ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

131
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIENCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA NOTAS DE AULAS DISCIPLINA: ESTATÌSTICA PARA ENGENHARIA DE MATERIAIS I PROFESSORA: LUCIANA MARIA DE OLIVEIRA 1

description

Estatística Descritiva e Probabilidade

Transcript of ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

Page 1: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIENCIAS EXATAS E DA TERRA

DEPARTAMENTO DE ESTATÍSTICA

NOTAS DE AULAS

DISCIPLINA: ESTATÌSTICA PARA ENGENHARIA DE MATERIAIS I

PROFESSORA: LUCIANA MARIA DE OLIVEIRA

NATAL/RN - 2010

1

Page 2: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

UNIDADE I

ESTATISTICA DESCRITIVA

1.1 - NARUREZA E CAMPO DA ESTATÍSTICA

Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal

forma que seja possível efetuar julgamentos sobre os mesmos.

Ramos da Estatística:

a) Estatística descritiva trata da observação de fenômenos de mesma natureza, da coleta de

dados numéricos referentes a esses fenômenos, da sua organização e classificação através de

tabelas e gráficos, bem como da análise e interpretação.

b) Probabilidade estatística · utilizada para analisar situações que envolvem o acaso

(aleatoriedade).

c) Inferência estatística estuda as características de uma população com base em dados obtidos

de amostras.

OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva estuda as

características de uma população, com base em dados obtidos de amostras.

Inferência = Indução + Margem de Erro

1.2 - O MÉTODO ESTATÍSTICO

A realização de uma pesquisa deve passar, necessariamente pelas fases apresentadas abaixo:

1) Definição do problema Saber exatamente o que se pretende pesquisar, ou seja, definir

corretamente o problema.

2

Coletas dos

Dados

Definição do

problemaPlanejamento

Crítica dos

Dados

Apresentação dos dados Tabelas e

Gráficos

Análise e interpretação

dos dados

Page 3: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

2) Planejamento determinar o procedimento necessário para resolver o problema, como levantar

informações sobre o assunto objeto do estudo. É importante a escolha das perguntas em um questionário,

que na medida do possível, devem ser fechadas.

O levantamento de dados pode ser de dois tipos: Censitário e Amostragem.

Outros elementos do planejamento de uma pesquisa são:

Cronograma das atividades;

Custos envolvidos;

Exame das informações disponíveis;

Delineamento da amostra.

3) Coleta de Dados consite na busca ou compilação dos dados . Pode ser classificado, quanto ao

tempo em:

Contínua (inflação, desemprego, etc);

Periódica (Censo);

Ocasional (pesquisa de mercado, eleitoral)

4) Crítica dos dados objetiva a eliminação de erros capazes de provocar futuros enganos. Faz-

se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.

5) Apresentação dos dados a organização dos dados denomina-se “Série Estatística”. Sua

apresentação pode ocorrer por meio de tabelas e gráficos.

6) Análise e Interpretação dos Dados consite em tirar conclusões que auxiliem o pesquisador a

resolver seu problema, descrevendo o fenômeno através do cálculo de medidas estatísticas,

especialmente as de posição e as de dispersão.

1.3 - REPRESENTAÇÃO TABULA E GRÁFICA

- REPRESENTAÇÃO TABULA

Consiste em dispor os dados em linhas e colunas , distribuídas de modo ordenado, segundo algumas

regras práticas e obedecendo à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho Nacional de

Estatística.

3

Page 4: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

As tabelas devem apresentar:

a) Título O quê? Onde? Quando?

b) Cabeçalho especifica o conteúdo das colunas

c) Coluna indicadora especifica o conteúdo das linhas

d) Corpo caselas onde são registrados os dados

e) Rodapé notas e identificação da fonte dos dados

Séries Estatísticas

São os dados organizados em forma de tabelas. De acordo com o fenômeno, local e a época de

ocorrência classificam-se, respectivamente, em : Temporal, Especificativa e Geográfica.

a) SérieTemporal (históricas ou cronológicas): os dados são observados segundo a época de sua

ocorrência

4

Page 5: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

b) Série Geográfica (espaciais, territoriais ou de localização): os dados são observados segundo o local

onde ocorreram.

c) Série Especificativa (categóricas): os dados são agrupados segundo a modalidade (espécie) de

ocorrência.

d) Série Mista ou de Dupla Entrada: é a fusão de duas ou mais séries simples.

TELEFONES INSTALADOS - 1987-89REGIÃO 1987 1988 1989Norte 373.312 403.712 457.741Nordeste 1.440.531 1.567.006 1.700.467Sudeste 8.435.308 8.892.409 8.673.660Sul 2.106.145 2.192.762 2.283.581Centro -oeste 803.013 849.401 944.075Total 13.158.309 13.905.290 14.059.524

5

Page 6: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

- POPULAÇÃO E AMOSTRA

Inferência Obtenção de resultados para uma população com base em observações

Estatística extraídas a partir de uma amostra retirada desta população.

POPULAÇÃO:

É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada característica.

Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o número de

vezes que se pode jogar um dado.

AMOSTRA:

É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos é

chamada de Amostragem.

- NOÇÕES DE AMOSTRAGEM

População (N) Amostra (n)

X X: determinada característica de

interesse da população;

: parâmetro populacional;

Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma população

tendo como base as informações extraídas através de uma amostra. Neste contexto, o estudo dos mais

diversos tipos de procedimentos de amostragem se faz necessário.

As técnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem probabilística

e a amostragem não probabilística.

6

Page 7: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

a) Amostragem Probabilística: neste grupo encontram-se os planos amostrais que utilizam mecanismos

aleatórios de seleção dos elementos da amostra, atribuindo a cada um deles uma probabilidade,

conhecida à priori, de pertencer a amostra.

b) Amostragem Não Probabilística: neste grupo encontram-se os planos amostrais que não utilizam

mecanismos aleatórios de seleção dos elementos da amostra, e dessa forma, não existe nenhuma

probabilidade associada a seleção desses elementos.

Ambos os procedimentos têm vantagens e desvantagens. A grande vantagem das amostras probabilísticas

é medir a precisão da amostra obtida. Tais medidas já são bem mais difíceis para os procedimentos do

outro grupo. Diante disso, amostras probabilísticas são comumente utilizadas na prática. Os tipos de

planos de amostragem probabilísticos são os seguintes:

1. Amostragem Aleatória Simples: cada elemento da população tem a mesma chance (ou

probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso, tabelas

de números aleatórios são freqüentemente utilizadas. Por exemplo, selecionar 5 alunos de uma turma.

2. Amostragem Estratificada: a população é dividida em estratos (ou grupos) homogêneos, sendo

selecionada uma amostra aleatória simples de cada estrato. Por exemplo, selecionar alunos de 5ª a 8ª

série de uma determinada escola. Neste caso, cada série corresponde a um estrato, e de cada estrato

uma amostra aleatória simples dos alunos é extraída.

3. Amostragem Sistemática: os elementos são selecionados segundo um regra pré-definida. É bastante

utilizada quando os elementos da população estão arranjados um ordem. Por exemplo, selecionar um

aluno a cada 15 que forem sorteados.

É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem ser

estudados. Portanto, a variabilidade é uma característica comum a dados de observação e experimentos.

Um atributo sujeito à variação é descrito em Estatística por uma variável.

Nominal

Qualitativa

Ordinal

Variável

Discreta

Quantitativa

Contínua

7

Page 8: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por

exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sangüíneo, etc..

Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura, peso,

etc..

Exercícios

1. De acordo com informações do IBGE, em 31.12.99, o pessoal administrativo ocupado em

estabelecimentos públicos, era, segundo o tipo de ocupação: Administração, 41.371; Serviço pessoal,

6.067; Contabilidade, 2.989; Estatística, 5.481; Limpeza e Conservação, 26.520; Almoxarifado,

3.970; Serviços Gerais, 46.073; e Outros, 15.689. Nos estabelecimentos da rede particular, nas

mesmas ocupações anteriores, as quantidades respectivas eram: 45.392, 4.555, 6.627, 3.112, 42.155,

4.019, 49.038 e 17.302. Dispor os dados acima em uma tabela, utilizando valores absolutos e

percentuais

2. Os prontuários de um paciente de um hospital estão organizados por ordem alfabética, em um

arquivo. Qual é a maneira mais rápida de amostrar 1/3 do total de prontuários?

3. Um pesquisador tem dez gaiolas que contém , cada uma, seis ratos. Como o pesquisador pode

selecionar uma amostra de dez ratos?

4. Um pesquisador pretende levantar dados sobre o número de moradores por domicílio, usando

amostragem sistemática. O pesquisador visitará cada domicílio selecionado. Se não tiver nenhuma

pessoa na ocasião da visita, o pesquisador excluirá o domicílio da amostra. Este fato introduz

tendenciosidade?

5. Dada uma população de 8 elementos {A, B, C, D, E, F, G, H, G} descreva três formas diferentes de

obter uma amostra sistemática de 4 elementos.

- Distribuições de Freqüências

Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do

fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de distribuição de

freqüências.

8

Page 9: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Distribuição de Freqüências: série estatística em que os dados são agrupados em classes, com suas

respectivas freqüências absolutas, relativas e percentuais, com o objetivo de

facilitar ao analista o seu estudo.

Construção de uma Distribuição de Freqüências:

Para a construção de uma distribuição de freqüências os seguintes componentes são necessários:

Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados.

Rol: são os dados apresentados em ordem crescente.

Os seguintes componentes são utilizados apenas em distribuição de freqüências em classes:

Amplitude Total (A): é a diferença entre o maior valor do rol (LS) e o menor valor (LI).

A = LS - LI

Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os elementos

do rol. Para determinar c, utiliza-se a fórmula de Sturges:

c = 1 + (3,33333.....).log(n)

onde n = número de elementos do rol.

Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos através da

fórmula:

i = A/c

Outros elementos da tabela:

Li = limite inferior de cada classe;

Ls = limite superior de cada classe;

x = ponto médio de cada classe x = Li + (i/2);

f = freqüência absoluta = número de ocorrências de cada classe;

fr = freqüência relativa ;

9

Page 10: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

f % = freqüência percentual f % = 100.fr;

= freqüência absoluta acumulada "abaixo de";

= freqüência absoluta acumulada "acima de";

= freqüência percentual acumulada "abaixo de";

= freqüência percentual acumulada "acima de";

Exemplos

1) (Dados Simples) Numa pesquisa feita para detectar o número de filhos de empregados de uma

multinacional, foram encontrados os seguintes valores:

1 4 2 5 3 2 0 3 2 1

5 4 2 5 0 3 2 4 2 3

2 3 2 1 4 2 1 3 4 2

Solução:

Rol (dados em ordem crescente):

0 0 1 1 1 1 2 2 2 2

2 2 2 2 2 2 3 3 3 3

3 3 4 4 4 4 4 5 5 5

Tabela de Distribuição de Freqüências:

X f fr f %

0 2 0,067 6,7 2 30 6,7 100

1 4 0,133 13,3 6 28 20 93,3

2 10 0,333 33,3 16 24 53,3 80

3 6 0,2 20 22 14 73,3 46,7

4 5 0,167 16,7 27 8 90 26,7

5 3 0,1 10 30 3 100 10

Total 30 1 100 - - - -

Algumas considerações ou conclusões:

Quantos empregados têm "x" filhos? A resposta é dada através de f (freqüência absoluta simples). a) Quantos empregados têm menos de "x" filhos? A resposta é dada através de (freqüência absoluta

acumulada "abaixo de").

10

Page 11: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

b) Quantos empregados têm mais de "x" filhos? A resposta é dada através de (freqüência absoluta

acumulada "acima de").

2) (Dados Agrupados em Classes) Um determinado hospital está interessado em analisar a quantidade de

creatinina (em miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes

internados com problemas renais. Os dados são os seguintes:

1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83

1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46

1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49

1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40

1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44

1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83

1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02

Solução:

Rol (dados em ordem crescente):

1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38

1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47

1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54

1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60

1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,681,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86

1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34

Amplitude Total (dá uma idéia do campo de variação dos dados):

A = LS - LI = (2,34) - (1,08) = 1,26

Analisando-se a quantidade creatinina encontrada na urina dos 84 pacientes verificou-se que, ocorreu a

variação de 1,26 no seu campo (de 1,08 a 2,34).

Estabelecer o Número de Classes (c):

c = 1 + (3,3333.....).log(n) = 1 + (3,3333....).log(84) = 7,414 c = 7

11

Page 12: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Estabelecer o Intervalo de Classe (i): i = A / c = (1,26) / 7 = 0,18

Construção da Tabela:

Classes fi Pm fr f %

1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84

1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79

1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66

1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34

1,80 - 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16

1,98 - 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5

2,16 - 2,34 3 2,25 0,036 3,6 100 3,6 84 3

Total 84 - 1 100 - - - -

OBS:

(1) O melhor valor para representar cada classe é o ponto médio (Pm), o qual se obtém pela fórmula:

Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2

(2) fi : número de elementos de cada classe.

fr : mede o quanto cada valor significa e relação a unidade.

f%: mede o quanto cada valor significa com relação a 100.

(3) 1,08 -- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao extremo inferior) e

aberto à direita (não pertencem a classe valores iguais ao extremo superior).

Algumas considerações ou conclusões:

12

Page 13: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

a) Quantos pacientes têm quantidade de creatinina no intervalo de "x"? A resposta é dada através de f

(freqüência absoluta simples). Ex.: Quantas pacientes tem quantidade de creatinina no intervalo [1,44;

1,62)? R.: 32 pacientes.

b) Quantas pacientes tem quantidade de creatinina inferior ao intervalo "x"? A resposta é dada através de

(freqüência absoluta acumulada "abaixo de"). Ex.: Quantas crianças tem quantidade de creatinina

inferior ao intervalo [1,80; 1,98)? R.: 68 pacientes.

c) Quantas pacientes tem quantidade de creatinina superior ao intervalo "x"? A resposta é dada através

de (freqüência absoluta acumulada "acima de"). Ex.: Quantas crianças tem quantidade de

creatinina superior ao intervalo [1,80; 1,98)? R.: 5 pacientes.

3) Construir uma distribuição de freqüências, utilizando a fórmula de Sturges e analisá-la com base nos

elementos abaixo, correspondente ao faturamento bruto mensal (US$ mil) de 38 pequenas empresas:

2,1 4,4 2,7 32,3 9,9 9,0 2,0 6,6 3,9 1,6 14,7 9,6 16,7 7,4

8,2 19,2 6,9 4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3

0,3 1,3 14,1 1,0 2,4 2,4 18,0 8,7 24,0 1,4 8,2 5,8 1,6 3,5

11,4 18,0 26,7 3,7 12,6 23,1 5,6 0,4

– REPRESENTAÇÃO GRÁFICA

Gráfico é um recurso visual da Estatística utilizado para representar um fenômeno. Sua utilização em larga escala nos meios de comunicação social, técnica e científica, devem-se tanto à sua capacidade de refletir padrões gerais e particulares do conjunto de dados em observação, como à facilidade de interpretação e a eficiência com que resume informações dos mesmos.

Embora os gráficos forneçam menor grau de detalhes que as tabelas, estes apresentam um ganho na compreensão global dos dados, permitindo que se aperceba imediatamente da sua forma geral sem deixar de evidenciar alguns aspectos particulares que sejam de interesse do pesquisador.

Uma representação gráfica coloca em evidência as tendências, as ocorrências ocasionais, os valores mínimos e máximos e também as ordens de grandezas dos fenômenos que estão sendo observados.

Todo gráfico, em sua versão final deve primar pela simplicidade, clareza e veracidade nas informações. Para atingir tal objetivo, a construção de um gráfico exige muito trabalho e cuidados. Segundo Silva (apud WALLGREN, 1996), a escolha da representação gráfica e, conseqüentemente, a escolha do tipo de gráfico mais adequado para representar um conjunto de dados deve ser feita com base nas respostas de questões como:- Um gráfico realmente é a melhor opção?- Qual é o público-alvo?- Qual é o objetivo do gráfico?- Que tipo de gráfico deve ser usado?- Como o gráfico deve ser apresentado?- Que tamanho o gráfico deve ter?- Deverá ser usado apenas um gráfico?

13

Page 14: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

- A qual meio técnico se deve recorrer?Ao incluir um gráfico em um trabalho, sua identificação deve aparecer na parte inferior,

precedido pela palavra Gráfico seguida de seu número de ordem de ocorrência no texto (algarismos arábicos), de seu respectivo título e/ou legenda explicativa de maneira breve e clara (dispensando a leitura do texto) e da fonte de onde se extraiu os dados. Uma regra básica para a elaboração adequada do título de qualquer gráfico, é verificar se o mesmo responde a três exigências: o quê, onde e quando.

- GRÁFICOS PARA TABELAS SIMPLES

a) Gráfico de barrasÉ um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles

representa a intensidade de uma modalidade ou atributo.O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis cujas

categorias tenham designações extensas.

b) Gráfico de colunasÉ o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de barras por

serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando as designações das categorias são breves. O número de colunas ou barras do gráfico não deve ser superior a 12 (doze).

Ao se descrever simultaneamente duas ou mais categorias para uma variável, é conveniente fazer uso dos gráficos de barras ou colunas justapostas (ou sobrepostas), chamados de gráficos comparativos. De acordo com as normas contidas em Gráficos (UFPR, 2001), este tipo de gráfico só deve ser utilizado quando apresentar até três elementos para uma série de no máximo quatro valores.

14

Page 15: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

c) Gráfico de setoresTipo de gráfico onde a variável em estudo é projetada num círculo, de raio arbitrário, dividido em

setores com áreas proporcionais às freqüências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de categorias não é grande e não obedecem a alguma ordem específica.

Para encontrarmos a medida dos ângulos (em graus) de cada setor do círculo (de cada fatia da

pizza), devemos estabelecer a seguinte regra de três:

De onde vem a relação:

Total observado X = (cada parcela) 360º

De onde obtemos que:

d) Gráfico de linhasSua aplicação é mais indicada para representações de séries temporais sendo por tal razão,

conhecidos também como gráficos de séries cronológicas. Sua construção é feita colocando-se no eixo vertical (y) a mensuração da variável em estudo e na abscissa (x), as unidades da variável numa ordem crescente. Este tipo de gráfico permite representar séries longas, o que auxilia detectar suas flutuações tanto quanto analisar tendências. Também podem ser representadas várias séries em um mesmo gráfico.

15

1 Total observado 360º

2 Cada parcela X

Page 16: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

- REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO(TABELAS COM INTERVALO DE CLASSE)a) Histograma:

Os histogramas são gráficos construídos para representar dados agrupados em

intervalos de classes e podem ser utilizados, considerando qualquer tipo de freqüência, simples

ou acumuladas, absolutas ou percentuais.

Assim, há histogramas com diversos contornos, informando sobre distintos aspectos do

comportamento dos dados.

Horas de Trabalho Nº de Crianças (fi) fi % F% Pm

10 |-- 15 4 10,52 10,52 12,5

15 |-- 20 5 13,15 23,67 17,5

20 |-- 25 8 21,10 44,77 22,5

25 |-- 30 12 31,56 76,33 27,5

30 |-- 35 6 15,78 92,11 32,5

35 |--| 40 3 7,89 100 37,5

Total 38 100,00 - -

Distribuição Simétrica: ocorre quando a concentração dos dados está no centro da figura.

16

0

2

4

6

8

10

12

14

10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |--| 40

Page 17: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Distribuição assimétrica: quando a concentração dos dados está localizada para a

direita ou para a esquerda da figura. Dividindo-se em:

Assimetria positiva: quando a concentração dos dados se localiza à esquerda do centro da

figura e a cauda à direita é alongada.

Assimetria negativa: quando a concentração dos dados se localiza à direita do centro da

figura e a cauda à esquerda é alongada.

b) Polígono de freqüênciaÉ um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abscissas

correspondentes aos pontos médios de cada classe e as ordenadas, às freqüências absolutas ou relativas dessas mesmas classes.O polígono de freqüência é um gráfico que deve ser fechado no eixo das abscissas. Então, para finalizar sua elaboração, deve-se acrescentar à distribuição, uma classe à esquerda e outra à direita,

17

0

2

4

6

8

10

12

10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45

0

2

4

6

8

10

12

10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45

0

2

4

6

8

10

12

10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45

Page 18: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

ambas com freqüências zero. Tal procedimento permite que a área sob a linha de freqüências seja igual à área do histograma.

Uma das vantagens da aplicação de polígonos de freqüências é que, por serem gráficos de linhas, permitem a comparação entre dois ou mais conjuntos de dados por meio da superposição dos mesmos.

c) Gráfico da freqüência acumulada ou Ogiva de GaltonÉ um gráfico que permite descrever dados quantitativos por meio da freqüência acumulada.A ogiva é um gráfico de linha que une os pontos cujas abscissas são os limites superiores das

classes, e, ordenadas suas respectivas freqüências acumuladas. Convém observa-se que o ponto inicial desse gráfico é o limite inferior do primeiro intervalo, com freqüência acumulada zero, pois não existe qualquer valor inferior a ele.

Exercício

Construa os gráficos representativos da distribuição de freqüência do exercício 2 (quantidade de

creatinina presente na urina de 84 pacientes).

Construção da Tabela:

18

Page 19: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Classes fi Pm fr f %

1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84

1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79

1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66

1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34

1,80 - 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16

1,98 - 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5

2,16 - 2,34 3 2,25 0,036 3,6 100 3,6 84 3

Total 84 - 1 100 - - - -

Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema.

Mas é conveniente apresentar medidas que mostrem a informação de maneira resumida.

1.4 – MEDIDAS DE TENDÊNCIA CENTRAL, DISPERÇÃO E ACHATAMENTO

– Medidas de Tendência Central

São medidas que tendem para o centro da distribuição e têm a capacidade de representá-la como

um todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média

Aritmética, Mediana e Moda e algumas.

Média, Mediana e Moda

Média Aritmética

A média aritmética pode ser definida em dois tipos: populacional ( ) e amostral ( ). Nos dois casos

existem três situações quanto aos cálculos.

1. Dados apresentados em forma de rol:

A média será:

Ex.: Peso em gramas de ratos (50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74) = 67

Análise: o peso médio dos 12 ratos observados é de 67 gramas.

Exercício: Um gerente de supermercado quer estudar a movimentação de pessoas em seu estabelecimento, constata que 195, 1.002, 941, 768, 1.283 pessoas entraram no seu estabelecimento nos últimos cinco dias. Descubra o número médio de pessoas que entraram diariamente neste estabelecimento nos últimos cinco dias.

2. Dados apresentados em forma de distribuição de freqüência simples:

19

Page 20: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

A média será:

Ex.: Número de cáries em crianças

X 0 1 2 3 4 Total

f 2 4 10 6 5 27

Análise: Verifica-se que o número médio de cáries das 27 crianças observadas no estudo é de 2,3.

Exercício: As informações abaixo apresentam a idade dos usuários de drogas internos numa clínica

para tratamento. Determine a idade média dos internos.

Idade fi

17 6

18 4

19 8

20 12

21 10

22 7

23 3

Total 50

3. Dados apresentados em forma de distribuição de freqüência em classes:

A média será:

Ex.: Nascidos vivos segundo o peso ao nascer, em kg.

20

Page 21: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Classes Pm fi

1,5 - 2,0 1,75 3

2,0 - 2,5 2,25 16

2,5 - 3,0 2,75 31

3,0 - 3,5 3,25 34

3,5 - 4,0 3,75 11

4,0 - 4,5 4,25 4

4,5 - 5,0 4,75 1

Total

Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg.

Mediana

Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é, é o

valor que ocupa o centro da distribuição, de onde conclui-se que 50% dos elementos ficam abaixo dela e

50% ficam acima.

Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou população,

em duas partes iguais.

0 Med 100%

a) Variável Discreta: os dados estão dispostos em forma de rol ou em uma distribuição de freqüência

simples.

Se "n" for ímpar:

Med = elemento central (de ordem [(n + 1)/2]º)

Se "n" for par:

Med = média aritmética dos dois elementos centrais (de ordem (n/2)º e [(n/2) + 1]º)

Ex1.: Seja a amostra: 1, 2, 3, 4, 5 Med = 3

21

Page 22: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Ex2.: Seja a amostra: 1, 2, 3, 4 Med = (2 + 3)/2 = 2,5

Ex3.: Suponha a seguinte distribuição de freqüência simples.

X fi

1 1 1

2 3 4

3 5 9

4 2 11

Total 11 -

n = 11 (ímpar)

Elemento mediano: [(n+1)/2]º = 6º elemento

3ª classe contém o 6º elemento Med = 3

Ex4.: Suponha a seguinte distribuição de freqüência simples.

X fi

82 5 5

85 10 15

87 15 30

89 8 38

90 4 42

Total 42 -

n = 42 (par)

Elemento mediano: (n/2)º = 21º elemento

(n/2)º + 1 = 22º elemento

3ª classe contém o 21º e o 22º elemento

Med = (87 + 87)/2 = 87

b) Variável Contínua: os dados estão agrupados em uma distribuição de freqüências em classes, então:

(1º Passo) Calcular a ordem (n/2)º. Como a variável é contínua não importa se é par ou ímpar.

(2º Passo) Através da identificar a classe que contém a mediana, isto é, a posição da mediana.

22

Page 23: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

(3º Passo) Utilizar a fórmula:

LIMed = limite inferior da classe que contém a mediana;

PMed = posição da mediana = = xº elemento;

= freqüência absoluta acumulada "abaixo de" da classe anterior a classe que contém a mediana;

fMe = freqüência absoluta da classe que contém a mediana;

iMe = intervalo da classe que contém a mediana;

Ex.: No exemplo acima (nascidos vivos segundo peso ao nascer, em kg) a mediana é dada por:

Classes Pm fi

1,5 - 2,0 1,75 3 3

2,0 - 2,5 2,25 16 19

2,5 - 3,0 2,75 31 50

3,0 - 3,5 3,25 34 84

3,5 - 4,0 3,75 11 95

4,0 - 4,5 4,25 4 99

4,5 - 5,0 4,75 1 100

PMe = 50º elemento 3ª classe: [2,5; 3,0)

Moda

É o valor que ocorre com maior freqüência, ou seja, aquele que mais se repete.

Ex.: Na série 3, 4, 5, 7, 7, 7, 9, 9 Mo = 7

Série Unimodal (tem uma única moda)

Ex.: Na série 3, 5, 6, 6, 6, 7, 8 Mo = 6

23

Page 24: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Série Bimodal (ocorrem duas modas)

Ex.: Na série 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Mo1 = 5 e Mo2 = 9

Série Trimodal (ocorrem três modas)

Ex.: Na série 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Mo1 = 4, Mo2 = 7 e Mo3 = 9

Série Polimodal (ocorrem quatro ou mais modas)

Ex.: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13 M o1 = 0, Mo2 = 3, Mo3 = 9, Mo4 = 12 e Mo5

= 13

Série Amodal (não existe moda)

Ex.: Na série 0, 1, 3, 4, 7, 8, não existe moda

a) Dados Apresentados em uma Distribuição de Freqüência Simples

Mo = elemento que tenha maior freqüência

Ex1.:

X f

1 13

3 15

6 25

10 8

Total 61

Mo = 6

Ex2.:

Tipo de Sangue f

O 547

A 441

B 123

AB 25

Total 1136

24

Page 25: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Mo = sangue do tipo "O"

b) Dados Apresentados em uma Distribuição de Freqüência Classes.

Nesse caso, a moda pode ser determinada através de quatro processos.

1. Moda Bruta (MoB)

Corresponde ao ponto médio da classe modal, ou seja, MoB = (li + ls)/2

Ex.: Quantidade de Creatinina

Classes fi

1,08 - 1,26 5

1,26 - 1,44 13

1,44 - 1,62 32

1,62 - 1,80 18

1,80 - 1,98 11

1,98 - 2,16 2

2,16 - 2,34 3

2. Moda de Pearson (MoP)

Utilizada mais especificamente, juntamente com e Med, para mostrar o comportamento da

distribuição, em relação a concentração ou não de seus elementos.

Utiliza-se a MoP para a análise da assimetria.

25

Page 26: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Assimetria à esquerda: (concentração à direita ou nos valores maiores)

Assimetria à direita: (concentração à esquerda ou nos valores menores)

Simétrica: (concentração no centro)

Ex.: Calcule a moda de Pearson para os seguintes dados = 1,61 e Med = 1,57.

= 3.(1,57) - 2.(1,61) = 1,49

Análise: , o que indica uma assimetria à direita, isto é, uma maior concentração à

esquerda (ou em direção aos valores menores).

3. Moda de King (MoK)

liMo = limite inferior da classe modal;

fpost = freqüência absoluta da classe posterior à classe modal;

fant = freqüência absoluta da classe anterior à classe modal;

iMo = ls - li = intervalo da classe modal;

4. Moda de Czuber (MoC)

onde

Ex.: Baseado no exemplo da distribuição de freqüência apresentada no primeiro processo (moda bruta)

calcule as modas de King e de Czuber.

Moda de King:

26

Page 27: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Classe Modal = 3ª classe [1,44; 1,62) com fi = 32

fant = 13

fpost = 18

iMo = (1,62) - (1,44) = 0,18

Análise: valores próximos ou iguais a 1,54 ocorrem com maior freqüência.

Moda de Czuber:

Classe Modal = 3ª classe [1,44; 1,62) com fi = 32

fant = 13 fmáx = 32

fpost = 18 d1 = 32 - 13 = 19

iMo = (1,62) - (1,44) = 0,18 d2 = 32 - 18 = 14

Análise: valores próximos ou iguais a 1,54 ocorrem com maior freqüência.

– MEDIDAS DE DISPERSÃO

Introdução

Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de números em

relação a sua média, pois ainda que consideremos a média como um número que tem a faculdade de

representar uma série de valores ela não pode por si mesma, destacar o grau de homogeneidade ou

heterogeneidade que existe entre os valores que compõem o conjunto. O nosso objetivo é construir

medidas que avaliem a representatividade da média para isto usaremos as medidas de dispersão.

27

Page 28: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são

suficientes para caracterizar totalmente uma seqüência numérica.

Se observarmos as seguintes seqüências:

X: 70, 70, 70, 70, 70

Y: 68, 69, 70, 71, 72

Z: 5, 15, 50, 120, 160

Calculando a média aritmética de cada um desses conjuntos, obtemos:

Observamos, então, que os três conjuntos apresentam a mesma média aritmética: 70.

No entanto, são seqüências completamente distintas do ponto de vista da variabilidade de dados.

Na seqüência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor da série.

Na seqüência Y, a média 70 representa bem a série, mas existem elementos da série levemente

diferenciados da média 70.

Na seqüência Z, existem muitos elementos bastante diferenciados da média 70.

Concluímos que a média 70 representa otimamente a seqüência X, representa bem a seqüência Y, mas

não representa bem a seqüência Z.

Nosso objetivo é construir medidas que avaliem a representatividade da média. Para isto,

usaremos as medidas de dispersão.

Observe que na seqüência X os dados estão totalmente concentrados sobre a média 70, não há

dispersão de dados. Na seqüência Y, há forte concentração dos dados sobre a média 70, mas há fraca

dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte dispersão

de dados em relação à média 70.

As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e

coeficiente de variação.

Variância

28

Page 29: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma dos

quadrados dos desvios e o número de elementos. É classificada em dois tipos:

Variância Populacional ( )

Variância Amostral (s2)

Exemplo: Calcular a variância das notas obtidas por quatro alunos em cinco provas

Alunos Notas

Variância

Amostral(S2)

Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25)2 /5] = 0

João 6 4 5 4 6 129 1

José 10 5 5 5 0 25 =1/4. [( 175) – (25)2/5]= = 12,5

Pedro 10 10 5 0 0 225 25

(preencha os espaços em branco realizando os cálculos necessários)

Comentários:

As notas de Antônio não variaram s2 = 0;

As notas de João variaram menos que as notas de José;

As notas de Pedro variaram mais que as outras.

IMPORTANTE: Quando os dados estão dispostos em uma tabela de distribuição de freqüência, utiliza-

se a fórmula:

1º Caso – Freqüência Simples

2º Caso – Freqüência em Classes

ATENÇÃO: “Desvantagem” do uso da variância

No cálculo da variância, quando elevamos ao quadrado a diferença , a unidade de medida

da série fica também elevada ao quadrado.

Portanto, a variância é dada sempre no quadrado da unidade de medida da série.

29

Page 30: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Se os dados são expressos em metros, a variância é expressa em metros quadrados.

Em algumas situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo,

em que os dados são expressos em litros. A variância será expressa em litros quadrados.

Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja:

variância não tem interpretação.

Desvio Padrão

Medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de

medida dos dados. É a raiz quadrada da variância.

Notações: 1) Quando a seqüência de dados representa uma população a variância será denotada por e

o desvio padrão correspondente por .

2) Quando a seqüência de dados representa uma amostra a variância será denotada por e o

desvio padrão correspondente por .

Desvio Padrão Populacional ( )

Desvio Padrão Amostral (s)

OBS: Quanto maior o valor do desvio padrão significa que mais dispersos estão os elementos em torno da

média.

Exemplo: Calcular o desvio padrão das notas obtidas por quatro alunos em cinco provas

Alunos Notas

Desvio padrão

amostral ( )

Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25)2 /5] = 0 0

João 6 4 5 4 6 129 =1

José 10 5 5 5 0 25

=1/4. [(175) -

(25)2/5]=5

Pedro 10 10 5 0 0 225 =25 5

(preencha os espaços em branco realizando os cálculos necessários)

30

Solução: Utilizar o DESVIO PADRÃO como medida

Page 31: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Interpretação do Desvio Padrão

O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.

É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados

da série. Quando uma curva de freqüência representativa da série é perfeitamente simétrica (

), podemos afirmar que os intervalos

contém aproximadamente 68% dos valores da série.

contém aproximadamente 95% dos valores da série.

contém aproximadamente 99% dos valores da série.

Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas

variações para mais ou para menos, segundo o caso.

Exemplo: Suponha uma série com média e desvio padrão , podemos interpretar estes valores

da seguinte forma:

1. Os valores da série estão concentrados em torno de 100.

2. O intervalo [95, 105] contém aproximadamente 68% dos valores da série.

O intervalo [90, 110] contém aproximadamente 95% dos valores da série.

3. O intervalo [85, 115] contém aproximadamente 99% dos valores da série.

Coeficiente de Variação (CV)

Quando as medidas de duas ou mais variáveis são expressas em unidades diferentes como

peso/altura, capacidade/comprimento, etc. não se pode compara-las através do desvio padrão, por este ser

uma medida absoluta de variabilidade. Usa-se então o CV, que é uma medida relativa, que expressa o

desvio padrão como uma porcentagem da média aritmética. Quanto mais próximo de zero, mais

homogênea é a distribuição. Quanto mais distante, mais dispersas.

31

Page 32: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

O CV mede a dispersão em relação à média. É a razão entre o desvio padrão e a média. O

resultado obtido dessa operação é multiplicado por 100, para que o coeficiente de variação seja dado em

porcentagem.

OBS.: um CV alto indica que a dispersão dos dados em torno da média é muito grande.

Exemplo: Calcule a média, o desvio padrão e o coeficiente de variação dos dados apresentados na tabela

abaixo. Comente os resultados, apontando quais os dados que apresentaram maior variabilidade, ou seja,

qual a variável mais homogênea (peso ou comprimento).

Peso (em kg) e comprimento (em cm) de 10 cães

Peso Comprimento X2 Y2

23,0 104 529 10816

22,7 107    

21,2 103    

21,5 105    

17,0 100    

28,4 104    

19,0 108    

14,5 91    

19,0 102    

19,5 99    

       

Fonte: Araújo e Hossne (1997)

Solução:

a) Para a variável PESO (x)

Média

Variância

32

Page 33: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Desvio padrão

Coeficiente de variação

b) Para a variável COMPRIMENTO (y)

Média

Variância

Desvio padrão

Coeficiente de variação

Conclusão:

33

Page 34: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

EXERCÍCIOS:

1 – Calcule a variância, o desvio padrão e o coeficiente de variação dos dados apresentados nas tabelas

abaixo:

Tabela 01 – Taxa de glicose, em miligramas por 100 ml de sangue,

em ratos machos da raça Wistar, com 20 dias de idade

100 97,5

100 85

97,5 85

80 80

Fonte: Guimarães et all (1979)

Tabela 02 – Peso fresco, em gramas, de pulmões de cobaias machos de 90 dias de idade

Pulmão

Direito Esquerdo

1,66 1,48

2,15 1,58

2,03 1,59

2,35 1,92

1,9 1,55

Fonte: HOSSNE et all (1990)

Medição

• MEDIÇÃO: conjunto de operações que tem por objetivo determinar um valor de uma

grandeza.

• Medição é fundamental para quem trabalha com movimento humano

• Avaliar um sujeito, um atleta, uma classe, uma equipe...

• Uma avaliação correta depende da seleção, aplicação e interpretação correta dos resultados

de uma medição...

Lembre-se, para tomar uma decisão adequada, primeiro obtenha informações válidas...

34

Page 35: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Metrologia

• METROLOGIA: Ciência da medição.

• GRANDEZA: Atributo de um fenômeno, corpo ou substância que pode ser qualitativamente

distinguido e quantitativamente determinado.

• PRINCÍPlO DE MEDIÇÃO: Base científica de uma medição.

• MÉTODO DE MEDIÇÃO: Seqüência lógica de operações, descritas genericamente, usadas

na execução das medições.

• PROCEDIMENTO DE MEDIÇÃO: Conjunto de operações, descritas especificamente, usadas

na execução de medições particulares, de acordo com um dado método.

• MENSURANDO: Objeto da medição. Grandeza específica submetida à medição.

• RESULTADO DE UMA MEDIÇÃO: Valor atribuído a um mensurando obtido por medição

(medida).

Unidades de medida

• UNIDADE DE MEDIDA: Grandeza específica, definida e adotada por convenção, com a qual

outras grandezas de mesma natureza são comparadas para expressar suas magnitudes em

relação àquela grandeza.

• O resultado da medição de uma grandeza é expresso pelo número de vezes que a unidade

de medida, tomada como referência, está contida na grandeza a ser determinada.

• O resultado da medição é composto por duas partes: o número e a unidade padrão em que a

grandeza foi expressa.

• Claramente, a informação de que uma pessoa saltou “15” de distância está incompleta,

porque se foram 15 cm, 15 polegadas ou até 15 m, é completamente diferente.

Sistema Internacional de Unidades

Sistema coerente de unidades adotado e recomendado pela Conferência Geral de Pesos e

Medidas (CGPM)

35

Page 36: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Medida & erro

• Toda medida está sujeita à erro: erro instrumental, erro na aplicação do teste, variabilidade do

que está sendo medido (por exemplo, desempenho do sujeito).

36

Page 37: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

• Para determinar corretamente um valor de uma grandeza é necessário então não só

conhecer o resultado da medição mas também o erro associado.

VALOR (DE UMA GRANDEZA): Expressão quantitativa de uma grandeza específica,

geralmente sob a forma de uma unidade de medida multiplicada por um número.

• VALOR VERDADEIRO (DE UMA GRANDEZA): Valor consistente com a definição de uma

dada grandeza específica.

• Idealmente, o objetivo de uma medição é determinar o valor verdadeiro de uma grandeza;

• Mas o resultado de uma medição é o valor observado;

• Devido ao erro no resultado da medição, o valor observado consiste no valor verdadeiro mais

o valor do erro.

• INCERTEZA DE MEDIÇÃO: Parâmetro, associado ao resultado de uma medição, que

caracteriza a dispersão dos valores que podem ser fundamentadamente atribuídos a um

mensurando.

Tipos de erro

• ERRO DE MEDIÇÃO: Resultado de uma medição menos o valor verdadeiro do mensurando.

• ERRO ALEATÓRlO: Resultado de uma medição menos a média que resultaria de um infinito

número de medições do mesmo mensurando efetuadas sob condições de repetitividade.

• ERRO SISTEMÁTICO: Média que resultaria de um infinito número de medições do mesmo

mensurando, efetuadas sob condições de repetitividade, menos o valor verdadeiro do

mensurando.

Medida e erro

Em geral em teoria de erros assume-se que:

1. O valor verdadeiro é independente do valor de erro;

2. A média dos valores de erro é zero (descontados os erros sistemáticos);

3. Os valores de erro de diferentes resultados de medição são independentes.

Como reportar o valor de uma medida

• Algarismos significativos: todos os algarismos do valor de uma medida dos quais se tem

certeza mais o primeiro algarismo de incerto da medida.

• Em geral, quantidade de algarismos significativos indica a precisão de uma medida.

37

Page 38: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

– Por exemplo, é errado reportar a massa de uma pessoa determinada por uma balança

analógica (de ponteiro, com resolução de 1 kg) como sendo 70,215 kg. O correto seria 70,2 kg

(são 3 algarismos significativos e 2 é o algarismo de incerteza pois esse valor é estimado já

que não havia uma escala com essa resolução).

– A medida e o erro da medida poderia ser reportado como: 70,2±0,5 kg.

Como reportar o valor de uma medida II

• Suponha que foram feitas medidas da massa de vários indivíduos e pretende-se reportar o valor central e a dispersão dessas medidas. Para tanto, é usual reportar média e desvio padrão. Por exemplo, se as medidas foram 60,1; 65,0; 73,7; 68,5 kg, a média e desvio padrão são: m = 66.8250 kg e dp = 5.7337 kg ou 66.8250±5.7337 kg.• Esta forma de reportar média e dispersão de uma medida está errada. Não faz sentido

reportar tantos algarismos significativos considerando o erro da medida. Uma regra geral é

reportar a medida até a primeira casa decimal que já tem erro (desvio padrão nesse caso):

67±6 kg (com arredondamento).

• É aceitável reportar até a segunda casa decimal de erro e também seria correto: 66.8± 5.7 kg.

Repetitividade (de resultados de medição)

Grau de concordância entre os resultados de medições sucessivas de um mesmo

mensurando efetuadas sob as mesmas condições de medição.

Observações:

1. Estas condições são denominadas condições de repetitividade.

2. Condições de repetitividade incluem:

• mesmo procedimento de medição;

• mesmo observador;

• mesmo instrumento de medição, utilizado nas mesmas condições;

• mesmo local;

• repetição em curto período de tempo.

3. Repetitividade pode ser expressa, quantitativamente, em função das características da

dispersão dos resultados.

Reprodutibilidade (de resultados de medição)

Grau de concordância entre os resultados das medições de um mesmo mensurando

efetuadas sob condições variadas de medição.

Observações:

38

Page 39: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

1. Para que uma expressão da reprodutibilidade seja válida, é necessário que sejam

especificadas as condições alteradas.

2. As condições alteradas podem incluir:

• Princípio, método e instrumento de medição;

• observador;

• padrão de referência;

• condições de utilização;

• local e tempo;

3. Reprodutibilidade pode ser expressa, quantitativamente, em função das características da

dispersão dos resultados.

Exatidão e Precisão

• EXATIDÃO (ACURÁCIA) DE MEDIÇÃO: Grau de concordância entre o resultado de uma

medição e um valor verdadeiro do mensurando. Exatidão é um conceito qualitativo.

• PRECISÃO DE MEDIÇÃO: Grau de concordância entre resultados de medição obtidos sob as

mesmas condições (repetitividade). Precisão é um conceito qualitativo.

Propriedades do resultado de uma medição

FIDEDIGNIDADE/CONFIABILIDADE (reliability) & VALIDADE

• Estas duas propriedades são comumente atribuídas como as mais importantes do resultado

de uma medição (ou da medição em si).

• Infelizmente, há várias definições diferentes para estas duas propriedades.

Boas definições são:

39

Page 40: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

• FIDEDIGNIDADE: grau de repetitividade e reprodutibilidade do resultado de uma medição

(precisão).

• VALIDADE: grau de exatidão (acurácia) do resultado de uma medição (o quanto o resultado

se refere ao que se queria medir ou se pensava estar medindo).

Estimativas de fidedignidade/confiabilidade

• TESTE/RETESTE: aplicação do mesmo teste mais de uma vez nos mesmos sujeitos e

comparar os resultados.

• CONSISTÊNCIA INTERNA: aplicação de subgrupos do teste que medem o mesmo conceito.

Por exemplo, aplicar dois grupos de questões que avaliam o mesmo conceito e comparar os

resultados.

Tipos de validade

Validade pode ser dividida em:

1. Lógica

2. De conteúdo

3. De critério

4. De constructo

Validade lógica

• Diz-se de uma medição que utiliza na medição a própria variável que está sendo

determinada.

• Por exemplo, um teste de força muscular, que consiste em medir com um dinamômetro a

força que uma pessoa produz, tem validade lógica.

• Não há teste estatístico para esta propriedade.

Validade de conteúdo

• As medidas do teste devem estar relacionadas ao que se pretende avaliar.

• Exemplo: uma prova de um curso deve avaliar todo o conteúdo do curso. Uma peneira no

futebol deve ser um teste que avalie domínio de bola, posicionamento no campo, chute, e não

um teste que avalie número de flexões.

• Não há teste estatístico para esta propriedade.

40

Page 41: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Validade de critério

• Relação do resultado de uma medição com um padrão ou critério reconhecidamente aceito

• Validade concorrente: validade de duas medidas que estão sendo aplicadas ao mesmo

tempo. Exemplo: validação do teste de cooper em relação ao teste de VO2 (referência, padrão

ouro).

• Validade preditiva: validade de uma medida como preditora de um resultado. Exemplo:

detecção de talento, predição da gordura corporal por dobras cutâneas.

Validade de constructo

• Grau que um teste mede uma variável que não pode ser observada diretamente, um

contructo (por exemplo, inteligência, ansiedade).

• A validade de constructo é estabelecida relacionando o resultado do teste com o

comportamento esperado.

41

Page 42: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

UNIDADE II

INTRODUÇÃO A PROBABILIDADE

A Estatística está ligada à Teoria da Probabilidade e vice-versa. Ela se faz presente em várias

situações, como por exemplo, nas técnicas de amostragem. Na Estatística Indutiva, a probabilidade é um

ferramental indispensável, pois todo o processo de inferência ocorre com uma determinada margem de

incerteza. Sendo assim, se faz necessário aos usuários de Estatística adquirir pelo menos, noções básicas

sobre essa teoria.

1.1 – Conceitos fundamentais

a) Experimentos aleatórios e determinísticos.

Podemos distinguir dois tipos de experimentos. Observe as seguintes situações:

E.1) Experimentos do tipo 1:

i) Uma injeção contendo uma substância letal, altamente eficaz, que tem efeito em apenas 10 minutos, é

aplicada em 10 cobaias. Após duas horas, o número de sobreviventes é contado.

ii) Um recipiente com água é colocado para ferver, na cidade de Santos (ao nível do mar). A temperatura

de ebulição da água é registrada.

E. 2) Experimentos do tipo 2:

i) Jogar uma moeda e observar a face voltada para cima.

ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.

Podemos dizer que nos experimentos do tipo I, os resultados são conhecidos à priori, ou seja,

antes de se realizar o experimento. Assim, fatalmente não haverá sobreviventes no primeiro exemplo,

assim, como se sabe que água ferve a 100º C, ao nível do mar. Esses experimentos são chamados de

deterministicos e não são de interesse do ponto de vista da probabilidade. Já os experimentos do tipo 2,

são chamados aleatórios e, por mais que nos esforcemos em prever o resultado, ele só e determinado após

a realização do experimento. Portanto, os experimentos aleatórios são aqueles que repetidos sob as

mesmas condições podem, levar a resultados distintos. Estes sim, são objeto de interesse da Teoria da

Probabilidade.

42

Page 43: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

b) Espaço Amostral e eventos

Embora nos experimentos aleatórios não seja possível identificar com exatidão o resultado à priori

, é possível descrever todos os possíveis resultados. A esse conjunto, da-se o nome de espaço amostral.

Aqui, denotaremos espaço amostral pela letra grega .

i) E = jogar um dado e observar o número da face superior

= cara, coroa

ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.

Evento e qualquer subconjunto de , incluindo , evento impossível e o próprio , evento certo.

Exemplos (relacionados com os experimentos anteriores).

Evento 1 – “ocorre cara”

A = cara

Evento 2 – “ o paciente não sobrevive”

Eventos complementares

Dado um evento A de , o evento complementar de A, denotado A, é formado por todos os

elementos de , que não estão em A .

Considerando os exemplos anteriores temos:

É imediato observar que:

i) A A =

ii) A A =

Esquema ilustrativo

43

AA

A

Page 44: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Eventos mutuamente exclusivos (ou excludentes)

Dois eventos A e B de um mesmo espaço amostral , são considerados mutuamente exclusivos se

a ocorrência de um deles exclui a ocorrência do outro. Por outras palavras, os dois não podem ocorrer

simultaneamente, ou simplesmente se A B = .

Exemplo: No lançamento de um dado honesto, os eventos “número par” e “número ímpar” são mutuamente exclusivos.

Utilizando operações com conjuntos, podem-se formar novos eventos:

i) (A B) é o evento que ocorre se A ocorre ou se B ocorre ou ambos ocorrem;

ii) (A B) é o evento que ocorre se A ocorre e B ocorre;

iii) ( ) é o evento que ocorre se A não ocorre;

iv) Dois eventos A e B são denominados mutuamente exclusivos, se eles não puderem ocorrer

simultaneamente, isto é, (A B) = .

v) Eventos complementares são sempre mutuamente excludentes, mas a recíproca nem sempre é

sempre verdadeira.

c) Conceito clássico

Probabilidade – É o grau de confiança que se tem na ocorrência de um determinado evento.

Seja um espaço amostral finito e A um evento qualquer, então a probabilidade de ocorrer A é:

Onde, #A é o nº de maneiras que ocorre o evento "A"

# nº de maneiras que ocorre o espaço amostral

ou ainda,

Onde, N.C.F. é o nº de casos favoráveis

N.T.C. nº total de casos

Essa probabilidade deve satisfazer as seguintes condições:

a) 0 P(A) 1;

b) P () = 1

c) Se A e B são eventos mutuamente exclusivos, então: P (A B) = P (A) + P (B)

44

Page 45: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Exemplos:

1) Lança-se um dado. Qual é a probabilidade de sair um número ímpar? Qual é a probabilidade de sair o

número 2?

2) Uma carta é extraída ao acaso de um baralho com 52 cartas. Qual é a probabilidade de sair um às?

NOTAS:

a) A probabilidade varia entre 0 e 1 ou entre 0 e 100%;

b) Se é certo de ocorrer determinado evento, a P (desse evento) = 1 ou 100%. Se é impossível ocorrer

determinado evento a P (desse evento) = 0. Exemplo, lança-se um dado:

P (ocorrer um nº menor que 8) =

P (ocorrer um nº maior que 8) =

TEOREMAS:

1 – Se é o conjunto vazio, então P() = 0

2 – Se é complementar do evento A, então P( ) =1 – P(A)

3 – Se A B, então P(A) P(B)

4 – Teorema da soma: se A e B são dois eventos quaisquer, então,

P(A B) = P(A) + P(B) – P(A B)

P(A B C) = P(A) + P(B) + P(C) – P(A B) – P(A C) – P(B C) + P(A B C)

Exercício: lance um dado.

Verifique o espaço amostral;

Considere os eventos: A = um nº par ocorre;

B = o número 5 ocorre;

C = um nº maior que 3 ocorre.

Calcule: P(A), P(B), P(C), P(A B), P(A C), P(B C),

45

Page 46: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

1 2 - Probabilidade Condicional:

Definição: denomina-se probabilidade condicional à probabilidade de ocorrer determinado evento sob

uma dada condição. Sejam A e B dois eventos, denota-se a probabilidade condicionada do

evento quando tiver ocorrido por,

ou

Exemplo:

Dois dados são lançados, registrando-se os resultados com (x1, x2 ). Considere os seguintes eventos:

= { (x1, x2); x1 + x2 = 10} e = { (x1, x2); x1 > x2}

Calcule , , e

Espaço amostral:

Espaço amostral de A:

Espaço amostral de B:

Qual a P(A B) ?

Resp.: (A B) = { (x1, x2); x1 + x2 = 10 e x1 > x2}

(A B) = {(6,4)} P(A B) = 1/36.

A partir da definição de "Probabilidade Condicional" pode-se enunciar o TEOREMA DO PRODUTO:

P(A\B ) = P(A B) / P(B) P(A B) = P(B) . P(A\B )

P(B\A ) = P(A B) / P(A) P(A B) = P(A) . P(B\A )

46

Page 47: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

1 3 - Independência Probabilística

Dois eventos A e B, de , são independentes se e somente se:

Ou seja, a ocorrência de um deles não condiciona a ocorrência do outro e vice-versa. Desse modo, temos

também que:

Como por exemplo, considere o experimento aleatório do lançamento simultâneo de um dado e

uma moeda e sejam os eventos:

A = (cara, 1); (cara,3); (cara,4); (cara,4); (cara,5); (cara,6) [“ocorrer cara”

B = (cara, 6); (coroa,6) [“ocorrer número 6”

Será que os eventos A e B são independentes

É imediato verificar que P(A\B) = P(A) =1/2, assim como, P(B\A) =P(B) = 1/6, portanto os eventos A e B

são independentes. E, nesse contexto, a probabilidade de ocorrer a e B simultaneamente é dada por:

1 4 - Teorema de Bayes

Seja o espaço amostral associado a um experimento aleatório e uma partição de

. De tal forma que e seja A um evento qualquer de . Suponha que

sejam conhecidas todas as probabilidades condicionais do tipo bem como todas as

probabilidades de cada um dos eventos da partição de . Desejando-se saber qual é a probabilidade de

ocorrer dado que ocorreu A .

Esse resultado é dado pelo teorema da Bayes também conhecido como “regra das probabilidades

das hipóteses” e é uma das relações mais importantes envolvendo probabilidades condicionais:

Exemplo: Numa Faculdade funcionam três cursos C1, C2, C3. Sabe-se que a proporção de alunos

fumantes nos três cursos é de 0,25; 0,55 e 0,40; respectivamente. Um aluno é selecionado ao acaso e

sabe-se que ele é fumante. Nessas condições, qual é a probabilidade de que ele seja do curso C3?

47

Page 48: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Trata-se de um problema típico para a aplicação do Teorema de Bayes. Costuma ser elucidativo,

nesses casos, a árvore das possibilidades da situação descrita:

P (C1) Curso Fuma?

Então;

Esquema ilustrativo da partição do espaço amostral em 3 eventos exaustivo

UNIDADE III

PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADE

48

1/3

1/3

1/3

C1

C3

C2 11/20

9/20

Sim

Não1/4

3/4

2/5

3/5

Sim

Não

Sim

Não

A

C3

C1 C2

Page 49: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Em muitas situações de interesse pratico que consideramos, queremos estudar o comportamento

de uma ou mais variáveis. Assim, podemos estar interessados em estudar a distribuição das alturas e

pesos de pessoas de uma população. Escolhida uma pessoa ao acaso, desta população, obtemos o seu peso

e a sua altura e estamos, pois considerando duas variáveis. Em muitas situações, como a descrita, a

associação pode ser arbitrária. Por exemplo, considere o caso de um questionário, em que uma pessoa é

indagada a respeito de uma proposição e as respostas possíveis são “sim” ou “não”, respectivamente.

(Mais adiante estudaremos com pormenores este tipo de variável).

2.1 - VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTINUAS

As variáveis aleatórias (que descrevemos de modo abreviado: v. a .) podem ser de dois tipos:

discretas ou continuas. Uma v.a. é dita discreta quando ela assume somente valores num conjunto

enumerável de pontos do conjunto real. Ela é uma v.a . continua se for do tipo que pode assumir qualquer

valor em um intervalo real.

2 .1 - Definição: Sejam e um experimento e um espaço amostral associado ao experimento. Uma

função , que associe a cada elemento um número real, , é denominada variável aleatória.

É toda variável influenciada pelo acaso.

Ex. 1: Consideremos o experimento aleatório: extraem-se duas bolas, sem reposição, de uma urna

que contem: 2 bolas brancas (B) e 3 vermelhas (V). Vamos definir a v. a . X como:

= “o numero de bolas vermelhas obtidas nas duas extrações”. Portanto os valores possíveis que a v. a.

X pode assumir são :

= 0, se ocorre o evento: “BB”, (duas bolas brancas)

=1, se ocorre o evento: “VB” ou “BV” (Vermelha e branca ou branca e vermelha)

= 2, se ocorre o evento: “VV” (Duas bolas Vermelhas)

49

Page 50: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

2.2 - Valor Esperado de Variáveis Aleatórias Discretas

Definição: Se são os possíveis valores de v. a. , e

são as respectivas probabilidades então o valor esperado, (ou esperança matemática ou media), de ,

denotado por ou , é definido por:

para v. a’ s discretas para v. a’ s contínuas

Ex. 4: Consideremos o novamente o exemplo da urna com 3 bolas vermelhas e 2 brancas, de onde se

extraem sem reposição duas bolas.

A v. a . é definida como:

= “o numero de bolas vermelhas obtidas nas duas extrações”.

Portanto:

O valor esperado ou média da v. a. será:

Ex. 5: Consideremos o novamente o exemplo do lançamento de uma moeda “honesta” duas vezes. Seja a

v. a. , definida como:

= “nº de ”caras” obtidas nos dois lançamentos”. . Portanto temos:

Então que a média desta v.a. (seu valor esperado) será:

2.3 – Propriedades

1) A média de uma constante é a própria constante:

50

Page 51: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

2) Multiplicando uma v.a. X por uma constante, sua média fica multiplicada por essa constante:

3) Somando ou subtraindo uma constante a uma v.a. a sua média fica somada ou subtraída da mesma

constante.

4) A média da soma ou da diferença de duas v. a.’s é a soma ou a diferença das médias.

5) A média do produto de duas v. a’s independentes é o produto das médias.

Estas propriedades também são válidas para as variáveis contínuas.

Ex. 6: Seja o experimento: Lançar um dado “honesto” e observar o número que ocorre na face superior.

Então temos, . Sejam as variáveis aleatórias e , definidas como:

= “duas vezes o numero que aparece na face superior do dado” e,

= 1, se ocorre um número ímpar na face superior do dado.

= 3, se ocorre um número par na face superior do dado.

Portanto,

Então temos as distribuições de probabilidade e os respectivos cálculos de suas esperanças:

a) v. a. b) v. a.

2 1/6 2/64 1/6 4/6 6 1/6 6/68 1/6 8/6

10 1/6 10/612 1/6 12/6 1 42/6=7

Logo: e

Seja a constante real e v. a. dada por , isto é, . Segundo a propriedade

(2) devemos ter que:

1 1/2 1/23 1/2 3/2 1 42/6=7

51

Page 52: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

desde que .

vamos confirmar se realmente . Os valores possíveis da v. a. dada por

serão:

portanto temos a distribuição e o respectivo calculo da media da v. a. Z.

4 1/2 4/212 1/2 12/2 1 16/2 = 8

Logo, portanto , realmente o resultado as propriedade (2) foi verificado.

Tomemos agora a v. a . como sendo .

Pela propriedade (3) devemos ter que

Vamos verificar se realmente . Analogamente ao procedimento anterior, temos que, se

é definida como , então os possíveis valores da v. a serão:

Portanto temos:

5 1/2 5/27 1/2 7/2 1 12/2 = 6

Logo, Desta forma se verifica o resultado da propriedade (3).

Tomemos agora a v. a . , definida como: .. Pela propriedade (4) devemos ter:

52

Page 53: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Vamos verificar se, de fato, . Temos que, se é dada por:

, então os possíveis valores da v.a serão:

Assim, v. a. tem distribuição e média conforme a tabela:

3 1/6 3/67 2/6 14/6

11 2/6 22/615 1/6 15/6 1 54/6 = 9

E, concluímos que o resultado da propriedade (4) se verifica para os valores deste exemplo.

2.4 – Variância de uma Variável Aleatória

Definição: Seja uma v.a.. Definimos a variância de , denotada por ou , da seguinte

maneira:

2.5 – Propriedades

1) Se for uma constante

2) Se for uma constante

3) Se for uma v. a. bidimensional, e se forem independentes então:

53

Page 54: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

.

Em muitos problemas teóricos e aplicados, e a primeira vista, sob diversas condições, várias

funções de densidade (ou distribuição) de probabilidade aparecem com tanta freqüência que merecem ser

estudadas.

2.7 - Principais Distribuições Discretas

2.7.2 Distribuição Binomial

Consideremos n tentativas de um mesmo experimento aleatório. Cada tentativa admite apenas

dois resultados: fracasso com probabilidade q e sucesso com probabilidade p, p + q = 1. As

probabilidades de sucesso e fracasso são as mesmas para cada tentativa.

Seja X: nº de sucessos de n tentativas independentes.

Determine a função de probabilidades da variável X, isto é, P(X = k).

Um resultado particular (RP):

Logo,

P(RP) = P(SSS ... SFFF ... F) =

Considerando todas as n-úplas com k sucessos temos:

P(X = k) =

A variável X tem distribuição Binomial, com parâmetros n e p, e indicaremos pela notação X~B(n,p).

Ex. Uma prova tipo teste tem 50 questões independentes. Cada questão tem 5 alternativas. Apenas uma

das alternativas é a correta. Se um aluno resolve a prova respondendo as questões, qual a probabilidade de

tirar nota 5, sabendo-se que a prova vale 10?

Solução: X = nº de acertos. X = 0, 1, .........., 50

p = P( acerto ) = 1/5 X : B( 50, 1/5 )

P( X = 25 ) =

54

Page 55: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Esperança (média) e Variância

Se X ~ B( n, p ) P(X = k) = , logo ;

E(X) = n.p

Var(X) = n.p.q

2.7.3 Distribuição Hipergeométrica

Consideremos uma população com N elementos, dos quais r tem uma determinada característica

(a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição,

uma amostra de tamanho n.

Seja X: nº de sucessos na amostra (saída do elemento com a característica). Qual a P(X = k)?

Podemos tirar amostras sem reposição. Os sucessos na amostra podem ocorrer de maneiras e

fracassos de modos.

Logo,

, 0 k n e k r

A variável X assim definida tem distribuição Hipergeométrica.

Esperança (média) e Variância

E( X ) = n.p

Var( X ) = n.p.(1-p) onde p =

Ex.: Pequenos motores são guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada

caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa é aceita.

Se pelo menos um for defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa

caixa. Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa?

Solução: X: nº de motores defeituosos da amostra.

N = 50; r = 6; n = 5

55

Page 56: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

P(X 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 - = 1 – 0,5126 = 0,4874

2.7.4 Distribuição de Poisson

Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo.

A probabilidade da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A

probabilidade de mais de um sucesso nesse intervalo é bastante pequena com relação à probabilidade de

um sucesso. Por exemplo: automóveis que passam numa esquina. Poderemos num determinado intervalo

de tempo anotar o nº de carros que passaram, porém, o nº de carros que deixaram de passar pela esquina

não poderá ser determinado.

Seja X o nº de sucessos no intervalo então:

Esperança (média) e Variância

E( X ) =

Var( X ) =

Ex.: Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade de que uma página

contenha pelo menos 3 erros?

Solução: X: nº de erros por página e = 1

P(X 3) = 1 – P(X < 3) = 1- {P(X = 0) + P(X = 1) + P(X = 2)} =

= 1 - = 1 - {0,367879 + 0,367879 + 0,183940} =

= 1 – 0,919698 = 0,080302

EXERCÍCIOS

56

Page 57: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

1) A probabilidade de um menino ser daltônico e 6%. Qual é a probabilidade de serem daltônicos

todos os 4 meninos que se apresentaram, em determinado dia, para um exame oftalmológico?

2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual a

probabilidade de se obter:

a) exatamente duas caras?

b) Pelo menos uma cara?

c) Mais de uma cara?

2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual

a probabilidade de se obter:

d) exatamente duas caras?

e) Pelo menos uma cara?

f) Mais de uma cara?

3) Se o número de chamadas telefônicas que um operador recebe entre 9:00 e 9:05 segue uma

distribuição de Poisson com = 2, qual é a probabilidade de que o operador não receba nenhuma

chamada amanhã, no mesmo intervalo?

4) Em estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A

e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos

pesquisadores através de capturas periódicas. Determinar a probabilidade de, em três jacarés capturados

de uma vez, obtemos:

a) Todos da espécie ª

b) Nem todos serem da espécie B.

c) A maioria ser da espécie A.

5) Um laboratório estuda a emissão de partículas de certo material radioativo. Seja N: número de

partículas emitidas em 1 minuto. O laboratório admite que n tem função de probabilidade Poisson com

parâmetro 5, isto é,

a) Calcule a probabilidade de que em um minuto não hajam emissões de partículas.

b) Determine a probabilidade de que pelo menos uma partícula seja emitida em um minuto.

57

Page 58: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

c) Qual a probabilidade que, em um minuto, o número de partículas emitidas esteja entre 2 e

5 (inclusive)?

2.8 - Principais Distribuições Contínuas

As variáveis aleatórias contínuas são muito usadas para descrever fenômenos físicos, principalmente aqueles que envolvem o tempo. Este capítulo apresentará as distribuições de probabilidade mais usadas para descrever a funcionalidade entre as variáveis aleatórias contínuas.

As distribuições contínuas de probabilidade discutidas aqui são: distribuição normal ou gaussiana, distribuição exponencial, distribuição uniforme

2.8.2 - A Distribuição Normal

A distribuição normal (ou Gaussiana) é a mais importante distribuição de probabilidade na

estatística. Isto porque para amostras grandes vários fenômenos estudados convergem para uma curva

normal.

Como se sabe, as variáveis contínuas resultam, em geral, de mensurações (medidas) e podem

assumir quaisquer valores em um intervalo real. Assim, comprimento, área, altura, volume, peso,

pressão, renda familiar, etc, são alguns exemplos de variáveis contínuas. Vimos na Estatística Descritiva

que a apresentação gráfica dessas variáveis pode ser feita através de um histograma ou polígono de

freqüências. Em grande parte dos casos, esses gráficos têm aspecto similar, sugerindo uma distribuição

para os dados em foram de sino, como mostra a figura abaixo:

58

Page 59: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

A curva sob o gráfico acima pode ser interpretada como um limite teórico para a descrição dos

dados, pois à medida que aumentamos o tamanho da amostra mais as características amostrais se

aproximam dos parâmetros populacionais, de tal sorte que podemos supor uma linha totalmente polida,

simétrica e mesocúrtica para o verdadeiro tamanho da população. A essa curava dá-se o nome de curva

normal ou curava gausiana e os dados que aderem a ela seguem a chamada distribuição normal.

A distribuição normal, como já foi dito, é a principal distribuição de variável aleatória contínua.

A caracterização de distribuições contínuas se dá através de uma função densidade de probabilidade. É

através dessas funções, por exemplo, que podemos calcular a probabilidade de uma variável aleatória

pertencer a um determinado intervalo.

Dizemos que a v. a. X tem distribuição normal, com parâmetros e 2,

, se sua f.d.p. é dada por:

, para todo x R,

em que os parâmetros e 2 referem-se respectivamente a média e a variância da variável

aleatória X.

Notação: X~N( , 2)

Gráfico: A figura abaixo ilustra uma particular curva normal, determinada por valores particulares

de e 2.

59

Page 60: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Pode-se demonstrar que:

a) E(X) =

b) Var(X) = 2

c) f(x) 0 quando x

d) - e + são pontos de inflexão de f(x);

e) x = é ponto de máximo de f(x), e o valor máximo é ;

f) f(x) é simétrica ao redor de x = , isto é, f( + x) = f( - x), para todo

g) a variável aleatória (x) pode assumir qualquer valor real.

h) o gráfico é uma curva em forma de sino, simétrica em torno da média .

i) a área total sob a curva vale 1, porque essa área corresponde à probabilidade de a variável

aleatória assumir qualquer valor real.

j) como a curva é simétrica em torno da média, os valores maiores do que a média e os valores

menores do que a média ocorrem com igual probabilidade.

PROBLEMAS para o cálculo das probabilidades:

1. integração de f (x), pois para o cálculo é necessário o desenvolvimento em séries;

2. elaboração de uma tabela de probabilidades, pois f (x) depende de 2 parâmetros , μ e μ, o que

acarretaria um grande trabalho para tabelar essas probabilidades considerando-se as várias

combinações de μ e μ.

60

Page 61: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

SOLUÇÃO: transformação de variáveis (x em z)

A Normal-Padrão

Para o cálculo das probabilidades, surgem dois grandes problemas: primeiro, para integração de

f(x), pois para o cálculo é necessário o desenvolvimento em séries; segundo, seria a elaboração de uma

tabela de probabilidades, pois f(x) depende de dois parâmetros, fato este que acarretaria um grande

trabalho para tabelar essas probabilidades considerando-se as várias combinações de e 2.

Os problemas foram solucionados por meio de uma mudança de variável obtendo-se, assim, a

distribuição normal padronizada ou reduzida:

Quando = 0 e 2 = 1, temos uma normal padrão ou reduzida, e escrevemos: N(0,1).

Se X~N(, 2), então a v.a. Z definida por

terá uma distribuição N(0,1).

É fácil demonstrar que Z tem média 0 e variância 1. A normalidade de Z já não é imediata e não

será provada aqui. A figura abaixo ilustra a N(0,1).

Suponha, então, que X~N(, 2) e queiramos determinar

61

Page 62: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

P(a X b) = . (Ver figura)

A integral acima não pode ser calculada exatamente, por métodos numéricos. No entanto, para

cada valor de e cada valor de , teríamos que obter P(a X b) para diversos valores de a e b. Esta

tarefa é facilitada através do uso de , de sorte que somente é necessário construir uma tabela

para a distribuição normal padrão N(0,1).

Vejamos, então, como obter probabilidades a partir da Tabela da Distribuição Normal Reduzida.

Esta tabela dá as probabilidades sob uma curva normal padrão que nada mais são do que as

correspondentes áreas sob a curva. A figura ao abaixo ilustra a probabilidade fornecida pela tabela , a

saber,

P(0 Z zc),

sendo Z~N(0,1). Assim, se zc = 1,73, segue-se que

P(0 Z 1,73) = 0,4582.

62

Page 63: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Exercícios:

1) Usando a tábua da Normal padrão, ou seja, se Z ~ N(0,1) estabeleça as seguintes probabilidades:

a) P (0<Z<2,13)

b) P (-2,13<Z<0)

c) P ((-2,13<Z<2,13)

d) P (Z 2,13)

e) P (Z< -2,13)

2) Numa população, o peso dos indivíduos é uma variável aleatória X que segundo estudos anteriores

segue o modelo normal com média 78 kg e desvio-padrão 10 kg. Uma pessoa é escolhida ao acaso

nessa população. Determine a probabilidade de que seu peso:

a) Seja maior que 60 kg;

b) Esteja entre 62kg e 72 kg

c) Seja inferior a 90 kg

d) Seja superior a 90 kg

DISTRIBUIÇÃO DE PROBABILIDADES GAMA

Seja X uma variável aleatória que representa o número de chegadas no intervalo de

tempo (0, t) e que segue uma distribuição de Poisson. Suponha que o tempo a v-ésima

chegada seja dada pela f.d.p.

para valores inteiros de ν.

Veja que quando ν = 1....

63

Page 64: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Ou seja, a Distribuição Exponencial é um caso particular da Distribuição Gama.

DISTRIBUIÇÃO GAMA:

Idéias gerais:

Muitas variáveis atmosféricas são distintamente assimétricas, e possuem uma

assimetria para a direita. Muitos de vocês encontraram essas distribuições quando analisaram

seus dados para o seminário. Um dos exemplos mais comuns dessa situação é a precipitação.

Sabemos que não existem precipitações negativas, certo? Então vamos analisar a seguinte

situação: suponha que uma certa localidade tenha uma média de precipitação diária de 1.96 in

e desvio-padrão de 1.12 in. Utilizando a tabela de distribuições acumuladas Gaussiana

podemos calcular a probabilidade de precipitações negativas como Pr { Z ≤ (0.00 – 1.96)/1.12}

= Pr{Z≤ -1.75} = 0.040. Esta probabilidae calculada não é especialmente grande, mas por outro

lado não pode ser considerada zero. AGORA, SABEMOS PELA NATUREZA QUE

PRECIPITAÇÕES NEGATIVAS SÃO IMPOSSÍVEIS!

Uma escolha comum para representar distribuições contínuas que são assimétricas é utilizar a

distribuição GAMMA. Esta distribuição é definida pela PDF:

, onde x, α, β > 0

Os dois parâmetros da distribuição são α, chamado PARÂMETRO DE FORMA , e β O

PARÂMETRO DE ESCALA. A quantitdade Γ(α) é o valor da função matemática padrão

conhecida como FUNÇÃO GAMMA, definida pela integral:

64

Page 65: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Fig. 5.3. Funções densidade de probabilidade GAMMA para 4 valores do parâmetro de forma α

(adaptado de Wilks, cap 5)

Em geral, a função gamma precisa ser avaliada numericamente, ou aproximada usando

valores tabulados como os dados acima. A função gamma satisfaz a recorrência fatorial:

Isto permite que a tabela distribuída em sala de aula seja utilizada indefinidamente. Por

exemplo, Γ(3.5)= Γ(2.5) Γ(2.5)=(2.5)(1.5) Γ(1.5)=(2.5)(1.5)(0.8862)=3.323.

A PDF da distribuição Gamma pode apresentar uma grande variedade de formas, dependendo,

portanto, do parâmetro de forma α. Para valores de α muito altos, a distribuição gamma tende à

Gaussiana

O parâmetro de escala β, tem a função de ESTICAR OU ENCOLHER (isto é escalonar) a

função de densidade gamma para a direita ou esquerda, dependendo das magnitudes gerais

dos valores dos dados representados.

Existem 2 aproximações para os estimadores da distribuição Gamma que são fáceis de

calcular à mão. Ambas empregam a estatística:

, (5.14)

1) A primeira das duas aproximações (conhecida por estimadores de Thom – Thom (1958))

para o parâmetro de forma é dada por:

65

Page 66: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

(5.15)

(5.16)

2) A segunda aproximação é polinomial e utilizamos as seguintes equações:

(5.17)

Para 0≤ D ≤0.5772,

Ou

(5.18)

Para 0.5772 ≤ D ≤ 17

O parâmetro de escala é medido como na Eq. 5.16.

Como no caso da distribuição Gaussiana, a função densidade de probabilidade Gama não é

analiticamente integrável. A distribuição Gama precisa portanto ser obtida pelo calculo das

aproximações da CDF (isto é, a integral da 5.11) ou a partir das probabilidades tabuladas. A

tabela de distribuição de probabilidades Gama será fornecida em sala de aula (ou pode ser

encontrada no final do livro texto – tabela B-2). Em qualquer caso, a distribuição de

probabilidades gama será disponível para uma distribuição gama padrão com β=1. Portanto, é

sempre necessário fazer uma transformação para re-escalonar a variável X de interesse

(caracterizada por uma gama com parâmetro de escala arbitrário β) para a variável

(5.19)

Que segue uma distribuição gama com β=1. A variável padrão ζ é admensional (lembre-se que

β possui a dimensão de seus dados). O parâmetro de forma α será o mesmo para X ou para ζ.

66

Page 67: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Veja que este procedimento é equivalente à transformação para a variável padronizada z no

caso da distribuição Gaussiana.

Entretanto, as PROBABILIDADES CUMULATIVAS para a distribuição gama padrão são dadas

pela função matemática conhecida como “FUNÇÃO GAMMA INCOMPLETA, P(α,ζ )= Pr

{Θ≤ζ}=F(ζ). Esta é a função que foi utilizada para calcular as probabilidades que aparecem na

tabela B.2. Ou seja, as probabilidades cumulativas para a distribuição gama padronizada na

tabela B.2 estão arranjadas de forma INVERSA DO QUE É FEITO COM AS

PROBABILIADDES GAUSSIANAS. Quer dizer, os quantis (ou valores transformados ζ) é que

estão apresentados no corpo da tabela, enquanto as probabilidades cumulativa é que estão

sendo mostradas na primeira linha da tabela. Na primeira coluna da tabela, a entrada é o valor

de alfa.

Vamos analisar o exemplo dado pelo Wilks. Considere a tabela de dados da precipitação de

Janeiro para a cidade de Ithaca durante 50 anos (1933-1982). Queremos avaliar o quão ‘não

usual” foi a precipitação observada em Ithaca em 1987 (fornecida numa tabela separada). Para

esta finalidade, procedemos da seguinte maneira:

1) Calculamos a média aritmética como de costume (no presente caso, a média é igual a

1.96in)

2) Calculamos o valor da média dos logaritmos dos totais mensais (igual a 0.5346)

3) Obtemos o valor de D como na Eq. 5.14 (igual a 0.139)

4) O método de Thom (Eq. 5.15 e 5.17) estimam α=3.76 e β=0.52in.

5) Avaliamos qual usual foi a precipitação em janeiro de 1987 (=3.15in) com a ajuda da

Tab. B2 para os parâmetros da Gama que obtivemos anteriormente. Para esta

finalidade, vamos primeiro fazer a transformação de variáveis indicado na Eq. 5.19. No

presente caso, ζ=3.15in/0.52in= 6.06.

6) O passo seguinte é encontrar no corpo da tabela onde se encontra a probabilidade 6.06

para α=3.76. O valor mais próximo de entrada de α é α=3.75. Vamos olhar na linha

correspondente onde está a probabilidade 6.06. Esta se encontra entre os valores

tabulados F(5.214)=0.90 e F(6.354)=0.90. A interpolação nos dá F(6.06)=0.874. Ou seja,

a probabilidade de chover em janeiro menos ou igual a 3.15 in em Ithaca é de 0.874. O

complementar (1- 0.874) = 0.126 é a probabilidade de chover mais do que esse valor (a

qual é equivalente a aproximadamente 1 chance em 8 (1/8).

A tabela B2 pode também ser utilizada para inverter a CDF gama para encontrar valores de

precipitação correspondendo a probabilidades cumulativas ζ=F-1(p). Valores dimensionais de

67

Page 68: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

precipitação são então recuperados para reverter a transformação na Eq. 5.19. Por exemplo,

vamos considerar a estimativa da mediana para a precipitação de janeiro em Ithaca. Esta

corresponderá ao valor de ζ satisfazendo F(ζ) =0.50, o qual, na coluna correspondente a α=3.5

na Tab. B2 é 3.425. O correspondente valor dimensional da precipitação é dado pelo produto ζ

β=(3.425)(0.52in)=1.78in. Por comparação, a mediana amostral da precipitação obtida da

tabela com os dados é igual a 1.72in. Não é surpresa que a mediana é menos que a média de

1.96in, uma vez que a distribuição é alongada para a direita. (positivamente alongada ou

skewed). O engraçado nesta idéia (o que está intimamente ligado às características de uma

distribuição Gama) é que valores mais baixos do que a média são mais prováveis de ocorrer do

que valores acima da média (ou normal).

68

Page 69: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

69

Page 70: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

70

Page 71: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

UNIDADE IV

INFERENCIA ESTATÍSTICA

ESTATÍSTICA: Ciência que diz respeito à coleta, apresentação, análise e interpretação de dados

experimentais.

ESTATÍSTICA DESCRITIVA

PROBABILIDADE ESTATISTICA

INFERÊNCIA ESTATÍSTICA

1. Introdução

Nas últimas unidades vimos como construir modelos probabilísticos para descrever alguns fenômenos.

Nessa parte, iremos estudar um ramo muito importante da Estatística conhecido como Inferência

Estatística, ou seja, como fazer afirmações sobre características de uma população, baseando-se em

resultados de uma mostra.

Inferência Estatística é o ramo da Estatística que refere-se ao processo de obter informações sobre

uma população a partir de resultados observados na amostra.

POPULAÇÃO (N) AMOSTRA (n)

Inferência Estatística

POPULAÇÃO: conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum observável.

Pode ser finita como o conjunto de alunos de uma escola em um determinado ano, ou infinita, como o

número de vezes que se pode jogar um dado.

AMOSTRA: qualquer subconjunto da população

71

Page 72: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

CASOS GERAIS:

Verificar o sabor de um bolo;

Verificar a temperatura da água de uma piscina;

Avaliar a qualidade de um livro;

A grande maioria das pesquisas realizadas nas mais variadas áreas do conhecimento humano são

feiras com amostras. O pesquisador, no entanto, almeja generalizar seus resultados, ou seja, saber se o

que obteve com amostras é válido para toda a população. Essa é, sem dúvida, a essência da inferência

estatística. Formalmente, a Inferência ou Estatística Indutiva é a parte da Estatística que estuda a

estimação e os testes sobre os parâmetros populacionais.

ALGUNS CONCEITOS IMPORTANTES

AMOSTRA ALEATÓRIA: Seja X uma variável populacional. Uma amostra aleatória é o conjunto de

n variáveis aleatórias independentes, , extraídas de uma população, tal que cada tem a

mesma característica, ou distribuição da variável X.

PARÂMETRO: medida usada para descrever uma característica da população [ ].

ESTIMADOR (ESTATÍSTICA): medida usada para descrever uma característica da amostra [

]

ESTIMATIVA: é o valor numérico do estimador. Por exemplo, é uma estimativa da média

populacional .

ESTIMAÇÃO (Pontual e Intervalar)

INFERÊNCIA

ESTATÍSTICA

TESTES DE HIPÓTESES

(Paramétricos e Não-Paramétricos)

ESTIMAÇÃO PONTUAL

A partir da amostra procura-se obter um único valor de um certo parâmetro populacional.

72

Page 73: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

Em geral é INSUFICIENTE!

Exemplo: A média amostral ( ) é um estimador pontual da média populacional ( ).

ESTIMAÇÃO INTERVALAR

A partir da amostra procura-se construir um intervalo de variação, , com uma certa

probabilidade de conter o verdadeiro parâmetro populacional.

TESTES PARAMÉTRICOS

A hipótese é formulada com respeito ao valor de um parâmetro populacional.

TESTES NÃO-PARAMÉTRICOS

A hipótese é formulada com respeito à natureza da distribuição da população.

ESTIMAÇÃO INTERVALAR

INTERVALOS DE CONFIANÇA

É um intervalo real, centrado na estimativa pontual que deverá conter o parâmetro com determinada

probabilidade.

A probabilidade de o intervalo conter o parâmetro estimado é denominado nível de confiança

associado ao intervalo. A notação mais usual para o nível de confiança associado ao intervalo é 1 - .

Assim como as estimações pontuais, os intervalos de confiança podem ser vistos como uma técnica

para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído com os

elementos amostrais, pode-se inferir sobre um parâmetro populacional.

Fundamenta-se nas distribuições amostrais

: Parâmetro populacional

: Estimador de

73

Page 74: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

A partir da distribuição de probabilidade de é possível construir um intervalo , que

contém , e exigir que a probabilidade do intervalo seja de .

O valor da probabilidade que usualmente assume os valores 90%, 95%, 98%, etc., é

denominado NÍVEL DE CONFIANÇA, e o valor é chamado NÍVEL DE SIGNIFICÂNCIA, isto é,

representa o erro que se está cometendo quando se afirma que a probabilidade do intervalo, ,

conter o verdadeiro valor do parâmetro populacional é .

VANTAGEM:

Permite uma idéia da precisão com que foi calculada a estimativa do parâmetro, pois expressa o

erro aceito ao calculá-la.

1 - Intervalo muito pequeno ALTA PRECISÃO DA ESTIMATIVA DO PARÂMETRO

2 - Quanto maior o grau de confiança MENOR PRECISÃO DA ESTIMATIVA DO PARÂMETRO

Suponha,

n = 25, e

: amplitude = 0.98

: amplitude = 1.36

INTERVALO DE CONFIANÇA PARA A MÉDIA

Neste caso, existem 2 métodos para estimativa de através do intervalo de confiança; as

utilizações desses métodos dependem do tamanho da amostra ou do fato de ter ou não conhecimento do

valor do desvio-padrão populacional. Se n 30 e a variância populacional é conhecida utiliza-se o

método da distribuição normal (a variável utilizada será a Z). No entanto, para amostras pequenas (n <

74

Page 75: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

30) e variância populacional desconhecida utiliza-se o método da distribuição t-Student (a variável

utilizada será a t).

FatoresMétodos

Distribuição Normal Distribuição t-Student

Tamanho da amostra n 30 n < 30

Variância conhecida

Variável utilizada Z T

A Distribuição t de Student

Trata-se de um modelo de distribuição contínua que se assemelha à distribuição normal padrão, N(0,1).

É utilizada particularmente, quando se tem amostras com tamanhos inferiores a 30 elementos.

Possui um parâmetro chamado "grau de liberdade"

Se a distribuição de uma população é essencialmente normal (com a forma aproximadamente de

um sino), então a distribuição de

, com (n-1) graus de liberdade,

é essencialmente uma distribuição t de Student para todas as amostras de tamanho n. A distribuição t de

Student, geralmente conhecida como distribuição t, é utilizada na determinação de valores críticos

denotados por .

A tabela da t relaciona valores da distribuição t juntamente com áreas denotadas por . Os valores

de são obtidos localizando o número adequado de graus de liberdade ((n-1) gruas de liberdade).

OBS: O número de graus de liberdade para um conjunto de dados corresponde ao número de valores que

podem variar após terem sido impostas certas restrições a todos os valores.

75

Page 76: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira

PROPRIEDADES IMPORTANTES DA DISTRIBUIÇÃO t DE STUDENT:

1. A distribuição t de Student tem a mesma forma geral simétrica (curva em forma de sino)que a

distribuição normal, mas reflete maior variabilidade que é esperada em pequenas amostras.

2. A distribuição t de Student tem média t = 0 (tal como a normal padronizada, com média Z = 0).

3. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, mas é superior a 1 (ao

contrário da distribuição normal padronizada).

4. Na medida em que aumenta o tamanho da amostra, a distribuição t de Student se aproxima mais e

mais da distribuição normal padronizada. Para valores n > 30, as diferenças são tão pequenas que

podemos utilizar os valores críticos Z.

CONDIÇÕES PARA A UTILIZAÇÃO DA DISTRIBUIÇÃO t DE STUDENT:

1. O tamanho da amostra é pequeno ;

2. é desconhecido;

3. A população original tem distribuição essencialmente normal (como a distribuição da população

original normalmente é desconhecida, estimamo-la construindo um histograma dos dados amostrais).

GRAUS DE LIBERDADE DE UMA ESTATÍSTICA:

Sabe-se que, a variância de uma amostra deve ser calculada pr, s2 (x)= . A

necessidade dessa correção esta relacionada com o número de G.L, por exemplo: e

.

são estatísticas com "n" graus de liberdade, pois existem n valores xi livres que devem ser considerados

para podermos calcular o valor da estatística.

A estatística s2(x), por usar ao invés de , tem um grau de liberdade a menos. Isso ocorre porque para

o cálculo de s2(x) é necessário que se tenha calculado , ou seja, já utilizamos uma vez todo os valores da

amostra; estes estiram sendo usados pela Segunda vez para o cálculo de s2.

Exercício: Com base na tabela t de Student determine o valor da distribuição nos seguinte casos:

a) t (5; 1%)

b) t (6; 2%)

c) t (19; 5%)

d) t (21; 10%)

e) t (28; 5%)

f) t (12; 1%)

76

Page 77: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

CASO 1:

INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA

POPULACIONAL CONHECIDA

Seja . Sabe-se que o estimador de , (média amostral), tem distribuição de

probabilidade dada por:

, para populações infinitas

, para populações finitas

Então,

Fixando-se um nível de confiança tem-se:

www.estatistica.ccet.ufrn.br 78

Page 78: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

Exemplo: O departamento de Recursos Humanos de uma grade empresa informa que o tempo de

execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o

desvio padrão permanece aproximadamente constante em 3 min. Uma nova tarefa está sendo

implantada na empresa. Uma amostra aleatória do tempo de execução de 50 dessas novas tarefas

forneceu o valor médio de 15 min. Determine o intervalo de confiança de 95% para o tempo

médio de execução dessa nova tarefa.

CASO 2:

INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA

POPULACIONAL DESCONHECIDA

www.estatistica.ccet.ufrn.br 79

Page 79: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

Estimar com base na amostra, S.

Como S é uma variável aleatória a substituição só é verificada para amostras grandes (n

30)

S é um estimador viesado para , mas aumentando o tamanho da amostra o viés tende a

desaparecer; portanto o IC para pode ser construído.

Quanto menor a amostra mais necessária se torna a introdução de uma correção: t(n-1) ao

invés de Z.

Sabe-se que, e

Então,

Para o caso de populações finitas, utilizar:

www.estatistica.ccet.ufrn.br 80

Page 80: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

OBS: Quanto menor o tamanho da amostra, mais necessário se torna a introdução de uma

correção, a qual consiste em usar a variável t-Student (t(n-1)) ao invés de usar a variável Z.

Exemplo: A amostra 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população normal.

Construir um intervalo de confiança para a média ao nível de 95%.

Solução:

Média amostral:

Desvio padrão amostral:

Variável: t(n-1) = t(9; 5%) = 2.2622

Interpretação:

Podemos afirmar que o intervalo [7.27; 10.13] contém a verdadeira média com 95% de

confiança;

A precisão dessa estimativa nos permite afirmar , com 95% de certeza, de que não

estamos errando por mais de 1,43 nessa estimação.

www.estatistica.ccet.ufrn.br 81

Page 81: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

INTERVALO DE CONFIANÇA PARA A PROPORÇÃO

Sabendo que a distribuição amostral da proporção é:

, para populações infinitas.

, para populações finitas.

Quando n for grande, n 30 a distribuição binomial se aproxima da Normal, então:

Fixando-se um nível de confiança tem-se:

Exemplo: Uma pesquisa recente efetuada com 300 habitantes de uma grande cidade revelou que

128 pessoas apresentavam insuficiência respiratória. Determine um intervalo de confiança de

95% para a proporção de habitantes dessa cidade que apresentaram insuficiência respiratória.

TESTES DE HIPÓTESES

www.estatistica.ccet.ufrn.br 82

Page 82: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

Suponha que numa determinada região, o peso de crianças aos 12 anos, seja modulado

pela distribuição normal, tal que X ~N (48, 16). Um pesquisador da área médica desconfia que

devido a mudanças nos hábitos alimentares, o peso médio seja maior. Para tentar comprovar sua

suposição o pesquisador seleciona, por processo aleatório, uma amostra de 100 crianças dessa

população, obtendo como peso amostral = 51,3 kg. Será que ele tem razão? A resposta deve

ser analisada cuidadosamente e uma decisão mais segura só é possível depois de submeter seu

dados a um teste estatístico, também conhecido como teste de hipóteses.

Regra de decisão que permite aceitar ou rejeitar uma hipótese, decisão esta que é tomada

em função dos valores amostrais. Em outras palavras, formula-se uma hipótese quanto ao valor

do parâmetro populacional, e pelos elementos amostrais faz-se um teste que indicará a rejeição,

ou não, da hipótese nula (H0).

HIPÓTESE ESTATÍSTICA

Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma

probabilidade de uma variável populacional.

TIPOS DE HIPÓTESES

: é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;

hipótese nula. É formulada com base nos dados populacionais.

: é qualquer hipótese diferente da hipótese nula, sendo sempre a favor do resultado do

experimento amostral; hipótese alternativa.

OBS: a aceitação de H0 implica na rejeição de H1, e a rejeição de H0 implica na aceitação de H1.

TIPOS DE TESTES

a)

www.estatistica.ccet.ufrn.br 83(Teste bicaudal)

Page 83: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

b)

c)

TIPOS DE ERROS:

Erro Tipo I : P(rejeitar | é verdadeira)

Erro Tipo II : P(aceitar | é falsa)

RealidadeDecisão

Aceitar Rejeitar

é verdadeira Decisão Correta Erro Tipo I

é falsa Erro Tipo II Decisão Correta

ERRO TIPO I cometido quando rejeitamos H0 , quando na verdade, ela é verdadeira. Esse

tipo de erro é o mais importante a ser evitado. A probabilidade de se cometer um erro tipo I é o

que se chama de nível de significância de um teste. =P(erro tipo I)

ERRO TIPO II cometido quando não rejeitamos H0, quando na verdade ela é falsa.

Deseja-se: reduzir ao mínimo as probabilidades dos erros.

TAREFA DIFÍCIL: para uma amostra de tamanho n a probabilidade de se incorrer em

um erro tipo II aumenta à medida que diminui a probabilidade do erro tipo I (vice-versa)

www.estatistica.ccet.ufrn.br 84

(Teste unicaudal à esquerda)

(Teste unicaudal à direita)

Page 84: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

REDUÇÃO SIMULTÂNEA AUMENTO DO

DOS ERROS TAMANHO DE n

PROCEDIMENTO PARA CONSTRUÇÃO DO TESTE DE HIPÓTESE:

1. Estabelecer as hipóteses de nulidade e alternativa ;

2. Escolhe um nível de significância , em geral, usa-se: 0,05; 0,01 ou 0,001

3. Selecionar uma estatística apropriada e determinar as RA e RC para , com o auxílio

das tabelas estatísticas, considerando e a variável do teste.

4. Com os elementos amostrais, calcular o valor da variável do teste.

5. Concluir pela aceitação ou rejeição de pela comparação do valor obtido no 4º passo

com RA e RC, ou seja, rejeitar Ho sempre que a estatística calculada pertencer à região

crítica, caso contrário, não rejeitar.

TESTES PARAMÉTRICOS

TESTES PARA A MÉDIA

1. Enunciar as hipóteses:

2. Fixar o nível de significância . Admitindo desconhecida, a variável do teste será .

www.estatistica.ccet.ufrn.br 85

Page 85: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

3. Determinar RA e RC através da tabela t.

4. Calcular a variável do teste

5. Conclusões

a) Se , não se pode rejeitar .

Se ou , rejeita-se .

b) Se , não se pode rejeitar .

Se , rejeita-se .

c) Se , não se pode rejeitar .

Se , rejeita-se .

Exemplo:

www.estatistica.ccet.ufrn.br 86

Page 86: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

Os registros de um colégio atestam para calouros admitidos uma nota média de 115. Para testar a hipótese de que a média de uma nova turma é a mesma, tirou-se ao acaso, uma amostra de 20 notas, obtendo-se média 118 e desvio padrão 20. Admitir =5% para efetuar o teste.

Solução:

, , , e

1. Enunciar as hipóteses

2. =5%

Variável: =

3. Determinar RA e RC:

4. Calcular a estatística do teste:

5. Conclusão: como não se pode rejeitar com esse nível de significância. Logo, a média da nova turma é a mesma.

TESTES PARA PROPORÇÕES

1. Enunciar as hipóteses:

www.estatistica.ccet.ufrn.br 87

Page 87: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

2. Fixar o nível de significância . A variável escolhida é Z, normal padrão.

3. Determinar RA e RC através da tabela da distribuição normal padrão.

4. Calcular a variável do teste

5. Conclusões

a) Se , não se pode rejeitar .

Se ou , rejeita-se .

b) Se , não se pode rejeitar .

Se , rejeita-se .

c) Se , não se pode rejeitar .

Se , rejeita-se .

Exemplo:

As condições de mortalidade de uma região são tais que a proporção de nascidos vivos

que sobrevivem até 60 anos é 0.6. Testar essa hipótese ao nível de 5% se em 1000 nascimentos

amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos.

Solução:

www.estatistica.ccet.ufrn.br 88

Page 88: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

, , e

1. Enunciar as hipóteses

2.

Variável: = 1.96

3. Determinar RA e RC:

4. Calcular a estatística do teste:

5. Conclusão: como , rejeita-se , concluindo-se ao nível de significância de 5%

que .

TESTES NÃO-PARAMÉTRICOS

TESTE QUI-QUADRADO

Teste de Adequação do Ajustamento

Teste de Associação

www.estatistica.ccet.ufrn.br 89

Page 89: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

CAS0 1: TESTE QUI-QUADRADO DE ADEQUAÇÃO

Suponha que em uma determinada amostra de tamanho n, observou-se que um conjunto

de eventos possíveis, , ocorreram com as freqüências observadas ; e

que de acordo com as regras de probabilidade, era de se esperar que esses eventos ocorressem

com freqüências esperadas, .

Eventos ...

Freqüências

Observadas ...

Freqüências

Esperadas ...

Objetivo: verificar de modo significativo se as freqüências observadas diferem das

esperadas.

CONCEITOS IMPORTANTES:

EVENTO: qualquer ocorrência associada a um fenômeno aleatório.

FREQÜÊNCIA OBSERVADA: é a freqüência que se observa através da realização de um

determinado experimento aleatório.

FREQÜÊNCIA ESPERADA: é a freqüência que se espera que aconteça sem a realização de determinado experimento aleatório.

PROCEDIMENTO PARA A CONSTRUÇÃO DO TESTE:

1. Enunciar as hipóteses

: não há discrepâncias entre as freqüências e .

: há discrepâncias entre as freqüências e .

www.estatistica.ccet.ufrn.br 90

Page 90: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

2. Fixar o nível de significância . A variável escolhida é , onde k é o número de eventos.

3. Determinar RA e RC através da tabela .

4. Calcular a variável do teste

5. Conclusões

a) Se , não se pode rejeitar .

Se , rejeita-se .

Exemplo:

Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipótese de a moeda ser honesta adotando-se = 5%.

Solução:

1. Enunciar as hipóteses

: A moeda é honesta

: A moeda não é honesta

2. = 5%.

Variável:

3. Determinar RA e RC através da tabela .

4. Calcular a variável do teste

Eventos Cara Coroa

www.estatistica.ccet.ufrn.br 91

Page 91: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

Freq. Observada 35 65

Freq. Esperada 50 50

5. Conclusão: Como , rejeita-se , concluindo-se com risco de 5%, que a moeda não é honesta.

CASO 2: TESTE QUI-QUADRADO DE ASSOCIAÇÃO

Objetivo: estudar a associação ou dependência, entre duas variáveis.

Tabela de Contingência: representação das freqüências observadas.

Cálculo das freqüências esperadas tem como base a definição de variáveis aleatórias independentes.

(X e Y independentes: P(Xi, Yj) = P(Xi).P(Yj))

PROCEDIMENTO PARA A CONSTRUÇÃO DO TESTE:

1. Enunciar as hipóteses

: as variáveis são independentes (as variáveis não estão associadas).

: as variáveis são dependentes (as variáveis estão associadas).

2. Fixar o nível de significância . A variável escolhida é , onde L é o número de linhas da tabela de contingência e C é o número de colunas.

3. Determinar RA e RC através da tabela .

www.estatistica.ccet.ufrn.br 92

Page 92: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

4. Calcular a variável do teste

onde, eij = ((soma da linha i)(soma da coluna j))/(total de obs.)

5. Conclusões

a) Se , não se pode rejeitar .

Se , rejeita-se .

Exemplo:

Testar ao nível de 5% se há discrepância entre as preferências por sabor da pasta de dentes e o bairro.

Sabor da PastaBairros

A B C

Limão 70 44 86 200

Chocolate 50 30 45 125

Hortelã 10 06 34 50

Outros 20 20 85 125

150 100 250 500

Solução:

1. Enunciar as hipóteses

: A preferência pelo sabor independe do bairro

: A preferência pelo sabor depende do bairro

2. = 5%.

Variável:

3. Determinar RA e RC através da tabela .

www.estatistica.ccet.ufrn.br 93

Page 93: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

4. Calcular a variável do teste

Tabela de Freqüências Esperadas

Sabor da PastaBairros

A B C

Limão 60 40 100

Chocolate 37.5 25 62.5

Hortelã 15 10 25

Outros 37.5 25 62.5

5. Conclusão: Como , rejeita-se , concluindo-se com risco de 5%, que há

dependência entre o sabor da pasta de dentes e o bairro.

Distribuição Qui-Quadrado

Em uma população distribuída normalmente com variância , escolhemos aleatoriamente

amostras independentes de tamanho n e calculamos a variância amostral S2 para cada amostra. A

estatística amostral

www.estatistica.ccet.ufrn.br 94

Page 94: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

tem uma distribuição chamada Distribuição Qui-quadrado, onde:

n = tamanho da amostra;

s2 = variância amostral;

= variância populacional;

Os valores críticos são encontrados a partir da tabela da distribuição qui-quadrado, cujo número

de graus de liberdade é definido como sendo (n-1).

PROPIREDADES DA DISTRIBUIÇÃO DA ESTATÍSTICA QUI-QUADRADO:

1. A distribuição qui-quadrado não é simétrica, ao contrário das distribuições normal e t de

Student. Na medida em que o número de graus de liberdade aumenta, a distribuição vai se

tornando menos assimétrica.

2. Os valores de qui-quadrado podem ser zero ou positivos; nunca podem ser negativos.

3. Há uma distribuição qui-quadrado diferente para cada número de graus de liberdade que é gl

= (n-1). À medida que o número de graus de liberdade aumenta, a distribuição qui-quadrado

tende para uma distribuição normal.

BIBLIOGRAFIA

MEYER, Paul L. Probabilidade: aplicações à estatística. 2ed. Rio de Janeiro, LTC S/A, 1984.

BUSSAB, W. O e MORETTIN, P. A Estatística Básica. São Paulo: Atual, ed. 4, 1987.

STONE, Hoel Port. Introduction to stochastic process. Boston, Houghton Misslyn Company,

1972.

VIEIRA, Sônia. Planejamento de Experimentos.

VIEIRA, Sônia. Princípios de estatística. São Paulo, pioneira, 1999.

www.estatistica.ccet.ufrn.br 95

Page 95: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

LISTA DE EXERCÍCIOS

1. Um levantamento do tempo de execução de uma determinada tarefa manual realizadas por

idosos apontou, a partir de uma amostra de 100 idosos, um tempo médio de 2,40 min. Sabe-

se, por experiência anterior, que a variância para esse tipo de tarefa e aproximadamente

constante e valor 0,16. Construa um intervalo de confiança de 90% para o tempo médio

desta tarefa sabendo de que se trata de uma população normal.

2. Um psicólogo que trabalha com a situação do problema anterior deseja verificar qual é o

tempo máximo de realização dessa tarefa ao nível de confiança de 80%. Qual foi o valor

obtido por ele?

3. Uma revista semanal, em artigo sobre a participação das mulheres em curso superior de

Ciências Biológicas, afirmou que a proporção de mulheres neste curso é superior à dos

homens. Uma pessoa interessada em testar essa afirmação levantou uma amostra ao acaso de

100 estudantes de Ciências Biológicas e obteve na amostra uma porcentagem de 40% de

mulheres.

a) Qual é o IC para a proporção de mulheres não população ao nível de 98%?

b) Baseando-se nesse IC, a afirmação da revista é certamente falsa?

4. Para estudar o grau de satisfação com o setor de serviço em uma empresa, um consultor

levantou uma amostra aleatória de 50 pessoas na empresa. Sabe-se, por experiências

anteriores, que o desvio padrão para o grau de satisfação com o setor de serviço é

aproximadamente constante e igual a 40. O grau médio de satisfação amostral foi calculado

em 245. Determine um intervalo de confiança de 94% para o grau médio de satisfação nesta

empresa.

www.estatistica.ccet.ufrn.br 96

Page 96: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

5. Uma amostra aleatória de 15 estudantes do curso de Biologia forneceu um desempenho

médio no curso de 20 pontos, com desvio padrão de 0,1 pontos. Supondo que o desempenho

no curso tem distribuição normal de probabilidades, determine um intervalo de confiança de

95% para o desempenho médio dos estudantes do curso de psicologia.

6. Uma amostra aleatória de 60 elementos obtidos de uma população normal apresentou média

de 46 e desvio padrão de 8. Calcular:

a) O erro padrão de estimação da média populacional, ao nível de 90%.

b) O intervalo de confiança para a média populacional ao nível de 98%.

7. Um guarda de trânsito vistoriou 200 carros em um bairro de uma cidade e constatou que 25

motoristas não estavam usando o conto de segurança no momento da vistoria. Determine um

intervalo de confiança de 95% para a proporção de motoristas que usam regularmente o

cinto de segurança neste bairro.

8. Uma amostra de 90 pessoas foi selecionada ao acaso de um grupo de 1.000 pessoas,

fornecendo uma proporção de fumantes equivalente a 0,24. Calcular o intervalo de confiança

ao nível de 92% para a proporção de fumantes nas 1.000 pessoas.

9. Um vendedor consegue entrevistar 120 pessoas num dia, e resolve testar a aceitação de um

novo produto. Para isso, escolheu 32 pessoas e mostrou o produto, conseguindo uma

proporção de respostas positivas de 25%. Qual seria a estimativa da proporção de respostas

positivas entre as 120 pessoas, ao nível de 85%?

10. Uma população normalmente distribuída apresenta média histórica de 6 unidades e desvio

padrão de 0,5 unidades. Uma amostra de 15 elementos selecionados ao acaso forneceu

média 4 e desvio padrão 1. Teste ao nível de 5% o valo da média histórica, contra a

alternativa em que a média diminuiu.

11. De uma população normal com média histórica de 18 unidades, 12 elementos forma

selecionados ao acaso, fornecendo média de 17 unidades e desvio padrão de 3 unidades.

Teste ao nível de significância 10% a hipótese =18.

www.estatistica.ccet.ufrn.br 97

Page 97: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

Um fabricante de inseticida afirma no rótulo da embalagem que sua eficiência é de 70% contra

todos os tipos de insetos. Um agente da Secretaria de Defesa do Consumidor encomenda a um

laboratório um teste de toxicidade do inseticida, e quer testar a hipótese de que a eficiência é de

70% contra a alternativa de ser maior que 70%. O laboratório informou que de 120 insetos

tratados com este inseticida 32 sobreviveram. A toxicidade do inseticida está controlada ao nível

de 2,5% de significância?

www.estatistica.ccet.ufrn.br 98

Page 98: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

= graus de liberdade

TABELA - Distribuição t de Student (Unicaudal e Bicaudal)

25% 10% 5% 2,5% 1% 0,5% 25% 10% 5% 2,5% 1% 0,5%

1 1,0000 3,0777 6,3138 12,7062 31,8207 63,6574 46 0,6799 1,3002 1,6787 2,0129 2,4102 2,6870 2 0,8165 1,8856 2,9200 4,3027 6,9646 9,9248 47 0,6797 1,2998 1,6779 2,0117 2,4083 2,6846 3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8409 48 0,6796 1,2994 1,6772 2,0106 2,4066 2,6822 4 0,7407 1,5332 2,1318 2,7764 3,7469 4,6041 49 0,6795 1,2991 1,6766 2,0096 2,4049 2,6800 5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0322 50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778 6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074 51 0,6793 1,2984 1,6753 2,0076 2,4017 2,6757 7 0,7111 1,4149 1,8946 2,3646 2,9980 3,4995 52 0,6792 1,2980 1,6747 2,0066 2,4002 2,6737 8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554 53 0,6791 1,2977 1,6741 2,0057 2,3988 2,6718 9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498 54 0,6791 1,2974 1,6736 2,0049 2,3974 2,6700 10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693 55 0,6790 1,2971 1,6730 2,0040 2,3961 2,6682

11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058 56 0,6789 1,2969 1,6725 2,0032 2,3948 2,6665 12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545 57 0,6788 1,2966 1,6720 2,0025 2,3936 2,6649 13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123 58 0,6787 1,2963 1,6716 2,0017 2,3924 2,6633 14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768 59 0,6787 1,2961 1,6711 2,0010 2,3912 2,6618 15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467 60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603

16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208 61 0,6785 1,2956 1,6702 1,9996 2,3890 2,6589 17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982 62 0,6785 1,2954 1,6698 1,9990 2,3880 2,6575 18 0,6884 1,3304 1,7341 2,1009 2,5524 2,8784 63 0,6784 1,2951 1,6694 1,9983 2,3870 2,6561 19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609 64 0,6783 1,2949 1,6690 1,9977 2,3860 2,6549 20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453 65 0,6783 1,2947 1,6686 1,9971 2,3851 2,6536

21 0,6864 1,3232 1,7207 2,0796 2,5177 2,8314 66 0,6782 1,2945 1,6683 1,9966 2,3842 2,6524 22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188 67 0,6782 1,2943 1,6679 1,9960 2,3833 2,6512 23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073 68 0,6781 1,2941 1,6676 1,9955 2,3824 2,6501 24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7969 69 0,6781 1,2939 1,6672 1,9949 2,3816 2,6490 25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874 70 0,6780 1,2938 1,6669 1,9944 2,3808 2,6479

26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787 71 0,6780 1,2936 1,6666 1,9939 2,3800 2,6469 27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707 72 0,6779 1,2934 1,6663 1,9935 2,3793 2,6459 28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633 73 0,6779 1,2933 1,6660 1,9930 2,3785 2,6449 29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564 74 0,6778 1,2931 1,6657 1,9925 2,3778 2,6439 30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500 75 0,6778 1,2929 1,6654 1,9921 2,3771 2,6430

31 0,6825 1,3095 1,6955 2,0395 2,4528 2,7440 76 0,6777 1,2928 1,6652 1,9917 2,3764 2,6421 32 0,6822 1,3086 1,6939 2,0369 2,4487 2,7385 77 0,6777 1,2926 1,6649 1,9913 2,3758 2,6412 33 0,6820 1,3077 1,6924 2,0345 2,4448 2,7333 78 0,6776 1,2925 1,6646 1,9908 2,3751 2,6403 34 0,6818 1,3070 1,6909 2,0322 2,4411 2,7284 79 0,6776 1,2924 1,6644 1,9905 2,3745 2,6395 35 0,6816 1,3062 1,6896 2,0301 2,4377 2,7238 80 0,6776 1,2922 1,6641 1,9901 2,3739 2,6387

36 0,6814 1,3055 1,6883 2,0281 2,4345 2,7195 81 0,6775 1,2921 1,6639 1,9897 2,3733 2,6379 37 0,6812 1,3049 1,6871 2,0262 2,4314 2,7154 82 0,6775 1,2920 1,6636 1,9893 2,3727 2,6371 38 0,6810 1,3042 1,6860 2,0244 2,4286 2,7116 83 0,6775 1,2918 1,6634 1,9890 2,3721 2,6364 39 0,6808 1,3036 1,6849 2,0227 2,4258 2,7079 84 0,6774 1,2917 1,6632 1,9886 2,3716 2,6356 40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045 85 0,6774 1,2916 1,6630 1,9883 2,3710 2,6349

41 0,6805 1,3025 1,6829 2,0195 2,4208 2,7012 86 0,6774 1,2915 1,6628 1,9879 2,3705 2,6342 42 0,6804 1,3020 1,6820 2,0181 2,4185 2,6981 87 0,6773 1,2914 1,6626 1,9876 2,3700 2,6335 43 0,6802 1,3016 1,6811 2,0167 2,4163 2,6951 88 0,6773 1,2912 1,6624 1,9873 2,3695 2,6329 44 0,6801 1,3011 1,6802 2,0154 2,4141 2,6923 89 0,6773 1,2911 1,6622 1,9870 2,3690 2,6322 45 0,6800 1,3006 1,6794 2,0141 2,4121 2,6896 90 0,6772 1,2910 1,6620 1,9867 2,3685 2,6316 100 0,677 1,290 1,660 1,984 2,364 2,626

120 0,677 1,289 1,658 1,980 2,358 2,617

0,674 1,282 1,645 1,960 2,326 2,576

www.estatistica.ccet.ufrn.br 99

Page 99: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

www.estatistica.ccet.ufrn.br 100

Page 100: ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I

EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira

www.estatistica.ccet.ufrn.br 101

Assimétrica NegativaSimétricaAssimétrica Positiva