Apresentação CQE2010-EST-II-SP

172
Curso preparatório para a prova de Certificação CQE ASQ Módulo: Estatística II Instrutor: Paulo Simas Tecnologia da Informação - UMSA Maio/2010

description

Aula para curso preparatório para o CQE

Transcript of Apresentação CQE2010-EST-II-SP

Page 1: Apresentação CQE2010-EST-II-SP

Curso preparatório para a prova de Certificação

CQE ASQ

Módulo: Estatística II Instrutor: Paulo Simas Tecnologia da Informação - UMSA Maio/2010

Page 2: Apresentação CQE2010-EST-II-SP

Disciplina: Estatística II

Paulo Afonso Lourenço SimasEngenheiro Mecânico - PUC-BH (1985)

Engº de Qualidade Certificado - CQE-ASQ (2003)

MBA Gestão Empresarial (2007)

paulo.simas@usiminasmecânica.com.br3829-3766 8395-9961

Page 3: Apresentação CQE2010-EST-II-SP

Escopo Stat:VI. Quantitative Methods and Tools (43 Questions)

D. Statistical Decision-Making

Point estimates and confidence intervalsHypothesis testing Paired-comparison testsGoodness-of-fit testsAnalysis of variance (ANOVA)Contingency tables

E. Relationships Between Variables

Linear regressionSimple linear correlationTime-series analysis

Page 4: Apresentação CQE2010-EST-II-SP

Agenda

Primeiro Dia: 27/05/2010– 8:00: Introdução– 8:30: Estimativas (medias e

proporções)– 10:00: Intervalo– 10:30: Estimativa (desvio

Padrão/variância)– 12:00: Almoço– 13:30: Exercícios– 14:30 Correção– 15:30: Intervalo– 16:00: Testes de hipóteses

para a média e a proporção

Segundo Dia: 28/05/2010– 8:00: Testes de hipóteses

para 2 médias/proporções– 10:00: Intervalo– 10:30: Testes de hipóteses

para a variância e Testes de aderência e independência

– 12:00: Almoço– 13:30:Exercícios– 14:30: Correção– 15:30: Intervalo– 16:00: Regressão Linear

Simples

Page 5: Apresentação CQE2010-EST-II-SP

Agenda

Terceiro Dia: 11/06/2009– 8:00: Regressão Linear Múltipla– 10:00: Intervalo– 10:30: Séries Temporais– 12:00: Almoço– 13:30: Exercícios– 15:30: Intervalo– 16:00 Correção

Page 6: Apresentação CQE2010-EST-II-SP

1) If an answer is obvious it must be a trick question.FACT: Just because an answer is obvious to you doesn’t mean it is obvious toeveryone.

2) Guessing wrong can hurt your score more than leaving an answer blank.FACT: There is no penalty for guessing, and you have a 25% chance of getting it right.

3) The passing score for all ASQ exams is 70%.FACT: The passing score for each ASQ exam is established as a minimum performancestandard during the cut-score process.

4) Taking a section refresher course or buying ASQ exam prep material is a sureway to pass.FACT: Section refresher courses and the self-directed products are excellent ways toprepare for the examinations, but using them does not guarantee that you will pass.

5) If you do poorly on one area of the body of knowledge, you automatically fail thetest.FACT: Your total score on the examination determines whether you pass or fail, not yourscore on any one portion of the test.

6) ASQ limits the number of people who pass.FACT: Anyone who meets or exceeds the passing score (cut point) passes theexamination. ASQ does not set a passing rate.

Top 10 Myths of Certification

Page 7: Apresentação CQE2010-EST-II-SP

7) The grading of the constructed response portion of the certified quality managerexam is very subjective.FACT: The constructed response portion of the exam is designed to test the candidate’sability to respond to realworld situations.

8) It takes a long time to receive exam results.FACT: ASQ works very hard to provide exam results as quickly as possible and is veryaware that the examinees are anxious to learn whether they have passed or failed.

9) Test questions are deliberately tricky.FACT: ASQ goes through an extensive process to ensure that examination questionsare as accurate, clear, and concise as possible.

10) I can’t learn from my mistakes if I don’t get my scored test back.FACT: Because of its policy to reuse examination questions, ASQ cannot release copiesof the examinations.

Top 10 Myths of Certification

Page 8: Apresentação CQE2010-EST-II-SP

InglêsVeja como é o seu inglês e qual a modalidade mais fácil de usar agora. Eu optei pelo seguinte:

Eu lia o texto escrito em Inglês e pronunciava em Português. Uma espécie de tradução simultânea. Durante os dias que estudamos junto, eu lia o texto dos livros e os outros escutavam. Não quiseram ler, pois ficaram receosos de retardar o processo. Eu achei bom, pois assim aperfeiçoei mais rápido.

Tempo de estudoCada um tem necessidade de uma quantidade de estudo. eu precisei de muito. Após as aulas,

eu passava os Sábados e Domingos reescrevendo as questões e resolvendo-as, conferindo-as em seguida. Eu precisava sedimentar novamente os conceitos básicos de cada disciplina. Fiz 80% dos exercícios do Stevenson (copiados e resolvidos). Busquei na Internet tudo que dizia respeito ao CQE. Encontrei outros materiais e usei-os para estudo também.

RelaxÉ importante que vocês vejam o limite de cada um. Eu não conseguia estudar após o

expediente. Então ia para casa, verificava a situação por lá (tenho uma filha que estava com 15 anos e um filho de 10 anos.), rezava o terço com eles, ia para a ginástica, e depois que tudo se acalmava, por volta das 9:00 horas da noite, eu voltava a estudar um pouco, se achasse que iria render alguma coisa. Não se esforcem demasiadamente, pois o cansaço da mente e do estado emocional podem prejudicar muito. O resultado do estudo, a vida familiar, seu humor e mais.

Sala de estudosNós pedimos uma sala reservada para nós a partir de Setembro, sendo que tínhamos esta sala

exclusiva, aonde deixamos a maior parte do material, e vínhamos de segunda a sábado estudar nela. Aos Sábados, às vezes era necessário pegar as chaves e informar à vigilância, pois ficávamos sozinhos aqui. Nosso tempo de estudo variou. Eu tirei férias a partir de 27 de Outubro e misturei com os dias de aula, ficando até a segunda-feira após a prova por conta. Outros obtiveram 1 mês de liberação da chefia. Outros conseguiram férias de 15 dias antes da prova. E outros nada.

Estudos para o CQE

Page 9: Apresentação CQE2010-EST-II-SP

SimuladosDevem ser feitos no dia marcado, no horário marcado. Não fiquem adiando. Não busquem os

simulados dos anos anteriores. Como isto é trabalho voluntário, em horários extras, os simulados têm muitas questões repetidas de um ano para outro. Venham para o simulado, para usá-lo como experiência. Vocês terão que ler as questões, entendê-las, resolvê-las e marcar o gabarito. Se vocês já tiverem os resultados ou resolvidos esses simulados, eles não expressarão a condição real da prova, e vocês terão resultados menos realistas. Após os simulados não existe condições psicológicas de se continuar a estudar, o ideal é ir descansar.

Simulados ExtrasEles preparam 3 simulados. Nós fizemos 5. Os dois extras foram feitos buscando-se mais

informações, questões que outras turmas haviam preparado, e simulado da ABCQ. O problema foi no simulado de outra turma, anterior à nossa, que baixaram da internet as questões do site da ASQ, sendo que tinham questões de CRE, CQM, CQA e CQE. Com isto, tivemos um tempo de preocupação (desespero) quando vimos questões tão difíceis para os estudos que estávamos fazendo. Tragam o material para os simulados, pois vocês devem aprender a usá-lo e o que eles contém.

GabaritoMinha turma foi quase unânime em marcar o gabarito enquanto resolvia a prova. Foi uma

experiência válida, porém este sistema foi adotado deste os simulados.

Estudos para o CQE

Page 10: Apresentação CQE2010-EST-II-SP

MaterialResumos, livros, dicionários. Após os estudos, por volta de Outubro, comecem a fazer seus

resumos. Podem utilizar-se de resumos de outros, mas é importante que vocês façam os próprios. Cada um tem sua dificuldade ou facilidade. O resumo de um pode parecer bobagem para uns e não ser entendido por outros. Se forem fazer o dicionário, façam os próprios dicionários. Existem palavras que a gente lê 2 ou 3 vezes e aprende, existem palavras que a gente lê uma infinidade de vezes e depois se desespera escreve para todo lado e acaba aprendendo e existem palavras que por mais que a gente se desespera, jamais aprende. Volto a repetir, cada um tem a sua dificuldade ou facilidade.(Nós tínhamos: Foundations, Pizdek, Primer, Questões da ABCQ, Stevenson)

CalculadoraTenham uma calculadora boa em mãos. Não é necessário nada sofisticado. Precisa ser

Científica e ter funções Estatísticas. O uso na prova é pouco, porém de grande valia se ela tiver as funções para acelerar/facilitar os resultados. Não é permitido uso de calculadora programável. Vejam com o Paulo Rogério sobre o uso de tais calculadoras com antecedência. É muito importante que vocês arrumem a calculadora com bastante antecedência, pois precisam estar acostumados com ela para usá-la no dia.

Estudos para o CQE

Page 11: Apresentação CQE2010-EST-II-SP

Bibliografia

•ASQ’s FOUNDATIONS IN QUALITY

•JURAN’S QUALITY HANDBOOK

Page 12: Apresentação CQE2010-EST-II-SP

1ª Parte:

– Introdução

– Estimativas (Médias e Proporções)

– Estimativas (Desvio Padrão/Variância)

Slide 12

Page 13: Apresentação CQE2010-EST-II-SP

Cálculo das Probabilidades

Grandes Áreas da Estatística

Coleta de Dados

Estatística Descritiva

EstatísticaInferencial

•Organização•Apresentação•Sintetização

Métodos paratomada de decisões

AmostragemPlanejamento deExperimentos

Page 14: Apresentação CQE2010-EST-II-SP

QUESTÕES

• Até que ponto, podemos confiar nos resultados ou estimativas de

estatísticas amostrais?

• Qual é o tamanho ideal ou mínimo para uma amostra representativa?

Precisamos de mecanismos para quantificar em quanto podemos acreditar Precisamos de mecanismos para quantificar em quanto podemos acreditar

no resultados de uma amostra! no resultados de uma amostra!

• Grau de confiança • Tamanho da amostra

• Estimativa • Precisão

Distribuição Amostral da Média:

Page 15: Apresentação CQE2010-EST-II-SP

Média1 1 2 2 4 2,252 5 3 3 6 4,253 2 4 4 3 3,254 9 8 5 9 7,755 4 0 1 0 1,256 2 3 4 2 2,757 4 5 6 7 5,58 5 6 8 9 79 8 6 6 5 6,2510 9 6 7 8 7,511 0 2 8 0 2,512 8 8 4 8 713 9 9 7 8 8,2514 8 7 4 5 615 9 6 4 2 5,2516 3 7 9 4 5,7517 3 1 2 2 218 2 4 4 6 419 8 9 3 4 620 2 7 9 7 6,2521 3 3 4 5 3,7522 3 6 7 8 623 9 8 9 6 824 3 0 1 2 1,525 7 9 6 8 7,5

Amostras aleatórias

0 1 2 3 4 5 6 7

freq

uên

cia

8 9

Distribuição dos 100 dados

f(x) 1

XDistribuição amostral das 25 médias

TEOREMA CENTRAL DO LIMITE

Page 16: Apresentação CQE2010-EST-II-SP

Na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal;

População original

Médias amostraisn=5

Médias amostraisn=30

Page 17: Apresentação CQE2010-EST-II-SP

Compreendendo o Teorema Central do Limite...

Uma variável “x” pode

possuir uma distribuição

normal ou não, com média

() e desvio-padrão ().

Se amostras de tamanho (n)

são extraídas aleatoriamente

dessa população.

Na medida em que o tamanho

da amostra aumenta, a

distribuição das médias

amostrais tende para uma

distribuição normal.nx

Neste caso, a média das

médias amostrais será a

média da população E

o desvio-padrão das médias

amostrais é chamado de

erro padrão, dado por:

X

Page 18: Apresentação CQE2010-EST-II-SP

O Teorema Central do Limite em projeto de elevadores

Em projetos de elevadores é fundamental considerar o

peso das pessoas para que não haja sobrecarga e

futuras falhas. Dado que a população brasileira tem

peso distribuído normalmente entre 72 kg e d.p. 12 kg,

determine a probabilidade de que:

a) uma pessoa escolhida aleatoriamente pese mais de

78 kg.

6915,0

50,012

7278Xz

z

Logo, a probabilidade de uma pessoa pesar mais de 78 kg é de 30,85%.

Page 19: Apresentação CQE2010-EST-II-SP

b) Levando em consideração que uma empresa desenvolveu

um elevador de grande porte (25 pessoas) e a capacidade

máxima de carga é de 1950Kg. Qual a probabilidade de que

25 pessoas que entrem aleatoriamente no elevador, ao

mesmo tempo, propiciem um peso médio maior que 78kg?

Agora estamos lidando com a média para um grupo de 25 valores, e não

mais com um valor individual.

kgX

72

4,225

12

nX

50,24,2

7278

x

Xx

Z

99379,0z

Logo, a probabilidade será de 0,62%.

Page 20: Apresentação CQE2010-EST-II-SP

Conclusões sobre o Teorema Central do Limite.

• O Teorema Central do Limite demonstra que se n é grande (n>30) a

distribuição amostral das médias será aproximadamente normal,

qualquer que seja a variável x;

• Se a própria distribuição original tem distribuição normal, então as

médias amostrais terão distribuição normal para qualquer tamanho

amostral (n).

• No caso de amostragem sem reposição ou quando o tamanho “n” da

amostra é superior a 5% do tamanho N da população finita, ajustamos o

erro-padrão da média amostral para:

1.

N

nN

nX

Page 21: Apresentação CQE2010-EST-II-SP

• Um estimadorestimador é uma estatística amostral utilizada para obter uma

aproximação de um parâmetro populacional. Uma estimativaestimativa é um valor

específico, ou um intervalo de valores, usado para aproximar um

parâmetro populacional.Estimadores

Estimativa pontual Estimativa intervalar

É um valor único (número) usado para aproximar um parâmetro populacional

Intervalo que tem uma probabilidade de conter o verdadeiro valor da população.

Intervalo de Confiança para Média:

ESTIMADOR

Page 22: Apresentação CQE2010-EST-II-SP

ESTIMATIVA INTERVALAR (Intervalo de confiança)

• Fornece uma faixa de possíveis valores que o parâmetro de interesse () pode

assumir, com um grau de confiança conhecido.

O grau de confiança é a probabilidade (1-) expressa em valor percentual do intervalo de confiança conter o verdadeiro valor do parâmetro

populacional.

X

0 Z-1,96 -1,96

/2=0,025 /2=0,025

Grau de confiança de 95%

Para um grau de confiança 95%, o valor crítico de é igual a 1,96 2

Z

• Um Intervalo de confiança é uma amplitude de valores que tem a probabilidade de

conter o verdadeiro valor da população.

Page 23: Apresentação CQE2010-EST-II-SP

Interpretação do conceito de intervalo de confiança para uma

X5050403020 807060

Número da amostra

1

2

3

4...

454647

...

98

99100 =50

Se em um estudo, forem retiradas várias amostras aleatórias de tamanho n da população e que, para cada amostra, seja construído um intervalo de 100(1-) de confiança para .

Os intervalos obtidos serão diferentes, mas 100(1-)% destes intervalos conterão entre os seus intervalos o valor verdadeiro do parâmetro.

Page 24: Apresentação CQE2010-EST-II-SP

Intervalo de Confiança de uma Média populacional (Grandes amostras n>30 ou quando é conhecido)

1) Colete uma amostra aleatória de tamanho n>30 da população ou

uma amostra de qualquer tamanho se é conhecido;

2) Calcule os valores de e (s).

3) Determine o valor do coeficiente de confiança (1 - );

4) Encontre o valor de crítico de

5) Calcule a margem de erro (E)

6) Calcule os limites do intervalo de confiança

7) Interprete o resultado obtido.

X

2

Z

nZx

.2

ExEx

nZE

.2

Page 25: Apresentação CQE2010-EST-II-SP

• É a diferença ou erro máximo provável (1-) entre a média amostral

observada e a verdadeira média populacional . A margem de erro “E”

é também chamada de “erro máximo da estimativa” e pode ser

calculada por: n

ZE

.2

Obs.: a fórmula da margem de erro exige o conhecimento do desvio-padrão

populacional . Sendo praticamente impossível termos o valor do sem ter o valor

da Média populacional, podemos substituir o valor de pelo desvio-padrão amostral

s.

n

sZE .

2

Intervalo inferior Intervalo superiorX

XE

“Margem de erro - Precisão do Intervalo”

Page 26: Apresentação CQE2010-EST-II-SP

Um dos principais produtos de uma indústria siderúrgica é a folha

de flandres. Havia uma preocupação com a possibilidade de

haver um número de folhas fora da faixa de especificação de

dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta

informação a empresa decidiu estimar a dureza média das folhas

de flandres () coletando uma amostra aleatória de 50 folhas.

61,0 60,2 60,3 60,3 60,0 61,0 60,360,0 60,0 60,9 61,0 61,2 59,2 60,960,0 60,5 59,8 59,3 61,0 59,6 59,859,6 60,1 58,0 59,8 58,9 57,6 58,060,5 60,1 61,6 61,1 59,7 58,3 61,659,5 59,0 60,3 58,7 59,6 54,2 60,361,0 59,7 59,9 59,9 60,0 58,6 59,9

Medidas de dureza (HR) das folhas-de-flandres fabricadas pela siderúrgica

61,0

21,60

s

X

Para um grau de confiança de 95%, determine a margem de erro (E) e o intervalo

de confiança para média populacional ().

Page 27: Apresentação CQE2010-EST-II-SP

61,0

21,60

s

X

Resolução:

n = 50

n

sxZE

2

Margem de erro:

17,0169,050

61,0.96,1 E

Grau de confiança de 95% implica em:1 - = 95% = 5% = 0,05 96,1025,0

2

ZZ

Dados:

ExEx

Intervalo de confiança

17,021,6017,021,60

[60,04 ; 60,38]HR

Interpretação:

Se fôssemos selecionar muitas amostras (n=50) da produção de folhas e construíssemos um intervalo de 95% de confiança para cada amostra, 95% desses intervalos conteriam a média populacional .

Page 28: Apresentação CQE2010-EST-II-SP

(Pequenas amostras n 30 e desvio padrão da população desconhecida)

1) Colete uma amostra aleatória de tamanho n < 30 da população;

2) Calcule os valores de e s.

3) Determine o valor do coeficiente de confiança (1 - );

4) Encontre o valor de crítico de

5) Calcule a margem de erro (E)

6) Calcule os limites do intervalo de confiança

7) Interprete o resultado obtido.

X

1;2

nt

ntx

n

.

1;2

ExEx

ntE

n

.

1;2

INTERVALO DE CONFIANÇA DE MÉDIA POPULACIONAL

Page 29: Apresentação CQE2010-EST-II-SP

• O conceito de nível de confiança pode ser utilizado para o cálculo do

tamanho da amostra, necessário para fazermos inferências confiáveis.

• Se a amostra empregada for muito pequena, a

margem de erro será grande, o que

impossibilita ou inviabiliza a tomada de decisão.

• Por outro lado, se a amostra for muito grande,

o intervalo obtido pode ser mais estreito do que

o necessário. (gastos desnecessários);

Como o tamanho

da amostra afeta o

erro de

amostragem?

2

2/ .

E

sZn

n

sZE .

2

CÁLCULO DO TAMANHO DA AMOSTRA:

Page 30: Apresentação CQE2010-EST-II-SP

500 1000 1500 2000 2500 3000Tamanho da amostra

Mar

gem

de

erro

(E

)

0,5

1

1,5

3

2

2,5Tamanho de amostra e margens de erromantendo fixos (S=10 e 95% de confiança)

• Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das

amostras não são constantes;

• Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque

elas fornecem pouca precisão adicional;

Page 31: Apresentação CQE2010-EST-II-SP

Em um estudo para a determinação do perfil dos veteranos de uma Faculdade, a

característica de maior interesse tem s=0,3. Qual deve ser o tamanho da amostra

para que tenhamos 95% de confiança em que o erro da estimativa da

correspondente a esta característica não supere 0,05?

2

2/ .

E

sZn

13905,0

)3,0).(96,1(.22

2/

E

sZn

E = 0,05s = 0,3 =0,05

Refaça o cálculo supondo que se deseja ter 98% de confiança.

Page 32: Apresentação CQE2010-EST-II-SP

PROPORÇÃO

• A estimativa de proporções populacionais é muito semelhante à de

médias populacionais;Estimadores

Estimativa pontual de uma proporção

Estimativa intervalar de uma proporção

• 21% das peças é defeituosa;• 45% dos eleitores votariam novamente no Presidente Lula

• Entre 18 e 23% das peças são defeituosas;• A proporção de votos para reeleição do Presidente está entre 15 a 25%.

• A média de uma distribuição amostral de proporções amostrais

é sempre igual a verdadeira proporção da população.

Intervalo de Confiança para Proporção:

Page 33: Apresentação CQE2010-EST-II-SP

Estimativa pontual

n

Xp ˆ

O estimador da proporção amostral:

Sendo X o número de elementos da amostra (n) que apresenta a característica de estudo;

O erro-padrão da estimativa:

n

qppEP

ˆ.ˆ)ˆ( pq ˆ1ˆ Sendo:

Suposição: A proporção populacional é igual a proporção amostral!

Page 34: Apresentação CQE2010-EST-II-SP

Estimativa intervalar

n

qpZp

n

qpZp

ˆ.ˆ.ˆ;

ˆ.ˆ.ˆ

22

• intervalo de 100(1-)% de confiança;• supondo amostras grandes (n>40) [aproximação da Binomial para Normal];

• Se amostra finita e n > 5% de N:

1

.ˆ.ˆ

.ˆ2 N

nN

n

qpZp

Page 35: Apresentação CQE2010-EST-II-SP

Tamanho da amostra

2

2

2

ˆ.ˆ

E

qpZn

Para o cálculo do tamanho da amostra:

•Se não tivermos noção do número de defeituosos, isto é, p desconhecido:Devemos perceber que p varia de 0 a 1 (de nenhum defeituoso até 100% defeituoso)

21,0q.p3,0p

16,0q.p2,0p

09,0q.p1,0p

0q.p0p

:para

)p1.(pq.p

21,0q.p7,0p

24,0q.p6,0p

25,0q.p5,0p

24,0q.p4,0p

Assim, consideramos P = 0,5 por nos garantir a maior relação para o tamanho da amostra

Page 36: Apresentação CQE2010-EST-II-SP

Exemplo:

Nos Estados Unidos, os pesquisadores de opinião são

atormentados por uma diversidade de fatores de confusão, como

secretárias eletrônicas. Em uma pesquisa junto a 1068 americanos,

673 informaram ter secretária eletrônica. Com base nesses

resultados amostrais determine:

a) A estimativa pontual da população p:

b) a estimativa intervalar de 95% da proporção populacional

630,01068

673ˆ

n

Xp

0290,01068

)370,0).(630,0(.96,1

ˆ.ˆ

2

n

qpZE

659,0601,0

0290,0630,00290,0630,0

ˆˆ

p

p

EppEp Intervalo de confiança

Entre os americanos, a

percentagem daqueles

que possuem secretária

eletrônica é estimada em

63%, com uma margem

de erro de + 2,9 pontos

percentuais.

Page 37: Apresentação CQE2010-EST-II-SP

Conclusões• Intervalos de confiança são muito mais informativos do que as

estimativas pontuais;

• Toda estimativa intervalar está associada a um grau de confiança;

Referência Bibliográfica

Triola.; - Introdução a Estatística

• Quando se tem n<30 e não se conhece o desvio-padrão da população

usamos a distribuição t.

Page 38: Apresentação CQE2010-EST-II-SP

1. Uma máquina automática de suco industrial é regulada de modo que

a quantidade suprida de cada vez, tenha distribuição aproximadamente

normal com desvio-padrão de 35ml. Determine um intervalo de 96% de

confiança para a quantidade média de toda produção, sabendo que uma

amostra de 30 embalagens teve um conteúdo médio de 290 ml.

Exercícios:

2. Uma amostra aleatória de 40 empregados é tomada de uma linha de

produção de 500. A média de horas-extras trabalhadas por semana é

cinco horas com desvio-padrão de uma hora. Construa um intervalo de

99% de confiança para a média das horas extras trabalhadas para a

toda a linha de produção.

Page 39: Apresentação CQE2010-EST-II-SP

3. Um fabricante de cintos de segurança deseja estimar a probabilidade

dos cintos resistirem a um esforço. Como o teste é destrutível , ele deseja

manter o tamanho da amostra o menor possível. Determine o número de

observações que devem ser feitas para estimar a probabilidade a menos

de 0,04 com 95% de confiança, se ele crê (baseando-se em experimentos

anteriores) que a percentagem de defeituosos não supere a 6%.

4. Especifique quais são e como influenciam as 3 variáveis que

determinam a margem de erro de um intervalo de confiança.

Page 40: Apresentação CQE2010-EST-II-SP

5. Qual o tamanho da amostra necessária para estimar o tempo médio que

um vendedor de uma loja de móveis gasta com cada cliente, a menos de 2

minutos do verdadeiro valor, para obter um nível de confiança de 99% de

confiança? Suponha o desvio da população igual a 12 minutos. (obs.:

sempre arredondamos a resposta para o próximo número inteiro superior.)

6. A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a

velocidade desenvolvida nas rodovias durante o período de 2 às 4 horas

da madrugada. Num período de observação e em um trecho específico,

100 carros passaram por um aparelho de radar a uma velocidade média

de 115 Km/h, com desvio padrão de 10 Km/h.

a) Estime a verdadeira média (estimativa pontual) da população;

b) Construa um intervalo de 98% de confiança para a média da população.

Page 41: Apresentação CQE2010-EST-II-SP

7. Uma amostra aleatória de 40 contas não-comerciais na filial de um

banco acusou saldo médio de R$140,00 com desvio-padrão de R$30,00.

a) Construa um intervalo de 95% confiança para a verdadeira média.

b) Construa um intervalo de 99% confiança para a verdadeira média.

c) A que conclusão podemos chegar com os resultados das letras

anteriores?

8. Um grupo de pesquisa de mercado constatou que 25% dos 200

fregueses recentemente entrevistados num grande shopping center de

Belo Horizonte residem a mais de 5 Km deste local.

a) Construa um intervalo de 95% de confiança para a percentagem efetiva

de fregueses que moram a mais de 5 km do Shopping Center;

b) Qual é o erro provável máximo associado ao intervalo?

Page 42: Apresentação CQE2010-EST-II-SP

9. A Biblioteca da faculdade deseja estimar a percentagem de livros de

seu acervo que são publicados até 1995. Qual deve ser o tamanho da

amostra aleatória para se ter 90% de confiança de ficar menos de 5% da

verdadeira proporção?

10. Uma amostra aleatória de 40 homens trabalhando num grande projeto

de construção revelou que 6 homens não estavam usando capacetes

protetores. Construa um intervalo de 98% confiança dos que não estão

usando capacetes nesse projeto.

Page 43: Apresentação CQE2010-EST-II-SP

INTERVALO DE TOLERÂNCIA

Limites de Tolerância são similares a Capabilidade de

Processo, isto é, eles mostram os limites práticos de

variabilidade do processo e portanto podem ser valiosas

informações na determinação dos limites de tolerância na

engenharia.

Existem dois tipos de determinação dos limites de tolerância:

-Os que assumem a distribuição Normal

-Os que não requerem qualquer distribuição.

Intervalo de Tolerância:

Page 44: Apresentação CQE2010-EST-II-SP

Intervalo de Tolerância:

Método Distribuição Fórmula dos limites

Amostra de n elementos sabendo-se a média e o desvio padrão

Normal

Amostra de n elementos sabendo-se a média e o range

Normal

N amostras de n elementos cada uma e sabendo-se a média das médias e o range

Normal

Definida a proporção da população, e amostra de n observando o maior e o menor valores

Nenhuma A probabilidade é que ao menos P% da população estará entre os extremos amostrais

RKx 1

Ksx

RKx 2

Page 45: Apresentação CQE2010-EST-II-SP

• Identificação de K, K1 e K2:

•Fazer uso das tabelas de “Fatores de Tolerância para

Distribuição Normal” (Juran, Apêndice II, Tabelas U, V e W)

Intervalo de Tolerância:

Page 46: Apresentação CQE2010-EST-II-SP

INTERVALO DE TOLERÂNCIA

• Alguns valores de K (proporção populacional 95% e nível de

confiança 95%)n One Sided K Two Sided K

3 9.916 7.655

4 6.370 5.145

5 5.079 4.202

6 4.414 3.707

7 4.007 3.399

8 3.732 3.188

9 3.532 3.031

10 3.379 2.911

11 3.259 2.815

12 3.162 2.736

13 3.081 2.670

14 3.012 2.614

15 2.954 2.566

Page 47: Apresentação CQE2010-EST-II-SP

INTERVALO DE CONFIANÇA PARA A VARIÂNCIA

• A variância amostral s2 é a melhor estimativa pontual da variância

populacional 2 (população normal).

• Embora s2 seja a melhor estimativa pontual de 2, não há indicação

de quão bom realmente seja. Para compensar esta deficiência,

estabelecemos uma estimativa intervalar mais “reveladora”:

•Lembrete: a distribuição Qui-Quadrado não é simétrica!!!!

2

22

2

2 )1()1(

ED

snsn

Page 48: Apresentação CQE2010-EST-II-SP

INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO

• O intervalo de confiança para o desvio padrão é dado pela raiz

quadrada de cada componente do intervalo de confiança da variância.

2E

2

2D

2 s)1n(s)1n(

Page 49: Apresentação CQE2010-EST-II-SP

Exemplo:

A variância amostral para um conjunto de 25

amostras foi calculado ser 36. Calcule o

intervalo de 90% de confiança para a variância

populacional.

Slide 49

38,6272,23

85,13

36)125(

42,36

36)125(

s)1n(s)1n(

2

2

2

22

2

2

1n,2/11n,2/

95,02/1

05,02/

25n

36s2

Page 50: Apresentação CQE2010-EST-II-SP

Exercícios: Folha 1

Slide 50

Page 51: Apresentação CQE2010-EST-II-SP

2ª Parte:

– Testes de hipóteses para a média e a proporção

Slide 51

Page 52: Apresentação CQE2010-EST-II-SP

TESTE DE HIPÓTESE

Hipótese, em estatística, é uma afirmação sobre uma propriedade

(parâmetro) de uma população.

O objetivo da estimação é

estimar (calcular) algum

parâmetro populacional.

O objetivo do teste de hipótese

é decidir se determinada

afirmação sobre um parâmetro

populacional é verdadeira.

Inferência estatística

Inspeciona-se uma amostra de 142 peças de uma grande remessa,

encontrando-se 8% de peças defeituosas. O fornecedor garante que

não haverá mais de 6% de peças defeituosas em cada remessa. O

que devemos responder com o auxílio do teste de hipótese é se a

afirmação do fornecedor é verdadeira !

O problema:O problema:

Teste de Hipótese:

Page 53: Apresentação CQE2010-EST-II-SP

Estabelecer a hipótese nula ( pressupõem-

se que não há diferença entre o que se

afirma e que realmente acontece).

Hipótese NulaoH Hipótese Alternativa 1H

É a afirmação que deve ser verdadeira

se a hipótese nula é falsa.

A forma simbólica de uma hipótese nula pode ser:

:

:

:

o

o

o

H

H

H Algum valor

Algum valor

Algum valor

A forma simbólica de uma hipótese alternativa pode ser:

:

:

:

1

1

1

H

H

H Algum valor

Algum valor

Algum valor

ESTABELECENDO HIPÓTESES:

Page 54: Apresentação CQE2010-EST-II-SP

Se o leitor ou consumidor está fazendo a

pesquisa e deseja usar o teste de hipótese

para apoiar sua afirmação, então essa

afirmação deve ser formulada de maneira

que se torne a hipótese alternativa, não

podendo assim, conter a situação de

igualdade!

A Hipótese alternativaA Hipótese alternativa Hipótese de pesquisaHipótese de pesquisa

Page 55: Apresentação CQE2010-EST-II-SP

3: oH

3:1 H

A Telemar afirma que pelo menos 88%

dos telefones públicos em Belo Horizonte

estão em bom estado.

88,0: pHo

Um fabricante de pneu alega que seus

pneus suportam 64 mil Km no mínimo.

000.64: oH

000.64:1 H

88,0:1 pH

O tempo médio para fazer um teste é

crítico para a gestão de custos de um

grande laboratório. Supõem-se que um

certo tipo de teste pode ser feito em três

minutos.

Hipóteses

EXEMPLOS DE HIPÓTESES NULAS E ALTERNATIVAS

Page 56: Apresentação CQE2010-EST-II-SP

• O teste consiste em verificar se uma estatística amostral observada

pode razoavelmente provirrazoavelmente provir de uma população com um parâmetro

alegado;

X

0 Z

Estatísticas amostrais como esta são bastante prováveis se

Ho é verdadeira;

Estatísticas amostrais como esta são bastante improváveis se Ho é verdadeira;

CARACTERÍSTICAS DE UM TESTE DE HIPÓTESE:

Page 57: Apresentação CQE2010-EST-II-SP

Inspeciona-se uma amostra de 142 peças de uma grande remessa,

encontrando-se 8% de peças defeituosas. O fornecedor garante que

não haverá mais de 6% de peças defeituosas em cada remessa. O

que devemos responder com o auxílio do teste de hipótese é se a

afirmação do fornecedor é verdadeira !

O problema:O problema:

n

qppEP

.)( 02,0

142

)94,0).(06,0()( pEP

%6: pHo

%6:1 pH

0,102,0

06,008,0

.

ˆ

nqp

ppZ

0,1587

f(x)

X0,08

0 1 Z

• A probabilidade de obter uma discrepância

superior a 8% com uma amostra de 142 de

uma população com 6% é de cerca de 16%;

ENTENDENDO A BASE DO TESTE DE HIPÓTESE:

Page 58: Apresentação CQE2010-EST-II-SP

Assim podemos dizer:

Isto pode sugerir que a discrepância pode ser devida apenas ao acaso, mas não

podemos afirmar, em definitivo, que a população tenha realmente uma

percentagem de 6% de defeituosos. Em vista da distribuição amostral de tal

população e da estatística observada, podemos afirmar que a afirmativa parece

verdadeira.• Suponhamos agora que tivéssemos

encontrado uma proporção amostral,

digamos de 19%.

5,602,0

06,019,0ˆ

x

ppZ

f(x)

X

0 6,5Z

• A probabilidade é pequena. Assim, parece

pouco provável que tal estatística amostral

provenha de uma população com um

parâmetro com população alegada de 6%.

Page 59: Apresentação CQE2010-EST-II-SP

Procedimentos para o teste de hipótese de uma e p:

1- Formular as hipóteses nula e alternativa colocando-as na forma simbólica;

Obs.:Das duas expressões, a hipótese nula (Ho) é a que contém a condição

de igualdade. A hipótese alternativa (H1) e a outra afirmação;

2- Escolher o nível de significância () com base na gravidade do erro tipo 1.

Tomar um valor de () pequeno se as consequências da rejeição de uma Ho

verdadeira são sérias. (valores comuns para : 0,05 e 0,01);

4- Determinar a estatística de teste. Incluir a estatística de teste no gráfico;

5- Rejeitar Ho se a estatística de teste esta na região crítica. Não rejeitar Ho se a

estatística de teste não está na região crítica;

6- Formule a decisão estatística em termos do problema original.

3- Determinar os valores críticos e a região crítica. Esboçar um gráfico e incluir os

valores críticos e a região crítica;

Page 60: Apresentação CQE2010-EST-II-SP

Conceitos importante para o Teste de Hipótese:

• Estatística de teste = é uma estatística amostral da média ou da

proporção;

• Região Crítica = é o conjunto de todos os valores da estatística

de teste que levam à rejeição da hipótese nula;

• Valor Crítico = O valor crítico e o valor ou valores que separa(m)

a região crítica dos valores da estatística de teste que não levam a

rejeição da hipótese nula;

Page 61: Apresentação CQE2010-EST-II-SP

Região Crítica e o nível de significância num teste bilateral

Não rejeitamos Ho

Rejeitamos HoRejeitamos Ho

Região Crítica Região Crítica

/2 /20

Page 62: Apresentação CQE2010-EST-II-SP

Decidimos rejeitar a hipótese nula

Não rejeitamos a hipótese nula

A hipótese nula é verdadeira

A hipótese nula é falsa

Erro tipo I ()

Erro tipo II ()

Ok

Ok

Erros do tipo: I e II

O valor é verdadeiro na realidade

• A probabilidade de um erro tipo I acontecer é igual ao nível de significância () de

um teste de hipótese. Valores comuns predeterminados: (=0,05 e =0,01)

() nível de significância ou a

probabilidade do erro tipo I

() nível de significância ou a

probabilidade do erro tipo II

Page 63: Apresentação CQE2010-EST-II-SP

Erro Tipo I: Risco do Produtor

• Teste Bilateral = quando a região crítica está situada nas duas regiões

extremas (caudas) sob a curva;/2/2

• Teste Unilateral a esquerda =

quando a região crítica está situada na

extrema esquerda sob a curva;

• Teste Unilateral a direita =

quando a região crítica está situada na

extrema direita sob a curva;

Page 64: Apresentação CQE2010-EST-II-SP

Erro Tipo II: Risco do Consumidor

Page 65: Apresentação CQE2010-EST-II-SP

Exemplo de um Teste de Hipótese Para Média

Um fabricante de pneu americano alega que seus pneus suportam

uma quilometragem de 40.000 milhas no mínimo. Suponhamos que

os resultados de um teste tenham sido: amostra n=49, média

amostral 38.000 milhas. Sabe-se que quilometragem de todos os

pneus tem desvio-padrão de 3.500 milhas. Realize o teste de

hipótese para testar a afirmação do fabricante.

000.40:1 H

000.40: oH500

49

500.3

nX

0,4500

000.40000.38

x

Xx

Z

Adotando: (=0,05) temos que Z = - 1,65

Portanto a Ho deve ser rejeitada se:

Z < Z0,05

Single Sample Test

Page 66: Apresentação CQE2010-EST-II-SP

X

0-4,0 Z-1,65

1- O valor de Z = - 4,0 é menor que

-1,65 , o que rejeitaria a hipótese nula;

CONCLUSÕESCONCLUSÕES

2- A evidências suficientes para garantir

a rejeição da afirmação que a média é

maior ou igual à 40 mil Milhas

3- Poderemos, estar correndo um erro

tipo I. Não há maneiras de se estar

absolutamente certo se Ho é verdadeiro

ou não.

Qual a verdadeira média dos pneus?

- Uma forma de responder a

esta pergunta é usar os dados

amostrais para estimar a média

da quilometragem. Usando um

nível de confiança de 95%,

temos:

38.000+1,96.(500)

nX x.96,1

(38.000+980) milhas

Page 67: Apresentação CQE2010-EST-II-SP

Exemplo para o teste de uma afirmação de uma proporção:

Um estudo sobre a eficácia do air-bag em automóveis, constatou

que, em 821 colisões com carros de tamanho médio equipados

com air-bag, 46 resultaram na hospitalização do motorista. Ao

nível de significância de 0,01, teste a afirmação de que a taxa de

hospitalização nos casos de air-bag é inferior à taxa de 7,8%.

078,0: pHo

078,0:1 pH

35,2

821)922,0).(078,0(

078,005603,0

.

ˆ

nqp

ppZ

922,0078,011 pq05603,0821

46ˆ p

078,0p

01,0

Implica num valor crítico de Z= -2,33

A estatística de teste está dentro da região crítica.

Rejeitamos Ho. Assim temos evidências suficientes para

afirmar que a taxa de hospitalização é inferior a 7,8%.

Portanto a Ho deve ser rejeitada se:

01,0ZZ

Page 68: Apresentação CQE2010-EST-II-SP

Exemplo para o teste de uma afirmação de uma proporção:

Em um teste de gosto de consumidores, 100 bebedores regulares de

Pepsi recebem amostras cegas de Coca e Pepsi; 48 deles preferiram a

Coca-cola no teste. Se os diretores da Coca-cola afirmam que seu

refrigerante é preferido por 50% dos bebedores de Pepsi, teste esta

afirmação ao nível de significância de 0,05.

50,0: pHo

50,0:1 pH

40,0

100)5,0).(5,0(

5,048,0

.

ˆ

nqp

ppZ025,0

2

Implica num valor crítico de Z0,025=+1,96 Não há evidencia

suficiente para

rejeitar a afirmação

de que 50 % dos

bebedores de Pepsi

preferem coca

Conclusão

Portanto a Ho deve ser rejeitada se:

025,0ZZ 025,0ZZ ouZ=0

Dados amostrais indicamZ= - 0,4

p=0,5

-1,96 +1,96

48,0100

48ˆ p 5,05,01p1q 50,0p

Page 69: Apresentação CQE2010-EST-II-SP

Pontos importantes e conclusões:

• Para o teste de hipótese da Média, o tamanho da amostra (n) sempre deve ser > que

30;

• Para o teste de hipótese da Média de pequenas amostras, a distribuição t de

student deve ser usada;

• Nos testes bilaterais, o nível de significância () é dividido igualmente entre as duas

caudas que constituem regiões críticas;

• Quando a hipótese alternativa (H1) é de algum valor, temos um teste bilaterais.

Quando H1 tem sinal (>) temos um teste unilateral a direita e quando H1 recebe sinal

(<) temos um teste unilateral a esquerda ;

• A interpretação do texto é bastante importante na realização dos experimentos de teste

de hipótese. Se mencionar igual trata-se de uma afirmação nula, se não mencionar,

a afirmação será a hipótese alternativa;

Page 70: Apresentação CQE2010-EST-II-SP

Exercícios:

1. Um fabricante de fio de arame alega que seu produto tem uma resistência

média à ruptura superior a 10 Kg, com desvio padrão de 0,5 kg. O INMETRO

resolve testar essa afirmativa, extraindo uma amostra de 50 peças de arame, a

qual acusou resistência média de 10,4 kg. Que conclusão o INMETRO pode

chegar?

2. Uma rede de pizzaria compra as peças de salame utilizadas na produção de

pizzas de uma grande indústria produtora de alimentos derivados de carne. Pizzas

de boa qualidade exigem um teor médio de gordura nas peças de salame igual a

40%. Experiências anteriores com este fornecedor revelam que o teor médio de

gordura tem variabilidade igual a um d.p. de 2,0%. Um teste com 36 peças de

salame um teor médio de gordura de 41%. Faça o teste de hipótese adotando nível

de significância 0,05.

Page 71: Apresentação CQE2010-EST-II-SP

3. O tempo médio necessário para paradas de manutenção de uma certa

máquina copiadora é igual a 93 minutos. Uma companhia alega que o seu novo

modelo foi projetado para ter uma manutenção mais fácil e consequentemente

mais rápida. Um teste com 73 máquinas de um novo modelo resultou num tempo

de reparo médio de 88,8 minutos. Sabendo-se que os arquivos de manutenção

registram um desvio-padrão de 26,6 minutos, utilize o nível de significância de

(=0,025) para testar a alegação da companhia.

4. Em uma certa indústria, cerca de 15% dos trabalhadores possuíam doenças

provocadas pela radiação. A companhia afirmou ao sindicato que faria a

medicação de seus trabalhadores e depois do tratamento cerca de 140

trabalhadores foram novamente avaliados. Constatou-se cerca de 19

trabalhadores com altos índices de radiação. Utilize (=0,025) para checar a

alegação da companhia de que o tratamento teve sucesso.

Page 72: Apresentação CQE2010-EST-II-SP

5. Uma empresa fornece uma grande variedade de parafusos à montadora Fiat.

Um dos tipos de parafusos mais importantes utilizados na montagem dos

automóveis é o de comprimento igual à 3,5 polegadas. Para este tipo, o

fornecedor alega que um lote enviado contém parafusos com tamanho médio

igual à 3,5 polegadas e desvio-padrão de 0,01 polegada. Você é o diretor

responsável pelo controle de qualidade de peças de terceiros da FIAT e determina

aos seus estagiários que tirem uma amostra aleatória de 40 parafusos para

verificar o comprimento. O resultado encontrado no teste foi uma média de 3,49

polegadas. Utilize um nível de significância igual (=0,05).

6. Um engenheiro de produção recém contratado pela “Cera Inglesa” deseja

estimar a percentagem do estoque de todos os tipos de produtos que chegaram

na central de distribuição de Belo Horizonte no início do ano passado e que ainda

não foi distribuída. Qual deve ser o tamanho da amostra aleatória a ser tomada

para se ter 99% de confiança de ficar menos de 3% da verdadeira proporção?

Page 73: Apresentação CQE2010-EST-II-SP

7. Uma amostra aleatória com 69 compradores de novos veículos GOLF mostrou

que a quilometragem média percorrida durante o primeiro ano de utilização do

veículo foi de 7.500 km com desvio-padrão de 1150 km.

A) Construa um intervalo de 90% confiança para a verdadeira quilometragem

média.

B) Construa um intervalo de 99% confiança para a verdadeira quilometragem

média.

C) A que conclusão podemos chegar com os resultados das letras anteriores?

8. O tempo médio, por operário para executar uma tarefa tem sido igual a 100

minutos, com um desvio padrão de 15 minutos. Introduziu-se uma modificação para

diminuir esse tempo, e, após certo período, sorteou-se uma amostra de 36

operários, medindo-se o tempo de execução de cada um. O tempo médio da

amostra foi de 85 minutos. Estes resultados trazem evidências estatísticas da

melhora desejada?

Page 74: Apresentação CQE2010-EST-II-SP

Exemplos: soluções

Slide 74

Page 75: Apresentação CQE2010-EST-II-SP

3ª Parte:

– Testes de hipóteses para 2 médias / proporções

– Testes de hipóteses para a variância e Testes de aderência e independência

Slide 75

Page 76: Apresentação CQE2010-EST-II-SP

Exemplos de Comparações

Técnicos de uma indústria que opera com duas linhas de produção desejam avaliar a similaridade de produção das linhas a fim de identificar possíveis pontos de melhoria em uma delas;

A área de marketing de uma empresa prestadora de serviços deseja fazer uma nova peça publicitária comparando o serviço prestado ao das concorrentes.

Teste de Hipótese sobre 2 Médias Amostrais:

Two Sample Test

Page 77: Apresentação CQE2010-EST-II-SP

Tipos de Amostras

Independentes

se a amostra extraída de uma das populações não tem qualquer relação com a amostra extraída da outra população; como por exemplo o peso de Homens e de Mulheres.

H1 M1H2 M2H3 M3

Dependentes ou Emparelhadas

quando uma amostra possui alguma relação com a outra; como por exemplo o peso do indivíduo antes e após um tratamento para emagrecimento.

H1a H1dH2a H2d

H3a H3d

Page 78: Apresentação CQE2010-EST-II-SP

Comparação de Duas MédiasDados Emparelhados

Dez cobaias (porcos) foram submetidas a um tratamento com um novo tipo de ração, por um mês. Deseja-se saber se a nova ração foi efetiva para o aumento de peso dos animais.

Trata-se de dados emparelhados, pois o que se pretende medir é o peso atual – peso anterior de um mesmo indivíduo da população

Page 79: Apresentação CQE2010-EST-II-SP

depois - antes =

H0: 0

H1: < 0

O teste a ser usado será “t de Student”:

t = d. -

sd/nPorque ?

A distribuição t-Student assemelha-se a distribuição normal em relação à forma, sendo menos alta na região próxima a média e mais alta nas extremidades, sendo aplicável para n < 30. A medida que n sobe t tende para z.

Page 80: Apresentação CQE2010-EST-II-SP

Comparação de Duas MédiasDados Emparelhados

H0: 0

H1: < 0

d. = 4.3

Sd = 4.9

tcalc= (d.- ) / (Sd/ n)

tcalc= (4.3- 0) / (4.9/ 10)

tcalc= 2.77

Considerando = 0,05 e t(n-1) tem-se

tcrítico = -1.833

Sendo tcalc > tcrítico, não há evidência para rejeitar H0

Antes Após Diferença300 315 15310 312 2315 320 5320 320 0310 313 3312 315 3325 330 5310 307 -3315 319 4311 320 9

Média 312,8 317,1 4,3D.P. 6,7 6,2 4,9

Page 81: Apresentação CQE2010-EST-II-SP

Escolha dos Testes

Comparação de2 médias

Dados Emparelhados

H0: = 0H1: 0

Calcula-set de Student

Não

Desconhecidos 1 = 2

Conhecidos 1 = 2

Z = (X1-X2) (1/n1+1/n2)

2

)1()1( 22

212

nm

smsns

mns

YX

11.2

Calcula-set como sendo...

Calcula-se t de StudentUsando Aspin-Welch

Sim

Desconhecidos 1 2

Page 82: Apresentação CQE2010-EST-II-SP

Comparação de Duas MédiasDados Não Emparelhados

Dois diferentes métodos de execução de uma tarefa foram testados, resultando nos dados abaixo, expressos em minutos. Deseja-se saber se o método 2 é mais rápido que o método 1.

Trata-se de dados não emparelhados, e é razoável supor que as variâncias sejam iguais.

Page 83: Apresentação CQE2010-EST-II-SP

Comparação de Duas MédiasDados Não Emparelhados

H0: 1 = 2

H1: 1 > 2

X1 = 55, S1 = 2,7 e n1 = 5

Y2 = 53, S2 = 2,2 e m2 = 5

S = 2.5

tcalc = 1.26

Considerando = 0,05 e t(n1+m2-2);0,05

tem-se tcrítico = 1.86

Sendo tcalc < tcrítico, não há evidência para rejeitar H0

Método 1 Método 254 5055 5458 5651 5257 53

Média 55 53D.P. 2,7 2,2

2

)1()1( 22

212

nm

smsns

m1

n1

.s

YXt

2

calc

Page 84: Apresentação CQE2010-EST-II-SP

Escolha de t crítico = f(H1)

• A região crítica para um teste

com nível de significância (),

depende da hipótese

alternativa;

mns

YXTo

11.2

211 : H 2;0 mntT

211 : H 2;0 mntT

211 : H2;2/0 mntT

Hipótese alternativa Região Crítica

2;2/0 mntT

Page 85: Apresentação CQE2010-EST-II-SP

Características do teste de comparação para proporções:

Proporção populacional

Tamanho da amostra

Número de sucessos na amostraproporção amostral

Para a população 1Para a população 1

1p

1n

1x

1

11ˆ

n

xp

Proporção populacional

Tamanho da amostra

número de sucessos na amostraproporção amostral

Para a população 2Para a população 2

2p

2n

2x

2

22ˆ

n

xp

• Têm-se dois conjuntos de dados amostrais independentes

escolhidos de maneira aleatória;

• Em ambas as amostras verificam-se as condições de:

(Condição para uso da Distribuição Normal) 5ˆ.

5ˆ.

qn

pn

Teste de hipótese s/ 2 proporções amostrais:

Page 86: Apresentação CQE2010-EST-II-SP

Características do teste de comparação para proporções:

• O teste de hipótese feito para duas proporções populacionais

utiliza a seguinte estimativa combinada do valor comum a p1 e p2 :

21

21

nn

xxp

pq 1Para pPara p1 =1 = p p2 2 têm-se a seguinte têm-se a seguinte

estimativa combinadaestimativa combinada

• A estatística de teste para duas proporções será igual :

21

21

..

ˆˆ

nqp

nqp

ppZo

Page 87: Apresentação CQE2010-EST-II-SP

“Exemplo da aplicação do teste de hipótese para comparação de duas proporções”

Uma empresa nacional de linha branca deseja comparar o

desempenho dos motores fabricados pelo seu fornecedor (1) com o

desempenho dos motores vendidos por um outro fornecedor (2) ao seu

concorrente. A variável escolhida para a realização da comparação foi a

proporção de motores que funcionam sem a necessidade de reparos por

um período de um mês, quando submetidos a condições específicas de

“stress”. No estudo foram tomados 100 motores de cada fornecedor,

sendo encontrados: X1=66 e X2=73 motores que funcionaram sem a

necessidade de reparos. A equipe da empresa realizará o teste de

hipótese adotando o nível de significância = 0,05.

Page 88: Apresentação CQE2010-EST-II-SP

1- Estabelecer as Hipóteses nula e alternativa:

21: ppHo

211 : ppH

A empresa quer comparar o desempenho dos motores dos dois fornecedores;

Os parâmetros de interesse são as proporções de motores dos

fornecedores: p1 e p2 que funcionam sem a necessidade de reparo

2- Determinação do nível de significância e da região crítica:

A partir da tabela de distribuição normal padronizada

96,1025,0

2

ZZZcrítico

Portanto, a Ho deve ser rejeitada se Zteste >1,96

ou Zteste <-1,96

Page 89: Apresentação CQE2010-EST-II-SP

3- Verificação se o teste baseado em Z é válido (pré requisito):

4- Determinação da estimativa combinada de p1 e p2:

Amostra 15ˆ.

5ˆ.

qn

pn

5100

34.100

5100

66.100

Amostra 25ˆ.

5ˆ.

qn

pn

5100

27.100

5100

73.100

Okkk !!!Okkk !!!

695,0100100

7366

21

21

nn

xxp

305,0695,011 pq

Page 90: Apresentação CQE2010-EST-II-SP

5- Determinação da estatística de teste apropriada:

08,1

100)305,0).(695,0(

100)305,0).(695,0(

10073

10066

..

ˆˆ

21

21

nqp

nqp

ppZ teste

6- Decidir se a hipótese nula deve ser rejeitada ou não:

Como Zteste = -1,08 não está na região crítica, não há

evidência para rejeitar a hipótese nula ao nível de

significância de 5%.

Não há evidências para concluir que o desempenho

dos motores produzidos pelo fornecedor 1 é diferente

do desempenho do motor produzido pelo fornecedor 2.

Page 91: Apresentação CQE2010-EST-II-SP

Os Engenheiros de Produto da Cervejaria Schincariol querem realizar um

teste para avaliar se os consumidores da Nova Schin do interior de Minas

Gerais e de Belo Horizonte, diferem ou não na proporção de aprovação

da nova cerveja. Para isto, tomou-se uma amostra aleatória de 50

consumidores na capital e 50 consumidores no interior do estado. Na

capital, 18 aprovaram a nova cerveja e no interior apenas 25 aprovaram.

Realize o teste ao nível de 0,01 de significância.

1- Estabelecer as Hipóteses nula e alternativa:

21: ppHo

211 : ppH

A empresa quer comparar se existe diferença na proporção de aprovação da nova cerveja.

TESTE DE HIPÓTESE PARA DUAS PROPORÇÕES

Page 92: Apresentação CQE2010-EST-II-SP

2- Determinação do nível de significância e da região crítica:

A partir da tabela de distribuição normal padronizada

58,2005,0

2

ZZZcrítico

Portanto, a Ho deve ser rejeitada se Zteste >+2,58 ou Zteste<-2,58.

3- Verificação se o teste baseado em Z é válido (pré requisito):

Amostra 15ˆ.

5ˆ.

qn

pn

550

32.50

550

18.50

Amostra 25ˆ.

5ˆ.

qn

pn

550

25.50

550

25.50

Okkk !!!Okkk !!!

Page 93: Apresentação CQE2010-EST-II-SP

4- Determinação da estimativa combinada de p1 e p2:

43,05050

2518

21

21

nn

xxp

57,043,011 pq

5- Determinação da estatística de teste apropriada:

41,1

50)57,0).(43,0(

50)57,0).(43,0(

5025

5018

..

ˆˆ

21

21

nqp

nqp

ppZ teste

Page 94: Apresentação CQE2010-EST-II-SP

6- Decidir se a hipótese nula deve ser rejeitada ou não:

Como Zteste = -1,41 não está na região crítica, não há

evidência para rejeitar a hipótese nula ao nível de

significância de 1%.

Não há evidências para concluir que haja diferença na

proporção dos consumidores que aprovam a Nova

Schin na capital e no interior.

Page 95: Apresentação CQE2010-EST-II-SP

Testes de Hipóteses para a variância amostral

• Estatística de teste:

• Lembrete: A distribuição Qui-Quadrado não é simétrica!!!!

2

22 )1(

sn

Graus de liberdade = n-1

Suposição:

• População distribuída normalmente

Testes de hipóteses para a variância :

Page 96: Apresentação CQE2010-EST-II-SP

Exemplo:

• O departamento de desenvolvimento de aço da R&D tentou

desenvolver uma nova liga de aço com menor variabilidade da

tensão elástica. O departamento da R&D declara que o novo material

terá uma variação de tensão dentro de 4 Sigmas menor ou igual a 60

psi 95% das vezes. Uma amostra de 8 elementos foi testada e

rendeu um desvio padrão de 8 psi. Pode uma redução na variação

da tensão elástica ser validada com 95% de confiança?

Testes de hipóteses para a variância :

Page 97: Apresentação CQE2010-EST-II-SP

20

200

20

200

:H

:H

O melhor range de variação esperado é 60 psi. Isto nos leva a ter

um sigma de 15 psi (uma aproximação de 4 sigma de largura

acobertado por 95,44% das ocorrências).

A hipótese nula é:

A hipótese alternativa:

A hipótese nula é:

A hipótese alternativa:

Testes de hipóteses para a variância :

2200

2200

15:H

15:H

Page 98: Apresentação CQE2010-EST-II-SP

99,115

8)18(s)1n(X

2

2

20

2x2

Da tabela de Qui-quadrado: porque a hipótese alternativa é “<“

este é um teste unilateral. Usando gl = n-1 = 7, o valor crítico

para qui-quadrado com 95% de confiança é 2,17.

A estatística de teste calculada é:

Testes de hipóteses para a variância :

Uma vez que 1,99 é menor que 2,17, ela cai na região crítica e a

hipótese nula deve ser rejeitada.

Existe evidência suficiente para rejeitarmos a Hipótese nula.

A declaração do departamento da R&D foi suportada.

Page 99: Apresentação CQE2010-EST-II-SP

Comparação de duas variâncias amostrais

• Estatística de teste:

• Lembrete: A distribuição F não é simétrica!!!!

22

21

s

sF

Graus de liberdade do numerador = n1-1

Suposições:

• Populações independentes;

•:Ambas distribuídas normalmente

Graus de liberdade do denominador = n2-1

Page 100: Apresentação CQE2010-EST-II-SP

Exemplo:

Um laboratório de materiais está estudando o efeito de

envelhecimento de um determinado produto. Eles querem saber se

existe melhoria na consistência de concentração após o

envelhecimento por um ano (assuma um nível de confiança de 95%).

Os dados obtidos são listados abaixo:

No Início 1 ano depois

Numero de testes 9 7

Desvio Padrão (psi) 900 300

Page 101: Apresentação CQE2010-EST-II-SP

Hipótese Nula:

Hipótese Alternativa:

6v

8v

:H

:H

2

1

22

211

22

210

A hipótese alternativa é relativa à melhoria na variação, portanto

temos um teste unilateral. A partir da distribuição F, ovalor

crítico de F é 4,15.

A região de rejeição da hipótese nula é maior ou igual a 4,15.

Page 102: Apresentação CQE2010-EST-II-SP

9300

900

s

sF

2

2

22

21

Fazendo o cálculo da estatística de teste:

Uma vez que o valor calculado de F está na região crítica, a

hipótese nula deve ser rejeitada.

Existe evidência suficiente para indicar a redução da variância e

aumento da consistência da concentração após o

envelhecimento por um ano.

Page 103: Apresentação CQE2010-EST-II-SP

TESTE DE ADERÊNCIA

• No teste de aderência, a hipótese testada refere-se à forma da

distribuição da população.

• Este teste baseia-se na estatística:

2

2 2

11

( )O E

E

O

Eni i

i

i

ii

k

i

k

onde:2

a estatística do teste, com graus de liberdade;Oi a frequência observada de uma determinada classe;Ei a frequência esperada desta classe, segundo o modelo testado = nipi;n o número de elementos da amostra;k número de classes ou valores considerados;pi probabilidade de se obter um valor da variável na classe esperada, segundo o modelo.

Testes de Ajuste – Goodness of Fit:

Page 104: Apresentação CQE2010-EST-II-SP

•Passos para conduzir um teste de aderência:

1- Formule as hipóteses nula e a alternativa.

2- Se o parâmetro da distribuição dada nas hipóteses nula e

alternativa não for conhecido, então deve ser calculado.

3- Calcular a freqüência esperada para cada uma das categorias “k”

como a distribuição hipotética fosse a distribuição verdadeira.

4- Calcular a estatística de teste.

5- Rejeite H0 se o valor calculado for maior que o valor tabelado (ou

seja, não adere ao modelo).

= k-1-m, onde “m” é o número de parâmetros do modelo estimados

independentemente a partir da amostra.

; ; ;calc2 2

Page 105: Apresentação CQE2010-EST-II-SP

• Exemplo:

É um dado de jogar honesto e balanceado, fornecidos o número de

vezes que cada um dos lados saiu?

Um dado foi jogado 48 vezes com os seguintes resultados:

Face Número Saídas Face Número Saídas

1 12 2 7

3 2 4 7

5 12 6 8

Quando o dado é jogado, a expectativa é que cada um dos lados

deveria sair um número igual de vezes.

É óbvio que existirão saídas aleatórias desta expectativa teórica uma

vez que o dado seja honesto.

Page 106: Apresentação CQE2010-EST-II-SP

H0: as saídas do dado seguem uma distribuição uniforme

H1: as saídas do dados não seguem uma distribuição uniforme.

Faces fe f0 (fe – f0)2 / fe

1 8 12 2,000

2 8 7 0,125

3 8 2 4,500

4 8 7 0,125

5 8 12 2,000

6 8 8 0,000

Total 48 48 8,750

k

1i e

2e02 750,8

f

)ff(

Page 107: Apresentação CQE2010-EST-II-SP

O valor do qui-quadrao calculado é 8,75. O valor de qui-

quadrado crítico é 11,07.

O qui-quadrado calculado não excede o qui-quadrado crítico.

Portanto, a hipótese de um dado honesto seguindo uma

distribuição uniforme não pode ser rejeitada.

As saídas aleatórias a partir de uma expectativa teórica

podem tranquilamente ser explicadas pela causa comum.

Page 108: Apresentação CQE2010-EST-II-SP

TESTE DE INDEPENDÊNCIA

• Os testes de independência são realizados através de Tabelas de

Contingência.

• Tabela de contingência é a representação tabular das freqüências

observadas.

Exemplo: 100 pessoas foram entrevistadas sobre um projetode lei; o resultado é colocado em forma de uma tabela decontingência:

OpiniãoSexo Favorável Desfavorável Indiferente Totais

Homens 33 12 15 60Mulheres 7 20 13 40

Totais 40 32 28 100

Page 109: Apresentação CQE2010-EST-II-SP

TESTE DE INDEPENDÊNCIA

• O teste de independência:H0: as variáveis são independentes;H1: as variáveis não são independentes.

O teste será feito usando 2, semelhante ao teste de aderência.

2 = a estatística do teste, com graus de liberdade;

r = número de linhas;s = número de colunas;Oij = frequência observada na interseção da linha i com a coluna j;Eij = frequência esperada na interseção da linha i com a coluna j;n = número de elementos da amostra.

2

2

11

( )O E

Eij ij

ijj

s

i

r

Page 110: Apresentação CQE2010-EST-II-SP

TESTE DE INDEPENDÊNCIA

• Rejeita-se H0 se 2calc > 2

crít.

= (L-1).(c-1)

•“macete” para cálculo do : na tabela anterior, risque uma

linha e uma coluna, conte o que sobrou

Page 111: Apresentação CQE2010-EST-II-SP

– Exercícios: Folha 2

Slide 111

Page 112: Apresentação CQE2010-EST-II-SP

4ª Parte:

– Regressão Linear Simples

Slide 112

Page 113: Apresentação CQE2010-EST-II-SP

CORRELAÇÃO ENTRE DUAS VARIÁVEIS

Problema: O diretor de vendas de varejo nacional

necessita analisar se há relação entre o investimento em

propaganda e as vendas da empresa. O departamento de

vendas preparou uma tabela com as vendas (em milhões)

e os investimentos em propaganda (em milhões) dos

últimos dez anos.

480400270195210470490520335430Vendas

2535178203742352130Propagandas

Objetivo: analisar a possibilidade de definir um modelo que represente a

relação entre as duas variáveis.

$

Correlação e regressão linear entre 2 variáveis :

Page 114: Apresentação CQE2010-EST-II-SP

EXEMPLOS DE CORRELAÇÃO ENTRE DUAS VARIÁVEIS

• A temperatura na cidade pode influenciar as taxas de criminalidade?

• Correlação entre a quantidade de acidentes de trabalho numa

construtora e o tempo de experiência do trabalhador!

• A Correlação entre a tensão na rede elétrica (volts) e a variação no

corte (mm);

• A correlação entre o nº. de horas de treinamento em ferramentas da

qualidade e o nº. de peças defeituosas produzidas por um trabalhador;

Page 115: Apresentação CQE2010-EST-II-SP

A correlação é uma técnica estatística que tem por objetivo investigar

se há ou não correlação linear entre duas ou mais variáveis;

Existe correlação entre duas variáveis quando uma delas está, de

alguma forma, relacionada com a outra;

Os dados analisados num teste de correlação são emparelhados e

aleatórios;

Para estudar o comportamento conjunto de duas variáveis X e Y,

serão apresentadas duas técnicas: o Diagrama de Dispersão e o

Coeficiente de Correlação de Pearson.

CORRELAÇÃO:

Page 116: Apresentação CQE2010-EST-II-SP

Consiste de um método gráfico que ajuda a avaliar se existe ou não

alguma associação (relação) entre as variáveis em estudo, mas não nos

fornece o valor numérico dessa relação.

OBJETIVO: Alguma correlação ou relação entre duas variáveis

significa: “qual alteração devemos esperar em uma das variáveis, como

consequência de alterações sofridas pela outra variável”;.

y

x

...... .

Não há correlação entre x e y

. .. .

.

..

. ..y

x

..Correlação não linear entre x e y

........

..... . ..... .

DIAGRAMA DE DISPERSÃO

Page 117: Apresentação CQE2010-EST-II-SP

INTERPRETAÇÃO DO DIAGRAMA DE DISPERSÃO:

y

x

... ......

.....

.

Correlação positiva entre x e y

y

x

... ......

........ . . .

.

.

Forte Correlação positiva entre x e y

y

xCorrelação positiva perfeita entre x e y

. ........

...

.

Page 118: Apresentação CQE2010-EST-II-SP

y

x

..

Correlação negativa entre x e y

. .. .. .. ...

y

x

..

Forte Correlação negativa entre x e y

.. .. ... . ...

..

.

y

xCorrelação negativa perfeita entre x e y

.. .......

.

...

.

INTERPRETAÇÃO DO DIAGRAMA DE DISPERSÃO:

Page 119: Apresentação CQE2010-EST-II-SP

Diagrama de Dispersão:

Gráfico 1- Diagrama de dispersão das notas de Estatística versus

Matemática

0

2

4

6

8

10

12

0 2 4 6 8 10 12

Notas de Matemática

No

tas d

e E

sta

tísti

ca

Pode-se notar que as variáveis

Notas em Estatística e Notas

em Matemática estão

correlacionadas positivamente,

isto é, à medida que aumenta-

se a nota em Matemática,

aumenta-se também a nota em

Estatística.

36593291067Estatística (Y)

26784310956Matemática (X)

Exemplo 1: Suponha que dez alunos foram submetidos a um teste de

Estatística e de Matemática, obtendo-se as seguintes notas :

Page 120: Apresentação CQE2010-EST-II-SP

EXEMPLO DE DIAGRAMA DE DISPERSÃO

Exemplo 2: A tabela seguinte fornece o Peso (Kg) de alunos e a

respectiva Altura alcançada no teste de salto em altura (Cm).

515248545550Altura (Y)

494751464550Peso (X)

O gráfico indica que as

variáveis Peso e Altura obtida

no teste de salto em altura

encontram-se correlacionadas

negativamente, isto é, à

medida que o peso aumenta, o

valor obtido para o teste de

salto em altura diminui.

Gráfico 2- Diagrama de dispersão do peso versus resultado do teste de salto

em altura

47484950515253545556

44 46 48 50 52

Peso (Kg)

Alt

ura

(C

m)

Page 121: Apresentação CQE2010-EST-II-SP

Observações importantes e conclusões sobre diagramas:

As conclusões tiradas de diagramas de dispersão tendem a ser

subjetivas, o cálculo do coeficiente de correlação linear pode propiciar

uma melhor avaliação do tipo de relacionamento;

OUTLIER - observação extrema, que não é condizente com o

restante da massa de dados. Pode ser fruto de um registro incorreto.

Deve ser analisado detalhadamente e eliminado do conjunto;

A existência de uma correlação entre as variáveis consideradas não

implica necessariamente na existência de uma relação de causa-efeito

entre X e Y;

Construindo diagramas de dispersão no software Excel;

Page 122: Apresentação CQE2010-EST-II-SP

O coeficiente de correlação linear r mede o grau (intensidade)

da relacionamento (linear) entre as variáveis X e Y em uma

amostra;

Cálculo do coeficiente de correlação:

2222 )()()()(

))((

yynxxn

yxxynr

número de pares de dados analisados

soma de todos os valores de x e soma de todos os valores de y

elevar cada valor de x ao quadrado e somar os resultados

somamos os valores de x e elevamos o resultado ao quadrado;

multiplicamos cada valor x pelo valor correspondente de y e somamos

os produtos

xy

x

x

yx

n

2

2

,

COEFICIENTE DE CORRELAÇÃO

Page 123: Apresentação CQE2010-EST-II-SP

O valor de r está sempre entre –1 e 1;

r mede a intensidade, ou o grau de um relacionamento linear. Não

serve para medir a intensidade de um relacionamento não linear.

Se o valor de r estiver próximo de 0, concluímos que não há

correlação linear significativa entre x e y.

Se o valor de r estiver próximo de +1 ou –1, concluímos que há

correlação linear.

PROPRIEDADES DO COEFICIENTE DE CORRELAÇÃO

Page 124: Apresentação CQE2010-EST-II-SP

Os pesquisadores tem estudado os ursos,

anestesiando-os a fim de obterem medidas

vitais como idade, peso, comprimento e etc.

Como os usos são bastante pesados e difíceis

de serem levantados, os pesquisadores tem

dificuldade em pesar o urso na selva. Será

que é possível medirmos o peso de um urso a

partir do outras medidas mais fáceis?

53 67,5 72 72 73,5 68,5 73 3780 344 416 348 262 360 332 34peso (lbs)

Comprimento (in)Comprimento e pesos de ursos

Page 125: Apresentação CQE2010-EST-II-SP

Resolução:

2222 )()()()(

))((

yynxxn

yxxynr

número de pares de dados analisados

soma de todos os valores de x e soma de todos os valores de y

elevar cada valor de x ao quadrado e somar os resultados

somamos os valores de x e elevamos o resultado ao quadrado;

multiplicamos cada valor x pelo valor correspondente de y e somamos

os produtos

xy

x

x

yx

n

2

2

,

22 )176.2()520.728(8)5,516()75,525.34(8

)2176).(5,516()879.151(8

r

897,0184.093.175,9433

128.91r

Page 126: Apresentação CQE2010-EST-II-SP

Interpretação do coeficiente de correlação linear:

Se o valor de r estiver próximo

de 0, concluímos que não há

correlação linear significativa entre

x e y.

obs.: o valor de r deve estar sempre entre –1 e +1, inclusive.

Se o valor de r estiver

próximo de +1 ou –1,

concluímos que há correlação

linear.

Como r=0,897 (e está próximo de 1), dizemos que

existe correlação entre a altura do urso e o seu peso!

Page 127: Apresentação CQE2010-EST-II-SP

Interpretação do coeficiente de correlação linear:

Com os dados abaixo sobre crimes violentos e a temperatura média

entre 21 e 2 horas das noites de sábado de uma comunidade, avalie se

há correlação entre as variáveis.

Crimes violentos/1000 residentes

52,24,15,42,83

3,62,52

Temperatura ºC

221819242320212017

Page 128: Apresentação CQE2010-EST-II-SP

Regressão linear Simples

Proposição: A análise de regressão é uma técnica estatística que

tem por objetivo investigar e modelar o relacionamento entre duas

variáveis (regressão simples) ou mais variáveis (regressão

múltipla).

Iniciaremos estudando a relação entre duas variáveis (regressão

simples).

Objetivo: Descrever, utilizando dados amostrais, a relação entre

duas variáveis, quando verificamos que existe correlação linear

significativa entre elas:

• traçando seu gráfico e,

determinando a equação da reta que representa aquela

relação (reta de regressão).

Page 129: Apresentação CQE2010-EST-II-SP

Método dos Mínimos Quadrados

Definição: Dada uma coleção de dados amostrais emparelhados

(duas variáveis), a reta de regressão tem sua equação de

regressão dada por:

Esta definição expressa uma relação entre x (variável

independente ou preditora) e (variável dependente ou resposta).

baxy ˆ

yyy

A partir dos dados amostrais, não podemos achar os parâmetros

populacionais, mas estimá-los como a e b:

e 22

xxn

yxxyna

n

xayb

Page 130: Apresentação CQE2010-EST-II-SP

Exemplo 1: O diretor de vendas de uma rede de varejo nacional precisa

analisar a relação entre o investimento em propaganda e as vendas da

empresa. Os dados estão na tabela abaixo:

Variável explicativa(x) : Investimento em propagandas;Variável resposta (y) : Vendas da empresa.

Propagandas (X) 30 21 35 42 37 20 8 17 35 25

Vendas (Y) 430 335 520 490 470 210 195 270 400 480

Regressão Linear Simples

Page 131: Apresentação CQE2010-EST-II-SP

Na resolução de problemas de regressão o primeiro passo é traçar o diagrama de dispersão

correspondente.

Diagrama de Dispersão

0

100

200

300

400

500

600

0 10 20 30 40 50

Investimento em Propagandas

Ve

nd

as

da

Em

pre

sa

Regressão Linear Simples

Page 132: Apresentação CQE2010-EST-II-SP

O objetivo da regressão linear é colocar no diagrama de dispersão uma

linha que melhor se ajuste ou que melhor represente a relação entre as

duas variáveis.

Diagrama de Dispersão

0

100

200

300

400

500

600

0 10 20 30 40 50

Investimento em Propagandas

Ve

nd

as

da

Em

pre

sa

Regressão Linear Simples

Page 133: Apresentação CQE2010-EST-II-SP

Interpretação dos Parâmetros do Modelo de Regressão

• Obtida uma reta de regressão, o primeiro passo na sua interpretação é verificar o sinal de a. Se for positivo, indica que, quanto maior o valor de x, maior o valor de y; se for negativo, indica que quanto maior o valor de x, menor o valor de y.

• a é a inclinação da reta de regressão. Ele indica a mudança na média de y para cada aumento de uma unidade em x.

• b é o intercepto do modelo. Se o domínio do modelo inclui x=0, b fornece a média de y quando x=0. Caso contrário, b não possui interpretação.

• A reta de regressão para o Exemplo 1 é:

• a = 9,74 indica que para cada aumento de uma unidade no investimento em propagandas há um aumento de 9,74 unidades na média de vendas da empresa.

xy 74,907,117

Page 134: Apresentação CQE2010-EST-II-SP

Exemplo 2: Abaixo estão mostrados os comprimentos e os pesos de

oito ursos cinzentos:

Comprimento x (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0 Peso y (lb) 80 344 416 348 262 360 332 34

Com base nestes dados, parece haver alguma relação entre o

comprimento de um urso e o seu peso? Em caso afirmativo, qual

é esta relação?

Regressão Linear Simples

Page 135: Apresentação CQE2010-EST-II-SP

Com os dados da tabela anterior, determine a equação de

regressão da reta que relaciona comprimentos e pesos dos ursos

dessa espécie.x y x . y x2 y2

53,0 80 4.240 2809,00 6.40067,5 344 23.220 4556,25 118.33672,0 416 29.952 5184,00 173.05672,0 348 25.056 5184,00 121.10473,5 262 19.257 5402,25 68.64468,5 306 24.660 4692,25 129.60073,0 332 24.236 5329,00 110.22437,0 34 1.258 1369,00 1.156

Total 516,5 2176 151.879 34.525,75 728.520

x y xy 2x 2y

Regressão Linear Simples

Page 136: Apresentação CQE2010-EST-II-SP

Regressão Linear

Definições:

Desvio total: distância vertical yy

Desvio explicado: distância vertical yy ˆ

Desvio não-explicado: distância vertical , também chamado de resíduoyy ˆ

y = valor observado

y = média dos valores observados

y = valor predito pela equação de regressão

Regressão Linear Simples:

Page 137: Apresentação CQE2010-EST-II-SP

140

220

300

380

460

540

0 9 18 27 36 45

Investimento

Ve

nd

as

a: Desvio Total: Valor Real – Média

a

c

c: Desvio Não Explicado: Valor Real – PreditoChamado RESÍDUO ou ERRO.

b

b: Desvio Explicado: Valor Predito – Média

Page 138: Apresentação CQE2010-EST-II-SP

Regressão Linear

Definições:Variação total: soma dos quadrados dos desvios totais

2)( yy Variação explicada: soma dos quadrados dos desvios explicados

2)ˆ( yy

2)ˆ( yy

Variação não-explicada: soma dos quadrados dos desvios não-explicados

Page 139: Apresentação CQE2010-EST-II-SP

Relações entre os desvios

(desvio total) = (desvio explicado) + (desvio não-explicado)

yy = yy ˆ + yy ˆ

(variação total) = (variação explicada) + (variação não-explicada)

De maneira análoga:

2)( yy = 2)ˆ( yy +2)ˆ( yy

Page 140: Apresentação CQE2010-EST-II-SP

Definição: Valor da variação de y que é explicado pela reta de regressão.

Coeficiente de Determinação

totalvariação

explicada variação2 r

2

22

)(

)ˆ(

yy

yyr

Obs. Podemos calcular r2 tanto pela definição acima, como simplesmente elevando ao quadrado o coeficiente de correlação linear r

r2 sempre assumirá valores entre 0 e 1

ou

Page 141: Apresentação CQE2010-EST-II-SP

Exemplo:

Coeficiente de Determinação

Diagrama de dispersão: média no 2o grau e índice na universidade - reta ajustada

80 82 84 86 88 90 92 94 96 98 1000.90

1.22

1.54

1.86

2.18

2.50

2.82

3.14

3.46

3.78

4.10

Y = -13.520 + (.180 * X)

Médias dos estudantes no 2o grau

Índ

ice

do

s e

stu

da

nte

s n

a u

niv

ers

ida

de

r2 = 0,92 = 0,81 Ou seja 81% da variação pode ser explicada pela reta

Page 142: Apresentação CQE2010-EST-II-SP

Erro padrão da estimativa

É uma medida das diferenças entre os valores observados e os valores preditos obtidos através da reta de regressão

2

)ˆ( 2

n

yyse 2

2

n

xyaybyse

ou

Intervalo de predição para um y individual

Dado um valor fixo x0, o intervalo de predição para um determinado y é:

EyyEy ˆˆ

22

20

2 )((

)(11

xxn

xxn

nstE e

Page 143: Apresentação CQE2010-EST-II-SP

Análise de Resíduos

Os resíduos são as diferenças entre os valores observados da variável dependente e os valores preditos da variável dependente, através do modelo de regressão, para um determinado valor da variável independente. Para tornar a análise mais confiável, sem que as grandezas dos resíduos venham a prejudicá-la recomenda-se padronizar os resíduos: calcula-se o desvio padrão dos resíduos e divide-se cada um deles pelo desvio padrão.Para fazer a análise de resíduos precisamos construir pelo menos dois diagramas de dispersão:- um que relacione os resíduos padronizados com os próprios valores preditos da variável independente;- outro que relacione os resíduos padronizados com os valores da variável independente

Page 144: Apresentação CQE2010-EST-II-SP

Análise de Resíduos

Se o modelo de regressão é adequado os resíduos padronizados não podem apresentar quaisquer padrões, eles devem distribuir-se de forma aleatória nos dois diagramas, atendendo os seguintes critérios:- a quantidade de resíduos padronizados positivos deve ser aproximadamente igual à quantidade de negativos.- a grandeza dos resíduos padronizados positivos deve ser aproximadamente igual a dos negativos, para todos os valores preditos da variável dependente, e para todos os valores da variável independente.- não pode haver padrões não aleatórios (tendências crescentes ou decrescentes, curvas, etc.) em nenhum dos diagramas.

Page 145: Apresentação CQE2010-EST-II-SP

Somente se todas estas condições forem satisfeitas é que podemos considerar o modelo de regressão apropriado. Se houver dois ou mais modelos apropriados escolhemos o mais simples, ou aquele que apresentar o mais alto coeficiente de determinação. Os diagramas deveriam ser como a figura abaixo:

Análise de Resíduos

Resíduos padronizados

Valorespreditosou X

Page 146: Apresentação CQE2010-EST-II-SP

0.700 1.050 1.400 1.750 2.100 2.450 2.800 3.150 3.500 3.850-3.0

-2.4

-1.8

-1.2

-0.6

0.0

0.6

1.2

1.8

2.4

Resíduos de Índice (Y)

Valores preditos

Re

síd

uo

s P

ad

ron

iza

do

s

Análise de Resíduos

Exemplo:

Resíduos padronizados: média no 2o grau e índice na universidade

Page 147: Apresentação CQE2010-EST-II-SP

Questão: as variáveis são relacionadas? Não coeficiente angular = 0. Sim coeficiente angular 0. Teste de hipóteses: H0: = 0 H1: 0 Como o desvio padrão da população é desconhecido, usamos “t”

de Student,com (n-2) graus de liberdade.

sb desvio padrão da distribuição amostral do coeficiente angular.

Teste de hipóteses para o Coeficiente Angular

tb

s

b

sb b

(

~valor amostral) - (valor esperado)

desvio padrao

0

nxxss eb /)(

1.

22

bstb .t.s-b

t.sb : para confiança de intervalo

b

b

Page 148: Apresentação CQE2010-EST-II-SP

Questão: as variáveis são relacionadas? Não coeficiente de correlação = 0. Sim coeficiente de correlação 0. H0: = 0 H1: 0 ou > 0 ou < 0. O teste é feito com “t” de Student:

Intervalo de confiança para o coeficiente de correlação:

Teste de hipóteses para o Coeficiente de Correlação

( ) .t rn

rn calc

2 2

2

1t t

tcrit n

n

. ;

; /

2

2 2

para < 0 ou > 0

t para 0crit.

3r1

r1ln

2

1tanh

3r1

r1ln

2

1tanh 2/2/

n

Z

n

Z

Page 149: Apresentação CQE2010-EST-II-SP

Exercícios: Folha 3

Slide 149

Page 150: Apresentação CQE2010-EST-II-SP

5ª Parte:

– Regressão Linear Múltipla

– Séries Temporais

Slide 150

Page 151: Apresentação CQE2010-EST-II-SP

Para y = b1x1 + b2x2

Onde está a reta de regressão ?

Regressão Linear Múltipla:

Page 152: Apresentação CQE2010-EST-II-SP

Os cálculos necessários à regressão múltipla são complexos e envolvem a resolução de sistemas lineares ou matrizes

Basicamente os softwares apresentam 3 componentes para a regressão múltipla:– A Equação de Regressão;– R2 Ajustado e– Significância Global da Equação.

CONCEITOS E DEFINIÇÕES

Page 153: Apresentação CQE2010-EST-II-SP

Equação de Regressão MúltiplaEquação de Regressão Múltipla: expressa um

relacionamento linear entre uma variável

dependente Y e duas ou mais variáveis

independentes (x1, x2, x3, ..., xk).

Modelo MatemáticoModelo Matemático:

Y = b0 + b1x1 + b2x2 + ... + bkxk

Valor Predito de Y

K = número de variáveis independentes

Intecepto

Xi= variáveis independentes

bi= Coeficientes

CONCEITOS E DEFINIÇÕES

Page 154: Apresentação CQE2010-EST-II-SP

Coeficiente de Determinação Múltipla (RCoeficiente de Determinação Múltipla (R22):): é a medida de ajustamento da equação de regressão múltipla aos dados amostrais.

Limitação de RLimitação de R22: : na medida em que se incluem novas variáveis R2 aumenta, ou seja, a simples inclusão de todas as variáveis disponíveis levará R2 para próximo de 1. Entretanto a melhor equação nem sempre inclue todas as variáveis.

Como contornar este Como contornar este problema ?problema ?

CONCEITOS E DEFINIÇÕES

Page 155: Apresentação CQE2010-EST-II-SP

Coeficiente de Determinação AjustadoCoeficiente de Determinação Ajustado: é o coeficiente de determinação R2 modificado de modo a levar em conta o número de variáveis e o tamanho da amostra. É o melhor número para comparar diferentes equações.

Modelo MatemáticoModelo Matemático:R2 Ajustado= 1 - (n –1 ) (1 – R2)

[n – (k+1)]

Número de dados Número de Variáveis Independentes

CONCEITOS E DEFINIÇÕES

Page 156: Apresentação CQE2010-EST-II-SP

Significância Global: O valor PSignificância Global: O valor P.– Os Softwares, via de regra, apresentam o valor P,

que é uma medida da significância global da equação de regressão.

– Assim como R2, P é uma medida da aderência da equação aos dados amostrais.

– Quanto menor o valor de P, melhor a aderência da equação, ou seja, melhor o modelo.

P indica a probabilidade de se estar rejeitando H0 de forma indevida.

CONCEITOS E DEFINIÇÕES

Page 157: Apresentação CQE2010-EST-II-SP

Já calculamos o coeficiente de correlação entre a altura do urso e seu peso (r = 0.897), daí r2=0.8046.

O que fazer para melhorar O que fazer para melhorar a estimativa do peso, sem a estimativa do peso, sem o uso de uma balança ?o uso de uma balança ?

NOSSO AMIGO URSO

Page 158: Apresentação CQE2010-EST-II-SP

Os biólogos resolveram testar mais variáveis, além da altura. Foram escolhidas as seguintes variáveis:– Altura (já avaliada) [ H ]– Tórax [ T ]– Comprimento da Cabeça [ CC ]– Largura da Cabeça [ LC ]– Idade [ I ]– Diâmetro do Pescoço [ DP ]

Utilizando-se um Software apropriado, foram obtidos os dados a seguir:

NOSSO AMIGO URSO

Page 159: Apresentação CQE2010-EST-II-SP

Como variável única, Tórax é melhor que a altura para predizer o peso dos ursos.

Quanto mais variáveis consideradas, maior o valor de R2

A melhor equação de regressão é definida por I, DP, H e T, porque:– Maior R2;– Menor P;– Além de ser mais simples.

Variáveis > H T CC e H I e DP e H e T I e CC e LC e DP e H e TR2 0,805 0,983 0,828 0,999 0,999

R2 Ajustado 0,773 0,980 0,759 0,997 0,996Significância Global0,002 0,000 0,012 0,000 0,046

NOSSO AMIGO URSO

Page 160: Apresentação CQE2010-EST-II-SP

Sabe-se que o nível de resistência de um aço é correlacionado com seu teor de Carbono, conforme demonstrado no diagrama de dispersão.

82,8% da variação da resistência é explicada pela equação de regressão.

y = 1170x + 315,3R2 = 0,8285

340

350

360

370

380

390

400

410

420

0,000 0,020 0,040 0,060 0,080 0,100

Teor de C (%)

Re

sis

tên

cia

(M

Pa)

O que pode O que pode ser feito para ser feito para melhorar a melhorar a estimativa estimativa da da Resistência ?Resistência ?

UM CASO PRÁTICO

Page 161: Apresentação CQE2010-EST-II-SP

O conhecimento técnico determina que o Manganês tem efeito semelhante ao Carbono.

Os mesmos dados foram submetidos a regressão múltipla tendo C como X1 e Mn como X2.

O “O “poder de poder de explicaçãoexplicação” ” da regressão da regressão subiu de subiu de 82,8% para 82,8% para 96,2%.96,2%.

y = 1188,9x + 268,59R2 = 0,9624

340

350

360

370

380

390

400

410

420

0,00 0,05 0,10 0,15

C+Mn/6

Re

sis

tên

cia

(MP

a)

UM CASO PRÁTICO

Page 162: Apresentação CQE2010-EST-II-SP

A partir deste conhecimento, o projetista vai poder determinar qual a combinação necessária entre C e Mn, que reflita em menor custo, mas que atenda às exigências mínimas de Resistência, com maior nível de precisão.

UM CASO PRÁTICO

Page 163: Apresentação CQE2010-EST-II-SP

1. Use o bom senso e considerações de ordem prática para incluir ou excluir variáveis.

2. Inclua um número relativamente pequeno de variáveis independentes (x).

3. Escolha uma equação em que a inclusão de uma nova variável provoque pequeno incremento em R2.

4. Para um mesmo número de variáveis independentes (x) escolha aquela que tenha o R2 maior.

5. Escolha a equação cujo valor de Significância Global (P) seja o menor.

ESCOLHA DE VARIÁVEIS

Page 164: Apresentação CQE2010-EST-II-SP

Série temporal: conjunto de observações ordenadas no tempo.Exemplos:

a.Consumo mensal de energia em uma residência

b.Preço semanal de um produto

c.Valor anual de um índice de produção industrial

Idéia básica: observações passadas da série contêm informações sobre o seu padrão de comportamento futuro.

CONCEITO

Séries Temporais:

Page 165: Apresentação CQE2010-EST-II-SP

Definição: tipo mais simples de série temporal, em que os

valores da série flutuam aleatoriamente em torno de um

valor fixo (nível da série), sem apresentar qualquer

tendência. Vendas das Fábricas da GM (em milhões de unidades)

4

5

6

7

8

9

10

Ano

SÉRIES GLOBALMENTE CONSTANTES

Page 166: Apresentação CQE2010-EST-II-SP

Suavização Exponencial

Forma de modelar a série temporal

Supõe que a série é constante

Cada valor é uma média ponderada dos valores

anteriores da série

Pesos decaem à medida que o tempo de observação

fica mais distante do presente

SÉRIES GLOBALMENTE CONSTANTES

Page 167: Apresentação CQE2010-EST-II-SP

Vendas Líquidas da Xerox Corp. (em bilhões de dólares)

0

2

4

6

8

10

12

14

16

18

20

Ano

Rec

eita

A série é composta por dois fatores: o nível (como na

série globalmente constante) e a tendência.

SÉRIES COM TENDÊNCIA LINEAR

Page 168: Apresentação CQE2010-EST-II-SP

SÉRIES COM TENDÊNCIA LINEAR

MÉTODOS PARA ISOLAR A TENDÊNCIA: TREND ANALYSIS:

É o melhor processo. A tendência dos dados é dada pela curva de regressão.

MOVING AVERAGE: "Este processo, que objetiva suavizar as variações na variável estudada

tem a grande vantagem de não exigir a determinação de nenhuma curva a qual a tendência deva se adaptar.

Limitação: é quase impossível remover completamente variações cíclicas e irregulares.

Ideal: médias com períodos de tempo longo.

Problema: quanto mais dados, menos sensível a média se torna a observações recentes (às vezes é necessário ponderação)

Page 169: Apresentação CQE2010-EST-II-SP

Além do nível e da tendência, algumas séries possuem um

fator sazonal. Este fator capta características da série que

se repetem a intervalos regulares de tempo.

Exemplo: A venda de um artigo em uma loja é função não

somente da venda no mês anterior e de uma expectativa

de aumento ou decréscimo (tendência da procura), mas

também da venda desse produto na mesma época, em

anos anteriores.

SÉRIES SAZONAIS

Page 170: Apresentação CQE2010-EST-II-SP

Tipos de Efeito Sazonal

1. Efeito aditivo: a amplitude do fator sazonal independe do nível

local da série.

SÉRIES SAZONAIS

Page 171: Apresentação CQE2010-EST-II-SP

2. Efeito Multiplicativo: a amplitude do fator sazonal varia

proporcionalmente ao nível da série.

Tipos de Efeito Sazonal

SÉRIES SAZONAIS

Page 172: Apresentação CQE2010-EST-II-SP

Exercícios: Folha 4

Slide 174