Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo...

62
Estatíst Estatíst ica ica Universidade Federal de Universidade Federal de Alagoas Alagoas Centro de Tecnologia Aula 25 Aula 25 Prof. Marllus Gustavo Ferreira Passos das Prof. Marllus Gustavo Ferreira Passos das Neves Neves Adaptado do material elaborado pelo Prof. Adaptado do material elaborado pelo Prof. Christiano Cantarelli Rodrigues Christiano Cantarelli Rodrigues

Transcript of Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo...

Page 1: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

EstatísticaEstatística

Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia

Aula 25Aula 25

Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves

Adaptado do material elaborado pelo Prof. Christiano Adaptado do material elaborado pelo Prof. Christiano Cantarelli RodriguesCantarelli Rodrigues

Page 2: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Aula 25Aula 25

Análise de RegressãoAnálise de Regressão

CorrelaçãoCorrelação

Page 3: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Existe relação entre o tempo em sala de aula e o salário?Existe relação entre a temperatura e o nível de oxigênio dissolvido em um rio?Existe relação entre a fração de área impermeável em um lote e a vazão gerada após uma chuva?Existe relação entre o nível de fibra de carbono em um material em que é fabricada uma estrutura e a resistência desta ao impacto?Existe relação entre as vazões médias mensais de 2 postos de monitoramento próximos?Existe relação entre o no de motos vendidas e o no de acidentes de trânsito?

IntroduçãoIntrodução

Page 4: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Técnica estatística usada para modelar e investigar a relação entre 2 ou mais variáveis a partir de dados amostrais

1) Pode ser usada para construir um modelo para prever um fenômeno exemplo: ano que vem, se forem vendidas x motos, teremos y acidentes ...

2) Pode ser usado também para otimizar um processo, determinar as variáveis que melhoram resposta de um processo ou para controlar um processo exemplo: modificar a temperatura numexperimento não modifica em nada os resultados, mas se for modificado tal composto, o efeito é o desejado

Análise de RegressãoAnálise de Regressão

Page 5: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Suponha que um engenheiro esteja interessado em saber se a porcentagem de hidrocarbonetos presente em um condensador principal de uma unidade de destilação tem relação com a pureza do oxigênio produzido em um processo químico

Análise de RegressãoAnálise de Regressão

Chamando de x a pureza (%) e y a quantidade de hidrocarboneto (reagente, também em %) traçar-se primeiramente um diagrama de dispersão

A seguir os dados e o gráficoA seguir os dados e o gráfico

Page 6: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

Observação

Reagente

Pureza

X(%) Y(%)

1 0,99 90,01

2 1,02 89,05

3 1,15 91,43

4 1,29 93,74

5 1,46 96,73

6 1,36 94,45

7 0,87 87,59

8 1,23 91,77

9 1,55 99,42

10 1,40 93,65

11 1,19 93,54

12 1,15 92,52

13 0,98 90,56

14 1,01 89,54

15 1,11 89,85

16 1,20 90,39

17 1,26 93,25

18 1,30 93,41

19 1,43 94,98

20 0,95 87,33

85

90

95

100

0,80 1,00 1,20 1,40 1,60

Pur

eza

(%)

Reagente (%)

Diagrama de dispersão

Embora não vejamos uma curva, mas sim pontos dispersos, há forte indicação de que eles repousam aleatoriamente em torno de uma reta

Page 7: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

Tomando x = 1,2, esperaríamos que seu valor de y caísse na reta

Page 8: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

esperaríamos que y(1,2) caísse aqui

Mas caiu aqui

Isto ocorre porque Y é uma v.a.

Page 9: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

Se Y é uma v.a. possui uma distribuição de probabilidade possui valor esperado e possui variância

Para um dado valor de x (tal como x = 1,2), Y possui valor esperado ou média que é aquele que esperaríamos que caísse bem na reta

Então a média da v.a. Y está relacionada com x pela relação linear seguinte:

xxYE xY 10)|(

Page 10: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

xxYE xY 10)|(

Page 11: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

xxY 10

Coeficientes de Regressão

Interseção da reta Inclinação da reta

A média de Y é uma função linear de xMas um valor real qualquer observado y não cai exatamente na reta

Page 12: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

Modelo Linear Probabilístico maneira mais apropriada para generalizar

xY 10

Erro aleatório

Modelo de Regressão Linear Simples

x

Y|x) = 0 + 1x

y

y = Y|x) +

Page 13: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

xY 10

Modelo de regressão linear simples possui apenas uma variável independente x regressorv. a. Y:

)()()|( 10 ExExYE xY Valor esperado

Variância

)()()|( 10 VarxVarxYVar

Page 14: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

Supondo que a v.a. tenha valor esperado (média) 0 e variância 2

xxYE 10)|(

2)|( xYVar

1) o modelo verdadeiro de regressão é uma linha de valores médios

2) 1 é a mudança média de Y para uma mudança unítária de x

Page 15: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Análise de RegressãoAnálise de Regressão

Supondo que a v.a. tenha valor esperado (média) 0 e variância 2

xxYE 10)|(

2)|( xYVar

3) A variabilidade de Y, em um valor particular de x, é determinada pela variância do erro 2

4) Essa variância é a mesma para cada x distribuição de valores ao redor da média (Y|x)

Page 16: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Regressão Linear SimplesRegressão Linear Simples

Possui apenas uma variável independente x regressorPossui apenas uma variável dependente aleatória Y variável de resposta

Nosso objetivo é estimar os parâmetros populacionais 0 e 1, ou seja, teremos estimativas pontuais, vindas de amostras retirada de 2 populações

xxYE 10)|(

EstimarQue Que populações?populações?

Page 17: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Regressão Linear SimplesRegressão Linear Simples

0 e 1

X YAs populações são de X e Y

A regressão linear simples supõe ser possível uma relação linear entre as 2 populações

Amostra

x1

, x2

, ..., xn

Amostra

y1

, y2

, ..., yn

10 e ˆˆ

Estimativas pontuais de 0 e 1

A estimativa dos parâmetros do modelo pode ser feita pela estimativa dos mínimos quadrados:

xy 10ˆˆ

xx

xy

S

S1

n

iiyn

y1

1

n

iixn

x1

1

Page 18: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Regressão Linear SimplesRegressão Linear Simples

)

n

i

n

ii

i

n

iixx n

x

xxxS1

2

12

1

2

)

n

i

n

ii

n

ii

ii

n

iiixy n

yx

xyxxyS1

11

1

2

xy 10ˆˆ

xx

xy

S

S1

Reta que melhor se ajusta aos pontos

FórmulasFórmulas

xY 10ˆˆˆ

Page 19: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Modelo de Regressão Linear Simples

xY 10

Resíduo do Modelo de Regressão Linear Simples

iii yy ˆ

Regressão Linear SimplesRegressão Linear Simples

xY 10ˆˆˆ

Amostras x,y

Page 20: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Como se obtiveram estas fórmulas?

iii xy 10

Logo, isolando o resíduo i

) )

n

iii

n

iii

n

ii xyyyL

1

2

101

2

1

2 ˆˆˆ

Regressão Linear SimplesRegressão Linear Simples

Para cada ponto xi, yi

iii xy 10 Criando a função abaixo, derivando em relação aos estimadores de 0 e 1 e igualando a zero chagamos nas fórmulas

010

ˆ,ˆ0

L

010

ˆ,ˆ1

L

e método dos mínimos quadrados

Page 21: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

AplicaçõesAplicações

Exemplo da relação entre a porcentagem de hidrocarbonetos e a pureza do oxigênio produzido em um processo químico

Observação

Reagente

Pureza

X(%) Y(%)

1 0,99 90,01

2 1,02 89,05

3 1,15 91,43

4 1,29 93,74

5 1,46 96,73

6 1,36 94,45

7 0,87 87,59

8 1,23 91,77

9 1,55 99,42

10 1,40 93,65

11 1,19 93,54

12 1,15 92,52

13 0,98 90,56

14 1,01 89,54

15 1,11 89,85

16 1,20 90,39

17 1,26 93,25

18 1,30 93,41

19 1,43 94,98

20 0,95 87,33

Page 22: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Exemplo: 20n

20

1

92,23ix

20

1

21,1843iy

20,1x

16,92y 20

1

2 53,170044iy

20

1

2 29,29ix

20

1

66,2214ii yx

) )68,0

20

92,2329,29

2

1

2

12

1

2

n

i

n

ii

i

n

iixx n

x

xxxS

) ) )18,10

20

21,184392,2366,2214

1

11

1

2

n

i

n

ii

n

ii

ii

n

iiixy n

yx

xyxxyS

97,1468,0

18,101

xx

xy

S

S

) 20,7420,197,1416,92ˆˆ10 xy

xxY 97,1420,74ˆˆˆ10

AplicaçõesAplicações

Page 23: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

85

90

95

100

0,80 1,00 1,20 1,40 1,60

Reagente (%)

Pure

za (%

)

Experimento Modelo Linear (Modelo)

AplicaçõesAplicações

Page 24: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Observação

Reagente Pureza

Modelo Resíduo

X(%) Y(%)

1 0,99 90,01 89,02 0,99

2 1,02 89,05 89,47 -0,42

3 1,15 91,43 91,42 0,01

4 1,29 93,74 93,51 0,23

5 1,46 96,73 96,06 0,67

6 1,36 94,45 94,56 -0,11

7 0,87 87,59 87,22 0,37

8 1,23 91,77 92,61 -0,84

9 1,55 99,42 97,40 2,02

10 1,40 93,65 95,16 -1,51

11 1,19 93,54 92,01 1,53

12 1,15 92,52 91,42 1,10

13 0,98 90,56 88,87 1,69

14 1,01 89,54 89,32 0,22

15 1,11 89,85 90,82 -0,97

16 1,20 90,39 92,16 -1,77

17 1,26 93,25 93,06 0,19

18 1,30 93,41 93,66 -0,25

19 1,43 94,98 95,61 -0,63

20 0,95 87,33 88,42 -1,09

-2,00

-1,50

-1,00

-0,50

0,00

0,50

1,00

1,50

2,00

2,50

Res

íduo

Resíduo do Modelo de Regressão Linear Simples

iii yy ˆ

AplicaçõesAplicações

Page 25: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Propriedades dos estimadoresPropriedades dos estimadores

Já vimos que Y e são variáveis aleatórias

Vimos também que Var(Y) = Var() = 2, mas E(Y) = Y/x (reta de regressão) e E() = 0

Page 26: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Propriedades dos estimadoresPropriedades dos estimadores

Os estimadores também são variáveis aleatórias

Pode-se mostrar que

10ˆˆ e

xxS

2

111ˆˆ )Var( e )E(

xxS

x

n

22

000

1ˆˆ )Var( e )E(

onde:

xyT

n

iii

n

iiE SSQyySQ 1

1

2

1

2 ˆ)ˆ(

2

1

22

1

)( ynyyySQn

ii

n

iiT

SQ soma dos quadrados, dos erros (SQE) e total (SQT)

2ˆ 2

n

SQE Estimador não tendencioso de 2

Page 27: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Testes de hipóteses na regressão linearTestes de hipóteses na regressão linear

O primeiro teste que veremos é para a significância da regressão, ou seja, responder a pergunta: existe evidência suficiente para afirmarmos que há uma relação linear entre x e y?Isto pode ser feito de 2 formas

Teste tTabela ANOVA teste F

Suposições:1)A componente do erro no modelo é uma v.a. que segue uma distribuição normal com média 0 e variância 2 ~ N(0,2);

2)Quanto as demais v.a. Y ~ N(o+1x,2),

)/S,N( xx12

1 ~ˆ β ) )/Sx (1/n, N( xx2

0 20 ~ˆ βe

Page 28: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Testes de hipóteses na regressão linearTestes de hipóteses na regressão linear

Usando o teste t para 1 :

H0: 1 = 1,0 a inclinação da reta é igual a um valor constante 1,0

H1: 1 ≠ 1,0Estatística de teste:

xx

2

S

ˆ

ˆt 0,11

Se as suposições estiverem certas esta estatística segue a distribuição t com gl = n-2, sujeito a H0 acima.

Rejeitamos H0 se |t| > tc, onde tc = t,n-2

Page 29: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Testes de hipóteses na regressão linearTestes de hipóteses na regressão linear

Usando o teste t para 0 :

H0: 0 = 0,0 a inclinação da reta é igual a um valor constante 0,0

H1: 0 ≠ 0,0Estatística de teste:

xx

2

Sn

2

0,00

ˆt

x

Se as suposições estiverem certas esta estatística segue a distribuição t com gl = n-2, sujeito a H0 acima.

Rejeitamos H0 se |t| > tc, onde tc = t,n-2

Page 30: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Testes de hipóteses na regressão linearTestes de hipóteses na regressão linear

Usaremos o teste t para 1 para 1,0 = 0, ou seja:

H0: 1 = a inclinação da reta é nula não há relação linear entre x e YH1: 1 ≠

Estatística de teste: xx

2

ˆt 1

Verificaremos a significância da regressão

Casos ondeH0: 1 = não é rejeitada

Page 31: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Testes de hipóteses na regressão linearTestes de hipóteses na regressão linear

Verificaremos a significância da regressão

Casos ondeH0: 1 = é rejeitada

Page 32: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

AplicaçõesAplicaçõesContinuação do exemplo

Observação

Reagente

Pureza

X(%) Y(%)

1 0,99 90,01

2 1,02 89,05

3 1,15 91,43

4 1,29 93,74

5 1,46 96,73

6 1,36 94,45

7 0,87 87,59

8 1,23 91,77

9 1,55 99,42

10 1,40 93,65

11 1,19 93,54

12 1,15 92,52

13 0,98 90,56

14 1,01 89,54

15 1,11 89,85

16 1,20 90,39

17 1,26 93,25

18 1,30 93,41

19 1,43 94,98

20 0,95 87,33

H0: 1 = H1: 1 ≠

xx

2

ˆt 1

97,141 68,0xxSCalculados antes

2ˆ 2

n

SQE Precisamos agora

xyTE SSQSQ 1 2

1

2 ynySQn

iiT

Page 33: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

AplicaçõesAplicaçõesContinuação do exemplo

11,41

0,681,17

14,97t

Onde Sxy = 10,18 (calculado antes)

1,17220

20,9852n

SQ E2

20,98510,1814,97173,38SSQSQ xyTE 1

) 173,3892,1620170.044,5ynySQ 22n

1i

2iT

adotando = 0,05 (2 caudas), com gl = n-2 = 18:tc = 2,101 rejeita H0 há evidências suficiente para a afirmação da relação linear entre x e y

Page 34: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

ANOVA: testar a significância da regressãoANOVA: testar a significância da regressão

Col 1 Col 2 Col 3 Col 4 Col 5

Fonte de variação

Soma dos Quadrados

(SQ)

Graus de liberdad

e

Média Quadrática (MQ)

Estatística de teste F

Regressão 1 Num = Col 2/Col

3Num / Den

Erro SQE =SQT-SQR n – 2 Den = Col 2/Col 3

TotalSQT n – 1

Outra forma de fazer o mesmo teste é através da tabela ANOVA

xyR SSQ 1

Page 35: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

AplicaçõesAplicaçõesContinuação do exemplo

Col 1 Col 2 Col 3 Col 4 Col 5

Fonte de variação

Soma dos Quadrados

(SQ)

Graus de liberdad

e

Média Quadrática (MQ)

Estatística de teste F

Regressão 152,395 1 152,395

130,25

Erro 20,985 18 1,17

Total 173,38 19

Fc = F0,05;1;18 = 4,4139 rejeita H0

Page 36: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

ANOVA: testar a significância da regressãoANOVA: testar a significância da regressãoQual o significado de cada soma SQ da Qual o significado de cada soma SQ da ANOVA?ANOVA?

)

n

iiiE yySQ

1

)

n

iiR yySQ

1

)

n

iiT yySQ

1

2Soma Quadrática Total variabilidade total

Soma Quadrática dos Erros variabilidade residual sem explicação pela linha de regressão

Soma Quadrática da Regressão variabilidade devido à linha de regressão

ERT SQSQSQ

Page 37: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

ANOVA: testar a significância da regressãoANOVA: testar a significância da regressão

)

n

iiiE yySQ

1

)

n

iiR yySQ

1

)

n

iiT yySQ

1

2

ERT SQSQSQ

Qual o significado de cada soma SQ da Qual o significado de cada soma SQ da ANOVA?ANOVA?

Desvio ou variação explicada é melhor a estimativa 13 do que simplesmente a média 9 para o valor real 19

Page 38: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

IC para a resposta médiaIC para a resposta média

Para um valor especificado de x, tal como x0, pode ser construído um IC para a resposta média

0xY0)x|E(Y

0xY0 x)x|E(Y0 10

IC em torno da linha de regressão

No ponto x0, o valor esperado é

0xY x0 10

ˆˆˆ Já a estimativa do valor esperado é

Page 39: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

-0|ˆ xY

Nível de confiança

IC para a resposta médiaIC para a resposta média

0|ˆ xY Ex0+0|ˆ xYEx0

x

x0

0|ˆ xY Estimador não tendencioso de 0|xY

Page 40: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

IC para a resposta médiaIC para a resposta média

Como temos normalmente distribuídos:10

ˆˆ e

)

xx

202

x|Yx|Y Sxx

n1

N~00

)Var(0x|Y

2Usando como estimativa de2

)

xx

202

Sxx

n1

E ct Margem de erro da predição em x0

tc = t,n-2 (2 caudas)

Page 41: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

AplicaçõesAplicaçõesContinuação do exemplo

Construir o intervalo de confiança para a resposta média, adotando NC = 95%

0xY 14,97x74,20

Estimativa pontual para qualquer x0

tc = 2,101

Margem de erro para qualquer x0

)

0,681,20x

201

1,172,101E2

02)(

Page 42: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Calculando a resposta média e a margem de erro para vários valores de x0, surge o gráfico abaixo

AplicaçõesAplicações

Page 43: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Adequação do modelo de regressãoAdequação do modelo de regressão

Ajustar um modelo de regressão requer várias suposições

• A estimação dos parâmetros 0 e 1 requer que os erros sejam v.a. não correlacionadas com média zero e variância 2 constante

• Testes de hipótese e construção de IC requerem que os erros tenham distribuição normal

A análise dos resíduos ou análise residual e o A análise dos resíduos ou análise residual e o coeficiente de determinação Rcoeficiente de determinação R22 nos ajudam a nos ajudam a verificar se o modelo é realmente adequadoverificar se o modelo é realmente adequado

Page 44: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Adequação Adequação análise dos resíduos análise dos resíduos

A análise dos resíduos é útil para verificar se eles seguem a distribuição normal

Histograma de frequência dos resíduos

Gráfico de probabilidade normal dos resíduosGráficos dos resíduos contra valores de y ou x

Pode-se construir

Vamos ver nas aplicaçõesVamos ver nas aplicações

Page 45: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

AplicaçõesAplicaçõesContinuação do exemplo

Observação Reagente Pureza

Pureza prevista Erro

X(%) Y(%) (%)

1 0,99 90,01 87,22 2,786

2 1,02 89,05 88,42 0,628

3 1,15 91,43 88,87 2,559

4 1,29 93,74 89,02 4,720

5 1,46 96,73 89,32 7,410

6 1,36 94,45 89,47 4,981

7 0,87 87,59 90,82 -3,227

8 1,23 91,77 91,42 0,354

9 1,55 99,42 91,42 8,004

10 1,40 93,65 92,01 1,636

11 1,19 93,54 92,16 1,376

12 1,15 92,52 92,61 -0,093

13 0,98 90,56 93,06 -2,502

14 1,01 89,54 93,51 -3,971

15 1,11 89,85 93,66 -3,811

16 1,20 90,39 94,56 -4,169

17 1,26 93,25 95,16 -1,908

18 1,30 93,41 95,61 -2,197

19 1,43 94,98 96,06 -1,076

20 0,95 87,33 97,40 -10,074

Page 46: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

AplicaçõesAplicaçõesContinuação do exemplo

Gráficos dos resíduos contra valores de y ou x

Page 47: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Que tipos de gráficos podem aparecer?

Situação ideal Variância crescendo

Crescendo com o tempo ou com a magnitude de y ou x

Variâncias desiguais

Modelo linear inadequado

Testar outros modelos (parabólico, por exemplo)

Adequação Adequação análise dos resíduos análise dos resíduos

Page 48: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Adequação Adequação coeficiente R coeficiente R22

Lembrando ...

)

n

iiiE yySQ

1

)

n

iiR yySQ

1

)

n

iiT yySQ

1

2Soma Quadrática Total variabilidade total

Soma Quadrática dos Erros variabilidade residual sem explicação pela linha de regressão

Soma Quadrática da Regressão variabilidade devido à linha de regressão

ERT SQSQSQ

Page 49: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Adequação Adequação coeficiente R coeficiente R22

Dividindo a equação por SQTERT SQSQSQ

T

E

T

R

T

T

SQSQ

SQSQ

SQSQ

T

E

T

R

SQSQ

1SQSQ

T

E

T

R2

SQSQ

1SQSQ

R Coeficiente de determinação

Frequentemente usado para julgar a adequação do modelo quantidade de variabilidade nos dados explicada ou considerada pelo modelo de regressão

0 ≤ R2 ≤ 1

Page 50: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Adequação Adequação coeficiente R coeficiente R22

O coeficiente de determinação deve ser utilizado com cuidado

1)R2 sempre aumentará se adicionarmos uma variável ao modelo, porém isso não significa necessariamente que o modelo novo é melhor que o antigo2)Mesmo se x e y estiverem relacionados de maneira não linear, R2 será frequentemente grande3)Mesmo com R2 grande, isto não implica que o modelo de regressão forneça previsões exatas para observações futuras

Page 51: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Adequação Adequação coeficiente R coeficiente R22

Os 2 casos abaixo podem ter R2 grande, mas o caso 2 não é um caso de linearidade

Page 52: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Nosso exemplo

8790,012 T

E

T

R

SQ

SQ

SQ

SQR

) 98,20ˆ1

2

n

iiiE yySQ

) 39,152ˆ1

2

n

iiR yySQ

) 37,1731

2

n

iiT yySQ

AplicaçõesAplicações

Page 53: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

CorrelaçãoCorrelação

Vimos que o engenheiro extrai dados para seus estudos de duas maneiras:

experimental

x1, x2, ..., xn

Sistema estudado

Entrada controlada saída não controlada

y1, y2, ..., yn

observacional

x1, x2, ..., xn

Sistema estudado

Entrada não controlada saída não controlada

y1, y2, ..., yn

Page 54: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

CorrelaçãoCorrelação

Vimos que o engenheiro extrai dados para seus estudos de duas maneiras:

experimental

observacional

Exemplo da Eng. Civil: de forma controlada e cuidadosa, altero a forma como as formas são assentadas na construção observo se a velocidade no cronograma é alterada

Exemplo da Eng. Ambiental: realizo o monitoramento da quantidade de enxofre lançado na atmosfera por indústrias meço o pH da chuva na mesma região

Page 55: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

CorrelaçãoCorrelação

Fazemos uma análise de regressão quando supomos que a variável x seja uma variável matemática, medida com erro desprezível e a variável Y seja aleatória caso típico de experimentosUsamos o termo correlação quando as 2 variáveis x e Y são aleatórias. Neste caso, elas são distribuídas conjuntamente caso típico de observações

Pode-se mostrar que o modelo matemático de regressão com as variáveis X e Y aleatórias é equivalente aquele mesmo modelo, considerando X controlada ou matemática

Page 56: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

CorrelaçãoCorrelação

Mas isto somente ocorre se X e Y forem distribuídas normal e conjuntamente

Para o caso linear, surge então o chamado coeficiente de correlação R

Pode-se mostrar que ele é a raiz quadrada do coeficiente de determinação que vimos antes

T

E

T

R2

SQSQ

1SQSQ

R 2RR

Coef. de determinação Coef. de correlação linear amostral

O coeficiente R é, na verdade o estimador do coeficiente de correlação populacional existe teste de hipótese para verificar se = 0 ou ≠ 0

Page 57: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Casos não lineares redutíveis ao linearCasos não lineares redutíveis ao linear

Page 58: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Casos não lineares redutíveis ao linearCasos não lineares redutíveis ao linear

Page 59: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Erros comuns envolvendo regressãoErros comuns envolvendo regressão

1) Concluir que a correlação implica em causalidade:

podemos encontrar correlação entre o aumento de mortes de motociclistas e a venda de motos, mas não significa que mais motos vendidas causem mais mortes;

2) Outro erro surge de dados que se baseiam em médias: médias suprimem a variação individual e podem aumentar o R;

3) Outro erro envolve a propriedade de linearidade: pode existir uma relação entre x e y mesmo quando não há correlação linear significativa

Page 60: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

ResumoResumo

Tudo que foi visto pode ser resumido nos passos:

1)Traçar diagrama de dispersão verificar se o modelo linear é o que deve ser buscado2)se for modelo linear passo 3, senão linearizar a equação passos adiante com x e y linearizados3)Determinar a reta com o método dos mínimos quadrados4)Fazer o teste para o estimador do coeficiente angular5)Fazer o teste com a tabela ANOVA6)Construir o intervalo de confiança7)Verificar a adequação do modelo

Page 61: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Densidade Habitacional

(hab/ha)

Fração da área

impermeável (%)

25 11,340 26,760 36,780 46,6

100 49120 53,4140 57,2160 60,4180 63,2200 65,8

AplicaçõesAplicações

Temos abaixo uma tabela com dados de densidade habitacional e fração de área impermeável, acompanhada do diagrama de dispersão. Podemos concluir que existe alguma relação entre as variáveis? Se positivo, seria linear ou não linear? Faça o estudo.

Page 62: Estatística Universidade Federal de Alagoas Centro de Tecnologia Aula 25 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

EstatísticaEstatística

Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia

Aula 25Aula 25

Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves

Adaptado do material elaborado pelo Prof. Christiano Adaptado do material elaborado pelo Prof. Christiano Cantarelli RodriguesCantarelli Rodrigues