1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão...

27
1 ESTATÍSTICA

Transcript of 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão...

Page 1: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

1

ESTATÍSTICA

Page 2: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

2

UDIII - Relação Entre Duas ou Mais Variáveis

ESTATÍSTICA

Ass 02: Regressão Múltipla

Page 3: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

3

OBJETIVOS ESPECÍFICOS

• Calcular a equação de regressão múltipla de Y sobe X e Z utilizando o critério dos mínimos quadrados

• Grafar a relação de Y para X quando se mantém constante Z

• Usar o plano de regressão para fazer predições

Page 4: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

4

SUMÁRIO

1- Introdução

2. O Modelo de Regressão

3. O Plano Ajustado de Mínimos Quadrados

Page 5: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

5

1. Introdução

A regressão múltipla nada mais é do que a regressão simples quando se tem em conta mais de um fator X.

É a técnica adequada quando desejamos pesquisar o efeito simultâneo de vários fatores sobre Y.

A regressão múltipla reduz a tendenciosidade que se verificaria no caso de uma regressão simples que não levasse em conta fatores estranhos.

Page 6: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

6

Exemplo: Suponhamos que as observações sobre fertilizante e safra já estudadas anteriormente tivessem sido feitas em sete postos agrícolas diferentes em todo o país. Mantidas que fossem as condições do solo e a temperatura, ainda poderíamos perguntar se parte da flutuação de Y não seria explicada pela variação do nível pluviométrico nas diferentes áreas. Poderemos fazer melhor previsão se levarmos em conta tanto o fertilizante como o nível pluviométrico. Assim é que a tabela 1, a seguir, dá os níveis pluviométricos observados, juntamente com as observações originais sobre a safra e fertilizante.

Page 7: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

7

Safra(bu/acre)

100200300400500600700

Tabela 1Observações sobre Safra,Fertilizante e

Nível Pluviométrico

Fertilizante(lb/acre)

40505070656580

Nível Pluviométrico

(pols)10201030202030

Page 8: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

8

a) Na figura a seguir, atribua a cada ponto seu nível pluviométrico Z. Então, considerando apenas os pontos com baixo nível pluviométrico (Z=10), ajuste a olho uma reta. Repita então o experimento para os pontos com nível pluviométrico moderado (Z=20), e, finalmente, para os pontos com alto nível pluviométrico (Z=30).

Page 9: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

9Fertilizante (lb/acre)

Saf

ra (

bu/a

cre)

Y

X100 200 300 400 500 600 700

80

70

60

504030

0

Z=10

20

10

30 20

20

Z=30

SOLUÇÃO

Fig 1- Como a safra depende de duas variáveis (fertilizante X e nível pluviométrico Z)

Page 10: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

10

b) Supondo agora constante o nível pluviométrico, estime qual seria o coeficiente angular da safra por libra adicional de fertilizante. Ou seja, qual seria o aumento de safra por libra adicional de fertilizante?

Solução

Note-se que o maior coeficiente angular na Fig.1 é 10/200=0,05 para a reta Z=10, enquanto que o menor coeficiente angular é 10/300=0,033 para a reta Z=30: em média, tais coeficientes são de cerca de 0,04 bushels por libra de fertilizante.

Page 11: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

11Fertilizante (lb/acre)

Saf

ra (

bu/a

cre)

Y

X100 200 300 400 500 600 700

80

70

60

504030

0

Z=10

20

10

30 20

20

Z=30

Maior b=10/200=0,05Menor b=10/300=0,033b médio= 0,04 bu/lb

Fig 2- Aumento de safra por libra adicional de fertilizante (Z constante)

Page 12: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

12

c) Mantido constante o fertilizante, estime o aumento de safra por polegada adicional de nível pluviométrico.

SoluçãoMantenhamos constante o fertilizante, no centro dos dados, por exemplo onde X=400. Uma reta tracejada mostra a distância vertical entre a reta correspondente ao nível pluviométrico Z=10 e a reta correspondente a Z=30 – cerca de 15 bushels. Como este aumento de 15 bushels decorre de um aumento de 20 polegadas do nível pluviométrico, isto significa que a chuva aumenta a safra em cerca de 15/20 bushels por polegada de nível pluviométrico.

Page 13: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

13Fertilizante (lb/acre)

Saf

ra (

bu/a

cre)

Y

X100 200 300 400 500 600 700

80

70

60

504030

0

Z=10

20

10

30 20

20

Z=30

d=15

pol/bu 75,020

15b

Fig 3- Aumento de safra por polegada adicional de nível pluviométrico (X constante)

Page 14: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

14

d) Estime a safra no caso de o nível de fertilizante ser de 400 libras e o nível pluviométrico de 10 polegadas.

Solução

Na figura 1 utilizamos a reta correspondente a Z=10, no ponto onde X=400, obtendo uma safra = 55 bushels.

Page 15: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

15

Y

X100 200 300 400 500 600 700

80

70

60

504030

0

Z=10

20

10

30 20

20

Z=30

55

X=400 lb; Z=10 pol Safra = 55 bu

Fig 4- Estimativa da safra para X=400 libras e Z=10 polegadas

Page 16: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

16

2. O Modelo de Regressão

Devemos considerar agora a regressão da safra Y sobre duas variáveis independentes – fertilizante X e nível pluviométrico Z. Suponhamos que a relação seja da forma

Valor esperado de Y = + X + Z

Geometricamente, esta equação é um plano tridimensional (Fig. 2)

Page 17: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

17

Fig.5 - Dispersão dos pontos observados em torno do verdadeiro plano de regressão

Fertilizante X

Nível Pluviométrico Z

Safra YY observado

Valor esperado de Y = + X + Z

(X,Z)

e

Page 18: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

18

Naturalmente, a safra efetivamente observada é quase sempre diferente da previsão: a diferença é o erro aleatório. Assim, qualquer valor observado pode ser expresso como seu valor esperado mais um erro aleatório e :

Y = + X + Z + e

Com as mesmas hipóteses sobre e do assunto anterior.

Page 19: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

19

coef. ang.

coef. ang.

ZX

Y

0

LXY

LZY

Fig.6 - Um plano como malha de retas paralelas

(intercepto)

Page 20: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

20

pode ser interpretado geometricamente como o coeficiente angular do plano quando nos deslocamos na direção X, mantendo Z constante.

Costuma-se designar como efeito marginal do fertilizante X sobre a safra Y.

Analogamente, é o coeficiente angular do plano quando nos deslocamos na direção Z, mantendo X constante; é o efeito marginal de Z sobre Y.

Page 21: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

21

2. O Plano Ajustado de Mínimos Quadrados

Tal como na regressão simples, o problema é que o estatístico não conhece e verdadeira relação (o verdadeiro plano), devendo, por isso, ajustar um plano estimado, da forma

cZbXaY a – intercepto do plano ajustado no eixo Y.b – coeficiente angular do plano ajustado,

na direção de X com Z constante.c – coeficiente angular do plano ajustado,

na direção de Z com X constante.

Page 22: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

22

Equações Estimadoras(Critério dos Mínimos Quadrados)

cZbXaY

ZcXbYa

zcxzbzy

xzcxbxy2

2

ZZz YYy XXx

Page 23: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

23

Tabela 2Cálculos para a Regressão Múltipla de Y sobre X e Z

Dados

Y X

100200300400500600700

y x xy x2

Desvios Produtos

-300-200-100

0100200300

400

X

60

Y

0

y

0

x

40505070656580

-20-10-101055

20

16500

xy

900004000010000

0100004000090000

280000

x2

Z10201030202030

20

Z

z-100

-101000

10

0

z

600020001000

0500

10006000

2000

100100

00

200

zy

1000

100100

00

100

30000

1000000

3000

z2 xz

600

zy

400

z2 7000

xz

Page 24: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

24

28,1a

0,833(20)-)0,0381(400-60a

0,833c

0,0381b

400c b 7000 600

c 7000b 28000016500

Z83,0X038,028Y

Page 25: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

25

Exemplo: Faça o gráfico da relação de Y para X dada por quando se mantém constante o nível pluviométrico em:

i) Z=10; ii) Z=20; iii) Z=30Solução:

0,038X52,9Y

0,83(30)0,038X82Y30Z para iii)

0,038X44,6Y

0,83(20)0,038X28Y20Z para ii)

0,038X36,3Y

0,83(10)0,038X28Y10Z para )i

Z83,0X038,028Y

Page 26: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

26

Fig.7 - A regressão múltipla ajusta os dados com retas paralelas

Fertilizante (lb/acre)

Saf

ra (

bu/a

cre)

Y

X100 200 300 400 500 600 700

80

70

60

504030

0

Z=10Z=20Z=30

Page 27: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 02: Regressão Múltipla.

27

PRATIQUE COM OS

EXERCÍCIOS .

BOA SORTE!