Parte 4: Inferencia

47
Aula 07 Gujarati e Porter, 2011 Capítulos 7 e 8 Heij et al., 2004 Capítulo 3 Análise de Regressão Linear Múltipla IV

Transcript of Parte 4: Inferencia

Aula 07

Gujarati e Porter, 2011 – Capítulos 7 e 8

Heij et al., 2004 – Capítulo 3

Análise de Regressão Linear Múltipla IV

2

Exemplo

Tomando por base o modelo

a senhorita Jolie, gerente do departamento de RH da

empresa TEMCO, desconfia que ao menos um dos

regressores é relevante para explicar a variável resposta.

Utilizando um nível de significância de 1%, conduza um teste

de hipóteses adequado.

iiiii prevanosempeducsalario explog 3210

re de zerometro difeos um parâ: pelo menH

βββ:H

A

0 3210

Modelo

iiiii prevanosempeducsalario explog 3210

Hipóteses de Interesse

Exemplo

SST = SSR + SSE

Se H0 for verdadeira, espera-se que SSE seja pequena e SSR grande.

4

TESTE F(Análise de Variâncias – ANOVA)

5

;0 , 2 1

2

2 k(k) βse βχ~

σ

SSE.

É possível demonstrar que, sob certas condições, as v.a.

SSR, SSE e SST apresentam as seguintes características:

; 1 2

12 knχ~σ

SSR.

tes.independen são SSE e SSR 3.

Teste F

Consequências:

2

2 11 (a) σMSRE

kn

SSRE kn

σ

SSRE

Logo, MSR é um estimador não-viesado de s2

Se 1 = 2 = ... = k = 0, então MSE = SSE/k é um estimador não-viesado de

s2.

2

12σMSEE

k

SSEE 0 k,

SSEE (b)

kββse

s

Teste F

7

Logo, SST/(n-1) é estimador não-viesado de s2

Teste F

222

1

11

,0 Se (c)

) σ(n- σkσkn

SSEESSRESST E

ββ k

Consequências: (cont.)

8

12

2

1

1

1

1

,0 Se (d)

kn-,k

k

F~MSR

MSE

kn-

SSRk-

SSE

kn-

SSR/ σk

SSE/ σ

F

ββ

Teste FConsequências: (cont.)

9

1k-n

SSRMSR

k

SSEMSE

Fonte de

variação SS gl MS F

Regressão SSE k MSE MSE/MSR

Erro SSR n-(k+1) MSR

Total SST n-1

Teste FConsequências: (cont.)

10

1)(k-n ,k

H sob

2

2

F ~

1)(k-n)R-(1

(k)R

MSR

MSEF

0

Fc

Região crítica:

Teste FConsequências: (cont.)

11

Exemplo

Tomando por base o modelo

a senhorita Jolie, gerente do departamento de RH da

empresa TEMCO, desconfia que ao menos um dos

regressores é relevante para explicar a variável resposta.

Utilizando um nível de significância de 1%, conduza um teste

de hipóteses adequado.

iiiii prevanosempeducsalario explog 3210

12

re de zerometro difeos um parâ: pelo menH

βββ:H

A

0 3210

Modelo

iiiii prevanosempeducsalario explog 3210

Hipóteses de Interesse

Resolução do Exemplo

13

Resolução do Exemplo

14

38,42Fobs

Fcrit

285,4)42,3,99.0(@

)01,0(

]42;3[ qfdistFFEviewsNo

crit

critobs0 F F se H Rejeito

Resolução do Exemplo

re de zerometro difeos um parâ: pelo menH

βββ:H

A

0 3210

15

valor-p se H Rejeito 0

p-valor

Fobs

13

]42;3[ 1007,9)42,3,38.42(@1 cfdistFFPvalorpEviewsNo

obs

re de zerometro difeos um parâ: pelo menH

βββ:H

A

0 4320

Resolução do Exemplo

16

Voltando ao Exemplo

A senhorita Jolie sabe que, a 1% de significância, ao menos

um dos regressores é relevante para explicar a variável

resposta. Todavia, a senhorita Jolie desconfia que expprev

seja irrelevante, dado que os funcionários da TEMCO passam

por um processo de treinamento assim que são admitidos na

empresa. Dessa forma, adotando um nível de significância de

1%, existem evidências favoráveis à desconfiança da gerente

de RH?

0

0

3

30

β:H

β:H

A

Modelo

iiiii prevanosempeducsalario explog 3210

Hipóteses de Interesse

Voltando ao Exemplo

18

Teste t

Já foi visto que

~ 10

)1(

ˆ

2

2; N

RSQT

ββ

jj xx

jj

s

e como s2 é um parâmetro desconhecido, então deverá ser

estimado. Dessa maneira, será necessário estudar a

distribuição de probabilidades da nova v.a. resultante.

Teste t

Nos slides anteriores foi dito que SSR, SSE e SST são v.a. e,

ainda, não é difícil provar que, sob certas condições:

;~σ

SSR 2

12 kn

Assim,

MSR é um estimador não-viesado de s2

Teste t

2

2 11 σMSRE

kn

SSRE kn

σ

SSRE

21

Assim, substituindo s2, pelo seu estimador, MSR, na

expressão do slide 19, temos que

em que

j

jX

depadrãoerroRsn

j

j

s

s

ˆ :)1(1

ˆˆ

22

2

ˆ

regressãodapadrãoerroMSR :ˆˆ 2 ss

Teste t

)1(

ˆ

2

jj xx

jj

RSQT

MSR

ββ

22

Logo, para testarmos as hipóteses

H0: j = b (em particular b = 0)

HA: j b (HA: j < b ou HA: j > b),

utilizaremos o fato que, sob H0,

e construiremos a região crítica de acordo com a hipótese

alternativa adotada.

1

ˆ

t~ˆ

ˆ

kn-

j

j

s

Teste t

0

0

3

30

β:H

β:H

A

Modelo

iiiii prevanosempeducsalario explog 3210

Hipóteses de Interesse

Voltando ao Exemplo

24

Resolução do Exemplo

25

698,2)42,995.0(@

)005,0(

]42[

)005,0(

]446[ qtdisttttEviewsNo

crit

cri to b s0 t t se H Rejeito

/2/2

tcrit- tcrit

0

0

3

30

β:H

β:H

A

Resolução do Exemplo

51004100053640

00027360,

,

,tobs

26

/2/2

tcrit- tcrit

valo r-p se H Rejeito 0

Resolução do Exemplo

0

0

3

30

β:H

β:H

A

51004100053640

00027360,

,

,tobs

6127,0)510041,0(@12510041,02

]42[ ctdisttPvalorpEviewsNo

27

Voltando ao Exemplo

Tomando por base o modelo

existem evidências sobre a relevância da variável educ, com

99% de confiança? Toda a sua análise deve ser baseada na

construção de um intervalo de confiança.

iiiii prevanosempeducsalario explog 3210

28

Intervalo de Confiança

29

Intervalo de Confiança para j

Prova-se que

j

kn-jj tββIC

s ˆ2/

1ˆˆ);(

é um intervalo de confiança para o parâmetro j, com

coeficiente de confiança de 1-.

em que

jβado a o assoacierro padrãj

ˆˆ ˆ s

0

0

1

10

β:H

β:H

A

Modelo

iiiii prevanosempeducsalario explog 3210

Hipóteses de Interesse

Voltando ao Exemplo

31

Resolução do Exemplo

698,2)42,995.0(@

)005,0(

]42[

)005,0(

]446[ qtdisttttEviewsNo

crit

/2/2

tcrit- tcrit

Resolução do Exemplo

068924,0;021126,0008858,0698,2045025,0);(

023899,0

jβIC

0

0

1

10

β:H

β:H

A

Como o IC não engloba o zero, então, com 99% de confiança, existem evidências

contrárias à hipótese nula.

33

A administração de um hospital particular deseja estudar a

relação entre a satisfação dos pacientes em relação ao

atendimento do hospital (escore de 0 a 100) em função do índice

de severidade da doença do paciente (escore de 0 a 100), do

custo hospitalar pago pelo paciente (em milhares de reais) e do

nível de ansiedade do paciente (escore de 0 a 5). Para o estudo

foi coletada uma amostra aleatória de 23 pacientes atendidos no

último mês e os resultados estão no arquivo sat_pacientes.xls.

Exercício Completo

34

a) Faça a análise descritiva dos dados obtidos em função do

problema a ser analisado.

b) Proponha e estime os parâmetros de um modelo de regressão

adequado. Escreva os resultados na forma usual. Interprete

as estimativas dos parâmetros do modelo em termos do

problema em questão.

c) Calcule uma medida de qualidade do ajuste do modelo e

interprete-a em termos do problema em questão.

d) Qual(is) das variáveis explicativas utilizadas no modelo

influenciam a satisfação dos pacientes? Justifique sua

resposta com base numa técnica inferencial adequada e use

um nível de significância de 10%.

Exercício Completo

35

e) Estime um novo modelo com base nos resultados obtidos no

item (d).

f) O diretor do hospital afirmou que o aumento de uma unidade

no índice de severidade da doença de um paciente provoca

um decréscimo de pelo menos 1,5 no escore de satisfação

esperado. Verifique se esta afirmação procede com 90% de

confiança.

g) Com base num intervalo com 95% de confiança, verifique se

há um decréscimo médio de 2 unidades no escore de

satisfação com o aumento do custo hospitalar em mil reais.

Exercício Completo

36

h) (DESAFIO) O diretor ainda afirmou que o escore de satisfação

decresce em média 2 unidades quando se aumenta o índice

de severidade em 1 unidade e o custo hospitalar em mil reais,

conjuntamente. Teste a afirmação do diretor com 10% de

significância.

Dica: Leitura complementar!!!!

Exercício Completo

37

Teste de Hipóteses sobre uma única

Combinação Linear de Parâmetros (teste t)

LEITURA COMPLEMENTAR

38

Exemplo

Seja a equação de regressão múltipla,

Verifique, a partir da formulação e construção de um teste de

hipóteses, se a variável educ apresenta um impacto superior

ao da variável produtividade na variável resposta. Nesse

exemplo, utilize o banco de dados TEMCOPROD.wf1.

adeprodutivideducsalário 210

39

:H

0:H

21A

21210

ββ

ββββ

Hipóteses

Exemplo

adeprodutivideducsalário 210

Modelo

40

Teste de hipóteses sobre uma única

combinação linear de parâmetros

) ou ( :H

0:H

A

0

jijiji

jiji

ββββββ

ββββ

Estatística do teste

)ββse(

)ββ(t

ji

ji

ˆˆ

0ˆˆ

)ββv(oC)βse()βse()ββse( jijijiˆ,ˆˆ2ˆˆˆˆ 22

Sejam as hipóteses

41

Teste de hipóteses sobre uma única

combinação linear de parâmetros

ALTERNATIVAS DE SOLUÇÃO

A) Calcular todos os componentes do erro padrão (o software

Eviews gera a matriz de variâncias e covariâncias para os

estimadores dos parâmetros do modelo de regressão. Lembra

onde está?).

)ββv(oC)βse()βse()ββse( jijijiˆ,ˆˆ2ˆˆˆˆ 22

42

Teste de hipóteses sobre uma única

combinação linear de parâmetros

ALTERNATIVAS DE SOLUÇÃO (cont.)

B) Trabalhar com um modelo transformado para obter o

resultado diretamente

Seja

= i – j,

por exemplo, j pode ser escrito como j = i – e,

substituindo este resultado na equação de regressão

múltipla, podemos testar H0: = 0, contra uma alternativa

apropriada.

43

Teste de hipóteses sobre uma única

combinação linear de parâmetros

C) Utilizar o menu do Eviews para solucionar o problema (teste

de restrições nos coeficientes).

D) Trabalhar com uma hipótese linear geral (R = r) e usar, por

exemplo, o MATLAB.

E) Estimar o modelo restrito e o irrestrito e, através dos

coeficientes de determinação de ambos, conduzir o teste de

hipóteses de interesse.

ALTERNATIVAS DE SOLUÇÃO (cont.)

44

Escrevendo = 1 –2, vem que

0

0

:

:

AH

0H

Voltando ao Exemplo (solução B)

:H

0:H

21A

21210

ββ

ββββ

Hipóteses

adeprodutivideducsalário 210

Modelo

45

Mas, = 1 – 2 1 = + 2, e substituindo este resultado no

modelo proposto, vem que

)(

)(

20

220

220

210

adeprodutivideduceducsalário

adeprodutivideduceducsalário

adeprodutivideducsalário

adeprodutivideducsalário

Voltando ao Exemplo (solução B)

46

Voltando ao Exemplo (solução B)

47

Sob H0

Hipóteses

0:H

0:H

A

0

01985,0)43,121222.2(@1

681,1)43,95.0(@

1212222978,591

0717,1255

05,0

43

ctdistvalorp

qtdistttt

,t

n-kcrítico

obs

Voltando ao Exemplo (solução B)