Analise de Regressão Parte 2. Interpretando Valores X Y Um valor de Y conhecendo X!

Post on 16-Apr-2015

108 views 3 download

Transcript of Analise de Regressão Parte 2. Interpretando Valores X Y Um valor de Y conhecendo X!

Analise de Regressão

Parte 2

Interpretando Valores

X

Y Um valor de Y conhecendo X!

Interpretando Valores

X

Y

Y

Y

Interpretando Valores e os Ruídos

X

Y

^

Yi (valor real)

*

Y

Interpretando os Valores e os Ruídos

X

Y

Y

^

Yi (valor real)

*

Y = b0 + b1X

Yi (valor estimado)^

Esta equação vai “procurar” passar no meio das distribuições para os possíveis valores de Y a partir de um dado valor X

Interpretando os Ruídos!

X

Y

Y

^

Yi (valor real)

*

Y = b0 + b1X

Yi (valor estimado)^

Yi^

YYi -

Yi - Y^

Yi -

Interpretando os ruídos / resíduos

YYi -

Resíduo Global ou Variação Total em Y

Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de

SQDy – Variação Total em Y

Yi - Y^

Variação de Y explicada pela regressão.

Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de

SQRegressão – Variação de Y explicada pela regressão

Yi -Yi

^Variação de Y Não explicada pela regressão.

Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de

SQResíduo – Variação de Y não explicada pela regressão

Interpretando os Ruídos

X

Y

Y

^

Yi (valor real)

*Y

Y = b0 + b1X

Yi (valor estimado)^

Yi^

Yi -

Yi - Y^

Yi -

Modelo de Regressão Linearmais simples?!!

Yi

i

X

Y

0

1 Coeficienteangular

Y = E(Y) = 0 + 1 X

InclinaçãoPopulacional

InterceptoPopulacional

Erro Aleatório

Variável Independente

Variável Dependente Yi=0+1Xi +i

Ŷi=b0+b1Xi

i =Yi-Ŷi

Modelo estimado

Resíduo

Como?

10 1 1

2 2

1

ˆ b

n

i ii

n

ii

x y nxyb y x e

x nx

De onde surgiu? MMQO

Método dos Mínimos Quadrados Ordinários

MMQOYi

i

X

Y

0

1 Coeficienteangular

Y = E(Y) = 0 + 1 X

MMQOPara se encontrar o mínimo para uma equação, deve-se derivá-la em relação à “variável” de interesse e igualá-la a zero. A sua derivada segunda deverá, obviamente, ser positiva, o que no caso sempre ocorrerá, por se tratar de uma soma de quadrados.

Derivando então a expressão (1) em relação aos parâmetros e igualando-as a zero, poderemos obter duas equações que, juntas, vão compor o chamado sistemas de equações normais. A solução desse sistema fornecerá:

Note: Novas Formas ou fórmulas!Será mesmo?

10 1 1

2 2

1

ˆ b

n

i ii

n

ii

x y nxyb y x e

x nx

Perguntas

Podemos extrapolar: isto é tentar avaliar previsões para fora do intervalo observado para os dados

= 1602,0971;

e

Erro Padrão da Estimativa: É a medida de variabilidade em torno da linha de regressão (isto é, o seu desvio padrão).

Medidas de Variação na Regressão e na Correlação

• Utilidade: – Verificar se a variável independente prevê

bem a variável dependente no modelo estatístico utilizado!

• Soma Total de Quadrados (STQ)• Coeficiente de Determinação• Coeficiente de Correlação Linear

Pressupostos da Regressão e da Correlação

• Normalidade• Afeta as inferências sobre os valores dos coeficientes de

regressão.

• Homocedasticidade• Afeta a forma de cálculo dos coeficientes de regressão

• Independência de Erros• Aplica-se, em especial, a valores coletados ao longo de

um período de tempo.

• Linearidade• O modelo utilizado não é adequado.

Análise dos Resíduos

( )i i ie Y Y

0

X

X

0

Erros Correlacionados

-4

-2

0

2

4

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Estimativas de Intervalo de Confiança

• (valor médio)

• Efeito Banda de Confiança

2i n YX iY t S h

2 1i n YX iY t S h

Inferências sobre os Parâmetros: REGRESSÃO e CORRELAÇÃO

Testes de hipótese sobre o valor de 1.

Testes de hipótese sobre o valor de .

Testes de hipótese sobre o valor de 1

• Hipóteses:– Nula H0: 1 = 0 (não existe relação)– Alternativa H1: 1 0 (existe uma relação)

• Determinar o nível de significância do teste ()• Calcular a estatística do teste

– Comparar Região de Rejeição com a estatística do teste (Tabela da distribuição t com n-2 graus de liberdade)

• Concluir

Testes de hipótese sobre o valor de

• Hipóteses:– Nula H0: = 0 (não existe correlação)– Alternativa H1: 0 (existe correlação)

• Determinar o nível de significância do teste ()• Calcular a estatística do teste

– Comparar Região de Rejeição com a estatística do teste (Tabela da distribuição t com n-2 graus de liberdade)

• Concluir

Exercícios