Revisão

RevisãoPremissa: seja y e x duas variáveis representando alguma

população, deseja-se explicar y em termos de x.

Ex: y=salário hora e x=anos de escolaridade

Questões:

a) Dado que nunca há uma relação exata entre x e y, como considerar outros fatores que afetam y?

b) Qual a relação funcional entre y e x?

c) Captura-se uma relação ceteris paribus entre y e x?

As ambiguidades são resolvidas através da equação do modelo linear simples:

Y=βo+ β1x+u

Respostas:

a) Através do termo de erro, ou seja, fatores que não são observados e que afetam y, além de x.

b) Se os outros fatores em u são mantidos fixos, Δu=0, então x tem um efeito linear sobre y: Δy= β1Δx se Δu=0, ode β1 é o parâmetro de inclinação. A linearidade implica que uma variação de 1 unid. Em x tem o mesmo efeito sobre y, independente do valor inicial de x.

c) Para obter conclusões ceteris paribus sobre como x afeta y é preciso fazer uma hipótese que restrinja a maneira como u está relacionado com x, e assim obter estimadores confiáveis de βo e β1 de uma amostra aleatória.

Hipótese sobre u:

Se βo está na equação, nada se perde ao assumir que : E(u)=0. Isto é, faz-se uma afirmação sobre a distribuição dos fatores não-observáveis na população.

Ex: a média da aptidão é zero para as pessoas que trabalham.

De qualquer forma, há sempre a possibilidade de redefinir βo para tornar E(u)=0 verdadeiro.

Hipótese da média condicional zero:

Como u e x são VA’s, então pode-se obter o valor esperado de u condicionado a qualquer valor de x. A hipótese crucial é que o valor médio de u não depende do valor de x, ie:

E(u|x)= E(u)=0

Para qualquer x, a média dos valores não-observáveis é a mesma, e assim, deve igualar-se ao valor médio de u na população.

Ex:características da terra e quantidade de fertilizante.

Função de regressão populacional

Considere o valor esperado de Y=βo+ β1x+u condicionado a x e usando E(u|x)= 0. Então:

E(y|x)= βo+ β1x

E(y|x) é uma função linear de x. Para um certo valor x, a distribuição de y estará centrada ao redor de E(y|x).

(Wooldridge, exercício 2.1)

1. Seja filhos o número de filhos de uma mulher e educ os anos de educação da mulher. Um modelo simples que relaciona a fertilidade a anos de educação é:

filhos = β0 + β1.educ + u , em que u é um erro não-observável.(a) Que tipos de fatores podem estar incluídos em u? É

provável que estejam correlacionados com o nível de educação? Explique.

(b) Uma análise de regressão simples mostrará o efeito ceteris paribus da educação sobre a fertilidade? Explique.

Mínimos quadrados ordináriosConsidere {(xi,yi): i=1,2,...,n} como uma amostra aleatória de tamanho

n da população. Podemos escrever:

yi=βo+ β1xi+ui

Defina, para qualquer boe b1 , um valor estimado para y quando x=xi, tal como:

ŷi=bo+ b1xi

Esse é o valor que se prevê para y quando x=xi. Há um valor estimado para cada observação da amostra, assim, o resíduo para a observação i é a diferença entre o valor verdadeiro de yi e seu valor estimado:

ûi=yi-ŷi=yi-bo- b1xi

A ideia é escolher boe b1 que tornam a soma dos resíduos quadrados mínima:

Min Σûi²

Uma vez determinados os estimadores, construímos a reta de regressão de MQO: ŷi=bo+ b1xi

Propriedades algébricas das estatísticas de MQO

(1) A soma, e portanto a média amostral, soa resíduos de MQO, é zero. (resulta da CPO)

Σûi²=0

(2) A covariância amostral entre os regressores e o resíduo de MQO é zero. (resulta da CPO)

Σxiûi=0

(3) O ponto( ) sempre está sobre a reta de regressão de MQO.

yx,

Defina:

SQT

SQE

SQR

SQT é uma medida da variação amostral total em yi. Se a dividirmos por n-1 obteremos a variância amostral de y. SQE mede a variação amostral em ŷi (sendo ) e SQR mede a variação amostral em ûi.

Assim: SQT=SQE+SQR

Grau de ajuste (R²)= SQE/SQT=1-SQR/SQT

R² está sempre entre 0 e 1 e é igual ao coeficiente de correlação amostral entre yi e ŷi.

Revisão

Documents

Transcript of Revisão