Revisão
description
Transcript of Revisão
RevisãoPremissa: seja y e x duas variáveis representando alguma
população, deseja-se explicar y em termos de x.
Ex: y=salário hora e x=anos de escolaridade
Questões:
a) Dado que nunca há uma relação exata entre x e y, como considerar outros fatores que afetam y?
b) Qual a relação funcional entre y e x?
c) Captura-se uma relação ceteris paribus entre y e x?
As ambiguidades são resolvidas através da equação do modelo linear simples:
Y=βo+ β1x+u
Respostas:
a) Através do termo de erro, ou seja, fatores que não são observados e que afetam y, além de x.
b) Se os outros fatores em u são mantidos fixos, Δu=0, então x tem um efeito linear sobre y: Δy= β1Δx se Δu=0, ode β1 é o parâmetro de inclinação. A linearidade implica que uma variação de 1 unid. Em x tem o mesmo efeito sobre y, independente do valor inicial de x.
c) Para obter conclusões ceteris paribus sobre como x afeta y é preciso fazer uma hipótese que restrinja a maneira como u está relacionado com x, e assim obter estimadores confiáveis de βo e β1 de uma amostra aleatória.
Hipótese sobre u:
Se βo está na equação, nada se perde ao assumir que : E(u)=0. Isto é, faz-se uma afirmação sobre a distribuição dos fatores não-observáveis na população.
Ex: a média da aptidão é zero para as pessoas que trabalham.
De qualquer forma, há sempre a possibilidade de redefinir βo para tornar E(u)=0 verdadeiro.
Hipótese da média condicional zero:
Como u e x são VA’s, então pode-se obter o valor esperado de u condicionado a qualquer valor de x. A hipótese crucial é que o valor médio de u não depende do valor de x, ie:
E(u|x)= E(u)=0
Para qualquer x, a média dos valores não-observáveis é a mesma, e assim, deve igualar-se ao valor médio de u na população.
Ex:características da terra e quantidade de fertilizante.
Função de regressão populacional
Considere o valor esperado de Y=βo+ β1x+u condicionado a x e usando E(u|x)= 0. Então:
E(y|x)= βo+ β1x
E(y|x) é uma função linear de x. Para um certo valor x, a distribuição de y estará centrada ao redor de E(y|x).
(Wooldridge, exercício 2.1)
1. Seja filhos o número de filhos de uma mulher e educ os anos de educação da mulher. Um modelo simples que relaciona a fertilidade a anos de educação é:
filhos = β0 + β1.educ + u , em que u é um erro não-observável.(a) Que tipos de fatores podem estar incluídos em u? É
provável que estejam correlacionados com o nível de educação? Explique.
(b) Uma análise de regressão simples mostrará o efeito ceteris paribus da educação sobre a fertilidade? Explique.
Mínimos quadrados ordináriosConsidere {(xi,yi): i=1,2,...,n} como uma amostra aleatória de tamanho
n da população. Podemos escrever:
yi=βo+ β1xi+ui
Defina, para qualquer boe b1 , um valor estimado para y quando x=xi, tal como:
ŷi=bo+ b1xi
Esse é o valor que se prevê para y quando x=xi. Há um valor estimado para cada observação da amostra, assim, o resíduo para a observação i é a diferença entre o valor verdadeiro de yi e seu valor estimado:
ûi=yi-ŷi=yi-bo- b1xi
A ideia é escolher boe b1 que tornam a soma dos resíduos quadrados mínima:
Min Σûi²
Uma vez determinados os estimadores, construímos a reta de regressão de MQO: ŷi=bo+ b1xi
Propriedades algébricas das estatísticas de MQO
(1) A soma, e portanto a média amostral, soa resíduos de MQO, é zero. (resulta da CPO)
Σûi²=0
(2) A covariância amostral entre os regressores e o resíduo de MQO é zero. (resulta da CPO)
Σxiûi=0
(3) O ponto( ) sempre está sobre a reta de regressão de MQO.
yx,
Defina:
SQT
SQE
SQR
SQT é uma medida da variação amostral total em yi. Se a dividirmos por n-1 obteremos a variância amostral de y. SQE mede a variação amostral em ŷi (sendo ) e SQR mede a variação amostral em ûi.
Assim: SQT=SQE+SQR
Grau de ajuste (R²)= SQE/SQT=1-SQR/SQT
R² está sempre entre 0 e 1 e é igual ao coeficiente de correlação amostral entre yi e ŷi.