1. Existem variáveis que não são facilmente quantificáveis numa escala definida. Estas variáveis quase frequentemente são denominadas por variáveis qualitativas, também designadas por variáveis dummies.
2. A titulo exemplificativo, num determinado modelo, mantendo todas as variáveis constantes, se estivermos a tratar do rendimento, notaremos que o sexo feminino tende para alguns casos a auferir salários inferiores aos seus colegas do sexo masculino.
3. As variáveis qualitativas geralmente indicam a presença ou a ausência de uma qualidade ou atributo. Em termos numéricos, elas assumem valores de 1 ou de 0, servindo de indicadores alternativos –variáveis dicotómicas, variáveis qualitativas, variáveis binárias.
iiiii uXDY +++= baa 2
Y Salario anual de um professor, sendo que a variável qualitativa género possui duas categorias (masculino e feminino)
Di=1 se o professor for do género masculinoDi=0 se o professor for do género feminino
4. Nota que na verdade a inclusão das variáveis dummiesimplicaria ter as duas categorias, para o caso do rendimento como função da oferta de trabalho de professores, incluiríamos duas categorias, ilustrando a demanda de professores quando tratam-se de homens e mulheres, tal que o modelo apareceria do seguinte modo:
iiiiii uXDDY ++++= baaa 2312
contrariocasomulheresforseDcontrariocaso
emforseD
i
i
010
hom1
2
1
====
5. Entretanto, devido ao problema da multicolinearidade, não incluímos as duas categoria, incluímos apenas uma, no principio de que tomando o numero de categorias existentes, deveremos sempre deduzir uma. No nosso caso simples, a exclusão de uma categorias, será coberta pela outra categoria na medida em que o seus valores são exactamente o inverso da outra categoria.
6. D1 é um vector collinear a D2
7. Se a variável qualitativa tiver m categorias, use sempre m-1variáveis a incorporar no modelo.
Intercepto D1 D2 X1Homem Y1 1 1 0 234Homem Y2 1 1 0 434Mulher Y3 1 0 1 325Homem Y4 1 1 0 543Mulher Y5 1 0 1 278
Feminino
Masculino
!(#$|%$, '$ = 0) = +, + .%$
!(#$|%$, '$ = 1) = +, + +0 + .%$Y
X
+, + +0+,
ttt XDY baa ++= 21
Ord YSex (1
=Masc; 0=Feminino)
1 22 1
2 19 0
3 18 0
4 21.7 1
5 18.5 0
6 21 1
7 20.5 1
8 17 0
9 17.5 0
10 21.2 1
tt DY 21 aa +=
!(#$|%$ = 0) = )* +,-,./ 0,-121-/
!(#$|%$ = 1) = )* + )5 +,-,./ 6789:;1-/
Considere a determinação função de salários de professores segundo o género:
m = 2
09/29/2017Armando Manuel 9
Regression Statistics
Multiple R 0,93471954
R Square 0,87370062
Adjusted R Square 0,8579132
Standard Error 0,697137
Observations 10
ANOVA
df SS MS FSignificance
F
Regression 1 26,896 26,896 55,3415638 7,3397E-05
Residual 8 3,888 0,486
Total 9 30,784
CoefficientsStandard
Errort Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 18 0,31176915 57,7350269 8,994E-12 17,2810591 18,7189409 17,2810591 18,7189409
Genero/Dummy 3,28 0,44090815 7,43919107 7,3397E-05 2,26326397 4,29673603 2,26326397 4,29673603
09/29/2017Armando Manuel 10
16
17
18
19
20
21
22
23
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Predicted Salários Salários
ii DY 28.318ˆ +=
-1,5
-1
-0,5
0
0,5
1
1,5
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Residuals
Top Related