Estatística para Economia e Gestão - Resumos.net · Escreva o seu nome e número de aluno na...

15
Nome: ___________________________________________________________ Nº: _________ NOVA School of Business and Economics (b) 1 Estatística para Economia e Gestão Licenciatura em Economia e Licenciatura em Gestão NOVA School of Business and Economics Prof. Luís Catela Nunes Exame Final 1ª Época 14 de Junho de 2011 Duração: 2 horas INSTRUÇÕES Material autorizado: Caneta e este enunciado. Escreva o seu nome e número de aluno na primeira página deste enunciado. Este enunciado deve permanecer sempre agrafado. As respostas às questões devem ser escritas neste enunciado nos locais indicados. Pode utilizar o verso de cada folha como rascunho. Qualquer situação de plágio (como sejam a utilização de material não autorizado, comunicação com colegas, etc.) terá como consequência imediata a reprovação à disciplina neste semestre. Não é permitido tirar dúvidas durante o exame. Antes de iniciar o exame confirme que este enunciado tem 15 folhas numeradas de 1 a 15. Na folha 12 aparece um formulário com algumas fórmulas estatísticas. Nas folhas 13 e 14 são incluídas tabelas estatísticas que podem ser necessárias para responder a algumas das questões deste exame. Deve permanecer sentado no seu lugar até ao final do exame. A recolha final do enunciado será feita pelos vigilantes.

Transcript of Estatística para Economia e Gestão - Resumos.net · Escreva o seu nome e número de aluno na...

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 1

Estatística para Economia e Gestão Licenciatura em Economia e Licenciatura em Gestão

NOVA School of Business and Economics

Prof. Luís Catela Nunes

Exame Final – 1ª Época

14 de Junho de 2011

Duração: 2 horas

INSTRUÇÕES

Material autorizado: Caneta e este enunciado.

Escreva o seu nome e número de aluno na primeira página deste enunciado.

Este enunciado deve permanecer sempre agrafado.

As respostas às questões devem ser escritas neste enunciado nos locais indicados.

Pode utilizar o verso de cada folha como rascunho.

Qualquer situação de plágio (como sejam a utilização de material não autorizado,

comunicação com colegas, etc.) terá como consequência imediata a reprovação à disciplina

neste semestre.

Não é permitido tirar dúvidas durante o exame.

Antes de iniciar o exame confirme que este enunciado tem 15 folhas numeradas de 1 a 15.

Na folha 12 aparece um formulário com algumas fórmulas estatísticas.

Nas folhas 13 e 14 são incluídas tabelas estatísticas que podem ser necessárias para responder

a algumas das questões deste exame.

Deve permanecer sentado no seu lugar até ao final do exame.

A recolha final do enunciado será feita pelos vigilantes.

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 2

Grupo I (4 Valores)

Para cada questão indique uma só resposta na tabela que aparece na página 15

Cada resposta certa vale 1,0 valores.

Cada resposta errada vale 0,3 valores negativos (-0,3).

Cada resposta em branco ou mal assinalada vale 0 valores.

O Sr. Silva é o gerente de uma empresa de pesca de polvo e acabou de negociar com um

comprador um preço fixo de 5 mil euros por tonelada para toda a sua pesca durante o

próximo mês. Apesar do preço estar fixo, existe alguma incerteza sobre a quantidade total

que será pescada e também sobre os custos totais. Com base no seu conhecimento da

actividade pesqueira, o Sr. Silva concluiu que a quantidade total (em toneladas) que será

pescada no próximo mês pode ser descrita como uma variável aleatória que segue uma

distribuição normal com média 20 e desvio-padrão igual a 2. O Sr. Silva considera também

que no proximo mês os custos totais (em milhares de euros) são aleatórios com uma

distribuição normal com média 50 e desvio-padrão 10. A quantidade total pescada e os custos

totais estão correlacionados, com um coeficiente de correlação igual a 0,1.

Com base nesta informação, pretende-se estudar a aleatoriedade do lucro total para o

próximo mês (lucro = preço × quantidade - custos). Responda às seguintes questões

apresentando todos os cálculos intermédios e respectivas justificações.

1. Qual a probabilidade do custo total no próximo mês exceder 60 mil euros?

a. 16%

b. 36%

c. 64%

d. 84%

2. Qual o valor esperado do lucro total no próximo mês?

a. -30

b. 20

c. 50

d. 450

3. Qual a variância do lucro total no próximo mês?

a. 119

b. 180

c. 200

d. 220

4. Para que valor da correlação entre a quantidade total pescada e os custos totais seria a

variância do lucro total máxima?

a. -1

b. 0

c. 0,5

d. 1

C~N(50,102). P(C>60)=P(Z>(60-50)/10)=P(Z>1)=1-0.8413=16%

E(L)=E(5Q-C)=5E(Q)-E(C)=5 ×20 – 50 =50

V(L)=V(5Q-C)=52V(Q)+V(C)-2×5×Cov(Q,C)

=25×22+10

2-10×Corr(Q,C)×10×2=200-200×Corr(Q,C)

=200-200×0,1=200-20=180

Maximizar: V(L)=…=200-200×Corr(Q,C)

Quanto maior Corr(Q,C), menor será a V(L). Logo a resposta é o

valor mínimo que Corr(Q,C) pode tomar, que é Corr(Q,C) = -1.

Ver valor na tabela da página 13

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 3

Grupo II (7 Valores)

Responda no espaço em branco após cada uma das questões

A EDI é uma empresa de distribuição de energia eléctrica na Ilândia. Durante o ano de 2010,

a empresa desenvolveu um programa integrado de incentivo à poupança energética junto da

população de North Ilway. Foi recolhida informação sobre uma amostra de 100 famílias

escolhidas ao acaso dessa população. Para cada uma dessas famílias calculou-se a variação

do consumo de electricidade em 2010 face ao ano anterior (em kWh/dia). De seguida

apresentam-se algumas estatísticas descritivas relativas a essa variável para a amostra de 100

famílias:

Mínimo = -2,5

Máximo = 1.5

Média = -0,5

Mediana = -0,5

Desvio-Padrão = 2,0

Sabe-se ainda que dessas 100 famílias, 80 tiveram uma variação negativa do consumo de

electricidade em 2010 face ao ano anterior.

Responda às seguintes questões justificando todos os cálculos intermédios necessários.

1. Apresente um intervalo de confiança a 95% para a proporção de famílias na população de

North Ilway que reduziu o consumo de electricidade em 2010 face ao ano anterior. (2

Valores)

p = proporção de famílias na população que reduziu consumo

n=100 > 30 , pelo que se poderá usar o teorema do limite central.

100/80ˆ p =0,8.

Intervalo de confiança a 95% para p: n

ppzp

)ˆ1(ˆˆ %5,2 .

Substituindo pelos valores vem

I.C. =100

2,08,096,18,0

=

10

16,096,18,0 =

10

4,096,18,0 08,08,0

Ou seja, o I.C. vem dado por: [0,72 ; 0,88].

O habitual z2,5%

=1,96 (que também aparece na tabela da página 14)

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 4

2. Vai ser realizado um estudo semelhante noutra população. Caso se pretenda obter para

essa população um intervalo de confiança a 95% para a proporção de famílias que

reduziu o consumo com uma margem de erro máxima de 1% qual deverá ser a dimensão

mínima da amostra a considerar? (2 Valores)

Margem de erro máxima é obtida quando p=0,5,ou seja, M.E. máxima =

n

5,05,096,1

.

Pretende-se:

M.E. máxima = 0,01

n

5,05,096,1

=0,01

n

5,096,1 =0,01

0,01

5,096,1 = n

5096,1 = n

Cálculos aproximados:

502 = n

n=1002

n=10000

Cálculos exactos:

98= n

n=9604

A dimensão mínima da amostra a considerar é de 9604 observações

(aproximadamente 10000 observações).

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 5

3. Pretende-se verificar se em média as famílias da população de North Ilway reduziram em

mais de 0,3 kWh/dia o seu consumo de electricidade em 2010 face ao ano anterior. Teste

esta hipótese do ponto de vista estatístico. Seja claro quanto a: (i) hipóteses nula e

alternativa, (ii) estatística de teste e sua distribuição, (iii) nível de significância a utilizar,

(iv) valor crítico, (v) regra de decisão e (vi) conclusão final. (2 Valores)

Seja X = variação do consumo de uma família escolhida ao acaso em North

Ilway.

Seja E(X) = e Var(X) = 2.

(i) H0: -0,3 , H1: < -0,3 ,

(ii) Dado que a variância 2 tem que ser estimada, utiliza-se a estatística

nS

Xt

)3,0( .

Dado que a dimensão amostral n=100 é suficientemente grande, pode-se aplicar

o teorema do limite central, e a estatística t tem uma distribuição

aproximadamente normal com média 0 e variância 1 sob a hipótese nula.

(iii) Escolho o habitual nível de significância de 5%.

(iv) Tendo em conta a hipótese alternativa ( < -0,3), o valor crítico é dado por

-1,645 que é o valor que deixa 5% na aba esquerda da distribuição da N(0,1).

(v) A regra de decisão consiste em rejeitar H0 se t < -1,645.

(vi) A estatística de teste vem: 1002

)3,0(5,0 t =

2,0

2,0= -1.

Como t > -1,645, não se rejeita a hipótese nula.

Logo, para um nível de significância de 5%, não existe evidência suficiente

para se dizer que em média as famílias da população de North Ilway reduziram

o seu consumo em mais de 0,3 kWh/dia.

O valor 1,645 aparece na tabela da página 14, ou aproximado na página 13

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 6

4. Utilizando a mesma amostra de 100 famílias de North Ilway, um colega apresentou o

seguinte intervalo de confiança para a variação média do consumo de electricidade na

população: [-0,6 ; -0,4]. Qual o grau de confiança utilizado na construção deste intervalo?

(1 Valor)

I.C. proposto = -0,5 ± 0,1 = 1,0x

Logo o margem de erro é de 0,1 pelo que:

M.E.=0,1

1,0100

22 z (Dado que a dimensão amostral n=100 é suficientemente

grande, pode-se aplicar o teorema do limite central e utilizar

2z )

2

1001,02 z

5,02 z

)6915,01(2

=0.3185

60%.

Logo o grau de confiança do intervalo proposto = (1 - ) 40%.

O valor 0,6915 aparece na tabela da página 13

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 7

Grupo III (7 Valores)

Para cada questão indique uma só resposta na tabela que aparece na página 15

Cada resposta certa vale 1,0 valores.

Cada resposta errada vale 0,3 valores negativos (-0,3).

Cada resposta em branco ou mal assinalada vale 0 valores.

Suponha que trabalha para uma empresa de consultoria e que lhe foi pedido para realizar um

estudo sobre os salários na empresa IQPlus. Esta empresa a operar em Portugal é uma

subsidiária de uma multinacional espanhola. Os actuais trabalhadores da empresa têm

nacionalidade portuguesa ou espanhola. No entanto, a maioria dos empregados com mais

anos de experiência são espanhóis porque há cerca de 10 a 15 anos atrás, a empresa contratou

maioritariamente no mercado de emprego espanhol para preencher os seus quadros nessa

altura. Recentemente, a IQPlus perdeu um grande número de trabalhadores para os seus

concorrentes, e a administração da empresa quer determinar se os salários são uma das razões

pelas quais os empregados estão a deixar a empresa.

Para realizar este estudo, foram recolhidas informações salariais e outras variáveis

relacionadas a partir de uma amostra aleatória de 110 trabalhadores na IQPlus. Também foi

recolhida informação sobre a nacionalidade desses trabalhadores, a nota obtida no teste de

aptidões realizado no momento da admissão de cada um, e ainda informação sobre se cada

trabalhador tem ou não um grau de mestrado. Finalmente, existe ainda informação sobre os

anos de experiência de cada um dos trabalhadores na IQPlus.

Para estimar um modelo de regressão linear com base nos dados disponíveis para cada

trabalhador foram então consideradas as seguintes variáveis explicativas:

PT: uma variável dummy que tem um valor de "1" se a nacionalidade do empregado

for portuguesa e um valor de "0" se a nacionalidade do funcionário for espanhola.

NOTA: a nota obtida no teste de aptidão do trabalhador (a classificação vai do

mínimo de aptidão de 0 a um máximo de aptidão de 4).

MESTRADO: uma variável dummy que tem um valor de "1" se o empregado tem um

mestrado e um valor de "0" se o trabalhador só tem um curso de licenciatura.

EXPER: o número de anos do empregado na IQPLus.

Estas variáveis foram escolhidas para a sua análise por vários motivos. Em primeiro lugar,

porque se pretendem prever os salários na IQPlus com base nalguma medida de experiência

(capturada pelo número de anos na empresa) e no talento intelectual inato para o trabalho

(capturado pela nota do teste de aptidões e pela variável dummy para o mestrado). Além

disso, pretende-se testar a hipótese de que os empregados portugueses podem estar a receber

um salário inferior aos seus colegas espanhóis.

De seguida, apresenta-se o resultado obtido através do Excel da estimação de um modelo de

regressão linear em que o salário anual de cada trabalhador (em euros) é a variável

dependente. Deve responder às diversas questões que são apresentadas a seguir.

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 8

Regression Statistics Multiple R 0.938506 R Square 0.880794 Adjusted R

Square 0.876253 Standard Error 5775.951 Observations 110

ANOVA

df SS MS F Significance

F Regression 4 2.59E+10 6.47E+09 193.9574 1.51E-47 Residual 105 3.5E+09 33361607

Total 109 2.94E+10

Coefficients Standard

Error t Stat P-value

Intercept 2543.674 4014.276 0.633657 0.527683

PT -1804.88 1757.195 -1.02714 0.306715

NOTA 19232.81 1064.995 18.05906 5.56E-34

MESTRADO 10001.8 1199.531 8.338092 3.16E-13

EXPER 1962.386 183.2202 10.71054 1.56E-18

1. Existe evidência estatística suficiente para se dizer que para toda a empresa IQPlus os

trabalhadores portugueses ganham em média menos que os trabalhadores espanhóis com

as mesmas características?

a) Sim, porque o coeficiente estimado da variável PT é negativo.

b) Não, porque o coeficiente estimado da variável PT não é significativamente

diferente de zero.

c) Não, porque o coeficiente estimado da variável PT é significativamente diferente

de zero.

d) Sim, porque o coeficiente estimado da variável PT não é significativamente

diferente de zero.

2. Com base na descrição que foi feita sobre a empresa IQPlus, qual das seguintes afirmações

é mais plausível caso fosse estimada uma regressão linear simples em que a única variável

explicativa era a variável PT?

a) A estimativa do coeficiente da variável PT na regressão simples não deveria diferir

da estimativa obtida na regressão múltipla, ou seja, não deveria diferir de -1804.88.

b) A estimativa do coeficiente da variável PT na regressão simples seria menos

negativa.

c) A estimativa do coeficiente da variável PT na regressão simples seria ainda

mais negativa.

“Explicação: Os trabalhadores portugueses têm menos experiência e como tal

um salário em média inferior (notas: (i) na regr.múltipla é medido o efeito

ceteris paribus, (ii) na regressão simples é omitida a variável experiência.”

d) A estimativa do coeficiente da variável PT na regressão simples seria positiva.

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 9

3. Quais os factores que parecem explicar o salário, considerando um nível de significância

de 5%?

a) PT

b) NOTA

c) NOTA, MESTRADO, EXPER “são as variáveis que têm p-values < 5%”

d) PT, NOTA, MESTRADO, EXPER

4. A administração da IQPlus pensa que o salário anual deve crescer em média 2000 euros

por cada ano adicional de experiência de um trabalhador na empresa. O que é que os

resultados permitem concluir?

a) A um nível de significância de 5%, os resultados não rejeitam essa hipótese.

“Fazendo um teste da H0 de que o coeficiente da variável EXPER é igual a 2000,

dá uma estatística t=(1962-2000)/183-0,2 pelo que não se rejeita H0.”

b) A um nível de significância de 5%, os resultados rejeitam essa hipótese.

c) Não existe informação suficiente para testar essa hipótese.

d) Os resultados permitem rejeitar essa hipótese porque o coeficiente estimado é

inferior a 2000.

5. O intervalo de confiança a 95% para o impacto médio no salário anual por se ter um

mestrado, ceteris paribus, é dado por:

a) [ -6 , 20006]

b) [1200 , 10002]

c) [7623 , 12380] “IC = 10002±1,96×1200”

d) [8802 , 11202]

6. Se o acréscimo no salário devido ao factor mestrado depender dos anos de experiência na

empresa, qual a variável adicional que deve ser incluida no modelo? E qual o sinal

esperado para o seu coeficiente estimado se o impacto de se ter um mestrado for superior

para os trabalhadores menos experientes?

a) EXPER ao quadrado com sinal positivo,

b) EXPER ao quadrado com sinal negativo,

c) EXPER × MESTRADO com sinal positivo,

d) EXPER × MESTRADO com sinal negativo. “efeito estimado de se ter

mestrado=bMESTRADO + bEXPER×MESTRADO×EXPER._Se quanto maior a

experiência menor o efeito do mestrado deve-se ter bEXPER×MESTRADO < 0.

7. Se adicionarmos mais uma variável explicativa ao modelo e o re-estimarmos com essa

variável incluída, como se altera o R2?

a) O R2 da nova regressão estimada não será inferior ao acima apresentado nos

resultados para o modelo.

b) O R2 da nova regressão estimada não será superior ao acima apresentado nos

resultados para o modelo.

c) O R2 da nova regressão estimada será superior caso a nova variável seja

significativa.

d) O R2 da nova regressão estimada será superior caso a estatística t da nova variável

seja superior a 1.

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 10

GRUPO IV (2 Valores)

Responda no espaço em branco após a questão

Suponha que uma variável y é causada por uma variável x de acordo com o seguinte modelo

de regressão linear:

iii xy 10 (A)

em que 01 e as hipóteses habituais do modelo de regressão linear estão verificadas. No

entanto, a variável yi foi medida com alguns erros. Em particular, as observações desta

variável são iguais ao valor real mais um termo aleatório ui. Este termo aleatório é

independente de todas as outras variáveis aleatórias do modelo e tem uma distribuição

normal com média igual a 10 e desvio-padrão igual a 20. Quais os valores esperados dos

estimadores de mínimos quadrados de 0 e de 1 quando se utilizam os dados para a

variável yi com esses erros de medição? Pode calcular os valores esperados condicionais nos

valores observados da variável x. Apresente todos os cálculos necessários.

O modelo real é dado por iii xy 10 .

Com erros de medição, os valores observados para yi são dados por

ii

obs

i uyy em que ui ~N(10, 202).

Quando se utilizam os valores observados de yi com erros de medição (ou seja obs

iy em vez de iy ) no estimador de mínimos quadrados de b1, este vem:

n

i i

n

i

obsobs

ii xxyyxxb1

2

11 )(/))(( .

O numerador de b1 pode-se simplificar:

n

i

obs

i

n

i

obs

ii

n

i

obsobs

ii yxxyxxyyxx111

)()())((

n

i i

obsn

i

obs

ii xxyyxx11

)()(

n

i

obs

ii yxx1

)( (porque

n

i i xx1

)( =0).

Calculando o valor esperado de b1 vem:

n

i i

n

i

obs

ii xxyxxEbE1

2

11 )(/)()(

n

i i

n

i iii xxuyxxE1

2

1)(/))((

n

i i

n

i ii

n

i i

n

i ii xxuxxExxyxxE1

2

11

2

1)(/)()(/)(

n

i i

n

i ii xxuxxE1

2

11 )(/)( (porque

n

i i

n

i ii xxyxx1

2

1)(/)( corresponde

ao habitual estimador sem erros de medição que sabemos

ser centrado).

n

i i

n

i ii xxuExx1

2

11 )(/)()(

n

i i

n

i i xxxx1

2

11 )(/10)(

n

i i

n

i i xxxx1

2

11 )(/)(10

1

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 11

Calculando o valor esperado de b0 vem:

xbuyExbyEbE obs

110 )(

uExbyE 1

100 . (porque xby 1 coorresponde ao habitual estimador

sem erros de medição que sabemos ser centrado).

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 12

SOME USEFUL FORMULAS

Difference Between Population Means or Proportions (Independent Samples)

Parameter Assumption Confidence Interval Endpoints

X Y 2( , )X XN

2( , )Y YN 2 2, knownX Y

2 2

/ 2X Y

x y

x y zn n

X Y 2( , )X XN 2( , )Y YN

2 2 unknownX Y

2 2

2, / 2x y

p p

n n

x y

s sx y t

n n

2 2

2( 1) ( 1)

2

x x y y

p

x y

n s n ss

n n

X Y 2( , )X XN

2( , )Y YN 2 2, unknownX Y

22

, / 2

yxv

x y

ssx y t

n n

2 222 22 2

/( 1) /( 1)y yx x

x y

x y x y

s ss sv n n

n n n n

X Y Large samples 2 2, unknownX Y

22

/ 2

yx

x y

ssx y z

n n

X Yp p

Large samples

Bernoulli Xp

Bernoulli Yp

/ 2

ˆ ˆ(1 )ˆ ˆ(1 )ˆ ˆ

y yx xx y

x y

p pp pp p z

n n

Note: The first two intervals in the table are exact. The other three intervals are approximations.

Multiple Linear Regression: i 0 1 1i 2 2i k ki iy β β x β x β x ε

Total S.Sq.=SST= 2

i(y y) , Regression S.Sq.=SSR= 2

iˆ(y y) , Error S.Sq.=SSE=

2

i iˆ(y y )

2R SSR/SST and 2 SSE / (n K 1)

R 1SST / (n 1)

Var( iε ) = 2 is estimated as

n2 2

e ii=1s e /(n k 1)

Confidence interval for jβ : jj n k 1,α/2 bb t s

Test for H0: 1 2 kβ β β 0 is SSR/k

F = SSE/(n-k-1)

~ Fk,n-k-1 under H0

Simple Linear Regression: i 0 1 1i iy β β x ε

0 1b y b x and n n 2

1 i 1 i 1b (x x)(y y) / (x x)i i i

n2 2

1 ii 1Var(b ) σ / (x x)

is estimated as

1

n2 2 2

b e ii 1s s / (x x)

Prediction interval for2

n+1n+1 0 1 n+1 n-2, /2 e 2

i

(x x)1y : b b x t s 1

n (x x)

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 13

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 14

Nome: ___________________________________________________________ Nº: _________

NOVA School of Business and Economics (b) 15

Respostas às Questões dos Grupos I e III

Assinale as suas respostas com um X

Resposta

Questão a b c d

I.1 X

I.2 X

I.3 X

I.4 X

III.1 X

III.2 X

III.3 X

III.4 X

III.5 X

III.6 X

III.7 X