Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e...

12
Estatística para Economia e Gestão 1º Semestre 09/10 1 Caderno de Exercício 3 Ensaios de Hipóteses e Regressão Linear 1. Exercícios Aulas 1. Exercício 10.11 do livro “Statistics for Economics and Business” 2. Exercício 10.27 do livro “Statistics for Economics and Business” 3. Exercício 10.30 do livro “Statistics for Economics and Business” 4. Exercício 10.52 do livro “Statistics for Economics and Business” 5. Exercício 11.22 do livro “Statistics for Economics and Business” 6. Exercício 12.2 a) do livro “Statistics for Economics and Business” 7. Exercício 12.20 do livro “Statistics for Economics and Business” 8. Exercício 12.35 do livro “Statistics for Economics and Business” 9. Exercício 12.74 do livro “Statistics for Economics and Business” 10. Exercício 13.53 do livro “Statistics for Economics and Business” 11. Exercício 13.44 do livro “Statistics for Economics and Business” estatística F 2. Exercícios Aplicação 1. O CAMPIC é o modelo mais vendido de um dado fabricante automóvel. O valor médio das emissões gases poluentes destes carros é de 50 unidades. O fabricante comprometeu-se a reduzir em 1 unidade por ano as emissões dos carros por si fabricados. Passados que estão 3 anos, o valor médio das emissões deveria ser igual a 47. No entanto, um grupo ecologista desconfia que o valor médio das emissões poderá ser superior a 47. Com base no resultado das emissões de uma amostra aleatória de 30 automóveis novos do modelo CAMPIC, pretende-se testar se de facto as suspeitas do grupo ecologista são fundadas. Suponha que a média amostral dos 30 automóveis for de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um nível de significância de 5%. b. Qual a conclusão do teste? c. Qual o P-value do teste?

Transcript of Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e...

Page 1: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

1

Caderno de Exercício 3 Ensaios de Hipóteses e Regressão Linear

1. Exercícios Aulas

1. Exercício 10.11 do livro “Statistics for Economics and Business”

2. Exercício 10.27 do livro “Statistics for Economics and Business”

3. Exercício 10.30 do livro “Statistics for Economics and Business”

4. Exercício 10.52 do livro “Statistics for Economics and Business”

5. Exercício 11.22 do livro “Statistics for Economics and Business”

6. Exercício 12.2 a) do livro “Statistics for Economics and Business”

7. Exercício 12.20 do livro “Statistics for Economics and Business”

8. Exercício 12.35 do livro “Statistics for Economics and Business”

9. Exercício 12.74 do livro “Statistics for Economics and Business”

10. Exercício 13.53 do livro “Statistics for Economics and Business”

11. Exercício 13.44 do livro “Statistics for Economics and Business” – estatística F

2. Exercícios Aplicação

1. O CAMPIC é o modelo mais vendido de um dado fabricante automóvel. O valor médio

das emissões gases poluentes destes carros é de 50 unidades. O fabricante

comprometeu-se a reduzir em 1 unidade por ano as emissões dos carros por si

fabricados. Passados que estão 3 anos, o valor médio das emissões deveria ser igual a

47. No entanto, um grupo ecologista desconfia que o valor médio das emissões poderá

ser superior a 47. Com base no resultado das emissões de uma amostra aleatória de 30

automóveis novos do modelo CAMPIC, pretende-se testar se de facto as suspeitas do

grupo ecologista são fundadas. Suponha que a média amostral dos 30 automóveis for

de 47,6 e o desvio-padrão de 2,5.

a. Defina a região crítica para efectuar o teste a um nível de significância de 5%.

b. Qual a conclusão do teste?

c. Qual o P-value do teste?

Page 2: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

2

d. Para que níveis de significância teria a conclusão do teste sido diferente?

2. Suponha o ensaio de hipóteses simples contra simples em populações normais:

𝐻0: 𝜇 = 300

𝐻1: 𝜇 = 350

A variância é de 𝜎2 = 2500; as duas situações são igualmente prováveis. Seja a regra

de decisão seguinte: se 𝑋4 > 310 decido que estou em 𝐻1; se 𝑋4

≤ 310 decido que

esotu em 𝐻0.

a. Calcule a probabilidade de tomar uma decisão errada.

b. Sabendo que tomou uma decisão errada, qual a probabilidade que a hipótese

verdadeira fosse 𝐻0? Sem fazer cálculos diga qual a probabilidade que a

hipótese verdadeira fosse 𝐻1.

c. Suponha agora que em vez de n=4 dispõe de n=9 mas mantém a mesma regra

de decisão em 310. Verifique que a probabilidade de tomar uma decisão

errada diminui.

d. Sabendo de novo que tomou uma decisão errada, qual a probabilidade que a

hipótese verdadeira fosse 𝐻0? Sem fazer cálculos diga qual a probabilidade

que a hipótese verdadeira fosse 𝐻1.

e. Porque razão as duas probabilidades em d) não diminuem também tal como

aconteceu com a probabilidade de uma decisão errada, ou seja de a) para c)?

f. Supondo que o ensaio é 𝐻0: 𝜇 = 300 contra 𝐻0: 𝜇 > 350, n=4 e a regra de

decisão sendo a mesma, calcule a potência do teste para 𝜇 = 290. O facto de

este valor ser tão baixo preocupa-o?

3. Foi estimado o seguinte modelo: xbby 10ˆ

com n = 51,

n

i

ii yyxx1

))(( = 2000, SSE = 500, 2

ys = 100.

a. Determine o 2R e interprete o resultado.

b. Demonstre que 22 rR .

c. Calcule a variação estimada de y se aumentar x em uma unidade.

3. Exercícios Extra

1. Uma fábrica de memórias de computador detém uma máquina de impressão de

circuitos integrados. Quando a máquina foi comprada a proporção de circuitos

impressos com defeito era apenas de p=1%. No entanto, após um ano de operação, os

responsáveis da fábrica estão preocupados com a possibilidade de, devido ao desgaste

da máquina, o valor de p ser neste momento superior ao inicial. Deste modo, irão ser

analisados n=100 circuitos para determinar a proporção destes com defeito.

Page 3: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

3

a. Proponha um teste estatístico com um nível de significância de 1% para

resolver este problema. Indique as hipóteses nula e alternativa, a estatística de

teste e a região crítica.

b. Suponha que dos 100 circuitos analisados foram detectados apenas 2 circuitos

defeituosos. Qual a conclusão do teste proposto? Quantos circuitos

defeituosos deveria encontrar nos 100 analisados para concluir exactamente o

oposto?

c. Qual a probabilidade de ocorrer um erro do tipo II para o teste proposto na

questão 1 se o valor de p for de 2%?

2. Suponha que o tempo em minutos que uma pizza leva a ser cozinhada num forno de

um restaurante segue uma distribuição normal com média 𝜇1 e desvio-padrão 𝜎1 = 2.

Para uma amostra aleatória de 16 pizzas obteve-se um tempo médio de cozedura de

15 minutos.

a. Obtenha um intervalo de confiança a 99% para 𝜇1.

b. Suponha que a loja tem também outro forno a funcionar, mas com outra

tecnologia, em que o tempo de cozedura segue uma distribuição normal com

média 𝜇2 e desvio-padrão 𝜎2. Para uma amostra aleatória de 9 pizzas

conzinhadas neste forno, o tempo médio obtido foi inferior em 3 minutos (ou

seja 12 minutos).

i. Suponha que os desvios-padrão dos dois fornos são iguais, será que se

pode afirmar que este forno é, em média, mais rápido? (Recorra a um

teste de hipóteses com um nível de significância de 1%).

ii. Se este forno for de facto 3 minutos mais rápido, qual a probabilidade

do teste utilizado na alínea ii) dar uma resposta correcta?

3. Admita agora que se quer comparar a “performance” de dois jogadores de ténis, o

João e o José, jogando ténis com outros jogadores, do seguinte modo: fizeram-se duas

amostras e na primeira de 100 jogos o José ganhou 50 e na segunda amostra de outros

100 jogos o João ganhou 60.

a. Estabeleça um intervalo de confiança a 90% para a diferença das verdadeiras

proporções de vitórias dos dois jogadores. Comente.

b. Teste a um nível de significância de 5% se o João é melhor jogador que o José.

Justifique.

c. Que erro pode estar associado à decisão que tomou em b)? Determine o seu

valor. Se necessitar utilize o valor alternativo para 𝑝1 − 𝑝2 = −0,2.

4. O director de produção de determinada empresa está empenhado em reduzir a

proporção de peças defeituosas resultantes do actual processo produtivo. Para

analisar o problema recolher uma amostra de 80 peças e verificou que 10 eram

defeituosas. Decidiu então substituir algumas máquinas após o que obteve uma nova

amostra, agora de 150 peças, em que 12 apresentavam defeito.

a. Construa um intervalo de confiança a 90% para a verdadeira proporção de

peças defeituosas antes da substituição das máquinas. Interprete o resultado.

Page 4: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

4

b. Usando um nível de significância de 10%, teste se a qualidade do processo

produtivo melhorou. Justifique a resposta.

c. Que erro pode estar associado à decisão da alínea anterior? Determine o seu

valor considerando, se necessário, que a verdadeira proporção de peças

defeituosas diminuiu 2%. Interprete o resultado e ilustre graficamente.

5. Considere uma população normal com variância igual a 625 da qual se retirou uma

amostra de 100 elementos para, com um nível de significância de 5%, se realizar o

seguinte teste de hipóteses:

𝐻0: 𝜇 = 100

𝐻1: 𝜇 < 100

a. Para que valores da média amostral não rejeitamos a hipótese nula?

b. Sabendo que a potência do ensaio foi de 0,8 que valor foi considerado para a

hipótese alternativa?

c. Qual teria de ser a dimensão da amostra para que a hipótese nula fosse

rejeitada quando a média amostral é menor que 98?

6. O laboratório de uma empresa farmacêutica pretende investigar o efeito de

determinado tipo de medicamento. Para tal, realizou um teste a um grupo de 26

indivíduos, escolhidos aleatoriamente, sendo os resultados obtidos para o tempo de

reacção ao medicamento os seguintes:

𝑥𝑖

26

𝑖=1

= 81,9

𝑥𝑖 − 𝑥 2

26

𝑖=1

= 15

Admita que, para a população da qual o grupo de indivíduos foi extraído, o tempo de reacção

tem uma distribuição normal.

a. Apresente uma estimativa pontual para o tempo médio de reacção ao referido

medicamento.

b. Determine o intervalo de confiança a 95% para o tempo médio de reacção ao

referido medicamento.

c. O responsável pelo laboratório afirma que o tempo médio de reacção ao dito

medicamento é superior ou igual a 3,5 segundos.

i. Teste esta afirmação para um nível de significância de 𝛼 = 5%.

ii. Calcule o P-value do teste.

iii. Qual a probabilidade de ocorrer um erro do tipo II, se o valor de

tempo médio de reacção for de 3,0 segundos.

d. Uma nova empresa farmacêutica sugere um medicamento alternativo e afirma

que os resultados apresentados por este foram melhores, isto é, o tempo

médio de reacção é menor. Os resultados obtidos usando o medicamento

alternativo, para um grupo de 36 indivíduos foram: 𝑥 = 2,85 segundos e

𝑆2 = 0,58. Concorda com a afirmação da nova empresa (use o nível de

significância sugerido anteriormente e assuma igualdade de variâncias)?

Page 5: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

5

7. Numa sondagem efectuada recentemente sobre audiências de televisão, foram

entrevistados 200 telespectadores da região Norte e 250 telespectadores da região

Sul. Dos 250 telespectadores da região Sul entrevistados, 75 responderam que vêem o

programa “Small Sister” do canal TVD (TV Dependente). De acordo com os resultados

obtidos, foi também proposto o seguinte intervalo de confiança para a percentagem

de telespectadores da região Norte que vêem o referido programa: 0.343; 0.457 .

a. Num artigo publicado na mesma semana, a revista TVZ afirma que a

percentagem de telespectadores da região Sul que vê o referido programa é

superior a 25%.

i. Teste esta afirmação para um nível de significância de 5%.

ii. Que erro poderá estar associado à decisão tomada na alínea anterior?

Determine a probabilidade de ocorrer esse erro.

iii. Calcule a potência do teste, se a verdadeira percentagem de

telespectadores da região Sul que vêem o programa for de 35%.

8. Face a uma alteração na regulamentação sobre a emissão de ruídos, um fabricante de

automóveis esta a estudar um novo motor que poderá vir a ser utilizado no seu

principal modelo de automóvel. Suponha que devido à variabilidade na produção, o

nível de ruídos, com um destes novos motores escolhido ao acaso, é uma variável

aleatória X com distribuição normal com média µ e desvio-padrão igual a 4. Pretende-

se que para este novo motor o nível de ruídos seja em média igual a 20. Para verificar

esta hipótese irá ser analisado o resultado obtido com 16 destes novos motores

escolhidos ao acaso. O teste proposto é o seguinte: 18 < 𝑋 < 22 não se rejeita

𝐻0: 𝜇 = 20.

a. Determine o nível de significância do teste.

b. Calcule a probabilidade de não se rejeitar 𝐻0 se o verdadeiro valor de µ for 17.

9. Uma máquina de ensacar farinha está regulada para encher sacos com 20 kg. Para

controlar o seu funcionamento escolheram-se, ao acaso, 15 sacos da produção de

determinado período, tendo-se obtido um peso médio de 20,33 kg e um desvio-

padrão de 0,48 kg.

Admitindo que os pesos são normalmente distribuídos:

a. Verifique se, para um nível de significância de 5%, será correcto concluir que a

máquina está bem regulada.

b. Calcule o P-value do teste efectuado na alínea anterior.

10. A PERFAL, empresa de produção de perfis de alumínio, sabe que o comprimento de

cada perfil é uma variável aleatória normal com desvio padrão igual a 10 cm. O

responsável da qualidade afirma que está a haver um desperdício de material, isto é, o

comprimento médio dos perfis produzidos é superior a 300 cm. Para avaliar esta

hipótese foram medidos 9 perfis de alumínio, tendo-se obtido um comprimento médio

igual a 306 cm.

a. Usando um nível de significância de 5%, teste a afirmação do responsável da

qualidade.

b. Calcule o P-value do teste efectuado na alínea anterior.

Page 6: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

6

c. Supondo que o verdadeiro comprimento médio dos perfis é 304, calcule a

probabilidade de ocorrer um erro do tipo II.

d. Posteriormente foi instalada uma nova linha de produção de perfis com um

novo sistema de corte, da qual foram recolhidos 10 perfis tendo-se obtido um

comprimento médio igual a 311 cm. Assumindo que, o comprimento dos perfis

produzidos nesta linha é uma variável aleatória normal com desvio padrão 12

cm, teste a hipótese do comprimento médio dos perfis produzidos na nova

linha ser igual ao comprimento médio dos perfis produzidos na linha antiga.

11. O Director da revista “KARAS” está interessado em estudar o comportamento dos

leitores da mesma. Para tal, decidiu observar o tempo de leitura (em minutos) de 16

leitores seleccionados aleatoriamente, donde resultou um tempo médio de leitura

igual a 90 minutos. Admita que o tempo de leitura da revista “KARAS” é normalmente

distribuído com desvio padrão 15 minutos.

a. Determine um intervalo de confiança para o tempo médio de leitura da revista

“KARAS” com uma margem de erro (semi amplitude do intervalo de confiança)

de 6,16875. Qual a percentagem de intervalos de confiança que não contêm o

verdadeiro valor do tempo médio?

b. Teste, a um nível de significância de 5%, a hipótese de o tempo médio de

leitura ser igual a 100 contra a hipótese alternativa de ser inferior; calcule o P-

value do teste.

c. Supondo que o verdadeiro tempo médio de leitura é igual a 95 minutos,

calcule a probabilidade de não rejeitar a hipótese nula (definida na alínea

anterior). Que erro está associado a esta decisão?

d. O Director da revista “KARAS” desconfia que o tempo médio de leitura da

revista “VIP7” é superior ao da revista “KARAS”. Suponha que foram

observados os tempos de leitura em 18 leitores da revista “VIP7”,

seleccionados aleatoriamente, tendo-se obtido um tempo médio igual a 98,5

minutos. Admita que o tempo de leitura da nova revista (“VIP7”) é

normalmente distribuído com desvio padrão 12 minutos. O que pode dizer

acerca da desconfiança do Director da Revista “KARAS”? (Use um nível de

significância de 5%).

12. A temperatura da água de um tanque de crustáceos é uma variável aleatória com

distribuição Normal. Testes de controlo da temperatura da água são feitos

regularmente. Foi recolhida uma amostra aleatória com 15 observações da

temperatura da água do tanque e obteve-se uma média amostral 4 graus e um desvio-

padrão amostral igual a 1.10 graus. Posteriormente o tanque foi substituído por um

novo. A temperatura da água neste novo tanque é também uma variável com

distribuição Normal, com variância igual à do tanque antigo. Os responsáveis pela

manutenção do tanque começaram a desconfiar de que este novo tanque leva a uma

temperatura média da água mais alta. Foi recolhida uma amostra da temperatura da

água no novo tanque com 17 observações, tendo-se obtido uma média amostral de

4.8 graus e um desvio-padrão amostral de 1.05 graus. Teste se a temperatura média

Page 7: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

7

da água aumentou com a introdução do novo tanque, com base nas duas amostras

recolhidas (=5%).

13. Numa reunião do conselho de administração da empresa, o responsável pela

manutenção do tanque disse que para controlar a temperatura será recolhida uma

amostra aleatória de dimensão 30 e que será testada a hipótese nula de a variância da

temperatura da água ser igual a 1 contra a alternativa de ser inferior a 1. Sendo a

temperatura da água uma variável aleatória com distribuição Normal, a hipótese nula

será rejeitada quando a variância amostral (S2) for inferior a 0.682. Qual o nível de

significância do teste referido?

14. Considere o seguinte output de uma análise de regressão que estima o efeito de se ser

mulher na dimensão das propriedades rurais no Malawi. A variável “mulher” é igual a

1 se a pessoa inquirida for mulher e igual a 0 em caso contrário.

Regression Statistics

R Square 0.002

Observations 3,167

Coefficients St. Error t Stat P-value Lower 95%

Upper 95%

Women -4.302 1.970 -2.180 0.029 -8.164 -0.440

Intercept 8.378 1.460 5.40 0.000 5.516 11.240

a. Qual a dimensão prevista para uma propriedade detida por um homem? E detida por

uma mulher?

b. Encontre um intervalo de confiança a 95% para o efeito de se ser mulher na dimensão

das propriedades rurais no Malawi.

c. Será o efeito encontrado na alínea anterior significativamente diferente de zero, para

=5%?

15. Foi estimado o seguinte modelo xbby 10ˆ e obteve-se o intervalo de previsão para

uma observação de y: 14.8; 20.8 para 𝑥 = 29. Sabe-se ainda que 𝑥 = 25,5 e 𝑦 = 16.

a. Calcule o 𝑏0 e 𝑏1 e interprete os resultados.

b. Sabendo que 𝑠𝑥𝑦 = 2880 e 𝑠𝑦2 = 4000, calcule o coeficiente de correlação

entre 𝑥 e 𝑦.

c. Diga, explicitando todos os passos, como obteria os estimadores dos mínimos

quadrados, isto é, 𝑏0 e 𝑏1. (Não é necessário efectuar cálculos)

d. Mostre que 𝑥𝑖−𝑥 𝑌𝑖−𝑌 𝑛

𝑖=1

𝑥𝑖−𝑥 2𝑛𝑖=1

= 𝑥𝑖−𝑥 𝑌𝑖

𝑛𝑖=1

𝑥𝑖−𝑥 2𝑛𝑖=1

.

16. Foi estimada a seguinte regressão com base em 22 observações: wbbc 10 em que

c representa as despesas em consumo e w é o salário. Sabe-se que 934.02 R , SST =

1133.77, 36.6ws . Sabe-se também que o intervalo de previsão para c quando w =

31 é dado por [44.391;51.309].

a. Interprete o coeficiente de determinação.

Page 8: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

8

b. Calcule o coeficiente de correlação amostral entre c e w.

c. Calcule 0be 1b .

d. Calcule um intervalo de confiança a 95 por cento para 1 , isto é, o verdadeiro

valor do coeficiente associado a w.

e. Sabendo que 4.79222

1

i

iw , qual o nível de confiança implícito no intervalo

de previsão dado no enunciado?

17. Considere-se uma amostra de 25 alunos da FEUNL. Cada aluno foi inquirido acerca da

sua satisfação da qualidade das aulas (x) de 1 a 10. Adicionalmente, recolheu-se

informação relativa ao número de aulas que cada um desses alunos faltou no semestre

passado (y). Foi estimado o seguinte modelo: ö 12.6 1.2i iy x

com x = 6, 25

2

1

( )i

i

x x

= 130, SSE = 80.6.

a. Interprete o coeficiente associado à variável x (satisfação relativa à qualidade

das aulas).

b. Teste a hipótese nula de que a satisfação relativa à qualidade não tem efeito

linear sobre o absentismo contra a alternativa de ter um impacto negativo

com um nível de significância de 5%.

c. Um determinado aluno tem um nível de satisfação relativa à qualidade das

aulas igual a 4. Determine um intervalo a 90% para o número de aulas que

este aluno estará ausente num semestre.

18. Uma instituição internacional publicou um estudo sobre a esperança média de vida

num grupo heterogéneo de países. Para tal, recolheu uma amostra de 40 países e

estimou a seguinte regressão

yi 69,98 0,00022x1i 0,11654x2i

onde yi é a esperança media de vida (em anos), x1i representa o PIB per capita (em dólares) e

x2i o número de médicos por mil habitantes. Sabe-se ainda que se=3,5, sb1=0,0000353 e que o

coeficiente de determinação é 0,61.

a. Interprete o sinal do coeficiente associado ao PIB per capita (x1i).

b. Suponha dois países com o mesmo PIB per capital. Qual será a diferença estimada na

esperança media de vida quando o país A tem mais 2 médicos por mil habitantes do

que o país B?

Foram fornecidos ainda os seguintes resultados:

ANOVA

df SS MS F

Regression A 710,5361315 355,2680658 C

Residual 37 B 12,25609757

Total 39 1164,011742

c. Complete a tabela calculando A,B e C. O que pode concluir quanto à significância

global do modelo?

Page 9: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

9

d. Explique detalhadamente como procederia se quisesse avaliar o impacto de ser

mulher versus de ser homem na esperança média de vida.

e. Comente a veracidade da seguinte afirmação: O coeficiente de determinação pode ser

menor do que o coeficiente de determinação ajustado.”

19. Com base numa amostra de 100 famílias seleccionadas aleatoriamente em todo o país

foram recolhidas várias informações tendo em vista o estudo das despesas em saúde

das famílias portuguesas. Assim, para cada família, obtiveram-se dados para as

seguintes variáveis:

Y – Despesas mensais em saúde (em euros),

X1 – Rendimento anual (em centenas de euros),

X2 – Número de filhos,

X3 – Igual a 1 se a família vive num centro urbano, e igual a 0 se não.

Utilizando estes dados estimou-se a seguinte regressão

𝑌𝑡 = 𝛽0 + 𝛽1𝑥1𝑡 + 𝛽2𝑥2𝑡 + 𝛽3𝑥3𝑡 + 𝜀𝑡

tendo sido obtidos os seguintes resultados:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,41242 R Square 0,17009 Adjusted R Square 0,144156 Standard Error 10,67597 Observations 100

ANOVA

df SS MS F Significance

F

Regression 3 2242,512 747,5039 6,558413 0,000442 Residual 96 10941,73 113,9763 Total 99 13184,24

Coefficients Standard

Error t Stat P-value

Intercept 97,39896 3,863172 25,21217 4E-44 X1 0,048717 0,018643 2,613147 0,010415 X2 39,74978 17,96329 2,212834 0,029279 X3 4,481669 2,337796 1,917049 0,058205

1. A um nível de significância de 5% as seguintes variáveis explicativas são

significativas:

a) Apenas X1,

b) X1 e X2,

c) Apenas X3,

d) X1, X2 e X3.

Page 10: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

10

2. O intervalo de confiança a 95% (com os valores arredondados às unidades) para o

coeficiente da variável X3 é dado por:

a) [0 , 9]

b) [1 , 8]

c) [2 , 7]

d) [3 , 6]

3. Assumindo tudo o resto constante, quanto se estima que em média variem as

despesas em saúde em consequência de um aumento de 100 euros no rendimento

anual?

a) 4,8717 euros por mês.

b) 4,8717%.

c) 0,048717 euros por mês.

d) 0,048717 %.

4. Qual das seguintes conclusões sobre as despesas em saúde dos agregados familiares

na população portuguesa é a mais apropriada em termos estatísticos assumindo um

nível de significância de 5%?

a) “As despesas em saúde são, em média, superiores para famílias urbanas”;

b) “Tudo o resto constante, as despesas em saúde são, em média, superiores para

famílias urbanas”;

c) “As despesas em saúde são em média idênticas para famílias urbanas e não-

urbanas”;

d) “Tudo o resto constante, as despesas em saúde são em média idênticas para

famílias urbanas e não-urbanas”;

5. A regressão acima apresentada irá ser re-estimada mas excluindo a variável X3. Qual

das seguintes afirmações está correcta?

a) O valor de R2 da nova regressão poderá vir inferior, igual ou superior a 0,17009;

b) O valor de R2 da nova regressão não poderá ser superior a 0,17009;

c) O valor de R2 da nova regressão não poderá ser inferior a 0,17009;

d) O valor de R2 da nova regressão virá igual ao valor de R2 ajustado.

6. De acordo com os resultados da regressão espera-se que as famílias urbanas sem

filhos e um rendimento anual de dez mil euros tenham uma despesa mensal em

saúde (com o valor arredondado às unidades) igual a:

a) 40 euros;

b) 107 euros;

c) 147 euros;

d) 590 euros.

20. Considere o modelo 𝑌𝑖 = 𝛼 + 𝜀𝑖 com 𝑖 = 1,2, … , 𝑛 em que a variável aleatória 𝜀𝑖 satisfaz

as seguintes hipóteses 𝐸 𝜀𝑖 = 0, 𝑉𝑎𝑟 𝜀𝑖 = 𝜎2, para todo o 𝑖, e 𝐸 𝜀𝑖𝜀𝑗 = 0, para todo

𝑖 ≠ 𝑗.

a. Deduza o estimador dos mínimos quadrados para o parâmetro 𝛼.

b. Verifique que o estimador obtido em a) é não enviesado e determine a sua

variância

Page 11: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

11

c. Suponha que se sabe também que 𝜀𝑖~𝑁 0, 𝜎2 . Determine o estimador de

máxima verosimilhança para 𝜎2 e verifique se é não enviesado.

21. Considere o modelo 𝑌𝑖 = βxi + 𝜀𝑖 com 𝑖 = 1,2, … , 𝑛 em que a variável aleatória 𝜀𝑖

satisfaz as seguintes hipóteses 𝐸 𝜀𝑖 = 0, 𝑉𝑎𝑟 𝜀𝑖 = 𝜎2, para todo o 𝑖, e 𝐸 𝜀𝑖𝜀𝑗 = 0,

para todo 𝑖 ≠ 𝑗.

a. Deduza o estimador dos mínimos quadrados para o parâmetro 𝛽

b. Verifique que o estimador obtido em a) é não enviesado e determine a sua

variância.

c. “Neste modelo a soma dos resíduos é zero”. Esta afirmação é verdadeira ou

falsa? Justifique.

4. Soluções Exercícios Extra

1. a. 𝐻0: 𝑝 ≤ 0,01 𝐻1: 𝑝 > 0,01. Estatística-teste: 𝑝 −𝑝0

𝑝0 1−𝑝0

𝑛

~ 𝑁 0,1

Regra de decisão: Rejeitar 𝐻0 quando 𝑧0>2,33

b. 𝑧0 = 1,005, logo não rejeitamos 𝐻0. Para se rejeitar 𝑝 > 0,033. c. 0,714

2. a. 𝐼𝐶99% 𝜇 = 13,715; 16,285 b. 𝑧0 = −3,6 < −2,33. Logo, rejeitamos 𝐻0,

pelo que o forno 2 é mais rápido. c. 0,8980

3. a. 𝐼𝐶90% 𝑝1 − 𝑝2 = −0,21515; 0,01515 . Não rejeitamos a hipótese de os dois

jogadores serem igualmente bons. b. 𝑧0 = −1,421 > −1,645. Logo, não

rejeitamos a hipótese de o José não ser melhor que o João. c. 0,1151

4. a. 𝐼𝐶90% 𝑝1 = 0,064; 0,185 b. 𝑧0 = 1,103 < 2,33, logo não rejeitamos a

𝐻0 , pelo que se concluiu que não melhorou. c. 0,0329

5. a. 95,8875 b. 93,7875 c. 422,8

6. a. 3,15 b. 𝐼𝐶95% 𝜇 = 2,85; 3,45 c. i) 𝑡0 = −2,3 <

−1,708, logo rejeitamos 𝐻0. ii) Entre 0,01 e 0,025. iii)Entre 0,05 e 0,1

d. 𝑧0 = 1,52 < 1,645, logo não rejeitamos 𝐻0, pelo que não devemos concordar com

a empresa.

7. a. i) 𝑧0 = 1,83 > 1,645 , logo rejeitamos 𝐻0, pelo que é verdade. ii) 0,05

iii) 0,9656

8. a. 0,0456 b. 0,8413

9. a. 𝑧0 = 2,66 > 2,145, logo rejeitamos 𝐻0, pelo que não está bem regulada. b. 0,02

10. a. 𝑧0 = 1,8 > 1,645, logo rejeitamos a hipótese de não haver desperdício.

b. 0,0359 c. 0,444 d. 𝑧0 = −0,989 > −1,96𝑒 < 1,96,

logo não rejeitamos 𝐻0, ou seja, não rejeitamos a igualdade das médias.

11. a. 𝛼 = 10% b. Rejeitar a 𝐻0. P-value = 0,0039. c. 𝛽 = 0,6255

d. . 𝑧0 = 1,809 > 2,145, rejeitamos 𝐻0, pelo que o tempo médio de leitura da VIP é

maior.

12. 𝑡0 = 2,097, pelo que rejeitamos 𝐻0.

Page 12: Caderno de Exercício 3docentes.fe.unl.pt/~msampaio/Caderno%20de%20Exerc%EDcio%203.pdf · de 47,6 e o desvio-padrão de 2,5. a. Defina a região crítica para efectuar o teste a um

Estatística para Economia e Gestão

1º Semestre 09/10

12

13. Nível de significância: 10%

14. a. 8,378 b. −8,164; −0,440 c. Sim, pois o zero não está

contido no intervalo construído a 95% de confiança.

15. a. 𝑏0 = 0,514 𝑏1 = 2,89 b. 𝜌 = 0,608

16. b. 𝑟 = 0,966 c. 𝑏0 = 82,57 𝑏1 = 1,12 d. 0,538; 1,701

e. 𝛼 = 8,36%

17. b. 𝑡0 = −7,3, pelo que rejeitamos 𝐻0. c. 4,61; 10,986

18. b. 0,23308 c. A=2 B=453,4756 C=28,987 Dado que F=28,987 rejeitamos a

hipótese nula de não significância global do modelo para os níveis de significância

habituais. d. Introdução de uma dummy e. Falso

19. 1) B 2)A 3)C 4)B 5)B 6)B

20. a. 𝑎 = 𝑌 b. 𝐸 𝑎 = 𝑎 𝑉𝑎𝑟 𝑎 =𝜎2

𝑛 c. 𝜎 2 =

1

𝑛 𝜀𝑖

2 𝐸 𝜎 2 = 𝜎2, pelo que é

centrado.

21. a . 𝑏 = 𝑥𝑖𝑦𝑖

𝑥𝑖2 b. 𝐸 𝑏 = 𝑏 𝑉𝑎𝑟 𝑏 = 𝜎2 c. Falso