PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
Exercícios de CORRELAÇÃO E REGRESSÃO LINEAR1- Abaixo você encontra uma lista de situações de pesquisa. Para cada uma delas indique se oapropriado é proceder uma análise de regressão ou uma de correlação. Justifique sua indicação.a) 0 rendimento escolar na Universidade favorece o êxito profissional?b) 0 tempo de treinamento influi no desempenho profissional?c) O objetivo e estimar o tempo necessário a consecução de certa tarefa usando, para tanto, o tempode treinamento do executor.d) 0 objetivo e utilizar o preço da carne de gado para estimar a quantidade de procura desse bem.e) A quantidade procurada de carne de gado depende do preço da carne de porco?
2- Uma cadeia de supermercados financiou um estudo dos gastos realizados por família de quatropessoas com renda mensal líquida entre oito e vinte salários mínimos. A pesquisa levou a equação deregressão = -1,2 + 0,4 X, onde representa a despesa mensal estimada ( através do modelo) e X arenda mensal líquida expressa em numero de salários mínimos.a) Estime a despesa mensal de uma família com renda líquida mensal de 15 salários mínimos.b) A equação parece sugerir que uma família com renda mensal de 3 salários mínimos nada gasta commercadorias. O que você tem a dizer sobre isso ?c) A equação em questão serve para estimar a despesa mensal de uma família de 5 pessoas comrenda líquida de 12 salários mínimos ? Justifique.
3- Uma amostra de fábricas de uma indústria levou a:Custo total Y Produção X 80 1244 451 670 11 61 8a) Determine a equação de regressão linear.b) Quais os significados econômicos de "a" e "b"?c) Encontre o coeficiente de determinação ( ou de explicação).d) Teste a existência da regressão a um nível de significância de 5%.e) Determine um Intervalo de Predição (90%) para a média de Y dado X=10.
4- Pretendendo estudar a relação entre o tempo necessário a um consumidor para optar e o númerode produtos substitutos alternativos expostos a ele, foi observada uma amostra aleatória de 15consumidores, da qual resultaram os seguintes dados,:Y X5 28 28 27 29 27 39 38 39 310 310 311 4
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
1
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
10 412 49 4
A variável Y refere-se ao tempo necessário para a tomada de decisão e X o número de alternativas.a) Estime o coeficiente de correlação linear de Pearson.b) Determine a equação de regressão para a amostra dada.c)Interprete os valores dos coeficientes encontrados para a reta.d)Estime e interprete o coeficiente de determinação entre X e Y.
5- Para cada caso abaixo, estime a correspondente reta de regressão:
a)
b)
6- Uma população é composta por N=6 pontos (X;Y). São eles:(1;2) (5;6) (2;4) (2;3) (3;5) (5;10)
a) Determine a reta de regressão populacional;b) Faça um diagrama de dispersão, localize a reta do item anterior e os segmentos que representam os 6
valores de u. Verifique que a soma de u é igual a zero.
7- Uma amostra de residências selecionadas aleatoriamente foi observada quanto à idade do imóvel X e quanto ao preço de venda. Resultou:
X Y1 102 303 404 505 656 70
a) Estime a reta de regressão populacional;b) Teste, usando o coeficiente angular, se o preço de venda do imóvel diminui á medida que a idade
cresce. Use 5%.c) Obtenha e interprete o intervalo de projeção de 95% para o preço de uma casa com 3 anos;d) Obtenha e interprete o intervalo de projeção de 95% para o preço médio de uma casa com 3 anos;e) Estime os coeficientes de correlação e determinação entre X e Y;f) È necessário testar a significância do coeficiente de correlação? Explique.
8- Abaixo, você encontra 3 afirmações. Indique, justificando, se são verdadeiras ou falsas:a) Se entre X e Y o coeficiente de correlação é 1, apenas uma dessas variáveis exerce influência sobre a
outra. Isso já não é verdade quando o coeficiente de correlação é –1.b) Se o coeficiente angular da reta de regressão é nulo, o coeficiente de correlação entre as mesmas
variáveis também o é.c) Se o coeficiente angular da reta de regressão é positivo, necessariamente o coeficiente de correlação
entre as mesmas variáveis também o é.9- Para cada um dos casos abaixo teste, a 5%, a significância do coeficiente angular da reta de regressão:a) b=4; n=12;
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
2
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
b) b=-0,15 n=20;
c) b=0,6 n=50.
10- Para estudar a poluição de um rio, um cientista mediu a concentração de um determinado composto orgânico (Y) e a precipitação pluviométrica na semana anterior (X):
X Y 0,91 0,10 1,33 1,10 4,19 3,40 2,68 2,10 1,86 2,60 1,17 1,00
a)Existe alguma relação entre o nível de poluição e a precipitação pluviométrica?Informa-se que r= 0,89. Teste sua significância, ao nível de 5%. ,b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%.c)Calcule o coeficiente de correlação linear de Pearson e teste a sua significância ao nível de 1 %.
11- Procurando quantificar os efeitos da escassez de sono sobre a capacidade de resoluçãode problemas simples, um agente tomou ao acaso 10 sujeitos e os submeteu a experimentação. Deixou-os sem dormir por diferentes números de horas, após o que solicitou que os mesmos resolvessem os itens "contas de adicionar" de um teste. Obteve, assim, os seguintes dados:No de erros - Y
Horas sem dormir - X
8 8 6 8 6 12 10 12 8 16 14 16 14 20 12 20 16 2412 24
a)Calcule o coeficiente de correlação linear de Pearson e teste a sua significância ao nível de 1%.b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%.
12-A tabela abaixo mostra o comprimento ( X ) e largura ( Y ) de 10 folhas extraídas deuma arvore aleatoriamente. a)Verifique se existe correlação significativa entre as variáveis com um nível de significância de 5%.b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1% e 5%.
comprimento largura 12 10 15 14
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
3
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
11 916 1313 1012 1210 89 717 1315 1413- A tabela abaixo mostra a freqüência do pulso médio em diferentes períodos etários:
Idade Pulso 2 112 4 104 6 100 8 9210 8812 8614 8416 80
a) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%.
14- A tabela abaixo mostra o volume de vendas ( em 1.000 unidades ) e os gastos promocionais( em 100.000 reais ). Vendas Promoção 80 2 90 4 95 5 95 6100 8110 8115 10110 10120 12130 15
a) Represente graficamente estes pontos.b) Calcule o coeficiente de correlação linear de Pearson.c) Ajuste os dados através de uma reta de mínimos quadrados. ( modelo linear )d) Determine o coeficiente de explicação para a reta.e) Teste a existência da regressão ao um nível de significância de 5%.
15- Há suspeitas de que a qualidade do remédio depende do tempo de maturação despendido em sua produção. Para verificar isso, um laboratório farmacêutico coletou os seguintes dados:
Tempo-X Qualidade - Y 1 23 2 31 3 40
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
4
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
4 465 526 63
a) Represente graficamente estes pontos.b) Calcule o coeficiente de correlação linear de Pearson.c) Ajuste os dados através de uma reta de mínimos quadrados. ( modelo linear )d) Determine o coeficiente de explicação para a reta.e) Teste a existência da regressão ao um nível de significância de 5%.
16- Em certa população, o coeficiente de correlação entre X e Y é –0,80.a) O que isto significa?b) Que percentual da variância de Y não é explicada pelas variações de X?
17- A tabela seguinte mostra os resultados de uma pesquisa com 10 famílias de determinada região. Famílias Renda (u.m.:100) Poupança u.m.:1000) Número de Filhos Média de Anos de Estudo
da FamíliaA 10 4 8 3B 15 7 6 4C 12 5 5 5D 70 20 1 12E 80 20 2 16F 100 30 2 18G 20 8 3 8H 30 8 2 8I 10 3 6 4J 60 15 1 8
Calcule o coeficiente de correlação linear de Pearson entre:a) renda familiar e poupança das dez famílias;b) renda e numero de filhos para as dez famílias;c) poupança e numero de filhos;d) média de anos de estudo e numero de filhos;e)renda familiar e media de anos de estudo.
18- Um grupo de pesquisa estabeleceu uma escala de quocientes de violência para programas de televisão. Classificou cada um dos 6 programas e coletou dados sobre o percentual de pessoas que assistem cada programa. Verifique se existe correlação significativa entre as variáveis com um nível de significância de 5%.Programa Quociente de violência (X) % que assistem (Y)1 10 152 30 203 40 244 50 305 65 356 70 35
19- Os dados abaixo representam o Consumo(Y) e Renda disponível (X) num período de 14 anos. As variáveis são expressas em milhões de dólares.
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
5
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
a) Determine as estimativas de “a” e “b” dos parâmetros da reta estimada;b) Qual o significado econômico dessas estimativas?c) Qual o consumo esperado para uma renda de 400 milhões de dólares?d) Calcule o poder explicativo da regressão e interprete-o.
20-Uma empresa está estudando como varia a demanda de certo produto em função de seu preço de venda. Para isso levantou as seguintes informações:Meses Unidades Vendidas (Y) Preço/unidade(X)J 248 162F 242 167M 234 165A 216 173M 230 170J 220 176J 213 178A 205 180S 198 182O 195 187N 197 190D 260 200
a) Ajuste os dados através de um modelo linear;b) Qual o significado econômico das estimativas de “a” e “b” dos parâmetros da reta estimada?c) Teste a existência da regressão a um nível de 1%;d) Determine um intervalo de 95% de confiança para a média de y dado x=185.
Respostas
Lista de Exercícios de Correlação e Regressão
Exercício 3 Custo Total
Produção
80 1244 451 670 1161 8
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,988988
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
6
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
R-Quadrado
0,978098
R-quadrado ajustado
0,970797
Erro padrão
2,462819
Observações
5
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 812,6036 812,6036 133,9719 0,001385
Resíduo 3 18,19643 6,065476Total 4 830,8
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
26,27679 3,211966 8,180904 0,003821 16,05487 36,4987
Variável X 1
4,258929 0,367954 11,57462 0,001385 3,087934 5,429923
Exercício 4Tempo Alternativas
5 28 28 27 29 27 39 38 39 3
10 310 311 410 412 49 4
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,70907
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
7
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
R-Quadrado
0,502781
R-quadrado ajustado
0,464533
Erro padrão
1,27346
Observações
15
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 21,31791 21,31791 13,14542 0,003077
Resíduo 13 21,08209 1,621699Total 14 42,4
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
4,268657 1,292327 3,303079 0,005714 1,476755 7,060558
Alternativas
1,544776 0,426067 3,625661 0,003077 0,624313 2,465239
Exercício 7X YPreço de Venda
Idade do Imóvel
6 105 304 403 502 651 70
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,987932R-Quadrado
0,976009
R-quadrado ajustado
0,970012
Erro padrão
3,888322
Observaç 6______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
8
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
ões
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 2460,357 2460,357 162,7323 0,000218
Resíduo 4 60,47619 15,11905Total 5 2520,833
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
85,66667 3,619831 23,66593 1,89E-05 75,61638 95,71695
Preço de Venda
-11,8571 0,929487 -12,7567 0,000218 -14,4378 -9,27647
RESULTADOS DE RESÍDUOS
Observação
Previsto(a) Idade
do Imóvel
Resíduos
1 14,52381 -4,523812 26,38095 3,6190483 38,2381 1,7619054 50,09524 -0,095245 61,95238 3,0476196 73,80952 -3,80952
Exercício 10
X Y
Composto
Precipitação
0,91 0,11,33 1,14,19 3,42,68 2,11,86 2,61,17 1
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,887119______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
9
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
R-Quadrado
0,78698
R-quadrado ajustado
0,733725
Erro padrão
0,622154
Observações
6
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 5,720032 5,720032 14,77757 0,018394
Resíduo 4 1,548301 0,387075Total 5 7,268333
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
-0,03858 0,522492 -0,07384 0,944679 -1,48926 1,412089
Composto
0,867504 0,225668 3,844161 0,018394 0,240948 1,49406
Exercício 11
Y X
N.erros Horas 8 86 86 12
10 128 16
14 1614 2012 2016 2412 24
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,801467R-Quadrado
0,642349
R- 0,597642
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
10
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
quadrado ajustadoErro padrão
2,241651
Observações
10
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 72,2 72,2 14,36816 0,005308
Resíduo 8 40,2 5,025Total 9 112,4
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
3 2,126617 1,410691 0,196016 -1,90399 7,903991
Horas 0,475 0,125312 3,790535 0,005308 0,18603 0,76397
X YExercício 12
Comprim Largura
12 1015 1411 916 1313 1012 1210 89 7
17 1315 14
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,902732R-Quadrado
0,814925
R-quadrado ajustado
0,79179
Erro padrão
1,15836
Observaç 10
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
11
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
ões
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 47,26563 47,26563 35,22562 0,000348
Resíduo 8 10,73438 1,341797Total 9 58
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
-0,17188 1,917645 -0,08963 0,930786 -4,59397 4,250225
Comprim 0,859375 0,144795 5,935117 0,000348 0,525477 1,193273
Exercício 13
X Y
Idade Pulso2 1124 1046 1008 92
10 8812 8614 8416 80
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,975971R-Quadrado
0,95252
R-quadrado ajustado
0,944607
Erro padrão
2,601892
Observações
8
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 814,881 814,881 120,3693 3,41E-05
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
12
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
Resíduo 6 40,61905 6,769841Total 7 855,5
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
113,0714 2,027378 55,77225 2,23E-09 108,1106 118,0322
Idade -2,20238 0,20074 -10,9713 3,41E-05 -2,69358 -1,71119
Exercício 14
X
Vendas - Y
Promoção
80 290 495 595 6
100 8110 8115 10110 10120 12130 15
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,981686R-Quadrado
0,963707
R-quadrado ajustado
0,95917
Erro padrão
3,066296
Observações
10
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 1997,283 1997,283 212,4277 4,81E-07
Resíduo 8 75,21739 9,402174Total 9 2072,5
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
13
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
74,06522 2,302313 32,16991 9,5E-10 68,75607 79,37436
Promoção
3,804348 0,26102 14,5749 4,81E-07 3,202433 4,406263
Exercício 20
Y X
248 162242 167234 165216 173230 170220 176213 178205 180198 182195 187197 190260 200
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,251769R-Quadrado
0,063388
R-quadrado ajustado
-0,03027
Erro padrão
21,78059
Observações
12
ANOVA
gl SQ MQ F F de significaçãoRegressão
1 321,0579 321,0579 0,676774 0,42988
Resíduo 10 4743,942 474,3942Total 11 5065
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiore
Inferior 95,0%
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
14
PONTIFÍCIA UNIVERSIDADE CATOLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA – DEPARTAMENTO DE ESTATÍSTICA____________________________________________________________________________________
sInterseção
307,5842 104,8297 2,934133 0,014935 74,00911 541,1594 74,00911
X -0,48498 0,589527 -0,82266 0,42988 -1,79853 0,828566 -1,79853
Exercício 17
Renda Poupança
Número de filhos
Anos de estudo Renda Número de filhos
10 4 8 3 10 815 7 6 4 15 612 5 5 5 12 570 20 1 12 70 180 20 2 16 80 2
100 30 2 18 100 220 8 3 8 20 330 8 2 8 30 210 3 6 4 10 660 15 1 8 60 1
Renda Poupança
Renda Anos de estudo
Renda 1 Renda 1Poupança
0,983518 1 Anos de estudo
0,947271 1
Renda Número de filhosRenda 1 Renda Anos de estudoNúmero de filhos
-0,7586 1 10 3
15 4Poupanç
aNúmero de filhos 12 5
Poupança
1 70 12
Número de filhos
-0,71136 1 80 16
100 18Número de filhos
Anos de estudo 20 8
Número de filhos
1 30 8
Anos de estudo
-0,73672 1 10 4
60 8
______________________________________________________________________________________Profa. Rossana Fraga BenitesDisc. Elementos de Estatística B
15
Top Related