Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
-
Author
jean-paulo-mendes-alves -
Category
Engineering
-
view
1.832 -
download
7
Embed Size (px)
Transcript of Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.

ENGENHARIA CIVIL
NOTURNO
Estatística e Probabilidade
Correlação e Regressão Linear - Exercícios
UniEVANGÉLICA – Centro Universitário de Anápolis
Curso de Engenharia Civil
2º período – Noturno
Disciplina: Estatística e Probabilidade
Acadêmico: Jean Paulo Mendes Alves

Exercícios de CORRELAÇÃO E REGRESSÃO LINEAR 1- Abaixo você encontra uma lista de situações de pesquisa. Para cada uma delas indique se o
apropriado é proceder uma análise de regressão ou uma de correlação. Justifique sua indicação.
a) 0 rendimento escolar na Universidade favorece o êxito profissional?
b) 0 tempo de treinamento influi no desempenho profissional?
c) O objetivo e estimar o tempo necessário a consecução de certa tarefa usando, para tanto, o tempo
de treinamento do executor.
d) 0 objetivo e utilizar o preço da carne de gado para estimar a quantidade de procura desse bem.
e) A quantidade procurada de carne de gado depende do preço da carne de porco?
2- Uma cadeia de supermercados financiou um estudo dos gastos realizados por família de quatro
pessoas com renda mensal líquida entre oito e vinte salários mínimos. A pesquisa levou a equação de
regressão Y = -1,2 + 0,4 X, onde Y representa a despesa mensal estimada ( através do modelo) e X a
renda mensal líquida expressa em numero de salários mínimos.
a) Estime a despesa mensal de uma família com renda líquida mensal de 15 salários mínimos.
b) A equação parece sugerir que uma família com renda mensal de 3 salários mínimos nada gasta com
mercadorias. O que você tem a dizer sobre isso ?
c) A equação em questão serve para estimar a despesa mensal de uma família de 5 pessoas com
renda líquida de 12 salários mínimos ? Justifique.
3- Uma amostra de fábricas de uma indústria levou a:
Custo total Y Produção X
80 12
44 4
51 6
70 11
61 8
a) Determine a equação de regressão linear.
b) Quais os significados econômicos de "a" e "b"?
c) Encontre o coeficiente de determinação ( ou de explicação).
d) Teste a existência da regressão a um nível de significância de 5%.
e) Determine um Intervalo de Predição (90%) para a média de Y dado X=10.
4- Pretendendo estudar a relação entre o tempo necessário a um consumidor para optar e o número
de produtos substitutos alternativos expostos a ele, foi observada uma amostra aleatória de 15
consumidores, da qual resultaram os seguintes dados,:
Y X
5 2
8 2
8 2
7 2
9 2
7 3
9 3
8 3
9 3
10 3
10 3
11 4
10 4
12 4
9 4
A variável Y refere-se ao tempo necessário para a tomada de decisão e X o número de alternativas.
a) Estime o coeficiente de correlação linear de Pearson.

b) Determine a equação de regressão para a amostra dada.
c)Interprete os valores dos coeficientes encontrados para a reta.
d)Estime e interprete o coeficiente de determinação entre X e Y.
5- Para cada caso abaixo, estime a correspondente reta de regressão:
a) n X Y XY X 20 200 300 6200 36002, , , , .
b) n X Y XY X 36 7 2 37 3100 6202, , , , , .
6- Uma população é composta por N=6 pontos (X;Y). São eles:
(1;2) (5;6) (2;4) (2;3) (3;5) (5;10)
a) Determine a reta de regressão populacional;
b) Faça um diagrama de dispersão, localize a reta do item anterior e os segmentos que representam os 6
valores de u. Verifique que a soma de u é igual a zero.
7- Uma amostra de residências selecionadas aleatoriamente foi observada quanto à idade do imóvel X e
quanto ao preço de venda. Resultou:
X Y
1 10
2 30
3 40
4 50
5 65
6 70
a) Estime a reta de regressão populacional;
b) Teste, usando o coeficiente angular, se o preço de venda do imóvel diminui á medida que a idade cresce.
Use 5%.
c) Obtenha e interprete o intervalo de projeção de 95% para o preço de uma casa com 3 anos;
d) Obtenha e interprete o intervalo de projeção de 95% para o preço médio de uma casa com 3 anos;
e) Estime os coeficientes de correlação e determinação entre X e Y;
f) È necessário testar a significância do coeficiente de correlação? Explique.
8- Abaixo, você encontra 3 afirmações. Indique, justificando, se são verdadeiras ou falsas:
a) Se entre X e Y o coeficiente de correlação é 1, apenas uma dessas variáveis exerce influência sobre a
outra. Isso já não é verdade quando o coeficiente de correlação é –1.
b) Se o coeficiente angular da reta de regressão é nulo, o coeficiente de correlação entre as mesmas
variáveis também o é.
c) Se o coeficiente angular da reta de regressão é positivo, necessariamente o coeficiente de correlação entre
as mesmas variáveis também o é.
9- Para cada um dos casos abaixo teste, a 5%, a significância do coeficiente angular da reta de regressão:
a) b=4; ;b1 n=12;
b) b=-0,15 , ;b0 1 n=20;
c) b=0,6 , ;b0 2 n=50.
10- Para estudar a poluição de um rio, um cientista mediu a concentração de um determinado composto
orgânico (Y) e a precipitação pluviométrica na semana anterior (X):
X Y
0,91 0,10

1,33 1,10
4,19 3,40
2,68 2,10
1,86 2,60
1,17 1,00
a)Existe alguma relação entre o nível de poluição e a precipitação pluviométrica?
Informa-se que r= 0,89. Teste sua significância, ao nível de 5%. ,
b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%.
c)Calcule o coeficiente de correlação linear de Pearson e teste a sua significância ao nível de 1 %.
11- Procurando quantificar os efeitos da escassez de sono sobre a capacidade de resolução
de problemas simples, um agente tomou ao acaso 10 sujeitos e os submeteu a experimentação. Deixou-os
sem dormir por diferentes números de horas, após o que solicitou que os mesmos resolvessem os itens
"contas de adicionar" de um teste. Obteve, assim, os seguintes dados:
No de
erros - Y
Horas sem dormir -
X
8 8
6 8
6 12
10 12
8 16
14 16
14 20
12 20
16 24
12 24
a)Calcule o coeficiente de correlação linear de Pearson e teste a sua significância ao nível de 1%.
b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%.
12-A tabela abaixo mostra o comprimento ( X ) e largura ( Y ) de 10 folhas extraídas de
uma arvore aleatoriamente.
a)Verifique se existe correlação significativa entre as variáveis com um nível de significância de 5%.
b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1% e 5%.
comprimento largura
12 10
15 14
11 9
16 13
13 10
12 12
10 8
9 7
17 13
15 14
13- A tabela abaixo mostra a freqüência do pulso médio em diferentes períodos etários:
Idade Pulso
2 112
4 104
6 100
8 92

10 88
12 86
14 84
16 80
a) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e 5%.
14- A tabela abaixo mostra o volume de vendas ( em 1.000 unidades ) e os gastos promocionais
( em 100.000 reais ).
Vendas Promoção
80 2
90 4
95 5
95 6
100 8
110 8
115 10
110 10
120 12
130 15
a) Represente graficamente estes pontos.
b) Calcule o coeficiente de correlação linear de Pearson.
c) Ajuste os dados através de uma reta de mínimos quadrados. ( modelo linear )
d) Determine o coeficiente de explicação para a reta.
e) Teste a existência da regressão ao um nível de significância de 5%.
15- Há suspeitas de que a qualidade do remédio depende do tempo de maturação despendido em sua
produção. Para verificar isso, um laboratório farmacêutico coletou os seguintes dados:
Tempo-X Qualidade - Y
1 23
2 31
3 40
4 46
5 52
6 63
a) Represente graficamente estes pontos.
b) Calcule o coeficiente de correlação linear de Pearson.
c) Ajuste os dados através de uma reta de mínimos quadrados. ( modelo linear )
d) Determine o coeficiente de explicação para a reta.
e) Teste a existência da regressão ao um nível de significância de 5%.
16- Em certa população, o coeficiente de correlação entre X e Y é –0,80.
a) O que isto significa?
b) Que percentual da variância de Y não é explicada pelas variações de X?
17- A tabela seguinte mostra os resultados de uma pesquisa com 10 famílias de determinada região.
Famílias Renda (u.m.:100) Poupança u.m.:1000) Número de Filhos Média de Anos de Estudo
da Família
A 10 4 8 3
B 15 7 6 4
C 12 5 5 5
D 70 20 1 12

E 80 20 2 16
F 100 30 2 18
G 20 8 3 8
H 30 8 2 8
I 10 3 6 4
J 60 15 1 8
Calcule o coeficiente de correlação linear de Pearson entre:
a) renda familiar e poupança das dez famílias;
b) renda e numero de filhos para as dez famílias;
c) poupança e numero de filhos;
d) média de anos de estudo e numero de filhos;
e)renda familiar e media de anos de estudo.
18- Um grupo de pesquisa estabeleceu uma escala de quocientes de violência para programas de televisão.
Classificou cada um dos 6 programas e coletou dados sobre o percentual de pessoas que assistem cada
programa. Verifique se existe correlação significativa entre as variáveis com um nível de significância de 5%.
Programa Quociente de violência (X) % que assistem (Y)
1 10 15
2 30 20
3 40 24
4 50 30
5 65 35
6 70 35
19- Os dados abaixo representam o Consumo(Y) e Renda disponível (X) num período de 14 anos. As
variáveis são expressas em milhões de dólares.
X Y X Y
XY
3915 5 3273 4 1150349 73 800330 16
959198 36
2 2, , , ,
,
a) Determine as estimativas de “a” e “b” dos parâmetros da reta estimada;
b) Qual o significado econômico dessas estimativas?
c) Qual o consumo esperado para uma renda de 400 milhões de dólares?
d) Calcule o poder explicativo da regressão e interprete-o.
20-Uma empresa está estudando como varia a demanda de certo produto em função de seu preço de venda.
Para isso levantou as seguintes informações:
Meses Unidades Vendidas (Y) Preço/unidade(X)
J 248 162
F 242 167
M 234 165
A 216 173
M 230 170
J 220 176
J 213 178
A 205 180
S 198 182
O 195 187
N 197 190
D 260 200
a) Ajuste os dados através de um modelo linear;
b) Qual o significado econômico das estimativas de “a” e “b” dos parâmetros da reta estimada?
c) Teste a existência da regressão a um nível de 1%;

d) Determine um intervalo de 95% de confiança para a média de y dado x=185.
Respostas
Lista de Exercícios de Correlação e Regressão
Exercício 3 Custo Total
Produção
80 12
44 4
51 6
70 11
61 8
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,988988
R-Quadrado
0,978098
R-quadrado ajustado
0,970797
Erro padrão
2,462819
Observações
5
ANOVA
gl SQ MQ F F de significação
Regressão
1 812,6036 812,6036 133,9719 0,001385
Resíduo 3 18,19643 6,065476
Total 4 830,8
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
26,27679 3,211966 8,180904 0,003821 16,05487 36,4987
Variável X 1
4,258929 0,367954 11,57462 0,001385 3,087934 5,429923
Exercício 4
Tempo Alternativas
5 2
8 2
8 2

7 2
9 2
7 3
9 3
8 3
9 3
10 3
10 3
11 4
10 4
12 4
9 4
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,70907
R-Quadrado
0,502781
R-quadrado ajustado
0,464533
Erro padrão
1,27346
Observações
15
ANOVA
gl SQ MQ F F de significação
Regressão
1 21,31791 21,31791 13,14542 0,003077
Resíduo 13 21,08209 1,621699
Total 14 42,4
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
4,268657 1,292327 3,303079 0,005714 1,476755 7,060558
Alternativas
1,544776 0,426067 3,625661 0,003077 0,624313 2,465239
Exercício 7
X Y
Preço de Venda
Idade do Imóvel
6 10
5 30
4 40
3 50
2 65

1 70
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,987932
R-Quadrado
0,976009
R-quadrado ajustado
0,970012
Erro padrão
3,888322
Observações
6
ANOVA
gl SQ MQ F F de significação
Regressão
1 2460,357 2460,357 162,7323 0,000218
Resíduo 4 60,47619 15,11905
Total 5 2520,833
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
85,66667 3,619831 23,66593 1,89E-05 75,61638 95,71695
Preço de Venda
-11,8571 0,929487 -12,7567 0,000218 -14,4378 -9,27647
RESULTADOS DE RESÍDUOS
Observação
Previsto(a) Idade
do Imóvel
Resíduos
1 14,52381 -4,52381
2 26,38095 3,619048
3 38,2381 1,761905
4 50,09524 -0,09524
5 61,95238 3,047619
6 73,80952 -3,80952
Exercício 10
X Y
Composto
Precipitação
0,91 0,1
1,33 1,1
4,19 3,4

2,68 2,1
1,86 2,6
1,17 1
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,887119
R-Quadrado
0,78698
R-quadrado ajustado
0,733725
Erro padrão
0,622154
Observações
6
ANOVA
gl SQ MQ F F de significação
Regressão
1 5,720032 5,720032 14,77757 0,018394
Resíduo 4 1,548301 0,387075
Total 5 7,268333
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
-0,03858 0,522492 -0,07384 0,944679 -1,48926 1,412089
Composto
0,867504 0,225668 3,844161 0,018394 0,240948 1,49406
Exercício 11
Y X
N.erros Horas
8 8
6 8
6 12
10 12
8 16
14 16
14 20
12 20
16 24
12 24
RESUMO DOS RESULTADOS
Estatística de

regressão
R múltiplo 0,801467
R-Quadrado
0,642349
R-quadrado ajustado
0,597642
Erro padrão
2,241651
Observações
10
ANOVA
gl SQ MQ F F de significação
Regressão
1 72,2 72,2 14,36816 0,005308
Resíduo 8 40,2 5,025
Total 9 112,4
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
3 2,126617 1,410691 0,196016 -1,90399 7,903991
Horas 0,475 0,125312 3,790535 0,005308 0,18603 0,76397
X Y
Exercício 12
Comprim Largura
12 10
15 14
11 9
16 13
13 10
12 12
10 8
9 7
17 13
15 14
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,902732
R-Quadrado
0,814925
R-quadrado ajustado
0,79179
Erro padrão
1,15836

Observações
10
ANOVA
gl SQ MQ F F de significação
Regressão
1 47,26563 47,26563 35,22562 0,000348
Resíduo 8 10,73438 1,341797
Total 9 58
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
-0,17188 1,917645 -0,08963 0,930786 -4,59397 4,250225
Comprim 0,859375 0,144795 5,935117 0,000348 0,525477 1,193273
Exercício 13
X Y
Idade Pulso
2 112
4 104
6 100
8 92
10 88
12 86
14 84
16 80
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,975971
R-Quadrado
0,95252
R-quadrado ajustado
0,944607
Erro padrão
2,601892
Observações
8
ANOVA
gl SQ MQ F F de significação
Regressão
1 814,881 814,881 120,3693 3,41E-05
Resíduo 6 40,61905 6,769841
Total 7 855,5

Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
113,0714 2,027378 55,77225 2,23E-09 108,1106 118,0322
Idade -2,20238 0,20074 -10,9713 3,41E-05 -2,69358 -1,71119
Exercício 14
X
Vendas - Y
Promoção
80 2
90 4
95 5
95 6
100 8
110 8
115 10
110 10
120 12
130 15
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,981686
R-Quadrado
0,963707
R-quadrado ajustado
0,95917
Erro padrão
3,066296
Observações
10
ANOVA
gl SQ MQ F F de significação
Regressão
1 1997,283 1997,283 212,4277 4,81E-07
Resíduo 8 75,21739 9,402174
Total 9 2072,5
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiores
Interseção
74,06522 2,302313 32,16991 9,5E-10 68,75607 79,37436
Promoção
3,804348 0,26102 14,5749 4,81E-07 3,202433 4,406263

Exercício 20
Y X
248 162
242 167
234 165
216 173
230 170
220 176
213 178
205 180
198 182
195 187
197 190
260 200
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,251769
R-Quadrado
0,063388
R-quadrado ajustado
-0,03027
Erro padrão
21,78059
Observações
12
ANOVA
gl SQ MQ F F de significação
Regressão
1 321,0579 321,0579 0,676774 0,42988
Resíduo 10 4743,942 474,3942
Total 11 5065
Coeficientes
Erro padrão
Stat t valor-P 95% inferiores
95% superiore
s
Inferior 95,0%
Interseção
307,5842 104,8297 2,934133 0,014935 74,00911 541,1594 74,00911
X -0,48498 0,589527 -0,82266 0,42988 -1,79853 0,828566 -1,79853
Exercício 17
Renda Poupança
Número de filhos
Anos de estudo Renda Número de filhos
10 4 8 3 10 8
15 7 6 4 15 6
12 5 5 5 12 5

70 20 1 12 70 1
80 20 2 16 80 2
100 30 2 18 100 2
20 8 3 8 20 3
30 8 2 8 30 2
10 3 6 4 10 6
60 15 1 8 60 1
Renda Poupança
Renda Anos de estudo
Renda 1 Renda 1
Poupança
0,983518 1 Anos de estudo
0,947271 1
Renda Número de filhos
Renda 1 Renda Anos de estudo
Número de filhos
-0,7586 1 10 3
15 4
Poupança
Número de filhos 12 5
Poupança
1 70 12
Número de filhos
-0,71136 1 80 16
100 18
Número de filhos
Anos de estudo 20 8
Número de filhos
1 30 8
Anos de estudo
-0,73672 1 10 4
60 8