CORRELAÇÃO & REGRESSÃO 2

27
CORRELAÇÃO CORRELAÇÃO & & REGRESSÃO REGRESSÃO

Transcript of CORRELAÇÃO & REGRESSÃO 2

Page 1: CORRELAÇÃO & REGRESSÃO 2

CORRELAÇÃOCORRELAÇÃO&&

REGRESSÃOREGRESSÃO

Page 2: CORRELAÇÃO & REGRESSÃO 2

CORRELAÇÃO E CORRELAÇÃO E REGRESSÃOREGRESSÃOOBJETIVOS:

1.Estudar as relações que podem existir entre duas variáveis, onde as distribuições não são eficientes;2.Verificar o grau dessa relação;3.Identificar a natureza quantitativa da relação entre as variáveis;4.Utilizar a correlação como instrumento para descobrir e medir essa relação e a regressão como instrumento para determinar os parâmetros dessa relação.

Page 3: CORRELAÇÃO & REGRESSÃO 2

CORRELAÇÃOCORRELAÇÃO

1. Relação funcional e relação estatísticaAnalisando as seguintes situações:a)A relação entre o perímetro e o lado de um quadrado

b)A relação entre o peso e a estatura de um grupo de pessoas.

Conclusão:O caso (a) é uma relação FUNCIONAL.O caso (b) é uma relação ESTATÍSTICA.

lp 42

Page 4: CORRELAÇÃO & REGRESSÃO 2

CORRELAÇÃO E CORRELAÇÃO E REGRESSÃOREGRESSÃO2. Conceito

Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe CORRELAÇÃO entre elas.

Situação-problema: Consideremos uma amostra aleatória, formada por dez dos 50 alunos de uma classe da Faculdade Pitágoras e pelas notas obtidas por eles em Cálculo 2 e Estatística.

Page 5: CORRELAÇÃO & REGRESSÃO 2

N.º

NOTAS

Cálculo 2 (Xi) Estatística (Yi)

01 5,0 6,0

08 8,0 9,0

13 7,0 8,0

17 10,0 10,0

23 6,0 5,0

29 7,0 7,0

30 9,0 8,0

34 3,0 4,0

42 8,0 6,0

46 2,0 2,0

Page 6: CORRELAÇÃO & REGRESSÃO 2

Representando, em um sistema coordenado cartesiano ortogonal, os pares ordenados (x,y), obtemos uma nuvem de pontos que denominamos diagrama de dispersão.

Page 7: CORRELAÇÃO & REGRESSÃO 2

CORRELAÇÃO LINEARCORRELAÇÃO LINEAROs pontos obtidos, vistos em conjunto, formam

uma elipse em diagonal. Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma reta. Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por isso, denominada correlação linear.

É possível verificar que a cada correlação está associada como “imagem” uma relação funcional. Por esse motivo, as relações funcionais são chamadas relações perfeitas.

Page 8: CORRELAÇÃO & REGRESSÃO 2

Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é chamada correlação linear positiva.

Page 9: CORRELAÇÃO & REGRESSÃO 2
Page 10: CORRELAÇÃO & REGRESSÃO 2

Coeficiente de Correlação Coeficiente de Correlação LinearLinear

O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).

Neste caso, faz-se uso do coeficiente de correlação de Pearson, dado por:

2222iiii

iiii

yynxxn

yxyxnr

Page 11: CORRELAÇÃO & REGRESSÃO 2

Coeficiente de Correlação Coeficiente de Correlação LinearLinear

Onde n é o número de observações.Os valores limites de r são -1 e +1, isto é, o

valor de r pertence ao intervalo [-1,+1].

OBS.: Para que uma relação possa ser descrita por meio do coeficiente de correlação de Pearson é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se de correlação curvilínea.

Page 12: CORRELAÇÃO & REGRESSÃO 2

Analisando a tabela abaixo, calcular o coeficiente de correlação linear.

N.º

NOTAS

Cálculo 2

(Xi)

Estatística(Yi)

Xi.Yi Xi² Yi²

01 5,0 6,0

08 8,0 9,0

13 7,0 8,0

17 10,0 10,0

23 6,0 5,0

29 7,0 7,0

30 9,0 8,0

34 3,0 4,0

42 8,0 6,0

46 2,0 2,0

Page 13: CORRELAÇÃO & REGRESSÃO 2

²6547510²6548110

656547310

r

4225475042254810

42254730

r

911,018,554

505

525585

505

r

SOLUÇÃO:

Page 14: CORRELAÇÃO & REGRESSÃO 2

REGRESSÃOREGRESSÃO1. AJUSTAMENTO DA RETASempre que desejamos estudar determinada variável

em função de outra, fazemos uma análise de regressão.

A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de n observações das mesmas.

A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente.

Assim, supondo X a variável independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por:

Page 15: CORRELAÇÃO & REGRESSÃO 2

baXY Onde a e b são chamados de parâmetros.

Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora não perfeita, como, por exemplo, as que forma a tabela abaixo.

N.º

NOTAS

Cálculo 2

(Xi)

Estatística(Yi)

Xi.Yi Xi² Yi²

01 5,0 6,0

08 8,0 9,0

13 7,0 8,0

17 10,0 10,0

23 6,0 5,0

29 7,0 7,0

30 9,0 8,0

34 3,0 4,0

42 8,0 6,0

46 2,0 2,0

Page 16: CORRELAÇÃO & REGRESSÃO 2

Cujo diagrama de dispersão é dado por:

Pela forma do diagrama, trata-se de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por:

baXY

Page 17: CORRELAÇÃO & REGRESSÃO 2

Calculando os valores dos parâmetros a e b com a ajuda das fórmulas:

22

ii

iiii

xxn

yxyxna

xayb

Page 18: CORRELAÇÃO & REGRESSÃO 2

NOTA: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Assim:

baXY ˆ

Page 19: CORRELAÇÃO & REGRESSÃO 2
Page 20: CORRELAÇÃO & REGRESSÃO 2
Page 21: CORRELAÇÃO & REGRESSÃO 2

REGRESSÃOREGRESSÃO2. INTERPOLAÇÃO E EXTRAPOLAÇÃONa tabela abaixo, vemos que 4,0 não figura entre

as notas de Cálculo 2. entretanto, pode-se estimar a nota correspondente em Estatística fazendo X = 4,0 na equação.

Page 22: CORRELAÇÃO & REGRESSÃO 2

NOTA: Uma norma fundamental no uso de equações de regressão é a de nunca extrapolar, exceto quando considerações teóricas ou experimentais demonstrem a possibilidade de extrapolação.

Page 23: CORRELAÇÃO & REGRESSÃO 2

EXERCÍCIOS EXERCÍCIOS E E

APLICAÇÕESAPLICAÇÕES

Page 24: CORRELAÇÃO & REGRESSÃO 2

EXERCÍCIO 1: Uma empresa localizada na cidade de São Paulo, produtora de pneumáticos, possui uma rede distribuidora por todo o interior do Estado. Realizou um estudo para determinar qual a função que ligava o preço do produto e a distância do mercado consumidor da cidade de São Paulo. Os dados são os seguintes:

a)Estime a reta de regressão.

b)A empresa tem uma filial no Rio de Janeiro, e o preço de venda do pneumático lá produzido, na cidade B, é de R$ 160,00. sabendo-se que a distância entre São Paulo e a cidade B é de 250 km, pergunta-se qual produto deve ser vendido: o produzido no Rio de Janeiro ou o fabricado em São Paulo?

Preço 36 48 50 70 42 58 91 69

Distância (km)

50 240 150 350

100 175 485 335

Page 25: CORRELAÇÃO & REGRESSÃO 2

EXERCÍCIO 2: Sessenta e quatro estudantes foram submetidos a dois testes: Raciocínio Lógico e Quantitativo e Conhecimentos Gerais. Dos escores obtidos, foram calculadas as somas:

Determine o coeficiente de correlação linear.

8372304²

1450²327169

xyy

xyx

Page 26: CORRELAÇÃO & REGRESSÃO 2

EXERCÍCIO 3: Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo:

(a)Construa o diagrama de dispersão para esses dados.

(b)Calcule o coeficiente de correlação entre as variáveis X e Y.

(c)Obtenha a reta de regressão da variável Y em função de X.

X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,010,0

10,0

10,0

Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,610,0

10,1

Page 27: CORRELAÇÃO & REGRESSÃO 2

EXERCÍCIO 4: As exportações de castanha in natura, processadas pela Empresa Yasmin Ltda., no período que se estende de 1983 a 1989, encontram-se na tabela a seguir:

onde a variável quantidade está expressa em toneladas. Pede-se:

a) O coeficiente de correlação linear. R: r = -0,959

b) A equação de regressão linear da quantidade sobre o tempo.

R: Ŷ = 31 - 6,32X, em que Xi = ti – t0,

c) A quantidade estimada para a exportação em 1990.

R: Ŷ=5,72 toneladas

ANO198

3198

4198

5198

6198

7198

8198

9QUANTIDA

DE50 46 36 31 25 11 18