Aula 2 Regressão e Correlação Linear · Esse coeficiente deve indicar o grau de intensidade da...
Transcript of Aula 2 Regressão e Correlação Linear · Esse coeficiente deve indicar o grau de intensidade da...
2
Regressão e Correlação Quando consideramos a observação de duas ou mais
variáveis, surge um novo problema:-as relações que podem existir entre as variáveis estudadas.
Assim, quando consideramos variáveis como por exemplo:-peso e altura de um grupo de pessoas;-uso de cigarro e incidência de câncer;-horas trabalhadas e salário à receber; etc...
Procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação.
Sendo a relação entre as variáveis de natureza
quantitativa, dizemos que a correlação é o
instrumento adequado para descobrir e medir essa relação.
Uma vez caracterizada a relação, procuramos descrevê-la
através de uma função matemática. A regressão é o
instrumento adequado para a determinação dos parâmetros da função.
3
Correlação
As relações entre grandezas do tipo: perímetro e lado de um quadrado são conhecidas como relações funcionais, pois existe uma função que associa uma à outra. Aqui, perímetro = 4 x lado.
Enquanto que as grandezas do tipo: peso e altura são conhecidas como relações estatísticas, uma vez que, apesar de podermos fazer uma estimativa do peso de uma pessoa baseando-se na sua altura, não podemos formalizar uma expressão matemática.
Quando duas variáveis estão ligadas por uma relação
estatística, dizemos que existe correlação entre elas.
4
Correlação
Diagrama de dispersãoConsideremos uma amostra aleatória, formada por dez dos 98 alunos desta
classe e pelas notas obtidas por eles em Matemática Financeira e Estatística.Representando, em um plano
cartesiano, os pares ordenados (x,y), obtemos uma nuvem de pontos que
denominamos diagrama de dispersão.
Aluno Notas
Mat. Finaceira Estatística
A 5,0 6,0
M 8,0 9,0
O 7,0 8,0
T 10,0 10,0
Od 6,0 5,0
Os 7,0 7,0
V 9,0 8,0
Oc 3,0 4,0
Ê 8,0 6,0
Xs 2,0 2,0
5
Correlação
Correlação LinearSe os pontos obtidos, vistos em
conjunto, formam uma elipse diagonal, então essa correlação de
forma elíptica tem como “imagem”uma reta, e por isso é denominada
correlação linear.
6
Correlação
ClassificaçãoAssim, uma correlação pode ser:
- Linear positiva: se os pontos têm como imagem uma reta ascendente;
- Linear negativa: se os pontos têm como imagem uma reta descendente;
- Não-linear: se os pontos têm como imagem uma curva.
7
Correlação
Coeficiente de Correlação LinearO instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre as duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).
O coeficiente de correlação de Pearson é dado por:
Calma! Essa fórmula é mais fácil do que parece...
2222
iiii
iiii
yynxxn
yxyxnr
8
Correlação
2222
iiii
iiii
yynxxn
yxyxnr
Quando: r = +1 então há correlação positiva entre duas variáveis;r = -1 então há correlação negativa;
r = 0 então não há correlação entre as variáveis.
Onde: r → é o coeficiente de correlação;r está sempre entre -1 e 1n → é o número de observações;
xi e yi → são as observações de uma mesma linha.
O numerador é a diferença entre “ o somatório de „xi e yi‟ multiplicado por
„n‟ ” e “ o produto entre o somatório de „xi‟ e o somatório de „yi‟ ”
O denominador é o produto entre “ o somatório dos quadrados de xi
multiplicado por n menos o quadrado do somatório de xi ” e “ a
mesma coisa só que y ao invés de x ”.
9
Correlação
Para que o Coeficiente de Correlação de Pearson possa descrever um resultado expressivo, é imprescindível que ele se aproxime de uma função linear. Isso ocorre quando verificamos que o diagrama de dispersão se comporta aparentemente como uma reta.
Algebricamente, podemos tirar conclusões segundo os parâmetros:
0,6 ≤ | r | ≤ 1 → Ideal
0,3 ≤ | r | < 0,6 → Correlação Fraca
0 < | r | < 0,3 → Correlação Muito Fraca
Não serve!
r = 0 → Não existe Correlação.
10Exemplo:Vamos calcular o coeficiente de correlação da tabela que segue:
Aluno Notas
Mat. Finaceira Estatística
A 5,0 6,0
M 8,0 9,0
O 7,0 8,0
T 10,0 10,0
Od 6,0 5,0
Os 7,0 7,0
V 9,0 8,0
Oc 3,0 4,0
Ê 8,0 6,0
Xs 2,0 2,0
Total
xifi xi2 yi
2
2222
iiii
iiii
yynxxn
yxyxnr
12
Regressão
Ajustamento da RetaSempre que desejamos estudar determinada variável em
função de outra fazemos uma análise de regressão.
Supondo “ X ” a variável independente e “ Y ” a
dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja,
vamos obter uma função definida por: Y = aX + bonde “a” e “b” são parâmetros.
A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas
variáveis, partindo de “ n ” observações das mesmas.
A variável a qual desejamos fazer uma estimativa recebe
o nome de variável dependente e a outra recebe o
nome de variável independente.
13
Regressão
Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora não perfeita, como as que formam a tabela a seguir:
xi 5 8 7 10 6 7 9 3 8 2
yi 6 9 8 10 5 7 8 4 6 2
Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por:
Y = aX + b. Onde:“n” é o número de
observações;“ x ” é a média dos
valores de x;“ y ” é a média dos
valores de y.
14
Regressão
Vamos então completar a tabela:
5,0 6,0
8,0 9,0
7,0 8,0
10,0 10,0
6,0 5,0
7,0 7,0
9,0 8,0
3,0 4,0
8,0 6,0
2,0 2,0
Total
xiyi xi2 yi
2
a = ?x = ?y = ?b = ?Y = ?
15
Regressão
Solução:
Assim, podemos estimar valores que não pertenciam à tabela inicial:
Exemplo:Se X = 4,0, temos
Y = 4,33Se X = 1,0, temos
Y = 1,75
16Exemplo:Calcule o ajustamento de uma reta para os dados:
xi 2 4 6 8 10 12 14
Yi 30 25 22 18 15 11 10
∑xiyi = ?∑xi
2 = ?
17
1 – A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura:
Testando seus conhecimentos
Temperatura 10 15 20 25 30
Comprimento 1,003 1,005 1,010 1,011 1,014
a) Construa o diagrama de dispersão;b) Calcule o coeficiente de correlação;c) O ajustamento da reta;d) O valor estimado do comprimento da barra para uma temperatura de 18º C;e) O valor estimado da temperatura quando a barra medir exatamente 1