cci22-cap05.ppt [Modo de Compatibilidade] - comp.ita.brpauloac/cci22/cap05_p2_slides.pdf · Ajuste...

36
CCI-22 Introdução Método dos Mínimos Quadrados Regressão linear Ajuste de funções não-lineares Ajuste a um polinômio Ajuste a outras curvas Regressão de funções multivariáveis Mensuração da qualidade do ajuste

Transcript of cci22-cap05.ppt [Modo de Compatibilidade] - comp.ita.brpauloac/cci22/cap05_p2_slides.pdf · Ajuste...

CCI-22

� Introdução

� Método dos Mínimos Quadrados

� Regressão linear

� Ajuste de funções não-lineares� Ajuste de funções não-lineares

� Ajuste a um polinômio

� Ajuste a outras curvas

� Regressão de funções multivariáveis

� Mensuração da qualidade do ajuste

AJUSTE A UM POLINÔMIO� Se a curva f for ajustada a um polinômio de grau n,

teremos f*(x) = a0 + a1x + ... + anxn

� Seguindo o mesmo procedimento anterior, chegaremos ao seguinte sistema linear:

=

∑∑∑∑∑

∑∑∑∑∑

∑∑∑∑

+++

+

ii

ni

iii

ii

n

i

ni

i

ni

i

ni

i

ni

i

ni

i

ni

ii

ii

ii

ii

i

ni

ii

ii

ii

yx

yx

y

a

a

a

xxxxx

xxxxx

xxxxm

MM

L

MOMMMM

L

L

1

0

2321

1432

32

.

EXEMPLO 2

� Os dados abaixo correspondem ao volume do álcool anídrico em função da temperatura. Considerando um volume inicial de 1cm3 a 0°C, deseja-se uma tabela do volume para temperaturas entre 20 e 40°C

t (°C) 13,9 43,0 67,8 89,0 99,2

v (cm3) 1,04 1,12 1,19 1,24 1,27

� Ajustaremos v(t) à um polinômio de grau 2. Considerando o volume inicial, temos v (t) = 1 + a t + a tinicial, temos v*(t) = 1 + a1t + a2t2

� Sistema de equações normais para as demais constantes:

=

∑∑

∑∑

iii

iii

ii

ii

ii

ii

vt

vt

a

a

tt

tt

2

2

1

43

32

.

=

0202,5661

142,66.

10.841675,110.0750189,2

10.0750189,269,24400

2

1

86

6

a

a

a1 = 0,003068189 a2 = 1,548545.10-7

t 13,9 20 25 30 35 40 43,0 67,8 89,0 99,2

v 1,04 1,12 1,19 1,24 1,27

v* 1,04 1,06 1,08 1,09 1,11 1,12 1,13 1,21 1,27 1,31

GRÁFICO DO EXEMPLO 2

EXEMPLO 3

� Ajuste um polinômio de segundo grau aos dados abaixo

A partir dos dados podemos construir o sistema:

x 0 1 2 3 4 5

y 2,1 7,7 13,6 27,2 40,9 61,1

� A partir dos dados podemos construir o sistema:

� m=6

� ∑xi = 15 ∑yi = 152,6 ∑xi2 = 55 ∑xi

3 = 55

� ∑xi4 = 979 ∑xi yi = 585,6 ∑xi

2 yi = 2488,8

=

∑∑∑

∑∑∑∑∑∑∑∑

ii

ii

i

iii

iii

ii

yx

yx

y

a

a

a

xxx

xxx

xxm

2

2

1

0

432

32

2

.

EXEMPLO 3 - CONTINUAÇÃO

� Logo,

=

6,585

6,152

.2255515

55156

1

0

a

a

� Resolvendo o sistema, se obtém:� a0 =2,47857 a1=2,35929 a2 =1,86071� Resolução alternativa no Matlab:

8,248897922555

2a

x=[0 1 2 3 4 5]

y=[2,1 7,7 13,6 27,2 40,9 61,1]

polyfit(x,y,2)

1,86071 2,35929 2,47857

GRÁFICO DO EXEMPLO 3

CCI-22

� Introdução

� Método dos Mínimos Quadrados

� Regressão linear

� Ajuste de funções não-lineares� Ajuste de funções não-lineares

� Ajuste a um polinômio

� Ajuste a outras curvas

� Regressão de funções multivariáveis

� Mensuração da qualidade do ajuste

AJUSTE À CURVA EXPONENCIAL� Também é possível ajustar f a uma curva exponencial,

fazendo-se antes uma mudança de variável:� f*(x) = c1ekx, onde c1 e k são constantes� ln f*(x) = ln c1 + kx� z*(x) = c2 + kx, onde z*(x) = ln f*(x)� z* e x estão relacionados linearmente: basta resolver a � z* e x estão relacionados linearmente: basta resolver a

regressão linear� Depois de resolvido esse sistema, volta-se ao problema

original

EXEMPLO

x -1,0 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,0

f(x) 36,547 17,264 8,155 3,852 1,820 0,860 0,406 0,246

A dispersão dos dados sugere um ajuste à

curva exponencial, ver próximo slide

z*(x) = c2 + kx, onde z*(x) = ln f*(x)

próximo slide

x -1,0 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,0

z(x) = ln f(x) 3,599 2,849 2,099 1,349 0,599 -0,151 -0,901 -1,402

=

∑∑

iii

ii

ii

ii

ii

xz

z

k

c

xx

xm2

2.

=

646,8

041,8.

59,33,0

3,08 2

k

c

c2 = 1,099

k = -2,5

ln f*(x) = 1,099 – 2,5x

f*(x) = 3,001e– 2,5x

GRÁFICO DE DISPERSÃO

RESULTADO DA REGRESSÃO

Gráfico x vs. ln(y) Gráfico x vs. y

AJUSTE A OUTRAS CURVAS� Equação de Potência: f*(x) = axb

� ln f*(x) = ln a + b.ln x� Sejam z* = ln f*(x) e t = ln x� Portanto, z*(t) = ln a + bt� z* e t estão relacionados linearmente

� Equação f*(x) = abx

� ln f*(x) = ln a + x.ln b� ln f*(x) = ln a + x.ln b� Seja z*(x) = ln f*(x) � Portanto, z*(x) = ln a + x.ln b� z* e x estão relacionados linearmente

� Equação de saturação: f*(x) = ax/(b+x)� 1/f*(x) = b/(ax)+1/a� Seja z* = 1/f*(x) e t=1/x� Portanto, z*(t) = t*b/a + 1/a� z* e t estão relacionados linearmente

CCI-22

� Introdução

� Método dos Mínimos Quadrados

� Regressão linear

� Ajuste de funções não-lineares� Ajuste de funções não-lineares

� Ajuste a um polinômio

� Ajuste a outras curvas

� Regressão de funções multivariáveis

� Mensuração da qualidade do ajuste

REGRESSÃO LINEAR MÚLTIPLA

� É possível estender a regressão linear para o caso de funções lineares de múltiplas variáveis como:� f(x1 , x2 , x3 ..., xn )

� Tomando por exemplo o caso:� f(x1 , x2) = a0 + a1 .x1 + a2 .x2� f(x1 , x2) = a0 + a1 .x1 + a2 .x2

� Define-se a função resíduo como :� R = ∑ (a0 + a1x1i + a2 .x2i – yi)2 , onde o somatório engloba todos os

pontos de ajuste. Isto é, 0 ≤ i ≤ m.

� Para que R seja mínimo, é necessário que:�∂R/∂a0 = 0

� ∂R/∂a1 = 0

�∂R/∂a2 = 0

REGRESSÃO LINEAR MÚLTIPLA� R = ∑ (a0 + a1x1i + a2 .x2i – yi)2

� ∂R/∂a0 = 2 ∑ (a0 + a1x1i + a2 .x2i – yi) = 0� ∂R/∂a1 = 2 ∑ x1i (a0 + a1x1i + a2 .x2i – yi) = 0� ∂R/∂a2 = 2 ∑ x2i (a0 + a1x1i + a2 .x2i – yi) = 0

� Temos então um sistema linear com três incógnitas (a0 , a1 e a2) e três equações,Este sistema pode ser escrito na forma matricial abaixo e resolvido � Este sistema pode ser escrito na forma matricial abaixo e resolvido através de um método numérico, tal como a eliminação de Gauss.

� Desta forma, determina-se o plano que ajusta os pontos tridimensionais dados pelo critério dos mínimos quadrados.

=

∑∑∑

∑∑∑∑∑∑∑∑

ii

ii

i

iiii

iiii

ii

yx

yx

y

a

a

a

xxxx

xxxx

xxm

2

1

2

1

0

2

2212

21

2

11

21

.

.

.

CCI-22

� Introdução

� Método dos Mínimos Quadrados

� Regressão linear

� Ajuste de funções não-lineares� Ajuste de funções não-lineares

� Ajuste a um polinômio

� Ajuste a outras curvas

� Regressão de funções multivariáveis

� Mensuração da qualidade do ajuste

TESTE DE ALINHAMENTO� Há uma maneira simples de averiguar se a curva de

ajuste foi ou não bem escolhida:� Nos m pontos experimentais {(x1,y1), ..., (xm,ym)}, calcular as

correspondentes trocas de variáveis� Por exemplo, zi = ln yi, 1≤i≤m

� Fazer o diagrama de dispersão desses novos dados (z,x)� Fazer o diagrama de dispersão desses novos dados (z,x)� Verificar o alinhamento dos pontos

x -1,0 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,0

Y=f(x) 36,547 17,264 8,155 3,852 1,820 0,860 0,406 0,246

x -1,0 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,0

z(x) = ln f(x) 3,599 2,849 2,099 1,349 0,599 -0,151 -0,901 -1,402

TESTE DE ALINHAMENTO

MENSURAÇÃO DA QUALIDADE DA

REGRESSÃO-LINEAR

� Quanto maior a qualidade da regressão, menor será o valor da função resíduo:� R =∑(f*(xi )-yi )2

� Pode-se definir o resíduo em relação a média como:� RM =∑(y* -yi )2 , onde y* = ∑iyi/m

� Define-se o coeficiente de determinação de um ajuste decurvas como:

� O coeficiente de correlação é definido como:

� Em um ajuste perfeito, r=r2= 1. Quanto mais próximo de 1for o coeficiente de determinação melhor o ajuste.

M

M

R

RRr

=2

M

M

R

RRr

=

EVOLUÇÃO DA POPULAÇÃO BRASILEIRA

� A tabela abaixo fornece dados de evolução da população brasileira (em milhões de habitantes) , ajuste uma curva a este dados e projete o valor da população no ano 2000.

ano 1872 1890 1900 1920 1940 1950 1960 1970 1980 1991

Hab. 9,9 14,3 17,4 30,6 41,2 51,9 70,2 93,1 119,0 146,2

EVOLUÇÃO DA POPULAÇÃO BRASILEIRA

HIPÓTESE: RELAÇÃO EXPONECIAL

� Fazendo o ajuste para y=a*ebx , obtemos os seguintes coeficientes:� 0.0229 -40.6088

� Dessa forma, a = 2.3111*10-18 e b=0,0229� Dessa forma, a = 2.3111*10-18 e b=0,0229

� O coeficiente de determinação pode ser calculado como: 0,9955

EVOLUÇÃO DA POPULAÇÃO BRASILEIRA -LINEARIZAÇÃO VIA LN(Y) VS X

EVOLUÇÃO DA POPULAÇÃO BRASILEIRA

� Coeficiente de determinação r2 = 0,9955

EXEMPLO

� Um objeto é suspenso em um túnel de vento e a força é medida em diversos níveis de velocidade:

x (m/s) 10 20 30 40 50 60 70 80

y (N) 25 70 380 550 610 1220 830 1450

� Através de regressão por mínimos quadrados tente ajustar estes dados com: uma reta, uma equação de potência. Verifique qual o melhor ajuste através do coeficiente de determinação e do teste de hipótese.

AJUSTE A UMA RETA

∑ x .y = 318250 ; ∑ x 2 = 20400

a0 = y* – a1x*∑ixi.yi – (∑ixi.∑iyi)/m

∑ixi2 – (∑ixi)2/m

a1 = y* = ∑iyi/m x* = ∑ixi/m

� ∑ixi.yi = 318250 ; ∑ixi2 = 20400

� ∑ixi = 360 ∑iyi = 5135 � y* = 5135/8=641,875 x*=360/8=45� Assim� a1 = 19,4702 a0= -234,2857

REGRESSÃO LINEAR DE X VS Y

� Coeficiente de determinação r2 = 0,8805

AJUSTE A UMA EQUAÇÃO DE POTÊNCIA

Uso de ln(x) e ln(y)

a0 = y* – a1x*∑ixi.yi – (∑ixi.∑iyi)/m

∑ixi2 – (∑ixi)2/m

a1 = y* = ∑iyi/m x* = ∑ixi/m

� Uso de ln(x) e ln(y)� y=a*xb => ln(y)= ln(a)+b*ln(x)� Determina-se os coeficientes:� a1 = 1.9842 a0 = -1.2941

REGRESSÃO LINEAR DE LN(X) VS. LN(Y)

� Coeficiente de determinação r2 = 0,9481

REGRESSÃO LINEAR DE LN(X) VS LN(Y)

� Os dados obtidos para a regressão linear foram� a1 = 1,9842� a0 = -1,2941

� Assim poder-se-ia estimar a força através de:� Assim poder-se-ia estimar a força através de:� F(v)= 0,2741*v1,98

� De fato, a resistência do ar pode ser representada por: � F= c.v2 , onde c é uma constante de proporcionalidade

chamada de coeficiente de arrasto (kg/s)

TESTE DE HIPÓTESE

� Teste da Hipótese de uma Reta� Faz-se o ajuste de uma reta para:� (y medido, y estimado por uma reta)

� Teste da Hipótese de uma Equação de Potência� Faz-se o ajuste de uma reta para:� (y medido, y estimado pela equação de potência)

� Em uma estimativa perfeita um gráfico ( y medido, y estimado) será:� Uma reta com coeficientes:� a1 = 1� a0 = 0

� Desenhando estes gráficos e calculando o ajuste linear obtemos:

TESTE DE HIPÓTESE PARA A RETA

TESTE DE HIPÓTESE PARA A EQUAÇÃO DE

POTÊNCIA

TESTE DE HIPÓTESES

� RETA:� Os coeficientes do ajuste linear são:� a1 = 0.8805� a0 = 76.7135� Coeficiente de determinação r2 = 0,8805� Coeficiente de determinação r2 = 0,8805

� Equação de Potência:� Os coeficientes são:� a1 = 1.0497 � a0 = -18.6452� Coeficiente de determinação r2 = 0,9481

REGRESSÃO LINEAR DE LN(X) VS LN(Y)

� Os dados obtidos para a regressão linear foram� a1 = 1,9842� a0 = -1,2941

� Assim poder-se-ia estimar a força através de:� Assim poder-se-ia estimar a força através de:� F(v)= 0,2741*v1,98

� De fato, a resistência do ar pode ser representada por: � F= c.v2 , onde c é uma constante de proporcionalidade

chamada de coeficiente de arrasto (kg/s)