4 251
0011 0010
UNIVERSIDADE FEDERAL DE UBERLÂNDIAFACULDADE DE MATEMÁTICA
PROJETO PIBEG
Unidade
Ajuste de curvas
4 251
0011 0010
1 – Introdução
2 – Quadrados Mínimos (Caso discreto – Modelo linear)
3 – Quadrados Mínimos (Caso discreto – Modelo não linear) 3.1 – Teste de alinhamento 4 – Quadrados Mínimos (Caso contínuo)
Sumário:
4 251
0011 0010
1 – Introdução
4 251
0011 0010
Obter uma função matemática que represente (ou que ajuste)
estes dados, permite fazer simulações do processo, reduzindo
assim repetições de experimentos que podem ter um custo alto.
Em geral, experimentos em laboratório geram um conjunto de
dados que devem ser analisados com o objetivo de determinar
certas propriedades do processo em análise.
1 1.5 2 2.5 3 3.5 4 4.5 50
2
4
6
8
10
12
14
4 251
0011 0010
Nesta unidade será estudado uma das técnicas mais utilizadas
para se ajustar dados, conhecida com Método dos Quadrados
Mínimos (MQM).
4 251
0011 0010
2 – Quadrados Mínimos
Caso discreto - Modelo linear
4 251
0011 0010
Seja uma tabela de pontos (xi, yi), i = 0, 1,..., m, xi [a, b].O problema de ajuste de curvas consiste em escolher n funçõesg1, g2,..., gn contínuas e linearmente independentes em [a, b] e obter n constantes ,,...,n tais que:
Este é um modelo linear porque a função (x) utilizada no
ajuste dos pontos é linear nos parâmetros j, embora as funções
gj(x) possam ser não-lineares (ex.: ex, 1 + x2, ln(x) ).
xk) = g1(xk) + g2(xk) +...+ ngn(xk)
seja uma boa aproximação para os pontos y(xk), ou seja, k ≈ yk.
4 251
0011 0010
A escolha das funções gj(x) pode ser feita observando
o gráfico dos pontos tabelados,
chamado de diagrama de dispersão,
Através do qual podemos observar o tipo de curva
que melhor se ajusta aos dados.
4 251
0011 0010
Exemplo 1: Considere a seguinte tabela de pontos.
xk 0.1 0.2 0.5 0.7 0.8 0.9 1.1 1.23 1.35 1.5 1.7 1.8
yk 0.19 0.36 0.75 0.91 0.96 0.99 0.99 0.94 0.87 0.75 0.51 0.35
A análise do diagrama de dispersão mostra que a função que procuramos se comporta como uma parábola.
Logo poderíamos escolher as funções g1(x) = 1, g2(x) = x e g3(x) = x2, pois (x) = g1(x) + g2(x) + 3g3(x) representa uma família de parábolas, e com a escolha adequada dos j teremos aquela que melhor se ajusta aos pontos.
0 0.5 1 1.5 20
0.2
0.4
0.6
0.8
1
4 251
0011 0010
Para obter a curva que melhor se ajusta a função tabelada a idéia
é impor que o desvio em relação à função aproximada seja o menor
possível, ou seja:dk = |yk – (xk)|
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2-1.5
-1
-0.5
0
0.5
1
1.5
(x)yk
d1
d2d3
dk
4 251
0011 0010
O Método dos Quadrados Mínimos consiste em escolher j de tal forma que a soma dos quadrados dos desvios seja mínima:
m
kkk
m
kk xyd
1
2
1
2 )(
m
kknnkkk
m
kk xgxgxgyd
1
22211
1
2 )()()(
isto é, encontrar os parâmetros j que minimizam a função:
m
k
x
knnkkn
k
xgxgyF1
2
)(
1121 ]))(...)(([),...,,(
4 251
0011 0010
A função F é uma função quadrática que satisfaz F() ≥ 0 .
Isto é, uma função limitada inferiormente e portanto tem um ponto
de mínimo.
mR
O ponto crítico de F() é encontrado igualando seu gradiente a
zero:
.,...,2 ,1 0),...,( 1
njF
nj
Desta forma temos:
m
k 12 [yk – 1g1(xk) - 2g2(xk) – ... – ngn(xk)](-gj(xk)) = 0
4 251
0011 0010
A equação anterior pode ser reescrita como:
Assim, para obter j temos que resolver o seguinte sistema:
nnnnnnn
n
n
n
b
b
b
b
AAAA
AAAA
AAAA
AAAA
3
2
1
3
2
1
321
3333231
2232221
1131211
onde,
m
kn
m
k
m
k
m
k
m
kn
m
k
m
k
m
k
m
kn
m
k
m
k
m
k
112
11
1
112
11
1
112
11
1
g1(xk)g1(xk) g2(xk)g1(xk) gn(xk)g1(xk) yk g1(xk)
g1(xk)g2(xk) g2(xk)g2(xk) gn(xk)g2(xk) yk g2(xk)
g1(xk)gn(xk) g2(xk)gn(xk) gn(xk)gn(xk) yk gn(xk)
gi(xk)gj(xk)
yk gi(xk)
m
ki
m
kij
b
A
1
1
Observação
4 251
0011 0010
No exemplo anterior ajustamos os dados a uma parábola, mas outras funções bases poderiam ser usadas.
Como exemplo, poderíamos pensar que os dados representam o primeiro meio período de uma função senoidal.
A soma dos quadrados dos desvios em cada ponto tabelado fornece uma medida que pode ser usada como parâmetro de comparação entre ajustes diferentes.
n
kkk xyd
1
2)]([
E neste caso poderíamos tomar (x) = 1 + sen(x). Afinal qual seria a melhor escolha?
2
4 251
0011 0010
Aplicando o Método dos Quadrados Mínimos para o caso da função senoidal, obtém-se:
xsenx
20193.10136.0)(
0 0.5 1 1.5 20.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
4 251
0011 0010
Calculando a soma dos quadrados dos desvios para cada caso:
00011.0)]()([12
1
2
k
kk xxySr Parábola:
Portanto, para este caso, o melhor ajuste foi obtido usando a parábola.
Senóide: 02835.0)]()([12
1
2
k
kk xxySr
4 251
0011 0010
2.1 – Coeficiente de correlação (r)
Fornece uma medida do percentual de pontos bem ajustados:.
t
rt
S
SSr
2
2
1
m
kmkt yyS
2
1
m
kikr yS
m
yy
m
kk
m
1
onde,
4 251
0011 0010
3 – Quadrados Mínimos
Caso discreto - Modelo não linear
4 251
0011 0010
Existem casos, onde o diagrama de dispersão de uma função indica que os dados devem ser ajustados por uma função que não é linear com relação aos parâmetros j.
Como exemplo, considere os seguintes dados:
xk -1.0 -0.5 0 0.5 1 1.5 2.0 2.5 3
yk 0.157 0.234 0.350 0.522 0.778 1.162 1.733 2.586 3.858
Observando o diagrama podemosconsiderar que os dados tem um comportamento exponencial, quenos sugere o seguinte ajuste:
xex 21)(
-1 -0.5 0 0.5 1 1.5 2 2.5 30
0.5
1
1.5
2
2.5
3
3.5
4
4 251
0011 0010
Para aplicar o Método dos Quadrados Mínimos torna-se necessário efetuar uma linearização do problema.
A linearização da função escolhida para ajustar os pontos anteriores deve ser feita da seguinte forma:
xzxzex x211 ln))(ln()( 2
Fazendo 1 = ln1 e 2 = 2 o problema consiste em ajustar os dados de z pela reta:
z(x) = 1 + 2x
4 251
0011 0010
Para isso devemos construir uma nova tabela com os dados de
zk = ln(yk) = 1 + 2x.
xk -1.0 -0.5 0 0.5 1 1.5 2.0 2.5 3
yk 0.166 0.189 0.250 0.600 0.800 1.200 1.800 2.640 3.700
zk = ln(yk) -1.796 -1.666 -1.386 -0.511 -0.223 0.182 0.588 0.971 1.308
9
1
22121 )]()([),(
kkk xxzF
Resolvendo o sistema anterior obtemos a seguinte solução:= -1.114 2 = 0.832
9
1
9
1
2
1
9
1
29
1
9
1
9
1)1(
kkk
kk
kk
kk
kk
k
xz
z
xx
x
4 251
0011 0010
Desta forma os valores de j são dados por:
832.0
328.0
22
11
e
Portanto temos: xx eex 832.0
1 328.0)( 2
-2 -1 0 1 2 3 40
1
2
3
4
5
4 251
0011 0010
Para calcular o coeficiente de correlação escrevemos a seguintetabela:
2606.19
9
1
kky
y
1644.1229
1
kmkt yyS
1066.029
1
kikr yS
yk (yk – y )2 k (yk - k)2
0,166 1,1980 0,1427 0,0005
0,189 1,1482 0,2164 0,0007
0,25 1,0212 0,3280 0,0061
0,6 0,4363 0,4972 0,0106
0,8 0,2121 0,7537 0,0021
1,2 0,0037 1,1425 0,0033
1,8 0,2910 1,7320 0,0046
2,64 1,9029 2,6255 0,0002
3,7 5,9509 3,9799 0,0783
∑ 12,1644 0,1066
9912,01644.12
1066.01644.122
t
rt
S
SSr
9956.0r
4 251
0011 0010
Linearização de algumas curvas:
1
2121
xzx
y
• Curva Hiperbólica
• Curva Exponencial
• Curva Geométrica
xzy x2121 )(
)ln()ln()ln(
21
2112
tz
xyxy
yz 1 onde
)ln( , )ln( , )ln( onde 2211 yz
2211 ),ln(
),(ln),(ln onde
xtyz
4 251
0011 0010
Uma vez escolhida uma função não linear em 1, 2,..., n para ajustar uma função dada, uma forma de verificarmos se a escolha feita foi razoável é aplicarmos o teste de alinhamento, que consiste em:
3.1 – Teste de Alinhamento
i) fazer a “linearização” da função não linear escolhida;
ii) fazer o diagrama de dispersão dos novos dados;
iii) se os pontos do diagrama (ii) estiverem alinhados, istosignificará que a escolha da função foi adequada.
4 251
0011 0010
Exemplo 4: Considere a função dada pela tabela:
xk -8 -6 -4 -2 0 2 4
yk 30 10 9 6 5 4 4
Qual das funções xabxy )(
Em primeiro lugar devemos linearizar as funções:
:obtemos ,)( De tabxy
a) ou b)
ajustaria melhor os dados da tabela?bxa
xy
1
)(
bxaxz )(1
bxaxz lnln)(2
xk -8 -6 -4 -2 0 2 4
z1=1/yk 0.03 0.10 0.11 0.17 0.20 0.25 0.25
xk -8 -6 -4 -2 0 2 4
z2=ln(yk) 3.40 2.30 2.20 1.79 1.61 1.39 1.39
:obtemos , 1
)( Debxa
xy
4 251
0011 0010
Fazendo o diagrama de dispersão para cada função:
bxaz 1 bxaz lnln2
-8 -6 -4 -2 0 2 40
0.05
0.1
0.15
0.2
0.25
0.3
0.35
-8 -6 -4 -2 0 2 41
1.5
2
2.5
3
3.5
Vemos que os dados de z1 = a + bx se aproximam mais de uma reta. Assim, devemos escolher para ajustar os dados.bxay 1
4 251
0011 0010
4 – Quadrados Mínimos
Caso contínuo
4 251
0011 0010
No caso contínuo temos uma função f(x) dada num intervalo [a, b] e não mais uma tabela de pontos.
O procedimento é análogo ao caso discreto. Escolhidas as funções bases gj devemos determinar a função xk) = g1(xk) + g2(xk) +...+ ngn(xk) de modo que o desvio seja mínimo, onde:
b
a
dxxxfd 2)()(
Neste caso os j também são determinados pela resolução de um sistema, onde os elementos Aij são obtidos por intermédio do produto interno entre as funções gi(x) e gj(x).
E os elementos bi pelo produto interno entre f(x) e gj(x), ou seja:
b
ajiij dxxgxgA )()(
b
aji dxxgxfb )()(
Top Related