Download - 4 2 5 1 0011 0010 UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA PROJETO PIBEG Unidade Ajuste de curvas.

Transcript

4 251

0011 0010

UNIVERSIDADE FEDERAL DE UBERLÂNDIAFACULDADE DE MATEMÁTICA

PROJETO PIBEG

Unidade

Ajuste de curvas

4 251

0011 0010

1 – Introdução

2 – Quadrados Mínimos (Caso discreto – Modelo linear)

3 – Quadrados Mínimos (Caso discreto – Modelo não linear) 3.1 – Teste de alinhamento 4 – Quadrados Mínimos (Caso contínuo)

Sumário:

4 251

0011 0010

1 – Introdução

4 251

0011 0010

Obter uma função matemática que represente (ou que ajuste)

estes dados, permite fazer simulações do processo, reduzindo

assim repetições de experimentos que podem ter um custo alto.

Em geral, experimentos em laboratório geram um conjunto de

dados que devem ser analisados com o objetivo de determinar

certas propriedades do processo em análise.

1 1.5 2 2.5 3 3.5 4 4.5 50

4 251

0011 0010

Nesta unidade será estudado uma das técnicas mais utilizadas

para se ajustar dados, conhecida com Método dos Quadrados

Mínimos (MQM).

4 251

0011 0010

2 – Quadrados Mínimos

Caso discreto - Modelo linear

4 251

0011 0010

Seja uma tabela de pontos (xi, yi), i = 0, 1,..., m, xi [a, b].O problema de ajuste de curvas consiste em escolher n funçõesg1, g2,..., gn contínuas e linearmente independentes em [a, b] e obter n constantes ,,...,n tais que:

Este é um modelo linear porque a função (x) utilizada no

ajuste dos pontos é linear nos parâmetros j, embora as funções

gj(x) possam ser não-lineares (ex.: ex, 1 + x2, ln(x) ).

xk) = g1(xk) + g2(xk) +...+ ngn(xk)

seja uma boa aproximação para os pontos y(xk), ou seja, k ≈ yk.

4 251

0011 0010

A escolha das funções gj(x) pode ser feita observando

o gráfico dos pontos tabelados,

chamado de diagrama de dispersão,

Através do qual podemos observar o tipo de curva

que melhor se ajusta aos dados.

4 251

0011 0010

Exemplo 1: Considere a seguinte tabela de pontos.

xk 0.1 0.2 0.5 0.7 0.8 0.9 1.1 1.23 1.35 1.5 1.7 1.8

yk 0.19 0.36 0.75 0.91 0.96 0.99 0.99 0.94 0.87 0.75 0.51 0.35

A análise do diagrama de dispersão mostra que a função que procuramos se comporta como uma parábola.

Logo poderíamos escolher as funções g1(x) = 1, g2(x) = x e g3(x) = x2, pois (x) = g1(x) + g2(x) + 3g3(x) representa uma família de parábolas, e com a escolha adequada dos j teremos aquela que melhor se ajusta aos pontos.

0 0.5 1 1.5 20

0.2

0.4

0.6

0.8

4 251

0011 0010

Para obter a curva que melhor se ajusta a função tabelada a idéia

é impor que o desvio em relação à função aproximada seja o menor

possível, ou seja:dk = |yk – (xk)|

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2-1.5

-1

-0.5

0.5

1.5

(x)yk

d2d3

4 251

0011 0010

O Método dos Quadrados Mínimos consiste em escolher j de tal forma que a soma dos quadrados dos desvios seja mínima:

kkk

kk xyd

2 )(

kknnkkk

kk xgxgxgyd

22211

2 )()()(

isto é, encontrar os parâmetros j que minimizam a função:

knnkkn

xgxgyF1

)(

1121 ]))(...)(([),...,,(

4 251

0011 0010

A função F é uma função quadrática que satisfaz F() ≥ 0 .

Isto é, uma função limitada inferiormente e portanto tem um ponto

de mínimo.

O ponto crítico de F() é encontrado igualando seu gradiente a

zero:

.,...,2 ,1 0),...,( 1

njF

Desta forma temos:

k 12 [yk – 1g1(xk) - 2g2(xk) – ... – ngn(xk)](-gj(xk)) = 0

4 251

0011 0010

A equação anterior pode ser reescrita como:

Assim, para obter j temos que resolver o seguinte sistema:

nnnnnnn

AAAA

321

3333231

2232221

1131211

onde,

112

g1(xk)g1(xk) g2(xk)g1(xk) gn(xk)g1(xk) yk g1(xk)

g1(xk)g2(xk) g2(xk)g2(xk) gn(xk)g2(xk) yk g2(xk)

g1(xk)gn(xk) g2(xk)gn(xk) gn(xk)gn(xk) yk gn(xk)

gi(xk)gj(xk)

yk gi(xk)

kij

Observação

4 251

0011 0010

No exemplo anterior ajustamos os dados a uma parábola, mas outras funções bases poderiam ser usadas.

Como exemplo, poderíamos pensar que os dados representam o primeiro meio período de uma função senoidal.

A soma dos quadrados dos desvios em cada ponto tabelado fornece uma medida que pode ser usada como parâmetro de comparação entre ajustes diferentes.

kkk xyd

2)]([

E neste caso poderíamos tomar (x) = 1 + sen(x). Afinal qual seria a melhor escolha?

4 251

0011 0010

Aplicando o Método dos Quadrados Mínimos para o caso da função senoidal, obtém-se:

xsenx

20193.10136.0)(

0 0.5 1 1.5 20.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.1

4 251

0011 0010

Calculando a soma dos quadrados dos desvios para cada caso:

00011.0)]()([12

kk xxySr Parábola:

Portanto, para este caso, o melhor ajuste foi obtido usando a parábola.

Senóide: 02835.0)]()([12

kk xxySr

4 251

0011 0010

2.1 – Coeficiente de correlação (r)

Fornece uma medida do percentual de pontos bem ajustados:.

SSr

kmkt yyS

kikr yS

onde,

4 251

0011 0010

3 – Quadrados Mínimos

Caso discreto - Modelo não linear

4 251

0011 0010

Existem casos, onde o diagrama de dispersão de uma função indica que os dados devem ser ajustados por uma função que não é linear com relação aos parâmetros j.

Como exemplo, considere os seguintes dados:

xk -1.0 -0.5 0 0.5 1 1.5 2.0 2.5 3

yk 0.157 0.234 0.350 0.522 0.778 1.162 1.733 2.586 3.858

Observando o diagrama podemosconsiderar que os dados tem um comportamento exponencial, quenos sugere o seguinte ajuste:

xex 21)(

-1 -0.5 0 0.5 1 1.5 2 2.5 30

0.5

1.5

2.5

3.5

4 251

0011 0010

Para aplicar o Método dos Quadrados Mínimos torna-se necessário efetuar uma linearização do problema.

A linearização da função escolhida para ajustar os pontos anteriores deve ser feita da seguinte forma:

xzxzex x211 ln))(ln()( 2

Fazendo 1 = ln1 e 2 = 2 o problema consiste em ajustar os dados de z pela reta:

z(x) = 1 + 2x

4 251

0011 0010

Para isso devemos construir uma nova tabela com os dados de

zk = ln(yk) = 1 + 2x.

xk -1.0 -0.5 0 0.5 1 1.5 2.0 2.5 3

yk 0.166 0.189 0.250 0.600 0.800 1.200 1.800 2.640 3.700

zk = ln(yk) -1.796 -1.666 -1.386 -0.511 -0.223 0.182 0.588 0.971 1.308

22121 )]()([),(

kkk xxzF

Resolvendo o sistema anterior obtemos a seguinte solução:= -1.114 2 = 0.832

1)1(

kkk

4 251

0011 0010

Desta forma os valores de j são dados por:

832.0

328.0

Portanto temos: xx eex 832.0

1 328.0)( 2

-2 -1 0 1 2 3 40

4 251

0011 0010

Para calcular o coeficiente de correlação escrevemos a seguintetabela:

2606.19

kky

1644.1229

kmkt yyS

1066.029

kikr yS

yk (yk – y )2 k (yk - k)2

0,166 1,1980 0,1427 0,0005

0,189 1,1482 0,2164 0,0007

0,25 1,0212 0,3280 0,0061

0,6 0,4363 0,4972 0,0106

0,8 0,2121 0,7537 0,0021

1,2 0,0037 1,1425 0,0033

1,8 0,2910 1,7320 0,0046

2,64 1,9029 2,6255 0,0002

3,7 5,9509 3,9799 0,0783

∑ 12,1644 0,1066

9912,01644.12

1066.01644.122

SSr

9956.0r

4 251

0011 0010

Linearização de algumas curvas:

2121

xzx

• Curva Hiperbólica

• Curva Exponencial

• Curva Geométrica

xzy x2121 )(

)ln()ln()ln(

2112

xyxy

yz 1 onde

)ln( , )ln( , )ln( onde 2211 yz

2211 ),ln(

),(ln),(ln onde

xtyz

4 251

0011 0010

Uma vez escolhida uma função não linear em 1, 2,..., n para ajustar uma função dada, uma forma de verificarmos se a escolha feita foi razoável é aplicarmos o teste de alinhamento, que consiste em:

3.1 – Teste de Alinhamento

i) fazer a “linearização” da função não linear escolhida;

ii) fazer o diagrama de dispersão dos novos dados;

iii) se os pontos do diagrama (ii) estiverem alinhados, istosignificará que a escolha da função foi adequada.

4 251

0011 0010

Exemplo 4: Considere a função dada pela tabela:

xk -8 -6 -4 -2 0 2 4

yk 30 10 9 6 5 4 4

Qual das funções xabxy )(

Em primeiro lugar devemos linearizar as funções:

:obtemos ,)( De tabxy

a) ou b)

ajustaria melhor os dados da tabela?bxa

)(

bxaxz )(1

bxaxz lnln)(2

xk -8 -6 -4 -2 0 2 4

z1=1/yk 0.03 0.10 0.11 0.17 0.20 0.25 0.25

xk -8 -6 -4 -2 0 2 4

z2=ln(yk) 3.40 2.30 2.20 1.79 1.61 1.39 1.39

:obtemos , 1

)( Debxa

4 251

0011 0010

Fazendo o diagrama de dispersão para cada função:

bxaz 1 bxaz lnln2

-8 -6 -4 -2 0 2 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

-8 -6 -4 -2 0 2 41

1.5

2.5

3.5

Vemos que os dados de z1 = a + bx se aproximam mais de uma reta. Assim, devemos escolher para ajustar os dados.bxay 1

4 251

0011 0010

4 – Quadrados Mínimos

Caso contínuo

4 251

0011 0010

No caso contínuo temos uma função f(x) dada num intervalo [a, b] e não mais uma tabela de pontos.

O procedimento é análogo ao caso discreto. Escolhidas as funções bases gj devemos determinar a função xk) = g1(xk) + g2(xk) +...+ ngn(xk) de modo que o desvio seja mínimo, onde:

dxxxfd 2)()(

Neste caso os j também são determinados pela resolução de um sistema, onde os elementos Aij são obtidos por intermédio do produto interno entre as funções gi(x) e gj(x).

E os elementos bi pelo produto interno entre f(x) e gj(x), ou seja:

ajiij dxxgxgA )()(

aji dxxgxfb )()(

Top Related