Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O...

15
1 Tópicos em Identificação de Sistemas Não Lineares Ricardo J. G. B. Campello 2 Modelos Polinomiais Modelo Polinomial de Ordem M :

Transcript of Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O...

Page 1: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

1

Tópicos em Identificação de Sistemas Não Lineares

Ricardo J. G. B. Campello

2

Modelos PolinomiaisModelo Polinomial de Ordem M :

Page 2: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

2

3

Modelos PolinomiaisSão uma generalização não linear do modelo ARMAX ⇒ NARMAX.

Na ausência de dinâmicas não modeladas e perturbações coloridas e(k) := y(k) - ŷ(k) é um ruído branco aditivo na saída e pode ser removido do modelo: Generalização do modelo ARX ⇒ NARX.

Exemplo:

Modelo polinomial NFIR ⇒ Volterra.

)1()1(1.0)1(3.0)1(9.0)(ˆ −−+−+−= kukykukyky

modelo bilinear

4

Modelos PolinomiaisIdentificação de modelos polinomiais:

� Propriedade 1: modelo é capaz de aproximar com precisão arbitrária qualquer sistema que admita representação entrada-saída com mapeamento H contínuo e regressores em um domínio compacto.

� Propriedade 2: modelo é linear nos parâmetros ⇒ ŷ(k) = θθθθT λλλλ’(k)

� EPC: Como são os vetores de parâmetros θθθθ e de regressão λλλλ’(k) ?

� Problema: dim(θθθθ) cresce exponencialmente com M, nu, ny e ne.

� Solução: identificação de estrutura (Aguirre et al., 1998; Aguirre, 2004).

� Ordem polinomial M e ordens dos regressores nu, ny e ne .

� Coeficientes nulos (modelo incompleto).

Page 3: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

3

5

Modelos RacionaisModelo Racional = razão de dois modelos polinomiais a e b.

Mais genérico ⇒ Mais flexível ⇒ Maior capacidade de aproximação para polinômios de ordem arbitrária.

Contrapartida (Aguirre, 2004):

� Não linear nos parâmetros; ou

� Saída correlacionada com o erro mesmo para ruído aditivo branco.

6

Modelos de VolterraFundamentos iniciaram-se com V. Volterra em 1887, através do estudo de funcionais do tipo:

(1)

Domínio de integração no tempo (contínuo) é genericamente dado por Γ=(-∞,∞), mas para representação causal tem-se Γ=[0,∞) e considerando u(t<0)=0 obtém-se Γ=[0,t] .Evidentemente trata-se de uma generalização do modelo linear de convolução.O primeiro termo (m=1) equivale ao modelo linear e os demais termos são generalizações não lineares de ordem m.O kernel (núcleo) de Volterra hm é uma generalização de dimensão m da função de resposta ao impulso de um sistema linear.

ii

m

i

mm

m

dtuhty τττττ )(),,,( )(1

21

1

−= ∏∫∑ ∫=

Γ

LL

saída entradam-ésimo kernel

Page 4: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

4

7

Modelos de Volterra (cont.)Claramente, o modelo de Volterra é uma representação do tipo:

(2)

que é válida para sistemas dinâmicos não-lineares nos quais a não linearidade em si ( no caso o operador H ) não possui dinâmica, o que exclui, e.g., histerese e backslash.Se o operador não linear for analítico, pode-se aproximá-lo por um desenvolvimento em série de Taylor que resulta no modelo de Volterra (generalização do desenvolvimento utilizado para obter o modelo de convolução).O desenvolvimento em série de Taylor converge se a entrada e os kernels forem limitados superior e inferiormente.A convergência da série implica que, na prática, é possível truncá-la a partir de um ponto além do qual os termos de ordem superior podem ser desprezados.

( )Γ∈= )}({)( ττuHty

8

Modelos de Volterra (cont.)A representação aproximada (truncada) de ordem finita M é dada por:

(3)

A versão de tempo discreto desse modelo é dada por:

(4)

O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal do tipo em (2), porém discreto, cujo operador não linear seja contínuo e possua fading memory(desde que a entrada seja limitada inferior e superiormente).

∑ ∑ ∑ ∏= = = =

−=M

m

k

n

k

n

i

m

i

mm

m

nkunnnhky1 0 0 1

21

1

)(),,,( )( LL

ii

m

i

M

m

t t

mm dtuhty τττττ )(),,,( )(11 0 0

21 −= ∏∑ ∫ ∫==

LL

PS. Um sistema com fading memory é tal que a importância de uma excitação na entrada em um dado instante decresce (rápido o suficiente) com o tempo até não contribuir mais significativamente com a saída.

PS. Um sistema com fading memory é tal que a importância de uma excitação na entrada em um dado instante decresce (rápido o suficiente) com o tempo até não contribuir mais significativamente com a saída.

Page 5: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

5

9

Modelos de Volterra (cont.)O problema de identificação resume-se à estimação dos kernels.Os kernels de Volterra possuem as seguintes propriedades: � São ou podem ser feitos

simétricos. No caso do kernel de 2a ordem, por exemplo, tem-se h2(n1,n2)=h2(n2,n1).

� Kernels convergem para zero na representação de sistemas com fading memory ou memória finita.

A primeira propriedade permite estimar os elementos referentes apenas a uma das “metades” do domínio.A segunda propriedade permite estimar apenas uma quantidade finita de elementos de cada kernel em problemas envolvendo sistemas estáveis.

{ } ,,1 ,0),,(lim 1 minnh mmni

KL ∈∀=∞→

∑∑ ∑ ∏= = = =

−=M

m n n

i

m

i

mm

m m

m

nkunnnhky1 0 0 1

21

1

)(),,,( )(ε ε

LL

Problema: Em princípio, kernelssão funções não-parametrizadasque só podem ser mensuradasse sua contribuição puder serseparada da resposta total.

10

Modelos de Volterra (cont.)Ao lado tem-se um exemplo de um kernel de 2a ordem.

Esse kernel já apresenta a propriedade de simetria.

Devido à propriedade de convergência o kernel foi truncado em uma quantidade de termos ε2 = 20.

Page 6: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

6

11

Estimação dos Kernels de VolterraAbordagens Analíticas: Requerem um modelo do sistema na forma de equações diferenciais ou a diferenças não lineares (e.g. mecanístico) para obtenção dos kernels a partir de desenvolvimentos em séries de potência e linearizações(Carleman) desse modelo:

� M. Schetzen, The Volterra and Wiener Theories of Nonlinear Systems, John Wiley & Sons,1980.

� W. J. Rugh, Nonlinear System Theory: The Volterra / WienerApproach, The Johns Hopkins University Press, 1981.

Abordagens Experimentais: Baseiam-se no projeto do sinal de entrada e hipóteses sobre a estrutura do sistema para que os sinais de E/S apresentem propriedades específicas de interesse (e.g. correlação) à obtenção dos kernels no domínio do tempo ou freqüência:� F. J. Doyle III, R. K. Pearson and B. A. Ogunnaike, Identification and

Control using Volterra Models, Springer-Verlag, 2002.

12

Estimação dos Kernels de Volterra (cont.)Abordagens Paramétricas Neurais: Baseiam-se em equivalências exatas ou aproximadas entre modelos de Volterra e diferentes arquiteturas de RNAs para estimar parametricamente os kernels como funções dos parâmetros das redes (e.g. via backpropagation) ⇒ ver refs. em [Campello, 2002].

Abordagem Paramétrica NFIR: Assume que cada elemento de um dado kernel é um parâmetro independente a ser estimado, por exemplo, via MQ. Como uma abordagem NFIR, o no de parâmetros é crítico e cresce exponencialmente com a ordem do modelo (∴ usualmente M=2 ⇒ mild nonlinearities).

Abordagem NOBF: Generalização da abordagem paramétrica NFIR baseada no desenvolvimento dos kernels em FBOs.

Page 7: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

7

13

Abordagem Paramétrica NFIRModelo de Volterra parametrizado pode ser escrito como:

(5)

onde α0 é um parâmetro DC opcional.

No caso de 2a ordem (M=2), já considerando a propriedade de simetria, tem-se:

(6)

Fica evidente a estrutura NFIR, i.e., y(k) = H( λλλλ(k) ), com vetor de entradas λλλλ(k) = [u(k) u(k-1) ... u(k-nf) ]T, onde nf = max{ε1, ε2}.Como é o operador H ?

∑ ∑ ∑ ∏= = = =

−+=M

m

ε

n

ε

n

i

m

i

nn

m m

m

mnkucky

1 0 0 1

,,0

1

1)( )(

KLα

∑∑∑= ==

−−+−+=2

1

1

2

21

1

1

1

0 0

21 ,

0

1 0 )()()()(ε

n

n

n

nn

ε

n

n nkunkucnkucky α

14

Abordagem Paramétrica NFIR (cont.)Assumindo por simplicidade e sem perda de generalidade que o sistema possui atraso unitário e que ε1 = ε2 := ε, tem-se:

onde cT= [c1 c2 ... cε ] e

ou na forma padrão y(k) = θθθθT λλλλ’(k) (linear nos parâmetros), onde:

λλλλ’(k) = [ 1 u(k-1) ... u(k-ε) u(k-1)2 u(k-2)u(k-1) u(k-2)2 ... u(k-ε)u(k-1) ... u(k-ε)2 ]T

θθθθ = [ α0 c1 ... cε c1,1 c2,1 c2,2 c3,1 c3,2 c3,3 ... cε,1 ... cε, ε ]T.

)( )( )( )( 0 kCkkky λλλcTT ++= α

=

ε,ε3,ε2,ε1,ε

2,21,2

1,1

0 0

0 0 0

cccc

cc

c

C

L

M

L

L Simetria pode ser depois obtida

fazendo ci,j=(ci,j+cj,i)/2 sem alterar a

saída do modelo.

Simetria pode ser depois obtida

fazendo ci,j=(ci,j+cj,i)/2 sem alterar a

saída do modelo.

Page 8: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

8

15

Abordagem NOBFVimos que os kernels de Volterra podem ser truncados para a representação de sistemas estáveis.

Nesse caso os kernels são necessariamente somáveis em [0,∞[ e, portanto, podem ser desenvolvidos em uma base de funções ortonormais.

O desenvolvimento do kernel de 1a ordem é análogo àquele da resposta ao impulso de um sistema linear.

Desenvolvendo esse kernel em N1 funções pode-se reescrever o termo de 1a ordem do modelo de Volterra como:

)() ( )(

) ( )() ( )(

1

1

1

1

1

1

1i

1

0

1i

1i

1

0 1i

1i1

0

11

klnkun

nkunnkunh

i

N

i

k

n

N

i

k

n

N

i

k

n

∑∑∑

∑∑∑

===

= ==

=−=

=−=−

αφα

φα

16

Abordagem NOBF (cont.)O desenvolvimento do kernel de 2a ordem (N2 funções) é dado por:

e conseqüentemente o termo de 2a ordem do modelo torna-se:

Desenvolvendo todos os M kernels do modelo de forma análoga tem-se:

Considerando α(⋅⋅⋅⋅) como parâmetros a serem estimados, a grande vantagem desse modelo com relação ao modelo de Volterra em (5) é que em geral Nm << εm .

)( )( )( )( ),( 2

1 1

1,

0 0

21212 2

2

1

2

2

1 21

1 2

nlnlk-nuk-nunnh i

N

i

N

i

iii

k

n

k

n

∑∑∑ ∑= == =

= α

∑ ∑= =

=2

1

2

2

21 21

1 1

21,212 )( )(),(N

i

N

i

iiii nnnnh φφα

∑ ∑ ∑ ∏= = = =

+=M

m

N

i

N

i

i

m

j

ii

m m

m

jmklky

1 1 1 1

,,0

1

1)( )(

KL αα Modelo

Volterra-FBOModelo

Volterra-FBO

Page 9: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

9

17

Abordagem NOBF (cont.)Assumindo por simplicidade e sem perda de generalidade que todos os kernels são desenvolvidos através da mesma BFO, e sendo Φi(q

-1) a FT da i-ésima função ortonormal, fica clara a estrutura NOBF do modelo.

Nesse caso tem-se λλλλ(k) = [Φ1(q-1)u(k) Φ2(q

-1)u(k) ... Φn(q-1)u(k) ]T, onde

n = max{N1,…,Nm}. Como é H (sendo λi(k) o i-ésimo elemento de λλλλ(k) )?

Como um modelo NOBF, Volterra-FBO é também um modelo de Wiener, o que fica mais claro quando tomamos uma BFO particular, e.g. Laguerre:

Por esta razão, é usualmente chamado Wiener-Volterra ou Laguerre-Volterra. Esta última denominação é mais adequada pois o modelo de Volterra convencional também possui estrutura de Wiener (NFIR).

pz

p

− 21

pz

pz

−1

pz

pz

−1

pz

pz

−1

18

Abordagem NOBF (cont.)É simples verificar que a propriedade de simetria também é válida para os modelos Volterra-FBO.Nesse caso, a quantidade de parâmetros a serem estimados é dada por:

Mesmo significativamente inferior àquela referente aos modelos de Volterra convencionais, essa quantidade de parâmetros pode ser impraticável para modelos de ordem elevada.Por esta razão, a grande maioria das aplicações práticas restringe-se a modelos de segunda ordem (M=2).Esses modelos são mais adequados à modelagem de sistemas com não linearidades “brandas” (mild nonlinearities).

( )

+++ ∑

=

−M

i

i

i

i

i NNN1

1

112

1

Page 10: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

10

19

Resumo

∑ ∑ ∑ ∏= = = =

−=M

m

k

n

k

n

i

m

i

mm

m

nkunnnhky1 0 0 1

21

1

)(),,,( )( LL

∑ ∑ ∑ ∏= = = =

−+=M

m

ε

n

ε

n

i

m

i

nn

m m

m

mnkucky

1 0 0 1

,,0

1

1)( )(

KLα

∑ ∑= =

=m m

m

mm

N

i

N

i

miiiimm nnnnh1 1

1,,1

1

1 1 )( )(),,( φφα LLL

K

∑∑ ∑ ∏= = = =

+=M

m

N

i

N

i

i

m

j

ii

m m

m

jmklky

1 1 1 1

,,0

1

1)( )(

KL αα

Modelo de Volterra

Modelo de Volterra com

Parametrização NFIR e

termo DC

Desenvolvimento Ortonormal

dos Kernels.

Modelo Volterra-FBO

Resultante

20

Exemplo 1Considere um modelo de Volterra com M=2, ε1 = ε2 = 25 e kernels dados por:

h1(n1) = Z-1{H(z)}, H(z) = (z + 0.5) / (z2 – 1.5z + 0.7)h2(n1,n2) = exp(–0.2(n1+n2)), h2(0,n2)= h2(n1,0)=0

Seja um canal de comunicação hipotético passível de descrição exata através do modelo de Volterra acima.

Para projetar equalizadores de forma mais eficiente, é importante dispor de um modelo do canal de comunicação.

Esse modelo pode ser identificado utilizando um conjunto de dados transmitidos (entrada) e recebidos (saída) através do canal.Uma transmissão através do canal pode ser simulada através da simulação do modelo de Volterra utilizando uma seqüência de dados de entrada.

Canals yx

Equalizador

receptor

Page 11: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

11

21

Exemplo 1 (cont.)Para identificar o canal adotaremos um modelo do tipo Laguerre-Volterra com M=2, N1=N2=5 e diferentes pólos de Laguerre para os termos de 1a e 2a ordem, calculados através de um algoritmo numérico iterativo [Campello, 2002] como p1=0.6 e p2=0.8.

Obtém-se o conjunto de dados de E/S simulando a transmissão de 200 símbolos binários aleatórios (+1 e –1) através do canal.

Metade dos dados é destinada à estimação (MQ) dos parâmetros (coeficientes da expansão) do modelo Laguerre-Volterra e a outra metade destinada à validação desse modelo.

Canals yx

Equalizador

receptor

22

Exemplo 1 (cont.)A figura ao lado apresenta o kernel de 1a ordem do modelo de Volterra original (linha contínua) e o kernelcorrespondente do modelo Laguerre-Volterra (linha pontilhada).O kernel aproximado foi calculado analiticamente utilizando os coeficientes da expansão, estimados via MQ.Note portanto que o kerneloriginal não foi utilizado explicitamente no cálculo do kernel aproximado.

Page 12: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

12

23

Exemplo 1 (cont.)A figura abaixo apresenta o kernel de 2a ordem do modelo de Volterra original (a) e o kernel correspondente do modelo Laguerre-Volterra (b).A aproximação é superior nesse caso pois o kernel não apresenta comportamento mal amortecido.

24

Exemplo 1 (cont.)Os sinais de saída do canal e do modelo para a seqüência de dados de validação são apresentados na figura abaixo:

A avaliação da qualidade desta aproximação depende da aplicação em questão.

Page 13: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

13

25

Exemplo 2Processo: Tanque de Líquido.

E/S: -Tensão na Bomba que Injeta Líquido no Tanque ( u [Volts] ).-Altura da Coluna de Líquido ( y [Centímetros] ).

Não Linearidade Principal:

• Bernoulli: Vazão pelo pequeno orifício é prop. a y1/2.

Não Linearidade Principal:

• Bernoulli: Vazão pelo pequeno orifício é prop. a y1/2.

26

Exemplo 2 (cont.)Dispõe-se de dois conjuntos de dados reais, cada um com 1000 amostras de E/S mensuradas a cada 1s.

ESTIMAÇÃO

VALIDAÇÃO

Page 14: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

14

27

Exemplo 2 (cont.)Iremos identificar esse sistema utilizando um modelo Laguerre-Volterrade 2a ordem (M=2).Em função do período de amostragem (rápido), escolhemos um pólo de Laguerre lento: p=0.9.Antes da estimação dos parâmetros do modelo via MQ os dados de E/S são normalizados em [-1,+1].A simulação do modelo (N1= N2 = 4 ⇒ total de 15 parâmetros) utilizando os dados de validação éapresentada ao lado.

EQM = 1.1914

28

ReferênciasCampello, R. J. G. B. & Oliveira, G. H. C., Modelos Não-Lineares, Em Aguirre, L. A. (Editor), Enciclopédia de Automática, Edgard Blücher (em editoração).

Nelles, O., Nonlinear System Identification, Springer-Verlag, 2001.

F. J. Doyle III, R. K. Pearson and B. A. Ogunnaike, Identification andControl using Volterra Models, Springer-Verlag, 2002.

W. J. Rugh, Nonlinear System Theory: The Volterra / Wiener Approach, The Johns Hopkins University Press, 1981.

M. Schetzen, The Volterra and Wiener Theories of Nonlinear Systems, John Wiley & Sons,1980.

Eykhoff, P., System Identification: Parameter and State Estimation, John Wiley & Sons, 1974.

Page 15: Tópicos em Identificação de Sistemas Não Linearesjbosco/ia856/aula 3 ia856 ricardo.pdf · O modelo acima é capaz de representar com precisão arbitrária qualquer sistema causal

15

29

Referências (cont.)Billings, S. A., “Identification of Nonlinear Systems - A Survey”, IEE Proc. Pt. D, Vol. 127, No. 6, 272-285, 1980.

Aguirre, L. A., Introdução à Identificação de Sistemas: Técnicas Lineares e Não Lineares, 2a Edição, Editora UFMG, 2004.

Aguirre, L. A., Rodrigues, G. G. & Jácome, C. R. F., “Identificação de Modelos Não-Lineares utilizando Modelos NARMAX Polinomiais – Uma Revisão e Novos Resultados”, Controle & Automação, V. 9, pág. 90-106, 1998.

Da Rosa, A., “Desenvolvimento de Modelos de Volterra de Tempo Discreto usando Funções de Kautz”, Tese de Mestrado, DCA/FEEC/UNICAMP, Campinas, Brasil, 2005.

Campello, R.J.G.B., “Arquiteturas e Metodologias para Modelagem e Controle de Sistemas Complexos Utilizando Ferramentas Clássicas e Modernas”, Tese de Doutorado, DCA/FEEC/UNICAMP, Campinas, Brasil, 2002.