EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio...

8
EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC BINÁRIO MULTIVARIÁVEL UTILIZANDO DIFERENCIADORES ROBUSTOS EXATOS GLOBAIS ANDREI BATTISTEL,EDUARDO V.L. NUNES AND LIU HSU * * Programa de Engenharia Elétrica COPPE/Universidade Federal do Rio de Janeiro, C.P. 68504 21945-970-Rio de Janeiro, RJ, Brasil Email: [email protected], [email protected], [email protected] Abstract— This paper presents a multivariable adaptive control technique that does not require stringent symmetry assumptions on the High Frequency Gain and is applicable to plants of non-uniform arbitrary relative degree. The result is an extension to the Multivariable Binary Model Reference Adaptive Control (BMRAC), where Global Robust Differentiators (GRED) are used to circumvent the relative degree obstacle. Global exact output tracking for uncertain linear plants is obtained with good transient performance and robustness. Keywords— Multivariable Adaptive Control, High Order Sliding Modes, Robust Exact Differentiators Resumo— Este trabalho apresenta a extensão para grau relativo arbitrário e não uniforme do Controle Adaptativo Multivariável Binário por Modelo de Referência (BMRAC). Obtém-se um controlador robusto com rastreamento global e exato para plantas lineares incertas sem a necessidade de simetrização da matriz do ganho de alta frequência. Para contornar o problema do grau relativo, é utilizada a versão multivariável do Diferenciador Robusto Global e Exato (GRED), que obtém derivadas exatas através da combinação convexa de um filtro de avanço de fase com um estimador não linear baseado em modos deslizantes de ordem superior. Palavras-chave— Controle Adaptativo Multivariável, Modos Deslizantes de Ordem Superior, Diferenciadores Exatos Robustos 1 Introdução As técnicas convencionais de Controle Adaptativo Di- reto 1 Multivariável por Modelo de Referência (MIMO MRAC) requerem o conhecimento de um multiplica- dor S p para a matriz K p do Ganho de Alta Frequência (HFG, high frequency gain), tal que S p K p se torne simétrica positiva definida (SPD, symmetric positive definite) (Tao, 2003) (Ioannou and Sun, 1996). Essa hipótese é não genérica, portanto frágil, uma vez que uma perturbação paramétrica arbitrariamente pequena no K p destrói a simetria. Algumas das técnicas que permitem o projeto de controladores MIMO-MRAC para plantas com HFG incerto e possivelmente não simétrico se baseiam em fatoração matricial (Tao, 2003), (Costa et al., 2003), (Imai et al., 2004), (Xie and Zhang, 2005), (Xie and Li, 2006), (Xie, 2008), (Boulkroune et al., 2010), (Charandab et al., 2011). Embora trate-se de uma so- lução bastante genérica que dispensa o conhecimento de uma matriz simetrizante S p , a desvantagem é a re- sultante superparametrização do controle. Uma possibilidade recente de contornar a exigên- cia de simetria é encontrada em (Barkana et al., 2006) and (Hsu et al., 2011a), utilizando para tal o con- ceito de passividade generalizada, WSPR (W strictly positive real) apresentado em (Fradkov, 2003) ao in- vés do paradigma usual de positividade real SPR; e a idéia de passividade WASPR (W almost SPR), no qual um sistema pode se tornar WSPR por meio de realimentação estática de saída. É demonstrado em (Hsu et al., 2011a) que a condição necessária e sufici- ente para que sistemas de fase mínima de grau relativo 1 No controle adaptativo direto, os parâmetros do controlador são diretamente atualizados por uma lei de adaptação um sejam WASPR é que a matriz do HFG, K p , tenha forma de Jordan diagonal positiva (PDJ). Este resul- tado motivou um novo algoritmo de MRAC direto sem a necessidade de superparametrização e que dispensa as condições de simetria em K p (Hsu et al., 2014) Sabe-se que os controladores adaptativos basea- dos em lei do gradiente têm como característica os maus transitórios de adaptação e a pouca robustez. A partir daí motivou-se o desenvolvimento do BMRAC (Binary Model Reference Adaptive Control) (Hsu and Costa, 1994), que permite um aumento do ganho de adaptação de maneira que estes problemas são sua- vizados, permitindo bom comportamento transitório e robustez. O BMRAC consiste basicamente no MRAC convencional com uso de projeção paramétrica com- binado com alto ganho de adaptação. A extensão mul- tivariável para grau relativo um foi recentemente apre- sentada em (Yanque et al., 2012). Embora o BMRAC tenda para um controle em modos deslizantes con- forme o ganho de adaptação aumenta, este ganho pode ser sintonizado para um valor suficientemente alto evi- tando o chattering. Embora esta solução requeira ape- nas que K p seja PDJ, relaxando assim a condição de simetria, o algoritmo em questão é restrito a plantas de grau relativo uniforme ρ =1 apenas. Neste trabalho é proposta uma nova extensão ao MIMO BMRAC englobando plantas de grau relativo não uniforme e que permite obter rastreamento glo- bal e exato através de um estimador híbrido recente- mente generalizado para o caso multivariável (Nunes et al., 2013). Tal estimador, chamado Diferencia- dor Robusto Exato Global (GRED, Global Robust Exact Differentiator), chaveia entre um filtro MIMO de avanço de fase e um filtro não linear que utiliza Di- ferenciadores Robustos Exatos (RED) (Levant, 2003) Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 1135

Transcript of EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio...

Page 1: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC BINÁRIO MULTIVARIÁVELUTILIZANDO DIFERENCIADORES ROBUSTOS EXATOS GLOBAIS

ANDREI BATTISTEL, EDUARDO V.L. NUNES AND LIU HSU∗

∗Programa de Engenharia ElétricaCOPPE/Universidade Federal do Rio de Janeiro, C.P. 68504

21945-970-Rio de Janeiro, RJ, Brasil

Email: [email protected], [email protected], [email protected]

Abstract— This paper presents a multivariable adaptive control technique that does not require stringent symmetry assumptionson the High Frequency Gain and is applicable to plants of non-uniform arbitrary relative degree. The result is an extension tothe Multivariable Binary Model Reference Adaptive Control (BMRAC), where Global Robust Differentiators (GRED) are used tocircumvent the relative degree obstacle. Global exact output tracking for uncertain linear plants is obtained with good transientperformance and robustness.

Keywords— Multivariable Adaptive Control, High Order Sliding Modes, Robust Exact Differentiators

Resumo— Este trabalho apresenta a extensão para grau relativo arbitrário e não uniforme do Controle Adaptativo MultivariávelBinário por Modelo de Referência (BMRAC). Obtém-se um controlador robusto com rastreamento global e exato para plantaslineares incertas sem a necessidade de simetrização da matriz do ganho de alta frequência. Para contornar o problema do graurelativo, é utilizada a versão multivariável do Diferenciador Robusto Global e Exato (GRED), que obtém derivadas exatas atravésda combinação convexa de um filtro de avanço de fase com um estimador não linear baseado em modos deslizantes de ordemsuperior.

Palavras-chave— Controle Adaptativo Multivariável, Modos Deslizantes de Ordem Superior, Diferenciadores Exatos Robustos

1 Introdução

As técnicas convencionais de Controle Adaptativo Di-reto1 Multivariável por Modelo de Referência (MIMOMRAC) requerem o conhecimento de um multiplica-dor Sp para a matriz Kp do Ganho de Alta Frequência(HFG, high frequency gain), tal que SpKp se tornesimétrica positiva definida (SPD, symmetric positivedefinite) (Tao, 2003) (Ioannou and Sun, 1996). Essahipótese é não genérica, portanto frágil, uma vez queuma perturbação paramétrica arbitrariamente pequenano Kp destrói a simetria.

Algumas das técnicas que permitem o projeto decontroladores MIMO-MRAC para plantas com HFGincerto e possivelmente não simétrico se baseiam emfatoração matricial (Tao, 2003), (Costa et al., 2003),(Imai et al., 2004), (Xie and Zhang, 2005), (Xie andLi, 2006), (Xie, 2008), (Boulkroune et al., 2010),(Charandab et al., 2011). Embora trate-se de uma so-lução bastante genérica que dispensa o conhecimentode uma matriz simetrizante Sp, a desvantagem é a re-sultante superparametrização do controle.

Uma possibilidade recente de contornar a exigên-cia de simetria é encontrada em (Barkana et al., 2006)and (Hsu et al., 2011a), utilizando para tal o con-ceito de passividade generalizada, WSPR (W strictlypositive real) apresentado em (Fradkov, 2003) ao in-vés do paradigma usual de positividade real SPR; ea idéia de passividade WASPR (W almost SPR), noqual um sistema pode se tornar WSPR por meio derealimentação estática de saída. É demonstrado em(Hsu et al., 2011a) que a condição necessária e sufici-ente para que sistemas de fase mínima de grau relativo

1No controle adaptativo direto, os parâmetros do controlador sãodiretamente atualizados por uma lei de adaptação

um sejam WASPR é que a matriz do HFG, Kp, tenhaforma de Jordan diagonal positiva (PDJ). Este resul-tado motivou um novo algoritmo de MRAC direto sema necessidade de superparametrização e que dispensaas condições de simetria em Kp (Hsu et al., 2014)

Sabe-se que os controladores adaptativos basea-dos em lei do gradiente têm como característica osmaus transitórios de adaptação e a pouca robustez. Apartir daí motivou-se o desenvolvimento do BMRAC(Binary Model Reference Adaptive Control) (Hsu andCosta, 1994), que permite um aumento do ganho deadaptação de maneira que estes problemas são sua-vizados, permitindo bom comportamento transitório erobustez. O BMRAC consiste basicamente no MRACconvencional com uso de projeção paramétrica com-binado com alto ganho de adaptação. A extensão mul-tivariável para grau relativo um foi recentemente apre-sentada em (Yanque et al., 2012). Embora o BMRACtenda para um controle em modos deslizantes con-forme o ganho de adaptação aumenta, este ganho podeser sintonizado para um valor suficientemente alto evi-tando o chattering. Embora esta solução requeira ape-nas que Kp seja PDJ, relaxando assim a condição desimetria, o algoritmo em questão é restrito a plantas degrau relativo uniforme ρ = 1 apenas.

Neste trabalho é proposta uma nova extensão aoMIMO BMRAC englobando plantas de grau relativonão uniforme e que permite obter rastreamento glo-bal e exato através de um estimador híbrido recente-mente generalizado para o caso multivariável (Nuneset al., 2013). Tal estimador, chamado Diferencia-dor Robusto Exato Global (GRED, Global RobustExact Differentiator), chaveia entre um filtro MIMOde avanço de fase e um filtro não linear que utiliza Di-ferenciadores Robustos Exatos (RED) (Levant, 2003)

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1135

Page 2: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

baseado em modos deslizantes de ordem superior. Ouso do MIMO GRED torna o erro do sistema uni-formemente exponencialmente globalmente pratica-mente estável em relação a um conjunto residual pe-queno com convergência para zero.

2 Passividade generalizada (WSPR)

O conceito de SPR convencional requer que o ganhode alta frequência da planta seja SPD, condição difi-cilmente satisfeita por sistemas reais.

Uma solução para contornar esta dificuldade foirecentemente proposta em (Barkana et al., 2006), (Hsuet al., 2011a), explorando um conceito mais geral depassividade associado com a definição de WSPR e re-sultados correlatos.

Definição 1 (WSPR) (Barkana et al., 2006) (Hsuet al., 2011b) Um sistema linear invariante no tempocom a realização AK , B,C, onde AK ∈ Rn×n,B ∈ Rn×M , and C ∈ RM×n é dito W–EstritamentePassivo (WSP) e a sua função de transferênciaC(sI−AK)−1B é ditaW–Estritamente Positiva Real(WSPR), se existem matrizes simétricas positivas defi-nidas P , Q e W tal que

ATKP + PAK = −Q , PB = CTW . (1)

Definição 2 (WASPR) : Um sistema linear e invari-ante no tempo com realização A,B,C, é dito WASPse pode se tornar WSP a partir de uma realimentaçãoestática de saída, i.e., se existe K ∈ RM×M tal queC(sI −AK)−1B é WSPR, com AK = A−BKC.

O teorema WASPR é enunciado como em (Hsu et al.,2011a) e estabelece a condição para que um sistemase torne WSPR por meio de realimentação estática desaída.

Teorema 1 (Teorema WASPR (Hsu et al., 2011b))Todo sistema estritamente próprio e de fase mínimaA,B,C com A ∈ Rn×n, B ∈ Rn×M , C ∈ RM×ne matriz de transferência C(sI − A)−1B de ordemM ×M pode se tornar WSPR através de realimenta-ção de saída (suficientemente grande), se e somentese Kp tem autovalores positivos e reais e sua formade Jordan é diagonal (condição PDJ).

Conforme (Hsu et al., 2011a)[Lemma 1], a con-dição necessária e suficiente para a existência de Wque simetriza Kp é que Kp = CB tenha autovalorespositivos e reais e que sua forma de Jordan seja dia-gonal positiva (condição PDJ). De acordo com (Hsuet al., 2014),(Yanque et al., 2012), se Kp não satisfaza condição de PDJ, é possível escolher um multiplica-dor matricial L tal que LKp satisfaça a condição dePDJ de maneira robusta.

3 Descrição do Problema

Considera-se uma planta MIMO linear invariante notempo descrita por

xp = Apxp +Bpu , y = Hpxp , (2)

onde xp ∈ Rn é o estado, u ∈ RM é a entrada, y ∈RM é a saída eAp,Bp andHp são matrizes constantese incertas. Todos os parâmetros incertos pertencema um conjunto compacto Υ, tal que são disponíveisos limites de incerteza necessários a serem definidosposteriormente.

O modelo entrada-saída da planta é dado por

y = G(s)u, G(s) = Hp(sI−Ap)−1Bp .

As seguintes hipóteses são consideradas

(A1) G(s) é de fase mínima e tem posto completo.

(A2) A planta é controlável e observável.

(A3) O índice de observabilidade ν de G(s), ou umlimitante superior de ν é conhecido.

(A4) Existe uma matriz polinomial diago-nal conhecida ξm(s), definida como amatriz interactor pela esquerda modifi-cada (MLI) de G(s) da forma ξm(s) =diag d1(s), d2(s), . . . , dM (s) onde di(s)são polinômios mônicos estáveis de grau ρi > 0.

(A5) A matriz de ganho de alta frequência de G(s),definida como Kp = lims→∞ ξm(s)G(s) é finitae não singular, com autovalores positivos e formade Jordan diagonal (condição PDJ).

Assim, pela hipótese (A4), o grau relativo vetorial[ρ1, ρ2, ..., ρM ]T é arbitrário e conhecido.

O sinal de referência ym é gerado pelo seguintemodelo de referência

ym = M(s) r ; r, ym ∈ IRM (3)M(s) = diag

(s+ a)−1, ..., (s+ a)−1

L−1(s) (4)

onde a > 0 e L(s) é dado por

L(s) = diag L1(s), L2(s), ..., LM (s) , (5)

e Li(s), i = 1, ...,M são polinômios Hurwitz dadospor

Li(s) = s(ρi−1) + l[i]ρi−2s

(ρi−2) + ...+ l[i]1 s+ l

[i]0 (6)

A matriz de transferência M(s) tem o mesmo graurelativo vetorial de G(s) e o seu HFG é a matriz iden-tidade.

O objetivo de controle é encontrar uma lei de con-trole u(t) tal que o erro de saída

e(t) = y(t)− ym(t), (7)

tenda a zero assintoticamente para condições inici-ais arbitrárias. Quando a planta é conhecida, uma

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1136

Page 3: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

lei de controle que obtém o casamento entre a ma-triz de transferência em malha fechada e M(s) é dadapor u∗ = Θ∗

T

ω, onde a matriz de parâmetros pode

ser escrita como Θ∗ =[Θ∗

T

u Θ∗T

y Θ∗T

0 K∗T

Θ

]T, com

Θ∗u,Θ∗y ∈ IRM(ν−1)×M ,Θ∗0,K

∗Θ ∈ IRM×M e o vetor

regressor ω = [ωTu ωTy yT rT ]T , ωu, ωy ∈ IRM(ν−1)

é obtido dos filtros de entrada e saída dados por:

ωu = A(s)Λ−1(s)u , ωy = A(s)Λ−1(s)y , (8)

onde A(s) = [Isν−2 Isν−3 · · · Is I]T , Λ(s) =λ(s)I e λ(s) é um polinômio mônico e estável de grauν − 1. A condição de casamento requer que K∗TΘ =K−1p .

No entanto, como a planta é desconhecida, a ma-triz de parâmetros desejada Θ∗ também é desconhe-cida. Nesse caso, a seguinte lei de controle pode serusada

u(t) = ΘT (t)ω(t) (9)

onde Θ é uma estimativa de Θ∗ obtida por uma leide adaptação. Uma equação do erro pode ser obtidaestendendo-se a abordagem usual do MRAC para ocaso SISO para o caso MIMO (Tao, 2003; Ioannou andSun, 1996). Define-se o vetor X =

[xTp , ω

Tu , ω

Ty

]Tcom a seguinte dinâmica X = A0X + B0u. Assim,somando e subtraindoB0u

∗ e notando que há matrizesΩ1 e Ω2 tal que ω = Ω1X + Ω2r, segue-se que

X = AcX +BcKp [u− u∗] +Bcr, y = H0X(10)

com Ac = A0 +B0θ∗TΩ1, Bc = B0K

∗Tθ = B0K

−1p .

O modelo de referência pode ser descrito por Xm =AcXm +Bcr. Assim, o estado do erro xe = X−Xm

é dado por

xe = Acxe +BcKp [u− u∗] , e = H0xe (11)

Note que (Ac, Bc, H0) é uma realização não mínimadeM(s) e assim o a equação do erro pode ser reescritana forma entrada-saída como

e = M(s)Kp [u− u∗] (12)

Esta é uma abordagem existente para o caso de plan-tas com grau relativo arbitrário uniforme (Yanqueet al., 2012). A extensão para o caso de grau rela-tivo arbitrário pode ser obtida utilizando estimativasdas derivadas de y, tal que um sistema de grau relativouniforme n∗ = 1 é gerado.

A extensão do BMRAC para sistemas MIMOé usada como na proposta apresentada em (Yanqueet al., 2012), adotando a seguinte parametrização:

ϑ=vec(Θ)=

θ1

θ2

...θn

, Ω=Im⊗ω=

ω. . .

ω

(13)

com Ω ∈ IRNM×M , ϑ ∈ IRNM , onde N é o númerode elementos do vetor regressor ω, θi é a i-ésima co-luna da matriz de parâmetros Θ e ⊗ é o produto de

Kronecker. A lei de adaptação do MIMO BMRAC édada por

ϑ = −ϑσ − γΩξ (14)

com σ dada por uma projeção

σ =

0, se ||ϑ|| < Mϑ ou σeq < 0

σeq, se ||ϑ|| ≥Mϑ e σeq ≥ 0(15)

σeq =−γϑTΩξ

||ϑ||2(16)

onde Mϑ > ||ϑ∗||. A lei de controle pode ser rescritacomo

u(t) = ΘT (t)ω(t) = ΩT (t)ϑ(t) (17)

4 BMRAC utilizando um filtro MIMO de avançode fase

O BMRAC proposto em (Yanque et al., 2012) obtémrastreamento global e exato se a planta consideradatem grau relativo uniforme n∗ = 1. Para contornaro problema do grau relativo, utiliza-se o operador (6),tal que L(s)G(s) e L(s)M(s) tenham grau relativouniforme n∗ = 1. Para tal, define-se a seguinte saídamodificada:

ξy =L(s)y =

y

(ρ1−1)1 + · · ·+ l

[1]1 y1 + l

[1]0 y1

...y

(ρM−1)M + · · ·+ l

[M ]1 yM + l

[M ]0 yM

=

∑ρ1−1j=0 l

[1]j h

T1 A

(j)c X

...∑ρM−1j=0 l

[M ]j hTMA

(j)c X

= HX , (18)

onde hTi ∈ Rn+2M(ν−1) é a i-ésima linha da matrizHo e a segunda igualdade é obtida a partir da hipó-tese (A4) e da Eq. (10). O erro de grau relativo ρ = 1corresponde a

e = ξy − ym (19)

Deve-se notar que o sinal ξy necessário para con-tornar o obstáculo do grau relativo não é diretamentedisponível para implementação. Uma maneira de re-solver este problema é estimando ξy por meio de umfiltro de avanço de fase.

ξl = La(s)e, La(s) = L(s)F−1(τs) (20)

onde F (τs) = diag(τs+1)ρ1−1, . . . , (τs+1)ρm−1.Pode-se notar que conforme τ > 0 tende a zero, ξlaproxima ξy . Definindo-se o erro de estimativa do fil-tro de avanço de fase como εl = ξl − ξy , a respectivadinâmica pode ser descrita como

xε =1

τAεxε +Bεξy, εl = Hεxε , (21)

onde ξy=HAcX+HBcKpϑTΩ (ver (11) e (18)),

Aε = block diag A[1]ε , . . . , A

[M ]ε , com A

[i]ε ∈

Rρi−1×ρi−1,

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1137

Page 4: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

Bε = block diag B[1]ε , . . . , B

[M ]ε , com B

[i]ε ∈

Rρi−1×1, Hε = block diag H [1]ε , . . . ,H

[M ]ε ,

com H[i]ε ∈R1×ρi−1,

A[i]ε =

−a[i]ρi−2 1 0 . . . 0

−a[i]ρi−3 0 1 . . . 0...

......

. . ....

−a[i]1 0 0 0 1

−a[i]0 0 0 0 0

, B[i]

ε =

−b[i]ρi−2

−b[i]ρi−3

...−b[i]1

−b[i]0

,

H [i]ε =

[1 0 0 . . . 0

],

a[i]j = Cρi−1

ρi−1−j , b[i]j =Cρi−1

j+1 Cnl = n!/(k!(n− k)!)

Na análise de estabilidade do sistema em malha fe-chada com estado zT =

[xTe x

], considera-se a pre-

sença de uma perturbação de saída uniformemente li-mitada βα(t) de ordem τ do filtro de avanço de fase.Por projeto, βα(T ) ≤ εM com εM = τKR, e KR > 0é uma constante. Utilizando o filtro MIMO de avançode fase, a lei de adaptação é dada por

ϑ = −ϑσ − γΩ(e+ βα) (22)

com σ dada por uma projeção

σ =

0, se ||ϑ|| < Mϑ ou σeq < 0

σeq, se ||ϑ|| ≥Mϑ e σeq ≥ 0(23)

σeq =−γϑTΩ(e+ βα)

||ϑ||2(24)

onde Mϑ > ||ϑ∗||. Neste ponto, o seguinte Teoremapode ser enunciado.

Teorema 2 Dada a planta (2) e o modelo de referên-cia (3)–(5) com sinal de controle (9) e lei de adapta-ção (22)–(24). Suponha que as hipóteses (A1) a (A5)são satisfeitas. Se a perturbação βα(t) é uniforme-mente limitada por ||βα(t)|| ≤ τKR, onde KR > 0 éuma constante, então para τ > 0 suficientemente pe-queno e γ > 0 suficientemente grande, o sistema doerro em malha fechada (11), (9), (18), (21), (22)–(24)com estado zT =

[xTe x

], é uniformemente global-

mente exponencialmente praticamente estável (GEpS)em relação a um conjunto residual, i.e., existem cons-tantes cz, a > 0 tal que ||z(t)|| ≤ cze−a(t−t0) ||z(t0)||+O(τ) +O(γ−1) é satisfeita ∀z(t0), ∀t ≥ t0 > 0.(Prova: ver Apêndice.)

Corolário 3 Para todo R > 0, existe τ > 0 sufici-entemente pequeno e γ suficientemente grande tal quepara algum tempo finito T , o estado do erro z(t) é le-vado a um conjunto invariante compacto DR := z :||z|| ≤ R.

Corolário 4 Os sinais e(i)j (t), i = 0,. . ., ρj , j =

1,. . .,M são uniformemente limitados, i.e., ∃K [j]i >

0 tal que |e(i)j (t)| ≤ K

[j]i ,∀ t ≥ t0 ≥ 0, i =

0,. . ., ρj , j = 1,. . .,M . Além disso, se ||xe(t)|| ≤R,∀t > T , então, ∃C [j]

ρj > 0 tal que∣∣∣∣∣∣e(ρj)j[T,t]

∣∣∣∣∣∣∞≤

C[j]ρj , j = 1, . . . ,M . (Prova: ver Apêndice)

5 Diferenciador Robusto Exato MIMO

Na seção anterior, o BMRAC utilizando um filtro deavanço de fase para estimar ξy foi analisado. Pelo Te-orema 2 a convergência do estado do erro é garantidaapenas a um conjunto residual. Para obter um rastrea-mento exato, pode-se utilizar a extensão MIMO do di-ferenciador baseado em modos deslizantes de ordemsuperior (HOSM, high order sliding modes) recente-mente proposto em (Levant, 2003). A ideia é empre-gar um RED de ordem pj = ρj − 1 para cada saídaej ∈ R, j = 1, . . . ,M como se segue:

ζ[j]i =v

[j]i ,

v[j]i = −λ[j]

i C[j]

1pj−i+1

ρj

∣∣∣ζ [j]i −v

[j]i−1

∣∣∣ pj−i

pj−i+1 sgn(ζ [j]i −v

[j]i−1)

+ ζ[j]i+1,

...ζ [j]pj =−λ

[j]pjC

[j]ρj sgn(ζ [j]

pj − v[j]pj ),

(25)onde i = 0, . . . , pj − 1, v[j]

−1 = ej(t), C [j]ρj é uma

constante tal que |e(ρj)j (t)| ≤ C

[j]ρj , ∀t. Se os parâme-

tros λ[j]i são propriamente escolhidos de forma recur-

siva 2, então as igualdades são válidas em tempo finito(Levant, 2003).

ζ[j]0 =ej(t); ζ

[j]i = e

(i)j (t), j = 1, . . . ,m;

i =1, . . . , pj

Assim, utilizando um RED MIMO composto deM REDs de ordem ρj − 1 para cada saída ej , a se-guinte estimativa de ξy pode ser obtida

ξr=

ζ

[1]ρ1−1 + · · ·+ l

[1]1 ζ

[1]1 + l

[1]0 ζ

[1]0

...ζ

[M ]ρM−1 + · · ·+ l

[M ]1 ζ

[M ]1 + l

[M ]0 ζ

[M ]0

.(26)

Assim, as derivadas de y podem ser usadas conformeem ξy = L(s)y. Porém, apenas a convergência localdo estado do erro para zero pode ser garantida, umavez que os sinais e(ρj)

j (t), j = 1, . . . ,M devem seruniformemente limitados.

6 BMRAC baseado no RED Global (GRED)

A fim de garantir a estabilidade global e exponencialem relação a um conjunto residual e obter a conver-gência global do estado do erro para zero, demonstra-se que o filtro MIMO de avanço de fase apresentadona Seção 4 pode ser combinado com o RED MIMO(Seção 5). O esquema de controle proposto, chamadoGRED-BMRAC, é baseado em um compensador hí-brido que consiste em uma combinação convexa evariante no tempo entre a estimativa dada pelo filtroMIMO (20) e a estimativa do RED MIMO (26), da

2Particularmente, para pj ≤ 3: λ[j]0 = 5, λ

[j]1 = 3, λ

[j]2 =

1.5, λ[j]3 = 1.1. Mais detalhes são encontrados em (Levant, 2003).

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1138

Page 5: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

seguinte forma:

ξg = α(νrl) ξl + [1− α(νrl)] ξr , (27)

onde νrl = ξr − ξl é a diferença entre ambas esti-mativas. A função de chaveamento α(νrl) é uma mo-dulação contínua e dependente do estado que assumevalores no intervalo [0, 1] e permite que o controladoralterne de maneira suave entre os estimadores.

Deve-se notar que a estabilidade global a um con-junto invariante DR é garantida independente do cha-veamento entre os estimadores, uma vez que é pos-sível mostrar que o sistema resultante é equivalente aum BMRAC com filtro MIMO de avanço de fase comouma perturbação de saída uniformemente limitada deordem τ . Assim, estabilidade prática global e conver-gência ao conjunto DR são garantidas de acordo como Teorema 2. A função de chaveamento é escolhidade maneira a garantir que, em tempo finito apenas, aestimativa do RED MIMO seja utilizada.

Especificamente, α(·) é projetado de maneira que∣∣∣∣∣∣ξg − ξl∣∣∣∣∣∣ ≤ τKR:

α(νrl)=

0, ||νrl|| < εM −∆(||νrl||−εM+∆)/∆, εM−∆≤||νrl||<εM

1, ||νrl|| ≥ εM(28)

onde 0<∆<εM é uma camada de transição utilizadapara suavizar a função de chaveamento, e εM := τKR

onde KR é um parâmetro de projeto, escolhido tal queεM−∆>εl. Isto implica que em tempo finito apenasa estimativa do RED MIMO é utilizada (α= 0), pro-vendo o valor exato das derivadas de ξy conforme de-sejado. Uma forma de ajuste os parâmetros do GREDMIMO é dada em (Nunes et al., 2013).

Usando o GRED para estimar ξy a lei de adapta-ção é dada por

ϑ = −ϑσ − γΩξg (29)

com σ dado por uma projeção

σ =

0, se ||ϑ|| < Mϑ ou σeq < 0

σeq, se ||ϑ|| ≥Mϑ e σeq ≥ 0(30)

σeq =−γϑTΩξg

||ϑ||2(31)

ondeMϑ > ||ϑ∗||. Os resultados de estabilidade e con-vergência do controlador proposto são enunciados noteorema a seguir. Um diagrama de blocos da estratégiaé mostrado na Fig. 1

Teorema 5 Seja a planta (2) e o modelo de referên-cia (3)–(5) com lei de controle dada por (9) e lei deadaptação (29)–(31). A função de chaveamento α(·)é definida em (28). Supondo que as hipóteses (A1) a(A5) são válidas, para τ > 0 suficientemente pequenoe γ > 0 suficientemente grande, o sistema do erroem malha fechada, descrito por (9), (11), (18), (21),(29)–(31) é uniformemente globalmente exponencial-mente praticamente estável (GEpS) em relação a um

Figura 1: Diagrama de blocos do GRED-BMRAC

conjunto residual e a estimativa do MIMO RED e to-dos os sinais em malha fechada são uniformementelimitados. Além disso, para λ

[j]i , j = 1, . . . ,M ,

i = 0, . . . , ρj−1, e KR propriamente escolhidos, aestimativa das derivadas do erro ξy passam a ser exa-tas, utilizando apenas o RED (α(·) = 0)em tempofinito. Assim, o estado do erro em malha fechadazT =

[xTe x

], e portanto o erro de saída e, con-

vergem exponencialmente para zero. (Prova: a provasegue os passos das provas de (Nunes et al., 2013)[Te-orema 3], (Nunes et al., 2009)[Teorema 3]).

7 Resultados de Simulação

Considera-se um sistema MIMO linear invariante notempo descrevendo um atuador e processo dados por

A=

1 2 3 10 2 1 10 0 1 10 0 0 1

; B=

10 20 0 0−1 −0.5 0 −0.50 0 16 800 0 0 4

,H=I

cuja matriz de transferência é G0(s). A planta écomposta de um atuador/processo e um sensor dadopela matriz de transferência Gs(s) = diag1/(s +1), 1/(s + 1), 1, 1. A matriz de transferência re-sultante G(s) = Gs(s)G0(s) de u para y temgrau relativo vetorial ρ = [2, 2, 1, 1]. O mo-delo é escolhido como M(s) = diag1/(s +1)2, 1/(s + 1)2, 1/(s + 1), 1/(s + 1). Por simplici-dade, escolhe-se Kp = B PDJ. Assim, com L(s) =diag (s+ 1), (s+ 1), 1, 1, a matriz de transferênciacorrespondente L(s)M(s)KP pode ser demonstradacomo sendo WSPR. Quando isto não é possível, ummultiplicador passivador pode ser utilizado a partir deum Kp nominal (Hsu et al., 2011a). De acordo com aprova do teorema WASPR em (Barkana et al., 2006),pode-se concluir que um sistema WSPR mantém-seWSPR com qualquer realimentação estática de saídade ganho −k onde k é um escalar positivo. Verificou-se que é possível melhorar a velocidade da convergên-cia do erro de rastreamento ajustando-se este ganho k.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1139

Page 6: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

Figura 2: Erros de rastreamento obtidos quando ape-nas o filtro de avanço de fase é utilizado

O sinal de referência r(t) ∈ IR4 é esco-lhido como ondas quadradas com offset f(t/T ) =sqw(2t/T ) + 1 e diferentes períodos T , rT =0.5[f(t/6); 2f(t/2); 3f(t/4); 3f(t/0.3)]. O único co-nhecimento prévio da planta necessário para o con-trole é Mϑ = 15 (de acordo com (31)) e o índicede observabilidade ν = 2. O ganho de adaptação éγ = 10. Outros parâmetros de projeto são: filtro deavanço de fase (20): τ =0.01; RED MIMO (25)-(26):

λ[1]0 =1.5C

[1]1/2

2 , λ[1]1 =1.1C

[1]2 e C [1]

2 =10; função dechaveamento (28): εM = 0.5 e ∆ = 0.2. A condiçãoinicial da planta é y(0) = [1 1 1 1]. O restante dascondições iniciais é zero.

Quando apenas o filtro de avanço é utilizado, oerro tem amplitude considerável, conforme Fig. 2.Quando o diferenciador híbrido é empregado, erronulo de rastreamento é obtido (a menos de erros de in-tegração numérica), conforme a Fig. 3. O desempenhodo rastreamento é visto na Fig. 4e pode-se ver que ochattering é evitado no controle. Finalmente, na Fig. 5pode-se notar que a diferenciação é feita inicialmentepelos filtros de avanço de fase para em seguida cha-vear permanentemente para o RED MIMO em tempofinito. Deve-se notar que nas mesmas circunstâncias osistema é instável se apenas o RED MIMO é utilizado.

8 Conclusões

Este trabalho apresenta a extensão de grau relativonão-uniforme e arbitrário para o Controle AdaptativoBinário por Modelo de Referência (BMRAC). Obtém-se rastreamento global e exato para plantas lineares eincertas sem a neessidade de condições restritivas desimetria no ganho de alta frequência, além de um me-lhor transitório em relação a técnicas convencionaisdo MRAC. Para contornar a restrição do grau rela-tivo, empregou-se uma versão multivariável do Dife-renciador Robusto Global e Exato (GRED), que obtémestabilidade uniforme global e prática e rastreamentoexato através do chaveamento de um filtro de avanço

Figura 3: Erros de rastreamento obtidos como estima-dor híbrido (GRED-BMRAC)

Figura 4: Desempenho de rastreamento obtidos comoestimador híbrido (GRED-BMRAC)

Figura 5: a) Função de chaveamento do estimador hí-brido (GRED-BMRAC) e b) sinal de controle

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1140

Page 7: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

de fase com um estimador não linear baseado em mo-dos deslizantes de ordem superior. O sinal de controleé contínuo e sem chattering

Apêndice

No que se segue, todos ki e κi são constantes positivas.Prova do Teorema 2: Considerando a seguinte candidata

a função de Lyapunov, com P1, P2 e WN simétricas e positivasdefinidas, e ϑ = ϑ− ϑ∗.

V = xTe P1xe +1

γϑTWN ϑ+ xTε P2xε (32)

uma vez que o sistema (11) é WSPR

V = −xTe Q1xe + 2eWΩT ϑ−1

τxTε Q2xε − 2

σ

γϑTWN ϑ+

− 2ϑWNΩ(ξy + εl + βα − ym) + 2xTε P2Bεξy (33)

Onde utilizou-se e = ξl − ym and ξy = ξl + εl. Pela Eq. (18), etendo que WNΩ = ΩW tem-se

V =−xTe Q1xe−1

τxTε Q2xε−2

σ

γϑTWN ϑ−ϑWNΩ(εl+βα) +

+2xTε P2BεHAKX+2xTε P2BεHBcKpΩT ϑ

Sabendo-se que ΩT ϑ=ΘTω, xe = X−Xm, ωr=W0(xe+Xm)onde ωr=[ωu ωy y]T , Θ∗

r=[Θ∗u Θ∗

y Θ∗0]T e

W0 =

0 I 00 0 IH0 0 0

(34)

tem-se

V =−xTe Q1xe−1

τxTε Q2xε−2

σ

γϑTWN ϑ−(εl+βα)TWΩT ε+

+2xTε P2BεHAKxe + 2xTε P2BεHBcKpΩTW0xe+

+2xTε P2BεHBcKpΩTW0Xm + 2xTε P2BεHBcKpKTΘr

O que pode ser simplificado:

V =− xTe Q1xe −1

τxTε Q2xε − 2

σ

γϑTWN ϑ−

(εl + βα)TQ6[xe +Xm] + (εl + βα)TQ7r+

+2xTε [Q3xe+Q4Xm +Q5r]

com Q3 =P2BεHBcKpΘTrW0+P2BεHAK ;

Q4 =P2BεHBcKpΘTW0; Q5 =P2BεHBcKpKTΘ ;

Q6 =W ΘTW0; Q7 =WKTΘ

Uma vez que Θ é limitado e lembrando que βα é uniforme-mente limitado por εM = τKR, and ||εl|| ≤ ||xe||,

V ≤ −k1 ||xe||2 −k2

τ||xε||2 +k3 ||xε|| ||xe||+ k4 ||xε||+

−2σ

γϑTWN ϑ+O(τ)

Completando os quadrados e simplificando, tem-se

V ≤k1

2||xe||2 −

k2

2τ||xε|| −

(k1 −

k23

k2τ

)||xe||2 +

+O(τ)− 2σ

γλM (WN )

∣∣∣∣∣∣ϑ∣∣∣∣∣∣2De acordo com a Eq. (15), o termo −2σ

γϑTWN ϑ é não-positivo,

visto que ϑ = ϑ− ϑ∗ e Mϑ ≥ ||ϑ∗|| e assumindo que τ ≤ k1k22k23

,tem-se

V ≤ −k1

2||xe||2 −

k2

4τ||xε||2 +O(τ)

Uma vez que ||ϑ|| é uniformemente limitado, obtém-se

V ≤ [xe xε]T

[P1 00 P2

] [xexε

]+O(γ−1) (35)

Tal que se pode escrever z = [xe xε]T V −O(γ−1) ≤ zTPz ≤λmax(P )zT z e V − O(τ) ≤ −zTQz ≤ −λmin(Q)zT z eassim

V ≤ −λ[V −O(γ−1)

]+O(τ) (36)

com λ = λmin(Q)/λmax(P ). Utilizando um lema de com-paração é possível mostrar que existem constantes cz , a > 0 talque ||z(t)|| ≤ cze−a(t−t0) ||z(t0)||+O(τ) +O(γ−1) ∀z(t0),∀t ≥ t0 > 0

Prova do Corolário 4: É possível mostrar que e(i)j =

hTj A(i)c xe, i = 1, . . . , ρi − 1, j = 1, . . . ,m. Uma vez que

o estado do erro xe é uniformemente limitado, existem constan-tes tais que: |e(i)j | ≤ Ki, ∀t ≥ t0 ≥ 0, i = 0, . . . , ρi −

1, j = 1, . . . ,M . Além disso, tem-se que e(ρj)

j , j =1, . . . ,M é uniformemente limitado, uma vez que o estado doerro xe(t), e os sinais u(t) e u∗, são uniformemente limitados.

Os sinais e(ρj)

j (t), j = 1, . . . ,M são dados por: e(ρj)

j (t) =

hTj Aρjc xe(t) +hTj A

ρj−1c BcKp[u(t)−u∗] . Note que u−u∗ =

ΩT ϑ = ΘTω e assim, a Eq. (34) permite estabelecer que |wr| ≤κ1 |xe| + κ2, visto que Xm, r e Θ são limitados. Assim e

(ρj)

j (t)

pode ser majorado por∣∣∣e(ρj)

j (t)∣∣∣ ≤ κ3 |xe(t)| + κ4. Uma vez

que |xe(t)| ≤ R ∀t ≥ T , as inequações∣∣∣∣∣∣e(ρj)

j[T,t]

∣∣∣∣∣∣ ≤ C[j]ρj , j =

1, . . . ,M são válidas uma vez que a projeção garante que ϑ é limi-tado.

Referências

Barkana, I., Teixeira, M. C. M. and Hsu, L. (2006). Mitigation ofsymmetry condition in positive realness for adaptive control,Automatica 39(9): 1611–1616.

Boulkroune, A., M’Saad, M. and Chekireb, H. (2010). Design ofa fuzzy adaptive controller for MIMO nonlinear time-delaysystems with unknown actuator nonlinearities and unknowncontrol direction, Information Sciences 180(24): 5041–5059.

Charandab, B. A., Salmasi, F. R. and Sedigh, A. K. (2011). Im-proved dead zone modification for robust adaptive controlof uncertain linear systems described by input-output modelswith actuator fault, IEEE Transactions on Automatic Control56(4): 863–867.

Costa, R. R., Hsu, L., Imai, A. K. and Kokotovic, P. (2003).Lyapunov-based adaptive control of MIMO systems, Automa-tica 39(7): 1251–1257.

Fradkov, A. L. (2003). Passification of non-square linear systemsand feedback Yakubovich-Kalman-Popov lemma, EuropeanJournal of Control 6(1): 573–582.

Hsu, L., Battistel, A. and Nunes, E. V. L. (2014). Multivariable mracdesign without gain symmetry conditions using a stabilizingmultiplier, IEEE Trans. Aut. Contr. to appear.

Hsu, L. and Costa, R. R. (1994). B-MRAC: Global exponential sta-bility with a new model reference adaptive controller based onbinary control theory, C-TAT - Control-Theory and AdvanceTechnology 10(04): 649–668. Special Issue on Sliding ModeControl.

Hsu, L., Teixeira, M. C. M., Costa, R. R. and Assunçao, E. (2011a).Necessary and sufficient condition for generalized passivity,passification and application to multivariable adaptive sys-tems, Proc. of the 18th IFAC World Congress, Milan.

Hsu, L., Teixeira, M. C. M., Costa, R. R. and Assunçao, E. (2011b).Necessary and sufficient condition for generalized passivity,passification and application to multivariable adaptive sys-tems, Proc. World Congress of the International Federationof Automatic Control (IFAC).

Imai, A. K., Costa, R. R., Hsu, L., Tao, G. and Kokotovic, P. V.(2004). Multivariable adaptive control using high-frequencygain matrix factorization, IEEE Transactions on AutomaticControl 49(7): 1152–1157.

Ioannou, P. and Sun, K. (1996). Robust Adaptive Control, PrenticeHall PTR.

Levant, A. (2003). Higher-order sliding modes, differentiation andoutput-feedback control, Int. J. Contr. 76(09): 924–941.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1141

Page 8: EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC … · extensÃo de grau relativo arbitrÁrio para o mrac binÁrio multivariÁvel utilizando diferenciadores robustos exatos globais

Nunes, E. V. L., Hsu, L. and Lizarralde, F. (2009). Globalexact tracking for uncertain systems using output-feedbacksliding mode control, Transactions on Automatic Control54(5): 1141–1147.

Nunes, E. V. L., Peixoto, A. J., Oliveira, T. R. and Hsu, L. (2013).Global exact tracking for uncertain mimo linear systems byoutput feedback sliding mode control, Journal of the FranklinInstitute .

Tao, G. (2003). Adaptive Control Design and Analysis, John Wiley& Sons Inc.

Xie, X.-J. (2008). Stability and robustness analysis of MIMOMRAC using Kp = L2D2S2 factorization, InternationalJournal of Systems Science 39(3): 265–278.

Xie, X.-J. and Li, J.-L. (2006). A robustness analysis of discrete-time direct model reference adaptive control, InternationalJournal of Control 79(10): 1196–1204.

Xie, X.-J. and Zhang, Z.-Q. (2005). Robust direct model referenceadaptive control using Kp = LDU factorization for multi-variable plants, International Journal of Control 78(10): 762–772.

Yanque, I., Nunes, E. V. L., Costa, R. and Hsu, L. (2012). Bi-nary mimo mrac using a passifying multiplier, 2012 AmericanControl Conference, Montreal, pp. 1925–1930.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1142