CONTROLE DE SISTEMAS INCERTOS COM ATRASO USANDO …
Transcript of CONTROLE DE SISTEMAS INCERTOS COM ATRASO USANDO …
CONTROLE DE SISTEMAS INCERTOS COM ATRASO
USANDO TECNICAS BASEADAS EM CONTROLE POR
MODOS DESLIZANTES INTEGRAL E LMI
Pedro Vicente Santos
Projeto de Graduacao apresentado ao Curso
de Engenharia Eletronica e de Computacao
da Escola Politecnica, Universidade Federal
do Rio de Janeiro, como parte dos requisitos
necessarios a obtencao do tıtulo de Enge-
nheiro.
Orientador: Eduardo Vieira Leao Nunes
Rio de Janeiro
Agosto de 2018
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
Escola Politecnica - Departamento de Eletronica e de Computacao
Centro de Tecnologia, bloco H, sala H-217, Cidade Universitaria
Rio de Janeiro - RJ CEP 21949-900
Este exemplar e de propriedade da Universidade Federal do Rio de Janeiro, que
podera incluı-lo em base de dados, armazenar em computador, microfilmar ou adotar
qualquer forma de arquivamento.
E permitida a mencao, reproducao parcial ou integral e a transmissao entre bibli-
otecas deste trabalho, sem modificacao de seu texto, em qualquer meio que esteja
ou venha a ser fixado, para pesquisa academica, comentarios e citacoes, desde que
sem finalidade comercial e que seja feita a referencia bibliografica completa.
Os conceitos expressos neste trabalho sao de responsabilidade do(s) autor(es).
iv
DEDICATORIA
A minha mae, Valeria, cujo apoio foi fundamental para que eu completasse esta
etapa da minha vida.
v
AGRADECIMENTO
Agradeco a minha mae e amigos, pelo incentivo e pela forca que me deram para
superar as dificuldades. Tambem agradeco ao Professor Eduardo Vieira Leao Nunes
pela orientacao e ajuda na elaboracao deste trabalho. Por fim, agradeco ao Conselho
Nacional de Desenvolvimento Cientıfico e Tecnologico (CNPq) pela oportunidade de
participar em atividades na area de pesquisa.
vi
RESUMO
Este trabalho apresenta algumas das principais caracterısticas de sistemas com
atraso, assim como os motivos que fazem com que o controle por modos deslizantes
possa ser tao vantajoso para lidar com modelagem incerta. Inicialmente, um breve
estudo sobre as principais caracterısticas e propriedades do controle por modos des-
lizantes e apresentado, incluindo o controle por modos deslizantes integral. Essa
tecnica procura garantir que o sistema seja robusto a incertezas e perturbacoes du-
rante todo o tempo ao assegurar que o sistema sempre se encontre em deslizamento.
Neste projeto e proposta uma modificacao para uma tecnica baseada em controle
por modos deslizantes integral para sistemas com atraso na entrada e tambem no es-
tado. A analise de estabilidade do esquema de controle e baseada em Desigualdades
Matriciais Lineares (Linear Matrix Inequalities - LMI). Por meio dessa ferramenta e
possıvel obter condicoes suficientes para assegurar a estabilidade global do sistema
em malha fechada. Para a solucao de LMI tres pacotes computacionais sao conside-
rados e brevemente discutidos. Alem disso, um pequeno tutorial sobre esses pacotes
e elaborado.
Palavras-Chave: Controle por Modos Deslizantes Integral, LMI, Sistemas com
Atraso.
vii
ABSTRACT
This work presents some of the main characteristics of time delay systems, as
well as the reasons why Sliding Mode Control can be so advantageous to deal with
uncertain modeling. Initially, a brief study of main characteristics and properties of
Sliding Mode Control is presented, including Integral Sliding Mode Control. This
technique seeks to ensure that the system is robust to uncertainties and disturban-
ces at all times by ensuring that the system is always in the sliding surface. In this
project a modification is proposed for a technique based on Integral Sliding Mode
Control for systems with input and state delays. The stability analysis of the con-
trol scheme is based on Linear Matrix Inequalities (LMI). Through this tool it is
possible to obtain sufficient conditions to ensure the overall stability of the closed
loop system. For the LMI solution three computational packages are considered and
briefly discussed. In addition, a small tutorial on these packages is developed.
Key-words: Integral Sliding Mode Control, LMI, time delay systems.
viii
SIGLAS
FDEs - Functional Differential Equations
ISMC - Integral Sliding Mode Control
LMI - Linear Matrix Inequalities
LTI - Linear Time-Invariant
NDEs - Neutral Type Differential Equations
ODEs - Ordinary Differential Equations
RDEs - Retarded Differential Equations
SPD - Semidefinite Programming
SMC - Sliding Mode Control
TDS - Time Delay System
ix
Sumario
1 Introducao 1
1.1 Tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Delimitacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.6 Descricao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Conceitos Matematicos 5
2.1 Matrizes positivas definidas . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Complemento de Schur . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Teoria de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Controle por Modos Deslizantes 17
3.1 Sistema de Controle Descontınuo . . . . . . . . . . . . . . . . . . . . 18
3.2 Nocoes Basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3 Existencia dos Modos Deslizantes . . . . . . . . . . . . . . . . . . . . 24
3.4 Metodo da Regularizacao . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.5 Metodo do Controle Equivalente . . . . . . . . . . . . . . . . . . . . . 29
3.6 Controle por Modos Deslizantes Integral . . . . . . . . . . . . . . . . 31
3.6.1 Definicao do Problema . . . . . . . . . . . . . . . . . . . . . . 32
3.6.2 Princıpios do Projeto . . . . . . . . . . . . . . . . . . . . . . . 33
3.6.3 Superfıcie de Deslizamento Integral . . . . . . . . . . . . . . . 35
3.6.4 Leis de controle . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.6.5 Condicao de Alcancabilidade . . . . . . . . . . . . . . . . . . . 37
x
3.6.6 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.7 Chattering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4 Sistemas com atraso 41
4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 Conceito de solucao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3 Tipos de atrasos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.3.1 Atrasos Constantes . . . . . . . . . . . . . . . . . . . . . . . . 50
4.3.2 Atrasos variantes no tempo . . . . . . . . . . . . . . . . . . . 50
4.4 Tipos de TDSs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5 Estabilidade e Desigualdades Matriciais Lineares 55
5.1 LMIs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Estabilidade de TDSs . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.3 Lyapunov-Krasovskii . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.3.1 Condicoes para estabilidade de TDSs . . . . . . . . . . . . . . 62
6 SMC aplicado a Sistemas com Atraso 65
6.1 Formulacao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.2 Projeto da superfıcie de deslizamento . . . . . . . . . . . . . . . . . . 67
6.3 Projeto do controlador . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.4 Exemplo Ilustrativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7 Conclusao 76
Bibliografia 78
A Toolboxs para resolucao de LMIs 82
A.1 LMI Control Toolbox . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
A.2 Yalmip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
A.3 CVX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
A.4 Comparacao entre os Toolboxs . . . . . . . . . . . . . . . . . . . . . . 90
xi
Lista de Figuras
2.1 Conceitos de estabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.1 Plano de fase para o sistema (3.2). . . . . . . . . . . . . . . . . . . . . . 20
3.2 Plano de fase para o sistema (3.3). . . . . . . . . . . . . . . . . . . . . . 20
3.3 Plano de fase para o sistema (3.1). . . . . . . . . . . . . . . . . . . . . . 21
3.4 Grafico de x x t para o sistema (3.1). . . . . . . . . . . . . . . . . . . . 21
3.5 Exemplos de trajetorias proximas da superfıcie de deslizamento e sinais de
controle para um sistema com histerese. . . . . . . . . . . . . . . . . . . 23
3.6 Plano de fase para o sistema (3.4). . . . . . . . . . . . . . . . . . . . . . 24
3.7 Ilustracao do deslizamento local. . . . . . . . . . . . . . . . . . . . . . . 27
3.8 Plano de fase para o sistema (3.13). . . . . . . . . . . . . . . . . . . . . 30
3.9 (a) Grafico de x x t para o sistema (3.13); (b) Grafico de x x t para o
sistema (3.15); (c) Sinal de controle para o sistema (3.13); (d) Sinal de
controle para o sistema (3.15). . . . . . . . . . . . . . . . . . . . . . . . 31
3.10 Sinal de controle: (a) Rele; (b) Saturacao para σ = 1. . . . . . . . . . . . 40
4.1 Esquematico de um sistema simples com atraso. . . . . . . . . . . . . . . 42
4.2 Diagrama de Bode para o termo de atraso puro. . . . . . . . . . . . . . . 43
4.3 Resposta ao degrau do sistema (4.3) considerando a possibilidade de um
ganho proporcional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Solucao do sistema (4.1). . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.5 Solucao do sistema (4.8). . . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.1 Trajetorias do sistema do exemplo considerado. . . . . . . . . . . . . . . 74
6.2 Sinal de controle do exemplo considerado. . . . . . . . . . . . . . . . . . 74
6.3 Superfıcie de deslizamento do exemplo considerado. . . . . . . . . . . . . 74
6.4 Superfıcie de deslizamento projetada como em [4]. . . . . . . . . . . . . . 75
xii
Capıtulo 1
Introducao
1.1 Tema
Este trabalho tem como tema o controle de sistemas com atraso e com modelo
dinamico incerto. Dentro desse contexto, sao abordadas tecnicas de controle basea-
das no controle por modos deslizantes (Sliding Mode Control - SMC ) e sao utilizados
a teoria de Lyapunov e o conceito de desigualdades matriciais lineares (Linear Matrix
Inequalities - LMI ) para analisar a estabilidade do sistema.
1.2 Delimitacao
O objeto de estudo sao as tecnicas de controle baseadas no SMC, mais especifica-
mente no controle por modos deslizantes integral (Integral Sliding Mode Control -
ISMC ). Tais tecnicas foram escolhidas por serem eficientes para lidar com sistemas
incertos. Alem disso, o estudo foi restrito a sistemas lineares que possuem atraso,
que pode ser constante ou variavel, na entrada e/ou na sua dinamica. Com relacao a
descricao matematica dos sistemas considerados, o estudo foi restrito a equacoes di-
ferenciais retardadas (Retarded Differential Equations - RDEs) e ao caso de sistemas
com atraso discreto.
1
1.3 Justificativa
Para sistemas dinamicos de dimensao finita, as condicoes iniciais dependem apenas
de um conjunto finito de valores, mais especificamente os valores das variaveis de
estado nesse instante de tempo inicial. Ja no caso de sistemas com atraso e preciso ter
mais informacoes. Para cada instante de tempo, nao basta apenas o conhecimento
do valor de certas variaveis para um dado instante de tempo, e preciso saber o
comportamento previo dessas variaveis em uma janela tempo. Dessa forma, sistemas
com atraso sao sistemas de dimensao infinita e o seu estado consiste de um conjunto
infinito de valores. Esse aspecto torna a analise desse tipo de sistema ainda mais
desafiadora.
Sistemas de controle com atrasos sao muito comuns, dado que normalmente existe
um tempo para adquirir a informacao necessaria para a tomada de decisoes e para
a execucao das mesmas. E valido tambem ressaltar que estudos comprovam que a
introducao cuidadosa de atrasos podem estabilizar um sistema que antes era instavel.
Um exemplo conhecido que possui esse comportamento e o seguinte sistema:
y(t) + y(t)− y(t− h) = 0
O sistema acima e instavel para h = 0, mas e assintoticamente estavel para h = 1
[1]. Esse paradoxo e um dos motivos para os anos de interesse no estudo de sistemas
com atraso [2, 1].
Alem disso, sistemas dinamicos muitas vezes sao caracterizados por serem incer-
tos, o que significa que possuem modelagem precaria ou grandes incertezas e per-
turbacoes. Essas perturbacoes podem ocorrer devido a dinamicas nao modeladas,
variacoes nos parametros da planta e por disturbios externos [3].
Caso esses atrasos e/ou incertezas sejam desconsiderados, o modelo criado para o
sistema pode nao funcionar perfeitamente e levar a uma performance insatisfatoria
[3, 4, 5]. Neste sentido, existe uma motivacao para o estudo de tecnicas de controle
baseadas em modos deslizantes, devido a sua eficiencia no controle de sistemas in-
certos, principalmente por sua robustez com respeito a estabilidade e desempenho
2
[6, 5, 7].
1.4 Objetivos
O principal objetivo desse trabalho e estudar e desenvolver tecnicas de controle
por modos deslizantes para sistemas incertos com atraso. Para alcancar essa meta os
seguintes objetivos especıficos devem ser atingidos: estudo das principais proprieda-
des de sistemas com atraso e do controle por modos deslizantes, revisao da literatura
para encontrar tecnicas modernas para o controle desse tipo de sistema, analise e
desenvolvimento do algoritmo de controle e validacao da estrategia escolhida por
meio de simulacoes numericas.
1.5 Metodologia
Primeiramente, foi realizado um estudo com enfase no controle por modos des-
lizantes e suas principais propriedades foram verificadas por meio de simulacoes
numericas. O SMC e conhecido pelas seguintes vantagens: estabilidade, rejeicao de
pertubacoes e robustez [3]. Alem disso, com este tipo de controle e possıvel combi-
nar caracterısticas uteis de cada estrutura do sistema realimentado, ou ate mesmo se
obter propriedades que nao estao presentes em nenhumas das estruturas utilizadas
[8, 9, 10, 11]. Dentro do SMC, foi estudado de forma mais aprofundada o controle
por modos deslizantes integral (ISMC) devido a sua capacidade de garantir que a
robustez do controlador seja valida por todo o tempo de resposta do sistema. Alem
disso, com o ISMC e possıvel lidar de forma mais adequada com incertezas desca-
sadas, o que nao acontece no SMC convencional. Por esses motivos, o ISMC sera
utilizado para lidar com o tipo de sistema encontrado neste trabalho.
Em seguida foi feito o estudo das principais caracterısticas de sistemas com atraso.
Um problema encontrado e que sistemas deste tipo costumam funcionar melhor com
ganhos baixos, enquanto o SMC e baseado em alto ganho. Logo, esse trabalho tera
que lidar com essa dificuldade para obter um sistema com bom desempenho.
3
Durante o desenvolvimento do controle do sistema, e necessario garantir que o
mesmo seja estavel assintoticamente em malha fechada. Esse trabalho faz uso das
LMIs para analise da estabilidade do sistema. As LMIs tem ganhado cada vez mais
forca atualmente, pois com elas e possıvel modelar uma variedade de problemas da
teoria de controle, alem de representarem problemas de otimizacao convexos, que
sao de facil solucao numerica usando os softwares atuais [12].
Dessa forma, neste trabalho a analise da estabilidade parte de uma funcao de Lya-
punov, obtendo uma condicao suficiente para a estabilidade assintotica do sistema
por meio de LMIs [13, 4].
1.6 Descricao
No capıtulo 2 sao abordadas alguns conceitos matematicos importantes que estao
presentes ao longo do texto.
O capıtulo 3 faz uso de simulacoes numericas e apresenta os principais conceitos
teoricos e caracterısticas do controle por modos deslizantes.
As principais caracterısticas teoricas de sistemas com atraso sao apresentadas no
capıtulo 4.
A relacao entre estabilidade e LMIs e apresentada no capıtulo 5. Nele e explicitado
o motivo do uso crescente dessa tecnica para garantir a estabilidade de sistemas de
controle.
A tecnica de controle desenvolvida e apresentada com detalhes no capıtulo 6. Sao
apresentadas simulacoes numericas que mostram os resultados obtidos e compravam
a viabilidade da estrategia escolhida.
As conclusoes gerais sobre o estudo desenvolvido sao apresentadas no capıtulo 7.
Por fim, o apendice A apresenta um pequeno tutorial sobre alguns dos pacotes
computacionais existentes para resolucao de LMIs.
4
Capıtulo 2
Conceitos Matematicos
Esse capıtulo tem como objetivo apresentar os conceitos matematicos mais im-
portantes que estao presentes ao longo do texto. Sao eles os conceitos de matrizes
positivas definidas, Complemento de Schur e funcoes de Lyapunov.
As LMIs se integram aos conceitos existentes na teoria de Lyapunov, sendo essa
teoria uma das principais e mais importantes formas de analisar a estabilidade de um
sistema [3, 1]. Como sera explicado adiante, para aplicar corretamente os conceitos
de Lyapunov, e importante entender o que sao matrizes positivas definidas e as
condicoes necessarias para serem caracterizadas como tal. Alem disso, e comum
ser necessario escrever uma inequacao como uma LMI e para isso pode-se usar o
conceito de Complemento de Schur, que tambem e diretamente relacionado com
matrizes positivas definidas.
2.1 Matrizes positivas definidas
Problemas de otimizacao sao comuns em Engenharia. Nesses problemas, normal-
mente precisa-se reconhecer o ponto mınimo de uma funcao. Quando esse ponto
mınimo e a origem, pode-se dizer que a funcao e positiva definida. De forma geral,
uma funcao F (x) e dita positiva definida se:
x 6= 0 ⇒ F (x) > 0, F (0) = 0
Caso F (x) ≥ 0, x 6= 0, a funcao e dita ser positiva semidefinida.
5
Para ilustrar melhor o conceito, considere a princıpio uma funcao quadratica es-
calar simples:
f(x, y) = ax2 + 2bxy + cy2 (2.1)
A funcao (2.1) e definida positiva se, e somente se, a > 0 e ac > b2. E sera definida
negativa se, e somente se, a < 0 e ac > b2. O caso singular ac = b2 leva uma funcao
semidefinida, sendo semidefinida negativa caso a < 0 e semidefinida positiva caso
a > 0 [14].
A funcao (2.1) pode ser escrita na forma matricial, neste caso uma matriz 2× 2:
ax2 + 2bxy + cy2 =[x y
]a b
b c
xy
(2.2)
Essa identidade pode ser generalizada para n dimensoes, como visto em (2.3).
Para qualquer matriz simetrica A, o produto xTAx e uma forma quadratica pura:
[x1 x2 · · · xn
]a11 a12 · · · a1n
a21 a22 · · · a2n
......
. . ....
an1 an2 · · · ann
x1
x2
...
xn
=n∑i=1
n∑j=1
aijxixj (2.3)
A partir da generalizacao acima, pode-se estudar o conceito de matrizes positivas
definidas. Este conceito e extremamente importante para a analise da estabilidade
de sistemas de controle, uma vez que muitas das condicoes de estabilidade partem
do princıpio da existencia de determinada matriz positiva definida.
Considerando a matriz quadrada em (2.3) e chamando ela de A. Esta matriz sera
dita positiva definida caso seja simetrica (A = AT ) e caso satisfaca as condicoes do
teorema abaixo:
Teorema 2.1
6
1. xTAx > 0 para todos os vetores reais x nao nulos.
2. Todos os autovalores de A satisfazem λi > 0.
3. Todas as submatrizes superiores Ak a esquerda tem determinantes positivos.
4. Todos os pivos (sem alteracoes de linha) satisfazem dk > 0.
5. Existe uma matriz R com colunas independentes tais que A = RTR.
Prova: ver [14].
E valido ressaltar que a funcao quadratica xTAx > 0 e de extrema importancia
para a analise de Lyapunov e aparece com bastante frequencia na analise de estabi-
lidade de sistemas de controle.
Para matrizes positivas semidefinidas, o teorema e reescrito da seguinte forma,
tambem considerando uma matriz real A:
Teorema 2.2
1. xTAx ≥ 0 para todos os vetores reais x nao nulos.
2. Todos os autovalores de A satisfazem λi ≥ 0.
3. Nenhuma submatriz principal possui determinantes negativos.
4. Nenhum pivo e negativo.
5. Existe uma matriz R, possivelmente com colunas dependentes, de modo que
A = RTR.
Prova: ver [14].
A definicao de matrizes negativas definidas parte da analogia com matrizes posi-
tivas definidas e o mesmo vale para matrizes negativa semidefinidas com as matrizes
positivas semidefinidas.
7
2.2 Complemento de Schur
O conceito de Complemento de Schur e muito importante no desenvolvimento das
desigualdades matriciais lineares (LMIs). Esta secao tem como objetivo detalhar
melhor esse conceito.
Considere uma matriz quadrada M : n × n escrita como uma matriz com bloco
2× 2:
M =
A B
C D
(2.4)
onde A e uma matriz p× p e D e uma matriz q × q, com n = p+ q, dessa forma
B e uma matriz p× q e C e uma matriz q × p. A matriz M pode ser utilizada para
resolver o seguinte sistema linear:
Ax+By = c
Cx+Dy = d (2.5)
que pode ser reescrito na forma matricial
A B
C D
xy
=
cd
Isolando y e assumindo que D e invertıvel:
y = D−1(d− Cx)
substituindo este resultado em (2.5)
Ax+B(D−1(d− Cx)) = c
(A−BD−1C)x = c−BD−1d
8
Caso A−BD−1C seja invertıvel, a solucao e dada por:
x = (A−BD−1C)−1(c−BD−1d)
y = D−1(d− C(A−BD−1C)−1(c−BD−1d)) (2.6)
A matriz A−BD−1C e chamada de Complemento de Schur de D em M [15]. A
solucao obtida em (2.6) leva a seguinte formula para a inversa de M :
A B
C D
−1
=
(A−BD−1C)−1 −(A−BD−1C)−1BD−1
−D−1C(A−BD−1C)−1 D−1 +D−1C(A−BD−1C)−1BD−1
A B
C D
−1
=
(A−BD−1C)−1 0
−D−1C(A−BD−1C)−1 D−1
I −BD−1
0 I
A B
C D
−1
=
I 0
−D−1C I
(A−BD−1C)−1 0
0 D−1
I −BD−1
0 I
A partir da equacao acima, e possıvel obter uma nova expressao para M , com a
vantagem de que nesta expressao e necessario que apenas D seja invertıvel:
A B
C D
=
I BD−1
0 I
(A−BD−1C) 0
0 D
I 0
D−1C I
A partir desse resultado, e possıvel caracterizar matrizes positivas definidas usando
o Complemento de Schur. Assuma que M seja simetrica, de forma que A e D sejam
simetricas e que C = BT , entao M pode ser reescrita como:
A B
BT D
=
I BD−1
0 I
(A−BD−1BT ) 0
0 D
I BD−1
0 I
T
9
E possıvel definir entao:
Definicao 2.1 Para qualquer matriz M da forma
M =
A B
BT C
Se C e invertıvel entao as seguintes propriedades sao validas:
1. M > 0 se e somente se C > 0 e A−BC−1BT > 0
2. Se C > 0 entao M ≥ 0 se e somente se A−BC−1BT ≥ 0
Prova: Para uma matriz M ser positiva definida e necessario que xTMx > 0. Esta
condicao pode ser escrita da seguinte forma:
xT
M︷ ︸︸ ︷ A B
BT C
x > 0
Reescrevendo de forma a obter o Complemento de Schur:
xT
PT︷ ︸︸ ︷I −BC−1
0 I
︸ ︷︷ ︸
wT
A−BC−1BT 0
0 C
︸ ︷︷ ︸
S
P︷ ︸︸ ︷ I 0
−C−1BT I
x︸ ︷︷ ︸
w
> 0
Dessa forma, obtem-se:
xTMx > 0 ⇔ xTP TSPx > 0
Pode-se reescrever xTP TSPx > 0 como wTSw > 0. Portanto, e necessario que
S > 0:
S =
A−BC−1BT 0
0 C
> 0
10
Da subsecao anterior sabe-se que para uma matriz ser positiva definida, todas as
submatrizes superiores a esquerda devem ter determinante positivo, ou seja, cada
um dos blocos de uma matriz positiva definida deve ser tambem positivo definido
[15]. Dessa forma, obtem-se as condicoes:
C > 0
A−BC−1BT > 0
Essas condicoes estao de acordo com a Definicao 2.1.
2.3 Teoria de Lyapunov
A analise da estabilidade de muitos sistemas, sejam eles lineares ou nao lineares,
muitas vezes se baseia nos metodos de Lyapunov. A teoria de Lyapunov e dividida
em dois metodos: o primeiro se baseia na linearizacao do sistema e analise do sistema
linearizado ao redor de um ponto de equilıbrio, o segundo e mais geral e se baseia no
conceito de energia do sistema, que e analisado por meio de uma funcao, chamada
de funcao de Lyapunov. Como esse trabalho nao ira trabalhar com o metodo da
linearizacao, ele nao sera detalhado aqui e mais informacoes podem ser encontradas
em [3].
Considere o sistema autonomo:
x(t) = f(x(t)), x(0) = x0
Um conceito importante para o entendimento de estabilidade e o de ponto de
equilıbrio, que pode ser entendido da seguinte forma:
Definicao 2.2 Um estado x∗ e um estado de equilıbrio (ou ponto de equilıbrio) de
um sistema se, uma vez que x(t) seja igual a x∗, o estado se mantera igual a x∗
para todo tempo futuro.
Matematicamente isso significa que o estado x∗ satisfaz a seguinte relacao:
f(x∗) = 0 (2.7)
11
Apos definido o conceito de ponto de equilıbrio, e possıvel definir os conceitos de
estabilidade.
Assim como na analise de sistemas lineares, e possıvel estudar o comportamento
de um sistema nao linear na vizinhanca da origem ao inves do ponto de equilıbrio
x∗, o que simplifica bastante a analise da estabilidade do sistema. Dessa forma,
supondo que f possui um ponto de equilıbrio em xe = 0 e denotando BR como a
regiao esferica definida por ||x|| < R no espaco de estados e SR a propria esfera,
definida por ||x|| = R, e possıvel definir os conceitos de estabilidade e instabilidade:
Definicao 2.3 O ponto de equilıbrio xe = 0 e estavel se, para qualquer R > 0, existe
r > 0, tal que se ||x(0)|| < r, entao ||x(t)|| < R para todo t > 0. Caso contrario, o
ponto de equilıbrio e dito instavel.
Essa definicao de estabilidade e conhecida como estabilidade no sentido de Lya-
punov e pode ser entendida da seguinte forma: uma trajetoria do sistema pode ser
mantida arbitrariamente perto do ponto de equilıbrio caso comece perto o suficiente
deste ponto. A definicao 2.3 pode ser escrita como:
∀R > 0,∃r > 0, x(0) ∈ Br ⇒ x(t) ∈ BR, ∀t ≥ 0
Caso as trajetorias do sistema nao satisfacam a condicao de estabilidade ele e dito
como sendo instavel.
Apesar da estabilidade ser uma definicao importante, em muitos sistemas de con-
trole e necessario que o sistema seja assintoticamente estavel. Este tipo de estabili-
dade e definida da seguinte forma:
Definicao 2.4 Um ponto de equilıbrio xe = 0 e assintoticamente estavel se e estavel
e, alem disso, x(t)→ 0 quando t→∞.
12
Um ponto de equilıbrio que e estavel no sentido de Lyapunov, mas nao e assin-
toticamente estavel e conhecido como marginalmente estavel. Alguns problemas
precisam estimar quao rapido as trajetorias vao tender para o ponto de equilıbrio e
a estabilidade exponencial e utilizada para esse proposito:
Definicao 2.5 Um ponto de equilıbrio xe = 0 e exponencialmente estavel se existem
dois numeros estritamente positivos α e λ tais que
||x(t)|| ≤ α||x(0)||e−λt, ∀t > 0
em alguma regiao Br ao redor da origem.
A definicao 2.5 significa que o vetor de estado de um sistema exponencialmente
estavel converge para o ponto de equilıbrio mais rapidamente que uma funcao ex-
ponencial. O numero λ e conhecido como a taxa de convergencia exponencial.
As tres definicoes citadas ate agora caracterizam o comportamento local do sis-
tema, ou seja, o que acontece caso o estado se inicie perto do ponto de equilıbrio.
Para caracterizar o que acontece caso a trajetoria se inicie em algum ponto longe do
equilıbrio e preciso utilizar conceitos de estabilidade globais:
Definicao 2.6 Se a estabilidade assintotica (exponencial) e valida para qualquer
estado inicial, entao o ponto de equilıbrio e globalmente assintoticamente (exponen-
cialmente) estavel.
Figura 2.1: Conceitos de estabilidade.
13
Apos definidos os conceitos de estabilidade e possıvel explicar o segundo metodo
de Lyapunov, que e tambem conhecido como metodo direto de Lyapunov.
A ideia do metodo direto de Lyapunov e uma extensao do conceito de energia
de sistemas: se a energia total de um sistema e continuamente dissipada, entao o
sistema deve eventualmente tender a algum ponto de equilıbrio. Dessa forma, e
possıvel concluir a estabilidade de um sistema analisando a variacao de uma funcao
escalar. O procedimento basico desse metodo e gerar uma funcao escalar para o
sistema, que lembre uma funcao de energia, e examinar a variacao no tempo desta
funcao.
Essas funcoes de energia possuem duas propriedades. A primeira e baseada no
conceito de funcoes positivas definidas. Ja a segunda implica que a funcao e mono-
tonicamente decrescente e e formalizada pelas funcoes de Lyapunov.
Definicao 2.7 Uma funcao escalar V (x) e positiva definida localmente se V (0) = 0
e, em uma regiao BR0
x 6= 0⇒ V (x) > 0
Se V (0) = 0 e a propriedade anterior e valida para todo o espaco de estado, entao
V (x) e positiva definida globalmente.
Definicao 2.8 Se, em uma regiao BR0, a funcao V (x) e positiva definida e possui
derivadas parciais contınuas, alem de possuir derivada no tempo ao longo de qualquer
trajetoria negativa semidefinida, ou seja:
V (x) ≤ 0
esta funcao e uma funcao de Lyapunov para o sistema.
E possıvel relacionar as funcoes de Lyapunov com a estabilidade da seguinte forma:
Teorema 2.3 Se, em uma regiao BR0 existe uma funcao escalar V (x) com deriva-
das parciais contınuas tal que
� V (x) e positiva definida (localmente em BR0)
14
� V (x) e negativa semidefinida (localmente em BR0)
entao o ponto de equilıbrio xe = 0 e estavel. Caso V (x) seja negativa definida
localmente em BR0, entao a estabilidade e assintotica.
Prova: ver [3].
O teorema 2.3 garante apenas a estabilidade local do sistema. Para garantir a
estabilidade global e assintotica e necessario que a regiao BR0 seja o espaco de estado
completo e que V (x)→∞ quando ||x|| → ∞.
Teorema 2.4 Assumindo a existencia de uma funcao escalar V do estado x, com
derivadas de primeira ordem contınuas, tal que:
� V (x) e positiva definida
� V (x) e negativa definida
� V (x)→∞ quando ||x|| → ∞
entao o equilıbrio e globalmente assintoticamente estavel.
Prova: ver [3].
Para ilustrar o metodo de Lyapunov, considere um sistema linear da forma:
x = Ax (2.8)
Escolhendo a funcao quadratica (2.9) como candidata a funcao de Lyapunov:
V (x) = xTPx (2.9)
com P sendo uma matriz positiva definida. Derivando (2.9) ao longo das tra-
jetorias de (2.8):
V (x) = xTPx+ xTPx = xTATPx+ xTPAx = −xTQx (2.10)
ATP + PA = −Q (2.11)
15
Caso a matriz Q, determinada pela equacao de Lyapunov (2.11), seja positiva
definida, a funcao V (x) atendera as condicoes do Teorema 2.4 e o ponto de equilıbrio,
nesse caso, a origem, sera assintoticamente estavel de forma global.
E importante ressaltar que um sistema nao possui apenas uma funcao de Lyapunov
e que uma boa escolha da funcao leva a resultados mais precisos. Alem disso, caso
as condicoes dos teoremas acima nao sejam satisfeitas para uma funcao V (x), nada
pode ser dito sobre a estabilidade do sistema, apenas pode-se tentar realizar uma
nova analise usando uma funcao de Lyapunov diferente.
Apesar de ser um metodo poderoso, o metodo direto de Lyapunov possui uma
desvantagem: encontrar uma funcao de Lyapunov nem sempre e uma tarefa simples.
Por esse motivo existem estudos [2, 1, 16] que visam analisar e escolher as melhores
funcoes de Lyapunov para sistemas com atraso. O metodo de Lyapunov-Krasovskii
para TDS sera explicado com mais detalhes no Capıtulo 5.
16
Capıtulo 3
Controle por Modos Deslizantes
Para sistemas que possuem grandes incertezas, como variacao de parametros,
dinamicas nao modeladas e disturbios externos, existem algumas tecnicas de controle
nao-linear utilizadas para tratarem tais problemas, um exemplo dessas tecnicas e o
controle por modos deslizantes (Sliding Mode Control - SMC ) [3, 17, 18].
No SMC utiliza-se uma lei de controle descontınua que chaveia entre um conjunto
de funcoes das variaveis de estado da planta, de forma a mudar a estrutura do sistema
em malha fechada. Dessa maneira e possıvel combinar caracterısticas uteis de cada
estrutura do sistema realimentado, ou ate mesmo se obter propriedades que nao
estao presentes em nenhuma das estruturas utilizadas [8]. A regra de chaveamento
e elaborada de tal forma que as trajetorias do sistema alcancem e se mantenham em
uma superfıcie do espaco de estados, denominada superfıcie de deslizamento, que e
escolhida pelo projetista.
A principal vantagem desta tecnica de controle e que e possıvel obter um novo
tipo de movimento, denominado modo deslizante, que uma vez que e alcancado, faz
com que o sistema passe a ser regido pela dinamica da superfıcie de deslizamento
[11]. Assim o desempenho do sistema torna-se insensıvel em relacao as incertezas
da planta, propriedade conhecida como propriedade da invariancia. Portanto, essa
tecnica possui aplicacoes em varias areas da engenharia como: robotica, sistemas
espaciais, controle automatico de voos, entre outros [3].
17
Um dos problemas enfrentados pelo controle por modos deslizantes e a possibili-
dade da ocorrencia do chattering, que consiste de um chaveamento em alta frequencia
do sinal de controle. Tal problema e causado devido as imperfeicoes no chaveamento
e e altamente indesejavel, pois pode fazer aparecer dinamicas de alta frequencia ig-
noradas durante a modelagem, instabilizando o sistema [19].
Esse capıtulo tambem apresenta o conceito de controle por modos deslizantes
integral (Integral Sliding Mode Control - ISMC ). Tecnicas baseadas no ISMC pos-
suem uma principal vantagem sobre o SMC tradicional: nelas, o deslizamento ocorre
durante toda a resposta do sistema em malha fechada, com isso garante-se que a
robustez do sistema seja valida durante todo tempo. Alem disso, sera mostrada que,
para escolhas adequadas dos parametros do projeto, o uso do ISMC torna o sistema
menos sensıvel a incertezas descasadas, sendo bastante vantajoso para casos mais
gerais.
3.1 Sistema de Controle Descontınuo
Seja um sistema de controle dado por:
x = a(t, x) + b(t, x)u
onde x ∈ Rn e o vetor de estados do sistema, a(t, x) e b(t, x) sao funcoes suaves
e u ∈ R e uma lei de controle descontınua. Neste projeto, e adotada a definicao
de Filippov para a solucao de equacoes diferenciais com lado direito descontınuo
[20, 21].
A ideia geral do controle por modos deslizantes e primeiramente definir a superfıcie
de deslizamento S = {x : s(x) = 0} de modo que a dinamica desejada seja alcancada
quando o sistema se encontrar dentro da mesma. Posteriormente, deve-se escolher
uma lei de controle descontınua que torne esta superfıcie de deslizamento pelo menos
localmente atrativa, seguindo uma condicao de alcancabilidade.
O sistema deve entao chavear entre duas estruturas diferentes. Essas estruturas
sao definidas de acordo com o sinal de controle descontınuo, que e dado por:
18
u(x) =
u+(x), se s(x) > 0
u−(x), se s(x) < 0
Onde u+(x) e u−(x) sao funcoes contınuas. Note ainda que u(x) nao e definido
em s(x) = 0.
3.2 Nocoes Basicas
Para exemplificar algumas caracterısticas do controle por modos deslizantes, sera
usado um exemplo simples. Considere o sistema:
x1 = x2
x2 = u
u = −f(t) sign(s)
s = x2 + αx1
(3.1)
Considerando α = 1 e f(t) = 5 e possıvel dividir este sistema em duas regioes:
� Na regiao I s(x) > 0, tem-se:
x1 = x2
x2 = −5(3.2)
� Na regiao II s(x) < 0, tem-se:
x1 = x2
x2 = 5(3.3)
Os planos de fase para ambas as regioes seguem abaixo. Para facilitar a visua-
lizacao tambem se encontra representada a reta de chaveamento (s(x) = 0).
19
Figura 3.1: Plano de fase para o sistema (3.2).
Figura 3.2: Plano de fase para o sistema (3.3).
E possıvel observar que em ambos os planos de fase, as trajetorias apontam para
a reta de chaveamento. O plano de fase para o sistema completo segue abaixo, assim
como o grafico de x x t.
20
Figura 3.3: Plano de fase para o sistema (3.1).
Figura 3.4: Grafico de x x t para o sistema (3.1).
Para o plano de fase do sistema completo, todas as trajetorias tendem para a
reta de chaveamento e a trajetoria do sistema fica confinada a superfıcie deslizante.
Isto gera um novo tipo de movimento, uma vez que essa trajetoria nao pertence a
nenhum dos dois sistemas chaveados. Alem disso, a frequencia de chaveamento se
torna infinita e o sinal de controle passa a nao ser mais definido no tempo.
21
Neste movimento, conhecido como modo deslizante, a trajetoria de estado se des-
loca por uma superfıcie denominada superfıcie de deslizamento, que e denotada por
s(x) = 0. Ja no espaco de estado, o chaveamento ocorre em uma superfıcie denomi-
nada superfıcie de chaveamento. Embora no exemplo citado estas duas superfıcies
sejam as mesmas, isso nem sempre e verdade.
O movimento das trajetorias do sistema e dividido em duas fases. Na primeira
fase, conhecida como fase de aproximacao, a trajetoria iniciada em qualquer lugar
do plano de fase e conduzida em tempo finito para a superfıcie de deslizamento.
Na segunda fase, o sistema entra em modo deslizante e ocorre uma reducao na
ordem da dinamica do sistema, que passa a ser dada pela equacao da superfıcie
de deslizamento. No exemplo analisado, no deslizamento o sistema passa a ser
governado pela seguinte equacao diferencial:
x1 = −x1
A partir desse momento, o sistema apresentara um comportamento igual ao de
um sistema de primeira ordem e tera uma convergencia exponencial para a origem.
Para representar o que acontece com o sinal de controle na presenca de imper-
feicoes, a expressao sign(s) sera substituıda por um rele com histerese. Nesse caso,
para uma histerese de valor mais alto, o sinal de controle nao possui uma frequencia
infinita e as trajetorias nao ficam confinadas perfeitamente na superfıcie de desliza-
mento. Para uma histerese de valor um pouco menor, o sistema se aproxima mais
do ideal, mas ainda ocorre trepidacoes nas trajetorias. Para uma histerese de valor
bem baixo (na faixa dos 0.001), a frequencia de chaveamento fica bastante elevada.
No limite, quando a largura da histerese tender para zero a frequencia tenderia para
o infinito e o sinal de controle nao poderia ser mais definido no tempo. Neste caso,
poderia-se considerar que o sistema entrou em modo deslizante.
22
Figura 3.5: Exemplos de trajetorias proximas da superfıcie de deslizamento e sinais de
controle para um sistema com histerese.
Para ilustrar esse comportamento, tem-se as seguintes figuras. Nas figuras 3.5 (a)
e 3.5 (d) tem-se a trajetoria maxima e o sinal de controle, respectivamente, para
uma histerese de 0.5. Nas figuras 3.5 (b) e 3.5 (e) tem-se as mesmas figuras porem
para uma histerese de 0.05 e nas figuras 3.5 (c) e 3.5 (f) para uma histerese de 0.005.
O fenomeno que ocorre para valores de histerese mais alto e conhecido como chat-
tering, que pode ser explicado da seguinte forma: no modo deslizante ideal, o estado
permanece na superfıcie de deslizamento e o sinal de controle possui frequencia in-
finita, ja no deslizamento real, o sinal de controle oscila em frequencias altas, mas
nao infinitas. Nesse caso, e possıvel ver uma trepidacao nos sinais do sistema.
Um aspecto interessante desse tipo de abordagem e a robustez do controlador.
Mesmo com incertezas ou pertubacoes, se as trajetorias do sistema continuarem
apontando em direcao a superfıcie de deslizamento, o sistema continuara entrando
em modo deslizante e apresentara o mesmo desempenho citado anteriormente (sera
governado pela dinamica referente a equacao da superfıcie de deslizamento).
23
Para ilustrar essa caracterıstica, considere o exemplo a seguir, onde foi colocada
uma pertubacao do tipo senoidal, com α = 1 e f(t) = 5:
x1 = x2
x2 = 4 sin(x1) + u
u = −f(t) sign(s)
s = x2 + αx1
(3.4)
A figura abaixo mostra o plano de fase para o sistema completo e pode ser visto
que mesmo com a pertubacao, as trajetorias continuam apontando na direcao da
superfıcie de deslizamento, o que garante que o sistema entre em modo deslizante.
A partir deste momento o sistema se torna insensıvel a perturbacoes.
Figura 3.6: Plano de fase para o sistema (3.4).
3.3 Existencia dos Modos Deslizantes
Para que o sistema entre em modo deslizante, a superfıcie de deslizamento deve
ser pelo menos localmente atrativa, ou seja, deve existir um domınio envolvendo a
superfıcie no qual as trajetorias do sistema apontam na sua direcao. Um criterio
matematico sucinto para expressar esse fato e dado por:
24
ss ≤ 0 (3.5)
A condicao (3.5) e chamada de condicao de alcancabilidade. Entretanto, essa
condicao garante que a superfıcie de deslizamento seja alcancada apenas assintotica-
mente, o que nao e suficiente para assegurar que o sistema entre em modo deslizante.
Para garantir que a superfıcie de deslizamento seja alcancada em tempo finito,
uma condicao mais restritiva deve ser satisfeita. Essa condicao e a condicao de
alcancabilidade-η dada por:
ss ≤ −η|s| (3.6)
onde η e uma constante positiva.
Reescrevendo a equacao (3.6) como
1ds2
2dt≤ −η|s|
ou ainda:
1d(|s|2)
2√
(|s|2)≤ −ηdt
e integrando de 0 a ts, segue que:
|s(ts)| − |s(0)| ≤ −ηts
Deste modo, o tempo necessario para atingir a superfıcie s = 0, representado por
ts, satisfaz:
ts ≤|s(0)|η
o que assegura uma convergencia em tempo finito para a superfıcie de desliza-
mento.
25
Nos casos analisados anteriormente, esta condicao e satisfeita de forma local,
garantido o aparecimento do deslizamento ideal.
� Exemplo 1:
s = x1 + x2
s = x2 − 5 sign(s)
ss ≤ −|s|(5− |x2|)
Dessa forma, para existir o modo deslizante neste caso temos que ter:
5− |x2| ≥ 0
|x2| ≤ 5 (3.7)
� Exemplo 2
s = x1 + x2
s = x2 + 4 sin(x1)− 5 sign(s)
ss ≤ −|s|(5− 4 sin(x1)− |x2|)
1− |x2| ≥ 0
|x2| ≤ 1 (3.8)
26
No caso ideal considerado pelo Exemplo 1, para que o deslizamento seja alcancado
de forma global a seguinte condicao deve ser satisfeita:
f(t) ≥ |x2|+ η
sendo que η e uma constante positiva que pode ser arbitrariamente pequena.
Nos casos analisados, como o deslizamento acontece localmente, quando x2 nao
satisfaz as condicoes acima, a trajetoria ira passar da superfıcie e somente quando
satisfazer as condicoes de deslizamento a trajetoria ficara confinada na superfıcie
de deslizamento. A figura 3.7 ilustra isso para o Exemplo 1, onde nao existe per-
turbacao.
Figura 3.7: Ilustracao do deslizamento local.
3.4 Metodo da Regularizacao
O modo de deslizamento ideal envolve o uso de um sinal de controle descontınuo,
o que impoe algumas dificuldades para a representacao matematica do sistema.
Para contornar esse problema, uma abordagem simples utilizada e a introducao de
imperfeicoes fısicas (zona morta, histerese, atraso) no dispositivo de chaveamento.
Com isto, o modo de deslizamento que apareceria na superfıcie descontınua dara
lugar a trajetorias mais suaves, que sao contınuas por partes.
27
Todavia, essa abordagem possui uma limitacao: deve ser conhecida a natureza
dessas imperfeicoes, o que nem sempre e facil. Uma solucao utilizada para resolver
esse problema e o uso do conceito de camada de fronteira (boundary layer), que per-
mite obter as equacoes do deslizamento sem especificar a natureza das imperfeicoes.
Considere sistemas da seguinte forma:
x = a(x, t) + b(x, t)u (3.9)
E suponha que a superfıcie de deslizamento exista e seja dada por s(x) = 0. A ideia
desse conceito e substituir o controle u, na vizinhanca da superfıcie de deslizamento,
por outro controle u que leve em consideracao todas a imperfeicoes, as encontradas
no dispositivo de chaveamento e as existentes na planta. O movimento do sistema
passa a ser entao:
x = a(x, t) + b(x, t)u
A solucao da equacao regularizada acima resulta em um movimento que nao
ocorre somente sobre a superfıcie de deslizamento (s(x) = 0), mas sim em alguma
vizinhanca
|s(x)| ≤ ∆
onde ∆ e uma constante positiva pequena. Este movimento e denominado desliza-
mento real. Como foi visto na figura 3.5 durante o deslizamento real o chaveamento
do sistema apresenta uma frequencia finita, que representa o fenomeno de chatte-
ring. Este fenomeno e extremamente prejudicial, pois pode excitar modos rapidos
do sistema que haviam sido desprezados, podendo levar o sistema a instabilidade.
Caso as imperfeicoes do sistema tendam para zero, ou seja, caso ∆ → 0 o desli-
zamento real tendera para o deslizamento ideal e a frequencia de chaveamento do
sistema tendera para o infinito, evitando dessa forma o surgimento do chattering.
28
3.5 Metodo do Controle Equivalente
Uma forma alternativa dos modos deslizantes serem representados e pelo conceito
de controle equivalente [10, 11]. Esse metodo consiste em encontrar um controle
contınuo ueq (o controle equivalente), que para uma dada condicao inicial sobre a
superfıcie de deslizamento, a trajetoria dos sistemas (3.9) passa a ser:
x = a(x, t) + b(x, t)ueq (3.10)
Essa trajetoria deve coincidir com a trajetoria descrita pelo sistema a estrutura
variavel durante o deslizamento.
Para encontrar o controle equivalente e suficiente notar que s(x) = 0 e uma
condicao necessaria para que as trajetorias de estado permanecam na superfıcie de
deslizamento s(x) = 0. Derivando s(x) ao longo das trajetorias de (3.9), obtem-se:
s(x) =∂s
∂xa(x, t) +
∂s
∂xb(x, t)u = 0 (3.11)
Resolvendo (3.11) para u, obtem-se o controle equivalente:
ueq = −(∂s
∂xb(x, t)
)−1(∂s
∂xa(x, t)
)(3.12)
onde a existencia de(∂s∂xb(x, t)
)−1e uma condicao necessaria.
O sistema abaixo e usado como exemplo para ilustrar o procedimento:
x1 = x2
x2 = u
u = − sign(s)
s = x1 + 2x2
(3.13)
A figura 3.8 apresenta o plano de fase do sistema (3.13). Vale ressaltar que o
sistema so entra em modo deslizante quando |x2| < 2.
29
Figura 3.8: Plano de fase para o sistema (3.13).
Para este caso o controle equivalente e obtido do seguinte modo:
s(x) = x2 + 2u⇒ ueq = −x2
2(3.14)
Substituindo o controle equivalente obtido em (3.14) no sistema (3.13), obtem-se
o seguinte sistema:
x1 = x2
x2 = ueq
ueq = −x22
(3.15)
O sistema (3.15) e equivalente ao sistema (3.13) durante o deslizamento.
A figura 3.9 apresenta o grafico dos sinais x1, x2 e u dos sistemas (3.13) e (3.15),
com a mesma condicao inicial para os dois. Nesta figura pode ser visto que os
sistemas apresentam o mesmo desempenho. Embora o controle equivalente (figura
3.9 (d)) seja contınuo e muito diferente do controle descontınuo (figura 3.9 (c)), ele
pode ser entendido como sendo o comportamento medio deste controle descontınuo.
30
Figura 3.9: (a) Grafico de x x t para o sistema (3.13); (b) Grafico de x x t para o sistema
(3.15); (c) Sinal de controle para o sistema (3.13); (d) Sinal de controle para o sistema
(3.15).
3.6 Controle por Modos Deslizantes Integral
O SMC convencional possui como principal caracterıstica sua robustez contra in-
certezas casadas. Porem, essa caracterıstica importante e alcancada apenas quando
o sistema passa da fase de aproximacao e entra em deslizamento. Dessa forma, du-
rante a fase de aproximacao o sistema fica sujeito ao efeito de qualquer incerteza,
inclusive as casadas.
31
Para contornar esse problema, foi proposto o ISMC. Esse tipo de controle tem
como principal objetivo forcar que ocorra o deslizamento desde o inıcio da resposta
do sistema, de forma que o sistema consiga ser robusto contra incertezas casadas
durante todo o tempo de resposta. Alem disso, sera mostrado adiante que o ISMC
tem a vantagem de nao amplificar o efeito de incertezas descasadas [22].
As subsecoes seguintes visam exemplificar as caracterısticas do ISMC por meio
do projeto do controle baseado no ISCM de um sistema LTI incerto. Os desen-
volvimentos dessa secao sao baseados nos desenvolvimentos apresentados em [22].
Assume-se durante toda essa secao que a informacao sobre o vetor de estados esta
disponıvel para o projeto do controlador. Alem disso, no ISMC assume-se que existe
uma planta nominal, na qual um controlador apropriado ja foi projetado para garan-
tir a estabilidade assintotica do sistema em malha fechada. Assim, um controlador
descontınuo e ‘adicionado‘ ao controlador nominal de forma a manter a performance
nominal e garantir que o sistema seja insensıvel a perturbacoes externas.
3.6.1 Definicao do Problema
Considere o seguinte sistema:
x(t) = Ax(t) +Bu(t) +Mξ(t, x) + fu(t, x) (3.16)
onde A ∈ Rn×n, B ∈ Rn×m. Assume-se que a matriz B possui posto completo,
ou seja, posto(B) = m, onde 1 ≤ m < n e que o par (A,B) e controlavel. Alem
disso, assume-se que a matriz M ∈ Rn×l e conhecida e se encontra na extensao do
espaco da matriz de distribuicao de entrada B, sendo possıvel escrever M = BD
para algum D ∈ Rm×l. Dessa forma, o sistema (3.16) pode ser reescrito, como:
x(t) = Ax(t) +Bu(t) +BDξ(t, x) + fu(t, x) (3.17)
Incertezas da forma BDξ(t, x), que agem no canal da matriz de distribuicao de
entrada, sao conhecidas como incertezas casadas. Ja o termo fu(t, x) representa
uma incerteza descasada, ou seja, que nao esta na extensao do espaco da matriz B.
32
No problema considerado, assume-se que a incerteza descasada e limitada com um
limite superior conhecido [22].
O sistema nominal associado ao sistema (3.17) pode ser escrito como:
x(t) = Ax(t) +Buo(t) (3.18)
Onde uo(t) e a lei de controle nominal, que pode ser projetada por meio de qual-
quer paradigma de realimentacao de estado capaz de atingir a performance nominal
desejada [22]. Como se assume que o par (A,B) e controlavel, existe um controle
de realimentacao de estado da seguinte forma:
uo(t) = −Fx(t) (3.19)
Onde F ∈ Rm×n e o ganho da realimentacao a ser projetado, de forma que as
trajetorias de estado do sistema nominal (3.18), chamadas de xo(t), sao estaveis e
respeitam as especificacoes de performance. O objetivo e desenvolver uma lei de
controle u(t), tal que as trajetorias de estado x(t) de (3.16) durante o deslizamento
satisfacam a condicao x(t) ≡ xo(t) para todo o tempo se fu(.) = 0, partindo do
tempo inicial onde x(0) ≡ xo(0). Para atingir x(0) ≡ xo(0) a ordem do sistema
em deslizamento deve ser a mesma do sistema nominal, sendo essa uma primeira
diferenca para o SMC tradicional, onde a ordem do sistema em deslizamento e
reduzida.
3.6.2 Princıpios do Projeto
Definindo a lei de controle u(t) com a forma:
u(t) = uo(t) + un(t) (3.20)
Onde uo(t) e o controle nominal e un(t) e um termo nao linear incluıdo para
induzir o modo deslizante. Utilizando (3.20), a equacao do sistema (3.16) pode ser
reescrita como:
33
x(t) = Ax(t) +Buo(t) +Bun(t) +BDξ(t, x) + fu(t, x) (3.21)
O termo un(t) e escolhido de forma a rejeitar a perturbacao ξ(t, x) enquanto o
sistema estiver no deslizamento e uo(t) e dado pela equacao (3.19). A superfıcie de
deslizamento e definida como:
s(t) = Gx(t) + z(t) (3.22)
G ∈ Rm×n e z(t) e especificada. A matriz de deslizamento G pode ser escolhida
de forma que a matriz GB seja nao singular (det(GB) 6= 0). Durante o deslizamento
s(t) = s(t) = 0 e portanto:
s(t) = Gx(t) + z(t) = 0 (3.23)
Para garantir que o controle equivalente associado com un(t) rejeite o efeito da
perturbacao casada ξ(t, x) (quando fu(t, x) = 0) e que a condicao x(t) ≡ xo(t) seja
satisfeita para todo t > 0, substitui-se o valor de (3.21) em (3.23):
s(t) = G(Ax(t) +Buo(t) +Bun(t) +BDξ(t, x)) + z(t) = 0 (3.24)
Durante o deslizamento espera-se que un(t) compense a incerteza, portanto espera-
se que uneq = −Dξ(t, x). Dessa forma, pode-se escolher:
z(t) = −G(Ax(t) +Buo(t)), z(0) = −Gx(0) (3.25)
Essa escolha garante que
s(t) = GBun(t) +GBDξ(t, x) (3.26)
E portanto durante o deslizamento uneq = −Dξ(t, x). Substituindo o valor de uneq
em (3.21) e possıvel notar que na ausencia da perturbacao fu(t, x) o modo deslizante
integral e governado por:
34
x(t) = Ax(t) +Buo(t) (3.27)
A equacao (3.27) confirma que a condicao x(t) ≡ xo(t) e satisfeita se fu(t, x) = 0
e x(0) = xo(0). Para o caso onde fu(t, x) 6= 0, o controle equivalente pode ser obtido
da equacao (3.24):
uneq(t) = −(GB)−1GBDξ(t, x)− (GB)−1Gfu(t, x)
= −Dξ(t, x)− (GB)−1Gfu(t, x) (3.28)
Substituindo este valor de uneq(t) em (3.21), e possıvel obter uma expressao para
a dinamica do modo de deslizamento integral:
x(t) = Ax(t) +Buo(t) + (I −B(GB)−1G)︸ ︷︷ ︸Γ
fu(t, x) (3.29)
Pela equacao (3.29) fica claro que o efeito da incerteza casada foi completamente
rejeitado durante o deslizamento. Porem, a matriz Γ pode amplificar os efeitos da
incerteza descasada fu(t, x). Portanto, e necessario projetar a superfıcie de desliza-
mento integral de forma a evitar qualquer amplificacao da incerteza descasada.
3.6.3 Superfıcie de Deslizamento Integral
Usando as expressoes (3.22) e (3.25), obtem-se uma expressao para a superfıcie
de deslizamento integral que elimina a fase de aproximacao:
s(t) = Gx(t)−Gx(0)−G∫ t
0
(Ax(τ) +Buo(τ)) dτ (3.30)
O termo −Gx(0) vem do fato de z(0) = −Gx(0) e e ele que garante que s(0) = 0,
fazendo com que a fase de aproximacao seja eliminada. Assim, o modo deslizante
vai existir desde o tempo t = 0 e o sistema sera robusto contra incertezas casadas
por toda a resposta em malha fechada.
35
Para rejeitar incertezas casadas, qualquer escolha de G que garante que GB seja
invertıvel e suficiente, todavia para rejeitar incertezas descasadas e necessario uma
escolha especıfica de G. Uma escolha apropriada e G sendo a pseudo inversa de B:
G = B+ =(BTB
)−1BT (3.31)
Essa escolha para G possui duas vantagens:
1. o ganho de modulacao associado com un(t) em (3.20) e minimizado, o que
significa que a amplitude do fenomeno de chattering pode ser reduzida;
2. evita que perturbacoes descasadas sejam amplificadas.
Essa escolha de G garante que GB e nao singular e simplifica a expressao:
GB =(BTB
)−1BT︸ ︷︷ ︸
G
B = Im
Alem disso, essa escolha de G faz com que o operador Γ em (3.29) passe a ser:
Γ = In −B(BTB
)−1BT (3.32)
E importante notar que o operador Γ em (3.32) possui a propriedade Γ2 = Γ.
Esta propriedade implica que ‖Γ‖ = 1, significando, portanto, que o efeito de fu nao
e amplificado ja que ‖Γfu‖ ≤ ‖fu‖.
3.6.4 Leis de controle
O controlador sera projetado baseado no sistema nominal (3.18) e tem a estrutura
dada pela equacao (3.20), com o termo uo(t) sendo a parte linear do controlador e
un(t) sendo a parte descontınua que forca o modo deslizante sobre a superfıcie de
deslizamento (3.30). Uma possıvel escolha para u(t) e:
u(t) = −Fx(t)− ρ(t, x)(GB)−1 s(t)
‖s(t)‖para s(t) 6= 0 (3.33)
36
Onde F e responsavel pela performance do sistema nominal e ρ(t, x), que tera seu
valor definido na proxima subsecao, e a modulacao que garante o modo deslizante.
3.6.5 Condicao de Alcancabilidade
Para garantir a existencia do modo deslizante ideal e necessario que o controlador
(3.33) satisfaca a condicao de alcancabilidade-η. Pode-se escrever:
s(t) = G (Ax(t) +Bu(t) +BDξ(t, x) + fu(t, x))−GAx(t) +GBFx(t) (3.34)
Substituindo (3.33) em (3.34) e simplificando obtem-se:
s(t) = G
(Ax(t) +B
(−Fx(t)− ρ(t, x)(GB)−1 s(t)
‖s(t)‖
)+BDξ(t, x) + fu(t, x)
)−GAx(t) +GBFx(t)
= −ρ(t, x)s(t)
‖s(t)‖+GBDξ(t, x) +Gfu(t, x) (3.35)
A condicao de alcancabilidade-η, ss ≤ η |s| pode ser reescrita como sT s ≤ η ‖s‖.
Dessa forma, multiplicando (3.35) por sT :
sT (t)s(t) = −ρ(t, x)‖s‖2
‖s‖+ sT (t) GB︸︷︷︸
I
Dξ(t, x) + sT (t)Gfu(t, x)
= −ρ(t, x) ‖s(t)‖+ sT (t)Dξ(t, x) + sT (t)Gfu(t, x)
≤ ‖s(t)‖ (−ρ(t, x) + ‖Dξ(t, x)‖+ ‖Gfu(t, x)‖) (3.36)
O valor da modulacao ρ(t, x) deve ser maior que qualquer perturbacao ou incerteza
do sistema, portanto, ρ(t, x) devera satisfazer:
ρ(t, x) ≥ ‖D‖ ‖ξ(t, x)‖+ ‖G‖ ‖fu(t, x)‖+ η (3.37)
Em (3.37), η e um escalar positivo. Com essa escolha para ρ(t, x), a condicao de
alcancabilidade-η e satisfeita e pode ser escrita como:
sT (t)s(t) ≤ −η ‖s(t)‖ (3.38)
37
3.6.6 Propriedades
Por fim, e valido ressaltar as principais caracterısticas do ISMC:
� o deslizamento ocorre durante toda a resposta do sistema, uma vez que a fase
de aproximacao e eliminada;
� durante o deslizamento, a ordem do movimento e a mesma ordem do sistema
original;
� o efeito da incerteza descasada nao e amplificado, com uma escolha correta da
superfıcie de deslizamento;
� durante o deslizamento, o sistema e invariante a incertezas casadas.
Portanto, esse trabalho utiliza o conceito do ISMC, pois com ele e possıvel lidar
com sistemas que alem de incertezas casadas, possuem incertezas descasadas, elimi-
nando, dessa forma, a necessidade de restringir os sistemas a serem controlados aos
casos onde as incertezas encontradas sao casadas.
3.7 Chattering
Como ja foi citado anteriormente, o fenomeno de chattering e uma das principais
desvantagens existentes no controle por modos deslizante. Ele ocorre quando a
superfıcie de deslizamento s(x) = 0 e alcancada e ocorre a excitacao de dinamicas nao
modeladas, que podem levar a oscilacoes do vetor de estados em altas frequencias.
Estas oscilacoes resultam numa reducao da acuracia do controle, o que pode levar
ate mesmo o sistema a instabilidade, dessa forma existe um grande interesse no
estudo e na reducao de seus efeitos [23].
A maneira mais imediata de amenizar o chattering e substituir a nao linearidade
do tipo rele do controlador por um elemento que implemente uma funcao similar,
mas que nao apresente um ponto de descontinuidade, ou seja, a ideia e utilizar uma
aproximacao contınua do rele.
38
Em [19], sao citados varios metodos para lidar com o chattering, onde vale a pena
destacar o metodo que utiliza o conceito de controle equivalente. Em [24], e valido
destacar o metodo do boundary layer. Esta solucao possui um bom desempenho e e
implementada fazendo uso de uma funcao de saturacao. Dessa forma, um controle
da seguinte forma:
u(t) = f(t) sign(s(t))
passa a ser descrito como:
u(t) = f(t) sat
(s(t)
σ
)onde s(t) e a superfıcie de deslizamento e σ e a espessura da boundary layer.
As funcoes sign e sat sao definidas como:
sign(s(t)) =
1, se s(t) > 0
0, se s(t) = 0
−1, se s(t) < 0
sat
(s(t)
σ
)=
1, se s(t) > σ
s(t)σ, se ‖s(t)‖ ≤ σ
−1, se s(t) < −σ
A figura 3.10 mostra como fica o sinal de controle usando a funcao de saturacao.
39
Figura 3.10: Sinal de controle: (a)Rele; (b)Saturacao para σ = 1.
40
Capıtulo 4
Sistemas com atraso
4.1 Introducao
Sistemas com atraso (Time Delay Systems - TDSs), tambem conhecidos como
sistemas com tempo morto, sao extremamente comuns na pratica, dado que nor-
malmente existe um tempo para adquirir a informacao necessaria para a tomada
de decisoes e para a execucao das mesmas. Eles pertencem a classe de equacoes
diferenciais funcionais (Functional Differential Equations - FDEs), que sao sistemas
com dimensao infinita, em oposicao as equacoes diferenciais ordinarias (Ordinary
Differential Equations - ODEs) [2].
Um exemplo simples de TDS e:
x(t) = −x(t− h), x(t) ∈ R (4.1)
onde h > 0 representa o atraso.
Atrasos podem aparecer no estado, na entrada de controle ou na saıda, sendo que
esses atrasos podem ser de transporte, comunicacao ou de medida. Eles aparecem
em uma serie de sistemas de controle, como: controle de aeronaves, controle de
processos quımicos, controle de redes de comunicacao, entre outros [2, 25, 1].
41
Figura 4.1: Esquematico de um sistema simples com atraso.
A figura 4.1 representa um exemplo de sistema com atraso bem comum e simples.
A pessoa tomando banho deseja atingir a temperatura Td e para isso realiza o ajuste
da temperatura alternando entre colocar a agua mais fria ou mais quente. No tempo
t, a pessoa sente a temperatura da agua que saiu do chuveiro em um tempo anterior
t− h, entao e obtida a seguinte equacao, com h sendo um atraso constante:
T (t) = −k[T (t− h)− Td], k ∈ R (4.2)
Apesar da simplicidade do sistema, o atraso impoe algumas dificuldades. Consi-
dere a funcao de transferencia do sistema (4.2):
G(s) =T (s)
Td(s)=
k
s+ ke−sh
O termo destacado e−sh representa o efeito do atraso no sistema. Esse termo e
uma funcao irracional, o que faz com que seja necessario o uso de aproximacoes
para facilitar o uso de softwares de analise numerica como o Matlab, sendo as mais
comuns a serie de Taylor e Aproximacao de Pade [26, 25].
42
Figura 4.2: Diagrama de Bode para o termo de atraso puro.
Para representar graficamente o efeito do atraso em um sistema, considere o dia-
grama de Bode do atraso puro na figura 4.2. Pela figura e possıvel ver que, apesar de
o atraso nao alterar a magnitude do diagrama de Bode, ele altera a fase, que passa
a decair linearmente com o atraso. Desta forma, o ganho dos controladores que
trabalham com sistemas com atraso sao limitados e costumam ser valores baixos.
Para ilustrar melhor a questao do ganho baixo em sistemas com atraso, considere
o seguinte sistema:
x(t) = x(t− h) (4.3)
O sistema (4.3) possui a seguinte funcao de transferencia:
G(s) =e−sh
s(4.4)
Considerando a possibilidade de um ganho proporcional, a figura 4.3 ilustra a
resposta ao degrau do sistema (4.3) em malha fechada, com atraso h = 1. Como
e possıvel ver, para ganhos K = 2 e K = 1.5, o sistema e instavel. Para um
ganho K = 0.8, o sistema e estavel. Isso demonstra para um exemplo simples como
sistemas com atraso costumam trabalhar com ganhos muito baixos.
43
Figura 4.3: Resposta ao degrau do sistema (4.3) considerando a possibilidade de um
ganho proporcional.
E valido ressaltar que tecnicas baseada em controle por modos deslizantes costu-
mam trabalhar com ganhos altos, portanto a tecnica que sera implementada tera
que lidar com isso para obter bom resultado.
4.2 Conceito de solucao
Considere sistemas com atraso como descritos na equacao (4.1). Para definir a
solucao em t ∈ [0, h], e necessario definir o lado direito da equacao para o mesmo
intervalo de tempo, o que resulta em uma funcao para o valor inicial:
x(θ) = ϕ(θ), θ ∈ [−h, 0] (4.5)
Essa e uma das diferencas para as ODEs, ao inves de existir uma condicao inicial
x(0) em h = 0 como existe nas ODEs, existe uma funcao para um intervalo de
tempo como valor inicial para equacao. Outra diferenca e que no caso de ODEs, o
estado e um vetor de n dimensoes se movendo no espaco Rn. Ja as FDEs possuem
a influencia do tempo passado, de forma que o estado nao pode ser mais um vetor
definido no instante t apenas e passa a existir uma quantidade variada de solucoes
que levam ao mesmo valor em um numero infinito de pontos.
Para encontrar uma solucao para o problema, um metodo possıvel de ser utilizado
e o metodo dos passos (step method) [2, 25]. Considerando ainda sistemas como o
44
da equacao (4.1), com condicoes iniciais como na equacao (4.5), primeiro e preciso
achar uma solucao em t ∈ [0, h]:
t ∈ [0, h]→ dx
dt= −ϕ(t− h) ∴
∫ x(t)
ϕ(0)
dx = −∫ t
0
ϕ(τ − h)dτ
x(t) = ϕ(0)−∫ t
0
ϕ(τ − h)dτ︸ ︷︷ ︸ϕ1(t)
Continuando o procedimento para t ∈ [h, 2h]:
t ∈ [h, 2h]→ dx
dt= −ϕ1(t− h) ∴
∫ x(t)
ϕ1(h)
dx = −∫ t
h
ϕ1(τ − h)dτ
x(t) = ϕ1(h)−∫ t
h
ϕ1(τ − h)dτ︸ ︷︷ ︸ϕ2(t)
Para obter a solucao, continua-se este procedimento para t ∈ [2h, 3h], t ∈ [3h, 4h]
e assim por diante. Para ilustrar melhor o procedimento, considere a equacao (4.1)
com h = 1 e com condicao inicial ϕ = 1:
t ∈ [0, 1]→ dx
dt= −ϕ(t− 1) ∴
∫ x(t)
ϕ(0)
dx = −∫ t
0
ϕ(τ − 1)dτ
x(t) = ϕ(0)−∫ t
0
1dτ︸ ︷︷ ︸ϕ1(t)
∴ x(t) = 1− t = ϕ1(t)
t ∈ [1, 2]→ dx
dt= −ϕ1(t− 1) ∴
∫ x(t)
ϕ1(1)
dx = −∫ t
1
ϕ1(τ − 1)dτ
x(t) = ϕ1(1)−∫ t
1
ϕ1(τ − 1)dτ︸ ︷︷ ︸ϕ2(t)
x(t) = 0−∫ t
1
1− (τ − 1)dτ = −∫ t
1
2− τdτ
x(t) =t2
2− 2t+
3
2= ϕ2(t)
O procedimento pode ser continuado para mais intervalos de tempo. A figura 4.4
mostra o resultado obtido com o metodo dos passos para o sistema (4.1), com h = 1
e com os valores ϕ = 1 e ϕ = 0.5t para as funcoes que sao as condicoes iniciais.
45
Essa figura ilustra outra caracterıstica das FDEs, uma FDE possui varias solucoes
que levam ao mesmo valor x(t∗) em instantes t∗, em oposicao as ODEs em que em
cada x(t∗) so passa apenas uma solucao. Portanto, em TDSs, o estado e na verdade
uma funcao:
xt : [−h, 0]→ R : xt(θ) = x(t+ θ), θ ∈ [−h, 0]
no intervalo [t− h, t].
Figura 4.4: Solucao do sistema (4.1).
Para ilustrar um caso um pouco mais geral, porem ainda escalar, considere a
seguinte equacao:
x = −a1x(t) + a2x(t− h)
x(t) = ϕ0(t), t ∈ [−h, 0](4.6)
Como ja foi citado, primeiro e necessario encontrar a solucao em t ∈ [0, h]:
t ∈ [0, h]→ x(t) = e−a1tϕ0(0) +
∫ t
0
e−a1(t−τ)a2ϕ0(τ − h)dτ︸ ︷︷ ︸ϕ1(t)
Entao, deve-se continuar com os outros intervalos t ∈ [h, 2h], t ∈ [2h, 3h] e assim
por diante:
46
t ∈ [h, 2h]→ x(t) = e−a1(t−h)ϕ1(h) +
∫ t
h
e−a1(t−τ)a2ϕ1(τ − h)dτ︸ ︷︷ ︸ϕ2(t)
t ∈ [2h, 3h]→ x(t) = e−a1(t−2h)ϕ2(2h) +
∫ t
2h
e−a1(t−τ)a2ϕ2(τ − h)dτ︸ ︷︷ ︸ϕ3(t)
De forma geral: Supondo que x(t) = ϕi−1(t) em um intervalo [ti − h, ti]. Entao,
no intervalo [ti, ti + h], tem-se que:
x(t) = ea1(t−ti)ϕi−1(ti) +
∫ t
ti
e−a1(t−τ)a2ϕi−1(τ − h)dτ︸ ︷︷ ︸ϕi(t)
(4.7)
Como e possıvel ver, o resultado obtido em (4.7) e uma generalizacao do caso sim-
ples representado pela equacao (4.1). Para ilustrar o resultado, considere o seguinte
sistema:
x = −2x(t) + x(t− 1)
x(t) = ϕ0(t), t ∈ [−1, 0](ϕ0(t) = 1
2
) (4.8)
Resolvendo a equacao (4.8) se baseando em (4.7):
t ∈ [0, 1]→ x(t) = −2x(t) +1
2
x(t) = e−2t ϕ0(0)︸ ︷︷ ︸12
+
∫ t
0
1
2e−2(t−τ)dτ
x(t) =1
2e−2t +
1
4e−2t
[e2τ∣∣∣t0
]
x(t) =1
2e−2t +
1
4− 1
4e−2t ∴ x(t) = ϕ1(t) =
1
4+
1
4e−2t
47
Seguindo para o proximo intervalo t ∈ [1, 2]:
t ∈ [1, 2]→ x(t) = −2x(t) +1
4+
1
4e−2(t−1)
x(t) = e−2(t−1)ϕ1(1) +
∫ t
1
e−2(t−τ)
(1
4+
1
4e−2(τ−1)
)dτ
x(t) =1
4e−2t +
1
4e−2(t−1) +
1
4e−2t
(∫ t
1
e2τdτ +
∫ t
1
e2dτ
)
x(t) =1
4e−2t +
1
4e−2(t−1) +
1
4e−2t
1
2e2τ∣∣∣t1︸ ︷︷ ︸
12
(e2t−e2)
+ e2τ∣∣∣t1︸ ︷︷ ︸
te2−e2
x(t) =1
4e−2t +
1
4e−2(t−1) +
1
8− 1
8e−2(t−1) +
1
4te−2(t−1) − 1
4e−2(t−1)
x(t) =1
4e−2t +
1
8− 1
8e−2(t−1) +
1
4te−2(t−1)
O processo poderia continuar para mais intervalos de tempo seguindo esse mesmo
raciocınio e tem seu resultado ilustrado na figura 4.5.
Figura 4.5: Solucao do sistema (4.8).
O caso mais geral considera a possibilidade dos escalares a1 e a2 serem matrizes
e possui a seguinte forma:
x(t) = Ax(t) + A1x(t− h) + f(t), t ≥ 0 (4.9)
48
Onde A e A1 sao matrizes constantes, f(t) e uma funcao localmente integravel e
a condicao inicial e definida como em (4.5). A solucao de (4.9) com A1 = 0 e dada
por:
x(t) = eAtϕ(0) +
∫ t
0
eA(t−τ)f(τ)dτ (4.10)
Para considerar o caso onde A1 6= 0, e necessario definir uma matriz X(t) que
satisfaz a equacao homogenea:
x(t) = Ax(t) + A1x(t− h) (4.11)
A matriz X(t) possui as seguintes condicoes iniciais:
X(t) =
0, t < 0
I, t = 0(4.12)
A solucao de (4.9) e dada por:
x(t) = X(t)ϕ(0) +
∫ 0
−hX(t− θ − h)A1ϕ(θ)dθ +
∫ t
0
X(t− τ)f(τ)dτ (4.13)
A prova para o resultado (4.13) pode ser encontrada em [2].
Como e possıvel ver, a solucao de um TDS vai ficando mais complexa conforme se
generaliza o sistema. Dessa forma, o caso mais geral que sera considerando adiante
na estrategia de controle desenvolvida possui uma grande complexidade matematica,
tornando o projeto do controlador mais desafiador.
4.3 Tipos de atrasos
Um sistema com atraso pode estar sujeito a atrasos de naturezas diferentes, sendo
os mais comuns citados nas subsecoes a seguir.
49
4.3.1 Atrasos Constantes
Foram os primeiros tipo de atraso a serem considerados. Os estudos de esta-
bilidade desses sistemas eram baseados principalmente em abordagens no domınio
da frequencia, com destaque para criterios aplicados a funcoes de transferencia de
Laplace. Ja no domınio do tempo, o metodo mais comum utilizado, e que ainda
persiste nos estudos atuais, e o metodo direto de Lyapunov [27, 28].
A analise da estabilidade utilizando o segundo metodo de Lyapunov pode levar a
condicoes que sao ditas independentes do atraso ou dependentes do atraso. Como
o nome sugere, condicoes dependentes do atraso significam que a estabilidade e
garantida apenas para alguns valores de atraso [27].
O crescente numero de estudos baseado no domınio do tempo se deve ao fato de
que os problemas tratados podem ser modelados como LMIs e que estas podem ser
resolvidas de forma simples e eficaz utilizando software de analise numerica, como
por exemplo o Matlab [27].
4.3.2 Atrasos variantes no tempo
Atrasos constantes costumam ser muito restritivos e com o avanco de aplicacoes
na area de redes de comunicacao houve uma motivacao para estudos que consideram
atrasos que variam com o tempo [27, 28].
Atrasos deste tipo sao mais prejudiciais a estabilidade do sistema do que os atrasos
constantes e quanto mais rapida for a variacao do atraso, mais prejudicial e o atraso
[28]. Muitos autores consideram a seguinte suposicao para facilitar o estudo do
sistema:
0 ≤ h(t) ≤ h2 (4.14)
onde h2 e um escalar positivo.
Entretanto, essa suposicao pode ser muito restritiva, pois e permitido que a funcao
de atraso chegue a zero, o que na pratica significaria que transporte da informacao
50
acontece de forma arbitrariamente rapida, e em algumas aplicacoes a velocidade e
limitada [27]. Por conta disso, a suposicao (4.14) e reescrita como:
0 < h1 ≤ h(t) ≤ h2 (4.15)
onde h1 e h2 sao escalares positivos.
Alem dessas suposicoes e muito comum existirem condicoes sobre a derivada da
funcao de atraso. A mais comum e:
h(t) ≤ d ≤ 1 (4.16)
A suposicao (4.16) exemplifica uma classe importante de atrasos variantes no
tempo: os atrasos que variam lentamente com o tempo. Alem disso, essa suposicao
implica que a funcao que representa a evolucao da informacao com atraso no tempo,
f(t) = t− h(t), so pode aumentar. Isso significa que a informacao afeta os sistemas
de forma cronologica [27]. Essa suposicao pode ser generalizada para:
d1 ≤ h(t) ≤ d2 (4.17)
onde d2 nao e necessariamente menor que 1. Essa generalizacao e necessaria
quando as condicoes para estabilidade dependem linearmente da derivada do atraso
[27].
Por fim, no caso da analise de sistemas onde ocorre amostragem de dados, e
comum existir a seguinte suposicao:
h(t) ≤ 1 (4.18)
A suposicao (4.18) implica que a funcao f(t) = t− h(t) pode ser constante, o que
significa que a informacao e mantida quando h(t) = 1, que e exatamente o efeito da
amostragem [27].
51
4.4 Tipos de TDSs
Como foi visto, TDSs se encaixam na classe de FDEs. Todavia, nao existe apenas
um tipo de sistema com atraso. Em relacao ao tipo de atraso que existe no sistema
e possıvel separar os TDSs em dois:
1. Sistemas com atraso discreto
2. Sistemas com atraso distribuıdo
Sistemas com atraso discreto sao sistemas representados pela seguinte FDE:
x(t) = Ax(t) + Adx(t− h), ∀t ≥ 0
x(t) = ϕ(t), ∀t ∈ [−h, 0](4.19)
onde x(t) e o vetor de estados e ϕ e a funcao de condicao inicial. No caso mais
simples pode-se assumir que A e Ad sao matrizes constantes.
A equacao (4.19) representa uma equacao de um TDS com atraso discreto, pois
apenas um valor discreto da funcao de estado, neste caso x(t− h), afeta a dinamica
do sistema. Esse tipo de sistema com atraso aparece em problemas de redes de
comunicacao, na area de Biologia e no controle de trafego por exemplo [27, 28].
Ja os sistemas com atraso distribuıdo sao sistemas onde toda funcao de estado xt
afeta a dinamica atual do sistema e podem ser modelados da seguinte forma:
x(t) = Ax(t) +
∫ 0
−hAd(θ)x(t+ θ)dθ, ∀t ≥ 0
x(t) = ϕ(t), ∀t ∈ [−h, 0]
(4.20)
Como visto em (4.20), valores antigos do estado influenciam a evolucao do sistema
por meio de uma soma contınua (integral). Esse tipo de sistema e comumente
encontrado em sistemas de foguetes, analise de epidemias, entre outras aplicacoes
[28].
52
De forma mais geral, um sistema linear invariante no tempo (Linear Time-Invariant
- LTI ) com atraso pode ser modelado da seguinte maneira:
x(t) =
q∑l=1
Dlx(t− ωl) +k∑i=0
(Aix(t− hi) +Biu(t− hi))
+r∑j=1
∫ t
t−τj(Gj(θ)x(θ) +Hj(θ)u(θ)) dθ (4.21)
y(t) =k∑i=0
Cix(t− hi) +r∑j=1
∫ t
t−τjNj(θ)x(θ)dθ (4.22)
Em (4.21), quando h0 = 0, A0 representa o ganho instantaneo de feedback. Ai(i >
0) representa o efeito dos atrasos discretos, enquanto a soma das integrais representa
o efeito dos atrasos distribuıdos. As matrizes Di correspondem a parte neutra do
sistema. Bi e Hj sao as matrizes de entrada. Em (4.22), y(t) ∈ R e a saıda do
sistema, com Ci representando a parte dos atrasos discretos e Nj representa a parte
dos atrasos distribuıdos.
Considerando sistemas como os da equacao (4.21), com relacao ao tipo de equacao
diferencial, eles podem ser divididos em dois tipos:
1. Equacoes diferenciais retardadas (Retarded Differential Equations - RDEs)
2. Equacoes diferenciais neutras (Neutral Type Differential Equations - NDEs)
A equacao (4.23) e um exemplo de uma RDE, enquanto (4.24) e um exemplo de
NDE.
x(t) = ax(t− h) + bx(t), x(t) ∈ R (4.23)
x(t) = ax(t− h) + bx(t), x(t) ∈ R (4.24)
De forma geral, RDEs sao representadas como na equacao (4.25) e NDEs sao
representadas como em (4.26). Como foi visto na figura 4.4, que ilustra o metodo
dos passos para uma RDE, existe um efeito suavizante na solucao do sistema. Este
53
efeito nao e mais verdadeiro nas NDEs, pois a derivada x(t) pode replicar qualquer
irregularidade da condicao inicial, o que torna difıcil de aplicar o metodo dos passos
a esse tipo de sistemas [25].
x(t) = f(t, xt, ut) (4.25)
x(t) = f(t, xt, xt, ut) (4.26)
Devido as dificuldades impostas pelas NDEs, esse trabalho vai lidar apenas com
RDEs. Alem disso, sistemas com atrasos distribuıdos sao mais difıceis de serem
analisados e controlados e, portanto, tambem nao serao abordados nesse trabalho.
54
Capıtulo 5
Estabilidade e Desigualdades
Matriciais Lineares
5.1 LMIs
Este capıtulo visa explicitar como a analise da estabilidade de TDSs e feita utili-
zando LMIs. Para isto, e necessario definir o que e uma LMI.
LMIs sao desigualdades matriciais que sao lineares em um conjunto de variaveis.
Estas variaveis podem ser um conjunto de vetores no espaco Rn, por exemplo.
Porem e muito comum ter matrizes como variaveis. Essencialmente, LMIs sao res-
tricoes (constraints) convexas. Portanto, problemas descritos por LMIs sao proble-
mas convexos de otimizacao. Esses problemas de otimizacao podem ser resolvidos
de forma eficiente, utilizando pacotes especializados na resolucao de LMIs, nor-
malmente conhecidos como programacao semidefinida (Semidefinite Programming -
SDP) [29, 30]. Detalhes de alguns dos Toolboxs utilizados para a resolucao de LMIs
se encontram no Apendice A.
Uma LMI tem a seguinte forma geral:
F (x) =m∑i=1
xiFi > 0 (5.1)
onde x ∈ Rn e a variavel e as matrizes simetricas Fi ∈ Rn×n sao conhecidas. A
inequacao (5.1) significa que F (x) e positiva definida, uTF (x)u > 0.
55
A inequacao (5.1) representa uma LMI estrita, porem tambem existem LMIs nao
estritas, que possuem a seguinte forma:
F (x) ≥ 0 (5.2)
Uma serie de problemas pode ser representado por LMIs: inequacoes lineares,
inequacoes lineares quadraticas e condicoes que surgem de problemas de controle,
como Lyapunov e inequacoes matriciais, sao alguns exemplos [12]. Considere a
inequacao de Lyapunov como um exemplo simples de LMI:
ATP + PA < 0
A matriz A ∈ Rn×n e conhecida e a matriz P = P T e a variavel.
Mesmo que varios problemas de controle possam ser expressos na forma de LMIs,
alguns desses problemas podem resultar em desigualdades matriciais nao lineares.
Existem alguns “truques” utilizados para transformar essas desigualdades nao line-
ares em formas permitidas para LMIs [29]. Alguns deles sao: mudanca de variaveis,
Procedimento-S e Complemento de Schur.
Nesse trabalho, o “truque” mais utilizado e baseado no Complemento de Schur.
Para entender melhor como o Complemento de Schur e utilizado para transformar
inequacoes em LMIs, considere a seguinte LMI e o conjunto de inequacoes:
Q(x) S(x)
S(x)T R(x)
> 0 (5.3)
R(x) > 0, Q(x)− S(x)R(x)−1ST > 0 (5.4)
Pelo Complemento de Schur, e facil perceber que o conjunto de inequacoes (5.4)
pode ser representado pela LMI (5.3).
Outro exemplo da utilizacao do Complemento de Schur para reescrever uma ine-
quacao como uma LMI e a equacao algebrica de Riccati:
56
ATP + PA+ PBR−1BTP +Q < 0 (5.5)
onde A, B, Q e R sao matrizes conhecidas de tamanho apropriado, sendo Q e
R matrizes positivas definidas, e P = P T e a variavel. A inequacao (5.5) pode ser
expressa pela seguinte LMI:
−ATP − PA−Q PB
BTP R
> 0 (5.6)
Essa transformacao e feita utilizando o conceito do Complemento de Schur. Cha-
mando −ATP − PA − Q de A, PB de B e R de C, e possıvel utilizar o resultado
obtido no Capıtulo 2, Definicao 2.1. Para que a matriz da LMI (5.6) seja maior que
0 e necessario que:
C > 0, A− BC−1BT > 0
Expandindo o termo A− BC−1BT > 0:
−ATP − PA−Q− PBR−1BTP > 0
Multiplicando por −1:
ATP + PA+Q+ PBR−1BTP < 0 (5.7)
A inequacao (5.7) e igual a (5.5) e prova que e possıvel expressar (5.5) pela LMI
(5.6). Alem disso, ao representar a inequacao (5.5) como uma LMI, fica claro que a
inequacao e convexa, o que nao e obvio a primeira vista.
Existem tres problemas mais comuns envolvendo LMIs, sao eles: o problema da
admissibilidade, o problema do autovalor e o problema do autovalor generalizado.
57
O problema da admissibilidade corresponde a, dada uma LMI F (x) > 0, encon-
trar xfeas tal que que F (xfeas) > 0 ou determinar que a LMI nao possui solucao
admissıvel. Esse problema e um problema de admissibilidade convexa. Um exemplo
de um problema de admissibilidade e o problema de estabilidade de Lyapunov para
varias matrizes. Dadas as matrizes Ai ∈ Rn×n, i = 1, . . . , L, e necessario encontrar
um matriz P que satisfaca a LMI:
P > 0, ATi P + PAi < 0, i = 1, . . . , L
Ou determinar que nao existe nenhuma matriz P que satisfaca essa LMI.
O problema do autovalor tem como objetivo minimizar o autovalor maximo de
uma matriz que depende diretamente de uma variavel, sujeito a uma restricao dada
por uma LMI (ou determinar que essa restricao nao possui solucao). Um exemplo
e:
minizar λ
sujeito a λI − A(x) > 0, B(x) > 0
Onde A e B sao matrizes simetricas que dependem diretamente da otimizacao da
variavel x. Esse tipo de problema e um problema de otimizacao convexa.
Esse tipo de problema tambem pode aparecer na forma equivalente de mini-
mizacao de uma funcao linear sujeita a uma LMI, por exemplo:
minizar cTx
sujeito a F (x) > 0
Onde F e uma funcao que depende diretamente de x. No caso especial onde
as matrizes Fi sao todas diagonais o problema e reduzido a um problema de pro-
gramacao linear: minimizar a funcao linear cTx sujeita a um conjunto de inequacoes
lineares em x.
58
Para ficar mais claro o que e um problema do autovalor, considere o problema um
pouco mais complexo:
minizar γ
sujeito a
−ATP − PA− CTC PB
BTP γI
> 0, P > 0
As matrizes A ∈ Rn×n, B ∈ Rn×p e C ∈ Rm×n sao conhecidas e P e γ sao as
variaveis a serem otimizadas.
Por fim, o problema do autovalor generalizado tem como objetivo minimizar o
maximo autovalor generalizado de um par de matrizes que dependem diretamente
de uma variavel, sujeito a restricao dada por uma LMI. Esse problema tem a seguinte
forma geral:
minizar λ
sujeito a λB(x)− A(x) > 0, B(x) > 0, C(x) > 0
Onde A,B e C sao matrizes simetricas que sao funcoes de x. Esse problema pode
ser expresso como:
minizar λmax(A(x), B(x))
sujeito a B(x) > 0, C(x) > 0
Onde λmax(A(x), B(x)) denota o maior autovalor generalizado de λB(x)−A(x) >
0 com B(x) > 0. Esse tipo de problema e um problema de otimizacao quase convexo
uma vez que a restricao e convexa, porem o objetivo, λmax(A(x), B(x)), e quase
convexo.
Um exemplo de um problema do autovalor generalizado e:
59
minizar α
sujeito a − ATP − PA− 2αP > 0, P > 0
Onde a matriz A e conhecida e as variaveis a serem otimizadas sao a matriz
simetrica P e o escalar α.
Esses tres tipos de problemas podem ser resolvidos em tempo polinomial e po-
dem ser resolvidos na pratica de forma eficiente. Resolver esses problemas significa
determinar se o problema possui ou nao solucao admissıvel e, caso possua, calcular
um ponto que respeite o objetivo a ser atingido dentro de uma acuracia pre definida
[12].
5.2 Estabilidade de TDSs
O conceito de estabilidade foi definido no Capıtulo 2 para sistemas que nao pos-
suem atraso e apesar de nao ser muito diferente para sistemas com atraso, e impor-
tante definir o conceito para TDSs.
Considere o seguinte TDS:
x = f(t, xt), t ≥ t0
x(t0 + s) = ϕ(s), s ∈ [−h, 0] (5.8)
onde h > 0 representa o atraso e ϕ(s) e a funcao que representa a condicao inicial.
O estado do sistema, denotado por xt, e definido por:
xt(θ) = x(t+ θ), θ ∈ [−h, 0]
Assume-se que o sistema (5.8) admite a solucao x(t) = 0, ou seja, f(t, 0) = 0, que
e normalmente referida como solucao trivial.
60
Definicao 5.1 Considere φ, entao a norma uniforme de φ e definida como
||φ||C = maxs∈[a,b]
|φ(s)| (5.9)
Definicao 5.2 Considere o sistema com atraso (5.8). A solucao trivial e dita
� estavel no sentido de Lyapunov se para qualquer t0 ≥ 0 e qualquer ε > 0,
existe δ = δ(t0, ε) > 0 tal que
‖xt0‖C ≤ δ ⇒ |x(t)| ≤ ε (5.10)
para todo t ≥ t0.
� atrativa se para qualquer t0 ≥ 0 e qualquer ε > 0, existe δ = δ(t0, ε) > 0 com
a propriedade
‖xt0‖C ≤ δa ⇒ limt→∞|x(t)| = 0 (5.11)
� assintoticamente estavel se e estavel e atrativa.
� uniformemente estavel se e estavel e δ = δ(t0, ε) nao depende de t0.
� exponencialmente estavel se existe δ, α > 0 e β ≥ 1 tal que
‖xt0‖C ≤ δ ⇒ |x(t)| ≤ βe−αt |x0| (5.12)
para todo t ≥ 0.
� instavel se nao e estavel no sentido de Lyapunov
Assim como em sistemas sem atraso, um metodo eficiente para analise da estabi-
lidade de TDSs e o metodo direto de Lyapunov. Os dois metodos mais comuns para
TDSs sao: Lyapunov-Krasovskii e Lyapunov-Razumikhin. Na literatura, boa parte
das estrategias de controle por modos deslizantes propostas para controlar TDSs
fazem uso da teoria de Lyapunov-Krasovskii, como, por exemplo, nos seguintes tra-
balhos [13, 31, 32, 5, 4, 7]. Dessa forma, esse trabalho ira se aprofundar apenas
no metodo de Lyapunov-Krasovskii. Mais detalhes sobre o metodo de Lyapunov-
Razumikhin podem ser encontrados em [2].
61
5.3 Lyapunov-Krasovskii
Considere a seguinte RDE:
x(t) = f(t, xt), t ≥ t0 (5.13)
Assuma que (5.13) possua a solucao trivial x(t) = 0 e que possua a condicao
inicial x(θ) = ϕ(θ), θ ∈ [−h, 0].
Considerando V (x) um funcional contınuo e possıvel definir o seguinte teorema:
Teorema 5.1 Supondo f(t, xt) e que u(s), v(s), w(s) sao funcoes contınuas e nao
decrescentes, ou seja, u(s) e v(s) sao positivas para s > 0, e u(0) = v(0) = 0. A
solucao trivial de (5.13) e estavel se existe um funcional contınuo V , que e positivo
definido
u(|ϕ(0)|) ≤ V (t, ϕ) ≤ v(||ϕ||C) (5.14)
tal que sua derivada ao longo da trajetoria (5.13) e nao positiva
V (t, ϕ) ≤ −w(|ϕ(0)|) (5.15)
Se w(s) > 0 para s > 0, entao a solucao trivial e assintoticamente estavel. Se, alem
disso, lims→∞ u(s) =∞, a solucao trivial e globalmente assintoticamente estavel.
Prova: ver [2].
5.3.1 Condicoes para estabilidade de TDSs
Como foi citado no capıtulo anterior, ao realizar a analise de sistemas com atraso
utilizando o metodo direto de Lyapunov, e possıvel obter condicoes que dependem
do atraso ou condicoes que nao dependem do atraso. Naturalmente isso significa
que a estabilidade do sistema pode depender ou nao do atraso [33, 1]. Apesar de
representarem de forma um pouco mais realista os sistemas de controle praticos, as
condicoes dependentes do atraso possuem formulacao matematica mais complexa e,
como fogem do escopo desse trabalho, nao serao abordadas. Informacoes detalhadas
dessas condicoes podem ser encontradas em [33, 2].
62
Aqui sera explorado apenas o caso de condicoes independentes. Para isso, consi-
dere a seguinte RDE linear:
x = Ax(t) + A1x(t− τ(t)), t ≥ t0 (5.16)
onde x(t) ∈ Rn, com um atraso variante no tempo τ(t) ∈ [0, h]. A e A1 sao
matrizes constantes n× n.
Para a analise da estabilidade de (5.16) com atraso constante τ = h, uma forma
geral para o funcional de Lyapunov-Krasovskii e:
V (xt) = xT (t)Px(t) + 2xT (t)
∫ 0
−hQ(ξ)x(t+ ξ)dξ
+
∫ 0
−h
∫ 0
−hxT (t+ s)R(s, ξ)x(t+ ξ)dsdξ (5.17)
Esse funcional de Lyapunov-Krasovskii leva a problemas complicados e e comu-
mente substituıdo por uma versao mais simples:
V (t, xt) = xTPx+
∫ t
t−τ(t)
xT (s)Qx(s)ds (5.18)
P e Q sao matrizes positivas definidas n×n. Em (5.18) V depende do tempo por
conta do termo τ(t). No caso onde o atraso e constante τ = h, o funcional (5.18) nao
dependera mais do tempo. Para o caso onde o atraso e de fato variante no tempo,
assume-se que τ ≤ d < 1, que representa os atrasos que variam lentamente com o
tempo. O funcional acima satisfaz a condicao (5.14) do Teorema 5.1 e derivando V
ao longo das trajetorias de (5.16), obtem-se:
V (t, xt) = xT (t)Px(t) + xT (t)Px(t) + xT (t)Qx(t)− (1− τ)xT (t− τ)Qx(t− τ)
Substituindo x(t) da equacao (5.16):
63
V (t, xt) ≤ xT (t)(ATP + PA+Q)x(t) + xT (t)PA1x(t− τ)
+ xT (t− τ)AT1 Px(t)− (1− d)xT (t− τ)Qx(t− τ)
V (t, xt) =[xT (t) xT (t− τ)
]W
x(t)
x(t− τ)
≤ α |x(t)|2
para algum α > 0 se
W =
ATP + PA+Q PA1
AT1 P −(1− d)Q
< 0 (5.19)
A LMI (5.19) nao depende do atraso h e e dessa forma independente do atraso,
apesar de depender da derivada do atraso. Pelo Teorema 5.1, a viabilidade da LMI
(5.19) e uma condicao suficiente para a estabilidade assintotica uniforme de sistemas
com atrasos que variam lentamente no tempo. Esse resultado pode ser resumido da
seguinte maneira:
� O sistema (5.16) e assintoticamente uniformemente estavel para qualquer atraso
τ(t) com τ ≤ d < 1 se existem as matrizes positivas definidas P e Q tal que a
LMI (5.19) possui solucao.
64
Capıtulo 6
SMC aplicado a Sistemas com
Atraso
Esse capıtulo tem como objetivo apresentar a tecnica de controle desenvolvida
para controlar sistemas com atraso, baseada no artigo [4]. Essa tecnica utiliza o
conceito de controle por modos deslizantes (SMC), mais especificamente o controle
por modos deslizantes integral (ISMC). Sao controlados sistemas incertos com atra-
sos na sua propria dinamica e na entrada, incertezas parametricas descasadas e
perturbacoes externas. A estabilidade global do sistema em malha fechada e garan-
tida utilizando a teoria de estabilidade de Lyapunov e o conceito de LMIs. Alem
disso, e atingida uma norma H∞ limitada da atenuacao da perturbacao existente no
sistema. O metodo proposto tem como principais vantagens:
� a ordem da equacao do movimento durante o deslizamento e igual a ordem do
sistema original;
� a robustez do sistema e garantida durante toda a reposta do sistema, desde o
tempo inicial;
� a estabilidade assintotica e garantida sem a necessidade do uso de preditores
de estado.
Uma desvantagem que esse metodo possui e a necessidade de se saber perfeita-
mente a informacao de algumas matrizes do sistema, o que nem sempre e facil de se
obter em sistemas praticos.
65
Notacao: Durante esse capıtulo, x(t) sera chamado de estado para seguir a
convencao encontrada na literatura, porem a definicao formal de estado para um
sistema com atraso e a encontrada no Capıtulo 4. As entradas indicadas por ∗
representam entradas simetricas na matriz.
6.1 Formulacao do Problema
Considere o seguinte TDS incerto:
x(t) = (A+ ∆A(t))x(t) + Adx(t− h) +Bu(t) +Bdu(t− h) +B1w(t)
y(t) = Cx(t)
x(t) = 0, u(t) = 0 t < 0; x(0) = x0, u(0) = u0 (6.1)
Em (6.1), x(t) ∈ Rn e o estado, u(t) ∈ Rm e a entrada de controle, w(t) ∈ Rl
e a perturbacao externa, que possui ‖w(t)‖ ≤ δw, y(t) ∈ Rp e a saıda do sinal
controlado, A,Ad, B e Bd sao matrizes conhecidas de dimensoes apropriadas e h > 0
e o atraso no tempo, constante e conhecido. A incerteza parametrica ∆A(t) nao e
conhecida e e variante com o tempo, alem disso, assume-se que ela e limitada em
norma e possui a seguinte forma:
∆A(t) = D1F (t)E1 (6.2)
Onde D1 e E1 sao matrizes conhecidas de dimensoes apropriadas, que representa
a estrutura da incerteza, e F (t) e uma matriz desconhecida satisfazendo:
F T (t)F (t) ≤ I (6.3)
O objetivo, entao, e desenvolver um controlador por modo deslizante robusto que
estabilize a classe de sistemas incertos com atrasos na sua propria dinamica e na
entrada. Alem disso, o controlador deve assegurar que os efeitos da perturbacao
na saıda do sistema sejam atenuados. A norma da saıda, passa a ser limitada pela
norma da perturbacao conforme a definicao a seguir:
66
Definicao 6.1 Sujeita a condicoes iniciais nulas, x(t) = 0, t < 0, a saıda do sinal
controlado y(t) e dita ser ‖Tyw‖ ≤ γ, γ > 0, caso satisfaca ‖y(t)‖2 < γ ‖w(t)‖2 para
qualquer perturbacao nao nula w(t).
6.2 Projeto da superfıcie de deslizamento
O primeiro passo para realizar o projeto de um controlador baseado no SMC e
especificar a superfıcie de deslizamento. Nesse trabalho, sera utilizada uma superfıcie
de deslizamento integral, baseada nos conceitos citados no Capıtulo 3:
s(t) = Gx(t) + z(t)
s(t) = Gx(t) +Gx(0)−G∫ t
0
[(A+BK)x(τ) + Adx(t− τ) +Bdu(t− τ)] dτ︸ ︷︷ ︸z(t)
(6.4)
Onde a matriz G ∈ Rm×n e escolhida de forma que GB seja nao singular e
K ∈ Rm×n e projetado tal que o sistema (6.1) seja assintoticamente estavel durante
o deslizamento.
A seguir, sao derivadas as condicoes para avaliar a estabilidade e robustez do TDS
incerto (6.1) restrito a superfıcie de deslizamento s(t) = 0. Essas condicoes estao
sujeitas a existencia de matrizes positivas definidas apropriadas.
Teorema 6.1 O TDS incerto (6.1) com w(t) = 0 e assintoticamente estavel no
modo deslizante se a superfıcie de deslizamento integral (6.4) e usada, e existem
matrizes positivas definidas R1 ∈ Rn×n, R2 ∈ Rm×m e P ∈ Rn×n para qualquer
matriz incerta F (t) admissıvel tal que a seguinte inequacao e satisfeita
Ξ = Π1 + Π2R−11 ΠT
2 + PBdR−12 BT
d P < 0 (6.5)
onde
67
Π1 = P (A+DaF (t)Ea +BK) + (A+DaF (t)Ea +BK)TP +R1 +KTR2K
Π2 = P (Ad +DdF (t− h)Ed)
Da = [I −B(GB)−1G]D1
Dd = −Bd(GB)−1GD1
Ea = Ed = E1
Prova: ver [4].
Teorema 6.2 Considere o TDS incerto (6.1) com superfıcie de deslizamento inte-
gral definida pela funcao (6.4). Se existe uma constante γ > 0 e matrizes positivas
definidas R1 ∈ Rn×n, R2 ∈ Rm×m e P ∈ Rn×n tais que para qualquer matriz incerta
F (t) admissıvel a seguinte inequacao e satisfeita
T = Π1 + Π2R−11 ΠT
2 + PBdR−12 BT
d P + CTC + γ−2PB1BT1 P < 0 (6.6)
onde Π1 e Π2 sao definidas em (6.5). Entao, durante o deslizamento, o sistema
(6.1) e assintoticamente estavel e ‖Tyw‖ ≤ γ.
Prova: ver [4].
O proximo teorema visa formular o Teorema 6.2 na forma de LMI, alem de definir
o valor do ganho K.
Teorema 6.3 O TDS incerto (6.1) com superfıcie de deslizamento integral dada por
(6.4) e assintoticamente estavel durante o deslizamento e ‖Tyw‖ ≤ γ se existe uma
constante γ > 0, uma constante positiva ε > 0, uma matriz W ∈ Rm×n e matrizes
positivas definidas M1 ∈ Rn×n, M2 ∈ Rm×m e X ∈ Rn×n tais que a seguinte LMI e
satisfeita
68
Λ AdM1 BdM2 X W T XETa 0 XCT
∗ −M1 0 0 0 0 M1ETd 0
∗ ∗ −M2 0 0 0 0 0
∗ ∗ ∗ −M1 0 0 0 0
∗ ∗ ∗ ∗ −M2 0 0 0
∗ ∗ ∗ ∗ ∗ −εI 0 0
∗ ∗ ∗ ∗ ∗ ∗ −εI 0
∗ ∗ ∗ ∗ ∗ ∗ ∗ −I
< 0 (6.7)
onde Λ = AX+XAT +BW +W TBT +εDaDTa +εDdD
Td +γ−2B1B
T1 . Alem disso,
a matriz de ganho K e dada por
K = WX−1 (6.8)
Prova: ver [4].
E importante dizer que nesse trabalho sera considerado apenas os casos onde o
atraso e constante, porem a estrategia escolhida tambem pode ser expandida para
lidar com sistemas que possuem atraso variavel, desde que h(t) ≤ ρh < 1 [4].
6.3 Projeto do controlador
O proximo passo apos o desenvolvimento da superfıcie de deslizamento e o de-
senvolvimento de uma lei de controle apropriada que satisfaca a condicao de al-
cancabilidade-η, ss ≤ −η|s|. Essa condicao garante que que a lei de controle levara
o sistema ate a superfıcie de deslizamento e o mantem nela uma vez que foi al-
cancada. A escolha da lei de controle se baseia na lei apresentada para o ISMC no
Capıtulo 3:
u(t) = uo(t) + un(t) (6.9)
69
Nesse caso, o ganho de feedback, uo(t), e usado para confirmar a performance do
SMC e e escolhido como uo(t) = Kx(t), com a matriz K dada por (6.8). O termo
nao linear, un(t), e utilizado para induzir o modo deslizante e vencer o efeito de
qualquer perturbacao externa ou variacao de parametro do sistema (6.1), possui a
seguinte forma:
un(t) = −(GB)−1ρ(t, x)s(t)
‖s(t)‖(6.10)
Dessa forma, a equacao (6.9) pode ser reescrita como:
u(t) = Kx(t)− (GB)−1ρ(t, x)s(t)
‖s(t)‖(6.11)
Como foi indicado no Capıtulo 3, uma boa escolha para a matriz G e:
G = B+ =(BTB
)−1BT (6.12)
Essa escolha de G com a pseudo inversa de B traz como principal vantagem a nao
amplificacao de incertezas descasadas. Alem disso, ela leva a seguinte propriedade:
GB =(BTB
)−1BT︸ ︷︷ ︸
G
B = Im
O termo ρ(t, x) e encontrado provando que o controlador (6.11) satisfaz a condicao
de alcancabilidade-η. Assim:
s(t) = Gx(t)−G(A+BK)x(t)−GAdx(t− h)−GBdu(t− h)
= G∆A(t)x(t) +GBu(t) +GB1w(t)−GBKx(t) (6.13)
Para encontrar a condicao de alcancabilidade-η e necessario fazer sT (t)s(t), por-
tanto, multiplicando (6.13) por sT (t), utilizando a equacao (6.11) para u(t) e os
fatos GB = I e sT (t)s(t) = ‖s(t)‖2, obtem-se:
70
sT (t)s(t) = sT (t)(G∆A(t)x(t) +GBu(t) +GB1w(t)−GBKx(t))
= sT (t)G∆A(t)x(t)− ρ(t, x) ‖s(t)‖2 + sT (t)GB1w(t)
≤ ‖s(t)‖ (−ρ(t, x) + ‖G∆A(t)x(t)‖+ ‖GB1w(t)‖) (6.14)
O valor da modulacao ρ(t, x) deve ser maior que qualquer perturbacao ou incerteza
do sistema, portanto, ρ(t, x) deve satisfazer:
ρ(t, x) ≥ ‖G‖ ‖D1‖ ‖E1‖ ‖x(t)‖+ ‖GB1‖ δw + η (6.15)
Para obter (6.15) foram utilizadas as equacoes (6.2) e (6.3) e o fato de que ‖w(t)‖ ≤
δw. Dessa forma, com essa escolha para ρ(t, x) e possıvel escrever (6.14) como:
sT (t)s(t) ≤ −η ‖s(t)‖ (6.16)
Onde η > 0 e um parametro escolhido durante o projeto. Com o resultado (6.16),
prova-se que a condicao de alcancabilidade-η e satisfeita e o termo de controle e
dado por (6.11) com ρ(t, x):
ρ(t, x) = ‖G‖ ‖D1‖ ‖E1‖ ‖x(t)‖+ ‖GB1‖ δw + η (6.17)
Com a escolha da lei de controle (6.11) e com as matrizes satisfazendo a LMI (6.7)
e garantido que o TDS incerto (6.1) e assintoticamente estavel.
Por fim, um ultimo ajuste deve ser feito na lei de controle para evitar o efeito do
chattering causado pelo termo s(t)‖s(t)‖ . Utilizando o uso do conceito de boundary layer
citado no Capıtulo 3, substitui-se s(t)‖s(t)‖ por uma funcao de saturacao. Dessa forma,
a lei de controle (6.11) e reescrita como:
u(t) = Kx(t)− (GB)−1ρ(t, x) sat
(s(t)
δ
)(6.18)
Onde δ e a medida da espessura da camada de fronteira (boundary layer).
71
6.4 Exemplo Ilustrativo
Essa secao visa ilustrar e mostrar a viabilidade da estrategia desenvolvida por
meio de um exemplo numerico. Considere um TDS incerto descrito por (6.1) com:
A =
−1 0
0.2 0.3
, Ad =
0.01 −0.04
0.02 0
, B =
2
1
,
Bd =
1
0
, h = 0.8
Para ilustrar a utilizacao do esquema proposto, sao escolhidas tambem as matrizes
da incerteza parametrica, da perturbacao externa e do sinal controlado na saıda:
D1 =
0.1
0.1
, F (t) = sen(t), E1 =[0 1
], B1 =
0
0.1
,
w(t) = sen(t)e−t, C =[1 0
]De acordo com (6.12), G e escolhido de forma que GB = I e escolhe-se γ = 0.5.
Com esses dados, basta resolver a LMI (6.7). A referencia [4] utiliza o LMI Toolbox
para encontrar a solucao da LMI. Por dificuldades de implementacao encontradas
com esse Toolbox, sera utilizada a ferramenta Yalmip, uma vez que a definicao e
resolucao da LMI e mais intuitiva por meio dela e os resultados obtidos nao afetam
o desempenho final do sistema. As solucoes obtidas para ε, W , M1, M2 e X sao:
1 epsilon = 1.4484
2
3
4 M1 = 1.4184 -0.0660
5 -0.0660 0.7131
6
7
8 M2 = 0.5100
9
10
72
11 W = -0.1719 -0.1469
12
13
14 X = 0.6856 0.0112
15 0.0112 0.0642
16
17 % K = WXˆ-1
18 K = -0.2139 -2.2499
Com os valores obtidos, a lei de controle (6.18) fica:
u(t) =[−0.2139 −2.2499
]x(t)− (‖G‖ ‖D1‖ ‖E1‖ ‖x(t)‖+ ‖GB1‖+ 1) sat
(s(t)
0.1
)Onde foram escolhidos η = 1, δ = 0.1 e δw = 1. Para δw foi escolhido esse valor,
pois essa modulacao precisa vencer o valor da perturbacao externa w(t), que possui
valor maximo igual a 1. Para δ, quanto mais proximo de 0, mais perto do termo
s(t)‖s(t)‖ fica a aproximacao feita pela saturacao, portanto 0.1 e um valor razoavel.
As figuras a seguir ilustram o resultado da simulacao do sistema, com uma
condicao inicial x(0) =[−1 2
]T. A figura 6.1 mostra as trajetorias do sistema,
confirmando a estabilidade assintotica do sistema em malha fechada. A figura 6.2
mostra a entrada de controle e pode ser visto que o fenomeno do chattering e eli-
minado. A figura 6.3 mostra a superfıcie de deslizamento e fica claro que, com as
escolhas apropriadas dos termos, a fase de aproximacao e eliminada e o sistema entra
em modo deslizante desde o primeiro instante.
73
Figura 6.1: Trajetorias do sistema do exemplo considerado.
Figura 6.2: Sinal de controle do exemplo considerado.
Figura 6.3: Superfıcie de deslizamento do exemplo considerado.
74
Em comparacao com o artigo [4], as mudancas feitas no projeto da superfıcie de
deslizamento e na matriz G fazem com que o sistema obtenha o comportamento
esperado, uma vez que a tecnica se baseia no ISMC. Dessa forma, ao inves do
sistema possuir uma fase de aproximacao como e visto em [4], a fase de aproximacao
e eliminada e o sistema desliza desde o inıcio da resposta em malha fechada.
Para ilustrar isso foi feita a simulacao novamente, porem trocando apenas o valor
de G e a forma que superfıcie de deslizamento foi projetada, seguindo o proposto
em [4]. Como esperado, a superfıcie de deslizamento passa a possuir a fase de
aproximacao.
Figura 6.4: Superfıcie de deslizamento projetada como em [4].
Dessa forma, fica claro que as mudancas realizadas no projeto melhoram o de-
sempenho do sistema, fazendo com que ele entre em deslizamento durante toda a
resposta em malha fechada.
Diante dos resultados apresentados, fica claro que estrategia de controle proposta
possui boa performance e robustez contra atrasos na sua propria dinamica e na
entrada, incertezas parametricas descasadas e perturbacoes externas.
75
Capıtulo 7
Conclusao
Esse trabalho apresentou uma tecnica de controle robusto capaz de controlar
sistemas incertos com atraso. Para isso, primeiramente foi apresentado um estudo
sobre os conceitos matematicos mais importantes que permeiam todo o texto.
A partir desse ponto, foi apresentado um estudo sobre o controle por modos desli-
zantes, verificando suas principais propriedades, vantagens e dificuldades de imple-
mentacao. Dentro desse contexto, foi dada enfase ao estudo do controle por modos
deslizantes integral (Integral Sliding Mode Control - ISMC ), devido as suas vanta-
gens apresentadas em comparacao com controle por modos deslizantes convencional.
Duas de suas vantagens mais importantes sao a eliminacao da fase de aproximacao e
a capacidade de lidar com incertezas descasadas, desde que sejam seguidas algumas
regras para escolha dos parametros do sistema.
O trabalho entao apresentou com mais detalhes a classe de sistemas considerada.
O estudo sobre sistemas com atraso mostrou a dificuldade matematica que a in-
clusao do atraso traz para a analise do sistema. Dessa forma, foi delimitado que os
sistemas a serem controlados seriam sistemas com atrasos discretos, que possuem
sua formulacao matematica na forma de equacoes diferenciais retardadas. A seguir,
foi apresentado o conceito de desigualdade matriciais lineares (Linear Matrix Ine-
qualities - LMI ) e estabilidade para sistemas com atraso. Foi demonstrado que,
utilizando a Teoria de Lyapunov, a estabilidade de um TDS pode ser analisada por
meio de uma LMI.
76
Tendo como motivacao o fato de que muitos sistemas praticos sao incertos, foi
proposto um esquema de controle baseado no ISMC para controlar sistemas incer-
tos e que possuem atraso. Foi considerado o caso mais geral onde o sistema pode
possuir atraso na entrada e no estado. Alem disso, como a lei de controle utili-
zou os conceitos do ISMC, a estrategia desenvolvida foi capaz de nao amplificar os
efeitos das incertezas descasadas. Esta estrategia possui desempenho satisfatorio,
garantindo a estabilidade assintotica do sistema em malha fechada. As condicoes
necessarias para estabilidade do sistema foram encontradas por meio de uma LMI.
O trabalho tem como contribuicoes o uso de LMIs para analise da estabilidade do
sistema e o uso do ISMC para o projeto do controlador. Como trabalhos futuros,
pode-se estudar se e possıvel de fato utilizar o esquema proposto para sistemas com
atraso variavel. Alem disso, pode-se estudar a possibilidade do desenvolvimento de
alguma algoritmo de controle para sistemas discretos com atraso. Uma outra possi-
bilidade e estudar o controle de sistemas a dados amostrados como sendo equivalente
a um sistema contınuo com atraso variavel.
77
Referencias Bibliograficas
[1] FRIDMAN, E., “Tutorial on Lyapunov-based methods for time-delay systems”,
European Journal of Control, v. 20, n. 6, pp. 271 – 283, 2014.
[2] FRIDMAN, E., Introduction to Time-Delay Systems: Analysis and Control,
Systems & Control: Foundations & Applications. Springer International Pu-
blishing, 2014.
[3] SLOTINE, J., LI, W., Applied Nonlinear Control. Prentice Hall, 1991.
[4] PAI, M.-C., “Sliding Mode Control of Vibration in Uncertain Time-delay Sys-
tems”, Journal of Vibration and Control, v. 16, pp. 2131–2145, 2010.
[5] ZHANG, X., “Integral sliding mode control for uncertain systems with input
delay based on singular perturbation approach”. In: Proceeding of the 11th
World Congress on Intelligent Control and Automation, pp. 4657–4662, 2014.
[6] RICHARD, J.-P., GOUAISBAUT, F., PERRUQUETTI, W., “Sliding Mode
Control in the Presence of Delay”, Kybernetika, v. 3, pp. 277–294, 2001.
[7] PAI, M.-C., “Chaotic sliding mode controllers for uncertain time-delay chao-
tic systems with input nonlinearity”, Applied Mathematics and Computation,
v. 271, pp. 757 – 767, 2015.
[8] HUNG, J. Y., GAO, W., HUNG, J. C., “Variable Structure Control: A Survey”,
IEEE Transactions on Industrial Eletronics, v. 40, pp. 2–22, 1993.
[9] NUNES, E. V. L., Controle por modos deslizantes de ordem superior com es-
tabilidade global. M.Sc. dissertation, Universidade Federal do Rio de Janeiro,
Maio 2004.
78
[10] UTKIN, V. I., “Variable structure systems with sliding modes”, IEEE Tran-
sactions on Automatic Control, v. 22, pp. 212–222, 1977.
[11] UTKIN, V. I., Sliding Modes and Their Application in Variable Structure Sys-
tems. MIR, 1978.
[12] BOYD, S., EL GHAOUI, L., FERON, E., et al., Linear Matrix Inequalities in
System and Control Theory. Society for Industrial and Applied Mathematics,
1994.
[13] FRIDMAN, E., HAN, X., SPURGEON, S., “A Singular Perturbation Approach
to Sliding Mode Control in the Presence of Input Delay”, IFAC Proceedings
Volumes, v. 43, pp. 1272 – 1277, 2010.
[14] STRANG, G., Linear algebra and its applications. 4 ed. Thomson, Brooks/Cole,
2006.
[15] GALLIER, J., “http://www.cis.upenn.edu/∼jean/schur-comp.pdf”, 2010,
(Acesso em 21 Junho 2018).
[16] FRIDMAN, E., “New Lyapunov-Krasovskii functionals for stability of linear
retarded and neutral type systems”, Systems & Control Letters, v. 43, n. 4,
pp. 309 – 319, 2001.
[17] EDWARDS, C., SPURGEON, S., Sliding mode control: theory and applications,
Series in Systems and Control. Taylor & Francis, 1988.
[18] SHTESSEL, Y., EDWARDS, C., FRIDMAN, L., et al., Sliding Mode Control
and Observation. Springer Science New York, 2014.
[19] LEE, H., UTKIN, V. I., “Chattering suppression methods in sliding mode con-
trol systems”, Annual Reviews in Control, v. 31, pp. 179 – 188, 2007.
[20] FILIPPOV, A. F., “Differential Equations with Discontinuous Right-Hand
Side”, Translations. Series 2. American Mathematical Society., v. 42, n. 2,
pp. 199 – 231, 1964.
[21] FILIPPOV, A. F., Differential Equations with Discontinuous Righthand Side.
Kluwer Academic Publishers, 1988.
79
[22] HAMAYUN, M. T., EDWARDS, C., ALWI, H., Fault Tolerant Control Schemes
Using Integral Sliding Modes, Studies in Systems, Decision and Control 61. 1
ed. Springer International Publishing, 2016.
[23] UTKIN, V. I., “Sliding mode control design principles and applications to elec-
tric drives”, IEEE Transactions on Industrial Electronics, v. 40, pp. 23–36,
1993.
[24] UTKIN, V. I., LEE, H., “Chattering Problem in Sliding Mode Control Sys-
tems”. In: International Workshop on Variable Structure Systems, 2006.
VSS’06., pp. 346–350, 2006.
[25] RICHARD, J.-P., “Time-delay systems: an overview of some recent advances
and open problems”, Automatica, v. 39, n. 10, pp. 1667 – 1694, 2003.
[26] MIRKIN, L., “Introduction to Time-Delay Systems”, 2012.
[27] SEURET, A., GOUAISBAUT, F., BAUDOUIN, L., D1.1 -Overview of Lyapu-
nov methods for time-delay systems, Research report, LAAS-CNRS, 2016.
[28] BRIAT, C., Linear Parameter-Varying and Time-Delay Systems: Analysis, Ob-
servation, Filtering & Control, chapter Introduction to Time-Delay Systems,
Berlin, Heidelberg, Springer Berlin Heidelberg, pp. 123–164, 2015.
[29] ZHANG, J., SWAIN, A. K., NGUANG, S., Robust Observer-Based Fault Di-
agnosis for Nonlinear Systems Using MATLAB®. Springer International Pu-
blishing, 2016.
[30] GAHINET, P., NEMIROVSKIAND, A., LAUB, A., et al., LMI control toolbox
user’s guide. The MathWorks, Inc., 1995.
[31] HAN, X., FRIDMAN, E., SPURGEON, S., “Sliding mode control in the pre-
sence of input delay: A singular perturbation approach”, Automatica, v. 48,
n. 8, pp. 1904 – 1912, 2012.
[32] XIA, Y., YANG, H., FU, M., et al., “Sliding Mode Control for Linear Systems
with Time-Varying Input and State Delays”, Circuits, Systems, and Signal
Processing, v. 30, n. 3, pp. 629 – 641, 2011.
80
[33] BRIAT, C., Linear Parameter-Varying and Time-Delay Systems: Analysis, Ob-
servation, Filtering & Control, chapter Stability Analysis of Time-Delay Sys-
tems, Berlin, Heidelberg, Springer Berlin Heidelberg, pp. 165–242, 2015.
[34] GRANT, M. C., BOYD, S. P., The CVX Users Guide Release 2.1. CVX Rese-
arch, Inc., 2017.
[35] LOFBERG, J., “YALMIP : a toolbox for modeling and optimization in MA-
TLAB”. In: 2004 IEEE International Conference on Robotics and Automation
(IEEE Cat. No.04CH37508), pp. 284–289, 2004.
81
Apendice A
Toolboxs para resolucao de LMIs
Este trabalho faz uso do Matlab para a resolucao de LMIs. As tres ferramentas
mais comuns para resolucao de LMIs no Matlab sao: Yalmip, CVX e LMI Control
Toolbox. As duas primeiras sao mais recentes e podem ser instaladas de graca no
Matlab, a ultima e incluıda na instalacao do Matlab.
As duas ferramentas mais recentes, Yalmip e CVX, sao na verdade linguagens de
modelagem que somam-se ao Matlab para tornar possıvel a resolucao de problemas
convexos, como e o caso das LMIs [34, 35]. Ja o LMI Control Toolbox implementa
ferramentas para analise e projeto de sistemas robustos baseando-se no conceito de
LMI. Alem disso, oferece um ambiente para especificar e resolver LMIs, o LMI Lab
[30].
A resolucao de fato de alguma LMI em qualquer uma das tres ferramentas so e
capaz de ser realizada utilizando algum solver. O LMI Control Toolbox traz consigo
tres solvers diferentes que sao capazes de resolver os tres problemas mais comuns
envolvendo LMIs: o problema da admissibilidade, o problema do autovalor e o
problema do autovalor generalizado, explicados com mais detalhes no Capitulo 5 [30].
No caso das linguagens de modelagem, os solvers nao sao acoplados e exclusivos das
ferramentas e sao desenvolvidos por terceiros, sendo possıvel ambas as linguagens
possuırem solvers em comum. No caso do CVX, o solver padrao e o SDPT3, porem
a instalacao da ferramenta tambem inclui outro solver, o Sedumi [34]. A instalacao
do Yalmip nao inclui os solvers mais comuns para resolucao de LMIs, por isso faz-se
necessaria a instalacao separada deles [35].
82
Cada um desses toolboxs possuem diferencas na implementacao e resolucao de
LMIs. Mais detalhes de como definir e resolver uma LMI utilizando cada uma
dessas ferramentas sao apresentados nas secoes seguintes. Todavia, antes de entrar
em detalhes sobre cada ferramenta separadamente, e importante evidenciar uma
caracterıstica que o Yalmip e o CVX possuem em comum: ambos nao permitem o
uso de LMIs estritas. Para contornar esse problema, uma solucao encontrada que
nao afeta significativamente o resultado e fazer a seguinte mudanca:
F (x) > 0
F (x) ≥ δI
Onde I e a matriz identidade de dimensao apropriada. A ideia e escolher um δ
pequeno o suficiente que permita que a ferramenta resolva a LMI, mas que nao afete
tanto o resultado final obtido.
Dessa forma, o Yalmip e o CVX possuem uma desvantagem em relacao ao LMI
Control Toolbox, que e capaz de implementar LMIs estritas. Porem, como sera visto
adiante, outras vantagens como facilidade de implementacao e a presenca de solvers
mais recentes tornam interessante o uso das linguagens de modelagem no lugar do
toolbox incluso no Matlab.
As proximas secoes tem como objetivo mostrar como especificar e resolver um
sistema de LMIs, alem de comparar os toolboxs. As referencias [35, 34, 30] foram
utilizadas como base para resolucao de problemas envolvendo LMIs em cada uma
das ferramentas e possuem mais detalhes sobre os toolboxs.
A.1 LMI Control Toolbox
O primeiro passo para resolucao de LMIs utilizando o LMI Control Toolbox e a
inicializacao da descricao do sistema de LMIs. Isso e feito utilizando o comando
setlmis([ ]).
83
Feito isso, e necessario definir as variaveis desconhecidas. Estas variaveis sao ca-
racterizadas pela sua estrutura. O comando responsavel pela definicao das variaveis
possui a seguinte estrutura: lmivar(tipo,estrutura). A definicao do argumento
estrutura depende da definicao anterior do argumento tipo, que pode ter tres valores:
� tipo = 1: estrutura simetrica em blocos diagonais. Isso corresponde a
variaveis com a seguinte forma:D1 0 . . . 0
0 D2. . .
......
. . . . . . 0
0 . . . 0 Dr
Cada bloco diagonal Dj e uma matriz quadrada, que pode ser uma matriz
nula, uma matriz simetrica completa ou uma matriz escalar. A estrutura para
esse tipo e um vetor que contem todos os blocos da matriz. Cada elemento
do vetor representa um bloco e possui dois valores: o tamanho do bloco e
a natureza do bloco (1 para um bloco simetrico completo, 0 para um bloco
escalar e -1 para um bloco nulo).
O tipo = 1 engloba as variaveis que sao escalares (1 bloco escalar de tamanho
1). Como exemplo de variaveis desse tipo, tem-se:
1 X = lmivar(1,[2 0,2 1]);
2 Y = lmivar(1,[5 1]);
3 e = lmivar(1,[1 0]);
No exemplo X possui 2 blocos diagonais, o primeiro bloco possui tamanho
2 e e escalar e o segundo bloco tambem possui tamanho 2, mas e um bloco
completo. A variavel Y possui apenas 1 bloco, sendo uma matriz simetrica
completa de dimensao igual a 5. A variavel e representa um escalar.
� tipo = 2: estrutura retangular. Corresponde a uma matriz retangular n×m,
tendo como estrutura um vetor de tamanho 1, cujo primeiro elemento indica
a quantidade de linhas da matriz e o segundo indica a quantidade de colunas.
Como exemplo, considere a matriz retangular X de tamanho 5× 4:
84
1 X = lmivar(2,[5 4]);
� tipo = 3: estruturas gerais. Este tipo representa matrizes mais complexas,
que nao serao tratadas nesse trabalho.
Apos a definicao das variaveis, o proximo passo e definir a LMI. Isso e feito com o
comando lmiterm(ID,A,B,flag). Os 3 primeiros argumentos desse comando sao
obrigatorios e o argumento flag e opcional. O primeiro argumento ID e um vetor
de dimensao 1 × 4. O primeiro elemento desse vetor indica qual LMI esta sendo
definida, o segundo e terceiro elementos indicam a posicao do termo que esta sendo
definido e o quarto elemento indica qual variavel esta envolvida no termo definido (X
quando envolve a variavel X, 0 quando nao envolve nenhuma variavel e -X quando
envolve XT ). Os argumentos A e B sao os termos que irao multiplicar a variavel a
esquerda e a direita, respectivamente. O argumento opcional flag pode ter o valor
como ’s’, o que torna possıvel definir o termo e seu termo simetrico de forma mais
rapida.
Uma observacao importante a ser feita e que devem ser especificados apenas os
termos nos blocos diagonais ou os termos acima da diagonal da LMI. Como a LMI
deve ser simetrica para ser resolvida com sucesso no LMI Control Toolbox, e suficiente
especificar apenas esses termos. Especificar todos os termos da LMI resulta em
termos duplicados e, portanto, cria uma LMI diferente da esperada.
O ultimo passo para definicao do problema e a criacao da representacao interna
da LMI. Isto e feito com o comando getlmis :
1 nomeDaLMI = getlmis
Esse comando so deve ser utilizado uma vez e apenas apos a declaracao de todas
as variaveis e termos da LMI com os dois comandos anteriores.
Tendo a LMI definida, o ultimo passo e resolve-la. Para isso, o toolbox possui tres
solvers diferentes:
85
� feasp. Resolve o problema da admissibilidade.
� mincx. Resolve o problema do autovalor, que tambem pode ser entendido
como a minizacao de um objetivo linear.
� gevp. Resolve o problema do autovalor generalizado.
Os tres solvers tem a representacao interna da LMI como argumento e retornam
a solucao admissıvel ou otimizada do problema.
Por fim, para ser possıvel mostrar o resultado obtido, e necessario fazer uma
conversao de variaveis. Isso acontece porque durante a especificacao da LMI os
termos sao especificados como variaveis de matrizes, porem, durante o processo de
resolucao, os solvers tratam os termos como variaveis de decisao. Dessa forma,
a solucao retornada pelo solver e uma variavel de decisao e para o resultado ser
convertido para o formato correto e necessario utilizar o comando
1 dec2mat(nomeDaLMI,variavelDeDecisao,variavelDeMatriz)
Feita essa conversao, o resultado pode ser impresso no Matlab com sucesso.
O LMI Control Toolbox oferece um ambiente grafico para especificacao de LMIs, o
LMI Lab, que pode ser acessado utilizando o comando lmiedit. Apesar de facilitar
o processo de definicao do problema, o LMI Lab nao e tao flexıvel quanto o uso
do lmiterm. Devido a essa limitacao, foi preferido nao utilizar o LMI Lab nesse
trabalho.
Um exemplo de resolucao de LMI utilizando o LMI Control Toolbox sera mostrado
mais adiante.
A.2 Yalmip
No caso do Yalmip o primeiro passo e o uso do comando yalmip(’clear’). Apesar
de nao ser um comando obrigatorio para definicao de LMIs, ele limpa definicoes
86
anteriores feitas no toolbox e evita que algum valor antigo que tenha sido guardado
pelo Matlab influencie no problema atual.
Feito isso, o proximo passo e a definicao das variaveis do problema. Aqui, isso
e feito utilizando o comando sdpvar. Toda matriz quadrada definida no Yalmip e
assumida ser simetrica, nao precisando explicitar isso. Alem disso, muitos opera-
dores do Matlab podem ser aplicados diretamente a objetos criados pelo comando
sdpvar, o que simplifica a definicao de algumas matrizes especiais. Considere as
seguintes variaveis para exemplificar o uso desse comando:
1 P = sdpvar(n); % matriz simetrica
2 P = sdpvar(n,n); % matriz simetrica
3 P = sdpvar(n,n,'symmetric'); % matriz simetrica
4 M = sdpvar(n,m); % matriz retangular
5 X = diag(sdpvar(n,1)); % matriz diagonal
6 X = toeplitz(sdpvar(n,1)); % matriz de Toeplitz
Definidas as variaveis, o proximo passo e definir as restricoes impostas pela LMI.
No Yalmip isso e feito de forma bem simples e clara. Considere o exemplo onde a
restricao requer que a variavel X seja positiva definida e a variavel Y seja negativa
definida.
1 X = sdpvar(n,n);
2 Y = sdpvar(m,m);
3 LMI = [X > 0, Y < 0];
Uma vez que todas as variaveis e restricoes estejam definidas, basta resolver o pro-
blema. Isto e feito utilizando o comando optimize(restricoes,objetivo,opcoes).
Caso o problema tratado seja o problema de admissibilidade, o argumento objetivo
pode ser omitido. O argumento opcoes e opcional, porem permite selecionar opcoes
alem das padroes no Yalmip, como escolher o solver por exemplo. A escolha das
opcoes e feita por um segundo comando, o sdpsettings.
Feita a otimizacao do problema, o ultimo passo e extrair o valor numerico da
variavel, de forma que seja possıvel exibir o valor obtido no Matlab. O comando que
87
realiza essa operacao e o comando value(variavel). Considere o exemplo linear
simples para ilustrar o uso desses 3 comandos:
min cTx sujeito a Ax ≤ b
Esse problema pode ser resolvido com o seguinte codigo:
1 x = sdpvar(length(c),1);
2 restricao = [A*x ≤ b];
3 objetivo = c'*x;
4 optimize(restricao,objetivo);
5 solucao = value(x)
Caso seja procurada apenas uma solucao admissıvel, o objetivo pode ser omitido:
1 optimize(restricao);
Caso deseje-se escolher o solver e definir quantas informacoes o solver ira mostrar
na saıda faz-se:
1 opcoes = sdpsettings('solver',sedumi,'verbose',0);
2 solucao = optimize(restricao,objetivo,opcoes)
3 solucao = optimze(restricao,[],opcoes) % quando deseja-se apenas uma solucao ...
admissıvel
A opcao verbose indica a quantidade de informacoes que sera exposta na saıda
do Matlab. O padrao para essa opcao e 1, que exibe uma quantidade razoavel de
informacoes, escolher a opcao como o valor 0 ira imprimir a solucao com a menor
quantidade de informacoes possıveis e escolher o valor 2 mostrara a maior quantidade
de informacoes.
O Yalmip nao possui um solver padrao, pois se baseia em solvers externos para
resolucao dos problemas de otimizacao. Quando o usuario nao especifica explici-
tamente qual o solver que deseja utilizar, o toolbox analisa o problema descrito e
seleciona o solver que acha mais apropriado para resolve-lo. Caso o melhor solver
para resolver o problema nao esteja disponıvel, o toolbox realiza a conversao do
problema para uma outra outra formulacao que possua um solver apropriado [35].
88
Nesse trabalho sao instalados os solvers SDPT3 e Sedumi para uso com Yalmip,
uma vez que ambos nao necessitam de licenca para sua utilizacao.
Um exemplo de resolucao de LMI utilizando o Yalmip sera mostrado mais adiante.
A.3 CVX
O CVX assim como o Yalmip e uma linguagem de modelagem que faz uso de
solvers externos, porem com a vantagem de incluir em sua instalacao os solvers
Sedumi e SDPT3, tendo o SDPT3 como padrao.
Para resolver as LMIs utilizando o CVX e importante que todas as declaracoes
estejam inclusas dentro do bloco que comeca pelo comando cvx begin e termina
com o comando cvx end.
O comando cvx begin deve incluir um modificador que indique o tipo de pro-
blema que sera resolvido. No caso das LMIs, o comando passa a ser cvx begin sdp,
onde o modificador sdp indica Semidefinite Programming, classe onde se encaixa a
resolucao de LMIs [34]. Alem disso, existe a possibilidade de controlar o que sera
exibido na saıda, assim como era possıvel no Yalmip utilizando verbose = 0. No
CVX isso e feito adicionando o modificador quiet ao comando begin, que passa a ter
a seguinte forma cvx begin sdp quiet.
Com o bloco definido pelos comandos begin e end, pode-se comecar a definir o
sistema de LMIs. Assim como nos outros toolboxs, o primeiro passo e a definicao
das variaveis. Isto e feito com o uso do comando variable seguido pelo nome da
variavel, seu tamanho e outras palavras chaves opcionais que definem a estrutura
da variavel. Como exemplo, considere a definicao das variaveis a seguir:
1 variable X
2 variable Y(5,4)
3 variable P(3,3) symmetric
4 variable Z(10,10) hermitian toeplitz
89
Nesse caso, X e uma variavel escalar, Y e uma matriz retangular 5× 4, P e uma
matriz quadrada simetrica e Z e uma matriz especial hermitiana e de toeplitz.
O proximo passo e definir as restricoes das LMIs. Caso a LMI trate de um pro-
blema de autovalor ou autovalor generalizado, havera um objetivo a ser minimizado
ou maximizado. Para isso, o CVX possui dois comandos: minimize e maximize.
Se nenhum objetivo for definido com esses dois comandos, assume-se que se trata
de um problema de admissibilidade, que e equivalente a realizar a minimizacao com
objetivo igual a 0.
As restricoes sao definidas de forma semelhante ao Yalmip com uma unica dife-
renca de nao ser necessario atribuir uma variavel a elas. Considere o mesmo exemplo
do Yalmip, onde a restricao requer que a variavel X seja positiva definida e a variavel
Y seja negativa definida.
1 cvx begin sdp quiet
2 variable X(n,n) symmetric
3 variable Y(m,m) symmetric
4 [X > 0, Y < 0]
5 cvx end
O processo de solucao no CVX nao possui uma funcao especıfica igual aos ou-
tros toolboxs. O comando que indica o inıcio do processo de solucao e o cvx end.
Portanto, fora do bloco com a definicao do problema ja e possıvel obter o resultado.
Isto e feito igual ao Yalmip, com a funcao value, que extrai o valor numerico da
variavel.
Um exemplo completo utilizando o CVX se encontra na proxima secao, que ira
comparar os 3 toolboxs.
A.4 Comparacao entre os Toolboxs
Pelas diferencas citadas acima, e facil perceber que a definicao do problema utili-
zando o Yalmip e o CVX e mais simples e intuitiva. Alem disso, esses dois toolboxs
90
possuem a vantagem de trabalharem com solvers mais recentes, que possuem de-
sempenho melhor ao lidar com problemas grandes, o que nao e visto nos solvers
inclusos no LMI Control Toolbox.
Um ponto positivo do LMI Control Toolbox e a possibilidade de se trabalhar com
LMIs estritas. Todavia, a dificuldade da definicao do problema imposta pelo uso do
comando lmiterm faz com que seja mais interessante o uso do CVX ou Yalmip,
uma vez que eles passam mais seguranca ao usuario do que esta sendo definido por
ele.
Considere o exemplo simples da equacao de Lyapunov para ilustrar o uso de cada
um dos toolboxs estudados:
P > 0, ATP + PA < 0 (A.1)
Essas duas inequacoes podem ser combinadas na LMI:
ATP + PA 0
0 −P
< 0 (A.2)
O codigo abaixo mostra como e resolvida a LMI com o LMI Control Toolbox e o
resultado obtido.
1 clear all;
2 close all;
3
4 A = [0 1;-2 -3];
5 setlmis([])
6 P = lmivar(1,[size(A,1) 1]);
7 lmiterm([1 1 1 P],1,A,'s');
8 lmiterm([1 1 2 0],1);
9 lmiterm([1 2 2 P],-1,1);
10 lmis = getlmis;
11 [tmin,Pfeas] = feasp(lmis);
12 P = dec2mat(lmis,Pfeas,P)
13
14 Resultado:
15 P = 65.9992 12.8946
16 12.8946 15.1836
91
Utilizando o Yalmip tem-se o seguinte codigo:
1 clear all;
2 close all;
3
4 A = [0 1;-2 -3];
5
6 yalmip('clear');
7 P=sdpvar(2,2);
8 LMI=[A'*P+P*A, zeros(2);zeros(2), -P] ≤ 1e-4*eye(4)
9 ops=sdpsettings('solver','sdpt3','verbose',0);
10 optimize(LMI,[],ops);
11 P=value(P)
12
13 Resultado:
14 P = 11.7628 2.2073
15 2.2073 2.8078
Utilizando o CVX, tem-se:
1 clear all;
2 close all;
3
4 A = [0 1;-2 -3];
5 cvx begin sdp quiet
6 variable P(2,2) symmetric
7 [A'*P+P*A, zeros(2);zeros(2), -P] ≤ 1e-4*eye(4)
8 cvx end
9 P=value(P)
10
11 Resultado:
12 P = 25.0780 4.7113
13 4.7113 5.9725
Com o Yalmip e CVX foi necessario fazer um ajuste para tornar a LMI estrita
em nao estrita.
Por serem ferramentas diferentes, e esperado que o resultado nao seja o mesmo.
Porem, como o caso analisado e um problema de admissibilidade, o fato de se obter
3 resultados diferentes nao e um problema, uma vez que qualquer solucao admissıvel
e uma resposta valida.
92
Por conta da dificuldade de implementacao encontrada no LMI Control Toolbox,
alem do fato de utilizar solvers mais antigos, nesse trabalho sera preferido o uso do
CVX ou do Yalmip.
93