LQR.trabalho

22
Instituto Federal de Educação, Ciência e Tecnologia do Pará (IFPA) Engenharia de Controle e Automação Engenharia de Controle I Regulador Linear Quadrático Pedro Santos Renan Godinho Barbara Gonçalves Abner Barbosa Rodrigo Pena Belém/PA Setembro/2013

Transcript of LQR.trabalho

Page 1: LQR.trabalho

Instituto Federal de Educação, Ciência e Tecnologia do Pará (IFPA)

Engenharia de Controle e Automação Engenharia de Controle I

Regulador Linear Quadrático

Pedro Santos

Renan Godinho

Barbara Gonçalves

Abner Barbosa

Rodrigo Pena

Belém/PA

Setembro/2013

Page 2: LQR.trabalho

SUMÁRIO

INTRODUÇÃO.......................................................................................................3

DESENVOLVIMENTO.............................................................................................4

1. PROBLEMAS DE CONTROLE ÓTIMO.................................................................4

a) PROBLEMA DO CONTROLE ÓTIMO QUADRÁTICO:.........................4

b) TEMPO MÍNIMO DE CONTROLE:....................................................6

c) CONTROLE TERMINAL:...................................................................6

d) MÍNIMO ESFORÇO DE CONTROLE:.................................................6

e) O SERVOMECANISMO ÓTIMO:.......................................................6

f) PROBLEMA DO REGULADOR ÓTIMO:...............................................7

2. O Problema do Regulador Linear Quadrático Invariante no Tempo.7

3. Motivação física para o Regulador Linear Quadrático......................10

4. As Matrizes Q e R................................................................................13

5. Projeto de Regulador Linear Quadrático no MATLAB.....................18

6. Conclusão.............................................................................................21

7. Bibliografia............................................................................................22

Page 3: LQR.trabalho

INTRODUÇAO

O Regulador linear quadrático (LQR do inglês Linear Quadratic

Regulator) possui grande aplicação em controle ótimo. A teoria do controle

ótimo lida com operação de um sistema dinâmico com custo mínimo. Sabemos

que a natureza não é linear, portanto por meio de uma linearização podemos

conduzir a uma solução que se aproxime da solução real do problema.

O LQR é uma estratégia de controle,criada pelo matemático Kalman em

1960, que é baseada na realimentação de estados , ou seja , tem a vantagem

de se apresenta a solução do problema através das variáveis de estado, é

fundamental para o LQR que os ganhos do controlador sejam calculados pelas

matrizes que regem o desempenho do sistema.

Esses ganhos obtidos são encontrados por meio da solução da equação

de Riccati, que é uma equação diferencial não-linear de primeira ordem, a

resolução de problemas de controle ótimo através de sistemas lineares é bem

conhecida e seus estudos são bastantes consolidados , entretanto quando o

sistema não é linear a solução do problema torna-se complexa. Com o objetivo

de amenizar esse problema parcialmente Al´brekht (1962) estudou o problema

de controle ótimo de maneira geral considerando um sistema de equações não-

lineares , mas analíticas e invariantes no tempo. Lukes (1969) utilizou esses

conceitos e estendeu a teoria do LQR a sistemas não-lineares, mas analíticos

em torno da origem, invariantes no tempo e com horizonte infinito. Willemstein

(1975) mostrou que essa extensão é valida para sistemas não-lineares, mas

analíticos em torno da origem, variantes no tempo e com horizonte finito. A

situação onde a dinâmica do sistema é descrita por um conjunto de equações

diferenciais lineares é descrita por uma função quadrática, denominada de

problema linear quadrático.

DESENVOLVIMENTO

O controle ótimo está desempenhando um papel cada vez mais

importante nos projetos de sistemas modernos com o objetivo a maximização

do retorno de, ou a minimização do custo de, a operação do processo físico e

econômico.

Page 4: LQR.trabalho

A situação onde a dinâmica do sistema é descrita por um conjunto de

equações diferenciais lineares é descrita por uma função quadrática,

denominada de problema linear quadrático.

Nos projetos via Regulador Linear Quadrático, o projetista deverá atribuir

ponderações as matrizes que definem a importância relativa dos estados e do

esforço de controle, no entanto o LQR não possui um método para definir

antecipadamente os parâmetros de desempenho do sistema em função do

tempo em função das ponderações impostas pelo projetista, mostrando-se

basicamente empírica.

1. PROBLEMAS DE CONTROLE ÓTIMO:

a) PROBLEMA DO CONTROLE ÓTIMO QUADRÁTICO:

*Regulador de tempo contínuo:

O sistema dinâmico abaixo descrito pelas equações de estados:

(1)

Onde u = -kx

Com função custo dada por:

(2)

A minimização do valor custo é representada pela seguinte lei de

controle de retroalimentação:

(3)

Sendo P encontrado através da solução da Equação de Ricatti(*) dada

abaixo:

Page 5: LQR.trabalho

(4)

* Equação de Ricatti é uma equação diferencial ordinária não-linear de

primeira ordem, na forma:

(5)

Onde a(x),b(x) e c(x) são três funções que dependem de

Se conhecermos uma solução particular da equação, por exemplo , a

seguinte mudança de variável transformará a equação em equação linear:

(6)

=

(7)

*Regulador de tempo discreto:

Sendo o sistema de tempo discreto descrito por:

(8)

Função custo definida por:

A lei de controle de realimentação é:

(9)

Onde: (10)

(11)

E P é a solução para a Equação de Ricatti discreta:

(12)

Page 6: LQR.trabalho

O objetivo do controle ótimo é determinar o vetor de controle u(t)

que forçará o comportamento do sistema a minimizar algum tipo de

função custo, enquanto ao mesmo tempo satisfaz as limitações físicas

do sistema.

b) TEMPO MÍNIMO DE CONTROLE:

O problema resumisse em encontrar o vetor u(t) de modo que o tempo

exigido seja mínimo, ou seja, a . Onde este tempo é calculado pela

função custo abaixo :

(13)

c) Controle terminal :

Dada a função abaixo:

( ) ( ) ( ) (14)

Onde ξ( é o valor final desejado para , S é a matriz de estados

terminais, ou seja, S está relacionada com os estados finais fixos, os quais são

os estados desejados, positiva semidefinida de pesos. Neste caso, o interesse

é definir u(t), tal que o erro x(tf) – ξ(tf) seja mínimo.

d) Mínimo esforço de controle:

Dada a função :

(15)

Na expressão acima J representa a energia consumida pelo vetor de

controle u(t) na ação de controlar o sistema, onde R é um matriz de peso

semidefinida positiva com t Є (

e) O servomecanismo ótimo:

Dada a função de custo:

∫ ∫

(16)

Page 7: LQR.trabalho

Onde Q é uma matriz de pesos real semidefinida positiva para t Є (tf,t0) e

ξ(t) é a trajetória pré-especificada, desejada, do vetor de estado x(t). O vetor de

e = x(t) – ξ(t) é o erro que se deseja minimizar. Isto deve ser completado pela

escolha de um u(t) adequado.

Neste tipo de problema, frequentemente inclui-se tanto o esforço de

controle, quanto o problema de controle terminal:

( ) ( ) [ ( ) ( )]

} (17)

f) Problema do regulador ótimo:

Dada a função de custo abaixo:

(18)

Aqui o objetivo é restabelecer o estado de equilíbrio do sistema após este

ser submetido a uma perturbação. Em projetos de controle ótimo envolvendo

este tipo de problema, nos quais não se requer estados finais fixos, a função de

custo J se reduz a:

(19)

2. O Problema do Regulador Linear Quadrático Invariante no Tempo

Para iniciar, será exposto o problema do LQR, sua solução e hipóteses

usadas na obtenção da solução. Será dado o teorema abaixo, avaliado sem

provas, somente hipóteses acerca do LQR, abordando a existência da solução

do problema.

Teorema 1: Dada a dinâmica do sistema:

(19)

(20)

Com x(t) Є Rn e u(t) Є Rm ao longo de uma combinação linear de estados,

deixando pequena

Page 8: LQR.trabalho

(21)

Com y(t) Є Rp. Define-se a função custo quadrática:

(22)

No qual o tamanho dos estados de interesse, z(t) é comparado

relativamente à ação de controle equivalente de u(t), através da matriz de

pesos R. Considerando, sem prova formal, se as seguintes hipóteses são

corretas:

a) O vetor de estado x(t) está inteiramente disponível para realimentação;

b) [A B] é estabilizável e [A C] é detectável;

c) R = RT>0;

Então:

i) O controlador linear quadrático é único, ótimo e a lei de controle de

realimentação de estados total é:

Com:

Que minimiza a função custo J, sujeito à restrição dinâmica imposta pela

dinâmica de malha aberta em eq.1.

ii) S é uma matriz única, simétrica, positiva e semidefinida, a qual é

solução da equação algébrica de Riccati:

iii) A dinâmica em malha fechada, através da substituição de 2 em 1:

(23)

(24)

(25)

(26)

(27)

Page 9: LQR.trabalho

O qual é garantido haver estabilidade.

iv) O mínimo valor do funcional quadrático de custo J na equação 11 é:

A prova (simplificada) do teorema anterior decorre do sistema dado na

equação 1 e da função de Lyapunov

Com S>0 calculada a partir da equação de Riccati. Derivando em relação

ao tempo, obtem-se:

Cuja integral de 0 a +∞ fornece

( ) ( ) ∫

Com ρ = R sendo escalar (no caso geral de uma única entrada u(t)).

3. Motivação física para o Regulador Linear Quadrático

O problema do LQR e o custo podem ser motivados da seguinte maneira.

Dado o sistema da equação 1, que está inicialmente excitado, e o resultado

desta excitação está refletido no vetor de estado x0. Esta condição inicial pode

ser considerada como um desvio indesejável da posição de equilíbrio do

sistema, x(t)=0. Uma vez conhecido esse desvio, o objetivo de controle pode

ser essencialmente visto como a seleção do vetor de controle u(t) que regula o

vetor de estado x(t)=0 tão rapidamente o possível.

(28)

(29)

[30]

(31)

0]

Page 10: LQR.trabalho

Se a equação 1 é controlável, então é possível levar o sistema de x(t) para

zero em um curto período de tempo arbitrário. Isto irá requerer altos valores do

sinal de controle (grande esforço de controle), o qual do ponto de vista da

engenharia é inaceitável. Altos valores para sinais de controle irão saturar os

atuadores e se implementados na forma de realimentação, irá requerer projetos

com grandes larguras de banda que por sua vez, irão excitar dinâmicas não

modeladas. Por este motivo, fica óbvio que deve existir no projeto um balanço

entre o desejo de regular perturbações em estado de equilíbrio e a magnitude

do sinal de controle necessário.

Minimizando o funcional quadrático de custo da equação 11 é uma forma

de quantificar o desejo do engenheiro de controle em alcançar este balanço.

Compreender que a natureza quadrática de ambos os termos no custo

(32)

(33)

Assegura que estes termos são não-negativos para todo t. Ora, avaliando o

efeito de R e CTC = Q no desempenho do sistema, é possível chegar às

seguintes conclusões:

i) Se Q>>R>0

O peso do sinal de controle no cálculo do critério é reduzido;

O sinal de controle pode atingir valores elevados;

O sistema responde com maior velocidade;

Há a possibilidade de saturação dos atuadores;

ii) Em contrapartida, se 0≤Q<<R:

A energia de controle tem maior peso no cálculo do critério;

As componentes do ganho de realimentação de estado serão de

pequeno valor absoluto;

O sistema não apresentará uma resposta rápida.

Exemplo:

Page 11: LQR.trabalho

Considere-se o sistema mostrado na Figura 2.1. Admitindo-se que o sinal de controle seja: u(t) = - Kx(t)

Determinar a matriz de ganho de realimentação K ótima tal que o seguinte índice de desempenho seja minimizado:

Onde:

[

]

Fig.2.1. Sistema de controle

A partir da figura acima, acha-se a equação de estado para o processo é:

Onde [

], B =[ ]

Será demonstrado o uso da equação matricial de Riccati reduzida no projeto do sistema de controle ótimo, como:

Observando-se que a matriz A é real e que a matriz Q é real e simétrica, a matriz P é uma matriz real simétrica. Portanto, esta última equação pode ser escrita como:

Page 12: LQR.trabalho

Esta equação pode ser simplificada para

A partir da qual se obtém as três equações seguintes

Resolvendo-se estas três equações simultâneas em p11, p12, p22, com o requisito de que P seja definida positiva, obtém-se:

Pode-se obter a matriz de ganho de realimentação K ótima como sendo:

Assim, o sinal de controle ótimo é

Note-se que a lei de controle dada pela equação acima conduz a um resultado ótimo para qualquer estado inicial sob o índice de desempenho dado. Além disso, observa-se que a matriz Q só afeta o segundo elemento da matriz de ganho de realimentação K.

4. As Matrizes Q e R.

Um problema do LQR é a determinação das matrizes de ponderação que

satisfazem determinadas condições, onde, Q é uma matriz de ponderação

associada aos estados do sistema e R é uma matriz de ponderação associada às

variáveis de controle. A determinação dessas matrizes influencia para o cálculo

do ganho. Diversas técnicas foram desenvolvidas para determina-las que tem por

base métodos determinísticos e Heurísticos. A liberdade de escolha das matrizes

Page 13: LQR.trabalho

de ponderação do projeto LQR são variáveis de projeto livres que são utilizadas

para a sintonia dos ganhos de controle ótimo.

O principal enfoque deste tópico é fazer uma breve explanação dos métodos

de busca das matrizes de ponderação Q e R que compõem índice de

desempenho J.

a) Métodos Heurísticos: são métodos que constituem uma das primeiras

técnicas concebidas para a seleção das matrizes de ponderação. Uma

abordagem dessa metodologia é o chamado quadrado do inverso ou Método de

Bryson, cuja idéia básica é normalizar as saídas e o termo controle dentro da

função de índice de desempenho quadrático. Esta normalização é normalmente

realizada usando o máximo de valores antecipados (ou derivados) do controle e

das saídas individuais. Porém, sua desvantagem é por ser um método intuitivo.

Os parâmetros Q e R geralmente necessitam ser sintonizados até um

comportamento satisfatório ser obtido, ou até o projetista se satisfazer com o

resultado.

Uma conjectura inicial é escolher uma diagonal de Q e R

b) [

] [

]

Onde Q e R têm diagonais positivas, dentre as quais:

c)

d)

e)

Onde m é o numero de estados e k é o número de atuadores do sistema de

controle. O desempenho desejado do sistema obtido pelo ajuste das matrizes

de ponderações são escolhidas pelas equações 4.3 e 4.4.

O número Δximax está baseado na faixa/intervalo de operação dos estados.

A outra quantidade Δuimax tem um significado similar para a i-ésima

[4.1]

[4.2]

[4.3]

[4.4]

Page 14: LQR.trabalho

componente da entrada u, e está baseada no máximo esforço de controle ou

valor máximo de operação de atuadores. Partindo desta conjectura inicial os

valores das diagonais principais de Q e R devem ser ajustados por método de

tentativa e erro, sistematicamente.

Na figura 4.1 apresenta-se um algoritmo ilustrando o procedimento de

determinação das matrizes de ponderação Q e R, implementando o método de

Bryson.

b) Metodologia usando Controle ótimo Modal

O objetivo do controle ótimo modal é determinar uma lei de realimentação

de estado, utilizando a equação 4.4:

de modo que a matriz do sistema de malha fechada

tenha os seus autovalores pré estabelecidos. O controle ótimo modal é

baseado na convencional alocação de pólos, que em vez de escolher o ganho

de realimentação diretamente, os parâmetros de projeto da função quadrática

são posicionados de acordo com as matrizes Q e R até atingir os objetivos do

projeto de controle.

c) Projeto do Regulador com Condições de Estabilidade.

Neste método troca-se a determinação das localizações exatas de todos os

pólos à malha fechada pela simples especificação de uma região do semipleno

complexo esquerdo onde deverão estar os pólos a malha fechada. Este

método explora ainda as propriedades do regulador de potência mínima e a

equação de Riccati é usada para determinar as matrizes de ponderação

apropriadas.

[4.5]

Page 15: LQR.trabalho

Figura 4.1 - Método de Bryson

Page 16: LQR.trabalho

Figura 4.2 - Controle modal

Page 17: LQR.trabalho

Figura 4.3 - Algoritmo do regulador em condições de estabilidade

Page 18: LQR.trabalho

5. Projeto de Regulador Linear Quadrático no MATLAB

Exemplo 1:

Considerando uma equação multivariável de espaço de estado

determinada por

Selecionando a matriz diagonal Q = diag(10, 8, 2, 0) e a matriz

identidade R = I, podemos obter a matriz de realimentação de estados através

de

A matriz K de realimentação de estados e a solução P para a equação de

Ricatti pode ser obtida por

E os polos em malha fechada são −6.3396,−12.7427,−23.5384 e −27.8096.

Exemplo 2: Regulador Linear Quadrático para um motor DC

A representação dos estados do motor de corrente contínua é dado abaixo:

Onde y é a velocidade angular da carga e u a tensão de alimentação de tal forma que o sistema em malha fechada

1. Seja estável e acompanhe um degrau unitário com erro nulo em regime permanente.

2. Não apresente sobre-elevação no sinal de saída, em relação ao degrau de entrada, no domínio do tempo.

Considere o modelo do motor de corrente contínua. Resolvemos o problema linear quadrático para:

Page 19: LQR.trabalho

A = 0 1.0000 -0.1429 -1.0714 B = 0 1 C = 0.0714 0 D = 0 Q = 1 0 0 1 R = 25 Logo, para [k,P] = lqr(A,B,Q,R) são: k = 0.1029 0.1092 P = 3.4271 2.5726 2.5726 2.7289 E 1 ≤ρ ≤ 25. Obtemos o Gráfico a seguir:

Page 20: LQR.trabalho

0 5 10 15 20 25 30 35 400

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

REGULADOR LINEAR QUADRATICO PARA MOTOR DC

Time (sec)

Am

plitude

Sem Regulação

Com Regulação

Figura 5.1

Page 21: LQR.trabalho

6. Conclusão

Neste trabalho apresentamos de forma breve o Regulador Linear

Quadrático, muito usado em sistemas de Controle Ótimo. Onde o LQR pode

proporcionar ganhos de controle ótimo desde que seja feita uma escolha

adequada das matrizes Q e R da função desejada para minimização de custo.

Podemos concluir também que o LQR garante excelentes margens de

estabilidade e boa rejeição de distúrbios, porém o projetista é obrigado a testar,

de forma intuitiva, índices de desempenhos até se chegar o qual ele desejar.

No caso do Regulador Linear Quadrático, o índice de desempenho é um

mapeamento dos espaços dos vetores de estados e de controle ponderados

pelas matrizes constantes Q e R, respectivamente. Aponta-se também como

vantagem do LQR a margem de estabilidade garantida. Foi discutido a

problemática relacionada com a solução da Equação de Ricatti, a escolha das

matrizes de ponderação e suas relações com métodos de busca ótima.

Page 22: LQR.trabalho

7. Bibliografia

OGATA, Katsuhiko. Engenharia de Controle Moderno. Prentice Hall do Brasil. 2ª ed. Rio de Janeiro. 1982.

BURNS, Roland. Advanced Control Engineering. Butterwoth-

Heinemann. 1ª ed. Oxford. 2001.

KIRK, Donald. Optimal Control Theory. Dover Publications, 1970.