metrologia piezas 3D

131
CONTROLE DE SISTEMAS ADAPTATIVOS MEDIANTE A UTILIZAÇÃO DO FILTRO DE KALMANVARIANTE NO TEMPO MIGUEL ENRIQUE PARRA MUÑOZ TESES DE DOUTORADO EM SISTEMAS MECATRÔNICOS DEPARTAMENTO DE ENGENHARIA MECÂNICA FACULDADE DE TECNOLOGIA UNIVERSIDADE DE BRASÍLIA

description

piezas echas en 3D metrologia

Transcript of metrologia piezas 3D

  • CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAO DO

    FILTRO DE KALMAN VARIANTE NO TEMPO

    MIGUEL ENRIQUE PARRA MUOZ

    TESES DE DOUTORADO EM SISTEMAS MECATRNICOS

    DEPARTAMENTO DE ENGENHARIA MECNICA

    FACULDADE DE TECNOLOGIA

    UNIVERSIDADE DE BRASLIA

  • UNIVERSIDADE DE BRASLIAFACULDADE DE TECNOLOGIA

    DEPARTAMENTO DE ENGENHARIA MECNICA

    CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAO DO

    FILTRO DE KALMAN VARIANTE NO TEMPO

    MIGUEL ENRIQUE PARRA MUOZ

    DISSERTAO DE MESTRADO ACADMICO SUBMETIDA AO DEPARTAMENTODE ENGENHARIA MECNICA DA FACULDADE DE TECNOLOGIA DA UNI-VERSIDADE DE BRASLIA COMO PARTE DOS REQUISITOS NECESSRIOSPARA A OBTENO DO GRAU DE MESTRE EM SISTEMAS MECATRNICOS.

    APROVADA POR:

    Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB(Orientador)

    Prof. Dr. nome professor, X/XCo-Orientador

    Prof. ************, CIC/UnBMembro Externo

    Prof. ********************, Ph.D., ENM/UnBMembro Externo

    Prof. ****************, DSc., ENE/UnBMembro Interno

    BRASLIA, 12 DE 11 DE 2014.

  • FICHA CATALOGRFICA

    PARRA MUOZ,MIGUEL ENRIQUECONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAO DO FILTRODE KALMAN VARIANTE NO TEMPO [Distrito Federal] 2014.xvi, Xp., 210 x 297 mm (ENM/FT/UnB, Mestre, Sistemas Mecatrnicos, 2014).Tese de Mestrado Universidade de Braslia, Faculdade de Tecnologia.Departamento de Engenharia Mecnica1. Modelagem e controle 2. Filtro de Kalman3. Controle de sistemas 4. Controle de varinciaI. ENM/FT/UnB II. Ttulo (srie)

    REFERNCIA BIBLIOGRFICAPARRA, M. E. (2014). CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE AUTILIZAO DO FILTRO DE KALMAN VARIANTE NO TEMPO , Dissertao deMestrado em Sistemas Mecatrnicos, Publicao PPGENE.TD-X/X, Departamento deEngenharia Mecnica, Universidade de Braslia, Braslia, DF, Xp.

    CESSO DE DIREITOSAUTOR: Miguel Enrique Parra MuozTTULO: CONTROLE DE SISTEMAS ADAPTATIVOSMEDIANTE A UTILIZAODO FILTRO DE KALMAN VARIANTE NO TEMPO .GRAU: Mestre ANO: 2014

    concedida Universidade de Braslia permisso para reproduzir cpias desta dissertaode mestrado e para emprestar ou vender tais cpias somente para propsitos acadmicos ecientficos. O autor reserva outros direitos de publicao e nenhuma parte dessa dissertaode mestrado pode ser reproduzida sem autorizao por escrito do autor.

    Miguel Enrique Parra MuozDepartamento de Eng. Mecnica (ENM) - FTUniversidade de Braslia (UnB)Campus Darcy RibeiroCEP 70919-970 - Braslia - DF - Brasil

  • AGRADECIMENTOS

    ***

  • RESUMO

    CONTROLE DE SISTEMAS ADAPTATIVOS MEDIANTE A UTILIZAO DO FIL-TRO DE KALMAN VARIANTE NO TEMPO

    Autor: Miguel Enrique Parra Muoz

    Orientador: Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB

    Programa de Ps-graduao em Sistemas Mecatrnicos

    Braslia, 11 de 2014

    Este documento apresenta o trabalho desenvolvido nos ltimos dois anos, para permitirdesenvolver a pesquisa na realizagco do doutorado, o capitulo um, mostra os objetivos,definigco do problema e introdugco, o capitulo dois mostra algumas tlcnicas decontrole que serco usados no desenvolvimento do problema, enfatizando-se diretamenteno filtro de Kalman e as diferentes configuragtes variante e invariante no tempo queserco analisadas, dado que sera desenvolvido um controle que tera uma parte estocas-tica modificando diretamente a varicncia do sistema, razco pela qual no capitulo trsl mostrado um suporte estocastico onde se mostram diferentes aspectos dos processosestocasticos e l analisada a varicncia que sera fundamental no desenvolvimento dotrabalho. O capitulo quatro inicia com a busca na literatura de trabalhos relacionados decontrole de sistemas subaquatico onde sco mostrados trabalhos que apresentam diferen-tes tlcnicas de controle para estes sistemas feitos por outros autores no Brasil, allm dissoo capitulo quatro, mostra uma descrigco matematica de um sistema submarino ROV,este sistema sera analisado detalhadamente na prsxima etapa da pesquisa, neste n vel aparte fundamente l se enfocar em conhecer e desenvolver tlcnicas de controle estocas-tico adaptativo com filtro de Kalman, que possa ser atualizado no tempo, e que permitiraser aplicado em diferentes sistemas na realizagco de teste, esta parte l fundamentale l mostrada no capitulo 5 na parte dos resultados obtidos, aqui l detalhado a analisesde um sistema de tanques, para o qual foi criado diferentes controladores baseados em umavaricncia desejada finalizando com uma analises do filtro de Kalman variante e invarianteno tempo.

  • ABSTRACT

    CONTROL SYSTEMS BY ADAPTIVE KALMAN FILTER VARIABLE IN TIME

    Author: Miguel Enrique Parra Muoz

    Supervisor: Prof. Dr. Eugnio Liborio Feitosa Fortaleza ENE,UNB

    Programa de Ps-graduao em Sistemas Mecatrnicos

    Este documento apresenta o trabalho desenvolvido nos ltimos dois anos, para permitirdesenvolver a pesquisa na realizagco do doutorado, o capitulo um, mostra os objetivos,definigco do problema e introdugco, o capitulo dois mostra algumas tlcnicas decontrole que serco usados no desenvolvimento do problema, enfatizando-se diretamenteno filtro de Kalman e as diferentes configuragtes variante e invariante no tempo queserco analisadas, dado que sera desenvolvido um controle que tera uma parte estocas-tica modificando diretamente a varicncia do sistema, razco pela qual no capitulo trsl mostrado um suporte estocastico onde se mostram diferentes aspectos dos processosestocasticos e l analisada a varicncia que sera fundamental no desenvolvimento dotrabalho. O capitulo quatro inicia com a busca na literatura de trabalhos relacionados decontrole de sistemas subaquatico onde sco mostrados trabalhos que apresentam diferen-tes tlcnicas de controle para estes sistemas feitos por outros autores no Brasil, allm dissoo capitulo quatro, mostra uma descrigco matematica de um sistema submarino ROV,este sistema sera analisado detalhadamente na prsxima etapa da pesquisa, neste n vel aparte fundamente l se enfocar em conhecer e desenvolver tlcnicas de controle estocas-tico adaptativo com filtro de Kalman, que possa ser atualizado no tempo, e que permitiraser aplicado em diferentes sistemas na realizagco de teste, esta parte l fundamentale l mostrada no capitulo 5 na parte dos resultados obtidos, aqui l detalhado a analisesde um sistema de tanques, para o qual foi criado diferentes controladores baseados em umavaricncia desejada finalizando com uma analises do filtro de Kalman variante e invarianteno tempo.

  • SUMRIO

    1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.0.1 OBJETIVO GERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.0.2 OBJETIVOS ESPECFICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1



    2.4.1 SISTEMAS SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.4.2 SISTEMAS MIMO .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    2.5 ESPAO DE ESTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.5.1 DESCRIO INTERNA DE SISTEMAS LINEARES CONTNUOS AMOS-

    TRADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.5.2 MODELO EM ESPAO DE ESTADOS PARA SISTEMAS MIMO .. . . . . . . . . . 82.5.3 DIAGRAMA DE BLOCOS DE UM SISTEMA MIMO .. . . . . . . . . . . . . . . . . . . . . . . 9





  • 2.7.7 FILTRO DE KALMAN (PREDIO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.7.8 EXEMPLO FILTRO DE KALMAN DISCRETO: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.7.9 EXEMPLO 2 FILTRO DE KALMAN DISCRETO: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    2.8 FILTRO DE KALMAN VARIVEL NO TEMPO FKVT . . . . . . . . . . . . . . . . . . . . 382.9 CONTROLE LQG .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    2.9.1 PROPRIEDADES DO LQG .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.9.2 EXEMPLO DO CONTROLE LQG.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.9.3 CONTROLE ATRAVS DE ALOCAO DE PLOS . . . . . . . . . . . . . . . . . . . . . . . . . . 442.9.4 EXEMPLO 2 DO CONTROLE LQG .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    2.10CONTROLADOR PID. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    3 VARIVEIS ALETRIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.1 MDIA ARITMTICA, VARINCIA E DESVIO PADRO. . . . . . . . . . . . . . . . . . . . . . . . . . 51

    3.1.1 MDIA ARITMTICA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.1.2 VARINCIA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523.1.3 DESVIO PADRO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    3.2 FUNDAMENTOS BSICOS DOS PROCESSOS ESTOCSTICOS. . . . . . . . . . . . . . . . . . . . 533.3 VARIVEL ALEATRIA DISCRETA E FUNO DE PROBABILIDADE. . . . . . . . . . . . 54



    3.4 FUNO DISTRIBUIO DE PROBABILIDADE NORMAL. . . . . . . . . . . . . . . . . . . . . . . . 563.4.1 REGRA DE BAYES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    3.5 AUTOCORRELAO: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573.5.1 PROPRIEDADES DA FUNO DE AUTOCORRELAO. . . . . . . . . . . . . . . . . . . . 58

    3.6 RUDO BRANCO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593.7 INTRODUO AOS PROCESSOS DE MARKOV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    3.7.1 CLASSIFICAO DOS ESTADOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62



  • 5 RESULTADOS OBTIDOS COM AS DIFERENTES TCNICAS DE CON-TROLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    5.0.1 FILTRO DE KALMAN DISCRETO COMO CONTROLADOR. . . . . . . . . . . . . . . . . . 775.0.2 CLCULO DA VARINCIA PARA UM SISTEMA DE SEGUNDA ORDEM. . 825.0.3 OBTENO DO CONTROLADOR PID. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 865.0.4 CONTROLADOR LQG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 885.0.5 OBTENO DO PARMETRO Q VARIANTE NO TEMPO . . . . . . . . . . . . . . . . . . . 895.0.6 ANALISES DO FILTRO DE KALAM DE ORDEM SEIS . . . . . . . . . . . . . . . . . . . . . . 90

    6 CONCLUSES E TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

    REFERNCIAS BIBLIOGRFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .101

    ANEXOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106



  • LISTA DE FIGURAS

    2.1 Sistema SISO. [1]............................................................................... 52.2 Sistema MIMO. [1]. ........................................................................... 62.3 Diagrama de blocos de um sistema em varivel de estados [2]. .................... 72.4 Diagrama de blocos do sistema nominal [3]. ............................................ 92.5 Diagrama do pndulo invertido. [4]........................................................ 132.6 Diagrama do corpo livre do sistema [4] .................................................. 142.7 Sada do sistema em malha aberta. ........................................................ 162.8 Sada do sistema em funo do espao de estados para o carro e o pndulo. [4] 182.9 Regulador LQR [?] ............................................................................ 192.10 Sada do sistema para o caso mais simples R=1. ...................................... 212.11 Modificao da entra de referncia [5] .................................................... 212.12 Regulador LQR [5] ............................................................................ 222.13 Projeo do observador [6]................................................................... 232.14 Sada do sistema para o controle LQR modificando a entrada. ..................... 232.15 Projeto LQR com efeito integral. [7] ...................................................... 242.16 Lei de controle, Ganho proporcional e integral. ....................................... 252.17 Diagrama de Blocos do sistema com rudo de estado e medida [8] ................ 292.18 Estados de um filtro de Kalman............................................................. 322.19 Filtro de Kalman com Predio ............................................................. 332.20 Passos para obter o Filtro de Kalman com Predio ................................... 352.21 Comparao de dados com o filtro de kalman........................................... 382.22 Resposta obtida usando o filtro de kalman ............................................... 392.23 Controle LQG [8] .............................................................................. 422.24 Controle LQR discreto [11] .................................................................. 442.25 Sada do sistema para R=1, caso mais simples [11] ................................... 442.26 Sada do sistema com a matriz Q modificada [11] ..................................... 452.27 Esquema com a entrada de referencia modificada [11] ............................... 452.28 Sada do controle LQR. [11] ................................................................ 462.29 (a) Sistema geral (b) Sistema interno (c) Representao da planta do sistema

    (d) Modelo do filtro de Kalman. ............................................................ 472.30 Sada do sistema com controle LQG e filtro de Kalman [11]........................ 482.31 (a) Diagrama de blocos do contole LQG de ordem dois (b) Sada do con-

    trolador LQG de ordem dois. (c) Diagrama de blocos do contole LQG deordem quatro (d) Sada do controlador LQG de ordem quatro. ..................... 49

    3.1 Densidade normal N(, 2) [12] ........................................................... 56

  • 3.2 Ilustrao de funo de autocorrelao de processos aleatrios com flutuaomas lenta e mais rpida [13] ................................................................. 59

    3.3 Caractersticas do rudo branco (A) Densidade espectral de potncia. (B)Funo de autocorrelao [13] .............................................................. 60

    4.1 veculo submarino co sistemas de coordenadas inercial e de corpo rigido. [14]. 674.2 Sistemas de coordenadas de referncia. Retirado de [15] ........................... 684.3 Foras restauradoras do sistema B [16] ................................................... 73

    5.1 Sistema de tanques em serie ................................................................. 775.2 Modelo do sistema de tanques a ser controlado......................................... 795.3 Sada do sistema controlado mediante o FK de segunda e quarta ordem ......... 805.4 Sada do sistema controlado mediante o FK de segunda e quarta ordem com

    rudo no processo ............................................................................... 815.5 Comparao dos ruidos dos FK de ordem dois e quatro .............................. 815.6 Comparao do sistema continuo e discreto. ........................................... 835.7 Varincia do sistema. ......................................................................... 845.8 (a)Diagrama de blocos para os filtros (b) Degrau dos Sistemas. .................... 845.9 Comparao dos ruidos com relao aos filtros. ....................................... 855.10 Comparao dos diagrmas de Bode dos sistemas. ................................... 865.11 Comparao dos diferentes controladores. .............................................. 875.12 Resposta do controlador PID. ............................................................... 885.13 Resposta do controlador LQG. ............................................................. 885.14 Diagrama de blocos para obter a covarincia. .......................................... 895.15 Covarincia Q variavel no tempo. ......................................................... 905.16 Sistema variante e invariante no tempo. .................................................. 915.17 Comparao da sada do sistema sem ruido relao 6x. ............................. 925.18 Comparao da sada do comando relao 15x. ....................................... 925.19 Comparao da sada do sistema com ruido e sem ruido. ........................... 935.20 Comparao da sada com varincia para o sistema com ruido. ................... 935.21 Comparao da sada com varincia para o sistema sem ruido. .................... 945.22 Comparao dos estados do FK variante e invariante no tempo. .................. 945.23 Comparao da sada do controlador PID com FK variante e invariante no

    tempo. ............................................................................................ 955.24 Comparao do diagrama de bode filtro Butterworth com = 1/

    2 e =

    0.2 . ............................................................................................... 965.25 Comparao da sada dos estados do FK com um filtro Butterworth =

    1/

    2 e = 0.2 . ............................................................................... 965.26 Comparao da sada dos estados do FK com um filtro Butterworth = 0.2 . 975.27 Comparao da sada do controlador PID com FK com um filtro Butterworth

    = 0.2. .......................................................................................... 97

  • 5.28 comparao das sadas dos filtros com varincia 0.25 ................................ 985.29 diagrama de blocos dos filtros .............................................................. 985.30 Comparao da sada do Q varivel para sistemas com filtros diferntes ........ 99

  • LISTA DE TABELAS

    4.1 sistema de referncia. Retirado de [17] .................................................. 68

  • LISTA DE SMBOLOS

  • P (A) Probabilidade do evento Afk(n) Frequncia relativa do evento kNk(n) Nmero de ocorrncias do evento KXk Vetor de estados do sistema no instante kWk Rudo de processo no instante de tempo kVk Rudo de medio no instante de tempo kQ Matriz de covarincia do rudo de processoR Matriz de covarincia do rudo de medioE(xk) Valor Esperado do vetor de estados x no instante de tempo kYt Vetor de medies no instante de tempo tN(0, ) Distribuio normal com media 0 e desvio padro K Ganho de Kalmane Erro a priorie+ Erro a posterioriNeff Tamanho efetivo de amostragemik1 Componente inercial no instante k 1Vi Matriz de variao de estadosdHoHi Distncia Bathacharyya entre os histogramas Ho e Hiwi Peso da partcula i-simaHO:k Histograma do objeto no instante kHMP :k Histograma da melhor partcula no instante kHwi.X Histograma da melhor partcula no instante kNf Nmero de frames onde o alvo est presenteA(GT, ST ) Relao entra a sobreposio da rea do ground truth e a rea de sada do

    sistemaSPE Semiplano esquerdoSPD Semiplano direitoMIMO Sistema multiplas entradas multiplas sadasSISO Sistema unica entrada unica sadaLQR Regulador Linear QuadrticoEAR Equao Algbrica de RiccatiFK Filtro de KalmanLQG Regulador Quadrtico GaussianoFB Filtro ButterworthFKV T Filtro de Kalaman Varivel no tempoRGB Red Blue GreenHSV Hue Saturation ValueLBP Local Binary PatternsMB-ELBP Block Multiescale Enchanced Local Binary PatternsEBIM Enchanced Biologically Inspired ModelArs Attentional regionsSIR Sampling Importance ResamplingMB Medida BathacharyyaFPAD Filtro de Partculas com Amostragem DuplaBoBot Bonn Benchmark on trackingWM Windows Matching

  • 1 INTRODUO

    Nas dcadas dos anos 60 e 70, com o surgimento dos computadores digitais que foramas ferramentas para trabalhar para o desenvolvimento do controle em tempo real, e com aintroduo da modelagem atravs da formulao mediante as equaes de estados, surgi-ram tcnicas de controles timos, utilizando os critrios quadrticos LQR (Linear QuadraticRegulator) e LQG (Linear Quadratic Gaussian) [18]. A tcnica que utiliza a estrutura doregulador linear quadrtico (LQR), til quando os estados esto disponveis para realimen-tao, a qual possui excelentes margens de ganho e de fase, mas nada pode ser concludoa respeito de sua robustez paramtrica [18]. A estrutura LQG, por outro lado, no tem ovetor de estados completo para a realimentao, ento este vetor obtido mediante aplica-es de observao aplicando o Filtro de Kalman (FK), sendo por esta razo muito sensvela variaes paramtricas na planta [18].

    A razo fundamental pela que surgem o controle robusto e adaptativo, porque normal-mente quando se tem um sistema em malha fechada ele resulta insensvel a pequenas im-precises do modelo do sistema, como s variaes pequenas da planta, o que pode serocasionado porque muitos sistemas apresentam no linearidades e normalmente tornam ossistemas vulnerveis a todo tipo de perturbaes, capazes de conduzi-los instabilidade aperca do desempenho. As snteses de controle robusto surgem exatamente para preencheresta lacuna dentro da teoria de controle timo. [18].

    O desenvolvimento de tcnicas de controle, fundamental para representar modelos f-sicos reais, permitindo assim desenvolver controladores e testar-los mediante simulao demaneira real, diminuindo a probabilidade de erros nos testes, evitando o uso desnecessriode recursos que possam ser onerosos.

    1.0.1 Objetivo geral

    Desenvolver estratgias de controle adaptativos no tempo que possa associar diferentestcnicas de controle, relacionando o Filtro de Kalman e sistemas estocsticos de maneiraque seja possvel representar o mais aproximado possvel a um sistema real, e que permitagerar diferentes controladores que possam ser adaptados no tempo e que permita controlarsistemas reais.

    1.0.2 Objetivos especficos

    Resolver estratgias de controle do Filtro de Kalman adaptativo no tempo associando aum controle PID;

    1

  • Desenvolver teoria de controle associada ao filtro de Kalman adaptativo;

    Controlar sistemas que apresentem rudos que tenham comportamento Gaussianos e ru-dos com mdia diferente de zero e varincia diferente ao valor unitrio, de maneira quepossa ser projetados controladores baseados na varincia desejada dos sistemas, envol-vendo diferentes filtros e controladores como PID, LQG e Filtro Butterworth.

    2

  • 2 CONCEITOS DE CONTROLE TIMO

    Este captulo vai mostrar alguns conceitos fundamentais que sero usados no desenvolvi-mento do projeto. O captulo inicia mostrando a definio de controlabilidade e observabili-dade de sistemas contnuos e discretos, e continua mostrando de maneira bsica os diferentescontroladores timos como, controle LQR e LQG, e mostra uma comparao do Filtro deKalman variante e invariante no tempo para sistemas simples.

    2.1 CONTROLABILIDADE

    Um sistema linear, contnuo no tempo, dito controlvel, se para qualquer estado inicialx(0) e tempo final t > 0, existe um controle que transfere o estado para qualquer valor de-sejado no tempo t. Um sistema linear, discreto no tempo, dito controlvel se para qualquerestado inicial x0 e tempo final k, existe um controle que transfere o estado para qualquervalor desejado no tempo k. A diferena nas definies para o tempo contnuo e o discreto, que no contnuo a transferncia para qualquer tempo final e no discreto para algum tempofinal [19].

    Outra maneira de verificar a controlabilidade de um sistema, estudando o rango damatriz de controlabilidade M . Se o rango da matriz igual ordem do sistema, o sistema controlvel de estado completo. Usando MATLAB pode ser verificada a controlabilidade daseguinte maneira [20]:

    M = (BAB...An1B) (2.1)

    Em matlab se tem:M = ctrb(A;B) (2.2)

    rank(M) (2.3)

    2.2 OBSERVABILIDADE

    Um sistema contnuo no tempo dito observvel se para qualquer estado inicial x(0) etempo final t > 0 o estado inicial x(0) puder ser unicamente determinado pelo conhecimentode entradas u() e sadas y() para todo [0, t]. J um sistema linear, discreto no tempo, dito observvel se para qualquer estado inicial x(0) e tempo final k o estado inicial x(0)puder ser unicamente determinado pelo conhecimento de entradas ui e sadas y i para todo

    3

  • i[0, k]. Novamente, a diferena nas definies para o tempo contnuo e o discreto, que nocontnuo a transferncia para qualquer tempo final e no discreto para algum tempo final.Se o sistema observvel, o estado inicial pode ser determinado e todos os estados entre oinicial e o final tambm podem ser determinados [19].

    Outra maneira de verificar a observabilidade de um sistema, estudando o rango damatriz de observabilidade N . Se o rango da matriz igual ordem do sistema, o sistema observvel de estado completo. Usando MATLAB, pode ser verificada a observabilidade daseguinte maneira [20]:

    N = [CTATCT ...(AT )n1CT ] (2.4)

    Em matlab se tem:N = obsv(A;C) (2.5)

    Rank(N) (2.6)

    2.3 SISTEMAS DE CONTROLE TIMO

    O controle timo uma tcnica matemtica usada para resolver problemas de otimizaoem sistemas que evoluem no tempo, e que so suscetveis a perturbaes por foras externas.Uma vez o problema tenha sido, resolvido o controle timo define o comportamento paraas variveis de controle, indicando as aes que devero ser tomadas para poder levar totalidade dos sistemas de um estado inicial a um estado final de forma tima [1].

    A teoria de controle timo o conjunto de tcnicas para determinar o controle e as tra-jetrias de um sistema dinmico que minimiza uma funo sobre um intervalo de tempo[1].

    H diversas formulaes para um problema de controle timo, as quais mudam depen-dendo do critrio de otimizao, do tipo de domnio de tempo (contnuo ou discreto), dapresena de diversos tipos de restries, e das variveis que esto livres. A formulao deum problema de controle timo requer em geral de:

    Definir o modelo matemtico do sistema controlado; Especificar o critrio de contorno para o estado; Descreve as restries sobre o estado e o controle; Descrever as variveis do problema que esto livres.

    Quase a totalidade dos problemas de controle timo no pode ser resolvido analitica-mente pelo fato de ser necessrio a aplicao de tcnicas adequadas em procura da respostaadequada [1].

    4

  • 2.4 SISTEMAS DE CONTROLE MULTIVARIVEL

    So processos nos quais a sada varivel controlada, est controlada por uma entradavarivel manipulada; e classificada como sistemas de uma entrada e uma sada SISO.Mas a maioria dos processos na engenharia tem mais de um lao de controle, onde normal-mente cada processo tem pelo menos duas variveis para ser controladas. Os sistemas commais de um lao so classificados como sistemas de mltiplas entradas e mltiplas sadasMIMO ou sistemas multivariveis.Um sistema multivarivel MIMO permite alcanar oobjetivo de manter um conjunto de variveis em um valor desejado. A diferena do controleSISO que s permite controlar uma varivel no tempo [1].

    2.4.1 Sistemas SISO

    Os sistemas SISO so aqueles que tm simplesmente uma entrada e uma nica sada.Desta maneira lgico pensar que para manter a sada desejada do sistema deve ser feitoajustes necessrios entrada e desta forma vai ser obtido o propsito de controle, mas existea necessidade de observar constantemente como a resposta ante as variaes da entrada.Por essa razo surge a necessidade de fechar a malha de controle para monitorar de maneirapermanente a sada do sistema e compar-la com um sinal de referncia a sada desejada [1].

    Na engenharia de controle, geralmente se faz referncia a uma nica entrada e uma nicasada. Os sistemas SISO so menos complexos que os sistemaMIMOMultipleInputMultipleOutput, onde geralmente mais simples projetar a ordem da magnitude. A figura2.1 representa um sistema SISO [1]

    Figura 2.1: Sistema SISO. [1].

    Se,alm disso o sistema se mostrar determinista, invariante no tempo, de uma entrada euma sada (SISO), o modelo de entrada sada ser:

    5

  • y(k) = f(y(k 1), y(k 2), ...y(k n), u(k 1), u(k 2), ...u(k m)) (2.7)

    Onde u(k), y(k) representam o par de entrada-sada no tempo k. O inteiro positivo ne m so o nmero de sadas passadas, tambm chamado ordem do sistema, e o nmero deentradas passadas. Na prtica m , normalmente, menor ou igual ao n. f pode ser qualquerfuno no-linear definida do espao de entradas e sadas passadas at o espao de sadasfuturas [1]

    2.4.2 Sistemas MIMO

    At o momento, s tem se referenciado um sistema de controle simples, o que implicaque so utilizados em processos de menor complexidade, razo pela qual necessrio falarque, na realidade, devem ser usados sistemas mais complexos os quais so denominadossistemas MIMO, onde tem mais de duas entradas, por tanto, diversas sadas, o que fazpossvel controlar diversas variveis [1].

    Figura 2.2: Sistema MIMO. [1].

    A maioria das tcnicas para projetar sistemas de controle se baseia em um bom enten-dimento da planta. Porm, em um nmero de tarefas, a planta a ser controlada muitocomplexa e os processos bsicos internos nela no so compreensveis totalmente. Devidoao pouco conhecimento que se pode ter do sistema, se faz necessrio o uso de tcnicas adap-tativas que permitem controlar o sistema[1].[Gonzales,Bucheli,2011]. A maioria dos proces-sos na engenharia tem mais de um malha de controle. Cada controle requer, normalmente,controlar duas variveis [1].

    Considerando um sistema MIMO com m entradas e n sadas, o qual representadopelo modelo bsico de funo de transferncia y(s) = G(s) u(s), onde y(s) o vetor devariveis controladas de dimenso n1, u(s) o vetor de variveis manipuladas de dimenso

    6

  • m1 e G(s) a matriz funes de transferncia de dimenso nxm, ou em forma matricial setem [1].

    y1(s)

    .

    .

    yn(s)

    nx1

    =

    G11(s) G12(s) .... G1m(s)

    G21(s) G22(s) .... G2m(s)

    . . .

    Gn1(s) Gn2(s) .... Gnm(s)

    nxm

    u1(s)

    .

    .

    un(s)

    mx1

    (2.8)

    2.5 ESPAO DE ESTADOS

    Os mtodos convencionais para projetar um controle so normalmente aplicveis a sis-temas lineares, mas estes mtodos no so eficientes ou no so aplicveis a sistemas decontrole timo e adaptativo. Se estes sistemas apresentam mltiplas entradas e mltiplassadas sistemasMIMO conveniente fazer uma representao em variveis de estados, e oprojeto realizado pelos mtodos modernos para projetar controladores. A figura 2.3 repre-senta um diagrama de blocos do sistema SISO com representao em variveis de estados[2]:

    Figura 2.3: Diagrama de blocos de um sistema em varivel de estados [2].

    2.5.1 Descrio interna de sistemas lineares contnuos amostrados

    A descrio em variveis de estados de um sistema continuo linear de entra e sada nicaSISO [2] :

    7

  • x(t) = Acx(t) +Bcu(t) (2.9)

    y(t) = Ccx(t) +Dcu(t) (2.10)

    X(t) so os estados, u(t) a referncia e y(t) a sada, A,B,C,D so matrizes cons-tantes. A matriz A chamada matriz dinmica, a matriz B chamada matriz de controle, amatriz C chamada matriz de sensores e a matrizD de termos independentes. A funo detransferncia do sistema contnuo calculado usando a expresso que representa a equao2.11

    G(s) = Cc[sI Ac]1Bc +Dc (2.11)As matrizes do equivalente discreto, no espao de estados com perodo de amostragem T ,so:

    A = I + AcT + A2cT

    2/2! + ... = eT (2.12)

    B = (IT + AcT2/2! + A2cT

    3/3! + ...)Bc =

    t0

    eTdt (2.13)

    C = Cc (2.14)

    D = D (2.15)

    A descrio de um sistema discreto equivalente definida como:

    x(k + 1) = Ax(k) +Bu(k) (2.16)

    y(k) = Cx(k) +Du(k) (2.17)

    Partindo desse modelo pode-se obter a funo de transferncia do sistema equivalente dis-creto [2]:

    G(z) = C[zI A]1B +D (2.18)Normalmente, em sistemas fsicos lineares e invariantes D = 0, para realizar os clculos utilizado programas como MATLAB [2].

    2.5.2 Modelo em Espao de Estados para sistemas MIMO

    Um sistema dinmico pode ser tambm escrito por um modelo de espao de estados deordem n de mltiplas entradas e mltiplas sadas MIMO, no-linear e invariante no tempo,tem a forma representado pela equao 2.19 [21]:

    8

  • x(k + 1) = (x(k), u(k))y(k) = (x(k)) (2.19)x(k) = (x1(k), x2(k)....xn(k))

    T

    u(k) = (u1(k), u2(k)....un(k))T

    y(k) = (y1(k), y2(k)....yl(k))T

    (2.20)

    x(k), u(k), ey(k) so o vetor de estados, vetor de entradas e o vetor de sadas, respectiva-mente. Si, o sistema linear, ele representado pela equao:x(k + 1) = Ax(k) +Bu(k)y(k) = cx(k) +Du(k) (2.21)OndeA,B,C,D so matrizes (nxn), (mxn), (nxl)e(mxl) respectivamente. Estas estruturasso teis para projetar sistemas lineares e no lineares [21]

    2.5.3 Diagrama de blocos de um sistema MIMO

    Seja o sistema representado pelo seguinte diagrama de blocos:

    Figura 2.4: Diagrama de blocos do sistema nominal [3].

    Onde ele tem mltiplas entradas e uma s sada, este sistema em malha fechada estvelse, e somente se, os polos de

    CN(s) =gN(s)k(s)

    1 + gN(s)k(s)(2.22)

    9

  • Esto localizados no semiplano esquerdo (SPE) aberto [3]. Uma das maneiras de seestudar a estabilidade do sistema atravs do Critriode Nyquist, que pode ser enunciadoda seguinte forma: Uma condio necessria e suficiente para a estabilidade do sistema emmalha fechada ocorre quando o nmero de voltas do diagrama de Nyquist de gN(s)k(s) emtorno do ponto 1 + j0, no sentido anti-horrio, seja igual ao nmero de polos instveis demalha aberta [22]

    Note que tanto a planta gN(s), quanto o compensador k(s), podem ter polos no semiplanodireito (SPD) [3]. Para o sistema representado, a funo de transferncia :

    y(s) =gN(s)k(s)

    1 + gN(s)k(s)r(s) +

    1

    1 + gN(s)k(s)d(s) gN(s)k(s)

    1 + gN(s)k(s)n(s) (2.23)

    ee(s) =

    1

    1 + gN(s)k(s)r(s) +

    1

    1 + gN(s)k(s)d(s) 1

    1 + gN(s)k(s)n(s) (2.24)

    Nas equaes anteriores pode-se observar que a sada do sistema e o erro dependem das trsentradas (referncia, distrbio e o erro), o qual representa um sistema MIMO.

    2.6 METODOLOGIA DE CONTROLE LQR

    A metodologia do controle LQR pode ser visualizada como uma aplicao particular deum problema de otimizao. Este problema de otimizao e caracterizado pela busca de umvetor de entrada u que minimiza a funo J(.) como mostra a equao 2.25, mas tem comorestrio o modelo do sistema descrito no espao de estados representado na equao 2.26[23]:

    mimuJ(x,Q, u,R) (2.25)

    x = Ax+Bu (2.26)

    Esta formulao chamada de problema de controle timo. No caso do Regulador LinearQuadrtico, o ndice de desempenho J um mapeamento dos espaos dos vetores de estadoe de controle que so ponderados pelas matrizes constantes Q e R, respectivamente [23].Asvantagens do controlador LQR so:

    Obter uma lei de controle em malha fechada [24];

    Os custos de computao so baixos [24];

    Controle robusto com margem de estabilidade garantido e margem de fase grande [24].

    10

  • Como desvantagens da metodologia LQR, est a necessidade de disponibilizao dos estadospara medies da realimentao do sinal de controle, o que normalmente no possvel.Outra desvantagem forte que, para aplicar a tcnica, o sistema no pode ter nem rudo nemperturbaes externas [23].

    2.6.1 Problemas do controle LQR

    O problema do controle LQR em relao a equao algbrica de Riccati (EAR), aescolha das matrizes de ponderao e suas relaes com os mtodos de busca tima. A(EAR) normalmente estvel, pois as matrizes de ponderao e suas condies obedecemrigorosamente as restries que garantem a existncia de uma soluo tima.[23] O LQR formulado por meio de um ndice de desempenho quadrtico e tem como restrio a equaode estado linear invariante no tempo como apresenta a equao 2.27 [23].

    J(t0) =1

    2xT (t)P (t)x(t) +

    1

    2

    Tt0

    xT (t)Q(t)x(t) + uTR(t)u dt (2.27)x = Ax+Bu (2.28)

    Sendo x Rn, e u Rm, o par A,B controlvel, o par A,C observvel, P (T ) 0,Q(T ) 0, e R > 0. Todas simtricas Q Rnxn, e R Rnxm,so matrizes definidas esemidefinidas, positivas respectivamente.[t0, T ], sendo o intervalo de tempo de interesse doproblema [23].

    2.6.2 Soluo do controle LQR

    O propsito do projeto LQR estabelecer uma relao entre as energias do vetor deestado x(t) e do vetor de controle u(t), sendo o sistema em espao de estados representadonas equaes 2.29 e 2.30 [8]:

    X = Ax+Bu (2.29)

    y = Cx+Du (2.30)

    O objetivo do trabalho e a determinao da lei de controle u(t) que minimiza a funo decusto quadrtica, tambm conhecida como ndice de desempenho quadrtico a ser minimi-zada, com os limites de integrao entre 0 e representada pela equao 2.31 [8]:

    J = mimu(t)

    0

    x(t)Q(t)x(t) + u(t)R(t)u(t) dt (2.31)A lei de controle estabelecida tem como parmetros as matrizes de ponderaoQ Rnxn

    de estado simtrica, semi-definida positiva (Q 0) e de controle Q Rmxm simtrica edefinida positiva (R > 0) [8].Se o sistema estvel, a lei de controle que estabiliza o sistemae minimiza o critrio, dada pela equao 2.32:

    u(t) = kx(t) (2.32)

    11

  • Sendo K uma matriz de tamanho rxn, como apresenta a equao 2.33:u1

    u2...ur

    =k1 k12 . . . k1n

    k21 k22 . . . k2n...

    ...kr1 kr2 . . . krn

    x1

    x2...xn

    (2.33)Assim, o projeto de controle timo se reduz determinao dos elementos da matriz derealimentao de estado K tima, qualquer que seja o estado inicial [8], representado pelaequao 2.34:

    K = R1BTP (2.34)

    Sendo P uma matriz definida positiva obtida da soluo da equao de Ricatti, representadapela equao 2.35:

    AP + AP PBR1BP +Q = 0 (2.35)

    2.6.3 Eleio das matrizes Q e R.

    No existem regras que possam ser utilizadas de forma geral para a eleio das matrizes Qe R. Uma forma simples escolher Q e R diagonais, adicionando valores grandes aos valoresque se desejam minimizar. Mas sempre os valores das matrizes Q e R devem ser positivos ouzero [25]. A informao conhecida do sistema torna-se fundamental na eleio das matrizes;mesmo assim necessrio calcular diferentes controladores, baseados nos distintos valoresassumidos nas matrizes Q e R verificando sua efetividade mediante simulao. [25] Umavantagem importante do projeto LQR que, independentemente da eleio das matrizes Q eR, mantido a estabilidade assinttica e robustez do controle. [25]

    2.6.4 Exemplo da projeo do controle LQR

    Deseja-se controlar a posio de um carro e o ngulo de um pndulo invertido, comoapresenta a figura 2.5. [4]:

    Onde:

    M Massa do carro.

    m Massa de pndulo

    b Atrito do carro

    l Comprimento do centro do massa ao pndulo

    I Inrcia do pndulo

    F Fora aplicada ao carro

    12

  • Figura 2.5: Diagrama do pndulo invertido. [4]

    x Coordenadas da posio do carro

    ngulo do pndulo em relao vertical.

    O exemplo apresentado permite a simulao do comportamento fsico de um sistemadinmico que evolui no tempo. O objetivo projetar um sistema de controle timo quepermita a estabilizao do pndulo invertido, o qual esta localizado na parte superior docarro, como apresenta a figura 2.5 [4].

    2.6.5 Modelagem matemtica do pndulo

    NO pndulo invertido pode-se considerar um corpo slido, onde seu movimento li-mitado em duas dimenses. A figura 2.6 representa o modelo do corpo livre do sistema, es equaes fundamentais do movimento no plano do corpo slido so representadas pelasequaes 2.36, 2.37 e 2.38: [4]:

    i=0

    Fi = mai (2.36)

    j=0

    Fj = maj (2.37)

    i=0

    FG = mi (2.38)

    Somando as foras do corpo livre do carro, horizontalmente, a equao de movimento representada pela equao 2.39:

    Mx+ bx+N = F (2.39)

    13

  • Figura 2.6: Diagrama do corpo livre do sistema [4]

    Do diagrama do corpo livre do pndulo, tem-se a equao 2.40:

    N = mx+ml cos ml2 sin (2.40)

    Substituindo a equao 2.39, na equao 2.40 tem-se a equao 2.41:

    F = (M +m)x+ bx+mlcos ml2 sin (2.41)

    Somando as foras perpendiculares do pndulo, tem-se a equao 2.42:

    Pl sin +Nl cos mg sin = ml +mxcos (2.42)

    Dos momentos do centroide do pndulo so obtidas as equaes 2.43 e 2.44:

    Pl sin Nl cos = I (2.43)

    (I +ml2) +mgl sin = mlx cos (2.44)Linearizando os termos, as equaes do movimento so representadas nas equaes 2.45 e2.46:

    (I +ml2)mgl = mlx (2.45)(M +m)x+ bxml = u (2.46)

    2.6.6 Funo de transferncia

    O objetivo da representao da funo de transferncia do sistema, obter o sistemaem relao da entrada e sada do sistema, isto feito mediante aplicao a transformada deLaplace as equaes 2.45 e 2.46 linearizadas, assim as equaes 2.47 e 2.48 representam osistema:

    (I +ml2)(s)s2 mg(s) = mlX(s)s2 (2.47)

    14

  • (M +m)X(s)s2 + bX(s)sml(s)s2 = U(s) (2.48)Da equao 2.47, tem-se a equao 2.49:

    X(s) =[(I +ml2)s2 mgl](s)

    mls2(2.49)

    Substituindo a 2.49, na equao 2.48 tem-se a equao 2.50:

    [(M +m)s2 + bs][(I +ml2)s2 mgl](s)

    mls2ml(s)s2 = U(s) (2.50)

    Onde o sistema geral de sada, em funo da entrada, representado pela equao 2.52:

    (s)[(M +m)(I +ml2)s4 mgl(M +m)s2 + b(I +ml2)s3 mglbs (ml)2s4]= mls2U(s)

    (2.51)

    (s)[(M +m)(I +ml2)s4 mgl(M +m)s2 + b(I +ml2)s3 mglbs (ml)2s4]= mls2U(s)

    (2.52)

    Com:q = ((M +m)(I +ml2) (ml)2) (2.53)

    Ento a funo de transferncia representada pela equao 2.55, onde ela mostra a sada dosistema em malha aberta para uma entrada impulso como apresenta a figura 2.7.

    (s)

    U(s)=

    mls2

    q

    [s4 + b(I+ml2)s3

    q mgl(M+m)s2

    q mglbs

    q]

    (2.54)

    (s)

    U(s)=

    mlsq

    [s3 + b(I+ml2)s3

    q mgl(M+m)

    q mglb

    q]

    (2.55)

    2.6.7 Modelo em espao de estados

    Como a representao de um sistema em espao dada pelas equaes 2.56 e 2.57:

    X = Ax+Bu (2.56)

    y = Cx+Du (2.57)

    onde:

    x o estado do sistema de ordem n;

    15

  • Figura 2.7: Sada do sistema em malha aberta.

    u o vetor de entradas dos m elementos;

    y o vetor de sadas dos p elementos;

    A a matriz do sistema de tamanho nxn;

    B a matriz de entradas de tamanho nxm;

    C a matriz sadas de tamanho pxn;

    D uma matriz tamanho pxm.

    A vantagem da representao de espao de estados fundamentada em conhecer o com-portamento interno do sistema, alm de isso, permite trabalhar com condies iniciais di-ferente de zero e facilitar o desenho e representao do sistema mediante software[4]. Dasequaes 2.45 e 2.46, substituindo a equao 2.45 na equao 2.46, tem-se a equao 2.59:

    (M +m)

    ml((I +ml2)xmgl) + bxml = u (2.58)

    ((M +m)(I +ml2) (ml)2)mgl(M +m)+mlbx = mlu (2.59)Substituindo a equao 2.53 na equao 2.59: tem-se a equao 2.60:

    =mlu

    q+mgl(M +m)

    q mlbx

    q(2.60)

    Fazendo o mesmo procedimento para a outra equao, substituindo a equao 2.46 na equa-o 2.45 tem-se a equao 2.64:

    (I +ml2)

    ml((M +m)x) + bx u)mgl = mlx (2.61)

    16

  • (I +ml2)(M +m)x+ b(I +ml2)x (I +ml2)u (ml)2g = (ml)2x (2.62)((I +ml2)(M +m) (ml)2)x = (I +ml2)u+ (ml)2g b(I +ml2)x (2.63)

    Ento:

    x =(I +ml2)

    q+

    (ml)2g

    q b(I +ml

    2)x

    q(2.64)

    Mediante as transformaes seguintes obtido o modelo de espao de estados:

    x1 = x

    x2 = x1 = x

    x2 = x1 = x

    x3 =

    x4 = x3 =

    x4 =

    Ento:

    x = x2

    x2 =(ml)2gu

    q+ (ml)

    2gx3q b(I+ml2)x2

    q

    x3 = x4

    x4 =(ml)uq

    + mgl(M+m)x3q

    mlbx2q

    Assim, a representao em espao de estados mostrada nas equaes 2.65 e 2.66:x1

    x2

    x3

    x4

    =

    0 1 0 0

    0 b(I+ml2)q

    (ml)2gq

    0

    0 0 0 1

    0 mlbq

    mgl(M+m)q

    0

    x1

    x2

    x3

    x4

    +

    0g(ml)q

    0mlq

    u (2.65)

    y =

    [1 0 0 0

    0 0 1 0

    ]x1

    x2

    x3

    x4

    (2.66)Substituindo os seguintes parmetros numricos para a realizao das simulaes do sis-

    tema:

    M = 0.5kg

    m = 0.2kg

    b = Ns/m

    l = 0.3m

    17

  • I = 0.006kgm2

    g = 9.8m/s2

    obtido o sistema em espao de estados de forma numrica o qual representado pelasequaes 2.67 e 2.68:

    x1

    x2

    x3

    x4

    =

    0 1 0 0

    0 0.1818 2.6727 00 0 0 1

    0 0.4545 31.1818 0

    x1

    x2

    x3

    x4

    +

    0

    1.8182

    0

    4.5455

    u (2.67)

    y =

    [1 0 0 0

    0 0 1 0

    ]x1

    x2

    x3

    x4

    (2.68)Como o sistema tem mltiplas sadas, o objetivo controlar o ngulo do pndulo e a posiodo carro, baseados nos seguintes requerimentos do desenho [4]:

    Tempo de estabilizao de x e menor a 5s.

    Tempo de impulso mximo menor aos 0.5s.

    Sobre sinal de menor aos 20 graus.

    Para uma entrada degrau de 0.2m tem-se:

    Figura 2.8: Sada do sistema em funo do espao de estados para o carro e o pndulo. [4]

    Na figura 2.8 , os asteriscos representam a posio do carro. A figura representada porcrculos mostra o ngulo. Ento pode-se analisar que para melhorar a dinmica do sistematem que se projetar um controle, neste caso, ser projetado um controle LQR[4].

    18

  • 2.6.8 Regulador LQR

    A vantagem de ter um sistema representado em espao de estados que a projeo deum controlador LQR resulta simples. A ideia estabelecer uma retroalimentao completamediante uma combinao linear das variveis de estado. Para o caso ideal, a realidade que o estado medido no completo, pelo qual necessria a utilizao de um observadorde ordem reduzido para fazer a estimao da parte do estado. Para este caso assumido quetodos os estados so medveis [4], ento a representao a mostrada na figura 2.9:

    Figura 2.9: Regulador LQR [?]

    Na figura 2.9 pode-se observar uma representao do algoritmo de controle. K a ma-triz de retroalimentao para obter o sinal de controle, onde u(k) = Kx(k). Precisa-seencontrar o valor deK que determina o valor da lei de controle de realimentao o qual podeser feito de muitas formas [4]:

    A primeira opo inserir arbitrariamente o valor dos plos que deseja-se que o sistematenha, em malha fechada.

    A segunda opo fazer um controle timo varivel no tempo.

    Para a segunda opo trata-se de minimizar a funo representada pela equao 2.69

    J =Nk=0

    [xT (k)Q(t)x(k) + uT (k)R(x)u(x)] (2.69)

    J uma funo que geralmente est associada com a energia do sistema. O controle timo porque o objetivo minimizar a energia. A expresso XTn (k)QXn(k) representaa energia aportada para cada estado Q uma matriz no negativa definida. A importnciade Q que permite a eleio do peso que tem cada estado da funo J . Como o estadou(k) tem um s elemento,R 0 um elemento que indica o peso que deseja-se dar

    19

  • energia associada com o sinal de controle, se por exemplo, a funo tem as caractersticasrepresentada na equao 2.70:

    Xn(k + 1) = AdXn(k) +Bdu(k) (2.70)

    Para dar soluo a equao anterior, preciso de mtodos numricos. A soluo resul-tante uma lei de controle varivel no tempo como apresenta a equao 2.71:

    u(k)K(k)Xn(k) (2.71)

    Se o sistema tem coeficientes constantes, K(k) fixado durante o perodo de tempo eposteriormente converge para zero [4]. O valor exato de J no relevante, s pretendidoencontrar um valor de K que permita obter o mnimo valor para J . A importncia est novalor relativo que tem os elementos Q e R entre eles. Estes parmetros so os encarregadosde balancear a importncia relativa da entrada e os estados em relao ao sistema que sepretende otimizar. O caso mais simples para um valor de R = 1 obter um valor de Q, emrelao ao valor de R [4].

    2.6.9 Projeo do controlador em espao de estados

    Baseados nas condies de desenho apresentadas anteriormente, adicionando o erro emestado estacionrio, que menor ao 2 por cento. [4]. Para projetar o regulador utilizada afuno LQR que produz um controlador timo, isso feito mediante MATLAB, onde podeser escolhidos os parmetros R e Q. Para o caso mais simples as escolhas so: R = 1, ondeQ = C C. O mtodo LQR vai permitir encontrar as duas sadas, para obter uma respostadesejvel, permitindo que o controle possa ser sintonizado mudando os elementos no nulosda matriz Q [4]. Para esta condio o valor da matriz Q, mostrada na equao 2.72:

    Q =

    1 0 0 0

    0 0 0 0

    0 0 1 0

    0 0 0 0

    (2.72)

    k =1.0000 1.6567 18.6854 3.4594

    Mediante a utilizao de MATLAB, fazendo a representao do sistema, obtida a sadacomo mostrado na figura 2.10:

    Na figura 2.10, a figura representada pelos asteriscos mostra o ngulo do pndulo emradiais, e a figura dos crculos representa a posio do carro em metros. Como pode-se ob-servar os resultados obtidos representados pela figura 2.10 no so timos, Adicionalmente,pode-se observar que o carro no esta prximo da posio desejada, dado que est se movi-mentado na direo oposta [4], o que faz que no sistema, em malha fechada, no possa ser

    20

  • Figura 2.10: Sada do sistema para o caso mais simples R=1.

    realizada a comparao da sada diretamente com a referncia para obter o resultado dese-jado,neste caso necessrio dimensionar a entrada de referncia, de modo que a sada sejaigual referncia. Isso pode ser feito atravs da introduo de um fator de escala N , naentrada de referncia do sistema [5], como apresenta figura2.27:

    Figura 2.11: Modificao da entra de referncia [5]

    Agora, com o tempo de subida e estabilizao pode ser resolvido mudando os valoresdas variveis no nulas da matriz Q. Com isso pode-se melhorar os tempos de estabilizao,[4], por exemplo para a matriz representada pela equao 2.73:

    Q =

    5000 0 0 0

    0 0 0 0

    0 0 100 0

    0 0 0 0

    (2.73)

    21

  • k =70.7107 37.8345 105.5298 20.9238

    Figura 2.12: Regulador LQR [5]

    A figura 2.12 mostra o incremento dos valores da matriz Q, onde a resposta melhorada,e ainda pode ser melhorar, mas os esforos vo ser maiores do controle projetado, assimpode-se cumprir com o objetivo desejado que obter um tempo de estabilizao menor aos2s para a posio do carro e o ngulo do pndulo [4].

    2.6.10 Projeo do observador

    Para a implementao da realimentao completa de estados, necessrio adicionar umdispositivo dinmico, chamado observador, o estimador de estados, onde a sada um esti-mador do vetor de estados, pelo qual a ordem do observador completo tem a mesma ordemda planta [4], ou seja, estimado todo o vetor de estados, para o sistema representado nasequaes (espao de estados), onde A,B,C so conhecidas e a entrada u(t) e a sada y(t)so medveis, mas no o estado x(t), como mostra a figura 2.13 [6]:

    Assim, para iniciar o trabalho, preciso conhecer os polos do sistema controlado. Paraeste exemplo, os polos mudam os parmetros da matrizQ, como foi dito anteriormente,entoeles so [4]:

    p = 8.491 + 7.9283i 8.491 7.9283i 4.7592 + 0.839i 4.7592 0.839i

    Pode se perceber que os polos do sistema so diferentes. Deseja-se projetar um estimador queseja 10 vezes mais rpido que o menor dos polos. Como existem quatro polos, com a ajudado MATLAB, mediante o comando PLACE, pode-se obter o observador. Este comandoprecisa de polos diferentes, ento:

    P = [40 41 42 43]

    22

  • Figura 2.13: Projeo do observador [6]

    L = place(A, C , P )

    Onde: L o observador e P os polos inseridos ao sistema. Mediante a combinao docontrolador e observador, obtida a resposta que apresenta a figura 2.14:

    Figura 2.14: Sada do sistema para o controle LQR modificando a entrada.

    Na figura 2.14 pode-se observar que o erro esttico fica dentro dos limites esperados,obtendo a amplitude desejada mediante a utilizao da matriz de pr-compensao, satisfa-zendo os requisitos de desenho impostos [4].

    23

  • 2.6.11 LQR com ao integral

    Dado que o controle LQR tem o problema de no ser robusto quando o sistema temperturbaes, para dar soluo ao problema e conseguir um controlador que rejeite perturba-es, necessrio adicionar ao projeto LQR um efeito integral que afete o erro das variveisdo modelo. O efeito integral tem como funcionalidade integrar o erro dos estados afetadospelas perturbaes [26]; as razes so:

    A lei de controle LQR U = kx, responde essencialmente a um controle proporcional,dado que o controle proporcional origina efeitos do erro estacionrio no caso de existirperturbaes no sistema de controle [26].

    O modelo do sistema utiliza clculo dos valores do ponto do trabalho (X,U), onde osistema pode apresentar desvios importantes com relao planta ( quedas de tenso emsemi-condutores, desvio dos valores de componentes passivos, etc) [26]. Estes desviosgeram perturbaes no sistema de controle e erro estacionrio [26].

    Qual quer perturbao existente na planta gera erro estacionrio que o controle proporci-onal no pode corrigir [26].

    Para o projeto LQR deve ser corrigidos os erros em estado permanente e estacionrio,como conhecido da teoria de controle clssico, incorporando ao sistema uma parte integral,permitindo rechaar assintoticamente as perturbaes [26], como apresenta a figura 2.15 [7]:

    Figura 2.15: Projeto LQR com efeito integral. [7]

    Seja o sistema apresentado nas equaes 2.29 e 2.30, com C = I , considerando umsistema de ordem trs, pode-se representar como apresenta a equao 2.74

    24

  • x1x2x3

    =a11 a12 a13a21 a22 a23a31 a32 a33

    x1x2x3

    +b11 b12 b13b21 b22 b23b31 b32 b33

    u1u2u3

    (2.74)A parte integral pode ser implementada para eliminar o erro estacionrio em todas ou s

    algumas variveis de estado. Por exemplo, deseja-se adicionar parte integral aos estados x1e x2. necessrio incrementar a ordem com dois novos estados Ix1, Ix2 que so as integraisdos estados sobre os que deseja-se adicionar ao integral, [27] [28].

    Ix1 =

    x1 dIx1

    dt= x1 (2.75)

    Ix2 =

    x2 dIx2

    dt= x2 (2.76)

    x1

    x2

    x3

    Ix1

    Ix2

    =a11 a12 a13 0 0

    a21 a22 a23 0 0

    a31 a32 a33 0 0

    1 0 0 0 0

    0 1 0 0 0

    x1

    x2

    x3

    Ix1

    Ix2

    +b11 b12 b13

    b21 b22 b23

    b31 b32 b33

    0 0 0

    0 0 0

    u1u2u3

    (2.77)

    Baseados no novo sistema necessrio definir as novas matrizes Q e R da funo decuste, a qual tambm aumenta sua dimenso.Os termos das matrizes relacionadas com osestados originais condicionam a parte proporcional do controlador [26], o clculo da matrizLQR desenvolvido no MATLAB.

    Para o exemplo proposto a matriz de controle que resultaria ao aplicar a lei de controleLQR tem a forma apresentada na figura 2.16.

    Figura 2.16: Lei de controle, Ganho proporcional e integral.

    2.6.12 Robustez do controle LQR

    O controle LQR garante estabilidade, um controle robusto, apresenta um margem defase mnimo de 60, um margem de ganho crescente infinito, e um margem de ganho decres-

    25

  • cente de 0.5 . O que garante que o sistema em malha fechada com controle LQR seja estvelpara qualquer incremento no ganho, e para todos os ganhos superiores metade do valornominal do projeto. [27]

    A adio da parte integral elimina os erros de regime permanente ocasionado pelas per-turbaes, adicionalmente proporciona robustez frente s variaes dos parmetros do mo-delo do sistema.

    A parte integral importante nos casos que o modelo precise de pequenos sinais no cl-culo do controlador LQR, onde o modelo depende do ponto de trabalho, o erro causado aoprojetar um controle longe do ponto do trabalho pode ser cancelado mediante a implementa-o da ao integral, se analisada a robustez do projeto LQR a ao integral permite obtererro estacionrio nulo, mesmo o modelo apresente erros grandes [29].

    Outra vantagem do controle LQR em relao a sua robustez que apresenta uma sensi-bilidade inferior ou igual a unidade para toda o margem de frequncias. Assim supor que afuno de transferncia do sistema completo tem uma variao mnima em relao variaodos elementos do sistema, para qualquer frequncia [29].

    2.7 FILTRO DE KALMAN FK

    No ano de 1960, Rudolph. E. Kalman publicou um trabalho que descreve uma soluode maneira recursiva para o problema de filtragem de dados discretos em sistemas lineares.O trabalho mostra que partindo de alguns valores iniciais, pode ser predito e ajustados osparmetros de modelos atravs de cada nova medio, obtendo a estimativa do erro em cadaatualizao. A sua habilidade para incorporar os efeitos de erros e sua estrutura computa-cional fez com que o FK tivesse um amplo campo de aplicaes, especialmente no que serefere anlise de trajetrias em viso computacional, controle de sistemas dinmicos de-vido a que o filtro permite analisar sistemas que esto expostos a rudos e perturbaes queso analisadas de maneira estocstica, por isso teoricamente, o filtro de Kalman conhecidocomo um estimador para o que chamado Problema Quadrtico Linear, que o problemade estimar o estado instantneo de um sistema linear perturbado por um rudo branco [10].

    Existem muitas definies do FK, mas basicamente um algoritmo recursivo muito efici-ente. E sua utilizao baseada na estimativa das variveis de estado de sistemas representa-dos por equaes de estado lineares. Quase sempre considerado que o sistema perturbadopor rudos brancos e Gaussianos, de forma que os estados possam ser tratados como variveisaleatrias Gaussianas.

    Os mtodos de resoluo mediante a teria do FK permitem a utilizao de uma esti-mativa recursiva na qual a informao a priori sobre o estado estimado se combina com asmedida para atualizar o parmetro estimado [30]. O FK pode-se estimar de forma continua

    26

  • ou discreta.

    O FK comunmente aplicado para dar soluo aos problemas em filtragem e estimaode sistemas MIMO, pelo fato que ele tem mltiplas entradas e mltiplas sadas quandose esta usado como um observador de estados, o FK um algoritmo de processamentode dados timos recursivos, timo porque minimiza um critrio e porque incorpora toda ainformao que subministrada para determinar a filtragem, e recursivo porque no precisamanter os dados prvios, o que facilita sua implementao em sistemas de processamentoem tempo real. Este algoritmo de processamento de dados pelo fato que foi projetado paraser usado em sistemas discretos o objetivo do FK estimar o estado de maneira tima, demaneira que possa ser minimizado o ndice de erro quadrtico meio [1].

    2.7.1 Algoritmo discreto do filtro de Kalman

    O Filtro projetado supondo que o sistema pode ser descrito por meio de um modeloestocstico linear, onde o erro associado tanto ao sistema como informao adicional que incorporado em ele mesmo, tem uma distribuio normal com mdia zero e varinciadeterminada [1].

    A soluo tima pelo fato que o filtro combina toda a informao observada e o co-nhecimento prvio do comportamento do sistema para produzir uma estimativa do estado demaneira que o erro minimizado estatisticamente. O termo recursivo faz referncia a que ofiltro recalcula a soluo a cada nova observao ou medida incorporada ao sistema [1].

    O FK o principal algoritmo para estimar sistema dinmico representado em forma deespao de estados, em este representao o sistema descrito pelo conjunto de variveis de-nominadas de estados. Os estados contem toda a informao relativa ao sistema em instantesespecficos de tempo. Esta informao deve permitir a inferncia do comportamento passadodo sistema, com o objetivo de predizer seu comportamento futuro [1].

    O que faz o filtro interessante precisamente a habilidade para predizer o estado de umsistema no passado, presente e futuro, mesmo quando a natureza do sistema modelado sejadesconhecida. Na pratica, as variveis do estado individual de um sistema dinmico nopode ser exatamente determinadas pela medio direta. Pelo qual sua medio feita pelosprocessos estocsticos que envolvem algum grau de incerteza na medio [1].

    Os modelos em forma de espao de estados de processos aleatrios esto baseados nachamada propriedade de Markov, segundo esta propriedade, o futuro do processo comrespeito ao passado independente, sempre que no seja conhecido o estado presente. Emum sistema deste tipo o estado do processo resume toda a informao relativa ao passadoque resulta relevante para predizer o futuro[1].

    O FK o principal algoritmo para estimar sistemas dinmicos especificados em formade espao de estados. Estes modelos so essencialmente uma notao conveniente para abor-

    27

  • dar a manipulao de um amplo rango de modelos. Na estimao e controle de problemas,esta metodologia baseada em modelos estocsticos, dado o suposto da natureza errada dasmedies [1].

    2.7.2 Algoritmo do filtro de Kalman

    O algoritmo do FK pode ser explicado como uma forma de controle realimentado [31],onde a funcionalidade do filtro baseada estimando o estado de um processo em alguminstante de tempo k, assim o sistema realimentado obtm uma resposta medidaruidosa,desta maneira, as equaes do FK podem ser divididas em dois grupos:

    Equaes para a atualizao do tempo ;

    Equaes para a atualizao da medida.

    As equaes para a atualizao do tempo projetam no tempo o estado atual e a varinciado erro para obter a estimativa a priori para o seguinte estado k+ 1. As equaes para a atu-alizao da medida so responsveis da realimentao, ou seja, incorporam a nova medioe a estimativa a priori usada para obter uma estimativa a posteriori melhorada [32].

    2.7.3 Caractersticas do filtro de Kalman

    O FK implementvel, na forma discreta em um um computador digital, permitindoeconomizar recursos e uma melhor resposta que a obtida com um filtro analgico [10].

    O FK no exige o conhecimento da dinmicas determinsticas de um sistema, normal-mente os processos aleatrios so analisados de maneira estacionria, e muitas aplicaes deimportncia incluem processos estocsticos no estacionrios[10].

    O FK compatvel com a formulao matemticas de sistemas dinmicos em espao deestados, assim permite a implementao de controladores opcionais para sistemas dinmicos.[10].

    A descrio matemtica do FK apresenta a vantagem sob outros filtros como o filtro deWiener , que sua representao matemtica mais simples, obtendo assim timos resultadospelo qual sua implementao superior no maior dos casos e uma ferramenta muito utili-zada para estudantes de engenharia [10]. o FK fornece as informaes matemtica necessriapara detectar estatisticamente e rejeitar medies anmalas [10].

    2.7.4 Filtro de Kalman Continua

    O FK um mtodo de estimao utilizado para obter estimativas timas das variveis deestado de um sistema dinmico, de maneira que o erro minimizado estatisticamente. Sejaa planta definida como apresentam as equaes 2.78 e 2.79 [8]:

    28

  • x(t) = Ax(t) +Bu(t) +Gv(t) (2.78)

    y(t) = Cx(t) + w(t) (2.79)

    Sendo x(t) Rn o vetor de estados, u(t) Rm e y(t) Rq so os vetores de entrada ede sada, respectivamente, A Rnxn, B Rnxm e C Rqxn, so matrizes que representamo modelo do sistema, w(t) Rn o rudo do processo, v(t) Rq o rudo de medida, que sosinais no correlacionados, ambos so rudos brancos Gaussianos com mdia zero e matrizesde covarincias W e V , respectivamente [8], como mostram as equaes 2.80 e 2.81:

    E{w(t)w(t)

    }

    = W 0 (2.80)

    E{v(t)v(t)

    }

    = V > 0 (2.81)

    Sendo W a matriz de covarincia do rudo no estado positiva semi-definida, V a matriz decovarincia do rudo de medida positiva definida. Adicionalmente assumido o rudo dossinais como no correlacionado entre si, como apresenta a equao 2.83 [8].

    E {w(t)v(t)} = 0 (2.82)

    E {v(t)w(t)} = 0 (2.83)

    O sistema anterior pode ser representado no diagrama de blocos da Figura 2.17.

    Figura 2.17: Diagrama de Blocos do sistema com rudo de estado e medida [8]

    O problema a ser resolvido consiste em:

    Obter-se uma estimativa x(t) do estado x(t), partindo da observao da sada y(t) [8].

    29

  • A estrutura de um FK semelhante ao de um observador de estados [8].

    A dinmica do FK dada pela equao 2.84 [8]:

    x(t) = Ax(t) +Bu(t) + L(t)(y(t) Cx(t)) (2.84)

    O erro entre x(t), e x(t) dado pela equao 2.85 [33]:

    e(t) = x(t) x(t) (2.85)

    Substituindo a equao 2.79 na equao 2.84 o FK pode-se representar como apresenta aequao 2.86 [8]:

    x(t) = (A L(t)C)x(t) + wu(t) L(t)v(t) (2.86)Assim o FK um sistema dinmico, onde a matriz de ganho timo L(t) representada pelaequao 2.87 [8].

    L(t) = SC V 1 (2.87)

    Sendo S a nica soluo simtrica definida positiva da equao Algbrica de Riccati, a qual representada pela equao 2.88 [8].

    SA + AS SC V 1CS +W = 0 (2.88)

    Onde o FK deve cumprir que [8]:

    Re[1(A L(t))] < 0, (i = 1, 2, ..., n)

    Ento a estimativa gerada pelo filtro e tima no sentido que a varincia do erro de estimaoseja mnima, como apresenta a equao 2.89 [8]:

    min

    ni=1

    E {[xi(t) x(t)]} (2.89)

    2.7.5 Exemplo filtro de Kalman continuo

    Seja o sistema descrito em espao de estado representado pelas equaes 2.90 e 2.91

    x =

    [4 22 4

    ]x+

    [1

    1

    ]v (2.90)

    y =[1 0

    ]x+ w (2.91)

    Onde o termo do rudo v(t) tem mdia zero e covarincia V = 0.09. O rudo da medio assumido com mdia zero e covarincia W = 0.025. O objetivo encontrar a matriz de ga-nho otimo baseada na matriz que minimiza a equao de Riccati 2.91 [34]. Se o estado inicial

    da planta x(0) =[0.5 05

    ]T, com covarincia de estado inicial S0 = I2x2. Baseando-se no

    30

  • modelo de espao de estado apresentado na equao 2.78, para descrever o comportamentodo FK do sistema, como foi mostrado nas equaes 2.86 2.88, Substituindo os parmetrosdas matrizes do sistema em espao de estado tem-se as equaes 2.92 2.94.

    x =

    [4 22 4

    ]x+

    [1

    1

    ]v + L(t)(y(t)

    [1 0

    ]x(t)) (2.92)

    L(t) =

    [S1 S2

    S2 S3

    ] [1 0

    ]T(0.25)1 (2.93)

    [S1 S2

    S2 S3

    ]=

    [4 22 4

    ][P1 P2

    P2 S3

    ]+

    [S1 S2

    S2 S3

    ][4 22 4

    ]T

    [S1 S2

    S2 S3

    ] [1 0

    ]T(0.25)1

    [1 0

    ] [S1 S2S2 S3

    ][

    1

    1

    ](0.09)

    [1

    1

    ]T (2.94)

    Para dar soluo equao 2.94, a qual uma soluo numrica foi utilizado comoferramenta o software MATLAB. Obtendo assim a soluo da equao de Riccati comorepresentam a equao 2.95:

    S =

    [0.0066 0.00880.0088 0.0153

    ](2.95)

    Ento o ganho timo dado pela equao 2.96.

    L(t) =

    [0.0066 0.00880.0088 0.0153

    ] [1 0

    ]T(0.25)1 =

    [0.264

    0.352

    ](2.96)

    2.7.6 Filtro de Kalman discretro

    Seja o seguinte sistema discreto representado pelas equaes 2.97 e 2.98 [35]:

    xk+1 = Axk +Buk +Gvk (2.97)

    yk = Cxk + wk (2.98)

    As novas sinais de entrada vk e wk, so processos aleatrias considerados rudos brancoS es-tacionrio com mdia zero e no correlacionados entre si, pelo qual apresentam as seguintespropriedades [34]:

    E {vk} = E {wk} = 0,j, kE{vTk vk

    }= Q

    E{vTk vj

    }= 0

    E{vTj wk

    }= 0,j, k

    E{vTj wk

    }= 0,j, k

    E{wTk wj

    }= 0,k 6= j

    E{wTk wk

    }= R

    31

  • Assim a matriz de covarincia conjunta pode ser expresada como mostra a equao 2.99:

    E[

    (wk

    vk

    )(wTk v

    Tk

    )] =

    Qk 00 Rk (2.99)

    Assim que o problema pode ser abordado de trs formas diferentes:

    Predio obtida a estimativa x(k+1) conhecendo as medidas y(0), y(1), y(2), ..., y(k)

    Filtragem Se obter a estimativa x(k) conhecendo as medidas y(0), y(1), y(2), ..., y(k)

    Alisado obtida a estimativa x(k1) conhecendo as medidas y(0), y(1), y(2), ..., y(k)

    Figura 2.18: Estados de um filtro de Kalman

    O critrio para obter o timo minimizar o ndice de comportamento

    P (n) = E[e(n)eT (n)

    ](2.100)

    Com n = k+ 1, n = k e n = k1, independente da etapa de filtragem, predio ou alisado,a matriz de covarincia do erro e(k) minimizada.

    e(k) = x(k) x(k) (2.101)

    Quando a matriz de covarincia P (k) minimizada, qualquer forma quadrtica

    TP (k) (2.102)

    minimizada sendo um vetor arbitrrio de ordem nx1. assumido que o estado inicialX(0) se conhece seu valor esperado ou valor mdio.

    E [x(0)] = x(0) (2.103)

    Que um valor determinstico, alm disso, se conhece a matriz de covarincia do estadoinicial

    E[[x(0) x(0)] [x(0) x(0)]T

    ]= P0 (2.104)

    32

  • O estado inicial e o rudo cumprem

    E[[x(0) x(0)] vT (k)] = E [[x(0) x(0)]wT (k)] = 0 (2.105)

    Onde so independentes, brancos e de media zero.

    2.7.7 Filtro de kalman (predio)

    Assumidas todas as condies anteriores, o objetivo determinar a estimao x(k + 1) ,conhecendo as medias contaminadas pelo y(0), y(1), y(2), ..., y(k), para quea matriz P (k +1) de covarincia do erro, no instante k+ 1, seja mnima. A soluo encontrada por Kalmane Bucy, foium estimador ptimo dos estados que tem por equao:

    x(k+ 1) = A(k)x(k) +B(k)u(k) +K(k)[y(k) y(k)] = A(k)x(k) +B(k)u(k) (2.106)

    E o digrama de blocos representado na figura.

    Figura 2.19: Filtro de Kalman com Predio

    O erro do sistema no instante k + 1 :

    e(k + 1) = x(k + 1) x(k + 1) = [A(k)K(k)C(k)]e(k)K(k)(k) + v(k) (2.107)

    O qual representado como:

    e(k + 1) = A(k)e(k)K(k)(k) + v(k) (2.108)

    33

  • eT (k + 1) = eT (k)AT (k) (k)TKT (k) + vT (k) (2.109)

    Onde a matriz A(k) determinstica. O objetivo minimizar a matriz de covarincia do erro

    P (k + 1) = E[e(k + 1)eT (k + 1)

    ](2.110)

    E no o ndice escalarJ =

    1

    2eT (k + 1)e(k + 1) (2.111)

    Substituindo as equaes do erro e erro transposto tem-se.

    P (k+1) = E[e(k + 1)eT (k + 1)

    ]= A(k)P (k)AT (k)AT (k)E[e(k)wT (k)]KT (k)+A(k)E[e(k)vT (k)]K(k)E[w(k)eT (k)]AT (k)+E[v(k)eT (k)]AT (k)+K(k)R(k)KT (k)+Q(k)

    E como:E[e(k)wT (k)] = AT (k + 1)E[e(k 1)wT (k)] (2.112)

    Assim que o valor esperado pode se expressar como mostra a seguinte equao:

    E[e(k)w(k)] = A(k1)E[e(k1)wT (k)] = A(k1)A(k2)E[e(k2)wT (k)] = A(k1)A(k2)...A(0)E[e(0)wT (k)] = A(k1)A(k2)...A(0)E[[x(0)x(0)]wT (k)]

    Como:E[[x(0) x(0)]wT (k)] = 0 (2.113)

    Os termos:

    E[e(k)vT (k)] = E[w(k)eT (k)] = 0 (2.114)

    Ento

    P (k+1) = A(k)P (k)AT (k)+K(k)R(k)KT (k)+Q(k) = [A(k)K(k)C(k)]P (k)[A(k)K(k)C(k)]T+K(k)R(k)KT (k)+Q(k)(2.115)

    Para minimizar P (k+1), derivada a equao kkkk em funo de K(k) obtendo o valormnimo da funo.

    dP (k + 1)

    dK(k)= 0 = 2A(k)P (k)CT (k) + 2K(k)C(k)P (k)CT (k) + 2K(k)R(k) (2.116)

    Manipulando a equao anterior obtida

    K(k) = A(k)P (k)CT (k)[R(k) + C(k)P (k)CT (k)]1 (2.117)

    34

  • K(k) o valor que faz mmima a forma quadratica TP (k + 1)

    K(k) A(k)P (k)CT (k)D1(k) = 0 (2.118)

    K(k) = A(k)P (k)CT (k)[R(k) + C(k)P (k)CT (k)]1 (2.119)

    importante notar quee(0) = x(0) x(0) = x(0) x(0) (2.120)

    Assim avaliando a equao anterior na matriz de covarincia do erro representada como:

    P (k + 1) = Q(k) + [A(k)K(k)C(k)]P (k)AT (k) (2.121)

    Que a equao de Riccati,em resumo este procedimento pode ser visualizado no seguintediagrama

    Figura 2.20: Passos para obter o Filtro de Kalman com Predio

    2.7.8 Exemplo filtro de Kalman discreto:

    Para o sistema representado nas equaes 2.90, a discretizao do sistema em espao deestados pode ser feita mediante as equaes 2.122 at 2.124 [36].

    Ad = eAT (2.122)

    35

  • Bd = A1(A I)B (2.123)

    Gd = A1(A I)G (2.124)

    Baseado nas equaes anteriores discretizado o sistema para um tempo de amostragemT = 0.05s. onde a discretizao feita mediante a utilizao das equaes 2.90 e 2.91,obtendo assim as equaes 2.125 e 2.126 [34].

    xk+1 =

    [0.8146 0.08173

    0.08173 0.8146

    ]xk +

    [0.002188

    0.045245

    ]uk +

    [0.043

    0.0447

    ]vk (2.125)

    yk =[1 0

    ]xk + wk (2.126)

    O termo do rudo v tem mdia zero e covarincia V = 0.09. e o rudo de medio assumido com mdia zero e covarincia W = 0.25. Aplicando uma entrada u = sin(kt),com um periodo de amostragem T = 0.05s, para um intervalo KT

    [0 1

    ]s e condio

    inicial x0. Substituindo o sistema discreto nas equaes 2.128 a 2.131 tem-se: Estimativa apriori do estado.

    xk =

    [0.8146 0.08173

    0.08173 0.8146

    ]xk +

    [0.002188

    0.045245

    ]uk (2.127)

    Ento o ganho de Kalman definido pela equao 2.128.

    Lk+1 =

    [0.8146 0.08173

    0.08173 0.8146

    ]Sk

    [0.8146 0.08173

    0.08173 0.8146

    ]T

    +

    [0.043

    0.0447

    ](0.09)

    [0.8146 0.08173

    0.08173 0.8146

    ][0.043

    0.0447

    ]T

    +

    [0.043

    0.0447

    ](0.09)

    [0.043

    0.0447

    ]T [1 0

    ]+ (0.25)1

    (2.128)

    Assim a estimativa a posteriori, corregida com a sada y(k+1) dada pela equao 2.129

    xk+1 = (I Lk+1[1 0

    ])

    [0.8146 0.08173

    0.08173 0.8146

    ]xk +

    [0.002188

    0.045245

    ]uk +Lk+1 (2.129)

    E a matriz de covarincia para prxima iterao representada na equao2.130.

    Sk+1 = (I Lk+1[1 0

    ])

    [0.8146 0.08173

    0.08173 0.8146

    ]Sk

    [0.8146 0.08173

    0.08173 0.8146

    ]T[

    0.002188

    0.045245

    ](0.09)

    [0.002188

    0.045245

    ]T(I Lk+1

    [1 0

    ]) + Lk+1(0.025)L

    Tk+1(I Lk+1

    [1 0

    ])

    (2.130)

    36

  • A soluo das equaes anteriores feita mediante a ajuda do software MATLAB, ondeforam obtidas a matriz de covarincia para prxima iterao e o ganho do Kalman comoapresentam as equaes 2.131 e 2.132

    L =

    [0.0130

    0.0174

    ](2.131)

    S = 13[

    0.3260 0.43520.4352 0.7580

    ](2.132)

    2.7.9 Exemplo 2 filtro de Kalman discreto:

    Seja o sistema em espao de estados dado pelas equaes 2.97 e 2.98. Onde as matrizesdiscretas tm a forma que apresentam as equaes 2.133 e 2.134.

    xk+1 =

    1.1269 0.4940 0.11291.000 0 00 1 0

    xk +0.38320.5919

    0.5191

    uk + vk (2.133)yk =

    [1 0 0

    ]xk + wk (2.134)

    Projetar um FK baseados nas medies de rudo y[n] = Cx[n] + v[n] Pode-se utilizara funo de KALMAN de Matlab para projetar o FK estacionrio,esta funo determinao timo estado para o filtro estacionrio com ganho K baseado no processo de ruido decovarincia Q e o rudo do sensor de covarincia R. Para desenvolver o exemplo vai setomar como covarincia para do rudo e do sensor respetivamente:

    Q = 2.3 um valor diferente de zero;

    R = 1.0 Um valor diferente de zero.

    Assim o FK en estado estacionrio que ser projetado tem as equaes 2.135 e 2.136

    x[n+ 1|n] = Ax[n|n 1] +Bu[n] (2.135)x[n|n] = x[n|n 1] +K(yv[n] Cx[n|n 1]) (2.136)

    Sendo que L um ganho timo de inovao. Ento em Matlab a planta representadapela equao 2.137:

    Plant = ss(A, [BB], C, 0,1, y) (2.137)

    A primeira sada do FK a planta de sada estimativa ye = Cx[n|n], e as sadas restantesso as estimativas de estado, assim o ganho timo do FK dado pela equao 2.138:

    [kalmf, L, ,K, Z] = kalman(Plant,Q,R) (2.138)

    37

  • L =

    0.53450.01010.4776

    (2.139)O funcionamento do FK pode ser representado como mostra a figura 2.21.

    Figura 2.21: Comparao de dados com o filtro de kalman

    A figura 2.21. mostra como os dados que entram no filtro so comparados com verdadeiraresposta da planta. Como entrada no sistema ser usada uma funo senoidal e gerados osrudos w e v, partindo dos valores das varincias Q e R, obtendo assim a saida mostrada nafigura 2.22.

    Onde a segunda parte da figura 2.22, da cor vermelha, mostra que a reduo do erromediante a implementao do FK, o qual verificado observando sua varincia, onde semostra que antes da filtragem a covarincia de erro tinha um valor de 0, 9871 , e aps dafiltragem a covarincia de erro tem um valor de 0.3479

    2.8 FILTRO DE KALMAN VARIVEL NO TEMPO FKVT

    A definio de um FK varivel no tempo feita da mesma maneira como foi apresentadapara um FK invariante no tempo, com a diferena que o tempo esta sendo atualizado emcada um dos instantes onde so calculados os estados que definem o FK. O FKVT pode serdeterminado de duas maneiras diferentes:

    Deixando constante a matriz de covarincias e modificando s o tempo para cada parme-tro considerando as matrizes do sistema varivel;

    Modificando o tempo ao igual que a matriz de covariana para calcular cada um dos esta-dos.

    Para obter um FKVT deve-se primeiro atualizar o tempo como mostra as equaes 2.140e 2.141, e depois atualizar as medies baseados na atualizao do tempo, como mostrado

    38

  • Figura 2.22: Resposta obtida usando o filtro de kalman

    39

  • nas equaes 2.142 at 2.144.

    x[n+ 1|n] = Ax[n|n] +Bu[n] (2.140)

    P [n+ 1|n] = AP [n|n]A +B Q B (2.141)

    x[n|n] = x[n|n 1] +M [n](yv[n] Cx[n|n 1]) (2.142)

    M [n] = P [n|n 1]C (CP [n|n 1]1C +R) (2.143)

    P [n|n] = (IM [n]C)P [n|n 1] (2.144)BILBLIOGRAFIA MATLAB

    O procedimento para obter o FKVT em matlab o mesmo utilizado para FK discreto,com a diferena que aqui pode ser atualizado tanto o tempo como a covarincia Q.

    2.9 CONTROLE LQG

    Como o controlador LQR projetado para sistemas que no tem rudo nem pertur-baes, para superar o problema de certas variveis de estados que no podem ser medi-das, ou so muito ruidosas, ento a analises feita usando teoria de processos estocsticos[2].Considerando os fatos anteriormente ditos necessrio adicionar um observador estocs-tico ao projeto LQR, normalmente este observador um FK, o qual resolve o problema deestimao timo dos valores das variveis de estado do sistema conhecido em presena derudo nas prprias variveis e medidas, onde o observado de estados considera os compo-nentes aleatrias do sistema [2]. Depois da estimao dos valores das variveis dos estados,pode ser feita a realimentao tima das variveis de estado para projetar um regulador lineartimo quadrtico (LQG), onde normalmente o projeto desenvolvido em duas etapas [2].

    1. Determinar a matriz de ganho do filtro de Kalman [2];

    2. Determinar a matriz de ganho de realimentao tima [2].

    Com isto pode ser considerado como vantagens do uso de projetos de controladores LQG:

    Ao integral que pode ser introduzida facilmente [33];

    Sinais de referncia estocsticos podem ser includos [33];

    40

  • Sistemas multivariveis no quadrados, com atraso nas diferentes malhas, podem ser con-trolados [33].

    Mas o controlador LQG tambm apresenta desvantagens, entre elas esto a perda da robustezdevido incluso do estimador e ao tempo gasto com a estimao [33], No controlador LQG,a dinmica da planta linear e conhecida , e as perturbaes presentes so estocsticas comas propriedades estatsticas conhecidas [33] Seja o sistema a ser controlado representadopelas equaes 2.145 e 2.146 [37]:

    x(t) = Ax(t) +Bu(t) +Gv(t) (2.145)

    y(t) = Cx(t) + w(t) (2.146)

    Onde:

    x Rn o estado do sistema [37];

    y Rq o vetor de medidas contaminado pelo rudo v Rq [37];

    u Rm o vetor do controle a ser determinado [37];

    v Rn o vetor de perturbao [37];

    w Rn o vetor rudo que afeita a sada [37].

    v(t) E w(t) so sinais estocsticas com mdia e varincia conhecidos [37] Em relao aosistema, pode-se assumir as seguintes caractersticas de v(t) e w(t):

    v(t) ew(t) so rudos brancos, isto variveis estocsticas de mdia nula, o sejaE {w(t)} =0,E {v(t)} = 0 e no correlacionadas no tempo, o que igual a ter E {w(t)w()} = 0,E {v(t)v()} = 0 para t [4];

    v(t) e w(t) so no correlacionadas entre s, E {v(t)vw()} = 0;

    v(t) e w(t) possuem matriz de covarincia conhecida e so E {w(t)w()} = Qw 0 eE {v(t)v()} = Rv 0.

    A parte fundamental do controle LQG encontrar uma lei de controle u(t) que ao seraplicado no sistema possa minimiza a funo 2.147 [33].

    J(t0) = limT

    1

    T

    T0

    xT (t)Q(t)x(t) + uT (t)R(t)u(t) dt (2.147)Sendo Q e R matrizes de ponderao como mostram as equaes 2.9 e 2.9 :

    Q QT 0

    41

  • R RT 0

    A soluo para o problema LQG pode ser apresentada em duas etapas:

    1 Projeta-se um controle LQR com u(t) = Kx(t), sendoK uma matriz de realimentaode estados que no depende de V e W ;

    2. Projeta-se um observador onde a varincia do erro de estimao E {(x xf )(x xf )} minimizada mediante o FK.

    Assim a soluo do problema LQG pode-se ser representada como apresenta a figura 2.23

    Figura 2.23: Controle LQG [8]

    2.9.1 Propriedades do LQG

    Para a anlise do controlador LQR, substituindo a equao 2.32 na equao 2.30 obtm-se a equao do sistema de malha fechada dada pela equao 2.148:

    x(t) = (ABK)x(t) (2.148)

    Os autovalores (A BK) esto no semi-plano esquerdo, caracterizando o sistema LQRcomo assintoticamente estvel. A representao do FK um observador de estados do tipoLuenberger [33], representado pela equao 2.149.

    xt = (A LC)x(t) +Bu(t) + Ly(t) (2.149)

    Os autovalores de (ALC) esto no semi-plano esquerdo, caracterizando o filtro de Kalmancomo assintoticamente estvel. Sendo L o ganho do observador projetado para minimizara varincia do erro estimado [33]. A determinao do filtro de Kalman feita buscando umvalor de L tal que possa minimizar a equao 2.150

    minLE {e(t), e(t)} = x(t) xf (t) (2.150)

    42

  • Onde a determinao de L obtida da equao de Riccati como mostra a equao 2.151.

    SA + AS AC R1v CS +Qw = 0 (2.151)

    E o ganho do estado dado pela equao 2.152.

    L(t) = SC R1v (2.152)

    O LQR e o FK possuem excelentes propriedades de robustez, margem de fase de 60 graus emargem de ganho infinita, quando analisados isoladamente. Seria de se esperar que o sistemaformado pela juno destes dois projetos tambm apresentassem as mesmas propriedades derobustez. Entretanto, a incluso do FK pode resultar da degradao das propriedades doLQR, de forma que no Projeto LQG as propriedades de robustez no so garantidas [38].

    2.9.2 Exemplo do controle LQG

    Para o pndulo invertido, do item 2, onde foi projetado um controle LQR representadopelas equaes 2.67 2.69, ser projetado um controle LQG, dado que o sistema requerdo modelo discreto, a discretizao do modelo feita em MATLAB mediante o comandoc2d, onde necessrio um tempo de amostragem para o caso ser T = 1/100; o sistemadiscretizado representado pelas equaes 2.153 e 2.154 [11].

    x1

    x2

    x3

    x4

    =

    1 0.01 0.0001 0

    0 0.9982 0.0267 0.0001

    0 0 0 0.01

    0 0.0045 0.3119 1.0016

    x1

    x2

    x3

    x4

    +

    0.0001

    0.0182

    0.0002

    0.0454

    u (2.153)

    y =

    [1 0 0 0

    0 0 1 0

    ]x1

    x2

    x3