repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação...

110
Universidade de Lisboa (Faculdade de Ciˆ encias) Departamento de Matem´ atica Sobre a Estabiliza¸ ao de Sistemas Lineares Maria Cristina Canelas Lopes Ferreira Doutoramento em Matem´atica (Matem´ atica, especialidade de ´ Algebra, L´ ogica e Fundamentos) 2012

Transcript of repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação...

Page 1: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Universidade de Lisboa(Faculdade de Ciencias)

Departamento de Matematica

Sobre a Estabilizacao de SistemasLineares

Maria Cristina Canelas Lopes Ferreira

Doutoramento em Matematica (Matematica, especialidade de Algebra, Logica e

Fundamentos)

2012

Page 2: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Universidade de Lisboa(Faculdade de Ciencias)

Departamento de Matematica

Sobre a Estabilizacao de SistemasLineares

Maria Cristina Canelas Lopes Ferreira

Tese orientada pelo Professor Doutor Fernando Abel Conceicao Silva,especialmente elaborada para a obtencao do grau de doutor em Matematica

(Matematica, especialidade de Algebra, Logica e Fundamentos)

2012

Page 3: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

O binómio de Newton é tão belo como a Vénus de Milo.

óóóó�óóóóóóóóó�óóóóóóóóóóóóóóó

(O vento lá fora)

Álvaro de Campos

Page 4: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante

a realização deste trabalho.

aos responsáveis pelo Centro de Estruturas Lineares e Combina-

tórias (CELC), pelo apoio �nanceiro para participação em reuniões

cientí�cas no país e no estrangeiro.

aos colegas do departamento de Matemática da Universidade de

Aveiro e a todos os que nele trabalham, pelo companheirismo e pelas

excelentes condições de trabalho.

a todos aqueles que me deram sugestões, críticas e esclareci-

mentos para uma maior simplicidade e clareza na escrita deste texto,

em particular aos Professores Doutores Paolo Vettori e Rita Simões,

pela disponibilidade e pelo apoio.

aos Amigos que, estando sempre presentes, me deram força

para continuar nos momentos mais difíceis.

Page 5: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

resumo Uma matriz complexa quadrada A diz-se estável se as partes reais dos

seus valores próprios forem negativas. Um conhecido resultado devido

a Lyapunov estabelece que −A é estável se e só se existe uma matriz

hermítica H de�nida positiva tal que AH + HA∗ é de�nida positiva.

O teorema geral de inércia, devido a Ostrowski, Scheneider e Taussky,

estabelece que existe uma matriz hermítica H tal que AH + HA∗ é

de�nida positiva se o só se A não tem valores próprios com parte real

nula; e, neste caso, as inércias de A e H coincidem.

Um par (A, B) de matrizes de tamanhos n×n e n×m, respetivamente,

diz-se estabilizável se existe X tal que A+BX é estável.

Nesta dissertação, os resultados anteriores e outros teoremas sobre

inércia foram generalizados para pares de matrizes, com vista a estudar

a estabilização. De seguida, resultados análogos sobre a estabilização

com respeito ao círculo unitário foram também considerados.

palavras-chave estabilidade

estabilização

inércia de matrizes

matrizes hermíticas

Page 6: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

abstract A complex square matrix A is said to be stable if the real parts of its

eigenvalues are negative. A well-known theorem due to Lyapunov sta-

tes that −A is stable if and only if there exists a (Hermitian) positive

de�nite matrix H such that AH +HA∗ is positive de�nite. The main

inertia theorem, due to Ostrowski, Scheneider and Taussky, states that

there exists a Hermitian matrix H such that AH + HA∗ is positive

de�nite if and only if A has no eigenvalues with zero real part; and, in

that case, the inertias of A and H coincide. A pair (A, B) of matrices

of sizes n×n and n×m, respectively, is said to be stabilizable if there

exists X such that A+BX is stable.

In this work, the results above and other inertia theorems were gene-

ralized to pairs of matrices, in order to study stabilization. Analogous

questions about stabilization with respect to the unit disc were also

considered.

keywords Stability

Stabilization

Inertia of matrices

Hermitian matrices

Page 7: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Índice

1 Introdução 1

1.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Estabilidade de Sistemas Lineares . . . . . . . . . . . . . . . 9

1.2.1 Sistemas com Variáveis Contínuas . . . . . . . . . . . 10

1.2.2 Sistemas com Variáveis Discretas . . . . . . . . . . . 18

1.3 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2 Estabilização de Sistemas de Variável Contínua 33

2.1 Generalização do Teorema de Lyapunov . . . . . . . . . . . 33

2.2 Generalização do Teorema Geral da Inércia . . . . . . . . . . 37

2.3 Generalização de um Teorema de Chen e Wimmer . . . . . . 46

2.4 Um Teorema de Inércia de Loewy . . . . . . . . . . . . . . . 57

2.5 A Desigualdade π(AH +HA∗) ≥ l . . . . . . . . . . . . . . 61

3 Estabilização de Sistemas de Variável Discreta 71

3.1 Generalização do Teorema de Stein . . . . . . . . . . . . . . 72

3.2 Generalização do Teorema Geral da Inércia . . . . . . . . . . 74

i

Page 8: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Índice

3.3 A Desigualdade π(H + AHA∗) ≥ l . . . . . . . . . . . . . . 88

Referências Bibliográ�cas 96

Índice Remissivo 100

ii

Page 9: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Capítulo 1

Introdução

1.1 Preliminares

Vamos começar por referir algumas notações e alguns resultados bem co-

nhecidos que serão utilizados ao longo deste trabalho. Mais detalhes sobre

os resultados aqui referidos podem ser encontrados em diversos livros sobre

teoria de matrizes como, por exemplo, [8, 11, 13].

Vamos representar por F qualquer elemento do conjunto {R,C}, onde R

representa o corpo dos números reais e C representa o corpo dos números

complexos. Representamos por F[x] o anel dos polinómios na indeterminada

x com coe�cientes em F e por gr(f) o grau de f ∈ F[x] \ {0}.

1

Page 10: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.1. Preliminares

Dados dois polinómios f e g ∈ F[x] \ {0}, escrevemos f | g sempre que f

divide g e dizemos que f é mónico se o monómio de maior grau que ocorre

em f tem coe�ciente 1.

Vamos agora referir também algumas notações para matrizes. Assim se m

e n forem inteiros positivos, F[x]m×n e Fm×n representam os conjuntos das

matrizes de tamanho m × n com coe�cientes em F[x] e F, respetivamente.

Usamos, em geral, letras maiúsculas do alfabeto latino para representar

matrizes.

A matriz identidade de ordem n é representada por In e se n e m forem

inteiros positivos, 0n,m, 0n e 0 representam, respetivamente, a matriz nula

de tamanho n × m, a matriz nula de tamanho n × n, e uma matriz nula

de tamanho não especi�cado. Representamos por e(n)i a i-ésima linha ou a

i-ésima coluna da matriz identidade de ordem n, In.

Representamos por diag(a1, . . . , an) a matriz diagonal de ordem n, cuja en-

trada (i, i) é ai, i ∈ {1, . . . , n}, que tem todas as outras entradas nulas.

Se A ∈ Cn×m, car(A) e tr(A) representam, respetivamente, a caraterística

e o traço da matriz A.

Se A ∈ Cn×m, At eA∗ = (A)t representam,respetivamente, a matriz trans-

posta e a matriz transconjugada de A.

Se A ∈ Cn×n, det(A), σ(A) e ρ(A) representam, respetivamente, o deter-

2

Page 11: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.1. Preliminares

minante, o espetro e o raio espetral da matriz A. Se det(A) 6= 0, A−1

representa a inversa de A.

Representamos pelo símbolo ⊕ a soma direta de matrizes e por ∗ entradas

não especi�cadas de uma matriz.

Seja H ∈ Cn×n uma matriz hermítica. Escrevemos H > 0 quando H é

de�nida positiva e H ≥ 0 quando H é semide�nida positiva.

Seja A = [aij] ∈ Cn×n. Dizemos que A é diagonalmente dominante por

linhas se

|aii| >∑j 6=i

|aij|,

para todo i ∈ {1, . . . , n}.

Teorema 1.1 [11] Seja A ∈ Cn×n uma matriz diagonalmente dominante

por linhas.

1. Se todas as entradas da diagonal principal de A são reais positivas,

então todos os valores próprios de A têm parte real positiva.

2. Se A é hermítica e todas as suas entradas principais são reais positivas,

então todos os valores próprios de A são reais positivos.

Dados dois triplos de números reais (π, ν, δ) e (π′, ν ′, δ′), escrevemos (π, ν, δ) ≤

3

Page 12: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.1. Preliminares

(π′, ν ′, δ′) quando π ≤ π′, ν ≤ ν ′ e δ ≤ δ′.

Seja A ∈ F[x]m×n. Para cada j ∈ {1, . . . , r}, onde r = car(A), chama-

mos divisor determinantal de ordem j de A ao máximo divisor comum

mónico dos menores de ordem j de A, que será representado por dj(A).

Em particular, d1(A) é o máximo divisor comum mónico dos elementos da

matriz. Além disso, dj(A) 6= 0, para j ∈ {1, . . . , r}, e convencionamos que

dj(A) = 0, para j > r. Por outro lado, convencionamos que d0(A) = 1.

Resulta da regra de Laplace para o desenvolvimento do determinante que

d0(A) | d1(A) | · · · | dr(A).

Seja A ∈ F[x]m×n. Para cada j ∈ {1, . . . , r}, onde r = car(A), designamos

por j-ésimo fator invariante de A ∈ F[x]m×n o elemento

sj(x) =dj(A)

dj−1(A).

Seja A ∈ Fn×n. Aos fatores invariantes da matriz xIn − A ∈ F[x]n×n cha-

mamos polinómios invariantes de A.

Como a matriz xIn − A tem caraterística n, então A tem n polinómios in-

variantes.

Dizemos que as matrizes A ∈ F[x]m×n e B ∈ F[x]m×n são equivalentes,

se existirem matrizes invertíveis U ∈ F[x]m×m e V ∈ F[x]n×n tais que

A = UBV .

Forma normal de Smith [13]

4

Page 13: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.1. Preliminares

Seja A ∈ F[x]m×n. Então A é equivalente a uma única matriz com a forma diag(f1, . . . , fr) 0

0 0

,onde f1, . . . , fr são polinómios mónicos tais que f1 | f2 | . . . | fr e r é a cara-

terística de A. Nestas condições, para cada j ∈ {1, . . . , r}, onde r = car(A),

fj é o j-ésimo fator invariante de A.

A esta matriz chamamos forma normal de Smith de A, a qual será repre-

sentada por S(A).

Podemos concluir que as matrizes A, B ∈ F[x]m×n são equivalentes se e só

se têm os mesmos fatores invariantes.

Designamos por polinómio mínimo de A ∈ Fn×n o polinómio h ∈ F[x]

mónico de grau mínimo tal que h(A) = 0.

Dizemos que A ∈ Fn×n é não derrogatória se o seu polinómio mínimo e o

seu polinómio caraterístico, det(xIn − A), coincidem.

Sejam f1 | . . . | fr os polinómios invariantes de A ∈ Fn×n não constantes.

Representamos por i(A) o número r. Os polinómios mínimo e caraterís-

tico de A, são, respetivamente, h = fr e f = f1 · · · fr. Assim, A é não

derrogatória se e só se i(A) = 1.

5

Page 14: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.1. Preliminares

Dado um polinómio mónico f(x) = xk + ak−1xk−1 + · · · + a0 ∈ F[x], com

k ≥ 1, chamamos matriz companheira de f a

C(f) =

0 Ik−1

−a0 −a1 · · · − ak−1

∈ Fk×k.

Os polinómios invariantes de C(f) são 1, . . . , 1, f . Assim, xIk − C(f) e

diag(1, . . . , 1, f) são equivalentes e C(f) é não derrogatória.

Dizemos que A ∈ Fn×n e B ∈ Fn×n são semelhantes se existir uma matriz

não singular U ∈ Fn×n tal que

A = UBU−1.

É conhecido que A,B ∈ Fn×n são semelhantes se e só se xIn −A e xIn −B

são equivalentes em F[x]n×n.

Assim, duas matrizes A,B ∈ Fn×n são semelhantes se e só se têm os mesmos

polinómios invariantes.

Forma normal racional para a semelhança [10, 13]

Toda a matriz A ∈ Fn×n é semelhante com uma única matriz da forma

C(f1)⊕ · · · ⊕ C(fr),

onde r = car(A) e f1 | f2 | . . . | fr são polinómios mónicos não constantes.

Neste caso, f1 , . . . , fr são os polinómios invariantes de A não constantes.

6

Page 15: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.1. Preliminares

Um bloco de Jordan de ordem k é uma matriz k × k da forma

Jk(λ) = λIk +

0 Ik−1

0 0

, ∈ Fk×k

onde λ ∈ C.

Forma normal de Jordan [11, 13]

Uma matriz A ∈ Cn×n é semelhante com uma matriz com a forma

J = Jn1(λ1)⊕ Jn2(λ2)⊕ · · · ⊕ Jnk(λk) (1.1)

onde λi ∈ C, para i ∈ {1, 2, . . . , k}, é um valor próprio de A de multiplici-

dade ni e n1 + n2 + · · ·+ nk = n.

Uma matriz com a forma anterior chama-se forma normal de Jordan de A.

Esta matriz é única a menos da permutação dos blocos de Jordan.

Por vezes é útil saber que toda a matriz A ∈ Cn×n é semelhante com uma

matriz da forma (1.1) na qual todos os elementos iguais a 1, situados imedi-

atamente acima da diagonal principal, são substituídos por ε 6= 0 e ε pode

ser tomado com módulo arbitrariamente pequeno.

Um bloco de Jordan generalizado é uma matriz da forma

Jk,ε(λ) = λIk + ε

0 Ik−1

0 0

,

onde λ ∈ C e ε ∈ C\{0}.

7

Page 16: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.1. Preliminares

Forma normal de Jordan generalizada [11]

Dados uma matriz A ∈ Cn×n e ε 6= 0, então A é semelhantcom a uma matriz

com a forma

Jn1,ε(λ1)⊕ Jn2,ε(λ2)⊕ · · · ⊕ Jnk,ε(λk) (1.2)

onde λi ∈ C, para i ∈ {1, 2, . . . , k}, é um valor próprio de A de multiplici-

dade ni e n1 + n2 + · · ·+ nk = n.

Lema 1.2 [10, 13] Seja A ∈ Fn×n. A equação AX + XB = C tem uma

única solução XC ∈ Fn×n, para qualquer C ∈ Fn×n, se e só se A e −B não

têm valores próprios em comum.

Sejam H, H ′ ∈ Fn×n. Dizemos que H e H ′ são congruentes se existir uma

matriz não singular S ∈ Fn×n tal que

H = SH ′S∗. (1.3)

Forma normal para a congruência de matrizes hermíticas [11, 13]

Uma matriz hermítica H ∈ Fn×n é congruente com uma matriz com a forma

Is ⊕−Ir−s ⊕ 0n−r,

onde r = car(H) e s é o número de valores próprios positivos de H contando

as multiplicidades.

8

Page 17: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

O próximo resultado garante que pequenas alterações nas entradas de uma

matriz A ∈ Cn×n conduzem a pequenas alterações nos valores próprios de

A. Por isso, podemos falar em continuidade dos valores próprios de uma

matriz.

Teorema da continuidade de valores próprios [2, 12]

Sejam A = [aij] ∈ Cn×n uma matriz e λ1, . . . , λt os valores próprios distintos

de A. Seja mi a multiplicidade algébrica de λi, i ∈ {1, . . . , t}. Para todo o

δ > 0, existe ε > 0 tal que, para toda a matriz A′ = [a′ij] ∈ Cn×n, se

maxi,j|a′ij − aij| < ε,

então A′ tem mi valores próprios no disco com centro em λi e raio δ.

1.2 Estabilidade de Sistemas Lineares

Nesta secção, referem-se alguns conceitos e alguns resultados fundamentais

sobre a estabilidade de sistemas lineares. Mais detalhes sobre estabilidade

podem ser encontrados em diversos livros sobre teoria de sistemas, teoria

de matrizes, equações diferenciais ou equações com diferenças, como por

exemplo [11, 13, 18].

9

Page 18: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

1.2.1 Sistemas com Variáveis Contínuas

Consideremos um sistema S descrito por uma lista �nita de variáveis de

estado x1(t), . . . , xn(t), de�nidas em R+0 , que tomam valores em F e obede-

cem a um sistema de equações diferenciais lineares de primeira ordem com

coe�cientes constantes,

dx(t)

dt= Ax(t), onde A ∈ Fn×n, e (1.4)

x(t) =

x1(t)

...

xn(t)

.

De�nição 1.3 Dizemos que um sistema S cujas variáveis de estado obe-

decem a (1.4) é estável, se todas as soluções de (1.4) convergem para zero,

quando t→ +∞.

Prova-se que o sistema (1.4) é estável se e só se todos os valores próprios de

A têm parte real negativa.

De�nição 1.4 Dizemos que uma matriz A ∈ Cn×n é estável se todos os

seus valores próprios têm parte real negativa.

Por conveniência, vamos dizer que uma matriz A ∈ Cn×n é estável positiva

se todos os seus valores próprios têm parte real positiva, isto é, se −A é

10

Page 19: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

estável.

De�nição 1.5 A inércia de um polinómio f ∈ C[x] \ {0}, é o triplo

In(f) = (π(f), ν(f), δ(f)),

onde π(f), ν(f) e δ(f)) representam, respetivamente, o número de raízes

de f com parte real positiva, negativa e nula.

De�nição 1.6 A inércia de uma matriz A ∈ Cn×n é a inércia do seu poli-

nómio caraterístico e representa-se por In(A) = (π(A), ν(A), δ(A)).

Assim, A ∈ Cn×n é estável positiva se e só se In(A) = (n, 0, 0).

Teorema 1.7 (Teorema de Lyapunov, caso complexo) [11, 13]

Uma matriz A ∈ Cn×n é estável positiva se e só se existe uma matriz her-

mítica de�nida positiva H ∈ Cn×n tal que AH +HA∗ é de�nida positiva.

Demonstração. Suponhamos que A é estável positiva. Seja ε um número

real positivo tal que ε < Re(λi), i ∈ {1, . . . , s}. Seja S ∈ Cn×n uma matriz

invertível tal que

A′ := S−1AS =s⊕i=1

Jki,ε(λi)

11

Page 20: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

tem uma forma normal de Jordan generalizada. Então

A′ + A′∗ =s⊕i=1

2 Re(λi) ε 0

ε 2 Re(λi). . .

. . . . . . ε

0 ε 2 Re(λi)

.

Como ε < Re(λi), i ∈ {1, . . . , s} e A′ + A′∗ é hermítica e diagonalmente

dominante por linhas, pelo teorema 1.1, os valores próprios de A′ +A′∗ são

reais positivos e A′ + A′∗ é de�nida positiva. Portanto,

S(A′ + A′∗)S∗ = A(SS∗) + (SS∗)A∗

é de�nida positiva. Seja x ∈ Cn×1\{0}. Como S é invertível, S∗x 6= 0.

Assim, x∗SS∗x > 0 e SS∗ é de�nida positiva.

Reciprocamente, suponhamos que existe uma matriz de�nida positiva H ∈

Cn×n tal que AH + HA∗ é de�nida positiva. Seja λ ∈ C um valor próprio

de A e seja u ∈ Cn×1 um vetor próprio de A∗ associado ao valor próprio λ.

Então,

0 < u∗(AH +HA∗)u = λu∗Hu+ λu∗Hu = 2 Re(λ)u∗Hu.

Como H é de�nida positiva, u∗Hu > 0. Logo Re(λ) > 0.

Estamos agora em condições de considerar uma generalização do teorema

de Lyapunov.

12

Page 21: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Teorema 1.8 (Teorema Geral da Inércia, caso complexo) [15, 20]

Seja A ∈ Cn×n. Existe uma matriz hermítica H ∈ Cn×n tal que

AH +HA∗ > 0 (1.5)

se e só se δ(A) = 0. E se H ∈ Cn×n é uma matriz hermítica tal que (1.5)

então In(A) = In(H).

Demonstração. Suponhamos que existe uma matriz hermítica H ∈ Cn×n

tal que (1.5) é válida. Suponhamos que A tem um valor próprio ia, com

a ∈ R. Então A é semelhante com uma matriz com a forma

A′ := SAS−1 =

ia 0

∗ A0

,onde S ∈ Cn×n é invertível, a ∈ R e A0 ∈ C(n−1)×(n−1). Seja H ′ := SHS∗.

É fácil veri�car que a entrada (1, 1) de A′H ′+H ′A′∗ é nula, o que é absurdo,

pois S(AH +HA∗)S∗ = A′H ′ +H ′A′∗ é de�nida positiva. Logo δ(A) = 0.

Reciprocamente, suponhamos que δ(A) = 0. Então A é semelhante com

uma matriz com forma

A′ := T−1AT = A1 ⊕ A2,

onde T ∈ Cn×n é invertível, todos os valores próprios de A1 ∈ Cn1×n1 têm

parte real positiva e todos os valores próprios de A2 ∈ Cn2×n2 têm parte real

negativa. Pelo teorema de Lyapunov, existem matrizes de�nidas positivas

13

Page 22: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

H1 ∈ Cn1×n1 e H2 ∈ Cn2×n2 tais que A1H1 +H1A∗1 e (−A2)H2 +H2(−A2)

são de�nidas positivas. Então H ′ := H1 ⊕ (−H2) é hermítica e

A′H ′ +H ′A′∗ = (A1H1 +H1A∗1)⊕ ((−A2)H2 +H2(−A2)

∗)

é de�nida positiva. Logo

T (A′H ′ +H ′A′∗)T ∗ = A(TH ′T ∗) + (TH ′T ∗)A∗

é de�nida positiva. Finalmente, vamos provar por indução em n que, se

existe uma matriz hermíticaH ∈ Cn×n tal que AH+HA∗ é de�nida positiva,

então In(A) = In(H). Este resultado é trivial quando n = 1.

Suponhamos que n ≥ 2. Então A é semelhante com uma matriz com a

forma,

A′ := SAS−1 =

A1,1 0

A2,2 a2,2

,onde S ∈ Cn×n é invertível e A1,1 ∈ C(n−1)×(n−1).

Particionemos H ′ := SHS∗ do seguinte modo:

H ′ := SHS∗ =

H1,1 H1,2

H∗1,2 h2,2

,onde H1,1 ∈ C(n−1)×(n−1) é hermítica. Então

S(AH +HA∗)S∗ = A′H ′ +H ′A′∗ =

A1,1H1,1 +H1,1A∗1,1 ∗

∗ ∗

é de�nida positiva. Donde A1,1H1,1 + H1,1A

∗1,1 é de�nida positiva. Pela

primeira parte da demonstração e pela hipótese de indução, δ(A1,1) = 0

14

Page 23: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

e In(A1,1) = In(H1,1). Portanto H1,1 é uma matriz invertível e podemos

de�nir uma nova matriz

V =

In−1 0

−H∗1,2H−11,1 1

.Então H ′ é congruente com

H ′′ := V H ′V ∗ = H1,1 ⊕ [h′2,2],

para algum h′2,2 ∈ R. Notemos que

A′′ := V A′V −1 =

A1,1 0

A′2,1 a2,2

,para algum A′2,1 ∈ C1×(n−1). Então

V (A′H ′ +H ′A′∗)V ∗ = A′′H ′′ +H ′′A′′∗

=

A1,1H1,1 +H1,1A∗1,1 ∗

∗ a2,2h′2,2 + h′2,2a2,2

é de�nida positiva. Logo a2,2h′2,2 + h′2,2a2,2 > 0. Donde a parte real de a2,2

e o real h′2,2 têm o mesmo sinal, ou seja, In([a2,2]) = In([h′2,2)]. Já vimos

que In(A11) = In(H11). Tendo em conta as formas das matrizes A′′ e H ′′

deduzimos que In(A′′) = In(H ′′). Como A, A′′ são semelhantes e H, H ′′ são

congruentes, deduzimos que In(A) = In(H).

Teorema 1.9 Seja G ∈ Cn×n uma matriz de�nida positiva. Uma matriz

A ∈ Cn×n é estável positiva se e só se existe uma matriz de�nida positiva

H ∈ Cn×n tal que AH +HA∗ = G.

15

Page 24: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Demonstração. (⇐) Resulta do teorema de Lyapunov.

(⇒) Suponhamos que A ∈ Cn×n é estável positiva. De acordo com o lema

1.2, existe H ∈ Cn×n tal que AH + HA∗ = G. Donde AH∗ + H∗A∗ =

(AH + HA∗)∗ = G∗ = G. Pelo lema 1.2, H = H∗ e pelo teorema 1.8

In(A) = In(H). Como A é estável positiva, deduzimos que todos valores

próprios de H são reais positivos, ou seja, H é de�nida positiva.

Corolário 1.10 Uma matriz A ∈ Cn×n é estável positiva se e só se existe

uma matriz de�nida positiva H ∈ Cn×n tal que AH +HA∗ = In.

Vamos agora ver que o teorema de Lyapunov e o teorema geral da inércia

ainda são válidos no caso de se trabalhar em R.

Teorema 1.11 (Teorema de Lyapunov, caso real)

Uma matriz A ∈ Rn×n é estável positiva se e só se existe uma matriz de�nida

positiva H ∈ Rn×n tal que AH +HAt é de�nida positiva.

Demonstração. (⇐) Resulta do teorema 1.7.

(⇒) Pelo corolário 1.10, existe uma matriz de�nida positiva H ∈ Cn×n tal

que AH + HA∗ = In é de�nida positiva. Pelo lema 1.2, existe X ∈ Rn×n

tal que AX +XA∗ = In. Resulta ainda do lema 1.2 que X = H.

16

Page 25: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Teorema 1.12 (Teorema Geral da Inércia, caso real)

Seja A ∈ Rn×n. Existe uma matriz simétrica H ∈ Rn×n tal que AH +HAt

é de�nida positiva se e só se δ(A) = 0. Além disso, se existir uma matriz

simétrica H ∈ Rn×n tal que AH + HAt é de�nida positiva, então In(A) =

In(H).

Demonstração. Se existir uma matiz simétrica H ∈ Rn×n tal que

AH +HAt é de�nida positiva, então, pelo teorema 1.8, δ(A) = 0 e In(A) =

In(H).

Com argumentos análogos a argumentos utilizados na demonstração do te-

orema 1.8, prova-se que, se δ(A) = 0, então existe uma matriz simétrica

H ∈ Rn×n tal que AH +HAt é de�nida positiva.

Observemos que, para toda a matriz A ∈ Fn×n, toda a matriz hermítica

H ∈ Fn×n e toda a matriz não singular S ∈ Fn×n, temos que

AH +HA∗

é congruente com

(SAS−1)(SHS∗) + (SHS∗)(SAS−1)∗.

Utilizando esta observação, é fácil ver que o teorema geral da inércia, quer no

caso real quer no caso complexo, fornece um conjunto completo de relações

entre as classes de semelhança de A e as classes de congruência de H quando

17

Page 26: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

AH + HA∗ > 0 e o teorema geral da inércia pode ser enunciado como se

segue.

Teorema 1.13 Sejam A,H ∈ Fn×n, onde H é uma matriz hermítica. As

a�rmações seguintes são equivalentes:

(a1.13) Existe uma matriz hermítica H ′ ∈ Fn×n, congruente com H, tal que

AH ′ +H ′A∗ > 0.

(b1.13) Existe uma matriz A′ ∈ Fn×n, semelhante com A, tal que

A′H +HA′∗ > 0.

(c1.13) Existe uma matriz hermítica H ′ ∈ Fn×n, congruente com H, e existe

A′ ∈ Fn×n, semelhante com A, tais que A′H ′ +H ′A′∗ > 0.

(d1.13) δ(A) = 0 e In(A) = In(H).

1.2.2 Sistemas com Variáveis Discretas

Consideremos um sistema S descrito pela equação

x(t+ 1) = Ax(t) (1.6)

onde A ∈ Fn×n e t é uma variável que toma valores no conjunto dos inteiros

não negativos.

18

Page 27: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

De�nição 1.14 Dizemos que o sistema S é estável se, para qualquer x(0) ∈

Fn×1, a solução (x(t))t∈N0 converge para 0.

Prova-se que o sistema S é estável se e só se todos os valores próprios de A

têm módulo menor que 1.

De�nição 1.15 Dizemos que A ∈ Cn×n é estável com respeito ao círculo

unitário se, todos os seus valores próprios λ1, λ2, . . . , λn pertencem ao in-

terior do círculo unitário, isto é, |λj| < 1, j ∈ {1, . . . , n}.

Vamos passar ao desenvolvimento de um método análogo ao desenvolvido

no caso de variável contínua.

Lema 1.16 [13] Se A ∈ Cn×n é uma matriz estável com respeito ao círculo

unitário, então C = (In + A)−1(In − A) é estável positiva.

Demonstração. Suponhamos que A é estável relativamente ao círculo

unitário. Seja U ∈ Cn×n uma matriz invertível tal que U−1AU é triangular

superior:

U−1AU =

λ1 ∗

. . .

0 λn

.

19

Page 28: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Então

U−1CU = (In + U−1AU)−1(In − U−1AU).

Donde

U−1CU =

(1 + λ1)

−1(1− λ1) ∗. . .

0 (1 + λn)−1(1− λn)

.

Qualquer que seja k ∈ {1, . . . , n},

2 Re

(1− λk1 + λk

)=

1− λk1 + λk

+1− λk1 + λk

=2− 2|λk|2

|1 + λk|2> 0.

Logo C é estável positiva.

Lema 1.17 [13] Seja A ∈ Cn×n uma matriz estável relativamente ao círculo

unitário. Seja C = (In + A)−1(In − A). Quaisquer que sejam H, G ∈

Cn×n, CH +HC∗ = G se e só se

H − AHA∗ = (2−1/2(In + A))G(2−1/2(In + A∗)).

Demonstração. Quaisquer que sejam H, G ∈ Cn×n,

CH +HC∗ = G⇔ (In + A)−1(In − A)H +H(In − A∗)(In + A∗)−1 = G

⇔ (In + A)−1[(In − A)H(In + A∗) + (In + A)H(In − A∗)](In + A∗)−1 = G

⇔ (In + A)H(In + A∗) + (In + A)H(In − A∗) = (In + A)G(In + A∗)

20

Page 29: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

⇔ 2(H − AHA∗) = (In + A)G(In + A∗)

⇔ H − AHA∗ = (2−1/2(In + A))G(2−1/2(In + A∗).

De seguida recordamos dois teoremas de estabilidade e inércia com respeito

ao círculo unitário [9, 13, 19, 21, 23].

Teorema 1.18 (Teorema de Stein, caso complexo) [13]

Uma matriz A ∈ Cn×n é estável com respeito ao círculo unitário se e só se

existe uma matriz de�nida positiva H ∈ Cn×n tal que

H − AHA∗ = G (equação de Stein) (1.7)

é de�nida positiva.

Demonstração. Suponhamos que A ∈ Cn×n é uma matriz estável com

respeito ao círculo unitário.

De acordo com o lema 1.16, C = (In + A)−1(In − A) é estável positiva. De

acordo com o teorema de Lyapunov, existe uma matriz de�nida positiva

H ∈ Cn×n tal que CH +HC∗ = G, onde G ∈ Cn×n é de�nida positiva. De

acordo com o lema 1.17,

H − AHA∗ = (2−1/2(In + A))G(2−1/2(In + A∗)).

Assim H − AHA∗ é congruente com G e, portanto, é de�nida positiva.

Reciprocamente, suponhamos que existe uma matriz de�nida positiva H ∈

21

Page 30: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Cn×n tal que H − AHA∗ é de�nida positiva. Seja λ ∈ C um valor próprio

de A e seja u ∈ Cn×1 um vetor próprio de A∗ associado ao valor próprio λ.

Então,

0 < u∗(H − AHA∗)u = (1− |λ|2)u∗Hu.

Como H é de�nida positiva, u∗Hu > 0. Portanto 1 − |λ|2 > 0. Donde

|λ| < 1. Logo, A é estável relativamente ao círculo unitário.

De�nição 1.19 A inércia com respeito ao círculo unitário de um polinómio

f ∈ F[x] \ {0}, é o triplo In(f) = (π(f), ν(f), δ(f)), onde π(f), ν(f) e δ(f)

representam o número de raízes de f de módulo menor que 1, maior que 1

e igual a 1, respetivamente.

De�nição 1.20 A inércia com respeito ao círculo unitário de A ∈ Cn×n é

a inércia com respeito ao círculo unitário do seu polinómio caraterístico e

denota-se por In(A) = (π(A), ν(A), δ(A)).

Teorema 1.21 (Teorema Geral da Inércia, caso complexo)[13]

Seja A ∈ Cn×n. Existe uma matriz hermítica H ∈ Cn×n tal que H −AHA∗

é de�nida positiva se e só se δ(A) = 0. Além disso, se existir uma matriz

hermítica H ∈ Cn×n tal que H − AHA∗ é de�nida positiva então In(A) =

In(H).

22

Page 31: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Demonstração. Suponhamos que existe uma matriz hermítica H ∈ Cn×n

tal que H − AHA∗ é de�nida positiva. Seja λ ∈ C um valor próprio de A.

Seja S ∈ Cn×n uma matriz invertível tal que

A′ := SAS−1 =

λ 0

∗ ∗

.Suponhamos que H ′ := SHS∗ = [hij]. Então H −AHA∗ é congruente com

S(H − AHA∗)S∗ = H ′ − A′H ′A′∗ =

h1,1(1− |λ|2) ∗

∗ ∗

.Como H − AHA∗ é de�nida positiva, h1,1(1 − |λ|2) > 0. Portanto |λ| 6= 1.

Logo δ(A) = 0.

Reciprocamente suponhamos que δ(A) = 0. Seja T ∈ Cn×n uma matriz

invertível tal que

A′ := T−1AT = A1 ⊕ A2,

onde todos os valores próprios de A1 ∈ Cn1×n1 têm módulo inferior a 1 e

todos os valores próprios A2 ∈ Cn2×n2 têm módulo superior a 1. Então A2

é invertível e todos os valores próprios de A−12 têm módulo inferior a 1.

Pelo teorema de Stein, existem matrizes de�nidas positivas H1 ∈ Cn1×n1

e H2 ∈ Cn2×n2 tais que H1 − A1H1A∗1 e H2 − A−12 H2(A

∗2)−1 são de�nidas

positivas. A matriz H2 − A−12 H2(A∗2)−1 é congruente com

A2(H2 − A−12 H2(A∗2)−1)A∗2 = −H2 − A2(−H2)A

∗2.

Assim, tomando H ′ = H1 ⊕ (−H2), a matriz

H ′ − A′H ′A′∗ = (H1 − A1H1A∗1)⊕ (−H2 − A2(−H2)A

∗2)

23

Page 32: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

é de�nida positiva. Tomando H = TH ′T ∗, deduzimos que

H − AHA∗ = T (H ′ − A′H ′A′∗)T ∗

é de�nida positiva.

Finalmente, vamos provar, por indução em n, que, se existir uma matriz

hermítica H ∈ Cn×n tal que H − AHA∗ é de�nida positiva, então In(A) =

In(H). Este resultado é trivial quando n = 1. Suponhamos que n ≥ 2.

Então A é semelhante com uma matriz com a forma,

A′ := UAU−1 =

A1,1 0

A2,1 a2,2

,onde U ∈ Cn×n é invertível e A1,1 ∈ C(n−1)×(n−1). Particionemos H ′ :=

UHU∗ do seguinte modo:

H ′ := UHU∗ =

H1,1 H1,2

H∗1,2 h2,2

,onde H1,1 ∈ C(n−1)×(n−1). Então

U(H − AHA∗)U∗ = H ′ − A′H ′A′∗ =

H1,1 − A1,1H1,1A∗1,1 ∗

∗ ∗

é de�nida positiva. Donde H1,1 − A1,1H1,1A

∗1,1 é de�nida positiva. Pela

primeira parte da demonstração e pela hipótese de indução, δ(A1,1) = 0 e

In(A1,1) = In(H1,1). Como δ(H1,1) = δ(A1,1) = 0, H1,1 é invertível. Seja

V =

In−1 0

−H∗1,2H−11,1 1

.

24

Page 33: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Então H ′ é congruente com

H ′′ := V H ′V ∗ = H1,1 ⊕ [h′2,2],

para algum h′2,2 ∈ R. Notemos que

A′′ := V A′V −1 =

A1,1 0

A′2,1 a2,2

,para algum A′2,1 ∈ C1×(n−1). Então

V (H ′ − A′H ′A′∗)V ∗ = G′′ − A′′H ′′A′′∗

=

H1,1 − A1,1H1,1A∗1,1 ∗

∗ h′2,2 − a2,2h′2,2a2,2

é de�nida positiva. Donde h′2,2−a2,2h′2,2a2,2 > 0. Logo In([a2,2]) = In([h′2,2]).

Já vimos que In(A1,1) = In(H1,1). Tendo em conta as formas das matrizes

A′′ eH ′′, temos que In(A′′) = In(H ′′). Como A, A′′ são semelhantes eH, H ′′

são congruentes, deduzimos que In(A) = In(H).

Lema 1.22 Se A ∈ Fn×n é estável relativamente ao círculo unitário, então

X − AXA∗ = G tem uma única solução XG ∈ Fn×n, para qualquer G ∈

Fn×n.

25

Page 34: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Demonstração. Seja A ∈ Fn×n uma matriz estável relativamente ao cír-

culo unitário. Seja C = (In +A)−1(In −A). De acordo com o lema 1.16, C

é estável positiva.

Seja G ∈ Fn×n. Seja G′ = 2(In +A)−1G(In +A∗)−1. De acordo com o lema

1.17, as soluções de X −A∗XA = G e CX +XC∗ = G′ coincidem. Logo a

equação X − A∗XA = G tem uma única solução.

Teorema 1.23 Seja G ∈ Cn×n uma matriz de�nida positiva. Uma matriz

A ∈ Cn×n é estável relativamente ao círculo unitário se e só se existe uma

matriz de�nida positiva H ∈ Cn×n tal que H − AHA∗ = G.

Demonstração. (⇐) Resulta do teorema de Stein.

(⇒) Suponhamos que A ∈ Cn×n é estável relativamente ao círculo unitário.

De acordo com o lema 1.22, existeH ∈ Cn×n tal queH−AHA∗ = G. Donde

H∗ − AH∗A∗ = (H − AHA∗)∗ = G∗ = G. Tendo em conta a unicidade

referida no lema 1.22, H = H∗. Pelo teorema 1.21, In(A) = In(H). Como

A é estável relativamente ao círculo unitário, deduzimos que todos os valores

próprios de H são positivos, ou seja, H é de�nida positiva

Corolário 1.24 Uma matriz A ∈ Cn×n é estável relativamente ao círculo

unitário se e só se existe uma matriz de�nida positiva H ∈ Cn×n tal que

H − AHA∗ = In.

26

Page 35: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Vamos agora ver que o teorema de Stein e o teorema geral da inércia rela-

tivamente ao círculo unitário ainda são válidos no caso de se trabalhar em

R.

Teorema 1.25 (Teorema de Stein, caso real) [13]

Uma matriz A ∈ Rn×n é estável relativamente ao círculo unitário se e só se

existe uma matriz de�nida positiva H ∈ Rn×n tal que

H − AHAt = G (1.8)

é de�nida positiva.

Demonstração. (⇐) Resulta do teorema 1.18

(⇒) Pelo corolário 1.24, existe uma matriz H ∈ Cn×n tal que H −AHA∗ =

In é de�nida positiva. Pelo lema 1.22, existe X ∈ Rn×n tal que X−AXA∗ =

In. Resulta ainda do lema 1.22 que X = H.

Teorema 1.26 (Teorema Geral da Inércia, caso real)[13]

Seja A ∈ Rn×n. Existe uma matriz simétrica H ∈ Rn×n tal que H −AHAt

é de�nida positiva se e só se δ(A) = 0. Além disso se existir uma matriz

simétrica H ∈ Rn×n tal que H − AHAt é de�nida positiva então In(A) =

In(H).

27

Page 36: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.2. Estabilidade de Sistemas Lineares

Demonstração. Se existir uma matriz simétrica H ∈ Rn×n tal que

H−AHAt é de�nida positiva, então, pelo teorema 1.21, δ(A) = 0 e In(A) =

In(H). Com argumentos análogos a argumentos utilizados na demonstração

do teorema 1.21, provamos que, se δ(A) = 0, então existe uma matriz

simétrica de�nida positiva H ∈ Rn×n tal que H−AHAt é de�nida positiva.

Para toda a matriz A ∈ Fn×n, para toda a matriz hermítica H ∈ Fn×n e

toda a matriz não singular S ∈ Fn×n, temos que

H − AHA∗ > 0

é congruente com

(SHS∗)− (SAS−1)(SHS∗)(SAS−1)∗ > 0.

Assim, o teorema geral de inércia, quer no caso real quer no caso complexo,

fornece uma relação completa entre a classe de semelhança de A e a classe

de congruência de H, quando H −AHA∗ > 0, como pode ser observado no

seguinte teorema.

Teorema 1.27 Sejam A,H ∈ Fn×n, onde H é uma matriz hermítica. As

a�rmações seguintes são equivalentes:

(a1.27) Existe uma matriz hermítica H ′ ∈ Fn×n, congruente com H, tal que

H ′ − AH ′A∗ > 0.

28

Page 37: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.3. Objetivo

(b1.27) Existe uma matriz A′ ∈ Fn×n, semelhante com A, tal que

H − A′HA′∗ > 0.

(c1.27) Existe uma matriz hermítica H ′ ∈ Fn×n, congruente com H, e existe

A′ ∈ Fn×n, semelhante com A, tais que H ′ − A′H ′A′∗ > 0.

(d1.27) δ(A) = 0, e In(A) = In(H).

1.3 Objetivo

Consideremos um sistema S descrito por uma lista �nita de variáveis de

estado x1(t), . . . , xn(t), de�nidas em R+0 , com valores em F, que pode ser

in�uenciado por variáveis de controlo u1(t), . . . , up(t) e obedece à equação

linear seguinte

dx(t)

dt= Ax(t) +Bu(t) (1.9)

onde A ∈ Fn×n, B ∈ Fn×m,

x(t) =

x1(t)

...

xn(t)

, u(t) =

u1(t)

...

up(t)

.

De�nição 1.28 Dizemos que um sistema S, descrito acima, é controlável

se, quaisquer que sejam X0, X1 ∈ Fn×1, existir uma função contínua u(t),

29

Page 38: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.3. Objetivo

de�nida num intervalo de tempo real �nito [0, T ], com valores em Fm×1, tal

que a solução, x(t), de (1.9), com a condição inicial x(0) = X0, satisfaz

x(T ) = X1.

De�nição 1.29 Dizemos que um par de matrizes (A,B) ∈ Fn×n × Fn×m é

controlável se o sistema (1.9) for controlável.

De�nição 1.30 Dizemos que um sistema que obedece a (1.9) é estabilizável

se existir X ∈ Fm×m tal que, tomando u(t) = Xx(t), obtemos um sistema

estável.

De�nição 1.31 Chamamos matriz de controlabilidade de um par (A,B) ∈

Fn×n × Fn×m à matriz

C(A,B) :=

[B AB · · · An−1B

]∈ Fn×nm.

Teorema 1.32 Para um sistema S, descrito acima, são equivalentes as

a�rmações seguintes.

1. S é controlável.

2. carC(A,B) = n.

3. minλ∈C car

[λIn − A B

]= n.

30

Page 39: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.3. Objetivo

4. Os fatores invariantes de

[xIn − A B

]∈ F[x]n×m são todos iguais

a 1.

De�nição 1.33 Dizemos que o par de matrizes (A,B) ∈ Fn×n × Fn×m é

estabilizável (respetivamente, estabilizável positivo) se existir X ∈ Fm×n tal

que a matriz A+BX é estável (respetivamente, estável positiva).

Consideremos agora um sistema S descrito por um vetor de variáveis de

estado discretas x(t), de�nidas em Z+0 , com valores em Fn×1, que pode

ser in�uenciado por um vetor de controlo u(t) e obedece à equação linear

seguinte

x(t+ 1) = Ax(t) +Bu(t) (1.10)

onde A ∈ Fn×n e B ∈ Fn×m.

De�nição 1.34 Dizemos que um sistema S, descrito acima, é controlável

se, quaisquer que sejam X0, X1 ∈ Fn×1, existir uma função u(t), de�nida

num intervalo �nito {0, 1, . . . , T} de Z com valores em Fn×1, tal que a solu-

ção, x(t), de (1.10), com a condição inicial x(0) = X0, satisfaz x(T ) = X1.

Para este sistema S, com variável discreta, o teorema 1.32 também é satis-

feito.

Dizemos que S é estabilizável se existir X ∈ Fm×n tal que, tomando u(t) =

Xx(t), o sistema resultante x(t+ 1) = (A+BX)x(t) é estável.

31

Page 40: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

1.3. Objetivo

De�nição 1.35 Dizemos que um par de matrizes (A,B) ∈ Fn×n × Fn×m é

estabilizável relativamente ao círculo unitário se existir X ∈ Fm×n tal que

A+BX é estável relativamente ao círculo unitário.

Nesta dissertação, procuramos extender os resultados sobre estabilidade

apresentados na secção 1.2 e outros que serão apresentados nos capítulos

seguintes, de modo a obter novos resultados sobre a estabilização de siste-

mas lineares com variáveis de controlo.

32

Page 41: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Capítulo 2

Estabilização de Sistemas de

Variável Contínua

2.1 Generalização do Teorema de Lyapunov

Neste capítulo, vamos abordar o estudo da estabilização de sistemas de

variáveis contínuas.

De�nição 2.1 Sejam A ∈ Fn×n, B ∈ Fn×m. De�nimos polinómio carate-

rístico de (A,B) como sendo o produto dos fatores invariantes de[xIn − A B

]. (2.1)

33

Page 42: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.1. Generalização do Teorema de Lyapunov

De�nição 2.2 Sejam A ∈ Fn×n, B ∈ Fn×m. De�nimos valores próprios de

(A,B) como sendo as raízes do polinómio caraterístico de (A,B).

De�nição 2.3 Se A ∈ Cn×n, B ∈ Cn×m, de�nimos inércia de (A,B) como

sendo o triplo

In(A,B) = (π(A,B), ν(A,B), δ(A,B))

onde π(A,B), ν(A,B) e δ(A,B) representam o número dos valores pró-

prios de (A,B) com parte real positiva, parte real negativa e parte real nula,

respetivamente.

A descrição dos possíveis polinómios caraterísticos de A + BX, quando X

varia, apresentado no seguinte lema, é um resultado conhecido da teoria de

controlo, presente, por exemplo, em [18, teorema 13]. Para resultados mais

gerais ver [28, teorema 2.6].

Lema 2.4 Sejam A ∈ Fn×n, B ∈ Fn×m. Seja f ∈ F[x] um polinómio mó-

nico de grau n. Existe X ∈ Fm×n tal que A+BX tem polinómio caraterístico

f se e só se o produto dos fatores invariantes de (2.1) divide f .

Lema 2.5 [24] Sejam A ∈ Fn×n e B ∈ Fn×m. Seja f ∈ F[x] um polinómio

34

Page 43: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.1. Generalização do Teorema de Lyapunov

mónico de grau n+m. Existem matrizes C ∈ Fm×n e D ∈ Fm×m tais que

L =

A B

C D

(2.2)

tem polinómio caraterístico f se e só se o polinómio caraterístico de (A,B)

divide f .

Podemos observar que, sendo A ∈ Fn×n, B ∈ Fn×m, as seguintes a�rmações

são corolários dos lemas anteriores.

Corolário 2.6 O par de matrizes (A,B) é estabilizável positivo se e só se

as raízes do seu polinómio caraterístico têm parte real positiva.

Corolário 2.7 O par de matrizes (A,B) é estabilizável positivo se e só se

existem C ∈ Fm×n, D ∈ Fm×m tais que (2.2) é estável positiva.

Corolário 2.8 Dada uma matriz do tipo (2.2), tem-se que

In(A,B) ≤ In(L).

Estamos agora em condições de generalizar, para pares de matrizes, o teo-

rema de Lyapunov.

35

Page 44: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.1. Generalização do Teorema de Lyapunov

Teorema 2.9 [5]

Sejam A ∈ Fn×n e B ∈ Fn×m. O par de matrizes (A,B) é estabilizável

positivo se e só se existem uma matriz de�nida positiva H1 ∈ Fn×n e uma

matriz H2 ∈ Fn×m tais que

AH1 +H1A∗ +BH∗2 +H2B

∗ > 0. (2.3)

Demonstração. Suponhamos que (A,B) é estabilizável positivo. Seja

X ∈ Fm×n uma matriz tal que A + BX é estável positiva. De acordo com

o teorema de Lyapunov, existe uma matriz de�nida positiva H1 ∈ Fn×n tal

que

(A+BX)H1 +H1(A+BX)∗ > 0.

Então (2.3) é válido, com H2 = H1X∗. Reciprocamente, suponhamos que

(2.3) é válido, com H1 de�nida positiva. Então

(A+BH∗2H−11 )H1 +H1(A

∗ +H−11 H2B∗) > 0.

Pelo teorema de Lyapunov, A+BH∗2H−11 é estável positiva. Portanto (A,B)

é estabilizável positivo.

36

Page 45: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

2.2 Generalização do Teorema Geral da Inér-

cia

O problema que vamos abordar de seguida é a generalização para pares de

matrizes do teorema geral da inércia.

Comecemos por ver as noções de semelhança por blocos e congruência por

blocos para pares de matrizes.

Seja

S =

P 0

R Q

∈ F(n+m)×(n+m), onde P ∈ Fn×n, (2.4)

uma matriz não singular.

De�nição 2.10

[A B

]e

[A′ B′

], onde A, A′ ∈ Fn×n e B, B′ ∈

Fn×m, são semelhantes por blocos se existe uma matriz não singular da

forma (2.4) tal que

[A′ B′

]= P

[A B

]S−1.

É fácil de ver que

[A B

]e

[A′ B′

]são semelhantes por blocos se e

só se os feixes de matrizes

[xIp − A B

]e

[xIp − A′ B′

]são estrita-

mente equivalentes. Assim a forma normal para a semelhança por blocos

resulta facilmente da forma normal de Kronecker para a equivalência estrita.

Um estudo detalhado dos feixes de matrizes pode encontrar-se em [8].

37

Page 46: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

Lema 2.11 (Forma normal para a semelhança por blocos) [26, teo-

rema 2.11]

Sejam A ∈ Fn×n, B ∈ Fn×m. A matriz

[A B

]é semelhante por blocos a

uma única matriz da forma N 0 0

0 M1 M2

, (2.5)

onde

N = C(f1)⊕ · · · ⊕ C(fw) ∈ Fd×d,

M1 = C(xµ1)⊕ · · · ⊕ C(xµu) ∈ F(n−d)×(n−d),

M2 =

[e(n−d)µ1 e

(n−d)µ1+µ2 · · · e

(n−d)µ1+···+µu 0

]∈ F(n−d)×m,

onde f1(x) | · · · | fw(x), são polinómios mónicos, w ≥ 0, d = gr(f1 · · · fw)

e 0 ≤ µ1 ≤ · · · ≤ µu com u ≥ 0. Os polinómios f1, . . . , fw são os fatores

invariantes não constantes e µ1, . . . , µu são os indices minimais para as

colunas diferentes de 0 do feixe (2.1).

De�nição 2.12 Duas matrizes

[H1 H2

]e

[H ′1 H ′2

], onde H1, H

′1 ∈

Fn×n são hermíticas e H2, H′2 ∈ Fn×m, são congruentes por blocos se existir

uma matriz não singular da forma (2.4) tal que[H ′1 H ′2

]= P

[H1 H2

]S∗.

38

Page 47: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

Lema 2.13 (Forma normal para a congruência por blocos)[5]

Sejam H1 ∈ Fn×n uma matriz hermítica e H2 ∈ Fn×m. Então

[H1 H2

]é congruente por blocos com uma única matriz da forma

Iπ 0 0 0 0 0

0 −Iν 0 0 0 0

0 0 0ρ 0 Iρ 0

0 0 0 0n−π−ν−ρ 0 0

(2.6)

Neste caso, π = π(H1), ν = ν(H1) e ρ = ρ(H1, H2) := car

[H1 H2

]−

car(H1).

Demonstração. Existência. Como H1 é hermítica, existe uma matriz

não singular P ∈ Fn×n tal que

PH1P∗ = Iπ ⊕ (−Iν)⊕ 0,

onde π = π(H1), ν = ν(H1). Suponhamos que PH2 =

[M t

1 M t2 M t

3

]t,

onde M1 ∈ Fπ×m, M2 ∈ Fν×m e M3 ∈ F(n−π−ν)×m. Note-se que

car(M3) = ρ(H1, H2) := car

[H1 H2

]− car(H1).

Sejam P0 ∈ F(n−π−ν)×(n−π−ν), Q ∈ Fm×m matrizes não singulares tais que

P0M3Q = Iρ ⊕ 0, onde ρ = ρ(H1, H2). Então

[H1 H2

]é congruente por

39

Page 48: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

blocos comIπ 0 0

0 Iν 0

0 0 P0

(P

[H1 H2

](P ∗ ⊕ Iq)

)

Iπ 0 0 −M1Q

0 Iν 0 M2Q

0 0 P ∗0 0

0 0 0 Q

,

e, esta matriz tem a forma prescrita.

Unicidade. Se

[H1 H2

]é congruente por blocos com uma matriz da

forma (2.6), é fácil ver que, π = π(H1), ν = ν(H1) e ρ = car

[H1 H2

]−

car(H1).

Temos assim, que duas matrizes[H1 H2

]e

[H ′1 H ′2

], onde H1, H

′1 ∈ Fn×n

são hermíticas e H2, H′2 ∈ Fn×m, são congruentes por blocos se e só se

In(H1) = In(H ′1) e ρ(H1, H2) = ρ(H ′1, H′2).

Estamos agora em condições de generalizar o teorema geral da inércia.

Teorema 2.14 [7] Sejam A ∈ Fn×n, B ∈ Fn×m. Existe uma matriz her-

mítica H1 ∈ Fn×n e existe H2 ∈ Fn×m tais que (2.3) é válido se e só se

δ(A,B) = 0. E se (2.3) é válido então In(A,B) ≤ In(H1).

Demonstração. Suponhamos que existe uma matriz hermítica H1 ∈ Fn×n

e existe uma matrizH2 ∈ Fn×m tais que (2.3) é válido. Suponhamos também

40

Page 49: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

que δ(A,B) > 0 e ia, com a ∈ R, é um valor próprio de (A,B).

Por [18, lema 3.3.3], existe uma matriz P ∈ Cn×n não singular tal que

P

[A B

](P−1 ⊕ Im) =

A1 A2 B1

0 A3 0

,onde A1, A3 são blocos quadrados e (A1, B1) é controlável. Então os valores

próprios de (A,B) são exatamente os valores próprios de A3. Podemos

assumir que P pode ser escolhida de forma que A3 seja a forma normal de

Jordan e a última linha de A3 é

[0 . . . 0 ia

]. Então,

P (AH1 +H1A∗ +BH∗2 +H2B

∗)P ∗, (2.7)

tem a entrada (n, n) iguais a 0, o que é impossível, porque (2.7) é de�nida

positiva. Portanto δ(A,B) = 0.

Mais, (2.7) tem uma submatriz principal da forma A3H0 +H0A∗3, onde H0 é

uma submatriz principal de PH1P∗. Pelo teorema geral da inércia, In(H0) =

In(A3) = In(A,B). Como δ(H0) = δ(A,B) = 0, então, pelas desigualdades

de entrelaçamento dos valores próprios para matrizes hermíticas, In(H0) ≤

In(H1). Assim In(A,B) ≤ In(H1).

Reciprocamente, suponhamos que δ(A,B) = 0. Seja h ∈ F[x] um polinómio

mónico de grau n, múltiplo do polinómio caraterístico de (A,B), tal que

δ(h) = 0. De acordo com o lema 2.4, existe X ∈ Fm×n tal que A+BX tem

polinómio caraterístico h. De acordo com o teorema geral de inércia, existe

uma matriz hermítica H1 ∈ Fn×n tal que

(A+BX)H1 +H1(A+BX)∗ > 0.

41

Page 50: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

Então (2.3) é válido, com H2 = H1X∗.

Observação 2.15 Notemos que o teorema anterior é uma generalização do

teorema geral da inércia, porque quando B = 0, a soma das três componen-

tes de In(A,B) é igual a n e inequação In(A,B) ≤ In(H1) torna-se numa

igualdade.

Por outro lado, dada uma matriz do tipo (2.4) temos que a matriz

AH1 +H1A∗ +BH∗2 +H2B

é congruente com a seguinte matriz:

(P

[A B

]S−1

)S H1

H∗2

P ∗

+

(P

[H1 H2

]S∗)(S∗)−1

A∗

B∗

P ∗ .

Tendo em conta esta observação, é fácil concluir que o próximo teorema

fornece um conjunto completo de relações entre a classe de semelhança por

blocos de

[A B

]e a classe de congruência por blocos de

[H1 H2

],

quando (2.3) é válida.

Teorema 2.16 [5] Sejam A ∈ Fn×n, B ∈ Fn×m. Sejam π, ν, δ e ρ intei-

ros não negativos tais que π + ν + δ = n. As seguintes a�rmações são

equivalentes.

42

Page 51: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

(a2.16) Existe uma matriz hermítica H1 ∈ Fn×n e existe uma matriz H2 ∈

Fn×m tais que (2.3) é válido, In(H1) = (π, ν, δ) e ρ(H1, H2) = ρ.

(b2.16) ρ = δ ≤ car(B) e In(A,B) ≤ (π, ν, 0).

Demonstração. (a2.16)⇒ (b2.16). Se car

[H1 H2

]< n, então

[H1 H2

]é congruente por blocos com uma matriz em que a última linha é nula. Sem

perda de generalidade, suponhamos que a última linha de

[H1 H2

nula. Então, a entrada (n, n) da matriz AH1 +H1A∗+BH∗2 +H2B

∗ é igual

a zero, o que é uma contradição. Temos assim que car

[H1 H2

]= n,

logo ρ = δ. Então,

[H1 H2

]é congruente por blocos com

∆ 0 0 0

0 0ρ Iρ 0

,onde ∆ ∈ F(n−ρ)×(n−ρ) é hermítica e In(∆) = (π, ν, 0).

Sem perda de generalidade, consideremos que

[H1 H2

]tem esta forma.

Particionando A e B de modo análogo

A =

A1,1 A1,2

A2,1 A2,2

, B =

B1,1 B1,2

B2,1 B2,2

,onde A1,1 ∈ F(n−ρ)×(n−ρ) e B1,1 ∈ F(n−ρ)×ρ. Então B2,1 +B∗2,1 é uma subma-

triz principal de AH1 + H1A∗ + BH∗2 + H2B

∗ e portanto B2,1 + B∗2,1 > 0.

Temos também que car(B) ≥ car(B2,1) = ρ = δ. No que se segue vamos

provar que In(A,B) ≤ (π, ν, 0). Consideremos, sem perda de generalidade,

43

Page 52: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

que

[A B

]tem a forma de (2.5). Particionemos

[H1 H2

]de modo

análogo [H1 H2

]=

G1,1 G1,2 G1,3

G∗1,2 G2,2 G2,3

,onde G1,1 ∈ Fd×d, G2,2 ∈ F(n−d)×(n−d). Então, NG1,1 + G1,1N

∗ é uma sub-

matriz principal da matriz AH1 +H1A∗ +BH∗2 +H2B

∗.

Assim NG1,1 + G1,1N∗ > 0. Pelo teorema geral da inércia, δ(N) = 0 e

In(N) = In(G1,1). Pelas condições de desigualdades de entrelaçamento dos

valores próprios para matrizes hermíticas, resulta que π(G1,1) ≤ π(H1) e

ν(G1,1) ≤ ν(H1). Então In(A,B) = In(N) = In(G1,1) ≤ (π, ν, 0).

(b2.16) ⇒ (a2.16). Sejam γ1 | . . . | γn os fatores invariantes de (2.1). Como

ρ ≤ car(B), temos que γ1 = · · · = γρ = 1 e existem matrizes não singulares

U ∈ Fn×n, V ∈ Fm×m tais que

UBV = B1,1 ⊕ Iρ,

para alguma matriz B1,1 ∈ F(n−ρ)×(n−ρ). Suponhamos que

[A′ B′

]:= U

[A B

] (U−1 ⊕ V

)=

A1,1 A1,2 B1,1 0

A2,1 A2,2 0 Iρ

,onde os blocos A′, A1,1, A2,2 são matrizes quadradas. Os fatores invariantes

de

[xIn−ρ − A1,1 A1,2 B1,1

]são γρ+1, . . . , γn. Como In(γρ+1 . . . γn) =

In(A,B) ≤ (π, ν, 0), podemos escolher um polinómio mónico h tal que

In(γρ+1 . . . γnh) = (π, ν, 0). Pelo lema 2.4, existem X ∈ Fρ×(n−ρ) e Y ∈

F(m−ρ)×(n−ρ) tais que A1,1 + A1,2X + B1,1Y tem polinómio caraterístico

44

Page 53: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.2. Generalização do Teorema Geral da Inércia

γρ+1 . . . γnh. Então

[A B

]é semelhante por blocos com

[A′′ B′′

]:=

In−ρ 0

−X Iρ

[ A′ B′]

In−ρ 0 0

X Iρ 0

Y 0 Im−ρ

⊕ Iρ

e

[A′′ B′′

]tem a forma

A′1,1 A1,2 B1,1 0

∗ ∗ ∗ Iρ

,onde A′1,1 = A1,1 + A1,2X + B1,1Y . É claro que

[A′′ B′′

]é semelhante

por blocos com A′1,1 A1,2 B1,1 0

0 0 0 Iρ

.Sem perda de generalidade, consideremos que

[A B

]tem esta forma.

Pelo teorema geral da inércia, existe uma matriz hermítica ∆ ∈ F(n−ρ)×(n−ρ)

tal que A′1,1∆ + ∆A′∗1,1 > 0 e In(∆) = In(A′1,1) = (π, ν, 0). Sejam

H1 =

∆ 0

0 0

∈ Fn×n, H2 =

0 0

0 Iρ

∈ Fn×m.

Então In(H1) = (π, ν, δ), ρ(H1, H2) = ρ e

AH1 +H1A∗ +BH∗2 +H2B

∗ = (A′1,1∆ + ∆A′∗1,1)⊕ 2Iρ > 0.

45

Page 54: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

2.3 Generalização de um Teorema de Chen e

Wimmer

Chen [4] e Wimmer [25] provaram .

Teorema 2.17 [4, 25] Sejam A,H ∈ Fn×n, onde H é hermítica. Se

(a2.17) Existe uma matriz hermítica H ′ ∈ Fn×n, congruente com H, tal que

K := AH ′ +H ′A∗ ≥ 0 e (A,K) é controlável.

Então (d1.13) do teorema 1.13 é válido.

O recíproco é trivialmente verdadeiro, pois (d1.13) ⇒ (a1.13) ⇒ (a2.17). O

nosso propósito seguinte é obter uma generalização do teorema de Chen e

Wimmer para pares de matrizes.

Lema 2.18 Sejam G, Y ∈ Fn×n matrizes hermíticas e suponha-se que Y

é não singular. Então existe um número real positivo ε tal que, para todo

λ ≥ ε, In(G+ λY ) = In(Y ).

46

Page 55: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

Demonstração. Para todo o número real positivo λ, In(G + λY ) =

In(λ−1G+ Y ). Como

limλ→+∞

(λ−1G) = 0

e Y é não singular, a conclusão resulta da continuidade dos valores próprios.

Lema 2.19 Sejam G1,1 ∈ Fd×d, Y ∈ F(n−d)×(n−d) matrizes hermíticas não

singulares. Seja G1,2 ∈ Fd×(n−d) uma matriz. Então existe um número real

positivo ε tal que, para todo λ ≥ ε,

In

G1,1 G1,2

G∗1,2 λY

= In(G1,1) + In(Y ).

Demonstração. Para todo o número real positivo λ G1,1 G1,2

G∗1,2 λY

é congruente com G1,1⊕ (λY −G∗1,2G−11,1G1,2). Então a conclusão resulta do

lema anterior.

Lema 2.20 Sejam M1 ∈ Fn×n, M2 ∈ Fn×m. Suponhamos que (M1,M2) é

controlável. Então existem Y−, Y+ ∈ Fn×n, Z−, Z+ ∈ Fn×m tais que Y−, Y+

são hermíticas, Y− < 0, Y+ > 0 e

M1Y− + Y−M∗1 +M2Z

∗− + Z−M

∗2 > 0, (2.8)

M1Y+ + Y+M∗1 +M2Z

∗+ + Z+M

∗2 > 0. (2.9)

47

Page 56: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

Demonstração. Podemos considerar, sem perda de generalidade, que a

matriz

[M1 M2

]está na forma normal para a semelhança por blocos.

Vamos provar que existem Y− ∈ Fn×n, Z− ∈ Fn×m tais que Y− < 0 e (2.8) é

válido. O resto da demonstração é análoga.

Primeiro, suponhamos que car(M2) = 1. Podemos considerar que

M1 = C(xp), M2 =

[e(n)n 0 · · · 0

].

Neste caso, a demonstração é feita por indução em n. Se n = 1, seja[Y− Z−

]:=

[−1 1 0 · · · 0

].

Suponhamos que n ≥ 2, e que

[M1 M2

]=

L1 L2 0 0 · · · 0

0 0 1 0 · · · 0

,onde L1 ∈ F(n−1)×(n−1), L2 ∈ F(n−1)×1. De acordo com a hipótese de in-

dução, existe uma matriz de�nida negativa R ∈ F(n−1)×(n−1) e existe uma

matriz S ∈ F(n−1)×1 tais que L1R+RL∗1 +L2S∗+SL∗2 > 0. Vamos escolher

µ ∈ R tal que

Y− :=

R S

S∗ µ

tenha determinante (−1)n. Então escolhemos λ ∈ R tal que, com

Z− :=

0 0 · · · 0

λ 0 · · · 0

∈ Fn×m,

a matriz

M1Y− + Y−M∗1 +M2Z

∗− + Z−M

∗2

48

Page 57: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

=

L1R +RL∗1 + L2S∗ + SL∗2 L1S + µL2

S∗L∗1 + µL∗2 2λ

tem determinante positivo. Utilizando o critério dos determinantes dos

menores principais lideres, deduzimos que Y− é de�nida negativa e M1Y−+

Y−M∗1 +M∗

2Z∗− + Z−M

∗2 é de�nida positiva.

Suponhamos que u := car(M2) ≥ 2. Podemos considerar que

M1 = C(xµ1)⊕ · · · ⊕ C(xµu),

M2 =

[e(n)µ1 e

(n)µ1+µ2 · · · e

(n)µ1+···+µu 0

].

De acordo com o caso anterior, para todo i ∈ {1, . . . , u}, existem matrizes

de�nidas negativas Yi ∈ Fµi×µi e existem Zi ∈ Fµi×1 tais que

C(xµi)Yi + YiC(xµi)∗ + e(µi)µiZ∗i + Zie

(µi)∗µi

> 0.

Seja Y− = Y1⊕· · ·⊕Yu ∈ Fn×n e Z− =

[Z1 ⊕ · · · ⊕ Zu 0

]∈ Fn×m. Então

Y− é de�nida negativa e (2.8) é satisfeito.

Lema 2.21 Sejam M1 ∈ Fn′×n′ , M2 ∈ Fn′×m. Consideremos que (M1,M2)

é controlável. Então, para todo c1, . . . , cn′ ∈ F,[M1 M2

]é semelhante

por blocos a uma matriz da forma

[M ′

1 M ′2

]onde M ′

1 ∈ Fn′×n′ é trian-

gular superior com entrada (i, i) igual a ci, para todo i ∈ {1, · · · , n′}, e M ′2

tem a forma 0 0

Icar(M2) 0

. (2.10)

49

Page 58: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

Demonstração. Por indução em n′. Como (M1,M2) é controlável,

car(M2) > 0. Sejam P ∈ Fn′×n′ e Q ∈ Fm×m matrizes não singulares

tais que M ′2 := PM2Q tem a forma (2.10). Seja s = car(M2).

Se n′ = s, então, para toda M ′1 ∈ Fn′×n′ ,

[M1 M2

]é semelhante por

blocos com

[M ′

1 M ′2

]e o resultado é trivial.

Suponhamos agora que n′ > s. Então

[M1 M2

]é semelhante por blocos

com

P

[M1 M2

](P−1 ⊕Q) =

N1 N2 0 0

∗ ∗ Is 0

,onde N1 ∈ F(n′−s)×(n′−s), N2 ∈ F(n′−s)×s. Notemos que (N1, N2) é contro-

lável. De acordo com a hipótese de indução,

[N1 N2

]é semelhante por

blocos com uma matriz da forma

[N ′1 N ′2

], onde N ′1 ∈ F(n′−s)×(n′−s)

é triangular superior com as entradas (i, i) iguais a ci, para todo i ∈

{1, · · · , n′ − s}. Então[M1 M2

]é semelhante por blocos com

N ′1 N ′2 0 0

0 diag(cn′−s+1, . . . , cn′) Is 0

.A última matriz tem a forma prescrita.

O próximo resultado generaliza o teorema de Chen e Wimmer para pares

de matrizes.

50

Page 59: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

Teorema 2.22 [5] Seja A ∈ Fn×n, B ∈ Fn×m. Sejam π, ν, δ e ρ números

inteiros não negativos tais que π + ν + δ = n. Sejam γ1 | · · · | γn os fatores

invariantes de (2.1). As a�rmações seguintes são equivalentes:

(a2.22) Existe uma matriz hermítica H1 ∈ Fn×n e existe uma matriz H2 ∈

Fn×m tais que In(H1) = (π, ν, δ), ρ(H1, H2) = ρ,

K := AH1 +H1A∗ +BH∗2 +H2B

∗ ≥ 0. (2.11)

e

(A,

[B K

])é controlável.

(b2.22) ρ ≤ m, ρ ≤ δ ≤ n− gr(γ1 · · · γp) e In(A,B) ≤ (π, ν, 0).

Demonstração. (a2.22) ⇒ (b2.22). Vamos primeiro considerar que H1 é

não singular. É claro que ρ = δ = 0 ≤ n − gr(γ1 · · · γn). Sem perda de

generalidade, suponhamos que

H1 = Iπ ⊕ (−Iν), H2 = 0.

Particionando

[A B

]de modo semelhante:

[A B

]=

A1,1 A1,2 B1

A2,1 A2,2 B2

,onde A1,1 ∈ Fπ×π, A2,2 ∈ Fν×ν . Seja j ∈ {−1, 1}. Sejam

Lj =

A1,1 A1,2 B1

A2,1 A2,2 B2

−jB∗1 jB∗2 jIm

, Gj = Iπ ⊕ (−Iν)⊕ (jIm).

51

Page 60: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

Então

LjGj +GjL∗j = K ⊕ 2Im ≥ 0.

Como

(A,

[B K

])é controlável, resulta que (Lj, LjGj + GjL

∗j) é con-

trolável. Pelo teorema de Chen e Wimmer, In(Lj) = In(Gj). Pelo Lema 2.5

In(A,B) ≤ In(Lj). Então

In(A,B) ≤ In(L−1) = In(G−1) = (π, ν +m, 0),

In(A,B) ≤ In(L1) = In(G1) = (π +m, ν, 0).

Portanto In(A,B) ≤ (π, ν, 0).

Vamos agora ver o caso geral. A condição ρ ≤ m é trivial. Sem perda de

generalidade, suponha-se que

[A B

]tem a forma (2.5). Particionando[

H1 H2

]de modo análogo:

[H1 H2

]=

G1,1 G1,2 G1,3

G∗1,2 G2,2 G2,3

,onde G1,1 ∈ Fd×d, G2,2 ∈ F(n−d)×(n−d). Então

K =

NG1,1 +G1,1N∗ NG1,2 +G1,2M

∗1 +G1,3M

∗2

G∗1,2N∗ +M1G

∗1,2 +M2G

∗1,3 M1G2,2 +G2,2M

∗1 +M2G

∗2,3 +G2,3M

∗2

.(2.12)

Com vista a obter uma contradição, suponhamos que G1,1 é singular. Seja

e = car(G1,1). Então existe uma matriz não singular U ∈ Fd×d tal que

G′1,1 := UG1,1U∗ = 0d−e ⊕ ∆, onde ∆ é não singular ou não existe (isto é,

52

Page 61: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

G1,1 = 0). Particionemos N ′ = UNU−1 de modo análogo

N ′ =

N1,1 N1,2

N2,1 N2,2

,onde N1,1 ∈ F(d−e)×(d−e). Então NG1,1 +G1,1N

∗ é congruente com

N ′G′1,1 +G′1,1N′∗ =

0d−e N1,2∆

∆N∗1,2 N2,2∆ + ∆N∗2,2

.Como NG1,1 + G1,1N

∗ ≥ 0, temos que N1,2∆ = 0. Mas, como ∆ é não

singular, N1,2 = 0. Notemos que N ′G′1,1 + G′1,1N′∗ é uma submatriz líder

principal de

K ′ := (U ⊕ In−d)K(U∗ ⊕ In−d).

Como K ≥ 0 e K ′ é congruente com K, deduzimos que as primeiras d − e

linhas de K ′ são nulas. Então

[A B K

]é semelhante por blocos com

(U ⊕ In−d)[A B K

](U−1 ⊕ In−d+m ⊕ U∗ ⊕ In−d) =

N1,1 0 0

∗ ∗ ∗

.Se λ ∈ C é um valor próprio de N1,1 então car

[λIn − A B K

]< n.

Isto é uma contradição, porque

(A,

[B K

])é controlável. Portanto

G1,1 é não singular. Então d = car(G1,1) ≤ car(H1) = n − δ e ρ ≤ δ ≤

n− d = n− gr(γ1 · · · γn).

Para toda a matriz hermítica Y ∈ F(n−d)×(n−d) e toda a matriz Z ∈ F(n−d)×m,

seja KY,Z a matriz que resulta de K substituindo G2,2 por Y e G2,3 por Z

em (2.12). Como (M1,M2) é controlável, todos os fatores invariantes de[xIn−d −M1 M2

](2.13)

53

Page 62: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

são iguais a 1 e a forma normal de Smith de (2.13) é

[In−d 0

]. Tendo

em conta a forma (2.5) de

[A B

], deduzimos que[

xIn − A B KY,Z

]é equivalente, em F[x], a[xId −N NG1,1 +G1,1N

∗ NG1,2 +G1,2M∗1 +G1,3M

∗2

]⊕[In−d 0

].

(2.14)

Podemos observar que (2.14) não depende de Y nem de Z. Em particular,

sabemos que

(A,

[B K

])é controlável e, portanto, (2.14) tem todos os

seus fatores invariantes iguais a 1. Consequentemente

(A,

[B KY,Z

])é controlável, para toda a matriz hermítica Y ∈ F(n−d)×(n−d) e toda a

matriz Z ∈ F(n−d)×m. De acordo com o lema 2.20, existem Y−, Y+ ∈

F(n−d)×(n−d), Z−, Z+ ∈ F(n−d)×m tais que Y−, Y+ são hermíticas, Y− <

0, Y+ > 0 e (2.8),(2.9) são satisfeitos. Para todo o número real positivo

λ, sejam

H1,−λ =

G1,1 G1,2

G∗1,2 λY−

, H2,−λ =

G1,3

λZ−

,

H1,λ =

G1,1 G1,2

G∗1,2 λY+

, H2,λ =

G1,3

λZ+

.Notemos que

AH1,−λ +H1,−λA∗ +BH∗2,−λ +H2,−λB

∗ = KλY−,λZ− ,

AH1,λ +H1,λA∗ +BH∗2,λ +H2,λB

∗ = KλY+,λZ+ .

54

Page 63: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

De acordo com o lema 2.19, existe um número real positivo ε tal que, para

todo λ ≥ ε,

In(H1,−λ) = In(G1,1) + (0, n− d, 0),

In(H1,λ) = In(G1,1) + (n− d, 0, 0),

e H1,−λ e H1,λ são não singulares.

Seja V ∈ Fd×d uma matriz não singular tal que

V (NG1,1 +G1,1N∗)V ∗ = 0d−r ⊕∆,

onde r = car(NG1,1 + G1,1N∗) e ∆ ∈ Fr×r é de�nida positiva. Então

(V ⊕ In−d)K(V ∗ ⊕ In−d) tem a forma0d−r 0 P

0 ∆ Q

P ∗ Q∗ M1G2,2 +G2,2M∗1 +M2G

∗2,3 +G2,3M

∗2

,

para algumas matrizes P, Q. Como K ≥ 0, deduzimos que P = 0. Notemos

que, para algum número real positivo λ, (V ⊕In−d)KλY−,λZ−(V ∗⊕In−d) tem

a forma

0d−r ⊕

∆ Q

Q∗ λ(M1Y− + Y−M∗1 +M2Z

∗− + Z−M

∗2 )

.Pelo lema 2.19 existe um número real positivo ε− tal que, para todo λ ≥ ε−,

KλY−,λZ− é semide�nida positiva. Analogamente, existe um número real

positivo ε+ tal que, para todo o λ ≥ ε+, KλY+,λZ+ é semide�nida positiva.

55

Page 64: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.3. Generalização de um Teorema de Chen e Wimmer

Para λ ≥ max{ε, ε+, ε−}, pelo caso estudado em primeiro lugar e pelas desi-

gualdades de entrelaçamento dos valores próprios para matrizes hermíticas,

resulta que

In(A,B) ≤ In(H1,−λ) = In(G1,1) + (0, n− d, 0) ≤ (π, ν + n− d, 0),

In(A,B) ≤ In(H1,λ) = In(G1,1) + (n− d, 0, 0) ≤ (π + n− d, ν, 0).

Portanto In(A,B) ≤ (π, ν, 0).

(b2.22) ⇒ (a2.22). Suponhamos que

[A B

]está na forma (2.5. Temos

que In(N) = In(A,B) ≤ (π, ν, 0). Então d = gr(γ1 · · · γn) ≤ π + ν.

Seja n′ = n− d. Seja[M ′

1 M ′2

]uma matriz, semelhante por blocos com[

M1 M2

], da forma indicada no lema 2.21, com os elementos c1, . . . , c′n

escolhidos tais que, se M0 é a submatriz líder principal de M ′1 de tamanho

(π + ν − d)× (π + ν − d), então In(N ⊕M0) = (π, ν, 0).

Então

[A B

]é semelhante por blocos com N 0 0

0 M ′1 M ′

2

.Como ρ ≤ δ = n − π − ν, não é difícil deduzir que existe uma matriz de

permutação Q ∈ Fm×m tal que

M ′2Q =

0 B′1,2

B2,1 B2,2

∈ F(n−d)×m, onde B2,1 =

0 0

0 Ir

∈ Fδ×ρ,

r = min{car(B), ρ}. Particionando N ⊕M ′1 como A1,1 A1,2

0 A2,2

, onde A1,1 = N ⊕M0 ∈ F(π+ν)×(π+ν).

56

Page 65: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.4. Um Teorema de Inércia de Loewy

Então

[A B

]é semelhante por blocos com

A1,1 A1,2 0 B1,2

0 A2,2 B2,1 B2,2

, onde B1,2 =

0

B′1,2

. (2.15)

Sem perda de generalidade, suponhamos que

[A B

]tem a forma (2.15).

De acordo com o teorema geral da inércia, existe uma matriz hermítica

∆ ∈ F(π+ν)×(π+ν) tal que A1,1∆ + ∆A∗1,1 > 0 e In(∆) = In(A1,1) = In(N ⊕

M0) = (π, ν, 0). Seja

[H1 H2

]:=

∆ 0 0 0 0

0 0δ−ρ 0 0 0

0 0 0ρ Iρ 0

,

onde H1 é uma matriz n× n e H2 é uma matriz n×m. Então

In(H1) = (π, ν, δ), ρ(H1, H2) = ρ,

K := AH1 +H1A∗ +BH∗2 +H2B

∗ = (A1,1∆ + ∆A∗1,1)⊕ 0⊕ 2Ir ≥ 0,

e

(A,

[B K

])é controlável.

2.4 Um Teorema de Inércia de Loewy

Para todas as matrizes A ∈ Fn×n, B ∈ Fn×m, denotamos por i(A,B) o

número de fatores invariantes de (2.1) não constantes. Recordemos que

57

Page 66: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.4. Um Teorema de Inércia de Loewy

(A,B) é controlável se e só se i(A,B) = 0. O próximo lema é um corolário

de [16, 22], como se verá. Este também é uma consequência de [1]; e uma

consequência de [27], quando q = 0.

Lema 2.23 Sejam A ∈ Fn×n, B ∈ Fn×m. Então i(A,B) é o menor in-

teiro não negativo τ para o qual existe uma matriz X ∈ Fn×τ tal que(A,

[B X

])é controlável.

O resultado é válido quando q = 0.

Demonstração. Seja i(A,B) = τ . De acordo com [16, 22], existe

M(x) ∈ Fn×τ tal que[xIn − A B M(x)

]tem todos os fatores invarian-

tes iguais a 1. Suponhamos que M(x) = (xIn − A)Q(x) +X, onde Q(x) ∈

F[x]n×τ , X ∈ Fn×τ . Então

[xIn − A B M(x)

]e

[xIn − A B X

]são equivalentes, e portanto,

(A,

[B X

])é controlável.

Suponhamos agora que Y ∈ Fn×σ, onde σ < τ . Sejam γ1 | . . . | γn os fatores

invariantes de (2.1) e η1 | · · · | ηn os fatores invariantes de[xIp − A B Y

].

De acordo com [16, 22], γn−σ | ηn. Como γn−σ é não constante, isto implica

que

(A,

[B Y

])não é controlável.

Loewy [14] obteve condições necessárias para (a2.17) quando "(A,K) é con-

trolável"é substituído por uma condição mais geral "carC(A,K) = l, l ∈

58

Page 67: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.4. Um Teorema de Inércia de Loewy

{0, . . . , n}".

O próximo teorema fornece uma condição necessária para as a�rmações que

resultam de (a2.17), quando "(A,K) é controlável"é substituído pela a�r-

mação mais geral "i(A,K) = τ ". Também se irá obter uma versão deste

resultado para pares de matrizes.

Teorema 2.24 [5] Seja A ∈ Fn×n. Sejam π, ν, δ, τ inteiros não negativos

tais que π+ν+δ = n. Sejam α1 | . . . | αn os fatores invariantes de xIn−A.

Se existir uma matriz hermítica H ∈ Fn×n tal que In(H) = (π, ν, δ), K :=

AH +HA∗ ≥ 0 e i(A,K) = τ então

(b2.24) In(α1 · · ·αn−τ ) ≤ (π, ν, 0).

(Com a convenção de α1 · · ·αn−τ = 1, quando n = τ).

Observação 2.25 A condição (b2.24) implica que gr(α1 · · ·αn−τ ) ≤ π+ν =

n−δ e, portanto, δ ≤ n−gr(α1 · · ·αn−τ ). Como gr(α1 · · ·αn−τ ) = n, é fácil

deduzir que, quando τ = 0, (b2.24) é equivalente a (d1.13).

Omitimos a demonstração deste teorema, porque é análogo à demonstração

do próximo teorema.

Teorema 2.26 [5] Sejam A ∈ Fn×n, B ∈ Fn×m. Sejam π, ν, δ, τ inteiros

não negativos tais que π+ν+δ = n. Sejam γ1 | . . . | γn os fatores invariantes

59

Page 68: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.4. Um Teorema de Inércia de Loewy

de (2.1). Se existir uma matriz hermítica H1 ∈ Fn×n e existir uma matriz

H2 ∈ Fn×m tais que In(H1) = (π, ν, δ), (2.11) é válido e i

(A,

[B K

])=

τ , então In(γ1 · · · γn−τ ) ≤ (π, ν, 0). (Com a convenção de α1 · · ·αn−τ = 1,

quando n = τ).

Demonstração. Tendo em atenção a forma normal da semelhança por

blocos de

[A B K

](ver lema 2.11), existe uma matriz invertível P ∈

Fn×n tal que

A′ := PAP−1 =

N 0

M0 M1

, B′ := PB =

0

M2

,

K ′ := PKP ∗ =

0 0

0 M3

,ondeN ∈ Fe×e, M1 ∈ F(n−e)×(n−e), M2 ∈ F(n−e)×m, M3 ∈ F(n−e)×(p−e),

(M1,

[M2 M3

])é controlável e o número de fatores invariantes não constantes de xIe−N é

igual a i

(A,

[B K

])= τ .

De acordo com lema 2.23, existe D ∈ Fe×τ tal que (N,D) é controlável.

Então (A′,

[B′ E ′ K ′

])é controlável, onde

E ′ :=

D

0

.

60

Page 69: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

Além disso, K ′ = A′H ′1 +H ′1A′∗ +B′H ′∗2 +H ′2B

′∗ ≥ 0, onde H ′1 = PH1P∗ e

H ′2 = PH2. De acordo com o teorema 2.22, δ(H1) ≤ n− gr(η1 · · · ηn), onde

η1 | . . . | ηn são os fatores invariantes de

[x− In − A′ B′ E ′

], e

In

(A′,

[B′ E ′

])≤ (π(H1), ν(H1), 0). Pelas condições de desigualdades

entrelaçamento para os fatores invariantes [16, 22], ηi | γi e γi | ηi+τ , para

todos os indices i signi�cantes. Portanto

In(γ1 · · · γn−τ ) ≤ In(η1 · · · ηn) = In

(A′,

[B′ E ′

])≤ (π(H1), ν(H1), 0).

2.5 A Desigualdade π(AH +HA∗) ≥ l

O próximo objetivo é dar um conjunto completo de relações entre as clas-

ses de semelhança de A ∈ Fn×n e as classes de congruência de uma matriz

hermítica H ∈ Fn×n, quando π(AH +HA∗) ≥ l e também dar uma genera-

lização para par de matrizes.

Teorema 2.27 [7] Sejam A ∈ Fn×n, B ∈ Fn×m. Sejam γ1 | · · · | γn os

fatores invariantes de

[xIn − A B

]. Sejam π, ν, δ, ρ, l inteiros não ne-

gativos tais que π + ν + δ = n, ρ ≤ δ e l ≤ n. As seguintes a�rmações

são equivalentes:

61

Page 70: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

(a2.27) Existe uma matriz hermítica H1 ∈ Fn×n e existe H2 ∈ Fn×m tais que

In(H1) = (π, ν, δ), ρ(H1, H2) = ρ, e

π (AH1 +H1A∗ +BH∗2 +H2B

∗) ≥ l. (2.16)

(b2.27) As condições seguintes são válidas:

l ≤ π + ν + ρ, (2.17)

l ≤ π + ν + car(B), (2.18)

In(γ1 . . . γl) ≤ (π, ν, 0). (2.19)

Observação 2.28 Com vista á demonstração do teorema 2.27, podemos

substituir a matriz

[A B

]por uma que lhe seja semelhante por blocos.

Mas, primeiro vamos considerar dois lemas.

Lema 2.29 Sejam A ∈ Fn×n, B ∈ Fn×m. Sejam γ1| · · · |γn os fatores in-

variantes de

[xIp − A B

]. Sejam π, ν, l números inteiros não negativos

tais que π + ν ≤ n e l ≤ n. Se (2.19) é válido e l ≤ π + ν, então a matriz[A B

]é semelhante por blocos a uma matriz da forma

A1,1 A1,2 B1

A2,1 A2,2 B2

, (2.20)

onde A1,1 ∈ Fl×l, A2,2 ∈ F(n−l)×(n−l) e In(γ1 · · · γl) ≤ In(A1,1) ≤ (π, ν, 0).

62

Page 71: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

Demonstração. Como o grau do polinómio caraterístico de (A,B),

γ1 · · · γp, não deve exceder n, resulta que gr(γ1 · · · γl) ≤ l. Podemos es-

colher inteiros não negativos π′, ν ′ tais que π′ + ν ′ = l e In(γ1 · · · γl) ≤

(π′, ν ′, 0) ≤ (π, ν, 0). Consideremos agora, um polinómio mónico h ∈ F[x]

tal que In(γ1 · · · γlh) = (π′, ν ′, 0). Seja A ∈ Fl×l uma matriz tal que xIl−A1,1

tem fatores invariantes γ1 | . . . | γl−1 | γlh. Resulta de [3, Teorema 5] que

existe A′ ∈ Fn×n que contem A1,1 como submatriz líder principal e existe

B′ ∈ Fn×m tais que

[A′ B′

]e

[A B

]são semelhantes por blocos.

Lema 2.30 Sejam A ∈ Fn×n, B ∈ Fn×m. Sejam γ1 | . . . | γn os fatores

invariantes de

[xIn − A B

]. Sejam π, ν, l inteiros não negativos tais

que π + ν ≤ n e l ≤ n. Se (2.18), (2.19) são válidos e π + ν < l, então[A B

]é semelhante por blocos com uma matriz da forma

A1,1 A1,2 A1,3 B1 0

A2,1 A2,2 A2,3 B2 0

0 0 0l−π−ν 0 Il−π−ν

, (2.21)

onde A1,1 ∈ F(π+ν)×(π+ν), A2,2 ∈ F(n−l)×(n−l) e In(γ1 · · · γl) ≤ In(A1,1) =

(π, ν, 0).

Demonstração. Como l − π − ν ≤ car(B),

[A B

]é semelhante por

blocos a uma matriz da forma

63

Page 72: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

C1 C2 D 0

0 0 0 Il−π−ν

, (2.22)

onde C1 ∈ F(n−l+π+ν)×(n−l+π+ν), C2 ∈ F(n−l+π+ν)×(l−π−ν). Além disso, γ1 =

· · · = γl−π−ν = 1 e [xIn−l+π+ν − C1 C2 D

]tem fatores invariantes γ′1 | . . . | γ′n−l+π+ν , onde

γ′i = γi+l−π−ν , i ∈ {1, . . . , n− l + π + ν} .

Então

In(γ′1 · · · γ′π+ν) = In(γ1 · · · γl) ≤ (π, ν, 0).

De acordo com o lema 2.29,

[C1 C2 D

]é semelhante por blocos com

uma matriz da forma

[C ′1 C ′2 D′

]=

A1,1 A1,2 A′1,3 B′1

A2,1 A2,2 A′2,3 B′2

,onde C ′1 ∈ F(n−l+π+ν)×(n−l+π+ν), C ′2 ∈ F(n−l+π+ν)×(l−π−ν), A1,1 ∈ F(π+ν)×(π+ν), A1,2 ∈

F(π+ν)×(n−l), A′1,3 ∈ F(π+ν)×(l−π−ν) e

In(γ′1 · · · γ′π+ν) ≤ In(A1,1) = (π, ν, 0).

Seja

S0 =

P0 0

R0 Q0

∈ F(n+m−l+π+ν)×(n+m−l+π+ν),

64

Page 73: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

onde P0 ∈ F(n−l+π+ν)×(n−l+π+ν), é uma matriz invertível tal que[C ′1 C ′2 D′

]= P−10

[C1 C2 D

]S0.

Seja

T0 =

P0 0

R0 Im

∈ F(n+m−l+π+ν)×(n+m−l+π+ν).

Então P−10

[C1 C2 D

]T0 tem a forma

A1,1 A1,2 A1,3 B1

A2,1 A2,2 A2,3 B2

,onde A1,3 ∈ F(π+ν)×(l−π−ν). É fácil deduzir que

[A B

]é semelhante por

blocos com (2.21).

Demonstração. (do teorema 2.27) (a2.27)⇒ (b2.27). Parte I. Primeiro,

vamos provar (2.17) e (2.19). Seja P ∈ Fn×n uma matriz invertível tal

que P (AH1 + H1A∗ + BH∗2 + H2B

∗)P ∗ tem a forma Il ⊕W , para algum

W ∈ F(n−l)×(n−l). Suponhamos que

P

[A B

] (P−1 ⊕ Im

)=

A1,1 A1,2 B1

A2,1 A2,2 B2

,

P

[H1 H2

](P ∗ ⊕ Im) =

G1,1 G1,2 G1,3

G∗1,2 G2,2 G2,3

,

65

Page 74: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

onde A1,1, G1,1 ∈ Fl×l, A2,2, G2,2 ∈ F(n−l)×(n−l). Então

[A1,1 A1,2 B1

]G1,1

G∗1,2

G∗1,3

+

[G1,1 G1,2 G1,3

]A∗1,1

A∗1,2

B∗1

= Il.

Pelo teorema 2.16,

ρ

(G1,1,

[G1,2 G1,3

])= δ(G1,1) ≤ car

[A1,2 B1

]e

In

(A1,1,

[A1,2 B1

])≤ (π(G1,1), ν(G1,1), 0) .

Pelas desigualdades de entrelaçamento para fatores invariantes [16, 22], re-

sulta que

In(γ1 · · · γl) ≤ In

(A1,1,

[A1,2 B1

]).

Pelas desigualdades de entrelaçamento para valores próprios para matrizes

hermíticas, π(G1,1) ≤ π e ν(G1,1) ≤ ν. Então In(γ1 · · · γl) ≤ (π, ν, 0). Por

outro lado,

l = π(G1,1) + ν(G1,1) + δ(G1,1)

= π(G1,1) + ν(G1,1) + ρ

(G1,1,

[G1,2 G1,3

])

= car

[G1,1 G1,2 G1,3

]

≤ car

[H1 H2

]= π + ν + ρ.

66

Page 75: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

Parte 2. Vamos provar (2.18). Sem perca de generalidade, suponhamos que[H1 H2

]está na forma normal para a congruência por blocos:

[H1 H2

]=

∆ 0 0 0 0

0 0ρ 0 Iρ 0

0 0 0n−π−ν−ρ 0 0

,

onde ∆ ∈ F(π+ν)×(π+ν), In(∆) = (π, ν, 0). Particionemos

[A B

]de modo

análogo:

[A B

]=

C1,1 C1,2 C1,3 D1,1 D1,2

C2,1 C2,2 C2,3 D2,1 D2,2

C3,1 C3,2 C3,3 D3,1 D3,2

,onde C1,1 ∈ F(π+ν)×(π+ν), C2,2 ∈ Fρ×ρ, C3,3 ∈ F(n−π−ν−ρ)×(n−π−ν−ρ), D1,1 ∈

F(π+ν)×ρ. Seja M = AH1 +H1A∗ +BH∗2 +H2B

∗. Então

M =

C1,1∆ + ∆C∗1,1 D1,1 + ∆C∗2,1 ∆C∗3,1

C2,1∆ +D∗1,1 D2,1 +D∗2,1 D∗3,1

C3,1∆ D3,1 0

.

Seja

E =

[Dt

1,1 Dt2,1 Dt

3,1

]t.

Sejam r = car(E) e R ∈ Fρ×ρ uma matriz invertível tal que as ρ− r últimas

colunas de ER são iguais a zero. Então

(Iπ+ν ⊕R∗ ⊕ In−π−ν−ρ)M (Iπ+ν ⊕R⊕ In−π−ν−ρ)

67

Page 76: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

tem a forma

M ′ =

M1 M2

M∗2 0n−π−ν−r

,onde M1 ∈ F(π+ν+r)×(π+ν+r). Como M ′ contem uma submatriz nula de

ordem n − π − ν − r, resulta, das desigualdades de entrelaçamento para

valores próprios para matrizes hermíticas, que π(M ′) ≤ π + ν + r. Como

l ≤ π(M) = π(M ′), então l − π − ν ≤ r ≤ car(B).

(b2.27)⇒ (a2.27). Se l ≤ π+ ν, então, sem perca de generalidade, considere-

mos que

[A B

]tem a forma (2.20), onde A1,1 ∈ Fl×l, A2,2 ∈ F(n−l)×(n−l)

e In(γ1 · · · γl) ≤ In(A1,1) ≤ (π, ν, 0). Se π + ν < l, então, sem perca

de generalidade, consideremos que

[A B

]tem a forma (2.21), onde

A1,1 ∈ F(π+ν)×(π+ν), A2,2 ∈ F(n−l)×(n−l) e In(γ1 · · · γl) ≤ In(A1,1) = (π, ν, 0).

Seja l′ = min{l, π+ν}. De acordo com o teorema geral da inércia, existe uma

matriz hermítica G1,1 ∈ Fl′×l′ tal que A1,1G1,1 + G1,1A∗1,1 > 0 e In(G1,1) =

In(A1,1) ≤ (π, ν, 0). Suponhamos que In(A1,1) = (π′, ν ′, 0). Seja

H1 = G1,1 ⊕ Iπ−π′ ⊕ (−Iν−ν′)⊕ 0δ ∈ Fn×n, H2 = 0n−ρ,m−ρ ⊕ Iρ ∈ Fn×m.

Então In(H1) = (π, ν, δ) e ρ(H1, H2) = ρ.

Se l ≤ π+ν, então AH1+H1A∗+BH∗2 +H2B

∗ contem (A1,1G1,1+G1,1A∗1,1)⊕

2Il−π−ν como submatriz principal.

Em qualquer caso, AH1 + H1A∗ + BH∗2 + H2B

∗ contem uma submatriz

de�nida positiva de tamanho l× l. Resulta, pelas desigualdades de entrela-

çamento para valores próprios para matrizes hermíticas, que (2.16) é válido.

68

Page 77: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

O seguinte corolário generaliza o teorema geral da inércia.

Corolário 2.31 [7] Seja A ∈ Fn×n. Sejam γ1 | · · · | γn os fatores invarian-

tes de xIn−A. Sejam π, ν, δ, l inteiros não negativos tais que π+ ν+ δ = n

e l ≤ n. As seguintes a�rmações são equivalentes:

(a2.31) Existe uma matriz hermítica H1 ∈ Fn×n tal que In(H) = (π, ν, δ), e

π(AH +HA∗) ≥ l.

(b2.31) l ≤ π + ν e In(γ1 · · · γl) ≤ (π, ν, 0).

Corolário 2.32 [7] Seja A ∈ Fn×n, B ∈ Fn×m. Sejam γ1 | · · · | γn os

fatores invariantes de

[xIn − A B

]. Seja l ∈ {1, . . . n}. As a�rmações

seguintes são equivalentes:

(a2.32) Existe uma matriz hermítica H1 ∈ Fn×n e existe uma matriz H2 ∈

Fn×m tais que π(AH1 +H1A∗ +BH∗2 +H2B

∗) ≥ l.

(b2.32) δ(γ1 · · · γl) = 0.

69

Page 78: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

2.5. A Desigualdade π(AH +HA∗) ≥ l

Demonstração. Resulta facilmente pelo teorema 2.27 que (a2.32) ⇒

(b2.32).

Reciprocamente, escolhemos inteiros não negativos π, ν tais que π + ν = n

e In(γ1, . . . γl) ≤ (π, ν, 0). Seja δ = ρ = 0. Claramente (2.17) - (2.19) são

válidos e (a2.32) resulta do teorema 2.27

Corolário 2.33 [7] Seja A ∈ Fn×n. Sejam γ1 | · · · | γn os fatores in-

variantes de xIn − A. Seja l ∈ {1, . . . n}. As seguintes a�rmações são

equivalentes:

(a2.33) Existe uma matriz hermítica H ∈ Fn×n tal que π(AH +HA∗) ≥ l.

(b2.33) δ(γ1 · · · γl) = 0.

70

Page 79: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Capítulo 3

Estabilização de Sistemas de

Variável Discreta

O principal objetivo deste capítulo é generalizar o teorema de Stein e o

teorema geral da inércia para pares de matrizes. Também iremos apresentar

resultados paralelos aos apresentados na secção 2.5.

71

Page 80: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.1. Generalização do Teorema de Stein

3.1 Generalização do Teorema de Stein

Lema 3.1 Sejam A ∈ Fn×n, B ∈ Fn×m. As a�rmações seguintes são equi-

valentes

(a3.1) O par (A,B) é estabilizável com respeito ao círculo unitário.

(b3.1) ν(A,B) = δ(A,B) = 0.

(c3.1) Existem matrizes C ∈ Fm×n, D ∈ Fm×m tais que

L =

A B

C D

(3.1)

é estável com respeito ao círculo unitário.

Demonstração. A equivalência entre (a3.1) e (b3.1) resulta do lema 2.4.

A equivalência entre (a3.1) e (c3.1) resulta do lema 2.5.

Estamos agora em condições de generalizar o teorema de Stein.

Teorema 3.2 [6] Sejam A ∈ Fn×n, B ∈ Fn×m. As a�rmações seguintes

são equivalentes:

(a3.2) O par (A,B) é estabilizável com respeito ao círculo unitário.

72

Page 81: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.1. Generalização do Teorema de Stein

(b3.2) Existe uma matriz de�nida positiva

H =

H1,1 H1,2

H∗1,2 H2,2

∈ F(n+m)×(n+m), onde H1,1 ∈ Fn×n (3.2)

tal que

K := H1,1 −[A B

]H

A∗

B∗

> 0. (3.3)

Demonstração. (a3.2) ⇒ (b3.2). De acordo com o lema 3.1, existe C ∈

Fm×n, D ∈ Fm×m tais que (3.1) é estável com respeito ao círculo unitário.

De acordo com o teorema Stein, existe uma matriz de�nida positiva H ∈

F(n+m)×(n+m) tal que H − LHL∗ > 0. Particionemos H de modo análogo

em (3.2). Então K é uma submatriz principal de H − LHL∗ e, portanto, é

de�nida positiva.

(b3.2) ⇒ (a3.2). Suponhamos que (b3.2) é satisfeita. Então H1,1 > 0 e H é

congruente com In 0

−H∗1,2H−11,1 Im

H In −H−11,1H1,2

0 Im

=

H1,1 0

0 H2,2 −H∗1,2H−11,1H1,2

.Portanto H2,2 −H∗1,2H−11,1H1,2 > 0. Como K > 0,

H1,1 −(A+BH∗1,2H

−11,1

)H1,1

(A∗ +H−11,1H1,2B

∗)= K +B

(H2,2 −H∗1,2H−11,1H1,2

)B∗ > 0.

Pelo teorema de Stein, A+BH∗1,2H−11,1 é estável com respeito ao círculo uni-

tário. Portanto o par (A,B) é estabilizável com respeito ao círculo unitário.

73

Page 82: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

3.2 Generalização do Teorema Geral da Inér-

cia

De�nição 3.3 Sejam A ∈ Fn×n, B ∈ Fn×m. A inércia do par (A,B) com

respeito ao círculo unitário, é representada por

In(A,B) = (π(A,B), ν(A,B), δ(A,B)),

onde π(A,B), ν(A,B) e δ(A,B) representam o número de valores próprios

de (A,B) com módulo menor que um, maior que um e igual a um,respetivamente.

Com vista à generalização do teorema geral da inércia para pares de matri-

zes, notemos que, para toda a matriz não singular da forma

S =

P 0

R Q

∈ F(n+m)×(n+m), onde P ∈ Fn×n, (3.4)

(3.3) é equivalente com

PH1,1P∗ −

(P

[A B

]S−1

)(SHS∗)

(S∗)−1

A∗

B∗

P ∗ > 0. (3.5)

De�nição 3.4 Dizemos que duas matrizes

H =

H1,1 H1,2

H∗1,2 H2,2

H ′ =

H ′1,1 H ′1,2

H′∗1,2 H ′2,2

∈ F(n+m)×(n+m), (3.6)

onde H1,1, H′1,1 ∈ Fn×n, são (n,m)-congruentes por blocos se existir uma

matriz não singular da forma (3.4) tal que H ′ = SHS∗.

74

Page 83: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

O próximo objetivo é descrever uma relação completa entre a classe de

semelhança por blocos de

[A B

]e a classe de (n,m)-congruência por

blocos de H, quando (3.3) é satisfeito.

A forma normal para a semelhança por blocos usada no estudo de sistemas

lineares e problemas de completação de matrizes foi já apresentada no ca-

pítulo anterior, no lema 2.11. Vamos agora estabelecer uma forma normal

para a (n,m)-congruência por blocos.

Teorema 3.5 Forma normal para (n,m)-congruência por blocos[6]

Seja H ′ ∈ F(n+m)×(n+m) uma matriz hermítica particionada de acordo com

(3.6). Então H ′ é (n,m)-congruente por blocos com uma única matriz da

forma

Iπ1 ⊕ (−Iν1)⊕ 0n−π1−ν1−ρ ⊕

0 Iρ

Iρ 0

⊕ Iπ2 ⊕ (−Iν2)⊕ 0m−π2−ν1−ρ. (3.7)

Neste caso,

In(H ′1,1) = (π1, ν1, n− π1 − ν1), (3.8)

ρ = car

[H ′1,1 H ′1,2

]− car(H ′1,1) (3.9)

In(H ′) = (π1 + π2 + ρ, ν1 + ν2 + ρ, n+m− π1 − π2 − ν1 − ν2 − 2ρ). (3.10)

75

Page 84: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

Demonstração. No capítulo 2 viu-se que

[H ′1,1 H ′1,2

]é congruente

por blocos com uma única matriz da forma

[G1,1 G1,2

], onde

G1,1 = Iπ1 ⊕ (−Iν1)⊕ 0p−π1−ν1 ∈ Fn×n, G1,2 =

0 0

Iρ 0

∈ Fn×m

e

ρ ≤ n− π1 − ν1.

Seja S ∈ F(n+m)×(n+m) uma matriz com a forma de (3.4) tal que[G1,1 G1,2

]= P

[H ′1,1 H ′1,2

]S∗.

Suponhamos que

G := SH ′S∗ =

G1,1 G1,2

G∗1,2 G2,2

.Particionemos G2,2 de forma análoga

G2,2 =

J1,1 J1,2

J∗1,2 J2,2

,onde J1,1 ∈ Fρ×ρ. Seja T ∈ F(m−ρ)×(m−ρ) uma matriz não singular tal que

TJ2,2T∗ = Iπ2 ⊕ (−Iν2)⊕ 0m−π2−ν2−ρ

para alguns inteiros não negativos π2, ν2 tais que π2 + ν2 ≤ m− ρ. Seja

S ′ = In−ρ ⊕

Iρ 0 0

−12J1,1 Iρ 0

−TJ∗1,2 0 T

.

76

Page 85: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

Então, H ′ é (n,m)-congruente por blocos com S ′GS′∗ e esta matriz tem a

forma prescrita. É fácil veri�car que (3.8)-(3.10) são válidas. A unicidade

resulta destas igualdades.

Portanto, com a notação anterior, In(H ′1,1), In(H ′) e

ρ(H ′1,1, H′1,2) := car

[H ′1,1 H ′1,2

]− car(H ′1,1)

formam um conjunto completo de invariantes para a (n,m)-congruência por

blocos de H ′.

Lema 3.6 Seja Γ ∈ Fγ×γ uma matriz hermítica e D ∈ Fn×γ. Então

π(−DΓD∗) ≤ min {car(D), ν(Γ)} .

Demonstração. Seja r = carD e P ∈ Fn×n, G ∈ Fγ×γ matrizes não

singulares tais que PDG = Ir ⊕ 0. Suponhamos que

G−1Γ(G∗)−1 =

Γ1,1 Γ1,2

Γ∗1,2 Γ2,2

,onde Γ1,1 ∈ Fr×r. Então −DΓD∗ é congruente com

−(PDG)(G−1Γ(G∗)−1)(G∗D∗P ∗) = −Γ1,1 ⊕ 0.

Assim, temos que π(−DΓD∗) = ν(Γ1,1) ≤ r. Pelas desigualdades de en-

trelaçamento dos valores próprios para matrizes hermíticas, resulta que

ν(Γ1,1) ≤ ν(Γ).

77

Page 86: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

Lema 3.7 [17, Teorema 2] Sejam G1, G2 ∈ Fn×n matrizes hermíticas. En-

tão

π(G1 +G2) ≤ π(G1) + π(G2).

Lema 3.8 Seja H1,1 ∈ Fn×n uma matriz hermítica e A ∈ Fn×n. Então

π(H1,1 − AH1,1A∗) ≤ car(H1,1).

Demonstração. Usando os dois lemas anteriores, temos π(H1,1−AH1,1A∗) ≤

π(H1,1) + π(−AH1,1A∗) ≤ π(H1,1) + min {car(A), ν(H1,1)} ≤ π(H1,1) +

ν(H1,1) = car(H1,1).

Lema 3.9 Sejam D,C ∈ Fn×n. Então π(DC∗ + CD∗) ≤ car(D).

Demonstração. Seja r = car(D). Sejam P ∈ Fn×n e R ∈ Fρ×ρ matrizes

não singulares tais que D′ := PDR = Ir ⊕ 0. Seja

C ′ := PC(R∗)−1 =

C1,1 C1,2

C2,1 C2,2

,onde C1,1 ∈ Fr×r. Então, DC∗ + CD∗ é congruente com

E := D′C′∗ + C ′D

′∗ =

C1,1 + C∗1,1 C∗2,1

C2,1 0

.

78

Page 87: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

Como E tem uma submatriz principal nula de tamanho (n − r) × (n −

r), então, pelas desigualdades de entrelaçamento de valores próprios para

matrizes hermíticas, a matriz E tem n− r valores próprios que não podem

ser positivos.

Teorema 3.10 [6] Sejam A ∈ Fn×n, B ∈ Fn×m. Seja H ′ ∈ F(n+m)×(n+m)

uma matriz hermítica particionada como em (3.6). As seguintes a�rmações

são equivalentes:

(a3.10) Existe uma matriz hermítica H com a forma de (3.2), (n,m)-congruente

por blocos com H ′, tal que (3.3) é válida.

(b3.10) As seguintes desigualdades são satisfeitas:

(i3.10) In(A,B) ≤ (π(H ′1,1), ν(H ′1,1), 0),

(ii3.10) n ≤ π(H ′1,1) + min{

car(B) + ν(H ′1,1), ν(H ′)}.

Demonstração. Sejam (π1, ν1, δ1) := In(H ′1,1), (π, ν, δ) := In(H ′) e ρ :=

ρ(H ′1,1, H′1,2). Seja

∆⊕

0 Iρ

Iρ 0

⊕ Γ (3.11)

79

Page 88: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

a forma normal para a (n,m)-congruência por blocos de H ′, onde ∆ ∈

F(n−ρ)×(n−ρ) e Γ ∈ F(m−ρ)×(m−ρ) são matrizes hermíticas e

In(∆) = (π1, ν1, δ1 − ρ),

In(Γ) = (π − π1 − ρ, ν − ν1 − ρ, δ − δ1 + ρ).

(a3.10) ⇒ (b3.10). Com vista a provar (i3.10), suponhamos, sem perda de

generalidade, que

[A B

]tem a forma (2.5). Suponhamos que

H1,1 =

G1,1 ∗

∗ ∗

,onde G1,1 ∈ Fd×d. Então G1,1 − NG1,1N

∗ é uma submatrix principal de

K > 0. Portanto G1,1 − NG1,1N∗ > 0. De acordo com o teorema geral

da inércia relativamente ao círculo unitário, δ(N) = 0 e In(G1,1) = In(N).

Pelas desigualdades de entrelaçamento de valores próprios para matrizes

hermíticas, resulta que π(G1,1) ≤ π(H1,1) = π(H ′1,1) e ν(G1,1) ≤ ν(H1,1) =

ν(H ′1,1). Como In(N) = In(A,B), então (i3.10) é satisfeito.

Com vista a provar (ii3.10), suponhamos, sem perda de generalidade, que H

tem a forma (3.11). Suponhamos também que

[A B

]=

A1,1 A1,2 B1,1 B1,2

A2,1 A2,2 B2,1 B2,2

,onde A1,1 ∈ F(n−ρ)×(n−ρ), A2,2 ∈ Fρ×ρ, B1,1 ∈ F(n−ρ)×ρ. Seja

K := H1,1 −[A B

]H

A∗

B∗

.

80

Page 89: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

Então K = M1 +M2 +M3, onde

M1 = H1,1 − AH1,1A∗,

M2 = −

B1,1

B2,1

[ A∗1,2 A∗2,2

]−

A1,2

A2,2

[ B∗1,1 B∗2,1

],

M3 = −

B1,2

B2,2

Γ

[B∗1,2 B∗2,2

].

De acordo com o lema 3.8, π(M1) ≤ car(H1,1). De acordo com o lema 3.9

π(M2) ≤ car

B1,1

B2,1

≤ min {ρ, car(B)} .

De acordo com o lema 3.6,

π(M3) ≤ min

car

B1,2

B2,2

, ν(Γ)

≤ min {car(B), ν(Γ)} .

Então

π(K) ≤ π(M1) + π(M2) + π(M3),

π(K) ≤ car(H1,1) + min {ρ, car(B)}+ min {car(B), ν(Γ)} . (3.12)

Também temos M2 +M3 = −BC∗ − CB∗, onde

C =

A1,212B1,2Γ

A2,212B2,2Γ

.

81

Page 90: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

De acordo com os lemas anteriores,

π(K) ≤ π(M1) + π(M2 +M3) ≤ car(H1,1) + car(B). (3.13)

Por (3.12) e (3.13), resulta que

π(K) ≤ car(H1,1) + min {car(B), ρ+ ν(Γ)} .

Como n = π(K), car(H1,1) = π1 + ν1 e ν(Γ) = ν − ν1 − ρ, (ii3.10) resulta

imediatamente.

(b3.10)⇒ (a3.10). Sejam µ = min {car(B), ν(Γ), m− ρ} , σ = min {ρ, car(B)− µ}.

Então

µ+ σ = min {ρ+ ν(Γ), car(B)} .

Sejam P ∈ Fn×n, Q ∈ Fm×m matrizes não singulares tais que

PBQ =

B1 0 B2 0

0 Iσ 0 0

0 0 0 Iµ

,

onde B1 ∈ F(n−σ−µ)×(ρ−σ), B2 ∈ F(n−σ−µ)×(m−ρ−µ). Particionemos PAP−1

em blocos: PAP−1 = [Ai,j], onde A1,1 ∈ F(n−σ−µ)×(n−σ−µ), A2,2 ∈ Fσ×σ e

A3,3 ∈ Fµ×µ.

Como n ≤ π1 + min {car(B) + ν1, ν}, deduzimos que n− σ − µ ≤ π1 + ν1.

Podemos observar que (1.26) e[xIn−σ−µ − A1,1 A1,2 A1,3 B1 B2

]

82

Page 91: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

têm os mesmos fatores invariantes não constantes. De acordo com o lema

2.4, existe uma matriz R ∈ Fm×(n−σ−µ) tal que

C1 := A1,1 +

[A1,2 A1,3 B1 B2

]R

satisfaz In(A,B) ≤ In(C1) ≤ (π1, ν1, 0).

Então podemos provar que

[A B

]é semelhante por blocos com

C1 A1,2 A1,3 B1 0 B2 0

0 0 0 0 Iσ 0 0

0 0 0 0 0 0 Iµ

. (3.14)

Como µ ≤ ν(Γ), Γ é congruente com uma matriz da forma Γ0⊕ (−Iµ), onde

Γ0 ∈ F(m−ρ−µ)×(m−ρ−µ). Como In(C1) ≤ (π1, ν1, 0) ≤ In(∆), ∆ é congru-

ente com uma matriz da forma ∆1⊕∆2, onde ∆1 ∈ F(n−σ−µ)×(n−σ−µ), ∆2 ∈

F(σ+µ−ρ)×(σ+µ−ρ) e In(∆1) = In(C1). Mais, para todo o número real positivo

ε, ∆2 é congruente com ε∆2.

De acordo com o teorema geral da inércia relativamente ao círculo uni-

tário, ∆1 é congruente com uma matriz ∆′1 ∈ F(n−ρ−µ)×(n−ρ−µ) tal que

∆′1 −C1∆′1C∗1 > 0. Então, para todo o número real positivo ε, H ′ é (n,m)-

congruente por blocos com

Hε := ∆′1 ⊕ ε∆2 ⊕

0 −Iρ

−Iρ 0

⊕ Γ0 ⊕ (−Iµ).

Por forma a tornar a notação mais conveniente, suponhamos que[A1,2 A1,3

]=

[C2 C3 C4

],

83

Page 92: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

onde C2 ∈ F(n−σ−µ)×(σ+µ−ρ), C3 ∈ F(n−σ−µ)×(n−σ), C4 ∈ F(n−σ−µ)×σ.

Não é muito difícil de provar que, para todo o número real positivo ε, (3.14)

é semelhante por blocos com

[Aε Bε

]=

C1 εC2 εC3 εC4 εB1 0 εB2 0

0 0 0 Iσ 0 Iσ 0 0

0 0 0 0 0 0 0 Iµ

.Seja Hε,1,1 a submatriz principal de Hε com as primeiras p linhas e colunas.

Então

Kε := Hε,1,1 −[Aε Bε

]Hε

A∗ε

B∗ε

tem a forma

Kε = ((∆′1 − C1∆′1C∗1)⊕ 2Iσ ⊕ Iµ) +Dε,

onde Dε → 0, quando ε → 0. Como (∆′1 − C1∆′1C∗1) ⊕ 2Iσ ⊕ Iµ > 0,

pela continuidade dos valores próprios podemos concluir, que para valores

su�cientemente pequenos de ε, Kε > 0. Como

[A B

],

[Aε Bε

]são

semelhantes por blocos e H ′, Hε são (n,m)-congruentes por blocos, é fácil

concluir a demonstração.

Corolário 3.11 [6] Sejam A ∈ Fn×n, B ∈ Fn×m. Sejam π, ν, δ números

inteiros não negativos tais que π + ν + δ = n+m. As a�rmações seguintes

são equivalentes:

(a3.11) Existe uma matriz hermítica com a forma (3.2) tal que (3.3) é satis-

84

Page 93: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

feito e In(H) = (π, ν, δ).

(b3.11) In(A,B) ≤ (π, ν, 0) e n ≤ π + ν.

Demonstração. (a3.11) ⇒ (b3.11). Seja (π1, ν1, δ1) := In(H1,1). Pelas de-

sigualdades de entrelaçamento de valores próprios para matrizes hermíticas,

π1 ≤ π e ν1 ≤ ν. Pelo teorema 3.10 temos que In(A,B) ≤ (π1, ν1, 0) ≤

(π, ν, 0) e n ≤ π1 + ν ≤ π + ν.

(b3.11)⇒ (a3.11). Seja (π0, ν0, 0) := In(A,B). Sejam

π1 := max {π0, n− ν} ,

ν1 := max {ν0, n− car(B)− π1, ν −m} ,

δ1 := n− π1 − ν1,

ρ := max {0, π + ν − π1 −m, δ1 − δ} .

É imediato que π1, ν1, ρ ≥ 0.

Como

[A B

]é semelhante por blocos com uma matriz com a forma

(2.5), temos que

n ≥ d+ car(B) = π0 + ν0 + car(B).

Então

π1 + ν1 = max {n− car(B), n− ν + ν0, π0 + ν −m} . (3.15)

Então

δ1 = n− π1 − ν1 = min {car(B), ν − ν0, n+m− π0 − ν} ≥ 0.

85

Page 94: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

Como

π + ν − π1 − ν1 −m ≤ n− π1 − ν1 = δ1,

deduzimos que ρ ≤ δ1. Como (π1, ν1, δ1−ρ) ≥ (0, 0, 0) e π1 +ν1 + δ1−ρ =

n− ρ, existe uma matriz hermítica ∆ ∈ F(n−ρ)×(n−ρ) tal que

In(∆) = (π1, ν1, δ1 − ρ).

Por (b3.10) resulta que

π − π1 ≥ 0. (3.16)

Por ν1 ≥ ν −m, resulta que

π − π1 ≥ π + ν − π1 − ν1 −m. (3.17)

Como n = π1 + ν1 + δ1 e n+m = π + ν + δ, deduzimos que

π − π1 = π + ν1 + δ1 − n ≥ π + ν −m+ δ1 − n = δ1 − δ. (3.18)

Pelas desigualdades (3.16)-(3.18), concluímos que

π − π1 − ρ ≥ 0. (3.19)

Por (b3.10), ν ≥ ν0. Mais,

ν ≥ p− car(B)− p+ ν ≥ p− car(B)− π1. (3.20)

Então, pela de�nição de ν1,

ν ≥ ν1. (3.21)

Também temos

ν ≥ ν+(π+ν−n−m) ≥ π+ν−π1−m = ν1+(π+ν−π1−ν1−m) (3.22)

86

Page 95: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.2. Generalização do Teorema Geral da Inércia

e

ν ≥ ν − δ ≥ n− π1 − δ = ν1 + δ1 − δ. (3.23)

Pelas desigualdades (3.21)-(3.23), concluímos que

ν − ν1 − ρ ≥ 0. (3.24)

Pela de�nição de ρ,

δ − δ1 + ρ ≥ 0. (3.25)

É fácil ver que

m− ρ = (π − π1 − ρ) + (ν − ν1 − ρ) + (δ − δ1 − ρ).

Atendendo a (3.19), (3.24), (3.25), existe uma matriz hermítica Γ ∈ F(m−ρ)×(m−ρ)

tal que

In(Γ) = (π − π1 − ρ, ν − ν1 − ρ, δ − δ1 − ρ).

Denotemos a matriz (3.11) por H ′. Particionemos H ′ como em (3.6). No-

temos que

In(H ′1,1) = (π1, ν1, δ1), In(H ′) = (π, ν, δ) e ρ(H ′1,1, H′1,2) = ρ.

Resulta imediatamente das de�nições de π1, ν1 e de (b3.10) que (i3.10) é

válido. Por (3.15) e a de�nição de π1,

p ≤ π1 + car(B) + ν1 e p ≤ π1 + ν.

Portanto (ii3.10) é satisfeita. Resulta do teorema 3.10 que (a3.11) é satisfeita.

87

Page 96: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

Corolário 3.12 [6] Sejam A ∈ Fn×n, B ∈ Fn×m. Existe uma matriz her-

mítica com a forma de (3.2) tal que (3.3) é válido se e só se δ(A, B) = 0.

Demonstração. Resulta trivialmente do corolário 3.11.

3.3 A Desigualdade π(H +AHA∗) ≥ l

Teorema 3.13 Sejam A ∈ Fn×n, B ∈ Fn×m. Seja γ1| · · · |γn os fatores

invariantes de [xIn − A B

].

Seja H ′ ∈ F(n+m)×(n+m) uma matriz hermítica particionada como em (3.2).

Suponhamos que

In(H ′) = (π, ν, δ), In(H ′1,1) = (π1, ν1, δ1) e ρ(H ′1,1, H′1,2) = ρ.

Seja l ∈ {1, . . . , n}. As a�rmações seguintes são equivalentes:

(a3.13) Existe uma matriz hermítica H com a forma (3.2), (n,m)-congruente

por blocos com H ′, tal que

π

H1,1 −[A B

]H

A∗

B∗

≥ l. (3.26)

88

Page 97: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

(b3.13) As condições seguintes são válidas

l ≤ π1 + min {car(B) + ν1, ν} , (3.27)

In(γ1 · · · γl) ≤ (π1, ν1, 0). (3.28)

Os dois lemas seguintes podem ser provados com argumentos idênticos aos

argumentos usados nas demonstrações dos lema 2.29 e lema 2.30.

Lema 3.14 Sejam A ∈ Fn×n, B ∈ Fn×m. Seja γ1| · · · |γn os fatores inva-

riantes de

[xIn − A B

]. Sejam π1, ν1, l inteiros não negativos tais que

π1 + ν1 ≤ n e l ≤ n. Se (3.28) é válido e l ≤ π1 + ν1, então

[A B

semelhante por blocos com uma matriz com a forma

A1,1 A1,2 B1

A2,1 A2,2 B2

(3.29)

onde A1,1 ∈ Fl×l, A2,2 ∈ F(n−l)×(n−l) e In(γ1 · · · γl) ≤ In(A1,1) ≤ (π1, ν1, 0).

Lema 3.15 Sejam A ∈ Fn×n, B ∈ Fn×m. Seja γ1 | · · · | γn os fatores

invariantes de

[xIn − A B

]. Sejam π1, ν1, l inteiros não negativos tais

que π1 + ν1 ≤ n e l ≤ n. Se (3.27) e (3.28) são válidas e π1 + ν1 < l, então

89

Page 98: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

[A B

]é semelhante por blocos com uma matriz com a forma

A1,1 A1,2 A1,3 B1 0

A2,1 A2,2 A2,3 B2 0

0 0 0l−π1−ν1 0 Il−π1−ν1

, (3.30)

onde A1,1 ∈ F(π1+ν1)×(π1+ν1), A2,2 ∈ F(n−l)×(n−l) e In(γ1 · · · γn) ≤ In(A1,1) =

(π1, ν1, 0).

Estamos agora em condições de apresentar a demonstração do teorema 3.13.

Demonstração. (a3.13) ⇒ (b3.13). Para l = n, (3.27) está provado no

teorema 3.10. Para l 6= n, a demonstração é análoga e, portanto, é omitida

aqui. Seja P ∈ Fn×n uma matriz não singular tal que

P

H1,1 −[A B

]H

A∗

B∗

P ∗ = Il ⊕W,

para alguma matriz W ∈ F(n−l)×(n−l). Suponhamos que

P

[A B

](P ∗ ⊕ Im) =

A1,1 A1,2 B1

A2,1 A2,2 B2

,

(P ⊕ Im)H (P ∗ ⊕ Im) =

G1,1 G1,2 G1,3

G∗1,2 G2,2 G2,3

G∗1,3 G∗2,3 H2,2

,

90

Page 99: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

onde A1,1, G1,1 ∈ Fl×l, A2,2, G2,2 ∈ F(n−l)×(n−l). Então

G1,1 −[A1,1 A1,2 B1

]H

A∗1,1

A∗1,2

B∗1

= Il.

De acordo com o teorema 3.10,

In

(A1,1,

[A1,2 B1

])≤ (π(G1,1), ν(G1,1), 0).

Pelas desigualdades de entrelaçamento para fatores invariantes [16, 22], re-

sulta que

In(γ1 · · · γl) ≤ In

(A1,1,

[A1,2 B1

]).

Como é claro que π(G1,1) ≤ π1 e ν(G1,1) ≤ ν1, então (3.28) é válido.

(b3.13) ⇒ (a3.13). Se l ≤ π1 + ν1, então, sem perda de generalidade, pode-

mos considerar que

[A B

]tem a forma (3.29), onde A1,1 ∈ Fl×l, A2,2 ∈

F(n−l)×(n−l) e In(γ1 · · · γl) ≤ In(A1,1) = (π1, ν1, 0).

Seja l′ = min{l, π1 + ν1}. De acordo com o teorema geral da inércia rela-

tivamente ao círculo unitário, existe uma matriz hermítica G1,1 ∈ Fl′×l′ tal

que

G1,1 − A1,1G1,1A∗1,1 > 0 e In(G1,1) = In(A1,1) ≤ (π1, ν1, 0).

Suponhamos que

In(A1,1) = (π′1, ν′1, 0).

91

Page 100: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

Seja

G = G1,1 ⊕ Iπ1−π′1 ⊕ (−Iν1−ν′1)⊕ 0δ1−ρ

0 Iρ

Iρ 0

⊕ Iπ−π1−ρ ⊕ (−Iν−ν1−ρ)⊕ 0δ−δ1+ρ.

Note-se que G e H ′ são (n,m)-congruentes por blocos, porque têm os mes-

mos invariantes para a (n,m)-congruência por blocos.

Caso 1. Suponhamos que l ≤ π1 + ν1. Particionemos G da seguinte forma

G = G1,1 ⊕

G2,2 G2,3

G∗2,3 G3,3

,onde G2,2 ∈ F(n−l)×(n−l). Para todo o número real positivo ε, G é (n,m)-

congruente por blocos a

Hε = G1,1 ⊕

εG2,2 εG2,3

εG∗2,3 εG3,3

.Particionemos Hε do seguinte modo

Hε =

Hε,1,1 Hε,1,2

H∗ε,1,2 εG3,3

, onde Hε,1,1 ∈ Fn×n.

Com cálculos simples, é fácil de ver que existe uma matriz M ∈ Fl×l tal

que, para todo o número real positivo ε,

Hε,1,1 −[A B

]Hε

A∗

B∗

contém G1,1 − A1,1G1,1A

∗1,1 + εM como submatriz principal líder. Como

G1,1−A1,1G1,1A∗1,1 > 0, resulta que, para um número real ε su�cientemente

92

Page 101: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

pequeno,

π

Hε,1,1 −[A B

]Hε

A∗

B∗

≥ l.

Caso 2. Suponhamos que π1 + ν1 < l. Por (3.27), resulta que l−π1− ν1 ≤

ρ + (ν − ν1 − ρ). Podemos escolher inteiros não negativos, q1, q2, tais que

q1 ≤ ρ, q2 ≤ ν − ν1 − ρ e q1 + q2 = l − π1 − ν1. Escolhemos uma matriz de

permutação Π ∈ Fm×m tal que G′ := (In ⊕ Π)G(In ⊕ Π∗) tenha a forma

G′ = G1,1 ⊕

G2,2 0 G2,4 0

0 0q1 0 Iq1

G∗2,4 0 G4,4 0

0 Iq1 0 0q1

⊕ (−Iq2),

onde G2,2 ∈ F(n−π1−ν1−q1)×(n−π1−ν1−q1). Para todo o número real positivo ε

e para todo o número real λ, G′ é (n,m)-congruente por blocos com

Hε,λ = G1,1 ⊕

εG2,2 0 εG2,4 0

0 0q1 0 Iq1

εG∗2,4 0 εG4,4 0

0 Iq1 0 λIq1

⊕ (−Iq2).

Note-se que q1 + q2 = l− π1 − ν1 ≤ car(B). Particionemos

[A B

]como

se segue:

A1,1 C1,2 C1,3 B1 0 0

C2,1 C2,2 C2,3 B2 0 0

0 0 0 0 Iq1 0

0 0 0 0 0 Iq2

,

93

Page 102: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

onde C2,2 ∈ F(n−l)×(n−π1−ν1−q1), C2,3 ∈ F(n−l)×q1 . Particionemos Hε,λ como

se segue:

Hε,λ =

Hε,λ,1,1 Hε,λ,1,2

H∗ε,λ,1,2 Hε,λ,2,2

, onde Hε,λ,1,1 ∈ Fn×n.

Como cálculos simples, é fácil de ver que existe uma matriz M ∈ Fl×l tal

que, para todo o número real positivo ε e todo o número real λ,

Hε,λ,1,1 −[A B

]Hε,λ

A∗

B∗

contém

εM +

G1,1 − A1,1G1,1A

∗1,1 −C1,3

−C∗1,3 −λIq1

⊕ Iq2 (3.31)

como submatriz principal.

Como G1,1−A1,1G1,1A∗1,1 > 0, resulta, pelo lema 2.18, que existe um número

real negativo λ tal que G1,1 − A1,1G1,1A∗1,1 −C1,3

−C∗1,3 −λIq1

⊕ Iq2é de�nida positiva. Então, para um número real positivo ε su�cientemente

pequeno, (3.31) é de�nida positiva. Para estes valores de ε e λ,

π

Hε,λ,1,1 −[A B

]Hε,λ

A∗

B∗

≥ l.

94

Page 103: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

3.3. A Desigualdade π(H + AHA∗) ≥ l

Corolário 3.16 Seja A ∈ Fn×n. Sejam γ1 | · · · | γn os fatores invarian-

tes de xIn − A. Seja H ′ ∈ Fn×n uma matriz hermítica. Suponhamos que

In(H ′) = (π, ν, δ). Seja l ∈ {1, . . . , n}. As seguintes a�rmações são equi-

valentes:

(a3.16) Existe uma matriz hermítica H ∈ Fn×n congruente com H ′ tal que

π (H − AHA∗) ≥ l.

(b3.16) l ≤ π + ν e In(γ1 · · · γl) ≤ (π, ν, 0).

Corolário 3.17 Seja A ∈ Fn×n, B ∈ Fn×m. Sejam γ1 | · · · | γn os fa-

tores invariantes de

[xIn − A B

]. Seja l ∈ {1, . . . , n}. As seguintes

a�rmações são equivalentes:

(a3.17) Existe uma matriz hermítica H com a forma (2.9) tal que (3.26) é

satisfeito.

(b3.17) δ(γ1 · · · γl) = 0.

Corolário 3.18 Seja A ∈ Fn×n. Sejam γ1 | · · · | γn os fatores invariantes

de xIn − A. Seja l ∈ {1, . . . , n}. As seguintes a�rmações são equivalentes:

(a3.18) Existe uma matriz hermítica H ∈ Fn×n tal que π(H − AHA∗) ≥ l.

(b3.18) δ(γ1 · · · γl) = 0.

95

Page 104: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Referências Bibliográ�cas

[1] I. Baragaña and I. Zaballa, Column completion of pair of matrices,

Linear and Multilinear Algebra, 27 (1990), 243�273. 1 2.4

[2] R. Bhatia, Matrix Analysis, Springer-Verlag, New York, 1997. {58}1.1

[3] I. Cabral, F. C. Silva, Uni�ed theorems on completions of matrix

pencils, Linear Algebra Appl., 159 (1991), 43�54. {9} 2.5

[4] C. T. Chen, A generalization of the inertia theorem, SIAM J. Appl.

Math., 25 (1973), 158�161. {63} 2.3, 2.17

[5] C. Ferreira, F.C. Silva, Inertia Theorems for Pairs of matrices, Linear

Algebra Appl., 381 (2004) 37�52. {46} 2.9, 2.13, 2.16, 2.22, 2.24, 2.26

[6] C. Ferreira, F.C. Silva, On the Stabilization of linear discrete-time

systems, Linear Algebra Appl., 390 (2004) 7�18. {36,39,42,51,59} 3.2, 3.5,

3.10, 3.11, 3.121 Os números entre {} indicam as páginas no texto onde o documento em questão foi

citado.

96

Page 105: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Referências Bibliográ�cas 97

[7] C. Ferreira, F.C. Silva, Inertia Theorems for Pairs of Matrices II,

Linear Algebra Appl., 413 (2006) 425�439. {72,75,79,84,88} 2.14, 2.27,

2.31, 2.32, 2.33

[8] F. R. Gantmacher, The Theory of Matrices, vol. 2, Chelsea Pu-

blishhing Comp., New York, 1960. {40,61,69,70} 1.1, 2.2

[9] R. D. Hill, Inertia theory for simultaneously triangulable complex ma-

trices, Linear Algebra Appl., 2 (1969), 131�142. {1,37} 1.2.2

[10] R.A.Horn, C.R.Johnson, Topics in Matrix Analysis, Cambridge Uni-

versity Press, 1981. {21} 1.1, 1.2

[11] R.A.Horn, C.R.Johnson, Matrix Analysis, Cambridge University

Press, 1985. {6,8} 1.1, 1.1, 1.1, 1.1, 1.1, 1.2, 1.7

[12] T. Kato, Perturbation Theory for Linear Operators, Springer-Verlag,

New York, 1980. {1,3,7,8,9,11} 1.1

[13] P. Lancaster, M. Tismenstsky, The Theory of Matrices, 2nd ed., Aca-

demic Press,1985. {9}1.1, 1.1, 1.2, 1.1, 1.2, 1.7, 1.16, 1.17, 1.2.2, 1.18,

1.21, 1.25, 1.26

[14] R. Loewy, An inertia theorem for Lyapunov's equation and the di-

mension of a controllability space, Linear Algebra Appl., 260 (1997),

1�7. {1,4,6,7,8,9,11,19,20,21,22,27} 2.4

97

Page 106: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Referências Bibliográ�cas 98

[15] A. Ostrowski and H. Schneider, Some theorems on the inertia of ge-

neral matrices, J. Math. Anal. Appl. 4 (1962), 72�84. {58} 1.8

[16] E. M. Sá, Imbedding conditions for λ-matrices, Linear Algebra Appl.,

24 (1979), 33�50. {13} 2.4, 2.4, 2.4, 2.5, 3.3

[17] E. M. Sá, On the inertia of sums of Hermitian matrices, Linear Algebra

Appl., 37 (1981), 143�159. {58,61,66,91} 3.7

[18] E. D. Sontag, Mathematical Control theory, Deteministic Finite Di-

mensional Systems, 2nd ed., Springer, New York, 1998. {78} 1.2, 2.1,

2.2

[19] P. Stein, Some general theorems on iterants, J. Research Nat. Bur.

Standards, 48 (1952), 82�83. {9,34,41} 1.2.2

[20] O. Taussky, A generalization of a theorem of Lyapunov, SIAM J.

Appl. Math., 9: 640�643, 1961. {21} 1.8

[21] O. Taussky, Matrices Cn → 0, J. Algebra, 1 (1964), 5�10. {13} 1.2.2

[22] R. C. Thompson, Interlacing inequalities for invariant factors, Linear

Algebra Appl., 24 (1979), 1�31. {21} 2.4, 2.4, 2.4, 2.5, 3.3

[23] H. K. Wimmer, On the Ostrowski-Schneider inertia theorem, J. Math.

Anal. Appl., 41 (1973), 164�169. {58,61,66,91} 1.2.2

[24] H. K. Wimmer, Existenzsatze in der theorie der matrizen und lineare

kontrolltheorie, Monasth. Math., 78 (1974), 256�263. {21} 2.5

98

Page 107: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Referências Bibliográ�cas 99

[25] H. K. Wimmer, Inertia theorems for matrices, controllability, and

linear vibrations, Linear Algebra Appl.. 8 (1974), 337�343. {34} 2.3,

2.17

[26] I. Zaballa, Matrices with prescribed rows and invariant factors, Linear

Algebra Appl., 87 (1987), 113�146. {46} 2.11

[27] I. Zaballa, Interlacing inequalities and control theory, Linear Algebra

and its Appl., 87 (1988), 9�31. {38} 2.4

[28] I. Zaballa, Interlacing and majorization in invariant factors assign-

ment problems, Linear Algebra Appl., 121 (1989), 409�421. {58} 2.1

{34}

99

Page 108: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Índice Remissivo

anel

polinómios, 1

bloco

Jordan, 7

caraterística

matriz, 2

contolo

variáveis, 29

vetor, 31

controlável

par de matrizes, 30

sistema, 29

discreto, 31

determinantal

divisor, 4

equação

Stein, 21, 27

estabilizável

par de matrizes, 31

relativamente ao círculo unitá-

rio, 32

sistema

relativamente ao círculo unitá-

rio, 31

estado

variáveis, 29

estado discreto

variavél, 31

forma normal

(n,m)-congruência por blocos, 75

Smith, 5

congruência por blocos, 39

de Jordan, 7

generalizada, 8

para a congruência, 8

100

Page 109: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Referências Bibliográ�cas 101

racional para a semelhança, 6

semelhança por blocos, 38

Smith, 4

inércia

matriz, 11

com respeito ao círculo unitá-

rio, 22

par de matrizes, 34

relativamente ao círculo unitá-

rio, 74

polinómio, 11

com respeito ao círculo unitá-

rio, 22

invariante

fator, 4, 5, 31, 34

polinómio, 4

matiz

conjunto, 2

matriz

companheira, 6

controlabilidade, 30

de�nida positiva, 3, 11, 12

determinante, 3

diagonal, 2

dominante por linhas, 3

espetro, 3

estável, 10

relativamente ao círculo unitá-

rio, 19, 21

relativamente ao círculo unitá-

rio, 27

estável positiva, 11

identidade, 2

inversa, 3

não derrogatória, 5, 6

nula, 2

raio espetral, 3

semide�nida positiva, 3

soma direta, 3

traço, 2

transconjugada, 2

transposta, 2

Matrizes

congruentes

por blocos, 38

101

Page 110: repositorio.ul.pt · agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas

Referências Bibliográ�cas 102

matrizes

congruentes, 8

equivalentes, 4

semelhantes, 6

por blocos, 37

par de matrizes

(n,m)-congruentes por blocos, 74

estabilizável positivo, 35

polinómio

caraterístico, 5, 11, 34

par de matrizes, 33

grau, 1

mónico, 2, 5

mínimo, 5

polinómios

divide, 2

semelhança

por blocos, 37

sistema

estável, 10

relativamente ao círculo unitá-

rio, 19

estabilizável, 30

teorema

continuidade de valores próprios,

9

geral da inércia

caso complexo, 13

caso real, 17

generalização, 18

Lyapunov, 36

caso complexo, 11

caso real, 16

Stein

caso complexo, 21

valor próprio

par de matrizes, 41

valores próprios

par de matrizes, 34

102