Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH...

28
Projeto de Pesquisa Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH Muñoz Sumário 1. Introdução 2 2. Indicadores 4 3. Material básico 6 4. Subprojeto 1: Homotopia e Geometria Hiperbólica 19 5. Subprojeto 2: Zeros Reais 21 6. Subprojeto 3: Polinômios Esparsos 24 Referências 26 Pedido de Renovação e Reclassificação da Bolsa de Produtividade em Pesquisa Última modificação: 5 de agosto de 2010.

Transcript of Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH...

Page 1: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

Projeto de Pesquisa

Complexidade de Algoritmos Numéricos

Gregorio MALAJOVICH Muñoz

Sumário

1. Introdução 2

2. Indicadores 4

3. Material básico 6

4. Subprojeto 1: Homotopia e Geometria Hiperbólica 19

5. Subprojeto 2: Zeros Reais 21

6. Subprojeto 3: Polinômios Esparsos 24

Referências 26

Pedido de Renovação e Reclassificaçãoda Bolsa de Produtividade em PesquisaÚltima modificação: 5 de agosto de 2010.

Page 2: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

2

1. Introdução

Algoritmos (e em particular algoritmos numéricos) são um objetode estudo em matemática desde a antiguidade. Uma novidade doséculo passado é o estudo matemático de classes de algoritmos e dacomplexidade associada a um problema ou classe de problemas.

O famoso problema P 6= NP já é considerado um dos principaisproblemas em aberto para a comunidade matemática (tanto é quefoi incluido na lista dos problemas do milênio do Instituto Clay).

De maneira mais geral, os aspectos matemáticos que permeiamáreas ‘aplicadas’ como computação, análise numérica e otimizaçãosão objetos de estudo matemático rigoroso.

Neste projeto, pretendo obter avanços relacionados com algunsdos Problemas em aberto descritos abaixo.

Nota ao Comitê Assessor: Por força do sistema do CNPq, pre-cisei cadastrar este projeto como Matemática Aplicada. Ele nãose insere em nenhuma das comunidades majoritárias no Brasil, ese eu pudesse o classificaria como Matemática, com áreas secundá-rias Análise Numérica, Geometria Diferencial, Geometria Algébrica,Matemática da Computação, Probabilidade.

1.1. Relevância internacional. O interesse matemático internacio-nal provocado por esse tipo de problemas se mede, por exemplo,pela rápida ascensão de revistas focadas neles.

Por exemplo, pelo critério de Fator de Impacto de 5 anos (fonte:ISI web of knowledge, 2009 JCR Science Edition) as revistas top em ma-temática são:

Nome ISSN ImpactoANN MATH 0003-486X 4.310

COMMUN PUR APPL MATH 0010-3640 4.132

B AM MATH SOC 0273-0979 3.733

J AM MATH SOC 0894-0347 3.675

ACTA MATH-DJURSHOLM 0001-5962 3.016

INVENT MATH 0020-9910 2.982

FOUND COMPUT MATH 1615-3375 2.655

MEM AM MATH SOC 0065-9266 2.519

PUBL MATH-PARIS 0073-8301 2.083

DUKE MATH J 0012-7094 2.039

(Note-se que o primeiro número de Foundations of ComputationalMathematics saiu em 2001.)

Este projeto de pesquisa engloba o estudo matemático de algo-ritmos numéricos. Em particular, pretendo trabalhar em um certonúmero de problemas relacionados com a solução numérica de sis-temas de polinômios. O foco está em obter teoremas. Em alguns

Page 3: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

3

casos, esses teoremas podem inspirar uma melhoria nos algoritmosexistentes. Em outros casos, podem implicar na impossibilidade dese obter algoritmos eficientes.

Um exemplo de problema em aberto nesta área é:

Problema 1 (17o problema de Smale). É possível encontrar aproxi-madamente um zero de um sistema de n equações polinomiais, emtempo esperado polinomial, utilizando um algoritmo uniforme?

A formulação técnica foi especificada em [32], nas suas referên-cias e no livro-texto [5]. Nesse livro, são explicadas algumas dasconexões entre o problema de resolver sistemas de polinômios, aquestão P 6= NP e as versões de P 6= NP sobre os complexos esobre os reais.

1.2. Relevância tecnológica. Do ponto de vista tecnológico, um me-lhor entendimento matemático da análise numérica se traduz emalgoritmos mais eficientes e/ou mais confiáveis.

Em particular, não existe hoje uma tecnologia satisfatória pararesolver sistemas de equações polinomiais. Uma melhora nessa tec-nologia teria efeito em áreas como engenharia mecânica, cinéticaquímica ou bioquímica, gráficos computacionais, otimização não-linear, controle, e outras.

1.3. Relevância econômica e para o desenvolvimento nacional. Das13 áreas apontadas pelo Ministério da Ciência e Tecnologia comoestratégicas,1 pelo menos 8 (a saber:

• Tecnologias da Informação e Comunicação,• Energia Elétrica, Hidrogênio e Energias Renováveis,• Petróleo, Gás e Carvão Mineral,• Amazônia e Semi-Árido,• Meteorologia e Mudanças Climáticas,• Programa Espacial,• Programa Nuclear, e• Defesa Nacional e Segurança Pública)

demandam tecnologias computacionais que dependem pesadamentede análise numérica, como sensoriamento remoto, simulações outratamento da informação. Desses setores, Petróleo, Gás, Tecnolo-gias da Informação e Comunicação e Segurança Pública são tambémvitais para o Estado do Rio de Janeiro.

Este é um projeto de ciência básica e não pretendemos agir dire-tamente nessas áreas. Mas podemos contribuir indiretamente, porgeração de conhecimento, capacitação e formação de pessoal.

1http://www.mct.gov.br/index.php/content/view/73412.html

Page 4: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

4

1.4. Inserção internacional. O presente projeto se insere dentro deuma rede de colaboração internacional da qual participam entre ou-tros: Carlos Beltrán (Univ. de Cantábria), Felipe Cucker (City Uni-versity of Hong Kong), Jean-Pierre Dedieu (Université Paul Sabatier,Toulouse), Teresa Krick (Universidad de Buenos Aires), Mike Shub(City Univ of New York e Univ. de Buenos Aires), Mario Wsche-bor (Univ. de la República). (Nesta lista, inclui apenas os coautoresmais recentes) Pela parte Brasileira, solicitei recursos ao PROSUL eao projeto MathAmSud (que permitiria ampliar a equipe).

Essa rede se desenvolveu a partir da fundação da sociedade Foun-dations of Computational Mathematics, www.focm.net, da qual parti-cipo como membro do board of directors.

1.5. Organização do texto. Este texto está organizado assim: emprimeiro lugar, descrevo os indicadores pertinentes à minha pro-dução dos últimos 10 anos. Como considero que indicadores sófazem sentido quando ponderados também pela profundidade, di-ficuldade e interesse da produção científica, disponibilizo todos osartigos em linha a partir do meu currículo Lattes (via DOI), a partirdeste projeto (hyperlinks do arquivo PDF, para os quais é necessárioter acesso ao MathSciNet e ao Portal de Periódicos) ou a partir daminha página, www.labma.ufrj.br/~gregorio. Os preprints estãodisponibilizados no ArXiV (www.arxiv.org).

Depois, reproduzo um capítulo do meu livro [17] com algumasexplicações e material básico sobre complexidade de algoritmos nu-méricos.

O objetivo é tornar mais legível a descrição dos três diferentessubprojetos e nos quais pretendo trabalhar. Nas seções seguintes,explico o que foi feito em cada um deles e quais os objetivos atuais.

2. Indicadores

Entre 2001 e 2010, foram publicados os seguintes artigos em jour-nals indexados com corpo editorial fixo (ordem cronológica reversa):[1] Carlos Beltrán, Jean-Pierre Dedieu, Gregorio Malajovich, and Mike Shub,

Convexity properties of the condition number, SIAM J. Matrix Anal. Appl. 31(2009), no. 3, 1491–1506, DOI 10.1137/080718681. MR2587788

[2] Felipe Cucker, Teresa Krick, Gregorio Malajovich, and Mario Wschebor,A numerical algorithm for zero counting. II. Distance to ill-posedness and smo-othed analysis, J. Fixed Point Theory Appl. 6 (2009), no. 2, 285–294, DOI10.1007/s11784-009-0127-4. MR2580979

[3] , A numerical algorithm for zero counting. I. Complexity and accuracy,J. Complexity 24 (2008), no. 5-6, 582–605, DOI 10.1016/j.jco.2008.03.001.MR2467589 (2010d:68063)

[4] Jean-Pierre Dedieu and Gregorio Malajovich, On the number of minimaof a random polynomial, J. Complexity 24 (2008), no. 2, 89–108, DOI10.1016/j.jco.2007.09.003. MR2400310 (2009j:26015)

Page 5: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

5

[5] Gregorio Malajovich and Klaus Meer, Computing minimal multi-homogeneousBézout numbers is hard, Theory Comput. Syst. 40 (2007), no. 4, 553–570, DOI10.1007/s00224-006-1322-y. MR2305377 (2009a:68028)

[6] Jean-Pierre Dedieu, Gregorio Malajovich, and Mike Shub, On the curvature ofthe central path of linear programming theory, Found. Comput. Math. 5 (2005),no. 2, 145–171, DOI 10.1007/s10208-003-0116-8. MR2149414 (2006a:90053)

[7] Gregorio Malajovich and J. Maurice Rojas, High probability analysis of the con-dition number of sparse polynomial systems, Theoret. Comput. Sci. 315 (2004),no. 2-3, 524–555, DOI 10.1016/j.tcs.2004.01.006. MR2073064 (2005e:34166)

[8] Jean-Pierre Dedieu, Pierre Priouret, and Gregorio Malajovich, Newton’smethod on Riemannian manifolds: convariant alpha theory, IMA J. Numer.Anal. 23 (2003), no. 3, 395–419, DOI 10.1093/imanum/23.3.395. MR1987937

(2004e:65061)[9] Gregorio Malajovich, Lower bounds for some decision problems over C, Theoret.

Comput. Sci. 276 (2002), no. 1-2, 425–434, DOI 10.1016/S0304-3975(01)00273-0. MR1896363 (2003a:68051)

[10] Gregorio Malajovich and Jorge P. Zubelli, Tangent Graeffe iteration, Numer.Math. 89 (2001), no. 4, 749–782. MR1865511 (2003i:65044)

[11] , On the geometry of Graeffe iteration, J. Complexity 17 (2001), no. 3,541–573, DOI 10.1006/jcom.2001.0585. MR1851059 (2003c:65042)

[12] J. Demmel, B. Diament, and G. Malajovich, On the complexity of compu-ting error bounds, Found. Comput. Math. 1 (2001), no. 1, 101–125, DOI10.1007/s10208001004. MR1829238 (2002a:65213)

[13] Gregorio Malajovich, On a transfer theorem for the P 6= NP conjecture, J. Com-plexity 17 (2001), no. 1, 27–85, DOI 10.1006/jcom.2000.0568. MR1817608

(2001m:68041)

Os seguintes artigos estão submetidos:[14] Carlos Beltrán, Jean-Pierre Dedieu, Gregorio Malajovich, and Mike Shub,

Convexity properties of the condition number II. Preprint, ArXiV, http://arxiv.org/abs/1007.1597.

[15] Felipe Cucker, Teresa Krick, Gregorio Malajovich, and Mario Wschebor, Anumerical algorithm for zero counting. III. Randomization and Condition. Preprint,ArXiV, http://arxiv.org/abs/0910.5936.

Foram ainda publicados dois resumos completos:[16] Gregorio Malajovich and Klaus Meer, Computing minimal multi-homogeneous

Bézout numbers is hard, STACS 2005, Lecture Notes in Comput. Sci., vol. 3404,Springer, Berlin, 2005, pp. 244–255. MR2151622 (2006b:68041)

[17] Gregorio Malajovich and J. Maurice Rojas, Polynomial systems and the mo-mentum map, Foundations of computational mathematics (Hong Kong,2000), World Sci. Publ., River Edge, NJ, 2002, pp. 251–266. MR2021984

(2004k:65090)

O primeiro livro abaixo (divulgação) foi publicado por ocasiãode um mini-curso no CNMAC. O segundo está em fase final derevisão. É destinado à turma de elite de Álgebra Linear, compostade estudantes de Matemática Aplicada e do Programa Especial deEngenharia.[18] Gregorio Malajovich, Geometria de Algoritmos Numéricos, Notas em Mate-

mática Aplicada, vol. 36, SBMAC, São Carlos, setembro de 2008. http:

//www.labma.ufrj.br/~gregorio.

Page 6: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

6

[19] , Álgebra Linear, março de 2010. http://www.labma.ufrj.br/

~gregorio.

Foram orientadas no período as seguintes dissertações de Mestrado:[20] Vinicius Gripp Barros Ramos, Curvas Algébricas e Geometria Tropical, Disser-

tação de Mestrado, Universidade Federal do Rio de Janeiro, Julho de 2007,http://teses.ufrj.br/IM_M/ViniciusGrippBarrosRamos.pdf.

[21] Bruno do Nascimento Morier, Volume Misto e o Teorema de Bernstein, Disser-tação de Mestrado, Universidade Federal do Rio de Janeiro, 2004.

[22] Caio Guimarães Souza, Estimativas para a convergência de Graeffe Tangente,Dissertação de Mestrado, Universidade Federal do Rio de Janeiro, Previstapara 2010.

A seguinte tabela sumariza alguns indicadores das revistas nasquais publiquei no período.

Nome Avaliação Qualis MCQ ImpactoFound. of Computational Mathematics A1 1.37 2.655

Numerische Mathematik A1 1.04 2.023

IMA Journal of Numerical Analysis A2 0.96 1.967

SIAM J. on Matrix Analysis and Applications Não consta 0.90 1.923

Journal of Complexity A2 0.60 1.305

Theoretical Computer Science A1 Ma e Com 0.26 1.103

Theory of Computing Systems B1 Com/B3 Ma. 0.24 0.868

J. of Fixed Point Theory and Applications (novo) B2 0.42 0.605

Fontes: CAPES, Webqualis atualizado em 2010. Ma é Matemáticae Comp. é Ciência da Computação. MATHSCINET, MCQ-2009. ISIWEB OF KNOWLEDGE, 2009 JCR Science edition, Fator de Impactode 5 anos.

Fui guest editor do Journal of Complexity em duas ocasiões, (Núme-ros 21-1(2005) e 24-1(2008)).

3. Material básico

Reproduzo aqui o primeiro capítulo do meu livro Geometria de Algo-ritmos Numéricos [17]. O objetivo é cobrir algumas definições básicas,assim como introduzir as conexões entre algoritmos de homotopia e geome-tria algébrica. Analistas numéricos podem pular para a seção 3.4

Condicionamento, e a Variedade Discriminante

3.1. O que não se ensina no curso de Álgebra Linear. Nos cursosde Álgebra Linear, ensinamos a resolver sistemas de equações afins,ou seja, sistemas da forma

(1) Ax = b ,

onde A é uma matriz n× n, e b e x são vetores em Rn. Essa equaçãotem solução x única se e somente se det(A) 6= 0.

Nos bons cursos de Álgebra Linear, ensina-se a resolver o sis-tema (1) por eliminação Gaussiana ou por fatoração PLU. Isso só

Page 7: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

7

vale para sistemas com matriz inversível (e as outras situações sãotratadas caso a caso).

Por exemplo, o sistema0 0 10 1 00 1 1

x =

b1b2b3

admite uma reta de soluções se e somente se b3 = b1 + b2.

Teoricamente, o sistema

(2)

ε 0 10 1 ε0 1 1

x =

b1b2b3

tem sempre solução para ε 6= 0.

Vamos escolher b = [1, 0, 1]T e resolver este último sistema poreliminação: subtraindo a segunda linha da terceira, obtemos:ε 0 1

0 1 ε0 0 1− ε

x =

101

.

Ou seja, x3 = 1/(1− ε), x2 = −εx3 e x1 = (1− x3)/ε = 1/(1− ε).No limite,

limε→0

x1 = 1.

Esses são resultados exatos e teóricos, obtidos simbolicamente.Ao refazer o mesmo exemplo numericamente, fica evidente que ateoria não descreve de maneira adequada a realidade de um com-putador digital.

Vamos utilizar diversos valores de ε:#include <stdio.h>#include <math.h>

void resolve(float epsilon){float x[4] ;

x[3] = 1.0 /(1.0-epsilon) ;x[2] = -epsilon * x[3] ;x[1] = (1.0 - x[3]) / epsilon ;

printf("x = [% 15.12e % 15.12e % 15.12e]\n", x[1],x[2],x[3]) ;}

Podemos agora olhar para os resultados:

Page 8: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

8

Figura 1. Representação de números de ponto flutu-ante em precisão simples (padrão IEEE 754). Númerosde ponto flutuante em precisão dupla são representa-dos de maneira análoga com 52 bits de mantissa, 11

de expoente e um de sinal.

main()

{

resolve(pow(2.0, -21)) ;

resolve(pow(2.0, -22)) ;

resolve(pow(2.0, -23)) ;

resolve(pow(2.0, -24)) ;

resolve(pow(2.0, -25)) ;

resolve(pow(2.0, -26)) ;

}

gregorio@momentum:~/cnmac$ ./arredonda

x = [-1.000000000000e+00 -4.768373855768e-07 1.000000476837e+00]

x = [-1.000000000000e+00 -2.384186359450e-07 1.000000238419e+00]

x = [-1.000000000000e+00 -1.192093037616e-07 1.000000119209e+00]

x = [-2.000000000000e+00 -5.960465188082e-08 1.000000119209e+00]

x = [ 0.000000000000e+00 -2.980232238770e-08 1.000000000000e+00]

x = [ 0.000000000000e+00 -1.490116119385e-08 1.000000000000e+00]

Quando ε é suficientemente pequeno, o resultado obtido para x1é zero ! Isso se deve à maneira como os números reais são repre-sentados. Computadores trabalham com grandezas aproximadas,representadas como números de ponto flutuante. O formato pa-drão em uso nos computadores modernos (figuras 1 e 2) prevê 23

bits de mantissa.

Page 9: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

9

Formato Precisão simples Precisão dupla IEEE-854

dupla estendidaLinguagem C float double long doubleBits de mantissa 23 52 64

Bits de expoente 8+1 11+1 15+1

Menor representável > 1 1 + 2−23 1 + 2−52 1 + 2−64

Menor arredondado a 1: 1 + 2−24 1 + 2−53 1 + 2−65

Figura 2. Padrão IEEE 754. Dados tirados de/usr/include/ieee754.h

O modelo de aritmética utilizado hoje em todos os computadoresé o padrão IEEE754/854 [16, Cap. 2.3]. Este modelo constitui umadefinição axiomática rigorosa da aritmética digital, embora permita dife-rentes implementações. As regras ou axiomas do padrão permitem provarteoremas sobre algoritmos numéricos.

Por outro lado, x1 = 0 está longe da solução do sistema (2). Paraentender as implicações de se utilizar aritmética IEEE, é preciso en-tender não apenas o efeito do arredondamento no algoritmo, masainda o conceito de condicionamento, que é independente do algo-ritmo.

3.2. Arredondamento e condicionamento. Um estudo cuidadosodo algoritmo de eliminação Gaussiana sob a aritmética de pontoflutuante [13, Seção 2.4.2] mostra que, se o computador produziruma “solução” x para o problema Ax = b, então x é a solução exatapara um problema aproximado,

(A + δA) x = b .

Além disso, prova-se que ‖δA‖F ≤ 3nε‖L‖F‖U‖F, onde A = PLUé a fatoração PLU de A e ‖ · ‖F denota a norma de Frobenius (VerApêndice).

Subtraindo a equação Ax = b, obtemos:

δA x + A δx = 0 .Ou seja,

δx = A−1 δAxe o erro relativo da solução aproximada pode ser estimado por:

‖δx‖‖x + δx‖ ≤ ‖A−1‖2‖δA‖F

‖x‖‖x + δx‖ .

Isso implica:

‖δx‖‖x + δx‖ ≤ ‖A−1‖2‖A‖F

‖δA‖F

‖A‖F

‖δx‖‖x + δx‖ .

Page 10: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

10

Seja κA = ‖A‖2‖A−1‖F. Nesse caso, obtemos:

‖δx‖‖x + δx‖ ≤ κA

‖δA‖F

‖A‖F.

Em outras palavras: O processo numérico utilizado para computarx produziu a solução exata de um problema aproximado. O erro relativona solução x pode ser estimado pelo produto do erro relativo no problema,vezes o número κA.

O número κA não depende do algoritmo utilizado para resolver osistema de equações. Ele é um invariante que depende apenas doscoeficientes do sistema. É chamado de número de condicionamentoda matriz A, associado ao problema de resolver Ax = b.

No exemplo numérico acima, κA '√

2ε−1.

3.3. O polinômio pérfido. O polinômio pérfido de grau d (tambémconhecido como polinômio de Pochammer) é definido por:

pd(x) = (x− 1)(x− 2) · · · (x− d) .

Por exemplo,

p10(x) = x10 − 55x9 + 1320x8 − 18150x7 + 157773x6 − 902055x5 +

+ 3416930x4 − 8409500x3 + 12753576x2 − 10628640x1 + 3628800.

Uma maneira de se encontrar a raízes de polinômios de grau baixoé produzir a matriz companheira associada a eles. Se f (x) = xd +fd−1xd−1 + · · ·+ f1x + f0, então a matriz companheira de f é

C f =

0 1 0 · · · 0

. . . . . . .... . . . . . ...

0 1− f0 − f1 · · · − fd−2 − fd−1

.

A matriz companheira foi construída de maneira que f fosse oseu polinômio característico (a menos do sinal):

det C f − λI = (−1)d f (λ).

Assim, reduzimos o problema de resolver um polinômio de graud a outro problema, que é o de achar os autovalores de uma matrizd × d. Existe excelente software numérico para achar autovalores.Vamos aplicar essa idéia ao polinômio pérfido.p=poly(1:10)C=[ [zeros(9,1),eye(9)]; -p(11:-1:2)]x=eig(C)

x =

Page 11: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

11

10.000009.000008.000007.000006.000005.000004.000003.000002.000001.00000

A solução parece correta. Mas conhecemos a solução exata, epodemos conferir:

x - [10:-1:1]´ans =

4.3965e-11-2.1128e-104.4744e-10-5.4329e-104.0626e-10-1.8595e-104.9097e-11-6.6769e-124.0634e-13-1.5654e-14

Mais uma vez, a solução parece correta. O fato do Octave usararitmética de dupla precisão deveria no entanto levantar suspeitas.O erro relativo de cada operação aritmética em precisão dupla é deno máximo 2−53 ' 10−16. Não está claro se o resultado é acurado.O mesmo acontece se utilizamos o comando roots.

Vamos agora repetir o experimento, com grau 20.

Page 12: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

12

p=poly(1:20)C=[ [zeros(19,1),eye(19)]; -p(21:-1:2)]x=eig(C)

x =

19.999419.005617.976917.052415.909215.102113.9168

13.055311.975311.00929.99759.00057.99997.00006.00005.00004.00003.00002.00001.0000

O seguinte experimento mostra que a dificuldade em se resolverpolinômios pérfidos não é bug do software ou deficiência do algo-ritmo:

p=poly(1:10)p(11)=p(11)*1.0001C=[ [zeros(9,1),eye(9)]; -p(11:-1:2)]x=eig(C)x =

9.99909.00897.96247.08075.86735.13273.91933.03761.99111.0010

Uma perturbação de 0.01% em um dos coeficientes provocou umaperturbação de 2% nos valores das raízes.

Para explicar o ocorrido, introduzimos o número de condiciona-mento de Wilkinson para polinômios: se ζ é um zero isolado de f ,define-se o condicionamento por

κ f (ζ) =‖ f ‖| f ′(ζ)| .

Se z for uma solução exata do polinômio f + δ f , então podemosdefinir implicitamente:

Page 13: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

13

( f + tδ f )(z(t)) = 0com z(1) = z. Derivando em relação a t,

(δ f )(z(t)) + ( f + δ f )′(z(t)) = 0e logo

‖z(t)‖ ≤ 1|( f + δ f )′(z(t))| ‖δ f ‖

∥∥∥∥∥∥∥∥∥∥∥

1

z(t)z(t)2

...z(t)deg f

∥∥∥∥∥∥∥∥∥∥∥.

Podemos concluir (com um pouco mais de trabalho) que o erro‖δz‖ é no máximo da ordem de

κ f (ζ)‖δ f ‖‖ f ‖

√deg f max(1, |ζ|)deg f .

3.4. Teoria geral. Números de condicionamento foram estudados edefinidos para os mais diversos problemas, como por exemplo pro-blemas de autovalores, solução de sistemas de polinômios, mínimosquadrados, etc... (Ver [5, 13]).

A teoria geral de números de condicionamento utiliza conceitosde geometria diferencial. Vamos introduzir abaixo alguns concei-tos fundamentais de Cálculo em Variedades, essenciais para o bomentendimento do que segue.

Em primeiro lugar, uma função diferenciável é uma função deri-vável, com derivada contínua. Se for uma função vetorial, exigimosque todas as derivadas parciais em relação a todas as variáveis sejamdiferenciáveis, e representamos a derivada pela matriz das deriva-das parciais.

Definição 1. SejaF : Rn → Rm

x 7→ F(x)uma função diferenciável, com n ≥ m. Um ponto crítico de F é umx ∈ Rn tal que DFx tenha posto < m, ou seja, que as colunas de DFxnão sejam independentes, ou ainda que a aplicação linear DFx nãoseja sobrejetora. Um ponto regular é um x ∈ Rn que não é crítico.Definimos ainda um valor crítico de F como um y ∈ Rm que sejaimagem por F de um ponto crítico. Um y ∈ Rm é dito valor regularse ele não é imagem de nenhum ponto crítico.

Definição 2. Uma subvariedade diferenciável d-dimensional M im-plícita em Rn é um conjunto da forma F−1(0), onde

F : Rn → Rm

x 7→ F(x)

Page 14: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

14

é uma função diferenciável, e 0 é valor regular de F.

Neste texto, uma variedade é sempre uma subvariedade diferenciá-vel d-dimensional implícita de algum espaço linear. Por exemplo, oconjunto das matrizes n× n de determinante zero é uma variedade.

Se M = F−1(0) é uma variedade (no nosso sentido) e x um pontode M, definimos o espaço tangente a M em x como

TxM = ker DFx .

Existe uma parametrização de TxM em uma vizinhança de x ∈M. Dessa maneira, podemos (localmente) introduzir sistemas decoordenadas em M. Se F : Rn → Rm, então TxM tem dimensãon−m e dizemos que M tem dimensão m− n.

Se M e N são variedades e Φ : M → N, então definimos DΦx :Tx → TΦ(x) como a melhor aproximação linear de Φ (se existir).Dessa maneira, podemos fazer cálculo em variedades.

Uma definição diferente de variedade é utilizada em geometria al-gébrica. Um fechado de Zariski é o conjunto dos zeros de uma coleçãode polinômios (reais, complexos, etc...). Uma variedade algébrica éum fechado de Zariski, que não se escreve como união trivial de fe-chados de Zariski. A variedade das matrizes A tais que det A = 0,por exemplo, é uma variedade algébrica.

Um problema numérico é definido por um espaço (ou variedade!)F de entrada (por exemplo, as matrizes n× n) e um espaço X desoluções (exemplo: autovalor λ ∈ C). Existe uma regra associandosoluções às entradas. Essa regra não é nem pode ser uma funçãounívoca, pois certos problemas (por exemplo, o problema de auto-valores) admitem várias soluções.

No exemplo, um número complexo λ é autovalor de A se e so-mente se det(A− λI) = 0. Definimos portanto a seguinte variedadede F ×C, chamada de variedade de incidência (Figura 3):

(3) V = {(A, λ) ∈ F ×C : det(A− λI) = 0}

(A prova de que V é variedade é um exercício). π1 : V → F eπ2 : V → C denotam as projeções canônicas.

Dado (M, λ) ∈ V ⊂ F × X, podem acontecer duas situações:

• (A, λ) é ponto crítico da projeção π1 : V → F . Nesse caso,a entrada A é chamada de mal-posta, ou degenerada. Pordefinição, o número de condicionamento µ(A, λ) em (A, λ)é infinito.• (A, λ) é ponto regular da projeção V → F. Nesse caso (Teo-

rema da Função Implícita !) podemos estender λ como fun-ção (π2 ◦ π−1

1 )de A, localmente, em uma certa vizinhança de

Page 15: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

15

π1

π2

F

Ponto regular

Valor regular

C

Variedade de incidência

Pontos críticos

Valores críticos

Figura 3. Formulação geral.

A. O número de condicionamento µ(A, λ) em (A, λ) é anorma da derivada da função implícita (π2 ◦ π−1

1 ) em A.

Em geral, o número de condicionamento é proporcional à norma daderivada da solução em função da entrada, podendo ser infinito. Se forgrande, a entrada é dita “mal condicionada”. Se for infinita, ela édegenerada ou “mal posta”. Se pudéssemos impunemente brincarcom a precisão de nossos computadores, o número de bits necessáriopara resolver um problema com uma certa entrada seria proporcional aologaritmo do condicionamento desta.

3.5. Os problemas mal postos. Os números de condicionamentomedem a dificuldade de resolver um problema para determinadaentrada. A esse título, constituem a noção central em análise numé-rica, e números de condicionamento altos são a principal obstruçãopara algoritmos numéricos.

Identificada a obstrução, cumpre entendê-la, para depois tomaras devidas providências (contornar? remover? explodir? conformar-se?).

Na maioria dos problemas numéricos estudados em dimensão fi-nita, o conjunto das entradas mal-postas tem estrutura de variedadealgébrica. Essa variedade não é, em geral, diferenciável. Por exem-plo, no caso do problema de resolver sistemas lineares, as entradasmal-postas são precisamente:

{A : det A = 0} .

Page 16: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

16

No caso de polinômios em uma variável, a classe das entradasmal postas é a variedade dos polinômios com uma raiz múltipla.Em função dos coeficientes, isso equivale a escrever:

det

f0 f1

f1. . . ... . . .

... f0 (d− 1) fd−1. . .

... f1 d fd. . . f1

fd... . . . . . . ...

. . . ... . . . (d− 1) fd−1fd d fd

= 0 .

A variedade das entradas mal postas é um objeto extremamentecomplicado, mas tem sempre codimensão ≥ 1 (i.e. dimensão N − 1em um espaço de dimensão N).

Podemos deduzir que• A probabilidade de uma entrada aleatória ser mal posta é

zero.• A variedade das entradas mal postas não desconecta a vari-

edade de todas as entradas... desde que se trate de varieda-des complexas.• Superfície e área de vizinhança tubular podem ser estimadas.

3.6. A decomposição em valores singulares. Precisamos agora dealguns teoremas de Álgebra Linear. O principal deles é o teoremada decomposição em valores singulares, e vamos deduzi-lo do Teo-rema Espectral.

Teorema 3 (T. Espectral para matrizes simétricas). Seja S uma matrizsimétrica real n× n. Então todos os autovalores de S são reais, e S admiteuma base ortonormal de autovetores.

A prova foi deixada para os exercícios. Admitindo esse resultado,podemos passar ao Teorema seguinte.

Seja A : Rn → Rm uma aplicação linear. Os espaços Rn e Rm sãomunidos do produto interno canônico.

Vamos mostrar que existe uma base ortonormal (v1, . . . , vn) deRn, e uma base ortonormal (u1, . . . , un) de Rm, tais que a matrizassociada A relativa a essas duas bases é diagonal.

Uma matriz Σ de tamanho m× n é diagonal positiva se e somentese para todo i, Σii ≥ 0, e para i 6= j, Σij = 0.

Teorema 4. Seja A uma matriz real de tamanho m × n. Então existemU ∈ O(m), V ∈ O(n) e Σ diagonal positiva de tamanho m× n, tais que

A = UΣVT .

Page 17: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

17

Demonstração. Para fixar as idéias, vamos assumir que m ≥ n. (Nocaso m < n, basta substituir A por AT).

A matriz AT A é real e simétrica. Pelo Teorema Espectral, ela ad-mite uma base ortonormal (v1, . . . , vn) de autovetores. Denotamospor λi os autovalores de AT A. Para todo i = 1, . . . , n, definimos

σi = ‖Avi‖e assumimos que a base vi está ordenada de maneira que σ1 ≥ σ2 ≥· · · ≥ σn. Seja r o posto de A, então σ1, . . . , σr 6= 0 e para todoi ∈ {1, 2, . . . , r}, podemos definir

ui = σ−1i Avi .

Por construção, ‖ui‖ = 1. (Note que isso implica que σ2i = λi).

Como para todo i 6= j, vi(AT A)vj = λjvTi vj = 0, teremos que

〈ui, uj〉 = 0 e os ui formam um conjunto ortonormal.Existe uma base (u1, . . . , ur, wr+1, . . . , wm) de Rn. Aplicando Gram-

Schmidt a essa base, obtemos uma base ortonormal (u1, . . . , um).Como todo vetor ortogonal à imagem de A pertence ao núcleo deAT,

A = U

σ1 0 0 · · · 00 σ2 0 · · · 00 0 σ3...

... . . .0 0 σr0 0 0...

......

0 0 0

VT .

Os σi’s são chamados de valores singulares de A, e os ui’s e vi’sde vetores singulares.

Uma interpretação geométrica é a seguinte. Assuma que A é detamanho m× n, com m ≥ n e posto n). Seja

E = {Ax : ‖x‖ ≤ 1} .

O conjunto E é o elipsóide de centro zero, e semieixos σiui.

3.7. Os problemas mal condicionados. Lembremos que o númerode condicionamento de uma matriz A é dado por

κA = ‖A‖2‖A−1‖F .

Seja Σ = {A : det A = 0} a variedade das entradas mal postas.

Teorema 5 (Eckart-Young).

κA =1

d(Σ, A)/‖A‖F

Page 18: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

18

onde d(Σ, A) = min(A+δA)∈Σ ‖δA‖F.

Prova: Vamos utilizar a decomposição em valores singulares deA. Pelo Teorema 4, toda matriz A se escreve como:

A = UΣV

onde U e V são matrizes ortogonais, e Σ é uma matriz diagonal realnão-negativa. Seja

Σ =

σ1

σ2. . .

σn

com σ1 ≥ σ2 ≥ · · · σn > 0. Então, podemos escrever explicitamente:

‖A‖F =√

∑ σ2i

e

κA =√

∑ σ2i /σn .

A menor perturbação que torna A singular é:

δA = U

0

. . .0−σn

VT

que tem norma σn. Logo, d(A, Σ)/‖A‖F = σn/‖A‖F = 1/κA, q.e.d.Resultados análogos foram descobertos para problemas como o

problema de autovalores, problema de mínimos quadrados, soluçãode polinômios, de sistemas de polinômios.

Esses resultados sugerem o seguinte paradigma: O número de con-dicionamento pode ser interpretado como o inverso da distância à variedadedas entradas mal postas.

Como todo paradigma, deve ser tomado com um certo cuidado.No caso de polinômios e sistemas de polinômios, a igualdade é umpouco mais sutil: o número de condicionamento µ( f , ζ) é a inversada distância medida dentro da “fibra” das entradas f com soluçãoem ζ ([5, Cap.12]).

No caso do problema de autovalores não-simétrico, a distância émenor ou igual a 1/

√c2 − 1 ' 1/c, onde c é o número de condicio-

namento ([13, Teorema 4.6]).

No entanto, o paradigma acima permite atacar a perguntas comoa seguinte: qual é a probabilidade de uma matriz ter número de condiçãomenor do que um certo ε−1 ? Para isso precisamos definir uma medidade probabilidade sobre as matrizes. Por exemplo, se as coordenadas

Page 19: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

19

são variáveis aleatórias Gaussianas, identicamente e independente-mente distribuídas, Alan Edelman mostrou [15, Cor. 7.1] que

limn→∞

Prob[κ < ε−1] = e−2nε−2n2ε2.

Pelo Teorema de Eckart-Young, estamos calculando o volume (pro-babilidade total) de uma vizinhança tubular de raio ε da variedadealgébrica det A = 0.

4. Subprojeto 1: Homotopia e Geometria Hiperbólica

Algoritmos de homotopia para resolver um sistema de equações(por exemplo polinomiais) F1(x) = 0 funcionam da seguinte ma-neira: Escolhe-se outro sistema F0 com solução x0 conhecida. Escolhe-se também um caminho ou família a um parâmetro (Ft)t∈[0,1] unindoF0 a F1 (ver Figura 3).

Os sistemas F0 e F1 pertencem a um espaço F de sistemas deequações.

Consideramos também a variedade de incidência V = {(F, x) ∈F × Cn : F(x) = 0}. É possível garantir sob certas circunstâncias(por exemplo, genericidade de F0 caso se trabalhe com equações acoeficientes complexos) garantir a existência de um levantamento docaminho Ft a um caminho (Ft, xt) na variedade de incidência V .

Para se obter algoritmos e resultados de complexidade, é necessá-rio ainda dizer como aproximar o levantamento. Uma possibilidadeé definir

xti+1 = N(Fti , xti)

onde N(F, x) = x − DF(x)−1F(x) é a iteração de Newton, t0 = 0,tN = 1, e os ti são escolhidos judiciosamente.

A complexidade de tais algoritmos depende do total de passos N.Estimativas para N foram o objeto da sequência [3, 26–31]. Existeforte evidência de que o custo de seguir um caminho seja da ordemde

(4)∫

µ(Ft, xt)‖xt‖ dt

passos, onde µ(F, x) é o número de condicionamento de F em x.(Os ‘algoritmos’ existentes ainda não são algoritmos efetivos. Verproblema 5 abaixo).

Neste projeto, geometrizamos a noção de compexidade. A equa-ção (4) pode ser entendida como o comprimento do caminho (Ft, xt)na nova métrica

〈·, ·〉′Ft,xt= µ(Ft, xt)〈·, ·〉

Assim, o estudo geometrico do espaço das geodésicas de 〈·, ·〉′nos permitirá obter estimativas de complexidade. Algumas per-guntas interessantes são:

Page 20: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

20

• log µ(Ft, xt) é uma função geodesicamente convexa ? Se issoocorrer, o máximo do número de condicionamento será atin-gido em um dos extremos.• Existe (F0, x0) tal que, na nova métrica, para todo (F1, x1),

d((F0, x0), (F1, x1)) < Cµ(F1, x1)2 para alguma constante C ?

4.1. O primeiro artigo: caso linear genérico. É conveniente intro-duzir aqui a noção de autoconvexidade. Uma função real definidaem uma variedade Riemanniana M é dita geodesicamente convexaquando a sua restrição a cada geodésica de M é uma função con-vexa. Ela é dita quasiconvexa se o máximo ao longo de um segmentogeodésico é sempre atingido em uma das extremidades. Toda fun-ção geodesicamente convexa é quasiconvexa.

Definição 6. Seja (M, 〈·, ·〉) uma variedade Riemanniana e seja α :M → R uma função de classe C2 a valores positivos. Seja Mκ avariedade M munida da nova métrica

〈·, ·〉κ,x = α(x)〈·, ·〉xconhecida como métrica do condicionamento. Dizemos que α é auto-convexa (self-convex) quando log ◦α é geodesicamente convexa emMκ.

O resultado principal de [1] é o seguinte: denotamos por GLn,mo espaço das matrizes n×m de posto n, m ≥ n. Dada uma matrizA, denotamos por σ1 ≥ σ2 ≥ · · · ≥ σn os seus valores singulares.Então σn é diferenciável em GL>

n,m = {A ∈ GLn,m : σn−1 > σn}.A métrica ‘original’ em GLn,m é dada por 〈A, B〉 = tr(ABT).

Teorema 7. A função A 7→ σ−2n é autoconvexa em GL>

n,m.

Outro resultado do mesmo artigo é um análogo geométrico doteorema anterior. Seja N ⊂ Rj uma variedade imersa de classe C2,com borda. Seja ρ(x) a distância entre x ∈ Rj e a variedade N . SejaU o conjunto dos x ∈ Rj tais que o ponto y ∈ N proximal a x éúnico.

Teorema 8. A função ρ−2 : N \ U → R é autoconvexa.

4.2. O caso linear geral. Os teoremas de [1] não permitiam inferirnada fora do domínio de diferenciabilidade do último valor singular(resp. do domínio de unicidade U ).

Em [2], consideramos estruturas de Riemann- Lipschitz: os coefi-cientes da métrica do condicionamento não são suaves em GLn,m,mas apenas Lipschitz. Não é possível portanto utilizar diretamenteos resultados da geometria diferencial clássica.

O conceito de geodésica precisa ser revisitado. O caminho mini-mal entre dois pontos pode não ser diferenciável.

Page 21: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

21

Definição 9. Uma geodésica minimizante entre A e B é um cami-nho absolutamente contínuo x : [0, L] → GLn,m, com x(0) = A,x(1) = B, e que minimiza o funcional L(x) =

∫‖x(t)‖κ,x(t) dt. Uma

geodésica é um caminho absolutamente contínuo, que é localmenteuma geodésica minimizante.

Nota: x(t) denota a derivada de x(t) em relação a t. Esta derivadaexiste para quase todo t, e é integrável.

De posse desta noção de geodésica, podemos aplicar literalmentea definição anterior de autoconvexidade. O resultado principal é:

Teorema 10. A função A 7→ σ−2n é autoconvexa em todo GLn,m.

A prova combina (entre outras técnicas) campos de Killing, deri-vadas de Clarke, e um teorema de Burkill sobre a segunda derivadasuperior simétrica.

4.3. Trabalho em andamento.

Problema 2. Mostrar que o número de condicionamento é autocon-vexo para sistemas de polinômios de grau ≥ 2, ou que não é.

No caso de sistemas de polinômios, sabe-se que entre qualquerpar de sistemas, a distância geodésica (na métrica do condiciona-mento) é de no máximo de O(nD3/2 +

√n log(µ1µ2/n)), onde n é

o número de variáveis, D o maior grau e µ1, µ2 são os números decondicionamento respectivos [3].

Problema 3. Desenvolver um método para aproximar a geodésicaentre dois pontos.

Problema 4. Desenvolver um algoritmo que dado f , dado ζ comf (ζ) = 0, dado g, ache um caminho curto (na variedade de inci-dência, pela métrica do condicionamento) entre ( f , ζ) e (g, ζ ′) paraalgum ζ ′.

O mesmo problema, onde uma dos polinômios é fixo, poderiadar lugar a uma solução afirmativa do 17o problema de Smale. Paraisso, precisamos do seguinte (tabalho em preparação):

Problema 5. Produzir um algoritmo de homotopia efetivo, em termodas operações de soma, subtração, multiplicação, divisão, raiz qua-drada, com tempo de execução limitado pelo comprimento, na mé-trica do condicionamento.

5. Subprojeto 2: Zeros Reais

A motivação para esta linha de pesquisa vem da teoria da hierar-quia polinomial das funções computáveis sobre os reais (modelo deBlum, Shub e Smale [6]. Ver também o livro-texto [5]).

Page 22: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

22

A classe #PR é a classe de todas as funções h de R∞ (união dis-junta dos Rk) em {0, 1}, para as quais existe uma máquina de Blum-Shub-Smale real M = M(y, z), funcionando em tempo polinomialno tamanho de y ∈ R∞, e aceitando exatamente h(y) entradas (y, z)com z ∈ R∞ [25]. Note-se a inclusão trivial PR ⊆ NPR ⊆ #PR.

Sabe-se que a função #R, que a cada entrada f codificando um sis-tema de n polinômios a n incógnitas, associa o número de soluçõesreais, é #PR-completa.

Algoritmos de complexidade exponencial para calcular #R são co-nhecidos desde Tarski (mas houve progressos recentes). Um algo-ritmo de complexidade polinomial implicaria PR = NPR. Nossoobjetivo aqui foi investigar um algoritmo que dependa não somentedo tamanho da entrada, mas ainda de seu número de condicionamento.

Do ponto de vista da teoria da complexidade sobre os reais, seriadesejável uma versão da teoria que incluindo números de condicio-namento no custo computacional (reduções polinomiais, classes P ,NP , #P , etc...)

5.1. O número de condicionamento. É conveniente homogeneizaro sistema de polinômios. Assim, podemos considerar que f é umsistema de n polinômios em n+ 1 variáveis, e vamos contar soluçõesna esfera unitária.

Define-se

µnorm( f , x) = ‖ f ‖√

n

∥∥∥∥∥∥D f (x)−1|TxSn

√grau( f1)· · · √

grau( fn)

∥∥∥∥∥∥onde a primeira norma é a norma U(n + 1)-invariante de Weyl eBombieri, e a segunda é a norma de operador.

Nosso número de condicionamento é definido como:

κ( f ) = maxx∈Sn

min{

µnorm( f , x),‖ f ‖

‖ f (x)‖∞

}.

5.2. O algoritmo. O principal resultado de [7] é o seguinte:

Teorema 11. Existe um algoritmo iterativo, com entrada f no espaço Hdde sistemas de polinômios homogêneos de grau d1, . . . , dn, que

(1): Calcula #R( f ).(2): O número de iterações é O(log(n(max di)κ( f ))) iterações, cada

uma custando

O

(log(n(max di)κ( f ))(n + 1)2

((n + 1)(max di)

2κ( f )2

α∗

)2n)operações aritméticas. Aqui, α∗ ' 0.03884629388 é uma constanteuniversal.

Page 23: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

23

(3): Pode ser bem paralelizado, no sentido que admite versões parale-las com tempo de execução

O(

n2 log(n(max di)κ( f ))(

log (n(max di)κ( f ))2 − log(α∗)2))

e número de processadores exponenciais nessa quantidade.(4): Pode ser implementado em precisão finita (...)(5): Pode ser modificado para retornar um zero aproximado em re-

lação à iteração de Newton, para cada solução.

5.3. Smoothed analysis. Faltava analisar o número de condiciona-mento do algoritmo acima. Para isso, substituimos o número decondicionamento κ( f ) por uma expressão κ( f ) mais conveniente,com

κ( f )√n≤ κ( f ) ≤

√2nκ( f ).

Com essa modificação, obtivemos em [8] um teorema de condici-onamento:

Teorema 12. Para todo f , κ( f ) = ‖ f ‖/dist( f , ΣR), onde ΣR é a varie-dade discriminante e dist denota a distância projetiva.

O paradigma da smoothed analysis é substituir uma entrada f poruma perturbação aleatória, mas pequena.

Para isso, atribuimos à bola de centro f e raio σ distribuiçãode probabilidade uniforme, e consideramos uma perturbação g ∈B( f , σ) aleatória de f .

A partir do resultado anterior, mostramos que:

Corolário 12.1. Sejam D = max grau( fi) e D = ∏(grau( fi)). SejaN + 1 o número de coeficientes de f . Para todo σ ∈ (0, 1] e todo t ≥(4nD2 + 1)N

σ ,

supf∈P(Hd)

Probg∈B( f ,σ){κ(g) ≥ t} ≤ 13n2DDN1σt

e

supf∈P(Hd)

Eg∈B( f ,σ)[ln κ(g)] ≤ 2 ln N + 4 ln n+ 2 lnD+ ln D+ ln(

)+ 6.

Em particular, fazendo σ = 1, obtemos: para todo t ≥ N(4nD2 + 1),

(5) Probg∈PN{κ(g) ≥ t} ≤ 13n2DDN1t

e

(6) Eg∈PN [ln κ(g)] ≤ 2 ln N + 4 ln n + 2 lnD + ln(D) + 6.

Page 24: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

24

As equações (5) e (6) foram obtidas particularizando o resultadode smoothed analysis.

Em [9], obtemos uma cota mais fina estimando diretamente acauda da distribuição de probabilidade da variável aleatória κ( f )(onde f tem distribuição Gaussiana, por exemplo).

5.4. Problemas em aberto. Um problema relevante do ponto devista prático é desenvolver algoritmos eficientes para achar zerosreais de sistemas de polinômios. Uma questão básica é como definiro número de condicionamento. Diferentemente do caso complexo,zeros reais podem ‘desaparecer’ como no exemplo z2 − ε para εperto de zero. Assim, é natural considerar o polinômio z2− 0.00001como extremamente mal condicionado sobre os reais, embora nãotenha solução real.

Problema 6. Desenvolver algoritmos para achar soluções reais de sis-temas de polinômios, em função do número de condicionamentoacima.

Este sub-projeto todo também pode ser visto como um passo pre-liminar para atacar o seguinte problema:

Problema 7. Elaborar uma teoria de complexidade e de reduções so-bre os reais para problemas de decisão ou problemas numéricos,incorporando o número de condicionamento (ou seu logaritmo) no‘tamanho’ dos problemas.

Outra possibilidade é

Problema 8. Utilizar os mesmos métodos desenvolvidos para esti-mar a cauda de variáveis aleatórias relacionadas à complexidade dealgoritmos de homotopia, como γ( f , x0) onde f é um sistema po-linomial Gaussiano aleatório e x0 é fixo. O invariante γ é definidopor

γ( f , x0) = maxk≥2

(D f (x0)

†Dk f (x0)

k!

)1/(k−1)

e sua inversa mede o raio de convergência quadrática da iteraçãode Newton.

6. Subprojeto 3: Polinômios Esparsos

Seja A ⊂ Zn um conjunto finito. Um polinômio com suporte A éuma expressão da forma

f (z) = ∑a∈A

faza11 za2

2 · · · zann

Page 25: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

25

Figura 4. Volume misto do sistem f (x, y) = 1 + x +y + xy, g(x, y) = 1 + x + y. O quadrado vermelho éo fecho convexo do suporte de f , o quadrado azul éo fecho convexo do suporte de g. O volume misto(escalado) é a área em púrpura.

O Teorema de Bernstein [4] garante que o número de raízes iso-ladas em (C∗)n de um sistema de polinômios f = ( f1, . . . , fn), ondefi tem suporte Ai, é dado pelo volume misto da n-upla

(conv(A1), . . . , conv(An)).

A notação conv(A) denota o fecho convexo de A (ver figura 4

pag. 25).O volume misto é atingido para coeficientes genéricos, ou seja,

em um conjunto Zariski-aberto.A variedade tórica associada a essa n-upla é uma compactificação

de (C∗)n, que tem a seguinte propriedade: Quando os coeficientesconvergem para a fronteira do Zariski-aberto do Teorema de Berns-tein, e no limite as soluções continuam isoladas, então o número desoluções isoladas (com multiplicidade) é preservado.

Isso torna a variedade tórica o espaço adequado para se estudaro conjunto das soluções de um sistema de polinômios esparsos.

No artigo, estudamos de maneira probabilista o número de condi-cionamento e o número de zeros reais de um sistema de polinômioscom coeficientes aleatórios (mas os suportes são fixos).

O número de condicionamento µ(f, ı) é o módulo da derivada daraiz ζ, considerada como função implícita dos coeficientes (reais oucomplexos).

O número de zeros reais é investigado para coeficientes reais.Assumimos sempre distribuições Gaussianas independentes cen-

tradas no zero, mas as variâncias são quaisquer.Associamos aos suportes e variâncias um conjunto de n formas

de Kähler na variedade tórica, sendo que o produto exterior des-sas 2-formas é uma forma de volume (que chamamos de forma devolume misto).

Page 26: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

26

Dois teoremas típicos deste artigo são:

Teorema 13. Seja A ⊆ Zn um conjunto finito com fecho convexo devolume positivo, e A = (A, A, . . . A). Então existe uma métrica natu-ral d(·, ·) no espaço dos sistemas de polinômios com suporte A, tal queo número de condicionamento µ(f, ı) seja igual a 1/d(f, Σ) onde Σ é avariedade discriminante (ou variedade dos problemas mal postos).

Além disso,

Prob[

µ( f , ζ) ≥ 1ε

para alguma raiz ζ de f]≤

≤ n3(n + 1)Vol(conv(A))(#A− 1)(#A− 2)ε4

Teorema 14. Seja U um conjunto mensurável de Rn com medida de Le-besgue λ(U). Seja f um polinômio real Gaussiano aleatório. Então onúmero esperado de raízes de f em U é limitado por

(4π)−n/2√

λ(U)∫

U×[0,2π]nωA1 ∧ · · · ∧ωAn

onde ωAi é a forma de Kähler associada ao suporte Ai e respectivas variân-cias.

6.1. Problemas em aberto. Neste assunto, todos os principais pon-tos estão em aberto.

Problema 9. Produzir um algoritmo para calcular o volume misto,que funcione em tempo polinomial no volume misto.

Um projeto mais fraco é

Problema 10. Melhorar os algoritmos existentes para calcular o vo-lume misto, utilizando técnicas de Geometria Algébrica Tropical.

Problema 11. Produzir um algoritmo de homotopia, com tempo deexecução polinomial no comprimento do condicionamento, para onúmero de condicionamento esparso.

Aqui existe a possibilidade de resultados de natureza prática, jáque os sistemas de polinômios provenientes das aplicações são es-parsos.

Referências

[1] Carlos Beltrán, Jean-Pierre Dedieu, Gregorio Malajovich, and Mike Shub,Convexity properties of the condition number, SIAM J. Matrix Anal. Appl. 31(2009), no. 3, 1491–1506, DOI 10.1137/080718681. MR2587788

[2] , Convexity properties of the condition number II. Preprint, ArXiV, http://arxiv.org/abs/1007.1597.

[3] Carlos Beltrán and Michael Shub, Complexity of Bézout’s theorem. VII: Distanceestimates in the condition metric, 2007.

[4] D. N. Bernstein, The number of roots of a system of equations, Funkcional. Anal.i Priložen. 9 (1975), no. 3, 1–4 (Russian).

Page 27: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

27

[5] Lenore Blum, Felipe Cucker, Michael Shub, and Steve Smale, Complexity andreal computation, Springer-Verlag, New York, 1998.

[6] Lenore Blum, Mike Shub, and Steve Smale, On a theory of computation andcomplexity over the real numbers: NP-completeness, recursive functions and uni-versal machines, Bull. Amer. Math. Soc. (N.S.) 21 (1989), no. 1, 1–46.

[7] Felipe Cucker, Teresa Krick, Gregorio Malajovich, and Mario Wschebor, Anumerical algorithm for zero counting. I. Complexity and accuracy, J. Comple-xity 24 (2008), no. 5-6, 582–605, DOI 10.1016/j.jco.2008.03.001. MR2467589

(2010d:68063)[8] , A numerical algorithm for zero counting. II. Distance to ill-posedness and

smoothed analysis, J. Fixed Point Theory Appl. 6 (2009), no. 2, 285–294, DOI10.1007/s11784-009-0127-4. MR2580979

[9] , A numerical algorithm for zero counting. III. Randomization and Condi-tion. Preprint, ArXiV, http://arxiv.org/abs/0910.5936.

[10] Jean-Pierre Dedieu and Gregorio Malajovich, On the number of minimaof a random polynomial, J. Complexity 24 (2008), no. 2, 89–108, DOI10.1016/j.jco.2007.09.003. MR2400310 (2009j:26015)

[11] Jean-Pierre Dedieu, Gregorio Malajovich, and Mike Shub, On the curvature ofthe central path of linear programming theory, Found. Comput. Math. 5 (2005),no. 2, 145–171, DOI 10.1007/s10208-003-0116-8. MR2149414 (2006a:90053)

[12] Jean-Pierre Dedieu, Pierre Priouret, and Gregorio Malajovich, Newton’smethod on Riemannian manifolds: convariant alpha theory, IMA J. Numer.Anal. 23 (2003), no. 3, 395–419, DOI 10.1093/imanum/23.3.395. MR1987937

(2004e:65061)[13] James W. Demmel, Applied numerical linear algebra, Society for Industrial and

Applied Mathematics (SIAM), Philadelphia, PA, 1997.[14] J. Demmel, B. Diament, and G. Malajovich, On the complexity of compu-

ting error bounds, Found. Comput. Math. 1 (2001), no. 1, 101–125, DOI10.1007/s10208001004. MR1829238 (2002a:65213)

[15] Alan Edelman, Eigenvalues and condition numbers of random matrices, Ph.D.Thesis, Department of Mathematics, Massachusetts Institute of Technology,Cambridge, MA, 1989.

[16] Nicholas J. Higham, Accuracy and stability of numerical algorithms, 2nd ed.,Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA,2002.

[17] Gregorio Malajovich, Geometria de Algoritmos Numéricos, Notas em Mate-mática Aplicada, vol. 36, SBMAC, São Carlos, setembro de 2008. http:

//www.labma.ufrj.br/~gregorio.[18] Gregorio Malajovich and Klaus Meer, Computing minimal multi-homogeneous

Bézout numbers is hard, Theory Comput. Syst. 40 (2007), no. 4, 553–570, DOI10.1007/s00224-006-1322-y. MR2305377 (2009a:68028)

[19] Gregorio Malajovich and J. Maurice Rojas, High probability analysis of the con-dition number of sparse polynomial systems, Theoret. Comput. Sci. 315 (2004),no. 2-3, 524–555, DOI 10.1016/j.tcs.2004.01.006. MR2073064 (2005e:34166)

[20] Gregorio Malajovich, Lower bounds for some decision problems over C, Theoret.Comput. Sci. 276 (2002), no. 1-2, 425–434, DOI 10.1016/S0304-3975(01)00273-0. MR1896363 (2003a:68051)

[21] Gregorio Malajovich and Jorge P. Zubelli, Tangent Graeffe iteration, Numer.Math. 89 (2001), no. 4, 749–782. MR1865511 (2003i:65044)

[22] , On the geometry of Graeffe iteration, J. Complexity 17 (2001), no. 3,541–573, DOI 10.1006/jcom.2001.0585. MR1851059 (2003c:65042)

Page 28: Complexidade de Algoritmos Numéricos Gregorio MALAJOVICH …gregorio/research/CNPQ-302256-2010-5.pdf · Algoritmos (e em particular algoritmos numéricos) são um objeto de estudo

28

[23] Gregorio Malajovich, On a transfer theorem for the P 6= NP conjecture, J. Com-plexity 17 (2001), no. 1, 27–85, DOI 10.1006/jcom.2000.0568. MR1817608

(2001m:68041)[24] Gregorio Malajovich and J. Maurice Rojas, Polynomial systems and the mo-

mentum map, Foundations of computational mathematics (Hong Kong,2000), World Sci. Publ., River Edge, NJ, 2002, pp. 251–266. MR2021984

(2004k:65090)[25] Klaus Meer, Counting problems over the reals, Theoret. Comput. Sci. 242

(2000), no. 1-2, 41–58, DOI 10.1016/S0304-3975(98)00190-X. MR1769145

(2002g:68041)[26] Michael Shub, Complexity of Bézout’s theorem. VI: Geodesics in the condition

(number) metric, 2007.[27] Michael Shub and Steve Smale, Complexity of Bézout’s theorem. I. Geometric

aspects, J. Amer. Math. Soc. 6 (1993), no. 2, 459–501. MR1175980 (93k:65045)[28] M. Shub and S. Smale, Complexity of Bezout’s theorem. II. Volumes and probabi-

lities, Computational algebraic geometry (Nice, 1992), Progr. Math., vol. 109,Birkhäuser Boston, Boston, MA, 1993, pp. 267–285. MR1230872 (94m:68086)

[29] Michael Shub and Steve Smale, Complexity of Bezout’s theorem. III. Conditionnumber and packing, J. Complexity 9 (1993), no. 1, 4–14. Festschrift for JosephF. Traub, Part I. MR1213484 (94g:65152)

[30] , Complexity of Bezout’s theorem. IV. Probability of success; extensions,SIAM J. Numer. Anal. 33 (1996), no. 1, 128–148. MR1377247 (97k:65310)

[31] M. Shub and S. Smale, Complexity of Bezout’s theorem. V. Polynomial time, Theo-ret. Comput. Sci. 133 (1994), no. 1, 141–164. Selected papers of the Workshopon Continuous Algorithms and Complexity (Barcelona, 1993). MR1294430

(96d:65091)[32] Steve Smale, Mathematical problems for the next century, Math. Intelligencer 20

(1998), no. 2, 7–15, DOI 10.1007/BF03025291. MR1631413 (99h:01033)