Métodos Numéricos Resolução Numérica de Equações Não...

Métodos Numéricos

Resolução Numérica deEquações Não Lineares

Miguel MoreiraDepartamento de Matemática

Escola Superior de Tecnologia de Setúbal

Ano Lectivo 2003/2004

1 Equações não lineares

Como se sabe não existem fórmulas resolventes genéricas que permitam determinar alge-bricamente os zeros de polinómios de grau igual ou superior a cinco. Assim, sem outrastécnicas difícilmente resolveríamos a equação

x5 + 3x2 − 2x = π.

Um outro exemplo de equação cuja solução não trivial não pode ser obtida algebricamenteé a equação transcendente

x = 3 sinx.

A necessidade de resolução de problemas deste tipo constitui a motivação para aaprendizagem de algumas técnicas com que se possam enfrentar. Comecemos por algu-mas definições.

Seja y = f (x) uma função real de variável real. Diz-se que α ∈ IR é uma raiz daequação f (x) = 0 ou um zero da função f se f (α) = 0.

Por outro lado, entende-se por processo iterativo um método pelo qual se podeachar uma sucessão x1, x2, . . ., xn,. . ., de valores aproximados ou iteradas da soluçãoprocurada. A sucessão de iteradas pode representar-se por

{xn : n ≥ 0} .Refira-se que, na prática, cada nova iterada xn+1 é calculada recorrendo ao conhecimentode uma ou mais das iteradas xi determinadas nos passos anteriores.

Seja α uma raiz da equação f (x) = 0. Chama-se erro en da iterada xn dumprocesso iterativo a

en = α− xn.

Um processo iterativo, para ter interesse prático, deve gerar iteradas que se aproximamda raiz procurada, isto é, deve ser convergente para a raiz referida. Um processo iterativodiz-se convergente quando

limn→∞

xn = α

ou, de forma equivalente, quandolimn→∞

en = 0.

Admitindo convergente um dado processo iterativo, a caracterização da sua “veloci-dade” de convergência para uma certa raiz, é outra noção que importa formalizar e quetem muito interesse.

Definição 1 Suponha-se que a sequência de iteradas {xn : n ≥ 0} é convergente para α.Diz-se que o processo iterativo converge com ordem p (p ≥ 1) para o ponto α se

limn→∞

|en+1||en|p = K∞

para algum K∞ > 0. Se p = 1, a velocidade de convergência diz-se linear e se p > 1supralinear. Se p = 2 a velocidade de convergência diz-se quadrática, etc. A constanteK∞ designa-se por coeficiente assintótico de convergência.

1 2/Abril/2004

Relativamente aos conceitos anteriores, podemos referir que quanto maior for a ordemde convergência p maior é a “velocidade” de convergência. Por outro lado, menorescoeficientes assintóticos para idênticas ordens de convergência, correspondem a maiores“velocidades” de convegência.

A determinação iterativa de zeros de funções passa pela resolução dos problemasseguintes:

1. Determinação dos intervalos com o menor amplitude possível nos quais existe ume um só dos zeros de f ;

2. Cálculo aproximado da raiz utilizando um processo iterativo convergente. Para talé importante escolher adequadamente os valores iniciais do processo;

3. Avaliação do erro cometido no decurso da aplicação de um critério de paragem.

Relativamente aos critérios de paragem, podemos referir que é habitual fixar o númeromáximo de iterações, impondo simultaneamente:

|en| ≤ ε (1)

em que ε representa a exactidão desejada na determinação da raiz. Diversas indicaçõesque serão oportunamente referidas, poderão ser utilizadas para estimar o erro cometido|en|, em cada iterada.

Em algumas circunstâncias utiliza-se como critério de paragem, em substituição de(1), a condição

|xn+1 − xn| ≤ ε (2)

em que ε representa uma tolerância apropriada. Note-se que em (2) se considerarmosxn+1 ≈ α, então, |xn+1 − xn| ≈ |en|. Isto é, (2) representa um valor aproximado do erroabsoluto cometido na iteração n.

Podemos, também, utilizar um critério de paragem baseado na estimativa do errorelativo δ: |xn+1 − xn|

|xn+1| ≤ δ. (3)

Em certos casos (quando f ′ (x) ≥ 1, numa vizinhança apropriada da raiz α), acondição

|f (xn)| ≤ ε, (4)

em que ε representa a tolerância apropriada habitual, fornece-nos uma estimativa ade-quada do erro absoluto da iterada xn. Esta última condição é corolário dum resultadomais geral, que pelo seu interesse referiremos de seguida.

Seja f contínua no intervalo I = [a, b] e diferenciável em ]a, b[. Seja α um zero de fem ]a, b[. Então, do teorema de Lagrange

f (xn)− f (α) = f ′ (c) (xn − α) ⇒|xn − α| =

∣∣∣∣

f (xn)

f ′ (c)

∣∣∣∣

2 2/Abril/2004

para um certo c entre xn e α (e portanto em I). Assim,

|en| = |xn − α| ≤ |f (xn)|minx∈I |f ′ (x)| (5)

desde que a derivada de f não se anule em I.Seguidamente apresentaremos alguns métodos iterativos mais utilizados para res-

olução de equações não lineares.

1.1 Método da bissecção e da falsa posição

Os métodos da bissecção e da falsa posição apoiam-se, ambos, no corolário do teoremade Bolzano (ou do valor intermédio).

1.1.1 Método da bissecção

Suponha-se y = f (x) uma função contínua no intervalo I0 = [a0, b0], tal que f (a0) ×f (b0) < 0 e com uma e uma só raiz no intervalo considerado. Consideremos o seguinteprocesso iterativo. Tomemos para primeiro valor aproximado da raiz procurada o pontomédio do intervalo referido:

x1 =a0 + b0

2.

A raiz α deve localizar—se num dos subintervalos [a0, x1] ou [x1, b0]. Verificando o sinaldos produtos f (a0) × f (x1) e f (x1) × f (b0) pode-se saber em qual dos intervalos selocaliza a raiz (porquê?). Designemos este intervalo por I1 = [a1, b1].

A aplicação repetida deste procedimento permite obter uma sucessão de intervalosfechados In = [an, bn], encaixados não vazios e cujo diâmetro tende para zero. É sabidoque existe um e um só ponto comum a todos os subintervalos In: a raiz α procurada (estefacto resulta de um teorema da análise conhecido por teorema do encaixe). Por outrolado, em consequência do teorema das sucessões enquadradas, a sucessão dos pontosxn+1 = an+bn

2, n = 0, 1, . . . , tem de convergir para a raiz α procurada. Este processo

iterativo designa-se por método da bissecção.Não é difícil verificar que o erro absoluto |en| de cada iterada satisfaz a seguinte

desigualdade

|en| = |α− xn| ≤ b− a

2n(6)

com n = 1, 2, . . . ,.Pode mostrar-se que a ordem de convergência p deste método é pelo menos

linear com um coeficiente assintótico K∞ = 12. Com efeito no pior dos casos (porquê?)

|en+1| = 1

2|en| ⇒ lim

n→∞|en+1||en| =

1

2.

De assinalar as seguintes condições suficientes de convergência do método dabissecção:

3 2/Abril/2004

1. f é contínua em [a0, b0];

2. f (a0)× f (b0) < 0.

Exemplo 1 Calcule√5 com um erro inferior a 0.01.

Comecemos por observar que√5 é a raiz positiva de f (x) = x2 − 5 e que esta raiz

ocorre no intervalo [2, 3]. A raiz procurada é única no intervalo [2, 3] pois f é crescentee f (2)× f (3) < 0.

Construa-se, com vista a sistematizar a aplicação do método da bissecção e a con-sequente análise do erro em cada iterada, a tabela seguinte (n− representa a iteração,an o extremo inferior do intervalo, bn o extremo superior do intervalo e s o sinal def (an)× f (xn+1)):

n an bn xn+1 maj. de |en+1| s Obs:0 2 3 2.5 0.50 − b1 = 2.51 2 2.5 2.25 0.25 − b2 = 2.252 2 2.25 2.125 0.125 + b3 = 2.253 2.125 2.25 2.1875 0.0625 + b4 = 2.18754 2.1875 2.25 2.21875 0.03125 + b5 = 2.218755 2.21875 2.25 2.234375 0.0151625 + b6 = 2.2343756 2.234375 2.25 2.2421875 0.0078125

A sétima iterada, x7 = 2.2421875, não difere mais do que 0.01 da raiz procurada. Aresposta será 2.24. Note-se que este número arredonda x7 às centésimas e satisfaz ointervalo de erro pretendido (porquê?).

Supondo que f satisfaz as condições de convergência num certo intervalo I0 = [a0, b0],o método da bissecção pode ser aplicado recorrendo ao algoritmo que se exemplificaseguidamente.

Algoritmo 1 (Método da Bissecção) Para n = 0, . . . , ITMAX (número máximo deiteradas)

1. c = an+bn2

2. se f (an)× f (c) ≤ 0 faça-se an+1 = an e bn+1 = c,

3. caso contrário, faça-se, an+1 = c e bn+1 = bn.

4. Parar se algum critério de paragem for satisfeito antes de n = ITMAX.

Exemplo 2 Considere a equação senx− e−x = 0.

1. Prove que esta equação tem uma raiz α em [0.5, 0.7] .

Seja f (x) = senx− e−x:

f (0.5) = sen 0.5− e−0.5 ≈ −0.127 e

f (0.7) = sen 0.7− e−0.7 ≈ 0.147.

4 2/Abril/2004

Por outro ladof ′ (x) = cosx+ ex > 0, ∀x ∈ [0.5, 0.7] .

Estes factos mostram, tendo em conta o teorema do valor intermédio e pelo factode f ser estritamente crescente, que f tem uma e uma só raiz em [0.5, 0.7];

2. Efectue uma iteração pelo método da bissecção e indique uma novo intervalo quecontenha a raiz α.

A primeira iterada é

x1 =0.5 + 0.7

2= 0.6.

Comof (0.6) = sen 0.6− e−0.6 ≈ 1.583 × 10−2 > 0,

o novo intervalo será [0.5, 0.6] ;

3. Determine o número n de iterações necessárias para garantir que

|xn − α| < 10−6.

Sabemos que

|en| ≤ b− a

2n.

Assim, bastará garantir que

b− a

2n< 10−6, ou seja,

0.2

2n< 10−6 ⇒

105 < 2n−1 ⇒5 < (n− 1) log10 2 ⇒

(n− 1) >5

log10 2≈ 16.61 ⇒

n ≥ 18.

1.1.2 Método da falsa posição

Como anteriormente, suponha-se y = f (x) uma função contínua no intervalo I = [a, b],tal que f (a)×f (b) < 0 e com uma e uma só raiz no intervalo considerado. No método dabissecção cada termo da sucessão de iteradas consiste num ponto médio de uma sucessãode intervalos encaixados [a0, b0] = [a, b], [a1, b1], . . . , [an, bn], . . . , que contêm todos a raizprocurada, isto é,

xn+1 =an + bn

2.

Como se pode observar na Figura 1, no método da falsa posição (também conhecidopor regula falsi), cada termo é a coordenada xn+1 da intersecção com o eixo das abcissas

5 2/Abril/2004

da secante ao gráfico da função nos pontos (an, f (an)) e (bn, f (bn)) tais que f (an) ×f (bn) < 0. Isto é,

f (bn)− 0

bn − xn+1=

f (bn)− f (an)

bn − an,

resultando

xn+1 = bn − f (bn)f(bn)−f(an)

bn−an

, com n = 0, 1, . . .

ou seja

xn+1 = bn − f (bn)bn − an

f (bn)− f (an), com n = 0, 1, . . . (7)

-1

0

1

2

3

1 2 3 4 5

na

nb

x

y

( )xfy =

1+nx

-1

0

1

2

3

1 2 3 4 5

na

nb

x

y

( )xfy =

1+nx

Figura 1: Método da falsa posição.

Como este método utiliza mais informação para gerar as iteradas é, em geral deconvergência mais rápida. Pode mostrar-se que em certas circunstâncias, a ordem deconvergência deste método é linear com um coeficiente assintótico K∞ menor do que12.A principal desvantagem deste método ocorre quando a sucessão das iteradas se

posiciona só à esquerda ou só à direita da raiz procurada. Nesta situação que ocorresempre que o gráfico da função apresenta a concavidade voltada para cima ou para baixono intervalo em estudo, a velocidade de convergência pode tornar-se bastante mais lenta.

De assinalar que as condições suficientes de convergência do método da falsa posiçãosão idênticas às do método da bissecção:

1. f é contínua em [a, b];

2. f (a)× f (b) < 0.

6 2/Abril/2004

Tendo em conta que este método pode não gerar pequenos subintervalos em torno daraiz procurada, os critérios de paragem mais utilizados são:

|f (an)| ≤ ε ou

|xn+1 − xn| ≤ ε.

Algoritmo 2 (Método da Falsa Posição) Para n = 0, . . . , ITMAX (número máx-imo de iteradas)

1. c = f(bn)an−f(an)bnf(bn)−f(an)

2. se f (an)× f (c) < 0 faça-se an+1 = an e bn+1 = c,

3. caso contrário, faça-se, an+1 = c e bn+1 = bn.


Exemplo 3 Considere a função f (x) = e−x + 2x− 2.

1. Quantas raizes tem a equação f (x) = 0? Determine um intervalo, com amplitude0.1, que contenha a maior raiz.

A equação referida é equivalente à equação e−x = −2x + 2, cujos membros estãorepresentados na Figura 2.

-2

0

2

4

6

8

12

-2 -1 1 2x

yx

ey−=

22 +−= xy

-2

0

2

4

6

8

12

-2 -1 1 2x

yx

ey−=

22 +−= xy

Figura 2: Funções y = e−x e y = −2x+ 2.

Esta sugere a existência de duas raízes, uma negativa e outra positiva. A maiorraíz está no intervalo [0, 1]. Note-se que f (0) = −1, f (1) = e−1 e f é crescente em[0, 1], já que f ′ (x) = −e−x + 2 > 0 neste intervalo. A obtenção de um intervalocom amplitude de 0.1 que contenha a raiz, pode efectuar-se recorrendo ao métododa bissecção:

7 2/Abril/2004

n an bn xn+1 maj. de |en+1| sinal de f (xn+1)0 0 1 0.5 0.5 −1 0.5 1 0.75 0.25 −2 0.75 1 0.875 0.125 +3 0.75 0.875 0.8125 0.0625 +

O intervalo pretendido é [0.75, 0.8125].

2. No cálculo da raiz localizada no intervalo [−2,−1] utilizando o método da falsaposição obtiveram-se os seguintes resultados

f (−2) = 1.389056,

f (−1) = −1.281718,

x1 = −1.479905,

f (x1) = −0.567281.

Determine a segunda iterada.

O novo intervalo que contém a raiz procurada será [−2,−1.479905]. Tendo emconta que f (x) = e−x + 2x− 2, a iterada seguinte será

x2 =f (b1) a1 − f (a1) b1

f (b1)− f (a1)

=f (−1.479905)× (−2)− f (−2)× (−1.479905)

f (−1.479905)− f (−2)≈ −1.6307.

1.2 Método de Newton e método da secante

1.2.1 O método de Newton

A aplicação, à equação f (x) = 0, do método de Newton (também conhecido por métododas tangentes) exige que a função f tenha pelo menos a primeira derivada não nula nointervalo em que se pretenda encontrar a raiz. É no entanto ummétodo com convergênciamais rápida do que os métodos anterioremente referidos.

Admita-se que f é uma função contínua, com derivada contínua e diferente de zerono intervalo [a, b], tal que f (a)× f (b) < 0.

Pretende-se achar um valor x que satisfaça a equação f (x) = 0. Suponha-se que x1

é um valor próximo da raiz procurada pertencente ao intervalo em estudo. Como

f (x) ≈ f (x1) + (x− x1) f′ (x1) ,

então

f (x) = 0 ⇒f (x1) + (x− x1) f

′ (x1) = 0 ⇒x = x1 − f (x1)

f ′ (x1).

8 2/Abril/2004

Repare-se que x pode ser considerado como uma segunda aproximação x2 = x1 −f (x1) /f

′ (x1) da raiz de f em [a, b]. Como se pode observar na Figura 3, x2 repre-senta a abcissa do ponto de intersecção da recta tangente ao gráfico de f em (x1, f (x1))com eixo das abcissas.

( )1xf

-2

-1

0

1

2

3

0.2 0.4

0.6 0.8 1 1.2 1.4 1.6 1.8 2

( )( )11

, xfx

1x

2x

x

( )xfy =y

( )1xf

-2

-1

0

1

2

3

0.2 0.4

0.6 0.8 1 1.2 1.4 1.6 1.8 2

( )( )11

, xfx

1x

2x

x

( )xfy =y

Figura 3: Método de Newton.

A repetição deste procedimento conduz-nos ao seguinte processo iterativo, conhecidopor método de Newton

xn+1 = xn − f (xn)

f ′ (xn), n = 0, 1, 2, . . . (8)

-2

-1

0

2

3

-4 -2 2 4 6 8 10

x

y

( )xfy =

0x

1x

-2

-1

0

2

3

-4 -2 2 4 6 8 10

x

y

( )xfy =

0x

1x

Figura 4: Exemplo de divergência do método de Newton.

9 2/Abril/2004

Nem sempre a sucessão {xn : n ≥ 0} gerada por este método converge para a raizde f em [a, b]. Na Figura 4 ilustra-se um caso em que esta situação pode ocorrer. Noentanto, se certas condições forem asseguradas este método não só converge, como o fazrapidamente. No resultado seguinte apresentam-se condições suficientes de convergência.

Teorema 1 Seja I = [a, b] uma vizinhança do zero α de uma função f ∈ C2 ([a, b]) esuponha-se que se verificam as condições:

1. 0 < m1 ≤ |f ′ (x)| , ∀x ∈ I,

2. 0 < |f ′′ (x)| ≤ m2, ∀x ∈ I,

3. M (b− a) < 1 com M = m2

2m1

Então, escolhendo para x0 o extremo (a ou b) do intervalo I em que a função f tem omesmo sinal que a sua segunda derivada, isto é, de forma a que f (x0) f

′′ (x0) > 0, ométodo de Newton (8) converge para a raíz α e o erro das iteradas consecutivas satisfaza relação

|en+1| ≤ M |en|2 . (9)

Demonstração. Comecemos por observar que f ′ e f ′′ são contínuas no intervalo I emresultado da condição pois f ∈ C2 ([a, b]). Por outro lado, deste facto e das condições 1e 2, f ′ e f ′′ não mudam de sinal do intervalo em estudo. Assim, o zero α de f é único eserá também possível escolher a iterada inicial nas condições indicadas.

Sem perda de generalidade suponha-se que f ′′ > 0 e f ′ > 0 para todo o x no intervaloem estudo (a argumentação da demonstração é identica nas outras situações). Nestascircunstâncias x0 = b (porquê?) e α < x0.

Demonstremos que o método de Newton (8) gera uma sucessão

α < · · · < xn+1 < xn < · · · < x1 < x0 = b

decrescente e limitada inferiormente pela raíz α.Efectuemos o desenvolvimento de f em série de Taylor com resto de ordem 2 na

vizinhaça de x0 e calculemos o valor desse desenvolvimento em x = α:

f (α) = 0 = f (x0) + f ′ (x0) (α− x0) +f ′′ (c)2

(α− x0)2 ,

para um certo c entre α e x0. Desta última expressão deduz-se sucessivamente

α = x0 − f (x0)

f ′ (x0)− f ′′ (c)

2f ′ (x0)(α− x0)

2 =

= x1 − f ′′ (c)

2f ′ (x0)(α− x0)

2 , atendendo a (8). (10)

Ou seja

α− x1 = − f ′′ (c)2f ′ (x0)

(α− x0)2 .

10 2/Abril/2004

Como f ′′/f ′ é positivoα− x1 < 0 ⇒ α < x1.

Por outro lado, tendo em conta (10)∣∣∣∣α− x1

α− x0

∣∣∣∣ =

∣∣∣∣− f ′′ (c)2f ′ (x0)

∣∣∣∣ |α− x0|

≤ m2

2m1|α− x0| = M |α− x0|

< M (b− a) < 1.

Isto é, x1 está mais próximo da raíz do que x0. Desta forma α < x1 < x0. Um raciocíniointeiramente análogo permite concluir que se

α < xn < x0

então o processo (8) origina a iterada xn+1 satisfazendo

α < xn+1 < xn.

Assim, por indução matemática conclui-se que o método de Newton gera uma sucessão

α < · · · < xn+1 < xn < · · · < x1 < x0 = b

decrescente e limitada inferiormente pela raiz α, como se pretendia mostrar. Ora talsucessão é convergente (porquê?) para um certo número β no intervalo em estudo e porisso

β = limxn+1 = lim

(xn − f (xn)

f ′ (xn)

)= β − f (β)

f ′ (β)⇒ f (β) = 0.

Mas a única raíz de f no intervalo é α, por isso β = α, o que mostra que limxn = α.Este facto demonstra que o método de Newton converge para a raiz α.

Mostremos agora que o erro de duas iteradas consecutivas satisfaz a relação (15).Das hipóteses, efectuemos o desenvolvimento de f em série de Taylor com resto de

ordem 2 na vizinhaça de xn e calculemos o valor desse desenvolvimento em x = α:

f (α) = 0 = f (xn) + f ′ (xn) (α− xn) +f ′′ (cn)

2(α− xn)

2 ,

para certo cn entre α e x0. Desta última expressão deduz-se sucessivamente

|en+1| = |α− xn+1| =∣∣∣∣− f ′′ (cn)

2f ′ (xn)(α− xn)

2

∣∣∣∣ (11)

≤ m2

2m1(α− xn)

2 = M |en|2 ,

onde M = m2/2m1. Este facto demonstra (9), como se pretendia.

11 2/Abril/2004

A ordem de convergência do método de Newton pode determinar-se com base naexpressão (11). Com efeito, admitidos os pressupostos do Teorema 1,

|en+1| =

∣∣∣∣− f ′′ (cn)

2f ′ (xn)(α− xn)

2

∣∣∣∣ ⇒|en+1||en|2

=

∣∣∣∣ f′′ (cn)

2f ′ (xn)

∣∣∣∣ para um certo cn entre α e xn,

donde se deduz,

limn→+∞

|en+1||en|2

= limn→+∞

∣∣∣∣ f′′ (cn)

2f ′ (xn)

∣∣∣∣ =∣∣∣∣ f

′′ (α)2f ′ (α)

∣∣∣∣ = K∞ > 0.

Este facto mostra que o método de Newton tem uma ordem de convergênciaquadrática se a raiz α for simples (isto é, se f ′ (α) �=0).



ocorre no intervalo [2, 3]. A raiz procurada é única no intervalo [2, 3] pois f é crescentee f (2)× f (3) < 0.

Consideremos a função f (x) = x2 − 5 e o intervalo [2, 3]. Notemos que f está nascondições do Teorema 1 pois f́ ∈ C2 ([2, 3]) e

1. 0 < m1 = 4 ≤ |f ′ (x)| = 2 |x| ,∀x ∈ [2, 3] ,

2. 0 < |f ′′ (x)| = 2 ≤ m2 = 2,∀x ∈ [2, 3] ,

3. M (b− a) = m2

2m1

(b− a) = 22×4

= 0.25 < 1.

Escolha-se x0 de forma a assegurar que f (x0)× f ′′ (x0) > 0. Como f ′′ (x) > 0 a escolharecai sobre x0 = 3.

1. Estamos, assim, em condições de assegurar a convergência do método de Newton:

xn+1 = xn − f (xn)

f ′ (xn)= xn − x2

n − 5

2xn

=1

2

(xn +

5

xn

).

Construa-se a seguinte tabela para melhor sistematizar os cálculos a efectuar. Note-se que

|en+1| ≤ M |en|2 com M =m2

2m1=

2

2× 4= 0.25.

n xn = 12

(xn−1 +

5xn−1

)|en|

0 3 11 7/3 0.252 2.2380 0.25× 0.252 = 0.015625

12 2/Abril/2004

Note-se que escolhendo 2.24 para o referido valor aproximado procurado, verifi-camos que

|earredondamento|+ |e4| = |2.24− 2.2380|+ 0.0156 25

= 1.762 5× 10−2 ≤ 0.02

donde 2.24 satisfaz a condição de ser um valor aproximada da raiz procurada comum erro inferior a 0.02.

Seguidamente ilustramos o algoritmo aplicável na implementação do método de New-ton.

Algoritmo 3 (Método de Newton) Para n = 0, . . . , ITMAX (número máximo deiteradas)

1. xn+1 = xn − f(xn)f ′(xn)

;


Exemplo 5 Considere a equação 2x+ lnx = 1.

1. Mostre que a equação dada tem uma única raiz.

Seja f (x) = 2x+lnx−1. Comecemos por observar que os zeros de f são as raízes daequação dada. Notemos que a função dada está definida em ]0,+∞[, sendo contínuae diferenciável neste intervalo. Observando que f

(12

)= ln 1

2= − ln 2 < 0 e que

f (1) = 1 > 0 e tendo em conta, simultaneamente, que f é estritamente crescente(pois f ′ (x) = 2 + 1

x> 0), deduz-se imediatamente (corolários do teorema do valor

intermédio e do teorema de Rolle) que f tem um único zero em ]0,+∞[, que selocaliza mais precisamente em

[12, 1]. Mostrámos assim que a equação dada tem

uma única raiz.

2. Pretende-se usar o método de Newton para obter a raiz da equação dada.

(a) Indique um intervalo de comprimento 12que contenha a raiz da equação.

O intervalo[12, 1], indicado na resposta à alínea anterior tem comprimento 1

2

e contém a raiz procurada como se mostrou na alínea anterior.

(b) Verifique se no intervalo indicado são satisfeitas todas as condições de con-vergência e escolha uma aproximação inicial adequada.Com efeito, f ∈ C2

([12, 1]), 0 < m1 = 3 ≤ |f ′ (x)| = ∣∣2 + 1

x

∣∣ ,∀x ∈ [12, 1], 0 <

|f ′′ (x)| = ∣∣− 1x2

∣∣ ≤ 4,∀x ∈ [12, 1]e M (b− a) < 1 com M = m2/2m1 = 2/3.

Assim para aproximação inicial deveremos escolher o extremo do intervaloreferido em que a função tenha o mesmo sinal da segunda derivada: x0 =

12.

13 2/Abril/2004

(c) Efectue duas iterações e indique majorantes para os erros das aproximaçõesobtidas.Recordemos que o algoritmo correspondente ao método de Newton é, no pre-sente caso

xn+1 = xn − f (xn)

f ′ (xn)

= xn − 2xn + lnxn − 1

2 + 1xn

.

Sistematizemos os cálculos na seguinte tabela:

n xn majorante de |en|0 1

212

1 0.67329(12

)2 23≈ 0.166 67

2 0.68735 0.166 672 × 23≈ 1.8519× 10−2

(d) Determine uma solução aproximada da raiz da equação de modo a garantirum erro absoluto não superior a 10−6.Na tabela seguinte apresentamos as quatro primeiras iteradas obtidas a partirdo programa do Apêndice 1.7 com ligeiras modificações:

n xn majorante de |en|0 1

212

1 6.7328679e− 001 1.666667e− 0012 6.8734899e− 001 1.8518519e− 0023 6.8741126e− 001 2.2862368e− 0044 6.8741126e− 001 3.4845860e− 008

A resposta é x4 = 0.687411.

1.2.2 Método da secante

Suponha-se y = f (x) uma função contínua no intervalo I = [a, b]. Tal como no métododa falsa posição, nométodo da secante, cada termo, é a coordenada xn+1 da intersecçãocom o eixo das abcissas, da secante ao gráfico da função em dois pontos (xn−1, f (xn−1))e (xn, f (xn)). No entanto, neste método, não se exige que f (xn−1)× f (xn) < 0.

O método da secante, ilustrado na Figura 5, é um processo iterativo cuja forma éidêntica à forma utilizada pelo método da falsa posição:

xn+1 = xn − f (xn)f(xn)−f(xn−1)

xn−xn−1

, com n = 0, 1, 2, . . . (12)

ou seja

xn+1 = xn − f (xn)xn − xn−1

f (xn)− f (xn−1), com n = 0, 1, 2, . . . (13)

14 2/Abril/2004

0

5

10

15

1 1.5 2 2.5 3 3.5 4

x

y( )xfy =

1−nxnx

1+nx

0

5

10

15

1 1.5 2 2.5 3 3.5 4

x

y( )xfy =

1−nxnx

1+nx

Figura 5: Método da secante.

Tal como no método da falsa posição a aplicação deste processo iterativo exige oconhecimento de dois valores aproximados da raiz para gerar o valor seguinte. Destaforma para ser iniciado torna-se necessário escolher x0 e x1, ambos pertencentes aointervalo I = [a, b].

As seguintes condições suficientes de convergência, semelhantes às atrás enunciadasna aplicação do método de Newton, podem ser utilizadas:

Teorema 2 Seja I = [a, b] uma vizinhança do zero α de uma função f ∈ C2 ([a, b]) esuponha-se que se verificam as condições:

1. 0 < m1 ≤ |f ′ (x)| , ∀x ∈ I,

2. 0 < |f ′′ (x)| ≤ m2, ∀x ∈ I,

3. M (b− a) < 1 com M = m2/2m1.

Então, escolhendo para x−1 e x0 dois pontos do intervalo I tais que

f (x−1) f′′ (x−1) > 0 e f (x0) f

′′ (x0) > 0

o método da secante (12) converge para a raiz α.

Demonstração. Notemos que as condições suficientes 1 a 3 são análogas às condiçõessuficientes de convergência do método de Newton. Observe-se que f ′ e f ′′ são contínuasno intervalo I pelo facto de f ∈ C2 ([a, b]). Por outro lado, deste facto e das condições 1e 2, f ′ e f ′′ não mudam de sinal do intervalo em estudo. Assim, o zero α de f é único eserá também possível escolher x0 e x−1 nas condições indicadas.

15 2/Abril/2004

Sem perda de generalidade suponha-se que f ′′ > 0 e f ′ > 0 para todo o x no intervaloem estudo (a argumentação da demonstração é identica nas outras situações). Nestascircunstâncias escolha-se x−1 e x0 tais que α < x0 < x−1 < b. Notemos que a aplicaçãodo método de Newton utilizando como iteradas iniciais y0 = x−1 e z0 = x0 conduz àobtenção de duas sucessões

{yn : n ≥ 0} e {zn : n ≥ 0}decrescentes e convergentes para a raíz α tais que

α < zn < yn, n ≥ 0.

Com efeito, a iterada xn resultante da aplicação do método da secante satisfaz

zn+1 < xn+1 < yn+1, n ≥ 0,

isto é,

zn − f (zn)

f ′ (zn)< xn − f (xn)

f(xn)−f(xn−1)xn−xn−1

< yn − f (yn)

f ′ (yn), n ≥ 0.

-0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

2.2 2.4 2.6 2.8 x

y ( )xfy =

1−nxnx

1+nx 1+ny1+nz-0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

2.2 2.4 2.6 2.8 x

y ( )xfy =

1−nxnx

1+nx 1+ny1+nz

Figura 6: Demonstração da convergência do método da secante.

Este facto, ilustrado na Figura 6, é demonstrável por indução matemática e permiteconcluir, como se pretendia, que o método da secante converge para a raiz α.

A análise do erro cometido pode realizar-se recorrendo ao resultado seguinte queapresentamos sem demonstração (consultar, por exemplo, Pina [12]).

Teorema 3 Se todas as iteradas resultantes da aplicação do processo (12) estiverem con-tidas numa vizinhança [a, b] suficientemente pequena da raiz α da função f ∈ C2 ([a, b]),então o método da secante é convergente e o erro satisfaz a relação

|en+1| ≤ M |en| |en−1| (14)

com M = m2

2m1

, 0 < m1 ≤ |f ′ (x)| e 0 < |f ′′ (x)| ≤ m2 para todo x ∈ [a, b] .

16 2/Abril/2004

Nas condições do resultado anterior é possível mostrar que a ordem de convergên-cia do método da secante (supondo, portanto, que a raiz procurada é simples) é p =(1+

√5)

2≈ 1.618.



ocorre no intervalo [2, 3]. A raiz procurada é única no intervalo [2, 3] pois f é crescentee f (2)× f (3) < 0. Notemos que f está nas condições do Teorema 2.

Nas presentes circunstâncias façamos m1 = 4 e m2 = 2. Então M = 0.25 e

xn+1 = xn − x2n − 5

x2n−x2

n−1

xn−xn−1

=xnxn−1 + 5

xn + xn−1.

Construa-se uma tabela para sistematizar os cálculos e façamos x−1 = 3 e x0 = 2.5(nas condições suficientes de convergência do Teorema 2):

n xn+1 xn xn−1 maj. de |en+1|0 2.272 7 2.5 3 1

4× 1

2× 1 = 0. 125

1 2.238 1 2.272 7 2.5 18× 1

4× 1

2= 1.562 5× 10−2

2 2.236 1 2.238 1 2.272 7 18× 1

4× 1.562 5× 10−2 = 4.882 8× 10−4

Arredondando para x3 para 2.24 este último valor distará de√5 não mais do que

|earredondamento|+ |e3| = |2.24− 2.236 1|+ 4.882 8× 10−4

= 4.388 3× 10−3.

Assim a resposta 2.24 terá certamente um erro inferior a 0.01.

De referir que o critério de paragem utilizado baseou-se na estimativa do erro de cadaiterada, o qual se pode majorar com base no resultado da proposição 3.

Apresentamos seguidamente o algoritmo típico que se utiliza para implementar ométodo da secante.

Algoritmo 4 (Método da Secante) Para n = 0, . . . , ITMAX (número máximo deiteradas)

1. xn+1 = xn − f (xn)xn−xn−1

f(xn)−f(xn−1);


Exemplo 7 Considere a equação x2 − 1− ln (x+ 1) = 0.

17 2/Abril/2004

-1

-0.5

0

0.5

1.5

2

-0.5 0.5 1 1.5 x

y

( )xfy =

-1

-0.5

0

0.5

1.5

2

-0.5 0.5 1 1.5 x

y

( )xfy =

Figura 7: f (x) = x2 − 1− ln (x+ 1) .

1. Localize graficamente as raízes reais da equação dada e mostre, analiticamente, queno intervalo [1, 2] a equação tem uma só raiz.

Com efeito, a partir do gráfico podemos observar que a equação dada tem raízesreais nos intevalos ]−1, 0[ e [1, 2] tem raizes reais.

Por outro lado, fazendo f (x) = x2 − 1 − ln (x+ 1) deduz-se f (1) = − ln 2 < 0 ef (2) = 3 − ln 3 > 0. Tal facto determina a existência de pelo menos uma raiz nointervalo indicado (corolário do teorema do valor intermédio tendo em conta quef é contínua no seu domínio). Como f ′ (x) = 2x− 1

x+1> 0, ∀x ∈ [1, 2], f tem um

único zero em [1, 2] (corolário do Teorema de Rolle).

2. Partindo do intervalo da alínea anterior determine a terceira iterada pelo métododa falsa posição.

Consideremos o método da falsa posição

xn+1 = bn − f (bn)bn − an

f (bn)− f (an)

= bn − (bn − an) (b2n − 1− ln (bn + 1))

b2n − 1− ln (bn + 1)− (a2n − 1− ln (an + 1)), com n = 0, 1, . . .

com a0 = 1 e b0 = 2 e sistematizemos os cálculos das sucessivas iteradas:

n xn+1 an bn sinal de f (xn+1) maj. de |en+1|0 1.267 2 1 2 − 0.73281 1.340 9 1.267 2 2 − 0.65912 1.358 6 1.340 9 2 − 0.6414

Concluimos que x3 = 1.3586.

3. Partindo das aproximações iniciais x0 = 1.5 e x−1 = 2, aproxime agora essa raizusando o método da secante em três iterações.

18 2/Abril/2004

Comecemos por notar que f está nas condições de convergência do método dasecante, já que f ∈ C2 ([1, 2]), 0 < m1 = 3/2 ≤ |f ′ (x)| = |2x− 1/ (x+ 1)| ,∀x ∈[1, 2], 0 <

∣∣f ′′

(x)∣∣ = ∣∣1/ (x+ 1)2 + 2

∣∣ ≤ m2 = 9/4 e M (b− a) = M (2− 1) < 1com M = m2/2m1 = 3/4.

Seja, então o método

xn+1 = xn − f (xn)(xn − xn−1)

f (xn)− f (xn−1), n = 1, 2, . . .

Consideremos a seguinte tabela para sistematizar os cálculos:

n xn+1 xn xn−1 maj. de |en+1|0 1.3936 1.5 2 3

4

1 1.3657 1.3936 1.5(34

)2= 0.562 5

2 1.3640 1.3657 1.3936 34× 0.562 5× 3

4= 0.31641.

Obtemos para terceira iterada o valor x = 1.3640.

4. Compare as aproximações a que chegou nas alíneas anteriores determinando, emcada caso um limite superior para o erro absoluto para cada uma das aproximações.

Estes limites superiores encontram-se estimados nas tabelas anteriores.

1.3 Método iterativo do ponto fixo

No método do ponto fixo a equação f (x) = 0, cuja raiz α se procura, é rearranjada naforma equivalente x = g (x). Nesta nova forma deve assegurar-se que

f (α) = 0 ⇐⇒ α = g (α) .

A raiz α costuma designar-se por ponto fixo de g (x) = x e o processo iterativo consisteno algoritmo

xn+1 = g (xn) , n ≥ 0 (15)

ilustrado na Figura 8.

x

yxy =

( )xgy =

1

2

3

4

5

1 2 3 4 5

0x

1x

2x

x

yxy =

( )xgy =

1

2

3

4

5

1 2 3 4 5

0x

1x

2x

Figura 8: O método do ponto fixo.

19 2/Abril/2004

De salientar que, em geral, a convergência do método iterativo do ponto fixo estáassociada à contractividade da função iteradora g. Basicamente, uma aplicação g diz-secontractiva num intervalo I, se

|g (x)− g (y)| ≤ M |(x− y)| ,∀x, y ∈ I

para algum 0 < M < 1. É possível mostrar que se g ∈ C1 ([a, b]) e |g′ (x)| ≤ M < 1,∀x ∈ [a, b], então g é contractiva no intervalo em causa.

Na Figura 9 apresentamos o exemplo de um processo iterativo do tipo xn+1 = g (xn)que não converge para o ponto fixo.

0.6

0.8

1

1.2

1.4

1.6

1.8

2

0.6 0.8 1 1.2 1.4 1.6 1.8 2 x

y

( )xgy =

xy =

0.6

0.8

1

1.2

1.4

1.6

1.8

2

0.6 0.8 1 1.2 1.4 1.6 1.8 2 x

y

( )xgy =

xy =

Figura 9: Exemplo de processo iterativo não convergente.

Seguidamente apresentaremos condições suficientes de convergência deste método it-erativo.

Proposição 4 Suponha-se que g e g′ são funções contínuas em I = [a, b] (b > a) comg ([a, b]) ⊆ [a, b] e |g′ (x)| ≤ M < 1, ∀x ∈ [a, b]. Então, g tem um único ponto fixo α nointervalo I e o processo iterativo (15) converge para α se x0 ∈ [a, b].

Demonstração. Notemos que a aplicação g é contractiva (porquê?). Comecemos pormostrar que g tem pelo menos um ponto fixo α no intervalo I. Consideremos a funçãoauxiliar h (x) = g (x)− x. Como g ([a, b]) ⊆ [a, b] , então

h (a) = g (a)− a ≥ 0 e h (b) = g (b)− b ≤ 0.

Se h (a) = 0 ou h (b) = 0, g tem um ponto fixo em a ou b respectivamente. Casocontrário, em consequência do corolário do teorema do valor intermédio, da continuidadede h em I, deduz-se que existe pelo menos um valor α ∈ I tal que h (α) = 0, isto é,

g (α)− α = 0 ⇒ g (α) = α,

20 2/Abril/2004

o que demonstra a tese. Mostremos agora a unicidade do ponto fixo. Suponha-se comvista a um absurdo que existem dois pontos fixos de g, α1 e α2 em I. Do teorema deLagrange, da continuidade de f ′ em I, deduz-se

g (α1)− g (α2) = f ′ (c) (α1 − α2) ⇒α1 − α2 = f ′ (c) (α1 − α2) ⇒

f ′ (c) = 1,

para um certo c entre α1 e α2. Ora, esta conclusão é absurda, pois por hipótese

|g′ (x)| ≤ M < 1,∀x ∈ [a, b] .

Este facto demonstra a unicidade do ponto fixo de g em I.Mostremos agora a convergência o processo iterativo (15) para α se x0 ∈ [a, b]. Seja

M ≥ 0 tal que |g′ (x)| ≤ M < 1 e suponha-se que xn ∈ I, para um qualquer n ∈ IN0. Doteorema de Lagrange sabemos

g (xn)− g (α) = g′ (cn) (xn − α) , (16)

para certo cn entre xn e α. Então,

|xn+1 − α| ≤ M |xn − α| .

Note-se que xn+1 = g (xn) ∈ [a, b]. Sucessivamente

|en+1| ≤ M |en| ≤ M2 |en−1| ≤ · · · ≤ Mn+1 |e0| ⇒0 ≤ lim

n→∞|en+1| ≤ lim

n→∞Mn+1 |e0| = 0.

O que demonstra a convergência do processo.De referir que a proposição anterior contém a informação da evolução do erro asso-

ciado a cada iteração, informação esta que pode ser utilizada como critério de paragem.Mais rigorosamente

|en+1| ≤ M |en| , n = 0, 1, . . . (17)

com M < 1 e |g′ (x)| ≤ M , ∀x ∈ [a, b], ou alternativamente,

|en| ≤ Mn |e0| , n = 1, 2, . . .

Com base em (17), podemos deduzir sucessivamente

|en+1| ≤ M |xn − α|= M |xn − α− xn+1 + xn+1|≤ M |xn − xn+1|+M |en+1| ⇒

|en+1| −M |en+1| ≤ M |xn − xn+1| ⇒|en+1| (1−M) ≤ M |xn − xn+1| ,

21 2/Abril/2004

donde resulta a seguinte desigualdade, também, com algum interesse:

|en+1| ≤ M

1−M|xn+1 − xn| , n = 0, 1, . . .

Quanto à ordem de convergência deste método, suponha-se que g satisfaz os pressu-postos da proposição anterior e consideremos a expressão (16):

g (xn)− g (α) = g′ (cn) (xn − α) , (18)

para certo cn entre xn e α. Então,

|xn+1 − α||xn − α| = |g′ (cn)|

para certo cn entre xn e α. Donde se conclui (da continuidade de g′) que

limn→∞

|en+1||en| = |g′ (α)| .

Como, 0 < |g′ (α)| < 1, este facto mostra que a ordem de convergência deste método(supondo α, uma raíz simples de f) é linear com um coeficiente assintóticoK∞ = |g′ (α)|.Exemplo 8 Calcule a raiz de x2+x−1 situada no intervalo [0.5, 1] com um erro inferiora 0.01.

Comecemos por observar que f é crescente no intervalo referido e que f (0.5)×f (1) <0.

Façamos g (x) = 11+x

. Note-se que g e g′ são contínuas em [0.5, 1] e

1

1 + x= x ⇔ x2 + x− 1 = 0.

Por outro lado,|g′ (x)| ≤ 0.5,∀x ∈ [0.5, 1] .

e (notemos que g é decrescente)

g ([0.5, 1]) = [g (1) , g (0.5)] ⊆ [0.5, 1] .

Então estamos nas condições da proposição 4. Façamos então M = 0.5 e construa-se aseguinte tabela para sistematizar os cálculos:

n xn xn+1 = g (xn) majorante de |en+1|0 1 0.5 0.251 0.5 0.666 67 0.1252 0.666 67 0.6 0.06253 0.6 0.625 0.0312 54 0.625 0.615 38 1.562 5× 10−2

5 0.615 38 0.619 05 7. 812 5× 10−3

A resposta será α = 0.62.

22 2/Abril/2004

Algoritmo 5 (Método do Ponto Fixo) Para n = 0, . . . , ITMAX (número máximode iteradas)

1. xn+1 = g (xn) ;


Exemplo 9 Considere a função g (x) = π2− 0.5 senx.

1. Prove que a função g tem um único ponto fixo no intervalo I = [0, π] .

Notemos que g e g′ são contínuas em [0, π]. Comecemos por observar que g ([0, π]) ⊆[0, π]. Com efeito,

maxx∈[0,π]

g =π

2− (−0.5) ≈ 2.070 8 < π

eminx∈[0,π]

g =π

2− 0.5 ≈ 1.0708 > 0.

Como g é contínua e por isso transforma intervalos em intervalos, claramente

g ([0, π]) ⊆ [0, π] .

Por outro lado,

g′ (x) = −0.5 cosx ⇒ |g′ (x)| = |0.5 cosx| ≤ 0.5 < 1.

Estão, então asseguradas as condições suficientes de unicidade, existência do pontofixo de g em I e, adicionalmente, de convergência do respectivo método qualquerque seja x0 escolhido em I.

2. Encontre uma aproximação da raiz da equação x+0.5 senx−π2= 0 usando o método

do ponto fixo em 3 iterações. Justifique a convergência do método e indique ummajorante do erro absoluto da aproximação a que chegou.

Notemos quex+ 0.5 senx− π

2= 0 ⇔ g (x) = x

com g (x) = π2− 0.5 senx. Assim, tendo por base as justificações da alínea an-

terior relativamente à convergência apliquemos o método iterativo do ponto fixoescolhendo para x0 o ponto médio do intervalo I. Façamos M = 0.5.

n xn xn+1 = g (xn) majorante de |en+1|0 π

21.070 8 π

2× 0.5

1 1.070 8 1.132 π2× 0.52

2 1.132 1.118 2 π2× 0.53

Assim x3 = 1.118 2 com |e3| ≤ π2× 0.53 ≈ 0.196 35.

23 2/Abril/2004

Exemplo 10 Considere a equação x4 − x+ 0.1 = 0.

1. Determine uma função ϕ e um intervalo real tais que o método iterativo xk+1 =ϕ (xk) convirja para a maior raiz real da equação dada.

Localização do intervalo de interesse:

Sabemos que f é estritamente crescente para todo o valor x >√33

(note-se quef ′ (x) = 3x3 − 1) e que f

(34

) ≈ −0.33359 < 0 e f (1) > 0. Então a maior raiz realtem de situar-se no intervalo

[34, 1](porquê?).

Determinação de uma função ϕ:

Notemos que

x4 − x+ 0.1 = 0 ⇐⇒ x4 + 2x− 3x+ 0.1 = 0

⇐⇒ x4 + 2x = 3x− 0.1

⇐⇒ x =3x− 0.1

x3 + 2.

Este facto mostra que os pontos fixos de ϕ = 3x−0.1x3+2

são zeros de f . Observe-se queϕ e ϕ são contínuas em

[34, 1]. Por outro lado,

ϕ′ (x) =6 (1− x3) + 0.3x2

(x3 + 2)2> 0,∀x ∈

[3

4, 1

].

Deste facto resulta que

ϕ

([3

4, 1

])⊆

[3

4, 1

]

já que ϕ(34

)= 0.88774 e ϕ (1) = 0.96667. Por outro lado ∀x ∈ [

34, 1]

1

(x3 + 2)2< ϕ′ (x) <

6[1− (

34

)3]+ 0.3[(

34

)3+ 2

]2 < 0.65.

Assim, estão garantidas as condições de convergência do processo

xk+1 = ϕ (xk) , k = 0, 1, . . .

para o único ponto fixo do intervalo de interesse, escolhendo x0 ∈[34, 1].

2. Utilizando o método iterativo indicado, obtenha uma aproximação da maior raizreal da equação dada realizando três iterações. Indique um majorante do erroabsoluto da aproximação obtida.

Faça-se M = 0.65, x0 = 0.75+12

= 0.875 (|e0| ≤ 0.125) e considere-se a seguintetabela para sistematizar os cálculos:

n xn xn+1 = ϕ (xn) majorante de |en+1|0 0.875 0.945 72 0.65× 0.125 = 0.081 251 0.945 72 0.961 81 0.65× 0.081 25 = 5. 281 3× 10−2

2 0.961 81 0.963 9 0.65× 5. 281 3× 10−2 = 3. 432 8× 10−2

Assim, x3 = 0.96 com |e3| ≤ 3.5× 10−2.

24 2/Abril/2004

Pode não ser fácil, como verificámos nos exemplos resolvidos, construir a equaçãox = g (x) a partir da equação f (x) = 0 de forma a satisfazer as condições de convergência.Referiremos, a título informativo, o artifício que consiste em fazer

g (x) = x− φ (x) f (x)

escolhendo de uma função apropriada φ (x). Esta função φ deve ser não nula e limitadanum intervalo que contenha a raiz procurada.

1.4 Localização de zeros de polinómios

Já vimos que o conhecimento da localização aproximada dos zeros das funções é im-portante para assegurar a rápida convergência dos processos iterativos utilizados na suadeterminação numérica.

Seguidamente apresentaremos algumas técnicas para conhecermos a natureza e alocalização dos zeros de uma classe particular de funções: os polinómios.

Representaremos um polinómio real de grau n seguinte forma:

p (x) = anxn + an−1x

n−1 + · · ·+ a1x+ a0, (19)

com a0, a2, . . . , an números reais e an �= 0.Notemos que um polinómio real de grau n tem exactamente n zeros (alguns eventual-

mente idênticos) que podem ser reais ou complexos. De referir que os zeros complexos,a existirem, ocorrem em pares conjugados.

Proposição 5 (Regra de Descartes I ) O número N+ de zeros reais positivos de umpolinómio real p não excede o número V de variações de sinal dos seus coeficientes nãonulos, e o valor V −N+ é par.

Demonstração. Consequência da regra de Budan (proposição 8) considerando o inter-valo I = [0,+∞[.

Exemplo 11 Seja p (x) = 8x3+4x2− 34x+15. Comecemos por avaliar o número V devariações de sinal dos seus coeficientes:V = 2. Então N+ ≤ 2 e V −N+ = 2−N+ é par.Assim, podemos concluir imediatamente que N+ = 0 ou N+ = 2.

Seja q (x) = p (−x). Sabendo que se z é zero de p então −z é zero de q, resulta daregra anterior o seguinte facto:

Proposição 6 (Regra de Descartes II) O número N− de zeros reais negativos de umpolinómio real p não excede o número V de variações de sinal dos coeficientes não nulosdo polinómio q (x) = p (−x), e o valor V −N− é par.

Demonstração. Consequência imediata da regra anterior.

25 2/Abril/2004

Exemplo 12 Seja p (x) = 8x3 + 4x2 − 34x + 15. Consideremos o polinómio auxiliarq (x) = p (−x) = −8x3 + 4x2 + 34x + 15. Comecemos por avaliar o número V devariações de sinal dos seus coeficientes: V = 1. Então N− ≤ 1 e V − N− = 1 − N− épar. Assim, podemos concluir imediatamente que N− = 1. Resumidamente, p tem emalternativa:

1. Dois zeros positivos e um zero negativo;

2. Dois zeros complexos conjugados e um zero negativo.

De referir que a regra de Descartes só nos fornece indicações sobre o número de zerosreais em ]−∞, 0[ e ]0,+∞[.

Seguidamente apresentaremos um resultado para melhor localizar os zeros.

Proposição 7 (Regra do máximo) Todos os zeros z, reais ou complexos de um polinómiop, na forma (19) verifica a desigualdade |z| < R, em que

R = 1 + max0≤k≤n−1

∣∣∣∣akan∣∣∣∣ .

Em particular, se p tiver zeros reais, eles pertencem ao intervalo ]−R,R[.

Demonstração. Se z for um zero tal que |z| ≤ 1, o resultado é trivialmente verdadeiro.Suponha-se que |z| > 1. Nestas circunstâncias, deduz-se sucessivamente

p (z) = 0 ⇒

anzn = −

n−1∑k=0

akzk ⇒

|an| |zn| ≤ max0≤k≤n−1

|ak|n−1∑k=0

|z|k .

Da expressão que nos permite calcular os n primeiros termos de uma progressão ge-ométrica

n−1∑k=0

|z|k = |z|n − 1

|z| − 1,

deduz-se

|an| |zn| ≤ max0≤k≤n−1

|ak| |z|n − 1

|z| − 1⇒

|z| − 1 ≤ max0≤k≤n−1

|ak||an|

|z|n − 1

|zn| ≤ max0≤k≤n−1

|ak||an| ,

como se queria demonstrar.

26 2/Abril/2004

Exemplo 13 Seja p (x) = 8x3 + 4x2 − 34x+ 15. Então,

R = 1 +

∣∣∣∣−34

8

∣∣∣∣ = 5.25.

Desta forma deduz-se que os zeros reais de p, se existirem, situam-se em

]−5.25, 5.25[ .

Seguidamente indicaremos um resultado útil na determinação do número de zerosreais existentes num dado intervalo: regra de Budan.

Proposição 8 (Regra de Budan) Consideremos o intervalo I = [a, b] e p um polinómiode grau n. Sejam Va e Vb os números de variação de sinal das sucessões

p (a) , p′ (a) , p′′ (a) , . . . , p(n) (a) ,

p (b) , p′ (b) , p′′ (b) , . . . , p(n) (b) ,

respectivamente. Então, o número N de zeros reais de p em ]a, b[ não excede Va − Vb e(Va − Vb)−N é par.

Demonstração. Consultar, por exemplo, [11].

Exemplo 14 Seja p (x) = 8x3 + 4x2 − 34x+ 15. Então,

p′ (x) = 24x2 + 8x− 34

p′′ (x) = 48x+ 4

p′′′ (x) = 48.

Sistematizemos a análise da aplicação desta regra no intervalo [−3, 2]:

x −3 −2 −1 0 1 2p (x) − + + + − +p′ (x) + + − − − +p′′ (x) − − − + + +p′′′ (x) + + + + + +Vx 3 2 2 2 1 0Vx − Vy 1 0 0 1 1

Do quadro, conclui-se que existe uma raiz real em cada um dos seguintes subinterva-los: ]−3,−2[, ]0, 1[ e ]1, 2[.

27 2/Abril/2004

1.5 Método de Bierge-Vieta

O método de Bierge-Vieta representa uma adaptação do método de Newton à determi-nação de raizes de polinómios. Seja p um polinómio genérico:

p (x) = anxn + an−1x

n−1 + · · · a1x+ a0. (20)

Na aplicação do método de Newton

xn+1 = xn − p (xn)

p′ (xn), (21)

torna-se necessário calcular p (x) e p′ (x) em x0, x1, . . . , etc. O método de Bierge-Vietaé um algoritmo que permite efectuar estes cálculos efectuando um menor número deoperações aritméticas. Baseia-se no seguinte processo recursivo (conhecido por algoritmode Horner):

p0 (x) = an (22)

p1 (x) = xp0 (x) + an−1 (23)

p2 (x) = xp1 (x) + an−2 (24)... (25)

pn (x) = xpn−1 (x) + a0. (26)

Não é difícil verificar que

pn (x) = a0 + x (a1 + x (a2 + · · ·+ x (an−1 + xan))) . (27)

Tal processo permite calcular p (x) em cada xk, k = 0, 1, . . . , efectuando apenas nadições e n multiplicações, com vantagens na rapidez e no menor número de erros dearredondamento.

Suponha-se que, com base em (27), pretendemos calcular pn (x), por exemplo.

an an−1 an−2 · · · a0x +xp0 (x) +xp1 (x) · · · +xpn−1 (x)

p0 (x) = an p1 (x) p2 (x) · · · pn (x)

De referir que o algoritmo ilustrado é semelhante à regra de Ruffini e designa-se poralgoritmo de divisão sintética.

Suponha-se agora que pretendemos calcular p′n (x). Consideremos as derivadas dasexpressões (22)-(26):

p′0 (x) = 0 (28)

p′1 (x) = xp′0 (x) + p0 (x) = p0 (x) (29)

p′2 (x) = xp′1 (x) + p1 (x) (30)... (31)

p′n (x) = xp′n−1 (x) + pn−1 (x) . (32)

28 2/Abril/2004

As expressões obtidas permitem operacionalizar o seguinte procedimento para calcularp′n (x):

p0 (x) p1 (x) p2 (x) · · · pn−1 (x)x +xp′1 (x) +xp′2 (x) · · · +xp′n−1 (x)

p′1 (x) p′2 (x) p′3 (x) · · · p′n (x)

Resumidamente, o algoritmo e Bierge-Vieta, consiste na aplicação dos procedimentosatrás descritos (algoritmo de divisão sintética) para gerar as sucessivas iteradas

xn+1 = xn − p (xn)

p′ (xn), n = 0, 1, . . .

do método de Newton. Note-se que os procedimentos descritos para calcular p (x) e p′ (x)podem ser acoplados, como se ilustrará de seguida.

Exemplo 15 Determine x1 aplicando o método de Bierge-Vieta ao polinómio

p (x) = 3x5 + 3x4 − 4x3 + 2x− 120,

supondo x0 = 2:

3 3 -4 0 2 -1202 6 18 28 56 116

3 9 14 28 58 -42 6 30 88 232

3 15 44 116 290

Assim, p (2) = −4 e p′ (2) = 290. Donde

x1 = 2− −4

290= 2.013793.

Exemplo 16 Considere a equação algébrica x4 − x− 1 = 0.

1. Justificando, utilize as regras de Descartes, do máximo e de Budan para concluirsobre a existência de raízes reais da equação e obter intervalos de comprimentoutitário que as contenha.

Consideremos p (x) = x4 − x− 1 e q (x) = p (−x) = x4 + x− 1.

Regras de Descartes: V (p) = 1. Assim N+ ≤ 1 e V (p)−N+ é par. Logo deveexistir uma raiz positiva. V (q) = 1. Assim N− ≤ 1 e V (q)−N− é par. Logo deveexistir uma raiz negativa. As restantes raizes deverão ser complexas.

Regra do máximo:

R = 1 + max0≤k≤n−1

∣∣∣∣akan∣∣∣∣

= 1 +1

1= 2.

29 2/Abril/2004

Assim, as raizes reais estarão no intervalo [−2, 2].

Regra de Budan:

p (x) = x4 − x− 1,

p′ (x) = 4x3 − 1,

p′′ (x) = 12x2,

p′′′ (x) = 24x,

p′′′′ (x) = 24 e

x −2 −1 0 1 2p (x) + + − − +p′ (x) − − − + +p′′ (x) + + 0 + +p′′′ (x) − − 0 + +p′′′′ (x) + + + + +Vx 4 4 1 1 0Vx − Vy 0 3 0 1

Como, em cada intervalo, o número de zeros reais N não excede Vx − Vy devendoVx − Vy − N ser par, concluímos que as duas raizes reais existem cada uma nosintervalos [−1, 0] e [1, 2].

2. Utilizando o método de Bierge-Vieta, efectue duas iterações para obter uma aprox-imação da raiz negativa. Escolha para aproximação inicial um dos extremos dointervalo obtido anteriormente e justifique a resposta.

Para assegurar a boa convergência (condicões suficientes de convergência do métodode Newton) comecemos por escolher o extremo do intervalo em que p tem o mesmosinal de p′′, isto é, x0 = −1 com

p (x) = x4 + 0x3 + 0x2 − x− 1.

Apliquemos agora o método de Bierge-Vieta:

1 0 0 −1 −1−1 −1 1 −1 2

1 −1 1 −2 1−1 −1 2 −3

1 −2 3 −5

Donde, p (−1) = 1 e p′ (−1) = −5. Assim,

x1 = x0 − p (x0)

p′ (x0)

= −1− 1

−5= −0.8.

30 2/Abril/2004

Calculemos, agora, a segunda iterada.

1 0 0 −1 −1−0.8 −0.8 0.64 −0.512 1. 209 6

1 −0.8 0.64 −1.512 0.209 6−0.8 −0.8 1. 28 −1. 536

1 −1.6 1. 92 −3. 048

Donde, p (−0.8) = 0.209 6 e p′ (−0.8) = −3. 048. Assim,

x2 = x1 − p (x1)

p′ (x1)

= −0.8− 0.209 6

−3. 048≈ −0.731 23.

31 2/Abril/2004

Laboratórios

1.6 Laboratório 1

% Métodos iterativos de resolução de equações% metod_bissec.m% Método da bissecçãoclear all; close all; clc;%intervalo inicial: [xmin, xmax]%numero de iterações: itmax%função: fx% definição simbólica da função%fx=’exp(x)-2*x^3’; xmin=0; xmax=1.5;fx=’exp(x-1)-5*x^3’; xmin=0; xmax=1.5;%plot da expressão simbólicaezplot(fx,xmin,xmax);grid on;%Método da bissecçãoitmax=15;xn=[];erron=[];fn=[];a=xmin; b=xmax;for k=1:itmaxx=a; s1=eval(fx);x=(a+b)/2;xn=[xn;x];erron=[erron;(b-a)/2];s2=eval(fx);fn=[fn;s2];if sign(s1*s2) <= 0b=x;elsea=x;end

endpause;plot(xn,’r-’)title([’f(x)=’,fx, sprintf(’\n’)...’x(n)=’,num2str(xn(end)),’ // Erro(n)=’,num2str(erron(end))])

xlabel(’Iteração’)ylabel(’raiz’)grid on

32 2/Abril/2004

1.7 Laboratório 2

% Métodos iterativos de resolução de equações não lineares% metodo_newton.m% Método de Newtonclear all; close all; clc;format long e%intervalo inicial: [xmin, xmax]%numero de iterações: itmax%função: fx% definição simbólica da funçãofx=’exp(x-1)-5*x^3’; xmin0=0.1; xmax0=1.0;% definição simbólica da derivada da funçãodfx=’exp(x-1)-15*x^2’;absdfx=’abs(exp(x-1)-15*x^2)’% definição simbólica da segunda derivada da funçãoddfx=’exp(x-1)-30*x’;absddfx=’abs(exp(x-1)-30*x)’;%plot da expressão simbólicaezplot(fx,xmin0,xmax0);grid on;xmin=input(’Qual o que pretende? xmin = ’);if isempty(xmin)==1;xmin=xmin0;

endxmax=input(’Qual o valor que pretende? xmax = ’);if isempty(xmax)==1;xmax=xmax0;

end%plot da derivada de f no itervaloezplot(absdfx,xmin,xmax)m1=input(’Valor absoluto mínimo da derivada no intervalo? m1 = ’);clc;%plot da segunda derivada de f no intervaloezplot(absddfx,xmin,xmax);M2=input(’Valor absoluto máximo da 2a derivada no intervalo? M2 = ’);clc;% cálculo de M (destinado à estimativa dos majorantes dos erros)M=M2/(2*m1);%Método de Newtonitmax=5;%Escolha de x0x=xmin;s1=eval(fx); s2=eval(ddfx);

33 2/Abril/2004

if sign(s1*s2) < 0x=xmax;

enderro_n=[];erro=xmax-xmin;erron=[erro];xn=[x];fxn=[eval(fx)];for k=1:itmaxx=x-eval(fx)/eval(dfx);xn=[xn;x];erro=M*erro^2;erron=[erron; erro];fxn=[fxn;eval(fx)];

endplot(xn,’r-’)title([’f(x)=’,fx, sprintf(’\n’)...’x(n)=’,num2str(xn(end)),’ // Erro(n)=’,num2str(erron(end))])

xlabel(’Iteração’)ylabel(’raiz’)grid on% impressão no displayclcfprintf(’ \n’) ;fprintf(’ \n’) ;fprintf(’MÉTODO DE NEWTON\n’) ;fprintf(’ \n’) ;fprintf(’ \n’) ;fprintf(’ \n’) ;fprintf(’ xn f(xn) erro(n)\n’) ;fprintf(’ \n’) ;for k=1:itmaxfprintf(’%15.9f %15.9f %15.9f\n’,xn(k),fxn(k),erron(k)) ;

endfprintf(’ \n’) ;fprintf(’ \n’) ;

34 2/Abril/2004

Referências

[1] Apostol, Tom M., Calculus, Editorial Reverté, 1967.

[2] Carlos Alves, Fundamentos de Análise Numérica, 2001-2002, Departamento deMatemática do IST, Edição da AEIST.

[3] Carpentier, M. P. J., Análise Numérica-Teoria, Fev. 1993, Departamento deMatemática do IST, Edição da AEIST.

[4] Carvalho, J., Notas manuscritas (não publicadas), 1997.

[5] Conte, S. D. & Boor, C., Elementary Numerical Analysis, McGraw-Hill, 1980.

[6] Démidovitch, B. & Maron, I., Élements de Calcul Numérique, Editora MIR, 1973.

[7] Gerald, C. e Wheatley, P., Applied Numerical Analysis, Addison-Wesley, 1997.

[8] Kharab, A & Guenter, R. b., An Introduction to Numerical Methods: A MatlabApproach, Chapman & All/CRC, 2002.

[9] Lindfield, G. e Penny, J., Numerical Methods Using Matlab. Ellis Horwood, 1995.

[10] Kreyszig, Erwin., Advanced Engineering Mathematics (Cap. 17 e 18), Willey, 1999.(Livro de texto).

[11] Kurosh, A., Cours d’Algèbre Supérieure, MIR, Moscovo, 1998.

[12] Pina, Heitor, Métodos Numéricos, McGraw-Hill, 1995.

[13] Press, W., Flannery, B. P., Teukolsky, S. A. e Vetterling, W. T., Numerical Recipes-The Art of Scientific Computing, Cambridge University Press, 1989.

[14] Río, J. A. I. Del & Cabezas, J. M. R., Métodos Numéricos-Teoria, problemas ypráticas com MATLAB, Edições Pirámide, 2002.

[15] Santos, F. C., Fundamentos de Análise Numérica, Edições Sílabo, 2003.

35 2/Abril/2004

Métodos Numéricos Resolução Numérica de Equações Não...

Documents

Transcript of Métodos Numéricos Resolução Numérica de Equações Não...