Teoria Classica de Campos

100
Teoria Clássica de Campos Mario C. Bertin 17 de junho de 2015

description

Notas de aulo sobre Teoria Clássica de Campos

Transcript of Teoria Classica de Campos

Teoria Clássica de Campos

Mario C. Bertin

17 de junho de 2015

Sumário

1 Transformações de Lorentz 51.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Postulados fundamentais da relatividade restrita . . . . . . . . . . . . . . . . . 61.3 Transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.4 Composição de velocidades, contração de Lorentz e dilatação do tempo . . . . . 101.5 O espaço-tempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.6 A partícula livre relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2 Transformações infinitesimais 152.1 Transformações infinitesimais em Rn . . . . . . . . . . . . . . . . . . . . . . . . 152.2 Evolução temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.3 Translações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.4 Rotações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3 A geometria de Minkowski 213.1 Vetores e covetores de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.2 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.3 Ortogonalidade e os grupos de Lorentz e Poincaré . . . . . . . . . . . . . . . . . 243.4 Álgebra de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.5 A representação adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.6 Invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4 O formalismo lagrangiano para campos 314.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.2 Variações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324.3 A primeira variação da ação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.4 Os termos de fronteira . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.5 Os princípios de Hamilton e Weiss e as equações de campo . . . . . . . . . . . . 38

5 Os teoremas de Noether 415.1 Simetrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415.2 A equação de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425.3 O primeiro teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435.4 Cargas conservadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455.5 Translações e a conservação de energia e momento . . . . . . . . . . . . . . . . . 465.6 Rotações, momento angular e spin . . . . . . . . . . . . . . . . . . . . . . . . . . 505.7 O segundo teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535.8 Invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

6 O campo escalar 596.1 O campo escalar real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 596.2 O campo escalar complexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.3 Simetrias internas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.4 Simetrias de gauge locais e interação . . . . . . . . . . . . . . . . . . . . . . . . . 62

2

7 O campo eletromagnético 657.1 O campo vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657.2 O campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687.3 Liberdade de gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

8 Campos espinoriais 758.1 A álgebra de Clifford relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . 758.2 Rotações: a representação espinorial das transformações de Lorentz . . . . . . 798.3 Representações de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 828.4 Espinores de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 868.5 A ação de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 868.6 Aplicando o princípio de Weiss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

9 Campos de Gauge 919.1 Revisitando o campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 919.2 Transformações de gauge globais . . . . . . . . . . . . . . . . . . . . . . . . . . . 929.3 Transformações de gauge locais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 949.4 A lagrangiana invariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

3

Capítulo 1

Transformações de Lorentz

1.1 IntroduçãoNa mecânica clássica, a trajetória de uma partícula é descrita a partir da segunda lei deNewton

F =dp

dt, (1.1)

em que p = mv, sendo m a massa e v = x = dx/dt a velocidade da partícula, definida a partirda escolha de um sistema de coordenadas no espaço retangular R3. A posição da partículapode ser representada por um vetor posição x = (x, y, z), em que x, y e z são número reaisrelacionados a três eixos cartesianos ex, ey e ez. A escolha de um sistema de coordenadas quedescreve o movimento de uma partícula em R3 é o equivalente físico à escolha de um sistemade referência a partir do qual qualquer medida sobre o sistema pode ser tomada. Segundoa primeira lei de Newton, se a força resultante que age sobre uma partícula é nula, existesempre um sistema referencial para o qual a velocidade da partícula é constante em sentido,direção e módulo. Um referencial que obedece a essa propriedade é chamado referencialinercial, e uma das propriedades mais importantes da dinâmica de um sistema clássico é que(1.1) continua vális ou, dito de outra forma, é covariante em qualquer desses referenciais.Dizemos, assim, que o sistema físico é invariante sob a escolha entre referenciais inerciais.

Esta invariância retira do espaço o caráter absoluto que lhe havia atribuído a mecânicade Aristóteles. Por outro lado, outra suposição fundamental da mecânica newtoniana é sobrea natureza imutável do tempo. Para qualquer referencial inercial, a passagem do tempo deveser a mesma, o que implica que se dois referenciais inerciais são usados para descrever ummesmo sistema, intervalos de tempo medidos por ambos possuem o mesmo valor absoluto.

Vamos supor uma partícula de massa m de força resultante nula, que se move com velo-cidade v com relação a um determinado referencial inercial O, cujo sistema de coordenadasseja dado por x = (x, y, z). Agora vamos supor um segundo referencial inercial O′. Por sim-plicidade vamos escolher este segundo referencial de modo que seus eixos cartesianos sejamparalelos aos eixos cartesianos de O e que, em t = 0, a origem dos dois sistemas coincida. Osistema de coordenadas de O′ é dado por x′ = (x′, y′, z′) e sua origem move-se com velocidadeu, constante, com relação a O. Ambos os sistemas de coordenadas estão relacionados por

x′ = x− ut. (1.2)

Lembremos que, segundo o caráter absoluto do tempo, t′ = t. Se x (t) representa a trajetóriada partícula sob o ponto de vista de O, (1.2) também resulta na trajetória da partícula x′ (t)medida pelo referencial O′.

Neste caso, a velocidade da partícula medida por O′ é dada por

v′ =dx′

dt′=dx′

dt=

d

dt(x− ut) =

dx

dt− u = v − u. (1.3)

5

Esta é a lei de composição de velocidades na mecânica newtoniana. Note que

p′ = mv′ =⇒ dp′

dt= m

dv′

dt= m

dv

dt=dp

dt, (1.4)

desde que a massa seja constante. Este resultado implica que a aceleração de um sistema éinvariante sob a escolha de referenciais inerciais. Para que a segunda lei (1.1) seja covariante,uma força F que age sobre a partícula também não pode depender da escolha do referencialinercial.

Outro invariante sob a transformação (1.2) vem a ser a quantidade

ds2 = dx2 + dy2 + dz2 = dx · dx, (1.5)

que é a métrica euclidiana do espaço cartesiano R3. Tomando-se (1.2), temos

(ds′)2

= dx′ · dx′ = dx · dx = ds2. (1.6)

Dada a invariância da métrica, é imediato notar que a norma dos vetores em R3 também épreservada, o que implica que distâncias medidas por O devem ser as mesmas medidas porO′.

Portanto, os sistemas físicos descritos pela mecânica clássica são invariantes pelas trans-formações

x′ = x− ut, (1.7a)t′ = t, (1.7b)

que são chamadas transformações de Galilei.

1.2 Postulados fundamentais da relatividade restritaAté o século XIX, a relatividade de Galilei era considerada uma propriedade dos sistemasfísicos, em razão do grande sucesso da mecânica clássica. Contudo, na segunda metade doséculo XIX as bases matemáticas do eletromagnetismo clássico foram reunidas em formafinal, através das equações de Maxwell. Foi uma grande surpresa quando os estudos deLorentz e Poincaré revelaram que tais equações não eram covariantes às transformações(1.7), ou seja, o eletromagnetismo não obedecia à relatividade galileana. Este fato tornou-seum problema teórico fundamental, visto que a lei de força de Lorentz é baseada na mecânicanewtoniana e, portanto, uma incompatibilidade entre a teoria de Maxwell e a mecânica surgiuem nível formal.

Esta incompatibilidade não foi, contudo, observada imediatamente nas experiências emeletrodinâmica clássica (as trajetórias de partículas carregadas que se movem em camposeletromagnéticos, por exemplo, são bem descritas desde que as velocidades das partículassejam tipicamente pequenas). Contudo, experimentos como o de Michelson e Morley (1989)mostraram que a velocidade da luz no vácuo independe do movimento relativo entre a fontee o observador, em clara violação da relatividade de Galilei.

Einstein observou que a incompatibilidade entre o eletromagnetismo e a mecânica new-toniana deveria ser corrigida modificando-se a mecânica, de modo que os sistemas físicosobedecessem dois postulados fundamentais:

1. Todo sistema físico é invariante pela escolha de referencial inercial;

2. A velocidade da luz é uma constante independente do movimento relativo entre fonte eobservador.

Vamos supor que uma fonte de luz seja ligada na origem de um dado referencial inercialO, que é munido de um sistema de coordenadas x = (x, y, z) e, também, de um relógio cujoinstante t = 0 marca o instante em que a fonte de luz é ligada. A frente de onda se move à

6

velocidade da luz, que denominaremos como c (tem o valor de exatamente 299.792.458 metrospor segundo no vácuo), e é descrita pela equação

x2 + y2 + z2 = c2t2,

neste referencial.Agora, consideremos um segundo referencial inercial O′, não rotacionado com relação a O.

O sistema de coordenadas x′ = (x′, y′, z′) relativo aO′ tem origem coincidente com a origem deO no instante em que a fonte é ligada, ou seja, quando t = 0 em O. Contudo, consideraremosque O′ possui seu próprio relógio e que, neste, o intervalo de tempo medido não coincidenecessariamente com o relógio carregado por O. Ou seja, t′ 6= t. Mas podemos definir o tempoem O′ de modo que t′ = 0 quando t = 0. Isto é possível visto que as coordenadas da fonte sãoas mesmas em ambos os referenciais quando esta é ligada, ou seja, o evento que deu origemao pulso de luz é simultâneo em ambos os referenciais.

Se a velocidade da frente de onda é a mesma para ambos os referenciais, temos

x′2 + y′2 + z′2 = c2t′2,

ou seja,

c2t′2 − r′2 = c2t2 − r2, (1.8)

em que r2 = x2 + y2 + z2, o mesmo para r′. Para simplificar o sistema, vamos supor que O′mova-se com velocidade constante u = uex com relação a O, em que u seja constante, real epositivo. Assim,

c2t′2 − x′2 = c2t2 − x2. (1.9)

Esta configuração é chamada configuração padrão.

1.3 Transformações de LorentzPara que o postulado 1 seja válido, a transformação (t, x) → (t′, x′) deve ser linear. Portantovamos considerar

x′ = Ax+ cBt,

ct′ = Cx+ cDt.

Em (1.9), temos

c2t2 − x2 = (Cx+ cDt)2 − (Ax+ cBt)

2

= C2x2 + c2D2t2 + 2cCDxt−A2x2 − c2B2t2 − 2cABxt

=(C2 −A2

)x2 +

(D2 −B2

)c2t2 + 2c (CD −AB)xt.

Ao igualar os coeficientes,

C2 −A2 = −1,

D2 −B2 = 1,

CD = AB.

Vamos supor a seguinte solução:

A = D = coshφ,

B = C = − sinhφ,

em que o ângulo φ é chamado rapidez. Esta solução não é única, mas é escolhida por reque-rimentos físicos. Em primeiro lugar, a configuração padrão implica que x′ e t′ crescem comx e t, por isso a escolha do sinal negativo em B e C. Em segundo lugar, as transformações

7

resultantes devem levar às transformações de Galilei para |u| c. Levando em conta essescritérios, temos

x′ = x coshφ− ct sinhφ,

ct′ = −x sinhφ+ ct coshφ,

ou em forma matricial,(ct′

x′

)=

(coshφ − sinhφ− sinhφ coshφ

)(ctx

). (1.10)

Podemos, também, colocar o sistema na forma

x′ = coshφ (x− tanhφct) ,

ct′ = coshφ (ct− tanhφx) .

Para interpretar o significado físico de φ, vamos observar a origem de O′, ou seja, x′ = 0. Istoimplica em

x− tanhφct = 0 =⇒ tanhφ =x

ct.

Contudo, u = x/t, portanto

tanhφ =u

c≡ β. (1.11)

Vamos definir, também,

γ ≡ coshφ. (1.12)

Assim, temos

tanhφ = β =⇒ γ =sinhφ

β,

enquanto

cosh2 φ− sinh2 φ = 1 =⇒ sinh2 φ = γ2 − 1.

Comparando-se as duas equações, temos

γ2 =γ2 − 1

β=⇒ γ2

(1− β2

)= 1 =⇒ γ =

√1

1− β2.

Portanto, a transformação pode ser colocada também nas formas mais conhecidas

x′ = γ (x− βct) ,

t′ = γ

(t− β

cx

),

ou

x′ =x− ut√1− u2/c2

, (1.13a)

t′ =t−(u/c2

)x√

1− u2/c2. (1.13b)

8

Nesta configuração, as direções y e z ficam inalteradas, de modo que a forma completa édada por

x′ =x− ut√1− u2/c2

, (1.14a)

y′ = y, (1.14b)z′ = z, (1.14c)

t′ =t−(u/c2

)x√

1− u2/c2, (1.14d)

ou nas duas formas de notação matricial,ct′

x′

y′

z′

=

coshφ − sinhφ 0 0− sinhφ coshφ 0 0

0 0 1 00 0 0 1

ctxyz

, (1.15)

ct′

x′

y′

z′

=

γ −γβ 0 0−γβ γ 0 0

0 0 1 00 0 0 1

ctxyz

, (1.16)

As transformações (3.12), ou mesmo na forma (1.15) são chamadas transformações de Lo-rentz, ou simplesmente boosts de Lorentz. É imediato observar que as transformações deLorentz inversas são dadas substituindo-se u por −u, β por −β ou φ por −φ nessas trans-formações. As transformações de Lorentz são precisamente as transformações que deixam ateoria eletromagnética de Maxwell invariante.

A forma mais geral das transformações de Lorentz, usadas quando os referenciais O eO′ movem-se com uma velocidade u = uxex + uyey + uzez, mas ainda mantêm a mesmaorientação, é dada por(

ct′

r′

)=

(γ −γBT

−γB (γ − 1) BBT /β2

)(ctr

), (1.17)

em que B é o vetor coluna

B ≡

βxβyβz

=1

c

uxuyuz

=u

c,

e BT é o vetor linha

BT ≡(βx βy βz

)=

1

c

(ux uy uz

)=

uT

c.

O produto BBT é dado por

BBT =

β2x βxβy βxβz

βyβx β2y βyβz

βzβx βzβy β2z

,

e β2 = BTB = |u|2 /c2.Observando-se a forma (1.15), é imediato calcular o limite não relativístico, ou seja, a

baixas velocidades das transformações de Lorentz. Observemos que este limite é dado por

u c =⇒ β 1 =⇒ φ 1.

Neste caso, temos

sinhφ→ φ,

coshφ→ 1,

tanhφ→ φ = β = u/c.

9

Então,ct′

x′

y′

z′

=

1 −β 0 0−β 1 0 00 0 1 00 0 0 1

ctxyz

,

ou seja,

x′ = x− βct = x− ut,

t′ = t− β

cx = t− u

c2x ≈ t,

que são as transformações de Galilei na configuração padrão.

1.4 Composição de velocidades, contração de Lorentz edilatação do tempo

Vamos verificar como um objeto, que se move a uma velocidade v com relação a O, move-secom relação ao referencial O′. Por simplicidade vamos utilizar a configuração padrão, nestecaso,

vx =dx

dt.

Vamos utilizar a transformação de Lorentz inversa dada por

x = γ (x′ + βct′) .

Temos, considerando-se γ e β constantes,

vx =dx

dt= γ

(dx′

dt+ βc

dt′

dt

)= γ

(dx′

dt+ βc

dt′

dt

)= γ

(dx′

dt′+ βc

)dt′

dt.

Agora, temos a transformação

t′ = γ

(t− β

cx

)=⇒ dt′

dt= γ

(1− βvx

c

).

Portanto,

vx = γ2

(1− βvx

c

)(v′x + βc) =

1− βvx/c1− β2

(v′x + βc) .

v′x =vx(1− β2

)− βc (1− βvx/c)

1− βvx/c=vx − vxβ2 − βc+ β2vx

1− βvx/c=

vx − βc1− βvx/c

,

ou seja,

v′x =vx − u

1− uvx/c2. (1.18)

Para as demais componentes, temos

vy =dy

dt=dy′

dt=dy′

dt′dt′

dt= v′y

dt′

dt= γv′y

(1− βvx

c

),

ou

v′y =vy

γ (1− uvx/c2). (1.19)

10

Ainda,

v′z =vz

γ (1− uvx/c2). (1.20)

Essas são as equações para composição de velocidades na relatividade restrita. Através essas,podemos mostrar que a velocidade da luz é a mesma para ambos os referenciais. Um raio deluz disparado em (x = 0, t = 0) no referencial O tem velocidade vx = c. Portanto, temos

v′x =c− u

1− uc/c2=

c− u1− u/c

= c

(1− u/c1− u/c

)= c,

em concordância com o segundo postulado.Vamos supor uma régua de comprimento l com relação a um sistema referencial em re-

pouso O. Neste caso, temos

l = x2 − x1,

em que x2 é a posição de uma das extremidades da régua, enquanto x1 < x2 é a posição daoutra extremidade, ambas com relação a O. Supondo um segundo referencial O′ que se movecom velocidade u = uex com relação a O, em uma configuração padrão, temos

x(2,1) = γ(x′(2,1) + ut′(2,1)

),

em que t′(2,1) são os instantes de tempo medidos porO′ em que as medidas de posição da réguasão tomadas. Para que O′ tome uma medida do comprimento da régua, as medidas de x′1 e x′2devem ser sincronizadas, ou seja, tomadas considerando-se ∆t′ = t′2 − t′1 = 0. Neste caso,

l = γ [x′2 − x′1 + u (t′2 − t′1)] = γ [l′ + u∆t′] = γl′,

ou seja,

l′ =1

γl = l

√1− u2/c2. (1.21)

Como γ é sempre maior que 1, toda medida de comprimento na direção do movimento doobservador é sempre menor que a mesma medida feita por um observador em repouso comrelação ao objeto. Este fenômeno é conhecido como contração de Lorentz.

Agora, vamos supor um relógio em repouso com relação a um referencial O. Vamos vercomo um intervalo de tempo, digamos ∆t′ = t′2 − t′1 é medido por um referencial O′ comvelocidade u = uex com relação ao relógio, em uma configuração padrão. A transformação deLorentz relevante é dada por

t′ = γ[t−(u/c2

)x],

portanto,

∆t′ = γ[t2 − t1 −

(u/c2

)(x2 − x1)

]= γ

[∆t−

(u/c2

)∆x].

Contudo, como o relógio está em repouso com relação a O, temos que ∆x = 0, então,

∆t′ = γ∆t =∆t√

1− u2/c2. (1.22)

Como γ é sempre maior que 1, qualquer observador mede intervalos de tempos dilatados comrelação a um observador em repouso com relação ao relógio. Este fenômeno é conhecido comodilatação do tempo.

Portanto, o intervalo de tempo medido por um relógio depende do observador, e não con-siste mais em uma medida absoluta. Quanto mais rápido se move o relógio, maior o intervalode tempo medido pelo observador. Para todo observador inercial, existe um relógio para o qualos intervalos de tempo são mínimos. Segundo (1.22), este relógio é aquele que encontra-se emrepouso com relação ao observador, e o tempo medido por este é chamado tempo próprio τ .

11

1.5 O espaço-tempo de MinkowskiDe forma análoga à relatividade de Galilei, existe uma medida invariante às transformaçõesde Lorentz. Ela é definida pela métrica de Minkowski

ds2 =(dx0)2 − (dx1

)2 − (dx2)2 − (dx3

)2,

em que renomeamos as coordenadas xi =(x1 = x, x2 = y, x3 = z

), e definimos uma quarta

coordenada x0 = ct. A métrica de Minkowski é uma métrica do espaço-tempo de MinkowskiM4, que é um espaço plano pseudo-riemanniano de quatro dimensões. Um sistema de coorde-nadas emM4 consiste em quatro coordenadas xµ =

(x0, x1, x2, x3

), que também distinguem

entre diferentes eventos no espaço-tempo.A métrica de Minkowski é escrita por

ds2 =

3∑µ,ν=0

ηµνdxµdxν , µ, ν = 0, 1, 2, 3. (1.23)

A partir de agora, usaremos a notação de Einstein, para a qual a repetição de dois índicesimplica em soma sobre todos os valores deste índice, ou seja, escreveremos simplesmente

ds2 = ηµνdxµdxν . (1.24)

ηµν são as componentes da métrica de Minkowski no sistema de coordenadas xµ. Em notaçãomatricial, se este sistema de coordenadas for ortogonal, temos

ηµν =

1 0 0 00 −1 0 00 0 −1 00 0 0 −1

. (1.25)

Podemos, também, escrever uma transformação de Lorentz com esta notação. Ela é dadapor

x′µ = Λµνxν . (1.26)

Na configuração padrão, temos em representação matricial

Λµν =

γ −γβ 0 0−γβ γ 0 0

0 0 1 00 0 0 1

=

coshφ − sinhφ 0 0− sinhφ coshφ 0 0

0 0 1 00 0 0 1

. (1.27)

A métrica de Minkowski não é um métrica propriamente dita. A razão é a presença dossinais negativos em (1.25), que resultam no fato de que dois eventos distintos em R4 podemter distância nula. Note que

ds2 = ηµνdxµdxν =

(dx0)2 − (dx1

)2 − (dx2)2 − (dx3

)2= c2 (dt)

2 −(dx1)2 − (dx2

)2 − (dx3)2

é nulo sempre que

c2 (dt)2

=(dx1)2

+(dx2)2

+(dx3)2,

que é a equação que representa a frente de uma onda que se desloca com velocidade c. Noespaço-tempo de Minkowski, esta equação demarca o cone de luz, ou seja, a região na qualtodos os corpos com velocidade c se deslocam. Todos os pontos no cone de luz estão a umadistância nula com relação à métrica de Minkowski.

12

1.6 A partícula livre relativísticaAção

S = −mcˆ s1

s0

ds, ds2 = ηµνdxµdxν . (1.28)

Variações

δxµ = xµ − xµ, δxµ (s0) = δxµ (s1) = 0. (1.29)

Primeira variação da ação

δS = −mcδˆ s1

s0

ds = −mcˆ s1

s0

δds. (1.30)

De (1.28), temos

δ(ds2)

= δ (ηµνdxµdxν) = δηµνdx

µdxν + ηµνδ (dxµ) dxν + ηµνdxµδ (dxν)

= δηµνdxµdxν + 2ηµνdx

µδ (dxν)

= δηµνdxµ

ds

dxν

ds(ds)

2+ 2ηµν

dxµ

dsdsδ (dxν) uµ = dxµ/ds,

= δηµνuµuν (ds)

2+ 2ηµνu

µdsδ (dxν) .

Por outro lado,

δ(ds2)

= 2dsδ (ds) ,

assim,

2dsδ (ds) = δηµνuµuν (ds)

2+ 2ηµνu

µdsδ (dxν) ,

que torna-se

δ (ds) =1

2δηµνu

µuνds+ ηµνuµδ (dxν) , (1.31)

Com δdxµ = dxµ − dxµ = d (xµ − xµ) = d (δxµ) e integrando por partes,

δ (ds) =1

2δηµνu

µuνds+ ηµνuµδ (dxν)

=1

2δηµνu

µuνds+ ηµνuµd (δxν)

=1

2δηµνu

µuνds− d (ηµνuµ) δxν + d (ηµνu

µδxν) . (1.32)

O termo de diferencial total será nulo quando na integral (1.30), pois torna-se um temo defronteira

ˆ s1

s0

d (ηµνuµδxν) = ηµνu

µδxν |s1s0 = 0,

devido a (1.29). Assim,

δ (ds) =1

2δηµνu

µuνds− d (ηµνuµ) δxν

=1

2δηµνu

µuνds− dηµνuµδxν − ηµνduµδxν

=1

2δηµνu

µuνds− dηµνuµδxν − ηµνduµ

dsdsδxν . (1.33)

13

Temos

δηµν =∂ηµν∂xα

δxα, dηµν =∂ηµν∂xα

dxα. (1.34)

Assim,

δ (ds) =1

2

∂ηµν∂xα

uµuνdsδxα − ∂ηµν∂xα

dxαuµδxν − ηµνduµ

dsdsδxν

=1

2

∂ηµν∂xα

uµuνdsδxα − ∂ηµν∂xα

uαuµdsδxν − ηµνduµ

dsdsδxν

=1

2

∂ηµν∂xα

uµuνdsδxα − ∂ηµα∂xν

uνuµdsδxα − ηµαduµ

dsdsδxα

=

[1

2

∂ηµν∂xα

uµuν − ∂ηµα∂xν

uµuν − ηµαduµ

ds

]dsδxα. (1.35)

Vamos simetrizar o termo

∂ηµα∂xν

uµuν =1

2

∂ηµα∂xν

uµuν +1

2

∂ηνα∂xµ

uµuν .

Assim,

δ (ds) =

[1

2

∂ηµν∂xα

uµuν − 1

2

∂ηµα∂xν

uµuν − 1

2

∂ηνα∂xµ

uµuν − ηµαduµ

ds

]dsδxα

= −[ηµα

duµ

ds+

1

2

(∂ηµα∂xν

+∂ηνα∂xµ

− ∂ηµν∂xα

)uµuν

]dsδxα. (1.36)

Vamos definir os símbolos de Christoffel do primeiro tipo:

γαµν ≡1

2

(∂ηµα∂xν

+∂ηνα∂xµ

− ∂ηµν∂xα

).

Assim,

δ (ds) = −[ηµα

duµ

ds+ γαµνu

µuν]dsδxα. (1.37)

Com (1.37) em (1.30),

δS = −mcˆ s1

s0

δds = mc

ˆ s1

s0

ds

[ηµα

duµ

ds+ γαµνu

µuν]δxα. (1.38)

A condição de extremo δS = 0 resulta em

mcηµαduµ

ds+mcγαµνu

µuν = 0.

Com a métrica inversa à esquerda, temos

0 = mc

(ηλαηαµ

duµ

ds+ ηλαγαµνu

µuν = δλµduµ

ds+ ηλαγαµνu

µuν)

= mc

(duλ

ds+ ηλαγαµνu

µuν).

Vamos definir os símbolos de Christoffel do segundo tipo

Γµαβ ≡ ηµλγλαβ =

1

2ηµλ

(∂ηαλ∂xβ

+∂ηβλ∂xα

− ∂ηαβ∂xλ

). (1.39)

Então, temos como resultado a equação geodésica

mcaµ +mcΓµαβuαuβ = 0, aµ = duµ/ds = d2xµ/ds2. (1.40)

14

Capítulo 2

Transformações infinitesimais

2.1 Transformações infinitesimais em Rn

Vamos supor um espaço euclidiano de n dimensões Rn com um sistema de coordenadasxi

.A forma mais geral de uma transformação contínua em Rn é definida por um conjunto dem + 1 parâmetros (ε, λa), em que a = 1, · · · ,m. Com estes, definimos as transformações nascoordenadas e no tempo,

t→ t = t (ε) , xi → xi (t, λa) = xi (ε, λa) , (2.1)

com as seguintes condições:

1. As funções t (ε) e xi (ε, λa) devem ser analíticas nas variáveis independentes.

2. As transformações devem ser conexas à identidade, ou seja,

(ε, λa)→ 0 =⇒ t→ t e xi (t)→ xi (t) . (2.2)

Se as variáveis transformadas são analíticas, podem ser expandidas em séries de Taylor:

t = t+dt

∣∣∣∣ε=0

ε+O(ε2), (2.3a)

xi = xi +dxi

∣∣∣∣ε,λ=0

ε+dxi

dλa

∣∣∣∣ε,λ=0

λa +O(ε2, λ2

). (2.3b)

Considerando apenas termos de primeira ordem, temos

t = t+dt

∣∣∣∣ε=0

ε, (2.4a)

xi = xi +dxi

dt

dt

∣∣∣∣ε,λ=0

ε+dxi

dλa

∣∣∣∣ε,λ=0

λa (2.4b)

= xi + xidt

∣∣∣∣ε=0

ε+dxi

dλa

∣∣∣∣ε,λ=0

λa (2.4c)

Nestas, definimos

δt ≡ dt

∣∣∣∣ε=0

ε, δxi ≡ dxi

dλa

∣∣∣∣ε,λ=0

λa. (2.5)

Assim,

xi = xi + xiδt+ δxi. (2.6)

15

Neste caso, vemos que a forma final da transformação é dada por

δxi = δxi + δtdxi

dt, (2.7)

com

xi = xi + δxi, t = t+ δt. (2.8)

Portanto, transformações contínuas infinitesimais possuem a mesma forma analítica de pri-meiras variações. Neste caso, variações que dependem de um conjunto de parâmetros contí-nuos.

2.2 Evolução temporalVamos supor a transformação

t = t+ δt, (2.9)

mas que nenhuma transformação seja definida em qi. Ainda assim, (2.9) implica em

xi = xi + δtxi, (2.10)

ou seja,

δxi = δtxi. (2.11)

Se δt = dt, então temos dt = t − t e δxi = dtxi = dxi, que determina a evolução temporal dospontos em Rn em função do tempo.

Desejamos estudar as propriedades de composição de evoluções temporais. Primeiro, daequação (2.10) temos

xi = xi + δtxi = xi + δtd

dtxi =

(1 + δt

d

dt

)xi. (2.12)

Assim, podemos realizar uma evolução temporal ao atuar o operador diferencial

gt ≡ 1 + δtd

dt(2.13)

em xi, ou seja,

xi = gtxi. (2.14)

Sejam gt1 e gt2 dois operadores de evolução temporal. Notemos que

1. A composição de duas evoluções temporais é uma evolução temporal:

xi (t0) → xi (t1)→ xi (t2) = gt2xi (t1) = gt2gt1x

i (t0)

=

(1 + δt2

d

dt

)(1 + δt1

d

dt

)xi (t0) = xi (t0) + δt1

d

dtxi (t0) + δt2

d

dtxi (t0)

+δt2d

dt

(δt1

d

dtxi (t0)

).

O último termo é quadrático em δt, portanto ficamos apenas com os primeiros termos

xi2 = xi0 + δt1d

dtxi0 + δt2

d

dtxi0 = xi0 + (δt1 + δt2) xi0 = xi0 + δtxi0, (2.15)

em que δt = δt1 + δt2.

16

2. A ordem da composição não altera o resultado final:

gt2gt1qi = gt1gt2q

i =⇒ [gt1 , gt2 ] = 0. (2.16)

3. A composição de k evoluções temporais é dada por

Gt =

k∏p=1

gtp = (gt)k

=

(1 + δt

d

dt

)k,

quando todos os δt′s forem iguais. No limite para k →∞, temos

Gt = limk→∞

(1 +

∆t

k

d

dt

)k= exp

[∆t

d

dt

], ∆t = t− t0. (2.17)

Neste caso, dizemos que gt é membro de uma álgebra de Lie, enquanto Gt é membro de umgrupo de Lie. Este processo é conhecido como exponenciação da álgebra da evolução temporal,e dá origem a uma transformação finita, com ∆t finito, e não infinitesimal. Gt é simplesmenteo operador que carrega a evolução temporal de um tempo t0 a t. Em função de (2.16), a álgebraé dita abeliana, ou comutativa.

No argumento da exponencial, há o campo vetorial

Xt =d

dt= qi∂i, (2.18)

que acompanha o termo ∆t. Na forma infinitesimal, temos

gt = 1 + δtXt = 1 + δtqi∂i = 1 + δqi∂i. (2.19)

O campo vetorial Xt é denominado gerador da evolução temporal.

2.3 TranslaçõesVamos supor a transformação

xi (t)→ xi (t) = xi (t) + ai, ai ∈ R. (2.20)

Esta operação é chamada translação, pois translada um ponto a outro de Rn a tempo cons-tante. Neste caso,

δt = 0, δxi = ai. (2.21)

Duas translações resultam em uma translação, ou seja,

xi → xi = xi + ai → xi = xi + bi = xi + ai + bi = qi + ci,

em que

ci = ai + bi.

Portanto, translações também formam um grupo. A natureza do grupo é a mesma da evoluçãotemporal: a ordem da composição não altera a translação total. Dizemos que um grupo cujaordem da composição não importa é um grupo abeliano.

O operador infinitesimal que carrega a operação de translação pode ser deduzido pelaigualdade

xi = xi + ai = xi + aj∂xi

∂xj=

(1 + aj

∂xj

)xi,

17

ou seja,

gx ≡ 1 + ai∂

∂xi= 1 + δxi

∂xi, (2.22)

que tem a mesma forma da evolução temporal, exceto que neste caso, δxi = ai. O operador gxé um elemento da álgebra de translações, que também é abeliana, ou seja,

[gx1 , gx2 ] = 0.

A composição de k translações iguais resulta em

xi =

(1 + δxj

∂xj

)kxi,

que no limite k →∞ torna-se

xi = limk→∞

(1 +

∆xj

k

∂xj

)kxi = exp

[∆xj

∂xj

]xi = Gxx

i, (2.23)

em que

Gx = exp

[∆xj

∂xj

](2.24)

é o elemento do grupo de translações. Os operadores diferenciais

Pi ≡∂

∂xi(2.25)

são os geradores de translações, denominados momentos conjugados.

2.4 RotaçõesO grupo de rotações, por ser um exemplo não abeliano, merece uma atenção especial. Todarotação pode ser descrita pela relação

xi = Rijxj , (2.26)

em que R é uma matriz ortogonal n× n de determinante 1. O grupo de rotações em n dimen-sões é chamado SO (n), o grupo ortogonal especial, que é isomórfico ao espaço das matrizesortogonais de determinante unitário. É uma propriedade das transformações ortogonais apreservação da norma de vetores e da métrica de Rn.

Vamos tomar o exemplo tridimensional, em que consideraremos primeiro uma rotaçãopassiva no eixo z com ângulo θ. A matriz desta transformação é dada por

Rz (θ) =

cos θ − sin θ 0sin θ cos θ 0

0 0 1

. (2.27)

Para θ 1, podemos aproximar esta matriz pela sua forma infinitesimal de primeira ordem

rz (θ) =

1 −θ 0θ 1 00 0 1

=

1 0 00 1 00 0 1

+

0 −θ 0θ 0 00 0 0

≡ 1 + θJz, (2.28)

em que

Jz ≡

0 −1 01 0 00 0 0

. (2.29)

18

Nos outros eixos, temos

rx (θ) = 1 + θJx, ry (θ) = 1 + θJy, (2.30)

em que

Jx ≡

0 0 00 0 −10 1 0

, Jy ≡

0 0 10 0 0−1 0 0

. (2.31)

As matrizes Ja são os geradores de rotações em três dimensões.Uma rotação geral em três dimensões contém três parâmetros independentes, que podem

ser colecionados em um vetor θ ≡ (θ1, θ2, θ3). Na forma infinitesimal, temos

r (θ) = 1 + θ · J = 1 + θaJa = 1 + θ1J1 + θ2J2 + θ3J3. (2.32)

Dizemos que o objeto

W = θaJa =

0 −θ3 θ2

θ3 0 −θ1

−θ2 θ1 0

, (2.33)

é um elemento da álgebra de Lie de SO (3), denotado pelo símbolo so (3). A identidade 1, emconjunto com os geradores Ja, formam uma base para a álgebra so (3). A relação de comutaçãode so (3) é facilmente calculada por

[Ja,Jb] = ε cab Jc, (2.34)

o que caracteriza a álgebra como não abeliana. A exponenciação da álgebra é direta, dada por

R (θa) = exp [−θaJa] . (2.35)

Agora, vamos definir

θ ≡√θ2 = |θ| , u ≡ θ/ |θ| . (2.36)

A forma geral de um elemento do grupo é dada por

R =

c+ (1− c)u1u1 (1− c)u1u2 − su3 (1− c)u1u3 − su2

(1− c)u1u2 − su3 c+ (1− c)u2u2 (1− c)u2u3 − su1

(1− c)u1u3 − su2 (1− c)u2u3 − su1 c+ (1− c)u3u3

, (2.37)

em que

c ≡ cos θ, s ≡ sin θ. (2.38)

Em componentes, temos

Rij = δij − εijkuk sin θ +(uiuj − δij

)(1− cos θ) (2.39)

Vamos atuar a matriz R no vetor u:

Rijuj =

[δij − εijkuk sin θ +

(uiuj − δij

)(1− cos θ)

]uj

= δijuj − εijkukuj sin θ +

(uiuju

j − δijuj)

(1− cos θ)

= ui − εijkukuj sin θ +(uiuju

j − δijuj)

(1− cos θ)

= ui +(u2 − 1

)ui (1− cos θ) = (1)ui,

ou seja, u é um autovetor de R cujo autovalor é 1. Este é o denominado eixo de rotação.

19

Quando atua em um vetor posição x, temos

Rijxj = xi − εijkukxj sin θ +

(uiujx

j − xi)

(1− cos θ)

= xi − εijkukxj sin θ + uiujxj − uiujxj cos θ − xi + xi cos θ

= −εijkukxj sin θ + uiujxj − uiujxj cos θ + xi cos θ

= (u× x)isin θ + ui (u · x) +

[xi − ui (u · x)

]cos θ.

Nesta equação,(x‖)i≡ ui (u · x)

é a componente de x paralela a u e(x⊥)i ≡ xi − ui (u · x)

é sua componente ortogonal. Assim,

Rx = x‖ + x⊥ cos θ + (u× x) sin θ.

Agora, vamos voltar ao espaço Rn. Uma rotação finita é descrita por

xi = Rijxj ,

enquanto a infinitesimal tem forma

xi (ω) = xi + δxi (ω) = xi +1

2

∂xi

∂ωab

∣∣∣∣ω=0

δωab, (2.40)

em que ωab são as componentes de uma matriz n × n antissimétrica, com m =(n2 − n

)/2

componentes independentes. Dizemos que m é o número de parâmetros independentes ne-cessários para parametrizar a transformação infinitesimal, que deve ter a forma

xi (ω) = xi + δωijxj . (2.41)

Neste caso,

δxi =1

2

∂xi

∂ωab

∣∣∣∣ω=0

δωab =1

2

∂xi

∂ωab∂xj

∣∣∣∣ω=0

xjδωab, considerando linearidade em x.

Assim, definimos

(Jab)ij ≡

∂xi

∂ωab∂xj

∣∣∣∣ω=0

, (2.42)

de modo que

1

2(Jab)

ij x

jδωab =1

2

∂xi

∂ωab∂xj

∣∣∣∣ω=0

xjδωab = xjδωij . (2.43)

A solução para a equação anterior é dada por

(Jab)ij ≡ δajδ

ib − δbjδia. (2.44)

A relação destes objetos com os geradores Ja é dada por

(Ja)ij =

1

2ε bca (Jbc)

ij , (2.45)

e, assim,

(Ja)ij = −εaij . (2.46)

Dizemos que os geradores na forma (2.46) estão na representação adjunta do grupo de rota-ções, pois são representados por matrizes que possuem a mesma dimensão do grupo.

20

Capítulo 3

A geometria de Minkowski

3.1 Vetores e covetores de LorentzAgora, vamos considerar um espaço-tempo de MinkowskiM4 com um sistema de coordenadascartesiano xµ. Como vimos, este espaço é caracterizado pela métrica

ds2 = ηµνdxµdxν =

(dx0)2 − (dx1

)2 − (dx2)2 − (dx3

)2. (3.1)

Uma transformação de Lorentz é dada por uma matriz Λ na forma

x = Λx ←→ xµ = Λµνxν . (3.2)

A métrica deve ser preservada por transformações de Lorentz.

Definição 1. Um vetor de Lorentz, ou vetor de Lorentz contravariante, con-siste em um objeto u = uµ∂µ = uµ (∂/∂xµ) invariante por transformações de Lorentz,ou seja,

x = Λx =⇒ u (x) = u (x) .

Note que, dado (3.2),

∂µ =∂

∂xµ=∂xν

∂xµ∂

∂xν=

∂xνΛνµ = Λνµ∂ν .

Se a matriz Λ tem uma inversa Λ−1, então multiplicamos a expressão anterior por Λ−1:(Λ−1

)µλ∂µ =

(Λ−1

)µλ

Λνµ∂ν = Λνµ(Λ−1

)µλ∂ν = δνλ∂ν ,

ou seja,

∂µ =(Λ−1

)νµ∂ν . (3.3)

Aplicando-se a invariância em u, temos

u = uµ∂µ = uµΛνµ∂ν = uν ∂ν .

Portanto,

uµ = Λµνuν . (3.4)

21

Assim, se um vetor u = uµ∂µ é invariante de Lorentz, suas componentes se transformamcom a mesma forma do sistema de coordenadas. Dizemos que componentes de vetores que setransformam como (3.4) transformam-se contravariantemente.

A métrica (3.1) naturalmente implica em uma métrica para os vetores de Lorentz, de modoque o produto escalar é dado por

u · v = ηµνuµvν . (3.5)

Se a métrica é invariante, este produto também o é. Neste caso, u · v = u · v e

u · v = ηµν uµuν = ηµνΛµαu

αΛνβuβ =

(ηµνΛµαΛνβ

)uαuβ = ηαβu

αuβ .

Assim,

ηαβ = ΛµαηµνΛνβ =(ΛT) µαηµνΛνβ

e

ηµν =((

Λ−1)T) α

µηαβ

(Λ−1

)βν. (3.6)

Em notação matricial,

η =(Λ−1

)Tη(Λ−1

). (3.7)

Definição 2. Todo vetor de Lorentz u possui um dual uT , denominado covetor,ou vetor de Lorentz covariante. Este objeto é um funcional linear, ou seja, age emvetores e resulta em um escalar real tendo como regra o produto escalar, de modoque

uT [u] ≡ u2 = ηµνuµuν . (3.8)

A regra (3.8) define um isomorfismo entre vetores e covetores, de modo que uma base ∂µde vetores induz uma base para os covetores. Esta base é naturalmente tomada como asdiferenciais dxµ, e toda 1-forma α pode ser escrita como α = αµdx

µ. Cada elemento da baseé um covetor que, ao agir sobre um elemento da base de vetores, resulta na operação

dxµ [∂ν ] = δµν . (3.9)

Portanto, a ação de um covetor α em um vetor u é dada por

α [u] = αµdxµ [uν∂ν ] = αµu

νdxµ [∂ν ] = αµuνδµν = αµu

µ.

Da mesma forma,

uT [u] = uµdxµ [uν∂ν ] = uµu

νdxµ [∂ν ] = uµuµ = ηµνu

µuν .

Então,

uµ = ηµνuν , (3.10)

ou seja, a métrica é a matriz jacobiana do isomorfismo entre vetores e covetores. Dizemos as-sim que a métrica "baixa" índices de componentes de vetores e os transforma em componentesde covetores.

22

Seja η−1 a inversa da matriz métrica, de modo que suas componentes sejam dadas por ηµν ,de modo que ηµληλν = δµν . Podemos mostrar que

uµ = ηµνuν , (3.11)

ou seja, a métrica inversa "levanta" índices de componentes de covetores, transformando-osem componentes contravariantes.

Covetores também são invariantes por transformações de Lorentz, ou seja,

x = Λx =⇒ α (x) = α (x) .

Então,

uT [u] = uµuµ = uµΛµνu

ν = uνuν ,

de modo que uν = uµΛµν , ou,

uµ = uν(Λ−1

)νµ. (3.12)

Assim, componentes de covetores se transformam com a inversa da transformação. Dizemosque esta transformação é covariante.

3.2 Tensores

Definição 3. Um tensor do tipo (p, q) é um objeto geométrico invariante de Lo-rentz com a forma

T = Tµν···λαβ···γ

p vezes︷ ︸︸ ︷(∂µ∂ν · · · ∂λ)

(dxαdxβ · · · dxγ

)︸ ︷︷ ︸q vezes

. (3.13)

As leis de transformação das componentes de base são dadas por

∂µ =(Λ−1

)νµ∂ν , trans. covariante,

dxµ = Λµνdxµ, trans. contravariante.

Portanto,

T δε···ρτψ···φ =(Λ−1

) α

τ

(Λ−1

) β

ψ· · ·(Λ−1

) γ

φ︸ ︷︷ ︸q trans. covariantes

Tµν···λαβ···γ

p trans. contravariantes︷ ︸︸ ︷ΛδµΛεν · · ·Λ

ρλ . (3.14)

Por exemplo, a métrica é um tensor do tipo (0, 2) ds2 = ηµνdxµdxν . Então, suas componentes

se transformam por

ηµν =(Λ−1

) αµ

(Λ−1

) βνηαβ .

23

3.3 Ortogonalidade e os grupos de Lorentz e PoincaréA invariância do produto escalar resulta na expressão

ηαβ = ΛµαηµνΛνβ =(ΛT) µαηµνΛνβ .

Se η é a métrica de Minkowski, temos

δαβ = Λ αµ δ

µνΛνβ = Λ α

µ Λµβ =(ΛT)αµ

Λµβ ,

ou seja,

ΛTΛ = 1 ⇐⇒ Λ−1 = ΛT . (3.15)

Portanto, transformações de Lorentz são ortogonais.Tomando-se o determinante de (3.15), obtemos

det(ΛTΛ

)= 1 =⇒ (det Λ)

2= 1,

ou seja,

det Λ = ±1. (3.16)

Definição 4. O grupo de Lorentz é definido pelo conjunto de transformações li-neares ortogonais que preserva a métrica de Minkowski.

O sinal do determinante define se a transformação é conexa à identidade ou à anti-identidade. Por enquanto, estamos interessados em transformação conexas à identidade,pois elas deixam invariante a orientação do sistema de coordenadas local xµ. A dimensãodeste conjunto de transformações é 4 (quatro), de modo que este é isomórfico ao conjunto dasmatrizes ortogonais 4 × 4 de determinante unitário. Este conjunto forma um grupo com aoperação de multiplicação matricial, denominado SO (1, 3).

O grupo de Lorentz SO (1, 3) é, portanto, o grupo de pseudo-rotações emM4. A denomina-ção entre parênteses caracteriza o fato de que um elemento do grupo é uma pseudo-rotação:(1, 3) indica que a direção temporal x0 é diferente das 3 direções espaciais. Neste caso, dize-mos que SO (1, 3) é um grupo pseudo-ortogonal, e é obviamente distinto do grupo de rotaçõesem quatro dimensões SO (4). Este último consiste no grupo que deixa invariante uma métricaeuclidiana em R4.

O grupo de Poincaré é o grupo que inclui pseudo-rotações e translações e, como vimos,constitui um grupo de dimensão 5. É possível mostrar que um espaço invariante por um grupoortogonal também é invariante pelo seu respectivo grupo inomogêneo, que inclui translações.Este grupo também é chamado grupo de Lorentz inomogêneo ISO (1, 3).

3.4 Álgebra de LorentzVamos nos ater ao grupo de Lorentz por enquanto. Este grupo é um grupo de Lie, ou seja,possui uma estrutura diferenciável. Na prática, isto significa que toda transformação deLorentz pode ser "expandida em série de Taylor" ao redor da identidade do grupo:

Λ = 1 +∂Λ

∂εa

∣∣∣∣ε=0

δεa +1

2

∂2Λ

∂εa∂εb

∣∣∣∣ε=0

δεaδεb + · · · ,

em que εa é um conjunto de parâmetros linearmente independentes que caracteriza umarepresentação do grupo. Se o grupo age em vetores e covetores, por exemplo, estes parâmetros

24

serão em número seis, mas podem ser colocados sob a forma de uma matriz 4×4 antissimétricade traço nulo.

Se tomarmos a expansão até o termo de ordem 1, temos

gΛ ≡ 1 +∂Λ

∂εa

∣∣∣∣ δεa = 1 + εaJa. (3.17)

Esta é a forma geral de um elemento da álgebra de Lie de SO (1, 3), que denominados aálgebra so (1, 3). Ja formam um conjunto de operadores também linearmente independentes,que são os geradores da álgebra. A forma explícita de Ja depende do objeto geométrico noqual o grupo atua, portanto, de sua representação. Por enquanto, vamos supor que Λ sejauma matriz real.

Se o grupo é ortogonal, temos

ΛTΛ = 1 =⇒ (gΛ)TgΛ = 1.

Assim,

1 = (1 + εaJa)T (

1 + εbJb)

= 1 + εaJa + (εaJa)T,

ou seja,

εaJa = − (εaJa)T.

Se εa são parâmetros reais, temos

Ja = −JTa , (3.18)

ou seja, os operadores Ja são antissimétricos. Por outro lado, é fácil verificar que se det Λ = 1,det Ja = 0.

Por outro lado, consideremos W = εaJa. Temos

η = ΛT ηΛ =(1 +WT

)η (1 +W ) ,

que resulta em

η = η + ηW +WT η

em primeira ordem. Se Λ preserva a métrica, η = η e então,

ηW +WT η = 0,

ou

WT = −ηWη−1. (3.19)

Vamos tomar o traço desta expressão:

trWT = tr[−ηWη−1

]= −tr

[ηWη−1

]= −tr

[η−1ηW

]= −trW.

Contudo, trWT = trW , então devemos ter que trW = 0.Portanto, cada elemento do grupo de Lorentz SO (1, 3) é conectado a um elemento da álge-

bra so (1, 3), que formam o conjunto das matrizes antissimétricas de traço nulo com base noespaço de Minkowski. A relação álgebra-grupo de Lie se dá através da operação de exponen-ciação da álgebra: Se W é um elemento genérico da álgebra de Lie, seu respectivo elementode grupo é dado por

Λ = exp (W ) . (3.20)

25

3.5 A representação adjuntaUma representação pode ser compreendida intuitivamente como uma realização de um grupoabstrato através de um grupo matricial. Quando atuamos um elemento do grupo de Lorentzem um vetor de Lorentz, por exemplo, os geradores J são realizados por um conjunto dematrizes Jab de elementos (Jab)

µν , com a, b = 1, 2, 3, 4. Neste caso, um elemento da álgebra é

dado por

gΛ = 1 + ωabJab, (3.21)

em que ωab forma uma matriz antissimétrica de traço nulo nos índices ab. Eles são, portanto,seis parâmetros independentes.

O grupo SO (1, 3) é um subgrupo de GL (1, 3), ou seja, é um subgrupo de todas as matrizes4 × 4 de determinante não nulo. O grupo GL (1, 3) forma um espaço vetorial, cuja base maissimples consiste no conjunto de matrizes

(∆ab)µν = δµaηbν . (3.22)

Por exemplo,

∆11 =

1 0 0 00 0 0 00 0 0 00 0 0 0

, ∆12 =

0 −1 0 00 0 0 00 0 0 00 0 0 0

, ∆13 =

0 0 −1 00 0 0 00 0 0 00 0 0 0

, · · · .

Toda matriz de GL (1, 3) pode ser escrita por

A = Aab∆ab. (3.23)

Esta base, denominada base canônica, é completa e linearmente independente. De fato, nestabase uma matriz tem componentes iguais ao seus elementos, ou seja, Aab = Aµν .

Vamos tomar a multiplicação matricial ∆ab∆dc

(∆ab)µλ (∆cd)

λν = δµaηbλδ

λc ηdν = ηbcδ

µa δdν = ηbc (∆ad)

µν .

O colchete de Lie é dado por[(∆ab)

µλ , (∆cd)

λν

]= (∆ab)

µλ (∆cd)

λν − (∆cd)

µλ (∆ab)

λν ,

que resulta em[(∆ab)

µλ , (∆cd)

λν

]=[δeaηbcδ

fd − δ

ecηdaδ

fb

](∆ef )

µν .

Portanto, a álgebra é caracterizada pelos colchetes

[∆ab,∆cd] = C(ef)

(ab)(cd) ∆ef , (3.24)

com constantes de estrutura

C(ef)

(ab)(cd) = δeaηbcδfd − δ

ecηdaδ

fb . (3.25)

Portanto, de (3.24) vemos que gl (1, 3) é uma álgebra de Lie não abeliana.Note que as matrizes

Jab = ∆ab −∆ba (3.26)

são antissimétricas, possuem traço nulo e são linearmente independentes. Neste caso, elasformam uma base para um subespaço de matrizes: são os geradores da álgebra so (1, 3). Suascomponentes são dadas por

(Jab)µν = δµaηbν − δ

µb ηaν . (3.27)

26

Note que

[Jab, Jcd] = [∆ab −∆ba,∆cd −∆dc] = [∆ab,∆cd]− [∆ab,∆dc]− [∆ba,∆cd] + [∆ba,∆dc]

=(C

(ef)(ab)(cd) − C (ef)

(ab)(dc) − C (ef)(ba)(cd) + C

(ef)(ba)(dc)

)∆ef(

δeaηbcδfd − δ

ecηdaδ

fb − δ

eaηbdδ

fc + δedηcaδ

fb

)∆ef

+(−δebηacδ

fd + δecηdbδ

fa + δebηadδ

fc − δedηcbδfa

)∆ef

=(δeaηbcδ

fd − δ

edηcbδ

fa + δebηadδ

fc − δecηdaδ

fb

)∆ef

+(

+δedηcaδfb − δ

ebηacδ

fd + δecηdbδ

fa − δeaηbdδfc

)∆ef

=(δeaηbcδ

fd − δ

faηbcδ

ed

)∆ef +

(δebηadδ

fc − δecηdaδ

fb

)∆ef

+(δedηcaδ

fb − δ

ebηacδ

fd

)∆ef +

(δecηdbδ

fa − δeaηbdδfc

)∆ef

= δeaηbcδfd (∆ef −∆fe) + δebηadδ

fc (∆ef −∆fe)

+δedηcaδfb (∆ef −∆fe) + δecηdbδ

fa (∆ef −∆fe) .

Com (3.26) temos

[Jab, Jcd] =(δeaηbcδ

fd + δebηadδ

fc + δedηcaδ

fb + δecηdbδ

fa

)Jef

=(δebηadδ

fc + δeaηbcδ

fd − δ

eaηbdδ

fc − δebηacδ

fd

)Jef

= f(ef)

(ab)(cd) Jef , (3.28)

em que as constantes de estrutura são

f(ef)

(ab)(cd) = δebηadδfc + δeaηbcδ

fd − δ

eaηbdδ

fc − δebηacδ

fd . (3.29)

Em forma explícita, temos a álgebra

[Jab, Jcd] = ηadJbc + ηbcJad − ηdbJac − ηacJbd. (3.30)

Definição 5. A realização de uma álgebra e seu respectivo grupo de Lie abstratoscomo uma álgebra e grupo de Lie matricial é denominada representação.

Definição 6. A representação na qual os geradores da álgebra possuem a mesmadimensão dos elementos do grupo é denominada representação adjunta.

Neste caso, os geradores Jab, definidos por (3.26) e (3.27), da álgebra de pseudo-rotações emquatro dimensões são os geradores da representação adjunta deste grupo. A representaçãoadjunta também é chamada, em física, de representação vetorial, porque esta representaçãorealiza o grupo de pseudo-rotações em vetores deM4.

27

3.6 InvariantesUma álgebra de Lie é um espaço vetorial com uma base completa Ja, o conjunto de gera-dores da álgebra. Neste caso, podemos definir um produto interno. Sejam dois elementosA = AaJa e B = BaJa da álgebra, temos

A ·B ≡ tr(AaBbJaJb

)=

1

2

(AaBb +AbBa

)tr (JaJb) ≡ γabAaBb. (3.31)

Nesta expressão,

tr (JaJb) = (JaJb)µµ = (Ja)

µν (Jb)

νµ .

Os objetos

γab ≡1

2tr (JaJb) (3.32)

são componentes da denominada métrica de Killing. Se a métrica de Killing tem sinal definidoe é não degenerada, ela define um bom produto interno. Neste caso, uma álgebra de Lie étambém um espaço de Hilbert.

Elementos do grupo de Lie podem agir em elementos da álgebra. Por exemplo, uma rota-ção em R3 age sobre um gerador Ja na forma

Ja −→ R−1JaR.

Neste caso,

tr (JaJb) −→ tr(R−1JaRR

−1JbR)

= tr(R−1JaJbR

)= tr

(RR−1JaJb

)= tr (JaJb) ,

ou seja, a métrica de Killing é invariante por rotações:

R−1γabR = γab. (3.33)

Tratando-se de transformações infinitesimais, R = 1 + ωaJa,

R−1γR =(1 + ωaJTa

)γ(1 + ωbJb

)= γ + ωaγJa + ωaJTa γ + ωaωbJTa γJb

≈ γ + ωa(γJa + JTa γ

)= γ,

portanto,

γJa + JTa γ = γJa − Jaγ = [γ,Ja] = 0. (3.34)

A métrica de Killing, então, comuta com os geradores.Neste caso, todo escalar construído com a métrica de Killing é um invariante. Contudo, em

um sistema dinâmico de dimensão finita, somente um número finito desses invariantes sãolinearmente independentes. No caso de rotações em três dimensões, há apenas um invariante

J2 = γabJaJb, (3.35)

que é o quadrado do momento angular. Este tipo de invariante é denominado invariante deCasimir da álgebra. Para cada representação do grupo de rotações, o problema de autovalores

J2uj = αjuj

indica um espectro de autovalores de J2. Como J2 é um invariante, o espectro também éinvariante. No caso do momento angular, é sempre possível escrever

J2uj = j (j + 1)uj . (3.36)

28

Neste caso, dizemos que j é o spin da representação. É fácil verificar para o grupo de rotaçõesque, na representação adjunta, j = 1 quando os autovetores são vetores euclidianos.

Para grupos de álgebras de Lie mais gerais, é possível encontrar outros invariantes deCasimir, cada um deles uma forma multilinear invariante, como (3.35). O número maximalde invariantes independentes é denominado rank da álgebra de Lie. O grupo de rotações temrank 1: apenas J2 é invariante. Em uma determinada representação, os autovalores des-ses operadores de Casimir também são invariantes pela ação do grupo, portanto o espectroé invariante. O resultado é que uma representação é completamente determinada pelos es-pectros dos operadores de Casimir do grupo, então as quantidades físicas relevantes quandohá uma simetria sob determinado grupo de Lie são dadas pelos objetos geométricos que sãoautovetores simultâneos dos operadores de Casimir.

29

Capítulo 4

O formalismo lagrangiano paracampos

4.1 IntroduçãoAgora, vamos nos voltar à análise do problema variacional de se encontrar condições necessá-rias e suficientes para que uma dada integral fundamental tome um valor extremo (máximoou mínimo) local. Este problema variacional é comum em diversas áreas da física e da ma-temática que compartilham de quantidades geométricas que assumam, por requerimentosfísicos ou puramente matemáticos, um valor máximo ou mínimo. Por exemplo, o problemavariacional que descreve fenômenos da ótica geométrica consiste em encontrar a trajetóriado raio de luz para a qual o tempo de propagação seja mínimo (princípio de Fermat). A dinâ-mica de partículas relativísticas, como outro exemplo, refere-se ao problema de se encontrartrajetórias no espaço-tempo que maximizem o tempo próprio.

Problemas variacionais na mecânica clássica [12, 13], disciplina na qual o cálculo vari-acional encontrou seu maior terreno de desenvolvimento, precisam ser definidos com baseem espaços não tão facilmente intuídos. Um sistema físico neste cenário é descrito por umatrajetória em um espaço de configuração Qn formado por suas coordenadas generalizadas qa,em que a = 1, . . . , n e n indica a dimensão de Qn. Tal trajetória é definida pelas equaçõesparamétricas

γ : qa = qa (t) , (4.1)

em que t é um parâmetro relacionado univocamente com o tempo. O problema variacionalconsiste em encontrar condições necessárias e suficientes para que a integral fundamental

A [γ] ≡ˆ t1

t0

L (t, qa, qa) dt, (4.2)

em que qa ≡ dqa/dt, assuma um valor extremo sobre C, fornecida uma função LagrangianaL que dependa do tempo, das coordenadas e de suas velocidades. Neste caso, precisamos queas funções qa (t) sejam pelo menos de classe C2. Este problema variacional recebe o nome deprincípio de Hamilton quando a primeira variação das coordenadas generalizadas em t = t0 et = t1 é nula. A aplicação direta do princípio de Hamilton leva às equações de Euler-Lagrange

d

dt

∂L

∂qa− ∂L

∂qa= 0, (4.3)

que são as equações diferenciais que ditam a dinâmica da teoria.O caráter do tempo como parâmetro de evolução nessas teorias é bastante especial. Em

primeiro lugar, é um parâmetro de evolução único: a integral (4.2) é uma integral simples e assoluções das equações (4.3), se existirem, são famílias de curvas de 1-parâmetro que depen-dem de um conjunto de condições iniciais. Em segundo lugar, embora seja sempre possível

31

um processo de reparametrização, a integral fundamental não é independente da escolha doparâmetro. Por isso, as equações de Euler-Lagrange não são apenas equações que descrevemuma dada geometria no espaço de configuração, mas possuem também a interpretação deequações que caracterizam um sistema dinâmico finito.

Por causa do papel especial do tempo, o formalismo Hamiltoniano pode ser naturalmenteintroduzido e a mecânica clássica pode ser analisada através do espaço de fase T ∗Qn, ondeas equações de movimento tomam a forma de um conjunto de equações de primeira ordem.No espaço de fase há a introdução de uma estrutura simplética natural, através da qual épossível conhecer a forma da evolução de qualquer observável físico sem a necessidade daresolução das equações de movimento. Além disso, as propriedades geométricas do espaçode fase permitem que o efeito de transformações sobre observáveis sejam imediatamente re-conhecidos, independentemente da dinâmica específica da teoria. Dentre as transformaçõesmais importantes estão as transformações canônicas, que preservam o elemento de volumedo espaço de fase. A importância desse formalismo canônico para a física não pode ser subes-timada, visto que a mesma estrutura formal está presente também na mecânica quântica.

O cálculo variacional para a mecânica clássica envolve também os teoremas de Noether,que dizem respeito a identidades obedecidas quando a integral fundamental (4.2) é invariantepor alguma classe de transformações, assim como o formalismo de Hamilton-Jacobi.

O mesmo quadro para teorias de campos não pode ser traçado tão naturalmente. Comoveremos, campos são sistemas que dependem de um conjunto de parâmetros, geralmenteidentificados com as coordenadas cartesianas do espaço-tempo. A integral fundamental quecaracteriza o problema variacional, análoga à integral (4.2), é uma integral múltipla. Alémdisso, os sistemas em campos mais importantes na física são invariantes por reparametri-zações. Essas características fazem desses sistemas essencialmente distintos dos sistemasclássicos, nos quais o tempo tem um papel privilegiado. Em especial, não há uma forma únicade dinâmica Hamiltoniana e, tampouco, um único formalismo de Hamilton-Jacobi possível.Outro aspecto das teorias de campos mais importantes para a física são as simetrias de gauge,que são características de sistemas singulares.

4.2 VariaçõesUm campo pode ser descrito por um conjunto de n funções φi (x), em que x representa umponto no espaço-tempo de 4 dimensões, localmente descrito por um sistema de coordenadasxµ =

(x0, x1, x2, x3

)em um dado volume Ω. Todas as nossas considerações serão restritas ao

sistema contido nesse volume. O índice i varia de 1 a n. Vamos trabalhar em um espaço deconfiguração construído da seguinte forma. Os campos φ são coordenadas de uma variedadeQn de dimensão n. Em conjunto com essa variedade, definimos também um espaço para osparâmetros, R4. O espaço de configuração vem a ser o produto direto definido por Q ≡ Qn×R4,de modo que o volume Ω, o qual será tratado também como o domínio dos campos φ, estejaimerso em Q.

Vamos supor que os campos sejam funções de classe C∞, de modo que podemos definirtodas as suas derivadas

φiµ ≡dφi

dxµ≡ ∂µφi, φiµν ≡ ∂µ∂νφi, . . . . (4.4)

Uma configuração φ dos campos é definida como os valores dos campos e de suas derivadasprimeiras, ou velocidades, em cada ponto do espaço-tempo:

φ :φi (x) , φiµ (x)

, ∀x ∈ R4. (4.5)

Consideremos, agora, a existência de uma densidade Lagrangiana L(xµ, φi, φiµ

), contendo

derivadas dos campos até primeira ordem. Com essa densidade Lagrangiana definimos aação

A [φ] ≡ˆ

Ω

L(xµ, φi, φiµ

)dω, (4.6)

32

em que usamos a notação dω ≡ dx0dx1dx2dx3.Para definir o problema variacional, vamos considerar uma transformação ativa no espaço

de configuração, que pode ser imaginada como um arraste suave dos campos e dos parâmetros.Existe uma configuração física φ (x), que será arrastada suavemente para uma configuraçãoφ′ (y), de modo que a topologia e geometria do espaço de configuração e, consequentementedo espaço de Minkowski, seja preservada. Isto significa que não serão permitidas transfor-mações que envolvam "colar" e "furar" o espaço-tempo, nem transformações que mudem amétrica de Minkowski. A configuração física φ (x) deve ser um extremo da integral funda-mental.

Para realizar esta transformação, vamos fazer da configuração φi um membro de umafamília de configurações de 1-parâmetro, definida por

φ (u) :φi = φi (xµ, u) ; φiµ = φiµ (xµ, u) ; · · ·

, (4.7)

pelo menos de classe C2 em u. Se uma dada configuração φ (u0) é um extremo da integralfundamental (4.6), correspondendo à configuração física do sistema, A (u0) deve ser menor (oumaior) que um valorA (u) calculado em uma configuração φ (u), pertencente a uma vizinhançafechada |u− u0| de φ (u0). Supondo |u− u0| um número muito pequeno, desprezando termosde ordem maior ou igual a |u− u0|2, a expansão de φ (u) em série de Taylor ao redor daconfiguração φ (u0) pode ser escrita por

φi (xα, u) ≈ φi (xα, u0) +dφi (xα, u)

du

∣∣∣∣u=u0

δu, (4.8)

e assim também para as derivadas dos campos, em que δu ≡ u − u0. Esta é a fórmula deprimeira ordem para a comparação entre duas configurações φ (u0) e φ (u) para um conjuntofixo de parâmetros xµ. Ela nos permite definir a primeira variação dos campos a ponto fixo,dada pela expressão

δφi ≡ φi (xµ, u)− φi (xµ, u0) =dφi

du

∣∣∣∣u=u0

δu. (4.9)

A mesma expressão é válida para as derivadas. Por exemplo, temos a primeira variação deφaµ:

δφiµ ≡ φiµ (xα, u)− φiµ (xα, u0) =dφiµdu

∣∣∣∣∣u=u0

δu

=d2φi

dxµdu

∣∣∣∣u=u0

δu =d

dxµdφi

du

∣∣∣∣u=u0

δu =d

dxµ(δφi).

Na expressão acima, usamos a derivada total definida por

d

dxα≡ ∂

∂xα+

ˆΩ

dωx

[φiα (x)

δ

δφi (x)+ φiµα (x)

δ

δφiµ (x)+ φiµνα (x)

δ

δφiµν (x)+ · · ·

]. (4.10)

A integral que aparece na expressão acima atende ao fato de que campos são, de forma ri-gorosa, tratados como distribuições do espaço-tempo: as derivadas com relação aos campossão derivadas funcionais e não simples derivadas parciais. Por essa razão usamos o símboloδF (x) /δφ (y) para caracterizar a derivada funcional de uma função F (x), aplicada em umponto x do volume Ω, com relação a uma função φ (y), aplicada em um ponto y do mesmodomínio. A relação mais fundamental vem a ser

δφi (x)

δφj (y)= δijδ

4 (x− y) , (4.11)

em que temos a delta de Dirac de dimensão 4:

δ4 (x− y) =

0 se x 6= y,

∞ se x = y.,

ˆM4

δ4 (x− y) d4x = 1. (4.12)

33

No geral podemos ignorar a escrita das integrais, de modo a não sobrecarregar a notação,o que faremos em boa parte do trabalho. Contudo, quando somas em derivadas funcionaisaparecem, integrais geralmente as acompanham e devemos ficar atentos a este fato. Porexemplo, usaremos repetidamente expressões do tipo φiµ

[δL/δφi

], com L sendo a densidade

Lagrangiana, que devem ser lidas comoˆ

Ω

dωx

[φiµ (x)

δL (y)

δφi (x)

]. (4.13)

A primeira variação (4.9), portanto, é o termo de primeira ordem da comparação entreduas configurações infinitesimalmente próximas, mantendo fixos o conjunto de parâmetrosxµ e, portanto, o domínio Ω. Podemos generalizar este argumento e considerar também acomparação com configurações que variem os parâmetros. Basta considerarmos

φ′ (u) :φ′i = φ′i (yµ, u) ; φ′iµ = φ′iµ (yµ, u)

, (4.14)

em que os parâmetros yµ representam coordenadas de um volume Ω′ do espaço-tempo. Pode-mos escolher esta configuração de modo que yµ = xµ para u = u0 e, assim, ambos os conjuntosestão relacionados pela equação

yµ = yµ (xν , u) ≈ yµ +dyµ

du

∣∣∣∣u=u0

δu, (4.15)

em que, por último, tomamos a expansão até primeira ordem em δu.Com a variação dos parâmetros, temos a primeira variação total

φ′i (yµ, u) ≈ φi (yµ, u0) +dφi (yµ, u)

du

∣∣∣∣u=u0

δu+dφi (yµ, u)

dyβdyβ

du

∣∣∣∣u=u0

δu

= φi (xµ, u0) + δφi +(φaβ)u=u0

δxβ ,

ou seja,

δφi ≡ δφi + φiβδxβ , (4.16)

em que

δxβ ≡ dyβ

du

∣∣∣∣u=u0

δu. (4.17)

4.3 A primeira variação da açãoVamos escrever a integral fundamental para a configuração φ (u0):

A (u0) =

ˆΩ

L(xµ, φi, φaµ

)dω, (4.18)

assim como para a configuração φ′ (u):

A (u) =

ˆΩ′L(yµ, φ′a, φ′aµ

)dω′, (4.19)

em que dω′ ≡ dy0dy1 . . . dyd. A primeira variação total da ação é definida por

δA ≡ A (u)−A (u0) ≈ dA (u)

du

∣∣∣∣u=u0

δu. (4.20)

O operador

δ ≡ δu d

du(4.21)

34

é um operador diferencial de primeira ordem, que obedece às propriedades de uma derivadaordinária: é linear e obedece à regra de Leibniz. Neste caso, vamos calcular

δA = δ

[ˆΩ

L(xµ, φi, φaµ

)dω

]=

ˆΩ

(δLdω + Lδdω) . (4.22)

A variação total atua sobre o elemento de volume na seguinte forma:

δ (dω) = dω′ − dω = det

(dyµ

dxν

)dω − dω =

[det

(dyµ

dxν

)− 1

]dω.

Note que yµ = xµ + δxµ, então

dyµ

dxν= δµν +

d (δxµ)

dxν.

O determinante é dado por

det

(dyµ

dxν

)= det

1 +

d(δx0)dx0

d(δx0)dx1

d(δx0)dx2

d(δx0)dx3

d(δx1)dx0 1 +

d(δx1)dx1

d(δx1)dx2

d(δx1)dx3

d(δx2)dx0

d(δx2)dx1 1 +

d(δx2)dx2

d(δx2)dx3

d(δx3)dx0

d(δx3)dx1

d(δx3)dx2 1 +

d(δx3)dx3

.

É fácil verificar que, em primeira ordem, o determinante é aproximado por

det

(dyµ

dxν

)= 1 +

d (δxµ)

dxµ. (4.23)

Então,

δ (dω) =

[1 +

d (δxµ)

dxµ− 1

]dω =

d (δxµ)

dxµdω. (4.24)

Na integral, temos

δA =

ˆΩ

(δLdω + Lδdω) =

ˆΩ

(δL+ L

d (δxµ)

dxµ

)dω.

Note que

Ld (δxµ)

dxµ=

d

dxµ(Lδxµ)− δxµ dL

dxµ,

e, neste caso,

δA =

ˆΩ

(δL+

d

dxµ(Lδxµ)− δxµ dL

dxµ

)dω

=

ˆΩ

(δL− δxµ dL

dxµ

)dω +

ˆΩ

dωd

dxµ(Lδxµ) ,

ou,

δA =

ˆΩ

δLdω +

ˆΩ

dωd

dxµ(Lδxµ) , (4.25)

em que

δL = δL− δxµ dLdxµ

. (4.26)

35

Primeiro, vamos calcular

δL = δudL

du= δxµ

∂L

∂xµ+ δφi

δL

δφi+ δφiµ

δL

δφiµ. (4.27)

Por outro lado,

δxµdL

dxµ= δxµ

(∂L

∂xµ+ φiµ

δL

δφi+ φiµν

δL

δφiν

), (4.28)

de modo que

δL = δL− δxµ dLdxµ

= δxµ∂L

∂xµ+ δφi

δL

δφi+ δφiµ

δL

δφiµ− δxµ

(∂L

∂xµ+ φiµ

δL

δφi+ φiµν

δL

δφiν

)=

(δφi − δxµφiµ

) δLδφi

+(δφiµ − δxµφiµν

) δLδφiν

,

ou,

δL =

(δ − δxµ d

dxµ

)φiδL

δφi+

(δ − δxµ d

dxµ

)φiν

δL

δφiν

= δφiδL

δφi+ δφiµ

δL

δφiµ. (4.29)

Vamos calcular agora a variação

δφiµ = δφiµ − δxνφiνµ. (4.30)

Primeiro,

δφiµ = δ

(dφi

dxµ

)=dφ′i

dyµ− dφi

dxµ=dxν

dyµdφ′i

dxν− dφi

dxµ

=dxν

dyµdφ′i

dxν− dφi

dxµ.

Note que xµ = yµ − δxµ. Portanto,

δφiµ =d

dyµ(yν − δxν)

dφ′i

dxν− dφi

dxµ

=

(δνµ −

d (δxν)

dyµ

)dφ′i

dxν− dφi

dxµ=dφ′i

dxµ− d (δxν)

dyµdφ′i

dxν− dφi

dxµ

=d

dxµ(φ′i − φi

)− d (δxν)

dyµdφ′i

dxν

=d(δφi)

dxµ− d

dyµ

(δxν

dφ′i

dxν

)+ δxν

d2φ′i

dyµdxν.

Em primeira ordem,

δφiµ =d(δφi)

dxµ− d

dxµ

(δxν

dφi

dxν

)+ δxν

d2φi

dxµdxν

=d

dxµ(δφi − δxνφiν

)+ δxν φiνµ

=d

dxµ(δφi)

+ δxνφiνµ, (4.31)

que resulta em

δφiµ =d

dxµ(δφi)

+ δxν φiνµ − δxνφiνµ =d

dxµ(δφi). (4.32)

36

Temos

δL = δφiδL

δφi+ δφiµ

δL

δφiµ= δφi

δL

δφi+

d

dxµ(δφi) δLδφiµ

= δφi[δL

δφi− d

dxµδL

δφiµ

]+

d

dxµ

(δφi

δL

δφiµ

). (4.33)

Na integral,

δA =

ˆΩ

δLdω +

ˆΩ

dωd

dxµ(Lδxµ)

=

ˆΩ

δφi[δL

δφi− d

dxµδL

δφiµ

]dω +

ˆΩ

dωd

dxµ

(Lδxµ + δφi

δL

δφiµ

). (4.34)

Vamos deixar a primeira integral como está, mas desejamos escrever a segunda integralcomo combinações lineares das variações totais dos campos. Vamos usar δφ = δφ− δxµφµ:

δA =

ˆΩ

δφi[δL

δφi− d

dxµδL

δφiµ

]dω +

ˆΩ

dωd

dxµ

[Lδxµ − δxνφiν

δL

δφiµ+ δφi

δL

δφiµ

]=

ˆΩ

δφi[δL

δφi− d

dxµ

(δL

δφiµ

)]dω +

ˆΩ

dωd

dxµ

[δφi

δL

δφiµ−(φiν

δL

δφiµ− δµνL

)δxν].

Vamos definir

Hµν ≡δL

δφiµφiν − ηµνL, (4.35)

assim,

δA =

ˆΩ

δφi[δL

δφi− d

dxµδL

δφiµ

]dω +

ˆΩ

dωd

dxµ

(δφi

δL

δφiµ−Hµ

νδxν

). (4.36)

4.4 Os termos de fronteiraA integral

ˆΩ

dωd

dxµ

(δL

δφiµδφi −Hµ

νδxν

)é uma integral de uma divergência total no volume Ω. Segundo o teorema de Gauss, a integralde um divergente de um campo vetorial em um volume Ω deve ser igual à integral da projeçãoortogonal do mesmo campo vetorial na fronteira ∂Ω de Ω, ou seja,

ˆΩ

dωdFµ (x)

dxµ=

ˆ∂Ω

dσnµ (x)Fµ (x) ,

em que nµ (x) são componentes de um vetor unitário tangente a ∂Ω em determinado ponto x.Neste caso,

ˆΩ

dωd

dxµ

(δL

δφiµδφi −Hµ

νδxν

)=

ˆ∂Ω

dσnµ

(δL

δφiµδφi −Hµ

νδxν

). (4.37)

Por esta razão, integrais de divergentes em um problema variacional são denominados ter-mos de fronteira, já que eles dependem apenas das configurações e variações dos campos nafronteira de Ω.

O campo vetorial relevante é dado por

Φµ ≡δL

δφµiδφi −Hµνδx

ν , (4.38)

37

e é uma combinação linear de δφ e δx. Os coeficientes são

Hµν =δL

δφµiφiν − ηµνL, (4.39)

que são as componentes de um objeto que recebe o nome de densidade de energia-momento.Há, também, os coeficientes

πµi ≡δL

δφiµ, (4.40)

que são denominados momentos conjugados covariantes. Veremos mais adiante que essasquantidades são fundamentais na definição de quantidades conservadas e invariantes do pro-blema variacional.

4.5 Os princípios de Hamilton e Weiss e as equações decampo

Um princípio físico é necessário para que se defina a configuração física dos campos. É usual,a princípio, a utilização do princípio de Hamilton:

Proposição 1. O Princípio de Hamilton para campos.

Seja uma configuração de campos φ e uma integral fundamental, ou ação A, definidaa partir de uma densidade Lagrangiana L = L (x, φ, φµ). Considere, também, umavariação dos campos δφ que não modifique o volume Ω ⊂M4 e seja nula na fronteira∂Ω. Neste caso, φ é uma configuração física do sistema se a ação for estacionáriaquando calculada nesta configuração, em comparação com a ação calculada sobrequalquer outra configuração φ′ em uma vizinhança fechada de φ.

A condição necessária, mas não necessariamente suficiente, para que a ação seja estacio-nária é dada por δA = 0, ou seja, a primeira variação da ação tendo como base a configuraçãoestacionária deve ser nula. Nas condições do princípio de Hamilton, a variação δφ deve sertal que

δxµ = 0 e δφi (x)∣∣x∈∂Ω

= 0. (4.41)

Neste caso, a primeira variação da ação, (4.36), toma a forma

δA =

ˆΩ

δφi[δL

δφi− d

dxµδL

δφiµ

]dω +

ˆΩ

dωd

dxµ(πµi δφ

i),

visto que δ = δ quando δx = 0. O termo de fronteira envolve o cálculo de δφ na fronteira de Ω,ˆ

Ω

dωd

dxµ(πµi δφ

i)

=

ˆ∂Ω

dσx nµ (x)πµi (x) δφi (x)∣∣x∈∂Ω

,

que é nulo devido à segunda condição (4.41).Neste caso,

δA =

ˆΩ

δφi[δL

δφi− d

dxµδL

δφiµ

]dω. (4.42)

38

O volume Ω é fixado a priori. Contudo, o procedimento acima deve ser válido para qualquervolume no qual o sistema de coordenadas cartesiano xµ seja válido e, também, no qual oscampos sejam bem definidos. Sem perda de generalidade, podemos considerar Ω arbitrário.Além disso, as variações δφi devem ser linearmente independentes: a variação de um campoφi não pode depender da variação de uma campo φj para j 6= i. A condição de extremo δA = 0implica em que a integral (4.42) seja nula. Se Ω é arbitrário e δφi são LI, o termo entrecolchetes deve ser nulo, ou seja,

δL

δφi− d

dxµδL

δφiµ= 0. (4.43)

Essas são as equações de campo, são as equações de Euler-Lagrange da ação (4.6).

Observação 1. O princípio de Hamilton pode ser flexibilizado na condição de queδφ seja nulo na fronteira. Ainda mantendo Ω fixo, é suficiente que os momentoscovariantes sejam tangentes a ∂Ω na fronteira, ou seja,

nµ (x)πµi (x)|x∈∂Ω = 0. (4.44)

Isto implica na nulidade dos termos de fronteira e resulta nas mesmas equaçõesde campo. Esta condição, contudo, restringe as configurações físicas àquelas queobedecem ao vínculo (4.44), que se torna uma condição de contorno.

Um segundo princípio é mais geral e permite variações no volume Ω:

Proposição 2. O Princípio de Weiss.

Seja uma configuração de campos φ e uma integral fundamental, ou ação A, definidaa partir de uma densidade Lagrangiana L = L (x, φ, φµ). Sejam uma variação doscampos δφ = φ′ (y) − φ (x) e uma variação no volume δx = y − x, infinitesimais earbitrários. Neste caso, φ (x) é uma configuração física do sistema se a primeiravariação da ação depender apenas da fronteira de Ω.

O princípio de Weiss permite, portanto, variações arbitrárias no espaço de configuração, ouseja, permite todo arraste de campos que respeite a topologia e a geometria do espaço-tempo,ao contrário do princípio de Hamilton. Se a primeira variação só depende da fronteira, existepelo menos um conjunto de funções Fµ tais que

δA =

ˆΩ

dωdFµ

dxµ=

ˆ∂Ω

dσ |nµ (x)Fµ (x)|x∈∂Ω .

Neste caso, δx 6= 0 e δφ = δφ− δxµφµ, de modo que

δA =

ˆΩ

δφi[δL

δφi− d

dxµδL

δφiµ

]dω +

ˆΩ

dωd

dxµ

(δφi

δL

δφiµ−Hµ

νδxν

)=

ˆΩ

dωdFµ

dxµ.

Para que δA não dependa do volume, temos a condiçãoˆ

Ω

δφi[δL

δφi− d

dxµδL

δφiµ

]dω = 0,

39

que deve ser respeitada com Ω arbitrário e δφi linearmente independentes. Neste caso, temos

δL

δφi− d

dxµδL

δφiµ= 0,

que são as equações de campo (4.43) da ação.No princípio de Weiss, não se exige que os termos de fronteira sejam nulos. Contudo, de-

pendendo do volume Ω em consideração, condições de contorno nos campos e nas velocidadestalvez sejam necessárias para garantir a existência das integrais.

40

Capítulo 5

Os teoremas de Noether

5.1 SimetriasVamos supor uma transformação infinitesimal

xµ → xµ = xµ + δxµ, φi (x)→ φi (x) = φi (x) + δφi. (5.1)

Um funcional de ação A é denominado invariante sob estas transformações se a ação calcu-lada nas novas variáveis,

A[φ]

=

ˆΩ

dωL(x, φ, φµ

), (5.2)

for igual à ação calculada nas antigas variáveis

A [φ] =

ˆΩ

dωL (x, φ, φµ) , (5.3)

ou seja,

A = A. (5.4)

A condição (5.4) pode ser escrita através da diferença finita

∆A = A−A = 0. (5.5)

Vamos supor que δxµ são funções analíticas de um conjunto de parâmetros aµ e que δφisão funções analíticas de um conjunto de m parâmetros λa, em que a toma os valores de 1 am. Portanto, as transformações (5.1) fazem parte de uma classe de transformações contínuas.Além disso, temos a condição

(aµ, λa)→ 0 =⇒ δx = δφ = 0 =⇒ xµ = xµ, φi = φi, (5.6)

para as quais dizemos que as transformações são conexas à identidade.Se as transformações são contínuas e conexas à identidade, podemos expandir A em série

de Taylor:

A(λa′)

= A+dA

daµ

∣∣∣∣a,λ=0

aµ +dA

dλa

∣∣∣∣a,λ=0

λa +O(λ2). (5.7)

Colecionando apenas termos até primeira ordem, temos

A ≈ A+ δA, (5.8)

em que δA é uma primeira variação de A com relação às transformações (5.1), ou seja,

∆A ≈ δA, (5.9)

41

em primeira ordem da aproximação de Taylor.Uma condição necessária para que ∆A seja nulo é, claramente, que δA seja nulo para as

transformações (5.1). É claro que esta condição não é suficiente, de modo que podemos definiro que denominamos invariância fraca. A ação A é fracamente invariante sob as transforma-ções (5.1) se δA = 0. De agora em diante, sempre que nos referirmos a uma invariância, estase refere a uma invariância fraca. Uma invariância forte, em que ∆A = 0 é, claramente,também uma invariância fraca.

As transformações que deixam um funcional invariante são chamadas simetrias destefuncional.

Simetrias contínuas e conexas à identidade, caracterizada pelos m+ 4 parâmetros aµ e λa,podem ser explicitamente colocadas na forma

δxµ =dxµ

daν

∣∣∣∣a,λ=0

δφi =dφi

daµ

∣∣∣∣a,λ=0

aµ +dφi

dλa

∣∣∣∣a,λ=0

λa =dφi

dxνdxν

daµ

∣∣∣∣a,λ=0

aµ +dφi

dλa

∣∣∣∣a,λ=0

λa

= φiνdxν

daµ

∣∣∣∣a,λ=0

aµ +dφi

dλa

∣∣∣∣a,λ=0

λa = δxµφiµ + δφi,

em que

δφi =dφi

dλa

∣∣∣∣a,λ=0

λa.

Nessas expressões, definimos

Γµν ≡dxµ

daν

∣∣∣∣a,λ=0

, Υia ≡

dφi

dλa

∣∣∣∣a,λ=0

, (5.10)

que são funções independentes dos parâmetros. Em resumo,

δxµ = Γµνaν , δφi = φiµδx

µ + δφi = φiµΓµνaν + Υi

aλa. (5.11)

5.2 A equação de LieA primeira variação de A sob uma transformação infinitesimal geral caracterizada pelas fun-ções δxµ e δφi foi calculada em (4.36), resultando em

δA =

ˆΩ

[δL

δφi− d

dxµδL

δφiµ

]δφi +

ˆΩ

dωd

dxµ

(δφi

δL

δφiµ−Hµ

νδxν

). (5.12)

Com as definições (5.11),

δA =

ˆΩ

(δL

δφi− d

dxµδL

δφiµ

)Υiaλ

a +d

dxµ(πµi φ

iλΓλνa

ν + πµi Υiaλ

a −HµνΓνγa

γ)

.

Se δA = 0 em um volume Ω arbitrário, então(δL

δφi− d

dxµδL

δφiµ

)Υiaλ

a = − d

dxµ[(πµi φ

iν −Hµ

ν

)Γνγa

γ + πµi Υiaλ

a]. (5.13)

Esta é a equação diferencial de Lie.

42

5.3 O primeiro teoremaVamos separar, por conveniência, as transformações exclusivamente nos campos (δxµ = 0),das transformações exclusivamente no ponto do espaço-tempo (δφ = 0). No primeiro caso,temos δxµ = Γµνa

ν = 0, portanto tomaremos Γ = 0 em (5.13). Então,(δL

δφi− d

dxµδL

δφiµ

)Υiaλ

a = − d

dxµ[πµi Υi

aλa].

Agora, vamos considerar os parâmetros λa independentes do ponto, ou seja, constantes emxµ. Neste caso, se λa são linearmente independentes, temos(

δL

δφi− d

dxµδL

δφiµ

)Υia = − d

dxµ(πµi Υi

a

). (5.14)

Dizemos que essas são transformações internas globais. Internas, pois consistem em m trans-formações exclusivamente nos campos, sem mudança nas coordenadas deM4. Globais, poissão transformações a parâmetros constantes, que não dependem do ponto do espaço-tempo.Com (5.14), podemos enunciar a forma matemática do primeiro teorema de Noether:

Teorema 1. Primeiro teorema de Noether (versão matemática).Para cada simetria da ação, existe uma combinação linear das equações de campoque é igual a uma divergência total.

Este teorema também vale no segundo caso, em que δφ = 0, consistindo em transformaçõesexclusivamente no espaço-tempo. Neste caso, temos δφi = −δxµφiµ, resultando em Υi

aλa =

−φiµΓµνaν . Então, (5.13) torna-se(δL

δφi− d

dxµδL

δφiµ

)φiµΓµγ = − d

dxµ(Hµ

νΓνγ), (5.15)

com aµ constantes. Então, temos o caso em que quatro simetrias resultam em quatro combi-nações lineares das equações de Euler-Lagrange iguais a quatro divergências totais.

Toda simetria global (com parâmetros constantes) pode ser separada em uma transforma-ção interna e uma transformação no ponto, de modo que o caso misto não é de muito interesse.Simetrias internas possuem uma enorme relevância em teorias de campos, como por exemploas transformações de gauge. Por outro lado, toda teoria de campo relativística é invariantepelo grupo de Poincaré, que consiste em translações e pseudo-rotações emM4. Transforma-ções de Poincaré são transformações globais no ponto, portanto.

Outra versão do primeiro teorema de Noether pode ser formulada a partir da equação deLie (

δL

δφi− d

dxµδL

δφiµ

)δφi = − d

dxµ(πµi δφ

i −Hµνδx

ν), (5.16)

agora escrita na forma geral. Note que, se as equações de campo são satisfeitas,

δL

δφi− d

dxµδL

δφiµ= 0,

a seguinte divergência é nula:

dΦµ

dxµ= 0, Φµ ≡ πµi δφ

i −Hµνδx

ν . (5.17)

43

No caso de transformações internas globais, temos

Φµ = πµi δφi = πµi Υi

aλa,

ou seja,

dΦµ

dxµ= 0 =⇒ d

dxµ(πµi Υi

a

)= 0.

As funções Φµa ≡ πµi Υi

a são denominadas correntes próprias, e as equações

dΦµadxµ

= 0 (5.18)

são denominadas equações de continuidade.No caso de transformações no ponto, temos

Φµ = −Hµνδx

ν = −HµνΓνλa

λ,

que resulta em

dΦµ

dxµ= 0 =⇒ d

dxµ(Hµ

νΓνλ) = 0. (5.19)

Neste caso, as correntes próprias são as funções Φµλ ≡ Hµν Γνλ, que obedecem às equações de

continuidade dΦµν/dxµ = 0.

Teorema 2. Primeiro teorema de Noether (versão física I).Para cada simetria da ação, existe uma equação de continuidade para um conjuntode correntes próprias.

Equações de continuidade aparecem em toda teoria física com simetrias. Por exemplo,considere as equações de Maxwell com fontes

∇ ·E =ρ

ε0,

∇×B = µ0j + µ0ε0∂E

∂t.

Derivando a primeira equação parcialmente no tempo e tomando o divergente da segunda,temos

∂t(∇ ·E) = ∇ · ∂E

∂t=

1

ε0

∂ρ

∂t,

∇ · ∇ ×B = µ0∇ · j + µ0ε0∇ ·∂E

∂t= 0.

Portanto, a última equação resulta em

∇ · j +∂ρ

∂t= 0,

que é a equação de continuidade para a carga elétrica. Vamos introduzir a 4-corrente

jµ =(ρc, j).

44

Então,

∇ · j +∂ρ

∂t= ∇ · j + c

∂j0

∂t= ∇ · j +

∂j0

∂x0=∂jµ

∂xµ= 0.

A corrente jµ é um exemplo de corrente de Noether própria, como veremos no estudo do campoeletromagnético.

Outro exemplo consiste na equação de Schrödinger

i~∂ψ

∂t= − ~2

2m∇2ψ + V ψ.

Seu complexo conjugado resulta em

−i~∂ψ∗

∂t= − ~2

2m∇2ψ∗ + V ψ∗.

Multiplicando a primeira equação por ψ∗ e a segunda por ψ, temos

i~ψ∗∂ψ

∂t= − ~2

2mψ∗∇2ψ + V ψ∗ψ,

−i~∂ψ∗

∂tψ = − ~2

2m

(∇2ψ∗

)ψ + V ψ∗ψ.

Tomando a diferença, temos

i~∂

∂t(ψ∗ψ) = − ~2

2m∇ · [ψ∗∇ψ − ψ∇ψ∗] .

Definindo-se ρ = i~ψ∗ψ e j =(~2/2m

)(ψ∗∇ψ − ψ∇ψ∗), temos

∂ρ

∂t+∇ · j = 0,

que é também uma equação de continuidade, desta vez para a probabilidade de transição emmecânica quântica. Esta equação de continuidade também é resultante do primeiro teoremade Noether, desta vez para a mecânica quântica.

5.4 Cargas conservadasAgora, podemos trabalhar de forma mais geral. Se a ação possui uma simetria global, existeuma corrente própria Φµa , em que a = a para uma simetria interna e a = µ para uma simetriade ponto. A equação de continuidade é dada por

dΦµadxµ

= 0. (5.20)

Esta é uma equação diferencial parcial nas coordenadas, portanto tem um caráter local. Comcondições de contorno apropriadas, este tipo de equação também resulta em uma lei de con-servação global.

Primeiro, vamos supor um observador em repouso com relação à origem de um sistemade coordenadas cartesiano xµ. Seu tempo próprio é a coordenada x0 = ct, de modo queseu relógio mede um tempo t = x0/c em seu referencial. Vamos supor, aqui, um sistemade unidades natural em que c = 1. Este observador faz experiências sobre um conjunto decampos φi (x) em seu laboratório, que tem volume V . Ele está interessado especialmente naintegral da equação (5.20) em Ω, de modo que

I =

ˆΩ

dωdΦµadxµ

=

ˆ t1

t0

dt

ˆV

d3xdΦµadxµ

=

ˆ t1

t0

dt

ˆV

d3x

(dΦ0

a

dx0+dΦkadxk

), k = 1, 2, 3.

45

Esta integral divide-se em duas:

I =

ˆ t1

t0

dtd

dt

(ˆV

d3xΦ0a

)+

ˆ t1

t0

dt

(ˆV

d3xdiv ~Φa).

Na segunda integral, podemos usar o teorema de Gauss em três dimensões. Ela resultaem

ˆ t1

t0

dt

(ˆV

d3xdiv ~Φa)

=

ˆ t1

t0

dt

(ˆA

d2xn · ~Φa).

Vamos supor que o observador expanda o volume ao infinito e, neste caso, ele supõe que ascorrentes tridimensionais ~Φa vão a zero na fronteira de V . Portanto, a segunda integral énula e

I =

ˆ t1

t0

dtd

dt

(ˆV

d3xΦ0a

)=

ˆ t1

t0

d

(ˆV

d3xΦ0a

)=

(ˆV

d3xΦ0a

)t1t0

. (5.21)

Se (5.20) é satisfeita, I = 0, de modo que

d

dt

(ˆV

d3xΦ0a

)= 0.

A quantidade

Qa (t) ≡ˆV

d3xΦ0a (x, t) (5.22)

é chamada de carga de Noether, e é uma quantidade conservada no tempo, visto que

dQadt

= 0. (5.23)

Teorema 3. Primeiro teorema de Noether (versão física II).Seja Φa =

(Φ0a, ~Φa

)tal que n · ~Φa = 0 na fronteira de um volume tridimensional

V , em que n é um vetor unitário ortogonal à superfície definida pela fronteira deV . Então, para cada simetria da ação, existe uma carga Qa =

´Vd3xΦ0

a que é umaconstante de movimento.

Portanto, simetrias implicam em cargas conservadas, que são constantes de movimentodo ponto de vista de um observador inercial.

5.5 Translações e a conservação de energia e momentoConsidere a transformação

δxµ = aµ,

com coeficientes aµ constantes. Esta operação representa uma translação no espaço-tempo.Neste caso,

δxµ = Γµνaν = aµ =⇒ Γµν = δµν .

46

Essas transformações são efetuadas de modo que δφi = 0, pois campos relativísticos sãonaturalmente invariantes por translações. Então a equação de Lie torna-se(

δL

δφi− d

dxµδL

δφiµ

)φiνδx

ν = − d

dxµ(Hµ

νδxν) ,

que resulta em(δL

δφi− d

dxµδL

δφiµ

)φiν = − d

dxµ(Hµ

ν) .

Se as equações de campo são satisfeitas,

δL

δφi− d

dxµδL

δφiµ= 0,

temos

d

dxµ(Hµ

ν) = 0. (5.24)

Portanto, existem quatro equações de continuidade para a densidade de energia-momento:

∂tH0

ν +∇ · ~Hν = 0, (5.25)

em que consideramos Hµν =

(H0

ν , ~Hν

).

Agora, é conveniente entendermos melhor o papel da densidade de energia-momento. Po-demos obter uma definição formal abaixo.

Definição 7. Densidade de energia-momento canônica.Seja E o espaço vetorial dos vetores de Lorentz definidos emM4 e Φ o espaço de todasas funções escalares de Lorentz definidas emM4. A densidade de energia-momentoé um funcional bilinear T : E ×E → Φ. Dado um sistema de coordenadas xµ e umabase de covetores dxµ, T tem a forma T = Hµνdx

µdxν , cujas componentes são dadaspor

Hµν ≡δL

δφiµφiν − ηµνL, (5.26)

em que L é uma densidade lagrangiana. Neste caso, T é um tensor do tipo (0, 2).

Considere agora um observador em um referencial inercial com 4-velocidade u = uµ∂µ:

Definição 8. Densidade de energia.Seja u a 4-velocidade de um observador e T a densidade de energia-momento de umcampo. A densidade de energia do campo ρ medida por este observador é definidapelo escalar

ρ ≡ T (u, u) = Hµνuµuν . (5.27)

47

Supondo que o observador esteja em repouso com relação ao seu sistema de coordenadaslocal, temos u = (1, 0, 0, 0). Neste caso,

ρ = Hµνuµuν = H00u

0u0 = H00.

Neste caso, o tempo medido por este observador é dado por t = x0/c e, a tempo constante,podemos integrar esta expressão em um volume V tridimensional:

ˆV

ρ (x) d3x =

ˆV

H00 (x) d3x =

ˆV

(δL

δφi0φi0 − L

)d3x.

Esta integral é precisamente a energia do campo no volume V , ou seja,

H =

ˆV

H00 (x) d3x (5.28)

é a função hamiltoniana do campo. Neste caso, a energia é a integral no volume da com-ponente H00 de T quando o observador encontra-se em repouso com relação ao seu próprioreferencial. No caso mais geral, a energia é dada por

H =

ˆΣ

Hµν (x)uµuνdσ, (5.29)

em que Σ é um volume tridimensional ortogonal à velocidade u.

Observação 2. O processo descrito acima é uma escolha de dinâmica relativística.Uma dinâmica relativística envolve a escolha de um eixo temporal, neste caso a ve-locidade u de um observador, de modo que seu tempo próprio seja o parâmetro deevolução temporal. Neste caso, o observador mede os campos não mais como funçõesno espaço-tempo, mas como funções do tempo t e das posições x de um espaço tridi-mensional Σt onde todos os pontos são definidos a t constante. Uma escolha de dinâ-mica relativística, portanto, decompõe o espaço-tempo em espaços tridimensionaisΣt em cada tempo t. Os físicos chamam este processo de folheação do espaço-tempo,de modo que cada Σt é uma folha tridimensional a t constante. Quando t = x0/ce Σt = R3, esta dinâmica é denominada dinâmica instantânea. Existem, até o mo-mento, cinco dinâmicas relativísticas não equivalentes.

Agora, vamos considerar um vetor τ unitário e ortogonal a u. Este vetor é claramentetangente a Σ, visto que u é ortogonal a Σ. De fato, podemos definir um conjunto de três vetoresτk = (τ1, τ2, τ3) que formam uma base ortonormal de Σ. Cada vetor é um eixo ortonormal deΣ. Neste caso,

Definição 9. Densidade de momento.Seja τ um vetor unitário ortogonal à velocidade u de um observador, e T a densidadede energia-momento de um campo. A densidade de momento do campo na direçãode τ , pτ , medida por este observador é definida por

pτ ≡ T (u, τ) = Hµνuµτν . (5.30)

Na dinâmica instantânea, u = (1, 0, 0, 0). Seja τ1 = (0, 1, 0, 0). Neste caso,

p1 = Hµνuµτν = H01u

0τ1 = H01.

48

Esta é a densidade de momento na direção x1. Da mesma forma, p2 = H02 e p3 = H03, demodo que

pk = H0k, k = 1, 2, 3. (5.31)

Integrando-se esta expressão, temos

Pk ≡ˆV

pk (x) d3x = Pk ≡ˆV

H0k (x) d3x. (5.32)

Esta expressão define o momento total do campo em cada direção espacial.Por fim, definimos:

Definição 10. Densidade de estresse.Seja τk uma base para Σ, tal que Σ seja ortogonal à velocidade u de um observador.Seja T a densidade de energia-momento de um campo. Considere também umasuperfície gaussiana Γk ortogonal a cada τk em determinado ponto de Σ. O fluxo dacomponente m da densidade de momento através de uma superfície Γn é dado por

τmn ≡ T (τm, τn) = Hmnτmτn, (5.33)

e é denominado densidade de estresse do campo.

Na dinâmica instantânea, é imediato verificar que

τmn = Hmn. (5.34)

Assim, quando u = (1, 0, 0, 0), temos

Hµν =

ρ p1 p2 p3

p1 τ11 τ12 τ13

p2 τ21 τ22 τ23

p3 τ31 τ32 τ33

. (5.35)

As componentes τ11, τ22 e τ33 são denominadas densidades de estresses normais a cada dire-ção. Quando são iguais, τkk (sem soma em k) é denominado densidade de pressão do campo.Integradas em Σ, (5.35) formam as componentes do tensor de estresse. Da mesma forma, asintegrais

Tµν (t) ≡ˆ

Σt

Hµν (t,x) dσ (5.36)

são as componentes do denominado tensor energia-momento.Vamos voltar à discussão anterior. Vimos que a invariância da ação sob translações im-

plica em que as equações de Euler-Lagrange resultam em uma equação de continuidade paraa densidade de energia-momento. Neste caso, vamos escrever

∂µHµν = 0, (5.37)

que vem a ser a forma mais comum de notação. Dizemos que Hµν é uma quantidade conser-vada.

Vamos trabalhar na dinâmica instantânea de agora em diante. Integrando (5.37) em Ω ⊂M4, temos

0 =

ˆΩ

dω∂µHµν =

ˆdt

ˆV

d3x∂µHµν

=

ˆdt

ˆV

d3x(∂0H0ν + ∂kHkν

), k = 1, 2, 3.

49

Temosˆdt

ˆV

d3x(∂0H0ν + ∂kHkν

)=

ˆdt

[d

dt

(ˆV

d3xH0ν

)+

ˆV

d3x∂kHkν

]= 0.

Vamos analisar apenas a equação para ν = 0. Assim, com H00 = ρ e Hk0 = H0k = pk, temosˆdt

[d

dt

(ˆV

d3xρ (x)

)+

ˆV

d3x∂kpk

]= 0. (5.38)

Dentro dos colchetes, a segunda integral é um termo de fronteira em V :ˆV

d3x∂kpk =

ˆ∂V

d2xnk (x) pk (x) , (5.39)

em que nk (x) são as componentes de um campo vetorial (em três dimensões) ortogonal a ∂V .Esta integral é o fluxo de momento do campo através da superfície ∂V . Nós vamos supor queo sistema é fechado, de modo que n · p = 0 em ∂V . Neste caso, a integral é nula e ficamosapenas com

ˆdtd

dt

(ˆV

d3xρ (x)

)=

ˆdtdH

dt= 0 =⇒ dH

dt= 0. (5.40)

Portanto, a hamiltoniana H =´Vd3xρ (x) =

´Vd3xH00 é uma constante de movimento.

Quando uma hamiltoniana é conservada, ela é relacionada com a energia do sistema. Por-tanto, invariância por translações (especificamente pela evolução temporal), resulta na con-servação da energia do campo.

As demais equações, para ν = k, resultam emˆdt

[d

dt

(ˆV

d3xpk

)+

ˆV

d3x∂lτlk

]= 0,

em que pk = H0k e τlk = Hlk, com l = 1, 2, 3. Mais uma vez, vamos supor que o sistema éfechado, de modo que o estresse do campo é tangente à superfície ∂V . Assim,

ˆV

d3x∂lτlk =

ˆ∂V

dxnl (x) τlk (x) = 0

eˆdtd

dt

(ˆV

d3xpk

)= 0.

A equação acima implica em que os momentos Pk =´Vd3xpk (x) são conservados, ou seja,

dPkdt

= 0. (5.41)

Então, translações (espaciais) implicam na conservação dos momentos lineares dos campos.

5.6 Rotações, momento angular e spinVamos analisar o que ocorre quando a ação é invariante por transformações de Lorentz, quevem a ser uma (pseudo)rotação global no espaço-tempo. Temos

yµ = Λµνxν ≈ 1xµ + ωµνx

ν =

[δµν +

1

2i (Jab)

µν ω

ab

]xν , (5.42)

em que ωab = −ωba e Jab são os geradores da álgebra so (1, 3) na representação adjunta,

(Jab)µν = i (δµaηbν − δ

µb ηaν) , a, b, µ, ν = 0, 1, 2, 3. (5.43)

50

Neste caso,

δxµ =1

2i (Jab)

µν ω

abxν . (5.44)

Uma rotação no espaço-tempo implica uma rotação nos campos. Vamos definir esta rotaçãode modo que δφi = 0, ou seja, apenas a transformação no ponto influencia na transformaçãototal dos campos. Assim,

δφi = δxµφiµ =1

2i (Jab)

µν ω

abxνφiµ, (5.45)

de modo que a equação de Lie[δL

δφi− d

dxµδL

δφiµ

]δφi = − d

dxµ

(δφi

δL

δφiµ−Hµ

νδxν

)torna-se

d

dxµ

(δL

δφiµδφi −Hµ

νδxµ

)=

1

2id

dxµ

[(δL

δφiµφiν −Hµ

ν

)(Jab)

νλ ω

abxλ]

= 0

independentemente das equações de campo, visto que δφi = 0. Como ωab são constantes,temos

∂µ

[(δL

δφiµφiν −Hµ

ν

)(Jab)

νλ x

λ

]= 0. (5.46)

Com (5.43), temos

0 = ∂µ

[Hµ

ν (δνaηbλ − δνb ηaλ)xλ − δL

δφiµφiν (Jab)

νλ x

λ

]= ∂µ

[(Hµ

axb −Hµbxa)− δL

δφiµφiν (Jab)

νλ x

λ

].

Vamos definir dois objetos:

Definição 11. Densidade de momento angular orbital.As componentes da densidade de momento angular orbital são definidas por

`µab ≡ Hµaxb −H

µbxa. (5.47)

Este momento angular é um vetor de Lorentz, mas também é uma matriz na álgebra deLorentz. Todo campo que se transforma como uma representação do grupo de Lorentz possuimomento angular orbital. O segundo objeto é dado por:

Definição 12. Densidade de spin.Seja uma rotação infinitesimal δxµ = ωµνx

ν = (i/2) (Jab)µν ω

abxν . Se os campos φi setransformam de modo que

δφi =1

2i (Jab)

µν ω

abxνφiµ,

as componentes da densidade de spin dos campos são definidas por

sµab ≡ −δL

δφiµ

∂(δφi)

∂ωab= − δL

δφiµφiν (Jab)

νλ x

λ. (5.48)

51

Neste caso, a corrente de Noether conservada é dada pela densidade de momento an-gular total, cujas componentes são

mµab ≡ `

µab + sµab, (5.49)

que obedecem às equações de continuidade

∂µmµab = 0. (5.50)

Vamos integrar (5.50) em Ω, como temos feito usualmente:

0 =

ˆΩ

dω∂µmµab =

ˆdt

ˆV

d3x∂µmµab

=

ˆdt

ˆV

d3x(∂0m

0ab + ∂im

iab

)+

ˆdt

(dMab

dt+

ˆV

d3x∂imiab

).

Mais uma vez, vamos supor que o fluxo de momento angular em ∂V é nulo, anulando a últimaintegral. A matriz

Mab ≡ˆV

d3xm0ab

é a matriz de momento angular total. Então, a equação de continuidade implica emdMab

dt= 0, (5.51)

ou seja, o momento angular total dos campos é uma carga conservada.Portanto, o momento angular de um campo tem uma componente orbital e uma compo-

nente de spin,

Mab = Lab + Sab, (5.52)

em que

Lab =

ˆV

d3x`0ab e Sab =

ˆV

d3xs0ab. (5.53)

Embora não exista uma razão matemática, o fato é que ambos os momentos angulares sãoconservados separadamente em campos relativísticos. Note que, se ∂µmµ

ab = 0 e ∂µHµν = 0,

temos

∂µsµab = −∂µ`µab = −∂µ (Hµ

axb −Hµbxa)

= Hµb∂µxa −H

µa∂µxb = Hµ

bηµa −Hµaηµb

= Hab −Hba, (5.54)

ou seja, a divergência da densidade de spin é igual à parte antissimétrica da densidade deenergia momento. Se a densidade de energia-momento é simétrica, ∂µsµab = 0 e, assim, ambasas componentes do momento angular são conservadas separadamente.

Observação 3. No geral, as componentes da densidade de energia-momento

Hµν =δL

δφiµφiν − ηµνL

não são simétricas, ou seja, Hµν 6= Hνµ. Mas existe um procedimento de simetriza-ção deHµν , conhecido como procedimento de Belinfante, que consiste em acrescentarum termo de fronteira ao tensor energia-momento:

Tµν = Hµν +1

2∂λ(sλµν + sλνµ − s λ

νµ

). (5.55)

Este tensor é chamado tensor de Belinfante-Rosenfeld e, usando (5.54), mostra-seque Tµν = Tνµ. A diferença entre Tµν e Hµν é um termo de divergência total e,assim, torna-se um termo de fronteira na ação, o que não altera as equações decampo. Neste caso, é sempre preferível o uso do tensor energia-momento simétricosobre o canônico, visto que este garante a conservação da densidade de spin.

52

5.7 O segundo teoremaO segundo teorema de Noether diz respeito à invariância da ação sob transformações locais,ou seja, cujos parâmetros são funções de pontos do espaço-tempo. Vamos considerar umatransformação dependente de um conjunto de funções do ponto do espaço-tempo λa, tal quea = 1, · · · ,m:

δφi =∂φi

∂λadλa

dxµ

∣∣∣∣λ=0

δxµ. (5.56)

Esta transformação implica em

δφi = δφi − δxµφiµ, (5.57)

que resulta em

δφi =

(∂φi

∂λadλa

dxµ

∣∣∣∣λ=0

− φiµ)δxµ, (5.58)

em que

δxµ =dyµ

dλa

∣∣∣∣λ=0

λa. (5.59)

Vamos definir as funções

Aia ≡ φiµdyµ

dλa

∣∣∣∣λ=0

e Biµa ≡∂φi

∂λa

∣∣∣∣λ=0

δxµ, (5.60)

De forma que,

δφi = Biµadλa

dxµ, φiµδx

µ = Aiaλa, δφi = Biµa

dλa

dxµ−Aiaλa. (5.61)

A equação de Lie,

(EL)i δφi + ∂µ

(δL

δφiµBiµa

dλa

dxµ−Hµ

νδxν

)= 0,

em que

(EL)i ≡δL

δφi− d

dxµδL

δφiµ(5.62)

são os lados esquerdos das equações de campo, torna-se

(EL)i(Biµa ∂µλ

a −Aiaλa)

+ ∂µΦµ = 0, (5.63)

com

Φµ ≡ δL

δφiµ

(Biµa

dλa

dxµ−Aiaλa

)+ Lδxµ. (5.64)

Podemos escrever esta equação como

0 = (EL)i(Biµa ∂µλ

a −Aiaλa)

+ ∂µΦµ

= (EL)iBiµa ∂µλ

a − (EL)iAiaλ

a + ∂µΦµ

= ∂µ[(EL)iB

iµa λ

a]− ∂µ

((EL)iB

iµa

)λa − (EL)iA

iaλ

a + ∂µΦµ

= −∂µ((EL)iB

iµa

)λa − (EL)iA

iaλ

a + ∂µ[Φµ + (EL)iB

iµa λ

a].

53

Ou seja,∂µ[(EL)iB

iµa

]+ (EL)iA

ia

λa − ∂µ

[Φµ + (EL)iB

iµa λ

a]

= 0. (5.65)

Agora, vamos integrar esta equação em Ω:ˆ

Ω

∂µ[(EL)iB

iµa

]+ (EL)iA

ia

λadω −

ˆΩ

dω∂µ[Φµ + (EL)iB

iµa λ

a]

= 0.

Enquanto o primeiro teorema de Noether lida com o caso de parâmetros constantes, emque as transformações são globais e a invariância da ação é definida em todo o domínio Ω,a invariância da ação por transformações com parâmetros que dependem do espaço-tempoé local. A integral fundamental não só é invariante quando calculada num volume Ω, mastambém em qualquer sub-domínio Ω ⊂ Ω. Exceto em Ω, a integral

ˆΩ

dω∂µ[Φµ + (EL)iB

iµa λ

a]

(5.66)

deve ser nula em todo Ω ⊂ Ω. Neste caso, temos

δAΩ =

ˆΩ

∂µ[(EL)iB

iµa

]+ (EL)iA

ia

λadω = 0.

Com volume e parâmetros arbitrários, temos as relações

∂µ[(EL)iB

iµa

]+ (EL)iA

ia = 0. (5.67)

Estas são as chamadas identidades de Noether.

Teorema 4. Segundo Teorema de Noether.Seja uma transformação total dos campos que dependa de um conjunto de n parâ-metros λa (x), dependentes do ponto do espaço-tempo. Se a ação é invariante sobestas transformações, existem n identidades de Noether que envolvem combinaçõeslineares das equações de Euler-Lagrange.

As identidades de Noether (5.67) podem ser colocadas na forma de uma equação de con-servação covariante. Para tal, definimos as funções Gaiµ tais que

GaiµBjνb = δji δ

ab δνµ. (5.68)

Assim,

0 = ∂µ[(EL)iB

iµa

]+ (EL)iA

ia

= ∂µ

[(EL)iB

jνb

]δµν δ

ijδba + (EL)iA

jbδbaδij

= ∂µ

[(EL)iB

jνb

]GbjνB

iµa + (EL)iA

jbδbaδij .

Vamos multiplicar por G à direita:

0 = ∂µ

[(EL)iB

jνb

]GbjνB

iµa G

ckλ + (EL)iA

iaG

ckλ

= ∂µ

[(EL)iB

jνb

]Gbjνδ

caδikδµλ + (EL)iA

iaG

ckλ

= ∂λ

[(EL)k B

jνb

]Gbjνδ

ca + (EL)iA

iaG

ckλ

= ∂µ

[(EL)k B

jνb

]Gbjνδ

ca + (EL)iA

iaG

ckµ.

54

Agora, vamos multiplicar por B à direita:

0 = ∂µ

[(EL)k B

jνb

]Gbjνδ

caB

lλd + (EL)iA

iaG

ckµB

lλd

= ∂µ

[(EL)k B

jνb

]δbdδ

ljδλν δca + (EL)iA

iaG

ckµB

lλd

= ∂µ[(EL)iB

lλd

]δikδ

ca + (EL)iB

lλd A

iaG

ckµ

=[δijδ

ba∂µ +AiaG

bjµ

] [(EL)iB

kνc

].

Vamos definir a derivada covariante

(∇µ)ibja ≡ δ

ijδba∂µ − (Γµ)

ibja , (5.69)

com os campos de conexão

(Γµ)ibja ≡ −A

iaG

bjµ. (5.70)

Dessa forma, as identidades de Noether podem ser escritas por

(∇µ)ibja

[(EL)iB

kνc

]= 0. (5.71)

Essas identidades são independentes das equações de movimento e não dependem dascondições de fronteira dos campos ou das variações do problema variacional. São válidaspara qualquer configuração de campos, extremos ou não. Elas recebem o nome de leis deconservação impróprias: não são verdadeiramente leis de conservação. As quantidades

Υjνic ≡ (EL)iB

jνc (5.72)

são chamadas correntes impróprias.Na fronteira de Ω, a integral (5.66) não pode ser levada a zero para transformações com

forma geral. Assim, temosˆ

Ω

∂µ[(EL)iB

iµa

]+ (EL)iA

ia

λadω −

ˆΩ

dω∂µ[Φµ + (EL)iB

iµa λ

a]

= 0. (5.73)

em Ω. Para campos que são extremos do problema variacional, (EL)i = 0 eˆ

Ω

dω∂µΦµ = 0, (5.74)

com

Φµ =δL

δφiµ

(Biνa ∂νλ

a −Aiaλa)

+ Ldxµ

dλaλa

=δL

δφiµBiνa ∂νλ

a −[δL

δφiµAia + L

dxµ

dλa

]λa =

δL

δφiµBiνa ∂νλ

a − Φµaλa, (5.75)

com

Φµa ≡δL

δφiµAia + L

dxµ

dλa. (5.76)

A equação (5.74) resulta em ∂µΦµ = 0, de modo que Φµ é uma corrente própria. Portanto,

∂µΦµ = ∂µ

(δL

δφiµBiνa ∂νλ

a − Φµaλa

)= ∂µ

(δL

δφiµBiνa ∂νλ

a

)− ∂µ (Φµaλ

a)

= ∂µ

(δL

δφiµBiνa

)∂νλ

a +

(δL

δφiµBiνa

)∂µ∂νλ

a − ∂µΦµaλa − Φµa∂µλ

a

=

[∂µ

(δL

δφiµBiνa

)− Φνa

]∂νλ

a +

(δL

δφiµBiνa

)∂µ∂νλ

a − (∂µΦµa)λa = 0

55

Vamos supor que λ e suas derivadas sejam independentes. Neste caso,

∂µΦµa = 0, (5.77)

Φνa = ∂µ

(δL

δφiµBiνa

), (5.78)

δL

δφiµBiνa +

δL

δφiνBiµa = 0. (5.79)

Portanto, na validade das equações de campo, temos um conjunto de correntes própria con-servadas (5.77). Essas correntes, de acordo com (5.78), pode ser escrita como uma divergênciaordinária de um tensor de segunda ordem que, ainda de acordo com (5.79), deve ser antissimé-trico nos índices do espaço-tempo. Este conjunto de relações não é, obviamente, independente.Se a corrente é escrita como a divergência de um tensor antissimétrico, a lei de conservação(5.77) é automática, devido à simetria das derivadas.

Se leis de conservação próprias são obedecidas, integrais de movimento podem ser encon-tradas com uma escolha de dinâmica relativística. Essas integrais são dadas pelas carga

Qa =

ˆV

d3xΦ0a =

1

2

ˆV

d3x∂µ

(δL

δφi0Biµa −

δL

δφiµBi0a

).

Com o teorema de Gauss-Ostrogradski, essa carga pode ser escrita por

Qa =1

2

ˆ∂V

d2xnµ

(δL

δφi0Biµa −

δL

δφiµBi0a

)(5.80)

como uma integral de 2 dimensões na fronteira de V .

5.8 InvariantesPara começar, vamos tratar sobre os invariantes que encontramos no capítulo passado. Es-ses invariantes estão relacionados aos invariantes de Casimir da álgebra de Poincaré, queincluem rotações e translações emM4. A simetria por translações implica na conservação dadensidade de energia-momento

Hµν ≡ πiµφiν − ηµνL, (5.81)

que obedece a uma equação de continuidade ∂µHµν = 0. Na dinâmica instantânea, em quet = x0/c, a conservação de Hµν implica na existência das constantes de movimento

Pµ =

ˆR3

d3xH0µ (x) , (5.82)

em que P0 = E/c está relacionado à energia do sistema e Pk, com k = 1, 2, 3, são os momentoslineares dos campos.

O invariante de Casimir relacionado a essas funções é o momento linear ao quadradoP 2 = PµP

µ. Note que Pµ, como geradores da álgebra de translações, são operadores abstratosque atuam sobre os campos, de modo que (5.82) é uma realização analítica desses operadores.P 2 define um problema de autovalores

PµPµφ = m2φ, (5.83)

em que m é definido como o conteúdo de massa do campo φ. Se o campo é um campo clás-sico, dependente do ponto do espaço-tempo, ou seja, φ = φ (x), a realização dos momentosapropriada é dada por Pµ ≡ i∂µ, de modo que (5.83) torna-se a equação de Klein-Gordon-Fock

( +m2

)φ (x) = 0, (5.84)

56

em que

≡ ∂µ∂µ = ηµν∂µ∂ν = −P 2 (5.85)

é o operador D’Alambertiano. Todo campo relativístico obedece à equação de Klein-Gordon-Fock por definição, já que tais campos são construídos como invariantes por translações.

A invariância por rotações, por outro lado, implica na conservação do momento angulartotal, representado pela matriz

Mµν = Lµν + Sµν , (5.86)

que tem uma componente orbital e uma componente de spin, como definidos em (5.53), (5.47)e (5.48). Neste caso, Pµ e Mµν são geradores da álgebra de Poincaré.

Com (5.86) podemos construir o operador de Pauli-Lubanski

Wµ ≡ −i

2εµνγλM

νγPλ. (5.87)

Definição 13. O tensor antissimétrico quadridimensional.Em quatro dimensões, podemos definir o tensor de componentes

εµνγλ =

1 para combinações cíclicas de (µνγλ) ,

0 se quaisquer dois índices forem iguais,−1 para combinações anti-cíclicas de (µνγλ),

(5.88)

de modo que ε0123 = 1. Note que as componentes inversas

εµνγλ = ηµαηνβηγτηλσεαβτσ (5.89)

obedecem à mesma regra, contudo, ε0123 = −1 devido à métrica de Minkowski.

O operador Wµ, obedece trivialmente à relação WµPµ = 0 e possui as seguintes relações

de comutação com os geradores da álgebra:

[Pµ,Wν ] = 0, [Mµν ,Wγ ] = ηνγWµ − ηµγWν , (5.90)

além de

[Wµ,Wν ] = εµνγλWγPλ. (5.91)

A importância do operador de Pauli-Lubanski vem a ser o fato de que ele gera transformaçõesde Lorentz que preservam os autovalores de massa do operador momento. Neste caso, elepode ser utilizado, em conjunto com P 2, para classificar campos relativísticos em termos desua massa e spin. O quadrado deste operador,

W 2 = WµWµ, (5.92)

é um invariante de Casimir da álgebra de Poincaré. Este esquema de classificação foi intro-duzido por Wigner [19].

Considere um campo livre φ com conteúdo de massa m diference de zero e energia E.Após quantizado, tal campo dará origem a estados de partículas de massa m. Como W 2 éum invariante de Poincaré, podemos calculá-lo escolhendo um referencial inercial. Vamosescolher um observador em repouso na origem, de modo que Pµ = (E/c = mc, 0, 0, 0) = P0.Neste caso,

Wµ ≡ −i

2mcε0µνγM

νγ .

57

Com as propriedades de ε, temos W0 = 0. Com k,m, n = 1, 2, 3, temos

Wk = − i2mcεkmnM

mn = −mcJk, (5.93)

em que Jk = (i/2) εkmnMmn são as componentes do momento angular tridimensional. Usa-

mos a relação εkmn = ε0kmn. Neste caso,

W 2 = m2c2J iJi = −m2c2J2, (5.94)

Em que J2 = ηmnJmJn = −δmnJmJn é o quadrado do momento angular total. Supondo umestado singleto, em que o momento orbital é nulo, temos

W 2 = −m2c2S2, (5.95)

em que S2 = SkSk é o quadrado do spin (tridimensional) do campo. No geral, um estado

fundamental de um campo quântico é um estado singleto, de modo que o estado de momentoangular total resulta em seu estado de spin.

Ao atuar em um estado singleto, temos

S2φ = s (s+ 1)φ, (5.96)

ou seja, as partículas de massa m podem ser classificadas por seus valores de spin s =0, 1, 2, · · · , caso em que o campo é denominado bosônico, ou s = 1/2, 3/2, · · · , caso em que ocampo é fermiônico.

No caso não massivo, notemos que P 2 = 0 não implica em W 2 = 0. De fato,

WµWµ = −1

4εµνγλε

µαβρM

νγPλMαβP ρ = MαγPγMαβPβ , (5.97)

que pode ser calculado com uso da relação

εµνγλεταβρ = det

δτµ ηµα ηµβ ηµρδτν ηνα ηνβ ηνρδτγ ηγα ηγβ ηγρδτλ ηλα ηλβ ηλρ

, (5.98)

válida para o tensor ε.Se P 2 = 0, temosE2 = p2c2, em que p é o momento linear tridimensional do campo. Assim,

Pµ é um vetor tipo luz, ou seja, repousa sobre o cone de luz. Neste caso, Pµ =(√

p2,p)

e

W0 = − i2εkmnM

kmPn = −Jkpk = J · p, (5.99a)

Wk = − i2εkνγλM

νγPλ = −EcJk + iεkmnM

0mPn. (5.99b)

A equação 5.99b gera um conjunto de transformações que não preserva o spin do campo,portanto vamos descartá-la como alternativa para construção de um invariante. Por outrolado, W0 é denominado helicidade do campo quando L · p = 0:

h ≡ S · p, (5.100)

e é um invariante relativístico. Se o campo tem spin s, a helicidade tem autovalores

(−s,−s+ 1, · · · , 0, · · · , s− 1, s) .

58

Capítulo 6

O campo escalar

6.1 O campo escalar realO campo relativístico mais simples é aquele cujas componentes são invariantes por transfor-mações de Lorentz. Um campo escalar real é uma função φ (x) :M4 → R tal que

x→ x′ = Λx =⇒ φ (x)→ φ′ (x′) = φ (x) . (6.1)

Obviamente, se φ não muda por rotações em M4, isto implica em que o momento angulartotal do campo é nulo, ou seja, Lµν = 0 e Sµν = 0. Neste caso, um campo cujas componentessão invariantes de Lorentz tem spin zero.

Se o campo tem conteúdo de massa m, temos que P 2φ = m2φ, o que na realização dasposições Pµ = i∂µ resulta na equação de Klein-Gordon-Fock(

+m2)φ = 0. (6.2)

A equação (6.2) é a única equação obedecida por φ, portanto, ela é considerada a equação decampo do campo escalar real.

A densidade lagrangiana relacionada à equação (6.2) é dada por

L =1

2

(∂µφ∂

µφ−m2φ2), (6.3)

que resulta em (6.2) através das equações de Lagrange

δL

δφ− ∂µ

δL

δ (∂µφ)= 0. (6.4)

A densidade de energia-momento é dada por

Hµν =δL

δ (∂µφ)∂νφ− ηµν

[∂γφ∂

γφ−m2φ2]

= ∂µφ∂νφ−1

2ηµν

[∂γφ∂

γφ−m2φ2], (6.5)

que já é simétrico.A função hamiltoniana na dinâmica instantânea é dada por

H =

ˆR3

d3xH00 (x) =

ˆR3

d3x

[∂0φ∂0φ−

1

2η00

(∂γφ∂

γφ−m2φ2)]

=

ˆR3

d3x

(φ2 − 1

2φ2 − 1

2∂kφ∂

kφ+1

2m2φ2

)=

1

2

ˆR3

d3x(φ2 +∇φ · ∇φ+m2φ2

), (6.6)

59

em que usamos a notação φ = ∂0φ. H é uma quantidade conservada no tempo e semprepositiva, portanto é igual ao seu conteúdo de energia. Por outro lado,

pk =

ˆR3

d3xH0k (x) =

ˆR3

d3x∂0φ∂kφ. (6.7)

ou seja,

p =

ˆR3

d3xφ∇φ. (6.8)

Uma maneira imediata de introduzir uma interação é permitir que o campo interaja con-sigo mesmo. No caso do campo escalar isto pode ser feito com termos do tipo λφn, em quen ≥ 3. Um modelo de grande interesse, pois resulta em uma teoria quântica autoconsistente,é dado pela densidade lagrangiana

L =1

2

(∂µφ∂

µφ−m2φ2)− λ

4!φ4, (6.9)

cuja equação de campo é dada por

( +m2

)φ = − λ

3!φ3. (6.10)

Sua densidade de energia-momento vem a ser

Hµν = ∂µφ∂νφ−1

2ηµν

[∂γφ∂

γφ−m2φ2 − 2λ

4!φ4

]. (6.11)

O termo φ4 modifica, portanto, o conteúdo de energia do campo. O conteúdo de momento, poroutro lado, é igual ao do campo livre.

Observação 4. Note que a transformação

φ = −φ

deixa a densidade lagrangiana (6.9) invariante, portanto, não altera a equação decampo (6.10). Esta transformação não é contínua, portanto, não deixa um invariantede Noether. Mas é um exemplo de simetria interna do campo escalar, neste casodenominada Z2. Vamos considerar

V (φ) =1

2m2φ2 +

λ

4!φ4,

em analogia com o potencial em mecânica clássica. Se m é um parâmetro real,m2 > 0 e, assim, V tem um único mínimo em φ = 0. Por outro lado, se m é umnúmero imaginário puro, m2 < 0 e, assim, V tem dois mínimos

φ = ±√− 6

λm2

e um máximo em φ = 0. Os mínimos do potencial estão relacionados com os estadosde vácuo da teoria quântica, de modo que há um vácuo único para m2 > 0, mashá uma degenerescência para m2 < 0. No primeiro caso, o vácuo é invariante pelasimetria Z2. No segundo caso, no entanto, os estados de vácuo não são mais inva-riantes. Dizemos, assim, que a simetria Z2 sofre uma quebra, consistindo em umexemplo simples de quebra espontânea de simetria.

60

6.2 O campo escalar complexoUm campo escalar complexo, por outro lado, é uma função φ (x) :M4 → C tal que

x→ x′ = Λx =⇒ φ (x)→ φ′ (x′) = φ (x) . (6.12)

Novamente, este é um campo de spin zero. O campo complexo também obedece à equação deKlein-Gordon-Fock(

+m2)φ = 0, (6.13a)

mas agora temos também a equação conjugada( +m2

)φ∗ = 0. (6.13b)

A ação deste campo é dada por

A =

ˆM4

d4x(∂µφ

∗∂µφ−m2φ∗φ). (6.14)

Para variar, vamos encontrar as informações necessárias variando a ação com relação a umconjunto de transformações infinitesimais δφ, δφ∗, δxµ. O resultado vem a ser

δA =

ˆd4x∂γ

(∂γφ) δφ∗ + (∂γφ∗) δφ−

[∂µφ

∗∂γφ+ ∂γφ∗∂µφ− δγµ(∂λφ

∗∂λφ−m2φ∗φ)]δxµ

+

ˆd4x

[( +m2

)φ (δxγ∂γ − δ)φ∗ +

( +m2

)φ∗ (δxγ∂γ − δ)φ

]. (6.15)

A segunda linha nos dá as equações de campo (6.13), segundo o princípio de Weiss. O termode fronteira nos dá os momentos covariantes

π∗γ ≡ ∂γφ, πγ ≡ ∂γφ∗ (6.16)

conjugados à variáveis φ∗ e φ respectivamente. O coeficiente de δx é a densidade de energia-momento

Hµν = π∗µπν + π∗νπµ − ηµν(πλπ

∗λ −m2φ∗φ). (6.17)

Na dinâmica instantânea, temos a hamiltoniana

H =

ˆR3

d3x(π∗π +∇φ · ∇φ∗ +m2φ∗φ

), (6.18)

em que π = π0 = φ∗ e π∗ = π∗0 = φ, e os momentos lineares

pk =

ˆR3

d3x[(π0∇φ)

∗+ (π0∇φ)

]. (6.19)

6.3 Simetrias internasA simetria Z2 também está presente no campo escalar complexo. Vamos tratá-la adequada-mente mais adiante. Há uma simetria, contudo, que o campo real não apresenta. Considerea transformação global

φ (x)→ φ′ (x) = eiαφ (x) , φ∗ (x)→ φ′∗ (x) = e−iαφ∗ (x) , (6.20)

em que α é um parâmetro real constante. Esta transformação claramente deixa invariante aação (6.14). Esta é uma transformação interna, que não modifica o ponto do espaço-tempo.

Para o primeiro teorema de Noether, consideramos as versões infinitesimais

δφ (x, α) = iαφ (x) , δφ∗ (x, α) = −iαφ∗ (x) . (6.21)

61

A equação de Lie(δL

δφi− d

dxµδL

δφiµ

)δφi = −∂µ

(δφi

δL

δφiµ−Hµ

νδxν

)torna-se, com δx = 0 e δφ = δφ,(

+m2)φδφ∗ +

( +m2

)φ∗δφ = −∂µ (δφ∗∂µφ+ δφ∂µφ∗) .

Neste caso, as equações de campo implicam na lei de conservação

∂µ (φ∗∂µφ− φ∂µφ∗) = 0, (6.22)

com o uso de (6.21). A carga conservada na dinâmica instantânea é dada por

Q =

ˆR3

d3x(φ∗φ− φ∗φ

). (6.23)

A simetria (6.20) é um exemplo de simetria de gauge global. Ela pertence ao grupo detransformações denominado U (1), que consiste em todas as transformações complexas unitá-rias cuja álgebra possui apenas um gerador, precisamente o número 1. Um membro de U (1) érepresentado simplesmente por um número complexo ω tal que ω∗ω = 1, que pode ser colocadona forma ω = eiα para algum α real. Portanto, a invariância global por U (1) resulta em umacarga conservada (6.23). Podemos tentar identificar Q como a carga elétrica do campo, masesta identificação seria simplesmente incorreta. Um campo livre simplesmente não possuium conteúdo de carga que gere campos eletromagnéticos. A razão é que a invariância globalnão é suficiente para descrever a interação de φ com um campo eletromagnético, qualquerque seja a teoria que o descreva. A localização da simetria por U (1) deve ser implementadapara que o conteúdo de carga elétrica tenha sentido físico.

6.4 Simetrias de gauge locais e interaçãoVamos considerar, agora, as transformações

φ (x)→ φ′ (x) = eiα(x)φ (x) , φ∗ (x)→ φ′∗ (x) = e−iα(x)φ∗ (x) , (6.24)

em que α (x) é um parâmetro real dependente do ponto. Esta é uma transformação de gaugelocal, ainda representada por um membro do grupo U (1). A diferença para o caso global estáno fato de que cada ponto deM4 está ligado a um membro distinto de U (1).

Esta transformação já não deixa invariante a ação (6.14). Note que a densidade lagrangi-ana

L = ∂µφ∗∂µφ−m2φ∗φ (6.25)

transforma-se por

L→ L′ =∂µ

(e−iα(x)φ∗

)∂µ(eiα(x)φ

)−m2φ∗φ

= (∂µ − iαµ)φ∗ (∂µ + iαµ)φ−m2φ∗φ, (6.26)

em que αµ = ∂µα. O problema está nas derivada dos campos, que se transformam por

∂µφ→ ∂µ(eiαφ

)= eiα (∂µ + iαµ)φ,

∂µφ∗ → ∂µ

(e−iαφ∗

)= e−iα (∂µ − iαµ)φ∗.

Ao impor a invariância local sobre a teoria, devemos encontrar uma lagrangiana invari-ante de gauge local. A maneira mais simples é introduzir uma conexão, denominado campode gauge, de componentes Aµ, tal que

Dµ ≡ ∂µ + iqAµ (6.27)

62

pode ser definida como uma derivada covariante. Para que Dµφ seja covariante, temos

D′µφ′ = (∂µφ)

′+ iqA′µφ

=∂µ(eiαφ

)+ iqA′µe

iαφ

=∂µ(eiα)φ+ eiα∂µφ+ ieiαqA′µφ

=eiα[∂µφ+ iq

(−ie−iα∂µ

(eiα)

+A′µ)φ].

A covariância é atestada por Dµφ→ eiαDµφ, de modo que o campo de gauge deve se transfor-mar na forma

A′µ = Aµ + ie−iα∂µ(eiα), (6.28)

ou

A′µ = Aµ − ∂µα. (6.29)

Em vez da densidade lagrangiana (6.25), vamos considerar

L = (Dµφ)∗Dµφ−m2φ∗φ. (6.30)

se a conexão se transforma segundo (6.29), esta lagrangiana é invariante pelas transforma-ções de gauge locais do grupo U (1). (6.30) pode ser reescrita na forma

L = (∂µ − iqAµ)φ∗ (∂µ + iqAµ)φ−m2φ∗φ

= ∂µφ∗∂µφ−m2φ∗φ+AµJµ, (6.31)

em que

Jµ ≡ iq (φ∂µφ∗ − φ∗∂µφ− iqAµφ∗φ) (6.32)

é a densidade de corrente do campo escalar.As equações dos campos escalares da lagrangiana (6.32) são(

+m2)φ = −Aµ δJµ

δφ∗,( +m2

)φ∗ = −Aµ δJµ

δφ, (6.33)

em que

δJµδφ

= iq (∂µφ∗ − iqAµφ∗) = iq (Dµφ)

∗, (6.34a)

δJµδφ∗

= −iq (∂µφ+ iqAµφ) = −iqDµφ. (6.34b)

Portanto, se uma simetria interna local é imposta ao sistema físico, um novo campo A =Aµdx

µ deve ser introduzido, e suas componentes se transformam por

Aµ → Aµ − ∂µα (6.35)

por transformações de gauge locais. Contudo,

x→ Λx =⇒ Aµ → Λ νµ Aν , (6.36)

portanto A é também um covetor de Lorentz. Veremos mais adiante que essas são precisa-mente as características do potencial eletromagnético. Assim, simetria por transformaçõesde gauge locais do grupo U (1) implicam em interação eletromagnética.

A lagrangiana (6.31) não pode ser completa. É necessário acrescentar ao sistema umtermo para o campo eletromagnético livre, que seja um escalar de Lorentz e, também, invari-ante de gauge. Este termo é construído com o tensor

F = Fµνdxµ ∧ dxν , (6.37)

63

em que ∧ é o produto exterior (uma generalização do produto vetorial) e as componentes são

Fµν ≡ ∂µAν − ∂νAµ, (6.38)

automaticamente invariantes de gauge. Neste caso, a lagrangiana completa é dada por

L = −1

4FµνF

µν + ∂µφ∗∂µφ−m2φ∗φ+AµJµ, (6.39)

que consiste em um temo livre do campo eletromagnético, um termo livre do campo escalar eum termo de interação. Esta é a lagrangiana da eletrodinâmica escalar.

Se esta lagrangiana é invariante por U (1) local, ela é automaticamente invariante porU (1) global. Portanto, o primeiro teorema de Noether se aplica, resultando na corrente pró-pria

Φµ = φδL

δ∂µφ− φ∗ δL

δ∂µφ∗

= φ (∂µφ∗ − iqAµφ∗)− φ∗ (∂µφ+ iqAµφ)

= φ (Dµφ)∗ − φ∗Dµφ, (6.40)

que é conservada (∂µΦµ = 0). Na dinâmica instantânea, temos

Q =

ˆR3

d3x[φ (D0φ)

∗ − φ∗D0φ]

=

ˆR3

d3x[φφ∗ − φ∗φ− 2iqV φ∗φ

], (6.41)

em que V = A0 vem a ser o potencial escalar. Neste caso, Q é a carga elétrica do campoescalar.

Observação 5. O procedimento acima pode ser generalizado para uma teoria degauge do grupo U (N). Neste caso, tratamos das transformações mais gerais

φ→ eiαφ = eiαaTaφ, φ∗ → e−iα

†φ∗ = e−iα

aT†aφ∗, (6.42)

em que † é a operação de transposição com conjugação complexa. A derivada covari-ante é definida por

Dµ = 1∂µ + iqAµ, (6.43)

em que A = Aµdxµ = Aaµdx

µTa é um potencial de gauge que toma valores na re-presentação fundamental do grupo U (N), cujos geradores são as matrizes Ta. Noteque, se um elemento do grupo é unitário, temos

U = eiαaTa : U†U = 1,

que implica

U†U = (1 + iαaTa)†

(1 + iαaTa) ≈ 1 + iαaTa − iαaT†a = 1,

ou seja, Ta = T†a, os geradores são hermitianos.A corrente induzida por esta transformação, após exigência de invariância local dalagrangiana, é dada por

Jµ ≡ iq [1∂µφ∗φ− 1φ∗∂µφ− iqAµφ

∗φ] , (6.44)

enquanto a lagrangiana torna-se

L = (Dµφ)†Dµφ−m2φ∗φ = ∂µφ

∗∂µφ−m2φ∗φ+ AµJµ. (6.45)

64

Capítulo 7

O campo eletromagnético

7.1 O campo vetorialUm campo vetorial vem a ser um objeto A : Φ (x)→ Φ (x), em que Φ (x) é o espaço de funçõesescalares com domínio emM4. Em cada ponto do espaço-tempo,A é um vetor de Lorentz quepode ser colocado na forma

A (x) = φµ (x) ∂µ, (7.1)

portanto as componentes φµ (x) possuem a lei de transformação

x′ = Λx =⇒ A′µ (x′) = ΛµνAν (x) , (7.2)

sob transformações de Lorentz. Cada componente é uma função Aµ (x) :M4 → F , em que Fé o conjunto dos números reais se o campo for real, mas complexo se o campo for complexo.Por simplicidade, vamos trabalhar inicialmente com o campo real.

Cada campo vetorial possui um dual, representado por um campo 1-forma diferencial

A (x) = Aµ (x) dxµ, (7.3)

cujas componentes se transformam por

x′ = Λx =⇒ A′µ (x′) = Aν (x)(ΛT)νµ

= Λ νµ Aν (x) . (7.4)

Ambos os campos são necessários para a construção de uma dinâmica que seja invariantede Lorentz. A relação entre as componentes de vetores e covetores é dada pela métrica deMinkowski:

Aµ = ηµνAν , Aµ = ηµνAν . (7.5)

A lagrangiana desta teoria deve ser invariante por Lorentz, então a primeira tentativa deconstrução de uma lagrangiana deve ser com a densidade

L = −1

2

(∂µAν∂

µAν −m2AµAµ),

que descreve um campo vetorial de massa m. Esta densidade lagrangiana possui dois pro-blemas. Primeiro, sua densidade de energia-momento não é positiva-definida, dando origema uma densidade de energia com setor negativo. Para corrigir este problema, o campo deveobedecer à condição ∂µA

µ = 0, denominada condição de Lorenz, ou às condições A0 = 0 e∂iA

i = 0, com i = 1, 2, 3, conhecidas por condições do gauge de radiação. Esses vínculospodem ser integrados à densidade lagrangiana de formas diferentes, mas mostra-se que alagrangiana

L = −1

4(∂µAν − ∂νAµ) (∂µAν − ∂νAµ)− m2

2AµA

µ

65

resolve este problema. É usual introduzir o tensor F = Fµνdxµdxν , com componentes

Fµν ≡ ∂µAν − ∂νAµ, (7.6)

de modo que

L = −1

4FµνF

µν − m2

2AµA

µ. (7.7)

A densidade (7.7) é denominada lagrangiana de Proca. As equações de campo são dadas por

δL

δAµ− ∂ν

δL

δ∂νAµ= 0,

de modo que

δL

δAµ= −m

2

2

δ

δAµ(AγA

γ) = −m2

2

(δAγδAµ

Aγ +AγδAγ

δAµ

)= −m

2

2

(ηγµA

γ +Aγδγµ

)= −m

2

2(Aµ +Aµ)

= −m2Aµ,

e

∂νδL

δ∂νAµ= ∂ν

(δL

δ∂νAµ

)= ∂ν

(δL

δFαβ∂Fαβ

∂ (∂νAµ)

)= ∂ν

[δL

δFαβ∂(∂αAβ − ∂βAα

)∂ (∂νAµ)

]= ∂ν

[δL

δFαβ(δαν δ

βµ − δαµδβν

)].

Nessas ocasiões, em que um objeto antissimétrico é derivado com relação a suas componentes,é comum utilizar a delta antissimetrizada

δα[µδβν] ≡ δ

αµδ

βν − δαν δβµ . (7.8)

Assim,

∂νδL

δ∂νAµ= ∂ν

[δL

δFαβδα[νδ

βµ]

]= 2∂ν

δL

δF νµ

= 2∂νδ

δF νµ

(−1

4FαβF

αβ

)=

1

2∂ν

δ

δFµν(FαβF

αβ)

=1

2∂ν(δFαβδFµν

Fαβ + FαβδFαβ

δFµν

)=

1

2∂ν(ηαµηβνF

αβ + Fαβδαµδ

βν

)=

1

2∂ν (Fµν + Fµν) =

1

2∂ν (Fµν + Fµν) = ∂νFµν .

Faremos mais uso do resultado

δL

δ∂νAµ= Fµν . (7.9)

Então, temos as equações

∂µFµν +m2Aν = 0. (7.10)

Derivando-se (7.10), temos

∂ν∂µFµν +m2∂νA

ν = 0 =⇒ ∂νAν = 0,

pois Fµν é antissimétrico, anulando o primeiro termo. Portanto, o campo de Proca obedece àcondição de Lorenz identicamente.

66

A densidade de energia-momento de (7.7) torna-se

Hµν ≡δL

δ∂µAλ∂νA

λ − ηµνL = −Fµλ∂νAλ − ηµνL,

ou seja,

Hµν = −Fµλ∂νAλ +1

4ηµνFαβF

αβ + ηµνm2

2AγA

γ .

Vamos utilizar a versão simétrica

Tµν = −FµλF λν +

1

4ηµνFαβF

αβ + ηµνm2

2AγA

γ −m2AµAν , (7.11)

que difere de Hµν por uma divergência total:

Tµν −Hµν = −m2AµAν − Fµλ(F λν − ∂νAλ

)= ∂λ (FλµAν) ,

fato que não altera as equações de campo. A equação acima também implica em ∂µTµν = 0.Este tensor dá origem à hamiltoniana

H =

ˆR3

d3xT00 =

ˆR3

d3x

(−F0λF

λ0 +

1

4FαβF

αβ +m2

2AγA

γ −m2A0A0

)=

ˆR3

d3x

(−1

2F0iF

0i +1

4FijF

ij +m2

2AγA

γ +m2A20

), (7.12)

e aos momentos lineares

Pi =

ˆR3

d3xT0i =

ˆR3

d3x(F 0jFij −m2A0Ai

), (7.13)

que são conservados.Uma transformação de Lorentz em um campo vetorial é dada explicitamente por

Aµ (x)→ exp

[i

2ωαβ (Jαβ)

µν

]Aν = Aµ +

i

2ωαβ (Jαβ)

µν A

ν = Aµ + ωµβAβ ,

então, a densidade de spin torna-se

sµαβ =δL

δ∂µAγ∂ (δAγ)

∂ωαβ= −Fµγ ∂ (δAγ)

∂ωαβ= −Fµγ ∂ωγν

∂ωαβAν = −Fµγηγ[αηβ]νA

ν

= −Fµ[αAβ] = FµβAα − FµαAβ . (7.14)

O momento angular orbital, por outro lado, é dado por

`µαβ = Tµ[αxβ]

= Fµλx[αFλβ] −m

2AµA[αxβ] − ηµ[αxβ]L (7.15)

o que resulta no momento angular total

mµαβ = Fµλx[αFλβ] −m

2AµA[αxβ] − Fµ[αAβ] − ηµ[αxβ]L, (7.16)

cuja divergência é nula. A matriz Mαβ é dada por

Mαβ =

ˆR3

d3xm0αβ

=

ˆR3

d3x(−F0iF

ijx[αηβ]j −m2A0A[αxβ] +A[αδiβ]F0i − η0[αxβ]L

)(7.17)

também conservada.

67

7.2 O campo eletromagnéticoO campo eletromagnético é um campo vetorial real de massa nula, que também é uma conexãode gauge do grupo U (1). Neste caso, é mais conveniente defini-lo por sua 1-forma diferencial

A = Aµdxµ, (7.18)

cujas componentes se transformam pela transposta de um elemento do grupo de Lorentz, masque também tem a lei de transformação

Aµ → Aµ − ∂µΛ (7.19)

sob uma transformação de gauge local U (1).O grupo U (1) é o grupo mais trivial de transformações unitárias. Seu elemento mais geral

é escrito por

exp (iα) ,

em que α é um número real. A álgebra infinitesimal é dada pela expansão

exp (iα) ≈ 1 + iα = 1 + iα1,

ou seja, o único gerador é dado pelo número 1.No capítulo anterior, vimos que este campo aparece como o campo que interage com o

campo escalar complexo, quando sua lagrangiana é invariante de gauge local. Esta lagrangi-ana é dada por

L = −1

4FµνF

µν +AµJµ + Lφ, Fµν = ∂µAν − ∂νAµ. (7.20)

em que Lφ é a lagrangiana livre do campo escalar, e Jµ a corrente de interação. Todo campocarregado eletricamente deve interagir com o campo Aµ de maneira similar, como veremosmais adiante. Então, ao estudar exclusivamente o campo eletromagnético e sua interação,podemos trabalhar com

LA = −1

4FµνF

µν +AµJµ. (7.21)

Nosso sistema de unidades, por conveniência, é o natural, em que ~ = c = 1.Neste caso,

δLAδAµ

= Jµ,

enquanto temos o resultado já calculado

∂νδL

δ∂νAµ= ∂νF

µν ,

o que resulta nas equações de campo

∂νFµν = Jµ. (7.22)

Os resultados encontrados para o campo de Proca podem ser utilizados aqui, com m → 0.Neste caso, o tensor densidade de energia-momento tem componentes

Hµν = −Fµλ∂νAλ +1

4ηµνFαβF

αβ , (7.23)

com a versão simétrica

Tµν = −FµλF λν +

1

4ηµνFαβF

αβ . (7.24)

68

Temos também

H =

ˆR3

d3x

(−1

2F0iF

0i +1

4FijF

ij

), (7.25)

como a hamiltoniana conservada, e os momentos lineares conservados

Pi =

ˆR3

d3xF 0jFij . (7.26)

A matriz de momento angular, por outro lado, é dada por

Mαβ =

ˆR3

d3x(−F0iF

ijx[αηβ]j +A[αδiβ]F0i − η0[αxβ]LA

). (7.27)

Note que, tomando-se a derivada de (7.22), temos

∂µ∂νFµν = ∂µJ

µ = 0, (7.28)

portanto, Jµ é uma corrente conservada. Vamos definir suas componentes por

Jµ =(ρ, ji

), (7.29)

em que ρ é a densidade de carga elétrica e j = jiei a densidade de corrente elétrica. Então,

∂µJµ = 0 =⇒ ∂ρ

∂t−∇ · j = 0,

que é a equação de continuidade que envolve a conservação local de cargas elétricas.As equações de campo tornam-se

∂νFµν = Jµ =⇒

∂iF

0i = ρ

∂0Fi0 + ∂jF

ij = ji. (7.30)

Vamos analisar a primeira equação:

ρ = ∂iF0i = ∂i

(∂0Ai − ∂iA0

)= ∂i

(Ai − ∂iA0

),

de modo que V ≡ A0 = A0 vem a ser o potencial eletrostático escalar e Ai são as componentesdo potencial vetor eletromagnético A. Então,

ρ = ∂i

(Ai − ∂iA0

)= ∂i

(∂Ai

∂t− ∂V

∂xi

),

que pode ser escrito por

∇ ·(−∇V − ∂A

∂t

)= ρ. (7.31)

Seja o campo elétrico definido por

E = −∇V − ∂A

∂t, (7.32)

então, a equação (7.31) torna-se

∇ ·E = ρ, (7.33)

que é a lei de Gauss. Portanto, as componentes do campo elétrico são dadas por

Ei = F0i = Ai − ∂iA0 (7.34)

69

A segunda equação em (7.30) resulta em

ji = ∂0Fi0 + ∂jF

ij = ∂0Ei + ∂jF

ij ,

ou seja,

∂jFij = −∂0E

i + ji. (7.35)

Vamos definir o campo magnético B tal que suas componentes sejam dadas por

Bi =1

2εijkF

jk =⇒ Fij = εijkBk. (7.36)

Note que

Bi =1

2εijkFjk =

1

2εijk (∂jAk − ∂kAj) = εijk∂jAk,

que são as componentes do rotacional do potencial vetor, ou seja,

B = ∇×A. (7.37)

Neste caso, (7.35) torna-se equivalente a

εijk∂jBk = −∂0Ei + ji,

ou,

∇×B =∂E

∂t+ j, (7.38)

que vem a ser a lei de Ampère-Maxwell.Com as definições de E e B, temos

Fµν =

0 Ex/c Ey/c Ez/c

−Ex/c 0 −Bz Bx−Ey/c Bz 0 −By−Ez/c −Bz By 0

. (7.39)

A hamiltoniana é dada por

H =

ˆR3

d3x

(−1

2F0iF

0i +1

4FijF

ij

)=

ˆR3

d3x

(1

2EiE

i +1

4εijkB

kεijmBm

)=

ˆR3

d3x

(1

2E2 +

1

4(2δmk )BkBm

)=

ˆR3

d3x

(1

2E2 +

1

2BkBk

)=

1

2

ˆR3

d3x(E2 + B2

), (7.40)

que é o conteúdo de energia do campo eletromagnético.Os momentos lineares, por outro lado, resultam em

Pi =

ˆR3

d3xF 0jFij =

ˆR3

d3xEjεijkBk =

ˆR3

d3xεijkEjBk, ou,

P =

ˆR3

d3x (E×B) =

ˆR3

d3xp, (7.41)

que vem a ser o vetor de Poynting.Ainda temos a matriz de momento angular que, na projeção Mαβ →Mij , torna-se

Mij =

ˆR3

d3x[xi (E×B)j − xj (E×B)i +AiEj −AjEi

]. (7.42)

70

O momento angular total (espacial) é dado por

J i =1

2εijkMjk =

ˆR3

d3x1

2εijk

[xi (E×B)j − xj (E×B)i +AiEj −AjEi

]=

ˆR3

d3xεijk[xi (E×B)j +AiEj

],

ou, equivalentemente,

J =

ˆR3

d3x (x× p + E×A) . (7.43)

Também podemos escrever uma forma explícita para o tensor energia-momento simétricodo campo na dinâmica instantânea. Temos

Tµν =

(E2 +B2

)/2 px py pz

px −σxx −σxy −σxzpy −σyx −σyy −σyzpz −σzx −σzy −σzz

. (7.44)

Nesta expressão, a matriz

σij = EiEj +BiBj −1

2δij(E2 +B2

)=

σxx σxy σxzσyx σyy σyzσzx σzy σzz

(7.45)

é o tensor de tensões de Maxwell.Em resumo, as equações de campo

∂µFνµ = Jµ (7.46)

são equivalentes às equações de Maxwell com fontes

∇ ·E = ρ, ∇×B− ∂E

∂t= j, (7.47)

no sistema de unidades naturais.Note que a combinação de derivadas baixo se anula identicamente,

∂µFαβ + ∂αFβµ + ∂βFµα = 0. (7.48)

Essas são chamadas identidades de Bianchi do campo eletromagnético. Elas podem ser escri-tas com o uso do campo dual

Fµν ≡ εµναβFαβ , (7.49)

na forma

∂µFµν = 0. (7.50)

por exemplo, considere as componentes

F0i =1

2ε0imnF

mn =1

2εimnF

mn = Bi. (7.51)

Por outro lado,

Fij =1

2εijαβF

αβ = εijmF0m = εijmE

m, (7.52)

portanto temos

Fµν =

0 Bx By Bz−Bx 0 −Ez Ey−By Ez 0 −Ex−Bz −Ey Ex 0

. (7.53)

71

As equações (7.50) tornam-se

∂µFµν = 0 =⇒

∂iF

i0 = 0

∂0F0i + ∂iF

ji = 0,

de modo que

∂iFi0 = 0 =⇒ ∇ ·B = 0 (7.54)

e

∂0F0i + ∂iF

ji = 0 =⇒ ∇×E +∂B

∂t= 0, (7.55)

sendo a última, a lei de Faraday.Portanto, o sistema de equações

∂µFµν = −Jν , ∂µF

µν = 0 (7.56)

é equivalente às equações de Maxwell no vácuo

∇ ·E = ρ ∇ ·B = 0,

∇×E +∂B

∂t= 0 ∇×B− ∂E

∂t= j. (7.57)

De fato, este campo representa o campo eletromagnético.

7.3 Liberdade de gaugeA transformação

Aµ → Aµ − ∂µΛ (7.58)

de fato deixa invariante as equações de Maxwell, supondo-se que j não dependa das compo-nentes Aµ. Isto ocorre porque, tendo quatro componentes, o campo A contém apenas doisgraus de liberdade independentes. Vamos supor as equações de Gauss e Ampére com fontesnulas,

∂µFµν = 0, (7.59)

que podem ser escritas por

0 = ∂µFµν = ∂µ (∂µAν − ∂νAµ) = ∂µ∂

µAν − ∂µ∂νAµ.

Então,

Aν − ∂ν∂µAµ = 0. (7.60)

Vamos tomar a equação para ν = 0:

A0 − ∂0∂µAµ =

(− ∂2

0

)A0 + ∂0∇ ·A = 0.

Note que

− ∂20 = ∂µ∂

µ − ∂20 = ∂0∂

0 + ∂i∂i − ∂2

0 = −∇2,

assim,

∇2A0 − ∂0∇ ·A = 0. (7.61)

72

Uma solução formal para (7.61) pode ser escrita por

A0 =(∇2)−1

∂0∇ ·A,

que deve ser compreendida por

A0 (x) =

ˆd3yG (x− y) ∂0∇y ·A (y) , (7.62)

em que G (x− y) é a função de Green para o operador Laplaciano.A equação para ν = i torna-se

A−∇ (∂µAµ) = A−∇∂0A0 +∇ (∇ ·A) = 0. (7.63)

Substituindo-se (7.62),

A−∇∂0

(∇2)−1

∂0∇ ·A +∇ (∇ ·A) = 0.

Inserindo-se a identidade ∇2(∇2)−1

= 1, temos

0 = A−∇∂0

(∇2)−1

∂0∇ ·A +∇2∇(∇2)−1

(∇ ·A)

= A +(−∂2

0 +∇2)∇(∇2)−1

(∇ ·A)

= A−∇(∇2)−1

(∇ ·A)

= [A−∇

(∇2)−1

(∇ ·A)].

Vamos definir a função

Λ =(∇2)−1

(∇ ·A) , (7.64)

assim,

[A−∇Λ] = 0.

Portanto, existe uma transformação de gauge A = A−∇Λ tal que a equação de onda

A =∂2A

∂t2−∇2A = 0 (7.65)

é obedecida. Note que

∇ · A = ∇ ·[A−∇

(∇2)−1

(∇ ·A)]

= ∇ ·A−∇2(∇2)−1

(∇ ·A) = ∇ ·A−∇ ·A = 0, (7.66)

então, nesta escolha de gauge, o divergente de A é nulo. Na equação para A0, temos

A0 =(∇2)−1

∂0∇ ·A =(∇2)−1

∂0∇2Λ = ∂0Λ,

portanto,

A0 = A0 − ∂0Λ = 0. (7.67)

Neste caso, existe uma função Λ (x) tal que toda configuração de campo pode ser levada aobedecer as condições

A0 = 0, ∇ ·A = 0. (7.68)

Essas condições são as condições do gauge de radiação. Neste gauge, o potencial vetor eletro-magnético obedece à equação de onda

A = 0 (7.69)

73

na ausência de fontes.A condição ∇ · A = 0 é denominada condição de Coulomb. Para ver o que esta condição

significa, vamos decompor o campo A (x) em uma transformada de Fourier com relação a umvetor k:

A (x) =

ˆd3kA (k) eik·A(x).

Temos

∇x ·A (x) = ∇x ·ˆd3kA (k) eik·x

=

ˆd3k (A · ∇x) eik·x =

ˆd3kA · kieik·x.

Portanto,

∇ ·A = 0 =⇒ ik ·A (k) = 0, (7.70)

ou seja, a componente de A longitudinal ao vetor k é nula. Dado um vetor k, todo campovetorial pode ser decomposto em componentes longitudinal e transversal,

A = A‖ + A⊥, (7.71)

de modo que

k×A‖ = 0, k ·A⊥ = 0, (7.72)

ou seja,

A‖ =k

k2(k ·A) , A⊥ =

ik

|k|×A. (7.73)

A condição de Coulomb simplesmente seleciona as componentes transversais do potencialvetor, ou seja,

∇ ·A = 0 =⇒ A = A⊥ =ik

|k|×A,

ou, no espaço das posições,

∇ ·A = 0 =⇒ A→ A⊥ = ∇×A. (7.74)

Esta operação pode ser efetuada por um projetor transversal

β⊥ij = δij −(∇2)−1

∂i∂j =⇒ β⊥ij (k) = δij −kikjk2

, (7.75)

de modo que

β⊥A = A− k

k2(k ·A) = A−A‖ = A⊥. (7.76)

74

Capítulo 8

Campos espinoriais

8.1 A álgebra de Clifford relativísticaVamos supor um vetor de Lorentz

u = uµ∂µ = u0∂0 + u1∂1 + u2∂2 + u3∂3, (8.1)

membro do espaço tangente aM4, que denominados pelo símbolo E1. A base ∂µ é apenas umadas possíveis escolhas de base para o espaço-tempo de Minkowski, que resulta no produtoescalar

u · v = uµvµ = ηµνuµvν , (8.2)

em que

ηµν =

1 0 0 00 −1 0 00 0 −1 00 0 0 −1

(8.3)

são as componentes da métrica de Minkowski.Agora, vamos considerar uma base generalizada

u = uµγµ = u0γ0 + u1γ1 + u2γ2 + u3γ3. (8.4)

Considere um produto (u, v) ≡ uv de dois objetos do tipo (8.4). Vamos exigir apenas a bilinea-ridade

(αu+ βv,w) = α (u,w) + β (v, w) , (8.5)

e a associatividade. A norma de um vetor u, contudo, continua definida por

u2 = (u, u) = uµuµ =(u0)2 − (u1

)2 − (u2)2 − (u3

)2, (8.6)

ou seja,

(u, u) = (uµγµ, uνγν) = uµ (γµ, γν)uν = uµuνγµγν

=(u0, u1, u2, u2

)γ0γ0 γ0γ1 γ0γ2 γ0γ3

γ1γ0 γ1γ1 γ1γ2 γ1γ3

γ2γ0 γ2γ1 γ2γ2 γ2γ3

γ3γ0 γ3γ1 γ3γ2 γ3γ3

u0

u1

u2

u3

. (8.7)

Comparando-se (8.6) com (8.7), nota-se que

γ0γ0 = 1, γiγi = −1, (8.8)

75

sem soma em i. Já os termos fora da diagonal devem satisfazer

γµγν + γνγµ = 0, µ 6= ν. (8.9)

A álgebra vetorial ordinária, denominada álgebra de Gibbs, é obtida com γµγν = ηµν ,supondo-se sempre que o produto de dois elementos da base é um escalar. Neste caso, o pro-duto é também simétrico. Mas no caso mais geral, consideramos γµ objetos não comutativosde natureza ainda indeterminada. Assim,

Definição 14. Se γµ ⊂ E1 uma base completa de vetores de Lorentz, que obedeceàs condições gerais de anti-comutação

γµ, γν ≡ γµγν + γνγµ = 2ηµν , (8.10)

dizemos que γµ são geradores de uma álgebra de Clifford C`1,3.

Vemos claramente que (8.10) representa apropriadamente as condições (8.8) e (8.9). Apro-veitamos para introduzir o anti-comutador A,B = AB + BA, e o comutador [A,B] =AB − BA. O produto de Clifford (ou produto geométrico) entre dois vetores u e v é intro-duzido por

uv = (uµγµ) (vνγν) = uµvνγµγν =1

2uµvν γµ, γν+

1

2uµvν [γµ, γν ]

= ηµνuµvν +

1

2uµvν (γµγν − γµγν)

≡ uµvµ + uµvνγµ ∧ γν , (8.11)

em que

Definição 15. Seja γµ ⊂ C`1,3 uma base completa da álgebra de Clifford C`1,3. Oproduto

γµ ∧ γν ≡1

2[γµ, γν ] =

1

2(γµγν − γνγµ) (8.12)

é denominado produto exterior entre dois elementos da base.

Então o produto de Clifford consiste em duas partes. A primeira é o produto escalarordinário entre os vetores u e v. A segunda parte,

u ∧ v ≡ uµvνγµ ∧ γν , (8.13)

envolve o produto exterior entre u e v. Quando u e v são vetores de Lorentz, vemos claramenteque este produto é antissimétrico. Note que u ∧ v não pode ser um escalar, nem um vetor,devido às relações (8.10). Ele forma um novo objeto, denominado forma diferencial desegunda ordem, ou 2-forma. Portanto,

uv = u · v + u ∧ v, (8.14)

em que u · v é igual ao produto escalar ordinário uµvµ, e u ∧ v é uma 2-forma.

Definição 16. Seja γµ ⊂ C`1,3 uma base completa. Um objeto do tipo

α = αµνγµγν (8.15)

é denominado bivetor e pertence a um espaço denominado pelo símbolo E2. Todobivetor pode ser escrito como a soma de um escalar e uma 2-forma.

76

A seguinte questão é imediata: podemos tomar um produto de Clifford entre um vetor eum bivetor? Sejam u ∈ E1 e α ∈ E2, temos

uα = (uµγµ)(ανλγνγλ

)= uµανλγµγνγλ

= u(ανλγνγλ

)= u (ανγηνλ + ανγγν ∧ γγ)

= u(ανν + ανλγν ∧ γλ

)= trαu+ uµανλγµγν ∧ γλ

= trαu+1

2uµανλ γµ, γν ∧ γλ + uµανλγµ ∧ γν ∧ γλ

=(trαuλ + uνα

νλ)γλ + uµανγγµ ∧ γν ∧ γγ . (8.16)

O primeiro termo é um vetor. O segundo é um objeto cuja base envolve um produto exteriortriplo. Este objeto é denominado 3-forma diferencial. Assim, o produto de Clifford uα é asoma de um vetor e uma 3-forma:

Definição 17. Seja γµ ⊂ C`1,3 uma base completa. Um objeto do tipo

T = Tµνλγµγνγλ (8.17)

é denominado trivetor e pertence a um espaço denominado pelo símbolo E3. Todotrivetor pode ser escrito como a soma de um vetor e uma 3-forma.

Por outro lado, o produto de um vetor com um trivetor T ∈ E3 resulta em

uT = uαTµνλγαγµγνγλ, (8.18)

de modo que

uT = uµTµνν + uµT

νµν + uµT

νµν

+(uµT

µαβ + uαTµ βµ + uαT βνν)γα ∧ γβ

+uαTµνλγα ∧ γµ ∧ γν ∧ γλ, (8.19)

que é a soma de um escalar, uma 2-forma e um objeto ainda desconhecido, que obviamenteserá chamado de 4-forma diferencial.

Definição 18. Seja γµ ⊂ C`1,3 uma base completa. Um objeto do tipo

Γ = Γαµνλγαγµγνγλ (8.20)

é denominado quadrivetor e pertence a um espaço denominado pelo símbolo E4.Todo quadrivetor pode ser escrito como a soma de um escalar, uma 2-forma e uma4-forma.

Vamos analisar as bases. Vetores, ou 1-formas diferenciais em nossa notação, são expan-didos com a base da álgebra de Clifford, que consiste no conjunto de quatro objetos indepen-dentes

γ0, γ1, γ2, γ3 .

As 2-formas, por outro lado, possuem seis geradores independentes,

γ0 ∧ γ1, γ0 ∧ γ2, γ0 ∧ γ3, γ1 ∧ γ2, γ1 ∧ γ3, γ2 ∧ γ3 .

A base de 3-formas possui quatro geradores:

γ0 ∧ γ1 ∧ γ2, γ0 ∧ γ2 ∧ γ3, γ0 ∧ γ1 ∧ γ3, γ1 ∧ γ2 ∧ γ3 ,

77

e por fim, o único gerador de uma 4-forma é o elemento de base γ0 ∧ γ1 ∧ γ2 ∧ γ3. Isto ocorrepois qualquer índice repetido anula a base das formas diferenciais. Por esta razão, o produtode um vetor e um 4-vetor não resulta em nenhum objeto novo: 4-formas são o máximo queconseguiremos.

Neste caso, a soma direta E ≡ E0 ⊕ E1 ⊕ E2 ⊕ E3 ⊕ E4 forma um espaço vetorial E sob oproduto de Clifford, cujos elementos são multivetores

u = a+ u+ α+ T + Γ. (8.21)

O espaço multivetorial é fechado pelo produto de Clifford, ou seja, para dois multivetoresu ∈ E e v ∈ E , uv ∈ E . O espaço multivetorial E em conjunto com o produto geométrico é oque denominamos álgebra de Clifford relativística. A seguir, vamos definir alguma operaçõesque dependem exclusivamente desta álgebra.

Definição 19. (Paridade)Seja γµ ⊂ C`1,3 uma base completa. Um operador P , tal que

P−1γµP = δµ0 γ0 − δµi γ

i, (8.22)

é denominado operador de paridade. A operação de paridade mantém o eixo tempo-ral da base, enquanto inverte os eixos espaciais.

Note que

γ0γ0γ0 = γ0

e

γ0γiγ0 = −γ0γ0γi = −γi,

ou seja,

γ0γµγ0 = γ0γµ, γ0

− γ0γ0γµ

= 2ηµ0γ0 − γµ

= 2δµ0 γ0 − δµ0 γ0 − δµi γ

i

= δµ0 γ0 − δµi γ

i.

Ou seja, γ0 atua em um elemento da base como um operador de paridade. De fato, P = γ0

para toda possível representação de uma álgebra de Clifford.

Definição 20. (Reversão temporal)Seja γµ ⊂ C`1,3 uma base completa. Um operador T , tal que

T−1γµT = −δµ0 γ0 + δµi γi, (8.23)

é denominado operador de reversão temporal. A operação de reversão temporalinverte o eixo temporal da base, enquanto deixa invariantes os eixos espaciais.

78

A operação de dualidade é definida como segue.

Definição 21. (Dualidade)Seja Ak ∈ Ek um k-forma no espaçoM4. O dual ?Ak é uma (4-k)-forma

?Ak = −iγ5Ak, (8.24)

em que

γ5 ≡ iγ0γ1γ2γ3. (8.25)

O dual de uma 1-forma é, portanto, uma 3-forma:

?u = −iγ5u

= uµγ0γ1γ2γ3γµ

= u0γ0γ1γ2γ3γ0 + u1γ0γ1γ2γ3γ1 + u2γ0γ1γ2γ3γ2 + u3γ0γ1γ2γ3γ3

= −u0γ1γ2γ3 − u1γ0γ2γ3 + u2γ0γ1γ3 − u3γ0γ1γ2.

O dual de uma 2-forma é uma 2-forma:

?α = −iγ5α

= γ0γ1γ2γ3αµνγµ ∧ γν

= α[01]γ2γ3 + α[20]γ1γ3 + α[03]γ1γ2

+α[21]γ0γ3 + α[13]γ0γ2 + α[32]γ0γ1.

O dual de uma 3-forma é uma 1-forma:

?T = −iγ5T

= −iγ5Tµνγγµ ∧ γν ∧ γγ

= T [012]γ3 + T [013]γ2 + T [023]γ1 + T [123]γ0.

O dual de uma 4-forma é uma 0-forma:

?Γ = −iγ5Γ = Γ[1234]γ5γ5 = Γ[1234].

Definição 22. (Conjugação de carga)Seja γµ ⊂ C`1,3 uma base completa. Um operador C, tal que

C†C = 1 e C†γµC = − (γµ)∗ (8.26)

é denominado operador de conjugação de carga. A operação de conjugação de cargatransforma os geradores em seus opostos conjugados. A relação com a "carga" seráelucidada mais adiante.

8.2 Rotações: a representação espinorial das transfor-mações de Lorentz

Vamos trabalhar, agora, com a álgebra de Clifford gerada pelos objetos

γµ =γ0, γ1, γ2, γ3

, (8.27)

que obedecem às relações de anticomutação

γµ, γν = 2ηµν . (8.28)

79

Não há um conjunto de escalares ou vetores de Lorentz que satisfaçam essas condições, entãodevemos pensar em objetos matemáticos mais gerais, como matrizes complexas. De fato, umainspeção em (8.28) também exclui matrizes quadradas de dimensão 2 ou 3. As matrizes deordem mais baixa que podem representar uma álgebra de Clifford em quatro dimensões sãode dimensão 4.

Uma possível representação é dada pelas matrizes de Dirac

γ0 =

(02×2 12×2

12×2 02×2

), γi =

(02×2 σi

−σi 02×2

), (8.29)

em que σi são as matrizes de Pauli

σ1 =

(0 11 0

), σ2 =

(0 −ii 0

), σ3 =

(1 00 −1

). (8.30)

As matrizes de Pauli, por outro lado, obedecem a uma álgebra de Clifford euclideana em trêsdimensões

σi, σj

= 2δij . Toda possível representação da álgebra de Clifford quadridimen-

sional em termos de matrizes 4× 4 são equivalentes por transformações inversíveis, ou seja

γµ = V γµV −1 =⇒ γµ, γν = 2ηµν .

A representação (8.29) é denominada representação de Weyl, ou chiral, a qual empregaremossempre que necessário.

O fato é que os comutadores

Sµν ≡ i

4[γµ, γν ] =

i

4(γµγν − γνγµ) (8.31)

são geradores da álgebra de Lorentz quadridimensional.

Exercício 1. A partir da definição (8.31), mostre que[Sµν , Sαβ

]= i(ηµβSνα − ηµαSνβ + ηναSµβ − ηνβSµα

)(8.32)

e, portanto, Sµν são geradores de pseudo-rotações emM4.

Na representação chiral, com a dinâmica instantânea, temos

S0i =i

4

[γ0, γi

]= − i

2

(σi 00 −σi

), (8.33)

que são geradores de boosts, enquanto

Sij =i

4

[γi, γj

]=

1

2εijk

(σk 00 σk

)=

1

2εijkΣk, (8.34)

em que σk = −δkiσi, são os geradores de rotações tridimensionais. De fato,

Σi = εijkSjk =

(σi 00 σi

), (8.35)

satisfazem a álgebra de Lie

[Σi,Σj ] = εijkΣk,

portanto, rotações em 3 dimensões também podem ser geradas por Σi.A representação mais trivial de uma transformação de Lorentz no espaço de Minkowski é

a representação adjunta, ou vetorial, na qual a matriz de transformação é dada por

Λαβ ≡ exp

[− i

2ωµν (Mµν)αβ

], (8.36)

80

em que

(Mµν)αβ = i(δµαδ

νβ − δ

µβδνα

)(8.37)

são os geradores de pseudo-rotações nesta representação. A matriz (8.36) determina comouma transformação de Lorentz é aplicada em vetores (A′µ = ΛµνA

ν) ou tensores(

e.g. T ′µν = ΛµαΛνβTαβ)

.O que acabamos de encontrar, com o uso da álgebra de Clifford (8.28), é uma nova represen-tação da álgebra de Lorentz. Como γµ são matrizes 4 × 4 complexas (γµ)ab, o mesmo ocorrecom os geradores Sµν . Portanto, os índices µ, ν = 0, 1, 2, 3 do espaço-tempo são acompanhadospor índices matriciais a, b = 1, 2, 3, 4. Se Sµν obedecem a uma álgebra de Lie (8.32), podemosescrever um elemento do respectivo grupo de Lie por exponenciação,

Sab (Λ) = exp

[− i

2ωµν (Sµν)ab

]. (8.38)

Dizemos que esta é a representação espinorial de um elemento do grupo de Lorentz. Podemosmostrar que não há transformação inversível que conecte a matriz (8.36) à matriz (8.38),portanto, a representação vetorial e a espinorial são inequivalentes. Isto significa que osobjetos que rodam sob a ação de (8.38) não são vetores ou tensores em M4. Os índices a, bserão frequentemente ignorados, já que as operações de transformações são representadaspor multiplicações matriciais simples, a menos de casos em que explicitar esses índices torne-se necessário. Os objetos geométricos sobre os quais age (8.38) são denominados espinores,que serão apropriadamente definidos mais adiante.

Exercício 2. Demonstre a relação de comutação[γµ, Sαβ

]= i(ηµαδβν − ηµβδαν

)γν =

(Mαβ

)µνγν . (8.39)

Com este resultado, mostre também que(1 +

i

2ωαβS

αβ

)γµ(

1− i

2ωαβS

αβ

)≈[δµν −

i

2ωαβ

(Mαβ

)µν

]γν . (8.40)

A forma finita de (8.40) é dada por

S−1 (Λ) γµS (Λ) = Λµνγν . (8.41)

A relação (8.41) tem um significado fundamental. Se S (Λ) é um operador de pseudo-rotação,as matrizes γµ rodam como se fossem vetores de Lorentz.

Uma consequência importante desta construção segue agora. Vamos tomar apenas umarotação genérica em três dimensões

S (R) = exp

(− i

2ωijS

ij

). (8.42)

Uma rotação espacial em um vetor de Lorentz deve ser ortogonal, o que implica que suarepresentação em termos de matrizes complexas deve ser unitária. Se S (R) é unitário, ouseja, S† (R)S (R) = 1,

1 = S† (R)S (R) =

[1 +

i

2ωij(S†)ij] [

1− i

2ωmnS

mn

]≈ 1− i

2ωij

(Sij −

(S†)ij)

,

ou seja,

Sij =(S†)ij

, (8.43)

81

e os geradores devem ser hermitianos. Neste caso, (8.43) implica em

i

4

[γi, γj

]= − i

4

[γi, γj

]†=⇒

[γi, γj

]=[(γi)†,(γj)†]

,

ou seja,(γi)† (

γi)−1

= ±1, (8.44)

então as matrizes γi são hermitianas ou anti-hermitianas. A representação chiral é anti-hermitiana, ou seja, γi = −

(γi)†, então, de fato, S (R) é unitário. Também podemos mos-

trar que uma transformação de similaridade resulta também em uma representação anti-hermitiana para γi.

Vamos ver o que ocorre para os boosts

S (K) = exp

[− i

2ω0iS

0i

]. (8.45)

Se quisermos que S (K) seja unitário, temos igualmente o resultado de que S0i devem serhermitianos, o que resulta em

i

4

[γ0, γi

]= − i

4

[γ0, γi

]†=⇒

[γ0, γi

]=[(γ0)†,(γi)†]

.

Se γi é anti-hermitiano, γ0 também deve ser anti-hermitiano. Por outro lado, uma possí-vel representação hermitiana das matrizes γi implicaria em que γ0 também precisaria serhermitiana. Contudo, γ0 é claramente hermitiana na representação chiral. De fato, não hárepresentação das matrizes de Dirac na qual γ0 e γi sejam hermitianas ou anti-hermitianasem conjunto. Assim, a representação espinorial de boosts de Lorentz não pode ser unitária.

Observação 6. O fato da não unitaridade dos boosts na representação espinorial éum problema fundamental para a formulação da mecânica quântica relativística.Nesta teoria, espinores de Dirac são interpretados como funções de onda, por exem-plo, para o elétron relativístico, o que significa que essas funções definem densidadesde probabilidade de transição entre estados quânticos do elétron. Uma transforma-ção sobre as funções de onda preserva a probabilidade apenas se esta for repre-sentada por um operador unitário ou anti-unitário, o que implica que os geradoresdevem ser hermitianos ou anti-hermitianos. Nossa construção não pode ser umateoria deste tipo. Se boosts são necessariamente não unitários, uma mudança dereferencial inercial resultaria em mudança na probabilidade de transição, ou seja, oespectro do átomo de hidrogênio resultaria ser distinto para dois observadores comvelocidades relativas distintas. Isto é fisicamente inaceitável, portanto um espinorde Dirac não pode ser uma função de onda. A mecânica quântica relativísticaé uma teoria fisicamente incoerente com o princípio da relatividade e, por-tanto, não tem validade física por princípio.

8.3 Representações de spinA representação de Weyl, ou chiral, tem uma grande vantagem operacional. As matrizes γµsão representadas por matrizes 4 × 4 formadas por blocos de matrizes 2 × 2. Isto sugere quepode haver uma representação de pseudo-rotações em duas dimensões, embora essa repre-sentação certamente deve quebrar a álgebra de Clifford quadridimensional.

Vamos observar novamente os boosts

S (K) = exp

[− i

2ω0iS

0i

]= exp

[1

4φiσ

i

(1 00 −1

)]= exp

[(14φiσ

i 00 − 1

4φiσi

)]=

(eφiσ

i/4 0

0 e−φiσi/4

), (8.46)

82

em que φi são as componentes da rapidez φ. Existem, portanto, duas operações distintas,

S± (K) = exp

(±1

4φ · σ

)= exp

[− i

2φ ·K

], (8.47)

em que

K = ± i2σ. (8.48)

As matrizes S± (K) são bidimensionais.Sobre as rotações, temos

S (R) = exp

[− i

2ωijS

ij

]= exp

[− i

2θkσk

(1 00 1

)]=

(e−iθ·σ/2 0

0 e−iθ·σ/2

), (8.49)

em que

θk ≡ 1

2εkijωij .

Então, (8.49) é uma transformação duplicada, com a forma 2× 2

S (J) = exp

(− i

2θ · σ

)= exp [−iθ · J ] , (8.50)

em que

J =σ

2. (8.51)

Exercício 3. Use as matrizes de Pauli para demonstrar as relações de comutação[σi, σj

]= 2iεijkσk. (8.52)

Mostre também que[J i, Jj

]= iεijkJk,

[Ki,Kj

]= −iεijkJk,

[J i,Kj

]= iεijkKk. (8.53)

Portanto, de fato o conjunto de seis geradores J ,K são geradores de transforma-ções de Lorentz.

A relação (8.48) indica que J = ±iK, cada escolha de sinal implica em uma operação deboost distinta. Assim, vamos definir dois geradores

W± =1

2(J ± iK) , (8.54)

que fecham a álgebra[W i±,W

]= iεijkW

k±,

[W i±,W

j∓

]= 0. (8.55)

Portanto, W i± são geradores de duas rotações independentes no plano complexo, com seis

parâmetros independentes. A equação J = ±iK implica emW+ = 0 ouW− = 0, o que definedois estados independentes:

(j, 0) → J = iK =⇒ W− = 0,

(0, j) → J = −iK =⇒ W+ = 0.

83

O número j é o valor da representação de spin. No caso de transformações em que 8.48 e 8.51são os geradores, então j = 1/2.

Assim, temos duas rotações inequivalentes. Não há transformação inversível tal queW+ ↔W−.

Definição 23. Sejam dois objetos ψR e ψL, representados por matrizes coluna 2× 1que, numa transformação de Lorentz, se transformam na forma

ψR −→ exp [2iω ·W+]ψR, ψL −→ exp [2iω ·W−]ψL. (8.56)

Estes objetos são denominados biespinores. Os parâmetros ω são números comple-xos.

O biespinor ψR é denominado espinor de mão direita, ou do tipo (j, 0), enquanto ψL é umespinor de mão esquerda, ou do tipo (0, j). Por convenção, vamos definir o tipo (1/2, 0) pelascondições

J =1

2σ, K = − i

2σ, W− = 0. (8.57)

Assim,

ψR −→ exp [iω ·W+]ψR

= exp [iω · (J + iK)]ψR = exp [i (ω · J + iω ·K)]ψR

= exp[i (θ − iφ) · σ

2

]ψR. (8.58)

O tipo (0, 1/2) é dado por

J =1

2σ, K =

i

2σ, W+ = 0, (8.59)

que resulta em

ψL −→ exp[i (θ + iφ) · σ

2

]ψL. (8.60)

Ambas as representações são inequivalentes por transformações inversíveis.Contudo, espinores de mão direita e esquerda estão relacionados por uma transformação

de paridade. A paridade é uma transformação discreta no espaço-tempo, de modo que os eixossão invertidos, ou seja,

(ct, x, y, z)→ (ct,−x,−y,−z) .

As velocidades, inclusive as relativas entre dois referenciais inerciais, trocam de sinal. Por-tanto, uma operação de paridade é equivalente a uma transformação de Lorentz inversa, emque φ→ −φ. Portanto, os geradoresK também trocam de sinal, ou seja,K → −K. Por outrolado, os geradores J permanecem invariantes (uma rotação no sentido horário permanece nosentido horário após uma transformação de paridade), o que é coerente com o que conhecemosdo momento angular. Assim,

W± →W∓,

o que implica em

ψR ↔ ψL. (8.61)

Vamos considerar, agora, um boost simples em uma direção n do espaço. Temos

ψR −→ exp

(−1

2σ · φ

)ψR = exp

(−1

2σ · nφ

)ψR. (8.62)

84

Exercício 4. Mostre que

(σ · n)k

=

1 se k é par,σ · n se k é ímpar.

(8.63)

Com este resultado, mostre que

exp

(1

2σ · nφ

)= cosh

2

)+ σ · n sinh

2

). (8.64)

Agora, demonstre as relações

cosh

2

)=

√γ + 1

2, sinh

2

)=

√γ − 1

2, (8.65)

Por fim, suponha que o observador original está em repouso, e o segundo observadortem momento p com relação ao primeiro. Neste caso, E2 = m2 + p2 implica emE = γm (c = 1). Mostre que

ψR (p) =E +m+ σ · p√

2m (E +m)ψR (0) . (8.66)

Da mesma forma, mostre que

ψL (p) =E +m− σ · p√

2m (E +m)ψL (0) . (8.67)

Temos que ψR (0) = ψL (0). Portanto,

ψR (u) =E + σ · p

mψL (u) , (8.68a)

e

ψL (u) =E − σ · p

mψR (u) . (8.68b)

Essas equações podem ser colocadas na forma

−mψR + (p0 + σ · p)ψL = 0

(p0 − σ · p)ψR −mψL = 0,

ou em forma matricial(−m p0 + σ · p

p0 − σ · p −m

)(ψRψL

)= 0. (8.69)

Esta equação pode ser escrita em termos das matrizes γµ (8.29) como(γ0p0 + γipi −m1

)ψ = 0,

ou

(γµpµ −m)ψ = 0, (8.70)

em que

ψ =

(ψRψL

). (8.71)

85

A equação (8.70) é a equação de Dirac. Portanto, a equação de Dirac é uma relação algébricaentre os espinores chirais ψR e ψL.

Escrita na forma (8.70), a equação de Dirac supões que ψ = ψ (p) é um campo que dependedo momento do campo com relação a determinado referencial inercial. Assim, a álgebra deClifford é realizada em um espaço de momentos, análogo à representação dos momentos emmecânica quântica. Por outro lago, se supormos que ψ = ψ (x) é um campo com valores noespaço-tempo, os momentos são representados por

pµ = i∂µ. (8.72)

Neste caso, a equação de Dirac no espaço das posições é dado por

(iγµ∂µ −m)ψ (x) = 0, (8.73)

que é um conjunto acoplado de equações diferenciais parciais de primeira ordem. Ambas asrealizações são relacionadas por uma transformada de Fourier

ψ (x) =

ˆd4pψ (p) exp (−ipµxµ) , (8.74)

de modo que

∂λψ (x) =

ˆd4pψ (p) ∂λ exp (−ipµxµ) =

ˆd4p (−ipλ)ψ (p) exp (−ipµxµ) ,

que implica em (8.72).

8.4 Espinores de WeylVamos tomar as equações (8.69)(

−m p0 + σ · pp0 − σ · p −m

)(ψRψL

)= 0, (8.75)

que, com m = 0 tornam-se(0 p0 + σ · p

p0 − σ · p 0

)(ψRψL

)= 0,

ou

γµpµ

(ψRψL

)= 0. (8.76)

Agora, considere as matrizes 2× 2

σµ =(1, σi

)e σµ =

(1,−σi

). (8.77)

Com (8.77), podemos escrever (8.76) por

σµpµψR = 0 e σµpµψL = 0. (8.78)

Neste caso, espinores de mão direita e esquerda não massivos são denominados espinores deWeyl, enquanto (8.78) são as equações de Weyl para estes espinores.

8.5 A ação de DiracConstruir uma ação que resulte na equação (8.73) implica na construção de invariantes deLorentz com as matrizes γµ. A primeira tarefa é construir um escalar, cuja primeira tentativapode ser simplesmente o objeto

ψ† (x)ψ (x) ,

86

em que ψ† é o operador auto-adjunto de ψ, ou seja, ψ† = (ψ∗)T . Para que este objeto seja um

escalar, é necessário que(ψ†ψ

)(x)→

(ψ†ψ

) (Λ−1x

)sob uma transformação de Lorentz Λ. Os espinores, contudo, se transformam por

ψ (x)→ S (Λ)ψ(Λ−1x

)e ψ† (x)→ ψ†

(Λ−1x

)S† (Λ) .

Assim,

ψ† (x)ψ (x)→ ψ†(Λ−1x

)S† (Λ)S (Λ)ψ

(Λ−1x

),

que resultaria em um escalar se S (Λ) fosse unitário.O fato de não haver representação 4× 4 unitária do grupo de Lorentz impede, assim, que

ψ†ψ seja um escalar de Lorentz. Note, contudo, que podemos usar a operação de paridadepara encontrar uma função adequada, já que γ0γ0 = 1 implica em γ0 =

(γ0)† e γiγi = −1

implica em γi = −(γi)†, como já vimos. Neste caso,

P−1γµP = (γµ)†, P = γ0. (8.79)

Por outro lado,

(Sµν)†

= − i4

[γµ, γν ]†

=i

4

[(γµ)

†, (γν)

†]

=i

4

[γ0γµγ0, γ0γνγ0

]=i

4γ0 [γµ, γν ] γ0

= γ0Sµνγ0, (8.80)

que implica em

S† (Λ) = exp

(− i

2ωµνS

µν

)†= exp

(i

2ωµν (Sµν)

†)

= exp

(i

2ωµνγ

0Sµνγ0

)= γ0 exp

(i

2ωµνS

µν

)γ0

= γ0S−1 (Λ) γ0, S−1S = 1. (8.81)

Assim, definimos

Definição 24. (Espinor de Dirac adjunto)O objeto

ψ (x) = ψ† (x) γ0 (8.82)

é denominado adjunto de ψ (x).

Agora, mostramos que ψψ é um escalar de Lorentz:

ψψ = ψ†γ0ψ = ψ†γ0ψ →ψ†S†γ0Sψ = ψ†γ0S−1γ0γ0Sψ

= ψ†γ0S−1Sψ = ψ†γ0ψ = ψψ,

ou explicitando os argumentos,(ψψ)

(x)→(ψψ) (

Λ−1x). (8.83)

Afirmação 1. O objeto

ψ (x) γµψ (x) (8.84)

é um vetor de Lorentz.

87

Para demonstrar esta afirmação, vamos utilizar o resultado (8.41)

S−1 (Λ) γµS (Λ) = Λµνγν ,

tendo em mente que

ψ (x)→ ψ(Λ−1x

)S−1 (Λ) .

Assim,

ψ (x) γµψ (x)→ψ(Λ−1x

)S−1 (Λ) γµS (Λ)ψ

(Λ−1x

)= ψ

(Λ−1x

)Λµνγ

νψ(Λ−1x

)= Λµν

[ψγνψ

] (Λ−1x

),

o que prova a Afirmação 1.Da mesma forma, podemos demonstrar que

ψγµγνψ =1

2ψ γµ, γνψ +

1

2ψ [γµ, γν ]ψ

= ηµνψψ − 2i(ψSµνψ

)(8.85)

transforma-se como um tensor de Lorentz do tipo (2, 0), e constitui um bivetor. Toda formamultilinear pode ser construída a partir de ψψ, ψγµψ e ψγµγνψ, de modo que escalares podemser definidos a partir da contração desses multivetores.

Definição 25. A ação de Dirac é definida pelo funcional

A ≡ˆ

Ω

dωψ (x) (iγµ∂µ −m)ψ (x) . (8.86)

É fácil demonstrar que o objeto ψ (iγµ∂µ)ψ é um invariante de Lorentz:

ψ (x)(iγµ∂xµ

)ψ (x)→ψ

(Λ−1x

)S−1 (Λ)

(iγµ

(Λ†) ν

µ∂Λ−1xν

)S (Λ)ψ

(Λ−1x

)= ψ

(Λ−1x

)S−1 (Λ) (iγµ)S (Λ)

(Λ†) ν

µ∂Λ−1xν ψ

(Λ−1x

)= ψ

(Λ−1x

)Λµλ

(iγλ) (

Λ†) ν

µ∂Λ−1xν ψ

(Λ−1x

)= ψ

(Λ−1x

) (iγν∂Λ−1x

ν

)ψ(Λ−1x

). (8.87)

O termo mψψ, que é um invariante já que m é um invariante, representa o termo de massado campo.

8.6 Aplicando o princípio de WeissAgora, vamos mostrar que a equação de Dirac surge da ação (8.86), juntamente com umaequação adjunta. Além disso, estamos interessados em calcular o tensor energia-momento docampo ψ e os invariantes dinâmicos relacionados à simetrias desta ação. Contudo, esta açãopode ser suplementada por um termo de fronteira, que não modifica as equações de campo,de modo que usaremos a integral simétrica

A ≡ˆ

Ω

dωψ (x)

(iγµ↔∂ µ −m

)ψ (x) , (8.88)

88

em que

ψγµ↔∂ µψ =

1

2

(ψγµ∂µψ − ∂µψγµψ

). (8.89)

Consideremos a seguinte transformação infinitesimal

δx = x′ − x, δψ (x) = ψ′ (x′)− ψ (x) , δψ (x) = ψ′ (x′)− ψ (x) . (8.90)

A transformação no espinor adjunto ψ é considerada independente da transformação em ψ.

δA = δ

ˆΩ

dωψ

(iγµ↔∂ µ −m

)ψ = δ

ˆΩ

dωψDψ, D ≡ iγµ↔∂ µ −m,

=

ˆΩ

δdωψDψ +

ˆΩ

dωδ[ψDψ

]=

ˆΩ

dω∂λδxλψDψ +

ˆΩ

dωδ[ψDψ

]=

ˆΩ

dω(δ − δxλ∂λ

) [ψDψ

]+

ˆΩ

dω∂λ[ψDψδxλ

]=

ˆΩ

dωδ[ψDψ

]+

ˆΩ

dω∂λ[ψDψδxλ

], δ ≡ δ − δxλ∂λ.

Temos que calcular o termo

δ[ψDψ

]= δψ (Dψ) + ψδ [Dψ] .

Temos

δ (∂µψ) = ∂µ(δψ)

=⇒ δD = Dδ,

de modo que

δ[ψDψ

]= δψ (Dψ) + ψD

[δψ]

= δψ

(iγµ↔∂ µ −m

)ψ + ψ

(iγµ↔∂ µ −m

)δψ

= iδψγµ↔∂ µψ −mδψψ + iγµψ

↔∂ µδψ −mψδψ

=i

2

[δψγµ∂µψ − ∂µ

(δψ)γµψ + ψγµ∂µ

(δψ)− ∂µψγµδψ

]−m

(δψ)ψ −mψ

(δψ)

= δψiγµ∂µψ −m(δψ)ψ − ∂µψiγµδψ −mψ

(δψ)

+ ∂µ

(i

2ψγµδψ

)− ∂µ

(i

2δψγµψ

)= δψ (iγµ∂µ −m)ψ −

(∂µψiγ

µ +mψ)δψ + ∂µ

(i

2ψγµδψ − i

2δψγµψ

)Vamos definir as derivada à direita e à esquerda

ψγµi←∂ µ ≡ i∂µψγµ, iγµ

→∂ µ ≡ iγµ∂µψ (8.91)

Assim,

δ[ψDψ

]= δψ

(iγµ→∂ µ −m

)ψ − ψ

(i←∂ µγ

µ +m

)δψ + ∂µ

(i

2ψγµδψ − i

2δψγµψ

)(8.92)

Então,

δA =

ˆΩ

[δψ

(iγµ→∂ µ −m

)ψ − ψ

(i←∂ µγ

µ +m

)δψ

]+

ˆdiv, (8.93)

em queˆ

div ≡ˆ

Ω

dω∂λ

(i

2ψγλδψ − i

2δψγλψ + ψDψδxλ

). (8.94)

89

Para que δA seja um termo de fronteira, temos as equações de Dirac(iγµ→∂ µ −m

)ψ (x) = 0, (8.95a)

ψ (x)

(iγµ←∂ µ +m

)= 0, (8.95b)

tanto para ψ quanto para o adjunto ψ.O termo de fronteira é escrito porˆ

Ω

dω∂λ

(i

2ψγλδψ − i

2δψγλψ −

[(i

2ψγλ

)∂γψ + ∂γψ

(− i

2γλψ

)− δλγ ψDψ

]δxγ). (8.96)

Neste caso, temos os momentos conjugados

πλψ =i

2ψγλ, πλψ = − i

2γλψ, (8.97)

e a densidade de energia-momento

Tαβ = παψ∂βψ + ∂βψπαψ − η

αβψDψ. (8.98)

90

Capítulo 9

Campos de Gauge

9.1 Revisitando o campo escalarNo capítulo 6, vimos que o campo escalar complexo possui uma simetria especial, caracteri-zada pelas transformações

φ (x)→ Uφ (x) , U = eiα. (9.1)

Se α é um parâmetro real independente do evento espaço-temporal, esta transformação édenominada transformação de gauge global do grupo U (1). O grupo U (1) é o grupo de todasas matrizes quadradas, complexas e unitárias de dimensão 1, ou seja, U é um simples númerocomplexo unitário. Esta transformação deixa invariante a densidade Lagrangiana

L = ∂µφ∗∂µφ−m2φ∗φ. (9.2)

Esta densidade lagrangiana, contudo, não é mais invariante se a transformação for local, ouseja, α→ α (x). Neste caso, a transformação

φ (x)→ U (x)φ (x) , U = eiα(x), (9.3)

implica na transformação

L→ L′ = (∂µ − i∂µα)φ∗ (∂µ + i∂µα)φ−m2φ∗φ. (9.4)

Para introduzir uma Lagrangiana localmente invariante, precisamos de um campo deconexão de componentes Aµ, que se transforma por

Aµ (x)→ Aµ (x) + iU−1 (x) ∂µU (x) = Aµ (x)− ∂µα (x) . (9.5)

Neste caso, a derivada covariante

Dµ ≡ ∂µ + iqAµ (9.6)

define a lagrangiana invariante de gauge local

L = (Dµφ)∗Dµφ−m2φ∗φ = ∂µφ

∗∂µφ−m2φ∗φ+AµJµ, (9.7)

com a corrente de interação

Jµ ≡ iq (∂µφ∗φ− φ∗∂µφ− iqAµφ∗φ) . (9.8)

Portanto, a invariância de gauge local de uma teoria escalar implica na necessidade daintrodução de um campo interagente, representado por Aµ. Se este campo se transformacomo (9.5) por transformações de gauge do grupo U (1), ele é um campo de conexão de gaugedo grupo U (1). Se, em adição, este campo for um vetor de Lorentz, ou seja,

xµ = Λµνxν =⇒ Aµ = ΛµνA

ν ,

91

Aµ serão as componentes de um campo eletromagnético. A Lagrangiana completa

L = (Dµφ)∗Dµφ−m2φ∗φ− 1

4FµνF

µν , (9.9)

com

Fµν ≡ ∂µAν − ∂νAµ, (9.10)

descreve a teoria do campo escalar complexo carregado em um campo eletromagnético.

9.2 Transformações de gauge globaisDesde então, fizemos um progresso considerável, especialmente ao estudar o campo eletro-magnético livre e ao introduzir o campo espinorial de Dirac. Nossa intensão, agora, é aplicaro espírito da invariância de gauge local a campos espinoriais. O procedimento mais geralpossível resulta no que, hoje, conhecemos por teorias de gauge.

Vamos começar com um conjunto de N espinores ψi (x), todos com o mesmo parâmetro demassa m. Lembremos que cada espinor é um objeto com quatro componentes (em nosso es-paço quadridimensional), então o índice i neste capítulo não denota componentes espinoriais,que permanecerão implícitas, mas apenas identifica cada espinor. A lagrangiana livre desteconjunto de campos é dada por

L = ψi(iγµ↔∂ µ −m

)ψi, (9.11)

com soma no índice i = 1, · · · , N . Por construção, esta lagrangiana é um invariante de Lo-rentz, mas também é um invariante U (1) global:

ψi → eiαψi , ψi → ψie−iα =⇒ L→ L. (9.12)

Neste expressão, α é um parâmetro real constante.No entanto, esta não é a única simetria interna. Considere a matriz Uij , com i, j =

1, · · · , N , e a transformação

ψi → U ijψj . (9.13)

Neste caso, temos(ψi)† → (

U ijψj)†

=(ψj)† (

U ij)†

=(ψ†)j (

U†) ij,

ou seja,(ψi)†γ0 →

(ψ†)jγ0(U†) ij,

o que resulta em

ψi → ψj(U†) ij. (9.14)

Neste caso,

ψi(iγµ↔∂ µ −m

)ψi → ψk

(U†) ik

(iγµ↔∂ µ −m

)U ji ψj

= ψk(U†) ikU ji

(iγµ↔∂ µ −m

)ψj ,

se Uij tiver componentes constantes.Se a transformação é unitária, temos(

U†U)ij

=(U†)ikUkj = δij ,

92

ou seja,

ψk(U†) ikU ji

(iγµ↔∂ µ −m

)ψc = ψkδjk

(iγµ↔∂ µ −m

)ψj = ψi

(iγµ↔∂ µ −m

)ψi.

Neste caso,

ψi → U ijψj =⇒ L→ L, (9.15)

e a lagrangiana é invariante global.Agora, a transformação não envolve apenas um número complexo, mas uma matriz com-

plexa unitária. O conjunto de todas as matrizes complexas unitárias N ×N forma um grupo,o grupo U (N). Contudo, estamos interessados no subgrupo conexo à identidade, ou seja, de-sejamos que um elemento do grupo possa ser expandido em transformações infinitesimais naforma

Uij = δij + ωij = δij + iωaTaij .

O índice a é o índice da álgebra de Lie das transformações infinitesimais. Para que Uij sejaconexo à identidade, detUij = 1. Neste caso, transformações do grupo U (N) conexas à identi-dade formam um subgrupo denominado SU (N): S para "special", que significa determinante1, e U para "unitary". Portanto, temos a

Proposição 3. Um conjunto de N espinores livres de mesmo parâmetro de massaformam um sistema invariante global sob a ação do grupo SU (N).

Para evitar a sobrecarga de índices, vamos usar uma notação matricial. Assim, a matrizde componentes Uij é denotada por U , e os espinores ψi serão parte de uma matriz colunaN × 1, ψ. Cada componente desta coluna é, em si, uma coluna de quatro componentes, ascomponentes espinoriais: ψ é, assim, uma coluna de colunas. A transformação (9.13) é escritaapenas por

ψ → Uψ, ψ → ψU †, (9.16)

e é denominada transformação de gauge.O grupo SU (N) é um grupo de Lie. Portanto, um elemento de SU (N) tem a forma geral

U = exp (iωaT a) , (9.17)

em que T a são geradores de uma álgebra de Lie su (N) com as relações de comutação

[Ta,Tb] = −if cab Tc, (9.18)

para um conjunto de coeficientes de estrutura fabc. Cada gerador é representado por umamatriz N ×N hermitiana e de traço nulo. Estes geradores definem a representação funda-mental do grupo SU (N). O número de geradores da álgebra, ou seja, a dimensão da álgebraé dada por N2 − 1, ou seja, a = 1, · · · , N2 − 1. A forma infinitesimal é dada por

U = 1 + iωaTa, (9.19)

A rigor, escrevemos a densidade lagrangiana

L = ψ

(iγµ1

↔∂ µ − 1m

)ψ. (9.20)

93

Observação 7. Por exemplo, a cromodinâmica é uma teoria de gauge do grupo SU (3),que é o grupo de matrizes unitárias de determinante 1. Quarks são representadospor espinores na representação fundamental do grupo, ou seja, ψ toma a forma deuma matriz 3 × 1, enquanto ψ é uma matriz 1 × 3. Quarks também vêm em seistipos, denominados sabores, com massas distintas mI . Sua densidade lagrangianalivre é dada por

LCD =

6∑I=1

ψI

(iγµ↔∂ µ −mI

)ψI .

O grupo SU (3) tem oito geradores na representação fundamental, Ta = γa/2, emque γa podem ser representados pelas oito matrizes de Gell-Mann

γ1 =

0 1 01 0 00 0 0

, γ2 =

0 −i 0i 0 00 0 0

, γ3 =

1 0 00 −1 00 0 0

,

γ4 =

0 0 10 0 01 0 0

, γ5 =

0 0 −i0 0 0i 0 0

, γ6 =

0 0 00 0 10 1 0

,

γ7 =

0 0 00 0 −i0 i 0

, γ8 =1√3

1 0 00 1 00 0 −2

.

Os coeficientes de estrutura da álgebra, fabc, são dados por

f123 = −1,

f147 = f165 = f246 = f257 = f345 = f376 = −1/2,

f458 = f678 = −√

3

2,

enquanto os demais são permutações destes, ou zero.

9.3 Transformações de gauge locaisA lagrangiana (9.20), portanto, é invariante global pelo grupo SU (N). Contudo, a localizaçãodo grupo de gauge, como no caso do campo escalar complexo, resulta na quebra de invariânciade (9.20). Mais uma vez, o problema está no fato de que as derivadas ∂µψ e ∂µψ não sãocovariantes por transformações de gauge locais. Seja

U (x) = exp (iωa (x)T a) , (9.21)

temos

ψ (x)→ U (x)ψ (x) =⇒ ∂µψ (x)→ U (x) ∂µψ (x) + ∂µU (x)ψ (x) , (9.22)

enquanto os campos adjuntos se transformam por

ψ (x)→ ψ (x)U † (x) =⇒ ∂µψ (x)→ ∂µψ (x)U † (x) + ψ (x) ∂µU† (x) . (9.23)

Seguindo a ideia de que teorias fundamentais da natureza devem ser invariantes por trans-formações de gauge locais, precisamos encontrar uma densidade lagrangiana localmente in-variante. Mais uma vez a introdução de uma lagrangiana invariante pode ser efetuada coma inclusão de um campo de conexão ao formalismo, e assim uma derivada covariante pode serconstruída. Este procedimento é conhecido como acoplamento mínimo.

94

O campo de conexão é introduzido pela forma diferencial

A = Aµdxµ, (9.24)

em que os campos Aµ = AaµT a assumem valores na representação fundamental da álgebrasu (N). A forma (9.24) é automaticamente invariante de Lorentz se as componentes se trans-formarem comoAµ → Λ ν

µ Aν diante de uma pseudo-rotação emM4. Neste caso, introduzimosa seguinte derivada na representação fundamental,

Dµ ≡ 1∂µ − igAµ, (9.25)

em que g é denominada constante de acoplamento. Usando (9.22), vemos que a derivadaDµψtransforma-se por

Dµψ → (Dµψ)′

= D′µψ′ =

(1∂µ − igA′µ

)Uψ

= 1∂µ (Uψ)− igA′µUψ = U∂µψ + (∂µU)ψ − igA′µUψ

= U∂µψ +UU † (∂µU)ψ − igUU †A′µUψ

= U∂µψ +U[U † (∂µU)− igU †A′µU

= U

1∂µ − ig

[U †A′µU +

i

gU † (∂µU)

]ψ.

Para que a derivada seja covariante, a lei de transformação deve ser Dµψ → U (Dµψ), demodo que a conexão deve ser transformar por

Aµ = U †A′µU +i

gU † (∂µU) , (9.26)

ou

Aµ → A′µ = UAµU† − i

g(∂µU)U †. (9.27)

Todo campo vetorial que se transforma como (9.27) é denominado conexão de gauge.Vamos observar a forma infinitesimal de (9.27), que é dada por

Aµ → A′µ = (1 + iωaT a)Aµ

(1− iωbT b

)− i

gU (i∂µω

aT a)U †,

ou seja, em primeira ordem,

δAµ =1

g∂µω

aT a − iωa [Aµ,T a] .

Explicitando as componentes da álgebra, Aµ = AaµT a, temos

δAaµT a =1

g∂µω

aT a − iωaAbµ [T b,T a] .

Usando as relações de comutação fundamentais (9.18), temos

δAaµT a =1

g∂µω

aT a + ωaf cab A

bµT c,

que com troca de índices mudos torna-se

δAcµT c =1

g∂µω

cT c + ωaf cab A

bµT c.

Como os geradores são linearmente independentes, temos

δAaµ =1

g

(∂µω

a + gfacbAbµω

c). (9.28)

95

As relações (9.28) definem as transformações de gauge das componentes Aaµ dos camposde gauge. Esta é a forma "favorita" dos físicos, enquanto a forma (9.27) é mais utilizada pelosmatemáticos, que preferem trabalhar em notação independente de representação. A forma(9.28) explicita, por outro lado, uma segunda derivada covariante:

δAaµ =1

g

(δac ∂µ + gfacbA

)ωc =

1

g(Dµ)

ac ω

c,

em que

(Dµ)ac ≡ δ

ac ∂µ − gfabcAbµ. (9.29)

Observação 8. A derivada (9.29), longe de ser completamente distinta da derivada(9.25), é na verdade a mesma derivada em outra representação, a representaçãoadjunta. Na representação adjunta, um elemento do grupo SU (N) é representadopor matrizes

(N2 − 1

)×(N2 − 1

), ou seja, os geradores da álgebra são representados

por(N2 − 1

)matrizes

(N2 − 1

)×(N2 − 1

): a dimensão da representação é a mesma

dimensão da álgebra.Neste caso, a lógica dita que devemos pensar em objetos abstratos que podem serrealizados em representações do grupo de gauge. Temos a derivada covariante

Dµ = ∂µ − igAµ, (9.30)

sem negrito, como a derivada completamente abstrata, independente de represen-tação. Ao escolher uma representação, por exemplo a fundamental, temos

fund (Dµ) = fund (1) ∂µ − igfund (Aµ)

= fund (1) ∂µ − igAaµfund (Ta) , (9.31)

em que fund (1) = 1 é a identidade na representação fundamental, N ×N , enquantofund (Ta) = T a são os geradores da álgebra nesta mesma representação, N2 − 1matrizes N × N . Na representação fundamental, a derivada covariante toma aforma explícita (9.25).Na representação adjunta, temos

adj (Dµ) = adj (1) ∂µ − igAaµadj (Ta) . (9.32)

Esta representação realiza o grupo de Lie como matrizes(N2 − 1

)×(N2 − 1

)e,

por consequência, a dimensão da representação é a mesma da álgebra. De fato,adj (1)

ab = δab é a identidade nesta representação, enquanto adj (Ta)bc ≡ (Ta)bc =

ifabc, ou seja, os geradores são relacionados às constantes de estrutura. Neste caso,(9.32) torna-se

(Dµ)ab = δab ∂µ − igAcµ (Tc)

ab

= δab ∂µ − igAcµ (i) f ac b = δab ∂µ − gfacbAcµ,

que corresponde a (9.29).

Assim, nas componentes da álgebra, a transformação dos campos de gauge é dada por

δAaµ =1

g(Dµ)

ab ω

b =1

g[Dµω]

a, (9.33)

em que usamos a notação mais compacta [Dµω]a ≡ (Dµ)

ab ω

b para a derivada covariante narepresentação adjunta.

96

Observação 9. Note que, se o grupo de simetria é U (1), a álgebra de Lie é trivial, comgeradores que são simplesmente o número 1. Neste caso, o campo de gauge é o pró-prio campo eletromagnético, visto que todo o procedimento acima é realizado comfabc = 0. A derivada covariante na representação fundamental torna-se simples-mente Dµ ≡ ∂µ − igAµ, enquanto na representação adjunta ela é igual à derivadaordinária. Neste caso, temos δA = (1/g) ∂µω, que é a transformação de gauge docampo eletromagnético.

9.4 A lagrangiana invarianteSe os campos de gauge se transformam por (9.33), ou mesmo (9.27), a derivadaDµψ é covari-ante por transformações de gauge. Neste caso, devemos substituir a derivada ordinária peladerivada covariante, especialmente no termo

ψγµ↔∂ µψ =

1

2

(ψγµ∂µψ − ∂µψγµψ

). (9.34)

Para o primeiro termo à direita, é imediato ver que a substituição

ψγµ∂µψ → ψγµDµψ (9.35)

dá origem a um termo invariante.O segundo termo requer certo cuidado. Ele torna-se

∂µψγµψ → ψγµ

←D†

µψ = ψγµ(

1←∂ µ + igAµ

= ∂µψγµψ + igψγµAµψ.

Podemos verificar que este termo também é invariante. Uma transformação de gauge resultaem (

∂µψU† + ψ∂µU

†)γµUψ + igψU †γµA′µUψ =

= ∂µψγµψ + ψ∂µU

†γµUψ + igψγµ(U †A′µU

)ψ =

= ∂µψγµψ + ψ∂µU

†γµUψ + igψγµ(Aµ −

i

gU † (∂µU)

)ψ =

= ∂µψγµψ + igψγµAµψ + ψγµ∂µ

(U †U

)ψ = ∂µψγ

µψ + igψγµAµψ.

Assim, a densidade lagrangiana

L = ψ

(iγµ↔Dµ − 1m

)ψ (9.36)

é um invariante de gauge, com

ψγµ↔Dµψ ≡

1

2

(ψγµ

→Dµψ − ψγµ

←D†

µψ

). (9.37)

Note que

ψiγµ↔Dµψ =

1

2i

(ψγµ

→Dµψ − ψγµ

←D†

µψ

)=

1

2i

(ψγµ (1∂µ − igAµ)ψ − ψγµ

(1←∂ µ + igAµ

)=

1

2i

(ψγµ∂µψ − ψγµ

←∂ µψ − 2igψγµAµψ

)=

1

2i

(ψγµ∂µψ − ψγµ

←∂ µψ

)+ gψγµAµψ,

97

ou seja, a densidade (9.36) equivale à lagrangiana

L = ψ

(iγµ↔∂ µ − 1m

)ψ + gψγµAµψ. (9.38)

O termo gψγµAµψ torna-se

gψγµAµψ = Aaµ(gψγµT aψ

)= AaµJ

µa ,

em que

Jµa ≡ gψγµT aψ (9.39)

é a corrente fermiônica, fonte dos campos de gauge. Portanto, outra forma para as densidadeslagrangianas (9.36) e (9.38) vem a ser a lagrangiana

L = ψ

(iγµ↔∂ µ −m

)ψ +AaµJ

µa (9.40)

Então, a imposição de uma teoria localmente invariante pelo grupo de gauge implica naexistência de um termo de interação do tipo corrente-campo de gauge, assim como vimos nocaso do campo escalar.

98

Referências Bibliográficas

[1] Notas de aula do Aldrovandi.

[2] Landau Classical Fields.

[3] Jackson Electrodynamics.

[4] Jayme Vaz Jr. (Clifford algebra and spinors).

[5] Jayme Vaz Jr. (Artigos de ensino).

[6] Peskin.

[7] Rider.

[8] Greiner.

[9] Landau Quantum Electrodynamics.

[10] Livros em simetrias, grupos e álgebras de Lie.

[11] Grasmann & Hamilton.

[12] C. Lanczos, The variational principles of mechanics, fourth edition, Dover Publications(1986).

[13] I. M. Gelfand & S. V. Fomin, Calculus of variations, Dover Publications (2000).

[14] H. Rund, The Hamilton-Jacobi theory in the calculus of variations; its role in mathema-tics and physics, Van Nostrand (1966).

[15] N. P. Konopleva & V. N. Popov, Gauge fields, Harwood Academic Publishers (1981).

[16] A. O. Barut, Electrodynamics and the classical theory of fields and particles, McMillan(1982).

[17] C. A. Bonin, R. Bufalo, B. M. Pimentel & G. E. R. Zambrano, Podolsky electromagne-tism at finite temperature: Implications on the Stefan-Boltzmann law, Phys. Rev. D 81,025003 (2010).

[18] E. Noether, Invariant variation problems, tradução por M. A. Travel, ar-Xiv:physics/0503066v1 [physics.hist-ph] (2005).

[19] E. P. Wigner, On unitary representations of the inhomogeneous Lorentz group, Annals ofMathematics 40 149–204 (1939).

99