Uploaded by mfonsecapaiva

Apontamentos - Carlos Herdeiro

advertisement
Notas de
Mecânica Quântica
Carlos A. R. Herdeiro
Departamento de Fı́sica
Faculdade de Ciências da Universidade do Porto
2007-08
v4.0
Agradecimentos
É um prazer agradecer à Professora Renata Arala Chaves, ao Professor Eduardo Lage e
ao Professor João Lopes dos Santos a oportunidade de leccionar as cadeiras de Mecânica
Quântica I e Mecânica Quântica II como Professor Auxiliar Convidado, durante os anos
lectivos 2003/2004 a 2006/2007, no Departamento de Fı́sica da Faculdade de Ciências da
Universidade do Porto. Uma palavra muito especial à Professora Fátima Mota pelo apoio
sempre presente.
Junho de 2007
Carlos Herdeiro
(Alguma) Cronologia relacionada com o Nascimento da Mecânica Quântica
1678 - Christian Huygens publica o seu livro Traité de la lumiere onde defendia a natureza
ondulatória da luz;
1687 - Isaac Newton publica o seu tratado Philosophiae Naturalis Principia Mathematica
onde expõe as suas leis da mecânica (hoje dita mecânica clássica);
1703 - Newton publica o seu livro sobre a luz Opticks, onde defende que a luz é um fluxo
de pequenos corpúsculos;
1803 - Thomas Young anuncia numa ‘Bakerian Lecture’ intitulada Experiments and Calculations Relative to Physical Optics a observação da difracção da luz, provando assim
que a luz tem propriedades ondulatórias e portanto validando a tese de Huygens e
invalidando a de Newton;
1873 - James Maxwell publica a sua obra A Treatise on Electricity and Magnetism onde
apresenta as suas equações do campo electromagnético e mostra que a sua teoria
prevê a existência de ondas electromagnéticas viajando ‘à velocidade da luz’;
1887 - Heinrich Hertz produz e detecta ondas electromagnéticas, validando a teoria de
Maxwell; descobre também, acidentalmente, o efeito fotoeléctrico;
1900 - Max Planck explica a radiação de corpo negro usando a quantificação de energia e
introduzindo uma nova constante h (hoje dita constante de Planck ). A sua descoberta
foi apresentada num encontro da Sociedade Alemã de Fı́sica, em 14 de Dezembro de
1900, a data de nascimento da Mecânica Quântica;
1905 - Albert Einstein sugera a quantificação da radiação para explicar algumas caracterı́sticas do efeito fotoeléctrico descobertas em 1900 por Philip Lenard;
1911 - Ernest Rutherford propõe o modelo nuclear do átomo baseado nas experiências de
scattering de partı́culas α de Hans Geiger e Ernest Marsden;
1913 - Niels Bohr propõe o seu modelo do átomo de hidrogénio num artigo intitulado
Sobre a constituição de átomos e moléculas;
1916 - Robert Milikan verifica a equação de Einstein relativa ao efeito fotoeléctrico;
1923 - Arthur Compton explica o scattering de raios x por electrões como uma colisão
entre electrões e fotões verificando experimentalmente as suas conclusões;
1924 - Louis De Broglie propõe que o electrão tenha ondas electrónicas associadas com
comprimento de onda h/p;
1925 - Erwin Schrödinger propõe a sua equação de onda para descrever as ondas associadas à matéria;
1925 - Werner Heisenberg inventa a mecânica de matrizes para descrever fenómenos quânticos;
1925 - Wolfgang Pauli apresenta o seu princı́pio de exclusão;
1927 - Heisenberg formula o princı́pio da incerteza;
1927 - Clinton Davisson e Lester Germer e independentemente, George Thomson, observam difracção devido a ondas electrónicas;
1928 - Paul Dirac desenvolve a mecânica quântica relativista e prevê a existência de
positrões, descobertos em 1932 por Carl Anderson;
“Quem não se sentiu chocado com a teoria quântica
não pode tê-la compreendido.”
Niels Bohr
(1885-1962),
Conteúdo
I
Problemas exactamente solúveis e quantificação canónica de
sistemas clássicos
1
1 Tópicos de Mecânica Clássica
2
1.1 Mecânica Newtoniana
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2 Mecânica Lagrangeana . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2.1
Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . .
7
1.2.2
Teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . .
11
1.3 Mecânica Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
1.3.1
O Espaço de Fase e os Parêntesis de Poisson . . . . . . . . . . . . .
16
1.3.2
A Equação de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . .
18
1.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
2 O perı́odo de Transição
2.1 A luz: ondas versus corpúsculos . . . . . . . . . . . . . . . . . . . . . . . .
25
26
2.1.1
Experiências de Young (1801): ondas triunfam . . . . . . . . . . . .
28
2.1.2
A radiação do corpo negro, Planck e o quantum (1900) . . . . . . .
33
2.1.3
O efeito fotoeléctrico (Einstein 1905) . . . . . . . . . . . . . . . . .
37
2.2 Matéria: corpúsculos versus ondas . . . . . . . . . . . . . . . . . . . . . . .
40
2.2.1
O Espectro do átomo de Hidrogénio . . . . . . . . . . . . . . . . . .
43
2.2.2
O modelo atómico de Bohr (1913) . . . . . . . . . . . . . . . . . . .
45
2.2.3
As ondas electrónicas . . . . . . . . . . . . . . . . . . . . . . . . . .
48
2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica
Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
2.3.1
Experiência de Young com luz de baixa intensidade . . . . . . . . .
51
2.3.2
O princı́pio da incerteza de Heisenberg . . . . . . . . . . . . . . . .
55
2.3.3
Experiência com a polarização da luz . . . . . . . . . . . . . . . . .
57
2.4 A aplicabilidade da Mecânica Quântica . . . . . . . . . . . . . . . . . . . .
59
2.5 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
3 A equação de Schrödinger
63
3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas . . . . . . . .
64
3.1.1
Sobreposição discreta de ondas . . . . . . . . . . . . . . . . . . . .
66
3.1.2
Sobreposição contı́nua de ondas . . . . . . . . . . . . . . . . . . . .
69
3.2 Partı́cula em potenciais independentes do tempo . . . . . . . . . . . . . . .
71
3.2.1
Caracterı́sticas gerais num potencial em escada . . . . . . . . . . .
73
3.2.2
Salto de potencial (E > V0 ) . . . . . . . . . . . . . . . . . . . . . .
76
3.2.3
Salto de potencial (E < V0 ) . . . . . . . . . . . . . . . . . . . . . .
78
3.2.4
Barreira de potencial (E > V0 ) . . . . . . . . . . . . . . . . . . . . .
81
3.2.5
Barreira de potencial (E < V0 ) . . . . . . . . . . . . . . . . . . . . .
83
3.2.6
Poço de potencial de profundidade finita (E < 0) . . . . . . . . . .
88
3.2.7
Poço de potencial de profundidade infinita . . . . . . . . . . . . . .
90
3.3 Evolução de um trem de ondas . . . . . . . . . . . . . . . . . . . . . . . .
91
3.3.1
Trem de ondas Gaussiano livre
. . . . . . . . . . . . . . . . . . . .
92
3.3.2
Trem de ondas incidente num salto de potencial (E < V0 ) . . . . . .
93
3.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
4 Formalismo Matemático e Postulados da Mecânica Quântica
4.1 Funções de onda e operadores . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1
Estrutura de F e produto escalar em F . . . . . . . . . . . . . . . .
97
97
98
4.1.2
Bases de F
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
4.1.3
Operadores Lineares a actuar em F . . . . . . . . . . . . . . . . . . 103
4.2 A notação de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.2.1
Produto escalar e espaço dual a E . . . . . . . . . . . . . . . . . . . 107
4.2.2
Acção de operadores lineares . . . . . . . . . . . . . . . . . . . . . . 108
4.2.3
O operador adjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.2.4
A operação adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.2.5
Notação de Dirac numa dada base . . . . . . . . . . . . . . . . . . . 111
4.2.6
Valores próprios e vectores próprios de um operador . . . . . . . . . 113
4.2.7
Observáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.3 Os postulados da Mecânica Quântica . . . . . . . . . . . . . . . . . . . . . 115
4.4 Quantificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.4.1
Variáveis compatı́veis, incompatı́veis e C.C.O.C. . . . . . . . . . . . 119
4.4.2
Os operadores X̂ e P̂ . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.4.3
Regras de Quantificação canónica . . . . . . . . . . . . . . . . . . . 126
4.4.4
Comentários sobre a evolução de um sistema quântico . . . . . . . . 128
4.4.5
Evolução do valor médio de uma variável . . . . . . . . . . . . . . . 129
4.5 Mecânica Quântica Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.5.1
O operador de densidade para um estado puro . . . . . . . . . . . . 133
4.5.2
O operador de densidade para uma mistura estatı́stica de estados . 134
4.5.3
O operador de evolução e a evolução de um estado puro . . . . . . . 137
4.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5 Exemplos de Quantificação Canónica
141
5.1 Oscilador Harmónico Quântico em Uma Dimensão . . . . . . . . . . . . . . 141
5.1.1
O espectro de energia do Oscilador Harmónico Quântico . . . . . . 142
5.1.2
As funções de onda para o oscilador harmónico . . . . . . . . . . . 146
5.1.3
Resolução directa da equação de Schrödinger . . . . . . . . . . . . . 149
5.1.4
Valor médio e desvio padrão de x e p . . . . . . . . . . . . . . . . . 153
5.2 O Oscilador Harmónico Quântico em Duas Dimensões . . . . . . . . . . . . 155
5.2.1
Quantões lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.2.2
Quantões circulares . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.2.3
Funções de Onda para quantões circulares . . . . . . . . . . . . . . 158
5.3 O problema de Landau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
6 Momento Angular Orbital e o Átomo de Hidrogénio
6.1 Operadores de momento angular orbital
167
. . . . . . . . . . . . . . . . . . . 167
6.2 Os Harmónicos Esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.3 Partı́cula numa força central . . . . . . . . . . . . . . . . . . . . . . . . . . 176
6.4 O átomo de hidrogénio (sem spin) . . . . . . . . . . . . . . . . . . . . . . . 180
6.5 O átomo de hidrogénio (sem spin) num campo magnético . . . . . . . . . . 189
6.5.1
Dedução dos vários termos do Hamiltoniano . . . . . . . . . . . . . 189
6.5.2
Interpretação dos vários termos do Hamiltoniano . . . . . . . . . . 191
6.5.3
Comparação dos vários termos no Hamiltoniano . . . . . . . . . . . 195
6.5.4
Espectro de Energias aproximado: efeito Zeeman . . . . . . . . . . 196
6.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7 Outras soluções exactas da equação de Schrödinger
205
7.1 Alguns poços de potencial exactamente solúveis . . . . . . . . . . . . . . . 206
7.1.1
Estados Ligados em Poços infinitos . . . . . . . . . . . . . . . . . . 207
7.1.2
Densidade de estados . . . . . . . . . . . . . . . . . . . . . . . . . . 215
7.1.3
Estados Ligados em Poços finitos . . . . . . . . . . . . . . . . . . . 216
7.2 Método algébrico para potenciais com forma invariante . . . . . . . . . . . 220
7.2.1
O superpotencial e potenciais parceiros . . . . . . . . . . . . . . . . 220
7.2.2
Hierarquia de Hamiltonianos . . . . . . . . . . . . . . . . . . . . . . 226
7.2.3
Potenciais de forma invariante . . . . . . . . . . . . . . . . . . . . . 228
7.2.4
Potenciais de forma invariante relacionados por translação . . . . . 229
7.3 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
II
Métodos de aproximação e Spin
237
8 A aproximação WKB
238
8.1 O método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
8.2 Interpretação da validade da aproximação . . . . . . . . . . . . . . . . . . 241
8.3 Fórmulas de ligação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
8.4 Aplicação ao cálculo de estados ligados . . . . . . . . . . . . . . . . . . . . 246
8.5 Aplicação ao cálculo do factor de transmissão . . . . . . . . . . . . . . . . 250
8.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
9 Teoria Geral do Momento Angular e Spin
253
9.1 Representações da álgebra do momento angular . . . . . . . . . . . . . . . 254
9.2 Emergência Fı́sica do Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
9.3 Postulados da teoria de Pauli . . . . . . . . . . . . . . . . . . . . . . . . . 273
9.4 Descrição não relativista de partı́culas de spin
9.4.1
1
2
. . . . . . . . . . . . . . . 274
Juntando os graus de liberdade de spin aos orbitais . . . . . . . . . 276
9.5 Adição de momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . 283
9.5.1
Cálculo dos vectores próprios comuns a Jˆ2 e a Jˆz . . . . . . . . . . 287
9.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
10 Teoria da Difusão
293
10.1 Formalismo para descrever processos de difusão . . . . . . . . . . . . . . . 296
10.1.1 Definição da secção eficaz de difusão . . . . . . . . . . . . . . . . . 296
10.1.2 Estados estacionários de difusão . . . . . . . . . . . . . . . . . . . . 298
10.1.3 Relação entre amplitude e secção eficaz de difusão . . . . . . . . . . 300
10.2 Equação integral de difusão e o método de Born . . . . . . . . . . . . . . . 302
10.2.1 Escolha da função de Green e de Φ0 . . . . . . . . . . . . . . . . . . 304
10.2.2 A aproximação de Born . . . . . . . . . . . . . . . . . . . . . . . . 306
10.2.3 Interpretação da aproximação de Born . . . . . . . . . . . . . . . . 308
10.2.4 A aproximação de Born para potenciais centrais . . . . . . . . . . . 309
10.3 Método das ondas parciais para a difusão por um potencial central . . . . . 316
10.3.1 Ondas esféricas versus ondas planas para uma partı́cula livre . . . . 317
10.3.2 Dedução da forma explı́cita das ondas esféricas livres . . . . . . . . 319
10.3.3 Propriedades das ondas esféricas livres . . . . . . . . . . . . . . . . 323
10.3.4 Ondas parciais num potencial V (r) . . . . . . . . . . . . . . . . . . 328
10.4 Difusão Inelástica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
10.4.1 Secções eficazes de difusão elástica e de absorção . . . . . . . . . . . 337
10.4.2 Secção eficaz total e o teorema óptico . . . . . . . . . . . . . . . . . 339
10.5 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
11 Métodos perturbativos independentes e dependentes do tempo
343
11.1 Teoria das perturbações estacionárias . . . . . . . . . . . . . . . . . . . . . 344
11.1.1 Perturbação de um nı́vel não degenerado . . . . . . . . . . . . . . . 347
11.1.2 Perturbação a um nı́vel degenerado . . . . . . . . . . . . . . . . . . 351
11.1.3 Perturbações X̂, X̂ 2 e X̂ 3 a um potencial harmónico . . . . . . . . 352
11.1.4 Estrutura fina do átomo de Hidrogénio . . . . . . . . . . . . . . . . 357
11.2 Teoria das Perturbações dependentes do tempo . . . . . . . . . . . . . . . 368
11.2.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . 368
11.2.2 Solução aproximada da equação de Schrödinger . . . . . . . . . . . 369
11.2.3 Aplicação a uma perturbação sinusoidal ou constante . . . . . . . . 373
11.2.4 Probabilidade de transição via operador de evolução . . . . . . . . . 385
11.3 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395
12 Sistemas de partı́culas idênticas
397
12.1 Origem do Problema: a degenerescência de troca
. . . . . . . . . . . . . . 397
12.2 Operadores de permutação . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
12.2.1 Sistema de duas partı́culas . . . . . . . . . . . . . . . . . . . . . . . 401
12.2.2 Sistema de três partı́culas e generalização para N partı́culas . . . . 405
12.3 O postulado de simetrização . . . . . . . . . . . . . . . . . . . . . . . . . . 410
12.3.1 Levantamento da degenerescência de troca . . . . . . . . . . . . . . 411
12.3.2 Observáveis e evolução temporal
. . . . . . . . . . . . . . . . . . . 416
12.4 Consequências do postulado de simetrização . . . . . . . . . . . . . . . . . 417
12.4.1 Diferenças entre bosões e fermiões . . . . . . . . . . . . . . . . . . . 417
12.4.2 Efeitos de interferência . . . . . . . . . . . . . . . . . . . . . . . . . 420
12.4.3 Difusão de duas partı́culas idênticas com spin . . . . . . . . . . . . 424
12.5 Átomos com vários electrões - A tabela periódica . . . . . . . . . . . . . . 428
12.5.1 Nı́veis de energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
12.5.2 Configurações electrónicas e princı́pio da exclusão de Pauli . . . . . 432
12.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435
13 Introdução à Mecânica Quântica Relativista
13.1 A teoria de Klein-Gordon
437
. . . . . . . . . . . . . . . . . . . . . . . . . . . 437
13.2 Os problemas com a teoria de Klein-Gordon . . . . . . . . . . . . . . . . . 439
13.2.1 Energias negativas . . . . . . . . . . . . . . . . . . . . . . . . . . . 440
13.2.2 Probabilidades negativas . . . . . . . . . . . . . . . . . . . . . . . . 441
13.2.3 Inexistência de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 444
13.3 A teoria de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448
13.3.1 Os sucessos da equação de Dirac . . . . . . . . . . . . . . . . . . . . 450
13.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
III
Tópicos Avançados e Modernos
453
14 Formulação de integrais de caminho da Mecânica Quântica
454
15 Mecânica Quântica Super-simétrica
455
16 Introdução à teoria da Informação Quântica
457
IV
Apêndices
458
A Geometria da Transformada de Legendre
459
B Princı́pio do tempo mı́nimo de Fermat
463
B.1 Reflexão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
B.2 Refracção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
C Análise de Fourier
467
C.1 Séries de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467
C.1.1 Representação em termos de ondas planas . . . . . . . . . . . . . . 469
C.1.2 O Espaço de Hilbert e a Igualdade de Bessel-Parseval . . . . . . . . 470
C.2 Integrais de Fourier e Transformadas de Fourier . . . . . . . . . . . . . . . 471
C.2.1 A fórmula de Parseval-Plancherel . . . . . . . . . . . . . . . . . . . 472
C.2.2 Quantidades estatı́sticas e a relação de incerteza . . . . . . . . . . . 474
Parte I
Problemas exactamente solúveis e quantificação canónica de
sistemas clássicos
CAPÍTULO
1
Tópicos de Mecânica Clássica
1.1
Mecânica Newtoniana
O principal objectivo da mecânica clássica é descrever e explicar o movimento de objectos
macroscópicos. Tal descrição é feita através do conceito de trajectória, que em mecânica
não relativista é um mapa
Tp (t) : R −→ R3
,
(1.1.1)
t −→ ~x(t)
para cada ponto p do objecto em questão - figura 1.1. Em muitos problemas, a dinâmica de
corpos rı́gidos é reduzida, em primeira análise, à dinâmica do centro de massa e portanto
à de uma partı́cula pontual. Assim sendo, a descrição e explicação do movimento de uma
partı́cula pontual é o problema base da mecânica clássica.
Em 1686-87, Isaac Newton (1642-1727) apresentou na sua principal obra Philosophiae
Naturalis Principia Mathematica as leis da Mecânica Newtoniana e em particular a sua
equação do movimento (2a lei de Newton) que relaciona a força com a variação da quantidade de movimento
d~p
F~ =
,
dt
p~ ≡ m~v ≡ m
d~x
.
dt
(1.1.2)
1.1 Mecânica Newtoniana
3
z
Tp (t2 )
y
x
Tp (t1 )
Figura 1.1: A trajectória é um mapa da linha real para R3 .
Se a massa m é fixa,
2
d ~x
¨.
F~ = m 2 ≡ m~x
dt
(1.1.3)
Exemplo 1 : Oscilador Harmónico (ex: pequenas oscilações de um pêndulo, mola,...)
Um oscilador harmónico é um sistema em que a força é proporcional ao deslocamento
a partir de um ponto de equilı́brio e dirigida para o ponto de equilı́brio (Lei de Hooke).
Rotulando o ponto de equilı́brio como ~x = 0, temos
F~ = −k~x .
(1.1.4)
Consideremos o oscilador harmónico em uma dimensão, com uma massa m e uma constante
de oscilador k. Pela segunda lei
ẍ +
k
x=0,
m
(1.1.5)
que é uma equação diferencial ordinária de segunda ordem com solução
!
r
k
t + φ0 ,
(1.1.6)
x(t) = A cos
m
p
de onde se lê a frequência de oscilação: ω = k/m. A e φ0 são constantes de integração
interpretadas como amplitude e fase inicial do movimento que fisicamente são determinadas
pelas condições iniciais.
Exemplo 2 : Problema de Larmor O problema de Larmor é o problema de uma
partı́cula de massa m e carga eléctrica q num campo magnético constante que tomamos
~ = Bez .
como sendo B
4
Tópicos de Mecânica Clássica
A força que uma partı́cula sente devido à interacção com o campo electromagnético é
dada pela força de Lorentz
~ + ~v × B)
~ .
F~ = q(E
(1.1.7)
Aplicando ao nosso caso e usando a segunda lei de Newton obtemos a equação do movimento (~x = (x, y, z))



ẍ = ωc ẏ


¨ = ωc~x˙ × ez ⇔
~x
ÿ = −ωc ẋ



 z̈ = 0
⇒
onde definimos a frequência ciclotrónica é
ωc =
 3
dx


+ ωc2 ẋ = 0


3

dt

d3 y
+ ωc2ẏ = 0


3

dt


 z̈ = 0
qB
.
m
,
(1.1.8)
(1.1.9)
As equações de terceira ordem são de segunda ordem nas velocidades e equivalentes a
osciladores harmónicos. Logo a solução é


ẋ = A cos (ωc t + φ0 )



,
ẏ = Ã cos ωc t + φ̃0



 z =z +v t
0
z
(1.1.10)
onde A, Ã, φ, φ̃, z0 , vz são constantes de integração. As equações de segunda ordem em
(1.1.8) relacionam as constantes de integração
A = Ã ,
φ̃0 = φ0 +
π
.
2
(1.1.11)
Como tal a solução final é

A


sin (ωc t + φ0 )
x(t) = x0 +


ωc

A
y(t)
=
y
+
cos (ωc t + φ0 )
0

ω

c


 z =z +v t
0
z
.
(1.1.12)
Assim, x(t) e y(t) obedecem a
2
2
(x(t) − x0 ) + (y(t) − y0 ) =
A
ωc
2
,
(1.1.13)
1.2 Mecânica Lagrangeana
5
~
B
z
y
x
Figura 1.2: Trajectórias no problema de Larmor. Apenas a trajectória mais à direita tem
vz 6= 0.
e interpretamos as trajectórias projectadas no plano x-y como sendo circunferências com
centro em (x0 , y0 ) e raio Am/qB - figura 1.2. Lêmos também que a frequência das órbitas
é a frequência ciclotrónica.
Nota: Este movimento corresponde a dois osciladores harmónicos nas direcções x e y
em oposição de fase.
1.2
Mecânica Lagrangeana
Existem algumas forças, ditas conservativas, que podem ser derivadas de um potencial,
através de:1
F~ = −∇V
∇ × F~ = 0 .
⇔
(1.2.1)
Dada uma força, a última equação pode ser utilizada como teste para ver se a força é
conservativa. Por exemplo, para a força do exemplo 1,
F~ = −kx
⇔
V (x) =
kx2
.
2
(1.2.2)
Ao desenharmos o potencial - figura 1.3 - ficamos com uma ideia da dinâmica usando a
nossa intuição gravitacional: a partı́cula quer descer o potencial e ‘custa-lhe’ a subi-lo.
Como a energia total da partı́cula é conservada
1
1
Etotal = Ecinética + Epotencial = mv 2 + kx2 ,
2
2
1
(1.2.3)
A implicação da direita para a esquerda não é sempre válida e depende de considerações topológicas,
nomeadamente a co-homologia de de Rham da variedade. Para a generalidade das aplicações em Fı́sica
elementar, onde a topologia do espaço-tempo é trivial, pode-se considerar a equivâlencia válida em geral.
6
Tópicos de Mecânica Clássica
V(x)
E
−a
a
x
Figura 1.3: Potencial do oscilador harmónico; uma partı́cula com energia E oscila entre
pontos −a e a tais que V (−a) = V (a) = E.
q1 (t)
qreal (t)
(qi , ti )
(qf , tf )
q2 (t)
Figura 1.4: Três percursos alternativos entre o ponto qi no instante ti e qf no instante tf . A
t
trajectória real, qreal (t) é um extremo da acção S[q(t)]tfi . Se, por exemplo, for um mı́nimo,
t
t
t
S[qreal (t)]tfi < S[q1 (t)]tfi , S[q2 (t)]tfi .
uma partı́cula com energia total E sobe até uma altura do potencial dada por V = E, onde
a velocidade se anula; a velocidade é máxima em x = 0, onde toda a energia é cinética.
Dado um qualquer potencial, correspondendo a uma força, podemos de imediato deduzir
um conjunto particular de trajectórias fı́sicas, i.e. soluções das equações do movimento:
são as trajectórias constantes, correspondentes aos extremos do potencial. Os extremos
são definidos por
∇V (x0 ) = 0
⇔
F~ = 0 em x0 ,
(1.2.4)
o que significa que se a partı́cula estiver inicialmente em repouso em x0 aı́ ficará. No caso
do oscilador harmónico a única solução deste tipo é quando a partı́cula está em repouso
na posição de equilı́brio, que é trivial. Mas origina a seguinte pergunta:
‘Dado que estas trajectórias extremizam uma quantidade escalar (o potencial), haverá
uma quantidade escalar mais geral extremizada por todas as trajectórias?’
1.2 Mecânica Lagrangeana
7
Isto é consideremos um movimento com inı́cio em ti na posição qi e com fim em tf
na posição qf , como na figura 1.4.2 Existe uma quantidade que a trajectória verdadeira,
qreal (t), extremize comparativamente a todas as outras trajectórias, como q1 (t) ou q2 (t)? Se
tal quantidade existir não é uma função, mas sim uma ‘máquina’ que transforma funções como a trajectória - em números (note que uma função transforma números em números),
denominada funcional :
t
S[. . .]tfi : F −→ R
t
q(t) −→ S[q(t)]tfi
.
(1.2.5)
F é o espaço de todas as funções de variável real. Um dos princı́pios mais importantes em
toda a fı́sica é o princı́pio da acção mı́nima 3 ou princı́pio de Hamilton:
Num sistema fı́sico com Lagrangeano L(q, q̇, t), as trajectórias reais, qreal (t), são as que
extremizam o funcional acção, definido como
Z tf
tf
dtL(q, q̇, t) ,
S[q(t)]ti =
(1.2.6)
ti
onde o Lagrangeano se define como a diferença entre a energia cinética, T (q̇) e a energia
potencial, V (q, t)4
L(q, q̇, t) ≡ T (q̇) − V (q, t) .
(1.2.7)
Para o princı́pio de Hamilton fazer sentido tem que dar origem a um conjunto de
equações do movimento equivalentes às da mecânica Newtoniana. Essas equações chamamse Equações de Euler-Lagrange, que agora deduzimos.
1.2.1
Equações de Euler-Lagrange
Os extremos de uma função são encontrados requerendo que a derivada da função seja
zero. Analogamente, os extremos de um funcional encontram-se requerendo que a variação
do funcional se anule. Variar um funcional consiste em comparar o valor do funcional para
2
É convencional utilizar a variável ‘q’ para designar um sistema arbitrário de coordenadas, por isso
denominadas coordenadas generalizadas.
3
Embora esta designação seja comum, as trajectórias reais não são sempre um mı́nimo da acção, mas
sim um extremo.
4
Curiosidade: A designação de energia cinética por T e da energia potencial por V tem origem nas
palavras alemãs tatkraft e verk, que significam, respectivamente ‘energia’ e ‘potencial’.
8
Tópicos de Mecânica Clássica
funções ligeiramente distintas, mas mantendo fixos os pontos inicial e final da função, que
no nosso caso é a trajectória. Denotando esta operação de variação por ‘δ’ obtemos
Z tf ∂L
∂L
tf
tf
δq +
δ q̇ ,
(1.2.8)
δS = S[q(t) + δq(t)]ti − S[q(t)]ti =
dt
∂q
∂ q̇
ti
e assumindo que a operação de variação comuta com diferenciação,
δ q̇ = δ
dq
d
= δq ,
dt
dt
de onde, integrando por partes
Z tf ∂L
d ∂L
∂L
δq +
−
δq
dt
δS =
∂q
dt ∂ q̇
∂ q̇
ti
(1.2.9)
tf
ti
.
(1.2.10)
O último termo é zero, pois corresponde à variação da trajectória nos pontos inicial e final,
que assumimos ser zero. Como queremos garantir que δS = 0 para uma variação arbitrária,
o integrando do termo restante tem de ser zero, isto é,
d ∂L ∂L
−
=0,
dt ∂ q̇
∂q
(1.2.11)
para cada coordenada q. Estas são as equações de Euler-Lagrange (Joseph Lagrange 17361813, Leonhard Euler 1707-1783). Usando (1.2.7) estas equações escrevem-se
d ∂L
∂V
=−
dt ∂ q̇
∂q
⇔
d ∂L
= F~ .
dt ∂ ~q˙
(1.2.12)
Usamos ~q para denotar a possibilidade de haver vários graus de liberdade e correspondentes
coordenadas. Para uma partı́cula pontual num potencial V (~q),
1 2
L = m~q˙ − V (~q) ,
2
(1.2.13)
e (1.2.12) reduz-se a F~ = m¨~q, i.e. à segunda lei de Newton. Em geral define-se o momento
canónico conjugado à variável ‘q’ como ‘p’
p~ ≡
∂L
.
∂ ~q˙
(1.2.14)
Deste modo, com toda a generalidade, (1.2.12) implica
d
F~ = p~ ,
dt
(1.2.15)
1.2 Mecânica Lagrangeana
9
mostrando que o formalismo Lagraneano reproduz o Newtoniano.
Exemplo 1, Versão b) : Tratamos agora o oscilador harmónico no formalismo Lagrangiano. De (1.2.2) vemos facilmente que o Lagrangeano é
1
1
L = mẋ2 − kx2 ,
2
2
(1.2.16)
e as equações de Euler-Lagrange dão
ẍ +
k
x=0,
m
(1.2.17)
em concordância com (1.1.5).
Exemplo 2, Versão b) : Para tratarmos a versão Lagrangeana do problema de Larmor, comecemos por discutir se existe um potencial para a força de Lorentz. Recordemos
as equações de Maxwell (no sistema internacional de unidades)
~ =0
(i) ∇ · B
~
~ = − ∂B
(iii) ∇ × E
∂t
~ = ρ
(ii) ∇ · E
ǫ0
~ .
~i
∂E
~
(iv) c ∇ × B = +
ǫ0
∂t
(1.2.18)
2
Uma condição necessária para existir o potencial de uma força é (1.2.1). Calculemos pois
o rotacional de F~Lorentz
~ + ∇ × (~v × B))
~ ,
∇ × F~Lorentz = q(∇ × E
(1.2.19)
ou, usando as equações de Maxwell e o facto que
~ = (β~ · ∇)~
~ ·α
~ ,
∇ × (~
α × β)
α − β(∇
~ ) − (~
α · ∇)β~ + α
~ (∇ · β)
(1.2.20)
obtemos (~v não é um campo de velocidades; logo as suas derivadas desaparecem)
!
~
~
∂
B
~ = −q dB .
− (~v · ∇)B
(1.2.21)
∇ × F~Lorentz = q −
∂t
dt
Assim, em geral, a força de Lorentz não é derivável de um potencial. Só o é se o campo
magnético sentido pela partı́cula for constante.
10
Tópicos de Mecânica Clássica
Ainda assim, é possı́vel definir um Lagrangeano cujas equações do movimento são as
de uma partı́cula actuada pela força de Lorentz, mas que não tem a forma (1.2.7). Para
vermos esse Lagrangeano recordemos os potenciais electromagnéticos.
~
A equação (i) permite-nos definir o potencial magnético, A,
~ =0
∇·B
⇒
~ =∇×A
~,
B
(1.2.22)
que usando na equação de Maxwell-Faraday (iii) nos permite escrever esta como
~
~ + ∂A ) = 0
∇ × (E
∂t
⇒
~
~ = −∇φ − ∂ A ,
E
∂t
(1.2.23)
onde φ é o potencial electrostático. As duas equações (1.2.22) e (1.2.23) definem os poten~ Note-se que estes não são únicos. Isto é, para os mesmos
ciais electromagnéticos (φ, A).
~ B
~ existe uma classe de equivalência de diferentes escolhas para φ e A
~ a que se chama
E,
“equivalência de gauge”.
Lema: O Lagrangeano
1
2
~ ~x) − qφ(t, ~x) ,
L = m~x˙ + q~x˙ · A(t,
2
(1.2.24)
reproduz as equações do movimento de uma partı́cula actuada pela força de Lorentz.
Demonstração: As equações de Euler-Lagrange para este Lagrangeano
d ∂L
∂L
−
=0
i
∂x
dt ∂ ẋi
q~x˙ ·
⇒
~
∂A
∂φ
d
− q i − (mẋi + qAi ) = 0 .
i
∂x
∂x
dt
(1.2.25)
~ depende do tempo tanto
Note-se que a derivada em ordem ao tempo é total e que A
explicitamente como através da dependência em ~x. Assim a equação fica
∂φ
∂Ai ∂Ai ∂xj
1 ∂A1
2 ∂A2
3 ∂A3
q ẋ
= mẍi .
+ ẋ
+ ẋ
− i−
− j
∂xi
∂xi
∂xi
∂x
∂t
∂x ∂t
Usando (1.2.23) reescrevemos a equação
∂A2 ∂Ai
∂A3 ∂Ai
∂A1 ∂Ai
2
3
1
~ i = mẍi .
− 1 +v
− 2 +v
− 3 + (E)
q v
∂xi
∂x
∂xi
∂x
∂xi
∂x
(1.2.26)
(1.2.27)
Tomando como exemplo a componente i = 1 desta equação, reescrevemo-la como
h i
h
i
2
3
~
~
~
~
~
q v ∇ × A − v ∇ × A + (E)1 = mẍ1 ⇔ q E + ~v × B = mẍ1 , (1.2.28)
3
2
1
1.2 Mecânica Lagrangeana
11
e analogamente para as outras componentes, o que demonstra o Lema. (q.e.d.)
Voltemos então ao problema de Larmor. Podemos escolher os seguintes potenciais
electromagnéticos para o problema

 E
~ =0
 B
~ = Be


φ=0
 A
~ = B (−y, x, 0)
2
,
(1.2.29)
1
Bq
L(~x, ~x˙ , t) = m(ẋ2 + ẏ 2 + ż 2 ) +
(xẏ − y ẋ) ,
2
2
(1.2.30)
⇐
z
originando o Lagrangeano
e as equações de Euler-Lagrange

Bq
Bq
d


− y + mẋ = 0
ẏ −


dt 2

 2
d Bq
Bq
x + mẏ = 0
− ẋ −

2
dt 2



d


− (mż) = 0
dt

qB


ẏ
ẍ =


m

qB
ÿ = − ẋ

m



 z̈ = 0
,
(1.2.31)
que são as mesmas equações obtidas no formalismo Newtoniano (1.1.8).
1.2.2
Teorema de Noether
Neste último exemplo obtivemos uma equação do movimento da forma
d
(mż) = 0
dt
⇒
pz ≡ mż = constante ,
(1.2.32)
o que significa existir uma quantidade conservada no movimento, pz . A existência desta
quantidade conservada é consequência directa de neste problema haver uma simetria na
direcção z e, como tal, de o Lagrangeano não depender de z. A generalização deste resultado é conhecida como Teorema de Noether, (Emmy Noether 1882-1935) um dos mais
importantes em mecânica Lagrangeana:
Teorema (Noether): Se o Lagrangeano de um sistema fı́sico L(~q, ~q˙ , t) é invariante
pela acção de transformações do tipo
~q −→ ~q + δ~q ,
(1.2.33)
12
Tópicos de Mecânica Clássica
para algum δ~q, isto é, possui uma simetria na direcção definida por δ~q, então existe uma
quantidade conservada no movimento desse sistema fı́sico associada com essa simetria.
Demonstração: Escolher uma coordenada y tal que as suas linhas integrais sejam
tangentes a δ~q; a invariância de L significa que L não depende da coordenada y, ∂L/∂y = 0;
logo, a equação do movimento de y é
d ∂L
=0
⇒
dt ∂ ẏ
∂L
≡ py = constante ,
∂ ẏ
(1.2.34)
o que significa que py é uma constante do movimento.
1.3
Mecânica Hamiltoniana
Tanto no formalismo Newtoniano como Lagrangeano, as equações do movimento são equações
diferenciais de segunda ordem. Quer para implementação numérica, quer para uso de
métodos analı́ticos é, em muitas circunstâncias, mais conveniente resolver um conjunto de
2n equações diferenciais de primeira ordem do que um conjunto de n equações diferenciais
equivalentes de segunda ordem. Isto sugere a introdução de um formalismo em que as
equações do movimento são de primeira ordem, que é o caso do formalismo Hamiltoniano
(William Hamilton 1805-1865). Este formalismo é também o caminho canónico para a
quantificação de um sistema fı́sico.
No formalismo Lagrangeano, as variáveis independentes são
(q, q̇, t),
(1.3.1)
e o Lagrangeano é visto como uma função destas variáveis
L = L(q, q̇, t) .
(1.3.2)
Anteriormente já introduzimos uma nova variável que em geral depende de q̇, que é o
momento canónico conjugado a q,
p≡
∂L
.
∂ q̇
(1.3.3)
1.3 Mecânica Hamiltoniana
13
É pois natural, para obter equações de primeira ordem, tomar como variáveis independentes
(q, p, t),
(1.3.4)
e pensar no Lagrangeano como uma nova função em que as variáveis independentes são
estas
L̂ = L̂(q, q̇(q, p, t), t) .
(1.3.5)
As equações de Euler-Lagrange
d ∂L
∂L
−
=0
∂q
dt ∂ q̇
⇔
ṗ =
∂L
,
∂q
(1.3.6)
tem de ser expressas em termos da função L̂. Note-se que em geral
∂L
∂ L̂
6=
,
∂q
∂q
(1.3.7)
pois estas são derivadas parciais. De facto
∂L ∂L ∂
∂
L̂(q, q̇(q, p, t), t) =
+
q̇(q, p, t) ⇔
∂q
∂q ∂ q̇ ∂q
∂
∂L
∂
L̂(q, p, t)−p q̇(q, p, t) . (1.3.8)
=
∂q
∂q
∂q
Usando (1.3.6) e notando que o lado direito da última equação já está totalmente expresso
em termos de funções das novas variáveis (q, p, t), obtemos
∂ ṗ = −
pq̇(q, p, t) − L̂(q, p, t) .
∂q
(1.3.9)
Por outro lado calculemos também
∂
∂
∂ q̇
∂
∂
L̂(q, p, t) =
L(q, q̇, t)
= p q̇(q, p, t) =
(pq̇(q, p, t)) − q̇(q, p, t) ,
∂p
∂ q̇
∂p
∂p
∂p
(1.3.10)
ou
q̇ =
∂
(pq̇(q, p, t) − L̂(q, p, t)) .
∂p
(1.3.11)
Para simplificar a forma das equações (1.3.9) e (1.3.11), introduzimos o Hamiltoniano
definido como
H(q, p, t) ≡ pq̇(q, p, t) − L(q, q̇(q, p, t), t) ,
(1.3.12)
14
Tópicos de Mecânica Clássica
em termos do qual, as equações (1.3.9) e (1.3.11) reescrevem-se como
q̇ =
∂H
,
∂p
ṗ = −
∂H
,
∂q
(1.3.13)
denominadas equações de Hamilton ou equações canónicas. Estas equações contêm a
mesma informação que as equações de Euler-Lagrange, mas em vez de uma (ou n para
n coordenadas) equação de segunda ordem temos agora duas (2n) equações de primeira
ordem. Note-se que tudo o que fizemos para ir do formalismo Lagrangeano para o Hamiltoniano foi uma mudança de variáveis independentes
(q, q̇, t) −→ (q, p, t) ,
(1.3.14)
o que motivou a substituição do Lagrangeano por uma outra função, o Hamiltoniano
L(q, q̇, t) −→ H(q, p, t) .
(1.3.15)
Esta última transformação, que aparece associada a uma mudança de variáveis toma o
nome de transformada de Legendre, cuja interpretação geométrica é dada no apêndice A.
Calculemos agora o Hamiltoniano para cada um dos nossos dois exemplos.
Exemplo 1, Versão c): Dado que o Lagrangeano para o oscilador harmónico é (1.2.16)
temos
1
1
L = mẋ2 − kx2
2
2
⇒
p≡
∂L
= mẋ ,
∂ ẋ
(1.3.16)
o que significa que o momento canónico conjugado a x é o momento dinâmico usual, isto
é, a quantidade de movimento. Logo
H = pẋ − L =
1
p2
+ kx2 = T + V ,
2m 2
(1.3.17)
isto é, o Hamiltoniano é a energia cinética mais a energia potencial, ou seja, a energia total
do sistema. Como exercı́cio pode verificar que as equações de Hamilton deste Hamiltoniano
são equivalentes a (1.1.5). Em geral, um Lagrangeano do tipo
1
L = mẋ2 − V (x)
2
⇒
H=
p2
+ V (x) ,
2m
(1.3.18)
1.3 Mecânica Hamiltoniana
15
o que é ainda a energia total.
Exemplo 2, Versão c): Comecemos por deduzir o Hamiltoniano para uma partı́cula a
interagir com um campo electromagnético arbitrário, cujo Lagrangeano vimos ser (1.2.24)
2
1
~ ~x) − qφ(t, ~x)
L = m~x˙ + q~x˙ · A(t,
2
⇒
~.
~p = m~x˙ + q A
(1.3.19)
Neste caso o momento canónico conjugado a ~x não é o momento dinâmico usual o que
mostra que estas duas quantidades não têm de coincidir. O Hamiltoniano resultante é
~ 2
(~p − q A)
+ qφ .
H = ~p · ~x˙ − L =
2m
(1.3.20)
~ = m~x˙ concluimos que o Hamiltoniano é ainda a energia cinética mais
Notando que p~ − q A
a energia potencial devido ao potencial φ. Esta é a energia total em jogo. O efeito do
potencial magnético é levado em conta usando a regra de substituir no Hamiltoniano
~,
~p −→ p~ − q A
(1.3.21)
a que se chama acoplamento minimal. Mas note-se que esta regra, corresponde a manter o
2
termo cinético como sendo m~x˙ /2. Assim, numa situação em que o potencial φ seja nulo
(ou constante) concluimos que a energia cinética da partı́cula tem de ser constante e como
tal também a norma da sua velocidade.5 Isso é exactamente o que acontece no problema
de Larmor para as trajectórias da figura 1.2.
Especializando (1.3.20) para os potenciais (1.2.29) obtemos o Hamiltoniano
1
H=
2m
qBy
px +
2
2
1
+
2m
2
qBx
p2
py −
+ z .
2
2m
(1.3.22)
Como exercı́cio pode verificar que as equações de Hamilton deste Hamiltoniano são equivalentes a (1.1.8) - Folha de Problemas 8, exercı́cio 1d).
5
A menos de efeitos de irradiação de ondas electromagnéticas e correspondente perda de energia, conforme o problema 2 da Folha de Problemas 1.
16
Tópicos de Mecânica Clássica
1.3.1
O Espaço de Fase e os Parêntesis de Poisson
O formalismo Hamiltoniano desenrola-se no espaço de fase, que é o espaço parameterizado
por (q, p), que são as variáveis independentes neste formalismo. A simetria das equações
canónicas (1.3.13) sugere a introdução de coordenadas unificadas
ξ i = (q, p)
ξ1 = q , ξ2 = p ,
⇔
(1.3.23)
de modo que as equações canónicas são reescritas
∂H
ξ˙i = ω ij j ,
∂ξ
(1.3.24)
onde ω ij são as componentes de uma matriz anti-simétrica (dita simplética)


0
1
 .
ω ij = 
−1 0
(1.3.25)
Na equação (1.3.24) usamos a chamada convenção de Einstein, que significa que quando
um ı́ndice aparece repetido num produto, denota uma soma de termos correspondendo a
todos os valores possı́veis desse ı́ndice.6 Em (1.3.24) o ı́ndice j aparece repetido no produto
do lado direito. Logo temos de somar sobre todos os valores possı́veis de j, ou seja 1, 2.
Por exemplo, a componente i = 1 de (1.3.24) fica
∂H
∂H
ξ˙1 = ω 11 1 + ω 12 2
∂ξ
∂ξ
⇔
q̇ =
∂H
,
∂p
(1.3.26)
que é uma das equações canónicas.
Consideremos a evolução de uma determinada variável dinâmica f = f (q, p, t). A sua
evolução temporal é dada por
df
∂f
∂f
∂f
∂f
∂f ∂H
∂f ∂H
=
+
q̇ +
ṗ =
+
−
,
dt
∂t
∂q
∂p
∂t
∂q ∂p
∂p ∂q
(1.3.27)
ou em termos das coordenadas unificadas
df
∂f
∂f ∂H
=
+ ω ij i j
dt
∂t
∂ξ ∂ξ
6
⇔
df
∂f
=
+ {f, H} ,
dt
∂t
(1.3.28)
Rigorosamente, o ı́ndice repetido tem que aparecer uma vez como covariante que corresponde a estar
em baixo na variável (ou em cima quando a variável está no denominador) e uma vez como contravariante
que corresponde a estar em cima na variável (ou em baixo quando no denominador).
1.3 Mecânica Hamiltoniana
17
onde introduzimos os Parêntesis de Poisson, definidos como
{A, B} ≡ ω ij
∂A ∂B
∂A ∂B ∂B ∂A
=
−
.
i
j
∂ξ ∂ξ
∂q ∂p
∂q ∂p
(1.3.29)
Os parêntesis de Poisson têm 3 importantes propriedades
i) Bi-linearidade
{α1 A1 + α2 A2 , B} = α1 {A1 , B} + α2 {A2 , B} ,
(1.3.30)
onde α1,2 são constantes e uma expressão análoga pode ser escrita para o segundo
argumento nos parêntesis.
ii) Anti-simetria
{A, B} = −{B, A} .
(1.3.31)
{A, {B, C}} + {B, {C, A}} + {C, {A, B}} = 0 .
(1.3.32)
iii) Identidade de Jacobi
Devido a estas propriedades, os parêntesis de Poisson são um exemplo de parêntesis de
Lie e a álgebra de funções no espaço de fase por eles originada é uma álgebra de Lie,
que será definida na secção 9.1. Os parêntesis de Poisson são um objecto fundamental na
quantificação canónica de um sistema fı́sico.
Apliquemos a equação de evolução (1.3.28):
• Às coordenadas unificadas ξ i
ξ˙i = {ξ i, H} .
(1.3.33)
Estas são exactamente as equações canónicas.
• Ao Hamiltoniano
∂H
.
(1.3.34)
∂t
O Hamiltoniano é uma quantidade conservada no movimento a menos que dependa
Ḣ =
explicitamente do tempo. Como se pode mostrar directamente da definição de Hamiltoniano que
∂H
∂L
=−
,
∂t
∂t
(1.3.35)
18
Tópicos de Mecânica Clássica
isto reflecte a conservação de energia para Lagrangianos independentes do tempo.
• A uma variável dinâmica g que não tenha dependência explı́cita no tempo
ġ = {g, H} .
(1.3.36)
Ou seja, g é uma constante do movimento se e só se comutar com o Hamiltoniano
em termos dos parêntesis de Poisson.
1.3.2
A Equação de Hamilton-Jacobi
Como vimos, a mudança do formalismo Lagrangeano para o formalismo Hamiltoniano
corresponde a uma mudança de variáveis independentes descrita por (1.3.14), tornando-se
depois natural mudar a função dinâmica de Lagrangeano para Hamiltoniano. Dentro do
formalismo Hamiltoniano, podem-se fazer mudanças de variáveis independentes do tipo
(q, p, t) −→ (Q(q, p, t), P (q, p, t), t) ,
(1.3.37)
ou seja mudar de coordenadas no espaço de fase, requerendo que as equações canónicas
mantenham a sua forma. Isto é, que haja uma função K = K(Q, P, t) que desempenha o
papel de novo Hamiltoniano7 e que nas novas coordenadas se possam escrever equações do
movimento do tipo canónico
Ṗ = −
∂K
,
∂Q
Q̇ =
∂K
.
∂P
(1.3.38)
Nem todas as transformações do tipo (1.3.37) permitem escrever equações do movimento
do tipo (1.3.38). Transformações que o permitem designam-se canónicas. Depois de uma
transformação canónica ainda temos um Hamiltoniano, K = K(Q, P, t), ao qual podemos
associar um Lagrangiano, P Q̇ − K e como tal deduzir as trajectórias fı́sicas entre t1 e t2
pelo princı́pio variacional
δ
Z
t2
t1
7
h
i
P Q̇ − K(Q, P, t) dt = 0 .
(1.3.39)
Para distinguir do Hamiltoniano original, e porque é convencional usar a letra K, designa-se por vezes
esta função de ‘Kamiltoniano’.
1.3 Mecânica Hamiltoniana
19
Mas nas coordenadas originais existe, obviamente, um princı́pio semelhante
δ
Z
t2
t1
[pq̇ − H(q, p, t)] dt = 0 .
(1.3.40)
Uma condição suficiente8 para a mudança de coordenadas (1.3.37) de modo a que (1.3.39)
seja consistente com (1.3.40), é
pq̇ − H = P Q̇ − K +
dF
,
dt
(1.3.41)
onde F é uma função no espaço de fase, denominada função geradora, que pode ser expressa
nas coordenadas velhas, novas ou numa combinação de novas e velhas. Este último caso,
quando possı́vel, é particularmente útil, pois F funciona como uma ponte de ligação na
mudança de coordenadas. Temos então quatro hipóteses
a) F = F1 (q, Q, t)
b) F = F2 (q, P, t)
c) F = F3 (p, Q, t)
d) F = F4 (p, P, t) .
(1.3.42)
Tomando a hipótese a), (1.3.41) fica
pq̇ − H = P Q̇ − K +
∂F1 ∂F1
∂F1
Q̇ ,
+
q̇ +
∂t
∂q
∂Q
(1.3.43)
e como estamos a tomar q e Q como variáveis independentes obtemos que para esta equação
ser obedecida
(i)
∂F1
=p,
∂q
(ii)
∂F1
= −P ,
∂Q
(iii) K = H +
∂F1
.
∂t
(1.3.44)
Dada uma função geradora, (i) dá-nos p = p(q, Q, t), que se for possı́vel inverter dá Q =
Q(q, p, t). Então, (ii) dá P = P (q, Q(q, p, t), t) e (iii) dá-nos o novo Hamiltoniano. Note-se
que os dois Hamiltonianos só diferem se F1 depender explicitamente do tempo.
Para fazer um raciocı́nio semelhante com a hipótese b) em (1.3.42), temos de tomar
F = F2 (q, P, t) − QP .
8
(1.3.45)
Esta condição não é necessária para que a transformação seja canónica; existem transformações
canónicas mais gerais.
20
Tópicos de Mecânica Clássica
p
P
(q, p, t) −→ (Q, P, t)
(q(t),p(t))
(Q(t),P(t))=(const.,const.)
Q
q
Figura 1.5: O formalismo de Hamilton-Jacobi é definido por uma função geradora associada
a uma mudança para coordenadas ‘co-móveis’ com a partı́cula no espaço de fase.
Neste caso (1.3.43) e (1.3.44) são substituidas por
pq̇ − H = −QṖ − K +
(i)
∂F2
=p,
∂q
(ii)
∂F2 ∂F2
∂F2
Ṗ ,
+
q̇ +
∂t
∂q
∂P
∂F2
=Q,
∂P
(iii) K = H +
∂F2
.
∂t
(1.3.46)
(1.3.47)
respectivamente. Mais uma vez, (i) dá-nos p = p(q, P, t), que se for possı́vel inverter dá
P = P (q, p, t). Então, (ii) dá Q = Q(q, P (q, p, t), t) e (iii) dá-nos o novo Hamiltoniano.
Raciocı́nios semelhantes existem para c) e d) em (1.3.42), mas o caso b) é o mais útil para
o formalismo de Hamilton-Jacobi que vamos agora deduzir.
Uma escolha muito particular de novas coordenadas no espaço de fase, Q e P , é um
sistema de coordenadas onde a partı́cula está parada - figura 1.5
Q = constante
P = constante ,
(1.3.48)
e o novo Hamiltoniano é também uma constante, que podemos tomar como sendo zero.
As novas equações canónicas (1.3.38) são trivialmente obedecidas e toda a dinâmica fica
contida na transformação de coordenadas, em particular na função geradora. Se escolhermos uma função geradora do tipo 2, toda a informação sobre a dinâmica fica contida nas
equações (1.3.47). Neste caso, constuma-se representar F2 pela letra S = S(q, P, t) que se
designa função principal de Hamilton ou função acção e que obedece a
∂S
=p,
∂q
(1.3.49)
1.3 Mecânica Hamiltoniana
21
o que significa que o momento é o gradiente da função acção,
∂S
=Q,
∂P
(1.3.50)
cujo significado veremos em baixo e ainda
∂S
∂S
,t = −
,
H q, p =
∂q
∂t
(1.3.51)
que é a equação de Hamilton-Jacobi (H-J). Esta equação foi primeiramente estudada por
Hamilton em óptica e só depois usada por Karl Jacobi (1804-1851) em mecânica.
O formalismo de Hamilton-Jacobi pode ser interpretado da seguinte forma. Fisicamente, mudamos para coordenadas ‘co-móveis’ com a partı́cula e portanto, ao descobrir
essa mudança de coordenadas resolvemos, simultaneamente, o movimento da partı́cula.
Em termos matemáticos, estabelecemos a equivalência entre resolver um sistema de 2n
equações diferenciais ordinárias de primeira ordem (para o caso de n graus de liberdade qi ,
i = 1...n) e resolver uma equação diferencial com n + 1 (correspondendo a qi , t) derivadas
parciais.
Uma solução da equação de H-J com n + 1 variáveis, terá n + 1 constantes de integração. Mas uma dessas constantes será irrelevante, pois na equação de H-J só entram as
derivadas de S e como tal se S é solução, S ′ = S + constante, também é solução. Assim,
haverá n constantes relevantes de integração, que podemos identificar com as constantes
Pi . Daı́ concluimos que o significado de (1.3.50) é que a derivada da função acção em
ordem às constantes de integração pode ser considerada constante, uma ferramenta muito
útil quando usamos o método de Hamilton-Jacobi na prática.
A razão pela qual se chama função acção a S(q, P, t) é a seguinte. Da acção definida
em (1.2.6), que é um funcional, constrói-se uma função que obedece à equação de HamitonJacobi. De facto, a função acção
S = S(q, P, t)
⇒
dS
∂S
∂S
=
q̇ +
,
dt
∂q
∂t
(1.3.52)
pois P é constante, ou usando (1.3.49) e (1.3.51),
dS
= pq̇ − H = L ,
dt
⇒
S(t) =
Z
t
t0
Ldt′ + constante ,
(1.3.53)
22
Tópicos de Mecânica Clássica
que é uma função - dado que o limite superior do integral não está fixo - construida da
acção.
Hamiltonianos independentes do tempo
Se o Hamiltoniano não depende explicitamente do tempo, o lado direito da equação de
Hamilton-Jacobi também não deverá depender do tempo pelo que podemos tomar a função
acção como sendo
S = −Et + h(q) ,
(1.3.54)
onde E tem a interpretação de energia, pois é igual ao Hamiltoniano. Para um Hamiltoniano do tipo
H=
p2
+ V (q) ,
2m
(1.3.55)
a equação de Hamilton-Jacobi reduz-se a
∂h
∂q
2
= 2m(E − V (q)) ,
(1.3.56)
de onde se extrai imediatamente uma assinatura caracterı́stica da mecânica clássica: esta
equação só tem solução real se E > V (q); logo o movimento é proibido onde a energia da
partı́cula é menor que o potencial. Integrando e substituindo em (1.3.54) obtemos
Z p
S = −Et ±
2m(E − V (q))dq .
(1.3.57)
Para resolver o problema dinâmico usamos o facto, anteriormente mencionado, que
as derivadas da função acção relativamente às constantes de integração são também constantes. Assim,
∂S
= const.
∂E
(1.3.57)
⇒
r Z
dq
m
p
t=±
+ constante .
2
E − V (q)
(1.3.58)
Substituindo pelo potencial do problema em questão obtém-se t = t(q), que invertendo
nos dá q = q(t), e portanto a solução do problema dinâmico. Voltaremos a encontrar a
equação de Hamilton-Jacobi, no limite clássico da equação de Schrödinger (secção 8.4).
1.4 Sumário
1.4
23
Sumário
Vimos os vários tipos de equações da mecânica clássica:
• Newtonianas,
d~p
;
F~ =
dt
(1.4.1)
• Euler-Lagrange, para o Lagrangeano L = L(q, q̇, t),
d ∂L ∂L
−
=0;
dt ∂ q̇
∂q
(1.4.2)
• Hamiltonianas, para o Hamiltoniano H = H(q, p, t),
q̇ =
∂H
,
∂p
ṗ = −
∂H
,
∂q
(1.4.3)
ou, de um modo mais geral, a evolução de uma variável dinâmica f = f (q, p, t) é
dada por
∂f
df
=
+ {f, H} ;
dt
∂t
• Hamilton-Jacobi, para uma função acção S = S(q, P, t),
∂S
∂S
∂S
=Q,
H q, p =
,t = −
.
∂P
∂q
∂t
(1.4.4)
(1.4.5)
Dadas condições iniciais, qualquer um destes conjuntos de equações determina exactamente a trajectória da partı́cula tal e qual a podemos medir num instante posterior. Este
determinismo é o paradigma da mecânica clássica.
CAPÍTULO
2
O perı́odo de Transição
Historicamente podemos atribuir uma data de nascimento à Mecânica Quântica. No dia
14 de Dezembro de 1900, Max Planck (1858-1947), apresentou uma solução inovadora para
explicar as caracterı́sticas observadas da radiação do corpo negro. O modelo de Planck
continha a génese das ideias quânticas bem como introduzia aquela que viria a ser chamada
constante de Planck, a constante fundamental da Mecânica Quântica. No entanto, somente
26 anos depois a Mecânica Quântica emergiria na sua forma final. No perı́odo intermédio,
entre 1900 e 1926 viveu-se um perı́odo de transição em que, para explicar certos resultados
experimentais, se introduziu na fı́sica os conceitos de
i) Quantificação de grandezas fı́sicas;
ii) Dualidade onda-partı́cula;
iii) Interpretação probabilı́stica de fenómenos.
Para muitos dos fı́sicos envolvidos neste processo, estas ideias não seriam mais do que
conceitos temporários, que a devida altura deveriam ser substituidos por ideias mais convencionais. Em particular, o ponto iii) aparecia como altamente indesejável para a maioria
da comunidade cientı́fica, sendo a reluctância desta espelhada na famosa frase de Einstein
26
O perı́odo de Transição
y
θi
θ1
MEIO 1
x
MEIO 2
θ2
Figura 2.1: Um raio de luz proveniente do meio 1, incidente na superfı́cie y = 0 com ângulo
de incidência θi tem uma componente reflectida, ângulo de reflexão θ1 e uma componente
refractada, emergente no meio 2 na direcção definida por θ2 .
‘Deus não joga aos dados...’ . No entanto é no ponto ii) que se encontra quer a origem do
ponto i) e do ponto iii) quer a essência da mecânica quântica. Vamos discutir algumas das
experiências que motivaram a introdução destas ideias e terminamos este capı́tulo com o
quadro conceptual que delas emergiu.
2.1
A luz: ondas versus corpúsculos
Para além do conceito de partı́cula discutido anteriormente (i.e. pequenas “bolas de bilhar”), também o conceito de onda nos é familiar. As ondas circulares que se propagam
num lago calmo onde cai uma pedra ou as ondas numa corda de guitarra a vibrar são dois
exemplos familiares.
Entre o século XVII e o século XIX, duas correntes antagónicas disputavam qual a
natureza da luz. Newton (e os seus seguidores), naturalmente inspirado pelo sucesso da sua
mecânica de partı́culas, defendia que a luz é um fluxo de pequenos corpúsculos. Christian
Huyghens (1629-1695) concebeu a ideia de a luz ser uma onda, a propagar-se através de
um suporte invisı́vel baptizado de éter.
A discussão centrava-se nos seguintes fenómenos fı́sicos:
• Reflexão; como a verificada num espelho ou numa superfı́cie de água. Obviamente
2.1 A luz: ondas versus corpúsculos
27
este fenómeno era observado para a luz. Era explicado pela teoria corpuscular por
conservação da quantidade de movimento que previa (ver figura 2.1)
θi = θ1 (lei da reflexão) ,
(2.1.1)
mas podia também ser quantitativamente explicado pela teoria ondulatória pelo
princı́pio de Huygens, ou, em óptica geométrica pelo princı́pio do tempo mı́nimo
de Fermat - apêndice B;
• Refracção; ou seja, uma mudança (normalmente) brusca na direcção de propagação da
luz, em geral devido à mudança de meio, um fenómeno também observado para a
luz. Se a luz fosse feita de pequenos corpúsculos poder-se-ia invocar conservação de
momento para explicar a refracção do seguinte modo: consideremos que o meio 1
está a um potencial V1 e o meio 2 a um potencial V2 , no ‘setup’ da figura 2.1. Na
transição de meio por uma partı́cula existe uma força que nela actua que tem apenas
componente Fy . Logo px é conservada ou seja
v2
sin θi
=
sin θ2
v1
(‘Lei da refraccão corpuscular′ ) .
(2.1.2)
Por outro lado, se a luz fosse uma onda, o princı́pio de Huygens (ou o princı́pio do
tempo mı́nimo de Fermat - apêndice B) implica
sin θi
v1
=
sin θ2
v2
(lei de Snell) .
(2.1.3)
Mas devido à dificuldade em medir a velocidade de luz num meio, esta diferença não
foi suficiente para decidir qual a verdadeira natureza da luz até ao século XIX. (Note
que Jean Bernard Léon Foucault (1819-1868) fez as primeiras medições da velocidade
da luz em meados do séc. XIX.)
• Difracção; Fenómeno ondulatório; capacidade de ondas rodearem obstáculos - como a
água do mar rodeia uma rocha - e por isso não produzirem ‘sombras’ bem definidas figura 2.2. Pelo contrário, corpúsculos não são difractados - figura 2.3; se a luz fosse
corpuscular deixaria uma sombra bem definida. Mas todos sabemos que a luz de
28
O perı́odo de Transição
ECRA
sombra mal definida
obstaculo
Frentes de onda em t=0
Frentes de onda em t>0
Figura 2.2: Ondas sofrem difracção, isto é, rodeiam o obstáculo. As duas frentes de
onda - uma proveniente de cada um dos lados do obstáculo - interferem. A sua fase num
determinado ponto depende da distância que cada uma teve de viajar para chegar a esse
ponto; por exemplo, no meio a interferência é construtiva. Este é o padrão de difracção do
obstáculo, que estraga a sombra. Na figura não está representada a onda reflectida.
uma lanterna ou do sol deixa sombras bem definidas; este argumento levou a que a
teoria corpuscular fosse dominante durante todo o século XVIII.
Embora com diferenças quantitativas, tanto a perspectiva ondulatória como corpuscular da luz explicam os fenómenos de reflexão e refracção, enquanto que apenas a teoria
ondulatória explica o fenómeno de difracção (ou de interferência em geral). Em óptica, os
primeiros dois costumam ser tratados por óptica geométrica,1 onde se lida com raios de luz
e não frentes de onda, que por sua vez são essenciais para a óptica fı́sica que lida com os
fenómenos puramente ondulatórios.
2.1.1
Experiências de Young (1801): ondas triunfam
Quando temos uma situação em que ondas encontram um obstáculo existem duas escalas
relevantes: λ=comprimento de onda, e l=largura do obstáculo. Thomas Young (1773-1829)
observou que as ondas na água só tinham uma difracção apreciável e como tal “sombras”
mal definidas imediatamente atrás do obstáculo se
l.λ.
1
(2.1.4)
A óptica geométrica é uma aproximação quase corpuscular da óptica que é válida quando l ≫ λ, na
notação da próxima secção.
2.1 A luz: ondas versus corpúsculos
ECRA
29
sombra bem definida
obstaculo
corpusculos em t=0
t>0
Figura 2.3: Corpúsculos não sofrem difracção; assim, foi argumentado que se a luz fosse
corpuscular as sombras deveriam ser bem definidas.
ECRA
sombra bem definida
obstaculo
Frentes de onda em t=0
Frentes de onda em t>0
Figura 2.4: Ondas sofrem uma difracção negligenciável se o obstáculo é grande relativamente ao comprimento de onda. Note-se que mais uma vez não representamos a onda
reflectida.
Se l ≫ λ há uma zona atrás do obstáculo onde a sombra está bem definida, tal como
na teoria corpuscular, isto é, a difracção é negligenciável - figura 2.4. Assim, a nossa experiência diária de sombras bem definidas seria consistente com uma teoria ondulatória da
luz se os objectos cujas sombras vemos tivessem largura muito maior do que o comprimento
de onda da luz.
Podemos também considerar a experiência contrária, isto é, consideremos uma onda
plana com comprimento de onda λ que em vez de encontrar um obstáculo passa por uma
fenda de tamanho l. Se l ≃ λ a difracção da onda é grande, pelo que a fenda se comporta
como uma fonte de ondas circulares.
Para testar a verdadeira natureza da luz contraste-se a experiência na figura 2.5 com a
30
O perı́odo de Transição
Figura 2.5: Experiência de Young com ondas (extraı́do das Feynman lectures on Physics Vol 3 ).
experiência na figura 2.6.
Experiência de Young com ondas
Como explicado anteriormente, as duas fendas na parede (a) da figura 2.5, funcionam
(quase) como fontes de ondas circulares, ou mais rigorosamente, semi-circulares. Existe
um detector que mede a altura instantânea da água num ponto x - coordenada paralela ao
detector - medindo
A1 (x)ei(ωt+φ1 (x)) ≡ h1 (x)eiωt , se apenas a fenda 1 estiver aberta
i(ωt+φ2 (x))
A2 (x)e
iωt
≡ h2 (x)e
,
(2.1.5)
, se apenas a fenda 2 estiver aberta
onde Ai são as amplitudes e φi são fases, cuja informação se condensa nas amplitudes complexas hi (x). O detector pode ainda calcular a intensidade das ondas, que por analogia com
as ondas electromagnéticas (para as quais corresponde à energia que passa pelo detector
por unidade de tempo e de área perpendicular à direcção de propagação), é o quadrado do
2.1 A luz: ondas versus corpúsculos
31
módulo da amplitude, obtendo
I1 = |h1 (x)|2 , se apenas a fenda 1 estiver aberta
I2 = |h2 (x)|2 , se apenas a fenda 2 estiver aberta
,
(2.1.6)
que são dados pelos padrões em (c) na figura.
Consideremos agora que as duas fendas estão abertas. As ondas ‘emitidas’ a partir das
duas fendas têm a mesma fase no mesmo instante de tempo, pois provêm de uma mesma
onda antes da parede. Neste caso, a altura da água no detector e a intensidade das ondas
são dados respectivamente por
(h1 (x) + h2 (x))eiωt ,
I1+2 = |h1 (x) + h2 (x)|2 .
(2.1.7)
Dependendo da coordenada x, as ondas poderão estar em fase ou não. Por exemplo,
exactamente no meio do detector (correspondente a igual distância das duas fendas), as
ondas vão estar em fase pois demoram o mesmo tempo a chegar lá. Em geral
I1+2 = |h1 (x) + h2 (x)|2 = |h1 (x)|2 + |h2 (x)|2 + 2|h1 (x)||h2 (x)| cos δ(x) ,
(2.1.8)
onde δ é o angulo entre eiφ1 (x) e eiφ2 (x) . Este fenómeno de interferência explica o padrão
(c) na figura 2.5.
Uma ‘experiência de Young’ com corpúsculos
Imaginemos uma pistola que atira balas aleatoriamente como na figura 2.6. A variável
x pode ser vista como uma variável aleatória, correspondendo à posição de chegada das
balas. O detector obtém as seguintes funções de distribuição de probabilidades:
P1 (x) , se apenas a fenda 1 estiver aberta
P2 (x) , se apenas a fenda 2 estiver aberta
.
(2.1.9)
P1+2 (x) = P1 (x) + P2 (x) , se as duas fendas estiverem abertas
Em particular, não há interferência entre corpúsculos. Note-se a diferença fundamental
entre corpúsculos e ondas, expressa em (2.1.9) versus (2.1.6) e (2.1.8). A probabilidade
para corpúsculos é a soma das probabilidades individuais. A intensidade das ondas - que no
32
O perı́odo de Transição
Figura 2.6: Experiência de Young com ‘balas’ (extraı́do das Feynman lectures on Physics
- Vol 3 ).
final do capı́tulo faremos corresponder a uma probabilidade - não é a soma das intensidades
individuais; de facto resulta da soma das amplitudes individuais.
Fazendo este tipo de experiência com luz, com duas fendas muito finas (e pequena
distância entre elas), Young observou um padrão de interferência semelhante ao da figura
2.5 (c), e concluiu que a luz era uma onda. Esta perspectiva foi reforçada pela teoria de
Maxwell que tem soluções ondulatórias para o campo electromagnético - ondas electromagnéticas, descobertas posteriormente - em 1887 - por Hertz, das quais a luz visı́vel é um
exemplo. Mais ainda, (2.1.3) foi derivado da teoria de Maxwell e medida em experiências
com radiação electromagnética (e não (2.1.2)). Assim, no final do século XIX a comunidade
cientı́fica concordava que a luz (e toda a radiação electromagnética) seria um fenómeno
ondulatório.
2.1 A luz: ondas versus corpúsculos
33
Figura 2.7: Distribuição espectral da radiação de um corpo negro; fórmula clássica de
Rayleigh-Jeans versus resultados experimentais (extraı́do de Eisberg & Resnick, ‘Quantum
Physics’ ).
2.1.2
A radiação do corpo negro, Planck e o quantum (1900)
Consideremos um corpo que absorve toda a radiação electromagnética nele incidente, isto
é, um absorsor perfeito. Como, em particular, ele absorve o espectro visı́vel, este é um
corpo negro.
Se um corpo negro está em equilı́brio térmico à temperatura T , ele terá de emitir tanta
energia por unidade de tempo quanto aquela que recebe - o corpo negro é também um emissor perfeito. Mas ao contrário da energia recebida, que pode ser arbitrariamente distribuida
pelas diversas frequências no espectro electromagnético, verifica-se experimentalmente que
a energia emitida tem um distribuição espectral ρT (ν)dν, muito bem definida, que só depende da temperatura do corpo negro. A curva experimental ρT (ν)dν tem a forma de uma
‘montanha assimétrica’ - figura 2.7.
A descrição teórica deste fenómeno em fı́sica clássica, envolvia calcular o número de
ondas estacionárias numa cavidade (3-dimensional) com frequência no intervalo dν, multiplicando o resultado pela energia média de uma onda, dada pelo teorema da equipartição
34
O perı́odo de Transição
de energia como sendo KB T , onde KB é a constante de Boltzmann, cujo valor numérico é
KB = 1.38 × 10−23 Joule/K .
(2.1.10)
Deste modo, obtém-se a fórmula de Rayleigh-Jeans
ρT (ν)dν =
8πν 2
KB T dν .
c3
(2.1.11)
Comparando esta lei com a curva experimental - figura 2.7 - verifica-se um desacordo
absoluto para frequências elevadas, dado que a previsão teórica diverge, que foi baptizado
como catástrofe do ultra-violeta.
Em 1900, Planck mostrou os seguintes dois factos:
• 1) A curva experimental era bem reproduzida pela fórmula empı́rica
ρT (ν) =
8πν 2
hν
,
3
hν/K
BT − 1
c e
(2.1.12)
hoje chamada Lei de Planck. Nesta fórmula foi introduzida a constante h, chamada constante de Planck com dimensões de Energia×T empo (as mesmas da Acção introduzida
em (1.2.6)) e com o valor numérico (actual)
h = 6.626 × 10−34 Joule × Segundo ,
(2.1.13)
que foi inicialmente determinada ajustando a lei de Planck à curva experimental da radiação
do corpo negro. A constante de Planck tornar-se-á a constante fundamental da mecânica
quântica. Para frequências pequenas, a exponencial na Lei de Planck pode ser aproximada
pelos dois primeiros termos da sua série de Taylor
KB T
ν≪
h
8πν 2
8πν 2
hν
⇒ ρT (ν) ≃ 3
= 3 KB T ,
c 1 + hν/KB T − 1
c
(2.1.14)
e portanto recuperamos a fórmula de Rayleigh-Jeans, que de facto dava bons resultados
para frequências pequenas. Mas para frequências elevadas, a fórmula de Planck
ν≫
KB T
h
⇒ ρT (ν) ≃
evitando a catástrofe do ultra-violeta.
8πν 2 hν
ν→∞
−→ 0 ,
c3 ehν/KB T
(2.1.15)
2.1 A luz: ondas versus corpúsculos
35
a)
b)
c)
d)
e)
Figura 2.8: a) Distribuição de Boltzmann; b) Energia média na teoria clássica - independente da frequência da radiação - corresponde à area debaixo da curva; c),d),e) Energia
média na teoria de Planck. Em cada caso, o integral é substituı́do por uma soma de Riemann, sendo a frequência da radiação o tamanho da base dos rectângulos. Para frequências
pequenas, a soma de Riemann é praticamente igual ao integral - c). À medida que aumentamos a frequência, a soma de Riemann diminui tendendo asimptoticamente para zero. Na
notação da figura k = KB e E¯ = hEi (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ).
36
O perı́odo de Transição
• 2) Comparando (2.1.11) com (2.1.12), a diferença está no valor da energia média de
uma onda, que classicamente era calculada pela ‘lei de equipartição da energia’. Esta lei é
deduzida da distribuição de Boltzmann, que é uma função de distribuição de probabilidade
(portanto já normalizada) para encontrar um oscilador harmónico com energia E a uma
temperatura T
P(E) =
e−E/KB T
.
KB T
(2.1.16)
Uma onda estacionária não é mais do que um oscilador harmónico. A energia média destas
ondas é (conforme (C.40))
Z ∞
Z
−E/KB T ∞
hEi =
EP(E)dE = −Ee
|0 +
0
∞
e−E/KB T dE = KB T .
(2.1.17)
0
Planck observou que para reproduzir o comportamento experimental a energia média teria
de ter os seguintes comportamentos assimptóticos
ν→0
hEi −→ KB T ,
ν→∞
hEi −→ 0 .
(2.1.18)
Isto é, tem de haver um ‘cut-off’ na energia média para frequências elevadas, de modo a
impedir a catástrofe do ultra-violeta. A grande contribuição de Planck foi perceber que
isto se podia conseguir discretizando a energia que o corpo negro emite
E = nhν .
(2.1.19)
A energia é quantificada, sendo o quantão de energia - a quantidade mı́nima emitida de cada
vez - hν. Em vez de (2.1.16) temos agora uma distribuição discreta para a probabilidade
de encontrar uma onda com frequência ν no n-ésimo estado de energia, En ,
e−nhν/KB T
,
Pn = P(En = nhν) =
KB T
n = 0, 1, 2, 3, ...
(2.1.20)
Esta distribuição de probabilidade não está normalizada. Assim sendo, a energia média é
!
P∞
P∞
∞
−nhν/KB T
X
nhνe
E
P
d
n=0
n=0 n n
= P
= −KB T ν ln
hEi = P
e−nhν/KB T , (2.1.21)
∞
∞
−nhν/KB T
P
e
dν
n=0 n
n=0
n=0
mas o último somatório é apenas uma soma geométrica; logo
hν
d
1
hEi = −KB T ν ln
= hν/K T
,
−hν/K
T
B
B
dν
1−e
e
−1
(2.1.22)
2.1 A luz: ondas versus corpúsculos
37
Figura 2.9: Esquerda: Aparato experimental do efeito fotoeléctrico; Direita: Variação da
intensidade de corrente com o potencial entre cátodo e ânodo para duas intensidades de
luz diferentes (Extraı́do de Tipler, ‘Physics’ ).
que é exactamente o necessário para obter a lei de Planck. Assim, a radiação do corpo
negro é explicada se a energia de um oscilador harmónico, e como tal a energia da radiação
emitida pelo corpo negro, estiver quantificada. Mas estar quantificada é dizer que vem
em pedaços, o que se assemelha mais a uma descrição corpuscular do que ondulatória da
radiação.
2.1.3
O efeito fotoeléctrico (Einstein 1905)
O efeito fotoeléctrico foi descoberto por Hertz em 1887 e estudado por Lenard em 1900.
Consiste na ejecção de electrões de um material onde incide luz (ou, mais geralmente,
radiação electromagnética). Um aparato experimental possı́vel está representado na figura
2.9, que pode ser descrito do seguinte modo:
• Luz incide no cátodo C, ejectando electrões;
• Se algum electrão atinge o ânodo A, gera-se uma corrente eléctrica no circuito externo;
38
O perı́odo de Transição
• O número de electrões que atinge o ânodo pode ser aumentado ou diminuido introduzindo
uma diferença de potencial entre A e C,
V = VA − VC ,
(2.1.23)
• Se V > 0, significa que o potencial aumenta (para uma carga positiva; para uma carga
negativa efectivamente diminui) e mais electrões chegam ao ânodo;
• Quando V é suficientemente grande, isto é
V > V1 ,
(2.1.24)
para um certo V1 , todos os electrões ejectados atingem o ânodo e aumentando ainda
mais V a corrente não se altera - figura 2.9. Esta corrente limite é designada corrente
de saturação;
• Lenard observou que a corrente máxima é proporcional à intensidade da luz. Tal facto
era esperado com base na teoria clássica: duplicando a intensidade da luz, duplicamos
a energia incidente por unidade de tempo e de área e como tal duplicamos o número
de electrões ejectados e como tal a corrente;
• Se pelo contrário V é negativo, menos electrões chegam ao ânodo (do que se não houvesse
potencial), pois são repelidos;
• Se V é suficientemente negativo,
V < V0 ,
(2.1.25)
para um dado V0 , nenhum electrão chega ao ânodo. Chama-se a V0 o potencial de
paragem, que está relacionado com a energia cinética máxima dos electrões emitidos
por
|eV0 | =
1 2
mv
2
onde e, m são a carga e massa do electrão;
max
,
(2.1.26)
2.1 A luz: ondas versus corpúsculos
39
Figura 2.10: Experiência de Millikan (1916), obtendo a recta prevista por Einstein para a
variação do potencial de paragem entre cátodo e ânodo com a frequência da luz (Extraı́do
de Tipler, ‘Physics).
• V0 não depende da intensidade luminosa para luz da mesma frequência, o que não está de
acordo com a teoria clássica. Pela teoria clássica, aumentando a intensidade luminosa,
deveria aumentar a energia cinética máxima dos electrões e como tal variar V0 .
Esta contradição entre teoria clássica e experiência levou Einstein, em 1905, a propôr
que a energia na luz está distribuı́da em pequenos pacotes, posteriormente baptizados de
fotões, com energia dada pela fórmula de Planck,
E = hν .
(2.1.27)
Variando a intensidade da luz mas não a sua frequência, varia o número de fotões, mas
não a energia de cada um deles. Como cada electrão ejectado sê-lo-ia por choque com um
fotão, isto explicava porque V0 não dependia da intensidade luminosa. Se assim fosse,
1 2
mv
2
max
= |eV0 | = hν − φ ,
(2.1.28)
40
O perı́odo de Transição
em que φ é a chamada função de trabalho, que é a energia necessária para extrair um
electrão do metal. Daqui se deduz que
|V0 | =
φ
h
ν−
.
|e|
|e|
(2.1.29)
As experiências de Robert Millikan (1868-1952) em 1914, 1916 mostraram esta relação
linear - figura 2.10 - sendo o declive consistente com os valores para a constante de Planck
medidos através da radiação do corpo negro.
Uma outra caracterı́stica do efeito fotoeléctrico que não pode ser explicada pela teoria
clássica é a ausência de intervalo de tempo entre a incidência de radiação e a ejecção de
electrões. A intensidade da radiação é a potência por unidade de área que chega ao cátodo.
Podemos diminuir a intensidade de modo a que fossem preciso horas para obter energia
suficiente para superar a função de trabalho e ejectar um electrão. Mas experimentalmente
não se detecta, essencialmente, nenhum intervalo de tempo. Nem este depende da intensidade. À luz da teoria fotónica isto é facilmente explicável. Diminuindo a intensidade
diminuem os fotões que chegam por unidade de tempo, mas cada fotão é suficiente para
ejectar um electrão.
A teoria corpuscular da radiação teve ainda outras vitórias, da qual destacamos o efeito
Compton (demonstrado em 1923), que lida com a difusão de radiação por electrões. Assim,
mais de um século depois das experiências de Young, era novamente necessário invocar a
teoria corpuscular para descrever o comportamento da luz, sendo que o comportamento
ondulatório continuava a ser fundamental para explicar os fenómenos de difracção e interferência que vimos anteriormente. Este estado de coisas levou Einstein a escrever, em 1924
“Existem hoje duas teorias sobre a luz, as duas indispensáveis... e sem qualquer ligação
lógica entre si.”. Antes de vermos como lida a mecânica quântica com este aparente paradoxo, mudemos a discussão da radiação para a matéria.
2.2
Matéria: corpúsculos versus ondas
Por volta de 1910 sabia-se que o átomo, embora neutro, continha electrões. O efeito
fotoeléctrico, por exemplo, demonstrava-o. Mas devido à sua neutralidade, tinha também
2.2 Matéria: corpúsculos versus ondas
41
de conter cargas positivas, pelo que se questionava qual a distribuição no átomo de cargas
negativas e positivas.
J. J. Thomson (1856-1940) propusera o seu modelo do ‘pudim de passas’, em que os
electrões se apresentavam como as passas num pudim que, por sua vez, representava a
distribuição de carga positiva. O conjunto teria um raio da ordem de 10−10 m,2 isto é, 1
Angström. Se o átomo estivesse no mı́nimo da sua energia, os electrões estariam parados
em posições de equilı́brio; se o átomo estivesse excitado - por exemplo aquecido -, os
electrões oscilariam em torno dessas posições de equilı́brio, emitindo no processo radiação
electromagnética. Explicava-se assim qualitativamente - mas não quantitativamente - os
espectros atómicos.
As experiências de Ernest Rutherford (1871-1937) em 1911 mostraram que o modelo
de Thompson era inadequado. Rutherford fez incidir numa fina folha metálica um feixe
colimado de partı́culas α, isto é, átomos de hélio duplamente ionizados. O objectivo era
medir o ângulo de desvio dessas partı́culas α (dito o ângulo de difusão) relativamente à
direcção inicial, devido à interacção com os átomos na folha metálica. Como este desvio
resulta de uma interacção electromagnética poder-se-ia estimar a partir da sua medição
o potencial a que as partı́culas α estavam sujeitas. A surpresa foi encontrar eventos em
que as partı́culas α eram desviadas de ângulos muito elevados, até perto de 180o, isto
é, algumas partı́culas α voltavam para trás! Nas palavras de Rutherford: ”Era como se
disparassemos uma bala de canhão contra um lenço de papel e a bala voltasse para trás.”.
A conclusão é que essas (poucas) partı́culas α que eram muito deflectidas encontravam
um forte potencial repulsivo, o que implica uma forte concentração de carga positiva num
pequeno espaço. Esta era a contradição com o modelo de Thomson, em que a carga
positiva se encontrava dispersa em todo o raio atómico - cerca de 10−10 m -, enquanto que
pelas estimativas de Rutherford o potencial repulsivo observado necessitaria que essa carga
estivesse concentrada num raio de 10−14 m.3
2
Este número pode ser estimado considerando a densidade de uma substância pura, o seu peso atómico
e o número de Avogadro.
3
Mais rigorosamente, era possı́vel num modelo como o de Thomson explicar a existência de deflexões
perto dos 180o através de uma soma de pequenas deflexões. Contudo, a probabilidade de isso acontecer
42
O perı́odo de Transição
Assim Rutherford sugeriu que a carga positiva de um átomo e como tal a grande maioria
da massa, dado que se sabia que a razão da massa do electrão para a massa do átomo era
muito pequena, estavam concentradas numa pequena zona central chamada núcleo. Deste
modelo, Rutherford deduziu uma expressão para a secção eficaz diferencial de difusão que
de facto explicava quantitativamente os seus resultados experimentais, validando o modelo
(ver capı́tulo 10). Mas deixava em aberto a questão do que fariam os electrões neste
modelo atómico. Se os electrões estivessem inicialmente parados, cairiam rapidamente
para o núcleo, neutralizando-o e eliminando o forte potencial repulsivo necessário para
explicar as experiências de Rutherford. Era pois necessário estabilizar os electrões longe
do núcleo. Um modelo simples era o análogo do sistema solar. Os electrões encontrarse-iam em órbitas circulares ou elı́pticas em volta do núcleo (ver Folhas de Problemas).
Só que isto implicaria que os electrões tivessem movimentos acelerados. De acordo com
o electromagnetismo clássico uma carga acelerada emite radiação, perdendo gradualmente
energia, o que implicaria que os electrões tivessem órbitas em espiral caindo rapidamente
no núcleo. O tempo que demoraria esse processo pode ser estimado do seguinte modo.
Veremos na próxima secção que a energia total de uma órbita clássica circular de raio r é
dada por (2.2.10). Assumindo que o raio da órbita pode variar com o tempo num processo
‘quase-estático’4 obtemos
dE
1 Ze2
=
ṙ .
dt
8πǫ0 r 2
(2.2.1)
Por outro lado, pela fórmula de Larmor dada no problema 2c) da folha de Problemas 1,
usando para a aceleração a fórmula da aceleração centrı́peta
2
dE
e2
e2 v 4
Ze2
(2.2.9)
=
−
=−
.
dt
6πǫ0 c3 r 2
6πǫ0 c3 4πǫ0 mr 2
(2.2.2)
Igualando estas duas expressões para a derivada temporal da energia obtemos (para Z = 1)
2
4α2 ~2
4 α~
2
3
(t − t0 ) .
(2.2.3)
3r ṙ = −
⇒ r =−
cm2
c m
neste modelo implicava uma variação do número de acontecimentos com a espessura da folha metálica que
não era verificada experimentalmente.
4
Esta hipótese poderá não ser muito boa, mas a estimativa do tempo de queda é representativa da fı́sica
do processo.
2.2 Matéria: corpúsculos versus ondas
43
Figura 2.11: Experiência para medir um espectro atómico (extraı́do de Eisberg & Resnick,
‘Quantum Physics’ ).
Introduzimos a constante de estrutura fina
α≡
e2
.
4πǫ0 ~c
(2.2.4)
Como esperado, o raio diminui com o tempo. Para uma órbita de 10−10 m, pode-se estimar
o tempo de queda em cerca de 10−10 segundos! O átomo não seria estável e para além
disso esta radiação - que teria um espectro contı́nuo - emitida na queda era diferente da
radiação atómica observada que tem um espectro discreto que agora discutimos.
2.2.1
O Espectro do átomo de Hidrogénio
Um espectro atómico pode ser medido com um ‘setup’ experimental do tipo da figura 2.11.
Há essencialmente dois tipos de espectros:
• No espectro de emissão, a fonte de luz na esquerda da figura 2.11, corresponde ao
gás (monoatómico) cujo espectro se quer medir, no qual se faz descargas eléctricas. As
descargas eléctricas excitam os átomos que, ao voltarem para o seu estado de energia
mı́nima, emitem radiação. Esta é encaminhada através de uma fenda para um prisma, que
dispersa a radiação nos diversos comprimentos de onda, que são impressos numa chapa
44
O perı́odo de Transição
Figura 2.12: Fotografia do espectro de emissão do hidrogénio (cima) - série de Balmer;
comprimentos de onda correspondentes (baixo) (extraı́do de Eisberg & Resnick, ‘Quantum
Physics’ ).
fotográfica. Para o hidrogénio obtém-se, na região do visı́vel, uma fotografia do tipo da
imagem de cima na figura 2.12. Estas linhas são (parte do) espectro de emissão do átomo
de Hidrogénio.
• No espectro de absorção, a fonte de luz emite um espectro contı́nuo que incide num
contentor de vidro onde se encontra o gás a estudar. Este irá absorver alguns comprimentos
de onda particulares. Os restantes seguem para a fenda e daı́ para o prisma e chapa
fotográfica. Assim, na fotografia de um espectro de absorção teremos algumas riscas onde
falta radiação, ao contrário do espectro de emissão que corresponde a algumas riscas onde
radiação foi emitida.
Olhando para a figura 2.12 há uma regularidade óbvia nas riscas do espectro de emissão
do hidrogénio. Em 1885, Johann Balmer (1825-1898) mostrou que a seguinte fórmula
reproduzia correctamente os comprimentos de onda, λ, das riscas observadas:
1
1
1
, n = 3, 4, 5, ...
= RH
−
λ
22 n2
(2.2.5)
onde RH é a chamada constante de Rydberg, cujo valor numérico (actual) é
RH = 10967757.6 ± 1.2 m−1 .
(2.2.6)
2.2 Matéria: corpúsculos versus ondas
45
À série de comprimentos de onda descritos pela fórmula de Balmer chama-se série de
Balmer. Para o hidrogénio existe uma infinidade de séries de comprimentos de onda, cada
um descrito por uma fórmula semelhante a (2.2.5) - as primeiras cinco encontram-se escritas
na tabela seguinte.
Nome da série
Zona de Comprimentos de onda
Lyman
Ultravioleta
Balmer
Ultravioleta próximo e visı́vel
Paschen
Infravermelho
Brackett
Infravermelho
Pfund
Infravermelho
1
λ
1
λ
1
λ
1
λ
1
λ
1/λ
1
= RH
2
1
1
= RH
2
2
1
= RH
2
3
1
= RH
2
4
1
= RH
52
Valores de n
−
−
−
−
−
1
n2 1
n2 1
n2 1
n2 1
n2
n = 2, 3, 4, . . .
n = 3, 4, 5, . . .
n = 4, 5, 6 . . .
n = 5, 6, 7 . . .
n = 6, 7, 8, . . .
Era pois necessário um modelo atómico capaz de explicar estas riscas que fosse ao
mesmo tempo consistente com as observações de Rutherford.
2.2.2
O modelo atómico de Bohr (1913)
Um tal modelo foi proposto por Niels Bohr (1885-1962), baseado na observação que, em
mecânica clássica, o movimento de uma carga num campo de Coulomb tinha como possı́veis
soluções para órbitas fechadas, elipses e circunferências. Por simplicidade Bohr escolheu
as últimas e postulou que:
i) Um electrão num átomo move-se em órbitas circulares em torno do núcleo, sob a influência do campo de Coulomb do núcleo, de acordo com as leis da mecânica clássica;
ii) Ao contrário das leis da mecânica clássica, apesar de acelerado, o electrão não irradia
energia, mantendo a sua energia E constante;
iii) Ao contrário das leis da mecânica clássica, as únicas órbitas possı́veis para o movimento do electrão são aquelas cujo momento angular orbital, L, é um múltiplo inteiro
46
O perı́odo de Transição
de h/2π
L = n~ ⇔ mvr = n~ ,
~ ≡ h/2π ;
(2.2.7)
iv) Radiação electromagnética é emitida sempre que um electrão, inicialmente em movimento numa órbita de energia total Ei muda descontinuamente - impossı́vel em
mecânica clássica - o seu movimento para uma órbita de energia total Ef . A radiação emitida tem frequência
ν=
Ei − Ef
.
h
(2.2.8)
Bohr notou que estes postulados conduziam a uma explicação quantitativa do átomo
de hidrogénio. Mas generalizemos o argumento para um átomo com número atómico Z.
O raio de uma órbita circular em mecânica clássica é determinado pela igualdade da força
centrı́peta (Coulomb neste caso) com a força centrı́fuga
v2
1 Ze2
=
m
,
4πǫ0 r 2
r
(2.2.9)
onde ‘e’ é a carga do electrão (em módulo). A energia total de uma órbita circular no
problema de Coulomb é dada por
1
1 Ze2
E = mv 2 −
2
4πǫ0 r
(2.2.9)
=
−
1 Ze2
.
8πǫ0 r
(2.2.10)
Estes são os ingredientes necessários. Usando o terceiro postulado de Bohr em (2.2.9)
obtemos
r=
4πǫ0 2 2
n~ ,
mZe2
(2.2.11)
2
(2.2.12)
o que introduzido em (2.2.10) dá
E=−
Ze2
4πǫ0
m
.
2n2 ~2
A quantificação do momento angular das órbitas permitidas implica a quantificação da
energia dessas órbitas. Assim, o quarto postulado de Bohr diz-nos que a radiação emitida
quando o electrão salta de uma órbita com momento angular ni ~ para uma órbita com
momento angular nf ~
!
2 2
Ze
m
1
1
ν=
− 2 ,
4πǫ0
4π~3 n2f
ni
c=νλ
⇒
1
=
λ
Ze2
4πǫ0
2
m
4π~3 c
1
1
− 2
2
nf
ni
!
. (2.2.13)
2.2 Matéria: corpúsculos versus ondas
47
Figura 2.13: ‘Saltos’ correspondendo às várias séries do átomo de hidrogénio (extraı́do de
Eisberg & Resnick, ‘Quantum Physics’ ).
Esta fórmula reproduz a fórmula para as várias séries do átomo de hidrogénio, se identificarmos5
R∞ = RH ,
onde R∞ ≡
Ze2
4πǫ0
2
m
.
4π~3 c
(2.2.14)
O modelo de Bohr dá a seguinte interpretação ao átomo de hidrogénio. Chamemos a
cada valor possı́vel de n um estado do electrão. Existe um nı́vel de energia mı́nimo,
chamado estado fundamental, correspondente a n = 1. Todos os outros estados em que o
electrão se pode encontrar são excitados. Cada série do átomo de hidrogénio corresponde
a todos os saltos possı́veis do electrão para um dado estado. Quando o estado final é o
fundamental (n = 1)/primeiro excitado (n = 2)/segundo excitado (n = 3) essa é a série de
Lyman/Balmer/Paschen - figura 2.13.
M
R∞ , pois o centro de massa do movimento não é exactamente no núcleo Rigorosamente, RH = m+M
que tem massa M . Mas mesmo para o hidrogénio, M/m ≃ 1836, o que torna a aproximação de considerar
o núcleo como o centro de massa boa. Contudo, como a espectroscopia é uma ciência muito exacta podemM
se medir os desvios desta aproximação. Mas considerando RH = m+M
R∞ verifica-se concordância com os
dados experimentais até 3 partes em 100.000, que resulta da estrutura fina.
5
48
O perı́odo de Transição
2.2.3
As ondas electrónicas
Qual o significado e porque funciona a quantificação do momento angular proposta por
Bohr? Em 1924, Louis de Broglie (1892-1987) propôs na sua tese de doutoramento que tal
como a luz tinha comportamentos corpusculares e ondulatórias, talvez também a matéria
tivesse ambos os comportamentos. Em particular isto deveria ser verdade para os electrões.
Se assim fosse, poderiamos associar tanto à radiação como à matéria quantidades ondulatórias - como frequência (ν) e comprimento de onda (λ) - e quantidades algo mais ‘corpusculares’ - como energia (E) e quantidade de movimento (~p). De Broglie propôs que
estas quantidades estariam relacionadas pelas equações
E = hν ,
|~p| =
h
.
λ
(2.2.15)
A primeira é a relação de Planck usada também por Einstein para explicar o efeito fotoeléctrico. A segunda é consequência da primeira para a radiação, dado que para o campo
electromagnético, E = c|~p|, e, c = νλ; de Broglie propôs uma tal relação para atribuir um
comprimento de onda a uma partı́cula de matéria. Se assim fosse, o terceiro postulado de
Bohr (2.2.7) ficaria
mvr = n
h
2π
⇔
2πr = n
h
|~p|
⇔
2πr
=λ.
n
(2.2.16)
Recordemos que o objectivo de Bohr era explicar a estabilidade e os nı́veis de energia do
hidrogénio. A última relação diz-nos que a quantificação do momento angular requerida
por Bohr é equivalente, se aceitarmos a proposta de de Broglie, à condição de existência de
ondas estacionárias! Quando uma onda está encerrada num intervalo fechado de dimensão
L, os estados estacionários só existem para comprimentos de onda que sejam um divisor de
L. Outros comprimentos de onda não têm a periodicidade correcta. Esta observação dava
um significado fı́sico claro ao postulado de Bohr, se aceitassemos a hipótese de de Broglie.
Em 1926-27 a ideia de de Broglie foi confirmada pela experiência, através da detecção
de padrões de difracção de feixes de electrões em experiências feitas por Clinton Davisson (1881-1958) e Lester Germer (1896-1971) nos EUA e G.P. Thomson (1892-1975)
2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica
Quântica
49
na Escócia.6
Desde essas experiências já se mostrou que objectos tão variados como
feixes moleculares de hidrogénio, feixes atómicos de hélio ou neutrões também apresentam padrões de difracção. Assim verifica-se a hipótese de de Broglie: Todos os objectos
materiais, que normalmente consideramos partı́culas ou aglomerados de partı́culas têm
também comportamento ondulatório. A razão porque, por exemplo, uma bola de futebol com a massa de 1 Kg e deslocando-se à velocidade de 10 m/s não aparenta qualquer
caracterı́stica ondulatória é porque o seu comprimento de onda de de Broglie é
6.6 × 10−34
h
=
= 6.6 × 10−35 m ,
(2.2.17)
mv
1 × 10
que é extremamente pequeno; a bola terá uma difracção completamente irrelevante em
λ=
qualquer fenómeno do nosso quotidiano. Pelo contrário, um electrão com energia cinética
de 100 eV, ou seja, 1.6 × 10−17 J (que pode ainda ser considerado não relativista) tem
comprimento de onda de de Broglie é
λ= √
h
6.6 × 10−34
=√
= 1.2 × 10−10 m ,
2mEc
2 × 9.1 × 10−31 × 100 × 1.6 × 10−19
(2.2.18)
que é da ordem do diâmetro atómico, sendo por isso o electrão difractado por uma rede de
átomos - figura 2.14.
Notemos que introduzindo a frequência angular ω = 2πν e o vector de onda ~k cujo
módulo é 2π/λ, escrevemos as relações de Einstein-de Broglie (2.2.15)
E = ~ω ,
2.3
p~ = ~~k .
(2.2.19)
A dualidade onda/corpúsculo e a interpretação
probabilı́stica da Mecânica Quântica
Se tanto a matéria como a radiação têm tanto propriedades corpusculares como ondulatórias há duas questões imediatas
6
Existe alguma ironia no facto de J.J. Thomson ter ganho o prémio Nobel em 1906 pela sua descoberta
do electrão em 1897, que caracterizou como uma partı́cula, e o seu filho G.P.Thomson ter ganho o prémio
Nobel em 1937 pela descoberta da difracção do electrão em 1927. Assim, Thomson, o pai, ganhou o Nobel
por ter mostrado que o electrão é uma partı́cula e Thomson, o filho, ganhou o Nobel por ter mostrado que
o electrão é uma onda...’
50
O perı́odo de Transição
Figura 2.14: Cima: Aparato experimental para a experiência de Debye-Scherrer para observar a difração de raios X (baixo esquerda - usa cristais de óxido de zircónio) ou elecrões
(baixo direita - usa cristais de ouro). (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ).
2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica
Quântica
51
• As propriedades ondulatórias do fotão são descritas pelas equações de Maxwell. Que
equação descreve as propriedades ondulatórias do electrão?
• Que relação existe entre estes dois tipos de propriedades?
Historicamente estas perguntas só foram clarificadas com
i) O trabalho de Erwin Schrödinger (1887-1961) que em 1925 postulou uma equação de
onda para descrever as ondas associadas a uma partı́cula de matéria, como por exemplo um electrão. As soluções da sua equação denominam-se funções de onda,
Ψ(x);
ii) O trabalho de Max Born (1882-1970) que, em 1926, sugeriu que a interpretação a dar
às funções de onda de Schrödinger seria de amplitude de probabilidade para encontrar
a partı́cula num determinado ponto x e cujo módulo ao quadrado Ψ(x)Ψ(x)∗ seria
uma densidade de probabilidade;7
Estudemos duas experiências que ilustram esta interpretação probabilı́stica. A primeira
lida com a função de onda no espaço de posições. Mas a maioria das partı́culas tem outros
graus de liberdade que não apenas a sua posição ou momento. O spin dos electrões (ver
capı́tulo 9) e a polarização dos fotões são dois exemplos. Assim, a função de onda completa
de uma partı́cula deverá conter informação acerca desses outros graus de liberdade. No
segundo exemplo ilustramos a parte da ‘função de onda’ respeitante à polarização de fotões.
2.3.1
Experiência de Young com luz de baixa intensidade
Consideremos de novo a experiência de Young com um setup experimental semelhante ao
da figura 2.5 e com luz monocromática, frequência ν. A experiência original de Young
mostrou que a luz8 apresenta um padrão de interferência e portanto conclui-se que ela
tem propriedades ondulatórias. Por outro lado, do efeito fotoeléctrico sabemos que a
Ψ(x) será em geral complexo e ‘∗′ designa o complexo conjugado. Assim a densidade de probabilidade
é garantidamente positiva e normalizando esta função termos uma função de distribuição de probabilidade
no sentido de (C.39)
8
Por luz pode-se entender a partir de agora radiação electromagnética.
7
52
O perı́odo de Transição
intensidade da fonte é um indicador do número de fotões emitidos por unidade de tempo,
todos eles tendo a mesma energia hν. Imaginemos que diminuimos a intensidade ao ponto
de ser emitido apenas um fotão de cada vez. No alvo colocamos ao longo da direcção x um
grande número de pequenos fotomultiplicadores, de modo a identificar com grande precisão
a coordenada x em que o fotão incide no alvo. Observamos o seguinte
i) Os fotodetectores detectam impactos localizados do fotão, isto é, um fotodetector dá
sinal de cada vez, de acordo com a descrição corpuscular;
ii) Para pequenos números de fotões, os impactos dos fotões parecem ter uma distribuição
aleatória - figura 2.15 - esquerda;
iii) Para grandes números de fotões, começamos a recuperar o perfil de interferência que
vemos na experiência original de Young - figura 2.15 - direita.
Assim, as propriedades corpusculares são confirmadas no que toca à detecção individual
de fotões - a luz vem em pacotes. E as propriedades ondulatórias são verificadas no que
toca à detecção de um padrão de interferência quando muitos fotões já incidiram no alvo.
A localização do impacto de cada fotão parece ser aleatória. Mas reconhecemos que estatisticamente os fotões distribuem-se de acordo com o padrão de interferência. Ou seja
• A intensidade da onda descreve a densidade de probabilidades para a localização do
impacto.
Mas se o fotão tem um comportamento corpuscular, então cada fotão passa ou pela
fenda 1 ou ou pela fenda 2 da figura 2.5, correcto? Mas se assim for, bloquearmos uma
das fendas deveria apenas parar cerca de metade dos fotões continuando os outros a exibir o padrão de interferência. Mas nós sabemos da experiência de Young original que
não é assim; bloqueando uma das fendas não há padrão de interferência! Mas então, do
ponto de vista de um fotão individual, ele intefere com quê? Não pode ser com os outros,
na medida em que nós fizemos a experiência de modo que um fotão passasse de cada vez.
Logo
2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica
Quântica
53
Figura 2.15: Experiência de Young com fotões. Esquerda: alguns impactos individuais
parecem aleatoriamente distribuidos; Direita: Estatisticamente começamos a ver o padrão
de interferência a formar-se.
• Cada fotão individual tem de inteferir consigo mesmo e só interfere se as duas fendas
estiverem abertas!
Notemos que se fizéssemos uma experiência de Young com electrões com um setup
tal que o tamanho das fendas seja da ordem do comprimento de onda de de Broglie dos
electrões de modo a que estes sejam apreciavelmente difractados, observarı́amos:
- Os electrões apresentam um padrão de difração semelhante ao da figura 2.5;
- Se enviassemos electrões individualmente, o fenómeno da figura 2.15 repetir-se-ia;
Isto é, tudo o que descrevemos para fotões podia ser repetido ‘ipsis verbis’ para os electrões.
Tentemos, com a experiência de electrões responder à seguinte questão: ‘Será que conseguimos ver porque fenda passa o electrão, sem alterar o padrão de difracção observado?’
O setup experimental e o seu resultado estão representados na figura 2.16. Existe uma
fonte luminosa imediatamente a seguir às fendas de modo a que se note uma variação
da intensidade recebida por essa fonte devido à passagem do electrão. Se por exemplo o
electrão passar pela fenda 2, observamos uma variação na luminosidade no ponto A. Assim
54
O perı́odo de Transição
Figura 2.16: Experiência de Young com electrões onde tentamos ver a fenda pelo qual o
electrão passa. Se o fizermos, necessariamente perdemos o perfil de interferência (extraı́do
das Feynman lectures in Physics - Vol 3 ).
podemos determinar porque lado passou o electrão. Se o fizermos, o padrão de difracção
desaparece! Temos de concluir que
• Vermos o sistema quântico, implica interagir com ele de um modo que o altera.
• Não conseguimos ver o comportamento ondulatório e corpuscular de um sistema simultaneamente.
A interpretação canónica em Mecânica Quântica (dita interpretação de Copenhaga)
destas estranhas conclusões é a seguinte:
i) Enquanto não é medido, o fotão/electrão não existe como entidade localizada, como
corpúsculo, mas encontra-se antes diluı́do por todo o espaço com uma amplitude de
probabilidade que é dada pela função de onda;
ii) Apenas quando se efectua uma medição se dá o colapso da função de onda, após o qual
detectamos o fotão/electrão como corpúsculo localizado e cuja localização apenas
pode ser prevista probabilisticamente com a função de distribuição de probabilidade
sendo o quadrado do módulo da função de onda (normalizada).
2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica
Quântica
55
De acordo com esta interpretação, as caracterı́sticas ondulatórias do fotão/electrão
resultam da sua amplitude de probabilidade se comportar como uma onda. Quando
interferimos de algum modo com esta onda, de modo a poder detectar onde se encontra a partı́cula a ela associada, mudamo-la, de modo a não podermos mais ver os aspectos ondulatórios. Assim aspectos ondulatórios e corpusculares são complementares princı́pio da complementaridade. Note-se que classicamente estes aspectos eram vistos
como incompatı́veis.
2.3.2
O princı́pio da incerteza de Heisenberg
Existe uma expressão matemática para a incapacidade de, num sistema fı́sico, vermos
simultaneamente as propriedades ondulatórias e corpusculares de um electrão ou de um
fotão ou de qualquer outro objecto.
• Por partı́cula (pontual) entendemos algo que tem uma posição bem definida x;
• Por onda, entendemos um objecto que tem um comprimento de onda, λ, bem definido.
Note-se que quando sobrepomos ondas com diferentes comprimentos de onda (próximos)
e amplitudes semelhantes os padrões de interferência começam a ficar mal definidos.
Assim, deve haver uma expressão matemática que nos diga que a precisão com que conhecemos x e λ não pode ser, simultaneamente, arbitrariamente pequena. Uma expressão
quantitativa pode ser deduzida da seguinte maneira. Consideremos uma partı́cula descrita,
num determinado instante, por uma função de onda Ψ(x). A função de onda determina
uma função de distribuição de probabilidade P(x), dada por
Z
Ψ(x)Ψ(x)∗
2
P(x) =
,
onde kΨk = dxΨ(x)Ψ(x)∗ .
2
kΨk
(2.3.1)
Quanto menor for o desvio padrão de x, ∆x, sendo x tratado como uma variável aleatória
relativamente à densidade de probabilidade P(x), mais parecida fica a partı́cula com uma
partı́cula clássica. Por outro lado, podemos exprimir a função de onda como uma combinação linear de ondas planas monocromáticas, usando um integral de Fourier
Z +∞
1
Ψ(x) = √
Ψ̃(k)eikx dk ,
2π −∞
(2.3.2)
56
O perı́odo de Transição
onde a transformada de Fourier é
1
Ψ̃(k) ≡ √
2π
Z
+∞
Ψ(x)e−ikx dx .
(2.3.3)
−∞
Podemos encarar Ψ̃ como sendo a função de onda no espaço de Fourier, cujo quadrado
do módulo nos dá uma densidade de probabilidade para a distribuição do vector de onda
k = 2π/λ. A nossa partı́cula será tanto mais parecida com uma onda quanto menor
for o desvio padrão da variável aleatória k, ∆k, calculada relativamente à densidade de
probabilidade
Ψ̃(k)Ψ̃(k)∗
,
P̃ (k) =
kΨ̃k2
2
onde kΨ̃k =
Z
dk Ψ̃(k)Ψ̃(k)∗ .
(2.3.4)
Mas é uma propriedade das transformadas de Fourier que (em uma dimensão)
∆x∆k ≥
1
,
2
(2.3.5)
ou, usando a relação de de Broglie p = h/λ = ~k,
∆x∆p ≥
~
.
2
(2.3.6)
Esta é a relação de incerteza de Heisenberg. O coeficiente do ~ nesta equação é n/2 quando
usamos transformadas de Fourier para funcões em n dimensões. Por isso exprime-se em
geral o princı́pio da incerteza como
∆x∆p & ~ .
(2.3.7)
Note-se que as grandes implicações fı́sicas estão contidas na passagem de (2.3.5) para
(2.3.6). A primeira destas expressões refere-se apenas a uma relação entre a dispersão
de uma função espacial e a dispersão dos comprimentos de onda das funções sinusoidais
que a descrevem no espaço de Fourier. É quando usamos a relação de de Broglie, que
transformamos esta expressão em termos de quantidades puramente corpusculares, x e p.
Obtemos então uma limitação ao conhecimento de duas variáveis que associamos a uma
partı́cula pontual e que em termos clássicos podem ser conhecidas simultaneamente com
precisão arbitrária.
2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica
Quântica
57
Esta incerteza está intrinsecamente relacionada com o facto de que, no mundo microscópico, quando tentarmos ver o sistema, isto é, medir qualquer coisa, necessariamente
alteramos o sistema em questão. Essa alteração tem um resultado imprevisı́vel, numa
perspectiva determinista, como se vê pelos impactos localizados dos fotões na figura 2.15.
O princı́pio da incerteza de Heisenberg inspirou, desde que foi apresentado, algumas
das mais interessantes discussões sobre o conhecimento humano, quer numa perspectiva
filosófica quer numa perspectiva cientı́fica. O ponto de vista aqui apresentado é que se
trata de uma expressão matemática do princı́pio da complementaridade.
2.3.3
Experiência com a polarização da luz
Consideramos uma experiência com uma onda electromagnética plana e monocromática frequência ω - a propagar-se na direcção Oz da figura 2.17. Supomos que o campo eléctrico
está polarizado linearmente na direcção definida por ep e como tal pode ser representado
por
~ r , t) = E0 ep ei(kz−ωt) ,
E(~
(2.3.8)
onde E0 é uma constante e como tal a intensidade da luz (energia que passa por z =
constante por unidade de área e tempo) é
I=
ǫ0 c
|E0 |2 .
2
(2.3.9)
Coloquemos um polarizador A que transmite a luz polarizada paralelamente a Ox e absorve
a luz polarizada paralelamente a Oy. Depois de passar pelo polarizador, a onda encontra-se
polarizada linearmente na direcção Ox e como tal o campo eléctrico é descrito por
~ ′ (~r, t) = E ′ ex ei(kz−ωt) ,
E
0
(2.3.10)
e a intensidade da luz é dada pela lei de Malus
I ′ = I cos2 θ .
(2.3.11)
Esta lei descreve o comportamento clássico da radiação ao passar por um polarizador. Mas
o que acontece se diminuirmos a intensidade suficientemente de modo a enviar um fotão
de cada vez?
58
O perı́odo de Transição
Figura 2.17: Setup experimental para experiência com a polarização de fotões (extraı́do de
Cohen et al., ‘Quantum Mechanics’ ).
i) Não é possı́vel haver ‘meio’ fotão. Logo o fotão passa ou não passa pelo polarizador;
ii) Se colocarmos um fotodetector atrás do polarizador veremos que o fotão passa ou é
absorvido aleatoriamente; para grandes números de fotões enviados, N, detectaremos atrás do polarizador N cos2 θ fotões, que seria o que esperarı́amos pela fórmula
clássica (2.3.11);
Fixemos as seguintes ideias deste exemplo
• Numa medição de um sistema quântico há determinados resultados priveligiados, denominados resultados ou valores próprios. Neste caso os resultados proprios são: a)
o fotão passa; b) o fotão não passa; o espectro de resultados possı́veis é, portanto,
discreto; isto contrasta com a situação clássica, onde o valor da intensidade depois
do polarizador varia continuamente entre I e 0, dependendo de θ;
• Descrevemos a polarização do fotão por um vector de polarização ep . A cada valor
próprio corresponde um estado próprio para o fotão


 e =e
 ‘passa′
p
x
está associado o estado próprio
Para o valor próprio
 e =e
 ‘não passa′
p
y
.
2.4 A aplicabilidade da Mecânica Quântica
59
Se o fotão se encontra num dado estado próprio, então o resultado de uma medição
da sua polarização é, com probabilidade igual a um, o valor próprio associado a esse
estado próprio.
• Para descrevermos o facto de o fotão passar, ou não, aleatoriamente, dizemos que antes
da medição, o fotão encontra-se numa sobreposição de estados de polarização; isto é
a ‘função de onda’ de polarização
ep = cos θex + sin θey .
(2.3.12)
O quadrado do módulo do coeficiente de um dado estado próprio descreve a probabilidade de obter numa medição o valor próprio associado a esse estado próprio.
Aplicando esta regra temos uma probabilidade de cos2 θ (sin2 θ) para o fotão passar
(não passar). Note-se que a soma da probabilidade de todos os estados tem de ser
igual a um, caso contrário é necessário normalizar a função de onda de polarização. A
esta regra de decomposição em estados próprios chama-se princı́pio de decomposição
espectral. Note-se que esta decomposição depende do ‘setup’ experimental. Neste
caso, o ângulo θ é o ângulo com a direcção do polarizador.
• Quando ‘vemos’ se o fotão passa ou não, interagimos com ele de modo que a sua função
de onda colapsa para um estado próprio. A partir desse momento o fotão encontra-se
nesse estado próprio. Por exemplo, se sabemos que ele passou pelo primeiro polarizador - porque interagimos com ele - então passará por outros polarizadores iguais ao
primeiro que ponhamos no seu caminho. Mais uma vez vemos que interagir com um
sistema quântico, mesmo que com o objectivo ‘inocente’ de o ver, implica alterá-lo
de uma maneira fundamental.
2.4
A aplicabilidade da Mecânica Quântica
Na teoria da relatividade existe uma constante fundamental que é a velocidade da luz, c.
A existência desta constante dá-nos um critério simples para saber se temos de tratar o
sistema usando o formalismo relativista - matematicamente mais pesado - ou se podemos
60
O perı́odo de Transição
usar a aproximação não relativista - matematicamente mais simples. Esse critério é que as
velocidades tı́picas do sistema em questão, vt , sejam muito menores que a velocidade da
luz
vt ≪ c .
(2.4.1)
Neste capı́tulo vimos que quer na radiação do corpo negro, quer no efeito fotoeléctrico, quer
no átomo de Bohr, quer nas relações de de Broglie, quer no princı́pio da incerteza, há um
factor comum: a constante de Planck. Tal como a velocidade da luz no caso da relatividade,
a constante de Planck fornece um critério simples para a necessidade de aplicar ou não o
formalismo da mecânica quântica em detrimento do clássico. O critério é o seguinte: Se
as acções tı́picas do sistema, St , forem muito maiores que h,
St ≫ h ,
(2.4.2)
podemos tratar o sistema na aproximação clássica; caso haja acções da ordem da constante
de Planck temos de usar o formalismo da mecânica quântica. Isto não significa que temos
de calcular a acção do sistema como definido no capı́tulo 1. Basta-nos calcular variáveis
dinâmicas tı́picas do sistema com as dimensões de uma acção. Exemplos:
• Oscilador harmónico: uma acção tı́pica é a energia total, dada pelo Hamiltoniano, a
dividir pela frequência, ω. Para um oscilador com amplitude A e massa m obtemos
1
St = ωmA2 .
2
(2.4.3)
Para uma mola com ω = 10s−1 , m = 1g, A = 0.1m, St = 5 × 10−5J · s ≫ h,
logo podemos esquecer efeitos quânticos e tratar o sistema classicamente. Mas se
pensarmos nas oscilações de um electrão, m ≃ 10−31 kg numa escala atómica A ≃
10−10 m que emite no ultravioleta ω ≃ 1017 s−1 , obtemos St ≃ 10−34 J · s ≃ h. Logo o
problema tem de ser tratado quanticamente, que é basicamente o caso da radiação do
corpo negro. Veremos no capı́tulo 5 o tratamento quântico do oscilador harmónico.
• Problema de Larmor: uma acção tı́pica será mais uma vez a energia total dada pelo
Hamiltoniano a dividir pela frequência ciclotrónica ωc . Obtemos
1
St = ωc mr 2 ,
2
(2.4.4)
2.5 Sumário
61
para uma órbita de raio r. Portanto considerações semelhantes ao caso anterior
podem ser feitas. Em particular, um electrão no regime atómico tem de ser tratado
quanticamente, dando origem à versão quântica do problema de Larmor, chamado
problema de Landau, que veremos no capı́tulo 5.
• Problema de Kepler/Coulomb: consideremos as órbitas circulares; mais uma vez, uma
acção tı́pica é a energia da órbita sobre a frequência, que na notação do problema 1
da folha de problemas 1 é
St =
1√
αmr .
2
(2.4.5)
Para o problema de Kepler, α = GmM e considerando o sistema Terra-Sol temos
α ≃ 1043 N · m2 , m ≃ 1024 kg, r ≃ 1011 m. Claramente St ≫ h e não necessitamos de
mecânica quântica. Para o problema atómico de Coulomb temos α = e2 /(4πǫ0 ) ≃
10−28 N · m2 , pelo que, usando os valores anteriores para massa do electrão e raio
atómico temos St ≃ 10−34 e portanto concluimos que o problema atómico cai no
fórum da mecânica quântica; será tratado no capı́tulo 6.
• Um fotão: a acção tı́pica de um fotão pode ser estimada como a energia a dividir
pela frequência, que, pela fórmula de Planck é h. Logo um fotão é, por definição,
uma entidade quântica. Posto de outra maneira, o campo electromagnético para
intensidades suficientemente baixas tem de ser tratado quanticamente.
2.5
Sumário
Vimos que a luz (e a radiação electromagnética em geral) encarada por Newton como um
fluxo de corpúsculos e por Huygens como uma onda, passou a ser vista como uma onda
depois das experiências de Young e como uma partı́cula depois das explicações da radiação
do corpo negro por Planck, e principalmente, do efeito fotoeléctrico por Einstein. Vimos
que a quantificação do átomo feita por Bohr era naturalmente interpretada em termos de
estados estacionários do electrão se associássemos ao electrão propriedades ondulatóridas,
mais tarde descobertas experimentalmente nas experiências de Davisson e Germer e ainda
62
O perı́odo de Transição
Thomson. Assim, tanto a matéria como a radiação têm propriedades ondulatórias e corpusculares. As propriedades ondulatórias estão associadas às funções de onda que descrevem a amplitude de probabilidade para encontrar a partı́cula no espaço. Tentando
‘ver’ a trajectória da partı́cula causamos o colapso da função de onda e o desaparecimento
posterior de propriedades ondulatórias. Esta complementaridade mutuamente exclusiva
entre propriedades corpusculares e ondulatórias está expressa no princı́pio da incerteza de
Heisenberg.
A descrição probabilı́stica está no âmago da mecânica quântica. Assim, embora estejamos a descrever partı́culas devemos abdicar do conceito de trajectória em prol de algo
mais lato: o estado em que a partı́cula se encontra. Esta situação representa um contraste
marcado em relação ao paradigma clássico da fı́sica. Portanto, em mecânica quântica
TRAJECTORIA
ESTADO
CAPÍTULO
3
A equação de Schrödinger
Se as partı́culas como o electrão têm uma função de onda associada, Ψ(x), temos que
escrever uma equação que descreve o comportamento e evolução de tal função de onda.
Obviamente, uma tal equação não pode ser deduzida com base nas equações da mecânica
clássica discutidas no capı́tulo 1. Mas do capı́tulo 2 sabemos algumas propriedades que
esta equação deve ter:
• Deve ser consistente com as relações de Einstein e de Broglie (2.2.19)
E = ~ω ,
p~ = ~~k ;
(3.0.1)
• Deve ser consistente com a expressão (não relativista) para a energia total, E, de uma
partı́cula de massa m, momento p~, num potencial V (~x, t),
E=
p~2
+ V (~x, t) ;
2m
(3.0.2)
• Para admitir fenómenos de interferência deve ser linear, isto é admitir que a sobreposição
de duas soluções seja ainda uma solução, pois é essa sobreposição que dá origem a
fenómenos de interferência, como na secção 2.1.1 para ondas na água;
• Quando o potencial for zero, tanto a energia como o momento da partı́cula devem ser
constantes - a partı́cula é livre. Traduzindo nas quantidades ondulatórias tanto
64
A equação de Schrödinger
a frequência como o vector de onda devem ser constantes. Mas isto é o que se
passa para uma onda plana monocromática. Assim, assumimos que uma onda plana
monocromática, que é representada por
~
Ψ(~x, t) = ei(k·~x−ωt) ,
(3.0.3)
é solução da equação de onda procurada.
Usando (3.0.1) em (3.0.2) obtemos, na ausência de potencial,
~ω =
~2 ~ 2
k .
2m
(3.0.4)
Esta relação de dispersão é a obtida se actuarmos em (3.0.3) com uma derivada temporal
e duas espaciais, isto é
i~
~2
∂Ψ(~x, t)
=−
∆Ψ(~x, t) ,
∂t
2m
(3.0.5)
onde ∆ representa o Laplaciano. Esta é chamada a equação de Schrödinger para uma
partı́cula livre. Adicionando o termo do potencial, que tem de ser multiplicado pela função
de onda devido à linearidade da equação
∂Ψ(~x, t)
~2
i~
= −
∆ + V (~x, t) Ψ(~x, t) ,
∂t
2m
(3.0.6)
obtemos a equação de Schrödinger, sugerida em 1925 pelo fı́sico austrı́aco Erwin Schrödinger.
Esta discussão não pretende ser uma derivação da equação de Schrödinger. Apenas uma
motivação. A equação de Schrödinger não é derivada, mas sim postulada. A sua validação
provém da concordância com os resultados experimentais.
3.1
Descrição Quântica de uma partı́cula livre - Trem
de Ondas
Qual a função de onda adequada para descrever uma partı́cula que não esteja actuada
por nenhum potencial, i.e. uma partı́cula livre? A solução mais simples da equação de
Schrödinger é a onda plana monocromática (3.0.3), por construção. Contudo, segundo o
3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas
65
postulado de Born para a interpretação da função de onda, a função de distribuição de
probabilidade associada a Ψ(~x, t) é
P(~x, t) =
Ψ(~x, t)Ψ(~x, t)∗
,
kΨ(t)k2
onde a norma kΨ(t)k, que é - à priori - função do tempo1 , é calculada como
Z
2
kΨ(t)k = d3~xΨ(~x, t)Ψ(~x, t)∗ .
Então se tomarmos para a função de onda (3.0.3)
Z
~
~
2
kΨ(t)k = d3~xei(k·~x−ωt) e−i(k·~x−ωt) = ∞ ,
(3.1.1)
(3.1.2)
(3.1.3)
ou seja, a norma diverge. Diz-se que a função de onda não é normalizável. Este resultado
não é inesperado. Uma onda plana monocromática tem um vector de onda bem definido e
como tal um comprimento de onda bem definido. Logo, o desvio padrão para a distribuição
de vectores de onda é zero e pela relação de de Broglie ∆pi = 0, para todos os i. Pelo
princı́pio da incerteza, ∆xi = ∞. Isto significa que a partı́cula tem igual probabilidade
de estar em todos os pontos. Mas uma tal distribuição de probabilidade constante sobre
toda a recta real é necessariamente não normalizável. Assim, esperamos que uma função
de onda fisicamente razoável dê origem a uma densidade de probabilidade que não seja
totalmente delocalizada.
Existe uma segunda razão pela qual uma onda plana monocromática não é uma ‘boa’
função de onda para uma partı́cula. Consideremos as expressões relativistas de energia e
momento de uma partı́cula
E=p
mc2
,
1 − v 2 /c2
p~ = p
m~v
,
1 − v 2 /c2
(3.1.4)
onde m é a massa em repouso da partı́cula e v a sua velocidade relativamente a um dado
referencial inercial. Deduzimos que
p~ =
1
E
~v .
c2
(3.1.5)
Veremos que na evolução de um sistema fı́sico a norma é conserada, pelo que se a função de onda estiver
normalizada assim permanecerá. Esta propriedade decorre da unitariedade do operador de evolução.
66
A equação de Schrödinger
Uma onda monocromática é definida pela frequência angular ω e pelo vector de onda, com
norma |~k|. A velocidade a que se propaga uma dada fase, isto é um máximo ou um mı́nimo
da onda - dita velocidade de fase - é dada por ~k · ~x − ωt = constante; portanto a velocidade
de fase tem norma
E (3.1.5) c2
,
(3.1.6)
=
|~p|
|~v |
que não só é diferente da velocidade da partı́cula como é maior - para uma partı́cula com
vf ase =
ω
|~k|
(3.0.1)
=
massa, para a qual |~v| < c - do que a velocidade da luz no vazio! Como tal concluimos
que uma onda monocromática não é uma descrição aceitável da função de onda de uma
partı́cula.
Ambas as dificuldades anteriores são ultrapassadas se usarmos uma sobreposição de
ondas monocromáticas de várias frequências para descrever a nossa partı́cula, isto é, um
pacote ou trem de ondas. As razões são as seguintes: 1) Ao adicionarmos ondas de várias
frequências, estas interferem destrutivamente e construtivamente de um modo que pode
localizar mais a função de onda, tornando-a normalizável; 2) A velocidade do pacote de
ondas não é a média das velocidades de fase de cada uma das ondas que formam o pacote;
é antes a velocidade de propagação do máximo da amplitude, dita velocidade de grupo. A
propagação deste máximo resulta de fenómenos de interferência, podendo a sua velocidade
ser identificada com a da partı́cula clássica associada à onda.
Devido à linearidade da equação de Schrödinger uma tal sobreposição é necessariamente
ainda uma solução desta equação. Começamos com o caso simples de uma sobreposição
discreta, para depois irmos para o caso de uma sobreposição contı́nua, que é o caso de
interesse fı́sico.
3.1.1
Sobreposição discreta de ondas
Consideramos, no instante t = 0, uma sobreposição discreta de ondas, isto é, algo do tipo
Ψ(~x, 0) =
n
X
~
Aj ei(kj ·~x) ,
(3.1.7)
j=1
correspondendo a uma sobreposição de n ondas planas, com amplitudes Aj e vectores de
onda ~kj . Por simplicidade vamos trabalhar em uma dimensão e especializemos a nossa
3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas
67
Figura 3.1: Três ondas monocromáticas e a sua sobreposição. Na figura de baixo, a linha a
tracejado corresponde ao módulo da função de onda (Extraı́do de Cohen et al, ‘Quantum
Mechanics’).
análise para o seguinte caso:
∆k
∆k
n = 3 , kj = k0 −
,
, k0 , k0 +
2
2
g(k0 )
Aj = √
2π
1
1
, 1,
2
2
.
(3.1.8)
Com esta escolha (3.1.7) fica
x∆k
g(k0) ik0 x
.
1 + cos
Ψ(x, 0) = √ e
2
2π
(3.1.9)
Na figura 3.1 representamos as várias ondas monocromáticas e a sua sobreposição. Este
exemplo mostra o efeito, ora destrutivo ora construtivo, da interferência das várias ondas.
Notando que
p
g(k0 )
|Ψ(x, 0)| = Ψ(x, 0)Ψ(x, 0)∗ = √
2π
x∆k
1 + cos
2
,
(3.1.10)
este exemplo mostra também como o módulo da função de onda (e como tal a densidade
de probabilidade) que é representado pela linha tracejada na figura 3.1 - que corresponde
à função (1 + cos(x∆k/2) - ficou mais localizada do que no caso de uma só onda. Esta é
que é a imagem a reter do pacote de ondas.
68
A equação de Schrödinger
Note-se que neste caso ainda não resolvemos o problema da não normalização da função
de onda. De facto, qualquer sobreposição discreta de ondas monocromáticas dá origem a
uma função periódica. No caso que temos em mão, isso significa que na figura 3.1 há
infinitas repetições quer para a esquerda quer para a direita da figura de baixo. Para
termos uma função de onda normalizável temos necessariamente de ter uma sobreposição
contı́nua de ondas monocromáticas (se as ondas estiverem definidas sobre todo o R).
Com este exemplo podemos ilustrar o princı́pio de incerteza. Suponhamos que
2
x∆k
,
P(x) ∝ 1 + cos
2
para
x∈
2
[−π, π] ,
∆k
(3.1.11)
e P(x) = 0 fora deste intervalo. Consideramos apenas uma dimensão. Uma medida para o
‘espalhamento’ dos valores de x, ∆x, é o tamanho do intervalo onde se distribui a densidade
de probabilidade; logo
∆x∆k ≃ 4π ,
(3.1.12)
de onde conluimos que aumentando ∆k se diminui ∆x, conforme esperado pelo princı́pio
da incerteza.
Com este exemplo podemos ver como a sobreposição modifica a velocidade de propagação.
Tomamos agora para t > 0
Ψ(~x, t) =
n
X
~
Aj ei(kj ·~x−tωj ) ,
(3.1.13)
j=1
e especializamos para (3.1.8) juntamente com
∆ω
∆ω
ωj = ω0 −
.
, ω0 , ω0 +
2
2
(3.1.14)
g(k0 ) i(k0 x−tω0 )
x∆k ∆w
Ψ(x, t) = √ e
−
t
,
1 + cos
2
2
2π
(3.1.15)
x∆k ∆w
g(k0 )
−
t
.
1 + cos
|Ψ(x, t)| = √
2
2
2π
(3.1.16)
Neste caso obtemos,
e
3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas
69
A velocidade de grupo é por definição a velocidade com que o máximo do módulo da função
de onda está a avançar, que é
vgrupo =
∆ω
,
∆k
(3.1.17)
que não coincide com nenhuma das velocidades de fase
vf ase =
2ω0 − ∆ω ω0 2ω0 + ∆ω
, ,
2k0 − ∆k k0 2k0 + ∆k
,
(3.1.18)
nem com a sua média. Veremos a seguir que esta velocidade de grupo coincide com a
velocidade ‘clássica’ da partı́cula.
3.1.2
Sobreposição contı́nua de ondas
Consideramos agora uma função de onda dada pela sobreposição contı́nua de ondas na
forma
1
Ψ(x, 0) = √
2π
Z
+∞
g(k)ei(kx+φ(k)) dk ,
(3.1.19)
0
onde g(k) é a amplitude (real) do modo de Fourier com comprimento de onda λ = 2π/k e
φ(k) é uma fase que depende do modo de Fourier. Tomamos a amplitude como sendo não
nula apenas em
∆k
∆k
, k0 +
k0 −
2
2
,
(3.1.20)
intervalo no qual a fase φ(k) varia suavemente. Sendo o intervalo suficientemente pequeno,
aproximamos
φ(k) = φ(k0 ) +
dφ
dk
k0
(k − k0 ) ≡ φ0 − φ′0 (k − k0 ) .
(3.1.21)
Deste modo, para este caso particular, expressamos (3.1.19) como
1
Ψ(x, 0) = √ ei(φ0 +k0 x)
2π
Z
k0 +∆k/2
k0 −∆k/2
′
g(k)ei(k−k0 )(x−φ0 ) dk ≡ A(x, 0)ei(φ0 +k0 x) .
(3.1.22)
Assim, expressamos a nossa sobreposição contı́nua de ondas como uma onda plana com
amplitude variável. Esta forma da função é útil para estudar a variação de |Ψ(x, 0)| com
x:
70
A equação de Schrödinger
• Para (x − φ′0 ) >> 1/(k − k0 ), a função
′
ei(k−k0 )(x−φ0 ) ,
(3.1.23)
oscila muito rapidamente quando variamos k no intervalo permitido. Assim, o integral
em (3.1.22) é aproximadamente a média da função (3.1.23), que é zero;
• Para x ≃ φ′0 , a função (3.1.23) praticamente não oscila, dando o integral uma forte
contribuição e sendo a amplitude A(x, 0) dominante neste ponto.
Concluimos assim duas coisas:
i) O centro do pacote de ondas, isto é, o máximo da amplitude é em
dφ
′
;
xcentro = φ0 ≡ −
dk k0
ii) A norma da função de onda
Z +∞
Z
2
∗
kΨ(0)k =
Ψ(x, 0)Ψ(x, 0) dx =
−∞
(3.1.24)
+∞
A(x, 0)A(x, 0)∗ dx ,
(3.1.25)
−∞
é agora finita, pois a amplitude é nula para (x−φ′0 ) >> 1/(k −k0 ) e nunca é infinita.2
Agora mostramos que a velocidade de grupo deste pacote de ondas coincide com a velocidade clássica da partı́cula que lhe podemos associar. Para isso consideramos a nossa
função de onda (3.1.19) para t > 0
1
Ψ(x, t) = √
2π
Z
+∞
g(k)ei(kx+φ(k)−w(k)t) dk ,
(3.1.26)
0
onde a frequência ω(k) é uma função suave do modo de Fourier, para a qual utilizamos
uma aproximação semelhante àquela usada para a fase
dω
(k − k0 ) ≡ ω0 + ω0′ (k − k0 ) .
ω(k) = ω(k0 ) +
dk k0
(3.1.27)
Nota técnica: para o integral (3.1.25) convergir é necessário que A(x, 0)A(x, 0)∗ decaia mais rapidamente que 1/x. Analisando (3.1.22), podemos concluir que A(x, 0) decai como 1/x, pelo que A(x, 0)A(x, 0)∗
decai de facto mais rapidamente do que 1/x.
2
3.2 Partı́cula em potenciais independentes do tempo
71
Usando esta expressão e (3.1.21), escrevemos (3.1.26) como
1
Ψ(x, t) = √ ei(φ0 +k0 x−ω0 t)
2π
Z
k0 +∆k/2
k0 −∆k/2
′
′
g(k)ei(k−k0 )(x−φ0 −ω0 t) dk ≡ A(x, t)ei(φ0 +k0 x−ω0 t) .
(3.1.28)
Pela mesma argumentação usada anteriormente concluimos que o centro do pacote de
ondas se encontra agora em
xcentro = φ′0 + ω0′ t ,
(3.1.29)
pelo que se desloca com velocidade
vgrupo =
ω0′
≡
dω
dk
.
(3.1.30)
k0
Pelas relações de Einstein-de Broglie, (3.0.1), isto implica que3
vgrupo =
dE
dp
=
p0
p0
= v0 .
m
(3.1.31)
A filosofia é agora a seguinte. Ao expressarmos a sobreposição contı́nua de ondas na forma
(3.1.28) pensamos nela como uma onda plana monocromática com amplitude variável, à
qual podemos associar uma velocidade de duas maneiras distintas: i) A sua frequência,
ω0 , e vector de onda, k0 , definem pelas relações de de Broglie uma energia e um momento,
que por sua vez definem a velocidade da partı́cula: v0 = dE/dp, para p = p0 = ~k0 ; ii) A
velocidade de propagação do máximo da amplitude, que é dado pela velocidade de grupo
(3.1.31), que coincide com a anterior.
3.2
Partı́cula em potenciais independentes do tempo
Se o potencial onde a partı́cula se encontra é independente do tempo, a equação de
Schrödinger (3.0.6) escreve-se
∂Ψ(~x, t)
~2
i~
= −
∆ + V (~x) Ψ(~x, t) .
∂t
2m
3
(3.2.1)
Na penúltima e última igualdades da equação (3.1.31) usamos a expressão não relativista da energia;
se usassemos as expressões relativistas (3.1.4) o resultado final seria o mesmo.
72
A equação de Schrödinger
Podemos tentar encontrar soluções desta equação separando variáveis, isto é tomando como
ansätz
Ψ(~x, t) = Φ(~x)χ(t) .
(3.2.2)
Colocando no lado esquerdo a dependência temporal e do lado direito a dependência espacial, a equação de Schrödinger reescreve-se
~2
1
i~ ∂χ(t)
−
=
∆ + V (~x) Φ(~x) .
χ(t) ∂t
Φ(~x)
2m
(3.2.3)
O lado direito só depende de ~x e o esquerdo só depende de t. Logo, para ter soluções
desta equação cada lado tem de ser igual a uma constante. Dado que os vários termos têm
dimensão de ‘energia’, interpretamos a constante, denotada E, como energia e obtemos:
1) Do lado esquerdo
i~
dχ(t)
= Eχ(t)
dt
⇒
χ(t) = e−iEt/~ = e−iωt ,
(3.2.4)
onde usamos (3.0.1). Assim a dependência temporal está bem definida;
2) Do lado direito,
~2
∆ + V (~x) Φ(~x) = EΦ(~x) .
−
2m
(3.2.5)
A esta equação chamamos equação de Schrödinger independente do tempo. Entende-se
que as suas soluções representam a parte espacial da função de onda; a função de onda
total é
Ψ(~x, t) = Φ(~x)e−iωt .
(3.2.6)
Soluções deste tipo da equação de Schrödinger, são baptizadas de estados estacionários.
Representam estados com energia bem definida, E = ~ω.
Podemos reescrever a equação de Schrödinger independente do tempo como
ĤΦ(~x) = EΦ(~x) ,
(3.2.7)
onde definimos o operador diferencial linear Ĥ, chamado operador Hamiltoniano,
Ĥ ≡ −
~2
∆ + V (~x) .
2m
(3.2.8)
3.2 Partı́cula em potenciais independentes do tempo
73
Deste ponto de vista, resolver a equação de Schrödinger independente do tempo é resolver
um problema de valores próprios e funções próprias, isto é, as energias são valores próprios
e as funções Φ(~x) são funções próprias do operador Hamiltoniano. Podemos descrever
também a equação (3.2.4) nesta linguagem: a dependência temporal da função de onda
para estados estacionários, e−iEt/~, é uma função própria do operador diferencial linear T̂ ,
denominado operador de translações temporais
T̂ ≡ i~
∂
,
∂t
(3.2.9)
com valor próprio E. Assim, a função de onda (3.2.6) é um produto de funções próprias
dos operadores Ĥ e T̂ .4 Note-se que devido à linearidade da equação de Schrödinger,
manifesta no facto dos operadores Ĥ e T̂ serem lineares, qualquer combinação linear de
estados próprios é ainda uma solução da equação de Schrödinger. No capı́tulo 4 iremos
sistematizar o formalismo de operadores, funções próprias e vectores próprios em mecânica
quântica.
Vamos agora estudar os estados estacionários para alguns potenciais concretos, em uma
dimensão. O nosso objectivo é contrastar o comportamento de uma partı́cula quântica,
descrita pela equação de Schrödinger, com o de uma partı́cula clássica, sendo a diferença
fundamental a seguinte: a partı́cula quântica propaga-se como uma onda. Os potenciais
escolhidos são matematicamente simples de tratar pois são constantes por pedaços: potenciais em escada. Isto implica certas descontinuidades. Mas note-se que estas descontinuidades não são fı́sicas; devemos pensar nos exemplos a seguir como aproximações de
potenciais contı́nuos que variam rapidamente.
3.2.1
Caracterı́sticas gerais num potencial em escada
Por potencial em escada entende-se um potencial que é constante por pedaços. As figuras
3.3, 3.7 e 3.11 são exemplos de potenciais em escada. Em cada uma das regiões, a equação
4
Note que, em geral, a equação de Schrödinger se pode escrever T̂ Ψ(t, ~x) = Ĥ(t)Ψ(t, ~x). Para os estados
estacionários os valores próprios destes dois operadores coincidem.
74
A equação de Schrödinger
de Schrödinger independente do tempo (3.2.5) fica uma equação do tipo
d2 Φ(x) 2m
+ 2 (E − V )Φ(x) = 0 ,
dx2
~
(3.2.10)
para um V constante. Analisemos os vários tipos de soluções:
i) Se E > V esta é uma equação do tipo da do oscilador harmónico (1.1.5), cuja solução
escrevemos agora como
Φ(x) = Aeikx + A′ e−ikx ,
(que é equivalente a escrever Φ(x) = Ã cos(kx + φ0 )) onde definimos
p
2m(E − V )
,
k=
~
(3.2.11)
(3.2.12)
e as constantes A, A′ são números complexos, pois a função de onda é complexa.
Estas soluções correspondem a uma função de onda ‘ondulatória’.
ii) Se E < V esta é uma equação do tipo da do oscilador harmónico mas com ‘frequências
imaginárias’. Isto significa que em vez de exponenciais imaginárias temos como
soluções exponenciais reais
Φ(x) = Bek̃x + B ′ e−k̃x ,
onde B, B ′ são constantes complexas e
p
2m(V − E)
k̃ =
.
~
(3.2.13)
(3.2.14)
Estas soluções correspondem a funções de onda que crescem ou decrescem exponencialmente.
iii) Se E = V a solução é
Φ(x) = C + C ′ x ,
(3.2.15)
que é uma função de onda linear, onde C, C ′ são constantes complexas. Este caso é
muito particular e não será usado na nossa análise.
3.2 Partı́cula em potenciais independentes do tempo
75
V(x)
V0
0
x
Figura 3.2: Potencial real aproximado por um potencial em escada.
O que irá acontecer à função de onda nos pontos de descontinuidade do potencial? Para esclarecer este ponto recordamos que os verdadeiros potenciais fı́sicos não serão descontı́nuos;
variarão rapidamente mas serão contı́nuos. Assim, por exemplo, o potencial da figura 3.3
é uma aproximação ao potencial da figura 3.2. O primeiro é mais fácil de tratar matematicamente, mas o segundo será o potencial realista.
Deste modo podemos pensar num potencial em escada, V (x), que é descontı́nuo no
ponto x0 , como limite de potenciais contı́nuos no intervalo [x0 − ǫ, x0 + ǫ], Vǫ (x), que
coincidem com V (x) fora deste intervalo. Para cada Vǫ (x), existe uma função de onda
Φǫ (x), que obedece a
d2 Φǫ (x) 2m
+ 2 (E − Vǫ )Φǫ (x) = 0 .
dx2
~
Integrando esta equação diferencial entre x0 − η e x0 + η, obtemos
Z
dΦǫ
dΦǫ
2m x0 +η
(x0 + η) −
(x0 − η) = 2
[Vǫ (x) − E]Φǫ (x)dx .
dx
dx
~ x0 −η
(3.2.16)
(3.2.17)
Para as funções Φǫ (x) e o seu limite quando ǫ → 0 serem boas funções de onda, não podem
divergir em nenhum ponto; caso contrário, a densidade de probabilidade associada a esse
ponto seria infinita. Então tomamos estas funções de onda como finitas. Logo o integrando
em (3.2.17) é finito, inclusive no limite ǫ → 0. Tirando seguidamente o limite η → 0, concluimos que dΦ(x)/dx é contı́nua em x0 . Isto implica que Φ(x) também é contı́nua em x0 de facto, derivável. Assim, iremos impôr que a função de onda e a sua derivada são contı́nuas
nas descontinuidades do potencial.
76
A equação de Schrödinger
Note-se que a análise do último parágrafo assumiu implicitamente que o potencial é
finito, caso contrário o integrando em (3.2.17) seria infinito. No caso de o potencial ser
infinito, a derivada da função de onda não será contı́nua, mas podemos ainda requerer continuidade da função de onda. O potencial ser infinito numa dada região (finita) significa que
a função de onda será zero nessa região. Como veremos, uma partı́cula quântica pode penetrar numa região com um potencial, V , maior do que a sua energia, E - região classicamente
proibida pois, como E = Ecinética + V , significaria que Ecinética < 0. Contudo, o seu poder
de penetração, que é dado por uma onda evanescente, diminui quando V − E aumenta.
Quando V → ∞, essa possibilidade de penetração desaparece. Assim, para uma descontinuidade infinita do potencial imporemos apenas a continuidade da função de onda, o que
será suficiente para resolver o problema, dado que o valor da função de onda na região onde
o potencial é infinito é conhecido: é zero.
Vamos desde já definir a intensidade de uma função de onda, I, como a densidade de
probabilidade de posição da partı́cula vezes a velocidade de propagação da mesma. Para
uma onda plana
~k
.
(3.2.18)
m
Note-se que a definição é análoga à da intensidade de uma onda plana, que é a quantidade
Ψ(x, t) = Aei(Et/−̄kx)
⇒
I = |A|2
de energia que atravessa uma superfı́cie disposta normalmente à direcção de propagação da
onda por unidade de tempo e de área. Equivalentemente, é a densidade de energia vezes a
velocidade de propagação.
3.2.2
Salto de potencial (E > V0 )
Consideramos o potencial na figura 3.3. As soluções da equação de Schrödinger independente do tempo para uma partı́cula com energia E, tal que E > V0 são

√
2mE

ik1 x
′ −ik1 x

 Região I
Φ(x) = A1 e
+ A1 e
com k1 =
p~
.
(3.2.19)

2m(E
−
V
)

0
 Região II
Φ(x) = A2 eik2 x + A′2 e−ik2 x com k2 =
~
Requerendo continuidade da função de onda e da sua derivada em x = 0 obtemos, respectivamente
3.2 Partı́cula em potenciais independentes do tempo
77
V(x)
A’1
A1
E
A2
A’2
V
0
I
II
x
0
Figura 3.3: Salto de potencial. Distinguimos duas regiões: x < 0 é a Região I, onde V = 0;
x > 0 é a Região II, onde V = V0 ; aqui consideramos as várias ondas associadas a uma
partı́cula com E > V0 .


 A1 + A′1 = A2 + A′2
.
(3.2.20)

 k1 (A1 − A′ ) = k2 (A2 − A′ )
1
2
Temos quatro constantes de integração e duas condições entre elas, o que, portanto, não
especifica suficientemente a solução. Podemos pois por uma constante igual a zero: A′2 = 0.
Fisicamente esta escolha tem o seguinte significado. Recordando que a função de onda total
é dada por
Ψ(x, t) = Φ(x)e−iEt/~ ,
(3.2.21)
podemos ver qual a direcção em que viajam as várias ondas da solução, o que se encontra
representado na figura 3.3. Se pensarmos fisicamente no nosso problema como descrevendo
uma partı́cula que vem de x = −∞ (associada à onda A1 ), que tem uma probabilidade de
ser transmitida para a região II em x = 0 (associada à onda A2 ) e uma probabilidade de
ser reflectida de volta para a região I (associada à onda A′1 ), concluimos que não devemos
ter a onda A′2 . Assim, escrevemos a solução das equações (3.2.20) como
A′1
k1 − k2
=
,
A1
k1 + k2
A2
2k1
=
.
A1
k1 + k2
(3.2.22)
78
A equação de Schrödinger
Estas são designadas, respectivamente, amplitudes de reflexão e transmissão. As intensidades das ondas incidentes, reflectida e transmitida são, respectivamente
Ii =
|A1 |2 ~k1
,
m
Ir =
|A′1 |2 ~k1
,
m
It =
|A2 |2 ~k2
.
m
(3.2.23)
Definimos o factor de transmissão T , e o factor de reflexão R, respectivamente como
2
2
2
4k1 k2
k1 − k2
k2 A2
It
Ir
A′1
=
=
=
T ≡ =
,
R≡
.
(3.2.24)
Ii
k1 A1
(k1 + k2 )2
Ii
A1
k1 + k2
Note-se que
T +R =1 .
(3.2.25)
Assim, as quantidades T e R são apropriadas para ser interpretadas como a probabilidade
de transmissão e reflexão da partı́cula. Vemos desde já uma diferença fundamental entre
a descrição quântica e clássica desta partı́cula: Classicamente a partı́cula seria sempre
transmitida para a região II; quanticamente existe uma probabilidade de a partı́cula ser
reflectida de volta para a região I. Este facto é facilmente entendido se pensarmos numa
analogia com óptica. Uma onda que chega à fronteira entre dois meios com ı́ndices de
refracção diferentes, proporcionais a k1 e k2 , tem uma componente transmitida e reflectida.
Para incidência normal, as fórmulas de Fresnel que descrevem a razão entre os vários
campos eléctricos envolvidos coincidem com (3.2.22). Assim, em óptica este resultado é
claro. A mecânica quântica entra quando pensamos na onda como a função de onda que
descreve uma partı́cula.
3.2.3
Salto de potencial (E < V0 )
Consideramos o mesmo potencial que no caso anterior, mas tomamos agora uma partı́cula
com E < V0 , como representado na figura 3.4. As soluções da equação de Schrödinger
independente do tempo são:



 Região I
Φ(x) = Aeik1 x + A′ e−ik1 x


 Região II
Φ(x) = Bek2 x + B ′ e−k2 x
√
2mE
p~
.
2m(V0 − E)
com k2 =
~
com k1 =
(3.2.26)
3.2 Partı́cula em potenciais independentes do tempo
79
V(x)
I
II
V
0
A’
A
E
B
B’
x
0
Figura 3.4: Salto de potencial. Aqui consideramos as várias ondas associadas a uma
partı́cula com E < V0 . Na região II essas ondas são exponenciais; na figura damos a ideia
de qual a crescente e qual a decrescente.
Requerendo continuidade da função de onda e da sua derivada em x = 0 obtemos, respectivamente


 A + A′ = B + B ′
.
(3.2.27)

 ik1 (A − A′ ) = k2 (B − B ′ )
Neste caso, para que a função de onda seja limitada quando x → +∞ tomamos B = 0.
Logo
A′
k1 − ik2
=
,
A
k1 + ik2
B′
2k1
=
.
A
k1 + ik2
(3.2.28)
A função de onda na região II já não é uma onda plana, e não lhe podemos associar uma
velocidade e como tal uma intensidade de probabilidade. Por isso não podemos calcular
um coeficiente de transmissão. Isto é consistente com o facto de o coeficiente de reflexão
ser
R=
k1 − ik2
k1 + ik2
2
=1.
(3.2.29)
Concluimos que 1) tal como em mecânica clássica, a partı́cula quântica é sempre reflectida;
2) mas a função de onda não é zero na região II, decaindo exponencialmente - diz-se que
existe uma onda evanescente na região II (figura 3.5), havendo portanto uma probabilidade
não nula de encontrar a partı́cula nessa região. A razão da consistência entre estes dois
80
A equação de Schrödinger
Ψ(x,t )Ψ(x,t )*
II
I
V
0
x
0
Figura 3.5: Salto de potencial. Representação do módulo da função de onda ao quadrado
para um t fixo, para uma partı́cula com E < V0 . Note-se a onda evanescente na região II.
factos é a seguinte. Note-se que A′ /A tem uma parte imaginária
Im
A′
A
=−
2k1 k2
.
k12 + k22
(3.2.30)
Logo, há um diferença de fase entre a onda incidente e a reflectida, que pode ser vista
como um atraso na reflexão. Podemos pensar que, embora a partı́cula quântica - tal
como a clássica - seja sempre reflectida, a partı́cula quântica - ao contrário da clássica pode penetrar na região II antes de ser reflectida, causando o atraso referido. Note-se que
no limite V0 → ∞ temos k2 → ∞; logo a parte imaginária (3.2.30) vai para zero. Neste
limite perdemos a onda evanescente e consequentemente o ‘atraso’ na onda reflectida.
Note-se ainda que ao analizar este limite confirmamos que a função de onda é zero quando
o potencial é infinitamente maior do que a energia da partı́cula, o que prova a afirmação
feita no final da secção 3.2.1.
Usando A′ ≡ eϕi A, podemos escrever a parte espacial da função de onda neste problema
como
Φ(x) = A(eik1 x + e−ik1 x+iϕ ) ,
(3.2.31)
de onde concluimos que ΨΨ∗ = 2A2 (1 + cos(2k1 x − ϕ)); este módulo está representado na
figura (3.5).
3.2 Partı́cula em potenciais independentes do tempo
81
V(x)
A1
A’1
A2 A’2
E
A3
A’3
V
0
II
I
III
0
x
L
Figura 3.6: Barreira de potencial. Distinguimos três regiões: x < 0 é a Região I, onde
V = 0; 0 < x < L é a Região II, onde V = V0 ; x > L é a região III, onde V = 0. Aqui
representamos as várias ondas associadas com uma partı́cula com E > V0 .
3.2.4
Barreira de potencial (E > V0)
Consideramos agora uma barreira de potencial, como a representada na figura 3.6 e uma
partı́cula com E > V0 . As soluções da equação de Schrödinger independente do tempo são
agora




Região I




ik1 x
Φ(x) = A1 e
Região II






 Região III
+
A′1 e−ik1 x
Φ(x) = A2 eik2 x + A′2 e−ik2 x
Φ(x) = A3 eik1 x + A′3 e−ik1 x
√
2mE
p~
2m(E − V0 )
com k2 =
~
com k1 =
.
(3.2.32)
Requerendo continuidade da função de onda e da sua derivada em x = 0 e x = L, obtemos,
respectivamente


 A1 + A′1 = A2 + A′2

 k1 (A1 − A′ ) = k2 (A2 − A′ )
1
2
,


 A2 eik2 L + A′2 e−ik2 L = A3 eik1 L + A′3 e−ik1 L
.

 k2 (A2 eik2 L − A′ e−ik2 L ) = k1 (A3 eik1 L − A′ e−ik1 L )
2
3
(3.2.33)
Considerando uma partı́cula que vem de x = −∞, tomamos A′3 = 0. Começando pelo
segundo sistema de equações obtemos
A′2 =
k2 − k1 i(k1 +k2 )L
e
A3 ,
2k2
A2 =
k2 + k1 i(k1 −k2 )L
e
A3 .
2k2
(3.2.34)
82
A equação de Schrödinger
Usando estes resultados no primeiro sistema de equações obtemos
k12 + k22
sin(k2 L) eik1 L A3 ,
A1 = cos(k2 L) − i
2k1 k2
A′1 = i
k22 − k12
sin(k2 L)A3 .
2k1k2
(3.2.35)
Os factores de reflexão em x = 0 e de transmissão para a região 3 são, respectivamente
A′
Ir
= 1
Ii
A1
2
R=
A3
It
=
Ii
A1
2
T =
=
(k12 − k22 )2 sin2 (k2 L)
,
4k12 k22 + (k12 − k22 )2 sin2 (k2 L)
(3.2.36)
=
4k12 k22
.
4k12 k22 + (k12 − k22 )2 sin2 (k2 L)
(3.2.37)
Verifica-se facilmente que T +R = 1, como seria de esperar. Concluimos que em geral existe
uma probabilidade de a partı́cula ser reflectida, tal como no caso do salto de potencial. Isto
contrasta com a situação em mecânica clássica em que a partı́cula é sempre transmitida.
Contudo, para
k2 L = nπ
⇔
L
λ
= ,
n
2
n∈N,
(3.2.38)
a probabilidade de transmissão é um. Isto acontece quando um múltiplo inteiro de metade
do comprimento de onda é igual ao comprimento da barreira, L.
Podemos dar a este comportamento a seguinte interpretação fı́sica. Consideremos as
ondas que se propagam na direcção positiva do eixo dos x, isto é A1 , A2 , A3 . Para A3 ter o
mesmo módulo do que A1 , ou seja, para o coeficiente de transmissão ser um, as ondas não
podem sofrer perdas na região II. Ou seja A2 tem de ter ainda o mesmo módulo. Mas A2
pode ser reflectida em x = L e a onda resultante novamente em x = 0. Para que esta dupla
reflexão de A2 esteja em fase consigo mesma necessitamos da relação (3.2.38). Note-se que
neste caso tanto A′2 /A2 como A′1 /A1 não têm parte imaginária e não há atrasos na reflexão.
Deste modo não há perdas na região II e o coeficiente de transmissão é um. Este fenómeno
é designado por ressonância, pois resulta de uma ressonância das ondas na região II. Este
fenómeno é usado para explicar o efeito Ramsauer que consiste na capacidade de certos
gases nobres serem transparentes a electrões com certas energias bem definidas (da ordem
do eV ).
3.2 Partı́cula em potenciais independentes do tempo
83
V(x)
V
0
I
A1
II
A’1
B
E
III
A3
B’
0
A’3
x
L
Figura 3.7: Barreira de potencial. Aqui representamos as várias ondas associadas com uma
partı́cula com E < V0 .
3.2.5
Barreira de potencial (E < V0)
Consideremos novamente uma barreira de potencial, mas agora uma partı́cula com E < V0 ,
como representada na figura 3.7. O cálculo da secção anterior aplica-se com a modificação
p
2m(V0 − E)
.
(3.2.39)
k2 → −ik ,
com k =
~
Concluimos pois que
R=
(k12 + k 2 )2 sinh2 (kL)
,
4k12 k 2 + (k12 + k 2 )2 sinh2 (kL)
(3.2.40)
T =
4k12 k 2
.
4k12 k 2 + (k12 + k 2 )2 sinh2 (kL)
(3.2.41)
Obviamente T + R = 1. A propriedade importante é que o coeficiente de transmissão não
é nulo. Existe uma probabilidade de a partı́cula quântica ‘furar’ a barreira de potencial,
enquanto que uma partı́cula clássica voltaria necessariamente para trás. Este fenómeno
designa-se por efeito túnel. Note-se que podemos reexprimir o coeficiente de transmissão
como
T = 1+
V02
sinh2 (kL)
4E(V0 − E)
−1
.
(3.2.42)
Note-se ainda que no caso frequente de a barreira ser muito maior do que o comprimento
de onda de de Broglie da partı́cula, kL >> 1, a última expressão é aproximada como
T ≃
16E(V0 − E) −2kL
e
.
V02
(3.2.43)
84
A equação de Schrödinger
Ψ(x,t)Ψ(x,t)*
II
I
III
V0
0
L
x
Figura 3.8: Barreira de potencial. Representação do quadrado do módulo da função de
onda, para uma partı́cula com E < V0 . A existência da onda evanescente na zona classicamente proibida resulta na probabilidade de encontrar a partı́cula na região III.
O efeito túnel é observado numa variedade de fenómenos quânticos. Historicamente
a sua primeira aplicação foi ao decaimento radioactivo por emissão de partı́culas α, que
agora descrevemos.
Radioactividade alfa
Como mencionado na secção 2.2, Rutherford estudou o potencial V (r) que uma partı́cula
α sente a uma distância r do núcleo atómico. Os seus estudos e estudos posteriores com
núcleos mais leves concluiram que o potencial referido tem a forma exibida na figura 3.9.
Isto é para distâncias maiores que r ′′ ≡ 3 × 10−14 m, as partı́culas α sentem um potencial
do tipo de Coulomb entre uma partı́cula com carga +2e e um núcleo com carga +Ze
V (r) =
1 2e2 Z
.
4πǫ0 r
(3.2.44)
Para distâncias menores que r ′ , onde r ′ < r ′′ sabia-se que havia um desvio do potencial
de Coulomb, devido a experiências de difusão com núcleos leves, mas não se sabia o valor
exacto de r ′ para núcleos pesados.
Por outro lado sabia-se que vários núcleos pesados, como o U 234 (urânio) e o Ra226
(rádio) emitiam espontaneamente partı́culas α. Isto sugere que pensemos no potencial
para r < r ′ como um poço de potencial onde existe uma força (de facto a força nu-
3.2 Partı́cula em potenciais independentes do tempo
85
Figura 3.9: Potencial sentido por uma partı́cula α à distância r de um núcleo de U 238
(Extraı́do de Eisberg & Resnick, ‘Quantum Physics’).
clear forte) que vence a repulsão de Coulomb e ‘cola’ uma partı́cula α a um determinado
núcleo, correspondendo o conjunto, por exemplo, ao núcleo de Urânio 234. Mas existe
uma probabilidade de a partı́cula α sair por efeito túnel: radiactividade α. Estimemos
essa probabilidade usando o resultado para a barreira quadrada (3.2.43) que reescrevemos
como
√
T ∼ e−2L 2m(V0 −E)/~ .
(3.2.45)
A barreira de potencial na figura 3.9 não é quadrada; mas podemos pensar na curva como
uma soma de barreiras quadradas no limite em que a base destas barreiras quadradas vai
para zero. Nesse limite obtemos5
√
Z ′′′
Z ′′′ s
8m r
1 2e2 Z
2 r p
−E ,
dr
ln T ∼ −
2m[V (r) − E]dr = −
~ r′
~
4πǫ0 r
r′
para uma partı́cula com energia dada por E = V (r ′′′ ). Usando o facto que
s r
r
!
Z
br
a
a
br
br
dr
1−
,
− b = √ arcsin
+
r
a
a
a
b
(3.2.46)
(3.2.47)
juntamente com
E = V (r ′′′ ) ,
5
E << V (r ′ ) ,
A relação usada é de facto a aproximação WKB; ver relação (8.5.10).
(3.2.48)
86
A equação de Schrödinger
obtemos
2
ln T ∼ −
eZ
ǫ0 ~
r
m
+4
2E
s
e2 Zmr ′
.
πǫ0 ~2
(3.2.49)
Vamos estimar uma relação entre T e E usando esta fórmula. Para isso tomamos um valor
tı́pico para Z e r ′ . Tomamos o decaimento do isótopo 226 do Rádio (número atómico 88).
Assim
r ′ = 7.3 F ermi = 7.3 × 10−15 m .
(3.2.50)
mα ≃ 6.645 × 10−27 Kg ≃ 3.737 × 103 (MeV ) .
(3.2.51)
Z = 86 ,
Usando também que
Obtemos assim, a aproximação
log T = log e ln T ∼ − p
148
+ 32.5 .
E (MeV )
(3.2.52)
Queremos agora relacionar o coeficiente de transmissão com o tempo médio de vida τ do
isótopo radioactivo, que é a quantidade medida experimentalmente. Para isso imaginamos
o seguinte cenário simplista. A partı́cula α encontra-se no poço de potencial correspondente
à região da força forte, r < r ′ oscilando ao longo de um diâmetro, com velocidade v =
p
2E/m. De cada vez que ela chega a r = r ′ tem uma probabilidade T de ser transmitida
por efeito túnel. Logo a probabilidade por unidade de tempo de ser transmitida é T v/2r ′.
Assumimos que a vida média, τ , é o inverso da probabilidade de decaimento por unidade
de tempo
2r ′
τ=
T
r
τ0
m
≡
,
2E
T
⇒
r 148
m
.
log τ ∼ p
− 32.5 + log 2r ′
2E
E (MeV )
(3.2.53)
O segundo termo varia com a energia muito mais lentamente do que o primeiro, devido ao
logaritmo. Assim, dentro do nosso cenário aproximado usamos para o segundo termo uma
constante, estimada com base no decaimento tı́pico do Rádio, acima referido, para o qual a
energia da partı́cula α é cerca de 5MeV . O significado desta aproximação é que o processo
de decaimento alfa é essencialmente determinado pelo efeito túnel, sendo o que acontece
dentro do núcleo de importância secundária. Concluimos que τ0 ≃ 10−21 s. E como tal
3.2 Partı́cula em potenciais independentes do tempo
87
Figura 3.10: Decaimento alfa: comparação da curva teórica (3.2.54) com os dados
p experimentais. Note-se que a ordenada é o logaritmo comum de τ e a abcissa é −1/ E(MeV )
(Extraı́do de ‘Quantum Physics’, Berkeley Physics Course - Volume 4).
88
A equação de Schrödinger
148
log τ ∼ p
− 53.5 .
E (MeV )
(3.2.54)
Os resultados desta curva teórica encontram-se na figura 3.10. É de salientar a boa descrição global dada pelo nosso cenário simplista, apesar da enormı́ssima variedade de tempos médios de vida considerados. Como exemplos, o U 238 tem uma vida média de 1017 s
enquanto que o P o212 tem uma vida média de 10−7s. Este tipo de cálculo, originalmente
feito por Gamow, Condon e Gurney em 1928, foi um dos primeiros e mais convincentes
sucessos da mecânica ondulatória de Schrödinger.
3.2.6
Poço de potencial de profundidade finita (E < 0)
Consideramos agora um poço de potencial, como o representado na figura 3.11 e uma
partı́cula com energia −V0 < E < 0. As soluções da equação de Schrödinger independente
do tempo são agora



Região I




Região II






Região III
k1 x
Φ(x) = B1 e
+
√
B1′ e−k1 x
Φ(x) = Aeikx + A′ e−ikx
Φ(x) = B2 ek1 x + B2′ e−k1 x
−2mE
com k1 =
p ~
2m(E + V0 )
com k =
~
.
(3.2.55)
Requeremos continuidade da função de onda e da sua derivada em x = −L/2 e x = L/2;
requeremos também que a função de onda seja finita em x = ±∞, o que significa que
B1′ = B2 = 0. Assim obtemos


 B1 e−k1 L/2 = Ae−ikL/2 + A′ eikL/2
,


 AeikL/2 + A′ e−ikL/2 = B2′ e−k1 L/2
.

 ik(AeikL/2 − A′ e−ikL/2 ) = −k1 B ′ e−k1 L/2
2
(3.2.56)

 k1 B1 e−k1 L/2 = ik(Ae−ikL/2 − A′ eikL/2 )
Resolvendo cada um dos sistemas para a razão A/A′ obtemos, respectivamente,
A
= −eikL
A′
k1 + ik
k1 − ik
,
A
ik − k1
= e−ikL
,
′
A
ik + k1
(3.2.57)
3.2 Partı́cula em potenciais independentes do tempo
89
V(x)
L/2
−L/2 0
x
B’1
I
B1
II
A E A’
III
B’2
B2
−V
0
Figura 3.11: Poço de potencial. Distinguimos três regiões: x < −L/2 é a Região I, onde
V = 0; −L/2 < x < L/2 é a Região II, onde V = −V0 ; x > L/2 é a região III, onde V = 0.
o que implica que
k1 − ik
= ±eikL
k1 + ik
onde definimos
⇔


 | sin(kL/2)| = k/k


0


cot(kL/2)
=
−k
/k
⇔

1

 tan (kL/2) < 0



 | cos(kL/2)| = k/k

0


tan
(kL/2)
=
k
/k
⇔

1


 tan (kL/2) > 0
k0 ≡
√
2mV0
.
~
, (3.2.58)
(3.2.59)
Existem portanto duas famı́lias de soluções. Em cada um dos casos, os valores permitidos
para k e portanto para a energia E são discretos. Graficamente podem ser imaginados como
a intersecção da função | sin(x)| ou | cos(x)| com uma recta que passa pela origem (problema
3, folha 4). Esta discretização dos nı́veis de energia dos estados ligados é uma caracterı́stica
da mecânica quântica que não se encontra na mecânica clássica onde a partı́cula pode ter
qualquer energia entre 0 > E > V0 . Pode ser interpretada do seguinte modo: as ondas
associadas à partı́cula vão sofrer reflexões sucessivas em x = ±L/2. Em geral, as várias
ondas interferem destrutivamente, e só para certos comprimentos de onda - e como tal
certas energias - esta interferência permite a existência de estados estacionários. O caso
de E > 0 num poço finito de potencial é tratado também no problema 3 da folha 4.
90
A equação de Schrödinger
3.2.7
Poço de potencial de profundidade infinita
Tomamos agora um poço de potencial de profunidade infinita, que é mais convenientemente
tratado tomando V (x) da forma
V (x) = 0 para x ∈ [0, L] ,
V (x) = +∞ para x > L e x < 0 .
(3.2.60)
Consideramos um estado com energia E positiva. Vimos, para a barreira de potencial,
que no caso em que V0 → ∞ perdemos a onda evanescente. De um modo semelhante,
esperamos que neste caso a função de onda se anule fora do intervalo [0, L]. De facto, a
solução da equação de Schrödinger independente do tempo dá-nos


 Região I e III

 Região II
Φ(x) = 0
ikx
Φ(x) = Ae
′ −ikx
+Ae
com k =
√
2mE
~
.
(3.2.61)
Para saltos infinitos de potencial o nosso argumento acerca da continuidade da função
de onda e da sua derivada não é aplicável. Mas podemos ainda requerer pelo menos
continuidade da função de onda em x = 0, L:

 A + A′ = 0
 AeikL + A′ e−ikL = 0
⇒
sin(kL) = 0 ,
(3.2.62)
ou seja
kL = nπ
⇔
E=
n2 π 2 ~2
≡ En .
2mL2
(3.2.63)
Tal como no caso anterior os estados quânticos têm as suas energias possı́veis quantificadas. Notemos que neste caso, a quantificação dos comprimentos de onda (e das energias)
é obtida pela relação L = nλ/2, que exprime a condição para a existência de estados
estacionários num sistema periódico. A mesma situação não se verificava no caso do poço
finito, essencialmente devido à existência de uma onda evanescente.
A função de onda normalizada correspondente ao estado de energia n é
r
nπx 2
e−iEn t/~ para x ∈ [0, L] ,
sin
Ψn (x, t) =
L
L
(3.2.64)
3.3 Evolução de um trem de ondas
91
e zero fora deste intervalo e como tal, a função de distribuição de probabilidade associada
à partı́cula é
P(x) =
nπx 2
para x ∈ [0, L] ,
sin2
L
L
(3.2.65)
e zero fora do intervalo. Se calcularmos, por exemplo, o valor esperado de x e de x2 ,
obtemos
hxi =
Z
0
L
L
xP(x)dx = ,
2
2
hx i =
Z
0
L
x2 P(x)dx =
L2
L2
− 2 2 .
3
2π n
(3.2.66)
Podemos comparar este resultado com o da mecânica clássica, pensando na partı́cula
clássica como tendo uma função de distribuição de probabilidade uniforme no intervalo
[0, L],
Pc (x) =
1
para x ∈ [0, L] ,
L
e zero fora do intervalo. Assim
Z L
L
hxi =
xPc (x)dx = ,
2
0
2
hx i =
Z
0
L
x2 Pc (x)dx =
(3.2.67)
L2
.
3
(3.2.68)
Concluimos que o resultado clássico é aproximado para números quânticos elevados correspondendo a energias elevadas. Este é um padrão que se repete em muitos casos.
3.3
Evolução de um trem de ondas
Como referimos na secção 3.1, a descrição de uma partı́cula livre deve ser feita por um trem
de ondas. Mas mesmo para uma partı́cula sob a influência de potenciais como aqueles que
vimos na secção 3.2 o trem de ondas é a descrição apropriada, pois é a maneira natural de
obter uma função de onda normalizável. Note-se no entanto que sendo o trem de ondas
apenas uma sobreposição de ondas planas com diferentes energias, concluimos que toda a
fı́sica da interação do trem de ondas com os vários potenciais da secção 3.2 foi já vista.
Usar o trem de ondas em vez das ondas individuais aumenta a complexidade técnica da
análise sem introduzir grandes novidades. Assim nesta secção discutiremos brevemente a
evolução de um trem de ondas gaussiano livre e a interacção de um trem de ondas com um
salto de potencial.
92
3.3.1
A equação de Schrödinger
Trem de ondas Gaussiano livre
Um exemplo tratável analiticamente de um trem de ondas é considerar em (3.1.26)
2 1/4
~ 2
a
2
2
e−a (k−k0 ) /4 ,
φ(k) = 0 , ω(k) =
k ,
(3.3.1)
g(k) =
2π
2m
correspondendo a uma função gaussiana para o perfil de Fourier de amplitudes, com todas
as ondas em fase e com a relação de dispersão de uma partı́cula livre (3.0.4). Assim sendo,
(3.1.26) pode-se escrever na forma


2

!2 
a2 k0
2
√
Z +∞
ix
+
2 2
2
2
a
a k0 
a
2ix + a k0 
i~t

Ψ(x, t) =
exp −
−
k − 2 2i~t
exp 
+
dk ,

2i~t
3/4
2
(2π)
4
4
2m
a + m
a + m
−∞
(3.3.2)
ou, fazendo o integral Gaussiano,
Ψ(x, t) =


2
a2 k0
1/4
−1/2
a2 k02 
2i~t
2a2
 ix + 2
−
a2 +
exp 
.
π
m
4
a2 + 2i~t
m
(3.3.3)
Trabalhando os termos na exponencial, reescrevemos a função de onda como
!
2 1/4 −1/2
~k0 t 2
2
x
−
2a
2i~t
~k
t
Ψ(x, t) =
a2 +
, (3.3.4)
exp i − 0 + k0 x exp − 2 m
π
m
2m
a + 2i~t
m
ou, definindo θ como
2~t
tan 2θ =
ma2
⇔
e−iθ =
a2 −
a2 +
2i~t
m
2i~t
m
!1/4
,
(3.3.5)
temos
Ψ(x, t) =
2a2
π
1/4 4~2 t2
a4 +
m2
−1/4
2 !
x − ~km0 t
~k02 t
.
exp i −θ −
+ k0 x exp − 2 2i~t
2m
a + m
(3.3.6)
Nesta forma é simples verificar que o módulo da função de onda ao quadrado é
!
−1/2
2 1/2 ~k0 t 2
4~2 t2
2a
4
2 x− m
2
a +
exp −2a
.
|Ψ(x, t)| =
2 2
π
m2
a4 + 4~m2t
Extraı́mos as seguintes conclusões:
(3.3.7)
3.3 Evolução de um trem de ondas
93
• A função de onda está normalizada e a sua norma é conservada na evolução temporal
Z +∞
2
kΨ(t)k ≡
|Ψ(x, t)|2 = 1 .
(3.3.8)
−∞
Veremos mais tarde que este facto resulta de o Hamiltoniano ser Hermı́tico e como
tal a evolução unitária.
• A variância, σx , associado com a função de distribuição de probabilidade P(x) = |Ψ(x, t)|2
é
~2 t2
a2
+ 2 2 ,
(3.3.9)
4
am
o que significa que a função de onda se está a espalhar para t > 0. Isto é, definimos
σx =
a nossa partı́cula livre como uma gaussiana para t = 0 posteriormente ela espalha-se
delocalizando cada vez mais a partı́cula. Este fenómeno de espalhamento é geral para
trens de onda livres.
3.3.2
Trem de ondas incidente num salto de potencial (E < V0 )
Vamos considerar um trem de ondas incidente no salto de potencial da figura (3.3). Vamos
considerar o caso em que todas as ondas no nosso trem têm uma energia E < V0 . Este
caso para uma onda foi tratado na secção 3.2.3. Concluimos que para cada onda plana
monocromática - vector de onda k - as amplitudes A e A′ estavam relacionadas por (3.2.28).
Portanto, para um trem de ondas vamos ter as relações
A′ (k1 )
k1 − ik2
=
≡ e−2iθ(k1 ) ,
A(k1 )
k1 + ik2
onde
tan θ ≡
k2
,
k1
(3.3.10)
para cada onda no trem. Isto é, dada uma onda com energia E, que define k1 e k2 , temos
que as amplitudes incidente e reflectida diferem apenas de uma fase. Como vimos na secção
3.2.3 isto significa que a reflexão é total mas há um atraso correspondente à diferença de
fase. Definimos
√
2mV0
,
(3.3.11)
~
e consideramos que todas as ondas no trem obedecem a k1 < K0 ; todas as ondas são
K0 =
reflectidas. Consideremos a solução na Região I para t = 0 sendo
Z K0
1
dk1 g(k1) eik1 x + e−2iθ(k1 ) e−ik1 x .
Ψ(x, 0) = √
2π 0
(3.3.12)
94
A equação de Schrödinger
Vamos assumir que |g(k1)| tem um pico pronunciado em k1 = k̃ < K0 de modo a que a
velocidade de grupo vai ser definida pela propagação deste pico. A evolução do trem de
ondas é descrita pela função de onda
Z K0
Z K0
1
1
i(k1 x−ω(k1 )t)
Ψ(x, t) = √
dk1 g(k1)e
+√
dk1 g(k1 )e−i(k1 x+ω̃(k1 )t) ,
2π 0
2π 0
(3.3.13)
onde
ω̃(k1 ) = ω(k1 ) + 2
θ(k1 )
.
t
(3.3.14)
O primeiro termo representa o trem de ondas incidente. O segundo representa o trem de
ondas reflectido. A relação de dispersão que usamos é mais uma vez a relação de dispersão
para uma partı́cula livre
ω(k1) =
~k12
.
2m
(3.3.15)
A posição do centro do trem de ondas incidente é dado por
dω
~k̃
xi (t) = t
=
t,
dk1 k1 =k̃
m
enquanto que a posição do centro do trem de ondas reflectidas é dado por
dω̃
~k̃
2
xr (t) = −t
.
=− t+ q
dk1 k1 =k̃
m
K02 − k̃ 2
(3.3.16)
(3.3.17)
Se pensarmos no centro do trem de ondas como descrevendo a ‘posição’ da partı́cula
quântica associada ao trem de ondas xi (t) e xr (t) podemos fazer a seguinte análise do
movimento:
• Esta solução descreve o movimento na região I, isto é para x < 0. Para t < 0, xr > 0,
logo para t negativo não há onda reflectia. Do mesmo modo, para t > 0, xi > 0.
Logo, para t positivo não há onda incidente.
• Assim descrevemos o movimento como: i) para t < 0 a ‘partı́cula’ desloca-se com velocidade ~k̃/m no sentido positivo do eixo dos x; ii) entre
2m
0<t<
~k̃
q
K02 − k̃ 2
≡ ∆τ ,
(3.3.18)
3.4 Sumário
95
a ‘partı́cula’ não está na região I; ao contrário de uma partı́cula clássica que seria
reflectida instantaneamente, a partı́cula quântica pode ‘penetrar’ na região II, devido
à onda evanescente originando um atraso na reflexão dado por ∆τ ; iii) para t > ∆τ
a ‘partı́cula’ desloca-se com velocidade ~k̃/m no sentido negativo do eixo dos x.
Assim, usando um trem de ondas conseguimos obter uma solução ‘localizada’ cujo centro podemos encarar como a ‘localização’ da partı́cula quântica. Mas ao mesmo tempo
vemos os efeitos quânticos que decorrem da propagação desta partı́cula ser feita de um
modo ondulatório, que neste caso corresponde ao atraso na reflexão. Análises semelhantes
poderiam ser feitas para todos os outros casos da secção 3.2.
3.4
Sumário
Neste capı́tulo introduzimos a equação de Schrödinger. Discutimos as razões porque uma
onda plana monocromática não é uma boa descrição da função de onda para uma partı́cula
livre o que nos levou a introduzir o conceito de trem de ondas. Investigamos as consequências da equação de Schrödinger em alguns potenciais independentes do tempo, estudando os estados estacionários do sistema, para ondas monocromáticas. A figura 3.12
faz um sumário dos potenciais estudados. Finalmente, estudamos a evolução de um trem
de ondas Gaussiano e de um trem de ondas a interagir com um salto de potencial. A
importante lição a tirar desta análise é que as propriedes inesperadas da partı́cula quântica
são facilmente percebidas se nos lembrarmos que uma partı́cula quântica se propaga como
uma onda, que é interpretada como uma onde de probabilidade.
96
A equação de Schrödinger
~
SECÇAO
3.2.3
3.2.2
3.2.5
3.2.4
3.2.6
3.2.7
Figura 3.12: Os potenciais em escada estudados na secção 3.2 (extraı́do de Eisberg &
Resnick, ‘Quantum Physics’ ).
CAPÍTULO
4
Formalismo Matemático e Postulados da Mecânica
Quântica
Neste capı́tulo vamos introduzir de um modo sistemático a matemática usada na mecânica
quântica e os postulados que a definem como teoria fı́sica.
4.1
Funções de onda e operadores
O objecto matemático fundamental em mecânica quântica é a função de onda Ψ(~x, t).
Devido ao postulado de Born para a interpretação da função de onda vamos estar particularmente interessados em funções de onda normalizáveis, ditas funções de quadrado
somável, que obedecem a
2
kΨ(t)k ≡
Z
3
∗
d ~xΨ(~x, t)Ψ(~x, t) ≡
Z
d3~x|Ψ(~x, t)|2 < ∞ .
(4.1.1)
O espaço das funções de quadrado somável sobre o corpo dos complexos, C, forma um
espaço vectorial designado por ‘L2 ’ e tem a estrutura de um espaço de Hilbert. Mas o nosso
interesse incidirá apenas sobre um subconjunto de ‘L2 ’, denotado por F que compreende
funções de onda de quadrado somável infinitamente deriváveis e limitadas.
98
Formalismo Matemático e Postulados da Mecânica Quântica
4.1.1
Estrutura de F e produto escalar em F
F é um espaço vectorial, isto é, se (a partir de agora deixamos de escrever, para simplicidade de notação, o argumento (~x, t) das funções de onda)
Ψ1 , Ψ2 ∈ F
⇒
Ψ ≡ λ 1 Ψ1 + λ 2 Ψ2 ∈ F ,
(4.1.2)
onde λ1 , λ2 ∈ C. De facto,
|Ψ|2 = |λ1 |2 |Ψ1 |2 + |λ2 |2 |Ψ1 |2 + λ∗1 λ2 Ψ∗1 Ψ2 + λ1 λ∗2 Ψ1 Ψ∗2 ,
(4.1.3)
onde os dois últimos termos têm o mesmo módulo (pois são complexos conjugados) e são
limitados superiormente por
2|λ1 ||λ2||Ψ1 ||Ψ2 | ≤ |λ1 ||λ2 | |Ψ1 |2 + |Ψ2 |2 .
Logo,
2
kΨk ≤
Z
d3~x |λ1 |2 |Ψ1 |2 + |λ2 |2 |Ψ1 |2 + |λ1 ||λ2 | |Ψ1 |2 + |Ψ2 |2 ,
(4.1.4)
(4.1.5)
que é um número finito pois, por hipótese, Ψ1 , Ψ2 são funções de quadrado somável.
A definição de norma que temos usado, (4.1.1), sugere a definição de um produto escalar
entre duas funções de onda Ψ e Φ:
(Ψ, Φ) ≡
Z
d3~xΨ∗ Φ ,
(4.1.6)
que associa a um par de funções de onda Ψ, Φ ∈ F um número complexo. Note-se que
porque as funções pertencem ao espaço de Hilbert este integral é necessariamente convergente. Esta propriedade é uma consequência da desigualdade de Schwarz que veremos em
baixo.
Propriedades do produto escalar:
i) Não é simétrico
(Φ, Ψ) = (Ψ, Φ)∗ ;
(4.1.7)
4.1 Funções de onda e operadores
99
ii) Linear no segundo argumento
(Φ, λ1 Ψ1 + λ2 Ψ2 ) = λ1 (Φ, Ψ1 ) + λ2 (Φ, Ψ2 ) ;
(4.1.8)
iii) Anti-linear no primeiro argumento
(λ1 Φ1 + λ2 Φ2 , Ψ) = λ∗1 (Φ1 , Ψ) + λ∗2 (Φ2 , Ψ) ;
(4.1.9)
iv) Definição de funções ortogonais: se
(Φ, Ψ) = 0 ,
(4.1.10)
(Ψ, Ψ) = kΨk2 ,
(4.1.11)
as funções são ditas ortogonais;
v) Definição da norma:
que é real, positiva e só é zero se Ψ = 0.
vi) Finito
|(Ψ1 , Ψ2 )| ≤
p
(Ψ1 , Ψ1 )
p
(Ψ2 , Ψ2 ) = kΨ1 kkΨ2 k < ∞ ,
que decorre da desigualdade de Schwarz habitual
Z b
Z b
Z b
2
∗
∗
f gdx ≤
f f dx
g ∗gdx .
a
4.1.2
a
(4.1.12)
(4.1.13)
a
Bases de F
Dado que as funções de onda vivem num espaço vectorial é natural definir uma base. Isto
é, um conjunto completo de funções em que possamos expandir, de um modo único, a
função de onda em cada instante t. Dependendo da estrutura de F , esta base pode ser
discreta ou contı́nua:
Base discreta {un (~x)} , n ∈ N
Base contı́nua {uα (~x)} , α ∈ R .
(4.1.14)
/ F , pelo que o
Nos casos em que analisaremos, un (~x) ∈ F para todo o n, mas uα (~x) ∈
uso do termo base é abusivo no caso contı́nuo, mas ainda assim será usado com o sentido
100
Formalismo Matemático e Postulados da Mecânica Quântica
de que expandiremos funções de F usando o conjunto {uα (~x)}. Analisemos primeiro uma
base discreta:
• Expansão da função de onda para um dado t:
Ψ(~x) =
X
cn un (~x) ,
(4.1.15)
n
o que define de um modo único as componentes {cn };
• Relação de ortonormalização da base:
(un , um ) = δnm ;
(4.1.16)
• Produto escalar de uma função de onda com uma função da base (i.e. projecção na base)
Z
X
X
XZ
3
∗
cm (un , um ) =
cm δnm = cn ;
d3~xu∗n cm um =
(un , Ψ) = d ~xun Ψ =
m
m
m
(4.1.17)
• Produto escalar de duas funções de onda em termos das suas componentes: Tomamos
Ψ=
X
cn u n ,
Φ=
n
X
bm um ,
(4.1.18)
m
logo
(Φ, Ψ) =
X
b∗m cn
n,m
Z
d3~xu∗m un
(4.1.16)
X
=
b∗m cn δnm =
n,m
X
b∗n cn ,
(4.1.19)
n
e em particular
(Ψ, Ψ) =
X
n
|cn |2 ,
(4.1.20)
que é uma generalização da igualdade de Bessel-Parseval (C.21).
• Relação de fecho (isto é, {un } formam uma base)
Ψ(~x) =
X
n
cn un (~x)
(4.1.17)
=
X
n
(un , Ψ)un (~x) =
Z
d3~x ′ Ψ(~x ′ )
"
X
n
u∗n (~x ′ )un (~x)
#
.
(4.1.21)
4.1 Funções de onda e operadores
101
Introduzimos aqui a Função delta de Dirac, δ(~x − ~x ′ ), definida pela propriedade1
Z
f (~x)δ(~x − ~x ′ )d3~x = f (~x ′ ) ;
(4.1.22)
(assumiu-se que ~x′ pertence ao domı́nio de integração). Logo, se Ψ pode ser expandida
em termos da base concluimos que
X
n
u∗n (~x ′ )un (~x) = δ(~x − ~x ′ ) .
(4.1.23)
Reciprocamente, se (4.1.23) é verdadeira, Ψ pode ser expressa em termos da base; de
facto
Ψ(~x) =
Z
d3~x ′ δ(~x−~x ′ )Ψ(~x ′ )
hipótese
=
Z
d3~x ′ Ψ(~x ′ )
"
X
#
u∗n (~x ′ )un (~x) =
n
X
cn un (~x) .
n
(4.1.24)
Assim, a relação de fecho (4.1.23) é a expressão matemática de que {un } formam
uma base.
Façamos agora uma análise semelhante para uma ‘base’ contı́nua:
• Expansão da função de onda para um dado t:
Z
Ψ(~x) = dαc(α)uα(~x) ,
(4.1.25)
o que define de um modo único as componentes {c(α)};
• Relação de ortonormalização da base:
(uα , uα′ ) =
Z
• Projecção na base
Z
Z
3
∗
(uα , Ψ) = d ~xuα dα′c(α′ )uα′
d3~xu∗α uα′ = δ(α − α′ ) ;
(4.1.26)
=
Z
dα′ c(α′ )δ(α − α′ ) = c(α);
(4.1.26)
(4.1.27)
Portanto, definindo a relação de ortonormalização anterior permite-nos obter esta
relação de projecção, análoga ao caso discreto.
1
Notemos que a ordem dos argumentos na função delta de Dirac não interessa, i.e. δ(~x −~x ′ ) = δ(~x ′ −~x).
102
Formalismo Matemático e Postulados da Mecânica Quântica
• Produto escalar de duas funções de onda em componentes: Tomamos
Z
Z
Ψ = dαc(α)uα ,
Φ = dα′b(α′ )uα′ ,
(4.1.28)
logo
(Φ, Ψ) =
Z
′
′ ∗
dαdα b(α ) c(α)
Z
d
3
~xu∗α′ uα
(4.1.26)
=
Z
dαb(α)∗ c(α) ,
(4.1.29)
e em particular
(Ψ, Ψ) =
Z
dα|c(α)|2 .
(4.1.30)
• Relação de fecho (isto é, {uα } formam uma base)
Z
Z
Z
(4.1.27)
3 ′
′
Ψ(~x) = dαc(α)uα(~x)
=
d ~x Ψ(~x ) dαu∗α(~x ′ )uα (~x) .
Logo, se Ψ pode ser expandida em termos da base concluimos que
Z
dαu∗α(~x ′ )uα (~x) = δ(~x − ~x ′ ) .
(4.1.31)
(4.1.32)
Reciprocamente, é simples demonstrar que se (4.1.32) é verdadeira, Ψ pode ser expressa em termos da base.
Resumimos as propriedades das bases contı́nuas e discretas nas seguinte tabela:
Expansão da Função de Onda
Base discreta {un }
X
Ψ(~x) =
cn un (~x)
Base contı́nua {uα }
R
Ψ(~x) = dαc(α)uα(~x)
(un , Ψ) = cn
X
(Φ, Ψ) =
b∗n cn
(uα , Ψ) = c(α)
R
(Φ, Ψ) = dαb∗ (α)c(α)
n
Relação de Ortonormalização
(uα , uα′ ) = δ(α − α′ )
(un , um ) = δnm
Projecção da Função de Onda
Produto escalar em componentes
n
Relação de Fecho
X
n
u∗n (~x ′ )un (~x)
= δ(~x − ~x ′ )
R
dαu∗α(~x ′ )uα (~x) = δ(~x − ~x ′ )
Note-se portanto que a passagem da base discreta para contı́nua pode ser sistematizada como uma mudança do ı́ndice discreto da base para contı́nuo (n → α), somatórios
R
P
para integrais ( → ) e deltas de Kronecker para deltas de Dirac (δmn → δ(α − α′ )).
Especializamos agora o caso contı́nuo para dois importantes conjuntos de funções:
4.1 Funções de onda e operadores
103
i) Tomamos o parâmetro contı́nuo α = p~, as componentes c(α) = c(~p) ≡ Ψ̃(~p) e os vectores
da base (em n dimensões)
uα (~x) = up~(~x) =
1
ei~x·~p/~ ,
(2π~)n/2
(4.1.33)
ou seja ondas planas, que são funções com momento bem definido;
ii) Tomamos o parâmetro contı́nuo α = ~x0 , as componentes c(α) = c(~x0 ) ≡ Ψ(~x0 ) e os
vectores da base
uα (~x) = u~x0 (~x) = δ(~x − ~x0 ) ,
(4.1.34)
ou seja deltas de Dirac, que são funções cujo suporte está bem definido no espaço de
posições.
Para estes dois exemplos de ‘bases’2 a tabela anterior toma a forma
Expansão
Orto
Projecção
P.E.
Fecho
Ondas Planas
Z
−n/2
d~p Ψ̃(~p)ei~x·~p/~
Ψ(~x) = (2π~)
Z
′
−n
d~x ei~x·(~p −~p)/~ = δ(~p ′ − p~)
(2π~)
Z
−n/2
d~x Ψ(~x)e−i~x·~p/~
Ψ̃(~p) = (2π~)
Z
Z
∗
d~xΦ(~x) Ψ(~x) = d~pΦ(~p)∗ Ψ(~p)
Z
′
−n
d~p ei~p·(~x −~x)/~ = δ(~x ′ − ~x)
(2π~)
Z
Deltas de Dirac
Z
Ψ(~x) = d~x0 Ψ(~x0 )δ(~x − ~x0 )
d~xδ(~x − ~x0 )δ(~x − ~x0 ′ ) = δ(~x0 − ~x0 ′ )
Z
Ψ(~x0 ) = d~xΨ(~x)δ(~x − ~x0 )
Z
Z
∗
d~xΦ(~x) Ψ(~x) = d~x0 Φ(~x0 )∗ Ψ(~x0 )
Z
d~x0 δ(~x − ~x0 )δ(~x ′ − ~x0 ) = δ(~x − ~x ′ )
Note-se que a penúltima linha expressa relações do tipo da igualdade de ParsevalPlancharel (C.29).
4.1.3
Operadores Lineares a actuar em F
Um operador linear Â, é uma aplicação (endomorfismo) em F
 : F
−→
F
Ψ(~x) −→ Ψ′ (~x) = ÂΨ(~x)
2
,
Relembramos que o termo base é abusivo pois os vectores da ‘base’ não pertencem a F .
(4.1.35)
104
Formalismo Matemático e Postulados da Mecânica Quântica
que é linear
Â[λ1 Ψ1 + λ2 Ψ2 ] = λ1 ÂΨ1 + λ2 ÂΨ2 .
(4.1.36)
Alguns exemplos de operadores:
• Operador Paridade
Π̂Ψ(x, y, z) = Ψ(−x, −y, −z) ;
(4.1.37)
X̂Ψ(x, y, z) = xΨ(x, y, z) ;
(4.1.38)
• Operador multiplicação por x
• Operador derivada em ordem a x
D̂x Ψ(x, y, z) =
∂
Ψ(x, y, z) ;
∂x
(4.1.39)
• Operadores Hamiltoniano e Translações temporais (ver capı́tulo 3) a actuar numa função
de onda do tipo Ψ(~x, t) = Φ(~x)e−iEt/~
ĤΨ(~x, t) = EΨ(~x, t) ,
T̂ Ψ(~x, t) = EΨ(~x, t) .
(4.1.40)
Sejam Â, B̂ dois operadores. Definimos o produto de operadores ÂB̂ como
h
i
(ÂB̂)Ψ(~x) = Â B̂Ψ(~x) .
(4.1.41)
Em geral o produto de operadores não é comutativo, isto é o comutador
h
i
Â, B̂ ≡ ÂB̂ − B̂ Â ,
(4.1.42)
é diferente de zero. Por exemplo, o comutador dos operadores X̂ e D̂x não é zero
h
i
∂
∂
−
x Ψ(~x) = −Ψ(~x) ,
(4.1.43)
X̂, D̂x Ψ(~x) = x
∂x ∂x
ou seja
h
i
X̂, D̂x = −1̂ .
(4.1.44)
4.1 Funções de onda e operadores
105
Como veremos adiante o facto de dois operadores comutarem ou não está intrinsecamente
associado ao princı́pio da incerteza e ao facto de duas grandezas fı́sicas serem compatı́veis
ou incompatı́veis.
Um tipo particularmente importante de operadores em Mecânica Quântica são os operadores hermı́ticos, que por definição obedecem a
(Ψ, ÂΨ) = (ÂΨ, Ψ) ,
∀Ψ ∈ F .
(4.1.45)
Estudemos a hermiticidade dos operadores anteriores:
• Operador Paridade
Z +∞
(Ψ, Π̂Ψ) =
d3~xΨ∗ (~x)Ψ(−~x)
~
x→−~
x
=
−∞
−
Z
−∞
d3~xΨ∗ (−~x)Ψ(~x) = (Π̂Ψ, Ψ) ,
+∞
(4.1.46)
logo o operador Paridade é hermı́tico.
• Operador multiplicação por x
Z
Z
3
∗
(Ψ, X̂Ψ) = d ~xΨ (~x)xΨ(~x) = d3~x(xΨ(~x))∗ Ψ(~x) = (X̂Ψ, Ψ) ,
(4.1.47)
logo o operador multiplicação por x é hermı́tico. Deste exemplo conclui-se que se
os valores próprios do operador são reais ele é hermı́tico. O resultado recı́proco é
também verdade, como veremos na secção 4.2.6.
• Operador derivada em ordem a x
Z
∂
(Ψ, D̂x Ψ) = d3~xΨ∗ (~x) Ψ(~x)
∂x
por partes
=
−
Z
d3~x
∂ ∗
Ψ (~x)Ψ(~x) = −(D̂x Ψ, Ψ) ,
∂x
(4.1.48)
logo o operador derivada não é hermı́tico (de facto é anti-hermı́tico). Note-se que na
integração por partes usamos que o módulo da função de onda desaparece no infinito,
devido à função de onda ser de quadrado somável. Um exercı́cio análogo mostra que
o operador iD̂x é hermı́tico. Logo, o operador
P̂ = −i~
∂
,
∂x
que interpretaremos como operador momento, é um operador hermı́tico.
(4.1.49)
106
Formalismo Matemático e Postulados da Mecânica Quântica
• Operadores Hamiltoniano e Translações temporais (ver capı́tulo 3) a actuar numa função
de onda do tipo Ψ(~x, t) = Φ(~x)e−iEt/~: pelo que vimos anterioremente este operadores
serão hermı́ticos se E for real.
Concluimos com a definição que aos valores próprios de um operador se chama espectro do
operador.
4.2
A notação de Dirac
Como vimos no fim do capı́tulo 2, um sistema quântico caracteriza-se pelo estado em que
se encontra. Este estado é definido pela sua função de onda, que por sua vez, é um vector
em F . É desejável ter uma designação genérica e caracterı́stica para os vectores associados
a estados quânticos, independentemente de F ter dimensão finita ou infinita, de a base ser
contı́nua ou discreta e de o estado viver no espaço de configurações, polarizações, spin, etc
(todos os graus de liberdade possı́veis). Dirac sugeriu a designação de ket e a representação
|αi i ,
(4.2.1)
onde os αi são um conjunto apropriado de rótulos para o estado em consideração.3 Por
exemplo, as funções de onda que tratamos no capı́tulo 3, para uma partı́cula sem spin,
Ψ(x) são agora representadas pelo ket
Ψ(x) ∈ F
−→ |Ψi ∈ E .
(4.2.2)
A ausência do argumento espacial no rótulo do ket significa que o ket representa o estado,
independentemente das coordenadas usadas, enquanto que Ψ(~x) são as componentes de
|Ψi num dado sistema coordenado. Esta situação é análoga a considerarmos um vector
~v , que é uma entidade geométrica autónoma, independentemente da base escolhida para
o representar numa situação concreta, em que tem componentes {vi }. Definimos também
um espaço de estados E, onde vivem os kets, que é isomórfico ao espaço das funções de
onda F . Vejamos pois como se reexpressam em E os conceitos de produto escalar e de
acção de operadores lineares.
3
Como veremos na secção 4.4.1, estes rótulos são os valores próprios dos operadores de um Conjunto
Completo de Observáveis que Comutam (C.C.O.C.).
4.2 A notação de Dirac
4.2.1
107
Produto escalar e espaço dual a E
Definimos o produto escalar de kets como a associação a cada par de kets de um número
complexo
( , ):E ×E
−→
C
,
(4.2.3)
|Ψi, |Φi −→ (|Ψi, |Φi)
que obedece às propriedades (4.1.7)-(4.1.12). Por outro lado podemos definir um espaço
dual a E, isto é um espaço cujos membros são aplicações lineares de E para C
hαi | ∈ E ∗ : E −→ C .
(4.2.4)
Os vectores deste espaço são designados por bra e representados por
hαi | ,
(4.2.5)
onde αi são mais uma vez rótulos. A existência do produto escalar determina uma correspondência entre E e E ∗ :4
E
−→
E∗
,
(4.2.6)
|Φi −→ (|Φi, . . .) ≡ hΦ|
onde os . . . representam a entrada livre. Esta correspondência é antilinear. De facto
λ1 |Φ1 i + λ2 |Φ2 i
corresponde ao bra
−→
(λ1 |Φ1 i + λ2 |Φ2 i, . . .) = λ∗1 (|Φ1 i, . . .) + λ∗2 (|Φ2 i, . . .)
= λ∗1 hΦ1 | + λ∗2 hΦ2 |
.
(4.2.7)
Nesta notação, o produto escalar é representado da seguinte forma
(|Φi, |Ψi) = hΦ|Ψi .
As propriedades (4.1.7)-(4.1.12) aplicam-se também nesta notação.
(4.2.8)
O uso de bras e
kets denomina-se notação de Dirac. Nesta notação o produto escalar aparece como um
parêntesis da forma h. . . | . . .i, ou seja a justaposição de um bra a um ket; a origem destes
está no inglês em que parêntesis se diz bracket=bra+ket.
4
Se E for finito, E e E ∗ são isomórficos, mas em geral não são.
108
4.2.2
Formalismo Matemático e Postulados da Mecânica Quântica
Acção de operadores lineares
Podemos reescrever a secção 4.1.3 na notação de Dirac. Assim, um operador linear  é
um endomorfismo em E
 : E
−→
E
|Φi −→ |Φ′ i ≡ Â|Φi
,
(4.2.9)
que é linear
 [λ1 |Ψ1 i + λ2 |Ψ2 i] = λ1 Â|Ψ1 i + λ2 Â|Ψ2 i .
(4.2.10)
O produto escalar do ket |Φi com Â|Ψi,
hΦ|Â|Ψi ,
(4.2.11)
é designado elemento de matriz do operador  entre |Φi e |Ψi, que é um número complexo
que depende linearmente em |Ψi e antilinearmente em |Φi. Um exemplo particular de
operador é construı́ido com um bra e um ket com a ordem ‘trocada’:
|ΦihΨ| : E
−→
E
,
(4.2.12)
|χi −→ |ΦihΨ|χi = z|Φi
onde z ≡ hΨ|χi é um número complexo. Em particular, o operador |ΨihΨ| é um operador
de projecção de um ket arbitrário em |Ψi
|ΨihΨ| : E
−→
E
,
(4.2.13)
|χi −→ |ΨihΨ|χi
projecção que é nula se |Ψi e |χi forem ortogonais, isto é hΨ|χi = 0. Deste exemplo
concluı́mos que a ordem com que colocamos kets e bras é fundamental:
hΨ|Φi = número ,
|ΦihΨ| = operador .
(4.2.14)
Podemos usar a acção de um operador num ket para definir a acção de um operador
num bra do seguinte modo:
hΦ|Â |Ψi ≡ hΦ| Â|Ψi .
(4.2.15)
4.2 A notação de Dirac
109
Isto é, um elemento de matriz é independente de o operador actuar primeiramente no bra
ou no ket. Como exercı́cio pode tentar demonstrar que a acção no bra assim definida é
linear. Podemos pois escrever o elemento de matriz como (4.2.11) pois não há ambiguidades
de ordem de actuação.
4.2.3
O operador adjunto
Definimos o operador adjunto a Â, representado † (lê-se “A dagger” ou “A adjunto”), do
seguinte modo: a cada ket associamos um bra5
|Ψi −→ hΨ| ;
(4.2.16)
definimos o operador adjunto como o operador que actuando no bra hΨ| dá origem ao bra
associado ao ket Â|Ψi
|Ψ′ i ≡ Â|Ψi −→ hΨ′ | ≡ hΨ|† .
(4.2.17)
Mostremos que, por esta definição, a acção de † nos bras é linear. Seja
λ∗1 |Ψ1 i + λ∗2 |Ψ2 i −→ λ1 hΨ1 | + λ2 hΨ2 | ;
(4.2.18)
pela linearidade de Â
 (λ∗1 |Ψ1 i
+
λ∗2 |Ψ2 i)
=
λ∗1
∗
Â|Ψ1 i + λ2 Â|Ψ2 i ,
e igualando os bras associados a cada um destes kets obtemos imediatamente
(λ1 hΨ1 | + λ2 hΨ2 |) † = λ1 hΨ1 |† + λ2 hΨ2 |† ,
(4.2.19)
(4.2.20)
o que demonstra que a acção de † é linear.
Uma importante equação é a que relaciona os elementos de matriz de † com os de Â.
Por (4.1.7),
hΨ′ |Φi = hΦ|Ψ′ i∗ ,
(4.2.21)
para |Φi e |Ψ′ i arbitrários. Se tomarmos |Ψ′ i como em (4.2.17) obtemos
hΨ|† |Φi = hΦ|Â|Ψi∗ .
5
Nesta secção a seta denota a correspondência (4.2.6).
(4.2.22)
110
Formalismo Matemático e Postulados da Mecânica Quântica
As seguintes propriedades são consequência de (4.2.17) e (4.2.22):
i)
†
Â
†
= Â ;
(4.2.23)
ii)
†
λ = λ∗ † ;
(4.2.24)
iii)
 + B̂
†
= A† + B † ;
(4.2.25)
iv)
†
ÂB̂|ψi −→ hΨ| ÂB̂
.
†
†
 B̂|Ψi −→ hΨ|B̂ Â
Logo
ÂB̂
†
= B̂ † † .
(4.2.26)
(4.2.27)
Reexpressemos a definição de operador hermı́tico (4.1.45), na notação de Dirac. Consideramos os kets |Ψi e Â|Ψi. Os seus bras associados são
|Ψi −→ (|Ψi, . . .) ≡ hΨ|
.
Â|Ψi −→ Â|Ψi, . . . ≡ hΨ|†
(4.2.28)
Logo, a condição (4.1.45) é expressa
hΨ|Â|Ψi = hΨ|† |Ψi ,
(4.2.29)
que, sendo |Ψi arbitrário, é equivalente a
† =  .
(4.2.30)
Notemos que o produto de 2 operadores hermı́ticos só é um operador hermı́tico se o seu
comutador for zero
†
ÂB̂ = ÂB̂
(4.2.27)
⇔
B̂ † † = ÂB̂
hermiticidade
⇔
h
i
B̂ Â = ÂB̂ ⇔ Â, B̂ = 0 .
(4.2.31)
4.2 A notação de Dirac
4.2.4
111
A operação adjunta
A definição de operador adjunto resulta da correspondência entre E e E ∗ . Chamamos por
isso a um ket e ao seu bra associado adjuntos e denotamos
hΨ|† = |Ψi ,
|Ψi† = hΨ| .
(4.2.32)
O que acontece quando temos um produto de kets e bras como por exemplo
(|aihb|)† ?
(4.2.33)
O elemento de matriz deste operador entre 2 estados arbitrários é
hΨ| (|aihb|)† |Φi
(4.2.22)
=
(hΦ|aihb|Ψi)∗ = hΦ|ai∗ hb|Ψi∗ = hΨ|biha|Φi = hΨ| (|biha|) |Φi ,
(4.2.34)
ou seja
(|aihb|)† = |biha| .
(4.2.35)
Assim, a acção da operação adjunta transforma ket ↔ bra e, tal como para operadores,
inverte a ordem. Notando que a operação adjunta transforma um escalar no seu complexo conjugado (por (4.2.24)), resumimos a acção da operação adjunta numa expressão
composta por kets, bras, constantes e operadores do seguinte modo:
i) Substituimos
• constantes pelos complexos conjugados;
• kets pelos bras associados e vice-versa;
• operadores pelos adjuntos;
ii) Invertemos a ordem dos factores.
4.2.5
Notação de Dirac numa dada base
Reproduzimos a tabela da secção 4.1.2 na notação de Dirac:6
6
Os kets |uα i são designados por kets generalizados, pois não pertencem a E, i.e. não são normalizáveis,
tal como os vectores uα (~x) na secção 4.1.2.
112
Formalismo Matemático e Postulados da Mecânica Quântica
Expansão da Função de Onda
Base discreta {|un i}
X
|Ψi =
cn |un i
Base contı́nua {|uαi}
R
|Ψi = dαc(α)|uαi
hun |Ψi = cn
X
hΦ|Ψi =
b∗n cn
huα |Ψi = c(α)
R
hΦ|Ψi = dαb∗ (α)c(α)
n
Relação de Ortonormalização
huα |uα′ i = δ(α − α′ )
hun |umi = δnm
Projecção da Função de Onda
Produto escalar em componentes
n
Relação de Fecho
(n)
P̂
≡
X
n
|un ihun | = 1̂ P̂ (α) ≡
R
dα|uαihuα| = 1̂
onde usamos o ket
|Φi =
X
n
bn |un i ,
(4.2.36)
e denotamos o operador identidade como 1̂. Demonstremos a relação de fecho no caso
discreto. Considerando o ket |Ψi nesta base temos
|Ψi =
X
n
cn |un i =
X
n
hun |Ψi|un i =
X
n
|un ihun |Ψi ,
(4.2.37)
o que implica a equivalência
X
n
|un ihun | = 1̂ .
(4.2.38)
É simples expressar um bra nesta base usando este operador. No caso discreto
hΨ| =
X
n
hΨ|unihun | =
X
n
c∗n hun | .
(4.2.39)
Por outro lado, os elementos de matriz de um operador  são
Anm = hun |Â|umi
A(α, α′ ) = huα |Â|uα′ i ,
(4.2.40)
para uma base discreta e contı́nua respectivamente. Assim, no caso de uma base discreta
podemos resumir a situação do seguinte modo:
• O ket |Ψi =
• O bra hΦ| =
P
n cn |un i
é representado como um vector coluna com componentes {cn };
∗
n bn hun |
é representado como um vector linha com componentes {b∗n };
P
4.2 A notação de Dirac
113
• O operador  é representado como uma matriz com componentes Anm = hun |Â|um i;
• O ket Â|Ψi é representado como um vector coluna com componentes {dn =
P
m
Anm cm },
que resulta da multiplicação de uma matriz (que representa Â) por um vector coluna
(que representa |Ψi); de facto projectando este ket nos vectores da base obtemos
X
X
dn = hun |Â|Ψi = hun |Â1̂|Ψi =
hun |Â|um ihum |Ψi =
Anm cm ;
(4.2.41)
m
m
• O bra hΨ|Â é representado como um vector linha com componentes {
∗
n cn Anm },
P
que
resulta da multiplicação de um vector linha (que representa hΨ|) por uma matriz
(que representa Â); de facto projectando este bra nos vectores da base obtemos
X
X
c∗n Anm ;
(4.2.42)
hΨ|Â|um i = hΨ|1̂Â|umi =
hΨ|un ihun |Â|um i =
n
• O número hΦ|Â|Ψi é representado como
n
∗
n,m bn Anm cm ,
P
que resulta da multiplicação
de uma matriz (que representa Â) por um vector linha à esquerda (que representa o
bra) e um vector coluna à direita (que representa o ket); de facto
X
X
hΦ|Â|Ψi = hΦ|1̂Â1̂|Ψi =
hΦ|un ihun |Â|um ihum|Ψi =
b∗n Anm cm ;
n,m
(4.2.43)
n,m
• O operador adjunto † de um operador  é representado pela matriz complexa conjugada
e transposta da matriz que representa Â; de facto
A†
nm
= hun |† |um i
(4.2.22)
=
hum |Â|un i∗ = A∗mn ;
(4.2.44)
• Um operador hermı́tico é representado por uma matriz hermı́tica, pois † =  implica
que
Anm = A∗mn .
4.2.6
(4.2.45)
Valores próprios e vectores próprios de um operador
Um problema fundamental em mecânica quântica é encontrar os valores próprios, λ, e os
vectores próprios, |Ψi, de um operador Â; isto é, resolver a equação
Â|Ψi = λ|Ψi .
(4.2.46)
114
Formalismo Matemático e Postulados da Mecânica Quântica
Chama-se espectro do operador  ao seu conjunto de valores próprios. Notemos que para
qualquer operador linear
i) Se |Ψi é vector próprio, α|Ψi também o é, correspondendo ao mesmo valor próprio.
Podemos por isso escolher sempre os vectores próprios normalizados, isto é
hΨ|Ψi = 1 .
(4.2.47)
ii) Se {|Ψi i}, i=1,...,n, são linearmente independentes e correspondem ao mesmo valor
próprio, o valor próprio diz-se degenerado com grau de degenerescência n.
No caso de o operador em consideração ser hermı́tico podemos ainda enunciar as seguintes
propriedades:
i) Os valores próprios de um operador hermı́tico  são reais:
λhΨ|Ψi = hΨ|Â|Ψi
(4.2.22)
=
hΨ|Â|Ψi∗ = λ∗ hΨ|Ψi ,
(4.2.48)
logo
λ = λ∗ ;
(4.2.49)
ii) Dois vectores próprios |Ψi, |Φi associados a valores próprios distintos λ, µ são ortogonais. De facto,

 Â|Ψi = λ|Ψi
 Â|Φi = µ|Φi
adjunto
←→

 hΨ|Â = λhΨ|
 hΦ|Â = µhΦ|
logo se considerarmos hΦ|Â|Ψi podemos pensar de duas maneiras
λhΦ|Ψi = hΦ| Â|Ψi = hΦ|Â|Ψi = hΦ|Â |Ψi = µhΦ|Ψi ,
,
(4.2.50)
(4.2.51)
e como λ 6= µ concluı́mos que hΦ|Ψi = 0.
Na prática, dada uma base em que expressamos um operador  como uma matriz, encontrar os valores próprios do operador resume-se a encontrar os valores próprios da matriz e
portanto resolver a equação
det (Amn − λδmn ) = 0 .
(4.2.52)
4.3 Os postulados da Mecânica Quântica
4.2.7
115
Observáveis
Consideremos um operador hermı́tico Â, e por simplicidade assumimos que os seus valores
próprios formam um espectro discreto {λn }, n=1,...,N, com
Â|Ψin i = λn |Ψin i ,
(4.2.53)
onde i representa a degenerescência de cada valor próprio, i = 1, ..., gn , onde gn é um
número inteiro que depende de n. Para cada n podemos escolher uma base ortonormada
do subespaço vectorial associado ao valor próprio λn ,
hΨin |Ψjn i = δ ij .
(4.2.54)
Como vimos anteriormente os vectores próprios associados a valores próprios distintos são
necessariamente ortogonais e podemos escolhê-los normalizados. Assim o conjunto |Ψin i,
n = 1...N, i = 1...gn forma uma base ortonormada do espaço de funções próprias de Â. Se
este conjunto é também uma base do espaço de estados E, o operador hermı́tico é designado
uma observável. Portanto, o requerimento para ser observável é que qualquer estado de E
possa ser expresso como uma combinação linear de funções próprias da observável, condição
que é expressa matematicamente pela relação de fecho
gn
N X
X
n=1 i=1
|Ψin ihΨin | = 1̂ .
(4.2.55)
Veremos na próxima secção que as grandezas fı́sicas mensuráveis estão associadas a observáveis.
4.3
Os postulados da Mecânica Quântica
Pensemos na descrição da mecânica clássica dada pelo formalismo Hamiltoniano descrito
na secção 1.3. Podemos escrever “postulados” para a mecânica clássica de N partı́culas
pontuais usando a linguagem de estado do sistema que temos usado na descrição quântica.
Os postulados clássicos seriam os seguintes:
i) O estado de um sistema no instante t0 é definido especificando {q i (t0 ), pi(t0 )}, i = 1...N;
116
Formalismo Matemático e Postulados da Mecânica Quântica
ii) Num dado instante o valor de todas as quantidades fı́sicas é completamente determinado
se o estado do sistema é conhecido. Sabendo o estado do sistema em t0 podemos
prever com toda a certeza o resultado de qualquer medida efectuada no sistema em
t0 ;
iii) A evolução do estado do sistema é dada pelas equações canónicas (1.3.13)
ṗi = −
∂H
,
∂q i
q̇ i =
∂H
,
∂pi
(4.3.1)
onde H é o Hamiltoniano. Dado estas serem equações diferenciais de primeira ordem,
a sua solução {q i (t), pi (t)} é completamente determinada pelas condições iniciais
{q i (t0 ), pi(t0 )}. Assim, o estado do sistema é conhecido para todo o t se for conhecido
para t0 .
Qual o sistema de postulados que substituem os anteriores em mecânica quântica? Ou
seja:
i) Como se descreve matematicamente num dado instante t0 o estado de um
sistema quântico?
Primeiro Postulado
Num dado instante t0 , o estado de um sistema é descrito por um ket |Ψ(to )i pertencente
ao espaço de estados E.
Note-se que neste postulado está implı́cito: a) o princı́pio de sobreposição, pois E é um
espaço vectorial; b) normalizabilidade da função de onda pois E é um subespaço de um
espaço de Hilbert.
ii) Dado este estado, como podemos prever o resultado da medida de quantidades fı́sicas?
Segundo Postulado
Qualquer quantidade fı́sica mensurável, A, é descrita por um operador, Â, que actua
em E; este operador é uma observável.
4.3 Os postulados da Mecânica Quântica
117
Note-se desde já que em mecânica quântica o estado do sistema - representado por
um vector - e uma quantidade fı́sica mensurável - representada por um operador - têm
naturezas diferentes. Em mecânica clássica este contraste não existe.
Terceiro Postulado
Os únicos resultados possı́veis numa medição de A são os valores próprios de Â.
Note-se que a) o resultado de uma medição é um número real, como consequência de
 ser hermı́tico; b) se o espectro de  for discreto os resultados possı́veis da medição de
A estão quantificados.
Quarto Postulado
A previsão do resultado da medição de A é de natureza probabilı́stica. Se A for medida
num sistema descrito por um estado normalizado |Ψi, temos as seguintes possibilidades
para a probabilidade de obter um dado valor:
• Se  tem um espectro discreto {an }, a probabilidade de obter um dado valor próprio an
é
P(an ) =
gn
X
i=1
|huin |Ψi|2 ,
(4.3.2)
onde gn é o grau de degenerescência do valor próprio an e {|uin i}, i = 1...gn é uma
base ortonormada do subespaço de vectores próprios associados a an ;
• Se  tem um espectro contı́nuo {a(α)}, a probabilidade dP(α) de obter um resultado
entre α e α + dα é
dP(α) = |huα |Ψi|2dα ,
(4.3.3)
onde |uαi é o vector próprio de  associado ao valor próprio a(α).
Note-se que para este postulado ser coerente, a soma da probabilidade de todos os resultados possı́veis tem de ser 1. Este é o caso se  for uma observável. De facto, tomando
como exemplo simples o caso de um espectro discreto não degenerado,
X
n
P(an ) =
X
n
|hun |Ψi|2
 é observável
=
XX
m
n
|hun |umicm |2 =
X
m
|cm |2 = 1 , (4.3.4)
118
Formalismo Matemático e Postulados da Mecânica Quântica
pois hΨ|Ψi = 1 por hipótese. Logo, a condição de  ser observável garante que
hΨ|Ψi = 1
 é Observável
X
⇒
todos os valores próprios
P(valor próprio) = 1 .
(4.3.5)
Note-se também que poderı́amos considerar casos mais complicados, como espectros contı́nuos
degenerados ou espectros parcialmente contı́nuos e parcialmente discretos.
Quinto Postulado - Colapso da função de onda
Se a medição de uma grandeza fı́sica A no sistema no estado |Ψi dá resultado:
• (caso discreto) an , o sistema imediatamente depois da medida encontra-se no estado
descrito pela projecção normalizada de |Ψi para o subespaço associado a an
|Ψi
medida dá an
−→
onde
gn
X
P̂n =
i=1
P̂n |Ψi
q
,
hΨ|P̂n |Ψi
(4.3.6)
|uin ihuin | ;
(4.3.7)
• (caso contı́nuo) α0 com incerteza ∆α, o sistema imediatamente depois da medida encontrase no estado descrito pela projecção
medida dá α0
|Ψi
P̂∆α (α0 )|Ψi
incerteza ∆α
−→
q
onde
P̂∆α (α0 ) =
Z
,
(4.3.8)
hΨ|P̂∆α(α0 )|Ψi
α0 +∆α/2
α0 −∆α/2
dα|uαihuα| .
(4.3.9)
Note-se que a evolução normal do sistema poderá retira-lo deste estado próprio de Â,
caso este operador não comute com o operador Hamiltoniano.
iii) Sabendo o estado inicial em t0 , como calcular o estado num instante posterior t?
Sexto Postulado
A evolução temporal do estado do sistema |Ψ(t)i é descrita pela equação de Schrödinger
i~
d
|Ψ(t)i = Ĥ(t)|Ψ(t)i ,
dt
(4.3.10)
4.4 Quantificação
119
onde Ĥ(t) é o operador Hamiltoniano que é a observável associada com a energia total do
sistema.
4.4
Quantificação
O princı́pio da incerteza de Heisenberg ficou, aparentemente, de fora nos postulados da
secção anterior. Por outro lado, o segundo postulado associa a uma grandeza mensurável
A um operador Â, que não especificamos como construir. Vamos agora estabelecer como
é que associamos às variáveis fı́sicas mensuráveis operadores e como é que incorporamos
nesses operadores o princı́pio da incerteza.
4.4.1
Variáveis compatı́veis, incompatı́veis e C.C.O.C.
Duas grandezas mensuráveis A e B dizem-se compatı́veis se os operadores que lhes estão
associados  e B̂ comutam. Também se usa o termo compatı́veis para as próprias observáveis. Significado matemático de compatibilidade:
Teorema: A compatibilidade de duas observáveis é equivalente a possuirem um sistema
ortonormado completo e comum de funções próprias, isto é, uma base própria comum.
Estas observáveis são ditas simultaneamente diagonalizáveis.
Demonstração: Aqui tomamos somente o caso mais simples em que  e B̂ têm espectro
discreto não degenerado com valores próprios, respectivamente, {an } e {bn }.
i) (⇐) Utilizemos estes valores próprios como rótulos do conjunto ortonormado e completo de vectores próprios comum a  e B̂ denotado {|an , bm i}:
Â|an , bm i = an |an , bm i ,
B̂|an , bm i = bm |an , bm i .
(4.4.1)
Logo
B̂ Â − ÂB̂ |an , bm i = 0 ,
(4.4.2)
de onde concluimos, devido aos |an , bm i formarem uma base do espaço de estados, que
h
i
Â, B̂ = 0.
120
Formalismo Matemático e Postulados da Mecânica Quântica
ii) (⇒) Consideramos duas variáveis compatı́veis, que portanto têm operadores associados  e B̂ que comutam. Consideremos um conjunto completo de vectores próprios de
Â, {|an i},
Â|an i = an |an i .
O vector B̂|an i é também vector próprio de  com valor próprio an ; de facto
[Â,B̂]=0
 B̂|an i
=
B̂ Â|an i = an B̂|an i .
(4.4.3)
(4.4.4)
Mas como assumimos que o espectro é não degenerado, todos os vectores próprios associados a um valor próprio são colineares. Logo
B̂|an i = b|an i ,
(4.4.5)
o que mostra que os vectores próprios de  são também vectores próprios de B̂ e como tal
que existe um conjunto completo de vectores próprios comum a  e B̂. (q.e.d.)
Corolário: Se o Hamiltoniano Ĥ comuta com um operador Ô então existe uma base de
estados estacionários cujos elementos são também estados próprios de Ô. Note, no entanto,
que se o espectro de Ĥ for degenerado poderá ser possı́vel construir estados estacionários
que não são estados próprios de Ô.
Nota: o facto de não existir uma base própria comum a duas observáveis não significa
que não exista nenhum vector próprio comum.
Obviamente, duas grandezas mensuráveis A e B dizem-se incompatı́veis se os operadores que lhes estão associados  e B̂ não comutam (os operadores também são ditos
incompatı́veis). Significado fı́sico da incompatibilidade:
Teorema: A incompatibilidade de duas grandezas fı́sicas implica a impossibilidade de
determinar ambas as grandezas com precisão arbitrária.
Demonstração: Assumimos que os operadores  e B̂ associados às nossas grandezas
fı́sicas A e B não comutam:
h
i
Â, B̂ = ia1̂ ,
a ∈ R+ .
(4.4.6)
4.4 Quantificação
121
Estas grandezas têm associadas funções de distribuição de probabilidade. Podemos por
isso associar-lhes um valor esperado, uma variância e um desvio padrão. Pretendemos
demonstrar que o produto dos desvios padrão tem um ı́nfimo. Se o espectro de  e B̂ for
dado por {an } e {bn }, os valores esperados das grandezas A e B serão dados por
hAi =
X
n
P(an )an ,
hBi =
X
∆B =
p
P(bn )bn ,
(4.4.7)
h(B − hBi)2 i .
(4.4.8)
n
onde P(an ) = |han |Ψi|2 e os desvios padrão
∆A =
p
h(A − hAi)2i ,
Primeiro, notamos como expressar hAi na notação de Dirac:
hAi =
X
n
han |Ψi∗han |Ψian =
X
n
hΨ|an ihan |Ψian =
X
n
hΨ|Â|an ihan |Ψi = hΨ|Â|Ψi ≡ hÂi .
(4.4.9)
Observe a notação. No fim da linha denotamos o valor esperado de um operador num
determinado estado de uma maneira análoga ao valor esperado (ou médio) estatı́stico que
aparece no inı́cio da linha.
Segundo, definimos as observáveis α̂, β̂ do seguinte modo
α̂ = Â − hÂi1̂ ,
β̂ = B̂ − hB̂i1̂ ,
(4.4.10)
que são observáveis com a mesma relação de comutação que  e B̂, [α̂, β̂] = ia1̂, correspondentes a grandezas fı́sicas, α, β, com o mesmo desvio padrão de A, B mas valor esperado
zero. Logo (4.4.8) fica neste caso
(∆α)2 = hα2 i,
(∆β)2 = hβ 2 i ,
(4.4.11)
(∆β)2 = hΨ|β̂ 2|Ψi ,
(4.4.12)
ou, na notação de Dirac
(∆α)2 = hΨ|α̂2|Ψi,
ou ainda, definindo |Ψ1 i = α̂|Ψi e |Ψ2 i = β̂|Ψi
(∆α)2 = hΨ1 |Ψ1 i,
(∆β)2 = hΨ2 |Ψ2 i .
(4.4.13)
122
Formalismo Matemático e Postulados da Mecânica Quântica
Terceiro usamos a desigualdade de Schwarz (4.1.12)
(∆α∆β)2 = hΨ1 |Ψ1 ihΨ2 |Ψ2 i
(4.1.12)
≥
hΨ1 |Ψ2 ihΨ2|Ψ1 i = hΨ|α̂β̂|ΨihΨ|β̂ α̂|Ψi . (4.4.14)
Notemos que embora α̂ e β̂ sejam hermı́ticos, o seu produto α̂β̂ não é hermı́tico, pois eles
não comutam. Assim
†
x + iy ≡ hΨ|α̂β̂|Ψi = hΨ| α̂β̂ |Ψi∗ = hΨ|β̂ α̂|Ψi∗
⇒
hΨ|β̂ α̂|Ψi ≡ x − iy . (4.4.15)
Logo reescrevemos (4.4.14) como
(∆α∆β)2 ≥ x2 + y 2 ≥ y 2 = −
2
h
i
2 a2
1
1
hΨ|α̂β̂|Ψi − hΨ|β̂ α̂|Ψi = − hΨ| α̂, β̂ |Ψi =
.
4
4
4
(4.4.16)
Finalmente concluimos então que
∆α∆β ≥
a
2
⇔
∆A∆B ≥
a
,
2
(4.4.17)
o que mostra que não podemos determinar as duas grandezas simultaneamente com precisão
arbitrária. (q.e.d.)
Tendo compreendido que um conjunto de variáveis compatı́veis corresponde a um conjunto de observáveis que comutam e portanto têm uma base própria comum, introduzimos
a seguinte definição
Definição: Um conjunto de observáveis, Â, B̂, Ĉ . . ., diz-se um Conjunto Completo de
Observáveis que Comutam (C.C.O.C) se:
i) Todos os pares de observáveis comutarem;
ii) Especificando o valor próprio de todas as observáveis determina um único vector próprio
(normalizado);
iii) Ao retirarmos uma qualquer observável, ii) deixa de ser obedecido, ou seja, o conjunto
é minimal.
4.4 Quantificação
123
A base para o espaço de estados de um sistema fı́sico é escolhida como o conjunto de
vectores próprios de um C.C.O.C, sendo estes vectores rotulados pelos valores próprios do
C.C.O.C.
|an , bn , cn , . . .i ,
(4.4.18)
onde {an }, {bn }, {cn }, . . ., são os espectros de Â, B̂, Ĉ . . .. Note-se que para um dado
sistema fı́sico existem, em geral, vários C.C.O.C.
4.4.2
Os operadores X̂ e P̂
O exemplo canónico de variáveis incompatı́veis são as grandezas fı́sicas momento e posição.
Associando a estas grandezas fı́sicas as observáveis X̂ e P̂ e comparando (4.4.17) com (2.3.6)
identificamos a = ~ e usando em (4.4.6) temos que a relação de comutação
h
i
X̂, P̂ = i~1̂ ,
(4.4.19)
reproduz a relação de incerteza de Heisenberg. Ou seja (4.4.19) é a expressão do princı́pio
da incerteza de Heisenberg em termos das observáveis X̂ e P̂ . Se tivéssemos várias componentes de posição e momento, X̂ k e P̂j terı́amos
h
i
X̂ k , P̂j = i~δjk 1 ,
h
i
h
i
X̂ k , X̂ j = 0 = P̂k , P̂j ,
(4.4.20)
que são denominadas relações de comutação canónicas. Deste modo, não podemos escolher
uma base de funções próprias comum a X̂ e P̂ , pelo que temos duas importantes alternativas
para a escolha de base de um sistema fı́sico:7
• Representação |~xi: Expandimos o estado do sistema fı́sico na base de funções próprias
do operador X̂. Esta base foi estudada no final da secção 4.1.2 e corresponde a tomar
os vectores da base como deltas de Dirac, ou, na notação de Dirac
δ(~x − ~x0 ) → |~x0 i ;
7
Note-se que os kets que vamos usar |~x0 i e |~
pi são kets generalizados.
(4.4.21)
124
Formalismo Matemático e Postulados da Mecânica Quântica
• Representação |~pi: Expandimos o estado do sistema fı́sico na base de funções próprias
do operador P̂ . Tomamos os vectores da base como ondas planas, ou, na notação de
Dirac
1
ei~p·~x/~ → |~pi .
(2π~)n/2
(4.4.22)
Para estas ‘bases’ a tabela da secção 4.2.5 fica
Representação |~pi
Z
|Ψi = d~p Ψ̃(~p)|~pi
Expansão da Função de Onda
h~p|~p ′ i = δ(~p − ~p ′ )
Relação de Ortonormalização
Projecção da Função de Onda
Produto escalar em componentes
Relação de Fecho
Representação |~xi
Z
|Ψi = d~x0 Ψ(~x0 )|~x0 i
h~x0 |~x0 ′ i = δ(~x0 − ~x0 ′ )
h~p|Ψi = Ψ̃(~p)
h~x0 |Ψi = Ψ(~x0 )
R
R
hΦ|Ψi = d~pΦ̃∗ (~p)Ψ̃(~p) hΦ|Ψi = d~x0 Φ∗ (~x0 )Ψ(x~0 )
R
R
d~p|~pih~p| = 1̂
d~x0 |~x0 ih~x0 | = 1̂
Assim, podemos reinterpretar a função de onda no espaço de configurações Ψ(~x) e a
sua transformada de Fourier Ψ̃(~p) como os coeficientes da expansão do estado do sistema
na representação |~xi e |~pi respectivamente. Notemos que
h~x0 |~p0 i =
Z
d~xδ(~x − ~x0 )
1
1
i~
p0 ·~
x/~
e
=
ei~p0 ·~x0 /~ .
(2π~)n/2
(2π~)n/2
(4.4.23)
Para simplificar a notação trabalharemos a partir de agora em uma só dimensão. A
acção do operador X̂ na representação |xi e do operador P̂ na representação |pi é
X̂|xi = x|xi ,
P̂ |pi = p|pi .
(4.4.24)
Uma questão natural é a seguinte: Qual a acção do operador P̂ na representação |xi e
do operador X̂ na representação |pi? Para obter a resposta consideramos o ket P̂ |Ψi
projectado na representação |xi:
Z
Z
1
dpeipx/~pΨ̃(p)
hx|P̂ |Ψi = dphx|pihp|P̂ |Ψi = √
2π~
Z
.
1
d
d
d
ipx/~
=√
dpe
Ψ̃(p) = −i~
Ψ(x) = −i~
hx|Ψi
−i~
dx
dx
dx
2π~
(4.4.25)
4.4 Quantificação
125
Portanto, na representação |xi o operador P̂ coincide com o operador diferencial −i~d/dx,
que é hermı́tico, como vimos na secção 4.1.3. Um elemento de matriz fica
Z
Z
d
′
′
′
′
∗
hx|x′ ihx′ |Ψi
hΦ|P̂ |Ψi = dxdx hΦ|xihx|P̂ |x ihx |Ψi = dxdx Φ(x) −i~
dx
.
Z
Z
Z
d
d
∗
′ ′
′
∗
= dxΦ(x) −i~
hx|
dx |x ihx | |Ψi = dxΦ(x) −i~
Ψ(x)
dx
dx
(4.4.26)
Podemos ainda verificar a consistência desta representação do operador P̂ com (4.4.19);
consideremos
h
i
hx| X̂, P̂ |Ψi = hx|X̂ P̂ − P̂ X̂|Ψi ,
(4.4.27)
e se nos situarmos na representação |xi temos
d
= hx|X̂ P̂ |Ψi − hx|P̂ X̂|Ψi = xhx|P̂ |Ψi + i~ hx|X̂|Ψi
dx
d
d
= x −i~ hx|Ψi + i~ (xhx|Ψi) = i~hx|Ψi
dx
dx
ou, como |Ψi é arbitrário,
em concordância com (4.4.19).
h
i
X̂, P̂ = i~1 ,
,
(4.4.28)
(4.4.29)
De um modo análogo podemos concluir que o operador X̂ na representação |pi toma a
forma do operador diferencial i~d/dp.
Notemos que qualquer variável ou equação dinâmica pode ser expressa tanto na representação |xi como |pi. Assim, a equação de Schrödinger, que é usualmente escrita na
representação |xi,
~2
∂Ψ(x, t)
= −
∆ + V (x, t) Ψ(x, t) ,
i~
∂t
2m
(4.4.30)
pode ser vista como resultando da relação de energia
E=
p2
+ V (x, t) ,
2m
(4.4.31)
por substituição de
E → i~
∂
,
∂t
p~ → −i~∇ ,
(4.4.32)
126
Formalismo Matemático e Postulados da Mecânica Quântica
o que significa o uso da representação |xi. Por contraste, na representação |pi farı́amos a
substituição
E → i~
∂
,
∂t
~x → i~∇p ,
(4.4.33)
o que nos leva à equação de Schrödinger na representação |pi
2
∂ Ψ̃(p, t)
p
i~
=
+ V (i~∇p , t) Ψ̃(p, t) .
∂t
2m
(4.4.34)
Claro que esta equação não é mais do que a representação de (4.4.30) no espaço de Fourier.
Concluimos com a observação de que tanto X̂ como P̂ são observáveis (a hermiticidade
foi demonstrada na secção 4.1.3) e que para o problema de uma partı́cula sem spin a
mover-se livremente no espaço de posições vários C.C.O.C. são
{X̂, Ŷ , Ẑ} ,
4.4.3
{P̂x , P̂y , P̂z } ,
{X̂, P̂y , P̂z } , . . .
(4.4.35)
Regras de Quantificação canónica
Consideremos um sistema clássico de uma partı́cula, descrito pelo ‘estado clássico’ {q(t), p(t)}.
A quantificação deste sistema é feita do seguinte modo:
i) O estado do sistema passa a ser interpretado como um vector |Ψi em E;
ii) Uma grandeza fı́sica mensurável, A(q, p, t) passa a ser um operador
A(q, p, t) → Â(X̂, P̂ , t) ,
(4.4.36)
onde, quando houver ambiguidade de ordem entre X̂ e P̂ a expressão deve ser
simetrizada, o que garante a hermiticiadade do operador;
iii) Impõem-se relações de comutação canónicas (em coordenadas cartesianas) entre a
observável associada à posição, X̂, e a observável associada ao seu momento canónico
conjugado, P̂ .
Exemplos:
4.4 Quantificação
127
• A quantidade fı́sica qp tem associado o operador
1
(X̂ P̂ + P̂ X̂) ,
2
(4.4.37)
que contem a simetrização necessária para evitar ambiguidades de ordem e garante
a hermiticidade necessária para ser observável;
• O momento angular
~ = ~x × p~ = (ypz − zpy , zpx − xpz , xpy − ypx ) ,
L
(4.4.38)
tem operador associado
~
L̂ = (L̂x , L̂y , L̂z ) = (Ŷ P̂z − Ẑ P̂y , Ẑ P̂x − X̂ P̂z , X̂ P̂y − Ŷ P̂x ) .
(4.4.39)
Usando as relações de comutação canónicas obtemos
[L̂x , L̂y ] = i~L̂z ,
[L̂y , L̂z ] = i~L̂x ,
[L̂z , L̂x ] = i~L̂y ,
(4.4.40)
que são as relações de comutação para o momento angular.
• Consideremos um sistema descrito pelo Lagrangiano
1
L = mq̇ 2 − V (q)
2
p=mq̇
⇒
H=
p2
+ V (q) .
2m
(4.4.41)
Quantificando, temos o operador Hamiltoniano
Ĥ =
P̂ 2
+ V (X̂) ,
2m
(4.4.42)
e as relações de comutação canónicas são
h
i
X̂, P̂ = i~1 ;
(4.4.43)
• Consideremos uma partı́cula sob a influência de um campo electromagnético
2
1
~ ~x)−qφ(t, ~x)
L = m~x˙ +q~x˙ ·A(t,
2
~
p
~=m~
x˙ +q A
⇒
H=
~ ~x))2
(~p − q A(t,
+qφ(t, ~x) . (4.4.44)
2m
128
Formalismo Matemático e Postulados da Mecânica Quântica
Quantificando, temos o operador Hamiltoniano
Ĥ =
~
~ ~
(P̂ − q Â(t, X̂))2
~
+ q φ̂(t, X̂) ,
2m
(4.4.45)
e as relações de comutação canónicas
[X̂ j , P̂k ] = i~δkj 1 .
(4.4.46)
No capı́tulo 5 estudaremos detalhadamente a quantificação canónica do oscilador harmónico
e do problema de Larmor. Em conclusão notamos que este método de quantificação não
pode ser aplicado a variáveis que não tenham análogo clássico. O exemplo óbvio é o spin,
que tem de ser definido directamente pelo operador associado.
4.4.4
Comentários sobre a evolução de um sistema quântico
A evolução de um sistema quântico é dada pela equação de Schrödinger
i~
d|Ψ(t)i
= Ĥ|Ψ(t)i .
dt
(4.4.47)
Vamos discutir algumas propriedades desta equação:
i) Determinista: dado o estado inicial |Ψ(t0 )i, o estado final |Ψ(t)i está totalmente determinado; o indeterminismo na mecânica quântica surge na altura da medição devido
ao colapso da função de onda;
ii) Linearidade, que é equivalente ao princı́pio de sobreposição;
iii) Conservação da probabilidade, isto é hΨ(t)|Ψ(t)i é constante na evolução devido à
hermiticidade do operador Hamiltoniano:
d
d
d
hΨ(t)|Ψ(t)i =
hΨ(t)| |Ψ(t)i + hΨ(t)|
|Ψ(t)i ,
dt
dt
dt
(4.4.48)
mas, pela equação de Schrödinger
d|Ψ(t)i
1
= Ĥ|Ψ(t)i
dt
i~
⇔
dhΨ(t)|
1
= − hΨ(t)|Ĥ .
dt
i~
(4.4.49)
Logo, (4.4.48) fica igual a zero, o que mostra que a norma da função de onda é
conservada.
4.4 Quantificação
129
Claro que na evolução do sistema poderá haver variações locais da densidade de probabilidade. Assumindo que a função de onda está normalizada,
Z
Z
P(~x, t)d~x =
Ψ(~x, t)∗ Ψ(~x, t)d~x ,
V
(4.4.50)
V
representa a probabilidade de a partı́cula estar num determinado volume V . Assim
Z
Z ∂
∂
d
∗
∗
P(~x, t)d~x =
Ψ(~x, t) Ψ(~x, t) + Ψ(~x, t)
Ψ(~x, t) d~x ,
(4.4.51)
dt V
∂t
∂t
V
ou, usando a equação de Schrödinger
Z
Z
i~
∗
∗
=
[−Ψ(~x, t)∆Ψ(~x, t) + Ψ(~x, t) ∆Ψ(~x, t)] d~x = −
∇ · J~(~x, t)d~x ,
2m V
V
(4.4.52)
onde definimos o vector densidade de corrente de probabilidade
~ x, t) = i~ [Ψ(~x, t)∇Ψ(~x, t)∗ − Ψ(~x, t)∗ ∇Ψ(~x, t)] .
J(~
2m
(4.4.53)
Assim temos
Z
V
∂
P(~x, t)d~x +
∂t
ou, como o volume é arbitrário
Z
V
~ x, t)d~x = 0 ,
∇ · J(~
∂
~ x, t) = 0 ,
P(~x, t) + ∇ · J(~
∂t
(4.4.54)
(4.4.55)
que é uma equação de continuidade para a probabilidade.
4.4.5
Evolução do valor médio de uma variável
Para um dado instante t, o valor médio de uma grandeza fı́sica A é dado por (4.4.9)
hÂi(t) = hΨ(t)|Â|Ψ(t)i .
(4.4.56)
Diferenciando
d
hÂi(t) =
dt
∂ Â
∂
∂
hΨ(t)| Â|Ψ(t)i + hΨ(t)|
|Ψ(t)i + hΨ(t)|Â
|Ψ(t)i ,
∂t
∂t
∂t
(4.4.57)
ou, usando a equação de Schrödinger
=
∂ Â
1
hΨ(t)|ÂĤ − Ĥ Â|Ψ(t)i + h
i(t) ,
i~
∂t
(4.4.58)
130
Formalismo Matemático e Postulados da Mecânica Quântica
de onde concluimos que
i
∂ Â
1 h
d
hÂi(t) = h i(t) + h Â, Ĥ i(t) .
dt
∂t
i~
(4.4.59)
Logo, a dinâmica do valor médio é a mesma da mecânica clássica (1.3.28). Tal como em
mecânica clássica, se a observável  não depender explicitamente do tempo e comutar
com o Hamiltoniano, o seu valor médio é uma constante do movimento. Note-se que os
parêntesis de Poisson desempenham o papel de comutador clássico.
Uma aplicação particular de (4.4.59) é aos operadores X̂ e P̂ para um sistema com
Hamiltoniano (4.4.42); aplicando a X̂ obtemos
#
"
i
i P̂
d
1 h
hP̂ i
1
P̂ 2
P̂ h
i = h X̂, P̂
X̂, P̂ i =
hX̂i = h X̂,
+
,
dt
i~
2m
i~
2m 2m
m
enquanto que notando que
h
i
série T aylor
P̂ , V̂ (X̂)
=
[P̂ , V0 1̂ + V1 X̂ + V2 X̂ 2 + V3 X̂ 3 + . . .]
dV̂ (X̂)
2
= −i~ V1 − 2V2 X̂ − 3V3 X̂ − . . . = −i~
dX̂
(4.4.60)
,
(4.4.61)
e aplicando a P̂ obtemos
i
d
1 h
1
dV̂ (X̂)
dV̂ (X̂)
hP̂ i = h P̂ , V̂ (X̂) i = h−i~
i = −h
i,
dt
i~
i~
dX̂
dX̂
(4.4.62)
que reproduzem as fórmulas clássicas
p
dx
=
,
dt
m
dp
dV (x)
=−
.
dt
dx
(4.4.63)
Estes resultados demonstram o teorema de Ehrenfest: “As equações de evolução dos valores
médios de um sistema quântico são formalmente idênticas às da mecânica clássica.”
Como tal, se os valores médios de observáveis derem uma boa descrição da fı́sica de
um sistema, a mecânica clássica fornece uma descrição satisfatória, que é o conteúdo do
princı́pio da correspondência. Por exemplo, a mecânica clássica só ‘vê’ a posição do centro
do trem de ondas; se a dispersão do mesmo for irreconhecı́vel nas experiências levadas a
cabo, a descrição da mecânica clássica será satisfatória.
4.5 Mecânica Quântica Estatı́stica
4.5
131
Mecânica Quântica Estatı́stica
O formalismo que desenvolvemos até ao momento consegue apenas fazer previsões probabilı́sticas relativamente aos resultados possı́veis em medições de um sistema quântico.
Contudo, este formalismo baseia-se em saber exactamente o estado quântico do sistema,
|Ψi, o que temos sempre assumido. Podemos, no entanto, imaginar situações em que
temos uma informação incompleta acerca do estado do sistema. Por exemplo, a energia
cinética de átomos emitidos por uma fornalha à temperatura T é conhecida apenas probabilisticamente, mesmo em mecânica clássica. De facto, tal como em Mecânica Clássica
Estatı́stica sabemos, por exemplo, a energia de uma partı́cula num sistema em equilı́brio
térmico apenas probabilisticamente através da distribuição de Boltzmann
P(E) ∼ e−E/KB T ,
(4.5.1)
em Mecânica Quântica Estatı́stica saberemos o estado em que uma partı́cula se encontra
apenas probabilisticamente. Existe uma mistura estatı́stica de estados, ou estado mistura.
Por oposição, um estado quântico perfeitamente conhecido é designado por estado puro.
Para compreender as alterações introduzidas se considerarmos uma mistura estatı́stica
de estados consideremos o seguinte exemplo. O nosso sistema quântico encontra-se no
estado mistura descrito por
|Ψi = a1 |αi + a2 |βi com probabilidade p1
,
(4.5.2)
′
|Ψ i = a3 |αi + a4 |βi com probabilidade p2
onde cada estado está normalizado
|a1 |2 + |a2 |2 = 1 ,
|a3 |2 + |a4 |2 = 1 ,
(4.5.3)
e p1 + p2 = 1. Uma pergunta natural é: “Qual a probabilidade de obter o valor próprio
associado a |αi ou |βi numa medição?” A resposta natural é
P(α) = p1 |a1 |2 + p2 |a3 |2 ,
P(β) = p1 |a2 |2 + p2 |a4 |2 ,
(4.5.4)
o que implica que
P(α) + P(β) = 1 .
(4.5.5)
132
Formalismo Matemático e Postulados da Mecânica Quântica
Note-se que esta resposta não é equivalente a considerar o novo estado
|Ψ̃i =
√
p1 |Ψi +
√
√
√
√
√
p2 |Ψ′ i = ( p1 a1 + p2 a3 ) |αi + ( p1 a2 + p2 a4 ) |βi ,
(4.5.6)
que, pelos postulados usuais implicaria que
√
p1 |a1 |2 + p2 |a3 |2 + p1 p2 (a1 a∗3 + a∗1 a3 )
.
P(α) = √
p1 p2 (a1 a∗3 + a∗1 a3 + a2 a∗4 + a4 a∗2 ) + 1
(4.5.7)
Neste caso existem termos de interferência, que não estão presentes na mistura estatı́stica
de estados.
Com este exemplo concluimos os seguintes dois factos:
• Uma mistura estatı́stica de estados quânticos |Ψ1 i . . . |Ψn i não pode ser expressa como
uma combinação linear destes estados quânticos
|Ψi =
6
n
X
i=1
χi |Ψi i ,
(4.5.8)
pois nesta combinação linear existiriam sempre termos de interferência entre os vários
estados |Ψi i no cálculo de probabilidades, termos que não estão presentes nas probabilidades da mistura estatı́stica. Mais concretamente, uma sobreposição linear de
estados puros
|Ψi = λ1 |Ψ1 i + λ2 |Ψ2 i ,
(4.5.9)
que é ainda um estado puro, tem um significado fı́sico diferente de uma mistura
estatı́stica de |λ1 |2 sistemas no estado |Ψ1 i com |λ2 |2 sistemas no estado |Ψ2 i, que é
um estado mistura.
• Na mecânica quântica estatı́stica existem dois nı́veis diferentes onde entra a probabilidade: i) no facto de a informação sobre o estado inicial ser probabilı́stica - semelhante
à mecânica clássica estatı́stica; ii) no facto da previsão de resultados de medições ser
probabilı́stica - puramente quântico.
Vamos agora introduzir um operador, denominado operador de densidade que unifica
a descrição de estados puros e estados mistura.
4.5 Mecânica Quântica Estatı́stica
4.5.1
133
O operador de densidade para um estado puro
Assumimos que temos um espaço de estados com uma base discreta, {|un i}, de modo que
um estado puro normalizado se escreve
X
|Ψ(t)i =
cn (t)|un i ,
n
X
n
|cn (t)|2 = 1 .
(4.5.10)
Introduzimos agora um operador construı́do com base no estado do sistema e que contem
a mesma informação que este: o operador densidade definido por
ρ̂(t) ≡ |Ψ(t)ihΨ(t)| .
(4.5.11)
Note-se que este operador depende do tempo. Consideremos algumas propriedades de ρ̂(t):
• Na base {|un i}, o operador de densidade é representado pela matriz de densidade:
ρmn (t) = hum |ρ̂(t)|un i = hum |Ψ(t)ihΨ(t)|uni = cm (t)c∗n (t) .
(4.5.12)
• A condição de normalização do estado quântico em termos do operador de densidade
fica
1 = hΨ(t)|Ψ(t)i =
ou seja
X
n
|cn |2 =
X
ρnn (t) = Tr(ρ̂(t)) ,
(4.5.13)
n
Tr(ρ̂(t)) = 1 .
• O valor médio de uma observável é
hÂi(t) = hΨ(t)|Â|Ψ(t)i =
=
X
n,p
ou seja
cp (t)c∗n (t)Anp
X
n,p
=
hΨ(t)|un ihun |Â|up ihup |Ψ(t)i
X
(4.5.14)
,
(4.5.15)
Anp ρpn (t) = Tr(Âρ̂(t))
n,p
hÂi(t) = Tr(Âρ̂(t)) = Tr(ρ̂(t)Â) .
• A evolução do operador de densidade é deduzida da equação de Schrödinger
(4.5.16)
1
d
d
1
d
ρ̂(t) =
(|Ψ(t)i) hΨ(t)| + |Ψ(t)i (hΨ(t)|) = Ĥ|Ψ(t)ihΨ(t)| − |Ψ(t)ihΨ(t)|Ĥ
dt
dt
dt
i~
i~
i
1 h
Ĥ, ρ(t) .
=
i~
(4.5.17)
134
Formalismo Matemático e Postulados da Mecânica Quântica
• A probabilidade de obter o valor próprio associado ao estado |un i, an , numa medição é:
P(an ) = hΨ(t)|un ihun |Ψ(t)i = hΨ(t)|P̂n |Ψ(t)i = Tr(ρ̂(t)P̂n ) ,
(4.5.18)
onde P̂n = |un ihun | é o operador de projecção (4.3.7).
• Pela definição ρ̂(t) é hermı́tico
ρ̂(t) = ρ̂(t)† .
(4.5.19)
• ρ̂(t) é um operador de projecção
ρ̂(t)2 = |Ψ(t)ihΨ(t)|Ψ(t)ihΨ(t)| = |Ψ(t)ihΨ(t)| = ρ̂(t) .
• Logo
(4.5.20)
Tr(ρ̂(t)2 ) = Tr(ρ̂(t)) = 1 .
(4.5.21)
Esta propriedade e a anterior só são válidas para um estado puro. Veremos que
não se verificam para uma mistura estatı́stica de estados e por isso podem funcionar
para testar se uma determinada matriz de densidade descreve um estado puro ou um
estado mistura.
Assim, para um estado puro, especificar o operador de densidade ou o próprio estado é
equivalente.
4.5.2
O operador de densidade para uma mistura estatı́stica de
estados
Consideremos agora uma mistura estatı́stica de estados
(
)
X
i
i
|Ψ i =
cn (t)|un i
com probabilidades
n
Definimos o operador de densidade como
X
X
ρ̂(t) ≡
pi |Ψi (t)ihΨi (t)| ≡
pi ρ̂i (t) .
i
i
p
.
(4.5.22)
(4.5.23)
i
Claramente (4.5.11) é o caso particular correspondente a p1 = 1 e pi = 0 quando i 6= 1,
ou seja um estado puro. Reconsideremos agora as propriedades do operador de densidade
vistas anteriormente:
4.5 Mecânica Quântica Estatı́stica
135
• Na base {|un i}, o operador de densidade é representado pela matriz de densidade, que
agora toma a forma:
ρmn (t) = hum|ρ̂(t)|un i = hum|
X
i
pi |Ψi (t)ihΨi (t)|un i =
X
pi ρimn (t) =
i
X
pi cim (t)cin (t)∗ .
i
(4.5.24)
Note-se que para n = m
ρnn (t) =
X
i
pi |cin (t)|2 ,
(4.5.25)
que é um número real positivo que nos dá a probabilidade de encontrarmos numa
medição o sistema no estado |un i, como demonstrará a relação (4.5.30). Assim, os
termos da diagonal da matriz de densidade designam-se por populações. Para n 6= m,
ρnm é um número complexo. Representa uma média (para todos os estados |Ψi i) de
termos de interferência entre |uin i e |uim i. Estes termos são designados por coerências.
• A condição de normalização dos vários estados quânticos na mistura fica, em termos do
operador de densidade
1 = hΨi (t)|Ψi (t)i =
X
n
|cin |2 =
X
ρinn (t) = Tr(ρ̂i (t)) ;
(4.5.26)
n
logo
1=
X
pi =
i
X
pi Tr(ρ̂i (t)) = Tr(ρ̂(t)) .
(4.5.27)
i
Ou seja temos ainda a condição (4.5.14).
• O valor médio de uma observável é
hÂi(t) =
X
n
an
X
i
i
i
p P (an )
!
=
X
i
pi
X
n
an P i (an ) =
= Tr(ρ̂(t)Â) ,
X
pi Tr(ρ̂i (t)Â)
i
(4.5.28)
que é ainda o mesmo resultado do caso puro (4.5.16).
• A evolução do operador de densidade é ainda dada pela equação do caso puro
i
d
1 h
Ĥ, ρ(t) .
(4.5.29)
ρ̂(t) =
dt
i~
136
Formalismo Matemático e Postulados da Mecânica Quântica
• A probabilidade de obter o valor próprio associado ao estado |un i, an , numa medição é:
P(an ) =
X
i
pi P i (an ) =
X
pi Tr(ρ̂i (t)P̂n ) = Tr(ρ̂(t)P̂n ) ,
(4.5.30)
i
recuperando o resultado do estado puro.
• Obviamente ρ̂(t) é ainda hermı́tico
• Em geral ρ̂(t) não é um operador de projecção:
ρ̂(t)2 =
X
i,j
pi pj |Ψi(t)ihΨi (t)|Ψj (t)ihΨj (t)| =
6 ρ̂(t) .
(4.5.31)
• Assim sendo calculemos o traço do quadrado de ρ̂(t):
Tr(ρ̂(t)2 ) =
X
n,m
=
X
pi pj
i,j
X
hun |ρ̂(t)|um ihum|ρ̂(t)|un i =
cjn (t)∗ cin (t)
X
cim (t)∗ cjm (t) =
X
m
n
≤
X
pp =
i,j
X
i
p
i
X
cin (t)cim (t)∗ cjm (t)cjn (t)∗
n,m
i,j
X
i,j
i j
pi pj
pi pj hΨj (t)|Ψi (t)ihΨi (t)|Ψj (t)i
X
pj = 1 ,
j
(4.5.32)
onde usamos a desigualdade de Schwarz
|hΨi (t)|Ψj (t)i| ≤
p
hΨi (t)|Ψi (t)ihΨj (t)|Ψj (t)i = 1 .
(4.5.33)
Deste modo
Tr(ρ̂(t)2 ) ≤ 1 ,
(4.5.34)
sendo a desigualdade saturada apenas para um estado puro. Vemos, tal como anunciado, que esta propriedade e a anterior distinguem a matriz de densidade de um
estado puro e de um estado mistura.
• Notemos ainda que o operador densidade é definido positivo; para um ket arbitrário |Φi
hΦ|ρ̂(t)|Φi =
X
i
pi hΦ|Ψi (t)ihΨi(t)|Φi =
X
i
pi |hΦ|Ψi (t)i|2 ≥ 0 .
(4.5.35)
4.5 Mecânica Quântica Estatı́stica
4.5.3
137
O operador de evolução e a evolução de um estado puro
Devido à linearidade e homogeneidade da equação de Schrödinger, existe um operador
linear, denominado operador de evolução que relaciona o estado inicial de um sistema
|Ψ(t0 )i com o estado do sistema num instante posterior |Ψ(t)i, através de
|Ψ(t)i = Û (t, t0 )|Ψ(t0 )i .
(4.5.36)
Û (t0 , t0 ) = 1̂ .
(4.5.37)
Obviamente
Substituindo na equação de Schrödinger
i~
d|Ψ(t)i
= Ĥ(t)|Ψ(t)i ⇔
dt
dÛ(t0 , t)
i
|Ψ(t0 )i = − Ĥ(t)Û (t0 , t)|Ψ(t0 )i .
dt
~
(4.5.38)
Em geral, usando a condição inicial (4.5.37), podemos escrever formalmente a solução desta
equação como
i
Û (t, t0 ) = 1̂ −
~
Z
t
Ĥ(t′ )Û (t′ , t0 )dt′ .
(4.5.39)
t0
No caso particular de um Hamiltoniano não depender do tempo (sistemas conservativos)
a solução explı́cita fica
Û(t, t0 ) = e−i(t−t0 )Ĥ/~ .
(4.5.40)
Uma importante propriedade da evolução de um sistema quântico é a conservação da
norma ou equivalentemente, a conservação da probabilidade. Logo requeremos que
hΨ(t0 )|Ψ(t0 )i = hΨ(t)|Ψ(t)i
⇔
hΨ(t0 )|Ψ(t0 )i = hΨ(t0 )|Û(t0 , t)† Û (t0 , t)|Ψ(t0 )i ,
(4.5.41)
ou seja
Û (t0 , t)† Û (t0 , t) = 1̂ ,
(4.5.42)
o operador de evolução deve ser unitário. Note-se que no caso de sistemas conservativos,
onde Û tem a forma (4.5.40) isso é garantido se o Hamiltoniano for Hermı́tico. Unitariedade
é uma importante propriedade em teorias quânticas. De um modo mais geral significa que
as probabilidades estão bem definidas e são conservadas. Tecnicamente, significa que o
138
Formalismo Matemático e Postulados da Mecânica Quântica
espaço de Hilbert é positivo definido (não há normas negativas) e o operador de evolução
é unitário.
Consideremos agora a evolução de um estado puro. A matriz de densidade pode-se
escrever
ρ̂(t) = |Ψ(t)ihΨ(t)| = Û (t0 , t)|Ψ(t0 )ihΨ(t0 )|Û (t0 , t)† = Û(t0 , t)ρ̂(t0 )Û(t0 , t)† .
(4.5.43)
Logo,
Tr(ρ̂(t)2 ) = Tr(Û(t0 , t)ρ̂(t0 )Û(t0 , t)† Û (t0 , t)ρ̂(t0 )Û (t0 , t)† ) ,
(4.5.44)
ou, usando a unitariedade do operador de evolução e a propriedade cı́clica do traço,
Tr(ρ̂(t)2 ) = Tr(ρ̂(t0 )2 ) = 1 ,
(4.5.45)
pela relação (4.5.21). Assim, num sistema quântico unitário um estado puro evolui sempre
para um estado puro.
Na década de 1970, Stephen Hawking mostrou que existe um processo quântico pelo
qual os buracos negros, que classicamente só absorvem, emitem radiação, denominada
radiação de Hawking. Esta radiação parecia ser, na aproximação usada por Hawking,
térmica, e como tal um estado mistura. Extrapolando o processo de Hawking até o buraco
negro desaparecer completamente devido à emissão de radiação, parece que o resultado
final seria a existência de apenas radiação térmica e como tal um estado mistura. Por
outro lado, o buraco negro poderia ter sido formado pelo colapso gravitacional de estados
puros. Hawking concluiu que, em gravitação quântica, a evolução não poderia ser unitária,
pois estados puros poderiam evoluir para estados mistura. Esta aparente contradição entre
gravitação quântica e um princı́pio fundamental da teoria quântica foi baptizado de ‘paradoxo da informação’. Embora o problema não esteja completamente resolvido, acredita-se
hoje, que a unitariedade é também válida em gravitação quântica e a aproximação usada
por Hawking não estava correcta.
4.6 Sumário
4.6
139
Sumário
Estabelecemos a linguagem da mecânica quântica que é uma linguagem de estados e
operadores cuja representação abstracta se faz na notação de Dirac. Em muitos problemas concretos escolhem-se bases discretas para os representar como vectores e matrizes
respectivamente. Daı́ a designação deste formalismo por mecânica matricial de Heisenberg. Este formalismo é muito apropriado para lidar com graus de liberdade abstractos
que vivem em espaços vectoriais internos, como o spin ou a polarização de fotões como será
visto em Mecânica Quântica II. Numa ‘base’ contı́nua como a representação |xi o estado
do sistema |Ψ(t)i tem como componentes a função de onda do capı́tulo 3, Ψ(~x, t). Assim
o formalismo geral faz o contacto com a mecânica ondulatória de Schrödinger do capı́tulo
3, que como vimos é intuitiva dado usar a bem conhecida fı́sica das ondas.
Estabelecemos um conjunto de postulados que podem ser vistos como as regras básicas
do formalismo quântico e aprendemos a usar essas regras num sistema clássico através da
quantificação deste. Em particular discutimos que a representação matemática do princı́pio
da incerteza de Heisenberg no formalismo de operadores aparece na forma de operadores
que não comutam. Notamos também que os valores médios das grandezas fı́sicas num
sistema quântico se comportam como as grandezas clássicas do capı́tulo 1 estabelecendo
um princı́pio de correspondência entre a mecânica quântica e a sua aproximação clássica.
Discutimos mecânica quântica estatı́stica em que o estado do sistema só é conhecido probabilisticamente. Isto levou-nos a distinguir estados puros e estados mistura, mas pela
introdução da matriz de densidade podem ambos os tipos ser tratados de um modo unificado. Finalmente vimos que uma evolução unitária não pode transformar um estado puro
num estado mistura.
CAPÍTULO
5
Exemplos de Quantificação Canónica
Neste capı́tulo vamos voltar ao problema do oscilador harmónico e ao problema de Larmor
tratados no capı́tulo 1, usando as regras do capı́tulo 4 para os tratar como problemas
quânticos.
5.1
Oscilador Harmónico Quântico em Uma Dimensão
Na secção 4.4.3 vimos a forma do operador Hamiltoniano para um sistema com Hamiltoniano clássico dado por H = Ecin + Epot . Especializando para o potencial do oscilador
harmónico, obtemos o operador Hamiltoniano
Ĥ =
P̂ 2
mω 2 2
X̂ ,
+
2m
2
(5.1.1)
e, usando as regras de quantificação canónica impomos as relações de comutação
h
i
X̂, P̂ = i~1̂ .
(5.1.2)
Dada a forma do potencial (figura 1.3) naturalmente teremos estados ligados, pelo que
esperamos que o conjunto de estados seja discreto, correspondendo ao facto de as energias
possı́veis estarem quantificadas. O nosso objectivo é encontrar os valores próprios En e
142
Exemplos de Quantificação Canónica
funções próprias |ni da equação de Schrödinger independente do tempo
Ĥ|ni = En |ni .
(5.1.3)
Introduzimos os operadores â e o seu adjunto ↠(note-se que não são operadores hermı́ticos)
r
r
i
1
i
mω
mω
1
†
X̂ + √
X̂ − √
P̂ ,
â = √
P̂ ,
(5.1.4)
â = √
~
~
2
2
mω~
mω~
que são designados, respectivamente, por operador de destruição e operador de criação.
Calculando o seu produto obtemos
i
1 mω 2
1
ih
†
2
â â =
X̂ +
P̂ +
X̂, P̂
2
~
mω~
~
⇔
↠â =
1̂
1
Ĥ − ,
~ω
2
(5.1.5)
ou, equivalentemente
1̂
Ĥ = ~ω N̂ +
2
!
.
(5.1.6)
onde definimos o operador de número N̂ ≡ ↠â, que é hermı́tico, o que é consistente com o
facto de o Hamiltoniano também o ser. Note-se que a tradução para os operadores â e â†
da relação de comutação é
1 [â, â ] =
−i[X̂, P̂ ] + i[P̂ , X̂] ,
2~
(5.1.7)
[â, ↠] = 1̂ .
(5.1.8)
†
ou seja
Calculemos também os comutadores entre o operador de número N̂ e os operadores de
criação e destruição:
5.1.1
[N̂ , â] = [↠â, â] = [↠, â]â + ↠[â, â] = −â ,
(5.1.9)
[N̂ , ↠] = [↠â, ↠] = [↠, ↠]â + ↠[â, ↠] = ↠.
(5.1.10)
O espectro de energia do Oscilador Harmónico Quântico
As grandezas fı́sicas que associamos ao oscilador harmónico são a posição, momento e
energia. Como os seus operadores associados X̂, P̂ , Ĥ não comutam, o C.C.O.C. contem
5.1 Oscilador Harmónico Quântico em Uma Dimensão
143
apenas uma destas quantidades, que escolhemos ser a energia, ou, equivalentemente, o
operador de número N̂
C.C.O.C. = {N̂} .
(5.1.11)
Assim, vamos escrever o estado do sistema usando como base os vectores próprios do operador de número, denotados por |ni, cujos valores próprios irão ser números inteiros que
servem de rótulo para os vectores próprios. Os vectores do conjunto {|ni} são necessariamente ortogonais, mas para já nada assumiremos acerca da sua normalização. A energia
do estado próprio |ni é dada por (5.1.3), o que implica que
hn|Ĥ|ni
= ~ω
En =
hn|ni
hn|↠â|ni 1
+
hn|ni
2
= ~ω
||â|ni||2 1
+
hn|ni
2
≥
~ω
.
2
(5.1.12)
Assim, existe um estado de energia mı́nima para o oscilador harmónico, dito o estado
fundamental ou “vácuo”, que vamos rotular com n = 0 e definido por
â|0i = 0
⇒
E0 =
~ω
.
2
(5.1.13)
Desde já notamos uma diferença fundamental com a mecânica clássica: o estado fundamental não tem energia zero - como em mecânica clássica - mas antes E0 = ~ω/2, designada
energia do ponto zero. Este facto está intrinsecamente ligado ao princı́pio da incerteza; uma
energia nula do estado fundamental implicaria uma partı́cula congelada em x = 0 = p; mas
pelo princı́pio da incerteza isso não pode acontecer. De facto, podemos encontrar o valor
(5.1.13) minimizando a expressão clássica da energia com a condição de que xp = ~/2:
E(x, p) =
p2
mω 2 2
+
x
2m
2
xp=~/2
⇔
E(x) =
~2
mω 2 2
+
x ,
8mx2
2
(5.1.14)
que extremizando
0=
dE
~2
=−
+ mω 2 x
dx
4mx3
⇔
x2 =
~
,
2mω
(5.1.15)
valor para o qual a energia do oscilador harmónico é E = ~ω/2. Existe evidência experimental para a existência da energia do ponto zero e até mesmo uma manifestação
macroscópica:o efeito Casimir em teoria quântica de campo.
144
Exemplos de Quantificação Canónica
A acção do operador de destruição no estado fundamental aniquila-o. Logo, o estado
fundamental é um vector próprio de N̂ com valor próprio zero. Consideremos agora o
estado obtido pela acção no estado fundamental do operador de criação, ↠|0i. Actuando
com N̂
N̂ ↠|0i = [N̂ , ↠] + ↠N̂ |0i = ↠+ ↠N̂ |0i = ↠|0i ,
(5.1.16)
|1i ≡ ↠|0i .
(5.1.17)
N̂ ↠|1i = ↠+ ↠N̂ |1i = 2↠|1i ,
(5.1.18)
ou seja, ↠|0i é um estado próprio de N̂ com valor próprio 1; assim, denotamos
Analogamente
ou seja, ↠|1i ≡ |2i é vector próprio de N̂ com valor próprio 2. O padrão que descobrimos
pode ser agora sistematizado:
Teorema: Seja |ni um vector próprio de N̂ com valor próprio n ∈ N0 . Logo
i) |ni tem energia
1
En = ~ω n +
2
;
(5.1.19)
ii) ↠|ni ≡ |n + 1i é um vector próprio de N̂ com valor próprio n + 1;
iii) â|ni = n|n − 1i é vector próprio de N̂ com valor próprio n − 1 (note-se a consistência
com â|0i = 0).
Demonstração:
i) A energia é o valor próprio de Ĥ. Logo
1̂
Ĥ|ni = ~ω N̂ +
2
!
1
|ni = ~ω n +
|ni ,
2
(5.1.20)
de onde concluimos que a energia do estado |ni é dada por (5.1.19). Este é o espectro
de energia do oscilador harmónico, que como esperado exibe quantificação de energia
- figura 5.1;
5.1 Oscilador Harmónico Quântico em Uma Dimensão
145
E
V(x)
5~ω/2
3~ω/2
~ω/2
x
Figura 5.1: Nı́veis de energia permitidos para o oscilador harmónico quântico, marcados
pelas linhas horizontais, correspondentes à relação (5.1.19).
ii)
†
N̂ |n+1i = N̂ â |ni
(5.1.10)
=
†
â
1̂ + N̂ |ni = (n+1)↠|ni = (n+1)|n+1i , (5.1.21)
o que mostra que |n + 1i é um vector próprio de N̂ com valor próprio n + 1;
iii)
nN̂ |n−1i = N̂ â|ni
(5.1.9)
=
â N̂ − 1̂ |ni = (n−1)â|ni = n(n−1)|n−1i , (5.1.22)
o que mostra que |n − 1i é um vector próprio de N̂ com valor próprio n − 1. (q.e.d.)
Note-se que no ponto iii), o factor de n tem que aparecer por consistência; de facto
|ni = ↠|n − 1i ⇒ â|ni = â↠|n − 1i = (N̂ + 1̂)|n − 1i = n|n − 1i .
(5.1.23)
Deste modo compreendemos a terminologia que introduzimos: o operador de Número
dá-nos o número de quantões de energia no estado que estamos a considerar; o operador de
criação/destruição transformam um dado estado num outro com mais/menos um quantão
de energia.
Finalmente discutamos a normalização dos estados {|ni}. Vamos assumir que |0i está
normalizado, h0|0i = 1. Logo
h1|1i = h0|â↠|0i = h0|1̂ + N̂|0i = 1 ,
(5.1.24)
o que mostra que |1i também está normalizado, mas
h2|2i = h1|â↠|1i = h1|1̂ + N̂|1i = 2 ,
(5.1.25)
146
Exemplos de Quantificação Canónica
que já não está normalizado. Mostremos por indução matemática que
hn|ni = n! :
(5.1.26)
Acabamos de mostrar que este resultado é verdade para n = 1. Assumindo (5.1.26)
consideramos
hn + 1|n + 1i = hn|â↠|ni = hn|1̂ + N̂ |ni = (n + 1)hn|ni = (n + 1)! ,
(5.1.27)
o que prova a tese. Assim introduzimos a base ortonormalizada no espaço de estados
{|Φn i} definidos como
|ni
|Φn i ≡ √ ,
n!
(5.1.28)
hΦn |Φm i = δnm .
(5.1.29)
e obedecendo a
Notemos que, em termos destes estados normalizados,
↠|ni = |n + 1i
↠|Φn i =
⇔
√
n + 1|Φn+1 i ,
(5.1.30)
√
(5.1.31)
e de um modo semelhante
â|ni = n|n − 1i
5.1.2
⇔
â|Φn i =
n|Φn−1 i .
As funções de onda para o oscilador harmónico
O grau de liberdade primordial do oscilador harmónico é a sua posição espacial. Logo,
estamos interessados em conhecer as funções de onda no espaço de configurações, Φn (x),
que estão associadas aos estados normalizados |Φn i. Estas funções de onda dizem-nos,
como habitualmente, a amplitude de probabilidade espacial para encontrar a partı́cula
quântica que se encontra nesse estado |Φn i. A conversão de |Φn i para Φn (x) faz-se usando
a representação |xi da secção 4.4.2; Φn (x) são vistos como as componentes da expansão da
função de onda nesta base:
|Φn i =
Z
dxΦn (x)|xi .
(5.1.32)
5.1 Oscilador Harmónico Quântico em Uma Dimensão
147
Vamos agora construir explicitamente essas funções de onda. Começamos pelo vácuo, que
é definido por
â|0i = 0
⇔
â|Φ0 i = 0
⇔
1
√
2
r
mω
i
P̂
X̂ + √
~
mω~
|Φ0 i = 0 .
(5.1.33)
Usando a representação |xi, isto é projectando esta equação num bra hx|:
r
r
d
mω
i
mω
~
(4.4.24),(4.4.25)
hx|P̂ |Φ0 i = 0
⇔
hx|X̂|Φ0 i+ √
xhx|Φ0 i+ √
hx|Φ0 i = 0 ,
~
~
mω~
mω~ dx
(5.1.34)
ou, finalmente, usando a tabela da secção 4.4.2 e a expansão (5.1.32) temos hx|Φ0 i = Φ0 (x)
e como tal
d
mω
+
x Φ0 (x) = 0 .
dx
~
(5.1.35)
A solução desta equação diferencial de primeira ordem é
mω
2
Φ0 (x) = C0 e− 2~ x ,
(5.1.36)
onde tomamos a constante de integração como
mω 1/4
C0 =
,
π~
(5.1.37)
de modo que a função de onda Φ0 (x) esteja normalizada, pois o estado |Φ0 i está normalizado. Note-se que a solução normalizada é única e por isso o estado fundamental é não
degenerado.
Na prática, (5.1.35) resultou de (5.1.33) pelas substituições
d
(X̂, P̂ , |Φn i) −→
x, −i~ , Φn (x) ,
dx
(5.1.38)
com n = 0. Com isto em mente construimos as funções de onda para os próximos estados
do seguinte modo:
√
†
n + 1|Φn+1 i = â |Φn i
⇔
√
1
n + 1|Φn+1 i = √
2
r
ou, usando a nossa substituição (5.1.38)
s
mω
d
~
Φn+1 (x) =
Φn (x) ,
x−
2mω(n + 1)
~
dx
mω
i
P̂
X̂ − √
~
mω~
n ∈ N0 .
|Φn i ,
(5.1.39)
(5.1.40)
148
Exemplos de Quantificação Canónica
Deste modo, obtemos para Φ1 (x)
r
2mω − mω x2
xe 2~ ,
~
(5.1.41)
mω 2
2mω 2
x − 1 e− 2~ x .
~
(5.1.42)
Φ1 (x) = C0
e para Φ2 (x)
C0
Φ2 (x) = √
2
É agora fácil de concluir que todas as funções de onda são do tipo
r
mω
−χ2 /2
x,
Φn (χ) = Cn Hn (χ)e
,
χ≡
~
(5.1.43)
onde Cn é uma constante e Hn é um polinómio de grau n e com paridade bem definida
(−1)n (1=par, −1=ı́mpar). Usando esta forma para a função de onda em (5.1.40) obtemos
d 1
2
−χ2 /2
χ−
(5.1.44)
Cn Hn (χ)e−χ /2 ,
Cn+1 Hn+1 (χ)e
=p
dχ
2(n + 1)
que é obedecido escolhendo
Cn
Cn+1 = p
,
2(n + 1)
Hn+1 (χ) = 2χHn (χ) −
d
Hn (χ) .
dχ
(5.1.45)
A fórmula de recorrência para os polinómios define os polinómios de Hermite. Os quatro
primeiros são
H0 = 1 ,
H1 = 2χ ,
H2 = 4χ2 − 2 ,
H3 = 8χ3 − 12χ .
(5.1.46)
Resumimos a situação respeitante aos primeiros estados estacionários (dado que o estado
Φn tem energia constante) do oscilador harmónico na seguinte tabela:
Estado Normalizado Componentes na representação |xi Paridade
2 /2
|Φ0 i = |0i
Φ0 (χ) = C0 e−χ
|Φ1 i = |1i
√
|Φ2 i = |2i/ 2
√
|Φ3 i = |3i/ 3!
Φ1 (χ) = C1 (2χ)e−χ
...
2 /2
Φ2 (χ) = C2 (4χ2 − 2)e−χ
2 /2
Φ3 (χ) = C3 (8χ3 − 12χ)e−χ
...
2 /2
Energia
Par
~ω/2
Ímpar
3~ω/2
Par
5~ω/2
Ímpar
7~ω/2
...
...
5.1 Oscilador Harmónico Quântico em Uma Dimensão
149
Figura 5.2: Funções de onda para n = 0, 1, 2 e n = 10 do oscilador Harmónico e as
respectivas densidades de probabilidade. Na notação da figura Φn = ϕn . (Extraı́do de
Cohen et al, ‘Quantum Mechanics’).
Note-se que para cada nı́vel de energia a função de onda (normalizada) é única, pelo
que o espectro é não degenerado. Na figura 5.2 representamos as funções de onda para os
nı́veis n = 0, 1, 2 e n = 10.
Concluimos com o comentário de que se pode mostrar matematicamente que as funções
{Φn (x)} formam uma base do espaço de funções sobre R, que é necessário para que N̂ e
Ĥ seja observáveis.
5.1.3
Resolução directa da equação de Schrödinger
À semelhança do que fizemos no capı́tulo 3, podı́amos ter procurado os estados estacionários
resolvendo directamente a equação de Schrödinger. Tomando a função de onda
Ψ(x, t) = Φ(x)e−iEt/~ ,
(5.1.47)
150
Exemplos de Quantificação Canónica
obtinhamos a equação para a função de onda espacial (3.2.5) especializada para o potencial
do oscilador harmónico
mω 2 2
~2 d 2
+
x Φ(x) = EΦ(x) .
−
2m dx2
2
(5.1.48)
Como da nossa análise da secção anterior já sabemos a resposta, usamos como ansatz a
forma
mω
2
Φ(x) = f (x)e− 2~ x ,
(5.1.49)
de modo a que (5.1.48) toma a forma
2mω ′
2m
f (x) −
xf (x) + 2
~
~
′′
~ω
E−
2
f (x) = 0 .
(5.1.50)
Procuremos uma solução como uma série de potências:
f (x) =
∞
X
n
an x
n=0
⇒
′
f (x) =
∞
X
n−1
nan x
⇒
n=0
′′
f (x) =
∞
X
n=0
n(n − 1)an xn−2 , (5.1.51)
de modo que a equação diferencial para f (x) fica
∞ X
1
2m
an xn = 0 .
(n + 2)(n + 1)an+2 + 2 E − ~ω n +
~
2
n=0
(5.1.52)
Para a equação ser obedecida para todo o x todos os termos na série têm de ser zero;
obtemos portanto a relação de recorrência
(n + 2)(n + 1)an+2
2m
= 2
~
1
− E an .
~ω n +
2
(5.1.53)
Para compararmos com a análise da secção anterior é conveniente usar a variável χ introduzida em (5.1.43). Em termos desta variável
f (x) =
∞
X
n=0
n
an x
→ f (χ) =
∞
X
n
bn χ ,
n=0
com bn =
~
mω
n/2
an .
(5.1.54)
A relação de recorrência fica
(n + 2)(n + 1)bn+2
2E
bn .
= 2n + 1 −
~ω
(5.1.55)
5.1 Oscilador Harmónico Quântico em Uma Dimensão
151
Vamos assumir que a série é finita; voltaremos a este ponto mais em baixo. Para a série
ser finita é necessário que o coeficiente do bn se torne zero para algum n; isto restringe os
valores possı́veis para a energia; existe um n0 ∈ N0 para o qual
2E
= 2n0 + 1 ,
~ω
(5.1.56)
o que não é mais do que o nosso espectro de energias. Obtemos assim a quantificação da
energia, usando directamente a equação de Schrödinger
~ω 3~ω 5~ω 7~ω
,
,
,
, . . . , para n0 = (0, 1, 2, . . .) .
En0 =
2
2
2
2
(5.1.57)
Deste modo a relação de recorrência para o polinómio fn0 (χ) fica
(n + 2)(n + 1)bn+2 = 2(n − n0 )bn .
(5.1.58)
Como a relação de recorrência relaciona termos de ordem par ou termos de ordem ı́mpar,
para a série ser finita, temos de tomar unicamente os termos com a paridade de n0 . Assim
temos
• Para n0 = 0 a série só tem o termo b0 cujo valor é arbitrário; tomamos b0 = 1; o
polinómio correspondente é
f0 (χ) = 1 ;
(5.1.59)
• Para n0 = 1 a série só tem o termo b1 cujo valor é arbitrário; tomamos b1 = 2; o
polinómio correspondente é
f1 (χ) = 2χ ;
(5.1.60)
• Para n0 = 2 a série tem o termo b0 = 1 e b2 = −2; o polinómio correspondente é
f2 (χ) = 1 − 2χ2 ;
(5.1.61)
• Para n0 = 3 a série tem o termo b1 = 2 e b3 = −4/3; o polinómio correspondente é
4
f3 (χ) = 2χ − χ3 ;
3
(5.1.62)
152
Exemplos de Quantificação Canónica
etc.
Claro que estes polinómios são todos proporcionais aos polinómios de Hermite,
fn0 (χ) ∝ Hn0 (χ). De facto, a série (5.1.58) define o polinómio de Hermite Hn0 . Obtemos deste modo tanto o espectro de energias como as funções de onda da secção anterior.
Falta-nos justificar a hipótese fundamental de que a série (5.1.53) tem de ser finita.
Esta condição surge de requerer que a função de onda seja normalizável. De facto, as
funções de onda tomam a forma

∞
X
n
an x


n=0
Ψ(x, t) = e−iEt/~ 
 mω
x2
 e 2~
Podemos escrever
mωx2 /(2~)
e
=
∞
X
cn xn ,
com c2n =
n=0



 .


mω n 1
,
2~
n!
(5.1.63)
(5.1.64)
e como tal
c2n+2 mω 1
=
c2n
2~ n + 1
n→∞
≃
mω
,
2~n
(5.1.65)
enquanto que por (5.1.53)
an+2
an
n→∞
≃
2mω
.
~n
(5.1.66)
mω
.
~n
(5.1.67)
Assim, se tomarmos a parte par da série dos an ,
a2n+2
a2n
n→∞
≃
Concluimos que para n suficientemente grande
a2n+2
c2n+2
>
,
a2n
c2n
(5.1.68)
pelo que a divisão das duas séries não poderá tender para zero quando |x| → ∞ e como tal
o módulo da função de onda (5.1.63) não irá tender para zero o que implica que a função
de onda não será normalizável. Se a série dos an tiver apenas parte ı́mpar podemos ainda
majorar a série dos cn extraindo portanto a mesma conclusão relativa à normalização da
função de onda.
5.1 Oscilador Harmónico Quântico em Uma Dimensão
5.1.4
153
Valor médio e desvio padrão de x e p
Usando (5.1.4) expressamos os operadores posição e momento X̂ e P̂ em termos dos operadores de criação e destruição:
r
~
X̂ =
↠+ â ,
2mω
r
P̂ = i
mω~ †
â − â .
2
(5.1.69)
Note-se a hermiticidade de P̂ e X̂. Logo, a acção destes operadores num estado estacionário
é
r
√
~ √
n + 1|Φn+1 i + n|Φn−1 i ,
2mω
r
√
mω~ √
n + 1|Φn+1 i − n|Φn−1 i ,
P̂ |Φn i = i
2
X̂|Φn i =
(5.1.70)
(5.1.71)
e como tal obtemos os elementos de matriz
hX̂i = hΦn |X̂|Φn i = 0 = hΦn |P̂ |Φn i = hP̂ i .
(5.1.72)
Assim concluimos que o valor médio da posição e do momento são zero em qualquer estado
estacionário. O desvio padrão é calculado pela expressão (4.4.8):
1
n+
,
2
(5.1.73)
mω~
1
2
2
2
2
† 2
†
†
(∆p) = hP̂ i = hΦn |P̂ |Φn i = −
,
hΦn |â + (â ) − ââ − â â|Φn i = mω~ n +
2
2
(5.1.74)
~
~
hΦn |â2 + (↠)2 + â↠+ ↠â|Φn i =
(∆x) = hX̂ i = hΦn |X̂ |Φn i =
2mω
mω
2
2
2
onde a contribuição não trivial vem dos termos â↠e ↠â usando (5.1.30) e (5.1.31). Logo
~
1
∆x∆p = ~ n +
≥ ,
(5.1.75)
2
2
em concordância com o princı́pio de incerteza. Os estados estacionários |Ψn i não têm
equivalente clássico, dado que têm valores médios zero para momento e posição e ao mesmo
tempo energia diferente de zero. Pelo teorema de Ehrenfest os valores médios hX̂i e hP̂ i correspondem às variáveis clássicas e a única situção em que um oscilador harmónico clássico
tem x(t) = 0 = p(t) é quando tem energia nula. Contudo, sobrepondo estados estacionários podemos construir estados cuja média se comporta como um oscilador clássico.
154
Exemplos de Quantificação Canónica
Seja o estado inicial dado pela sobreposição
|Ψ(0)i =
No instante t,
|Ψ(t)i =
∞
X
n=0
∞
X
n=0
cn (0)|Φn i .
cn (0)e−iEn t/~|Φn i =
∞
X
n=0
(5.1.76)
cn (0)e−iω(n+1/2)t |Φn i .
(5.1.77)
Logo obtemos para o valor médio de X̂, hX̂i(t) = hΨ(t)|X̂|Ψ(t)i,
r
∞ ∞
√
√
~ XX
∗
iω(m−n)t
hΦm |cm (0)cn (0)e
n + 1|Φn+1 i + n|Φn−1 i ,
hX̂i(t) =
2mω n=0 m=0
r
∞ ∞
√
√
~ XX ∗
n + 1δm,n+1 + nδm,n−1 ,
=
cm (0)cn (0)eiω(m−n)t
2mω n=0 m=0
!
" ∞
#
!
r
∞
X
X
√
√
~
n + 1cn (0)c∗n+1 (0) eiωt +
ncn (0)c∗n−1 (0) e−iωt .
=
2mω
n=0
n=0
(5.1.78)
Note-se que se apenas um dos cn (0) for não nulo então obtemos imediatamente hX̂i(t) = 0,
tal como discutido anteriormente. Se definirmos
∞
X
√
n + 1cn (0)c∗n+1 (0) ,
z≡
(5.1.79)
n=0
então
∗
z =
∞
X
√
n+
1c∗n (0)cn+1 (0)
m≡n+1
=
∞
X
√
m=1
n=0
mc∗m−1 (0)cm (0)
=
∞
X
√
mcm (0)c∗m−1 (0) ,
m=0
(5.1.80)
reescrevemos (5.1.78) como
r
~
zeiωt + z ∗ e−iωt ,
(5.1.81)
2mω
p
ou, expressando o número complexo z = mω/(2~)Aeiφ0 , onde A e φ0 são números reais,
hX̂i(t) =
temos
ei(ωt+φ0 ) + e−i(ωt+φ0 )
= A cos(ωt + φ0 ) .
(5.1.82)
hX̂i(t) = A
2
Assim, o valor médio de uma sobreposição de estados estacionários do oscilador harmónico
quântico evolui de acordo com a teoria do oscilador clássico (1.1.6), em concordância com
o teorema da correspondência de Ehrenfest.
5.2 O Oscilador Harmónico Quântico em Duas Dimensões
5.2
155
O Oscilador Harmónico Quântico em Duas Dimensões
O Hamiltoniano clássico para um oscilador harmónico isotrópico em duas dimensões é
Hxy =
p2x + p2y µω 2 2
+
(x + y 2 ) .
2µ
2
(5.2.1)
A partir de agora designamos por ‘µ’ a massa da partı́cula. As trajectórias que resolvem
o problema clássico são

 x(t) = xM cos(ωt − φx )
,
(5.2.2)
 y(t) = y cos(ωt − φ )
M
y
onde xM , yM , φx , φy são constantes de integração. O movimento geral é elı́ptico, dependendo dos detalhes da diferença de fase φy − φx :
φy − φx = −π
movimento linear na direcção x = −y
0 > φy − φx > −π
movimento retrógrado na elipse
φy − φx = 0
movimento linear na direcção x = y
π > φy − φx > 0
movimento directo na elipse
φy − φx = +π
movimento linear na direcção x = −y
Por quantificação canónica introduzimos o operador Hamiltoniano
i
P̂ 2 + P̂22 µω 2 h 1 2
Ĥxy = 1
(X̂ ) + (X̂ 2 )2 ,
+
2µ
2
(5.2.3)
onde X̂ 1 e X̂ 2 são as observáveis associadas às grandezas fı́sicas x e y sendo P̂1 e P̂2 os
seus momentos canónicos conjugados. As relações canónicas de comutação são
[X̂ k , P̂j ] = i~δjk .
5.2.1
(5.2.4)
Quantões lineares
Claramente, temos duas cópias de tudo o que fizemos na secção 5.1. Definindo os operadores
de criação â†1 , â†2 e destruição como â1 , â2
r
r
µω j
µω j
1
i
1
i
†
âj = √
X̂ + √
P̂j ,
âj = √
X̂ − √
P̂j ,
~
~
µω~
µω~
2
2
j = 1, 2
(5.2.5)
156
Exemplos de Quantificação Canónica
obtemos
Ĥxy = ~ω N̂1 + N̂2 + 1 ,
(5.2.6)
com os operadores de número sendo N̂j = â†j âj . As únicas relações de comutação não
triviais entre estes operadores de criação e destruição são
h
i
âi , â†j = δij 1̂ .
(5.2.7)
Claramente podemos tomar como C.C.O.C.
n
o
C.C.O.C = N̂1 , N̂2 ,
(5.2.8)
pelo que a base para o nosso espaço de estados será o conjunto de kets {|n1 , n2 i}, com {n1 }
e {n2 } sendo o espectro de N̂1 e N̂2 respectivamente. O espectro de energias será
E(n1 ,n2 ) = ~ω(n1 + n2 + 1) ,
(5.2.9)
e as funções de onda para os estados estacionários serão simplesmente
Ψ(n1 ,n2 ) (t, x, y) = Φn1 (x)Φn2 (y)e−iE(n1 ,n2 ) t/~ ,
(5.2.10)
onde Φn é dado por (5.1.43). Note que o espectro é degenerado.
5.2.2
Quantões circulares
O potencial do oscilador harmónico isotrópico em duas dimensões é invariante por rotações
em torno do eixo Oz. É por isso natural considerarmos o operador momento angular
segundo z; por (4.4.39)
L̂z = X̂ 1 P̂2 −X̂ 2 P̂1
(5.1.69)
=
i
i
h
i~ h †
(â1 + â1 )(â†2 − â2 ) − (â†2 + â2 )(â†1 − â1 ) = i~ â1 â†2 − â†1 â2 .
2
(5.2.11)
Vemos facilmente que L̂z comuta com Ĥxy :
h
i
h
i
h
i
N̂1 + N̂2 , L̂z = i~ N̂1 , â1 â†2 − â†1 â2 + i~ N̂2 , â1 â†2 − â†1 â2
= i~(−â1 â†2 − â†1 â2 + â1 â†2 + â†1 â2 ) = 0
.
(5.2.12)
5.2 O Oscilador Harmónico Quântico em Duas Dimensões
157
n
o
Assim, em vez de usarmos N̂1 , N̂2 poderiamos escolher como C.C.O.C.
n
o
C.C.O.C. = L̂z , Ĥxy .
(5.2.13)
Para o fazermos é útil introduzirmos os operadores de criação e destruição circulares:1
1
âd = √ (â1 − iâ2 ) ,
2
1
âe = √ (â1 + iâ2 ) ,
2
(5.2.14)
e os seus adjuntos â†d , â†e ; os únicos comutadores não triviais são:
[âd , â†d ] = 1 = [âe , â†e ] .
(5.2.15)
Facilmente vemos que
â†d âd
1 †
†
†
†
=
â â1 + â2 â2 − iâ1 â2 + iâ2 â1 ,
2 1
â†e âe
1 †
†
†
†
=
â â1 + â2 â2 + iâ1 â2 − iâ2 â1 .
2 1
(5.2.16)
Definindo os operadores de número circulares
N̂d = â†d âd ,
temos
N̂e = â†e âe ,

 Ĥxy = ~ω N̂d + N̂e + 1

(5.2.17)
.
(5.2.18)
L̂z = ~(N̂d − N̂e )
Podemos pois como uma outra hipótese tomar como C.C.O.C.
n
o
C.C.O.C. = N̂e , N̂d ,
(5.2.19)
e rotular a base no nosso espaço de estados como {|ne , nd i}. Os espectros da energia e (da
componente z) do momento angular são
E(ne ,nd ) = ~ω(nd + ne + 1) ≡ ~ω(n + 1) ,
lz = ~(nd − ne ) ≡ ~m .
(5.2.20)
Nestas relações definimos n ≡ nd + ne e m ≡ nd − ne . Podemos agora compreender a
terminologia de quantões circulares. O operador â†d (â†e ) adiciona ao estado um quantão de
1
Os sub-ı́ndices d e e significam ‘direita’ e ‘esquerda’.
158
Exemplos de Quantificação Canónica
momento angular -~- no sentido directo (inverso), para além de adicionarem um quantão
de energia.
Para cada valor da energia, existe uma degenerescência de grau n + 1, correspondendo
aos pares
(ne , nd ) = [(0, n); (1, n − 1); (2, n − 2); . . . ; (n − 1, 1); (n, 0)] ,
(5.2.21)
que correspondendem aos valores de lz = m~ com
m = [n; n − 2; n − 4; . . . ; 2 − n; −n] .
(5.2.22)
Note-se que a acção dos operadores circulares nos estados {|ne , nd i} é dada por
â†d |ne , nd i = |ne , nd + 1i ,
â†e |ne , nd i = |ne + 1, nd i ,
âd |ne , nd i = nd |ne , nd − 1i ,
5.2.3
(5.2.23)
âe |ne , nd i = ne |ne − 1, nd i .
Funções de Onda para quantões circulares
Vimos na secção 5.1.2 que a acção de operadores de destruição e criação lineares é dada
por, na representação |xi,
1
âi → √
2
r
µω i
x +
~
s
~ ∂
µω ∂xi
!
,
(5.2.24)
1
â†i → √
2
r
µω i
x −
~
s
~ ∂
µω ∂xi
!
.
(5.2.25)
Logo, usando (5.2.14), a acção dos operadores de destruição e criação circulares é dada
por2
2
âd
1
→
2
r
â†d
1
→
2
r
Usamos x1 = x e x2 = y.
µω
(x − iy) +
~
s
~
µω
∂
∂
−i
∂x
∂y
!
,
(5.2.26)
µω
(x + iy) −
~
s
~
µω
∂
∂
+i
∂x
∂y
!
.
(5.2.27)
5.2 O Oscilador Harmónico Quântico em Duas Dimensões
159
Os operadores circulares ‘retrógrados’ âe , â†e são obtidos pela transformação i → −i nas
duas últimas expressões respectivamente.3 A mudança para quantões circulares pretendeu
usar a simetria de rotação em torno do eixo Oz do problema; é pois natural reexpressar
estas quantidades em coordenadas polares:



x + iy = ρeiφ




∂x ∂
∂y ∂
∂
∂
∂



=
+
= −y
+x


 ∂φ
 x = ρ cos φ
∂φ ∂x ∂φ ∂y
∂x
∂y
.
⇒
∂x ∂
∂y ∂
x ∂
y ∂
∂

 y = ρ sin φ
=
+
=
+


∂ρ
∂ρ ∂x ∂ρ ∂y
ρ ∂x ρ ∂y





∂
i ∂
x − iy ∂
i(x − iy) ∂
∂
∂

−iφ

+
=
+
=e
+i

∂ρ ρ ∂φ
ρ ∂x
ρ
∂y
∂x
∂y
(5.2.28)
Logo, reexpressamos a acção dos operadores de criação e destruição directos
s
r
!
µω
~
1
∂
i ∂
âd → e−iφ
,
ρ+
−
2
~
µω ∂ρ ρ ∂φ
s
r
!
µω
~
∂
i
∂
1
,
ρ−
+
â†d → eiφ
2
~
µω ∂ρ ρ ∂φ
(5.2.29)
(5.2.30)
e os operadores circulares ‘retrógrados’ âe , â†e são obtidos pela transformação i → −i nas
duas últimas expressões respectivamente. As funções próprias do oscilador harmónico 2dimensional em termos destes quantões circulares (que são portanto estados próprios da
energia e momento angular)
Ψ(ne ,nd ) (ρ, φ) = Φ(ne ,nd ) (t, ρ, φ)e−iE(ne ,nd ) t/~ ,
(5.2.31)
são obtidas actuando no vácuo com â†d e â†e . A função de onda do vácuo para os quantões
lineares é (5.2.10) com n1 = n2 = 0
Ψ(n1 =0,n2 =0) (t, x, y) =
r
ωµ − µω (x2 +y2 ) −iωt
e 2~
e
,
π~
(5.2.32)
ou, em termos dos quantões circulares
n = 0, m = 0 ,
Φ(ne =0,nd =0) (ρ, φ) =
r
ωµ − µω ρ2
e 2~ .
π~
(5.2.33)
Note que isto não corresponde a tirar o complexo conjugado, dado que os operadores âi e â†i não
mudam.
3
160
Exemplos de Quantificação Canónica
Note-se que por (5.2.29), âd Φ(0,0) = 0 como requerido (e também âe Φ(0,0) = 0). Actuando
agora com â†d ou â†e respectivamente obtemos
µω 2
ωµ
Φ(ne =0,nd =1) (ρ, φ) = √ eiφ ρe− 2~ ρ ,
π~
n=1,
µω 2
ωµ

 m = −1 , Φ(ne =1,nd =0) (ρ, φ) = √ e−iφ ρe− 2~ ρ ,
π~


 m=1,
(5.2.34)
e assim por diante. Repare-se que para este nı́vel de energia (n = 1) os diferentes estados
de momento angular diferem de uma fase. Em geral o mesmo não se verifica; de facto isso
pode ser verificado para n = 2; tendo em atenção o factor de normalização obtemos

ωµ 3/2
2
µω 2

2iφ ρ

√
m
=
2
,
Φ
(ρ,
φ)
=
e
e− 2~ ρ ,

(ne =0,nd =2)


2π

r~ h

i µω 2
ωµ ωµ 2
n=2,
(5.2.35)
m = 0 , Φ(ne =1,nd =1) (ρ, φ) =
ρ − 1 e− 2~ ρ ,

π~
~


ωµ 3/2

µω 2
ρ2


e−2iφ √ e− 2~ ρ .
 m = −2 , Φ(ne =2,nd =0) (ρ, φ) =
~
2π
As densidades de probabilidade respeitantes a estas funções de onda estão representadas
na figura 5.3.
5.3
O problema de Landau
O problema de Landau para uma partı́cula sem spin é a versão quântica do problema de
Larmor do capı́tulo 1. Consideramos o hamiltoniano (1.3.22)
1
HL =
2µ
qBy
px +
2
2
2
qBx
1
p2
py −
+
+ z .
2µ
2
2µ
(5.3.1)
Tal como discutido na secção 4.4.3, a quantificação deste sistema é feita usando o operador
Hamiltoniano
µ
ĤL =
2
P̂x ωc Ŷ
+
µ
2
!2
µ
+
2
P̂y ωc X̂
−
µ
2
!2
+
P̂z2
,
2µ
(5.3.2)
onde usamos a frequência ciclotrónica ωc = qB/µ e onde impomos as relações de comutação
canónicas
[X̂, P̂x ] = i~ ,
[Ŷ , P̂y ] = i~ ,
[Ẑ, P̂z ] = i~ ,
(5.3.3)
5.3 O problema de Landau
161
0.3
0.1
0.25
0.08
0.2
0.06
0.15
0.04
0.1
0.02
0.05
0
0
0
0.5
1
1.5
2
0
0.5
1
1.5
rho
2
2.5
3
3
3.5
rho
0.3
0.08
0.25
0.06
0.2
0.15
0.04
0.1
0.02
0.05
0
0
0
0.5
1
1.5
2
rho
2.5
3
3.5
0
0.5
1
1.5
2
2.5
rho
Figura 5.3: Densidades de probabilidade para os nı́veis (n, m) = (0, 0) (cima esquerda),
(n, m) = (1, ±1) (cima direita) , (n, m) = (2, ±2) (baixo esquerda), (n, m) = (2, 0) (baixo
direita). Nos gráficos tomamos µω/~ = 1.
162
Exemplos de Quantificação Canónica
sendo todos os outros comutadores envolvendo momento e posição zero. Reescrevemos
(5.3.2) como
ĤL =
P̂x2 + P̂y2 µωc2 2
P̂ 2
P̂ 2
ωc
ωc
+
(X̂ + Ŷ 2 ) − (X̂ P̂y − Ŷ P̂x ) + z = Ĥxy − L̂z + z , (5.3.4)
2µ
8
2
2µ
2
2µ
onde Ĥxy é o Hamiltoniano do oscilador harmónico dois dimensional (5.2.3) com ω = ωc /2
e L̂z é a componente z do operador momento angular. Usando (5.2.18), reescrevemos o
hamiltoniano como
1
P̂ 2
ĤL = ~ωc N̂e +
+ z .
2
2µ
(5.3.5)
Note-se que podiamos ter definido directamente de (5.3.2) os operadores de destruição e
criação
"
!
!#
µ
P̂x ωc Ŷ
P̂y ωc X̂
+i
,
+
−
−iâe =
2~ωc
µ
2
µ
2
"
!
!#
r
P̂
P̂
ω
Ŷ
ω
X̂
µ
x
y
c
c
−i
,
+
−
iâ†e =
2~ωc
µ
2
µ
2
r
(5.3.6)
(5.3.7)
de modo que
"
µ
2
â†e âe =
2~ωc µ
P̂ 2
ĤL − z
2µ
!
#
iωc
iωc
1
−
[P̂x , X̂] +
[Ŷ , P̂y ] =
2µ
2µ
~ωc
P̂ 2
ĤL − z
2µ
!
−
1
,
2
(5.3.8)
recuperando (5.3.5). Só que ao usarmos a comparação com o oscilador harmónico em
duas dimensões temos imediatamente a interpretação de âe e â†e como destruindo e criando
quantões circulares (retrógrados). Assim, o Hamiltoniano é igual ao do oscilador harmónico
um dimensional, mas com quantões circulares, mais uma parte que descreve o movimento
(livre) segundo o eixo do z.
Consideremos a decomposição
ĤL = Ĥ⊥ + Ĥk ,
com
1
e
Ĥ⊥ = ~ωc N̂e +
2
Ĥk =
P̂z2
.
2µ
(5.3.9)
Analisamos primeiro o movimento no plano xy que é descrito por Ĥ⊥ . O espectro de
energias no plano xy é infinitamente degenerado. De facto, estados próprios de L̂z com
diferentes valores de nd têm o mesmo valor próprio da energia, que só depende de ne ;
5.3 O problema de Landau
163
adicionando ou subtraindo quantões circulares directos não altera a energia do estado.
Para compreender fisicamente este resultado vamos definir vários operadores:
• Operadores Velocidade: Pela relação clássica (1.3.19)
~,
p~ = µ~x˙ + q A
(5.3.10)
definimos os operadores associados à velocidade
V̂ i =
q
P̂i
− Âi ,
µ
µ
V̂ y =
P̂y ωc
− X̂ ,
µ
2
(5.3.11)
que no nosso caso são
V̂ x =
P̂x ωc
+ Ŷ ,
µ
2
V̂ z =
P̂z
.
µ
(5.3.12)
Logo
[V̂ x , V̂ y ] =
i~ωc
,
µ
(5.3.13)
e portanto existe uma incerteza mı́nima associada à determinação das componentes
x e y da velocidade, quando B 6= 0
∆v x ∆v y ≥
ωc ~
.
2µ
(5.3.14)
• Operadores Centro da Trajectória Clássica: Pelas relações clássicas (1.1.10)-(1.1.12)
temos
x = x0 −
vy
,
ωc
y = y0 +
vx
,
ωc
(B 6= 0)
(5.3.15)
definimos as observáveis associadas ao centro da trajectória clássica
X̂0 = X̂ +
X̂
P̂y
V̂ y
=
+
,
ωc
2
µωc
Ŷ0 = Ŷ −
V̂ x
Ŷ
P̂x
= −
.
ωc
2
µωc
(5.3.16)
Primeiro notamos que
[X̂0 , Ŷ0 ] = −
i~
.
µωc
(5.3.17)
Logo, X̂0 e Ŷ0 são incompatı́veis e existe uma incerteza mı́nima associada às suas
grandezas fı́sicas associadas
∆x0 ∆y0 ≥
~
.
2µωc
(5.3.18)
164
Exemplos de Quantificação Canónica
Segundo notamos que
[ĤL , X̂0 ] = 0 = [ĤL , Ŷ0 ] ,
(5.3.19)
pelo que tanto X̂0 como Ŷ0 são constantes do movimento no sentido da secção 4.4.5.
Terceiro notamos que
[X̂0 , L̂z ] = −i~Ŷ0 ,
[Ŷ0 , L̂z ] = i~X̂0 ,
(5.3.20)
pelo que não podemos incluir mais do que uma das três grandezas X̂0 , Ŷ0 , L̂z no nosso
C.C.O.C..
Quarto notamos que o operador
P̂x2 + P̂y2 µωc2 2
ωc
+
(X̂ + Ŷ 2 ) + (X̂ P̂y − Ŷ P̂x )
2µ
8
2
!
1̂
ωc 2~
2 Ĥxy + L̂z =
N̂d +
=
µωc2
2
µωc
2
2
R̂02 ≡ X̂02 + Ŷ02 =
µωc2
!
.
(5.3.21)
Deste modo vemos que o valor próprio do operador R̂02 depende somente do número
de quantões circulares directos.
• Operador Raio da trajectória clássica: Pela expressão clássica (1.1.13)
r 2 = (x(t) − x0 )2 + (y(t) − y0 )2 ,
(5.3.22)
definimos o operador raio da trajectória clássica
1
2~
R̂2 = (X̂ − X̂0 )2 + (Ŷ − Ŷ0 )2 = 2 ((V̂ x )2 + (V̂ y )2 ) =
ωc
µωc
1̂
N̂e +
2
!
.
(5.3.23)
Assim, R̂2 é determinado pelo número de quantões circulares retrógrados.
Assim, o C.C.O.C. para o problema de Landau é
n
o
C.C.O.C = N̂e , N̂d , P̂z ,
(5.3.24)
e a base para o espaço de estados pode ser tomada como rotulada pelos seus valores próprios
{|ne , nd , pz i}. Podemos pensar em ne como determinando a energia do sistema ou também
5.4 Sumário
165
o valor próprio do operador raio da trajectória clássica. Por outro lado nd determina o
valor próprio do operador R̂02 . O espectro total de energias é
E(ne ,pz )
1
p2
= ~ωc ne +
+ z ,
2
2µ
(5.3.25)
que tem uma parte discreta relativa ao movimento no plano xy que é designada por nı́veis de
Landau e uma parte contı́nua relativa ao movimento segundo z. Este espectro é degenerado
em dois sentidos diferentes. Primeiro, como discutido atrás, funções de onda que só diferem
de nd têm a mesma energia - degenerescência infinita. Segundo, mesmo tomando o mesmo
valor de nd , duas funções de onda com diferentes valores de pz e ne podem ainda ter a
mesma energia, desde que a soma das duas parcelas ainda se mantenha igual. Esta é uma
degenerescência finita com grau ñ + 1 onde ñ é o maior inteiro menor que E/(~ωc ) −
1/2. As funções de onda totais para o problema de Landau que são estados próprios
simultaneamente de ĤL , L̂z e P̂z são dadas pelo produto das funções de onda da secção
5.2.3 por uma onda plana que descreve o movimento livre segundo z:
Ψ(ρ, φ, z, t) = Φ(ne ,nd ) (ρ, φ)eipz z/~eiE(ne ,pz ) t/~ .
(5.3.26)
Claro está, que tal como discutido no capı́tulo 3, esta função de onda não vai ser normalizável, devido à componente segundo z ser livre. Para normalizar a função de onda
terı́amos de considerar um pacote de ondas na direcção z.
5.4
Sumário
Considerámos três exemplos de quantificação canónica. O primeiro, o oscilador harmónico
quântico em uma dimensão é o paradigma de problema que é resolvido pela introdução
de operadores de criação e destruição. O espectro de energias mostra que a diferença de
energia entre dois nı́veis diferentes é um múltiplo de ~ω. Esta foi exactamente a observação
de Planck discutida na secção 2.1.2 que é obtida naturalmente no formalismo quântico. Ao
considerarmos o oscilador harmónico isotrópico em duas dimensões pudemos introduzir
também os operadores de criação e destruição circulares, que são úteis para tratar estados
166
Exemplos de Quantificação Canónica
com momento angular bem definido. Vimos também aqui um exemplo de espectro de
energias (finitamente) degenerado em cada nı́vel. O problema de Landau permitiu-nos ver
um exemplo de um espectro de energias infinitamente degenerado; esta degenerescência
pode ser associada à redundância de trajectórias clássicas no problema clássico de Larmor,
que resulta da uniformidade do campo magnético. O problema de Landau dá-nos também
um exemplo de uma situação em que os operadores associados a velocidades (ou a posições)
não comutam entre si.
CAPÍTULO
6
Momento Angular Orbital e o Átomo de Hidrogénio
No capı́tulo anterior estudamos sistemas com componente Lz do momento angular bem
definida. Isso levou-nos a estudar as funções de onda da secção 5.2.3 que são estados
próprios dos operadores Ĥ e L̂z - estes operadores comutam e podem, como tal, ser diagonalizados simultaneamente. Neste capı́tulo vamos começar por estudar um conjunto
de funções próprias comuns a L̂z e L̂2 que aplicaremos depois ao estudo do átomo de
Hidrogénio.
6.1
Operadores de momento angular orbital
As componentes do momento angular orbital são dadas por (4.4.39)
~
L̂ = (L̂x , L̂y , L̂z ) = (Ŷ P̂z − Ẑ P̂y , Ẑ P̂x − X̂ P̂z , X̂ P̂y − Ŷ P̂x ) .
Na representação |~xi, estes operadores são escritos associando
∂
∂
∂
P̂x , P̂y , P̂z
→
−i~ , −i~ , −i~
,
∂x
∂y
∂z
(6.1.1)
(6.1.2)
de modo que representamos
∂
∂
∂
∂
∂
∂
.
− z ,z
−x ,x
−y
(L̂x , L̂y , L̂z ) = −i~ y
∂z
∂y ∂x
∂z ∂y
∂x
(6.1.3)
168
Momento Angular Orbital e o Átomo de Hidrogénio
Podemos facilmente verificar que esta representação obedece às relações de comutação para
o momento angular
[L̂x , L̂y ] = i~L̂z ,
[L̂y , L̂z ] = i~L̂x ,
[L̂z , L̂x ] = i~L̂y ;
(6.1.4)
por exemplo, sendo φ(x, y, z) uma função de onda arbitrária
∂
∂
∂
∂
∂
∂
∂
∂
z
+ z
y
φ(x, y, z)
−z
−x
−x
−z
[L̂x , L̂y ]φ(x, y, z) = ~ − y
∂z
∂y
∂x
∂z
∂x
∂z
∂z
∂y
∂
∂
2
φ(x, y, z) = i~L̂z φ(x, y, z) ,
−y
=~ x
∂y
∂x
(6.1.5)
2
em acordo com (6.1.4).
Definimos o operador momento angular total
~ ~
L̂2 = L̂ · L̂ = L̂2x + L̂2y + L̂2z .
(6.1.6)
Note-se que L̂2 comuta com qualquer das componentes do momento angular
h
i
L̂2 , L̂x = 0 ,
h
i
L̂2 , L̂y = 0 ,
h
i
L̂2 , L̂z = 0 .
(6.1.7)
Por exemplo
h
i h
i
h
i h
i
h
i h
i
L̂2 , L̂x = L̂2y + L̂2z , L̂x = L̂y L̂y , L̂x + L̂y , L̂x L̂y + L̂z L̂z , L̂x + L̂z , L̂x L̂z
= −i~L̂y L̂z − i~L̂z L̂y + i~L̂z L̂y + i~L̂y L̂z = 0
.
(6.1.8)
Assim, em mecânica quântica, classificamos os estados com momento angular bem definido
usando o momento angular total e apenas uma das suas componentes, normalmente z; ou
seja, consideramos o
n
o
C.C.O.C. = L̂2 , L̂z ,
(6.1.9)
para descrever os estados próprios do momento angular.
Tal como na secção 5.2.3. usámos coordenadas polares para descrever as funções de onda
que são estados próprios de L̂z , é conveniente usar coordenadas esféricas para descrever
6.2 Os Harmónicos Esféricos
169
as funções de onda que são estados próprios simultaneamente de L̂2 e L̂z . A relação entre
coordenadas esféricas e cartesianas é dada por



 x = r sin θ cos φ

y = r sin θ sin φ



 z = r cos θ
.
(6.1.10)
Os versores em coordenadas esféricas e cartesianas relacionam-se como


e = cos θ cos φex + cos θ sin φey − sin θez


 θ
.
(6.1.11)
eφ = cos φey − sin φex



 er = x ex + y ey + z ez
r
r
r
~ˆ = ~ˆr × ˆ~p, na representação |xi e usando coordenadas
O operador momento angular, L
esféricas toma a forma
∂
1 ∂
1 ∂
ˆ
~
L = rer × (−i~∇) = −i~rer × er
,
+ eθ
+ eφ
∂r
r ∂θ
r sin θ ∂φ
(6.1.12)
ou seja
1
∂
∂
ˆ
~ = −i~ eφ
.
− eθ
L
∂θ
sin θ ∂φ
(6.1.13)
Usando (6.1.11) para projectar esta equação em ex , ey e ez obtemos respectivamente

∂
∂


L̂x = i~ sin φ + cot θ cos φ



∂θ
∂φ 

∂
∂
.
(6.1.14)
L̂y = i~ − cos φ + cot θ sin φ

∂θ
∂φ



∂


 L̂z = −i~
∂φ
Calculando o operador momento angular total L̂2 = L̂2x + L̂2y + L̂2z nesta representação
obtemos
2
L̂ = −~
6.2
2
1 ∂
sin θ ∂θ
∂
1 ∂2
sin θ
+
.
∂θ
sin2 θ ∂φ2
(6.1.15)
Os Harmónicos Esféricos
Vamos agora construir as funções próprias comuns a L̂2 e L̂z . Comecemos por calcular as
funções próprias de L̂2 com valor próprio α~2 que denotamos por Yα (θ, φ) e obedecem à
170
Momento Angular Orbital e o Átomo de Hidrogénio
equação diferencial
L̂2 Yα (θ, φ) = α~2 Yα (θ, φ) ,
(6.2.1)
ou seja
−~
2
1 ∂
sin θ ∂θ
∂
1 ∂2
sin θ
+
Yα (θ, φ) = α~2 Yα (θ, φ) .
∂θ
sin2 θ ∂φ2
(6.2.2)
Separamos variáveis
Yα (θ, φ) = Θ(θ)Φ(φ) ,
de modo a obtermos a equação
d
1 d2
sin θ d
2
sin θ Θ(θ) + α sin θ = −
Φ(φ) .
Θ(θ) dθ
dθ
Φ(φ) dφ2
(6.2.3)
(6.2.4)
Como o lado esquerdo só depende de θ e o direito de φ, para obedecer à igualdade cada
lado tem de ser uma constante a que chamamos m2 . Do lado direito obtemos então
d2
Φ(φ) + m2 Φ(φ) = 0
dφ2
⇒
Φ(φ) = C1 eimφ + C2 e−imφ .
(6.2.5)
Note-se que as funções e±imφ são também funções próprias de L̂z , com valores próprios
−i~(±im) = ±m~ ,
(6.2.6)
enquanto que a combinação linear C1 eimφ + C2 e−imφ não é função própria de L̂z . Deste
modo tomamos
Φ(φ) = Ce±imφ ,
(6.2.7)
onde C é uma constante de normalização. Além disso, para a função e±imφ ter valor único,
precisamos
e±imφ = e±im(φ+2π)
⇒
m∈Z,
(6.2.8)
ou seja, m é inteiro e como tal os valores próprios de L̂z são
0, ±~, ±2~, ±3~ , . . .
Do lado esquerdo de (6.2.4) obtemos
d
d
sin θ Θ(θ) + α sin2 θ − m2 Θ(θ) = 0 .
sin θ
dθ
dθ
(6.2.9)
(6.2.10)
6.2 Os Harmónicos Esféricos
171
Para resolvermos esta equação fazemos uma mudança de variável:
χ ≡ cos θ
dχ d
d
d
=
= − sin θ
,
dθ
dθ dχ
dχ
⇒
f (χ) ≡ Θ(θ) ,
(6.2.11)
de modo que a equação em θ fica
d
m2
2 d
(1 − χ ) f (χ) + α −
f (χ) = 0 .
dχ
dχ
1 − χ2
(6.2.12)
Começamos por considerar o caso com m = 0, ficando a equação
d2 f (χ)
df (χ)
(1 − χ )
−
2χ
+ αf (χ) = 0 .
dχ2
dχ
2
(6.2.13)
Esta é uma equação diferencial ordinária de segunda ordem, denominada equação de Legendre. Tentemos encontrar uma solução como uma série de potências
f (χ) =
∞
X
an χn ,
(6.2.14)
n=0
de modo que a equação fica
2
(1 − χ )
⇔
⇔
∞
X
n=0
∞
X
n=0
∞
X
n=0
n−2
n(n − 1)an χ
− 2χ
∞
X
nan χ
n=0
[−n(n − 1) − 2n + α] an χn +
n
[α − n(n + 1)] an χ +
∞
X
n−1
∞
X
n=0
+α
∞
X
an χn = 0
n=0
n(n − 1)an χn−2 = 0
,
(6.2.15)
(m + 2)(m + 1)am+2 χm = 0
m=−2
notando que os termos com m = −2 e m = −1 no último somatório dão contribuição zero
e chamando n a m obtemos
⇔
∞
X
n=0
[(α − n(n + 1))an + (n + 2)(n + 1)an+2 ] χn = 0 ,
(6.2.16)
que para ser obedecido implica a relação de recorrência para a série
an+2 =
(n + 1)n − α
an .
(n + 2)(n + 1)
(6.2.17)
Notamos de imediato que
an+2
an
n→∞
−→ 1 ,
(6.2.18)
172
Momento Angular Orbital e o Átomo de Hidrogénio
de modo que para a série não divergir quando χ = ±1 (que é o valor máximo para χ dado
que χ ≡ cos θ) temos de requerer que ela seja finita, isto é que o valor próprio α obedeça a
α = ℓ(ℓ + 1) ,
(6.2.19)
para um dado ℓ ∈ N0 . As soluções da equação de Legendre são então polinómios de grau
ℓ. Note-se ainda que como a relação de recorrência relaciona apenas an+2 com an , temos
que a série de termos pares é independentente da série de termos ı́mpares; a escolha de
α = ℓ(ℓ + 1) para um dado ℓ garante que a série com a paridade de ℓ páre; assim para
termos uma série finita temos de escolher somente termos pares ou termos ı́mpares:
série par (ℓ par)
a0 6= 0 , a1 = 0 ,
série ı́mpar (ℓ ı́mpar)
(6.2.20)
a0 = 0 , a1 6= 0 .
Estes polinómios são designados por polinómios de Legendre e denotados por Pℓ (χ) (grau
ℓ) quando obedecem à condição de normalização
Z 1
Pℓ (χ)Pℓ′ (χ)dχ =
−1
2
δℓℓ′ .
2ℓ + 1
(6.2.21)
Os quatro primeiros são
• Tomamos ℓ = 0, a0 = 1, a1 = 0 e obtemos
P0 (χ) = 1;
(6.2.22)
• Tomamos ℓ = 1, a0 = 0, a1 = 1 e obtemos
P1 (χ) = χ ;
(6.2.23)
• Tomamos ℓ = 2, a0 = −1/2, a1 = 0 e obtemos
P2 (χ) = −
1
1 − 3χ2 ;
2
(6.2.24)
• Tomamos ℓ = 3, a0 = 0, a1 = −3/2 e obtemos
5
3
P3 (χ) = − χ + χ3 .
2
2
(6.2.25)
6.2 Os Harmónicos Esféricos
173
Pode-se verificar que com estas normalizações os polinómios obedecem a (6.2.21).
Descobrimos pois um conjunto de funções próprias comuns a L̂2 e L̂z , da forma
Yℓm (θ, φ) = F (θ)eimφ ,
(6.2.26)
cujo valor próprio de L̂z é m~, com m ∈ Z, e, para m = 0 estas funções tomam a forma
Yℓ0 (θ, φ) = CPℓ (cos θ) ,
(6.2.27)
onde C é uma constante de normalização, sendo o valor próprio de L̂2 , ℓ(ℓ + 1)~2 com
ℓ ∈ N0 .
Vamos agora usar (6.2.27) para construir Yℓm (θ, φ) com m 6= 0. Primeiro notamos que
os valores de m e ℓ não são completamente independentes. Por definição
L̂2 = L̂2x + L̂2y + L̂2z ;
(6.2.28)
o valor esperado desta equação num determinado estado com momento angular bem
definido, |Ψi = | . . . , ℓ, mi (normalizado) é
hΨ|L̂2 |Ψi = hΨ|L̂2x + L̂2y + L̂2z |Ψi ,
(6.2.29)
e dado que L̂x e L̂y são hermı́ticos
ℓ(ℓ + 1)~2 = kL̂x |Ψik2 + kL̂y |Ψik2 + m2 ~2 ≥ m2 ~2 ,
o que equivale a que |m| ≤
(6.2.30)
p
ℓ(ℓ + 1), ou, como |m|, ℓ ∈ N0 ,
|m| ≤ ℓ .
(6.2.31)
Note-se que assumimos que mesmo para m 6= 0 os estados próprios do momento angular
têm valor próprio de L̂2 igual a ℓ(ℓ + 1)~2 ; iremos confirmar isto em baixo.
Segundo definimos os operadores de escada
L̂+ = L̂x + iL̂y ,
L̂− = L̂x − iL̂y .
(6.2.32)
174
Momento Angular Orbital e o Átomo de Hidrogénio
Estes operadores obedecem às relações de comutação
h
i
L̂2 , L̂± = 0 ,
h
i
L̂− , L̂+ = −2~L̂z ,
h
i
L̂z , L̂± = ±~L̂± .
(6.2.33)
Por exemplo,
h
i h
i
L̂− , L̂+ = L̂x − iL̂y , L̂x + iL̂y = −2~L̂z .
(6.2.34)
h
i
Compare-se as relações de comutação L̂z , L̂± = ±~L̂± com as relações (5.1.9) e (5.1.10);
são idênticas, pelo que podemos fazer uma analogia para L̂+ /L̂− como operadores de
criação/destruição e para L̂z como operador de número. Mais concretamente, L̂+ /L̂− vão
transformar um estado com momento angular segundo z, m~, num estado com mais/menos
um quantão de momento angular segundo z, (m+1)~/(m−1)~. Isto, sem alterar o momento
h
i
2
2
angular total ~ ℓ(ℓ + 1), pois L̂ , L̂± = 0, o que justifica a hipótese tomada acima de que
os valores próprios de L̂2 mantinham a sua forma para m 6= 0.
Deste modo tomamos para estados próprios do momento angular o conjunto {|ℓ, mi},
com |m| ≤ ℓ e
L̂2 |ℓ, mi = ℓ(ℓ + 1)~2 |ℓ, mi ,
L̂+ |ℓ, mi =
Cℓm |ℓ, m
+ 1i ,
L̂z |ℓ, mi = m~|ℓ, mi
L̂− |ℓ, mi =
C̃ℓm |ℓ, m
,
(6.2.35)
− 1i
onde Cℓℓ = 0, C̃ℓ−ℓ = 0, para garantir que |m| ≤ ℓ. Tal como para o oscilador harmónico
(fórmulas (5.1.30) e (5.1.31)), as constantes Cℓm , C̃ℓm são necessárias para garantir a normalização dos estados. Para vermos a forma destas constantes notamos que
L̂∓ L̂± =
L̂2x
+
L̂2y
∓ iL̂y L̂x ± iL̂x L̂y =
L̂2x
+
L̂2y
h
i
± i L̂x , L̂y = L̂2 − L̂2z ∓ ~L̂z .
(6.2.36)
Logo,
hℓ, m|L̂∓ L̂± |ℓ, mi = hℓ, m|L̂2 − L̂2z ∓ ~L̂z |ℓ, mi = ~2 ℓ(ℓ + 1) − m2 ∓ m hℓ, m|ℓ, mi .
(6.2.37)
Mas, por outro lado,
hℓ, m|L̂− L̂+ |ℓ, mi = Cℓm (Cℓm )∗ hℓ, m + 1|ℓ, m + 1i
,
∗
m
m
hℓ, m|L̂+ L̂− |ℓ, mi = C̃ℓ C̃ℓ
hℓ, m − 1|ℓ, m − 1i
(6.2.38)
6.2 Os Harmónicos Esféricos
175
e como tal
~2 (ℓ(ℓ + 1) − m(m + 1)) hℓ, m|ℓ, mi = Cℓm (Cℓm )∗ hℓ, m + 1|ℓ, m + 1i
.
∗
~2 (ℓ(ℓ + 1) − m(m − 1)) hℓ, m|ℓ, mi = C̃ℓm C̃ℓm hℓ, m − 1|ℓ, m − 1i
(6.2.39)
Concluimos que para garantir que a acção dos operadores em escada preserva a normalização dos estados tomamos
p
Cℓm = ~ ℓ(ℓ + 1) − m(m + 1) ,
C̃ℓm = ~
que naturalmente obedecem a Cℓℓ = 0, C̃ℓ−ℓ = 0.
p
ℓ(ℓ + 1) − m(m − 1) ,
(6.2.40)
Terceiro, os operadores em escada na representação |~xi e em coordenadas esféricas
tomam a forma (usando (6.2.32) e (6.1.14))
∂
∂
iφ
,
+ i cot θ
L̂+ = ~e
∂θ
∂φ
∂
∂
−iφ
L̂− = −~e
,
− i cot θ
∂θ
∂φ
(6.2.41)
(6.2.42)
e os estados |ℓ, mi tomam a forma Yℓm (θ, φ), sendo a condição de normalização
Z π
Z 2π
dθ
dφ sin θYℓm (Yℓm )∗ = 1 ,
θ=0
(6.2.43)
φ=0
e designam-se por harmónicos esféricos. Consideremos os primeiros
√
• Para ℓ = 0, m = 0 temos Y00 = C; normalizando obtemos C = 1/ 4π, logo
1
Y00 = √
;
4π
(6.2.44)
• Para ℓ = 1, m = 0 temos Y10 = C cos θ; normalizando obtemos C =
r
3
0
Y1 =
cos θ ,
4π
p
3/(4π), logo
(6.2.45)
e usando
√
L̂+ |1, 0i = ~ 2|1, 1i
⇔
1
Y11 = √ ~eiφ
2~
∂
∂
+ i cot θ
∂θ
∂φ
r
Y10 = −
3 iφ
e sin θ ,
8π
(6.2.46)
176
Momento Angular Orbital e o Átomo de Hidrogénio
e de um modo semelhante
√
L̂− |1, 0i = ~ 2|1, −1i
⇔
Y1−1
1
= − √ ~e−iφ
2~
∂
∂
− i cot θ
∂θ
∂φ
Y10
=
• Para ℓ = 2, m = 0 temos Y20 = C(3 cos2 θ − 1); normalizando obtemos C =
logo
Y20
=
r
5
(3 cos2 θ − 1) ,
16π
r
3 −iφ
e sin θ ;
8π
(6.2.47)
p
5/(16π),
(6.2.48)
e pela acção dos operadores em escada obtemos
√
r
15 iφ
e cos θ sin θ ,
8π
(6.2.49)
r
√
∂
1
15 −iφ
∂
L̂− |2, 0i = ~ 6|2, −1i ⇔ Y2−1 = − √ ~e−iφ
Y20 =
− i cot θ
e cos θ sin θ ,
∂θ
∂φ
8π
6~
(6.2.50)
r
∂
1 iφ ∂
15 2iφ 2
Y21 =
~e
+ i cot θ
e sin θ ,
L̂+ |2, 1i = ~2|2, 2i
⇔
Y22 =
2~
∂θ
∂φ
32π
(6.2.51)
r
1
∂
∂
15 −2iφ 2
L̂− |2, −1i = ~2|2, −2i ⇔ Y2−2 = − ~e−iφ
Y2−1 =
− i cot θ
e
sin θ .
2~
∂θ
∂φ
32π
(6.2.52)
L̂+ |2, 0i = ~ 6|2, 1i
⇔
Y21
1
= √ ~eiφ
6~
∂
∂
+ i cot θ
∂θ
∂φ
Y20
=−
Nas figuras 6.1, 6.2, 6.3 é representada a dependência angular da função Yℓm (Yℓm )∗ .
Como toda a dependência em φ desaparece, a figura obtida é dada pela revolução em
torno do eixo dos z das figuras planares exibidas.
6.3
Partı́cula numa força central
Consideremos o operador Hamiltoniano para uma partı́cula sem spin num campo de forças
central1
Ĥ =
1
P̂ 2
+ V̂ (R̂) .
2µ
(6.3.1)
Denotaremos de futuro a massa por ‘µ’ para evitar confusão com o número quântico azimutal ‘m’.
6.3 Partı́cula numa força central
177
Figura 6.1: Dependência angular dos harmónicos esféricos com número quântico azimutal
mı́nimo, Y00 , Y10 , Y20 , respectivamente. Note-se que as zonas de maior probabilidade se
encontram ao longo do eixo polar (extraı́do de Cohen et al., ‘Quantum Mechanics’).
Figura 6.2: Dependência angular dos harmónicos esféricos com número quântico azimutal máximo, Y00 , Y1±1 , Y1±2 , Y3±3 , Y4±4 respectivamente. Note-se que as zonas de maior
probabilidade se encontram ao longo do plano equatorial (extraı́do de Eisberg & Resnick,
‘Quantum Physics’).
178
Momento Angular Orbital e o Átomo de Hidrogénio
Figura 6.3: Dependência angular dos harmónicos esféricos Y30 , Y3±1 , Y2±2 , Y3±3 , respectivamente. Note-se que as zonas de maior probabilidade se deslocam do eixo polar para o
plano equatorial à medida que o número quântico azimutal cresce (extraı́do de Eisberg &
Resnick, ‘Quantum Physics’).
Vamos reescrever este Hamiltoniano em termos do operador momento angular. Para isso
notamos que na representação |~xi
P̂ 2 = (−i~∇) · (−i~∇) = −~2 ∆ ,
onde ∆ é o Laplaciano. Em coordenadas esféricas temos então
1 ∂
∂2
1
∂
1
∂
2
2
2 ∂
P̂ = −~
r
+ 2
sin θ
+ 2 2
,
r 2 ∂r
∂r
r sin θ ∂θ
∂θ
r sin θ ∂φ2
ou ainda, usando o operador distância radial R̂ e definindo o operador radial
~2 ∂
2 ∂
Ξ̂ ≡ − 2
r
,
r ∂r
∂r
(6.3.2)
(6.3.3)
(6.3.4)
temos em forma de operadores
P̂ 2 = Ξ̂ +
L̂2
R̂2
⇒
Ĥ =
Ξ̂
L̂2
+
+ V̂ (R̂) .
2µ 2µR̂2
Desta forma do Hamiltoniano podemos extrair as seguintes conclusões:
(6.3.5)
6.3 Partı́cula numa força central
179
i) Quer L̂2 quer L̂z quando representados no espaço de configurações em coordenadas
esféricas actuam apenas nas coordenadas angulares, conforme (6.1.14), (6.1.15), logo
h
i
h
i
h
i
2
2
2 1
=0
⇒
L̂2 , Ĥ = 0 , (6.3.6)
L̂ , Ξ̂ = 0 ,
L̂ , V̂ (R̂) = 0 ,
L̂ ,
R̂2
e de um modo semelhante
h
i
L̂z , Ξ̂ = 0 ,
h
i
L̂z , V̂ (R̂) = 0 ,
L̂z ,
1
R̂2
=0
[L̂z ,L̂2 ]=0
⇒
h
i
L̂z , Ĥ = 0 . (6.3.7)
Assim, no problema quântico de uma partı́cula num campo de forças central podemos
incluir no C.C.O.C.
n
o
C.C.O.C. = Ĥ, L̂2 , L̂z ,
(6.3.8)
isto é, os estados com energia bem definida (estados estacionários) têm também
momento angular bem definido.
ii) Para encontrarmos os estados estacionários e o espectro de energias temos de resolver
a equação de Schrödinger independente do tempo
Ĥ|Φi = E|Φi ,
(6.3.9)
que no espaço de configurações toma a forma
2
~
∂2
1
∂
1
1 ∂
∂
2 ∂
−
r
+ 2
sin θ
+ 2 2
+ V (r) Φ(r, θ, φ)
2µ r 2 ∂r
∂r
r sin θ ∂θ
∂θ
r sin θ ∂φ2
= EΦ(r, θ, φ) .
(6.3.10)
É natural tomarmos como ansatz para as funções de onda espaciais
Φ(r, θ, φ) = f (r)Yℓm (θ, φ) ,
(6.3.11)
de modo aproveitar o conhecimento que adquirimos sobre as funções próprias do momento angular. A equação de onda fica reduzida a uma equação diferencial ordinária
de segunda ordem na coordenada radial
ℓ(ℓ + 1)~2
~2 d
2 d
r
+
−
+ V (r) f (r) = Ef (r) .
2µr 2 dr
dr
2µr 2
(6.3.12)
180
Momento Angular Orbital e o Átomo de Hidrogénio
6.4
O átomo de hidrogénio (sem spin)
Especializamos agora a equação (6.3.12) para o problema de Coulomb, para o qual
V (r) = −
1 e2
,
4πǫ0 r
(6.4.1)
R(r)
,
r
(6.4.2)
e introduzindo a função R(r) por
f (r) =
o que transforma a equação radial em (usamos µ = me massa do electrão)
2
me e2
2me E 2
2 d
−r
R(r) =
r +
r − ℓ(ℓ + 1) R(r) .
dr 2
~2
2πǫ0 ~2
Esta equação tem a forma da chamada equação de Whittaker
2
2
1
z
2 d
2
W (z) ,
z
W (z) =
− kz + m −
dz 2
4
4
(6.4.3)
(6.4.4)
cuja solução se toma como sendo da forma
W (z) = z m+1/2 e−z/2 g(z) ,
(6.4.5)
o que implica que (denotando dg/dz = g ′ )
g′
d2 W (z)
1
1
1
1
1
′′
2
m+1/2 −z/2
g + (2m + 1 − z) +
−
m+
g ,
m −
=z
e
+
dz 2
z
4 z2
4
z
2
(6.4.6)
transformando a equação de Whittaker na equação
1
′′
′
g=0.
zg + (2m + 1 − z)g + k − m −
2
(6.4.7)
Esta equação é agora resolvida por uma série de potências
g(z) =
∞
X
bn z n ,
(6.4.8)
n=0
que substituindo em (6.4.7) fica
∞
X
∞
X
∞
1 X
z
n(n − 1)bn z
+ (2m + 1 − z)
nbn z
+ k−m−
bn z n = 0
2
n=0
n=0
n=0
∞ X
1
⇔
(n + 1)(2m + 1 + n)bn+1 − n + m + − k bn z n = 0
2
n=0
n−2
n−1
,
(6.4.9)
6.4 O átomo de hidrogénio (sem spin)
181
e obtemos a relação de recorrência
bn+1 =
n + m − k + 1/2
bn .
(n + 1)(n + 2m + 1)
(6.4.10)
Notemos que esta relação de recorrência implica que
bn+1
bn
1
.
n
n→∞
−→
(6.4.11)
Concluimos que a solução da equação de Whittaker tem a forma
P∞
bn z n+m+1/2
W (z) = n=0 z/2
.
e
(6.4.12)
Expressando a exponencial no denominador como uma série de potências
ez/2 =
∞
X
n=0
cn z n ,
cn =
cn+1
2n n!
1
⇒
=
2n n!
cn
2n+1 (n + 1)!
n→∞
−→
1
.
2n
(6.4.13)
Comparando (6.4.11) com (6.4.13) vemos que os coeficientes decrescem mais rapidamente
para a série no denominador. Assim, o comportamento da função quando z → ∞ é
dominado pelo numerador e portanto não converge para zero. Para a função de Whittaker
convergir para zero quando z → ∞2 requeremos que exista um inteiro, n0 tal que
n0 + m − k + 1/2 = 0 ,
n0 ∈ N0 .
(6.4.14)
Voltemos agora à equação radial (6.4.3). Para a transformar na forma da equação de
Whittaker, (6.4.4) introduzimos a variável z tal que
z2
2me E
≡ − 2 r2
4
~
⇒
z=
√
−8me E
r.
~
(6.4.15)
Note-se que esta transformação só é possı́vel para E < 0, isto é para os estados ligados,
que são exactamente aqueles para os quais esperamos encontrar quantificação da energia.
Fazendo esta transformação, (6.4.3) fica da forma de (6.4.4), com
r
1
me
e2
,
m=ℓ+ .
−
k=
4πǫ0 ~
2E
2
2
Esta condição é necessária para a função de onda ser normalizável.
(6.4.16)
182
Momento Angular Orbital e o Átomo de Hidrogénio
Figura 6.4: Espectro de energias do Hidrogénio; na figura o número quântico principal é
denotado por n (extraı́do de Cohen et al., ‘Quantum Mechanics’).
A condição de que a série pára (6.4.14) fica
r
1
e2
me 1
n0 + ℓ + −
−
+ =0
⇔
2 4πǫ0 ~
2E 2
E=−
e2
4πǫ0 ~
2
me
, (6.4.17)
2(n0 + ℓ + 1)2
ou definindo o número quântico principal N ≡ n0 + ℓ + 1 obtemos
2 2
me
e
,
EN = −
4πǫ0 ~
2N 2
(6.4.18)
que é o espectro de energias do átomo de hidrogénio visto no capı́tulo 2 (relação (2.2.12)
com Z = 1).
Este espectro de energias só depende do número quântico principal, mas não do momento angular total definido por ℓ ou do momento angular azimutal definido por m. Assim
o espectro é degenerado de duas maneiras
• Um determinado número quântico principal N pode ser obtido tomando
ℓ = 0, 1, . . . , N − 1 ,
(6.4.19)
6.4 O átomo de hidrogénio (sem spin)
183
E
r
V(r)
Figura 6.5: Espectro de energias do Hidrogénio versus o potencial; compare-se com o caso
do oscilador harmónico exibido na figura 5.1.
e o correspondente n0 para complementar. Assim temos uma degenerescência de
grau N. Na notação dos espectroscopistas a cada valor de ℓ = 0, 1, 2 . . . é atribuı́do
uma letra, respectivamente ℓ = s, p, d, f, g, . . . seguindo-se a ordem alfabética. É por
isso usual encontrar uma referência, por exemplo, à orbital 2p, o que significa N = 2,
ℓ = 1. Esta degenerescência é exibida na figura 6.4;
• Para cada ℓ temos 2ℓ + 1 valores possı́veis de m
m = −ℓ, −ℓ + 1, . . . , ℓ − 1, ℓ ;
(6.4.20)
Assim o grau total de degenerescência é, para o nı́vel N
1 + 3 + 5 + . . . + 2N − 1 = N 2 .
(6.4.21)
Orbitais
Para exibirmos a forma explı́cita das funções de onda, também designadas neste contexto
por orbitais, notamos que se introduzirmos o raio de Bohr
a0 ≡
4πǫ0 ~2
,
me e2
(6.4.22)
~2 1
,
2me a20 N 2
(6.4.23)
o espectro de energias (6.4.18) escreve-se
EN = −
184
Momento Angular Orbital e o Átomo de Hidrogénio
Figura 6.6: Funções de onda radiais f(1,0) , f(2,0) e f(2,1) ; na notação da figura R(n,ℓ) = f(N,ℓ)
(extraı́do de Cohen et al., ‘Quantum Mechanics’).
e como tal a transformação (6.4.15) fica
z=
2
r.
a0 N
(6.4.24)
Deste modo, a função de onda radial (6.4.2) fica
n+ℓ+1
2r
W (z = 2r/Na0 )
e−r/a0 N X
R(r)
bn
=
=
f(N,ℓ) (r) =
.
r
r
r
Na
0
n
(6.4.25)
Notando que usando (6.4.23) em (6.4.16) obtemos k = N, a relação de recorrência é
bn+1 =
n+ℓ+1−N
bn .
(n + 1)(n + 2ℓ + 2)
A relação de normalização será em geral
Z ∞
∗
f(N,ℓ) f(N,ℓ)
r 2 dr = 1 .
(6.4.26)
(6.4.27)
0
Exemplos:
• Estado fundamental: N = 1 ⇒ ℓ = 0; a relação de recorrência reduz-se a
bn+1 =
n
bn ,
(n + 1)(n + 2)
⇒
b0 ≡ C , bn = 0, n ≥ 1 .
(6.4.28)
6.4 O átomo de hidrogénio (sem spin)
185
Logo
f(1,0) =
2C −r/a0
e
.
a0
(6.4.29)
Normalizando,
Z
+∞
r 2 e−2r/a0 dr =
0
a30
4
√
C = 1/ a0 ,
normalizar
⇒
(6.4.30)
onde integramos por partes. Deste modo a função de onda total para o primeiro nı́vel
do átomo de hidrogénio, Ψ(N,ℓ,m) (t, r, θ, φ), é
1 e−r/a0 −iE1 t/~
Ψ(1,0,0) (t, r, θ, φ) = f(1,0) (r)Y00 (θ, φ)e−iE1 t/~ = √
e
.
π (a0 )3/2
(6.4.31)
• Orbital 2s: N = 2, ℓ = 0; a relação de recorrência reduz-se a
bn+1 =
n−1
bn ,
(n + 1)(n + 2)
⇒
b0 ≡ C , b1 = −
C
, bn = 0, n ≥ 2 .
2
(6.4.32)
Logo
f(2,0)
C
=
2a0
r
2−
e−r/2a0 .
a0
(6.4.33)
Normalizando,
Z
+∞
0
r n e−r/a0 dr = (n − 1)!an+1
0
normalizar
⇒
√
C = 1/ 2a0 ,
(6.4.34)
onde integramos por partes. Logo a função de onda total para a orbital 2s do átomo
de hidrogénio, é
Ψ(2,0,0) (t, r, θ, φ) =
f(2,0) (r)Y00 (θ, φ)e−iE2 t/~
1
= √
4 2π
r
2−
a0
e−r/2a0 −iE2 t/~
e
.
(a0 )3/2
(6.4.35)
• As funções de onda radiais para os nı́veis seguintes serão exponenciais multiplicadas por
um polinómio de r; na figura 6.6 estão representadas f(1,0) , f(2,0) e f(2,1) .
Repetindo este raciocı́nio para todas as orbitais dos três primeiros nı́veis de energia do
átomo de Hidrogénio obtemos a seguinte tabela:
186
Momento Angular Orbital e o Átomo de Hidrogénio
N
ℓ
m
1
0
0
2
0
0
2
1
0
2
1 ±1
3
0
0
3
1
0
3
1 ±1
3
2
3
2 ±1
3
2 ±2
0
Função de onda
1 e−r/a0 −iE1 t/~
e
Ψ(1,0,0) (t, r, θ, φ) = √
π (a0)3/2
1
r e−r/2a0 −iE2 t/~
e
Ψ(2,0,0) (t, r, θ, φ) = √
2−
a0 (a0 )3/2
4 2π
1 r e−r/2a0
cos θe−iE2 t/~
Ψ(2,1,0) (t, r, θ, φ) = √
3/2
a
(a
)
4 2π 0 0
1 r e−r/2a0
sin θe±iφ e−iE2 t/~
Ψ(2,1,±1) (t, r, θ, φ) = √
3/2
8 π a
0 (a0 )
r 2 e−r/3a0 −iE3 t/~
r
1
e
27 − 18 + 2 2
Ψ(3,0,0) (t, r, θ, φ) = √
3/2
a
a
(a
)
81√ 3π
0
0
0
2
r e−r/3a0
r
cos θe−iE3 t/~
6−
Ψ(3,1,0) (t, r, θ, φ) = √
81 π a0 a0 (a0 )3/2
1
r e−r/3a0
r
Ψ(3,1,±1) (t, r, θ, φ) = √
sin θe±iφ e−iE3 t/~
6−
3/2
a0 a0 (a0 )
81 π
1 r 2 e−r/3a0
(3 cos2 θ − 1)e−iE3 t/~
Ψ(3,2,0) (t, r, θ, φ) = √
2
3/2
a
(a
)
81 6π 0 0
1 r 2 e−r/3a0
sin θ cos θe±iφ e−iE3 t/~
Ψ(3,2,±1) (t, r, θ, φ) = √ 2
3/2
81 π a0 (a0 )
1 r 2 e−r/3a0
√
sin2 θe±2iφ e−iE3 t/~
Ψ(3,2,±2) (t, r, θ, φ) =
162 π a20 (a0 )3/2
Note-se que a densidade de probabilidade na direcção radial tem a forma
∗
P(N,ℓ) (r)dr = r 2 f(N,ℓ) f(N,ℓ)
dr ,
(6.4.36)
que pode ser representada como na figura 6.7. Juntando esta informação com a dos
harmónicos esféricos obtemos uma representação da densidade de probabilidade electrónica
das orbitais do átomo de hidrogénio dada na figura 6.8. Novas orbitais, ditas hı́bridas, podem ser construı́das sobrepondo diferentes orbitais com o mesmo N.
Terminamos esta secção com a observação que na notação de Dirac, as orbitais do
átomo de hidrogénio podem ser escritas como os estados {|N, ℓ, mi}, que diagonalizam o
C.C.O.C. composto por Ĥ, L̂2 , L̂z e que obedecem a
Ĥ|N, ℓ, mi = EN |N, ℓ, mi = −
2
2
L̂ |N, ℓ, mi = ~ ℓ(ℓ + 1)|N, ℓ, mi ,
~2
|N, ℓ, mi ,
2me a20 N 2
L̂z |N, ℓ, mi = m~|N, ℓ, mi ,
onde N ∈ N e ℓ, m ∈ N0 com as restrições 0 ≤ ℓ ≤ N − 1 e |m| ≤ ℓ.
(6.4.37)
6.4 O átomo de hidrogénio (sem spin)
187
Figura 6.7: Densidade de probabilidade na direcção radial para as funções de onda do
átomo de hidrogénio (extraı́do de Eisberg & Resnick, ‘Quantum Physics’).
188
Momento Angular Orbital e o Átomo de Hidrogénio
Figura 6.8: Representação artı́stica das primeiras orbitais do átomo de hidrogénio (extraı́do
de Eisberg & Resnick, ‘Quantum Physics’).
6.5 O átomo de hidrogénio (sem spin) num campo magnético
6.5
189
O átomo de hidrogénio (sem spin) num campo
magnético
Vimos na secção anterior a resolução exacta do problema do átomo de hidrogénio (sem
spin) em Mecânica Quântica. Na secção 5.3 tinhamos visto a resolução exacta do problema de uma carga num campo magnético uniforme. Vamos agora combinar estes dois
problemas e considerar que o átomo de hidrogénio está imerso num campo magnético, que
tomamos como sendo uniforme. Note-se que esta última hipótese é perfeitamente adequada
à experimentação, uma vez que os campos magnéticos produzidos no laboratório variam
muito pouco em escalas da ordem do tamanho atómico.
Não nos irá ser possı́vel, neste caso, a resolução exacta do problema. Mas com algumas
aproximações conseguiremos determinar a alteração do espectro do átomo de hidrogénio
devida ao campo magnético, denominada Efeito Zeeman.
6.5.1
Dedução dos vários termos do Hamiltoniano
O Hamiltoniano clássico para um electrão (carga q massa me ), num campo electromagnético
é dado por (1.3.20)
H=
~ 2
(~p − q A)
+ qφ .
2me
(6.5.1)
~ uniforme, podemos escrever o potencial magnético na forma
Sendo o campo B
~ = − 1 ~r × B
~
A
2
⇔
~ = − 1 (yBz − zBy , zBx − xBz , xBy − yBx ) ;
A
2
(6.5.2)
~ é constante, segue-se que
de facto, como B
~ = (Bx , By , Bz ) = B
~ ,
∇×A
(6.5.3)
como é necessário pela definição de potencial magnético. Logo, para o problema quântico,
expressamos o operador Hamiltoniano, obtido por quantificação canónica, na forma:
Ĥ =
h
i2
~
~
~
P̂ + 2q R̂ × B
2me
~
+ qφ(R̂) .
(6.5.4)
190
Momento Angular Orbital e o Átomo de Hidrogénio
~ sendo constante não é operador. Tratemos do quadrado perfeito
Note-se que B
i2 h
i h
i
h
q~
q~
q~
~
~
~
~ = P̂
~ · P̂
~
+ R̂ × B
+ R̂ × B
P̂ + R̂ × B
2
2
2
q2 2
~2 q ~ ~
~
~
~
~ + (R̂ × B)
~ · P̂ +
~ .
= P̂ +
P̂ · (R̂ × B)
R̂ × B
2
4
(6.5.5)
Consideremos as seguintes identidades do cálculo vectorial
~ × B)
~ · (C
~ × D)
~ = (A
~ · C)(
~ B
~ · D)
~ − (A
~ · D)(
~ B
~ · C)
~ ,
(A
~ · (B
~ × C)
~ =C
~ · (A
~ × B)
~ ,
A
(6.5.6)
sendo que a segunda pode ser reescrita como
~ × B)
~ ·C
~ = −(A
~ × C)
~ ·B
~ .
(A
(6.5.7)
Aplicando estas identidades a (6.5.5) obtemos
h
q2 2
i2
q~
~
~2 q ~ ~ ~
~ ~ ~
~ ~2
~ ~ 2
~
P̂ + R̂ × B = P̂ +
B · (P̂ × R̂) − (R̂ × P̂ ) · B +
R̂ B − (R̂ · B) .
2
2
4
(6.5.8)
Verificamos que surge o operador momento angular
~
~ ~
~ ~
L̂ = R̂ × P̂ = −P̂ × R̂ ,
(6.5.9)
~
~
onde a segunda igualdade é verdadeira apesar de R̂ e P̂ não comutarem; de facto cada
componente do momento angular é da forma X̂ i P̂j − X̂ j P̂i com i 6= j, pelo que a ordem
com que aparecem as posições e os momentos é irrelevante. Logo o Hamiltoniano do
problema é
~2
P̂
q ~ ~
q2 2 ~ 2
~
~ ~ 2
Ĥ =
+ qφ(R̂) ,
R̂ B − (R̂ · B)
−
L̂ · B +
2me 2me
8me
(6.5.10)
que reescrevemos como
Ĥ ≡ Ĥ0 + Ĥ1 + Ĥ2 ,
(6.5.11)
onde definimos
~2
P̂
~
+ qφ(R̂) ,
Ĥ0 ≡
2me
Ĥ1 ≡ −
µB ~ ~
L̂ · B ,
~
Ĥ2 ≡
~2
q2B
R̂2 ,
8me ⊥
(6.5.12)
6.5 O átomo de hidrogénio (sem spin) num campo magnético
191
e ainda, o magnetão de Bohr
µB ≡
q~
,
2me
(6.5.13)
que tem as dimensões de um momento magnético (carga vezes momento angular a dividir
por massa), e o operador
~ ~ 2
~ 2 (R̂ · B)
2
R̂⊥
= R̂ −
,
~2
B
(6.5.14)
~
~ Se escolhermos um sistema cartesiano
que é a projecção de R̂ num plano perpendicular a B.
~ = Bez , fica
eB
2
R̂⊥
= X̂ 2 + Ŷ 2 .
(6.5.15)
Notemos os casos limites deste Hamiltoniano:
~ = 0, Ĥ fica reduzido a Ĥ0 , que, com o potencial de Coulomb é o problema
• Tomando B
da secção 6.4;
~ = Bez , Ĥ fica
• Tomando φ = 0 e escolhendo B
Ĥ =
P̂x2 + P̂y2 + P̂z2
qB
q2B 2 2
−
L̂z +
X̂ + Ŷ 2 ,
2me
2me
8me
(6.5.16)
que coincide com o Hamiltoniano (5.3.4) do problema de Landau.
6.5.2
Interpretação dos vários termos do Hamiltoniano
~ = 0 o Hamiltoniano reduz-se a Ĥ0 , isto é a soma da energia cinética com a
Quando B
~ =
energia potencial. Mas quando B
6 0, Ĥ0 já não pode ser interpretado como a energia
cinética mais a energia potencial. Para verificarmos este ponto consideremos a seguinte
análise clássica. O Hamiltoniano de uma carga sob a acção de um campo electromagnético
é dado por (1.3.20) que podemos reescrever em termos da velocidade
H=
~ 2
(~p − q A)
1
2
+ qφ = me~x˙ + qφ ,
2me
2
(6.5.17)
logo a energia cinética na presença de um campo magnético é
Ec =
~ 2
(~p − q A)
,
2me
(6.5.18)
192
Momento Angular Orbital e o Átomo de Hidrogénio
~ Para um
e não p~2 /2me . O significado fı́sico de p~2 /2me depende da gauge escolhida para A.
~ uniforme, com a escolha de gauge (6.5.2) e tomando B
~ = Bez temos (usando a
campo B
frequência ciclotrónica ωc = qB/me )
~p
q
~ = p~ − ωc r (cos φey −sin φex )
~x˙ =
+
~r × B
me 2me
me
2
⇔
~p
ωc r
= ~x˙ −
(sin φex −cos φey ) ,
me
2
(6.5.19)
ou seja a ‘velocidade’ p~/me é a velocidade da partı́cula relativamente a um referencial em
rotação em torno da direcção do campo uniforme, com velocidade angular ωc /2, no sentido
directo, denominado referencial de Larmor. Assim,
• H0 é a energia cinética da partı́cula relativamente ao referencial de Larmor mais a energia
potencial;
• H2 , que coincide com
i2
me h ωc r
(sin φex − cos φey ) ,
2
2
(6.5.20)
é a energia cinética do referencial de Larmor;
• H1 é um termo cruzado que surge sempre que a velocidade da partı́cula relativamente
ao referencial de Larmor não seja ortogonal à velocidade do referencial de Larmor.
A interpretação que acabamos de dar dos vários termos é puramente mecânica. Mas
os termos Ĥ1 e Ĥ2 têm também uma interpretação electromagnética de interesse. Para
a compreendermos consideramos novamente uma análise clássica. Define-se geralmente a
densidade de momento magnético (ou magnetização) como sendo
i
1h
~
~
M(~x) =
~x × i(~x) ,
2
(6.5.21)
onde ~i é o vector densidade de corrente; o integral da densidade de magnetização é a
magnetização total ou momento magnético total ou ainda o dipolo magnético
1
~µ =
2
Z
V
~x × ~i(~x)d3~x .
(6.5.22)
6.5 O átomo de hidrogénio (sem spin) num campo magnético
193
No caso em que uma corrente com intensidade I só existe ao longo de um circuito fechado
e planar, com elemento de linha d~l, o integral de volume reduz-se a um integral de linha
fechado
I
~µ =
2
I
~x × d~l = AIn ,
(6.5.23)
onde n é a ortogonal ao plano com orientação dada pelo sentido da corrente e A é a área
planar delimitada pelo circuito. Se considerarmos uma carga com movimento circular e
uniforme com velocidade angular v/r = ω, associamos-lhe uma intensidade de corrente
I = densidade de carga × velocidade =
qv
;
2πr
(6.5.24)
como a superfı́cie delimitada pelo circuito tem área A = πr 2 , o momento magnético é
~µ = IAn =
qvr
n.
2
(6.5.25)
~ de uma tal carga com um movimento circular
Consideremos agora o momento angular L
e uniforme anterior que se move num campo magnético constante que representamos na
gauge (6.5.2); por definição
~ ,
~ = ~r × ~p = ~r × (me~v + q A)
~ = me rvn − q ~r × (~r × B)
L
2
(6.5.26)
que usando a identidade
~a × (~b × ~c) = ~b(~a · ~c) − ~c(~a · ~b) ,
e (6.5.25) reescrevemos como
i
qh
2me
2~
~
~
(~r · B)~r − r B
~µ −
L=
q
2
⇔
(6.5.27)
i
q ~
q2 h
2~
~
~µ =
L+
(~r · B)~r − r B . (6.5.28)
2me
4me
Assim, a nossa carga tem duas contribuições para o seu momento magnético. Uma devido a
estar numa órbita circular e consequentemente ter momento angular; uma segunda devido
a estar imersa num campo magnético. A densidade de energia3 devida à interacção entre
o momento magnético e um campo magnético externo é
i
q ~ ~
q2 h 2 2
~
~ 2 ,
dH = −~µ · dB
⇒
H=−
L·B+
r B − (~r · B)
2me
8me
(6.5.29)
~ onde
Em sistemas magnéticos a segunda lei da termodinâmica pode ser escrita dF = −SdT − µ
~ · dB,
F é a energia livre de Helmholtz.
3
194
Momento Angular Orbital e o Átomo de Hidrogénio
que são exactamente os análogos clássicos dos termos Ĥ1 e Ĥ2 em (6.5.10). Assim o termo
H1 pode ser escrito como
~ ,
H1 = −~µL · B
(6.5.30)
onde
~µL =
q ~
L.
2me
(6.5.31)
Este termo é, portanto, a energia de acoplamento entre o campo magnético externo e o
momento magnético do electrão que resulta do seu momento angular, ~µL . É denominado
acoplamento paramagnético, pois é energeticamente vantajoso o momento magnético do
electrão encontrar-se paralelo ao campo externo. Por outro lado, o termo H2 , é a energia
de acoplamento entre o campo magnético externo e o momento magnético do electrão que
é induzido pelo próprio campo externo. A sua contribuição para a energia é positiva pelo
que este momento magnético induzido é anti-paralelo ao campo indutor. É denominado
acoplamento diamagnético. Como veremos na próxima secção, o acoplamento diamagnético
é bem menos importante que o paramagnético e só tem de ser considerado em estados com
momento angular zero. Na natureza, substâncias diamagnéticas consistem de átomos ou
moléculas com momento angular total zero. A aplicação de um campo magnético externo
leva à criação de correntes atómicas em circulação que produzem um momento magnético
antiparalelo ao campo externo; de facto, o termo diamagnético é o associado ao referencial
de Larmor, como vimos em cima. O Bismuto é a substância mais diamagnética conhecida.
Se os átomos ou moléculas constituintes da substância tiverem um momento angular total
não nulo, oriundo de electrões desemparelhados, a substância é paramagnética. Imerso
num campo magnético, o momento magnético do electrão desemparelhado alinhar-se-á
paralelamente ao campo.
Nota: Em geral, uma carga q (massa m) com momento angular J~, seja ele de origem
orbital ou intrı́nseco (spin), tem um momento magnético dado por
~µ = g
q ~
J ,
2m
(6.5.32)
6.5 O átomo de hidrogénio (sem spin) num campo magnético
195
onde g se denomina a razão giromagnética. Para uma carga clássica com o J~ de origem
orbital, g = 1 - como exemplificado em cima - mas para o electrão com o seu J~ intrı́nseco,
verifica-se que g ≃ 2. De facto g = 2 é a previsão da equação de onda relativista (eq.
de Dirac), mas efeitos associados às flutuações quânticas do vácuo alteram ligeiramente
este valor, denominado por razão giromagnética anómala. Este valor pode ser calculado
em electrodinâmica quântica (QED) com grande precisão e o acordo com a experiência
verifica-se com 10 algarismos significativos!
6.5.3
Comparação dos vários termos no Hamiltoniano
~ =0
Vamos agora comparar as ordens de magnitude dos três termos em (6.5.10). Quando B
ficamos apenas com Ĥ0 , cujo espectro de energias é (6.4.23). Como tal associamos com
este termo energias da ordem de
E0 ∼
~2
.
me a20
(6.5.33)
Pela forma do operador Ĥ1 (6.5.12), tomando um campo magnético na direcção z e recordando que os valores próprios de L̂z são inteiros vezes ~ concluimos que dará origem a
energias da ordem de
E1 ∼
qB~
.
me
(6.5.34)
2
Por outro lado, assumindo que os elementos de matriz do operador R̂⊥
são da ordem de
grandeza de a20 , dado que o raio de Bohr caracteriza as distâncias atómicas, temos que
q 2 B 2 a20
.
E2 ∼
me
(6.5.35)
Concluimos imediatamente as seguintes ordens de grandeza relativas:
E2
E1
Bqa20
∼
∼
∼ B(Tesla) × 10−5 .
E1
E0
~
(6.5.36)
Sendo os maiores campos magnéticos produzidos em laboratório da ordem dos 100 Tesla,
concluimos que nessas experiências E2 ≪ E1 ≪ E0 .
196
Momento Angular Orbital e o Átomo de Hidrogénio
6.5.4
Espectro de Energias aproximado: efeito Zeeman
Vamos agora então levar a cabo a tarefa a que nos propusemos: ver como o espectro de um
átomo de hidrogénio se altera quando imerso num campo magnético. A aproximação que
vamos usar é a de negligenciar o termo Ĥ2 , que, como vimos na secção anterior, tem uma
grandeza inferior aos outros dois. Assim, consideramos como Hamiltoniano aproximado
~2
q ~ ~
P̂
~
+ qφ(R̂) −
L̂ · B .
Ĥ ≃ Ĥ0 + Ĥ1 =
2me
2me
(6.5.37)
Ao fazermos esta aproximação, o único operador novo relativamente ao problema do átomo
~ ~
de hidrogénio sem campo magnético (descrito por Ĥ0 ) é L̂ · B;
no problema sem campo
~ = Bez , verificamos que o
magnético tomamos o C.C.O.C.= {Ĥ0 , L̂2 , L̂z }. Tomando B
único operador no termo novo é L̂z , que é diagonalizado pelos mesmos estados que diagonalizam Ĥ0 , que têm a forma (6.4.37). A acção do operador Hamiltoniano nestes estados
é dada por
Ĥ|N, ℓ, mi = −
qB
~2
−
m~ |N, ℓ, mi ,
2me a20 N 2 2me
(6.5.38)
pelo que o espectro de energias é agora
E(N,m) = EN − µB Bm ,
(6.5.39)
onde EN é espectro do átomo de hidrogénio livre, dado por (6.4.23). Há, portanto um
levantamento da degenerescência do espectro de energias; estados com o mesmo número
quântico principal, N, mas diferente número quântico azimutal, m, irão em geral ter diferentes energias: efeito Zeeman. Mas note-se que a degenerescência do espectro de energias
não é totalmente eliminada; resiste ainda a degenerescência que origina de estados com
diferente ℓ mas com o mesmo N e m. Deste modo a degenerescência decresce de N 2 para
N − |m| (para valores genéricos de B).
Duas notas:
• A aproximação falha para estados com m = 0; para esses, a primeira correcção ao espectro do átomo de hidrogénio origina no termo negligenciado (termo diamagnético);
6.5 O átomo de hidrogénio (sem spin) num campo magnético
Sem Campo Magnetico
Espectro sem Campo
197
Com Campo Magnetico
Espectro com Campo
Figura 6.9: Efeito Zeeman: Desdobramento das linhas espectrais devido à presença de um
campo magnético. Note-se que nem todas as transições são possı́veis; de facto há regras
de selecção.
• Na realidade, tanto o electrão como o protão têm spin, que estamos aqui a negligenciar.
Por essa razão, o espectro anterior não é o observado numa experiência fı́sica real.
Mas a inclusão de spin é uma generalização simples do cálculo aqui exemplificado e
o efeito fı́sico da alteração das energias (e também das polarizações que veremos a
seguir) permanece válido qualitativamente.
A presença do campo magnético altera genericamente, como vimos, a energia dos estados estacionários do átomo de hidrogénio. Como tal, a frequência da radiação emitida em
transições atómicas é também alterada. Em geral existe um desdobramento das riscas espectrais, como exemplificado na figura 6.9. Mas para além desta alteração das frequências
possı́veis, o efeito Zeeman consiste também na alteração da polarização dos fotões emitidos numa transição atómica. Para estudarmos este ponto, consideramos o operador dipolo
eléctrico, definido por
~
~
D̂ ≡ q R̂ .
(6.5.40)
Consideremos os elementos de matriz deste operador num estado estacionário do átomo
de hidrogénio imerso no campo magnético. Continuamos a considerar a aproximação em
198
Momento Angular Orbital e o Átomo de Hidrogénio
que negligenciamos o termo diamagnético. Estes estados são os mesmos dos átomo de
hidrogénio livre {|N, ℓ, mi}, apenas possuindo energias diferentes. Estes estados têm uma
paridade bem definida. Pode-se verificar que Yℓm tem paridade (−1)ℓ . Logo, os estados
~
{|N, ℓ, mi} têm paridade (−1)ℓ . Por outro lado, o operador D̂ é ı́mpar. Logo
~
hN, ℓ, m|D̂|N, ℓ, mi = 0 ,
(6.5.41)
em qualquer estado estacionário. Para termos um dipolo diferente de zero temos de considerar uma sobreposição de estados estacionários. Tomemos uma sobreposição dos estados
1s e 2p, isto é
|Ψ(0)i = cos α|1, 0, 0i + sin α|2, 1, mi ,
(6.5.42)
onde m = 0, ±1 e α ∈ R. A energia destes dois estados é
E1s = E1 ,
E2p = E2 − µB Bm = E1 + ~(Ω + mωL ) ,
(6.5.43)
onde EN é dado por (6.4.23), e introduzimos
Ω≡
E2 − E1
,
~
ωL ≡ −
ωc
,
2
(6.5.44)
respectivamente a frequência angular associada a um fotão emitido na transição de N = 2
para N = 1 do átomo de hidrogénio livre e a frequência angular do referencial de Larmor.
Logo
|Ψ(t)i = cos α|1, 0, 0i + sin αe−i(Ω+mωL )t |2, 1, mi e−iE1 t/~ .
(6.5.45)
Vamos agora calcular o valor esperado do operador dipolo neste estado
~
~
hD̂i(t) = hΨ(t)|D̂|Ψ(t)i
.
~
~
i(Ω+mωL )t
−i(Ω+mωL )t
= sin α cos α e
h2, 1, m|D̂|1, 0, 0i + e
h1, 0, 0|D̂|2, 1, mi
(6.5.46)
Para calcularmos estes elementos de matriz notamos que
~
D̂ = (D̂x , D̂y , D̂z ) = q(X̂, Ŷ , Ẑ) .
(6.5.47)
6.5 O átomo de hidrogénio (sem spin) num campo magnético
199
Por outro lado, recordando a forma dos harmónicos esféricos com ℓ = 1, dada por (6.2.45),
(6.2.46) e (6.2.47), podemos escrever estes harmónicos em coordenadas cartesianas como
r r
3 z
3 x
y
±1
0
;
(6.5.48)
,
Y1 = ∓
±i
Y1 =
4π r
8π r
r
invertendo estas relações obtemos
r
r
2π
2π
−1
1
x=
r Y1 − Y1 , y = i
r Y1−1 + Y11 ,
3
3
z=
r
4π 0
rY .
3 1
(6.5.49)
Deste modo, usando a representação do produto escalar no espaço de configurações temos
h1, 0, 0|D̂x|2, 1, mi =
r
Z 2π
Z π Z +∞
2π
2
0 ∗
=
r Y1−1 − Y11 f(2,1) (r)Y1m
dφ
dθ
drr sin θ f(1,0) (r)Y0 q
3
0
Z 2π 0 Z π 0
qχ
=√
dφ
dθ sin θ Y1−1 − Y11 Y1m ,
6 0
0
(6.5.50)
onde definimos
χ≡
Z
+∞
r 3 f(1,0) (r)f(2,1) (r)dr ,
(6.5.51)
0
e usamos o facto que as funções de onda radiais são reais. Usamos também o valor de Y00 =
√
1/ 4π. Usamos agora o facto de que os harmónicos esféricos são uma base ortonormal do
espaço de funções de quadrado somável na esfera. A relação de ortonormalização é
Z 2π
Z π
′
mm′
dφ
dθ sin θ(Yℓm (θ, φ))∗ Yℓm
.
(6.5.52)
′ (θ, φ) = δℓℓ′ δ
0
0
Logo, dado que (Y1±1 )∗ = −Y1∓1
Z
Z π
∗
qχ 2π
qχ
dφ
h1, 0, 0|D̂x|2, 1, mi = √
dθ sin θ −Y11 + Y1−1 Y1m = √ (−δ 1m + δ −1m ) .
6 0
6
0
(6.5.53)
Cálculos análogos revelam que
Z
Z π
qχ
qχ 2π
dφ
dθ sin θi Y11 + Y1−1 Y1m = −i √ (δ 1m + δ −1m ) ,
h1, 0, 0|D̂y |2, 1, mi = √
6 0
6
0
(6.5.54)
Z
Z π
qχ 2π
qχ
h1, 0, 0|D̂z |2, 1, mi = √
(6.5.55)
dφ
dθ sin θY10 Y1m = √ δ 0m .
3 0
3
0
200
Momento Angular Orbital e o Átomo de Hidrogénio
Podemos agora concluir que o valor esperado das várias componentes do operador dipolo
eléctrico é o seguinte:
qχ
hD̂x i(t) = √ sin(2α) cos[(Ω − ωL )t]δ −1m − cos[(Ω + ωL )t]δ 1m ,
6
qχ
hD̂y i(t) = − √ sin(2α) sin[(Ω − ωL )t]δ −1m + sin[(Ω + ωL )t]δ 1m ,
6
qχ
hD̂z i(t) = √ sin(2α) cos(Ωt)δ m0 .
3
(6.5.56)
(6.5.57)
(6.5.58)
Para qualquer um dos três valores possı́veis de m, o valor esperado do dipolo eléctrico
é uma função oscilatória do tempo. Logo haverá emissão de radiação electromagnética.
Podemos pensar nessa radiação como sendo emitida devido à transição |2, 1, mi → |1, 0, 0i.
Para estudarmos as caracterı́sticas dessa radição tomemos os três valores possı́veis de m
separadamente:
• m = +1, temos
qχ
qχ
hD̂y i(t) = − √ sin(2α) sin[(Ω + ωL )t] ,
hD̂x i(t) = − √ sin(2α) cos[(Ω + ωL )t] ,
6
6
hD̂z i(t) = 0 .
(6.5.59)
A frequência angular da radiação emitida, ωrad , é igual à frequência angular de oscilação do dipolo:
ωrad = Ω + ωL
⇒
νrad =
E(2,1) − E(1,0)
ωrad
(E2 − µB B) − E1
=
=
, (6.5.60)
2π
h
h
que é exactamente a frequência esperada na transição |2, 1, 1i → |1, 0, 0i. A polarização da radiação emitida vai depender da direcção. Consideremos a direcção com
versor ~n. De acordo com o electromagnetismo clássico, o estado de polarização da
radiação será dado pelo vector
~k p = (~n × D)
~ × ~n = D
~ − ~n(~n · D)
~ ⇔
(kxp , kyp , kzp ) = ((1 − n2x )Dx − nx ny Dy , (1 − n2y )Dy − nx ny Dx , −nz (nx Dx + ny Dy )) ,
(6.5.61)
~ num plano ortogonal a ~n.
que corresponde a projecção de D
6.5 O átomo de hidrogénio (sem spin) num campo magnético
201
- Radiação emitida na direcção Oz: nx = ny = 0, logo
~k p = D
~ ⇒ (k p )2 + (k p )2 = constante ;
x
y
(6.5.62)
A polarização é circular no sentido directo que é o movimento efectuado pelo
vector dipolo eléctrico;
- Radiação emitida na direcção xOy: nz = 0, logo n2x + n2y = 1, pelo que
~k p = (ny (ny Dx − nx Dy ), nx (nx Dy − ny Dx ), 0) ⇒ nx k p = −ny k p ; (6.5.63)
x
y
A polarização é linear;
- Numa direcção arbitrária a polarização é elı́ptica.
• m = 0, temos
hD̂x i(t) = 0 ,
hD̂y i(t) = 0 ,
qχ
hD̂z i(t) = √ sin(2α) cos(Ωt) .
3
(6.5.64)
A frequência angular é
ωrad = Ω
⇒
νrad =
E(2,0) − E(1,0)
ωrad
E2 − E1
=
=
,
2π
h
h
(6.5.65)
que é exactamente a frequência esperada na transição |2, 1, 0i → |1, 0, 0i. A polarização neste caso é linear em todas as direcções excepto na direcção Oz, em que não
é emitida radiação.
• m = −1, temos
qχ
qχ
hD̂y i(t) = − √ sin(2α) sin[(Ω − ωL )t] ,
hD̂x i(t) = √ sin(2α) cos[(Ω − ωL )t] ,
6
6
hD̂z i(t) = 0 .
(6.5.66)
A frequência angular da radiação emitida é igual à frequência angular de oscilação
do dipolo:
ωrad = Ω − ωL
⇒
νrad =
E(2,−1) − E(1,0)
ωrad
(E2 + µB B) − E1
=
=
, (6.5.67)
2π
h
h
202
Momento Angular Orbital e o Átomo de Hidrogénio
(E 2 − E1 )/h
ν
(E 2 − E1 )/h
ν
Figura 6.10: Efeito Zeeman - esquerda: riscas observadas na direcção perpendicular ao
~
campo; a polarização da radiação é linear em todas elas, mas é paralela ao campo B
na risca central e perpendicular nas riscas laterais; direita: riscas observadas na direcção
do campo; têm polarização circular. O espaçamento entre a risca central e as laterais é
∆ν = µB B/h (adaptado de Cohen et al., ‘Quantum Mechanics’).
que é exactamente a frequência esperada na transição |2, 1, −1i → |1, 0, 0i. A análise
da polarização é semelhante à do caso m = +1, com a diferença de ser circular inversa
para a emissão na direcção Oz.
As riscas espectrais que acabamos de discutir estão representadas na figura 6.10. Note-se
que o resultado da introdução do campo magnético, efeito Zeeman, é não só o aparecimento
de novas riscas, mas também de diferentes polarizações.
Como nota final mencionamos que o tratamento da radiação dado nesta secção foi
clássico, ao contrário do dado ao átomo que foi quântico. Note-se que usamos o teorema
~
~
e assim deduzirmos
de Ehrenfest para associarmos hD̂(t)i com quantidade clássica D(t)
a polarização da radiação. Neste sentido, usamos uma aproximação semi-clássica para o
problema ‘átomo+radiação’.
6.6
Sumário
Estudamos os operadores que descrevem as várias componentes do momento angular e
também o momento angular total. Em mecânica clássica, para descrever o momento angular de um sistema fı́sico necessitamos de três números, correspondendo às três componentes
do momento angular. Em mecânica quântica os estados próprios do momento angular têm
apenas dois números quânticos, correspondendo ao número máximo de operadores que
6.6 Sumário
203
conseguimos diagonalizar simulaneamente: L̂2 e, por escolha, L̂z . Construimos explicitamente a representação no espaço de configurações das funções próprias comuns a estes dois
operadores denominadas harmónicos esféricos. Consideramos uma partı́cula num potencial
central e mostramos que os estados estacionários vão ter também momento angular bem
definido. Especializando para o potencial de Coulomb, deduzimos as funções de onda que
diagonalizam simultaneamente a energia, o momento angular total e o momento angular
azimutal. Obtemos como resultado (e de primeiros princı́pios) a quantificação da energia
que havı́amos estudado no capı́tulo 2 para o átomo de hidrogénio no modelo de Bohr, que
reproduzia a fórmula de Balmer para o espectro do hidrogénio. Note-se no entanto que o
nosso estudo do átomo de hidrogénio foi incompleto devido à não inclusão do spin. Esta
quantidade leva à existência no espectro do hidrogénio duma sub estrutura do espectro
que nós deduzimos, denominada estrutura fina. Mergulhamos o átomo de hidrogénio num
campo magnético uniforme. Usando uma aproximação em que negligenciamos o termo diamagnético, verificamos o levantamento de parte da degenerescência do espectro de energias
correspondendo a inequivalência energética de estados com diferente número quântico azimutal e mesmo número quântico principal. Este facto leva ao aparecimento de novas riscas
no espectro do hidrogénio. Estudando o operador dipolo eléctrico vimos também o tipo de
polarização correspondente a essas riscas.
CAPÍTULO
7
Outras soluções exactas da equação de Schrödinger
Soluções analı́ticas exactas da equação de Schrödinger existem apenas para alguns casos
especiais; potencias constantes por pedaços (capı́tulo 3), osciladores harmónicos, campos
magnéticos constantes (capı́tulo 5) e o potencial de Coulomb (capı́tulo 6) são alguns destes
casos que foram estudados aqui. Dada esta limitação, foram construidos vários métodos
de aproximação que serão estudados nos próximos capı́tulos.
Neste capı́tulo iremos rematar o nosso estudo de modelos exactamente solúveis, procurando esclarecer duas questões:
i) Existe alguma estrutura subjacente aos modelos exactamente solúveis?
ii) Existe algo análogo aos operadores de criação e destruição do oscilador harmónico para
outros modelos exactamente solúveis?
Vamos começar por mencionar alguns modelos solúveis, que ilustrarão a dificuldade que,
genericamente, existe em os resolver através de um ‘ataque’ directo à equação de Schrödinger,
isto é, pelo método diferencial. Seguidamente introduziremos um método algébrico, baseado
em operadores análogos aos operadores de criação e destruição do oscilador harmónico.
Estes operadores resultam do conceito de superpotencial e potenciais parceiros. Finalmente
discutiremos como os potenciais exactamente solúveis têm, genericamente, a propriedade
206
Outras soluções exactas da equação de Schrödinger
de invariância de forma, e como esta propriedade pode ser usada para determinar o espectro de energias e as funções próprias de um modelo exactamente solúvel, o que nos
permitirá construir, resolver e compreender modelos exactamente solúveis.
7.1
Alguns poços de potencial exactamente solúveis
No capı́tulo 3 estudamos potenciais constantes por pedaços. Estes são, obviamente, casos em que existe uma solução exacta da equação de Schrödinger. Não sendo potenciais
realistas são casos paradigmáticos que nos ensinam muita da fı́sica desta equação. Dois
problemas fundamentais em Mecânica Quântica, que são ilustrados pelos exemplos do
capı́tulo 3, são:
• Cálculo do espectro de estados ligados: Sempre que temos um estado com energia E
num potencial cujo valor assimptótico, para ambos os lados, é maior do que E, este
estado é denominado estado ligado. Significa que está “preso” num tipo de poço
de potencial. Sempre que existem estados ligados existe discretização de energias.
A interpretação fı́sica é que nem todos os comprimentos de onda podem existir no
poço de potencial como estados estacionários, devido à interferência com as ondas
reflectidas nas paredes do potencial. O cálculo do espectro de energias de estados
ligados é um importante problema em Mecânica Quântica.
• Cálculo da difusão de uma partı́cula num potencial : A função de onda que descreve
a partı́cula quântica sofre difusão, ou espalhamento, que depende das variações no
espaço e no tempo do potencial onde se propaga. Em problemas a uma dimensão,
esta difusão é quantificada pelos factores de reflexão e transmissão. Em mais do que
uma dimensão iremos definir (capı́tulo 9) uma secção eficaz diferencial de difusão.
Em qualquer dos casos a difusão da função de onda permite calcular a distribuição
de probabilidade espacial de encontar a partı́cula. Esta difusão permite ainda efeitos
fı́sicos inexistentes em Mecânica clássica, como o efeito túnel. Um estado com energia
E tem uma função de onda não nula mesmo em zonas onde o potencial é maior que
a energia (só será zero se o potencial for infinitamente maior do que a energia). Isso
7.1 Alguns poços de potencial exactamente solúveis
207
permite que a função de onda de um estado com energia E seja diferente de zero
em ambos os lados de uma barreira de potencial mais elevado do que o valor de E.
Esta é a origem do efeito túnel. O cálculo do factor de transmissão através de uma
barreira de potencial é também um importante problema em Mecânica Quântica.
Neste capı́tulo debruçar-nos-emos exclusivamente sobre o cálculo dos estados ligados. Notese que a difusão, e em particular o factor de transmissão por efeito túnel, será também
exactamente calculável num modelo solúvel em que o efeito exista (como no potencial de
Pöschl-Teller invertido).
7.1.1
Estados Ligados em Poços infinitos
Comecemos por estudar o espectro de estados ligados em alguns potenciais com profundidade infinita.
Poço de potencial rectangular de profundidade infinita
Como visto na secção 3.2.7, para um poço de profundidade infinita
V (x) = 0 para x ∈ [0, L] ,
V (x) = +∞ para x > L e x < 0 ,
(7.1.1)
o espectro de energias é
En =
n2 π 2 ~2
,
2mL2
n = 1, 2, 3, . . .
e a parte espacial da função de onda normalizada é
r
nπx 2
Φn (x) =
para x ∈ [0, L] ,
sin
L
L
(7.1.2)
(7.1.3)
e zero fora deste intervalo. O espectro de energias e as funções de onda dos três estados
estacionários de energia mais baixa estão representados nas figuras 7.1 e 7.2.
Oscilador Harmónico
Como visto no capı́tulo 5, para o potencial harmónico
V (x) =
mω 2 2
x ,
2
(7.1.4)
208
Outras soluções exactas da equação de Schrödinger
E
E
V(x)
V(x)
x
x
Figura 7.1: Nı́veis de energia no oscilador harmónico e no poço de potencial rectangular
de profundidade infinita.
1
0.6
0.5
0.4
0.2
0
0
-4
-2
0
0
2
0.5
4
1
1.5
2
x
x
-0.2
-0.5
-0.4
-0.6
-1
Figura 7.2: Funções de onda dos três estados estacionários de energia mais baixa do oscilador harmónico e do poço de potencial rectangular de profundidade infinita. Note-se
que o número de nodos aumenta com a energia.
o espectro de energias é
1
En = ~ω n +
,
2
n = 0, 1, 2, . . .
(7.1.5)
e a parte espacial da função de onda normalizada é
Φn (x) =
mω 1/4
π~
√
1
2n · n!
Hn
r
mω
2
x e−mωx /2~ ,
~
(7.1.6)
onde Hn são polinómios de Hermite. O espectro de energias e as funções de onda dos três
estados estacionários de energia mais baixa estão representados nas figuras 7.1 e 7.2.
7.1 Alguns poços de potencial exactamente solúveis
209
5
4
3
2
1
0
0
1
2
3
4
5
x
Figura 7.3: O potencial V (x) = (1/x − x)2 . O espaçamento entre os nı́veis de energia é
constante.
Poço da forma V0 (a/x − x/a)2
O potencial
V (x) = V0
a
x
−
x 2
,
a
x>0,
V0 > 0 ,
(7.1.7)
admite solução analı́tica exacta (ver Folha 1, Problema 1). Este potencial é representado
na figura 7.3. O espectro de energias tem a forma
(
!)
r
r
r
1 1
8V0
8mV0 a2
8mV0 a2
n+ +
+1−
,
En = ~
ma2
2 4
~2
~2
n = 0, 1, 2, . . .
e a parte espacial das funções de onda tem a forma
!
!
r
r
1
mV0 2
2mV0 2
Φn (x) = cn xν exp −
,
x F −n, ν + ,
x
2
2
2~ a
2
~2 a2
onde F (a, b, z) são funções confluentes hipergeométricas,
!
r
1
8mV0 a2
ν≡
+1+1 ,
2
~2
(7.1.8)
(7.1.9)
(7.1.10)
e cn são constantes de normalização. Notamos que a função confluente hipergeométrica
tem expansão
F (a, b; χ) =
+∞
X
(a)p χp
p=0
(b)p p!
,
(7.1.11)
210
Outras soluções exactas da equação de Schrödinger
onde os sı́mbolos de Pochhammer são definidos da seguinte forma:
(a)p = a(a + 1)(a + 2) . . . (a + p − 1) ,
(a)0 = 1 .
(7.1.12)
Devido ao primeiro argumento da função confluente hipergeométrica ser um inteiro negativo, a função reduz-se a um polinómio finito, de grau n. Explicitamente, nas três primeiras
funções de onda usamos
F (0, b; χ) = 1 ,
F (−1, b; χ) = 1 −
χ
,
b
F (−2, b; χ) = 1 −
2χ
χ2
+
.
b
b(b + 1)
(7.1.13)
As três primeiras funções de onda dos estados estacionários estão representadas na figura
7.4.
Note-se que, devido ao comportamento para x grande ser o mesmo do oscilador harmónico,
o espectro é o de um oscilador harmónico. Neste limite o potencial fica aproximadamente
V (x) ≃
V0 2
x ,x > 0
a2
V (x) ≃ 0 , x < 0 ,
ou seja metade de um potencial harmónico com frequência ω =
(7.1.14)
p
2V0 /ma2 . Para um
potencial harmónico truncado desta maneira, só subsistem metade dos nı́veis de energia
(funções de onda ı́mpares), pelo que a frequência é efectivamente o dobro da frequência do
potencial harmónico completo. Logo, para o potencial (7.1.14) esperamos uma frequência
r
2V0
ω=2
,
(7.1.15)
ma2
que é de facto a que observamos em (7.1.8). Esta é também a frequência para pequenas
oscilações à volta do mı́nimo. Note-se que a energia de ponto zero é sempre maior do que a
do oscilador harmónico com essa frequência. Este potencial é, de facto, um caso particular
do potencial harmónico efectivo três dimensional (Ver problema 4, Folha de problemas 1).
Poço da forma V0 cot2 (πx/L)
V (x) = V0 cot2
π x ,
L
0<x<L,
V0 > 0 ,
(7.1.16)
também admite solução analı́tica exacta (ver Folha 1, Problema 2). O espectro de energias
tem a forma
En = n2 + 4nλ − 2λ
π 2 ~2
,
2mL2
n = 1, 2, 3, . . . ,
(7.1.17)
7.1 Alguns poços de potencial exactamente solúveis
211
0.4
0.2
0
0
1
2
3
4
x
-0.2
Figura 7.4: Funções de onda dos três estados estacionários de energia mais baixa do potencial V (x) = (1/x − x)2 . O número de nodos aumenta com a energia.
onde
1
λ=
4
r
8mV0 L2
+1−1
π 2 ~2
!
.
(7.1.18)
As funções de onda têm a forma diferente dependendo da paridade de n. Para valores
ı́mpares de n, obtemos a função de onda
πx −2λ n
n 1
2 πx
Φn (x) = cn sin
,
F − − 2λ, , ; cos
L
2
2 2
L
(7.1.19)
enquanto que para valores pares de n obtemos a função de onda
πx −2λ
n
1 n 1 3
πx
2 πx
,
F − − 2λ + , + , ; cos
cos
Φn (x) = cn sin
L
L
2
2 2 2 2
L
(7.1.20)
onde F (a, b, c; z) são funções hipergeométricas. Na secção 7.2.1 analisaremos algumas
destas funções de onda, que estão representadas na figura 7.15.
É interessante analisar dois casos limites deste potencial. O primeiro é o limite em que
V0 → 0. Como se pode ver na figura 7.5, nesse limite o potencial aproxima-se do poço de
potencial infinito rectangular. Nesse limite, λ → 0 e o espectro (7.1.17) reduz-se a
En ≃
n2 π 2 ~2
,
2mL2
(7.1.21)
212
Outras soluções exactas da equação de Schrödinger
5
5
4
4
3
3
2
2
1
1
0
0
0
0.5
1
1.5
2
2.5
0
3
0.5
1
1.5
2
2.5
3
x
x
Figura 7.5: Os potenciais V (x) = cot2 x e V (x) = cot2 x/100.
exactamente o espectro do poço rectangular infinito (7.1.2). Um outro limite interessante
e oposto é tomar λ ≫ 1; nesse caso
λ≃
r
mV0 L2
,
2π 2 ~2
e, para os primeiros nı́veis de energia podemos escrever o espectro como
r
2V0 π 2
1
, n = 0, 1, 2, . . . ,
ω≡
.
En ≃ ~ω n +
2
mL2
(7.1.22)
(7.1.23)
Obtemos portanto um espectro de oscilador harmónico, o que se pode entender facilmente,
se expandirmos o potencial à volta de x = L/2:
"
2
3 #
2 π
L
2
sin
x
−
πx
L
L
V
π
0
2 ;
= V0 2 Lπ
+O
x−
V (x) = V0 cot2
= 2 x−
L
L
2
2
cos L x − L2
o primeiro termo tem a forma V (x) = mω 2 (x − L/2)2 /2, com ω dado pela expressão
anterior.
Poço Triangular
Consideremos um potencial linear
V (x) = V0 x ,
V0 > 0 .
(7.1.24)
7.1 Alguns poços de potencial exactamente solúveis
213
0.8
0.4
0
-10
-5
0
5
10
x
-0.4
-0.8
Figura 7.6: A função de Airy convergente.
A equação de Schrödinger independente do tempo para um estado com energia E fica
~2 d 2
−
+ V0 x Φ(x) = EΦ(x) ,
(7.1.25)
2m dx2
ou ainda
2mV0
d2
−
dx2
~2
E
x−
V0
Φ(x) = 0 .
(7.1.26)
As soluções da equação
d2
− z f (z) = 0 ,
dz 2
(7.1.27)
chamam-se funções de Airy, e as duas soluções linearmente independentes são denotadas
por Ai(z) e Bi(z), sendo que a segunda é divergente. Assim, a solução geral da equação
de Airy (7.1.27) é dada por
f (z) = αAi(z) + βBi(z) .
(7.1.28)
A função de Airy convergente juntamente com um potencial linear de declive 1 estão
representadas na figura 7.6. Note-se que a forma é exactamente a esperada. A função de
onda oscila quando a energia é maior do que o potencial e torna-se uma onda evanescente
214
Outras soluções exactas da equação de Schrödinger
quando a energia é menor do que o potencial. Assim, tomamos a solução de (7.1.26) como
sendo
r
3
Φ(x) = cAi
2mV0
~2
E
x−
V0
!
,
(7.1.29)
onde c é uma constante de normalização.
Um potencial linear origina uma força constante, como por exemplo a de uma partı́cula
carregada num campo eléctrico constante. Mas um potencial linear em todo o espaço
não faz sentido fisicamente, pois a energia não está limitada inferiormente. Podemos, no
entanto, considerar um poço de potencial triangular da seguinte forma

 Vx
x>0
0
V (x) =
 +∞
x<0.
(7.1.30)
Se o fizermos, esperamos quantificação de energia. Matematicamente, esta quantificação
aparece como consequência da condição
Φ(0) = 0 .
(7.1.31)
Logo, em x = 0, o argumento da função de Airy tem de ser um dos seus zeros, xn , isto é
2 2 1/3
V0 ~
En = −
xn .
(7.1.32)
2m
Estes zeros não têm uma expressão matemática simples, mas é muito simples compreender
a forma da função de onda para os vários estados estacionários; representamos os primeiros
na figura 7.7. Numericamente,
x1 ≃ −2.34 ,
x2 ≃ −4.09 ,
x3 ≃ −5.52 ,
(7.1.33)
o que revela que |E3 −E2 | < |E2 −E1 |. Este é um padrão que se repete: os nı́veis de energia
estão cada vez mais próximos à medida que a energia aumenta, ou, posto na linguagem da
próxima secção, a densidade de estados aumenta com a energia.
Nesta altura vale a pena observar que em todos os exemplos de poços de potencial
estudados até agora, o número de nodos aumente sempre de uma unidade com o nı́vel
de energia. Esta é uma caracterı́stica genérica de problemas em uma dimensão. Note-se
também que o estado fundamental nunca tem qualquer nodo.
7.1 Alguns poços de potencial exactamente solúveis
215
0.8
0.8
0.8
0.4
0.4
0.4
0
0
0
2
4
6
8
0
0
10
2
4
6
8
10
0
2
4
x
x
6
8
10
x
-0.4
-0.4
-0.4
-0.8
-0.8
-0.8
Figura 7.7: As função de onda dos três primeiros estados estacionários no poço triângular.
7.1.2
Densidade de estados
Comparemos agora a densidade de estados, ρ(E), definida por
dN(E)
,
dE
ρ(E) =
(7.1.34)
para alguns destes poços infinitos. No caso do oscilador harmónico, temos
N(E) =
E
1
−
~ω 2
⇒
ρ(E) =
1
.
~ω
(7.1.35)
Obviamente para o caso do oscilador harmónico, a densidade de estados é constante, dado
o espaçamento energético entre os nı́veis ser sempre igual.
No caso do poço rectangular infinito,
L√
N(E) =
2mE
π~
⇒
L
ρ(E) =
π~
r
m
.
2E
(7.1.36)
A densidade de estados tende para zero à medida que a energia aumenta, devido ao
espaçamento energético aumentar com o nı́vel.
No caso do poço de potencial do tipo cot2 x, escolhemos a raiz positiva da equação
quadrática
2mEa2
N(E)2 +4N(E)λ−2λ− 2 2 = 0
π ~
⇒
N(E) =
r
4λ2 + 2λ +
2mEa2
−2λ , (7.1.37)
π 2 ~2
pelo que obtemos uma densidade de estados
ρ(E) =
ma2
1
q
2
2
π ~
4λ2 + 2λ +
2mEa2
π 2 ~2
.
(7.1.38)
216
Outras soluções exactas da equação de Schrödinger
1
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
E
Figura 7.8: Densidade de estados para o oscilador harmónico (constante), poço rectangular
infinito (curva divergente em zero) e poço do tipo cot2 x.
Estas várias densidades de estados estão representadas na figura 7.8. Note-se, que de acordo
com a análise efectuada anteriormente, o potencial cot2 x tem uma densidade aproximadamente constante para energias baixas e converge para a densidade do poço rectangular
infinito para energias elevadas. Estas curvas da densidade de estados ajudam-nos a ter
uma intuição sobre outros casos onde não possamos resolver analiticamente o problema.
Por exemplo, no potencial x4 , deveremos ter uma densidade de estados cujo declive estará
algures entre entre o do poço rectangular infinito e o do potencial harmónico. Notemos
ainda que o potencial triangular da secção anterior tem uma densidade de estados que
aumenta com a energia.
7.1.3
Estados Ligados em Poços finitos
Vamos agora estudar o espectro de estados ligados de dois potenciais com profundidade
finita, um dos quais já nosso conhecido. Recordemos ainda que na secção 3.2.6 estudamos
um outro caso de um potencial rectangular finito, cujos nı́veis de energia se determinaram
por um método geométrico.
7.1 Alguns poços de potencial exactamente solúveis
217
x
0.3
0
5
10
15
20
0
0.2
-0.2
0.1
-0.4
0
0
5
10
15
20
x
-0.6
-0.1
-0.8
-0.2
-1
-0.3
Figura 7.9: Potencial de Coulomb efectivo para b 6= 0 and b = 0 respectivamente.
Poço de potencial efectivo de Coulomb
No capı́tulo 6 resolvemos a equação de Schrödinger três dimensional no potencial de
Coulomb. Devido à simetria esférica, reduzimos o problema a uma dimensão, com um
potencial efectivo do tipo
V (x) =
a
b
+ 2 , se x > 0 ;
x x
V (x) = +∞ , se x < 0 .
(7.1.39)
As constantes a e b têm valores negativo e positivo (ou zero) respectivamente. O potencial
está representado na figura 7.9. No caso do problema de Coulomb, estas constantes têm o
valor
e2
~2
a=−
,
b = ℓ(ℓ + 1)
.
(7.1.40)
4πǫ0
2µ
Usando um método análogo ao do capı́tulo 6, mostra-se que os nı́veis de energia são
dados por
En = −
µa2
2~2
1
n+
q
1
4
+
2µb
~2
+
1
2
2 ,
n = 0, 1, 2, 3, . . . .
(7.1.41)
Tomando os valores (7.1.40) obtemos o espectro de energias do átomo de Hidrogénio, que
está representado na figura 6.5. As funções de onda serão dadas pela parte radial das
funções de onda estudadas no capı́tulo 6 para o átomo de Hidrogénio. Note-se que para
ℓ = 0 (b = 0) este é um poço infinito. Na secção 7.2.4 voltaremos a analisar este problema
usando o método algébrico.
218
Outras soluções exactas da equação de Schrödinger
x
-4
-2
0
2
4
0
-0.2
-0.4
-0.6
-0.8
-1
Figura 7.10: O potencial de Pöchl-Teller para V0 = 1 = a.
Poço de potencial de Pöschl-Teller
O poço de potencial
V (x) = −
V0
cosh2
x
a
,
V0 , a > 0 ,
(7.1.42)
denominado potencial de Pöschl-Teller, admite solução analı́tica exacta (ver Folha 1, Problema 3). Este potencial é representado na figura 7.10. O espectro de energias tem a forma
" r
#2
~2
1
1 8mV0 a2
En = −
+1− n+
, n = 0, 1, 2, . . . , N ,
(7.1.43)
2ma2 2
~2
2
onde N é o maior inteiro que satisfaz a desigualdade
r
1 8mV0 a2
1
+1 .
N+ <
2
2
~2
(7.1.44)
As funções de onda têm a forma diferente dependendo da paridade de n. Para valores
ı́mpares de n, obtemos a função de onda
x
x −2λ
n 1 3
n 1
2 x
Φn = cn sinh
cosh
,
F − + , −2λ + + , ; − sinh
a
a
2 2
2 2 2
a
enquanto que para valores pares de n obtemos a função de onda
n
n 1
x −2λ
2 x
,
F − , −2λ + , ; − sinh
Φn = cn cosh
a
2
2 2
a
(7.1.45)
(7.1.46)
7.1 Alguns poços de potencial exactamente solúveis
219
1
0.5
x
-3
-2
-1
0
1
2
3
0
-0.5
-1
Figura 7.11: Funções de onda dos três estados estacionários de energia mais baixa do
potencial de Pöschl-Teller (não normalisadas). Usamos λ = 2, a = 1. O número de nodos
aumenta com a energia.
onde F (a, b, c; z) são funções hipergeométricas e λ é dado pela expressão
!
r
8mV0 a2
1
1+
λ≡
−1 .
4
~2
(7.1.47)
Notamos que a função hipergeométrica tem expansão
F (a, b, c; χ) =
+∞
X
(a)p (b)p χp
p=0
(c)p
p!
.
(7.1.48)
Devido ao primeiro argumento da função hipergeométrica ser um inteiro negativo (quer no
caso par, quer ı́mpar), a função reduz-se a um polinómio finito, de grau n. Explicitamente,
para as três primeiras funções de onda usamos
F (0, b, c; χ) = 1 ,
b
F (−1, b, c; χ) = 1 − χ .
c
(7.1.49)
As funções de onda dos três primeiros estados estacionários encontram-se representadas na
figura 7.11.
Notemos que este poço de profundidade finita admite um número finito de estados ligados, enquanto que o poço de potencial efectivo de Coulomb, sendo ainda de profundidade
finita, admite um número infinito de estados ligados.
220
7.2
Outras soluções exactas da equação de Schrödinger
Método algébrico para potenciais com forma invariante
Quando, no capı́tulo 5, estudamos o oscilador harmónico, deduzimos o seu espectro e
funções próprias usando dois métodos diferentes: um método algébrico baseado na introdução de operadores de criação e destruição (secções 5.1.1 e 5.1.2); um método diferencial de resolução directa da equação de Schrödinger, com um “ansatz” apropriado que
introduz uma série de potências que deverá ser finita por normalizabilidade da função de
onda. O primeiro método é, sem dúvida, bem mais elegante e prático.
Os potenciais estudados na secção 7.1 são, tradicionalmente, resolvidos usando o segundo método. Existe, no entanto, um método algébrico aplicável a estes e outros potenciais, que nos permitirá, de um modo mais prático, extrair o espectro e as funções próprias do
problema (e também os factores de transmissão e reflexão, quando aplicável, mas que não
será aqui tratado). O método que vamos descrever tem a sua origem em técnicas de “supersimetria” - uma simetria (ainda não observada) que relaciona bosões com fermiões - mas
que é essencialmente equivalente a um método de factorização introduzido por Schrödinger
em 1940 (Proc. Roy. Irish Acad. A46 (1940) 9).
7.2.1
O superpotencial e potenciais parceiros
Consideramos o operador Hamiltoniano na representação |xi:
2
2
ˆ = − ~ d + Ṽ (x) .
H̃
1
1
2m dx2
(7.2.1)
Assumimos que o potencial é limitado inferiormente e tem um espectro de estados ligados,
acima do qual poderá, ou não, existir um contı́nuo de estados. É uma propriedade universal
que o estado fundamental Φ0 não tem nodos. Este estado tem energia Ẽ0 e obedece a
−
~2 d2 Φ0
+ Ṽ1 (x)Φ0 = Ẽ0 Φ0 ,
2m dx2
que, invertendo, resulta em
Ṽ1 (x) =
~2 1 d2 Φ0
+ Ẽ0 .
2m Φ0 dx2
(7.2.2)
7.2 Método algébrico para potenciais com forma invariante
221
Conhecendo, pois, o estado fundamental de um problema, podemos facilmente reconstruir
o potencial, a menos de uma constante (a energia de ponto zero). No que se segue iremos
considerar o potencial que é obtido do original através da subtracção da energia de ponto
zero, o que garante que o estado fundamental do novo potencial tem energia zero:
Ṽ1 − Ẽ0 = V1 ,
ˆ − Ẽ 1̂ = Ĥ .
H̃
1
0
1
(7.2.3)
Podemos agora factorizar o operador Hamiltoniano da seguinte maneira
Ĥ1 = †  ,
(7.2.4)
onde os operadores  e † são adjuntos e tomam a forma, na representação |xi:
~ d
+ W (x) ,
 = √
2m dx
~ d
† = − √
+ W (x) .
2m dx
(7.2.5)
A função W (x) é denominada superpotencial. Da equivalência entre (7.2.1) e (7.2.4),
~ d
~ d
~2 d 2
√
−√
+ W (x)
+ W (x) = −
+ V1 (x) ,
2m dx2
2m dx
2m dx
resulta que
~ dW
V1 (x) = W (x)2 − √
.
2m dx
(7.2.6)
Esta equação é denominada equação de Riccati. Dado um potencial Ṽ1 (x) = V1 (x) + Ẽ0 ,
usamo-la para determinar o superpotencial, descobrindo simultaneamente a energia de
ponto zero do potencial Ṽ1 (x).
O estado definido por ÂΦ = 0, obedece a Ĥ1 Φ = † ÂΦ = 0; isto é tem a energia
do estado fundamental. Como o espectro é não degenerado (caracterı́stica genérica de
problemas um dimensionais), este deve ser o estado fundamental:
ÂΦ0 = 0
⇔
~ 1 dΦ0
W (x) = − √
.
2m Φ0 dx
(7.2.7)
Substituindo em (7.2.6) obtemos
V1 (x) =
~2 1 d2 Φ0
,
2m Φ0 dx2
(7.2.8)
222
Outras soluções exactas da equação de Schrödinger
em concordância com (7.2.2) após a transformação (7.2.3). Por outro lado, de (7.2.7),
temos que dado o superpotencial podemos determinar Φ0 (x) por
!
√
Z
2m
W (x)dx .
Φ0 (x) = exp −
~
(7.2.9)
Exemplo: Consideremos o oscilador harmónico tratado no capı́tulo 5. Usando a representação |xi, escrevemos os operadores de criação e destruição (5.1.4) da seguinte maneira
!
!
r
r
2
2
1
~
mω
mω
~
1
d
d
√
↠= √
−√
+
x , â = √
+
x .
(7.2.10)
2
2
2m dx
2m dx
ω~
ω~
O Hamiltoniano escreve-se, em termos destes operadores
!
1̂
ˆ − ~ω 1̂ = (√~ω↠)(√~ωâ) ,
ˆ = ~ω ↠â +
⇔ H̃
H̃
1
1
2
2
de onde concluimos que os operadores  e † são dados por
† =
√
~ω↠,
 =
√
~ωâ ,
(7.2.11)
e o superpotencial é linear
W (x) =
r
mω 2
x.
2
(7.2.12)
Usando (7.2.9), obtemos ainda que a função de onda do estado fundamental é uma Gaussiana do tipo Φ0 = Ce−mωx
2 /(2~)
, em concordância com (5.1.36), e obtemos de (7.2.8)
V1 (x) =
mω 2 2 ~ω
x −
,
2
2
(7.2.13)
que é, de facto, o potencial harmónico com a energia de ponto zero removida.
Para introduzir a noção de potencial parceiro, definimos um novo Hamiltoniano, Ĥ2 ,
Ĥ2 = † ,
(7.2.14)
obtido invertendo a ordem de  e † . Usando (7.2.5)
~ d
~2 d 2
~ dW (x)
~ d
+ W (x)
−√
+ W (x) = −
+ W (x)2 + √
,
Ĥ2 = √
2
2m dx
2m dx
2m dx
2m dx
7.2 Método algébrico para potenciais com forma invariante
223
de onde definimos o potencial parceiro, V2 (x) por
~ dW (x)
.
V2 (x) = W (x)2 + √
2m dx
(7.2.15)
A designação de potenciais parceiros para V1 (x) e V2 (x) surge porque os seus espectros
e funções próprias (e matrizes de difusão quando aplicável) estão relacionados. De facto,
(1)
se {Φn }, n ≥ 0, for o conjunto de funções próprias de Ĥ1 , com correspondente espectro
(1)
En ≥ 0, ∀n,
(1) (1)
Ĥ1 Φ(1)
n = En Φn ,
(1)
(1)
então, as funções ÂΦn , com n > 0, são funções próprias de Ĥ2 com valor próprio En :
†
(1)
(1)
(1) (1)
(1)
(1)
Ĥ2 ÂΦ(1)
=
Â
Â
ÂΦ
=
Â
Ĥ
Φ
=
ÂE
Φ
=
E
ÂΦ
.
1 n
n
n
n
n
n
n
Note-se que o estado fundamental de Ĥ1 não origina, por este procedimento, nenhuma
função própria não trivial de Ĥ2 .
(2)
De um modo semelhante, se {Φn }, n ≥ 0, for o conjunto de funções próprias de Ĥ2 ,
(2)
com correspondente espectro En > 0, ∀n,
(2) (2)
Ĥ2 Φ(2)
n = En Φn ,
(2)
(2)
então, as funções † Φn , com n ≥ 0, são funções próprias de Ĥ1 com valor próprio En :
†
† (2)
†
(2)
† (2) (2)
(2)
† (2)
Ĥ1 † Φ(2)
=
Â
Â
Â
Φ
=
Â
Ĥ
Φ
=
Â
E
Φ
=
E
Â
Φ
.
2 n
n
n
n
n
n
n
(2)
Note-se que Ĥ2 Φ0 6= 0, pelo que o estado fundamental de Ĥ2 origina, por este procedimento, uma função própria não trivial de Ĥ1 .
Concluimos pois que os espectros dos potenciais parceiros estão relacionados por
(1)
En(2) = En+1 , n ≥ 0,
(1)
E0 = 0 ;
(7.2.16)
as funções próprias estão relacionadas por
Φ(2)
n = q
1
(1)
En+1
(1)
ÂΦn+1 ,
(1)
ou Φn+1 = q
1
(2)
En
† Φ(2)
n ,
(7.2.17)
224
Outras soluções exactas da equação de Schrödinger
(1)
(2)
E3
(1)
E2
E2
†
(1)
(2)
E1
(1)
0 = E0
(2)
E1
E0
Â
Figura 7.12: Espectros de potenciais parceiros e acção dos operadores  e † . Note-se que
o operador Â/† destroi/cria um nodo na função de onda. Nesse sentido os operadores
são ainda operadores de destruição/criação.
(1)
(2)
que estão normalizadas, assumindo normalização de Φn ou Φn respectivamente. Na
figura 7.12 ilustramos a relação entre os espectros de potenciais parceiros.
Exemplo 1: No caso do oscilador harmónico, os operadores  e † são proporcionais
aos operadores de criação e destruição. Logo, é de prever que o potencial parceiro do oscilador harmónico seja ainda um potencial harmónico. Facilmente se verifica que, tomando
o superpotencial (7.2.12) se obtém, de (7.2.15)
V2 (x) =
mω 2 2 ~ω
x +
,
2
2
(2)
que é de facto um potencial harmónico com energia de ponto zero E0 = ~ω - figura 7.13.
Esta energia de ponto zero corresponde, de facto, à energia do primeiro estado excitado do
potencial parceiro (7.2.13). Vemos pois que o potencial harmónico tem forma invariante;
isto é não modifica a sua forma relativamente ao potencial parceiro. Potenciais de forma
invariante irão desempenhar um importante papel no que se segue.
Exemplo 2: Consideramos o poço de potencial rectangular de profundidade infinita
(revisto em 7.1.1), que subtraido da sua energia de ponto zero, tomamos como o potencial
V1 (x). O espectro de energias fica então:
En(1) =
π 2 ~2
n(n + 2)π 2 ~2
(n + 1)2 π 2 ~2
−
=
,n ≥ 0 ;
2mL2
2mL2
2mL2
(7.2.18)
7.2 Método algébrico para potenciais com forma invariante
225
E
E
V(x)
1
V(x)
2
x
x
Figura 7.13: Potencial harmónico com energia de ponto zero nula (esquerda) e o seu
potencial parceiro (direita), que é um potencial harmónico igual mas subido de ~ω.
as funções próprias são
Φ(1)
n
=
r
2
sin
L
(n + 1)πx
L
,
x ∈ [0, L] ,
(7.2.19)
e zero no complementar. Usando (7.2.7) obtemos o superpotencial
W (x) = − √
~π
πx
,
cot
L
2mL
(7.2.20)
e como tal, o potencial parceiro, usando (7.2.15),
~2 π 2 2 πx
V2 (x) =
2 cot
+1 .
2mL2
L
(7.2.21)
Concluimos pois, de (7.2.16), que o espectro deste potencial é
En(2) =
(n + 1)(n + 3)π 2 ~2
,n ≥ 0 .
2mL2
(7.2.22)
As funções próprias do potencial parceiro, por sua vez, são obtidas das de Ĥ1 pela açcão
do operador
~
 = √
2m
π
πx
d
− cot
dx L
L
.
Usando (7.2.17) obtemos as funções de onda do potencial parceiro:
s
(n + 2)πx
πx
(n + 2)πx
2
(2)
Φn =
(n + 2) cos
.
− cot
sin
(n + 1)(n + 3)L
L
L
L
As três primeiras funções de onda encontram-se representadas na figura 7.15.
(7.2.23)
226
Outras soluções exactas da equação de Schrödinger
V(x)
2
V(x)
1
E
x
Figura 7.14: Poço de potencial rectangular com energia de ponto zero nula (esquerda) e o
seu potencial parceiro (direita), que é um potencial do tipo π 2 ~2 /mL2 (2 cot2 (πx/L) + 1).
Vale a pena notar, neste segundo exemplo, que o potencial parceiro do poço de potencial
rectangular de profundidade infinita, que é bastante trivial de resolver, é um potencial
altamente não trivial de resolver - figura 7.14. Notemos ainda que
V2 (x) −
~2 π 2
π 2 ~2
πx
=
cot2
,
2
2
2mL
mL
L
(7.2.24)
que é o potencial (7.1.16), com V0 = π 2 ~2 /mL2 . Para este valor especial de V0 , a variável
λ (7.1.18) toma o valor de 1/2 e o espectro de energias (7.1.17)
En = (n(n + 2) − 1)
π 2 ~2
,
2mL2
n = 1, 2, 3, . . . ,
(7.2.25)
(2)
o que coincide exactamente com En − π 2 ~2 /2mL2 , em acordo com o cálculo anterior.
7.2.2
Hierarquia de Hamiltonianos
Vamos assumir que conhecemos um potencial que é exactamente solúvel, Ṽ1 (x) e conhecemos o seu espectro e funções de onda. Se assim é, podemos, aparentemente, construir um
número infinito de potenciais exactamente solúveis. O método é o seguinte.
(1)
(1)
Conhecendo o estado fundamental de um Hamiltoniano Ĥ1 , Φ0 , que tem energia E0
igual a zero, podemos encontrar o superpotencial W1 (x), usando (7.2.7). Os operadores
Â1 e †1 , podem então ser construidos usando (7.2.5), e podem ser usados para factorizar o
Hamiltoniano, escrevendo-o na forma Ĥ1 = †1 Â1 . O estado fundamental do Hamiltoniano
(2)
(2)
parceiro Ĥ2 = Â1 †1 , Φ0 , que tem energia E0
maior do que zero, é obtido a partir do
7.2 Método algébrico para potenciais com forma invariante
227
1.5
1
0.5
x
0
0.2
0.4
0.6
0.8
1
0
-0.5
-1
-1.5
Figura 7.15: Funções de onda dos três estados estacionários de energia mais baixa do
potencial do tipo cot2 (πx/L). O número de nodos aumenta com a energia.
(2)
primeiro estado excitado de Ĥ1 , pela aplicação do operador Â1 . O Hamiltoniano Ĥ2 −E0 1̂
(2)
tem estado fundamental Φ0
com energia igual a zero. Podemos por isso recomeçar o
processo e calcular um novo superpotencial W2 (x), novos operadores Â2 e †2 que factorizam
o Hamiltoniano Ĥ2 = †2 Â2 e um novo Hamiltoniano parceiro Ĥ3 = Â2 †2 , com um novo
(3)
estado fundamental, Φ0 , que tem energia maior do que zero. O Hamiltoniano Ĥ3 −
(3)
(3)
E0 1̂ tem estado fundamental Φ0 com energia igual a zero. Podemos recomeçar agora
novamente o processo. Construimos assim toda uma hierarquia de Hamiltonianos, criados
por refactorizações repetidas.
A razão pela qual, genericamente, não construimos por este método um conjunto infinito
de potenciais exactamente solúveis é que, genericamente, os potenciais parceiros vão ter a
mesma forma do potencial original, apenas com parâmetros diferentes. Isto é, potenciais
exactamente solúveis são, genericamente, potenciais de forma invariante que tratamos de
seguida. Usando a condição de invariância de forma apropriada podemos resolver um
potencial de primeiros princı́pios, e não apenas resolver um potencial dado o conhecimento
do seu potencial parceiro.
228
7.2.3
Outras soluções exactas da equação de Schrödinger
Potenciais de forma invariante
Se um potencial tem a mesma forma do seu potencial parceiro, isto é, se o potencial V1 (x; ai )
e o seu parceiro V2 (x; aj ), onde ai,j são os parâmetros que definem o potencial, obedecerem
a
V2 (x; ai ) = V1 (x; f (ai )) + R(ai ) ,
(7.2.26)
então dizemos que o potencial tem forma invariante. f (ai ) e R(ai ) são duas funções dos
parâmetros ai . Esta condição é uma condição de integrabilidade. Usando-a podemos, de
um modo sistemático, obter as funções próprias e os valores próprios de qualquer potencial
de forma invariante. Vejamos como.
Consideramos um Hamiltoniano, Ĥ1 construido com um potencial, V1 (x; a), que obedece
à condição de invariância de forma. Se
Ĥ1 = −
~2 d 2
+ V1 (x, a) ,
2m dx2
pela condição de invariância de forma, o Hamiltoniano parceiro será
Ĥ2 = −
~2 d 2
+ V1 (x, f (a)) + R(a) .
2m dx2
O Hamiltoniano Ĥ1 tem energia de ponto zero igual a zero, por construção, para qualquer
conjunto de parâmetros a. O Hamiltoniano Ĥ2 é igual ao Hamiltoniano Ĥ1 , com um
conjunto de parâmetros f (a) - que ainda terá energia do estado fundamental igual a zero
- somado de R(a). Logo a energia do estado fundamental de Ĥ2 , que é igual à energia do
primeiro estado excitado de Ĥ1 é
(1)
(2)
E1 = E0 = R(a) .
(7.2.27)
Subtraindo a energia de ponto zero ao Hamiltoniano Ĥ2 , Ĥ2′ = Ĥ2 − R(a)1̂, terá como
Hamiltoniano parceiro
Ĥ3 = −
~2 d 2
+ V1 (x, f 2 (a)) + R(f (a)) ,
2m dx2
de onde concluimos que a energia do segundo estado excitado de Ĥ1 será
(1)
E2 = R(a) + R(f (a)) .
7.2 Método algébrico para potenciais com forma invariante
229
Logo, para potenciais de forma invariante, podemos construir uma hierarquia de Hamiltonianos, Ĥs , s = 1, 2, 3, . . ., em que Ĥn tem o mesmo espectro que Ĥ1 , a menos dos primeiros
n−1 nı́veis de Ĥ1 , que estão ausentes em Ĥn , sendo as suas energias subtraı́das no espectro
de Ĥn . Usando repetidamente a condição de invariância de forma, temos que
Ĥs = −
~2 d 2
+ V1 (x, f s−1(a)) + R(f s−2(a)) .
2m dx2
Logo, a energia do nı́vel n do Hamiltoniano Ĥ1 é
En(1) =
n−1
X
k=0
R(f k (a)) , n ≥ 1 ,
(1)
, E0 = 0 .
Consideremos agora o cálculo das funções de onda dos estados estacionários. Dado
o potencial original V1 (x; a), podemos encontrar o superpotencial W (x; a), via (7.2.6),
a função de onda do estado fundamental Φ0 (x; a), via (7.2.7) e os operadores Â(x; a) e
† (x; a) usando (7.2.5). Como o potencial é de forma invariante, o potencial parceiro é, a
(1)
menos de uma constante (E1 ), V1 (x; f (a)). A função de onda do estado fundamental do
potencial parceiro será, por isso, Φ0 (x; f (a)). Logo, a função de onda do primeiro estado
excitado de V1 (x; a) será, usando (7.2.17),
Analogamente,
Φ1 (x; a) = q
Φn (x; a) = q
1
(1)
† (x; a)Φ0 (x; f (a)) .
E1
1
(1)
En
† (x; a)Φn−1 (x; f (a)) .
(7.2.28)
Deste modo construimos, com um método algébrico em tudo análogo ao usado no oscilador
harmónico, todas as funções de onda do problema original.
7.2.4
Potenciais de forma invariante relacionados por translação
Há, essencialmente, duas classes de potenciais de forma invariante que têm sido estudados:
i) Potenciais que estão relacionados com o parceiro por uma translação
f (a) = a + α ;
(7.2.29)
230
Outras soluções exactas da equação de Schrödinger
ii) Potenciais que estão relacionados com o parceiro por uma transformação de escala
f (a) = qa .
(7.2.30)
Existem ainda outras classes discutidas na literatura. Contudo é um facto notável que todos
os modelos exactamente solúveis que se encontram genericamente nos livros de Mecânica
Quântica não relativista pertencem à primeira classe descrita em cima. Consideremos dois
exemplos.
Oscilador Harmónico generalizado
Consideramos um potencial harmónico centrado no ponto x = a. Vamos assumir que nada
sabemos da teoria quântica deste potencial; em particular desconhecemos a energia de
ponto zero, Ẽ0 . O potencial harmónico com energia de ponto zero nula será
1
V1 (x) = mω 2 (x − a)2 − Ẽ0 .
2
(7.2.31)
O superpotencial está relacionado com V1 (x) por
~ dW
V1 (x) = W (x)2 − √
;
2m dx
(7.2.32)
Tomamos como ansatz para o superpotencial
W (x) = α(x + β) ;
(7.2.33)
inserindo este ansatz juntamente com a forma de V1 (x) na equação anterior obtemos
r
m
~ω
α=±
ω , β = −a
⇒
Ẽ0 = ±
.
(7.2.34)
2
2
Isto é encontrando o superpotencial que origina a parte não constante do potencial, encontramos também a energia de ponto zero! De facto temos duas hipóteses para a energia de
ponto zero; mas uma delas, associada ao sinal inferior, não é fı́sica pois diminui a energia
dos estados excitados em vez de a aumentar. Assim tomamos o sinal superior e
r
m
ω(x − a) .
W (x) =
2
(7.2.35)
7.2 Método algébrico para potenciais com forma invariante
231
O potencial parceiro é
1
~ω
~ dW
= mω 2 (x − a)2 +
.
V2 (x) = W (x)2 + √
2
2
2m dx
(7.2.36)
V2 (x) = V1 (x) + ~ω,
(7.2.37)
Logo
que demonstra que o potencial é de forma invariante. Daqui deduzimos, por (7.2.27) que
(1)
E1
(2)
= E0
= ~ω. Subtraindo a energia de ponto zero do potencial V2 (x) recuperamos
exactamente o potencial original V1 (x) e podemos recomeçar o processo. No cálculo do
novo potencial parceiro iremos ganhar novamente uma energia de ~ω, pelo que
(1)
E2 = ~ω + ~ω = 2~ω .
(7.2.38)
Repetindo o procedimento verificamos facilmente que
En(1)
= n~ω
⇒
1
,
Ẽn = ~ω n +
2
(7.2.39)
onde repusemos a energia de ponto zero, de acordo com (7.2.3).
Consideramos agora o cálculo das funções próprias. O operador † é,
r
√
~ d
m
†
 = − √
+
ω(x − a) = ω~↠,
2
2m dx
(7.2.40)
onde ↠é o operador de criação habitual (em termos da variável x − a). Logo, por (7.2.28)
temos, para as funções de onda normalizadas,
1 √
Φn (x) = √
~ω↠Φn−1 (x) ,
n~ω
(7.2.41)
exactamente de acordo com (5.1.30). Esta é uma relação iterativa; o conhecimento de todas
as funções de onda decorre do conhecimento da função de onda do estado fundamental.
Este pode ser determinado usando (7.2.7), que, dado o superpotencial, determina a função
de onda através de:
√
Z
2m
ln Φ0 = −
W (x)dx + constante ,
~
que neste caso é facilmente integrável para dar
mω
2
Φ0 (x) = C0 e− 2~ (x−a) ,
como esperado.
(7.2.42)
(7.2.43)
232
Outras soluções exactas da equação de Schrödinger
Potencial efectivo de Coulomb
Num campo de forças central, escolhendo o ansatz,
Φ(r, θ, φ) =
R(r) m
Y (θ, φ) ,
r ℓ
(7.2.44)
a equação de Schrödinger independente do tempo fica reduzida a uma equação de Schrödinger
um dimensional
2 2
~ d
+ Vef e (r) R(r) = ER(r) ,
−
2µ dr 2
(7.2.45)
com potencial efectivo
Vef e =
ℓ(ℓ + 1)~2
+ V (r) ,
2µr 2
(7.2.46)
onde µ é a massa da partı́cula e V (r) o potencial central a que a partı́cula está sujeita.
Tomando para V (r) o potencial de Coulomb
e2
~2
V (r) = −
=−
,
4πǫ0 r
µa0 r
(7.2.47)
temos
V1 (r; ℓ) =
~2
ℓ(ℓ + 1)~2
−
− Ẽ0 (ℓ) ,
2µr 2
µa0 r
(7.2.48)
onde o último termo corresponde a subtrair a menor energia possı́vel para uma orbital com
número quântico angular ℓ e usamos o raio de Bohr a0 , dado por (6.4.22). Para encontrar
o superpotencial, i.e. resolver
~ dW
,
V1 (r, ℓ) = W (r, ℓ)2 − √
2µ dr
(7.2.49)
parece natural tomar o ansatz
W (r; ℓ) =
α(ℓ)
+ β(ℓ) .
r
(7.2.50)
Inserindo esta forma na equação anterior, juntamente com V1 (r; ℓ) obtemos



~
~
~2






√
√
,
−
−
(ℓ
+
1)
,
,



2µa20 (ℓ + 1)2
2µ
2µa0 (ℓ + 1)
β(ℓ) =
α(ℓ) =
Ẽ0 =
~
~



~2



 −√
 √ ℓ,
 −
,
.
2µ
2µa0 ℓ
2µa20 ℓ2
(7.2.51)
7.2 Método algébrico para potenciais com forma invariante
233
A solução inferior diminui a energia dos estados excitados (para além de divergir para
ℓ = 0) e por isso tomamos a solução superior. Nesse caso, a energia de ponto zero coincide,
de facto com a menor energia possı́vel para uma orbital com número quântico angular ℓ
do átomo de hidrogénio (6.4.23). Assim, de um modo extremamente simples derivamos a
energia de um número infinito de orbitais do átomo de hidrogénio! Tomamos, por isso
V1 (r; ℓ) =
~2
~2
ℓ(ℓ + 1)~2
−
+
;
2µr 2
µa0 r 2µa20 (ℓ + 1)2
(7.2.52)
o superpotencial é
~
W (r; ℓ) = √
2µ
e o potencial parceiro
V2 (r; ℓ) =
ℓ+1
1
−
a0 (ℓ + 1)
r
,
(7.2.53)
(ℓ + 2)(ℓ + 1)~2
~2
~2
−
+
.
2µr 2
µa0 r 2µa20 (ℓ + 1)2
(7.2.54)
Logo
~2
V2 (r; ℓ) = V1 (r; ℓ + 1) +
2µa20
1
1
−
2
(ℓ + 1)
(ℓ + 2)2
,
(7.2.55)
o que confirma que o potencial em questão é de forma invariante. Como tal
~2
1
1
(1)
(2)
E1 = E0 =
−
.
2µa20 (ℓ + 1)2 (ℓ + 2)2
(7.2.56)
Tomando o potencial V2 (r; ℓ) com energia de ponto zero nula recuperamos o potencial
original V1 (r; ℓ̃), com parâmetro ℓ̃ = ℓ + 1 e podemos recomeçar o processo. No cálculo do
novo potencial parceiro iremos ganhar novamente uma energia de
1
~2
1
,
−
2µa20 (ℓ̃ + 1)2 (ℓ̃ + 2)2
(7.2.57)
pelo que
(1)
E2
~2
=
2µa20
1
1
1
1
−
−
+
2
2
2
(ℓ + 1)
(ℓ + 2)
(ℓ̃ + 1)
(ℓ̃ + 2)2
~2
1
1
=
−
2
2
2µa0 (ℓ + 1)
(ℓ + 3)2
,
Repetindo o procedimento verificamos facilmente que
1
~2
1
~2
(1)
⇒
Ẽ
=
−
−
,
En =
n
2µa20 (ℓ + 1)2 (ℓ + 1 + n)2
2µa20 (ℓ + 1 + n)2
(7.2.58)
(7.2.59)
234
Outras soluções exactas da equação de Schrödinger
onde repusemos a energia de ponto zero, de acordo com (7.2.3).
Consideremos agora o cálculo das funções próprias. O operador de criação é
d
~
1
ℓ+1
†
− +
.
 (ℓ) = √
−
dr a0 (ℓ + 1)
r
2µ
(7.2.60)
Usando (7.2.28), temos neste caso
Rn (r; ℓ) = q
a0
1
(ℓ+1)2
−
1
(n+ℓ+1)2
d
1
ℓ+1
− +
Rn−1 (r; ℓ + 1) .
−
dr a0 (ℓ + 1)
r
(7.2.61)
Para usarmos esta relação de recorrência, comecemos por determinar a função de onda do
estado fundamental. Usando (7.2.42) temos neste caso
√ Z
2µ
W (r; ℓ)dr + constante ,
ln R0 (r; ℓ) = −
~
(7.2.62)
de onde resulta
r
− (ℓ+1)a
R0 (r; ℓ) = C(ℓ)r ℓ+1e
0
.
(7.2.63)
Comparando com as funções de onda dadas na secção 6.4 verificamos que a dependência
radial é de facto a correcta para os nı́veis com N = ℓ + 1, que, para cada ℓ, correspondem
ao ‘estado fundamental’. Tomando os casos especı́ficos com ℓ = 0, 1, temos
− ar
R0 (r; 0) = C(0)re
0
;
− 2ar
R0 (r; 1) = C(1)r 2 e
0
.
(7.2.64)
O primeiro estado excitado com ℓ = 0 é obtido por acção do operador de criação no estado
fundamental com ℓ = 1:
√
r
2a0
1
1
d
− r
R1 (r; 0) = √
R0 (r; 1) = − 3a0 rC(1) 2 −
e 2a0 .
−
− +
dr a0 r
a0
3
(7.2.65)
Notando que a parte espacial da função de onda com números quânticos (N, ℓ, m) (na
notação do capı́tulo 6) é
Φ(N,ℓ,m) =
RN −ℓ−1 (r; ℓ) m
Yℓ (θ, φ) ,
r
obtemos
Φ(1,0,0)
C(0)
= √ e−r/a0 ,
4π
r
Φ(2,0,0) = −
r
3
e−r/2a0 ,
a0 C(1) 2 −
4π
a0
(7.2.66)
7.3 Sumário
235
r
3
rC(1) cos θe−r/2a0 ,
4π
que com as normalizações adequadas concordam (a menos de uma fase que é irrelevante)
Φ(2,1,0) =
com as funções de onda calculadas no capı́tulo 6.
7.3
Sumário
Neste capı́tulo discutimos alguns potenciais nos quais a equação de Schrödinger tem solução
exacta. Começamos por exemplificar alguns casos de poços de potencial de profundidade
finita e infinita, que são normalmente resolvidos por um método diferencial (ver folha de
exercı́cios 1). Seguidamente introduzimos um método algébrico baseado no conceito de
superpotencial, que permite factorizar o Hamiltoniano e introduzir operadores de criação
e destruição. Este método permite calcular o espectro de energias e as funções próprias
de potenciais de forma invariante, sendo muito análogo ao dos operadores de criação e
destruição usados no oscilador harmónico. O método foi exemplificado construindo o espectro de energias e funções de onda do problema de Coulomb. Genericamente o método
pode ser sumarizado na seguinte receita:
i) Dado um potencial, que denominamos Ṽ1 (x; ai ), escrevemos o potencial
V1 (x; ai ) = Ṽ1 (x; ai ) − Ẽ0 ,
que é igual ao anterior, mas com energia de ponto zero nula. Note-se que Ẽ0 é
desconhecida neste momento.
ii) Usando a equação de Riccati
~ dW (x; ai )
V1 (x; ai ) = W (x; ai )2 − √
,
dx
2m
determinamos o superpotencial W (x; ai ) e a energia de ponto zero. Este é o ponto
onde alguma intuição é necessária para escolher um bom ansatz para o superpotencial.
iii) Determinamos o potencial parceiro
~ dW (x; ai )
V2 (x; ai ) = W (x; ai )2 + √
.
dx
2m
236
Outras soluções exactas da equação de Schrödinger
iv) Se o potencial for de forma invariante, isto é, se existirem funções f (ai ) e R(ai ) tal que
V2 (x; ai ) = V1 (x; f (ai )) + R(ai ) ,
então podemos determinar o espectro e funções de onda de V1 (x; ai ) (e logo de
Ṽ1 (x; ai )) analiticamente.
v) O espectro de Ṽ1 (x; ai ) é dado por
Ẽn = Ẽ0 +
n−1
X
R(f s (ai )) ,
s=0
n≥0
onde f 0 (ai ) = ai , f 1 (ai ) = f (ai ), etc.
vi) As funções de onda de Ṽ1 (x; ai ) (que são as mesmas das funções de onda de V1 (x; ai ))
são dadas por:
• Estado fundamental
√
2m
Φ0 (x; ai ) = exp −
~
Z
!
W (x; ai )dx
,
onde tem que se escolher a constante de integração de modo a normalizar a
função de onda;
• nesimo estado excitado (n ≥ 1)
Φn (x; ai ) = qP
n−1
s=0
onde
1
† (x; ai )Φn−1 (x; f (ai )) ,
R(f s (ai ))
~ d
+ W (x; ai ) .
† (x; ai ) = − √
2m dx
Parte II
Métodos de aproximação e Spin
CAPÍTULO
8
A aproximação WKB
A introdução da equação de Schrödinger completa a nova mecânica ondulatória e torna
alguns dos postulados introduzidos arbitrariamente na “velha teoria quântica” naturais.
Por exemplo, a quantificação introduzida por Planck (capı́tulo 2) torna-se um problema
de modos normais e frequências próprias num potencial de oscilador harmónico (capı́tulo
5). Contudo não nos devemos esquecer que as ondas descritas pela equação de Schrödinger
diferem de ondas clássicas, como as electromagnéticas, de duas maneiras: são ondas de
probabilidade (interpretação de Born); são ondas complexas.
Como vimos no capı́tulo anterior, existem casos em que se pode resolver exactamente a
equação de Schrödinger correspondentes a potenciais de forma invariante. Mas, em geral,
tal não é possı́vel e como tal necessitamos de métodos aproximados. Alguns destes, como
métodos perturbativos ou variacionais, são muito gerais e ganham força quando discutidos
num contexto mais abrangente do que apenas problemas em uma dimensão. Mas existe
um método de grande interesse para problemas em uma dimensão: a aproximação WKB
cujo método é moralmente análogo ao usado no capı́tulo 3 para potenciais constantes por
pedaços e origina um resultado para a função de onda formalmente semelhante às ondas
planas vistas nesse caso. É este método que agora consideramos.
Esta aproximação foi aplicada à equação de Schrödinger quase simultaneamente por
8.1 O método
239
G.Wentzel [Zeits.f.Phys. 38 (1926) 518], H.A.Kramers [Zeits.f.Phys. 39 (1926) 828] e
L.Brillouin [Comptes Rendus 183 (1926) 24], sendo por isso conhecida como aproximação
ou método WKB. Alternativamente, a aproximação é por vezes denominada BWK, WBK
ou por razões que se discutirão em baixo, aproximação semi-clássica ou aproximação da
fase integral.
8.1
O método
Consideremos o cálculo de estados estacionários da equação de Schrödinger através da
resolução da equação de Schrödinger independente do tempo em uma dimensão
~2 d 2
−
+ V (x) Φ(x) = EΦ(x) ,
2m dx2
(8.1.1)
ou equivalentemente
d2 Φ(x) 2m
+ 2 (E − V (x))Φ(x) = 0
dx2
~
⇔
Φ(x)′′ + [k(x)]2 Φ(x) = 0 ,
onde as ‘linhas’ denotam derivadas em ordem a x e definimos
p
2m(E − V (x))
k(x) ≡
.
~
(8.1.2)
(8.1.3)
A equação (8.1.2) tem a forma da equação de Helmholtz, muito familiar na teoria ondulatória. Sabemos que quando k é constante a solução é da forma e±ikx (capı́tulo 3); isto
sugere que se V não for constante mas variar lentamente com x, possamos tomar o ansatz
Φ(x) = eiu(x) ,
(8.1.4)
onde a função u(x) não deverá ser simplesmente proporcional a x. Introduzindo este ansatz
em (8.1.2) obtemos a equação
d2 u
i 2−
dx
du
dx
2
+ [k(x)]2 = 0 .
(8.1.5)
Esta equação é totalmente equivalente a (8.1.1). Só que é não linear em u(x), pelo que
poderemos pensar que estamos pior do que começamos! A aproximação WKB toma partido
240
A aproximação WKB
desta não linearidade para construir uma aproximação a (8.1.5), através de um método
iterativo; este método é sugerido pelo facto de que a segunda derivada é zero para uma
partı́cula livre (i.e potencial constante):
• Primeira aproximação (aproximação clássica - ver secção 8.4): Se o potencial variar
suficientemente lentamente, negligenciamos o termo da segunda derivada. Designando esta aproximação a u(x) por u0 (x) (8.1.5) fica
du0
dx
2
2
= [k(x)]
⇔
u0 (x) = ±
Z
k(x)dx + C0 .
(8.1.6)
Esta quantidade, designada por fase integral, é a quantidade fundamental na aproximação.
• Aproximações seguintes: Escrevemos a equação de Schrödinger na forma (8.1.5) mas
reflectindo já o método iterativo
2
d2 u n
dun+1
= [k(x)]2 + i 2 ;
dx
dx
(8.1.7)
isto é, tomamos do lado direito a aproximação de ordem n, un , e obtemos do lado
esquerdo a aproximação de ordem n + 1, un+1 , que portanto se pode escrever na
forma
Z r
d2 u n
un+1 (x) = ±
[k(x)]2 + i 2 dx + Cn+1 .
dx
• Segunda aproximação (aproximação WKB): Em particular
Z r
Z r
2u
d
dk
0
u1 (x) = ±
[k(x)]2 + i 2 dx + C1 = ±
[k(x)]2 ± i dx + C1 .
dx
dx
(8.1.8)
(8.1.9)
Esta segunda aproximação é designada por aproximação semi-clássica ou WKB.
Para fazer sentido que este procedimento iterativo seja truncado aqui, é necessário que
u1 (x) esteja próximo de u0 (x), isto é, que u1 (x) seja uma pequena correcção a u0 (x) na
aproximação à verdadeira função u(x). Em particular isto significa que
|dk/dx| ≪ |k 2 (x)| .
(8.1.10)
8.2 Interpretação da validade da aproximação
241
Se assim for,
u1 (x) ≃ ±
Z Z
i
i dk
dx + C1 = ± k(x)dx + log k(x) + C1 ,
k(x) ±
2k dx
2
(8.1.11)
e como tal, na aproximação WKB a função de onda toma a forma
Φ(x) =
Aei
Φ(x) =
R
k(x)dx
R
Be
+ A′ e−i
p
k(x)
k̃(x)dx
R
k(x)dx
+ B ′ e−
q
k̃(x)
,
R
2m(E − V (x))
, se E > V (x) ,
~
p
2m(V (x) − E)
, se E < V (x) .
k̃(x) ≡
~
k(x) ≡
k̃(x)dx
,
p
(8.1.12)
A constante C1 pôde ser negligenciada pois a função de onda terá de ser, de qualquer
modo, normalizada. Comparando com a secção 3.2.1 concluimos a semelhança formal
anteriormente anunciada com a função de onda em potenciais constantes por pedaços.
8.2
Interpretação da validade da aproximação
Da análise anterior resulta que a condição de validade da aproximação WKB significa
que a fase varia muito mais rapidamente do que a amplitude da função de onda. Mas
para interpretar de um modo mais fı́sico a condição (8.1.10) de validade da aproximação
definimos, para E > V (x), um comprimento de onda efectivo
λ(x) =
2π
.
k(x)
(8.2.1)
Notando ainda que podemos atribuir um momento à partı́cula pela relação p(x) = ~k(x),
a condição (8.1.10) pode ser escrita
|dp/dx|
|p| 2π
≪
~
~ λ
⇒
λ(x)|dp(x)/dx| ≪ |p(x)| .
(8.2.2)
Ou seja, a condição da validade da aproximação WKB é que a alteração do momento
da partı́cula ao longo de um comprimento de onda deve ser muito menor que o próprio
momento. Esta condição é violada:
242
A aproximação WKB
V(x)
E
x=a
Figura 8.1: Um potencial V (x) perto de um ponto de viragem clássico x = a.
• Se o potencial variar muito rapidamente, ou equivalentemente, se k(x) variar muito
rapidamente. Se este for o caso a aproximação WKB não será aplicável;
• Nos pontos de viragem clássicos onde E = V (x) ou equivalentemente k(x) = 0.
Logo, para podermos usar o método WKB temos de compreender como extender as soluções
(8.1.12) através dos pontos de viragem clássicos. Estes pontos existem tanto no estudo de
estados ligados como no cálculo do factor de transmissão por efeito túnel. Precisamos pois
de estabelecer fórmulas de ligação que permitirão relacionar os coeficientes Ai e Bi nas
funções de onda (8.1.12). Essas fórmulas de ligação desempenharão o mesmo papel que
as condições de continuidade da função de onda e da sua derivada desempenharam nos
potenciais contı́nuos por pedaços do capı́tulo 3.
8.3
Fórmulas de ligação
Suponhamos que x = a é um ponto de viragem clássico - figura 8.1. Assumimos que
a aproximação WKB é aplicável, excepto na vizinhança imediata dos pontos de viragem
clássicos; por outras palavras o potencial não varia demasiado rapidamente. Fazemos a
seguinte mudança de variáveis
v(x) =
p
k(x)Φ(x) ,
y=
Z
x
k(x′ )dx′ .
(8.3.1)
8.3 Fórmulas de ligação
243
Logo
1
d2 Φ(x)
=p
2
dx
k(x)
1
dΦ(x)
=p
dx
k(x)
dv(x)
v(x) dk(x)
−
dx
2k(x) dx
,
(8.3.2)
d2 v(x)
1 dk(x) dv(x)
v(x) d2 k(x) 3 v(x)
−
−
+
dx2
k(x) dx dx
2k(x) dx2
4 [k(x)]2
dk(x)
dx
2 !
;
(8.3.3)
notamos ainda que
d2 v
=k
dx2
d2 v
dk dv
+k 2
dy dy
dy
,
d2 k
=k
dx2
dk
dy
2
d2 k
+k 2
dy
de modo que a equação de Schrödinger (8.1.2) fica
"
#
2
d2 v
dk
1 d2 k
1
+
+1 v =0 .
−
dy 2
4k 2 dy
2k dy 2
!
,
(8.3.4)
(8.3.5)
Também esta equação é completamente equivalente à equação de Schrödinger (8.1.1). Da
discussão da secção anterior resulta que a aproximação WKB é tomar o termo dentro do
parêntises [. . .] igual à unidade. Nesse caso
v(y) = e±iy ,
(8.3.6)
o que, com as definições (8.3.1) se reduz à função de onda anteriormente calculada com a
aproximação WKB (8.1.12).
Em geral y = y(x) é uma variável real se E > V (x) e imaginária se E < V (x).
Considerando um potencial como o da figura 8.1 temos que:
• y é real à esquerda do ponto de viragem clássico; logo na aproximação WKB, a equação
(8.3.5) tem solução
v(y) = Aeiy + A′ e−iy ;
(8.3.7)
• y é imaginário à direito do ponto de viragem clássico; logo na aproximação WKB, a
equação (8.3.5) tem solução
v(y) = Be|y| + B ′ e−|y| .
(8.3.8)
244
A aproximação WKB
O nosso objectivo é relacionar as constantes A, A′ com B, B ′ de modo a v(y) ser a função
de onda de um mesmo estado em regiões distintas. Note-se que nestas variáveis, as soluções
são exactamente às mesmas que em potenciais constantes.
Dado que a aproximação WKB falha perto do ponto de viragem clássico, para construirmos esta relação temos de considerar a equação de Schrödinger completa (8.3.5) perto
deste ponto. Fazemo-lo aproximando o potencial perto de x = a por uma função linear
V (x) − E ≃ α(x − a) ,
α>0.
(8.3.9)
Com esta aproximação
p
2m(E − V (x))
k(x) =
~

p
2mα(a − x)


 k(x) =
x<a
~
p
⇒


 k(x) = ±i 2mα(x − a) x > a
~
A variável y por seu lado fica
√
Z xp
2mα(a − x′ ) ′
2 2mα
y(x) =
dx = −
(a − x)3/2
x<a,
~
3
~
a
√
Z x p
2mα(x′ − a) ′
2i 2mα
y(x) =
dx = ±
(x − a)3/2
x>a.
±i
~
3
~
a
.
(8.3.10)
(8.3.11)
Escolhemos a solução negativa, de modo a que e+iy = e+|y| .
A variável y = y(x) tornou-se uma medida da distância entre x e o ponto de viragem
clássico. Reexpressemos k(x) como k(y) usando a expressão para x < a:
√
1/3
2mα √
3mα
k=
.
a−x= − 2 y
~
~
Logo
1
4k 2
dk
dy
2
1 d2 k
5
−
=
.
2
2k dy
36y 2
(8.3.12)
(8.3.13)
O mesmo resultado é obtido considerando a expressão para x > a. Logo, a equação de
Schrödinger (8.3.5) fica
d2 v
5
v=0.
+ 1+
dy 2
36y 2
(8.3.14)
Para |y| elevado, o termo 5/36y 2 pode ser negligenciado e obtemos a aproximação WKB.
Para |y| pequeno - perto do ponto de viragem clássico - a equação torna-se exacta. O que
8.3 Fórmulas de ligação
245
V(x)
E
x=b
Figura 8.2: Um potencial V (x) perto de um ponto de viragem clássico x = b.
estamos a assumir é que para valores intermedios esta equação é uma boa aproximação de
modo a conseguirmos ligar a aproximação WKB de ambos os lados.1
Um estudo detalhado da equação (8.3.14) permite-nos então relacionar a solução WKB
à esquerda com a solução WKB à direita do ponto de viragem clássico da figura 8.1 da
seguinte forma
cos −y − π4
1 e−|y|
√
,
←→
2 k̃
k
sin −y − π4
e|y|
√
.
←→ −
k̃
k
(8.3.15)
Estas são as chamadas fórmulas de ligação. Em termos da coordenada original x e especificando os dois casos possı́veis para pontos de viragem temos as seguintes fórmulas de
ligação:
• Caso da figura 8.1
Z a
Rx
2
π
1
′
′
′
′
√ cos
k(x )dx −
←→ p e− a k̃(x )dx
4
k
x
k̃
Z a
1
π
1 Rx ′ ′
√ sin
k(x′ )dx′ −
←→ − p e a k̃(x )dx
4
k
x
k̃
1
F órmula i
(8.3.16)
F órmula ii
Este procedimento é problematico se o valor de E estiver próximo de um extremo do potencial; aqui
iremos negligenciar essa subtileza.
246
A aproximação WKB
I
B’1
II
x=b
x
E
B1
A
III
x=a
A’
B’2
B2
V(x)
−V
0
Figura 8.3: Um estado com energia E num poço de potencial V (x); x = b e x = a são os
pontos de viragem clássicos.A região I é desde x = −∞ até ligeiramente antes de x = b; a
região II é desde ligeiramente depois de x = b até ligeiramente antes de x = a; a região III
é desde ligeiramente depois de x = a até x = +∞.
• Caso da figura 8.2
Z x
1 − R b k̃(x′ )dx′
2
π
′
′
p e x
←→ √ cos
k(x )dx −
4
k
b
k̃
Z x
R
b
1
1
π
′ )dx′
k̃(x
′
′
−p e x
←→ √ sin
k(x )dx −
4
k
b
k̃
F órmula iii
F órmula iv
(8.3.17)
Estas fórmulas de ligação desempenham, na aproximação WKB, o mesmo papel das considções de continuidade desempenharam no nosso estudo de potenciais constantes por
pedaços no capı́tulo 3.
8.4
Aplicação ao cálculo de estados ligados
Vamos agora usar a aproximação WKB para calcular o espectro de estados ligados num
poço de potencial do tipo da figura 8.3. Consideramos um estado com energia E, com
−V0 < E < 0. Na aproximação WKB, as soluções da equação de Schrödinger independente
8.4 Aplicação ao cálculo de estados ligados
247
do tempo nas várias regiões esquematizadas na figura 8.3 são:
R
R
p

− xb k̃(x′ )dx′
′ xb k̃(x′ )dx′
2m(V (x) − E)
B
e
+
B
e

1
1


q
com k̃(x) ≡
Região I
Φ(x) =


~


k̃(x)


R
R
p
x
x

′
′
′
′

2m(E − V (x))
Aei b k(x )dx + A′ e−i b k(x )dx
p
Região II
Φ(x) =
com k(x) ≡
.
~

k(x)


Rx
Rx

′
′
′
′


a k̃(x )dx + B ′ e− a k̃(x )dx
B
e

2
2

q
Região
III
Φ(x)
=



k̃(x)
(8.4.1)
Para a função de onda ser normalizavel, as funções que crescem exponencialmente quando
x → ±∞ têm que ser rigorosamente zero, isto é B1′ = 0 = B2 . Logo, na região I a função
de onda não normalizada será
B1 − R b k̃(x′ )dx′
, x<b.
e x
Φ(x) ≃ q
k̃(x)
(8.4.2)
Pela fórmula de ligação iii, esta função de onda tem a forma, na região II
2B1
Φ(x) ≃ p
cos
k(x)
Z
x
π
k(x )dx −
4
′
b
′
,
b<x<a.
Reescrevemos esta função de onda como
Z a
Z a
π
2B1
′
′
k(x)dx −
k(x )dx −
Φ(x) ≃ √ cos
4
k
b
x
Z a
Z a
2B1
π
′
′
k(x)dx −
= √ sin
k(x )dx +
4
k
b
x
Z a
Z a
π
2B1
′
′
k(x)dx sin
k(x )dx −
= − √ cos
4
k
b
x
Z a
Z a
π
2B1
k(x)dx cos
k(x′ )dx′ −
+ √ sin
4
k
b
x
(8.4.3)
.
(8.4.4)
Pelas fórmulas de ligação i e ii, obtemos finalmente que a função de onda na região III tem
a forma
Φ(x) = 2B1 cos
Z
b
a
Z a
− R x k̃(x′ )dx′
R x k̃(x′ )dx′
e a
ea
q
q
+ B1 sin
.
k(x)dx
k(x)dx
b
k̃(x)
k̃(x)
(8.4.5)
248
A aproximação WKB
Comparando com (8.4.1), verificamos que
B2 = 2B1 cos
Z
a
b
k(x)dx ,
(8.4.6)
pelo que a condição de normalizabilidade B2 = 0 requer que
Z
a
b
1
π,
k(x)dx = n +
2
n ∈ N0 .
(8.4.7)
Note-se que n ∈ N0 e não Z, pois o lado esquerdo desta equação é positivo. Esta equação
determina o espectro de energias dos estados ligados.
Exemplo: Consideramos o potencial do oscilador harmónico V (x) = mω 2 x2 /2 e um
estado com energia E. Os pontos de viragem clássicos, a e b, obedecem a V (a) = E = V (b),
p
e tomam neste caso a forma ± 2E/mω 2 . Logo, a condição (8.4.7) fica
Z
q
−
2E
mω 2
q
2E
mω 2
p
m(2E − mω 2 x2 )
1
π,
dx = n +
~
2
(8.4.8)
de onde se conclui que
1
E = ~ω n +
,
2
(8.4.9)
que é o valor exacto incluindo a energia de ponto zero!
Exercı́cio: Calcule a função de onda do oscilador harmónico para os nı́veis n = 0 e
n = 1 na aproximação WKB.
Se introduzissemos o momento clássico pela relação p(x) = ±~k(x), o movimento limitado no poço de potencial corresponde a uma trajectória fechada no espaço de fase - figura
8.4. A condição (8.4.7) pode ser reescrita como
I
1
p(x)dx = n +
h.
2
(8.4.10)
Esta condição é muito semelhante a uma outras impostas na velha teoria quântica, que
corespondiam a um passo intermédio entre a teoria clássica e a teoria quântica completa.
8.4 Aplicação ao cálculo de estados ligados
249
p
b
a
x
Figura 8.4: Movimento no espaço de fase de uma partı́cula clássica confinada entre x = b
e x = a no potencial da figura 8.3.
Por exemplo a quantificação sugerida por Bohr, discutida no capı́tulo 2 podia ser escrita
como
I
p(x)dx = nh .
(8.4.11)
Por esta razão a aproximação WKB é frequentemente designada por aproximação semiclássica. Isso é também confirmado notando que o ansatz Φ(x) = exp (iS(x))/~ transforma,
se negligenciarmos as segundas derivadas, a equação de Schrödinger completa
∂Ψ
~2 d 2
i~
= −
+ V (x, t) Ψ ,
∂t
2m dx2
(8.4.12)
na equação de Hamilton-Jacobi da mecânica clássica (1.3.51)
1
∂S
=
−
∂t
2m
∂S
∂x
2
+ V (x, t) .
(8.4.13)
Portanto, a fase S(x, t) comporta-se como a acção função da mecânica clássica. Isto justifica
a classificação da primeira aproximação na secção 8.1 como ‘aproximação clássica’. A
segunda aproximação (primeira ordem em ~) é a aproximação WKB.
A fórmula (8.4.7) ajuda-nos também a pensar na função de onda da seguinte maneira.
Podemos entender esta relação como expressando que a mudança de fase ao longo do poço,
de a para b, é igual a (n + 1/2)π. Dividindo por 2π, concluimos que a função de onda
na aproximação WKB tem n/2 + 1/4 (quase) comprimentos de onda no poço. Assim n
representa o número de nodos da função de onda, facto que ajuda a visualizar Ψ.
250
A aproximação WKB
V(x)
A1
A’1
B
A2
B’
A’2
E
I
x=a
II
x=b
III
x
Figura 8.5: Um estado com energia E numa barreira de potencial V (x); x = a e x = b
são os pontos de viragem clássicos. A região I é desde x = −∞ até ligeiramente antes de
x = a; a região II é desde ligeiramente depois de x = a até ligeiramente antes de x = b; a
região III é desde ligeiramente depois de x = b até x = +∞.
8.5
Aplicação ao cálculo do factor de transmissão
Aplicamos agora o método WKB ao cálculo do factor de transmissão através de uma
barreira com altura maior do que a energia da partı́cula - figura 8.5. Este problema
é semelhante ao da barreira rectângular estudado no capı́tulo 3, mas nenhuma hipótese
especifica é feita relativamente à forma concreta da barreira. Assumimos que a aproximação
WKB é válida nas três regiões. Isto é, o potencial não varia demasiado rapidamente. Nesta
aproximação obtemos as seguintes três soluções da equação de Schrödinger independente
do tempo:

Rx
Rx
p
′
′
′
′

2m(E − V (x))
A1 ei a k(x )dx + A′1 e−i a k(x )dx


p
Região I :
Φ(x) =
com k(x) ≡


~

k(x)



R
R
p

x
x
′
′
′
′

2m(V (x) − E)
Be a k̃(x )dx + B ′ e− a k̃(x )dx
q
com k̃(x) ≡
Região II :
Φ(x) =
~


k̃(x)



R
R
x
x

′
′
′
′


A2 ei b k(x )dx + A′2 e−i b k(x )dx


p
.
Φ(x) =
 Região III :
k(x)
(8.5.1)
O nosso objectivo é usar as fórmulas de ligação para relacionar os coeficientes A1 , A′1 com
A2 , A′2 , de modo a poder comparar a onda incidente com a transmitida. Com esse objectivo
notamos que:
8.5 Aplicação ao cálculo do factor de transmissão
251
• Usando as fórmulas de ligação i e ii, ligamos a solução na região II à região I:
Rx
Be
Φ(x) =
a
em I
−→
=
Rx
k̃(x′ )dx′
′
′
+ B ′ e− a k̃(x )dx
q
k̃(x)
Z a
Z a
′
π
π
B
2B
′
′
′
′
p
cos
sin
k(x )dx −
k(x )dx −
−p
4
4
k(x)
k(x)
x
x
2B ′ + iB −iπ/4 i R a k(x′ )dx′ 2B ′ − iB iπ/4 −i R a k(x′ )dx′
p
e
e x
+ p
e e x
.
2 k(x)
2 k(x)
Logo

2B ′ − iB iπ/4


e
 A1 =
2
′


 A′1 = 2B + iB e−iπ/4
2
⇔
• Denotamos
(8.5.2)

A′ eiπ/4 + A1 e−iπ/4


 B′ = 1
2
′ iπ/4

− A1 e−iπ/4

 B = A1 e
i
Rb
θ≡e
a
k̃(x)dx
.
.
(8.5.3)
(8.5.4)
Usando as fórmulas de ligação iii e iv, ligamos a solução na região II à região III
Φ(x) =
Rx
Be
em III
−→
=
a
k̃(x′ )dx′
Rx
′
Rb
′
′
′
Rb
′
′
B ′ e x k̃(x )dx + Bθ2 e− x k̃(x )dx
+ B ′ e− a k̃(x )dx
q
q
=
k̃(x)
θ k̃(x)
Z x
Z x
′
B
π
π
2Bθ
′
′
′
′
− p
sin
cos
k(x )dx −
k(x )dx −
+p
4
4
θ k(x)
k(x)
b
b
2θB + iB ′ /θ −iπ/4 i R x k(x′ )dx′ 2θB − iB ′ /θ iπ/4 −i R x k(x′ )dx′
p
p
+
.
e
e b
e e b
2 k(x)
2 k(x)
Logo

2θB + iB ′ /θ −iπ/4


e
 A2 =
2
′


 A′2 = 2θB − iB /θ eiπ/4
2
⇔

A2 eiπ/4 − A′2 e−iπ/4


θ
 B′ =
i
iπ/4

+ A′2 e−iπ/4

 B = A2 e
2θ
Igualando as duas soluções (8.5.3) a (8.5.6) obtemos

1
1


A2 + i 2θ −
A′2
 2A1 = 2θ +
2θ
2θ

1
1
′

 2A1 = i −2θ +
A2 + 2θ +
A′2
2θ
2θ
.
(8.5.5)
. (8.5.6)
(8.5.7)
252
A aproximação WKB
O factor de transmissão, T , foi definido por (3.2.24) como sendo a intensidade da onda
transmitida sobre a intensidade da onda reflectida. A intensidade de um onda foi, por sua
vez, definida na secção 3.2.1 como a densidade de probabilidade vezes a velocidade; assim
sendo temos, para o nosso caso
√
|Φt kt |2
|A2 |2
|Φt |2 vt
√
=
.
=
T =
|Φi |2 vi
|A1 |2
|Φi ki |2
(8.5.8)
Assumindo que temos uma onda incidente de x = −∞, não deverá existir onda incidente
da direita; logo A′2 = 0. Assim sendo
|A2 |2
=
|A1 |2
4θ
2
4θ + 1
2
.
(8.5.9)
Para uma barreira larga e alta, θ ≫ 1; este factor é uma medida da opacidade da barreira.
Neste caso
T ≃
R √
1
−2 ab 2m(V (x)−E)/~
=
e
.
θ2
(8.5.10)
Esta é fórmula (3.2.46) usada no capı́tulo 3 para estudar a radioactividade α, com uma
justificação vaga. A sua verdadeira justificação é a aproximação WKB como acabamos de
deduzir. Nesse caso T é chamado o factor de Gamow.
8.6
Sumário
Neste capı́tulo estabelecemos um método, denominado aproximação WKB, que permite,
para uma vasta classe de potenciais e em analogia próxima com o tratamento de potenciais
constantes por pedaços do capı́tulo 3, calcular o espectro de estados ligados e o factor de
transmissão através de barreiras de potencial.
CAPÍTULO
9
Teoria Geral do Momento Angular e Spin
No capı́tulo 6 estudamos o momento angular orbital em Mecânica Quântica. Em particular
vimos que as componentes do operador momento angular orbital, L̂i , i = 1, 2, 3, obedecem
às relações de comutação (6.1.4),
[L̂j , L̂k ] = i~ǫjkl L̂l ,
onde ǫjkl é o sı́mbolo de Levi-Civita, que tem valor1

 +1 se (jkl) = Π (123)
par
ǫjkl =
 −1 se (jkl) = Π
(123)
(9.0.1)
,
(9.0.2)
ímpar
onde Π... (123) significa “permutação par” ou “permutação ı́mpar” da sequência (123).
Estas relações de comutação resultam da quantificação canónica do momento angular
~ ≡ ~r × p~, e das relações de comutação canónicas. No entanto vamos agora
orbital, L
tomar uma perspectiva mais abrangente. Vamos tomar estas relações de comutação como
definindo os operadores de momento angular. Para manifestar que estes poderão ter outra
origem que não a orbital, denotamos os operadores mais gerais de momento angular por
J~i ; as relações de comutação são assim
[Jˆj , Jˆk ] = i~ǫjkl Jˆl .
1
(9.0.3)
Em linguagem de geometria diferencial o sı́mbolo de Levi-Civita que estamos a definir é uma densidade
tensorial e não um tensor, pois mantém a forma (9.0.2) em todos os sistemas coordenados.
254
Teoria Geral do Momento Angular e Spin
Vamos começar por demonstrar que esta álgebra admite mais representações do que as que
correspondem à acção do momento angular orbital. Estas últimas descrevem partı́culas
com spin inteiro; as novas representações descrevem partı́culas com spin semi-inteiro. Um
spin semi-inteiro é uma quantidade que não tem equivalente em mecânica clássica, mas
cuja existência fı́sica estabeleceremos seguidamente, como consequência de resultados experimentais.
9.1
Representações da álgebra do momento angular
A álgebra (9.0.3) é um caso particular de uma álgebra de Lie. Como estas álgebras são
centrais no estudo de grupos de simetria contı́nuos (grupos de Lie), e estes descrevem
muitas simetrias que aparecem em sistemas fı́sicos, vamos enquadrar a nossa discussão
desta secção no contexto mais geral de álgebras e grupos de Lie. Começamos por definir
álgebra de Lie:
Definição: Seja L um espaço vectorial de dimensão finita sobre um corpo K (K = R
ou K = C). L é uma álgebra de Lie sobre K se existir, em L, uma regra de composição
X, Y −→ [X, Y ] ,
(9.1.1)
que satisfaça os seguintes axiomas para ∀X, Y, Z ∈ L:
i) linearidade; ∀α, β ∈ K,
[αX + βY, Z] = α[X, Z] + β[Y, Z] ;
(9.1.2)
[X, Y ] = −[Y, X] ;
(9.1.3)
ii) anti-simetria,
iii) identidade (ou associatividade) de Jacobi,
[X, [Y, Z]] + [Z, [X, Y ]] + [Y, [Z, X]] = 0 .
(9.1.4)
9.1 Representações da álgebra do momento angular
255
A operação [. . . , . . .] é denominada multiplicação de Lie. Esta multiplicação é genericamente anti-comutativa e não associativa. Notemos que um exemplo de produto de Lie, que
encontramos na secção 1.3.1, é dado pelos parêntesis de Poisson; um outro, que é a razão
pela qual introduzimos aqui a teoria de Lie, é o comutador quântico.
Consideremos algumas definições importantes relativas a uma álgebra de Lie:
• Uma álgebra de Lie é dita abeliana ou comutativa se, ∀X, Y ∈ L, [X, Y ] = 0.
• Um sub-espaço vectorial de L, L1 ⊂ L, é uma sub-álgebra de Lie se
[X, Y ] ∈ L1 ,
∀X, Y ∈ L1 .
(9.1.5)
• Um sub-espaço vectorial de L, L1 ⊂ L, é um ideal se
[X, Y ] ∈ L1 ,
∀X ∈ L1 , ∀Y ∈ L ;
(9.1.6)
um ideal é, portanto, um sub-conjunto “absorvente” da álgebra e qualquer ideal é
uma sub-álgebra.
• Um sub-espaço vectorial de L, L1 ⊂ L, é um ideal máximo ou centro se
[X, Y ] = 0 ,
∀X ∈ L1 , ∀Y ∈ L ;
(9.1.7)
o centro comuta, portanto, com toda a álgebra e constitui uma sub-álgebra abeliana.
• Seja {ei } uma base de L. A multiplicação de Lie para esta base define as constantes de
estrutura da álgebra de Lie, cij k ,
[ei , ej ] = cij k ek .
(9.1.8)
Note-se que como consequência dos axiomas, as constantes de estrutura obedecem a
cjki = −ckji ,
cis p cjks + cjsp ckis + cksp cij s = 0 .
(9.1.9)
Note-se ainda que estas “constantes” dependem da base; de facto transformamse como um tensor com dois ı́ndices covariantes e um contravariante numa transformação de base.
256
Teoria Geral do Momento Angular e Spin
• Uma representação da álgebra de Lie, denotada por D, é uma aplicação linear de L para
um espaço vectorial V, que preserva o produto de Lie; isto é
D : L −→ V ,
(9.1.10)
D([X, Y ]) = [D(X), D(Y )] .
(9.1.11)
tal que
Para definir a representação necessitamos pois de definir o produto de Lie em V.
Geralmente as representações são classificadas pelos valores próprios dos chamados invariantes de Casimir, que são operadores que comutam com os geradores da
álgebra; encontram-se por isso no centro da mesma.2 No caso da âlgebra do momento
ângular o invariante de Casimir será Jˆ2 .
• Uma representação matricial de dimensão n da álgebra da Lie é uma aplicação da álgebra
de Lie para o espaço de matrizes, em geral de entradas complexas, de n × n. É fácil
de verificar que este é um espaço vectorial sobre o corpo C. O produto de Lie no
espaço vectorial das matrizes é definido como o comutador
[X, Y ] = X · Y − Y · X ,
(9.1.12)
e onde “·” é o produto usual de matrizes. Com esta forma de multiplicação de Lie,
é simples verificar a identidade de Jacobi, que surge como consequência da associatividade do produto de matrizes. O espaço vectorial onde a representação matricial
actua tem como base os estados fı́sicos do sistema. Dizemos que os estados se transformam pela acção da representação n dimensional da álgebra de Lie. Por exemplo,
para a álgebra do momento angular, estados escalares transformam-se pela acção da
representação um dimensional; estados spinoriais pela acção da representação dois
dimensional; estados vectoriais pela acção da representação três dimensional, etc.
Vamos agora estudar representações matriciais da álgebra do momento angular, isto é
um conjunto de matrizes Ji que obedecem a (9.0.3). Começamos por definir os operadores
2
Como os invariantes de Casimir são geralmente quadráticos ou até de ordem mais elevada nos geradores,
poderão não ser vectores de L; ainda assim dizemos que se encontram no centro da álgebra.
9.1 Representações da álgebra do momento angular
257
não hermı́ticos em escada análogos a (6.2.32):
Jˆ+ = Jˆx + iJˆy ,
Jˆ− = Jˆx − iJˆy ,
(9.1.13)
que obedecem às relações de comutação
h
i
Jˆ2 , Jˆ± = 0 ,
h
i
Jˆ− , Jˆ+ = −2~Jˆz ,
h
i
Jˆz , Jˆ± = ±~Jˆ± ,
(9.1.14)
exactamente análogas a (6.2.33), onde definimos o momento angular total Jˆ2 como
Jˆ2 ≡ Jˆx2 + Jˆy2 + Jˆz2 .
(9.1.15)
Queremos considerar os estados com momento angular bem definido. No caso do momento angular orbital estes estados diagonalizavam simultaneamente L̂2 e, por escolha, L̂z ;
na notação de Dirac tais estados foram denotados |ℓ, mi. L̂2 e L̂z formam um C.C.O.C.
para o problema dos estados com momento angular orbital bem definido; isto é, especificando ℓ e m, que determinam univocamente os valores próprios de L̂2 e L̂z , especifica um
único estado de momento angular orbital bem definido. Por analogia vamos assumir que:
• Os estados com momento angular bem definido diagonalizam simultaneamente Jˆ2 e Jˆz ;
• Estes estados, denotados |j, mi, são rotulados pelos números quânticos j e m, que determinam univocamente os valores próprios de Jˆ2 e Jˆz ;
• A correspondência entre o rótulo m e o valor próprio de Jˆz é
Jˆz |j, mi = m~|j, mi .
(9.1.16)
Note-se que, como Jˆ2 e Jˆz são observáveis, estados próprios com valores próprios distintos
são ortogonais; assumindo normalização temos
hj ′ , m′ |j, mi = δj ′ j δm′ m .
(9.1.17)
Para construir as representações pretendidas, consideramos a álgebra
h
i
Jˆz , Jˆ± = ±~Jˆ± ,
(9.1.18)
258
Teoria Geral do Momento Angular e Spin
que implica que Jˆ± |j, mi é estado próprio de Jˆz com valor próprio (m ± 1)~; logo
Jˆ+ |j, mi = Cjm |j, m + 1i ,
Jˆ− |j, mi = C̃jm |j, m − 1i .
(9.1.19)
As constantes introduzidas Cjm e C̃jm não são todas independentes; de facto
(Cjm )∗ = (hj, m + 1|Jˆ+ |j, mi)∗ = hj, m|Jˆ− |j, m + 1i = C̃jm+1 .
(9.1.20)
Por outro lado, a relação de comutação
h
i
ˆ
ˆ
J− , J+ = −2~Jˆz ,
(9.1.21)
origina
hj, m|Jˆ− Jˆ+ − Jˆ+ Jˆ− |j, mi = −2~hj, m|Jˆz |j, mi
⇔
C̃jm Cjm−1 − Cjm C̃jm+1 = 2~2 m .
(9.1.22)
Juntamente com (9.1.20) esta relação implica
|Cjm−1 |2 − |Cjm |2 = 2~2 m ,
(9.1.23)
que tem como solução geral3
|Cjm |2 = (C − m(m + 1))~2
|C̃jm |2 = (C − m(m − 1))~2 ,
⇒
(9.1.24)
onde C é uma constante real, dado que |Cjm |2 é real. Como os lados esquerdos de (9.1.24)
são positivos e os lados direitos se tornam negativos para m suficientemente grande em
3
Para ver isto escreva |Cjm |2 ≡ f (m) como uma série de potências
f (m) =
+∞
X
an mn .
n=0
A equação (9.1.23) é reescrita
f (m − 1) − f (m) = 2~2 m ⇔
+∞
X
n=0
an ((m − 1)n − mn ) = 2~2 m .
Logo an = 0 para n > 2, e a equação anterior fica (1 − 2m)a2 − a1 = 2~2 m ou ainda a2 = −~2 , a1 = a2 .
Logo f (m) = −~2 (m + m2 ) + a0 , que é equivalente à primeira expressão em (9.1.24).
9.1 Representações da álgebra do momento angular
259
módulo, temos de concluir que os valores possı́veis para m têm um máximo e um mı́nimo,
denotados por m̄ e m, respectivamente:
m = m, m + 1, . . . , m̄ − 1, m̄ .
(9.1.25)
Em termos destes valores, (9.1.24) deve ser escrito como
|Cjm |2 = (m̄(m̄ + 1) − m(m + 1))~2
|C̃jm |2 = (m(m − 1) − m(m − 1))~2 ,
(9.1.26)
e como |Cjm |2 = |C̃jm+1 |2 , concluimos que m̄(m̄ + 1) = m(m − 1), o que pode ser reescrito
(m̄ + m)(m̄ − m + 1) = 0
⇒
m = −m̄
∨
m = m̄ + 1 .
(9.1.27)
A segunda possibilidade é excluı́da pois m̄ > m, por hipótese. Como m̄ − m ∈ Z+
0 (dado
que diferem de um múltiplo da unidade e o primeiro é maior do que o segundo), obtemos
que 2m̄ ∈ Z+
0 , pelo que concluimos que
3
5
1
m̄ = 0, , 1, , 2, , . . .
2
2
2
(9.1.28)
Para vermos os valores próprios de Jˆ2 notamos que
1ˆ ˆ
2
ˆ
ˆ
ˆ
J+ J− + J− J+ + Jˆz2 .
J =
2
(9.1.29)
O valor esperado deste operador num estado |j, mi é
1
9.1.26
hj, m|Jˆ2 |j, mi =
|Cjm−1 |2 + |Cjm |2 + m2 ~2 = ~2 m̄(m̄ + 1) .
2
(9.1.30)
Mas |j, mi é função própria de Jˆ2 pelo que concluimos que o valor próprio é m̄(m̄ + 1)~2 .
Denotando m̄ ≡ j temos então
Jˆ2 |j, mi = j(j + 1)~2 |j, mi ,
Jˆz |j, mi = m~|j, mi
p
Jˆ± |j, mi = ~ j(j + 1) − m(m ± 1)|j, m ± 1i ,
(9.1.31)
onde 2j ∈ N0 , m = −j, −j + 1, . . . , j − 1, j.
Descobrimos, pois um conjunto infinito de representações da álgebra (9.0.3), rotuladas
por j e que denotamos Dj , com dimensão 2j+1. Estas representações são todas irredutı́veis,
260
Teoria Geral do Momento Angular e Spin
pois em cada uma delas podemos transformar |j, mi em |j, m′ i, ∀m, m′ , pela acção de
Jˆ+ e Jˆ− . A base do espaço vectorial onde a representação Dj actua é {|j, mi}, com
m = −j, −j + 1, . . . , j − 1, j. Os geradores da álgebra terão, em cada representação Dj ,
uma representação matricial em termos de matrizes quadradas de dimensão 2j + 1, com
componentes
(Ji )m′ m = hj, m′ |Jˆi |j, mi .
(9.1.32)
Consideremos as primeiras representações, para o que irá ser útil notar que
Jˆ+ + Jˆ−
,
Jˆx =
2
Jˆ+ − Jˆ−
Jˆy =
,
2i
(9.1.33)
logo
p
~ p
j(j + 1) − m(m + 1)δm′ ,m+1 + j(j + 1) − m(m − 1)δm′ ,m−1 ,
2
p
~ p
hj, m′ |Jˆy |j, mi =
j(j + 1) − m(m + 1)δm′ ,m+1 − j(j + 1) − m(m − 1)δm′ ,m−1 ,
2i
hj, m′ |Jˆx |j, mi =
hj, m′ |Jˆz |j, mi = ~mδm′ ,m .
(9.1.34)
• j = 0, representação 1-dimensional; base do espaço onde a representação actua é {|0, 0i};
elementos de matriz:
h0, 0|Jˆx |0, 0i = 0 ; h0, 0|Jˆy |0, 0i = 0 ; h0, 0|Jˆx |0, 0i = 0 .
(9.1.35)
Logo todos os geradores da álgebra são representados por ‘zero’. Esta representação
é trivial e não é fiel (i.e não é injectiva). O único vector da base corresponde ao
harmónico esférico Y00 , que é constante e não é alterado pelo grupo de transformações
(rotações) geradas pela álgebra do momento angular.
• j = 1/2, representação 2-dimensional; a base do espaço vectorial onde a representação
9.1 Representações da álgebra do momento angular
261
actua é {|1/2, 1/2i, |1/2, −1/2i}; elementos de matriz:

0 1

~
 ≡ ~ σx
h1/2, m′ |Jˆx |1/2, mi = 
2
2
1 0


0 −i
~
 ≡ ~ σy
h1/2, m′ |Jˆy |1/2, mi = 
2
2
i 0


1 0
~
 ≡ ~ σz
h1/2, m′|Jˆz |1/2, mi = 
2
2
0 −1
.
(9.1.36)
As matrizes σx , σy e σz são denominadas matrizes de Pauli. O espaço onde esta
representação actua, tal como os de outras representações com j semi-inteiro, deve ser
visto como um espaço vectorial interno; neste caso esse espaço é denominado espaço
de spin 1/2 ou simplesmente espaço de spin e os Jˆi são usualmente representados
como Ŝi . Esta representação é fiel.
• j = 1, representação 3-dimensional; a base do espaço vectorial onde a representação
actua é {|1, 1i, |1, 0i, |1, −1i}; elementos de matriz:



0 1 0


~


h1, m′ |Jˆx |1, mi = √  1 0 1  ,

2
0 1 0

0
1 0


~


h1, m′ |Jˆy |1, mi = √  −1 0 1  ,

2i 
0 −1 0


1 0 0




h1, m′ |Jˆz |1, mi = ~  0 0 0  .


0 0 −1
(9.1.37)
A base do espaço vectorial onde esta representação actua corresponde aos harmónicos
esféricos Y1±1 e Y10 . De acordo com as relações (6.5.49) podemos fazer a mudança de
base

|xi


−1
 r 2π 




r i
 |yi  =


3 
|zi
0
0
1

|1, 1i


0 i   |1, 0i

√
2 0
|1, −1i



 .

(9.1.38)
262
Teoria Geral do Momento Angular e Spin
Tomando agora a base {|xi, |yi, |zi} para a representação j = 1, temos os elementos
de matriz:
hx |Jˆk |xj i =
i
1
X
hxi |1, m′ ih1, m′ |Jˆk |1, mih1, m|xj i ;
(9.1.39)
m,m′ =−1
obtemos assim as matrizes que representam os geradores da álgebra do momento
angular na base {|xi, |yi, |zi}:


0 0 0




i ˆ
j
hx |Jx |x i = i~  0 0 1 


0 −1 0

0
0 1


j
ˆ
hx |Jy |x i = i~  0 0 0

−1 0 0


0 1 0




i ˆ
j
hx |Jz |x i = i~  −1 0 0 


0 0 0
i





. (9.1.40)
Reconhecemos os geradores das rotações em R3 . Por exemplo, uma rotação finita por um
ângulo θ em torno do eixo Oz é obtida exponenciando o respectivo gerador:


cos θ sin θ 0


ˆ


Rz (θ) = e−iθJz /~ =  − sin θ cos θ 0  .


0
0
1
(9.1.41)
As representações matriciais de dimensão mais elevada podem ser construidas de um modo
análogo.
Exercı́cio: Construa a representação com j = 3/2.
Relação com o grupo de Lie
O mapa exponencial exemplificado em (9.1.41) é a relação genérica entre uma álgebra de
Lie e o grupo de Lie respectivo. Comecemos por relembrar a estrutura de grupo:
Definição: Um grupo G é um conjunto de elementos {g} com uma lei de composição
‘◦’ que obedece às seguintes condições:
i) O grupo é uma estrutura fechada: g1 ◦ g2 ∈ G , ∀g1 , g2 ∈ G;
9.1 Representações da álgebra do momento angular
263
ii) A lei de composição do grupo é associativa: (g1 ◦ g2 ) ◦ g3 = g1 ◦ (g2 ◦ g3 ) , ∀g1 , g2 , g3 ∈ G;
iii) Existe um elemento neutro (identidade) denotado por 1: 1 ◦ g = g ◦ 1 , ∀g ∈ G;
iv) Existe um inverso para qualquer elemento do grupo g, que é denotado por g −1 :
∀g , ∃g −1: g ◦ g −1 = g −1 ◦ g = 1.
Um grupo de Lie é um grupo contı́nuo, isto é um grupo cujos elementos são rotulados por
parâmetros que variam continuamente. Essa continuidade dá uma estrutura de variedade
diferenciável aos grupos de Lie, com uma determinada geometria local e uma determinada
topologia.
Dada uma álgebra de Lie, L podemos obter um grupo de Lie GL exponenciando os
geradores da álgebra, tal como em (9.1.41):
X∈L
⇒
e−iαX ∈ GL ;
(9.1.42)
o ponto fundamental (que não vamos demonstrar) é que a identidade de Jacobi da álgebra
garante a associatividade da lei de composição do grupo. Podemos agora ver duas propriedades genéricas das matrizes do grupo associado à álgebra do momento angular:
• Para qualquer representação o traço das matrizes que representam a álgebra do momento
angular é zero para qualquer dos geradores. Usamos então o seguinte facto: se duas
matrizes A e B obedecem a A = eB então det A = eTrB . Logo se o traço das
matrizes que representam os geradores de uma álgebra de Lie é zero o determinante
das matrizes que representam o grupo é igual a um. Tais matrizes denominam-se
especiais;
• Como os geradores da álgebra do momento angular são hermı́ticos, os elementos do
grupo de Lie associado obedecem a g † = (e−iθJ )† = eiθJ = g −1 . Os elementos do
grupo são portanto operadores unitários: gg † = g † g = 1.
No caso da representação três dimensional pudemos escolher uma base em que os
geradores são matrizes puramente imaginárias e anti-simétricas (9.1.40). Nesse caso,
264
Teoria Geral do Momento Angular e Spin
as matrizes da representação do grupo de Lie são ortogonais; de facto, nesse caso o
expoente torna-se real e uma matriz anti-simétrica A, pelo que g T = (eθA )T = e−θA =
g −1 , o que implica que gg T = g T g = 1, o que é a definção de operadores ortogonais.
Considermos pois as várias representações do grupo de Lie associado ao momento angular:
• j = 0: dado que os geradores da álgebra são representados por zero, os elementos do
grupo reduzem-se todos ao operador identidade
Rk (θ) = e−iθJk /~ = 1 ;
(9.1.43)
os estados que formam a base do espaço vectorial onde o grupo actua são pois invariantes pela acção do grupo e denominam-se estados escalares.
• j = 1/2: Os elementos do grupo têm a forma
Rk (θ) = e−iθJk /~ = e−iθσk /2 .
(9.1.44)
Para escrevermos os elementos do grupo mais explicitamente notamos a identidade
~ σ · B)
~ =A
~ ·B
~ 1̂ + i~σ · (A
~ × B)
~ ,
(~σ · A)(~
(9.1.45)
~ e B
~ são dois vectores arbitrários e ~σ = (σx , σy , σz ) as matrizes de Pauli
onde A
(9.1.36). Seja ~u um vector unitário. Pela fórmula anterior concluimos que


1̂ se n par
2
n
(~σ · ~u) = 1 ; logo (~σ · ~u) =
.
 ~σ · ~u se n ímpar
(9.1.46)
torno do eixo definido por ~u é dada por


θ
θ
θ
−
iu
sin
(−iu
−
u
)
sin
cos
z
x
y
2
2
2 
.
Ru~ (θ) = e−iθ~σ·~u/2 = 
(−iux + uy ) sin θ2 cos θ2 + iuz sin 2θ
(9.1.47)
Logo, a representação dos elementos do grupo correspondentes a uma rotação em
Note-se que Ru~ (2π) = −1 e Ru~ (4π) = 1. Ou seja para voltar ao mesmo estado no
espaço de spin 1/2 necessitamos de fazer uma rotação por um ângulo 4π.
9.2 Emergência Fı́sica do Spin
265
• j = 1: Os elementos do grupo têm a forma

1
0
0


Rx (θ) = e−iθJx /~ =  0 cos θ sin θ

0 − sin θ cos θ









Ry (θ) = e−iθJy /~ = 

cos θ sin θ 0


Rz (θ) = e−iθJz /~ =  − sin θ cos θ 0

0
0
1



.

cos θ
0
0 sin θ
1
0
− sin θ 0 cos θ
(9.1.48)
Estas são as bem conhecidas matrizes de rotação a actuar em R3 .
Acabamos de construir várias representações dos operadores de rotação. Estes operadores
são os elementos do grupo de Lie que descreve as rotações. Este grupo é designado por
SU(2), pois é constituido por Special Unitary matrices sendo a sua representação fundamental de dimensão 2 - as matrizes de Pauli. Este é o grupo de Lie associado à álgebra do
momento angular. Um seu sub-grupo é SO(3) o grupo de Special Orthogonal matrices que
está associado apenas às representações do momento angular orbital e cuja representação
fundamental é três dimensional. A álgebra de Lie associada a SU(2) é denotada su(2),
enquanto que a álgebra de Lie associada a SO(3) é denotada so(3). Como vimos estas
álgebras são isomórficas.
su(2) ∼
= so(3) .
(9.1.49)
Mas os grupos distinguem-se pelo facto de SU(2) ter mais representações que SO(3), sendo
SO(3) um grupo mais reduzido do que SU(2).4
9.2
Emergência Fı́sica do Spin
No tratamento do átomo de hidrogénio que efectuamos no capı́tulo 6 descrevemos os estados
estacionários do electrão através de uma função de onda Φ(~r) que depende somente das
4
Geometricamente o grupo SU (2) é uma 3-esfera, S 3 , enquanto que SO(3) é uma 3-esfera com pontos
identificados S 3 /Z2 .





266
Teoria Geral do Momento Angular e Spin
variáveis espaciais ~r. Este tratamento permitiu-nos deduzir o espectro de energias para o
átomo de hidrogénio que havia sido introduzido fenomenologicamente por Bohr.
Claro que um tratamento baseado na equação de Schrödinger não é relativista. Para
justificarmos que a aproximação não relativista é aceitável estimemos classicamente a velocidade de um electrão numa órbita circular, que obedece a
me
e2
v2
=
;
r
4πǫ0 r 2
(9.2.1)
estimando o raio da órbita r pelo raio de Bohr (6.4.22) e introduzindo a constante de
estrutura fina (2.2.4) concluimos que
e2
=
me v ∼
4πǫ0 a0
2
e2
4πǫ0 ~c
2
me c2
⇔
v ∼ αc .
(9.2.2)
Como a constante de estrutura fina é da ordem de α ∼ 1/137, a aproximação não relativista
é justificada. Contudo, é de esperar que surjam correcções relativistas no problema do
átomo de hidrogénio. A equação relativista da mecânica quântica, designada por equação
de Dirac introduz, de facto, não só correcções cinemáticas para as variáveis de posição
que descrevem o electrão - como a variação da massa com a velocidade -, mas ainda uma
caracterı́stica totalmente nova para o electrão: o spin.
Historicamente, contudo, o spin do electrão foi descoberto experimentalmente antes da
introdução da equação de Dirac, proposta em 1928. Tais resultados experimentais, que
serão discutidos seguidamente, levaram George Uhlenbeck e Samuel Goudsmit a propôr,
em 1925, a ideia de um momento angular intrı́nseco para o electrão; Pauli, em 1927,
formalizaria esta ideia propondo uma teoria - fenomenológica - que permitia incorporar o
spin na mecânica quântica não relativista, usando alguns postulados suplementares. Esta
teoria foi motivada por vários resultados experimentais, dos quais discutiremos agora três:
A estrutura fina
Um estudo preciso das linhas espectrais do átomo de hidrogénio (por exemplo), revela uma
sub-estrutura denominada estrutura fina.5 Cada linha na figura 2.12 é na verdade composta
5
A estrutura fina de linhas espectrais foi descoberta usando interferometria por A.A.Michelson em
1891-92: Phil. Mag. 31 (1891) 338; ibid. 34 (1892) 280.
9.2 Emergência Fı́sica do Spin
267
por várias linhas, com frequências muito idênticas mas que podem ser distinguidas por um
espectrómetro com boa resolução. Por exemplo, a transição 2p → 1s é na verdade um
dupleto de linhas espectrais, com as duas linhas separadas por cerca de 10−4 eV . Esta
separação é cerca de 105 vezes menor que a diferença de energia entre o nı́vel n = 2 e
n = 1, que é de cerca de 10.2 eV . Este dupleto será estudado em detalhe na secção 11.1.4.
Isto significa que existem grupos de nı́veis atómicos energeticamente muito próximos
mas distintos, o que não é previsto pela descrição quântica do átomo de hidrogénio feita
no capı́tulo 6, i.e sem spin, que se baseava apenas no Hamiltoniano
H=
p2
e2
−
.
2µ 4πǫ0 r
(9.2.3)
A teoria completa do átomo de hidrogénio tem de levar em conta vários outros termos
no Hamiltoniano, todos eles aparecendo de um modo natural da equação de Dirac. As
primeiras correcções a (9.2.3), responsáveis pela estrutura fina, são as seguintes:6
i) Correcções relativistas à energia cinética. A velocidade do electrão é da ordem de αc e
como tal não é “muito relativista”, pelo que podemos considerar apenas a primeira
correcção relativista à energia cinética, que tem a forma
Wmv = −
p4
.
8µ3 c2
(9.2.4)
Os estados estacionários do átomo de hidrogénio sem spin não são estados próprios
deste operador (depois de quantificação canónica deste termo), pelo que ele deverá ser
tratado como uma perturbação (cf. capı́tulo 11). Pode-se estimar que as correcções
ao espectro de energias do átomo de hidrogénio provenientes desta perturbação são
supressas por um factor de α2 relativamente ao espectro não perturbado - ou seja as
correcções são cerca de 104 − 105 vezes menores que o espectro não perturbado.
ii) Acoplamento spin-órbita. O electrão do átomo de hidrogénio vê uma corrente, devido
ao facto de no seu referencial o núcleo estar em movimento. Assim o electrão vê um
6
Todos estes termos serão discutidos em maior detalhe na secção 11.1.4.
268
Teoria Geral do Momento Angular e Spin
campo magnético, pelo que, se ele tem um momento magnético intrı́nseco ~µS , existe
um acoplamento do tipo
~ ,
WSO = −~µS · B
~µS = g
µB ~
S,
~
(9.2.5)
no Hamiltoniano, onde g é a razão giromagnética do electrão e µB o magnetão de
~ o que pode ser
Bohr. A forma explı́cita desta perturbação requer então calcular B,
~ do núcleo visto num
feito através de uma transformação de Lorentz do campo E
referencial onde este está parado. Para esse cálculo tem de ser também levada em
conta a chamada precessão de Thomas. Chega-se assim ao resultado:
WSO =
1 e2
g ~ ~
L·S .
3
2 4πǫ0 r 2m2 c2
(9.2.6)
Esta correcção irá ser da mesma ordem que a correcção relativista.
iii) Existe ainda uma outra correcção da mesma ordem de grandeza das duas anteriores,
denominada termo de Darwin. Este termo surge pelo facto de, na expansão em v/c da
equação de Dirac, o electrão ser afectado numa vizinhança da ordem do comprimento
de onda de Compton pelo potencial do protão, e não apenas num ponto. O termo
tem a forma
WD =
~2
∆V ,
8m2 c2
(9.2.7)
onde ∆V é o laplaciano da energia potencial de Coulomb.
A teoria de Pauli irá introduzir a correcção ii), o que irá explicar, qualitativamente, algumas
caracterı́sticas da estrutura fina.
O efeito Zeeman Anómalo
Como vimos na secção 6.5.4, quando um átomo é imerso num campo magnético uniforme,
cada uma das suas linhas espectrais separa-se num certo número de linhas equidistantes,
cuja distância é proporcional ao campo magnético - efeito Zeeman. A explicação deste
efeito baseia-se no Hamiltoniano (6.5.10) que inclui o acoplamento paramagnético
~ ,
H1 = −~µL · B
~µL =
µB ~
L.
~
(9.2.8)
9.2 Emergência Fı́sica do Spin
269
Negligenciando o acoplamento diamagnético obtemos o espectro (6.5.39)
E(N,m) = EN − µB Bm .
(9.2.9)
Esta descrição teórica é verificada experimentalmente em certos casos - efeito Zeeman
normal - mas não noutros - efeito Zeeman anómalo. A anomalia mais importante aparece
para átomos com Z ı́mpar, que inclui o hidrogénio: os seus nı́veis de energia dividem-se
num número par de sub-nı́veis, enquanto que a teoria prevê um número ı́mpar igual a 2ℓ+1
para o nı́vel com número quântico ℓ, que é inteiro. A teoria de Pauli irá substituir ℓ por j
que pode tomar valores semi-inteiros, resolvendo este problema.
A experiência de Stern Gerlach (1922)
A experiência consiste em estudar a deflexão de um feixe de átomos de prata
47
Ag (que
são paramagnéticos e neutros) num campo magnético fortemente não uniforme. O aparato
~ tem as seguintes
experimental está representado na figura 9.1. O campo magnético B
caracterı́sticas:
• Tem um plano de simetria yOz;
• Não depende de y (negligenciamos efeitos de bordo);
• Não tem componente segundo y;
• A sua maior componente é segundo z.
Examinemos o cálculo clássico da deflexão. Sendo neutros, os átomos de prata não estão
sujeitos à força de Lorentz; a interacção entre os átomos e o campo resulta apenas do
acoplamento dipolar
~ ;
H = −~µ · B
~ ,
logo F~ = ∇(~µ · B)
(9.2.10)
~ fosse constante. Concluimos que
é a força sentida pelos átomos, que seria zero caso B
a força depende do momento magnético; mas o momento magnético tem uma dinâmica
própria devido a um torque exercido pelo campo magnético externo da forma
~ ;
~τ = ~µ × B
(9.2.11)
270
Teoria Geral do Momento Angular e Spin
Figura 9.1: a) Átomos de prata estão contidos na fornalha E, que é aquecida a altas temperaturas. Os átomos podem ser emitidos da fornalha através de uma pequena abertura.
Uma outra pequena abertura F colima o feixe de átomos, escolhendo aqueles cuja velocidade é paralela à direcção Oy. Os átomos são então deflectidos pelo gradiente do campo
magnético criado por A e condensam no ponto N do alvo P ; b) Perfil das linhas de força
do campo magnético (extraı́do de Cohen et al,‘Quantum Mechanics’ ).
assumindo que este momento magnético resulta de um momento angular,
~µ =
gµB ~
S,
~
(9.2.12)
então a lei fundamental da mecânica de rotação diz-nos que
~
dS
~
= ~µ × B
dt
⇔
~
dS
gµB ~ ~
S ×B .
=
dt
~
(9.2.13)
Esta equação diz-nos que o dipólo precessa em torno do campo magnético. Como o campo
magnético é essencialmente segundo a direcção Oz, o dipolo precessa essencialmente em
torno do eixo Oz. Logo a média temporal das componentes µx e µy será aproximadamente
zero, pelo que não deverão influir na força que os átomos de prata sentem. Com esta
aproximação
F~ ≃ µz ∇Bz ;
(9.2.14)
por hipótese ∂Bz /∂y = 0 e no plano de simetria ∂Bz /∂x = 0. Logo a força é essencialmente
paralela a Oz e proporcional a µz , F~ ≃ µz ∂z Bz ez . Como tal, deflexão HN é uma medida
9.2 Emergência Fı́sica do Spin
271
Figura 9.2: Resultado clássico esperado (linha tracejada) e observado (linha sólida) na
experiência de Stern-Gerlach (extraı́do de Cohen et al,‘Quantum Physics’ ).
de µz .
O resultado esperado classicamente para a experiência anterior baseia-se na seguinte
observação. Os átomos de prata deveriam ter uma distribuição de momento magnético
isotrópica quando saem da fornalha. Logo todos os valores de µz entre −|~µ| e +|~µ| deveriam
ser encontrados, pelo que se esperaria um padrão do tipo da linha tracejada na figura 9.2,
i.e. deflexões entre N1 e N2 . Note-se que a dispersão das velocidades e a largura finita
da fenda explicam a curva extender-se um pouco além de Ni . O resultado observado é,
contudo, muito diferente. Observam-se 2 pontos de impacto priveligiados - linhas sólidas
na figura 9.2; ou seja a medição de µz só pode originar dois resultados possı́veis.
Descrevemos agora a interpretação quântica da experiência anterior. Os átomos de
prata têm um electrão desemparelhado e o seu momento magnético resulta do spin desse
electrão por (9.2.12). Assim, uma medição de µz é uma medição de Sz , que, de acordo
com a experiência de Stern-Gerlach, só pode tomar dois valores possı́veis. Pelo estudo das
representações do momento angular da secção 9.1, na representação Dj , Sz tem 2j + 1
valores possı́veis, pelo que j = 1/2. Esta será a representação escolhida para descrever o
electrão na teoria de Pauli.
Notas:
272
Teoria Geral do Momento Angular e Spin
• Se fizéssemos a experiência com electrões, como a carga não seria zero, a força de
Lorentz iria disfarçar o efeito do spin. O objectivo de usar átomos de prata é ter uma
partı́cula de spin 1/2 sem carga.
• As condições experimentais podem ser escolhidas de modo a que a dispersão espacial da
função de onda seja suficientemente pequena para poder tratar as variáveis posição
e momento classicamente.
A experiência anterior pode ser teorizada com o seguinte formalismo:
i) O electrão tem graus de liberdade externos ou orbitais (~r e ~p) e um grau de liberdade
~
interno (o spin S);
ii) O espaço vectorial interno tem dimensão 2 e base
|+i = |1/2, 1/2i ,
|−i = |1/2, −1/2i ,
(9.2.15)
tal que
~
Ŝz |±i = ± |±i ,
2
(9.2.16)
o que equivale a dizer que, nesta base, a componente z do operador de momento
angular intrı́nseco tem representação


1 0
~
 ≡ ~ σz ;
Ŝz = 
2
2
0 −1
a álgebra do momento angular é obedecida se escolhermos




0 1
0 −i
~
~
 ≡ ~ σx ,
 ≡ ~ σy .
Ŝx = 
Ŝy = 
2
2
2
2
1 0
i 0
(9.2.17)
(9.2.18)
Esta é a representação dois dimensional de su(2), (9.1.36).
• Note que o ponto fundamental da experiência de Stern-Gerlach é não só a confirmação
da quantificação do momento magnético do electrão (e como tal do seu spin) mas
também, e sobretudo, mostrar que j = 1/2.
9.3 Postulados da teoria de Pauli
9.3
273
Postulados da teoria de Pauli
Para explicar os resultados experimentais anteriores, Uhlenbeck e Goudsmit propuseram,
em 1925, que o electrão tem um momento angular intrı́nseco - spin. Este spin confere-lhe
um momento magnético
~µS =
2µB ~
S.
~
(9.3.1)
Ou seja, a razão giromagnética do electrão é g = 2 (chamado valor quântico), que era
necessária para explicar quantitativamente as deflexões observadas na experiência de SternGerlach e as separações espectrais no efeito Zeeman anómalo. Note-se que a razão giromagnética orbital é g = 1 (chamado valor clássico), metade da de spin. O valor g = 2 que
aqui é imposto fenomenologicamente é extraı́do naturalmente da equação de Dirac.
Pauli elaborou a proposta de Uhlenbeck e Goudsmit tornando-a um pouco mais precisa e conferindo-lhe o carácter de postulados adicionais da mecânica quântica que agora
descrevemos.
Em primeiro lugar notamos que o nosso estudo até ao momento incidiu sobre a quantificação de variáveis orbitais, como a posição ~r e o momento p~, às quais associamos op~
~
eradores R̂ e P̂ que actuam num espaço de estados E~r , que é isomórfico ao espaço das
funções de onda. Denominamos E~r como espaço de estados orbitais. A estas variáveis
orbitais temos de adicionar as variáveis de spin que satisfazem os seguintes postulados:
~
i) O operador de spin, Ŝ é um momento angular, o que significa que
[Ŝj , Ŝk ] = i~ǫjkl Ŝl ;
(9.3.2)
ii) Os operadores de spin actuam num novo espaço vectorial, denominado espaço de estados
de spin, ES , onde Ŝ 2 e Ŝz são um C.C.O.C.; o espaço ES tem como base os estados
próprios comuns a Ŝ 2 e Ŝz , {|s, mi}:
Ŝ 2 |s, mi = s(s + 1)~2 |s, mi ,
Ŝz |s, mi = m~|s, mi ,
(9.3.3)
onde 2s ∈ N0 e m = −s, −s + 1, . . . , s − 1, s. Uma dada partı́cula é caracterizada
por um único valor de s; dizemos que a partı́cula tem spin s. Logo, ES tem sempre
274
Teoria Geral do Momento Angular e Spin
dimensão finita e igual a 2s + 1; todos os estados de spin de uma dada partı́cula são
vectores próprios de Ŝ 2 com o mesmo valor próprio s(s + 1)~2 ;
iii) O espaço de estados completo, E, é o produto tensorial de E~r com ES :
E = E~r ⊗ ES .
Isto significa que todas as observáveis de spin comutam com todas as observáveis
orbitais. Daqui resulta que, excepto para o caso com s = 0, é insuficiente especificar
o ket de E~r para caracterizar o estado da partı́cula. É necessário também especificar
o estado de spin; isto é
C.C.O.C. = {observáveis orbitais, observáveis de spin} .
Qualquer estado da partı́cula é uma combinação linear de vectores que são o produto
tensorial de um ket de E~r com outro de ES ;
iv) O electrão é uma partı́cula de spin 1/2 (s = 1/2). Logo, para o electrão ES é 2dimensional. O momento magnético intrı́nseco do electrão é dado por (9.3.1). O
operador Hamiltoniano que descreve o comportamento de um electrão na presença
~ e φ é dado por
de um campo electromagnético descrito pelos potenciais A
Ĥ =
~
~
(P̂ − q Â)2
q~
~
+ q φ̂ −
~σ · B̂ ,
2me
2me
(9.3.4)
que, usando as propriedades das matrizes de Pauli, pode ser reescrito na forma
Ĥ =
~
~
[~σ · (P̂ − q Â)]2
+ q φ̂ .
2me
(9.3.5)
Este é o Hamiltoniano de Pauli.
9.4
Descrição não relativista de partı́culas de spin
1
2
Vamos agora considerar em detalhe os graus de liberdade de spin para o caso s = 1/2. ES
tem dimensão 2 e tomamos como base {|+i, |−i}, que obedece a
3
Ŝ 2 |±i = ~2 |±i ,
4
~
Ŝz |±i = ± |±i .
2
(9.4.1)
9.4 Descrição não relativista de partı́culas de spin
1
2
275
As relações de ortonormalização podem então ser escritas:
h+|−i = 0 ,
h−|−i = 1 ,
h+|+i = 1 ,
(9.4.2)
e a relação de fecho
|+ih+| + |−ih−| = 1̂ .
(9.4.3)
O estado de spin mais geral tem a forma
|χi = c+ |+i + c− |−i ,
c± ∈ C .
(9.4.4)
Todos os kets de ES são vectores próprios de Ŝ 2 com valor próprio 3~2 /4. Logo
Ŝ 2 =
3~2
1̂ .
4
(9.4.5)
Podemos definir os operadores em escada
Ŝ± = Ŝx ± iŜy ,
(9.4.6)
que têm acção
Ŝ+ |+i = 0 ,
Ŝ+ |−i = ~|+i ,
Ŝ− |+i = ~|−i ,
Ŝ− |−i = 0 .
(9.4.7)
Todos os operadores que actuam em ES são representados na base {|+i, |−i} por matrizes
de 2 × 2; os operadores de momento angular têm a representação
~
~
Ŝ = ~σ ,
2
(9.4.8)
onde ~σ são as matrizes de Pauli (9.1.36). Estas matrizes têm as seguintes propriedades
Trσi = 0 ,
det σi = −1 .
(9.4.9)
Juntamente com a identidade, as matrizes de Pauli formam uma base do conjunto de
matrizes de 2 × 2 com entradas complexas GL(2, C).
276
9.4.1
Teoria Geral do Momento Angular e Spin
Juntando os graus de liberdade de spin aos orbitais
Podemos agora juntar num único formalismo os graus de liberdade de spin e orbitais. O
espaço de estados tem como base os estados próprios de um C.C.O.C. de E, que é obtido
pela justaposição de um C.C.O.C. de E~r com um de ES . Assim, vários C.C.O.C. possı́veis
para um electrão livre são:
{X̂, Ŷ , Ẑ, Ŝ 2 , Ŝz } ,
{P̂x , P̂y , P̂z , Ŝ 2 , Ŝz } ,
{Ĥ, L̂2 , L̂z , Ŝ 2 , Ŝz } .
Note-se que como todos os kets em E têm o mesmo valor próprio de Ŝ 2 , este pode ser
omitido do C.C.O.C.; de facto este valor caracteriza a partı́cula, independentemente do
estado em que se encontra (tal como a massa em repouso ou a carga eléctrica).
Consideremos o primeiro destes C.C.O.C.. A base de E é
|~r, ǫi = |x, y, z, ǫi = |~ri ⊗ |ǫi ,
(9.4.10)
onde |~ri = |x, y, zi ∈ E~r e |ǫi ∈ ES . Os rótulos tomam os valores x, y, z ∈ R e ǫ = ±1. A
acção dos operadores que constituem o C.C.O.C. nestes estados é
X̂|~r, ǫi = x|~r, ǫi ,
Ŷ |~r, ǫi = y|~r, ǫi ,
Ẑ|~r, ǫi = z|~r, ǫi ,
3~2
~
Ŝ |~r, ǫi =
|~r, ǫi , Ŝz |~r, ǫi = ǫ |~r, ǫi .
4
2
(9.4.11)
2
A base {|~r, ǫi} é ortonormal, no sentido extenso da ortogonalidade por deltas de Dirac,
h~r′, ǫ′ |~r, ǫi = δǫ′ ǫ δ(~r′ − ~r) .
A relação de fecho é
Z
Z
XZ
3
3
1̂ =
d ~r|~r, ǫih~r, ǫ| = d ~r|~r, +ih~r, +| + d3~r|~r, −ih~r, −| .
(9.4.12)
(9.4.13)
ǫ
Estados na representação {|~r, ǫi}
Qualquer estado |Ψi em E pode ser expandido na base {|~r, ǫi}, usando a relação de fecho
XZ
XZ
3
|Ψi =
d ~r|~r, ǫih~r, ǫ|Ψi ≡
d3~r|~r, ǫiΨǫ (~r) .
(9.4.14)
ǫ
ǫ
9.4 Descrição não relativista de partı́culas de spin
1
2
277
Vemos assim que para caracterizar completamente o estado de um electrão é necessário
especificar duas funções espaciais:
Ψ+ (~r) = h~r, +|Ψi ,
Ψ− (~r) = h~r, −|Ψi ,
(9.4.15)
que podem ser escritas na forma de um spinor de dois componentes ou 2-spinor :


Ψ+ (~r)
 .
[Ψ](~r) = 
(9.4.16)
Ψ− (~r)
O bra hΨ| associado ao ket |Ψi é o adjunto de (9.4.14)
XZ
XZ
3
hΨ| =
d ~rhΨ|~r, ǫih~r, ǫ| ≡
d3~r Ψ∗ǫ h~r, ǫ| ,
ǫ
(9.4.17)
ǫ
que pode ser representado na forma de um spinor que é adjunto de (9.4.16)
[Ψ]† (~r) = Ψ∗+ (~r), Ψ∗− (~r) .
O produto escalar hΨ|Φi é representado por
Z
XZ
3
hΨ|Φi =
d ~rhΨ|~r, ǫih~r, ǫ|Φi = d3~r Ψ∗+ (~r)Φ+ (~r) + Ψ∗− (~r)Φ− (~r)
Zǫ
= d3~r[Ψ]† (~r)[Φ](~r) .
Logo a condição de normalização é
Z
Z
3
†
hΨ|Ψi = d ~r[Ψ] (~r)[Ψ](~r) = d3~r |Ψ+ (~r)|2 + |Ψ− (~r)|2 = 1 .
(9.4.18)
(9.4.19)
(9.4.20)
Um caso particular de estados de E são estados obtidos pelo produto tensorial de um estado
de E~r com outro de ES , isto é
|Ψi = |Φi ⊗ |χi ,
(9.4.21)
com
|Φi =
Z
d3~rΦ(~r)|~ri ∈ E~r ,
|χi = c+ |+i + c− |−i ∈ ES .
Nesse caso as funções de onda orbitais e de spin separam


c+
 ,
[Ψ](~r) = Φ(~r) 
c−
(9.4.22)
(9.4.23)
tal como as relações de normalização
2
2
1̂ = hΨ|Ψi = hΦ|Φihχ|χi = (|c+ | + |c− | )
Z
d3~r|Φ(~r)|2 .
(9.4.24)
278
Teoria Geral do Momento Angular e Spin
Operadores na representação {|~r, ǫi}
Consideremos a acção de um operador linear  num ket |Ψi ∈ E
Â|Ψi = |Ψ′i .
(9.4.25)
Este operador tem uma representação matricial que actua em 2-spinors
Â[Ψ](~r) = [Ψ′ ](~r) ,
(9.4.26)
onde os elementos de matriz que representam  serão, em geral, operadores diferenciais
que actuam na variável ~r. Consideremos os vários casos possı́veis:
• Operadores de spin: estes actuam apenas no ı́ndice ǫ da base {|~r, ǫi}. Um exemplo é um
dos operadores em escada (9.4.6):
Ŝ+ =


0 1
~
 .
(σx + iσy ) = ~ 
2
0 0
(9.4.27)
• Operadores orbitais: estes deixam invariante o ı́ndice ǫ pelo que as suas matrizes associadas são proporcionais à matriz identidade. Dois exemplos são os operadores:




x 0
∂/∂x
0
 , P̂x = −i~ 
 .
X̂ = 
(9.4.28)
0 x
0
∂/∂x
• Operadores mistos: os operadores mais gerais a actuar em E serão representados por
matrizes de 2 × 2 cujos elementos são operadores diferencias relativamente à variável
~r. Um exemplo é um produto de um operador orbital com um operador de spin


−i~∂/∂ϕ
0
~
 ;
L̂z Ŝz = 
(9.4.29)
2
0
i~∂/∂ϕ
mas mais geralmente teremos combinações lineares de produtos de operadores orbitais
com operadores de spin; por exemplo
~ ~
Ŝ · P̂ =
~
2
σx P̂x + σy P̂y + σz P̂z = −
2


∂/∂z
∂/∂x − i∂/∂y
i~ 
 .
2
∂/∂x + i∂/∂y
−∂/∂z
(9.4.30)
9.4 Descrição não relativista de partı́culas de spin
1
2
Notamos ainda que o elemento de matriz de um operador é dado por
Z
hΨ|Â|Φi = d3~r[Ψ]† (~r)Â[Φ](~r) .
279
(9.4.31)
Se, alternativamente, tivéssemos considerado o C.C.O.C.={P̂x , P̂y , P̂z , Ŝ 2 , Ŝz }, terı́amos
a representação {|~p, ǫi}, em que cada vector |Ψi ∈ E é o 2-spinor


Ψ̄+ (~p)
 ,
[Ψ̄](~p) = 
Ψ̄− (~p)
(9.4.32)
com
Ψ̄+ (~p) = h~p, +|Ψi ,
Ψ− (~p) = h~p, −|Ψi .
(9.4.33)
Notando que
h~r, ǫ|~p, ǫ′ i = h~r|~pihǫ|ǫ′ i =
1
ei~p·~r/~δǫǫ′ ,
3/2
(2π~)
(9.4.34)
concluı́mos que Ψ̄+ (~p) e Ψ̄− (~p) são transformadas de Fourier de Ψ+ (~r) e Ψ− (~r), respectivamente:
XZ
Ψ̄ǫ (~p) = h~p, ǫ|Ψi =
d3~rh~p, ǫ|~r, ǫ′ ih~r, ǫ′ |Ψi
Z ǫ′
(9.4.35)
1
3 −i~
p·~
r/~
d ~re
Ψǫ (~r) .
=
(2π~)3/2
Finalmente, notamos que os postulados do capı́tulo 4 se aplicam naturalmente neste formalismo. Por exemplo, a probabilidade d3 P(~r, +) de encontrar um electrão num volume
infinitesimal d3~r em torno do ponto ~r com o spin para cima, Sz = +~/2, é
d3 P(~r, +) = |h~r, +|Ψi|2d3~r = |Ψ+ (~r)|2 d3~r ,
(9.4.36)
enquanto que a probabilidade d3 P(~r) de encontrar um electrão num volume infinitesimal
d3~r em torno de ~r, qualquer que seja o spin, é
d3 P(~r) = (|Ψ+ (~r)|2 + |Ψ− (~r)|2 )d3~r .
(9.4.37)
Operador de rotação para uma partı́cula de spin 1/2
~
Uma partı́cula de spin 1/2 pode possuir, para além do seu momento angular intrı́nseco S,
~ O seu momento angular total será
um momento angular orbital L.
~ +S
~ .
J~ = L
(9.4.38)
280
Teoria Geral do Momento Angular e Spin
Como se comporta a função de onda de uma partı́cula de spin 1/2 sob a acção de uma
rotação? O operador de rotação a actuar no espaço de estados orbitais E~r toma a forma,
~
Ru~ (α) = e−iαL·~u/~ ,
(9.4.39)
em que a rotação é em torno de um eixo definido pelo versor ~u e de um ângulo α. Naturalmente, o operador de rotação que actua no espaço de estados E terá a forma
~
Ru~ (α) = e−iαJ ·~u/~ .
(9.4.40)
~
~
Como L̂ só actua em E~r e Ŝ só actua em ES , podemos escrever Ru~ (α) na forma de um
produto tensorial
(~
r)
(S)
Ru~ (α) = Ru~ (α) ⊗ Ru~ (α) ,
(9.4.41)
onde
~
(~
r)
~
(S)
Ru~ (α) = e−iαL·~u/~ ,
Ru~ (α) = e−iαS·~u/~ ,
(9.4.42)
são os operadores de rotação que actuam em E~r e ES respectivamente. Deste modo, se a
partı́cula de spin 1/2 estiver num estado que seja um produto tensorial, do tipo (9.4.21),
o seu estado após a rotação será
(~
r)
(S)
|Ψ′ i = Ru~ (α)|Ψi = [Ru~ (α)|Φi] ⊗ [Ru~ (α)|χi] .
(~
r)
(9.4.43)
(S)
Claro que Ru~ (2π) = 1̂ pois esta é uma rotação orbital; mas por (9.1.47), Ru~ (2π) = −1̂;
logo
(~
r)
(S)
Ru~ (2π) = Ru~ (2π) ⊗ Ru~ (2π) = −1̂ .
(9.4.44)
Esta é uma famosa propriedade de uma partı́cula de spin 1/2: uma tal partı́cula necessita
de dar duas voltas para voltar ao mesmo estado, i.e ser descrita pelo mesmo spinor; de
facto
(~
r)
(S)
Ru~ (4π) = Ru~ (4π) ⊗ Ru~ (4π) = 1̂ .
(9.4.45)
A periodicidade de 4π dos fermiões de spin 1/2 foi observada directamente em experiências
de interferência com neutrões lentos (S.A.Warner et al, Phys. Rev. Lett. 35 (1975) 1053.)
9.4 Descrição não relativista de partı́culas de spin
1
2
281
Note-se, no entanto, que uma observável não muda de sinal pela acção de uma rotação de
2π:
Â′ = Ru~ (2π)ÂRu~ (2π)† = Â .
(9.4.46)
O comportamento global de uma partı́cula de spin 1/2 sob a acção de uma rotação
pode ser visto do seguinte modo: o estado |Ψi é representado pelo 2-spinor [Ψ](~r) com
componentes
Ψǫ (~r) = h~r, ǫ|Ψi ,
(9.4.47)
sob a acção de uma rotação |Ψ′i = R̂|Ψi, onde R̂ = R̂(~r) ⊗ R̂(S) , obtemos um novo 2-spinor,
cujas componentes são
Ψ′ǫ (~r)
′
= h~r, ǫ|Ψ i = h~r, ǫ|R̂|Ψi =
mas
XZ
ǫ′
d3 r~′ h~r, ǫ|R̂|r~′ , ǫ′ ihr~′, ǫ′ |Ψi ;
(S)
(S)
h~r, ǫ|R̂|r~′ , ǫ′ i = h~r|R̂(~r) |r~′ihǫ|R̂(S) |ǫ′ i ≡ hR−1~r|r~′ iRǫǫ′ = δ(R−1~r − r~′ )Rǫǫ′ .
(9.4.48)
(9.4.49)
Logo
Ψ′ǫ (~r) =
X
(S)
Rǫǫ′ Ψǫ′ (R−1~r) .
(9.4.50)
ǫ′
Explicitamente, em notação tensorial temos

 


(S)
(S)
′
−1
Ψ (~r)
R
R+−
Ψ (R ~r)
 +
 =  ++
 +
 .
(S)
(S)
Ψ′− (~r)
Ψ− (R−1~r)
R−+ R−−
(9.4.51)
Note-se a analogia com o caso de spin 1.
Exemplo: Para ilustrar a fı́sica das partı́culas com spin 1/2 vamos considerar um
problema de difusão um dimensional do tipo do capı́tulo 3, mas adicionando um campo
magnético, tal como representado na figura 9.3. Uma partı́cula de spin 1/2, massa m, sem
carga e com razão giromagnética g incide no potencial, proveniente de x = −∞. Para além
~ = B0 ez . Logo, o operador
do salto de potencial existe na região II um campo magnético B
Hamiltoniano para o sistema, escrito na forma (9.3.4) é
P̂ 2
P̂ 2
~
~
+ V (X̂) − µ̂ · B =
+ θ(x) V0 + ω Ŝz ,
Ĥ =
2m
2m
(9.4.52)
282
Teoria Geral do Momento Angular e Spin
V(x)
~ =0
B
I
~ = B0 ez
B
II
V
0
~µ =
~
gµB S~
E
0
x
Figura 9.3: Um salto de potencial com campo magnético na região II.
onde ω = −gµB B0 /~ e θ(x) é a função de Heaviside, que toma valores

 0, x<0
θ(x) ≡
.
 1, x>0
Podemos tomar como C.C.O.C.={Ĥ, P̂y , P̂z , Ŝz } e a base de estados para o sistema,
que são estados estacionários, sendo
±
|Φ±
E,py ,pz i = |ΦE i ⊗ |py i ⊗ |pz i ⊗ |±i .
(9.4.53)
A equação de Schrödinger
±
Ĥ|Φ±
E,py ,pz i = E|ΦE,py ,pz i ,
reduz-se a
!
p2y + p2z
P̂x2
ω~
±
|Φ±
+
+ θ(x) V0 ±
E i = E|ΦE i .
2m
2m
2
±
Projectando na representação |xi, hx|Φ±
E i = ΦE (x) e assumindo py = pz = 0 obtemos
~2 d 2
~ω
±
−
Φ±
(9.4.54)
+ θ(x) V0 ±
E (x) = EΦE (x) .
2m dx2
2
A inclusão do spin, tornada visı́vel pela presença do campo magnético, dá origem a um
potencial efectivo diferente para cada um dos dois modos da partı́cula, isto é Vef e =
V0 ± ~ω/2, para os modos |+i e |−i, respectivamente. Esta é a lição genérica a reter: o
potencial efectivo pode ser diferente para feixes com polarizações diferentes. A partir daqui
podemos calcular o factor de transmissão e reflexão, para cada um dos dois modos, usando
os métodos do capı́tulo 3.
9.5 Adição de momento angular
9.5
283
Adição de momento angular
Tendo estabelecido que uma partı́cula quântica pode ter um momento angular intrı́nseco,
para além do momento angular orbital, ambos quantificados, coloca-se a questão de saber
quais são os valores possı́veis para o seu momento angular total. O mesmo se pode perguntar relativamente a um sistema fı́sico constituı́do por dois sub-sistemas (por exemplo,
um sistema de duas partı́culas), cada um possuindo momento angular. É esta a questão
que vamos agora considerar.
7
Analisemos, por exemplo, um sistema de duas partı́culas, que se identificarão por ı́ndices
1 e 2. Designamos por J~1 e J~2 os respectivos momentos angulares e seja
J~ = J~1 + J~2 ,
o momento angular total do sistema, com componentes (Jx , Jy , Jz ). Admitimos que se
conhece, no espaço de estados do sistema i, Ei, i = 1, 2, a base padrão {|ki, Ji , Mi i}
constituı́da por vectores próprios comuns a Jˆi2 e a Jˆiz :
Jˆi2 |ki, Ji , Mi i
=
Ji (Ji + 1)~2 |ki , Ji , Mi i ,
(9.5.1)
Jˆiz |ki, Ji , Mi i
=
Mi ~ |ki, Ji , Mi i ,
(9.5.2)
Jˆi± |ki, Ji , Mi i
=
~
p
Ji (Ji + 1) − Mi (Mi ± 1) |ki, Ji , Mi ± 1i ,
(9.5.3)
onde ki representa o conjunto de números quânticos adicionais necessários à especificação
completa do estado do sistema.
O espaço de estados do sistema total, E, é o produto tensorial de E1 e E2 :
E = E1 ⊗ E2 .
(9.5.4)
Uma base neste espaço é obtida fazendo o produto tensorial das bases de E1 e de E2 :
{| k1 , k2 ; J1 , J2 ; M1 , M2 i} = {| k1 , J1 , M1 i ⊗ | k2 , J2 , M2 i} ,
7
Esta secção foi escrita com a colaboração da Prof. Fátima Mota.
(9.5.5)
284
Teoria Geral do Momento Angular e Spin
que é uma base própria comum aos operadores Jˆ12 , Jˆ22 , Jˆ1z , Jˆ2z . Um outro C.C.O.C. em
E é
Jˆ12 , Jˆ22 , Jˆ2 , Jˆz ,
(9.5.6)
e podemos escolher uma base própria comum a estas observáveis:
{|k, J1, J2 ; J, Mi} .
(9.5.7)
A questão que se põe é a de determinar esta base em termos da base conhecida (9.5.5).
O problema é tanto mais relevante quando se sabe que, genericamente, num sistema de
partı́culas com interacção apenas o momento angular total é uma constante de movimento,
isto é, apenas o momento angular total comutará com o Hamiltoniano. Consequentemente,
os estados estacionários (e a evolução do sistema) podem ser determinados se se conhecer
a base (9.5.7).
Mesmo num sistema de uma só partı́cula, surge genericamente um acoplamento entre o
momento angular intrı́nseco e o orbital, o acoplamento spin-órbita,
ˆ~
ˆ
~ˆ · S.
9.2, proporcional a L
Na presença deste termo apenas J~ ≡
já discutido na secção
ˆ~
~ˆ + S
L
comuta com o
Hamiltoniano do sistema, pelo que os estados estacionários deverão ser rotulados pelo
valor próprio de Jˆ e não dos momentos angulares individuais, como será visto, para o
átomo de Hidrogénio, na secção 11.1.4.
Enunciamos e provamos agora o teorema de adição de dois momentos angulares.
Teorema de adição de dois momentos angulares:
No espaço E gerado pelos vectores |k; J1 , J2 ; M1 , M2 i (k, J1 , J2 , fixos; M1 , M2 variáveis),
que tem dimensão (2J1 + 1)(2J2 + 1):
• Os valores possı́veis de J são:
J1 + J2 , J1 + J2 − 1, J1 + J2 − 2, . . . |J1 − J2 | .
(9.5.8)
• A cada valor de J correspondem 2J + 1 vectores próprios |J, Mi do momento angular
total.
Demonstração:
9.5 Adição de momento angular
285
A demonstração do teorema tem por base três observações:
(1) O número quântico M toma valores J1 +J2 , J1 +J2 −1, J1 +J2 −2, . . . , −J1 −J2 . De
facto o ket | k1 ; J1 , J2 ; M1 , M2 i é ket próprio das observáveis Jˆ1z , Jˆ2z e de Jˆz . Em particular:
ˆ
ˆ
ˆ
Jz |k; J1 , J2 ; M1 , M2 i = J1z + J2z |k; J1, J2 ; M1 , M2 i
= ~ (M1 + M2 ) |k; J1, J2 ; M1 , M2 i .
Logo M = M1 + M2 . Como Mi toma todos os valores entre −Ji e Ji , M toma todos os
valores entre −(J1 +J2 ) e J1 +J2 , o que demonstra a afirmação. Sem perda de generalidade,
no desenvolvimento que se segue, considerar-se-á J1 ≥ J2 .
(2) A degenerescência dos valores de M, g(M), é:


0,
|M| > J1 + J2 ,




g(M) = g(−M) J1 + J2 + 1 − |M| , J1 + J2 ≥ |M| ≥ |J1 − J2 | ,





2J2 + 1 ,
|J1 − J2 | ≥ |M| ≥ 0 .
Para deteminar g(M) pode proceder-se como se segue. Num diagrama bidimensional,
associa-se a cada ket |k; J1 , J2 ; M1 , M2 i um ponto cuja abcissa é M1 e cuja ordenada é M2 .
Na figura 9.4 mostra-se o caso especı́fico de J1 = 2 e J2 = 1. Sendo M = M1 + M2 todos
os pontos do diagrama que estão sobre rectas de declive -1 têm o mesmo M. O número
desses pontos é g(M). Analisem-se os diferentes valores de M:
• M = J1 + J2 = 3 é não degenerado. Portanto
g(J1 + J2 ) = 1 .
(9.5.9)
• M = J1 + J2 − 1 = 2 é duplamente degenerado. Portanto:
g(J1 + J2 − 1) = 2 .
(9.5.10)
• O grau de degenerescência cresce então de 1 cada vez que M decresce de 1, até se
atingir o vértice inferior direito do diagrama (M1 = J1 , M2 = −J2 ), isto é M = J1 −J2 .
A degenerescência de M é máxima para este ponto e vale:
g(J1 − J2 ) = 2J2 + 1 .
(9.5.11)
286
Teoria Geral do Momento Angular e Spin
m2
(-2,1)
(-1,1)
(-2,0)
(-1,0)
(0,1)
(0,0)
(1,1)
(2,1)
(1,0)
(2,0)
m1
(-2,-1)
(-1,-1)
(0,-1)
(1,-1)
(2,-1)
Figura 9.4: Análise da degenerescência da componente azimutal do momento angular total.
• Para valores de M < J1 − J2 a degenerescência de M mantém-se constante e igual ao
seu valor máximo até que a linha atravessa o vértice superior esquerdo do diagrama
(M1 = −J1 , M2 = J2 ), isto é M = −J1 + J2 :
g(M) = 2J2 + 1 , para
− (J1 − J2 ) ≤ M ≤ J1 − J2 .
(9.5.12)
• Finalmente para valores de M inferiores a −(J1 − J2 ), g(M) decresce de 1 cada vez
que M diminui de 1, até atingir novamente o valor 1 quando M = −(J1 + J2 ) (vértice
inferior esquerdo do diagrama). Ou seja:
g(−M) = g(M) .
(9.5.13)
(3) Para J1 e J2 fixos, os valores próprios de J 2 correspondem a
J = J1 + J2 , J1 + J2 − 1, J1 + J2 − 2, . . . , |J1 − J2 |,
(9.5.14)
e a cada um destes valores corresponde um único subespaço invariante E(J), isto é, um
multipleto de valores de M.8 Designe-se por p(J) o número de multipletos associados a um
dado valor J. Os valores de p(J) e de g(M) estão relacionados de uma forma simples:
g(M) = p(J = |M|) + p(J = |M| + 1) + p(J = |M| + 2) + . . . .
8
(9.5.15)
No presente contexto, um multipleto corresponde a um conjunto de estados que se transformam entre
si numa rotação. Mais geralmente, o multipleto de estados numa determinada representação de um grupo
de Lie são estados que se transformam entre si pela acção desse grupo.
9.5 Adição de momento angular
287
Invertendo (9.5.15) obtém-se:
p(M)
=
g(M = J) − g(M = J + 1)
(9.5.16)
=
g(M = −J) − g(M = −J − 1)
(9.5.17)
Usando os resultados da observação (2) obtém-se sucessivamente:
• p(J) = 0 para J > J1 + J2 , pois g(M) = 0 se |M| > J1 + J2 .
• Usando (9.5.9) e (9.5.10) obtém-se:
p(J = J1 + J2 ) = g(M = J1 + J2 ) = 1 ,
p(J = J1 + J2 − 1) = g(M = J1 + J2 − 1) − g(M = J1 + J2 ) = 1 .
Por iteracção obtêm-se todos os valores de p(J):
p(J = J1 + J2 − 2) = 1 , . . . , p(J = J1 − J2 ) = 1 .
• Finalmente: p(J) = 0 para J < J1 − J2 .
Concluimos que a cada valor possı́vel de J está associado apenas um multipleto e como
tal 2J + 1 vectores próprios do momento angular total. (q.e.d.)
Matematicamente podemos escrever que o espaço vectorial obtido como produto tensorial (9.5.4) se decompõe na soma directa de espaços vectoriais que têm como base os vários
multipletos, ou seja, na soma directa de várias representações irredutı́veis do momento
angular:
E(J1 ) ⊗ E(J2 ) = E(J1 + J2 ) ⊕ E(J1 + J2 − 1) ⊕ . . . ⊕ E(|J1 − J2 | + 1) ⊕ E(|J1 − J2 |) .
9.5.1
Cálculo dos vectores próprios comuns a Jˆ2 e a Jˆz
Os vectores |J, Mi (rigorosamente dever-se-ia escrever |J1 , J2 , J, Mi, mas na prática usamos
a primeira notação) podem-se escrever como combinações lineares dos vectores da base
inicial {|J1 , J2 ; M1 , M2 i}:
|J, Mi =
J1
X
J2
X
M1 =−J1 M2 =−J2
|J1 , J2 ; M1 , M2 i hJ1 , J2 ; M1 , M2 |J, Mi .
(9.5.18)
288
Teoria Geral do Momento Angular e Spin
Os coeficientes hJ1 , J2 ; M1 , M2 |J, Mi desta expansão são os coeficientes de Clebsch-Gordan.
Não é possı́vel dar uma expressão geral destes coeficientes, mas eles podem ser determinados
seguindo o método que a seguir se desenvolve para o caso particular de momentos angulares
1/2 e atendendo a uma série de convenções de fase (por exemplo, os coeficientes de ClebschGordan são reais).
O caso particular de dois spins 1/2
Como exemplo consideremos um sistema de duas partı́culas de spin 1/2. De acordo com
os resultados anteriores, o momento angular total do sistema será S = 1 ou S = 0.
E(S1 = 1/2) ⊗ E(S2 = 1/2) = E(S = 1) ⊕ E(S = 0)
(9.5.19)
Teremos portanto dois multipletos: um estado tripleto (dado existirem três valores de M
para S = 1) e um estado singleto (um único M para S = 0).
⋆ O estado tripleto (subespaço E(S = 1)): Este subespaço, tridimensional, é gerado pela
base própria {|1, 1i, |1, 0i, |1, −1i}. É imediato escrever-se, após uma escolha de fase:
|1, 1i = |+, +i .
(9.5.20)
Os outros estados do tripleto são obtidos por aplicação do operador de escada Ŝ− :
|1, 0i
=
1
√ Ŝ− |1, 1i
~ 2
(9.5.21)
=
1
√ (Ŝ1− + Ŝ2− ) |1, 1i
~ 2
(9.5.22)
=
1
√ [|+, −i + | −, +i] ,
2
(9.5.23)
e ainda,
|1, −1i
=
=
1
√ Ŝ− |1, 0i
~ 2
|−, −i .
(9.5.24)
(9.5.25)
9.5 Adição de momento angular
289
⋆ O estado singleto (subespaço E(S = 0)): O único vector |0, 0i deste subespaço é determinado, a menos de um factor constante de fase, usando-se a condição de ortogonalidade
relativamente aos outros vectores |1, Mi, já determinados. |0, 0i é necessariamente
uma combinação linear dos vectores |+, −i e |−, +i:
|0, 0i = α|+, −i + β|−, +i .
(9.5.26)
A condição de normalização implica que:
h0, 0|0, 0i = |α|2 + |β|2 = 1 .
(9.5.27)
A condição de ortogonalidade a |1, 0i (|0, 0i é obviamente ortogonal a |1, 1i e a |1, −1i)
implica que:
1
h0, 0|1, 0i = √ (α + β) = 0 .
2
De (9.5.26) e de (9.5.27) conclui-se que:
1
α = −β = √ eiχ ,
2
(9.5.28)
(9.5.29)
onde χ é um número real. Escolhendo χ = 09 donde:
1
|0, 0i = √ [|+, −i − |−, +i] .
2
(9.5.30)
Caso geral de dois momentos angulares
De acordo com o teorema de adição do dois momentos angulares:
E(J1 )⊗E(J2 ) = E(J = J1 +J2 ) ⊕ E(J = J1 +J2 −1) ⊕ . . . ⊕ E(J = |J1 −J2 |) . (9.5.31)
Para determinar os vectores |J, Mi que geram os diferentes subespaços segue-se o método
exposto no parágrafo anterior. Em especı́fico:
i) Considera-se o subespaço de maior multiplicidade, isto é, o maior multipleto, que corresponde a J = J1 + J2 . Aqui o vector |J, Ji é facilmente reconhecido:
|J = J1 + J2 , M = J1 + J2 i = |J1 , J2 ; M1 = J1 , M2 = J2 i
9
(9.5.32)
Por convenção hJ1 , J2 ; J1 , J − J1 |J, Ji são reais e positivos, hJ1 , J2 ; M1 , J − M1 |J, Ji são reais e o seu
sinal é (−1)J1 −M1 .
290
Teoria Geral do Momento Angular e Spin
Os outros vectores deste subespaço são determinados por aplicação dos operadores
de escada.
ii) Os vectores de base dos outros subespaços são determinados escrevendo as combinações
lineares de vectores |J1 , J2 ; M1 , M2 i adequadas e usando as condições de ortogonalidade, as condições de normalização e as convenções de fase.
Propriedades dos coeficientes de Clebsch-Gordan
Como se referiu, a determinação dos coeficientes de Clebsch-Gordan obedece a determinadas convenções. Existem tabelas destes coeficientes. Importa no entanto referir algumas
propriedades interessantes destes coeficientes. Em particular:
(i) Regras de selecção: De acordo com o que se referiu no ponto (2) da demonstração do
teorema de adição de momento angular, os coeficientes de Clebsch-Gordon são nulos
se não se verificarem simultaneamente as duas condições:
|J1 − J2 | ≤ J ≤ J1 + J2 ,
M = M1 + M2 .
A desigualdade é conhecida como a desigualdade triangular já que tem implı́cito que
um triângulo pode ser construı́do com lados de comprimentos J1 , J2 e J. Estes três
números desempenham papeis idênticos; a desigualdade pode ser reescrita sob as
formas equivalentes:
|J − J1 | ≤ J2 ≤ J + J1 ,
ou
|J − J2 | ≤ J1 ≤ J + J2 .
(ii) Relações de ortogonalidade:
X
hJ1 , J2 ; M1 , M2 |J, Mi hJ1 , J2 ; M1 , M2 |J ′ , M ′ i = δJJ ′ δM M ′ ,
M1 ,M2
X
J,M
′
′
(9.5.33)
hJ1 , J2 ; M1 , M2 |J, Mi hJ1 , J2 ; M1 , M2 |J, Mi = δM1 M ′ δM2 M ′ .
1
2
(iii) Relações de recorrência:
p
J(J + 1) − M (M + 1)hJ1 , J2 ; M1 , M2 |J, M + 1i =
p
J1 (J1 + 1) − M1 (M1 − 1)hJ1 , J2 ; M1 − 1, M2 |J, M i
p
+ J2 (J2 + 1) − M2 (M2 − 1)hJ1 , J2 ; M1 , M2 − 1|J, M i ,
(9.5.34)
9.6 Sumário
p
9.6
J(J + 1) − M (M − 1)hJ1 , J2 ; M1 , M2 |J, M − 1i =
p
J1 (J1 + 1) − M1 (M1 + 1)hJ1 , J2 ; M1 + 1, M2 |J, M i
p
+ J2 (J2 + 1) − M2 (M2 + 1)hJ1 , J2 ; M1 , M2 + 1|J, M i .
291
(9.5.35)
Sumário
Neste capı́tulo começamos por discutir as representações da álgebra do momento angular,
descobrindo que existem em maior número do que as que correspondem ao momento angular orbital. As representações extra correspondem a spin semi-inteiro. Vimos seguidamente
que estas representações são necessárias para descrever certos resultados experimentais,
como a estrutura fina, o efeito Zeeman anómalo e a experiência de Stern-Gerlach. Em
particular, estas experiências requerem que se descreva o electrão como uma partı́cula de
spin 1/2. Dada esta necessidade, Pauli introduziu certos postulados adicionais na mecânica
quântica não relativista, para descrever o spin das partı́culas, que enunciamos. Estudamos
em detalhe o formalismo quântico para o caso das partı́culas de spin 1/2, como o electrão,
em que o espaço de estados de spin tem dimensão 2. Consideramos o teorema de adição do
momento angular e descobrimos quais os valores possı́veis para o momento angular total
de um sistema com vários momentos angulares individuais. Na transformação entre a base
do momento angular total e dos momentos angulares individuais aparecem os coeficientes
de Clebsch-Gordan, que estudamos em detalhe no caso de um sistema de duas partı́culas
de spin 1/2.
CAPÍTULO
10
Teoria da Difusão
Nos capı́tulos anteriores estabelecemos métodos que nos permitem calcular a função de
onda dado o potencial. O conhecimento da função de onda permite-nos então calcular
quantidades fı́sicas, como o espectro de estados ligados ou o factor de transmissão. Estas
são quantidades relacionáveis com a experimentação. Portanto, tendo um modelo teórico
do potencial fazemos previsões que podem ser comparadas com a experiência.
Muitas vezes, em fı́sica, o problema em mão é o inverso do descrito anteriormente.
Temos resultados experimentais e pretendemos obter um modelo teórico. Por exemplo,
um tipo de experiências frequente em fı́sica, especialmente em fı́sica das altas energias,
consiste em fazer incidir um feixe de partı́culas - que denominamos por ′′ (1)′′ - num alvo
composto por outras partı́culas - que denominamos por ′′ (2)′′ - e estudar a colisão resultante.
Genericamente mede-se o estado final do sistema após a colisão, isto é, o tipo de partı́culas
resultantes e as suas caracterı́sticas, como direcção de emissão, energia, etc. Mas o objectivo
fundamental do estudo é determinar as interacções que ocorreram entre as várias partı́culas
que entraram no processo de colisão.
Os fenómenos observados na colisão, ditos reacções variam em complexidade:
• Nos casos mais simples o estado inicial e final do sistema são compostos pelas mesmas
294
Teoria da Difusão
partı́culas (1) e (2):
(1) + (2) −→ (1) + (2) .
Estas reacções são denominadas reacções de difusão, (“scattering” em inglês).
• Em casos mais gerais não é assim. As partı́culas (1) e (2) podem ser compostas por
outras mais elementares (como núcleos são compostos por nucleões e nucleões por
quarks), que se podem redistribuir durante a colisão, originando novas partı́culas
compostas, diferentes das partı́culas iniciais:
(1) + (2) −→ (3) + (4) + (5) + . . . .
Estas reacções são denominadas reacções com rearranjo.
• Notemos ainda que a altas energias existe a possibilidade relativista de “materialização”
de parte da energia, originando novas partı́culas no estado final.
No nosso estudo vamo-nos restringir à difusão. Na maior parte deste capı́tulo vamos
considerar ainda que esta difusão é elástica, isto é, que para além de as partı́culas iniciais
e finais serem as mesmas, os seus estados internos não se modificam durante a colisão.
Isto significa, em particular, que não há emissão ou absorção de energia por estes estados
internos. Na secção 10.4 será considerada a difusão inelástica.
Se o nosso problema de colisão caisse no âmbito da mecânica clássica, o nosso objectivo
seria determinar os desvios das trajectórias das partı́culas incidentes (1) devido à força
exercida pelas partı́culas alvo (2). Mas o problema em que estamos interessados ocorre à
escala atómica ou nuclear, caindo no âmbito da mecânica quântica. Assim devemos estudar
a evolução da função de onda associada às partı́culas incidentes (1) devida à influência das
interacções com as partı́culas alvo (2). A função de onda irá ‘difundir-se’, justificando o
nome do processo.
No nosso estudo iremos usar algumas hipóteses simplificativas:
• Consideraremos que as partı́culas (1) e (2) não têm spin. Esta hipótese tem como objectivo simplificar a teoria e não deve ser interpretada como implicando que o spin
295
não tem importância em fenómenos de difusão. Pelo contrário, se no Hamiltoniano
houver termos dependentes de spin, diferentes estados de spin difundir-se-ão diferentemente; no final será necessário pesar a contribuição dos diferentes estados de
spin. Este estudo será considerado em detalhe no capı́tulo 12, onde estudaremos
partı́culas idênticas e consideraremos problemas de difusão com spin.
• Não levaremos em consideração uma possı́vel estrutura interna das partı́culas (1) e (2).
O formalismo que iremos desenvolver até à secção 10.4 não será portanto aplicável a
fenómenos de difusão inelástica onde parte da energia cinética de (1) é absorvida, no
estado final pelos graus de liberdade internos de (1) e (2); será apenas para difusão
elástica. Na secção 10.4 consideraremos brevemente difusão inelástica.
• Assumiremos que o alvo é suficientemente fino para nos permitir negligenciar processos
de difusão múltiplos, em que uma partı́cula incidente é difundida várias vezes antes
de abandonar o alvo.
• Negligenciaremos qualquer possibilidade de coerência entre as ondas difundidas pelas
diferentes partı́culas que constituem o alvo. Esta simplificação é justificada quando
a dispersão dos pacotes de ondas associados às partı́culas incidentes (1) é pequena
comparada com as distâncias tı́picas das partı́culas do alvo. Ou seja, concentrarnos-emos em processos elementares de difusão de uma partı́cula incidente (1), por
uma partı́cula do alvo (2). Negligenciando estes efeitos de coerência, o fluxo de
partı́culas detectadas é simplesmente a soma dos fluxos difundidos por cada uma das
N partı́culas do alvo, isto é, N vezes o fluxo difundido por cada uma das partı́culas
do alvo. Note-se que esta aproximação exclui fenómenos interessantes, como difusão
coerente de um cristal - difracção de Bragg.
• Assumiremos que a interacção entre as partı́culas (1) e (2) pode ser descrita por uma
energia potencial V (~r1 − ~r2 ) que depende apenas da posição relativa ~r = ~r1 − ~r2
das partı́culas. Utilizando o referencial do centro de massa, o problema reduz-se ao
estudo da difusão de uma partı́cula devido ao potencial V (~r). Esta partı́cula tem
296
Teoria da Difusão
massa µ, que é a massa reduzida
1
1
1
+
,
=
µ
m1 m2
(10.0.1)
onde m1 e m2 são as massas de (1) e de (2).
10.1
Formalismo para descrever processos de difusão
10.1.1
Definição da secção eficaz de difusão
Seja Oz a direcção das partı́culas incidentes, de massa µ. O potencial V (~r) está localizado à volta da origem, O - figura 10.1. Seja Fi o fluxo de partı́culas no feixe incidente,
isto é, o número de partı́culas que, por unidade de tempo, atravessam uma superfı́cie de
área unitária perpendicular a Oz na região com z → −∞. Assumimos que este fluxo é
suficientemente pequeno para negligenciar as interacções entre as partı́culas do feixe. Um
detector é colocado longe da região onde o potencial é efectivo, numa direcção definida
pelos ângulos polar θ e azimutal φ, com a abertura voltada para o centro de difusão O e
compreendendo um ângulo sólido dΩ. Podemos assim contar o número de partı́culas dn,
difundidas por unidade de tempo para dentro do ângulo sólido dΩ, em torno da direcção
definida por (θ, φ). É de esperar que dn seja proporcional a dΩ e também a Fi ; logo1
dn = σ(θ, φ)FidΩ ,
(10.1.1)
onde o coeficiente de proporcionalidade σ(θ, φ) é denominado secção eficaz diferencial de
difusão na direcção (θ, φ). Dimensionalmente, a equação anterior é
1
1
= [σ(θ, φ)]
T
T L2
⇔ [σ(θ, φ)] = L2 .
(10.1.2)
Ou seja, a secção eficaz diferencial de difusão tem as dimensões de uma área. Frequentemente, σ(θ, φ) é medida em termos de ‘barns’ 2
1
Note que por vezes são usadas diferentes notações na literatura; o número de partı́culas difundidas por
unidade de tempo para dentro do ângulo sólido dΩ é por vezes denotado dn/dt e a secção eficaz diferencial
de difusão na direcção (θ, φ) por dσ(θ, φ)/dΩ.
2
O termo “barn” como unidade de área para secções eficazes surge durante o esforço de guerra norteamericano para o desenvolvimento da bomba atómica, durante trabalho feito na Universidade de Purdue
10.1 Formalismo para descrever processos de difusão
297
Detector
dΩ
feixe incidente
θ
V(r)
O
z
Fluxo Fi
Zona onde o potencial difunde
Figura 10.1: Representação dos vários elementos que entram num processo de difusão.
e seus sub-múltiplos, onde
1 barn ≡ 10−24 cm2 .
De um modo natural define-se a secção eficaz total de difusão σ, como
σ≡
Z
σ(θ, φ)dΩ .
(10.1.3)
num projecto precursor do projecto Manhattan - o famoso projecto em Los Alamos onde seriam construidas
as primeiras bombas. Como reportado na edição de Julho de 1972 da “Physics Today”, por altura de
Dezembro de 1942 os fı́sicos Marshall Holloway e Charles P. Baker da Universidade de Cornell, durante
um jantar, atiravam ideias para denominar a unidade para a secção eficaz nuclear tı́pica. Na sequência de
uma associação de ideias bem humurada sugeriram o “barn”. Nas suas palavras: “The tradition of naming
a unit after some great man closely associated with the field ran into difficulties since no such person could
be brought to mind. Failing in this, the names Oppenheimer and Bethe were tried, since these men had
suggested and made possible the work on the problem with which the Purdue project was concerned. The
”Oppenheimer” was discarded because of its length, although in retrospect an ”Oppy” or ”Oppie” would
seem to be short enough. The ”Bethe” was thought to lend itself to confusion because of the widespread
use of the Greek letter. Since John Manley was directing the work at Purdue, his name was tried, but the
”Manley” was thought to be too long. The ”John” was considered, but was discarded because of the use
of the term for purposes other than as the name of a person. The rural background of one of the authors
then led to the bridging of the gap between the ”John” and the ”barn”. This immediately seemed good
and further it was pointed out that a cross section of 10-24 cm2 for nuclear processes was really as big
as a barn. Such was the birth of the ”barn”.” Claro que a necessidade de uma nova unidade foi forçada
aos fı́sicos nucleares pela necessidade de comunicar telefonicamente com outros sobre tópicos altamente
secretos. O nome “pegou” e a unidade “barn” foi adoptada em Los Alamos, tornando-se o seu significado
secreto. Os dois autores da proposta descreveram a sua sugestão num relatório de 13 de Setembro de 1944
e daqui resultou o relatório de Los Alamos ”Origin of the Term ‘barn’”(LAMS523) de 5 de Março de 1947.
O significado foi “desclassificado” em 4 de Agosto de 1948.
298
Teoria da Difusão
Note-se que, na definição de σ(θ, φ), dn contabiliza apenas as partı́culas difundidas. O
fluxo destas partı́culas que atingem o detector é inversamente proporcional ao quadrado
da distância entre O e o detector. Se se colocar o detector em θ = 0, misturar-se-ão a
estas as partı́culas transmitidas, que terão a mesma forma das do feixe incidente, pelo que
σ(0, φ) não é obtido directamente, mas por extrapolação de σ(θ, φ) para θ pequeno.
10.1.2
Estados estacionários de difusão
Para descrevermos, em Mecânica Quântica, a difusão de uma partı́cula incidente devido
a um potencial V (~r) é necessário estudar a evolução temporal do pacote de ondas que
descreve a partı́cula. Assumimos conhecer o pacote de ondas para t → −∞ quando a
partı́cula está na região negativa do eixo Oz, inafectada pelo potencial V (~r). A evolução
subsequente do pacote de ondas é trivialmente estabelecida se expressarmos o pacote de
ondas como uma sobreposição de estados estacionários do Hamiltoniano do problema
H=
p~2
+ V (~r) .
2µ
(10.1.4)
Por isso, e tal como no capı́tulo 3, em vez de estudarmos pacotes de ondas, vamos
concentrar-nos nos próprios estados estacionários.
A equação de Schrödinger independente do tempo para o Hamiltoniano anterior é:
2
~
(10.1.5)
− ∆ + V (~r) Φ(~r) = EΦ(~r) .
2µ
Consideremos apenas energias positivas, E, iguais à energia cinética da partı́cula incidente
antes de entrar na zona de influência do potencial
E=
~2 k 2
,
2µ
(10.1.6)
onde k é o módulo do vector de onda ~k que descreve a partı́cula quando é livre. Definindo
V (~r) ≡
~2
U(~r) ,
2µ
(10.1.7)
reescrevemos a equação de Schrödinger como
[∆ + k 2 − U(~r)]Φ(~r) = 0 .
(10.1.8)
10.1 Formalismo para descrever processos de difusão
299
Para cada energia, isto é, para cada k, existe um número infinito de soluções desta equação,
dependendo das condições fronteira; o espectro de energias é infinitamente degenerado.
Mas tal como nos problemas de potenciais constantes por pedaços do capı́tulo 3 impusemos restrições de carácter fı́sico às soluções (como normalizabilidade da função de onda
que excluia funções com crescimento assimptótico exponencial, ou a existência de apenas
uma onda transmitida no lado oposto ao da onda incidente), também aqui impomos restrições fı́sicas às soluções que descrevem um processo de difusão. As funções de onda que
obedecem a essas condições, denotadas vkdif (~r), representam os estados estacionários de
difusão. Devem ter as seguintes duas propriedades:
1) Para valores grandes negativos de t, a partı́cula incidente é livre pois o potencial é
negligenciável. Logo a função de onda que descreve o estado estacionário de difusão
deve conter um termo da forma eikz , que descreve a onda incidente
vkinc (~r) ∼ eikz .
(10.1.9)
2) Quando o pacote de ondas atinge a zona onde o potencial é efectivo, a sua estrutura
pode ser drasticamente alterada. Mas para valores grandes e positivos de t esperamos
que os estados estacionários sejam compostos por uma onda difundida. Para r → ∞,
U(~r) → 0 e como tal a onda difundida obedece a
(∆ + k 2 )vkdif ≃ 0 .
(10.1.10)
Se esta onda fosse isotrópica, isto é se tivesse apenas dependência radial, esta equação
ficaria, em coordenadas esféricas,
1 d 2d
2
r
+ k vkdif (r) = 0 ,
r 2 dr dr
(10.1.11)
que se verifica facilmente ter soluções do tipo
e±ikr
.
r
(10.1.12)
300
Teoria da Difusão
Escolhendo o sinal positivo, de modo a representar uma onda que se propague para fora,
e considerando a possibilidade de anisotropia, tomamos a função de onda associada ao
estado estacionário de difusão, para ~r → ∞, como tendo a forma
~
r →∞
vkdif (~r) −→ eikz + fk (θ, φ)
eikr
.
r
(10.1.13)
É na função fk (θ, φ), denominada amplitude de difusão, que surge toda a dependência
desta solução assimptótica no potencial. Por exemplo, se V = 0, fk (θ, φ) = 0. Pode-se
demonstrar que a equação (10.1.8) tem uma única solução que obedece a (10.1.13).
Concluimos esta secção com duas notas:
• A equação (10.1.10) é singular em r = 0; assim, a solução (10.1.12) só tem que verificar
a equação para r 6= 0. Veremos na secção 10.2.1 que, mais correctamente,
(∆ + k 2 )
e±ikr
∝ δ(~r) .
r
(10.1.14)
• O pacote de ondas que representa o estado da partı́cula pode ser expandido em termos
dos estados estacionários do Hamiltoniano (que não são ondas planas); a sua função
de onda terá a forma
Ψ(t, ~r) =
Z
0
10.1.3
+∞
dk g(k)vkdif (~r)e−iEk t/~ ,
Ek =
~2 k 2
.
2µ
(10.1.15)
Relação entre amplitude e secção eficaz de difusão
Como já discutimos anteriormente, num problema fı́sico, uma partı́cula quântica será descrita por um pacote de ondas. Para calcular a secção eficaz de difusão deverı́amos considerar a difusão desse pacote de ondas incidente pelo potencial V (~r). Mas, mais uma vez devido à linearidade da equação de Schrödinger, podemos tratar apenas estados estacionários
de difusão. Podemos pensar nesses estados como descrevendo uma corrente estacionária
de um fluido de probabilidade e calculamos então a secção eficaz da corrente incidente e
difundida. O método é análogo ao usado na barreira quadrada do capı́tulo 3, onde a razão
entre a corrente transmitida (ou reflectida) e a corrente incidente dá-nos o coeficiente de
10.1 Formalismo para descrever processos de difusão
301
transmissão (ou reflexão). Assim iremos calcular as contribuições da onda incidente e da
onda difundida de um estado estacionário de difusão para a corrente de probabilidade.
Recordemos que o vector densidade de corrente de probabilidade (4.4.53), se pode
escrever, para um estado estacionário
1
~
i~
∗
∗
∗
~ r) =
[Φ(~r)∇Φ(~r) − Φ(~r) ∇Φ(~r)] = Re Φ (~r) ∇Φ(~r) .
J(~
2µ
µ
i
(10.1.16)
Calculemos o vector densidade de corrente de probabilidade para:
• Onda incidente/transmitida eikz . Neste caso só existe componente segundo z
1
k~
i
−ikz ~
ikz
Jz (~r) = Re e
=
ike
,
(10.1.17)
µ
i
µ
que não é mais do que a intensidade da função de onda incidente Ii , (3.2.18).
• Onda difundida fk (θ, φ)eikr /r. Notamos primeiro que em coordenadas esféricas
1 ∂
∂ 1 ∂
;
(10.1.18)
,
,
∇≡
∂r r ∂θ r sin θ ∂φ
logo, as componentes em coordenadas esféricas do vector densidade de corrente de
probabilidade são:
−ikr
1
1
~k |fk (θ, φ)|2
ik ikr
~
d
∗e
Jr = Re fk
− 2+
e fk =
,
µ
r i
r
r
µ
r2
Jθd
−ikr
~
1
~ ikr ∂
∗e
∗ ∂
fk = 3 Re −ifk fk ,
= Re fk 3 e
µ
r i
∂θ
µr
∂θ
~
∂
Jφd = 3
Re −ifk∗ fk .
µr sin θ
∂φ
(10.1.19)
(10.1.20)
(10.1.21)
Concluimos que, assimptoticamente, Jθ e Jφ são negligenciáveis e a corrente difundida
é essencialmente radial.
Para relacionarmos σ(θ, φ) com fk (θ, φ) recordemos a definição de secção diferencial de
difusão (10.1.1). Quer o fluxo incidente de partı́culas quer o fluxo difundido serão proporcionais às respectivas densidades de corrente de probabilidade com a mesma constante de
302
Teoria da Difusão
proporcionalidade.3 Logo, obtemos para o fluxo incidente
Fi = C|J i | = C
~k
.
µ
(10.1.22)
O número de partı́culas que atinge a abertura do detector por unidade de tempo é proporcional ao fluxo do vector densidade de corrente de probabilidade difundido através da
~ da abertura do detector:
superfı́cie dS
~
dn = C J~d · dS
assimptoticamente
≃
C(J d )r r 2 dΩ = C
~k
|fk (θ, φ)|2dΩ .
µ
(10.1.23)
Logo, (10.1.1) diz-nos que
σ(θ, φ) = |fk (θ, φ)|2 .
(10.1.24)
Ou seja, a secção eficaz diferencial de difusão é o quadrado do módulo da amplitude de
difusão, o que justifica o nome da última quantidade.
Notemos que no cálculo da corrente probabilidade difundida negligenciamos a interferência entre eikz (corrente incidente) e fk (θ, φ)eikr /r (corrente difundida). Na realidade
esta interferência só é importante perto de θ = 0, onde de qualquer modo extrapolamos
o resultado para a secção eficaz diferencial a partir dos valores para θ pequeno, como
comentamos anteriormente.
10.2
Equação integral de difusão e o método de Born
Para demonstrar a existência de estados estacionários cujo comportamento assimptótico
é (10.1.13) vamos estabelecer uma equação integral de difusão da qual tais estados serão
soluções. Recordemos a equação (10.1.8) que reescrevemos na forma
[∆ + k 2 ]Φ(~r) = U(~r)Φ(~r) .
(10.2.1)
Introduzimos agora a função de Green, G(~r), do operador ∆ + k 2 , definida pela equação:
[∆ + k 2 ]G(~r) = δ(~r) ,
3
(10.2.2)
Da mesma maneira que o fluxo de partı́culas num fluido ou numa corrente eléctrica é proporcional aos
respectivos vectores densidade de corrente.
10.2 Equação integral de difusão e o método de Born
303
onde δ(~r) é um delta de Dirac. Podemos tomar partido desta função para construir soluções
de (10.2.1). Seja Φ0 (~r) uma solução da equação (10.2.1) com o lado direito igual a zero,
isto é
[∆ + k 2 ]Φ0 (~r) = 0 .
(10.2.3)
A função
Φ(~r) = Φ0 (~r) +
Z
d3 r~′ G(~r − r~′ )U(r~′ )Φ(r~′ ) ,
(10.2.4)
é então também solução de (10.2.1). Para demonstrar este facto actuamos com o operador
(∆ + k 2 ) em ambos os lados da equação (10.2.4); obtemos
2
2
(∆ + k )Φ(~r) = (∆ + k )Φ0 (~r) +
Z
d3~r′ U(r~′ )Φ(r~′ )(∆ + k 2 )G(~r − r~′ ) ,
(10.2.5)
onde usamos o facto de que (∆ + k 2 ) actua na variável ~r e não r~′ , e como tal pode ser
colocado dentro do integral. Usando agora (10.2.2) e (10.2.3) obtemos
2
(∆ + k )Φ(~r) =
Z
d3 r~′ U(r~′ )Φ(r~′ )δ(~r − r~′ ) = U(~r)Φ(~r) ,
(10.2.6)
o que demonstra que (10.2.4) é solução de (10.2.1). Reciprocamente pode-se demonstrar
que qualquer solução de (10.2.1) se pode apresentar na forma (10.2.4). Isto é intuitivo se
pensarmos em (10.2.1) como uma equação diferencial homogénea - lado esquerdo - com
uma fonte - termo do lado direito; pensamos então em (10.2.4) como a soma da solução
geral da equação homogénea, Φ0 , com uma solução particular que considera o termo de
fonte.
A equação integral (10.2.4) é denominada equação integral de difusão. A sua principal
vantagem relativamente à equação diferencial (10.2.1) é que, escolhendo Φ0 (~r) e G(~r) apropriadamente, podemos obter, sem mais trabalho, Φ(~r) com o comportamento assimptótico
desejado. Portanto a equação integral (10.2.4) torna-se equivalente à equação diferencial
(10.2.1) mais a condição assimptótica (10.1.13). É exactamente esse resultado que vamos
agora estabelecer.
304
10.2.1
Teoria da Difusão
Escolha da função de Green e de Φ0
Comecemos por discutir as funções de Green. Com este propósito enunciamos, sem prova,
o seguinte resultado
1
∆
= −4πδ(~r) ,
r
(10.2.7)
onde ∆ é o laplaciano em três dimensões, r a coordenada esférica radial e δ(~r) o delta de
Dirac em três dimensões.4 Considerando este resultado e a equação de definição da função
de Green, (10.2.2), concluimos que, perto de r = 0,
r→0
G(~r) ≃ −
1
.
4πr
(10.2.8)
Por outro lado já vimos, na secção 10.1.2, que para ~r 6= 0,
(∆ + k 2 )
e±ikr
=0.
r
(10.2.9)
1 e±ikr
,
4π r
(10.2.10)
Logo, tomamos as funções de Green,
G± (~r) = −
onde G+ é denominada função de Green ‘outgoing’ e G− é denominada função de Green
‘incoming’. Equivalentemente estamos a estabelecer o resultado
e±ikr
= −4πδ(~r) .
∆+k
r
2
4
(10.2.11)
Podemos motivar este resultado (o que não constitui uma prova!) pelo seguinte raciocı́nio. Consideramos a equação de Poisson para o campo gravı́tico com uma massa pontual M , descrita por um delta de
Dirac:
1 d 2 d
r
φ = 4πGM δ(~r) .
∆φ(~r) = 4πGM δ(~r) ⇔
r2 dr dr
Integramos ambos numa esfera de raio R. Do lado esquerdo usamos coordenadas esféricas e do lado direito
coordenadas cartesianas:
Z R
Z
Z
Z
2 1 d 2 d
drr 2 r
4π
φ = 4πGM dx dy dzδ(x)δ(y)δ(z) ,
r dr dr
0
logo
GM
d
φ = GM ⇔ φ(R) = −
+ constante .
dR
R
Colocando esta solução na primeira equação temos
GM
1
∆ −
= −4πδ(~r) ,
+ constante = 4πGM δ(~r) ⇔ ∆
r
r
R2
que é a equação (10.2.7).
10.2 Equação integral de difusão e o método de Born
305
M
r
r
u
O
r’
r’
P
L
Figura 10.2: Representação de um ponto assimptoticamente longe da zona de influência
de um potencial.
O comportamento assimptótico que desejamos obter (10.1.13) sugere que escolhamos
Φ0 = eikz ,
(10.2.12)
e a função de Green ‘outgoing’, G(~r) = G+ (~r). Isto é, tomamos os estados estacionários
de difusão na forma (10.2.4) com estas escolhas:
Z
dif
ikz
vk (~r) = e + d3 r~′ G+ (~r − r~′ )U(r~′ )vkdif (r~′ ) .
(10.2.13)
Vamos então demonstrar que estes estados estacionários têm o comportamento assimptótico
correcto. Para isso consideramos um potencial cuja zona de influência, centrada em ~r = 0,
tem uma escala linear L - figura 10.2. Consideramos um ponto longe desta zona de influência, M, para o qual |~r| ≫ L. Considerando o vector de posição de um outro ponto, r~′
temos que
|~r − r~′ |
=
q
q
′
′
(~r − r~ ) · (~r − r~ ) = r 2 − 2~r · r~′ + (r ′ )2 = r
s
2r~′ · ~u
+
1−
r
′ 2
r
, (10.2.14)
r
onde r = |~r|, r ′ = |r~′ | e ~u é o versor na direcção de ~r, ~r = r~u. Especializemos para o caso
em que r~′ é a posição de um ponto arbitrário, P , na zona de influência do potencial. Para
todos estes pontos verifica-se que |r~′ | < L ≪ |~r|; logo expandimos a expressão anterior em
potências de r ′ /r, obtendo
|~r − r~′ | ≃ r − r~′ · ~u .
(10.2.15)
306
Teoria da Difusão
Nestas condições obtemos a expressão assimptótica
~′
G+ (~r − r~′ ) = −
1 eikr −ik~u·r~′
1 eik|~r−r |
≃−
e
.
4π |~r − r~′ |
4π r
(10.2.16)
Substituindo no estado de difusão (10.2.13) obtemos o comportamento assimptótico
Z
eikr
r→∞ ikz
~′
dif
d3 r~′ e−ik~u·r U(r~′ )vkdif (r~′ ) .
(10.2.17)
vk (~r) ≃ e −
4πr
Este é, de facto, o comportamento assimptótico (10.1.13), dado que o integral já não depende da distância r, mas apenas dos ângulos θ e φ, através de ~u. Concluimos deste
modo que os estados definidos pela equação integral (10.2.13) têm o comportamento assimptótico correcto para serem estados estacionários de difusão. Mais ainda, comparando
com (10.1.13) reconhecemos a amplitude de difusão como sendo
Z
1
~′
d3 r~′ e−ik~u·r U(r~′ )vkdif (r~′ ) .
fk (θ, φ) = −
4π
10.2.2
(10.2.18)
A aproximação de Born
Vamos agora estabelecer uma solução aproximada da equação integral de difusão para os
estados estacionários de difusão, e como tal para a amplitude de difusão e secção eficaz
diferencial de difusão. Começamos por escrever
~
eikz = eiki ·~r ,
(10.2.19)
onde ~ki é o vector de onda incidente. Em termos de ~ki, os estados estacionários de difusão
(10.2.13) ficam:
vkdif (~r)
i~ki ·~
r
=e
+
Z
d3 r~′ G+ (~r − r~′ )U(r~′ )vkdif (r~′ ) .
Façamos uma mudança de notação: ~r → r~′ e r~′ → r~′′ ; logo
Z
dif ~′
i~ki ·r~′
vk (r ) = e
+ d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )vkdif (r~′′ ) .
(10.2.20)
(10.2.21)
Seguidamente inserimos (10.2.21) em (10.2.20) e obtemos
Z
~ ~′
dif
i~ki ·~
r
vk (~r) = e
+ d3 r~′ G+ (~r − r~′ )U(r~′ )eiki ·r
Z
Z
3 ~′
′
′
+ d r G+ (~r − r~ )U(r~ ) d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )vkdif (r~′′ ) .
(10.2.22)
10.2 Equação integral de difusão e o método de Born
307
Note-se que agora conhecemos os dois primeiros termos do lado direito. Apenas desconhecemos o terceiro, pois inclui a função desconhecida vkdif . Podemos repetir novamente
o procedimento, substituindo em (10.2.20) ~r → r~′′ e r~′ → r~′′′ . Substituindo a expressão
resultante em (10.2.22) obtemos
i~ki ·~
r
Z
~ ~′
=e
+ d3 r~′ G+ (~r − r~′ )U(r~′ )eiki ·r
Z
Z
~ ~′′
3 ~′
′
′
+ d r G+ (~r − r~ )U(r~ ) d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )eiki ·r
Z
Z
Z
3 ~′
3 ~′′
′
′
′
′′
′′
~
~
~
~
~
+ d r G+ (~r − r )U(r ) d r G+ (r − r )U(r ) d3 r~′′′ G+ (r~′′ − r~′′′ )U(r~′′′ )vkdif (r~′′′ ) .
vkdif (~r)
(10.2.23)
Agora, os três primeiros termos do lado direito são conhecidos e apenas o quarto desconhecido. Podemos repetir o processo quantas vezes desejarmos, de modo a ficarmos com os
n primeiros termos do lado direito conhecidos e apenas o termo n + 1 desconhecido. Este
método, denominado expansão de Born pode ser usado para construir a função de onda
dos estados estacionários de difusão, desde que o potencial seja fraco. O ponto principal
desta expansão é que cada novo termo introduziu mais uma potência do potencial U(~r). O
significado de o potencial ser fraco é de que este novo termo deverá ser pequeno. Sendo L a
escala tı́pica do potencial, e U = 2µV /~2 a sua magnitude tı́pica, o significado quantitativo
de “o potencial ser fraco” é
√
U=
√
2µV
1
≪ .
~
L
(10.2.24)
Isto é a escala de energia associada à magnitude do potencial é muito menor do que a escala
de energia associada ao seu comprimento. Logo, se o potencial for fraco, a expansão de
Born é uma expansão perturbativa; isto é, cada termo é menor do que o anterior, pelo que
podemos truncar a expansão num determinado ponto e negligenciar o último termo, e como
tal calcular o lado direito da equação. Se substituirmos a expansão de Born para vkdif (r~′ )
em (10.2.18), obtemos a expansão de Born para a amplitude de difusão. A aproximação
de Born é truncar a expansão de Born considerando apenas os primeiros dois termos, isto
é
~ ~′
vkdif (r~′ ) = eiki ·r ,
(10.2.25)
308
Teoria da Difusão
r
r
r’’
r’
r’
Figura 10.3: Esquerda: Na aproximação de Born contabilizamos apenas a contribuição
da onda incidente e de ondas difundidas uma vez na zona onde o potencial é efectivo.
Direita: As aproximações seguintes levam em conta múltiplas difusões, que podem ser
negligenciadas, caso o potencial seja fraco.
pelo que (10.2.18) fica
fkBorn (θ, φ)
1
=−
4π
Z
~′
~ ~′
d3 r~′ e−ik~u·r U(r~′ )eiki ·r .
(10.2.26)
Denotando o vector de onda difundido ~kd ≡ k~u e o vector de onda transferido ~q ≡ ~kd − ~ki ,
reescrevemos este resultado como
Z
Z
1
2µ
~′
Born
3 ~′ −i~
q ·r~′
′
~
fk (θ, φ) = −
d re
U(r ) = −
d3 r~′ e−i~q·r V (r~′ ) ,
2
4π
4π~
(10.2.27)
onde usamos (10.1.7). Finalmente, usando (10.1.24), obtemos para a secção eficaz diferencial de difusão na aproximação de Born
σkBorn (θ, φ)
µ2
= 2 4
4π ~
Z
2
d3~re−i~q·~r V (~r)
.
(10.2.28)
Concluimos, portanto, que na aproximação de Born, a secção eficaz diferencial de difusão
está muito simplesmente relacionada com a transformada de Fourier do potencial. O vector
de onda transferido ~q, depende do módulo de ~ki e ~kd (que é o mesmo - k) e da direcção
de difusão (θ, φ). Para uma dada direcção de difusão, a secção eficaz de Born varia com
k, ou seja com a energia do feixe incidente. Por outro lado, para uma dada energia σ Born
varia com (θ, φ). Concluimos que estudando as variações de σ Born com θ, φ ou ainda com
a energia incidente, deduzimos informação sobre o potencial V (~r).
10.2.3
Interpretação da aproximação de Born
Recordemos a equação (10.2.20). Podemos pensar na função G+ (~r − r~′ ) como representando
a amplitude, no ponto ~r, da onda emitida por uma fonte pontual em r~′ . Este ponto de
10.2 Equação integral de difusão e o método de Born
309
vista é corroborado pela expressão (10.2.16). Tomando a aproximação de Born (10.2.25),
(10.2.20) diz-nos que a onda difundida em ~r é a soma da onda incidente com um número
infinito de ondas provenientes de fontes secundárias; estas fontes secundárias existem em
todos os r~′ onde U(r~′ 6= 0) - figura 10.3 esquerda. Os termos seguintes da expansão de
Born levam em conta novas fontes secundárias que são elas próprias excitadas por ondas
emitidas por fontes secundárias - figura 10.3 direita. Podemos assim interpretar o facto de
a expansão de Born ser perturbativa, quando o potencial é fraco, como significando que
podemos negligenciar a influência de fontes secundárias umas nas outras.
Nota: Os processos de difusão múltipla considerados na expansão de Born nada têm
a ver com os processos de difusão múltipla que dissemos ir negligenciar no princı́pio deste
capı́tulo. No primeiro caso estamos a falar pela difusão múltipla da partı́cula incidente por
uma partı́cula alvo; no segundo na difusão múltipla da partı́cula incidente por diferentes
partı́culas do alvo.
10.2.4
A aproximação de Born para potenciais centrais
No caso de o potencial difusor ser central, que inclui muitos casos de interesse fı́sico,
podemos escrever uma fórmula mais usável para a amplitude de difusão e consequentemente
para a secção eficaz de difusão. Esta fórmula é estabelecida usando a seguinte propriedade
de transformadas de Fourier três dimensionais:
Lema: Seja f (~r) uma função três dimensional com transformada de Fourier
f˜(~q) =
1
(2π)3/2
Z
d3~rf (~r)e−i~q·~r .
(10.2.29)
Se f (~r) = f (r), isto é, a função depende apenas do módulo de ~r, r, então:
i) f˜ depende apenas do módulo de ~q, q;
ii) f˜(q) pode ser calculada pela expressão:
2
f˜(q) = √
2π q
Z
+∞
r sin qrf (r)dr .
0
(10.2.30)
310
Teoria da Difusão
Demonstração:
˜ q~′ ), onde q~′ = R~q e R é uma rotação arbitrária. Logo
i) Consideremos f(
Z
1
~′
′
˜
~
d3~rf (~r)e−iq ·~r .
f (q ) =
3/2
(2π)
Aplicamos a mesma rotação à variável de integração, r~′ = R~r. Logo
Z
1
~′ ~′
′
˜
~
f (q ) =
d3 r~′ f (r~′)e−iq ·r .
3/2
(2π)
(10.2.31)
(10.2.32)
Como o elemento de volume e produto escalar são invariantes por uma rotação
d3~r = d3 r~′ ,
~q · ~r = q~′ · r~′ ,
(10.2.33)
e como, por hipótese, f (~r) = f (r~′ ), pois a função só depende do módulo, concluimos
que
f˜(~q) = f˜(q~′ ) .
(10.2.34)
Logo f˜ depende apenas do módulo de ~q.
ii) Podemos, por isso, escolher uma direcção arbitrária de ~q, para calcular a transformada
de Fourier (10.2.29). Seja ~q = qez ; (10.2.29) fica:
Z 2π Z +∞
Z π
1
2
˜
dφ
r f (r)
dθ sin θe−iqr cos θ dr .
f (q) =
(2π)3/2 0
0
0
(10.2.35)
Fazendo os integrais angulares obtemos
Z +∞ 2
Z +∞
r f (r) −iqr cos θ θ=π
2rf (r)
1
1
˜
f (q) = √
e
|θ=0 dr = √
sin (qr)dr . (10.2.36)
iqr
q
2π 0
2π 0
(q.e.d.)
Como a amplitude de difusão, na aproximação de Born, é dada por uma transformada
de Fourier (10.2.27), podemos para o caso de potenciais centrais V (~r) = V (r), usar este
lema. Usando (10.2.29) e (10.2.30) obtemos
Z
2µ +∞
Born
r sin (qr)V (r)dr .
fk (θ) = − 2
q~ 0
(10.2.37)
10.2 Equação integral de difusão e o método de Born
311
É esta expressão que usamos na prática. Note-se que nestes casos a amplitude de difusão
fica independente do ângulo azimutal. De facto, toda a dependência angular está contida
no vector de onda transferido, ~q, que entra na expressão apenas em módulo q = |~q|. Para
incidência segundo o eixo Oz, o vector de onda transferido é
~r
~q = ~kd − ~ki = k − kez ,
r
onde ez é um versor unitário na direcção z; calculamos então facilmente que
θ
2z
2
2
+ 1 = 2k 2 (1 − cos θ) = 4k 2 sin2 ,
q =k 1−
r
2
(10.2.38)
(10.2.39)
o que demonstra que |~q| depende apenas, de facto, do ângulo polar θ. Note-se que a
independência de φ resulta das simetrias do sistema. De facto tanto o feixe incidente como
o potencial difusor são independentes do ângulo azimutal.
Consideremos dois exemplos explı́citos de cálculo de secção eficaz diferencial de difusão
usando (10.2.37).
Poço de potencial esférico
Como primeiro exemplo consideramos um poço de potencial esférico

 −V , r < R
0
V (r) =
.
 0, r>R
(10.2.40)
Este é um potencial contı́nuo por pedaços onde é particularmente simples calcular a amplitude de difusão. Note, em primeiro lugar, que a condição de validade da aproximação
de Born (10.2.24) é
√
2µV0
1
≪
.
~
R
A expressão geral (10.2.37) fica
Z
2µV0 R
2µV0
Born
fk (θ) =
r sin (qr)dr = 3 2 (sin qR − qR cos qR) .
2
q~
q ~
0
(10.2.41)
(10.2.42)
Como tal, obtemos para a secção eficaz diferencial de difusão, na aproximação de Born
2 2 4
4µ V0 R
R2
Born
(sin qR − qR cos qR)2 ,
(10.2.43)
σ
(θ) =
6
(qR)
~4
312
Teoria da Difusão
0.11
0.105
0.1
0.095
0.09
0
0.5
1
1.5
2
2.5
3
theta
Figura 10.4: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial
(10.2.40) na aproximação de Born. Estão representados três valores de qR, sendo que à
medida que a energia da onda enviada diminui (e como tal também qR), a secção se torna
cada vez mais constante (i.e isotrópica).
onde q = 2k| sin θ/2|. Esta secção eficaz encontra-se representada graficamente na figura
10.4. Esta secção eficaz tem um limite particularmente simples se, para além da condição
de validade da aproximação de Born (10.2.41) assumirmos baixas energias
k≪
1
R
(⇔ qR ≪ 1) .
(10.2.44)
Isto é, a escala de energia das ondas difundidas é muito menor que a escala de energia
definida pelo alcance do potencial. Neste caso, podemos expandir as funções trigonométricas
em série de Taylor e tomar a primeira contribuição não nula. Obtemos
σ Born (θ)
baixa energia
≃
4µ2 V02 R6
.
9~4
(10.2.45)
A secção eficaz diferencial não tem dependência angular, nesta aproximação, de acordo
com o exibido na figura 10.4. A secção eficaz total é
σ Born
baixa energia
≃
16π µ2 V02 R6
.
9
~4
(10.2.46)
Iremos recuperar este resultado usando o método das ondas parciais (fórmula (10.3.97)),
do qual extrairemos uma maior interpretação fı́sica.
10.2 Equação integral de difusão e o método de Born
313
Potencial de Yukawa
Como segundo exemplo calculamos a secção eficaz diferencial de difusão para um potencial
do tipo
V (~r) = V0
e−αr
,
r
(10.2.47)
onde V0 e α são constantes reais e α > 0. O potencial será atractivo (repulsivo) se V0 < 0
(V0 > 0). A magnitude do potencial é caracterizada por |V0 |; o seu alcance por
r0 =
1
;
α
(10.2.48)
pois, para distâncias muito maiores do que 1/α, o potencial é praticamente nulo - figura
10.5. Este potencial é designado por potencial de Yukawa, em homenagem a Hideki Yukawa
(1907-1981), que o introduziu em 1935 para descrever as forças nucleares, cujo alcance é
da ordem do Fermi (10−15 m). Para explicar a origem deste potencial, Yukawa introduziu
uma nova partı́cula - o mesão π - cuja existência foi, de facto, descoberta em 1947 por
Cecil Powell (1903-1969). Esta partı́cula, que era vista como a mediadora da força nuclear,
possuı́a massa e essa era a razão do curto alcance do potencial. Por estas descobertas
Yukawa ganhou o prémio Nobel da Fı́sica em 1949 e Powell em 1950. Contudo, a teoria
de Yukawa foi posteriormente ultrapassada pela Cromodinâmica Quântica, como descrição
da força nuclear forte. Note-se que para α = 0 o potencial (10.2.47) se torna o potencial
de Coulomb, pelo que o potencial de Coulomb se pode considerar um potencial de Yukawa
com alcance infinito.
Se assumirmos que |V0 | é suficientemente pequeno para a aproximação de Born poder
ser usada, isto é (10.2.24)
p
2µ|V0|
≪α,
~
(10.2.49)
e observando que o potencial é central, temos, por (10.2.37),
Z
Z
2µV0 +∞ (iq−α)r
2µV0 +∞
−αr
Born
sin (qr)e dr = − 2
e
− e−(α+iq)r dr , (10.2.50)
fk (θ, φ) = − 2
~q 0
~ q2i 0
que agora se pode integrar facilmente para obter
fkBorn (θ, φ) = −
2µV0
1
.
2
2
~ q + α2
(10.2.51)
314
Teoria da Difusão
r
0
2
4
6
8
10
0
-0.2
-0.4
-0.6
-0.8
-1
Figura 10.5: Potencial de Yukawa com α = 1 versus potencial de Coulomb com a mesma
magnitude. Claramente o potencial de Yukawa tem um alcance efectivamente finito, enquanto que o potencial de Coulomb tem um alcance infinito.
Usando (10.2.39) para expressar q em função do ângulo θ, a secção eficaz diferencial de
difusão para o potencial de Yukawa na aproximação de Born fica
2 2
−2
4µ V0
4k 2 sin2 (θ/2)
Born
Born
2
σ
(θ) = |fk (θ, φ)| =
1+
.
α 2 ~4
α2
(10.2.52)
Este resultado está representado na figura 10.6. Comentários ao resultado:
• Esta secção eficaz é independente do ângulo azimutal, come seria de esperar dadas as
simetrias do problema: o potencial é central e o feixe é paralelo a Oz, pelo que existe
simetria azimutal.
• Mas a secção eficaz depende do ângulo polar. Em particular, para energia (k) fixa, é
maior para θ = 0 (partı́culas que seguem em frente) do que para θ = π (partı́culas
rechaçadas).
• A secção eficaz diminui com o aumento de energia.
• O sinal de V0 é irrelevante, na aproximação de Born.
• A secção eficaz total é
σ
Born
=
Z
σ
Born
4µ2V02
4π
.
(θ)dΩ = 2 4 2
α ~ [α + 4k 2 ]
(10.2.53)
10.2 Equação integral de difusão e o método de Born
315
1
0.8
0.6
0.4
0.2
0
0.5
1
1.5
2
2.5
3
theta
Figura 10.6: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial
(10.2.47) na aproximação de Born. Estão representados três valores de q/α, sendo que à
medida que a energia da onda enviada diminui (e como tal também q/α), a secção se torna
cada vez mais constante (i.e isotrópica).
Já comentamos anteriormente que o potencial de Coulomb pode ser visto como o caso
limite do potencial de Yukawa em que o alcance é infinito; isto é tomando
α=0,
2
V0 = Z 1 Z 2 e ,
q2
,
e =
4πǫ0
2
(10.2.54)
onde q é a carga do electrão e Z1 q e Z2 q são as cargas das duas partı́culas envolvidas
na interacção, (10.2.47) reduz-se ao potencial de Coulomb. Tomando estes valores em
(10.2.52), obtemos a secção eficaz diferencial de difusão
Born
(θ)
σ(Coulomb)
4µ2 Z12 Z22 e4
Z12 Z22 e4
= 4
=
,
~ 16k 4 sin4 θ/2
16E 2 sin4 θ/2
(10.2.55)
onde usamos (10.1.6). Esta é a famosa fórmula de Rutherford que descreve a secção eficaz
para o potencial de Coulomb. É curioso que tenhamos obtido a fórmula correcta neste caso,
dado que a teoria que desenvolvemos não é aplicável, à priori, ao potencial de Coulomb,
devido ao alcance infinito (que implica que a condição (10.2.49) não é obedecida). O
resultado encontra-se representado na figura 10.7.
316
Teoria da Difusão
250
200
150
100
50
0
0.5
1
1.5
2
2.5
3
theta
Figura 10.7: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial
de Coulomb na aproximação de Born. Repare-se que embora Rutherford tenha detectado
que algumas partı́culas α completamente rechaçadas - i.e. com θ = π/2-, a probabilidade
de isso acontecer é pequenı́ssima.
10.3
Método das ondas parciais para a difusão por
um potencial central
No caso particular de o potencial difusor ser um potencial central, podemos diagonalizar
simultaneamente os operadores Ĥ, L̂2 e L̂z , tal como discutido na secção 6.3. Isto é, existem
estados estacionários com momento angular bem definido, aos quais, no contexto da teoria
da difusão, chamamos ondas parciais e denotamos por Φk,ℓ,m(~r), ou ainda, na notação de
Dirac, |Φk,ℓ,m i. Os valores próprios dos operadores acima mencionados são, nestes estados:
Ĥ|Φk,ℓ,m i =
~2 k 2
|Φk,ℓ,mi ,
2µ
L̂2 |Φk,ℓ,m i = ℓ(ℓ + 1)~2 |Φk,ℓ,m i ,
L̂z |Φk,ℓ,mi = m~|Φk,ℓ,mi .
(10.3.1)
A dependência angular destas ondas parciais é sempre dada por harmónicos esféricos
Yℓm (θ, φ); o potencial V (r) só influencia a parte radial.
Nesta secção iremos começar por estudar estados estacionários com momento angular
bem definido para uma partı́cula livre. Denominamos estes estados por ondas esféricas
livres e denotamo-los por Φ0k,ℓ,m (~r), ou ainda, na notação de Dirac, |Φ0k,ℓ,m i. Veremos
10.3 Método das ondas parciais para a difusão por um potencial central
317
que, assimptoticamente, a dependência radial destas ondas esféricas livres será dada pela
sobreposição de uma onda ‘incoming’ e−ikr /r com uma onda ‘outgoing’ eikr /r, tendo as
duas ondas uma diferença de fase bem definida.
No caso das ondas parciais para um potencial V (r) que é assimptoticamente negligenciável, esperamos um comportamento semelhante: assimptoticamente a dependência
radial deverá ainda ser dada pela sobreposição das ondas ‘incoming’ e ‘outgoing’. Mas
neste caso, a diferença de fase entre as duas ondas é diferente daquela que caracteriza as
ondas esféricas livres: o potencial V (r) introduz uma diferença de fase adicional ou desfasamento, δℓ . Esta quantidade é a unica diferença entre o comportamento assimptótico
de Φ0k,ℓ,m(~r) e Φk,ℓ,m (~r). Logo, se soubermos:
1) Para uma dada energia, a diferença de fase adicional δℓ para todos os ℓ;
2) Expressar os estados estacionários de difusão vkdif (~r) como uma combinação linear das
ondas parciais Φk,ℓ,m(~r);
saberemos caracterizar o comportamento assimptótico dos estados estacionários de difusão
e como tal extrair a amplitude de difusão e a secção eficaz diferencial de difusão. É esta
técnica que vamos estabelecer nesta secção.
10.3.1
Ondas esféricas versus ondas planas para uma partı́cula
livre
Em mecânica clássica, uma partı́cula livre de massa µ tem um movimento rectilı́neo e
uniforme. O seu momento ~p, energia E = p~ 2 /2µ e momento angular relativamente à
~ = ~r × ~p, são constantes do movimento (|L|
~ = |~p|b, onde
origem do sistema coordenado, L
b é o parâmetro de impacto).
~
~
~
~
Em mecânica quântica, os operadores L̂ = R̂ × P̂ e P̂ não comutam, pelo que não
podemos classificar os estados fı́sicos de uma partı́cula livre simultaneamente pelo momento
angular e pelo momento linear. Portanto, em mecânica quântica, temos (pelo menos) duas
opções para o C.C.O.C. que descreve uma partı́cula livre:
• C.C.O.C.={P̂x , P̂y , P̂z }. Neste caso os estados próprios são ondas planas.
318
Teoria da Difusão
• C.C.O.C.={Ĥ0 , L̂z , L̂2 }. Neste caso os estados próprios são ondas esféricas livres.
Consideremos com mais detalhe estas duas possibilidades.
Ondas planas
Estes estados formam a representação |~pi estudada na secção 4.4.2. Obedecem a
~2
p~2
P̂
|~pi =
|~pi .
Ĥ0 |~pi =
2µ
2µ
P̂i |~pi = pi |~pi ,
(10.3.2)
Notemos ainda que a projecção das ondas planas em estados próprios do operador posição
é dada por (4.4.23)
h~r|~pi =
3/2
1
2π~
ei~p·~r/~ .
(10.3.3)
Em termos do vector de onda ~k = ~p/~, definimos os estados
|~ki ≡ ~3/2 |~pi ,
(10.3.4)
em termos dos quais as relações anteriores ficam
P̂i |~ki = ~ki |~ki ,
~k 2 ~2
Ĥ0 |~ki =
|~ki ,
2µ
(10.3.5)
3/2
(10.3.6)
e
h~r|~ki =
1
2π
~
eik·~r .
Ondas esféricas livres
~2
Pretendemos encontrar as funções próprias que diagonalizam simultaneamente Ĥ0 = P̂ /2µ,
L̂2 e L̂z . De acordo com a secção 6.3, resolvemos a equação de Schrödinger independente
do tempo com o ansatz
0
Φ0k,ℓ,m (~r) = Rk,ℓ
(r)Yℓm (θ, φ) ,
e obtemos (6.3.12) com V (r) = 0,
ℓ(ℓ + 1)~2
~2 d
2 d
0
0
r
+
Rk,ℓ
(r) = ERk,ℓ
(r) .
−
2µr 2 dr
dr
2µr 2
(10.3.7)
(10.3.8)
10.3 Método das ondas parciais para a difusão por um potencial central
319
Note-se que como o valor mı́nimo do potencial é zero (de facto é sempre zero!) não pode
haver estados estacionários com E < 0; definimos então
√
2µE
~2 k 2
⇔E=
.
k=
~
2µ
Esta equação pode ser reescrita como
2
d
2 2
0
2 d
+ 2r + k r − ℓ(ℓ + 1) Rk,ℓ
(r) = 0 ,
r
dr 2
dr
(10.3.9)
(10.3.10)
que é conhecida como a equação de Bessel esférica 5; é uma equação que pode ser transformada numa equação de Bessel com ordem semi-inteira. As suas soluções são bem conhecidas e denominam-se por funções de Bessel esféricas. Aqui iremos construir as soluções desta
equação usando um método algébrico, semelhante ao usado na construção dos harmónicos
esféricos.
10.3.2
Dedução da forma explı́cita das ondas esféricas livres
Comecemos por considerar, tal como na secção 6.4, soluções de (10.3.8) da forma
0
Rk,ℓ
a equação (10.3.8) fica então
u0k,ℓ
=
;
r
ℓ(ℓ + 1)
d2
2
−
+ k u0k,ℓ (r) = 0 .
dr 2
r2
(10.3.11)
(10.3.12)
Esta equação é suplementada pela condição
u0k,ℓ(r = 0) = 0 ,
(10.3.13)
que é necessária para que as ondas esféricas livres não sejam (todas) divergentes em r = 0
(se assim fosse qualquer estado estacionário seria divergente em r = 0, o que não é o caso).
Assimptoticamente, a equação (10.3.12) fica
2
d
2
⇒ u0k,ℓ (r) ≃ Aeikr + A′ e−ikr ,
+ k u0k,ℓ(r) ≃ 0
dr 2
5
(10.3.14)
Ver, por exemplo, G.B.Arfken e H.J.Webber, Mathematical Methods for Physicists, secção 11.7, Quarta
edição.
320
Teoria da Difusão
e como tal
Φ0k,ℓ,m (~r) ≃
Aeikr + A′ e−ikr m
Yℓ (θ, φ) ,
r
(10.3.15)
ou seja, a parte radial da onda esférica livre é, assimptoticamente, a sobreposição de uma
onda ‘incoming’ com uma onda ‘outgoing’. A diferença de fase destas duas ondas está
contida nos coeficientes A e A′ ; mas para os determinarmos teremos de saber mais do que
a solução assimptótica da equação, pois teremos de usar a condição fronteira (10.3.13).
Para isso vamos calcular as soluções exactas usando um método algébrico.
Começamos por definir o operador
P̂+ = P̂x + iP̂y .
(10.3.16)
As relações de comutação deste operador com os operadores do C.C.O.C são
[Ĥ0 , P̂+ ] = 0 ,
[L̂z , P̂+ ] = ~P̂+ ,
[L̂2 , P̂+ ] = 2~(P̂+ L̂z − P̂z L̂+ ) + 2~2 P̂+ .
(10.3.17)
Exercı́cio: Demonstre estas relações usando as relações de comutação canónicas.
Usando os operadores L̂+ e P̂+ podemos construir novos estados estacionários à custa
de antigos. Em primeiro lugar, recordemos a acção de L̂± nos harmónicos esféricos, dada
por (6.2.35); logo
L̂± |Φ0k,ℓ,mi ∝ |Φ0k,ℓ,m±1i .
(10.3.18)
Isto é L̂± |Φ0k,ℓ,m i é ainda um estado próprio de {Ĥ0 , L̂2 , L̂z } com valores próprios rotulados
por (k, ℓ, m ± 1). Utilizando as relações de comutação (10.3.17) estabelecemos também que
• P̂+ |Φ0k,ℓ,mi é ainda estado próprio de Ĥ0 , com valor próprio rotulado por k. De facto
Ĥ0 P̂+ |Φ0k,ℓ,m i = P̂+ Ĥ0 |Φ0k,ℓ,mi =
~2 k 2
P̂+ |Φ0k,ℓ,mi .
2µ
(10.3.19)
• P̂+ |Φ0k,ℓ,mi é ainda estado próprio de L̂z , com valor próprio rotulado por m + 1. De facto
L̂z P̂+ |Φ0k,ℓ,mi = (P̂+ L̂z + ~P̂+ )|Φ0k,ℓ,mi = (m + 1)~P̂+ |Φ0k,ℓ,mi .
(10.3.20)
10.3 Método das ondas parciais para a difusão por um potencial central
321
• P̂+ |Φ0k,ℓ,mi não é, em geral, estado próprio de L̂2 ; mas se m = ℓ, então P̂+ |Φ0k,ℓ,ℓ i é estado
próprio de L̂2 com valor próprio rotulado por ℓ + 1. De facto
L̂2 P̂+ |Φ0k,ℓ,ℓ i = (P̂+ L̂2 +2~(P̂+ L̂z − P̂z L̂+ )+2~2 P̂+ )|Φ0k,ℓ,ℓ i = (ℓ+1)(ℓ+2)~2P̂+ |Φ0k,ℓ,ℓi .
(10.3.21)
Logo concluimos que
P̂+ |Φ0k,ℓ,ℓ i ∝ |Φ0k,ℓ+1,ℓ+1i .
(10.3.22)
O nosso procedimento vai ser: Primeiro calcular as ondas esféricas livres com ℓ = m = 0
resolvendo a equação (10.3.12) e segundo calcular as restantes usando (10.3.18) e (10.3.22).
• Primeiro, a solução da equação (10.3.12) com ℓ = m = 0 e obedecendo à condição
(10.3.13) é
u0k,0(r)
= ak sin kr
⇒
Φ0k,0,0 (~r)
u0k,0(r) 0 ak sin kr
Y0 = √
.
=
r
4πr
(10.3.23)
As constantes ak podem ser obtidas pela condição de ortonormalização
′
δ(k − k ) =
Z
3
d ~r
∗
Φ0k,0,0
Φ0k′ ,0,0
∗
= (ak ) ak′
Z
+∞
dr sin kr sin k ′ r .
(10.3.24)
0
Escrevendo os senos em termos de exponenciais imaginárias e duplicando o intervalo de
integração temos
(ak )∗ ak′
δ(k − k ) =
4
′
Z
+∞
−∞
(ak )∗ ak′
′
′
ei(k−k )r − ei(k+k )r dr =
2π(δ(k − k ′ ) − δ(k + k ′ )) .
4
(10.3.25)
Como tanto k como k ′ são positivos, o segundo delta de Dirac nunca contribui. Concluimos
p
que ak = 2/π, pelo que podemos escrever as ondas esféricas livres com ℓ = m = 0 como
Φ0k,0,0 (~r)
=
r
2k 2 sin kr 1
√
.
π kr
4π
(10.3.26)
• Segundo, notamos que o operador P̂+ actua, na representação |~xi como
P̂+ = −i~
∂
∂
+i
∂x
∂y
.
(10.3.27)
322
Teoria da Difusão
A sua acção numa função puramente radial é
y d
d
+i
f (r) = −i~ sin θeiφ f (r) .
P̂+ f (r) = −i~
r
r dr
dr
x
Logo, actuando com este operador em (10.3.26) obtemos
cos kr sin kr
sin kr
iφ
0
0
∝ sin θe
−
Φk,1,1 (~r) ∝ P̂+ Φk,0,0 (~r) ∝ P̂+
kr
kr
(kr)2
cos kr sin kr
∝ Y11 (θ, φ)
−
.
kr
(kr)2
(10.3.28)
(10.3.29)
Aplicando L̂− a esta onda esférica livre calculamos Φ0k,1,0 e Φ0k,1,−1, que têm a mesma
dependência radial e dependência angular dada pelos harmónicos esféricos respectivos.
Para calcular as ondas esféricas livres com ℓ > 1, notamos que
[P̂+ , X̂ + iŶ ] = 0 .
(10.3.30)
Logo
x + iy d sin kr
1 d sin kr
Φ0k,2,2 (~r) ∝ P̂+2 Φ0k,0,0 (~r) ∝ P̂+
∝ (x + iy)P̂+
r dr kr
r dr kr
2
sin kr
1 d
.
∝ (x + iy)2
r dr
kr
Em geral
1 d
r dr
ℓ
(10.3.31)
sin kr
,
kr
(10.3.32)
(x + iy)ℓ = r ℓ sinℓ θeiℓφ ∝ r ℓ Yℓℓ (θ, φ) .
(10.3.33)
Φ0k,ℓ,ℓ (~r)
∝ (x + iy)
ℓ
onde notamos que a dependência angular é
Se definirmos
ℓ
jℓ (ρ) ≡ ρ
1 d
−
ρ dρ
ℓ
sin ρ
,
ρ
que são as funções de Bessel esféricas de ordem l,6 podemos escrever
r
2k 2
0
Φk,ℓ,m (~r) =
jℓ (kr)Yℓm (θ, φ) ,
π
6
(10.3.34)
(10.3.35)
A fórmula (10.3.34) designa-se por Fórmula de Rayleigh; veja, por exemplo 10.1.25 de ‘Handbook of
Mathematical Functions’, Ed. M. Abramowitz and I. Stegun, Dover, Ninth Printing.
10.3 Método das ondas parciais para a difusão por um potencial central
1
0.2
0.8
0.15
0.6
0.1
0.4
0.05
0.2
0
0
5
10
15
20
25
323
30
r
-0.05
0
0
5
10
20
15
25
30
r
-0.1
-0.2
Figura 10.8: Parte radial das funções de Bessel esféricas (10.3.34). Esquerda: ℓ = 0 e ℓ = 1
(zero na origem); direita ℓ = 4 e ℓ = 5 (começa a oscilar mais à direita).
onde a constante de normalização é escolhida de modo a verificar
Z
∗
0
0
hΦk,ℓ,m|Φk′ ,ℓ′ ,m′ i = d3~r Φ0k,ℓ,m Φ0k′ ,ℓ′ ,m′ = δ(k − k ′ )δℓℓ′ δmm′ .
(10.3.36)
Estas funções formam uma base do espaço de estados (isto é uma base do espaço de funções
de quadrado somável em R3 ), o que é manifesto na relação de fecho
Z
+∞
0
dk
+∞ X
ℓ
X
|Φ0k,ℓ,m ihΦ0k,ℓ,m| = 1̂ ,
(10.3.37)
Φ0k,ℓ,m (~r)Φ0k,ℓ,m (r~′ ) = δ(~r − r~′ ) .
(10.3.38)
ℓ=0 m=−ℓ
ou, equivalentemente
Z
0
+∞
dk
+∞ X
ℓ
X
ℓ=0 m=−ℓ
Na figura 10.8 encontram-se os gráficos da parte radial das funções de Bessel esféricas para
vários ℓ’s.
10.3.3
Propriedades das ondas esféricas livres
As ondas esféricas livres (10.3.35) têm uma dependência angular totalmente definida pelos
números quânticos ℓ e m, que determinam o correspondente harmónico esférico Yℓm , e
324
Teoria da Difusão
como tal independente da energia. Utiliza-se, por vezes, a notação dos espectroscopistas
mencionada na secção 6.4, no caso das ondas esféricas livres: onda s (ℓ = 0), onda p
(ℓ = 1), etc. Assim dizemos que a onda s esférica livre é sempre isotrópica.
A dependência radial fica clara nas figuras 10.8. Analisemos, analiticamente, os casos
limite:
Perto da origem
Neste caso podemos escrever:
ℓ
ℓ X
+∞
sin ρ
ρ2p
1 d
1 d
ℓ ℓ
ℓ ℓ
(−1)p
= (−1) ρ
jℓ (ρ) ≡ (−1) ρ
ρ dρ
ρ
ρ dρ
(2p + 1)!
p=0
ℓ−1 X
+∞
1 d
2p
= (−1)ℓ ρℓ
(−1)p
ρ2p−2
ρ dρ
(2p
+
1)!
p=0
ℓ ℓ
= (−1) ρ
+∞
X
p=0
(−1)p
(10.3.39)
2p(2p − 2)(2p − 4) . . . [2p − 2(ℓ − 1)] 2p−2ℓ
ρ
.
(2p + 1)!
Os termos com p = 0, 1, . . . , ℓ − 1 são zero na soma. O primeiro termo que contribui, que
é o mais importante perto da origem, é
ρ→0
jℓ (ρ) ≃ (−1)ℓ ρℓ (−1)ℓ
2ℓ(2ℓ − 2)(2ℓ − 4) . . . 2 ℓ
ρℓ
2ℓ(2ℓ − 2)(2ℓ − 4) . . . 2
=
ρ ≡
,
(2ℓ + 1)!
(2ℓ + 1)!
(2ℓ + 1)!!
(10.3.40)
onde definimos
N!! = N(N − 2)(N − 4) . . . .
(10.3.41)
Concluimos pois que todas as funções de Bessel esféricas tendem para zero na origem,
excepto a onda s (ℓ = 0), de acordo com as figuras 10.8.
Consideremos ainda a densidade de probabilidade de uma partı́cula que se encontre no
estado Φ0k,ℓ,m. A probabilidade de encontrar a partı́cula no ângulo sólido dΩ0 em torno da
direcção (θ0 , φ0) e entre r e r + dr é proporcional a
r 2 jℓ2 (kr)|Yℓm (θ0 , φ0 )|2 drdΩ0 .
(10.3.42)
Logo, a função radial de interesse para a densidade de probabilidade é jℓ2 (ρ)ρ2 . Esta
função encontra-se representada na figura 10.9 para vários ℓ’s. Perto da origem esta função
10.3 Método das ondas parciais para a difusão por um potencial central
325
1.4
1
1.2
0.8
1
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
0
5
10
15
20
0
5
rho
10
15
20
rho
Figura 10.9: Representação da função ρ2 jℓ2 (r). Esquerda: ℓ = 0 (é exactamente o sin2 ρ)
e ℓ = 1 (começa a oscilar mais à direita); direita ℓ = 4 e ℓ = 5 (começa a oscilar mais à
direita).
comporta-se como ρ2ℓ+2 /(2ℓ + 1)!!. Logo quanto maior for ℓ mais lento será o crescimento
desta função perto de ρ = 0. A probabilidade de encontrar a partı́cula para r suficientemente pequeno é, assim, negligenciável; estimamos que para
ρ<
p
ℓ(ℓ + 1)
⇔
p
ℓ(ℓ + 1)
|L|
=
,
r<
k
|~p|
(10.3.43)
a probabilidade de encontrar a partı́cula seja praticamente nula. Este valor é qualitativamente justificado pela figura 10.9. Façamos uma analogia clássica para uma justificação
mais quantitativa. Se considerarmos uma partı́cula clássica livre no plano xy, terá equações
do movimento

 x=x +v t
0
x
 y =y +v t
0
y
⇒
D 2 (t) = x2 +y 2 = x20 +y02 +(vx2 +vy2 )t2 +2(x0 vx +y0vy )t , (10.3.44)
onde D 2 (t) é o quadrado da distância à origem. Extremizando esta função calculamos o
parâmetro de impacto, b (distância mı́nima à origem):
2
Dmin
=
(x0 vy − y0 vx )2
vx2 + vy2
⇒
b = |Dmin | =
|L|
,
|~p|
(10.3.45)
326
Teoria da Difusão
que é a versão clássica de (10.3.43). Assim, a partı́cula quântica no estado |Φ0k,ℓ,mi é
praticamente inafectada pelo que acontece dentro de uma esfera com raio
p
ℓ(ℓ + 1)
.
bℓ (k) =
k
Comportamento assimptótico
ℓ
ℓ−1 sin ρ
cos ρ sin ρ
1 d
1 d
ℓ ℓ
ℓ ℓ
= (−1) ρ
− 3
jℓ (ρ) ≡ (−1) ρ
ρ dρ
ρ
ρ dρ
ρ2
ρ
ℓ−1
ρ→∞
1 d
cos ρ
≃ (−1)ℓ ρℓ
.
ρ dρ
ρ2
Aplicando outra derivada, o termo dominante será a derivada do cosseno
ℓ−2
ρ→∞
− sin ρ
1 d
ℓ ℓ
.
jℓ (ρ) ≃ (−1) ρ
ρ dρ
ρ3
(10.3.46)
(10.3.47)
(10.3.48)
Concluimos que, de um modo geral, o termo assimptoticamente dominante virá de aplicar
todas as derivadas à função trigonométrica (e não às potências de ρ)
ℓ
ℓ
ρ→∞
d
(−1)ℓ d
ℓ ℓ 1 1
jℓ (ρ) ≃ (−1) ρ ℓ
sin ρ =
sin ρ .
ρ ρ dρ
ρ
dρ
Notando que podemos escrever
ℓ
d
ℓπ
ℓ
.
sin ρ = (−1) sin ρ −
dρ
2
(10.3.49)
(10.3.50)
Logo,
sin ρ − ℓπ
2
.
(10.3.51)
jℓ (ρ) ≃
ρ
Assim sendo, as ondas esféricas livres (10.3.35) ficam, assimptoticamente,
r
r
ρ→∞
2k 2 sin(kr − ℓπ/2) m
2k 2 m
eikr e−iℓπ/2 − e−ikr eiℓπ/2
0
Φk,ℓ,m ≃
Yℓ (θ, φ) =
Yℓ (θ, φ)
.
π
kr
π
2ikr
(10.3.52)
ρ→∞
Este comportamento assimptótico corresponde à sobreposição de uma onda ‘incoming’
(e−ikr /r) com uma onda ‘outgoing’ (eikr /r), com uma diferença de fase
ℓπ
ℓπ
= πℓ .
− −
∆ϕ = ϕincoming − ϕoutgoing =
2
2
(10.3.53)
Ou seja, as componentes ‘incoming’ e ‘outgoing’ das ondas esféricas livres com ℓ par (ℓ
ı́mpar) estão em fase (oposição de fase). Tal como antecipado no inı́cio desta secção, a
diferença de fase é bem definida e função do número quântico ℓ.
10.3 Método das ondas parciais para a difusão por um potencial central
327
Expansão de uma onda plana em termos de ondas esféricas livres
Estudamos duas ‘bases’ distintas do espaço de funções de quadrado somável em R3 que
são bases próprias de Ĥ0 : ondas planas, |~ki = |kx , ky , kz i, e ondas esféricas livres, |Φ0k,ℓ,mi.
Dado serem bases é possı́vel expandir qualquer ket de uma base em termos dos kets da
outra base.
Consideremos o ket |0, 0, ki, que representa a onda plana eikz ; de facto
h~r|0, 0, ki =
1
eikz .
(2π)3/2
(10.3.54)
Este é um estado próprio de Ĥ0 com momento (~p = ~~k) e energia (E = ~2 k 2 /2µ) bem
definidos. Para além disso, como
eikz = eikr cos θ ,
(10.3.55)
é independente da coordenada φ, na representação |~ri, o ket |0, 0, ki é também um estado
próprio de L̂z (L̂z = −i~∂/∂φ), com valor próprio 0:
L̂z |0, 0, ki = 0 .
(10.3.56)
Usando a relação de fecho (10.3.37), podemos escrever
|0, 0, ki =
Z
0
+∞
dk
′
+∞ X
ℓ
X
ℓ=0 m=−ℓ
|Φ0k′ ,ℓ,mihΦ0k′ ,ℓ,m |0, 0, ki .
(10.3.57)
Para m 6= 0, |0, 0, ki e |Φ0k′ ,ℓ,m i são dois vectores próprios de um operador hermı́tico (L̂z ),
com valores próprios diferentes. Logo são ortogonais. São também 2 vectores próprios
de Ĥ0 - também hermı́tico - com valores próprios diferentes caso k 6= k ′ ; logo ortogonais.
Podemos pois escrever que
hΦ0k′ ,ℓ,m |0, 0, ki ∝ δm0 δ(k − k ′ ) ,
e como tal
|0, 0, ki =
+∞
X
ℓ=0
ck,ℓ |Φ0k,ℓ,0i ,
(10.3.58)
(10.3.59)
328
Teoria da Difusão
ou, na representação |~ri,
+∞
X
eikz
ck,ℓ
=
(2π)3/2
ℓ=0
r
2k 2
jℓ (kr)Yℓ0 (θ) .
π
Os coeficientes ck,ℓ podem ser calculados explicitamente, obtendo-se7
r
2ℓ + 1
ck,ℓ = iℓ
.
4πk 2
(10.3.60)
(10.3.61)
Logo
ikz
e
+∞
X
p
iℓ 4π(2ℓ + 1)jℓ (kr)Yℓ0 (θ) .
=
(10.3.62)
ℓ=0
Note-se que, assimptoticamente, usando (10.3.51), (10.3.52) temos a expressão
ikz
e
10.3.4
r→∞
≃
+∞
X
p
eikr e−iℓπ/2 − e−ikr eiℓπ/2 0
Yℓ (θ) .
iℓ 4π(2ℓ + 1)
2ikr
ℓ=0
(10.3.63)
Ondas parciais num potencial V (r)
Vamos agora introduzir um potencial central arbitrário V (r). O ponto principal é que para
qualquer V (r) com suporte compacto a forma assimptótica das ondas parciais será idêntica
à das ondas esféricas livres, apenas mudando o desfasamento entre a onda ‘incoming’ e a
onda ‘outgoing’.
Consideremos novamente a equação de Schrödinger três dimensional. Para a resolvermos em termos de ondas parciais tomamos um ansatz análogo a (10.3.7) com (10.3.11),
Φk,ℓ,m =
uk,ℓ(r) m
Yℓ (θ, φ) ,
r
onde uk,ℓ (r) é solução da generalização de (10.3.12), isto é
2
d
ℓ(ℓ + 1)
2µV (r)
2
−
+k −
uk,ℓ(r) = 0 ,
dr 2
r2
~2
(10.3.64)
(10.3.65)
com a condição (10.3.13)
uk,ℓ (r = 0) = 0 .
7
Este cálculo será efectuado nas aulas teórico-práticas.
(10.3.66)
10.3 Método das ondas parciais para a difusão por um potencial central
329
Note-se que isto não é mais do que a equação de Schrödinger para um problema em uma
dimensão, onde a partı́cula de massa µ está sob a acção do potencial

2

 V (r) + ℓ(ℓ + 1)~ , r > 0
2µr 2
;
Vef f (r) =


+∞ ,
r<0
(10.3.67)
esta perspectiva um dimensional justifica a utilização da condição fronteira (10.3.66). Assumindo que o potencial é assimptoticamente negligenciável, (10.3.65) fica, assimptoticamente
com solução geral
d2
2
+ k uk,ℓ(r)
dr 2
uk,ℓ (r)
r→∞
≃
r→∞
≃
0,
(10.3.68)
Aeikr + A′ e−ikr .
(10.3.69)
Podemos pensar nesta solução, na perspectiva do potencial efectivo um dimensional: existe
uma onda incidente de r = +∞ (e−ikr ) e uma onda reflectida (eikr ). Como não pode haver
onda transmitida para r < 0 - dado que o potencial é infinito nessa região - a corrente
reflectida tem que ser igual à transmitida, pelo que concluimos que
|A| = |A′ | ⇒ uk,ℓ (r)
r→∞
≃
|A| eikr eϕr + e−ikr eϕi ⇔ uk,ℓ(r)
r→∞
≃
C sin(kr + βℓ ) .
(10.3.70)
A fase βℓ vai ser determinada pela condição fronteira na origem (10.3.66). No caso das
ondas esféricas livres (V (r) = 0), vimos em (10.3.51) que βℓ = −ℓπ/2; tomando este valor
como referência escrevemos
uk,ℓ (r)
r→∞
≃
ℓπ
C sin kr −
+ δℓ ,
2
(10.3.71)
onde δℓ , que em geral será função da energia e como tal de k, é a diferença de fase adicional
ou desfasamento para as ondas parciais.
Concluimos que as ondas parciais terão a forma assimptótica
ℓπ
r→∞ C sin kr − 2 + δℓ
Φk,ℓ,m (~r) ≃
Yℓm (θ, φ)
r
eikr e−i(ℓπ/2−δℓ ) − e−ikr ei(ℓπ/2−δℓ )
,
= CYℓm (θ, φ)
2ir
(10.3.72)
330
Teoria da Difusão
e vemos que as ondas parciais são ainda a sobreposição de uma onda “incoming” com uma
onda “outgoing” com uma diferença de fase
∆ϕ = ϕincoming − ϕoutgoing = ℓπ − 2δℓ .
(10.3.73)
Portanto, o potencial originou a diferença de fase adicional −2δℓ relativamente ao que
aconteceria na ausência de potencial. Este factor traduz o efeito total do potencial numa
partı́cula com momento angular ℓ.
É conveniente definir uma nova função de onda Φ̃k,ℓ,m (~r) proporcional, assimptoticamente, a (10.3.72), do seguinte modo:
• Φ̃k,ℓ,m(~r) = eiδℓ Φk,ℓ,m (~r); esta redefinição por uma fase global é irrelevante fisicamente e
é conveniente porque fazendo-o podemos pensar no processo de difusão, na presença
do potencial, da seguinte maneira: a onda incidente de r = +∞ é a mesma do
que aquela considerada na ausência de potencial, mas a onda reflectida tem a fase
adicional 2δℓ .
• Tomamos a constante C = 1/k em (10.3.72). Esta escolha nada tem de fı́sico. É apenas
uma questão de conveniência como veremos em baixo. Logo
Φ̃k,ℓ,m (~r)
r→∞
∼
−Yℓm (θ, φ)
e−ikr eiℓπ/2 − eikr e−iℓπ/2 e2iδℓ
.
2ikr
(10.3.74)
Recordemos que as ondas esféricas livres Φ0k,ℓ,m praticamente não penetram na região
p
com r < ℓ(ℓ + 1)/k, como visto na secção anterior. Se considerarmos um potencial
com alcance finito - digamos r0 - tal que V (r) = 0 para r > r0 , necessitamos apenas de
considerar a diferença de fase adicional δℓ para ℓ < ℓM , onde
p
ℓM (ℓM + 1) ≃ r0 k .
(10.3.75)
Isto é, para potenciais com alcance finito, existe, para cada energia, um ℓ máximo e
as únicas diferenças de fase adicionais que necessitamos de calcular acontecerão para as
primeiras ondas parciais (s, p, . . .).
10.3 Método das ondas parciais para a difusão por um potencial central
331
Secção eficaz diferencial de difusão em termos de δℓ
Como toda a informação sobre o potencial V (r) fica contida, assimptoticamente, em δℓ ,
deveremos ser capazes de calcular σ(θ, φ) em termos de δℓ . Para isso escrevemos os estados
estacionários de difusão em termos das ondas parciais. Tendo em conta as simetrias do
problema (onda incidente segundo Oz e potencial central), as únicas ondas parciais que
respeitam esta simetria são Φk,ℓ,0 (~r). Logo
vkdif (~r)
=
+∞
X
cℓ Φ̃k,ℓ,0(~r) .
(10.3.76)
ℓ=0
Para estes serem estados estacionários de difusão, têm que ter o comportamento assimptótico correcto. Isso é verificado se escolhermos os coeficientes cℓ apropriadamente:
Lema: A forma de cℓ para (10.3.76) ser um estado estacionário de difusão é8
cℓ = iℓ
p
4π(2ℓ + 1) .
(10.3.77)
Demonstração: Introduzindo (10.3.77) em (10.3.76) temos
vkdif (~r)
+∞
X
p
iℓ 4π(2ℓ + 1)Φ̃k,ℓ,0 (~r) ;
=
(10.3.78)
ℓ=0
usando a forma assimptótica (10.3.74),
r→∞
vkdif (~r) ≃
+∞
X
p
e−ikr eiℓπ/2 − eikr e−iℓπ/2 e2iδℓ
0
ℓ
,
−
i 4π(2ℓ + 1)Yℓ (θ)
2irk
ℓ=0
(10.3.79)
ou ainda, escrevendo
e2iδℓ = 1 + 2ieiδℓ sin δℓ ,
(10.3.80)
temos
r→∞
vkdif (~r) ≃
8
−ikr iℓπ/2
+∞
X
p
e
e
− eikr e−iℓπ/2 e−iℓπ/2 eiδℓ sin δℓ eikr
0
ℓ
i 4π(2ℓ + 1)Yℓ (θ)
−
.
−
2irk
k
r
ℓ=0
(10.3.81)
Para obter (10.3.74) usamos C = 1/k em (10.3.72); caso tivessemos usado outro valor alteraria a forma
de (10.3.77), mas o resultado final (10.3.83) seria inalterado.
332
Teoria da Difusão
Comparando com (10.3.63) concluimos que o primeiro termo é a forma assimptótica de
eikz ; logo
r→∞
vkdif (~r) ≃
ikz
e
+∞
X
p
e−iℓπ/2 eiδℓ sin δℓ eikr
iℓ 4π(2ℓ + 1)Yℓ0 (θ)
.
+
k
r
ℓ=0
(10.3.82)
Esta é, de facto a forma assimptótica correcta para um estado estacionário de difusão,
(10.1.13). Concluimos ainda que a expressão para a amplitude de difusão em termos das
diferenças de fase adicionais, δℓ , toma a forma
+∞
fk (θ) =
1 Xp
4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) ,
k ℓ=0
(10.3.83)
onde usamos que e−iℓπ/2 = (−i)ℓ . (q.e.d.)
A secção eficaz diferencial de difusão é, portanto,
+∞
1 Xp
σ(θ) = |fk (θ)| =
4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ)
k
2
2
.
(10.3.84)
ℓ=0
Note-se, em particular, que a contribuição da onda s para a secção eficaz diferencial de
difusão é independente de θ e toma a forma
σ onda s =
sin2 δ0
.
k2
(10.3.85)
A secção eficaz total de difusão é simples de calcular usando a ortonormalização dos
harmónicos esféricos, com resultado
σ=
Z
dΩσ(θ) =
+∞
4π X
(2ℓ + 1) sin2 δℓ .
k2
(10.3.86)
ℓ=0
Em particular, a contribuição da onda s para a secção eficaz total é
onda s
σparcial
= 4π
sin2 δ0
;
k2
(10.3.87)
as contribuições de ondas especı́ficas para a secção eficaz total, são denominadas secções
eficazes de difusão parciais.
Comentários:
10.3 Método das ondas parciais para a difusão por um potencial central
333
• Não há contribuições provenientes de interferências entre diferentes ℓ’s para σ;
• Cada ℓ pode dar uma contribuição máxima de 4π(2ℓ + 1)/k 2 para σ;
• Para calcular σ será em princı́pio necessário saber δℓ para todos os ℓ. Há duas situações
possı́veis:
i) Se V (r) é conhecido isto implica resolver a equação radial para cada ℓ. Frequentemente isto tem de ser feito numericamente. Na prática o método das ondas
parciais só é atractivo se δℓ tiver que ser calculado apenas para um número suficientemente pequeno de ℓ’s. Este será o caso para potenciais de alcance finito L,
discutido anteriormente, se considerarmos a difusão de modos de baixa energia:
k≪
1
.
L
(10.3.88)
Para estes modos, apenas os desfasamentos com ℓ mais baixo terão de ser calculados. Em particular para energias suficientemente baixas, apenas a onda s
deverá ser considerada, pelo que a secção eficaz de difusão será bem aproximada
por (10.3.85);
ii) Se V (r) for desconhecido, tentaremos reproduzir a curva experimental usando
um pequeno número de δℓ ’s, isto é, usando apenas ℓ = 1, 2, . . . , ℓmáximo . A
dependência em θ irá sugerir que ℓ’s necessitamos de considerar. Por exemplo,
se σ for independente de θ, só necessitamos de considerar ℓ = 0 - dado que
Y00 é independente de θ. Pelo mesmo raciocı́nio se σ for dependente de θ,
necessitamos de considerar ℓ’s diferentes de zero. Depois de estabelecermos
quais os ℓ’s necessários para reproduzir os resultados experimentais, procuramos
potenciais que reproduzam os δℓ necessários.
Exemplo: Poço de potencial esférico
Como exemplo de aplicação do método das ondas parciais consideramos o poço de potencial
esférico (10.2.40), já considerado na aproximação de Born. No método das ondas parciais
334
Teoria da Difusão
temos de calcular os desfasamentos δℓ para todos os ℓ. Para isso temos de resolver a equação
(10.3.65) para o potencial (10.2.40), com a condição fronteira (10.3.66); isto é resolver
2
ℓ(ℓ + 1)
2µV0
d
2
−
+ k + 2 uk,ℓ (r) = 0 , r < R
dr 2
r2
~
2
.
(10.3.89)
ℓ(ℓ + 1)
d
2
−
+ k uk,ℓ(r) = 0 , r > R
dr 2
r2
Se kR ≪ 1, apenas a onda s (ℓ = 0) é relevante e neste caso as equações são particularmente
simples de resolver. De facto, o problema reduz-se a resolver a equação de Schrödinger um
dimensional num potencial contı́nuo por pedaços (capı́tulo 3). As soluções para uk,0(r) são:

′
′

 Aeik r + A′ e−ik r , r < R
uk,0(r) =
(10.3.90)

 A eikr + A′ e−ikr , r > R ,
1
1
onde
p
2µ(V0 + E)
.
k =
~
Impondo a condição fronteira (10.3.66) (que corresponde à continuidade da função de onda
′
na descontinuidade infinita do potencial em r = 0) e a continuidade da função de onda
uk,0(r) e da sua derivada em r = R, obtemos
′
′
k
k
′
−ikR
′
′
′
ikR
′
′
A = −A , A1 = e
− cos k R + i sin k R A .
cos k R + i sin k R A , A1 = e
k
k
(10.3.91)
Concluimos que a função de onda tem a forma



2iA sin k ′ r , r < R

′
uk,0(r) =
k

′
′

cos k R sin k(r − R) + sin k R cos k(r − R) , r > R .
 2iA
k
(10.3.92)
Para lermos o desfasamento, escrevemos a parte assimptótica da solução (r > R) na forma
(10.3.71), com ℓ = 0, isto é
uk,0(r) = 2Ai sin(kr + δ0 ) ,
r>R.
(10.3.93)
Expandindo este seno como o seno de uma soma (escrevendo sin[(kr − kR) + (δ0 + kR)])
e igualando a (10.3.92) obtemos
δ0 = arctan
k
′
tan k R − kR .
k′
(10.3.94)
10.3 Método das ondas parciais para a difusão por um potencial central
Usando (10.3.87) obtemos para a secção eficaz parcial de difusão
2
k
4π
′
onda s
tan k R − kR
.
σparcial = 2 sin arctan
k
k′
335
(10.3.95)
A secção eficaz parcial será uma boa aproximação à secção eficaz total no limite de baixas
energias, kR ≪ 1 (note-se que esta é a condição (10.2.44). Neste limite podemos aproximar
(desde que k ′ R 6= nπ/2)
arctan
kR
tan k ′ R
k′R
≃
kR
tan k ′ R .
k′R
Se a energia da partı́cula difundida for baixa, não só relativamente ao alcance do potencial,
mas também relativamente à sua magnitude E ≪ V0 , podemos aproximar
√
2µV0
′
k ≃ k0 =
.
~
Logo
δ0 ≃ kR
tan k0 R
−1
k0 R
,
e
onda s
σparcial
≃ 4πR
2
tan k0 R
−1
k0 R
2
.
(10.3.96)
Para compararamos com o resultado obtido na aproximação de Born, temos de considerar
a aproximação que está sempre presente na aproximação de Born, isto é, que o potencial
é fraco. Neste caso, k0 R ≪ 1 (note-se que esta é a condição (10.2.41)). Usando tan x ≃
x + x3 /3, para x ≪ 1 obtemos
onda s
σparcial
≃ 4πR2
16π µ2 V02 R6
(k0 R)4
=
,
9
9
~4
(10.3.97)
em concordância com o resultado (10.2.46) obtido na aproximação de Born.
Alguns comentários:
• Na aproximação de Born, o potencial é considerado suficientemente fraco. Para além
disso podemos, ou não, considerar uma aproximação de baixas energias. Por contraste, no método das ondas parciais, ao aproximarmos a secção eficaz total de difusão
pela secção eficaz parcial da onda s estamos a assumir uma aproximação de baixas
336
Teoria da Difusão
energias. Para além disso podemos, ou não, considerar uma aproximação de potencial fraco. Claro que só obtemos um acordo entre os dois métodos se considerarmos
ambas as aproximações nos dois casos.
• Por (10.3.96) vemos que, a secção eficaz aumenta com a profundidade do poço V0 e
diverge para tan k0 R = π/2. Esta é a profundidade para a qual o poço admite o
primeiro estado ligado (Problema 4, Folha de Problemas 4, Mecânica Quântica I). Se
continuarmos a aumentar a profundidade do poço a secção eficaz diminui até zero,
valor que é obtido para tan k0 R = k0 R. Aumentando a profundidade do poço a secção
eficaz oscila entre 0 e ∞, divergindo sempre que a profundidade do poço permite um
novo estado ligado.
10.4
Difusão Inelástica
Até agora lidamos neste capı́tulo unicamente com difusão elástica. Porém, existem fenómenos
onde parte da energia do feixe incidente é absorvida, no estado final, pelos graus de liberdade internos das diferentes partı́culas iniciais ou das partı́culas alvo. Se estamos essencialmente interessados na parte da difusão elástica, descrevemos esta absorção globalmente, i.e.
sem entrar nos detalhes das reacções de absorção. O método das ondas parciais fornece-nos
o enquadramento adequado para uma descrição fenomenológica da absorção. Comecemos
por discutir, conceptualmente, a modificação do método de modo a incluir o fenómeno de
absorção.
O método das ondas parciais é usado para potenciais centrais. Por isso vamos assumir que as interacções que conduzem à absorção são também invariantes por rotação. O
método baseia-se no cálculo de desfasamentos entre as ondas ‘incoming’ e ‘outgoing’, do
tipo e2iδℓ , de acordo com (10.3.74). Como o módulo deste factor é 1, as amplitudes das
ondas ‘incoming’ e ‘outgoing’ são iguais, pelo que a corrente de probabilidade que entra
é igual à que sai. Isto sugere que, se permitirmos que o desfasamento tenha uma parte
imaginária, de modo a que
|e2iδℓ | < 1 ,
(10.4.1)
10.4 Difusão Inelástica
337
teremos uma corrente de probabilidade a sair menor do que aquela que entrou, para a
onda parcial ℓ. Este facto manifesta o desaparecimento de algumas partı́culas e como tal
um fenómeno de absorção. Com este princı́pio iremos deduzir expressões para as secções
eficazes de difusão e absorção.
Note que a descrição que aqui é dada é fenomenológica; esconde uma realidade de
processos complexos que levam às absorções aqui descritas.
10.4.1
Secções eficazes de difusão elástica e de absorção
Denotemos
e2iδℓ ≡ ηℓ .
(10.4.2)
Impomos que |ηℓ | ≤ 1, de modo a descrever difusão elástica (se |ηℓ | = 1) ou difusão com
absorção (se |ηℓ | < 1). Reescrevemos (10.3.79) como
vkdif (~r)
r→∞
≃
+∞
X
p
eikr e−iℓπ/2 (ηℓ − 1) + eikr e−iℓπ/2 − e−ikr eiℓπ/2
iℓ 4π(2ℓ + 1)Yℓ0 (θ)
,
2irk
ℓ=0
(10.4.3)
ou, usando (10.3.63)
r→∞
vkdif (~r) ≃
ikz
e
+
+∞
X
p
4π(2ℓ + 1)Yℓ0 (θ)
ℓ=0
(ηℓ − 1) eikr
,
2ik
r
(10.4.4)
de onde lemos que a amplitude de difusão é
+∞
ηℓ − 1
1 Xp
4π(2ℓ + 1)Yℓ0 (θ)
fk (θ) =
.
k ℓ=0
2i
(10.4.5)
Logo, a secção eficaz diferencial de difusão, que agora denominamos secção eficaz de difusão
elástica e denotamos σel é
+∞
ηℓ − 1
1 Xp
4π(2ℓ + 1)Yℓ0 (θ)
σel (θ) = 2
k
2i
2
.
(10.4.6)
ℓ=0
Consequentemente, a secção eficaz total de difusão elástica é
σel =
Z
+∞
π X
σel (θ)dΩ = 2
(2ℓ + 1)|ηℓ − 1|2 .
k ℓ=0
(10.4.7)
338
Teoria da Difusão
Note que a absorção será máxima se ηℓ = 0. Mas mesmo nesse caso a onda ℓ contribui
para a secção de difusão elástica! Ou seja, mesmo uma região de interacção que seja um
absorvedor perfeito produz difusão elástica. Este é um fenómeno puramente quântico,
denominado de difusão por sombras.
Analogamente ao que foi feito na secção (10.1.1) para a secção eficaz diferencial de
difusão, definimos a secção eficaz de absorção, σabs , como sendo a razão entre o número de
partı́culas absorvidas por unidade de tempo dnabs e o fluxo incidente Fi :
dnabs = σabs Fi .
(10.4.8)
Para calcular esta secção eficaz é suficiente calcular a probabilidade total, ∆P, que desa~
parece por unidade de tempo. Esta probabilidade é, por sua vez, obtida da corrente J,
associada com a função de onda (10.4.3): ∆P é a diferença entre o fluxo de ondas que
entram e o das ondas que saem numa esfera de raio elevado R0 ; ou seja é menos o fluxo
total através dessa esfera:
∆P = −
Z
S2
~=−
J~ · dS
Z
Jr r 2 dΩ ,
(10.4.9)
r=R0
pois apenas a componente radial Jr contribui. Usando (10.1.16), temos
Jr = Re
(vkdif )∗ (~r)
~ ∂ dif
v (~r)
iµ ∂r k
.
(10.4.10)
Como a derivada radial não altera a dependência angular e usando a ortogonalidade dos
harmónicos esféricos obtemos
∆P = −
+∞ Z
X
ℓ
r=R0
Jr(ℓ) r 2 dΩ ,
(10.4.11)
onde
Jr(ℓ)
e como tal
r→+∞
≃
−
~k (2ℓ + 1)π
(1 − |ηℓ |2 )|Yℓ0 (θ)|2 ,
µ
k2r2
+∞
~k π X
∆P =
(2ℓ + 1)(1 − |ηℓ |2 ) .
µ k2 ℓ
(10.4.12)
(10.4.13)
10.4 Difusão Inelástica
339
A secção eficaz de absorção é a probabilidade ∆P a dividir pela corrente incidente ~k/µ,
σabs
+∞
π X
(2ℓ + 1)(1 − |ηℓ |2 ) .
= 2
k ℓ
(10.4.14)
Note-se que σabs = 0 se todos os |ηℓ | = 1 como seria de esperar quando todos os desfasamentos forem puramente reais. Pelo contrário, se |ηℓ | = 0 a contribuição da onda ℓ para
σabs é máxima.
10.4.2
Secção eficaz total e o teorema óptico
A secção eficaz total é definida como a soma de todas as secções eficazes (integradas
sobre todo o espaço caso sejam secções eficazes diferenciais). Corresponde ao número de
partı́culas que, por unidade de tempo, participam numa das reacções possı́veis (i.e são
difundidas ou absorvidas), dividido pelo fluxo incidente. Logo
σtotal = σel + σabs ,
(10.4.15)
ou usando (10.4.7) e (10.4.14),
σtotal
+∞
+∞
π X
π X
2
2
= 2
(2ℓ + 1) 1 − |ηℓ | + |ηℓ − 1| = 2
(2ℓ + 1) [1 − Re ηℓ ] .
k ℓ
k ℓ
(10.4.16)
Usando (10.4.5) e ainda o facto que os harmónicos esféricos envolvidos são, para ângulo
polar igual a zero:
Yℓ0 (θ
obtemos
= 0) =
r
2ℓ + 1
,
4π
+∞
1 X
Im fk (θ = 0) =
(2ℓ + 1)Re (1 − ηℓ ) ,
2k
(10.4.17)
(10.4.18)
ℓ
ou, comparando com (10.4.16)
σtotal =
4π
Im fk (θ = 0) .
k
(10.4.19)
Este resultado é designado por Teorema óptico. É uma relação entre a secção eficaz total
e a parte imaginária da amplitude de difusão elástica na direcção frontal (θ = 0). Note-se
340
Teoria da Difusão
que no caso em que não há absorção σtotal = σel e o teorema reduz-se a uma relação entre
a amplitude de difusão na direcção frontal e a secção eficaz total de difusão. Que uma
tal relação exista é bastante natural. Para o compreender recordemos a forma dos estados
estacionários de difusão (10.1.13)
~
r →∞
vkdif (~r) −→ eikr cos θ + fk (θ, φ)
eikr
;
r
(10.4.20)
A onda transmitida na direcção frontal é
~
r →∞
vkdif (r, θ = 0, φ) −→ eikr + fk (θ = 0, φ)
eikr
;
r
(10.4.21)
que não é mais do que uma sobreposição entre a onda incidente eikr e a onda difundida na
direcção frontal fk (θ = 0, φ)eikr /r. A última é determinada pela amplitude de difusão na
direcção frontal. A onda transmitida é atenuada (relativamente à onda incidente), devido
às partı́culas difundidas em todas as direcções do espaço. Logo a sobreposição entre a
onda difundida na direcção frontal e a onda incidente tem de ter a informação sobre as
partı́culas difundidas em todas as outras direcções. Logo é natural que exista uma relação
entre fk (θ = 0, φ) e σtotal .
10.5
Sumário
Neste capı́tulo estudamos reacções de difusão. As quantidades fundamentais do formalismo
são a amplitude de difusão, fk (θ, φ), e as secções eficazes (diferencial e total) de difusão
σ(θ, φ) e σ. Todo o formalismo pode ser discutido em termos dos estados estacionários
de difusão (quando o potencial é indepentente do tempo, que é o caso aqui considerado),
que são as funções de onda do problema com o comportamento assimptótico correcto. Por
considerações genéricas obtivemos a relação (10.1.24):
σ(θ, φ) = |fk (θ, φ)|2 .
Esta equação traduz a relação entre a quantidade directamente relacionável com a experiência σ(θ, φ) e a quantidade derivável da teoria, fk (θ, φ). Estudamos seguidamente
dois métodos teóricos para calcular a amplitude de difusão.
10.5 Sumário
341
No primeiro método - método de Born - começamos por estabelecer a equação integral
de difusão para obter os estados estacionários de difusão. Estabelecemos a expansão de
Born e a aproximação de Born que nos permitiu obter uma fórmula aproximada, utilizável,
para calcular a amplitude de difusão (e como tal a secção eficaz de difusão) para um
determinado potencial (10.2.27):
fkBorn (θ, φ)
µ
=−
2π~2
Z
d3~re−i~q·~r V (~r) ,
q ≡ 2k sin
θ
.
2
A fórmula é válida para potenciais fracos de acordo com o critério (10.2.24). Como exemplo
calculamos a secção eficaz de difusão para um poço de potencial esférico e para o potencial
de Yukawa. Para este último caso recuperamos, no limite de alcance infinito, a fórmula de
Rutherford.
No segundo método - método das ondas parciais -, válido apenas para potenciais com
simetria esférica, começamos por estudar em detalhe as ondas esféricas livres e estabelecemos que as ondas parciais num potencial central arbitrário diferem, assimptoticamente, das
ondas esféricas livres apenas por um desfasamento. Obtivemos uma expressão exacta para
a amplitude de difusão (10.3.83) em termos destes desfasamentos, causadas pelo potencial
difusor:
+∞
fk (θ) =
1 Xp
4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) .
k ℓ=0
Embora a fórmula seja exacta, para ser utilizável temos que assumir uma aproximação de
baixas energias (10.3.88), de modo a que seja apenas necessario saber os desfasamentos das
ondas com ℓ mais baixo. Como aplicação do método consideramos novamente um poço de
potencial esférico e recuperamos, no limite de baixas energias e potencial fraco o resultado
da aproximação de Born.
Finalmente consideramos brevemente a difusão inelástica. Definimos a secção eficaz de
absorção, obtivemos uma expressão para o seu cálculo e derivamos o teorema óptico.
CAPÍTULO
11
Métodos perturbativos independentes e dependentes
do tempo
Na secção 9.2 discutimos qualitativamente que, para descrever a estrutura fina do espectro
do átomo de hidrogénio, é necessário levar em consideração várias correcções ao Hamiltoniano do problema de Coulomb, estudado no capı́tulo 6. Considerando tais correcções, o
problema do átomo de hidrogénio deixa de ser exactamente solúvel e portanto é necessário
considerarmos métodos de resolução aproximada. Sendo que tais correcções são pequenas
é natural considerarmos um método perturbativo.
Neste capı́tulo consideramos sistemas fı́sicos cujo Hamiltoniano pode ser visto como
uma soma de dois termos. Um primeiro termo pode ser considerado exactamente, isto é,
o seu espectro e funções próprias podem ser calculados analiticamente. O segundo termo
não é, genericamente, diagonalizado pelas funções próprias do primeiro termo, e o como tal
o Hamiltoniano total não pode ser resolvido exactamente. No entanto, o segundo termo
pode ser considerado muito menor do que o primeiro e como tal o Hamiltoniano total pode
ser resolvido através de uma expansão perturbativa, que poderá ser truncada na ordem
desejada obtendo-se o espectro e funções próprias do Hamiltoniano total com uma precisão
que será tanto maior quanto maior for a ordem considerada.
Começamos por considerar o cálculo de estados estacionários de sistemas descritos por
344
Métodos perturbativos independentes e dependentes do tempo
Hamiltonianos independentes do tempo. Seguidamente estudaremos Hamiltonianos cujas
perturbações são dependentes do tempo.
11.1
Teoria das perturbações estacionárias
Consideramos o Hamiltoniano
Ĥ = Ĥ0 + Ŵ ,
(11.1.1)
onde Ĥ0 é o Hamiltoniano não perturbado e Ŵ é o Hamiltoniano da perturbação. O facto
de Ŵ ser uma perturbação significa que a sua contribuição para os valores próprios e os
vectores próprios de Ĥ é muito menor do que a contribuição de Ĥ0 ; esquematicamente
escrevemos
|Ŵ | ≪ |Ĥ0 | ,
(11.1.2)
mas o sentido preciso deste critério será esclarecido posteriormente. Para tornar explı́cita
a análise perturbativa, escrevemos Ŵ ≡ λV̂ , onde λ ≪ 1.
Assumimos que conhecemos a forma exacta dos valores próprios e estados próprios de
Ĥ0 , sendo o seu espectro {Ep0 } discreto:
Ĥ0 |φip i = Ep0 |φip i ,
(11.1.3)
onde i = 1, . . . , dp é um ı́ndice no sub-espaço degenerado das energias, e {|φip i} constitui
uma base ortonormalizada de estados próprios
′
hφip |φip′ i
ii′
= δ δpp′ ,
dp
XX
p
i=1
|φip ihφip | = 1̂ .
(11.1.4)
Com este formalismo, podemos calcular soluções aproximadas da equação de valores
próprios
Ĥ(λ)|Ψ(λ)i = E(λ)|Ψ(λ)i ,
(11.1.5)
onde Ĥ = Ĥ0 + λV̂ , usando uma expansão perturbativa em λ. Para este fim, assumimos
que tanto o valor próprio E(λ), como o vector próprio, |Ψ(λ)i, admitem uma expansão em
11.1 Teoria das perturbações estacionárias
345
potências de λ, da forma, respectivamente,
2
E(λ) = ǫ0 + λǫ1 + λ ǫ2 + . . . =
+∞
X
λn ǫn ,
(11.1.6)
n=0
2
|Ψ(λ)i = |0i + λ|1i + λ |2i + . . . =
Substituindo estas expansões em (11.1.5) obtemos
!
!
+∞
+∞
X
X
(Ĥ0 + λV̂ )
λn |ni =
λn ǫn
n=0
+∞
X
n=0
n=0
λn |ni .
+∞
X
m=0
λm |mi
(11.1.7)
!
.
(11.1.8)
Igualando as potências de λ obtemos um conjunto infinito de equações:
• Ordem 0 :
Ĥ0 |0i = ǫ0 |0i .
(11.1.9)
Este ordem corresponde ao sistema sem perturbação.
• Ordem 1 :
• Ordem 2 :
Ĥ0 − ǫ0 |1i + V̂ − ǫ1 |0i = 0 ;
(11.1.10)
Ĥ0 − ǫ0 |2i + V̂ − ǫ1 |1i − ǫ2 |0i = 0 ;
(11.1.11)
• Ordem n:
Ĥ0 − ǫ0 |ni + V̂ − ǫ1 |n − 1i − ǫ2 |n − 2i − . . . − ǫn |0i = 0 .
(11.1.12)
No que se segue estudaremos as correcção ao espectro e funções próprias até segunda ordem
em λ.
Para determinarmos a função de onda numa dada ordem em λ, recordamos que a
equação de valores próprios (11.1.5) determina a função de onda a menos de uma constante.
Esta constante pode ser escolhida de modo a que:
i) a função de onda esteja normalizada, hΨ(λ)|Ψ(λ)i = 1;
346
Métodos perturbativos independentes e dependentes do tempo
ii) como fica ainda a liberdade residual de escolher a fase da função de onda, tomamos
esta fase de modo a que h0|Ψ(λ)i seja real em qualquer ordem da expansão em λ.
Com estas duas condições temos:
• Ordem 0 : Dado que nesta ordem |Ψ(λ)i = |0i as duas condições traduzem-se em h0|0i =
1; isto é, o estado |0i está normalizado;
• Ordem 1 : Nesta ordem |Ψ(λ)i = |0i + λ|1i; a normalização da função de onda, nesta
ordem, significa
1 = (h0| + λh1|) (|0i + λ|1i) = h0|0i + λ (h0|1i + h1|0i) + O(λ2 ) ;
(11.1.13)
usando o resultado de ordem zero, obtemos
h0|1i = −h0|1i∗ ,
ou seja, h0|1i é um imaginário puro. Por outro lado, a condição ii) implica que
h0|Ψ(λ)i = h0|0i + λh0|1i = 1 + λh0|1i
seja real, ou seja h0|1i tem de ser real. Logo
h0|1i = h1|0i = 0 .
(11.1.14)
• Ordem 2 : Por um raciocı́nio análogo conclui-se que
1
h0|2i = h2|0i = − h1|1i .
2
(11.1.15)
• Ordem n: Analogamente conclui-se que
1
h0|ni = hn|0i = − [hn − 1|1i + hn − 2|2i + . . . + h2|n − 2i + h1|n − 1i] . (11.1.16)
2
Para considerarmos em detalhe o efeito da perturabação Ŵ no espectro e vectores
próprios de Ĥ0 consideremos separadamente os nı́veis de Ĥ0 degenerado e não degenerados.
11.1 Teoria das perturbações estacionárias
11.1.1
347
Perturbação de um nı́vel não degenerado
Consideramos um nı́vel não degenerado de Ĥ0 , com valor próprio En0 e vector próprio associado |φn i. Vamos calcular o valor próprio de Ĥ, En (λ), e a funcão própria correspondente,
|Ψn (λ)i, até segunda ordem em λ; ou seja, vamos calcular ǫ0 , ǫ1 , ǫ2 e |0i, |1i, |2i.
Ordem 0
Em ordem 0, En (λ) = ǫ0 e |Ψn (λ)i = |0i, isto é, ignoramos a perturbação. A energia e
estado correspondem aos de Ĥ0
ǫ0 = En0 ,
|0i = |φn i .
(11.1.17)
Ordem 1
Em ordem 1, En (λ) = ǫ0 + λǫ1 e |Ψn (λ)i = |0i + λ|1i. Para calcular ǫ1 projectamos a
equação (11.1.10) em hφn | = h0|:
hφn | Ĥ0 − ǫ0 |1i + hφn | V̂ − ǫ1 |0i = 0 ;
dado que Ĥ0 |φn i = ǫ0 |φn i, o primeiro termo é zero; como |0i = |φn i está normalizado
concluimos que
ǫ1 = hφn |V̂ |φn i .
(11.1.18)
En (λ) = En0 + hφn |Ŵ |φn i + O(λ2 ) .
(11.1.19)
Logo, em primeira ordem
A correcção de primeira ordem à energia de um nı́vel não degenerado |φn i é dada pelo
valor esperado da perturbação nesse mesmo estado não perturbado |φn i.
Para calcularmos o estado em primeira ordem em λ projectamos (11.1.10) em todos os
outros estados próprios de Ĥ0 (que não |φn i), {|φip i}. Note-se que os outros nı́veis p 6= n
podem ser degenerados, pelo que mantemos o ı́ndice i. Obtemos
hφip | Ĥ0 − ǫ0 |1i + hφip | V̂ − ǫ1 |0i = 0 ;
348
Métodos perturbativos independentes e dependentes do tempo
Como |φn i e |φip i para n 6= p são estados próprios associados a valores próprios distintos,
hφip |φn i = 0; usando ainda que Ĥ0 |φip i = Ep0 |φip i obtemos
hφip |V̂ |φn i
,
En0 − Ep0
hφip |1i =
p 6= n .
(11.1.20)
Como hφn |1i = 0, por (11.1.14) temos todos os coeficientes da projecção de |1i na base de
funções próprias de Ĥ0 . Logo
|1i =
dp
XX
p
i=1
|φip ihφip |1i
=
dp
XX
hφip |V̂ |φn i
p6=n i=1
En0 − Ep0
|φip i .
(11.1.21)
Consequentemente, em primeira ordem em λ, o estado próprio de Ĥ é
|Ψn (λ)i = |φn i +
dp
XX
hφip |Ŵ |φn i
p6=n i=1
En0 − Ep0
|φip i + O(λ2 ) .
(11.1.22)
A correcção de primeira ordem ao estado próprio |φn i de Ĥ0 é uma mistura de todos os
outros estados próprios de Ĥ0 , {|φip i}. A contribuição de um determinado estado |φip i
para esta mistura é tanto maior quanto: i) maior for o elemento de matriz da perturbação
entre este estado e o estado não perturbado; ii) mais próxima da energia do estado não
perturbado for a energia deste estado.
Podemos agora precisar o critério (11.1.2) relativo à validade do método perturbativo:
1) Por (11.1.19) requeremos que os elementos diagonais da perturbação sejam muito
menores que os elementos diagonais de Ĥ0 correspondentes
|hφn |Ŵ |φn i| ≪ |En0 | ;
(11.1.23)
2) Por (11.1.22) requeremos que os elementos não diagonais da perturbação sejam muito
menores que as diferenças entre os valores próprios de Ĥ0 correspondentes aos estados
em questão
|hφip|Ŵ |φn i| ≪ |En0 − Ep0 | .
(11.1.24)
11.1 Teoria das perturbações estacionárias
349
Ordem 2
Em ordem 2, En (λ) = ǫ0 + λǫ1 + λ2 ǫ2 e |Ψn (λ)i = |0i + λ|1i + λ2 |2i. Para calcular ǫ2
projectamos a equação (11.1.11) em hφn | = h0|:
hφn | Ĥ0 − ǫ0 |2i + hφn | V̂ − ǫ1 |1i − ǫ2 hφn |0i = 0 .
(11.1.25)
Tal como em ordem 1, o primeiro termo é zero; por (11.1.14), hφn |1i = 0 e usando hφn |0i = 1
temos1
ǫ2 = hφn |V̂ |1i
(11.1.21)
=
p6=n i=1
Logo, em segunda ordem em λ:
En (λ) =
En0
+ hφn |Ŵ |φn i +
dp
XX
|hφip|V̂ |φn i|2
En0 − Ep0
dp
XX
|hφip |Ŵ |φn i|2
p6=n i=1
En0
−
Ep0
,
+ O(λ3 ) .
(11.1.26)
(11.1.27)
Nesta ordem, a contribuição do estado |φip i para o valor próprio da energia do estado não
perturbado |φn i, devida à perturbação Ŵ , é tanto maior quanto: i) maior for o acoplamento
hφip |Ŵ |φn i; ii) mais próximas forem as energias Ep0 e En0 . Quanto maiores forem estas
contribuições mais os estados |φn i e |φip i se repelem.
Para calcularmos o estado em segunda ordem em λ projectamos (11.1.11) em todos os
outros estados próprios de Ĥ0 (que não |φn i), {|φip i}. Obtemos
hφip | Ĥ0 − ǫ0 |2i + hφip | V̂ − ǫ1 |1i + ǫ2 hφip |0i = 0 ;
Como |φn i e |φip i para n 6= p são estados próprios associados a valores próprios distintos,
hφip |φn i = 0 e o último termo é zero; usando ainda que Ĥ0 |φip i = Ep0 |φip i obtemos
hφip | V̂ − ǫ1 |1i
, n=
6 p.
(11.1.28)
hφip |2i =
En0 − Ep0
Expandindo |2i na base própria de Ĥ0 ,
|2i =
1
dp
XX
p
i=1
hφip |2i|φipi
=
dp
XX
p6=n i=1
hφip |2i|φipi + hφn |2i|φn i ,
Note-se que, para conhecer a energia em segunda ordem necessitamos do estado em primeira ordem.
Genericamente, para conhecermos a energia em ordem n necessitamos do estado até ordem n − 1.
350
Métodos perturbativos independentes e dependentes do tempo
e usando (11.1.28) e a relação (11.1.15) temos
dp hφi | V̂ − ǫ
XX p
1 |1i
h1|1i
|φip i −
|φn i .
|2i =
0
0
En − Ep
2
p6=n i=1
(11.1.29)
Usando agora (11.1.21) e (11.1.18), obtemos uma relação explı́cita para |2i em função de
elementos de matriz da perturbação na base |φim i:
dp
dp
dm
XX
XX
XX
hφip |V̂ |φn ihφn |V̂ |φn i i
hφip |V̂ |φjm i hφjm |V̂ |φn i i
|φ
i
−
|2i =
|φp i
p
0
En0 − Ep0 En0 − Em
(En0 − Ep0 )2
p6=n i=1
p6=n i=1 m6=n j=1
d
p
1 X X |hφip|V̂ |φn i|2
−
|φn i
2 p6=n i=1 (En0 − Ep0 )2
.
(11.1.30)
Logo, em segunda ordem em λ, o estado próprio de Ĥ é
!
dp
1 X X |hφip |Ŵ |φn i|2
|Ψn (λ)i = 1 −
|φn i
2 p6=n i=1 (En0 − Ep0 )2
!
dp
XX
hφip |Ŵ |φn i
hφn |Ŵ |φn i
+
1−
|φip i
0 − E0
0 − E0
E
E
n
p
n
p
p6=n i=1
(11.1.31)
dp
dm
XX
XX
hφip |Ŵ |φjm i hφjm |Ŵ |φn i i
+
|φp i + O(λ3 ) .
0
0
0
0
En − Ep En − Em
p6=n i=1 m6=n j=1
Ordem de grandeza do erro numa aproximação de primeira ordem
Se decidirmos truncar a expansão de En (λ) e |Ψ(λ)i em primeira ordem em λ, podemos
ter uma ideia do erro envolvido no cálculo majorando o termo da energia de ordem 2.
0
0
Seja Em
a energia mais próxima de En0 no espectro de Ĥ0 . Denotemos ∆E ≡ |En0 −Em
|.
Logo
|En0 − Ep0 | ≥ ∆E ,
∀p6=n .
Podemos assim majorar o termo ǫ2 usando a expressão (11.1.26):
#
"
dp
dp
XX
1
1 XX i
|hφp|V̂ |φn i|2 =
|ǫ2 | ≤
|φip ihφip | V̂ |φn i
hφn |V̂
∆E p6=n i=1
∆E
p6=n i=1
2 1
1
2
hφn |V̂ |φn i − hφn |V̂ |φn i
.
hφn |V̂ 1̂ − |φn ihφn | V̂ |φn i =
=
∆E
∆E
(11.1.32)
(11.1.33)
11.1 Teoria das perturbações estacionárias
351
Logo
|λ2 ǫ2 | ≤
(∆Ŵ )2
,
∆E
(11.1.34)
onde ∆Ŵ é o desvio padrão da perturbação no estado não perturbado. Logo, em ordem
1, a correcção à energia é o valor médio da perturbação no estado não perturbado e o erro
é estimado usando o desvio padrão da perturbação nesse mesmo estado.
11.1.2
Perturbação a um nı́vel degenerado
Consideremos agora um nı́vel degenerado de Ĥ0 , com valor próprio En0 e grau de degenerescência dn , 1 < dn < +∞. Seja En0 o sub-espaço vectorial gerado pelos vectores
próprios de Ĥ0 associados a En0 , {|φin i}. Neste caso vamos limitar a nossa análise à primeira
ordem nos valores próprios e ordem zero nos vectores próprios.
Ordem 0
Em ordem 0, En (λ) = ǫ0 e |Ψn (λ)i = |0i. Claramente
ǫ0 = En0 ,
|0i =
dn
X
i=1
ci |φin i ,
onde
dn
X
i=1
|ci |2 = 1 .
(11.1.35)
Note-se que existe uma indefinição na escolha de |0i, devida à degenerescência do nı́vel
em análise. Essa indefinição será levantada em ordens superiores, caso a degenerescência
também o seja.
Ordem 1
Em ordem 1, En (λ) = ǫ0 +λǫ1 e |Ψn (λ)i = |0i+λ|1i. Para calcular ǫ1 e simultaneamente |0i,
projectamos a equação (11.1.10) em hφin |. Por uma análise analoga ao caso não degenerado
obtemos
hφin |V̂ |0i = ǫ1 hφin |0i .
(11.1.36)
Inserindo a relação de fecho,
dp
XX
p
j=1
hφin |V̂ |φjp ihφjp|0i = ǫ1 hφin |0i .
(11.1.37)
352
Métodos perturbativos independentes e dependentes do tempo
Por (11.1.35), o termo hφjp |0i só é diferente de zero para p = n; logo
dn
X
j=1
hφin |V̂ |φjn ihφjn |0i = ǫ1 hφin |0i .
(11.1.38)
Escrevendo os elementos de matriz hφin |V̂ |φjn i ≡ Vnij e usando (11.1.35), esta equação
reescreve-se
Vnij cj = ǫ1 ci ⇔ V̂n |0i = ǫ1 |0i .
(11.1.39)
Isto é, para calcular os valores próprios em ordem 1 e simultaneamente o vector próprio em
ordem zero, de Ĥ(λ), correspondentes à perturbação de um nı́vel degenerado En0 , temos
de diagonalizar a perturbação V̂ no sub-espaço En0 associado a En0 . Cada estado em En0
pode ter uma correcção diferente na energia por acção da perturbação; isto é, em primeira
ordem
En,j (λ) = En0 + λǫj1 ,
j = 1, . . . , fn(1) ≤ dn ,
(11.1.40)
onde os vários ǫj1 são obtidos resolvendo a equação caracterı́stica (11.1.39), correspondendo
(1)
o ı́ndice j ao número de soluções distintas, num total de (em primeira ordem) fn , que
necessariamente não irá exceder a dimensão do sub-espaço vectorial degenerado, dn .
Relativamente ao vector próprio |0i, existem duas possibilidades:
• Se a perturbação levantar totalmente a degenerescência de En0 em primeira ordem, i.e.
(1)
fn = dn , o vector próprio |0i é unicamente determinado pela equação caracterı́stica
(11.1.39). Neste caso existe um único vector próprio de Ĥ(λ) em ordem zero com
valor próprio En0 + λǫj1 em ordem 1.
• Se a perturbação não levantar totalmente a degenerescência de En0 em primeira ordem,
(1)
i.e. fn
< dn , o vector próprio |0i não é unicamente determinado pela equação
caracterı́stica (11.1.39); para cada energia En0 + λǫj1 , em primeira ordem, |0i pertence
a um espaço vectorial cuja dimensão é a degenerescência En0 + λǫj1 em ordem 1.
11.1.3
Perturbações X̂, X̂ 2 e X̂ 3 a um potencial harmónico
Vamos agora ilustrar o formalismo estudado considerando perturbações do tipo X̂, X̂ 2 e X̂ 3
num potencial harmónico um dimensional. No primeiro e segundo caso, o problema com a
11.1 Teoria das perturbações estacionárias
353
perturbação é ainda exactamente solúvel, pelo que podemos testar o método perturbativo
comparando-o com a solução exacta. O terceiro caso não tem solução exacta, mas é de
interesse prático, pois um termo do tipo X̂ 3 é o primeiro termo não harmónico na expansão
de Taylor de um potencial arbitrário em torno de um ponto estacionário. Note que o
espectro de Ĥ0 será não degenerado.
Perturbação por um potencial linear
Seja Ĥ0 o Hamiltoniano do oscilador harmónico em uma dimensão (5.1.1)
Ĥ0 =
mω 2 2
P̂ 2
X̂ .
+
2m
2
(11.1.41)
O seu espectro é
En0
=
1
n+
2
n ∈ N0 ,
~ω,
(11.1.42)
e o conjunto de funções próprias normalizadas é denotado, tal como no capı́tulo 5, {|Φn i}.
Consideramos a perturbação
√
Ŵ = λ m~ω 3 X̂ .
(11.1.43)
Analisemos primeiro a solução exacta. O Hamiltoniano total Ĥ(λ) = Ĥ0 + Ŵ pode ser
escrito
mω 2
P̂ 2
+
Ĥ(λ) =
2m
2
X̂ + λ
r
!2
~
ω~
1̂ − λ2 1̂ .
mω
2
Concluimos imediatamente que o espectro de Ĥ é
1 − λ2
En (λ) = n +
~ω,
2
n ∈ N0 .
(11.1.44)
(11.1.45)
Para calcularmos as novas funções próprias notamos que o efeito da perturbação consiste,
para além da adição de uma energia ao Hamiltoniano, numa translação
r
~
X̂ → X̂ + λ
1̂ .
mω
O Hamiltoniano Ĥ(λ) é ainda um problema harmónico canónico (a menos da soma de
uma energia) quando interpretado em termos da posição transladada, dado que o operador
momento pode ainda ser interpretado como o momento canónico conjugado da posição
354
Métodos perturbativos independentes e dependentes do tempo
transladada. Recordamos que o operador translação foi definido no Problema 8 da folha
de problemas 5, como sendo T̂∆x , com acção
T̂∆x f (x) = f (x + ∆x) ,
(11.1.46)
e com representação
T̂∆x = ei∆xP̂ /~ .
(11.1.47)
p
p
Usando ∆x = λ ~/mω e, de (5.1.4), P̂ = −i mω~/2(â − ↠), obtemos, em termos de
operadores de criação e destruição
√
† )/
T̂∆x = eλ(â−â
2
.
(11.1.48)
Logo, as funções próprias de Ĥ(λ), |Ψn (λ)i, podem ser obtidas pela acção da translação
em |Φn i:
√
† )/
|Ψn (λ)i = eλ(â−â
2
|Φn i ,
ou, usando (5.1.30), (5.1.31) e expandindo a exponencial em série de Taylor,
r
r
n
n+1
|Φn−1 i − λ
|Φn+1 i + O(λ2 ) .
|Ψn (λ)i = |Φn i + λ
2
2
(11.1.49)
(11.1.50)
Vamos agora usar a teoria de perturbações estacionárias para reproduzir os resultados
(11.1.45) e (11.1.50). Começamos por escrever a perturbação Ŵ em termos dos operadores
de destruição e criação, usando (5.1.4):
r
~
X̂ =
(â + ↠)
2mω
⇒
~ω
Ŵ = λ √ (â + ↠) .
2
(11.1.51)
Claramente, a perturbação mistura o estado |Φn i apenas com |Φn−1 i e |Φn+1 i; os únicos
elementos de matriz da perturbação não nulos são
r
r
n+1
n
hΦn+1 |Ŵ |Φn i = λ~ω
,
hΦn−1 |Ŵ |Φn i = λ~ω
.
2
2
Logo, usando (11.1.27), En (λ) em ordem 2 é
~ω
1
− λ2
+ O(λ3 ) .
En (λ) = ~ω n +
2
2
(11.1.52)
(11.1.53)
11.1 Teoria das perturbações estacionárias
355
Nesta ordem obtemos o resultado exacto (11.1.45); pode-se demonstrar que todos os termos
de ordem superior a 2 são de facto zero. Usando (11.1.22) obtemos
r
r
n
n+1
|Φn−1 i − λ
|Φn+1 i + O(λ2 ) ,
|Ψn (λ)i = |Φn i + λ
2
2
(11.1.54)
em acordo com (11.1.50) nesta ordem.
Perturbação por um potencial quadrático
Perturbamos agora (11.1.41) por um potencial quadrático
Ŵ = λ
mω 2 2
X̂ .
2
(11.1.55)
Obviamente, o Hamiltoniano total é o de um oscilador harmónico canónico com frequência
√
ω 1 + λ. Como tal, o espectro de energias é
λ λ2
1
En (λ) = ~ω n +
1+ −
+ ... .
(11.1.56)
2
2
8
Podemos também relacionar os operadores de criação e destruição na presença da perturbação e na ausência da perturbação. Como a relação entre eles é complexa, vamos
restringir a nossa análise ao espectro. Para usarmos a teoria de perturbações escrevemos
a perturbação em termos de operadores de criação e destruição,
Ŵ = λ
~ω
(↠)2 + â↠+ ↠â + (â)2 ,
4
de onde se conclui que os elementos de matriz não nulos são
λ~ω
1
hΦn |Ŵ |Φn i =
n+
,
2
2
λ~ω p
λ~ω p
hΦn+2 |Ŵ |Φn i =
(n + 1) (n + 2) , hΦn−2 |Ŵ |Φn i =
n (n − 1) .
4
4
(11.1.57)
(11.1.58)
Logo, usando (11.1.27), En (λ) em ordem 2 é
2
2
(n + 1)(n + 2)
n(n − 1)
λ~ω
1
λ~ω
λ~ω
1
+
n+
−
+
En (λ) = ~ω n +
2
2
2
4
2~ω
4
2~ω
2
1
λ λ
= ~ω n +
1+ −
+ . . . + O(λ3 ) ,
2
2
8
(11.1.59)
em acordo com o cálculo exacto (11.1.56).
356
Métodos perturbativos independentes e dependentes do tempo
Perturbação por um potencial cúbico
Perturbamos agora (11.1.41) por um potencial cúbico
r
m3 ω 5 3
X̂ .
Ŵ = λ
~
(11.1.60)
No problema clássico, x(t) deixa de ser sinusoidal, aparecendo uma série de harmónicos
da frequência fundamental; o perı́odo deixa de ser independente da energia e o movimento deixa de ser simétrico relativamente à origem. Relativamente ao problema quântico
começamos por exprimir a perturbação em termos de operadores de criação e destruição.
Usando (11.1.51) obtemos, usando as relações de comutação entre â, ↠e o operador de
número N̂ = ↠â,
~ω Ŵ = λ √ â3 + (↠)3 + 3N̂ ↠+ 3(N̂ + 1)â .
8
(11.1.61)
Com esta forma é simples concluir que os únicos elementos de matriz não nulos para a
perturbação são
λω~ p
λω~ p
hΦn+3 |Ŵ |Φn i = √
(n + 1)(n + 2)(n + 3) , hΦn−3 |Ŵ |Φn i = √
n(n − 1)(n − 2) ,
8
8
3λω~
3λω~
hΦn+1 |Ŵ |Φn i = √ (n + 1)3/2 , hΦn−1 |Ŵ |Φn i = √ n3/2 .
8
8
(11.1.62)
Usando (11.1.27), verificamos que a contribuição de primeira ordem para En (λ) é zero;
levando em conta a contribuição de segunda ordem obtemos
2
15 2
1
7
1
− λ ω~ n +
− λ2 ω~ + O(λ3 ) .
En (λ) = ~ω n +
2
4
2
16
(11.1.63)
Em segunda ordem, a perturbação diminui a energia de todos os nı́veis. Quanto mais
elevado for o nı́vel maior a diminuição de energia. Note-se que, como tal, nı́veis consecutivos
já não são equidistantes.
Usando (11.1.22) obtemos, para os estados de Ĥ, em primeira ordem,
r
r
λ (n + 1)(n + 2)(n + 3)
λ n(n − 1)(n − 2)
|Ψn (λ)i = |Φn i −
|Φn+3 i +
|Φn−3 i
3
8
3
8
r
r
n3
(n + 1)3
|Φn−1 i − 3λ
|Φn+1 i + O(λ2 ) .
+3λ
8
8
(11.1.64)
11.1 Teoria das perturbações estacionárias
357
O efeito da perturbação é misturar o estado |Φn i com os estados |Φn+3 i, |Φn−3 i, |Φn+1 i e
|Φn−1 i.
11.1.4
Estrutura fina do átomo de Hidrogénio
Como aplicação da teoria de perturbações estacionárias vamos estudar a estrutura fina e
hiperfina2 do átomo de Hidrogénio. Como discutido na secção 9.2, o Hamiltoniano usado
para descrever o átomo de Hidrogénio no capı́tulo 6, Ĥ0 , é apenas aproximado, dado que
negligencia todos os efeitos relativistas, em particular os efeitos magnéticos e de spin,
para além de não considerar o spin nuclear. Estes efeitos são necessários para explicar os
espectros observados; de facto, embora conduzam a apenas pequenas alterações do espectro
estudado no capı́tulo 6, a enorme precisão da espectroscopia evidencia claramente estas
alterações. Sendo pequenas podemos usar teoria de perturbações para as estudar.
O Hamiltoniano de estrutura fina
O Hamiltoniano de estrutura fina pode ser obtido directamente da equação de Dirac.
Embora esta equação possa ser resolvida exactamente para um potencial de Coulomb,
é instrutivo considerar uma análise perturbativa, que evidencia a interpretação fı́sica de
cada um dos termos no problema. O operador Hamiltoniano que descreve o átomo de
Hidrogénio, incluindo os termos responsáveis pela estrutura fina, toma a seguinte forma:
Ĥ = me c2 1̂ + Ĥ0 + Ŵmv + ŴSO + ŴD .
(11.1.65)
Consideremos os vários termos individualmente:
• me c2 é a energia associada à massa em repouso do electrão;
• Ĥ0 é o Hamiltoniano considerado no capı́tulo 6; este leva apenas em conta o termo
cinético não relativista e o potencial de Coulomb
Ĥ0 =
2
1 e2
P̂ 2
−
.
2me 4πǫ0 r
A estrutura hiperfina será descrita nas aulas teórico-práticas se houver tempo para tal.
(11.1.66)
358
Métodos perturbativos independentes e dependentes do tempo
Note-se, que neste termo, o facto de a massa do protão ser finita pode ser levado em
consideração substituindo me pela massa reduzida do sistema protão-electrão µ.
• Ŵmv é a primeira correcção relativista ao termo cinético:
Ŵmv = −
P̂ 4
.
8m3e c2
(11.1.67)
Este termo é fácil de obter considerando a expressão relativista para a energia
s
p
p~2
~p2
p~4
2
2
2
2
2
E = c p~ + me c = me c 1 + 2 2 = me c 1 +
−
+ ... ;
me c
2m2e c2 8m4e c4
(11.1.68)
os três primeiros termos me c2 ,
p
~2
2me
4
e − 8mp~3 c2 , correspondem a três dos termos pree
sentes em (11.1.65): a energia correspondente à massa em repouso, o termo cinético
não relativista presente em Ĥ0 e a primeira correcção relativista à energia cinética
que resulta da variação da massa com a velocidade. Para estimarmos a ordem de
magnitude relativa entre Ŵmv e Ĥ0 estimamos o último pelo termo cinético:
|Ŵmv |
|Ĥ0 |
=
|~
p4 |
8m3e c2
|~
p2 |
2me
v 2
|~p2 |
∼ α2 ≃
∼ 2 2 ∼
me c
c
1
137
2
,
(11.1.69)
onde usamos a relação (9.2.2). Como as energias do espectro não perturbado são da
ordem de |Ĥ0 | ∼ 10 eV , a perturbação será da ordem de |Ŵmv | ∼ 10−3 eV , o que
justifica o uso de teoria de perturbações.
• ŴSO é o acoplamento spin-órbita:
ŴSO =
1
dV (R̂) ~ ~
L̂ · Ŝ .
2m2e c2 R̂ dR̂
(11.1.70)
A origem fı́sica deste termo pode ser compreendida pela seguinte análise clássica:
o electrão move-se com velocidade ~v no campo eléctrico do protão. Logo vê um
campo magnético que pode ser estimado pela transformação de Lorentz do campo
~
electrostático do protão E
~ ′ ≃ − ~v × E
~ .
B
c2
(11.1.71)
11.1 Teoria das perturbações estacionárias
359
Como o electrão tem um dipolo magnético que resulta do seu spin, existe uma interação do tipo
′
WSO
~v
1 dV ~r
e ~
′
~
S · − 2× −
.
= −~µS · B = − 2
2me
c
e dr r
(11.1.72)
~ obtemos
Usando a definição clássica de momento angular me~v × ~r = −L
′
WSO
=
1
m2e c2 r
dV ~ ~
L·S .
dr
(11.1.73)
A menos de um factor de 1/2, este é o acoplamento spin-órbita. O factor de 1/2 é
devido à nossa estimativa do campo magnético produzido pelo núcleo assumir um
movimento rectilı́neo, o que não acontece. O movimento não rectilı́neo origina uma
precessão do spin electrónico - Precessão de Thomas; quando levada em consideração
o factor de 1/2 surge naturalmente.
Estimemos agora a ordem de grandeza deste termo, relativamente a Ĥ0 , usando para
este último o termo potencial, estimando
~ ∼~,
L
~ ∼~,
S
temos
|ŴSO |
|Ĥ0 |
=
r ∼ a0 =
e2 ~2
8πǫ0 m2e c2 a30
e2
4πǫ0 a0
~
,
cme α
∼
dV
e2
,
∼
dr
4πǫ0 a20
~2
∼ α2 .
m2e c2 a20
(11.1.74)
Este termo é, portanto, da ordem da mesma ordem de grandeza de Ĥmv .
• ŴD é o termo de Darwin:
ŴD =
~2
∆V (R̂) .
8m2e c2
(11.1.75)
A origem fı́sica deste termo pode ser compreendida da seguinte maneira. Na equação
de Dirac a interacção entre o campo do núcleo e o electrão é local, isto é, o electrão é
afectado pelo potencial no ponto onde se encontra, ~r. Na aproximação não relativista,
no entanto, a expansão em v/c origina uma interacção não local, isto é, o electrão é
afectado pelo campo do protão num certo volume, centrado em ~r. Esse volume é da
360
Métodos perturbativos independentes e dependentes do tempo
ordem de (~/me c)3 , onde λ = ~/mc é o comprimento de onda de Compton.3 Assim,
a energia potencial não é apenas V (~r), mas toma a forma
Z
Energia potencial ∼ d3 ρf (ρ)V (~r + ρ) ,
(11.1.76)
onde a função f (ρ) tem as seguintes propriedades: i) depende apenas de |ρ|, dado que
o potencial tem simetria esférica; ii) tem suporte num volume da ordem de (~/me c)3 ,
R
centrado em ρ = 0; iii) d3 ρf (ρ) = 1. Considerando uma expansão em série de
Taylor, de V (~r + ρ) e notando que o integral do termo de ordem um é nulo devido à
simetria esférica obtemos que a energia potencial fica
Z
ρ2
3
d ρf (ρ) V (~r) + ∆V (~r) + . . . .
2
(11.1.77)
O primeiro termo é o termo potencial de Ĥ0 ; o segundo termo tem a forma
Z
∆V (~r) d3 ρρ2 f (ρ) ∼ ∆V (~r)(~/me c)2 ,
que, a menos de um factor numérico tem a forma do termo de Darwin.
Para estimar a ordem de grandeza do termo de Darwin relativamente a Ĥ0 notamos
que, usando (10.2.7) o termo pode ser reescrito
~2 e2
~2 e2
1
ŴD = − 2 2
=
∆
δ(R̂) .
8me c (4πǫ0 )
8m2e c2 ǫ0
R̂
(11.1.78)
O valor esperado deste operador num estado próprio de Ĥ0 é
hŴD i =
~2 e2
|Ψ(0)|2 .
8m2e c2 ǫ0
(11.1.79)
Imediatamente concluimos que o termo de Darwin só afecta electrões em orbitais s,
pois de acordo com os resultados do capı́tulo 6 (ver por exemplo tabela na secção
3
Uma maneira de pensar neste comprimento de onda é a seguinte: tal como o comprimento de onda
de de Broglie de uma partı́cula de massa m e com velocidade v, λdB = ~/mv nos dá a escala na qual o
carácter ondulatório de uma partı́cula quântica não pode ser negligenciado, o comprimento de onda de
Compton da mesma partı́cula λC = ~/mc dá-nos uma escala para a qual os efeitos relativistas não podem,
igualmente, ser negligenciados. Claramente λC < λdB . Na teoria de Dirac, a origem fı́sica do termo de
Darwin é um fenómeno denominado zitterbewegung que consiste no facto de que o electrão não se move
suavemente, mas sofre flutuações de pequena escala (da ordem de λC ) extremamente rápidas; assim, ao
fazermos uma expansão em v/c o electrão vê efectivamente o potencial de Coulomb do núcleo espalhado
por uma vizinhança da ordem de λC .
11.1 Teoria das perturbações estacionárias
361
6.4, ou expressão (7.2.63)) estas são as únicas para as quais Ψ(0) 6= 0. Como |Ψ(0)|2
é uma densidade de probabilidade estimamos o seu valor por |Ψ(0)|2 ∼ 1/a30 . Logo
|ŴD |
|Ĥ0 |
=
e2 ~2
8m2e c2 a30 ǫ0
p2
2me
∼
me c2 α4
∼ α2 ,
me c2 α2
(11.1.80)
tal como para os termos anteriores.
A estrutura fina do nı́vel N = 2
Vamos exemplificar o efeito da perturbação a Ĥ0 dada em (11.1.65) calculando a estrutura
fina do nı́vel N = 2 do átomo de Hidrogénio.4 Recordamos que o espectro deste átomo
(6.4.23) depende apenas do número quântico principal
0
EN
=−
~2 1
me c2 2
=
−
α .
2me a20 N 2
2N 2
(11.1.81)
Assim, o nı́vel 2s (N = 2, ℓ = 0) e o nı́vel 2p (N = 2, ℓ = 1) têm a mesma energia, dada
por
E20
me c2 2
=−
α .
8
(11.1.82)
Para além desta degenerescência, concluimos no capı́tulo 6, que o nı́vel p é ele próprio
degenerado, pois o momento angular ℓ = 1 pode ter momento angular azimutal descrito
por mℓ = −1, 0, 1. Mas no capı́tulo 6 foi negligenciado o spin. Considerando também o spin,
quer do electrão quer do protão, cado um dos 4 nı́veis anteriores tem uma degenerescência
adicional de 4. Assim, uma base para o espaço de estados de cada uma das orbitais será:
• Orbital 2s: {|N = 2, ℓ = 0, mℓ = 0, mS = ±; mI = ±i}; onde mS refere-se ao spin
electrónico e mI ao spin do protão;
• Orbital 2p: {|N = 2, ℓ = 1, mℓ = −1, 0, 1, mS = ±; mI = ±i}.
A degenerescência total do nı́vel N = 2 é então 4 + 12 = 16.
De acordo com os resultados vistos na secção 11.1 para perturbações de um nı́vel degenerado, necessitamos de diagonalizar a perturbação Ŵ neste sub-espaço 16 dimensional. Os
4
Nota: Para o nı́vel N = 1 a perturbação associada à estrutura fina produz apenas uma correcção
global ao nı́vel e não levanta a degenerescência. Assim é mais interessante estudar o nı́vel N = 2.
362
Métodos perturbativos independentes e dependentes do tempo
valores próprios nesta diagonalização serão as correcções de primeira ordem das energias; os
vectores próprios correspondentes serão os vectores próprios de ordem zero. Consideremos
então a perturbação
Ŵf = Ŵmv + ŴSO + ŴD ,
(11.1.83)
que será responsável pela chamada “estrutura fina”. O cálculo desta estrutura é facilitado
pelas duas seguintes observações: i) Dado que esta perturbação não actua no spin do protão,
este grau de liberdade pode ser ignorado para a estrutura fina. Assim sendo, a dimensão
do espaço degenerado associado a N = 2 reduz-se efectivamente a 8; ii) A perturbação
comuta com o momento angular total, [L̂2 , Ŵf ] = 0. De facto L̂2 comuta com Ŵmv pois
[L̂2 , P̂ 2] = 0 ⇒ [L̂2 , P̂ 4 ] = 0 ;
L̂2 comuta com ŴSO pois
[L̂2 , f (R̂)] = 0 ,
~
[L̂2 , L̂] = 0 ,
~
[L̂2 , Ŝ] = 0 ,
onde f (R̂) é uma função arbitrária de R̂; devido à primeira relação na última equação L̂2
comuta com ŴD . Logo, Ŵf não mistura estados 2s com estados 2p e a matriz de 8 × 8
que representa Ŵf parte-se numa matriz de 2 × 2 que actua nos estados 2s e uma matriz
de 6 × 6 que actua nos estados 2p. De facto é fácil verificar que Ŵf é um operador par e
como tal não poderia misturar estados com paridade diferente, como é o caso de estados s
e estados p. Consideramos seguidamente e separadamente as representações matriciais de
Ŵf que actuam em estados 2s e estados 2p.
Estrutura fina para o nı́vel 2s
Consideramos a base {|N, ℓ, mℓ , mS i = |2, 0, 0, ±i}. Ŵmv e ŴD não actuam no grau de
liberdade de spin, mS . Logo estes operadores são proporcionais ao operador identidade no
espaço de spin. Os coeficientes de proporcionalidade serão dados por elementos de matriz
puramente orbitais, respectivamente,
hŴmv i2s = −
1
h2, 0, 0|P̂ 4|2, 0, 0i ,
8m3e c2
hŴD i2s =
~2
h2, 0, 0|∆V (R̂)|2, 0, 0i .
8m2e c2
(11.1.84)
11.1 Teoria das perturbações estacionárias
363
Por outro lado, os elementos de matriz de ŴSO são nulos; de facto
hŴSO i2s ∝ h2, 0, 0, ±|L̂x,y,z |2, 0, 0, ±i = 0 ,
pois qualquer componente do momento angular tem valor esperado nulo no harmónico
esférico com ℓ = 0 = mℓ . Assim, o efeito dos termos de estrutura fina nos estados 2s é
alterar a sua energia para
E2s = −
me c2 2
α + hŴmv i2s + hŴD i2s .
8
(11.1.85)
Calculemos explicitamente estes elementos de matriz. Para calcular hŴmv i2s notamos que
Ĥ0 =
P̂ 2
+ V (R̂)
2me
⇒
P̂ 2 = 2me (Ĥ0 − V (R̂)) .
Logo
2
4m2e e4
2E20 e2 1
1
1
0 2
hŴmv i2s = − 3 2 h Ĥ0 − V (R̂) i2s = −
(E2 ) +
h i2s +
h i2s .
8me c
2me c2
4πǫ0 R̂
(4πǫ0 )2 R̂2
(11.1.86)
Para calcular os valores esperados h1/R̂n i2s , recordamos que a parte radial da função de
onda do estado 2s é (6.4.33)
2
f(2,0) (r) =
(2a0 )3/2
r
e−r/2a0 .
1−
2a0
(11.1.87)
Como tal
h
1
R̂n
i2s =
Z
+∞
0
Notando que

 1 ,
2

2
r
4
r
4a0
1−
e−r/a0 n dr =
1
3

(2a0 )
2a0
r

,
4a20
a0 ≡
4πǫ0 ~2
,
me e2
a0 α =
n=1,
(11.1.88)
n=2.
~
,
me c
obtemos
me c2 α4 1
13
1
1
hŴmv i2s = −
=−
−
+
me c2 α4 .
2
64 16 4
128
(11.1.89)
Para calcular hŴD i2s recordamos (11.1.79); logo
hŴD i2s =
~2 e2 1
4
me c2 α4
~2 e2
2
|Ψ(0)
|
=
=
,
2s
8m2e c2 ǫ0
8m2e c2 ǫ0 4π (2a0 )3
16
(11.1.90)
364
Métodos perturbativos independentes e dependentes do tempo
√
onde usamos (11.1.87) bem como o harmónico esférico Y00 = 1/ 4π.
Finalmente podemos juntar os resultados e concluir que a energia dos estados 2s,
levando em conta a perturbação da estrutura fina é
2
5 4
α
6
2
+
α + O(α ) .
E2s = −me c
8
128
(11.1.91)
Estrutura fina para o nı́vel 2p
Os termos Ŵmv e ŴD não actuam nas variáveis de spin e comutam com as várias
~
componentes de L̂. Logo, no sub-espaço associado aos 6 nı́veis 2p (ignorando o spin do
protão), os termos Ŵmv e ŴD serão proporcionais ao operador identidade neste espaço.
Para ŴD a constante de proporcionalidade é zero, dado que este termo tem valor esperado
não nulo apenas em órbitais s:
hŴD i2p = 0 .
(11.1.92)
O valor de hŴmv i2p pode ser calculado de um modo análogo a hŴmv i2s ; para este cálculo
necessitamos da função radial para a orbital 2p que é dada por
f(2,1) (r) =
1
r −r/2a0
√
e
,
(2a0 )3/2 3 a0
(11.1.93)
com a qual se conclui que
1
1
h i2p =
,
4a0
R̂
h
1
R̂2
i2p =
1
.
12a20
(11.1.94)
Usando uma fórmula análoga a (11.1.86) com 2s substituido por 2p obtem-se que
hŴmv i2p = −
7
me c2 α4 .
384
(11.1.95)
Consideramos agora o termo de spin-órbita. Temos de calcular elementos de matriz do
tipo
1
e2
1
~ ~
hN = 2, ℓ = 1, s = , m′ℓ , m′S |
L̂ · Ŝ|N = 2, ℓ = 1, s = , mℓ , mS i . (11.1.96)
2
2
8πǫ0 m2e c2 R̂3
Nestes elementos de matriz podemos separar a parte radial, usando a representação |~ri:
e2
1
1
1
~ ~
h i2p hℓ = 1, s = , m′ℓ , m′S |L̂ · Ŝ|ℓ = 1, s = , mℓ , mS i .
2
2
8πǫ0 me c R̂3
2
2
(11.1.97)
11.1 Teoria das perturbações estacionárias
365
Usando (11.1.93) conclui-se que
h
1
R̂3
i2p =
1
,
24a30
de onde se conclui que os elementos de matriz sob consideração podem ser escritos
1
1
α4
~ ~
me c2 hℓ = 1, s = , m′ℓ , m′S |L̂ · Ŝ|ℓ = 1, s = , mℓ , mS i .
2
48~
2
2
(11.1.98)
~ ~
O problema reduz-se agora a diagonalizar o operador L̂· Ŝ neste espaço 6 dimensional, o que
é automaticamente conseguido se usarmos uma base diferente. A base usada em (11.1.98),
no espaço ℓ = 1, s = 1/2, é uma base própria de L̂2 , Ŝ 2 , L̂z e Ŝz . Se introduzirmos o
momento angular total (tal como na secção 9.5)
~ˆ ~ ~
J = L̂ + Ŝ ,
(11.1.99)
podemos introduzir a base própria dos operadores L̂2 , Ŝ 2 , Jˆ2 e Jˆz ,
1
|ℓ = 1, s = , J, mJ i .
2
(11.1.100)
A relação entre as duas bases é dada pelos coeficientes de Clebsch-Gordon, que nos permite
traduzir entre elas sem dificuldade.
Usando as regras de adição de momento angular, vistas na secção 9.5, J toma dois
valores possı́veis: J = 1/2 e J = 3/2, com 2 e 4 valores de mJ associados, respectivamente.
~ ~
Mostramos agora que o operador L̂ · Ŝ está diagonalizado na base (11.1.100), tendo valor
esperado diferente para diferentes valores de J. Para isso escrevemos
Jˆ2 − L̂2 − Ŝ 2
~ ~
~ ~
,
Jˆ2 = L̂2 + Ŝ 2 + 2L̂ · Ŝ ⇔ L̂ · Ŝ =
2
(11.1.101)
~ ~
o que demonstra que L̂·Ŝ pode ser escrito em termos de operadores que estão diagonalizados
~ ~
na base (11.1.100). Daqui resulta que é muito simples calcular os valores esperados de L̂ · Ŝ
nesta base:
1
1
1
1
~2
~ ~
hℓ = 1, s = , J = , mJ |L̂ · Ŝ|ℓ = 1, s = , J = , mJ i =
2
2
2
2
2
3
3
−2−
4
4
= −~2 ,
(11.1.102)
366
Métodos perturbativos independentes e dependentes do tempo
e
1
3
1
3
~2
~ ~
hℓ = 1, s = , J = , mJ |L̂ · Ŝ|ℓ = 1, s = , J = , mJ i =
2
2
2
2
2
15
3
−2−
4
4
~2
.
2
(11.1.103)
=
Como afirmado anteriormente a correcção à energia irá depender de J, mas não de mJ .
Esta é uma caracterı́stica genérica.5 Na notação dos espectroscopistas, introduzida na
secção 6.4, adiciona-se por isso um sub-ı́ndice J à notação que tem vindo a ser usada.
Assim, para os estados 2p existem agora os nı́veis 2p1/2 e 2p3/2 , enquanto que os estados
2s existe apenas o nı́vel 2s1/2 (tal como para o estado 1s existe apenas 1s1/2 ). O valor
esperado nos nı́veis 2p1/2 e 2p3/2 da perturbação ŴSO é:
hŴSO i2p1/2 = −
α4
me c2 ,
48
hŴSO i2p3/2 =
α4
me c2 .
96
(11.1.106)
Juntando os resultados (11.1.92), (11.1.95) e (11.1.106) obtemos os seguintes nı́veis de
energia para os estados 2p:
2
2
α
7α4 α4
5α4
α
2
6
2
= −me c
+
+
+
+ O(α ) ,
E2p1/2 = −me c
8
384 48
8
128
(11.1.107)
que tem uma degenerescência 2. Curiosamente a correcção à energia devida a Ŵf é a
mesma que para o nı́vel 2s1/2 (11.1.91). Esta degenerescência parece ser acidental, ao
contrário da degenerescência em mJ que resulta da simetria esférica. No entanto, quando
se considera a quantificação do campo electromagnético esta degenerescência é levantada
pelo chamado desvio de Lamb; a energia do nı́vel 2s1/2 é então aumentada, relativamente à
5
De facto, a solução exacta, obtida da equação de Dirac, para a energia das orbitais do átomo de
Hidrogénio é dada por


EN,J = me c2 1 + N −J −
2
1
2
−1/2
α

q
2 
1 2
+ (J + 2 ) − α2
,
(11.1.104)
onde se vê que existe apenas dependência em N e J. Fazendo uma expansão em potências de α obtém-se:
α2
α4
N
3
6
+
O(α
)
.
(11.1.105)
EN,J = me c2 1 −
−
−
2N 2
2N 4 J + 21
4
Por exemplo, tomando N = 2, J = 1/2 obtém-se (11.1.91), que coincide com (11.1.107); tomando N = 2,
J = 3/2, obtém-se (11.1.108).
11.1 Teoria das perturbações estacionárias
367
do nı́vel 2p1/2 por uma quantidade que é cerca de dez vezes menor que a separação entre os
nı́veis 2p1/2 e 2p3/2 . O desvio de Lamb foi descoberto em 1949 e teve grande importância
no desenvolvimento da Electrodinâmica Quântica.
Para o nı́vel 2p3/2 obtem-se
E2p3/2 = −me c
2
α2 7α4 α4
+
−
8
384 96
= −me c
2
α2
α4
+
+ O(α6 )
8
128
.
(11.1.108)
Note-se que a correcção ao nı́vel 2p3/2 é ligeiramente inferior à do nı́vel 2p1/2 , o que levanta
parcialmente a degenerescência dos estados 2p. Como tal, se considerarmos a transição
2p −→ 1s, que corresponde à risca α da série de Lyman do espectro do hidrogénio (λ = 1216
◦
A), esta risca, quando analisada com uma resolução suficiente, divide-se em duas riscas
vizinhas

 2p −→ 1s
1/2
1/2
2p −→ 1s
,
 2p −→ 1s
3/2
1/2
que estão separadas por uma energia 4me c2 α4 /128 - figura 11.1. O espectro do Hidrogénio
apresenta, de facto, uma estrutura fina.
Energia
2
−me c2 α8
“ 2
”
α4
−me c2 α8 + 128
−me c2
“
4
α2
+ 5α
8
128
”
|0,0,+i
|0,0,−i
|1,0,+i
|1,0,−i
|1,1,+i
2p3/2
2s1/2
|1,1,−i
2p3/2
|1,−1,+i |1,−1,−i
2p3/2 2p3/2
2s1/2 2p1/2 2p1/2
Figura 11.1: Nı́vel N = 2 do átomo de hidrogénio. As linhas sólidas representam o espectro
de Ĥ0 , que tem degenerescência 8, correspondente aos 8 estados possı́veis |ℓ, mℓ , ms i para
N = 2. As linhas a tracejado representam o espectro com as correcções da estrutura fina.
Há um levantamento parcial da degenerescência que passa a ser 4+4. Note que os estados
corrigidos correspondem a combinações lineares dos estados não perturbados.
368
11.2
Métodos perturbativos independentes e dependentes do tempo
Teoria das Perturbações dependentes do tempo
O objectivo principal da teoria das perturbações estacionárias é a determinação da energia
dos estados estacionários. Contudo, existem situações em que essa não é a informação
mais importante. Consideremos, por exemplo, um estado excitado de um átomo. Sabese, experimentalmente, que o sistema decai para o estado fundamental ao fim de algum
tempo. Isso significa que, na presença do acoplamento ao campo de radiação, o estado
excitado não é um estado estacionário do Hamiltoniano. Habitualmente o que interessa
é determinar a probabilidade de transição para o estado fundamental do átomo e não os
estados estacionários do sistema átomo mais campo electromagnético. É o cálculo deste
tipo de probabilidades que iremos descrever nesta secção.
11.2.1
Formulação do problema
Consideremos um sistema fı́sico com Hamiltoniano Ĥ0 , estados estacionários {|Φn i} e espectro de energias {En }:
Ĥ0 |Φn i = En |Φn i .
(11.2.109)
Assumimos que o espectro é discreto e não degenerado, de modo a facilitar a exposição;
tomando os estados estacionários como normalizados temos
hΦn |Φn′ i = δnn′ ,
X
n
|Φn ihΦn | = 1̂ .
(11.2.110)
Note-se que Ĥ0 é independente do tempo, de modo a que os estados |Φn i sejam realmente
estados estacionários.
No instante t = 0, uma pequena perturbação dependente do tempo é aplicada ao
sistema. O Hamiltoniano toma então a forma:
Ĥ(t) = Ĥ0 + Ŵ (t) ,
Ŵ (t) = λV̂ (t) ,
(11.2.111)
onde introduzimos a constante adimensional λ ≪ 1 e a observável V̂ (t), que pode ser
explicitamente dependente do tempo e é da mesma ordem de magnitude do que Ĥ0 . A
perturbação é zero para t < 0.
11.2 Teoria das Perturbações dependentes do tempo
369
Assumimos que o sistema se encontra inicialmente no estado |Φi i, que é um estado
estacionário de Ĥ0 com valor próprio Ei . Depois de aplicada a perturbação Ŵ (t), em
t = 0, o sistema evolui, pelo que |Φi i deixará de ser, em geral, um estado estacionário do
Hamiltoniano perturbado. O nosso objectivo é calcular a probabilidade Pif (t), de encontrar
o sistema num outro estado estacionário de Ĥ0 , |Φf i, no instante t. Ou seja, pretendemos
estudar as transições entre estados estacionários do Hamiltoniano não perturbado, que
podem ser induzidas pela perturbação Ŵ (t) - figura 11.2.
|Φi i
Pif (t)
t=0
|Φi i −→ |Φf i
Ĥ0
Ĥ0 + Ŵ (t)
Figura 11.2: Transição entre dois estados estacionários de Ĥ0 induzida por uma perturbação
Ŵ (t).
Conceptualmente o problema é simples: entre os instantes 0 e t a evolução do sistema
é descrita pela equação de Schrödinger
i~
h
i
d
|Ψ(t)i = Ĥ0 + λV̂ (t) |Ψ(t)i ;
dt
(11.2.112)
como esta é uma equação diferencial de primeira ordem, impondo a condição inicial
|Ψ(t = 0)i = |Φi i ,
(11.2.113)
a solução é única. A probabilidade que pretendemos calcular é:
Pif (t) = |hΦf |Ψ(t)i|2 .
(11.2.114)
Assim, matematicamente, o problema consiste em resolver a equação de Schrödinger (11.2.112)
com a condição inicial (11.2.113), o que em geral terá de ser feito perturbativamente.
11.2.2
Solução aproximada da equação de Schrödinger
Como o cálculo de (11.2.114) envolve explicitamente os estados estacionários de Ĥ0 , vamos
utilizá-los como base, isto é, vamos expandir o estado do sistema |Ψ(t)i na representação
{|Φn i},
|Ψ(t)i =
X
n
cn (t)|Φn i ,
cn (t) = hΦn |Ψ(t)i .
(11.2.115)
370
Métodos perturbativos independentes e dependentes do tempo
Obviamente, o Hamiltoniano não perturbado é representado nesta base por uma matriz
diagonal
hΦn |Ĥ0 |Φm i = En δnm ,
(11.2.116)
enquanto que a observável Ŵ (t) tem elementos de matriz
hΦn |Ŵ (t)|Φm i = Wnm (t) = λVnm (t) .
(11.2.117)
Introduzindo na equação de Schrödinger (11.2.112) a relação de fecho
h
i
X
d X
|Φk ihΦk |Ψ(t)i =
|Φk i hΦk |Ĥ0 |Ψ(t)i + hΦk |λV̂ (t)|Ψ(t)i
i~
dt k
k
X
d
Vkp (t)cp (t) .
⇔ i~ ck (t) = Ek ck (t) + λ
dt
p
(11.2.118)
Estas equações ordinárias diferenciais de primeira ordem acopladas (pelos elementos de
matriz da perturbação Vkp ) permitem-nos determinar, perturbativamente, os coeficientes
ck (t). Vejamos como.
Primeiro observamos que se λV̂ (t) = 0, as equações deixam de estar acopladas. Neste
caso a solução é muito simples:
cn (t) = bn e−iEn t/~ ,
(11.2.119)
onde bn são constantes que dependem das condições iniciais. Por exemplo, com a condição
(11.2.113), teremos bi = 1 e bj = 0 para j 6= i.
Se λV̂ (t) não for zero mas ainda assim for muito pequeno (i.e. λ ≪ 1 sendo os elementos
de matriz de V̂ (t) da ordem dos de Ĥ0 ), a solução deverá ser ainda próxima de (11.2.119).
Tomamos como forma para esta solução
cn (t) = bn (t)e−iEn t/~ ,
(11.2.120)
e esperamos que bn (t) sejam funções que variam lentamente com o tempo. Inserindo
(11.2.120) em (11.2.118) obtemos
X
d
bn (t) e−iEn t/~ = λ
Vnp (t)bp (t)e−iEp t/~ .
i~
dt
p
(11.2.121)
11.2 Teoria das Perturbações dependentes do tempo
371
Multiplicando ambos os lados por eiEn t/~ e introduzindo a frequência angular de Bohr :
ωnp =
En − Ep
,
~
X
(11.2.122)
obtemos
i~
d
bn (t)
dt
=λ
Vnp (t)bp (t)eiωnp t .
(11.2.123)
p
Este sistema de equações é rigorosamente equivalente à equação de Schrödinger, dado
que ainda não introduzimos qualquer aproximação. Mas como em geral não conseguimos
encontrar uma solução exacta de (11.2.123), teremos de recorrer a métodos de aproximação.
Dado que λ ≪ 1 fazemos uma expansão em série de potências para bn (t)
bn (t) =
b0n (t)
+
λb1n (t)
+
λ2 b2n (t)
+ ... =
+∞
X
λk bkn (t) ;
(11.2.124)
k=0
esperamos que esta expansão convirja rapidamente, permitindo-nos truncá-la numa dada
ordem para obter uma solução aproximada. Substituindo esta expansão em (11.2.123)
obtemos
+∞
i~
d X k k
λ bn (t)
dt
k=0
!
=
X
Vnp (t)
p
+∞
X
λk+1 bkp (t)eiωnp t ;
(11.2.125)
k=0
igualando as potências de λ temos:
• Ordem λ0 :
i~
d 0
b (t) = 0 .
dt n
(11.2.126)
Isto é, b0n não depende do tempo. Este é o resultado esperado para λ = 0;
• Ordem λk , k ≥ 1:
i~
X
d k
bn (t) =
Vnp (t)eiωnp t bpk−1 .
dt
p
(11.2.127)
Obtemos, pois, uma relação de recorrência: inserindo a solução de ordem zero em
(11.2.127), obtemos a solução de primeira ordem, que por sua vez inserida no lado
direito de (11.2.127) origina a relação de segunda ordem, etc.
372
Métodos perturbativos independentes e dependentes do tempo
Examinemos em detalhe a solução até primeira ordem. Assumimos, tal como referido
anteriormente, que para t < 0 o sistema se encontra no estado |Φi i. Em t = 0 existe uma
descontinuidade no Hamiltoniano, pois
t=0
Ĥ = Ĥ0 −→ Ĥ = Ĥ0 + λV̂ (t) ;
mas dado que a descontinuidade é finita, a função de onda é contı́nua em t = 0. A condição
inicial é
bn (t = 0) = δni
A equação (11.2.126) implica que
⇒


 b0n (t = 0) = δni ,
(11.2.128)

 bk (t = 0) = 0 , k ≥ 1 .
n
b0n (t) = δni ,
t≥0,
(11.2.129)
o que determina a solução de ordem zero. Introduzindo esta solução em (11.2.127) com
k = 1 temos
i~
X
d 1
bn (t) =
Vnp (t)eiωnp t δpi = Vni (t)eiωni t .
dt
p
(11.2.130)
Levando em conta a condição inicial b1n (t = 0) = 0, obtemos
Z
1 t
′
1
bn (t) =
Vni(t′ )eiωni t dt′ .
i~ 0
(11.2.131)
Logo, o estado do sistema em primeira ordem em λ é



|Φi i , t < 0 ,


!
(
)
|Ψ(t)i =
X Z t
λ
′


e−iEn t/~ + O(λ2 ) |Φn i ,
Vni (t′ )eiωni t dt′

δni +

i~ n
0
t≥0.
(11.2.132)
Note que a função de onda está normalizada apenas em primeira ordem em λ. A perturbação mistura |Φi i com todos os outros estados próprios de Ĥ0 , |Φn i, para os quais
Vni 6= 0. A probabilidade de transição para um estado final |Φf i é dada por
Pif (t) = |hΦf |Ψ(t)i|2 = |hΦf |
X
n
cn (t)|Φn i|2 = |cf (t)|2
(11.2.120)
=
|bf (t)|2 .
(11.2.133)
11.2 Teoria das Perturbações dependentes do tempo
373
Queremos considerar uma transição induzida pela perturbação Ŵ (t); logo consideramos o
estado final diferente do inicial. Em primeira ordem
Z
λ t
′
Vf i (t′ )eiωf i t dt′ + O(λ2 ) ,
bf (t) = 0 +
i~ 0
e como tal
1
Pif (t) = 2
~
Z
(11.2.134)
2
t
′
Wf i (t′ )eiωf i t dt′
0
,
i 6= f .
(11.2.135)
Alguns comentários:
• Para t fixo e considerando Pif como função de Ef , a probabilidade de transição é proporcional ao quadrado do módulo da transformada de Fourier da perturbação (à
semelhança do que acontece com a aproximação de Born (10.2.28));
• A probabilidade de transição é zero, nesta ordem, se Wf i (t′ ) = 0, ∀t′ ∈ [0, t];
• A aproximação de primeira ordem resulta de substituir na equação de Schrödinger
(11.2.123), bp (t) pelos seus valores em t = 0. É natural que esta seja uma boa
aproximação para t pequeno, mas para t grande em princı́pio teremos de considerar
termos de ordem λ2 , λ3 , etc, que deverão ser importantes.
11.2.3
Aplicação a uma perturbação sinusoidal ou constante
Como aplicação do formalismo desenvolvido na secção anterior consideramos uma perturbação com uma das seguintes formas:
V̂ (t) = V̂ sin ωt
∨
V̂ (t) = V̂ cos ωt ,
(11.2.136)
onde V̂ é uma observável independente do tempo e ω é uma frequência angular constante.
Este tipo de perturbação é a que se encontra, por exemplo, na interacção de uma onda
electromagnética monocromática de frequência ω com um sistema fı́sico. Neste caso, Pif (t)
representará a probabilidade de transição |Φi i −→ |Φf i induzida pela radiação incidente.
Algo ingenuamente poderı́amos ser levados a pensar que esta transição seria possı́vel se
e só se ω = ±ωf i . Isto é, que Pif para t fixo e como função de ω teria dois picos (tipo
374
Métodos perturbativos independentes e dependentes do tempo
delta de Dirac) em ω = ±ωf i , sendo zero para outros ω. Contudo, devido ao princı́pio da
incerteza a situação é um pouco diferente, como agora demonstramos.
Na base dos estados estacionários do Hamiltoniano não perturbado, podemos escrever
os elementos de matriz da primeira perturbação em (11.2.136) como
hΦf |V̂ (t)|Φi i = hΦf |V̂ |Φi i sin ωt ≡ Vf i sin ωt = Vf i
eiωt − e−iωt
.
2i
(11.2.137)
Substituindo na fórmula geral (11.2.131)
Z
′
′
ei(ωf i +ω)t − ei(ωf i −ω)t ′
Vf i ei(ωf i +ω)t − 1 ei(ωf i −ω)t − 1
1 t
1
.
Vf i
dt = −
−
bf (t) =
i~ 0
2i
2i~
ωf i + ω
ωf i − ω
(11.2.138)
Usando (11.2.133), temos em primeira ordem
Pif (t) = |bf (t)|2 = λ2 |b1f (t)|2 ,
(11.2.139)
que no caso em estudo depende também do parâmetro da perturbação ω, pelo que escrevemos
|Wf i |2 1 − ei(ωf i +ω)t 1 − ei(ωf i −ω)t
Pif (t, ω) =
∓
4~2
ωf i + ω
ωf i − ω
2
.
(11.2.140)
O sinal inferior refere-se ao resultado do mesmo cálculo usando a segunda perturbação
(V̂ (t) = V̂ cos ωt) em (11.2.136), em vez da primeira. Para uso posterior consideramos
essa perturbação (i.e o cos) no limite ω = 0 em que obtemos uma perturbação constante,
para a qual, o resultado é
ω t
|Wf i |2 sin2 f2i
|Wf i |2
iωf i t 2
| =
.
Pif (t) = 2 2 |1 − e
ωf i 2
ωf i ~
~2
(11.2.141)
2
Vamos agora considerar dois casos distintos:
1) Quando ambos os estados |Φi i e |Φf i pertencem a um espectro discreto;
2) Quando |Φf i pertence a um contı́nuo de estados finais.
No primeiro caso Pif representa uma probabilidade, enquanto que no segundo representa
uma densidade de probabilidade.
11.2 Teoria das Perturbações dependentes do tempo
375
1) Perturbação sinusoidal que acopla dois estados discretos: um fenómeno de
ressonância
Fixemos o tempo t, de modo a considerarmos a probabilidade Pif (t, ω) como função apenas
da frequência ω. A análise de (11.2.140) envolve analisarmos os termos
t
1 − ei(ωf i ±ω)t
i(ωf i ±ω)t/2 sin (ωf i ± ω) 2
= −ie
.
A± =
ωf i ± ω
(ωf i ± ω)/2
(11.2.142)
Se ω ≃ ±ωf i , o denominador de A∓ fica aproximadamente zero. Se simultaneamente t
for suficientemente elevado, o argumento do seno no numerador de A∓ não é aproximadamente zero. Nestas condições esperamos que A∓ domine em (11.2.140) sobre A± ; o primeiro
e o último designam-se por, respectivamente, termo ressonante e termo anti-ressonante.
Estabelecemos desde já, o seguinte critério quantitativo que comentaremos graficamente
em baixo: se
i)
|ω ∓ ωf i | ≪ |ωf i| ,
ii)
1 ≪ t|ωf i | ,
(11.2.143)
podemos negligenciar A± em (11.2.140); obtemos então:
|Wf i |2
Pif (t, ω) ≃
4~2
sin (ωf i ∓ ω) 2t
(ωf i ∓ ω)/2
!2
.
(11.2.144)
Para t fixo representamos Pif (t, ω) em função de ω na figura 11.3, para ω ≃ ωf i . Notese o fenómeno de ressonância para Pif (t, ω) quando ω = ωf i . Para ω ≃ −ωf i existe um
fenómeno semelhante de ressonância em ω = −ωf i , sendo o gráfico respectivo o simétrico
relativamente ao eixo w = 0 da figura 11.3.
Podemos compreender graficamente o significado das aproximações i) e ii) (11.2.143):
i) significa que estamos a considerar o gráfico de Pif (t, ω) na região em que ω está próxima
do pico (logo próxima de ωf i ); ii) significa que as zonas do gráfico de (11.2.140) em que
A+ e A− dominam estão bem separadas; isto é
2|ωf i| ≫ ∆ω ⇔ |ωf i| ≫
2π
⇔ |ωf i|t ≫ 1 .
t
Fisicamente, esta condição significa que temos de esperar tempo suficiente para o sistema
perceber que a perturbação é sinusoidal.
376
Métodos perturbativos independentes e dependentes do tempo
Figura 11.3: Probabilidade de transição Pif (t, ω) em função de ω para t fixo. Existe um
fenómeno de ressonância quando ω = ωf i . A curva apresenta um “padrão de difracção”.
Pif (t, ω) tem zeros em ωf i −ω = 2nπ/t; logo, a largura da ressonância, ∆ω, estimada como
a distância entre os dois zeros de Pif (t, ω) que rodeiam o máximo é ∆ω = 4π/t (Extraı́do
de Cohen et al, ‘Quantum Mechanics’).
Notemos a diferente interpretação fı́sica das duas ressonâncias de Pif . A ressonância
em ω = ωf i corresponde a um processo com Ef > Ei , ou seja a excitação do sistema pela
absorção de um fotão enquanto que a ressonância em ω = −ωf i corresponde a um processo
com Ef < Ei , ou seja o decaimento do sistema pela emissão de um fotão - figura 11.4.
Ef
|Φf i
Ef
γ
γ
Ei
|Φf i
|Φi i
Ei
|Φi i
Figura 11.4: As ressonâncias para ω = ±ωf i têm interpretações de absorção (ω = ωf i ) esquerda - ou emissão (ω = −ωf i ) - direita - de um fotão.
Comentários:
• Pif (t, ω) tem máximos em ω = ±ωif , correspondendo à absorção/emissão de fotões
11.2 Teoria das Perturbações dependentes do tempo
377
com a frequência de Bohr; mas as ressonâncias têm largura, ∆ω, estimada como a
distância entre os dois zeros de Pif (t, ω) que rodeiam o máximo. Esta largura pode
ser entendida como uma manifestação da relação de incerteza para tempo e energia.
Se tentassemos medir a diferença de energia Ef − Ei = ~ωf i , aplicando uma onda
electromagnética, variando ω e tentando encontrar a ressonância, obteriamos uma
incerteza na energia:
∆E = ~∆ω ≃ ~
4π
t
⇒ ∆E∆t & ~ ,
para uma perturbação que actuou um tempo ∆t. Logo, para medir a diferença de
energia Ef − Ei com incerteza nula ∆E = 0, teriamos de deixar actuar a perturbação
durante um tempo infinito.
• No final da secção anterior comentamos que a aproximação de primeira ordem deixará
de ser válida para t grande. No entanto, neste exemplo requeremos que t seja suficientemente grande na aproximação que usamos, o que poderá parecer incompatı́vel.
De facto, que t não poderá ser demasiado grande é manifesto em que (de (11.2.144)
usando limx→0 sin x/x)
Pif (t; ω = ωf i ) =
|Wf i |2 t2
4~2
t→+∞
−→
+∞ ;
em particular a probabilidade torna-se maior do que 1, o que não faz sentido. Necessitamos por isso de impôr
|Wf i |t
≪1;
~
o estudo das próximas ordens perturbativas revela que esta condição é, de facto,
necessária, se bem que não suficiente, para garantir a validade da análise de primeira
ordem aqui feita.
• Analisando o gráfico da figura 11.3 vemos que a altura da ressonância depende de Wf i .
Se a perturbação tiver elementos de matriz Wf i diferentes para diferentes linhas
espectrais, podemos compreender porque é que algumas linhas espectrais são mais
378
Métodos perturbativos independentes e dependentes do tempo
intensas do que outras. Esta era uma lacuna importante na teoria de Bohr (capı́tulo
2), que a Mecânica Quântica resolve.
• No caso de uma perturbação constante, Pif (t, ω) é dado por (11.2.141) que tem uma
ressonância para ω = 0 - figura 11.5, de modo a conservar a energia do sistema.
Note-se que a largura da ressonância é a mesma que antes, mas a altura é 4 vezes
superior, devido à interferência construtiva entre termo ressonante e anti-ressonante.
Figura 11.5: Pif (t, ω) para t constante como função de ω (Extraı́do de Cohen et al, ‘Quantum Mechanics’).
2) Acoplamento entre estados de um espectro contı́nuo
Se a energia Ef pertencer a uma zona contı́nua do espectro de Ĥ0 , temos de interpretar
|hΦf |Ψi|2 como uma densidade de probabilidade. A probabilidade fı́sica é obtida integrando
esta densidade de probabilidade sobre uma conjunto de estados finais. Esta integração
introduz uma medida, denominada densidade de estados finais ρ(E), como explicamos
com o seguinte exemplo.
Consideramos o problema da difusão de uma partı́cula sem spin, de massa m por um
potencial W (~r). No instante t, o estado |Ψ(t)i pode ser expandido na representação |~pi,
correspondendo a estados com momento bem definido p~, energia E = p~2 /2m e função de
11.2 Teoria das Perturbações dependentes do tempo
379
onda espacial
h~r|~pi =
1
2π~
3/2
ei~p·~r/~ .
Se o estado |Ψ(t)i estiver normalizado, a densidade de probabilidade associada ao momento
~p é
d3 P(~p) = |h~p|Ψ(t)i|2 d3 ~p .
Conceptualmente podemos, numa experiência, programar um detector para dar sinal quando
a partı́cula difundida tiver um momento ~pf . Mas na prática, o detector terá uma abertura
finita e o seu filtro de energia não será perfeito; dará sinal sempre que o momento da
partı́cula difundida estiver num ângulo sólido δΩf , em torno de p~f e a sua energia num
intervalo δEf centrada em p~2f /2m. Seja Df o domı́nio no espaço de momentos definido por
estas condições. A probabilidade de obter um sinal do detector é
Z
δP(~pf , t) =
|h~p|Ψ(t)i|2d3 p~ .
p
~∈Df
Mudamos a variável de integração de momento para energia:
d3 p~ = p2 dpdΩ ≡ ρ(E)dEdΩ ,
onde, genericamente, ρ(E) é a densidade de estados finais. No exemplo que estamos a
considerar,
p2
E=
2m
⇒
logo identificando p2 dp ≡ ρ(E)dE lêmos
ρ(E) = p2
dp =
r
m
dE ;
2E
√
dp
= 2Em3 .
dE
(11.2.145)
(11.2.146)
Em termos de um integral na energia, a probabilidade de o detector dar sinal é
Z
δP(~pf , t) =
|h~p|Ψ(t)i|2 ρ(E)dΩdE .
(11.2.147)
Ω∈δΩf ,E∈δEf
A densidade de estados funciona pois como uma medida de integração.
Consideramos agora o caso geral. Tomamos um contı́nuo de estados estacionários de
Ĥ0 , rotulados por um conjunto de números quânticos que denotamos por α. Estes estados
380
Métodos perturbativos independentes e dependentes do tempo
obedecem a
hα|α′i = δ(α − α′ ) .
A probabilidade de encontrar o sistema num dado grupo de estados finais, denominado
Df , com um conjunto de valores de α centrados à volta de αf é
Z
δP(αf , t) =
dα|hα|Ψ(t)i|2 .
(11.2.148)
α∈Df
Tal como no exemplo anterior, mudamos de variável de integração para a energia, o que
introduz uma medida de integração ρ(β, E), que é uma densidade de estados finais que
pode depender de outros números quânticos que designamos genericamente por β (que
existirão caso Ĥ0 não constitua, per se, o C.C.O.C.):
dα = ρ(β, E)dβdE .
Mudando da base {|αi} para a base {|β, Ei} e sendo o domı́nio Df caracterizado, na nova
base, por β ∈ δβf e E ∈ δEf , a probabilidade (11.2.148) fica
Z
δP(αf , t) =
dβdEρ(β, E)|hβ, E|Ψ(t)i|2 .
(11.2.149)
β∈δβf ,E∈δEf
Usando esta expressão vamos agora deduzir um importante resultado para a probabilidade
de transição por unidade de tempo, denominado Regra de Ouro de Fermi.
Consideramos que o sistema se encontra num estado próprio |Φi i de Ĥ0 . Vimos anteriormente que para o caso de uma perturbação constante a probabilidade de transição
|Φi i −→ |Φf i é (11.2.141):
ω t
|Wf i |2 sin2 f2i
Pif (t) =
,
ωf i 2
~2
(11.2.150)
2
que reescrevemos na forma
|hΦf |Ψ(t)i|2 =
|hΦf |Ŵ |Φi i|2
F (t, ωf i ) .
~2
(11.2.151)
O cálculo que nos levou a esta fórmula permanece válido se em vez de calcular hΦf |Ψ(t)i
tivessemos calculado hβ, E|Ψ(t)i, onde |β, Ei pertence a um contı́nuo de estados finais;
neste caso o resultado é reescrito
|hβ, E|Ŵ |Φi i|2
F
|hβ, E|Ψ(t)i| =
~2
2
E − Ei
.
t,
~
(11.2.152)
11.2 Teoria das Perturbações dependentes do tempo
381
Usando (11.2.149) obtemos, para a probabilidade de transição de |Φi i para um conjunto
de estados num domı́nio em torno do estado com energia Ef e outros números quânticos
βf (isto é αf )
1
δP(Φi , αf , t) = 2
~
Z
2
β∈δβf ,E∈δEf
dβdEρ(β, E)|hβ, E|Ŵ |Φi i| F
E − Ei
t,
~
.
(11.2.153)
Analisemos a função
F
E − Ei
t,
~
≡
E−Ei
t
2~
2
E−Ei
2~
sin2
,
para t fixo em função de ωf i . Para t suficientemente grande, esta função pode ser aproximada por um delta de Dirac, centrado em E = Ei . De facto, uma das funções que aproxima
um delta de Dirac é:
δǫ (x) = ǫ
sin2 xǫ
,
x2
δǫ (x)
.
ǫ→0
π
δ(x) = lim
Na figura 11.6 representamos δǫ (x) para diferentes valores de ǫ.
Figura 11.6: δǫ (x) para ǫ = 1, 0.5, 0.25, respectivamente.
Tomando ǫ = 1/t, x = (E − Ei )/2~, temos
δ
E − Ei
2~
Logo, para t elevado
i
t
E − Ei
1 sin2 E−E
1
2~
= lim
.
= lim F t,
E−Ei 2
t→∞ tπ
t→∞ tπ
~
2~
F
E − Ei
t,
~
≃ tπδ
E − Ei
2~
.
382
Métodos perturbativos independentes e dependentes do tempo
Usando ainda que para a função delta de Dirac
δ(cx) =
1
δ(x) ,
|c|
obtemos, para t elevado,
E − Ei
≃ 2~tπδ(E − Ei ) .
F t,
~
(11.2.154)
Vamos concentrar-nos numa perturbação constante e consideramos as seguintes aproximações:
• t é suficientemente elevado para (11.2.154) ser uma boa aproximação;
• t é suficientemente pequeno para o tratamento perturbativo de primeira ordem ser boa
aproximação; isto significa que os coeficientes bnf (t) não variam demasiado rapida-
mente com t; concretamente, se considerarmos b1f (t), temos, por (11.2.131) e para
uma perturbação constante
Z
Vf i t iωf i t′ ′
Vf i iωf i t/2
ωf i t
1
bf (t) =
e
dt = −2i
e
sin
.
i~ 0
ωf i
2
(11.2.155)
Para esta quantidade não variar “demasiado rapidamente” tomamos
ωf i t
2~
≪ 1 ⇔ Ef − Ei ≪
,
2
t
(11.2.156)
que corresponde a frequência de Bohr pequena. Assim, depois de fixar t suficientemente grande para (11.2.154) ser uma boa aproximação tomamos Ef suficientemente
próximo de Ei .
• No pequeno intervalo de estados finais que resulta das condições da alı́nea anterior,
assumimos que δβf é pequeno, pelo que a integração em β é desnecessária.
Sob tais condições, (11.2.153) fica

 δβ 2πt |hβ , E = E |Ŵ |Φ i|2 ρ(β , E = E ) , se E ∈ δE ,
f
f
i
i
f
f
i
i
f
f ~
δP(Φi , αf , t) =
 0 , se E ∈
/ δE .
i
f
(11.2.157)
11.2 Teoria das Perturbações dependentes do tempo
383
Ou seja, a perturbação constante só pode induzir transições entre nı́veis com a mesma
energia, a menos de uma largura δEf igual a 2π~/t (estimada como a distância entre zeros
consecutivos de F (t, (E − Ei )/~)), que resulta da incerteza tempo/energia.
Como a probabilidade aumenta linearmente com o tempo6 , a probabilidade de transição
por unidade de tempo é constante. A densidade de probabilidade de transição, por unidade
de tempo e por unidade da variável βf é:
p(Φi , αf ) =
2π
d δP(Φi , αf , t)
=
|hβf , Ef = Ei |Ŵ |Φi i|2 ρ(βf , Ef = Ei ) .
dt
δβf
~
(11.2.158)
Esta é a Regra de Ouro de Fermi (ou, mais correctamente Fermi-Dirac, pois foi Dirac quem
fez grande parte do trabalho que levou a esta regra). Mais esquematicamente
pi→f =
2π
|Wf i |2 ρf .
~
(11.2.159)
Note-se que esta regra se aplica a perturbações independentes do tempo, embora seja
derivada usando o formalismo de teoria de perturbações dependentes do tempo.
Existem muitas aplicações de importância da regra de ouro de Fermi nesta forma; mas
a regra pode ser generalizada para perturbações dependentes do tempo. Por exemplo,
se em vez de termos considerado a perturbação constante tivéssemos considerado uma
perturbação sinusoidal (11.2.136), que acopla |Φi i a um contı́nuo de estados |βf , Ef i, com
energias próximas de Ei + ~ω, terı́amos obtido
p(Φi , αf ) =
π
|hβf , Ef = Ei + ~ω|Ŵ |Φi i|2 ρ(βf , Ef = Ei + ~ω) .
2~
(11.2.160)
Entre as aplicações da regra de ouro de Fermi encontram-se os cálculos de secção eficaz
de difusão e probabilidades de decaimento (como o decaimento beta). Como exemplo de
aplicação consideramos de seguida um cálculo de difusão.
Exemplo: Derivação da aproximação de Born para a secção eficaz de difusão pela
regra de ouro de Fermi.
6
O que será válido apenas para tempos pequenos e é o resultado esperado para uma perturbação
constante.
384
Métodos perturbativos independentes e dependentes do tempo
Consideramos a difusão de uma partı́cula por um potencial Ŵ , cujos elementos de
matriz, na representação {|~ri} são dados por
h~r|Ŵ |~r′ i = W (~r)δ(~r − ~r′ ) .
Assumimos que o estado inicial do sistema é um estado próprio do momento:
|Ψ(t = 0)i = |~pii .
(11.2.161)
Vamos calcular a probabilidade de transição desta partı́cula (i.e a difusão pelo potencial)
para estados com momento p~ em torno de p~f (|~pi | = |~pf |) por unidade de tempo e de ângulo
sólido. Pela regra de ouro de Fermi (11.2.158)
p(~pi , ~pf ) =
2π
|h~pf |Ŵ |~pi i|2 ρ(Ef = Ei ) ;
~
usamos
h~pf |Ŵ |~pi i =
=
=
Z Z
Z Z
d~rd~r′ h~pf |~rih~r|Ŵ |~r′ih~r′ |~pii
′
d~rd~r
3 Z
1
2π~
1
2π~
3/2
−i~
pf ·~
r/~
e
1
W (~r)δ(~r − ~r )
2π~
′
3/2
′
ei~pi ·~r /~
d~rei(~pi −~pf )·~r/~W (~r) ;
e levando em consideração (11.2.146) obtemos
Z
2
√
2π
i(~
pi −~
pf )·~
r /~
p(~pi , p~f ) =
2mE .
m
d~
r
e
W
(~
r
)
~(2π~)6
(11.2.162)
A secção eficaz diferencial de difusão foi definida por (10.1.1)
dn = σ(θ, φ)FidΩ ,
(11.2.163)
e portanto
σ(θ, φ) =
dn
,
Fi dΩ
[σ] = L2 ,
que corresponde um “número de partı́culas detectadas por unidade de tempo, fluxo incidente e ângulo sólido”. Comparando com
p(~pi , ~pf ) ,
[p] =
1
,
T
11.2 Teoria das Perturbações dependentes do tempo
385
que corresponde a uma “probabilidade de transição por unidade de tempo e ângulo sólido”,
concluimos que para identificar p(~pi , p~f ) com σ(θ, φ) necessitamos de dividir a primeira
quantidade por um “fluxo”. O candidato natural é o vector densidade de corrente de
probabilidade J~i para as partı́culas incidentes:
~
1
1
∗
~
[J~] = [Fluxo] =
.
Ji (~r) = Re Φ (~r) ∇Φ(~r) ,
m
i
T L2
Para
Φ(~r) =
1
2π~
3/2
(11.2.164)
ei~pi ·~r/~ ,
obtemos
J~i =
p~i
m(2π~)3
|J~i| =
⇒
Assim
m2
p(~pi , ~pf )
= 2 4
4π ~
|J~i |
Z
p
1
2Ei m .
m(2π~)3
2
d3~rei(~pi −~pf )·~r/~W (~r)
,
(11.2.165)
que coincide com a fórmula para σ(θ, φ) na aproximação de Born (10.2.28).
11.2.4
Probabilidade de transição via operador de evolução
A probabilidade de transição (11.2.135), pode ser obtida por um outro método que tem
a vantagem de se tornar mais simples em ordens superiores à primeira. A razão é que
este outro método emprega uma técnica de diagramas, bastante intuitivos, para construir
as amplitudes de transição em cada ordem. O método em questão, que iremos agora
estudar, usa o operador de evolução Û(t, t0 ), introduzido na secção 4.5.3, para deduzir a
probabilidade de transição Pif (t). Este método levará naturalmente a uma interpretação
gráfica da série perturbativa, no espı́rito dos diagramas de Feynman usados em Teoria
Quântica de Campo. Com este objectivo começaremos por discutir as várias representações
da Mecânica Quântica.
As representações de Schrödinger, Heisenberg e Interacção
O formalismo com que temos estudado a Mecânica Quântica contém:
• Operadores (observáveis) genericamente independentes do tempo: R̂, P̂ , etc.
386
Métodos perturbativos independentes e dependentes do tempo
• Um estado genericamente dependente do tempo, |Ψ(t)i, que nesta secção denotamos
|ΨS (t)i.
A evolução do sistema está inteiramente contida na evolução do estado |ΨS (t)i e é determinada pela equação de Schrödinger; por isso este formalismo é denominado representação
de Schrödinger.
O operador de evolução Û (t, t0 ) depende do tempo e podemos usa-lo para construir um
formalismo em que:
• Operadores (observáveis) serão dependentes do tempo;
• O estado será independente do tempo, sendo denotado por |ΨH i;
Este formalismo é denominado representação de Heisenberg. A unitariedade do operador
de evolução garante que as previsões da Mecânica Quântica (probabilidades e valores esperados) feitas nas duas representações são perfeitamente equivalentes. Para confirmarmos
que assim é consideremos, mais explicitamente, a relação entre os dois formalismos.
Por definição, o operador de evolução relaciona o estado do sistema em dois instantes
diferentes do seguinte modo:
|ΨS (t)i = Û (t, t0 )|ΨS (t0 )i .
(11.2.166)
O estado na representação de Heisenberg é introduzido como
|ΨH i ≡ |ΨS (t0 )i = Û † (t, t0 )|ΨS (t)i ,
(11.2.167)
onde usamos a unitariedade do operador de evolução. Isto é, o estado na representação de
Heisenberg é o estado inicial na representação de Schrödinger e como tal é independente
do tempo.
Consideramos agora um operador genérico na representação de Schrödinger, que poderá
ou não depender do tempo e que denotamos por ÂS (t). O seu valor esperado no estado
|ΨS (t)i é dado por
hÂi(t) = hΨS (t)|ÂS (t)|ΨS (t)i = hΨS (t0 )|Û † (t, t0 )ÂS (t)Û(t, t0 )|ΨS (t0 )i .
(11.2.168)
11.2 Teoria das Perturbações dependentes do tempo
387
Na representação de Heisenberg, a mesma observável será representada pelo operador
ÂH (t), e o seu valor esperado será
hÂi(t) = hΨH |ÂH (t)|ΨH i .
(11.2.169)
Requerendo que (11.2.168) e (11.2.169) sejam equivalentes obtemos
ÂH (t) = Û † (t, t0 )ÂS (t)Û (t, t0 ) ,
(11.2.170)
que genericamente depende do tempo, mesmo que ÂS não dependa.
Calculemos agora a evolução temporal de um operador na representação de Heisenberg.
Como cálculo preliminar derivamos (11.2.166) em ordem ao tempo
d
d
i~ |ΨS (t)i = i~ Û (t, t0 ) |ΨS (t0 )i ,
dt
dt
(11.2.171)
dado que |ΨS (t0 )i não depende do tempo; substituindo o lado esquerdo pelo uso da equação
de Schrödinger na forma
i~
d
|ΨS (t)i = ĤS (t)Û (t, t0 )|ΨS (t0 )i ,
dt
(11.2.172)
obtém-se
1
d
Û(t, t0 ) = ĤS (t)Û(t, t0 ) .
dt
i~
(11.2.173)
d †
1
Û (t, t0 ) = − Û † (t, t0 )ĤS (t) .
dt
i~
(11.2.174)
A equação adjunta é
Derivamos agora (11.2.170) em ordem ao tempo; usando (11.2.173) e (11.2.174) obtemos
d
ÂH (t) =
dt
1
dÂS (t)
1
− Û † (t, t0 )ĤS (t)ÂS (t)Û (t, t0 ) + Û † (t, t0 )
Û(t, t0 ) + Û † (t, t0 )ÂS (t)ĤS (t)Û (t, t0 ) ;
i~
dt
i~
(11.2.175)
Introduzindo 1̂ = Û (t, t0 )Û † (t, t0 ) no primeiro e terceiro termo do lado direito entre os
operadores ÂS e ĤS obtemos:
h
i
d
i~ ÂH (t) = ÂH (t), ĤH (t) + i~
dt
dÂS (t)
dt
!
.
H
(11.2.176)
388
Métodos perturbativos independentes e dependentes do tempo
Esta é a equação de evolução na representação de Heisenberg. Do mesmo modo que,
na representação de Schrödinger, toda a informação sobre a evolução do sistema (contida em |ΨS (t)i) é dada pela equação de Schrödinger, na representação de Heisenberg,
toda a informação sobre a evolução do sistema (contida em ÂH (t)) é dada pela equação
(11.2.176).7 Note-se a semelhança formal entre (11.2.176) e (1.3.28); na representação
de Schrödinger uma tal semelhança existe apenas para a evolução dos valores médios de
observáveis (4.4.59).
Existe uma terceira representação, que é introduzida para lidar com perturbações a um
sistema cuja solução exacta é conhecida: a representação de interacção. Consideremos o
Hamiltoniano:
Ĥ = Ĥ0 (t) + Ŵ (t) .
(11.2.177)
Seja Û0 (t, t0 ) o operador de evolução do Hamiltoniano não perturbado Ĥ0 (t); isto é, se
Ŵ (t) = 0, então
|ΨS (t)i = Û0 (t, t0 )|ΨS (t0 )i .
(11.2.178)
Seja Û (t, t0 ) o operador de evolução do Hamiltoniano total; então
|ΨS (t)i = Û (t, t0 )|ΨS (t0 )i .
(11.2.179)
Definimos o estado do sistema na representação de interacção |ΨI (t)i como
|ΨS (t)i = Û0 (t, t0 )|ΨI (t)i ⇔ |ΨI (t)i = Û0† (t, t0 )|ΨS (t)i ,
(11.2.180)
em que t0 é o instante em que a perturbação começou a actuar. Note-se a semelhança com
(11.2.167), substituindo Û ↔ Û0 , o que nos leva a concluir que se o Hamiltoniano fosse
apenas o Hamiltoniano no perturbado, o estado de interacção coincidiria com o estado de
Heisenberg e seria constante. Para verificarmos isto calculemos a evolução do estado na
representação de interacção:
d
d
d †
†
i~ |ΨI (t)i = i~ Û0 (t, t0 ) |ΨS (t)i + Û0 (t, t0 ) i~ |ΨS (t)i .
dt
dt
dt
7
(11.2.181)
Historicamente, as duas representações aparecem no mesmo ano, 1925, com a equação de Schrödinger
e a mecânica matricial de Heisenberg. A equivalência foi provada por Schrödinger em Março de 1926 no
artigo ‘Über das Verhältnis der Heisenberg-Born-Jordanschen Quantenmechanik zu der meinen’.
11.2 Teoria das Perturbações dependentes do tempo
389
Usando o análogo de (11.2.174) para Û0 ,
i~
d †
Û0 (t, t0 ) = −Û0† (t, t0 )Ĥ0 (t) ,
dt
(11.2.182)
no primeiro termo do lado direito e a equação de Schrödinger
i~
d
|ΨS (t)i = (Ĥ0 (t) + Ŵ (t))|ΨS (t)i ,
dt
(11.2.183)
para o segundo termo, (11.2.181) toma a forma:
i~
d
|ΨI (t)i = Û0† (t, t0 )Ŵ (t)Û0 (t, t0 )|ΨI (t)i ≡ ŴI (t)|ΨI (t)i .
dt
(11.2.184)
Note-se que a relação de ŴI com Ŵ , i.e. da perturbação na representação de interacção
e na representação de Schrödinger é semelhante à relação dos operadores na representação
de Heisenberg e de Schrödinger (11.2.170), mais uma vez substituindo Û ↔ Û0 . Esta é a
equação de evolução na representação de interacção. Se Ŵ = 0, então |ΨI (t)i = constante;
por (11.2.180)
|ΨS (t)i = Û0 (t, t0 )|ΨI (t)i ,
(11.2.185)
pelo que podemos interpretar o estado constante no tempo como |ΨI (t)i = |ΨS (t0 )i =
|ΨH i; logo interpretamos o estado de interacção como a evolução de |ΨS (t0 )i devida somente à perturbação, como ilustrado na figura 11.7.
Ĥ0
Û0 (t, t0 )|ΨS (t0 )i
Ŵ (t)
|ΨI (t)i
|ΨS (t0 )i
Figura 11.7: Evolução do estado |ΨS (t0 )i, separando as contribuições do Hamiltoniano
não perturbado Ĥ0 e da perturbação Ŵ (t). Se Ŵ (t) ≪ Ĥ0 esperamos que a evolução de
|ΨI (t)i seja muito mais lenta do que a de Û0 (t, t0 )|ΨS (t0 )i.
Podemos integrar, formalmente, a equação (11.2.184), obtendo
1
|ΨI (t)i = |ΨI (t0 )i +
i~
Z
t
t0
dt′ ŴI (t′ )|ΨI (t′ )i ;
(11.2.186)
390
Métodos perturbativos independentes e dependentes do tempo
onde |ΨI (t0 )i = |ΨS (t0 )i. Substituindo esta equação nela própria repetidamente obtemos:
|ΨI (t)i =
1
1̂ +
i~
t
Z
t0
1
dt′ ŴI (t′ ) +
(i~)2
Z
t
dt′ ŴI (t′ )
t0
!
t′
Z
t0
dt′′ ŴI (t′′ ) + . . . |ΨI (t0 )i ,
(11.2.187)
ou
|ΨI (t)i = ÛI (t, t0 )|ΨI (t0 )i ,
(11.2.188)
que define o operador de evolução na representação de interacção. Usando (11.2.180) temos
|ΨI (t)i = Û0† (t, t0 )|ΨS (t)i = Û0† (t, t0 )Û (t, t0 )|ΨS (t0 )i = Û0† (t, t0 )Û(t, t0 )|ΨI (t0 )i ;
(11.2.189)
comparando com (11.2.187) deduzimos que
ÛI (t, t0 ) = Û0† (t, t0 )Û (t, t0 ) .
(11.2.190)
Esta relação permite-nos mostrar que ÛI (t, t0 ) tem as propriedades adequadas para poder
ser considerado um operador de evolução. De facto, usando que Û0 (t, t0 ) e Û(t, t0 ) são
operadores de evolução demonstra-se que:
a) ÛI (t0 , t0 ) = 1̂;
b) ÛI† (t, t0 )ÛI (t, t0 ) = ÛI (t, t0 )ÛI† (t, t0 ) = 1̂;
c) ÛI (t, t′ ) = ÛI (t, t′′ )ÛI (t′′ , t′ ).
Derivamos agora uma expansão perturbativa para o operador de evolução total. Recordemos a definição do operador de evolução ÛI (t, t0 ) dada em (11.2.187):
1
ÛI (t, t0 ) = 1̂ +
i~
Z
t
t0
1
dt ŴI (t ) +
(i~)2
′
′
Z
t
t0
′
′
dt ŴI (t )
Z
t′
dt′′ ŴI (t′′ ) + . . . ;
(11.2.191)
t0
usando (11.2.190) para o lado esquerdo da equação, a definição de ŴI (t) dada em (11.2.184),
ŴI (t) = Û0† (t, t0 )Ŵ (t)Û0 (t, t0 ) ,
(11.2.192)
11.2 Teoria das Perturbações dependentes do tempo
391
para o lado direito e multiplicando (11.2.191) por Û0 (t, t0 ) obtemos
Z
1 t ′
dt Û0 (t, t0 )Û0† (t′ , t0 )Ŵ (t′ )Û0 (t′ , t0 )
Û (t, t0 ) = Û0 (t, t0 ) +
i~ t0
Z t Z t′
1
dt′′ Û0 (t, t0 )Û0† (t′ , t0 )Ŵ (t′ )Û0 (t′ , t0 )Û0† (t′′ , t0 )Ŵ (t′′ )Û0 (t′′ , t0 ) + . . . ;
dt′
+
2
(i~) t0
t0
(11.2.193)
notando que
Û0† (t′ , t0 ) = Û0 (t0 , t′ ) ,
(11.2.194)
Û0 (t, t0 )Û0† (t′ , t0 ) = Û0 (t, t0 )Û0 (t0 , t′ ) = Û0 (t, t′ ) ,
(11.2.195)
logo
e de um modo semelhante para outras combinações análogas, (11.2.193) toma a forma final
Û(t, t0 ) = Û0 (t, t0 ) +
+∞
X
Û (n) (t, t0 ) ,
(11.2.196)
n=1
onde definimos
Û
(n)
1
(t, t0 ) =
(i~)n
Z
t
dt1
t0
Z
t1
dt2 . . .
Z
tn−1
dtn Û0 (t, t1 )Ŵ (t1 )Û0 (t1 , t2 )Ŵ (t2 ) . . . Ŵ (tn )Û0 (tn , t0 ) ,
t0
t0
(11.2.197)
onde t > t1 > . . . > tn−1 .
Consideremos agora a probabilidade de transição no instante t, tal como discutida na
secção 11.2.1, entre os estados estacionários |Φi i e |Φf i de um Hamiltoniano Ĥ0 independente do tempo, devido a uma perturbação Ŵ (t), ligada em t = 0; em termos do operador
de evolução ela pode ser escrita da forma
2
Pif (t) = |hΦf |Û(t, 0)|Φi i| = |hΦf |Û0 (t, 0) +
+∞
X
n=1
Û (n) (t, 0)|Φii|2 .
(11.2.198)
Em ordem zero necessitamos dos elementos de matriz:
0
hΦf |Û0 (t, 0)|Φi i = hΦf |e−itĤ0 /~|Φi i = e−iEi t/~δif ,
(11.2.199)
392
Métodos perturbativos independentes e dependentes do tempo
onde En0 é o valor próprio de Ĥ0 associado ao estado próprio |Φn i. Em ordem um necessitamos dos elementos de matriz:
hΦf |Û
(1)
Z
1 t
(t, 0)|Φii = hΦf |
dt1 Û0 (t, t1 )Ŵ (t1 )Û0 (t1 , 0)|Φi i
i~ 0
Z
1 t
0
0
dt1 e−iEf (t−t1 )/~Ŵf i (t1 )e−iEi (t−0)/~ ,
=
i~ 0
(11.2.200)
onde denotamos hΦf |Ŵ (t1 )|Φi i = Ŵf i (t1 ). Os elementos de matriz de ordem dois são
calculados de maneira semelhante, sendo necessário introduzir a relação de fecho. Obtemse:
hΦf |Û
(2)
(t, 0)|Φii =
P Z
k
(i~)2
t
dt1
0
Z
t1
0
0
0
dt2 e−iEf (t−t1 )/~Ŵf k (t1 )e−iEk (t1 −t2 )/~Ŵki (t2 )e−iEi (t2 −0)/~ .
0
(11.2.201)
Podemos agora interpretar os termos nas várias ordens:
• Termo de ordem zero: corresponde ao sistema não perturbado; o operador de evolução
é apenas exp (−iEi0 (t − 0)/~);
• Termo de ordem um: o sistema evolui de t = 0 → t1 por acção de exp (−iEi0 (t1 − 0)/~);
em t1 actua a perturbação que transforma |Φi i → |Φf i; seguidamente o sistema
evolui de t1 → t por acção de exp (−iEf0 (t − t1 )/~). Integramos sobre todos os t1 de
modo a que a perturbação possa actuar em qualquer instante;
• Termo de ordem dois: o sistema evolui de t = 0 → t2 por acção de exp (−iEi0 (t2 − 0)/~);
em t2 actua a perturbação que transforma |Φi i → |Φk i que é um estado intermédio arbitrário; seguidamente o sistema evolui de t2 → t1 por acção de exp (−iEk0 (t1 − t2 )/~);
em t1 actua a perturbação que transforma |Φk i → |Φf i; seguidamente o sistema
evolui de t1 → t por acção de exp (−iEf0 (t − t1 )/~). Integramos sobre todos os t1 , t2
de modo a que as perturbações possam actuar em qualquer instante; somamos sobre
todos os estados intermédios de modo que o estado final possa ser atingido usando
qualquer estado intermédio.
Cada termo nesta série perturbativa pode ser representado por um diagrama. Os três
primeiros estão representados na figura 11.8. Aos diagramas associamos as seguintes regras:
11.2 Teoria das Perturbações dependentes do tempo
t
t
393
t
|Φf i
|Φf i
t2
|Φi i = |Φf i
Ŵ (t1 )
t1
Ŵ (t1 )
|Φi i
t=0
Ordem 0
Ŵ (t2 )
|Φk i
t1
|Φi i
t=0
Ordem 1
t=0
Ordem 2
Figura 11.8: Diagramas de ‘Feynman’ que ilustram o processo de ordem zero, um e dois
para a teoria de perturbações dependentes do tempo.
⋆ O diagrama lê-se de baixo para cima (ordem temporal) correspondendo à leitura dos
elementos de matriz correspondentes (11.2.199), (11.2.200) e (11.2.201) da direita
para a esquerda;
⋆ a cada linha recta do diagrama, que une os pontos ti → ti+1 e que traduz a evolução do
sistema no tempo sob a acção de Ĥ0 no estado |Φk i, atribui-se o factor de
0
e−iEk (ti+1 −ti )/~ ;
(11.2.202)
⋆ A cada vértice do diagrama (correspondente a um instante ti ) atribui-se um factor de
Z
1 ti−i
dti Ŵab (ti ) ,
(11.2.203)
i~ 0
onde os indices a, b se referem ao estado |Φa i - que se encontra imediatamente no
passado do vértice - e |Φb i - que se encontra imediatamente no futuro do vértice;
⋆ Soma-se sobre todos os estados intermédios |Φk i.
Com estas regras, que têm o mesmo espı́rito das regras de Feynman usadas em teoria
quântica de campo, podemos reconstruir a expressão analı́tica de um termo perturbativo dado o respectivo diagrama. Como exemplo consideramos o termo de ordem três,
394
Métodos perturbativos independentes e dependentes do tempo
t
Ŵ (t3 )
t3
|Φf i
|Φl i
t2
Ŵ (t1 )
t1
Ŵ (t2 )
|Φk i
|Φi i
t=0
Ordem 3
Figura 11.9: Diagrama de ‘Feynman’ que ilustra o processo de ordem três para a teoria de
perturbações dependentes do tempo.
representado na figura 11.9. A amplitude deste processo, isto é o elemento de matriz
hΦf |Û (3) (t, 0)|Φii, reconstruida usando a figura 11.9 e as regras anteriores é:
Z
Z t1
Z t2
1 X t
0
0
dt1
dt2
dt3 e−iEf (t−t3 )/~Ŵf l (t3 )e−iEl (t3 −t2 )/~×
3
(i~) k,l t0
t0
t0
0
0
×Ŵlk (t2 )e−iEk (t2 −t1 )/~Ŵki (t1 )e−iEi (t1 −t0 )/~ ,
(11.2.204)
onde t > t3 > t2 > t1 > t0 . A estrutura dos termos seguintes é agora bastante óbvia.
Usando as fórmulas para as amplitudes é simples calcular a probabilidade de transição.
Para a transição |Φi i e |Φf i, i 6= f , obtém-se, em primeira ordem,
(1)
1
0
(t, 0)|Φi i| = 2 e−iEf t/~
~
2
Pif (t) = |hΦf |Û
Z t
1
= 2
dt1 eiωf i t1 Ŵf i (t1 )
~
0
2
Z
0
t
2
0
0
dt1 e−i(Ei −Ef )t1 /~Ŵf i (t1 )
(11.2.205)
,
onde usamos a frequência angular de Bohr (11.2.122), que é exactamente o resultado
(11.2.135).
11.3 Sumário
11.3
395
Sumário
Neste capı́tulo estudamos métodos perturbativos independentes e dependentes do tempo,
de modo a podermos considerar problemas que não admitem solução exacta. A principal hipótese é que o Hamiltoniano se decompõe num Hamiltoniano que pode ser resolvido
exactamente Ĥ0 e numa perturbação Ŵ , que é “pequena”. Para o caso de perturbações
estacionárias, o formalismo considera separadamente as perturbações a nı́veis não degenerados e degenerados. Como aplicação do primeiro caso estudamos várias perturbações a
um oscilador harmónico em uma dimensão. Como aplicação do segundo caso calculamos
a estrutura fina do átomo de Hidrogénio. Para perturbações dependentes do tempo, estudamos como calcular a probabilidade de transições entre estados próprios de Ĥ0 induzidas
pela perturbação. Como aplicação estudamos as ressonâncias induzidas por pertubações
sinusoidais e a regra de Ouro de Fermi, que usamos para deduzir novamente a secção eficaz
na aproximação de Born. Finalmente estudamos um outro método, baseado no operador
de evolução e na representação de interacção, para derivar probabilidades de transição em
teoria de perturbações dependentes do tempo. Este método introduz uma componente
diagramática que torna mais intuitiva a construção das amplitudes de transição.
CAPÍTULO
12
Sistemas de partı́culas idênticas
Os postulados do capı́tulo 4 para a Mecânica Quântica não relativista foram suplementados, no capı́tulo 10, por um conjunto de outros postulados referentes ao spin. O conjunto
resultante de postulados é, ainda assim, insuficiente quando tratamos sistemas com várias
partı́culas idênticas, levando a ambiguidades nas previsões fı́sicas. Para eliminar tais ambiguidades introduzimos, neste capı́tulo um novo postulado, relativo à descrição quântica
de sistemas de partı́culas idênticas.
12.1
Origem do Problema: a degenerescência de troca
Duas partı́culas são ditas idênticas se todas as suas propriedades intrı́nsecas - massa, carga,
spin, etc - são exactamente iguais, sendo por isso impossı́vel distinguir uma da outra. Todos
os protões ou todos os electrões são, por exemplo, partı́culas idênticas.
Consideremos um problema de colisão entre duas partı́culas idênticas, rotuladas por
(1) e (2), no referencial de centro de massa, conforme a figura 12.1. Consideremos que
um aparelho de medida, D, detecta uma das partı́culas numa determinada direcção após
a colisão. A partı́cula detectada no aparelho de medida D foi, claro está, a partı́cula (1)
ou a partı́cula (2):
398
Sistemas de partı́culas idênticas
Figura 12.1: Descrição clássica de um problema de colisão entre duas partı́culas idênticas.
A partı́cula detectada pode ser identificada como sendo a partı́cula (1) ou a partı́cula (2)
(Extraı́do de Cohen et al, ‘Quantum Mechanics’).
• Classicamente não existe nenhuma ambiguidade; sabendo as condições iniciais sabemos
se as trajectórias efectuadas correspondem ao caso a) ou ao caso b) descrito na figura
12.1, e logo se a partı́cula detectada foi (1) ou (2).
• Quanticamente existe uma ambiguidade, porque os pactotes de onda se irão misturar
e as partı́culas perderão irreversivelmente qualquer caracterı́stica que as distinga Figura 12.2.
Figura 12.2: Descrição quântica de um problema de colisão entre duas partı́culas idênticas.
A partı́cula detectada não pode ser identificada como sendo a partı́cula (1) ou a partı́cula
(2) (Extraı́do de Cohen et al, ‘Quantum Mechanics’).
A conclusão é que, quanticamente, não existe nenhuma maneira de dizer se a partı́cula
detectada foi a partı́cula (1) ou a partı́cula (2). Para compreender como esta ambiguidade
12.1 Origem do Problema: a degenerescência de troca
399
introduz ambiguidades fı́sicas na descrição quântica de um sistema de partı́culas idênticas
consideramos o seguinte exemplo.
Suponhamos que temos um sistema com duas partı́culas de spin 1/2 idênticas. Descrevemos matematicamente o sistema rotulando as partı́culas como partı́cula (1) e partı́cula (2);
os graus de liberdade de spin são descritos pelo ket
|ǫ1 , ǫ2 i ,
onde ǫi = ±1, i = 1, 2, se refere ao valor próprio da observável de spin Ŝiz , da partı́cula i,
que é igual a ǫi ~/2. Imaginemos que medimos estas observáveis e obtemos como resultado
+~/2 para uma delas e −~/2 para a outra. Em princı́pio esta medição deveria determinar
completamente o estado de spin do sistema. Mas devido à natureza idêntica das partı́culas
os kets
| + −i ,
e
| − +i ,
parecem igualmente apropriados, à priori, para descrever o sistema. Existe, neste sentido
uma degenerescência de troca. Mais geralmente, qualquer combinação linear normalizada
α| + −i + β| − +i ,
|α|2 + |β|2 = 1 ,
(12.1.1)
poderia descrever matematicamene este sistema, dado que respeita a condição de a componente Ŝz do spin de uma das partı́culas ser ~/2 e a mesma componente do spin da outra
partı́cula ser −~/2, sendo irrelevante qual é qual. É esta degenerescência de estados que
constitui a degenerescência de troca, que é a afirmação que “num sistema de partı́culas
idênticas, uma medição completa de cada uma das partı́culas não permite a determinação
de um único ket para descrever o sistema”. Assim, no nosso exemplo, apesar de termos
medido individualmente o spin de cada uma das partı́culas sabemos apenas que o estado do
sistema é dado por (12.1.1), com α e β indeterminados. Ora, para a descrição da Mecânica
Quântica não ser ambigua, nenhuma previsão de quantidades fı́sicas pode depender das
constantes α e β. Mas podemos demonstrar facilmente que não é assim. Calculemos, por
exemplo, a probabilidade de encontrar as componentes Ŝx do spin de ambas as partı́culas
com valor +~/2.
400
Sistemas de partı́culas idênticas
Primeiro notamos que na base própria de Ŝz , Ŝx tem a forma (9.2.18)


0 1
~
 .
Ŝx = 
2
1 0
É fácil verificar que os seus vectores próprios (normalizados) são
1
|+ix = √ (|+i + |−i) ,
2
com valores próprios
1
|−ix = √ (|+i − |−i) ,
2
(12.1.2)
~
Ŝx |±ix = ± |±ix .
2
Para responder à questão de qual a probabilidade de encontrar as componentes Ŝx dos
spins de ambas as partı́culas iguais a ~/2, invertemos (12.1.2)
1
|+i = √ (|+ix + |−ix ) ,
2
1
|−i = √ (|+ix − |−ix ) ,
2
(12.1.3)
de modo a escrever (12.1.1) em termos dos estados próprios da componente Ŝx do spin
α| + −i + β| − +i = α|+i ⊗ |−i + β|−i ⊗ |+i
|+ix + |−ix |+ix − |−ix
|+ix − |−ix |+ix + |−ix
√
√
√
√
⊗
+β
⊗
2
2
2
2
α+β
α+β
α−β
β−α
=
|+ix ⊗ |+ix −
|−ix ⊗ |−ix −
|+ix ⊗ |−ix −
|−ix ⊗ |+ix .
2
2
2
2
(12.1.4)
=α
Logo, a probabilidade pedida é igual a
α+β
2
2
,
que depende dos coeficientes α e β e como tal temos uma ambiguidade fı́sica. Dificuldades
análogas - resultantes da degenerescência de troca - aparecem no estudo de todos os sistema
com um número arbitrário de partı́culas idênticas N, N > 1.
12.2
Operadores de permutação
Antes de enunciar o postulado adicional da Mecânica Quântica que nos permite remover
as ambiguidades resultantes da degenerescência de troca, iremos estudar certos operadores
que permutam as várias partı́culas de um sistema e simplificam os cálculos e raciocı́nios
que se seguirão.
12.2 Operadores de permutação
12.2.1
401
Sistema de duas partı́culas
Consideremos um sistema constituido por duas partı́culas, não necessariamente idênticas
(de modo a evitar as ambiguidades fı́sicas discutidas anteriormente), mas com espaços de
estados isomórficos. Em particular terão o mesmo spin. Por exemplo, um protão - partı́cula
(1) - e um electrão - partı́cula (2).
Escolhemos a base {|uii} para o espaço de estados da partı́cula (1), E(1); como este é
isomórfico a E(2), {|uii} é também uma base para este espaço. O espaço de estados total,
E, tem uma base obtida pelo produto tensorial
{|1 : ui i ⊗ |2 : uj i} = {|1 : ui; 2 : uj i} .
Note-se que a ordem por que se fez o produto tensorial não é importante, isto é
|1 : ui ; 2 : uj i = |2 : uj ; 1 : ui i ,
o que é importante é qual o estado associado a cada partı́cula:
|1 : ui ; 2 : uj i =
6 |1 : uj ; 2 : ui i ,
para i 6= j .
O operador de permutação P̂21 é definido como o operador linear cuja acção nesta base é
dada por:
P̂21 |1 : ui ; 2 : uj i = |2 : ui ; 1 : uj i = |1 : uj ; 2 : ui i .
Sabendo esta acção é fácil concluir qual a acção em qualquer ket, bastando expandi-lo
nesta base. Em termos das componentes da função de onda de uma partı́cula com spin e
graus de liberdade orbitais,
Ψǫ,ǫ′ (~r, ~r′ ) = h1 : ~r, ǫ; 2 : ~r′ , ǫ′ |Ψi ,
a acção do operador de permutação é
P̂
21
Ψǫ′ ,ǫ (~r′ , ~r) .
Ψǫ,ǫ′ (~r, ~r′) −→
Consideremos algumas propriedades do operador de permutação:
402
Sistemas de partı́culas idênticas
• É igual ao seu inverso (óbvio pela definição):
2
P̂21
= 1̂ ;
• É hermı́tico:
†
P̂21 = P̂21
;
para o demonstramos notamos que (assumimos que a base {|uii} está ortonormalizada)
h1 : ui′ ; 2 : uj ′ |P̂21 |1 : ui ; 2 : uj i = δi′ j δj ′ i .
†
Por outro lado, os mesmos elementos de matriz para o operador P̂21
são
†
|1 : ui ; 2 : uj i = h1 : ui ; 2 : uj |P̂21 |1 : ui′ ; 2 : uj ′ i∗
h1 : ui′ ; 2 : uj ′ |P̂21
= (δj ′ i δi′ j )∗ = δj ′ i δi′ j ,
o que mostra que os elementos de matriz dos dois operadores são iguais e prova que
P̂21 é hermı́tico.
• Das duas propriedades anteriores resulta que P̂21 é unitário:
†
= P̂21 P̂21 = 1̂ .
P̂21 P̂21
• Por ser hermı́tico os valores próprios de P̂21 são reais; como, para além disso, o seu
quadrado é a unidade, os valores próprios de P̂21 terão de ser λ = ±1. Asssociados a
cada um destes valores próprios temos um tipo distinto de vectores próprios:
⋆ λ = 1; os vectores próprios associados chamam-se simétricos e denotam-se |ΨS i:
P̂21 |ΨS i = |ΨS i.
⋆ λ = −1; os vectores próprios associados chamam-se anti-simétricos e denotam-se
|ΨA i:
P̂21 |ΨA i = −|ΨA i.
12.2 Operadores de permutação
403
Dado um estado arbitrário, podemos definir dois operadores cuja acção nesse estado
origina, um estado próprio de P̂21 , com valor próprio, respectivamente +1 ou −1. Estes
operadores chamam-se o simetrizador, Ŝ, e o anti-simetrizador, Â e são definidos pelas
expressões:
Ŝ =
1
1̂ + P̂21 ,
2
 =
1
1̂ − P̂21 .
2
(12.2.1)
Estes operadores têm as seguintes propriedades, todas elas podendo ser facilmente verificadas a partir das definições (12.2.1):
• Ambos são operadores de projecção:
Ŝ 2 = Ŝ ,
Â2 = Â ;
Ŝ = Ŝ † ,
 = † ;
• Ambos são operadores hermı́ticos:
• Ŝ e  projectam em espaços ortogonais e suplementares
Ŝ Â = ÂŜ = 0 ,
Ŝ + Â = 1̂ .
• Como antecipado em cima, a acção destes operadores num estado arbitrário |Ψi de E
produz estados próprios do operador de permutação:
P̂21 Ŝ|Ψi = Ŝ|Ψi ,
P̂21 Â|Ψi = −Â|Ψi ,
o que justifica a denominação dos operadores.
Consideremos agora a transformação de observáveis pela acção do operador de permutação. Seja B̂(1) uma observável definida em E(1). Como é observável os seus vectores
próprios constituem uma base de E(1). Sem perda de generalidade assumimos que a base
{|uii} corresponde à base própria de B̂(1), com valores próprios {bi }. Consideramos a
†
acção do operador P̂21 B̂(1)P̂21
num ket de E arbitrário:
†
P̂21 B̂(1)P̂21
|1 : ui ; 2 : uj i = P̂21 B̂(1)|1 : uj ; 2 : uii = bj P̂21 |1 : uj ; 2 : ui i = bj |1 : ui ; 2 : uj i .
404
Sistemas de partı́culas idênticas
Por outro lado, se considerarmos a acção da observável análoga em E(2), denotada B̂(2),
no mesmo ket, temos
B̂(2)|1 : ui ; 2 : uj i = bj |1 : ui ; 2 : uj i .
Como o ket é arbitrário concluimos que
†
P̂21 B̂(1)P̂21
= B̂(2) .
Por um método análogo pode-se mostrar que
†
= B̂(1);
• P̂21 B̂(2)P̂21
†
• P̂21 (B̂(1) + Ĉ(2))P̂21
= B̂(2) + Ĉ(1);
†
= B̂(2)Ĉ(1), que pode ser facilmente deduzido introduzindo o operador
• P̂21 B̂(1)Ĉ(2)P̂21
†
1̂ = P̂21
P̂21 entre B̂(1) e Ĉ(2).
Generalizando para qualquer observável Ô(1, 2), em E, que pode ser expressa em termos
de observáveis B̂(1) e Ĉ(2), temos
†
P̂21 Ô(1, 2)P̂21
= Ô(2, 1) ,
que é a mesma observável trocando 1 ↔ 2.
Uma observável é dita simétrica se
ÔS (2, 1) = ÔS (1, 2) .
Para uma observável simétrica, (12.2.2) fica
†
P̂21 ÔS (1, 2)P̂21
= ÔS (2, 1) = ÔS (1, 2)
⇒
P̂21 ÔS (1, 2) = ÔS (1, 2)P̂21 ,
de onde concluimos que
[ÔS (1, 2), P̂21] = 0 ,
ou seja, as observáveis simétricas comutam com o operador de permutação.
(12.2.2)
12.2 Operadores de permutação
12.2.2
405
Sistema de três partı́culas e generalização para N partı́culas
Consideramos agora a generalização para N partı́culas dos conceitos da subsecção anterior.
Para isso começamos por considerar explicitamente o caso com N = 3 que introduz a
estrutura do caso geral. Tomamos a base do espaço de estados de três partı́culas, com
espaços de estados individuais isomórficos, como sendo
{|1 : ui; 2 : uj ; 3 : uk i} ,
(12.2.3)
e definimos os 3! = 6 operadores de permutação que nela actuam:
P̂123 ,
P̂231 ,
P̂312 ,
P̂321 ,
P̂132 ,
P̂213 .
(12.2.4)
A acção destes operadores na base pode ser sumarizada como
P̂npq |1 : ui ; 2 : uj ; 3 : uk i = |n : ui ; p : uj ; q : uk i .
Logo P̂123 = 1̂. A acção em qualquer ket é facilmente escrita expandindo-o na base (12.2.3).
Os N! operadores num sistema de N partı́culas são definidos analogamente.
Consideremos algumas propriedades dos operadores de permutação num sistema de N
partı́culas, exemplificando com o caso de N = 3:
• O conjunto de operadores de permutação, com a multiplicação usual de operadores,
constitui um grupo. Verifiquemos os axiomas de grupo (apresentados na secção 9.1):
⋆ O produto de dois operadores de permutação é ainda um operador de permutação;
por exemplo
P̂312 P̂132 = P̂321 ;
(12.2.5)
Para calcular o produto do lado esquerdo tome-se o seguinte algoritmo:









1→1
1→3
1→3






1) P̂132
2 → 3 , 2) P̂312
3 → 2 , 3) P̂312 P̂132
2 → 2 . (12.2.6)









 3→2
 2→1
 3→1
Logo a acção de P̂312 P̂132 é a mesma que a ação de P̂321 , como antecipado.
406
Sistemas de partı́culas idênticas
⋆ O produto de permutações é associativo; por exemplo
P̂312 P̂132 P̂231 = P̂312 P̂321 = P̂213 ,
enquanto que associando as duas permutações que actuam em segundo e terceiro
lugar,
P̂312 P̂132 P̂231 = P̂321 P̂231 = P̂213 ,
obtemos de facto o mesmo resultado.
⋆ Existe um operador identidade, que é P̂123 ;
⋆ Cada permutação tem uma permutação inversa
P̂123
−1
= P̂123
−1
P̂231
= P̂312 ,
−1
−1
−1
, P̂321
= P̂321 , P̂213
= P̂213 , P̂132
= P̂132 .
Obviamente as transposições (a definir de seguida) e a identidade são inversos de si
mesmos, como exibido na segunda linha.
Notemos que o grupo não é abeliano. Por exemplo se trocarmos a ordem do produto
em (12.2.5) obtemos
P̂132 P̂312 = P̂213 6= P̂321 ,
ou seja, as permutações, genericamente, não comutam entre si.
• Definimos transposição como uma permutação que troca duas partı́culas e deixa as
restantes invariantes. Para N = 3, das seis permutações (12.2.4) três são transposições
P̂321 ,
P̂132 ,
P̂213 .
(12.2.7)
Em geral, das N! permutações num sistema de N partı́culas teremos N(N − 1)/2
transposições. Transposições são análogas à permutação P̂21 que definimos num
sistema de duas partı́culas. Em particular são operadores hermı́ticos e unitários.
12.2 Operadores de permutação
407
Qualquer permutação pode ser escrita como um produto de transposições. Mas esta
“decomposição” não é única. Por exemplo
P̂312 = P̂132 P̂213 = P̂321 P̂132 = P̂321 P̂213 P̂132 P̂321 ;
no entanto o número de transposições cujo produto origina P̂312 é sempre par. De
um modo semelhante, a permutação P̂321 , que é ela própria uma transposição, não
tem uma decomposição única, por exemplo pode ser também decomposta como
P̂321 = P̂132 P̂213 P̂132 ,
mas o número de transposições cujo produto origina P̂321 é sempre ı́mpar. Por
esta razão, as permutações P̂123 , P̂231 , P̂312 são chamadas permutações pares e as permutações P̂321 , P̂132 , P̂213 são chamadas permutações ı́mpares. No caso com N = 3
todas as permutações ı́mpares são transposições. Genericamente, para um sistema de
N partı́culas, definimos permutações pares (ı́mpares) como aquelas que só se podem
escrever como produtos de um número par (ı́mpar) de transposições. Notemos ainda
que para qualquer N há tantas permutações pares como ı́mpares.
• Operadores de permutação são sempre unitários, pois podem ser escritos como produtos
de operadores unitários, que são as transposições. De facto notemos que se dois
operadores são unitários o seu produto é ainda unitário:
se † = 1̂ ,
B̂ B̂ † = 1̂ ,
⇒
(ÂB̂)(ÂB̂)† = ÂB̂ B̂ † † = 1̂ .
• Operadores de permutação não são sempre hermı́ticos, pois, embora se escrevam como
produtos de operadores hermı́ticos (transposições), estes não comutam entre si, conforme (4.2.31).
• O adjunto de uma permutação, que é igual ao seu inverso dado serem operadores
unitários, tem a mesma paridade da permutação, pois escreve-se à custa das mesmas
transposições, mas em ordem contrária.
408
Sistemas de partı́culas idênticas
Consideramos agora a construção, para um sistema de N partı́culas, dos vectores
próprios simétricos e anti-simétricos, e também a do simetrizador e do anti-simetrizador.
Começamos por notar que, como os operadores de permutação não comutam entre
si, não é possı́vel arranjar uma base própria comum a todos eles. Contudo existem, ainda
assim, certos estados que são estados próprios comuns a todos os operadores de permutação
P̂α . Num sistema de N partı́culas estes estados são de dois tipos:
• Estados completamente simétricos
P̂α |ΨS i = |ΨS i ,
que são vectores próprios de todas as permutações com valor próprio +1;
• Estados completamente anti-simétricos
P̂α |ΨA i = ǫα |ΨA i ,
que são vectores próprios de todas as permutações par (ı́mpar) com valor próprio +1
(−1). Logo ǫα = (−1)Paridade
de P̂α
.
Tanto o espaço dos kets completamente simétricos ES como o espaço dos kets completamente anti-simétricos EA são sub-espaços do espaço de estados total E; mas ao contrário
do caso N = 2, em geral
E=
6 ES ⊕ EA ,
isto é, nem todos os estados podem ser escritos como combinação linear de um estado
totalmente simétrico e um estado totalmente anti-simétrico.
O simetrizador e o anti-simetrizador para um sistema de N partı́culas são os operadores
de projecção em ES e EA , definidos como
Ŝ =
1 X
P̂α ,
N! α
Consideremos as suas propriedades:
 =
1 X
ǫα P̂α .
N! α
(12.2.8)
12.2 Operadores de permutação
• São ambos hermı́ticos
409
Ŝ = Ŝ † ,
 = † .
Esta propriedade pode ser verificada da seguinte maneira. Existe uma correspondência
biunı́voca entre as permutações e as suas inversas; a permutação inversa tem a mesma
paridade da permutação; logo as somas (12.2.8) podem ser escritas
1 X 1 X
P̂α + (P̂α )−1 ,
 =
ǫα P̂α + (P̂α )−1 .
Ŝ =
2N! α
2N! α
Como todas as permutações são operadores unitários, P̂α† = (P̂α )−1 e como tal
P̂α + (P̂α )−1 é hermı́tico. Como acabamos de escrever Ŝ e  como uma soma
de operadores hermı́ticos, mostramos que são hermı́ticos.
• Se P̂α′ for uma permutação arbitrária

 P̂ ′ Ŝ = Ŝ P̂ ′ = Ŝ
α
α
 P̂ ′ Â = ÂP̂ ′ = ǫ ′ Â
α
α
α
• São operadores de projecção:

 P̂ ′ Ŝ|Ψi = Ŝ|Ψi
α
⇒
 P̂ ′ Â|Ψi = ǫ ′ Â|Ψi
α
Ŝ = Ŝ 2 ,
.
(12.2.9)
α
 = Â2 ,
em espaços ortogonais
Ŝ Â = ÂŜ = 0 ,
mas, como já referido anteriormente, para N > 2, os espaços ES e EA não são suplementares - Figura 12.3 - i.e.
Ŝ + Â 6= 1̂ .
Note-se que a dimensão de ES mais a de EA depende de N e da dimensão de {|uii}.
Podemos agora considerar a transformação de observáveis pela acção dos operadores de permutação. Escrevendo o operador de permutação como produtos de transposições, podemos
argumentar de um modo semelhante ao caso N = 2. Em particular observáveis completamente simétricas na troca dos ı́ndices 1, . . . , N, OS (1, . . . , N), comutam com todos os
operadores de permutação
[OS (1, . . . , N), P̂α ] = 0 .
(12.2.10)
410
Sistemas de partı́culas idênticas
E
ES
EA
N =2
E
ES
EA
N >2
Figura 12.3: Representação esquemática do espaço de estados total, E e dos espaços de
estados simétricos ES e anti-simétricos EA , para duas partı́culas idênticas, em que são
suplementares e para N > 2, em que não são. Note-se que a figura da esquerda não
significa que qualquer estado de E pertença a ES ou a EA ; significa que qualquer estado de
E pode ser escrito como combinação linear de estados de ES e EA .
12.3
O postulado de simetrização
Vamos agora introduzir o postulado que vai levantar a degenerescência de troca e resolver as
ambiguidades fı́sicas vistas em sistemas de partı́culas idênticas. O postulado, denominado
postulado de simetrização, pode ser enunciado do seguinte modo:
“Quando um sistema inclui várias partı́culas idênticas, somente certos kets do seu
espaço de estados podem descrever estados fı́sicos. Os kets fı́sicos são, dependendo da
natureza das partı́culas idênticas, ou completamente simétricos ou completamente antisimétricos, com respeito à permutação destas partı́culas. As partı́culas para as quais os
kets fı́sicos são simétricos (anti-simétricos) chamam-se bosões (fermiões).
Este postulado limita o espaço de estados num sistema de partı́culas idênticas. Em vez
de ser o produto tensorial dos espaços de estados das partı́culas individuais E (como é para
partı́culas distintas), é apenas um sub-espaço de E, respectivamente ES ou EA para bosões
ou fermiões.
Todas as partı́culas conhecidas1 actualmente obedecem à seguinte regra:
Partı́culas com spin semi-inteiro são fermiões (electrão, protão,. . . ); partı́culas com
spin inteiro são bosões (fotão, mesões,. . . ).
1
Este facto, resulta de as partı́culas elementares conhecidas obedecerem a esta regra. Contudo, existem
partı́culas auxiliares (não são reais) mas usadas na descrição matemática da teoria quântica de campo,
denominadas ghosts que não obedecem ao Teorema Spin-Estatı́stica.
12.3 O postulado de simetrização
411
Esta regra, denominada “Teorema Spin-Estatı́stica”, pode ser provada em Teoria Quântica
de Campo, usando hipóteses muito gerais.2 Mas não é impossı́vel que:
• Um bosão/fermião com spin semi-inteiro/inteiro possa ser descoberto;
• Haja kets fı́sicos com simetrias mais complexas do que as que são consideradas pelo
postulado anterior.
Notemos ainda que este postulado não se aplica em uma e duas dimensões espaciais;
em duas dimensões, em particular, existem outras (quasi)partı́culas, denominadas “aniões”
(anyons), que se tornaram úteis na descrição de alguns sistemas, como folhas de grafite,
ou no tratamento do efeito Hall quântico.3
12.3.1
Levantamento da degenerescência de troca
Vejamos agora como o postulado anterior pode resolver as ambiguidades fı́sicas discutidas.
Para isso, notamos que a degenerescência de troca pode ser enunciada da seguinte forma:
“Seja |ui um ket que descreve matematicamente um estado fı́sico bem definido de
um sistema contendo N partı́culas idênticas. O ket P̂α |ui, para qualquer operador de
permutação P̂α , descreve o estado fı́sico tão bem quanto |ui. Se o sub-espaço Eu gerado
por |ui e todas as suas permutações tiver dimensão maior do que 1, existe degenerescência
de troca. Em geral, a dimensão de Eu poderá ir de 1 a N!.”
Com o postulado adicional, o ket fı́sico tem de pertencer a ES ou a EA . A degenerescência
de troca será levantada se demonstrarmos que Eu contém um único ket de ES ou, caso as
partı́culas idênticas sejam fermiões, um único ket de EA . Para demonstrarmos que assim
é, recordamos (12.2.9)
Ŝ = Ŝ P̂α ,
2
 = ǫα ÂP̂α ,
O trabalho original foi feito por W.Pauli: “The Connection Between Spin and Statistics”, Phys. Rev.
58 (1940) 716-722.
3
A existência destas representações foi originalmente discutida em J.M.Leinaas e J.Myrheim, “On the
theory of identical particles”, Il Nuovo Cimento, 37B (1977) 1; agradeço ao Prof. João Lopes dos Santos
por me ter chamado a atenção para este artigo.
412
Sistemas de partı́culas idênticas
que implicam
Ŝ|ui = Ŝ P̂α |ui ,
Â|ui = ǫα ÂP̂α |ui .
Ou seja, a projecção em ES ou EA de todos os kets de Eu é a mesma, a menos de um sinal
que não tem relevância fı́sica, o que levanta a degenerescência de troca.
Deste modo, pelo postulado de simetrização, o ket fı́sico que descreve o estado fı́sico do
sistema de um sistema de N partı́culas idênticas é construido da seguinte maneira:
i) Numere-se as partı́culas arbitrariamente e construa-se o ket |ui correspondendo ao estado fı́sico considerado com os números quânticos de cada partı́cula determinados.
ii) Aplique-se Ŝ ou  a |ui, dependendo de as partı́culas idênticas serem bosões ou
fermiões.
iii) Normalize-se o ket obtido.
Consideremos alguns exemplos:
1) Sistema de duas partı́culas idênticas:
Num sistema de duas partı́culas idênticas sabe-se que uma está no estado |φi e outra no
estado |χi (normalizados). Apliquemos as regras anteriores:
i) Rotulamos a que está no estado |φi/|χi por (1)/(2). Logo construimos o ket
|ui = |1 : φ; 2 : χi .
ii) Se são bosões simetrizamos:
Ŝ|ui =
1
1
1̂ + P̂21 |ui = (|1 : φ; 2 : χi + |1 : χ; 2 : φi) .
2
2
Se são fermiões anti-simetrizamos:
1
1
Â|ui =
1̂ − P̂21 |ui = (|1 : φ; 2 : χi − |1 : χ; 2 : φi) .
2
2
iii) Normalizamos; há que considerar duas hipóteses:
12.3 O postulado de simetrização
413
⋆ Se os dois estados fı́sicos |φi e |ψi são distintos, podemos assumir que hφ|χi = 0;
obtemos o ket fı́sico4
1
|φ, χi = √ [|1 : φ; 2 : χi + ǫ|1 : χ; 2 : φi] ,
2
onde ǫ = +1, −1, para bosões e fermiões, respectivamente.
⋆ Se os dois estados fı́sicos são o mesmo |φi = |χi então temos, para bosões
Ŝ|ui = |1 : φ; 2 : φi ,
o que quer dizer que se as partı́culas idênticas são bosões e estão no mesmo
estado o ket simetrizado é o mesmo que o ket inicial |ui = Ŝ|ui; para fermiões
Â|ui = 0 ,
o que quer dizer que não existe nenhum ket em EA que descreve dois fermiões
no mesmo estado individual |φi. Um tal estado é excluido pelo postulado de
simetrização. Acabamos assim, de estabelecer, para um caso particular, o
Princı́pio de exclusão de Pauli:
“Dois fermiões idênticos não podem estar no mesmo estado individual.”
2) Sistema de três partı́culas idênticas:
Num sistema de três partı́culas idênticas sabe-se que uma está no estado |φi, outra no
estado |χi e outra no estado |wi (normalizados). Apliquemos as regras anteriores:
i) Rotulamos a que está no estado |φi/|χi/|wi por (1)/(2)/(3). Logo construimos o ket
|ui = |1 : φ; 2 : χ; 3 : wi .
4
Assumimos, por simplicidade que |φi e |χi são estados próprios de uma observável (com espectro não
degenerado) associados a valores próprios distintos.
414
Sistemas de partı́culas idênticas
ii) Se são bosões simetrizamos:
Ŝ|ui =
1
1 X
P̂α |ui = (|1 : φ; 2 : χ; 3 : wi + |1 : w; 2 : φ; 3 : χi + |1 : χ; 2 : w; 3 : φi
3! α
3!
+|1 : φ; 2 : w; 3 : χi + |1 : χ; 2 : φ; 3 : wi + |1 : w; 2 : χ; 3 : φi) ;
(12.3.1)
Se são fermiões anti-simetrizamos:
Â|ui =
1X
ǫα P̂α |ui ,
3! α
notando que os sinais são exactamente os dados por um determinante, escrevemos
1
Â|ui =
3!
|1 : φi |1 : χi |1 : wi
|2 : φi |2 : χi |2 : wi
,
(12.3.2)
|3 : φi |3 : χi |3 : wi
que é chamado o determinante de Slater.5
iii) Normalizamos; há que considerar três hipóteses:
⋆ Se todos os estados fı́sicos |φi, |χi e |wi são distintos, podemos assumir ortogonalidade entre todos; obtemos os ket fı́sicos (12.3.1) ou (12.3.2) com 1/3! substituido
√
por 1/ 3!.
⋆ Se dois dos estados fı́sicos são iguais, por exemplo |φi = |χi, então temos, para
bosões
1
|φ; φ; wi = √ [|1 : φ; 2 : φ; 3 : wi + |1 : φ; 2 : w; 3 : φi + |1 : w; 2 : φ; 3 : φi] ,
3
enquanto que para fermiões, o facto de dois estados serem iguais significa que
existem duas colunas iguais no determinante de Slater, que como tal é zero.
Deste modo, não existe qualquer estado em EA que descreva esta situação. Esta
é mais uma manifestação do princı́pio de exclusão de Pauli.
5
Esta técnica de usar um determinante foi introduzida por J.C.Slater em “The Theory of Complex
Spectra”, Phys. Rev. 34 (1929) 1293.
12.3 O postulado de simetrização
415
⋆ Se os três estados fı́sicos são iguais, então temos, para bosões
|φ; φ; φi = |1 : φ; 2 : φ; 3 : φi ,
enquanto que para os fermiões a função de onda é zero.
3) Sistema de N partı́culas idênticas:
Genericamente a situação é semelhante aos casos anteriores. Para bosões existe sempre um
estado simétrico, mesmo que várias partı́culas estejam no mesmo estado individual. Para
fermiões não pode haver repetição do estado individual.
Existe uma outra representação de kets fı́sicos que introduz o conceito de número de
ocupação. Consideremos um sistema de N partı́culas idênticas. Tomando uma base {|uii}
para o espaço de estados de uma partı́cula, construimos a base
{|1 : ui; 2 : uj ; . . . ; N : up i} ,
(12.3.3)
para o espaço de estados E. No entanto, a base do espaço de estados fı́sicos ES ou EA
é construida actuando com o simetrizador ou o anti-simetrizador na base anterior, o que
torna irrelevante qual a numeração da partı́cula que se encontra num estado |uii. O que é
realmente relevante é quantas partı́culas se encontram em cada estado, ou seja o número
de ocupação de cada estado. Este número corresponde a quantas vezes cada estado aparece
num ket da forma (12.3.3). Isso leva-nos a introduzir a notação, para kets fı́sicos
|n1 , . . . , nk , . . .i ,
onde o número de entradas no ket corresponde ao número de estados possı́veis, isto é à
dimensão do espaço de estados de uma partı́cula; ni é o número de ocupação do estado |ui i.
Subentende-se que este ket corresponde a um ket simetrizado ou anti-simetrizado quando
expresso na base (12.3.3). Obviamente
X
i
e para os fermiões ni = {0, 1}.
ni = N ,
416
Sistemas de partı́culas idênticas
12.3.2
Observáveis e evolução temporal
O postulado de simetrização restringe os kets fı́sicos num sistema de partı́culas idênticas
aos que são totalmente simétricos ou totalmente anti-simétricos na troca de duas quaisquer
partı́culas. Quais as restrições que devemos impôr às observáveis?
Em geral, dado que nenhuma propriedade fı́sica é modificada quando os papéis das N
partı́culas são permutados, estas N partı́culas devem entrar simetricamente em qualquer
observável passı́vel de ser medida, tanto para fermiões como para bosões. Matematicamente, requeremos que as observáveis fı́sicas, Ô, sejam invariantes quando as partı́culas
são permutadas, isto é, devem ser operadores simétricos, e como tal de acordo com (12.2.10)
devem comutar com os operadores de permutação:
[Ô, P̂α ] = 0 ,
∀P̂α .
(12.3.4)
Por exemplo;
• Num sistema de duas partı́culas, a observável
~
~
R̂1 − R̂2 ,
não é simétrica, e como tal não é fı́sica. A observável fı́sica que reflecte a distância
entre as duas partı́culas é
q
~
~
~
~
(R̂1 − R̂2 )2 = |R̂1 − R̂2 | .
• O operador Hamiltoniano que descreve o átomo de Hélio deverá ser escrito, em primeira
aproximação, como
P̂ 2
1
P̂ 2
Ĥ(1, 2) = 1 + 2 +
2me 2me 4πǫ0
−
2e2
R̂1
−
2e2
R̂2
+
e2
|R̂1 − R̂2 |
!
.
• O momento angular orbital total num sistema de três partı́culas idênticas será:
~ ~
~
~
L̂ = L̂1 + L̂2 + L̂3 .
12.4 Consequências do postulado de simetrização
417
Note-se que o significado de (12.3.4) é também que a acção de uma observável fı́sica num
ket fı́sico não retira o ket fı́sico de ES ou EA . Isto é verdade, em particular para o operador
Hamiltoniano, que deverá ser uma observável fı́sica. Como este operador é o responsável
pela evoluação temporal do sistema, através da equação de Schrödinger, esta evolução
não deverá retirar o ket fı́sico do espaço vectorial ES ou EA . Isto atesta a consistência do
formalismo.
Note-se ainda que as observáveis fı́sicas estarão definidas, à partida, no espaço de
estados total E, podendo por isso ter mais vectores próprios (e correspondentes valores
próprios) do que aqueles que têm em ES ou EA . Neste sentido, o efeito do postulado
de simetrização poderá ser eliminar alguns dos valores próprios de uma observável fı́sica,
restrigindo os valores próprios fı́sicos aos que têm vectores próprios associados em ES ou
EA .
12.4
Consequências do postulado de simetrização
12.4.1
Diferenças entre bosões e fermiões
No enunciado do postulado de simetrização, a diferença entre bosões e fermiões é “apenas”
um sinal. Esta diferença de sinal tem, no entanto, consequências notáveis, que são manifestações do princı́pio de exclusão de Pauli, para fermiões, e da ausência de um princı́pio
semelhante para bosões. Consideremos duas.
Estado fundamental de um sistema de partı́culas idênticas independentes
Dado que o Hamiltoniano é uma observável fı́sica tem de ser uma observável simétrica,
num sistema de partı́culas idênticas. Vamos assumir que estas são independentes, isto é
não se encontram acopladas. Se assim é, o Hamiltoniano pode ser decomposto da seguinte
forma:
Ĥ(1, 2, . . . , N) = ĥ(1) + ĥ(2) + . . . + ĥ(N) .
Note-se que os vários Hamiltonianos individuais são iguais (a menos do ı́ndice de partı́cula),
de modo a garantir que o operador Hamiltoniano seja simétrico. Consideremos a base
418
Sistemas de partı́culas idênticas
própria de ĥ(j):
ĥ(j)|φn i = en |φn i ,
|φn i ∈ E(j) .
Assumimos, por simplicidade, que o espectro é discreto e não degenerado e ordenamos os
vectores próprios de modo a que e1 < e2 < e3 < . . ..
• Se as partı́culas são bosões, o estado fundamental é
(S)
|φ1,1,...,1 i = |1 : φ1 ; 2 : φ1 ; . . . ; N : φ1 i ,
que já está simetrizado, sendo a energia correspondente
E1,1,...,1 = Ne1 .
• Se as partı́culas são fermiões, o estado fundamental é
(A)
|φ1,2,...,N i
1
=√
N!
|1 : φ1 i
...
|1 : φN i
...
...
...
,
|N : φ1 i . . . |N : φN i
sendo a energia correspondente
E1,2,...,N = e1 + e2 + . . . + eN .
A maior energia individual eN que se encontra no estado fundamental é denominada
energia de Fermi.
Estatı́stica Quântica
Em mecânica estatı́stica clássica (estatı́stica de Maxwell-Boltzmann), as N partı́culas do
sistema são tratadas como se tivessem diferentes naturezas, mesmo que sejam idênticas.
Dois estados microscópicos, são considerados distintos se as N partı́culas forem idênticas,
mas a permutação diferente. Daqui resulta que, em equilı́brio térmico à temperatura T , o
número médio de partı́culas com energia Ei é dado por
e−βEi
P
n̄i = N
,
−βEj
je
12.4 Consequências do postulado de simetrização
419
onde a soma é sobre todos os estados microscópicos do sistema e β = 1/KB T . Este
resultado é aplicável sempre que a temperatura seja suficientemente alta e a densidade
suficientemente baixa para os efeitos quânticos serem negligenciáveis (isto é não haver
sobreposição apreciável das funções de onda das partı́culas individuais).
Em mecânica estatı́stica quântica o postulado de simetrização tem de ser considerado:
• Bosões obedecem à estatı́stica de Bose-Einstein; o número médio de bosões num estado
com energia Ei , é dado por
1
n̄i =
eα+βEi
onde α é determinado pela restrição
N=
X
j
−1
,
1
eα+βEj
−1
.
(12.4.1)
Para bosões sem massa (como o fotão), α = 0. Note-se que esta estatı́stica permite
que n̄i seja muito elevado.
• Fermiões obedecem à estatı́stica de Fermi-Dirac; o número médio de fermiões num estado
com energia Ei , é dado por
n̄i =
1
eα+βEi
+1
,
onde α é determinado pela restrição (12.4.1). Note-se que esta estatı́stica limita n̄i a
0 ≤ n̄i ≤ 1, em concordância com o princı́pio de exclusão de Pauli.
Estas diferentes estatı́sticas podem ser observadas a baixas temperaturas. Bosões idênticos
tendem a acumular-se no estado de menor energia - condensação de Bose-Einstein. Para
o 4 He, este fenómeno origina a superfluidez. Para o 3 He, que é um fermião, o mesmo
fenómeno não se verifica. A razão de o 3 He ser um fermião e do 4 He ser um bosão é
consequência do teorema de adição do momento angular.
Note-se que se tentarmos sobrepôr fermiões no mesmo estado quântico, existirá uma
força efectiva que contrariará esta tentativa de sobreposição, originando a chamada pressão
de Fermi. Esta pressão desempenha um papel importante na evolução estelar. Quando a
pressão de radiação deixa de conseguir equilibrar uma estrela, a estrela colapsa. Se a estrela
420
Sistemas de partı́culas idênticas
tiver menos de 1.44 massas solares (limite de Chandrasekhar ), a pressão de Fermi devida
aos electrões (degenerescência electrónica) evita que o colapso gravitacional continue. Para
estrelas com massa superior ao limite de Chandrasekhar, existe energia gravitacional suficiente para forçar os electrões e os protões a combinarem-se em neutrões, formando uma
estrela de neutrões. A pressão de Fermi devida aos neutrões pode então travar o colapso
gravitacional, se a massa da estrela for inferior a 2 − 3 massas solares. Para massas muito
superiores a esta não se conhece nenhum efeito que consiga travar o colapso gravitacional.
A estrela evoluirá, em princı́pio, para um buraco negro.
12.4.2
Efeitos de interferência
A simetrização/anti-simetrização origina termos de interferência no cálculo de probabilidades. Para vermos este fenómeno consideramos um sistema de duas partı́culas idênticas,
uma no estado |φi e outra no estado |χi, ortogonais. O estado fı́sico é
i
1 h
|φ; χi = √ 1̂ + ǫP̂21 |1 : φ; 2 : χi ,
2
onde ǫ = +1, −1 para bosões e fermiões respectivamente.
Queremos medir a grandeza fı́sica B, associada às observáveis B̂(1) e B̂(2). Seja {bi } o
espectro de B̂,
B̂|uii = bi |uii ,
que tomamos como sendo discreto e não degenerado, por simplicidade. Podemos perguntar qual é a probabilidade de encontrar os valores bn e bn′ (diferentes) numa medição
da grandeza fı́sica B das duas partı́culas. Para respondermos, consideramos o ket fı́sico
associado a este resultado, que é
i
1 h
|un ; un′ i = √ 1̂ + ǫP̂21 |1 : un ; 2 : un′ i .
2
12.4 Consequências do postulado de simetrização
421
Logo, a amplitude de probabilidade é
1
†
A(bn , bn′ ) = hun ; un′ |φ; χi = h1 : un ; 2 : un′ |(1 + ǫP̂21
)(1 + ǫP̂21 )|1 : φ; 2 : χi
2
= h1 : un ; 2 : un′ |(1 + ǫP̂21 )|1 : φ; 2 : χi
= h1 : un ; 2 : un′ |1 : φ; 2 : χi + ǫh1 : un ; 2 : un′ |1 : χ; 2 : φi
= hun |φihun′ |χi + ǫhun |χihun′ |φi .
Podemos interpretar o resultado para a amplitude de probabilidade do seguinte modo.
Associamos os dois kets que descrevem o estado fı́sico |φi e |χi aos dois bras que descrevem
o resultado pretendido hun | e hun′ | das duas maneiras possı́veis - figura 12.4.
hun |
|φi
hun |
|φi
hun′ |
|χi
hun′ |
|χi
a)
b)
Figura 12.4: Associação dos dois kets que descrevem o estado fı́sico |φi e |χi aos dois bras
que descrevem o resultado pretendido hun | e hun′ |. O termo a) é denominado termo directo;
o termo b) é denominado termo de troca.
Cada uma das duas maneiras origina uma amplitude de probabilidade e estas duas
amplitudes interferem com sinal diferente para bosões e fermiões, originando probabilidades
P(bn , bn′ ) = |A(bn , bn′ )|2 ,
diferentes. Explicitamente
P(bn , bn′ ) = |hun |φihun′ |χi + ǫhun′ |φihun|χi|2 .
(12.4.2)
Notemos, por contraste, o resultado que seria obtido em Mecânica Quântica se as partı́culas
não fossem idênticas. Consideramos que o estado fı́sico que descreve o sistema das duas
partı́culas distinguı́veis é
|1 : φ; 2 : χi .
422
Sistemas de partı́culas idênticas
Fazemos uma medição que, embora as partı́culas sejam distinguiveis, nos dá uma propriedade fı́sica que não distingue entre elas (por exemplo, temos um electrão e um protão
e medimos o spin). Logo os dois estados
|1 : un ; 2 : un′ i
,
|1 : un′ ; 2 : un i ,
descrevem o mesmo resultado da medição. A probabilidade de obtermos os resultados bn
e bn′ é dada pela soma das probabilidades de o sistema estar nos estados |1 : un ; 2 : un′ i e
|1 : un′ ; 2 : un i:
P ′ (bn , bn′ ) = |h1 : un ; 2 : un′ |1 : φ; 2 : χi|2 + |h1 : un′ ; 2 : un |1 : φ; 2 : χi|2
(12.4.3)
2
2
= |hun |φihun′ |χi| + |hun′ |φihun |χi| .
Note-se a ausência do termo de interferência, cujo sinal depende de as partı́culas idênticas
serem bosões ou fermiões.
Este termo manifesta a diferença nas previsões fı́sicas da
Mecânica Quântica dependendo se as partı́culas são idênticas - resultado (12.4.2) - ou
distinguı́veis - resultado (12.4.3).
n
O
O
z
z
b)
a)
Figura 12.5: Processo de colisão de partı́culas idênticas no referencial de centro de massa.
Assumimos que tanto o estado inicial, a), como o estado final, b), são estados próprios do
momento, associados às direcções z e n̂, respectivamente.
Para ilustrarmos o significado fı́sico dos termos directo e de troca, consideramos um
exemplo mais concreto: a colisão elástica de duas partı́culas idênticas no referencial de
centro de massa. Assumimos que o estado fı́sico que representa o estado inicial é
1
|Ψi i = √ (1̂ + ǫP̂21 )|1 : pez ; 2 : −pez i ,
2
enquanto que o estado final é descrito por
1
|Ψf i = √ (1̂ + ǫP̂21 )|1 : pn̂; 2 : −pn̂i ,
2
12.4 Consequências do postulado de simetrização
423
conforme a figura 12.5. O estado final relaciona-se com o estado inicial através do operador
de evolução (4.5.36)
|Ψ(t1 )i = Û (t1 , t0 )|Ψi i .
Como o Hamiltoniano comuta com P̂21 , também o operador de evolução o fará
[Û(t, t′ ), P̂21 ] = 0 .
Assim, a amplitude de probabilidade para o processo descrito é:
1
†
hΨf |Ψ(t1 )i = h1 : pn̂; 2 : −pn̂|(1̂ + ǫP̂21
)Û (t1 , t0 )(1̂ + ǫP̂21 )|1 : pez ; 2 : −pez i ,
2
que, usando
†
†
†
(1̂ + ǫP̂21
)Û (t1 , t0 )(1̂ + ǫP̂21 ) = (1̂ + ǫP̂21
)(1̂ + ǫP̂21 )Û(t1 , t0 ) = 2(1̂ + ǫP̂21
)Û (t1 , t0 ) ;
pode ser reescrita
hΨf |Ψ(t1 )i = h1 : pn̂; 2 : −pn̂|Û(t1 , t0 )|1 : pez ; 2 : −pez i
+ǫh1 : −pn̂; 2 : pn̂|Û(t1 , t0 )|1 : pez ; 2 : −pez i .
Podemos pensar graficamente nestes dois termos como estando associados aos processos
descritos na figura 12.6. Qual termo associamos a qual gráfico é irrelevante. O que importa
é que temos de somar ou subtrair as respectivas amplitudes de probabilidade para bosões
ou fermiões, respectivamente.
n
n
z
a)
z
b)
Figura 12.6: Representação diagramática dos dois processos cujas amplitudes têm de ser
consideradas no cálculo da probabilidade do processo descrito na figura 12.5. Um diagrama
corresponde ao termo directo, por exemplo a), e outro ao termo de troca, por exemplo b).
424
Sistemas de partı́culas idênticas
Fechamos esta subsecção comentando que há situações em que podemos na prática
ignorar o postulado de simetrização e trabalhar com a função de onda para partı́culas
idênticas, como se fossem partı́culas distinguı́veis. Consideremos dois exemplos.
1) Se as partı́culas idênticas tiverem funções de onda espaciais com uma sobreposição
negligenciável, os problemas vistos no inı́cio deste capı́tulo não devem ocorrer, pois
as partı́culas não se misturarão e não perderemos o “rasto” de cada uma delas. Em
termos matemáticos, sejam U1 e U2 as regiões do espaço onde a função de onda
das partı́culas, que rotulamos como (1) e (2), têm suporte. Se perguntarmos qual
a probabilidade de encontrarmos uma partı́cula num sub-espaço da região U1 , e a
outra num sub-espaço da região U2 , apenas um dos termos - o termo directo, por
exemplo -, irá contribuir. O termo de troca será nulo pois corresponde a projectar a
função de onda da partı́cula (1)/(2) num sub-espaço de U2 /U1 , onde não têm suporte.
A resposta obtida para a densidade de probabilidade será a mesma do que se não
simetrizarmos/anti-simetrizarmos a função de onda das partı́culas idênticas.
2) Se as duas partı́culas se encontrarem em estados ortogonais de spin, e o Hamiltoniano
de interacção não actuar nas variáveis de spin, o spin funciona como um número
quântico conservado que efectivamente distingue as partı́culas.
12.4.3
Difusão de duas partı́culas idênticas com spin
A difusão, tal como foi tratada no capı́tulo 10, assumia uma clara separação entre a
partı́cula difundida e a partı́cula difusora (modelada por um potencial difusor). O cálculo
da secção eficaz de difusão baseava-se na leitura da amplitude de difusão, através da forma
assimptótica dos estados estacionários de difusão (10.1.13).
No caso de estudarmos difusão de duas partı́culas idênticas, é impossı́vel distinguir entre
a partı́cula incidente e a partı́cula difundida. Consequentemente, no referencial de centro
de massa, tem-se duas ondas planas incidentes idênticas, em rota de colisão: eikz , e−ikz . A
função de onda total que descreve o processo de difusão e é obtida pela resolução da equação
de Schrödinger, deverá ser simétrica (para bosões) ou anti-simétrica (para fermiões) na
12.4 Consequências do postulado de simetrização
425
troca das partı́culas ~r1 ↔ ~r2 . Esta troca, no referencial de centro de massa, corresponde a
r↔r ,
θ ↔π−θ ,
z = r cos θ ↔ −z.
(12.4.4)
Logo, num sistema de partı́culas idênticas, a parte orbital da função de onda que descreve
os estados estacionários de difusão terá a forma assimptótica
eikr
~
r →∞
,
(~r) −→ eikz ± e−ikz + (f (θ) ± f (π − θ))
vkdif
r
S,A
(12.4.5)
e não (10.1.13), onde S, A se referem respectivamente ao sinal ‘+’ e ‘−’ de modo a que
a função de onda seja simétrica e anti-simétrica, respectivamente, na troca das duas
partı́culas. Note que o sinal desta equação não é determinado pela natureza das partı́culas
ser bosónica ou fermiónica. De facto o postulado de simetrização requer que a função de
onda total, |Ψi, seja simétrica ou anti-simétrica na troca de duas partı́culas e não a função
de onda orbital |vkdif i. Assim, para compreendermos qual o sinal a utilizar na função de
onda orbital temos de considerar a função de onda total que terá para além da parte orbital
uma parte de spin. Como exemplo consideremos a difusão de dois fermiões de spin 1/2.
Vimos na secção 9.5.1 que o momento angular total e a respectiva função de onda de spin,
|Si, serão:
S = 1 (estado tripleto simétrico) ,



|1, 1i = |+, +i


√
|SiS =
|1, 0i = (|+, −i + |−, +i)/ 2



 |1, −1i = |−, −i
√
|SiA = |0, 0i = (|+, −i − |−, +i)/ 2 .
(12.4.6)
S = 0 (estado singleto anti − simétrico) ,
Consideramos agora os dois casos possı́veis:
⋆ Se o sistema estiver polarizado, isto é num estado de momento angular total bem definido
(|SiS ou |SiA ), a sua função de onda de spin será simétrica ou anti-simétrica, respectivamente. Como a função de onda total deverá ser anti-simétrica (as partı́culas são
fermiões) teremos de escolher a função de onda orbital anti-simétrica ou simétrica
respectivamente:
|Ψi = |vkdif iA ⊗ |SiS
ou
|Ψi = |vkdif iS ⊗ |SiA .
(12.4.7)
426
Sistemas de partı́culas idênticas
Portanto, para um feixe polarizado com S = 1 a secção eficaz diferencial de difusão,
dada pelo quadrado do módulo da amplitude de difusão, será:
σ(θ, φ)A = |f (θ) − f (π − θ)|2 ,
(12.4.8)
enquanto que para S = 0 será
σ(θ, φ)S = |f (θ) + f (π − θ)|2 .
(12.4.9)
⋆ Se o sistema não estiver polarizado, isto é estiver numa sobreposição de estado de momento angular total bem definido, a secção eficaz diferencial do processo é obtida
calculando uma média de σ(θ, φ)A e σ(θ, φ)S , onde o peso de cada uma é dada pelo
número de estados de spin que a ela estão associados. Na prática estamos a considerar todos os estados de spin equiprováveis. No nosso caso temos três estados com
S = 1 e um estado com S = 0. Portanto a secção será dada por
3
1
σ(θ, φ) = σ(θ, φ)A + σ(θ, φ)S .
4
4
(12.4.10)
O caso geral é agora simples de concluir. Se o spin de cada uma das partı́culas for s haverá
2s + 1 valores possı́veis para o momento angular total S (S = 2s, 2s − 1, . . . , 0); todos
os estados no multipleto correspondente a cada S terão a mesma simetria (simétricos ou
anti-simétricos na troca de duas partı́culas). A função de onda orbital é escolhida com a
simetria apropriada de modo a que a função de onda total seja simétrica (anti-simétrica)
se as partı́culas forem bosões (fermiões):
⋆ Se o sistema estiver polarizado no estado com momento angular total S e as partı́culas
forem fermiões (bosões) então a secção eficaz diferencial é dada por
σ(θ, φ)A = |f (θ) − f (π − θ)|2 ,
(12.4.11)
se o multipleto com momento angular total S for simétrico (anti-simétrico) ou
σ(θ, φ)S = |f (θ) + f (π − θ)|2 ,
(12.4.12)
se o multipleto com momento angular total S for anti-simétrico (simétrico).
12.4 Consequências do postulado de simetrização
427
⋆ Se o sistema não estiver polarizado temos
σ(θ, φ) =
s+1
s
σ(θ, φ)A +
σ(θ, φ)S ,
2s + 1
2s + 1
(12.4.13)
σ(θ, φ) =
s
s+1
σ(θ, φ)S +
σ(θ, φ)A ,
2s + 1
2s + 1
(12.4.14)
para fermiões e
para bosões, dado que genericamente teremos (2s + 1)2 estados de spin dos quais
s(2s + 1) serão anti-simétricos e (s + 1)(2s + 1) serão simétricos.
Exemplo: Considere a difusão neutrão-neutrão a baixa energia, tomando o potencial
de interacção
V (r) = ~σ1 · ~σ2 V0
e−αr
,
r
(12.4.15)
onde α, V0 são constantes positivas e σi a matriz de Pauli para o neutrão i = 1, 2. Pretendemos calcular a secção eficaz de difusão supondo que os feixes dos neutrões não estão
polarizados, na primeira aproximação de Born. Começamos por escrever o operador de
spin total do sistema
~
~
Ŝ = ~ŝ1 + ~ŝ2 = (~σ1 + ~σ2 ) ,
2
(12.4.16)
dado serem partı́culas de spin 1/2. Logo

 1 , se S = 1
2
~σ1 · ~σ2 = 2 Ŝ 2 − ŝ21 − ŝ22 =
.
 −3 , se S = 0
~
(12.4.17)
Logo, para feixes polarizados o potencial é efectivamente

e−αr


, se S = 1
 V0
r
V (r) =
.
(12.4.18)
−αr

e

 −3V0
, se S = 0
r
A amplitude de difusão para cada um destes potenciais na primeira aproximação de Born
é, usando (10.2.51) e (10.2.39)

2µV0
1


− 2
, se S = 1

2

~ 4k 2 sin θ2 + α2
fkBorn (θ, φ) =

1
6µV0


, se S = 0

2 θ
2
2
~ 4k sin 2 + α2
.
(12.4.19)
428
Sistemas de partı́culas idênticas
A secção eficaz diferencial de difusão é dada por (12.4.10) usando (12.4.8) e (12.4.9)
3
1
σ(θ, φ) = |fkS=1(θ) − fkS=1 (π − θ)|2 + |fkS=0 (θ) + fkS=0 (π − θ)|2 ,
4
4
ou
3 2µV0
σ(θ, φ) = − 2
4
~
1 6µV0
+
4 ~2
12.5
1
− 2
2 θ
2
2
4k sin 2 + α
4k cos2 2θ + α2
!
1
1
+
4k 2 sin2 2θ + α2 4k 2 cos2 2θ + α2
1
!
(12.4.20)
2
(12.4.21)
2
.
Átomos com vários electrões - A tabela periódica
No capı́tulo 6 estudamos o átomo de Hidrogénio, considerando apenas o termo cinético e
a interacção de Coulomb entre o electrão e o protão. O problema é exactamente solúvel
e obtivemos o espectro e as funções de onda analiticamente. Este estudo foi refinado no
capı́tulo 11, em que consideramos as primeiras correcções relativistas e em particular o spin,
para perceber e calcular perturbativamente a estrutura fina. Ao considerarmos átomos com
vários electrões, o problema, mesmo considerando apenas a interacção de Coulomb, deixa
de ser exactamente solúvel. A razão é que existe uma interacção repulsiva de Coulomb
entre os vários electrões, que faz com que os electrões deixem de sentir um potencial central.
Para um átomo com número atómico Z, o Hamiltoniano será:
Z
Z
X
P̂i2
e2
1 X
1 X Ze2
Ĥ =
+
−
,
2me 4πǫ0 i=1 R̂i
4πǫ0 i<j |R̂i − R̂j |
i=1
(12.5.1)
onde o último termo (que corresponde, de facto, a Z(Z − 1)/2 termos) descreve as interacções entre os electrões do átomo. Note-se que o Hamiltoniano é uma observável
simétrica, como requerido para uma observável fı́sica. Podiamos sugerir um tratamento
perturbativo para este Hamiltoniano, considerando o terceiro termo em (12.5.1) como uma
perturbação aos outros dois, que podem ser resolvidos exactamente. Estimando tanto R̂i
como |R̂i − R̂j | pelo raio de Bohr, a razão entre o terceiro e segundo termos em (12.5.1) é
Z(Z − 1)/2
,
Z2
12.5 Átomos com vários electrões - A tabela periódica
429
que varia entre 1/4 para Z = 2 e 1/2 para Z elevado. Claramente um tratamento perturbativo não será uma boa aproximação.
Existe, no entanto uma aproximação que pode ser usada para tratar este problema: a
aproximação de campo central. Esta aproximação consiste em considerar que cada electrão
sente um potencial efectivo central, Vc (R̂i ), que leva em conta, não só o potencial atractivo
do núcleo mas também o potencial repulsivo dos outros electrões. Uma intuição classica
revela que o potencial dos outros electrões depende, ele próprio, da localização do electrão
que consideramos; para além disso, se o electrão considerado estiver muito próximo de
outro electrão e a posição relativa não for radial, o potencial central será uma aproximação
pobre. Contudo, em mecânica quântica, onde os electrões se encontram delocalizados, esta
aproximação parece ser mais justificada. Assim consideramos o Hamiltoniano do problema
(12.5.1) na forma seguinte:
Ĥ = Ĥ0 + Ŵ ,
onde
Ĥ0 =
Z
X
i=1
P̂i2
+ Vc (R̂i )
2me
!
,
Z
Z
X
e2
1 X
1 X Ze2
+
−
Vc (R̂i ) .
Ŵ = −
4πǫ0 i=1 R̂i
4πǫ0 i<j |R̂i − R̂j | i=1
Se o potencial Vc (R̂i ) for escolhido apropriadamente, Ŵ pode ser considerado uma perturbação a Ĥ0 , que por sua vez corresponde a Z cópias de um Hamiltoniano efectivo para
uma partı́cula dado por
Ĥef e =
P̂i2
+ Vc (R̂) .
2me
(12.5.2)
A aproximação de campo central consiste em escolher apropriadamente Vc (R̂), negligenciar
Ŵ e resolver Ĥef e . O ponto crucial é a escolha de Vc (R̂), que é um problema complexo e
não será aqui tratado. A ideia é procurar uma solução auto-consistente, isto é:
i) A escolha do potencial Vc (R̂) tem que garantir que Ŵ é uma perturbação;
ii) A função de onda dos outros Z − 1 electrões é calculada usando Vc (R̂); estas funções
de onda têm de ser consistentes com o próprio potencial, no sentido que têm de
reproduzir a densidade de carga que produz Vc (R̂).
430
Sistemas de partı́culas idênticas
Se bem que a determinação exacta de Vc (R̂) seja um problema complexo, a sua forma
para pequenas e longas distâncias pode ser vislumbrada de um modo simples.
• Para r pequeno, o electrão considerado encontra-se dentro da nuvem electrónica dos
outros electrões, sentindo por isso, apenas o potencial nuclear; assim, o potencial
será
Vc (r) ≃ −
1 Ze2
;
4πǫ0 r
• Para r grande, o electrão considerado encontra-se fora da nuvem electrónica dos outros
electrões; efectivamente os Z − 1 electrões anulam Z − 1 cargas positivas do núcleo,
pelo que o potencial será
Vc (r) ≃ −
1 e2
.
4πǫ0 r
Para valores intermédios, Vc (r) interpola entre estes dois comportamentos, de um modo
mais ou menos complicado, dependendo do átomo - figura 12.7. Note-se que estes dois
potenciais coincidem para o Hidrogénio.
Figura 12.7: A tracejado representam-se os potenciais correspondentes às aproximações
longe e perto do núcleo. A cheio representa-se um potencial que interpola entre os dois
(Extraı́do de Cohen et al, ‘Quantum Mechanics’).
12.5 Átomos com vários electrões - A tabela periódica
12.5.1
431
Nı́veis de energia
Estas considerações qualitativas, permitem-nos inferir, qualitativamente, a estrutura do
espectro de energias do Hamiltoniano (12.5.2):
i) Dado que o potencial efectivo é central, as funções de onda devem ser caracterizadas
por um número quântico principal N e um número quântico angular ℓ, tal como no
caso do átomo de Hidrogénio. Mas, enquanto que no caso do Hidrogénio, há uma
degenerescência acidental (que pode ser ligada a uma simetria escondida do potencial
1/r que alarga o grupo de simetria do problema para SO(4) e não SO(3)) que permite
aos valores próprios do Hamiltoniano só dependerem de N, aqui esperamos que os
nı́veis de energia dependam de N e ℓ, ou seja, EN,ℓ . Tal como no Hidrogénio, o
número quântico principal é introduzido à custa de um inteiro n0 , que surge quando
resolvemos a equação radial, e por isso
ℓ≤N −1 .
ii) Esperamos que a energia aumente com N, para ℓ fixo:
EN ′ ,ℓ > EN,ℓ ,
N′ > N .
iii) Esperamos que a energia aumente com ℓ, para N fixo:
EN,ℓ′ > EN,ℓ ,
ℓ′ > ℓ .
De facto, quanto maior o momento angular, para N fixo, esperamos que a função de
onda esteja localizada mais longe do núcleo, correspondendo portanto a um estado
menos ligado.
iv) Existe uma degenerescência de 2(2ℓ + 1) de cada nı́vel de energia; o factor (2ℓ + 1) é
devido à invariância de rotação (que torna o módulo da função de onda e a energia
independentes de mℓ ) e o factor de 2 é devido ao spin.
Verifica-se de facto que a hierarquia de energia é muito semelhante para todos os átomos,
embora os valores absolutos dependam de Z. A figura 12.8 representa essa hierarquia.
Contraste-se o comportamento com o do átomo de Hidrogénio - Figura 6.4.
432
Sistemas de partı́culas idênticas
Figura 12.8: Hierarquia energética das várias camadas para um potencial central do tipo
representado na figura 12.7. Note-se que para N fixo (na figura representado como n), a
energia aumenta com ℓ. Entre parêntises encontra-se a degenerescência de cada nı́vel. Entre
chavetas encontram-se nı́veis muito próximos cuja disposição relativa depende do átomo. À
direita de cada camada encontram-se os sı́mbolos quı́micos dos átomos cuja última camada
ocupada (no estado fundamental) é essa (Extraı́do de Cohen et al, ‘Quantum Mechanics’).
12.5.2
Configurações electrónicas e princı́pio da exclusão de Pauli
Como os electrões são fermiões, obedecem ao princı́pio de exclusão de Pauli. Assim, depois
de resolvermos o Hamiltoniano (12.5.2) construimos, na aproximação de campo central, as
funções de onda de um átomo com número atómico Z através do determinante de Slater,
construido com as funções de onda de (12.5.2). O estado fundamental do átomo é assim
obtido quando os Z electrões ocupam as orbitais de menor energia de um modo compatı́vel
12.5 Átomos com vários electrões - A tabela periódica
433
com o princı́pio de exclusão de Pauli.
Cada nı́vel energético EN,ℓ tem degenerescência 2(2ℓ + 1) e o conjunto de estados individuais associados a essa mesma energia chama-se uma “shell ” ou camada. A lista
das camadas ocupadas com os respectivos números de ocupação chama-se a configuração
electrónica do átomo. O conhecimento desta configuração electrónica permite-nos interpretar as propriedades fı́sicas e quı́micas de um átomo.
A configuração electrónica de um determinado átomo é obtida enchendo as várias camadas, começando no nı́vel de menor energia, 1s, e seguindo a ordem crescente de energia
(i.e. pela ordem apresentada na figura 12.8), até esgotar os Z electrões:
Z = 1; O átomo de Hidrogénio, no seu estado fundamental, tem o seu único electrão no
nı́vel 1s:
H : 1s ;
Note-se que para o Hidrogénio, a energia não depende de ℓ, pelo que devemos usar a
figura 6.4 e não a figura 12.8.
Z = 2; O átomo de Hélio, no seu estado fundamental, tem os seus dois electrões no nı́vel
1s:
He : 1s2 ;
ou seja os dois electrões têm spins opostos;
Z = 3; O átomo de Lı́tio, no seu estado fundamental, tem dois electrões no nı́vel 1s e o
terceiro no nı́vel 2s:
Li : 1s2 , 2s ;
Z = 4; O átomo de Berı́lio, no seu estado fundamental, tem dois electrões no nı́vel 1s e
dois no nı́vel 2s:
Be : 1s2 , 2s2 ;
Para Z > 4 começa-se a encher a camada 2p, que pode comportar 6 electrões, correspondendo aos estados fundamentais dos elementos Boro, Carbono, Azoto, Oxigénio, Flúor e
434
Sistemas de partı́culas idênticas
Neon. Para Z = 11, 12, enche-se o nı́vel 3s, correspondendo aos estados fundamentais do
Sódio e Magnésio, etc. Assim, obtêm-se as configurações electrónicas de todos os átomos,
que, em última análise, explicam a tabela periódica de Mandeleev - Figura 12.9.
Figura 12.9: Uma tabela periódica dos elementos.
Note-se que nı́veis muito próximos (aqueles dentro de chavetas na figura 12.8), podem
ser enchidos de uma maneira irregular. Por exemplo, na figura 12.8 a camada 4s é repre-
12.6 Sumário
435
sentada como tendo menos energia que a camada 3d. No entanto, o Crómio (Z = 34) tem
5 electrões na camada 3d e a camada 4s incompleta. Irregularidades semelhantes aparecem
para o Cobre (Z = 29), Niobium (Z = 41), etc.
Apesar das subtilezas, algumas caracterı́sticas são bastante intuitivas. Por exemplo a
energia de ionização para o Hélio é 24.6 eV, ligeiramente menos do que o dobro do valor
do Hidrogénio, porque, apesar de existir uma força atractiva entre os electrões e o núcleo
que é o dobro daquela que existe no Hidrogénio, existe também uma força repulsiva entre
os dois electrões que diminui a energia de ligação.
Um comentário final prende-se com o momento angular dos átomos. Pode-se mostrar
que numa camada completa, o momento angular total é zero, tal como o momento angular
orbital e o momento angular de spin. Assim, o momento angular de um átomo é totalmente
devido aos seus electrões exteriores. Por exemplo, o momento angular total do hélio, no seu
estado fundamental é zero, tal como para todos os gases raros, enquanto que o momento
angular total do Lı́tio é 1/2, devido a um electrão desemparelhado numa orbital s, tal
como para todos os metais alcalinos.
12.6
Sumário
Neste capı́tulo estudamos a descrição quântica de sistemas com várias partı́culas idênticas.
Começamos por observar que existe uma degenerescência de funções de onda que podem
descrever o sistema depois de termos feito uma medição do mesmo tão completa quanto
possı́vel. Essa “degenerescência de troca” introduz ambiguidades nas previsões fı́sicas. Tais
ambiguidades podem ser levantadas introduzindo o postulado de simetrização, que postula
que os estados fı́sicos podem ter dois tipos, bosões e fermiões, correspondendo a funções
de onda totalmente simétricas ou totalmente anti-simétricas na troca de duas quaisquer
partı́culas. As funções de onda fı́sicas são construidas com os operadores simetrizador
e anti-simetrizador, definidos à custa dos operadores de permutação, que estudamos em
detalhe. Estudamos ainda as diferenças fı́sicas entre bosões e fermiões, a principal das
quais é o princı́pio de exclusão de Pauli para os fermiões, inexistente para bosões. A
436
Sistemas de partı́culas idênticas
existência deste princı́pio em sistemas de fermiões é responsável pela existência da energia
de Fermi e pela ausência de um fenómeno do tipo da condensação de Bose-Einstein. Ele
está ainda na origem das diferentes estatı́sticas para bosões e fermiões (Bose-Einstein e
Fermi-Dirac). Mostramos como os termos directo e de troca têm interferências diferentes
para fermiões e bosões. Terminamos fazendo algumas considerações sobre a estrutura
dos átomos com vários electrões. Descrevemos qualitativamente a aproximação de campo
central, que nos permite resolver o problema e apresentamos a estrutura dos nı́veis de
energia. Juntamente com o princı́pio de exclusão de Pauli, esta estrutura permitiu-nos
descrever a configuração electrónica dos átomos, que, por sua vez, permite compreender a
estrutura da tabela periódica dos elementos - figura 12.9.
CAPÍTULO
13
Introdução à Mecânica Quântica Relativista
A teoria quântica que construimos até agora é uma teoria não relativista. A equação
de onda de Schrödinger não possui invariância de Lorentz, dado ter sido construida com
base na relação de dispersão não relativista (3.0.2). Neste capı́tulo vamos introduzir duas
equações de onda invariantes por transformações de Lorentz, i.e. covariantes, de modo a
obedecer aos princı́pios da relatividade restrita: a equação de Klein-Gordon e a equação
de Dirac. A covariância é necessária para poder aplicar a teoria quântica a partı́culas com
energia elevada. Note-se que não é necessário (felizmente!) fazer a teoria totalmente covariante, i.e. compatı́vel com os princı́pios da relatividade geral, pois a interacção gravı́tica é
negligenciável nos fenómenos atómicos de interesse para o estudo aqui efectuado. Veremos
que, das duas equações, apenas uma - a de Dirac - descreve partı́culas com spin e como tal
é a equação relativista apropriada para descrever o electrão.
13.1
A teoria de Klein-Gordon
A equação de Schrödinger (3.0.6) foi construı́da no capı́tulo 3 a partir da relação não
relativista entre a energia e o momento (3.0.2). Como visto na secção 4.4.2 essa construção
438
Introdução à Mecânica Quântica Relativista
pode ser vista como resultando da associação à energia e ao momento dos operadores:
E → i~
∂
,
∂t
~p → −i~∇ .
(13.1.1)
Se procuramos uma equação fundamental da Mecânica Quântica Relativista é natural fazer
esta mesma associação na relação relativista entre a energia e o momento, que é:
E 2 = m20 c4 + p2 c2 ⇔ pµ pµ = m20 c2 ,
(13.1.2)
onde m0 é a massa em repouso da partı́cula, c é a velocidade da luz, p2 = p~ · p~ é o quadrado
do 3-momento e pµ é o 4-vector momento:
E
E
µ
, p~
⇔ pµ =
, −~p ,
p =
c
c
(13.1.3)
onde, em conformidade com a maioria da literatura sobre Mecânica Quântica Relativista
e Teoria Quântica de Campo, usamos a métrica de Minkowski com assinatura ‘maioritariamente negativa’
ds2 = ηµν dxµ dxν = (dx0 )2 − δij dxi dxj ;
(13.1.4)
o 4-vector posição espaço-temporal é:
xµ = (x0 , ~x) = (ct, ~x) .
Usando (13.1.1) em (13.1.3) obtemos que
E
1∂
∂
pµ =
, −~p → i~
, ∇ = i~ µ ,
c
c ∂t
∂x
(13.1.5)
(13.1.6)
ou
pµ → i~∂µ ,
(13.1.7)
que é a associação de operadores (13.1.1) em notação manifestamente covariante por transformações de Lorentz (i.e relativista). Usando esta associação em (13.1.2) obtemos a
equação de Klein-Gordon:1
m c 2
0
Φ(xµ ) ;
2Φ(x ) = −
~
µ
1
(13.1.8)
Esta equação foi descoberta independentemente e praticamente simultaneamente pelo fı́sico sueco
Oskar Klein (1894 - 1977), Z.f.Phys. 37 (1926) 895, e pelo fı́sico alemão Walter Gordon (1893-1940),
13.2 Os problemas com a teoria de Klein-Gordon
439
denotamos o operador D’Alambertiano por 2
2 = ∂µ ∂ µ =
1 ∂2
−∆ ,
c2 ∂t2
(13.1.9)
e ∆ é o operador Laplaciano. Estes operadores são a segunda derivada covariante num
espaço Lorentziano e Euclidiano respectivamente. Têm uma expressão covariante, isto é
válida para um sistema de coordenadas arbitrário e num espaço arbitrário, que é dada pela
métrica gµν nesse espaço e nesse sistema de coordenadas:
p
1
∆, 2 . . . = p ∂µ g µν |g|∂ν . . . ,
|g|
(13.1.10)
onde |g| é o módulo do determinante da métrica e ‘. . .’ representa a função escalar onde
estes operadores actuam.
13.2
Os problemas com a teoria de Klein-Gordon
A equação (13.1.8) é de facto uma equação invariante por transformações de Lorentz, ao
contrário da equação de Schrödinger. Mas dadas as diferenças fı́sicas entre a Mecânica não
relativista e a Mecânica relativista colocam-se duas questões:
i) Será que podemos ainda interpretar as soluções da equação de Klein-Gordon Φ(xµ )
como uma função de onda, que descreve uma amplitude de probabilidade, do mesmo
modo que fazemos na Mecânica Quântica não relativista?
ii) Será que esta é a equação relativista correcta para descrever o electrão?
Z.f.Phys. 40 (1926) 117. Contudo, a história parece ser algo mais interessante (ver S.Weinberg, Quantum
Field Theory, Vol I, Sec. 1.1). Em 1926 Schrödinger publicou quatro artigos sobre a mecânica ondulatória,
em que deriva a ‘sua’ equação, mostra equivalência com a mecânica matricial e só mais tarde, no quarto
artigo, apresenta a equação de onda relativista. Contudo, apesar de ter publicado primeiro a equação que
tem o seu nome e é não relativista, Schrödinger terá derivado inicialmente a equação relativista (13.1.8).
Mas ao calcular o espectro do átomo de hidrogénio, Schrödinger observou que a equação relativista dava
o resultado errado para a estrutura fina do átomo de hidrogénio. No limite não relativista, no entanto,
a equação (de Klein-Gordon) reduzia-se a uma equação que Schrödinger se apercebeu ser útil (a eq. de
Schrödinger) e que foi a eq. inicialmente publicada por ele, apesar de saber que era o limite não relativista
de uma eq. incorrecta! Quando, mais tarde, Schrödinger publicou a eq. relativista (Ann. Phys. 81 (1926)
109), esta já havia sido redescoberta por Klein e Gordon.
440
13.2.1
Introdução à Mecânica Quântica Relativista
Energias negativas
Para respondermos à questão i) consideremos, em primeiro lugar, os estados da equação de
Klein-Gordon análogos aos estados estacionários da equação de Schrödinger. Separando
variáveis:
Φ(xµ ) = T (t)φ(~x) ,
(13.2.1)
a equação de Klein-Gordon fica:
−
m c 2
1 1 d2 T (t) 1
0
+
∆φ(~
x
)
=
;
c2 T (t) dt2
φ
~
(13.2.2)
pelo argumento habitual esta equção separa-se em duas:
−
ω2
1 1 d2 T (t)
=
,
c2 T (t) dt2
c2
1
∆φ(~x) = −k 2 ,
φ
onde introduzimos as constantes ω 2 e k 2 , que obedecem à relação de dispersão:
r
2 4
m2 c4
m
c
ω 2 = k 2 c2 + 02
⇒
ω± = ± k 2 c2 + 02 .
~
~
(13.2.3)
(13.2.4)
A solução geral da primeira equação em (13.2.3) é
T (t) = c+ e−iω+ t + c− e−iω− t ,
(13.2.5)
enquanto que a segunda equação pode ser escrita como
−∆φ(~x) = k 2 φ(~x) ,
(13.2.6)
que é exactamente a forma da equação de Schrödinger livre e independente do tempo.
A diferença fundamental é que no tratamento não relativista o vector de onda de uma
partı́cula livre relaciona-se com a frequência por:
k2 =
p2
2mE
2mω
=
=
2
2
~
~
~
⇔
ω=
~k 2
.
2m
(13.2.7)
e, em particular existe apenas uma frequência para cada vector de onda. No caso relativista,
k 2 relaciona-se com a frequência pela relação de dispersão (13.2.4) e, em particular, existem
duas frequências possı́veis para cada k 2 , correspondendo a um modo de energia positiva e
13.2 Os problemas com a teoria de Klein-Gordon
441
outro de energia negativa. A existência de dois modos para cada comprimento de onda é
uma consequência directa da equação de Klein-Gordon ser de segunda ordem na derivada
temporal. Assim, escrevemos a solução como
Φ(xµ ) = Φ+ (xµ ) + Φ− (xµ ) ,
Φ± (xµ ) = φ(~x)e−iω± t ,
(13.2.8)
onde Φ+ (xµ ) (Φ− (xµ )) correspondem ao modo com energia positiva (negativa), como pode
ser verificado pela acção do operador (13.1.1).
A existência de modos com energia negativa pode ser problemática, se não existir um
limite inferior para as energias negativas. Para ilustrar este ponto considermos a equação
de Klein-Gordon num intervalo. Isto é, requeremos que φ(x) seja não nulo somente em
0 < x < a, anulando-se, por continuidade nos extremos. Esta situação é o análogo a
um poço de potencial de profundidade infinita para a eq. de KG. A solução tem a forma
(13.2.8) com
φ(x) = A sin(kn x) ,
kn =
nπ
, n∈N,
a
onde A é uma constante de normalização. Por (13.2.4),
r
n2 π 2 c2 m20 c4
ω± = ±
+ 2 .
a2
~
(13.2.9)
(13.2.10)
Logo, a energia não está limitada inferiormente; ω− torna-se arbitrariamente grande e negativo para n grande. Isto implica que somente a teoria livre é consistente. Se introduzirmos
interacções que permitam à partı́cula saltar de um nı́vel energético para outro, poderemos
extrair uma energia arbitrariamente grande do sistema quando a partı́cula de Klein-Gordon
saltar para nı́veis de energia arbitrariamente grande e negativa. A existência de tais nı́veis
é uma razão para considerarmos que a equação de Klein-Gordon não é adequada para
descrever quânticamente uma partı́cula relativista com interacções.
13.2.2
Probabilidades negativas
A interpretação das soluções da equação de Schrödinger como amplitudes de probabilidade
foi legitimada por existir um produto escalar. Para sermos concretos consideremos funções
442
Introdução à Mecânica Quântica Relativista
de onda em R3 ; esse produto escalar toma a forma (4.1.6)
Z
(φ, ψ) = d3~xφ∗ (~x)ψ(~x) .
(13.2.11)
Este produto é:
i) positivo (cf. secção 4.1.1), permitindo como tal definir uma norma positiva,
Z
2
||ψ|| = d3~xψ ∗ (~x)ψ(~x) ,
(13.2.12)
associada a uma densidade de probabilidade positiva:
P(~x) = ψ ∗ (~x)ψ(~x) ≥ 0 ,
∀~x ;
(13.2.13)
ii) globalmente conservado na evolução do sistema, dada a hermiticiade do operador
Hamiltoniano (cf. secção 4.4.4):
d
(φ, ψ) = 0 .
dt
(13.2.14)
Note que conservação local de probabilidade é expressa pela equação de continuidade
(4.4.55)
∂
~ x, t) = 0 ,
P(~x, t) + ∇ · J(~
∂t
(13.2.15)
onde o vector densidade de corrente de probabilidade é (4.4.53).
Para a equação de Klein-Gordon podemos introduzir um 4-vector densidade de corrente
conservado, definido por
Jµ (xα ) = i [Φ∗ (xα )∂µ Φ(xα ) − Φ(xα )∂µ Φ∗ (xα )] .
(13.2.16)
A equação de Klein-Gordon garante que ele é conservado:
∂ µ Jµ = 0 .
(13.2.17)
De facto
∂ µ Jµ = i [∂ µ Φ∗ (xα )∂µ Φ(xα ) + Φ∗ (xα )∂ µ ∂µ Φ(xα ) − ∂ µ Φ(xα )∂µ Φ∗ (xα ) − Φ(xα )∂µ ∂ µ Φ∗ (xα )]
= i [Φ∗ (xα )2Φ(xα ) − Φ(xα )2Φ∗ (xα )]
h
2
(13.1.8)
= i −Φ∗ (xα ) m~0 c Φ(xµ ) + Φ(xα )
m0 c 2
~
i
Φ∗ (xµ ) = 0 .
(13.2.18)
13.2 Os problemas com a teoria de Klein-Gordon
443
A equação (13.2.17) é uma versão covariante da equação de continuidade (13.2.15). Por
isso usamos a componente temporal do co-vector Jµ para definir um novo produto escalar :
Z
Z
∗ α
α
α ∂Φ (x )
3
α
3
∗ α ∂Φ(x )
− Φ(x )
,
(13.2.19)
(Φ, Φ) ≡ d ~xJ0 (x ) = i d ~x Φ (x )
∂x0
∂x0
ou, generalizando para campos diferentes e usando x0 = ct
Z
α
∗ α
i
3
∗ α ∂Ψ(x )
α ∂Φ (x )
d ~x Φ (x )
.
(Φ, Ψ) ≡
− Ψ(x )
c
∂t
∂t
(13.2.20)
Note-se que este produto escalar pressupõe uma foliação particular do espaço-tempo: foi
escolhida um certa famı́lia de hiper-superfı́cies espaciais onde se integra. Este produto é
i) Conservado
d
(Φ, Ψ) = 0 ;
dt
(13.2.21)
2 ∗ α
∂ 2 Ψ(xα )
α ∂ Φ (x )
d ~x Φ (x )
− Ψ(x )
∂t2
∂t2
Z
(13.1.8)
= ic d3~x {Φ∗ (xα )∆Ψ(xα ) − Ψ(xα )∆Φ∗ (xα )} = 0 ,
(13.2.22)
de facto
d
i
(Φ, Ψ) =
dt
c
Z
3
∗
α
onde a última igualdade é verificada integrando por partes e negligenciando o termo
fronteira (assume-se que o campo se anula no infinito).
ii) Mas não é positivo:
Fazendo o produto escalar entre modos de energia positiva (energia negativa) (13.2.8)
obtemos
2ω±
(Φ , Φ ) =
c
±
±
Z
d3~xφ∗ (~x)φ(~x) ,
(13.2.23)
que é claramente positivo (negativo): modos de energia negativa têm norma negativa.
Deste modo o produto escalar conservado não nos permite pensar numa solução genérica
da equação de Klein-Gordon como descrevendo uma amplitude de probabilidade, dado que
a densidade de probabilidade correspondente poderia ser negativa. A existência de tais
normas negativas revela que a interpretação de Born não pode ser extrapolada para as
‘funções de onda de Klein-Gordon’. A Mecânica Quântica não relativista não encontra
paralelo na teoria de Klein-Gordon.
444
13.2.3
Introdução à Mecânica Quântica Relativista
Inexistência de spin
No capı́tulo 1 vimos que a força de Lorentz que actua numa partı́cula carregada,2
~
v
~ ,
~ + ×B
(13.2.24)
F~ = q E
c
pode ser reproduzida no formalismo Hamiltoniano tomando
H=
~ 2
(~p − q A/c)
+ qφ .
2m
(13.2.25)
Como discutido nessa altura vimos que a interacção com o campo magnético é efectivamente considerada pela substituição (designada por acoplamento minimal )
q~
p~ −→ p~ − A
.
c
(13.2.26)
Notamos aqui que a interacção com o campo eléctrico é também efectivamente considerada
pela substituição
E → E − qφ ;
(13.2.27)
as duas últimas equações correspondem às componentes espaciais e temporal, respectivamente, da seguinte equação covariante:
E
q
E − qφ
q~
µ
p =
, p~ →
, ~p − A = pµ − Aµ ,
c
c
c
c
(13.2.28)
onde definimos o 4-vector potencial electromagnético como
~ µ = (φ, A)
~ ⇔ A
~ µ = (φ, −A)
~ .
A
(13.2.29)
As substituições (13.2.26) e (13.2.27) transformam a relação relativista para a energia em
2
~ 2 ⇔ pµ − q Aµ = m2 c2 .
(E − qφ)2 = m20 c4 + (c~p − q A)
(13.2.30)
0
c
A equação de Klein-Gordon minimalmente acoplada a um campo electromagnético, é
obtida pela associação (13.1.7) na última equação, obtendo-se
q µ q µ
i~∂µ − Aµ i~∂ − A Φ(xα ) = m20 c2 Φ(xα ) .
c
c
2
(13.2.31)
Neste capı́tulo vamos usar unidades electromagnéticas diferentes das usadas no capı́tulo 1, de modo
a que os campos eléctrico e magnético fiquem com as mesmas dimensões; isto corresponde a transformar
~ → B/c
~ em (1.1.7) e A
~ → A/c
~ em (1.3.20).
B
13.2 Os problemas com a teoria de Klein-Gordon
445
Potencial de Coulomb
Para testar se o electrão do átomo de Hidrogénio é apropriadamente descrito pela equação
de Klein-Gordon (13.2.31), vamos resolver esta equação para o potencial de Coulomb.
Tomamos
Aµ =
e ~
,0 ,
4πǫ0 r
q = −e ,
m0 = me ,
(13.2.32)
onde e é a carga do electrão (em módulo) e procuramos os estados estacionários da equação
de Klein Gordon usando o seguinte ansatz:
Φ(xµ ) = F (r)Yℓm (θ, φ)e−iEt/~ .
(13.2.33)
A equação (13.2.31) fica
~∂
e2
e2
~∂
2
2 2
i
+ ~ ∆ − me c F (r)Yℓm (θ, φ)e−iEt/~ = 0 ,
+
+
i
c ∂t 4πǫ0 cr
c ∂t 4πǫ0 cr
(13.2.34)
ou, usando
1 ∂
∆= 2
r ∂r
L̂2
2 ∂
r
− 2 2 ,
∂r
r ~
(13.2.35)
obtemos
"
E α~
+
c
r
2
~2 d
+ 2
r dr
#
2
d
~
ℓ(ℓ
+
1)
r2
−
− m2e c2 F (r) = 0 ,
dr
r2
(13.2.36)
onde introduzimos a constante de estrutura fina α, dada por (2.2.4). Escrevendo
F (r) =
R(r)
,
r
(13.2.37)
a equação fica
d2
−r
R(r) =
dr 2
2
E 2 − m2e c4 2 2Eα
2
R(r) .
r +
r − ℓ(ℓ + 1) − α
~ 2 c2
c~
(13.2.38)
Notemos que, em primeira aproximação em v/c,
E 2 − m2e c4 =
me c2
p
1−
(v/c)2
!2
− m2e c4 ≃ m2e v 2 c2 = 2me Ec c2 ,
E ≃ me c2 , (13.2.39)
446
Introdução à Mecânica Quântica Relativista
onde Ec é a expressão habitual para a energia cinética não relativista; negligenciando ainda
o termo em α2 em (13.2.38), esta equação reduz-se a
2
2me Ec 2
me e2
2 d
R(r) ≃
r +
r − (ℓ(ℓ + 1)) R(r) ,
−r
dr 2
~2
2πǫ0 ~2
(13.2.40)
que coincide com a equação (6.4.3) que descreve o átomo de Hidrogénio (sem spin) na
mecânica quântica não relativista. Portanto, no limite não relativista, a equação de KleinGordon acoplada a um campo electromagnético dará o espectro correcto para o átomo de
hidrogénio (6.4.18). Contudo este resultado só é válido em primeira ordem em α e vimos
no capı́tulo 11 as primeiras correcções que originam a estrutura fina. Se a equação de
Klein-Gordon for a equação correcta para descrever o electrão do átomo de Hidrogénio,
essas correcções deverão emergir naturalmente da solução de (13.2.38). É simples obter a
solução exacta desta equação usando os resultados do capı́tulo 6: tal como para (6.4.3),
transformamos (13.2.38) na equação de Whittaker (6.4.4) fazendo
z2
m2 c4 − E 2 2
2p 2 4
= e 2 2
r ⇔ z=
me c − E 2 r ,
4
~c
~c
(13.2.41)
que é a relação análoga a (6.4.15) e
Eα
k=p
,
m2e c4 − E 2
m=
s
1
ℓ+
2
2
− α2 ,
(13.2.42)
que são as relações análogas a (6.4.16). Como visto em detalhe na secção 6.4, para que a
função de Whittaker convirja quando z → +∞, tem de existir um inteiro n0 tal que
n0 + m − k + 1/2 = 0 ,
n0 ∈ N0 .
(13.2.43)
Esta condição fica, com as identificações anteriores
s
2
1
Eα
1
+ =0,
n0 +
− α2 − p
ℓ+
2
4
2
2
2
me c − E
(13.2.44)
que, introduzindo o número quântico principal N ≡ n0 + ℓ + 1 e resolvendo para a energia
fica

−1/2


α2


EN,ℓ = me c2 1 + 2 
q


2
N − ℓ − 21 +
ℓ + 12 − α2
.
(13.2.45)
13.2 Os problemas com a teoria de Klein-Gordon
447
Este é o espectro de energias exacto obtido da equação de Klein-Gordon acoplada ao
potencial de Coulomb; depende de dois números quânticos, N e ℓ que são os números
quânticos principal e de momento angular habituais. Podemos agora verificar que este
espectro não explica correctamente a estrutura fina do átomo de Hidrogénio. Fazendo uma
expansão de (13.2.45) em potências de α obtém-se:
EN,ℓ = me c
2
α2
α4
1−
−
2N 2 2N 4
3
N
1 −
4
ℓ+ 2
6
+ O(α )
.
(13.2.46)
O primeiro termo é a energia associada à massa em repouso do electrão; o segundo termo é
o espectro de energias obtido no capı́tulo 6 para o átomo de Hidrogénio (6.4.18); o terceiro
termo deveria ser o termo de estrutura fina. Para o nı́vel N = 2 este termo separa as
orbitais 2s e 2p, que passam a ter energia (até ordem α4 )
E2,0 = −me c
2
α2 13α4
+
8
128
,
E2,1 = −me c
2
α2 7α4
+
8
384
,
(13.2.47)
que estão portanto separadas por
E2,1 − E2,0 =
8 4me c2 α4
.
3 128
(13.2.48)
Como discutido na secção 11.1.4 a separação observada experimentalmente (e correctamente explicada pela teoria perturbativa) é de apenas 4me c2 α4 /128. Portanto a equação
de Klein-Gordon não explica correctamente a estrutura fina. Logo a equação de KleinGordon não descreve correctamente a fı́sica do electrão do átomo de Hidrogénio.
A razão é que a função de onda de Klein-Gordon não contém graus de liberdade de spin,
que é fundamental para obter a estrutura fina correcta. De facto, como visto na secção
9.4, a descrição (não relativista) de partı́culas de spin 1/2 envolve 2-spinores que contêm
duas funções de onda espaciais, cada uma descrevendo a amplitude de probabilidade de um
estado de spin. A equação de Klein-Gordon só possui uma função espacial, pelo que não
possui os graus de liberdade necessários para descrever o spin e como tal para descrever
apropriadamente o electrão.
448
13.3
Introdução à Mecânica Quântica Relativista
A teoria de Dirac
Paul Dirac sugeriu, em 1928, uma equação relativista para o electrão, que naturalmente
introduzia o seu spin, explicando correctamente a sua interacção com campos electromagnéticos, e que tinha um produto escalar positivo associado. A intuição de Dirac foi
que os problemas da equação de Klein-Gordon, nomeadadamente as probabilidades e energias negativas, estariam associados a esta equação ser de segunda ordem nas derivadas
temporais. Dirac tentou, por isso, factorizar a equação de Klein-Gordon para obter uma
equação de primeira ordem na derivada temporal e relativista. Dirac tentou factorizar a
expressão da energia relativista (13.1.2) escrevendo-a da seguinte forma:
pµ pµ − m20 c2 = 0 ⇔ (γ µ pµ + m0 c)(γ ν pν − m0 c) = 0 ,
(13.3.1)
o que é verdade se o objecto γ µ obedecer à seguinte propriedade:
γ (µ γ ν) ≡
1 µ ν
(γ γ + γ ν γ µ ) = η µν .
2
(13.3.2)
Se as componentes de γ µ forem números é manifestamente impossı́vel resolver estas equações.
Por exemplo teriamos de resolver simultaneamente
(γ 0 )2 = 1 ,
(γ 1 )2 = −1 ,
γ 0γ 1 = 0 .
(13.3.3)
A grande (enormı́ssima!) intuição de Dirac foi sugerir que as componentes de γ µ poderiam
ser matrizes. Como matrizes genericamente não comutam, a factorização (13.3.1) seria
verdadeira se
{γ µ , γ ν } = 2η µν ,
(13.3.4)
{A, B} ≡ AB + BA .
(13.3.5)
onde definimos o Anti-comutador
As relações de anti-comutação (13.3.4) definem uma álgebra denominada álgebra de Clifford
e as matrizes ‘gama’ são designadas por matrizes de Dirac. Usando a associação (13.1.7),
obtemos uma equação de primeira ordem igualando a zero qualquer um dos factores em
13.3 A teoria de Dirac
449
(13.3.1), a actuar numa função de onda Ψ(~x), que será um vector coluna no mesmo espaço
vectorial em que estão definidas as matrizes γ µ . Escolhendo o segundo factor em (13.3.1),
que corresponde à energia positiva, obtemos a equação de Dirac:
i~γ µ ∂µ Ψ(xα ) = m0 cΨ(xα ) .
(13.3.6)
As matrizes γ µ
Para estudar detalhadamente a equação de Dirac temos de ter uma forma explı́cita para
as matrizes γ µ , µ = 0, 1, 2, 3. Em primeiro lugar podemos perguntar qual será a dimensão
destas matrizes. Para cada dimensão espaço-temporal, existe uma dimensão mı́nima para
a representação da álgebra de Clifford; em quatro dimensões a representação minimal da
álgebra de Clifford tem dimensão quatro que é a dimensão das matrizes γ µ . Há várias
escolhas diferentes (ditas representações) para estas matrizes. Aqui iremos usar a seguinte
representação:

γ0 = 
1
0
0 −1

 ,

γi = 
0
σi
−σi
0

 ,
(13.3.7)
onde σi são as matrizes de Pauli (9.1.36) e 1 é a matriz identidade em duas dimensões.
A ‘função de onda de Dirac’ Ψ(xα ), será, portanto, representada por um vector coluna
quatro dimensional que é um spinor de quatro componentes ou 4-spinor :


α
Ψ (x )


  1

α 
α


Ψ
(x
)
[Ψ]
(x
)
 ,
= 2
Ψ(xα ) = 


α
α
 χ1 (x ) 
[χ] (x )


χ2 (xα )
(13.3.8)
onde [Ψ]a (xα ), a = 1, 2 representam dois 2-spinores, na notação da secção (9.4.1). Se no
caso da equação de Klein-Gordon tinhamos graus de liberdade insuficientes para descrever
uma partı́cula com spin 1/2, aparentemente, na equação de Dirac temos demasiados graus
de liberdade para tal!...
Exercı́cio: Verifique que as matrizes de Dirac (13.3.7) obedecem à álgebra de Clifford
(13.3.4).
450
Introdução à Mecânica Quântica Relativista
13.3.1
Os sucessos da equação de Dirac
Vamos agora enumerar, sem demonstrar, os sucessos da teoria de Dirac.
i) É possı́vel definir um produto escalar, que é invariante por transformações de Lorentz,
conservado e definido positivo; a norma de uma função de onda de Dirac é
(Ψ, Ψ) =
Z
3
†
d ~xΨ Ψ =
Z
d3~x |Ψ1 (xα )|2 + |Ψ2 (xα )|2 + |χ1 (xα )|2 + |χ2 (xα )|2 ,
(13.3.9)
que generaliza para 4-spinores a forma da norma para 2-spinors (9.4.20).
ii) No limite não relativista, a teoria de Dirac reduz-se à teoria de Pauli, com o factor
giromagnético correcto para o electrão, g = 2. Para obter este resultado é necessário
acoplar a equação de Dirac a um campo electromagnético, o que é feito pelo acoplamento minimal (13.2.28). Obetém-se a equação de Dirac na presença de um campo
electromagnético descrito pelo 4-potencial Aµ :
iq
i~γ ∂µ + Aµ Ψ(xα ) = m0 cΨ(xα ) .
c~
µ
(13.3.10)
Especializando para o electrão q = −e. Uma manipulação desta equação com, a
aproximação
p0 c ≃ m0 c2 + H ,
(13.3.11)
onde H ≪ m0 c2 leva ao resultado, considerando apenas campo magnético
HΨ(xα ) ≃
(
~ 2
e~
(~p + eA/c)
~
+
~σ · B
2m0
2m0 c
)
,
(13.3.12)
que é o Hamiltoniano de Pauli (9.3.4) (com a diferente convenção para os campos electromagnéticos e q = −e) na ausência de campo eléctrico, com a razão giromagnética
correcta.
iii) Na presença de um campo de Coulomb, a solução exacta para o espectro de energias
13.3 A teoria de Dirac
451
da equação de Dirac é
EN,J

−1/2


α2


= me c 1 + 2 
q


2
N − J − 21 +
J + 12 − α2
2
.
(13.3.13)
Esta é a fórmula (11.1.104) que, como discutido na secção (11.1.4) dá os nı́veis correctos para a estrutura fina do átomo de Hidrogénio. O número quântico J é o número
quântico de momento angular total (que tem de ser apropriadamente definido). Notese que é a mesma fórmula que (13.2.45) substituindo J ↔ ℓ o que demonstra que a
incapacidade da equação de Klein-Gordon descrever a estrutura fina resulta de não
levar em conta o spin.
A equação de Dirac possui, tal como a equação de Klein-Gordon, estados de energia
negativa, o que, como discutido anteriormente pode originar problemas na teoria interactiva. No entanto, como a equação de Dirac descreve fermiões, Dirac concebeu uma teoria
(do ‘mar de electrões’) em que todos estes estados de energia negativa estariam preenchidos (possı́veis vagas eram interpretadas como anti-partı́culas, isto é, positrões). Assim, o
problema de os usar para extrair infinita energia do sistema era resolvido.
No entanto esta interpretação, bem como a interpretação da teoria de Dirac como
descrevendo a Mecânica Quântica Relativista de uma partı́cula de spin 1/2, foi rapidamente
ultrapassada. O ponto fundamental é que a Mecânica Quântica Relativista não deve ser
vista como a descrição de uma partı́cula. A possibilidade relativista de conversão de
massa em energia torna a Mecânica Quântica Relativista necessariamente uma teoria de
muitas partı́culas. Esta é a perspectiva da Teoria Quântica de Campo, onde os campos são
promovidos a operadores (deixando de ser vistos como funções de onda) sujeitos a regras
de comutação ou anti-comutação. Este procedimento de promover os campos a operadores
com regras de comutação/anti-comutação é denominado, por vezes, segunda quantificação
(pois a primeira é a quantificação das observáveis que discutimos no capı́tulo 4). Em teoria
Quântica de Campo, quer a equação de Dirac quer a equação de Klein-Gordon encontram
452
Introdução à Mecânica Quântica Relativista
naturalmente o seu lugar, descrevendo a dinâmica de sistemas de partı́culas de spin 1/2 e
0 respectivamente.
13.4
Sumário
Neste capı́tulo fizemos uma breve introdução ao casamento das ideias da Relatividade
Restrita com as ideias da Mecânica Quântica. Uma primeira tentativa deste matrimónio
resulta na equação de Klein-Gordon, que tem vários problemas para ser compatibilizada
quer com as ideias da Mecânica Quântica não Relativista, quer com a fı́sica do electrão.
Estes problemas podem ser resolvidos pela equação de Dirac. No entanto, a tentativa de
extrapolar as ideias da Mecânica Quântica não Relativista para uma Mecânica Quântica
Relativista acaba por ser naturalmente ultrapassada por uma descrição que leva em conta
muitas partı́culas e não apenas uma - a Teoria Quântica de Campo.
Parte III
Tópicos Avançados e Modernos
CAPÍTULO
14
Formulação de integrais de caminho da Mecânica
Quântica
CAPÍTULO
15
Mecânica Quântica Super-simétrica
CAPÍTULO
16
Introdução à teoria da Informação Quântica
Parte IV
Apêndices
APÊNDICE
A
Geometria da Transformada de Legendre
A transição do Lagrangeano para o Hamiltoniano é um exemplo de uma transformada de
Legendre, de que vamos agora fornecer uma interpretação geometrica. Por simplicidade
vamos considerar apenas o caso com uma única variável dinâmica.
Consideremos uma função diferenciavel L(v), de um variável v. O gráfico de L(v) é
uma curva contı́nua de todos os pontos (v, L(v)) como a representada na figura A.1. A
derivada da função em cada ponto é denotada
p(v) ≡
dL
.
dv
(A.1)
A transformada de Legendre é uma maneira de reproduzir a curva inteiramente em termos
de p, sem referência a v; p torna-se a variável independente cujos valores são usados para
construir a curva. Mas tal como os valores de v sem os valores de L são insuficientes para
construir a curva, somente os valores de p são também insuficientes, pelo que necessitamos
de uma nova função H(p).
A função H(p) é construida da seguinte maneira. Consideremos a tangente à curva
L(v) no ponto v = v0 . O declive da tangente é
p(v0 ) = p0 ,
(A.2)
460
Geometria da Transformada de Legendre
L(v)
v0
v
y0 = L(v0 ) − p0 v0
Figura A.1: A curva que representa um ‘Lagrangeano’ L(v) como função da velocidade v.
A tangente à curva em v0 tem declive p0 e ordenada na origem y0 ≡ L(v0 ) − p0 v0 .
e a ordenada na origem da tangente é
y0 = L(v0 ) − p0 v0 .
(A.3)
Para um ponto arbitrário, (v, L(v)), a tangente à curva tem declive p = dL/dv e tem
ordenada na origem
y(v, p) = L(v) − pv .
(A.4)
Vamos assumir que (A.1) é invertivel. Voltaremos a este ponto mais tarde. Podemos então
obter v = v(p) de um modo único. Definimos a função H(p) como
H(p) = −y(v(p), p) = pv(p) − L(v(p)) .
(A.5)
O conhecimento de p e H(p) permite-nos reconstruir a curva da figura A.1. De facto, cada
combinção (p, H(p)) corresponde a uma linha de declive p e ordenada na origem H(p) no
plano (v, L). Geometricamente, a curva L(v) é o envelope destas linhas, a curva contı́nua
tangente a todas elas. Esta construção é esquematizada na figura A.2. Analiticamente, a
partir do conhecimento de H(p) determinamos v = v(p)
dv(p) dL(v(p))
dH(p)
=v+p
−
= v(p) .
dp
dp
dp
(A.6)
Assumindo a invertibilidade de v = v(p) obtemos p = p(v) e como tal de (A.5) obtemos
L(v) = H(p(v)) − p(v)v .
(A.7)
461
L(v)
v
Figura A.2: Conhecendo o declive das tangentes, p, e as suas ordenadas na origem, H(p),
é possivel reconstruir a forma da curva L(v).
A semelhança desta equação com (A.5) é sugestiva. Tal como (p, H(p)) é a representação
da curva L(v) no plano (v, L) pelo (declive, (menos) ordenada na origem) das tangentes
a essa curva, também (v, L(v)) é a representação da curva H(p) no plano (p, H) pelas
tangentes a essa curva.
Uma nota sobre a invertibilidade de p(v). Invertibilidade significa que p(v) é injectiva.
Logo p(v) não tem máximos ou mı́nimos. Dado que p(v) = dL/dv, concluimos que L(v)
não pode ter pontos de inflexão. Por um raciocı́nio semelhante concluimos que também
H(p) não pode ter pontos de inflexão. Em mais do que uma dimensão, invertibilidade
significa que as matrizes Hessianas
∂2L
,
∂v i ∂v j
são não singulares.
∂2H
,
∂pi ∂pj
(A.8)
APÊNDICE
B
Princı́pio do tempo mı́nimo de Fermat
Neste apêndice derivamos as leis da reflexão e refracção ondulatórias recorrendo ao princı́pio
do tempo mı́nimo de Fermat.
B.1
Reflexão
Consideremos dois pontos no plano xy, como na figura B.1. Consideremos um raio de luz
que une os dois pontos através de uma linha recta que é reflectida no eixo do x. Várias
y
∆x
x
Figura B.1: Dois pontos que distam de ∆x ao longo do eixo do x podem ser unidos por
uma infinidade de trajectórias que reflectem no eixo do x. De todas essas trajectórias, a
que minimiza a distância entre os dois pontos obedece à lei da reflexão.
464
Princı́pio do tempo mı́nimo de Fermat
y
l1
θ1
θ2
l2
x
∆x
Figura B.2: A trajectória real vai obedecer a θ1 = θ2 .
trajectórias possiveis estão desenhadas na figura B.1. O princı́pio do tempo mı́nimo de
Fermat diz-nos que a trajectória real é a que minimiza o tempo que o raio de luz demora
de um ponto até ao outro. Como a velocidade é constante, a trajectória real será aquela
que minimiza a distância.
Considermos uma trajectória possı́vel que faz ângulos θ1 e θ2 com a perpendicular à
superfı́cie de reflexão, conforme esquematizado na figura B.2. A distância total percorrida
é
∆s(θ1 , θ2 ) =
l1
l2
+
,
cos θ1 cos θ2
(B.1)
que é a quantidade que pretendemos minimizar, como função de θ1 e θ2 , mas onde l1 e l2
são fixos. Ou seja pertendemos calcular θ1 e θ2 de modo que
0 = d(∆s(θ1 , θ2 )) =
sin θ1 l1
sin θ2 l2
dθ1 +
dθ2 .
2
cos θ1
cos2 θ2
(B.2)
A extremização está sujeita à condição de que a distância total segundo x, ∆x é constante
∆x =
sin θ1 l1 sin θ2 l2
+
= constante .
cos θ1
cos θ2
(B.3)
Diferenciando esta equação obtemos
l2
l1
dθ1 +
dθ2 = 0 ,
2
cos θ1
cos2 θ2
(B.4)
que, substituindo em (B.2), resulta em
sin θ2 l2
sin θ1 l2
dθ
=
dθ2
2
cos2 θ2
cos2 θ2
⇔
sin θ1 = sin θ2 ,
(B.5)
B.2 Refracção
465
ou, como 0 < θ1 , θ2 < π/2,
θ1 = θ2 ,
(B.6)
que é a lei da reflexão.
B.2
Refracção
Consideramos agora dois pontos em dois meios diferentes. No meio 1, a luz move-se à
velocidade v1 ; no meio 2 a luz move-se à velocidade v2 . Na figura B.3 mostra-se um conjunto
de trajectórias, rectilı́neas em cada meio, que unem os dois pontos. A minimização do
tempo de viagem de um raio de luz não corresponde neste caso à minimização da distância
devido à diferente velocidade nos dois meios. A minimização do tempo irá corresponder a
um compromisso entre viajar o máximo de distância possı́vel no meio onde a velocidade é
maior, sem, contudo, aumentar demasiado a distância a percorrer.
y
MEIO 1
MEIO 2
x
Figura B.3: Várias trajectórias possı́veis para um raio de luz unindo dois pontos em meios
diferentes.
Tomando uma trajectória como aquela exibida na figura B.4, pertendemos extremizar
∆t, dado por
∆t(θ1 , θ2 ) =
∆x
l1
l2
=
+
,
v
v1 cos θ1 v2 cos θ2
(B.1)
ou seja determinar θ1 , θ2 de modo a que
0 = d(∆t(θ1 , θ2 )) =
l2 sin θ2
l1 sin θ1
dθ
+
dθ2 .
1
v1 cos2 θ1
v2 cos2 θ2
(B.2)
466
Princı́pio do tempo mı́nimo de Fermat
y
l1
θ1
MEIO 1
∆x
MEIO 2
x
l2
θ2
Figura B.4: A trajectória real vai obedecer à lei de Snell.
A extremização é sujeita à condição de que a distância segundo x, ∆x é constante,
∆x =
l1 sin θ1 l2 sin θ2
+
= constante .
cos θ1
cos θ2
(B.3)
Diferenciando a última equação obtemos
l1
l2
dθ
+
dθ2 = 0 ,
1
cos2 θ1
cos2 θ2
(B.4)
que substituindo em (B.2) resulta em
v1
sin θ1
=
.
sin θ2
v2
Obtemos assim a Lei de Snell.
(B.5)
APÊNDICE
C
Análise de Fourier
A análise de Fourier fornece a expansão de uma função f (x) em termos de senos e cossenos.
Para este próposito distinguem-se dois tipos de funções.
C.1
Séries de Fourier
Se a função é periódica com perı́odo L ∈ R, isto é
f (x) = f (x + L) ,
então as funções sinusoidais na expansão têm de ter perı́odo
2πn
2πn(x + L)
2πnx
kn ≡
= sin
,
, n ∈ N
⇒
sin
L
L
L
(C.1)
(C.2)
e analogamente para o cosseno. Funções sinusoidais com outros perı́odos não respeitam
a periodicidade da função a expandir. Neste caso, a expansão de Fourier é uma Série de
Fourier
+∞
a0 X
+
[an cos(kn x) + bn sin(kn x)] ,
f (x) =
2
n=1
(C.3)
e toda a informação acerca da função fica contida nos coeficientes
{a0 , an , bn } ,
(C.4)
468
Análise de Fourier
a que se chama o espectro de Fourier de f (x). Uma vantagem das séries de Fourier
relativamente a séries de Taylor é que a função a expandir não necessita de ser diferenciável
em todos os pontos; de facto pode até ser descontinua num número finito de pontos do
intervalo [x0 , x0 + L] para qualquer x0 . A condição essencial para a existência da série
de Fourier é integrabilidade.1 O teorema de Fourier diz-nos como calcular os coeficientes
(C.4):
Teorema: (Fourier) Seja f (x) : R −→ R com as seguintes propriedades
i) f(x) é periódica com perı́odo L;
ii) f(x) é integrável em [x0 , x0 + L] (ou é uma função de quadrado integrável conforme
(C.20));
então, a série de Fourier de f (x), (C.3) onde
2
an =
L
Z
x0 +L
f (x) cos(kn x)dx ,
x0
2
bn =
L
Z
x0 +L
f (x) sin(kn x)dx ,
(C.5)
x0
converge para qualquer x ∈ R. Se num dado ponto, y, f (x) é contı́nua, a série converge
para f (y); se é descontinua converge para a média dos limites à esquerda e à direita de
f (x).
Não vamos aqui demonstrar o teorema de Fourier, mas vamos mostrar a compatibilidade
de (C.5) com (C.3), introduzindo (C.3) nas expressões (C.5):
• a0 :
2
a0 =
L
Z
x0 +L
x0
!
+∞
a0 X
+
[an cos(kn x) + bn sin(kn x)] dx ,
2
n=1
(C.6)
que é claramente verificada pois, para n ∈ N
Z
1
x0 +L
sin(kn x)dx =
x0
Z
x0 +L
cos(kn x)dx = 0 .
(C.7)
x0
Rigorosamente o teorema de Fourier é mais geral do que o exposto aqui; contudo em mecânica quântica
a propriedade essencial é integrabilidade.
C.1 Séries de Fourier
469
• an :
2
an =
L
Z
!
+∞
a0 X
+
[am cos(km x) + bm sin(km x)] dx
2
m=1
x0 +L
cos(kn x)
x0
+∞
X
2
=
L m=1
Z
x0 +L
.
(C.8)
cos(kn x) (am cos(km x) + bm sin(km x)) dx
x0
Assim, temos de lidar com
Z x0 +L
cos(kn x) cos(km x)dx =
x0
L
δn,m ,
2
(C.9)
onde introduzimos o delta de Kronecker, definido como

 0 se n 6= m
δn,m ≡
,
 1 se n = m
e
Z
(C.10)
x0 +L
cos(kn x) sin(km x)dx = 0 ,
(C.11)
x0
e em baixo iremos também necessitar de
Z x0 +L
L
sin(kn x) sin(km x)dx = δn,m .
2
x0
(C.12)
É agora trivial verificar (C.8).
• bn :
2
bn =
L
Z
x0 +L
x0
+∞
X
2
=
L m=1
sin(kn x)
Z
x0 +L
!
+∞
a0 X
+
[am cos(km x) + bm sin(km x)] dx
2
m=1
,
(C.13)
sin(kn x) (am cos(km x) + bm sin(km x)) dx
x0
que é facilmente verificada usando (C.11) e (C.12).
C.1.1
Representação em termos de ondas planas
Uma outra maneira de exprimir a série de Fourier é usando exponenciais imaginárias em
vez de senos e cossenos. A fórmula de Euler
eiθ = cos θ + i sin θ ,
(C.14)
470
Análise de Fourier
permite-nos escrever as funções sinusoidais como
cos(kn x) =
1 ikn x
e
+ e−ikn x ,
2
sin(kn x) =
Podemos então reexpressar (C.3) como
+∞
X
f (x) =
1 ikn x
e
− e−ikn x .
2i
cn eikn x ,
(C.15)
(C.16)
n=−∞
onde o espectro de Fourier é agora descrito pelos coeficientes {cn }, que em geral são complexos, e estão relacionados com {a0 , an , bn } do seguinte modo

an − ibn


para n ∈ N


2



a0
.
cn =
para n = 0

2





 a−n + ib−n para − n ∈ N
2
(C.17)
Nesta representação da série de Fourier, cada coeficiente no espectro de Fourier, cn , aparece
associado a uma onda plana eikn x . Note-se, para uso futuro, que o equivalente às relações
(C.9), (C.11), (C.12), é, na linguagem de ondas planas, simplesmente
Z x0 +L
dxei(kn −km ) = Lδn,m , n, m ∈ Z .
(C.18)
x0
Note-se ainda que o espectro de Fourier é calculado nesta linguagem pela relação
Z
1 x0 +L
f (x)e−ikn x dx .
(C.19)
cn =
L x0
C.1.2
O Espaço de Hilbert e a Igualdade de Bessel-Parseval
Em Mecânica Quântica f (x) irá geralmente representar uma função de onda, denotada por
Ψ(x), que é em geral complexa; para ser normalizável no intervalo [a, b] a função de onda
tem de obedecer a
2
kΨk ≡
Z
a
b
|Ψ(x)|2 dx < ∞ ,
(C.20)
o que equivale a dizer que é uma função de quadrado somável. O conjunto de todas
as funções de quadrado somável em [a, b] formam o Espaço de Hilbert L2 ([a, b]), que é
C.2 Integrais de Fourier e Transformadas de Fourier
471
por isso o ‘habitat’ natural das funções de onda fı́sicas que encontramos em Mecânica
Quântica. É um resultado de grande importância para a aplicação de séries de Fourier em
Mecânica Quântica que todas as funções de quadrado integrável num intervalo admitem
uma expansão em série de Fourier nesse intervalo.
A norma (ao quadrado) kΨk2 pode ser calculada directamente do espectro de Fourier,
uma vez que este contem toda a informação sobre a função. O modo como o fazer é descrito
pela Igualdade de Bessel-Parseval :
1
L
Z
x0 +L
2
dx|f (x)| =
x0
+∞
X
n=−∞
|cn |2 .
(C.21)
A demonstração é trivial usando (C.18). Por outro lado, usando (C.17) podemos reescrever
a igualdade de Bessel-Parseval em termos de {a0 , an , bn }
1
L
C.2
Z
x0 +L
x0
+∞
|a0 |2 X dx|f (x)| =
+
|an |2 + |bn |2 .
4
n=1
2
(C.22)
Integrais de Fourier e Transformadas de Fourier
Se a função f (x) não é periódica, funções sinusoidais com qualquer perı́odo podem ser
usadas na expansão de Fourier que passa a ser uma soma sobre todos os valores de k ∈ R
e como tal um integral de Fourier em vez de uma série discreta. Assim, esperamos que
(C.16) seja substituido por uma expressão do tipo
Z +∞
f (x) =
c(k)eikx dx .
(C.23)
−∞
De facto, tirando o limite L → ∞ das expressões que temos para a série de Fourier
podemos mostrar que assim é. Denotemos a função com perı́odo L por fL (x). Notando
que kn+1 − kn = 2π/L, escolhendo x0 = −L/2 e introduzindo (C.19) em (C.16) obtemos
Z L/2
∞
1 X
ikn x
fL (x) =
(kn+1 − kn )e
fL (y)e−ikny dy ,
2π n=−∞
−L/2
(C.24)
que tem a forma de uma soma de Riemann. O limite L → ∞ equivale a kn → kn+1 e
fL (x) → f (x). Neste limite, o somatório é promovido a um integral e kn passa a ser uma
472
Análise de Fourier
variável contı́nua, pelo que obtemos
Z +∞
Z +∞
1
−iky
ikx
f (y)e
dy dk ,
e
f (x) =
2π −∞
−∞
ou
1
f (x) = √
2π
Z
1
f˜(k) ≡ √
2π
Z
onde definimos
+∞
(C.25)
ikx
˜
f(k)e
dk ,
(C.26)
f (x)e−ikx dx .
(C.27)
−∞
+∞
−∞
Claramente f˜(k) desempenha o papel de espectro de Fourier, que passa a ser uma variável
contı́nua; ou seja, uma função no plano complexo que contem toda a informação sobre f (x).
A este espectro contı́nuo de Fourier chama-se transformada de Fourier. Assim, existe uma
dualidade entre as duas funções
˜
f (x) ←→ f(k)
,
(C.28)
isto é são duas descrições diferentes do mesmo objecto.
A existência de um integral de Fourier para uma função é garantida se a função e a sua
transformada de Fourier forem integráveis:
Teorema da Inversão de Fourier: Se f (x) for integrável e f˜(k) definida em (C.27)
também o for, então a representação de f (x) como um integral de Fourier (C.26) existe.
C.2.1
A fórmula de Parseval-Plancherel
Tal como para as séries de Fourier é de esperar que do espectro de Fourier, que neste caso
é a transformada de Fourier, se possa deduzir a norma da função. A fórmula análoga à
fórmula de Bessel-Parseval,(C.21), é chamada fórmula de Parseval-Plancherel (por vezes
também denominada teorema de Fourier-Plancherel):
Z +∞
Z +∞
2
˜ 2 dk .
|f (x)| dx =
|f(k)|
−∞
(C.29)
−∞
Exemplo A1: Consideremos a função

 1 se |x| < a
f (x) =
 0 se |x| > a
,
a>0
(C.30)
C.2 Integrais de Fourier e Transformadas de Fourier
cuja transformada de Fourier é
r
Z +∞
Z a
2 sin ka
1
1
.
f˜(k) ≡ √
f (x)e−ikx dx = √
e−ikx dx =
π k
2π −∞
2π −a
473
(C.31)
Para verificarmos a fórmula de Parseval-Plancherel temos de calcular tanto a norma de
f (x) como a norma de f˜(k) no espaço de Fourier. A primeira é elementar
Z +∞
|f (x)|2 dx = 2a .
(C.32)
−∞
A segunda fica
Z
2 +∞ sin2 (ka)
2
˜
dk .
(C.33)
|f (k)| dk =
π −∞
k2
−∞
A função sin2 x/x2 (tal como sinx/x) não tem uma primitiva que se possa escrever como
Z
+∞
um número finito de funções elementares. Mas utilizando o teorema dos resı́duos em análise
complexa mostra-se que
+∞
sin2 x
dx = π ,
(C.34)
x2
−∞
resultado com o qual se prova que (C.33) é igual a (C.32). De outro ponto de vista, usando
Z
o teorema de Parseval-Plancherel fornece um método alternativo aos métodos complexos
de calcular o integral (C.34).
Exemplo A2: Consideremos a função Gaussiana
f (x) = e−x
2 /2a2
,
cuja transformada de Fourier é
Z +∞
−k 2 a2 /2 Z +∞
1
e
2 2
2
−ikx
˜ ≡√
f(k)
f (x)e
dx = √
e−(x+ika ) /2a dx ,
2π −∞
2π
−∞
ou, usando o resultado básico em integração de Gaussianas
r
Z +∞
π
−αx2
, α>0,
e
dx =
α
−∞
(C.35)
(C.36)
(C.37)
obtemos
2 2
f˜(k) = ae−k a /2 .
(C.38)
O resultado a reter é que a transformada de Fourier de uma Gaussiana é ainda uma
Gaussiana. Mas note que tanto o coeficiente como o expoente se alteram. Usando (C.37)
é muito fácil verificar a fórmula de Parseval-Plancherel neste caso.
474
C.2.2
Análise de Fourier
Quantidades estatı́sticas e a relação de incerteza
Em estatı́stica define-se a função de distribuição de probabilidade ou densidade de probabilidade, P(x), de uma variável aleatória, x, definida no intervalo [a, b], como sendo uma
distribuição que obedece a
Z
P(x) > 0 ,
b
a
P(x)dx = 1 .
(C.39)
xP(x)dx ;
(C.40)
Definem-se também
• Valor esperado de x, ou valor médio de x
hxi ≡
Z
b
a
• Analogamente, para uma função de x, h(x), define-se o valor esperado de h(x)
hh(x)i ≡
Z
b
h(x)P(x)dx ;
(C.41)
a
• A variância ou dispersão é definida como
2
Z
b
σx ≡ h(x − hxi) i =
(x − hxi)2 P(x)dx
a
;
Z b
2
2
2
2
=
(x − 2xhxi + hxi )P(x)dx = hx i − hxi
(C.42)
a
• O desvio padrão de x é
∆x =
√
σx .
(C.43)
Como a mecânica quântica fornece uma descrição probabilı́stica dos fenómenos fı́sicos é
natural usar esta terminologia estatı́stica. Mais concretamente, a entidade fundamental em
mecânica quântica, a função de onda Ψ(x) - uma solução da equação de Schrödinger-, é uma
amplitude de probabilidade, em geral uma função complexa. A densidade de probabilidade
é
P(x) =
Ψ(x)Ψ(x)∗
,
kΨk2
(C.44)
C.2 Integrais de Fourier e Transformadas de Fourier
475
onde ”∗”denota conjugação complexa, que claramente obedece a (C.39). O que a teoria
quântica produz para um dado sistema fı́sico são os ‘valores esperados’ das variáveis fı́sicas
em jogo.
O famoso prı́ncipio da incerteza de Heisenberg, um dos pilares da mecânica quântica,
não é mais do que um exemplo da seguinte propriedade das transformadas de Fourier:
Relação de incerteza: Seja x uma variável aleatória definida em R, cuja distribuição
é descrita por uma ‘função de onda’ Ψ(x) e pela densidade de probabilidade associada P(x).
Seja ∆x o desvio padrão de x associado a esta distribuição. Por outro lado seja Ψ̃(k) a
transformada de Fourier de Ψ(x). Associemos a esta função de onda no espaço de Fourier
uma densidade de probabilidade Pk (k). Seja ∆k o desvio padrão de k associado a esta
distribuição. É uma propriedade das transformadas de Fourier (em uma dimensão) que
∆x∆k ≥
1
.
2
(C.45)
O significado desta relação de incerteza é claro quando comparamos a forma de uma
Gaussiana (C.35) com a sua transformada de Fourier (C.38). Uma função de onda Gaussiana normalizada pode-se escrever
2
2
e−x /4(∆x)
Ψ(x) = p√
,
2π∆x
(C.46)
onde ∆x é o desvio padrão de x associado à respectiva densidade de probabilidade |Ψ(x)|2 .
De (C.35) e (C.38) lêmos que
√
√
∆x = a/ 2 , ∆k = 1/ 2a , ⇒
∆x∆k =
1
.
2
(C.47)
Variando ‘a’ podemos fazer ∆x ou ∆k tão pequeno quanto queiramos; isto é, podemos
localizar a variável aleatória perto do valor médio com uma probabilidade tão próxima da
unidade quanto desejado. Mas ao localizarmos x, por exemplo, aumentamos necessariamente a dispersão em k. Como discutido no capı́tulo 2, fenómenos microscópicos exibem
caracterı́sticas quer corpusculares quer ondulatórias, mas não ambas simultaneamente - dualidade onda partı́cula e complementaridade. Esta realidade é incorporado no formalismo
476
Análise de Fourier
da mecânica quântica descrevendo variáveis canónicas conjugadas - posição e momento por
exemplo - como transformadas de Fourier uma da outra. Deste modo a incerteza associada
à complementaridade é descrita pela existência de um limite inferior do produto de desvios
padrão de transformadas de Fourier.
Bibliografia
[1] Herbert Goldstein, Classical Mechanics, Second Edition, 1980.
[2] Jorge V. José, Eugene J. Saletan, Classical Dynamics, a contemporary approach, Cambridge University Press, 1998.
[3] Maria Renata Arala Chaves, Sebenta de Mecânica Quântica, 1975.
[4] Bernd Thaller, Visual Quantum Mechanics, Springer 2000 (inclui CD-ROM).
[5] L.D.Landau, E.M.Lifshitz Quantum Mechanics, Butterworth Heinemann, Third Revised Edition, 1977.
[6] Robert Eisberg, Robert Resnick, Quantum Physics of atoms, molecules, solids, nuclei,
and particles, John Wiley & Sons, Second Edition, 1985.
[7] Eyvind H. Wichmann, Quantum Physics - Berkeley Physics Course - Volume 4, McGraw Hill, 1967.
[8] Feynman, Leighton, Sands, The Feynman Lectures on Physics - Volume III, AddisonWesley Publishing Company, 1965.
[9] Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, Quantum Mechanics John Wiley & Sons, 1977.
478
[10] Paul A. M. Dirac, The Principles of Quantum Mechanics Oxford Science Publications,
Fourth Edition, 1958.
Download