Apuntes de Mecánica Cuántica

Notas de Mecânica Quântica Carlos A. R. Herdeiro Departamento de Fı́sica Faculdade de Ciências da Universidade do Porto 2007-08 v4.0 Agradecimentos É um prazer agradecer à Professora Renata Arala Chaves, ao Professor Eduardo Lage e ao Professor João Lopes dos Santos a oportunidade de leccionar as cadeiras de Mecânica Quântica I e Mecânica Quântica II como Professor Auxiliar Convidado, durante os anos lectivos 2003/2004 a 2006/2007, no Departamento de Fı́sica da Faculdade de Ciências da Universidade do Porto. Uma palavra muito especial à Professora Fátima Mota pelo apoio sempre presente. Junho de 2007 Carlos Herdeiro (Alguma) Cronologia relacionada com o Nascimento da Mecânica Quântica 1678 - Christian Huygens publica o seu livro Traité de la lumiere onde defendia a natureza ondulatória da luz; 1687 - Isaac Newton publica o seu tratado Philosophiae Naturalis Principia Mathematica onde expõe as suas leis da mecânica (hoje dita mecânica clássica); 1703 - Newton publica o seu livro sobre a luz Opticks, onde defende que a luz é um fluxo de pequenos corpúsculos; 1803 - Thomas Young anuncia numa ‘Bakerian Lecture’ intitulada Experiments and Calculations Relative to Physical Optics a observação da difracção da luz, provando assim que a luz tem propriedades ondulatórias e portanto validando a tese de Huygens e invalidando a de Newton; 1873 - James Maxwell publica a sua obra A Treatise on Electricity and Magnetism onde apresenta as suas equações do campo electromagnético e mostra que a sua teoria prevê a existência de ondas electromagnéticas viajando ‘à velocidade da luz’; 1887 - Heinrich Hertz produz e detecta ondas electromagnéticas, validando a teoria de Maxwell; descobre também, acidentalmente, o efeito fotoeléctrico; 1900 - Max Planck explica a radiação de corpo negro usando a quantificação de energia e introduzindo uma nova constante h (hoje dita constante de Planck ). A sua descoberta foi apresentada num encontro da Sociedade Alemã de Fı́sica, em 14 de Dezembro de 1900, a data de nascimento da Mecânica Quântica; 1905 - Albert Einstein sugera a quantificação da radiação para explicar algumas caracterı́sticas do efeito fotoeléctrico descobertas em 1900 por Philip Lenard; 1911 - Ernest Rutherford propõe o modelo nuclear do átomo baseado nas experiências de scattering de partı́culas α de Hans Geiger e Ernest Marsden; 1913 - Niels Bohr propõe o seu modelo do átomo de hidrogénio num artigo intitulado Sobre a constituição de átomos e moléculas; 1916 - Robert Milikan verifica a equação de Einstein relativa ao efeito fotoeléctrico; 1923 - Arthur Compton explica o scattering de raios x por electrões como uma colisão entre electrões e fotões verificando experimentalmente as suas conclusões; 1924 - Louis De Broglie propõe que o electrão tenha ondas electrónicas associadas com comprimento de onda h/p; 1925 - Erwin Schrödinger propõe a sua equação de onda para descrever as ondas associadas à matéria; 1925 - Werner Heisenberg inventa a mecânica de matrizes para descrever fenómenos quânticos; 1925 - Wolfgang Pauli apresenta o seu princı́pio de exclusão; 1927 - Heisenberg formula o princı́pio da incerteza; 1927 - Clinton Davisson e Lester Germer e independentemente, George Thomson, observam difracção devido a ondas electrónicas; 1928 - Paul Dirac desenvolve a mecânica quântica relativista e prevê a existência de positrões, descobertos em 1932 por Carl Anderson; “Quem não se sentiu chocado com a teoria quântica não pode tê-la compreendido.” Niels Bohr (1885-1962), Conteúdo I Problemas exactamente solúveis e quantificação canónica de sistemas clássicos 1 1 Tópicos de Mecânica Clássica 2 1.1 Mecânica Newtoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Mecânica Lagrangeana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.1 Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . 7 1.2.2 Teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.3 Mecânica Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3.1 O Espaço de Fase e os Parêntesis de Poisson . . . . . . . . . . . . . 16 1.3.2 A Equação de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . 18 1.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2 O perı́odo de Transição 2.1 A luz: ondas versus corpúsculos . . . . . . . . . . . . . . . . . . . . . . . . 25 26 2.1.1 Experiências de Young (1801): ondas triunfam . . . . . . . . . . . . 28 2.1.2 A radiação do corpo negro, Planck e o quantum (1900) . . . . . . . 33 2.1.3 O efeito fotoeléctrico (Einstein 1905) . . . . . . . . . . . . . . . . . 37 2.2 Matéria: corpúsculos versus ondas . . . . . . . . . . . . . . . . . . . . . . . 40 2.2.1 O Espectro do átomo de Hidrogénio . . . . . . . . . . . . . . . . . . 43 2.2.2 O modelo atómico de Bohr (1913) . . . . . . . . . . . . . . . . . . . 45 2.2.3 As ondas electrónicas . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.3.1 Experiência de Young com luz de baixa intensidade . . . . . . . . . 51 2.3.2 O princı́pio da incerteza de Heisenberg . . . . . . . . . . . . . . . . 55 2.3.3 Experiência com a polarização da luz . . . . . . . . . . . . . . . . . 57 2.4 A aplicabilidade da Mecânica Quântica . . . . . . . . . . . . . . . . . . . . 59 2.5 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3 A equação de Schrödinger 63 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas . . . . . . . . 64 3.1.1 Sobreposição discreta de ondas . . . . . . . . . . . . . . . . . . . . 66 3.1.2 Sobreposição contı́nua de ondas . . . . . . . . . . . . . . . . . . . . 69 3.2 Partı́cula em potenciais independentes do tempo . . . . . . . . . . . . . . . 71 3.2.1 Caracterı́sticas gerais num potencial em escada . . . . . . . . . . . 73 3.2.2 Salto de potencial (E > V0 ) . . . . . . . . . . . . . . . . . . . . . . 76 3.2.3 Salto de potencial (E < V0 ) . . . . . . . . . . . . . . . . . . . . . . 78 3.2.4 Barreira de potencial (E > V0 ) . . . . . . . . . . . . . . . . . . . . . 81 3.2.5 Barreira de potencial (E < V0 ) . . . . . . . . . . . . . . . . . . . . . 83 3.2.6 Poço de potencial de profundidade finita (E < 0) . . . . . . . . . . 88 3.2.7 Poço de potencial de profundidade infinita . . . . . . . . . . . . . . 90 3.3 Evolução de um trem de ondas . . . . . . . . . . . . . . . . . . . . . . . . 91 3.3.1 Trem de ondas Gaussiano livre . . . . . . . . . . . . . . . . . . . . 92 3.3.2 Trem de ondas incidente num salto de potencial (E < V0 ) . . . . . . 93 3.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 4 Formalismo Matemático e Postulados da Mecânica Quântica 4.1 Funções de onda e operadores . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Estrutura de F e produto escalar em F . . . . . . . . . . . . . . . . 97 97 98 4.1.2 Bases de F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.3 Operadores Lineares a actuar em F . . . . . . . . . . . . . . . . . . 103 4.2 A notação de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 4.2.1 Produto escalar e espaço dual a E . . . . . . . . . . . . . . . . . . . 107 4.2.2 Acção de operadores lineares . . . . . . . . . . . . . . . . . . . . . . 108 4.2.3 O operador adjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 4.2.4 A operação adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.2.5 Notação de Dirac numa dada base . . . . . . . . . . . . . . . . . . . 111 4.2.6 Valores próprios e vectores próprios de um operador . . . . . . . . . 113 4.2.7 Observáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 4.3 Os postulados da Mecânica Quântica . . . . . . . . . . . . . . . . . . . . . 115 4.4 Quantificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 4.4.1 Variáveis compatı́veis, incompatı́veis e C.C.O.C. . . . . . . . . . . . 119 4.4.2 Os operadores X̂ e P̂ . . . . . . . . . . . . . . . . . . . . . . . . . . 123 4.4.3 Regras de Quantificação canónica . . . . . . . . . . . . . . . . . . . 126 4.4.4 Comentários sobre a evolução de um sistema quântico . . . . . . . . 128 4.4.5 Evolução do valor médio de uma variável . . . . . . . . . . . . . . . 129 4.5 Mecânica Quântica Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . 131 4.5.1 O operador de densidade para um estado puro . . . . . . . . . . . . 133 4.5.2 O operador de densidade para uma mistura estatı́stica de estados . 134 4.5.3 O operador de evolução e a evolução de um estado puro . . . . . . . 137 4.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5 Exemplos de Quantificação Canónica 141 5.1 Oscilador Harmónico Quântico em Uma Dimensão . . . . . . . . . . . . . . 141 5.1.1 O espectro de energia do Oscilador Harmónico Quântico . . . . . . 142 5.1.2 As funções de onda para o oscilador harmónico . . . . . . . . . . . 146 5.1.3 Resolução directa da equação de Schrödinger . . . . . . . . . . . . . 149 5.1.4 Valor médio e desvio padrão de x e p . . . . . . . . . . . . . . . . . 153 5.2 O Oscilador Harmónico Quântico em Duas Dimensões . . . . . . . . . . . . 155 5.2.1 Quantões lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 5.2.2 Quantões circulares . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 5.2.3 Funções de Onda para quantões circulares . . . . . . . . . . . . . . 158 5.3 O problema de Landau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 5.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 6 Momento Angular Orbital e o Átomo de Hidrogénio 6.1 Operadores de momento angular orbital 167 . . . . . . . . . . . . . . . . . . . 167 6.2 Os Harmónicos Esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 6.3 Partı́cula numa força central . . . . . . . . . . . . . . . . . . . . . . . . . . 176 6.4 O átomo de hidrogénio (sem spin) . . . . . . . . . . . . . . . . . . . . . . . 180 6.5 O átomo de hidrogénio (sem spin) num campo magnético . . . . . . . . . . 189 6.5.1 Dedução dos vários termos do Hamiltoniano . . . . . . . . . . . . . 189 6.5.2 Interpretação dos vários termos do Hamiltoniano . . . . . . . . . . 191 6.5.3 Comparação dos vários termos no Hamiltoniano . . . . . . . . . . . 195 6.5.4 Espectro de Energias aproximado: efeito Zeeman . . . . . . . . . . 196 6.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 7 Outras soluções exactas da equação de Schrödinger 205 7.1 Alguns poços de potencial exactamente solúveis . . . . . . . . . . . . . . . 206 7.1.1 Estados Ligados em Poços infinitos . . . . . . . . . . . . . . . . . . 207 7.1.2 Densidade de estados . . . . . . . . . . . . . . . . . . . . . . . . . . 215 7.1.3 Estados Ligados em Poços finitos . . . . . . . . . . . . . . . . . . . 216 7.2 Método algébrico para potenciais com forma invariante . . . . . . . . . . . 220 7.2.1 O superpotencial e potenciais parceiros . . . . . . . . . . . . . . . . 220 7.2.2 Hierarquia de Hamiltonianos . . . . . . . . . . . . . . . . . . . . . . 226 7.2.3 Potenciais de forma invariante . . . . . . . . . . . . . . . . . . . . . 228 7.2.4 Potenciais de forma invariante relacionados por translação . . . . . 229 7.3 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 II Métodos de aproximação e Spin 237 8 A aproximação WKB 238 8.1 O método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 8.2 Interpretação da validade da aproximação . . . . . . . . . . . . . . . . . . 241 8.3 Fórmulas de ligação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 8.4 Aplicação ao cálculo de estados ligados . . . . . . . . . . . . . . . . . . . . 246 8.5 Aplicação ao cálculo do factor de transmissão . . . . . . . . . . . . . . . . 250 8.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 9 Teoria Geral do Momento Angular e Spin 253 9.1 Representações da álgebra do momento angular . . . . . . . . . . . . . . . 254 9.2 Emergência Fı́sica do Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 9.3 Postulados da teoria de Pauli . . . . . . . . . . . . . . . . . . . . . . . . . 273 9.4 Descrição não relativista de partı́culas de spin 9.4.1 1 2 . . . . . . . . . . . . . . . 274 Juntando os graus de liberdade de spin aos orbitais . . . . . . . . . 276 9.5 Adição de momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . 283 9.5.1 Cálculo dos vectores próprios comuns a Jˆ2 e a Jˆz . . . . . . . . . . 287 9.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 10 Teoria da Difusão 293 10.1 Formalismo para descrever processos de difusão . . . . . . . . . . . . . . . 296 10.1.1 Definição da secção eficaz de difusão . . . . . . . . . . . . . . . . . 296 10.1.2 Estados estacionários de difusão . . . . . . . . . . . . . . . . . . . . 298 10.1.3 Relação entre amplitude e secção eficaz de difusão . . . . . . . . . . 300 10.2 Equação integral de difusão e o método de Born . . . . . . . . . . . . . . . 302 10.2.1 Escolha da função de Green e de Φ0 . . . . . . . . . . . . . . . . . . 304 10.2.2 A aproximação de Born . . . . . . . . . . . . . . . . . . . . . . . . 306 10.2.3 Interpretação da aproximação de Born . . . . . . . . . . . . . . . . 308 10.2.4 A aproximação de Born para potenciais centrais . . . . . . . . . . . 309 10.3 Método das ondas parciais para a difusão por um potencial central . . . . . 316 10.3.1 Ondas esféricas versus ondas planas para uma partı́cula livre . . . . 317 10.3.2 Dedução da forma explı́cita das ondas esféricas livres . . . . . . . . 319 10.3.3 Propriedades das ondas esféricas livres . . . . . . . . . . . . . . . . 323 10.3.4 Ondas parciais num potencial V (r) . . . . . . . . . . . . . . . . . . 328 10.4 Difusão Inelástica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 10.4.1 Secções eficazes de difusão elástica e de absorção . . . . . . . . . . . 337 10.4.2 Secção eficaz total e o teorema óptico . . . . . . . . . . . . . . . . . 339 10.5 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 11 Métodos perturbativos independentes e dependentes do tempo 343 11.1 Teoria das perturbações estacionárias . . . . . . . . . . . . . . . . . . . . . 344 11.1.1 Perturbação de um nı́vel não degenerado . . . . . . . . . . . . . . . 347 11.1.2 Perturbação a um nı́vel degenerado . . . . . . . . . . . . . . . . . . 351 11.1.3 Perturbações X̂, X̂ 2 e X̂ 3 a um potencial harmónico . . . . . . . . 352 11.1.4 Estrutura fina do átomo de Hidrogénio . . . . . . . . . . . . . . . . 357 11.2 Teoria das Perturbações dependentes do tempo . . . . . . . . . . . . . . . 368 11.2.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . 368 11.2.2 Solução aproximada da equação de Schrödinger . . . . . . . . . . . 369 11.2.3 Aplicação a uma perturbação sinusoidal ou constante . . . . . . . . 373 11.2.4 Probabilidade de transição via operador de evolução . . . . . . . . . 385 11.3 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395 12 Sistemas de partı́culas idênticas 397 12.1 Origem do Problema: a degenerescência de troca . . . . . . . . . . . . . . 397 12.2 Operadores de permutação . . . . . . . . . . . . . . . . . . . . . . . . . . . 400 12.2.1 Sistema de duas partı́culas . . . . . . . . . . . . . . . . . . . . . . . 401 12.2.2 Sistema de três partı́culas e generalização para N partı́culas . . . . 405 12.3 O postulado de simetrização . . . . . . . . . . . . . . . . . . . . . . . . . . 410 12.3.1 Levantamento da degenerescência de troca . . . . . . . . . . . . . . 411 12.3.2 Observáveis e evolução temporal . . . . . . . . . . . . . . . . . . . 416 12.4 Consequências do postulado de simetrização . . . . . . . . . . . . . . . . . 417 12.4.1 Diferenças entre bosões e fermiões . . . . . . . . . . . . . . . . . . . 417 12.4.2 Efeitos de interferência . . . . . . . . . . . . . . . . . . . . . . . . . 420 12.4.3 Difusão de duas partı́culas idênticas com spin . . . . . . . . . . . . 424 12.5 Átomos com vários electrões - A tabela periódica . . . . . . . . . . . . . . 428 12.5.1 Nı́veis de energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 12.5.2 Configurações electrónicas e princı́pio da exclusão de Pauli . . . . . 432 12.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435 13 Introdução à Mecânica Quântica Relativista 13.1 A teoria de Klein-Gordon 437 . . . . . . . . . . . . . . . . . . . . . . . . . . . 437 13.2 Os problemas com a teoria de Klein-Gordon . . . . . . . . . . . . . . . . . 439 13.2.1 Energias negativas . . . . . . . . . . . . . . . . . . . . . . . . . . . 440 13.2.2 Probabilidades negativas . . . . . . . . . . . . . . . . . . . . . . . . 441 13.2.3 Inexistência de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 444 13.3 A teoria de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448 13.3.1 Os sucessos da equação de Dirac . . . . . . . . . . . . . . . . . . . . 450 13.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452 III Tópicos Avançados e Modernos 453 14 Formulação de integrais de caminho da Mecânica Quântica 454 15 Mecânica Quântica Super-simétrica 455 16 Introdução à teoria da Informação Quântica 457 IV Apêndices 458 A Geometria da Transformada de Legendre 459 B Princı́pio do tempo mı́nimo de Fermat 463 B.1 Reflexão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463 B.2 Refracção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 C Análise de Fourier 467 C.1 Séries de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467 C.1.1 Representação em termos de ondas planas . . . . . . . . . . . . . . 469 C.1.2 O Espaço de Hilbert e a Igualdade de Bessel-Parseval . . . . . . . . 470 C.2 Integrais de Fourier e Transformadas de Fourier . . . . . . . . . . . . . . . 471 C.2.1 A fórmula de Parseval-Plancherel . . . . . . . . . . . . . . . . . . . 472 C.2.2 Quantidades estatı́sticas e a relação de incerteza . . . . . . . . . . . 474 Parte I Problemas exactamente solúveis e quantificação canónica de sistemas clássicos CAPÍTULO 1 Tópicos de Mecânica Clássica 1.1 Mecânica Newtoniana O principal objectivo da mecânica clássica é descrever e explicar o movimento de objectos macroscópicos. Tal descrição é feita através do conceito de trajectória, que em mecânica não relativista é um mapa Tp (t) : R −→ R3 , (1.1.1) t −→ ~x(t) para cada ponto p do objecto em questão - figura 1.1. Em muitos problemas, a dinâmica de corpos rı́gidos é reduzida, em primeira análise, à dinâmica do centro de massa e portanto à de uma partı́cula pontual. Assim sendo, a descrição e explicação do movimento de uma partı́cula pontual é o problema base da mecânica clássica. Em 1686-87, Isaac Newton (1642-1727) apresentou na sua principal obra Philosophiae Naturalis Principia Mathematica as leis da Mecânica Newtoniana e em particular a sua equação do movimento (2a lei de Newton) que relaciona a força com a variação da quantidade de movimento d~p F~ = , dt p~ ≡ m~v ≡ m d~x . dt (1.1.2) 1.1 Mecânica Newtoniana 3 z Tp (t2 ) y x Tp (t1 ) Figura 1.1: A trajectória é um mapa da linha real para R3 . Se a massa m é fixa, 2 d ~x ¨. F~ = m 2 ≡ m~x dt (1.1.3) Exemplo 1 : Oscilador Harmónico (ex: pequenas oscilações de um pêndulo, mola,...) Um oscilador harmónico é um sistema em que a força é proporcional ao deslocamento a partir de um ponto de equilı́brio e dirigida para o ponto de equilı́brio (Lei de Hooke). Rotulando o ponto de equilı́brio como ~x = 0, temos F~ = −k~x . (1.1.4) Consideremos o oscilador harmónico em uma dimensão, com uma massa m e uma constante de oscilador k. Pela segunda lei ẍ + k x=0, m (1.1.5) que é uma equação diferencial ordinária de segunda ordem com solução ! r k t + φ0 , (1.1.6) x(t) = A cos m p de onde se lê a frequência de oscilação: ω = k/m. A e φ0 são constantes de integração interpretadas como amplitude e fase inicial do movimento que fisicamente são determinadas pelas condições iniciais. Exemplo 2 : Problema de Larmor O problema de Larmor é o problema de uma partı́cula de massa m e carga eléctrica q num campo magnético constante que tomamos ~ = Bez . como sendo B 4 Tópicos de Mecânica Clássica A força que uma partı́cula sente devido à interacção com o campo electromagnético é dada pela força de Lorentz ~ + ~v × B) ~ . F~ = q(E (1.1.7) Aplicando ao nosso caso e usando a segunda lei de Newton obtemos a equação do movimento (~x = (x, y, z))    ẍ = ωc ẏ   ¨ = ωc~x˙ × ez ⇔ ~x ÿ = −ωc ẋ     z̈ = 0 ⇒ onde definimos a frequência ciclotrónica é ωc =  3 dx   + ωc2 ẋ = 0   3  dt  d3 y + ωc2ẏ = 0   3  dt    z̈ = 0 qB . m , (1.1.8) (1.1.9) As equações de terceira ordem são de segunda ordem nas velocidades e equivalentes a osciladores harmónicos. Logo a solução é   ẋ = A cos (ωc t + φ0 )    , ẏ = Ã cos ωc t + φ̃0     z =z +v t 0 z (1.1.10) onde A, Ã, φ, φ̃, z0 , vz são constantes de integração. As equações de segunda ordem em (1.1.8) relacionam as constantes de integração A = Ã , φ̃0 = φ0 + π . 2 (1.1.11) Como tal a solução final é  A   sin (ωc t + φ0 ) x(t) = x0 +   ωc  A y(t) = y + cos (ωc t + φ0 ) 0  ω  c    z =z +v t 0 z . (1.1.12) Assim, x(t) e y(t) obedecem a 2 2 (x(t) − x0 ) + (y(t) − y0 ) = A ωc 2 , (1.1.13) 1.2 Mecânica Lagrangeana 5 ~ B z y x Figura 1.2: Trajectórias no problema de Larmor. Apenas a trajectória mais à direita tem vz 6= 0. e interpretamos as trajectórias projectadas no plano x-y como sendo circunferências com centro em (x0 , y0 ) e raio Am/qB - figura 1.2. Lêmos também que a frequência das órbitas é a frequência ciclotrónica. Nota: Este movimento corresponde a dois osciladores harmónicos nas direcções x e y em oposição de fase. 1.2 Mecânica Lagrangeana Existem algumas forças, ditas conservativas, que podem ser derivadas de um potencial, através de:1 F~ = −∇V ∇ × F~ = 0 . ⇔ (1.2.1) Dada uma força, a última equação pode ser utilizada como teste para ver se a força é conservativa. Por exemplo, para a força do exemplo 1, F~ = −kx ⇔ V (x) = kx2 . 2 (1.2.2) Ao desenharmos o potencial - figura 1.3 - ficamos com uma ideia da dinâmica usando a nossa intuição gravitacional: a partı́cula quer descer o potencial e ‘custa-lhe’ a subi-lo. Como a energia total da partı́cula é conservada 1 1 Etotal = Ecinética + Epotencial = mv 2 + kx2 , 2 2 1 (1.2.3) A implicação da direita para a esquerda não é sempre válida e depende de considerações topológicas, nomeadamente a co-homologia de de Rham da variedade. Para a generalidade das aplicações em Fı́sica elementar, onde a topologia do espaço-tempo é trivial, pode-se considerar a equivâlencia válida em geral. 6 Tópicos de Mecânica Clássica V(x) E −a a x Figura 1.3: Potencial do oscilador harmónico; uma partı́cula com energia E oscila entre pontos −a e a tais que V (−a) = V (a) = E. q1 (t) qreal (t) (qi , ti ) (qf , tf ) q2 (t) Figura 1.4: Três percursos alternativos entre o ponto qi no instante ti e qf no instante tf . A t trajectória real, qreal (t) é um extremo da acção S[q(t)]tfi . Se, por exemplo, for um mı́nimo, t t t S[qreal (t)]tfi < S[q1 (t)]tfi , S[q2 (t)]tfi . uma partı́cula com energia total E sobe até uma altura do potencial dada por V = E, onde a velocidade se anula; a velocidade é máxima em x = 0, onde toda a energia é cinética. Dado um qualquer potencial, correspondendo a uma força, podemos de imediato deduzir um conjunto particular de trajectórias fı́sicas, i.e. soluções das equações do movimento: são as trajectórias constantes, correspondentes aos extremos do potencial. Os extremos são definidos por ∇V (x0 ) = 0 ⇔ F~ = 0 em x0 , (1.2.4) o que significa que se a partı́cula estiver inicialmente em repouso em x0 aı́ ficará. No caso do oscilador harmónico a única solução deste tipo é quando a partı́cula está em repouso na posição de equilı́brio, que é trivial. Mas origina a seguinte pergunta: ‘Dado que estas trajectórias extremizam uma quantidade escalar (o potencial), haverá uma quantidade escalar mais geral extremizada por todas as trajectórias?’ 1.2 Mecânica Lagrangeana 7 Isto é consideremos um movimento com inı́cio em ti na posição qi e com fim em tf na posição qf , como na figura 1.4.2 Existe uma quantidade que a trajectória verdadeira, qreal (t), extremize comparativamente a todas as outras trajectórias, como q1 (t) ou q2 (t)? Se tal quantidade existir não é uma função, mas sim uma ‘máquina’ que transforma funções como a trajectória - em números (note que uma função transforma números em números), denominada funcional : t S[. . .]tfi : F −→ R t q(t) −→ S[q(t)]tfi . (1.2.5) F é o espaço de todas as funções de variável real. Um dos princı́pios mais importantes em toda a fı́sica é o princı́pio da acção mı́nima 3 ou princı́pio de Hamilton: Num sistema fı́sico com Lagrangeano L(q, q̇, t), as trajectórias reais, qreal (t), são as que extremizam o funcional acção, definido como Z tf tf dtL(q, q̇, t) , S[q(t)]ti = (1.2.6) ti onde o Lagrangeano se define como a diferença entre a energia cinética, T (q̇) e a energia potencial, V (q, t)4 L(q, q̇, t) ≡ T (q̇) − V (q, t) . (1.2.7) Para o princı́pio de Hamilton fazer sentido tem que dar origem a um conjunto de equações do movimento equivalentes às da mecânica Newtoniana. Essas equações chamamse Equações de Euler-Lagrange, que agora deduzimos. 1.2.1 Equações de Euler-Lagrange Os extremos de uma função são encontrados requerendo que a derivada da função seja zero. Analogamente, os extremos de um funcional encontram-se requerendo que a variação do funcional se anule. Variar um funcional consiste em comparar o valor do funcional para 2 É convencional utilizar a variável ‘q’ para designar um sistema arbitrário de coordenadas, por isso denominadas coordenadas generalizadas. 3 Embora esta designação seja comum, as trajectórias reais não são sempre um mı́nimo da acção, mas sim um extremo. 4 Curiosidade: A designação de energia cinética por T e da energia potencial por V tem origem nas palavras alemãs tatkraft e verk, que significam, respectivamente ‘energia’ e ‘potencial’. 8 Tópicos de Mecânica Clássica funções ligeiramente distintas, mas mantendo fixos os pontos inicial e final da função, que no nosso caso é a trajectória. Denotando esta operação de variação por ‘δ’ obtemos Z tf ∂L ∂L tf tf δq + δ q̇ , (1.2.8) δS = S[q(t) + δq(t)]ti − S[q(t)]ti = dt ∂q ∂ q̇ ti e assumindo que a operação de variação comuta com diferenciação, δ q̇ = δ dq d = δq , dt dt de onde, integrando por partes Z tf ∂L d ∂L ∂L δq + − δq dt δS = ∂q dt ∂ q̇ ∂ q̇ ti (1.2.9) tf ti . (1.2.10) O último termo é zero, pois corresponde à variação da trajectória nos pontos inicial e final, que assumimos ser zero. Como queremos garantir que δS = 0 para uma variação arbitrária, o integrando do termo restante tem de ser zero, isto é, d ∂L ∂L − =0, dt ∂ q̇ ∂q (1.2.11) para cada coordenada q. Estas são as equações de Euler-Lagrange (Joseph Lagrange 17361813, Leonhard Euler 1707-1783). Usando (1.2.7) estas equações escrevem-se d ∂L ∂V =− dt ∂ q̇ ∂q ⇔ d ∂L = F~ . dt ∂ ~q˙ (1.2.12) Usamos ~q para denotar a possibilidade de haver vários graus de liberdade e correspondentes coordenadas. Para uma partı́cula pontual num potencial V (~q), 1 2 L = m~q˙ − V (~q) , 2 (1.2.13) e (1.2.12) reduz-se a F~ = m¨~q, i.e. à segunda lei de Newton. Em geral define-se o momento canónico conjugado à variável ‘q’ como ‘p’ p~ ≡ ∂L . ∂ ~q˙ (1.2.14) Deste modo, com toda a generalidade, (1.2.12) implica d F~ = p~ , dt (1.2.15) 1.2 Mecânica Lagrangeana 9 mostrando que o formalismo Lagraneano reproduz o Newtoniano. Exemplo 1, Versão b) : Tratamos agora o oscilador harmónico no formalismo Lagrangiano. De (1.2.2) vemos facilmente que o Lagrangeano é 1 1 L = mẋ2 − kx2 , 2 2 (1.2.16) e as equações de Euler-Lagrange dão ẍ + k x=0, m (1.2.17) em concordância com (1.1.5). Exemplo 2, Versão b) : Para tratarmos a versão Lagrangeana do problema de Larmor, comecemos por discutir se existe um potencial para a força de Lorentz. Recordemos as equações de Maxwell (no sistema internacional de unidades) ~ =0 (i) ∇ · B ~ ~ = − ∂B (iii) ∇ × E ∂t ~ = ρ (ii) ∇ · E ǫ0 ~ . ~i ∂E ~ (iv) c ∇ × B = + ǫ0 ∂t (1.2.18) 2 Uma condição necessária para existir o potencial de uma força é (1.2.1). Calculemos pois o rotacional de F~Lorentz ~ + ∇ × (~v × B)) ~ , ∇ × F~Lorentz = q(∇ × E (1.2.19) ou, usando as equações de Maxwell e o facto que ~ = (β~ · ∇)~ ~ ·α ~ , ∇ × (~ α × β) α − β(∇ ~ ) − (~ α · ∇)β~ + α ~ (∇ · β) (1.2.20) obtemos (~v não é um campo de velocidades; logo as suas derivadas desaparecem) ! ~ ~ ∂ B ~ = −q dB . − (~v · ∇)B (1.2.21) ∇ × F~Lorentz = q − ∂t dt Assim, em geral, a força de Lorentz não é derivável de um potencial. Só o é se o campo magnético sentido pela partı́cula for constante. 10 Tópicos de Mecânica Clássica Ainda assim, é possı́vel definir um Lagrangeano cujas equações do movimento são as de uma partı́cula actuada pela força de Lorentz, mas que não tem a forma (1.2.7). Para vermos esse Lagrangeano recordemos os potenciais electromagnéticos. ~ A equação (i) permite-nos definir o potencial magnético, A, ~ =0 ∇·B ⇒ ~ =∇×A ~, B (1.2.22) que usando na equação de Maxwell-Faraday (iii) nos permite escrever esta como ~ ~ + ∂A ) = 0 ∇ × (E ∂t ⇒ ~ ~ = −∇φ − ∂ A , E ∂t (1.2.23) onde φ é o potencial electrostático. As duas equações (1.2.22) e (1.2.23) definem os poten~ Note-se que estes não são únicos. Isto é, para os mesmos ciais electromagnéticos (φ, A). ~ B ~ existe uma classe de equivalência de diferentes escolhas para φ e A ~ a que se chama E, “equivalência de gauge”. Lema: O Lagrangeano 1 2 ~ ~x) − qφ(t, ~x) , L = m~x˙ + q~x˙ · A(t, 2 (1.2.24) reproduz as equações do movimento de uma partı́cula actuada pela força de Lorentz. Demonstração: As equações de Euler-Lagrange para este Lagrangeano d ∂L ∂L − =0 i ∂x dt ∂ ẋi q~x˙ · ⇒ ~ ∂A ∂φ d − q i − (mẋi + qAi ) = 0 . i ∂x ∂x dt (1.2.25) ~ depende do tempo tanto Note-se que a derivada em ordem ao tempo é total e que A explicitamente como através da dependência em ~x. Assim a equação fica ∂φ ∂Ai ∂Ai ∂xj 1 ∂A1 2 ∂A2 3 ∂A3 q ẋ = mẍi . + ẋ + ẋ − i− − j ∂xi ∂xi ∂xi ∂x ∂t ∂x ∂t Usando (1.2.23) reescrevemos a equação ∂A2 ∂Ai ∂A3 ∂Ai ∂A1 ∂Ai 2 3 1 ~ i = mẍi . − 1 +v − 2 +v − 3 + (E) q v ∂xi ∂x ∂xi ∂x ∂xi ∂x (1.2.26) (1.2.27) Tomando como exemplo a componente i = 1 desta equação, reescrevemo-la como h i h i 2 3 ~ ~ ~ ~ ~ q v ∇ × A − v ∇ × A + (E)1 = mẍ1 ⇔ q E + ~v × B = mẍ1 , (1.2.28) 3 2 1 1.2 Mecânica Lagrangeana 11 e analogamente para as outras componentes, o que demonstra o Lema. (q.e.d.) Voltemos então ao problema de Larmor. Podemos escolher os seguintes potenciais electromagnéticos para o problema   E ~ =0  B ~ = Be   φ=0  A ~ = B (−y, x, 0) 2 , (1.2.29) 1 Bq L(~x, ~x˙ , t) = m(ẋ2 + ẏ 2 + ż 2 ) + (xẏ − y ẋ) , 2 2 (1.2.30) ⇐ z originando o Lagrangeano e as equações de Euler-Lagrange  Bq Bq d   − y + mẋ = 0 ẏ −   dt 2   2 d Bq Bq x + mẏ = 0 − ẋ −  2 dt 2    d   − (mż) = 0 dt  qB   ẏ ẍ =   m  qB ÿ = − ẋ  m     z̈ = 0 , (1.2.31) que são as mesmas equações obtidas no formalismo Newtoniano (1.1.8). 1.2.2 Teorema de Noether Neste último exemplo obtivemos uma equação do movimento da forma d (mż) = 0 dt ⇒ pz ≡ mż = constante , (1.2.32) o que significa existir uma quantidade conservada no movimento, pz . A existência desta quantidade conservada é consequência directa de neste problema haver uma simetria na direcção z e, como tal, de o Lagrangeano não depender de z. A generalização deste resultado é conhecida como Teorema de Noether, (Emmy Noether 1882-1935) um dos mais importantes em mecânica Lagrangeana: Teorema (Noether): Se o Lagrangeano de um sistema fı́sico L(~q, ~q˙ , t) é invariante pela acção de transformações do tipo ~q −→ ~q + δ~q , (1.2.33) 12 Tópicos de Mecânica Clássica para algum δ~q, isto é, possui uma simetria na direcção definida por δ~q, então existe uma quantidade conservada no movimento desse sistema fı́sico associada com essa simetria. Demonstração: Escolher uma coordenada y tal que as suas linhas integrais sejam tangentes a δ~q; a invariância de L significa que L não depende da coordenada y, ∂L/∂y = 0; logo, a equação do movimento de y é d ∂L =0 ⇒ dt ∂ ẏ ∂L ≡ py = constante , ∂ ẏ (1.2.34) o que significa que py é uma constante do movimento. 1.3 Mecânica Hamiltoniana Tanto no formalismo Newtoniano como Lagrangeano, as equações do movimento são equações diferenciais de segunda ordem. Quer para implementação numérica, quer para uso de métodos analı́ticos é, em muitas circunstâncias, mais conveniente resolver um conjunto de 2n equações diferenciais de primeira ordem do que um conjunto de n equações diferenciais equivalentes de segunda ordem. Isto sugere a introdução de um formalismo em que as equações do movimento são de primeira ordem, que é o caso do formalismo Hamiltoniano (William Hamilton 1805-1865). Este formalismo é também o caminho canónico para a quantificação de um sistema fı́sico. No formalismo Lagrangeano, as variáveis independentes são (q, q̇, t), (1.3.1) e o Lagrangeano é visto como uma função destas variáveis L = L(q, q̇, t) . (1.3.2) Anteriormente já introduzimos uma nova variável que em geral depende de q̇, que é o momento canónico conjugado a q, p≡ ∂L . ∂ q̇ (1.3.3) 1.3 Mecânica Hamiltoniana 13 É pois natural, para obter equações de primeira ordem, tomar como variáveis independentes (q, p, t), (1.3.4) e pensar no Lagrangeano como uma nova função em que as variáveis independentes são estas L̂ = L̂(q, q̇(q, p, t), t) . (1.3.5) As equações de Euler-Lagrange d ∂L ∂L − =0 ∂q dt ∂ q̇ ⇔ ṗ = ∂L , ∂q (1.3.6) tem de ser expressas em termos da função L̂. Note-se que em geral ∂L ∂ L̂ 6= , ∂q ∂q (1.3.7) pois estas são derivadas parciais. De facto ∂L ∂L ∂ ∂ L̂(q, q̇(q, p, t), t) = + q̇(q, p, t) ⇔ ∂q ∂q ∂ q̇ ∂q ∂ ∂L ∂ L̂(q, p, t)−p q̇(q, p, t) . (1.3.8) = ∂q ∂q ∂q Usando (1.3.6) e notando que o lado direito da última equação já está totalmente expresso em termos de funções das novas variáveis (q, p, t), obtemos ∂ ṗ = − pq̇(q, p, t) − L̂(q, p, t) . ∂q (1.3.9) Por outro lado calculemos também ∂ ∂ ∂ q̇ ∂ ∂ L̂(q, p, t) = L(q, q̇, t) = p q̇(q, p, t) = (pq̇(q, p, t)) − q̇(q, p, t) , ∂p ∂ q̇ ∂p ∂p ∂p (1.3.10) ou q̇ = ∂ (pq̇(q, p, t) − L̂(q, p, t)) . ∂p (1.3.11) Para simplificar a forma das equações (1.3.9) e (1.3.11), introduzimos o Hamiltoniano definido como H(q, p, t) ≡ pq̇(q, p, t) − L(q, q̇(q, p, t), t) , (1.3.12) 14 Tópicos de Mecânica Clássica em termos do qual, as equações (1.3.9) e (1.3.11) reescrevem-se como q̇ = ∂H , ∂p ṗ = − ∂H , ∂q (1.3.13) denominadas equações de Hamilton ou equações canónicas. Estas equações contêm a mesma informação que as equações de Euler-Lagrange, mas em vez de uma (ou n para n coordenadas) equação de segunda ordem temos agora duas (2n) equações de primeira ordem. Note-se que tudo o que fizemos para ir do formalismo Lagrangeano para o Hamiltoniano foi uma mudança de variáveis independentes (q, q̇, t) −→ (q, p, t) , (1.3.14) o que motivou a substituição do Lagrangeano por uma outra função, o Hamiltoniano L(q, q̇, t) −→ H(q, p, t) . (1.3.15) Esta última transformação, que aparece associada a uma mudança de variáveis toma o nome de transformada de Legendre, cuja interpretação geométrica é dada no apêndice A. Calculemos agora o Hamiltoniano para cada um dos nossos dois exemplos. Exemplo 1, Versão c): Dado que o Lagrangeano para o oscilador harmónico é (1.2.16) temos 1 1 L = mẋ2 − kx2 2 2 ⇒ p≡ ∂L = mẋ , ∂ ẋ (1.3.16) o que significa que o momento canónico conjugado a x é o momento dinâmico usual, isto é, a quantidade de movimento. Logo H = pẋ − L = 1 p2 + kx2 = T + V , 2m 2 (1.3.17) isto é, o Hamiltoniano é a energia cinética mais a energia potencial, ou seja, a energia total do sistema. Como exercı́cio pode verificar que as equações de Hamilton deste Hamiltoniano são equivalentes a (1.1.5). Em geral, um Lagrangeano do tipo 1 L = mẋ2 − V (x) 2 ⇒ H= p2 + V (x) , 2m (1.3.18) 1.3 Mecânica Hamiltoniana 15 o que é ainda a energia total. Exemplo 2, Versão c): Comecemos por deduzir o Hamiltoniano para uma partı́cula a interagir com um campo electromagnético arbitrário, cujo Lagrangeano vimos ser (1.2.24) 2 1 ~ ~x) − qφ(t, ~x) L = m~x˙ + q~x˙ · A(t, 2 ⇒ ~. ~p = m~x˙ + q A (1.3.19) Neste caso o momento canónico conjugado a ~x não é o momento dinâmico usual o que mostra que estas duas quantidades não têm de coincidir. O Hamiltoniano resultante é ~ 2 (~p − q A) + qφ . H = ~p · ~x˙ − L = 2m (1.3.20) ~ = m~x˙ concluimos que o Hamiltoniano é ainda a energia cinética mais Notando que p~ − q A a energia potencial devido ao potencial φ. Esta é a energia total em jogo. O efeito do potencial magnético é levado em conta usando a regra de substituir no Hamiltoniano ~, ~p −→ p~ − q A (1.3.21) a que se chama acoplamento minimal. Mas note-se que esta regra, corresponde a manter o 2 termo cinético como sendo m~x˙ /2. Assim, numa situação em que o potencial φ seja nulo (ou constante) concluimos que a energia cinética da partı́cula tem de ser constante e como tal também a norma da sua velocidade.5 Isso é exactamente o que acontece no problema de Larmor para as trajectórias da figura 1.2. Especializando (1.3.20) para os potenciais (1.2.29) obtemos o Hamiltoniano 1 H= 2m qBy px + 2 2 1 + 2m 2 qBx p2 py − + z . 2 2m (1.3.22) Como exercı́cio pode verificar que as equações de Hamilton deste Hamiltoniano são equivalentes a (1.1.8) - Folha de Problemas 8, exercı́cio 1d). 5 A menos de efeitos de irradiação de ondas electromagnéticas e correspondente perda de energia, conforme o problema 2 da Folha de Problemas 1. 16 Tópicos de Mecânica Clássica 1.3.1 O Espaço de Fase e os Parêntesis de Poisson O formalismo Hamiltoniano desenrola-se no espaço de fase, que é o espaço parameterizado por (q, p), que são as variáveis independentes neste formalismo. A simetria das equações canónicas (1.3.13) sugere a introdução de coordenadas unificadas ξ i = (q, p) ξ1 = q , ξ2 = p , ⇔ (1.3.23) de modo que as equações canónicas são reescritas ∂H ξ˙i = ω ij j , ∂ξ (1.3.24) onde ω ij são as componentes de uma matriz anti-simétrica (dita simplética)   0 1  . ω ij =  −1 0 (1.3.25) Na equação (1.3.24) usamos a chamada convenção de Einstein, que significa que quando um ı́ndice aparece repetido num produto, denota uma soma de termos correspondendo a todos os valores possı́veis desse ı́ndice.6 Em (1.3.24) o ı́ndice j aparece repetido no produto do lado direito. Logo temos de somar sobre todos os valores possı́veis de j, ou seja 1, 2. Por exemplo, a componente i = 1 de (1.3.24) fica ∂H ∂H ξ˙1 = ω 11 1 + ω 12 2 ∂ξ ∂ξ ⇔ q̇ = ∂H , ∂p (1.3.26) que é uma das equações canónicas. Consideremos a evolução de uma determinada variável dinâmica f = f (q, p, t). A sua evolução temporal é dada por df ∂f ∂f ∂f ∂f ∂f ∂H ∂f ∂H = + q̇ + ṗ = + − , dt ∂t ∂q ∂p ∂t ∂q ∂p ∂p ∂q (1.3.27) ou em termos das coordenadas unificadas df ∂f ∂f ∂H = + ω ij i j dt ∂t ∂ξ ∂ξ 6 ⇔ df ∂f = + {f, H} , dt ∂t (1.3.28) Rigorosamente, o ı́ndice repetido tem que aparecer uma vez como covariante que corresponde a estar em baixo na variável (ou em cima quando a variável está no denominador) e uma vez como contravariante que corresponde a estar em cima na variável (ou em baixo quando no denominador). 1.3 Mecânica Hamiltoniana 17 onde introduzimos os Parêntesis de Poisson, definidos como {A, B} ≡ ω ij ∂A ∂B ∂A ∂B ∂B ∂A = − . i j ∂ξ ∂ξ ∂q ∂p ∂q ∂p (1.3.29) Os parêntesis de Poisson têm 3 importantes propriedades i) Bi-linearidade {α1 A1 + α2 A2 , B} = α1 {A1 , B} + α2 {A2 , B} , (1.3.30) onde α1,2 são constantes e uma expressão análoga pode ser escrita para o segundo argumento nos parêntesis. ii) Anti-simetria {A, B} = −{B, A} . (1.3.31) {A, {B, C}} + {B, {C, A}} + {C, {A, B}} = 0 . (1.3.32) iii) Identidade de Jacobi Devido a estas propriedades, os parêntesis de Poisson são um exemplo de parêntesis de Lie e a álgebra de funções no espaço de fase por eles originada é uma álgebra de Lie, que será definida na secção 9.1. Os parêntesis de Poisson são um objecto fundamental na quantificação canónica de um sistema fı́sico. Apliquemos a equação de evolução (1.3.28): • Às coordenadas unificadas ξ i ξ˙i = {ξ i, H} . (1.3.33) Estas são exactamente as equações canónicas. • Ao Hamiltoniano ∂H . (1.3.34) ∂t O Hamiltoniano é uma quantidade conservada no movimento a menos que dependa Ḣ = explicitamente do tempo. Como se pode mostrar directamente da definição de Hamiltoniano que ∂H ∂L =− , ∂t ∂t (1.3.35) 18 Tópicos de Mecânica Clássica isto reflecte a conservação de energia para Lagrangianos independentes do tempo. • A uma variável dinâmica g que não tenha dependência explı́cita no tempo ġ = {g, H} . (1.3.36) Ou seja, g é uma constante do movimento se e só se comutar com o Hamiltoniano em termos dos parêntesis de Poisson. 1.3.2 A Equação de Hamilton-Jacobi Como vimos, a mudança do formalismo Lagrangeano para o formalismo Hamiltoniano corresponde a uma mudança de variáveis independentes descrita por (1.3.14), tornando-se depois natural mudar a função dinâmica de Lagrangeano para Hamiltoniano. Dentro do formalismo Hamiltoniano, podem-se fazer mudanças de variáveis independentes do tipo (q, p, t) −→ (Q(q, p, t), P (q, p, t), t) , (1.3.37) ou seja mudar de coordenadas no espaço de fase, requerendo que as equações canónicas mantenham a sua forma. Isto é, que haja uma função K = K(Q, P, t) que desempenha o papel de novo Hamiltoniano7 e que nas novas coordenadas se possam escrever equações do movimento do tipo canónico Ṗ = − ∂K , ∂Q Q̇ = ∂K . ∂P (1.3.38) Nem todas as transformações do tipo (1.3.37) permitem escrever equações do movimento do tipo (1.3.38). Transformações que o permitem designam-se canónicas. Depois de uma transformação canónica ainda temos um Hamiltoniano, K = K(Q, P, t), ao qual podemos associar um Lagrangiano, P Q̇ − K e como tal deduzir as trajectórias fı́sicas entre t1 e t2 pelo princı́pio variacional δ Z t2 t1 7 h i P Q̇ − K(Q, P, t) dt = 0 . (1.3.39) Para distinguir do Hamiltoniano original, e porque é convencional usar a letra K, designa-se por vezes esta função de ‘Kamiltoniano’. 1.3 Mecânica Hamiltoniana 19 Mas nas coordenadas originais existe, obviamente, um princı́pio semelhante δ Z t2 t1 [pq̇ − H(q, p, t)] dt = 0 . (1.3.40) Uma condição suficiente8 para a mudança de coordenadas (1.3.37) de modo a que (1.3.39) seja consistente com (1.3.40), é pq̇ − H = P Q̇ − K + dF , dt (1.3.41) onde F é uma função no espaço de fase, denominada função geradora, que pode ser expressa nas coordenadas velhas, novas ou numa combinação de novas e velhas. Este último caso, quando possı́vel, é particularmente útil, pois F funciona como uma ponte de ligação na mudança de coordenadas. Temos então quatro hipóteses a) F = F1 (q, Q, t) b) F = F2 (q, P, t) c) F = F3 (p, Q, t) d) F = F4 (p, P, t) . (1.3.42) Tomando a hipótese a), (1.3.41) fica pq̇ − H = P Q̇ − K + ∂F1 ∂F1 ∂F1 Q̇ , + q̇ + ∂t ∂q ∂Q (1.3.43) e como estamos a tomar q e Q como variáveis independentes obtemos que para esta equação ser obedecida (i) ∂F1 =p, ∂q (ii) ∂F1 = −P , ∂Q (iii) K = H + ∂F1 . ∂t (1.3.44) Dada uma função geradora, (i) dá-nos p = p(q, Q, t), que se for possı́vel inverter dá Q = Q(q, p, t). Então, (ii) dá P = P (q, Q(q, p, t), t) e (iii) dá-nos o novo Hamiltoniano. Note-se que os dois Hamiltonianos só diferem se F1 depender explicitamente do tempo. Para fazer um raciocı́nio semelhante com a hipótese b) em (1.3.42), temos de tomar F = F2 (q, P, t) − QP . 8 (1.3.45) Esta condição não é necessária para que a transformação seja canónica; existem transformações canónicas mais gerais. 20 Tópicos de Mecânica Clássica p P (q, p, t) −→ (Q, P, t) (q(t),p(t)) (Q(t),P(t))=(const.,const.) Q q Figura 1.5: O formalismo de Hamilton-Jacobi é definido por uma função geradora associada a uma mudança para coordenadas ‘co-móveis’ com a partı́cula no espaço de fase. Neste caso (1.3.43) e (1.3.44) são substituidas por pq̇ − H = −QṖ − K + (i) ∂F2 =p, ∂q (ii) ∂F2 ∂F2 ∂F2 Ṗ , + q̇ + ∂t ∂q ∂P ∂F2 =Q, ∂P (iii) K = H + ∂F2 . ∂t (1.3.46) (1.3.47) respectivamente. Mais uma vez, (i) dá-nos p = p(q, P, t), que se for possı́vel inverter dá P = P (q, p, t). Então, (ii) dá Q = Q(q, P (q, p, t), t) e (iii) dá-nos o novo Hamiltoniano. Raciocı́nios semelhantes existem para c) e d) em (1.3.42), mas o caso b) é o mais útil para o formalismo de Hamilton-Jacobi que vamos agora deduzir. Uma escolha muito particular de novas coordenadas no espaço de fase, Q e P , é um sistema de coordenadas onde a partı́cula está parada - figura 1.5 Q = constante P = constante , (1.3.48) e o novo Hamiltoniano é também uma constante, que podemos tomar como sendo zero. As novas equações canónicas (1.3.38) são trivialmente obedecidas e toda a dinâmica fica contida na transformação de coordenadas, em particular na função geradora. Se escolhermos uma função geradora do tipo 2, toda a informação sobre a dinâmica fica contida nas equações (1.3.47). Neste caso, constuma-se representar F2 pela letra S = S(q, P, t) que se designa função principal de Hamilton ou função acção e que obedece a ∂S =p, ∂q (1.3.49) 1.3 Mecânica Hamiltoniana 21 o que significa que o momento é o gradiente da função acção, ∂S =Q, ∂P (1.3.50) cujo significado veremos em baixo e ainda ∂S ∂S ,t = − , H q, p = ∂q ∂t (1.3.51) que é a equação de Hamilton-Jacobi (H-J). Esta equação foi primeiramente estudada por Hamilton em óptica e só depois usada por Karl Jacobi (1804-1851) em mecânica. O formalismo de Hamilton-Jacobi pode ser interpretado da seguinte forma. Fisicamente, mudamos para coordenadas ‘co-móveis’ com a partı́cula e portanto, ao descobrir essa mudança de coordenadas resolvemos, simultaneamente, o movimento da partı́cula. Em termos matemáticos, estabelecemos a equivalência entre resolver um sistema de 2n equações diferenciais ordinárias de primeira ordem (para o caso de n graus de liberdade qi , i = 1...n) e resolver uma equação diferencial com n + 1 (correspondendo a qi , t) derivadas parciais. Uma solução da equação de H-J com n + 1 variáveis, terá n + 1 constantes de integração. Mas uma dessas constantes será irrelevante, pois na equação de H-J só entram as derivadas de S e como tal se S é solução, S ′ = S + constante, também é solução. Assim, haverá n constantes relevantes de integração, que podemos identificar com as constantes Pi . Daı́ concluimos que o significado de (1.3.50) é que a derivada da função acção em ordem às constantes de integração pode ser considerada constante, uma ferramenta muito útil quando usamos o método de Hamilton-Jacobi na prática. A razão pela qual se chama função acção a S(q, P, t) é a seguinte. Da acção definida em (1.2.6), que é um funcional, constrói-se uma função que obedece à equação de HamitonJacobi. De facto, a função acção S = S(q, P, t) ⇒ dS ∂S ∂S = q̇ + , dt ∂q ∂t (1.3.52) pois P é constante, ou usando (1.3.49) e (1.3.51), dS = pq̇ − H = L , dt ⇒ S(t) = Z t t0 Ldt′ + constante , (1.3.53) 22 Tópicos de Mecânica Clássica que é uma função - dado que o limite superior do integral não está fixo - construida da acção. Hamiltonianos independentes do tempo Se o Hamiltoniano não depende explicitamente do tempo, o lado direito da equação de Hamilton-Jacobi também não deverá depender do tempo pelo que podemos tomar a função acção como sendo S = −Et + h(q) , (1.3.54) onde E tem a interpretação de energia, pois é igual ao Hamiltoniano. Para um Hamiltoniano do tipo H= p2 + V (q) , 2m (1.3.55) a equação de Hamilton-Jacobi reduz-se a ∂h ∂q 2 = 2m(E − V (q)) , (1.3.56) de onde se extrai imediatamente uma assinatura caracterı́stica da mecânica clássica: esta equação só tem solução real se E > V (q); logo o movimento é proibido onde a energia da partı́cula é menor que o potencial. Integrando e substituindo em (1.3.54) obtemos Z p S = −Et ± 2m(E − V (q))dq . (1.3.57) Para resolver o problema dinâmico usamos o facto, anteriormente mencionado, que as derivadas da função acção relativamente às constantes de integração são também constantes. Assim, ∂S = const. ∂E (1.3.57) ⇒ r Z dq m p t=± + constante . 2 E − V (q) (1.3.58) Substituindo pelo potencial do problema em questão obtém-se t = t(q), que invertendo nos dá q = q(t), e portanto a solução do problema dinâmico. Voltaremos a encontrar a equação de Hamilton-Jacobi, no limite clássico da equação de Schrödinger (secção 8.4). 1.4 Sumário 1.4 23 Sumário Vimos os vários tipos de equações da mecânica clássica: • Newtonianas, d~p ; F~ = dt (1.4.1) • Euler-Lagrange, para o Lagrangeano L = L(q, q̇, t), d ∂L ∂L − =0; dt ∂ q̇ ∂q (1.4.2) • Hamiltonianas, para o Hamiltoniano H = H(q, p, t), q̇ = ∂H , ∂p ṗ = − ∂H , ∂q (1.4.3) ou, de um modo mais geral, a evolução de uma variável dinâmica f = f (q, p, t) é dada por ∂f df = + {f, H} ; dt ∂t • Hamilton-Jacobi, para uma função acção S = S(q, P, t), ∂S ∂S ∂S =Q, H q, p = ,t = − . ∂P ∂q ∂t (1.4.4) (1.4.5) Dadas condições iniciais, qualquer um destes conjuntos de equações determina exactamente a trajectória da partı́cula tal e qual a podemos medir num instante posterior. Este determinismo é o paradigma da mecânica clássica. CAPÍTULO 2 O perı́odo de Transição Historicamente podemos atribuir uma data de nascimento à Mecânica Quântica. No dia 14 de Dezembro de 1900, Max Planck (1858-1947), apresentou uma solução inovadora para explicar as caracterı́sticas observadas da radiação do corpo negro. O modelo de Planck continha a génese das ideias quânticas bem como introduzia aquela que viria a ser chamada constante de Planck, a constante fundamental da Mecânica Quântica. No entanto, somente 26 anos depois a Mecânica Quântica emergiria na sua forma final. No perı́odo intermédio, entre 1900 e 1926 viveu-se um perı́odo de transição em que, para explicar certos resultados experimentais, se introduziu na fı́sica os conceitos de i) Quantificação de grandezas fı́sicas; ii) Dualidade onda-partı́cula; iii) Interpretação probabilı́stica de fenómenos. Para muitos dos fı́sicos envolvidos neste processo, estas ideias não seriam mais do que conceitos temporários, que a devida altura deveriam ser substituidos por ideias mais convencionais. Em particular, o ponto iii) aparecia como altamente indesejável para a maioria da comunidade cientı́fica, sendo a reluctância desta espelhada na famosa frase de Einstein 26 O perı́odo de Transição y θi θ1 MEIO 1 x MEIO 2 θ2 Figura 2.1: Um raio de luz proveniente do meio 1, incidente na superfı́cie y = 0 com ângulo de incidência θi tem uma componente reflectida, ângulo de reflexão θ1 e uma componente refractada, emergente no meio 2 na direcção definida por θ2 . ‘Deus não joga aos dados...’ . No entanto é no ponto ii) que se encontra quer a origem do ponto i) e do ponto iii) quer a essência da mecânica quântica. Vamos discutir algumas das experiências que motivaram a introdução destas ideias e terminamos este capı́tulo com o quadro conceptual que delas emergiu. 2.1 A luz: ondas versus corpúsculos Para além do conceito de partı́cula discutido anteriormente (i.e. pequenas “bolas de bilhar”), também o conceito de onda nos é familiar. As ondas circulares que se propagam num lago calmo onde cai uma pedra ou as ondas numa corda de guitarra a vibrar são dois exemplos familiares. Entre o século XVII e o século XIX, duas correntes antagónicas disputavam qual a natureza da luz. Newton (e os seus seguidores), naturalmente inspirado pelo sucesso da sua mecânica de partı́culas, defendia que a luz é um fluxo de pequenos corpúsculos. Christian Huyghens (1629-1695) concebeu a ideia de a luz ser uma onda, a propagar-se através de um suporte invisı́vel baptizado de éter. A discussão centrava-se nos seguintes fenómenos fı́sicos: • Reflexão; como a verificada num espelho ou numa superfı́cie de água. Obviamente 2.1 A luz: ondas versus corpúsculos 27 este fenómeno era observado para a luz. Era explicado pela teoria corpuscular por conservação da quantidade de movimento que previa (ver figura 2.1) θi = θ1 (lei da reflexão) , (2.1.1) mas podia também ser quantitativamente explicado pela teoria ondulatória pelo princı́pio de Huygens, ou, em óptica geométrica pelo princı́pio do tempo mı́nimo de Fermat - apêndice B; • Refracção; ou seja, uma mudança (normalmente) brusca na direcção de propagação da luz, em geral devido à mudança de meio, um fenómeno também observado para a luz. Se a luz fosse feita de pequenos corpúsculos poder-se-ia invocar conservação de momento para explicar a refracção do seguinte modo: consideremos que o meio 1 está a um potencial V1 e o meio 2 a um potencial V2 , no ‘setup’ da figura 2.1. Na transição de meio por uma partı́cula existe uma força que nela actua que tem apenas componente Fy . Logo px é conservada ou seja v2 sin θi = sin θ2 v1 (‘Lei da refraccão corpuscular′ ) . (2.1.2) Por outro lado, se a luz fosse uma onda, o princı́pio de Huygens (ou o princı́pio do tempo mı́nimo de Fermat - apêndice B) implica sin θi v1 = sin θ2 v2 (lei de Snell) . (2.1.3) Mas devido à dificuldade em medir a velocidade de luz num meio, esta diferença não foi suficiente para decidir qual a verdadeira natureza da luz até ao século XIX. (Note que Jean Bernard Léon Foucault (1819-1868) fez as primeiras medições da velocidade da luz em meados do séc. XIX.) • Difracção; Fenómeno ondulatório; capacidade de ondas rodearem obstáculos - como a água do mar rodeia uma rocha - e por isso não produzirem ‘sombras’ bem definidas figura 2.2. Pelo contrário, corpúsculos não são difractados - figura 2.3; se a luz fosse corpuscular deixaria uma sombra bem definida. Mas todos sabemos que a luz de 28 O perı́odo de Transição ECRA sombra mal definida obstaculo Frentes de onda em t=0 Frentes de onda em t>0 Figura 2.2: Ondas sofrem difracção, isto é, rodeiam o obstáculo. As duas frentes de onda - uma proveniente de cada um dos lados do obstáculo - interferem. A sua fase num determinado ponto depende da distância que cada uma teve de viajar para chegar a esse ponto; por exemplo, no meio a interferência é construtiva. Este é o padrão de difracção do obstáculo, que estraga a sombra. Na figura não está representada a onda reflectida. uma lanterna ou do sol deixa sombras bem definidas; este argumento levou a que a teoria corpuscular fosse dominante durante todo o século XVIII. Embora com diferenças quantitativas, tanto a perspectiva ondulatória como corpuscular da luz explicam os fenómenos de reflexão e refracção, enquanto que apenas a teoria ondulatória explica o fenómeno de difracção (ou de interferência em geral). Em óptica, os primeiros dois costumam ser tratados por óptica geométrica,1 onde se lida com raios de luz e não frentes de onda, que por sua vez são essenciais para a óptica fı́sica que lida com os fenómenos puramente ondulatórios. 2.1.1 Experiências de Young (1801): ondas triunfam Quando temos uma situação em que ondas encontram um obstáculo existem duas escalas relevantes: λ=comprimento de onda, e l=largura do obstáculo. Thomas Young (1773-1829) observou que as ondas na água só tinham uma difracção apreciável e como tal “sombras” mal definidas imediatamente atrás do obstáculo se l.λ. 1 (2.1.4) A óptica geométrica é uma aproximação quase corpuscular da óptica que é válida quando l ≫ λ, na notação da próxima secção. 2.1 A luz: ondas versus corpúsculos ECRA 29 sombra bem definida obstaculo corpusculos em t=0 t>0 Figura 2.3: Corpúsculos não sofrem difracção; assim, foi argumentado que se a luz fosse corpuscular as sombras deveriam ser bem definidas. ECRA sombra bem definida obstaculo Frentes de onda em t=0 Frentes de onda em t>0 Figura 2.4: Ondas sofrem uma difracção negligenciável se o obstáculo é grande relativamente ao comprimento de onda. Note-se que mais uma vez não representamos a onda reflectida. Se l ≫ λ há uma zona atrás do obstáculo onde a sombra está bem definida, tal como na teoria corpuscular, isto é, a difracção é negligenciável - figura 2.4. Assim, a nossa experiência diária de sombras bem definidas seria consistente com uma teoria ondulatória da luz se os objectos cujas sombras vemos tivessem largura muito maior do que o comprimento de onda da luz. Podemos também considerar a experiência contrária, isto é, consideremos uma onda plana com comprimento de onda λ que em vez de encontrar um obstáculo passa por uma fenda de tamanho l. Se l ≃ λ a difracção da onda é grande, pelo que a fenda se comporta como uma fonte de ondas circulares. Para testar a verdadeira natureza da luz contraste-se a experiência na figura 2.5 com a 30 O perı́odo de Transição Figura 2.5: Experiência de Young com ondas (extraı́do das Feynman lectures on Physics Vol 3 ). experiência na figura 2.6. Experiência de Young com ondas Como explicado anteriormente, as duas fendas na parede (a) da figura 2.5, funcionam (quase) como fontes de ondas circulares, ou mais rigorosamente, semi-circulares. Existe um detector que mede a altura instantânea da água num ponto x - coordenada paralela ao detector - medindo A1 (x)ei(ωt+φ1 (x)) ≡ h1 (x)eiωt , se apenas a fenda 1 estiver aberta i(ωt+φ2 (x)) A2 (x)e iωt ≡ h2 (x)e , (2.1.5) , se apenas a fenda 2 estiver aberta onde Ai são as amplitudes e φi são fases, cuja informação se condensa nas amplitudes complexas hi (x). O detector pode ainda calcular a intensidade das ondas, que por analogia com as ondas electromagnéticas (para as quais corresponde à energia que passa pelo detector por unidade de tempo e de área perpendicular à direcção de propagação), é o quadrado do 2.1 A luz: ondas versus corpúsculos 31 módulo da amplitude, obtendo I1 = |h1 (x)|2 , se apenas a fenda 1 estiver aberta I2 = |h2 (x)|2 , se apenas a fenda 2 estiver aberta , (2.1.6) que são dados pelos padrões em (c) na figura. Consideremos agora que as duas fendas estão abertas. As ondas ‘emitidas’ a partir das duas fendas têm a mesma fase no mesmo instante de tempo, pois provêm de uma mesma onda antes da parede. Neste caso, a altura da água no detector e a intensidade das ondas são dados respectivamente por (h1 (x) + h2 (x))eiωt , I1+2 = |h1 (x) + h2 (x)|2 . (2.1.7) Dependendo da coordenada x, as ondas poderão estar em fase ou não. Por exemplo, exactamente no meio do detector (correspondente a igual distância das duas fendas), as ondas vão estar em fase pois demoram o mesmo tempo a chegar lá. Em geral I1+2 = |h1 (x) + h2 (x)|2 = |h1 (x)|2 + |h2 (x)|2 + 2|h1 (x)||h2 (x)| cos δ(x) , (2.1.8) onde δ é o angulo entre eiφ1 (x) e eiφ2 (x) . Este fenómeno de interferência explica o padrão (c) na figura 2.5. Uma ‘experiência de Young’ com corpúsculos Imaginemos uma pistola que atira balas aleatoriamente como na figura 2.6. A variável x pode ser vista como uma variável aleatória, correspondendo à posição de chegada das balas. O detector obtém as seguintes funções de distribuição de probabilidades: P1 (x) , se apenas a fenda 1 estiver aberta P2 (x) , se apenas a fenda 2 estiver aberta . (2.1.9) P1+2 (x) = P1 (x) + P2 (x) , se as duas fendas estiverem abertas Em particular, não há interferência entre corpúsculos. Note-se a diferença fundamental entre corpúsculos e ondas, expressa em (2.1.9) versus (2.1.6) e (2.1.8). A probabilidade para corpúsculos é a soma das probabilidades individuais. A intensidade das ondas - que no 32 O perı́odo de Transição Figura 2.6: Experiência de Young com ‘balas’ (extraı́do das Feynman lectures on Physics - Vol 3 ). final do capı́tulo faremos corresponder a uma probabilidade - não é a soma das intensidades individuais; de facto resulta da soma das amplitudes individuais. Fazendo este tipo de experiência com luz, com duas fendas muito finas (e pequena distância entre elas), Young observou um padrão de interferência semelhante ao da figura 2.5 (c), e concluiu que a luz era uma onda. Esta perspectiva foi reforçada pela teoria de Maxwell que tem soluções ondulatórias para o campo electromagnético - ondas electromagnéticas, descobertas posteriormente - em 1887 - por Hertz, das quais a luz visı́vel é um exemplo. Mais ainda, (2.1.3) foi derivado da teoria de Maxwell e medida em experiências com radiação electromagnética (e não (2.1.2)). Assim, no final do século XIX a comunidade cientı́fica concordava que a luz (e toda a radiação electromagnética) seria um fenómeno ondulatório. 2.1 A luz: ondas versus corpúsculos 33 Figura 2.7: Distribuição espectral da radiação de um corpo negro; fórmula clássica de Rayleigh-Jeans versus resultados experimentais (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). 2.1.2 A radiação do corpo negro, Planck e o quantum (1900) Consideremos um corpo que absorve toda a radiação electromagnética nele incidente, isto é, um absorsor perfeito. Como, em particular, ele absorve o espectro visı́vel, este é um corpo negro. Se um corpo negro está em equilı́brio térmico à temperatura T , ele terá de emitir tanta energia por unidade de tempo quanto aquela que recebe - o corpo negro é também um emissor perfeito. Mas ao contrário da energia recebida, que pode ser arbitrariamente distribuida pelas diversas frequências no espectro electromagnético, verifica-se experimentalmente que a energia emitida tem um distribuição espectral ρT (ν)dν, muito bem definida, que só depende da temperatura do corpo negro. A curva experimental ρT (ν)dν tem a forma de uma ‘montanha assimétrica’ - figura 2.7. A descrição teórica deste fenómeno em fı́sica clássica, envolvia calcular o número de ondas estacionárias numa cavidade (3-dimensional) com frequência no intervalo dν, multiplicando o resultado pela energia média de uma onda, dada pelo teorema da equipartição 34 O perı́odo de Transição de energia como sendo KB T , onde KB é a constante de Boltzmann, cujo valor numérico é KB = 1.38 × 10−23 Joule/K . (2.1.10) Deste modo, obtém-se a fórmula de Rayleigh-Jeans ρT (ν)dν = 8πν 2 KB T dν . c3 (2.1.11) Comparando esta lei com a curva experimental - figura 2.7 - verifica-se um desacordo absoluto para frequências elevadas, dado que a previsão teórica diverge, que foi baptizado como catástrofe do ultra-violeta. Em 1900, Planck mostrou os seguintes dois factos: • 1) A curva experimental era bem reproduzida pela fórmula empı́rica ρT (ν) = 8πν 2 hν , 3 hν/K BT − 1 c e (2.1.12) hoje chamada Lei de Planck. Nesta fórmula foi introduzida a constante h, chamada constante de Planck com dimensões de Energia×T empo (as mesmas da Acção introduzida em (1.2.6)) e com o valor numérico (actual) h = 6.626 × 10−34 Joule × Segundo , (2.1.13) que foi inicialmente determinada ajustando a lei de Planck à curva experimental da radiação do corpo negro. A constante de Planck tornar-se-á a constante fundamental da mecânica quântica. Para frequências pequenas, a exponencial na Lei de Planck pode ser aproximada pelos dois primeiros termos da sua série de Taylor KB T ν≪ h 8πν 2 8πν 2 hν ⇒ ρT (ν) ≃ 3 = 3 KB T , c 1 + hν/KB T − 1 c (2.1.14) e portanto recuperamos a fórmula de Rayleigh-Jeans, que de facto dava bons resultados para frequências pequenas. Mas para frequências elevadas, a fórmula de Planck ν≫ KB T h ⇒ ρT (ν) ≃ evitando a catástrofe do ultra-violeta. 8πν 2 hν ν→∞ −→ 0 , c3 ehν/KB T (2.1.15) 2.1 A luz: ondas versus corpúsculos 35 a) b) c) d) e) Figura 2.8: a) Distribuição de Boltzmann; b) Energia média na teoria clássica - independente da frequência da radiação - corresponde à area debaixo da curva; c),d),e) Energia média na teoria de Planck. Em cada caso, o integral é substituı́do por uma soma de Riemann, sendo a frequência da radiação o tamanho da base dos rectângulos. Para frequências pequenas, a soma de Riemann é praticamente igual ao integral - c). À medida que aumentamos a frequência, a soma de Riemann diminui tendendo asimptoticamente para zero. Na notação da figura k = KB e E¯ = hEi (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). 36 O perı́odo de Transição • 2) Comparando (2.1.11) com (2.1.12), a diferença está no valor da energia média de uma onda, que classicamente era calculada pela ‘lei de equipartição da energia’. Esta lei é deduzida da distribuição de Boltzmann, que é uma função de distribuição de probabilidade (portanto já normalizada) para encontrar um oscilador harmónico com energia E a uma temperatura T P(E) = e−E/KB T . KB T (2.1.16) Uma onda estacionária não é mais do que um oscilador harmónico. A energia média destas ondas é (conforme (C.40)) Z ∞ Z −E/KB T ∞ hEi = EP(E)dE = −Ee |0 + 0 ∞ e−E/KB T dE = KB T . (2.1.17) 0 Planck observou que para reproduzir o comportamento experimental a energia média teria de ter os seguintes comportamentos assimptóticos ν→0 hEi −→ KB T , ν→∞ hEi −→ 0 . (2.1.18) Isto é, tem de haver um ‘cut-off’ na energia média para frequências elevadas, de modo a impedir a catástrofe do ultra-violeta. A grande contribuição de Planck foi perceber que isto se podia conseguir discretizando a energia que o corpo negro emite E = nhν . (2.1.19) A energia é quantificada, sendo o quantão de energia - a quantidade mı́nima emitida de cada vez - hν. Em vez de (2.1.16) temos agora uma distribuição discreta para a probabilidade de encontrar uma onda com frequência ν no n-ésimo estado de energia, En , e−nhν/KB T , Pn = P(En = nhν) = KB T n = 0, 1, 2, 3, ... (2.1.20) Esta distribuição de probabilidade não está normalizada. Assim sendo, a energia média é ! P∞ P∞ ∞ −nhν/KB T X nhνe E P d n=0 n=0 n n = P = −KB T ν ln hEi = P e−nhν/KB T , (2.1.21) ∞ ∞ −nhν/KB T P e dν n=0 n n=0 n=0 mas o último somatório é apenas uma soma geométrica; logo hν d 1 hEi = −KB T ν ln = hν/K T , −hν/K T B B dν 1−e e −1 (2.1.22) 2.1 A luz: ondas versus corpúsculos 37 Figura 2.9: Esquerda: Aparato experimental do efeito fotoeléctrico; Direita: Variação da intensidade de corrente com o potencial entre cátodo e ânodo para duas intensidades de luz diferentes (Extraı́do de Tipler, ‘Physics’ ). que é exactamente o necessário para obter a lei de Planck. Assim, a radiação do corpo negro é explicada se a energia de um oscilador harmónico, e como tal a energia da radiação emitida pelo corpo negro, estiver quantificada. Mas estar quantificada é dizer que vem em pedaços, o que se assemelha mais a uma descrição corpuscular do que ondulatória da radiação. 2.1.3 O efeito fotoeléctrico (Einstein 1905) O efeito fotoeléctrico foi descoberto por Hertz em 1887 e estudado por Lenard em 1900. Consiste na ejecção de electrões de um material onde incide luz (ou, mais geralmente, radiação electromagnética). Um aparato experimental possı́vel está representado na figura 2.9, que pode ser descrito do seguinte modo: • Luz incide no cátodo C, ejectando electrões; • Se algum electrão atinge o ânodo A, gera-se uma corrente eléctrica no circuito externo; 38 O perı́odo de Transição • O número de electrões que atinge o ânodo pode ser aumentado ou diminuido introduzindo uma diferença de potencial entre A e C, V = VA − VC , (2.1.23) • Se V > 0, significa que o potencial aumenta (para uma carga positiva; para uma carga negativa efectivamente diminui) e mais electrões chegam ao ânodo; • Quando V é suficientemente grande, isto é V > V1 , (2.1.24) para um certo V1 , todos os electrões ejectados atingem o ânodo e aumentando ainda mais V a corrente não se altera - figura 2.9. Esta corrente limite é designada corrente de saturação; • Lenard observou que a corrente máxima é proporcional à intensidade da luz. Tal facto era esperado com base na teoria clássica: duplicando a intensidade da luz, duplicamos a energia incidente por unidade de tempo e de área e como tal duplicamos o número de electrões ejectados e como tal a corrente; • Se pelo contrário V é negativo, menos electrões chegam ao ânodo (do que se não houvesse potencial), pois são repelidos; • Se V é suficientemente negativo, V < V0 , (2.1.25) para um dado V0 , nenhum electrão chega ao ânodo. Chama-se a V0 o potencial de paragem, que está relacionado com a energia cinética máxima dos electrões emitidos por |eV0 | = 1 2 mv 2 onde e, m são a carga e massa do electrão; max , (2.1.26) 2.1 A luz: ondas versus corpúsculos 39 Figura 2.10: Experiência de Millikan (1916), obtendo a recta prevista por Einstein para a variação do potencial de paragem entre cátodo e ânodo com a frequência da luz (Extraı́do de Tipler, ‘Physics). • V0 não depende da intensidade luminosa para luz da mesma frequência, o que não está de acordo com a teoria clássica. Pela teoria clássica, aumentando a intensidade luminosa, deveria aumentar a energia cinética máxima dos electrões e como tal variar V0 . Esta contradição entre teoria clássica e experiência levou Einstein, em 1905, a propôr que a energia na luz está distribuı́da em pequenos pacotes, posteriormente baptizados de fotões, com energia dada pela fórmula de Planck, E = hν . (2.1.27) Variando a intensidade da luz mas não a sua frequência, varia o número de fotões, mas não a energia de cada um deles. Como cada electrão ejectado sê-lo-ia por choque com um fotão, isto explicava porque V0 não dependia da intensidade luminosa. Se assim fosse, 1 2 mv 2 max = |eV0 | = hν − φ , (2.1.28) 40 O perı́odo de Transição em que φ é a chamada função de trabalho, que é a energia necessária para extrair um electrão do metal. Daqui se deduz que |V0 | = φ h ν− . |e| |e| (2.1.29) As experiências de Robert Millikan (1868-1952) em 1914, 1916 mostraram esta relação linear - figura 2.10 - sendo o declive consistente com os valores para a constante de Planck medidos através da radiação do corpo negro. Uma outra caracterı́stica do efeito fotoeléctrico que não pode ser explicada pela teoria clássica é a ausência de intervalo de tempo entre a incidência de radiação e a ejecção de electrões. A intensidade da radiação é a potência por unidade de área que chega ao cátodo. Podemos diminuir a intensidade de modo a que fossem preciso horas para obter energia suficiente para superar a função de trabalho e ejectar um electrão. Mas experimentalmente não se detecta, essencialmente, nenhum intervalo de tempo. Nem este depende da intensidade. À luz da teoria fotónica isto é facilmente explicável. Diminuindo a intensidade diminuem os fotões que chegam por unidade de tempo, mas cada fotão é suficiente para ejectar um electrão. A teoria corpuscular da radiação teve ainda outras vitórias, da qual destacamos o efeito Compton (demonstrado em 1923), que lida com a difusão de radiação por electrões. Assim, mais de um século depois das experiências de Young, era novamente necessário invocar a teoria corpuscular para descrever o comportamento da luz, sendo que o comportamento ondulatório continuava a ser fundamental para explicar os fenómenos de difracção e interferência que vimos anteriormente. Este estado de coisas levou Einstein a escrever, em 1924 “Existem hoje duas teorias sobre a luz, as duas indispensáveis... e sem qualquer ligação lógica entre si.”. Antes de vermos como lida a mecânica quântica com este aparente paradoxo, mudemos a discussão da radiação para a matéria. 2.2 Matéria: corpúsculos versus ondas Por volta de 1910 sabia-se que o átomo, embora neutro, continha electrões. O efeito fotoeléctrico, por exemplo, demonstrava-o. Mas devido à sua neutralidade, tinha também 2.2 Matéria: corpúsculos versus ondas 41 de conter cargas positivas, pelo que se questionava qual a distribuição no átomo de cargas negativas e positivas. J. J. Thomson (1856-1940) propusera o seu modelo do ‘pudim de passas’, em que os electrões se apresentavam como as passas num pudim que, por sua vez, representava a distribuição de carga positiva. O conjunto teria um raio da ordem de 10−10 m,2 isto é, 1 Angström. Se o átomo estivesse no mı́nimo da sua energia, os electrões estariam parados em posições de equilı́brio; se o átomo estivesse excitado - por exemplo aquecido -, os electrões oscilariam em torno dessas posições de equilı́brio, emitindo no processo radiação electromagnética. Explicava-se assim qualitativamente - mas não quantitativamente - os espectros atómicos. As experiências de Ernest Rutherford (1871-1937) em 1911 mostraram que o modelo de Thompson era inadequado. Rutherford fez incidir numa fina folha metálica um feixe colimado de partı́culas α, isto é, átomos de hélio duplamente ionizados. O objectivo era medir o ângulo de desvio dessas partı́culas α (dito o ângulo de difusão) relativamente à direcção inicial, devido à interacção com os átomos na folha metálica. Como este desvio resulta de uma interacção electromagnética poder-se-ia estimar a partir da sua medição o potencial a que as partı́culas α estavam sujeitas. A surpresa foi encontrar eventos em que as partı́culas α eram desviadas de ângulos muito elevados, até perto de 180o, isto é, algumas partı́culas α voltavam para trás! Nas palavras de Rutherford: ”Era como se disparassemos uma bala de canhão contra um lenço de papel e a bala voltasse para trás.”. A conclusão é que essas (poucas) partı́culas α que eram muito deflectidas encontravam um forte potencial repulsivo, o que implica uma forte concentração de carga positiva num pequeno espaço. Esta era a contradição com o modelo de Thomson, em que a carga positiva se encontrava dispersa em todo o raio atómico - cerca de 10−10 m -, enquanto que pelas estimativas de Rutherford o potencial repulsivo observado necessitaria que essa carga estivesse concentrada num raio de 10−14 m.3 2 Este número pode ser estimado considerando a densidade de uma substância pura, o seu peso atómico e o número de Avogadro. 3 Mais rigorosamente, era possı́vel num modelo como o de Thomson explicar a existência de deflexões perto dos 180o através de uma soma de pequenas deflexões. Contudo, a probabilidade de isso acontecer 42 O perı́odo de Transição Assim Rutherford sugeriu que a carga positiva de um átomo e como tal a grande maioria da massa, dado que se sabia que a razão da massa do electrão para a massa do átomo era muito pequena, estavam concentradas numa pequena zona central chamada núcleo. Deste modelo, Rutherford deduziu uma expressão para a secção eficaz diferencial de difusão que de facto explicava quantitativamente os seus resultados experimentais, validando o modelo (ver capı́tulo 10). Mas deixava em aberto a questão do que fariam os electrões neste modelo atómico. Se os electrões estivessem inicialmente parados, cairiam rapidamente para o núcleo, neutralizando-o e eliminando o forte potencial repulsivo necessário para explicar as experiências de Rutherford. Era pois necessário estabilizar os electrões longe do núcleo. Um modelo simples era o análogo do sistema solar. Os electrões encontrarse-iam em órbitas circulares ou elı́pticas em volta do núcleo (ver Folhas de Problemas). Só que isto implicaria que os electrões tivessem movimentos acelerados. De acordo com o electromagnetismo clássico uma carga acelerada emite radiação, perdendo gradualmente energia, o que implicaria que os electrões tivessem órbitas em espiral caindo rapidamente no núcleo. O tempo que demoraria esse processo pode ser estimado do seguinte modo. Veremos na próxima secção que a energia total de uma órbita clássica circular de raio r é dada por (2.2.10). Assumindo que o raio da órbita pode variar com o tempo num processo ‘quase-estático’4 obtemos dE 1 Ze2 = ṙ . dt 8πǫ0 r 2 (2.2.1) Por outro lado, pela fórmula de Larmor dada no problema 2c) da folha de Problemas 1, usando para a aceleração a fórmula da aceleração centrı́peta 2 dE e2 e2 v 4 Ze2 (2.2.9) = − =− . dt 6πǫ0 c3 r 2 6πǫ0 c3 4πǫ0 mr 2 (2.2.2) Igualando estas duas expressões para a derivada temporal da energia obtemos (para Z = 1) 2 4α2 ~2 4 α~ 2 3 (t − t0 ) . (2.2.3) 3r ṙ = − ⇒ r =− cm2 c m neste modelo implicava uma variação do número de acontecimentos com a espessura da folha metálica que não era verificada experimentalmente. 4 Esta hipótese poderá não ser muito boa, mas a estimativa do tempo de queda é representativa da fı́sica do processo. 2.2 Matéria: corpúsculos versus ondas 43 Figura 2.11: Experiência para medir um espectro atómico (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). Introduzimos a constante de estrutura fina α≡ e2 . 4πǫ0 ~c (2.2.4) Como esperado, o raio diminui com o tempo. Para uma órbita de 10−10 m, pode-se estimar o tempo de queda em cerca de 10−10 segundos! O átomo não seria estável e para além disso esta radiação - que teria um espectro contı́nuo - emitida na queda era diferente da radiação atómica observada que tem um espectro discreto que agora discutimos. 2.2.1 O Espectro do átomo de Hidrogénio Um espectro atómico pode ser medido com um ‘setup’ experimental do tipo da figura 2.11. Há essencialmente dois tipos de espectros: • No espectro de emissão, a fonte de luz na esquerda da figura 2.11, corresponde ao gás (monoatómico) cujo espectro se quer medir, no qual se faz descargas eléctricas. As descargas eléctricas excitam os átomos que, ao voltarem para o seu estado de energia mı́nima, emitem radiação. Esta é encaminhada através de uma fenda para um prisma, que dispersa a radiação nos diversos comprimentos de onda, que são impressos numa chapa 44 O perı́odo de Transição Figura 2.12: Fotografia do espectro de emissão do hidrogénio (cima) - série de Balmer; comprimentos de onda correspondentes (baixo) (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). fotográfica. Para o hidrogénio obtém-se, na região do visı́vel, uma fotografia do tipo da imagem de cima na figura 2.12. Estas linhas são (parte do) espectro de emissão do átomo de Hidrogénio. • No espectro de absorção, a fonte de luz emite um espectro contı́nuo que incide num contentor de vidro onde se encontra o gás a estudar. Este irá absorver alguns comprimentos de onda particulares. Os restantes seguem para a fenda e daı́ para o prisma e chapa fotográfica. Assim, na fotografia de um espectro de absorção teremos algumas riscas onde falta radiação, ao contrário do espectro de emissão que corresponde a algumas riscas onde radiação foi emitida. Olhando para a figura 2.12 há uma regularidade óbvia nas riscas do espectro de emissão do hidrogénio. Em 1885, Johann Balmer (1825-1898) mostrou que a seguinte fórmula reproduzia correctamente os comprimentos de onda, λ, das riscas observadas: 1 1 1 , n = 3, 4, 5, ... = RH − λ 22 n2 (2.2.5) onde RH é a chamada constante de Rydberg, cujo valor numérico (actual) é RH = 10967757.6 ± 1.2 m−1 . (2.2.6) 2.2 Matéria: corpúsculos versus ondas 45 À série de comprimentos de onda descritos pela fórmula de Balmer chama-se série de Balmer. Para o hidrogénio existe uma infinidade de séries de comprimentos de onda, cada um descrito por uma fórmula semelhante a (2.2.5) - as primeiras cinco encontram-se escritas na tabela seguinte. Nome da série Zona de Comprimentos de onda Lyman Ultravioleta Balmer Ultravioleta próximo e visı́vel Paschen Infravermelho Brackett Infravermelho Pfund Infravermelho 1 λ 1 λ 1 λ 1 λ 1 λ 1/λ 1 = RH 2 1 1 = RH 2 2 1 = RH 2 3 1 = RH 2 4 1 = RH 52 Valores de n − − − − − 1 n2 1 n2 1 n2 1 n2 1 n2 n = 2, 3, 4, . . . n = 3, 4, 5, . . . n = 4, 5, 6 . . . n = 5, 6, 7 . . . n = 6, 7, 8, . . . Era pois necessário um modelo atómico capaz de explicar estas riscas que fosse ao mesmo tempo consistente com as observações de Rutherford. 2.2.2 O modelo atómico de Bohr (1913) Um tal modelo foi proposto por Niels Bohr (1885-1962), baseado na observação que, em mecânica clássica, o movimento de uma carga num campo de Coulomb tinha como possı́veis soluções para órbitas fechadas, elipses e circunferências. Por simplicidade Bohr escolheu as últimas e postulou que: i) Um electrão num átomo move-se em órbitas circulares em torno do núcleo, sob a influência do campo de Coulomb do núcleo, de acordo com as leis da mecânica clássica; ii) Ao contrário das leis da mecânica clássica, apesar de acelerado, o electrão não irradia energia, mantendo a sua energia E constante; iii) Ao contrário das leis da mecânica clássica, as únicas órbitas possı́veis para o movimento do electrão são aquelas cujo momento angular orbital, L, é um múltiplo inteiro 46 O perı́odo de Transição de h/2π L = n~ ⇔ mvr = n~ , ~ ≡ h/2π ; (2.2.7) iv) Radiação electromagnética é emitida sempre que um electrão, inicialmente em movimento numa órbita de energia total Ei muda descontinuamente - impossı́vel em mecânica clássica - o seu movimento para uma órbita de energia total Ef . A radiação emitida tem frequência ν= Ei − Ef . h (2.2.8) Bohr notou que estes postulados conduziam a uma explicação quantitativa do átomo de hidrogénio. Mas generalizemos o argumento para um átomo com número atómico Z. O raio de uma órbita circular em mecânica clássica é determinado pela igualdade da força centrı́peta (Coulomb neste caso) com a força centrı́fuga v2 1 Ze2 = m , 4πǫ0 r 2 r (2.2.9) onde ‘e’ é a carga do electrão (em módulo). A energia total de uma órbita circular no problema de Coulomb é dada por 1 1 Ze2 E = mv 2 − 2 4πǫ0 r (2.2.9) = − 1 Ze2 . 8πǫ0 r (2.2.10) Estes são os ingredientes necessários. Usando o terceiro postulado de Bohr em (2.2.9) obtemos r= 4πǫ0 2 2 n~ , mZe2 (2.2.11) 2 (2.2.12) o que introduzido em (2.2.10) dá E=− Ze2 4πǫ0 m . 2n2 ~2 A quantificação do momento angular das órbitas permitidas implica a quantificação da energia dessas órbitas. Assim, o quarto postulado de Bohr diz-nos que a radiação emitida quando o electrão salta de uma órbita com momento angular ni ~ para uma órbita com momento angular nf ~ ! 2 2 Ze m 1 1 ν= − 2 , 4πǫ0 4π~3 n2f ni c=νλ ⇒ 1 = λ Ze2 4πǫ0 2 m 4π~3 c 1 1 − 2 2 nf ni ! . (2.2.13) 2.2 Matéria: corpúsculos versus ondas 47 Figura 2.13: ‘Saltos’ correspondendo às várias séries do átomo de hidrogénio (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). Esta fórmula reproduz a fórmula para as várias séries do átomo de hidrogénio, se identificarmos5 R∞ = RH , onde R∞ ≡ Ze2 4πǫ0 2 m . 4π~3 c (2.2.14) O modelo de Bohr dá a seguinte interpretação ao átomo de hidrogénio. Chamemos a cada valor possı́vel de n um estado do electrão. Existe um nı́vel de energia mı́nimo, chamado estado fundamental, correspondente a n = 1. Todos os outros estados em que o electrão se pode encontrar são excitados. Cada série do átomo de hidrogénio corresponde a todos os saltos possı́veis do electrão para um dado estado. Quando o estado final é o fundamental (n = 1)/primeiro excitado (n = 2)/segundo excitado (n = 3) essa é a série de Lyman/Balmer/Paschen - figura 2.13. M R∞ , pois o centro de massa do movimento não é exactamente no núcleo Rigorosamente, RH = m+M que tem massa M . Mas mesmo para o hidrogénio, M/m ≃ 1836, o que torna a aproximação de considerar o núcleo como o centro de massa boa. Contudo, como a espectroscopia é uma ciência muito exacta podemM se medir os desvios desta aproximação. Mas considerando RH = m+M R∞ verifica-se concordância com os dados experimentais até 3 partes em 100.000, que resulta da estrutura fina. 5 48 O perı́odo de Transição 2.2.3 As ondas electrónicas Qual o significado e porque funciona a quantificação do momento angular proposta por Bohr? Em 1924, Louis de Broglie (1892-1987) propôs na sua tese de doutoramento que tal como a luz tinha comportamentos corpusculares e ondulatórias, talvez também a matéria tivesse ambos os comportamentos. Em particular isto deveria ser verdade para os electrões. Se assim fosse, poderiamos associar tanto à radiação como à matéria quantidades ondulatórias - como frequência (ν) e comprimento de onda (λ) - e quantidades algo mais ‘corpusculares’ - como energia (E) e quantidade de movimento (~p). De Broglie propôs que estas quantidades estariam relacionadas pelas equações E = hν , |~p| = h . λ (2.2.15) A primeira é a relação de Planck usada também por Einstein para explicar o efeito fotoeléctrico. A segunda é consequência da primeira para a radiação, dado que para o campo electromagnético, E = c|~p|, e, c = νλ; de Broglie propôs uma tal relação para atribuir um comprimento de onda a uma partı́cula de matéria. Se assim fosse, o terceiro postulado de Bohr (2.2.7) ficaria mvr = n h 2π ⇔ 2πr = n h |~p| ⇔ 2πr =λ. n (2.2.16) Recordemos que o objectivo de Bohr era explicar a estabilidade e os nı́veis de energia do hidrogénio. A última relação diz-nos que a quantificação do momento angular requerida por Bohr é equivalente, se aceitarmos a proposta de de Broglie, à condição de existência de ondas estacionárias! Quando uma onda está encerrada num intervalo fechado de dimensão L, os estados estacionários só existem para comprimentos de onda que sejam um divisor de L. Outros comprimentos de onda não têm a periodicidade correcta. Esta observação dava um significado fı́sico claro ao postulado de Bohr, se aceitassemos a hipótese de de Broglie. Em 1926-27 a ideia de de Broglie foi confirmada pela experiência, através da detecção de padrões de difracção de feixes de electrões em experiências feitas por Clinton Davisson (1881-1958) e Lester Germer (1896-1971) nos EUA e G.P. Thomson (1892-1975) 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 49 na Escócia.6 Desde essas experiências já se mostrou que objectos tão variados como feixes moleculares de hidrogénio, feixes atómicos de hélio ou neutrões também apresentam padrões de difracção. Assim verifica-se a hipótese de de Broglie: Todos os objectos materiais, que normalmente consideramos partı́culas ou aglomerados de partı́culas têm também comportamento ondulatório. A razão porque, por exemplo, uma bola de futebol com a massa de 1 Kg e deslocando-se à velocidade de 10 m/s não aparenta qualquer caracterı́stica ondulatória é porque o seu comprimento de onda de de Broglie é 6.6 × 10−34 h = = 6.6 × 10−35 m , (2.2.17) mv 1 × 10 que é extremamente pequeno; a bola terá uma difracção completamente irrelevante em λ= qualquer fenómeno do nosso quotidiano. Pelo contrário, um electrão com energia cinética de 100 eV, ou seja, 1.6 × 10−17 J (que pode ainda ser considerado não relativista) tem comprimento de onda de de Broglie é λ= √ h 6.6 × 10−34 =√ = 1.2 × 10−10 m , 2mEc 2 × 9.1 × 10−31 × 100 × 1.6 × 10−19 (2.2.18) que é da ordem do diâmetro atómico, sendo por isso o electrão difractado por uma rede de átomos - figura 2.14. Notemos que introduzindo a frequência angular ω = 2πν e o vector de onda ~k cujo módulo é 2π/λ, escrevemos as relações de Einstein-de Broglie (2.2.15) E = ~ω , 2.3 p~ = ~~k . (2.2.19) A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica Se tanto a matéria como a radiação têm tanto propriedades corpusculares como ondulatórias há duas questões imediatas 6 Existe alguma ironia no facto de J.J. Thomson ter ganho o prémio Nobel em 1906 pela sua descoberta do electrão em 1897, que caracterizou como uma partı́cula, e o seu filho G.P.Thomson ter ganho o prémio Nobel em 1937 pela descoberta da difracção do electrão em 1927. Assim, Thomson, o pai, ganhou o Nobel por ter mostrado que o electrão é uma partı́cula e Thomson, o filho, ganhou o Nobel por ter mostrado que o electrão é uma onda...’ 50 O perı́odo de Transição Figura 2.14: Cima: Aparato experimental para a experiência de Debye-Scherrer para observar a difração de raios X (baixo esquerda - usa cristais de óxido de zircónio) ou elecrões (baixo direita - usa cristais de ouro). (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 51 • As propriedades ondulatórias do fotão são descritas pelas equações de Maxwell. Que equação descreve as propriedades ondulatórias do electrão? • Que relação existe entre estes dois tipos de propriedades? Historicamente estas perguntas só foram clarificadas com i) O trabalho de Erwin Schrödinger (1887-1961) que em 1925 postulou uma equação de onda para descrever as ondas associadas a uma partı́cula de matéria, como por exemplo um electrão. As soluções da sua equação denominam-se funções de onda, Ψ(x); ii) O trabalho de Max Born (1882-1970) que, em 1926, sugeriu que a interpretação a dar às funções de onda de Schrödinger seria de amplitude de probabilidade para encontrar a partı́cula num determinado ponto x e cujo módulo ao quadrado Ψ(x)Ψ(x)∗ seria uma densidade de probabilidade;7 Estudemos duas experiências que ilustram esta interpretação probabilı́stica. A primeira lida com a função de onda no espaço de posições. Mas a maioria das partı́culas tem outros graus de liberdade que não apenas a sua posição ou momento. O spin dos electrões (ver capı́tulo 9) e a polarização dos fotões são dois exemplos. Assim, a função de onda completa de uma partı́cula deverá conter informação acerca desses outros graus de liberdade. No segundo exemplo ilustramos a parte da ‘função de onda’ respeitante à polarização de fotões. 2.3.1 Experiência de Young com luz de baixa intensidade Consideremos de novo a experiência de Young com um setup experimental semelhante ao da figura 2.5 e com luz monocromática, frequência ν. A experiência original de Young mostrou que a luz8 apresenta um padrão de interferência e portanto conclui-se que ela tem propriedades ondulatórias. Por outro lado, do efeito fotoeléctrico sabemos que a Ψ(x) será em geral complexo e ‘∗′ designa o complexo conjugado. Assim a densidade de probabilidade é garantidamente positiva e normalizando esta função termos uma função de distribuição de probabilidade no sentido de (C.39) 8 Por luz pode-se entender a partir de agora radiação electromagnética. 7 52 O perı́odo de Transição intensidade da fonte é um indicador do número de fotões emitidos por unidade de tempo, todos eles tendo a mesma energia hν. Imaginemos que diminuimos a intensidade ao ponto de ser emitido apenas um fotão de cada vez. No alvo colocamos ao longo da direcção x um grande número de pequenos fotomultiplicadores, de modo a identificar com grande precisão a coordenada x em que o fotão incide no alvo. Observamos o seguinte i) Os fotodetectores detectam impactos localizados do fotão, isto é, um fotodetector dá sinal de cada vez, de acordo com a descrição corpuscular; ii) Para pequenos números de fotões, os impactos dos fotões parecem ter uma distribuição aleatória - figura 2.15 - esquerda; iii) Para grandes números de fotões, começamos a recuperar o perfil de interferência que vemos na experiência original de Young - figura 2.15 - direita. Assim, as propriedades corpusculares são confirmadas no que toca à detecção individual de fotões - a luz vem em pacotes. E as propriedades ondulatórias são verificadas no que toca à detecção de um padrão de interferência quando muitos fotões já incidiram no alvo. A localização do impacto de cada fotão parece ser aleatória. Mas reconhecemos que estatisticamente os fotões distribuem-se de acordo com o padrão de interferência. Ou seja • A intensidade da onda descreve a densidade de probabilidades para a localização do impacto. Mas se o fotão tem um comportamento corpuscular, então cada fotão passa ou pela fenda 1 ou ou pela fenda 2 da figura 2.5, correcto? Mas se assim for, bloquearmos uma das fendas deveria apenas parar cerca de metade dos fotões continuando os outros a exibir o padrão de interferência. Mas nós sabemos da experiência de Young original que não é assim; bloqueando uma das fendas não há padrão de interferência! Mas então, do ponto de vista de um fotão individual, ele intefere com quê? Não pode ser com os outros, na medida em que nós fizemos a experiência de modo que um fotão passasse de cada vez. Logo 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 53 Figura 2.15: Experiência de Young com fotões. Esquerda: alguns impactos individuais parecem aleatoriamente distribuidos; Direita: Estatisticamente começamos a ver o padrão de interferência a formar-se. • Cada fotão individual tem de inteferir consigo mesmo e só interfere se as duas fendas estiverem abertas! Notemos que se fizéssemos uma experiência de Young com electrões com um setup tal que o tamanho das fendas seja da ordem do comprimento de onda de de Broglie dos electrões de modo a que estes sejam apreciavelmente difractados, observarı́amos: - Os electrões apresentam um padrão de difração semelhante ao da figura 2.5; - Se enviassemos electrões individualmente, o fenómeno da figura 2.15 repetir-se-ia; Isto é, tudo o que descrevemos para fotões podia ser repetido ‘ipsis verbis’ para os electrões. Tentemos, com a experiência de electrões responder à seguinte questão: ‘Será que conseguimos ver porque fenda passa o electrão, sem alterar o padrão de difracção observado?’ O setup experimental e o seu resultado estão representados na figura 2.16. Existe uma fonte luminosa imediatamente a seguir às fendas de modo a que se note uma variação da intensidade recebida por essa fonte devido à passagem do electrão. Se por exemplo o electrão passar pela fenda 2, observamos uma variação na luminosidade no ponto A. Assim 54 O perı́odo de Transição Figura 2.16: Experiência de Young com electrões onde tentamos ver a fenda pelo qual o electrão passa. Se o fizermos, necessariamente perdemos o perfil de interferência (extraı́do das Feynman lectures in Physics - Vol 3 ). podemos determinar porque lado passou o electrão. Se o fizermos, o padrão de difracção desaparece! Temos de concluir que • Vermos o sistema quântico, implica interagir com ele de um modo que o altera. • Não conseguimos ver o comportamento ondulatório e corpuscular de um sistema simultaneamente. A interpretação canónica em Mecânica Quântica (dita interpretação de Copenhaga) destas estranhas conclusões é a seguinte: i) Enquanto não é medido, o fotão/electrão não existe como entidade localizada, como corpúsculo, mas encontra-se antes diluı́do por todo o espaço com uma amplitude de probabilidade que é dada pela função de onda; ii) Apenas quando se efectua uma medição se dá o colapso da função de onda, após o qual detectamos o fotão/electrão como corpúsculo localizado e cuja localização apenas pode ser prevista probabilisticamente com a função de distribuição de probabilidade sendo o quadrado do módulo da função de onda (normalizada). 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 55 De acordo com esta interpretação, as caracterı́sticas ondulatórias do fotão/electrão resultam da sua amplitude de probabilidade se comportar como uma onda. Quando interferimos de algum modo com esta onda, de modo a poder detectar onde se encontra a partı́cula a ela associada, mudamo-la, de modo a não podermos mais ver os aspectos ondulatórios. Assim aspectos ondulatórios e corpusculares são complementares princı́pio da complementaridade. Note-se que classicamente estes aspectos eram vistos como incompatı́veis. 2.3.2 O princı́pio da incerteza de Heisenberg Existe uma expressão matemática para a incapacidade de, num sistema fı́sico, vermos simultaneamente as propriedades ondulatórias e corpusculares de um electrão ou de um fotão ou de qualquer outro objecto. • Por partı́cula (pontual) entendemos algo que tem uma posição bem definida x; • Por onda, entendemos um objecto que tem um comprimento de onda, λ, bem definido. Note-se que quando sobrepomos ondas com diferentes comprimentos de onda (próximos) e amplitudes semelhantes os padrões de interferência começam a ficar mal definidos. Assim, deve haver uma expressão matemática que nos diga que a precisão com que conhecemos x e λ não pode ser, simultaneamente, arbitrariamente pequena. Uma expressão quantitativa pode ser deduzida da seguinte maneira. Consideremos uma partı́cula descrita, num determinado instante, por uma função de onda Ψ(x). A função de onda determina uma função de distribuição de probabilidade P(x), dada por Z Ψ(x)Ψ(x)∗ 2 P(x) = , onde kΨk = dxΨ(x)Ψ(x)∗ . 2 kΨk (2.3.1) Quanto menor for o desvio padrão de x, ∆x, sendo x tratado como uma variável aleatória relativamente à densidade de probabilidade P(x), mais parecida fica a partı́cula com uma partı́cula clássica. Por outro lado, podemos exprimir a função de onda como uma combinação linear de ondas planas monocromáticas, usando um integral de Fourier Z +∞ 1 Ψ(x) = √ Ψ̃(k)eikx dk , 2π −∞ (2.3.2) 56 O perı́odo de Transição onde a transformada de Fourier é 1 Ψ̃(k) ≡ √ 2π Z +∞ Ψ(x)e−ikx dx . (2.3.3) −∞ Podemos encarar Ψ̃ como sendo a função de onda no espaço de Fourier, cujo quadrado do módulo nos dá uma densidade de probabilidade para a distribuição do vector de onda k = 2π/λ. A nossa partı́cula será tanto mais parecida com uma onda quanto menor for o desvio padrão da variável aleatória k, ∆k, calculada relativamente à densidade de probabilidade Ψ̃(k)Ψ̃(k)∗ , P̃ (k) = kΨ̃k2 2 onde kΨ̃k = Z dk Ψ̃(k)Ψ̃(k)∗ . (2.3.4) Mas é uma propriedade das transformadas de Fourier que (em uma dimensão) ∆x∆k ≥ 1 , 2 (2.3.5) ou, usando a relação de de Broglie p = h/λ = ~k, ∆x∆p ≥ ~ . 2 (2.3.6) Esta é a relação de incerteza de Heisenberg. O coeficiente do ~ nesta equação é n/2 quando usamos transformadas de Fourier para funcões em n dimensões. Por isso exprime-se em geral o princı́pio da incerteza como ∆x∆p & ~ . (2.3.7) Note-se que as grandes implicações fı́sicas estão contidas na passagem de (2.3.5) para (2.3.6). A primeira destas expressões refere-se apenas a uma relação entre a dispersão de uma função espacial e a dispersão dos comprimentos de onda das funções sinusoidais que a descrevem no espaço de Fourier. É quando usamos a relação de de Broglie, que transformamos esta expressão em termos de quantidades puramente corpusculares, x e p. Obtemos então uma limitação ao conhecimento de duas variáveis que associamos a uma partı́cula pontual e que em termos clássicos podem ser conhecidas simultaneamente com precisão arbitrária. 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 57 Esta incerteza está intrinsecamente relacionada com o facto de que, no mundo microscópico, quando tentarmos ver o sistema, isto é, medir qualquer coisa, necessariamente alteramos o sistema em questão. Essa alteração tem um resultado imprevisı́vel, numa perspectiva determinista, como se vê pelos impactos localizados dos fotões na figura 2.15. O princı́pio da incerteza de Heisenberg inspirou, desde que foi apresentado, algumas das mais interessantes discussões sobre o conhecimento humano, quer numa perspectiva filosófica quer numa perspectiva cientı́fica. O ponto de vista aqui apresentado é que se trata de uma expressão matemática do princı́pio da complementaridade. 2.3.3 Experiência com a polarização da luz Consideramos uma experiência com uma onda electromagnética plana e monocromática frequência ω - a propagar-se na direcção Oz da figura 2.17. Supomos que o campo eléctrico está polarizado linearmente na direcção definida por ep e como tal pode ser representado por ~ r , t) = E0 ep ei(kz−ωt) , E(~ (2.3.8) onde E0 é uma constante e como tal a intensidade da luz (energia que passa por z = constante por unidade de área e tempo) é I= ǫ0 c |E0 |2 . 2 (2.3.9) Coloquemos um polarizador A que transmite a luz polarizada paralelamente a Ox e absorve a luz polarizada paralelamente a Oy. Depois de passar pelo polarizador, a onda encontra-se polarizada linearmente na direcção Ox e como tal o campo eléctrico é descrito por ~ ′ (~r, t) = E ′ ex ei(kz−ωt) , E 0 (2.3.10) e a intensidade da luz é dada pela lei de Malus I ′ = I cos2 θ . (2.3.11) Esta lei descreve o comportamento clássico da radiação ao passar por um polarizador. Mas o que acontece se diminuirmos a intensidade suficientemente de modo a enviar um fotão de cada vez? 58 O perı́odo de Transição Figura 2.17: Setup experimental para experiência com a polarização de fotões (extraı́do de Cohen et al., ‘Quantum Mechanics’ ). i) Não é possı́vel haver ‘meio’ fotão. Logo o fotão passa ou não passa pelo polarizador; ii) Se colocarmos um fotodetector atrás do polarizador veremos que o fotão passa ou é absorvido aleatoriamente; para grandes números de fotões enviados, N, detectaremos atrás do polarizador N cos2 θ fotões, que seria o que esperarı́amos pela fórmula clássica (2.3.11); Fixemos as seguintes ideias deste exemplo • Numa medição de um sistema quântico há determinados resultados priveligiados, denominados resultados ou valores próprios. Neste caso os resultados proprios são: a) o fotão passa; b) o fotão não passa; o espectro de resultados possı́veis é, portanto, discreto; isto contrasta com a situação clássica, onde o valor da intensidade depois do polarizador varia continuamente entre I e 0, dependendo de θ; • Descrevemos a polarização do fotão por um vector de polarização ep . A cada valor próprio corresponde um estado próprio para o fotão    e =e  ‘passa′ p x está associado o estado próprio Para o valor próprio  e =e  ‘não passa′ p y . 2.4 A aplicabilidade da Mecânica Quântica 59 Se o fotão se encontra num dado estado próprio, então o resultado de uma medição da sua polarização é, com probabilidade igual a um, o valor próprio associado a esse estado próprio. • Para descrevermos o facto de o fotão passar, ou não, aleatoriamente, dizemos que antes da medição, o fotão encontra-se numa sobreposição de estados de polarização; isto é a ‘função de onda’ de polarização ep = cos θex + sin θey . (2.3.12) O quadrado do módulo do coeficiente de um dado estado próprio descreve a probabilidade de obter numa medição o valor próprio associado a esse estado próprio. Aplicando esta regra temos uma probabilidade de cos2 θ (sin2 θ) para o fotão passar (não passar). Note-se que a soma da probabilidade de todos os estados tem de ser igual a um, caso contrário é necessário normalizar a função de onda de polarização. A esta regra de decomposição em estados próprios chama-se princı́pio de decomposição espectral. Note-se que esta decomposição depende do ‘setup’ experimental. Neste caso, o ângulo θ é o ângulo com a direcção do polarizador. • Quando ‘vemos’ se o fotão passa ou não, interagimos com ele de modo que a sua função de onda colapsa para um estado próprio. A partir desse momento o fotão encontra-se nesse estado próprio. Por exemplo, se sabemos que ele passou pelo primeiro polarizador - porque interagimos com ele - então passará por outros polarizadores iguais ao primeiro que ponhamos no seu caminho. Mais uma vez vemos que interagir com um sistema quântico, mesmo que com o objectivo ‘inocente’ de o ver, implica alterá-lo de uma maneira fundamental. 2.4 A aplicabilidade da Mecânica Quântica Na teoria da relatividade existe uma constante fundamental que é a velocidade da luz, c. A existência desta constante dá-nos um critério simples para saber se temos de tratar o sistema usando o formalismo relativista - matematicamente mais pesado - ou se podemos 60 O perı́odo de Transição usar a aproximação não relativista - matematicamente mais simples. Esse critério é que as velocidades tı́picas do sistema em questão, vt , sejam muito menores que a velocidade da luz vt ≪ c . (2.4.1) Neste capı́tulo vimos que quer na radiação do corpo negro, quer no efeito fotoeléctrico, quer no átomo de Bohr, quer nas relações de de Broglie, quer no princı́pio da incerteza, há um factor comum: a constante de Planck. Tal como a velocidade da luz no caso da relatividade, a constante de Planck fornece um critério simples para a necessidade de aplicar ou não o formalismo da mecânica quântica em detrimento do clássico. O critério é o seguinte: Se as acções tı́picas do sistema, St , forem muito maiores que h, St ≫ h , (2.4.2) podemos tratar o sistema na aproximação clássica; caso haja acções da ordem da constante de Planck temos de usar o formalismo da mecânica quântica. Isto não significa que temos de calcular a acção do sistema como definido no capı́tulo 1. Basta-nos calcular variáveis dinâmicas tı́picas do sistema com as dimensões de uma acção. Exemplos: • Oscilador harmónico: uma acção tı́pica é a energia total, dada pelo Hamiltoniano, a dividir pela frequência, ω. Para um oscilador com amplitude A e massa m obtemos 1 St = ωmA2 . 2 (2.4.3) Para uma mola com ω = 10s−1 , m = 1g, A = 0.1m, St = 5 × 10−5J · s ≫ h, logo podemos esquecer efeitos quânticos e tratar o sistema classicamente. Mas se pensarmos nas oscilações de um electrão, m ≃ 10−31 kg numa escala atómica A ≃ 10−10 m que emite no ultravioleta ω ≃ 1017 s−1 , obtemos St ≃ 10−34 J · s ≃ h. Logo o problema tem de ser tratado quanticamente, que é basicamente o caso da radiação do corpo negro. Veremos no capı́tulo 5 o tratamento quântico do oscilador harmónico. • Problema de Larmor: uma acção tı́pica será mais uma vez a energia total dada pelo Hamiltoniano a dividir pela frequência ciclotrónica ωc . Obtemos 1 St = ωc mr 2 , 2 (2.4.4) 2.5 Sumário 61 para uma órbita de raio r. Portanto considerações semelhantes ao caso anterior podem ser feitas. Em particular, um electrão no regime atómico tem de ser tratado quanticamente, dando origem à versão quântica do problema de Larmor, chamado problema de Landau, que veremos no capı́tulo 5. • Problema de Kepler/Coulomb: consideremos as órbitas circulares; mais uma vez, uma acção tı́pica é a energia da órbita sobre a frequência, que na notação do problema 1 da folha de problemas 1 é St = 1√ αmr . 2 (2.4.5) Para o problema de Kepler, α = GmM e considerando o sistema Terra-Sol temos α ≃ 1043 N · m2 , m ≃ 1024 kg, r ≃ 1011 m. Claramente St ≫ h e não necessitamos de mecânica quântica. Para o problema atómico de Coulomb temos α = e2 /(4πǫ0 ) ≃ 10−28 N · m2 , pelo que, usando os valores anteriores para massa do electrão e raio atómico temos St ≃ 10−34 e portanto concluimos que o problema atómico cai no fórum da mecânica quântica; será tratado no capı́tulo 6. • Um fotão: a acção tı́pica de um fotão pode ser estimada como a energia a dividir pela frequência, que, pela fórmula de Planck é h. Logo um fotão é, por definição, uma entidade quântica. Posto de outra maneira, o campo electromagnético para intensidades suficientemente baixas tem de ser tratado quanticamente. 2.5 Sumário Vimos que a luz (e a radiação electromagnética em geral) encarada por Newton como um fluxo de corpúsculos e por Huygens como uma onda, passou a ser vista como uma onda depois das experiências de Young e como uma partı́cula depois das explicações da radiação do corpo negro por Planck, e principalmente, do efeito fotoeléctrico por Einstein. Vimos que a quantificação do átomo feita por Bohr era naturalmente interpretada em termos de estados estacionários do electrão se associássemos ao electrão propriedades ondulatóridas, mais tarde descobertas experimentalmente nas experiências de Davisson e Germer e ainda 62 O perı́odo de Transição Thomson. Assim, tanto a matéria como a radiação têm propriedades ondulatórias e corpusculares. As propriedades ondulatórias estão associadas às funções de onda que descrevem a amplitude de probabilidade para encontrar a partı́cula no espaço. Tentando ‘ver’ a trajectória da partı́cula causamos o colapso da função de onda e o desaparecimento posterior de propriedades ondulatórias. Esta complementaridade mutuamente exclusiva entre propriedades corpusculares e ondulatórias está expressa no princı́pio da incerteza de Heisenberg. A descrição probabilı́stica está no âmago da mecânica quântica. Assim, embora estejamos a descrever partı́culas devemos abdicar do conceito de trajectória em prol de algo mais lato: o estado em que a partı́cula se encontra. Esta situação representa um contraste marcado em relação ao paradigma clássico da fı́sica. Portanto, em mecânica quântica TRAJECTORIA ESTADO CAPÍTULO 3 A equação de Schrödinger Se as partı́culas como o electrão têm uma função de onda associada, Ψ(x), temos que escrever uma equação que descreve o comportamento e evolução de tal função de onda. Obviamente, uma tal equação não pode ser deduzida com base nas equações da mecânica clássica discutidas no capı́tulo 1. Mas do capı́tulo 2 sabemos algumas propriedades que esta equação deve ter: • Deve ser consistente com as relações de Einstein e de Broglie (2.2.19) E = ~ω , p~ = ~~k ; (3.0.1) • Deve ser consistente com a expressão (não relativista) para a energia total, E, de uma partı́cula de massa m, momento p~, num potencial V (~x, t), E= p~2 + V (~x, t) ; 2m (3.0.2) • Para admitir fenómenos de interferência deve ser linear, isto é admitir que a sobreposição de duas soluções seja ainda uma solução, pois é essa sobreposição que dá origem a fenómenos de interferência, como na secção 2.1.1 para ondas na água; • Quando o potencial for zero, tanto a energia como o momento da partı́cula devem ser constantes - a partı́cula é livre. Traduzindo nas quantidades ondulatórias tanto 64 A equação de Schrödinger a frequência como o vector de onda devem ser constantes. Mas isto é o que se passa para uma onda plana monocromática. Assim, assumimos que uma onda plana monocromática, que é representada por ~ Ψ(~x, t) = ei(k·~x−ωt) , (3.0.3) é solução da equação de onda procurada. Usando (3.0.1) em (3.0.2) obtemos, na ausência de potencial, ~ω = ~2 ~ 2 k . 2m (3.0.4) Esta relação de dispersão é a obtida se actuarmos em (3.0.3) com uma derivada temporal e duas espaciais, isto é i~ ~2 ∂Ψ(~x, t) =− ∆Ψ(~x, t) , ∂t 2m (3.0.5) onde ∆ representa o Laplaciano. Esta é chamada a equação de Schrödinger para uma partı́cula livre. Adicionando o termo do potencial, que tem de ser multiplicado pela função de onda devido à linearidade da equação ∂Ψ(~x, t) ~2 i~ = − ∆ + V (~x, t) Ψ(~x, t) , ∂t 2m (3.0.6) obtemos a equação de Schrödinger, sugerida em 1925 pelo fı́sico austrı́aco Erwin Schrödinger. Esta discussão não pretende ser uma derivação da equação de Schrödinger. Apenas uma motivação. A equação de Schrödinger não é derivada, mas sim postulada. A sua validação provém da concordância com os resultados experimentais. 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas Qual a função de onda adequada para descrever uma partı́cula que não esteja actuada por nenhum potencial, i.e. uma partı́cula livre? A solução mais simples da equação de Schrödinger é a onda plana monocromática (3.0.3), por construção. Contudo, segundo o 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas 65 postulado de Born para a interpretação da função de onda, a função de distribuição de probabilidade associada a Ψ(~x, t) é P(~x, t) = Ψ(~x, t)Ψ(~x, t)∗ , kΨ(t)k2 onde a norma kΨ(t)k, que é - à priori - função do tempo1 , é calculada como Z 2 kΨ(t)k = d3~xΨ(~x, t)Ψ(~x, t)∗ . Então se tomarmos para a função de onda (3.0.3) Z ~ ~ 2 kΨ(t)k = d3~xei(k·~x−ωt) e−i(k·~x−ωt) = ∞ , (3.1.1) (3.1.2) (3.1.3) ou seja, a norma diverge. Diz-se que a função de onda não é normalizável. Este resultado não é inesperado. Uma onda plana monocromática tem um vector de onda bem definido e como tal um comprimento de onda bem definido. Logo, o desvio padrão para a distribuição de vectores de onda é zero e pela relação de de Broglie ∆pi = 0, para todos os i. Pelo princı́pio da incerteza, ∆xi = ∞. Isto significa que a partı́cula tem igual probabilidade de estar em todos os pontos. Mas uma tal distribuição de probabilidade constante sobre toda a recta real é necessariamente não normalizável. Assim, esperamos que uma função de onda fisicamente razoável dê origem a uma densidade de probabilidade que não seja totalmente delocalizada. Existe uma segunda razão pela qual uma onda plana monocromática não é uma ‘boa’ função de onda para uma partı́cula. Consideremos as expressões relativistas de energia e momento de uma partı́cula E=p mc2 , 1 − v 2 /c2 p~ = p m~v , 1 − v 2 /c2 (3.1.4) onde m é a massa em repouso da partı́cula e v a sua velocidade relativamente a um dado referencial inercial. Deduzimos que p~ = 1 E ~v . c2 (3.1.5) Veremos que na evolução de um sistema fı́sico a norma é conserada, pelo que se a função de onda estiver normalizada assim permanecerá. Esta propriedade decorre da unitariedade do operador de evolução. 66 A equação de Schrödinger Uma onda monocromática é definida pela frequência angular ω e pelo vector de onda, com norma |~k|. A velocidade a que se propaga uma dada fase, isto é um máximo ou um mı́nimo da onda - dita velocidade de fase - é dada por ~k · ~x − ωt = constante; portanto a velocidade de fase tem norma E (3.1.5) c2 , (3.1.6) = |~p| |~v | que não só é diferente da velocidade da partı́cula como é maior - para uma partı́cula com vf ase = ω |~k| (3.0.1) = massa, para a qual |~v| < c - do que a velocidade da luz no vazio! Como tal concluimos que uma onda monocromática não é uma descrição aceitável da função de onda de uma partı́cula. Ambas as dificuldades anteriores são ultrapassadas se usarmos uma sobreposição de ondas monocromáticas de várias frequências para descrever a nossa partı́cula, isto é, um pacote ou trem de ondas. As razões são as seguintes: 1) Ao adicionarmos ondas de várias frequências, estas interferem destrutivamente e construtivamente de um modo que pode localizar mais a função de onda, tornando-a normalizável; 2) A velocidade do pacote de ondas não é a média das velocidades de fase de cada uma das ondas que formam o pacote; é antes a velocidade de propagação do máximo da amplitude, dita velocidade de grupo. A propagação deste máximo resulta de fenómenos de interferência, podendo a sua velocidade ser identificada com a da partı́cula clássica associada à onda. Devido à linearidade da equação de Schrödinger uma tal sobreposição é necessariamente ainda uma solução desta equação. Começamos com o caso simples de uma sobreposição discreta, para depois irmos para o caso de uma sobreposição contı́nua, que é o caso de interesse fı́sico. 3.1.1 Sobreposição discreta de ondas Consideramos, no instante t = 0, uma sobreposição discreta de ondas, isto é, algo do tipo Ψ(~x, 0) = n X ~ Aj ei(kj ·~x) , (3.1.7) j=1 correspondendo a uma sobreposição de n ondas planas, com amplitudes Aj e vectores de onda ~kj . Por simplicidade vamos trabalhar em uma dimensão e especializemos a nossa 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas 67 Figura 3.1: Três ondas monocromáticas e a sua sobreposição. Na figura de baixo, a linha a tracejado corresponde ao módulo da função de onda (Extraı́do de Cohen et al, ‘Quantum Mechanics’). análise para o seguinte caso: ∆k ∆k n = 3 , kj = k0 − , , k0 , k0 + 2 2 g(k0 ) Aj = √ 2π 1 1 , 1, 2 2 . (3.1.8) Com esta escolha (3.1.7) fica x∆k g(k0) ik0 x . 1 + cos Ψ(x, 0) = √ e 2 2π (3.1.9) Na figura 3.1 representamos as várias ondas monocromáticas e a sua sobreposição. Este exemplo mostra o efeito, ora destrutivo ora construtivo, da interferência das várias ondas. Notando que p g(k0 ) |Ψ(x, 0)| = Ψ(x, 0)Ψ(x, 0)∗ = √ 2π x∆k 1 + cos 2 , (3.1.10) este exemplo mostra também como o módulo da função de onda (e como tal a densidade de probabilidade) que é representado pela linha tracejada na figura 3.1 - que corresponde à função (1 + cos(x∆k/2) - ficou mais localizada do que no caso de uma só onda. Esta é que é a imagem a reter do pacote de ondas. 68 A equação de Schrödinger Note-se que neste caso ainda não resolvemos o problema da não normalização da função de onda. De facto, qualquer sobreposição discreta de ondas monocromáticas dá origem a uma função periódica. No caso que temos em mão, isso significa que na figura 3.1 há infinitas repetições quer para a esquerda quer para a direita da figura de baixo. Para termos uma função de onda normalizável temos necessariamente de ter uma sobreposição contı́nua de ondas monocromáticas (se as ondas estiverem definidas sobre todo o R). Com este exemplo podemos ilustrar o princı́pio de incerteza. Suponhamos que 2 x∆k , P(x) ∝ 1 + cos 2 para x∈ 2 [−π, π] , ∆k (3.1.11) e P(x) = 0 fora deste intervalo. Consideramos apenas uma dimensão. Uma medida para o ‘espalhamento’ dos valores de x, ∆x, é o tamanho do intervalo onde se distribui a densidade de probabilidade; logo ∆x∆k ≃ 4π , (3.1.12) de onde conluimos que aumentando ∆k se diminui ∆x, conforme esperado pelo princı́pio da incerteza. Com este exemplo podemos ver como a sobreposição modifica a velocidade de propagação. Tomamos agora para t > 0 Ψ(~x, t) = n X ~ Aj ei(kj ·~x−tωj ) , (3.1.13) j=1 e especializamos para (3.1.8) juntamente com ∆ω ∆ω ωj = ω0 − . , ω0 , ω0 + 2 2 (3.1.14) g(k0 ) i(k0 x−tω0 ) x∆k ∆w Ψ(x, t) = √ e − t , 1 + cos 2 2 2π (3.1.15) x∆k ∆w g(k0 ) − t . 1 + cos |Ψ(x, t)| = √ 2 2 2π (3.1.16) Neste caso obtemos, e 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas 69 A velocidade de grupo é por definição a velocidade com que o máximo do módulo da função de onda está a avançar, que é vgrupo = ∆ω , ∆k (3.1.17) que não coincide com nenhuma das velocidades de fase vf ase = 2ω0 − ∆ω ω0 2ω0 + ∆ω , , 2k0 − ∆k k0 2k0 + ∆k , (3.1.18) nem com a sua média. Veremos a seguir que esta velocidade de grupo coincide com a velocidade ‘clássica’ da partı́cula. 3.1.2 Sobreposição contı́nua de ondas Consideramos agora uma função de onda dada pela sobreposição contı́nua de ondas na forma 1 Ψ(x, 0) = √ 2π Z +∞ g(k)ei(kx+φ(k)) dk , (3.1.19) 0 onde g(k) é a amplitude (real) do modo de Fourier com comprimento de onda λ = 2π/k e φ(k) é uma fase que depende do modo de Fourier. Tomamos a amplitude como sendo não nula apenas em ∆k ∆k , k0 + k0 − 2 2 , (3.1.20) intervalo no qual a fase φ(k) varia suavemente. Sendo o intervalo suficientemente pequeno, aproximamos φ(k) = φ(k0 ) + dφ dk k0 (k − k0 ) ≡ φ0 − φ′0 (k − k0 ) . (3.1.21) Deste modo, para este caso particular, expressamos (3.1.19) como 1 Ψ(x, 0) = √ ei(φ0 +k0 x) 2π Z k0 +∆k/2 k0 −∆k/2 ′ g(k)ei(k−k0 )(x−φ0 ) dk ≡ A(x, 0)ei(φ0 +k0 x) . (3.1.22) Assim, expressamos a nossa sobreposição contı́nua de ondas como uma onda plana com amplitude variável. Esta forma da função é útil para estudar a variação de |Ψ(x, 0)| com x: 70 A equação de Schrödinger • Para (x − φ′0 ) >> 1/(k − k0 ), a função ′ ei(k−k0 )(x−φ0 ) , (3.1.23) oscila muito rapidamente quando variamos k no intervalo permitido. Assim, o integral em (3.1.22) é aproximadamente a média da função (3.1.23), que é zero; • Para x ≃ φ′0 , a função (3.1.23) praticamente não oscila, dando o integral uma forte contribuição e sendo a amplitude A(x, 0) dominante neste ponto. Concluimos assim duas coisas: i) O centro do pacote de ondas, isto é, o máximo da amplitude é em dφ ′ ; xcentro = φ0 ≡ − dk k0 ii) A norma da função de onda Z +∞ Z 2 ∗ kΨ(0)k = Ψ(x, 0)Ψ(x, 0) dx = −∞ (3.1.24) +∞ A(x, 0)A(x, 0)∗ dx , (3.1.25) −∞ é agora finita, pois a amplitude é nula para (x−φ′0 ) >> 1/(k −k0 ) e nunca é infinita.2 Agora mostramos que a velocidade de grupo deste pacote de ondas coincide com a velocidade clássica da partı́cula que lhe podemos associar. Para isso consideramos a nossa função de onda (3.1.19) para t > 0 1 Ψ(x, t) = √ 2π Z +∞ g(k)ei(kx+φ(k)−w(k)t) dk , (3.1.26) 0 onde a frequência ω(k) é uma função suave do modo de Fourier, para a qual utilizamos uma aproximação semelhante àquela usada para a fase dω (k − k0 ) ≡ ω0 + ω0′ (k − k0 ) . ω(k) = ω(k0 ) + dk k0 (3.1.27) Nota técnica: para o integral (3.1.25) convergir é necessário que A(x, 0)A(x, 0)∗ decaia mais rapidamente que 1/x. Analisando (3.1.22), podemos concluir que A(x, 0) decai como 1/x, pelo que A(x, 0)A(x, 0)∗ decai de facto mais rapidamente do que 1/x. 2 3.2 Partı́cula em potenciais independentes do tempo 71 Usando esta expressão e (3.1.21), escrevemos (3.1.26) como 1 Ψ(x, t) = √ ei(φ0 +k0 x−ω0 t) 2π Z k0 +∆k/2 k0 −∆k/2 ′ ′ g(k)ei(k−k0 )(x−φ0 −ω0 t) dk ≡ A(x, t)ei(φ0 +k0 x−ω0 t) . (3.1.28) Pela mesma argumentação usada anteriormente concluimos que o centro do pacote de ondas se encontra agora em xcentro = φ′0 + ω0′ t , (3.1.29) pelo que se desloca com velocidade vgrupo = ω0′ ≡ dω dk . (3.1.30) k0 Pelas relações de Einstein-de Broglie, (3.0.1), isto implica que3 vgrupo = dE dp = p0 p0 = v0 . m (3.1.31) A filosofia é agora a seguinte. Ao expressarmos a sobreposição contı́nua de ondas na forma (3.1.28) pensamos nela como uma onda plana monocromática com amplitude variável, à qual podemos associar uma velocidade de duas maneiras distintas: i) A sua frequência, ω0 , e vector de onda, k0 , definem pelas relações de de Broglie uma energia e um momento, que por sua vez definem a velocidade da partı́cula: v0 = dE/dp, para p = p0 = ~k0 ; ii) A velocidade de propagação do máximo da amplitude, que é dado pela velocidade de grupo (3.1.31), que coincide com a anterior. 3.2 Partı́cula em potenciais independentes do tempo Se o potencial onde a partı́cula se encontra é independente do tempo, a equação de Schrödinger (3.0.6) escreve-se ∂Ψ(~x, t) ~2 i~ = − ∆ + V (~x) Ψ(~x, t) . ∂t 2m 3 (3.2.1) Na penúltima e última igualdades da equação (3.1.31) usamos a expressão não relativista da energia; se usassemos as expressões relativistas (3.1.4) o resultado final seria o mesmo. 72 A equação de Schrödinger Podemos tentar encontrar soluções desta equação separando variáveis, isto é tomando como ansätz Ψ(~x, t) = Φ(~x)χ(t) . (3.2.2) Colocando no lado esquerdo a dependência temporal e do lado direito a dependência espacial, a equação de Schrödinger reescreve-se ~2 1 i~ ∂χ(t) − = ∆ + V (~x) Φ(~x) . χ(t) ∂t Φ(~x) 2m (3.2.3) O lado direito só depende de ~x e o esquerdo só depende de t. Logo, para ter soluções desta equação cada lado tem de ser igual a uma constante. Dado que os vários termos têm dimensão de ‘energia’, interpretamos a constante, denotada E, como energia e obtemos: 1) Do lado esquerdo i~ dχ(t) = Eχ(t) dt ⇒ χ(t) = e−iEt/~ = e−iωt , (3.2.4) onde usamos (3.0.1). Assim a dependência temporal está bem definida; 2) Do lado direito, ~2 ∆ + V (~x) Φ(~x) = EΦ(~x) . − 2m (3.2.5) A esta equação chamamos equação de Schrödinger independente do tempo. Entende-se que as suas soluções representam a parte espacial da função de onda; a função de onda total é Ψ(~x, t) = Φ(~x)e−iωt . (3.2.6) Soluções deste tipo da equação de Schrödinger, são baptizadas de estados estacionários. Representam estados com energia bem definida, E = ~ω. Podemos reescrever a equação de Schrödinger independente do tempo como ĤΦ(~x) = EΦ(~x) , (3.2.7) onde definimos o operador diferencial linear Ĥ, chamado operador Hamiltoniano, Ĥ ≡ − ~2 ∆ + V (~x) . 2m (3.2.8) 3.2 Partı́cula em potenciais independentes do tempo 73 Deste ponto de vista, resolver a equação de Schrödinger independente do tempo é resolver um problema de valores próprios e funções próprias, isto é, as energias são valores próprios e as funções Φ(~x) são funções próprias do operador Hamiltoniano. Podemos descrever também a equação (3.2.4) nesta linguagem: a dependência temporal da função de onda para estados estacionários, e−iEt/~, é uma função própria do operador diferencial linear T̂ , denominado operador de translações temporais T̂ ≡ i~ ∂ , ∂t (3.2.9) com valor próprio E. Assim, a função de onda (3.2.6) é um produto de funções próprias dos operadores Ĥ e T̂ .4 Note-se que devido à linearidade da equação de Schrödinger, manifesta no facto dos operadores Ĥ e T̂ serem lineares, qualquer combinação linear de estados próprios é ainda uma solução da equação de Schrödinger. No capı́tulo 4 iremos sistematizar o formalismo de operadores, funções próprias e vectores próprios em mecânica quântica. Vamos agora estudar os estados estacionários para alguns potenciais concretos, em uma dimensão. O nosso objectivo é contrastar o comportamento de uma partı́cula quântica, descrita pela equação de Schrödinger, com o de uma partı́cula clássica, sendo a diferença fundamental a seguinte: a partı́cula quântica propaga-se como uma onda. Os potenciais escolhidos são matematicamente simples de tratar pois são constantes por pedaços: potenciais em escada. Isto implica certas descontinuidades. Mas note-se que estas descontinuidades não são fı́sicas; devemos pensar nos exemplos a seguir como aproximações de potenciais contı́nuos que variam rapidamente. 3.2.1 Caracterı́sticas gerais num potencial em escada Por potencial em escada entende-se um potencial que é constante por pedaços. As figuras 3.3, 3.7 e 3.11 são exemplos de potenciais em escada. Em cada uma das regiões, a equação 4 Note que, em geral, a equação de Schrödinger se pode escrever T̂ Ψ(t, ~x) = Ĥ(t)Ψ(t, ~x). Para os estados estacionários os valores próprios destes dois operadores coincidem. 74 A equação de Schrödinger de Schrödinger independente do tempo (3.2.5) fica uma equação do tipo d2 Φ(x) 2m + 2 (E − V )Φ(x) = 0 , dx2 ~ (3.2.10) para um V constante. Analisemos os vários tipos de soluções: i) Se E > V esta é uma equação do tipo da do oscilador harmónico (1.1.5), cuja solução escrevemos agora como Φ(x) = Aeikx + A′ e−ikx , (que é equivalente a escrever Φ(x) = Ã cos(kx + φ0 )) onde definimos p 2m(E − V ) , k= ~ (3.2.11) (3.2.12) e as constantes A, A′ são números complexos, pois a função de onda é complexa. Estas soluções correspondem a uma função de onda ‘ondulatória’. ii) Se E < V esta é uma equação do tipo da do oscilador harmónico mas com ‘frequências imaginárias’. Isto significa que em vez de exponenciais imaginárias temos como soluções exponenciais reais Φ(x) = Bek̃x + B ′ e−k̃x , onde B, B ′ são constantes complexas e p 2m(V − E) k̃ = . ~ (3.2.13) (3.2.14) Estas soluções correspondem a funções de onda que crescem ou decrescem exponencialmente. iii) Se E = V a solução é Φ(x) = C + C ′ x , (3.2.15) que é uma função de onda linear, onde C, C ′ são constantes complexas. Este caso é muito particular e não será usado na nossa análise. 3.2 Partı́cula em potenciais independentes do tempo 75 V(x) V0 0 x Figura 3.2: Potencial real aproximado por um potencial em escada. O que irá acontecer à função de onda nos pontos de descontinuidade do potencial? Para esclarecer este ponto recordamos que os verdadeiros potenciais fı́sicos não serão descontı́nuos; variarão rapidamente mas serão contı́nuos. Assim, por exemplo, o potencial da figura 3.3 é uma aproximação ao potencial da figura 3.2. O primeiro é mais fácil de tratar matematicamente, mas o segundo será o potencial realista. Deste modo podemos pensar num potencial em escada, V (x), que é descontı́nuo no ponto x0 , como limite de potenciais contı́nuos no intervalo [x0 − ǫ, x0 + ǫ], Vǫ (x), que coincidem com V (x) fora deste intervalo. Para cada Vǫ (x), existe uma função de onda Φǫ (x), que obedece a d2 Φǫ (x) 2m + 2 (E − Vǫ )Φǫ (x) = 0 . dx2 ~ Integrando esta equação diferencial entre x0 − η e x0 + η, obtemos Z dΦǫ dΦǫ 2m x0 +η (x0 + η) − (x0 − η) = 2 [Vǫ (x) − E]Φǫ (x)dx . dx dx ~ x0 −η (3.2.16) (3.2.17) Para as funções Φǫ (x) e o seu limite quando ǫ → 0 serem boas funções de onda, não podem divergir em nenhum ponto; caso contrário, a densidade de probabilidade associada a esse ponto seria infinita. Então tomamos estas funções de onda como finitas. Logo o integrando em (3.2.17) é finito, inclusive no limite ǫ → 0. Tirando seguidamente o limite η → 0, concluimos que dΦ(x)/dx é contı́nua em x0 . Isto implica que Φ(x) também é contı́nua em x0 de facto, derivável. Assim, iremos impôr que a função de onda e a sua derivada são contı́nuas nas descontinuidades do potencial. 76 A equação de Schrödinger Note-se que a análise do último parágrafo assumiu implicitamente que o potencial é finito, caso contrário o integrando em (3.2.17) seria infinito. No caso de o potencial ser infinito, a derivada da função de onda não será contı́nua, mas podemos ainda requerer continuidade da função de onda. O potencial ser infinito numa dada região (finita) significa que a função de onda será zero nessa região. Como veremos, uma partı́cula quântica pode penetrar numa região com um potencial, V , maior do que a sua energia, E - região classicamente proibida pois, como E = Ecinética + V , significaria que Ecinética < 0. Contudo, o seu poder de penetração, que é dado por uma onda evanescente, diminui quando V − E aumenta. Quando V → ∞, essa possibilidade de penetração desaparece. Assim, para uma descontinuidade infinita do potencial imporemos apenas a continuidade da função de onda, o que será suficiente para resolver o problema, dado que o valor da função de onda na região onde o potencial é infinito é conhecido: é zero. Vamos desde já definir a intensidade de uma função de onda, I, como a densidade de probabilidade de posição da partı́cula vezes a velocidade de propagação da mesma. Para uma onda plana ~k . (3.2.18) m Note-se que a definição é análoga à da intensidade de uma onda plana, que é a quantidade Ψ(x, t) = Aei(Et/−̄kx) ⇒ I = |A|2 de energia que atravessa uma superfı́cie disposta normalmente à direcção de propagação da onda por unidade de tempo e de área. Equivalentemente, é a densidade de energia vezes a velocidade de propagação. 3.2.2 Salto de potencial (E > V0 ) Consideramos o potencial na figura 3.3. As soluções da equação de Schrödinger independente do tempo para uma partı́cula com energia E, tal que E > V0 são  √ 2mE  ik1 x ′ −ik1 x   Região I Φ(x) = A1 e + A1 e com k1 = p~ . (3.2.19)  2m(E − V )  0  Região II Φ(x) = A2 eik2 x + A′2 e−ik2 x com k2 = ~ Requerendo continuidade da função de onda e da sua derivada em x = 0 obtemos, respectivamente 3.2 Partı́cula em potenciais independentes do tempo 77 V(x) A’1 A1 E A2 A’2 V 0 I II x 0 Figura 3.3: Salto de potencial. Distinguimos duas regiões: x < 0 é a Região I, onde V = 0; x > 0 é a Região II, onde V = V0 ; aqui consideramos as várias ondas associadas a uma partı́cula com E > V0 .    A1 + A′1 = A2 + A′2 . (3.2.20)   k1 (A1 − A′ ) = k2 (A2 − A′ ) 1 2 Temos quatro constantes de integração e duas condições entre elas, o que, portanto, não especifica suficientemente a solução. Podemos pois por uma constante igual a zero: A′2 = 0. Fisicamente esta escolha tem o seguinte significado. Recordando que a função de onda total é dada por Ψ(x, t) = Φ(x)e−iEt/~ , (3.2.21) podemos ver qual a direcção em que viajam as várias ondas da solução, o que se encontra representado na figura 3.3. Se pensarmos fisicamente no nosso problema como descrevendo uma partı́cula que vem de x = −∞ (associada à onda A1 ), que tem uma probabilidade de ser transmitida para a região II em x = 0 (associada à onda A2 ) e uma probabilidade de ser reflectida de volta para a região I (associada à onda A′1 ), concluimos que não devemos ter a onda A′2 . Assim, escrevemos a solução das equações (3.2.20) como A′1 k1 − k2 = , A1 k1 + k2 A2 2k1 = . A1 k1 + k2 (3.2.22) 78 A equação de Schrödinger Estas são designadas, respectivamente, amplitudes de reflexão e transmissão. As intensidades das ondas incidentes, reflectida e transmitida são, respectivamente Ii = |A1 |2 ~k1 , m Ir = |A′1 |2 ~k1 , m It = |A2 |2 ~k2 . m (3.2.23) Definimos o factor de transmissão T , e o factor de reflexão R, respectivamente como 2 2 2 4k1 k2 k1 − k2 k2 A2 It Ir A′1 = = = T ≡ = , R≡ . (3.2.24) Ii k1 A1 (k1 + k2 )2 Ii A1 k1 + k2 Note-se que T +R =1 . (3.2.25) Assim, as quantidades T e R são apropriadas para ser interpretadas como a probabilidade de transmissão e reflexão da partı́cula. Vemos desde já uma diferença fundamental entre a descrição quântica e clássica desta partı́cula: Classicamente a partı́cula seria sempre transmitida para a região II; quanticamente existe uma probabilidade de a partı́cula ser reflectida de volta para a região I. Este facto é facilmente entendido se pensarmos numa analogia com óptica. Uma onda que chega à fronteira entre dois meios com ı́ndices de refracção diferentes, proporcionais a k1 e k2 , tem uma componente transmitida e reflectida. Para incidência normal, as fórmulas de Fresnel que descrevem a razão entre os vários campos eléctricos envolvidos coincidem com (3.2.22). Assim, em óptica este resultado é claro. A mecânica quântica entra quando pensamos na onda como a função de onda que descreve uma partı́cula. 3.2.3 Salto de potencial (E < V0 ) Consideramos o mesmo potencial que no caso anterior, mas tomamos agora uma partı́cula com E < V0 , como representado na figura 3.4. As soluções da equação de Schrödinger independente do tempo são:     Região I Φ(x) = Aeik1 x + A′ e−ik1 x    Região II Φ(x) = Bek2 x + B ′ e−k2 x √ 2mE p~ . 2m(V0 − E) com k2 = ~ com k1 = (3.2.26) 3.2 Partı́cula em potenciais independentes do tempo 79 V(x) I II V 0 A’ A E B B’ x 0 Figura 3.4: Salto de potencial. Aqui consideramos as várias ondas associadas a uma partı́cula com E < V0 . Na região II essas ondas são exponenciais; na figura damos a ideia de qual a crescente e qual a decrescente. Requerendo continuidade da função de onda e da sua derivada em x = 0 obtemos, respectivamente    A + A′ = B + B ′ . (3.2.27)   ik1 (A − A′ ) = k2 (B − B ′ ) Neste caso, para que a função de onda seja limitada quando x → +∞ tomamos B = 0. Logo A′ k1 − ik2 = , A k1 + ik2 B′ 2k1 = . A k1 + ik2 (3.2.28) A função de onda na região II já não é uma onda plana, e não lhe podemos associar uma velocidade e como tal uma intensidade de probabilidade. Por isso não podemos calcular um coeficiente de transmissão. Isto é consistente com o facto de o coeficiente de reflexão ser R= k1 − ik2 k1 + ik2 2 =1. (3.2.29) Concluimos que 1) tal como em mecânica clássica, a partı́cula quântica é sempre reflectida; 2) mas a função de onda não é zero na região II, decaindo exponencialmente - diz-se que existe uma onda evanescente na região II (figura 3.5), havendo portanto uma probabilidade não nula de encontrar a partı́cula nessa região. A razão da consistência entre estes dois 80 A equação de Schrödinger Ψ(x,t )Ψ(x,t )* II I V 0 x 0 Figura 3.5: Salto de potencial. Representação do módulo da função de onda ao quadrado para um t fixo, para uma partı́cula com E < V0 . Note-se a onda evanescente na região II. factos é a seguinte. Note-se que A′ /A tem uma parte imaginária Im A′ A =− 2k1 k2 . k12 + k22 (3.2.30) Logo, há um diferença de fase entre a onda incidente e a reflectida, que pode ser vista como um atraso na reflexão. Podemos pensar que, embora a partı́cula quântica - tal como a clássica - seja sempre reflectida, a partı́cula quântica - ao contrário da clássica pode penetrar na região II antes de ser reflectida, causando o atraso referido. Note-se que no limite V0 → ∞ temos k2 → ∞; logo a parte imaginária (3.2.30) vai para zero. Neste limite perdemos a onda evanescente e consequentemente o ‘atraso’ na onda reflectida. Note-se ainda que ao analizar este limite confirmamos que a função de onda é zero quando o potencial é infinitamente maior do que a energia da partı́cula, o que prova a afirmação feita no final da secção 3.2.1. Usando A′ ≡ eϕi A, podemos escrever a parte espacial da função de onda neste problema como Φ(x) = A(eik1 x + e−ik1 x+iϕ ) , (3.2.31) de onde concluimos que ΨΨ∗ = 2A2 (1 + cos(2k1 x − ϕ)); este módulo está representado na figura (3.5). 3.2 Partı́cula em potenciais independentes do tempo 81 V(x) A1 A’1 A2 A’2 E A3 A’3 V 0 II I III 0 x L Figura 3.6: Barreira de potencial. Distinguimos três regiões: x < 0 é a Região I, onde V = 0; 0 < x < L é a Região II, onde V = V0 ; x > L é a região III, onde V = 0. Aqui representamos as várias ondas associadas com uma partı́cula com E > V0 . 3.2.4 Barreira de potencial (E > V0) Consideramos agora uma barreira de potencial, como a representada na figura 3.6 e uma partı́cula com E > V0 . As soluções da equação de Schrödinger independente do tempo são agora     Região I     ik1 x Φ(x) = A1 e Região II        Região III + A′1 e−ik1 x Φ(x) = A2 eik2 x + A′2 e−ik2 x Φ(x) = A3 eik1 x + A′3 e−ik1 x √ 2mE p~ 2m(E − V0 ) com k2 = ~ com k1 = . (3.2.32) Requerendo continuidade da função de onda e da sua derivada em x = 0 e x = L, obtemos, respectivamente    A1 + A′1 = A2 + A′2   k1 (A1 − A′ ) = k2 (A2 − A′ ) 1 2 ,    A2 eik2 L + A′2 e−ik2 L = A3 eik1 L + A′3 e−ik1 L .   k2 (A2 eik2 L − A′ e−ik2 L ) = k1 (A3 eik1 L − A′ e−ik1 L ) 2 3 (3.2.33) Considerando uma partı́cula que vem de x = −∞, tomamos A′3 = 0. Começando pelo segundo sistema de equações obtemos A′2 = k2 − k1 i(k1 +k2 )L e A3 , 2k2 A2 = k2 + k1 i(k1 −k2 )L e A3 . 2k2 (3.2.34) 82 A equação de Schrödinger Usando estes resultados no primeiro sistema de equações obtemos k12 + k22 sin(k2 L) eik1 L A3 , A1 = cos(k2 L) − i 2k1 k2 A′1 = i k22 − k12 sin(k2 L)A3 . 2k1k2 (3.2.35) Os factores de reflexão em x = 0 e de transmissão para a região 3 são, respectivamente A′ Ir = 1 Ii A1 2 R= A3 It = Ii A1 2 T = = (k12 − k22 )2 sin2 (k2 L) , 4k12 k22 + (k12 − k22 )2 sin2 (k2 L) (3.2.36) = 4k12 k22 . 4k12 k22 + (k12 − k22 )2 sin2 (k2 L) (3.2.37) Verifica-se facilmente que T +R = 1, como seria de esperar. Concluimos que em geral existe uma probabilidade de a partı́cula ser reflectida, tal como no caso do salto de potencial. Isto contrasta com a situação em mecânica clássica em que a partı́cula é sempre transmitida. Contudo, para k2 L = nπ ⇔ L λ = , n 2 n∈N, (3.2.38) a probabilidade de transmissão é um. Isto acontece quando um múltiplo inteiro de metade do comprimento de onda é igual ao comprimento da barreira, L. Podemos dar a este comportamento a seguinte interpretação fı́sica. Consideremos as ondas que se propagam na direcção positiva do eixo dos x, isto é A1 , A2 , A3 . Para A3 ter o mesmo módulo do que A1 , ou seja, para o coeficiente de transmissão ser um, as ondas não podem sofrer perdas na região II. Ou seja A2 tem de ter ainda o mesmo módulo. Mas A2 pode ser reflectida em x = L e a onda resultante novamente em x = 0. Para que esta dupla reflexão de A2 esteja em fase consigo mesma necessitamos da relação (3.2.38). Note-se que neste caso tanto A′2 /A2 como A′1 /A1 não têm parte imaginária e não há atrasos na reflexão. Deste modo não há perdas na região II e o coeficiente de transmissão é um. Este fenómeno é designado por ressonância, pois resulta de uma ressonância das ondas na região II. Este fenómeno é usado para explicar o efeito Ramsauer que consiste na capacidade de certos gases nobres serem transparentes a electrões com certas energias bem definidas (da ordem do eV ). 3.2 Partı́cula em potenciais independentes do tempo 83 V(x) V 0 I A1 II A’1 B E III A3 B’ 0 A’3 x L Figura 3.7: Barreira de potencial. Aqui representamos as várias ondas associadas com uma partı́cula com E < V0 . 3.2.5 Barreira de potencial (E < V0) Consideremos novamente uma barreira de potencial, mas agora uma partı́cula com E < V0 , como representada na figura 3.7. O cálculo da secção anterior aplica-se com a modificação p 2m(V0 − E) . (3.2.39) k2 → −ik , com k = ~ Concluimos pois que R= (k12 + k 2 )2 sinh2 (kL) , 4k12 k 2 + (k12 + k 2 )2 sinh2 (kL) (3.2.40) T = 4k12 k 2 . 4k12 k 2 + (k12 + k 2 )2 sinh2 (kL) (3.2.41) Obviamente T + R = 1. A propriedade importante é que o coeficiente de transmissão não é nulo. Existe uma probabilidade de a partı́cula quântica ‘furar’ a barreira de potencial, enquanto que uma partı́cula clássica voltaria necessariamente para trás. Este fenómeno designa-se por efeito túnel. Note-se que podemos reexprimir o coeficiente de transmissão como T = 1+ V02 sinh2 (kL) 4E(V0 − E) −1 . (3.2.42) Note-se ainda que no caso frequente de a barreira ser muito maior do que o comprimento de onda de de Broglie da partı́cula, kL >> 1, a última expressão é aproximada como T ≃ 16E(V0 − E) −2kL e . V02 (3.2.43) 84 A equação de Schrödinger Ψ(x,t)Ψ(x,t)* II I III V0 0 L x Figura 3.8: Barreira de potencial. Representação do quadrado do módulo da função de onda, para uma partı́cula com E < V0 . A existência da onda evanescente na zona classicamente proibida resulta na probabilidade de encontrar a partı́cula na região III. O efeito túnel é observado numa variedade de fenómenos quânticos. Historicamente a sua primeira aplicação foi ao decaimento radioactivo por emissão de partı́culas α, que agora descrevemos. Radioactividade alfa Como mencionado na secção 2.2, Rutherford estudou o potencial V (r) que uma partı́cula α sente a uma distância r do núcleo atómico. Os seus estudos e estudos posteriores com núcleos mais leves concluiram que o potencial referido tem a forma exibida na figura 3.9. Isto é para distâncias maiores que r ′′ ≡ 3 × 10−14 m, as partı́culas α sentem um potencial do tipo de Coulomb entre uma partı́cula com carga +2e e um núcleo com carga +Ze V (r) = 1 2e2 Z . 4πǫ0 r (3.2.44) Para distâncias menores que r ′ , onde r ′ < r ′′ sabia-se que havia um desvio do potencial de Coulomb, devido a experiências de difusão com núcleos leves, mas não se sabia o valor exacto de r ′ para núcleos pesados. Por outro lado sabia-se que vários núcleos pesados, como o U 234 (urânio) e o Ra226 (rádio) emitiam espontaneamente partı́culas α. Isto sugere que pensemos no potencial para r < r ′ como um poço de potencial onde existe uma força (de facto a força nu- 3.2 Partı́cula em potenciais independentes do tempo 85 Figura 3.9: Potencial sentido por uma partı́cula α à distância r de um núcleo de U 238 (Extraı́do de Eisberg & Resnick, ‘Quantum Physics’). clear forte) que vence a repulsão de Coulomb e ‘cola’ uma partı́cula α a um determinado núcleo, correspondendo o conjunto, por exemplo, ao núcleo de Urânio 234. Mas existe uma probabilidade de a partı́cula α sair por efeito túnel: radiactividade α. Estimemos essa probabilidade usando o resultado para a barreira quadrada (3.2.43) que reescrevemos como √ T ∼ e−2L 2m(V0 −E)/~ . (3.2.45) A barreira de potencial na figura 3.9 não é quadrada; mas podemos pensar na curva como uma soma de barreiras quadradas no limite em que a base destas barreiras quadradas vai para zero. Nesse limite obtemos5 √ Z ′′′ Z ′′′ s 8m r 1 2e2 Z 2 r p −E , dr ln T ∼ − 2m[V (r) − E]dr = − ~ r′ ~ 4πǫ0 r r′ para uma partı́cula com energia dada por E = V (r ′′′ ). Usando o facto que s r r ! Z br a a br br dr 1− , − b = √ arcsin + r a a a b (3.2.46) (3.2.47) juntamente com E = V (r ′′′ ) , 5 E << V (r ′ ) , A relação usada é de facto a aproximação WKB; ver relação (8.5.10). (3.2.48) 86 A equação de Schrödinger obtemos 2 ln T ∼ − eZ ǫ0 ~ r m +4 2E s e2 Zmr ′ . πǫ0 ~2 (3.2.49) Vamos estimar uma relação entre T e E usando esta fórmula. Para isso tomamos um valor tı́pico para Z e r ′ . Tomamos o decaimento do isótopo 226 do Rádio (número atómico 88). Assim r ′ = 7.3 F ermi = 7.3 × 10−15 m . (3.2.50) mα ≃ 6.645 × 10−27 Kg ≃ 3.737 × 103 (MeV ) . (3.2.51) Z = 86 , Usando também que Obtemos assim, a aproximação log T = log e ln T ∼ − p 148 + 32.5 . E (MeV ) (3.2.52) Queremos agora relacionar o coeficiente de transmissão com o tempo médio de vida τ do isótopo radioactivo, que é a quantidade medida experimentalmente. Para isso imaginamos o seguinte cenário simplista. A partı́cula α encontra-se no poço de potencial correspondente à região da força forte, r < r ′ oscilando ao longo de um diâmetro, com velocidade v = p 2E/m. De cada vez que ela chega a r = r ′ tem uma probabilidade T de ser transmitida por efeito túnel. Logo a probabilidade por unidade de tempo de ser transmitida é T v/2r ′. Assumimos que a vida média, τ , é o inverso da probabilidade de decaimento por unidade de tempo 2r ′ τ= T r τ0 m ≡ , 2E T ⇒ r 148 m . log τ ∼ p − 32.5 + log 2r ′ 2E E (MeV ) (3.2.53) O segundo termo varia com a energia muito mais lentamente do que o primeiro, devido ao logaritmo. Assim, dentro do nosso cenário aproximado usamos para o segundo termo uma constante, estimada com base no decaimento tı́pico do Rádio, acima referido, para o qual a energia da partı́cula α é cerca de 5MeV . O significado desta aproximação é que o processo de decaimento alfa é essencialmente determinado pelo efeito túnel, sendo o que acontece dentro do núcleo de importância secundária. Concluimos que τ0 ≃ 10−21 s. E como tal 3.2 Partı́cula em potenciais independentes do tempo 87 Figura 3.10: Decaimento alfa: comparação da curva teórica (3.2.54) com os dados p experimentais. Note-se que a ordenada é o logaritmo comum de τ e a abcissa é −1/ E(MeV ) (Extraı́do de ‘Quantum Physics’, Berkeley Physics Course - Volume 4). 88 A equação de Schrödinger 148 log τ ∼ p − 53.5 . E (MeV ) (3.2.54) Os resultados desta curva teórica encontram-se na figura 3.10. É de salientar a boa descrição global dada pelo nosso cenário simplista, apesar da enormı́ssima variedade de tempos médios de vida considerados. Como exemplos, o U 238 tem uma vida média de 1017 s enquanto que o P o212 tem uma vida média de 10−7s. Este tipo de cálculo, originalmente feito por Gamow, Condon e Gurney em 1928, foi um dos primeiros e mais convincentes sucessos da mecânica ondulatória de Schrödinger. 3.2.6 Poço de potencial de profundidade finita (E < 0) Consideramos agora um poço de potencial, como o representado na figura 3.11 e uma partı́cula com energia −V0 < E < 0. As soluções da equação de Schrödinger independente do tempo são agora    Região I     Região II       Região III k1 x Φ(x) = B1 e + √ B1′ e−k1 x Φ(x) = Aeikx + A′ e−ikx Φ(x) = B2 ek1 x + B2′ e−k1 x −2mE com k1 = p ~ 2m(E + V0 ) com k = ~ . (3.2.55) Requeremos continuidade da função de onda e da sua derivada em x = −L/2 e x = L/2; requeremos também que a função de onda seja finita em x = ±∞, o que significa que B1′ = B2 = 0. Assim obtemos    B1 e−k1 L/2 = Ae−ikL/2 + A′ eikL/2 ,    AeikL/2 + A′ e−ikL/2 = B2′ e−k1 L/2 .   ik(AeikL/2 − A′ e−ikL/2 ) = −k1 B ′ e−k1 L/2 2 (3.2.56)   k1 B1 e−k1 L/2 = ik(Ae−ikL/2 − A′ eikL/2 ) Resolvendo cada um dos sistemas para a razão A/A′ obtemos, respectivamente, A = −eikL A′ k1 + ik k1 − ik , A ik − k1 = e−ikL , ′ A ik + k1 (3.2.57) 3.2 Partı́cula em potenciais independentes do tempo 89 V(x) L/2 −L/2 0 x B’1 I B1 II A E A’ III B’2 B2 −V 0 Figura 3.11: Poço de potencial. Distinguimos três regiões: x < −L/2 é a Região I, onde V = 0; −L/2 < x < L/2 é a Região II, onde V = −V0 ; x > L/2 é a região III, onde V = 0. o que implica que k1 − ik = ±eikL k1 + ik onde definimos ⇔    | sin(kL/2)| = k/k   0   cot(kL/2) = −k /k ⇔  1   tan (kL/2) < 0     | cos(kL/2)| = k/k  0   tan (kL/2) = k /k ⇔  1    tan (kL/2) > 0 k0 ≡ √ 2mV0 . ~ , (3.2.58) (3.2.59) Existem portanto duas famı́lias de soluções. Em cada um dos casos, os valores permitidos para k e portanto para a energia E são discretos. Graficamente podem ser imaginados como a intersecção da função | sin(x)| ou | cos(x)| com uma recta que passa pela origem (problema 3, folha 4). Esta discretização dos nı́veis de energia dos estados ligados é uma caracterı́stica da mecânica quântica que não se encontra na mecânica clássica onde a partı́cula pode ter qualquer energia entre 0 > E > V0 . Pode ser interpretada do seguinte modo: as ondas associadas à partı́cula vão sofrer reflexões sucessivas em x = ±L/2. Em geral, as várias ondas interferem destrutivamente, e só para certos comprimentos de onda - e como tal certas energias - esta interferência permite a existência de estados estacionários. O caso de E > 0 num poço finito de potencial é tratado também no problema 3 da folha 4. 90 A equação de Schrödinger 3.2.7 Poço de potencial de profundidade infinita Tomamos agora um poço de potencial de profunidade infinita, que é mais convenientemente tratado tomando V (x) da forma V (x) = 0 para x ∈ [0, L] , V (x) = +∞ para x > L e x < 0 . (3.2.60) Consideramos um estado com energia E positiva. Vimos, para a barreira de potencial, que no caso em que V0 → ∞ perdemos a onda evanescente. De um modo semelhante, esperamos que neste caso a função de onda se anule fora do intervalo [0, L]. De facto, a solução da equação de Schrödinger independente do tempo dá-nos    Região I e III   Região II Φ(x) = 0 ikx Φ(x) = Ae ′ −ikx +Ae com k = √ 2mE ~ . (3.2.61) Para saltos infinitos de potencial o nosso argumento acerca da continuidade da função de onda e da sua derivada não é aplicável. Mas podemos ainda requerer pelo menos continuidade da função de onda em x = 0, L:   A + A′ = 0  AeikL + A′ e−ikL = 0 ⇒ sin(kL) = 0 , (3.2.62) ou seja kL = nπ ⇔ E= n2 π 2 ~2 ≡ En . 2mL2 (3.2.63) Tal como no caso anterior os estados quânticos têm as suas energias possı́veis quantificadas. Notemos que neste caso, a quantificação dos comprimentos de onda (e das energias) é obtida pela relação L = nλ/2, que exprime a condição para a existência de estados estacionários num sistema periódico. A mesma situação não se verificava no caso do poço finito, essencialmente devido à existência de uma onda evanescente. A função de onda normalizada correspondente ao estado de energia n é r nπx 2 e−iEn t/~ para x ∈ [0, L] , sin Ψn (x, t) = L L (3.2.64) 3.3 Evolução de um trem de ondas 91 e zero fora deste intervalo e como tal, a função de distribuição de probabilidade associada à partı́cula é P(x) = nπx 2 para x ∈ [0, L] , sin2 L L (3.2.65) e zero fora do intervalo. Se calcularmos, por exemplo, o valor esperado de x e de x2 , obtemos hxi = Z 0 L L xP(x)dx = , 2 2 hx i = Z 0 L x2 P(x)dx = L2 L2 − 2 2 . 3 2π n (3.2.66) Podemos comparar este resultado com o da mecânica clássica, pensando na partı́cula clássica como tendo uma função de distribuição de probabilidade uniforme no intervalo [0, L], Pc (x) = 1 para x ∈ [0, L] , L e zero fora do intervalo. Assim Z L L hxi = xPc (x)dx = , 2 0 2 hx i = Z 0 L x2 Pc (x)dx = (3.2.67) L2 . 3 (3.2.68) Concluimos que o resultado clássico é aproximado para números quânticos elevados correspondendo a energias elevadas. Este é um padrão que se repete em muitos casos. 3.3 Evolução de um trem de ondas Como referimos na secção 3.1, a descrição de uma partı́cula livre deve ser feita por um trem de ondas. Mas mesmo para uma partı́cula sob a influência de potenciais como aqueles que vimos na secção 3.2 o trem de ondas é a descrição apropriada, pois é a maneira natural de obter uma função de onda normalizável. Note-se no entanto que sendo o trem de ondas apenas uma sobreposição de ondas planas com diferentes energias, concluimos que toda a fı́sica da interação do trem de ondas com os vários potenciais da secção 3.2 foi já vista. Usar o trem de ondas em vez das ondas individuais aumenta a complexidade técnica da análise sem introduzir grandes novidades. Assim nesta secção discutiremos brevemente a evolução de um trem de ondas gaussiano livre e a interacção de um trem de ondas com um salto de potencial. 92 3.3.1 A equação de Schrödinger Trem de ondas Gaussiano livre Um exemplo tratável analiticamente de um trem de ondas é considerar em (3.1.26) 2 1/4 ~ 2 a 2 2 e−a (k−k0 ) /4 , φ(k) = 0 , ω(k) = k , (3.3.1) g(k) = 2π 2m correspondendo a uma função gaussiana para o perfil de Fourier de amplitudes, com todas as ondas em fase e com a relação de dispersão de uma partı́cula livre (3.0.4). Assim sendo, (3.1.26) pode-se escrever na forma   2  !2  a2 k0 2 √ Z +∞ ix + 2 2 2 2 a a k0  a 2ix + a k0  i~t  Ψ(x, t) = exp − − k − 2 2i~t exp  + dk ,  2i~t 3/4 2 (2π) 4 4 2m a + m a + m −∞ (3.3.2) ou, fazendo o integral Gaussiano, Ψ(x, t) =   2 a2 k0 1/4 −1/2 a2 k02  2i~t 2a2  ix + 2 − a2 + exp  . π m 4 a2 + 2i~t m (3.3.3) Trabalhando os termos na exponencial, reescrevemos a função de onda como ! 2 1/4 −1/2 ~k0 t 2 2 x − 2a 2i~t ~k t Ψ(x, t) = a2 + , (3.3.4) exp i − 0 + k0 x exp − 2 m π m 2m a + 2i~t m ou, definindo θ como 2~t tan 2θ = ma2 ⇔ e−iθ = a2 − a2 + 2i~t m 2i~t m !1/4 , (3.3.5) temos Ψ(x, t) = 2a2 π 1/4 4~2 t2 a4 + m2 −1/4 2 ! x − ~km0 t ~k02 t . exp i −θ − + k0 x exp − 2 2i~t 2m a + m (3.3.6) Nesta forma é simples verificar que o módulo da função de onda ao quadrado é ! −1/2 2 1/2 ~k0 t 2 4~2 t2 2a 4 2 x− m 2 a + exp −2a . |Ψ(x, t)| = 2 2 π m2 a4 + 4~m2t Extraı́mos as seguintes conclusões: (3.3.7) 3.3 Evolução de um trem de ondas 93 • A função de onda está normalizada e a sua norma é conservada na evolução temporal Z +∞ 2 kΨ(t)k ≡ |Ψ(x, t)|2 = 1 . (3.3.8) −∞ Veremos mais tarde que este facto resulta de o Hamiltoniano ser Hermı́tico e como tal a evolução unitária. • A variância, σx , associado com a função de distribuição de probabilidade P(x) = |Ψ(x, t)|2 é ~2 t2 a2 + 2 2 , (3.3.9) 4 am o que significa que a função de onda se está a espalhar para t > 0. Isto é, definimos σx = a nossa partı́cula livre como uma gaussiana para t = 0 posteriormente ela espalha-se delocalizando cada vez mais a partı́cula. Este fenómeno de espalhamento é geral para trens de onda livres. 3.3.2 Trem de ondas incidente num salto de potencial (E < V0 ) Vamos considerar um trem de ondas incidente no salto de potencial da figura (3.3). Vamos considerar o caso em que todas as ondas no nosso trem têm uma energia E < V0 . Este caso para uma onda foi tratado na secção 3.2.3. Concluimos que para cada onda plana monocromática - vector de onda k - as amplitudes A e A′ estavam relacionadas por (3.2.28). Portanto, para um trem de ondas vamos ter as relações A′ (k1 ) k1 − ik2 = ≡ e−2iθ(k1 ) , A(k1 ) k1 + ik2 onde tan θ ≡ k2 , k1 (3.3.10) para cada onda no trem. Isto é, dada uma onda com energia E, que define k1 e k2 , temos que as amplitudes incidente e reflectida diferem apenas de uma fase. Como vimos na secção 3.2.3 isto significa que a reflexão é total mas há um atraso correspondente à diferença de fase. Definimos √ 2mV0 , (3.3.11) ~ e consideramos que todas as ondas no trem obedecem a k1 < K0 ; todas as ondas são K0 = reflectidas. Consideremos a solução na Região I para t = 0 sendo Z K0 1 dk1 g(k1) eik1 x + e−2iθ(k1 ) e−ik1 x . Ψ(x, 0) = √ 2π 0 (3.3.12) 94 A equação de Schrödinger Vamos assumir que |g(k1)| tem um pico pronunciado em k1 = k̃ < K0 de modo a que a velocidade de grupo vai ser definida pela propagação deste pico. A evolução do trem de ondas é descrita pela função de onda Z K0 Z K0 1 1 i(k1 x−ω(k1 )t) Ψ(x, t) = √ dk1 g(k1)e +√ dk1 g(k1 )e−i(k1 x+ω̃(k1 )t) , 2π 0 2π 0 (3.3.13) onde ω̃(k1 ) = ω(k1 ) + 2 θ(k1 ) . t (3.3.14) O primeiro termo representa o trem de ondas incidente. O segundo representa o trem de ondas reflectido. A relação de dispersão que usamos é mais uma vez a relação de dispersão para uma partı́cula livre ω(k1) = ~k12 . 2m (3.3.15) A posição do centro do trem de ondas incidente é dado por dω ~k̃ xi (t) = t = t, dk1 k1 =k̃ m enquanto que a posição do centro do trem de ondas reflectidas é dado por dω̃ ~k̃ 2 xr (t) = −t . =− t+ q dk1 k1 =k̃ m K02 − k̃ 2 (3.3.16) (3.3.17) Se pensarmos no centro do trem de ondas como descrevendo a ‘posição’ da partı́cula quântica associada ao trem de ondas xi (t) e xr (t) podemos fazer a seguinte análise do movimento: • Esta solução descreve o movimento na região I, isto é para x < 0. Para t < 0, xr > 0, logo para t negativo não há onda reflectia. Do mesmo modo, para t > 0, xi > 0. Logo, para t positivo não há onda incidente. • Assim descrevemos o movimento como: i) para t < 0 a ‘partı́cula’ desloca-se com velocidade ~k̃/m no sentido positivo do eixo dos x; ii) entre 2m 0<t< ~k̃ q K02 − k̃ 2 ≡ ∆τ , (3.3.18) 3.4 Sumário 95 a ‘partı́cula’ não está na região I; ao contrário de uma partı́cula clássica que seria reflectida instantaneamente, a partı́cula quântica pode ‘penetrar’ na região II, devido à onda evanescente originando um atraso na reflexão dado por ∆τ ; iii) para t > ∆τ a ‘partı́cula’ desloca-se com velocidade ~k̃/m no sentido negativo do eixo dos x. Assim, usando um trem de ondas conseguimos obter uma solução ‘localizada’ cujo centro podemos encarar como a ‘localização’ da partı́cula quântica. Mas ao mesmo tempo vemos os efeitos quânticos que decorrem da propagação desta partı́cula ser feita de um modo ondulatório, que neste caso corresponde ao atraso na reflexão. Análises semelhantes poderiam ser feitas para todos os outros casos da secção 3.2. 3.4 Sumário Neste capı́tulo introduzimos a equação de Schrödinger. Discutimos as razões porque uma onda plana monocromática não é uma boa descrição da função de onda para uma partı́cula livre o que nos levou a introduzir o conceito de trem de ondas. Investigamos as consequências da equação de Schrödinger em alguns potenciais independentes do tempo, estudando os estados estacionários do sistema, para ondas monocromáticas. A figura 3.12 faz um sumário dos potenciais estudados. Finalmente, estudamos a evolução de um trem de ondas Gaussiano e de um trem de ondas a interagir com um salto de potencial. A importante lição a tirar desta análise é que as propriedes inesperadas da partı́cula quântica são facilmente percebidas se nos lembrarmos que uma partı́cula quântica se propaga como uma onda, que é interpretada como uma onde de probabilidade. 96 A equação de Schrödinger ~ SECÇAO 3.2.3 3.2.2 3.2.5 3.2.4 3.2.6 3.2.7 Figura 3.12: Os potenciais em escada estudados na secção 3.2 (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). CAPÍTULO 4 Formalismo Matemático e Postulados da Mecânica Quântica Neste capı́tulo vamos introduzir de um modo sistemático a matemática usada na mecânica quântica e os postulados que a definem como teoria fı́sica. 4.1 Funções de onda e operadores O objecto matemático fundamental em mecânica quântica é a função de onda Ψ(~x, t). Devido ao postulado de Born para a interpretação da função de onda vamos estar particularmente interessados em funções de onda normalizáveis, ditas funções de quadrado somável, que obedecem a 2 kΨ(t)k ≡ Z 3 ∗ d ~xΨ(~x, t)Ψ(~x, t) ≡ Z d3~x|Ψ(~x, t)|2 < ∞ . (4.1.1) O espaço das funções de quadrado somável sobre o corpo dos complexos, C, forma um espaço vectorial designado por ‘L2 ’ e tem a estrutura de um espaço de Hilbert. Mas o nosso interesse incidirá apenas sobre um subconjunto de ‘L2 ’, denotado por F que compreende funções de onda de quadrado somável infinitamente deriváveis e limitadas. 98 Formalismo Matemático e Postulados da Mecânica Quântica 4.1.1 Estrutura de F e produto escalar em F F é um espaço vectorial, isto é, se (a partir de agora deixamos de escrever, para simplicidade de notação, o argumento (~x, t) das funções de onda) Ψ1 , Ψ2 ∈ F ⇒ Ψ ≡ λ 1 Ψ1 + λ 2 Ψ2 ∈ F , (4.1.2) onde λ1 , λ2 ∈ C. De facto, |Ψ|2 = |λ1 |2 |Ψ1 |2 + |λ2 |2 |Ψ1 |2 + λ∗1 λ2 Ψ∗1 Ψ2 + λ1 λ∗2 Ψ1 Ψ∗2 , (4.1.3) onde os dois últimos termos têm o mesmo módulo (pois são complexos conjugados) e são limitados superiormente por 2|λ1 ||λ2||Ψ1 ||Ψ2 | ≤ |λ1 ||λ2 | |Ψ1 |2 + |Ψ2 |2 . Logo, 2 kΨk ≤ Z d3~x |λ1 |2 |Ψ1 |2 + |λ2 |2 |Ψ1 |2 + |λ1 ||λ2 | |Ψ1 |2 + |Ψ2 |2 , (4.1.4) (4.1.5) que é um número finito pois, por hipótese, Ψ1 , Ψ2 são funções de quadrado somável. A definição de norma que temos usado, (4.1.1), sugere a definição de um produto escalar entre duas funções de onda Ψ e Φ: (Ψ, Φ) ≡ Z d3~xΨ∗ Φ , (4.1.6) que associa a um par de funções de onda Ψ, Φ ∈ F um número complexo. Note-se que porque as funções pertencem ao espaço de Hilbert este integral é necessariamente convergente. Esta propriedade é uma consequência da desigualdade de Schwarz que veremos em baixo. Propriedades do produto escalar: i) Não é simétrico (Φ, Ψ) = (Ψ, Φ)∗ ; (4.1.7) 4.1 Funções de onda e operadores 99 ii) Linear no segundo argumento (Φ, λ1 Ψ1 + λ2 Ψ2 ) = λ1 (Φ, Ψ1 ) + λ2 (Φ, Ψ2 ) ; (4.1.8) iii) Anti-linear no primeiro argumento (λ1 Φ1 + λ2 Φ2 , Ψ) = λ∗1 (Φ1 , Ψ) + λ∗2 (Φ2 , Ψ) ; (4.1.9) iv) Definição de funções ortogonais: se (Φ, Ψ) = 0 , (4.1.10) (Ψ, Ψ) = kΨk2 , (4.1.11) as funções são ditas ortogonais; v) Definição da norma: que é real, positiva e só é zero se Ψ = 0. vi) Finito |(Ψ1 , Ψ2 )| ≤ p (Ψ1 , Ψ1 ) p (Ψ2 , Ψ2 ) = kΨ1 kkΨ2 k < ∞ , que decorre da desigualdade de Schwarz habitual Z b Z b Z b 2 ∗ ∗ f gdx ≤ f f dx g ∗gdx . a 4.1.2 a (4.1.12) (4.1.13) a Bases de F Dado que as funções de onda vivem num espaço vectorial é natural definir uma base. Isto é, um conjunto completo de funções em que possamos expandir, de um modo único, a função de onda em cada instante t. Dependendo da estrutura de F , esta base pode ser discreta ou contı́nua: Base discreta {un (~x)} , n ∈ N Base contı́nua {uα (~x)} , α ∈ R . (4.1.14) / F , pelo que o Nos casos em que analisaremos, un (~x) ∈ F para todo o n, mas uα (~x) ∈ uso do termo base é abusivo no caso contı́nuo, mas ainda assim será usado com o sentido 100 Formalismo Matemático e Postulados da Mecânica Quântica de que expandiremos funções de F usando o conjunto {uα (~x)}. Analisemos primeiro uma base discreta: • Expansão da função de onda para um dado t: Ψ(~x) = X cn un (~x) , (4.1.15) n o que define de um modo único as componentes {cn }; • Relação de ortonormalização da base: (un , um ) = δnm ; (4.1.16) • Produto escalar de uma função de onda com uma função da base (i.e. projecção na base) Z X X XZ 3 ∗ cm (un , um ) = cm δnm = cn ; d3~xu∗n cm um = (un , Ψ) = d ~xun Ψ = m m m (4.1.17) • Produto escalar de duas funções de onda em termos das suas componentes: Tomamos Ψ= X cn u n , Φ= n X bm um , (4.1.18) m logo (Φ, Ψ) = X b∗m cn n,m Z d3~xu∗m un (4.1.16) X = b∗m cn δnm = n,m X b∗n cn , (4.1.19) n e em particular (Ψ, Ψ) = X n |cn |2 , (4.1.20) que é uma generalização da igualdade de Bessel-Parseval (C.21). • Relação de fecho (isto é, {un } formam uma base) Ψ(~x) = X n cn un (~x) (4.1.17) = X n (un , Ψ)un (~x) = Z d3~x ′ Ψ(~x ′ ) " X n u∗n (~x ′ )un (~x) # . (4.1.21) 4.1 Funções de onda e operadores 101 Introduzimos aqui a Função delta de Dirac, δ(~x − ~x ′ ), definida pela propriedade1 Z f (~x)δ(~x − ~x ′ )d3~x = f (~x ′ ) ; (4.1.22) (assumiu-se que ~x′ pertence ao domı́nio de integração). Logo, se Ψ pode ser expandida em termos da base concluimos que X n u∗n (~x ′ )un (~x) = δ(~x − ~x ′ ) . (4.1.23) Reciprocamente, se (4.1.23) é verdadeira, Ψ pode ser expressa em termos da base; de facto Ψ(~x) = Z d3~x ′ δ(~x−~x ′ )Ψ(~x ′ ) hipótese = Z d3~x ′ Ψ(~x ′ ) " X # u∗n (~x ′ )un (~x) = n X cn un (~x) . n (4.1.24) Assim, a relação de fecho (4.1.23) é a expressão matemática de que {un } formam uma base. Façamos agora uma análise semelhante para uma ‘base’ contı́nua: • Expansão da função de onda para um dado t: Z Ψ(~x) = dαc(α)uα(~x) , (4.1.25) o que define de um modo único as componentes {c(α)}; • Relação de ortonormalização da base: (uα , uα′ ) = Z • Projecção na base Z Z 3 ∗ (uα , Ψ) = d ~xuα dα′c(α′ )uα′ d3~xu∗α uα′ = δ(α − α′ ) ; (4.1.26) = Z dα′ c(α′ )δ(α − α′ ) = c(α); (4.1.26) (4.1.27) Portanto, definindo a relação de ortonormalização anterior permite-nos obter esta relação de projecção, análoga ao caso discreto. 1 Notemos que a ordem dos argumentos na função delta de Dirac não interessa, i.e. δ(~x −~x ′ ) = δ(~x ′ −~x). 102 Formalismo Matemático e Postulados da Mecânica Quântica • Produto escalar de duas funções de onda em componentes: Tomamos Z Z Ψ = dαc(α)uα , Φ = dα′b(α′ )uα′ , (4.1.28) logo (Φ, Ψ) = Z ′ ′ ∗ dαdα b(α ) c(α) Z d 3 ~xu∗α′ uα (4.1.26) = Z dαb(α)∗ c(α) , (4.1.29) e em particular (Ψ, Ψ) = Z dα|c(α)|2 . (4.1.30) • Relação de fecho (isto é, {uα } formam uma base) Z Z Z (4.1.27) 3 ′ ′ Ψ(~x) = dαc(α)uα(~x) = d ~x Ψ(~x ) dαu∗α(~x ′ )uα (~x) . Logo, se Ψ pode ser expandida em termos da base concluimos que Z dαu∗α(~x ′ )uα (~x) = δ(~x − ~x ′ ) . (4.1.31) (4.1.32) Reciprocamente, é simples demonstrar que se (4.1.32) é verdadeira, Ψ pode ser expressa em termos da base. Resumimos as propriedades das bases contı́nuas e discretas nas seguinte tabela: Expansão da Função de Onda Base discreta {un } X Ψ(~x) = cn un (~x) Base contı́nua {uα } R Ψ(~x) = dαc(α)uα(~x) (un , Ψ) = cn X (Φ, Ψ) = b∗n cn (uα , Ψ) = c(α) R (Φ, Ψ) = dαb∗ (α)c(α) n Relação de Ortonormalização (uα , uα′ ) = δ(α − α′ ) (un , um ) = δnm Projecção da Função de Onda Produto escalar em componentes n Relação de Fecho X n u∗n (~x ′ )un (~x) = δ(~x − ~x ′ ) R dαu∗α(~x ′ )uα (~x) = δ(~x − ~x ′ ) Note-se portanto que a passagem da base discreta para contı́nua pode ser sistematizada como uma mudança do ı́ndice discreto da base para contı́nuo (n → α), somatórios R P para integrais ( → ) e deltas de Kronecker para deltas de Dirac (δmn → δ(α − α′ )). Especializamos agora o caso contı́nuo para dois importantes conjuntos de funções: 4.1 Funções de onda e operadores 103 i) Tomamos o parâmetro contı́nuo α = p~, as componentes c(α) = c(~p) ≡ Ψ̃(~p) e os vectores da base (em n dimensões) uα (~x) = up~(~x) = 1 ei~x·~p/~ , (2π~)n/2 (4.1.33) ou seja ondas planas, que são funções com momento bem definido; ii) Tomamos o parâmetro contı́nuo α = ~x0 , as componentes c(α) = c(~x0 ) ≡ Ψ(~x0 ) e os vectores da base uα (~x) = u~x0 (~x) = δ(~x − ~x0 ) , (4.1.34) ou seja deltas de Dirac, que são funções cujo suporte está bem definido no espaço de posições. Para estes dois exemplos de ‘bases’2 a tabela anterior toma a forma Expansão Orto Projecção P.E. Fecho Ondas Planas Z −n/2 d~p Ψ̃(~p)ei~x·~p/~ Ψ(~x) = (2π~) Z ′ −n d~x ei~x·(~p −~p)/~ = δ(~p ′ − p~) (2π~) Z −n/2 d~x Ψ(~x)e−i~x·~p/~ Ψ̃(~p) = (2π~) Z Z ∗ d~xΦ(~x) Ψ(~x) = d~pΦ(~p)∗ Ψ(~p) Z ′ −n d~p ei~p·(~x −~x)/~ = δ(~x ′ − ~x) (2π~) Z Deltas de Dirac Z Ψ(~x) = d~x0 Ψ(~x0 )δ(~x − ~x0 ) d~xδ(~x − ~x0 )δ(~x − ~x0 ′ ) = δ(~x0 − ~x0 ′ ) Z Ψ(~x0 ) = d~xΨ(~x)δ(~x − ~x0 ) Z Z ∗ d~xΦ(~x) Ψ(~x) = d~x0 Φ(~x0 )∗ Ψ(~x0 ) Z d~x0 δ(~x − ~x0 )δ(~x ′ − ~x0 ) = δ(~x − ~x ′ ) Note-se que a penúltima linha expressa relações do tipo da igualdade de ParsevalPlancharel (C.29). 4.1.3 Operadores Lineares a actuar em F Um operador linear Â, é uma aplicação (endomorfismo) em F Â : F −→ F Ψ(~x) −→ Ψ′ (~x) = ÂΨ(~x) 2 , Relembramos que o termo base é abusivo pois os vectores da ‘base’ não pertencem a F . (4.1.35) 104 Formalismo Matemático e Postulados da Mecânica Quântica que é linear Â[λ1 Ψ1 + λ2 Ψ2 ] = λ1 ÂΨ1 + λ2 ÂΨ2 . (4.1.36) Alguns exemplos de operadores: • Operador Paridade Π̂Ψ(x, y, z) = Ψ(−x, −y, −z) ; (4.1.37) X̂Ψ(x, y, z) = xΨ(x, y, z) ; (4.1.38) • Operador multiplicação por x • Operador derivada em ordem a x D̂x Ψ(x, y, z) = ∂ Ψ(x, y, z) ; ∂x (4.1.39) • Operadores Hamiltoniano e Translações temporais (ver capı́tulo 3) a actuar numa função de onda do tipo Ψ(~x, t) = Φ(~x)e−iEt/~ ĤΨ(~x, t) = EΨ(~x, t) , T̂ Ψ(~x, t) = EΨ(~x, t) . (4.1.40) Sejam Â, B̂ dois operadores. Definimos o produto de operadores ÂB̂ como h i (ÂB̂)Ψ(~x) = Â B̂Ψ(~x) . (4.1.41) Em geral o produto de operadores não é comutativo, isto é o comutador h i Â, B̂ ≡ ÂB̂ − B̂ Â , (4.1.42) é diferente de zero. Por exemplo, o comutador dos operadores X̂ e D̂x não é zero h i ∂ ∂ − x Ψ(~x) = −Ψ(~x) , (4.1.43) X̂, D̂x Ψ(~x) = x ∂x ∂x ou seja h i X̂, D̂x = −1̂ . (4.1.44) 4.1 Funções de onda e operadores 105 Como veremos adiante o facto de dois operadores comutarem ou não está intrinsecamente associado ao princı́pio da incerteza e ao facto de duas grandezas fı́sicas serem compatı́veis ou incompatı́veis. Um tipo particularmente importante de operadores em Mecânica Quântica são os operadores hermı́ticos, que por definição obedecem a (Ψ, ÂΨ) = (ÂΨ, Ψ) , ∀Ψ ∈ F . (4.1.45) Estudemos a hermiticidade dos operadores anteriores: • Operador Paridade Z +∞ (Ψ, Π̂Ψ) = d3~xΨ∗ (~x)Ψ(−~x) ~ x→−~ x = −∞ − Z −∞ d3~xΨ∗ (−~x)Ψ(~x) = (Π̂Ψ, Ψ) , +∞ (4.1.46) logo o operador Paridade é hermı́tico. • Operador multiplicação por x Z Z 3 ∗ (Ψ, X̂Ψ) = d ~xΨ (~x)xΨ(~x) = d3~x(xΨ(~x))∗ Ψ(~x) = (X̂Ψ, Ψ) , (4.1.47) logo o operador multiplicação por x é hermı́tico. Deste exemplo conclui-se que se os valores próprios do operador são reais ele é hermı́tico. O resultado recı́proco é também verdade, como veremos na secção 4.2.6. • Operador derivada em ordem a x Z ∂ (Ψ, D̂x Ψ) = d3~xΨ∗ (~x) Ψ(~x) ∂x por partes = − Z d3~x ∂ ∗ Ψ (~x)Ψ(~x) = −(D̂x Ψ, Ψ) , ∂x (4.1.48) logo o operador derivada não é hermı́tico (de facto é anti-hermı́tico). Note-se que na integração por partes usamos que o módulo da função de onda desaparece no infinito, devido à função de onda ser de quadrado somável. Um exercı́cio análogo mostra que o operador iD̂x é hermı́tico. Logo, o operador P̂ = −i~ ∂ , ∂x que interpretaremos como operador momento, é um operador hermı́tico. (4.1.49) 106 Formalismo Matemático e Postulados da Mecânica Quântica • Operadores Hamiltoniano e Translações temporais (ver capı́tulo 3) a actuar numa função de onda do tipo Ψ(~x, t) = Φ(~x)e−iEt/~: pelo que vimos anterioremente este operadores serão hermı́ticos se E for real. Concluimos com a definição que aos valores próprios de um operador se chama espectro do operador. 4.2 A notação de Dirac Como vimos no fim do capı́tulo 2, um sistema quântico caracteriza-se pelo estado em que se encontra. Este estado é definido pela sua função de onda, que por sua vez, é um vector em F . É desejável ter uma designação genérica e caracterı́stica para os vectores associados a estados quânticos, independentemente de F ter dimensão finita ou infinita, de a base ser contı́nua ou discreta e de o estado viver no espaço de configurações, polarizações, spin, etc (todos os graus de liberdade possı́veis). Dirac sugeriu a designação de ket e a representação |αi i , (4.2.1) onde os αi são um conjunto apropriado de rótulos para o estado em consideração.3 Por exemplo, as funções de onda que tratamos no capı́tulo 3, para uma partı́cula sem spin, Ψ(x) são agora representadas pelo ket Ψ(x) ∈ F −→ |Ψi ∈ E . (4.2.2) A ausência do argumento espacial no rótulo do ket significa que o ket representa o estado, independentemente das coordenadas usadas, enquanto que Ψ(~x) são as componentes de |Ψi num dado sistema coordenado. Esta situação é análoga a considerarmos um vector ~v , que é uma entidade geométrica autónoma, independentemente da base escolhida para o representar numa situação concreta, em que tem componentes {vi }. Definimos também um espaço de estados E, onde vivem os kets, que é isomórfico ao espaço das funções de onda F . Vejamos pois como se reexpressam em E os conceitos de produto escalar e de acção de operadores lineares. 3 Como veremos na secção 4.4.1, estes rótulos são os valores próprios dos operadores de um Conjunto Completo de Observáveis que Comutam (C.C.O.C.). 4.2 A notação de Dirac 4.2.1 107 Produto escalar e espaço dual a E Definimos o produto escalar de kets como a associação a cada par de kets de um número complexo ( , ):E ×E −→ C , (4.2.3) |Ψi, |Φi −→ (|Ψi, |Φi) que obedece às propriedades (4.1.7)-(4.1.12). Por outro lado podemos definir um espaço dual a E, isto é um espaço cujos membros são aplicações lineares de E para C hαi | ∈ E ∗ : E −→ C . (4.2.4) Os vectores deste espaço são designados por bra e representados por hαi | , (4.2.5) onde αi são mais uma vez rótulos. A existência do produto escalar determina uma correspondência entre E e E ∗ :4 E −→ E∗ , (4.2.6) |Φi −→ (|Φi, . . .) ≡ hΦ| onde os . . . representam a entrada livre. Esta correspondência é antilinear. De facto λ1 |Φ1 i + λ2 |Φ2 i corresponde ao bra −→ (λ1 |Φ1 i + λ2 |Φ2 i, . . .) = λ∗1 (|Φ1 i, . . .) + λ∗2 (|Φ2 i, . . .) = λ∗1 hΦ1 | + λ∗2 hΦ2 | . (4.2.7) Nesta notação, o produto escalar é representado da seguinte forma (|Φi, |Ψi) = hΦ|Ψi . As propriedades (4.1.7)-(4.1.12) aplicam-se também nesta notação. (4.2.8) O uso de bras e kets denomina-se notação de Dirac. Nesta notação o produto escalar aparece como um parêntesis da forma h. . . | . . .i, ou seja a justaposição de um bra a um ket; a origem destes está no inglês em que parêntesis se diz bracket=bra+ket. 4 Se E for finito, E e E ∗ são isomórficos, mas em geral não são. 108 4.2.2 Formalismo Matemático e Postulados da Mecânica Quântica Acção de operadores lineares Podemos reescrever a secção 4.1.3 na notação de Dirac. Assim, um operador linear Â é um endomorfismo em E Â : E −→ E |Φi −→ |Φ′ i ≡ Â|Φi , (4.2.9) que é linear Â [λ1 |Ψ1 i + λ2 |Ψ2 i] = λ1 Â|Ψ1 i + λ2 Â|Ψ2 i . (4.2.10) O produto escalar do ket |Φi com Â|Ψi, hΦ|Â|Ψi , (4.2.11) é designado elemento de matriz do operador Â entre |Φi e |Ψi, que é um número complexo que depende linearmente em |Ψi e antilinearmente em |Φi. Um exemplo particular de operador é construı́ido com um bra e um ket com a ordem ‘trocada’: |ΦihΨ| : E −→ E , (4.2.12) |χi −→ |ΦihΨ|χi = z|Φi onde z ≡ hΨ|χi é um número complexo. Em particular, o operador |ΨihΨ| é um operador de projecção de um ket arbitrário em |Ψi |ΨihΨ| : E −→ E , (4.2.13) |χi −→ |ΨihΨ|χi projecção que é nula se |Ψi e |χi forem ortogonais, isto é hΨ|χi = 0. Deste exemplo concluı́mos que a ordem com que colocamos kets e bras é fundamental: hΨ|Φi = número , |ΦihΨ| = operador . (4.2.14) Podemos usar a acção de um operador num ket para definir a acção de um operador num bra do seguinte modo: hΦ|Â |Ψi ≡ hΦ| Â|Ψi . (4.2.15) 4.2 A notação de Dirac 109 Isto é, um elemento de matriz é independente de o operador actuar primeiramente no bra ou no ket. Como exercı́cio pode tentar demonstrar que a acção no bra assim definida é linear. Podemos pois escrever o elemento de matriz como (4.2.11) pois não há ambiguidades de ordem de actuação. 4.2.3 O operador adjunto Definimos o operador adjunto a Â, representado Â† (lê-se “A dagger” ou “A adjunto”), do seguinte modo: a cada ket associamos um bra5 |Ψi −→ hΨ| ; (4.2.16) definimos o operador adjunto como o operador que actuando no bra hΨ| dá origem ao bra associado ao ket Â|Ψi |Ψ′ i ≡ Â|Ψi −→ hΨ′ | ≡ hΨ|Â† . (4.2.17) Mostremos que, por esta definição, a acção de Â† nos bras é linear. Seja λ∗1 |Ψ1 i + λ∗2 |Ψ2 i −→ λ1 hΨ1 | + λ2 hΨ2 | ; (4.2.18) pela linearidade de Â Â (λ∗1 |Ψ1 i + λ∗2 |Ψ2 i) = λ∗1 ∗ Â|Ψ1 i + λ2 Â|Ψ2 i , e igualando os bras associados a cada um destes kets obtemos imediatamente (λ1 hΨ1 | + λ2 hΨ2 |) Â† = λ1 hΨ1 |Â† + λ2 hΨ2 |Â† , (4.2.19) (4.2.20) o que demonstra que a acção de Â† é linear. Uma importante equação é a que relaciona os elementos de matriz de Â† com os de Â. Por (4.1.7), hΨ′ |Φi = hΦ|Ψ′ i∗ , (4.2.21) para |Φi e |Ψ′ i arbitrários. Se tomarmos |Ψ′ i como em (4.2.17) obtemos hΨ|Â† |Φi = hΦ|Â|Ψi∗ . 5 Nesta secção a seta denota a correspondência (4.2.6). (4.2.22) 110 Formalismo Matemático e Postulados da Mecânica Quântica As seguintes propriedades são consequência de (4.2.17) e (4.2.22): i) † Â † = Â ; (4.2.23) ii) † λÂ = λ∗ Â† ; (4.2.24) iii) Â + B̂ † = A† + B † ; (4.2.25) iv) † ÂB̂|ψi −→ hΨ| ÂB̂ . † † Â B̂|Ψi −→ hΨ|B̂ Â Logo ÂB̂ † = B̂ † Â† . (4.2.26) (4.2.27) Reexpressemos a definição de operador hermı́tico (4.1.45), na notação de Dirac. Consideramos os kets |Ψi e Â|Ψi. Os seus bras associados são |Ψi −→ (|Ψi, . . .) ≡ hΨ| . Â|Ψi −→ Â|Ψi, . . . ≡ hΨ|Â† (4.2.28) Logo, a condição (4.1.45) é expressa hΨ|Â|Ψi = hΨ|Â† |Ψi , (4.2.29) que, sendo |Ψi arbitrário, é equivalente a Â† = Â . (4.2.30) Notemos que o produto de 2 operadores hermı́ticos só é um operador hermı́tico se o seu comutador for zero † ÂB̂ = ÂB̂ (4.2.27) ⇔ B̂ † Â† = ÂB̂ hermiticidade ⇔ h i B̂ Â = ÂB̂ ⇔ Â, B̂ = 0 . (4.2.31) 4.2 A notação de Dirac 4.2.4 111 A operação adjunta A definição de operador adjunto resulta da correspondência entre E e E ∗ . Chamamos por isso a um ket e ao seu bra associado adjuntos e denotamos hΨ|† = |Ψi , |Ψi† = hΨ| . (4.2.32) O que acontece quando temos um produto de kets e bras como por exemplo (|aihb|)† ? (4.2.33) O elemento de matriz deste operador entre 2 estados arbitrários é hΨ| (|aihb|)† |Φi (4.2.22) = (hΦ|aihb|Ψi)∗ = hΦ|ai∗ hb|Ψi∗ = hΨ|biha|Φi = hΨ| (|biha|) |Φi , (4.2.34) ou seja (|aihb|)† = |biha| . (4.2.35) Assim, a acção da operação adjunta transforma ket ↔ bra e, tal como para operadores, inverte a ordem. Notando que a operação adjunta transforma um escalar no seu complexo conjugado (por (4.2.24)), resumimos a acção da operação adjunta numa expressão composta por kets, bras, constantes e operadores do seguinte modo: i) Substituimos • constantes pelos complexos conjugados; • kets pelos bras associados e vice-versa; • operadores pelos adjuntos; ii) Invertemos a ordem dos factores. 4.2.5 Notação de Dirac numa dada base Reproduzimos a tabela da secção 4.1.2 na notação de Dirac:6 6 Os kets |uα i são designados por kets generalizados, pois não pertencem a E, i.e. não são normalizáveis, tal como os vectores uα (~x) na secção 4.1.2. 112 Formalismo Matemático e Postulados da Mecânica Quântica Expansão da Função de Onda Base discreta {|un i} X |Ψi = cn |un i Base contı́nua {|uαi} R |Ψi = dαc(α)|uαi hun |Ψi = cn X hΦ|Ψi = b∗n cn huα |Ψi = c(α) R hΦ|Ψi = dαb∗ (α)c(α) n Relação de Ortonormalização huα |uα′ i = δ(α − α′ ) hun |umi = δnm Projecção da Função de Onda Produto escalar em componentes n Relação de Fecho (n) P̂ ≡ X n |un ihun | = 1̂ P̂ (α) ≡ R dα|uαihuα| = 1̂ onde usamos o ket |Φi = X n bn |un i , (4.2.36) e denotamos o operador identidade como 1̂. Demonstremos a relação de fecho no caso discreto. Considerando o ket |Ψi nesta base temos |Ψi = X n cn |un i = X n hun |Ψi|un i = X n |un ihun |Ψi , (4.2.37) o que implica a equivalência X n |un ihun | = 1̂ . (4.2.38) É simples expressar um bra nesta base usando este operador. No caso discreto hΨ| = X n hΨ|unihun | = X n c∗n hun | . (4.2.39) Por outro lado, os elementos de matriz de um operador Â são Anm = hun |Â|umi A(α, α′ ) = huα |Â|uα′ i , (4.2.40) para uma base discreta e contı́nua respectivamente. Assim, no caso de uma base discreta podemos resumir a situação do seguinte modo: • O ket |Ψi = • O bra hΦ| = P n cn |un i é representado como um vector coluna com componentes {cn }; ∗ n bn hun | é representado como um vector linha com componentes {b∗n }; P 4.2 A notação de Dirac 113 • O operador Â é representado como uma matriz com componentes Anm = hun |Â|um i; • O ket Â|Ψi é representado como um vector coluna com componentes {dn = P m Anm cm }, que resulta da multiplicação de uma matriz (que representa Â) por um vector coluna (que representa |Ψi); de facto projectando este ket nos vectores da base obtemos X X dn = hun |Â|Ψi = hun |Â1̂|Ψi = hun |Â|um ihum |Ψi = Anm cm ; (4.2.41) m m • O bra hΨ|Â é representado como um vector linha com componentes { ∗ n cn Anm }, P que resulta da multiplicação de um vector linha (que representa hΨ|) por uma matriz (que representa Â); de facto projectando este bra nos vectores da base obtemos X X c∗n Anm ; (4.2.42) hΨ|Â|um i = hΨ|1̂Â|umi = hΨ|un ihun |Â|um i = n • O número hΦ|Â|Ψi é representado como n ∗ n,m bn Anm cm , P que resulta da multiplicação de uma matriz (que representa Â) por um vector linha à esquerda (que representa o bra) e um vector coluna à direita (que representa o ket); de facto X X hΦ|Â|Ψi = hΦ|1̂Â1̂|Ψi = hΦ|un ihun |Â|um ihum|Ψi = b∗n Anm cm ; n,m (4.2.43) n,m • O operador adjunto Â† de um operador Â é representado pela matriz complexa conjugada e transposta da matriz que representa Â; de facto A† nm = hun |Â† |um i (4.2.22) = hum |Â|un i∗ = A∗mn ; (4.2.44) • Um operador hermı́tico é representado por uma matriz hermı́tica, pois Â† = Â implica que Anm = A∗mn . 4.2.6 (4.2.45) Valores próprios e vectores próprios de um operador Um problema fundamental em mecânica quântica é encontrar os valores próprios, λ, e os vectores próprios, |Ψi, de um operador Â; isto é, resolver a equação Â|Ψi = λ|Ψi . (4.2.46) 114 Formalismo Matemático e Postulados da Mecânica Quântica Chama-se espectro do operador Â ao seu conjunto de valores próprios. Notemos que para qualquer operador linear i) Se |Ψi é vector próprio, α|Ψi também o é, correspondendo ao mesmo valor próprio. Podemos por isso escolher sempre os vectores próprios normalizados, isto é hΨ|Ψi = 1 . (4.2.47) ii) Se {|Ψi i}, i=1,...,n, são linearmente independentes e correspondem ao mesmo valor próprio, o valor próprio diz-se degenerado com grau de degenerescência n. No caso de o operador em consideração ser hermı́tico podemos ainda enunciar as seguintes propriedades: i) Os valores próprios de um operador hermı́tico Â são reais: λhΨ|Ψi = hΨ|Â|Ψi (4.2.22) = hΨ|Â|Ψi∗ = λ∗ hΨ|Ψi , (4.2.48) logo λ = λ∗ ; (4.2.49) ii) Dois vectores próprios |Ψi, |Φi associados a valores próprios distintos λ, µ são ortogonais. De facto,   Â|Ψi = λ|Ψi  Â|Φi = µ|Φi adjunto ←→   hΨ|Â = λhΨ|  hΦ|Â = µhΦ| logo se considerarmos hΦ|Â|Ψi podemos pensar de duas maneiras λhΦ|Ψi = hΦ| Â|Ψi = hΦ|Â|Ψi = hΦ|Â |Ψi = µhΦ|Ψi , , (4.2.50) (4.2.51) e como λ 6= µ concluı́mos que hΦ|Ψi = 0. Na prática, dada uma base em que expressamos um operador Â como uma matriz, encontrar os valores próprios do operador resume-se a encontrar os valores próprios da matriz e portanto resolver a equação det (Amn − λδmn ) = 0 . (4.2.52) 4.3 Os postulados da Mecânica Quântica 4.2.7 115 Observáveis Consideremos um operador hermı́tico Â, e por simplicidade assumimos que os seus valores próprios formam um espectro discreto {λn }, n=1,...,N, com Â|Ψin i = λn |Ψin i , (4.2.53) onde i representa a degenerescência de cada valor próprio, i = 1, ..., gn , onde gn é um número inteiro que depende de n. Para cada n podemos escolher uma base ortonormada do subespaço vectorial associado ao valor próprio λn , hΨin |Ψjn i = δ ij . (4.2.54) Como vimos anteriormente os vectores próprios associados a valores próprios distintos são necessariamente ortogonais e podemos escolhê-los normalizados. Assim o conjunto |Ψin i, n = 1...N, i = 1...gn forma uma base ortonormada do espaço de funções próprias de Â. Se este conjunto é também uma base do espaço de estados E, o operador hermı́tico é designado uma observável. Portanto, o requerimento para ser observável é que qualquer estado de E possa ser expresso como uma combinação linear de funções próprias da observável, condição que é expressa matematicamente pela relação de fecho gn N X X n=1 i=1 |Ψin ihΨin | = 1̂ . (4.2.55) Veremos na próxima secção que as grandezas fı́sicas mensuráveis estão associadas a observáveis. 4.3 Os postulados da Mecânica Quântica Pensemos na descrição da mecânica clássica dada pelo formalismo Hamiltoniano descrito na secção 1.3. Podemos escrever “postulados” para a mecânica clássica de N partı́culas pontuais usando a linguagem de estado do sistema que temos usado na descrição quântica. Os postulados clássicos seriam os seguintes: i) O estado de um sistema no instante t0 é definido especificando {q i (t0 ), pi(t0 )}, i = 1...N; 116 Formalismo Matemático e Postulados da Mecânica Quântica ii) Num dado instante o valor de todas as quantidades fı́sicas é completamente determinado se o estado do sistema é conhecido. Sabendo o estado do sistema em t0 podemos prever com toda a certeza o resultado de qualquer medida efectuada no sistema em t0 ; iii) A evolução do estado do sistema é dada pelas equações canónicas (1.3.13) ṗi = − ∂H , ∂q i q̇ i = ∂H , ∂pi (4.3.1) onde H é o Hamiltoniano. Dado estas serem equações diferenciais de primeira ordem, a sua solução {q i (t), pi (t)} é completamente determinada pelas condições iniciais {q i (t0 ), pi(t0 )}. Assim, o estado do sistema é conhecido para todo o t se for conhecido para t0 . Qual o sistema de postulados que substituem os anteriores em mecânica quântica? Ou seja: i) Como se descreve matematicamente num dado instante t0 o estado de um sistema quântico? Primeiro Postulado Num dado instante t0 , o estado de um sistema é descrito por um ket |Ψ(to )i pertencente ao espaço de estados E. Note-se que neste postulado está implı́cito: a) o princı́pio de sobreposição, pois E é um espaço vectorial; b) normalizabilidade da função de onda pois E é um subespaço de um espaço de Hilbert. ii) Dado este estado, como podemos prever o resultado da medida de quantidades fı́sicas? Segundo Postulado Qualquer quantidade fı́sica mensurável, A, é descrita por um operador, Â, que actua em E; este operador é uma observável. 4.3 Os postulados da Mecânica Quântica 117 Note-se desde já que em mecânica quântica o estado do sistema - representado por um vector - e uma quantidade fı́sica mensurável - representada por um operador - têm naturezas diferentes. Em mecânica clássica este contraste não existe. Terceiro Postulado Os únicos resultados possı́veis numa medição de A são os valores próprios de Â. Note-se que a) o resultado de uma medição é um número real, como consequência de Â ser hermı́tico; b) se o espectro de Â for discreto os resultados possı́veis da medição de A estão quantificados. Quarto Postulado A previsão do resultado da medição de A é de natureza probabilı́stica. Se A for medida num sistema descrito por um estado normalizado |Ψi, temos as seguintes possibilidades para a probabilidade de obter um dado valor: • Se Â tem um espectro discreto {an }, a probabilidade de obter um dado valor próprio an é P(an ) = gn X i=1 |huin |Ψi|2 , (4.3.2) onde gn é o grau de degenerescência do valor próprio an e {|uin i}, i = 1...gn é uma base ortonormada do subespaço de vectores próprios associados a an ; • Se Â tem um espectro contı́nuo {a(α)}, a probabilidade dP(α) de obter um resultado entre α e α + dα é dP(α) = |huα |Ψi|2dα , (4.3.3) onde |uαi é o vector próprio de Â associado ao valor próprio a(α). Note-se que para este postulado ser coerente, a soma da probabilidade de todos os resultados possı́veis tem de ser 1. Este é o caso se Â for uma observável. De facto, tomando como exemplo simples o caso de um espectro discreto não degenerado, X n P(an ) = X n |hun |Ψi|2 Â é observável = XX m n |hun |umicm |2 = X m |cm |2 = 1 , (4.3.4) 118 Formalismo Matemático e Postulados da Mecânica Quântica pois hΨ|Ψi = 1 por hipótese. Logo, a condição de Â ser observável garante que hΨ|Ψi = 1 Â é Observável X ⇒ todos os valores próprios P(valor próprio) = 1 . (4.3.5) Note-se também que poderı́amos considerar casos mais complicados, como espectros contı́nuos degenerados ou espectros parcialmente contı́nuos e parcialmente discretos. Quinto Postulado - Colapso da função de onda Se a medição de uma grandeza fı́sica A no sistema no estado |Ψi dá resultado: • (caso discreto) an , o sistema imediatamente depois da medida encontra-se no estado descrito pela projecção normalizada de |Ψi para o subespaço associado a an |Ψi medida dá an −→ onde gn X P̂n = i=1 P̂n |Ψi q , hΨ|P̂n |Ψi (4.3.6) |uin ihuin | ; (4.3.7) • (caso contı́nuo) α0 com incerteza ∆α, o sistema imediatamente depois da medida encontrase no estado descrito pela projecção medida dá α0 |Ψi P̂∆α (α0 )|Ψi incerteza ∆α −→ q onde P̂∆α (α0 ) = Z , (4.3.8) hΨ|P̂∆α(α0 )|Ψi α0 +∆α/2 α0 −∆α/2 dα|uαihuα| . (4.3.9) Note-se que a evolução normal do sistema poderá retira-lo deste estado próprio de Â, caso este operador não comute com o operador Hamiltoniano. iii) Sabendo o estado inicial em t0 , como calcular o estado num instante posterior t? Sexto Postulado A evolução temporal do estado do sistema |Ψ(t)i é descrita pela equação de Schrödinger i~ d |Ψ(t)i = Ĥ(t)|Ψ(t)i , dt (4.3.10) 4.4 Quantificação 119 onde Ĥ(t) é o operador Hamiltoniano que é a observável associada com a energia total do sistema. 4.4 Quantificação O princı́pio da incerteza de Heisenberg ficou, aparentemente, de fora nos postulados da secção anterior. Por outro lado, o segundo postulado associa a uma grandeza mensurável A um operador Â, que não especificamos como construir. Vamos agora estabelecer como é que associamos às variáveis fı́sicas mensuráveis operadores e como é que incorporamos nesses operadores o princı́pio da incerteza. 4.4.1 Variáveis compatı́veis, incompatı́veis e C.C.O.C. Duas grandezas mensuráveis A e B dizem-se compatı́veis se os operadores que lhes estão associados Â e B̂ comutam. Também se usa o termo compatı́veis para as próprias observáveis. Significado matemático de compatibilidade: Teorema: A compatibilidade de duas observáveis é equivalente a possuirem um sistema ortonormado completo e comum de funções próprias, isto é, uma base própria comum. Estas observáveis são ditas simultaneamente diagonalizáveis. Demonstração: Aqui tomamos somente o caso mais simples em que Â e B̂ têm espectro discreto não degenerado com valores próprios, respectivamente, {an } e {bn }. i) (⇐) Utilizemos estes valores próprios como rótulos do conjunto ortonormado e completo de vectores próprios comum a Â e B̂ denotado {|an , bm i}: Â|an , bm i = an |an , bm i , B̂|an , bm i = bm |an , bm i . (4.4.1) Logo B̂ Â − ÂB̂ |an , bm i = 0 , (4.4.2) de onde concluimos, devido aos |an , bm i formarem uma base do espaço de estados, que h i Â, B̂ = 0. 120 Formalismo Matemático e Postulados da Mecânica Quântica ii) (⇒) Consideramos duas variáveis compatı́veis, que portanto têm operadores associados Â e B̂ que comutam. Consideremos um conjunto completo de vectores próprios de Â, {|an i}, Â|an i = an |an i . O vector B̂|an i é também vector próprio de Â com valor próprio an ; de facto [Â,B̂]=0 Â B̂|an i = B̂ Â|an i = an B̂|an i . (4.4.3) (4.4.4) Mas como assumimos que o espectro é não degenerado, todos os vectores próprios associados a um valor próprio são colineares. Logo B̂|an i = b|an i , (4.4.5) o que mostra que os vectores próprios de Â são também vectores próprios de B̂ e como tal que existe um conjunto completo de vectores próprios comum a Â e B̂. (q.e.d.) Corolário: Se o Hamiltoniano Ĥ comuta com um operador Ô então existe uma base de estados estacionários cujos elementos são também estados próprios de Ô. Note, no entanto, que se o espectro de Ĥ for degenerado poderá ser possı́vel construir estados estacionários que não são estados próprios de Ô. Nota: o facto de não existir uma base própria comum a duas observáveis não significa que não exista nenhum vector próprio comum. Obviamente, duas grandezas mensuráveis A e B dizem-se incompatı́veis se os operadores que lhes estão associados Â e B̂ não comutam (os operadores também são ditos incompatı́veis). Significado fı́sico da incompatibilidade: Teorema: A incompatibilidade de duas grandezas fı́sicas implica a impossibilidade de determinar ambas as grandezas com precisão arbitrária. Demonstração: Assumimos que os operadores Â e B̂ associados às nossas grandezas fı́sicas A e B não comutam: h i Â, B̂ = ia1̂ , a ∈ R+ . (4.4.6) 4.4 Quantificação 121 Estas grandezas têm associadas funções de distribuição de probabilidade. Podemos por isso associar-lhes um valor esperado, uma variância e um desvio padrão. Pretendemos demonstrar que o produto dos desvios padrão tem um ı́nfimo. Se o espectro de Â e B̂ for dado por {an } e {bn }, os valores esperados das grandezas A e B serão dados por hAi = X n P(an )an , hBi = X ∆B = p P(bn )bn , (4.4.7) h(B − hBi)2 i . (4.4.8) n onde P(an ) = |han |Ψi|2 e os desvios padrão ∆A = p h(A − hAi)2i , Primeiro, notamos como expressar hAi na notação de Dirac: hAi = X n han |Ψi∗han |Ψian = X n hΨ|an ihan |Ψian = X n hΨ|Â|an ihan |Ψi = hΨ|Â|Ψi ≡ hÂi . (4.4.9) Observe a notação. No fim da linha denotamos o valor esperado de um operador num determinado estado de uma maneira análoga ao valor esperado (ou médio) estatı́stico que aparece no inı́cio da linha. Segundo, definimos as observáveis α̂, β̂ do seguinte modo α̂ = Â − hÂi1̂ , β̂ = B̂ − hB̂i1̂ , (4.4.10) que são observáveis com a mesma relação de comutação que Â e B̂, [α̂, β̂] = ia1̂, correspondentes a grandezas fı́sicas, α, β, com o mesmo desvio padrão de A, B mas valor esperado zero. Logo (4.4.8) fica neste caso (∆α)2 = hα2 i, (∆β)2 = hβ 2 i , (4.4.11) (∆β)2 = hΨ|β̂ 2|Ψi , (4.4.12) ou, na notação de Dirac (∆α)2 = hΨ|α̂2|Ψi, ou ainda, definindo |Ψ1 i = α̂|Ψi e |Ψ2 i = β̂|Ψi (∆α)2 = hΨ1 |Ψ1 i, (∆β)2 = hΨ2 |Ψ2 i . (4.4.13) 122 Formalismo Matemático e Postulados da Mecânica Quântica Terceiro usamos a desigualdade de Schwarz (4.1.12) (∆α∆β)2 = hΨ1 |Ψ1 ihΨ2 |Ψ2 i (4.1.12) ≥ hΨ1 |Ψ2 ihΨ2|Ψ1 i = hΨ|α̂β̂|ΨihΨ|β̂ α̂|Ψi . (4.4.14) Notemos que embora α̂ e β̂ sejam hermı́ticos, o seu produto α̂β̂ não é hermı́tico, pois eles não comutam. Assim † x + iy ≡ hΨ|α̂β̂|Ψi = hΨ| α̂β̂ |Ψi∗ = hΨ|β̂ α̂|Ψi∗ ⇒ hΨ|β̂ α̂|Ψi ≡ x − iy . (4.4.15) Logo reescrevemos (4.4.14) como (∆α∆β)2 ≥ x2 + y 2 ≥ y 2 = − 2 h i 2 a2 1 1 hΨ|α̂β̂|Ψi − hΨ|β̂ α̂|Ψi = − hΨ| α̂, β̂ |Ψi = . 4 4 4 (4.4.16) Finalmente concluimos então que ∆α∆β ≥ a 2 ⇔ ∆A∆B ≥ a , 2 (4.4.17) o que mostra que não podemos determinar as duas grandezas simultaneamente com precisão arbitrária. (q.e.d.) Tendo compreendido que um conjunto de variáveis compatı́veis corresponde a um conjunto de observáveis que comutam e portanto têm uma base própria comum, introduzimos a seguinte definição Definição: Um conjunto de observáveis, Â, B̂, Ĉ . . ., diz-se um Conjunto Completo de Observáveis que Comutam (C.C.O.C) se: i) Todos os pares de observáveis comutarem; ii) Especificando o valor próprio de todas as observáveis determina um único vector próprio (normalizado); iii) Ao retirarmos uma qualquer observável, ii) deixa de ser obedecido, ou seja, o conjunto é minimal. 4.4 Quantificação 123 A base para o espaço de estados de um sistema fı́sico é escolhida como o conjunto de vectores próprios de um C.C.O.C, sendo estes vectores rotulados pelos valores próprios do C.C.O.C. |an , bn , cn , . . .i , (4.4.18) onde {an }, {bn }, {cn }, . . ., são os espectros de Â, B̂, Ĉ . . .. Note-se que para um dado sistema fı́sico existem, em geral, vários C.C.O.C. 4.4.2 Os operadores X̂ e P̂ O exemplo canónico de variáveis incompatı́veis são as grandezas fı́sicas momento e posição. Associando a estas grandezas fı́sicas as observáveis X̂ e P̂ e comparando (4.4.17) com (2.3.6) identificamos a = ~ e usando em (4.4.6) temos que a relação de comutação h i X̂, P̂ = i~1̂ , (4.4.19) reproduz a relação de incerteza de Heisenberg. Ou seja (4.4.19) é a expressão do princı́pio da incerteza de Heisenberg em termos das observáveis X̂ e P̂ . Se tivéssemos várias componentes de posição e momento, X̂ k e P̂j terı́amos h i X̂ k , P̂j = i~δjk 1 , h i h i X̂ k , X̂ j = 0 = P̂k , P̂j , (4.4.20) que são denominadas relações de comutação canónicas. Deste modo, não podemos escolher uma base de funções próprias comum a X̂ e P̂ , pelo que temos duas importantes alternativas para a escolha de base de um sistema fı́sico:7 • Representação |~xi: Expandimos o estado do sistema fı́sico na base de funções próprias do operador X̂. Esta base foi estudada no final da secção 4.1.2 e corresponde a tomar os vectores da base como deltas de Dirac, ou, na notação de Dirac δ(~x − ~x0 ) → |~x0 i ; 7 Note-se que os kets que vamos usar |~x0 i e |~ pi são kets generalizados. (4.4.21) 124 Formalismo Matemático e Postulados da Mecânica Quântica • Representação |~pi: Expandimos o estado do sistema fı́sico na base de funções próprias do operador P̂ . Tomamos os vectores da base como ondas planas, ou, na notação de Dirac 1 ei~p·~x/~ → |~pi . (2π~)n/2 (4.4.22) Para estas ‘bases’ a tabela da secção 4.2.5 fica Representação |~pi Z |Ψi = d~p Ψ̃(~p)|~pi Expansão da Função de Onda h~p|~p ′ i = δ(~p − ~p ′ ) Relação de Ortonormalização Projecção da Função de Onda Produto escalar em componentes Relação de Fecho Representação |~xi Z |Ψi = d~x0 Ψ(~x0 )|~x0 i h~x0 |~x0 ′ i = δ(~x0 − ~x0 ′ ) h~p|Ψi = Ψ̃(~p) h~x0 |Ψi = Ψ(~x0 ) R R hΦ|Ψi = d~pΦ̃∗ (~p)Ψ̃(~p) hΦ|Ψi = d~x0 Φ∗ (~x0 )Ψ(x~0 ) R R d~p|~pih~p| = 1̂ d~x0 |~x0 ih~x0 | = 1̂ Assim, podemos reinterpretar a função de onda no espaço de configurações Ψ(~x) e a sua transformada de Fourier Ψ̃(~p) como os coeficientes da expansão do estado do sistema na representação |~xi e |~pi respectivamente. Notemos que h~x0 |~p0 i = Z d~xδ(~x − ~x0 ) 1 1 i~ p0 ·~ x/~ e = ei~p0 ·~x0 /~ . (2π~)n/2 (2π~)n/2 (4.4.23) Para simplificar a notação trabalharemos a partir de agora em uma só dimensão. A acção do operador X̂ na representação |xi e do operador P̂ na representação |pi é X̂|xi = x|xi , P̂ |pi = p|pi . (4.4.24) Uma questão natural é a seguinte: Qual a acção do operador P̂ na representação |xi e do operador X̂ na representação |pi? Para obter a resposta consideramos o ket P̂ |Ψi projectado na representação |xi: Z Z 1 dpeipx/~pΨ̃(p) hx|P̂ |Ψi = dphx|pihp|P̂ |Ψi = √ 2π~ Z . 1 d d d ipx/~ =√ dpe Ψ̃(p) = −i~ Ψ(x) = −i~ hx|Ψi −i~ dx dx dx 2π~ (4.4.25) 4.4 Quantificação 125 Portanto, na representação |xi o operador P̂ coincide com o operador diferencial −i~d/dx, que é hermı́tico, como vimos na secção 4.1.3. Um elemento de matriz fica Z Z d ′ ′ ′ ′ ∗ hx|x′ ihx′ |Ψi hΦ|P̂ |Ψi = dxdx hΦ|xihx|P̂ |x ihx |Ψi = dxdx Φ(x) −i~ dx . Z Z Z d d ∗ ′ ′ ′ ∗ = dxΦ(x) −i~ hx| dx |x ihx | |Ψi = dxΦ(x) −i~ Ψ(x) dx dx (4.4.26) Podemos ainda verificar a consistência desta representação do operador P̂ com (4.4.19); consideremos h i hx| X̂, P̂ |Ψi = hx|X̂ P̂ − P̂ X̂|Ψi , (4.4.27) e se nos situarmos na representação |xi temos d = hx|X̂ P̂ |Ψi − hx|P̂ X̂|Ψi = xhx|P̂ |Ψi + i~ hx|X̂|Ψi dx d d = x −i~ hx|Ψi + i~ (xhx|Ψi) = i~hx|Ψi dx dx ou, como |Ψi é arbitrário, em concordância com (4.4.19). h i X̂, P̂ = i~1 , , (4.4.28) (4.4.29) De um modo análogo podemos concluir que o operador X̂ na representação |pi toma a forma do operador diferencial i~d/dp. Notemos que qualquer variável ou equação dinâmica pode ser expressa tanto na representação |xi como |pi. Assim, a equação de Schrödinger, que é usualmente escrita na representação |xi, ~2 ∂Ψ(x, t) = − ∆ + V (x, t) Ψ(x, t) , i~ ∂t 2m (4.4.30) pode ser vista como resultando da relação de energia E= p2 + V (x, t) , 2m (4.4.31) por substituição de E → i~ ∂ , ∂t p~ → −i~∇ , (4.4.32) 126 Formalismo Matemático e Postulados da Mecânica Quântica o que significa o uso da representação |xi. Por contraste, na representação |pi farı́amos a substituição E → i~ ∂ , ∂t ~x → i~∇p , (4.4.33) o que nos leva à equação de Schrödinger na representação |pi 2 ∂ Ψ̃(p, t) p i~ = + V (i~∇p , t) Ψ̃(p, t) . ∂t 2m (4.4.34) Claro que esta equação não é mais do que a representação de (4.4.30) no espaço de Fourier. Concluimos com a observação de que tanto X̂ como P̂ são observáveis (a hermiticidade foi demonstrada na secção 4.1.3) e que para o problema de uma partı́cula sem spin a mover-se livremente no espaço de posições vários C.C.O.C. são {X̂, Ŷ , Ẑ} , 4.4.3 {P̂x , P̂y , P̂z } , {X̂, P̂y , P̂z } , . . . (4.4.35) Regras de Quantificação canónica Consideremos um sistema clássico de uma partı́cula, descrito pelo ‘estado clássico’ {q(t), p(t)}. A quantificação deste sistema é feita do seguinte modo: i) O estado do sistema passa a ser interpretado como um vector |Ψi em E; ii) Uma grandeza fı́sica mensurável, A(q, p, t) passa a ser um operador A(q, p, t) → Â(X̂, P̂ , t) , (4.4.36) onde, quando houver ambiguidade de ordem entre X̂ e P̂ a expressão deve ser simetrizada, o que garante a hermiticiadade do operador; iii) Impõem-se relações de comutação canónicas (em coordenadas cartesianas) entre a observável associada à posição, X̂, e a observável associada ao seu momento canónico conjugado, P̂ . Exemplos: 4.4 Quantificação 127 • A quantidade fı́sica qp tem associado o operador 1 (X̂ P̂ + P̂ X̂) , 2 (4.4.37) que contem a simetrização necessária para evitar ambiguidades de ordem e garante a hermiticidade necessária para ser observável; • O momento angular ~ = ~x × p~ = (ypz − zpy , zpx − xpz , xpy − ypx ) , L (4.4.38) tem operador associado ~ L̂ = (L̂x , L̂y , L̂z ) = (Ŷ P̂z − Ẑ P̂y , Ẑ P̂x − X̂ P̂z , X̂ P̂y − Ŷ P̂x ) . (4.4.39) Usando as relações de comutação canónicas obtemos [L̂x , L̂y ] = i~L̂z , [L̂y , L̂z ] = i~L̂x , [L̂z , L̂x ] = i~L̂y , (4.4.40) que são as relações de comutação para o momento angular. • Consideremos um sistema descrito pelo Lagrangiano 1 L = mq̇ 2 − V (q) 2 p=mq̇ ⇒ H= p2 + V (q) . 2m (4.4.41) Quantificando, temos o operador Hamiltoniano Ĥ = P̂ 2 + V (X̂) , 2m (4.4.42) e as relações de comutação canónicas são h i X̂, P̂ = i~1 ; (4.4.43) • Consideremos uma partı́cula sob a influência de um campo electromagnético 2 1 ~ ~x)−qφ(t, ~x) L = m~x˙ +q~x˙ ·A(t, 2 ~ p ~=m~ x˙ +q A ⇒ H= ~ ~x))2 (~p − q A(t, +qφ(t, ~x) . (4.4.44) 2m 128 Formalismo Matemático e Postulados da Mecânica Quântica Quantificando, temos o operador Hamiltoniano Ĥ = ~ ~ ~ (P̂ − q Â(t, X̂))2 ~ + q φ̂(t, X̂) , 2m (4.4.45) e as relações de comutação canónicas [X̂ j , P̂k ] = i~δkj 1 . (4.4.46) No capı́tulo 5 estudaremos detalhadamente a quantificação canónica do oscilador harmónico e do problema de Larmor. Em conclusão notamos que este método de quantificação não pode ser aplicado a variáveis que não tenham análogo clássico. O exemplo óbvio é o spin, que tem de ser definido directamente pelo operador associado. 4.4.4 Comentários sobre a evolução de um sistema quântico A evolução de um sistema quântico é dada pela equação de Schrödinger i~ d|Ψ(t)i = Ĥ|Ψ(t)i . dt (4.4.47) Vamos discutir algumas propriedades desta equação: i) Determinista: dado o estado inicial |Ψ(t0 )i, o estado final |Ψ(t)i está totalmente determinado; o indeterminismo na mecânica quântica surge na altura da medição devido ao colapso da função de onda; ii) Linearidade, que é equivalente ao princı́pio de sobreposição; iii) Conservação da probabilidade, isto é hΨ(t)|Ψ(t)i é constante na evolução devido à hermiticidade do operador Hamiltoniano: d d d hΨ(t)|Ψ(t)i = hΨ(t)| |Ψ(t)i + hΨ(t)| |Ψ(t)i , dt dt dt (4.4.48) mas, pela equação de Schrödinger d|Ψ(t)i 1 = Ĥ|Ψ(t)i dt i~ ⇔ dhΨ(t)| 1 = − hΨ(t)|Ĥ . dt i~ (4.4.49) Logo, (4.4.48) fica igual a zero, o que mostra que a norma da função de onda é conservada. 4.4 Quantificação 129 Claro que na evolução do sistema poderá haver variações locais da densidade de probabilidade. Assumindo que a função de onda está normalizada, Z Z P(~x, t)d~x = Ψ(~x, t)∗ Ψ(~x, t)d~x , V (4.4.50) V representa a probabilidade de a partı́cula estar num determinado volume V . Assim Z Z ∂ ∂ d ∗ ∗ P(~x, t)d~x = Ψ(~x, t) Ψ(~x, t) + Ψ(~x, t) Ψ(~x, t) d~x , (4.4.51) dt V ∂t ∂t V ou, usando a equação de Schrödinger Z Z i~ ∗ ∗ = [−Ψ(~x, t)∆Ψ(~x, t) + Ψ(~x, t) ∆Ψ(~x, t)] d~x = − ∇ · J~(~x, t)d~x , 2m V V (4.4.52) onde definimos o vector densidade de corrente de probabilidade ~ x, t) = i~ [Ψ(~x, t)∇Ψ(~x, t)∗ − Ψ(~x, t)∗ ∇Ψ(~x, t)] . J(~ 2m (4.4.53) Assim temos Z V ∂ P(~x, t)d~x + ∂t ou, como o volume é arbitrário Z V ~ x, t)d~x = 0 , ∇ · J(~ ∂ ~ x, t) = 0 , P(~x, t) + ∇ · J(~ ∂t (4.4.54) (4.4.55) que é uma equação de continuidade para a probabilidade. 4.4.5 Evolução do valor médio de uma variável Para um dado instante t, o valor médio de uma grandeza fı́sica A é dado por (4.4.9) hÂi(t) = hΨ(t)|Â|Ψ(t)i . (4.4.56) Diferenciando d hÂi(t) = dt ∂ Â ∂ ∂ hΨ(t)| Â|Ψ(t)i + hΨ(t)| |Ψ(t)i + hΨ(t)|Â |Ψ(t)i , ∂t ∂t ∂t (4.4.57) ou, usando a equação de Schrödinger = ∂ Â 1 hΨ(t)|ÂĤ − Ĥ Â|Ψ(t)i + h i(t) , i~ ∂t (4.4.58) 130 Formalismo Matemático e Postulados da Mecânica Quântica de onde concluimos que i ∂ Â 1 h d hÂi(t) = h i(t) + h Â, Ĥ i(t) . dt ∂t i~ (4.4.59) Logo, a dinâmica do valor médio é a mesma da mecânica clássica (1.3.28). Tal como em mecânica clássica, se a observável Â não depender explicitamente do tempo e comutar com o Hamiltoniano, o seu valor médio é uma constante do movimento. Note-se que os parêntesis de Poisson desempenham o papel de comutador clássico. Uma aplicação particular de (4.4.59) é aos operadores X̂ e P̂ para um sistema com Hamiltoniano (4.4.42); aplicando a X̂ obtemos # " i i P̂ d 1 h hP̂ i 1 P̂ 2 P̂ h i = h X̂, P̂ X̂, P̂ i = hX̂i = h X̂, + , dt i~ 2m i~ 2m 2m m enquanto que notando que h i série T aylor P̂ , V̂ (X̂) = [P̂ , V0 1̂ + V1 X̂ + V2 X̂ 2 + V3 X̂ 3 + . . .] dV̂ (X̂) 2 = −i~ V1 − 2V2 X̂ − 3V3 X̂ − . . . = −i~ dX̂ (4.4.60) , (4.4.61) e aplicando a P̂ obtemos i d 1 h 1 dV̂ (X̂) dV̂ (X̂) hP̂ i = h P̂ , V̂ (X̂) i = h−i~ i = −h i, dt i~ i~ dX̂ dX̂ (4.4.62) que reproduzem as fórmulas clássicas p dx = , dt m dp dV (x) =− . dt dx (4.4.63) Estes resultados demonstram o teorema de Ehrenfest: “As equações de evolução dos valores médios de um sistema quântico são formalmente idênticas às da mecânica clássica.” Como tal, se os valores médios de observáveis derem uma boa descrição da fı́sica de um sistema, a mecânica clássica fornece uma descrição satisfatória, que é o conteúdo do princı́pio da correspondência. Por exemplo, a mecânica clássica só ‘vê’ a posição do centro do trem de ondas; se a dispersão do mesmo for irreconhecı́vel nas experiências levadas a cabo, a descrição da mecânica clássica será satisfatória. 4.5 Mecânica Quântica Estatı́stica 4.5 131 Mecânica Quântica Estatı́stica O formalismo que desenvolvemos até ao momento consegue apenas fazer previsões probabilı́sticas relativamente aos resultados possı́veis em medições de um sistema quântico. Contudo, este formalismo baseia-se em saber exactamente o estado quântico do sistema, |Ψi, o que temos sempre assumido. Podemos, no entanto, imaginar situações em que temos uma informação incompleta acerca do estado do sistema. Por exemplo, a energia cinética de átomos emitidos por uma fornalha à temperatura T é conhecida apenas probabilisticamente, mesmo em mecânica clássica. De facto, tal como em Mecânica Clássica Estatı́stica sabemos, por exemplo, a energia de uma partı́cula num sistema em equilı́brio térmico apenas probabilisticamente através da distribuição de Boltzmann P(E) ∼ e−E/KB T , (4.5.1) em Mecânica Quântica Estatı́stica saberemos o estado em que uma partı́cula se encontra apenas probabilisticamente. Existe uma mistura estatı́stica de estados, ou estado mistura. Por oposição, um estado quântico perfeitamente conhecido é designado por estado puro. Para compreender as alterações introduzidas se considerarmos uma mistura estatı́stica de estados consideremos o seguinte exemplo. O nosso sistema quântico encontra-se no estado mistura descrito por |Ψi = a1 |αi + a2 |βi com probabilidade p1 , (4.5.2) ′ |Ψ i = a3 |αi + a4 |βi com probabilidade p2 onde cada estado está normalizado |a1 |2 + |a2 |2 = 1 , |a3 |2 + |a4 |2 = 1 , (4.5.3) e p1 + p2 = 1. Uma pergunta natural é: “Qual a probabilidade de obter o valor próprio associado a |αi ou |βi numa medição?” A resposta natural é P(α) = p1 |a1 |2 + p2 |a3 |2 , P(β) = p1 |a2 |2 + p2 |a4 |2 , (4.5.4) o que implica que P(α) + P(β) = 1 . (4.5.5) 132 Formalismo Matemático e Postulados da Mecânica Quântica Note-se que esta resposta não é equivalente a considerar o novo estado |Ψ̃i = √ p1 |Ψi + √ √ √ √ √ p2 |Ψ′ i = ( p1 a1 + p2 a3 ) |αi + ( p1 a2 + p2 a4 ) |βi , (4.5.6) que, pelos postulados usuais implicaria que √ p1 |a1 |2 + p2 |a3 |2 + p1 p2 (a1 a∗3 + a∗1 a3 ) . P(α) = √ p1 p2 (a1 a∗3 + a∗1 a3 + a2 a∗4 + a4 a∗2 ) + 1 (4.5.7) Neste caso existem termos de interferência, que não estão presentes na mistura estatı́stica de estados. Com este exemplo concluimos os seguintes dois factos: • Uma mistura estatı́stica de estados quânticos |Ψ1 i . . . |Ψn i não pode ser expressa como uma combinação linear destes estados quânticos |Ψi = 6 n X i=1 χi |Ψi i , (4.5.8) pois nesta combinação linear existiriam sempre termos de interferência entre os vários estados |Ψi i no cálculo de probabilidades, termos que não estão presentes nas probabilidades da mistura estatı́stica. Mais concretamente, uma sobreposição linear de estados puros |Ψi = λ1 |Ψ1 i + λ2 |Ψ2 i , (4.5.9) que é ainda um estado puro, tem um significado fı́sico diferente de uma mistura estatı́stica de |λ1 |2 sistemas no estado |Ψ1 i com |λ2 |2 sistemas no estado |Ψ2 i, que é um estado mistura. • Na mecânica quântica estatı́stica existem dois nı́veis diferentes onde entra a probabilidade: i) no facto de a informação sobre o estado inicial ser probabilı́stica - semelhante à mecânica clássica estatı́stica; ii) no facto da previsão de resultados de medições ser probabilı́stica - puramente quântico. Vamos agora introduzir um operador, denominado operador de densidade que unifica a descrição de estados puros e estados mistura. 4.5 Mecânica Quântica Estatı́stica 4.5.1 133 O operador de densidade para um estado puro Assumimos que temos um espaço de estados com uma base discreta, {|un i}, de modo que um estado puro normalizado se escreve X |Ψ(t)i = cn (t)|un i , n X n |cn (t)|2 = 1 . (4.5.10) Introduzimos agora um operador construı́do com base no estado do sistema e que contem a mesma informação que este: o operador densidade definido por ρ̂(t) ≡ |Ψ(t)ihΨ(t)| . (4.5.11) Note-se que este operador depende do tempo. Consideremos algumas propriedades de ρ̂(t): • Na base {|un i}, o operador de densidade é representado pela matriz de densidade: ρmn (t) = hum |ρ̂(t)|un i = hum |Ψ(t)ihΨ(t)|uni = cm (t)c∗n (t) . (4.5.12) • A condição de normalização do estado quântico em termos do operador de densidade fica 1 = hΨ(t)|Ψ(t)i = ou seja X n |cn |2 = X ρnn (t) = Tr(ρ̂(t)) , (4.5.13) n Tr(ρ̂(t)) = 1 . • O valor médio de uma observável é hÂi(t) = hΨ(t)|Â|Ψ(t)i = = X n,p ou seja cp (t)c∗n (t)Anp X n,p = hΨ(t)|un ihun |Â|up ihup |Ψ(t)i X (4.5.14) , (4.5.15) Anp ρpn (t) = Tr(Âρ̂(t)) n,p hÂi(t) = Tr(Âρ̂(t)) = Tr(ρ̂(t)Â) . • A evolução do operador de densidade é deduzida da equação de Schrödinger (4.5.16) 1 d d 1 d ρ̂(t) = (|Ψ(t)i) hΨ(t)| + |Ψ(t)i (hΨ(t)|) = Ĥ|Ψ(t)ihΨ(t)| − |Ψ(t)ihΨ(t)|Ĥ dt dt dt i~ i~ i 1 h Ĥ, ρ(t) . = i~ (4.5.17) 134 Formalismo Matemático e Postulados da Mecânica Quântica • A probabilidade de obter o valor próprio associado ao estado |un i, an , numa medição é: P(an ) = hΨ(t)|un ihun |Ψ(t)i = hΨ(t)|P̂n |Ψ(t)i = Tr(ρ̂(t)P̂n ) , (4.5.18) onde P̂n = |un ihun | é o operador de projecção (4.3.7). • Pela definição ρ̂(t) é hermı́tico ρ̂(t) = ρ̂(t)† . (4.5.19) • ρ̂(t) é um operador de projecção ρ̂(t)2 = |Ψ(t)ihΨ(t)|Ψ(t)ihΨ(t)| = |Ψ(t)ihΨ(t)| = ρ̂(t) . • Logo (4.5.20) Tr(ρ̂(t)2 ) = Tr(ρ̂(t)) = 1 . (4.5.21) Esta propriedade e a anterior só são válidas para um estado puro. Veremos que não se verificam para uma mistura estatı́stica de estados e por isso podem funcionar para testar se uma determinada matriz de densidade descreve um estado puro ou um estado mistura. Assim, para um estado puro, especificar o operador de densidade ou o próprio estado é equivalente. 4.5.2 O operador de densidade para uma mistura estatı́stica de estados Consideremos agora uma mistura estatı́stica de estados ( ) X i i |Ψ i = cn (t)|un i com probabilidades n Definimos o operador de densidade como X X ρ̂(t) ≡ pi |Ψi (t)ihΨi (t)| ≡ pi ρ̂i (t) . i i p . (4.5.22) (4.5.23) i Claramente (4.5.11) é o caso particular correspondente a p1 = 1 e pi = 0 quando i 6= 1, ou seja um estado puro. Reconsideremos agora as propriedades do operador de densidade vistas anteriormente: 4.5 Mecânica Quântica Estatı́stica 135 • Na base {|un i}, o operador de densidade é representado pela matriz de densidade, que agora toma a forma: ρmn (t) = hum|ρ̂(t)|un i = hum| X i pi |Ψi (t)ihΨi (t)|un i = X pi ρimn (t) = i X pi cim (t)cin (t)∗ . i (4.5.24) Note-se que para n = m ρnn (t) = X i pi |cin (t)|2 , (4.5.25) que é um número real positivo que nos dá a probabilidade de encontrarmos numa medição o sistema no estado |un i, como demonstrará a relação (4.5.30). Assim, os termos da diagonal da matriz de densidade designam-se por populações. Para n 6= m, ρnm é um número complexo. Representa uma média (para todos os estados |Ψi i) de termos de interferência entre |uin i e |uim i. Estes termos são designados por coerências. • A condição de normalização dos vários estados quânticos na mistura fica, em termos do operador de densidade 1 = hΨi (t)|Ψi (t)i = X n |cin |2 = X ρinn (t) = Tr(ρ̂i (t)) ; (4.5.26) n logo 1= X pi = i X pi Tr(ρ̂i (t)) = Tr(ρ̂(t)) . (4.5.27) i Ou seja temos ainda a condição (4.5.14). • O valor médio de uma observável é hÂi(t) = X n an X i i i p P (an ) ! = X i pi X n an P i (an ) = = Tr(ρ̂(t)Â) , X pi Tr(ρ̂i (t)Â) i (4.5.28) que é ainda o mesmo resultado do caso puro (4.5.16). • A evolução do operador de densidade é ainda dada pela equação do caso puro i d 1 h Ĥ, ρ(t) . (4.5.29) ρ̂(t) = dt i~ 136 Formalismo Matemático e Postulados da Mecânica Quântica • A probabilidade de obter o valor próprio associado ao estado |un i, an , numa medição é: P(an ) = X i pi P i (an ) = X pi Tr(ρ̂i (t)P̂n ) = Tr(ρ̂(t)P̂n ) , (4.5.30) i recuperando o resultado do estado puro. • Obviamente ρ̂(t) é ainda hermı́tico • Em geral ρ̂(t) não é um operador de projecção: ρ̂(t)2 = X i,j pi pj |Ψi(t)ihΨi (t)|Ψj (t)ihΨj (t)| = 6 ρ̂(t) . (4.5.31) • Assim sendo calculemos o traço do quadrado de ρ̂(t): Tr(ρ̂(t)2 ) = X n,m = X pi pj i,j X hun |ρ̂(t)|um ihum|ρ̂(t)|un i = cjn (t)∗ cin (t) X cim (t)∗ cjm (t) = X m n ≤ X pp = i,j X i p i X cin (t)cim (t)∗ cjm (t)cjn (t)∗ n,m i,j X i,j i j pi pj pi pj hΨj (t)|Ψi (t)ihΨi (t)|Ψj (t)i X pj = 1 , j (4.5.32) onde usamos a desigualdade de Schwarz |hΨi (t)|Ψj (t)i| ≤ p hΨi (t)|Ψi (t)ihΨj (t)|Ψj (t)i = 1 . (4.5.33) Deste modo Tr(ρ̂(t)2 ) ≤ 1 , (4.5.34) sendo a desigualdade saturada apenas para um estado puro. Vemos, tal como anunciado, que esta propriedade e a anterior distinguem a matriz de densidade de um estado puro e de um estado mistura. • Notemos ainda que o operador densidade é definido positivo; para um ket arbitrário |Φi hΦ|ρ̂(t)|Φi = X i pi hΦ|Ψi (t)ihΨi(t)|Φi = X i pi |hΦ|Ψi (t)i|2 ≥ 0 . (4.5.35) 4.5 Mecânica Quântica Estatı́stica 4.5.3 137 O operador de evolução e a evolução de um estado puro Devido à linearidade e homogeneidade da equação de Schrödinger, existe um operador linear, denominado operador de evolução que relaciona o estado inicial de um sistema |Ψ(t0 )i com o estado do sistema num instante posterior |Ψ(t)i, através de |Ψ(t)i = Û (t, t0 )|Ψ(t0 )i . (4.5.36) Û (t0 , t0 ) = 1̂ . (4.5.37) Obviamente Substituindo na equação de Schrödinger i~ d|Ψ(t)i = Ĥ(t)|Ψ(t)i ⇔ dt dÛ(t0 , t) i |Ψ(t0 )i = − Ĥ(t)Û (t0 , t)|Ψ(t0 )i . dt ~ (4.5.38) Em geral, usando a condição inicial (4.5.37), podemos escrever formalmente a solução desta equação como i Û (t, t0 ) = 1̂ − ~ Z t Ĥ(t′ )Û (t′ , t0 )dt′ . (4.5.39) t0 No caso particular de um Hamiltoniano não depender do tempo (sistemas conservativos) a solução explı́cita fica Û(t, t0 ) = e−i(t−t0 )Ĥ/~ . (4.5.40) Uma importante propriedade da evolução de um sistema quântico é a conservação da norma ou equivalentemente, a conservação da probabilidade. Logo requeremos que hΨ(t0 )|Ψ(t0 )i = hΨ(t)|Ψ(t)i ⇔ hΨ(t0 )|Ψ(t0 )i = hΨ(t0 )|Û(t0 , t)† Û (t0 , t)|Ψ(t0 )i , (4.5.41) ou seja Û (t0 , t)† Û (t0 , t) = 1̂ , (4.5.42) o operador de evolução deve ser unitário. Note-se que no caso de sistemas conservativos, onde Û tem a forma (4.5.40) isso é garantido se o Hamiltoniano for Hermı́tico. Unitariedade é uma importante propriedade em teorias quânticas. De um modo mais geral significa que as probabilidades estão bem definidas e são conservadas. Tecnicamente, significa que o 138 Formalismo Matemático e Postulados da Mecânica Quântica espaço de Hilbert é positivo definido (não há normas negativas) e o operador de evolução é unitário. Consideremos agora a evolução de um estado puro. A matriz de densidade pode-se escrever ρ̂(t) = |Ψ(t)ihΨ(t)| = Û (t0 , t)|Ψ(t0 )ihΨ(t0 )|Û (t0 , t)† = Û(t0 , t)ρ̂(t0 )Û(t0 , t)† . (4.5.43) Logo, Tr(ρ̂(t)2 ) = Tr(Û(t0 , t)ρ̂(t0 )Û(t0 , t)† Û (t0 , t)ρ̂(t0 )Û (t0 , t)† ) , (4.5.44) ou, usando a unitariedade do operador de evolução e a propriedade cı́clica do traço, Tr(ρ̂(t)2 ) = Tr(ρ̂(t0 )2 ) = 1 , (4.5.45) pela relação (4.5.21). Assim, num sistema quântico unitário um estado puro evolui sempre para um estado puro. Na década de 1970, Stephen Hawking mostrou que existe um processo quântico pelo qual os buracos negros, que classicamente só absorvem, emitem radiação, denominada radiação de Hawking. Esta radiação parecia ser, na aproximação usada por Hawking, térmica, e como tal um estado mistura. Extrapolando o processo de Hawking até o buraco negro desaparecer completamente devido à emissão de radiação, parece que o resultado final seria a existência de apenas radiação térmica e como tal um estado mistura. Por outro lado, o buraco negro poderia ter sido formado pelo colapso gravitacional de estados puros. Hawking concluiu que, em gravitação quântica, a evolução não poderia ser unitária, pois estados puros poderiam evoluir para estados mistura. Esta aparente contradição entre gravitação quântica e um princı́pio fundamental da teoria quântica foi baptizado de ‘paradoxo da informação’. Embora o problema não esteja completamente resolvido, acredita-se hoje, que a unitariedade é também válida em gravitação quântica e a aproximação usada por Hawking não estava correcta. 4.6 Sumário 4.6 139 Sumário Estabelecemos a linguagem da mecânica quântica que é uma linguagem de estados e operadores cuja representação abstracta se faz na notação de Dirac. Em muitos problemas concretos escolhem-se bases discretas para os representar como vectores e matrizes respectivamente. Daı́ a designação deste formalismo por mecânica matricial de Heisenberg. Este formalismo é muito apropriado para lidar com graus de liberdade abstractos que vivem em espaços vectoriais internos, como o spin ou a polarização de fotões como será visto em Mecânica Quântica II. Numa ‘base’ contı́nua como a representação |xi o estado do sistema |Ψ(t)i tem como componentes a função de onda do capı́tulo 3, Ψ(~x, t). Assim o formalismo geral faz o contacto com a mecânica ondulatória de Schrödinger do capı́tulo 3, que como vimos é intuitiva dado usar a bem conhecida fı́sica das ondas. Estabelecemos um conjunto de postulados que podem ser vistos como as regras básicas do formalismo quântico e aprendemos a usar essas regras num sistema clássico através da quantificação deste. Em particular discutimos que a representação matemática do princı́pio da incerteza de Heisenberg no formalismo de operadores aparece na forma de operadores que não comutam. Notamos também que os valores médios das grandezas fı́sicas num sistema quântico se comportam como as grandezas clássicas do capı́tulo 1 estabelecendo um princı́pio de correspondência entre a mecânica quântica e a sua aproximação clássica. Discutimos mecânica quântica estatı́stica em que o estado do sistema só é conhecido probabilisticamente. Isto levou-nos a distinguir estados puros e estados mistura, mas pela introdução da matriz de densidade podem ambos os tipos ser tratados de um modo unificado. Finalmente vimos que uma evolução unitária não pode transformar um estado puro num estado mistura. CAPÍTULO 5 Exemplos de Quantificação Canónica Neste capı́tulo vamos voltar ao problema do oscilador harmónico e ao problema de Larmor tratados no capı́tulo 1, usando as regras do capı́tulo 4 para os tratar como problemas quânticos. 5.1 Oscilador Harmónico Quântico em Uma Dimensão Na secção 4.4.3 vimos a forma do operador Hamiltoniano para um sistema com Hamiltoniano clássico dado por H = Ecin + Epot . Especializando para o potencial do oscilador harmónico, obtemos o operador Hamiltoniano Ĥ = P̂ 2 mω 2 2 X̂ , + 2m 2 (5.1.1) e, usando as regras de quantificação canónica impomos as relações de comutação h i X̂, P̂ = i~1̂ . (5.1.2) Dada a forma do potencial (figura 1.3) naturalmente teremos estados ligados, pelo que esperamos que o conjunto de estados seja discreto, correspondendo ao facto de as energias possı́veis estarem quantificadas. O nosso objectivo é encontrar os valores próprios En e 142 Exemplos de Quantificação Canónica funções próprias |ni da equação de Schrödinger independente do tempo Ĥ|ni = En |ni . (5.1.3) Introduzimos os operadores â e o seu adjunto â† (note-se que não são operadores hermı́ticos) r r i 1 i mω mω 1 † X̂ + √ X̂ − √ P̂ , â = √ P̂ , (5.1.4) â = √ ~ ~ 2 2 mω~ mω~ que são designados, respectivamente, por operador de destruição e operador de criação. Calculando o seu produto obtemos i 1 mω 2 1 ih † 2 â â = X̂ + P̂ + X̂, P̂ 2 ~ mω~ ~ ⇔ â† â = 1̂ 1 Ĥ − , ~ω 2 (5.1.5) ou, equivalentemente 1̂ Ĥ = ~ω N̂ + 2 ! . (5.1.6) onde definimos o operador de número N̂ ≡ â† â, que é hermı́tico, o que é consistente com o facto de o Hamiltoniano também o ser. Note-se que a tradução para os operadores â e â† da relação de comutação é 1 [â, â ] = −i[X̂, P̂ ] + i[P̂ , X̂] , 2~ (5.1.7) [â, â† ] = 1̂ . (5.1.8) † ou seja Calculemos também os comutadores entre o operador de número N̂ e os operadores de criação e destruição: 5.1.1 [N̂ , â] = [â† â, â] = [â† , â]â + â† [â, â] = −â , (5.1.9) [N̂ , â† ] = [â† â, â† ] = [â† , â† ]â + â† [â, â† ] = â† . (5.1.10) O espectro de energia do Oscilador Harmónico Quântico As grandezas fı́sicas que associamos ao oscilador harmónico são a posição, momento e energia. Como os seus operadores associados X̂, P̂ , Ĥ não comutam, o C.C.O.C. contem 5.1 Oscilador Harmónico Quântico em Uma Dimensão 143 apenas uma destas quantidades, que escolhemos ser a energia, ou, equivalentemente, o operador de número N̂ C.C.O.C. = {N̂} . (5.1.11) Assim, vamos escrever o estado do sistema usando como base os vectores próprios do operador de número, denotados por |ni, cujos valores próprios irão ser números inteiros que servem de rótulo para os vectores próprios. Os vectores do conjunto {|ni} são necessariamente ortogonais, mas para já nada assumiremos acerca da sua normalização. A energia do estado próprio |ni é dada por (5.1.3), o que implica que hn|Ĥ|ni = ~ω En = hn|ni hn|â† â|ni 1 + hn|ni 2 = ~ω ||â|ni||2 1 + hn|ni 2 ≥ ~ω . 2 (5.1.12) Assim, existe um estado de energia mı́nima para o oscilador harmónico, dito o estado fundamental ou “vácuo”, que vamos rotular com n = 0 e definido por â|0i = 0 ⇒ E0 = ~ω . 2 (5.1.13) Desde já notamos uma diferença fundamental com a mecânica clássica: o estado fundamental não tem energia zero - como em mecânica clássica - mas antes E0 = ~ω/2, designada energia do ponto zero. Este facto está intrinsecamente ligado ao princı́pio da incerteza; uma energia nula do estado fundamental implicaria uma partı́cula congelada em x = 0 = p; mas pelo princı́pio da incerteza isso não pode acontecer. De facto, podemos encontrar o valor (5.1.13) minimizando a expressão clássica da energia com a condição de que xp = ~/2: E(x, p) = p2 mω 2 2 + x 2m 2 xp=~/2 ⇔ E(x) = ~2 mω 2 2 + x , 8mx2 2 (5.1.14) que extremizando 0= dE ~2 =− + mω 2 x dx 4mx3 ⇔ x2 = ~ , 2mω (5.1.15) valor para o qual a energia do oscilador harmónico é E = ~ω/2. Existe evidência experimental para a existência da energia do ponto zero e até mesmo uma manifestação macroscópica:o efeito Casimir em teoria quântica de campo. 144 Exemplos de Quantificação Canónica A acção do operador de destruição no estado fundamental aniquila-o. Logo, o estado fundamental é um vector próprio de N̂ com valor próprio zero. Consideremos agora o estado obtido pela acção no estado fundamental do operador de criação, â† |0i. Actuando com N̂ N̂ â† |0i = [N̂ , â† ] + â† N̂ |0i = â† + â† N̂ |0i = â† |0i , (5.1.16) |1i ≡ â† |0i . (5.1.17) N̂ â† |1i = â† + â† N̂ |1i = 2â† |1i , (5.1.18) ou seja, â† |0i é um estado próprio de N̂ com valor próprio 1; assim, denotamos Analogamente ou seja, â† |1i ≡ |2i é vector próprio de N̂ com valor próprio 2. O padrão que descobrimos pode ser agora sistematizado: Teorema: Seja |ni um vector próprio de N̂ com valor próprio n ∈ N0 . Logo i) |ni tem energia 1 En = ~ω n + 2 ; (5.1.19) ii) â† |ni ≡ |n + 1i é um vector próprio de N̂ com valor próprio n + 1; iii) â|ni = n|n − 1i é vector próprio de N̂ com valor próprio n − 1 (note-se a consistência com â|0i = 0). Demonstração: i) A energia é o valor próprio de Ĥ. Logo 1̂ Ĥ|ni = ~ω N̂ + 2 ! 1 |ni = ~ω n + |ni , 2 (5.1.20) de onde concluimos que a energia do estado |ni é dada por (5.1.19). Este é o espectro de energia do oscilador harmónico, que como esperado exibe quantificação de energia - figura 5.1; 5.1 Oscilador Harmónico Quântico em Uma Dimensão 145 E V(x) 5~ω/2 3~ω/2 ~ω/2 x Figura 5.1: Nı́veis de energia permitidos para o oscilador harmónico quântico, marcados pelas linhas horizontais, correspondentes à relação (5.1.19). ii) † N̂ |n+1i = N̂ â |ni (5.1.10) = † â 1̂ + N̂ |ni = (n+1)â† |ni = (n+1)|n+1i , (5.1.21) o que mostra que |n + 1i é um vector próprio de N̂ com valor próprio n + 1; iii) nN̂ |n−1i = N̂ â|ni (5.1.9) = â N̂ − 1̂ |ni = (n−1)â|ni = n(n−1)|n−1i , (5.1.22) o que mostra que |n − 1i é um vector próprio de N̂ com valor próprio n − 1. (q.e.d.) Note-se que no ponto iii), o factor de n tem que aparecer por consistência; de facto |ni = â† |n − 1i ⇒ â|ni = ââ† |n − 1i = (N̂ + 1̂)|n − 1i = n|n − 1i . (5.1.23) Deste modo compreendemos a terminologia que introduzimos: o operador de Número dá-nos o número de quantões de energia no estado que estamos a considerar; o operador de criação/destruição transformam um dado estado num outro com mais/menos um quantão de energia. Finalmente discutamos a normalização dos estados {|ni}. Vamos assumir que |0i está normalizado, h0|0i = 1. Logo h1|1i = h0|ââ† |0i = h0|1̂ + N̂|0i = 1 , (5.1.24) o que mostra que |1i também está normalizado, mas h2|2i = h1|ââ† |1i = h1|1̂ + N̂|1i = 2 , (5.1.25) 146 Exemplos de Quantificação Canónica que já não está normalizado. Mostremos por indução matemática que hn|ni = n! : (5.1.26) Acabamos de mostrar que este resultado é verdade para n = 1. Assumindo (5.1.26) consideramos hn + 1|n + 1i = hn|ââ† |ni = hn|1̂ + N̂ |ni = (n + 1)hn|ni = (n + 1)! , (5.1.27) o que prova a tese. Assim introduzimos a base ortonormalizada no espaço de estados {|Φn i} definidos como |ni |Φn i ≡ √ , n! (5.1.28) hΦn |Φm i = δnm . (5.1.29) e obedecendo a Notemos que, em termos destes estados normalizados, â† |ni = |n + 1i â† |Φn i = ⇔ √ n + 1|Φn+1 i , (5.1.30) √ (5.1.31) e de um modo semelhante â|ni = n|n − 1i 5.1.2 ⇔ â|Φn i = n|Φn−1 i . As funções de onda para o oscilador harmónico O grau de liberdade primordial do oscilador harmónico é a sua posição espacial. Logo, estamos interessados em conhecer as funções de onda no espaço de configurações, Φn (x), que estão associadas aos estados normalizados |Φn i. Estas funções de onda dizem-nos, como habitualmente, a amplitude de probabilidade espacial para encontrar a partı́cula quântica que se encontra nesse estado |Φn i. A conversão de |Φn i para Φn (x) faz-se usando a representação |xi da secção 4.4.2; Φn (x) são vistos como as componentes da expansão da função de onda nesta base: |Φn i = Z dxΦn (x)|xi . (5.1.32) 5.1 Oscilador Harmónico Quântico em Uma Dimensão 147 Vamos agora construir explicitamente essas funções de onda. Começamos pelo vácuo, que é definido por â|0i = 0 ⇔ â|Φ0 i = 0 ⇔ 1 √ 2 r mω i P̂ X̂ + √ ~ mω~ |Φ0 i = 0 . (5.1.33) Usando a representação |xi, isto é projectando esta equação num bra hx|: r r d mω i mω ~ (4.4.24),(4.4.25) hx|P̂ |Φ0 i = 0 ⇔ hx|X̂|Φ0 i+ √ xhx|Φ0 i+ √ hx|Φ0 i = 0 , ~ ~ mω~ mω~ dx (5.1.34) ou, finalmente, usando a tabela da secção 4.4.2 e a expansão (5.1.32) temos hx|Φ0 i = Φ0 (x) e como tal d mω + x Φ0 (x) = 0 . dx ~ (5.1.35) A solução desta equação diferencial de primeira ordem é mω 2 Φ0 (x) = C0 e− 2~ x , (5.1.36) onde tomamos a constante de integração como mω 1/4 C0 = , π~ (5.1.37) de modo que a função de onda Φ0 (x) esteja normalizada, pois o estado |Φ0 i está normalizado. Note-se que a solução normalizada é única e por isso o estado fundamental é não degenerado. Na prática, (5.1.35) resultou de (5.1.33) pelas substituições d (X̂, P̂ , |Φn i) −→ x, −i~ , Φn (x) , dx (5.1.38) com n = 0. Com isto em mente construimos as funções de onda para os próximos estados do seguinte modo: √ † n + 1|Φn+1 i = â |Φn i ⇔ √ 1 n + 1|Φn+1 i = √ 2 r ou, usando a nossa substituição (5.1.38) s mω d ~ Φn+1 (x) = Φn (x) , x− 2mω(n + 1) ~ dx mω i P̂ X̂ − √ ~ mω~ n ∈ N0 . |Φn i , (5.1.39) (5.1.40) 148 Exemplos de Quantificação Canónica Deste modo, obtemos para Φ1 (x) r 2mω − mω x2 xe 2~ , ~ (5.1.41) mω 2 2mω 2 x − 1 e− 2~ x . ~ (5.1.42) Φ1 (x) = C0 e para Φ2 (x) C0 Φ2 (x) = √ 2 É agora fácil de concluir que todas as funções de onda são do tipo r mω −χ2 /2 x, Φn (χ) = Cn Hn (χ)e , χ≡ ~ (5.1.43) onde Cn é uma constante e Hn é um polinómio de grau n e com paridade bem definida (−1)n (1=par, −1=ı́mpar). Usando esta forma para a função de onda em (5.1.40) obtemos d 1 2 −χ2 /2 χ− (5.1.44) Cn Hn (χ)e−χ /2 , Cn+1 Hn+1 (χ)e =p dχ 2(n + 1) que é obedecido escolhendo Cn Cn+1 = p , 2(n + 1) Hn+1 (χ) = 2χHn (χ) − d Hn (χ) . dχ (5.1.45) A fórmula de recorrência para os polinómios define os polinómios de Hermite. Os quatro primeiros são H0 = 1 , H1 = 2χ , H2 = 4χ2 − 2 , H3 = 8χ3 − 12χ . (5.1.46) Resumimos a situação respeitante aos primeiros estados estacionários (dado que o estado Φn tem energia constante) do oscilador harmónico na seguinte tabela: Estado Normalizado Componentes na representação |xi Paridade 2 /2 |Φ0 i = |0i Φ0 (χ) = C0 e−χ |Φ1 i = |1i √ |Φ2 i = |2i/ 2 √ |Φ3 i = |3i/ 3! Φ1 (χ) = C1 (2χ)e−χ ... 2 /2 Φ2 (χ) = C2 (4χ2 − 2)e−χ 2 /2 Φ3 (χ) = C3 (8χ3 − 12χ)e−χ ... 2 /2 Energia Par ~ω/2 Ímpar 3~ω/2 Par 5~ω/2 Ímpar 7~ω/2 ... ... 5.1 Oscilador Harmónico Quântico em Uma Dimensão 149 Figura 5.2: Funções de onda para n = 0, 1, 2 e n = 10 do oscilador Harmónico e as respectivas densidades de probabilidade. Na notação da figura Φn = ϕn . (Extraı́do de Cohen et al, ‘Quantum Mechanics’). Note-se que para cada nı́vel de energia a função de onda (normalizada) é única, pelo que o espectro é não degenerado. Na figura 5.2 representamos as funções de onda para os nı́veis n = 0, 1, 2 e n = 10. Concluimos com o comentário de que se pode mostrar matematicamente que as funções {Φn (x)} formam uma base do espaço de funções sobre R, que é necessário para que N̂ e Ĥ seja observáveis. 5.1.3 Resolução directa da equação de Schrödinger À semelhança do que fizemos no capı́tulo 3, podı́amos ter procurado os estados estacionários resolvendo directamente a equação de Schrödinger. Tomando a função de onda Ψ(x, t) = Φ(x)e−iEt/~ , (5.1.47) 150 Exemplos de Quantificação Canónica obtinhamos a equação para a função de onda espacial (3.2.5) especializada para o potencial do oscilador harmónico mω 2 2 ~2 d 2 + x Φ(x) = EΦ(x) . − 2m dx2 2 (5.1.48) Como da nossa análise da secção anterior já sabemos a resposta, usamos como ansatz a forma mω 2 Φ(x) = f (x)e− 2~ x , (5.1.49) de modo a que (5.1.48) toma a forma 2mω ′ 2m f (x) − xf (x) + 2 ~ ~ ′′ ~ω E− 2 f (x) = 0 . (5.1.50) Procuremos uma solução como uma série de potências: f (x) = ∞ X n an x n=0 ⇒ ′ f (x) = ∞ X n−1 nan x ⇒ n=0 ′′ f (x) = ∞ X n=0 n(n − 1)an xn−2 , (5.1.51) de modo que a equação diferencial para f (x) fica ∞ X 1 2m an xn = 0 . (n + 2)(n + 1)an+2 + 2 E − ~ω n + ~ 2 n=0 (5.1.52) Para a equação ser obedecida para todo o x todos os termos na série têm de ser zero; obtemos portanto a relação de recorrência (n + 2)(n + 1)an+2 2m = 2 ~ 1 − E an . ~ω n + 2 (5.1.53) Para compararmos com a análise da secção anterior é conveniente usar a variável χ introduzida em (5.1.43). Em termos desta variável f (x) = ∞ X n=0 n an x → f (χ) = ∞ X n bn χ , n=0 com bn = ~ mω n/2 an . (5.1.54) A relação de recorrência fica (n + 2)(n + 1)bn+2 2E bn . = 2n + 1 − ~ω (5.1.55) 5.1 Oscilador Harmónico Quântico em Uma Dimensão 151 Vamos assumir que a série é finita; voltaremos a este ponto mais em baixo. Para a série ser finita é necessário que o coeficiente do bn se torne zero para algum n; isto restringe os valores possı́veis para a energia; existe um n0 ∈ N0 para o qual 2E = 2n0 + 1 , ~ω (5.1.56) o que não é mais do que o nosso espectro de energias. Obtemos assim a quantificação da energia, usando directamente a equação de Schrödinger ~ω 3~ω 5~ω 7~ω , , , , . . . , para n0 = (0, 1, 2, . . .) . En0 = 2 2 2 2 (5.1.57) Deste modo a relação de recorrência para o polinómio fn0 (χ) fica (n + 2)(n + 1)bn+2 = 2(n − n0 )bn . (5.1.58) Como a relação de recorrência relaciona termos de ordem par ou termos de ordem ı́mpar, para a série ser finita, temos de tomar unicamente os termos com a paridade de n0 . Assim temos • Para n0 = 0 a série só tem o termo b0 cujo valor é arbitrário; tomamos b0 = 1; o polinómio correspondente é f0 (χ) = 1 ; (5.1.59) • Para n0 = 1 a série só tem o termo b1 cujo valor é arbitrário; tomamos b1 = 2; o polinómio correspondente é f1 (χ) = 2χ ; (5.1.60) • Para n0 = 2 a série tem o termo b0 = 1 e b2 = −2; o polinómio correspondente é f2 (χ) = 1 − 2χ2 ; (5.1.61) • Para n0 = 3 a série tem o termo b1 = 2 e b3 = −4/3; o polinómio correspondente é 4 f3 (χ) = 2χ − χ3 ; 3 (5.1.62) 152 Exemplos de Quantificação Canónica etc. Claro que estes polinómios são todos proporcionais aos polinómios de Hermite, fn0 (χ) ∝ Hn0 (χ). De facto, a série (5.1.58) define o polinómio de Hermite Hn0 . Obtemos deste modo tanto o espectro de energias como as funções de onda da secção anterior. Falta-nos justificar a hipótese fundamental de que a série (5.1.53) tem de ser finita. Esta condição surge de requerer que a função de onda seja normalizável. De facto, as funções de onda tomam a forma  ∞ X n an x   n=0 Ψ(x, t) = e−iEt/~   mω x2  e 2~ Podemos escrever mωx2 /(2~) e = ∞ X cn xn , com c2n = n=0     .   mω n 1 , 2~ n! (5.1.63) (5.1.64) e como tal c2n+2 mω 1 = c2n 2~ n + 1 n→∞ ≃ mω , 2~n (5.1.65) enquanto que por (5.1.53) an+2 an n→∞ ≃ 2mω . ~n (5.1.66) mω . ~n (5.1.67) Assim, se tomarmos a parte par da série dos an , a2n+2 a2n n→∞ ≃ Concluimos que para n suficientemente grande a2n+2 c2n+2 > , a2n c2n (5.1.68) pelo que a divisão das duas séries não poderá tender para zero quando |x| → ∞ e como tal o módulo da função de onda (5.1.63) não irá tender para zero o que implica que a função de onda não será normalizável. Se a série dos an tiver apenas parte ı́mpar podemos ainda majorar a série dos cn extraindo portanto a mesma conclusão relativa à normalização da função de onda. 5.1 Oscilador Harmónico Quântico em Uma Dimensão 5.1.4 153 Valor médio e desvio padrão de x e p Usando (5.1.4) expressamos os operadores posição e momento X̂ e P̂ em termos dos operadores de criação e destruição: r ~ X̂ = â† + â , 2mω r P̂ = i mω~ † â − â . 2 (5.1.69) Note-se a hermiticidade de P̂ e X̂. Logo, a acção destes operadores num estado estacionário é r √ ~ √ n + 1|Φn+1 i + n|Φn−1 i , 2mω r √ mω~ √ n + 1|Φn+1 i − n|Φn−1 i , P̂ |Φn i = i 2 X̂|Φn i = (5.1.70) (5.1.71) e como tal obtemos os elementos de matriz hX̂i = hΦn |X̂|Φn i = 0 = hΦn |P̂ |Φn i = hP̂ i . (5.1.72) Assim concluimos que o valor médio da posição e do momento são zero em qualquer estado estacionário. O desvio padrão é calculado pela expressão (4.4.8): 1 n+ , 2 (5.1.73) mω~ 1 2 2 2 2 † 2 † † (∆p) = hP̂ i = hΦn |P̂ |Φn i = − , hΦn |â + (â ) − ââ − â â|Φn i = mω~ n + 2 2 (5.1.74) ~ ~ hΦn |â2 + (â† )2 + ââ† + â† â|Φn i = (∆x) = hX̂ i = hΦn |X̂ |Φn i = 2mω mω 2 2 2 onde a contribuição não trivial vem dos termos ââ† e â† â usando (5.1.30) e (5.1.31). Logo ~ 1 ∆x∆p = ~ n + ≥ , (5.1.75) 2 2 em concordância com o princı́pio de incerteza. Os estados estacionários |Ψn i não têm equivalente clássico, dado que têm valores médios zero para momento e posição e ao mesmo tempo energia diferente de zero. Pelo teorema de Ehrenfest os valores médios hX̂i e hP̂ i correspondem às variáveis clássicas e a única situção em que um oscilador harmónico clássico tem x(t) = 0 = p(t) é quando tem energia nula. Contudo, sobrepondo estados estacionários podemos construir estados cuja média se comporta como um oscilador clássico. 154 Exemplos de Quantificação Canónica Seja o estado inicial dado pela sobreposição |Ψ(0)i = No instante t, |Ψ(t)i = ∞ X n=0 ∞ X n=0 cn (0)|Φn i . cn (0)e−iEn t/~|Φn i = ∞ X n=0 (5.1.76) cn (0)e−iω(n+1/2)t |Φn i . (5.1.77) Logo obtemos para o valor médio de X̂, hX̂i(t) = hΨ(t)|X̂|Ψ(t)i, r ∞ ∞ √ √ ~ XX ∗ iω(m−n)t hΦm |cm (0)cn (0)e n + 1|Φn+1 i + n|Φn−1 i , hX̂i(t) = 2mω n=0 m=0 r ∞ ∞ √ √ ~ XX ∗ n + 1δm,n+1 + nδm,n−1 , = cm (0)cn (0)eiω(m−n)t 2mω n=0 m=0 ! " ∞ # ! r ∞ X X √ √ ~ n + 1cn (0)c∗n+1 (0) eiωt + ncn (0)c∗n−1 (0) e−iωt . = 2mω n=0 n=0 (5.1.78) Note-se que se apenas um dos cn (0) for não nulo então obtemos imediatamente hX̂i(t) = 0, tal como discutido anteriormente. Se definirmos ∞ X √ n + 1cn (0)c∗n+1 (0) , z≡ (5.1.79) n=0 então ∗ z = ∞ X √ n+ 1c∗n (0)cn+1 (0) m≡n+1 = ∞ X √ m=1 n=0 mc∗m−1 (0)cm (0) = ∞ X √ mcm (0)c∗m−1 (0) , m=0 (5.1.80) reescrevemos (5.1.78) como r ~ zeiωt + z ∗ e−iωt , (5.1.81) 2mω p ou, expressando o número complexo z = mω/(2~)Aeiφ0 , onde A e φ0 são números reais, hX̂i(t) = temos ei(ωt+φ0 ) + e−i(ωt+φ0 ) = A cos(ωt + φ0 ) . (5.1.82) hX̂i(t) = A 2 Assim, o valor médio de uma sobreposição de estados estacionários do oscilador harmónico quântico evolui de acordo com a teoria do oscilador clássico (1.1.6), em concordância com o teorema da correspondência de Ehrenfest. 5.2 O Oscilador Harmónico Quântico em Duas Dimensões 5.2 155 O Oscilador Harmónico Quântico em Duas Dimensões O Hamiltoniano clássico para um oscilador harmónico isotrópico em duas dimensões é Hxy = p2x + p2y µω 2 2 + (x + y 2 ) . 2µ 2 (5.2.1) A partir de agora designamos por ‘µ’ a massa da partı́cula. As trajectórias que resolvem o problema clássico são   x(t) = xM cos(ωt − φx ) , (5.2.2)  y(t) = y cos(ωt − φ ) M y onde xM , yM , φx , φy são constantes de integração. O movimento geral é elı́ptico, dependendo dos detalhes da diferença de fase φy − φx : φy − φx = −π movimento linear na direcção x = −y 0 > φy − φx > −π movimento retrógrado na elipse φy − φx = 0 movimento linear na direcção x = y π > φy − φx > 0 movimento directo na elipse φy − φx = +π movimento linear na direcção x = −y Por quantificação canónica introduzimos o operador Hamiltoniano i P̂ 2 + P̂22 µω 2 h 1 2 Ĥxy = 1 (X̂ ) + (X̂ 2 )2 , + 2µ 2 (5.2.3) onde X̂ 1 e X̂ 2 são as observáveis associadas às grandezas fı́sicas x e y sendo P̂1 e P̂2 os seus momentos canónicos conjugados. As relações canónicas de comutação são [X̂ k , P̂j ] = i~δjk . 5.2.1 (5.2.4) Quantões lineares Claramente, temos duas cópias de tudo o que fizemos na secção 5.1. Definindo os operadores de criação â†1 , â†2 e destruição como â1 , â2 r r µω j µω j 1 i 1 i † âj = √ X̂ + √ P̂j , âj = √ X̂ − √ P̂j , ~ ~ µω~ µω~ 2 2 j = 1, 2 (5.2.5) 156 Exemplos de Quantificação Canónica obtemos Ĥxy = ~ω N̂1 + N̂2 + 1 , (5.2.6) com os operadores de número sendo N̂j = â†j âj . As únicas relações de comutação não triviais entre estes operadores de criação e destruição são h i âi , â†j = δij 1̂ . (5.2.7) Claramente podemos tomar como C.C.O.C. n o C.C.O.C = N̂1 , N̂2 , (5.2.8) pelo que a base para o nosso espaço de estados será o conjunto de kets {|n1 , n2 i}, com {n1 } e {n2 } sendo o espectro de N̂1 e N̂2 respectivamente. O espectro de energias será E(n1 ,n2 ) = ~ω(n1 + n2 + 1) , (5.2.9) e as funções de onda para os estados estacionários serão simplesmente Ψ(n1 ,n2 ) (t, x, y) = Φn1 (x)Φn2 (y)e−iE(n1 ,n2 ) t/~ , (5.2.10) onde Φn é dado por (5.1.43). Note que o espectro é degenerado. 5.2.2 Quantões circulares O potencial do oscilador harmónico isotrópico em duas dimensões é invariante por rotações em torno do eixo Oz. É por isso natural considerarmos o operador momento angular segundo z; por (4.4.39) L̂z = X̂ 1 P̂2 −X̂ 2 P̂1 (5.1.69) = i i h i~ h † (â1 + â1 )(â†2 − â2 ) − (â†2 + â2 )(â†1 − â1 ) = i~ â1 â†2 − â†1 â2 . 2 (5.2.11) Vemos facilmente que L̂z comuta com Ĥxy : h i h i h i N̂1 + N̂2 , L̂z = i~ N̂1 , â1 â†2 − â†1 â2 + i~ N̂2 , â1 â†2 − â†1 â2 = i~(−â1 â†2 − â†1 â2 + â1 â†2 + â†1 â2 ) = 0 . (5.2.12) 5.2 O Oscilador Harmónico Quântico em Duas Dimensões 157 n o Assim, em vez de usarmos N̂1 , N̂2 poderiamos escolher como C.C.O.C. n o C.C.O.C. = L̂z , Ĥxy . (5.2.13) Para o fazermos é útil introduzirmos os operadores de criação e destruição circulares:1 1 âd = √ (â1 − iâ2 ) , 2 1 âe = √ (â1 + iâ2 ) , 2 (5.2.14) e os seus adjuntos â†d , â†e ; os únicos comutadores não triviais são: [âd , â†d ] = 1 = [âe , â†e ] . (5.2.15) Facilmente vemos que â†d âd 1 † † † † = â â1 + â2 â2 − iâ1 â2 + iâ2 â1 , 2 1 â†e âe 1 † † † † = â â1 + â2 â2 + iâ1 â2 − iâ2 â1 . 2 1 (5.2.16) Definindo os operadores de número circulares N̂d = â†d âd , temos N̂e = â†e âe ,   Ĥxy = ~ω N̂d + N̂e + 1  (5.2.17) . (5.2.18) L̂z = ~(N̂d − N̂e ) Podemos pois como uma outra hipótese tomar como C.C.O.C. n o C.C.O.C. = N̂e , N̂d , (5.2.19) e rotular a base no nosso espaço de estados como {|ne , nd i}. Os espectros da energia e (da componente z) do momento angular são E(ne ,nd ) = ~ω(nd + ne + 1) ≡ ~ω(n + 1) , lz = ~(nd − ne ) ≡ ~m . (5.2.20) Nestas relações definimos n ≡ nd + ne e m ≡ nd − ne . Podemos agora compreender a terminologia de quantões circulares. O operador â†d (â†e ) adiciona ao estado um quantão de 1 Os sub-ı́ndices d e e significam ‘direita’ e ‘esquerda’. 158 Exemplos de Quantificação Canónica momento angular -~- no sentido directo (inverso), para além de adicionarem um quantão de energia. Para cada valor da energia, existe uma degenerescência de grau n + 1, correspondendo aos pares (ne , nd ) = [(0, n); (1, n − 1); (2, n − 2); . . . ; (n − 1, 1); (n, 0)] , (5.2.21) que correspondendem aos valores de lz = m~ com m = [n; n − 2; n − 4; . . . ; 2 − n; −n] . (5.2.22) Note-se que a acção dos operadores circulares nos estados {|ne , nd i} é dada por â†d |ne , nd i = |ne , nd + 1i , â†e |ne , nd i = |ne + 1, nd i , âd |ne , nd i = nd |ne , nd − 1i , 5.2.3 (5.2.23) âe |ne , nd i = ne |ne − 1, nd i . Funções de Onda para quantões circulares Vimos na secção 5.1.2 que a acção de operadores de destruição e criação lineares é dada por, na representação |xi, 1 âi → √ 2 r µω i x + ~ s ~ ∂ µω ∂xi ! , (5.2.24) 1 â†i → √ 2 r µω i x − ~ s ~ ∂ µω ∂xi ! . (5.2.25) Logo, usando (5.2.14), a acção dos operadores de destruição e criação circulares é dada por2 2 âd 1 → 2 r â†d 1 → 2 r Usamos x1 = x e x2 = y. µω (x − iy) + ~ s ~ µω ∂ ∂ −i ∂x ∂y ! , (5.2.26) µω (x + iy) − ~ s ~ µω ∂ ∂ +i ∂x ∂y ! . (5.2.27) 5.2 O Oscilador Harmónico Quântico em Duas Dimensões 159 Os operadores circulares ‘retrógrados’ âe , â†e são obtidos pela transformação i → −i nas duas últimas expressões respectivamente.3 A mudança para quantões circulares pretendeu usar a simetria de rotação em torno do eixo Oz do problema; é pois natural reexpressar estas quantidades em coordenadas polares:    x + iy = ρeiφ     ∂x ∂ ∂y ∂ ∂ ∂ ∂    = + = −y +x    ∂φ  x = ρ cos φ ∂φ ∂x ∂φ ∂y ∂x ∂y . ⇒ ∂x ∂ ∂y ∂ x ∂ y ∂ ∂   y = ρ sin φ = + = +   ∂ρ ∂ρ ∂x ∂ρ ∂y ρ ∂x ρ ∂y      ∂ i ∂ x − iy ∂ i(x − iy) ∂ ∂ ∂  −iφ  + = + =e +i  ∂ρ ρ ∂φ ρ ∂x ρ ∂y ∂x ∂y (5.2.28) Logo, reexpressamos a acção dos operadores de criação e destruição directos s r ! µω ~ 1 ∂ i ∂ âd → e−iφ , ρ+ − 2 ~ µω ∂ρ ρ ∂φ s r ! µω ~ ∂ i ∂ 1 , ρ− + â†d → eiφ 2 ~ µω ∂ρ ρ ∂φ (5.2.29) (5.2.30) e os operadores circulares ‘retrógrados’ âe , â†e são obtidos pela transformação i → −i nas duas últimas expressões respectivamente. As funções próprias do oscilador harmónico 2dimensional em termos destes quantões circulares (que são portanto estados próprios da energia e momento angular) Ψ(ne ,nd ) (ρ, φ) = Φ(ne ,nd ) (t, ρ, φ)e−iE(ne ,nd ) t/~ , (5.2.31) são obtidas actuando no vácuo com â†d e â†e . A função de onda do vácuo para os quantões lineares é (5.2.10) com n1 = n2 = 0 Ψ(n1 =0,n2 =0) (t, x, y) = r ωµ − µω (x2 +y2 ) −iωt e 2~ e , π~ (5.2.32) ou, em termos dos quantões circulares n = 0, m = 0 , Φ(ne =0,nd =0) (ρ, φ) = r ωµ − µω ρ2 e 2~ . π~ (5.2.33) Note que isto não corresponde a tirar o complexo conjugado, dado que os operadores âi e â†i não mudam. 3 160 Exemplos de Quantificação Canónica Note-se que por (5.2.29), âd Φ(0,0) = 0 como requerido (e também âe Φ(0,0) = 0). Actuando agora com â†d ou â†e respectivamente obtemos µω 2 ωµ Φ(ne =0,nd =1) (ρ, φ) = √ eiφ ρe− 2~ ρ , π~ n=1, µω 2 ωµ   m = −1 , Φ(ne =1,nd =0) (ρ, φ) = √ e−iφ ρe− 2~ ρ , π~    m=1, (5.2.34) e assim por diante. Repare-se que para este nı́vel de energia (n = 1) os diferentes estados de momento angular diferem de uma fase. Em geral o mesmo não se verifica; de facto isso pode ser verificado para n = 2; tendo em atenção o factor de normalização obtemos  ωµ 3/2 2 µω 2  2iφ ρ  √ m = 2 , Φ (ρ, φ) = e e− 2~ ρ ,  (ne =0,nd =2)   2π  r~ h  i µω 2 ωµ ωµ 2 n=2, (5.2.35) m = 0 , Φ(ne =1,nd =1) (ρ, φ) = ρ − 1 e− 2~ ρ ,  π~ ~   ωµ 3/2  µω 2 ρ2   e−2iφ √ e− 2~ ρ .  m = −2 , Φ(ne =2,nd =0) (ρ, φ) = ~ 2π As densidades de probabilidade respeitantes a estas funções de onda estão representadas na figura 5.3. 5.3 O problema de Landau O problema de Landau para uma partı́cula sem spin é a versão quântica do problema de Larmor do capı́tulo 1. Consideramos o hamiltoniano (1.3.22) 1 HL = 2µ qBy px + 2 2 2 qBx 1 p2 py − + + z . 2µ 2 2µ (5.3.1) Tal como discutido na secção 4.4.3, a quantificação deste sistema é feita usando o operador Hamiltoniano µ ĤL = 2 P̂x ωc Ŷ + µ 2 !2 µ + 2 P̂y ωc X̂ − µ 2 !2 + P̂z2 , 2µ (5.3.2) onde usamos a frequência ciclotrónica ωc = qB/µ e onde impomos as relações de comutação canónicas [X̂, P̂x ] = i~ , [Ŷ , P̂y ] = i~ , [Ẑ, P̂z ] = i~ , (5.3.3) 5.3 O problema de Landau 161 0.3 0.1 0.25 0.08 0.2 0.06 0.15 0.04 0.1 0.02 0.05 0 0 0 0.5 1 1.5 2 0 0.5 1 1.5 rho 2 2.5 3 3 3.5 rho 0.3 0.08 0.25 0.06 0.2 0.15 0.04 0.1 0.02 0.05 0 0 0 0.5 1 1.5 2 rho 2.5 3 3.5 0 0.5 1 1.5 2 2.5 rho Figura 5.3: Densidades de probabilidade para os nı́veis (n, m) = (0, 0) (cima esquerda), (n, m) = (1, ±1) (cima direita) , (n, m) = (2, ±2) (baixo esquerda), (n, m) = (2, 0) (baixo direita). Nos gráficos tomamos µω/~ = 1. 162 Exemplos de Quantificação Canónica sendo todos os outros comutadores envolvendo momento e posição zero. Reescrevemos (5.3.2) como ĤL = P̂x2 + P̂y2 µωc2 2 P̂ 2 P̂ 2 ωc ωc + (X̂ + Ŷ 2 ) − (X̂ P̂y − Ŷ P̂x ) + z = Ĥxy − L̂z + z , (5.3.4) 2µ 8 2 2µ 2 2µ onde Ĥxy é o Hamiltoniano do oscilador harmónico dois dimensional (5.2.3) com ω = ωc /2 e L̂z é a componente z do operador momento angular. Usando (5.2.18), reescrevemos o hamiltoniano como 1 P̂ 2 ĤL = ~ωc N̂e + + z . 2 2µ (5.3.5) Note-se que podiamos ter definido directamente de (5.3.2) os operadores de destruição e criação " ! !# µ P̂x ωc Ŷ P̂y ωc X̂ +i , + − −iâe = 2~ωc µ 2 µ 2 " ! !# r P̂ P̂ ω Ŷ ω X̂ µ x y c c −i , + − iâ†e = 2~ωc µ 2 µ 2 r (5.3.6) (5.3.7) de modo que " µ 2 â†e âe = 2~ωc µ P̂ 2 ĤL − z 2µ ! # iωc iωc 1 − [P̂x , X̂] + [Ŷ , P̂y ] = 2µ 2µ ~ωc P̂ 2 ĤL − z 2µ ! − 1 , 2 (5.3.8) recuperando (5.3.5). Só que ao usarmos a comparação com o oscilador harmónico em duas dimensões temos imediatamente a interpretação de âe e â†e como destruindo e criando quantões circulares (retrógrados). Assim, o Hamiltoniano é igual ao do oscilador harmónico um dimensional, mas com quantões circulares, mais uma parte que descreve o movimento (livre) segundo o eixo do z. Consideremos a decomposição ĤL = Ĥ⊥ + Ĥk , com 1 e Ĥ⊥ = ~ωc N̂e + 2 Ĥk = P̂z2 . 2µ (5.3.9) Analisamos primeiro o movimento no plano xy que é descrito por Ĥ⊥ . O espectro de energias no plano xy é infinitamente degenerado. De facto, estados próprios de L̂z com diferentes valores de nd têm o mesmo valor próprio da energia, que só depende de ne ; 5.3 O problema de Landau 163 adicionando ou subtraindo quantões circulares directos não altera a energia do estado. Para compreender fisicamente este resultado vamos definir vários operadores: • Operadores Velocidade: Pela relação clássica (1.3.19) ~, p~ = µ~x˙ + q A (5.3.10) definimos os operadores associados à velocidade V̂ i = q P̂i − Âi , µ µ V̂ y = P̂y ωc − X̂ , µ 2 (5.3.11) que no nosso caso são V̂ x = P̂x ωc + Ŷ , µ 2 V̂ z = P̂z . µ (5.3.12) Logo [V̂ x , V̂ y ] = i~ωc , µ (5.3.13) e portanto existe uma incerteza mı́nima associada à determinação das componentes x e y da velocidade, quando B 6= 0 ∆v x ∆v y ≥ ωc ~ . 2µ (5.3.14) • Operadores Centro da Trajectória Clássica: Pelas relações clássicas (1.1.10)-(1.1.12) temos x = x0 − vy , ωc y = y0 + vx , ωc (B 6= 0) (5.3.15) definimos as observáveis associadas ao centro da trajectória clássica X̂0 = X̂ + X̂ P̂y V̂ y = + , ωc 2 µωc Ŷ0 = Ŷ − V̂ x Ŷ P̂x = − . ωc 2 µωc (5.3.16) Primeiro notamos que [X̂0 , Ŷ0 ] = − i~ . µωc (5.3.17) Logo, X̂0 e Ŷ0 são incompatı́veis e existe uma incerteza mı́nima associada às suas grandezas fı́sicas associadas ∆x0 ∆y0 ≥ ~ . 2µωc (5.3.18) 164 Exemplos de Quantificação Canónica Segundo notamos que [ĤL , X̂0 ] = 0 = [ĤL , Ŷ0 ] , (5.3.19) pelo que tanto X̂0 como Ŷ0 são constantes do movimento no sentido da secção 4.4.5. Terceiro notamos que [X̂0 , L̂z ] = −i~Ŷ0 , [Ŷ0 , L̂z ] = i~X̂0 , (5.3.20) pelo que não podemos incluir mais do que uma das três grandezas X̂0 , Ŷ0 , L̂z no nosso C.C.O.C.. Quarto notamos que o operador P̂x2 + P̂y2 µωc2 2 ωc + (X̂ + Ŷ 2 ) + (X̂ P̂y − Ŷ P̂x ) 2µ 8 2 ! 1̂ ωc 2~ 2 Ĥxy + L̂z = N̂d + = µωc2 2 µωc 2 2 R̂02 ≡ X̂02 + Ŷ02 = µωc2 ! . (5.3.21) Deste modo vemos que o valor próprio do operador R̂02 depende somente do número de quantões circulares directos. • Operador Raio da trajectória clássica: Pela expressão clássica (1.1.13) r 2 = (x(t) − x0 )2 + (y(t) − y0 )2 , (5.3.22) definimos o operador raio da trajectória clássica 1 2~ R̂2 = (X̂ − X̂0 )2 + (Ŷ − Ŷ0 )2 = 2 ((V̂ x )2 + (V̂ y )2 ) = ωc µωc 1̂ N̂e + 2 ! . (5.3.23) Assim, R̂2 é determinado pelo número de quantões circulares retrógrados. Assim, o C.C.O.C. para o problema de Landau é n o C.C.O.C = N̂e , N̂d , P̂z , (5.3.24) e a base para o espaço de estados pode ser tomada como rotulada pelos seus valores próprios {|ne , nd , pz i}. Podemos pensar em ne como determinando a energia do sistema ou também 5.4 Sumário 165 o valor próprio do operador raio da trajectória clássica. Por outro lado nd determina o valor próprio do operador R̂02 . O espectro total de energias é E(ne ,pz ) 1 p2 = ~ωc ne + + z , 2 2µ (5.3.25) que tem uma parte discreta relativa ao movimento no plano xy que é designada por nı́veis de Landau e uma parte contı́nua relativa ao movimento segundo z. Este espectro é degenerado em dois sentidos diferentes. Primeiro, como discutido atrás, funções de onda que só diferem de nd têm a mesma energia - degenerescência infinita. Segundo, mesmo tomando o mesmo valor de nd , duas funções de onda com diferentes valores de pz e ne podem ainda ter a mesma energia, desde que a soma das duas parcelas ainda se mantenha igual. Esta é uma degenerescência finita com grau ñ + 1 onde ñ é o maior inteiro menor que E/(~ωc ) − 1/2. As funções de onda totais para o problema de Landau que são estados próprios simultaneamente de ĤL , L̂z e P̂z são dadas pelo produto das funções de onda da secção 5.2.3 por uma onda plana que descreve o movimento livre segundo z: Ψ(ρ, φ, z, t) = Φ(ne ,nd ) (ρ, φ)eipz z/~eiE(ne ,pz ) t/~ . (5.3.26) Claro está, que tal como discutido no capı́tulo 3, esta função de onda não vai ser normalizável, devido à componente segundo z ser livre. Para normalizar a função de onda terı́amos de considerar um pacote de ondas na direcção z. 5.4 Sumário Considerámos três exemplos de quantificação canónica. O primeiro, o oscilador harmónico quântico em uma dimensão é o paradigma de problema que é resolvido pela introdução de operadores de criação e destruição. O espectro de energias mostra que a diferença de energia entre dois nı́veis diferentes é um múltiplo de ~ω. Esta foi exactamente a observação de Planck discutida na secção 2.1.2 que é obtida naturalmente no formalismo quântico. Ao considerarmos o oscilador harmónico isotrópico em duas dimensões pudemos introduzir também os operadores de criação e destruição circulares, que são úteis para tratar estados 166 Exemplos de Quantificação Canónica com momento angular bem definido. Vimos também aqui um exemplo de espectro de energias (finitamente) degenerado em cada nı́vel. O problema de Landau permitiu-nos ver um exemplo de um espectro de energias infinitamente degenerado; esta degenerescência pode ser associada à redundância de trajectórias clássicas no problema clássico de Larmor, que resulta da uniformidade do campo magnético. O problema de Landau dá-nos também um exemplo de uma situação em que os operadores associados a velocidades (ou a posições) não comutam entre si. CAPÍTULO 6 Momento Angular Orbital e o Átomo de Hidrogénio No capı́tulo anterior estudamos sistemas com componente Lz do momento angular bem definida. Isso levou-nos a estudar as funções de onda da secção 5.2.3 que são estados próprios dos operadores Ĥ e L̂z - estes operadores comutam e podem, como tal, ser diagonalizados simultaneamente. Neste capı́tulo vamos começar por estudar um conjunto de funções próprias comuns a L̂z e L̂2 que aplicaremos depois ao estudo do átomo de Hidrogénio. 6.1 Operadores de momento angular orbital As componentes do momento angular orbital são dadas por (4.4.39) ~ L̂ = (L̂x , L̂y , L̂z ) = (Ŷ P̂z − Ẑ P̂y , Ẑ P̂x − X̂ P̂z , X̂ P̂y − Ŷ P̂x ) . Na representação |~xi, estes operadores são escritos associando ∂ ∂ ∂ P̂x , P̂y , P̂z → −i~ , −i~ , −i~ , ∂x ∂y ∂z (6.1.1) (6.1.2) de modo que representamos ∂ ∂ ∂ ∂ ∂ ∂ . − z ,z −x ,x −y (L̂x , L̂y , L̂z ) = −i~ y ∂z ∂y ∂x ∂z ∂y ∂x (6.1.3) 168 Momento Angular Orbital e o Átomo de Hidrogénio Podemos facilmente verificar que esta representação obedece às relações de comutação para o momento angular [L̂x , L̂y ] = i~L̂z , [L̂y , L̂z ] = i~L̂x , [L̂z , L̂x ] = i~L̂y ; (6.1.4) por exemplo, sendo φ(x, y, z) uma função de onda arbitrária ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ z + z y φ(x, y, z) −z −x −x −z [L̂x , L̂y ]φ(x, y, z) = ~ − y ∂z ∂y ∂x ∂z ∂x ∂z ∂z ∂y ∂ ∂ 2 φ(x, y, z) = i~L̂z φ(x, y, z) , −y =~ x ∂y ∂x (6.1.5) 2 em acordo com (6.1.4). Definimos o operador momento angular total ~ ~ L̂2 = L̂ · L̂ = L̂2x + L̂2y + L̂2z . (6.1.6) Note-se que L̂2 comuta com qualquer das componentes do momento angular h i L̂2 , L̂x = 0 , h i L̂2 , L̂y = 0 , h i L̂2 , L̂z = 0 . (6.1.7) Por exemplo h i h i h i h i h i h i L̂2 , L̂x = L̂2y + L̂2z , L̂x = L̂y L̂y , L̂x + L̂y , L̂x L̂y + L̂z L̂z , L̂x + L̂z , L̂x L̂z = −i~L̂y L̂z − i~L̂z L̂y + i~L̂z L̂y + i~L̂y L̂z = 0 . (6.1.8) Assim, em mecânica quântica, classificamos os estados com momento angular bem definido usando o momento angular total e apenas uma das suas componentes, normalmente z; ou seja, consideramos o n o C.C.O.C. = L̂2 , L̂z , (6.1.9) para descrever os estados próprios do momento angular. Tal como na secção 5.2.3. usámos coordenadas polares para descrever as funções de onda que são estados próprios de L̂z , é conveniente usar coordenadas esféricas para descrever 6.2 Os Harmónicos Esféricos 169 as funções de onda que são estados próprios simultaneamente de L̂2 e L̂z . A relação entre coordenadas esféricas e cartesianas é dada por     x = r sin θ cos φ  y = r sin θ sin φ     z = r cos θ . (6.1.10) Os versores em coordenadas esféricas e cartesianas relacionam-se como   e = cos θ cos φex + cos θ sin φey − sin θez    θ . (6.1.11) eφ = cos φey − sin φex     er = x ex + y ey + z ez r r r ~ˆ = ~ˆr × ˆ~p, na representação |xi e usando coordenadas O operador momento angular, L esféricas toma a forma ∂ 1 ∂ 1 ∂ ˆ ~ L = rer × (−i~∇) = −i~rer × er , + eθ + eφ ∂r r ∂θ r sin θ ∂φ (6.1.12) ou seja 1 ∂ ∂ ˆ ~ = −i~ eφ . − eθ L ∂θ sin θ ∂φ (6.1.13) Usando (6.1.11) para projectar esta equação em ex , ey e ez obtemos respectivamente  ∂ ∂   L̂x = i~ sin φ + cot θ cos φ    ∂θ ∂φ   ∂ ∂ . (6.1.14) L̂y = i~ − cos φ + cot θ sin φ  ∂θ ∂φ    ∂    L̂z = −i~ ∂φ Calculando o operador momento angular total L̂2 = L̂2x + L̂2y + L̂2z nesta representação obtemos 2 L̂ = −~ 6.2 2 1 ∂ sin θ ∂θ ∂ 1 ∂2 sin θ + . ∂θ sin2 θ ∂φ2 (6.1.15) Os Harmónicos Esféricos Vamos agora construir as funções próprias comuns a L̂2 e L̂z . Comecemos por calcular as funções próprias de L̂2 com valor próprio α~2 que denotamos por Yα (θ, φ) e obedecem à 170 Momento Angular Orbital e o Átomo de Hidrogénio equação diferencial L̂2 Yα (θ, φ) = α~2 Yα (θ, φ) , (6.2.1) ou seja −~ 2 1 ∂ sin θ ∂θ ∂ 1 ∂2 sin θ + Yα (θ, φ) = α~2 Yα (θ, φ) . ∂θ sin2 θ ∂φ2 (6.2.2) Separamos variáveis Yα (θ, φ) = Θ(θ)Φ(φ) , de modo a obtermos a equação d 1 d2 sin θ d 2 sin θ Θ(θ) + α sin θ = − Φ(φ) . Θ(θ) dθ dθ Φ(φ) dφ2 (6.2.3) (6.2.4) Como o lado esquerdo só depende de θ e o direito de φ, para obedecer à igualdade cada lado tem de ser uma constante a que chamamos m2 . Do lado direito obtemos então d2 Φ(φ) + m2 Φ(φ) = 0 dφ2 ⇒ Φ(φ) = C1 eimφ + C2 e−imφ . (6.2.5) Note-se que as funções e±imφ são também funções próprias de L̂z , com valores próprios −i~(±im) = ±m~ , (6.2.6) enquanto que a combinação linear C1 eimφ + C2 e−imφ não é função própria de L̂z . Deste modo tomamos Φ(φ) = Ce±imφ , (6.2.7) onde C é uma constante de normalização. Além disso, para a função e±imφ ter valor único, precisamos e±imφ = e±im(φ+2π) ⇒ m∈Z, (6.2.8) ou seja, m é inteiro e como tal os valores próprios de L̂z são 0, ±~, ±2~, ±3~ , . . . Do lado esquerdo de (6.2.4) obtemos d d sin θ Θ(θ) + α sin2 θ − m2 Θ(θ) = 0 . sin θ dθ dθ (6.2.9) (6.2.10) 6.2 Os Harmónicos Esféricos 171 Para resolvermos esta equação fazemos uma mudança de variável: χ ≡ cos θ dχ d d d = = − sin θ , dθ dθ dχ dχ ⇒ f (χ) ≡ Θ(θ) , (6.2.11) de modo que a equação em θ fica d m2 2 d (1 − χ ) f (χ) + α − f (χ) = 0 . dχ dχ 1 − χ2 (6.2.12) Começamos por considerar o caso com m = 0, ficando a equação d2 f (χ) df (χ) (1 − χ ) − 2χ + αf (χ) = 0 . dχ2 dχ 2 (6.2.13) Esta é uma equação diferencial ordinária de segunda ordem, denominada equação de Legendre. Tentemos encontrar uma solução como uma série de potências f (χ) = ∞ X an χn , (6.2.14) n=0 de modo que a equação fica 2 (1 − χ ) ⇔ ⇔ ∞ X n=0 ∞ X n=0 ∞ X n=0 n−2 n(n − 1)an χ − 2χ ∞ X nan χ n=0 [−n(n − 1) − 2n + α] an χn + n [α − n(n + 1)] an χ + ∞ X n−1 ∞ X n=0 +α ∞ X an χn = 0 n=0 n(n − 1)an χn−2 = 0 , (6.2.15) (m + 2)(m + 1)am+2 χm = 0 m=−2 notando que os termos com m = −2 e m = −1 no último somatório dão contribuição zero e chamando n a m obtemos ⇔ ∞ X n=0 [(α − n(n + 1))an + (n + 2)(n + 1)an+2 ] χn = 0 , (6.2.16) que para ser obedecido implica a relação de recorrência para a série an+2 = (n + 1)n − α an . (n + 2)(n + 1) (6.2.17) Notamos de imediato que an+2 an n→∞ −→ 1 , (6.2.18) 172 Momento Angular Orbital e o Átomo de Hidrogénio de modo que para a série não divergir quando χ = ±1 (que é o valor máximo para χ dado que χ ≡ cos θ) temos de requerer que ela seja finita, isto é que o valor próprio α obedeça a α = ℓ(ℓ + 1) , (6.2.19) para um dado ℓ ∈ N0 . As soluções da equação de Legendre são então polinómios de grau ℓ. Note-se ainda que como a relação de recorrência relaciona apenas an+2 com an , temos que a série de termos pares é independentente da série de termos ı́mpares; a escolha de α = ℓ(ℓ + 1) para um dado ℓ garante que a série com a paridade de ℓ páre; assim para termos uma série finita temos de escolher somente termos pares ou termos ı́mpares: série par (ℓ par) a0 6= 0 , a1 = 0 , série ı́mpar (ℓ ı́mpar) (6.2.20) a0 = 0 , a1 6= 0 . Estes polinómios são designados por polinómios de Legendre e denotados por Pℓ (χ) (grau ℓ) quando obedecem à condição de normalização Z 1 Pℓ (χ)Pℓ′ (χ)dχ = −1 2 δℓℓ′ . 2ℓ + 1 (6.2.21) Os quatro primeiros são • Tomamos ℓ = 0, a0 = 1, a1 = 0 e obtemos P0 (χ) = 1; (6.2.22) • Tomamos ℓ = 1, a0 = 0, a1 = 1 e obtemos P1 (χ) = χ ; (6.2.23) • Tomamos ℓ = 2, a0 = −1/2, a1 = 0 e obtemos P2 (χ) = − 1 1 − 3χ2 ; 2 (6.2.24) • Tomamos ℓ = 3, a0 = 0, a1 = −3/2 e obtemos 5 3 P3 (χ) = − χ + χ3 . 2 2 (6.2.25) 6.2 Os Harmónicos Esféricos 173 Pode-se verificar que com estas normalizações os polinómios obedecem a (6.2.21). Descobrimos pois um conjunto de funções próprias comuns a L̂2 e L̂z , da forma Yℓm (θ, φ) = F (θ)eimφ , (6.2.26) cujo valor próprio de L̂z é m~, com m ∈ Z, e, para m = 0 estas funções tomam a forma Yℓ0 (θ, φ) = CPℓ (cos θ) , (6.2.27) onde C é uma constante de normalização, sendo o valor próprio de L̂2 , ℓ(ℓ + 1)~2 com ℓ ∈ N0 . Vamos agora usar (6.2.27) para construir Yℓm (θ, φ) com m 6= 0. Primeiro notamos que os valores de m e ℓ não são completamente independentes. Por definição L̂2 = L̂2x + L̂2y + L̂2z ; (6.2.28) o valor esperado desta equação num determinado estado com momento angular bem definido, |Ψi = | . . . , ℓ, mi (normalizado) é hΨ|L̂2 |Ψi = hΨ|L̂2x + L̂2y + L̂2z |Ψi , (6.2.29) e dado que L̂x e L̂y são hermı́ticos ℓ(ℓ + 1)~2 = kL̂x |Ψik2 + kL̂y |Ψik2 + m2 ~2 ≥ m2 ~2 , o que equivale a que |m| ≤ (6.2.30) p ℓ(ℓ + 1), ou, como |m|, ℓ ∈ N0 , |m| ≤ ℓ . (6.2.31) Note-se que assumimos que mesmo para m 6= 0 os estados próprios do momento angular têm valor próprio de L̂2 igual a ℓ(ℓ + 1)~2 ; iremos confirmar isto em baixo. Segundo definimos os operadores de escada L̂+ = L̂x + iL̂y , L̂− = L̂x − iL̂y . (6.2.32) 174 Momento Angular Orbital e o Átomo de Hidrogénio Estes operadores obedecem às relações de comutação h i L̂2 , L̂± = 0 , h i L̂− , L̂+ = −2~L̂z , h i L̂z , L̂± = ±~L̂± . (6.2.33) Por exemplo, h i h i L̂− , L̂+ = L̂x − iL̂y , L̂x + iL̂y = −2~L̂z . (6.2.34) h i Compare-se as relações de comutação L̂z , L̂± = ±~L̂± com as relações (5.1.9) e (5.1.10); são idênticas, pelo que podemos fazer uma analogia para L̂+ /L̂− como operadores de criação/destruição e para L̂z como operador de número. Mais concretamente, L̂+ /L̂− vão transformar um estado com momento angular segundo z, m~, num estado com mais/menos um quantão de momento angular segundo z, (m+1)~/(m−1)~. Isto, sem alterar o momento h i 2 2 angular total ~ ℓ(ℓ + 1), pois L̂ , L̂± = 0, o que justifica a hipótese tomada acima de que os valores próprios de L̂2 mantinham a sua forma para m 6= 0. Deste modo tomamos para estados próprios do momento angular o conjunto {|ℓ, mi}, com |m| ≤ ℓ e L̂2 |ℓ, mi = ℓ(ℓ + 1)~2 |ℓ, mi , L̂+ |ℓ, mi = Cℓm |ℓ, m + 1i , L̂z |ℓ, mi = m~|ℓ, mi L̂− |ℓ, mi = C̃ℓm |ℓ, m , (6.2.35) − 1i onde Cℓℓ = 0, C̃ℓ−ℓ = 0, para garantir que |m| ≤ ℓ. Tal como para o oscilador harmónico (fórmulas (5.1.30) e (5.1.31)), as constantes Cℓm , C̃ℓm são necessárias para garantir a normalização dos estados. Para vermos a forma destas constantes notamos que L̂∓ L̂± = L̂2x + L̂2y ∓ iL̂y L̂x ± iL̂x L̂y = L̂2x + L̂2y h i ± i L̂x , L̂y = L̂2 − L̂2z ∓ ~L̂z . (6.2.36) Logo, hℓ, m|L̂∓ L̂± |ℓ, mi = hℓ, m|L̂2 − L̂2z ∓ ~L̂z |ℓ, mi = ~2 ℓ(ℓ + 1) − m2 ∓ m hℓ, m|ℓ, mi . (6.2.37) Mas, por outro lado, hℓ, m|L̂− L̂+ |ℓ, mi = Cℓm (Cℓm )∗ hℓ, m + 1|ℓ, m + 1i , ∗ m m hℓ, m|L̂+ L̂− |ℓ, mi = C̃ℓ C̃ℓ hℓ, m − 1|ℓ, m − 1i (6.2.38) 6.2 Os Harmónicos Esféricos 175 e como tal ~2 (ℓ(ℓ + 1) − m(m + 1)) hℓ, m|ℓ, mi = Cℓm (Cℓm )∗ hℓ, m + 1|ℓ, m + 1i . ∗ ~2 (ℓ(ℓ + 1) − m(m − 1)) hℓ, m|ℓ, mi = C̃ℓm C̃ℓm hℓ, m − 1|ℓ, m − 1i (6.2.39) Concluimos que para garantir que a acção dos operadores em escada preserva a normalização dos estados tomamos p Cℓm = ~ ℓ(ℓ + 1) − m(m + 1) , C̃ℓm = ~ que naturalmente obedecem a Cℓℓ = 0, C̃ℓ−ℓ = 0. p ℓ(ℓ + 1) − m(m − 1) , (6.2.40) Terceiro, os operadores em escada na representação |~xi e em coordenadas esféricas tomam a forma (usando (6.2.32) e (6.1.14)) ∂ ∂ iφ , + i cot θ L̂+ = ~e ∂θ ∂φ ∂ ∂ −iφ L̂− = −~e , − i cot θ ∂θ ∂φ (6.2.41) (6.2.42) e os estados |ℓ, mi tomam a forma Yℓm (θ, φ), sendo a condição de normalização Z π Z 2π dθ dφ sin θYℓm (Yℓm )∗ = 1 , θ=0 (6.2.43) φ=0 e designam-se por harmónicos esféricos. Consideremos os primeiros √ • Para ℓ = 0, m = 0 temos Y00 = C; normalizando obtemos C = 1/ 4π, logo 1 Y00 = √ ; 4π (6.2.44) • Para ℓ = 1, m = 0 temos Y10 = C cos θ; normalizando obtemos C = r 3 0 Y1 = cos θ , 4π p 3/(4π), logo (6.2.45) e usando √ L̂+ |1, 0i = ~ 2|1, 1i ⇔ 1 Y11 = √ ~eiφ 2~ ∂ ∂ + i cot θ ∂θ ∂φ r Y10 = − 3 iφ e sin θ , 8π (6.2.46) 176 Momento Angular Orbital e o Átomo de Hidrogénio e de um modo semelhante √ L̂− |1, 0i = ~ 2|1, −1i ⇔ Y1−1 1 = − √ ~e−iφ 2~ ∂ ∂ − i cot θ ∂θ ∂φ Y10 = • Para ℓ = 2, m = 0 temos Y20 = C(3 cos2 θ − 1); normalizando obtemos C = logo Y20 = r 5 (3 cos2 θ − 1) , 16π r 3 −iφ e sin θ ; 8π (6.2.47) p 5/(16π), (6.2.48) e pela acção dos operadores em escada obtemos √ r 15 iφ e cos θ sin θ , 8π (6.2.49) r √ ∂ 1 15 −iφ ∂ L̂− |2, 0i = ~ 6|2, −1i ⇔ Y2−1 = − √ ~e−iφ Y20 = − i cot θ e cos θ sin θ , ∂θ ∂φ 8π 6~ (6.2.50) r ∂ 1 iφ ∂ 15 2iφ 2 Y21 = ~e + i cot θ e sin θ , L̂+ |2, 1i = ~2|2, 2i ⇔ Y22 = 2~ ∂θ ∂φ 32π (6.2.51) r 1 ∂ ∂ 15 −2iφ 2 L̂− |2, −1i = ~2|2, −2i ⇔ Y2−2 = − ~e−iφ Y2−1 = − i cot θ e sin θ . 2~ ∂θ ∂φ 32π (6.2.52) L̂+ |2, 0i = ~ 6|2, 1i ⇔ Y21 1 = √ ~eiφ 6~ ∂ ∂ + i cot θ ∂θ ∂φ Y20 =− Nas figuras 6.1, 6.2, 6.3 é representada a dependência angular da função Yℓm (Yℓm )∗ . Como toda a dependência em φ desaparece, a figura obtida é dada pela revolução em torno do eixo dos z das figuras planares exibidas. 6.3 Partı́cula numa força central Consideremos o operador Hamiltoniano para uma partı́cula sem spin num campo de forças central1 Ĥ = 1 P̂ 2 + V̂ (R̂) . 2µ (6.3.1) Denotaremos de futuro a massa por ‘µ’ para evitar confusão com o número quântico azimutal ‘m’. 6.3 Partı́cula numa força central 177 Figura 6.1: Dependência angular dos harmónicos esféricos com número quântico azimutal mı́nimo, Y00 , Y10 , Y20 , respectivamente. Note-se que as zonas de maior probabilidade se encontram ao longo do eixo polar (extraı́do de Cohen et al., ‘Quantum Mechanics’). Figura 6.2: Dependência angular dos harmónicos esféricos com número quântico azimutal máximo, Y00 , Y1±1 , Y1±2 , Y3±3 , Y4±4 respectivamente. Note-se que as zonas de maior probabilidade se encontram ao longo do plano equatorial (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). 178 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.3: Dependência angular dos harmónicos esféricos Y30 , Y3±1 , Y2±2 , Y3±3 , respectivamente. Note-se que as zonas de maior probabilidade se deslocam do eixo polar para o plano equatorial à medida que o número quântico azimutal cresce (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). Vamos reescrever este Hamiltoniano em termos do operador momento angular. Para isso notamos que na representação |~xi P̂ 2 = (−i~∇) · (−i~∇) = −~2 ∆ , onde ∆ é o Laplaciano. Em coordenadas esféricas temos então 1 ∂ ∂2 1 ∂ 1 ∂ 2 2 2 ∂ P̂ = −~ r + 2 sin θ + 2 2 , r 2 ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2 ou ainda, usando o operador distância radial R̂ e definindo o operador radial ~2 ∂ 2 ∂ Ξ̂ ≡ − 2 r , r ∂r ∂r (6.3.2) (6.3.3) (6.3.4) temos em forma de operadores P̂ 2 = Ξ̂ + L̂2 R̂2 ⇒ Ĥ = Ξ̂ L̂2 + + V̂ (R̂) . 2µ 2µR̂2 Desta forma do Hamiltoniano podemos extrair as seguintes conclusões: (6.3.5) 6.3 Partı́cula numa força central 179 i) Quer L̂2 quer L̂z quando representados no espaço de configurações em coordenadas esféricas actuam apenas nas coordenadas angulares, conforme (6.1.14), (6.1.15), logo h i h i h i 2 2 2 1 =0 ⇒ L̂2 , Ĥ = 0 , (6.3.6) L̂ , Ξ̂ = 0 , L̂ , V̂ (R̂) = 0 , L̂ , R̂2 e de um modo semelhante h i L̂z , Ξ̂ = 0 , h i L̂z , V̂ (R̂) = 0 , L̂z , 1 R̂2 =0 [L̂z ,L̂2 ]=0 ⇒ h i L̂z , Ĥ = 0 . (6.3.7) Assim, no problema quântico de uma partı́cula num campo de forças central podemos incluir no C.C.O.C. n o C.C.O.C. = Ĥ, L̂2 , L̂z , (6.3.8) isto é, os estados com energia bem definida (estados estacionários) têm também momento angular bem definido. ii) Para encontrarmos os estados estacionários e o espectro de energias temos de resolver a equação de Schrödinger independente do tempo Ĥ|Φi = E|Φi , (6.3.9) que no espaço de configurações toma a forma 2 ~ ∂2 1 ∂ 1 1 ∂ ∂ 2 ∂ − r + 2 sin θ + 2 2 + V (r) Φ(r, θ, φ) 2µ r 2 ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2 = EΦ(r, θ, φ) . (6.3.10) É natural tomarmos como ansatz para as funções de onda espaciais Φ(r, θ, φ) = f (r)Yℓm (θ, φ) , (6.3.11) de modo aproveitar o conhecimento que adquirimos sobre as funções próprias do momento angular. A equação de onda fica reduzida a uma equação diferencial ordinária de segunda ordem na coordenada radial ℓ(ℓ + 1)~2 ~2 d 2 d r + − + V (r) f (r) = Ef (r) . 2µr 2 dr dr 2µr 2 (6.3.12) 180 Momento Angular Orbital e o Átomo de Hidrogénio 6.4 O átomo de hidrogénio (sem spin) Especializamos agora a equação (6.3.12) para o problema de Coulomb, para o qual V (r) = − 1 e2 , 4πǫ0 r (6.4.1) R(r) , r (6.4.2) e introduzindo a função R(r) por f (r) = o que transforma a equação radial em (usamos µ = me massa do electrão) 2 me e2 2me E 2 2 d −r R(r) = r + r − ℓ(ℓ + 1) R(r) . dr 2 ~2 2πǫ0 ~2 Esta equação tem a forma da chamada equação de Whittaker 2 2 1 z 2 d 2 W (z) , z W (z) = − kz + m − dz 2 4 4 (6.4.3) (6.4.4) cuja solução se toma como sendo da forma W (z) = z m+1/2 e−z/2 g(z) , (6.4.5) o que implica que (denotando dg/dz = g ′ ) g′ d2 W (z) 1 1 1 1 1 ′′ 2 m+1/2 −z/2 g + (2m + 1 − z) + − m+ g , m − =z e + dz 2 z 4 z2 4 z 2 (6.4.6) transformando a equação de Whittaker na equação 1 ′′ ′ g=0. zg + (2m + 1 − z)g + k − m − 2 (6.4.7) Esta equação é agora resolvida por uma série de potências g(z) = ∞ X bn z n , (6.4.8) n=0 que substituindo em (6.4.7) fica ∞ X ∞ X ∞ 1 X z n(n − 1)bn z + (2m + 1 − z) nbn z + k−m− bn z n = 0 2 n=0 n=0 n=0 ∞ X 1 ⇔ (n + 1)(2m + 1 + n)bn+1 − n + m + − k bn z n = 0 2 n=0 n−2 n−1 , (6.4.9) 6.4 O átomo de hidrogénio (sem spin) 181 e obtemos a relação de recorrência bn+1 = n + m − k + 1/2 bn . (n + 1)(n + 2m + 1) (6.4.10) Notemos que esta relação de recorrência implica que bn+1 bn 1 . n n→∞ −→ (6.4.11) Concluimos que a solução da equação de Whittaker tem a forma P∞ bn z n+m+1/2 W (z) = n=0 z/2 . e (6.4.12) Expressando a exponencial no denominador como uma série de potências ez/2 = ∞ X n=0 cn z n , cn = cn+1 2n n! 1 ⇒ = 2n n! cn 2n+1 (n + 1)! n→∞ −→ 1 . 2n (6.4.13) Comparando (6.4.11) com (6.4.13) vemos que os coeficientes decrescem mais rapidamente para a série no denominador. Assim, o comportamento da função quando z → ∞ é dominado pelo numerador e portanto não converge para zero. Para a função de Whittaker convergir para zero quando z → ∞2 requeremos que exista um inteiro, n0 tal que n0 + m − k + 1/2 = 0 , n0 ∈ N0 . (6.4.14) Voltemos agora à equação radial (6.4.3). Para a transformar na forma da equação de Whittaker, (6.4.4) introduzimos a variável z tal que z2 2me E ≡ − 2 r2 4 ~ ⇒ z= √ −8me E r. ~ (6.4.15) Note-se que esta transformação só é possı́vel para E < 0, isto é para os estados ligados, que são exactamente aqueles para os quais esperamos encontrar quantificação da energia. Fazendo esta transformação, (6.4.3) fica da forma de (6.4.4), com r 1 me e2 , m=ℓ+ . − k= 4πǫ0 ~ 2E 2 2 Esta condição é necessária para a função de onda ser normalizável. (6.4.16) 182 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.4: Espectro de energias do Hidrogénio; na figura o número quântico principal é denotado por n (extraı́do de Cohen et al., ‘Quantum Mechanics’). A condição de que a série pára (6.4.14) fica r 1 e2 me 1 n0 + ℓ + − − + =0 ⇔ 2 4πǫ0 ~ 2E 2 E=− e2 4πǫ0 ~ 2 me , (6.4.17) 2(n0 + ℓ + 1)2 ou definindo o número quântico principal N ≡ n0 + ℓ + 1 obtemos 2 2 me e , EN = − 4πǫ0 ~ 2N 2 (6.4.18) que é o espectro de energias do átomo de hidrogénio visto no capı́tulo 2 (relação (2.2.12) com Z = 1). Este espectro de energias só depende do número quântico principal, mas não do momento angular total definido por ℓ ou do momento angular azimutal definido por m. Assim o espectro é degenerado de duas maneiras • Um determinado número quântico principal N pode ser obtido tomando ℓ = 0, 1, . . . , N − 1 , (6.4.19) 6.4 O átomo de hidrogénio (sem spin) 183 E r V(r) Figura 6.5: Espectro de energias do Hidrogénio versus o potencial; compare-se com o caso do oscilador harmónico exibido na figura 5.1. e o correspondente n0 para complementar. Assim temos uma degenerescência de grau N. Na notação dos espectroscopistas a cada valor de ℓ = 0, 1, 2 . . . é atribuı́do uma letra, respectivamente ℓ = s, p, d, f, g, . . . seguindo-se a ordem alfabética. É por isso usual encontrar uma referência, por exemplo, à orbital 2p, o que significa N = 2, ℓ = 1. Esta degenerescência é exibida na figura 6.4; • Para cada ℓ temos 2ℓ + 1 valores possı́veis de m m = −ℓ, −ℓ + 1, . . . , ℓ − 1, ℓ ; (6.4.20) Assim o grau total de degenerescência é, para o nı́vel N 1 + 3 + 5 + . . . + 2N − 1 = N 2 . (6.4.21) Orbitais Para exibirmos a forma explı́cita das funções de onda, também designadas neste contexto por orbitais, notamos que se introduzirmos o raio de Bohr a0 ≡ 4πǫ0 ~2 , me e2 (6.4.22) ~2 1 , 2me a20 N 2 (6.4.23) o espectro de energias (6.4.18) escreve-se EN = − 184 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.6: Funções de onda radiais f(1,0) , f(2,0) e f(2,1) ; na notação da figura R(n,ℓ) = f(N,ℓ) (extraı́do de Cohen et al., ‘Quantum Mechanics’). e como tal a transformação (6.4.15) fica z= 2 r. a0 N (6.4.24) Deste modo, a função de onda radial (6.4.2) fica n+ℓ+1 2r W (z = 2r/Na0 ) e−r/a0 N X R(r) bn = = f(N,ℓ) (r) = . r r r Na 0 n (6.4.25) Notando que usando (6.4.23) em (6.4.16) obtemos k = N, a relação de recorrência é bn+1 = n+ℓ+1−N bn . (n + 1)(n + 2ℓ + 2) A relação de normalização será em geral Z ∞ ∗ f(N,ℓ) f(N,ℓ) r 2 dr = 1 . (6.4.26) (6.4.27) 0 Exemplos: • Estado fundamental: N = 1 ⇒ ℓ = 0; a relação de recorrência reduz-se a bn+1 = n bn , (n + 1)(n + 2) ⇒ b0 ≡ C , bn = 0, n ≥ 1 . (6.4.28) 6.4 O átomo de hidrogénio (sem spin) 185 Logo f(1,0) = 2C −r/a0 e . a0 (6.4.29) Normalizando, Z +∞ r 2 e−2r/a0 dr = 0 a30 4 √ C = 1/ a0 , normalizar ⇒ (6.4.30) onde integramos por partes. Deste modo a função de onda total para o primeiro nı́vel do átomo de hidrogénio, Ψ(N,ℓ,m) (t, r, θ, φ), é 1 e−r/a0 −iE1 t/~ Ψ(1,0,0) (t, r, θ, φ) = f(1,0) (r)Y00 (θ, φ)e−iE1 t/~ = √ e . π (a0 )3/2 (6.4.31) • Orbital 2s: N = 2, ℓ = 0; a relação de recorrência reduz-se a bn+1 = n−1 bn , (n + 1)(n + 2) ⇒ b0 ≡ C , b1 = − C , bn = 0, n ≥ 2 . 2 (6.4.32) Logo f(2,0) C = 2a0 r 2− e−r/2a0 . a0 (6.4.33) Normalizando, Z +∞ 0 r n e−r/a0 dr = (n − 1)!an+1 0 normalizar ⇒ √ C = 1/ 2a0 , (6.4.34) onde integramos por partes. Logo a função de onda total para a orbital 2s do átomo de hidrogénio, é Ψ(2,0,0) (t, r, θ, φ) = f(2,0) (r)Y00 (θ, φ)e−iE2 t/~ 1 = √ 4 2π r 2− a0 e−r/2a0 −iE2 t/~ e . (a0 )3/2 (6.4.35) • As funções de onda radiais para os nı́veis seguintes serão exponenciais multiplicadas por um polinómio de r; na figura 6.6 estão representadas f(1,0) , f(2,0) e f(2,1) . Repetindo este raciocı́nio para todas as orbitais dos três primeiros nı́veis de energia do átomo de Hidrogénio obtemos a seguinte tabela: 186 Momento Angular Orbital e o Átomo de Hidrogénio N ℓ m 1 0 0 2 0 0 2 1 0 2 1 ±1 3 0 0 3 1 0 3 1 ±1 3 2 3 2 ±1 3 2 ±2 0 Função de onda 1 e−r/a0 −iE1 t/~ e Ψ(1,0,0) (t, r, θ, φ) = √ π (a0)3/2 1 r e−r/2a0 −iE2 t/~ e Ψ(2,0,0) (t, r, θ, φ) = √ 2− a0 (a0 )3/2 4 2π 1 r e−r/2a0 cos θe−iE2 t/~ Ψ(2,1,0) (t, r, θ, φ) = √ 3/2 a (a ) 4 2π 0 0 1 r e−r/2a0 sin θe±iφ e−iE2 t/~ Ψ(2,1,±1) (t, r, θ, φ) = √ 3/2 8 π a 0 (a0 ) r 2 e−r/3a0 −iE3 t/~ r 1 e 27 − 18 + 2 2 Ψ(3,0,0) (t, r, θ, φ) = √ 3/2 a a (a ) 81√ 3π 0 0 0 2 r e−r/3a0 r cos θe−iE3 t/~ 6− Ψ(3,1,0) (t, r, θ, φ) = √ 81 π a0 a0 (a0 )3/2 1 r e−r/3a0 r Ψ(3,1,±1) (t, r, θ, φ) = √ sin θe±iφ e−iE3 t/~ 6− 3/2 a0 a0 (a0 ) 81 π 1 r 2 e−r/3a0 (3 cos2 θ − 1)e−iE3 t/~ Ψ(3,2,0) (t, r, θ, φ) = √ 2 3/2 a (a ) 81 6π 0 0 1 r 2 e−r/3a0 sin θ cos θe±iφ e−iE3 t/~ Ψ(3,2,±1) (t, r, θ, φ) = √ 2 3/2 81 π a0 (a0 ) 1 r 2 e−r/3a0 √ sin2 θe±2iφ e−iE3 t/~ Ψ(3,2,±2) (t, r, θ, φ) = 162 π a20 (a0 )3/2 Note-se que a densidade de probabilidade na direcção radial tem a forma ∗ P(N,ℓ) (r)dr = r 2 f(N,ℓ) f(N,ℓ) dr , (6.4.36) que pode ser representada como na figura 6.7. Juntando esta informação com a dos harmónicos esféricos obtemos uma representação da densidade de probabilidade electrónica das orbitais do átomo de hidrogénio dada na figura 6.8. Novas orbitais, ditas hı́bridas, podem ser construı́das sobrepondo diferentes orbitais com o mesmo N. Terminamos esta secção com a observação que na notação de Dirac, as orbitais do átomo de hidrogénio podem ser escritas como os estados {|N, ℓ, mi}, que diagonalizam o C.C.O.C. composto por Ĥ, L̂2 , L̂z e que obedecem a Ĥ|N, ℓ, mi = EN |N, ℓ, mi = − 2 2 L̂ |N, ℓ, mi = ~ ℓ(ℓ + 1)|N, ℓ, mi , ~2 |N, ℓ, mi , 2me a20 N 2 L̂z |N, ℓ, mi = m~|N, ℓ, mi , onde N ∈ N e ℓ, m ∈ N0 com as restrições 0 ≤ ℓ ≤ N − 1 e |m| ≤ ℓ. (6.4.37) 6.4 O átomo de hidrogénio (sem spin) 187 Figura 6.7: Densidade de probabilidade na direcção radial para as funções de onda do átomo de hidrogénio (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). 188 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.8: Representação artı́stica das primeiras orbitais do átomo de hidrogénio (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). 6.5 O átomo de hidrogénio (sem spin) num campo magnético 6.5 189 O átomo de hidrogénio (sem spin) num campo magnético Vimos na secção anterior a resolução exacta do problema do átomo de hidrogénio (sem spin) em Mecânica Quântica. Na secção 5.3 tinhamos visto a resolução exacta do problema de uma carga num campo magnético uniforme. Vamos agora combinar estes dois problemas e considerar que o átomo de hidrogénio está imerso num campo magnético, que tomamos como sendo uniforme. Note-se que esta última hipótese é perfeitamente adequada à experimentação, uma vez que os campos magnéticos produzidos no laboratório variam muito pouco em escalas da ordem do tamanho atómico. Não nos irá ser possı́vel, neste caso, a resolução exacta do problema. Mas com algumas aproximações conseguiremos determinar a alteração do espectro do átomo de hidrogénio devida ao campo magnético, denominada Efeito Zeeman. 6.5.1 Dedução dos vários termos do Hamiltoniano O Hamiltoniano clássico para um electrão (carga q massa me ), num campo electromagnético é dado por (1.3.20) H= ~ 2 (~p − q A) + qφ . 2me (6.5.1) ~ uniforme, podemos escrever o potencial magnético na forma Sendo o campo B ~ = − 1 ~r × B ~ A 2 ⇔ ~ = − 1 (yBz − zBy , zBx − xBz , xBy − yBx ) ; A 2 (6.5.2) ~ é constante, segue-se que de facto, como B ~ = (Bx , By , Bz ) = B ~ , ∇×A (6.5.3) como é necessário pela definição de potencial magnético. Logo, para o problema quântico, expressamos o operador Hamiltoniano, obtido por quantificação canónica, na forma: Ĥ = h i2 ~ ~ ~ P̂ + 2q R̂ × B 2me ~ + qφ(R̂) . (6.5.4) 190 Momento Angular Orbital e o Átomo de Hidrogénio ~ sendo constante não é operador. Tratemos do quadrado perfeito Note-se que B i2 h i h i h q~ q~ q~ ~ ~ ~ ~ = P̂ ~ · P̂ ~ + R̂ × B + R̂ × B P̂ + R̂ × B 2 2 2 q2 2 ~2 q ~ ~ ~ ~ ~ ~ + (R̂ × B) ~ · P̂ + ~ . = P̂ + P̂ · (R̂ × B) R̂ × B 2 4 (6.5.5) Consideremos as seguintes identidades do cálculo vectorial ~ × B) ~ · (C ~ × D) ~ = (A ~ · C)( ~ B ~ · D) ~ − (A ~ · D)( ~ B ~ · C) ~ , (A ~ · (B ~ × C) ~ =C ~ · (A ~ × B) ~ , A (6.5.6) sendo que a segunda pode ser reescrita como ~ × B) ~ ·C ~ = −(A ~ × C) ~ ·B ~ . (A (6.5.7) Aplicando estas identidades a (6.5.5) obtemos h q2 2 i2 q~ ~ ~2 q ~ ~ ~ ~ ~ ~ ~ ~2 ~ ~ 2 ~ P̂ + R̂ × B = P̂ + B · (P̂ × R̂) − (R̂ × P̂ ) · B + R̂ B − (R̂ · B) . 2 2 4 (6.5.8) Verificamos que surge o operador momento angular ~ ~ ~ ~ ~ L̂ = R̂ × P̂ = −P̂ × R̂ , (6.5.9) ~ ~ onde a segunda igualdade é verdadeira apesar de R̂ e P̂ não comutarem; de facto cada componente do momento angular é da forma X̂ i P̂j − X̂ j P̂i com i 6= j, pelo que a ordem com que aparecem as posições e os momentos é irrelevante. Logo o Hamiltoniano do problema é ~2 P̂ q ~ ~ q2 2 ~ 2 ~ ~ ~ 2 Ĥ = + qφ(R̂) , R̂ B − (R̂ · B) − L̂ · B + 2me 2me 8me (6.5.10) que reescrevemos como Ĥ ≡ Ĥ0 + Ĥ1 + Ĥ2 , (6.5.11) onde definimos ~2 P̂ ~ + qφ(R̂) , Ĥ0 ≡ 2me Ĥ1 ≡ − µB ~ ~ L̂ · B , ~ Ĥ2 ≡ ~2 q2B R̂2 , 8me ⊥ (6.5.12) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 191 e ainda, o magnetão de Bohr µB ≡ q~ , 2me (6.5.13) que tem as dimensões de um momento magnético (carga vezes momento angular a dividir por massa), e o operador ~ ~ 2 ~ 2 (R̂ · B) 2 R̂⊥ = R̂ − , ~2 B (6.5.14) ~ ~ Se escolhermos um sistema cartesiano que é a projecção de R̂ num plano perpendicular a B. ~ = Bez , fica eB 2 R̂⊥ = X̂ 2 + Ŷ 2 . (6.5.15) Notemos os casos limites deste Hamiltoniano: ~ = 0, Ĥ fica reduzido a Ĥ0 , que, com o potencial de Coulomb é o problema • Tomando B da secção 6.4; ~ = Bez , Ĥ fica • Tomando φ = 0 e escolhendo B Ĥ = P̂x2 + P̂y2 + P̂z2 qB q2B 2 2 − L̂z + X̂ + Ŷ 2 , 2me 2me 8me (6.5.16) que coincide com o Hamiltoniano (5.3.4) do problema de Landau. 6.5.2 Interpretação dos vários termos do Hamiltoniano ~ = 0 o Hamiltoniano reduz-se a Ĥ0 , isto é a soma da energia cinética com a Quando B ~ = energia potencial. Mas quando B 6 0, Ĥ0 já não pode ser interpretado como a energia cinética mais a energia potencial. Para verificarmos este ponto consideremos a seguinte análise clássica. O Hamiltoniano de uma carga sob a acção de um campo electromagnético é dado por (1.3.20) que podemos reescrever em termos da velocidade H= ~ 2 (~p − q A) 1 2 + qφ = me~x˙ + qφ , 2me 2 (6.5.17) logo a energia cinética na presença de um campo magnético é Ec = ~ 2 (~p − q A) , 2me (6.5.18) 192 Momento Angular Orbital e o Átomo de Hidrogénio ~ Para um e não p~2 /2me . O significado fı́sico de p~2 /2me depende da gauge escolhida para A. ~ uniforme, com a escolha de gauge (6.5.2) e tomando B ~ = Bez temos (usando a campo B frequência ciclotrónica ωc = qB/me ) ~p q ~ = p~ − ωc r (cos φey −sin φex ) ~x˙ = + ~r × B me 2me me 2 ⇔ ~p ωc r = ~x˙ − (sin φex −cos φey ) , me 2 (6.5.19) ou seja a ‘velocidade’ p~/me é a velocidade da partı́cula relativamente a um referencial em rotação em torno da direcção do campo uniforme, com velocidade angular ωc /2, no sentido directo, denominado referencial de Larmor. Assim, • H0 é a energia cinética da partı́cula relativamente ao referencial de Larmor mais a energia potencial; • H2 , que coincide com i2 me h ωc r (sin φex − cos φey ) , 2 2 (6.5.20) é a energia cinética do referencial de Larmor; • H1 é um termo cruzado que surge sempre que a velocidade da partı́cula relativamente ao referencial de Larmor não seja ortogonal à velocidade do referencial de Larmor. A interpretação que acabamos de dar dos vários termos é puramente mecânica. Mas os termos Ĥ1 e Ĥ2 têm também uma interpretação electromagnética de interesse. Para a compreendermos consideramos novamente uma análise clássica. Define-se geralmente a densidade de momento magnético (ou magnetização) como sendo i 1h ~ ~ M(~x) = ~x × i(~x) , 2 (6.5.21) onde ~i é o vector densidade de corrente; o integral da densidade de magnetização é a magnetização total ou momento magnético total ou ainda o dipolo magnético 1 ~µ = 2 Z V ~x × ~i(~x)d3~x . (6.5.22) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 193 No caso em que uma corrente com intensidade I só existe ao longo de um circuito fechado e planar, com elemento de linha d~l, o integral de volume reduz-se a um integral de linha fechado I ~µ = 2 I ~x × d~l = AIn , (6.5.23) onde n é a ortogonal ao plano com orientação dada pelo sentido da corrente e A é a área planar delimitada pelo circuito. Se considerarmos uma carga com movimento circular e uniforme com velocidade angular v/r = ω, associamos-lhe uma intensidade de corrente I = densidade de carga × velocidade = qv ; 2πr (6.5.24) como a superfı́cie delimitada pelo circuito tem área A = πr 2 , o momento magnético é ~µ = IAn = qvr n. 2 (6.5.25) ~ de uma tal carga com um movimento circular Consideremos agora o momento angular L e uniforme anterior que se move num campo magnético constante que representamos na gauge (6.5.2); por definição ~ , ~ = ~r × ~p = ~r × (me~v + q A) ~ = me rvn − q ~r × (~r × B) L 2 (6.5.26) que usando a identidade ~a × (~b × ~c) = ~b(~a · ~c) − ~c(~a · ~b) , e (6.5.25) reescrevemos como i qh 2me 2~ ~ ~ (~r · B)~r − r B ~µ − L= q 2 ⇔ (6.5.27) i q ~ q2 h 2~ ~ ~µ = L+ (~r · B)~r − r B . (6.5.28) 2me 4me Assim, a nossa carga tem duas contribuições para o seu momento magnético. Uma devido a estar numa órbita circular e consequentemente ter momento angular; uma segunda devido a estar imersa num campo magnético. A densidade de energia3 devida à interacção entre o momento magnético e um campo magnético externo é i q ~ ~ q2 h 2 2 ~ ~ 2 , dH = −~µ · dB ⇒ H=− L·B+ r B − (~r · B) 2me 8me (6.5.29) ~ onde Em sistemas magnéticos a segunda lei da termodinâmica pode ser escrita dF = −SdT − µ ~ · dB, F é a energia livre de Helmholtz. 3 194 Momento Angular Orbital e o Átomo de Hidrogénio que são exactamente os análogos clássicos dos termos Ĥ1 e Ĥ2 em (6.5.10). Assim o termo H1 pode ser escrito como ~ , H1 = −~µL · B (6.5.30) onde ~µL = q ~ L. 2me (6.5.31) Este termo é, portanto, a energia de acoplamento entre o campo magnético externo e o momento magnético do electrão que resulta do seu momento angular, ~µL . É denominado acoplamento paramagnético, pois é energeticamente vantajoso o momento magnético do electrão encontrar-se paralelo ao campo externo. Por outro lado, o termo H2 , é a energia de acoplamento entre o campo magnético externo e o momento magnético do electrão que é induzido pelo próprio campo externo. A sua contribuição para a energia é positiva pelo que este momento magnético induzido é anti-paralelo ao campo indutor. É denominado acoplamento diamagnético. Como veremos na próxima secção, o acoplamento diamagnético é bem menos importante que o paramagnético e só tem de ser considerado em estados com momento angular zero. Na natureza, substâncias diamagnéticas consistem de átomos ou moléculas com momento angular total zero. A aplicação de um campo magnético externo leva à criação de correntes atómicas em circulação que produzem um momento magnético antiparalelo ao campo externo; de facto, o termo diamagnético é o associado ao referencial de Larmor, como vimos em cima. O Bismuto é a substância mais diamagnética conhecida. Se os átomos ou moléculas constituintes da substância tiverem um momento angular total não nulo, oriundo de electrões desemparelhados, a substância é paramagnética. Imerso num campo magnético, o momento magnético do electrão desemparelhado alinhar-se-á paralelamente ao campo. Nota: Em geral, uma carga q (massa m) com momento angular J~, seja ele de origem orbital ou intrı́nseco (spin), tem um momento magnético dado por ~µ = g q ~ J , 2m (6.5.32) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 195 onde g se denomina a razão giromagnética. Para uma carga clássica com o J~ de origem orbital, g = 1 - como exemplificado em cima - mas para o electrão com o seu J~ intrı́nseco, verifica-se que g ≃ 2. De facto g = 2 é a previsão da equação de onda relativista (eq. de Dirac), mas efeitos associados às flutuações quânticas do vácuo alteram ligeiramente este valor, denominado por razão giromagnética anómala. Este valor pode ser calculado em electrodinâmica quântica (QED) com grande precisão e o acordo com a experiência verifica-se com 10 algarismos significativos! 6.5.3 Comparação dos vários termos no Hamiltoniano ~ =0 Vamos agora comparar as ordens de magnitude dos três termos em (6.5.10). Quando B ficamos apenas com Ĥ0 , cujo espectro de energias é (6.4.23). Como tal associamos com este termo energias da ordem de E0 ∼ ~2 . me a20 (6.5.33) Pela forma do operador Ĥ1 (6.5.12), tomando um campo magnético na direcção z e recordando que os valores próprios de L̂z são inteiros vezes ~ concluimos que dará origem a energias da ordem de E1 ∼ qB~ . me (6.5.34) 2 Por outro lado, assumindo que os elementos de matriz do operador R̂⊥ são da ordem de grandeza de a20 , dado que o raio de Bohr caracteriza as distâncias atómicas, temos que q 2 B 2 a20 . E2 ∼ me (6.5.35) Concluimos imediatamente as seguintes ordens de grandeza relativas: E2 E1 Bqa20 ∼ ∼ ∼ B(Tesla) × 10−5 . E1 E0 ~ (6.5.36) Sendo os maiores campos magnéticos produzidos em laboratório da ordem dos 100 Tesla, concluimos que nessas experiências E2 ≪ E1 ≪ E0 . 196 Momento Angular Orbital e o Átomo de Hidrogénio 6.5.4 Espectro de Energias aproximado: efeito Zeeman Vamos agora então levar a cabo a tarefa a que nos propusemos: ver como o espectro de um átomo de hidrogénio se altera quando imerso num campo magnético. A aproximação que vamos usar é a de negligenciar o termo Ĥ2 , que, como vimos na secção anterior, tem uma grandeza inferior aos outros dois. Assim, consideramos como Hamiltoniano aproximado ~2 q ~ ~ P̂ ~ + qφ(R̂) − L̂ · B . Ĥ ≃ Ĥ0 + Ĥ1 = 2me 2me (6.5.37) Ao fazermos esta aproximação, o único operador novo relativamente ao problema do átomo ~ ~ de hidrogénio sem campo magnético (descrito por Ĥ0 ) é L̂ · B; no problema sem campo ~ = Bez , verificamos que o magnético tomamos o C.C.O.C.= {Ĥ0 , L̂2 , L̂z }. Tomando B único operador no termo novo é L̂z , que é diagonalizado pelos mesmos estados que diagonalizam Ĥ0 , que têm a forma (6.4.37). A acção do operador Hamiltoniano nestes estados é dada por Ĥ|N, ℓ, mi = − qB ~2 − m~ |N, ℓ, mi , 2me a20 N 2 2me (6.5.38) pelo que o espectro de energias é agora E(N,m) = EN − µB Bm , (6.5.39) onde EN é espectro do átomo de hidrogénio livre, dado por (6.4.23). Há, portanto um levantamento da degenerescência do espectro de energias; estados com o mesmo número quântico principal, N, mas diferente número quântico azimutal, m, irão em geral ter diferentes energias: efeito Zeeman. Mas note-se que a degenerescência do espectro de energias não é totalmente eliminada; resiste ainda a degenerescência que origina de estados com diferente ℓ mas com o mesmo N e m. Deste modo a degenerescência decresce de N 2 para N − |m| (para valores genéricos de B). Duas notas: • A aproximação falha para estados com m = 0; para esses, a primeira correcção ao espectro do átomo de hidrogénio origina no termo negligenciado (termo diamagnético); 6.5 O átomo de hidrogénio (sem spin) num campo magnético Sem Campo Magnetico Espectro sem Campo 197 Com Campo Magnetico Espectro com Campo Figura 6.9: Efeito Zeeman: Desdobramento das linhas espectrais devido à presença de um campo magnético. Note-se que nem todas as transições são possı́veis; de facto há regras de selecção. • Na realidade, tanto o electrão como o protão têm spin, que estamos aqui a negligenciar. Por essa razão, o espectro anterior não é o observado numa experiência fı́sica real. Mas a inclusão de spin é uma generalização simples do cálculo aqui exemplificado e o efeito fı́sico da alteração das energias (e também das polarizações que veremos a seguir) permanece válido qualitativamente. A presença do campo magnético altera genericamente, como vimos, a energia dos estados estacionários do átomo de hidrogénio. Como tal, a frequência da radiação emitida em transições atómicas é também alterada. Em geral existe um desdobramento das riscas espectrais, como exemplificado na figura 6.9. Mas para além desta alteração das frequências possı́veis, o efeito Zeeman consiste também na alteração da polarização dos fotões emitidos numa transição atómica. Para estudarmos este ponto, consideramos o operador dipolo eléctrico, definido por ~ ~ D̂ ≡ q R̂ . (6.5.40) Consideremos os elementos de matriz deste operador num estado estacionário do átomo de hidrogénio imerso no campo magnético. Continuamos a considerar a aproximação em 198 Momento Angular Orbital e o Átomo de Hidrogénio que negligenciamos o termo diamagnético. Estes estados são os mesmos dos átomo de hidrogénio livre {|N, ℓ, mi}, apenas possuindo energias diferentes. Estes estados têm uma paridade bem definida. Pode-se verificar que Yℓm tem paridade (−1)ℓ . Logo, os estados ~ {|N, ℓ, mi} têm paridade (−1)ℓ . Por outro lado, o operador D̂ é ı́mpar. Logo ~ hN, ℓ, m|D̂|N, ℓ, mi = 0 , (6.5.41) em qualquer estado estacionário. Para termos um dipolo diferente de zero temos de considerar uma sobreposição de estados estacionários. Tomemos uma sobreposição dos estados 1s e 2p, isto é |Ψ(0)i = cos α|1, 0, 0i + sin α|2, 1, mi , (6.5.42) onde m = 0, ±1 e α ∈ R. A energia destes dois estados é E1s = E1 , E2p = E2 − µB Bm = E1 + ~(Ω + mωL ) , (6.5.43) onde EN é dado por (6.4.23), e introduzimos Ω≡ E2 − E1 , ~ ωL ≡ − ωc , 2 (6.5.44) respectivamente a frequência angular associada a um fotão emitido na transição de N = 2 para N = 1 do átomo de hidrogénio livre e a frequência angular do referencial de Larmor. Logo |Ψ(t)i = cos α|1, 0, 0i + sin αe−i(Ω+mωL )t |2, 1, mi e−iE1 t/~ . (6.5.45) Vamos agora calcular o valor esperado do operador dipolo neste estado ~ ~ hD̂i(t) = hΨ(t)|D̂|Ψ(t)i . ~ ~ i(Ω+mωL )t −i(Ω+mωL )t = sin α cos α e h2, 1, m|D̂|1, 0, 0i + e h1, 0, 0|D̂|2, 1, mi (6.5.46) Para calcularmos estes elementos de matriz notamos que ~ D̂ = (D̂x , D̂y , D̂z ) = q(X̂, Ŷ , Ẑ) . (6.5.47) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 199 Por outro lado, recordando a forma dos harmónicos esféricos com ℓ = 1, dada por (6.2.45), (6.2.46) e (6.2.47), podemos escrever estes harmónicos em coordenadas cartesianas como r r 3 z 3 x y ±1 0 ; (6.5.48) , Y1 = ∓ ±i Y1 = 4π r 8π r r invertendo estas relações obtemos r r 2π 2π −1 1 x= r Y1 − Y1 , y = i r Y1−1 + Y11 , 3 3 z= r 4π 0 rY . 3 1 (6.5.49) Deste modo, usando a representação do produto escalar no espaço de configurações temos h1, 0, 0|D̂x|2, 1, mi = r Z 2π Z π Z +∞ 2π 2 0 ∗ = r Y1−1 − Y11 f(2,1) (r)Y1m dφ dθ drr sin θ f(1,0) (r)Y0 q 3 0 Z 2π 0 Z π 0 qχ =√ dφ dθ sin θ Y1−1 − Y11 Y1m , 6 0 0 (6.5.50) onde definimos χ≡ Z +∞ r 3 f(1,0) (r)f(2,1) (r)dr , (6.5.51) 0 e usamos o facto que as funções de onda radiais são reais. Usamos também o valor de Y00 = √ 1/ 4π. Usamos agora o facto de que os harmónicos esféricos são uma base ortonormal do espaço de funções de quadrado somável na esfera. A relação de ortonormalização é Z 2π Z π ′ mm′ dφ dθ sin θ(Yℓm (θ, φ))∗ Yℓm . (6.5.52) ′ (θ, φ) = δℓℓ′ δ 0 0 Logo, dado que (Y1±1 )∗ = −Y1∓1 Z Z π ∗ qχ 2π qχ dφ h1, 0, 0|D̂x|2, 1, mi = √ dθ sin θ −Y11 + Y1−1 Y1m = √ (−δ 1m + δ −1m ) . 6 0 6 0 (6.5.53) Cálculos análogos revelam que Z Z π qχ qχ 2π dφ dθ sin θi Y11 + Y1−1 Y1m = −i √ (δ 1m + δ −1m ) , h1, 0, 0|D̂y |2, 1, mi = √ 6 0 6 0 (6.5.54) Z Z π qχ 2π qχ h1, 0, 0|D̂z |2, 1, mi = √ (6.5.55) dφ dθ sin θY10 Y1m = √ δ 0m . 3 0 3 0 200 Momento Angular Orbital e o Átomo de Hidrogénio Podemos agora concluir que o valor esperado das várias componentes do operador dipolo eléctrico é o seguinte: qχ hD̂x i(t) = √ sin(2α) cos[(Ω − ωL )t]δ −1m − cos[(Ω + ωL )t]δ 1m , 6 qχ hD̂y i(t) = − √ sin(2α) sin[(Ω − ωL )t]δ −1m + sin[(Ω + ωL )t]δ 1m , 6 qχ hD̂z i(t) = √ sin(2α) cos(Ωt)δ m0 . 3 (6.5.56) (6.5.57) (6.5.58) Para qualquer um dos três valores possı́veis de m, o valor esperado do dipolo eléctrico é uma função oscilatória do tempo. Logo haverá emissão de radiação electromagnética. Podemos pensar nessa radiação como sendo emitida devido à transição |2, 1, mi → |1, 0, 0i. Para estudarmos as caracterı́sticas dessa radição tomemos os três valores possı́veis de m separadamente: • m = +1, temos qχ qχ hD̂y i(t) = − √ sin(2α) sin[(Ω + ωL )t] , hD̂x i(t) = − √ sin(2α) cos[(Ω + ωL )t] , 6 6 hD̂z i(t) = 0 . (6.5.59) A frequência angular da radiação emitida, ωrad , é igual à frequência angular de oscilação do dipolo: ωrad = Ω + ωL ⇒ νrad = E(2,1) − E(1,0) ωrad (E2 − µB B) − E1 = = , (6.5.60) 2π h h que é exactamente a frequência esperada na transição |2, 1, 1i → |1, 0, 0i. A polarização da radiação emitida vai depender da direcção. Consideremos a direcção com versor ~n. De acordo com o electromagnetismo clássico, o estado de polarização da radiação será dado pelo vector ~k p = (~n × D) ~ × ~n = D ~ − ~n(~n · D) ~ ⇔ (kxp , kyp , kzp ) = ((1 − n2x )Dx − nx ny Dy , (1 − n2y )Dy − nx ny Dx , −nz (nx Dx + ny Dy )) , (6.5.61) ~ num plano ortogonal a ~n. que corresponde a projecção de D 6.5 O átomo de hidrogénio (sem spin) num campo magnético 201 - Radiação emitida na direcção Oz: nx = ny = 0, logo ~k p = D ~ ⇒ (k p )2 + (k p )2 = constante ; x y (6.5.62) A polarização é circular no sentido directo que é o movimento efectuado pelo vector dipolo eléctrico; - Radiação emitida na direcção xOy: nz = 0, logo n2x + n2y = 1, pelo que ~k p = (ny (ny Dx − nx Dy ), nx (nx Dy − ny Dx ), 0) ⇒ nx k p = −ny k p ; (6.5.63) x y A polarização é linear; - Numa direcção arbitrária a polarização é elı́ptica. • m = 0, temos hD̂x i(t) = 0 , hD̂y i(t) = 0 , qχ hD̂z i(t) = √ sin(2α) cos(Ωt) . 3 (6.5.64) A frequência angular é ωrad = Ω ⇒ νrad = E(2,0) − E(1,0) ωrad E2 − E1 = = , 2π h h (6.5.65) que é exactamente a frequência esperada na transição |2, 1, 0i → |1, 0, 0i. A polarização neste caso é linear em todas as direcções excepto na direcção Oz, em que não é emitida radiação. • m = −1, temos qχ qχ hD̂y i(t) = − √ sin(2α) sin[(Ω − ωL )t] , hD̂x i(t) = √ sin(2α) cos[(Ω − ωL )t] , 6 6 hD̂z i(t) = 0 . (6.5.66) A frequência angular da radiação emitida é igual à frequência angular de oscilação do dipolo: ωrad = Ω − ωL ⇒ νrad = E(2,−1) − E(1,0) ωrad (E2 + µB B) − E1 = = , (6.5.67) 2π h h 202 Momento Angular Orbital e o Átomo de Hidrogénio (E 2 − E1 )/h ν (E 2 − E1 )/h ν Figura 6.10: Efeito Zeeman - esquerda: riscas observadas na direcção perpendicular ao ~ campo; a polarização da radiação é linear em todas elas, mas é paralela ao campo B na risca central e perpendicular nas riscas laterais; direita: riscas observadas na direcção do campo; têm polarização circular. O espaçamento entre a risca central e as laterais é ∆ν = µB B/h (adaptado de Cohen et al., ‘Quantum Mechanics’). que é exactamente a frequência esperada na transição |2, 1, −1i → |1, 0, 0i. A análise da polarização é semelhante à do caso m = +1, com a diferença de ser circular inversa para a emissão na direcção Oz. As riscas espectrais que acabamos de discutir estão representadas na figura 6.10. Note-se que o resultado da introdução do campo magnético, efeito Zeeman, é não só o aparecimento de novas riscas, mas também de diferentes polarizações. Como nota final mencionamos que o tratamento da radiação dado nesta secção foi clássico, ao contrário do dado ao átomo que foi quântico. Note-se que usamos o teorema ~ ~ e assim deduzirmos de Ehrenfest para associarmos hD̂(t)i com quantidade clássica D(t) a polarização da radiação. Neste sentido, usamos uma aproximação semi-clássica para o problema ‘átomo+radiação’. 6.6 Sumário Estudamos os operadores que descrevem as várias componentes do momento angular e também o momento angular total. Em mecânica clássica, para descrever o momento angular de um sistema fı́sico necessitamos de três números, correspondendo às três componentes do momento angular. Em mecânica quântica os estados próprios do momento angular têm apenas dois números quânticos, correspondendo ao número máximo de operadores que 6.6 Sumário 203 conseguimos diagonalizar simulaneamente: L̂2 e, por escolha, L̂z . Construimos explicitamente a representação no espaço de configurações das funções próprias comuns a estes dois operadores denominadas harmónicos esféricos. Consideramos uma partı́cula num potencial central e mostramos que os estados estacionários vão ter também momento angular bem definido. Especializando para o potencial de Coulomb, deduzimos as funções de onda que diagonalizam simultaneamente a energia, o momento angular total e o momento angular azimutal. Obtemos como resultado (e de primeiros princı́pios) a quantificação da energia que havı́amos estudado no capı́tulo 2 para o átomo de hidrogénio no modelo de Bohr, que reproduzia a fórmula de Balmer para o espectro do hidrogénio. Note-se no entanto que o nosso estudo do átomo de hidrogénio foi incompleto devido à não inclusão do spin. Esta quantidade leva à existência no espectro do hidrogénio duma sub estrutura do espectro que nós deduzimos, denominada estrutura fina. Mergulhamos o átomo de hidrogénio num campo magnético uniforme. Usando uma aproximação em que negligenciamos o termo diamagnético, verificamos o levantamento de parte da degenerescência do espectro de energias correspondendo a inequivalência energética de estados com diferente número quântico azimutal e mesmo número quântico principal. Este facto leva ao aparecimento de novas riscas no espectro do hidrogénio. Estudando o operador dipolo eléctrico vimos também o tipo de polarização correspondente a essas riscas. CAPÍTULO 7 Outras soluções exactas da equação de Schrödinger Soluções analı́ticas exactas da equação de Schrödinger existem apenas para alguns casos especiais; potencias constantes por pedaços (capı́tulo 3), osciladores harmónicos, campos magnéticos constantes (capı́tulo 5) e o potencial de Coulomb (capı́tulo 6) são alguns destes casos que foram estudados aqui. Dada esta limitação, foram construidos vários métodos de aproximação que serão estudados nos próximos capı́tulos. Neste capı́tulo iremos rematar o nosso estudo de modelos exactamente solúveis, procurando esclarecer duas questões: i) Existe alguma estrutura subjacente aos modelos exactamente solúveis? ii) Existe algo análogo aos operadores de criação e destruição do oscilador harmónico para outros modelos exactamente solúveis? Vamos começar por mencionar alguns modelos solúveis, que ilustrarão a dificuldade que, genericamente, existe em os resolver através de um ‘ataque’ directo à equação de Schrödinger, isto é, pelo método diferencial. Seguidamente introduziremos um método algébrico, baseado em operadores análogos aos operadores de criação e destruição do oscilador harmónico. Estes operadores resultam do conceito de superpotencial e potenciais parceiros. Finalmente discutiremos como os potenciais exactamente solúveis têm, genericamente, a propriedade 206 Outras soluções exactas da equação de Schrödinger de invariância de forma, e como esta propriedade pode ser usada para determinar o espectro de energias e as funções próprias de um modelo exactamente solúvel, o que nos permitirá construir, resolver e compreender modelos exactamente solúveis. 7.1 Alguns poços de potencial exactamente solúveis No capı́tulo 3 estudamos potenciais constantes por pedaços. Estes são, obviamente, casos em que existe uma solução exacta da equação de Schrödinger. Não sendo potenciais realistas são casos paradigmáticos que nos ensinam muita da fı́sica desta equação. Dois problemas fundamentais em Mecânica Quântica, que são ilustrados pelos exemplos do capı́tulo 3, são: • Cálculo do espectro de estados ligados: Sempre que temos um estado com energia E num potencial cujo valor assimptótico, para ambos os lados, é maior do que E, este estado é denominado estado ligado. Significa que está “preso” num tipo de poço de potencial. Sempre que existem estados ligados existe discretização de energias. A interpretação fı́sica é que nem todos os comprimentos de onda podem existir no poço de potencial como estados estacionários, devido à interferência com as ondas reflectidas nas paredes do potencial. O cálculo do espectro de energias de estados ligados é um importante problema em Mecânica Quântica. • Cálculo da difusão de uma partı́cula num potencial : A função de onda que descreve a partı́cula quântica sofre difusão, ou espalhamento, que depende das variações no espaço e no tempo do potencial onde se propaga. Em problemas a uma dimensão, esta difusão é quantificada pelos factores de reflexão e transmissão. Em mais do que uma dimensão iremos definir (capı́tulo 9) uma secção eficaz diferencial de difusão. Em qualquer dos casos a difusão da função de onda permite calcular a distribuição de probabilidade espacial de encontar a partı́cula. Esta difusão permite ainda efeitos fı́sicos inexistentes em Mecânica clássica, como o efeito túnel. Um estado com energia E tem uma função de onda não nula mesmo em zonas onde o potencial é maior que a energia (só será zero se o potencial for infinitamente maior do que a energia). Isso 7.1 Alguns poços de potencial exactamente solúveis 207 permite que a função de onda de um estado com energia E seja diferente de zero em ambos os lados de uma barreira de potencial mais elevado do que o valor de E. Esta é a origem do efeito túnel. O cálculo do factor de transmissão através de uma barreira de potencial é também um importante problema em Mecânica Quântica. Neste capı́tulo debruçar-nos-emos exclusivamente sobre o cálculo dos estados ligados. Notese que a difusão, e em particular o factor de transmissão por efeito túnel, será também exactamente calculável num modelo solúvel em que o efeito exista (como no potencial de Pöschl-Teller invertido). 7.1.1 Estados Ligados em Poços infinitos Comecemos por estudar o espectro de estados ligados em alguns potenciais com profundidade infinita. Poço de potencial rectangular de profundidade infinita Como visto na secção 3.2.7, para um poço de profundidade infinita V (x) = 0 para x ∈ [0, L] , V (x) = +∞ para x > L e x < 0 , (7.1.1) o espectro de energias é En = n2 π 2 ~2 , 2mL2 n = 1, 2, 3, . . . e a parte espacial da função de onda normalizada é r nπx 2 Φn (x) = para x ∈ [0, L] , sin L L (7.1.2) (7.1.3) e zero fora deste intervalo. O espectro de energias e as funções de onda dos três estados estacionários de energia mais baixa estão representados nas figuras 7.1 e 7.2. Oscilador Harmónico Como visto no capı́tulo 5, para o potencial harmónico V (x) = mω 2 2 x , 2 (7.1.4) 208 Outras soluções exactas da equação de Schrödinger E E V(x) V(x) x x Figura 7.1: Nı́veis de energia no oscilador harmónico e no poço de potencial rectangular de profundidade infinita. 1 0.6 0.5 0.4 0.2 0 0 -4 -2 0 0 2 0.5 4 1 1.5 2 x x -0.2 -0.5 -0.4 -0.6 -1 Figura 7.2: Funções de onda dos três estados estacionários de energia mais baixa do oscilador harmónico e do poço de potencial rectangular de profundidade infinita. Note-se que o número de nodos aumenta com a energia. o espectro de energias é 1 En = ~ω n + , 2 n = 0, 1, 2, . . . (7.1.5) e a parte espacial da função de onda normalizada é Φn (x) = mω 1/4 π~ √ 1 2n · n! Hn r mω 2 x e−mωx /2~ , ~ (7.1.6) onde Hn são polinómios de Hermite. O espectro de energias e as funções de onda dos três estados estacionários de energia mais baixa estão representados nas figuras 7.1 e 7.2. 7.1 Alguns poços de potencial exactamente solúveis 209 5 4 3 2 1 0 0 1 2 3 4 5 x Figura 7.3: O potencial V (x) = (1/x − x)2 . O espaçamento entre os nı́veis de energia é constante. Poço da forma V0 (a/x − x/a)2 O potencial V (x) = V0 a x − x 2 , a x>0, V0 > 0 , (7.1.7) admite solução analı́tica exacta (ver Folha 1, Problema 1). Este potencial é representado na figura 7.3. O espectro de energias tem a forma ( !) r r r 1 1 8V0 8mV0 a2 8mV0 a2 n+ + +1− , En = ~ ma2 2 4 ~2 ~2 n = 0, 1, 2, . . . e a parte espacial das funções de onda tem a forma ! ! r r 1 mV0 2 2mV0 2 Φn (x) = cn xν exp − , x F −n, ν + , x 2 2 2~ a 2 ~2 a2 onde F (a, b, z) são funções confluentes hipergeométricas, ! r 1 8mV0 a2 ν≡ +1+1 , 2 ~2 (7.1.8) (7.1.9) (7.1.10) e cn são constantes de normalização. Notamos que a função confluente hipergeométrica tem expansão F (a, b; χ) = +∞ X (a)p χp p=0 (b)p p! , (7.1.11) 210 Outras soluções exactas da equação de Schrödinger onde os sı́mbolos de Pochhammer são definidos da seguinte forma: (a)p = a(a + 1)(a + 2) . . . (a + p − 1) , (a)0 = 1 . (7.1.12) Devido ao primeiro argumento da função confluente hipergeométrica ser um inteiro negativo, a função reduz-se a um polinómio finito, de grau n. Explicitamente, nas três primeiras funções de onda usamos F (0, b; χ) = 1 , F (−1, b; χ) = 1 − χ , b F (−2, b; χ) = 1 − 2χ χ2 + . b b(b + 1) (7.1.13) As três primeiras funções de onda dos estados estacionários estão representadas na figura 7.4. Note-se que, devido ao comportamento para x grande ser o mesmo do oscilador harmónico, o espectro é o de um oscilador harmónico. Neste limite o potencial fica aproximadamente V (x) ≃ V0 2 x ,x > 0 a2 V (x) ≃ 0 , x < 0 , ou seja metade de um potencial harmónico com frequência ω = (7.1.14) p 2V0 /ma2 . Para um potencial harmónico truncado desta maneira, só subsistem metade dos nı́veis de energia (funções de onda ı́mpares), pelo que a frequência é efectivamente o dobro da frequência do potencial harmónico completo. Logo, para o potencial (7.1.14) esperamos uma frequência r 2V0 ω=2 , (7.1.15) ma2 que é de facto a que observamos em (7.1.8). Esta é também a frequência para pequenas oscilações à volta do mı́nimo. Note-se que a energia de ponto zero é sempre maior do que a do oscilador harmónico com essa frequência. Este potencial é, de facto, um caso particular do potencial harmónico efectivo três dimensional (Ver problema 4, Folha de problemas 1). Poço da forma V0 cot2 (πx/L) V (x) = V0 cot2 π x , L 0<x<L, V0 > 0 , (7.1.16) também admite solução analı́tica exacta (ver Folha 1, Problema 2). O espectro de energias tem a forma En = n2 + 4nλ − 2λ π 2 ~2 , 2mL2 n = 1, 2, 3, . . . , (7.1.17) 7.1 Alguns poços de potencial exactamente solúveis 211 0.4 0.2 0 0 1 2 3 4 x -0.2 Figura 7.4: Funções de onda dos três estados estacionários de energia mais baixa do potencial V (x) = (1/x − x)2 . O número de nodos aumenta com a energia. onde 1 λ= 4 r 8mV0 L2 +1−1 π 2 ~2 ! . (7.1.18) As funções de onda têm a forma diferente dependendo da paridade de n. Para valores ı́mpares de n, obtemos a função de onda πx −2λ n n 1 2 πx Φn (x) = cn sin , F − − 2λ, , ; cos L 2 2 2 L (7.1.19) enquanto que para valores pares de n obtemos a função de onda πx −2λ n 1 n 1 3 πx 2 πx , F − − 2λ + , + , ; cos cos Φn (x) = cn sin L L 2 2 2 2 2 L (7.1.20) onde F (a, b, c; z) são funções hipergeométricas. Na secção 7.2.1 analisaremos algumas destas funções de onda, que estão representadas na figura 7.15. É interessante analisar dois casos limites deste potencial. O primeiro é o limite em que V0 → 0. Como se pode ver na figura 7.5, nesse limite o potencial aproxima-se do poço de potencial infinito rectangular. Nesse limite, λ → 0 e o espectro (7.1.17) reduz-se a En ≃ n2 π 2 ~2 , 2mL2 (7.1.21) 212 Outras soluções exactas da equação de Schrödinger 5 5 4 4 3 3 2 2 1 1 0 0 0 0.5 1 1.5 2 2.5 0 3 0.5 1 1.5 2 2.5 3 x x Figura 7.5: Os potenciais V (x) = cot2 x e V (x) = cot2 x/100. exactamente o espectro do poço rectangular infinito (7.1.2). Um outro limite interessante e oposto é tomar λ ≫ 1; nesse caso λ≃ r mV0 L2 , 2π 2 ~2 e, para os primeiros nı́veis de energia podemos escrever o espectro como r 2V0 π 2 1 , n = 0, 1, 2, . . . , ω≡ . En ≃ ~ω n + 2 mL2 (7.1.22) (7.1.23) Obtemos portanto um espectro de oscilador harmónico, o que se pode entender facilmente, se expandirmos o potencial à volta de x = L/2: " 2 3 # 2 π L 2 sin x − πx L L V π 0 2 ; = V0 2 Lπ +O x− V (x) = V0 cot2 = 2 x− L L 2 2 cos L x − L2 o primeiro termo tem a forma V (x) = mω 2 (x − L/2)2 /2, com ω dado pela expressão anterior. Poço Triangular Consideremos um potencial linear V (x) = V0 x , V0 > 0 . (7.1.24) 7.1 Alguns poços de potencial exactamente solúveis 213 0.8 0.4 0 -10 -5 0 5 10 x -0.4 -0.8 Figura 7.6: A função de Airy convergente. A equação de Schrödinger independente do tempo para um estado com energia E fica ~2 d 2 − + V0 x Φ(x) = EΦ(x) , (7.1.25) 2m dx2 ou ainda 2mV0 d2 − dx2 ~2 E x− V0 Φ(x) = 0 . (7.1.26) As soluções da equação d2 − z f (z) = 0 , dz 2 (7.1.27) chamam-se funções de Airy, e as duas soluções linearmente independentes são denotadas por Ai(z) e Bi(z), sendo que a segunda é divergente. Assim, a solução geral da equação de Airy (7.1.27) é dada por f (z) = αAi(z) + βBi(z) . (7.1.28) A função de Airy convergente juntamente com um potencial linear de declive 1 estão representadas na figura 7.6. Note-se que a forma é exactamente a esperada. A função de onda oscila quando a energia é maior do que o potencial e torna-se uma onda evanescente 214 Outras soluções exactas da equação de Schrödinger quando a energia é menor do que o potencial. Assim, tomamos a solução de (7.1.26) como sendo r 3 Φ(x) = cAi 2mV0 ~2 E x− V0 ! , (7.1.29) onde c é uma constante de normalização. Um potencial linear origina uma força constante, como por exemplo a de uma partı́cula carregada num campo eléctrico constante. Mas um potencial linear em todo o espaço não faz sentido fisicamente, pois a energia não está limitada inferiormente. Podemos, no entanto, considerar um poço de potencial triangular da seguinte forma   Vx x>0 0 V (x) =  +∞ x<0. (7.1.30) Se o fizermos, esperamos quantificação de energia. Matematicamente, esta quantificação aparece como consequência da condição Φ(0) = 0 . (7.1.31) Logo, em x = 0, o argumento da função de Airy tem de ser um dos seus zeros, xn , isto é 2 2 1/3 V0 ~ En = − xn . (7.1.32) 2m Estes zeros não têm uma expressão matemática simples, mas é muito simples compreender a forma da função de onda para os vários estados estacionários; representamos os primeiros na figura 7.7. Numericamente, x1 ≃ −2.34 , x2 ≃ −4.09 , x3 ≃ −5.52 , (7.1.33) o que revela que |E3 −E2 | < |E2 −E1 |. Este é um padrão que se repete: os nı́veis de energia estão cada vez mais próximos à medida que a energia aumenta, ou, posto na linguagem da próxima secção, a densidade de estados aumenta com a energia. Nesta altura vale a pena observar que em todos os exemplos de poços de potencial estudados até agora, o número de nodos aumente sempre de uma unidade com o nı́vel de energia. Esta é uma caracterı́stica genérica de problemas em uma dimensão. Note-se também que o estado fundamental nunca tem qualquer nodo. 7.1 Alguns poços de potencial exactamente solúveis 215 0.8 0.8 0.8 0.4 0.4 0.4 0 0 0 2 4 6 8 0 0 10 2 4 6 8 10 0 2 4 x x 6 8 10 x -0.4 -0.4 -0.4 -0.8 -0.8 -0.8 Figura 7.7: As função de onda dos três primeiros estados estacionários no poço triângular. 7.1.2 Densidade de estados Comparemos agora a densidade de estados, ρ(E), definida por dN(E) , dE ρ(E) = (7.1.34) para alguns destes poços infinitos. No caso do oscilador harmónico, temos N(E) = E 1 − ~ω 2 ⇒ ρ(E) = 1 . ~ω (7.1.35) Obviamente para o caso do oscilador harmónico, a densidade de estados é constante, dado o espaçamento energético entre os nı́veis ser sempre igual. No caso do poço rectangular infinito, L√ N(E) = 2mE π~ ⇒ L ρ(E) = π~ r m . 2E (7.1.36) A densidade de estados tende para zero à medida que a energia aumenta, devido ao espaçamento energético aumentar com o nı́vel. No caso do poço de potencial do tipo cot2 x, escolhemos a raiz positiva da equação quadrática 2mEa2 N(E)2 +4N(E)λ−2λ− 2 2 = 0 π ~ ⇒ N(E) = r 4λ2 + 2λ + 2mEa2 −2λ , (7.1.37) π 2 ~2 pelo que obtemos uma densidade de estados ρ(E) = ma2 1 q 2 2 π ~ 4λ2 + 2λ + 2mEa2 π 2 ~2 . (7.1.38) 216 Outras soluções exactas da equação de Schrödinger 1 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 E Figura 7.8: Densidade de estados para o oscilador harmónico (constante), poço rectangular infinito (curva divergente em zero) e poço do tipo cot2 x. Estas várias densidades de estados estão representadas na figura 7.8. Note-se, que de acordo com a análise efectuada anteriormente, o potencial cot2 x tem uma densidade aproximadamente constante para energias baixas e converge para a densidade do poço rectangular infinito para energias elevadas. Estas curvas da densidade de estados ajudam-nos a ter uma intuição sobre outros casos onde não possamos resolver analiticamente o problema. Por exemplo, no potencial x4 , deveremos ter uma densidade de estados cujo declive estará algures entre entre o do poço rectangular infinito e o do potencial harmónico. Notemos ainda que o potencial triangular da secção anterior tem uma densidade de estados que aumenta com a energia. 7.1.3 Estados Ligados em Poços finitos Vamos agora estudar o espectro de estados ligados de dois potenciais com profundidade finita, um dos quais já nosso conhecido. Recordemos ainda que na secção 3.2.6 estudamos um outro caso de um potencial rectangular finito, cujos nı́veis de energia se determinaram por um método geométrico. 7.1 Alguns poços de potencial exactamente solúveis 217 x 0.3 0 5 10 15 20 0 0.2 -0.2 0.1 -0.4 0 0 5 10 15 20 x -0.6 -0.1 -0.8 -0.2 -1 -0.3 Figura 7.9: Potencial de Coulomb efectivo para b 6= 0 and b = 0 respectivamente. Poço de potencial efectivo de Coulomb No capı́tulo 6 resolvemos a equação de Schrödinger três dimensional no potencial de Coulomb. Devido à simetria esférica, reduzimos o problema a uma dimensão, com um potencial efectivo do tipo V (x) = a b + 2 , se x > 0 ; x x V (x) = +∞ , se x < 0 . (7.1.39) As constantes a e b têm valores negativo e positivo (ou zero) respectivamente. O potencial está representado na figura 7.9. No caso do problema de Coulomb, estas constantes têm o valor e2 ~2 a=− , b = ℓ(ℓ + 1) . (7.1.40) 4πǫ0 2µ Usando um método análogo ao do capı́tulo 6, mostra-se que os nı́veis de energia são dados por En = − µa2 2~2 1 n+ q 1 4 + 2µb ~2 + 1 2 2 , n = 0, 1, 2, 3, . . . . (7.1.41) Tomando os valores (7.1.40) obtemos o espectro de energias do átomo de Hidrogénio, que está representado na figura 6.5. As funções de onda serão dadas pela parte radial das funções de onda estudadas no capı́tulo 6 para o átomo de Hidrogénio. Note-se que para ℓ = 0 (b = 0) este é um poço infinito. Na secção 7.2.4 voltaremos a analisar este problema usando o método algébrico. 218 Outras soluções exactas da equação de Schrödinger x -4 -2 0 2 4 0 -0.2 -0.4 -0.6 -0.8 -1 Figura 7.10: O potencial de Pöchl-Teller para V0 = 1 = a. Poço de potencial de Pöschl-Teller O poço de potencial V (x) = − V0 cosh2 x a , V0 , a > 0 , (7.1.42) denominado potencial de Pöschl-Teller, admite solução analı́tica exacta (ver Folha 1, Problema 3). Este potencial é representado na figura 7.10. O espectro de energias tem a forma " r #2 ~2 1 1 8mV0 a2 En = − +1− n+ , n = 0, 1, 2, . . . , N , (7.1.43) 2ma2 2 ~2 2 onde N é o maior inteiro que satisfaz a desigualdade r 1 8mV0 a2 1 +1 . N+ < 2 2 ~2 (7.1.44) As funções de onda têm a forma diferente dependendo da paridade de n. Para valores ı́mpares de n, obtemos a função de onda x x −2λ n 1 3 n 1 2 x Φn = cn sinh cosh , F − + , −2λ + + , ; − sinh a a 2 2 2 2 2 a enquanto que para valores pares de n obtemos a função de onda n n 1 x −2λ 2 x , F − , −2λ + , ; − sinh Φn = cn cosh a 2 2 2 a (7.1.45) (7.1.46) 7.1 Alguns poços de potencial exactamente solúveis 219 1 0.5 x -3 -2 -1 0 1 2 3 0 -0.5 -1 Figura 7.11: Funções de onda dos três estados estacionários de energia mais baixa do potencial de Pöschl-Teller (não normalisadas). Usamos λ = 2, a = 1. O número de nodos aumenta com a energia. onde F (a, b, c; z) são funções hipergeométricas e λ é dado pela expressão ! r 8mV0 a2 1 1+ λ≡ −1 . 4 ~2 (7.1.47) Notamos que a função hipergeométrica tem expansão F (a, b, c; χ) = +∞ X (a)p (b)p χp p=0 (c)p p! . (7.1.48) Devido ao primeiro argumento da função hipergeométrica ser um inteiro negativo (quer no caso par, quer ı́mpar), a função reduz-se a um polinómio finito, de grau n. Explicitamente, para as três primeiras funções de onda usamos F (0, b, c; χ) = 1 , b F (−1, b, c; χ) = 1 − χ . c (7.1.49) As funções de onda dos três primeiros estados estacionários encontram-se representadas na figura 7.11. Notemos que este poço de profundidade finita admite um número finito de estados ligados, enquanto que o poço de potencial efectivo de Coulomb, sendo ainda de profundidade finita, admite um número infinito de estados ligados. 220 7.2 Outras soluções exactas da equação de Schrödinger Método algébrico para potenciais com forma invariante Quando, no capı́tulo 5, estudamos o oscilador harmónico, deduzimos o seu espectro e funções próprias usando dois métodos diferentes: um método algébrico baseado na introdução de operadores de criação e destruição (secções 5.1.1 e 5.1.2); um método diferencial de resolução directa da equação de Schrödinger, com um “ansatz” apropriado que introduz uma série de potências que deverá ser finita por normalizabilidade da função de onda. O primeiro método é, sem dúvida, bem mais elegante e prático. Os potenciais estudados na secção 7.1 são, tradicionalmente, resolvidos usando o segundo método. Existe, no entanto, um método algébrico aplicável a estes e outros potenciais, que nos permitirá, de um modo mais prático, extrair o espectro e as funções próprias do problema (e também os factores de transmissão e reflexão, quando aplicável, mas que não será aqui tratado). O método que vamos descrever tem a sua origem em técnicas de “supersimetria” - uma simetria (ainda não observada) que relaciona bosões com fermiões - mas que é essencialmente equivalente a um método de factorização introduzido por Schrödinger em 1940 (Proc. Roy. Irish Acad. A46 (1940) 9). 7.2.1 O superpotencial e potenciais parceiros Consideramos o operador Hamiltoniano na representação |xi: 2 2 ˆ = − ~ d + Ṽ (x) . H̃ 1 1 2m dx2 (7.2.1) Assumimos que o potencial é limitado inferiormente e tem um espectro de estados ligados, acima do qual poderá, ou não, existir um contı́nuo de estados. É uma propriedade universal que o estado fundamental Φ0 não tem nodos. Este estado tem energia Ẽ0 e obedece a − ~2 d2 Φ0 + Ṽ1 (x)Φ0 = Ẽ0 Φ0 , 2m dx2 que, invertendo, resulta em Ṽ1 (x) = ~2 1 d2 Φ0 + Ẽ0 . 2m Φ0 dx2 (7.2.2) 7.2 Método algébrico para potenciais com forma invariante 221 Conhecendo, pois, o estado fundamental de um problema, podemos facilmente reconstruir o potencial, a menos de uma constante (a energia de ponto zero). No que se segue iremos considerar o potencial que é obtido do original através da subtracção da energia de ponto zero, o que garante que o estado fundamental do novo potencial tem energia zero: Ṽ1 − Ẽ0 = V1 , ˆ − Ẽ 1̂ = Ĥ . H̃ 1 0 1 (7.2.3) Podemos agora factorizar o operador Hamiltoniano da seguinte maneira Ĥ1 = Â† Â , (7.2.4) onde os operadores Â e Â† são adjuntos e tomam a forma, na representação |xi: ~ d + W (x) , Â = √ 2m dx ~ d Â† = − √ + W (x) . 2m dx (7.2.5) A função W (x) é denominada superpotencial. Da equivalência entre (7.2.1) e (7.2.4), ~ d ~ d ~2 d 2 √ −√ + W (x) + W (x) = − + V1 (x) , 2m dx2 2m dx 2m dx resulta que ~ dW V1 (x) = W (x)2 − √ . 2m dx (7.2.6) Esta equação é denominada equação de Riccati. Dado um potencial Ṽ1 (x) = V1 (x) + Ẽ0 , usamo-la para determinar o superpotencial, descobrindo simultaneamente a energia de ponto zero do potencial Ṽ1 (x). O estado definido por ÂΦ = 0, obedece a Ĥ1 Φ = Â† ÂΦ = 0; isto é tem a energia do estado fundamental. Como o espectro é não degenerado (caracterı́stica genérica de problemas um dimensionais), este deve ser o estado fundamental: ÂΦ0 = 0 ⇔ ~ 1 dΦ0 W (x) = − √ . 2m Φ0 dx (7.2.7) Substituindo em (7.2.6) obtemos V1 (x) = ~2 1 d2 Φ0 , 2m Φ0 dx2 (7.2.8) 222 Outras soluções exactas da equação de Schrödinger em concordância com (7.2.2) após a transformação (7.2.3). Por outro lado, de (7.2.7), temos que dado o superpotencial podemos determinar Φ0 (x) por ! √ Z 2m W (x)dx . Φ0 (x) = exp − ~ (7.2.9) Exemplo: Consideremos o oscilador harmónico tratado no capı́tulo 5. Usando a representação |xi, escrevemos os operadores de criação e destruição (5.1.4) da seguinte maneira ! ! r r 2 2 1 ~ mω mω ~ 1 d d √ â† = √ −√ + x , â = √ + x . (7.2.10) 2 2 2m dx 2m dx ω~ ω~ O Hamiltoniano escreve-se, em termos destes operadores ! 1̂ ˆ − ~ω 1̂ = (√~ωâ† )(√~ωâ) , ˆ = ~ω â† â + ⇔ H̃ H̃ 1 1 2 2 de onde concluimos que os operadores Â e Â† são dados por Â† = √ ~ωâ† , Â = √ ~ωâ , (7.2.11) e o superpotencial é linear W (x) = r mω 2 x. 2 (7.2.12) Usando (7.2.9), obtemos ainda que a função de onda do estado fundamental é uma Gaussiana do tipo Φ0 = Ce−mωx 2 /(2~) , em concordância com (5.1.36), e obtemos de (7.2.8) V1 (x) = mω 2 2 ~ω x − , 2 2 (7.2.13) que é, de facto, o potencial harmónico com a energia de ponto zero removida. Para introduzir a noção de potencial parceiro, definimos um novo Hamiltoniano, Ĥ2 , Ĥ2 = ÂÂ† , (7.2.14) obtido invertendo a ordem de Â e Â† . Usando (7.2.5) ~ d ~2 d 2 ~ dW (x) ~ d + W (x) −√ + W (x) = − + W (x)2 + √ , Ĥ2 = √ 2 2m dx 2m dx 2m dx 2m dx 7.2 Método algébrico para potenciais com forma invariante 223 de onde definimos o potencial parceiro, V2 (x) por ~ dW (x) . V2 (x) = W (x)2 + √ 2m dx (7.2.15) A designação de potenciais parceiros para V1 (x) e V2 (x) surge porque os seus espectros e funções próprias (e matrizes de difusão quando aplicável) estão relacionados. De facto, (1) se {Φn }, n ≥ 0, for o conjunto de funções próprias de Ĥ1 , com correspondente espectro (1) En ≥ 0, ∀n, (1) (1) Ĥ1 Φ(1) n = En Φn , (1) (1) então, as funções ÂΦn , com n > 0, são funções próprias de Ĥ2 com valor próprio En : † (1) (1) (1) (1) (1) (1) Ĥ2 ÂΦ(1) = Â Â ÂΦ = Â Ĥ Φ = ÂE Φ = E ÂΦ . 1 n n n n n n n Note-se que o estado fundamental de Ĥ1 não origina, por este procedimento, nenhuma função própria não trivial de Ĥ2 . (2) De um modo semelhante, se {Φn }, n ≥ 0, for o conjunto de funções próprias de Ĥ2 , (2) com correspondente espectro En > 0, ∀n, (2) (2) Ĥ2 Φ(2) n = En Φn , (2) (2) então, as funções Â† Φn , com n ≥ 0, são funções próprias de Ĥ1 com valor próprio En : † † (2) † (2) † (2) (2) (2) † (2) Ĥ1 Â† Φ(2) = Â Â Â Φ = Â Ĥ Φ = Â E Φ = E Â Φ . 2 n n n n n n n (2) Note-se que Ĥ2 Φ0 6= 0, pelo que o estado fundamental de Ĥ2 origina, por este procedimento, uma função própria não trivial de Ĥ1 . Concluimos pois que os espectros dos potenciais parceiros estão relacionados por (1) En(2) = En+1 , n ≥ 0, (1) E0 = 0 ; (7.2.16) as funções próprias estão relacionadas por Φ(2) n = q 1 (1) En+1 (1) ÂΦn+1 , (1) ou Φn+1 = q 1 (2) En Â† Φ(2) n , (7.2.17) 224 Outras soluções exactas da equação de Schrödinger (1) (2) E3 (1) E2 E2 Â† (1) (2) E1 (1) 0 = E0 (2) E1 E0 Â Figura 7.12: Espectros de potenciais parceiros e acção dos operadores Â e Â† . Note-se que o operador Â/Â† destroi/cria um nodo na função de onda. Nesse sentido os operadores são ainda operadores de destruição/criação. (1) (2) que estão normalizadas, assumindo normalização de Φn ou Φn respectivamente. Na figura 7.12 ilustramos a relação entre os espectros de potenciais parceiros. Exemplo 1: No caso do oscilador harmónico, os operadores Â e Â† são proporcionais aos operadores de criação e destruição. Logo, é de prever que o potencial parceiro do oscilador harmónico seja ainda um potencial harmónico. Facilmente se verifica que, tomando o superpotencial (7.2.12) se obtém, de (7.2.15) V2 (x) = mω 2 2 ~ω x + , 2 2 (2) que é de facto um potencial harmónico com energia de ponto zero E0 = ~ω - figura 7.13. Esta energia de ponto zero corresponde, de facto, à energia do primeiro estado excitado do potencial parceiro (7.2.13). Vemos pois que o potencial harmónico tem forma invariante; isto é não modifica a sua forma relativamente ao potencial parceiro. Potenciais de forma invariante irão desempenhar um importante papel no que se segue. Exemplo 2: Consideramos o poço de potencial rectangular de profundidade infinita (revisto em 7.1.1), que subtraido da sua energia de ponto zero, tomamos como o potencial V1 (x). O espectro de energias fica então: En(1) = π 2 ~2 n(n + 2)π 2 ~2 (n + 1)2 π 2 ~2 − = ,n ≥ 0 ; 2mL2 2mL2 2mL2 (7.2.18) 7.2 Método algébrico para potenciais com forma invariante 225 E E V(x) 1 V(x) 2 x x Figura 7.13: Potencial harmónico com energia de ponto zero nula (esquerda) e o seu potencial parceiro (direita), que é um potencial harmónico igual mas subido de ~ω. as funções próprias são Φ(1) n = r 2 sin L (n + 1)πx L , x ∈ [0, L] , (7.2.19) e zero no complementar. Usando (7.2.7) obtemos o superpotencial W (x) = − √ ~π πx , cot L 2mL (7.2.20) e como tal, o potencial parceiro, usando (7.2.15), ~2 π 2 2 πx V2 (x) = 2 cot +1 . 2mL2 L (7.2.21) Concluimos pois, de (7.2.16), que o espectro deste potencial é En(2) = (n + 1)(n + 3)π 2 ~2 ,n ≥ 0 . 2mL2 (7.2.22) As funções próprias do potencial parceiro, por sua vez, são obtidas das de Ĥ1 pela açcão do operador ~ Â = √ 2m π πx d − cot dx L L . Usando (7.2.17) obtemos as funções de onda do potencial parceiro: s (n + 2)πx πx (n + 2)πx 2 (2) Φn = (n + 2) cos . − cot sin (n + 1)(n + 3)L L L L As três primeiras funções de onda encontram-se representadas na figura 7.15. (7.2.23) 226 Outras soluções exactas da equação de Schrödinger V(x) 2 V(x) 1 E x Figura 7.14: Poço de potencial rectangular com energia de ponto zero nula (esquerda) e o seu potencial parceiro (direita), que é um potencial do tipo π 2 ~2 /mL2 (2 cot2 (πx/L) + 1). Vale a pena notar, neste segundo exemplo, que o potencial parceiro do poço de potencial rectangular de profundidade infinita, que é bastante trivial de resolver, é um potencial altamente não trivial de resolver - figura 7.14. Notemos ainda que V2 (x) − ~2 π 2 π 2 ~2 πx = cot2 , 2 2 2mL mL L (7.2.24) que é o potencial (7.1.16), com V0 = π 2 ~2 /mL2 . Para este valor especial de V0 , a variável λ (7.1.18) toma o valor de 1/2 e o espectro de energias (7.1.17) En = (n(n + 2) − 1) π 2 ~2 , 2mL2 n = 1, 2, 3, . . . , (7.2.25) (2) o que coincide exactamente com En − π 2 ~2 /2mL2 , em acordo com o cálculo anterior. 7.2.2 Hierarquia de Hamiltonianos Vamos assumir que conhecemos um potencial que é exactamente solúvel, Ṽ1 (x) e conhecemos o seu espectro e funções de onda. Se assim é, podemos, aparentemente, construir um número infinito de potenciais exactamente solúveis. O método é o seguinte. (1) (1) Conhecendo o estado fundamental de um Hamiltoniano Ĥ1 , Φ0 , que tem energia E0 igual a zero, podemos encontrar o superpotencial W1 (x), usando (7.2.7). Os operadores Â1 e Â†1 , podem então ser construidos usando (7.2.5), e podem ser usados para factorizar o Hamiltoniano, escrevendo-o na forma Ĥ1 = Â†1 Â1 . O estado fundamental do Hamiltoniano (2) (2) parceiro Ĥ2 = Â1 Â†1 , Φ0 , que tem energia E0 maior do que zero, é obtido a partir do 7.2 Método algébrico para potenciais com forma invariante 227 1.5 1 0.5 x 0 0.2 0.4 0.6 0.8 1 0 -0.5 -1 -1.5 Figura 7.15: Funções de onda dos três estados estacionários de energia mais baixa do potencial do tipo cot2 (πx/L). O número de nodos aumenta com a energia. (2) primeiro estado excitado de Ĥ1 , pela aplicação do operador Â1 . O Hamiltoniano Ĥ2 −E0 1̂ (2) tem estado fundamental Φ0 com energia igual a zero. Podemos por isso recomeçar o processo e calcular um novo superpotencial W2 (x), novos operadores Â2 e Â†2 que factorizam o Hamiltoniano Ĥ2 = Â†2 Â2 e um novo Hamiltoniano parceiro Ĥ3 = Â2 Â†2 , com um novo (3) estado fundamental, Φ0 , que tem energia maior do que zero. O Hamiltoniano Ĥ3 − (3) (3) E0 1̂ tem estado fundamental Φ0 com energia igual a zero. Podemos recomeçar agora novamente o processo. Construimos assim toda uma hierarquia de Hamiltonianos, criados por refactorizações repetidas. A razão pela qual, genericamente, não construimos por este método um conjunto infinito de potenciais exactamente solúveis é que, genericamente, os potenciais parceiros vão ter a mesma forma do potencial original, apenas com parâmetros diferentes. Isto é, potenciais exactamente solúveis são, genericamente, potenciais de forma invariante que tratamos de seguida. Usando a condição de invariância de forma apropriada podemos resolver um potencial de primeiros princı́pios, e não apenas resolver um potencial dado o conhecimento do seu potencial parceiro. 228 7.2.3 Outras soluções exactas da equação de Schrödinger Potenciais de forma invariante Se um potencial tem a mesma forma do seu potencial parceiro, isto é, se o potencial V1 (x; ai ) e o seu parceiro V2 (x; aj ), onde ai,j são os parâmetros que definem o potencial, obedecerem a V2 (x; ai ) = V1 (x; f (ai )) + R(ai ) , (7.2.26) então dizemos que o potencial tem forma invariante. f (ai ) e R(ai ) são duas funções dos parâmetros ai . Esta condição é uma condição de integrabilidade. Usando-a podemos, de um modo sistemático, obter as funções próprias e os valores próprios de qualquer potencial de forma invariante. Vejamos como. Consideramos um Hamiltoniano, Ĥ1 construido com um potencial, V1 (x; a), que obedece à condição de invariância de forma. Se Ĥ1 = − ~2 d 2 + V1 (x, a) , 2m dx2 pela condição de invariância de forma, o Hamiltoniano parceiro será Ĥ2 = − ~2 d 2 + V1 (x, f (a)) + R(a) . 2m dx2 O Hamiltoniano Ĥ1 tem energia de ponto zero igual a zero, por construção, para qualquer conjunto de parâmetros a. O Hamiltoniano Ĥ2 é igual ao Hamiltoniano Ĥ1 , com um conjunto de parâmetros f (a) - que ainda terá energia do estado fundamental igual a zero - somado de R(a). Logo a energia do estado fundamental de Ĥ2 , que é igual à energia do primeiro estado excitado de Ĥ1 é (1) (2) E1 = E0 = R(a) . (7.2.27) Subtraindo a energia de ponto zero ao Hamiltoniano Ĥ2 , Ĥ2′ = Ĥ2 − R(a)1̂, terá como Hamiltoniano parceiro Ĥ3 = − ~2 d 2 + V1 (x, f 2 (a)) + R(f (a)) , 2m dx2 de onde concluimos que a energia do segundo estado excitado de Ĥ1 será (1) E2 = R(a) + R(f (a)) . 7.2 Método algébrico para potenciais com forma invariante 229 Logo, para potenciais de forma invariante, podemos construir uma hierarquia de Hamiltonianos, Ĥs , s = 1, 2, 3, . . ., em que Ĥn tem o mesmo espectro que Ĥ1 , a menos dos primeiros n−1 nı́veis de Ĥ1 , que estão ausentes em Ĥn , sendo as suas energias subtraı́das no espectro de Ĥn . Usando repetidamente a condição de invariância de forma, temos que Ĥs = − ~2 d 2 + V1 (x, f s−1(a)) + R(f s−2(a)) . 2m dx2 Logo, a energia do nı́vel n do Hamiltoniano Ĥ1 é En(1) = n−1 X k=0 R(f k (a)) , n ≥ 1 , (1) , E0 = 0 . Consideremos agora o cálculo das funções de onda dos estados estacionários. Dado o potencial original V1 (x; a), podemos encontrar o superpotencial W (x; a), via (7.2.6), a função de onda do estado fundamental Φ0 (x; a), via (7.2.7) e os operadores Â(x; a) e Â† (x; a) usando (7.2.5). Como o potencial é de forma invariante, o potencial parceiro é, a (1) menos de uma constante (E1 ), V1 (x; f (a)). A função de onda do estado fundamental do potencial parceiro será, por isso, Φ0 (x; f (a)). Logo, a função de onda do primeiro estado excitado de V1 (x; a) será, usando (7.2.17), Analogamente, Φ1 (x; a) = q Φn (x; a) = q 1 (1) Â† (x; a)Φ0 (x; f (a)) . E1 1 (1) En Â† (x; a)Φn−1 (x; f (a)) . (7.2.28) Deste modo construimos, com um método algébrico em tudo análogo ao usado no oscilador harmónico, todas as funções de onda do problema original. 7.2.4 Potenciais de forma invariante relacionados por translação Há, essencialmente, duas classes de potenciais de forma invariante que têm sido estudados: i) Potenciais que estão relacionados com o parceiro por uma translação f (a) = a + α ; (7.2.29) 230 Outras soluções exactas da equação de Schrödinger ii) Potenciais que estão relacionados com o parceiro por uma transformação de escala f (a) = qa . (7.2.30) Existem ainda outras classes discutidas na literatura. Contudo é um facto notável que todos os modelos exactamente solúveis que se encontram genericamente nos livros de Mecânica Quântica não relativista pertencem à primeira classe descrita em cima. Consideremos dois exemplos. Oscilador Harmónico generalizado Consideramos um potencial harmónico centrado no ponto x = a. Vamos assumir que nada sabemos da teoria quântica deste potencial; em particular desconhecemos a energia de ponto zero, Ẽ0 . O potencial harmónico com energia de ponto zero nula será 1 V1 (x) = mω 2 (x − a)2 − Ẽ0 . 2 (7.2.31) O superpotencial está relacionado com V1 (x) por ~ dW V1 (x) = W (x)2 − √ ; 2m dx (7.2.32) Tomamos como ansatz para o superpotencial W (x) = α(x + β) ; (7.2.33) inserindo este ansatz juntamente com a forma de V1 (x) na equação anterior obtemos r m ~ω α=± ω , β = −a ⇒ Ẽ0 = ± . (7.2.34) 2 2 Isto é encontrando o superpotencial que origina a parte não constante do potencial, encontramos também a energia de ponto zero! De facto temos duas hipóteses para a energia de ponto zero; mas uma delas, associada ao sinal inferior, não é fı́sica pois diminui a energia dos estados excitados em vez de a aumentar. Assim tomamos o sinal superior e r m ω(x − a) . W (x) = 2 (7.2.35) 7.2 Método algébrico para potenciais com forma invariante 231 O potencial parceiro é 1 ~ω ~ dW = mω 2 (x − a)2 + . V2 (x) = W (x)2 + √ 2 2 2m dx (7.2.36) V2 (x) = V1 (x) + ~ω, (7.2.37) Logo que demonstra que o potencial é de forma invariante. Daqui deduzimos, por (7.2.27) que (1) E1 (2) = E0 = ~ω. Subtraindo a energia de ponto zero do potencial V2 (x) recuperamos exactamente o potencial original V1 (x) e podemos recomeçar o processo. No cálculo do novo potencial parceiro iremos ganhar novamente uma energia de ~ω, pelo que (1) E2 = ~ω + ~ω = 2~ω . (7.2.38) Repetindo o procedimento verificamos facilmente que En(1) = n~ω ⇒ 1 , Ẽn = ~ω n + 2 (7.2.39) onde repusemos a energia de ponto zero, de acordo com (7.2.3). Consideramos agora o cálculo das funções próprias. O operador Â† é, r √ ~ d m † Â = − √ + ω(x − a) = ω~â† , 2 2m dx (7.2.40) onde â† é o operador de criação habitual (em termos da variável x − a). Logo, por (7.2.28) temos, para as funções de onda normalizadas, 1 √ Φn (x) = √ ~ωâ† Φn−1 (x) , n~ω (7.2.41) exactamente de acordo com (5.1.30). Esta é uma relação iterativa; o conhecimento de todas as funções de onda decorre do conhecimento da função de onda do estado fundamental. Este pode ser determinado usando (7.2.7), que, dado o superpotencial, determina a função de onda através de: √ Z 2m ln Φ0 = − W (x)dx + constante , ~ que neste caso é facilmente integrável para dar mω 2 Φ0 (x) = C0 e− 2~ (x−a) , como esperado. (7.2.42) (7.2.43) 232 Outras soluções exactas da equação de Schrödinger Potencial efectivo de Coulomb Num campo de forças central, escolhendo o ansatz, Φ(r, θ, φ) = R(r) m Y (θ, φ) , r ℓ (7.2.44) a equação de Schrödinger independente do tempo fica reduzida a uma equação de Schrödinger um dimensional 2 2 ~ d + Vef e (r) R(r) = ER(r) , − 2µ dr 2 (7.2.45) com potencial efectivo Vef e = ℓ(ℓ + 1)~2 + V (r) , 2µr 2 (7.2.46) onde µ é a massa da partı́cula e V (r) o potencial central a que a partı́cula está sujeita. Tomando para V (r) o potencial de Coulomb e2 ~2 V (r) = − =− , 4πǫ0 r µa0 r (7.2.47) temos V1 (r; ℓ) = ~2 ℓ(ℓ + 1)~2 − − Ẽ0 (ℓ) , 2µr 2 µa0 r (7.2.48) onde o último termo corresponde a subtrair a menor energia possı́vel para uma orbital com número quântico angular ℓ e usamos o raio de Bohr a0 , dado por (6.4.22). Para encontrar o superpotencial, i.e. resolver ~ dW , V1 (r, ℓ) = W (r, ℓ)2 − √ 2µ dr (7.2.49) parece natural tomar o ansatz W (r; ℓ) = α(ℓ) + β(ℓ) . r (7.2.50) Inserindo esta forma na equação anterior, juntamente com V1 (r; ℓ) obtemos    ~ ~ ~2       √ √ , − − (ℓ + 1) , ,    2µa20 (ℓ + 1)2 2µ 2µa0 (ℓ + 1) β(ℓ) = α(ℓ) = Ẽ0 = ~ ~    ~2     −√  √ ℓ,  − , . 2µ 2µa0 ℓ 2µa20 ℓ2 (7.2.51) 7.2 Método algébrico para potenciais com forma invariante 233 A solução inferior diminui a energia dos estados excitados (para além de divergir para ℓ = 0) e por isso tomamos a solução superior. Nesse caso, a energia de ponto zero coincide, de facto com a menor energia possı́vel para uma orbital com número quântico angular ℓ do átomo de hidrogénio (6.4.23). Assim, de um modo extremamente simples derivamos a energia de um número infinito de orbitais do átomo de hidrogénio! Tomamos, por isso V1 (r; ℓ) = ~2 ~2 ℓ(ℓ + 1)~2 − + ; 2µr 2 µa0 r 2µa20 (ℓ + 1)2 (7.2.52) o superpotencial é ~ W (r; ℓ) = √ 2µ e o potencial parceiro V2 (r; ℓ) = ℓ+1 1 − a0 (ℓ + 1) r , (7.2.53) (ℓ + 2)(ℓ + 1)~2 ~2 ~2 − + . 2µr 2 µa0 r 2µa20 (ℓ + 1)2 (7.2.54) Logo ~2 V2 (r; ℓ) = V1 (r; ℓ + 1) + 2µa20 1 1 − 2 (ℓ + 1) (ℓ + 2)2 , (7.2.55) o que confirma que o potencial em questão é de forma invariante. Como tal ~2 1 1 (1) (2) E1 = E0 = − . 2µa20 (ℓ + 1)2 (ℓ + 2)2 (7.2.56) Tomando o potencial V2 (r; ℓ) com energia de ponto zero nula recuperamos o potencial original V1 (r; ℓ̃), com parâmetro ℓ̃ = ℓ + 1 e podemos recomeçar o processo. No cálculo do novo potencial parceiro iremos ganhar novamente uma energia de 1 ~2 1 , − 2µa20 (ℓ̃ + 1)2 (ℓ̃ + 2)2 (7.2.57) pelo que (1) E2 ~2 = 2µa20 1 1 1 1 − − + 2 2 2 (ℓ + 1) (ℓ + 2) (ℓ̃ + 1) (ℓ̃ + 2)2 ~2 1 1 = − 2 2 2µa0 (ℓ + 1) (ℓ + 3)2 , Repetindo o procedimento verificamos facilmente que 1 ~2 1 ~2 (1) ⇒ Ẽ = − − , En = n 2µa20 (ℓ + 1)2 (ℓ + 1 + n)2 2µa20 (ℓ + 1 + n)2 (7.2.58) (7.2.59) 234 Outras soluções exactas da equação de Schrödinger onde repusemos a energia de ponto zero, de acordo com (7.2.3). Consideremos agora o cálculo das funções próprias. O operador de criação é d ~ 1 ℓ+1 † − + . Â (ℓ) = √ − dr a0 (ℓ + 1) r 2µ (7.2.60) Usando (7.2.28), temos neste caso Rn (r; ℓ) = q a0 1 (ℓ+1)2 − 1 (n+ℓ+1)2 d 1 ℓ+1 − + Rn−1 (r; ℓ + 1) . − dr a0 (ℓ + 1) r (7.2.61) Para usarmos esta relação de recorrência, comecemos por determinar a função de onda do estado fundamental. Usando (7.2.42) temos neste caso √ Z 2µ W (r; ℓ)dr + constante , ln R0 (r; ℓ) = − ~ (7.2.62) de onde resulta r − (ℓ+1)a R0 (r; ℓ) = C(ℓ)r ℓ+1e 0 . (7.2.63) Comparando com as funções de onda dadas na secção 6.4 verificamos que a dependência radial é de facto a correcta para os nı́veis com N = ℓ + 1, que, para cada ℓ, correspondem ao ‘estado fundamental’. Tomando os casos especı́ficos com ℓ = 0, 1, temos − ar R0 (r; 0) = C(0)re 0 ; − 2ar R0 (r; 1) = C(1)r 2 e 0 . (7.2.64) O primeiro estado excitado com ℓ = 0 é obtido por acção do operador de criação no estado fundamental com ℓ = 1: √ r 2a0 1 1 d − r R1 (r; 0) = √ R0 (r; 1) = − 3a0 rC(1) 2 − e 2a0 . − − + dr a0 r a0 3 (7.2.65) Notando que a parte espacial da função de onda com números quânticos (N, ℓ, m) (na notação do capı́tulo 6) é Φ(N,ℓ,m) = RN −ℓ−1 (r; ℓ) m Yℓ (θ, φ) , r obtemos Φ(1,0,0) C(0) = √ e−r/a0 , 4π r Φ(2,0,0) = − r 3 e−r/2a0 , a0 C(1) 2 − 4π a0 (7.2.66) 7.3 Sumário 235 r 3 rC(1) cos θe−r/2a0 , 4π que com as normalizações adequadas concordam (a menos de uma fase que é irrelevante) Φ(2,1,0) = com as funções de onda calculadas no capı́tulo 6. 7.3 Sumário Neste capı́tulo discutimos alguns potenciais nos quais a equação de Schrödinger tem solução exacta. Começamos por exemplificar alguns casos de poços de potencial de profundidade finita e infinita, que são normalmente resolvidos por um método diferencial (ver folha de exercı́cios 1). Seguidamente introduzimos um método algébrico baseado no conceito de superpotencial, que permite factorizar o Hamiltoniano e introduzir operadores de criação e destruição. Este método permite calcular o espectro de energias e as funções próprias de potenciais de forma invariante, sendo muito análogo ao dos operadores de criação e destruição usados no oscilador harmónico. O método foi exemplificado construindo o espectro de energias e funções de onda do problema de Coulomb. Genericamente o método pode ser sumarizado na seguinte receita: i) Dado um potencial, que denominamos Ṽ1 (x; ai ), escrevemos o potencial V1 (x; ai ) = Ṽ1 (x; ai ) − Ẽ0 , que é igual ao anterior, mas com energia de ponto zero nula. Note-se que Ẽ0 é desconhecida neste momento. ii) Usando a equação de Riccati ~ dW (x; ai ) V1 (x; ai ) = W (x; ai )2 − √ , dx 2m determinamos o superpotencial W (x; ai ) e a energia de ponto zero. Este é o ponto onde alguma intuição é necessária para escolher um bom ansatz para o superpotencial. iii) Determinamos o potencial parceiro ~ dW (x; ai ) V2 (x; ai ) = W (x; ai )2 + √ . dx 2m 236 Outras soluções exactas da equação de Schrödinger iv) Se o potencial for de forma invariante, isto é, se existirem funções f (ai ) e R(ai ) tal que V2 (x; ai ) = V1 (x; f (ai )) + R(ai ) , então podemos determinar o espectro e funções de onda de V1 (x; ai ) (e logo de Ṽ1 (x; ai )) analiticamente. v) O espectro de Ṽ1 (x; ai ) é dado por Ẽn = Ẽ0 + n−1 X R(f s (ai )) , s=0 n≥0 onde f 0 (ai ) = ai , f 1 (ai ) = f (ai ), etc. vi) As funções de onda de Ṽ1 (x; ai ) (que são as mesmas das funções de onda de V1 (x; ai )) são dadas por: • Estado fundamental √ 2m Φ0 (x; ai ) = exp − ~ Z ! W (x; ai )dx , onde tem que se escolher a constante de integração de modo a normalizar a função de onda; • nesimo estado excitado (n ≥ 1) Φn (x; ai ) = qP n−1 s=0 onde 1 Â† (x; ai )Φn−1 (x; f (ai )) , R(f s (ai )) ~ d + W (x; ai ) . Â† (x; ai ) = − √ 2m dx Parte II Métodos de aproximação e Spin CAPÍTULO 8 A aproximação WKB A introdução da equação de Schrödinger completa a nova mecânica ondulatória e torna alguns dos postulados introduzidos arbitrariamente na “velha teoria quântica” naturais. Por exemplo, a quantificação introduzida por Planck (capı́tulo 2) torna-se um problema de modos normais e frequências próprias num potencial de oscilador harmónico (capı́tulo 5). Contudo não nos devemos esquecer que as ondas descritas pela equação de Schrödinger diferem de ondas clássicas, como as electromagnéticas, de duas maneiras: são ondas de probabilidade (interpretação de Born); são ondas complexas. Como vimos no capı́tulo anterior, existem casos em que se pode resolver exactamente a equação de Schrödinger correspondentes a potenciais de forma invariante. Mas, em geral, tal não é possı́vel e como tal necessitamos de métodos aproximados. Alguns destes, como métodos perturbativos ou variacionais, são muito gerais e ganham força quando discutidos num contexto mais abrangente do que apenas problemas em uma dimensão. Mas existe um método de grande interesse para problemas em uma dimensão: a aproximação WKB cujo método é moralmente análogo ao usado no capı́tulo 3 para potenciais constantes por pedaços e origina um resultado para a função de onda formalmente semelhante às ondas planas vistas nesse caso. É este método que agora consideramos. Esta aproximação foi aplicada à equação de Schrödinger quase simultaneamente por 8.1 O método 239 G.Wentzel [Zeits.f.Phys. 38 (1926) 518], H.A.Kramers [Zeits.f.Phys. 39 (1926) 828] e L.Brillouin [Comptes Rendus 183 (1926) 24], sendo por isso conhecida como aproximação ou método WKB. Alternativamente, a aproximação é por vezes denominada BWK, WBK ou por razões que se discutirão em baixo, aproximação semi-clássica ou aproximação da fase integral. 8.1 O método Consideremos o cálculo de estados estacionários da equação de Schrödinger através da resolução da equação de Schrödinger independente do tempo em uma dimensão ~2 d 2 − + V (x) Φ(x) = EΦ(x) , 2m dx2 (8.1.1) ou equivalentemente d2 Φ(x) 2m + 2 (E − V (x))Φ(x) = 0 dx2 ~ ⇔ Φ(x)′′ + [k(x)]2 Φ(x) = 0 , onde as ‘linhas’ denotam derivadas em ordem a x e definimos p 2m(E − V (x)) k(x) ≡ . ~ (8.1.2) (8.1.3) A equação (8.1.2) tem a forma da equação de Helmholtz, muito familiar na teoria ondulatória. Sabemos que quando k é constante a solução é da forma e±ikx (capı́tulo 3); isto sugere que se V não for constante mas variar lentamente com x, possamos tomar o ansatz Φ(x) = eiu(x) , (8.1.4) onde a função u(x) não deverá ser simplesmente proporcional a x. Introduzindo este ansatz em (8.1.2) obtemos a equação d2 u i 2− dx du dx 2 + [k(x)]2 = 0 . (8.1.5) Esta equação é totalmente equivalente a (8.1.1). Só que é não linear em u(x), pelo que poderemos pensar que estamos pior do que começamos! A aproximação WKB toma partido 240 A aproximação WKB desta não linearidade para construir uma aproximação a (8.1.5), através de um método iterativo; este método é sugerido pelo facto de que a segunda derivada é zero para uma partı́cula livre (i.e potencial constante): • Primeira aproximação (aproximação clássica - ver secção 8.4): Se o potencial variar suficientemente lentamente, negligenciamos o termo da segunda derivada. Designando esta aproximação a u(x) por u0 (x) (8.1.5) fica du0 dx 2 2 = [k(x)] ⇔ u0 (x) = ± Z k(x)dx + C0 . (8.1.6) Esta quantidade, designada por fase integral, é a quantidade fundamental na aproximação. • Aproximações seguintes: Escrevemos a equação de Schrödinger na forma (8.1.5) mas reflectindo já o método iterativo 2 d2 u n dun+1 = [k(x)]2 + i 2 ; dx dx (8.1.7) isto é, tomamos do lado direito a aproximação de ordem n, un , e obtemos do lado esquerdo a aproximação de ordem n + 1, un+1 , que portanto se pode escrever na forma Z r d2 u n un+1 (x) = ± [k(x)]2 + i 2 dx + Cn+1 . dx • Segunda aproximação (aproximação WKB): Em particular Z r Z r 2u d dk 0 u1 (x) = ± [k(x)]2 + i 2 dx + C1 = ± [k(x)]2 ± i dx + C1 . dx dx (8.1.8) (8.1.9) Esta segunda aproximação é designada por aproximação semi-clássica ou WKB. Para fazer sentido que este procedimento iterativo seja truncado aqui, é necessário que u1 (x) esteja próximo de u0 (x), isto é, que u1 (x) seja uma pequena correcção a u0 (x) na aproximação à verdadeira função u(x). Em particular isto significa que |dk/dx| ≪ |k 2 (x)| . (8.1.10) 8.2 Interpretação da validade da aproximação 241 Se assim for, u1 (x) ≃ ± Z Z i i dk dx + C1 = ± k(x)dx + log k(x) + C1 , k(x) ± 2k dx 2 (8.1.11) e como tal, na aproximação WKB a função de onda toma a forma Φ(x) = Aei Φ(x) = R k(x)dx R Be + A′ e−i p k(x) k̃(x)dx R k(x)dx + B ′ e− q k̃(x) , R 2m(E − V (x)) , se E > V (x) , ~ p 2m(V (x) − E) , se E < V (x) . k̃(x) ≡ ~ k(x) ≡ k̃(x)dx , p (8.1.12) A constante C1 pôde ser negligenciada pois a função de onda terá de ser, de qualquer modo, normalizada. Comparando com a secção 3.2.1 concluimos a semelhança formal anteriormente anunciada com a função de onda em potenciais constantes por pedaços. 8.2 Interpretação da validade da aproximação Da análise anterior resulta que a condição de validade da aproximação WKB significa que a fase varia muito mais rapidamente do que a amplitude da função de onda. Mas para interpretar de um modo mais fı́sico a condição (8.1.10) de validade da aproximação definimos, para E > V (x), um comprimento de onda efectivo λ(x) = 2π . k(x) (8.2.1) Notando ainda que podemos atribuir um momento à partı́cula pela relação p(x) = ~k(x), a condição (8.1.10) pode ser escrita |dp/dx| |p| 2π ≪ ~ ~ λ ⇒ λ(x)|dp(x)/dx| ≪ |p(x)| . (8.2.2) Ou seja, a condição da validade da aproximação WKB é que a alteração do momento da partı́cula ao longo de um comprimento de onda deve ser muito menor que o próprio momento. Esta condição é violada: 242 A aproximação WKB V(x) E x=a Figura 8.1: Um potencial V (x) perto de um ponto de viragem clássico x = a. • Se o potencial variar muito rapidamente, ou equivalentemente, se k(x) variar muito rapidamente. Se este for o caso a aproximação WKB não será aplicável; • Nos pontos de viragem clássicos onde E = V (x) ou equivalentemente k(x) = 0. Logo, para podermos usar o método WKB temos de compreender como extender as soluções (8.1.12) através dos pontos de viragem clássicos. Estes pontos existem tanto no estudo de estados ligados como no cálculo do factor de transmissão por efeito túnel. Precisamos pois de estabelecer fórmulas de ligação que permitirão relacionar os coeficientes Ai e Bi nas funções de onda (8.1.12). Essas fórmulas de ligação desempenharão o mesmo papel que as condições de continuidade da função de onda e da sua derivada desempenharam nos potenciais contı́nuos por pedaços do capı́tulo 3. 8.3 Fórmulas de ligação Suponhamos que x = a é um ponto de viragem clássico - figura 8.1. Assumimos que a aproximação WKB é aplicável, excepto na vizinhança imediata dos pontos de viragem clássicos; por outras palavras o potencial não varia demasiado rapidamente. Fazemos a seguinte mudança de variáveis v(x) = p k(x)Φ(x) , y= Z x k(x′ )dx′ . (8.3.1) 8.3 Fórmulas de ligação 243 Logo 1 d2 Φ(x) =p 2 dx k(x) 1 dΦ(x) =p dx k(x) dv(x) v(x) dk(x) − dx 2k(x) dx , (8.3.2) d2 v(x) 1 dk(x) dv(x) v(x) d2 k(x) 3 v(x) − − + dx2 k(x) dx dx 2k(x) dx2 4 [k(x)]2 dk(x) dx 2 ! ; (8.3.3) notamos ainda que d2 v =k dx2 d2 v dk dv +k 2 dy dy dy , d2 k =k dx2 dk dy 2 d2 k +k 2 dy de modo que a equação de Schrödinger (8.1.2) fica " # 2 d2 v dk 1 d2 k 1 + +1 v =0 . − dy 2 4k 2 dy 2k dy 2 ! , (8.3.4) (8.3.5) Também esta equação é completamente equivalente à equação de Schrödinger (8.1.1). Da discussão da secção anterior resulta que a aproximação WKB é tomar o termo dentro do parêntises [. . .] igual à unidade. Nesse caso v(y) = e±iy , (8.3.6) o que, com as definições (8.3.1) se reduz à função de onda anteriormente calculada com a aproximação WKB (8.1.12). Em geral y = y(x) é uma variável real se E > V (x) e imaginária se E < V (x). Considerando um potencial como o da figura 8.1 temos que: • y é real à esquerda do ponto de viragem clássico; logo na aproximação WKB, a equação (8.3.5) tem solução v(y) = Aeiy + A′ e−iy ; (8.3.7) • y é imaginário à direito do ponto de viragem clássico; logo na aproximação WKB, a equação (8.3.5) tem solução v(y) = Be|y| + B ′ e−|y| . (8.3.8) 244 A aproximação WKB O nosso objectivo é relacionar as constantes A, A′ com B, B ′ de modo a v(y) ser a função de onda de um mesmo estado em regiões distintas. Note-se que nestas variáveis, as soluções são exactamente às mesmas que em potenciais constantes. Dado que a aproximação WKB falha perto do ponto de viragem clássico, para construirmos esta relação temos de considerar a equação de Schrödinger completa (8.3.5) perto deste ponto. Fazemo-lo aproximando o potencial perto de x = a por uma função linear V (x) − E ≃ α(x − a) , α>0. (8.3.9) Com esta aproximação p 2m(E − V (x)) k(x) = ~  p 2mα(a − x)    k(x) = x<a ~ p ⇒    k(x) = ±i 2mα(x − a) x > a ~ A variável y por seu lado fica √ Z xp 2mα(a − x′ ) ′ 2 2mα y(x) = dx = − (a − x)3/2 x<a, ~ 3 ~ a √ Z x p 2mα(x′ − a) ′ 2i 2mα y(x) = dx = ± (x − a)3/2 x>a. ±i ~ 3 ~ a . (8.3.10) (8.3.11) Escolhemos a solução negativa, de modo a que e+iy = e+|y| . A variável y = y(x) tornou-se uma medida da distância entre x e o ponto de viragem clássico. Reexpressemos k(x) como k(y) usando a expressão para x < a: √ 1/3 2mα √ 3mα k= . a−x= − 2 y ~ ~ Logo 1 4k 2 dk dy 2 1 d2 k 5 − = . 2 2k dy 36y 2 (8.3.12) (8.3.13) O mesmo resultado é obtido considerando a expressão para x > a. Logo, a equação de Schrödinger (8.3.5) fica d2 v 5 v=0. + 1+ dy 2 36y 2 (8.3.14) Para |y| elevado, o termo 5/36y 2 pode ser negligenciado e obtemos a aproximação WKB. Para |y| pequeno - perto do ponto de viragem clássico - a equação torna-se exacta. O que 8.3 Fórmulas de ligação 245 V(x) E x=b Figura 8.2: Um potencial V (x) perto de um ponto de viragem clássico x = b. estamos a assumir é que para valores intermedios esta equação é uma boa aproximação de modo a conseguirmos ligar a aproximação WKB de ambos os lados.1 Um estudo detalhado da equação (8.3.14) permite-nos então relacionar a solução WKB à esquerda com a solução WKB à direita do ponto de viragem clássico da figura 8.1 da seguinte forma cos −y − π4 1 e−|y| √ , ←→ 2 k̃ k sin −y − π4 e|y| √ . ←→ − k̃ k (8.3.15) Estas são as chamadas fórmulas de ligação. Em termos da coordenada original x e especificando os dois casos possı́veis para pontos de viragem temos as seguintes fórmulas de ligação: • Caso da figura 8.1 Z a Rx 2 π 1 ′ ′ ′ ′ √ cos k(x )dx − ←→ p e− a k̃(x )dx 4 k x k̃ Z a 1 π 1 Rx ′ ′ √ sin k(x′ )dx′ − ←→ − p e a k̃(x )dx 4 k x k̃ 1 F órmula i (8.3.16) F órmula ii Este procedimento é problematico se o valor de E estiver próximo de um extremo do potencial; aqui iremos negligenciar essa subtileza. 246 A aproximação WKB I B’1 II x=b x E B1 A III x=a A’ B’2 B2 V(x) −V 0 Figura 8.3: Um estado com energia E num poço de potencial V (x); x = b e x = a são os pontos de viragem clássicos.A região I é desde x = −∞ até ligeiramente antes de x = b; a região II é desde ligeiramente depois de x = b até ligeiramente antes de x = a; a região III é desde ligeiramente depois de x = a até x = +∞. • Caso da figura 8.2 Z x 1 − R b k̃(x′ )dx′ 2 π ′ ′ p e x ←→ √ cos k(x )dx − 4 k b k̃ Z x R b 1 1 π ′ )dx′ k̃(x ′ ′ −p e x ←→ √ sin k(x )dx − 4 k b k̃ F órmula iii F órmula iv (8.3.17) Estas fórmulas de ligação desempenham, na aproximação WKB, o mesmo papel das considções de continuidade desempenharam no nosso estudo de potenciais constantes por pedaços no capı́tulo 3. 8.4 Aplicação ao cálculo de estados ligados Vamos agora usar a aproximação WKB para calcular o espectro de estados ligados num poço de potencial do tipo da figura 8.3. Consideramos um estado com energia E, com −V0 < E < 0. Na aproximação WKB, as soluções da equação de Schrödinger independente 8.4 Aplicação ao cálculo de estados ligados 247 do tempo nas várias regiões esquematizadas na figura 8.3 são: R R p  − xb k̃(x′ )dx′ ′ xb k̃(x′ )dx′ 2m(V (x) − E) B e + B e  1 1   q com k̃(x) ≡ Região I Φ(x) =   ~   k̃(x)   R R p x x  ′ ′ ′ ′  2m(E − V (x)) Aei b k(x )dx + A′ e−i b k(x )dx p Região II Φ(x) = com k(x) ≡ . ~  k(x)   Rx Rx  ′ ′ ′ ′   a k̃(x )dx + B ′ e− a k̃(x )dx B e  2 2  q Região III Φ(x) =    k̃(x) (8.4.1) Para a função de onda ser normalizavel, as funções que crescem exponencialmente quando x → ±∞ têm que ser rigorosamente zero, isto é B1′ = 0 = B2 . Logo, na região I a função de onda não normalizada será B1 − R b k̃(x′ )dx′ , x<b. e x Φ(x) ≃ q k̃(x) (8.4.2) Pela fórmula de ligação iii, esta função de onda tem a forma, na região II 2B1 Φ(x) ≃ p cos k(x) Z x π k(x )dx − 4 ′ b ′ , b<x<a. Reescrevemos esta função de onda como Z a Z a π 2B1 ′ ′ k(x)dx − k(x )dx − Φ(x) ≃ √ cos 4 k b x Z a Z a 2B1 π ′ ′ k(x)dx − = √ sin k(x )dx + 4 k b x Z a Z a π 2B1 ′ ′ k(x)dx sin k(x )dx − = − √ cos 4 k b x Z a Z a π 2B1 k(x)dx cos k(x′ )dx′ − + √ sin 4 k b x (8.4.3) . (8.4.4) Pelas fórmulas de ligação i e ii, obtemos finalmente que a função de onda na região III tem a forma Φ(x) = 2B1 cos Z b a Z a − R x k̃(x′ )dx′ R x k̃(x′ )dx′ e a ea q q + B1 sin . k(x)dx k(x)dx b k̃(x) k̃(x) (8.4.5) 248 A aproximação WKB Comparando com (8.4.1), verificamos que B2 = 2B1 cos Z a b k(x)dx , (8.4.6) pelo que a condição de normalizabilidade B2 = 0 requer que Z a b 1 π, k(x)dx = n + 2 n ∈ N0 . (8.4.7) Note-se que n ∈ N0 e não Z, pois o lado esquerdo desta equação é positivo. Esta equação determina o espectro de energias dos estados ligados. Exemplo: Consideramos o potencial do oscilador harmónico V (x) = mω 2 x2 /2 e um estado com energia E. Os pontos de viragem clássicos, a e b, obedecem a V (a) = E = V (b), p e tomam neste caso a forma ± 2E/mω 2 . Logo, a condição (8.4.7) fica Z q − 2E mω 2 q 2E mω 2 p m(2E − mω 2 x2 ) 1 π, dx = n + ~ 2 (8.4.8) de onde se conclui que 1 E = ~ω n + , 2 (8.4.9) que é o valor exacto incluindo a energia de ponto zero! Exercı́cio: Calcule a função de onda do oscilador harmónico para os nı́veis n = 0 e n = 1 na aproximação WKB. Se introduzissemos o momento clássico pela relação p(x) = ±~k(x), o movimento limitado no poço de potencial corresponde a uma trajectória fechada no espaço de fase - figura 8.4. A condição (8.4.7) pode ser reescrita como I 1 p(x)dx = n + h. 2 (8.4.10) Esta condição é muito semelhante a uma outras impostas na velha teoria quântica, que corespondiam a um passo intermédio entre a teoria clássica e a teoria quântica completa. 8.4 Aplicação ao cálculo de estados ligados 249 p b a x Figura 8.4: Movimento no espaço de fase de uma partı́cula clássica confinada entre x = b e x = a no potencial da figura 8.3. Por exemplo a quantificação sugerida por Bohr, discutida no capı́tulo 2 podia ser escrita como I p(x)dx = nh . (8.4.11) Por esta razão a aproximação WKB é frequentemente designada por aproximação semiclássica. Isso é também confirmado notando que o ansatz Φ(x) = exp (iS(x))/~ transforma, se negligenciarmos as segundas derivadas, a equação de Schrödinger completa ∂Ψ ~2 d 2 i~ = − + V (x, t) Ψ , ∂t 2m dx2 (8.4.12) na equação de Hamilton-Jacobi da mecânica clássica (1.3.51) 1 ∂S = − ∂t 2m ∂S ∂x 2 + V (x, t) . (8.4.13) Portanto, a fase S(x, t) comporta-se como a acção função da mecânica clássica. Isto justifica a classificação da primeira aproximação na secção 8.1 como ‘aproximação clássica’. A segunda aproximação (primeira ordem em ~) é a aproximação WKB. A fórmula (8.4.7) ajuda-nos também a pensar na função de onda da seguinte maneira. Podemos entender esta relação como expressando que a mudança de fase ao longo do poço, de a para b, é igual a (n + 1/2)π. Dividindo por 2π, concluimos que a função de onda na aproximação WKB tem n/2 + 1/4 (quase) comprimentos de onda no poço. Assim n representa o número de nodos da função de onda, facto que ajuda a visualizar Ψ. 250 A aproximação WKB V(x) A1 A’1 B A2 B’ A’2 E I x=a II x=b III x Figura 8.5: Um estado com energia E numa barreira de potencial V (x); x = a e x = b são os pontos de viragem clássicos. A região I é desde x = −∞ até ligeiramente antes de x = a; a região II é desde ligeiramente depois de x = a até ligeiramente antes de x = b; a região III é desde ligeiramente depois de x = b até x = +∞. 8.5 Aplicação ao cálculo do factor de transmissão Aplicamos agora o método WKB ao cálculo do factor de transmissão através de uma barreira com altura maior do que a energia da partı́cula - figura 8.5. Este problema é semelhante ao da barreira rectângular estudado no capı́tulo 3, mas nenhuma hipótese especifica é feita relativamente à forma concreta da barreira. Assumimos que a aproximação WKB é válida nas três regiões. Isto é, o potencial não varia demasiado rapidamente. Nesta aproximação obtemos as seguintes três soluções da equação de Schrödinger independente do tempo:  Rx Rx p ′ ′ ′ ′  2m(E − V (x)) A1 ei a k(x )dx + A′1 e−i a k(x )dx   p Região I : Φ(x) = com k(x) ≡   ~  k(x)    R R p  x x ′ ′ ′ ′  2m(V (x) − E) Be a k̃(x )dx + B ′ e− a k̃(x )dx q com k̃(x) ≡ Região II : Φ(x) = ~   k̃(x)    R R x x  ′ ′ ′ ′   A2 ei b k(x )dx + A′2 e−i b k(x )dx   p . Φ(x) =  Região III : k(x) (8.5.1) O nosso objectivo é usar as fórmulas de ligação para relacionar os coeficientes A1 , A′1 com A2 , A′2 , de modo a poder comparar a onda incidente com a transmitida. Com esse objectivo notamos que: 8.5 Aplicação ao cálculo do factor de transmissão 251 • Usando as fórmulas de ligação i e ii, ligamos a solução na região II à região I: Rx Be Φ(x) = a em I −→ = Rx k̃(x′ )dx′ ′ ′ + B ′ e− a k̃(x )dx q k̃(x) Z a Z a ′ π π B 2B ′ ′ ′ ′ p cos sin k(x )dx − k(x )dx − −p 4 4 k(x) k(x) x x 2B ′ + iB −iπ/4 i R a k(x′ )dx′ 2B ′ − iB iπ/4 −i R a k(x′ )dx′ p e e x + p e e x . 2 k(x) 2 k(x) Logo  2B ′ − iB iπ/4   e  A1 = 2 ′    A′1 = 2B + iB e−iπ/4 2 ⇔ • Denotamos (8.5.2)  A′ eiπ/4 + A1 e−iπ/4    B′ = 1 2 ′ iπ/4  − A1 e−iπ/4   B = A1 e i Rb θ≡e a k̃(x)dx . . (8.5.3) (8.5.4) Usando as fórmulas de ligação iii e iv, ligamos a solução na região II à região III Φ(x) = Rx Be em III −→ = a k̃(x′ )dx′ Rx ′ Rb ′ ′ ′ Rb ′ ′ B ′ e x k̃(x )dx + Bθ2 e− x k̃(x )dx + B ′ e− a k̃(x )dx q q = k̃(x) θ k̃(x) Z x Z x ′ B π π 2Bθ ′ ′ ′ ′ − p sin cos k(x )dx − k(x )dx − +p 4 4 θ k(x) k(x) b b 2θB + iB ′ /θ −iπ/4 i R x k(x′ )dx′ 2θB − iB ′ /θ iπ/4 −i R x k(x′ )dx′ p p + . e e b e e b 2 k(x) 2 k(x) Logo  2θB + iB ′ /θ −iπ/4   e  A2 = 2 ′    A′2 = 2θB − iB /θ eiπ/4 2 ⇔  A2 eiπ/4 − A′2 e−iπ/4   θ  B′ = i iπ/4  + A′2 e−iπ/4   B = A2 e 2θ Igualando as duas soluções (8.5.3) a (8.5.6) obtemos  1 1   A2 + i 2θ − A′2  2A1 = 2θ + 2θ 2θ  1 1 ′   2A1 = i −2θ + A2 + 2θ + A′2 2θ 2θ . (8.5.5) . (8.5.6) (8.5.7) 252 A aproximação WKB O factor de transmissão, T , foi definido por (3.2.24) como sendo a intensidade da onda transmitida sobre a intensidade da onda reflectida. A intensidade de um onda foi, por sua vez, definida na secção 3.2.1 como a densidade de probabilidade vezes a velocidade; assim sendo temos, para o nosso caso √ |Φt kt |2 |A2 |2 |Φt |2 vt √ = . = T = |Φi |2 vi |A1 |2 |Φi ki |2 (8.5.8) Assumindo que temos uma onda incidente de x = −∞, não deverá existir onda incidente da direita; logo A′2 = 0. Assim sendo |A2 |2 = |A1 |2 4θ 2 4θ + 1 2 . (8.5.9) Para uma barreira larga e alta, θ ≫ 1; este factor é uma medida da opacidade da barreira. Neste caso T ≃ R √ 1 −2 ab 2m(V (x)−E)/~ = e . θ2 (8.5.10) Esta é fórmula (3.2.46) usada no capı́tulo 3 para estudar a radioactividade α, com uma justificação vaga. A sua verdadeira justificação é a aproximação WKB como acabamos de deduzir. Nesse caso T é chamado o factor de Gamow. 8.6 Sumário Neste capı́tulo estabelecemos um método, denominado aproximação WKB, que permite, para uma vasta classe de potenciais e em analogia próxima com o tratamento de potenciais constantes por pedaços do capı́tulo 3, calcular o espectro de estados ligados e o factor de transmissão através de barreiras de potencial. CAPÍTULO 9 Teoria Geral do Momento Angular e Spin No capı́tulo 6 estudamos o momento angular orbital em Mecânica Quântica. Em particular vimos que as componentes do operador momento angular orbital, L̂i , i = 1, 2, 3, obedecem às relações de comutação (6.1.4), [L̂j , L̂k ] = i~ǫjkl L̂l , onde ǫjkl é o sı́mbolo de Levi-Civita, que tem valor1   +1 se (jkl) = Π (123) par ǫjkl =  −1 se (jkl) = Π (123) (9.0.1) , (9.0.2) ímpar onde Π... (123) significa “permutação par” ou “permutação ı́mpar” da sequência (123). Estas relações de comutação resultam da quantificação canónica do momento angular ~ ≡ ~r × p~, e das relações de comutação canónicas. No entanto vamos agora orbital, L tomar uma perspectiva mais abrangente. Vamos tomar estas relações de comutação como definindo os operadores de momento angular. Para manifestar que estes poderão ter outra origem que não a orbital, denotamos os operadores mais gerais de momento angular por J~i ; as relações de comutação são assim [Jˆj , Jˆk ] = i~ǫjkl Jˆl . 1 (9.0.3) Em linguagem de geometria diferencial o sı́mbolo de Levi-Civita que estamos a definir é uma densidade tensorial e não um tensor, pois mantém a forma (9.0.2) em todos os sistemas coordenados. 254 Teoria Geral do Momento Angular e Spin Vamos começar por demonstrar que esta álgebra admite mais representações do que as que correspondem à acção do momento angular orbital. Estas últimas descrevem partı́culas com spin inteiro; as novas representações descrevem partı́culas com spin semi-inteiro. Um spin semi-inteiro é uma quantidade que não tem equivalente em mecânica clássica, mas cuja existência fı́sica estabeleceremos seguidamente, como consequência de resultados experimentais. 9.1 Representações da álgebra do momento angular A álgebra (9.0.3) é um caso particular de uma álgebra de Lie. Como estas álgebras são centrais no estudo de grupos de simetria contı́nuos (grupos de Lie), e estes descrevem muitas simetrias que aparecem em sistemas fı́sicos, vamos enquadrar a nossa discussão desta secção no contexto mais geral de álgebras e grupos de Lie. Começamos por definir álgebra de Lie: Definição: Seja L um espaço vectorial de dimensão finita sobre um corpo K (K = R ou K = C). L é uma álgebra de Lie sobre K se existir, em L, uma regra de composição X, Y −→ [X, Y ] , (9.1.1) que satisfaça os seguintes axiomas para ∀X, Y, Z ∈ L: i) linearidade; ∀α, β ∈ K, [αX + βY, Z] = α[X, Z] + β[Y, Z] ; (9.1.2) [X, Y ] = −[Y, X] ; (9.1.3) ii) anti-simetria, iii) identidade (ou associatividade) de Jacobi, [X, [Y, Z]] + [Z, [X, Y ]] + [Y, [Z, X]] = 0 . (9.1.4) 9.1 Representações da álgebra do momento angular 255 A operação [. . . , . . .] é denominada multiplicação de Lie. Esta multiplicação é genericamente anti-comutativa e não associativa. Notemos que um exemplo de produto de Lie, que encontramos na secção 1.3.1, é dado pelos parêntesis de Poisson; um outro, que é a razão pela qual introduzimos aqui a teoria de Lie, é o comutador quântico. Consideremos algumas definições importantes relativas a uma álgebra de Lie: • Uma álgebra de Lie é dita abeliana ou comutativa se, ∀X, Y ∈ L, [X, Y ] = 0. • Um sub-espaço vectorial de L, L1 ⊂ L, é uma sub-álgebra de Lie se [X, Y ] ∈ L1 , ∀X, Y ∈ L1 . (9.1.5) • Um sub-espaço vectorial de L, L1 ⊂ L, é um ideal se [X, Y ] ∈ L1 , ∀X ∈ L1 , ∀Y ∈ L ; (9.1.6) um ideal é, portanto, um sub-conjunto “absorvente” da álgebra e qualquer ideal é uma sub-álgebra. • Um sub-espaço vectorial de L, L1 ⊂ L, é um ideal máximo ou centro se [X, Y ] = 0 , ∀X ∈ L1 , ∀Y ∈ L ; (9.1.7) o centro comuta, portanto, com toda a álgebra e constitui uma sub-álgebra abeliana. • Seja {ei } uma base de L. A multiplicação de Lie para esta base define as constantes de estrutura da álgebra de Lie, cij k , [ei , ej ] = cij k ek . (9.1.8) Note-se que como consequência dos axiomas, as constantes de estrutura obedecem a cjki = −ckji , cis p cjks + cjsp ckis + cksp cij s = 0 . (9.1.9) Note-se ainda que estas “constantes” dependem da base; de facto transformamse como um tensor com dois ı́ndices covariantes e um contravariante numa transformação de base. 256 Teoria Geral do Momento Angular e Spin • Uma representação da álgebra de Lie, denotada por D, é uma aplicação linear de L para um espaço vectorial V, que preserva o produto de Lie; isto é D : L −→ V , (9.1.10) D([X, Y ]) = [D(X), D(Y )] . (9.1.11) tal que Para definir a representação necessitamos pois de definir o produto de Lie em V. Geralmente as representações são classificadas pelos valores próprios dos chamados invariantes de Casimir, que são operadores que comutam com os geradores da álgebra; encontram-se por isso no centro da mesma.2 No caso da âlgebra do momento ângular o invariante de Casimir será Jˆ2 . • Uma representação matricial de dimensão n da álgebra da Lie é uma aplicação da álgebra de Lie para o espaço de matrizes, em geral de entradas complexas, de n × n. É fácil de verificar que este é um espaço vectorial sobre o corpo C. O produto de Lie no espaço vectorial das matrizes é definido como o comutador [X, Y ] = X · Y − Y · X , (9.1.12) e onde “·” é o produto usual de matrizes. Com esta forma de multiplicação de Lie, é simples verificar a identidade de Jacobi, que surge como consequência da associatividade do produto de matrizes. O espaço vectorial onde a representação matricial actua tem como base os estados fı́sicos do sistema. Dizemos que os estados se transformam pela acção da representação n dimensional da álgebra de Lie. Por exemplo, para a álgebra do momento angular, estados escalares transformam-se pela acção da representação um dimensional; estados spinoriais pela acção da representação dois dimensional; estados vectoriais pela acção da representação três dimensional, etc. Vamos agora estudar representações matriciais da álgebra do momento angular, isto é um conjunto de matrizes Ji que obedecem a (9.0.3). Começamos por definir os operadores 2 Como os invariantes de Casimir são geralmente quadráticos ou até de ordem mais elevada nos geradores, poderão não ser vectores de L; ainda assim dizemos que se encontram no centro da álgebra. 9.1 Representações da álgebra do momento angular 257 não hermı́ticos em escada análogos a (6.2.32): Jˆ+ = Jˆx + iJˆy , Jˆ− = Jˆx − iJˆy , (9.1.13) que obedecem às relações de comutação h i Jˆ2 , Jˆ± = 0 , h i Jˆ− , Jˆ+ = −2~Jˆz , h i Jˆz , Jˆ± = ±~Jˆ± , (9.1.14) exactamente análogas a (6.2.33), onde definimos o momento angular total Jˆ2 como Jˆ2 ≡ Jˆx2 + Jˆy2 + Jˆz2 . (9.1.15) Queremos considerar os estados com momento angular bem definido. No caso do momento angular orbital estes estados diagonalizavam simultaneamente L̂2 e, por escolha, L̂z ; na notação de Dirac tais estados foram denotados |ℓ, mi. L̂2 e L̂z formam um C.C.O.C. para o problema dos estados com momento angular orbital bem definido; isto é, especificando ℓ e m, que determinam univocamente os valores próprios de L̂2 e L̂z , especifica um único estado de momento angular orbital bem definido. Por analogia vamos assumir que: • Os estados com momento angular bem definido diagonalizam simultaneamente Jˆ2 e Jˆz ; • Estes estados, denotados |j, mi, são rotulados pelos números quânticos j e m, que determinam univocamente os valores próprios de Jˆ2 e Jˆz ; • A correspondência entre o rótulo m e o valor próprio de Jˆz é Jˆz |j, mi = m~|j, mi . (9.1.16) Note-se que, como Jˆ2 e Jˆz são observáveis, estados próprios com valores próprios distintos são ortogonais; assumindo normalização temos hj ′ , m′ |j, mi = δj ′ j δm′ m . (9.1.17) Para construir as representações pretendidas, consideramos a álgebra h i Jˆz , Jˆ± = ±~Jˆ± , (9.1.18) 258 Teoria Geral do Momento Angular e Spin que implica que Jˆ± |j, mi é estado próprio de Jˆz com valor próprio (m ± 1)~; logo Jˆ+ |j, mi = Cjm |j, m + 1i , Jˆ− |j, mi = C̃jm |j, m − 1i . (9.1.19) As constantes introduzidas Cjm e C̃jm não são todas independentes; de facto (Cjm )∗ = (hj, m + 1|Jˆ+ |j, mi)∗ = hj, m|Jˆ− |j, m + 1i = C̃jm+1 . (9.1.20) Por outro lado, a relação de comutação h i ˆ ˆ J− , J+ = −2~Jˆz , (9.1.21) origina hj, m|Jˆ− Jˆ+ − Jˆ+ Jˆ− |j, mi = −2~hj, m|Jˆz |j, mi ⇔ C̃jm Cjm−1 − Cjm C̃jm+1 = 2~2 m . (9.1.22) Juntamente com (9.1.20) esta relação implica |Cjm−1 |2 − |Cjm |2 = 2~2 m , (9.1.23) que tem como solução geral3 |Cjm |2 = (C − m(m + 1))~2 |C̃jm |2 = (C − m(m − 1))~2 , ⇒ (9.1.24) onde C é uma constante real, dado que |Cjm |2 é real. Como os lados esquerdos de (9.1.24) são positivos e os lados direitos se tornam negativos para m suficientemente grande em 3 Para ver isto escreva |Cjm |2 ≡ f (m) como uma série de potências f (m) = +∞ X an mn . n=0 A equação (9.1.23) é reescrita f (m − 1) − f (m) = 2~2 m ⇔ +∞ X n=0 an ((m − 1)n − mn ) = 2~2 m . Logo an = 0 para n > 2, e a equação anterior fica (1 − 2m)a2 − a1 = 2~2 m ou ainda a2 = −~2 , a1 = a2 . Logo f (m) = −~2 (m + m2 ) + a0 , que é equivalente à primeira expressão em (9.1.24). 9.1 Representações da álgebra do momento angular 259 módulo, temos de concluir que os valores possı́veis para m têm um máximo e um mı́nimo, denotados por m̄ e m, respectivamente: m = m, m + 1, . . . , m̄ − 1, m̄ . (9.1.25) Em termos destes valores, (9.1.24) deve ser escrito como |Cjm |2 = (m̄(m̄ + 1) − m(m + 1))~2 |C̃jm |2 = (m(m − 1) − m(m − 1))~2 , (9.1.26) e como |Cjm |2 = |C̃jm+1 |2 , concluimos que m̄(m̄ + 1) = m(m − 1), o que pode ser reescrito (m̄ + m)(m̄ − m + 1) = 0 ⇒ m = −m̄ ∨ m = m̄ + 1 . (9.1.27) A segunda possibilidade é excluı́da pois m̄ > m, por hipótese. Como m̄ − m ∈ Z+ 0 (dado que diferem de um múltiplo da unidade e o primeiro é maior do que o segundo), obtemos que 2m̄ ∈ Z+ 0 , pelo que concluimos que 3 5 1 m̄ = 0, , 1, , 2, , . . . 2 2 2 (9.1.28) Para vermos os valores próprios de Jˆ2 notamos que 1ˆ ˆ 2 ˆ ˆ ˆ J+ J− + J− J+ + Jˆz2 . J = 2 (9.1.29) O valor esperado deste operador num estado |j, mi é 1 9.1.26 hj, m|Jˆ2 |j, mi = |Cjm−1 |2 + |Cjm |2 + m2 ~2 = ~2 m̄(m̄ + 1) . 2 (9.1.30) Mas |j, mi é função própria de Jˆ2 pelo que concluimos que o valor próprio é m̄(m̄ + 1)~2 . Denotando m̄ ≡ j temos então Jˆ2 |j, mi = j(j + 1)~2 |j, mi , Jˆz |j, mi = m~|j, mi p Jˆ± |j, mi = ~ j(j + 1) − m(m ± 1)|j, m ± 1i , (9.1.31) onde 2j ∈ N0 , m = −j, −j + 1, . . . , j − 1, j. Descobrimos, pois um conjunto infinito de representações da álgebra (9.0.3), rotuladas por j e que denotamos Dj , com dimensão 2j+1. Estas representações são todas irredutı́veis, 260 Teoria Geral do Momento Angular e Spin pois em cada uma delas podemos transformar |j, mi em |j, m′ i, ∀m, m′ , pela acção de Jˆ+ e Jˆ− . A base do espaço vectorial onde a representação Dj actua é {|j, mi}, com m = −j, −j + 1, . . . , j − 1, j. Os geradores da álgebra terão, em cada representação Dj , uma representação matricial em termos de matrizes quadradas de dimensão 2j + 1, com componentes (Ji )m′ m = hj, m′ |Jî |j, mi . (9.1.32) Consideremos as primeiras representações, para o que irá ser útil notar que Jˆ+ + Jˆ− , Jˆx = 2 Jˆ+ − Jˆ− Jˆy = , 2i (9.1.33) logo p ~ p j(j + 1) − m(m + 1)δm′ ,m+1 + j(j + 1) − m(m − 1)δm′ ,m−1 , 2 p ~ p hj, m′ |Jˆy |j, mi = j(j + 1) − m(m + 1)δm′ ,m+1 − j(j + 1) − m(m − 1)δm′ ,m−1 , 2i hj, m′ |Jˆx |j, mi = hj, m′ |Jˆz |j, mi = ~mδm′ ,m . (9.1.34) • j = 0, representação 1-dimensional; base do espaço onde a representação actua é {|0, 0i}; elementos de matriz: h0, 0|Jˆx |0, 0i = 0 ; h0, 0|Jˆy |0, 0i = 0 ; h0, 0|Jˆx |0, 0i = 0 . (9.1.35) Logo todos os geradores da álgebra são representados por ‘zero’. Esta representação é trivial e não é fiel (i.e não é injectiva). O único vector da base corresponde ao harmónico esférico Y00 , que é constante e não é alterado pelo grupo de transformações (rotações) geradas pela álgebra do momento angular. • j = 1/2, representação 2-dimensional; a base do espaço vectorial onde a representação 9.1 Representações da álgebra do momento angular 261 actua é {|1/2, 1/2i, |1/2, −1/2i}; elementos de matriz:  0 1  ~  ≡ ~ σx h1/2, m′ |Jˆx |1/2, mi =  2 2 1 0   0 −i ~  ≡ ~ σy h1/2, m′ |Jˆy |1/2, mi =  2 2 i 0   1 0 ~  ≡ ~ σz h1/2, m′|Jˆz |1/2, mi =  2 2 0 −1 . (9.1.36) As matrizes σx , σy e σz são denominadas matrizes de Pauli. O espaço onde esta representação actua, tal como os de outras representações com j semi-inteiro, deve ser visto como um espaço vectorial interno; neste caso esse espaço é denominado espaço de spin 1/2 ou simplesmente espaço de spin e os Jî são usualmente representados como Ŝi . Esta representação é fiel. • j = 1, representação 3-dimensional; a base do espaço vectorial onde a representação actua é {|1, 1i, |1, 0i, |1, −1i}; elementos de matriz:    0 1 0   ~   h1, m′ |Jˆx |1, mi = √  1 0 1  ,  2 0 1 0  0 1 0   ~   h1, m′ |Jˆy |1, mi = √  −1 0 1  ,  2i  0 −1 0   1 0 0     h1, m′ |Jˆz |1, mi = ~  0 0 0  .   0 0 −1 (9.1.37) A base do espaço vectorial onde esta representação actua corresponde aos harmónicos esféricos Y1±1 e Y10 . De acordo com as relações (6.5.49) podemos fazer a mudança de base  |xi   −1  r 2π      r i  |yi  =   3  |zi 0 0 1  |1, 1i   0 i   |1, 0i  √ 2 0 |1, −1i     .  (9.1.38) 262 Teoria Geral do Momento Angular e Spin Tomando agora a base {|xi, |yi, |zi} para a representação j = 1, temos os elementos de matriz: hx |Jˆk |xj i = i 1 X hxi |1, m′ ih1, m′ |Jˆk |1, mih1, m|xj i ; (9.1.39) m,m′ =−1 obtemos assim as matrizes que representam os geradores da álgebra do momento angular na base {|xi, |yi, |zi}:   0 0 0     i ˆ j hx |Jx |x i = i~  0 0 1    0 −1 0  0 0 1   j ˆ hx |Jy |x i = i~  0 0 0  −1 0 0   0 1 0     i ˆ j hx |Jz |x i = i~  −1 0 0    0 0 0 i      . (9.1.40) Reconhecemos os geradores das rotações em R3 . Por exemplo, uma rotação finita por um ângulo θ em torno do eixo Oz é obtida exponenciando o respectivo gerador:   cos θ sin θ 0   ˆ   Rz (θ) = e−iθJz /~ =  − sin θ cos θ 0  .   0 0 1 (9.1.41) As representações matriciais de dimensão mais elevada podem ser construidas de um modo análogo. Exercı́cio: Construa a representação com j = 3/2. Relação com o grupo de Lie O mapa exponencial exemplificado em (9.1.41) é a relação genérica entre uma álgebra de Lie e o grupo de Lie respectivo. Comecemos por relembrar a estrutura de grupo: Definição: Um grupo G é um conjunto de elementos {g} com uma lei de composição ‘◦’ que obedece às seguintes condições: i) O grupo é uma estrutura fechada: g1 ◦ g2 ∈ G , ∀g1 , g2 ∈ G; 9.1 Representações da álgebra do momento angular 263 ii) A lei de composição do grupo é associativa: (g1 ◦ g2 ) ◦ g3 = g1 ◦ (g2 ◦ g3 ) , ∀g1 , g2 , g3 ∈ G; iii) Existe um elemento neutro (identidade) denotado por 1: 1 ◦ g = g ◦ 1 , ∀g ∈ G; iv) Existe um inverso para qualquer elemento do grupo g, que é denotado por g −1 : ∀g , ∃g −1: g ◦ g −1 = g −1 ◦ g = 1. Um grupo de Lie é um grupo contı́nuo, isto é um grupo cujos elementos são rotulados por parâmetros que variam continuamente. Essa continuidade dá uma estrutura de variedade diferenciável aos grupos de Lie, com uma determinada geometria local e uma determinada topologia. Dada uma álgebra de Lie, L podemos obter um grupo de Lie GL exponenciando os geradores da álgebra, tal como em (9.1.41): X∈L ⇒ e−iαX ∈ GL ; (9.1.42) o ponto fundamental (que não vamos demonstrar) é que a identidade de Jacobi da álgebra garante a associatividade da lei de composição do grupo. Podemos agora ver duas propriedades genéricas das matrizes do grupo associado à álgebra do momento angular: • Para qualquer representação o traço das matrizes que representam a álgebra do momento angular é zero para qualquer dos geradores. Usamos então o seguinte facto: se duas matrizes A e B obedecem a A = eB então det A = eTrB . Logo se o traço das matrizes que representam os geradores de uma álgebra de Lie é zero o determinante das matrizes que representam o grupo é igual a um. Tais matrizes denominam-se especiais; • Como os geradores da álgebra do momento angular são hermı́ticos, os elementos do grupo de Lie associado obedecem a g † = (e−iθJ )† = eiθJ = g −1 . Os elementos do grupo são portanto operadores unitários: gg † = g † g = 1. No caso da representação três dimensional pudemos escolher uma base em que os geradores são matrizes puramente imaginárias e anti-simétricas (9.1.40). Nesse caso, 264 Teoria Geral do Momento Angular e Spin as matrizes da representação do grupo de Lie são ortogonais; de facto, nesse caso o expoente torna-se real e uma matriz anti-simétrica A, pelo que g T = (eθA )T = e−θA = g −1 , o que implica que gg T = g T g = 1, o que é a definção de operadores ortogonais. Considermos pois as várias representações do grupo de Lie associado ao momento angular: • j = 0: dado que os geradores da álgebra são representados por zero, os elementos do grupo reduzem-se todos ao operador identidade Rk (θ) = e−iθJk /~ = 1 ; (9.1.43) os estados que formam a base do espaço vectorial onde o grupo actua são pois invariantes pela acção do grupo e denominam-se estados escalares. • j = 1/2: Os elementos do grupo têm a forma Rk (θ) = e−iθJk /~ = e−iθσk /2 . (9.1.44) Para escrevermos os elementos do grupo mais explicitamente notamos a identidade ~ σ · B) ~ =A ~ ·B ~ 1̂ + i~σ · (A ~ × B) ~ , (~σ · A)(~ (9.1.45) ~ e B ~ são dois vectores arbitrários e ~σ = (σx , σy , σz ) as matrizes de Pauli onde A (9.1.36). Seja ~u um vector unitário. Pela fórmula anterior concluimos que   1̂ se n par 2 n (~σ · ~u) = 1 ; logo (~σ · ~u) = .  ~σ · ~u se n ímpar (9.1.46) torno do eixo definido por ~u é dada por   θ θ θ − iu sin (−iu − u ) sin cos z x y 2 2 2  . Ru~ (θ) = e−iθ~σ·~u/2 =  (−iux + uy ) sin θ2 cos θ2 + iuz sin 2θ (9.1.47) Logo, a representação dos elementos do grupo correspondentes a uma rotação em Note-se que Ru~ (2π) = −1 e Ru~ (4π) = 1. Ou seja para voltar ao mesmo estado no espaço de spin 1/2 necessitamos de fazer uma rotação por um ângulo 4π. 9.2 Emergência Fı́sica do Spin 265 • j = 1: Os elementos do grupo têm a forma  1 0 0   Rx (θ) = e−iθJx /~ =  0 cos θ sin θ  0 − sin θ cos θ          Ry (θ) = e−iθJy /~ =   cos θ sin θ 0   Rz (θ) = e−iθJz /~ =  − sin θ cos θ 0  0 0 1    .  cos θ 0 0 sin θ 1 0 − sin θ 0 cos θ (9.1.48) Estas são as bem conhecidas matrizes de rotação a actuar em R3 . Acabamos de construir várias representações dos operadores de rotação. Estes operadores são os elementos do grupo de Lie que descreve as rotações. Este grupo é designado por SU(2), pois é constituido por Special Unitary matrices sendo a sua representação fundamental de dimensão 2 - as matrizes de Pauli. Este é o grupo de Lie associado à álgebra do momento angular. Um seu sub-grupo é SO(3) o grupo de Special Orthogonal matrices que está associado apenas às representações do momento angular orbital e cuja representação fundamental é três dimensional. A álgebra de Lie associada a SU(2) é denotada su(2), enquanto que a álgebra de Lie associada a SO(3) é denotada so(3). Como vimos estas álgebras são isomórficas. su(2) ∼ = so(3) . (9.1.49) Mas os grupos distinguem-se pelo facto de SU(2) ter mais representações que SO(3), sendo SO(3) um grupo mais reduzido do que SU(2).4 9.2 Emergência Fı́sica do Spin No tratamento do átomo de hidrogénio que efectuamos no capı́tulo 6 descrevemos os estados estacionários do electrão através de uma função de onda Φ(~r) que depende somente das 4 Geometricamente o grupo SU (2) é uma 3-esfera, S 3 , enquanto que SO(3) é uma 3-esfera com pontos identificados S 3 /Z2 .      266 Teoria Geral do Momento Angular e Spin variáveis espaciais ~r. Este tratamento permitiu-nos deduzir o espectro de energias para o átomo de hidrogénio que havia sido introduzido fenomenologicamente por Bohr. Claro que um tratamento baseado na equação de Schrödinger não é relativista. Para justificarmos que a aproximação não relativista é aceitável estimemos classicamente a velocidade de um electrão numa órbita circular, que obedece a me e2 v2 = ; r 4πǫ0 r 2 (9.2.1) estimando o raio da órbita r pelo raio de Bohr (6.4.22) e introduzindo a constante de estrutura fina (2.2.4) concluimos que e2 = me v ∼ 4πǫ0 a0 2 e2 4πǫ0 ~c 2 me c2 ⇔ v ∼ αc . (9.2.2) Como a constante de estrutura fina é da ordem de α ∼ 1/137, a aproximação não relativista é justificada. Contudo, é de esperar que surjam correcções relativistas no problema do átomo de hidrogénio. A equação relativista da mecânica quântica, designada por equação de Dirac introduz, de facto, não só correcções cinemáticas para as variáveis de posição que descrevem o electrão - como a variação da massa com a velocidade -, mas ainda uma caracterı́stica totalmente nova para o electrão: o spin. Historicamente, contudo, o spin do electrão foi descoberto experimentalmente antes da introdução da equação de Dirac, proposta em 1928. Tais resultados experimentais, que serão discutidos seguidamente, levaram George Uhlenbeck e Samuel Goudsmit a propôr, em 1925, a ideia de um momento angular intrı́nseco para o electrão; Pauli, em 1927, formalizaria esta ideia propondo uma teoria - fenomenológica - que permitia incorporar o spin na mecânica quântica não relativista, usando alguns postulados suplementares. Esta teoria foi motivada por vários resultados experimentais, dos quais discutiremos agora três: A estrutura fina Um estudo preciso das linhas espectrais do átomo de hidrogénio (por exemplo), revela uma sub-estrutura denominada estrutura fina.5 Cada linha na figura 2.12 é na verdade composta 5 A estrutura fina de linhas espectrais foi descoberta usando interferometria por A.A.Michelson em 1891-92: Phil. Mag. 31 (1891) 338; ibid. 34 (1892) 280. 9.2 Emergência Fı́sica do Spin 267 por várias linhas, com frequências muito idênticas mas que podem ser distinguidas por um espectrómetro com boa resolução. Por exemplo, a transição 2p → 1s é na verdade um dupleto de linhas espectrais, com as duas linhas separadas por cerca de 10−4 eV . Esta separação é cerca de 105 vezes menor que a diferença de energia entre o nı́vel n = 2 e n = 1, que é de cerca de 10.2 eV . Este dupleto será estudado em detalhe na secção 11.1.4. Isto significa que existem grupos de nı́veis atómicos energeticamente muito próximos mas distintos, o que não é previsto pela descrição quântica do átomo de hidrogénio feita no capı́tulo 6, i.e sem spin, que se baseava apenas no Hamiltoniano H= p2 e2 − . 2µ 4πǫ0 r (9.2.3) A teoria completa do átomo de hidrogénio tem de levar em conta vários outros termos no Hamiltoniano, todos eles aparecendo de um modo natural da equação de Dirac. As primeiras correcções a (9.2.3), responsáveis pela estrutura fina, são as seguintes:6 i) Correcções relativistas à energia cinética. A velocidade do electrão é da ordem de αc e como tal não é “muito relativista”, pelo que podemos considerar apenas a primeira correcção relativista à energia cinética, que tem a forma Wmv = − p4 . 8µ3 c2 (9.2.4) Os estados estacionários do átomo de hidrogénio sem spin não são estados próprios deste operador (depois de quantificação canónica deste termo), pelo que ele deverá ser tratado como uma perturbação (cf. capı́tulo 11). Pode-se estimar que as correcções ao espectro de energias do átomo de hidrogénio provenientes desta perturbação são supressas por um factor de α2 relativamente ao espectro não perturbado - ou seja as correcções são cerca de 104 − 105 vezes menores que o espectro não perturbado. ii) Acoplamento spin-órbita. O electrão do átomo de hidrogénio vê uma corrente, devido ao facto de no seu referencial o núcleo estar em movimento. Assim o electrão vê um 6 Todos estes termos serão discutidos em maior detalhe na secção 11.1.4. 268 Teoria Geral do Momento Angular e Spin campo magnético, pelo que, se ele tem um momento magnético intrı́nseco ~µS , existe um acoplamento do tipo ~ , WSO = −~µS · B ~µS = g µB ~ S, ~ (9.2.5) no Hamiltoniano, onde g é a razão giromagnética do electrão e µB o magnetão de ~ o que pode ser Bohr. A forma explı́cita desta perturbação requer então calcular B, ~ do núcleo visto num feito através de uma transformação de Lorentz do campo E referencial onde este está parado. Para esse cálculo tem de ser também levada em conta a chamada precessão de Thomas. Chega-se assim ao resultado: WSO = 1 e2 g ~ ~ L·S . 3 2 4πǫ0 r 2m2 c2 (9.2.6) Esta correcção irá ser da mesma ordem que a correcção relativista. iii) Existe ainda uma outra correcção da mesma ordem de grandeza das duas anteriores, denominada termo de Darwin. Este termo surge pelo facto de, na expansão em v/c da equação de Dirac, o electrão ser afectado numa vizinhança da ordem do comprimento de onda de Compton pelo potencial do protão, e não apenas num ponto. O termo tem a forma WD = ~2 ∆V , 8m2 c2 (9.2.7) onde ∆V é o laplaciano da energia potencial de Coulomb. A teoria de Pauli irá introduzir a correcção ii), o que irá explicar, qualitativamente, algumas caracterı́sticas da estrutura fina. O efeito Zeeman Anómalo Como vimos na secção 6.5.4, quando um átomo é imerso num campo magnético uniforme, cada uma das suas linhas espectrais separa-se num certo número de linhas equidistantes, cuja distância é proporcional ao campo magnético - efeito Zeeman. A explicação deste efeito baseia-se no Hamiltoniano (6.5.10) que inclui o acoplamento paramagnético ~ , H1 = −~µL · B ~µL = µB ~ L. ~ (9.2.8) 9.2 Emergência Fı́sica do Spin 269 Negligenciando o acoplamento diamagnético obtemos o espectro (6.5.39) E(N,m) = EN − µB Bm . (9.2.9) Esta descrição teórica é verificada experimentalmente em certos casos - efeito Zeeman normal - mas não noutros - efeito Zeeman anómalo. A anomalia mais importante aparece para átomos com Z ı́mpar, que inclui o hidrogénio: os seus nı́veis de energia dividem-se num número par de sub-nı́veis, enquanto que a teoria prevê um número ı́mpar igual a 2ℓ+1 para o nı́vel com número quântico ℓ, que é inteiro. A teoria de Pauli irá substituir ℓ por j que pode tomar valores semi-inteiros, resolvendo este problema. A experiência de Stern Gerlach (1922) A experiência consiste em estudar a deflexão de um feixe de átomos de prata 47 Ag (que são paramagnéticos e neutros) num campo magnético fortemente não uniforme. O aparato ~ tem as seguintes experimental está representado na figura 9.1. O campo magnético B caracterı́sticas: • Tem um plano de simetria yOz; • Não depende de y (negligenciamos efeitos de bordo); • Não tem componente segundo y; • A sua maior componente é segundo z. Examinemos o cálculo clássico da deflexão. Sendo neutros, os átomos de prata não estão sujeitos à força de Lorentz; a interacção entre os átomos e o campo resulta apenas do acoplamento dipolar ~ ; H = −~µ · B ~ , logo F~ = ∇(~µ · B) (9.2.10) ~ fosse constante. Concluimos que é a força sentida pelos átomos, que seria zero caso B a força depende do momento magnético; mas o momento magnético tem uma dinâmica própria devido a um torque exercido pelo campo magnético externo da forma ~ ; ~τ = ~µ × B (9.2.11) 270 Teoria Geral do Momento Angular e Spin Figura 9.1: a) Átomos de prata estão contidos na fornalha E, que é aquecida a altas temperaturas. Os átomos podem ser emitidos da fornalha através de uma pequena abertura. Uma outra pequena abertura F colima o feixe de átomos, escolhendo aqueles cuja velocidade é paralela à direcção Oy. Os átomos são então deflectidos pelo gradiente do campo magnético criado por A e condensam no ponto N do alvo P ; b) Perfil das linhas de força do campo magnético (extraı́do de Cohen et al,‘Quantum Mechanics’ ). assumindo que este momento magnético resulta de um momento angular, ~µ = gµB ~ S, ~ (9.2.12) então a lei fundamental da mecânica de rotação diz-nos que ~ dS ~ = ~µ × B dt ⇔ ~ dS gµB ~ ~ S ×B . = dt ~ (9.2.13) Esta equação diz-nos que o dipólo precessa em torno do campo magnético. Como o campo magnético é essencialmente segundo a direcção Oz, o dipolo precessa essencialmente em torno do eixo Oz. Logo a média temporal das componentes µx e µy será aproximadamente zero, pelo que não deverão influir na força que os átomos de prata sentem. Com esta aproximação F~ ≃ µz ∇Bz ; (9.2.14) por hipótese ∂Bz /∂y = 0 e no plano de simetria ∂Bz /∂x = 0. Logo a força é essencialmente paralela a Oz e proporcional a µz , F~ ≃ µz ∂z Bz ez . Como tal, deflexão HN é uma medida 9.2 Emergência Fı́sica do Spin 271 Figura 9.2: Resultado clássico esperado (linha tracejada) e observado (linha sólida) na experiência de Stern-Gerlach (extraı́do de Cohen et al,‘Quantum Physics’ ). de µz . O resultado esperado classicamente para a experiência anterior baseia-se na seguinte observação. Os átomos de prata deveriam ter uma distribuição de momento magnético isotrópica quando saem da fornalha. Logo todos os valores de µz entre −|~µ| e +|~µ| deveriam ser encontrados, pelo que se esperaria um padrão do tipo da linha tracejada na figura 9.2, i.e. deflexões entre N1 e N2 . Note-se que a dispersão das velocidades e a largura finita da fenda explicam a curva extender-se um pouco além de Ni . O resultado observado é, contudo, muito diferente. Observam-se 2 pontos de impacto priveligiados - linhas sólidas na figura 9.2; ou seja a medição de µz só pode originar dois resultados possı́veis. Descrevemos agora a interpretação quântica da experiência anterior. Os átomos de prata têm um electrão desemparelhado e o seu momento magnético resulta do spin desse electrão por (9.2.12). Assim, uma medição de µz é uma medição de Sz , que, de acordo com a experiência de Stern-Gerlach, só pode tomar dois valores possı́veis. Pelo estudo das representações do momento angular da secção 9.1, na representação Dj , Sz tem 2j + 1 valores possı́veis, pelo que j = 1/2. Esta será a representação escolhida para descrever o electrão na teoria de Pauli. Notas: 272 Teoria Geral do Momento Angular e Spin • Se fizéssemos a experiência com electrões, como a carga não seria zero, a força de Lorentz iria disfarçar o efeito do spin. O objectivo de usar átomos de prata é ter uma partı́cula de spin 1/2 sem carga. • As condições experimentais podem ser escolhidas de modo a que a dispersão espacial da função de onda seja suficientemente pequena para poder tratar as variáveis posição e momento classicamente. A experiência anterior pode ser teorizada com o seguinte formalismo: i) O electrão tem graus de liberdade externos ou orbitais (~r e ~p) e um grau de liberdade ~ interno (o spin S); ii) O espaço vectorial interno tem dimensão 2 e base |+i = |1/2, 1/2i , |−i = |1/2, −1/2i , (9.2.15) tal que ~ Ŝz |±i = ± |±i , 2 (9.2.16) o que equivale a dizer que, nesta base, a componente z do operador de momento angular intrı́nseco tem representação   1 0 ~  ≡ ~ σz ; Ŝz =  2 2 0 −1 a álgebra do momento angular é obedecida se escolhermos     0 1 0 −i ~ ~  ≡ ~ σx ,  ≡ ~ σy . Ŝx =  Ŝy =  2 2 2 2 1 0 i 0 (9.2.17) (9.2.18) Esta é a representação dois dimensional de su(2), (9.1.36). • Note que o ponto fundamental da experiência de Stern-Gerlach é não só a confirmação da quantificação do momento magnético do electrão (e como tal do seu spin) mas também, e sobretudo, mostrar que j = 1/2. 9.3 Postulados da teoria de Pauli 9.3 273 Postulados da teoria de Pauli Para explicar os resultados experimentais anteriores, Uhlenbeck e Goudsmit propuseram, em 1925, que o electrão tem um momento angular intrı́nseco - spin. Este spin confere-lhe um momento magnético ~µS = 2µB ~ S. ~ (9.3.1) Ou seja, a razão giromagnética do electrão é g = 2 (chamado valor quântico), que era necessária para explicar quantitativamente as deflexões observadas na experiência de SternGerlach e as separações espectrais no efeito Zeeman anómalo. Note-se que a razão giromagnética orbital é g = 1 (chamado valor clássico), metade da de spin. O valor g = 2 que aqui é imposto fenomenologicamente é extraı́do naturalmente da equação de Dirac. Pauli elaborou a proposta de Uhlenbeck e Goudsmit tornando-a um pouco mais precisa e conferindo-lhe o carácter de postulados adicionais da mecânica quântica que agora descrevemos. Em primeiro lugar notamos que o nosso estudo até ao momento incidiu sobre a quantificação de variáveis orbitais, como a posição ~r e o momento p~, às quais associamos op~ ~ eradores R̂ e P̂ que actuam num espaço de estados E~r , que é isomórfico ao espaço das funções de onda. Denominamos E~r como espaço de estados orbitais. A estas variáveis orbitais temos de adicionar as variáveis de spin que satisfazem os seguintes postulados: ~ i) O operador de spin, Ŝ é um momento angular, o que significa que [Ŝj , Ŝk ] = i~ǫjkl Ŝl ; (9.3.2) ii) Os operadores de spin actuam num novo espaço vectorial, denominado espaço de estados de spin, ES , onde Ŝ 2 e Ŝz são um C.C.O.C.; o espaço ES tem como base os estados próprios comuns a Ŝ 2 e Ŝz , {|s, mi}: Ŝ 2 |s, mi = s(s + 1)~2 |s, mi , Ŝz |s, mi = m~|s, mi , (9.3.3) onde 2s ∈ N0 e m = −s, −s + 1, . . . , s − 1, s. Uma dada partı́cula é caracterizada por um único valor de s; dizemos que a partı́cula tem spin s. Logo, ES tem sempre 274 Teoria Geral do Momento Angular e Spin dimensão finita e igual a 2s + 1; todos os estados de spin de uma dada partı́cula são vectores próprios de Ŝ 2 com o mesmo valor próprio s(s + 1)~2 ; iii) O espaço de estados completo, E, é o produto tensorial de E~r com ES : E = E~r ⊗ ES . Isto significa que todas as observáveis de spin comutam com todas as observáveis orbitais. Daqui resulta que, excepto para o caso com s = 0, é insuficiente especificar o ket de E~r para caracterizar o estado da partı́cula. É necessário também especificar o estado de spin; isto é C.C.O.C. = {observáveis orbitais, observáveis de spin} . Qualquer estado da partı́cula é uma combinação linear de vectores que são o produto tensorial de um ket de E~r com outro de ES ; iv) O electrão é uma partı́cula de spin 1/2 (s = 1/2). Logo, para o electrão ES é 2dimensional. O momento magnético intrı́nseco do electrão é dado por (9.3.1). O operador Hamiltoniano que descreve o comportamento de um electrão na presença ~ e φ é dado por de um campo electromagnético descrito pelos potenciais A Ĥ = ~ ~ (P̂ − q Â)2 q~ ~ + q φ̂ − ~σ · B̂ , 2me 2me (9.3.4) que, usando as propriedades das matrizes de Pauli, pode ser reescrito na forma Ĥ = ~ ~ [~σ · (P̂ − q Â)]2 + q φ̂ . 2me (9.3.5) Este é o Hamiltoniano de Pauli. 9.4 Descrição não relativista de partı́culas de spin 1 2 Vamos agora considerar em detalhe os graus de liberdade de spin para o caso s = 1/2. ES tem dimensão 2 e tomamos como base {|+i, |−i}, que obedece a 3 Ŝ 2 |±i = ~2 |±i , 4 ~ Ŝz |±i = ± |±i . 2 (9.4.1) 9.4 Descrição não relativista de partı́culas de spin 1 2 275 As relações de ortonormalização podem então ser escritas: h+|−i = 0 , h−|−i = 1 , h+|+i = 1 , (9.4.2) e a relação de fecho |+ih+| + |−ih−| = 1̂ . (9.4.3) O estado de spin mais geral tem a forma |χi = c+ |+i + c− |−i , c± ∈ C . (9.4.4) Todos os kets de ES são vectores próprios de Ŝ 2 com valor próprio 3~2 /4. Logo Ŝ 2 = 3~2 1̂ . 4 (9.4.5) Podemos definir os operadores em escada Ŝ± = Ŝx ± iŜy , (9.4.6) que têm acção Ŝ+ |+i = 0 , Ŝ+ |−i = ~|+i , Ŝ− |+i = ~|−i , Ŝ− |−i = 0 . (9.4.7) Todos os operadores que actuam em ES são representados na base {|+i, |−i} por matrizes de 2 × 2; os operadores de momento angular têm a representação ~ ~ Ŝ = ~σ , 2 (9.4.8) onde ~σ são as matrizes de Pauli (9.1.36). Estas matrizes têm as seguintes propriedades Trσi = 0 , det σi = −1 . (9.4.9) Juntamente com a identidade, as matrizes de Pauli formam uma base do conjunto de matrizes de 2 × 2 com entradas complexas GL(2, C). 276 9.4.1 Teoria Geral do Momento Angular e Spin Juntando os graus de liberdade de spin aos orbitais Podemos agora juntar num único formalismo os graus de liberdade de spin e orbitais. O espaço de estados tem como base os estados próprios de um C.C.O.C. de E, que é obtido pela justaposição de um C.C.O.C. de E~r com um de ES . Assim, vários C.C.O.C. possı́veis para um electrão livre são: {X̂, Ŷ , Ẑ, Ŝ 2 , Ŝz } , {P̂x , P̂y , P̂z , Ŝ 2 , Ŝz } , {Ĥ, L̂2 , L̂z , Ŝ 2 , Ŝz } . Note-se que como todos os kets em E têm o mesmo valor próprio de Ŝ 2 , este pode ser omitido do C.C.O.C.; de facto este valor caracteriza a partı́cula, independentemente do estado em que se encontra (tal como a massa em repouso ou a carga eléctrica). Consideremos o primeiro destes C.C.O.C.. A base de E é |~r, ǫi = |x, y, z, ǫi = |~ri ⊗ |ǫi , (9.4.10) onde |~ri = |x, y, zi ∈ E~r e |ǫi ∈ ES . Os rótulos tomam os valores x, y, z ∈ R e ǫ = ±1. A acção dos operadores que constituem o C.C.O.C. nestes estados é X̂|~r, ǫi = x|~r, ǫi , Ŷ |~r, ǫi = y|~r, ǫi , Ẑ|~r, ǫi = z|~r, ǫi , 3~2 ~ Ŝ |~r, ǫi = |~r, ǫi , Ŝz |~r, ǫi = ǫ |~r, ǫi . 4 2 (9.4.11) 2 A base {|~r, ǫi} é ortonormal, no sentido extenso da ortogonalidade por deltas de Dirac, h~r′, ǫ′ |~r, ǫi = δǫ′ ǫ δ(~r′ − ~r) . A relação de fecho é Z Z XZ 3 3 1̂ = d ~r|~r, ǫih~r, ǫ| = d ~r|~r, +ih~r, +| + d3~r|~r, −ih~r, −| . (9.4.12) (9.4.13) ǫ Estados na representação {|~r, ǫi} Qualquer estado |Ψi em E pode ser expandido na base {|~r, ǫi}, usando a relação de fecho XZ XZ 3 |Ψi = d ~r|~r, ǫih~r, ǫ|Ψi ≡ d3~r|~r, ǫiΨǫ (~r) . (9.4.14) ǫ ǫ 9.4 Descrição não relativista de partı́culas de spin 1 2 277 Vemos assim que para caracterizar completamente o estado de um electrão é necessário especificar duas funções espaciais: Ψ+ (~r) = h~r, +|Ψi , Ψ− (~r) = h~r, −|Ψi , (9.4.15) que podem ser escritas na forma de um spinor de dois componentes ou 2-spinor :   Ψ+ (~r)  . [Ψ](~r) =  (9.4.16) Ψ− (~r) O bra hΨ| associado ao ket |Ψi é o adjunto de (9.4.14) XZ XZ 3 hΨ| = d ~rhΨ|~r, ǫih~r, ǫ| ≡ d3~r Ψ∗ǫ h~r, ǫ| , ǫ (9.4.17) ǫ que pode ser representado na forma de um spinor que é adjunto de (9.4.16) [Ψ]† (~r) = Ψ∗+ (~r), Ψ∗− (~r) . O produto escalar hΨ|Φi é representado por Z XZ 3 hΨ|Φi = d ~rhΨ|~r, ǫih~r, ǫ|Φi = d3~r Ψ∗+ (~r)Φ+ (~r) + Ψ∗− (~r)Φ− (~r) Zǫ = d3~r[Ψ]† (~r)[Φ](~r) . Logo a condição de normalização é Z Z 3 † hΨ|Ψi = d ~r[Ψ] (~r)[Ψ](~r) = d3~r |Ψ+ (~r)|2 + |Ψ− (~r)|2 = 1 . (9.4.18) (9.4.19) (9.4.20) Um caso particular de estados de E são estados obtidos pelo produto tensorial de um estado de E~r com outro de ES , isto é |Ψi = |Φi ⊗ |χi , (9.4.21) com |Φi = Z d3~rΦ(~r)|~ri ∈ E~r , |χi = c+ |+i + c− |−i ∈ ES . Nesse caso as funções de onda orbitais e de spin separam   c+  , [Ψ](~r) = Φ(~r)  c− (9.4.22) (9.4.23) tal como as relações de normalização 2 2 1̂ = hΨ|Ψi = hΦ|Φihχ|χi = (|c+ | + |c− | ) Z d3~r|Φ(~r)|2 . (9.4.24) 278 Teoria Geral do Momento Angular e Spin Operadores na representação {|~r, ǫi} Consideremos a acção de um operador linear Â num ket |Ψi ∈ E Â|Ψi = |Ψ′i . (9.4.25) Este operador tem uma representação matricial que actua em 2-spinors Â[Ψ](~r) = [Ψ′ ](~r) , (9.4.26) onde os elementos de matriz que representam Â serão, em geral, operadores diferenciais que actuam na variável ~r. Consideremos os vários casos possı́veis: • Operadores de spin: estes actuam apenas no ı́ndice ǫ da base {|~r, ǫi}. Um exemplo é um dos operadores em escada (9.4.6): Ŝ+ =   0 1 ~  . (σx + iσy ) = ~  2 0 0 (9.4.27) • Operadores orbitais: estes deixam invariante o ı́ndice ǫ pelo que as suas matrizes associadas são proporcionais à matriz identidade. Dois exemplos são os operadores:     x 0 ∂/∂x 0  , P̂x = −i~   . X̂ =  (9.4.28) 0 x 0 ∂/∂x • Operadores mistos: os operadores mais gerais a actuar em E serão representados por matrizes de 2 × 2 cujos elementos são operadores diferencias relativamente à variável ~r. Um exemplo é um produto de um operador orbital com um operador de spin   −i~∂/∂ϕ 0 ~  ; L̂z Ŝz =  (9.4.29) 2 0 i~∂/∂ϕ mas mais geralmente teremos combinações lineares de produtos de operadores orbitais com operadores de spin; por exemplo ~ ~ Ŝ · P̂ = ~ 2 σx P̂x + σy P̂y + σz P̂z = − 2   ∂/∂z ∂/∂x − i∂/∂y i~   . 2 ∂/∂x + i∂/∂y −∂/∂z (9.4.30) 9.4 Descrição não relativista de partı́culas de spin 1 2 Notamos ainda que o elemento de matriz de um operador é dado por Z hΨ|Â|Φi = d3~r[Ψ]† (~r)Â[Φ](~r) . 279 (9.4.31) Se, alternativamente, tivéssemos considerado o C.C.O.C.={P̂x , P̂y , P̂z , Ŝ 2 , Ŝz }, terı́amos a representação {|~p, ǫi}, em que cada vector |Ψi ∈ E é o 2-spinor   Ψ̄+ (~p)  , [Ψ̄](~p) =  Ψ̄− (~p) (9.4.32) com Ψ̄+ (~p) = h~p, +|Ψi , Ψ− (~p) = h~p, −|Ψi . (9.4.33) Notando que h~r, ǫ|~p, ǫ′ i = h~r|~pihǫ|ǫ′ i = 1 ei~p·~r/~δǫǫ′ , 3/2 (2π~) (9.4.34) concluı́mos que Ψ̄+ (~p) e Ψ̄− (~p) são transformadas de Fourier de Ψ+ (~r) e Ψ− (~r), respectivamente: XZ Ψ̄ǫ (~p) = h~p, ǫ|Ψi = d3~rh~p, ǫ|~r, ǫ′ ih~r, ǫ′ |Ψi Z ǫ′ (9.4.35) 1 3 −i~ p·~ r/~ d ~re Ψǫ (~r) . = (2π~)3/2 Finalmente, notamos que os postulados do capı́tulo 4 se aplicam naturalmente neste formalismo. Por exemplo, a probabilidade d3 P(~r, +) de encontrar um electrão num volume infinitesimal d3~r em torno do ponto ~r com o spin para cima, Sz = +~/2, é d3 P(~r, +) = |h~r, +|Ψi|2d3~r = |Ψ+ (~r)|2 d3~r , (9.4.36) enquanto que a probabilidade d3 P(~r) de encontrar um electrão num volume infinitesimal d3~r em torno de ~r, qualquer que seja o spin, é d3 P(~r) = (|Ψ+ (~r)|2 + |Ψ− (~r)|2 )d3~r . (9.4.37) Operador de rotação para uma partı́cula de spin 1/2 ~ Uma partı́cula de spin 1/2 pode possuir, para além do seu momento angular intrı́nseco S, ~ O seu momento angular total será um momento angular orbital L. ~ +S ~ . J~ = L (9.4.38) 280 Teoria Geral do Momento Angular e Spin Como se comporta a função de onda de uma partı́cula de spin 1/2 sob a acção de uma rotação? O operador de rotação a actuar no espaço de estados orbitais E~r toma a forma, ~ Ru~ (α) = e−iαL·~u/~ , (9.4.39) em que a rotação é em torno de um eixo definido pelo versor ~u e de um ângulo α. Naturalmente, o operador de rotação que actua no espaço de estados E terá a forma ~ Ru~ (α) = e−iαJ ·~u/~ . (9.4.40) ~ ~ Como L̂ só actua em E~r e Ŝ só actua em ES , podemos escrever Ru~ (α) na forma de um produto tensorial (~ r) (S) Ru~ (α) = Ru~ (α) ⊗ Ru~ (α) , (9.4.41) onde ~ (~ r) ~ (S) Ru~ (α) = e−iαL·~u/~ , Ru~ (α) = e−iαS·~u/~ , (9.4.42) são os operadores de rotação que actuam em E~r e ES respectivamente. Deste modo, se a partı́cula de spin 1/2 estiver num estado que seja um produto tensorial, do tipo (9.4.21), o seu estado após a rotação será (~ r) (S) |Ψ′ i = Ru~ (α)|Ψi = [Ru~ (α)|Φi] ⊗ [Ru~ (α)|χi] . (~ r) (9.4.43) (S) Claro que Ru~ (2π) = 1̂ pois esta é uma rotação orbital; mas por (9.1.47), Ru~ (2π) = −1̂; logo (~ r) (S) Ru~ (2π) = Ru~ (2π) ⊗ Ru~ (2π) = −1̂ . (9.4.44) Esta é uma famosa propriedade de uma partı́cula de spin 1/2: uma tal partı́cula necessita de dar duas voltas para voltar ao mesmo estado, i.e ser descrita pelo mesmo spinor; de facto (~ r) (S) Ru~ (4π) = Ru~ (4π) ⊗ Ru~ (4π) = 1̂ . (9.4.45) A periodicidade de 4π dos fermiões de spin 1/2 foi observada directamente em experiências de interferência com neutrões lentos (S.A.Warner et al, Phys. Rev. Lett. 35 (1975) 1053.) 9.4 Descrição não relativista de partı́culas de spin 1 2 281 Note-se, no entanto, que uma observável não muda de sinal pela acção de uma rotação de 2π: Â′ = Ru~ (2π)ÂRu~ (2π)† = Â . (9.4.46) O comportamento global de uma partı́cula de spin 1/2 sob a acção de uma rotação pode ser visto do seguinte modo: o estado |Ψi é representado pelo 2-spinor [Ψ](~r) com componentes Ψǫ (~r) = h~r, ǫ|Ψi , (9.4.47) sob a acção de uma rotação |Ψ′i = R̂|Ψi, onde R̂ = R̂(~r) ⊗ R̂(S) , obtemos um novo 2-spinor, cujas componentes são Ψ′ǫ (~r) ′ = h~r, ǫ|Ψ i = h~r, ǫ|R̂|Ψi = mas XZ ǫ′ d3 r~′ h~r, ǫ|R̂|r~′ , ǫ′ ihr~′, ǫ′ |Ψi ; (S) (S) h~r, ǫ|R̂|r~′ , ǫ′ i = h~r|R̂(~r) |r~′ihǫ|R̂(S) |ǫ′ i ≡ hR−1~r|r~′ iRǫǫ′ = δ(R−1~r − r~′ )Rǫǫ′ . (9.4.48) (9.4.49) Logo Ψ′ǫ (~r) = X (S) Rǫǫ′ Ψǫ′ (R−1~r) . (9.4.50) ǫ′ Explicitamente, em notação tensorial temos      (S) (S) ′ −1 Ψ (~r) R R+− Ψ (R ~r)  +  =  ++  +  . (S) (S) Ψ′− (~r) Ψ− (R−1~r) R−+ R−− (9.4.51) Note-se a analogia com o caso de spin 1. Exemplo: Para ilustrar a fı́sica das partı́culas com spin 1/2 vamos considerar um problema de difusão um dimensional do tipo do capı́tulo 3, mas adicionando um campo magnético, tal como representado na figura 9.3. Uma partı́cula de spin 1/2, massa m, sem carga e com razão giromagnética g incide no potencial, proveniente de x = −∞. Para além ~ = B0 ez . Logo, o operador do salto de potencial existe na região II um campo magnético B Hamiltoniano para o sistema, escrito na forma (9.3.4) é P̂ 2 P̂ 2 ~ ~ + V (X̂) − µ̂ · B = + θ(x) V0 + ω Ŝz , Ĥ = 2m 2m (9.4.52) 282 Teoria Geral do Momento Angular e Spin V(x) ~ =0 B I ~ = B0 ez B II V 0 ~µ = ~ gµB S~ E 0 x Figura 9.3: Um salto de potencial com campo magnético na região II. onde ω = −gµB B0 /~ e θ(x) é a função de Heaviside, que toma valores   0, x<0 θ(x) ≡ .  1, x>0 Podemos tomar como C.C.O.C.={Ĥ, P̂y , P̂z , Ŝz } e a base de estados para o sistema, que são estados estacionários, sendo ± |Φ± E,py ,pz i = |ΦE i ⊗ |py i ⊗ |pz i ⊗ |±i . (9.4.53) A equação de Schrödinger ± Ĥ|Φ± E,py ,pz i = E|ΦE,py ,pz i , reduz-se a ! p2y + p2z P̂x2 ω~ ± |Φ± + + θ(x) V0 ± E i = E|ΦE i . 2m 2m 2 ± Projectando na representação |xi, hx|Φ± E i = ΦE (x) e assumindo py = pz = 0 obtemos ~2 d 2 ~ω ± − Φ± (9.4.54) + θ(x) V0 ± E (x) = EΦE (x) . 2m dx2 2 A inclusão do spin, tornada visı́vel pela presença do campo magnético, dá origem a um potencial efectivo diferente para cada um dos dois modos da partı́cula, isto é Vef e = V0 ± ~ω/2, para os modos |+i e |−i, respectivamente. Esta é a lição genérica a reter: o potencial efectivo pode ser diferente para feixes com polarizações diferentes. A partir daqui podemos calcular o factor de transmissão e reflexão, para cada um dos dois modos, usando os métodos do capı́tulo 3. 9.5 Adição de momento angular 9.5 283 Adição de momento angular Tendo estabelecido que uma partı́cula quântica pode ter um momento angular intrı́nseco, para além do momento angular orbital, ambos quantificados, coloca-se a questão de saber quais são os valores possı́veis para o seu momento angular total. O mesmo se pode perguntar relativamente a um sistema fı́sico constituı́do por dois sub-sistemas (por exemplo, um sistema de duas partı́culas), cada um possuindo momento angular. É esta a questão que vamos agora considerar. 7 Analisemos, por exemplo, um sistema de duas partı́culas, que se identificarão por ı́ndices 1 e 2. Designamos por J~1 e J~2 os respectivos momentos angulares e seja J~ = J~1 + J~2 , o momento angular total do sistema, com componentes (Jx , Jy , Jz ). Admitimos que se conhece, no espaço de estados do sistema i, Ei, i = 1, 2, a base padrão {|ki, Ji , Mi i} constituı́da por vectores próprios comuns a Jî2 e a Jîz : Jî2 |ki, Ji , Mi i = Ji (Ji + 1)~2 |ki , Ji , Mi i , (9.5.1) Jîz |ki, Ji , Mi i = Mi ~ |ki, Ji , Mi i , (9.5.2) Jî± |ki, Ji , Mi i = ~ p Ji (Ji + 1) − Mi (Mi ± 1) |ki, Ji , Mi ± 1i , (9.5.3) onde ki representa o conjunto de números quânticos adicionais necessários à especificação completa do estado do sistema. O espaço de estados do sistema total, E, é o produto tensorial de E1 e E2 : E = E1 ⊗ E2 . (9.5.4) Uma base neste espaço é obtida fazendo o produto tensorial das bases de E1 e de E2 : {| k1 , k2 ; J1 , J2 ; M1 , M2 i} = {| k1 , J1 , M1 i ⊗ | k2 , J2 , M2 i} , 7 Esta secção foi escrita com a colaboração da Prof. Fátima Mota. (9.5.5) 284 Teoria Geral do Momento Angular e Spin que é uma base própria comum aos operadores Jˆ12 , Jˆ22 , Jˆ1z , Jˆ2z . Um outro C.C.O.C. em E é Jˆ12 , Jˆ22 , Jˆ2 , Jˆz , (9.5.6) e podemos escolher uma base própria comum a estas observáveis: {|k, J1, J2 ; J, Mi} . (9.5.7) A questão que se põe é a de determinar esta base em termos da base conhecida (9.5.5). O problema é tanto mais relevante quando se sabe que, genericamente, num sistema de partı́culas com interacção apenas o momento angular total é uma constante de movimento, isto é, apenas o momento angular total comutará com o Hamiltoniano. Consequentemente, os estados estacionários (e a evolução do sistema) podem ser determinados se se conhecer a base (9.5.7). Mesmo num sistema de uma só partı́cula, surge genericamente um acoplamento entre o momento angular intrı́nseco e o orbital, o acoplamento spin-órbita, ˆ~ ˆ ~ˆ · S. 9.2, proporcional a L Na presença deste termo apenas J~ ≡ já discutido na secção ˆ~ ~ˆ + S L comuta com o Hamiltoniano do sistema, pelo que os estados estacionários deverão ser rotulados pelo valor próprio de Jˆ e não dos momentos angulares individuais, como será visto, para o átomo de Hidrogénio, na secção 11.1.4. Enunciamos e provamos agora o teorema de adição de dois momentos angulares. Teorema de adição de dois momentos angulares: No espaço E gerado pelos vectores |k; J1 , J2 ; M1 , M2 i (k, J1 , J2 , fixos; M1 , M2 variáveis), que tem dimensão (2J1 + 1)(2J2 + 1): • Os valores possı́veis de J são: J1 + J2 , J1 + J2 − 1, J1 + J2 − 2, . . . |J1 − J2 | . (9.5.8) • A cada valor de J correspondem 2J + 1 vectores próprios |J, Mi do momento angular total. Demonstração: 9.5 Adição de momento angular 285 A demonstração do teorema tem por base três observações: (1) O número quântico M toma valores J1 +J2 , J1 +J2 −1, J1 +J2 −2, . . . , −J1 −J2 . De facto o ket | k1 ; J1 , J2 ; M1 , M2 i é ket próprio das observáveis Jˆ1z , Jˆ2z e de Jˆz . Em particular: ˆ ˆ ˆ Jz |k; J1 , J2 ; M1 , M2 i = J1z + J2z |k; J1, J2 ; M1 , M2 i = ~ (M1 + M2 ) |k; J1, J2 ; M1 , M2 i . Logo M = M1 + M2 . Como Mi toma todos os valores entre −Ji e Ji , M toma todos os valores entre −(J1 +J2 ) e J1 +J2 , o que demonstra a afirmação. Sem perda de generalidade, no desenvolvimento que se segue, considerar-se-á J1 ≥ J2 . (2) A degenerescência dos valores de M, g(M), é:   0, |M| > J1 + J2 ,     g(M) = g(−M) J1 + J2 + 1 − |M| , J1 + J2 ≥ |M| ≥ |J1 − J2 | ,      2J2 + 1 , |J1 − J2 | ≥ |M| ≥ 0 . Para deteminar g(M) pode proceder-se como se segue. Num diagrama bidimensional, associa-se a cada ket |k; J1 , J2 ; M1 , M2 i um ponto cuja abcissa é M1 e cuja ordenada é M2 . Na figura 9.4 mostra-se o caso especı́fico de J1 = 2 e J2 = 1. Sendo M = M1 + M2 todos os pontos do diagrama que estão sobre rectas de declive -1 têm o mesmo M. O número desses pontos é g(M). Analisem-se os diferentes valores de M: • M = J1 + J2 = 3 é não degenerado. Portanto g(J1 + J2 ) = 1 . (9.5.9) • M = J1 + J2 − 1 = 2 é duplamente degenerado. Portanto: g(J1 + J2 − 1) = 2 . (9.5.10) • O grau de degenerescência cresce então de 1 cada vez que M decresce de 1, até se atingir o vértice inferior direito do diagrama (M1 = J1 , M2 = −J2 ), isto é M = J1 −J2 . A degenerescência de M é máxima para este ponto e vale: g(J1 − J2 ) = 2J2 + 1 . (9.5.11) 286 Teoria Geral do Momento Angular e Spin m2 (-2,1) (-1,1) (-2,0) (-1,0) (0,1) (0,0) (1,1) (2,1) (1,0) (2,0) m1 (-2,-1) (-1,-1) (0,-1) (1,-1) (2,-1) Figura 9.4: Análise da degenerescência da componente azimutal do momento angular total. • Para valores de M < J1 − J2 a degenerescência de M mantém-se constante e igual ao seu valor máximo até que a linha atravessa o vértice superior esquerdo do diagrama (M1 = −J1 , M2 = J2 ), isto é M = −J1 + J2 : g(M) = 2J2 + 1 , para − (J1 − J2 ) ≤ M ≤ J1 − J2 . (9.5.12) • Finalmente para valores de M inferiores a −(J1 − J2 ), g(M) decresce de 1 cada vez que M diminui de 1, até atingir novamente o valor 1 quando M = −(J1 + J2 ) (vértice inferior esquerdo do diagrama). Ou seja: g(−M) = g(M) . (9.5.13) (3) Para J1 e J2 fixos, os valores próprios de J 2 correspondem a J = J1 + J2 , J1 + J2 − 1, J1 + J2 − 2, . . . , |J1 − J2 |, (9.5.14) e a cada um destes valores corresponde um único subespaço invariante E(J), isto é, um multipleto de valores de M.8 Designe-se por p(J) o número de multipletos associados a um dado valor J. Os valores de p(J) e de g(M) estão relacionados de uma forma simples: g(M) = p(J = |M|) + p(J = |M| + 1) + p(J = |M| + 2) + . . . . 8 (9.5.15) No presente contexto, um multipleto corresponde a um conjunto de estados que se transformam entre si numa rotação. Mais geralmente, o multipleto de estados numa determinada representação de um grupo de Lie são estados que se transformam entre si pela acção desse grupo. 9.5 Adição de momento angular 287 Invertendo (9.5.15) obtém-se: p(M) = g(M = J) − g(M = J + 1) (9.5.16) = g(M = −J) − g(M = −J − 1) (9.5.17) Usando os resultados da observação (2) obtém-se sucessivamente: • p(J) = 0 para J > J1 + J2 , pois g(M) = 0 se |M| > J1 + J2 . • Usando (9.5.9) e (9.5.10) obtém-se: p(J = J1 + J2 ) = g(M = J1 + J2 ) = 1 , p(J = J1 + J2 − 1) = g(M = J1 + J2 − 1) − g(M = J1 + J2 ) = 1 . Por iteracção obtêm-se todos os valores de p(J): p(J = J1 + J2 − 2) = 1 , . . . , p(J = J1 − J2 ) = 1 . • Finalmente: p(J) = 0 para J < J1 − J2 . Concluimos que a cada valor possı́vel de J está associado apenas um multipleto e como tal 2J + 1 vectores próprios do momento angular total. (q.e.d.) Matematicamente podemos escrever que o espaço vectorial obtido como produto tensorial (9.5.4) se decompõe na soma directa de espaços vectoriais que têm como base os vários multipletos, ou seja, na soma directa de várias representações irredutı́veis do momento angular: E(J1 ) ⊗ E(J2 ) = E(J1 + J2 ) ⊕ E(J1 + J2 − 1) ⊕ . . . ⊕ E(|J1 − J2 | + 1) ⊕ E(|J1 − J2 |) . 9.5.1 Cálculo dos vectores próprios comuns a Jˆ2 e a Jˆz Os vectores |J, Mi (rigorosamente dever-se-ia escrever |J1 , J2 , J, Mi, mas na prática usamos a primeira notação) podem-se escrever como combinações lineares dos vectores da base inicial {|J1 , J2 ; M1 , M2 i}: |J, Mi = J1 X J2 X M1 =−J1 M2 =−J2 |J1 , J2 ; M1 , M2 i hJ1 , J2 ; M1 , M2 |J, Mi . (9.5.18) 288 Teoria Geral do Momento Angular e Spin Os coeficientes hJ1 , J2 ; M1 , M2 |J, Mi desta expansão são os coeficientes de Clebsch-Gordan. Não é possı́vel dar uma expressão geral destes coeficientes, mas eles podem ser determinados seguindo o método que a seguir se desenvolve para o caso particular de momentos angulares 1/2 e atendendo a uma série de convenções de fase (por exemplo, os coeficientes de ClebschGordan são reais). O caso particular de dois spins 1/2 Como exemplo consideremos um sistema de duas partı́culas de spin 1/2. De acordo com os resultados anteriores, o momento angular total do sistema será S = 1 ou S = 0. E(S1 = 1/2) ⊗ E(S2 = 1/2) = E(S = 1) ⊕ E(S = 0) (9.5.19) Teremos portanto dois multipletos: um estado tripleto (dado existirem três valores de M para S = 1) e um estado singleto (um único M para S = 0). ⋆ O estado tripleto (subespaço E(S = 1)): Este subespaço, tridimensional, é gerado pela base própria {|1, 1i, |1, 0i, |1, −1i}. É imediato escrever-se, após uma escolha de fase: |1, 1i = |+, +i . (9.5.20) Os outros estados do tripleto são obtidos por aplicação do operador de escada Ŝ− : |1, 0i = 1 √ Ŝ− |1, 1i ~ 2 (9.5.21) = 1 √ (Ŝ1− + Ŝ2− ) |1, 1i ~ 2 (9.5.22) = 1 √ [|+, −i + | −, +i] , 2 (9.5.23) e ainda, |1, −1i = = 1 √ Ŝ− |1, 0i ~ 2 |−, −i . (9.5.24) (9.5.25) 9.5 Adição de momento angular 289 ⋆ O estado singleto (subespaço E(S = 0)): O único vector |0, 0i deste subespaço é determinado, a menos de um factor constante de fase, usando-se a condição de ortogonalidade relativamente aos outros vectores |1, Mi, já determinados. |0, 0i é necessariamente uma combinação linear dos vectores |+, −i e |−, +i: |0, 0i = α|+, −i + β|−, +i . (9.5.26) A condição de normalização implica que: h0, 0|0, 0i = |α|2 + |β|2 = 1 . (9.5.27) A condição de ortogonalidade a |1, 0i (|0, 0i é obviamente ortogonal a |1, 1i e a |1, −1i) implica que: 1 h0, 0|1, 0i = √ (α + β) = 0 . 2 De (9.5.26) e de (9.5.27) conclui-se que: 1 α = −β = √ eiχ , 2 (9.5.28) (9.5.29) onde χ é um número real. Escolhendo χ = 09 donde: 1 |0, 0i = √ [|+, −i − |−, +i] . 2 (9.5.30) Caso geral de dois momentos angulares De acordo com o teorema de adição do dois momentos angulares: E(J1 )⊗E(J2 ) = E(J = J1 +J2 ) ⊕ E(J = J1 +J2 −1) ⊕ . . . ⊕ E(J = |J1 −J2 |) . (9.5.31) Para determinar os vectores |J, Mi que geram os diferentes subespaços segue-se o método exposto no parágrafo anterior. Em especı́fico: i) Considera-se o subespaço de maior multiplicidade, isto é, o maior multipleto, que corresponde a J = J1 + J2 . Aqui o vector |J, Ji é facilmente reconhecido: |J = J1 + J2 , M = J1 + J2 i = |J1 , J2 ; M1 = J1 , M2 = J2 i 9 (9.5.32) Por convenção hJ1 , J2 ; J1 , J − J1 |J, Ji são reais e positivos, hJ1 , J2 ; M1 , J − M1 |J, Ji são reais e o seu sinal é (−1)J1 −M1 . 290 Teoria Geral do Momento Angular e Spin Os outros vectores deste subespaço são determinados por aplicação dos operadores de escada. ii) Os vectores de base dos outros subespaços são determinados escrevendo as combinações lineares de vectores |J1 , J2 ; M1 , M2 i adequadas e usando as condições de ortogonalidade, as condições de normalização e as convenções de fase. Propriedades dos coeficientes de Clebsch-Gordan Como se referiu, a determinação dos coeficientes de Clebsch-Gordan obedece a determinadas convenções. Existem tabelas destes coeficientes. Importa no entanto referir algumas propriedades interessantes destes coeficientes. Em particular: (i) Regras de selecção: De acordo com o que se referiu no ponto (2) da demonstração do teorema de adição de momento angular, os coeficientes de Clebsch-Gordon são nulos se não se verificarem simultaneamente as duas condições: |J1 − J2 | ≤ J ≤ J1 + J2 , M = M1 + M2 . A desigualdade é conhecida como a desigualdade triangular já que tem implı́cito que um triângulo pode ser construı́do com lados de comprimentos J1 , J2 e J. Estes três números desempenham papeis idênticos; a desigualdade pode ser reescrita sob as formas equivalentes: |J − J1 | ≤ J2 ≤ J + J1 , ou |J − J2 | ≤ J1 ≤ J + J2 . (ii) Relações de ortogonalidade: X hJ1 , J2 ; M1 , M2 |J, Mi hJ1 , J2 ; M1 , M2 |J ′ , M ′ i = δJJ ′ δM M ′ , M1 ,M2 X J,M ′ ′ (9.5.33) hJ1 , J2 ; M1 , M2 |J, Mi hJ1 , J2 ; M1 , M2 |J, Mi = δM1 M ′ δM2 M ′ . 1 2 (iii) Relações de recorrência: p J(J + 1) − M (M + 1)hJ1 , J2 ; M1 , M2 |J, M + 1i = p J1 (J1 + 1) − M1 (M1 − 1)hJ1 , J2 ; M1 − 1, M2 |J, M i p + J2 (J2 + 1) − M2 (M2 − 1)hJ1 , J2 ; M1 , M2 − 1|J, M i , (9.5.34) 9.6 Sumário p 9.6 J(J + 1) − M (M − 1)hJ1 , J2 ; M1 , M2 |J, M − 1i = p J1 (J1 + 1) − M1 (M1 + 1)hJ1 , J2 ; M1 + 1, M2 |J, M i p + J2 (J2 + 1) − M2 (M2 + 1)hJ1 , J2 ; M1 , M2 + 1|J, M i . 291 (9.5.35) Sumário Neste capı́tulo começamos por discutir as representações da álgebra do momento angular, descobrindo que existem em maior número do que as que correspondem ao momento angular orbital. As representações extra correspondem a spin semi-inteiro. Vimos seguidamente que estas representações são necessárias para descrever certos resultados experimentais, como a estrutura fina, o efeito Zeeman anómalo e a experiência de Stern-Gerlach. Em particular, estas experiências requerem que se descreva o electrão como uma partı́cula de spin 1/2. Dada esta necessidade, Pauli introduziu certos postulados adicionais na mecânica quântica não relativista, para descrever o spin das partı́culas, que enunciamos. Estudamos em detalhe o formalismo quântico para o caso das partı́culas de spin 1/2, como o electrão, em que o espaço de estados de spin tem dimensão 2. Consideramos o teorema de adição do momento angular e descobrimos quais os valores possı́veis para o momento angular total de um sistema com vários momentos angulares individuais. Na transformação entre a base do momento angular total e dos momentos angulares individuais aparecem os coeficientes de Clebsch-Gordan, que estudamos em detalhe no caso de um sistema de duas partı́culas de spin 1/2. CAPÍTULO 10 Teoria da Difusão Nos capı́tulos anteriores estabelecemos métodos que nos permitem calcular a função de onda dado o potencial. O conhecimento da função de onda permite-nos então calcular quantidades fı́sicas, como o espectro de estados ligados ou o factor de transmissão. Estas são quantidades relacionáveis com a experimentação. Portanto, tendo um modelo teórico do potencial fazemos previsões que podem ser comparadas com a experiência. Muitas vezes, em fı́sica, o problema em mão é o inverso do descrito anteriormente. Temos resultados experimentais e pretendemos obter um modelo teórico. Por exemplo, um tipo de experiências frequente em fı́sica, especialmente em fı́sica das altas energias, consiste em fazer incidir um feixe de partı́culas - que denominamos por ′′ (1)′′ - num alvo composto por outras partı́culas - que denominamos por ′′ (2)′′ - e estudar a colisão resultante. Genericamente mede-se o estado final do sistema após a colisão, isto é, o tipo de partı́culas resultantes e as suas caracterı́sticas, como direcção de emissão, energia, etc. Mas o objectivo fundamental do estudo é determinar as interacções que ocorreram entre as várias partı́culas que entraram no processo de colisão. Os fenómenos observados na colisão, ditos reacções variam em complexidade: • Nos casos mais simples o estado inicial e final do sistema são compostos pelas mesmas 294 Teoria da Difusão partı́culas (1) e (2): (1) + (2) −→ (1) + (2) . Estas reacções são denominadas reacções de difusão, (“scattering” em inglês). • Em casos mais gerais não é assim. As partı́culas (1) e (2) podem ser compostas por outras mais elementares (como núcleos são compostos por nucleões e nucleões por quarks), que se podem redistribuir durante a colisão, originando novas partı́culas compostas, diferentes das partı́culas iniciais: (1) + (2) −→ (3) + (4) + (5) + . . . . Estas reacções são denominadas reacções com rearranjo. • Notemos ainda que a altas energias existe a possibilidade relativista de “materialização” de parte da energia, originando novas partı́culas no estado final. No nosso estudo vamo-nos restringir à difusão. Na maior parte deste capı́tulo vamos considerar ainda que esta difusão é elástica, isto é, que para além de as partı́culas iniciais e finais serem as mesmas, os seus estados internos não se modificam durante a colisão. Isto significa, em particular, que não há emissão ou absorção de energia por estes estados internos. Na secção 10.4 será considerada a difusão inelástica. Se o nosso problema de colisão caisse no âmbito da mecânica clássica, o nosso objectivo seria determinar os desvios das trajectórias das partı́culas incidentes (1) devido à força exercida pelas partı́culas alvo (2). Mas o problema em que estamos interessados ocorre à escala atómica ou nuclear, caindo no âmbito da mecânica quântica. Assim devemos estudar a evolução da função de onda associada às partı́culas incidentes (1) devida à influência das interacções com as partı́culas alvo (2). A função de onda irá ‘difundir-se’, justificando o nome do processo. No nosso estudo iremos usar algumas hipóteses simplificativas: • Consideraremos que as partı́culas (1) e (2) não têm spin. Esta hipótese tem como objectivo simplificar a teoria e não deve ser interpretada como implicando que o spin 295 não tem importância em fenómenos de difusão. Pelo contrário, se no Hamiltoniano houver termos dependentes de spin, diferentes estados de spin difundir-se-ão diferentemente; no final será necessário pesar a contribuição dos diferentes estados de spin. Este estudo será considerado em detalhe no capı́tulo 12, onde estudaremos partı́culas idênticas e consideraremos problemas de difusão com spin. • Não levaremos em consideração uma possı́vel estrutura interna das partı́culas (1) e (2). O formalismo que iremos desenvolver até à secção 10.4 não será portanto aplicável a fenómenos de difusão inelástica onde parte da energia cinética de (1) é absorvida, no estado final pelos graus de liberdade internos de (1) e (2); será apenas para difusão elástica. Na secção 10.4 consideraremos brevemente difusão inelástica. • Assumiremos que o alvo é suficientemente fino para nos permitir negligenciar processos de difusão múltiplos, em que uma partı́cula incidente é difundida várias vezes antes de abandonar o alvo. • Negligenciaremos qualquer possibilidade de coerência entre as ondas difundidas pelas diferentes partı́culas que constituem o alvo. Esta simplificação é justificada quando a dispersão dos pacotes de ondas associados às partı́culas incidentes (1) é pequena comparada com as distâncias tı́picas das partı́culas do alvo. Ou seja, concentrarnos-emos em processos elementares de difusão de uma partı́cula incidente (1), por uma partı́cula do alvo (2). Negligenciando estes efeitos de coerência, o fluxo de partı́culas detectadas é simplesmente a soma dos fluxos difundidos por cada uma das N partı́culas do alvo, isto é, N vezes o fluxo difundido por cada uma das partı́culas do alvo. Note-se que esta aproximação exclui fenómenos interessantes, como difusão coerente de um cristal - difracção de Bragg. • Assumiremos que a interacção entre as partı́culas (1) e (2) pode ser descrita por uma energia potencial V (~r1 − ~r2 ) que depende apenas da posição relativa ~r = ~r1 − ~r2 das partı́culas. Utilizando o referencial do centro de massa, o problema reduz-se ao estudo da difusão de uma partı́cula devido ao potencial V (~r). Esta partı́cula tem 296 Teoria da Difusão massa µ, que é a massa reduzida 1 1 1 + , = µ m1 m2 (10.0.1) onde m1 e m2 são as massas de (1) e de (2). 10.1 Formalismo para descrever processos de difusão 10.1.1 Definição da secção eficaz de difusão Seja Oz a direcção das partı́culas incidentes, de massa µ. O potencial V (~r) está localizado à volta da origem, O - figura 10.1. Seja Fi o fluxo de partı́culas no feixe incidente, isto é, o número de partı́culas que, por unidade de tempo, atravessam uma superfı́cie de área unitária perpendicular a Oz na região com z → −∞. Assumimos que este fluxo é suficientemente pequeno para negligenciar as interacções entre as partı́culas do feixe. Um detector é colocado longe da região onde o potencial é efectivo, numa direcção definida pelos ângulos polar θ e azimutal φ, com a abertura voltada para o centro de difusão O e compreendendo um ângulo sólido dΩ. Podemos assim contar o número de partı́culas dn, difundidas por unidade de tempo para dentro do ângulo sólido dΩ, em torno da direcção definida por (θ, φ). É de esperar que dn seja proporcional a dΩ e também a Fi ; logo1 dn = σ(θ, φ)FidΩ , (10.1.1) onde o coeficiente de proporcionalidade σ(θ, φ) é denominado secção eficaz diferencial de difusão na direcção (θ, φ). Dimensionalmente, a equação anterior é 1 1 = [σ(θ, φ)] T T L2 ⇔ [σ(θ, φ)] = L2 . (10.1.2) Ou seja, a secção eficaz diferencial de difusão tem as dimensões de uma área. Frequentemente, σ(θ, φ) é medida em termos de ‘barns’ 2 1 Note que por vezes são usadas diferentes notações na literatura; o número de partı́culas difundidas por unidade de tempo para dentro do ângulo sólido dΩ é por vezes denotado dn/dt e a secção eficaz diferencial de difusão na direcção (θ, φ) por dσ(θ, φ)/dΩ. 2 O termo “barn” como unidade de área para secções eficazes surge durante o esforço de guerra norteamericano para o desenvolvimento da bomba atómica, durante trabalho feito na Universidade de Purdue 10.1 Formalismo para descrever processos de difusão 297 Detector dΩ feixe incidente θ V(r) O z Fluxo Fi Zona onde o potencial difunde Figura 10.1: Representação dos vários elementos que entram num processo de difusão. e seus sub-múltiplos, onde 1 barn ≡ 10−24 cm2 . De um modo natural define-se a secção eficaz total de difusão σ, como σ≡ Z σ(θ, φ)dΩ . (10.1.3) num projecto precursor do projecto Manhattan - o famoso projecto em Los Alamos onde seriam construidas as primeiras bombas. Como reportado na edição de Julho de 1972 da “Physics Today”, por altura de Dezembro de 1942 os fı́sicos Marshall Holloway e Charles P. Baker da Universidade de Cornell, durante um jantar, atiravam ideias para denominar a unidade para a secção eficaz nuclear tı́pica. Na sequência de uma associação de ideias bem humurada sugeriram o “barn”. Nas suas palavras: “The tradition of naming a unit after some great man closely associated with the field ran into difficulties since no such person could be brought to mind. Failing in this, the names Oppenheimer and Bethe were tried, since these men had suggested and made possible the work on the problem with which the Purdue project was concerned. The ”Oppenheimer” was discarded because of its length, although in retrospect an ”Oppy” or ”Oppie” would seem to be short enough. The ”Bethe” was thought to lend itself to confusion because of the widespread use of the Greek letter. Since John Manley was directing the work at Purdue, his name was tried, but the ”Manley” was thought to be too long. The ”John” was considered, but was discarded because of the use of the term for purposes other than as the name of a person. The rural background of one of the authors then led to the bridging of the gap between the ”John” and the ”barn”. This immediately seemed good and further it was pointed out that a cross section of 10-24 cm2 for nuclear processes was really as big as a barn. Such was the birth of the ”barn”.” Claro que a necessidade de uma nova unidade foi forçada aos fı́sicos nucleares pela necessidade de comunicar telefonicamente com outros sobre tópicos altamente secretos. O nome “pegou” e a unidade “barn” foi adoptada em Los Alamos, tornando-se o seu significado secreto. Os dois autores da proposta descreveram a sua sugestão num relatório de 13 de Setembro de 1944 e daqui resultou o relatório de Los Alamos ”Origin of the Term ‘barn’”(LAMS523) de 5 de Março de 1947. O significado foi “desclassificado” em 4 de Agosto de 1948. 298 Teoria da Difusão Note-se que, na definição de σ(θ, φ), dn contabiliza apenas as partı́culas difundidas. O fluxo destas partı́culas que atingem o detector é inversamente proporcional ao quadrado da distância entre O e o detector. Se se colocar o detector em θ = 0, misturar-se-ão a estas as partı́culas transmitidas, que terão a mesma forma das do feixe incidente, pelo que σ(0, φ) não é obtido directamente, mas por extrapolação de σ(θ, φ) para θ pequeno. 10.1.2 Estados estacionários de difusão Para descrevermos, em Mecânica Quântica, a difusão de uma partı́cula incidente devido a um potencial V (~r) é necessário estudar a evolução temporal do pacote de ondas que descreve a partı́cula. Assumimos conhecer o pacote de ondas para t → −∞ quando a partı́cula está na região negativa do eixo Oz, inafectada pelo potencial V (~r). A evolução subsequente do pacote de ondas é trivialmente estabelecida se expressarmos o pacote de ondas como uma sobreposição de estados estacionários do Hamiltoniano do problema H= p~2 + V (~r) . 2µ (10.1.4) Por isso, e tal como no capı́tulo 3, em vez de estudarmos pacotes de ondas, vamos concentrar-nos nos próprios estados estacionários. A equação de Schrödinger independente do tempo para o Hamiltoniano anterior é: 2 ~ (10.1.5) − ∆ + V (~r) Φ(~r) = EΦ(~r) . 2µ Consideremos apenas energias positivas, E, iguais à energia cinética da partı́cula incidente antes de entrar na zona de influência do potencial E= ~2 k 2 , 2µ (10.1.6) onde k é o módulo do vector de onda ~k que descreve a partı́cula quando é livre. Definindo V (~r) ≡ ~2 U(~r) , 2µ (10.1.7) reescrevemos a equação de Schrödinger como [∆ + k 2 − U(~r)]Φ(~r) = 0 . (10.1.8) 10.1 Formalismo para descrever processos de difusão 299 Para cada energia, isto é, para cada k, existe um número infinito de soluções desta equação, dependendo das condições fronteira; o espectro de energias é infinitamente degenerado. Mas tal como nos problemas de potenciais constantes por pedaços do capı́tulo 3 impusemos restrições de carácter fı́sico às soluções (como normalizabilidade da função de onda que excluia funções com crescimento assimptótico exponencial, ou a existência de apenas uma onda transmitida no lado oposto ao da onda incidente), também aqui impomos restrições fı́sicas às soluções que descrevem um processo de difusão. As funções de onda que obedecem a essas condições, denotadas vkdif (~r), representam os estados estacionários de difusão. Devem ter as seguintes duas propriedades: 1) Para valores grandes negativos de t, a partı́cula incidente é livre pois o potencial é negligenciável. Logo a função de onda que descreve o estado estacionário de difusão deve conter um termo da forma eikz , que descreve a onda incidente vkinc (~r) ∼ eikz . (10.1.9) 2) Quando o pacote de ondas atinge a zona onde o potencial é efectivo, a sua estrutura pode ser drasticamente alterada. Mas para valores grandes e positivos de t esperamos que os estados estacionários sejam compostos por uma onda difundida. Para r → ∞, U(~r) → 0 e como tal a onda difundida obedece a (∆ + k 2 )vkdif ≃ 0 . (10.1.10) Se esta onda fosse isotrópica, isto é se tivesse apenas dependência radial, esta equação ficaria, em coordenadas esféricas, 1 d 2d 2 r + k vkdif (r) = 0 , r 2 dr dr (10.1.11) que se verifica facilmente ter soluções do tipo e±ikr . r (10.1.12) 300 Teoria da Difusão Escolhendo o sinal positivo, de modo a representar uma onda que se propague para fora, e considerando a possibilidade de anisotropia, tomamos a função de onda associada ao estado estacionário de difusão, para ~r → ∞, como tendo a forma ~ r →∞ vkdif (~r) −→ eikz + fk (θ, φ) eikr . r (10.1.13) É na função fk (θ, φ), denominada amplitude de difusão, que surge toda a dependência desta solução assimptótica no potencial. Por exemplo, se V = 0, fk (θ, φ) = 0. Pode-se demonstrar que a equação (10.1.8) tem uma única solução que obedece a (10.1.13). Concluimos esta secção com duas notas: • A equação (10.1.10) é singular em r = 0; assim, a solução (10.1.12) só tem que verificar a equação para r 6= 0. Veremos na secção 10.2.1 que, mais correctamente, (∆ + k 2 ) e±ikr ∝ δ(~r) . r (10.1.14) • O pacote de ondas que representa o estado da partı́cula pode ser expandido em termos dos estados estacionários do Hamiltoniano (que não são ondas planas); a sua função de onda terá a forma Ψ(t, ~r) = Z 0 10.1.3 +∞ dk g(k)vkdif (~r)e−iEk t/~ , Ek = ~2 k 2 . 2µ (10.1.15) Relação entre amplitude e secção eficaz de difusão Como já discutimos anteriormente, num problema fı́sico, uma partı́cula quântica será descrita por um pacote de ondas. Para calcular a secção eficaz de difusão deverı́amos considerar a difusão desse pacote de ondas incidente pelo potencial V (~r). Mas, mais uma vez devido à linearidade da equação de Schrödinger, podemos tratar apenas estados estacionários de difusão. Podemos pensar nesses estados como descrevendo uma corrente estacionária de um fluido de probabilidade e calculamos então a secção eficaz da corrente incidente e difundida. O método é análogo ao usado na barreira quadrada do capı́tulo 3, onde a razão entre a corrente transmitida (ou reflectida) e a corrente incidente dá-nos o coeficiente de 10.1 Formalismo para descrever processos de difusão 301 transmissão (ou reflexão). Assim iremos calcular as contribuições da onda incidente e da onda difundida de um estado estacionário de difusão para a corrente de probabilidade. Recordemos que o vector densidade de corrente de probabilidade (4.4.53), se pode escrever, para um estado estacionário 1 ~ i~ ∗ ∗ ∗ ~ r) = [Φ(~r)∇Φ(~r) − Φ(~r) ∇Φ(~r)] = Re Φ (~r) ∇Φ(~r) . J(~ 2µ µ i (10.1.16) Calculemos o vector densidade de corrente de probabilidade para: • Onda incidente/transmitida eikz . Neste caso só existe componente segundo z 1 k~ i −ikz ~ ikz Jz (~r) = Re e = ike , (10.1.17) µ i µ que não é mais do que a intensidade da função de onda incidente Ii , (3.2.18). • Onda difundida fk (θ, φ)eikr /r. Notamos primeiro que em coordenadas esféricas 1 ∂ ∂ 1 ∂ ; (10.1.18) , , ∇≡ ∂r r ∂θ r sin θ ∂φ logo, as componentes em coordenadas esféricas do vector densidade de corrente de probabilidade são: −ikr 1 1 ~k |fk (θ, φ)|2 ik ikr ~ d ∗e Jr = Re fk − 2+ e fk = , µ r i r r µ r2 Jθd −ikr ~ 1 ~ ikr ∂ ∗e ∗ ∂ fk = 3 Re −ifk fk , = Re fk 3 e µ r i ∂θ µr ∂θ ~ ∂ Jφd = 3 Re −ifk∗ fk . µr sin θ ∂φ (10.1.19) (10.1.20) (10.1.21) Concluimos que, assimptoticamente, Jθ e Jφ são negligenciáveis e a corrente difundida é essencialmente radial. Para relacionarmos σ(θ, φ) com fk (θ, φ) recordemos a definição de secção diferencial de difusão (10.1.1). Quer o fluxo incidente de partı́culas quer o fluxo difundido serão proporcionais às respectivas densidades de corrente de probabilidade com a mesma constante de 302 Teoria da Difusão proporcionalidade.3 Logo, obtemos para o fluxo incidente Fi = C|J i | = C ~k . µ (10.1.22) O número de partı́culas que atinge a abertura do detector por unidade de tempo é proporcional ao fluxo do vector densidade de corrente de probabilidade difundido através da ~ da abertura do detector: superfı́cie dS ~ dn = C J~d · dS assimptoticamente ≃ C(J d )r r 2 dΩ = C ~k |fk (θ, φ)|2dΩ . µ (10.1.23) Logo, (10.1.1) diz-nos que σ(θ, φ) = |fk (θ, φ)|2 . (10.1.24) Ou seja, a secção eficaz diferencial de difusão é o quadrado do módulo da amplitude de difusão, o que justifica o nome da última quantidade. Notemos que no cálculo da corrente probabilidade difundida negligenciamos a interferência entre eikz (corrente incidente) e fk (θ, φ)eikr /r (corrente difundida). Na realidade esta interferência só é importante perto de θ = 0, onde de qualquer modo extrapolamos o resultado para a secção eficaz diferencial a partir dos valores para θ pequeno, como comentamos anteriormente. 10.2 Equação integral de difusão e o método de Born Para demonstrar a existência de estados estacionários cujo comportamento assimptótico é (10.1.13) vamos estabelecer uma equação integral de difusão da qual tais estados serão soluções. Recordemos a equação (10.1.8) que reescrevemos na forma [∆ + k 2 ]Φ(~r) = U(~r)Φ(~r) . (10.2.1) Introduzimos agora a função de Green, G(~r), do operador ∆ + k 2 , definida pela equação: [∆ + k 2 ]G(~r) = δ(~r) , 3 (10.2.2) Da mesma maneira que o fluxo de partı́culas num fluido ou numa corrente eléctrica é proporcional aos respectivos vectores densidade de corrente. 10.2 Equação integral de difusão e o método de Born 303 onde δ(~r) é um delta de Dirac. Podemos tomar partido desta função para construir soluções de (10.2.1). Seja Φ0 (~r) uma solução da equação (10.2.1) com o lado direito igual a zero, isto é [∆ + k 2 ]Φ0 (~r) = 0 . (10.2.3) A função Φ(~r) = Φ0 (~r) + Z d3 r~′ G(~r − r~′ )U(r~′ )Φ(r~′ ) , (10.2.4) é então também solução de (10.2.1). Para demonstrar este facto actuamos com o operador (∆ + k 2 ) em ambos os lados da equação (10.2.4); obtemos 2 2 (∆ + k )Φ(~r) = (∆ + k )Φ0 (~r) + Z d3~r′ U(r~′ )Φ(r~′ )(∆ + k 2 )G(~r − r~′ ) , (10.2.5) onde usamos o facto de que (∆ + k 2 ) actua na variável ~r e não r~′ , e como tal pode ser colocado dentro do integral. Usando agora (10.2.2) e (10.2.3) obtemos 2 (∆ + k )Φ(~r) = Z d3 r~′ U(r~′ )Φ(r~′ )δ(~r − r~′ ) = U(~r)Φ(~r) , (10.2.6) o que demonstra que (10.2.4) é solução de (10.2.1). Reciprocamente pode-se demonstrar que qualquer solução de (10.2.1) se pode apresentar na forma (10.2.4). Isto é intuitivo se pensarmos em (10.2.1) como uma equação diferencial homogénea - lado esquerdo - com uma fonte - termo do lado direito; pensamos então em (10.2.4) como a soma da solução geral da equação homogénea, Φ0 , com uma solução particular que considera o termo de fonte. A equação integral (10.2.4) é denominada equação integral de difusão. A sua principal vantagem relativamente à equação diferencial (10.2.1) é que, escolhendo Φ0 (~r) e G(~r) apropriadamente, podemos obter, sem mais trabalho, Φ(~r) com o comportamento assimptótico desejado. Portanto a equação integral (10.2.4) torna-se equivalente à equação diferencial (10.2.1) mais a condição assimptótica (10.1.13). É exactamente esse resultado que vamos agora estabelecer. 304 10.2.1 Teoria da Difusão Escolha da função de Green e de Φ0 Comecemos por discutir as funções de Green. Com este propósito enunciamos, sem prova, o seguinte resultado 1 ∆ = −4πδ(~r) , r (10.2.7) onde ∆ é o laplaciano em três dimensões, r a coordenada esférica radial e δ(~r) o delta de Dirac em três dimensões.4 Considerando este resultado e a equação de definição da função de Green, (10.2.2), concluimos que, perto de r = 0, r→0 G(~r) ≃ − 1 . 4πr (10.2.8) Por outro lado já vimos, na secção 10.1.2, que para ~r 6= 0, (∆ + k 2 ) e±ikr =0. r (10.2.9) 1 e±ikr , 4π r (10.2.10) Logo, tomamos as funções de Green, G± (~r) = − onde G+ é denominada função de Green ‘outgoing’ e G− é denominada função de Green ‘incoming’. Equivalentemente estamos a estabelecer o resultado e±ikr = −4πδ(~r) . ∆+k r 2 4 (10.2.11) Podemos motivar este resultado (o que não constitui uma prova!) pelo seguinte raciocı́nio. Consideramos a equação de Poisson para o campo gravı́tico com uma massa pontual M , descrita por um delta de Dirac: 1 d 2 d r φ = 4πGM δ(~r) . ∆φ(~r) = 4πGM δ(~r) ⇔ r2 dr dr Integramos ambos numa esfera de raio R. Do lado esquerdo usamos coordenadas esféricas e do lado direito coordenadas cartesianas: Z R Z Z Z 2 1 d 2 d drr 2 r 4π φ = 4πGM dx dy dzδ(x)δ(y)δ(z) , r dr dr 0 logo GM d φ = GM ⇔ φ(R) = − + constante . dR R Colocando esta solução na primeira equação temos GM 1 ∆ − = −4πδ(~r) , + constante = 4πGM δ(~r) ⇔ ∆ r r R2 que é a equação (10.2.7). 10.2 Equação integral de difusão e o método de Born 305 M r r u O r’ r’ P L Figura 10.2: Representação de um ponto assimptoticamente longe da zona de influência de um potencial. O comportamento assimptótico que desejamos obter (10.1.13) sugere que escolhamos Φ0 = eikz , (10.2.12) e a função de Green ‘outgoing’, G(~r) = G+ (~r). Isto é, tomamos os estados estacionários de difusão na forma (10.2.4) com estas escolhas: Z dif ikz vk (~r) = e + d3 r~′ G+ (~r − r~′ )U(r~′ )vkdif (r~′ ) . (10.2.13) Vamos então demonstrar que estes estados estacionários têm o comportamento assimptótico correcto. Para isso consideramos um potencial cuja zona de influência, centrada em ~r = 0, tem uma escala linear L - figura 10.2. Consideramos um ponto longe desta zona de influência, M, para o qual |~r| ≫ L. Considerando o vector de posição de um outro ponto, r~′ temos que |~r − r~′ | = q q ′ ′ (~r − r~ ) · (~r − r~ ) = r 2 − 2~r · r~′ + (r ′ )2 = r s 2r~′ · ~u + 1− r ′ 2 r , (10.2.14) r onde r = |~r|, r ′ = |r~′ | e ~u é o versor na direcção de ~r, ~r = r~u. Especializemos para o caso em que r~′ é a posição de um ponto arbitrário, P , na zona de influência do potencial. Para todos estes pontos verifica-se que |r~′ | < L ≪ |~r|; logo expandimos a expressão anterior em potências de r ′ /r, obtendo |~r − r~′ | ≃ r − r~′ · ~u . (10.2.15) 306 Teoria da Difusão Nestas condições obtemos a expressão assimptótica ~′ G+ (~r − r~′ ) = − 1 eikr −ik~u·r~′ 1 eik|~r−r | ≃− e . 4π |~r − r~′ | 4π r (10.2.16) Substituindo no estado de difusão (10.2.13) obtemos o comportamento assimptótico Z eikr r→∞ ikz ~′ dif d3 r~′ e−ik~u·r U(r~′ )vkdif (r~′ ) . (10.2.17) vk (~r) ≃ e − 4πr Este é, de facto, o comportamento assimptótico (10.1.13), dado que o integral já não depende da distância r, mas apenas dos ângulos θ e φ, através de ~u. Concluimos deste modo que os estados definidos pela equação integral (10.2.13) têm o comportamento assimptótico correcto para serem estados estacionários de difusão. Mais ainda, comparando com (10.1.13) reconhecemos a amplitude de difusão como sendo Z 1 ~′ d3 r~′ e−ik~u·r U(r~′ )vkdif (r~′ ) . fk (θ, φ) = − 4π 10.2.2 (10.2.18) A aproximação de Born Vamos agora estabelecer uma solução aproximada da equação integral de difusão para os estados estacionários de difusão, e como tal para a amplitude de difusão e secção eficaz diferencial de difusão. Começamos por escrever ~ eikz = eiki ·~r , (10.2.19) onde ~ki é o vector de onda incidente. Em termos de ~ki, os estados estacionários de difusão (10.2.13) ficam: vkdif (~r) i~ki ·~ r =e + Z d3 r~′ G+ (~r − r~′ )U(r~′ )vkdif (r~′ ) . Façamos uma mudança de notação: ~r → r~′ e r~′ → r~′′ ; logo Z dif ~′ i~ki ·r~′ vk (r ) = e + d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )vkdif (r~′′ ) . (10.2.20) (10.2.21) Seguidamente inserimos (10.2.21) em (10.2.20) e obtemos Z ~ ~′ dif i~ki ·~ r vk (~r) = e + d3 r~′ G+ (~r − r~′ )U(r~′ )eiki ·r Z Z 3 ~′ ′ ′ + d r G+ (~r − r~ )U(r~ ) d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )vkdif (r~′′ ) . (10.2.22) 10.2 Equação integral de difusão e o método de Born 307 Note-se que agora conhecemos os dois primeiros termos do lado direito. Apenas desconhecemos o terceiro, pois inclui a função desconhecida vkdif . Podemos repetir novamente o procedimento, substituindo em (10.2.20) ~r → r~′′ e r~′ → r~′′′ . Substituindo a expressão resultante em (10.2.22) obtemos i~ki ·~ r Z ~ ~′ =e + d3 r~′ G+ (~r − r~′ )U(r~′ )eiki ·r Z Z ~ ~′′ 3 ~′ ′ ′ + d r G+ (~r − r~ )U(r~ ) d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )eiki ·r Z Z Z 3 ~′ 3 ~′′ ′ ′ ′ ′′ ′′ ~ ~ ~ ~ ~ + d r G+ (~r − r )U(r ) d r G+ (r − r )U(r ) d3 r~′′′ G+ (r~′′ − r~′′′ )U(r~′′′ )vkdif (r~′′′ ) . vkdif (~r) (10.2.23) Agora, os três primeiros termos do lado direito são conhecidos e apenas o quarto desconhecido. Podemos repetir o processo quantas vezes desejarmos, de modo a ficarmos com os n primeiros termos do lado direito conhecidos e apenas o termo n + 1 desconhecido. Este método, denominado expansão de Born pode ser usado para construir a função de onda dos estados estacionários de difusão, desde que o potencial seja fraco. O ponto principal desta expansão é que cada novo termo introduziu mais uma potência do potencial U(~r). O significado de o potencial ser fraco é de que este novo termo deverá ser pequeno. Sendo L a escala tı́pica do potencial, e U = 2µV /~2 a sua magnitude tı́pica, o significado quantitativo de “o potencial ser fraco” é √ U= √ 2µV 1 ≪ . ~ L (10.2.24) Isto é a escala de energia associada à magnitude do potencial é muito menor do que a escala de energia associada ao seu comprimento. Logo, se o potencial for fraco, a expansão de Born é uma expansão perturbativa; isto é, cada termo é menor do que o anterior, pelo que podemos truncar a expansão num determinado ponto e negligenciar o último termo, e como tal calcular o lado direito da equação. Se substituirmos a expansão de Born para vkdif (r~′ ) em (10.2.18), obtemos a expansão de Born para a amplitude de difusão. A aproximação de Born é truncar a expansão de Born considerando apenas os primeiros dois termos, isto é ~ ~′ vkdif (r~′ ) = eiki ·r , (10.2.25) 308 Teoria da Difusão r r r’’ r’ r’ Figura 10.3: Esquerda: Na aproximação de Born contabilizamos apenas a contribuição da onda incidente e de ondas difundidas uma vez na zona onde o potencial é efectivo. Direita: As aproximações seguintes levam em conta múltiplas difusões, que podem ser negligenciadas, caso o potencial seja fraco. pelo que (10.2.18) fica fkBorn (θ, φ) 1 =− 4π Z ~′ ~ ~′ d3 r~′ e−ik~u·r U(r~′ )eiki ·r . (10.2.26) Denotando o vector de onda difundido ~kd ≡ k~u e o vector de onda transferido ~q ≡ ~kd − ~ki , reescrevemos este resultado como Z Z 1 2µ ~′ Born 3 ~′ −i~ q ·r~′ ′ ~ fk (θ, φ) = − d re U(r ) = − d3 r~′ e−i~q·r V (r~′ ) , 2 4π 4π~ (10.2.27) onde usamos (10.1.7). Finalmente, usando (10.1.24), obtemos para a secção eficaz diferencial de difusão na aproximação de Born σkBorn (θ, φ) µ2 = 2 4 4π ~ Z 2 d3~re−i~q·~r V (~r) . (10.2.28) Concluimos, portanto, que na aproximação de Born, a secção eficaz diferencial de difusão está muito simplesmente relacionada com a transformada de Fourier do potencial. O vector de onda transferido ~q, depende do módulo de ~ki e ~kd (que é o mesmo - k) e da direcção de difusão (θ, φ). Para uma dada direcção de difusão, a secção eficaz de Born varia com k, ou seja com a energia do feixe incidente. Por outro lado, para uma dada energia σ Born varia com (θ, φ). Concluimos que estudando as variações de σ Born com θ, φ ou ainda com a energia incidente, deduzimos informação sobre o potencial V (~r). 10.2.3 Interpretação da aproximação de Born Recordemos a equação (10.2.20). Podemos pensar na função G+ (~r − r~′ ) como representando a amplitude, no ponto ~r, da onda emitida por uma fonte pontual em r~′ . Este ponto de 10.2 Equação integral de difusão e o método de Born 309 vista é corroborado pela expressão (10.2.16). Tomando a aproximação de Born (10.2.25), (10.2.20) diz-nos que a onda difundida em ~r é a soma da onda incidente com um número infinito de ondas provenientes de fontes secundárias; estas fontes secundárias existem em todos os r~′ onde U(r~′ 6= 0) - figura 10.3 esquerda. Os termos seguintes da expansão de Born levam em conta novas fontes secundárias que são elas próprias excitadas por ondas emitidas por fontes secundárias - figura 10.3 direita. Podemos assim interpretar o facto de a expansão de Born ser perturbativa, quando o potencial é fraco, como significando que podemos negligenciar a influência de fontes secundárias umas nas outras. Nota: Os processos de difusão múltipla considerados na expansão de Born nada têm a ver com os processos de difusão múltipla que dissemos ir negligenciar no princı́pio deste capı́tulo. No primeiro caso estamos a falar pela difusão múltipla da partı́cula incidente por uma partı́cula alvo; no segundo na difusão múltipla da partı́cula incidente por diferentes partı́culas do alvo. 10.2.4 A aproximação de Born para potenciais centrais No caso de o potencial difusor ser central, que inclui muitos casos de interesse fı́sico, podemos escrever uma fórmula mais usável para a amplitude de difusão e consequentemente para a secção eficaz de difusão. Esta fórmula é estabelecida usando a seguinte propriedade de transformadas de Fourier três dimensionais: Lema: Seja f (~r) uma função três dimensional com transformada de Fourier f˜(~q) = 1 (2π)3/2 Z d3~rf (~r)e−i~q·~r . (10.2.29) Se f (~r) = f (r), isto é, a função depende apenas do módulo de ~r, r, então: i) f˜ depende apenas do módulo de ~q, q; ii) f˜(q) pode ser calculada pela expressão: 2 f˜(q) = √ 2π q Z +∞ r sin qrf (r)dr . 0 (10.2.30) 310 Teoria da Difusão Demonstração: ˜ q~′ ), onde q~′ = R~q e R é uma rotação arbitrária. Logo i) Consideremos f( Z 1 ~′ ′ ˜ ~ d3~rf (~r)e−iq ·~r . f (q ) = 3/2 (2π) Aplicamos a mesma rotação à variável de integração, r~′ = R~r. Logo Z 1 ~′ ~′ ′ ˜ ~ f (q ) = d3 r~′ f (r~′)e−iq ·r . 3/2 (2π) (10.2.31) (10.2.32) Como o elemento de volume e produto escalar são invariantes por uma rotação d3~r = d3 r~′ , ~q · ~r = q~′ · r~′ , (10.2.33) e como, por hipótese, f (~r) = f (r~′ ), pois a função só depende do módulo, concluimos que f˜(~q) = f˜(q~′ ) . (10.2.34) Logo f˜ depende apenas do módulo de ~q. ii) Podemos, por isso, escolher uma direcção arbitrária de ~q, para calcular a transformada de Fourier (10.2.29). Seja ~q = qez ; (10.2.29) fica: Z 2π Z +∞ Z π 1 2 ˜ dφ r f (r) dθ sin θe−iqr cos θ dr . f (q) = (2π)3/2 0 0 0 (10.2.35) Fazendo os integrais angulares obtemos Z +∞ 2 Z +∞ r f (r) −iqr cos θ θ=π 2rf (r) 1 1 ˜ f (q) = √ e |θ=0 dr = √ sin (qr)dr . (10.2.36) iqr q 2π 0 2π 0 (q.e.d.) Como a amplitude de difusão, na aproximação de Born, é dada por uma transformada de Fourier (10.2.27), podemos para o caso de potenciais centrais V (~r) = V (r), usar este lema. Usando (10.2.29) e (10.2.30) obtemos Z 2µ +∞ Born r sin (qr)V (r)dr . fk (θ) = − 2 q~ 0 (10.2.37) 10.2 Equação integral de difusão e o método de Born 311 É esta expressão que usamos na prática. Note-se que nestes casos a amplitude de difusão fica independente do ângulo azimutal. De facto, toda a dependência angular está contida no vector de onda transferido, ~q, que entra na expressão apenas em módulo q = |~q|. Para incidência segundo o eixo Oz, o vector de onda transferido é ~r ~q = ~kd − ~ki = k − kez , r onde ez é um versor unitário na direcção z; calculamos então facilmente que θ 2z 2 2 + 1 = 2k 2 (1 − cos θ) = 4k 2 sin2 , q =k 1− r 2 (10.2.38) (10.2.39) o que demonstra que |~q| depende apenas, de facto, do ângulo polar θ. Note-se que a independência de φ resulta das simetrias do sistema. De facto tanto o feixe incidente como o potencial difusor são independentes do ângulo azimutal. Consideremos dois exemplos explı́citos de cálculo de secção eficaz diferencial de difusão usando (10.2.37). Poço de potencial esférico Como primeiro exemplo consideramos um poço de potencial esférico   −V , r < R 0 V (r) = .  0, r>R (10.2.40) Este é um potencial contı́nuo por pedaços onde é particularmente simples calcular a amplitude de difusão. Note, em primeiro lugar, que a condição de validade da aproximação de Born (10.2.24) é √ 2µV0 1 ≪ . ~ R A expressão geral (10.2.37) fica Z 2µV0 R 2µV0 Born fk (θ) = r sin (qr)dr = 3 2 (sin qR − qR cos qR) . 2 q~ q ~ 0 (10.2.41) (10.2.42) Como tal, obtemos para a secção eficaz diferencial de difusão, na aproximação de Born 2 2 4 4µ V0 R R2 Born (sin qR − qR cos qR)2 , (10.2.43) σ (θ) = 6 (qR) ~4 312 Teoria da Difusão 0.11 0.105 0.1 0.095 0.09 0 0.5 1 1.5 2 2.5 3 theta Figura 10.4: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial (10.2.40) na aproximação de Born. Estão representados três valores de qR, sendo que à medida que a energia da onda enviada diminui (e como tal também qR), a secção se torna cada vez mais constante (i.e isotrópica). onde q = 2k| sin θ/2|. Esta secção eficaz encontra-se representada graficamente na figura 10.4. Esta secção eficaz tem um limite particularmente simples se, para além da condição de validade da aproximação de Born (10.2.41) assumirmos baixas energias k≪ 1 R (⇔ qR ≪ 1) . (10.2.44) Isto é, a escala de energia das ondas difundidas é muito menor que a escala de energia definida pelo alcance do potencial. Neste caso, podemos expandir as funções trigonométricas em série de Taylor e tomar a primeira contribuição não nula. Obtemos σ Born (θ) baixa energia ≃ 4µ2 V02 R6 . 9~4 (10.2.45) A secção eficaz diferencial não tem dependência angular, nesta aproximação, de acordo com o exibido na figura 10.4. A secção eficaz total é σ Born baixa energia ≃ 16π µ2 V02 R6 . 9 ~4 (10.2.46) Iremos recuperar este resultado usando o método das ondas parciais (fórmula (10.3.97)), do qual extrairemos uma maior interpretação fı́sica. 10.2 Equação integral de difusão e o método de Born 313 Potencial de Yukawa Como segundo exemplo calculamos a secção eficaz diferencial de difusão para um potencial do tipo V (~r) = V0 e−αr , r (10.2.47) onde V0 e α são constantes reais e α > 0. O potencial será atractivo (repulsivo) se V0 < 0 (V0 > 0). A magnitude do potencial é caracterizada por |V0 |; o seu alcance por r0 = 1 ; α (10.2.48) pois, para distâncias muito maiores do que 1/α, o potencial é praticamente nulo - figura 10.5. Este potencial é designado por potencial de Yukawa, em homenagem a Hideki Yukawa (1907-1981), que o introduziu em 1935 para descrever as forças nucleares, cujo alcance é da ordem do Fermi (10−15 m). Para explicar a origem deste potencial, Yukawa introduziu uma nova partı́cula - o mesão π - cuja existência foi, de facto, descoberta em 1947 por Cecil Powell (1903-1969). Esta partı́cula, que era vista como a mediadora da força nuclear, possuı́a massa e essa era a razão do curto alcance do potencial. Por estas descobertas Yukawa ganhou o prémio Nobel da Fı́sica em 1949 e Powell em 1950. Contudo, a teoria de Yukawa foi posteriormente ultrapassada pela Cromodinâmica Quântica, como descrição da força nuclear forte. Note-se que para α = 0 o potencial (10.2.47) se torna o potencial de Coulomb, pelo que o potencial de Coulomb se pode considerar um potencial de Yukawa com alcance infinito. Se assumirmos que |V0 | é suficientemente pequeno para a aproximação de Born poder ser usada, isto é (10.2.24) p 2µ|V0| ≪α, ~ (10.2.49) e observando que o potencial é central, temos, por (10.2.37), Z Z 2µV0 +∞ (iq−α)r 2µV0 +∞ −αr Born sin (qr)e dr = − 2 e − e−(α+iq)r dr , (10.2.50) fk (θ, φ) = − 2 ~q 0 ~ q2i 0 que agora se pode integrar facilmente para obter fkBorn (θ, φ) = − 2µV0 1 . 2 2 ~ q + α2 (10.2.51) 314 Teoria da Difusão r 0 2 4 6 8 10 0 -0.2 -0.4 -0.6 -0.8 -1 Figura 10.5: Potencial de Yukawa com α = 1 versus potencial de Coulomb com a mesma magnitude. Claramente o potencial de Yukawa tem um alcance efectivamente finito, enquanto que o potencial de Coulomb tem um alcance infinito. Usando (10.2.39) para expressar q em função do ângulo θ, a secção eficaz diferencial de difusão para o potencial de Yukawa na aproximação de Born fica 2 2 −2 4µ V0 4k 2 sin2 (θ/2) Born Born 2 σ (θ) = |fk (θ, φ)| = 1+ . α 2 ~4 α2 (10.2.52) Este resultado está representado na figura 10.6. Comentários ao resultado: • Esta secção eficaz é independente do ângulo azimutal, come seria de esperar dadas as simetrias do problema: o potencial é central e o feixe é paralelo a Oz, pelo que existe simetria azimutal. • Mas a secção eficaz depende do ângulo polar. Em particular, para energia (k) fixa, é maior para θ = 0 (partı́culas que seguem em frente) do que para θ = π (partı́culas rechaçadas). • A secção eficaz diminui com o aumento de energia. • O sinal de V0 é irrelevante, na aproximação de Born. • A secção eficaz total é σ Born = Z σ Born 4µ2V02 4π . (θ)dΩ = 2 4 2 α ~ [α + 4k 2 ] (10.2.53) 10.2 Equação integral de difusão e o método de Born 315 1 0.8 0.6 0.4 0.2 0 0.5 1 1.5 2 2.5 3 theta Figura 10.6: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial (10.2.47) na aproximação de Born. Estão representados três valores de q/α, sendo que à medida que a energia da onda enviada diminui (e como tal também q/α), a secção se torna cada vez mais constante (i.e isotrópica). Já comentamos anteriormente que o potencial de Coulomb pode ser visto como o caso limite do potencial de Yukawa em que o alcance é infinito; isto é tomando α=0, 2 V0 = Z 1 Z 2 e , q2 , e = 4πǫ0 2 (10.2.54) onde q é a carga do electrão e Z1 q e Z2 q são as cargas das duas partı́culas envolvidas na interacção, (10.2.47) reduz-se ao potencial de Coulomb. Tomando estes valores em (10.2.52), obtemos a secção eficaz diferencial de difusão Born (θ) σ(Coulomb) 4µ2 Z12 Z22 e4 Z12 Z22 e4 = 4 = , ~ 16k 4 sin4 θ/2 16E 2 sin4 θ/2 (10.2.55) onde usamos (10.1.6). Esta é a famosa fórmula de Rutherford que descreve a secção eficaz para o potencial de Coulomb. É curioso que tenhamos obtido a fórmula correcta neste caso, dado que a teoria que desenvolvemos não é aplicável, à priori, ao potencial de Coulomb, devido ao alcance infinito (que implica que a condição (10.2.49) não é obedecida). O resultado encontra-se representado na figura 10.7. 316 Teoria da Difusão 250 200 150 100 50 0 0.5 1 1.5 2 2.5 3 theta Figura 10.7: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial de Coulomb na aproximação de Born. Repare-se que embora Rutherford tenha detectado que algumas partı́culas α completamente rechaçadas - i.e. com θ = π/2-, a probabilidade de isso acontecer é pequenı́ssima. 10.3 Método das ondas parciais para a difusão por um potencial central No caso particular de o potencial difusor ser um potencial central, podemos diagonalizar simultaneamente os operadores Ĥ, L̂2 e L̂z , tal como discutido na secção 6.3. Isto é, existem estados estacionários com momento angular bem definido, aos quais, no contexto da teoria da difusão, chamamos ondas parciais e denotamos por Φk,ℓ,m(~r), ou ainda, na notação de Dirac, |Φk,ℓ,m i. Os valores próprios dos operadores acima mencionados são, nestes estados: Ĥ|Φk,ℓ,m i = ~2 k 2 |Φk,ℓ,mi , 2µ L̂2 |Φk,ℓ,m i = ℓ(ℓ + 1)~2 |Φk,ℓ,m i , L̂z |Φk,ℓ,mi = m~|Φk,ℓ,mi . (10.3.1) A dependência angular destas ondas parciais é sempre dada por harmónicos esféricos Yℓm (θ, φ); o potencial V (r) só influencia a parte radial. Nesta secção iremos começar por estudar estados estacionários com momento angular bem definido para uma partı́cula livre. Denominamos estes estados por ondas esféricas livres e denotamo-los por Φ0k,ℓ,m (~r), ou ainda, na notação de Dirac, |Φ0k,ℓ,m i. Veremos 10.3 Método das ondas parciais para a difusão por um potencial central 317 que, assimptoticamente, a dependência radial destas ondas esféricas livres será dada pela sobreposição de uma onda ‘incoming’ e−ikr /r com uma onda ‘outgoing’ eikr /r, tendo as duas ondas uma diferença de fase bem definida. No caso das ondas parciais para um potencial V (r) que é assimptoticamente negligenciável, esperamos um comportamento semelhante: assimptoticamente a dependência radial deverá ainda ser dada pela sobreposição das ondas ‘incoming’ e ‘outgoing’. Mas neste caso, a diferença de fase entre as duas ondas é diferente daquela que caracteriza as ondas esféricas livres: o potencial V (r) introduz uma diferença de fase adicional ou desfasamento, δℓ . Esta quantidade é a unica diferença entre o comportamento assimptótico de Φ0k,ℓ,m(~r) e Φk,ℓ,m (~r). Logo, se soubermos: 1) Para uma dada energia, a diferença de fase adicional δℓ para todos os ℓ; 2) Expressar os estados estacionários de difusão vkdif (~r) como uma combinação linear das ondas parciais Φk,ℓ,m(~r); saberemos caracterizar o comportamento assimptótico dos estados estacionários de difusão e como tal extrair a amplitude de difusão e a secção eficaz diferencial de difusão. É esta técnica que vamos estabelecer nesta secção. 10.3.1 Ondas esféricas versus ondas planas para uma partı́cula livre Em mecânica clássica, uma partı́cula livre de massa µ tem um movimento rectilı́neo e uniforme. O seu momento ~p, energia E = p~ 2 /2µ e momento angular relativamente à ~ = ~r × ~p, são constantes do movimento (|L| ~ = |~p|b, onde origem do sistema coordenado, L b é o parâmetro de impacto). ~ ~ ~ ~ Em mecânica quântica, os operadores L̂ = R̂ × P̂ e P̂ não comutam, pelo que não podemos classificar os estados fı́sicos de uma partı́cula livre simultaneamente pelo momento angular e pelo momento linear. Portanto, em mecânica quântica, temos (pelo menos) duas opções para o C.C.O.C. que descreve uma partı́cula livre: • C.C.O.C.={P̂x , P̂y , P̂z }. Neste caso os estados próprios são ondas planas. 318 Teoria da Difusão • C.C.O.C.={Ĥ0 , L̂z , L̂2 }. Neste caso os estados próprios são ondas esféricas livres. Consideremos com mais detalhe estas duas possibilidades. Ondas planas Estes estados formam a representação |~pi estudada na secção 4.4.2. Obedecem a ~2 p~2 P̂ |~pi = |~pi . Ĥ0 |~pi = 2µ 2µ P̂i |~pi = pi |~pi , (10.3.2) Notemos ainda que a projecção das ondas planas em estados próprios do operador posição é dada por (4.4.23) h~r|~pi = 3/2 1 2π~ ei~p·~r/~ . (10.3.3) Em termos do vector de onda ~k = ~p/~, definimos os estados |~ki ≡ ~3/2 |~pi , (10.3.4) em termos dos quais as relações anteriores ficam P̂i |~ki = ~ki |~ki , ~k 2 ~2 Ĥ0 |~ki = |~ki , 2µ (10.3.5) 3/2 (10.3.6) e h~r|~ki = 1 2π ~ eik·~r . Ondas esféricas livres ~2 Pretendemos encontrar as funções próprias que diagonalizam simultaneamente Ĥ0 = P̂ /2µ, L̂2 e L̂z . De acordo com a secção 6.3, resolvemos a equação de Schrödinger independente do tempo com o ansatz 0 Φ0k,ℓ,m (~r) = Rk,ℓ (r)Yℓm (θ, φ) , e obtemos (6.3.12) com V (r) = 0, ℓ(ℓ + 1)~2 ~2 d 2 d 0 0 r + Rk,ℓ (r) = ERk,ℓ (r) . − 2µr 2 dr dr 2µr 2 (10.3.7) (10.3.8) 10.3 Método das ondas parciais para a difusão por um potencial central 319 Note-se que como o valor mı́nimo do potencial é zero (de facto é sempre zero!) não pode haver estados estacionários com E < 0; definimos então √ 2µE ~2 k 2 ⇔E= . k= ~ 2µ Esta equação pode ser reescrita como 2 d 2 2 0 2 d + 2r + k r − ℓ(ℓ + 1) Rk,ℓ (r) = 0 , r dr 2 dr (10.3.9) (10.3.10) que é conhecida como a equação de Bessel esférica 5; é uma equação que pode ser transformada numa equação de Bessel com ordem semi-inteira. As suas soluções são bem conhecidas e denominam-se por funções de Bessel esféricas. Aqui iremos construir as soluções desta equação usando um método algébrico, semelhante ao usado na construção dos harmónicos esféricos. 10.3.2 Dedução da forma explı́cita das ondas esféricas livres Comecemos por considerar, tal como na secção 6.4, soluções de (10.3.8) da forma 0 Rk,ℓ a equação (10.3.8) fica então u0k,ℓ = ; r ℓ(ℓ + 1) d2 2 − + k u0k,ℓ (r) = 0 . dr 2 r2 (10.3.11) (10.3.12) Esta equação é suplementada pela condição u0k,ℓ(r = 0) = 0 , (10.3.13) que é necessária para que as ondas esféricas livres não sejam (todas) divergentes em r = 0 (se assim fosse qualquer estado estacionário seria divergente em r = 0, o que não é o caso). Assimptoticamente, a equação (10.3.12) fica 2 d 2 ⇒ u0k,ℓ (r) ≃ Aeikr + A′ e−ikr , + k u0k,ℓ(r) ≃ 0 dr 2 5 (10.3.14) Ver, por exemplo, G.B.Arfken e H.J.Webber, Mathematical Methods for Physicists, secção 11.7, Quarta edição. 320 Teoria da Difusão e como tal Φ0k,ℓ,m (~r) ≃ Aeikr + A′ e−ikr m Yℓ (θ, φ) , r (10.3.15) ou seja, a parte radial da onda esférica livre é, assimptoticamente, a sobreposição de uma onda ‘incoming’ com uma onda ‘outgoing’. A diferença de fase destas duas ondas está contida nos coeficientes A e A′ ; mas para os determinarmos teremos de saber mais do que a solução assimptótica da equação, pois teremos de usar a condição fronteira (10.3.13). Para isso vamos calcular as soluções exactas usando um método algébrico. Começamos por definir o operador P̂+ = P̂x + iP̂y . (10.3.16) As relações de comutação deste operador com os operadores do C.C.O.C são [Ĥ0 , P̂+ ] = 0 , [L̂z , P̂+ ] = ~P̂+ , [L̂2 , P̂+ ] = 2~(P̂+ L̂z − P̂z L̂+ ) + 2~2 P̂+ . (10.3.17) Exercı́cio: Demonstre estas relações usando as relações de comutação canónicas. Usando os operadores L̂+ e P̂+ podemos construir novos estados estacionários à custa de antigos. Em primeiro lugar, recordemos a acção de L̂± nos harmónicos esféricos, dada por (6.2.35); logo L̂± |Φ0k,ℓ,mi ∝ |Φ0k,ℓ,m±1i . (10.3.18) Isto é L̂± |Φ0k,ℓ,m i é ainda um estado próprio de {Ĥ0 , L̂2 , L̂z } com valores próprios rotulados por (k, ℓ, m ± 1). Utilizando as relações de comutação (10.3.17) estabelecemos também que • P̂+ |Φ0k,ℓ,mi é ainda estado próprio de Ĥ0 , com valor próprio rotulado por k. De facto Ĥ0 P̂+ |Φ0k,ℓ,m i = P̂+ Ĥ0 |Φ0k,ℓ,mi = ~2 k 2 P̂+ |Φ0k,ℓ,mi . 2µ (10.3.19) • P̂+ |Φ0k,ℓ,mi é ainda estado próprio de L̂z , com valor próprio rotulado por m + 1. De facto L̂z P̂+ |Φ0k,ℓ,mi = (P̂+ L̂z + ~P̂+ )|Φ0k,ℓ,mi = (m + 1)~P̂+ |Φ0k,ℓ,mi . (10.3.20) 10.3 Método das ondas parciais para a difusão por um potencial central 321 • P̂+ |Φ0k,ℓ,mi não é, em geral, estado próprio de L̂2 ; mas se m = ℓ, então P̂+ |Φ0k,ℓ,ℓ i é estado próprio de L̂2 com valor próprio rotulado por ℓ + 1. De facto L̂2 P̂+ |Φ0k,ℓ,ℓ i = (P̂+ L̂2 +2~(P̂+ L̂z − P̂z L̂+ )+2~2 P̂+ )|Φ0k,ℓ,ℓ i = (ℓ+1)(ℓ+2)~2P̂+ |Φ0k,ℓ,ℓi . (10.3.21) Logo concluimos que P̂+ |Φ0k,ℓ,ℓ i ∝ |Φ0k,ℓ+1,ℓ+1i . (10.3.22) O nosso procedimento vai ser: Primeiro calcular as ondas esféricas livres com ℓ = m = 0 resolvendo a equação (10.3.12) e segundo calcular as restantes usando (10.3.18) e (10.3.22). • Primeiro, a solução da equação (10.3.12) com ℓ = m = 0 e obedecendo à condição (10.3.13) é u0k,0(r) = ak sin kr ⇒ Φ0k,0,0 (~r) u0k,0(r) 0 ak sin kr Y0 = √ . = r 4πr (10.3.23) As constantes ak podem ser obtidas pela condição de ortonormalização ′ δ(k − k ) = Z 3 d ~r ∗ Φ0k,0,0 Φ0k′ ,0,0 ∗ = (ak ) ak′ Z +∞ dr sin kr sin k ′ r . (10.3.24) 0 Escrevendo os senos em termos de exponenciais imaginárias e duplicando o intervalo de integração temos (ak )∗ ak′ δ(k − k ) = 4 ′ Z +∞ −∞ (ak )∗ ak′ ′ ′ ei(k−k )r − ei(k+k )r dr = 2π(δ(k − k ′ ) − δ(k + k ′ )) . 4 (10.3.25) Como tanto k como k ′ são positivos, o segundo delta de Dirac nunca contribui. Concluimos p que ak = 2/π, pelo que podemos escrever as ondas esféricas livres com ℓ = m = 0 como Φ0k,0,0 (~r) = r 2k 2 sin kr 1 √ . π kr 4π (10.3.26) • Segundo, notamos que o operador P̂+ actua, na representação |~xi como P̂+ = −i~ ∂ ∂ +i ∂x ∂y . (10.3.27) 322 Teoria da Difusão A sua acção numa função puramente radial é y d d +i f (r) = −i~ sin θeiφ f (r) . P̂+ f (r) = −i~ r r dr dr x Logo, actuando com este operador em (10.3.26) obtemos cos kr sin kr sin kr iφ 0 0 ∝ sin θe − Φk,1,1 (~r) ∝ P̂+ Φk,0,0 (~r) ∝ P̂+ kr kr (kr)2 cos kr sin kr ∝ Y11 (θ, φ) − . kr (kr)2 (10.3.28) (10.3.29) Aplicando L̂− a esta onda esférica livre calculamos Φ0k,1,0 e Φ0k,1,−1, que têm a mesma dependência radial e dependência angular dada pelos harmónicos esféricos respectivos. Para calcular as ondas esféricas livres com ℓ > 1, notamos que [P̂+ , X̂ + iŶ ] = 0 . (10.3.30) Logo x + iy d sin kr 1 d sin kr Φ0k,2,2 (~r) ∝ P̂+2 Φ0k,0,0 (~r) ∝ P̂+ ∝ (x + iy)P̂+ r dr kr r dr kr 2 sin kr 1 d . ∝ (x + iy)2 r dr kr Em geral 1 d r dr ℓ (10.3.31) sin kr , kr (10.3.32) (x + iy)ℓ = r ℓ sinℓ θeiℓφ ∝ r ℓ Yℓℓ (θ, φ) . (10.3.33) Φ0k,ℓ,ℓ (~r) ∝ (x + iy) ℓ onde notamos que a dependência angular é Se definirmos ℓ jℓ (ρ) ≡ ρ 1 d − ρ dρ ℓ sin ρ , ρ que são as funções de Bessel esféricas de ordem l,6 podemos escrever r 2k 2 0 Φk,ℓ,m (~r) = jℓ (kr)Yℓm (θ, φ) , π 6 (10.3.34) (10.3.35) A fórmula (10.3.34) designa-se por Fórmula de Rayleigh; veja, por exemplo 10.1.25 de ‘Handbook of Mathematical Functions’, Ed. M. Abramowitz and I. Stegun, Dover, Ninth Printing. 10.3 Método das ondas parciais para a difusão por um potencial central 1 0.2 0.8 0.15 0.6 0.1 0.4 0.05 0.2 0 0 5 10 15 20 25 323 30 r -0.05 0 0 5 10 20 15 25 30 r -0.1 -0.2 Figura 10.8: Parte radial das funções de Bessel esféricas (10.3.34). Esquerda: ℓ = 0 e ℓ = 1 (zero na origem); direita ℓ = 4 e ℓ = 5 (começa a oscilar mais à direita). onde a constante de normalização é escolhida de modo a verificar Z ∗ 0 0 hΦk,ℓ,m|Φk′ ,ℓ′ ,m′ i = d3~r Φ0k,ℓ,m Φ0k′ ,ℓ′ ,m′ = δ(k − k ′ )δℓℓ′ δmm′ . (10.3.36) Estas funções formam uma base do espaço de estados (isto é uma base do espaço de funções de quadrado somável em R3 ), o que é manifesto na relação de fecho Z +∞ 0 dk +∞ X ℓ X |Φ0k,ℓ,m ihΦ0k,ℓ,m| = 1̂ , (10.3.37) Φ0k,ℓ,m (~r)Φ0k,ℓ,m (r~′ ) = δ(~r − r~′ ) . (10.3.38) ℓ=0 m=−ℓ ou, equivalentemente Z 0 +∞ dk +∞ X ℓ X ℓ=0 m=−ℓ Na figura 10.8 encontram-se os gráficos da parte radial das funções de Bessel esféricas para vários ℓ’s. 10.3.3 Propriedades das ondas esféricas livres As ondas esféricas livres (10.3.35) têm uma dependência angular totalmente definida pelos números quânticos ℓ e m, que determinam o correspondente harmónico esférico Yℓm , e 324 Teoria da Difusão como tal independente da energia. Utiliza-se, por vezes, a notação dos espectroscopistas mencionada na secção 6.4, no caso das ondas esféricas livres: onda s (ℓ = 0), onda p (ℓ = 1), etc. Assim dizemos que a onda s esférica livre é sempre isotrópica. A dependência radial fica clara nas figuras 10.8. Analisemos, analiticamente, os casos limite: Perto da origem Neste caso podemos escrever: ℓ ℓ X +∞ sin ρ ρ2p 1 d 1 d ℓ ℓ ℓ ℓ (−1)p = (−1) ρ jℓ (ρ) ≡ (−1) ρ ρ dρ ρ ρ dρ (2p + 1)! p=0 ℓ−1 X +∞ 1 d 2p = (−1)ℓ ρℓ (−1)p ρ2p−2 ρ dρ (2p + 1)! p=0 ℓ ℓ = (−1) ρ +∞ X p=0 (−1)p (10.3.39) 2p(2p − 2)(2p − 4) . . . [2p − 2(ℓ − 1)] 2p−2ℓ ρ . (2p + 1)! Os termos com p = 0, 1, . . . , ℓ − 1 são zero na soma. O primeiro termo que contribui, que é o mais importante perto da origem, é ρ→0 jℓ (ρ) ≃ (−1)ℓ ρℓ (−1)ℓ 2ℓ(2ℓ − 2)(2ℓ − 4) . . . 2 ℓ ρℓ 2ℓ(2ℓ − 2)(2ℓ − 4) . . . 2 = ρ ≡ , (2ℓ + 1)! (2ℓ + 1)! (2ℓ + 1)!! (10.3.40) onde definimos N!! = N(N − 2)(N − 4) . . . . (10.3.41) Concluimos pois que todas as funções de Bessel esféricas tendem para zero na origem, excepto a onda s (ℓ = 0), de acordo com as figuras 10.8. Consideremos ainda a densidade de probabilidade de uma partı́cula que se encontre no estado Φ0k,ℓ,m. A probabilidade de encontrar a partı́cula no ângulo sólido dΩ0 em torno da direcção (θ0 , φ0) e entre r e r + dr é proporcional a r 2 jℓ2 (kr)|Yℓm (θ0 , φ0 )|2 drdΩ0 . (10.3.42) Logo, a função radial de interesse para a densidade de probabilidade é jℓ2 (ρ)ρ2 . Esta função encontra-se representada na figura 10.9 para vários ℓ’s. Perto da origem esta função 10.3 Método das ondas parciais para a difusão por um potencial central 325 1.4 1 1.2 0.8 1 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 0 0 5 10 15 20 0 5 rho 10 15 20 rho Figura 10.9: Representação da função ρ2 jℓ2 (r). Esquerda: ℓ = 0 (é exactamente o sin2 ρ) e ℓ = 1 (começa a oscilar mais à direita); direita ℓ = 4 e ℓ = 5 (começa a oscilar mais à direita). comporta-se como ρ2ℓ+2 /(2ℓ + 1)!!. Logo quanto maior for ℓ mais lento será o crescimento desta função perto de ρ = 0. A probabilidade de encontrar a partı́cula para r suficientemente pequeno é, assim, negligenciável; estimamos que para ρ< p ℓ(ℓ + 1) ⇔ p ℓ(ℓ + 1) |L| = , r< k |~p| (10.3.43) a probabilidade de encontrar a partı́cula seja praticamente nula. Este valor é qualitativamente justificado pela figura 10.9. Façamos uma analogia clássica para uma justificação mais quantitativa. Se considerarmos uma partı́cula clássica livre no plano xy, terá equações do movimento   x=x +v t 0 x  y =y +v t 0 y ⇒ D 2 (t) = x2 +y 2 = x20 +y02 +(vx2 +vy2 )t2 +2(x0 vx +y0vy )t , (10.3.44) onde D 2 (t) é o quadrado da distância à origem. Extremizando esta função calculamos o parâmetro de impacto, b (distância mı́nima à origem): 2 Dmin = (x0 vy − y0 vx )2 vx2 + vy2 ⇒ b = |Dmin | = |L| , |~p| (10.3.45) 326 Teoria da Difusão que é a versão clássica de (10.3.43). Assim, a partı́cula quântica no estado |Φ0k,ℓ,mi é praticamente inafectada pelo que acontece dentro de uma esfera com raio p ℓ(ℓ + 1) . bℓ (k) = k Comportamento assimptótico ℓ ℓ−1 sin ρ cos ρ sin ρ 1 d 1 d ℓ ℓ ℓ ℓ = (−1) ρ − 3 jℓ (ρ) ≡ (−1) ρ ρ dρ ρ ρ dρ ρ2 ρ ℓ−1 ρ→∞ 1 d cos ρ ≃ (−1)ℓ ρℓ . ρ dρ ρ2 Aplicando outra derivada, o termo dominante será a derivada do cosseno ℓ−2 ρ→∞ − sin ρ 1 d ℓ ℓ . jℓ (ρ) ≃ (−1) ρ ρ dρ ρ3 (10.3.46) (10.3.47) (10.3.48) Concluimos que, de um modo geral, o termo assimptoticamente dominante virá de aplicar todas as derivadas à função trigonométrica (e não às potências de ρ) ℓ ℓ ρ→∞ d (−1)ℓ d ℓ ℓ 1 1 jℓ (ρ) ≃ (−1) ρ ℓ sin ρ = sin ρ . ρ ρ dρ ρ dρ Notando que podemos escrever ℓ d ℓπ ℓ . sin ρ = (−1) sin ρ − dρ 2 (10.3.49) (10.3.50) Logo, sin ρ − ℓπ 2 . (10.3.51) jℓ (ρ) ≃ ρ Assim sendo, as ondas esféricas livres (10.3.35) ficam, assimptoticamente, r r ρ→∞ 2k 2 sin(kr − ℓπ/2) m 2k 2 m eikr e−iℓπ/2 − e−ikr eiℓπ/2 0 Φk,ℓ,m ≃ Yℓ (θ, φ) = Yℓ (θ, φ) . π kr π 2ikr (10.3.52) ρ→∞ Este comportamento assimptótico corresponde à sobreposição de uma onda ‘incoming’ (e−ikr /r) com uma onda ‘outgoing’ (eikr /r), com uma diferença de fase ℓπ ℓπ = πℓ . − − ∆ϕ = ϕincoming − ϕoutgoing = 2 2 (10.3.53) Ou seja, as componentes ‘incoming’ e ‘outgoing’ das ondas esféricas livres com ℓ par (ℓ ı́mpar) estão em fase (oposição de fase). Tal como antecipado no inı́cio desta secção, a diferença de fase é bem definida e função do número quântico ℓ. 10.3 Método das ondas parciais para a difusão por um potencial central 327 Expansão de uma onda plana em termos de ondas esféricas livres Estudamos duas ‘bases’ distintas do espaço de funções de quadrado somável em R3 que são bases próprias de Ĥ0 : ondas planas, |~ki = |kx , ky , kz i, e ondas esféricas livres, |Φ0k,ℓ,mi. Dado serem bases é possı́vel expandir qualquer ket de uma base em termos dos kets da outra base. Consideremos o ket |0, 0, ki, que representa a onda plana eikz ; de facto h~r|0, 0, ki = 1 eikz . (2π)3/2 (10.3.54) Este é um estado próprio de Ĥ0 com momento (~p = ~~k) e energia (E = ~2 k 2 /2µ) bem definidos. Para além disso, como eikz = eikr cos θ , (10.3.55) é independente da coordenada φ, na representação |~ri, o ket |0, 0, ki é também um estado próprio de L̂z (L̂z = −i~∂/∂φ), com valor próprio 0: L̂z |0, 0, ki = 0 . (10.3.56) Usando a relação de fecho (10.3.37), podemos escrever |0, 0, ki = Z 0 +∞ dk ′ +∞ X ℓ X ℓ=0 m=−ℓ |Φ0k′ ,ℓ,mihΦ0k′ ,ℓ,m |0, 0, ki . (10.3.57) Para m 6= 0, |0, 0, ki e |Φ0k′ ,ℓ,m i são dois vectores próprios de um operador hermı́tico (L̂z ), com valores próprios diferentes. Logo são ortogonais. São também 2 vectores próprios de Ĥ0 - também hermı́tico - com valores próprios diferentes caso k 6= k ′ ; logo ortogonais. Podemos pois escrever que hΦ0k′ ,ℓ,m |0, 0, ki ∝ δm0 δ(k − k ′ ) , e como tal |0, 0, ki = +∞ X ℓ=0 ck,ℓ |Φ0k,ℓ,0i , (10.3.58) (10.3.59) 328 Teoria da Difusão ou, na representação |~ri, +∞ X eikz ck,ℓ = (2π)3/2 ℓ=0 r 2k 2 jℓ (kr)Yℓ0 (θ) . π Os coeficientes ck,ℓ podem ser calculados explicitamente, obtendo-se7 r 2ℓ + 1 ck,ℓ = iℓ . 4πk 2 (10.3.60) (10.3.61) Logo ikz e +∞ X p iℓ 4π(2ℓ + 1)jℓ (kr)Yℓ0 (θ) . = (10.3.62) ℓ=0 Note-se que, assimptoticamente, usando (10.3.51), (10.3.52) temos a expressão ikz e 10.3.4 r→∞ ≃ +∞ X p eikr e−iℓπ/2 − e−ikr eiℓπ/2 0 Yℓ (θ) . iℓ 4π(2ℓ + 1) 2ikr ℓ=0 (10.3.63) Ondas parciais num potencial V (r) Vamos agora introduzir um potencial central arbitrário V (r). O ponto principal é que para qualquer V (r) com suporte compacto a forma assimptótica das ondas parciais será idêntica à das ondas esféricas livres, apenas mudando o desfasamento entre a onda ‘incoming’ e a onda ‘outgoing’. Consideremos novamente a equação de Schrödinger três dimensional. Para a resolvermos em termos de ondas parciais tomamos um ansatz análogo a (10.3.7) com (10.3.11), Φk,ℓ,m = uk,ℓ(r) m Yℓ (θ, φ) , r onde uk,ℓ (r) é solução da generalização de (10.3.12), isto é 2 d ℓ(ℓ + 1) 2µV (r) 2 − +k − uk,ℓ(r) = 0 , dr 2 r2 ~2 (10.3.64) (10.3.65) com a condição (10.3.13) uk,ℓ (r = 0) = 0 . 7 Este cálculo será efectuado nas aulas teórico-práticas. (10.3.66) 10.3 Método das ondas parciais para a difusão por um potencial central 329 Note-se que isto não é mais do que a equação de Schrödinger para um problema em uma dimensão, onde a partı́cula de massa µ está sob a acção do potencial  2   V (r) + ℓ(ℓ + 1)~ , r > 0 2µr 2 ; Vef f (r) =   +∞ , r<0 (10.3.67) esta perspectiva um dimensional justifica a utilização da condição fronteira (10.3.66). Assumindo que o potencial é assimptoticamente negligenciável, (10.3.65) fica, assimptoticamente com solução geral d2 2 + k uk,ℓ(r) dr 2 uk,ℓ (r) r→∞ ≃ r→∞ ≃ 0, (10.3.68) Aeikr + A′ e−ikr . (10.3.69) Podemos pensar nesta solução, na perspectiva do potencial efectivo um dimensional: existe uma onda incidente de r = +∞ (e−ikr ) e uma onda reflectida (eikr ). Como não pode haver onda transmitida para r < 0 - dado que o potencial é infinito nessa região - a corrente reflectida tem que ser igual à transmitida, pelo que concluimos que |A| = |A′ | ⇒ uk,ℓ (r) r→∞ ≃ |A| eikr eϕr + e−ikr eϕi ⇔ uk,ℓ(r) r→∞ ≃ C sin(kr + βℓ ) . (10.3.70) A fase βℓ vai ser determinada pela condição fronteira na origem (10.3.66). No caso das ondas esféricas livres (V (r) = 0), vimos em (10.3.51) que βℓ = −ℓπ/2; tomando este valor como referência escrevemos uk,ℓ (r) r→∞ ≃ ℓπ C sin kr − + δℓ , 2 (10.3.71) onde δℓ , que em geral será função da energia e como tal de k, é a diferença de fase adicional ou desfasamento para as ondas parciais. Concluimos que as ondas parciais terão a forma assimptótica ℓπ r→∞ C sin kr − 2 + δℓ Φk,ℓ,m (~r) ≃ Yℓm (θ, φ) r eikr e−i(ℓπ/2−δℓ ) − e−ikr ei(ℓπ/2−δℓ ) , = CYℓm (θ, φ) 2ir (10.3.72) 330 Teoria da Difusão e vemos que as ondas parciais são ainda a sobreposição de uma onda “incoming” com uma onda “outgoing” com uma diferença de fase ∆ϕ = ϕincoming − ϕoutgoing = ℓπ − 2δℓ . (10.3.73) Portanto, o potencial originou a diferença de fase adicional −2δℓ relativamente ao que aconteceria na ausência de potencial. Este factor traduz o efeito total do potencial numa partı́cula com momento angular ℓ. É conveniente definir uma nova função de onda Φ̃k,ℓ,m (~r) proporcional, assimptoticamente, a (10.3.72), do seguinte modo: • Φ̃k,ℓ,m(~r) = eiδℓ Φk,ℓ,m (~r); esta redefinição por uma fase global é irrelevante fisicamente e é conveniente porque fazendo-o podemos pensar no processo de difusão, na presença do potencial, da seguinte maneira: a onda incidente de r = +∞ é a mesma do que aquela considerada na ausência de potencial, mas a onda reflectida tem a fase adicional 2δℓ . • Tomamos a constante C = 1/k em (10.3.72). Esta escolha nada tem de fı́sico. É apenas uma questão de conveniência como veremos em baixo. Logo Φ̃k,ℓ,m (~r) r→∞ ∼ −Yℓm (θ, φ) e−ikr eiℓπ/2 − eikr e−iℓπ/2 e2iδℓ . 2ikr (10.3.74) Recordemos que as ondas esféricas livres Φ0k,ℓ,m praticamente não penetram na região p com r < ℓ(ℓ + 1)/k, como visto na secção anterior. Se considerarmos um potencial com alcance finito - digamos r0 - tal que V (r) = 0 para r > r0 , necessitamos apenas de considerar a diferença de fase adicional δℓ para ℓ < ℓM , onde p ℓM (ℓM + 1) ≃ r0 k . (10.3.75) Isto é, para potenciais com alcance finito, existe, para cada energia, um ℓ máximo e as únicas diferenças de fase adicionais que necessitamos de calcular acontecerão para as primeiras ondas parciais (s, p, . . .). 10.3 Método das ondas parciais para a difusão por um potencial central 331 Secção eficaz diferencial de difusão em termos de δℓ Como toda a informação sobre o potencial V (r) fica contida, assimptoticamente, em δℓ , deveremos ser capazes de calcular σ(θ, φ) em termos de δℓ . Para isso escrevemos os estados estacionários de difusão em termos das ondas parciais. Tendo em conta as simetrias do problema (onda incidente segundo Oz e potencial central), as únicas ondas parciais que respeitam esta simetria são Φk,ℓ,0 (~r). Logo vkdif (~r) = +∞ X cℓ Φ̃k,ℓ,0(~r) . (10.3.76) ℓ=0 Para estes serem estados estacionários de difusão, têm que ter o comportamento assimptótico correcto. Isso é verificado se escolhermos os coeficientes cℓ apropriadamente: Lema: A forma de cℓ para (10.3.76) ser um estado estacionário de difusão é8 cℓ = iℓ p 4π(2ℓ + 1) . (10.3.77) Demonstração: Introduzindo (10.3.77) em (10.3.76) temos vkdif (~r) +∞ X p iℓ 4π(2ℓ + 1)Φ̃k,ℓ,0 (~r) ; = (10.3.78) ℓ=0 usando a forma assimptótica (10.3.74), r→∞ vkdif (~r) ≃ +∞ X p e−ikr eiℓπ/2 − eikr e−iℓπ/2 e2iδℓ 0 ℓ , − i 4π(2ℓ + 1)Yℓ (θ) 2irk ℓ=0 (10.3.79) ou ainda, escrevendo e2iδℓ = 1 + 2ieiδℓ sin δℓ , (10.3.80) temos r→∞ vkdif (~r) ≃ 8 −ikr iℓπ/2 +∞ X p e e − eikr e−iℓπ/2 e−iℓπ/2 eiδℓ sin δℓ eikr 0 ℓ i 4π(2ℓ + 1)Yℓ (θ) − . − 2irk k r ℓ=0 (10.3.81) Para obter (10.3.74) usamos C = 1/k em (10.3.72); caso tivessemos usado outro valor alteraria a forma de (10.3.77), mas o resultado final (10.3.83) seria inalterado. 332 Teoria da Difusão Comparando com (10.3.63) concluimos que o primeiro termo é a forma assimptótica de eikz ; logo r→∞ vkdif (~r) ≃ ikz e +∞ X p e−iℓπ/2 eiδℓ sin δℓ eikr iℓ 4π(2ℓ + 1)Yℓ0 (θ) . + k r ℓ=0 (10.3.82) Esta é, de facto a forma assimptótica correcta para um estado estacionário de difusão, (10.1.13). Concluimos ainda que a expressão para a amplitude de difusão em termos das diferenças de fase adicionais, δℓ , toma a forma +∞ fk (θ) = 1 Xp 4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) , k ℓ=0 (10.3.83) onde usamos que e−iℓπ/2 = (−i)ℓ . (q.e.d.) A secção eficaz diferencial de difusão é, portanto, +∞ 1 Xp σ(θ) = |fk (θ)| = 4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) k 2 2 . (10.3.84) ℓ=0 Note-se, em particular, que a contribuição da onda s para a secção eficaz diferencial de difusão é independente de θ e toma a forma σ onda s = sin2 δ0 . k2 (10.3.85) A secção eficaz total de difusão é simples de calcular usando a ortonormalização dos harmónicos esféricos, com resultado σ= Z dΩσ(θ) = +∞ 4π X (2ℓ + 1) sin2 δℓ . k2 (10.3.86) ℓ=0 Em particular, a contribuição da onda s para a secção eficaz total é onda s σparcial = 4π sin2 δ0 ; k2 (10.3.87) as contribuições de ondas especı́ficas para a secção eficaz total, são denominadas secções eficazes de difusão parciais. Comentários: 10.3 Método das ondas parciais para a difusão por um potencial central 333 • Não há contribuições provenientes de interferências entre diferentes ℓ’s para σ; • Cada ℓ pode dar uma contribuição máxima de 4π(2ℓ + 1)/k 2 para σ; • Para calcular σ será em princı́pio necessário saber δℓ para todos os ℓ. Há duas situações possı́veis: i) Se V (r) é conhecido isto implica resolver a equação radial para cada ℓ. Frequentemente isto tem de ser feito numericamente. Na prática o método das ondas parciais só é atractivo se δℓ tiver que ser calculado apenas para um número suficientemente pequeno de ℓ’s. Este será o caso para potenciais de alcance finito L, discutido anteriormente, se considerarmos a difusão de modos de baixa energia: k≪ 1 . L (10.3.88) Para estes modos, apenas os desfasamentos com ℓ mais baixo terão de ser calculados. Em particular para energias suficientemente baixas, apenas a onda s deverá ser considerada, pelo que a secção eficaz de difusão será bem aproximada por (10.3.85); ii) Se V (r) for desconhecido, tentaremos reproduzir a curva experimental usando um pequeno número de δℓ ’s, isto é, usando apenas ℓ = 1, 2, . . . , ℓmáximo . A dependência em θ irá sugerir que ℓ’s necessitamos de considerar. Por exemplo, se σ for independente de θ, só necessitamos de considerar ℓ = 0 - dado que Y00 é independente de θ. Pelo mesmo raciocı́nio se σ for dependente de θ, necessitamos de considerar ℓ’s diferentes de zero. Depois de estabelecermos quais os ℓ’s necessários para reproduzir os resultados experimentais, procuramos potenciais que reproduzam os δℓ necessários. Exemplo: Poço de potencial esférico Como exemplo de aplicação do método das ondas parciais consideramos o poço de potencial esférico (10.2.40), já considerado na aproximação de Born. No método das ondas parciais 334 Teoria da Difusão temos de calcular os desfasamentos δℓ para todos os ℓ. Para isso temos de resolver a equação (10.3.65) para o potencial (10.2.40), com a condição fronteira (10.3.66); isto é resolver 2 ℓ(ℓ + 1) 2µV0 d 2 − + k + 2 uk,ℓ (r) = 0 , r < R dr 2 r2 ~ 2 . (10.3.89) ℓ(ℓ + 1) d 2 − + k uk,ℓ(r) = 0 , r > R dr 2 r2 Se kR ≪ 1, apenas a onda s (ℓ = 0) é relevante e neste caso as equações são particularmente simples de resolver. De facto, o problema reduz-se a resolver a equação de Schrödinger um dimensional num potencial contı́nuo por pedaços (capı́tulo 3). As soluções para uk,0(r) são:  ′ ′   Aeik r + A′ e−ik r , r < R uk,0(r) = (10.3.90)   A eikr + A′ e−ikr , r > R , 1 1 onde p 2µ(V0 + E) . k = ~ Impondo a condição fronteira (10.3.66) (que corresponde à continuidade da função de onda ′ na descontinuidade infinita do potencial em r = 0) e a continuidade da função de onda uk,0(r) e da sua derivada em r = R, obtemos ′ ′ k k ′ −ikR ′ ′ ′ ikR ′ ′ A = −A , A1 = e − cos k R + i sin k R A . cos k R + i sin k R A , A1 = e k k (10.3.91) Concluimos que a função de onda tem a forma    2iA sin k ′ r , r < R  ′ uk,0(r) = k  ′ ′  cos k R sin k(r − R) + sin k R cos k(r − R) , r > R .  2iA k (10.3.92) Para lermos o desfasamento, escrevemos a parte assimptótica da solução (r > R) na forma (10.3.71), com ℓ = 0, isto é uk,0(r) = 2Ai sin(kr + δ0 ) , r>R. (10.3.93) Expandindo este seno como o seno de uma soma (escrevendo sin[(kr − kR) + (δ0 + kR)]) e igualando a (10.3.92) obtemos δ0 = arctan k ′ tan k R − kR . k′ (10.3.94) 10.3 Método das ondas parciais para a difusão por um potencial central Usando (10.3.87) obtemos para a secção eficaz parcial de difusão 2 k 4π ′ onda s tan k R − kR . σparcial = 2 sin arctan k k′ 335 (10.3.95) A secção eficaz parcial será uma boa aproximação à secção eficaz total no limite de baixas energias, kR ≪ 1 (note-se que esta é a condição (10.2.44). Neste limite podemos aproximar (desde que k ′ R 6= nπ/2) arctan kR tan k ′ R k′R ≃ kR tan k ′ R . k′R Se a energia da partı́cula difundida for baixa, não só relativamente ao alcance do potencial, mas também relativamente à sua magnitude E ≪ V0 , podemos aproximar √ 2µV0 ′ k ≃ k0 = . ~ Logo δ0 ≃ kR tan k0 R −1 k0 R , e onda s σparcial ≃ 4πR 2 tan k0 R −1 k0 R 2 . (10.3.96) Para compararamos com o resultado obtido na aproximação de Born, temos de considerar a aproximação que está sempre presente na aproximação de Born, isto é, que o potencial é fraco. Neste caso, k0 R ≪ 1 (note-se que esta é a condição (10.2.41)). Usando tan x ≃ x + x3 /3, para x ≪ 1 obtemos onda s σparcial ≃ 4πR2 16π µ2 V02 R6 (k0 R)4 = , 9 9 ~4 (10.3.97) em concordância com o resultado (10.2.46) obtido na aproximação de Born. Alguns comentários: • Na aproximação de Born, o potencial é considerado suficientemente fraco. Para além disso podemos, ou não, considerar uma aproximação de baixas energias. Por contraste, no método das ondas parciais, ao aproximarmos a secção eficaz total de difusão pela secção eficaz parcial da onda s estamos a assumir uma aproximação de baixas 336 Teoria da Difusão energias. Para além disso podemos, ou não, considerar uma aproximação de potencial fraco. Claro que só obtemos um acordo entre os dois métodos se considerarmos ambas as aproximações nos dois casos. • Por (10.3.96) vemos que, a secção eficaz aumenta com a profundidade do poço V0 e diverge para tan k0 R = π/2. Esta é a profundidade para a qual o poço admite o primeiro estado ligado (Problema 4, Folha de Problemas 4, Mecânica Quântica I). Se continuarmos a aumentar a profundidade do poço a secção eficaz diminui até zero, valor que é obtido para tan k0 R = k0 R. Aumentando a profundidade do poço a secção eficaz oscila entre 0 e ∞, divergindo sempre que a profundidade do poço permite um novo estado ligado. 10.4 Difusão Inelástica Até agora lidamos neste capı́tulo unicamente com difusão elástica. Porém, existem fenómenos onde parte da energia do feixe incidente é absorvida, no estado final, pelos graus de liberdade internos das diferentes partı́culas iniciais ou das partı́culas alvo. Se estamos essencialmente interessados na parte da difusão elástica, descrevemos esta absorção globalmente, i.e. sem entrar nos detalhes das reacções de absorção. O método das ondas parciais fornece-nos o enquadramento adequado para uma descrição fenomenológica da absorção. Comecemos por discutir, conceptualmente, a modificação do método de modo a incluir o fenómeno de absorção. O método das ondas parciais é usado para potenciais centrais. Por isso vamos assumir que as interacções que conduzem à absorção são também invariantes por rotação. O método baseia-se no cálculo de desfasamentos entre as ondas ‘incoming’ e ‘outgoing’, do tipo e2iδℓ , de acordo com (10.3.74). Como o módulo deste factor é 1, as amplitudes das ondas ‘incoming’ e ‘outgoing’ são iguais, pelo que a corrente de probabilidade que entra é igual à que sai. Isto sugere que, se permitirmos que o desfasamento tenha uma parte imaginária, de modo a que |e2iδℓ | < 1 , (10.4.1) 10.4 Difusão Inelástica 337 teremos uma corrente de probabilidade a sair menor do que aquela que entrou, para a onda parcial ℓ. Este facto manifesta o desaparecimento de algumas partı́culas e como tal um fenómeno de absorção. Com este princı́pio iremos deduzir expressões para as secções eficazes de difusão e absorção. Note que a descrição que aqui é dada é fenomenológica; esconde uma realidade de processos complexos que levam às absorções aqui descritas. 10.4.1 Secções eficazes de difusão elástica e de absorção Denotemos e2iδℓ ≡ ηℓ . (10.4.2) Impomos que |ηℓ | ≤ 1, de modo a descrever difusão elástica (se |ηℓ | = 1) ou difusão com absorção (se |ηℓ | < 1). Reescrevemos (10.3.79) como vkdif (~r) r→∞ ≃ +∞ X p eikr e−iℓπ/2 (ηℓ − 1) + eikr e−iℓπ/2 − e−ikr eiℓπ/2 iℓ 4π(2ℓ + 1)Yℓ0 (θ) , 2irk ℓ=0 (10.4.3) ou, usando (10.3.63) r→∞ vkdif (~r) ≃ ikz e + +∞ X p 4π(2ℓ + 1)Yℓ0 (θ) ℓ=0 (ηℓ − 1) eikr , 2ik r (10.4.4) de onde lemos que a amplitude de difusão é +∞ ηℓ − 1 1 Xp 4π(2ℓ + 1)Yℓ0 (θ) fk (θ) = . k ℓ=0 2i (10.4.5) Logo, a secção eficaz diferencial de difusão, que agora denominamos secção eficaz de difusão elástica e denotamos σel é +∞ ηℓ − 1 1 Xp 4π(2ℓ + 1)Yℓ0 (θ) σel (θ) = 2 k 2i 2 . (10.4.6) ℓ=0 Consequentemente, a secção eficaz total de difusão elástica é σel = Z +∞ π X σel (θ)dΩ = 2 (2ℓ + 1)|ηℓ − 1|2 . k ℓ=0 (10.4.7) 338 Teoria da Difusão Note que a absorção será máxima se ηℓ = 0. Mas mesmo nesse caso a onda ℓ contribui para a secção de difusão elástica! Ou seja, mesmo uma região de interacção que seja um absorvedor perfeito produz difusão elástica. Este é um fenómeno puramente quântico, denominado de difusão por sombras. Analogamente ao que foi feito na secção (10.1.1) para a secção eficaz diferencial de difusão, definimos a secção eficaz de absorção, σabs , como sendo a razão entre o número de partı́culas absorvidas por unidade de tempo dnabs e o fluxo incidente Fi : dnabs = σabs Fi . (10.4.8) Para calcular esta secção eficaz é suficiente calcular a probabilidade total, ∆P, que desa~ parece por unidade de tempo. Esta probabilidade é, por sua vez, obtida da corrente J, associada com a função de onda (10.4.3): ∆P é a diferença entre o fluxo de ondas que entram e o das ondas que saem numa esfera de raio elevado R0 ; ou seja é menos o fluxo total através dessa esfera: ∆P = − Z S2 ~=− J~ · dS Z Jr r 2 dΩ , (10.4.9) r=R0 pois apenas a componente radial Jr contribui. Usando (10.1.16), temos Jr = Re (vkdif )∗ (~r) ~ ∂ dif v (~r) iµ ∂r k . (10.4.10) Como a derivada radial não altera a dependência angular e usando a ortogonalidade dos harmónicos esféricos obtemos ∆P = − +∞ Z X ℓ r=R0 Jr(ℓ) r 2 dΩ , (10.4.11) onde Jr(ℓ) e como tal r→+∞ ≃ − ~k (2ℓ + 1)π (1 − |ηℓ |2 )|Yℓ0 (θ)|2 , µ k2r2 +∞ ~k π X ∆P = (2ℓ + 1)(1 − |ηℓ |2 ) . µ k2 ℓ (10.4.12) (10.4.13) 10.4 Difusão Inelástica 339 A secção eficaz de absorção é a probabilidade ∆P a dividir pela corrente incidente ~k/µ, σabs +∞ π X (2ℓ + 1)(1 − |ηℓ |2 ) . = 2 k ℓ (10.4.14) Note-se que σabs = 0 se todos os |ηℓ | = 1 como seria de esperar quando todos os desfasamentos forem puramente reais. Pelo contrário, se |ηℓ | = 0 a contribuição da onda ℓ para σabs é máxima. 10.4.2 Secção eficaz total e o teorema óptico A secção eficaz total é definida como a soma de todas as secções eficazes (integradas sobre todo o espaço caso sejam secções eficazes diferenciais). Corresponde ao número de partı́culas que, por unidade de tempo, participam numa das reacções possı́veis (i.e são difundidas ou absorvidas), dividido pelo fluxo incidente. Logo σtotal = σel + σabs , (10.4.15) ou usando (10.4.7) e (10.4.14), σtotal +∞ +∞ π X π X 2 2 = 2 (2ℓ + 1) 1 − |ηℓ | + |ηℓ − 1| = 2 (2ℓ + 1) [1 − Re ηℓ ] . k ℓ k ℓ (10.4.16) Usando (10.4.5) e ainda o facto que os harmónicos esféricos envolvidos são, para ângulo polar igual a zero: Yℓ0 (θ obtemos = 0) = r 2ℓ + 1 , 4π +∞ 1 X Im fk (θ = 0) = (2ℓ + 1)Re (1 − ηℓ ) , 2k (10.4.17) (10.4.18) ℓ ou, comparando com (10.4.16) σtotal = 4π Im fk (θ = 0) . k (10.4.19) Este resultado é designado por Teorema óptico. É uma relação entre a secção eficaz total e a parte imaginária da amplitude de difusão elástica na direcção frontal (θ = 0). Note-se 340 Teoria da Difusão que no caso em que não há absorção σtotal = σel e o teorema reduz-se a uma relação entre a amplitude de difusão na direcção frontal e a secção eficaz total de difusão. Que uma tal relação exista é bastante natural. Para o compreender recordemos a forma dos estados estacionários de difusão (10.1.13) ~ r →∞ vkdif (~r) −→ eikr cos θ + fk (θ, φ) eikr ; r (10.4.20) A onda transmitida na direcção frontal é ~ r →∞ vkdif (r, θ = 0, φ) −→ eikr + fk (θ = 0, φ) eikr ; r (10.4.21) que não é mais do que uma sobreposição entre a onda incidente eikr e a onda difundida na direcção frontal fk (θ = 0, φ)eikr /r. A última é determinada pela amplitude de difusão na direcção frontal. A onda transmitida é atenuada (relativamente à onda incidente), devido às partı́culas difundidas em todas as direcções do espaço. Logo a sobreposição entre a onda difundida na direcção frontal e a onda incidente tem de ter a informação sobre as partı́culas difundidas em todas as outras direcções. Logo é natural que exista uma relação entre fk (θ = 0, φ) e σtotal . 10.5 Sumário Neste capı́tulo estudamos reacções de difusão. As quantidades fundamentais do formalismo são a amplitude de difusão, fk (θ, φ), e as secções eficazes (diferencial e total) de difusão σ(θ, φ) e σ. Todo o formalismo pode ser discutido em termos dos estados estacionários de difusão (quando o potencial é indepentente do tempo, que é o caso aqui considerado), que são as funções de onda do problema com o comportamento assimptótico correcto. Por considerações genéricas obtivemos a relação (10.1.24): σ(θ, φ) = |fk (θ, φ)|2 . Esta equação traduz a relação entre a quantidade directamente relacionável com a experiência σ(θ, φ) e a quantidade derivável da teoria, fk (θ, φ). Estudamos seguidamente dois métodos teóricos para calcular a amplitude de difusão. 10.5 Sumário 341 No primeiro método - método de Born - começamos por estabelecer a equação integral de difusão para obter os estados estacionários de difusão. Estabelecemos a expansão de Born e a aproximação de Born que nos permitiu obter uma fórmula aproximada, utilizável, para calcular a amplitude de difusão (e como tal a secção eficaz de difusão) para um determinado potencial (10.2.27): fkBorn (θ, φ) µ =− 2π~2 Z d3~re−i~q·~r V (~r) , q ≡ 2k sin θ . 2 A fórmula é válida para potenciais fracos de acordo com o critério (10.2.24). Como exemplo calculamos a secção eficaz de difusão para um poço de potencial esférico e para o potencial de Yukawa. Para este último caso recuperamos, no limite de alcance infinito, a fórmula de Rutherford. No segundo método - método das ondas parciais -, válido apenas para potenciais com simetria esférica, começamos por estudar em detalhe as ondas esféricas livres e estabelecemos que as ondas parciais num potencial central arbitrário diferem, assimptoticamente, das ondas esféricas livres apenas por um desfasamento. Obtivemos uma expressão exacta para a amplitude de difusão (10.3.83) em termos destes desfasamentos, causadas pelo potencial difusor: +∞ fk (θ) = 1 Xp 4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) . k ℓ=0 Embora a fórmula seja exacta, para ser utilizável temos que assumir uma aproximação de baixas energias (10.3.88), de modo a que seja apenas necessario saber os desfasamentos das ondas com ℓ mais baixo. Como aplicação do método consideramos novamente um poço de potencial esférico e recuperamos, no limite de baixas energias e potencial fraco o resultado da aproximação de Born. Finalmente consideramos brevemente a difusão inelástica. Definimos a secção eficaz de absorção, obtivemos uma expressão para o seu cálculo e derivamos o teorema óptico. CAPÍTULO 11 Métodos perturbativos independentes e dependentes do tempo Na secção 9.2 discutimos qualitativamente que, para descrever a estrutura fina do espectro do átomo de hidrogénio, é necessário levar em consideração várias correcções ao Hamiltoniano do problema de Coulomb, estudado no capı́tulo 6. Considerando tais correcções, o problema do átomo de hidrogénio deixa de ser exactamente solúvel e portanto é necessário considerarmos métodos de resolução aproximada. Sendo que tais correcções são pequenas é natural considerarmos um método perturbativo. Neste capı́tulo consideramos sistemas fı́sicos cujo Hamiltoniano pode ser visto como uma soma de dois termos. Um primeiro termo pode ser considerado exactamente, isto é, o seu espectro e funções próprias podem ser calculados analiticamente. O segundo termo não é, genericamente, diagonalizado pelas funções próprias do primeiro termo, e o como tal o Hamiltoniano total não pode ser resolvido exactamente. No entanto, o segundo termo pode ser considerado muito menor do que o primeiro e como tal o Hamiltoniano total pode ser resolvido através de uma expansão perturbativa, que poderá ser truncada na ordem desejada obtendo-se o espectro e funções próprias do Hamiltoniano total com uma precisão que será tanto maior quanto maior for a ordem considerada. Começamos por considerar o cálculo de estados estacionários de sistemas descritos por 344 Métodos perturbativos independentes e dependentes do tempo Hamiltonianos independentes do tempo. Seguidamente estudaremos Hamiltonianos cujas perturbações são dependentes do tempo. 11.1 Teoria das perturbações estacionárias Consideramos o Hamiltoniano Ĥ = Ĥ0 + Ŵ , (11.1.1) onde Ĥ0 é o Hamiltoniano não perturbado e Ŵ é o Hamiltoniano da perturbação. O facto de Ŵ ser uma perturbação significa que a sua contribuição para os valores próprios e os vectores próprios de Ĥ é muito menor do que a contribuição de Ĥ0 ; esquematicamente escrevemos |Ŵ | ≪ |Ĥ0 | , (11.1.2) mas o sentido preciso deste critério será esclarecido posteriormente. Para tornar explı́cita a análise perturbativa, escrevemos Ŵ ≡ λV̂ , onde λ ≪ 1. Assumimos que conhecemos a forma exacta dos valores próprios e estados próprios de Ĥ0 , sendo o seu espectro {Ep0 } discreto: Ĥ0 |φip i = Ep0 |φip i , (11.1.3) onde i = 1, . . . , dp é um ı́ndice no sub-espaço degenerado das energias, e {|φip i} constitui uma base ortonormalizada de estados próprios ′ hφip |φip′ i ii′ = δ δpp′ , dp XX p i=1 |φip ihφip | = 1̂ . (11.1.4) Com este formalismo, podemos calcular soluções aproximadas da equação de valores próprios Ĥ(λ)|Ψ(λ)i = E(λ)|Ψ(λ)i , (11.1.5) onde Ĥ = Ĥ0 + λV̂ , usando uma expansão perturbativa em λ. Para este fim, assumimos que tanto o valor próprio E(λ), como o vector próprio, |Ψ(λ)i, admitem uma expansão em 11.1 Teoria das perturbações estacionárias 345 potências de λ, da forma, respectivamente, 2 E(λ) = ǫ0 + λǫ1 + λ ǫ2 + . . . = +∞ X λn ǫn , (11.1.6) n=0 2 |Ψ(λ)i = |0i + λ|1i + λ |2i + . . . = Substituindo estas expansões em (11.1.5) obtemos ! ! +∞ +∞ X X (Ĥ0 + λV̂ ) λn |ni = λn ǫn n=0 +∞ X n=0 n=0 λn |ni . +∞ X m=0 λm |mi (11.1.7) ! . (11.1.8) Igualando as potências de λ obtemos um conjunto infinito de equações: • Ordem 0 : Ĥ0 |0i = ǫ0 |0i . (11.1.9) Este ordem corresponde ao sistema sem perturbação. • Ordem 1 : • Ordem 2 : Ĥ0 − ǫ0 |1i + V̂ − ǫ1 |0i = 0 ; (11.1.10) Ĥ0 − ǫ0 |2i + V̂ − ǫ1 |1i − ǫ2 |0i = 0 ; (11.1.11) • Ordem n: Ĥ0 − ǫ0 |ni + V̂ − ǫ1 |n − 1i − ǫ2 |n − 2i − . . . − ǫn |0i = 0 . (11.1.12) No que se segue estudaremos as correcção ao espectro e funções próprias até segunda ordem em λ. Para determinarmos a função de onda numa dada ordem em λ, recordamos que a equação de valores próprios (11.1.5) determina a função de onda a menos de uma constante. Esta constante pode ser escolhida de modo a que: i) a função de onda esteja normalizada, hΨ(λ)|Ψ(λ)i = 1; 346 Métodos perturbativos independentes e dependentes do tempo ii) como fica ainda a liberdade residual de escolher a fase da função de onda, tomamos esta fase de modo a que h0|Ψ(λ)i seja real em qualquer ordem da expansão em λ. Com estas duas condições temos: • Ordem 0 : Dado que nesta ordem |Ψ(λ)i = |0i as duas condições traduzem-se em h0|0i = 1; isto é, o estado |0i está normalizado; • Ordem 1 : Nesta ordem |Ψ(λ)i = |0i + λ|1i; a normalização da função de onda, nesta ordem, significa 1 = (h0| + λh1|) (|0i + λ|1i) = h0|0i + λ (h0|1i + h1|0i) + O(λ2 ) ; (11.1.13) usando o resultado de ordem zero, obtemos h0|1i = −h0|1i∗ , ou seja, h0|1i é um imaginário puro. Por outro lado, a condição ii) implica que h0|Ψ(λ)i = h0|0i + λh0|1i = 1 + λh0|1i seja real, ou seja h0|1i tem de ser real. Logo h0|1i = h1|0i = 0 . (11.1.14) • Ordem 2 : Por um raciocı́nio análogo conclui-se que 1 h0|2i = h2|0i = − h1|1i . 2 (11.1.15) • Ordem n: Analogamente conclui-se que 1 h0|ni = hn|0i = − [hn − 1|1i + hn − 2|2i + . . . + h2|n − 2i + h1|n − 1i] . (11.1.16) 2 Para considerarmos em detalhe o efeito da perturabação Ŵ no espectro e vectores próprios de Ĥ0 consideremos separadamente os nı́veis de Ĥ0 degenerado e não degenerados. 11.1 Teoria das perturbações estacionárias 11.1.1 347 Perturbação de um nı́vel não degenerado Consideramos um nı́vel não degenerado de Ĥ0 , com valor próprio En0 e vector próprio associado |φn i. Vamos calcular o valor próprio de Ĥ, En (λ), e a funcão própria correspondente, |Ψn (λ)i, até segunda ordem em λ; ou seja, vamos calcular ǫ0 , ǫ1 , ǫ2 e |0i, |1i, |2i. Ordem 0 Em ordem 0, En (λ) = ǫ0 e |Ψn (λ)i = |0i, isto é, ignoramos a perturbação. A energia e estado correspondem aos de Ĥ0 ǫ0 = En0 , |0i = |φn i . (11.1.17) Ordem 1 Em ordem 1, En (λ) = ǫ0 + λǫ1 e |Ψn (λ)i = |0i + λ|1i. Para calcular ǫ1 projectamos a equação (11.1.10) em hφn | = h0|: hφn | Ĥ0 − ǫ0 |1i + hφn | V̂ − ǫ1 |0i = 0 ; dado que Ĥ0 |φn i = ǫ0 |φn i, o primeiro termo é zero; como |0i = |φn i está normalizado concluimos que ǫ1 = hφn |V̂ |φn i . (11.1.18) En (λ) = En0 + hφn |Ŵ |φn i + O(λ2 ) . (11.1.19) Logo, em primeira ordem A correcção de primeira ordem à energia de um nı́vel não degenerado |φn i é dada pelo valor esperado da perturbação nesse mesmo estado não perturbado |φn i. Para calcularmos o estado em primeira ordem em λ projectamos (11.1.10) em todos os outros estados próprios de Ĥ0 (que não |φn i), {|φip i}. Note-se que os outros nı́veis p 6= n podem ser degenerados, pelo que mantemos o ı́ndice i. Obtemos hφip | Ĥ0 − ǫ0 |1i + hφip | V̂ − ǫ1 |0i = 0 ; 348 Métodos perturbativos independentes e dependentes do tempo Como |φn i e |φip i para n 6= p são estados próprios associados a valores próprios distintos, hφip |φn i = 0; usando ainda que Ĥ0 |φip i = Ep0 |φip i obtemos hφip |V̂ |φn i , En0 − Ep0 hφip |1i = p 6= n . (11.1.20) Como hφn |1i = 0, por (11.1.14) temos todos os coeficientes da projecção de |1i na base de funções próprias de Ĥ0 . Logo |1i = dp XX p i=1 |φip ihφip |1i = dp XX hφip |V̂ |φn i p6=n i=1 En0 − Ep0 |φip i . (11.1.21) Consequentemente, em primeira ordem em λ, o estado próprio de Ĥ é |Ψn (λ)i = |φn i + dp XX hφip |Ŵ |φn i p6=n i=1 En0 − Ep0 |φip i + O(λ2 ) . (11.1.22) A correcção de primeira ordem ao estado próprio |φn i de Ĥ0 é uma mistura de todos os outros estados próprios de Ĥ0 , {|φip i}. A contribuição de um determinado estado |φip i para esta mistura é tanto maior quanto: i) maior for o elemento de matriz da perturbação entre este estado e o estado não perturbado; ii) mais próxima da energia do estado não perturbado for a energia deste estado. Podemos agora precisar o critério (11.1.2) relativo à validade do método perturbativo: 1) Por (11.1.19) requeremos que os elementos diagonais da perturbação sejam muito menores que os elementos diagonais de Ĥ0 correspondentes |hφn |Ŵ |φn i| ≪ |En0 | ; (11.1.23) 2) Por (11.1.22) requeremos que os elementos não diagonais da perturbação sejam muito menores que as diferenças entre os valores próprios de Ĥ0 correspondentes aos estados em questão |hφip|Ŵ |φn i| ≪ |En0 − Ep0 | . (11.1.24) 11.1 Teoria das perturbações estacionárias 349 Ordem 2 Em ordem 2, En (λ) = ǫ0 + λǫ1 + λ2 ǫ2 e |Ψn (λ)i = |0i + λ|1i + λ2 |2i. Para calcular ǫ2 projectamos a equação (11.1.11) em hφn | = h0|: hφn | Ĥ0 − ǫ0 |2i + hφn | V̂ − ǫ1 |1i − ǫ2 hφn |0i = 0 . (11.1.25) Tal como em ordem 1, o primeiro termo é zero; por (11.1.14), hφn |1i = 0 e usando hφn |0i = 1 temos1 ǫ2 = hφn |V̂ |1i (11.1.21) = p6=n i=1 Logo, em segunda ordem em λ: En (λ) = En0 + hφn |Ŵ |φn i + dp XX |hφip|V̂ |φn i|2 En0 − Ep0 dp XX |hφip |Ŵ |φn i|2 p6=n i=1 En0 − Ep0 , + O(λ3 ) . (11.1.26) (11.1.27) Nesta ordem, a contribuição do estado |φip i para o valor próprio da energia do estado não perturbado |φn i, devida à perturbação Ŵ , é tanto maior quanto: i) maior for o acoplamento hφip |Ŵ |φn i; ii) mais próximas forem as energias Ep0 e En0 . Quanto maiores forem estas contribuições mais os estados |φn i e |φip i se repelem. Para calcularmos o estado em segunda ordem em λ projectamos (11.1.11) em todos os outros estados próprios de Ĥ0 (que não |φn i), {|φip i}. Obtemos hφip | Ĥ0 − ǫ0 |2i + hφip | V̂ − ǫ1 |1i + ǫ2 hφip |0i = 0 ; Como |φn i e |φip i para n 6= p são estados próprios associados a valores próprios distintos, hφip |φn i = 0 e o último termo é zero; usando ainda que Ĥ0 |φip i = Ep0 |φip i obtemos hφip | V̂ − ǫ1 |1i , n= 6 p. (11.1.28) hφip |2i = En0 − Ep0 Expandindo |2i na base própria de Ĥ0 , |2i = 1 dp XX p i=1 hφip |2i|φipi = dp XX p6=n i=1 hφip |2i|φipi + hφn |2i|φn i , Note-se que, para conhecer a energia em segunda ordem necessitamos do estado em primeira ordem. Genericamente, para conhecermos a energia em ordem n necessitamos do estado até ordem n − 1. 350 Métodos perturbativos independentes e dependentes do tempo e usando (11.1.28) e a relação (11.1.15) temos dp hφi | V̂ − ǫ XX p 1 |1i h1|1i |φip i − |φn i . |2i = 0 0 En − Ep 2 p6=n i=1 (11.1.29) Usando agora (11.1.21) e (11.1.18), obtemos uma relação explı́cita para |2i em função de elementos de matriz da perturbação na base |φim i: dp dp dm XX XX XX hφip |V̂ |φn ihφn |V̂ |φn i i hφip |V̂ |φjm i hφjm |V̂ |φn i i |φ i − |2i = |φp i p 0 En0 − Ep0 En0 − Em (En0 − Ep0 )2 p6=n i=1 p6=n i=1 m6=n j=1 d p 1 X X |hφip|V̂ |φn i|2 − |φn i 2 p6=n i=1 (En0 − Ep0 )2 . (11.1.30) Logo, em segunda ordem em λ, o estado próprio de Ĥ é ! dp 1 X X |hφip |Ŵ |φn i|2 |Ψn (λ)i = 1 − |φn i 2 p6=n i=1 (En0 − Ep0 )2 ! dp XX hφip |Ŵ |φn i hφn |Ŵ |φn i + 1− |φip i 0 − E0 0 − E0 E E n p n p p6=n i=1 (11.1.31) dp dm XX XX hφip |Ŵ |φjm i hφjm |Ŵ |φn i i + |φp i + O(λ3 ) . 0 0 0 0 En − Ep En − Em p6=n i=1 m6=n j=1 Ordem de grandeza do erro numa aproximação de primeira ordem Se decidirmos truncar a expansão de En (λ) e |Ψ(λ)i em primeira ordem em λ, podemos ter uma ideia do erro envolvido no cálculo majorando o termo da energia de ordem 2. 0 0 Seja Em a energia mais próxima de En0 no espectro de Ĥ0 . Denotemos ∆E ≡ |En0 −Em |. Logo |En0 − Ep0 | ≥ ∆E , ∀p6=n . Podemos assim majorar o termo ǫ2 usando a expressão (11.1.26): # " dp dp XX 1 1 XX i |hφp|V̂ |φn i|2 = |ǫ2 | ≤ |φip ihφip | V̂ |φn i hφn |V̂ ∆E p6=n i=1 ∆E p6=n i=1 2 1 1 2 hφn |V̂ |φn i − hφn |V̂ |φn i . hφn |V̂ 1̂ − |φn ihφn | V̂ |φn i = = ∆E ∆E (11.1.32) (11.1.33) 11.1 Teoria das perturbações estacionárias 351 Logo |λ2 ǫ2 | ≤ (∆Ŵ )2 , ∆E (11.1.34) onde ∆Ŵ é o desvio padrão da perturbação no estado não perturbado. Logo, em ordem 1, a correcção à energia é o valor médio da perturbação no estado não perturbado e o erro é estimado usando o desvio padrão da perturbação nesse mesmo estado. 11.1.2 Perturbação a um nı́vel degenerado Consideremos agora um nı́vel degenerado de Ĥ0 , com valor próprio En0 e grau de degenerescência dn , 1 < dn < +∞. Seja En0 o sub-espaço vectorial gerado pelos vectores próprios de Ĥ0 associados a En0 , {|φin i}. Neste caso vamos limitar a nossa análise à primeira ordem nos valores próprios e ordem zero nos vectores próprios. Ordem 0 Em ordem 0, En (λ) = ǫ0 e |Ψn (λ)i = |0i. Claramente ǫ0 = En0 , |0i = dn X i=1 ci |φin i , onde dn X i=1 |ci |2 = 1 . (11.1.35) Note-se que existe uma indefinição na escolha de |0i, devida à degenerescência do nı́vel em análise. Essa indefinição será levantada em ordens superiores, caso a degenerescência também o seja. Ordem 1 Em ordem 1, En (λ) = ǫ0 +λǫ1 e |Ψn (λ)i = |0i+λ|1i. Para calcular ǫ1 e simultaneamente |0i, projectamos a equação (11.1.10) em hφin |. Por uma análise analoga ao caso não degenerado obtemos hφin |V̂ |0i = ǫ1 hφin |0i . (11.1.36) Inserindo a relação de fecho, dp XX p j=1 hφin |V̂ |φjp ihφjp|0i = ǫ1 hφin |0i . (11.1.37) 352 Métodos perturbativos independentes e dependentes do tempo Por (11.1.35), o termo hφjp |0i só é diferente de zero para p = n; logo dn X j=1 hφin |V̂ |φjn ihφjn |0i = ǫ1 hφin |0i . (11.1.38) Escrevendo os elementos de matriz hφin |V̂ |φjn i ≡ Vnij e usando (11.1.35), esta equação reescreve-se Vnij cj = ǫ1 ci ⇔ V̂n |0i = ǫ1 |0i . (11.1.39) Isto é, para calcular os valores próprios em ordem 1 e simultaneamente o vector próprio em ordem zero, de Ĥ(λ), correspondentes à perturbação de um nı́vel degenerado En0 , temos de diagonalizar a perturbação V̂ no sub-espaço En0 associado a En0 . Cada estado em En0 pode ter uma correcção diferente na energia por acção da perturbação; isto é, em primeira ordem En,j (λ) = En0 + λǫj1 , j = 1, . . . , fn(1) ≤ dn , (11.1.40) onde os vários ǫj1 são obtidos resolvendo a equação caracterı́stica (11.1.39), correspondendo (1) o ı́ndice j ao número de soluções distintas, num total de (em primeira ordem) fn , que necessariamente não irá exceder a dimensão do sub-espaço vectorial degenerado, dn . Relativamente ao vector próprio |0i, existem duas possibilidades: • Se a perturbação levantar totalmente a degenerescência de En0 em primeira ordem, i.e. (1) fn = dn , o vector próprio |0i é unicamente determinado pela equação caracterı́stica (11.1.39). Neste caso existe um único vector próprio de Ĥ(λ) em ordem zero com valor próprio En0 + λǫj1 em ordem 1. • Se a perturbação não levantar totalmente a degenerescência de En0 em primeira ordem, (1) i.e. fn < dn , o vector próprio |0i não é unicamente determinado pela equação caracterı́stica (11.1.39); para cada energia En0 + λǫj1 , em primeira ordem, |0i pertence a um espaço vectorial cuja dimensão é a degenerescência En0 + λǫj1 em ordem 1. 11.1.3 Perturbações X̂, X̂ 2 e X̂ 3 a um potencial harmónico Vamos agora ilustrar o formalismo estudado considerando perturbações do tipo X̂, X̂ 2 e X̂ 3 num potencial harmónico um dimensional. No primeiro e segundo caso, o problema com a 11.1 Teoria das perturbações estacionárias 353 perturbação é ainda exactamente solúvel, pelo que podemos testar o método perturbativo comparando-o com a solução exacta. O terceiro caso não tem solução exacta, mas é de interesse prático, pois um termo do tipo X̂ 3 é o primeiro termo não harmónico na expansão de Taylor de um potencial arbitrário em torno de um ponto estacionário. Note que o espectro de Ĥ0 será não degenerado. Perturbação por um potencial linear Seja Ĥ0 o Hamiltoniano do oscilador harmónico em uma dimensão (5.1.1) Ĥ0 = mω 2 2 P̂ 2 X̂ . + 2m 2 (11.1.41) O seu espectro é En0 = 1 n+ 2 n ∈ N0 , ~ω, (11.1.42) e o conjunto de funções próprias normalizadas é denotado, tal como no capı́tulo 5, {|Φn i}. Consideramos a perturbação √ Ŵ = λ m~ω 3 X̂ . (11.1.43) Analisemos primeiro a solução exacta. O Hamiltoniano total Ĥ(λ) = Ĥ0 + Ŵ pode ser escrito mω 2 P̂ 2 + Ĥ(λ) = 2m 2 X̂ + λ r !2 ~ ω~ 1̂ − λ2 1̂ . mω 2 Concluimos imediatamente que o espectro de Ĥ é 1 − λ2 En (λ) = n + ~ω, 2 n ∈ N0 . (11.1.44) (11.1.45) Para calcularmos as novas funções próprias notamos que o efeito da perturbação consiste, para além da adição de uma energia ao Hamiltoniano, numa translação r ~ X̂ → X̂ + λ 1̂ . mω O Hamiltoniano Ĥ(λ) é ainda um problema harmónico canónico (a menos da soma de uma energia) quando interpretado em termos da posição transladada, dado que o operador momento pode ainda ser interpretado como o momento canónico conjugado da posição 354 Métodos perturbativos independentes e dependentes do tempo transladada. Recordamos que o operador translação foi definido no Problema 8 da folha de problemas 5, como sendo T̂∆x , com acção T̂∆x f (x) = f (x + ∆x) , (11.1.46) e com representação T̂∆x = ei∆xP̂ /~ . (11.1.47) p p Usando ∆x = λ ~/mω e, de (5.1.4), P̂ = −i mω~/2(â − â† ), obtemos, em termos de operadores de criação e destruição √ † )/ T̂∆x = eλ(â−â 2 . (11.1.48) Logo, as funções próprias de Ĥ(λ), |Ψn (λ)i, podem ser obtidas pela acção da translação em |Φn i: √ † )/ |Ψn (λ)i = eλ(â−â 2 |Φn i , ou, usando (5.1.30), (5.1.31) e expandindo a exponencial em série de Taylor, r r n n+1 |Φn−1 i − λ |Φn+1 i + O(λ2 ) . |Ψn (λ)i = |Φn i + λ 2 2 (11.1.49) (11.1.50) Vamos agora usar a teoria de perturbações estacionárias para reproduzir os resultados (11.1.45) e (11.1.50). Começamos por escrever a perturbação Ŵ em termos dos operadores de destruição e criação, usando (5.1.4): r ~ X̂ = (â + â† ) 2mω ⇒ ~ω Ŵ = λ √ (â + â† ) . 2 (11.1.51) Claramente, a perturbação mistura o estado |Φn i apenas com |Φn−1 i e |Φn+1 i; os únicos elementos de matriz da perturbação não nulos são r r n+1 n hΦn+1 |Ŵ |Φn i = λ~ω , hΦn−1 |Ŵ |Φn i = λ~ω . 2 2 Logo, usando (11.1.27), En (λ) em ordem 2 é ~ω 1 − λ2 + O(λ3 ) . En (λ) = ~ω n + 2 2 (11.1.52) (11.1.53) 11.1 Teoria das perturbações estacionárias 355 Nesta ordem obtemos o resultado exacto (11.1.45); pode-se demonstrar que todos os termos de ordem superior a 2 são de facto zero. Usando (11.1.22) obtemos r r n n+1 |Φn−1 i − λ |Φn+1 i + O(λ2 ) , |Ψn (λ)i = |Φn i + λ 2 2 (11.1.54) em acordo com (11.1.50) nesta ordem. Perturbação por um potencial quadrático Perturbamos agora (11.1.41) por um potencial quadrático Ŵ = λ mω 2 2 X̂ . 2 (11.1.55) Obviamente, o Hamiltoniano total é o de um oscilador harmónico canónico com frequência √ ω 1 + λ. Como tal, o espectro de energias é λ λ2 1 En (λ) = ~ω n + 1+ − + ... . (11.1.56) 2 2 8 Podemos também relacionar os operadores de criação e destruição na presença da perturbação e na ausência da perturbação. Como a relação entre eles é complexa, vamos restringir a nossa análise ao espectro. Para usarmos a teoria de perturbações escrevemos a perturbação em termos de operadores de criação e destruição, Ŵ = λ ~ω (â† )2 + ââ† + â† â + (â)2 , 4 de onde se conclui que os elementos de matriz não nulos são λ~ω 1 hΦn |Ŵ |Φn i = n+ , 2 2 λ~ω p λ~ω p hΦn+2 |Ŵ |Φn i = (n + 1) (n + 2) , hΦn−2 |Ŵ |Φn i = n (n − 1) . 4 4 (11.1.57) (11.1.58) Logo, usando (11.1.27), En (λ) em ordem 2 é 2 2 (n + 1)(n + 2) n(n − 1) λ~ω 1 λ~ω λ~ω 1 + n+ − + En (λ) = ~ω n + 2 2 2 4 2~ω 4 2~ω 2 1 λ λ = ~ω n + 1+ − + . . . + O(λ3 ) , 2 2 8 (11.1.59) em acordo com o cálculo exacto (11.1.56). 356 Métodos perturbativos independentes e dependentes do tempo Perturbação por um potencial cúbico Perturbamos agora (11.1.41) por um potencial cúbico r m3 ω 5 3 X̂ . Ŵ = λ ~ (11.1.60) No problema clássico, x(t) deixa de ser sinusoidal, aparecendo uma série de harmónicos da frequência fundamental; o perı́odo deixa de ser independente da energia e o movimento deixa de ser simétrico relativamente à origem. Relativamente ao problema quântico começamos por exprimir a perturbação em termos de operadores de criação e destruição. Usando (11.1.51) obtemos, usando as relações de comutação entre â, â† e o operador de número N̂ = â† â, ~ω Ŵ = λ √ â3 + (â† )3 + 3N̂ â† + 3(N̂ + 1)â . 8 (11.1.61) Com esta forma é simples concluir que os únicos elementos de matriz não nulos para a perturbação são λω~ p λω~ p hΦn+3 |Ŵ |Φn i = √ (n + 1)(n + 2)(n + 3) , hΦn−3 |Ŵ |Φn i = √ n(n − 1)(n − 2) , 8 8 3λω~ 3λω~ hΦn+1 |Ŵ |Φn i = √ (n + 1)3/2 , hΦn−1 |Ŵ |Φn i = √ n3/2 . 8 8 (11.1.62) Usando (11.1.27), verificamos que a contribuição de primeira ordem para En (λ) é zero; levando em conta a contribuição de segunda ordem obtemos 2 15 2 1 7 1 − λ ω~ n + − λ2 ω~ + O(λ3 ) . En (λ) = ~ω n + 2 4 2 16 (11.1.63) Em segunda ordem, a perturbação diminui a energia de todos os nı́veis. Quanto mais elevado for o nı́vel maior a diminuição de energia. Note-se que, como tal, nı́veis consecutivos já não são equidistantes. Usando (11.1.22) obtemos, para os estados de Ĥ, em primeira ordem, r r λ (n + 1)(n + 2)(n + 3) λ n(n − 1)(n − 2) |Ψn (λ)i = |Φn i − |Φn+3 i + |Φn−3 i 3 8 3 8 r r n3 (n + 1)3 |Φn−1 i − 3λ |Φn+1 i + O(λ2 ) . +3λ 8 8 (11.1.64) 11.1 Teoria das perturbações estacionárias 357 O efeito da perturbação é misturar o estado |Φn i com os estados |Φn+3 i, |Φn−3 i, |Φn+1 i e |Φn−1 i. 11.1.4 Estrutura fina do átomo de Hidrogénio Como aplicação da teoria de perturbações estacionárias vamos estudar a estrutura fina e hiperfina2 do átomo de Hidrogénio. Como discutido na secção 9.2, o Hamiltoniano usado para descrever o átomo de Hidrogénio no capı́tulo 6, Ĥ0 , é apenas aproximado, dado que negligencia todos os efeitos relativistas, em particular os efeitos magnéticos e de spin, para além de não considerar o spin nuclear. Estes efeitos são necessários para explicar os espectros observados; de facto, embora conduzam a apenas pequenas alterações do espectro estudado no capı́tulo 6, a enorme precisão da espectroscopia evidencia claramente estas alterações. Sendo pequenas podemos usar teoria de perturbações para as estudar. O Hamiltoniano de estrutura fina O Hamiltoniano de estrutura fina pode ser obtido directamente da equação de Dirac. Embora esta equação possa ser resolvida exactamente para um potencial de Coulomb, é instrutivo considerar uma análise perturbativa, que evidencia a interpretação fı́sica de cada um dos termos no problema. O operador Hamiltoniano que descreve o átomo de Hidrogénio, incluindo os termos responsáveis pela estrutura fina, toma a seguinte forma: Ĥ = me c2 1̂ + Ĥ0 + Ŵmv + ŴSO + ŴD . (11.1.65) Consideremos os vários termos individualmente: • me c2 é a energia associada à massa em repouso do electrão; • Ĥ0 é o Hamiltoniano considerado no capı́tulo 6; este leva apenas em conta o termo cinético não relativista e o potencial de Coulomb Ĥ0 = 2 1 e2 P̂ 2 − . 2me 4πǫ0 r A estrutura hiperfina será descrita nas aulas teórico-práticas se houver tempo para tal. (11.1.66) 358 Métodos perturbativos independentes e dependentes do tempo Note-se, que neste termo, o facto de a massa do protão ser finita pode ser levado em consideração substituindo me pela massa reduzida do sistema protão-electrão µ. • Ŵmv é a primeira correcção relativista ao termo cinético: Ŵmv = − P̂ 4 . 8m3e c2 (11.1.67) Este termo é fácil de obter considerando a expressão relativista para a energia s p p~2 ~p2 p~4 2 2 2 2 2 E = c p~ + me c = me c 1 + 2 2 = me c 1 + − + ... ; me c 2m2e c2 8m4e c4 (11.1.68) os três primeiros termos me c2 , p ~2 2me 4 e − 8mp~3 c2 , correspondem a três dos termos pree sentes em (11.1.65): a energia correspondente à massa em repouso, o termo cinético não relativista presente em Ĥ0 e a primeira correcção relativista à energia cinética que resulta da variação da massa com a velocidade. Para estimarmos a ordem de magnitude relativa entre Ŵmv e Ĥ0 estimamos o último pelo termo cinético: |Ŵmv | |Ĥ0 | = |~ p4 | 8m3e c2 |~ p2 | 2me v 2 |~p2 | ∼ α2 ≃ ∼ 2 2 ∼ me c c 1 137 2 , (11.1.69) onde usamos a relação (9.2.2). Como as energias do espectro não perturbado são da ordem de |Ĥ0 | ∼ 10 eV , a perturbação será da ordem de |Ŵmv | ∼ 10−3 eV , o que justifica o uso de teoria de perturbações. • ŴSO é o acoplamento spin-órbita: ŴSO = 1 dV (R̂) ~ ~ L̂ · Ŝ . 2m2e c2 R̂ dR̂ (11.1.70) A origem fı́sica deste termo pode ser compreendida pela seguinte análise clássica: o electrão move-se com velocidade ~v no campo eléctrico do protão. Logo vê um campo magnético que pode ser estimado pela transformação de Lorentz do campo ~ electrostático do protão E ~ ′ ≃ − ~v × E ~ . B c2 (11.1.71) 11.1 Teoria das perturbações estacionárias 359 Como o electrão tem um dipolo magnético que resulta do seu spin, existe uma interação do tipo ′ WSO ~v 1 dV ~r e ~ ′ ~ S · − 2× − . = −~µS · B = − 2 2me c e dr r (11.1.72) ~ obtemos Usando a definição clássica de momento angular me~v × ~r = −L ′ WSO = 1 m2e c2 r dV ~ ~ L·S . dr (11.1.73) A menos de um factor de 1/2, este é o acoplamento spin-órbita. O factor de 1/2 é devido à nossa estimativa do campo magnético produzido pelo núcleo assumir um movimento rectilı́neo, o que não acontece. O movimento não rectilı́neo origina uma precessão do spin electrónico - Precessão de Thomas; quando levada em consideração o factor de 1/2 surge naturalmente. Estimemos agora a ordem de grandeza deste termo, relativamente a Ĥ0 , usando para este último o termo potencial, estimando ~ ∼~, L ~ ∼~, S temos |ŴSO | |Ĥ0 | = r ∼ a0 = e2 ~2 8πǫ0 m2e c2 a30 e2 4πǫ0 a0 ~ , cme α ∼ dV e2 , ∼ dr 4πǫ0 a20 ~2 ∼ α2 . m2e c2 a20 (11.1.74) Este termo é, portanto, da ordem da mesma ordem de grandeza de Ĥmv . • ŴD é o termo de Darwin: ŴD = ~2 ∆V (R̂) . 8m2e c2 (11.1.75) A origem fı́sica deste termo pode ser compreendida da seguinte maneira. Na equação de Dirac a interacção entre o campo do núcleo e o electrão é local, isto é, o electrão é afectado pelo potencial no ponto onde se encontra, ~r. Na aproximação não relativista, no entanto, a expansão em v/c origina uma interacção não local, isto é, o electrão é afectado pelo campo do protão num certo volume, centrado em ~r. Esse volume é da 360 Métodos perturbativos independentes e dependentes do tempo ordem de (~/me c)3 , onde λ = ~/mc é o comprimento de onda de Compton.3 Assim, a energia potencial não é apenas V (~r), mas toma a forma Z Energia potencial ∼ d3 ρf (ρ)V (~r + ρ) , (11.1.76) onde a função f (ρ) tem as seguintes propriedades: i) depende apenas de |ρ|, dado que o potencial tem simetria esférica; ii) tem suporte num volume da ordem de (~/me c)3 , R centrado em ρ = 0; iii) d3 ρf (ρ) = 1. Considerando uma expansão em série de Taylor, de V (~r + ρ) e notando que o integral do termo de ordem um é nulo devido à simetria esférica obtemos que a energia potencial fica Z ρ2 3 d ρf (ρ) V (~r) + ∆V (~r) + . . . . 2 (11.1.77) O primeiro termo é o termo potencial de Ĥ0 ; o segundo termo tem a forma Z ∆V (~r) d3 ρρ2 f (ρ) ∼ ∆V (~r)(~/me c)2 , que, a menos de um factor numérico tem a forma do termo de Darwin. Para estimar a ordem de grandeza do termo de Darwin relativamente a Ĥ0 notamos que, usando (10.2.7) o termo pode ser reescrito ~2 e2 ~2 e2 1 ŴD = − 2 2 = ∆ δ(R̂) . 8me c (4πǫ0 ) 8m2e c2 ǫ0 R̂ (11.1.78) O valor esperado deste operador num estado próprio de Ĥ0 é hŴD i = ~2 e2 |Ψ(0)|2 . 8m2e c2 ǫ0 (11.1.79) Imediatamente concluimos que o termo de Darwin só afecta electrões em orbitais s, pois de acordo com os resultados do capı́tulo 6 (ver por exemplo tabela na secção 3 Uma maneira de pensar neste comprimento de onda é a seguinte: tal como o comprimento de onda de de Broglie de uma partı́cula de massa m e com velocidade v, λdB = ~/mv nos dá a escala na qual o carácter ondulatório de uma partı́cula quântica não pode ser negligenciado, o comprimento de onda de Compton da mesma partı́cula λC = ~/mc dá-nos uma escala para a qual os efeitos relativistas não podem, igualmente, ser negligenciados. Claramente λC < λdB . Na teoria de Dirac, a origem fı́sica do termo de Darwin é um fenómeno denominado zitterbewegung que consiste no facto de que o electrão não se move suavemente, mas sofre flutuações de pequena escala (da ordem de λC ) extremamente rápidas; assim, ao fazermos uma expansão em v/c o electrão vê efectivamente o potencial de Coulomb do núcleo espalhado por uma vizinhança da ordem de λC . 11.1 Teoria das perturbações estacionárias 361 6.4, ou expressão (7.2.63)) estas são as únicas para as quais Ψ(0) 6= 0. Como |Ψ(0)|2 é uma densidade de probabilidade estimamos o seu valor por |Ψ(0)|2 ∼ 1/a30 . Logo |ŴD | |Ĥ0 | = e2 ~2 8m2e c2 a30 ǫ0 p2 2me ∼ me c2 α4 ∼ α2 , me c2 α2 (11.1.80) tal como para os termos anteriores. A estrutura fina do nı́vel N = 2 Vamos exemplificar o efeito da perturbação a Ĥ0 dada em (11.1.65) calculando a estrutura fina do nı́vel N = 2 do átomo de Hidrogénio.4 Recordamos que o espectro deste átomo (6.4.23) depende apenas do número quântico principal 0 EN =− ~2 1 me c2 2 = − α . 2me a20 N 2 2N 2 (11.1.81) Assim, o nı́vel 2s (N = 2, ℓ = 0) e o nı́vel 2p (N = 2, ℓ = 1) têm a mesma energia, dada por E20 me c2 2 =− α . 8 (11.1.82) Para além desta degenerescência, concluimos no capı́tulo 6, que o nı́vel p é ele próprio degenerado, pois o momento angular ℓ = 1 pode ter momento angular azimutal descrito por mℓ = −1, 0, 1. Mas no capı́tulo 6 foi negligenciado o spin. Considerando também o spin, quer do electrão quer do protão, cado um dos 4 nı́veis anteriores tem uma degenerescência adicional de 4. Assim, uma base para o espaço de estados de cada uma das orbitais será: • Orbital 2s: {|N = 2, ℓ = 0, mℓ = 0, mS = ±; mI = ±i}; onde mS refere-se ao spin electrónico e mI ao spin do protão; • Orbital 2p: {|N = 2, ℓ = 1, mℓ = −1, 0, 1, mS = ±; mI = ±i}. A degenerescência total do nı́vel N = 2 é então 4 + 12 = 16. De acordo com os resultados vistos na secção 11.1 para perturbações de um nı́vel degenerado, necessitamos de diagonalizar a perturbação Ŵ neste sub-espaço 16 dimensional. Os 4 Nota: Para o nı́vel N = 1 a perturbação associada à estrutura fina produz apenas uma correcção global ao nı́vel e não levanta a degenerescência. Assim é mais interessante estudar o nı́vel N = 2. 362 Métodos perturbativos independentes e dependentes do tempo valores próprios nesta diagonalização serão as correcções de primeira ordem das energias; os vectores próprios correspondentes serão os vectores próprios de ordem zero. Consideremos então a perturbação Ŵf = Ŵmv + ŴSO + ŴD , (11.1.83) que será responsável pela chamada “estrutura fina”. O cálculo desta estrutura é facilitado pelas duas seguintes observações: i) Dado que esta perturbação não actua no spin do protão, este grau de liberdade pode ser ignorado para a estrutura fina. Assim sendo, a dimensão do espaço degenerado associado a N = 2 reduz-se efectivamente a 8; ii) A perturbação comuta com o momento angular total, [L̂2 , Ŵf ] = 0. De facto L̂2 comuta com Ŵmv pois [L̂2 , P̂ 2] = 0 ⇒ [L̂2 , P̂ 4 ] = 0 ; L̂2 comuta com ŴSO pois [L̂2 , f (R̂)] = 0 , ~ [L̂2 , L̂] = 0 , ~ [L̂2 , Ŝ] = 0 , onde f (R̂) é uma função arbitrária de R̂; devido à primeira relação na última equação L̂2 comuta com ŴD . Logo, Ŵf não mistura estados 2s com estados 2p e a matriz de 8 × 8 que representa Ŵf parte-se numa matriz de 2 × 2 que actua nos estados 2s e uma matriz de 6 × 6 que actua nos estados 2p. De facto é fácil verificar que Ŵf é um operador par e como tal não poderia misturar estados com paridade diferente, como é o caso de estados s e estados p. Consideramos seguidamente e separadamente as representações matriciais de Ŵf que actuam em estados 2s e estados 2p. Estrutura fina para o nı́vel 2s Consideramos a base {|N, ℓ, mℓ , mS i = |2, 0, 0, ±i}. Ŵmv e ŴD não actuam no grau de liberdade de spin, mS . Logo estes operadores são proporcionais ao operador identidade no espaço de spin. Os coeficientes de proporcionalidade serão dados por elementos de matriz puramente orbitais, respectivamente, hŴmv i2s = − 1 h2, 0, 0|P̂ 4|2, 0, 0i , 8m3e c2 hŴD i2s = ~2 h2, 0, 0|∆V (R̂)|2, 0, 0i . 8m2e c2 (11.1.84) 11.1 Teoria das perturbações estacionárias 363 Por outro lado, os elementos de matriz de ŴSO são nulos; de facto hŴSO i2s ∝ h2, 0, 0, ±|L̂x,y,z |2, 0, 0, ±i = 0 , pois qualquer componente do momento angular tem valor esperado nulo no harmónico esférico com ℓ = 0 = mℓ . Assim, o efeito dos termos de estrutura fina nos estados 2s é alterar a sua energia para E2s = − me c2 2 α + hŴmv i2s + hŴD i2s . 8 (11.1.85) Calculemos explicitamente estes elementos de matriz. Para calcular hŴmv i2s notamos que Ĥ0 = P̂ 2 + V (R̂) 2me ⇒ P̂ 2 = 2me (Ĥ0 − V (R̂)) . Logo 2 4m2e e4 2E20 e2 1 1 1 0 2 hŴmv i2s = − 3 2 h Ĥ0 − V (R̂) i2s = − (E2 ) + h i2s + h i2s . 8me c 2me c2 4πǫ0 R̂ (4πǫ0 )2 R̂2 (11.1.86) Para calcular os valores esperados h1/R̂n i2s , recordamos que a parte radial da função de onda do estado 2s é (6.4.33) 2 f(2,0) (r) = (2a0 )3/2 r e−r/2a0 . 1− 2a0 (11.1.87) Como tal h 1 R̂n i2s = Z +∞ 0 Notando que   1 , 2  2 r 4 r 4a0 1− e−r/a0 n dr = 1 3  (2a0 ) 2a0 r  , 4a20 a0 ≡ 4πǫ0 ~2 , me e2 a0 α = n=1, (11.1.88) n=2. ~ , me c obtemos me c2 α4 1 13 1 1 hŴmv i2s = − =− − + me c2 α4 . 2 64 16 4 128 (11.1.89) Para calcular hŴD i2s recordamos (11.1.79); logo hŴD i2s = ~2 e2 1 4 me c2 α4 ~2 e2 2 |Ψ(0) | = = , 2s 8m2e c2 ǫ0 8m2e c2 ǫ0 4π (2a0 )3 16 (11.1.90) 364 Métodos perturbativos independentes e dependentes do tempo √ onde usamos (11.1.87) bem como o harmónico esférico Y00 = 1/ 4π. Finalmente podemos juntar os resultados e concluir que a energia dos estados 2s, levando em conta a perturbação da estrutura fina é 2 5 4 α 6 2 + α + O(α ) . E2s = −me c 8 128 (11.1.91) Estrutura fina para o nı́vel 2p Os termos Ŵmv e ŴD não actuam nas variáveis de spin e comutam com as várias ~ componentes de L̂. Logo, no sub-espaço associado aos 6 nı́veis 2p (ignorando o spin do protão), os termos Ŵmv e ŴD serão proporcionais ao operador identidade neste espaço. Para ŴD a constante de proporcionalidade é zero, dado que este termo tem valor esperado não nulo apenas em órbitais s: hŴD i2p = 0 . (11.1.92) O valor de hŴmv i2p pode ser calculado de um modo análogo a hŴmv i2s ; para este cálculo necessitamos da função radial para a orbital 2p que é dada por f(2,1) (r) = 1 r −r/2a0 √ e , (2a0 )3/2 3 a0 (11.1.93) com a qual se conclui que 1 1 h i2p = , 4a0 R̂ h 1 R̂2 i2p = 1 . 12a20 (11.1.94) Usando uma fórmula análoga a (11.1.86) com 2s substituido por 2p obtem-se que hŴmv i2p = − 7 me c2 α4 . 384 (11.1.95) Consideramos agora o termo de spin-órbita. Temos de calcular elementos de matriz do tipo 1 e2 1 ~ ~ hN = 2, ℓ = 1, s = , m′ℓ , m′S | L̂ · Ŝ|N = 2, ℓ = 1, s = , mℓ , mS i . (11.1.96) 2 2 8πǫ0 m2e c2 R̂3 Nestes elementos de matriz podemos separar a parte radial, usando a representação |~ri: e2 1 1 1 ~ ~ h i2p hℓ = 1, s = , m′ℓ , m′S |L̂ · Ŝ|ℓ = 1, s = , mℓ , mS i . 2 2 8πǫ0 me c R̂3 2 2 (11.1.97) 11.1 Teoria das perturbações estacionárias 365 Usando (11.1.93) conclui-se que h 1 R̂3 i2p = 1 , 24a30 de onde se conclui que os elementos de matriz sob consideração podem ser escritos 1 1 α4 ~ ~ me c2 hℓ = 1, s = , m′ℓ , m′S |L̂ · Ŝ|ℓ = 1, s = , mℓ , mS i . 2 48~ 2 2 (11.1.98) ~ ~ O problema reduz-se agora a diagonalizar o operador L̂· Ŝ neste espaço 6 dimensional, o que é automaticamente conseguido se usarmos uma base diferente. A base usada em (11.1.98), no espaço ℓ = 1, s = 1/2, é uma base própria de L̂2 , Ŝ 2 , L̂z e Ŝz . Se introduzirmos o momento angular total (tal como na secção 9.5) ~ˆ ~ ~ J = L̂ + Ŝ , (11.1.99) podemos introduzir a base própria dos operadores L̂2 , Ŝ 2 , Jˆ2 e Jˆz , 1 |ℓ = 1, s = , J, mJ i . 2 (11.1.100) A relação entre as duas bases é dada pelos coeficientes de Clebsch-Gordon, que nos permite traduzir entre elas sem dificuldade. Usando as regras de adição de momento angular, vistas na secção 9.5, J toma dois valores possı́veis: J = 1/2 e J = 3/2, com 2 e 4 valores de mJ associados, respectivamente. ~ ~ Mostramos agora que o operador L̂ · Ŝ está diagonalizado na base (11.1.100), tendo valor esperado diferente para diferentes valores de J. Para isso escrevemos Jˆ2 − L̂2 − Ŝ 2 ~ ~ ~ ~ , Jˆ2 = L̂2 + Ŝ 2 + 2L̂ · Ŝ ⇔ L̂ · Ŝ = 2 (11.1.101) ~ ~ o que demonstra que L̂·Ŝ pode ser escrito em termos de operadores que estão diagonalizados ~ ~ na base (11.1.100). Daqui resulta que é muito simples calcular os valores esperados de L̂ · Ŝ nesta base: 1 1 1 1 ~2 ~ ~ hℓ = 1, s = , J = , mJ |L̂ · Ŝ|ℓ = 1, s = , J = , mJ i = 2 2 2 2 2 3 3 −2− 4 4 = −~2 , (11.1.102) 366 Métodos perturbativos independentes e dependentes do tempo e 1 3 1 3 ~2 ~ ~ hℓ = 1, s = , J = , mJ |L̂ · Ŝ|ℓ = 1, s = , J = , mJ i = 2 2 2 2 2 15 3 −2− 4 4 ~2 . 2 (11.1.103) = Como afirmado anteriormente a correcção à energia irá depender de J, mas não de mJ . Esta é uma caracterı́stica genérica.5 Na notação dos espectroscopistas, introduzida na secção 6.4, adiciona-se por isso um sub-ı́ndice J à notação que tem vindo a ser usada. Assim, para os estados 2p existem agora os nı́veis 2p1/2 e 2p3/2 , enquanto que os estados 2s existe apenas o nı́vel 2s1/2 (tal como para o estado 1s existe apenas 1s1/2 ). O valor esperado nos nı́veis 2p1/2 e 2p3/2 da perturbação ŴSO é: hŴSO i2p1/2 = − α4 me c2 , 48 hŴSO i2p3/2 = α4 me c2 . 96 (11.1.106) Juntando os resultados (11.1.92), (11.1.95) e (11.1.106) obtemos os seguintes nı́veis de energia para os estados 2p: 2 2 α 7α4 α4 5α4 α 2 6 2 = −me c + + + + O(α ) , E2p1/2 = −me c 8 384 48 8 128 (11.1.107) que tem uma degenerescência 2. Curiosamente a correcção à energia devida a Ŵf é a mesma que para o nı́vel 2s1/2 (11.1.91). Esta degenerescência parece ser acidental, ao contrário da degenerescência em mJ que resulta da simetria esférica. No entanto, quando se considera a quantificação do campo electromagnético esta degenerescência é levantada pelo chamado desvio de Lamb; a energia do nı́vel 2s1/2 é então aumentada, relativamente à 5 De facto, a solução exacta, obtida da equação de Dirac, para a energia das orbitais do átomo de Hidrogénio é dada por   EN,J = me c2 1 + N −J − 2 1 2 −1/2 α  q 2  1 2 + (J + 2 ) − α2 , (11.1.104) onde se vê que existe apenas dependência em N e J. Fazendo uma expansão em potências de α obtém-se: α2 α4 N 3 6 + O(α ) . (11.1.105) EN,J = me c2 1 − − − 2N 2 2N 4 J + 21 4 Por exemplo, tomando N = 2, J = 1/2 obtém-se (11.1.91), que coincide com (11.1.107); tomando N = 2, J = 3/2, obtém-se (11.1.108). 11.1 Teoria das perturbações estacionárias 367 do nı́vel 2p1/2 por uma quantidade que é cerca de dez vezes menor que a separação entre os nı́veis 2p1/2 e 2p3/2 . O desvio de Lamb foi descoberto em 1949 e teve grande importância no desenvolvimento da Electrodinâmica Quântica. Para o nı́vel 2p3/2 obtem-se E2p3/2 = −me c 2 α2 7α4 α4 + − 8 384 96 = −me c 2 α2 α4 + + O(α6 ) 8 128 . (11.1.108) Note-se que a correcção ao nı́vel 2p3/2 é ligeiramente inferior à do nı́vel 2p1/2 , o que levanta parcialmente a degenerescência dos estados 2p. Como tal, se considerarmos a transição 2p −→ 1s, que corresponde à risca α da série de Lyman do espectro do hidrogénio (λ = 1216 ◦ A), esta risca, quando analisada com uma resolução suficiente, divide-se em duas riscas vizinhas   2p −→ 1s 1/2 1/2 2p −→ 1s ,  2p −→ 1s 3/2 1/2 que estão separadas por uma energia 4me c2 α4 /128 - figura 11.1. O espectro do Hidrogénio apresenta, de facto, uma estrutura fina. Energia 2 −me c2 α8 “ 2 ” α4 −me c2 α8 + 128 −me c2 “ 4 α2 + 5α 8 128 ” |0,0,+i |0,0,−i |1,0,+i |1,0,−i |1,1,+i 2p3/2 2s1/2 |1,1,−i 2p3/2 |1,−1,+i |1,−1,−i 2p3/2 2p3/2 2s1/2 2p1/2 2p1/2 Figura 11.1: Nı́vel N = 2 do átomo de hidrogénio. As linhas sólidas representam o espectro de Ĥ0 , que tem degenerescência 8, correspondente aos 8 estados possı́veis |ℓ, mℓ , ms i para N = 2. As linhas a tracejado representam o espectro com as correcções da estrutura fina. Há um levantamento parcial da degenerescência que passa a ser 4+4. Note que os estados corrigidos correspondem a combinações lineares dos estados não perturbados. 368 11.2 Métodos perturbativos independentes e dependentes do tempo Teoria das Perturbações dependentes do tempo O objectivo principal da teoria das perturbações estacionárias é a determinação da energia dos estados estacionários. Contudo, existem situações em que essa não é a informação mais importante. Consideremos, por exemplo, um estado excitado de um átomo. Sabese, experimentalmente, que o sistema decai para o estado fundamental ao fim de algum tempo. Isso significa que, na presença do acoplamento ao campo de radiação, o estado excitado não é um estado estacionário do Hamiltoniano. Habitualmente o que interessa é determinar a probabilidade de transição para o estado fundamental do átomo e não os estados estacionários do sistema átomo mais campo electromagnético. É o cálculo deste tipo de probabilidades que iremos descrever nesta secção. 11.2.1 Formulação do problema Consideremos um sistema fı́sico com Hamiltoniano Ĥ0 , estados estacionários {|Φn i} e espectro de energias {En }: Ĥ0 |Φn i = En |Φn i . (11.2.109) Assumimos que o espectro é discreto e não degenerado, de modo a facilitar a exposição; tomando os estados estacionários como normalizados temos hΦn |Φn′ i = δnn′ , X n |Φn ihΦn | = 1̂ . (11.2.110) Note-se que Ĥ0 é independente do tempo, de modo a que os estados |Φn i sejam realmente estados estacionários. No instante t = 0, uma pequena perturbação dependente do tempo é aplicada ao sistema. O Hamiltoniano toma então a forma: Ĥ(t) = Ĥ0 + Ŵ (t) , Ŵ (t) = λV̂ (t) , (11.2.111) onde introduzimos a constante adimensional λ ≪ 1 e a observável V̂ (t), que pode ser explicitamente dependente do tempo e é da mesma ordem de magnitude do que Ĥ0 . A perturbação é zero para t < 0. 11.2 Teoria das Perturbações dependentes do tempo 369 Assumimos que o sistema se encontra inicialmente no estado |Φi i, que é um estado estacionário de Ĥ0 com valor próprio Ei . Depois de aplicada a perturbação Ŵ (t), em t = 0, o sistema evolui, pelo que |Φi i deixará de ser, em geral, um estado estacionário do Hamiltoniano perturbado. O nosso objectivo é calcular a probabilidade Pif (t), de encontrar o sistema num outro estado estacionário de Ĥ0 , |Φf i, no instante t. Ou seja, pretendemos estudar as transições entre estados estacionários do Hamiltoniano não perturbado, que podem ser induzidas pela perturbação Ŵ (t) - figura 11.2. |Φi i Pif (t) t=0 |Φi i −→ |Φf i Ĥ0 Ĥ0 + Ŵ (t) Figura 11.2: Transição entre dois estados estacionários de Ĥ0 induzida por uma perturbação Ŵ (t). Conceptualmente o problema é simples: entre os instantes 0 e t a evolução do sistema é descrita pela equação de Schrödinger i~ h i d |Ψ(t)i = Ĥ0 + λV̂ (t) |Ψ(t)i ; dt (11.2.112) como esta é uma equação diferencial de primeira ordem, impondo a condição inicial |Ψ(t = 0)i = |Φi i , (11.2.113) a solução é única. A probabilidade que pretendemos calcular é: Pif (t) = |hΦf |Ψ(t)i|2 . (11.2.114) Assim, matematicamente, o problema consiste em resolver a equação de Schrödinger (11.2.112) com a condição inicial (11.2.113), o que em geral terá de ser feito perturbativamente. 11.2.2 Solução aproximada da equação de Schrödinger Como o cálculo de (11.2.114) envolve explicitamente os estados estacionários de Ĥ0 , vamos utilizá-los como base, isto é, vamos expandir o estado do sistema |Ψ(t)i na representação {|Φn i}, |Ψ(t)i = X n cn (t)|Φn i , cn (t) = hΦn |Ψ(t)i . (11.2.115) 370 Métodos perturbativos independentes e dependentes do tempo Obviamente, o Hamiltoniano não perturbado é representado nesta base por uma matriz diagonal hΦn |Ĥ0 |Φm i = En δnm , (11.2.116) enquanto que a observável Ŵ (t) tem elementos de matriz hΦn |Ŵ (t)|Φm i = Wnm (t) = λVnm (t) . (11.2.117) Introduzindo na equação de Schrödinger (11.2.112) a relação de fecho h i X d X |Φk ihΦk |Ψ(t)i = |Φk i hΦk |Ĥ0 |Ψ(t)i + hΦk |λV̂ (t)|Ψ(t)i i~ dt k k X d Vkp (t)cp (t) . ⇔ i~ ck (t) = Ek ck (t) + λ dt p (11.2.118) Estas equações ordinárias diferenciais de primeira ordem acopladas (pelos elementos de matriz da perturbação Vkp ) permitem-nos determinar, perturbativamente, os coeficientes ck (t). Vejamos como. Primeiro observamos que se λV̂ (t) = 0, as equações deixam de estar acopladas. Neste caso a solução é muito simples: cn (t) = bn e−iEn t/~ , (11.2.119) onde bn são constantes que dependem das condições iniciais. Por exemplo, com a condição (11.2.113), teremos bi = 1 e bj = 0 para j 6= i. Se λV̂ (t) não for zero mas ainda assim for muito pequeno (i.e. λ ≪ 1 sendo os elementos de matriz de V̂ (t) da ordem dos de Ĥ0 ), a solução deverá ser ainda próxima de (11.2.119). Tomamos como forma para esta solução cn (t) = bn (t)e−iEn t/~ , (11.2.120) e esperamos que bn (t) sejam funções que variam lentamente com o tempo. Inserindo (11.2.120) em (11.2.118) obtemos X d bn (t) e−iEn t/~ = λ Vnp (t)bp (t)e−iEp t/~ . i~ dt p (11.2.121) 11.2 Teoria das Perturbações dependentes do tempo 371 Multiplicando ambos os lados por eiEn t/~ e introduzindo a frequência angular de Bohr : ωnp = En − Ep , ~ X (11.2.122) obtemos i~ d bn (t) dt =λ Vnp (t)bp (t)eiωnp t . (11.2.123) p Este sistema de equações é rigorosamente equivalente à equação de Schrödinger, dado que ainda não introduzimos qualquer aproximação. Mas como em geral não conseguimos encontrar uma solução exacta de (11.2.123), teremos de recorrer a métodos de aproximação. Dado que λ ≪ 1 fazemos uma expansão em série de potências para bn (t) bn (t) = b0n (t) + λb1n (t) + λ2 b2n (t) + ... = +∞ X λk bkn (t) ; (11.2.124) k=0 esperamos que esta expansão convirja rapidamente, permitindo-nos truncá-la numa dada ordem para obter uma solução aproximada. Substituindo esta expansão em (11.2.123) obtemos +∞ i~ d X k k λ bn (t) dt k=0 ! = X Vnp (t) p +∞ X λk+1 bkp (t)eiωnp t ; (11.2.125) k=0 igualando as potências de λ temos: • Ordem λ0 : i~ d 0 b (t) = 0 . dt n (11.2.126) Isto é, b0n não depende do tempo. Este é o resultado esperado para λ = 0; • Ordem λk , k ≥ 1: i~ X d k bn (t) = Vnp (t)eiωnp t bpk−1 . dt p (11.2.127) Obtemos, pois, uma relação de recorrência: inserindo a solução de ordem zero em (11.2.127), obtemos a solução de primeira ordem, que por sua vez inserida no lado direito de (11.2.127) origina a relação de segunda ordem, etc. 372 Métodos perturbativos independentes e dependentes do tempo Examinemos em detalhe a solução até primeira ordem. Assumimos, tal como referido anteriormente, que para t < 0 o sistema se encontra no estado |Φi i. Em t = 0 existe uma descontinuidade no Hamiltoniano, pois t=0 Ĥ = Ĥ0 −→ Ĥ = Ĥ0 + λV̂ (t) ; mas dado que a descontinuidade é finita, a função de onda é contı́nua em t = 0. A condição inicial é bn (t = 0) = δni A equação (11.2.126) implica que ⇒    b0n (t = 0) = δni , (11.2.128)   bk (t = 0) = 0 , k ≥ 1 . n b0n (t) = δni , t≥0, (11.2.129) o que determina a solução de ordem zero. Introduzindo esta solução em (11.2.127) com k = 1 temos i~ X d 1 bn (t) = Vnp (t)eiωnp t δpi = Vni (t)eiωni t . dt p (11.2.130) Levando em conta a condição inicial b1n (t = 0) = 0, obtemos Z 1 t ′ 1 bn (t) = Vni(t′ )eiωni t dt′ . i~ 0 (11.2.131) Logo, o estado do sistema em primeira ordem em λ é    |Φi i , t < 0 ,   ! ( ) |Ψ(t)i = X Z t λ ′   e−iEn t/~ + O(λ2 ) |Φn i , Vni (t′ )eiωni t dt′  δni +  i~ n 0 t≥0. (11.2.132) Note que a função de onda está normalizada apenas em primeira ordem em λ. A perturbação mistura |Φi i com todos os outros estados próprios de Ĥ0 , |Φn i, para os quais Vni 6= 0. A probabilidade de transição para um estado final |Φf i é dada por Pif (t) = |hΦf |Ψ(t)i|2 = |hΦf | X n cn (t)|Φn i|2 = |cf (t)|2 (11.2.120) = |bf (t)|2 . (11.2.133) 11.2 Teoria das Perturbações dependentes do tempo 373 Queremos considerar uma transição induzida pela perturbação Ŵ (t); logo consideramos o estado final diferente do inicial. Em primeira ordem Z λ t ′ Vf i (t′ )eiωf i t dt′ + O(λ2 ) , bf (t) = 0 + i~ 0 e como tal 1 Pif (t) = 2 ~ Z (11.2.134) 2 t ′ Wf i (t′ )eiωf i t dt′ 0 , i 6= f . (11.2.135) Alguns comentários: • Para t fixo e considerando Pif como função de Ef , a probabilidade de transição é proporcional ao quadrado do módulo da transformada de Fourier da perturbação (à semelhança do que acontece com a aproximação de Born (10.2.28)); • A probabilidade de transição é zero, nesta ordem, se Wf i (t′ ) = 0, ∀t′ ∈ [0, t]; • A aproximação de primeira ordem resulta de substituir na equação de Schrödinger (11.2.123), bp (t) pelos seus valores em t = 0. É natural que esta seja uma boa aproximação para t pequeno, mas para t grande em princı́pio teremos de considerar termos de ordem λ2 , λ3 , etc, que deverão ser importantes. 11.2.3 Aplicação a uma perturbação sinusoidal ou constante Como aplicação do formalismo desenvolvido na secção anterior consideramos uma perturbação com uma das seguintes formas: V̂ (t) = V̂ sin ωt ∨ V̂ (t) = V̂ cos ωt , (11.2.136) onde V̂ é uma observável independente do tempo e ω é uma frequência angular constante. Este tipo de perturbação é a que se encontra, por exemplo, na interacção de uma onda electromagnética monocromática de frequência ω com um sistema fı́sico. Neste caso, Pif (t) representará a probabilidade de transição |Φi i −→ |Φf i induzida pela radiação incidente. Algo ingenuamente poderı́amos ser levados a pensar que esta transição seria possı́vel se e só se ω = ±ωf i . Isto é, que Pif para t fixo e como função de ω teria dois picos (tipo 374 Métodos perturbativos independentes e dependentes do tempo delta de Dirac) em ω = ±ωf i , sendo zero para outros ω. Contudo, devido ao princı́pio da incerteza a situação é um pouco diferente, como agora demonstramos. Na base dos estados estacionários do Hamiltoniano não perturbado, podemos escrever os elementos de matriz da primeira perturbação em (11.2.136) como hΦf |V̂ (t)|Φi i = hΦf |V̂ |Φi i sin ωt ≡ Vf i sin ωt = Vf i eiωt − e−iωt . 2i (11.2.137) Substituindo na fórmula geral (11.2.131) Z ′ ′ ei(ωf i +ω)t − ei(ωf i −ω)t ′ Vf i ei(ωf i +ω)t − 1 ei(ωf i −ω)t − 1 1 t 1 . Vf i dt = − − bf (t) = i~ 0 2i 2i~ ωf i + ω ωf i − ω (11.2.138) Usando (11.2.133), temos em primeira ordem Pif (t) = |bf (t)|2 = λ2 |b1f (t)|2 , (11.2.139) que no caso em estudo depende também do parâmetro da perturbação ω, pelo que escrevemos |Wf i |2 1 − ei(ωf i +ω)t 1 − ei(ωf i −ω)t Pif (t, ω) = ∓ 4~2 ωf i + ω ωf i − ω 2 . (11.2.140) O sinal inferior refere-se ao resultado do mesmo cálculo usando a segunda perturbação (V̂ (t) = V̂ cos ωt) em (11.2.136), em vez da primeira. Para uso posterior consideramos essa perturbação (i.e o cos) no limite ω = 0 em que obtemos uma perturbação constante, para a qual, o resultado é ω t |Wf i |2 sin2 f2i |Wf i |2 iωf i t 2 | = . Pif (t) = 2 2 |1 − e ωf i 2 ωf i ~ ~2 (11.2.141) 2 Vamos agora considerar dois casos distintos: 1) Quando ambos os estados |Φi i e |Φf i pertencem a um espectro discreto; 2) Quando |Φf i pertence a um contı́nuo de estados finais. No primeiro caso Pif representa uma probabilidade, enquanto que no segundo representa uma densidade de probabilidade. 11.2 Teoria das Perturbações dependentes do tempo 375 1) Perturbação sinusoidal que acopla dois estados discretos: um fenómeno de ressonância Fixemos o tempo t, de modo a considerarmos a probabilidade Pif (t, ω) como função apenas da frequência ω. A análise de (11.2.140) envolve analisarmos os termos t 1 − ei(ωf i ±ω)t i(ωf i ±ω)t/2 sin (ωf i ± ω) 2 = −ie . A± = ωf i ± ω (ωf i ± ω)/2 (11.2.142) Se ω ≃ ±ωf i , o denominador de A∓ fica aproximadamente zero. Se simultaneamente t for suficientemente elevado, o argumento do seno no numerador de A∓ não é aproximadamente zero. Nestas condições esperamos que A∓ domine em (11.2.140) sobre A± ; o primeiro e o último designam-se por, respectivamente, termo ressonante e termo anti-ressonante. Estabelecemos desde já, o seguinte critério quantitativo que comentaremos graficamente em baixo: se i) |ω ∓ ωf i | ≪ |ωf i| , ii) 1 ≪ t|ωf i | , (11.2.143) podemos negligenciar A± em (11.2.140); obtemos então: |Wf i |2 Pif (t, ω) ≃ 4~2 sin (ωf i ∓ ω) 2t (ωf i ∓ ω)/2 !2 . (11.2.144) Para t fixo representamos Pif (t, ω) em função de ω na figura 11.3, para ω ≃ ωf i . Notese o fenómeno de ressonância para Pif (t, ω) quando ω = ωf i . Para ω ≃ −ωf i existe um fenómeno semelhante de ressonância em ω = −ωf i , sendo o gráfico respectivo o simétrico relativamente ao eixo w = 0 da figura 11.3. Podemos compreender graficamente o significado das aproximações i) e ii) (11.2.143): i) significa que estamos a considerar o gráfico de Pif (t, ω) na região em que ω está próxima do pico (logo próxima de ωf i ); ii) significa que as zonas do gráfico de (11.2.140) em que A+ e A− dominam estão bem separadas; isto é 2|ωf i| ≫ ∆ω ⇔ |ωf i| ≫ 2π ⇔ |ωf i|t ≫ 1 . t Fisicamente, esta condição significa que temos de esperar tempo suficiente para o sistema perceber que a perturbação é sinusoidal. 376 Métodos perturbativos independentes e dependentes do tempo Figura 11.3: Probabilidade de transição Pif (t, ω) em função de ω para t fixo. Existe um fenómeno de ressonância quando ω = ωf i . A curva apresenta um “padrão de difracção”. Pif (t, ω) tem zeros em ωf i −ω = 2nπ/t; logo, a largura da ressonância, ∆ω, estimada como a distância entre os dois zeros de Pif (t, ω) que rodeiam o máximo é ∆ω = 4π/t (Extraı́do de Cohen et al, ‘Quantum Mechanics’). Notemos a diferente interpretação fı́sica das duas ressonâncias de Pif . A ressonância em ω = ωf i corresponde a um processo com Ef > Ei , ou seja a excitação do sistema pela absorção de um fotão enquanto que a ressonância em ω = −ωf i corresponde a um processo com Ef < Ei , ou seja o decaimento do sistema pela emissão de um fotão - figura 11.4. Ef |Φf i Ef γ γ Ei |Φf i |Φi i Ei |Φi i Figura 11.4: As ressonâncias para ω = ±ωf i têm interpretações de absorção (ω = ωf i ) esquerda - ou emissão (ω = −ωf i ) - direita - de um fotão. Comentários: • Pif (t, ω) tem máximos em ω = ±ωif , correspondendo à absorção/emissão de fotões 11.2 Teoria das Perturbações dependentes do tempo 377 com a frequência de Bohr; mas as ressonâncias têm largura, ∆ω, estimada como a distância entre os dois zeros de Pif (t, ω) que rodeiam o máximo. Esta largura pode ser entendida como uma manifestação da relação de incerteza para tempo e energia. Se tentassemos medir a diferença de energia Ef − Ei = ~ωf i , aplicando uma onda electromagnética, variando ω e tentando encontrar a ressonância, obteriamos uma incerteza na energia: ∆E = ~∆ω ≃ ~ 4π t ⇒ ∆E∆t & ~ , para uma perturbação que actuou um tempo ∆t. Logo, para medir a diferença de energia Ef − Ei com incerteza nula ∆E = 0, teriamos de deixar actuar a perturbação durante um tempo infinito. • No final da secção anterior comentamos que a aproximação de primeira ordem deixará de ser válida para t grande. No entanto, neste exemplo requeremos que t seja suficientemente grande na aproximação que usamos, o que poderá parecer incompatı́vel. De facto, que t não poderá ser demasiado grande é manifesto em que (de (11.2.144) usando limx→0 sin x/x) Pif (t; ω = ωf i ) = |Wf i |2 t2 4~2 t→+∞ −→ +∞ ; em particular a probabilidade torna-se maior do que 1, o que não faz sentido. Necessitamos por isso de impôr |Wf i |t ≪1; ~ o estudo das próximas ordens perturbativas revela que esta condição é, de facto, necessária, se bem que não suficiente, para garantir a validade da análise de primeira ordem aqui feita. • Analisando o gráfico da figura 11.3 vemos que a altura da ressonância depende de Wf i . Se a perturbação tiver elementos de matriz Wf i diferentes para diferentes linhas espectrais, podemos compreender porque é que algumas linhas espectrais são mais 378 Métodos perturbativos independentes e dependentes do tempo intensas do que outras. Esta era uma lacuna importante na teoria de Bohr (capı́tulo 2), que a Mecânica Quântica resolve. • No caso de uma perturbação constante, Pif (t, ω) é dado por (11.2.141) que tem uma ressonância para ω = 0 - figura 11.5, de modo a conservar a energia do sistema. Note-se que a largura da ressonância é a mesma que antes, mas a altura é 4 vezes superior, devido à interferência construtiva entre termo ressonante e anti-ressonante. Figura 11.5: Pif (t, ω) para t constante como função de ω (Extraı́do de Cohen et al, ‘Quantum Mechanics’). 2) Acoplamento entre estados de um espectro contı́nuo Se a energia Ef pertencer a uma zona contı́nua do espectro de Ĥ0 , temos de interpretar |hΦf |Ψi|2 como uma densidade de probabilidade. A probabilidade fı́sica é obtida integrando esta densidade de probabilidade sobre uma conjunto de estados finais. Esta integração introduz uma medida, denominada densidade de estados finais ρ(E), como explicamos com o seguinte exemplo. Consideramos o problema da difusão de uma partı́cula sem spin, de massa m por um potencial W (~r). No instante t, o estado |Ψ(t)i pode ser expandido na representação |~pi, correspondendo a estados com momento bem definido p~, energia E = p~2 /2m e função de 11.2 Teoria das Perturbações dependentes do tempo 379 onda espacial h~r|~pi = 1 2π~ 3/2 ei~p·~r/~ . Se o estado |Ψ(t)i estiver normalizado, a densidade de probabilidade associada ao momento ~p é d3 P(~p) = |h~p|Ψ(t)i|2 d3 ~p . Conceptualmente podemos, numa experiência, programar um detector para dar sinal quando a partı́cula difundida tiver um momento ~pf . Mas na prática, o detector terá uma abertura finita e o seu filtro de energia não será perfeito; dará sinal sempre que o momento da partı́cula difundida estiver num ângulo sólido δΩf , em torno de p~f e a sua energia num intervalo δEf centrada em p~2f /2m. Seja Df o domı́nio no espaço de momentos definido por estas condições. A probabilidade de obter um sinal do detector é Z δP(~pf , t) = |h~p|Ψ(t)i|2d3 p~ . p ~∈Df Mudamos a variável de integração de momento para energia: d3 p~ = p2 dpdΩ ≡ ρ(E)dEdΩ , onde, genericamente, ρ(E) é a densidade de estados finais. No exemplo que estamos a considerar, p2 E= 2m ⇒ logo identificando p2 dp ≡ ρ(E)dE lêmos ρ(E) = p2 dp = r m dE ; 2E √ dp = 2Em3 . dE (11.2.145) (11.2.146) Em termos de um integral na energia, a probabilidade de o detector dar sinal é Z δP(~pf , t) = |h~p|Ψ(t)i|2 ρ(E)dΩdE . (11.2.147) Ω∈δΩf ,E∈δEf A densidade de estados funciona pois como uma medida de integração. Consideramos agora o caso geral. Tomamos um contı́nuo de estados estacionários de Ĥ0 , rotulados por um conjunto de números quânticos que denotamos por α. Estes estados 380 Métodos perturbativos independentes e dependentes do tempo obedecem a hα|α′i = δ(α − α′ ) . A probabilidade de encontrar o sistema num dado grupo de estados finais, denominado Df , com um conjunto de valores de α centrados à volta de αf é Z δP(αf , t) = dα|hα|Ψ(t)i|2 . (11.2.148) α∈Df Tal como no exemplo anterior, mudamos de variável de integração para a energia, o que introduz uma medida de integração ρ(β, E), que é uma densidade de estados finais que pode depender de outros números quânticos que designamos genericamente por β (que existirão caso Ĥ0 não constitua, per se, o C.C.O.C.): dα = ρ(β, E)dβdE . Mudando da base {|αi} para a base {|β, Ei} e sendo o domı́nio Df caracterizado, na nova base, por β ∈ δβf e E ∈ δEf , a probabilidade (11.2.148) fica Z δP(αf , t) = dβdEρ(β, E)|hβ, E|Ψ(t)i|2 . (11.2.149) β∈δβf ,E∈δEf Usando esta expressão vamos agora deduzir um importante resultado para a probabilidade de transição por unidade de tempo, denominado Regra de Ouro de Fermi. Consideramos que o sistema se encontra num estado próprio |Φi i de Ĥ0 . Vimos anteriormente que para o caso de uma perturbação constante a probabilidade de transição |Φi i −→ |Φf i é (11.2.141): ω t |Wf i |2 sin2 f2i Pif (t) = , ωf i 2 ~2 (11.2.150) 2 que reescrevemos na forma |hΦf |Ψ(t)i|2 = |hΦf |Ŵ |Φi i|2 F (t, ωf i ) . ~2 (11.2.151) O cálculo que nos levou a esta fórmula permanece válido se em vez de calcular hΦf |Ψ(t)i tivessemos calculado hβ, E|Ψ(t)i, onde |β, Ei pertence a um contı́nuo de estados finais; neste caso o resultado é reescrito |hβ, E|Ŵ |Φi i|2 F |hβ, E|Ψ(t)i| = ~2 2 E − Ei . t, ~ (11.2.152) 11.2 Teoria das Perturbações dependentes do tempo 381 Usando (11.2.149) obtemos, para a probabilidade de transição de |Φi i para um conjunto de estados num domı́nio em torno do estado com energia Ef e outros números quânticos βf (isto é αf ) 1 δP(Φi , αf , t) = 2 ~ Z 2 β∈δβf ,E∈δEf dβdEρ(β, E)|hβ, E|Ŵ |Φi i| F E − Ei t, ~ . (11.2.153) Analisemos a função F E − Ei t, ~ ≡ E−Ei t 2~ 2 E−Ei 2~ sin2 , para t fixo em função de ωf i . Para t suficientemente grande, esta função pode ser aproximada por um delta de Dirac, centrado em E = Ei . De facto, uma das funções que aproxima um delta de Dirac é: δǫ (x) = ǫ sin2 xǫ , x2 δǫ (x) . ǫ→0 π δ(x) = lim Na figura 11.6 representamos δǫ (x) para diferentes valores de ǫ. Figura 11.6: δǫ (x) para ǫ = 1, 0.5, 0.25, respectivamente. Tomando ǫ = 1/t, x = (E − Ei )/2~, temos δ E − Ei 2~ Logo, para t elevado i t E − Ei 1 sin2 E−E 1 2~ = lim . = lim F t, E−Ei 2 t→∞ tπ t→∞ tπ ~ 2~ F E − Ei t, ~ ≃ tπδ E − Ei 2~ . 382 Métodos perturbativos independentes e dependentes do tempo Usando ainda que para a função delta de Dirac δ(cx) = 1 δ(x) , |c| obtemos, para t elevado, E − Ei ≃ 2~tπδ(E − Ei ) . F t, ~ (11.2.154) Vamos concentrar-nos numa perturbação constante e consideramos as seguintes aproximações: • t é suficientemente elevado para (11.2.154) ser uma boa aproximação; • t é suficientemente pequeno para o tratamento perturbativo de primeira ordem ser boa aproximação; isto significa que os coeficientes bnf (t) não variam demasiado rapidamente com t; concretamente, se considerarmos b1f (t), temos, por (11.2.131) e para uma perturbação constante Z Vf i t iωf i t′ ′ Vf i iωf i t/2 ωf i t 1 bf (t) = e dt = −2i e sin . i~ 0 ωf i 2 (11.2.155) Para esta quantidade não variar “demasiado rapidamente” tomamos ωf i t 2~ ≪ 1 ⇔ Ef − Ei ≪ , 2 t (11.2.156) que corresponde a frequência de Bohr pequena. Assim, depois de fixar t suficientemente grande para (11.2.154) ser uma boa aproximação tomamos Ef suficientemente próximo de Ei . • No pequeno intervalo de estados finais que resulta das condições da alı́nea anterior, assumimos que δβf é pequeno, pelo que a integração em β é desnecessária. Sob tais condições, (11.2.153) fica   δβ 2πt |hβ , E = E |Ŵ |Φ i|2 ρ(β , E = E ) , se E ∈ δE , f f i i f f i i f f ~ δP(Φi , αf , t) =  0 , se E ∈ / δE . i f (11.2.157) 11.2 Teoria das Perturbações dependentes do tempo 383 Ou seja, a perturbação constante só pode induzir transições entre nı́veis com a mesma energia, a menos de uma largura δEf igual a 2π~/t (estimada como a distância entre zeros consecutivos de F (t, (E − Ei )/~)), que resulta da incerteza tempo/energia. Como a probabilidade aumenta linearmente com o tempo6 , a probabilidade de transição por unidade de tempo é constante. A densidade de probabilidade de transição, por unidade de tempo e por unidade da variável βf é: p(Φi , αf ) = 2π d δP(Φi , αf , t) = |hβf , Ef = Ei |Ŵ |Φi i|2 ρ(βf , Ef = Ei ) . dt δβf ~ (11.2.158) Esta é a Regra de Ouro de Fermi (ou, mais correctamente Fermi-Dirac, pois foi Dirac quem fez grande parte do trabalho que levou a esta regra). Mais esquematicamente pi→f = 2π |Wf i |2 ρf . ~ (11.2.159) Note-se que esta regra se aplica a perturbações independentes do tempo, embora seja derivada usando o formalismo de teoria de perturbações dependentes do tempo. Existem muitas aplicações de importância da regra de ouro de Fermi nesta forma; mas a regra pode ser generalizada para perturbações dependentes do tempo. Por exemplo, se em vez de termos considerado a perturbação constante tivéssemos considerado uma perturbação sinusoidal (11.2.136), que acopla |Φi i a um contı́nuo de estados |βf , Ef i, com energias próximas de Ei + ~ω, terı́amos obtido p(Φi , αf ) = π |hβf , Ef = Ei + ~ω|Ŵ |Φi i|2 ρ(βf , Ef = Ei + ~ω) . 2~ (11.2.160) Entre as aplicações da regra de ouro de Fermi encontram-se os cálculos de secção eficaz de difusão e probabilidades de decaimento (como o decaimento beta). Como exemplo de aplicação consideramos de seguida um cálculo de difusão. Exemplo: Derivação da aproximação de Born para a secção eficaz de difusão pela regra de ouro de Fermi. 6 O que será válido apenas para tempos pequenos e é o resultado esperado para uma perturbação constante. 384 Métodos perturbativos independentes e dependentes do tempo Consideramos a difusão de uma partı́cula por um potencial Ŵ , cujos elementos de matriz, na representação {|~ri} são dados por h~r|Ŵ |~r′ i = W (~r)δ(~r − ~r′ ) . Assumimos que o estado inicial do sistema é um estado próprio do momento: |Ψ(t = 0)i = |~pii . (11.2.161) Vamos calcular a probabilidade de transição desta partı́cula (i.e a difusão pelo potencial) para estados com momento p~ em torno de p~f (|~pi | = |~pf |) por unidade de tempo e de ângulo sólido. Pela regra de ouro de Fermi (11.2.158) p(~pi , ~pf ) = 2π |h~pf |Ŵ |~pi i|2 ρ(Ef = Ei ) ; ~ usamos h~pf |Ŵ |~pi i = = = Z Z Z Z d~rd~r′ h~pf |~rih~r|Ŵ |~r′ih~r′ |~pii ′ d~rd~r 3 Z 1 2π~ 1 2π~ 3/2 −i~ pf ·~ r/~ e 1 W (~r)δ(~r − ~r ) 2π~ ′ 3/2 ′ ei~pi ·~r /~ d~rei(~pi −~pf )·~r/~W (~r) ; e levando em consideração (11.2.146) obtemos Z 2 √ 2π i(~ pi −~ pf )·~ r /~ p(~pi , p~f ) = 2mE . m d~ r e W (~ r ) ~(2π~)6 (11.2.162) A secção eficaz diferencial de difusão foi definida por (10.1.1) dn = σ(θ, φ)FidΩ , (11.2.163) e portanto σ(θ, φ) = dn , Fi dΩ [σ] = L2 , que corresponde um “número de partı́culas detectadas por unidade de tempo, fluxo incidente e ângulo sólido”. Comparando com p(~pi , ~pf ) , [p] = 1 , T 11.2 Teoria das Perturbações dependentes do tempo 385 que corresponde a uma “probabilidade de transição por unidade de tempo e ângulo sólido”, concluimos que para identificar p(~pi , p~f ) com σ(θ, φ) necessitamos de dividir a primeira quantidade por um “fluxo”. O candidato natural é o vector densidade de corrente de probabilidade J~i para as partı́culas incidentes: ~ 1 1 ∗ ~ [J~] = [Fluxo] = . Ji (~r) = Re Φ (~r) ∇Φ(~r) , m i T L2 Para Φ(~r) = 1 2π~ 3/2 (11.2.164) ei~pi ·~r/~ , obtemos J~i = p~i m(2π~)3 |J~i| = ⇒ Assim m2 p(~pi , ~pf ) = 2 4 4π ~ |J~i | Z p 1 2Ei m . m(2π~)3 2 d3~rei(~pi −~pf )·~r/~W (~r) , (11.2.165) que coincide com a fórmula para σ(θ, φ) na aproximação de Born (10.2.28). 11.2.4 Probabilidade de transição via operador de evolução A probabilidade de transição (11.2.135), pode ser obtida por um outro método que tem a vantagem de se tornar mais simples em ordens superiores à primeira. A razão é que este outro método emprega uma técnica de diagramas, bastante intuitivos, para construir as amplitudes de transição em cada ordem. O método em questão, que iremos agora estudar, usa o operador de evolução Û(t, t0 ), introduzido na secção 4.5.3, para deduzir a probabilidade de transição Pif (t). Este método levará naturalmente a uma interpretação gráfica da série perturbativa, no espı́rito dos diagramas de Feynman usados em Teoria Quântica de Campo. Com este objectivo começaremos por discutir as várias representações da Mecânica Quântica. As representações de Schrödinger, Heisenberg e Interacção O formalismo com que temos estudado a Mecânica Quântica contém: • Operadores (observáveis) genericamente independentes do tempo: R̂, P̂ , etc. 386 Métodos perturbativos independentes e dependentes do tempo • Um estado genericamente dependente do tempo, |Ψ(t)i, que nesta secção denotamos |ΨS (t)i. A evolução do sistema está inteiramente contida na evolução do estado |ΨS (t)i e é determinada pela equação de Schrödinger; por isso este formalismo é denominado representação de Schrödinger. O operador de evolução Û (t, t0 ) depende do tempo e podemos usa-lo para construir um formalismo em que: • Operadores (observáveis) serão dependentes do tempo; • O estado será independente do tempo, sendo denotado por |ΨH i; Este formalismo é denominado representação de Heisenberg. A unitariedade do operador de evolução garante que as previsões da Mecânica Quântica (probabilidades e valores esperados) feitas nas duas representações são perfeitamente equivalentes. Para confirmarmos que assim é consideremos, mais explicitamente, a relação entre os dois formalismos. Por definição, o operador de evolução relaciona o estado do sistema em dois instantes diferentes do seguinte modo: |ΨS (t)i = Û (t, t0 )|ΨS (t0 )i . (11.2.166) O estado na representação de Heisenberg é introduzido como |ΨH i ≡ |ΨS (t0 )i = Û † (t, t0 )|ΨS (t)i , (11.2.167) onde usamos a unitariedade do operador de evolução. Isto é, o estado na representação de Heisenberg é o estado inicial na representação de Schrödinger e como tal é independente do tempo. Consideramos agora um operador genérico na representação de Schrödinger, que poderá ou não depender do tempo e que denotamos por ÂS (t). O seu valor esperado no estado |ΨS (t)i é dado por hÂi(t) = hΨS (t)|ÂS (t)|ΨS (t)i = hΨS (t0 )|Û † (t, t0 )ÂS (t)Û(t, t0 )|ΨS (t0 )i . (11.2.168) 11.2 Teoria das Perturbações dependentes do tempo 387 Na representação de Heisenberg, a mesma observável será representada pelo operador ÂH (t), e o seu valor esperado será hÂi(t) = hΨH |ÂH (t)|ΨH i . (11.2.169) Requerendo que (11.2.168) e (11.2.169) sejam equivalentes obtemos ÂH (t) = Û † (t, t0 )ÂS (t)Û (t, t0 ) , (11.2.170) que genericamente depende do tempo, mesmo que ÂS não dependa. Calculemos agora a evolução temporal de um operador na representação de Heisenberg. Como cálculo preliminar derivamos (11.2.166) em ordem ao tempo d d i~ |ΨS (t)i = i~ Û (t, t0 ) |ΨS (t0 )i , dt dt (11.2.171) dado que |ΨS (t0 )i não depende do tempo; substituindo o lado esquerdo pelo uso da equação de Schrödinger na forma i~ d |ΨS (t)i = ĤS (t)Û (t, t0 )|ΨS (t0 )i , dt (11.2.172) obtém-se 1 d Û(t, t0 ) = ĤS (t)Û(t, t0 ) . dt i~ (11.2.173) d † 1 Û (t, t0 ) = − Û † (t, t0 )ĤS (t) . dt i~ (11.2.174) A equação adjunta é Derivamos agora (11.2.170) em ordem ao tempo; usando (11.2.173) e (11.2.174) obtemos d ÂH (t) = dt 1 dÂS (t) 1 − Û † (t, t0 )ĤS (t)ÂS (t)Û (t, t0 ) + Û † (t, t0 ) Û(t, t0 ) + Û † (t, t0 )ÂS (t)ĤS (t)Û (t, t0 ) ; i~ dt i~ (11.2.175) Introduzindo 1̂ = Û (t, t0 )Û † (t, t0 ) no primeiro e terceiro termo do lado direito entre os operadores ÂS e ĤS obtemos: h i d i~ ÂH (t) = ÂH (t), ĤH (t) + i~ dt dÂS (t) dt ! . H (11.2.176) 388 Métodos perturbativos independentes e dependentes do tempo Esta é a equação de evolução na representação de Heisenberg. Do mesmo modo que, na representação de Schrödinger, toda a informação sobre a evolução do sistema (contida em |ΨS (t)i) é dada pela equação de Schrödinger, na representação de Heisenberg, toda a informação sobre a evolução do sistema (contida em ÂH (t)) é dada pela equação (11.2.176).7 Note-se a semelhança formal entre (11.2.176) e (1.3.28); na representação de Schrödinger uma tal semelhança existe apenas para a evolução dos valores médios de observáveis (4.4.59). Existe uma terceira representação, que é introduzida para lidar com perturbações a um sistema cuja solução exacta é conhecida: a representação de interacção. Consideremos o Hamiltoniano: Ĥ = Ĥ0 (t) + Ŵ (t) . (11.2.177) Seja Û0 (t, t0 ) o operador de evolução do Hamiltoniano não perturbado Ĥ0 (t); isto é, se Ŵ (t) = 0, então |ΨS (t)i = Û0 (t, t0 )|ΨS (t0 )i . (11.2.178) Seja Û (t, t0 ) o operador de evolução do Hamiltoniano total; então |ΨS (t)i = Û (t, t0 )|ΨS (t0 )i . (11.2.179) Definimos o estado do sistema na representação de interacção |ΨI (t)i como |ΨS (t)i = Û0 (t, t0 )|ΨI (t)i ⇔ |ΨI (t)i = Û0† (t, t0 )|ΨS (t)i , (11.2.180) em que t0 é o instante em que a perturbação começou a actuar. Note-se a semelhança com (11.2.167), substituindo Û ↔ Û0 , o que nos leva a concluir que se o Hamiltoniano fosse apenas o Hamiltoniano no perturbado, o estado de interacção coincidiria com o estado de Heisenberg e seria constante. Para verificarmos isto calculemos a evolução do estado na representação de interacção: d d d † † i~ |ΨI (t)i = i~ Û0 (t, t0 ) |ΨS (t)i + Û0 (t, t0 ) i~ |ΨS (t)i . dt dt dt 7 (11.2.181) Historicamente, as duas representações aparecem no mesmo ano, 1925, com a equação de Schrödinger e a mecânica matricial de Heisenberg. A equivalência foi provada por Schrödinger em Março de 1926 no artigo ‘Über das Verhältnis der Heisenberg-Born-Jordanschen Quantenmechanik zu der meinen’. 11.2 Teoria das Perturbações dependentes do tempo 389 Usando o análogo de (11.2.174) para Û0 , i~ d † Û0 (t, t0 ) = −Û0† (t, t0 )Ĥ0 (t) , dt (11.2.182) no primeiro termo do lado direito e a equação de Schrödinger i~ d |ΨS (t)i = (Ĥ0 (t) + Ŵ (t))|ΨS (t)i , dt (11.2.183) para o segundo termo, (11.2.181) toma a forma: i~ d |ΨI (t)i = Û0† (t, t0 )Ŵ (t)Û0 (t, t0 )|ΨI (t)i ≡ ŴI (t)|ΨI (t)i . dt (11.2.184) Note-se que a relação de ŴI com Ŵ , i.e. da perturbação na representação de interacção e na representação de Schrödinger é semelhante à relação dos operadores na representação de Heisenberg e de Schrödinger (11.2.170), mais uma vez substituindo Û ↔ Û0 . Esta é a equação de evolução na representação de interacção. Se Ŵ = 0, então |ΨI (t)i = constante; por (11.2.180) |ΨS (t)i = Û0 (t, t0 )|ΨI (t)i , (11.2.185) pelo que podemos interpretar o estado constante no tempo como |ΨI (t)i = |ΨS (t0 )i = |ΨH i; logo interpretamos o estado de interacção como a evolução de |ΨS (t0 )i devida somente à perturbação, como ilustrado na figura 11.7. Ĥ0 Û0 (t, t0 )|ΨS (t0 )i Ŵ (t) |ΨI (t)i |ΨS (t0 )i Figura 11.7: Evolução do estado |ΨS (t0 )i, separando as contribuições do Hamiltoniano não perturbado Ĥ0 e da perturbação Ŵ (t). Se Ŵ (t) ≪ Ĥ0 esperamos que a evolução de |ΨI (t)i seja muito mais lenta do que a de Û0 (t, t0 )|ΨS (t0 )i. Podemos integrar, formalmente, a equação (11.2.184), obtendo 1 |ΨI (t)i = |ΨI (t0 )i + i~ Z t t0 dt′ ŴI (t′ )|ΨI (t′ )i ; (11.2.186) 390 Métodos perturbativos independentes e dependentes do tempo onde |ΨI (t0 )i = |ΨS (t0 )i. Substituindo esta equação nela própria repetidamente obtemos: |ΨI (t)i = 1 1̂ + i~ t Z t0 1 dt′ ŴI (t′ ) + (i~)2 Z t dt′ ŴI (t′ ) t0 ! t′ Z t0 dt′′ ŴI (t′′ ) + . . . |ΨI (t0 )i , (11.2.187) ou |ΨI (t)i = ÛI (t, t0 )|ΨI (t0 )i , (11.2.188) que define o operador de evolução na representação de interacção. Usando (11.2.180) temos |ΨI (t)i = Û0† (t, t0 )|ΨS (t)i = Û0† (t, t0 )Û (t, t0 )|ΨS (t0 )i = Û0† (t, t0 )Û(t, t0 )|ΨI (t0 )i ; (11.2.189) comparando com (11.2.187) deduzimos que ÛI (t, t0 ) = Û0† (t, t0 )Û (t, t0 ) . (11.2.190) Esta relação permite-nos mostrar que ÛI (t, t0 ) tem as propriedades adequadas para poder ser considerado um operador de evolução. De facto, usando que Û0 (t, t0 ) e Û(t, t0 ) são operadores de evolução demonstra-se que: a) ÛI (t0 , t0 ) = 1̂; b) ÛI† (t, t0 )ÛI (t, t0 ) = ÛI (t, t0 )ÛI† (t, t0 ) = 1̂; c) ÛI (t, t′ ) = ÛI (t, t′′ )ÛI (t′′ , t′ ). Derivamos agora uma expansão perturbativa para o operador de evolução total. Recordemos a definição do operador de evolução ÛI (t, t0 ) dada em (11.2.187): 1 ÛI (t, t0 ) = 1̂ + i~ Z t t0 1 dt ŴI (t ) + (i~)2 ′ ′ Z t t0 ′ ′ dt ŴI (t ) Z t′ dt′′ ŴI (t′′ ) + . . . ; (11.2.191) t0 usando (11.2.190) para o lado esquerdo da equação, a definição de ŴI (t) dada em (11.2.184), ŴI (t) = Û0† (t, t0 )Ŵ (t)Û0 (t, t0 ) , (11.2.192) 11.2 Teoria das Perturbações dependentes do tempo 391 para o lado direito e multiplicando (11.2.191) por Û0 (t, t0 ) obtemos Z 1 t ′ dt Û0 (t, t0 )Û0† (t′ , t0 )Ŵ (t′ )Û0 (t′ , t0 ) Û (t, t0 ) = Û0 (t, t0 ) + i~ t0 Z t Z t′ 1 dt′′ Û0 (t, t0 )Û0† (t′ , t0 )Ŵ (t′ )Û0 (t′ , t0 )Û0† (t′′ , t0 )Ŵ (t′′ )Û0 (t′′ , t0 ) + . . . ; dt′ + 2 (i~) t0 t0 (11.2.193) notando que Û0† (t′ , t0 ) = Û0 (t0 , t′ ) , (11.2.194) Û0 (t, t0 )Û0† (t′ , t0 ) = Û0 (t, t0 )Û0 (t0 , t′ ) = Û0 (t, t′ ) , (11.2.195) logo e de um modo semelhante para outras combinações análogas, (11.2.193) toma a forma final Û(t, t0 ) = Û0 (t, t0 ) + +∞ X Û (n) (t, t0 ) , (11.2.196) n=1 onde definimos Û (n) 1 (t, t0 ) = (i~)n Z t dt1 t0 Z t1 dt2 . . . Z tn−1 dtn Û0 (t, t1 )Ŵ (t1 )Û0 (t1 , t2 )Ŵ (t2 ) . . . Ŵ (tn )Û0 (tn , t0 ) , t0 t0 (11.2.197) onde t > t1 > . . . > tn−1 . Consideremos agora a probabilidade de transição no instante t, tal como discutida na secção 11.2.1, entre os estados estacionários |Φi i e |Φf i de um Hamiltoniano Ĥ0 independente do tempo, devido a uma perturbação Ŵ (t), ligada em t = 0; em termos do operador de evolução ela pode ser escrita da forma 2 Pif (t) = |hΦf |Û(t, 0)|Φi i| = |hΦf |Û0 (t, 0) + +∞ X n=1 Û (n) (t, 0)|Φii|2 . (11.2.198) Em ordem zero necessitamos dos elementos de matriz: 0 hΦf |Û0 (t, 0)|Φi i = hΦf |e−itĤ0 /~|Φi i = e−iEi t/~δif , (11.2.199) 392 Métodos perturbativos independentes e dependentes do tempo onde En0 é o valor próprio de Ĥ0 associado ao estado próprio |Φn i. Em ordem um necessitamos dos elementos de matriz: hΦf |Û (1) Z 1 t (t, 0)|Φii = hΦf | dt1 Û0 (t, t1 )Ŵ (t1 )Û0 (t1 , 0)|Φi i i~ 0 Z 1 t 0 0 dt1 e−iEf (t−t1 )/~Ŵf i (t1 )e−iEi (t−0)/~ , = i~ 0 (11.2.200) onde denotamos hΦf |Ŵ (t1 )|Φi i = Ŵf i (t1 ). Os elementos de matriz de ordem dois são calculados de maneira semelhante, sendo necessário introduzir a relação de fecho. Obtemse: hΦf |Û (2) (t, 0)|Φii = P Z k (i~)2 t dt1 0 Z t1 0 0 0 dt2 e−iEf (t−t1 )/~Ŵf k (t1 )e−iEk (t1 −t2 )/~Ŵki (t2 )e−iEi (t2 −0)/~ . 0 (11.2.201) Podemos agora interpretar os termos nas várias ordens: • Termo de ordem zero: corresponde ao sistema não perturbado; o operador de evolução é apenas exp (−iEi0 (t − 0)/~); • Termo de ordem um: o sistema evolui de t = 0 → t1 por acção de exp (−iEi0 (t1 − 0)/~); em t1 actua a perturbação que transforma |Φi i → |Φf i; seguidamente o sistema evolui de t1 → t por acção de exp (−iEf0 (t − t1 )/~). Integramos sobre todos os t1 de modo a que a perturbação possa actuar em qualquer instante; • Termo de ordem dois: o sistema evolui de t = 0 → t2 por acção de exp (−iEi0 (t2 − 0)/~); em t2 actua a perturbação que transforma |Φi i → |Φk i que é um estado intermédio arbitrário; seguidamente o sistema evolui de t2 → t1 por acção de exp (−iEk0 (t1 − t2 )/~); em t1 actua a perturbação que transforma |Φk i → |Φf i; seguidamente o sistema evolui de t1 → t por acção de exp (−iEf0 (t − t1 )/~). Integramos sobre todos os t1 , t2 de modo a que as perturbações possam actuar em qualquer instante; somamos sobre todos os estados intermédios de modo que o estado final possa ser atingido usando qualquer estado intermédio. Cada termo nesta série perturbativa pode ser representado por um diagrama. Os três primeiros estão representados na figura 11.8. Aos diagramas associamos as seguintes regras: 11.2 Teoria das Perturbações dependentes do tempo t t 393 t |Φf i |Φf i t2 |Φi i = |Φf i Ŵ (t1 ) t1 Ŵ (t1 ) |Φi i t=0 Ordem 0 Ŵ (t2 ) |Φk i t1 |Φi i t=0 Ordem 1 t=0 Ordem 2 Figura 11.8: Diagramas de ‘Feynman’ que ilustram o processo de ordem zero, um e dois para a teoria de perturbações dependentes do tempo. ⋆ O diagrama lê-se de baixo para cima (ordem temporal) correspondendo à leitura dos elementos de matriz correspondentes (11.2.199), (11.2.200) e (11.2.201) da direita para a esquerda; ⋆ a cada linha recta do diagrama, que une os pontos ti → ti+1 e que traduz a evolução do sistema no tempo sob a acção de Ĥ0 no estado |Φk i, atribui-se o factor de 0 e−iEk (ti+1 −ti )/~ ; (11.2.202) ⋆ A cada vértice do diagrama (correspondente a um instante ti ) atribui-se um factor de Z 1 ti−i dti Ŵab (ti ) , (11.2.203) i~ 0 onde os indices a, b se referem ao estado |Φa i - que se encontra imediatamente no passado do vértice - e |Φb i - que se encontra imediatamente no futuro do vértice; ⋆ Soma-se sobre todos os estados intermédios |Φk i. Com estas regras, que têm o mesmo espı́rito das regras de Feynman usadas em teoria quântica de campo, podemos reconstruir a expressão analı́tica de um termo perturbativo dado o respectivo diagrama. Como exemplo consideramos o termo de ordem três, 394 Métodos perturbativos independentes e dependentes do tempo t Ŵ (t3 ) t3 |Φf i |Φl i t2 Ŵ (t1 ) t1 Ŵ (t2 ) |Φk i |Φi i t=0 Ordem 3 Figura 11.9: Diagrama de ‘Feynman’ que ilustra o processo de ordem três para a teoria de perturbações dependentes do tempo. representado na figura 11.9. A amplitude deste processo, isto é o elemento de matriz hΦf |Û (3) (t, 0)|Φii, reconstruida usando a figura 11.9 e as regras anteriores é: Z Z t1 Z t2 1 X t 0 0 dt1 dt2 dt3 e−iEf (t−t3 )/~Ŵf l (t3 )e−iEl (t3 −t2 )/~× 3 (i~) k,l t0 t0 t0 0 0 ×Ŵlk (t2 )e−iEk (t2 −t1 )/~Ŵki (t1 )e−iEi (t1 −t0 )/~ , (11.2.204) onde t > t3 > t2 > t1 > t0 . A estrutura dos termos seguintes é agora bastante óbvia. Usando as fórmulas para as amplitudes é simples calcular a probabilidade de transição. Para a transição |Φi i e |Φf i, i 6= f , obtém-se, em primeira ordem, (1) 1 0 (t, 0)|Φi i| = 2 e−iEf t/~ ~ 2 Pif (t) = |hΦf |Û Z t 1 = 2 dt1 eiωf i t1 Ŵf i (t1 ) ~ 0 2 Z 0 t 2 0 0 dt1 e−i(Ei −Ef )t1 /~Ŵf i (t1 ) (11.2.205) , onde usamos a frequência angular de Bohr (11.2.122), que é exactamente o resultado (11.2.135). 11.3 Sumário 11.3 395 Sumário Neste capı́tulo estudamos métodos perturbativos independentes e dependentes do tempo, de modo a podermos considerar problemas que não admitem solução exacta. A principal hipótese é que o Hamiltoniano se decompõe num Hamiltoniano que pode ser resolvido exactamente Ĥ0 e numa perturbação Ŵ , que é “pequena”. Para o caso de perturbações estacionárias, o formalismo considera separadamente as perturbações a nı́veis não degenerados e degenerados. Como aplicação do primeiro caso estudamos várias perturbações a um oscilador harmónico em uma dimensão. Como aplicação do segundo caso calculamos a estrutura fina do átomo de Hidrogénio. Para perturbações dependentes do tempo, estudamos como calcular a probabilidade de transições entre estados próprios de Ĥ0 induzidas pela perturbação. Como aplicação estudamos as ressonâncias induzidas por pertubações sinusoidais e a regra de Ouro de Fermi, que usamos para deduzir novamente a secção eficaz na aproximação de Born. Finalmente estudamos um outro método, baseado no operador de evolução e na representação de interacção, para derivar probabilidades de transição em teoria de perturbações dependentes do tempo. Este método introduz uma componente diagramática que torna mais intuitiva a construção das amplitudes de transição. CAPÍTULO 12 Sistemas de partı́culas idênticas Os postulados do capı́tulo 4 para a Mecânica Quântica não relativista foram suplementados, no capı́tulo 10, por um conjunto de outros postulados referentes ao spin. O conjunto resultante de postulados é, ainda assim, insuficiente quando tratamos sistemas com várias partı́culas idênticas, levando a ambiguidades nas previsões fı́sicas. Para eliminar tais ambiguidades introduzimos, neste capı́tulo um novo postulado, relativo à descrição quântica de sistemas de partı́culas idênticas. 12.1 Origem do Problema: a degenerescência de troca Duas partı́culas são ditas idênticas se todas as suas propriedades intrı́nsecas - massa, carga, spin, etc - são exactamente iguais, sendo por isso impossı́vel distinguir uma da outra. Todos os protões ou todos os electrões são, por exemplo, partı́culas idênticas. Consideremos um problema de colisão entre duas partı́culas idênticas, rotuladas por (1) e (2), no referencial de centro de massa, conforme a figura 12.1. Consideremos que um aparelho de medida, D, detecta uma das partı́culas numa determinada direcção após a colisão. A partı́cula detectada no aparelho de medida D foi, claro está, a partı́cula (1) ou a partı́cula (2): 398 Sistemas de partı́culas idênticas Figura 12.1: Descrição clássica de um problema de colisão entre duas partı́culas idênticas. A partı́cula detectada pode ser identificada como sendo a partı́cula (1) ou a partı́cula (2) (Extraı́do de Cohen et al, ‘Quantum Mechanics’). • Classicamente não existe nenhuma ambiguidade; sabendo as condições iniciais sabemos se as trajectórias efectuadas correspondem ao caso a) ou ao caso b) descrito na figura 12.1, e logo se a partı́cula detectada foi (1) ou (2). • Quanticamente existe uma ambiguidade, porque os pactotes de onda se irão misturar e as partı́culas perderão irreversivelmente qualquer caracterı́stica que as distinga Figura 12.2. Figura 12.2: Descrição quântica de um problema de colisão entre duas partı́culas idênticas. A partı́cula detectada não pode ser identificada como sendo a partı́cula (1) ou a partı́cula (2) (Extraı́do de Cohen et al, ‘Quantum Mechanics’). A conclusão é que, quanticamente, não existe nenhuma maneira de dizer se a partı́cula detectada foi a partı́cula (1) ou a partı́cula (2). Para compreender como esta ambiguidade 12.1 Origem do Problema: a degenerescência de troca 399 introduz ambiguidades fı́sicas na descrição quântica de um sistema de partı́culas idênticas consideramos o seguinte exemplo. Suponhamos que temos um sistema com duas partı́culas de spin 1/2 idênticas. Descrevemos matematicamente o sistema rotulando as partı́culas como partı́cula (1) e partı́cula (2); os graus de liberdade de spin são descritos pelo ket |ǫ1 , ǫ2 i , onde ǫi = ±1, i = 1, 2, se refere ao valor próprio da observável de spin Ŝiz , da partı́cula i, que é igual a ǫi ~/2. Imaginemos que medimos estas observáveis e obtemos como resultado +~/2 para uma delas e −~/2 para a outra. Em princı́pio esta medição deveria determinar completamente o estado de spin do sistema. Mas devido à natureza idêntica das partı́culas os kets | + −i , e | − +i , parecem igualmente apropriados, à priori, para descrever o sistema. Existe, neste sentido uma degenerescência de troca. Mais geralmente, qualquer combinação linear normalizada α| + −i + β| − +i , |α|2 + |β|2 = 1 , (12.1.1) poderia descrever matematicamene este sistema, dado que respeita a condição de a componente Ŝz do spin de uma das partı́culas ser ~/2 e a mesma componente do spin da outra partı́cula ser −~/2, sendo irrelevante qual é qual. É esta degenerescência de estados que constitui a degenerescência de troca, que é a afirmação que “num sistema de partı́culas idênticas, uma medição completa de cada uma das partı́culas não permite a determinação de um único ket para descrever o sistema”. Assim, no nosso exemplo, apesar de termos medido individualmente o spin de cada uma das partı́culas sabemos apenas que o estado do sistema é dado por (12.1.1), com α e β indeterminados. Ora, para a descrição da Mecânica Quântica não ser ambigua, nenhuma previsão de quantidades fı́sicas pode depender das constantes α e β. Mas podemos demonstrar facilmente que não é assim. Calculemos, por exemplo, a probabilidade de encontrar as componentes Ŝx do spin de ambas as partı́culas com valor +~/2. 400 Sistemas de partı́culas idênticas Primeiro notamos que na base própria de Ŝz , Ŝx tem a forma (9.2.18)   0 1 ~  . Ŝx =  2 1 0 É fácil verificar que os seus vectores próprios (normalizados) são 1 |+ix = √ (|+i + |−i) , 2 com valores próprios 1 |−ix = √ (|+i − |−i) , 2 (12.1.2) ~ Ŝx |±ix = ± |±ix . 2 Para responder à questão de qual a probabilidade de encontrar as componentes Ŝx dos spins de ambas as partı́culas iguais a ~/2, invertemos (12.1.2) 1 |+i = √ (|+ix + |−ix ) , 2 1 |−i = √ (|+ix − |−ix ) , 2 (12.1.3) de modo a escrever (12.1.1) em termos dos estados próprios da componente Ŝx do spin α| + −i + β| − +i = α|+i ⊗ |−i + β|−i ⊗ |+i |+ix + |−ix |+ix − |−ix |+ix − |−ix |+ix + |−ix √ √ √ √ ⊗ +β ⊗ 2 2 2 2 α+β α+β α−β β−α = |+ix ⊗ |+ix − |−ix ⊗ |−ix − |+ix ⊗ |−ix − |−ix ⊗ |+ix . 2 2 2 2 (12.1.4) =α Logo, a probabilidade pedida é igual a α+β 2 2 , que depende dos coeficientes α e β e como tal temos uma ambiguidade fı́sica. Dificuldades análogas - resultantes da degenerescência de troca - aparecem no estudo de todos os sistema com um número arbitrário de partı́culas idênticas N, N > 1. 12.2 Operadores de permutação Antes de enunciar o postulado adicional da Mecânica Quântica que nos permite remover as ambiguidades resultantes da degenerescência de troca, iremos estudar certos operadores que permutam as várias partı́culas de um sistema e simplificam os cálculos e raciocı́nios que se seguirão. 12.2 Operadores de permutação 12.2.1 401 Sistema de duas partı́culas Consideremos um sistema constituido por duas partı́culas, não necessariamente idênticas (de modo a evitar as ambiguidades fı́sicas discutidas anteriormente), mas com espaços de estados isomórficos. Em particular terão o mesmo spin. Por exemplo, um protão - partı́cula (1) - e um electrão - partı́cula (2). Escolhemos a base {|uii} para o espaço de estados da partı́cula (1), E(1); como este é isomórfico a E(2), {|uii} é também uma base para este espaço. O espaço de estados total, E, tem uma base obtida pelo produto tensorial {|1 : ui i ⊗ |2 : uj i} = {|1 : ui; 2 : uj i} . Note-se que a ordem por que se fez o produto tensorial não é importante, isto é |1 : ui ; 2 : uj i = |2 : uj ; 1 : ui i , o que é importante é qual o estado associado a cada partı́cula: |1 : ui ; 2 : uj i = 6 |1 : uj ; 2 : ui i , para i 6= j . O operador de permutação P̂21 é definido como o operador linear cuja acção nesta base é dada por: P̂21 |1 : ui ; 2 : uj i = |2 : ui ; 1 : uj i = |1 : uj ; 2 : ui i . Sabendo esta acção é fácil concluir qual a acção em qualquer ket, bastando expandi-lo nesta base. Em termos das componentes da função de onda de uma partı́cula com spin e graus de liberdade orbitais, Ψǫ,ǫ′ (~r, ~r′ ) = h1 : ~r, ǫ; 2 : ~r′ , ǫ′ |Ψi , a acção do operador de permutação é P̂ 21 Ψǫ′ ,ǫ (~r′ , ~r) . Ψǫ,ǫ′ (~r, ~r′) −→ Consideremos algumas propriedades do operador de permutação: 402 Sistemas de partı́culas idênticas • É igual ao seu inverso (óbvio pela definição): 2 P̂21 = 1̂ ; • É hermı́tico: † P̂21 = P̂21 ; para o demonstramos notamos que (assumimos que a base {|uii} está ortonormalizada) h1 : ui′ ; 2 : uj ′ |P̂21 |1 : ui ; 2 : uj i = δi′ j δj ′ i . † Por outro lado, os mesmos elementos de matriz para o operador P̂21 são † |1 : ui ; 2 : uj i = h1 : ui ; 2 : uj |P̂21 |1 : ui′ ; 2 : uj ′ i∗ h1 : ui′ ; 2 : uj ′ |P̂21 = (δj ′ i δi′ j )∗ = δj ′ i δi′ j , o que mostra que os elementos de matriz dos dois operadores são iguais e prova que P̂21 é hermı́tico. • Das duas propriedades anteriores resulta que P̂21 é unitário: † = P̂21 P̂21 = 1̂ . P̂21 P̂21 • Por ser hermı́tico os valores próprios de P̂21 são reais; como, para além disso, o seu quadrado é a unidade, os valores próprios de P̂21 terão de ser λ = ±1. Asssociados a cada um destes valores próprios temos um tipo distinto de vectores próprios: ⋆ λ = 1; os vectores próprios associados chamam-se simétricos e denotam-se |ΨS i: P̂21 |ΨS i = |ΨS i. ⋆ λ = −1; os vectores próprios associados chamam-se anti-simétricos e denotam-se |ΨA i: P̂21 |ΨA i = −|ΨA i. 12.2 Operadores de permutação 403 Dado um estado arbitrário, podemos definir dois operadores cuja acção nesse estado origina, um estado próprio de P̂21 , com valor próprio, respectivamente +1 ou −1. Estes operadores chamam-se o simetrizador, Ŝ, e o anti-simetrizador, Â e são definidos pelas expressões: Ŝ = 1 1̂ + P̂21 , 2 Â = 1 1̂ − P̂21 . 2 (12.2.1) Estes operadores têm as seguintes propriedades, todas elas podendo ser facilmente verificadas a partir das definições (12.2.1): • Ambos são operadores de projecção: Ŝ 2 = Ŝ , Â2 = Â ; Ŝ = Ŝ † , Â = Â† ; • Ambos são operadores hermı́ticos: • Ŝ e Â projectam em espaços ortogonais e suplementares Ŝ Â = ÂŜ = 0 , Ŝ + Â = 1̂ . • Como antecipado em cima, a acção destes operadores num estado arbitrário |Ψi de E produz estados próprios do operador de permutação: P̂21 Ŝ|Ψi = Ŝ|Ψi , P̂21 Â|Ψi = −Â|Ψi , o que justifica a denominação dos operadores. Consideremos agora a transformação de observáveis pela acção do operador de permutação. Seja B̂(1) uma observável definida em E(1). Como é observável os seus vectores próprios constituem uma base de E(1). Sem perda de generalidade assumimos que a base {|uii} corresponde à base própria de B̂(1), com valores próprios {bi }. Consideramos a † acção do operador P̂21 B̂(1)P̂21 num ket de E arbitrário: † P̂21 B̂(1)P̂21 |1 : ui ; 2 : uj i = P̂21 B̂(1)|1 : uj ; 2 : uii = bj P̂21 |1 : uj ; 2 : ui i = bj |1 : ui ; 2 : uj i . 404 Sistemas de partı́culas idênticas Por outro lado, se considerarmos a acção da observável análoga em E(2), denotada B̂(2), no mesmo ket, temos B̂(2)|1 : ui ; 2 : uj i = bj |1 : ui ; 2 : uj i . Como o ket é arbitrário concluimos que † P̂21 B̂(1)P̂21 = B̂(2) . Por um método análogo pode-se mostrar que † = B̂(1); • P̂21 B̂(2)P̂21 † • P̂21 (B̂(1) + Ĉ(2))P̂21 = B̂(2) + Ĉ(1); † = B̂(2)Ĉ(1), que pode ser facilmente deduzido introduzindo o operador • P̂21 B̂(1)Ĉ(2)P̂21 † 1̂ = P̂21 P̂21 entre B̂(1) e Ĉ(2). Generalizando para qualquer observável Ô(1, 2), em E, que pode ser expressa em termos de observáveis B̂(1) e Ĉ(2), temos † P̂21 Ô(1, 2)P̂21 = Ô(2, 1) , que é a mesma observável trocando 1 ↔ 2. Uma observável é dita simétrica se ÔS (2, 1) = ÔS (1, 2) . Para uma observável simétrica, (12.2.2) fica † P̂21 ÔS (1, 2)P̂21 = ÔS (2, 1) = ÔS (1, 2) ⇒ P̂21 ÔS (1, 2) = ÔS (1, 2)P̂21 , de onde concluimos que [ÔS (1, 2), P̂21] = 0 , ou seja, as observáveis simétricas comutam com o operador de permutação. (12.2.2) 12.2 Operadores de permutação 12.2.2 405 Sistema de três partı́culas e generalização para N partı́culas Consideramos agora a generalização para N partı́culas dos conceitos da subsecção anterior. Para isso começamos por considerar explicitamente o caso com N = 3 que introduz a estrutura do caso geral. Tomamos a base do espaço de estados de três partı́culas, com espaços de estados individuais isomórficos, como sendo {|1 : ui; 2 : uj ; 3 : uk i} , (12.2.3) e definimos os 3! = 6 operadores de permutação que nela actuam: P̂123 , P̂231 , P̂312 , P̂321 , P̂132 , P̂213 . (12.2.4) A acção destes operadores na base pode ser sumarizada como P̂npq |1 : ui ; 2 : uj ; 3 : uk i = |n : ui ; p : uj ; q : uk i . Logo P̂123 = 1̂. A acção em qualquer ket é facilmente escrita expandindo-o na base (12.2.3). Os N! operadores num sistema de N partı́culas são definidos analogamente. Consideremos algumas propriedades dos operadores de permutação num sistema de N partı́culas, exemplificando com o caso de N = 3: • O conjunto de operadores de permutação, com a multiplicação usual de operadores, constitui um grupo. Verifiquemos os axiomas de grupo (apresentados na secção 9.1): ⋆ O produto de dois operadores de permutação é ainda um operador de permutação; por exemplo P̂312 P̂132 = P̂321 ; (12.2.5) Para calcular o produto do lado esquerdo tome-se o seguinte algoritmo:          1→1 1→3 1→3       1) P̂132 2 → 3 , 2) P̂312 3 → 2 , 3) P̂312 P̂132 2 → 2 . (12.2.6)           3→2  2→1  3→1 Logo a acção de P̂312 P̂132 é a mesma que a ação de P̂321 , como antecipado. 406 Sistemas de partı́culas idênticas ⋆ O produto de permutações é associativo; por exemplo P̂312 P̂132 P̂231 = P̂312 P̂321 = P̂213 , enquanto que associando as duas permutações que actuam em segundo e terceiro lugar, P̂312 P̂132 P̂231 = P̂321 P̂231 = P̂213 , obtemos de facto o mesmo resultado. ⋆ Existe um operador identidade, que é P̂123 ; ⋆ Cada permutação tem uma permutação inversa P̂123 −1 = P̂123 −1 P̂231 = P̂312 , −1 −1 −1 , P̂321 = P̂321 , P̂213 = P̂213 , P̂132 = P̂132 . Obviamente as transposições (a definir de seguida) e a identidade são inversos de si mesmos, como exibido na segunda linha. Notemos que o grupo não é abeliano. Por exemplo se trocarmos a ordem do produto em (12.2.5) obtemos P̂132 P̂312 = P̂213 6= P̂321 , ou seja, as permutações, genericamente, não comutam entre si. • Definimos transposição como uma permutação que troca duas partı́culas e deixa as restantes invariantes. Para N = 3, das seis permutações (12.2.4) três são transposições P̂321 , P̂132 , P̂213 . (12.2.7) Em geral, das N! permutações num sistema de N partı́culas teremos N(N − 1)/2 transposições. Transposições são análogas à permutação P̂21 que definimos num sistema de duas partı́culas. Em particular são operadores hermı́ticos e unitários. 12.2 Operadores de permutação 407 Qualquer permutação pode ser escrita como um produto de transposições. Mas esta “decomposição” não é única. Por exemplo P̂312 = P̂132 P̂213 = P̂321 P̂132 = P̂321 P̂213 P̂132 P̂321 ; no entanto o número de transposições cujo produto origina P̂312 é sempre par. De um modo semelhante, a permutação P̂321 , que é ela própria uma transposição, não tem uma decomposição única, por exemplo pode ser também decomposta como P̂321 = P̂132 P̂213 P̂132 , mas o número de transposições cujo produto origina P̂321 é sempre ı́mpar. Por esta razão, as permutações P̂123 , P̂231 , P̂312 são chamadas permutações pares e as permutações P̂321 , P̂132 , P̂213 são chamadas permutações ı́mpares. No caso com N = 3 todas as permutações ı́mpares são transposições. Genericamente, para um sistema de N partı́culas, definimos permutações pares (ı́mpares) como aquelas que só se podem escrever como produtos de um número par (ı́mpar) de transposições. Notemos ainda que para qualquer N há tantas permutações pares como ı́mpares. • Operadores de permutação são sempre unitários, pois podem ser escritos como produtos de operadores unitários, que são as transposições. De facto notemos que se dois operadores são unitários o seu produto é ainda unitário: se ÂÂ† = 1̂ , B̂ B̂ † = 1̂ , ⇒ (ÂB̂)(ÂB̂)† = ÂB̂ B̂ † Â† = 1̂ . • Operadores de permutação não são sempre hermı́ticos, pois, embora se escrevam como produtos de operadores hermı́ticos (transposições), estes não comutam entre si, conforme (4.2.31). • O adjunto de uma permutação, que é igual ao seu inverso dado serem operadores unitários, tem a mesma paridade da permutação, pois escreve-se à custa das mesmas transposições, mas em ordem contrária. 408 Sistemas de partı́culas idênticas Consideramos agora a construção, para um sistema de N partı́culas, dos vectores próprios simétricos e anti-simétricos, e também a do simetrizador e do anti-simetrizador. Começamos por notar que, como os operadores de permutação não comutam entre si, não é possı́vel arranjar uma base própria comum a todos eles. Contudo existem, ainda assim, certos estados que são estados próprios comuns a todos os operadores de permutação P̂α . Num sistema de N partı́culas estes estados são de dois tipos: • Estados completamente simétricos P̂α |ΨS i = |ΨS i , que são vectores próprios de todas as permutações com valor próprio +1; • Estados completamente anti-simétricos P̂α |ΨA i = ǫα |ΨA i , que são vectores próprios de todas as permutações par (ı́mpar) com valor próprio +1 (−1). Logo ǫα = (−1)Paridade de P̂α . Tanto o espaço dos kets completamente simétricos ES como o espaço dos kets completamente anti-simétricos EA são sub-espaços do espaço de estados total E; mas ao contrário do caso N = 2, em geral E= 6 ES ⊕ EA , isto é, nem todos os estados podem ser escritos como combinação linear de um estado totalmente simétrico e um estado totalmente anti-simétrico. O simetrizador e o anti-simetrizador para um sistema de N partı́culas são os operadores de projecção em ES e EA , definidos como Ŝ = 1 X P̂α , N! α Consideremos as suas propriedades: Â = 1 X ǫα P̂α . N! α (12.2.8) 12.2 Operadores de permutação • São ambos hermı́ticos 409 Ŝ = Ŝ † , Â = Â† . Esta propriedade pode ser verificada da seguinte maneira. Existe uma correspondência biunı́voca entre as permutações e as suas inversas; a permutação inversa tem a mesma paridade da permutação; logo as somas (12.2.8) podem ser escritas 1 X 1 X P̂α + (P̂α )−1 , Â = ǫα P̂α + (P̂α )−1 . Ŝ = 2N! α 2N! α Como todas as permutações são operadores unitários, P̂α† = (P̂α )−1 e como tal P̂α + (P̂α )−1 é hermı́tico. Como acabamos de escrever Ŝ e Â como uma soma de operadores hermı́ticos, mostramos que são hermı́ticos. • Se P̂α′ for uma permutação arbitrária   P̂ ′ Ŝ = Ŝ P̂ ′ = Ŝ α α  P̂ ′ Â = ÂP̂ ′ = ǫ ′ Â α α α • São operadores de projecção:   P̂ ′ Ŝ|Ψi = Ŝ|Ψi α ⇒  P̂ ′ Â|Ψi = ǫ ′ Â|Ψi α Ŝ = Ŝ 2 , . (12.2.9) α Â = Â2 , em espaços ortogonais Ŝ Â = ÂŜ = 0 , mas, como já referido anteriormente, para N > 2, os espaços ES e EA não são suplementares - Figura 12.3 - i.e. Ŝ + Â 6= 1̂ . Note-se que a dimensão de ES mais a de EA depende de N e da dimensão de {|uii}. Podemos agora considerar a transformação de observáveis pela acção dos operadores de permutação. Escrevendo o operador de permutação como produtos de transposições, podemos argumentar de um modo semelhante ao caso N = 2. Em particular observáveis completamente simétricas na troca dos ı́ndices 1, . . . , N, OS (1, . . . , N), comutam com todos os operadores de permutação [OS (1, . . . , N), P̂α ] = 0 . (12.2.10) 410 Sistemas de partı́culas idênticas E ES EA N =2 E ES EA N >2 Figura 12.3: Representação esquemática do espaço de estados total, E e dos espaços de estados simétricos ES e anti-simétricos EA , para duas partı́culas idênticas, em que são suplementares e para N > 2, em que não são. Note-se que a figura da esquerda não significa que qualquer estado de E pertença a ES ou a EA ; significa que qualquer estado de E pode ser escrito como combinação linear de estados de ES e EA . 12.3 O postulado de simetrização Vamos agora introduzir o postulado que vai levantar a degenerescência de troca e resolver as ambiguidades fı́sicas vistas em sistemas de partı́culas idênticas. O postulado, denominado postulado de simetrização, pode ser enunciado do seguinte modo: “Quando um sistema inclui várias partı́culas idênticas, somente certos kets do seu espaço de estados podem descrever estados fı́sicos. Os kets fı́sicos são, dependendo da natureza das partı́culas idênticas, ou completamente simétricos ou completamente antisimétricos, com respeito à permutação destas partı́culas. As partı́culas para as quais os kets fı́sicos são simétricos (anti-simétricos) chamam-se bosões (fermiões). Este postulado limita o espaço de estados num sistema de partı́culas idênticas. Em vez de ser o produto tensorial dos espaços de estados das partı́culas individuais E (como é para partı́culas distintas), é apenas um sub-espaço de E, respectivamente ES ou EA para bosões ou fermiões. Todas as partı́culas conhecidas1 actualmente obedecem à seguinte regra: Partı́culas com spin semi-inteiro são fermiões (electrão, protão,. . . ); partı́culas com spin inteiro são bosões (fotão, mesões,. . . ). 1 Este facto, resulta de as partı́culas elementares conhecidas obedecerem a esta regra. Contudo, existem partı́culas auxiliares (não são reais) mas usadas na descrição matemática da teoria quântica de campo, denominadas ghosts que não obedecem ao Teorema Spin-Estatı́stica. 12.3 O postulado de simetrização 411 Esta regra, denominada “Teorema Spin-Estatı́stica”, pode ser provada em Teoria Quântica de Campo, usando hipóteses muito gerais.2 Mas não é impossı́vel que: • Um bosão/fermião com spin semi-inteiro/inteiro possa ser descoberto; • Haja kets fı́sicos com simetrias mais complexas do que as que são consideradas pelo postulado anterior. Notemos ainda que este postulado não se aplica em uma e duas dimensões espaciais; em duas dimensões, em particular, existem outras (quasi)partı́culas, denominadas “aniões” (anyons), que se tornaram úteis na descrição de alguns sistemas, como folhas de grafite, ou no tratamento do efeito Hall quântico.3 12.3.1 Levantamento da degenerescência de troca Vejamos agora como o postulado anterior pode resolver as ambiguidades fı́sicas discutidas. Para isso, notamos que a degenerescência de troca pode ser enunciada da seguinte forma: “Seja |ui um ket que descreve matematicamente um estado fı́sico bem definido de um sistema contendo N partı́culas idênticas. O ket P̂α |ui, para qualquer operador de permutação P̂α , descreve o estado fı́sico tão bem quanto |ui. Se o sub-espaço Eu gerado por |ui e todas as suas permutações tiver dimensão maior do que 1, existe degenerescência de troca. Em geral, a dimensão de Eu poderá ir de 1 a N!.” Com o postulado adicional, o ket fı́sico tem de pertencer a ES ou a EA . A degenerescência de troca será levantada se demonstrarmos que Eu contém um único ket de ES ou, caso as partı́culas idênticas sejam fermiões, um único ket de EA . Para demonstrarmos que assim é, recordamos (12.2.9) Ŝ = Ŝ P̂α , 2 Â = ǫα ÂP̂α , O trabalho original foi feito por W.Pauli: “The Connection Between Spin and Statistics”, Phys. Rev. 58 (1940) 716-722. 3 A existência destas representações foi originalmente discutida em J.M.Leinaas e J.Myrheim, “On the theory of identical particles”, Il Nuovo Cimento, 37B (1977) 1; agradeço ao Prof. João Lopes dos Santos por me ter chamado a atenção para este artigo. 412 Sistemas de partı́culas idênticas que implicam Ŝ|ui = Ŝ P̂α |ui , Â|ui = ǫα ÂP̂α |ui . Ou seja, a projecção em ES ou EA de todos os kets de Eu é a mesma, a menos de um sinal que não tem relevância fı́sica, o que levanta a degenerescência de troca. Deste modo, pelo postulado de simetrização, o ket fı́sico que descreve o estado fı́sico do sistema de um sistema de N partı́culas idênticas é construido da seguinte maneira: i) Numere-se as partı́culas arbitrariamente e construa-se o ket |ui correspondendo ao estado fı́sico considerado com os números quânticos de cada partı́cula determinados. ii) Aplique-se Ŝ ou Â a |ui, dependendo de as partı́culas idênticas serem bosões ou fermiões. iii) Normalize-se o ket obtido. Consideremos alguns exemplos: 1) Sistema de duas partı́culas idênticas: Num sistema de duas partı́culas idênticas sabe-se que uma está no estado |φi e outra no estado |χi (normalizados). Apliquemos as regras anteriores: i) Rotulamos a que está no estado |φi/|χi por (1)/(2). Logo construimos o ket |ui = |1 : φ; 2 : χi . ii) Se são bosões simetrizamos: Ŝ|ui = 1 1 1̂ + P̂21 |ui = (|1 : φ; 2 : χi + |1 : χ; 2 : φi) . 2 2 Se são fermiões anti-simetrizamos: 1 1 Â|ui = 1̂ − P̂21 |ui = (|1 : φ; 2 : χi − |1 : χ; 2 : φi) . 2 2 iii) Normalizamos; há que considerar duas hipóteses: 12.3 O postulado de simetrização 413 ⋆ Se os dois estados fı́sicos |φi e |ψi são distintos, podemos assumir que hφ|χi = 0; obtemos o ket fı́sico4 1 |φ, χi = √ [|1 : φ; 2 : χi + ǫ|1 : χ; 2 : φi] , 2 onde ǫ = +1, −1, para bosões e fermiões, respectivamente. ⋆ Se os dois estados fı́sicos são o mesmo |φi = |χi então temos, para bosões Ŝ|ui = |1 : φ; 2 : φi , o que quer dizer que se as partı́culas idênticas são bosões e estão no mesmo estado o ket simetrizado é o mesmo que o ket inicial |ui = Ŝ|ui; para fermiões Â|ui = 0 , o que quer dizer que não existe nenhum ket em EA que descreve dois fermiões no mesmo estado individual |φi. Um tal estado é excluido pelo postulado de simetrização. Acabamos assim, de estabelecer, para um caso particular, o Princı́pio de exclusão de Pauli: “Dois fermiões idênticos não podem estar no mesmo estado individual.” 2) Sistema de três partı́culas idênticas: Num sistema de três partı́culas idênticas sabe-se que uma está no estado |φi, outra no estado |χi e outra no estado |wi (normalizados). Apliquemos as regras anteriores: i) Rotulamos a que está no estado |φi/|χi/|wi por (1)/(2)/(3). Logo construimos o ket |ui = |1 : φ; 2 : χ; 3 : wi . 4 Assumimos, por simplicidade que |φi e |χi são estados próprios de uma observável (com espectro não degenerado) associados a valores próprios distintos. 414 Sistemas de partı́culas idênticas ii) Se são bosões simetrizamos: Ŝ|ui = 1 1 X P̂α |ui = (|1 : φ; 2 : χ; 3 : wi + |1 : w; 2 : φ; 3 : χi + |1 : χ; 2 : w; 3 : φi 3! α 3! +|1 : φ; 2 : w; 3 : χi + |1 : χ; 2 : φ; 3 : wi + |1 : w; 2 : χ; 3 : φi) ; (12.3.1) Se são fermiões anti-simetrizamos: Â|ui = 1X ǫα P̂α |ui , 3! α notando que os sinais são exactamente os dados por um determinante, escrevemos 1 Â|ui = 3! |1 : φi |1 : χi |1 : wi |2 : φi |2 : χi |2 : wi , (12.3.2) |3 : φi |3 : χi |3 : wi que é chamado o determinante de Slater.5 iii) Normalizamos; há que considerar três hipóteses: ⋆ Se todos os estados fı́sicos |φi, |χi e |wi são distintos, podemos assumir ortogonalidade entre todos; obtemos os ket fı́sicos (12.3.1) ou (12.3.2) com 1/3! substituido √ por 1/ 3!. ⋆ Se dois dos estados fı́sicos são iguais, por exemplo |φi = |χi, então temos, para bosões 1 |φ; φ; wi = √ [|1 : φ; 2 : φ; 3 : wi + |1 : φ; 2 : w; 3 : φi + |1 : w; 2 : φ; 3 : φi] , 3 enquanto que para fermiões, o facto de dois estados serem iguais significa que existem duas colunas iguais no determinante de Slater, que como tal é zero. Deste modo, não existe qualquer estado em EA que descreva esta situação. Esta é mais uma manifestação do princı́pio de exclusão de Pauli. 5 Esta técnica de usar um determinante foi introduzida por J.C.Slater em “The Theory of Complex Spectra”, Phys. Rev. 34 (1929) 1293. 12.3 O postulado de simetrização 415 ⋆ Se os três estados fı́sicos são iguais, então temos, para bosões |φ; φ; φi = |1 : φ; 2 : φ; 3 : φi , enquanto que para os fermiões a função de onda é zero. 3) Sistema de N partı́culas idênticas: Genericamente a situação é semelhante aos casos anteriores. Para bosões existe sempre um estado simétrico, mesmo que várias partı́culas estejam no mesmo estado individual. Para fermiões não pode haver repetição do estado individual. Existe uma outra representação de kets fı́sicos que introduz o conceito de número de ocupação. Consideremos um sistema de N partı́culas idênticas. Tomando uma base {|uii} para o espaço de estados de uma partı́cula, construimos a base {|1 : ui; 2 : uj ; . . . ; N : up i} , (12.3.3) para o espaço de estados E. No entanto, a base do espaço de estados fı́sicos ES ou EA é construida actuando com o simetrizador ou o anti-simetrizador na base anterior, o que torna irrelevante qual a numeração da partı́cula que se encontra num estado |uii. O que é realmente relevante é quantas partı́culas se encontram em cada estado, ou seja o número de ocupação de cada estado. Este número corresponde a quantas vezes cada estado aparece num ket da forma (12.3.3). Isso leva-nos a introduzir a notação, para kets fı́sicos |n1 , . . . , nk , . . .i , onde o número de entradas no ket corresponde ao número de estados possı́veis, isto é à dimensão do espaço de estados de uma partı́cula; ni é o número de ocupação do estado |ui i. Subentende-se que este ket corresponde a um ket simetrizado ou anti-simetrizado quando expresso na base (12.3.3). Obviamente X i e para os fermiões ni = {0, 1}. ni = N , 416 Sistemas de partı́culas idênticas 12.3.2 Observáveis e evolução temporal O postulado de simetrização restringe os kets fı́sicos num sistema de partı́culas idênticas aos que são totalmente simétricos ou totalmente anti-simétricos na troca de duas quaisquer partı́culas. Quais as restrições que devemos impôr às observáveis? Em geral, dado que nenhuma propriedade fı́sica é modificada quando os papéis das N partı́culas são permutados, estas N partı́culas devem entrar simetricamente em qualquer observável passı́vel de ser medida, tanto para fermiões como para bosões. Matematicamente, requeremos que as observáveis fı́sicas, Ô, sejam invariantes quando as partı́culas são permutadas, isto é, devem ser operadores simétricos, e como tal de acordo com (12.2.10) devem comutar com os operadores de permutação: [Ô, P̂α ] = 0 , ∀P̂α . (12.3.4) Por exemplo; • Num sistema de duas partı́culas, a observável ~ ~ R̂1 − R̂2 , não é simétrica, e como tal não é fı́sica. A observável fı́sica que reflecte a distância entre as duas partı́culas é q ~ ~ ~ ~ (R̂1 − R̂2 )2 = |R̂1 − R̂2 | . • O operador Hamiltoniano que descreve o átomo de Hélio deverá ser escrito, em primeira aproximação, como P̂ 2 1 P̂ 2 Ĥ(1, 2) = 1 + 2 + 2me 2me 4πǫ0 − 2e2 R̂1 − 2e2 R̂2 + e2 |R̂1 − R̂2 | ! . • O momento angular orbital total num sistema de três partı́culas idênticas será: ~ ~ ~ ~ L̂ = L̂1 + L̂2 + L̂3 . 12.4 Consequências do postulado de simetrização 417 Note-se que o significado de (12.3.4) é também que a acção de uma observável fı́sica num ket fı́sico não retira o ket fı́sico de ES ou EA . Isto é verdade, em particular para o operador Hamiltoniano, que deverá ser uma observável fı́sica. Como este operador é o responsável pela evoluação temporal do sistema, através da equação de Schrödinger, esta evolução não deverá retirar o ket fı́sico do espaço vectorial ES ou EA . Isto atesta a consistência do formalismo. Note-se ainda que as observáveis fı́sicas estarão definidas, à partida, no espaço de estados total E, podendo por isso ter mais vectores próprios (e correspondentes valores próprios) do que aqueles que têm em ES ou EA . Neste sentido, o efeito do postulado de simetrização poderá ser eliminar alguns dos valores próprios de uma observável fı́sica, restrigindo os valores próprios fı́sicos aos que têm vectores próprios associados em ES ou EA . 12.4 Consequências do postulado de simetrização 12.4.1 Diferenças entre bosões e fermiões No enunciado do postulado de simetrização, a diferença entre bosões e fermiões é “apenas” um sinal. Esta diferença de sinal tem, no entanto, consequências notáveis, que são manifestações do princı́pio de exclusão de Pauli, para fermiões, e da ausência de um princı́pio semelhante para bosões. Consideremos duas. Estado fundamental de um sistema de partı́culas idênticas independentes Dado que o Hamiltoniano é uma observável fı́sica tem de ser uma observável simétrica, num sistema de partı́culas idênticas. Vamos assumir que estas são independentes, isto é não se encontram acopladas. Se assim é, o Hamiltoniano pode ser decomposto da seguinte forma: Ĥ(1, 2, . . . , N) = ĥ(1) + ĥ(2) + . . . + ĥ(N) . Note-se que os vários Hamiltonianos individuais são iguais (a menos do ı́ndice de partı́cula), de modo a garantir que o operador Hamiltoniano seja simétrico. Consideremos a base 418 Sistemas de partı́culas idênticas própria de ĥ(j): ĥ(j)|φn i = en |φn i , |φn i ∈ E(j) . Assumimos, por simplicidade, que o espectro é discreto e não degenerado e ordenamos os vectores próprios de modo a que e1 < e2 < e3 < . . .. • Se as partı́culas são bosões, o estado fundamental é (S) |φ1,1,...,1 i = |1 : φ1 ; 2 : φ1 ; . . . ; N : φ1 i , que já está simetrizado, sendo a energia correspondente E1,1,...,1 = Ne1 . • Se as partı́culas são fermiões, o estado fundamental é (A) |φ1,2,...,N i 1 =√ N! |1 : φ1 i ... |1 : φN i ... ... ... , |N : φ1 i . . . |N : φN i sendo a energia correspondente E1,2,...,N = e1 + e2 + . . . + eN . A maior energia individual eN que se encontra no estado fundamental é denominada energia de Fermi. Estatı́stica Quântica Em mecânica estatı́stica clássica (estatı́stica de Maxwell-Boltzmann), as N partı́culas do sistema são tratadas como se tivessem diferentes naturezas, mesmo que sejam idênticas. Dois estados microscópicos, são considerados distintos se as N partı́culas forem idênticas, mas a permutação diferente. Daqui resulta que, em equilı́brio térmico à temperatura T , o número médio de partı́culas com energia Ei é dado por e−βEi P n̄i = N , −βEj je 12.4 Consequências do postulado de simetrização 419 onde a soma é sobre todos os estados microscópicos do sistema e β = 1/KB T . Este resultado é aplicável sempre que a temperatura seja suficientemente alta e a densidade suficientemente baixa para os efeitos quânticos serem negligenciáveis (isto é não haver sobreposição apreciável das funções de onda das partı́culas individuais). Em mecânica estatı́stica quântica o postulado de simetrização tem de ser considerado: • Bosões obedecem à estatı́stica de Bose-Einstein; o número médio de bosões num estado com energia Ei , é dado por 1 n̄i = eα+βEi onde α é determinado pela restrição N= X j −1 , 1 eα+βEj −1 . (12.4.1) Para bosões sem massa (como o fotão), α = 0. Note-se que esta estatı́stica permite que n̄i seja muito elevado. • Fermiões obedecem à estatı́stica de Fermi-Dirac; o número médio de fermiões num estado com energia Ei , é dado por n̄i = 1 eα+βEi +1 , onde α é determinado pela restrição (12.4.1). Note-se que esta estatı́stica limita n̄i a 0 ≤ n̄i ≤ 1, em concordância com o princı́pio de exclusão de Pauli. Estas diferentes estatı́sticas podem ser observadas a baixas temperaturas. Bosões idênticos tendem a acumular-se no estado de menor energia - condensação de Bose-Einstein. Para o 4 He, este fenómeno origina a superfluidez. Para o 3 He, que é um fermião, o mesmo fenómeno não se verifica. A razão de o 3 He ser um fermião e do 4 He ser um bosão é consequência do teorema de adição do momento angular. Note-se que se tentarmos sobrepôr fermiões no mesmo estado quântico, existirá uma força efectiva que contrariará esta tentativa de sobreposição, originando a chamada pressão de Fermi. Esta pressão desempenha um papel importante na evolução estelar. Quando a pressão de radiação deixa de conseguir equilibrar uma estrela, a estrela colapsa. Se a estrela 420 Sistemas de partı́culas idênticas tiver menos de 1.44 massas solares (limite de Chandrasekhar ), a pressão de Fermi devida aos electrões (degenerescência electrónica) evita que o colapso gravitacional continue. Para estrelas com massa superior ao limite de Chandrasekhar, existe energia gravitacional suficiente para forçar os electrões e os protões a combinarem-se em neutrões, formando uma estrela de neutrões. A pressão de Fermi devida aos neutrões pode então travar o colapso gravitacional, se a massa da estrela for inferior a 2 − 3 massas solares. Para massas muito superiores a esta não se conhece nenhum efeito que consiga travar o colapso gravitacional. A estrela evoluirá, em princı́pio, para um buraco negro. 12.4.2 Efeitos de interferência A simetrização/anti-simetrização origina termos de interferência no cálculo de probabilidades. Para vermos este fenómeno consideramos um sistema de duas partı́culas idênticas, uma no estado |φi e outra no estado |χi, ortogonais. O estado fı́sico é i 1 h |φ; χi = √ 1̂ + ǫP̂21 |1 : φ; 2 : χi , 2 onde ǫ = +1, −1 para bosões e fermiões respectivamente. Queremos medir a grandeza fı́sica B, associada às observáveis B̂(1) e B̂(2). Seja {bi } o espectro de B̂, B̂|uii = bi |uii , que tomamos como sendo discreto e não degenerado, por simplicidade. Podemos perguntar qual é a probabilidade de encontrar os valores bn e bn′ (diferentes) numa medição da grandeza fı́sica B das duas partı́culas. Para respondermos, consideramos o ket fı́sico associado a este resultado, que é i 1 h |un ; un′ i = √ 1̂ + ǫP̂21 |1 : un ; 2 : un′ i . 2 12.4 Consequências do postulado de simetrização 421 Logo, a amplitude de probabilidade é 1 † A(bn , bn′ ) = hun ; un′ |φ; χi = h1 : un ; 2 : un′ |(1 + ǫP̂21 )(1 + ǫP̂21 )|1 : φ; 2 : χi 2 = h1 : un ; 2 : un′ |(1 + ǫP̂21 )|1 : φ; 2 : χi = h1 : un ; 2 : un′ |1 : φ; 2 : χi + ǫh1 : un ; 2 : un′ |1 : χ; 2 : φi = hun |φihun′ |χi + ǫhun |χihun′ |φi . Podemos interpretar o resultado para a amplitude de probabilidade do seguinte modo. Associamos os dois kets que descrevem o estado fı́sico |φi e |χi aos dois bras que descrevem o resultado pretendido hun | e hun′ | das duas maneiras possı́veis - figura 12.4. hun | |φi hun | |φi hun′ | |χi hun′ | |χi a) b) Figura 12.4: Associação dos dois kets que descrevem o estado fı́sico |φi e |χi aos dois bras que descrevem o resultado pretendido hun | e hun′ |. O termo a) é denominado termo directo; o termo b) é denominado termo de troca. Cada uma das duas maneiras origina uma amplitude de probabilidade e estas duas amplitudes interferem com sinal diferente para bosões e fermiões, originando probabilidades P(bn , bn′ ) = |A(bn , bn′ )|2 , diferentes. Explicitamente P(bn , bn′ ) = |hun |φihun′ |χi + ǫhun′ |φihun|χi|2 . (12.4.2) Notemos, por contraste, o resultado que seria obtido em Mecânica Quântica se as partı́culas não fossem idênticas. Consideramos que o estado fı́sico que descreve o sistema das duas partı́culas distinguı́veis é |1 : φ; 2 : χi . 422 Sistemas de partı́culas idênticas Fazemos uma medição que, embora as partı́culas sejam distinguiveis, nos dá uma propriedade fı́sica que não distingue entre elas (por exemplo, temos um electrão e um protão e medimos o spin). Logo os dois estados |1 : un ; 2 : un′ i , |1 : un′ ; 2 : un i , descrevem o mesmo resultado da medição. A probabilidade de obtermos os resultados bn e bn′ é dada pela soma das probabilidades de o sistema estar nos estados |1 : un ; 2 : un′ i e |1 : un′ ; 2 : un i: P ′ (bn , bn′ ) = |h1 : un ; 2 : un′ |1 : φ; 2 : χi|2 + |h1 : un′ ; 2 : un |1 : φ; 2 : χi|2 (12.4.3) 2 2 = |hun |φihun′ |χi| + |hun′ |φihun |χi| . Note-se a ausência do termo de interferência, cujo sinal depende de as partı́culas idênticas serem bosões ou fermiões. Este termo manifesta a diferença nas previsões fı́sicas da Mecânica Quântica dependendo se as partı́culas são idênticas - resultado (12.4.2) - ou distinguı́veis - resultado (12.4.3). n O O z z b) a) Figura 12.5: Processo de colisão de partı́culas idênticas no referencial de centro de massa. Assumimos que tanto o estado inicial, a), como o estado final, b), são estados próprios do momento, associados às direcções z e n̂, respectivamente. Para ilustrarmos o significado fı́sico dos termos directo e de troca, consideramos um exemplo mais concreto: a colisão elástica de duas partı́culas idênticas no referencial de centro de massa. Assumimos que o estado fı́sico que representa o estado inicial é 1 |Ψi i = √ (1̂ + ǫP̂21 )|1 : pez ; 2 : −pez i , 2 enquanto que o estado final é descrito por 1 |Ψf i = √ (1̂ + ǫP̂21 )|1 : pn̂; 2 : −pn̂i , 2 12.4 Consequências do postulado de simetrização 423 conforme a figura 12.5. O estado final relaciona-se com o estado inicial através do operador de evolução (4.5.36) |Ψ(t1 )i = Û (t1 , t0 )|Ψi i . Como o Hamiltoniano comuta com P̂21 , também o operador de evolução o fará [Û(t, t′ ), P̂21 ] = 0 . Assim, a amplitude de probabilidade para o processo descrito é: 1 † hΨf |Ψ(t1 )i = h1 : pn̂; 2 : −pn̂|(1̂ + ǫP̂21 )Û (t1 , t0 )(1̂ + ǫP̂21 )|1 : pez ; 2 : −pez i , 2 que, usando † † † (1̂ + ǫP̂21 )Û (t1 , t0 )(1̂ + ǫP̂21 ) = (1̂ + ǫP̂21 )(1̂ + ǫP̂21 )Û(t1 , t0 ) = 2(1̂ + ǫP̂21 )Û (t1 , t0 ) ; pode ser reescrita hΨf |Ψ(t1 )i = h1 : pn̂; 2 : −pn̂|Û(t1 , t0 )|1 : pez ; 2 : −pez i +ǫh1 : −pn̂; 2 : pn̂|Û(t1 , t0 )|1 : pez ; 2 : −pez i . Podemos pensar graficamente nestes dois termos como estando associados aos processos descritos na figura 12.6. Qual termo associamos a qual gráfico é irrelevante. O que importa é que temos de somar ou subtrair as respectivas amplitudes de probabilidade para bosões ou fermiões, respectivamente. n n z a) z b) Figura 12.6: Representação diagramática dos dois processos cujas amplitudes têm de ser consideradas no cálculo da probabilidade do processo descrito na figura 12.5. Um diagrama corresponde ao termo directo, por exemplo a), e outro ao termo de troca, por exemplo b). 424 Sistemas de partı́culas idênticas Fechamos esta subsecção comentando que há situações em que podemos na prática ignorar o postulado de simetrização e trabalhar com a função de onda para partı́culas idênticas, como se fossem partı́culas distinguı́veis. Consideremos dois exemplos. 1) Se as partı́culas idênticas tiverem funções de onda espaciais com uma sobreposição negligenciável, os problemas vistos no inı́cio deste capı́tulo não devem ocorrer, pois as partı́culas não se misturarão e não perderemos o “rasto” de cada uma delas. Em termos matemáticos, sejam U1 e U2 as regiões do espaço onde a função de onda das partı́culas, que rotulamos como (1) e (2), têm suporte. Se perguntarmos qual a probabilidade de encontrarmos uma partı́cula num sub-espaço da região U1 , e a outra num sub-espaço da região U2 , apenas um dos termos - o termo directo, por exemplo -, irá contribuir. O termo de troca será nulo pois corresponde a projectar a função de onda da partı́cula (1)/(2) num sub-espaço de U2 /U1 , onde não têm suporte. A resposta obtida para a densidade de probabilidade será a mesma do que se não simetrizarmos/anti-simetrizarmos a função de onda das partı́culas idênticas. 2) Se as duas partı́culas se encontrarem em estados ortogonais de spin, e o Hamiltoniano de interacção não actuar nas variáveis de spin, o spin funciona como um número quântico conservado que efectivamente distingue as partı́culas. 12.4.3 Difusão de duas partı́culas idênticas com spin A difusão, tal como foi tratada no capı́tulo 10, assumia uma clara separação entre a partı́cula difundida e a partı́cula difusora (modelada por um potencial difusor). O cálculo da secção eficaz de difusão baseava-se na leitura da amplitude de difusão, através da forma assimptótica dos estados estacionários de difusão (10.1.13). No caso de estudarmos difusão de duas partı́culas idênticas, é impossı́vel distinguir entre a partı́cula incidente e a partı́cula difundida. Consequentemente, no referencial de centro de massa, tem-se duas ondas planas incidentes idênticas, em rota de colisão: eikz , e−ikz . A função de onda total que descreve o processo de difusão e é obtida pela resolução da equação de Schrödinger, deverá ser simétrica (para bosões) ou anti-simétrica (para fermiões) na 12.4 Consequências do postulado de simetrização 425 troca das partı́culas ~r1 ↔ ~r2 . Esta troca, no referencial de centro de massa, corresponde a r↔r , θ ↔π−θ , z = r cos θ ↔ −z. (12.4.4) Logo, num sistema de partı́culas idênticas, a parte orbital da função de onda que descreve os estados estacionários de difusão terá a forma assimptótica eikr ~ r →∞ , (~r) −→ eikz ± e−ikz + (f (θ) ± f (π − θ)) vkdif r S,A (12.4.5) e não (10.1.13), onde S, A se referem respectivamente ao sinal ‘+’ e ‘−’ de modo a que a função de onda seja simétrica e anti-simétrica, respectivamente, na troca das duas partı́culas. Note que o sinal desta equação não é determinado pela natureza das partı́culas ser bosónica ou fermiónica. De facto o postulado de simetrização requer que a função de onda total, |Ψi, seja simétrica ou anti-simétrica na troca de duas partı́culas e não a função de onda orbital |vkdif i. Assim, para compreendermos qual o sinal a utilizar na função de onda orbital temos de considerar a função de onda total que terá para além da parte orbital uma parte de spin. Como exemplo consideremos a difusão de dois fermiões de spin 1/2. Vimos na secção 9.5.1 que o momento angular total e a respectiva função de onda de spin, |Si, serão: S = 1 (estado tripleto simétrico) ,    |1, 1i = |+, +i   √ |SiS = |1, 0i = (|+, −i + |−, +i)/ 2     |1, −1i = |−, −i √ |SiA = |0, 0i = (|+, −i − |−, +i)/ 2 . (12.4.6) S = 0 (estado singleto anti − simétrico) , Consideramos agora os dois casos possı́veis: ⋆ Se o sistema estiver polarizado, isto é num estado de momento angular total bem definido (|SiS ou |SiA ), a sua função de onda de spin será simétrica ou anti-simétrica, respectivamente. Como a função de onda total deverá ser anti-simétrica (as partı́culas são fermiões) teremos de escolher a função de onda orbital anti-simétrica ou simétrica respectivamente: |Ψi = |vkdif iA ⊗ |SiS ou |Ψi = |vkdif iS ⊗ |SiA . (12.4.7) 426 Sistemas de partı́culas idênticas Portanto, para um feixe polarizado com S = 1 a secção eficaz diferencial de difusão, dada pelo quadrado do módulo da amplitude de difusão, será: σ(θ, φ)A = |f (θ) − f (π − θ)|2 , (12.4.8) enquanto que para S = 0 será σ(θ, φ)S = |f (θ) + f (π − θ)|2 . (12.4.9) ⋆ Se o sistema não estiver polarizado, isto é estiver numa sobreposição de estado de momento angular total bem definido, a secção eficaz diferencial do processo é obtida calculando uma média de σ(θ, φ)A e σ(θ, φ)S , onde o peso de cada uma é dada pelo número de estados de spin que a ela estão associados. Na prática estamos a considerar todos os estados de spin equiprováveis. No nosso caso temos três estados com S = 1 e um estado com S = 0. Portanto a secção será dada por 3 1 σ(θ, φ) = σ(θ, φ)A + σ(θ, φ)S . 4 4 (12.4.10) O caso geral é agora simples de concluir. Se o spin de cada uma das partı́culas for s haverá 2s + 1 valores possı́veis para o momento angular total S (S = 2s, 2s − 1, . . . , 0); todos os estados no multipleto correspondente a cada S terão a mesma simetria (simétricos ou anti-simétricos na troca de duas partı́culas). A função de onda orbital é escolhida com a simetria apropriada de modo a que a função de onda total seja simétrica (anti-simétrica) se as partı́culas forem bosões (fermiões): ⋆ Se o sistema estiver polarizado no estado com momento angular total S e as partı́culas forem fermiões (bosões) então a secção eficaz diferencial é dada por σ(θ, φ)A = |f (θ) − f (π − θ)|2 , (12.4.11) se o multipleto com momento angular total S for simétrico (anti-simétrico) ou σ(θ, φ)S = |f (θ) + f (π − θ)|2 , (12.4.12) se o multipleto com momento angular total S for anti-simétrico (simétrico). 12.4 Consequências do postulado de simetrização 427 ⋆ Se o sistema não estiver polarizado temos σ(θ, φ) = s+1 s σ(θ, φ)A + σ(θ, φ)S , 2s + 1 2s + 1 (12.4.13) σ(θ, φ) = s s+1 σ(θ, φ)S + σ(θ, φ)A , 2s + 1 2s + 1 (12.4.14) para fermiões e para bosões, dado que genericamente teremos (2s + 1)2 estados de spin dos quais s(2s + 1) serão anti-simétricos e (s + 1)(2s + 1) serão simétricos. Exemplo: Considere a difusão neutrão-neutrão a baixa energia, tomando o potencial de interacção V (r) = ~σ1 · ~σ2 V0 e−αr , r (12.4.15) onde α, V0 são constantes positivas e σi a matriz de Pauli para o neutrão i = 1, 2. Pretendemos calcular a secção eficaz de difusão supondo que os feixes dos neutrões não estão polarizados, na primeira aproximação de Born. Começamos por escrever o operador de spin total do sistema ~ ~ Ŝ = ~ŝ1 + ~ŝ2 = (~σ1 + ~σ2 ) , 2 (12.4.16) dado serem partı́culas de spin 1/2. Logo   1 , se S = 1 2 ~σ1 · ~σ2 = 2 Ŝ 2 − ŝ21 − ŝ22 = .  −3 , se S = 0 ~ (12.4.17) Logo, para feixes polarizados o potencial é efectivamente  e−αr   , se S = 1  V0 r V (r) = . (12.4.18) −αr  e   −3V0 , se S = 0 r A amplitude de difusão para cada um destes potenciais na primeira aproximação de Born é, usando (10.2.51) e (10.2.39)  2µV0 1   − 2 , se S = 1  2  ~ 4k 2 sin θ2 + α2 fkBorn (θ, φ) =  1 6µV0   , se S = 0  2 θ 2 2 ~ 4k sin 2 + α2 . (12.4.19) 428 Sistemas de partı́culas idênticas A secção eficaz diferencial de difusão é dada por (12.4.10) usando (12.4.8) e (12.4.9) 3 1 σ(θ, φ) = |fkS=1(θ) − fkS=1 (π − θ)|2 + |fkS=0 (θ) + fkS=0 (π − θ)|2 , 4 4 ou 3 2µV0 σ(θ, φ) = − 2 4 ~ 1 6µV0 + 4 ~2 12.5 1 − 2 2 θ 2 2 4k sin 2 + α 4k cos2 2θ + α2 ! 1 1 + 4k 2 sin2 2θ + α2 4k 2 cos2 2θ + α2 1 ! (12.4.20) 2 (12.4.21) 2 . Átomos com vários electrões - A tabela periódica No capı́tulo 6 estudamos o átomo de Hidrogénio, considerando apenas o termo cinético e a interacção de Coulomb entre o electrão e o protão. O problema é exactamente solúvel e obtivemos o espectro e as funções de onda analiticamente. Este estudo foi refinado no capı́tulo 11, em que consideramos as primeiras correcções relativistas e em particular o spin, para perceber e calcular perturbativamente a estrutura fina. Ao considerarmos átomos com vários electrões, o problema, mesmo considerando apenas a interacção de Coulomb, deixa de ser exactamente solúvel. A razão é que existe uma interacção repulsiva de Coulomb entre os vários electrões, que faz com que os electrões deixem de sentir um potencial central. Para um átomo com número atómico Z, o Hamiltoniano será: Z Z X P̂i2 e2 1 X 1 X Ze2 Ĥ = + − , 2me 4πǫ0 i=1 R̂i 4πǫ0 i<j |R̂i − R̂j | i=1 (12.5.1) onde o último termo (que corresponde, de facto, a Z(Z − 1)/2 termos) descreve as interacções entre os electrões do átomo. Note-se que o Hamiltoniano é uma observável simétrica, como requerido para uma observável fı́sica. Podiamos sugerir um tratamento perturbativo para este Hamiltoniano, considerando o terceiro termo em (12.5.1) como uma perturbação aos outros dois, que podem ser resolvidos exactamente. Estimando tanto R̂i como |R̂i − R̂j | pelo raio de Bohr, a razão entre o terceiro e segundo termos em (12.5.1) é Z(Z − 1)/2 , Z2 12.5 Átomos com vários electrões - A tabela periódica 429 que varia entre 1/4 para Z = 2 e 1/2 para Z elevado. Claramente um tratamento perturbativo não será uma boa aproximação. Existe, no entanto uma aproximação que pode ser usada para tratar este problema: a aproximação de campo central. Esta aproximação consiste em considerar que cada electrão sente um potencial efectivo central, Vc (R̂i ), que leva em conta, não só o potencial atractivo do núcleo mas também o potencial repulsivo dos outros electrões. Uma intuição classica revela que o potencial dos outros electrões depende, ele próprio, da localização do electrão que consideramos; para além disso, se o electrão considerado estiver muito próximo de outro electrão e a posição relativa não for radial, o potencial central será uma aproximação pobre. Contudo, em mecânica quântica, onde os electrões se encontram delocalizados, esta aproximação parece ser mais justificada. Assim consideramos o Hamiltoniano do problema (12.5.1) na forma seguinte: Ĥ = Ĥ0 + Ŵ , onde Ĥ0 = Z X i=1 P̂i2 + Vc (R̂i ) 2me ! , Z Z X e2 1 X 1 X Ze2 + − Vc (R̂i ) . Ŵ = − 4πǫ0 i=1 R̂i 4πǫ0 i<j |R̂i − R̂j | i=1 Se o potencial Vc (R̂i ) for escolhido apropriadamente, Ŵ pode ser considerado uma perturbação a Ĥ0 , que por sua vez corresponde a Z cópias de um Hamiltoniano efectivo para uma partı́cula dado por Ĥef e = P̂i2 + Vc (R̂) . 2me (12.5.2) A aproximação de campo central consiste em escolher apropriadamente Vc (R̂), negligenciar Ŵ e resolver Ĥef e . O ponto crucial é a escolha de Vc (R̂), que é um problema complexo e não será aqui tratado. A ideia é procurar uma solução auto-consistente, isto é: i) A escolha do potencial Vc (R̂) tem que garantir que Ŵ é uma perturbação; ii) A função de onda dos outros Z − 1 electrões é calculada usando Vc (R̂); estas funções de onda têm de ser consistentes com o próprio potencial, no sentido que têm de reproduzir a densidade de carga que produz Vc (R̂). 430 Sistemas de partı́culas idênticas Se bem que a determinação exacta de Vc (R̂) seja um problema complexo, a sua forma para pequenas e longas distâncias pode ser vislumbrada de um modo simples. • Para r pequeno, o electrão considerado encontra-se dentro da nuvem electrónica dos outros electrões, sentindo por isso, apenas o potencial nuclear; assim, o potencial será Vc (r) ≃ − 1 Ze2 ; 4πǫ0 r • Para r grande, o electrão considerado encontra-se fora da nuvem electrónica dos outros electrões; efectivamente os Z − 1 electrões anulam Z − 1 cargas positivas do núcleo, pelo que o potencial será Vc (r) ≃ − 1 e2 . 4πǫ0 r Para valores intermédios, Vc (r) interpola entre estes dois comportamentos, de um modo mais ou menos complicado, dependendo do átomo - figura 12.7. Note-se que estes dois potenciais coincidem para o Hidrogénio. Figura 12.7: A tracejado representam-se os potenciais correspondentes às aproximações longe e perto do núcleo. A cheio representa-se um potencial que interpola entre os dois (Extraı́do de Cohen et al, ‘Quantum Mechanics’). 12.5 Átomos com vários electrões - A tabela periódica 12.5.1 431 Nı́veis de energia Estas considerações qualitativas, permitem-nos inferir, qualitativamente, a estrutura do espectro de energias do Hamiltoniano (12.5.2): i) Dado que o potencial efectivo é central, as funções de onda devem ser caracterizadas por um número quântico principal N e um número quântico angular ℓ, tal como no caso do átomo de Hidrogénio. Mas, enquanto que no caso do Hidrogénio, há uma degenerescência acidental (que pode ser ligada a uma simetria escondida do potencial 1/r que alarga o grupo de simetria do problema para SO(4) e não SO(3)) que permite aos valores próprios do Hamiltoniano só dependerem de N, aqui esperamos que os nı́veis de energia dependam de N e ℓ, ou seja, EN,ℓ . Tal como no Hidrogénio, o número quântico principal é introduzido à custa de um inteiro n0 , que surge quando resolvemos a equação radial, e por isso ℓ≤N −1 . ii) Esperamos que a energia aumente com N, para ℓ fixo: EN ′ ,ℓ > EN,ℓ , N′ > N . iii) Esperamos que a energia aumente com ℓ, para N fixo: EN,ℓ′ > EN,ℓ , ℓ′ > ℓ . De facto, quanto maior o momento angular, para N fixo, esperamos que a função de onda esteja localizada mais longe do núcleo, correspondendo portanto a um estado menos ligado. iv) Existe uma degenerescência de 2(2ℓ + 1) de cada nı́vel de energia; o factor (2ℓ + 1) é devido à invariância de rotação (que torna o módulo da função de onda e a energia independentes de mℓ ) e o factor de 2 é devido ao spin. Verifica-se de facto que a hierarquia de energia é muito semelhante para todos os átomos, embora os valores absolutos dependam de Z. A figura 12.8 representa essa hierarquia. Contraste-se o comportamento com o do átomo de Hidrogénio - Figura 6.4. 432 Sistemas de partı́culas idênticas Figura 12.8: Hierarquia energética das várias camadas para um potencial central do tipo representado na figura 12.7. Note-se que para N fixo (na figura representado como n), a energia aumenta com ℓ. Entre parêntises encontra-se a degenerescência de cada nı́vel. Entre chavetas encontram-se nı́veis muito próximos cuja disposição relativa depende do átomo. À direita de cada camada encontram-se os sı́mbolos quı́micos dos átomos cuja última camada ocupada (no estado fundamental) é essa (Extraı́do de Cohen et al, ‘Quantum Mechanics’). 12.5.2 Configurações electrónicas e princı́pio da exclusão de Pauli Como os electrões são fermiões, obedecem ao princı́pio de exclusão de Pauli. Assim, depois de resolvermos o Hamiltoniano (12.5.2) construimos, na aproximação de campo central, as funções de onda de um átomo com número atómico Z através do determinante de Slater, construido com as funções de onda de (12.5.2). O estado fundamental do átomo é assim obtido quando os Z electrões ocupam as orbitais de menor energia de um modo compatı́vel 12.5 Átomos com vários electrões - A tabela periódica 433 com o princı́pio de exclusão de Pauli. Cada nı́vel energético EN,ℓ tem degenerescência 2(2ℓ + 1) e o conjunto de estados individuais associados a essa mesma energia chama-se uma “shell ” ou camada. A lista das camadas ocupadas com os respectivos números de ocupação chama-se a configuração electrónica do átomo. O conhecimento desta configuração electrónica permite-nos interpretar as propriedades fı́sicas e quı́micas de um átomo. A configuração electrónica de um determinado átomo é obtida enchendo as várias camadas, começando no nı́vel de menor energia, 1s, e seguindo a ordem crescente de energia (i.e. pela ordem apresentada na figura 12.8), até esgotar os Z electrões: Z = 1; O átomo de Hidrogénio, no seu estado fundamental, tem o seu único electrão no nı́vel 1s: H : 1s ; Note-se que para o Hidrogénio, a energia não depende de ℓ, pelo que devemos usar a figura 6.4 e não a figura 12.8. Z = 2; O átomo de Hélio, no seu estado fundamental, tem os seus dois electrões no nı́vel 1s: He : 1s2 ; ou seja os dois electrões têm spins opostos; Z = 3; O átomo de Lı́tio, no seu estado fundamental, tem dois electrões no nı́vel 1s e o terceiro no nı́vel 2s: Li : 1s2 , 2s ; Z = 4; O átomo de Berı́lio, no seu estado fundamental, tem dois electrões no nı́vel 1s e dois no nı́vel 2s: Be : 1s2 , 2s2 ; Para Z > 4 começa-se a encher a camada 2p, que pode comportar 6 electrões, correspondendo aos estados fundamentais dos elementos Boro, Carbono, Azoto, Oxigénio, Flúor e 434 Sistemas de partı́culas idênticas Neon. Para Z = 11, 12, enche-se o nı́vel 3s, correspondendo aos estados fundamentais do Sódio e Magnésio, etc. Assim, obtêm-se as configurações electrónicas de todos os átomos, que, em última análise, explicam a tabela periódica de Mandeleev - Figura 12.9. Figura 12.9: Uma tabela periódica dos elementos. Note-se que nı́veis muito próximos (aqueles dentro de chavetas na figura 12.8), podem ser enchidos de uma maneira irregular. Por exemplo, na figura 12.8 a camada 4s é repre- 12.6 Sumário 435 sentada como tendo menos energia que a camada 3d. No entanto, o Crómio (Z = 34) tem 5 electrões na camada 3d e a camada 4s incompleta. Irregularidades semelhantes aparecem para o Cobre (Z = 29), Niobium (Z = 41), etc. Apesar das subtilezas, algumas caracterı́sticas são bastante intuitivas. Por exemplo a energia de ionização para o Hélio é 24.6 eV, ligeiramente menos do que o dobro do valor do Hidrogénio, porque, apesar de existir uma força atractiva entre os electrões e o núcleo que é o dobro daquela que existe no Hidrogénio, existe também uma força repulsiva entre os dois electrões que diminui a energia de ligação. Um comentário final prende-se com o momento angular dos átomos. Pode-se mostrar que numa camada completa, o momento angular total é zero, tal como o momento angular orbital e o momento angular de spin. Assim, o momento angular de um átomo é totalmente devido aos seus electrões exteriores. Por exemplo, o momento angular total do hélio, no seu estado fundamental é zero, tal como para todos os gases raros, enquanto que o momento angular total do Lı́tio é 1/2, devido a um electrão desemparelhado numa orbital s, tal como para todos os metais alcalinos. 12.6 Sumário Neste capı́tulo estudamos a descrição quântica de sistemas com várias partı́culas idênticas. Começamos por observar que existe uma degenerescência de funções de onda que podem descrever o sistema depois de termos feito uma medição do mesmo tão completa quanto possı́vel. Essa “degenerescência de troca” introduz ambiguidades nas previsões fı́sicas. Tais ambiguidades podem ser levantadas introduzindo o postulado de simetrização, que postula que os estados fı́sicos podem ter dois tipos, bosões e fermiões, correspondendo a funções de onda totalmente simétricas ou totalmente anti-simétricas na troca de duas quaisquer partı́culas. As funções de onda fı́sicas são construidas com os operadores simetrizador e anti-simetrizador, definidos à custa dos operadores de permutação, que estudamos em detalhe. Estudamos ainda as diferenças fı́sicas entre bosões e fermiões, a principal das quais é o princı́pio de exclusão de Pauli para os fermiões, inexistente para bosões. A 436 Sistemas de partı́culas idênticas existência deste princı́pio em sistemas de fermiões é responsável pela existência da energia de Fermi e pela ausência de um fenómeno do tipo da condensação de Bose-Einstein. Ele está ainda na origem das diferentes estatı́sticas para bosões e fermiões (Bose-Einstein e Fermi-Dirac). Mostramos como os termos directo e de troca têm interferências diferentes para fermiões e bosões. Terminamos fazendo algumas considerações sobre a estrutura dos átomos com vários electrões. Descrevemos qualitativamente a aproximação de campo central, que nos permite resolver o problema e apresentamos a estrutura dos nı́veis de energia. Juntamente com o princı́pio de exclusão de Pauli, esta estrutura permitiu-nos descrever a configuração electrónica dos átomos, que, por sua vez, permite compreender a estrutura da tabela periódica dos elementos - figura 12.9. CAPÍTULO 13 Introdução à Mecânica Quântica Relativista A teoria quântica que construimos até agora é uma teoria não relativista. A equação de onda de Schrödinger não possui invariância de Lorentz, dado ter sido construida com base na relação de dispersão não relativista (3.0.2). Neste capı́tulo vamos introduzir duas equações de onda invariantes por transformações de Lorentz, i.e. covariantes, de modo a obedecer aos princı́pios da relatividade restrita: a equação de Klein-Gordon e a equação de Dirac. A covariância é necessária para poder aplicar a teoria quântica a partı́culas com energia elevada. Note-se que não é necessário (felizmente!) fazer a teoria totalmente covariante, i.e. compatı́vel com os princı́pios da relatividade geral, pois a interacção gravı́tica é negligenciável nos fenómenos atómicos de interesse para o estudo aqui efectuado. Veremos que, das duas equações, apenas uma - a de Dirac - descreve partı́culas com spin e como tal é a equação relativista apropriada para descrever o electrão. 13.1 A teoria de Klein-Gordon A equação de Schrödinger (3.0.6) foi construı́da no capı́tulo 3 a partir da relação não relativista entre a energia e o momento (3.0.2). Como visto na secção 4.4.2 essa construção 438 Introdução à Mecânica Quântica Relativista pode ser vista como resultando da associação à energia e ao momento dos operadores: E → i~ ∂ , ∂t ~p → −i~∇ . (13.1.1) Se procuramos uma equação fundamental da Mecânica Quântica Relativista é natural fazer esta mesma associação na relação relativista entre a energia e o momento, que é: E 2 = m20 c4 + p2 c2 ⇔ pµ pµ = m20 c2 , (13.1.2) onde m0 é a massa em repouso da partı́cula, c é a velocidade da luz, p2 = p~ · p~ é o quadrado do 3-momento e pµ é o 4-vector momento: E E µ , p~ ⇔ pµ = , −~p , p = c c (13.1.3) onde, em conformidade com a maioria da literatura sobre Mecânica Quântica Relativista e Teoria Quântica de Campo, usamos a métrica de Minkowski com assinatura ‘maioritariamente negativa’ ds2 = ηµν dxµ dxν = (dx0 )2 − δij dxi dxj ; (13.1.4) o 4-vector posição espaço-temporal é: xµ = (x0 , ~x) = (ct, ~x) . Usando (13.1.1) em (13.1.3) obtemos que E 1∂ ∂ pµ = , −~p → i~ , ∇ = i~ µ , c c ∂t ∂x (13.1.5) (13.1.6) ou pµ → i~∂µ , (13.1.7) que é a associação de operadores (13.1.1) em notação manifestamente covariante por transformações de Lorentz (i.e relativista). Usando esta associação em (13.1.2) obtemos a equação de Klein-Gordon:1 m c 2 0 Φ(xµ ) ; 2Φ(x ) = − ~ µ 1 (13.1.8) Esta equação foi descoberta independentemente e praticamente simultaneamente pelo fı́sico sueco Oskar Klein (1894 - 1977), Z.f.Phys. 37 (1926) 895, e pelo fı́sico alemão Walter Gordon (1893-1940), 13.2 Os problemas com a teoria de Klein-Gordon 439 denotamos o operador D’Alambertiano por 2 2 = ∂µ ∂ µ = 1 ∂2 −∆ , c2 ∂t2 (13.1.9) e ∆ é o operador Laplaciano. Estes operadores são a segunda derivada covariante num espaço Lorentziano e Euclidiano respectivamente. Têm uma expressão covariante, isto é válida para um sistema de coordenadas arbitrário e num espaço arbitrário, que é dada pela métrica gµν nesse espaço e nesse sistema de coordenadas: p 1 ∆, 2 . . . = p ∂µ g µν |g|∂ν . . . , |g| (13.1.10) onde |g| é o módulo do determinante da métrica e ‘. . .’ representa a função escalar onde estes operadores actuam. 13.2 Os problemas com a teoria de Klein-Gordon A equação (13.1.8) é de facto uma equação invariante por transformações de Lorentz, ao contrário da equação de Schrödinger. Mas dadas as diferenças fı́sicas entre a Mecânica não relativista e a Mecânica relativista colocam-se duas questões: i) Será que podemos ainda interpretar as soluções da equação de Klein-Gordon Φ(xµ ) como uma função de onda, que descreve uma amplitude de probabilidade, do mesmo modo que fazemos na Mecânica Quântica não relativista? ii) Será que esta é a equação relativista correcta para descrever o electrão? Z.f.Phys. 40 (1926) 117. Contudo, a história parece ser algo mais interessante (ver S.Weinberg, Quantum Field Theory, Vol I, Sec. 1.1). Em 1926 Schrödinger publicou quatro artigos sobre a mecânica ondulatória, em que deriva a ‘sua’ equação, mostra equivalência com a mecânica matricial e só mais tarde, no quarto artigo, apresenta a equação de onda relativista. Contudo, apesar de ter publicado primeiro a equação que tem o seu nome e é não relativista, Schrödinger terá derivado inicialmente a equação relativista (13.1.8). Mas ao calcular o espectro do átomo de hidrogénio, Schrödinger observou que a equação relativista dava o resultado errado para a estrutura fina do átomo de hidrogénio. No limite não relativista, no entanto, a equação (de Klein-Gordon) reduzia-se a uma equação que Schrödinger se apercebeu ser útil (a eq. de Schrödinger) e que foi a eq. inicialmente publicada por ele, apesar de saber que era o limite não relativista de uma eq. incorrecta! Quando, mais tarde, Schrödinger publicou a eq. relativista (Ann. Phys. 81 (1926) 109), esta já havia sido redescoberta por Klein e Gordon. 440 13.2.1 Introdução à Mecânica Quântica Relativista Energias negativas Para respondermos à questão i) consideremos, em primeiro lugar, os estados da equação de Klein-Gordon análogos aos estados estacionários da equação de Schrödinger. Separando variáveis: Φ(xµ ) = T (t)φ(~x) , (13.2.1) a equação de Klein-Gordon fica: − m c 2 1 1 d2 T (t) 1 0 + ∆φ(~ x ) = ; c2 T (t) dt2 φ ~ (13.2.2) pelo argumento habitual esta equção separa-se em duas: − ω2 1 1 d2 T (t) = , c2 T (t) dt2 c2 1 ∆φ(~x) = −k 2 , φ onde introduzimos as constantes ω 2 e k 2 , que obedecem à relação de dispersão: r 2 4 m2 c4 m c ω 2 = k 2 c2 + 02 ⇒ ω± = ± k 2 c2 + 02 . ~ ~ (13.2.3) (13.2.4) A solução geral da primeira equação em (13.2.3) é T (t) = c+ e−iω+ t + c− e−iω− t , (13.2.5) enquanto que a segunda equação pode ser escrita como −∆φ(~x) = k 2 φ(~x) , (13.2.6) que é exactamente a forma da equação de Schrödinger livre e independente do tempo. A diferença fundamental é que no tratamento não relativista o vector de onda de uma partı́cula livre relaciona-se com a frequência por: k2 = p2 2mE 2mω = = 2 2 ~ ~ ~ ⇔ ω= ~k 2 . 2m (13.2.7) e, em particular existe apenas uma frequência para cada vector de onda. No caso relativista, k 2 relaciona-se com a frequência pela relação de dispersão (13.2.4) e, em particular, existem duas frequências possı́veis para cada k 2 , correspondendo a um modo de energia positiva e 13.2 Os problemas com a teoria de Klein-Gordon 441 outro de energia negativa. A existência de dois modos para cada comprimento de onda é uma consequência directa da equação de Klein-Gordon ser de segunda ordem na derivada temporal. Assim, escrevemos a solução como Φ(xµ ) = Φ+ (xµ ) + Φ− (xµ ) , Φ± (xµ ) = φ(~x)e−iω± t , (13.2.8) onde Φ+ (xµ ) (Φ− (xµ )) correspondem ao modo com energia positiva (negativa), como pode ser verificado pela acção do operador (13.1.1). A existência de modos com energia negativa pode ser problemática, se não existir um limite inferior para as energias negativas. Para ilustrar este ponto considermos a equação de Klein-Gordon num intervalo. Isto é, requeremos que φ(x) seja não nulo somente em 0 < x < a, anulando-se, por continuidade nos extremos. Esta situação é o análogo a um poço de potencial de profundidade infinita para a eq. de KG. A solução tem a forma (13.2.8) com φ(x) = A sin(kn x) , kn = nπ , n∈N, a onde A é uma constante de normalização. Por (13.2.4), r n2 π 2 c2 m20 c4 ω± = ± + 2 . a2 ~ (13.2.9) (13.2.10) Logo, a energia não está limitada inferiormente; ω− torna-se arbitrariamente grande e negativo para n grande. Isto implica que somente a teoria livre é consistente. Se introduzirmos interacções que permitam à partı́cula saltar de um nı́vel energético para outro, poderemos extrair uma energia arbitrariamente grande do sistema quando a partı́cula de Klein-Gordon saltar para nı́veis de energia arbitrariamente grande e negativa. A existência de tais nı́veis é uma razão para considerarmos que a equação de Klein-Gordon não é adequada para descrever quânticamente uma partı́cula relativista com interacções. 13.2.2 Probabilidades negativas A interpretação das soluções da equação de Schrödinger como amplitudes de probabilidade foi legitimada por existir um produto escalar. Para sermos concretos consideremos funções 442 Introdução à Mecânica Quântica Relativista de onda em R3 ; esse produto escalar toma a forma (4.1.6) Z (φ, ψ) = d3~xφ∗ (~x)ψ(~x) . (13.2.11) Este produto é: i) positivo (cf. secção 4.1.1), permitindo como tal definir uma norma positiva, Z 2 ||ψ|| = d3~xψ ∗ (~x)ψ(~x) , (13.2.12) associada a uma densidade de probabilidade positiva: P(~x) = ψ ∗ (~x)ψ(~x) ≥ 0 , ∀~x ; (13.2.13) ii) globalmente conservado na evolução do sistema, dada a hermiticiade do operador Hamiltoniano (cf. secção 4.4.4): d (φ, ψ) = 0 . dt (13.2.14) Note que conservação local de probabilidade é expressa pela equação de continuidade (4.4.55) ∂ ~ x, t) = 0 , P(~x, t) + ∇ · J(~ ∂t (13.2.15) onde o vector densidade de corrente de probabilidade é (4.4.53). Para a equação de Klein-Gordon podemos introduzir um 4-vector densidade de corrente conservado, definido por Jµ (xα ) = i [Φ∗ (xα )∂µ Φ(xα ) − Φ(xα )∂µ Φ∗ (xα )] . (13.2.16) A equação de Klein-Gordon garante que ele é conservado: ∂ µ Jµ = 0 . (13.2.17) De facto ∂ µ Jµ = i [∂ µ Φ∗ (xα )∂µ Φ(xα ) + Φ∗ (xα )∂ µ ∂µ Φ(xα ) − ∂ µ Φ(xα )∂µ Φ∗ (xα ) − Φ(xα )∂µ ∂ µ Φ∗ (xα )] = i [Φ∗ (xα )2Φ(xα ) − Φ(xα )2Φ∗ (xα )] h 2 (13.1.8) = i −Φ∗ (xα ) m~0 c Φ(xµ ) + Φ(xα ) m0 c 2 ~ i Φ∗ (xµ ) = 0 . (13.2.18) 13.2 Os problemas com a teoria de Klein-Gordon 443 A equação (13.2.17) é uma versão covariante da equação de continuidade (13.2.15). Por isso usamos a componente temporal do co-vector Jµ para definir um novo produto escalar : Z Z ∗ α α α ∂Φ (x ) 3 α 3 ∗ α ∂Φ(x ) − Φ(x ) , (13.2.19) (Φ, Φ) ≡ d ~xJ0 (x ) = i d ~x Φ (x ) ∂x0 ∂x0 ou, generalizando para campos diferentes e usando x0 = ct Z α ∗ α i 3 ∗ α ∂Ψ(x ) α ∂Φ (x ) d ~x Φ (x ) . (Φ, Ψ) ≡ − Ψ(x ) c ∂t ∂t (13.2.20) Note-se que este produto escalar pressupõe uma foliação particular do espaço-tempo: foi escolhida um certa famı́lia de hiper-superfı́cies espaciais onde se integra. Este produto é i) Conservado d (Φ, Ψ) = 0 ; dt (13.2.21) 2 ∗ α ∂ 2 Ψ(xα ) α ∂ Φ (x ) d ~x Φ (x ) − Ψ(x ) ∂t2 ∂t2 Z (13.1.8) = ic d3~x {Φ∗ (xα )∆Ψ(xα ) − Ψ(xα )∆Φ∗ (xα )} = 0 , (13.2.22) de facto d i (Φ, Ψ) = dt c Z 3 ∗ α onde a última igualdade é verificada integrando por partes e negligenciando o termo fronteira (assume-se que o campo se anula no infinito). ii) Mas não é positivo: Fazendo o produto escalar entre modos de energia positiva (energia negativa) (13.2.8) obtemos 2ω± (Φ , Φ ) = c ± ± Z d3~xφ∗ (~x)φ(~x) , (13.2.23) que é claramente positivo (negativo): modos de energia negativa têm norma negativa. Deste modo o produto escalar conservado não nos permite pensar numa solução genérica da equação de Klein-Gordon como descrevendo uma amplitude de probabilidade, dado que a densidade de probabilidade correspondente poderia ser negativa. A existência de tais normas negativas revela que a interpretação de Born não pode ser extrapolada para as ‘funções de onda de Klein-Gordon’. A Mecânica Quântica não relativista não encontra paralelo na teoria de Klein-Gordon. 444 13.2.3 Introdução à Mecânica Quântica Relativista Inexistência de spin No capı́tulo 1 vimos que a força de Lorentz que actua numa partı́cula carregada,2 ~ v ~ , ~ + ×B (13.2.24) F~ = q E c pode ser reproduzida no formalismo Hamiltoniano tomando H= ~ 2 (~p − q A/c) + qφ . 2m (13.2.25) Como discutido nessa altura vimos que a interacção com o campo magnético é efectivamente considerada pela substituição (designada por acoplamento minimal ) q~ p~ −→ p~ − A . c (13.2.26) Notamos aqui que a interacção com o campo eléctrico é também efectivamente considerada pela substituição E → E − qφ ; (13.2.27) as duas últimas equações correspondem às componentes espaciais e temporal, respectivamente, da seguinte equação covariante: E q E − qφ q~ µ p = , p~ → , ~p − A = pµ − Aµ , c c c c (13.2.28) onde definimos o 4-vector potencial electromagnético como ~ µ = (φ, A) ~ ⇔ A ~ µ = (φ, −A) ~ . A (13.2.29) As substituições (13.2.26) e (13.2.27) transformam a relação relativista para a energia em 2 ~ 2 ⇔ pµ − q Aµ = m2 c2 . (E − qφ)2 = m20 c4 + (c~p − q A) (13.2.30) 0 c A equação de Klein-Gordon minimalmente acoplada a um campo electromagnético, é obtida pela associação (13.1.7) na última equação, obtendo-se q µ q µ i~∂µ − Aµ i~∂ − A Φ(xα ) = m20 c2 Φ(xα ) . c c 2 (13.2.31) Neste capı́tulo vamos usar unidades electromagnéticas diferentes das usadas no capı́tulo 1, de modo a que os campos eléctrico e magnético fiquem com as mesmas dimensões; isto corresponde a transformar ~ → B/c ~ em (1.1.7) e A ~ → A/c ~ em (1.3.20). B 13.2 Os problemas com a teoria de Klein-Gordon 445 Potencial de Coulomb Para testar se o electrão do átomo de Hidrogénio é apropriadamente descrito pela equação de Klein-Gordon (13.2.31), vamos resolver esta equação para o potencial de Coulomb. Tomamos Aµ = e ~ ,0 , 4πǫ0 r q = −e , m0 = me , (13.2.32) onde e é a carga do electrão (em módulo) e procuramos os estados estacionários da equação de Klein Gordon usando o seguinte ansatz: Φ(xµ ) = F (r)Yℓm (θ, φ)e−iEt/~ . (13.2.33) A equação (13.2.31) fica ~∂ e2 e2 ~∂ 2 2 2 i + ~ ∆ − me c F (r)Yℓm (θ, φ)e−iEt/~ = 0 , + + i c ∂t 4πǫ0 cr c ∂t 4πǫ0 cr (13.2.34) ou, usando 1 ∂ ∆= 2 r ∂r L̂2 2 ∂ r − 2 2 , ∂r r ~ (13.2.35) obtemos " E α~ + c r 2 ~2 d + 2 r dr # 2 d ~ ℓ(ℓ + 1) r2 − − m2e c2 F (r) = 0 , dr r2 (13.2.36) onde introduzimos a constante de estrutura fina α, dada por (2.2.4). Escrevendo F (r) = R(r) , r (13.2.37) a equação fica d2 −r R(r) = dr 2 2 E 2 − m2e c4 2 2Eα 2 R(r) . r + r − ℓ(ℓ + 1) − α ~ 2 c2 c~ (13.2.38) Notemos que, em primeira aproximação em v/c, E 2 − m2e c4 = me c2 p 1− (v/c)2 !2 − m2e c4 ≃ m2e v 2 c2 = 2me Ec c2 , E ≃ me c2 , (13.2.39) 446 Introdução à Mecânica Quântica Relativista onde Ec é a expressão habitual para a energia cinética não relativista; negligenciando ainda o termo em α2 em (13.2.38), esta equação reduz-se a 2 2me Ec 2 me e2 2 d R(r) ≃ r + r − (ℓ(ℓ + 1)) R(r) , −r dr 2 ~2 2πǫ0 ~2 (13.2.40) que coincide com a equação (6.4.3) que descreve o átomo de Hidrogénio (sem spin) na mecânica quântica não relativista. Portanto, no limite não relativista, a equação de KleinGordon acoplada a um campo electromagnético dará o espectro correcto para o átomo de hidrogénio (6.4.18). Contudo este resultado só é válido em primeira ordem em α e vimos no capı́tulo 11 as primeiras correcções que originam a estrutura fina. Se a equação de Klein-Gordon for a equação correcta para descrever o electrão do átomo de Hidrogénio, essas correcções deverão emergir naturalmente da solução de (13.2.38). É simples obter a solução exacta desta equação usando os resultados do capı́tulo 6: tal como para (6.4.3), transformamos (13.2.38) na equação de Whittaker (6.4.4) fazendo z2 m2 c4 − E 2 2 2p 2 4 = e 2 2 r ⇔ z= me c − E 2 r , 4 ~c ~c (13.2.41) que é a relação análoga a (6.4.15) e Eα k=p , m2e c4 − E 2 m= s 1 ℓ+ 2 2 − α2 , (13.2.42) que são as relações análogas a (6.4.16). Como visto em detalhe na secção 6.4, para que a função de Whittaker convirja quando z → +∞, tem de existir um inteiro n0 tal que n0 + m − k + 1/2 = 0 , n0 ∈ N0 . (13.2.43) Esta condição fica, com as identificações anteriores s 2 1 Eα 1 + =0, n0 + − α2 − p ℓ+ 2 4 2 2 2 me c − E (13.2.44) que, introduzindo o número quântico principal N ≡ n0 + ℓ + 1 e resolvendo para a energia fica  −1/2   α2   EN,ℓ = me c2 1 + 2  q   2 N − ℓ − 21 + ℓ + 12 − α2 . (13.2.45) 13.2 Os problemas com a teoria de Klein-Gordon 447 Este é o espectro de energias exacto obtido da equação de Klein-Gordon acoplada ao potencial de Coulomb; depende de dois números quânticos, N e ℓ que são os números quânticos principal e de momento angular habituais. Podemos agora verificar que este espectro não explica correctamente a estrutura fina do átomo de Hidrogénio. Fazendo uma expansão de (13.2.45) em potências de α obtém-se: EN,ℓ = me c 2 α2 α4 1− − 2N 2 2N 4 3 N 1 − 4 ℓ+ 2 6 + O(α ) . (13.2.46) O primeiro termo é a energia associada à massa em repouso do electrão; o segundo termo é o espectro de energias obtido no capı́tulo 6 para o átomo de Hidrogénio (6.4.18); o terceiro termo deveria ser o termo de estrutura fina. Para o nı́vel N = 2 este termo separa as orbitais 2s e 2p, que passam a ter energia (até ordem α4 ) E2,0 = −me c 2 α2 13α4 + 8 128 , E2,1 = −me c 2 α2 7α4 + 8 384 , (13.2.47) que estão portanto separadas por E2,1 − E2,0 = 8 4me c2 α4 . 3 128 (13.2.48) Como discutido na secção 11.1.4 a separação observada experimentalmente (e correctamente explicada pela teoria perturbativa) é de apenas 4me c2 α4 /128. Portanto a equação de Klein-Gordon não explica correctamente a estrutura fina. Logo a equação de KleinGordon não descreve correctamente a fı́sica do electrão do átomo de Hidrogénio. A razão é que a função de onda de Klein-Gordon não contém graus de liberdade de spin, que é fundamental para obter a estrutura fina correcta. De facto, como visto na secção 9.4, a descrição (não relativista) de partı́culas de spin 1/2 envolve 2-spinores que contêm duas funções de onda espaciais, cada uma descrevendo a amplitude de probabilidade de um estado de spin. A equação de Klein-Gordon só possui uma função espacial, pelo que não possui os graus de liberdade necessários para descrever o spin e como tal para descrever apropriadamente o electrão. 448 13.3 Introdução à Mecânica Quântica Relativista A teoria de Dirac Paul Dirac sugeriu, em 1928, uma equação relativista para o electrão, que naturalmente introduzia o seu spin, explicando correctamente a sua interacção com campos electromagnéticos, e que tinha um produto escalar positivo associado. A intuição de Dirac foi que os problemas da equação de Klein-Gordon, nomeadadamente as probabilidades e energias negativas, estariam associados a esta equação ser de segunda ordem nas derivadas temporais. Dirac tentou, por isso, factorizar a equação de Klein-Gordon para obter uma equação de primeira ordem na derivada temporal e relativista. Dirac tentou factorizar a expressão da energia relativista (13.1.2) escrevendo-a da seguinte forma: pµ pµ − m20 c2 = 0 ⇔ (γ µ pµ + m0 c)(γ ν pν − m0 c) = 0 , (13.3.1) o que é verdade se o objecto γ µ obedecer à seguinte propriedade: γ (µ γ ν) ≡ 1 µ ν (γ γ + γ ν γ µ ) = η µν . 2 (13.3.2) Se as componentes de γ µ forem números é manifestamente impossı́vel resolver estas equações. Por exemplo teriamos de resolver simultaneamente (γ 0 )2 = 1 , (γ 1 )2 = −1 , γ 0γ 1 = 0 . (13.3.3) A grande (enormı́ssima!) intuição de Dirac foi sugerir que as componentes de γ µ poderiam ser matrizes. Como matrizes genericamente não comutam, a factorização (13.3.1) seria verdadeira se {γ µ , γ ν } = 2η µν , (13.3.4) {A, B} ≡ AB + BA . (13.3.5) onde definimos o Anti-comutador As relações de anti-comutação (13.3.4) definem uma álgebra denominada álgebra de Clifford e as matrizes ‘gama’ são designadas por matrizes de Dirac. Usando a associação (13.1.7), obtemos uma equação de primeira ordem igualando a zero qualquer um dos factores em 13.3 A teoria de Dirac 449 (13.3.1), a actuar numa função de onda Ψ(~x), que será um vector coluna no mesmo espaço vectorial em que estão definidas as matrizes γ µ . Escolhendo o segundo factor em (13.3.1), que corresponde à energia positiva, obtemos a equação de Dirac: i~γ µ ∂µ Ψ(xα ) = m0 cΨ(xα ) . (13.3.6) As matrizes γ µ Para estudar detalhadamente a equação de Dirac temos de ter uma forma explı́cita para as matrizes γ µ , µ = 0, 1, 2, 3. Em primeiro lugar podemos perguntar qual será a dimensão destas matrizes. Para cada dimensão espaço-temporal, existe uma dimensão mı́nima para a representação da álgebra de Clifford; em quatro dimensões a representação minimal da álgebra de Clifford tem dimensão quatro que é a dimensão das matrizes γ µ . Há várias escolhas diferentes (ditas representações) para estas matrizes. Aqui iremos usar a seguinte representação:  γ0 =  1 0 0 −1   ,  γi =  0 σi −σi 0   , (13.3.7) onde σi são as matrizes de Pauli (9.1.36) e 1 é a matriz identidade em duas dimensões. A ‘função de onda de Dirac’ Ψ(xα ), será, portanto, representada por um vector coluna quatro dimensional que é um spinor de quatro componentes ou 4-spinor :   α Ψ (x )     1  α  α   Ψ (x ) [Ψ] (x )  , = 2 Ψ(xα ) =    α α  χ1 (x )  [χ] (x )   χ2 (xα ) (13.3.8) onde [Ψ]a (xα ), a = 1, 2 representam dois 2-spinores, na notação da secção (9.4.1). Se no caso da equação de Klein-Gordon tinhamos graus de liberdade insuficientes para descrever uma partı́cula com spin 1/2, aparentemente, na equação de Dirac temos demasiados graus de liberdade para tal!... Exercı́cio: Verifique que as matrizes de Dirac (13.3.7) obedecem à álgebra de Clifford (13.3.4). 450 Introdução à Mecânica Quântica Relativista 13.3.1 Os sucessos da equação de Dirac Vamos agora enumerar, sem demonstrar, os sucessos da teoria de Dirac. i) É possı́vel definir um produto escalar, que é invariante por transformações de Lorentz, conservado e definido positivo; a norma de uma função de onda de Dirac é (Ψ, Ψ) = Z 3 † d ~xΨ Ψ = Z d3~x |Ψ1 (xα )|2 + |Ψ2 (xα )|2 + |χ1 (xα )|2 + |χ2 (xα )|2 , (13.3.9) que generaliza para 4-spinores a forma da norma para 2-spinors (9.4.20). ii) No limite não relativista, a teoria de Dirac reduz-se à teoria de Pauli, com o factor giromagnético correcto para o electrão, g = 2. Para obter este resultado é necessário acoplar a equação de Dirac a um campo electromagnético, o que é feito pelo acoplamento minimal (13.2.28). Obetém-se a equação de Dirac na presença de um campo electromagnético descrito pelo 4-potencial Aµ : iq i~γ ∂µ + Aµ Ψ(xα ) = m0 cΨ(xα ) . c~ µ (13.3.10) Especializando para o electrão q = −e. Uma manipulação desta equação com, a aproximação p0 c ≃ m0 c2 + H , (13.3.11) onde H ≪ m0 c2 leva ao resultado, considerando apenas campo magnético HΨ(xα ) ≃ ( ~ 2 e~ (~p + eA/c) ~ + ~σ · B 2m0 2m0 c ) , (13.3.12) que é o Hamiltoniano de Pauli (9.3.4) (com a diferente convenção para os campos electromagnéticos e q = −e) na ausência de campo eléctrico, com a razão giromagnética correcta. iii) Na presença de um campo de Coulomb, a solução exacta para o espectro de energias 13.3 A teoria de Dirac 451 da equação de Dirac é EN,J  −1/2   α2   = me c 1 + 2  q   2 N − J − 21 + J + 12 − α2 2 . (13.3.13) Esta é a fórmula (11.1.104) que, como discutido na secção (11.1.4) dá os nı́veis correctos para a estrutura fina do átomo de Hidrogénio. O número quântico J é o número quântico de momento angular total (que tem de ser apropriadamente definido). Notese que é a mesma fórmula que (13.2.45) substituindo J ↔ ℓ o que demonstra que a incapacidade da equação de Klein-Gordon descrever a estrutura fina resulta de não levar em conta o spin. A equação de Dirac possui, tal como a equação de Klein-Gordon, estados de energia negativa, o que, como discutido anteriormente pode originar problemas na teoria interactiva. No entanto, como a equação de Dirac descreve fermiões, Dirac concebeu uma teoria (do ‘mar de electrões’) em que todos estes estados de energia negativa estariam preenchidos (possı́veis vagas eram interpretadas como anti-partı́culas, isto é, positrões). Assim, o problema de os usar para extrair infinita energia do sistema era resolvido. No entanto esta interpretação, bem como a interpretação da teoria de Dirac como descrevendo a Mecânica Quântica Relativista de uma partı́cula de spin 1/2, foi rapidamente ultrapassada. O ponto fundamental é que a Mecânica Quântica Relativista não deve ser vista como a descrição de uma partı́cula. A possibilidade relativista de conversão de massa em energia torna a Mecânica Quântica Relativista necessariamente uma teoria de muitas partı́culas. Esta é a perspectiva da Teoria Quântica de Campo, onde os campos são promovidos a operadores (deixando de ser vistos como funções de onda) sujeitos a regras de comutação ou anti-comutação. Este procedimento de promover os campos a operadores com regras de comutação/anti-comutação é denominado, por vezes, segunda quantificação (pois a primeira é a quantificação das observáveis que discutimos no capı́tulo 4). Em teoria Quântica de Campo, quer a equação de Dirac quer a equação de Klein-Gordon encontram 452 Introdução à Mecânica Quântica Relativista naturalmente o seu lugar, descrevendo a dinâmica de sistemas de partı́culas de spin 1/2 e 0 respectivamente. 13.4 Sumário Neste capı́tulo fizemos uma breve introdução ao casamento das ideias da Relatividade Restrita com as ideias da Mecânica Quântica. Uma primeira tentativa deste matrimónio resulta na equação de Klein-Gordon, que tem vários problemas para ser compatibilizada quer com as ideias da Mecânica Quântica não Relativista, quer com a fı́sica do electrão. Estes problemas podem ser resolvidos pela equação de Dirac. No entanto, a tentativa de extrapolar as ideias da Mecânica Quântica não Relativista para uma Mecânica Quântica Relativista acaba por ser naturalmente ultrapassada por uma descrição que leva em conta muitas partı́culas e não apenas uma - a Teoria Quântica de Campo. Parte III Tópicos Avançados e Modernos CAPÍTULO 14 Formulação de integrais de caminho da Mecânica Quântica CAPÍTULO 15 Mecânica Quântica Super-simétrica CAPÍTULO 16 Introdução à teoria da Informação Quântica Parte IV Apêndices APÊNDICE A Geometria da Transformada de Legendre A transição do Lagrangeano para o Hamiltoniano é um exemplo de uma transformada de Legendre, de que vamos agora fornecer uma interpretação geometrica. Por simplicidade vamos considerar apenas o caso com uma única variável dinâmica. Consideremos uma função diferenciavel L(v), de um variável v. O gráfico de L(v) é uma curva contı́nua de todos os pontos (v, L(v)) como a representada na figura A.1. A derivada da função em cada ponto é denotada p(v) ≡ dL . dv (A.1) A transformada de Legendre é uma maneira de reproduzir a curva inteiramente em termos de p, sem referência a v; p torna-se a variável independente cujos valores são usados para construir a curva. Mas tal como os valores de v sem os valores de L são insuficientes para construir a curva, somente os valores de p são também insuficientes, pelo que necessitamos de uma nova função H(p). A função H(p) é construida da seguinte maneira. Consideremos a tangente à curva L(v) no ponto v = v0 . O declive da tangente é p(v0 ) = p0 , (A.2) 460 Geometria da Transformada de Legendre L(v) v0 v y0 = L(v0 ) − p0 v0 Figura A.1: A curva que representa um ‘Lagrangeano’ L(v) como função da velocidade v. A tangente à curva em v0 tem declive p0 e ordenada na origem y0 ≡ L(v0 ) − p0 v0 . e a ordenada na origem da tangente é y0 = L(v0 ) − p0 v0 . (A.3) Para um ponto arbitrário, (v, L(v)), a tangente à curva tem declive p = dL/dv e tem ordenada na origem y(v, p) = L(v) − pv . (A.4) Vamos assumir que (A.1) é invertivel. Voltaremos a este ponto mais tarde. Podemos então obter v = v(p) de um modo único. Definimos a função H(p) como H(p) = −y(v(p), p) = pv(p) − L(v(p)) . (A.5) O conhecimento de p e H(p) permite-nos reconstruir a curva da figura A.1. De facto, cada combinção (p, H(p)) corresponde a uma linha de declive p e ordenada na origem H(p) no plano (v, L). Geometricamente, a curva L(v) é o envelope destas linhas, a curva contı́nua tangente a todas elas. Esta construção é esquematizada na figura A.2. Analiticamente, a partir do conhecimento de H(p) determinamos v = v(p) dv(p) dL(v(p)) dH(p) =v+p − = v(p) . dp dp dp (A.6) Assumindo a invertibilidade de v = v(p) obtemos p = p(v) e como tal de (A.5) obtemos L(v) = H(p(v)) − p(v)v . (A.7) 461 L(v) v Figura A.2: Conhecendo o declive das tangentes, p, e as suas ordenadas na origem, H(p), é possivel reconstruir a forma da curva L(v). A semelhança desta equação com (A.5) é sugestiva. Tal como (p, H(p)) é a representação da curva L(v) no plano (v, L) pelo (declive, (menos) ordenada na origem) das tangentes a essa curva, também (v, L(v)) é a representação da curva H(p) no plano (p, H) pelas tangentes a essa curva. Uma nota sobre a invertibilidade de p(v). Invertibilidade significa que p(v) é injectiva. Logo p(v) não tem máximos ou mı́nimos. Dado que p(v) = dL/dv, concluimos que L(v) não pode ter pontos de inflexão. Por um raciocı́nio semelhante concluimos que também H(p) não pode ter pontos de inflexão. Em mais do que uma dimensão, invertibilidade significa que as matrizes Hessianas ∂2L , ∂v i ∂v j são não singulares. ∂2H , ∂pi ∂pj (A.8) APÊNDICE B Princı́pio do tempo mı́nimo de Fermat Neste apêndice derivamos as leis da reflexão e refracção ondulatórias recorrendo ao princı́pio do tempo mı́nimo de Fermat. B.1 Reflexão Consideremos dois pontos no plano xy, como na figura B.1. Consideremos um raio de luz que une os dois pontos através de uma linha recta que é reflectida no eixo do x. Várias y ∆x x Figura B.1: Dois pontos que distam de ∆x ao longo do eixo do x podem ser unidos por uma infinidade de trajectórias que reflectem no eixo do x. De todas essas trajectórias, a que minimiza a distância entre os dois pontos obedece à lei da reflexão. 464 Princı́pio do tempo mı́nimo de Fermat y l1 θ1 θ2 l2 x ∆x Figura B.2: A trajectória real vai obedecer a θ1 = θ2 . trajectórias possiveis estão desenhadas na figura B.1. O princı́pio do tempo mı́nimo de Fermat diz-nos que a trajectória real é a que minimiza o tempo que o raio de luz demora de um ponto até ao outro. Como a velocidade é constante, a trajectória real será aquela que minimiza a distância. Considermos uma trajectória possı́vel que faz ângulos θ1 e θ2 com a perpendicular à superfı́cie de reflexão, conforme esquematizado na figura B.2. A distância total percorrida é ∆s(θ1 , θ2 ) = l1 l2 + , cos θ1 cos θ2 (B.1) que é a quantidade que pretendemos minimizar, como função de θ1 e θ2 , mas onde l1 e l2 são fixos. Ou seja pertendemos calcular θ1 e θ2 de modo que 0 = d(∆s(θ1 , θ2 )) = sin θ1 l1 sin θ2 l2 dθ1 + dθ2 . 2 cos θ1 cos2 θ2 (B.2) A extremização está sujeita à condição de que a distância total segundo x, ∆x é constante ∆x = sin θ1 l1 sin θ2 l2 + = constante . cos θ1 cos θ2 (B.3) Diferenciando esta equação obtemos l2 l1 dθ1 + dθ2 = 0 , 2 cos θ1 cos2 θ2 (B.4) que, substituindo em (B.2), resulta em sin θ2 l2 sin θ1 l2 dθ = dθ2 2 cos2 θ2 cos2 θ2 ⇔ sin θ1 = sin θ2 , (B.5) B.2 Refracção 465 ou, como 0 < θ1 , θ2 < π/2, θ1 = θ2 , (B.6) que é a lei da reflexão. B.2 Refracção Consideramos agora dois pontos em dois meios diferentes. No meio 1, a luz move-se à velocidade v1 ; no meio 2 a luz move-se à velocidade v2 . Na figura B.3 mostra-se um conjunto de trajectórias, rectilı́neas em cada meio, que unem os dois pontos. A minimização do tempo de viagem de um raio de luz não corresponde neste caso à minimização da distância devido à diferente velocidade nos dois meios. A minimização do tempo irá corresponder a um compromisso entre viajar o máximo de distância possı́vel no meio onde a velocidade é maior, sem, contudo, aumentar demasiado a distância a percorrer. y MEIO 1 MEIO 2 x Figura B.3: Várias trajectórias possı́veis para um raio de luz unindo dois pontos em meios diferentes. Tomando uma trajectória como aquela exibida na figura B.4, pertendemos extremizar ∆t, dado por ∆t(θ1 , θ2 ) = ∆x l1 l2 = + , v v1 cos θ1 v2 cos θ2 (B.1) ou seja determinar θ1 , θ2 de modo a que 0 = d(∆t(θ1 , θ2 )) = l2 sin θ2 l1 sin θ1 dθ + dθ2 . 1 v1 cos2 θ1 v2 cos2 θ2 (B.2) 466 Princı́pio do tempo mı́nimo de Fermat y l1 θ1 MEIO 1 ∆x MEIO 2 x l2 θ2 Figura B.4: A trajectória real vai obedecer à lei de Snell. A extremização é sujeita à condição de que a distância segundo x, ∆x é constante, ∆x = l1 sin θ1 l2 sin θ2 + = constante . cos θ1 cos θ2 (B.3) Diferenciando a última equação obtemos l1 l2 dθ + dθ2 = 0 , 1 cos2 θ1 cos2 θ2 (B.4) que substituindo em (B.2) resulta em v1 sin θ1 = . sin θ2 v2 Obtemos assim a Lei de Snell. (B.5) APÊNDICE C Análise de Fourier A análise de Fourier fornece a expansão de uma função f (x) em termos de senos e cossenos. Para este próposito distinguem-se dois tipos de funções. C.1 Séries de Fourier Se a função é periódica com perı́odo L ∈ R, isto é f (x) = f (x + L) , então as funções sinusoidais na expansão têm de ter perı́odo 2πn 2πn(x + L) 2πnx kn ≡ = sin , , n ∈ N ⇒ sin L L L (C.1) (C.2) e analogamente para o cosseno. Funções sinusoidais com outros perı́odos não respeitam a periodicidade da função a expandir. Neste caso, a expansão de Fourier é uma Série de Fourier +∞ a0 X + [an cos(kn x) + bn sin(kn x)] , f (x) = 2 n=1 (C.3) e toda a informação acerca da função fica contida nos coeficientes {a0 , an , bn } , (C.4) 468 Análise de Fourier a que se chama o espectro de Fourier de f (x). Uma vantagem das séries de Fourier relativamente a séries de Taylor é que a função a expandir não necessita de ser diferenciável em todos os pontos; de facto pode até ser descontinua num número finito de pontos do intervalo [x0 , x0 + L] para qualquer x0 . A condição essencial para a existência da série de Fourier é integrabilidade.1 O teorema de Fourier diz-nos como calcular os coeficientes (C.4): Teorema: (Fourier) Seja f (x) : R −→ R com as seguintes propriedades i) f(x) é periódica com perı́odo L; ii) f(x) é integrável em [x0 , x0 + L] (ou é uma função de quadrado integrável conforme (C.20)); então, a série de Fourier de f (x), (C.3) onde 2 an = L Z x0 +L f (x) cos(kn x)dx , x0 2 bn = L Z x0 +L f (x) sin(kn x)dx , (C.5) x0 converge para qualquer x ∈ R. Se num dado ponto, y, f (x) é contı́nua, a série converge para f (y); se é descontinua converge para a média dos limites à esquerda e à direita de f (x). Não vamos aqui demonstrar o teorema de Fourier, mas vamos mostrar a compatibilidade de (C.5) com (C.3), introduzindo (C.3) nas expressões (C.5): • a0 : 2 a0 = L Z x0 +L x0 ! +∞ a0 X + [an cos(kn x) + bn sin(kn x)] dx , 2 n=1 (C.6) que é claramente verificada pois, para n ∈ N Z 1 x0 +L sin(kn x)dx = x0 Z x0 +L cos(kn x)dx = 0 . (C.7) x0 Rigorosamente o teorema de Fourier é mais geral do que o exposto aqui; contudo em mecânica quântica a propriedade essencial é integrabilidade. C.1 Séries de Fourier 469 • an : 2 an = L Z ! +∞ a0 X + [am cos(km x) + bm sin(km x)] dx 2 m=1 x0 +L cos(kn x) x0 +∞ X 2 = L m=1 Z x0 +L . (C.8) cos(kn x) (am cos(km x) + bm sin(km x)) dx x0 Assim, temos de lidar com Z x0 +L cos(kn x) cos(km x)dx = x0 L δn,m , 2 (C.9) onde introduzimos o delta de Kronecker, definido como   0 se n 6= m δn,m ≡ ,  1 se n = m e Z (C.10) x0 +L cos(kn x) sin(km x)dx = 0 , (C.11) x0 e em baixo iremos também necessitar de Z x0 +L L sin(kn x) sin(km x)dx = δn,m . 2 x0 (C.12) É agora trivial verificar (C.8). • bn : 2 bn = L Z x0 +L x0 +∞ X 2 = L m=1 sin(kn x) Z x0 +L ! +∞ a0 X + [am cos(km x) + bm sin(km x)] dx 2 m=1 , (C.13) sin(kn x) (am cos(km x) + bm sin(km x)) dx x0 que é facilmente verificada usando (C.11) e (C.12). C.1.1 Representação em termos de ondas planas Uma outra maneira de exprimir a série de Fourier é usando exponenciais imaginárias em vez de senos e cossenos. A fórmula de Euler eiθ = cos θ + i sin θ , (C.14) 470 Análise de Fourier permite-nos escrever as funções sinusoidais como cos(kn x) = 1 ikn x e + e−ikn x , 2 sin(kn x) = Podemos então reexpressar (C.3) como +∞ X f (x) = 1 ikn x e − e−ikn x . 2i cn eikn x , (C.15) (C.16) n=−∞ onde o espectro de Fourier é agora descrito pelos coeficientes {cn }, que em geral são complexos, e estão relacionados com {a0 , an , bn } do seguinte modo  an − ibn   para n ∈ N   2    a0 . cn = para n = 0  2       a−n + ib−n para − n ∈ N 2 (C.17) Nesta representação da série de Fourier, cada coeficiente no espectro de Fourier, cn , aparece associado a uma onda plana eikn x . Note-se, para uso futuro, que o equivalente às relações (C.9), (C.11), (C.12), é, na linguagem de ondas planas, simplesmente Z x0 +L dxei(kn −km ) = Lδn,m , n, m ∈ Z . (C.18) x0 Note-se ainda que o espectro de Fourier é calculado nesta linguagem pela relação Z 1 x0 +L f (x)e−ikn x dx . (C.19) cn = L x0 C.1.2 O Espaço de Hilbert e a Igualdade de Bessel-Parseval Em Mecânica Quântica f (x) irá geralmente representar uma função de onda, denotada por Ψ(x), que é em geral complexa; para ser normalizável no intervalo [a, b] a função de onda tem de obedecer a 2 kΨk ≡ Z a b |Ψ(x)|2 dx < ∞ , (C.20) o que equivale a dizer que é uma função de quadrado somável. O conjunto de todas as funções de quadrado somável em [a, b] formam o Espaço de Hilbert L2 ([a, b]), que é C.2 Integrais de Fourier e Transformadas de Fourier 471 por isso o ‘habitat’ natural das funções de onda fı́sicas que encontramos em Mecânica Quântica. É um resultado de grande importância para a aplicação de séries de Fourier em Mecânica Quântica que todas as funções de quadrado integrável num intervalo admitem uma expansão em série de Fourier nesse intervalo. A norma (ao quadrado) kΨk2 pode ser calculada directamente do espectro de Fourier, uma vez que este contem toda a informação sobre a função. O modo como o fazer é descrito pela Igualdade de Bessel-Parseval : 1 L Z x0 +L 2 dx|f (x)| = x0 +∞ X n=−∞ |cn |2 . (C.21) A demonstração é trivial usando (C.18). Por outro lado, usando (C.17) podemos reescrever a igualdade de Bessel-Parseval em termos de {a0 , an , bn } 1 L C.2 Z x0 +L x0 +∞ |a0 |2 X dx|f (x)| = + |an |2 + |bn |2 . 4 n=1 2 (C.22) Integrais de Fourier e Transformadas de Fourier Se a função f (x) não é periódica, funções sinusoidais com qualquer perı́odo podem ser usadas na expansão de Fourier que passa a ser uma soma sobre todos os valores de k ∈ R e como tal um integral de Fourier em vez de uma série discreta. Assim, esperamos que (C.16) seja substituido por uma expressão do tipo Z +∞ f (x) = c(k)eikx dx . (C.23) −∞ De facto, tirando o limite L → ∞ das expressões que temos para a série de Fourier podemos mostrar que assim é. Denotemos a função com perı́odo L por fL (x). Notando que kn+1 − kn = 2π/L, escolhendo x0 = −L/2 e introduzindo (C.19) em (C.16) obtemos Z L/2 ∞ 1 X ikn x fL (x) = (kn+1 − kn )e fL (y)e−ikny dy , 2π n=−∞ −L/2 (C.24) que tem a forma de uma soma de Riemann. O limite L → ∞ equivale a kn → kn+1 e fL (x) → f (x). Neste limite, o somatório é promovido a um integral e kn passa a ser uma 472 Análise de Fourier variável contı́nua, pelo que obtemos Z +∞ Z +∞ 1 −iky ikx f (y)e dy dk , e f (x) = 2π −∞ −∞ ou 1 f (x) = √ 2π Z 1 f˜(k) ≡ √ 2π Z onde definimos +∞ (C.25) ikx ˜ f(k)e dk , (C.26) f (x)e−ikx dx . (C.27) −∞ +∞ −∞ Claramente f˜(k) desempenha o papel de espectro de Fourier, que passa a ser uma variável contı́nua; ou seja, uma função no plano complexo que contem toda a informação sobre f (x). A este espectro contı́nuo de Fourier chama-se transformada de Fourier. Assim, existe uma dualidade entre as duas funções ˜ f (x) ←→ f(k) , (C.28) isto é são duas descrições diferentes do mesmo objecto. A existência de um integral de Fourier para uma função é garantida se a função e a sua transformada de Fourier forem integráveis: Teorema da Inversão de Fourier: Se f (x) for integrável e f˜(k) definida em (C.27) também o for, então a representação de f (x) como um integral de Fourier (C.26) existe. C.2.1 A fórmula de Parseval-Plancherel Tal como para as séries de Fourier é de esperar que do espectro de Fourier, que neste caso é a transformada de Fourier, se possa deduzir a norma da função. A fórmula análoga à fórmula de Bessel-Parseval,(C.21), é chamada fórmula de Parseval-Plancherel (por vezes também denominada teorema de Fourier-Plancherel): Z +∞ Z +∞ 2 ˜ 2 dk . |f (x)| dx = |f(k)| −∞ (C.29) −∞ Exemplo A1: Consideremos a função   1 se |x| < a f (x) =  0 se |x| > a , a>0 (C.30) C.2 Integrais de Fourier e Transformadas de Fourier cuja transformada de Fourier é r Z +∞ Z a 2 sin ka 1 1 . f˜(k) ≡ √ f (x)e−ikx dx = √ e−ikx dx = π k 2π −∞ 2π −a 473 (C.31) Para verificarmos a fórmula de Parseval-Plancherel temos de calcular tanto a norma de f (x) como a norma de f˜(k) no espaço de Fourier. A primeira é elementar Z +∞ |f (x)|2 dx = 2a . (C.32) −∞ A segunda fica Z 2 +∞ sin2 (ka) 2 ˜ dk . (C.33) |f (k)| dk = π −∞ k2 −∞ A função sin2 x/x2 (tal como sinx/x) não tem uma primitiva que se possa escrever como Z +∞ um número finito de funções elementares. Mas utilizando o teorema dos resı́duos em análise complexa mostra-se que +∞ sin2 x dx = π , (C.34) x2 −∞ resultado com o qual se prova que (C.33) é igual a (C.32). De outro ponto de vista, usando Z o teorema de Parseval-Plancherel fornece um método alternativo aos métodos complexos de calcular o integral (C.34). Exemplo A2: Consideremos a função Gaussiana f (x) = e−x 2 /2a2 , cuja transformada de Fourier é Z +∞ −k 2 a2 /2 Z +∞ 1 e 2 2 2 −ikx ˜ ≡√ f(k) f (x)e dx = √ e−(x+ika ) /2a dx , 2π −∞ 2π −∞ ou, usando o resultado básico em integração de Gaussianas r Z +∞ π −αx2 , α>0, e dx = α −∞ (C.35) (C.36) (C.37) obtemos 2 2 f˜(k) = ae−k a /2 . (C.38) O resultado a reter é que a transformada de Fourier de uma Gaussiana é ainda uma Gaussiana. Mas note que tanto o coeficiente como o expoente se alteram. Usando (C.37) é muito fácil verificar a fórmula de Parseval-Plancherel neste caso. 474 C.2.2 Análise de Fourier Quantidades estatı́sticas e a relação de incerteza Em estatı́stica define-se a função de distribuição de probabilidade ou densidade de probabilidade, P(x), de uma variável aleatória, x, definida no intervalo [a, b], como sendo uma distribuição que obedece a Z P(x) > 0 , b a P(x)dx = 1 . (C.39) xP(x)dx ; (C.40) Definem-se também • Valor esperado de x, ou valor médio de x hxi ≡ Z b a • Analogamente, para uma função de x, h(x), define-se o valor esperado de h(x) hh(x)i ≡ Z b h(x)P(x)dx ; (C.41) a • A variância ou dispersão é definida como 2 Z b σx ≡ h(x − hxi) i = (x − hxi)2 P(x)dx a ; Z b 2 2 2 2 = (x − 2xhxi + hxi )P(x)dx = hx i − hxi (C.42) a • O desvio padrão de x é ∆x = √ σx . (C.43) Como a mecânica quântica fornece uma descrição probabilı́stica dos fenómenos fı́sicos é natural usar esta terminologia estatı́stica. Mais concretamente, a entidade fundamental em mecânica quântica, a função de onda Ψ(x) - uma solução da equação de Schrödinger-, é uma amplitude de probabilidade, em geral uma função complexa. A densidade de probabilidade é P(x) = Ψ(x)Ψ(x)∗ , kΨk2 (C.44) C.2 Integrais de Fourier e Transformadas de Fourier 475 onde ”∗”denota conjugação complexa, que claramente obedece a (C.39). O que a teoria quântica produz para um dado sistema fı́sico são os ‘valores esperados’ das variáveis fı́sicas em jogo. O famoso prı́ncipio da incerteza de Heisenberg, um dos pilares da mecânica quântica, não é mais do que um exemplo da seguinte propriedade das transformadas de Fourier: Relação de incerteza: Seja x uma variável aleatória definida em R, cuja distribuição é descrita por uma ‘função de onda’ Ψ(x) e pela densidade de probabilidade associada P(x). Seja ∆x o desvio padrão de x associado a esta distribuição. Por outro lado seja Ψ̃(k) a transformada de Fourier de Ψ(x). Associemos a esta função de onda no espaço de Fourier uma densidade de probabilidade Pk (k). Seja ∆k o desvio padrão de k associado a esta distribuição. É uma propriedade das transformadas de Fourier (em uma dimensão) que ∆x∆k ≥ 1 . 2 (C.45) O significado desta relação de incerteza é claro quando comparamos a forma de uma Gaussiana (C.35) com a sua transformada de Fourier (C.38). Uma função de onda Gaussiana normalizada pode-se escrever 2 2 e−x /4(∆x) Ψ(x) = p√ , 2π∆x (C.46) onde ∆x é o desvio padrão de x associado à respectiva densidade de probabilidade |Ψ(x)|2 . De (C.35) e (C.38) lêmos que √ √ ∆x = a/ 2 , ∆k = 1/ 2a , ⇒ ∆x∆k = 1 . 2 (C.47) Variando ‘a’ podemos fazer ∆x ou ∆k tão pequeno quanto queiramos; isto é, podemos localizar a variável aleatória perto do valor médio com uma probabilidade tão próxima da unidade quanto desejado. Mas ao localizarmos x, por exemplo, aumentamos necessariamente a dispersão em k. Como discutido no capı́tulo 2, fenómenos microscópicos exibem caracterı́sticas quer corpusculares quer ondulatórias, mas não ambas simultaneamente - dualidade onda partı́cula e complementaridade. Esta realidade é incorporado no formalismo 476 Análise de Fourier da mecânica quântica descrevendo variáveis canónicas conjugadas - posição e momento por exemplo - como transformadas de Fourier uma da outra. Deste modo a incerteza associada à complementaridade é descrita pela existência de um limite inferior do produto de desvios padrão de transformadas de Fourier. Bibliografia [1] Herbert Goldstein, Classical Mechanics, Second Edition, 1980. [2] Jorge V. José, Eugene J. Saletan, Classical Dynamics, a contemporary approach, Cambridge University Press, 1998. [3] Maria Renata Arala Chaves, Sebenta de Mecânica Quântica, 1975. [4] Bernd Thaller, Visual Quantum Mechanics, Springer 2000 (inclui CD-ROM). [5] L.D.Landau, E.M.Lifshitz Quantum Mechanics, Butterworth Heinemann, Third Revised Edition, 1977. [6] Robert Eisberg, Robert Resnick, Quantum Physics of atoms, molecules, solids, nuclei, and particles, John Wiley & Sons, Second Edition, 1985. [7] Eyvind H. Wichmann, Quantum Physics - Berkeley Physics Course - Volume 4, McGraw Hill, 1967. [8] Feynman, Leighton, Sands, The Feynman Lectures on Physics - Volume III, AddisonWesley Publishing Company, 1965. [9] Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, Quantum Mechanics John Wiley & Sons, 1977. 478 [10] Paul A. M. Dirac, The Principles of Quantum Mechanics Oxford Science Publications, Fourth Edition, 1958.

Apuntes de Mecánica Cuántica

Related documents

Products

Support

Apuntes de Mecánica Cuántica

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib