Notas de Mecânica Quântica Carlos A. R. Herdeiro Departamento de Fı́sica Faculdade de Ciências da Universidade do Porto 2007-08 v4.0 Agradecimentos É um prazer agradecer à Professora Renata Arala Chaves, ao Professor Eduardo Lage e ao Professor João Lopes dos Santos a oportunidade de leccionar as cadeiras de Mecânica Quântica I e Mecânica Quântica II como Professor Auxiliar Convidado, durante os anos lectivos 2003/2004 a 2006/2007, no Departamento de Fı́sica da Faculdade de Ciências da Universidade do Porto. Uma palavra muito especial à Professora Fátima Mota pelo apoio sempre presente. Junho de 2007 Carlos Herdeiro (Alguma) Cronologia relacionada com o Nascimento da Mecânica Quântica 1678 - Christian Huygens publica o seu livro Traité de la lumiere onde defendia a natureza ondulatória da luz; 1687 - Isaac Newton publica o seu tratado Philosophiae Naturalis Principia Mathematica onde expõe as suas leis da mecânica (hoje dita mecânica clássica); 1703 - Newton publica o seu livro sobre a luz Opticks, onde defende que a luz é um fluxo de pequenos corpúsculos; 1803 - Thomas Young anuncia numa ‘Bakerian Lecture’ intitulada Experiments and Calculations Relative to Physical Optics a observação da difracção da luz, provando assim que a luz tem propriedades ondulatórias e portanto validando a tese de Huygens e invalidando a de Newton; 1873 - James Maxwell publica a sua obra A Treatise on Electricity and Magnetism onde apresenta as suas equações do campo electromagnético e mostra que a sua teoria prevê a existência de ondas electromagnéticas viajando ‘à velocidade da luz’; 1887 - Heinrich Hertz produz e detecta ondas electromagnéticas, validando a teoria de Maxwell; descobre também, acidentalmente, o efeito fotoeléctrico; 1900 - Max Planck explica a radiação de corpo negro usando a quantificação de energia e introduzindo uma nova constante h (hoje dita constante de Planck ). A sua descoberta foi apresentada num encontro da Sociedade Alemã de Fı́sica, em 14 de Dezembro de 1900, a data de nascimento da Mecânica Quântica; 1905 - Albert Einstein sugera a quantificação da radiação para explicar algumas caracterı́sticas do efeito fotoeléctrico descobertas em 1900 por Philip Lenard; 1911 - Ernest Rutherford propõe o modelo nuclear do átomo baseado nas experiências de scattering de partı́culas α de Hans Geiger e Ernest Marsden; 1913 - Niels Bohr propõe o seu modelo do átomo de hidrogénio num artigo intitulado Sobre a constituição de átomos e moléculas; 1916 - Robert Milikan verifica a equação de Einstein relativa ao efeito fotoeléctrico; 1923 - Arthur Compton explica o scattering de raios x por electrões como uma colisão entre electrões e fotões verificando experimentalmente as suas conclusões; 1924 - Louis De Broglie propõe que o electrão tenha ondas electrónicas associadas com comprimento de onda h/p; 1925 - Erwin Schrödinger propõe a sua equação de onda para descrever as ondas associadas à matéria; 1925 - Werner Heisenberg inventa a mecânica de matrizes para descrever fenómenos quânticos; 1925 - Wolfgang Pauli apresenta o seu princı́pio de exclusão; 1927 - Heisenberg formula o princı́pio da incerteza; 1927 - Clinton Davisson e Lester Germer e independentemente, George Thomson, observam difracção devido a ondas electrónicas; 1928 - Paul Dirac desenvolve a mecânica quântica relativista e prevê a existência de positrões, descobertos em 1932 por Carl Anderson; “Quem não se sentiu chocado com a teoria quântica não pode tê-la compreendido.” Niels Bohr (1885-1962), Conteúdo I Problemas exactamente solúveis e quantificação canónica de sistemas clássicos 1 1 Tópicos de Mecânica Clássica 2 1.1 Mecânica Newtoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Mecânica Lagrangeana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.1 Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . 7 1.2.2 Teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.3 Mecânica Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3.1 O Espaço de Fase e os Parêntesis de Poisson . . . . . . . . . . . . . 16 1.3.2 A Equação de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . 18 1.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2 O perı́odo de Transição 2.1 A luz: ondas versus corpúsculos . . . . . . . . . . . . . . . . . . . . . . . . 25 26 2.1.1 Experiências de Young (1801): ondas triunfam . . . . . . . . . . . . 28 2.1.2 A radiação do corpo negro, Planck e o quantum (1900) . . . . . . . 33 2.1.3 O efeito fotoeléctrico (Einstein 1905) . . . . . . . . . . . . . . . . . 37 2.2 Matéria: corpúsculos versus ondas . . . . . . . . . . . . . . . . . . . . . . . 40 2.2.1 O Espectro do átomo de Hidrogénio . . . . . . . . . . . . . . . . . . 43 2.2.2 O modelo atómico de Bohr (1913) . . . . . . . . . . . . . . . . . . . 45 2.2.3 As ondas electrónicas . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.3.1 Experiência de Young com luz de baixa intensidade . . . . . . . . . 51 2.3.2 O princı́pio da incerteza de Heisenberg . . . . . . . . . . . . . . . . 55 2.3.3 Experiência com a polarização da luz . . . . . . . . . . . . . . . . . 57 2.4 A aplicabilidade da Mecânica Quântica . . . . . . . . . . . . . . . . . . . . 59 2.5 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3 A equação de Schrödinger 63 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas . . . . . . . . 64 3.1.1 Sobreposição discreta de ondas . . . . . . . . . . . . . . . . . . . . 66 3.1.2 Sobreposição contı́nua de ondas . . . . . . . . . . . . . . . . . . . . 69 3.2 Partı́cula em potenciais independentes do tempo . . . . . . . . . . . . . . . 71 3.2.1 Caracterı́sticas gerais num potencial em escada . . . . . . . . . . . 73 3.2.2 Salto de potencial (E > V0 ) . . . . . . . . . . . . . . . . . . . . . . 76 3.2.3 Salto de potencial (E < V0 ) . . . . . . . . . . . . . . . . . . . . . . 78 3.2.4 Barreira de potencial (E > V0 ) . . . . . . . . . . . . . . . . . . . . . 81 3.2.5 Barreira de potencial (E < V0 ) . . . . . . . . . . . . . . . . . . . . . 83 3.2.6 Poço de potencial de profundidade finita (E < 0) . . . . . . . . . . 88 3.2.7 Poço de potencial de profundidade infinita . . . . . . . . . . . . . . 90 3.3 Evolução de um trem de ondas . . . . . . . . . . . . . . . . . . . . . . . . 91 3.3.1 Trem de ondas Gaussiano livre . . . . . . . . . . . . . . . . . . . . 92 3.3.2 Trem de ondas incidente num salto de potencial (E < V0 ) . . . . . . 93 3.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 4 Formalismo Matemático e Postulados da Mecânica Quântica 4.1 Funções de onda e operadores . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Estrutura de F e produto escalar em F . . . . . . . . . . . . . . . . 97 97 98 4.1.2 Bases de F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.3 Operadores Lineares a actuar em F . . . . . . . . . . . . . . . . . . 103 4.2 A notação de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 4.2.1 Produto escalar e espaço dual a E . . . . . . . . . . . . . . . . . . . 107 4.2.2 Acção de operadores lineares . . . . . . . . . . . . . . . . . . . . . . 108 4.2.3 O operador adjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 4.2.4 A operação adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.2.5 Notação de Dirac numa dada base . . . . . . . . . . . . . . . . . . . 111 4.2.6 Valores próprios e vectores próprios de um operador . . . . . . . . . 113 4.2.7 Observáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 4.3 Os postulados da Mecânica Quântica . . . . . . . . . . . . . . . . . . . . . 115 4.4 Quantificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 4.4.1 Variáveis compatı́veis, incompatı́veis e C.C.O.C. . . . . . . . . . . . 119 4.4.2 Os operadores X̂ e P̂ . . . . . . . . . . . . . . . . . . . . . . . . . . 123 4.4.3 Regras de Quantificação canónica . . . . . . . . . . . . . . . . . . . 126 4.4.4 Comentários sobre a evolução de um sistema quântico . . . . . . . . 128 4.4.5 Evolução do valor médio de uma variável . . . . . . . . . . . . . . . 129 4.5 Mecânica Quântica Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . 131 4.5.1 O operador de densidade para um estado puro . . . . . . . . . . . . 133 4.5.2 O operador de densidade para uma mistura estatı́stica de estados . 134 4.5.3 O operador de evolução e a evolução de um estado puro . . . . . . . 137 4.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5 Exemplos de Quantificação Canónica 141 5.1 Oscilador Harmónico Quântico em Uma Dimensão . . . . . . . . . . . . . . 141 5.1.1 O espectro de energia do Oscilador Harmónico Quântico . . . . . . 142 5.1.2 As funções de onda para o oscilador harmónico . . . . . . . . . . . 146 5.1.3 Resolução directa da equação de Schrödinger . . . . . . . . . . . . . 149 5.1.4 Valor médio e desvio padrão de x e p . . . . . . . . . . . . . . . . . 153 5.2 O Oscilador Harmónico Quântico em Duas Dimensões . . . . . . . . . . . . 155 5.2.1 Quantões lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 5.2.2 Quantões circulares . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 5.2.3 Funções de Onda para quantões circulares . . . . . . . . . . . . . . 158 5.3 O problema de Landau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 5.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 6 Momento Angular Orbital e o Átomo de Hidrogénio 6.1 Operadores de momento angular orbital 167 . . . . . . . . . . . . . . . . . . . 167 6.2 Os Harmónicos Esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 6.3 Partı́cula numa força central . . . . . . . . . . . . . . . . . . . . . . . . . . 176 6.4 O átomo de hidrogénio (sem spin) . . . . . . . . . . . . . . . . . . . . . . . 180 6.5 O átomo de hidrogénio (sem spin) num campo magnético . . . . . . . . . . 189 6.5.1 Dedução dos vários termos do Hamiltoniano . . . . . . . . . . . . . 189 6.5.2 Interpretação dos vários termos do Hamiltoniano . . . . . . . . . . 191 6.5.3 Comparação dos vários termos no Hamiltoniano . . . . . . . . . . . 195 6.5.4 Espectro de Energias aproximado: efeito Zeeman . . . . . . . . . . 196 6.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 7 Outras soluções exactas da equação de Schrödinger 205 7.1 Alguns poços de potencial exactamente solúveis . . . . . . . . . . . . . . . 206 7.1.1 Estados Ligados em Poços infinitos . . . . . . . . . . . . . . . . . . 207 7.1.2 Densidade de estados . . . . . . . . . . . . . . . . . . . . . . . . . . 215 7.1.3 Estados Ligados em Poços finitos . . . . . . . . . . . . . . . . . . . 216 7.2 Método algébrico para potenciais com forma invariante . . . . . . . . . . . 220 7.2.1 O superpotencial e potenciais parceiros . . . . . . . . . . . . . . . . 220 7.2.2 Hierarquia de Hamiltonianos . . . . . . . . . . . . . . . . . . . . . . 226 7.2.3 Potenciais de forma invariante . . . . . . . . . . . . . . . . . . . . . 228 7.2.4 Potenciais de forma invariante relacionados por translação . . . . . 229 7.3 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 II Métodos de aproximação e Spin 237 8 A aproximação WKB 238 8.1 O método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 8.2 Interpretação da validade da aproximação . . . . . . . . . . . . . . . . . . 241 8.3 Fórmulas de ligação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 8.4 Aplicação ao cálculo de estados ligados . . . . . . . . . . . . . . . . . . . . 246 8.5 Aplicação ao cálculo do factor de transmissão . . . . . . . . . . . . . . . . 250 8.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 9 Teoria Geral do Momento Angular e Spin 253 9.1 Representações da álgebra do momento angular . . . . . . . . . . . . . . . 254 9.2 Emergência Fı́sica do Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 9.3 Postulados da teoria de Pauli . . . . . . . . . . . . . . . . . . . . . . . . . 273 9.4 Descrição não relativista de partı́culas de spin 9.4.1 1 2 . . . . . . . . . . . . . . . 274 Juntando os graus de liberdade de spin aos orbitais . . . . . . . . . 276 9.5 Adição de momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . 283 9.5.1 Cálculo dos vectores próprios comuns a Jˆ2 e a Jˆz . . . . . . . . . . 287 9.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 10 Teoria da Difusão 293 10.1 Formalismo para descrever processos de difusão . . . . . . . . . . . . . . . 296 10.1.1 Definição da secção eficaz de difusão . . . . . . . . . . . . . . . . . 296 10.1.2 Estados estacionários de difusão . . . . . . . . . . . . . . . . . . . . 298 10.1.3 Relação entre amplitude e secção eficaz de difusão . . . . . . . . . . 300 10.2 Equação integral de difusão e o método de Born . . . . . . . . . . . . . . . 302 10.2.1 Escolha da função de Green e de Φ0 . . . . . . . . . . . . . . . . . . 304 10.2.2 A aproximação de Born . . . . . . . . . . . . . . . . . . . . . . . . 306 10.2.3 Interpretação da aproximação de Born . . . . . . . . . . . . . . . . 308 10.2.4 A aproximação de Born para potenciais centrais . . . . . . . . . . . 309 10.3 Método das ondas parciais para a difusão por um potencial central . . . . . 316 10.3.1 Ondas esféricas versus ondas planas para uma partı́cula livre . . . . 317 10.3.2 Dedução da forma explı́cita das ondas esféricas livres . . . . . . . . 319 10.3.3 Propriedades das ondas esféricas livres . . . . . . . . . . . . . . . . 323 10.3.4 Ondas parciais num potencial V (r) . . . . . . . . . . . . . . . . . . 328 10.4 Difusão Inelástica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 10.4.1 Secções eficazes de difusão elástica e de absorção . . . . . . . . . . . 337 10.4.2 Secção eficaz total e o teorema óptico . . . . . . . . . . . . . . . . . 339 10.5 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 11 Métodos perturbativos independentes e dependentes do tempo 343 11.1 Teoria das perturbações estacionárias . . . . . . . . . . . . . . . . . . . . . 344 11.1.1 Perturbação de um nı́vel não degenerado . . . . . . . . . . . . . . . 347 11.1.2 Perturbação a um nı́vel degenerado . . . . . . . . . . . . . . . . . . 351 11.1.3 Perturbações X̂, X̂ 2 e X̂ 3 a um potencial harmónico . . . . . . . . 352 11.1.4 Estrutura fina do átomo de Hidrogénio . . . . . . . . . . . . . . . . 357 11.2 Teoria das Perturbações dependentes do tempo . . . . . . . . . . . . . . . 368 11.2.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . 368 11.2.2 Solução aproximada da equação de Schrödinger . . . . . . . . . . . 369 11.2.3 Aplicação a uma perturbação sinusoidal ou constante . . . . . . . . 373 11.2.4 Probabilidade de transição via operador de evolução . . . . . . . . . 385 11.3 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395 12 Sistemas de partı́culas idênticas 397 12.1 Origem do Problema: a degenerescência de troca . . . . . . . . . . . . . . 397 12.2 Operadores de permutação . . . . . . . . . . . . . . . . . . . . . . . . . . . 400 12.2.1 Sistema de duas partı́culas . . . . . . . . . . . . . . . . . . . . . . . 401 12.2.2 Sistema de três partı́culas e generalização para N partı́culas . . . . 405 12.3 O postulado de simetrização . . . . . . . . . . . . . . . . . . . . . . . . . . 410 12.3.1 Levantamento da degenerescência de troca . . . . . . . . . . . . . . 411 12.3.2 Observáveis e evolução temporal . . . . . . . . . . . . . . . . . . . 416 12.4 Consequências do postulado de simetrização . . . . . . . . . . . . . . . . . 417 12.4.1 Diferenças entre bosões e fermiões . . . . . . . . . . . . . . . . . . . 417 12.4.2 Efeitos de interferência . . . . . . . . . . . . . . . . . . . . . . . . . 420 12.4.3 Difusão de duas partı́culas idênticas com spin . . . . . . . . . . . . 424 12.5 Átomos com vários electrões - A tabela periódica . . . . . . . . . . . . . . 428 12.5.1 Nı́veis de energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 12.5.2 Configurações electrónicas e princı́pio da exclusão de Pauli . . . . . 432 12.6 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435 13 Introdução à Mecânica Quântica Relativista 13.1 A teoria de Klein-Gordon 437 . . . . . . . . . . . . . . . . . . . . . . . . . . . 437 13.2 Os problemas com a teoria de Klein-Gordon . . . . . . . . . . . . . . . . . 439 13.2.1 Energias negativas . . . . . . . . . . . . . . . . . . . . . . . . . . . 440 13.2.2 Probabilidades negativas . . . . . . . . . . . . . . . . . . . . . . . . 441 13.2.3 Inexistência de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 444 13.3 A teoria de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448 13.3.1 Os sucessos da equação de Dirac . . . . . . . . . . . . . . . . . . . . 450 13.4 Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452 III Tópicos Avançados e Modernos 453 14 Formulação de integrais de caminho da Mecânica Quântica 454 15 Mecânica Quântica Super-simétrica 455 16 Introdução à teoria da Informação Quântica 457 IV Apêndices 458 A Geometria da Transformada de Legendre 459 B Princı́pio do tempo mı́nimo de Fermat 463 B.1 Reflexão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463 B.2 Refracção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 C Análise de Fourier 467 C.1 Séries de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467 C.1.1 Representação em termos de ondas planas . . . . . . . . . . . . . . 469 C.1.2 O Espaço de Hilbert e a Igualdade de Bessel-Parseval . . . . . . . . 470 C.2 Integrais de Fourier e Transformadas de Fourier . . . . . . . . . . . . . . . 471 C.2.1 A fórmula de Parseval-Plancherel . . . . . . . . . . . . . . . . . . . 472 C.2.2 Quantidades estatı́sticas e a relação de incerteza . . . . . . . . . . . 474 Parte I Problemas exactamente solúveis e quantificação canónica de sistemas clássicos CAPÍTULO 1 Tópicos de Mecânica Clássica 1.1 Mecânica Newtoniana O principal objectivo da mecânica clássica é descrever e explicar o movimento de objectos macroscópicos. Tal descrição é feita através do conceito de trajectória, que em mecânica não relativista é um mapa Tp (t) : R −→ R3 , (1.1.1) t −→ ~x(t) para cada ponto p do objecto em questão - figura 1.1. Em muitos problemas, a dinâmica de corpos rı́gidos é reduzida, em primeira análise, à dinâmica do centro de massa e portanto à de uma partı́cula pontual. Assim sendo, a descrição e explicação do movimento de uma partı́cula pontual é o problema base da mecânica clássica. Em 1686-87, Isaac Newton (1642-1727) apresentou na sua principal obra Philosophiae Naturalis Principia Mathematica as leis da Mecânica Newtoniana e em particular a sua equação do movimento (2a lei de Newton) que relaciona a força com a variação da quantidade de movimento d~p F~ = , dt p~ ≡ m~v ≡ m d~x . dt (1.1.2) 1.1 Mecânica Newtoniana 3 z Tp (t2 ) y x Tp (t1 ) Figura 1.1: A trajectória é um mapa da linha real para R3 . Se a massa m é fixa, 2 d ~x ¨. F~ = m 2 ≡ m~x dt (1.1.3) Exemplo 1 : Oscilador Harmónico (ex: pequenas oscilações de um pêndulo, mola,...) Um oscilador harmónico é um sistema em que a força é proporcional ao deslocamento a partir de um ponto de equilı́brio e dirigida para o ponto de equilı́brio (Lei de Hooke). Rotulando o ponto de equilı́brio como ~x = 0, temos F~ = −k~x . (1.1.4) Consideremos o oscilador harmónico em uma dimensão, com uma massa m e uma constante de oscilador k. Pela segunda lei ẍ + k x=0, m (1.1.5) que é uma equação diferencial ordinária de segunda ordem com solução ! r k t + φ0 , (1.1.6) x(t) = A cos m p de onde se lê a frequência de oscilação: ω = k/m. A e φ0 são constantes de integração interpretadas como amplitude e fase inicial do movimento que fisicamente são determinadas pelas condições iniciais. Exemplo 2 : Problema de Larmor O problema de Larmor é o problema de uma partı́cula de massa m e carga eléctrica q num campo magnético constante que tomamos ~ = Bez . como sendo B 4 Tópicos de Mecânica Clássica A força que uma partı́cula sente devido à interacção com o campo electromagnético é dada pela força de Lorentz ~ + ~v × B) ~ . F~ = q(E (1.1.7) Aplicando ao nosso caso e usando a segunda lei de Newton obtemos a equação do movimento (~x = (x, y, z)) ẍ = ωc ẏ ¨ = ωc~x˙ × ez ⇔ ~x ÿ = −ωc ẋ z̈ = 0 ⇒ onde definimos a frequência ciclotrónica é ωc = 3 dx + ωc2 ẋ = 0 3 dt d3 y + ωc2ẏ = 0 3 dt z̈ = 0 qB . m , (1.1.8) (1.1.9) As equações de terceira ordem são de segunda ordem nas velocidades e equivalentes a osciladores harmónicos. Logo a solução é ẋ = A cos (ωc t + φ0 ) , ẏ = à cos ωc t + φ̃0 z =z +v t 0 z (1.1.10) onde A, Ã, φ, φ̃, z0 , vz são constantes de integração. As equações de segunda ordem em (1.1.8) relacionam as constantes de integração A = à , φ̃0 = φ0 + π . 2 (1.1.11) Como tal a solução final é A sin (ωc t + φ0 ) x(t) = x0 + ωc A y(t) = y + cos (ωc t + φ0 ) 0 ω c z =z +v t 0 z . (1.1.12) Assim, x(t) e y(t) obedecem a 2 2 (x(t) − x0 ) + (y(t) − y0 ) = A ωc 2 , (1.1.13) 1.2 Mecânica Lagrangeana 5 ~ B z y x Figura 1.2: Trajectórias no problema de Larmor. Apenas a trajectória mais à direita tem vz 6= 0. e interpretamos as trajectórias projectadas no plano x-y como sendo circunferências com centro em (x0 , y0 ) e raio Am/qB - figura 1.2. Lêmos também que a frequência das órbitas é a frequência ciclotrónica. Nota: Este movimento corresponde a dois osciladores harmónicos nas direcções x e y em oposição de fase. 1.2 Mecânica Lagrangeana Existem algumas forças, ditas conservativas, que podem ser derivadas de um potencial, através de:1 F~ = −∇V ∇ × F~ = 0 . ⇔ (1.2.1) Dada uma força, a última equação pode ser utilizada como teste para ver se a força é conservativa. Por exemplo, para a força do exemplo 1, F~ = −kx ⇔ V (x) = kx2 . 2 (1.2.2) Ao desenharmos o potencial - figura 1.3 - ficamos com uma ideia da dinâmica usando a nossa intuição gravitacional: a partı́cula quer descer o potencial e ‘custa-lhe’ a subi-lo. Como a energia total da partı́cula é conservada 1 1 Etotal = Ecinética + Epotencial = mv 2 + kx2 , 2 2 1 (1.2.3) A implicação da direita para a esquerda não é sempre válida e depende de considerações topológicas, nomeadamente a co-homologia de de Rham da variedade. Para a generalidade das aplicações em Fı́sica elementar, onde a topologia do espaço-tempo é trivial, pode-se considerar a equivâlencia válida em geral. 6 Tópicos de Mecânica Clássica V(x) E −a a x Figura 1.3: Potencial do oscilador harmónico; uma partı́cula com energia E oscila entre pontos −a e a tais que V (−a) = V (a) = E. q1 (t) qreal (t) (qi , ti ) (qf , tf ) q2 (t) Figura 1.4: Três percursos alternativos entre o ponto qi no instante ti e qf no instante tf . A t trajectória real, qreal (t) é um extremo da acção S[q(t)]tfi . Se, por exemplo, for um mı́nimo, t t t S[qreal (t)]tfi < S[q1 (t)]tfi , S[q2 (t)]tfi . uma partı́cula com energia total E sobe até uma altura do potencial dada por V = E, onde a velocidade se anula; a velocidade é máxima em x = 0, onde toda a energia é cinética. Dado um qualquer potencial, correspondendo a uma força, podemos de imediato deduzir um conjunto particular de trajectórias fı́sicas, i.e. soluções das equações do movimento: são as trajectórias constantes, correspondentes aos extremos do potencial. Os extremos são definidos por ∇V (x0 ) = 0 ⇔ F~ = 0 em x0 , (1.2.4) o que significa que se a partı́cula estiver inicialmente em repouso em x0 aı́ ficará. No caso do oscilador harmónico a única solução deste tipo é quando a partı́cula está em repouso na posição de equilı́brio, que é trivial. Mas origina a seguinte pergunta: ‘Dado que estas trajectórias extremizam uma quantidade escalar (o potencial), haverá uma quantidade escalar mais geral extremizada por todas as trajectórias?’ 1.2 Mecânica Lagrangeana 7 Isto é consideremos um movimento com inı́cio em ti na posição qi e com fim em tf na posição qf , como na figura 1.4.2 Existe uma quantidade que a trajectória verdadeira, qreal (t), extremize comparativamente a todas as outras trajectórias, como q1 (t) ou q2 (t)? Se tal quantidade existir não é uma função, mas sim uma ‘máquina’ que transforma funções como a trajectória - em números (note que uma função transforma números em números), denominada funcional : t S[. . .]tfi : F −→ R t q(t) −→ S[q(t)]tfi . (1.2.5) F é o espaço de todas as funções de variável real. Um dos princı́pios mais importantes em toda a fı́sica é o princı́pio da acção mı́nima 3 ou princı́pio de Hamilton: Num sistema fı́sico com Lagrangeano L(q, q̇, t), as trajectórias reais, qreal (t), são as que extremizam o funcional acção, definido como Z tf tf dtL(q, q̇, t) , S[q(t)]ti = (1.2.6) ti onde o Lagrangeano se define como a diferença entre a energia cinética, T (q̇) e a energia potencial, V (q, t)4 L(q, q̇, t) ≡ T (q̇) − V (q, t) . (1.2.7) Para o princı́pio de Hamilton fazer sentido tem que dar origem a um conjunto de equações do movimento equivalentes às da mecânica Newtoniana. Essas equações chamamse Equações de Euler-Lagrange, que agora deduzimos. 1.2.1 Equações de Euler-Lagrange Os extremos de uma função são encontrados requerendo que a derivada da função seja zero. Analogamente, os extremos de um funcional encontram-se requerendo que a variação do funcional se anule. Variar um funcional consiste em comparar o valor do funcional para 2 É convencional utilizar a variável ‘q’ para designar um sistema arbitrário de coordenadas, por isso denominadas coordenadas generalizadas. 3 Embora esta designação seja comum, as trajectórias reais não são sempre um mı́nimo da acção, mas sim um extremo. 4 Curiosidade: A designação de energia cinética por T e da energia potencial por V tem origem nas palavras alemãs tatkraft e verk, que significam, respectivamente ‘energia’ e ‘potencial’. 8 Tópicos de Mecânica Clássica funções ligeiramente distintas, mas mantendo fixos os pontos inicial e final da função, que no nosso caso é a trajectória. Denotando esta operação de variação por ‘δ’ obtemos Z tf ∂L ∂L tf tf δq + δ q̇ , (1.2.8) δS = S[q(t) + δq(t)]ti − S[q(t)]ti = dt ∂q ∂ q̇ ti e assumindo que a operação de variação comuta com diferenciação, δ q̇ = δ dq d = δq , dt dt de onde, integrando por partes Z tf ∂L d ∂L ∂L δq + − δq dt δS = ∂q dt ∂ q̇ ∂ q̇ ti (1.2.9) tf ti . (1.2.10) O último termo é zero, pois corresponde à variação da trajectória nos pontos inicial e final, que assumimos ser zero. Como queremos garantir que δS = 0 para uma variação arbitrária, o integrando do termo restante tem de ser zero, isto é, d ∂L ∂L − =0, dt ∂ q̇ ∂q (1.2.11) para cada coordenada q. Estas são as equações de Euler-Lagrange (Joseph Lagrange 17361813, Leonhard Euler 1707-1783). Usando (1.2.7) estas equações escrevem-se d ∂L ∂V =− dt ∂ q̇ ∂q ⇔ d ∂L = F~ . dt ∂ ~q˙ (1.2.12) Usamos ~q para denotar a possibilidade de haver vários graus de liberdade e correspondentes coordenadas. Para uma partı́cula pontual num potencial V (~q), 1 2 L = m~q˙ − V (~q) , 2 (1.2.13) e (1.2.12) reduz-se a F~ = m¨~q, i.e. à segunda lei de Newton. Em geral define-se o momento canónico conjugado à variável ‘q’ como ‘p’ p~ ≡ ∂L . ∂ ~q˙ (1.2.14) Deste modo, com toda a generalidade, (1.2.12) implica d F~ = p~ , dt (1.2.15) 1.2 Mecânica Lagrangeana 9 mostrando que o formalismo Lagraneano reproduz o Newtoniano. Exemplo 1, Versão b) : Tratamos agora o oscilador harmónico no formalismo Lagrangiano. De (1.2.2) vemos facilmente que o Lagrangeano é 1 1 L = mẋ2 − kx2 , 2 2 (1.2.16) e as equações de Euler-Lagrange dão ẍ + k x=0, m (1.2.17) em concordância com (1.1.5). Exemplo 2, Versão b) : Para tratarmos a versão Lagrangeana do problema de Larmor, comecemos por discutir se existe um potencial para a força de Lorentz. Recordemos as equações de Maxwell (no sistema internacional de unidades) ~ =0 (i) ∇ · B ~ ~ = − ∂B (iii) ∇ × E ∂t ~ = ρ (ii) ∇ · E ǫ0 ~ . ~i ∂E ~ (iv) c ∇ × B = + ǫ0 ∂t (1.2.18) 2 Uma condição necessária para existir o potencial de uma força é (1.2.1). Calculemos pois o rotacional de F~Lorentz ~ + ∇ × (~v × B)) ~ , ∇ × F~Lorentz = q(∇ × E (1.2.19) ou, usando as equações de Maxwell e o facto que ~ = (β~ · ∇)~ ~ ·α ~ , ∇ × (~ α × β) α − β(∇ ~ ) − (~ α · ∇)β~ + α ~ (∇ · β) (1.2.20) obtemos (~v não é um campo de velocidades; logo as suas derivadas desaparecem) ! ~ ~ ∂ B ~ = −q dB . − (~v · ∇)B (1.2.21) ∇ × F~Lorentz = q − ∂t dt Assim, em geral, a força de Lorentz não é derivável de um potencial. Só o é se o campo magnético sentido pela partı́cula for constante. 10 Tópicos de Mecânica Clássica Ainda assim, é possı́vel definir um Lagrangeano cujas equações do movimento são as de uma partı́cula actuada pela força de Lorentz, mas que não tem a forma (1.2.7). Para vermos esse Lagrangeano recordemos os potenciais electromagnéticos. ~ A equação (i) permite-nos definir o potencial magnético, A, ~ =0 ∇·B ⇒ ~ =∇×A ~, B (1.2.22) que usando na equação de Maxwell-Faraday (iii) nos permite escrever esta como ~ ~ + ∂A ) = 0 ∇ × (E ∂t ⇒ ~ ~ = −∇φ − ∂ A , E ∂t (1.2.23) onde φ é o potencial electrostático. As duas equações (1.2.22) e (1.2.23) definem os poten~ Note-se que estes não são únicos. Isto é, para os mesmos ciais electromagnéticos (φ, A). ~ B ~ existe uma classe de equivalência de diferentes escolhas para φ e A ~ a que se chama E, “equivalência de gauge”. Lema: O Lagrangeano 1 2 ~ ~x) − qφ(t, ~x) , L = m~x˙ + q~x˙ · A(t, 2 (1.2.24) reproduz as equações do movimento de uma partı́cula actuada pela força de Lorentz. Demonstração: As equações de Euler-Lagrange para este Lagrangeano d ∂L ∂L − =0 i ∂x dt ∂ ẋi q~x˙ · ⇒ ~ ∂A ∂φ d − q i − (mẋi + qAi ) = 0 . i ∂x ∂x dt (1.2.25) ~ depende do tempo tanto Note-se que a derivada em ordem ao tempo é total e que A explicitamente como através da dependência em ~x. Assim a equação fica ∂φ ∂Ai ∂Ai ∂xj 1 ∂A1 2 ∂A2 3 ∂A3 q ẋ = mẍi . + ẋ + ẋ − i− − j ∂xi ∂xi ∂xi ∂x ∂t ∂x ∂t Usando (1.2.23) reescrevemos a equação ∂A2 ∂Ai ∂A3 ∂Ai ∂A1 ∂Ai 2 3 1 ~ i = mẍi . − 1 +v − 2 +v − 3 + (E) q v ∂xi ∂x ∂xi ∂x ∂xi ∂x (1.2.26) (1.2.27) Tomando como exemplo a componente i = 1 desta equação, reescrevemo-la como h i h i 2 3 ~ ~ ~ ~ ~ q v ∇ × A − v ∇ × A + (E)1 = mẍ1 ⇔ q E + ~v × B = mẍ1 , (1.2.28) 3 2 1 1.2 Mecânica Lagrangeana 11 e analogamente para as outras componentes, o que demonstra o Lema. (q.e.d.) Voltemos então ao problema de Larmor. Podemos escolher os seguintes potenciais electromagnéticos para o problema E ~ =0 B ~ = Be φ=0 A ~ = B (−y, x, 0) 2 , (1.2.29) 1 Bq L(~x, ~x˙ , t) = m(ẋ2 + ẏ 2 + ż 2 ) + (xẏ − y ẋ) , 2 2 (1.2.30) ⇐ z originando o Lagrangeano e as equações de Euler-Lagrange Bq Bq d − y + mẋ = 0 ẏ − dt 2 2 d Bq Bq x + mẏ = 0 − ẋ − 2 dt 2 d − (mż) = 0 dt qB ẏ ẍ = m qB ÿ = − ẋ m z̈ = 0 , (1.2.31) que são as mesmas equações obtidas no formalismo Newtoniano (1.1.8). 1.2.2 Teorema de Noether Neste último exemplo obtivemos uma equação do movimento da forma d (mż) = 0 dt ⇒ pz ≡ mż = constante , (1.2.32) o que significa existir uma quantidade conservada no movimento, pz . A existência desta quantidade conservada é consequência directa de neste problema haver uma simetria na direcção z e, como tal, de o Lagrangeano não depender de z. A generalização deste resultado é conhecida como Teorema de Noether, (Emmy Noether 1882-1935) um dos mais importantes em mecânica Lagrangeana: Teorema (Noether): Se o Lagrangeano de um sistema fı́sico L(~q, ~q˙ , t) é invariante pela acção de transformações do tipo ~q −→ ~q + δ~q , (1.2.33) 12 Tópicos de Mecânica Clássica para algum δ~q, isto é, possui uma simetria na direcção definida por δ~q, então existe uma quantidade conservada no movimento desse sistema fı́sico associada com essa simetria. Demonstração: Escolher uma coordenada y tal que as suas linhas integrais sejam tangentes a δ~q; a invariância de L significa que L não depende da coordenada y, ∂L/∂y = 0; logo, a equação do movimento de y é d ∂L =0 ⇒ dt ∂ ẏ ∂L ≡ py = constante , ∂ ẏ (1.2.34) o que significa que py é uma constante do movimento. 1.3 Mecânica Hamiltoniana Tanto no formalismo Newtoniano como Lagrangeano, as equações do movimento são equações diferenciais de segunda ordem. Quer para implementação numérica, quer para uso de métodos analı́ticos é, em muitas circunstâncias, mais conveniente resolver um conjunto de 2n equações diferenciais de primeira ordem do que um conjunto de n equações diferenciais equivalentes de segunda ordem. Isto sugere a introdução de um formalismo em que as equações do movimento são de primeira ordem, que é o caso do formalismo Hamiltoniano (William Hamilton 1805-1865). Este formalismo é também o caminho canónico para a quantificação de um sistema fı́sico. No formalismo Lagrangeano, as variáveis independentes são (q, q̇, t), (1.3.1) e o Lagrangeano é visto como uma função destas variáveis L = L(q, q̇, t) . (1.3.2) Anteriormente já introduzimos uma nova variável que em geral depende de q̇, que é o momento canónico conjugado a q, p≡ ∂L . ∂ q̇ (1.3.3) 1.3 Mecânica Hamiltoniana 13 É pois natural, para obter equações de primeira ordem, tomar como variáveis independentes (q, p, t), (1.3.4) e pensar no Lagrangeano como uma nova função em que as variáveis independentes são estas L̂ = L̂(q, q̇(q, p, t), t) . (1.3.5) As equações de Euler-Lagrange d ∂L ∂L − =0 ∂q dt ∂ q̇ ⇔ ṗ = ∂L , ∂q (1.3.6) tem de ser expressas em termos da função L̂. Note-se que em geral ∂L ∂ L̂ 6= , ∂q ∂q (1.3.7) pois estas são derivadas parciais. De facto ∂L ∂L ∂ ∂ L̂(q, q̇(q, p, t), t) = + q̇(q, p, t) ⇔ ∂q ∂q ∂ q̇ ∂q ∂ ∂L ∂ L̂(q, p, t)−p q̇(q, p, t) . (1.3.8) = ∂q ∂q ∂q Usando (1.3.6) e notando que o lado direito da última equação já está totalmente expresso em termos de funções das novas variáveis (q, p, t), obtemos ∂ ṗ = − pq̇(q, p, t) − L̂(q, p, t) . ∂q (1.3.9) Por outro lado calculemos também ∂ ∂ ∂ q̇ ∂ ∂ L̂(q, p, t) = L(q, q̇, t) = p q̇(q, p, t) = (pq̇(q, p, t)) − q̇(q, p, t) , ∂p ∂ q̇ ∂p ∂p ∂p (1.3.10) ou q̇ = ∂ (pq̇(q, p, t) − L̂(q, p, t)) . ∂p (1.3.11) Para simplificar a forma das equações (1.3.9) e (1.3.11), introduzimos o Hamiltoniano definido como H(q, p, t) ≡ pq̇(q, p, t) − L(q, q̇(q, p, t), t) , (1.3.12) 14 Tópicos de Mecânica Clássica em termos do qual, as equações (1.3.9) e (1.3.11) reescrevem-se como q̇ = ∂H , ∂p ṗ = − ∂H , ∂q (1.3.13) denominadas equações de Hamilton ou equações canónicas. Estas equações contêm a mesma informação que as equações de Euler-Lagrange, mas em vez de uma (ou n para n coordenadas) equação de segunda ordem temos agora duas (2n) equações de primeira ordem. Note-se que tudo o que fizemos para ir do formalismo Lagrangeano para o Hamiltoniano foi uma mudança de variáveis independentes (q, q̇, t) −→ (q, p, t) , (1.3.14) o que motivou a substituição do Lagrangeano por uma outra função, o Hamiltoniano L(q, q̇, t) −→ H(q, p, t) . (1.3.15) Esta última transformação, que aparece associada a uma mudança de variáveis toma o nome de transformada de Legendre, cuja interpretação geométrica é dada no apêndice A. Calculemos agora o Hamiltoniano para cada um dos nossos dois exemplos. Exemplo 1, Versão c): Dado que o Lagrangeano para o oscilador harmónico é (1.2.16) temos 1 1 L = mẋ2 − kx2 2 2 ⇒ p≡ ∂L = mẋ , ∂ ẋ (1.3.16) o que significa que o momento canónico conjugado a x é o momento dinâmico usual, isto é, a quantidade de movimento. Logo H = pẋ − L = 1 p2 + kx2 = T + V , 2m 2 (1.3.17) isto é, o Hamiltoniano é a energia cinética mais a energia potencial, ou seja, a energia total do sistema. Como exercı́cio pode verificar que as equações de Hamilton deste Hamiltoniano são equivalentes a (1.1.5). Em geral, um Lagrangeano do tipo 1 L = mẋ2 − V (x) 2 ⇒ H= p2 + V (x) , 2m (1.3.18) 1.3 Mecânica Hamiltoniana 15 o que é ainda a energia total. Exemplo 2, Versão c): Comecemos por deduzir o Hamiltoniano para uma partı́cula a interagir com um campo electromagnético arbitrário, cujo Lagrangeano vimos ser (1.2.24) 2 1 ~ ~x) − qφ(t, ~x) L = m~x˙ + q~x˙ · A(t, 2 ⇒ ~. ~p = m~x˙ + q A (1.3.19) Neste caso o momento canónico conjugado a ~x não é o momento dinâmico usual o que mostra que estas duas quantidades não têm de coincidir. O Hamiltoniano resultante é ~ 2 (~p − q A) + qφ . H = ~p · ~x˙ − L = 2m (1.3.20) ~ = m~x˙ concluimos que o Hamiltoniano é ainda a energia cinética mais Notando que p~ − q A a energia potencial devido ao potencial φ. Esta é a energia total em jogo. O efeito do potencial magnético é levado em conta usando a regra de substituir no Hamiltoniano ~, ~p −→ p~ − q A (1.3.21) a que se chama acoplamento minimal. Mas note-se que esta regra, corresponde a manter o 2 termo cinético como sendo m~x˙ /2. Assim, numa situação em que o potencial φ seja nulo (ou constante) concluimos que a energia cinética da partı́cula tem de ser constante e como tal também a norma da sua velocidade.5 Isso é exactamente o que acontece no problema de Larmor para as trajectórias da figura 1.2. Especializando (1.3.20) para os potenciais (1.2.29) obtemos o Hamiltoniano 1 H= 2m qBy px + 2 2 1 + 2m 2 qBx p2 py − + z . 2 2m (1.3.22) Como exercı́cio pode verificar que as equações de Hamilton deste Hamiltoniano são equivalentes a (1.1.8) - Folha de Problemas 8, exercı́cio 1d). 5 A menos de efeitos de irradiação de ondas electromagnéticas e correspondente perda de energia, conforme o problema 2 da Folha de Problemas 1. 16 Tópicos de Mecânica Clássica 1.3.1 O Espaço de Fase e os Parêntesis de Poisson O formalismo Hamiltoniano desenrola-se no espaço de fase, que é o espaço parameterizado por (q, p), que são as variáveis independentes neste formalismo. A simetria das equações canónicas (1.3.13) sugere a introdução de coordenadas unificadas ξ i = (q, p) ξ1 = q , ξ2 = p , ⇔ (1.3.23) de modo que as equações canónicas são reescritas ∂H ξ˙i = ω ij j , ∂ξ (1.3.24) onde ω ij são as componentes de uma matriz anti-simétrica (dita simplética) 0 1 . ω ij = −1 0 (1.3.25) Na equação (1.3.24) usamos a chamada convenção de Einstein, que significa que quando um ı́ndice aparece repetido num produto, denota uma soma de termos correspondendo a todos os valores possı́veis desse ı́ndice.6 Em (1.3.24) o ı́ndice j aparece repetido no produto do lado direito. Logo temos de somar sobre todos os valores possı́veis de j, ou seja 1, 2. Por exemplo, a componente i = 1 de (1.3.24) fica ∂H ∂H ξ˙1 = ω 11 1 + ω 12 2 ∂ξ ∂ξ ⇔ q̇ = ∂H , ∂p (1.3.26) que é uma das equações canónicas. Consideremos a evolução de uma determinada variável dinâmica f = f (q, p, t). A sua evolução temporal é dada por df ∂f ∂f ∂f ∂f ∂f ∂H ∂f ∂H = + q̇ + ṗ = + − , dt ∂t ∂q ∂p ∂t ∂q ∂p ∂p ∂q (1.3.27) ou em termos das coordenadas unificadas df ∂f ∂f ∂H = + ω ij i j dt ∂t ∂ξ ∂ξ 6 ⇔ df ∂f = + {f, H} , dt ∂t (1.3.28) Rigorosamente, o ı́ndice repetido tem que aparecer uma vez como covariante que corresponde a estar em baixo na variável (ou em cima quando a variável está no denominador) e uma vez como contravariante que corresponde a estar em cima na variável (ou em baixo quando no denominador). 1.3 Mecânica Hamiltoniana 17 onde introduzimos os Parêntesis de Poisson, definidos como {A, B} ≡ ω ij ∂A ∂B ∂A ∂B ∂B ∂A = − . i j ∂ξ ∂ξ ∂q ∂p ∂q ∂p (1.3.29) Os parêntesis de Poisson têm 3 importantes propriedades i) Bi-linearidade {α1 A1 + α2 A2 , B} = α1 {A1 , B} + α2 {A2 , B} , (1.3.30) onde α1,2 são constantes e uma expressão análoga pode ser escrita para o segundo argumento nos parêntesis. ii) Anti-simetria {A, B} = −{B, A} . (1.3.31) {A, {B, C}} + {B, {C, A}} + {C, {A, B}} = 0 . (1.3.32) iii) Identidade de Jacobi Devido a estas propriedades, os parêntesis de Poisson são um exemplo de parêntesis de Lie e a álgebra de funções no espaço de fase por eles originada é uma álgebra de Lie, que será definida na secção 9.1. Os parêntesis de Poisson são um objecto fundamental na quantificação canónica de um sistema fı́sico. Apliquemos a equação de evolução (1.3.28): • Às coordenadas unificadas ξ i ξ˙i = {ξ i, H} . (1.3.33) Estas são exactamente as equações canónicas. • Ao Hamiltoniano ∂H . (1.3.34) ∂t O Hamiltoniano é uma quantidade conservada no movimento a menos que dependa Ḣ = explicitamente do tempo. Como se pode mostrar directamente da definição de Hamiltoniano que ∂H ∂L =− , ∂t ∂t (1.3.35) 18 Tópicos de Mecânica Clássica isto reflecte a conservação de energia para Lagrangianos independentes do tempo. • A uma variável dinâmica g que não tenha dependência explı́cita no tempo ġ = {g, H} . (1.3.36) Ou seja, g é uma constante do movimento se e só se comutar com o Hamiltoniano em termos dos parêntesis de Poisson. 1.3.2 A Equação de Hamilton-Jacobi Como vimos, a mudança do formalismo Lagrangeano para o formalismo Hamiltoniano corresponde a uma mudança de variáveis independentes descrita por (1.3.14), tornando-se depois natural mudar a função dinâmica de Lagrangeano para Hamiltoniano. Dentro do formalismo Hamiltoniano, podem-se fazer mudanças de variáveis independentes do tipo (q, p, t) −→ (Q(q, p, t), P (q, p, t), t) , (1.3.37) ou seja mudar de coordenadas no espaço de fase, requerendo que as equações canónicas mantenham a sua forma. Isto é, que haja uma função K = K(Q, P, t) que desempenha o papel de novo Hamiltoniano7 e que nas novas coordenadas se possam escrever equações do movimento do tipo canónico Ṗ = − ∂K , ∂Q Q̇ = ∂K . ∂P (1.3.38) Nem todas as transformações do tipo (1.3.37) permitem escrever equações do movimento do tipo (1.3.38). Transformações que o permitem designam-se canónicas. Depois de uma transformação canónica ainda temos um Hamiltoniano, K = K(Q, P, t), ao qual podemos associar um Lagrangiano, P Q̇ − K e como tal deduzir as trajectórias fı́sicas entre t1 e t2 pelo princı́pio variacional δ Z t2 t1 7 h i P Q̇ − K(Q, P, t) dt = 0 . (1.3.39) Para distinguir do Hamiltoniano original, e porque é convencional usar a letra K, designa-se por vezes esta função de ‘Kamiltoniano’. 1.3 Mecânica Hamiltoniana 19 Mas nas coordenadas originais existe, obviamente, um princı́pio semelhante δ Z t2 t1 [pq̇ − H(q, p, t)] dt = 0 . (1.3.40) Uma condição suficiente8 para a mudança de coordenadas (1.3.37) de modo a que (1.3.39) seja consistente com (1.3.40), é pq̇ − H = P Q̇ − K + dF , dt (1.3.41) onde F é uma função no espaço de fase, denominada função geradora, que pode ser expressa nas coordenadas velhas, novas ou numa combinação de novas e velhas. Este último caso, quando possı́vel, é particularmente útil, pois F funciona como uma ponte de ligação na mudança de coordenadas. Temos então quatro hipóteses a) F = F1 (q, Q, t) b) F = F2 (q, P, t) c) F = F3 (p, Q, t) d) F = F4 (p, P, t) . (1.3.42) Tomando a hipótese a), (1.3.41) fica pq̇ − H = P Q̇ − K + ∂F1 ∂F1 ∂F1 Q̇ , + q̇ + ∂t ∂q ∂Q (1.3.43) e como estamos a tomar q e Q como variáveis independentes obtemos que para esta equação ser obedecida (i) ∂F1 =p, ∂q (ii) ∂F1 = −P , ∂Q (iii) K = H + ∂F1 . ∂t (1.3.44) Dada uma função geradora, (i) dá-nos p = p(q, Q, t), que se for possı́vel inverter dá Q = Q(q, p, t). Então, (ii) dá P = P (q, Q(q, p, t), t) e (iii) dá-nos o novo Hamiltoniano. Note-se que os dois Hamiltonianos só diferem se F1 depender explicitamente do tempo. Para fazer um raciocı́nio semelhante com a hipótese b) em (1.3.42), temos de tomar F = F2 (q, P, t) − QP . 8 (1.3.45) Esta condição não é necessária para que a transformação seja canónica; existem transformações canónicas mais gerais. 20 Tópicos de Mecânica Clássica p P (q, p, t) −→ (Q, P, t) (q(t),p(t)) (Q(t),P(t))=(const.,const.) Q q Figura 1.5: O formalismo de Hamilton-Jacobi é definido por uma função geradora associada a uma mudança para coordenadas ‘co-móveis’ com a partı́cula no espaço de fase. Neste caso (1.3.43) e (1.3.44) são substituidas por pq̇ − H = −QṖ − K + (i) ∂F2 =p, ∂q (ii) ∂F2 ∂F2 ∂F2 Ṗ , + q̇ + ∂t ∂q ∂P ∂F2 =Q, ∂P (iii) K = H + ∂F2 . ∂t (1.3.46) (1.3.47) respectivamente. Mais uma vez, (i) dá-nos p = p(q, P, t), que se for possı́vel inverter dá P = P (q, p, t). Então, (ii) dá Q = Q(q, P (q, p, t), t) e (iii) dá-nos o novo Hamiltoniano. Raciocı́nios semelhantes existem para c) e d) em (1.3.42), mas o caso b) é o mais útil para o formalismo de Hamilton-Jacobi que vamos agora deduzir. Uma escolha muito particular de novas coordenadas no espaço de fase, Q e P , é um sistema de coordenadas onde a partı́cula está parada - figura 1.5 Q = constante P = constante , (1.3.48) e o novo Hamiltoniano é também uma constante, que podemos tomar como sendo zero. As novas equações canónicas (1.3.38) são trivialmente obedecidas e toda a dinâmica fica contida na transformação de coordenadas, em particular na função geradora. Se escolhermos uma função geradora do tipo 2, toda a informação sobre a dinâmica fica contida nas equações (1.3.47). Neste caso, constuma-se representar F2 pela letra S = S(q, P, t) que se designa função principal de Hamilton ou função acção e que obedece a ∂S =p, ∂q (1.3.49) 1.3 Mecânica Hamiltoniana 21 o que significa que o momento é o gradiente da função acção, ∂S =Q, ∂P (1.3.50) cujo significado veremos em baixo e ainda ∂S ∂S ,t = − , H q, p = ∂q ∂t (1.3.51) que é a equação de Hamilton-Jacobi (H-J). Esta equação foi primeiramente estudada por Hamilton em óptica e só depois usada por Karl Jacobi (1804-1851) em mecânica. O formalismo de Hamilton-Jacobi pode ser interpretado da seguinte forma. Fisicamente, mudamos para coordenadas ‘co-móveis’ com a partı́cula e portanto, ao descobrir essa mudança de coordenadas resolvemos, simultaneamente, o movimento da partı́cula. Em termos matemáticos, estabelecemos a equivalência entre resolver um sistema de 2n equações diferenciais ordinárias de primeira ordem (para o caso de n graus de liberdade qi , i = 1...n) e resolver uma equação diferencial com n + 1 (correspondendo a qi , t) derivadas parciais. Uma solução da equação de H-J com n + 1 variáveis, terá n + 1 constantes de integração. Mas uma dessas constantes será irrelevante, pois na equação de H-J só entram as derivadas de S e como tal se S é solução, S ′ = S + constante, também é solução. Assim, haverá n constantes relevantes de integração, que podemos identificar com as constantes Pi . Daı́ concluimos que o significado de (1.3.50) é que a derivada da função acção em ordem às constantes de integração pode ser considerada constante, uma ferramenta muito útil quando usamos o método de Hamilton-Jacobi na prática. A razão pela qual se chama função acção a S(q, P, t) é a seguinte. Da acção definida em (1.2.6), que é um funcional, constrói-se uma função que obedece à equação de HamitonJacobi. De facto, a função acção S = S(q, P, t) ⇒ dS ∂S ∂S = q̇ + , dt ∂q ∂t (1.3.52) pois P é constante, ou usando (1.3.49) e (1.3.51), dS = pq̇ − H = L , dt ⇒ S(t) = Z t t0 Ldt′ + constante , (1.3.53) 22 Tópicos de Mecânica Clássica que é uma função - dado que o limite superior do integral não está fixo - construida da acção. Hamiltonianos independentes do tempo Se o Hamiltoniano não depende explicitamente do tempo, o lado direito da equação de Hamilton-Jacobi também não deverá depender do tempo pelo que podemos tomar a função acção como sendo S = −Et + h(q) , (1.3.54) onde E tem a interpretação de energia, pois é igual ao Hamiltoniano. Para um Hamiltoniano do tipo H= p2 + V (q) , 2m (1.3.55) a equação de Hamilton-Jacobi reduz-se a ∂h ∂q 2 = 2m(E − V (q)) , (1.3.56) de onde se extrai imediatamente uma assinatura caracterı́stica da mecânica clássica: esta equação só tem solução real se E > V (q); logo o movimento é proibido onde a energia da partı́cula é menor que o potencial. Integrando e substituindo em (1.3.54) obtemos Z p S = −Et ± 2m(E − V (q))dq . (1.3.57) Para resolver o problema dinâmico usamos o facto, anteriormente mencionado, que as derivadas da função acção relativamente às constantes de integração são também constantes. Assim, ∂S = const. ∂E (1.3.57) ⇒ r Z dq m p t=± + constante . 2 E − V (q) (1.3.58) Substituindo pelo potencial do problema em questão obtém-se t = t(q), que invertendo nos dá q = q(t), e portanto a solução do problema dinâmico. Voltaremos a encontrar a equação de Hamilton-Jacobi, no limite clássico da equação de Schrödinger (secção 8.4). 1.4 Sumário 1.4 23 Sumário Vimos os vários tipos de equações da mecânica clássica: • Newtonianas, d~p ; F~ = dt (1.4.1) • Euler-Lagrange, para o Lagrangeano L = L(q, q̇, t), d ∂L ∂L − =0; dt ∂ q̇ ∂q (1.4.2) • Hamiltonianas, para o Hamiltoniano H = H(q, p, t), q̇ = ∂H , ∂p ṗ = − ∂H , ∂q (1.4.3) ou, de um modo mais geral, a evolução de uma variável dinâmica f = f (q, p, t) é dada por ∂f df = + {f, H} ; dt ∂t • Hamilton-Jacobi, para uma função acção S = S(q, P, t), ∂S ∂S ∂S =Q, H q, p = ,t = − . ∂P ∂q ∂t (1.4.4) (1.4.5) Dadas condições iniciais, qualquer um destes conjuntos de equações determina exactamente a trajectória da partı́cula tal e qual a podemos medir num instante posterior. Este determinismo é o paradigma da mecânica clássica. CAPÍTULO 2 O perı́odo de Transição Historicamente podemos atribuir uma data de nascimento à Mecânica Quântica. No dia 14 de Dezembro de 1900, Max Planck (1858-1947), apresentou uma solução inovadora para explicar as caracterı́sticas observadas da radiação do corpo negro. O modelo de Planck continha a génese das ideias quânticas bem como introduzia aquela que viria a ser chamada constante de Planck, a constante fundamental da Mecânica Quântica. No entanto, somente 26 anos depois a Mecânica Quântica emergiria na sua forma final. No perı́odo intermédio, entre 1900 e 1926 viveu-se um perı́odo de transição em que, para explicar certos resultados experimentais, se introduziu na fı́sica os conceitos de i) Quantificação de grandezas fı́sicas; ii) Dualidade onda-partı́cula; iii) Interpretação probabilı́stica de fenómenos. Para muitos dos fı́sicos envolvidos neste processo, estas ideias não seriam mais do que conceitos temporários, que a devida altura deveriam ser substituidos por ideias mais convencionais. Em particular, o ponto iii) aparecia como altamente indesejável para a maioria da comunidade cientı́fica, sendo a reluctância desta espelhada na famosa frase de Einstein 26 O perı́odo de Transição y θi θ1 MEIO 1 x MEIO 2 θ2 Figura 2.1: Um raio de luz proveniente do meio 1, incidente na superfı́cie y = 0 com ângulo de incidência θi tem uma componente reflectida, ângulo de reflexão θ1 e uma componente refractada, emergente no meio 2 na direcção definida por θ2 . ‘Deus não joga aos dados...’ . No entanto é no ponto ii) que se encontra quer a origem do ponto i) e do ponto iii) quer a essência da mecânica quântica. Vamos discutir algumas das experiências que motivaram a introdução destas ideias e terminamos este capı́tulo com o quadro conceptual que delas emergiu. 2.1 A luz: ondas versus corpúsculos Para além do conceito de partı́cula discutido anteriormente (i.e. pequenas “bolas de bilhar”), também o conceito de onda nos é familiar. As ondas circulares que se propagam num lago calmo onde cai uma pedra ou as ondas numa corda de guitarra a vibrar são dois exemplos familiares. Entre o século XVII e o século XIX, duas correntes antagónicas disputavam qual a natureza da luz. Newton (e os seus seguidores), naturalmente inspirado pelo sucesso da sua mecânica de partı́culas, defendia que a luz é um fluxo de pequenos corpúsculos. Christian Huyghens (1629-1695) concebeu a ideia de a luz ser uma onda, a propagar-se através de um suporte invisı́vel baptizado de éter. A discussão centrava-se nos seguintes fenómenos fı́sicos: • Reflexão; como a verificada num espelho ou numa superfı́cie de água. Obviamente 2.1 A luz: ondas versus corpúsculos 27 este fenómeno era observado para a luz. Era explicado pela teoria corpuscular por conservação da quantidade de movimento que previa (ver figura 2.1) θi = θ1 (lei da reflexão) , (2.1.1) mas podia também ser quantitativamente explicado pela teoria ondulatória pelo princı́pio de Huygens, ou, em óptica geométrica pelo princı́pio do tempo mı́nimo de Fermat - apêndice B; • Refracção; ou seja, uma mudança (normalmente) brusca na direcção de propagação da luz, em geral devido à mudança de meio, um fenómeno também observado para a luz. Se a luz fosse feita de pequenos corpúsculos poder-se-ia invocar conservação de momento para explicar a refracção do seguinte modo: consideremos que o meio 1 está a um potencial V1 e o meio 2 a um potencial V2 , no ‘setup’ da figura 2.1. Na transição de meio por uma partı́cula existe uma força que nela actua que tem apenas componente Fy . Logo px é conservada ou seja v2 sin θi = sin θ2 v1 (‘Lei da refraccão corpuscular′ ) . (2.1.2) Por outro lado, se a luz fosse uma onda, o princı́pio de Huygens (ou o princı́pio do tempo mı́nimo de Fermat - apêndice B) implica sin θi v1 = sin θ2 v2 (lei de Snell) . (2.1.3) Mas devido à dificuldade em medir a velocidade de luz num meio, esta diferença não foi suficiente para decidir qual a verdadeira natureza da luz até ao século XIX. (Note que Jean Bernard Léon Foucault (1819-1868) fez as primeiras medições da velocidade da luz em meados do séc. XIX.) • Difracção; Fenómeno ondulatório; capacidade de ondas rodearem obstáculos - como a água do mar rodeia uma rocha - e por isso não produzirem ‘sombras’ bem definidas figura 2.2. Pelo contrário, corpúsculos não são difractados - figura 2.3; se a luz fosse corpuscular deixaria uma sombra bem definida. Mas todos sabemos que a luz de 28 O perı́odo de Transição ECRA sombra mal definida obstaculo Frentes de onda em t=0 Frentes de onda em t>0 Figura 2.2: Ondas sofrem difracção, isto é, rodeiam o obstáculo. As duas frentes de onda - uma proveniente de cada um dos lados do obstáculo - interferem. A sua fase num determinado ponto depende da distância que cada uma teve de viajar para chegar a esse ponto; por exemplo, no meio a interferência é construtiva. Este é o padrão de difracção do obstáculo, que estraga a sombra. Na figura não está representada a onda reflectida. uma lanterna ou do sol deixa sombras bem definidas; este argumento levou a que a teoria corpuscular fosse dominante durante todo o século XVIII. Embora com diferenças quantitativas, tanto a perspectiva ondulatória como corpuscular da luz explicam os fenómenos de reflexão e refracção, enquanto que apenas a teoria ondulatória explica o fenómeno de difracção (ou de interferência em geral). Em óptica, os primeiros dois costumam ser tratados por óptica geométrica,1 onde se lida com raios de luz e não frentes de onda, que por sua vez são essenciais para a óptica fı́sica que lida com os fenómenos puramente ondulatórios. 2.1.1 Experiências de Young (1801): ondas triunfam Quando temos uma situação em que ondas encontram um obstáculo existem duas escalas relevantes: λ=comprimento de onda, e l=largura do obstáculo. Thomas Young (1773-1829) observou que as ondas na água só tinham uma difracção apreciável e como tal “sombras” mal definidas imediatamente atrás do obstáculo se l.λ. 1 (2.1.4) A óptica geométrica é uma aproximação quase corpuscular da óptica que é válida quando l ≫ λ, na notação da próxima secção. 2.1 A luz: ondas versus corpúsculos ECRA 29 sombra bem definida obstaculo corpusculos em t=0 t>0 Figura 2.3: Corpúsculos não sofrem difracção; assim, foi argumentado que se a luz fosse corpuscular as sombras deveriam ser bem definidas. ECRA sombra bem definida obstaculo Frentes de onda em t=0 Frentes de onda em t>0 Figura 2.4: Ondas sofrem uma difracção negligenciável se o obstáculo é grande relativamente ao comprimento de onda. Note-se que mais uma vez não representamos a onda reflectida. Se l ≫ λ há uma zona atrás do obstáculo onde a sombra está bem definida, tal como na teoria corpuscular, isto é, a difracção é negligenciável - figura 2.4. Assim, a nossa experiência diária de sombras bem definidas seria consistente com uma teoria ondulatória da luz se os objectos cujas sombras vemos tivessem largura muito maior do que o comprimento de onda da luz. Podemos também considerar a experiência contrária, isto é, consideremos uma onda plana com comprimento de onda λ que em vez de encontrar um obstáculo passa por uma fenda de tamanho l. Se l ≃ λ a difracção da onda é grande, pelo que a fenda se comporta como uma fonte de ondas circulares. Para testar a verdadeira natureza da luz contraste-se a experiência na figura 2.5 com a 30 O perı́odo de Transição Figura 2.5: Experiência de Young com ondas (extraı́do das Feynman lectures on Physics Vol 3 ). experiência na figura 2.6. Experiência de Young com ondas Como explicado anteriormente, as duas fendas na parede (a) da figura 2.5, funcionam (quase) como fontes de ondas circulares, ou mais rigorosamente, semi-circulares. Existe um detector que mede a altura instantânea da água num ponto x - coordenada paralela ao detector - medindo A1 (x)ei(ωt+φ1 (x)) ≡ h1 (x)eiωt , se apenas a fenda 1 estiver aberta i(ωt+φ2 (x)) A2 (x)e iωt ≡ h2 (x)e , (2.1.5) , se apenas a fenda 2 estiver aberta onde Ai são as amplitudes e φi são fases, cuja informação se condensa nas amplitudes complexas hi (x). O detector pode ainda calcular a intensidade das ondas, que por analogia com as ondas electromagnéticas (para as quais corresponde à energia que passa pelo detector por unidade de tempo e de área perpendicular à direcção de propagação), é o quadrado do 2.1 A luz: ondas versus corpúsculos 31 módulo da amplitude, obtendo I1 = |h1 (x)|2 , se apenas a fenda 1 estiver aberta I2 = |h2 (x)|2 , se apenas a fenda 2 estiver aberta , (2.1.6) que são dados pelos padrões em (c) na figura. Consideremos agora que as duas fendas estão abertas. As ondas ‘emitidas’ a partir das duas fendas têm a mesma fase no mesmo instante de tempo, pois provêm de uma mesma onda antes da parede. Neste caso, a altura da água no detector e a intensidade das ondas são dados respectivamente por (h1 (x) + h2 (x))eiωt , I1+2 = |h1 (x) + h2 (x)|2 . (2.1.7) Dependendo da coordenada x, as ondas poderão estar em fase ou não. Por exemplo, exactamente no meio do detector (correspondente a igual distância das duas fendas), as ondas vão estar em fase pois demoram o mesmo tempo a chegar lá. Em geral I1+2 = |h1 (x) + h2 (x)|2 = |h1 (x)|2 + |h2 (x)|2 + 2|h1 (x)||h2 (x)| cos δ(x) , (2.1.8) onde δ é o angulo entre eiφ1 (x) e eiφ2 (x) . Este fenómeno de interferência explica o padrão (c) na figura 2.5. Uma ‘experiência de Young’ com corpúsculos Imaginemos uma pistola que atira balas aleatoriamente como na figura 2.6. A variável x pode ser vista como uma variável aleatória, correspondendo à posição de chegada das balas. O detector obtém as seguintes funções de distribuição de probabilidades: P1 (x) , se apenas a fenda 1 estiver aberta P2 (x) , se apenas a fenda 2 estiver aberta . (2.1.9) P1+2 (x) = P1 (x) + P2 (x) , se as duas fendas estiverem abertas Em particular, não há interferência entre corpúsculos. Note-se a diferença fundamental entre corpúsculos e ondas, expressa em (2.1.9) versus (2.1.6) e (2.1.8). A probabilidade para corpúsculos é a soma das probabilidades individuais. A intensidade das ondas - que no 32 O perı́odo de Transição Figura 2.6: Experiência de Young com ‘balas’ (extraı́do das Feynman lectures on Physics - Vol 3 ). final do capı́tulo faremos corresponder a uma probabilidade - não é a soma das intensidades individuais; de facto resulta da soma das amplitudes individuais. Fazendo este tipo de experiência com luz, com duas fendas muito finas (e pequena distância entre elas), Young observou um padrão de interferência semelhante ao da figura 2.5 (c), e concluiu que a luz era uma onda. Esta perspectiva foi reforçada pela teoria de Maxwell que tem soluções ondulatórias para o campo electromagnético - ondas electromagnéticas, descobertas posteriormente - em 1887 - por Hertz, das quais a luz visı́vel é um exemplo. Mais ainda, (2.1.3) foi derivado da teoria de Maxwell e medida em experiências com radiação electromagnética (e não (2.1.2)). Assim, no final do século XIX a comunidade cientı́fica concordava que a luz (e toda a radiação electromagnética) seria um fenómeno ondulatório. 2.1 A luz: ondas versus corpúsculos 33 Figura 2.7: Distribuição espectral da radiação de um corpo negro; fórmula clássica de Rayleigh-Jeans versus resultados experimentais (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). 2.1.2 A radiação do corpo negro, Planck e o quantum (1900) Consideremos um corpo que absorve toda a radiação electromagnética nele incidente, isto é, um absorsor perfeito. Como, em particular, ele absorve o espectro visı́vel, este é um corpo negro. Se um corpo negro está em equilı́brio térmico à temperatura T , ele terá de emitir tanta energia por unidade de tempo quanto aquela que recebe - o corpo negro é também um emissor perfeito. Mas ao contrário da energia recebida, que pode ser arbitrariamente distribuida pelas diversas frequências no espectro electromagnético, verifica-se experimentalmente que a energia emitida tem um distribuição espectral ρT (ν)dν, muito bem definida, que só depende da temperatura do corpo negro. A curva experimental ρT (ν)dν tem a forma de uma ‘montanha assimétrica’ - figura 2.7. A descrição teórica deste fenómeno em fı́sica clássica, envolvia calcular o número de ondas estacionárias numa cavidade (3-dimensional) com frequência no intervalo dν, multiplicando o resultado pela energia média de uma onda, dada pelo teorema da equipartição 34 O perı́odo de Transição de energia como sendo KB T , onde KB é a constante de Boltzmann, cujo valor numérico é KB = 1.38 × 10−23 Joule/K . (2.1.10) Deste modo, obtém-se a fórmula de Rayleigh-Jeans ρT (ν)dν = 8πν 2 KB T dν . c3 (2.1.11) Comparando esta lei com a curva experimental - figura 2.7 - verifica-se um desacordo absoluto para frequências elevadas, dado que a previsão teórica diverge, que foi baptizado como catástrofe do ultra-violeta. Em 1900, Planck mostrou os seguintes dois factos: • 1) A curva experimental era bem reproduzida pela fórmula empı́rica ρT (ν) = 8πν 2 hν , 3 hν/K BT − 1 c e (2.1.12) hoje chamada Lei de Planck. Nesta fórmula foi introduzida a constante h, chamada constante de Planck com dimensões de Energia×T empo (as mesmas da Acção introduzida em (1.2.6)) e com o valor numérico (actual) h = 6.626 × 10−34 Joule × Segundo , (2.1.13) que foi inicialmente determinada ajustando a lei de Planck à curva experimental da radiação do corpo negro. A constante de Planck tornar-se-á a constante fundamental da mecânica quântica. Para frequências pequenas, a exponencial na Lei de Planck pode ser aproximada pelos dois primeiros termos da sua série de Taylor KB T ν≪ h 8πν 2 8πν 2 hν ⇒ ρT (ν) ≃ 3 = 3 KB T , c 1 + hν/KB T − 1 c (2.1.14) e portanto recuperamos a fórmula de Rayleigh-Jeans, que de facto dava bons resultados para frequências pequenas. Mas para frequências elevadas, a fórmula de Planck ν≫ KB T h ⇒ ρT (ν) ≃ evitando a catástrofe do ultra-violeta. 8πν 2 hν ν→∞ −→ 0 , c3 ehν/KB T (2.1.15) 2.1 A luz: ondas versus corpúsculos 35 a) b) c) d) e) Figura 2.8: a) Distribuição de Boltzmann; b) Energia média na teoria clássica - independente da frequência da radiação - corresponde à area debaixo da curva; c),d),e) Energia média na teoria de Planck. Em cada caso, o integral é substituı́do por uma soma de Riemann, sendo a frequência da radiação o tamanho da base dos rectângulos. Para frequências pequenas, a soma de Riemann é praticamente igual ao integral - c). À medida que aumentamos a frequência, a soma de Riemann diminui tendendo asimptoticamente para zero. Na notação da figura k = KB e E¯ = hEi (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). 36 O perı́odo de Transição • 2) Comparando (2.1.11) com (2.1.12), a diferença está no valor da energia média de uma onda, que classicamente era calculada pela ‘lei de equipartição da energia’. Esta lei é deduzida da distribuição de Boltzmann, que é uma função de distribuição de probabilidade (portanto já normalizada) para encontrar um oscilador harmónico com energia E a uma temperatura T P(E) = e−E/KB T . KB T (2.1.16) Uma onda estacionária não é mais do que um oscilador harmónico. A energia média destas ondas é (conforme (C.40)) Z ∞ Z −E/KB T ∞ hEi = EP(E)dE = −Ee |0 + 0 ∞ e−E/KB T dE = KB T . (2.1.17) 0 Planck observou que para reproduzir o comportamento experimental a energia média teria de ter os seguintes comportamentos assimptóticos ν→0 hEi −→ KB T , ν→∞ hEi −→ 0 . (2.1.18) Isto é, tem de haver um ‘cut-off’ na energia média para frequências elevadas, de modo a impedir a catástrofe do ultra-violeta. A grande contribuição de Planck foi perceber que isto se podia conseguir discretizando a energia que o corpo negro emite E = nhν . (2.1.19) A energia é quantificada, sendo o quantão de energia - a quantidade mı́nima emitida de cada vez - hν. Em vez de (2.1.16) temos agora uma distribuição discreta para a probabilidade de encontrar uma onda com frequência ν no n-ésimo estado de energia, En , e−nhν/KB T , Pn = P(En = nhν) = KB T n = 0, 1, 2, 3, ... (2.1.20) Esta distribuição de probabilidade não está normalizada. Assim sendo, a energia média é ! P∞ P∞ ∞ −nhν/KB T X nhνe E P d n=0 n=0 n n = P = −KB T ν ln hEi = P e−nhν/KB T , (2.1.21) ∞ ∞ −nhν/KB T P e dν n=0 n n=0 n=0 mas o último somatório é apenas uma soma geométrica; logo hν d 1 hEi = −KB T ν ln = hν/K T , −hν/K T B B dν 1−e e −1 (2.1.22) 2.1 A luz: ondas versus corpúsculos 37 Figura 2.9: Esquerda: Aparato experimental do efeito fotoeléctrico; Direita: Variação da intensidade de corrente com o potencial entre cátodo e ânodo para duas intensidades de luz diferentes (Extraı́do de Tipler, ‘Physics’ ). que é exactamente o necessário para obter a lei de Planck. Assim, a radiação do corpo negro é explicada se a energia de um oscilador harmónico, e como tal a energia da radiação emitida pelo corpo negro, estiver quantificada. Mas estar quantificada é dizer que vem em pedaços, o que se assemelha mais a uma descrição corpuscular do que ondulatória da radiação. 2.1.3 O efeito fotoeléctrico (Einstein 1905) O efeito fotoeléctrico foi descoberto por Hertz em 1887 e estudado por Lenard em 1900. Consiste na ejecção de electrões de um material onde incide luz (ou, mais geralmente, radiação electromagnética). Um aparato experimental possı́vel está representado na figura 2.9, que pode ser descrito do seguinte modo: • Luz incide no cátodo C, ejectando electrões; • Se algum electrão atinge o ânodo A, gera-se uma corrente eléctrica no circuito externo; 38 O perı́odo de Transição • O número de electrões que atinge o ânodo pode ser aumentado ou diminuido introduzindo uma diferença de potencial entre A e C, V = VA − VC , (2.1.23) • Se V > 0, significa que o potencial aumenta (para uma carga positiva; para uma carga negativa efectivamente diminui) e mais electrões chegam ao ânodo; • Quando V é suficientemente grande, isto é V > V1 , (2.1.24) para um certo V1 , todos os electrões ejectados atingem o ânodo e aumentando ainda mais V a corrente não se altera - figura 2.9. Esta corrente limite é designada corrente de saturação; • Lenard observou que a corrente máxima é proporcional à intensidade da luz. Tal facto era esperado com base na teoria clássica: duplicando a intensidade da luz, duplicamos a energia incidente por unidade de tempo e de área e como tal duplicamos o número de electrões ejectados e como tal a corrente; • Se pelo contrário V é negativo, menos electrões chegam ao ânodo (do que se não houvesse potencial), pois são repelidos; • Se V é suficientemente negativo, V < V0 , (2.1.25) para um dado V0 , nenhum electrão chega ao ânodo. Chama-se a V0 o potencial de paragem, que está relacionado com a energia cinética máxima dos electrões emitidos por |eV0 | = 1 2 mv 2 onde e, m são a carga e massa do electrão; max , (2.1.26) 2.1 A luz: ondas versus corpúsculos 39 Figura 2.10: Experiência de Millikan (1916), obtendo a recta prevista por Einstein para a variação do potencial de paragem entre cátodo e ânodo com a frequência da luz (Extraı́do de Tipler, ‘Physics). • V0 não depende da intensidade luminosa para luz da mesma frequência, o que não está de acordo com a teoria clássica. Pela teoria clássica, aumentando a intensidade luminosa, deveria aumentar a energia cinética máxima dos electrões e como tal variar V0 . Esta contradição entre teoria clássica e experiência levou Einstein, em 1905, a propôr que a energia na luz está distribuı́da em pequenos pacotes, posteriormente baptizados de fotões, com energia dada pela fórmula de Planck, E = hν . (2.1.27) Variando a intensidade da luz mas não a sua frequência, varia o número de fotões, mas não a energia de cada um deles. Como cada electrão ejectado sê-lo-ia por choque com um fotão, isto explicava porque V0 não dependia da intensidade luminosa. Se assim fosse, 1 2 mv 2 max = |eV0 | = hν − φ , (2.1.28) 40 O perı́odo de Transição em que φ é a chamada função de trabalho, que é a energia necessária para extrair um electrão do metal. Daqui se deduz que |V0 | = φ h ν− . |e| |e| (2.1.29) As experiências de Robert Millikan (1868-1952) em 1914, 1916 mostraram esta relação linear - figura 2.10 - sendo o declive consistente com os valores para a constante de Planck medidos através da radiação do corpo negro. Uma outra caracterı́stica do efeito fotoeléctrico que não pode ser explicada pela teoria clássica é a ausência de intervalo de tempo entre a incidência de radiação e a ejecção de electrões. A intensidade da radiação é a potência por unidade de área que chega ao cátodo. Podemos diminuir a intensidade de modo a que fossem preciso horas para obter energia suficiente para superar a função de trabalho e ejectar um electrão. Mas experimentalmente não se detecta, essencialmente, nenhum intervalo de tempo. Nem este depende da intensidade. À luz da teoria fotónica isto é facilmente explicável. Diminuindo a intensidade diminuem os fotões que chegam por unidade de tempo, mas cada fotão é suficiente para ejectar um electrão. A teoria corpuscular da radiação teve ainda outras vitórias, da qual destacamos o efeito Compton (demonstrado em 1923), que lida com a difusão de radiação por electrões. Assim, mais de um século depois das experiências de Young, era novamente necessário invocar a teoria corpuscular para descrever o comportamento da luz, sendo que o comportamento ondulatório continuava a ser fundamental para explicar os fenómenos de difracção e interferência que vimos anteriormente. Este estado de coisas levou Einstein a escrever, em 1924 “Existem hoje duas teorias sobre a luz, as duas indispensáveis... e sem qualquer ligação lógica entre si.”. Antes de vermos como lida a mecânica quântica com este aparente paradoxo, mudemos a discussão da radiação para a matéria. 2.2 Matéria: corpúsculos versus ondas Por volta de 1910 sabia-se que o átomo, embora neutro, continha electrões. O efeito fotoeléctrico, por exemplo, demonstrava-o. Mas devido à sua neutralidade, tinha também 2.2 Matéria: corpúsculos versus ondas 41 de conter cargas positivas, pelo que se questionava qual a distribuição no átomo de cargas negativas e positivas. J. J. Thomson (1856-1940) propusera o seu modelo do ‘pudim de passas’, em que os electrões se apresentavam como as passas num pudim que, por sua vez, representava a distribuição de carga positiva. O conjunto teria um raio da ordem de 10−10 m,2 isto é, 1 Angström. Se o átomo estivesse no mı́nimo da sua energia, os electrões estariam parados em posições de equilı́brio; se o átomo estivesse excitado - por exemplo aquecido -, os electrões oscilariam em torno dessas posições de equilı́brio, emitindo no processo radiação electromagnética. Explicava-se assim qualitativamente - mas não quantitativamente - os espectros atómicos. As experiências de Ernest Rutherford (1871-1937) em 1911 mostraram que o modelo de Thompson era inadequado. Rutherford fez incidir numa fina folha metálica um feixe colimado de partı́culas α, isto é, átomos de hélio duplamente ionizados. O objectivo era medir o ângulo de desvio dessas partı́culas α (dito o ângulo de difusão) relativamente à direcção inicial, devido à interacção com os átomos na folha metálica. Como este desvio resulta de uma interacção electromagnética poder-se-ia estimar a partir da sua medição o potencial a que as partı́culas α estavam sujeitas. A surpresa foi encontrar eventos em que as partı́culas α eram desviadas de ângulos muito elevados, até perto de 180o, isto é, algumas partı́culas α voltavam para trás! Nas palavras de Rutherford: ”Era como se disparassemos uma bala de canhão contra um lenço de papel e a bala voltasse para trás.”. A conclusão é que essas (poucas) partı́culas α que eram muito deflectidas encontravam um forte potencial repulsivo, o que implica uma forte concentração de carga positiva num pequeno espaço. Esta era a contradição com o modelo de Thomson, em que a carga positiva se encontrava dispersa em todo o raio atómico - cerca de 10−10 m -, enquanto que pelas estimativas de Rutherford o potencial repulsivo observado necessitaria que essa carga estivesse concentrada num raio de 10−14 m.3 2 Este número pode ser estimado considerando a densidade de uma substância pura, o seu peso atómico e o número de Avogadro. 3 Mais rigorosamente, era possı́vel num modelo como o de Thomson explicar a existência de deflexões perto dos 180o através de uma soma de pequenas deflexões. Contudo, a probabilidade de isso acontecer 42 O perı́odo de Transição Assim Rutherford sugeriu que a carga positiva de um átomo e como tal a grande maioria da massa, dado que se sabia que a razão da massa do electrão para a massa do átomo era muito pequena, estavam concentradas numa pequena zona central chamada núcleo. Deste modelo, Rutherford deduziu uma expressão para a secção eficaz diferencial de difusão que de facto explicava quantitativamente os seus resultados experimentais, validando o modelo (ver capı́tulo 10). Mas deixava em aberto a questão do que fariam os electrões neste modelo atómico. Se os electrões estivessem inicialmente parados, cairiam rapidamente para o núcleo, neutralizando-o e eliminando o forte potencial repulsivo necessário para explicar as experiências de Rutherford. Era pois necessário estabilizar os electrões longe do núcleo. Um modelo simples era o análogo do sistema solar. Os electrões encontrarse-iam em órbitas circulares ou elı́pticas em volta do núcleo (ver Folhas de Problemas). Só que isto implicaria que os electrões tivessem movimentos acelerados. De acordo com o electromagnetismo clássico uma carga acelerada emite radiação, perdendo gradualmente energia, o que implicaria que os electrões tivessem órbitas em espiral caindo rapidamente no núcleo. O tempo que demoraria esse processo pode ser estimado do seguinte modo. Veremos na próxima secção que a energia total de uma órbita clássica circular de raio r é dada por (2.2.10). Assumindo que o raio da órbita pode variar com o tempo num processo ‘quase-estático’4 obtemos dE 1 Ze2 = ṙ . dt 8πǫ0 r 2 (2.2.1) Por outro lado, pela fórmula de Larmor dada no problema 2c) da folha de Problemas 1, usando para a aceleração a fórmula da aceleração centrı́peta 2 dE e2 e2 v 4 Ze2 (2.2.9) = − =− . dt 6πǫ0 c3 r 2 6πǫ0 c3 4πǫ0 mr 2 (2.2.2) Igualando estas duas expressões para a derivada temporal da energia obtemos (para Z = 1) 2 4α2 ~2 4 α~ 2 3 (t − t0 ) . (2.2.3) 3r ṙ = − ⇒ r =− cm2 c m neste modelo implicava uma variação do número de acontecimentos com a espessura da folha metálica que não era verificada experimentalmente. 4 Esta hipótese poderá não ser muito boa, mas a estimativa do tempo de queda é representativa da fı́sica do processo. 2.2 Matéria: corpúsculos versus ondas 43 Figura 2.11: Experiência para medir um espectro atómico (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). Introduzimos a constante de estrutura fina α≡ e2 . 4πǫ0 ~c (2.2.4) Como esperado, o raio diminui com o tempo. Para uma órbita de 10−10 m, pode-se estimar o tempo de queda em cerca de 10−10 segundos! O átomo não seria estável e para além disso esta radiação - que teria um espectro contı́nuo - emitida na queda era diferente da radiação atómica observada que tem um espectro discreto que agora discutimos. 2.2.1 O Espectro do átomo de Hidrogénio Um espectro atómico pode ser medido com um ‘setup’ experimental do tipo da figura 2.11. Há essencialmente dois tipos de espectros: • No espectro de emissão, a fonte de luz na esquerda da figura 2.11, corresponde ao gás (monoatómico) cujo espectro se quer medir, no qual se faz descargas eléctricas. As descargas eléctricas excitam os átomos que, ao voltarem para o seu estado de energia mı́nima, emitem radiação. Esta é encaminhada através de uma fenda para um prisma, que dispersa a radiação nos diversos comprimentos de onda, que são impressos numa chapa 44 O perı́odo de Transição Figura 2.12: Fotografia do espectro de emissão do hidrogénio (cima) - série de Balmer; comprimentos de onda correspondentes (baixo) (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). fotográfica. Para o hidrogénio obtém-se, na região do visı́vel, uma fotografia do tipo da imagem de cima na figura 2.12. Estas linhas são (parte do) espectro de emissão do átomo de Hidrogénio. • No espectro de absorção, a fonte de luz emite um espectro contı́nuo que incide num contentor de vidro onde se encontra o gás a estudar. Este irá absorver alguns comprimentos de onda particulares. Os restantes seguem para a fenda e daı́ para o prisma e chapa fotográfica. Assim, na fotografia de um espectro de absorção teremos algumas riscas onde falta radiação, ao contrário do espectro de emissão que corresponde a algumas riscas onde radiação foi emitida. Olhando para a figura 2.12 há uma regularidade óbvia nas riscas do espectro de emissão do hidrogénio. Em 1885, Johann Balmer (1825-1898) mostrou que a seguinte fórmula reproduzia correctamente os comprimentos de onda, λ, das riscas observadas: 1 1 1 , n = 3, 4, 5, ... = RH − λ 22 n2 (2.2.5) onde RH é a chamada constante de Rydberg, cujo valor numérico (actual) é RH = 10967757.6 ± 1.2 m−1 . (2.2.6) 2.2 Matéria: corpúsculos versus ondas 45 À série de comprimentos de onda descritos pela fórmula de Balmer chama-se série de Balmer. Para o hidrogénio existe uma infinidade de séries de comprimentos de onda, cada um descrito por uma fórmula semelhante a (2.2.5) - as primeiras cinco encontram-se escritas na tabela seguinte. Nome da série Zona de Comprimentos de onda Lyman Ultravioleta Balmer Ultravioleta próximo e visı́vel Paschen Infravermelho Brackett Infravermelho Pfund Infravermelho 1 λ 1 λ 1 λ 1 λ 1 λ 1/λ 1 = RH 2 1 1 = RH 2 2 1 = RH 2 3 1 = RH 2 4 1 = RH 52 Valores de n − − − − − 1 n2 1 n2 1 n2 1 n2 1 n2 n = 2, 3, 4, . . . n = 3, 4, 5, . . . n = 4, 5, 6 . . . n = 5, 6, 7 . . . n = 6, 7, 8, . . . Era pois necessário um modelo atómico capaz de explicar estas riscas que fosse ao mesmo tempo consistente com as observações de Rutherford. 2.2.2 O modelo atómico de Bohr (1913) Um tal modelo foi proposto por Niels Bohr (1885-1962), baseado na observação que, em mecânica clássica, o movimento de uma carga num campo de Coulomb tinha como possı́veis soluções para órbitas fechadas, elipses e circunferências. Por simplicidade Bohr escolheu as últimas e postulou que: i) Um electrão num átomo move-se em órbitas circulares em torno do núcleo, sob a influência do campo de Coulomb do núcleo, de acordo com as leis da mecânica clássica; ii) Ao contrário das leis da mecânica clássica, apesar de acelerado, o electrão não irradia energia, mantendo a sua energia E constante; iii) Ao contrário das leis da mecânica clássica, as únicas órbitas possı́veis para o movimento do electrão são aquelas cujo momento angular orbital, L, é um múltiplo inteiro 46 O perı́odo de Transição de h/2π L = n~ ⇔ mvr = n~ , ~ ≡ h/2π ; (2.2.7) iv) Radiação electromagnética é emitida sempre que um electrão, inicialmente em movimento numa órbita de energia total Ei muda descontinuamente - impossı́vel em mecânica clássica - o seu movimento para uma órbita de energia total Ef . A radiação emitida tem frequência ν= Ei − Ef . h (2.2.8) Bohr notou que estes postulados conduziam a uma explicação quantitativa do átomo de hidrogénio. Mas generalizemos o argumento para um átomo com número atómico Z. O raio de uma órbita circular em mecânica clássica é determinado pela igualdade da força centrı́peta (Coulomb neste caso) com a força centrı́fuga v2 1 Ze2 = m , 4πǫ0 r 2 r (2.2.9) onde ‘e’ é a carga do electrão (em módulo). A energia total de uma órbita circular no problema de Coulomb é dada por 1 1 Ze2 E = mv 2 − 2 4πǫ0 r (2.2.9) = − 1 Ze2 . 8πǫ0 r (2.2.10) Estes são os ingredientes necessários. Usando o terceiro postulado de Bohr em (2.2.9) obtemos r= 4πǫ0 2 2 n~ , mZe2 (2.2.11) 2 (2.2.12) o que introduzido em (2.2.10) dá E=− Ze2 4πǫ0 m . 2n2 ~2 A quantificação do momento angular das órbitas permitidas implica a quantificação da energia dessas órbitas. Assim, o quarto postulado de Bohr diz-nos que a radiação emitida quando o electrão salta de uma órbita com momento angular ni ~ para uma órbita com momento angular nf ~ ! 2 2 Ze m 1 1 ν= − 2 , 4πǫ0 4π~3 n2f ni c=νλ ⇒ 1 = λ Ze2 4πǫ0 2 m 4π~3 c 1 1 − 2 2 nf ni ! . (2.2.13) 2.2 Matéria: corpúsculos versus ondas 47 Figura 2.13: ‘Saltos’ correspondendo às várias séries do átomo de hidrogénio (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). Esta fórmula reproduz a fórmula para as várias séries do átomo de hidrogénio, se identificarmos5 R∞ = RH , onde R∞ ≡ Ze2 4πǫ0 2 m . 4π~3 c (2.2.14) O modelo de Bohr dá a seguinte interpretação ao átomo de hidrogénio. Chamemos a cada valor possı́vel de n um estado do electrão. Existe um nı́vel de energia mı́nimo, chamado estado fundamental, correspondente a n = 1. Todos os outros estados em que o electrão se pode encontrar são excitados. Cada série do átomo de hidrogénio corresponde a todos os saltos possı́veis do electrão para um dado estado. Quando o estado final é o fundamental (n = 1)/primeiro excitado (n = 2)/segundo excitado (n = 3) essa é a série de Lyman/Balmer/Paschen - figura 2.13. M R∞ , pois o centro de massa do movimento não é exactamente no núcleo Rigorosamente, RH = m+M que tem massa M . Mas mesmo para o hidrogénio, M/m ≃ 1836, o que torna a aproximação de considerar o núcleo como o centro de massa boa. Contudo, como a espectroscopia é uma ciência muito exacta podemM se medir os desvios desta aproximação. Mas considerando RH = m+M R∞ verifica-se concordância com os dados experimentais até 3 partes em 100.000, que resulta da estrutura fina. 5 48 O perı́odo de Transição 2.2.3 As ondas electrónicas Qual o significado e porque funciona a quantificação do momento angular proposta por Bohr? Em 1924, Louis de Broglie (1892-1987) propôs na sua tese de doutoramento que tal como a luz tinha comportamentos corpusculares e ondulatórias, talvez também a matéria tivesse ambos os comportamentos. Em particular isto deveria ser verdade para os electrões. Se assim fosse, poderiamos associar tanto à radiação como à matéria quantidades ondulatórias - como frequência (ν) e comprimento de onda (λ) - e quantidades algo mais ‘corpusculares’ - como energia (E) e quantidade de movimento (~p). De Broglie propôs que estas quantidades estariam relacionadas pelas equações E = hν , |~p| = h . λ (2.2.15) A primeira é a relação de Planck usada também por Einstein para explicar o efeito fotoeléctrico. A segunda é consequência da primeira para a radiação, dado que para o campo electromagnético, E = c|~p|, e, c = νλ; de Broglie propôs uma tal relação para atribuir um comprimento de onda a uma partı́cula de matéria. Se assim fosse, o terceiro postulado de Bohr (2.2.7) ficaria mvr = n h 2π ⇔ 2πr = n h |~p| ⇔ 2πr =λ. n (2.2.16) Recordemos que o objectivo de Bohr era explicar a estabilidade e os nı́veis de energia do hidrogénio. A última relação diz-nos que a quantificação do momento angular requerida por Bohr é equivalente, se aceitarmos a proposta de de Broglie, à condição de existência de ondas estacionárias! Quando uma onda está encerrada num intervalo fechado de dimensão L, os estados estacionários só existem para comprimentos de onda que sejam um divisor de L. Outros comprimentos de onda não têm a periodicidade correcta. Esta observação dava um significado fı́sico claro ao postulado de Bohr, se aceitassemos a hipótese de de Broglie. Em 1926-27 a ideia de de Broglie foi confirmada pela experiência, através da detecção de padrões de difracção de feixes de electrões em experiências feitas por Clinton Davisson (1881-1958) e Lester Germer (1896-1971) nos EUA e G.P. Thomson (1892-1975) 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 49 na Escócia.6 Desde essas experiências já se mostrou que objectos tão variados como feixes moleculares de hidrogénio, feixes atómicos de hélio ou neutrões também apresentam padrões de difracção. Assim verifica-se a hipótese de de Broglie: Todos os objectos materiais, que normalmente consideramos partı́culas ou aglomerados de partı́culas têm também comportamento ondulatório. A razão porque, por exemplo, uma bola de futebol com a massa de 1 Kg e deslocando-se à velocidade de 10 m/s não aparenta qualquer caracterı́stica ondulatória é porque o seu comprimento de onda de de Broglie é 6.6 × 10−34 h = = 6.6 × 10−35 m , (2.2.17) mv 1 × 10 que é extremamente pequeno; a bola terá uma difracção completamente irrelevante em λ= qualquer fenómeno do nosso quotidiano. Pelo contrário, um electrão com energia cinética de 100 eV, ou seja, 1.6 × 10−17 J (que pode ainda ser considerado não relativista) tem comprimento de onda de de Broglie é λ= √ h 6.6 × 10−34 =√ = 1.2 × 10−10 m , 2mEc 2 × 9.1 × 10−31 × 100 × 1.6 × 10−19 (2.2.18) que é da ordem do diâmetro atómico, sendo por isso o electrão difractado por uma rede de átomos - figura 2.14. Notemos que introduzindo a frequência angular ω = 2πν e o vector de onda ~k cujo módulo é 2π/λ, escrevemos as relações de Einstein-de Broglie (2.2.15) E = ~ω , 2.3 p~ = ~~k . (2.2.19) A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica Se tanto a matéria como a radiação têm tanto propriedades corpusculares como ondulatórias há duas questões imediatas 6 Existe alguma ironia no facto de J.J. Thomson ter ganho o prémio Nobel em 1906 pela sua descoberta do electrão em 1897, que caracterizou como uma partı́cula, e o seu filho G.P.Thomson ter ganho o prémio Nobel em 1937 pela descoberta da difracção do electrão em 1927. Assim, Thomson, o pai, ganhou o Nobel por ter mostrado que o electrão é uma partı́cula e Thomson, o filho, ganhou o Nobel por ter mostrado que o electrão é uma onda...’ 50 O perı́odo de Transição Figura 2.14: Cima: Aparato experimental para a experiência de Debye-Scherrer para observar a difração de raios X (baixo esquerda - usa cristais de óxido de zircónio) ou elecrões (baixo direita - usa cristais de ouro). (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 51 • As propriedades ondulatórias do fotão são descritas pelas equações de Maxwell. Que equação descreve as propriedades ondulatórias do electrão? • Que relação existe entre estes dois tipos de propriedades? Historicamente estas perguntas só foram clarificadas com i) O trabalho de Erwin Schrödinger (1887-1961) que em 1925 postulou uma equação de onda para descrever as ondas associadas a uma partı́cula de matéria, como por exemplo um electrão. As soluções da sua equação denominam-se funções de onda, Ψ(x); ii) O trabalho de Max Born (1882-1970) que, em 1926, sugeriu que a interpretação a dar às funções de onda de Schrödinger seria de amplitude de probabilidade para encontrar a partı́cula num determinado ponto x e cujo módulo ao quadrado Ψ(x)Ψ(x)∗ seria uma densidade de probabilidade;7 Estudemos duas experiências que ilustram esta interpretação probabilı́stica. A primeira lida com a função de onda no espaço de posições. Mas a maioria das partı́culas tem outros graus de liberdade que não apenas a sua posição ou momento. O spin dos electrões (ver capı́tulo 9) e a polarização dos fotões são dois exemplos. Assim, a função de onda completa de uma partı́cula deverá conter informação acerca desses outros graus de liberdade. No segundo exemplo ilustramos a parte da ‘função de onda’ respeitante à polarização de fotões. 2.3.1 Experiência de Young com luz de baixa intensidade Consideremos de novo a experiência de Young com um setup experimental semelhante ao da figura 2.5 e com luz monocromática, frequência ν. A experiência original de Young mostrou que a luz8 apresenta um padrão de interferência e portanto conclui-se que ela tem propriedades ondulatórias. Por outro lado, do efeito fotoeléctrico sabemos que a Ψ(x) será em geral complexo e ‘∗′ designa o complexo conjugado. Assim a densidade de probabilidade é garantidamente positiva e normalizando esta função termos uma função de distribuição de probabilidade no sentido de (C.39) 8 Por luz pode-se entender a partir de agora radiação electromagnética. 7 52 O perı́odo de Transição intensidade da fonte é um indicador do número de fotões emitidos por unidade de tempo, todos eles tendo a mesma energia hν. Imaginemos que diminuimos a intensidade ao ponto de ser emitido apenas um fotão de cada vez. No alvo colocamos ao longo da direcção x um grande número de pequenos fotomultiplicadores, de modo a identificar com grande precisão a coordenada x em que o fotão incide no alvo. Observamos o seguinte i) Os fotodetectores detectam impactos localizados do fotão, isto é, um fotodetector dá sinal de cada vez, de acordo com a descrição corpuscular; ii) Para pequenos números de fotões, os impactos dos fotões parecem ter uma distribuição aleatória - figura 2.15 - esquerda; iii) Para grandes números de fotões, começamos a recuperar o perfil de interferência que vemos na experiência original de Young - figura 2.15 - direita. Assim, as propriedades corpusculares são confirmadas no que toca à detecção individual de fotões - a luz vem em pacotes. E as propriedades ondulatórias são verificadas no que toca à detecção de um padrão de interferência quando muitos fotões já incidiram no alvo. A localização do impacto de cada fotão parece ser aleatória. Mas reconhecemos que estatisticamente os fotões distribuem-se de acordo com o padrão de interferência. Ou seja • A intensidade da onda descreve a densidade de probabilidades para a localização do impacto. Mas se o fotão tem um comportamento corpuscular, então cada fotão passa ou pela fenda 1 ou ou pela fenda 2 da figura 2.5, correcto? Mas se assim for, bloquearmos uma das fendas deveria apenas parar cerca de metade dos fotões continuando os outros a exibir o padrão de interferência. Mas nós sabemos da experiência de Young original que não é assim; bloqueando uma das fendas não há padrão de interferência! Mas então, do ponto de vista de um fotão individual, ele intefere com quê? Não pode ser com os outros, na medida em que nós fizemos a experiência de modo que um fotão passasse de cada vez. Logo 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 53 Figura 2.15: Experiência de Young com fotões. Esquerda: alguns impactos individuais parecem aleatoriamente distribuidos; Direita: Estatisticamente começamos a ver o padrão de interferência a formar-se. • Cada fotão individual tem de inteferir consigo mesmo e só interfere se as duas fendas estiverem abertas! Notemos que se fizéssemos uma experiência de Young com electrões com um setup tal que o tamanho das fendas seja da ordem do comprimento de onda de de Broglie dos electrões de modo a que estes sejam apreciavelmente difractados, observarı́amos: - Os electrões apresentam um padrão de difração semelhante ao da figura 2.5; - Se enviassemos electrões individualmente, o fenómeno da figura 2.15 repetir-se-ia; Isto é, tudo o que descrevemos para fotões podia ser repetido ‘ipsis verbis’ para os electrões. Tentemos, com a experiência de electrões responder à seguinte questão: ‘Será que conseguimos ver porque fenda passa o electrão, sem alterar o padrão de difracção observado?’ O setup experimental e o seu resultado estão representados na figura 2.16. Existe uma fonte luminosa imediatamente a seguir às fendas de modo a que se note uma variação da intensidade recebida por essa fonte devido à passagem do electrão. Se por exemplo o electrão passar pela fenda 2, observamos uma variação na luminosidade no ponto A. Assim 54 O perı́odo de Transição Figura 2.16: Experiência de Young com electrões onde tentamos ver a fenda pelo qual o electrão passa. Se o fizermos, necessariamente perdemos o perfil de interferência (extraı́do das Feynman lectures in Physics - Vol 3 ). podemos determinar porque lado passou o electrão. Se o fizermos, o padrão de difracção desaparece! Temos de concluir que • Vermos o sistema quântico, implica interagir com ele de um modo que o altera. • Não conseguimos ver o comportamento ondulatório e corpuscular de um sistema simultaneamente. A interpretação canónica em Mecânica Quântica (dita interpretação de Copenhaga) destas estranhas conclusões é a seguinte: i) Enquanto não é medido, o fotão/electrão não existe como entidade localizada, como corpúsculo, mas encontra-se antes diluı́do por todo o espaço com uma amplitude de probabilidade que é dada pela função de onda; ii) Apenas quando se efectua uma medição se dá o colapso da função de onda, após o qual detectamos o fotão/electrão como corpúsculo localizado e cuja localização apenas pode ser prevista probabilisticamente com a função de distribuição de probabilidade sendo o quadrado do módulo da função de onda (normalizada). 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 55 De acordo com esta interpretação, as caracterı́sticas ondulatórias do fotão/electrão resultam da sua amplitude de probabilidade se comportar como uma onda. Quando interferimos de algum modo com esta onda, de modo a poder detectar onde se encontra a partı́cula a ela associada, mudamo-la, de modo a não podermos mais ver os aspectos ondulatórios. Assim aspectos ondulatórios e corpusculares são complementares princı́pio da complementaridade. Note-se que classicamente estes aspectos eram vistos como incompatı́veis. 2.3.2 O princı́pio da incerteza de Heisenberg Existe uma expressão matemática para a incapacidade de, num sistema fı́sico, vermos simultaneamente as propriedades ondulatórias e corpusculares de um electrão ou de um fotão ou de qualquer outro objecto. • Por partı́cula (pontual) entendemos algo que tem uma posição bem definida x; • Por onda, entendemos um objecto que tem um comprimento de onda, λ, bem definido. Note-se que quando sobrepomos ondas com diferentes comprimentos de onda (próximos) e amplitudes semelhantes os padrões de interferência começam a ficar mal definidos. Assim, deve haver uma expressão matemática que nos diga que a precisão com que conhecemos x e λ não pode ser, simultaneamente, arbitrariamente pequena. Uma expressão quantitativa pode ser deduzida da seguinte maneira. Consideremos uma partı́cula descrita, num determinado instante, por uma função de onda Ψ(x). A função de onda determina uma função de distribuição de probabilidade P(x), dada por Z Ψ(x)Ψ(x)∗ 2 P(x) = , onde kΨk = dxΨ(x)Ψ(x)∗ . 2 kΨk (2.3.1) Quanto menor for o desvio padrão de x, ∆x, sendo x tratado como uma variável aleatória relativamente à densidade de probabilidade P(x), mais parecida fica a partı́cula com uma partı́cula clássica. Por outro lado, podemos exprimir a função de onda como uma combinação linear de ondas planas monocromáticas, usando um integral de Fourier Z +∞ 1 Ψ(x) = √ Ψ̃(k)eikx dk , 2π −∞ (2.3.2) 56 O perı́odo de Transição onde a transformada de Fourier é 1 Ψ̃(k) ≡ √ 2π Z +∞ Ψ(x)e−ikx dx . (2.3.3) −∞ Podemos encarar Ψ̃ como sendo a função de onda no espaço de Fourier, cujo quadrado do módulo nos dá uma densidade de probabilidade para a distribuição do vector de onda k = 2π/λ. A nossa partı́cula será tanto mais parecida com uma onda quanto menor for o desvio padrão da variável aleatória k, ∆k, calculada relativamente à densidade de probabilidade Ψ̃(k)Ψ̃(k)∗ , P̃ (k) = kΨ̃k2 2 onde kΨ̃k = Z dk Ψ̃(k)Ψ̃(k)∗ . (2.3.4) Mas é uma propriedade das transformadas de Fourier que (em uma dimensão) ∆x∆k ≥ 1 , 2 (2.3.5) ou, usando a relação de de Broglie p = h/λ = ~k, ∆x∆p ≥ ~ . 2 (2.3.6) Esta é a relação de incerteza de Heisenberg. O coeficiente do ~ nesta equação é n/2 quando usamos transformadas de Fourier para funcões em n dimensões. Por isso exprime-se em geral o princı́pio da incerteza como ∆x∆p & ~ . (2.3.7) Note-se que as grandes implicações fı́sicas estão contidas na passagem de (2.3.5) para (2.3.6). A primeira destas expressões refere-se apenas a uma relação entre a dispersão de uma função espacial e a dispersão dos comprimentos de onda das funções sinusoidais que a descrevem no espaço de Fourier. É quando usamos a relação de de Broglie, que transformamos esta expressão em termos de quantidades puramente corpusculares, x e p. Obtemos então uma limitação ao conhecimento de duas variáveis que associamos a uma partı́cula pontual e que em termos clássicos podem ser conhecidas simultaneamente com precisão arbitrária. 2.3 A dualidade onda/corpúsculo e a interpretação probabilı́stica da Mecânica Quântica 57 Esta incerteza está intrinsecamente relacionada com o facto de que, no mundo microscópico, quando tentarmos ver o sistema, isto é, medir qualquer coisa, necessariamente alteramos o sistema em questão. Essa alteração tem um resultado imprevisı́vel, numa perspectiva determinista, como se vê pelos impactos localizados dos fotões na figura 2.15. O princı́pio da incerteza de Heisenberg inspirou, desde que foi apresentado, algumas das mais interessantes discussões sobre o conhecimento humano, quer numa perspectiva filosófica quer numa perspectiva cientı́fica. O ponto de vista aqui apresentado é que se trata de uma expressão matemática do princı́pio da complementaridade. 2.3.3 Experiência com a polarização da luz Consideramos uma experiência com uma onda electromagnética plana e monocromática frequência ω - a propagar-se na direcção Oz da figura 2.17. Supomos que o campo eléctrico está polarizado linearmente na direcção definida por ep e como tal pode ser representado por ~ r , t) = E0 ep ei(kz−ωt) , E(~ (2.3.8) onde E0 é uma constante e como tal a intensidade da luz (energia que passa por z = constante por unidade de área e tempo) é I= ǫ0 c |E0 |2 . 2 (2.3.9) Coloquemos um polarizador A que transmite a luz polarizada paralelamente a Ox e absorve a luz polarizada paralelamente a Oy. Depois de passar pelo polarizador, a onda encontra-se polarizada linearmente na direcção Ox e como tal o campo eléctrico é descrito por ~ ′ (~r, t) = E ′ ex ei(kz−ωt) , E 0 (2.3.10) e a intensidade da luz é dada pela lei de Malus I ′ = I cos2 θ . (2.3.11) Esta lei descreve o comportamento clássico da radiação ao passar por um polarizador. Mas o que acontece se diminuirmos a intensidade suficientemente de modo a enviar um fotão de cada vez? 58 O perı́odo de Transição Figura 2.17: Setup experimental para experiência com a polarização de fotões (extraı́do de Cohen et al., ‘Quantum Mechanics’ ). i) Não é possı́vel haver ‘meio’ fotão. Logo o fotão passa ou não passa pelo polarizador; ii) Se colocarmos um fotodetector atrás do polarizador veremos que o fotão passa ou é absorvido aleatoriamente; para grandes números de fotões enviados, N, detectaremos atrás do polarizador N cos2 θ fotões, que seria o que esperarı́amos pela fórmula clássica (2.3.11); Fixemos as seguintes ideias deste exemplo • Numa medição de um sistema quântico há determinados resultados priveligiados, denominados resultados ou valores próprios. Neste caso os resultados proprios são: a) o fotão passa; b) o fotão não passa; o espectro de resultados possı́veis é, portanto, discreto; isto contrasta com a situação clássica, onde o valor da intensidade depois do polarizador varia continuamente entre I e 0, dependendo de θ; • Descrevemos a polarização do fotão por um vector de polarização ep . A cada valor próprio corresponde um estado próprio para o fotão e =e ‘passa′ p x está associado o estado próprio Para o valor próprio e =e ‘não passa′ p y . 2.4 A aplicabilidade da Mecânica Quântica 59 Se o fotão se encontra num dado estado próprio, então o resultado de uma medição da sua polarização é, com probabilidade igual a um, o valor próprio associado a esse estado próprio. • Para descrevermos o facto de o fotão passar, ou não, aleatoriamente, dizemos que antes da medição, o fotão encontra-se numa sobreposição de estados de polarização; isto é a ‘função de onda’ de polarização ep = cos θex + sin θey . (2.3.12) O quadrado do módulo do coeficiente de um dado estado próprio descreve a probabilidade de obter numa medição o valor próprio associado a esse estado próprio. Aplicando esta regra temos uma probabilidade de cos2 θ (sin2 θ) para o fotão passar (não passar). Note-se que a soma da probabilidade de todos os estados tem de ser igual a um, caso contrário é necessário normalizar a função de onda de polarização. A esta regra de decomposição em estados próprios chama-se princı́pio de decomposição espectral. Note-se que esta decomposição depende do ‘setup’ experimental. Neste caso, o ângulo θ é o ângulo com a direcção do polarizador. • Quando ‘vemos’ se o fotão passa ou não, interagimos com ele de modo que a sua função de onda colapsa para um estado próprio. A partir desse momento o fotão encontra-se nesse estado próprio. Por exemplo, se sabemos que ele passou pelo primeiro polarizador - porque interagimos com ele - então passará por outros polarizadores iguais ao primeiro que ponhamos no seu caminho. Mais uma vez vemos que interagir com um sistema quântico, mesmo que com o objectivo ‘inocente’ de o ver, implica alterá-lo de uma maneira fundamental. 2.4 A aplicabilidade da Mecânica Quântica Na teoria da relatividade existe uma constante fundamental que é a velocidade da luz, c. A existência desta constante dá-nos um critério simples para saber se temos de tratar o sistema usando o formalismo relativista - matematicamente mais pesado - ou se podemos 60 O perı́odo de Transição usar a aproximação não relativista - matematicamente mais simples. Esse critério é que as velocidades tı́picas do sistema em questão, vt , sejam muito menores que a velocidade da luz vt ≪ c . (2.4.1) Neste capı́tulo vimos que quer na radiação do corpo negro, quer no efeito fotoeléctrico, quer no átomo de Bohr, quer nas relações de de Broglie, quer no princı́pio da incerteza, há um factor comum: a constante de Planck. Tal como a velocidade da luz no caso da relatividade, a constante de Planck fornece um critério simples para a necessidade de aplicar ou não o formalismo da mecânica quântica em detrimento do clássico. O critério é o seguinte: Se as acções tı́picas do sistema, St , forem muito maiores que h, St ≫ h , (2.4.2) podemos tratar o sistema na aproximação clássica; caso haja acções da ordem da constante de Planck temos de usar o formalismo da mecânica quântica. Isto não significa que temos de calcular a acção do sistema como definido no capı́tulo 1. Basta-nos calcular variáveis dinâmicas tı́picas do sistema com as dimensões de uma acção. Exemplos: • Oscilador harmónico: uma acção tı́pica é a energia total, dada pelo Hamiltoniano, a dividir pela frequência, ω. Para um oscilador com amplitude A e massa m obtemos 1 St = ωmA2 . 2 (2.4.3) Para uma mola com ω = 10s−1 , m = 1g, A = 0.1m, St = 5 × 10−5J · s ≫ h, logo podemos esquecer efeitos quânticos e tratar o sistema classicamente. Mas se pensarmos nas oscilações de um electrão, m ≃ 10−31 kg numa escala atómica A ≃ 10−10 m que emite no ultravioleta ω ≃ 1017 s−1 , obtemos St ≃ 10−34 J · s ≃ h. Logo o problema tem de ser tratado quanticamente, que é basicamente o caso da radiação do corpo negro. Veremos no capı́tulo 5 o tratamento quântico do oscilador harmónico. • Problema de Larmor: uma acção tı́pica será mais uma vez a energia total dada pelo Hamiltoniano a dividir pela frequência ciclotrónica ωc . Obtemos 1 St = ωc mr 2 , 2 (2.4.4) 2.5 Sumário 61 para uma órbita de raio r. Portanto considerações semelhantes ao caso anterior podem ser feitas. Em particular, um electrão no regime atómico tem de ser tratado quanticamente, dando origem à versão quântica do problema de Larmor, chamado problema de Landau, que veremos no capı́tulo 5. • Problema de Kepler/Coulomb: consideremos as órbitas circulares; mais uma vez, uma acção tı́pica é a energia da órbita sobre a frequência, que na notação do problema 1 da folha de problemas 1 é St = 1√ αmr . 2 (2.4.5) Para o problema de Kepler, α = GmM e considerando o sistema Terra-Sol temos α ≃ 1043 N · m2 , m ≃ 1024 kg, r ≃ 1011 m. Claramente St ≫ h e não necessitamos de mecânica quântica. Para o problema atómico de Coulomb temos α = e2 /(4πǫ0 ) ≃ 10−28 N · m2 , pelo que, usando os valores anteriores para massa do electrão e raio atómico temos St ≃ 10−34 e portanto concluimos que o problema atómico cai no fórum da mecânica quântica; será tratado no capı́tulo 6. • Um fotão: a acção tı́pica de um fotão pode ser estimada como a energia a dividir pela frequência, que, pela fórmula de Planck é h. Logo um fotão é, por definição, uma entidade quântica. Posto de outra maneira, o campo electromagnético para intensidades suficientemente baixas tem de ser tratado quanticamente. 2.5 Sumário Vimos que a luz (e a radiação electromagnética em geral) encarada por Newton como um fluxo de corpúsculos e por Huygens como uma onda, passou a ser vista como uma onda depois das experiências de Young e como uma partı́cula depois das explicações da radiação do corpo negro por Planck, e principalmente, do efeito fotoeléctrico por Einstein. Vimos que a quantificação do átomo feita por Bohr era naturalmente interpretada em termos de estados estacionários do electrão se associássemos ao electrão propriedades ondulatóridas, mais tarde descobertas experimentalmente nas experiências de Davisson e Germer e ainda 62 O perı́odo de Transição Thomson. Assim, tanto a matéria como a radiação têm propriedades ondulatórias e corpusculares. As propriedades ondulatórias estão associadas às funções de onda que descrevem a amplitude de probabilidade para encontrar a partı́cula no espaço. Tentando ‘ver’ a trajectória da partı́cula causamos o colapso da função de onda e o desaparecimento posterior de propriedades ondulatórias. Esta complementaridade mutuamente exclusiva entre propriedades corpusculares e ondulatórias está expressa no princı́pio da incerteza de Heisenberg. A descrição probabilı́stica está no âmago da mecânica quântica. Assim, embora estejamos a descrever partı́culas devemos abdicar do conceito de trajectória em prol de algo mais lato: o estado em que a partı́cula se encontra. Esta situação representa um contraste marcado em relação ao paradigma clássico da fı́sica. Portanto, em mecânica quântica TRAJECTORIA ESTADO CAPÍTULO 3 A equação de Schrödinger Se as partı́culas como o electrão têm uma função de onda associada, Ψ(x), temos que escrever uma equação que descreve o comportamento e evolução de tal função de onda. Obviamente, uma tal equação não pode ser deduzida com base nas equações da mecânica clássica discutidas no capı́tulo 1. Mas do capı́tulo 2 sabemos algumas propriedades que esta equação deve ter: • Deve ser consistente com as relações de Einstein e de Broglie (2.2.19) E = ~ω , p~ = ~~k ; (3.0.1) • Deve ser consistente com a expressão (não relativista) para a energia total, E, de uma partı́cula de massa m, momento p~, num potencial V (~x, t), E= p~2 + V (~x, t) ; 2m (3.0.2) • Para admitir fenómenos de interferência deve ser linear, isto é admitir que a sobreposição de duas soluções seja ainda uma solução, pois é essa sobreposição que dá origem a fenómenos de interferência, como na secção 2.1.1 para ondas na água; • Quando o potencial for zero, tanto a energia como o momento da partı́cula devem ser constantes - a partı́cula é livre. Traduzindo nas quantidades ondulatórias tanto 64 A equação de Schrödinger a frequência como o vector de onda devem ser constantes. Mas isto é o que se passa para uma onda plana monocromática. Assim, assumimos que uma onda plana monocromática, que é representada por ~ Ψ(~x, t) = ei(k·~x−ωt) , (3.0.3) é solução da equação de onda procurada. Usando (3.0.1) em (3.0.2) obtemos, na ausência de potencial, ~ω = ~2 ~ 2 k . 2m (3.0.4) Esta relação de dispersão é a obtida se actuarmos em (3.0.3) com uma derivada temporal e duas espaciais, isto é i~ ~2 ∂Ψ(~x, t) =− ∆Ψ(~x, t) , ∂t 2m (3.0.5) onde ∆ representa o Laplaciano. Esta é chamada a equação de Schrödinger para uma partı́cula livre. Adicionando o termo do potencial, que tem de ser multiplicado pela função de onda devido à linearidade da equação ∂Ψ(~x, t) ~2 i~ = − ∆ + V (~x, t) Ψ(~x, t) , ∂t 2m (3.0.6) obtemos a equação de Schrödinger, sugerida em 1925 pelo fı́sico austrı́aco Erwin Schrödinger. Esta discussão não pretende ser uma derivação da equação de Schrödinger. Apenas uma motivação. A equação de Schrödinger não é derivada, mas sim postulada. A sua validação provém da concordância com os resultados experimentais. 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas Qual a função de onda adequada para descrever uma partı́cula que não esteja actuada por nenhum potencial, i.e. uma partı́cula livre? A solução mais simples da equação de Schrödinger é a onda plana monocromática (3.0.3), por construção. Contudo, segundo o 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas 65 postulado de Born para a interpretação da função de onda, a função de distribuição de probabilidade associada a Ψ(~x, t) é P(~x, t) = Ψ(~x, t)Ψ(~x, t)∗ , kΨ(t)k2 onde a norma kΨ(t)k, que é - à priori - função do tempo1 , é calculada como Z 2 kΨ(t)k = d3~xΨ(~x, t)Ψ(~x, t)∗ . Então se tomarmos para a função de onda (3.0.3) Z ~ ~ 2 kΨ(t)k = d3~xei(k·~x−ωt) e−i(k·~x−ωt) = ∞ , (3.1.1) (3.1.2) (3.1.3) ou seja, a norma diverge. Diz-se que a função de onda não é normalizável. Este resultado não é inesperado. Uma onda plana monocromática tem um vector de onda bem definido e como tal um comprimento de onda bem definido. Logo, o desvio padrão para a distribuição de vectores de onda é zero e pela relação de de Broglie ∆pi = 0, para todos os i. Pelo princı́pio da incerteza, ∆xi = ∞. Isto significa que a partı́cula tem igual probabilidade de estar em todos os pontos. Mas uma tal distribuição de probabilidade constante sobre toda a recta real é necessariamente não normalizável. Assim, esperamos que uma função de onda fisicamente razoável dê origem a uma densidade de probabilidade que não seja totalmente delocalizada. Existe uma segunda razão pela qual uma onda plana monocromática não é uma ‘boa’ função de onda para uma partı́cula. Consideremos as expressões relativistas de energia e momento de uma partı́cula E=p mc2 , 1 − v 2 /c2 p~ = p m~v , 1 − v 2 /c2 (3.1.4) onde m é a massa em repouso da partı́cula e v a sua velocidade relativamente a um dado referencial inercial. Deduzimos que p~ = 1 E ~v . c2 (3.1.5) Veremos que na evolução de um sistema fı́sico a norma é conserada, pelo que se a função de onda estiver normalizada assim permanecerá. Esta propriedade decorre da unitariedade do operador de evolução. 66 A equação de Schrödinger Uma onda monocromática é definida pela frequência angular ω e pelo vector de onda, com norma |~k|. A velocidade a que se propaga uma dada fase, isto é um máximo ou um mı́nimo da onda - dita velocidade de fase - é dada por ~k · ~x − ωt = constante; portanto a velocidade de fase tem norma E (3.1.5) c2 , (3.1.6) = |~p| |~v | que não só é diferente da velocidade da partı́cula como é maior - para uma partı́cula com vf ase = ω |~k| (3.0.1) = massa, para a qual |~v| < c - do que a velocidade da luz no vazio! Como tal concluimos que uma onda monocromática não é uma descrição aceitável da função de onda de uma partı́cula. Ambas as dificuldades anteriores são ultrapassadas se usarmos uma sobreposição de ondas monocromáticas de várias frequências para descrever a nossa partı́cula, isto é, um pacote ou trem de ondas. As razões são as seguintes: 1) Ao adicionarmos ondas de várias frequências, estas interferem destrutivamente e construtivamente de um modo que pode localizar mais a função de onda, tornando-a normalizável; 2) A velocidade do pacote de ondas não é a média das velocidades de fase de cada uma das ondas que formam o pacote; é antes a velocidade de propagação do máximo da amplitude, dita velocidade de grupo. A propagação deste máximo resulta de fenómenos de interferência, podendo a sua velocidade ser identificada com a da partı́cula clássica associada à onda. Devido à linearidade da equação de Schrödinger uma tal sobreposição é necessariamente ainda uma solução desta equação. Começamos com o caso simples de uma sobreposição discreta, para depois irmos para o caso de uma sobreposição contı́nua, que é o caso de interesse fı́sico. 3.1.1 Sobreposição discreta de ondas Consideramos, no instante t = 0, uma sobreposição discreta de ondas, isto é, algo do tipo Ψ(~x, 0) = n X ~ Aj ei(kj ·~x) , (3.1.7) j=1 correspondendo a uma sobreposição de n ondas planas, com amplitudes Aj e vectores de onda ~kj . Por simplicidade vamos trabalhar em uma dimensão e especializemos a nossa 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas 67 Figura 3.1: Três ondas monocromáticas e a sua sobreposição. Na figura de baixo, a linha a tracejado corresponde ao módulo da função de onda (Extraı́do de Cohen et al, ‘Quantum Mechanics’). análise para o seguinte caso: ∆k ∆k n = 3 , kj = k0 − , , k0 , k0 + 2 2 g(k0 ) Aj = √ 2π 1 1 , 1, 2 2 . (3.1.8) Com esta escolha (3.1.7) fica x∆k g(k0) ik0 x . 1 + cos Ψ(x, 0) = √ e 2 2π (3.1.9) Na figura 3.1 representamos as várias ondas monocromáticas e a sua sobreposição. Este exemplo mostra o efeito, ora destrutivo ora construtivo, da interferência das várias ondas. Notando que p g(k0 ) |Ψ(x, 0)| = Ψ(x, 0)Ψ(x, 0)∗ = √ 2π x∆k 1 + cos 2 , (3.1.10) este exemplo mostra também como o módulo da função de onda (e como tal a densidade de probabilidade) que é representado pela linha tracejada na figura 3.1 - que corresponde à função (1 + cos(x∆k/2) - ficou mais localizada do que no caso de uma só onda. Esta é que é a imagem a reter do pacote de ondas. 68 A equação de Schrödinger Note-se que neste caso ainda não resolvemos o problema da não normalização da função de onda. De facto, qualquer sobreposição discreta de ondas monocromáticas dá origem a uma função periódica. No caso que temos em mão, isso significa que na figura 3.1 há infinitas repetições quer para a esquerda quer para a direita da figura de baixo. Para termos uma função de onda normalizável temos necessariamente de ter uma sobreposição contı́nua de ondas monocromáticas (se as ondas estiverem definidas sobre todo o R). Com este exemplo podemos ilustrar o princı́pio de incerteza. Suponhamos que 2 x∆k , P(x) ∝ 1 + cos 2 para x∈ 2 [−π, π] , ∆k (3.1.11) e P(x) = 0 fora deste intervalo. Consideramos apenas uma dimensão. Uma medida para o ‘espalhamento’ dos valores de x, ∆x, é o tamanho do intervalo onde se distribui a densidade de probabilidade; logo ∆x∆k ≃ 4π , (3.1.12) de onde conluimos que aumentando ∆k se diminui ∆x, conforme esperado pelo princı́pio da incerteza. Com este exemplo podemos ver como a sobreposição modifica a velocidade de propagação. Tomamos agora para t > 0 Ψ(~x, t) = n X ~ Aj ei(kj ·~x−tωj ) , (3.1.13) j=1 e especializamos para (3.1.8) juntamente com ∆ω ∆ω ωj = ω0 − . , ω0 , ω0 + 2 2 (3.1.14) g(k0 ) i(k0 x−tω0 ) x∆k ∆w Ψ(x, t) = √ e − t , 1 + cos 2 2 2π (3.1.15) x∆k ∆w g(k0 ) − t . 1 + cos |Ψ(x, t)| = √ 2 2 2π (3.1.16) Neste caso obtemos, e 3.1 Descrição Quântica de uma partı́cula livre - Trem de Ondas 69 A velocidade de grupo é por definição a velocidade com que o máximo do módulo da função de onda está a avançar, que é vgrupo = ∆ω , ∆k (3.1.17) que não coincide com nenhuma das velocidades de fase vf ase = 2ω0 − ∆ω ω0 2ω0 + ∆ω , , 2k0 − ∆k k0 2k0 + ∆k , (3.1.18) nem com a sua média. Veremos a seguir que esta velocidade de grupo coincide com a velocidade ‘clássica’ da partı́cula. 3.1.2 Sobreposição contı́nua de ondas Consideramos agora uma função de onda dada pela sobreposição contı́nua de ondas na forma 1 Ψ(x, 0) = √ 2π Z +∞ g(k)ei(kx+φ(k)) dk , (3.1.19) 0 onde g(k) é a amplitude (real) do modo de Fourier com comprimento de onda λ = 2π/k e φ(k) é uma fase que depende do modo de Fourier. Tomamos a amplitude como sendo não nula apenas em ∆k ∆k , k0 + k0 − 2 2 , (3.1.20) intervalo no qual a fase φ(k) varia suavemente. Sendo o intervalo suficientemente pequeno, aproximamos φ(k) = φ(k0 ) + dφ dk k0 (k − k0 ) ≡ φ0 − φ′0 (k − k0 ) . (3.1.21) Deste modo, para este caso particular, expressamos (3.1.19) como 1 Ψ(x, 0) = √ ei(φ0 +k0 x) 2π Z k0 +∆k/2 k0 −∆k/2 ′ g(k)ei(k−k0 )(x−φ0 ) dk ≡ A(x, 0)ei(φ0 +k0 x) . (3.1.22) Assim, expressamos a nossa sobreposição contı́nua de ondas como uma onda plana com amplitude variável. Esta forma da função é útil para estudar a variação de |Ψ(x, 0)| com x: 70 A equação de Schrödinger • Para (x − φ′0 ) >> 1/(k − k0 ), a função ′ ei(k−k0 )(x−φ0 ) , (3.1.23) oscila muito rapidamente quando variamos k no intervalo permitido. Assim, o integral em (3.1.22) é aproximadamente a média da função (3.1.23), que é zero; • Para x ≃ φ′0 , a função (3.1.23) praticamente não oscila, dando o integral uma forte contribuição e sendo a amplitude A(x, 0) dominante neste ponto. Concluimos assim duas coisas: i) O centro do pacote de ondas, isto é, o máximo da amplitude é em dφ ′ ; xcentro = φ0 ≡ − dk k0 ii) A norma da função de onda Z +∞ Z 2 ∗ kΨ(0)k = Ψ(x, 0)Ψ(x, 0) dx = −∞ (3.1.24) +∞ A(x, 0)A(x, 0)∗ dx , (3.1.25) −∞ é agora finita, pois a amplitude é nula para (x−φ′0 ) >> 1/(k −k0 ) e nunca é infinita.2 Agora mostramos que a velocidade de grupo deste pacote de ondas coincide com a velocidade clássica da partı́cula que lhe podemos associar. Para isso consideramos a nossa função de onda (3.1.19) para t > 0 1 Ψ(x, t) = √ 2π Z +∞ g(k)ei(kx+φ(k)−w(k)t) dk , (3.1.26) 0 onde a frequência ω(k) é uma função suave do modo de Fourier, para a qual utilizamos uma aproximação semelhante àquela usada para a fase dω (k − k0 ) ≡ ω0 + ω0′ (k − k0 ) . ω(k) = ω(k0 ) + dk k0 (3.1.27) Nota técnica: para o integral (3.1.25) convergir é necessário que A(x, 0)A(x, 0)∗ decaia mais rapidamente que 1/x. Analisando (3.1.22), podemos concluir que A(x, 0) decai como 1/x, pelo que A(x, 0)A(x, 0)∗ decai de facto mais rapidamente do que 1/x. 2 3.2 Partı́cula em potenciais independentes do tempo 71 Usando esta expressão e (3.1.21), escrevemos (3.1.26) como 1 Ψ(x, t) = √ ei(φ0 +k0 x−ω0 t) 2π Z k0 +∆k/2 k0 −∆k/2 ′ ′ g(k)ei(k−k0 )(x−φ0 −ω0 t) dk ≡ A(x, t)ei(φ0 +k0 x−ω0 t) . (3.1.28) Pela mesma argumentação usada anteriormente concluimos que o centro do pacote de ondas se encontra agora em xcentro = φ′0 + ω0′ t , (3.1.29) pelo que se desloca com velocidade vgrupo = ω0′ ≡ dω dk . (3.1.30) k0 Pelas relações de Einstein-de Broglie, (3.0.1), isto implica que3 vgrupo = dE dp = p0 p0 = v0 . m (3.1.31) A filosofia é agora a seguinte. Ao expressarmos a sobreposição contı́nua de ondas na forma (3.1.28) pensamos nela como uma onda plana monocromática com amplitude variável, à qual podemos associar uma velocidade de duas maneiras distintas: i) A sua frequência, ω0 , e vector de onda, k0 , definem pelas relações de de Broglie uma energia e um momento, que por sua vez definem a velocidade da partı́cula: v0 = dE/dp, para p = p0 = ~k0 ; ii) A velocidade de propagação do máximo da amplitude, que é dado pela velocidade de grupo (3.1.31), que coincide com a anterior. 3.2 Partı́cula em potenciais independentes do tempo Se o potencial onde a partı́cula se encontra é independente do tempo, a equação de Schrödinger (3.0.6) escreve-se ∂Ψ(~x, t) ~2 i~ = − ∆ + V (~x) Ψ(~x, t) . ∂t 2m 3 (3.2.1) Na penúltima e última igualdades da equação (3.1.31) usamos a expressão não relativista da energia; se usassemos as expressões relativistas (3.1.4) o resultado final seria o mesmo. 72 A equação de Schrödinger Podemos tentar encontrar soluções desta equação separando variáveis, isto é tomando como ansätz Ψ(~x, t) = Φ(~x)χ(t) . (3.2.2) Colocando no lado esquerdo a dependência temporal e do lado direito a dependência espacial, a equação de Schrödinger reescreve-se ~2 1 i~ ∂χ(t) − = ∆ + V (~x) Φ(~x) . χ(t) ∂t Φ(~x) 2m (3.2.3) O lado direito só depende de ~x e o esquerdo só depende de t. Logo, para ter soluções desta equação cada lado tem de ser igual a uma constante. Dado que os vários termos têm dimensão de ‘energia’, interpretamos a constante, denotada E, como energia e obtemos: 1) Do lado esquerdo i~ dχ(t) = Eχ(t) dt ⇒ χ(t) = e−iEt/~ = e−iωt , (3.2.4) onde usamos (3.0.1). Assim a dependência temporal está bem definida; 2) Do lado direito, ~2 ∆ + V (~x) Φ(~x) = EΦ(~x) . − 2m (3.2.5) A esta equação chamamos equação de Schrödinger independente do tempo. Entende-se que as suas soluções representam a parte espacial da função de onda; a função de onda total é Ψ(~x, t) = Φ(~x)e−iωt . (3.2.6) Soluções deste tipo da equação de Schrödinger, são baptizadas de estados estacionários. Representam estados com energia bem definida, E = ~ω. Podemos reescrever a equação de Schrödinger independente do tempo como ĤΦ(~x) = EΦ(~x) , (3.2.7) onde definimos o operador diferencial linear Ĥ, chamado operador Hamiltoniano, Ĥ ≡ − ~2 ∆ + V (~x) . 2m (3.2.8) 3.2 Partı́cula em potenciais independentes do tempo 73 Deste ponto de vista, resolver a equação de Schrödinger independente do tempo é resolver um problema de valores próprios e funções próprias, isto é, as energias são valores próprios e as funções Φ(~x) são funções próprias do operador Hamiltoniano. Podemos descrever também a equação (3.2.4) nesta linguagem: a dependência temporal da função de onda para estados estacionários, e−iEt/~, é uma função própria do operador diferencial linear T̂ , denominado operador de translações temporais T̂ ≡ i~ ∂ , ∂t (3.2.9) com valor próprio E. Assim, a função de onda (3.2.6) é um produto de funções próprias dos operadores Ĥ e T̂ .4 Note-se que devido à linearidade da equação de Schrödinger, manifesta no facto dos operadores Ĥ e T̂ serem lineares, qualquer combinação linear de estados próprios é ainda uma solução da equação de Schrödinger. No capı́tulo 4 iremos sistematizar o formalismo de operadores, funções próprias e vectores próprios em mecânica quântica. Vamos agora estudar os estados estacionários para alguns potenciais concretos, em uma dimensão. O nosso objectivo é contrastar o comportamento de uma partı́cula quântica, descrita pela equação de Schrödinger, com o de uma partı́cula clássica, sendo a diferença fundamental a seguinte: a partı́cula quântica propaga-se como uma onda. Os potenciais escolhidos são matematicamente simples de tratar pois são constantes por pedaços: potenciais em escada. Isto implica certas descontinuidades. Mas note-se que estas descontinuidades não são fı́sicas; devemos pensar nos exemplos a seguir como aproximações de potenciais contı́nuos que variam rapidamente. 3.2.1 Caracterı́sticas gerais num potencial em escada Por potencial em escada entende-se um potencial que é constante por pedaços. As figuras 3.3, 3.7 e 3.11 são exemplos de potenciais em escada. Em cada uma das regiões, a equação 4 Note que, em geral, a equação de Schrödinger se pode escrever T̂ Ψ(t, ~x) = Ĥ(t)Ψ(t, ~x). Para os estados estacionários os valores próprios destes dois operadores coincidem. 74 A equação de Schrödinger de Schrödinger independente do tempo (3.2.5) fica uma equação do tipo d2 Φ(x) 2m + 2 (E − V )Φ(x) = 0 , dx2 ~ (3.2.10) para um V constante. Analisemos os vários tipos de soluções: i) Se E > V esta é uma equação do tipo da do oscilador harmónico (1.1.5), cuja solução escrevemos agora como Φ(x) = Aeikx + A′ e−ikx , (que é equivalente a escrever Φ(x) = à cos(kx + φ0 )) onde definimos p 2m(E − V ) , k= ~ (3.2.11) (3.2.12) e as constantes A, A′ são números complexos, pois a função de onda é complexa. Estas soluções correspondem a uma função de onda ‘ondulatória’. ii) Se E < V esta é uma equação do tipo da do oscilador harmónico mas com ‘frequências imaginárias’. Isto significa que em vez de exponenciais imaginárias temos como soluções exponenciais reais Φ(x) = Bek̃x + B ′ e−k̃x , onde B, B ′ são constantes complexas e p 2m(V − E) k̃ = . ~ (3.2.13) (3.2.14) Estas soluções correspondem a funções de onda que crescem ou decrescem exponencialmente. iii) Se E = V a solução é Φ(x) = C + C ′ x , (3.2.15) que é uma função de onda linear, onde C, C ′ são constantes complexas. Este caso é muito particular e não será usado na nossa análise. 3.2 Partı́cula em potenciais independentes do tempo 75 V(x) V0 0 x Figura 3.2: Potencial real aproximado por um potencial em escada. O que irá acontecer à função de onda nos pontos de descontinuidade do potencial? Para esclarecer este ponto recordamos que os verdadeiros potenciais fı́sicos não serão descontı́nuos; variarão rapidamente mas serão contı́nuos. Assim, por exemplo, o potencial da figura 3.3 é uma aproximação ao potencial da figura 3.2. O primeiro é mais fácil de tratar matematicamente, mas o segundo será o potencial realista. Deste modo podemos pensar num potencial em escada, V (x), que é descontı́nuo no ponto x0 , como limite de potenciais contı́nuos no intervalo [x0 − ǫ, x0 + ǫ], Vǫ (x), que coincidem com V (x) fora deste intervalo. Para cada Vǫ (x), existe uma função de onda Φǫ (x), que obedece a d2 Φǫ (x) 2m + 2 (E − Vǫ )Φǫ (x) = 0 . dx2 ~ Integrando esta equação diferencial entre x0 − η e x0 + η, obtemos Z dΦǫ dΦǫ 2m x0 +η (x0 + η) − (x0 − η) = 2 [Vǫ (x) − E]Φǫ (x)dx . dx dx ~ x0 −η (3.2.16) (3.2.17) Para as funções Φǫ (x) e o seu limite quando ǫ → 0 serem boas funções de onda, não podem divergir em nenhum ponto; caso contrário, a densidade de probabilidade associada a esse ponto seria infinita. Então tomamos estas funções de onda como finitas. Logo o integrando em (3.2.17) é finito, inclusive no limite ǫ → 0. Tirando seguidamente o limite η → 0, concluimos que dΦ(x)/dx é contı́nua em x0 . Isto implica que Φ(x) também é contı́nua em x0 de facto, derivável. Assim, iremos impôr que a função de onda e a sua derivada são contı́nuas nas descontinuidades do potencial. 76 A equação de Schrödinger Note-se que a análise do último parágrafo assumiu implicitamente que o potencial é finito, caso contrário o integrando em (3.2.17) seria infinito. No caso de o potencial ser infinito, a derivada da função de onda não será contı́nua, mas podemos ainda requerer continuidade da função de onda. O potencial ser infinito numa dada região (finita) significa que a função de onda será zero nessa região. Como veremos, uma partı́cula quântica pode penetrar numa região com um potencial, V , maior do que a sua energia, E - região classicamente proibida pois, como E = Ecinética + V , significaria que Ecinética < 0. Contudo, o seu poder de penetração, que é dado por uma onda evanescente, diminui quando V − E aumenta. Quando V → ∞, essa possibilidade de penetração desaparece. Assim, para uma descontinuidade infinita do potencial imporemos apenas a continuidade da função de onda, o que será suficiente para resolver o problema, dado que o valor da função de onda na região onde o potencial é infinito é conhecido: é zero. Vamos desde já definir a intensidade de uma função de onda, I, como a densidade de probabilidade de posição da partı́cula vezes a velocidade de propagação da mesma. Para uma onda plana ~k . (3.2.18) m Note-se que a definição é análoga à da intensidade de uma onda plana, que é a quantidade Ψ(x, t) = Aei(Et/−̄kx) ⇒ I = |A|2 de energia que atravessa uma superfı́cie disposta normalmente à direcção de propagação da onda por unidade de tempo e de área. Equivalentemente, é a densidade de energia vezes a velocidade de propagação. 3.2.2 Salto de potencial (E > V0 ) Consideramos o potencial na figura 3.3. As soluções da equação de Schrödinger independente do tempo para uma partı́cula com energia E, tal que E > V0 são √ 2mE ik1 x ′ −ik1 x Região I Φ(x) = A1 e + A1 e com k1 = p~ . (3.2.19) 2m(E − V ) 0 Região II Φ(x) = A2 eik2 x + A′2 e−ik2 x com k2 = ~ Requerendo continuidade da função de onda e da sua derivada em x = 0 obtemos, respectivamente 3.2 Partı́cula em potenciais independentes do tempo 77 V(x) A’1 A1 E A2 A’2 V 0 I II x 0 Figura 3.3: Salto de potencial. Distinguimos duas regiões: x < 0 é a Região I, onde V = 0; x > 0 é a Região II, onde V = V0 ; aqui consideramos as várias ondas associadas a uma partı́cula com E > V0 . A1 + A′1 = A2 + A′2 . (3.2.20) k1 (A1 − A′ ) = k2 (A2 − A′ ) 1 2 Temos quatro constantes de integração e duas condições entre elas, o que, portanto, não especifica suficientemente a solução. Podemos pois por uma constante igual a zero: A′2 = 0. Fisicamente esta escolha tem o seguinte significado. Recordando que a função de onda total é dada por Ψ(x, t) = Φ(x)e−iEt/~ , (3.2.21) podemos ver qual a direcção em que viajam as várias ondas da solução, o que se encontra representado na figura 3.3. Se pensarmos fisicamente no nosso problema como descrevendo uma partı́cula que vem de x = −∞ (associada à onda A1 ), que tem uma probabilidade de ser transmitida para a região II em x = 0 (associada à onda A2 ) e uma probabilidade de ser reflectida de volta para a região I (associada à onda A′1 ), concluimos que não devemos ter a onda A′2 . Assim, escrevemos a solução das equações (3.2.20) como A′1 k1 − k2 = , A1 k1 + k2 A2 2k1 = . A1 k1 + k2 (3.2.22) 78 A equação de Schrödinger Estas são designadas, respectivamente, amplitudes de reflexão e transmissão. As intensidades das ondas incidentes, reflectida e transmitida são, respectivamente Ii = |A1 |2 ~k1 , m Ir = |A′1 |2 ~k1 , m It = |A2 |2 ~k2 . m (3.2.23) Definimos o factor de transmissão T , e o factor de reflexão R, respectivamente como 2 2 2 4k1 k2 k1 − k2 k2 A2 It Ir A′1 = = = T ≡ = , R≡ . (3.2.24) Ii k1 A1 (k1 + k2 )2 Ii A1 k1 + k2 Note-se que T +R =1 . (3.2.25) Assim, as quantidades T e R são apropriadas para ser interpretadas como a probabilidade de transmissão e reflexão da partı́cula. Vemos desde já uma diferença fundamental entre a descrição quântica e clássica desta partı́cula: Classicamente a partı́cula seria sempre transmitida para a região II; quanticamente existe uma probabilidade de a partı́cula ser reflectida de volta para a região I. Este facto é facilmente entendido se pensarmos numa analogia com óptica. Uma onda que chega à fronteira entre dois meios com ı́ndices de refracção diferentes, proporcionais a k1 e k2 , tem uma componente transmitida e reflectida. Para incidência normal, as fórmulas de Fresnel que descrevem a razão entre os vários campos eléctricos envolvidos coincidem com (3.2.22). Assim, em óptica este resultado é claro. A mecânica quântica entra quando pensamos na onda como a função de onda que descreve uma partı́cula. 3.2.3 Salto de potencial (E < V0 ) Consideramos o mesmo potencial que no caso anterior, mas tomamos agora uma partı́cula com E < V0 , como representado na figura 3.4. As soluções da equação de Schrödinger independente do tempo são: Região I Φ(x) = Aeik1 x + A′ e−ik1 x Região II Φ(x) = Bek2 x + B ′ e−k2 x √ 2mE p~ . 2m(V0 − E) com k2 = ~ com k1 = (3.2.26) 3.2 Partı́cula em potenciais independentes do tempo 79 V(x) I II V 0 A’ A E B B’ x 0 Figura 3.4: Salto de potencial. Aqui consideramos as várias ondas associadas a uma partı́cula com E < V0 . Na região II essas ondas são exponenciais; na figura damos a ideia de qual a crescente e qual a decrescente. Requerendo continuidade da função de onda e da sua derivada em x = 0 obtemos, respectivamente A + A′ = B + B ′ . (3.2.27) ik1 (A − A′ ) = k2 (B − B ′ ) Neste caso, para que a função de onda seja limitada quando x → +∞ tomamos B = 0. Logo A′ k1 − ik2 = , A k1 + ik2 B′ 2k1 = . A k1 + ik2 (3.2.28) A função de onda na região II já não é uma onda plana, e não lhe podemos associar uma velocidade e como tal uma intensidade de probabilidade. Por isso não podemos calcular um coeficiente de transmissão. Isto é consistente com o facto de o coeficiente de reflexão ser R= k1 − ik2 k1 + ik2 2 =1. (3.2.29) Concluimos que 1) tal como em mecânica clássica, a partı́cula quântica é sempre reflectida; 2) mas a função de onda não é zero na região II, decaindo exponencialmente - diz-se que existe uma onda evanescente na região II (figura 3.5), havendo portanto uma probabilidade não nula de encontrar a partı́cula nessa região. A razão da consistência entre estes dois 80 A equação de Schrödinger Ψ(x,t )Ψ(x,t )* II I V 0 x 0 Figura 3.5: Salto de potencial. Representação do módulo da função de onda ao quadrado para um t fixo, para uma partı́cula com E < V0 . Note-se a onda evanescente na região II. factos é a seguinte. Note-se que A′ /A tem uma parte imaginária Im A′ A =− 2k1 k2 . k12 + k22 (3.2.30) Logo, há um diferença de fase entre a onda incidente e a reflectida, que pode ser vista como um atraso na reflexão. Podemos pensar que, embora a partı́cula quântica - tal como a clássica - seja sempre reflectida, a partı́cula quântica - ao contrário da clássica pode penetrar na região II antes de ser reflectida, causando o atraso referido. Note-se que no limite V0 → ∞ temos k2 → ∞; logo a parte imaginária (3.2.30) vai para zero. Neste limite perdemos a onda evanescente e consequentemente o ‘atraso’ na onda reflectida. Note-se ainda que ao analizar este limite confirmamos que a função de onda é zero quando o potencial é infinitamente maior do que a energia da partı́cula, o que prova a afirmação feita no final da secção 3.2.1. Usando A′ ≡ eϕi A, podemos escrever a parte espacial da função de onda neste problema como Φ(x) = A(eik1 x + e−ik1 x+iϕ ) , (3.2.31) de onde concluimos que ΨΨ∗ = 2A2 (1 + cos(2k1 x − ϕ)); este módulo está representado na figura (3.5). 3.2 Partı́cula em potenciais independentes do tempo 81 V(x) A1 A’1 A2 A’2 E A3 A’3 V 0 II I III 0 x L Figura 3.6: Barreira de potencial. Distinguimos três regiões: x < 0 é a Região I, onde V = 0; 0 < x < L é a Região II, onde V = V0 ; x > L é a região III, onde V = 0. Aqui representamos as várias ondas associadas com uma partı́cula com E > V0 . 3.2.4 Barreira de potencial (E > V0) Consideramos agora uma barreira de potencial, como a representada na figura 3.6 e uma partı́cula com E > V0 . As soluções da equação de Schrödinger independente do tempo são agora Região I ik1 x Φ(x) = A1 e Região II Região III + A′1 e−ik1 x Φ(x) = A2 eik2 x + A′2 e−ik2 x Φ(x) = A3 eik1 x + A′3 e−ik1 x √ 2mE p~ 2m(E − V0 ) com k2 = ~ com k1 = . (3.2.32) Requerendo continuidade da função de onda e da sua derivada em x = 0 e x = L, obtemos, respectivamente A1 + A′1 = A2 + A′2 k1 (A1 − A′ ) = k2 (A2 − A′ ) 1 2 , A2 eik2 L + A′2 e−ik2 L = A3 eik1 L + A′3 e−ik1 L . k2 (A2 eik2 L − A′ e−ik2 L ) = k1 (A3 eik1 L − A′ e−ik1 L ) 2 3 (3.2.33) Considerando uma partı́cula que vem de x = −∞, tomamos A′3 = 0. Começando pelo segundo sistema de equações obtemos A′2 = k2 − k1 i(k1 +k2 )L e A3 , 2k2 A2 = k2 + k1 i(k1 −k2 )L e A3 . 2k2 (3.2.34) 82 A equação de Schrödinger Usando estes resultados no primeiro sistema de equações obtemos k12 + k22 sin(k2 L) eik1 L A3 , A1 = cos(k2 L) − i 2k1 k2 A′1 = i k22 − k12 sin(k2 L)A3 . 2k1k2 (3.2.35) Os factores de reflexão em x = 0 e de transmissão para a região 3 são, respectivamente A′ Ir = 1 Ii A1 2 R= A3 It = Ii A1 2 T = = (k12 − k22 )2 sin2 (k2 L) , 4k12 k22 + (k12 − k22 )2 sin2 (k2 L) (3.2.36) = 4k12 k22 . 4k12 k22 + (k12 − k22 )2 sin2 (k2 L) (3.2.37) Verifica-se facilmente que T +R = 1, como seria de esperar. Concluimos que em geral existe uma probabilidade de a partı́cula ser reflectida, tal como no caso do salto de potencial. Isto contrasta com a situação em mecânica clássica em que a partı́cula é sempre transmitida. Contudo, para k2 L = nπ ⇔ L λ = , n 2 n∈N, (3.2.38) a probabilidade de transmissão é um. Isto acontece quando um múltiplo inteiro de metade do comprimento de onda é igual ao comprimento da barreira, L. Podemos dar a este comportamento a seguinte interpretação fı́sica. Consideremos as ondas que se propagam na direcção positiva do eixo dos x, isto é A1 , A2 , A3 . Para A3 ter o mesmo módulo do que A1 , ou seja, para o coeficiente de transmissão ser um, as ondas não podem sofrer perdas na região II. Ou seja A2 tem de ter ainda o mesmo módulo. Mas A2 pode ser reflectida em x = L e a onda resultante novamente em x = 0. Para que esta dupla reflexão de A2 esteja em fase consigo mesma necessitamos da relação (3.2.38). Note-se que neste caso tanto A′2 /A2 como A′1 /A1 não têm parte imaginária e não há atrasos na reflexão. Deste modo não há perdas na região II e o coeficiente de transmissão é um. Este fenómeno é designado por ressonância, pois resulta de uma ressonância das ondas na região II. Este fenómeno é usado para explicar o efeito Ramsauer que consiste na capacidade de certos gases nobres serem transparentes a electrões com certas energias bem definidas (da ordem do eV ). 3.2 Partı́cula em potenciais independentes do tempo 83 V(x) V 0 I A1 II A’1 B E III A3 B’ 0 A’3 x L Figura 3.7: Barreira de potencial. Aqui representamos as várias ondas associadas com uma partı́cula com E < V0 . 3.2.5 Barreira de potencial (E < V0) Consideremos novamente uma barreira de potencial, mas agora uma partı́cula com E < V0 , como representada na figura 3.7. O cálculo da secção anterior aplica-se com a modificação p 2m(V0 − E) . (3.2.39) k2 → −ik , com k = ~ Concluimos pois que R= (k12 + k 2 )2 sinh2 (kL) , 4k12 k 2 + (k12 + k 2 )2 sinh2 (kL) (3.2.40) T = 4k12 k 2 . 4k12 k 2 + (k12 + k 2 )2 sinh2 (kL) (3.2.41) Obviamente T + R = 1. A propriedade importante é que o coeficiente de transmissão não é nulo. Existe uma probabilidade de a partı́cula quântica ‘furar’ a barreira de potencial, enquanto que uma partı́cula clássica voltaria necessariamente para trás. Este fenómeno designa-se por efeito túnel. Note-se que podemos reexprimir o coeficiente de transmissão como T = 1+ V02 sinh2 (kL) 4E(V0 − E) −1 . (3.2.42) Note-se ainda que no caso frequente de a barreira ser muito maior do que o comprimento de onda de de Broglie da partı́cula, kL >> 1, a última expressão é aproximada como T ≃ 16E(V0 − E) −2kL e . V02 (3.2.43) 84 A equação de Schrödinger Ψ(x,t)Ψ(x,t)* II I III V0 0 L x Figura 3.8: Barreira de potencial. Representação do quadrado do módulo da função de onda, para uma partı́cula com E < V0 . A existência da onda evanescente na zona classicamente proibida resulta na probabilidade de encontrar a partı́cula na região III. O efeito túnel é observado numa variedade de fenómenos quânticos. Historicamente a sua primeira aplicação foi ao decaimento radioactivo por emissão de partı́culas α, que agora descrevemos. Radioactividade alfa Como mencionado na secção 2.2, Rutherford estudou o potencial V (r) que uma partı́cula α sente a uma distância r do núcleo atómico. Os seus estudos e estudos posteriores com núcleos mais leves concluiram que o potencial referido tem a forma exibida na figura 3.9. Isto é para distâncias maiores que r ′′ ≡ 3 × 10−14 m, as partı́culas α sentem um potencial do tipo de Coulomb entre uma partı́cula com carga +2e e um núcleo com carga +Ze V (r) = 1 2e2 Z . 4πǫ0 r (3.2.44) Para distâncias menores que r ′ , onde r ′ < r ′′ sabia-se que havia um desvio do potencial de Coulomb, devido a experiências de difusão com núcleos leves, mas não se sabia o valor exacto de r ′ para núcleos pesados. Por outro lado sabia-se que vários núcleos pesados, como o U 234 (urânio) e o Ra226 (rádio) emitiam espontaneamente partı́culas α. Isto sugere que pensemos no potencial para r < r ′ como um poço de potencial onde existe uma força (de facto a força nu- 3.2 Partı́cula em potenciais independentes do tempo 85 Figura 3.9: Potencial sentido por uma partı́cula α à distância r de um núcleo de U 238 (Extraı́do de Eisberg & Resnick, ‘Quantum Physics’). clear forte) que vence a repulsão de Coulomb e ‘cola’ uma partı́cula α a um determinado núcleo, correspondendo o conjunto, por exemplo, ao núcleo de Urânio 234. Mas existe uma probabilidade de a partı́cula α sair por efeito túnel: radiactividade α. Estimemos essa probabilidade usando o resultado para a barreira quadrada (3.2.43) que reescrevemos como √ T ∼ e−2L 2m(V0 −E)/~ . (3.2.45) A barreira de potencial na figura 3.9 não é quadrada; mas podemos pensar na curva como uma soma de barreiras quadradas no limite em que a base destas barreiras quadradas vai para zero. Nesse limite obtemos5 √ Z ′′′ Z ′′′ s 8m r 1 2e2 Z 2 r p −E , dr ln T ∼ − 2m[V (r) − E]dr = − ~ r′ ~ 4πǫ0 r r′ para uma partı́cula com energia dada por E = V (r ′′′ ). Usando o facto que s r r ! Z br a a br br dr 1− , − b = √ arcsin + r a a a b (3.2.46) (3.2.47) juntamente com E = V (r ′′′ ) , 5 E << V (r ′ ) , A relação usada é de facto a aproximação WKB; ver relação (8.5.10). (3.2.48) 86 A equação de Schrödinger obtemos 2 ln T ∼ − eZ ǫ0 ~ r m +4 2E s e2 Zmr ′ . πǫ0 ~2 (3.2.49) Vamos estimar uma relação entre T e E usando esta fórmula. Para isso tomamos um valor tı́pico para Z e r ′ . Tomamos o decaimento do isótopo 226 do Rádio (número atómico 88). Assim r ′ = 7.3 F ermi = 7.3 × 10−15 m . (3.2.50) mα ≃ 6.645 × 10−27 Kg ≃ 3.737 × 103 (MeV ) . (3.2.51) Z = 86 , Usando também que Obtemos assim, a aproximação log T = log e ln T ∼ − p 148 + 32.5 . E (MeV ) (3.2.52) Queremos agora relacionar o coeficiente de transmissão com o tempo médio de vida τ do isótopo radioactivo, que é a quantidade medida experimentalmente. Para isso imaginamos o seguinte cenário simplista. A partı́cula α encontra-se no poço de potencial correspondente à região da força forte, r < r ′ oscilando ao longo de um diâmetro, com velocidade v = p 2E/m. De cada vez que ela chega a r = r ′ tem uma probabilidade T de ser transmitida por efeito túnel. Logo a probabilidade por unidade de tempo de ser transmitida é T v/2r ′. Assumimos que a vida média, τ , é o inverso da probabilidade de decaimento por unidade de tempo 2r ′ τ= T r τ0 m ≡ , 2E T ⇒ r 148 m . log τ ∼ p − 32.5 + log 2r ′ 2E E (MeV ) (3.2.53) O segundo termo varia com a energia muito mais lentamente do que o primeiro, devido ao logaritmo. Assim, dentro do nosso cenário aproximado usamos para o segundo termo uma constante, estimada com base no decaimento tı́pico do Rádio, acima referido, para o qual a energia da partı́cula α é cerca de 5MeV . O significado desta aproximação é que o processo de decaimento alfa é essencialmente determinado pelo efeito túnel, sendo o que acontece dentro do núcleo de importância secundária. Concluimos que τ0 ≃ 10−21 s. E como tal 3.2 Partı́cula em potenciais independentes do tempo 87 Figura 3.10: Decaimento alfa: comparação da curva teórica (3.2.54) com os dados p experimentais. Note-se que a ordenada é o logaritmo comum de τ e a abcissa é −1/ E(MeV ) (Extraı́do de ‘Quantum Physics’, Berkeley Physics Course - Volume 4). 88 A equação de Schrödinger 148 log τ ∼ p − 53.5 . E (MeV ) (3.2.54) Os resultados desta curva teórica encontram-se na figura 3.10. É de salientar a boa descrição global dada pelo nosso cenário simplista, apesar da enormı́ssima variedade de tempos médios de vida considerados. Como exemplos, o U 238 tem uma vida média de 1017 s enquanto que o P o212 tem uma vida média de 10−7s. Este tipo de cálculo, originalmente feito por Gamow, Condon e Gurney em 1928, foi um dos primeiros e mais convincentes sucessos da mecânica ondulatória de Schrödinger. 3.2.6 Poço de potencial de profundidade finita (E < 0) Consideramos agora um poço de potencial, como o representado na figura 3.11 e uma partı́cula com energia −V0 < E < 0. As soluções da equação de Schrödinger independente do tempo são agora Região I Região II Região III k1 x Φ(x) = B1 e + √ B1′ e−k1 x Φ(x) = Aeikx + A′ e−ikx Φ(x) = B2 ek1 x + B2′ e−k1 x −2mE com k1 = p ~ 2m(E + V0 ) com k = ~ . (3.2.55) Requeremos continuidade da função de onda e da sua derivada em x = −L/2 e x = L/2; requeremos também que a função de onda seja finita em x = ±∞, o que significa que B1′ = B2 = 0. Assim obtemos B1 e−k1 L/2 = Ae−ikL/2 + A′ eikL/2 , AeikL/2 + A′ e−ikL/2 = B2′ e−k1 L/2 . ik(AeikL/2 − A′ e−ikL/2 ) = −k1 B ′ e−k1 L/2 2 (3.2.56) k1 B1 e−k1 L/2 = ik(Ae−ikL/2 − A′ eikL/2 ) Resolvendo cada um dos sistemas para a razão A/A′ obtemos, respectivamente, A = −eikL A′ k1 + ik k1 − ik , A ik − k1 = e−ikL , ′ A ik + k1 (3.2.57) 3.2 Partı́cula em potenciais independentes do tempo 89 V(x) L/2 −L/2 0 x B’1 I B1 II A E A’ III B’2 B2 −V 0 Figura 3.11: Poço de potencial. Distinguimos três regiões: x < −L/2 é a Região I, onde V = 0; −L/2 < x < L/2 é a Região II, onde V = −V0 ; x > L/2 é a região III, onde V = 0. o que implica que k1 − ik = ±eikL k1 + ik onde definimos ⇔ | sin(kL/2)| = k/k 0 cot(kL/2) = −k /k ⇔ 1 tan (kL/2) < 0 | cos(kL/2)| = k/k 0 tan (kL/2) = k /k ⇔ 1 tan (kL/2) > 0 k0 ≡ √ 2mV0 . ~ , (3.2.58) (3.2.59) Existem portanto duas famı́lias de soluções. Em cada um dos casos, os valores permitidos para k e portanto para a energia E são discretos. Graficamente podem ser imaginados como a intersecção da função | sin(x)| ou | cos(x)| com uma recta que passa pela origem (problema 3, folha 4). Esta discretização dos nı́veis de energia dos estados ligados é uma caracterı́stica da mecânica quântica que não se encontra na mecânica clássica onde a partı́cula pode ter qualquer energia entre 0 > E > V0 . Pode ser interpretada do seguinte modo: as ondas associadas à partı́cula vão sofrer reflexões sucessivas em x = ±L/2. Em geral, as várias ondas interferem destrutivamente, e só para certos comprimentos de onda - e como tal certas energias - esta interferência permite a existência de estados estacionários. O caso de E > 0 num poço finito de potencial é tratado também no problema 3 da folha 4. 90 A equação de Schrödinger 3.2.7 Poço de potencial de profundidade infinita Tomamos agora um poço de potencial de profunidade infinita, que é mais convenientemente tratado tomando V (x) da forma V (x) = 0 para x ∈ [0, L] , V (x) = +∞ para x > L e x < 0 . (3.2.60) Consideramos um estado com energia E positiva. Vimos, para a barreira de potencial, que no caso em que V0 → ∞ perdemos a onda evanescente. De um modo semelhante, esperamos que neste caso a função de onda se anule fora do intervalo [0, L]. De facto, a solução da equação de Schrödinger independente do tempo dá-nos Região I e III Região II Φ(x) = 0 ikx Φ(x) = Ae ′ −ikx +Ae com k = √ 2mE ~ . (3.2.61) Para saltos infinitos de potencial o nosso argumento acerca da continuidade da função de onda e da sua derivada não é aplicável. Mas podemos ainda requerer pelo menos continuidade da função de onda em x = 0, L: A + A′ = 0 AeikL + A′ e−ikL = 0 ⇒ sin(kL) = 0 , (3.2.62) ou seja kL = nπ ⇔ E= n2 π 2 ~2 ≡ En . 2mL2 (3.2.63) Tal como no caso anterior os estados quânticos têm as suas energias possı́veis quantificadas. Notemos que neste caso, a quantificação dos comprimentos de onda (e das energias) é obtida pela relação L = nλ/2, que exprime a condição para a existência de estados estacionários num sistema periódico. A mesma situação não se verificava no caso do poço finito, essencialmente devido à existência de uma onda evanescente. A função de onda normalizada correspondente ao estado de energia n é r nπx 2 e−iEn t/~ para x ∈ [0, L] , sin Ψn (x, t) = L L (3.2.64) 3.3 Evolução de um trem de ondas 91 e zero fora deste intervalo e como tal, a função de distribuição de probabilidade associada à partı́cula é P(x) = nπx 2 para x ∈ [0, L] , sin2 L L (3.2.65) e zero fora do intervalo. Se calcularmos, por exemplo, o valor esperado de x e de x2 , obtemos hxi = Z 0 L L xP(x)dx = , 2 2 hx i = Z 0 L x2 P(x)dx = L2 L2 − 2 2 . 3 2π n (3.2.66) Podemos comparar este resultado com o da mecânica clássica, pensando na partı́cula clássica como tendo uma função de distribuição de probabilidade uniforme no intervalo [0, L], Pc (x) = 1 para x ∈ [0, L] , L e zero fora do intervalo. Assim Z L L hxi = xPc (x)dx = , 2 0 2 hx i = Z 0 L x2 Pc (x)dx = (3.2.67) L2 . 3 (3.2.68) Concluimos que o resultado clássico é aproximado para números quânticos elevados correspondendo a energias elevadas. Este é um padrão que se repete em muitos casos. 3.3 Evolução de um trem de ondas Como referimos na secção 3.1, a descrição de uma partı́cula livre deve ser feita por um trem de ondas. Mas mesmo para uma partı́cula sob a influência de potenciais como aqueles que vimos na secção 3.2 o trem de ondas é a descrição apropriada, pois é a maneira natural de obter uma função de onda normalizável. Note-se no entanto que sendo o trem de ondas apenas uma sobreposição de ondas planas com diferentes energias, concluimos que toda a fı́sica da interação do trem de ondas com os vários potenciais da secção 3.2 foi já vista. Usar o trem de ondas em vez das ondas individuais aumenta a complexidade técnica da análise sem introduzir grandes novidades. Assim nesta secção discutiremos brevemente a evolução de um trem de ondas gaussiano livre e a interacção de um trem de ondas com um salto de potencial. 92 3.3.1 A equação de Schrödinger Trem de ondas Gaussiano livre Um exemplo tratável analiticamente de um trem de ondas é considerar em (3.1.26) 2 1/4 ~ 2 a 2 2 e−a (k−k0 ) /4 , φ(k) = 0 , ω(k) = k , (3.3.1) g(k) = 2π 2m correspondendo a uma função gaussiana para o perfil de Fourier de amplitudes, com todas as ondas em fase e com a relação de dispersão de uma partı́cula livre (3.0.4). Assim sendo, (3.1.26) pode-se escrever na forma 2 !2 a2 k0 2 √ Z +∞ ix + 2 2 2 2 a a k0 a 2ix + a k0 i~t Ψ(x, t) = exp − − k − 2 2i~t exp + dk , 2i~t 3/4 2 (2π) 4 4 2m a + m a + m −∞ (3.3.2) ou, fazendo o integral Gaussiano, Ψ(x, t) = 2 a2 k0 1/4 −1/2 a2 k02 2i~t 2a2 ix + 2 − a2 + exp . π m 4 a2 + 2i~t m (3.3.3) Trabalhando os termos na exponencial, reescrevemos a função de onda como ! 2 1/4 −1/2 ~k0 t 2 2 x − 2a 2i~t ~k t Ψ(x, t) = a2 + , (3.3.4) exp i − 0 + k0 x exp − 2 m π m 2m a + 2i~t m ou, definindo θ como 2~t tan 2θ = ma2 ⇔ e−iθ = a2 − a2 + 2i~t m 2i~t m !1/4 , (3.3.5) temos Ψ(x, t) = 2a2 π 1/4 4~2 t2 a4 + m2 −1/4 2 ! x − ~km0 t ~k02 t . exp i −θ − + k0 x exp − 2 2i~t 2m a + m (3.3.6) Nesta forma é simples verificar que o módulo da função de onda ao quadrado é ! −1/2 2 1/2 ~k0 t 2 4~2 t2 2a 4 2 x− m 2 a + exp −2a . |Ψ(x, t)| = 2 2 π m2 a4 + 4~m2t Extraı́mos as seguintes conclusões: (3.3.7) 3.3 Evolução de um trem de ondas 93 • A função de onda está normalizada e a sua norma é conservada na evolução temporal Z +∞ 2 kΨ(t)k ≡ |Ψ(x, t)|2 = 1 . (3.3.8) −∞ Veremos mais tarde que este facto resulta de o Hamiltoniano ser Hermı́tico e como tal a evolução unitária. • A variância, σx , associado com a função de distribuição de probabilidade P(x) = |Ψ(x, t)|2 é ~2 t2 a2 + 2 2 , (3.3.9) 4 am o que significa que a função de onda se está a espalhar para t > 0. Isto é, definimos σx = a nossa partı́cula livre como uma gaussiana para t = 0 posteriormente ela espalha-se delocalizando cada vez mais a partı́cula. Este fenómeno de espalhamento é geral para trens de onda livres. 3.3.2 Trem de ondas incidente num salto de potencial (E < V0 ) Vamos considerar um trem de ondas incidente no salto de potencial da figura (3.3). Vamos considerar o caso em que todas as ondas no nosso trem têm uma energia E < V0 . Este caso para uma onda foi tratado na secção 3.2.3. Concluimos que para cada onda plana monocromática - vector de onda k - as amplitudes A e A′ estavam relacionadas por (3.2.28). Portanto, para um trem de ondas vamos ter as relações A′ (k1 ) k1 − ik2 = ≡ e−2iθ(k1 ) , A(k1 ) k1 + ik2 onde tan θ ≡ k2 , k1 (3.3.10) para cada onda no trem. Isto é, dada uma onda com energia E, que define k1 e k2 , temos que as amplitudes incidente e reflectida diferem apenas de uma fase. Como vimos na secção 3.2.3 isto significa que a reflexão é total mas há um atraso correspondente à diferença de fase. Definimos √ 2mV0 , (3.3.11) ~ e consideramos que todas as ondas no trem obedecem a k1 < K0 ; todas as ondas são K0 = reflectidas. Consideremos a solução na Região I para t = 0 sendo Z K0 1 dk1 g(k1) eik1 x + e−2iθ(k1 ) e−ik1 x . Ψ(x, 0) = √ 2π 0 (3.3.12) 94 A equação de Schrödinger Vamos assumir que |g(k1)| tem um pico pronunciado em k1 = k̃ < K0 de modo a que a velocidade de grupo vai ser definida pela propagação deste pico. A evolução do trem de ondas é descrita pela função de onda Z K0 Z K0 1 1 i(k1 x−ω(k1 )t) Ψ(x, t) = √ dk1 g(k1)e +√ dk1 g(k1 )e−i(k1 x+ω̃(k1 )t) , 2π 0 2π 0 (3.3.13) onde ω̃(k1 ) = ω(k1 ) + 2 θ(k1 ) . t (3.3.14) O primeiro termo representa o trem de ondas incidente. O segundo representa o trem de ondas reflectido. A relação de dispersão que usamos é mais uma vez a relação de dispersão para uma partı́cula livre ω(k1) = ~k12 . 2m (3.3.15) A posição do centro do trem de ondas incidente é dado por dω ~k̃ xi (t) = t = t, dk1 k1 =k̃ m enquanto que a posição do centro do trem de ondas reflectidas é dado por dω̃ ~k̃ 2 xr (t) = −t . =− t+ q dk1 k1 =k̃ m K02 − k̃ 2 (3.3.16) (3.3.17) Se pensarmos no centro do trem de ondas como descrevendo a ‘posição’ da partı́cula quântica associada ao trem de ondas xi (t) e xr (t) podemos fazer a seguinte análise do movimento: • Esta solução descreve o movimento na região I, isto é para x < 0. Para t < 0, xr > 0, logo para t negativo não há onda reflectia. Do mesmo modo, para t > 0, xi > 0. Logo, para t positivo não há onda incidente. • Assim descrevemos o movimento como: i) para t < 0 a ‘partı́cula’ desloca-se com velocidade ~k̃/m no sentido positivo do eixo dos x; ii) entre 2m 0<t< ~k̃ q K02 − k̃ 2 ≡ ∆τ , (3.3.18) 3.4 Sumário 95 a ‘partı́cula’ não está na região I; ao contrário de uma partı́cula clássica que seria reflectida instantaneamente, a partı́cula quântica pode ‘penetrar’ na região II, devido à onda evanescente originando um atraso na reflexão dado por ∆τ ; iii) para t > ∆τ a ‘partı́cula’ desloca-se com velocidade ~k̃/m no sentido negativo do eixo dos x. Assim, usando um trem de ondas conseguimos obter uma solução ‘localizada’ cujo centro podemos encarar como a ‘localização’ da partı́cula quântica. Mas ao mesmo tempo vemos os efeitos quânticos que decorrem da propagação desta partı́cula ser feita de um modo ondulatório, que neste caso corresponde ao atraso na reflexão. Análises semelhantes poderiam ser feitas para todos os outros casos da secção 3.2. 3.4 Sumário Neste capı́tulo introduzimos a equação de Schrödinger. Discutimos as razões porque uma onda plana monocromática não é uma boa descrição da função de onda para uma partı́cula livre o que nos levou a introduzir o conceito de trem de ondas. Investigamos as consequências da equação de Schrödinger em alguns potenciais independentes do tempo, estudando os estados estacionários do sistema, para ondas monocromáticas. A figura 3.12 faz um sumário dos potenciais estudados. Finalmente, estudamos a evolução de um trem de ondas Gaussiano e de um trem de ondas a interagir com um salto de potencial. A importante lição a tirar desta análise é que as propriedes inesperadas da partı́cula quântica são facilmente percebidas se nos lembrarmos que uma partı́cula quântica se propaga como uma onda, que é interpretada como uma onde de probabilidade. 96 A equação de Schrödinger ~ SECÇAO 3.2.3 3.2.2 3.2.5 3.2.4 3.2.6 3.2.7 Figura 3.12: Os potenciais em escada estudados na secção 3.2 (extraı́do de Eisberg & Resnick, ‘Quantum Physics’ ). CAPÍTULO 4 Formalismo Matemático e Postulados da Mecânica Quântica Neste capı́tulo vamos introduzir de um modo sistemático a matemática usada na mecânica quântica e os postulados que a definem como teoria fı́sica. 4.1 Funções de onda e operadores O objecto matemático fundamental em mecânica quântica é a função de onda Ψ(~x, t). Devido ao postulado de Born para a interpretação da função de onda vamos estar particularmente interessados em funções de onda normalizáveis, ditas funções de quadrado somável, que obedecem a 2 kΨ(t)k ≡ Z 3 ∗ d ~xΨ(~x, t)Ψ(~x, t) ≡ Z d3~x|Ψ(~x, t)|2 < ∞ . (4.1.1) O espaço das funções de quadrado somável sobre o corpo dos complexos, C, forma um espaço vectorial designado por ‘L2 ’ e tem a estrutura de um espaço de Hilbert. Mas o nosso interesse incidirá apenas sobre um subconjunto de ‘L2 ’, denotado por F que compreende funções de onda de quadrado somável infinitamente deriváveis e limitadas. 98 Formalismo Matemático e Postulados da Mecânica Quântica 4.1.1 Estrutura de F e produto escalar em F F é um espaço vectorial, isto é, se (a partir de agora deixamos de escrever, para simplicidade de notação, o argumento (~x, t) das funções de onda) Ψ1 , Ψ2 ∈ F ⇒ Ψ ≡ λ 1 Ψ1 + λ 2 Ψ2 ∈ F , (4.1.2) onde λ1 , λ2 ∈ C. De facto, |Ψ|2 = |λ1 |2 |Ψ1 |2 + |λ2 |2 |Ψ1 |2 + λ∗1 λ2 Ψ∗1 Ψ2 + λ1 λ∗2 Ψ1 Ψ∗2 , (4.1.3) onde os dois últimos termos têm o mesmo módulo (pois são complexos conjugados) e são limitados superiormente por 2|λ1 ||λ2||Ψ1 ||Ψ2 | ≤ |λ1 ||λ2 | |Ψ1 |2 + |Ψ2 |2 . Logo, 2 kΨk ≤ Z d3~x |λ1 |2 |Ψ1 |2 + |λ2 |2 |Ψ1 |2 + |λ1 ||λ2 | |Ψ1 |2 + |Ψ2 |2 , (4.1.4) (4.1.5) que é um número finito pois, por hipótese, Ψ1 , Ψ2 são funções de quadrado somável. A definição de norma que temos usado, (4.1.1), sugere a definição de um produto escalar entre duas funções de onda Ψ e Φ: (Ψ, Φ) ≡ Z d3~xΨ∗ Φ , (4.1.6) que associa a um par de funções de onda Ψ, Φ ∈ F um número complexo. Note-se que porque as funções pertencem ao espaço de Hilbert este integral é necessariamente convergente. Esta propriedade é uma consequência da desigualdade de Schwarz que veremos em baixo. Propriedades do produto escalar: i) Não é simétrico (Φ, Ψ) = (Ψ, Φ)∗ ; (4.1.7) 4.1 Funções de onda e operadores 99 ii) Linear no segundo argumento (Φ, λ1 Ψ1 + λ2 Ψ2 ) = λ1 (Φ, Ψ1 ) + λ2 (Φ, Ψ2 ) ; (4.1.8) iii) Anti-linear no primeiro argumento (λ1 Φ1 + λ2 Φ2 , Ψ) = λ∗1 (Φ1 , Ψ) + λ∗2 (Φ2 , Ψ) ; (4.1.9) iv) Definição de funções ortogonais: se (Φ, Ψ) = 0 , (4.1.10) (Ψ, Ψ) = kΨk2 , (4.1.11) as funções são ditas ortogonais; v) Definição da norma: que é real, positiva e só é zero se Ψ = 0. vi) Finito |(Ψ1 , Ψ2 )| ≤ p (Ψ1 , Ψ1 ) p (Ψ2 , Ψ2 ) = kΨ1 kkΨ2 k < ∞ , que decorre da desigualdade de Schwarz habitual Z b Z b Z b 2 ∗ ∗ f gdx ≤ f f dx g ∗gdx . a 4.1.2 a (4.1.12) (4.1.13) a Bases de F Dado que as funções de onda vivem num espaço vectorial é natural definir uma base. Isto é, um conjunto completo de funções em que possamos expandir, de um modo único, a função de onda em cada instante t. Dependendo da estrutura de F , esta base pode ser discreta ou contı́nua: Base discreta {un (~x)} , n ∈ N Base contı́nua {uα (~x)} , α ∈ R . (4.1.14) / F , pelo que o Nos casos em que analisaremos, un (~x) ∈ F para todo o n, mas uα (~x) ∈ uso do termo base é abusivo no caso contı́nuo, mas ainda assim será usado com o sentido 100 Formalismo Matemático e Postulados da Mecânica Quântica de que expandiremos funções de F usando o conjunto {uα (~x)}. Analisemos primeiro uma base discreta: • Expansão da função de onda para um dado t: Ψ(~x) = X cn un (~x) , (4.1.15) n o que define de um modo único as componentes {cn }; • Relação de ortonormalização da base: (un , um ) = δnm ; (4.1.16) • Produto escalar de uma função de onda com uma função da base (i.e. projecção na base) Z X X XZ 3 ∗ cm (un , um ) = cm δnm = cn ; d3~xu∗n cm um = (un , Ψ) = d ~xun Ψ = m m m (4.1.17) • Produto escalar de duas funções de onda em termos das suas componentes: Tomamos Ψ= X cn u n , Φ= n X bm um , (4.1.18) m logo (Φ, Ψ) = X b∗m cn n,m Z d3~xu∗m un (4.1.16) X = b∗m cn δnm = n,m X b∗n cn , (4.1.19) n e em particular (Ψ, Ψ) = X n |cn |2 , (4.1.20) que é uma generalização da igualdade de Bessel-Parseval (C.21). • Relação de fecho (isto é, {un } formam uma base) Ψ(~x) = X n cn un (~x) (4.1.17) = X n (un , Ψ)un (~x) = Z d3~x ′ Ψ(~x ′ ) " X n u∗n (~x ′ )un (~x) # . (4.1.21) 4.1 Funções de onda e operadores 101 Introduzimos aqui a Função delta de Dirac, δ(~x − ~x ′ ), definida pela propriedade1 Z f (~x)δ(~x − ~x ′ )d3~x = f (~x ′ ) ; (4.1.22) (assumiu-se que ~x′ pertence ao domı́nio de integração). Logo, se Ψ pode ser expandida em termos da base concluimos que X n u∗n (~x ′ )un (~x) = δ(~x − ~x ′ ) . (4.1.23) Reciprocamente, se (4.1.23) é verdadeira, Ψ pode ser expressa em termos da base; de facto Ψ(~x) = Z d3~x ′ δ(~x−~x ′ )Ψ(~x ′ ) hipótese = Z d3~x ′ Ψ(~x ′ ) " X # u∗n (~x ′ )un (~x) = n X cn un (~x) . n (4.1.24) Assim, a relação de fecho (4.1.23) é a expressão matemática de que {un } formam uma base. Façamos agora uma análise semelhante para uma ‘base’ contı́nua: • Expansão da função de onda para um dado t: Z Ψ(~x) = dαc(α)uα(~x) , (4.1.25) o que define de um modo único as componentes {c(α)}; • Relação de ortonormalização da base: (uα , uα′ ) = Z • Projecção na base Z Z 3 ∗ (uα , Ψ) = d ~xuα dα′c(α′ )uα′ d3~xu∗α uα′ = δ(α − α′ ) ; (4.1.26) = Z dα′ c(α′ )δ(α − α′ ) = c(α); (4.1.26) (4.1.27) Portanto, definindo a relação de ortonormalização anterior permite-nos obter esta relação de projecção, análoga ao caso discreto. 1 Notemos que a ordem dos argumentos na função delta de Dirac não interessa, i.e. δ(~x −~x ′ ) = δ(~x ′ −~x). 102 Formalismo Matemático e Postulados da Mecânica Quântica • Produto escalar de duas funções de onda em componentes: Tomamos Z Z Ψ = dαc(α)uα , Φ = dα′b(α′ )uα′ , (4.1.28) logo (Φ, Ψ) = Z ′ ′ ∗ dαdα b(α ) c(α) Z d 3 ~xu∗α′ uα (4.1.26) = Z dαb(α)∗ c(α) , (4.1.29) e em particular (Ψ, Ψ) = Z dα|c(α)|2 . (4.1.30) • Relação de fecho (isto é, {uα } formam uma base) Z Z Z (4.1.27) 3 ′ ′ Ψ(~x) = dαc(α)uα(~x) = d ~x Ψ(~x ) dαu∗α(~x ′ )uα (~x) . Logo, se Ψ pode ser expandida em termos da base concluimos que Z dαu∗α(~x ′ )uα (~x) = δ(~x − ~x ′ ) . (4.1.31) (4.1.32) Reciprocamente, é simples demonstrar que se (4.1.32) é verdadeira, Ψ pode ser expressa em termos da base. Resumimos as propriedades das bases contı́nuas e discretas nas seguinte tabela: Expansão da Função de Onda Base discreta {un } X Ψ(~x) = cn un (~x) Base contı́nua {uα } R Ψ(~x) = dαc(α)uα(~x) (un , Ψ) = cn X (Φ, Ψ) = b∗n cn (uα , Ψ) = c(α) R (Φ, Ψ) = dαb∗ (α)c(α) n Relação de Ortonormalização (uα , uα′ ) = δ(α − α′ ) (un , um ) = δnm Projecção da Função de Onda Produto escalar em componentes n Relação de Fecho X n u∗n (~x ′ )un (~x) = δ(~x − ~x ′ ) R dαu∗α(~x ′ )uα (~x) = δ(~x − ~x ′ ) Note-se portanto que a passagem da base discreta para contı́nua pode ser sistematizada como uma mudança do ı́ndice discreto da base para contı́nuo (n → α), somatórios R P para integrais ( → ) e deltas de Kronecker para deltas de Dirac (δmn → δ(α − α′ )). Especializamos agora o caso contı́nuo para dois importantes conjuntos de funções: 4.1 Funções de onda e operadores 103 i) Tomamos o parâmetro contı́nuo α = p~, as componentes c(α) = c(~p) ≡ Ψ̃(~p) e os vectores da base (em n dimensões) uα (~x) = up~(~x) = 1 ei~x·~p/~ , (2π~)n/2 (4.1.33) ou seja ondas planas, que são funções com momento bem definido; ii) Tomamos o parâmetro contı́nuo α = ~x0 , as componentes c(α) = c(~x0 ) ≡ Ψ(~x0 ) e os vectores da base uα (~x) = u~x0 (~x) = δ(~x − ~x0 ) , (4.1.34) ou seja deltas de Dirac, que são funções cujo suporte está bem definido no espaço de posições. Para estes dois exemplos de ‘bases’2 a tabela anterior toma a forma Expansão Orto Projecção P.E. Fecho Ondas Planas Z −n/2 d~p Ψ̃(~p)ei~x·~p/~ Ψ(~x) = (2π~) Z ′ −n d~x ei~x·(~p −~p)/~ = δ(~p ′ − p~) (2π~) Z −n/2 d~x Ψ(~x)e−i~x·~p/~ Ψ̃(~p) = (2π~) Z Z ∗ d~xΦ(~x) Ψ(~x) = d~pΦ(~p)∗ Ψ(~p) Z ′ −n d~p ei~p·(~x −~x)/~ = δ(~x ′ − ~x) (2π~) Z Deltas de Dirac Z Ψ(~x) = d~x0 Ψ(~x0 )δ(~x − ~x0 ) d~xδ(~x − ~x0 )δ(~x − ~x0 ′ ) = δ(~x0 − ~x0 ′ ) Z Ψ(~x0 ) = d~xΨ(~x)δ(~x − ~x0 ) Z Z ∗ d~xΦ(~x) Ψ(~x) = d~x0 Φ(~x0 )∗ Ψ(~x0 ) Z d~x0 δ(~x − ~x0 )δ(~x ′ − ~x0 ) = δ(~x − ~x ′ ) Note-se que a penúltima linha expressa relações do tipo da igualdade de ParsevalPlancharel (C.29). 4.1.3 Operadores Lineares a actuar em F Um operador linear Â, é uma aplicação (endomorfismo) em F  : F −→ F Ψ(~x) −→ Ψ′ (~x) = ÂΨ(~x) 2 , Relembramos que o termo base é abusivo pois os vectores da ‘base’ não pertencem a F . (4.1.35) 104 Formalismo Matemático e Postulados da Mecânica Quântica que é linear Â[λ1 Ψ1 + λ2 Ψ2 ] = λ1 ÂΨ1 + λ2 ÂΨ2 . (4.1.36) Alguns exemplos de operadores: • Operador Paridade Π̂Ψ(x, y, z) = Ψ(−x, −y, −z) ; (4.1.37) X̂Ψ(x, y, z) = xΨ(x, y, z) ; (4.1.38) • Operador multiplicação por x • Operador derivada em ordem a x D̂x Ψ(x, y, z) = ∂ Ψ(x, y, z) ; ∂x (4.1.39) • Operadores Hamiltoniano e Translações temporais (ver capı́tulo 3) a actuar numa função de onda do tipo Ψ(~x, t) = Φ(~x)e−iEt/~ ĤΨ(~x, t) = EΨ(~x, t) , T̂ Ψ(~x, t) = EΨ(~x, t) . (4.1.40) Sejam Â, B̂ dois operadores. Definimos o produto de operadores ÂB̂ como h i (ÂB̂)Ψ(~x) =  B̂Ψ(~x) . (4.1.41) Em geral o produto de operadores não é comutativo, isto é o comutador h i Â, B̂ ≡ ÂB̂ − B̂  , (4.1.42) é diferente de zero. Por exemplo, o comutador dos operadores X̂ e D̂x não é zero h i ∂ ∂ − x Ψ(~x) = −Ψ(~x) , (4.1.43) X̂, D̂x Ψ(~x) = x ∂x ∂x ou seja h i X̂, D̂x = −1̂ . (4.1.44) 4.1 Funções de onda e operadores 105 Como veremos adiante o facto de dois operadores comutarem ou não está intrinsecamente associado ao princı́pio da incerteza e ao facto de duas grandezas fı́sicas serem compatı́veis ou incompatı́veis. Um tipo particularmente importante de operadores em Mecânica Quântica são os operadores hermı́ticos, que por definição obedecem a (Ψ, ÂΨ) = (ÂΨ, Ψ) , ∀Ψ ∈ F . (4.1.45) Estudemos a hermiticidade dos operadores anteriores: • Operador Paridade Z +∞ (Ψ, Π̂Ψ) = d3~xΨ∗ (~x)Ψ(−~x) ~ x→−~ x = −∞ − Z −∞ d3~xΨ∗ (−~x)Ψ(~x) = (Π̂Ψ, Ψ) , +∞ (4.1.46) logo o operador Paridade é hermı́tico. • Operador multiplicação por x Z Z 3 ∗ (Ψ, X̂Ψ) = d ~xΨ (~x)xΨ(~x) = d3~x(xΨ(~x))∗ Ψ(~x) = (X̂Ψ, Ψ) , (4.1.47) logo o operador multiplicação por x é hermı́tico. Deste exemplo conclui-se que se os valores próprios do operador são reais ele é hermı́tico. O resultado recı́proco é também verdade, como veremos na secção 4.2.6. • Operador derivada em ordem a x Z ∂ (Ψ, D̂x Ψ) = d3~xΨ∗ (~x) Ψ(~x) ∂x por partes = − Z d3~x ∂ ∗ Ψ (~x)Ψ(~x) = −(D̂x Ψ, Ψ) , ∂x (4.1.48) logo o operador derivada não é hermı́tico (de facto é anti-hermı́tico). Note-se que na integração por partes usamos que o módulo da função de onda desaparece no infinito, devido à função de onda ser de quadrado somável. Um exercı́cio análogo mostra que o operador iD̂x é hermı́tico. Logo, o operador P̂ = −i~ ∂ , ∂x que interpretaremos como operador momento, é um operador hermı́tico. (4.1.49) 106 Formalismo Matemático e Postulados da Mecânica Quântica • Operadores Hamiltoniano e Translações temporais (ver capı́tulo 3) a actuar numa função de onda do tipo Ψ(~x, t) = Φ(~x)e−iEt/~: pelo que vimos anterioremente este operadores serão hermı́ticos se E for real. Concluimos com a definição que aos valores próprios de um operador se chama espectro do operador. 4.2 A notação de Dirac Como vimos no fim do capı́tulo 2, um sistema quântico caracteriza-se pelo estado em que se encontra. Este estado é definido pela sua função de onda, que por sua vez, é um vector em F . É desejável ter uma designação genérica e caracterı́stica para os vectores associados a estados quânticos, independentemente de F ter dimensão finita ou infinita, de a base ser contı́nua ou discreta e de o estado viver no espaço de configurações, polarizações, spin, etc (todos os graus de liberdade possı́veis). Dirac sugeriu a designação de ket e a representação |αi i , (4.2.1) onde os αi são um conjunto apropriado de rótulos para o estado em consideração.3 Por exemplo, as funções de onda que tratamos no capı́tulo 3, para uma partı́cula sem spin, Ψ(x) são agora representadas pelo ket Ψ(x) ∈ F −→ |Ψi ∈ E . (4.2.2) A ausência do argumento espacial no rótulo do ket significa que o ket representa o estado, independentemente das coordenadas usadas, enquanto que Ψ(~x) são as componentes de |Ψi num dado sistema coordenado. Esta situação é análoga a considerarmos um vector ~v , que é uma entidade geométrica autónoma, independentemente da base escolhida para o representar numa situação concreta, em que tem componentes {vi }. Definimos também um espaço de estados E, onde vivem os kets, que é isomórfico ao espaço das funções de onda F . Vejamos pois como se reexpressam em E os conceitos de produto escalar e de acção de operadores lineares. 3 Como veremos na secção 4.4.1, estes rótulos são os valores próprios dos operadores de um Conjunto Completo de Observáveis que Comutam (C.C.O.C.). 4.2 A notação de Dirac 4.2.1 107 Produto escalar e espaço dual a E Definimos o produto escalar de kets como a associação a cada par de kets de um número complexo ( , ):E ×E −→ C , (4.2.3) |Ψi, |Φi −→ (|Ψi, |Φi) que obedece às propriedades (4.1.7)-(4.1.12). Por outro lado podemos definir um espaço dual a E, isto é um espaço cujos membros são aplicações lineares de E para C hαi | ∈ E ∗ : E −→ C . (4.2.4) Os vectores deste espaço são designados por bra e representados por hαi | , (4.2.5) onde αi são mais uma vez rótulos. A existência do produto escalar determina uma correspondência entre E e E ∗ :4 E −→ E∗ , (4.2.6) |Φi −→ (|Φi, . . .) ≡ hΦ| onde os . . . representam a entrada livre. Esta correspondência é antilinear. De facto λ1 |Φ1 i + λ2 |Φ2 i corresponde ao bra −→ (λ1 |Φ1 i + λ2 |Φ2 i, . . .) = λ∗1 (|Φ1 i, . . .) + λ∗2 (|Φ2 i, . . .) = λ∗1 hΦ1 | + λ∗2 hΦ2 | . (4.2.7) Nesta notação, o produto escalar é representado da seguinte forma (|Φi, |Ψi) = hΦ|Ψi . As propriedades (4.1.7)-(4.1.12) aplicam-se também nesta notação. (4.2.8) O uso de bras e kets denomina-se notação de Dirac. Nesta notação o produto escalar aparece como um parêntesis da forma h. . . | . . .i, ou seja a justaposição de um bra a um ket; a origem destes está no inglês em que parêntesis se diz bracket=bra+ket. 4 Se E for finito, E e E ∗ são isomórficos, mas em geral não são. 108 4.2.2 Formalismo Matemático e Postulados da Mecânica Quântica Acção de operadores lineares Podemos reescrever a secção 4.1.3 na notação de Dirac. Assim, um operador linear  é um endomorfismo em E  : E −→ E |Φi −→ |Φ′ i ≡ Â|Φi , (4.2.9) que é linear  [λ1 |Ψ1 i + λ2 |Ψ2 i] = λ1 Â|Ψ1 i + λ2 Â|Ψ2 i . (4.2.10) O produto escalar do ket |Φi com Â|Ψi, hΦ|Â|Ψi , (4.2.11) é designado elemento de matriz do operador  entre |Φi e |Ψi, que é um número complexo que depende linearmente em |Ψi e antilinearmente em |Φi. Um exemplo particular de operador é construı́ido com um bra e um ket com a ordem ‘trocada’: |ΦihΨ| : E −→ E , (4.2.12) |χi −→ |ΦihΨ|χi = z|Φi onde z ≡ hΨ|χi é um número complexo. Em particular, o operador |ΨihΨ| é um operador de projecção de um ket arbitrário em |Ψi |ΨihΨ| : E −→ E , (4.2.13) |χi −→ |ΨihΨ|χi projecção que é nula se |Ψi e |χi forem ortogonais, isto é hΨ|χi = 0. Deste exemplo concluı́mos que a ordem com que colocamos kets e bras é fundamental: hΨ|Φi = número , |ΦihΨ| = operador . (4.2.14) Podemos usar a acção de um operador num ket para definir a acção de um operador num bra do seguinte modo: hΦ| |Ψi ≡ hΦ| Â|Ψi . (4.2.15) 4.2 A notação de Dirac 109 Isto é, um elemento de matriz é independente de o operador actuar primeiramente no bra ou no ket. Como exercı́cio pode tentar demonstrar que a acção no bra assim definida é linear. Podemos pois escrever o elemento de matriz como (4.2.11) pois não há ambiguidades de ordem de actuação. 4.2.3 O operador adjunto Definimos o operador adjunto a Â, representado † (lê-se “A dagger” ou “A adjunto”), do seguinte modo: a cada ket associamos um bra5 |Ψi −→ hΨ| ; (4.2.16) definimos o operador adjunto como o operador que actuando no bra hΨ| dá origem ao bra associado ao ket Â|Ψi |Ψ′ i ≡ Â|Ψi −→ hΨ′ | ≡ hΨ|† . (4.2.17) Mostremos que, por esta definição, a acção de † nos bras é linear. Seja λ∗1 |Ψ1 i + λ∗2 |Ψ2 i −→ λ1 hΨ1 | + λ2 hΨ2 | ; (4.2.18) pela linearidade de   (λ∗1 |Ψ1 i + λ∗2 |Ψ2 i) = λ∗1 ∗ Â|Ψ1 i + λ2 Â|Ψ2 i , e igualando os bras associados a cada um destes kets obtemos imediatamente (λ1 hΨ1 | + λ2 hΨ2 |) † = λ1 hΨ1 |† + λ2 hΨ2 |† , (4.2.19) (4.2.20) o que demonstra que a acção de † é linear. Uma importante equação é a que relaciona os elementos de matriz de † com os de Â. Por (4.1.7), hΨ′ |Φi = hΦ|Ψ′ i∗ , (4.2.21) para |Φi e |Ψ′ i arbitrários. Se tomarmos |Ψ′ i como em (4.2.17) obtemos hΨ|† |Φi = hΦ|Â|Ψi∗ . 5 Nesta secção a seta denota a correspondência (4.2.6). (4.2.22) 110 Formalismo Matemático e Postulados da Mecânica Quântica As seguintes propriedades são consequência de (4.2.17) e (4.2.22): i) †  † =  ; (4.2.23) ii) † λ = λ∗ † ; (4.2.24) iii)  + B̂ † = A† + B † ; (4.2.25) iv) † ÂB̂|ψi −→ hΨ| ÂB̂ . † †  B̂|Ψi −→ hΨ|B̂  Logo ÂB̂ † = B̂ † † . (4.2.26) (4.2.27) Reexpressemos a definição de operador hermı́tico (4.1.45), na notação de Dirac. Consideramos os kets |Ψi e Â|Ψi. Os seus bras associados são |Ψi −→ (|Ψi, . . .) ≡ hΨ| . Â|Ψi −→ Â|Ψi, . . . ≡ hΨ|† (4.2.28) Logo, a condição (4.1.45) é expressa hΨ|Â|Ψi = hΨ|† |Ψi , (4.2.29) que, sendo |Ψi arbitrário, é equivalente a † =  . (4.2.30) Notemos que o produto de 2 operadores hermı́ticos só é um operador hermı́tico se o seu comutador for zero † ÂB̂ = ÂB̂ (4.2.27) ⇔ B̂ † † = ÂB̂ hermiticidade ⇔ h i B̂  = ÂB̂ ⇔ Â, B̂ = 0 . (4.2.31) 4.2 A notação de Dirac 4.2.4 111 A operação adjunta A definição de operador adjunto resulta da correspondência entre E e E ∗ . Chamamos por isso a um ket e ao seu bra associado adjuntos e denotamos hΨ|† = |Ψi , |Ψi† = hΨ| . (4.2.32) O que acontece quando temos um produto de kets e bras como por exemplo (|aihb|)† ? (4.2.33) O elemento de matriz deste operador entre 2 estados arbitrários é hΨ| (|aihb|)† |Φi (4.2.22) = (hΦ|aihb|Ψi)∗ = hΦ|ai∗ hb|Ψi∗ = hΨ|biha|Φi = hΨ| (|biha|) |Φi , (4.2.34) ou seja (|aihb|)† = |biha| . (4.2.35) Assim, a acção da operação adjunta transforma ket ↔ bra e, tal como para operadores, inverte a ordem. Notando que a operação adjunta transforma um escalar no seu complexo conjugado (por (4.2.24)), resumimos a acção da operação adjunta numa expressão composta por kets, bras, constantes e operadores do seguinte modo: i) Substituimos • constantes pelos complexos conjugados; • kets pelos bras associados e vice-versa; • operadores pelos adjuntos; ii) Invertemos a ordem dos factores. 4.2.5 Notação de Dirac numa dada base Reproduzimos a tabela da secção 4.1.2 na notação de Dirac:6 6 Os kets |uα i são designados por kets generalizados, pois não pertencem a E, i.e. não são normalizáveis, tal como os vectores uα (~x) na secção 4.1.2. 112 Formalismo Matemático e Postulados da Mecânica Quântica Expansão da Função de Onda Base discreta {|un i} X |Ψi = cn |un i Base contı́nua {|uαi} R |Ψi = dαc(α)|uαi hun |Ψi = cn X hΦ|Ψi = b∗n cn huα |Ψi = c(α) R hΦ|Ψi = dαb∗ (α)c(α) n Relação de Ortonormalização huα |uα′ i = δ(α − α′ ) hun |umi = δnm Projecção da Função de Onda Produto escalar em componentes n Relação de Fecho (n) P̂ ≡ X n |un ihun | = 1̂ P̂ (α) ≡ R dα|uαihuα| = 1̂ onde usamos o ket |Φi = X n bn |un i , (4.2.36) e denotamos o operador identidade como 1̂. Demonstremos a relação de fecho no caso discreto. Considerando o ket |Ψi nesta base temos |Ψi = X n cn |un i = X n hun |Ψi|un i = X n |un ihun |Ψi , (4.2.37) o que implica a equivalência X n |un ihun | = 1̂ . (4.2.38) É simples expressar um bra nesta base usando este operador. No caso discreto hΨ| = X n hΨ|unihun | = X n c∗n hun | . (4.2.39) Por outro lado, os elementos de matriz de um operador  são Anm = hun |Â|umi A(α, α′ ) = huα |Â|uα′ i , (4.2.40) para uma base discreta e contı́nua respectivamente. Assim, no caso de uma base discreta podemos resumir a situação do seguinte modo: • O ket |Ψi = • O bra hΦ| = P n cn |un i é representado como um vector coluna com componentes {cn }; ∗ n bn hun | é representado como um vector linha com componentes {b∗n }; P 4.2 A notação de Dirac 113 • O operador  é representado como uma matriz com componentes Anm = hun |Â|um i; • O ket Â|Ψi é representado como um vector coluna com componentes {dn = P m Anm cm }, que resulta da multiplicação de uma matriz (que representa Â) por um vector coluna (que representa |Ψi); de facto projectando este ket nos vectores da base obtemos X X dn = hun |Â|Ψi = hun |Â1̂|Ψi = hun |Â|um ihum |Ψi = Anm cm ; (4.2.41) m m • O bra hΨ| é representado como um vector linha com componentes { ∗ n cn Anm }, P que resulta da multiplicação de um vector linha (que representa hΨ|) por uma matriz (que representa Â); de facto projectando este bra nos vectores da base obtemos X X c∗n Anm ; (4.2.42) hΨ|Â|um i = hΨ|1̂Â|umi = hΨ|un ihun |Â|um i = n • O número hΦ|Â|Ψi é representado como n ∗ n,m bn Anm cm , P que resulta da multiplicação de uma matriz (que representa Â) por um vector linha à esquerda (que representa o bra) e um vector coluna à direita (que representa o ket); de facto X X hΦ|Â|Ψi = hΦ|1̂Â1̂|Ψi = hΦ|un ihun |Â|um ihum|Ψi = b∗n Anm cm ; n,m (4.2.43) n,m • O operador adjunto † de um operador  é representado pela matriz complexa conjugada e transposta da matriz que representa Â; de facto A† nm = hun |† |um i (4.2.22) = hum |Â|un i∗ = A∗mn ; (4.2.44) • Um operador hermı́tico é representado por uma matriz hermı́tica, pois † =  implica que Anm = A∗mn . 4.2.6 (4.2.45) Valores próprios e vectores próprios de um operador Um problema fundamental em mecânica quântica é encontrar os valores próprios, λ, e os vectores próprios, |Ψi, de um operador Â; isto é, resolver a equação Â|Ψi = λ|Ψi . (4.2.46) 114 Formalismo Matemático e Postulados da Mecânica Quântica Chama-se espectro do operador  ao seu conjunto de valores próprios. Notemos que para qualquer operador linear i) Se |Ψi é vector próprio, α|Ψi também o é, correspondendo ao mesmo valor próprio. Podemos por isso escolher sempre os vectores próprios normalizados, isto é hΨ|Ψi = 1 . (4.2.47) ii) Se {|Ψi i}, i=1,...,n, são linearmente independentes e correspondem ao mesmo valor próprio, o valor próprio diz-se degenerado com grau de degenerescência n. No caso de o operador em consideração ser hermı́tico podemos ainda enunciar as seguintes propriedades: i) Os valores próprios de um operador hermı́tico  são reais: λhΨ|Ψi = hΨ|Â|Ψi (4.2.22) = hΨ|Â|Ψi∗ = λ∗ hΨ|Ψi , (4.2.48) logo λ = λ∗ ; (4.2.49) ii) Dois vectores próprios |Ψi, |Φi associados a valores próprios distintos λ, µ são ortogonais. De facto, Â|Ψi = λ|Ψi Â|Φi = µ|Φi adjunto ←→ hΨ| = λhΨ| hΦ| = µhΦ| logo se considerarmos hΦ|Â|Ψi podemos pensar de duas maneiras λhΦ|Ψi = hΦ| Â|Ψi = hΦ|Â|Ψi = hΦ| |Ψi = µhΦ|Ψi , , (4.2.50) (4.2.51) e como λ 6= µ concluı́mos que hΦ|Ψi = 0. Na prática, dada uma base em que expressamos um operador  como uma matriz, encontrar os valores próprios do operador resume-se a encontrar os valores próprios da matriz e portanto resolver a equação det (Amn − λδmn ) = 0 . (4.2.52) 4.3 Os postulados da Mecânica Quântica 4.2.7 115 Observáveis Consideremos um operador hermı́tico Â, e por simplicidade assumimos que os seus valores próprios formam um espectro discreto {λn }, n=1,...,N, com Â|Ψin i = λn |Ψin i , (4.2.53) onde i representa a degenerescência de cada valor próprio, i = 1, ..., gn , onde gn é um número inteiro que depende de n. Para cada n podemos escolher uma base ortonormada do subespaço vectorial associado ao valor próprio λn , hΨin |Ψjn i = δ ij . (4.2.54) Como vimos anteriormente os vectores próprios associados a valores próprios distintos são necessariamente ortogonais e podemos escolhê-los normalizados. Assim o conjunto |Ψin i, n = 1...N, i = 1...gn forma uma base ortonormada do espaço de funções próprias de Â. Se este conjunto é também uma base do espaço de estados E, o operador hermı́tico é designado uma observável. Portanto, o requerimento para ser observável é que qualquer estado de E possa ser expresso como uma combinação linear de funções próprias da observável, condição que é expressa matematicamente pela relação de fecho gn N X X n=1 i=1 |Ψin ihΨin | = 1̂ . (4.2.55) Veremos na próxima secção que as grandezas fı́sicas mensuráveis estão associadas a observáveis. 4.3 Os postulados da Mecânica Quântica Pensemos na descrição da mecânica clássica dada pelo formalismo Hamiltoniano descrito na secção 1.3. Podemos escrever “postulados” para a mecânica clássica de N partı́culas pontuais usando a linguagem de estado do sistema que temos usado na descrição quântica. Os postulados clássicos seriam os seguintes: i) O estado de um sistema no instante t0 é definido especificando {q i (t0 ), pi(t0 )}, i = 1...N; 116 Formalismo Matemático e Postulados da Mecânica Quântica ii) Num dado instante o valor de todas as quantidades fı́sicas é completamente determinado se o estado do sistema é conhecido. Sabendo o estado do sistema em t0 podemos prever com toda a certeza o resultado de qualquer medida efectuada no sistema em t0 ; iii) A evolução do estado do sistema é dada pelas equações canónicas (1.3.13) ṗi = − ∂H , ∂q i q̇ i = ∂H , ∂pi (4.3.1) onde H é o Hamiltoniano. Dado estas serem equações diferenciais de primeira ordem, a sua solução {q i (t), pi (t)} é completamente determinada pelas condições iniciais {q i (t0 ), pi(t0 )}. Assim, o estado do sistema é conhecido para todo o t se for conhecido para t0 . Qual o sistema de postulados que substituem os anteriores em mecânica quântica? Ou seja: i) Como se descreve matematicamente num dado instante t0 o estado de um sistema quântico? Primeiro Postulado Num dado instante t0 , o estado de um sistema é descrito por um ket |Ψ(to )i pertencente ao espaço de estados E. Note-se que neste postulado está implı́cito: a) o princı́pio de sobreposição, pois E é um espaço vectorial; b) normalizabilidade da função de onda pois E é um subespaço de um espaço de Hilbert. ii) Dado este estado, como podemos prever o resultado da medida de quantidades fı́sicas? Segundo Postulado Qualquer quantidade fı́sica mensurável, A, é descrita por um operador, Â, que actua em E; este operador é uma observável. 4.3 Os postulados da Mecânica Quântica 117 Note-se desde já que em mecânica quântica o estado do sistema - representado por um vector - e uma quantidade fı́sica mensurável - representada por um operador - têm naturezas diferentes. Em mecânica clássica este contraste não existe. Terceiro Postulado Os únicos resultados possı́veis numa medição de A são os valores próprios de Â. Note-se que a) o resultado de uma medição é um número real, como consequência de  ser hermı́tico; b) se o espectro de  for discreto os resultados possı́veis da medição de A estão quantificados. Quarto Postulado A previsão do resultado da medição de A é de natureza probabilı́stica. Se A for medida num sistema descrito por um estado normalizado |Ψi, temos as seguintes possibilidades para a probabilidade de obter um dado valor: • Se  tem um espectro discreto {an }, a probabilidade de obter um dado valor próprio an é P(an ) = gn X i=1 |huin |Ψi|2 , (4.3.2) onde gn é o grau de degenerescência do valor próprio an e {|uin i}, i = 1...gn é uma base ortonormada do subespaço de vectores próprios associados a an ; • Se  tem um espectro contı́nuo {a(α)}, a probabilidade dP(α) de obter um resultado entre α e α + dα é dP(α) = |huα |Ψi|2dα , (4.3.3) onde |uαi é o vector próprio de  associado ao valor próprio a(α). Note-se que para este postulado ser coerente, a soma da probabilidade de todos os resultados possı́veis tem de ser 1. Este é o caso se  for uma observável. De facto, tomando como exemplo simples o caso de um espectro discreto não degenerado, X n P(an ) = X n |hun |Ψi|2  é observável = XX m n |hun |umicm |2 = X m |cm |2 = 1 , (4.3.4) 118 Formalismo Matemático e Postulados da Mecânica Quântica pois hΨ|Ψi = 1 por hipótese. Logo, a condição de  ser observável garante que hΨ|Ψi = 1  é Observável X ⇒ todos os valores próprios P(valor próprio) = 1 . (4.3.5) Note-se também que poderı́amos considerar casos mais complicados, como espectros contı́nuos degenerados ou espectros parcialmente contı́nuos e parcialmente discretos. Quinto Postulado - Colapso da função de onda Se a medição de uma grandeza fı́sica A no sistema no estado |Ψi dá resultado: • (caso discreto) an , o sistema imediatamente depois da medida encontra-se no estado descrito pela projecção normalizada de |Ψi para o subespaço associado a an |Ψi medida dá an −→ onde gn X P̂n = i=1 P̂n |Ψi q , hΨ|P̂n |Ψi (4.3.6) |uin ihuin | ; (4.3.7) • (caso contı́nuo) α0 com incerteza ∆α, o sistema imediatamente depois da medida encontrase no estado descrito pela projecção medida dá α0 |Ψi P̂∆α (α0 )|Ψi incerteza ∆α −→ q onde P̂∆α (α0 ) = Z , (4.3.8) hΨ|P̂∆α(α0 )|Ψi α0 +∆α/2 α0 −∆α/2 dα|uαihuα| . (4.3.9) Note-se que a evolução normal do sistema poderá retira-lo deste estado próprio de Â, caso este operador não comute com o operador Hamiltoniano. iii) Sabendo o estado inicial em t0 , como calcular o estado num instante posterior t? Sexto Postulado A evolução temporal do estado do sistema |Ψ(t)i é descrita pela equação de Schrödinger i~ d |Ψ(t)i = Ĥ(t)|Ψ(t)i , dt (4.3.10) 4.4 Quantificação 119 onde Ĥ(t) é o operador Hamiltoniano que é a observável associada com a energia total do sistema. 4.4 Quantificação O princı́pio da incerteza de Heisenberg ficou, aparentemente, de fora nos postulados da secção anterior. Por outro lado, o segundo postulado associa a uma grandeza mensurável A um operador Â, que não especificamos como construir. Vamos agora estabelecer como é que associamos às variáveis fı́sicas mensuráveis operadores e como é que incorporamos nesses operadores o princı́pio da incerteza. 4.4.1 Variáveis compatı́veis, incompatı́veis e C.C.O.C. Duas grandezas mensuráveis A e B dizem-se compatı́veis se os operadores que lhes estão associados  e B̂ comutam. Também se usa o termo compatı́veis para as próprias observáveis. Significado matemático de compatibilidade: Teorema: A compatibilidade de duas observáveis é equivalente a possuirem um sistema ortonormado completo e comum de funções próprias, isto é, uma base própria comum. Estas observáveis são ditas simultaneamente diagonalizáveis. Demonstração: Aqui tomamos somente o caso mais simples em que  e B̂ têm espectro discreto não degenerado com valores próprios, respectivamente, {an } e {bn }. i) (⇐) Utilizemos estes valores próprios como rótulos do conjunto ortonormado e completo de vectores próprios comum a  e B̂ denotado {|an , bm i}: Â|an , bm i = an |an , bm i , B̂|an , bm i = bm |an , bm i . (4.4.1) Logo B̂  − ÂB̂ |an , bm i = 0 , (4.4.2) de onde concluimos, devido aos |an , bm i formarem uma base do espaço de estados, que h i Â, B̂ = 0. 120 Formalismo Matemático e Postulados da Mecânica Quântica ii) (⇒) Consideramos duas variáveis compatı́veis, que portanto têm operadores associados  e B̂ que comutam. Consideremos um conjunto completo de vectores próprios de Â, {|an i}, Â|an i = an |an i . O vector B̂|an i é também vector próprio de  com valor próprio an ; de facto [Â,B̂]=0  B̂|an i = B̂ Â|an i = an B̂|an i . (4.4.3) (4.4.4) Mas como assumimos que o espectro é não degenerado, todos os vectores próprios associados a um valor próprio são colineares. Logo B̂|an i = b|an i , (4.4.5) o que mostra que os vectores próprios de  são também vectores próprios de B̂ e como tal que existe um conjunto completo de vectores próprios comum a  e B̂. (q.e.d.) Corolário: Se o Hamiltoniano Ĥ comuta com um operador Ô então existe uma base de estados estacionários cujos elementos são também estados próprios de Ô. Note, no entanto, que se o espectro de Ĥ for degenerado poderá ser possı́vel construir estados estacionários que não são estados próprios de Ô. Nota: o facto de não existir uma base própria comum a duas observáveis não significa que não exista nenhum vector próprio comum. Obviamente, duas grandezas mensuráveis A e B dizem-se incompatı́veis se os operadores que lhes estão associados  e B̂ não comutam (os operadores também são ditos incompatı́veis). Significado fı́sico da incompatibilidade: Teorema: A incompatibilidade de duas grandezas fı́sicas implica a impossibilidade de determinar ambas as grandezas com precisão arbitrária. Demonstração: Assumimos que os operadores  e B̂ associados às nossas grandezas fı́sicas A e B não comutam: h i Â, B̂ = ia1̂ , a ∈ R+ . (4.4.6) 4.4 Quantificação 121 Estas grandezas têm associadas funções de distribuição de probabilidade. Podemos por isso associar-lhes um valor esperado, uma variância e um desvio padrão. Pretendemos demonstrar que o produto dos desvios padrão tem um ı́nfimo. Se o espectro de  e B̂ for dado por {an } e {bn }, os valores esperados das grandezas A e B serão dados por hAi = X n P(an )an , hBi = X ∆B = p P(bn )bn , (4.4.7) h(B − hBi)2 i . (4.4.8) n onde P(an ) = |han |Ψi|2 e os desvios padrão ∆A = p h(A − hAi)2i , Primeiro, notamos como expressar hAi na notação de Dirac: hAi = X n han |Ψi∗han |Ψian = X n hΨ|an ihan |Ψian = X n hΨ|Â|an ihan |Ψi = hΨ|Â|Ψi ≡ hÂi . (4.4.9) Observe a notação. No fim da linha denotamos o valor esperado de um operador num determinado estado de uma maneira análoga ao valor esperado (ou médio) estatı́stico que aparece no inı́cio da linha. Segundo, definimos as observáveis α̂, β̂ do seguinte modo α̂ =  − hÂi1̂ , β̂ = B̂ − hB̂i1̂ , (4.4.10) que são observáveis com a mesma relação de comutação que  e B̂, [α̂, β̂] = ia1̂, correspondentes a grandezas fı́sicas, α, β, com o mesmo desvio padrão de A, B mas valor esperado zero. Logo (4.4.8) fica neste caso (∆α)2 = hα2 i, (∆β)2 = hβ 2 i , (4.4.11) (∆β)2 = hΨ|β̂ 2|Ψi , (4.4.12) ou, na notação de Dirac (∆α)2 = hΨ|α̂2|Ψi, ou ainda, definindo |Ψ1 i = α̂|Ψi e |Ψ2 i = β̂|Ψi (∆α)2 = hΨ1 |Ψ1 i, (∆β)2 = hΨ2 |Ψ2 i . (4.4.13) 122 Formalismo Matemático e Postulados da Mecânica Quântica Terceiro usamos a desigualdade de Schwarz (4.1.12) (∆α∆β)2 = hΨ1 |Ψ1 ihΨ2 |Ψ2 i (4.1.12) ≥ hΨ1 |Ψ2 ihΨ2|Ψ1 i = hΨ|α̂β̂|ΨihΨ|β̂ α̂|Ψi . (4.4.14) Notemos que embora α̂ e β̂ sejam hermı́ticos, o seu produto α̂β̂ não é hermı́tico, pois eles não comutam. Assim † x + iy ≡ hΨ|α̂β̂|Ψi = hΨ| α̂β̂ |Ψi∗ = hΨ|β̂ α̂|Ψi∗ ⇒ hΨ|β̂ α̂|Ψi ≡ x − iy . (4.4.15) Logo reescrevemos (4.4.14) como (∆α∆β)2 ≥ x2 + y 2 ≥ y 2 = − 2 h i 2 a2 1 1 hΨ|α̂β̂|Ψi − hΨ|β̂ α̂|Ψi = − hΨ| α̂, β̂ |Ψi = . 4 4 4 (4.4.16) Finalmente concluimos então que ∆α∆β ≥ a 2 ⇔ ∆A∆B ≥ a , 2 (4.4.17) o que mostra que não podemos determinar as duas grandezas simultaneamente com precisão arbitrária. (q.e.d.) Tendo compreendido que um conjunto de variáveis compatı́veis corresponde a um conjunto de observáveis que comutam e portanto têm uma base própria comum, introduzimos a seguinte definição Definição: Um conjunto de observáveis, Â, B̂, Ĉ . . ., diz-se um Conjunto Completo de Observáveis que Comutam (C.C.O.C) se: i) Todos os pares de observáveis comutarem; ii) Especificando o valor próprio de todas as observáveis determina um único vector próprio (normalizado); iii) Ao retirarmos uma qualquer observável, ii) deixa de ser obedecido, ou seja, o conjunto é minimal. 4.4 Quantificação 123 A base para o espaço de estados de um sistema fı́sico é escolhida como o conjunto de vectores próprios de um C.C.O.C, sendo estes vectores rotulados pelos valores próprios do C.C.O.C. |an , bn , cn , . . .i , (4.4.18) onde {an }, {bn }, {cn }, . . ., são os espectros de Â, B̂, Ĉ . . .. Note-se que para um dado sistema fı́sico existem, em geral, vários C.C.O.C. 4.4.2 Os operadores X̂ e P̂ O exemplo canónico de variáveis incompatı́veis são as grandezas fı́sicas momento e posição. Associando a estas grandezas fı́sicas as observáveis X̂ e P̂ e comparando (4.4.17) com (2.3.6) identificamos a = ~ e usando em (4.4.6) temos que a relação de comutação h i X̂, P̂ = i~1̂ , (4.4.19) reproduz a relação de incerteza de Heisenberg. Ou seja (4.4.19) é a expressão do princı́pio da incerteza de Heisenberg em termos das observáveis X̂ e P̂ . Se tivéssemos várias componentes de posição e momento, X̂ k e P̂j terı́amos h i X̂ k , P̂j = i~δjk 1 , h i h i X̂ k , X̂ j = 0 = P̂k , P̂j , (4.4.20) que são denominadas relações de comutação canónicas. Deste modo, não podemos escolher uma base de funções próprias comum a X̂ e P̂ , pelo que temos duas importantes alternativas para a escolha de base de um sistema fı́sico:7 • Representação |~xi: Expandimos o estado do sistema fı́sico na base de funções próprias do operador X̂. Esta base foi estudada no final da secção 4.1.2 e corresponde a tomar os vectores da base como deltas de Dirac, ou, na notação de Dirac δ(~x − ~x0 ) → |~x0 i ; 7 Note-se que os kets que vamos usar |~x0 i e |~ pi são kets generalizados. (4.4.21) 124 Formalismo Matemático e Postulados da Mecânica Quântica • Representação |~pi: Expandimos o estado do sistema fı́sico na base de funções próprias do operador P̂ . Tomamos os vectores da base como ondas planas, ou, na notação de Dirac 1 ei~p·~x/~ → |~pi . (2π~)n/2 (4.4.22) Para estas ‘bases’ a tabela da secção 4.2.5 fica Representação |~pi Z |Ψi = d~p Ψ̃(~p)|~pi Expansão da Função de Onda h~p|~p ′ i = δ(~p − ~p ′ ) Relação de Ortonormalização Projecção da Função de Onda Produto escalar em componentes Relação de Fecho Representação |~xi Z |Ψi = d~x0 Ψ(~x0 )|~x0 i h~x0 |~x0 ′ i = δ(~x0 − ~x0 ′ ) h~p|Ψi = Ψ̃(~p) h~x0 |Ψi = Ψ(~x0 ) R R hΦ|Ψi = d~pΦ̃∗ (~p)Ψ̃(~p) hΦ|Ψi = d~x0 Φ∗ (~x0 )Ψ(x~0 ) R R d~p|~pih~p| = 1̂ d~x0 |~x0 ih~x0 | = 1̂ Assim, podemos reinterpretar a função de onda no espaço de configurações Ψ(~x) e a sua transformada de Fourier Ψ̃(~p) como os coeficientes da expansão do estado do sistema na representação |~xi e |~pi respectivamente. Notemos que h~x0 |~p0 i = Z d~xδ(~x − ~x0 ) 1 1 i~ p0 ·~ x/~ e = ei~p0 ·~x0 /~ . (2π~)n/2 (2π~)n/2 (4.4.23) Para simplificar a notação trabalharemos a partir de agora em uma só dimensão. A acção do operador X̂ na representação |xi e do operador P̂ na representação |pi é X̂|xi = x|xi , P̂ |pi = p|pi . (4.4.24) Uma questão natural é a seguinte: Qual a acção do operador P̂ na representação |xi e do operador X̂ na representação |pi? Para obter a resposta consideramos o ket P̂ |Ψi projectado na representação |xi: Z Z 1 dpeipx/~pΨ̃(p) hx|P̂ |Ψi = dphx|pihp|P̂ |Ψi = √ 2π~ Z . 1 d d d ipx/~ =√ dpe Ψ̃(p) = −i~ Ψ(x) = −i~ hx|Ψi −i~ dx dx dx 2π~ (4.4.25) 4.4 Quantificação 125 Portanto, na representação |xi o operador P̂ coincide com o operador diferencial −i~d/dx, que é hermı́tico, como vimos na secção 4.1.3. Um elemento de matriz fica Z Z d ′ ′ ′ ′ ∗ hx|x′ ihx′ |Ψi hΦ|P̂ |Ψi = dxdx hΦ|xihx|P̂ |x ihx |Ψi = dxdx Φ(x) −i~ dx . Z Z Z d d ∗ ′ ′ ′ ∗ = dxΦ(x) −i~ hx| dx |x ihx | |Ψi = dxΦ(x) −i~ Ψ(x) dx dx (4.4.26) Podemos ainda verificar a consistência desta representação do operador P̂ com (4.4.19); consideremos h i hx| X̂, P̂ |Ψi = hx|X̂ P̂ − P̂ X̂|Ψi , (4.4.27) e se nos situarmos na representação |xi temos d = hx|X̂ P̂ |Ψi − hx|P̂ X̂|Ψi = xhx|P̂ |Ψi + i~ hx|X̂|Ψi dx d d = x −i~ hx|Ψi + i~ (xhx|Ψi) = i~hx|Ψi dx dx ou, como |Ψi é arbitrário, em concordância com (4.4.19). h i X̂, P̂ = i~1 , , (4.4.28) (4.4.29) De um modo análogo podemos concluir que o operador X̂ na representação |pi toma a forma do operador diferencial i~d/dp. Notemos que qualquer variável ou equação dinâmica pode ser expressa tanto na representação |xi como |pi. Assim, a equação de Schrödinger, que é usualmente escrita na representação |xi, ~2 ∂Ψ(x, t) = − ∆ + V (x, t) Ψ(x, t) , i~ ∂t 2m (4.4.30) pode ser vista como resultando da relação de energia E= p2 + V (x, t) , 2m (4.4.31) por substituição de E → i~ ∂ , ∂t p~ → −i~∇ , (4.4.32) 126 Formalismo Matemático e Postulados da Mecânica Quântica o que significa o uso da representação |xi. Por contraste, na representação |pi farı́amos a substituição E → i~ ∂ , ∂t ~x → i~∇p , (4.4.33) o que nos leva à equação de Schrödinger na representação |pi 2 ∂ Ψ̃(p, t) p i~ = + V (i~∇p , t) Ψ̃(p, t) . ∂t 2m (4.4.34) Claro que esta equação não é mais do que a representação de (4.4.30) no espaço de Fourier. Concluimos com a observação de que tanto X̂ como P̂ são observáveis (a hermiticidade foi demonstrada na secção 4.1.3) e que para o problema de uma partı́cula sem spin a mover-se livremente no espaço de posições vários C.C.O.C. são {X̂, Ŷ , Ẑ} , 4.4.3 {P̂x , P̂y , P̂z } , {X̂, P̂y , P̂z } , . . . (4.4.35) Regras de Quantificação canónica Consideremos um sistema clássico de uma partı́cula, descrito pelo ‘estado clássico’ {q(t), p(t)}. A quantificação deste sistema é feita do seguinte modo: i) O estado do sistema passa a ser interpretado como um vector |Ψi em E; ii) Uma grandeza fı́sica mensurável, A(q, p, t) passa a ser um operador A(q, p, t) → Â(X̂, P̂ , t) , (4.4.36) onde, quando houver ambiguidade de ordem entre X̂ e P̂ a expressão deve ser simetrizada, o que garante a hermiticiadade do operador; iii) Impõem-se relações de comutação canónicas (em coordenadas cartesianas) entre a observável associada à posição, X̂, e a observável associada ao seu momento canónico conjugado, P̂ . Exemplos: 4.4 Quantificação 127 • A quantidade fı́sica qp tem associado o operador 1 (X̂ P̂ + P̂ X̂) , 2 (4.4.37) que contem a simetrização necessária para evitar ambiguidades de ordem e garante a hermiticidade necessária para ser observável; • O momento angular ~ = ~x × p~ = (ypz − zpy , zpx − xpz , xpy − ypx ) , L (4.4.38) tem operador associado ~ L̂ = (L̂x , L̂y , L̂z ) = (Ŷ P̂z − Ẑ P̂y , Ẑ P̂x − X̂ P̂z , X̂ P̂y − Ŷ P̂x ) . (4.4.39) Usando as relações de comutação canónicas obtemos [L̂x , L̂y ] = i~L̂z , [L̂y , L̂z ] = i~L̂x , [L̂z , L̂x ] = i~L̂y , (4.4.40) que são as relações de comutação para o momento angular. • Consideremos um sistema descrito pelo Lagrangiano 1 L = mq̇ 2 − V (q) 2 p=mq̇ ⇒ H= p2 + V (q) . 2m (4.4.41) Quantificando, temos o operador Hamiltoniano Ĥ = P̂ 2 + V (X̂) , 2m (4.4.42) e as relações de comutação canónicas são h i X̂, P̂ = i~1 ; (4.4.43) • Consideremos uma partı́cula sob a influência de um campo electromagnético 2 1 ~ ~x)−qφ(t, ~x) L = m~x˙ +q~x˙ ·A(t, 2 ~ p ~=m~ x˙ +q A ⇒ H= ~ ~x))2 (~p − q A(t, +qφ(t, ~x) . (4.4.44) 2m 128 Formalismo Matemático e Postulados da Mecânica Quântica Quantificando, temos o operador Hamiltoniano Ĥ = ~ ~ ~ (P̂ − q Â(t, X̂))2 ~ + q φ̂(t, X̂) , 2m (4.4.45) e as relações de comutação canónicas [X̂ j , P̂k ] = i~δkj 1 . (4.4.46) No capı́tulo 5 estudaremos detalhadamente a quantificação canónica do oscilador harmónico e do problema de Larmor. Em conclusão notamos que este método de quantificação não pode ser aplicado a variáveis que não tenham análogo clássico. O exemplo óbvio é o spin, que tem de ser definido directamente pelo operador associado. 4.4.4 Comentários sobre a evolução de um sistema quântico A evolução de um sistema quântico é dada pela equação de Schrödinger i~ d|Ψ(t)i = Ĥ|Ψ(t)i . dt (4.4.47) Vamos discutir algumas propriedades desta equação: i) Determinista: dado o estado inicial |Ψ(t0 )i, o estado final |Ψ(t)i está totalmente determinado; o indeterminismo na mecânica quântica surge na altura da medição devido ao colapso da função de onda; ii) Linearidade, que é equivalente ao princı́pio de sobreposição; iii) Conservação da probabilidade, isto é hΨ(t)|Ψ(t)i é constante na evolução devido à hermiticidade do operador Hamiltoniano: d d d hΨ(t)|Ψ(t)i = hΨ(t)| |Ψ(t)i + hΨ(t)| |Ψ(t)i , dt dt dt (4.4.48) mas, pela equação de Schrödinger d|Ψ(t)i 1 = Ĥ|Ψ(t)i dt i~ ⇔ dhΨ(t)| 1 = − hΨ(t)|Ĥ . dt i~ (4.4.49) Logo, (4.4.48) fica igual a zero, o que mostra que a norma da função de onda é conservada. 4.4 Quantificação 129 Claro que na evolução do sistema poderá haver variações locais da densidade de probabilidade. Assumindo que a função de onda está normalizada, Z Z P(~x, t)d~x = Ψ(~x, t)∗ Ψ(~x, t)d~x , V (4.4.50) V representa a probabilidade de a partı́cula estar num determinado volume V . Assim Z Z ∂ ∂ d ∗ ∗ P(~x, t)d~x = Ψ(~x, t) Ψ(~x, t) + Ψ(~x, t) Ψ(~x, t) d~x , (4.4.51) dt V ∂t ∂t V ou, usando a equação de Schrödinger Z Z i~ ∗ ∗ = [−Ψ(~x, t)∆Ψ(~x, t) + Ψ(~x, t) ∆Ψ(~x, t)] d~x = − ∇ · J~(~x, t)d~x , 2m V V (4.4.52) onde definimos o vector densidade de corrente de probabilidade ~ x, t) = i~ [Ψ(~x, t)∇Ψ(~x, t)∗ − Ψ(~x, t)∗ ∇Ψ(~x, t)] . J(~ 2m (4.4.53) Assim temos Z V ∂ P(~x, t)d~x + ∂t ou, como o volume é arbitrário Z V ~ x, t)d~x = 0 , ∇ · J(~ ∂ ~ x, t) = 0 , P(~x, t) + ∇ · J(~ ∂t (4.4.54) (4.4.55) que é uma equação de continuidade para a probabilidade. 4.4.5 Evolução do valor médio de uma variável Para um dado instante t, o valor médio de uma grandeza fı́sica A é dado por (4.4.9) hÂi(t) = hΨ(t)|Â|Ψ(t)i . (4.4.56) Diferenciando d hÂi(t) = dt ∂  ∂ ∂ hΨ(t)| Â|Ψ(t)i + hΨ(t)| |Ψ(t)i + hΨ(t)| |Ψ(t)i , ∂t ∂t ∂t (4.4.57) ou, usando a equação de Schrödinger = ∂  1 hΨ(t)|ÂĤ − Ĥ Â|Ψ(t)i + h i(t) , i~ ∂t (4.4.58) 130 Formalismo Matemático e Postulados da Mecânica Quântica de onde concluimos que i ∂  1 h d hÂi(t) = h i(t) + h Â, Ĥ i(t) . dt ∂t i~ (4.4.59) Logo, a dinâmica do valor médio é a mesma da mecânica clássica (1.3.28). Tal como em mecânica clássica, se a observável  não depender explicitamente do tempo e comutar com o Hamiltoniano, o seu valor médio é uma constante do movimento. Note-se que os parêntesis de Poisson desempenham o papel de comutador clássico. Uma aplicação particular de (4.4.59) é aos operadores X̂ e P̂ para um sistema com Hamiltoniano (4.4.42); aplicando a X̂ obtemos # " i i P̂ d 1 h hP̂ i 1 P̂ 2 P̂ h i = h X̂, P̂ X̂, P̂ i = hX̂i = h X̂, + , dt i~ 2m i~ 2m 2m m enquanto que notando que h i série T aylor P̂ , V̂ (X̂) = [P̂ , V0 1̂ + V1 X̂ + V2 X̂ 2 + V3 X̂ 3 + . . .] dV̂ (X̂) 2 = −i~ V1 − 2V2 X̂ − 3V3 X̂ − . . . = −i~ dX̂ (4.4.60) , (4.4.61) e aplicando a P̂ obtemos i d 1 h 1 dV̂ (X̂) dV̂ (X̂) hP̂ i = h P̂ , V̂ (X̂) i = h−i~ i = −h i, dt i~ i~ dX̂ dX̂ (4.4.62) que reproduzem as fórmulas clássicas p dx = , dt m dp dV (x) =− . dt dx (4.4.63) Estes resultados demonstram o teorema de Ehrenfest: “As equações de evolução dos valores médios de um sistema quântico são formalmente idênticas às da mecânica clássica.” Como tal, se os valores médios de observáveis derem uma boa descrição da fı́sica de um sistema, a mecânica clássica fornece uma descrição satisfatória, que é o conteúdo do princı́pio da correspondência. Por exemplo, a mecânica clássica só ‘vê’ a posição do centro do trem de ondas; se a dispersão do mesmo for irreconhecı́vel nas experiências levadas a cabo, a descrição da mecânica clássica será satisfatória. 4.5 Mecânica Quântica Estatı́stica 4.5 131 Mecânica Quântica Estatı́stica O formalismo que desenvolvemos até ao momento consegue apenas fazer previsões probabilı́sticas relativamente aos resultados possı́veis em medições de um sistema quântico. Contudo, este formalismo baseia-se em saber exactamente o estado quântico do sistema, |Ψi, o que temos sempre assumido. Podemos, no entanto, imaginar situações em que temos uma informação incompleta acerca do estado do sistema. Por exemplo, a energia cinética de átomos emitidos por uma fornalha à temperatura T é conhecida apenas probabilisticamente, mesmo em mecânica clássica. De facto, tal como em Mecânica Clássica Estatı́stica sabemos, por exemplo, a energia de uma partı́cula num sistema em equilı́brio térmico apenas probabilisticamente através da distribuição de Boltzmann P(E) ∼ e−E/KB T , (4.5.1) em Mecânica Quântica Estatı́stica saberemos o estado em que uma partı́cula se encontra apenas probabilisticamente. Existe uma mistura estatı́stica de estados, ou estado mistura. Por oposição, um estado quântico perfeitamente conhecido é designado por estado puro. Para compreender as alterações introduzidas se considerarmos uma mistura estatı́stica de estados consideremos o seguinte exemplo. O nosso sistema quântico encontra-se no estado mistura descrito por |Ψi = a1 |αi + a2 |βi com probabilidade p1 , (4.5.2) ′ |Ψ i = a3 |αi + a4 |βi com probabilidade p2 onde cada estado está normalizado |a1 |2 + |a2 |2 = 1 , |a3 |2 + |a4 |2 = 1 , (4.5.3) e p1 + p2 = 1. Uma pergunta natural é: “Qual a probabilidade de obter o valor próprio associado a |αi ou |βi numa medição?” A resposta natural é P(α) = p1 |a1 |2 + p2 |a3 |2 , P(β) = p1 |a2 |2 + p2 |a4 |2 , (4.5.4) o que implica que P(α) + P(β) = 1 . (4.5.5) 132 Formalismo Matemático e Postulados da Mecânica Quântica Note-se que esta resposta não é equivalente a considerar o novo estado |Ψ̃i = √ p1 |Ψi + √ √ √ √ √ p2 |Ψ′ i = ( p1 a1 + p2 a3 ) |αi + ( p1 a2 + p2 a4 ) |βi , (4.5.6) que, pelos postulados usuais implicaria que √ p1 |a1 |2 + p2 |a3 |2 + p1 p2 (a1 a∗3 + a∗1 a3 ) . P(α) = √ p1 p2 (a1 a∗3 + a∗1 a3 + a2 a∗4 + a4 a∗2 ) + 1 (4.5.7) Neste caso existem termos de interferência, que não estão presentes na mistura estatı́stica de estados. Com este exemplo concluimos os seguintes dois factos: • Uma mistura estatı́stica de estados quânticos |Ψ1 i . . . |Ψn i não pode ser expressa como uma combinação linear destes estados quânticos |Ψi = 6 n X i=1 χi |Ψi i , (4.5.8) pois nesta combinação linear existiriam sempre termos de interferência entre os vários estados |Ψi i no cálculo de probabilidades, termos que não estão presentes nas probabilidades da mistura estatı́stica. Mais concretamente, uma sobreposição linear de estados puros |Ψi = λ1 |Ψ1 i + λ2 |Ψ2 i , (4.5.9) que é ainda um estado puro, tem um significado fı́sico diferente de uma mistura estatı́stica de |λ1 |2 sistemas no estado |Ψ1 i com |λ2 |2 sistemas no estado |Ψ2 i, que é um estado mistura. • Na mecânica quântica estatı́stica existem dois nı́veis diferentes onde entra a probabilidade: i) no facto de a informação sobre o estado inicial ser probabilı́stica - semelhante à mecânica clássica estatı́stica; ii) no facto da previsão de resultados de medições ser probabilı́stica - puramente quântico. Vamos agora introduzir um operador, denominado operador de densidade que unifica a descrição de estados puros e estados mistura. 4.5 Mecânica Quântica Estatı́stica 4.5.1 133 O operador de densidade para um estado puro Assumimos que temos um espaço de estados com uma base discreta, {|un i}, de modo que um estado puro normalizado se escreve X |Ψ(t)i = cn (t)|un i , n X n |cn (t)|2 = 1 . (4.5.10) Introduzimos agora um operador construı́do com base no estado do sistema e que contem a mesma informação que este: o operador densidade definido por ρ̂(t) ≡ |Ψ(t)ihΨ(t)| . (4.5.11) Note-se que este operador depende do tempo. Consideremos algumas propriedades de ρ̂(t): • Na base {|un i}, o operador de densidade é representado pela matriz de densidade: ρmn (t) = hum |ρ̂(t)|un i = hum |Ψ(t)ihΨ(t)|uni = cm (t)c∗n (t) . (4.5.12) • A condição de normalização do estado quântico em termos do operador de densidade fica 1 = hΨ(t)|Ψ(t)i = ou seja X n |cn |2 = X ρnn (t) = Tr(ρ̂(t)) , (4.5.13) n Tr(ρ̂(t)) = 1 . • O valor médio de uma observável é hÂi(t) = hΨ(t)|Â|Ψ(t)i = = X n,p ou seja cp (t)c∗n (t)Anp X n,p = hΨ(t)|un ihun |Â|up ihup |Ψ(t)i X (4.5.14) , (4.5.15) Anp ρpn (t) = Tr(Âρ̂(t)) n,p hÂi(t) = Tr(Âρ̂(t)) = Tr(ρ̂(t)Â) . • A evolução do operador de densidade é deduzida da equação de Schrödinger (4.5.16) 1 d d 1 d ρ̂(t) = (|Ψ(t)i) hΨ(t)| + |Ψ(t)i (hΨ(t)|) = Ĥ|Ψ(t)ihΨ(t)| − |Ψ(t)ihΨ(t)|Ĥ dt dt dt i~ i~ i 1 h Ĥ, ρ(t) . = i~ (4.5.17) 134 Formalismo Matemático e Postulados da Mecânica Quântica • A probabilidade de obter o valor próprio associado ao estado |un i, an , numa medição é: P(an ) = hΨ(t)|un ihun |Ψ(t)i = hΨ(t)|P̂n |Ψ(t)i = Tr(ρ̂(t)P̂n ) , (4.5.18) onde P̂n = |un ihun | é o operador de projecção (4.3.7). • Pela definição ρ̂(t) é hermı́tico ρ̂(t) = ρ̂(t)† . (4.5.19) • ρ̂(t) é um operador de projecção ρ̂(t)2 = |Ψ(t)ihΨ(t)|Ψ(t)ihΨ(t)| = |Ψ(t)ihΨ(t)| = ρ̂(t) . • Logo (4.5.20) Tr(ρ̂(t)2 ) = Tr(ρ̂(t)) = 1 . (4.5.21) Esta propriedade e a anterior só são válidas para um estado puro. Veremos que não se verificam para uma mistura estatı́stica de estados e por isso podem funcionar para testar se uma determinada matriz de densidade descreve um estado puro ou um estado mistura. Assim, para um estado puro, especificar o operador de densidade ou o próprio estado é equivalente. 4.5.2 O operador de densidade para uma mistura estatı́stica de estados Consideremos agora uma mistura estatı́stica de estados ( ) X i i |Ψ i = cn (t)|un i com probabilidades n Definimos o operador de densidade como X X ρ̂(t) ≡ pi |Ψi (t)ihΨi (t)| ≡ pi ρ̂i (t) . i i p . (4.5.22) (4.5.23) i Claramente (4.5.11) é o caso particular correspondente a p1 = 1 e pi = 0 quando i 6= 1, ou seja um estado puro. Reconsideremos agora as propriedades do operador de densidade vistas anteriormente: 4.5 Mecânica Quântica Estatı́stica 135 • Na base {|un i}, o operador de densidade é representado pela matriz de densidade, que agora toma a forma: ρmn (t) = hum|ρ̂(t)|un i = hum| X i pi |Ψi (t)ihΨi (t)|un i = X pi ρimn (t) = i X pi cim (t)cin (t)∗ . i (4.5.24) Note-se que para n = m ρnn (t) = X i pi |cin (t)|2 , (4.5.25) que é um número real positivo que nos dá a probabilidade de encontrarmos numa medição o sistema no estado |un i, como demonstrará a relação (4.5.30). Assim, os termos da diagonal da matriz de densidade designam-se por populações. Para n 6= m, ρnm é um número complexo. Representa uma média (para todos os estados |Ψi i) de termos de interferência entre |uin i e |uim i. Estes termos são designados por coerências. • A condição de normalização dos vários estados quânticos na mistura fica, em termos do operador de densidade 1 = hΨi (t)|Ψi (t)i = X n |cin |2 = X ρinn (t) = Tr(ρ̂i (t)) ; (4.5.26) n logo 1= X pi = i X pi Tr(ρ̂i (t)) = Tr(ρ̂(t)) . (4.5.27) i Ou seja temos ainda a condição (4.5.14). • O valor médio de uma observável é hÂi(t) = X n an X i i i p P (an ) ! = X i pi X n an P i (an ) = = Tr(ρ̂(t)Â) , X pi Tr(ρ̂i (t)Â) i (4.5.28) que é ainda o mesmo resultado do caso puro (4.5.16). • A evolução do operador de densidade é ainda dada pela equação do caso puro i d 1 h Ĥ, ρ(t) . (4.5.29) ρ̂(t) = dt i~ 136 Formalismo Matemático e Postulados da Mecânica Quântica • A probabilidade de obter o valor próprio associado ao estado |un i, an , numa medição é: P(an ) = X i pi P i (an ) = X pi Tr(ρ̂i (t)P̂n ) = Tr(ρ̂(t)P̂n ) , (4.5.30) i recuperando o resultado do estado puro. • Obviamente ρ̂(t) é ainda hermı́tico • Em geral ρ̂(t) não é um operador de projecção: ρ̂(t)2 = X i,j pi pj |Ψi(t)ihΨi (t)|Ψj (t)ihΨj (t)| = 6 ρ̂(t) . (4.5.31) • Assim sendo calculemos o traço do quadrado de ρ̂(t): Tr(ρ̂(t)2 ) = X n,m = X pi pj i,j X hun |ρ̂(t)|um ihum|ρ̂(t)|un i = cjn (t)∗ cin (t) X cim (t)∗ cjm (t) = X m n ≤ X pp = i,j X i p i X cin (t)cim (t)∗ cjm (t)cjn (t)∗ n,m i,j X i,j i j pi pj pi pj hΨj (t)|Ψi (t)ihΨi (t)|Ψj (t)i X pj = 1 , j (4.5.32) onde usamos a desigualdade de Schwarz |hΨi (t)|Ψj (t)i| ≤ p hΨi (t)|Ψi (t)ihΨj (t)|Ψj (t)i = 1 . (4.5.33) Deste modo Tr(ρ̂(t)2 ) ≤ 1 , (4.5.34) sendo a desigualdade saturada apenas para um estado puro. Vemos, tal como anunciado, que esta propriedade e a anterior distinguem a matriz de densidade de um estado puro e de um estado mistura. • Notemos ainda que o operador densidade é definido positivo; para um ket arbitrário |Φi hΦ|ρ̂(t)|Φi = X i pi hΦ|Ψi (t)ihΨi(t)|Φi = X i pi |hΦ|Ψi (t)i|2 ≥ 0 . (4.5.35) 4.5 Mecânica Quântica Estatı́stica 4.5.3 137 O operador de evolução e a evolução de um estado puro Devido à linearidade e homogeneidade da equação de Schrödinger, existe um operador linear, denominado operador de evolução que relaciona o estado inicial de um sistema |Ψ(t0 )i com o estado do sistema num instante posterior |Ψ(t)i, através de |Ψ(t)i = Û (t, t0 )|Ψ(t0 )i . (4.5.36) Û (t0 , t0 ) = 1̂ . (4.5.37) Obviamente Substituindo na equação de Schrödinger i~ d|Ψ(t)i = Ĥ(t)|Ψ(t)i ⇔ dt dÛ(t0 , t) i |Ψ(t0 )i = − Ĥ(t)Û (t0 , t)|Ψ(t0 )i . dt ~ (4.5.38) Em geral, usando a condição inicial (4.5.37), podemos escrever formalmente a solução desta equação como i Û (t, t0 ) = 1̂ − ~ Z t Ĥ(t′ )Û (t′ , t0 )dt′ . (4.5.39) t0 No caso particular de um Hamiltoniano não depender do tempo (sistemas conservativos) a solução explı́cita fica Û(t, t0 ) = e−i(t−t0 )Ĥ/~ . (4.5.40) Uma importante propriedade da evolução de um sistema quântico é a conservação da norma ou equivalentemente, a conservação da probabilidade. Logo requeremos que hΨ(t0 )|Ψ(t0 )i = hΨ(t)|Ψ(t)i ⇔ hΨ(t0 )|Ψ(t0 )i = hΨ(t0 )|Û(t0 , t)† Û (t0 , t)|Ψ(t0 )i , (4.5.41) ou seja Û (t0 , t)† Û (t0 , t) = 1̂ , (4.5.42) o operador de evolução deve ser unitário. Note-se que no caso de sistemas conservativos, onde Û tem a forma (4.5.40) isso é garantido se o Hamiltoniano for Hermı́tico. Unitariedade é uma importante propriedade em teorias quânticas. De um modo mais geral significa que as probabilidades estão bem definidas e são conservadas. Tecnicamente, significa que o 138 Formalismo Matemático e Postulados da Mecânica Quântica espaço de Hilbert é positivo definido (não há normas negativas) e o operador de evolução é unitário. Consideremos agora a evolução de um estado puro. A matriz de densidade pode-se escrever ρ̂(t) = |Ψ(t)ihΨ(t)| = Û (t0 , t)|Ψ(t0 )ihΨ(t0 )|Û (t0 , t)† = Û(t0 , t)ρ̂(t0 )Û(t0 , t)† . (4.5.43) Logo, Tr(ρ̂(t)2 ) = Tr(Û(t0 , t)ρ̂(t0 )Û(t0 , t)† Û (t0 , t)ρ̂(t0 )Û (t0 , t)† ) , (4.5.44) ou, usando a unitariedade do operador de evolução e a propriedade cı́clica do traço, Tr(ρ̂(t)2 ) = Tr(ρ̂(t0 )2 ) = 1 , (4.5.45) pela relação (4.5.21). Assim, num sistema quântico unitário um estado puro evolui sempre para um estado puro. Na década de 1970, Stephen Hawking mostrou que existe um processo quântico pelo qual os buracos negros, que classicamente só absorvem, emitem radiação, denominada radiação de Hawking. Esta radiação parecia ser, na aproximação usada por Hawking, térmica, e como tal um estado mistura. Extrapolando o processo de Hawking até o buraco negro desaparecer completamente devido à emissão de radiação, parece que o resultado final seria a existência de apenas radiação térmica e como tal um estado mistura. Por outro lado, o buraco negro poderia ter sido formado pelo colapso gravitacional de estados puros. Hawking concluiu que, em gravitação quântica, a evolução não poderia ser unitária, pois estados puros poderiam evoluir para estados mistura. Esta aparente contradição entre gravitação quântica e um princı́pio fundamental da teoria quântica foi baptizado de ‘paradoxo da informação’. Embora o problema não esteja completamente resolvido, acredita-se hoje, que a unitariedade é também válida em gravitação quântica e a aproximação usada por Hawking não estava correcta. 4.6 Sumário 4.6 139 Sumário Estabelecemos a linguagem da mecânica quântica que é uma linguagem de estados e operadores cuja representação abstracta se faz na notação de Dirac. Em muitos problemas concretos escolhem-se bases discretas para os representar como vectores e matrizes respectivamente. Daı́ a designação deste formalismo por mecânica matricial de Heisenberg. Este formalismo é muito apropriado para lidar com graus de liberdade abstractos que vivem em espaços vectoriais internos, como o spin ou a polarização de fotões como será visto em Mecânica Quântica II. Numa ‘base’ contı́nua como a representação |xi o estado do sistema |Ψ(t)i tem como componentes a função de onda do capı́tulo 3, Ψ(~x, t). Assim o formalismo geral faz o contacto com a mecânica ondulatória de Schrödinger do capı́tulo 3, que como vimos é intuitiva dado usar a bem conhecida fı́sica das ondas. Estabelecemos um conjunto de postulados que podem ser vistos como as regras básicas do formalismo quântico e aprendemos a usar essas regras num sistema clássico através da quantificação deste. Em particular discutimos que a representação matemática do princı́pio da incerteza de Heisenberg no formalismo de operadores aparece na forma de operadores que não comutam. Notamos também que os valores médios das grandezas fı́sicas num sistema quântico se comportam como as grandezas clássicas do capı́tulo 1 estabelecendo um princı́pio de correspondência entre a mecânica quântica e a sua aproximação clássica. Discutimos mecânica quântica estatı́stica em que o estado do sistema só é conhecido probabilisticamente. Isto levou-nos a distinguir estados puros e estados mistura, mas pela introdução da matriz de densidade podem ambos os tipos ser tratados de um modo unificado. Finalmente vimos que uma evolução unitária não pode transformar um estado puro num estado mistura. CAPÍTULO 5 Exemplos de Quantificação Canónica Neste capı́tulo vamos voltar ao problema do oscilador harmónico e ao problema de Larmor tratados no capı́tulo 1, usando as regras do capı́tulo 4 para os tratar como problemas quânticos. 5.1 Oscilador Harmónico Quântico em Uma Dimensão Na secção 4.4.3 vimos a forma do operador Hamiltoniano para um sistema com Hamiltoniano clássico dado por H = Ecin + Epot . Especializando para o potencial do oscilador harmónico, obtemos o operador Hamiltoniano Ĥ = P̂ 2 mω 2 2 X̂ , + 2m 2 (5.1.1) e, usando as regras de quantificação canónica impomos as relações de comutação h i X̂, P̂ = i~1̂ . (5.1.2) Dada a forma do potencial (figura 1.3) naturalmente teremos estados ligados, pelo que esperamos que o conjunto de estados seja discreto, correspondendo ao facto de as energias possı́veis estarem quantificadas. O nosso objectivo é encontrar os valores próprios En e 142 Exemplos de Quantificação Canónica funções próprias |ni da equação de Schrödinger independente do tempo Ĥ|ni = En |ni . (5.1.3) Introduzimos os operadores â e o seu adjunto ↠(note-se que não são operadores hermı́ticos) r r i 1 i mω mω 1 † X̂ + √ X̂ − √ P̂ , â = √ P̂ , (5.1.4) â = √ ~ ~ 2 2 mω~ mω~ que são designados, respectivamente, por operador de destruição e operador de criação. Calculando o seu produto obtemos i 1 mω 2 1 ih † 2 â â = X̂ + P̂ + X̂, P̂ 2 ~ mω~ ~ ⇔ ↠â = 1̂ 1 Ĥ − , ~ω 2 (5.1.5) ou, equivalentemente 1̂ Ĥ = ~ω N̂ + 2 ! . (5.1.6) onde definimos o operador de número N̂ ≡ ↠â, que é hermı́tico, o que é consistente com o facto de o Hamiltoniano também o ser. Note-se que a tradução para os operadores â e ↠da relação de comutação é 1 [â, â ] = −i[X̂, P̂ ] + i[P̂ , X̂] , 2~ (5.1.7) [â, ↠] = 1̂ . (5.1.8) † ou seja Calculemos também os comutadores entre o operador de número N̂ e os operadores de criação e destruição: 5.1.1 [N̂ , â] = [↠â, â] = [↠, â]â + ↠[â, â] = −â , (5.1.9) [N̂ , ↠] = [↠â, ↠] = [↠, ↠]â + ↠[â, ↠] = ↠. (5.1.10) O espectro de energia do Oscilador Harmónico Quântico As grandezas fı́sicas que associamos ao oscilador harmónico são a posição, momento e energia. Como os seus operadores associados X̂, P̂ , Ĥ não comutam, o C.C.O.C. contem 5.1 Oscilador Harmónico Quântico em Uma Dimensão 143 apenas uma destas quantidades, que escolhemos ser a energia, ou, equivalentemente, o operador de número N̂ C.C.O.C. = {N̂} . (5.1.11) Assim, vamos escrever o estado do sistema usando como base os vectores próprios do operador de número, denotados por |ni, cujos valores próprios irão ser números inteiros que servem de rótulo para os vectores próprios. Os vectores do conjunto {|ni} são necessariamente ortogonais, mas para já nada assumiremos acerca da sua normalização. A energia do estado próprio |ni é dada por (5.1.3), o que implica que hn|Ĥ|ni = ~ω En = hn|ni hn|↠â|ni 1 + hn|ni 2 = ~ω ||â|ni||2 1 + hn|ni 2 ≥ ~ω . 2 (5.1.12) Assim, existe um estado de energia mı́nima para o oscilador harmónico, dito o estado fundamental ou “vácuo”, que vamos rotular com n = 0 e definido por â|0i = 0 ⇒ E0 = ~ω . 2 (5.1.13) Desde já notamos uma diferença fundamental com a mecânica clássica: o estado fundamental não tem energia zero - como em mecânica clássica - mas antes E0 = ~ω/2, designada energia do ponto zero. Este facto está intrinsecamente ligado ao princı́pio da incerteza; uma energia nula do estado fundamental implicaria uma partı́cula congelada em x = 0 = p; mas pelo princı́pio da incerteza isso não pode acontecer. De facto, podemos encontrar o valor (5.1.13) minimizando a expressão clássica da energia com a condição de que xp = ~/2: E(x, p) = p2 mω 2 2 + x 2m 2 xp=~/2 ⇔ E(x) = ~2 mω 2 2 + x , 8mx2 2 (5.1.14) que extremizando 0= dE ~2 =− + mω 2 x dx 4mx3 ⇔ x2 = ~ , 2mω (5.1.15) valor para o qual a energia do oscilador harmónico é E = ~ω/2. Existe evidência experimental para a existência da energia do ponto zero e até mesmo uma manifestação macroscópica:o efeito Casimir em teoria quântica de campo. 144 Exemplos de Quantificação Canónica A acção do operador de destruição no estado fundamental aniquila-o. Logo, o estado fundamental é um vector próprio de N̂ com valor próprio zero. Consideremos agora o estado obtido pela acção no estado fundamental do operador de criação, ↠|0i. Actuando com N̂ N̂ ↠|0i = [N̂ , ↠] + ↠N̂ |0i = ↠+ ↠N̂ |0i = ↠|0i , (5.1.16) |1i ≡ ↠|0i . (5.1.17) N̂ ↠|1i = ↠+ ↠N̂ |1i = 2↠|1i , (5.1.18) ou seja, ↠|0i é um estado próprio de N̂ com valor próprio 1; assim, denotamos Analogamente ou seja, ↠|1i ≡ |2i é vector próprio de N̂ com valor próprio 2. O padrão que descobrimos pode ser agora sistematizado: Teorema: Seja |ni um vector próprio de N̂ com valor próprio n ∈ N0 . Logo i) |ni tem energia 1 En = ~ω n + 2 ; (5.1.19) ii) ↠|ni ≡ |n + 1i é um vector próprio de N̂ com valor próprio n + 1; iii) â|ni = n|n − 1i é vector próprio de N̂ com valor próprio n − 1 (note-se a consistência com â|0i = 0). Demonstração: i) A energia é o valor próprio de Ĥ. Logo 1̂ Ĥ|ni = ~ω N̂ + 2 ! 1 |ni = ~ω n + |ni , 2 (5.1.20) de onde concluimos que a energia do estado |ni é dada por (5.1.19). Este é o espectro de energia do oscilador harmónico, que como esperado exibe quantificação de energia - figura 5.1; 5.1 Oscilador Harmónico Quântico em Uma Dimensão 145 E V(x) 5~ω/2 3~ω/2 ~ω/2 x Figura 5.1: Nı́veis de energia permitidos para o oscilador harmónico quântico, marcados pelas linhas horizontais, correspondentes à relação (5.1.19). ii) † N̂ |n+1i = N̂ â |ni (5.1.10) = † â 1̂ + N̂ |ni = (n+1)↠|ni = (n+1)|n+1i , (5.1.21) o que mostra que |n + 1i é um vector próprio de N̂ com valor próprio n + 1; iii) nN̂ |n−1i = N̂ â|ni (5.1.9) = â N̂ − 1̂ |ni = (n−1)â|ni = n(n−1)|n−1i , (5.1.22) o que mostra que |n − 1i é um vector próprio de N̂ com valor próprio n − 1. (q.e.d.) Note-se que no ponto iii), o factor de n tem que aparecer por consistência; de facto |ni = ↠|n − 1i ⇒ â|ni = â↠|n − 1i = (N̂ + 1̂)|n − 1i = n|n − 1i . (5.1.23) Deste modo compreendemos a terminologia que introduzimos: o operador de Número dá-nos o número de quantões de energia no estado que estamos a considerar; o operador de criação/destruição transformam um dado estado num outro com mais/menos um quantão de energia. Finalmente discutamos a normalização dos estados {|ni}. Vamos assumir que |0i está normalizado, h0|0i = 1. Logo h1|1i = h0|â↠|0i = h0|1̂ + N̂|0i = 1 , (5.1.24) o que mostra que |1i também está normalizado, mas h2|2i = h1|â↠|1i = h1|1̂ + N̂|1i = 2 , (5.1.25) 146 Exemplos de Quantificação Canónica que já não está normalizado. Mostremos por indução matemática que hn|ni = n! : (5.1.26) Acabamos de mostrar que este resultado é verdade para n = 1. Assumindo (5.1.26) consideramos hn + 1|n + 1i = hn|â↠|ni = hn|1̂ + N̂ |ni = (n + 1)hn|ni = (n + 1)! , (5.1.27) o que prova a tese. Assim introduzimos a base ortonormalizada no espaço de estados {|Φn i} definidos como |ni |Φn i ≡ √ , n! (5.1.28) hΦn |Φm i = δnm . (5.1.29) e obedecendo a Notemos que, em termos destes estados normalizados, ↠|ni = |n + 1i ↠|Φn i = ⇔ √ n + 1|Φn+1 i , (5.1.30) √ (5.1.31) e de um modo semelhante â|ni = n|n − 1i 5.1.2 ⇔ â|Φn i = n|Φn−1 i . As funções de onda para o oscilador harmónico O grau de liberdade primordial do oscilador harmónico é a sua posição espacial. Logo, estamos interessados em conhecer as funções de onda no espaço de configurações, Φn (x), que estão associadas aos estados normalizados |Φn i. Estas funções de onda dizem-nos, como habitualmente, a amplitude de probabilidade espacial para encontrar a partı́cula quântica que se encontra nesse estado |Φn i. A conversão de |Φn i para Φn (x) faz-se usando a representação |xi da secção 4.4.2; Φn (x) são vistos como as componentes da expansão da função de onda nesta base: |Φn i = Z dxΦn (x)|xi . (5.1.32) 5.1 Oscilador Harmónico Quântico em Uma Dimensão 147 Vamos agora construir explicitamente essas funções de onda. Começamos pelo vácuo, que é definido por â|0i = 0 ⇔ â|Φ0 i = 0 ⇔ 1 √ 2 r mω i P̂ X̂ + √ ~ mω~ |Φ0 i = 0 . (5.1.33) Usando a representação |xi, isto é projectando esta equação num bra hx|: r r d mω i mω ~ (4.4.24),(4.4.25) hx|P̂ |Φ0 i = 0 ⇔ hx|X̂|Φ0 i+ √ xhx|Φ0 i+ √ hx|Φ0 i = 0 , ~ ~ mω~ mω~ dx (5.1.34) ou, finalmente, usando a tabela da secção 4.4.2 e a expansão (5.1.32) temos hx|Φ0 i = Φ0 (x) e como tal d mω + x Φ0 (x) = 0 . dx ~ (5.1.35) A solução desta equação diferencial de primeira ordem é mω 2 Φ0 (x) = C0 e− 2~ x , (5.1.36) onde tomamos a constante de integração como mω 1/4 C0 = , π~ (5.1.37) de modo que a função de onda Φ0 (x) esteja normalizada, pois o estado |Φ0 i está normalizado. Note-se que a solução normalizada é única e por isso o estado fundamental é não degenerado. Na prática, (5.1.35) resultou de (5.1.33) pelas substituições d (X̂, P̂ , |Φn i) −→ x, −i~ , Φn (x) , dx (5.1.38) com n = 0. Com isto em mente construimos as funções de onda para os próximos estados do seguinte modo: √ † n + 1|Φn+1 i = â |Φn i ⇔ √ 1 n + 1|Φn+1 i = √ 2 r ou, usando a nossa substituição (5.1.38) s mω d ~ Φn+1 (x) = Φn (x) , x− 2mω(n + 1) ~ dx mω i P̂ X̂ − √ ~ mω~ n ∈ N0 . |Φn i , (5.1.39) (5.1.40) 148 Exemplos de Quantificação Canónica Deste modo, obtemos para Φ1 (x) r 2mω − mω x2 xe 2~ , ~ (5.1.41) mω 2 2mω 2 x − 1 e− 2~ x . ~ (5.1.42) Φ1 (x) = C0 e para Φ2 (x) C0 Φ2 (x) = √ 2 É agora fácil de concluir que todas as funções de onda são do tipo r mω −χ2 /2 x, Φn (χ) = Cn Hn (χ)e , χ≡ ~ (5.1.43) onde Cn é uma constante e Hn é um polinómio de grau n e com paridade bem definida (−1)n (1=par, −1=ı́mpar). Usando esta forma para a função de onda em (5.1.40) obtemos d 1 2 −χ2 /2 χ− (5.1.44) Cn Hn (χ)e−χ /2 , Cn+1 Hn+1 (χ)e =p dχ 2(n + 1) que é obedecido escolhendo Cn Cn+1 = p , 2(n + 1) Hn+1 (χ) = 2χHn (χ) − d Hn (χ) . dχ (5.1.45) A fórmula de recorrência para os polinómios define os polinómios de Hermite. Os quatro primeiros são H0 = 1 , H1 = 2χ , H2 = 4χ2 − 2 , H3 = 8χ3 − 12χ . (5.1.46) Resumimos a situação respeitante aos primeiros estados estacionários (dado que o estado Φn tem energia constante) do oscilador harmónico na seguinte tabela: Estado Normalizado Componentes na representação |xi Paridade 2 /2 |Φ0 i = |0i Φ0 (χ) = C0 e−χ |Φ1 i = |1i √ |Φ2 i = |2i/ 2 √ |Φ3 i = |3i/ 3! Φ1 (χ) = C1 (2χ)e−χ ... 2 /2 Φ2 (χ) = C2 (4χ2 − 2)e−χ 2 /2 Φ3 (χ) = C3 (8χ3 − 12χ)e−χ ... 2 /2 Energia Par ~ω/2 Ímpar 3~ω/2 Par 5~ω/2 Ímpar 7~ω/2 ... ... 5.1 Oscilador Harmónico Quântico em Uma Dimensão 149 Figura 5.2: Funções de onda para n = 0, 1, 2 e n = 10 do oscilador Harmónico e as respectivas densidades de probabilidade. Na notação da figura Φn = ϕn . (Extraı́do de Cohen et al, ‘Quantum Mechanics’). Note-se que para cada nı́vel de energia a função de onda (normalizada) é única, pelo que o espectro é não degenerado. Na figura 5.2 representamos as funções de onda para os nı́veis n = 0, 1, 2 e n = 10. Concluimos com o comentário de que se pode mostrar matematicamente que as funções {Φn (x)} formam uma base do espaço de funções sobre R, que é necessário para que N̂ e Ĥ seja observáveis. 5.1.3 Resolução directa da equação de Schrödinger À semelhança do que fizemos no capı́tulo 3, podı́amos ter procurado os estados estacionários resolvendo directamente a equação de Schrödinger. Tomando a função de onda Ψ(x, t) = Φ(x)e−iEt/~ , (5.1.47) 150 Exemplos de Quantificação Canónica obtinhamos a equação para a função de onda espacial (3.2.5) especializada para o potencial do oscilador harmónico mω 2 2 ~2 d 2 + x Φ(x) = EΦ(x) . − 2m dx2 2 (5.1.48) Como da nossa análise da secção anterior já sabemos a resposta, usamos como ansatz a forma mω 2 Φ(x) = f (x)e− 2~ x , (5.1.49) de modo a que (5.1.48) toma a forma 2mω ′ 2m f (x) − xf (x) + 2 ~ ~ ′′ ~ω E− 2 f (x) = 0 . (5.1.50) Procuremos uma solução como uma série de potências: f (x) = ∞ X n an x n=0 ⇒ ′ f (x) = ∞ X n−1 nan x ⇒ n=0 ′′ f (x) = ∞ X n=0 n(n − 1)an xn−2 , (5.1.51) de modo que a equação diferencial para f (x) fica ∞ X 1 2m an xn = 0 . (n + 2)(n + 1)an+2 + 2 E − ~ω n + ~ 2 n=0 (5.1.52) Para a equação ser obedecida para todo o x todos os termos na série têm de ser zero; obtemos portanto a relação de recorrência (n + 2)(n + 1)an+2 2m = 2 ~ 1 − E an . ~ω n + 2 (5.1.53) Para compararmos com a análise da secção anterior é conveniente usar a variável χ introduzida em (5.1.43). Em termos desta variável f (x) = ∞ X n=0 n an x → f (χ) = ∞ X n bn χ , n=0 com bn = ~ mω n/2 an . (5.1.54) A relação de recorrência fica (n + 2)(n + 1)bn+2 2E bn . = 2n + 1 − ~ω (5.1.55) 5.1 Oscilador Harmónico Quântico em Uma Dimensão 151 Vamos assumir que a série é finita; voltaremos a este ponto mais em baixo. Para a série ser finita é necessário que o coeficiente do bn se torne zero para algum n; isto restringe os valores possı́veis para a energia; existe um n0 ∈ N0 para o qual 2E = 2n0 + 1 , ~ω (5.1.56) o que não é mais do que o nosso espectro de energias. Obtemos assim a quantificação da energia, usando directamente a equação de Schrödinger ~ω 3~ω 5~ω 7~ω , , , , . . . , para n0 = (0, 1, 2, . . .) . En0 = 2 2 2 2 (5.1.57) Deste modo a relação de recorrência para o polinómio fn0 (χ) fica (n + 2)(n + 1)bn+2 = 2(n − n0 )bn . (5.1.58) Como a relação de recorrência relaciona termos de ordem par ou termos de ordem ı́mpar, para a série ser finita, temos de tomar unicamente os termos com a paridade de n0 . Assim temos • Para n0 = 0 a série só tem o termo b0 cujo valor é arbitrário; tomamos b0 = 1; o polinómio correspondente é f0 (χ) = 1 ; (5.1.59) • Para n0 = 1 a série só tem o termo b1 cujo valor é arbitrário; tomamos b1 = 2; o polinómio correspondente é f1 (χ) = 2χ ; (5.1.60) • Para n0 = 2 a série tem o termo b0 = 1 e b2 = −2; o polinómio correspondente é f2 (χ) = 1 − 2χ2 ; (5.1.61) • Para n0 = 3 a série tem o termo b1 = 2 e b3 = −4/3; o polinómio correspondente é 4 f3 (χ) = 2χ − χ3 ; 3 (5.1.62) 152 Exemplos de Quantificação Canónica etc. Claro que estes polinómios são todos proporcionais aos polinómios de Hermite, fn0 (χ) ∝ Hn0 (χ). De facto, a série (5.1.58) define o polinómio de Hermite Hn0 . Obtemos deste modo tanto o espectro de energias como as funções de onda da secção anterior. Falta-nos justificar a hipótese fundamental de que a série (5.1.53) tem de ser finita. Esta condição surge de requerer que a função de onda seja normalizável. De facto, as funções de onda tomam a forma ∞ X n an x n=0 Ψ(x, t) = e−iEt/~ mω x2 e 2~ Podemos escrever mωx2 /(2~) e = ∞ X cn xn , com c2n = n=0 . mω n 1 , 2~ n! (5.1.63) (5.1.64) e como tal c2n+2 mω 1 = c2n 2~ n + 1 n→∞ ≃ mω , 2~n (5.1.65) enquanto que por (5.1.53) an+2 an n→∞ ≃ 2mω . ~n (5.1.66) mω . ~n (5.1.67) Assim, se tomarmos a parte par da série dos an , a2n+2 a2n n→∞ ≃ Concluimos que para n suficientemente grande a2n+2 c2n+2 > , a2n c2n (5.1.68) pelo que a divisão das duas séries não poderá tender para zero quando |x| → ∞ e como tal o módulo da função de onda (5.1.63) não irá tender para zero o que implica que a função de onda não será normalizável. Se a série dos an tiver apenas parte ı́mpar podemos ainda majorar a série dos cn extraindo portanto a mesma conclusão relativa à normalização da função de onda. 5.1 Oscilador Harmónico Quântico em Uma Dimensão 5.1.4 153 Valor médio e desvio padrão de x e p Usando (5.1.4) expressamos os operadores posição e momento X̂ e P̂ em termos dos operadores de criação e destruição: r ~ X̂ = ↠+ â , 2mω r P̂ = i mω~ † â − â . 2 (5.1.69) Note-se a hermiticidade de P̂ e X̂. Logo, a acção destes operadores num estado estacionário é r √ ~ √ n + 1|Φn+1 i + n|Φn−1 i , 2mω r √ mω~ √ n + 1|Φn+1 i − n|Φn−1 i , P̂ |Φn i = i 2 X̂|Φn i = (5.1.70) (5.1.71) e como tal obtemos os elementos de matriz hX̂i = hΦn |X̂|Φn i = 0 = hΦn |P̂ |Φn i = hP̂ i . (5.1.72) Assim concluimos que o valor médio da posição e do momento são zero em qualquer estado estacionário. O desvio padrão é calculado pela expressão (4.4.8): 1 n+ , 2 (5.1.73) mω~ 1 2 2 2 2 † 2 † † (∆p) = hP̂ i = hΦn |P̂ |Φn i = − , hΦn |â + (â ) − ââ − â â|Φn i = mω~ n + 2 2 (5.1.74) ~ ~ hΦn |â2 + (↠)2 + â↠+ ↠â|Φn i = (∆x) = hX̂ i = hΦn |X̂ |Φn i = 2mω mω 2 2 2 onde a contribuição não trivial vem dos termos â↠e ↠â usando (5.1.30) e (5.1.31). Logo ~ 1 ∆x∆p = ~ n + ≥ , (5.1.75) 2 2 em concordância com o princı́pio de incerteza. Os estados estacionários |Ψn i não têm equivalente clássico, dado que têm valores médios zero para momento e posição e ao mesmo tempo energia diferente de zero. Pelo teorema de Ehrenfest os valores médios hX̂i e hP̂ i correspondem às variáveis clássicas e a única situção em que um oscilador harmónico clássico tem x(t) = 0 = p(t) é quando tem energia nula. Contudo, sobrepondo estados estacionários podemos construir estados cuja média se comporta como um oscilador clássico. 154 Exemplos de Quantificação Canónica Seja o estado inicial dado pela sobreposição |Ψ(0)i = No instante t, |Ψ(t)i = ∞ X n=0 ∞ X n=0 cn (0)|Φn i . cn (0)e−iEn t/~|Φn i = ∞ X n=0 (5.1.76) cn (0)e−iω(n+1/2)t |Φn i . (5.1.77) Logo obtemos para o valor médio de X̂, hX̂i(t) = hΨ(t)|X̂|Ψ(t)i, r ∞ ∞ √ √ ~ XX ∗ iω(m−n)t hΦm |cm (0)cn (0)e n + 1|Φn+1 i + n|Φn−1 i , hX̂i(t) = 2mω n=0 m=0 r ∞ ∞ √ √ ~ XX ∗ n + 1δm,n+1 + nδm,n−1 , = cm (0)cn (0)eiω(m−n)t 2mω n=0 m=0 ! " ∞ # ! r ∞ X X √ √ ~ n + 1cn (0)c∗n+1 (0) eiωt + ncn (0)c∗n−1 (0) e−iωt . = 2mω n=0 n=0 (5.1.78) Note-se que se apenas um dos cn (0) for não nulo então obtemos imediatamente hX̂i(t) = 0, tal como discutido anteriormente. Se definirmos ∞ X √ n + 1cn (0)c∗n+1 (0) , z≡ (5.1.79) n=0 então ∗ z = ∞ X √ n+ 1c∗n (0)cn+1 (0) m≡n+1 = ∞ X √ m=1 n=0 mc∗m−1 (0)cm (0) = ∞ X √ mcm (0)c∗m−1 (0) , m=0 (5.1.80) reescrevemos (5.1.78) como r ~ zeiωt + z ∗ e−iωt , (5.1.81) 2mω p ou, expressando o número complexo z = mω/(2~)Aeiφ0 , onde A e φ0 são números reais, hX̂i(t) = temos ei(ωt+φ0 ) + e−i(ωt+φ0 ) = A cos(ωt + φ0 ) . (5.1.82) hX̂i(t) = A 2 Assim, o valor médio de uma sobreposição de estados estacionários do oscilador harmónico quântico evolui de acordo com a teoria do oscilador clássico (1.1.6), em concordância com o teorema da correspondência de Ehrenfest. 5.2 O Oscilador Harmónico Quântico em Duas Dimensões 5.2 155 O Oscilador Harmónico Quântico em Duas Dimensões O Hamiltoniano clássico para um oscilador harmónico isotrópico em duas dimensões é Hxy = p2x + p2y µω 2 2 + (x + y 2 ) . 2µ 2 (5.2.1) A partir de agora designamos por ‘µ’ a massa da partı́cula. As trajectórias que resolvem o problema clássico são x(t) = xM cos(ωt − φx ) , (5.2.2) y(t) = y cos(ωt − φ ) M y onde xM , yM , φx , φy são constantes de integração. O movimento geral é elı́ptico, dependendo dos detalhes da diferença de fase φy − φx : φy − φx = −π movimento linear na direcção x = −y 0 > φy − φx > −π movimento retrógrado na elipse φy − φx = 0 movimento linear na direcção x = y π > φy − φx > 0 movimento directo na elipse φy − φx = +π movimento linear na direcção x = −y Por quantificação canónica introduzimos o operador Hamiltoniano i P̂ 2 + P̂22 µω 2 h 1 2 Ĥxy = 1 (X̂ ) + (X̂ 2 )2 , + 2µ 2 (5.2.3) onde X̂ 1 e X̂ 2 são as observáveis associadas às grandezas fı́sicas x e y sendo P̂1 e P̂2 os seus momentos canónicos conjugados. As relações canónicas de comutação são [X̂ k , P̂j ] = i~δjk . 5.2.1 (5.2.4) Quantões lineares Claramente, temos duas cópias de tudo o que fizemos na secção 5.1. Definindo os operadores de criação â†1 , â†2 e destruição como â1 , â2 r r µω j µω j 1 i 1 i † âj = √ X̂ + √ P̂j , âj = √ X̂ − √ P̂j , ~ ~ µω~ µω~ 2 2 j = 1, 2 (5.2.5) 156 Exemplos de Quantificação Canónica obtemos Ĥxy = ~ω N̂1 + N̂2 + 1 , (5.2.6) com os operadores de número sendo N̂j = â†j âj . As únicas relações de comutação não triviais entre estes operadores de criação e destruição são h i âi , â†j = δij 1̂ . (5.2.7) Claramente podemos tomar como C.C.O.C. n o C.C.O.C = N̂1 , N̂2 , (5.2.8) pelo que a base para o nosso espaço de estados será o conjunto de kets {|n1 , n2 i}, com {n1 } e {n2 } sendo o espectro de N̂1 e N̂2 respectivamente. O espectro de energias será E(n1 ,n2 ) = ~ω(n1 + n2 + 1) , (5.2.9) e as funções de onda para os estados estacionários serão simplesmente Ψ(n1 ,n2 ) (t, x, y) = Φn1 (x)Φn2 (y)e−iE(n1 ,n2 ) t/~ , (5.2.10) onde Φn é dado por (5.1.43). Note que o espectro é degenerado. 5.2.2 Quantões circulares O potencial do oscilador harmónico isotrópico em duas dimensões é invariante por rotações em torno do eixo Oz. É por isso natural considerarmos o operador momento angular segundo z; por (4.4.39) L̂z = X̂ 1 P̂2 −X̂ 2 P̂1 (5.1.69) = i i h i~ h † (â1 + â1 )(â†2 − â2 ) − (â†2 + â2 )(â†1 − â1 ) = i~ â1 â†2 − â†1 â2 . 2 (5.2.11) Vemos facilmente que L̂z comuta com Ĥxy : h i h i h i N̂1 + N̂2 , L̂z = i~ N̂1 , â1 â†2 − â†1 â2 + i~ N̂2 , â1 â†2 − â†1 â2 = i~(−â1 â†2 − â†1 â2 + â1 â†2 + â†1 â2 ) = 0 . (5.2.12) 5.2 O Oscilador Harmónico Quântico em Duas Dimensões 157 n o Assim, em vez de usarmos N̂1 , N̂2 poderiamos escolher como C.C.O.C. n o C.C.O.C. = L̂z , Ĥxy . (5.2.13) Para o fazermos é útil introduzirmos os operadores de criação e destruição circulares:1 1 âd = √ (â1 − iâ2 ) , 2 1 âe = √ (â1 + iâ2 ) , 2 (5.2.14) e os seus adjuntos â†d , â†e ; os únicos comutadores não triviais são: [âd , â†d ] = 1 = [âe , â†e ] . (5.2.15) Facilmente vemos que â†d âd 1 † † † † = â â1 + â2 â2 − iâ1 â2 + iâ2 â1 , 2 1 â†e âe 1 † † † † = â â1 + â2 â2 + iâ1 â2 − iâ2 â1 . 2 1 (5.2.16) Definindo os operadores de número circulares N̂d = â†d âd , temos N̂e = â†e âe , Ĥxy = ~ω N̂d + N̂e + 1 (5.2.17) . (5.2.18) L̂z = ~(N̂d − N̂e ) Podemos pois como uma outra hipótese tomar como C.C.O.C. n o C.C.O.C. = N̂e , N̂d , (5.2.19) e rotular a base no nosso espaço de estados como {|ne , nd i}. Os espectros da energia e (da componente z) do momento angular são E(ne ,nd ) = ~ω(nd + ne + 1) ≡ ~ω(n + 1) , lz = ~(nd − ne ) ≡ ~m . (5.2.20) Nestas relações definimos n ≡ nd + ne e m ≡ nd − ne . Podemos agora compreender a terminologia de quantões circulares. O operador â†d (â†e ) adiciona ao estado um quantão de 1 Os sub-ı́ndices d e e significam ‘direita’ e ‘esquerda’. 158 Exemplos de Quantificação Canónica momento angular -~- no sentido directo (inverso), para além de adicionarem um quantão de energia. Para cada valor da energia, existe uma degenerescência de grau n + 1, correspondendo aos pares (ne , nd ) = [(0, n); (1, n − 1); (2, n − 2); . . . ; (n − 1, 1); (n, 0)] , (5.2.21) que correspondendem aos valores de lz = m~ com m = [n; n − 2; n − 4; . . . ; 2 − n; −n] . (5.2.22) Note-se que a acção dos operadores circulares nos estados {|ne , nd i} é dada por â†d |ne , nd i = |ne , nd + 1i , â†e |ne , nd i = |ne + 1, nd i , âd |ne , nd i = nd |ne , nd − 1i , 5.2.3 (5.2.23) âe |ne , nd i = ne |ne − 1, nd i . Funções de Onda para quantões circulares Vimos na secção 5.1.2 que a acção de operadores de destruição e criação lineares é dada por, na representação |xi, 1 âi → √ 2 r µω i x + ~ s ~ ∂ µω ∂xi ! , (5.2.24) 1 â†i → √ 2 r µω i x − ~ s ~ ∂ µω ∂xi ! . (5.2.25) Logo, usando (5.2.14), a acção dos operadores de destruição e criação circulares é dada por2 2 âd 1 → 2 r â†d 1 → 2 r Usamos x1 = x e x2 = y. µω (x − iy) + ~ s ~ µω ∂ ∂ −i ∂x ∂y ! , (5.2.26) µω (x + iy) − ~ s ~ µω ∂ ∂ +i ∂x ∂y ! . (5.2.27) 5.2 O Oscilador Harmónico Quântico em Duas Dimensões 159 Os operadores circulares ‘retrógrados’ âe , â†e são obtidos pela transformação i → −i nas duas últimas expressões respectivamente.3 A mudança para quantões circulares pretendeu usar a simetria de rotação em torno do eixo Oz do problema; é pois natural reexpressar estas quantidades em coordenadas polares: x + iy = ρeiφ ∂x ∂ ∂y ∂ ∂ ∂ ∂ = + = −y +x ∂φ x = ρ cos φ ∂φ ∂x ∂φ ∂y ∂x ∂y . ⇒ ∂x ∂ ∂y ∂ x ∂ y ∂ ∂ y = ρ sin φ = + = + ∂ρ ∂ρ ∂x ∂ρ ∂y ρ ∂x ρ ∂y ∂ i ∂ x − iy ∂ i(x − iy) ∂ ∂ ∂ −iφ + = + =e +i ∂ρ ρ ∂φ ρ ∂x ρ ∂y ∂x ∂y (5.2.28) Logo, reexpressamos a acção dos operadores de criação e destruição directos s r ! µω ~ 1 ∂ i ∂ âd → e−iφ , ρ+ − 2 ~ µω ∂ρ ρ ∂φ s r ! µω ~ ∂ i ∂ 1 , ρ− + â†d → eiφ 2 ~ µω ∂ρ ρ ∂φ (5.2.29) (5.2.30) e os operadores circulares ‘retrógrados’ âe , â†e são obtidos pela transformação i → −i nas duas últimas expressões respectivamente. As funções próprias do oscilador harmónico 2dimensional em termos destes quantões circulares (que são portanto estados próprios da energia e momento angular) Ψ(ne ,nd ) (ρ, φ) = Φ(ne ,nd ) (t, ρ, φ)e−iE(ne ,nd ) t/~ , (5.2.31) são obtidas actuando no vácuo com â†d e â†e . A função de onda do vácuo para os quantões lineares é (5.2.10) com n1 = n2 = 0 Ψ(n1 =0,n2 =0) (t, x, y) = r ωµ − µω (x2 +y2 ) −iωt e 2~ e , π~ (5.2.32) ou, em termos dos quantões circulares n = 0, m = 0 , Φ(ne =0,nd =0) (ρ, φ) = r ωµ − µω ρ2 e 2~ . π~ (5.2.33) Note que isto não corresponde a tirar o complexo conjugado, dado que os operadores âi e â†i não mudam. 3 160 Exemplos de Quantificação Canónica Note-se que por (5.2.29), âd Φ(0,0) = 0 como requerido (e também âe Φ(0,0) = 0). Actuando agora com â†d ou â†e respectivamente obtemos µω 2 ωµ Φ(ne =0,nd =1) (ρ, φ) = √ eiφ ρe− 2~ ρ , π~ n=1, µω 2 ωµ m = −1 , Φ(ne =1,nd =0) (ρ, φ) = √ e−iφ ρe− 2~ ρ , π~ m=1, (5.2.34) e assim por diante. Repare-se que para este nı́vel de energia (n = 1) os diferentes estados de momento angular diferem de uma fase. Em geral o mesmo não se verifica; de facto isso pode ser verificado para n = 2; tendo em atenção o factor de normalização obtemos ωµ 3/2 2 µω 2 2iφ ρ √ m = 2 , Φ (ρ, φ) = e e− 2~ ρ , (ne =0,nd =2) 2π r~ h i µω 2 ωµ ωµ 2 n=2, (5.2.35) m = 0 , Φ(ne =1,nd =1) (ρ, φ) = ρ − 1 e− 2~ ρ , π~ ~ ωµ 3/2 µω 2 ρ2 e−2iφ √ e− 2~ ρ . m = −2 , Φ(ne =2,nd =0) (ρ, φ) = ~ 2π As densidades de probabilidade respeitantes a estas funções de onda estão representadas na figura 5.3. 5.3 O problema de Landau O problema de Landau para uma partı́cula sem spin é a versão quântica do problema de Larmor do capı́tulo 1. Consideramos o hamiltoniano (1.3.22) 1 HL = 2µ qBy px + 2 2 2 qBx 1 p2 py − + + z . 2µ 2 2µ (5.3.1) Tal como discutido na secção 4.4.3, a quantificação deste sistema é feita usando o operador Hamiltoniano µ ĤL = 2 P̂x ωc Ŷ + µ 2 !2 µ + 2 P̂y ωc X̂ − µ 2 !2 + P̂z2 , 2µ (5.3.2) onde usamos a frequência ciclotrónica ωc = qB/µ e onde impomos as relações de comutação canónicas [X̂, P̂x ] = i~ , [Ŷ , P̂y ] = i~ , [Ẑ, P̂z ] = i~ , (5.3.3) 5.3 O problema de Landau 161 0.3 0.1 0.25 0.08 0.2 0.06 0.15 0.04 0.1 0.02 0.05 0 0 0 0.5 1 1.5 2 0 0.5 1 1.5 rho 2 2.5 3 3 3.5 rho 0.3 0.08 0.25 0.06 0.2 0.15 0.04 0.1 0.02 0.05 0 0 0 0.5 1 1.5 2 rho 2.5 3 3.5 0 0.5 1 1.5 2 2.5 rho Figura 5.3: Densidades de probabilidade para os nı́veis (n, m) = (0, 0) (cima esquerda), (n, m) = (1, ±1) (cima direita) , (n, m) = (2, ±2) (baixo esquerda), (n, m) = (2, 0) (baixo direita). Nos gráficos tomamos µω/~ = 1. 162 Exemplos de Quantificação Canónica sendo todos os outros comutadores envolvendo momento e posição zero. Reescrevemos (5.3.2) como ĤL = P̂x2 + P̂y2 µωc2 2 P̂ 2 P̂ 2 ωc ωc + (X̂ + Ŷ 2 ) − (X̂ P̂y − Ŷ P̂x ) + z = Ĥxy − L̂z + z , (5.3.4) 2µ 8 2 2µ 2 2µ onde Ĥxy é o Hamiltoniano do oscilador harmónico dois dimensional (5.2.3) com ω = ωc /2 e L̂z é a componente z do operador momento angular. Usando (5.2.18), reescrevemos o hamiltoniano como 1 P̂ 2 ĤL = ~ωc N̂e + + z . 2 2µ (5.3.5) Note-se que podiamos ter definido directamente de (5.3.2) os operadores de destruição e criação " ! !# µ P̂x ωc Ŷ P̂y ωc X̂ +i , + − −iâe = 2~ωc µ 2 µ 2 " ! !# r P̂ P̂ ω Ŷ ω X̂ µ x y c c −i , + − iâ†e = 2~ωc µ 2 µ 2 r (5.3.6) (5.3.7) de modo que " µ 2 â†e âe = 2~ωc µ P̂ 2 ĤL − z 2µ ! # iωc iωc 1 − [P̂x , X̂] + [Ŷ , P̂y ] = 2µ 2µ ~ωc P̂ 2 ĤL − z 2µ ! − 1 , 2 (5.3.8) recuperando (5.3.5). Só que ao usarmos a comparação com o oscilador harmónico em duas dimensões temos imediatamente a interpretação de âe e â†e como destruindo e criando quantões circulares (retrógrados). Assim, o Hamiltoniano é igual ao do oscilador harmónico um dimensional, mas com quantões circulares, mais uma parte que descreve o movimento (livre) segundo o eixo do z. Consideremos a decomposição ĤL = Ĥ⊥ + Ĥk , com 1 e Ĥ⊥ = ~ωc N̂e + 2 Ĥk = P̂z2 . 2µ (5.3.9) Analisamos primeiro o movimento no plano xy que é descrito por Ĥ⊥ . O espectro de energias no plano xy é infinitamente degenerado. De facto, estados próprios de L̂z com diferentes valores de nd têm o mesmo valor próprio da energia, que só depende de ne ; 5.3 O problema de Landau 163 adicionando ou subtraindo quantões circulares directos não altera a energia do estado. Para compreender fisicamente este resultado vamos definir vários operadores: • Operadores Velocidade: Pela relação clássica (1.3.19) ~, p~ = µ~x˙ + q A (5.3.10) definimos os operadores associados à velocidade V̂ i = q P̂i − Âi , µ µ V̂ y = P̂y ωc − X̂ , µ 2 (5.3.11) que no nosso caso são V̂ x = P̂x ωc + Ŷ , µ 2 V̂ z = P̂z . µ (5.3.12) Logo [V̂ x , V̂ y ] = i~ωc , µ (5.3.13) e portanto existe uma incerteza mı́nima associada à determinação das componentes x e y da velocidade, quando B 6= 0 ∆v x ∆v y ≥ ωc ~ . 2µ (5.3.14) • Operadores Centro da Trajectória Clássica: Pelas relações clássicas (1.1.10)-(1.1.12) temos x = x0 − vy , ωc y = y0 + vx , ωc (B 6= 0) (5.3.15) definimos as observáveis associadas ao centro da trajectória clássica X̂0 = X̂ + X̂ P̂y V̂ y = + , ωc 2 µωc Ŷ0 = Ŷ − V̂ x Ŷ P̂x = − . ωc 2 µωc (5.3.16) Primeiro notamos que [X̂0 , Ŷ0 ] = − i~ . µωc (5.3.17) Logo, X̂0 e Ŷ0 são incompatı́veis e existe uma incerteza mı́nima associada às suas grandezas fı́sicas associadas ∆x0 ∆y0 ≥ ~ . 2µωc (5.3.18) 164 Exemplos de Quantificação Canónica Segundo notamos que [ĤL , X̂0 ] = 0 = [ĤL , Ŷ0 ] , (5.3.19) pelo que tanto X̂0 como Ŷ0 são constantes do movimento no sentido da secção 4.4.5. Terceiro notamos que [X̂0 , L̂z ] = −i~Ŷ0 , [Ŷ0 , L̂z ] = i~X̂0 , (5.3.20) pelo que não podemos incluir mais do que uma das três grandezas X̂0 , Ŷ0 , L̂z no nosso C.C.O.C.. Quarto notamos que o operador P̂x2 + P̂y2 µωc2 2 ωc + (X̂ + Ŷ 2 ) + (X̂ P̂y − Ŷ P̂x ) 2µ 8 2 ! 1̂ ωc 2~ 2 Ĥxy + L̂z = N̂d + = µωc2 2 µωc 2 2 R̂02 ≡ X̂02 + Ŷ02 = µωc2 ! . (5.3.21) Deste modo vemos que o valor próprio do operador R̂02 depende somente do número de quantões circulares directos. • Operador Raio da trajectória clássica: Pela expressão clássica (1.1.13) r 2 = (x(t) − x0 )2 + (y(t) − y0 )2 , (5.3.22) definimos o operador raio da trajectória clássica 1 2~ R̂2 = (X̂ − X̂0 )2 + (Ŷ − Ŷ0 )2 = 2 ((V̂ x )2 + (V̂ y )2 ) = ωc µωc 1̂ N̂e + 2 ! . (5.3.23) Assim, R̂2 é determinado pelo número de quantões circulares retrógrados. Assim, o C.C.O.C. para o problema de Landau é n o C.C.O.C = N̂e , N̂d , P̂z , (5.3.24) e a base para o espaço de estados pode ser tomada como rotulada pelos seus valores próprios {|ne , nd , pz i}. Podemos pensar em ne como determinando a energia do sistema ou também 5.4 Sumário 165 o valor próprio do operador raio da trajectória clássica. Por outro lado nd determina o valor próprio do operador R̂02 . O espectro total de energias é E(ne ,pz ) 1 p2 = ~ωc ne + + z , 2 2µ (5.3.25) que tem uma parte discreta relativa ao movimento no plano xy que é designada por nı́veis de Landau e uma parte contı́nua relativa ao movimento segundo z. Este espectro é degenerado em dois sentidos diferentes. Primeiro, como discutido atrás, funções de onda que só diferem de nd têm a mesma energia - degenerescência infinita. Segundo, mesmo tomando o mesmo valor de nd , duas funções de onda com diferentes valores de pz e ne podem ainda ter a mesma energia, desde que a soma das duas parcelas ainda se mantenha igual. Esta é uma degenerescência finita com grau ñ + 1 onde ñ é o maior inteiro menor que E/(~ωc ) − 1/2. As funções de onda totais para o problema de Landau que são estados próprios simultaneamente de ĤL , L̂z e P̂z são dadas pelo produto das funções de onda da secção 5.2.3 por uma onda plana que descreve o movimento livre segundo z: Ψ(ρ, φ, z, t) = Φ(ne ,nd ) (ρ, φ)eipz z/~eiE(ne ,pz ) t/~ . (5.3.26) Claro está, que tal como discutido no capı́tulo 3, esta função de onda não vai ser normalizável, devido à componente segundo z ser livre. Para normalizar a função de onda terı́amos de considerar um pacote de ondas na direcção z. 5.4 Sumário Considerámos três exemplos de quantificação canónica. O primeiro, o oscilador harmónico quântico em uma dimensão é o paradigma de problema que é resolvido pela introdução de operadores de criação e destruição. O espectro de energias mostra que a diferença de energia entre dois nı́veis diferentes é um múltiplo de ~ω. Esta foi exactamente a observação de Planck discutida na secção 2.1.2 que é obtida naturalmente no formalismo quântico. Ao considerarmos o oscilador harmónico isotrópico em duas dimensões pudemos introduzir também os operadores de criação e destruição circulares, que são úteis para tratar estados 166 Exemplos de Quantificação Canónica com momento angular bem definido. Vimos também aqui um exemplo de espectro de energias (finitamente) degenerado em cada nı́vel. O problema de Landau permitiu-nos ver um exemplo de um espectro de energias infinitamente degenerado; esta degenerescência pode ser associada à redundância de trajectórias clássicas no problema clássico de Larmor, que resulta da uniformidade do campo magnético. O problema de Landau dá-nos também um exemplo de uma situação em que os operadores associados a velocidades (ou a posições) não comutam entre si. CAPÍTULO 6 Momento Angular Orbital e o Átomo de Hidrogénio No capı́tulo anterior estudamos sistemas com componente Lz do momento angular bem definida. Isso levou-nos a estudar as funções de onda da secção 5.2.3 que são estados próprios dos operadores Ĥ e L̂z - estes operadores comutam e podem, como tal, ser diagonalizados simultaneamente. Neste capı́tulo vamos começar por estudar um conjunto de funções próprias comuns a L̂z e L̂2 que aplicaremos depois ao estudo do átomo de Hidrogénio. 6.1 Operadores de momento angular orbital As componentes do momento angular orbital são dadas por (4.4.39) ~ L̂ = (L̂x , L̂y , L̂z ) = (Ŷ P̂z − Ẑ P̂y , Ẑ P̂x − X̂ P̂z , X̂ P̂y − Ŷ P̂x ) . Na representação |~xi, estes operadores são escritos associando ∂ ∂ ∂ P̂x , P̂y , P̂z → −i~ , −i~ , −i~ , ∂x ∂y ∂z (6.1.1) (6.1.2) de modo que representamos ∂ ∂ ∂ ∂ ∂ ∂ . − z ,z −x ,x −y (L̂x , L̂y , L̂z ) = −i~ y ∂z ∂y ∂x ∂z ∂y ∂x (6.1.3) 168 Momento Angular Orbital e o Átomo de Hidrogénio Podemos facilmente verificar que esta representação obedece às relações de comutação para o momento angular [L̂x , L̂y ] = i~L̂z , [L̂y , L̂z ] = i~L̂x , [L̂z , L̂x ] = i~L̂y ; (6.1.4) por exemplo, sendo φ(x, y, z) uma função de onda arbitrária ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ z + z y φ(x, y, z) −z −x −x −z [L̂x , L̂y ]φ(x, y, z) = ~ − y ∂z ∂y ∂x ∂z ∂x ∂z ∂z ∂y ∂ ∂ 2 φ(x, y, z) = i~L̂z φ(x, y, z) , −y =~ x ∂y ∂x (6.1.5) 2 em acordo com (6.1.4). Definimos o operador momento angular total ~ ~ L̂2 = L̂ · L̂ = L̂2x + L̂2y + L̂2z . (6.1.6) Note-se que L̂2 comuta com qualquer das componentes do momento angular h i L̂2 , L̂x = 0 , h i L̂2 , L̂y = 0 , h i L̂2 , L̂z = 0 . (6.1.7) Por exemplo h i h i h i h i h i h i L̂2 , L̂x = L̂2y + L̂2z , L̂x = L̂y L̂y , L̂x + L̂y , L̂x L̂y + L̂z L̂z , L̂x + L̂z , L̂x L̂z = −i~L̂y L̂z − i~L̂z L̂y + i~L̂z L̂y + i~L̂y L̂z = 0 . (6.1.8) Assim, em mecânica quântica, classificamos os estados com momento angular bem definido usando o momento angular total e apenas uma das suas componentes, normalmente z; ou seja, consideramos o n o C.C.O.C. = L̂2 , L̂z , (6.1.9) para descrever os estados próprios do momento angular. Tal como na secção 5.2.3. usámos coordenadas polares para descrever as funções de onda que são estados próprios de L̂z , é conveniente usar coordenadas esféricas para descrever 6.2 Os Harmónicos Esféricos 169 as funções de onda que são estados próprios simultaneamente de L̂2 e L̂z . A relação entre coordenadas esféricas e cartesianas é dada por x = r sin θ cos φ y = r sin θ sin φ z = r cos θ . (6.1.10) Os versores em coordenadas esféricas e cartesianas relacionam-se como e = cos θ cos φex + cos θ sin φey − sin θez θ . (6.1.11) eφ = cos φey − sin φex er = x ex + y ey + z ez r r r ~ˆ = ~ˆr × ˆ~p, na representação |xi e usando coordenadas O operador momento angular, L esféricas toma a forma ∂ 1 ∂ 1 ∂ ˆ ~ L = rer × (−i~∇) = −i~rer × er , + eθ + eφ ∂r r ∂θ r sin θ ∂φ (6.1.12) ou seja 1 ∂ ∂ ˆ ~ = −i~ eφ . − eθ L ∂θ sin θ ∂φ (6.1.13) Usando (6.1.11) para projectar esta equação em ex , ey e ez obtemos respectivamente ∂ ∂ L̂x = i~ sin φ + cot θ cos φ ∂θ ∂φ ∂ ∂ . (6.1.14) L̂y = i~ − cos φ + cot θ sin φ ∂θ ∂φ ∂ L̂z = −i~ ∂φ Calculando o operador momento angular total L̂2 = L̂2x + L̂2y + L̂2z nesta representação obtemos 2 L̂ = −~ 6.2 2 1 ∂ sin θ ∂θ ∂ 1 ∂2 sin θ + . ∂θ sin2 θ ∂φ2 (6.1.15) Os Harmónicos Esféricos Vamos agora construir as funções próprias comuns a L̂2 e L̂z . Comecemos por calcular as funções próprias de L̂2 com valor próprio α~2 que denotamos por Yα (θ, φ) e obedecem à 170 Momento Angular Orbital e o Átomo de Hidrogénio equação diferencial L̂2 Yα (θ, φ) = α~2 Yα (θ, φ) , (6.2.1) ou seja −~ 2 1 ∂ sin θ ∂θ ∂ 1 ∂2 sin θ + Yα (θ, φ) = α~2 Yα (θ, φ) . ∂θ sin2 θ ∂φ2 (6.2.2) Separamos variáveis Yα (θ, φ) = Θ(θ)Φ(φ) , de modo a obtermos a equação d 1 d2 sin θ d 2 sin θ Θ(θ) + α sin θ = − Φ(φ) . Θ(θ) dθ dθ Φ(φ) dφ2 (6.2.3) (6.2.4) Como o lado esquerdo só depende de θ e o direito de φ, para obedecer à igualdade cada lado tem de ser uma constante a que chamamos m2 . Do lado direito obtemos então d2 Φ(φ) + m2 Φ(φ) = 0 dφ2 ⇒ Φ(φ) = C1 eimφ + C2 e−imφ . (6.2.5) Note-se que as funções e±imφ são também funções próprias de L̂z , com valores próprios −i~(±im) = ±m~ , (6.2.6) enquanto que a combinação linear C1 eimφ + C2 e−imφ não é função própria de L̂z . Deste modo tomamos Φ(φ) = Ce±imφ , (6.2.7) onde C é uma constante de normalização. Além disso, para a função e±imφ ter valor único, precisamos e±imφ = e±im(φ+2π) ⇒ m∈Z, (6.2.8) ou seja, m é inteiro e como tal os valores próprios de L̂z são 0, ±~, ±2~, ±3~ , . . . Do lado esquerdo de (6.2.4) obtemos d d sin θ Θ(θ) + α sin2 θ − m2 Θ(θ) = 0 . sin θ dθ dθ (6.2.9) (6.2.10) 6.2 Os Harmónicos Esféricos 171 Para resolvermos esta equação fazemos uma mudança de variável: χ ≡ cos θ dχ d d d = = − sin θ , dθ dθ dχ dχ ⇒ f (χ) ≡ Θ(θ) , (6.2.11) de modo que a equação em θ fica d m2 2 d (1 − χ ) f (χ) + α − f (χ) = 0 . dχ dχ 1 − χ2 (6.2.12) Começamos por considerar o caso com m = 0, ficando a equação d2 f (χ) df (χ) (1 − χ ) − 2χ + αf (χ) = 0 . dχ2 dχ 2 (6.2.13) Esta é uma equação diferencial ordinária de segunda ordem, denominada equação de Legendre. Tentemos encontrar uma solução como uma série de potências f (χ) = ∞ X an χn , (6.2.14) n=0 de modo que a equação fica 2 (1 − χ ) ⇔ ⇔ ∞ X n=0 ∞ X n=0 ∞ X n=0 n−2 n(n − 1)an χ − 2χ ∞ X nan χ n=0 [−n(n − 1) − 2n + α] an χn + n [α − n(n + 1)] an χ + ∞ X n−1 ∞ X n=0 +α ∞ X an χn = 0 n=0 n(n − 1)an χn−2 = 0 , (6.2.15) (m + 2)(m + 1)am+2 χm = 0 m=−2 notando que os termos com m = −2 e m = −1 no último somatório dão contribuição zero e chamando n a m obtemos ⇔ ∞ X n=0 [(α − n(n + 1))an + (n + 2)(n + 1)an+2 ] χn = 0 , (6.2.16) que para ser obedecido implica a relação de recorrência para a série an+2 = (n + 1)n − α an . (n + 2)(n + 1) (6.2.17) Notamos de imediato que an+2 an n→∞ −→ 1 , (6.2.18) 172 Momento Angular Orbital e o Átomo de Hidrogénio de modo que para a série não divergir quando χ = ±1 (que é o valor máximo para χ dado que χ ≡ cos θ) temos de requerer que ela seja finita, isto é que o valor próprio α obedeça a α = ℓ(ℓ + 1) , (6.2.19) para um dado ℓ ∈ N0 . As soluções da equação de Legendre são então polinómios de grau ℓ. Note-se ainda que como a relação de recorrência relaciona apenas an+2 com an , temos que a série de termos pares é independentente da série de termos ı́mpares; a escolha de α = ℓ(ℓ + 1) para um dado ℓ garante que a série com a paridade de ℓ páre; assim para termos uma série finita temos de escolher somente termos pares ou termos ı́mpares: série par (ℓ par) a0 6= 0 , a1 = 0 , série ı́mpar (ℓ ı́mpar) (6.2.20) a0 = 0 , a1 6= 0 . Estes polinómios são designados por polinómios de Legendre e denotados por Pℓ (χ) (grau ℓ) quando obedecem à condição de normalização Z 1 Pℓ (χ)Pℓ′ (χ)dχ = −1 2 δℓℓ′ . 2ℓ + 1 (6.2.21) Os quatro primeiros são • Tomamos ℓ = 0, a0 = 1, a1 = 0 e obtemos P0 (χ) = 1; (6.2.22) • Tomamos ℓ = 1, a0 = 0, a1 = 1 e obtemos P1 (χ) = χ ; (6.2.23) • Tomamos ℓ = 2, a0 = −1/2, a1 = 0 e obtemos P2 (χ) = − 1 1 − 3χ2 ; 2 (6.2.24) • Tomamos ℓ = 3, a0 = 0, a1 = −3/2 e obtemos 5 3 P3 (χ) = − χ + χ3 . 2 2 (6.2.25) 6.2 Os Harmónicos Esféricos 173 Pode-se verificar que com estas normalizações os polinómios obedecem a (6.2.21). Descobrimos pois um conjunto de funções próprias comuns a L̂2 e L̂z , da forma Yℓm (θ, φ) = F (θ)eimφ , (6.2.26) cujo valor próprio de L̂z é m~, com m ∈ Z, e, para m = 0 estas funções tomam a forma Yℓ0 (θ, φ) = CPℓ (cos θ) , (6.2.27) onde C é uma constante de normalização, sendo o valor próprio de L̂2 , ℓ(ℓ + 1)~2 com ℓ ∈ N0 . Vamos agora usar (6.2.27) para construir Yℓm (θ, φ) com m 6= 0. Primeiro notamos que os valores de m e ℓ não são completamente independentes. Por definição L̂2 = L̂2x + L̂2y + L̂2z ; (6.2.28) o valor esperado desta equação num determinado estado com momento angular bem definido, |Ψi = | . . . , ℓ, mi (normalizado) é hΨ|L̂2 |Ψi = hΨ|L̂2x + L̂2y + L̂2z |Ψi , (6.2.29) e dado que L̂x e L̂y são hermı́ticos ℓ(ℓ + 1)~2 = kL̂x |Ψik2 + kL̂y |Ψik2 + m2 ~2 ≥ m2 ~2 , o que equivale a que |m| ≤ (6.2.30) p ℓ(ℓ + 1), ou, como |m|, ℓ ∈ N0 , |m| ≤ ℓ . (6.2.31) Note-se que assumimos que mesmo para m 6= 0 os estados próprios do momento angular têm valor próprio de L̂2 igual a ℓ(ℓ + 1)~2 ; iremos confirmar isto em baixo. Segundo definimos os operadores de escada L̂+ = L̂x + iL̂y , L̂− = L̂x − iL̂y . (6.2.32) 174 Momento Angular Orbital e o Átomo de Hidrogénio Estes operadores obedecem às relações de comutação h i L̂2 , L̂± = 0 , h i L̂− , L̂+ = −2~L̂z , h i L̂z , L̂± = ±~L̂± . (6.2.33) Por exemplo, h i h i L̂− , L̂+ = L̂x − iL̂y , L̂x + iL̂y = −2~L̂z . (6.2.34) h i Compare-se as relações de comutação L̂z , L̂± = ±~L̂± com as relações (5.1.9) e (5.1.10); são idênticas, pelo que podemos fazer uma analogia para L̂+ /L̂− como operadores de criação/destruição e para L̂z como operador de número. Mais concretamente, L̂+ /L̂− vão transformar um estado com momento angular segundo z, m~, num estado com mais/menos um quantão de momento angular segundo z, (m+1)~/(m−1)~. Isto, sem alterar o momento h i 2 2 angular total ~ ℓ(ℓ + 1), pois L̂ , L̂± = 0, o que justifica a hipótese tomada acima de que os valores próprios de L̂2 mantinham a sua forma para m 6= 0. Deste modo tomamos para estados próprios do momento angular o conjunto {|ℓ, mi}, com |m| ≤ ℓ e L̂2 |ℓ, mi = ℓ(ℓ + 1)~2 |ℓ, mi , L̂+ |ℓ, mi = Cℓm |ℓ, m + 1i , L̂z |ℓ, mi = m~|ℓ, mi L̂− |ℓ, mi = C̃ℓm |ℓ, m , (6.2.35) − 1i onde Cℓℓ = 0, C̃ℓ−ℓ = 0, para garantir que |m| ≤ ℓ. Tal como para o oscilador harmónico (fórmulas (5.1.30) e (5.1.31)), as constantes Cℓm , C̃ℓm são necessárias para garantir a normalização dos estados. Para vermos a forma destas constantes notamos que L̂∓ L̂± = L̂2x + L̂2y ∓ iL̂y L̂x ± iL̂x L̂y = L̂2x + L̂2y h i ± i L̂x , L̂y = L̂2 − L̂2z ∓ ~L̂z . (6.2.36) Logo, hℓ, m|L̂∓ L̂± |ℓ, mi = hℓ, m|L̂2 − L̂2z ∓ ~L̂z |ℓ, mi = ~2 ℓ(ℓ + 1) − m2 ∓ m hℓ, m|ℓ, mi . (6.2.37) Mas, por outro lado, hℓ, m|L̂− L̂+ |ℓ, mi = Cℓm (Cℓm )∗ hℓ, m + 1|ℓ, m + 1i , ∗ m m hℓ, m|L̂+ L̂− |ℓ, mi = C̃ℓ C̃ℓ hℓ, m − 1|ℓ, m − 1i (6.2.38) 6.2 Os Harmónicos Esféricos 175 e como tal ~2 (ℓ(ℓ + 1) − m(m + 1)) hℓ, m|ℓ, mi = Cℓm (Cℓm )∗ hℓ, m + 1|ℓ, m + 1i . ∗ ~2 (ℓ(ℓ + 1) − m(m − 1)) hℓ, m|ℓ, mi = C̃ℓm C̃ℓm hℓ, m − 1|ℓ, m − 1i (6.2.39) Concluimos que para garantir que a acção dos operadores em escada preserva a normalização dos estados tomamos p Cℓm = ~ ℓ(ℓ + 1) − m(m + 1) , C̃ℓm = ~ que naturalmente obedecem a Cℓℓ = 0, C̃ℓ−ℓ = 0. p ℓ(ℓ + 1) − m(m − 1) , (6.2.40) Terceiro, os operadores em escada na representação |~xi e em coordenadas esféricas tomam a forma (usando (6.2.32) e (6.1.14)) ∂ ∂ iφ , + i cot θ L̂+ = ~e ∂θ ∂φ ∂ ∂ −iφ L̂− = −~e , − i cot θ ∂θ ∂φ (6.2.41) (6.2.42) e os estados |ℓ, mi tomam a forma Yℓm (θ, φ), sendo a condição de normalização Z π Z 2π dθ dφ sin θYℓm (Yℓm )∗ = 1 , θ=0 (6.2.43) φ=0 e designam-se por harmónicos esféricos. Consideremos os primeiros √ • Para ℓ = 0, m = 0 temos Y00 = C; normalizando obtemos C = 1/ 4π, logo 1 Y00 = √ ; 4π (6.2.44) • Para ℓ = 1, m = 0 temos Y10 = C cos θ; normalizando obtemos C = r 3 0 Y1 = cos θ , 4π p 3/(4π), logo (6.2.45) e usando √ L̂+ |1, 0i = ~ 2|1, 1i ⇔ 1 Y11 = √ ~eiφ 2~ ∂ ∂ + i cot θ ∂θ ∂φ r Y10 = − 3 iφ e sin θ , 8π (6.2.46) 176 Momento Angular Orbital e o Átomo de Hidrogénio e de um modo semelhante √ L̂− |1, 0i = ~ 2|1, −1i ⇔ Y1−1 1 = − √ ~e−iφ 2~ ∂ ∂ − i cot θ ∂θ ∂φ Y10 = • Para ℓ = 2, m = 0 temos Y20 = C(3 cos2 θ − 1); normalizando obtemos C = logo Y20 = r 5 (3 cos2 θ − 1) , 16π r 3 −iφ e sin θ ; 8π (6.2.47) p 5/(16π), (6.2.48) e pela acção dos operadores em escada obtemos √ r 15 iφ e cos θ sin θ , 8π (6.2.49) r √ ∂ 1 15 −iφ ∂ L̂− |2, 0i = ~ 6|2, −1i ⇔ Y2−1 = − √ ~e−iφ Y20 = − i cot θ e cos θ sin θ , ∂θ ∂φ 8π 6~ (6.2.50) r ∂ 1 iφ ∂ 15 2iφ 2 Y21 = ~e + i cot θ e sin θ , L̂+ |2, 1i = ~2|2, 2i ⇔ Y22 = 2~ ∂θ ∂φ 32π (6.2.51) r 1 ∂ ∂ 15 −2iφ 2 L̂− |2, −1i = ~2|2, −2i ⇔ Y2−2 = − ~e−iφ Y2−1 = − i cot θ e sin θ . 2~ ∂θ ∂φ 32π (6.2.52) L̂+ |2, 0i = ~ 6|2, 1i ⇔ Y21 1 = √ ~eiφ 6~ ∂ ∂ + i cot θ ∂θ ∂φ Y20 =− Nas figuras 6.1, 6.2, 6.3 é representada a dependência angular da função Yℓm (Yℓm )∗ . Como toda a dependência em φ desaparece, a figura obtida é dada pela revolução em torno do eixo dos z das figuras planares exibidas. 6.3 Partı́cula numa força central Consideremos o operador Hamiltoniano para uma partı́cula sem spin num campo de forças central1 Ĥ = 1 P̂ 2 + V̂ (R̂) . 2µ (6.3.1) Denotaremos de futuro a massa por ‘µ’ para evitar confusão com o número quântico azimutal ‘m’. 6.3 Partı́cula numa força central 177 Figura 6.1: Dependência angular dos harmónicos esféricos com número quântico azimutal mı́nimo, Y00 , Y10 , Y20 , respectivamente. Note-se que as zonas de maior probabilidade se encontram ao longo do eixo polar (extraı́do de Cohen et al., ‘Quantum Mechanics’). Figura 6.2: Dependência angular dos harmónicos esféricos com número quântico azimutal máximo, Y00 , Y1±1 , Y1±2 , Y3±3 , Y4±4 respectivamente. Note-se que as zonas de maior probabilidade se encontram ao longo do plano equatorial (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). 178 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.3: Dependência angular dos harmónicos esféricos Y30 , Y3±1 , Y2±2 , Y3±3 , respectivamente. Note-se que as zonas de maior probabilidade se deslocam do eixo polar para o plano equatorial à medida que o número quântico azimutal cresce (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). Vamos reescrever este Hamiltoniano em termos do operador momento angular. Para isso notamos que na representação |~xi P̂ 2 = (−i~∇) · (−i~∇) = −~2 ∆ , onde ∆ é o Laplaciano. Em coordenadas esféricas temos então 1 ∂ ∂2 1 ∂ 1 ∂ 2 2 2 ∂ P̂ = −~ r + 2 sin θ + 2 2 , r 2 ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2 ou ainda, usando o operador distância radial R̂ e definindo o operador radial ~2 ∂ 2 ∂ Ξ̂ ≡ − 2 r , r ∂r ∂r (6.3.2) (6.3.3) (6.3.4) temos em forma de operadores P̂ 2 = Ξ̂ + L̂2 R̂2 ⇒ Ĥ = Ξ̂ L̂2 + + V̂ (R̂) . 2µ 2µR̂2 Desta forma do Hamiltoniano podemos extrair as seguintes conclusões: (6.3.5) 6.3 Partı́cula numa força central 179 i) Quer L̂2 quer L̂z quando representados no espaço de configurações em coordenadas esféricas actuam apenas nas coordenadas angulares, conforme (6.1.14), (6.1.15), logo h i h i h i 2 2 2 1 =0 ⇒ L̂2 , Ĥ = 0 , (6.3.6) L̂ , Ξ̂ = 0 , L̂ , V̂ (R̂) = 0 , L̂ , R̂2 e de um modo semelhante h i L̂z , Ξ̂ = 0 , h i L̂z , V̂ (R̂) = 0 , L̂z , 1 R̂2 =0 [L̂z ,L̂2 ]=0 ⇒ h i L̂z , Ĥ = 0 . (6.3.7) Assim, no problema quântico de uma partı́cula num campo de forças central podemos incluir no C.C.O.C. n o C.C.O.C. = Ĥ, L̂2 , L̂z , (6.3.8) isto é, os estados com energia bem definida (estados estacionários) têm também momento angular bem definido. ii) Para encontrarmos os estados estacionários e o espectro de energias temos de resolver a equação de Schrödinger independente do tempo Ĥ|Φi = E|Φi , (6.3.9) que no espaço de configurações toma a forma 2 ~ ∂2 1 ∂ 1 1 ∂ ∂ 2 ∂ − r + 2 sin θ + 2 2 + V (r) Φ(r, θ, φ) 2µ r 2 ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2 = EΦ(r, θ, φ) . (6.3.10) É natural tomarmos como ansatz para as funções de onda espaciais Φ(r, θ, φ) = f (r)Yℓm (θ, φ) , (6.3.11) de modo aproveitar o conhecimento que adquirimos sobre as funções próprias do momento angular. A equação de onda fica reduzida a uma equação diferencial ordinária de segunda ordem na coordenada radial ℓ(ℓ + 1)~2 ~2 d 2 d r + − + V (r) f (r) = Ef (r) . 2µr 2 dr dr 2µr 2 (6.3.12) 180 Momento Angular Orbital e o Átomo de Hidrogénio 6.4 O átomo de hidrogénio (sem spin) Especializamos agora a equação (6.3.12) para o problema de Coulomb, para o qual V (r) = − 1 e2 , 4πǫ0 r (6.4.1) R(r) , r (6.4.2) e introduzindo a função R(r) por f (r) = o que transforma a equação radial em (usamos µ = me massa do electrão) 2 me e2 2me E 2 2 d −r R(r) = r + r − ℓ(ℓ + 1) R(r) . dr 2 ~2 2πǫ0 ~2 Esta equação tem a forma da chamada equação de Whittaker 2 2 1 z 2 d 2 W (z) , z W (z) = − kz + m − dz 2 4 4 (6.4.3) (6.4.4) cuja solução se toma como sendo da forma W (z) = z m+1/2 e−z/2 g(z) , (6.4.5) o que implica que (denotando dg/dz = g ′ ) g′ d2 W (z) 1 1 1 1 1 ′′ 2 m+1/2 −z/2 g + (2m + 1 − z) + − m+ g , m − =z e + dz 2 z 4 z2 4 z 2 (6.4.6) transformando a equação de Whittaker na equação 1 ′′ ′ g=0. zg + (2m + 1 − z)g + k − m − 2 (6.4.7) Esta equação é agora resolvida por uma série de potências g(z) = ∞ X bn z n , (6.4.8) n=0 que substituindo em (6.4.7) fica ∞ X ∞ X ∞ 1 X z n(n − 1)bn z + (2m + 1 − z) nbn z + k−m− bn z n = 0 2 n=0 n=0 n=0 ∞ X 1 ⇔ (n + 1)(2m + 1 + n)bn+1 − n + m + − k bn z n = 0 2 n=0 n−2 n−1 , (6.4.9) 6.4 O átomo de hidrogénio (sem spin) 181 e obtemos a relação de recorrência bn+1 = n + m − k + 1/2 bn . (n + 1)(n + 2m + 1) (6.4.10) Notemos que esta relação de recorrência implica que bn+1 bn 1 . n n→∞ −→ (6.4.11) Concluimos que a solução da equação de Whittaker tem a forma P∞ bn z n+m+1/2 W (z) = n=0 z/2 . e (6.4.12) Expressando a exponencial no denominador como uma série de potências ez/2 = ∞ X n=0 cn z n , cn = cn+1 2n n! 1 ⇒ = 2n n! cn 2n+1 (n + 1)! n→∞ −→ 1 . 2n (6.4.13) Comparando (6.4.11) com (6.4.13) vemos que os coeficientes decrescem mais rapidamente para a série no denominador. Assim, o comportamento da função quando z → ∞ é dominado pelo numerador e portanto não converge para zero. Para a função de Whittaker convergir para zero quando z → ∞2 requeremos que exista um inteiro, n0 tal que n0 + m − k + 1/2 = 0 , n0 ∈ N0 . (6.4.14) Voltemos agora à equação radial (6.4.3). Para a transformar na forma da equação de Whittaker, (6.4.4) introduzimos a variável z tal que z2 2me E ≡ − 2 r2 4 ~ ⇒ z= √ −8me E r. ~ (6.4.15) Note-se que esta transformação só é possı́vel para E < 0, isto é para os estados ligados, que são exactamente aqueles para os quais esperamos encontrar quantificação da energia. Fazendo esta transformação, (6.4.3) fica da forma de (6.4.4), com r 1 me e2 , m=ℓ+ . − k= 4πǫ0 ~ 2E 2 2 Esta condição é necessária para a função de onda ser normalizável. (6.4.16) 182 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.4: Espectro de energias do Hidrogénio; na figura o número quântico principal é denotado por n (extraı́do de Cohen et al., ‘Quantum Mechanics’). A condição de que a série pára (6.4.14) fica r 1 e2 me 1 n0 + ℓ + − − + =0 ⇔ 2 4πǫ0 ~ 2E 2 E=− e2 4πǫ0 ~ 2 me , (6.4.17) 2(n0 + ℓ + 1)2 ou definindo o número quântico principal N ≡ n0 + ℓ + 1 obtemos 2 2 me e , EN = − 4πǫ0 ~ 2N 2 (6.4.18) que é o espectro de energias do átomo de hidrogénio visto no capı́tulo 2 (relação (2.2.12) com Z = 1). Este espectro de energias só depende do número quântico principal, mas não do momento angular total definido por ℓ ou do momento angular azimutal definido por m. Assim o espectro é degenerado de duas maneiras • Um determinado número quântico principal N pode ser obtido tomando ℓ = 0, 1, . . . , N − 1 , (6.4.19) 6.4 O átomo de hidrogénio (sem spin) 183 E r V(r) Figura 6.5: Espectro de energias do Hidrogénio versus o potencial; compare-se com o caso do oscilador harmónico exibido na figura 5.1. e o correspondente n0 para complementar. Assim temos uma degenerescência de grau N. Na notação dos espectroscopistas a cada valor de ℓ = 0, 1, 2 . . . é atribuı́do uma letra, respectivamente ℓ = s, p, d, f, g, . . . seguindo-se a ordem alfabética. É por isso usual encontrar uma referência, por exemplo, à orbital 2p, o que significa N = 2, ℓ = 1. Esta degenerescência é exibida na figura 6.4; • Para cada ℓ temos 2ℓ + 1 valores possı́veis de m m = −ℓ, −ℓ + 1, . . . , ℓ − 1, ℓ ; (6.4.20) Assim o grau total de degenerescência é, para o nı́vel N 1 + 3 + 5 + . . . + 2N − 1 = N 2 . (6.4.21) Orbitais Para exibirmos a forma explı́cita das funções de onda, também designadas neste contexto por orbitais, notamos que se introduzirmos o raio de Bohr a0 ≡ 4πǫ0 ~2 , me e2 (6.4.22) ~2 1 , 2me a20 N 2 (6.4.23) o espectro de energias (6.4.18) escreve-se EN = − 184 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.6: Funções de onda radiais f(1,0) , f(2,0) e f(2,1) ; na notação da figura R(n,ℓ) = f(N,ℓ) (extraı́do de Cohen et al., ‘Quantum Mechanics’). e como tal a transformação (6.4.15) fica z= 2 r. a0 N (6.4.24) Deste modo, a função de onda radial (6.4.2) fica n+ℓ+1 2r W (z = 2r/Na0 ) e−r/a0 N X R(r) bn = = f(N,ℓ) (r) = . r r r Na 0 n (6.4.25) Notando que usando (6.4.23) em (6.4.16) obtemos k = N, a relação de recorrência é bn+1 = n+ℓ+1−N bn . (n + 1)(n + 2ℓ + 2) A relação de normalização será em geral Z ∞ ∗ f(N,ℓ) f(N,ℓ) r 2 dr = 1 . (6.4.26) (6.4.27) 0 Exemplos: • Estado fundamental: N = 1 ⇒ ℓ = 0; a relação de recorrência reduz-se a bn+1 = n bn , (n + 1)(n + 2) ⇒ b0 ≡ C , bn = 0, n ≥ 1 . (6.4.28) 6.4 O átomo de hidrogénio (sem spin) 185 Logo f(1,0) = 2C −r/a0 e . a0 (6.4.29) Normalizando, Z +∞ r 2 e−2r/a0 dr = 0 a30 4 √ C = 1/ a0 , normalizar ⇒ (6.4.30) onde integramos por partes. Deste modo a função de onda total para o primeiro nı́vel do átomo de hidrogénio, Ψ(N,ℓ,m) (t, r, θ, φ), é 1 e−r/a0 −iE1 t/~ Ψ(1,0,0) (t, r, θ, φ) = f(1,0) (r)Y00 (θ, φ)e−iE1 t/~ = √ e . π (a0 )3/2 (6.4.31) • Orbital 2s: N = 2, ℓ = 0; a relação de recorrência reduz-se a bn+1 = n−1 bn , (n + 1)(n + 2) ⇒ b0 ≡ C , b1 = − C , bn = 0, n ≥ 2 . 2 (6.4.32) Logo f(2,0) C = 2a0 r 2− e−r/2a0 . a0 (6.4.33) Normalizando, Z +∞ 0 r n e−r/a0 dr = (n − 1)!an+1 0 normalizar ⇒ √ C = 1/ 2a0 , (6.4.34) onde integramos por partes. Logo a função de onda total para a orbital 2s do átomo de hidrogénio, é Ψ(2,0,0) (t, r, θ, φ) = f(2,0) (r)Y00 (θ, φ)e−iE2 t/~ 1 = √ 4 2π r 2− a0 e−r/2a0 −iE2 t/~ e . (a0 )3/2 (6.4.35) • As funções de onda radiais para os nı́veis seguintes serão exponenciais multiplicadas por um polinómio de r; na figura 6.6 estão representadas f(1,0) , f(2,0) e f(2,1) . Repetindo este raciocı́nio para todas as orbitais dos três primeiros nı́veis de energia do átomo de Hidrogénio obtemos a seguinte tabela: 186 Momento Angular Orbital e o Átomo de Hidrogénio N ℓ m 1 0 0 2 0 0 2 1 0 2 1 ±1 3 0 0 3 1 0 3 1 ±1 3 2 3 2 ±1 3 2 ±2 0 Função de onda 1 e−r/a0 −iE1 t/~ e Ψ(1,0,0) (t, r, θ, φ) = √ π (a0)3/2 1 r e−r/2a0 −iE2 t/~ e Ψ(2,0,0) (t, r, θ, φ) = √ 2− a0 (a0 )3/2 4 2π 1 r e−r/2a0 cos θe−iE2 t/~ Ψ(2,1,0) (t, r, θ, φ) = √ 3/2 a (a ) 4 2π 0 0 1 r e−r/2a0 sin θe±iφ e−iE2 t/~ Ψ(2,1,±1) (t, r, θ, φ) = √ 3/2 8 π a 0 (a0 ) r 2 e−r/3a0 −iE3 t/~ r 1 e 27 − 18 + 2 2 Ψ(3,0,0) (t, r, θ, φ) = √ 3/2 a a (a ) 81√ 3π 0 0 0 2 r e−r/3a0 r cos θe−iE3 t/~ 6− Ψ(3,1,0) (t, r, θ, φ) = √ 81 π a0 a0 (a0 )3/2 1 r e−r/3a0 r Ψ(3,1,±1) (t, r, θ, φ) = √ sin θe±iφ e−iE3 t/~ 6− 3/2 a0 a0 (a0 ) 81 π 1 r 2 e−r/3a0 (3 cos2 θ − 1)e−iE3 t/~ Ψ(3,2,0) (t, r, θ, φ) = √ 2 3/2 a (a ) 81 6π 0 0 1 r 2 e−r/3a0 sin θ cos θe±iφ e−iE3 t/~ Ψ(3,2,±1) (t, r, θ, φ) = √ 2 3/2 81 π a0 (a0 ) 1 r 2 e−r/3a0 √ sin2 θe±2iφ e−iE3 t/~ Ψ(3,2,±2) (t, r, θ, φ) = 162 π a20 (a0 )3/2 Note-se que a densidade de probabilidade na direcção radial tem a forma ∗ P(N,ℓ) (r)dr = r 2 f(N,ℓ) f(N,ℓ) dr , (6.4.36) que pode ser representada como na figura 6.7. Juntando esta informação com a dos harmónicos esféricos obtemos uma representação da densidade de probabilidade electrónica das orbitais do átomo de hidrogénio dada na figura 6.8. Novas orbitais, ditas hı́bridas, podem ser construı́das sobrepondo diferentes orbitais com o mesmo N. Terminamos esta secção com a observação que na notação de Dirac, as orbitais do átomo de hidrogénio podem ser escritas como os estados {|N, ℓ, mi}, que diagonalizam o C.C.O.C. composto por Ĥ, L̂2 , L̂z e que obedecem a Ĥ|N, ℓ, mi = EN |N, ℓ, mi = − 2 2 L̂ |N, ℓ, mi = ~ ℓ(ℓ + 1)|N, ℓ, mi , ~2 |N, ℓ, mi , 2me a20 N 2 L̂z |N, ℓ, mi = m~|N, ℓ, mi , onde N ∈ N e ℓ, m ∈ N0 com as restrições 0 ≤ ℓ ≤ N − 1 e |m| ≤ ℓ. (6.4.37) 6.4 O átomo de hidrogénio (sem spin) 187 Figura 6.7: Densidade de probabilidade na direcção radial para as funções de onda do átomo de hidrogénio (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). 188 Momento Angular Orbital e o Átomo de Hidrogénio Figura 6.8: Representação artı́stica das primeiras orbitais do átomo de hidrogénio (extraı́do de Eisberg & Resnick, ‘Quantum Physics’). 6.5 O átomo de hidrogénio (sem spin) num campo magnético 6.5 189 O átomo de hidrogénio (sem spin) num campo magnético Vimos na secção anterior a resolução exacta do problema do átomo de hidrogénio (sem spin) em Mecânica Quântica. Na secção 5.3 tinhamos visto a resolução exacta do problema de uma carga num campo magnético uniforme. Vamos agora combinar estes dois problemas e considerar que o átomo de hidrogénio está imerso num campo magnético, que tomamos como sendo uniforme. Note-se que esta última hipótese é perfeitamente adequada à experimentação, uma vez que os campos magnéticos produzidos no laboratório variam muito pouco em escalas da ordem do tamanho atómico. Não nos irá ser possı́vel, neste caso, a resolução exacta do problema. Mas com algumas aproximações conseguiremos determinar a alteração do espectro do átomo de hidrogénio devida ao campo magnético, denominada Efeito Zeeman. 6.5.1 Dedução dos vários termos do Hamiltoniano O Hamiltoniano clássico para um electrão (carga q massa me ), num campo electromagnético é dado por (1.3.20) H= ~ 2 (~p − q A) + qφ . 2me (6.5.1) ~ uniforme, podemos escrever o potencial magnético na forma Sendo o campo B ~ = − 1 ~r × B ~ A 2 ⇔ ~ = − 1 (yBz − zBy , zBx − xBz , xBy − yBx ) ; A 2 (6.5.2) ~ é constante, segue-se que de facto, como B ~ = (Bx , By , Bz ) = B ~ , ∇×A (6.5.3) como é necessário pela definição de potencial magnético. Logo, para o problema quântico, expressamos o operador Hamiltoniano, obtido por quantificação canónica, na forma: Ĥ = h i2 ~ ~ ~ P̂ + 2q R̂ × B 2me ~ + qφ(R̂) . (6.5.4) 190 Momento Angular Orbital e o Átomo de Hidrogénio ~ sendo constante não é operador. Tratemos do quadrado perfeito Note-se que B i2 h i h i h q~ q~ q~ ~ ~ ~ ~ = P̂ ~ · P̂ ~ + R̂ × B + R̂ × B P̂ + R̂ × B 2 2 2 q2 2 ~2 q ~ ~ ~ ~ ~ ~ + (R̂ × B) ~ · P̂ + ~ . = P̂ + P̂ · (R̂ × B) R̂ × B 2 4 (6.5.5) Consideremos as seguintes identidades do cálculo vectorial ~ × B) ~ · (C ~ × D) ~ = (A ~ · C)( ~ B ~ · D) ~ − (A ~ · D)( ~ B ~ · C) ~ , (A ~ · (B ~ × C) ~ =C ~ · (A ~ × B) ~ , A (6.5.6) sendo que a segunda pode ser reescrita como ~ × B) ~ ·C ~ = −(A ~ × C) ~ ·B ~ . (A (6.5.7) Aplicando estas identidades a (6.5.5) obtemos h q2 2 i2 q~ ~ ~2 q ~ ~ ~ ~ ~ ~ ~ ~2 ~ ~ 2 ~ P̂ + R̂ × B = P̂ + B · (P̂ × R̂) − (R̂ × P̂ ) · B + R̂ B − (R̂ · B) . 2 2 4 (6.5.8) Verificamos que surge o operador momento angular ~ ~ ~ ~ ~ L̂ = R̂ × P̂ = −P̂ × R̂ , (6.5.9) ~ ~ onde a segunda igualdade é verdadeira apesar de R̂ e P̂ não comutarem; de facto cada componente do momento angular é da forma X̂ i P̂j − X̂ j P̂i com i 6= j, pelo que a ordem com que aparecem as posições e os momentos é irrelevante. Logo o Hamiltoniano do problema é ~2 P̂ q ~ ~ q2 2 ~ 2 ~ ~ ~ 2 Ĥ = + qφ(R̂) , R̂ B − (R̂ · B) − L̂ · B + 2me 2me 8me (6.5.10) que reescrevemos como Ĥ ≡ Ĥ0 + Ĥ1 + Ĥ2 , (6.5.11) onde definimos ~2 P̂ ~ + qφ(R̂) , Ĥ0 ≡ 2me Ĥ1 ≡ − µB ~ ~ L̂ · B , ~ Ĥ2 ≡ ~2 q2B R̂2 , 8me ⊥ (6.5.12) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 191 e ainda, o magnetão de Bohr µB ≡ q~ , 2me (6.5.13) que tem as dimensões de um momento magnético (carga vezes momento angular a dividir por massa), e o operador ~ ~ 2 ~ 2 (R̂ · B) 2 R̂⊥ = R̂ − , ~2 B (6.5.14) ~ ~ Se escolhermos um sistema cartesiano que é a projecção de R̂ num plano perpendicular a B. ~ = Bez , fica eB 2 R̂⊥ = X̂ 2 + Ŷ 2 . (6.5.15) Notemos os casos limites deste Hamiltoniano: ~ = 0, Ĥ fica reduzido a Ĥ0 , que, com o potencial de Coulomb é o problema • Tomando B da secção 6.4; ~ = Bez , Ĥ fica • Tomando φ = 0 e escolhendo B Ĥ = P̂x2 + P̂y2 + P̂z2 qB q2B 2 2 − L̂z + X̂ + Ŷ 2 , 2me 2me 8me (6.5.16) que coincide com o Hamiltoniano (5.3.4) do problema de Landau. 6.5.2 Interpretação dos vários termos do Hamiltoniano ~ = 0 o Hamiltoniano reduz-se a Ĥ0 , isto é a soma da energia cinética com a Quando B ~ = energia potencial. Mas quando B 6 0, Ĥ0 já não pode ser interpretado como a energia cinética mais a energia potencial. Para verificarmos este ponto consideremos a seguinte análise clássica. O Hamiltoniano de uma carga sob a acção de um campo electromagnético é dado por (1.3.20) que podemos reescrever em termos da velocidade H= ~ 2 (~p − q A) 1 2 + qφ = me~x˙ + qφ , 2me 2 (6.5.17) logo a energia cinética na presença de um campo magnético é Ec = ~ 2 (~p − q A) , 2me (6.5.18) 192 Momento Angular Orbital e o Átomo de Hidrogénio ~ Para um e não p~2 /2me . O significado fı́sico de p~2 /2me depende da gauge escolhida para A. ~ uniforme, com a escolha de gauge (6.5.2) e tomando B ~ = Bez temos (usando a campo B frequência ciclotrónica ωc = qB/me ) ~p q ~ = p~ − ωc r (cos φey −sin φex ) ~x˙ = + ~r × B me 2me me 2 ⇔ ~p ωc r = ~x˙ − (sin φex −cos φey ) , me 2 (6.5.19) ou seja a ‘velocidade’ p~/me é a velocidade da partı́cula relativamente a um referencial em rotação em torno da direcção do campo uniforme, com velocidade angular ωc /2, no sentido directo, denominado referencial de Larmor. Assim, • H0 é a energia cinética da partı́cula relativamente ao referencial de Larmor mais a energia potencial; • H2 , que coincide com i2 me h ωc r (sin φex − cos φey ) , 2 2 (6.5.20) é a energia cinética do referencial de Larmor; • H1 é um termo cruzado que surge sempre que a velocidade da partı́cula relativamente ao referencial de Larmor não seja ortogonal à velocidade do referencial de Larmor. A interpretação que acabamos de dar dos vários termos é puramente mecânica. Mas os termos Ĥ1 e Ĥ2 têm também uma interpretação electromagnética de interesse. Para a compreendermos consideramos novamente uma análise clássica. Define-se geralmente a densidade de momento magnético (ou magnetização) como sendo i 1h ~ ~ M(~x) = ~x × i(~x) , 2 (6.5.21) onde ~i é o vector densidade de corrente; o integral da densidade de magnetização é a magnetização total ou momento magnético total ou ainda o dipolo magnético 1 ~µ = 2 Z V ~x × ~i(~x)d3~x . (6.5.22) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 193 No caso em que uma corrente com intensidade I só existe ao longo de um circuito fechado e planar, com elemento de linha d~l, o integral de volume reduz-se a um integral de linha fechado I ~µ = 2 I ~x × d~l = AIn , (6.5.23) onde n é a ortogonal ao plano com orientação dada pelo sentido da corrente e A é a área planar delimitada pelo circuito. Se considerarmos uma carga com movimento circular e uniforme com velocidade angular v/r = ω, associamos-lhe uma intensidade de corrente I = densidade de carga × velocidade = qv ; 2πr (6.5.24) como a superfı́cie delimitada pelo circuito tem área A = πr 2 , o momento magnético é ~µ = IAn = qvr n. 2 (6.5.25) ~ de uma tal carga com um movimento circular Consideremos agora o momento angular L e uniforme anterior que se move num campo magnético constante que representamos na gauge (6.5.2); por definição ~ , ~ = ~r × ~p = ~r × (me~v + q A) ~ = me rvn − q ~r × (~r × B) L 2 (6.5.26) que usando a identidade ~a × (~b × ~c) = ~b(~a · ~c) − ~c(~a · ~b) , e (6.5.25) reescrevemos como i qh 2me 2~ ~ ~ (~r · B)~r − r B ~µ − L= q 2 ⇔ (6.5.27) i q ~ q2 h 2~ ~ ~µ = L+ (~r · B)~r − r B . (6.5.28) 2me 4me Assim, a nossa carga tem duas contribuições para o seu momento magnético. Uma devido a estar numa órbita circular e consequentemente ter momento angular; uma segunda devido a estar imersa num campo magnético. A densidade de energia3 devida à interacção entre o momento magnético e um campo magnético externo é i q ~ ~ q2 h 2 2 ~ ~ 2 , dH = −~µ · dB ⇒ H=− L·B+ r B − (~r · B) 2me 8me (6.5.29) ~ onde Em sistemas magnéticos a segunda lei da termodinâmica pode ser escrita dF = −SdT − µ ~ · dB, F é a energia livre de Helmholtz. 3 194 Momento Angular Orbital e o Átomo de Hidrogénio que são exactamente os análogos clássicos dos termos Ĥ1 e Ĥ2 em (6.5.10). Assim o termo H1 pode ser escrito como ~ , H1 = −~µL · B (6.5.30) onde ~µL = q ~ L. 2me (6.5.31) Este termo é, portanto, a energia de acoplamento entre o campo magnético externo e o momento magnético do electrão que resulta do seu momento angular, ~µL . É denominado acoplamento paramagnético, pois é energeticamente vantajoso o momento magnético do electrão encontrar-se paralelo ao campo externo. Por outro lado, o termo H2 , é a energia de acoplamento entre o campo magnético externo e o momento magnético do electrão que é induzido pelo próprio campo externo. A sua contribuição para a energia é positiva pelo que este momento magnético induzido é anti-paralelo ao campo indutor. É denominado acoplamento diamagnético. Como veremos na próxima secção, o acoplamento diamagnético é bem menos importante que o paramagnético e só tem de ser considerado em estados com momento angular zero. Na natureza, substâncias diamagnéticas consistem de átomos ou moléculas com momento angular total zero. A aplicação de um campo magnético externo leva à criação de correntes atómicas em circulação que produzem um momento magnético antiparalelo ao campo externo; de facto, o termo diamagnético é o associado ao referencial de Larmor, como vimos em cima. O Bismuto é a substância mais diamagnética conhecida. Se os átomos ou moléculas constituintes da substância tiverem um momento angular total não nulo, oriundo de electrões desemparelhados, a substância é paramagnética. Imerso num campo magnético, o momento magnético do electrão desemparelhado alinhar-se-á paralelamente ao campo. Nota: Em geral, uma carga q (massa m) com momento angular J~, seja ele de origem orbital ou intrı́nseco (spin), tem um momento magnético dado por ~µ = g q ~ J , 2m (6.5.32) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 195 onde g se denomina a razão giromagnética. Para uma carga clássica com o J~ de origem orbital, g = 1 - como exemplificado em cima - mas para o electrão com o seu J~ intrı́nseco, verifica-se que g ≃ 2. De facto g = 2 é a previsão da equação de onda relativista (eq. de Dirac), mas efeitos associados às flutuações quânticas do vácuo alteram ligeiramente este valor, denominado por razão giromagnética anómala. Este valor pode ser calculado em electrodinâmica quântica (QED) com grande precisão e o acordo com a experiência verifica-se com 10 algarismos significativos! 6.5.3 Comparação dos vários termos no Hamiltoniano ~ =0 Vamos agora comparar as ordens de magnitude dos três termos em (6.5.10). Quando B ficamos apenas com Ĥ0 , cujo espectro de energias é (6.4.23). Como tal associamos com este termo energias da ordem de E0 ∼ ~2 . me a20 (6.5.33) Pela forma do operador Ĥ1 (6.5.12), tomando um campo magnético na direcção z e recordando que os valores próprios de L̂z são inteiros vezes ~ concluimos que dará origem a energias da ordem de E1 ∼ qB~ . me (6.5.34) 2 Por outro lado, assumindo que os elementos de matriz do operador R̂⊥ são da ordem de grandeza de a20 , dado que o raio de Bohr caracteriza as distâncias atómicas, temos que q 2 B 2 a20 . E2 ∼ me (6.5.35) Concluimos imediatamente as seguintes ordens de grandeza relativas: E2 E1 Bqa20 ∼ ∼ ∼ B(Tesla) × 10−5 . E1 E0 ~ (6.5.36) Sendo os maiores campos magnéticos produzidos em laboratório da ordem dos 100 Tesla, concluimos que nessas experiências E2 ≪ E1 ≪ E0 . 196 Momento Angular Orbital e o Átomo de Hidrogénio 6.5.4 Espectro de Energias aproximado: efeito Zeeman Vamos agora então levar a cabo a tarefa a que nos propusemos: ver como o espectro de um átomo de hidrogénio se altera quando imerso num campo magnético. A aproximação que vamos usar é a de negligenciar o termo Ĥ2 , que, como vimos na secção anterior, tem uma grandeza inferior aos outros dois. Assim, consideramos como Hamiltoniano aproximado ~2 q ~ ~ P̂ ~ + qφ(R̂) − L̂ · B . Ĥ ≃ Ĥ0 + Ĥ1 = 2me 2me (6.5.37) Ao fazermos esta aproximação, o único operador novo relativamente ao problema do átomo ~ ~ de hidrogénio sem campo magnético (descrito por Ĥ0 ) é L̂ · B; no problema sem campo ~ = Bez , verificamos que o magnético tomamos o C.C.O.C.= {Ĥ0 , L̂2 , L̂z }. Tomando B único operador no termo novo é L̂z , que é diagonalizado pelos mesmos estados que diagonalizam Ĥ0 , que têm a forma (6.4.37). A acção do operador Hamiltoniano nestes estados é dada por Ĥ|N, ℓ, mi = − qB ~2 − m~ |N, ℓ, mi , 2me a20 N 2 2me (6.5.38) pelo que o espectro de energias é agora E(N,m) = EN − µB Bm , (6.5.39) onde EN é espectro do átomo de hidrogénio livre, dado por (6.4.23). Há, portanto um levantamento da degenerescência do espectro de energias; estados com o mesmo número quântico principal, N, mas diferente número quântico azimutal, m, irão em geral ter diferentes energias: efeito Zeeman. Mas note-se que a degenerescência do espectro de energias não é totalmente eliminada; resiste ainda a degenerescência que origina de estados com diferente ℓ mas com o mesmo N e m. Deste modo a degenerescência decresce de N 2 para N − |m| (para valores genéricos de B). Duas notas: • A aproximação falha para estados com m = 0; para esses, a primeira correcção ao espectro do átomo de hidrogénio origina no termo negligenciado (termo diamagnético); 6.5 O átomo de hidrogénio (sem spin) num campo magnético Sem Campo Magnetico Espectro sem Campo 197 Com Campo Magnetico Espectro com Campo Figura 6.9: Efeito Zeeman: Desdobramento das linhas espectrais devido à presença de um campo magnético. Note-se que nem todas as transições são possı́veis; de facto há regras de selecção. • Na realidade, tanto o electrão como o protão têm spin, que estamos aqui a negligenciar. Por essa razão, o espectro anterior não é o observado numa experiência fı́sica real. Mas a inclusão de spin é uma generalização simples do cálculo aqui exemplificado e o efeito fı́sico da alteração das energias (e também das polarizações que veremos a seguir) permanece válido qualitativamente. A presença do campo magnético altera genericamente, como vimos, a energia dos estados estacionários do átomo de hidrogénio. Como tal, a frequência da radiação emitida em transições atómicas é também alterada. Em geral existe um desdobramento das riscas espectrais, como exemplificado na figura 6.9. Mas para além desta alteração das frequências possı́veis, o efeito Zeeman consiste também na alteração da polarização dos fotões emitidos numa transição atómica. Para estudarmos este ponto, consideramos o operador dipolo eléctrico, definido por ~ ~ D̂ ≡ q R̂ . (6.5.40) Consideremos os elementos de matriz deste operador num estado estacionário do átomo de hidrogénio imerso no campo magnético. Continuamos a considerar a aproximação em 198 Momento Angular Orbital e o Átomo de Hidrogénio que negligenciamos o termo diamagnético. Estes estados são os mesmos dos átomo de hidrogénio livre {|N, ℓ, mi}, apenas possuindo energias diferentes. Estes estados têm uma paridade bem definida. Pode-se verificar que Yℓm tem paridade (−1)ℓ . Logo, os estados ~ {|N, ℓ, mi} têm paridade (−1)ℓ . Por outro lado, o operador D̂ é ı́mpar. Logo ~ hN, ℓ, m|D̂|N, ℓ, mi = 0 , (6.5.41) em qualquer estado estacionário. Para termos um dipolo diferente de zero temos de considerar uma sobreposição de estados estacionários. Tomemos uma sobreposição dos estados 1s e 2p, isto é |Ψ(0)i = cos α|1, 0, 0i + sin α|2, 1, mi , (6.5.42) onde m = 0, ±1 e α ∈ R. A energia destes dois estados é E1s = E1 , E2p = E2 − µB Bm = E1 + ~(Ω + mωL ) , (6.5.43) onde EN é dado por (6.4.23), e introduzimos Ω≡ E2 − E1 , ~ ωL ≡ − ωc , 2 (6.5.44) respectivamente a frequência angular associada a um fotão emitido na transição de N = 2 para N = 1 do átomo de hidrogénio livre e a frequência angular do referencial de Larmor. Logo |Ψ(t)i = cos α|1, 0, 0i + sin αe−i(Ω+mωL )t |2, 1, mi e−iE1 t/~ . (6.5.45) Vamos agora calcular o valor esperado do operador dipolo neste estado ~ ~ hD̂i(t) = hΨ(t)|D̂|Ψ(t)i . ~ ~ i(Ω+mωL )t −i(Ω+mωL )t = sin α cos α e h2, 1, m|D̂|1, 0, 0i + e h1, 0, 0|D̂|2, 1, mi (6.5.46) Para calcularmos estes elementos de matriz notamos que ~ D̂ = (D̂x , D̂y , D̂z ) = q(X̂, Ŷ , Ẑ) . (6.5.47) 6.5 O átomo de hidrogénio (sem spin) num campo magnético 199 Por outro lado, recordando a forma dos harmónicos esféricos com ℓ = 1, dada por (6.2.45), (6.2.46) e (6.2.47), podemos escrever estes harmónicos em coordenadas cartesianas como r r 3 z 3 x y ±1 0 ; (6.5.48) , Y1 = ∓ ±i Y1 = 4π r 8π r r invertendo estas relações obtemos r r 2π 2π −1 1 x= r Y1 − Y1 , y = i r Y1−1 + Y11 , 3 3 z= r 4π 0 rY . 3 1 (6.5.49) Deste modo, usando a representação do produto escalar no espaço de configurações temos h1, 0, 0|D̂x|2, 1, mi = r Z 2π Z π Z +∞ 2π 2 0 ∗ = r Y1−1 − Y11 f(2,1) (r)Y1m dφ dθ drr sin θ f(1,0) (r)Y0 q 3 0 Z 2π 0 Z π 0 qχ =√ dφ dθ sin θ Y1−1 − Y11 Y1m , 6 0 0 (6.5.50) onde definimos χ≡ Z +∞ r 3 f(1,0) (r)f(2,1) (r)dr , (6.5.51) 0 e usamos o facto que as funções de onda radiais são reais. Usamos também o valor de Y00 = √ 1/ 4π. Usamos agora o facto de que os harmónicos esféricos são uma base ortonormal do espaço de funções de quadrado somável na esfera. A relação de ortonormalização é Z 2π Z π ′ mm′ dφ dθ sin θ(Yℓm (θ, φ))∗ Yℓm . (6.5.52) ′ (θ, φ) = δℓℓ′ δ 0 0 Logo, dado que (Y1±1 )∗ = −Y1∓1 Z Z π ∗ qχ 2π qχ dφ h1, 0, 0|D̂x|2, 1, mi = √ dθ sin θ −Y11 + Y1−1 Y1m = √ (−δ 1m + δ −1m ) . 6 0 6 0 (6.5.53) Cálculos análogos revelam que Z Z π qχ qχ 2π dφ dθ sin θi Y11 + Y1−1 Y1m = −i √ (δ 1m + δ −1m ) , h1, 0, 0|D̂y |2, 1, mi = √ 6 0 6 0 (6.5.54) Z Z π qχ 2π qχ h1, 0, 0|D̂z |2, 1, mi = √ (6.5.55) dφ dθ sin θY10 Y1m = √ δ 0m . 3 0 3 0 200 Momento Angular Orbital e o Átomo de Hidrogénio Podemos agora concluir que o valor esperado das várias componentes do operador dipolo eléctrico é o seguinte: qχ hD̂x i(t) = √ sin(2α) cos[(Ω − ωL )t]δ −1m − cos[(Ω + ωL )t]δ 1m , 6 qχ hD̂y i(t) = − √ sin(2α) sin[(Ω − ωL )t]δ −1m + sin[(Ω + ωL )t]δ 1m , 6 qχ hD̂z i(t) = √ sin(2α) cos(Ωt)δ m0 . 3 (6.5.56) (6.5.57) (6.5.58) Para qualquer um dos três valores possı́veis de m, o valor esperado do dipolo eléctrico é uma função oscilatória do tempo. Logo haverá emissão de radiação electromagnética. Podemos pensar nessa radiação como sendo emitida devido à transição |2, 1, mi → |1, 0, 0i. Para estudarmos as caracterı́sticas dessa radição tomemos os três valores possı́veis de m separadamente: • m = +1, temos qχ qχ hD̂y i(t) = − √ sin(2α) sin[(Ω + ωL )t] , hD̂x i(t) = − √ sin(2α) cos[(Ω + ωL )t] , 6 6 hD̂z i(t) = 0 . (6.5.59) A frequência angular da radiação emitida, ωrad , é igual à frequência angular de oscilação do dipolo: ωrad = Ω + ωL ⇒ νrad = E(2,1) − E(1,0) ωrad (E2 − µB B) − E1 = = , (6.5.60) 2π h h que é exactamente a frequência esperada na transição |2, 1, 1i → |1, 0, 0i. A polarização da radiação emitida vai depender da direcção. Consideremos a direcção com versor ~n. De acordo com o electromagnetismo clássico, o estado de polarização da radiação será dado pelo vector ~k p = (~n × D) ~ × ~n = D ~ − ~n(~n · D) ~ ⇔ (kxp , kyp , kzp ) = ((1 − n2x )Dx − nx ny Dy , (1 − n2y )Dy − nx ny Dx , −nz (nx Dx + ny Dy )) , (6.5.61) ~ num plano ortogonal a ~n. que corresponde a projecção de D 6.5 O átomo de hidrogénio (sem spin) num campo magnético 201 - Radiação emitida na direcção Oz: nx = ny = 0, logo ~k p = D ~ ⇒ (k p )2 + (k p )2 = constante ; x y (6.5.62) A polarização é circular no sentido directo que é o movimento efectuado pelo vector dipolo eléctrico; - Radiação emitida na direcção xOy: nz = 0, logo n2x + n2y = 1, pelo que ~k p = (ny (ny Dx − nx Dy ), nx (nx Dy − ny Dx ), 0) ⇒ nx k p = −ny k p ; (6.5.63) x y A polarização é linear; - Numa direcção arbitrária a polarização é elı́ptica. • m = 0, temos hD̂x i(t) = 0 , hD̂y i(t) = 0 , qχ hD̂z i(t) = √ sin(2α) cos(Ωt) . 3 (6.5.64) A frequência angular é ωrad = Ω ⇒ νrad = E(2,0) − E(1,0) ωrad E2 − E1 = = , 2π h h (6.5.65) que é exactamente a frequência esperada na transição |2, 1, 0i → |1, 0, 0i. A polarização neste caso é linear em todas as direcções excepto na direcção Oz, em que não é emitida radiação. • m = −1, temos qχ qχ hD̂y i(t) = − √ sin(2α) sin[(Ω − ωL )t] , hD̂x i(t) = √ sin(2α) cos[(Ω − ωL )t] , 6 6 hD̂z i(t) = 0 . (6.5.66) A frequência angular da radiação emitida é igual à frequência angular de oscilação do dipolo: ωrad = Ω − ωL ⇒ νrad = E(2,−1) − E(1,0) ωrad (E2 + µB B) − E1 = = , (6.5.67) 2π h h 202 Momento Angular Orbital e o Átomo de Hidrogénio (E 2 − E1 )/h ν (E 2 − E1 )/h ν Figura 6.10: Efeito Zeeman - esquerda: riscas observadas na direcção perpendicular ao ~ campo; a polarização da radiação é linear em todas elas, mas é paralela ao campo B na risca central e perpendicular nas riscas laterais; direita: riscas observadas na direcção do campo; têm polarização circular. O espaçamento entre a risca central e as laterais é ∆ν = µB B/h (adaptado de Cohen et al., ‘Quantum Mechanics’). que é exactamente a frequência esperada na transição |2, 1, −1i → |1, 0, 0i. A análise da polarização é semelhante à do caso m = +1, com a diferença de ser circular inversa para a emissão na direcção Oz. As riscas espectrais que acabamos de discutir estão representadas na figura 6.10. Note-se que o resultado da introdução do campo magnético, efeito Zeeman, é não só o aparecimento de novas riscas, mas também de diferentes polarizações. Como nota final mencionamos que o tratamento da radiação dado nesta secção foi clássico, ao contrário do dado ao átomo que foi quântico. Note-se que usamos o teorema ~ ~ e assim deduzirmos de Ehrenfest para associarmos hD̂(t)i com quantidade clássica D(t) a polarização da radiação. Neste sentido, usamos uma aproximação semi-clássica para o problema ‘átomo+radiação’. 6.6 Sumário Estudamos os operadores que descrevem as várias componentes do momento angular e também o momento angular total. Em mecânica clássica, para descrever o momento angular de um sistema fı́sico necessitamos de três números, correspondendo às três componentes do momento angular. Em mecânica quântica os estados próprios do momento angular têm apenas dois números quânticos, correspondendo ao número máximo de operadores que 6.6 Sumário 203 conseguimos diagonalizar simulaneamente: L̂2 e, por escolha, L̂z . Construimos explicitamente a representação no espaço de configurações das funções próprias comuns a estes dois operadores denominadas harmónicos esféricos. Consideramos uma partı́cula num potencial central e mostramos que os estados estacionários vão ter também momento angular bem definido. Especializando para o potencial de Coulomb, deduzimos as funções de onda que diagonalizam simultaneamente a energia, o momento angular total e o momento angular azimutal. Obtemos como resultado (e de primeiros princı́pios) a quantificação da energia que havı́amos estudado no capı́tulo 2 para o átomo de hidrogénio no modelo de Bohr, que reproduzia a fórmula de Balmer para o espectro do hidrogénio. Note-se no entanto que o nosso estudo do átomo de hidrogénio foi incompleto devido à não inclusão do spin. Esta quantidade leva à existência no espectro do hidrogénio duma sub estrutura do espectro que nós deduzimos, denominada estrutura fina. Mergulhamos o átomo de hidrogénio num campo magnético uniforme. Usando uma aproximação em que negligenciamos o termo diamagnético, verificamos o levantamento de parte da degenerescência do espectro de energias correspondendo a inequivalência energética de estados com diferente número quântico azimutal e mesmo número quântico principal. Este facto leva ao aparecimento de novas riscas no espectro do hidrogénio. Estudando o operador dipolo eléctrico vimos também o tipo de polarização correspondente a essas riscas. CAPÍTULO 7 Outras soluções exactas da equação de Schrödinger Soluções analı́ticas exactas da equação de Schrödinger existem apenas para alguns casos especiais; potencias constantes por pedaços (capı́tulo 3), osciladores harmónicos, campos magnéticos constantes (capı́tulo 5) e o potencial de Coulomb (capı́tulo 6) são alguns destes casos que foram estudados aqui. Dada esta limitação, foram construidos vários métodos de aproximação que serão estudados nos próximos capı́tulos. Neste capı́tulo iremos rematar o nosso estudo de modelos exactamente solúveis, procurando esclarecer duas questões: i) Existe alguma estrutura subjacente aos modelos exactamente solúveis? ii) Existe algo análogo aos operadores de criação e destruição do oscilador harmónico para outros modelos exactamente solúveis? Vamos começar por mencionar alguns modelos solúveis, que ilustrarão a dificuldade que, genericamente, existe em os resolver através de um ‘ataque’ directo à equação de Schrödinger, isto é, pelo método diferencial. Seguidamente introduziremos um método algébrico, baseado em operadores análogos aos operadores de criação e destruição do oscilador harmónico. Estes operadores resultam do conceito de superpotencial e potenciais parceiros. Finalmente discutiremos como os potenciais exactamente solúveis têm, genericamente, a propriedade 206 Outras soluções exactas da equação de Schrödinger de invariância de forma, e como esta propriedade pode ser usada para determinar o espectro de energias e as funções próprias de um modelo exactamente solúvel, o que nos permitirá construir, resolver e compreender modelos exactamente solúveis. 7.1 Alguns poços de potencial exactamente solúveis No capı́tulo 3 estudamos potenciais constantes por pedaços. Estes são, obviamente, casos em que existe uma solução exacta da equação de Schrödinger. Não sendo potenciais realistas são casos paradigmáticos que nos ensinam muita da fı́sica desta equação. Dois problemas fundamentais em Mecânica Quântica, que são ilustrados pelos exemplos do capı́tulo 3, são: • Cálculo do espectro de estados ligados: Sempre que temos um estado com energia E num potencial cujo valor assimptótico, para ambos os lados, é maior do que E, este estado é denominado estado ligado. Significa que está “preso” num tipo de poço de potencial. Sempre que existem estados ligados existe discretização de energias. A interpretação fı́sica é que nem todos os comprimentos de onda podem existir no poço de potencial como estados estacionários, devido à interferência com as ondas reflectidas nas paredes do potencial. O cálculo do espectro de energias de estados ligados é um importante problema em Mecânica Quântica. • Cálculo da difusão de uma partı́cula num potencial : A função de onda que descreve a partı́cula quântica sofre difusão, ou espalhamento, que depende das variações no espaço e no tempo do potencial onde se propaga. Em problemas a uma dimensão, esta difusão é quantificada pelos factores de reflexão e transmissão. Em mais do que uma dimensão iremos definir (capı́tulo 9) uma secção eficaz diferencial de difusão. Em qualquer dos casos a difusão da função de onda permite calcular a distribuição de probabilidade espacial de encontar a partı́cula. Esta difusão permite ainda efeitos fı́sicos inexistentes em Mecânica clássica, como o efeito túnel. Um estado com energia E tem uma função de onda não nula mesmo em zonas onde o potencial é maior que a energia (só será zero se o potencial for infinitamente maior do que a energia). Isso 7.1 Alguns poços de potencial exactamente solúveis 207 permite que a função de onda de um estado com energia E seja diferente de zero em ambos os lados de uma barreira de potencial mais elevado do que o valor de E. Esta é a origem do efeito túnel. O cálculo do factor de transmissão através de uma barreira de potencial é também um importante problema em Mecânica Quântica. Neste capı́tulo debruçar-nos-emos exclusivamente sobre o cálculo dos estados ligados. Notese que a difusão, e em particular o factor de transmissão por efeito túnel, será também exactamente calculável num modelo solúvel em que o efeito exista (como no potencial de Pöschl-Teller invertido). 7.1.1 Estados Ligados em Poços infinitos Comecemos por estudar o espectro de estados ligados em alguns potenciais com profundidade infinita. Poço de potencial rectangular de profundidade infinita Como visto na secção 3.2.7, para um poço de profundidade infinita V (x) = 0 para x ∈ [0, L] , V (x) = +∞ para x > L e x < 0 , (7.1.1) o espectro de energias é En = n2 π 2 ~2 , 2mL2 n = 1, 2, 3, . . . e a parte espacial da função de onda normalizada é r nπx 2 Φn (x) = para x ∈ [0, L] , sin L L (7.1.2) (7.1.3) e zero fora deste intervalo. O espectro de energias e as funções de onda dos três estados estacionários de energia mais baixa estão representados nas figuras 7.1 e 7.2. Oscilador Harmónico Como visto no capı́tulo 5, para o potencial harmónico V (x) = mω 2 2 x , 2 (7.1.4) 208 Outras soluções exactas da equação de Schrödinger E E V(x) V(x) x x Figura 7.1: Nı́veis de energia no oscilador harmónico e no poço de potencial rectangular de profundidade infinita. 1 0.6 0.5 0.4 0.2 0 0 -4 -2 0 0 2 0.5 4 1 1.5 2 x x -0.2 -0.5 -0.4 -0.6 -1 Figura 7.2: Funções de onda dos três estados estacionários de energia mais baixa do oscilador harmónico e do poço de potencial rectangular de profundidade infinita. Note-se que o número de nodos aumenta com a energia. o espectro de energias é 1 En = ~ω n + , 2 n = 0, 1, 2, . . . (7.1.5) e a parte espacial da função de onda normalizada é Φn (x) = mω 1/4 π~ √ 1 2n · n! Hn r mω 2 x e−mωx /2~ , ~ (7.1.6) onde Hn são polinómios de Hermite. O espectro de energias e as funções de onda dos três estados estacionários de energia mais baixa estão representados nas figuras 7.1 e 7.2. 7.1 Alguns poços de potencial exactamente solúveis 209 5 4 3 2 1 0 0 1 2 3 4 5 x Figura 7.3: O potencial V (x) = (1/x − x)2 . O espaçamento entre os nı́veis de energia é constante. Poço da forma V0 (a/x − x/a)2 O potencial V (x) = V0 a x − x 2 , a x>0, V0 > 0 , (7.1.7) admite solução analı́tica exacta (ver Folha 1, Problema 1). Este potencial é representado na figura 7.3. O espectro de energias tem a forma ( !) r r r 1 1 8V0 8mV0 a2 8mV0 a2 n+ + +1− , En = ~ ma2 2 4 ~2 ~2 n = 0, 1, 2, . . . e a parte espacial das funções de onda tem a forma ! ! r r 1 mV0 2 2mV0 2 Φn (x) = cn xν exp − , x F −n, ν + , x 2 2 2~ a 2 ~2 a2 onde F (a, b, z) são funções confluentes hipergeométricas, ! r 1 8mV0 a2 ν≡ +1+1 , 2 ~2 (7.1.8) (7.1.9) (7.1.10) e cn são constantes de normalização. Notamos que a função confluente hipergeométrica tem expansão F (a, b; χ) = +∞ X (a)p χp p=0 (b)p p! , (7.1.11) 210 Outras soluções exactas da equação de Schrödinger onde os sı́mbolos de Pochhammer são definidos da seguinte forma: (a)p = a(a + 1)(a + 2) . . . (a + p − 1) , (a)0 = 1 . (7.1.12) Devido ao primeiro argumento da função confluente hipergeométrica ser um inteiro negativo, a função reduz-se a um polinómio finito, de grau n. Explicitamente, nas três primeiras funções de onda usamos F (0, b; χ) = 1 , F (−1, b; χ) = 1 − χ , b F (−2, b; χ) = 1 − 2χ χ2 + . b b(b + 1) (7.1.13) As três primeiras funções de onda dos estados estacionários estão representadas na figura 7.4. Note-se que, devido ao comportamento para x grande ser o mesmo do oscilador harmónico, o espectro é o de um oscilador harmónico. Neste limite o potencial fica aproximadamente V (x) ≃ V0 2 x ,x > 0 a2 V (x) ≃ 0 , x < 0 , ou seja metade de um potencial harmónico com frequência ω = (7.1.14) p 2V0 /ma2 . Para um potencial harmónico truncado desta maneira, só subsistem metade dos nı́veis de energia (funções de onda ı́mpares), pelo que a frequência é efectivamente o dobro da frequência do potencial harmónico completo. Logo, para o potencial (7.1.14) esperamos uma frequência r 2V0 ω=2 , (7.1.15) ma2 que é de facto a que observamos em (7.1.8). Esta é também a frequência para pequenas oscilações à volta do mı́nimo. Note-se que a energia de ponto zero é sempre maior do que a do oscilador harmónico com essa frequência. Este potencial é, de facto, um caso particular do potencial harmónico efectivo três dimensional (Ver problema 4, Folha de problemas 1). Poço da forma V0 cot2 (πx/L) V (x) = V0 cot2 π x , L 0<x<L, V0 > 0 , (7.1.16) também admite solução analı́tica exacta (ver Folha 1, Problema 2). O espectro de energias tem a forma En = n2 + 4nλ − 2λ π 2 ~2 , 2mL2 n = 1, 2, 3, . . . , (7.1.17) 7.1 Alguns poços de potencial exactamente solúveis 211 0.4 0.2 0 0 1 2 3 4 x -0.2 Figura 7.4: Funções de onda dos três estados estacionários de energia mais baixa do potencial V (x) = (1/x − x)2 . O número de nodos aumenta com a energia. onde 1 λ= 4 r 8mV0 L2 +1−1 π 2 ~2 ! . (7.1.18) As funções de onda têm a forma diferente dependendo da paridade de n. Para valores ı́mpares de n, obtemos a função de onda πx −2λ n n 1 2 πx Φn (x) = cn sin , F − − 2λ, , ; cos L 2 2 2 L (7.1.19) enquanto que para valores pares de n obtemos a função de onda πx −2λ n 1 n 1 3 πx 2 πx , F − − 2λ + , + , ; cos cos Φn (x) = cn sin L L 2 2 2 2 2 L (7.1.20) onde F (a, b, c; z) são funções hipergeométricas. Na secção 7.2.1 analisaremos algumas destas funções de onda, que estão representadas na figura 7.15. É interessante analisar dois casos limites deste potencial. O primeiro é o limite em que V0 → 0. Como se pode ver na figura 7.5, nesse limite o potencial aproxima-se do poço de potencial infinito rectangular. Nesse limite, λ → 0 e o espectro (7.1.17) reduz-se a En ≃ n2 π 2 ~2 , 2mL2 (7.1.21) 212 Outras soluções exactas da equação de Schrödinger 5 5 4 4 3 3 2 2 1 1 0 0 0 0.5 1 1.5 2 2.5 0 3 0.5 1 1.5 2 2.5 3 x x Figura 7.5: Os potenciais V (x) = cot2 x e V (x) = cot2 x/100. exactamente o espectro do poço rectangular infinito (7.1.2). Um outro limite interessante e oposto é tomar λ ≫ 1; nesse caso λ≃ r mV0 L2 , 2π 2 ~2 e, para os primeiros nı́veis de energia podemos escrever o espectro como r 2V0 π 2 1 , n = 0, 1, 2, . . . , ω≡ . En ≃ ~ω n + 2 mL2 (7.1.22) (7.1.23) Obtemos portanto um espectro de oscilador harmónico, o que se pode entender facilmente, se expandirmos o potencial à volta de x = L/2: " 2 3 # 2 π L 2 sin x − πx L L V π 0 2 ; = V0 2 Lπ +O x− V (x) = V0 cot2 = 2 x− L L 2 2 cos L x − L2 o primeiro termo tem a forma V (x) = mω 2 (x − L/2)2 /2, com ω dado pela expressão anterior. Poço Triangular Consideremos um potencial linear V (x) = V0 x , V0 > 0 . (7.1.24) 7.1 Alguns poços de potencial exactamente solúveis 213 0.8 0.4 0 -10 -5 0 5 10 x -0.4 -0.8 Figura 7.6: A função de Airy convergente. A equação de Schrödinger independente do tempo para um estado com energia E fica ~2 d 2 − + V0 x Φ(x) = EΦ(x) , (7.1.25) 2m dx2 ou ainda 2mV0 d2 − dx2 ~2 E x− V0 Φ(x) = 0 . (7.1.26) As soluções da equação d2 − z f (z) = 0 , dz 2 (7.1.27) chamam-se funções de Airy, e as duas soluções linearmente independentes são denotadas por Ai(z) e Bi(z), sendo que a segunda é divergente. Assim, a solução geral da equação de Airy (7.1.27) é dada por f (z) = αAi(z) + βBi(z) . (7.1.28) A função de Airy convergente juntamente com um potencial linear de declive 1 estão representadas na figura 7.6. Note-se que a forma é exactamente a esperada. A função de onda oscila quando a energia é maior do que o potencial e torna-se uma onda evanescente 214 Outras soluções exactas da equação de Schrödinger quando a energia é menor do que o potencial. Assim, tomamos a solução de (7.1.26) como sendo r 3 Φ(x) = cAi 2mV0 ~2 E x− V0 ! , (7.1.29) onde c é uma constante de normalização. Um potencial linear origina uma força constante, como por exemplo a de uma partı́cula carregada num campo eléctrico constante. Mas um potencial linear em todo o espaço não faz sentido fisicamente, pois a energia não está limitada inferiormente. Podemos, no entanto, considerar um poço de potencial triangular da seguinte forma Vx x>0 0 V (x) = +∞ x<0. (7.1.30) Se o fizermos, esperamos quantificação de energia. Matematicamente, esta quantificação aparece como consequência da condição Φ(0) = 0 . (7.1.31) Logo, em x = 0, o argumento da função de Airy tem de ser um dos seus zeros, xn , isto é 2 2 1/3 V0 ~ En = − xn . (7.1.32) 2m Estes zeros não têm uma expressão matemática simples, mas é muito simples compreender a forma da função de onda para os vários estados estacionários; representamos os primeiros na figura 7.7. Numericamente, x1 ≃ −2.34 , x2 ≃ −4.09 , x3 ≃ −5.52 , (7.1.33) o que revela que |E3 −E2 | < |E2 −E1 |. Este é um padrão que se repete: os nı́veis de energia estão cada vez mais próximos à medida que a energia aumenta, ou, posto na linguagem da próxima secção, a densidade de estados aumenta com a energia. Nesta altura vale a pena observar que em todos os exemplos de poços de potencial estudados até agora, o número de nodos aumente sempre de uma unidade com o nı́vel de energia. Esta é uma caracterı́stica genérica de problemas em uma dimensão. Note-se também que o estado fundamental nunca tem qualquer nodo. 7.1 Alguns poços de potencial exactamente solúveis 215 0.8 0.8 0.8 0.4 0.4 0.4 0 0 0 2 4 6 8 0 0 10 2 4 6 8 10 0 2 4 x x 6 8 10 x -0.4 -0.4 -0.4 -0.8 -0.8 -0.8 Figura 7.7: As função de onda dos três primeiros estados estacionários no poço triângular. 7.1.2 Densidade de estados Comparemos agora a densidade de estados, ρ(E), definida por dN(E) , dE ρ(E) = (7.1.34) para alguns destes poços infinitos. No caso do oscilador harmónico, temos N(E) = E 1 − ~ω 2 ⇒ ρ(E) = 1 . ~ω (7.1.35) Obviamente para o caso do oscilador harmónico, a densidade de estados é constante, dado o espaçamento energético entre os nı́veis ser sempre igual. No caso do poço rectangular infinito, L√ N(E) = 2mE π~ ⇒ L ρ(E) = π~ r m . 2E (7.1.36) A densidade de estados tende para zero à medida que a energia aumenta, devido ao espaçamento energético aumentar com o nı́vel. No caso do poço de potencial do tipo cot2 x, escolhemos a raiz positiva da equação quadrática 2mEa2 N(E)2 +4N(E)λ−2λ− 2 2 = 0 π ~ ⇒ N(E) = r 4λ2 + 2λ + 2mEa2 −2λ , (7.1.37) π 2 ~2 pelo que obtemos uma densidade de estados ρ(E) = ma2 1 q 2 2 π ~ 4λ2 + 2λ + 2mEa2 π 2 ~2 . (7.1.38) 216 Outras soluções exactas da equação de Schrödinger 1 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 E Figura 7.8: Densidade de estados para o oscilador harmónico (constante), poço rectangular infinito (curva divergente em zero) e poço do tipo cot2 x. Estas várias densidades de estados estão representadas na figura 7.8. Note-se, que de acordo com a análise efectuada anteriormente, o potencial cot2 x tem uma densidade aproximadamente constante para energias baixas e converge para a densidade do poço rectangular infinito para energias elevadas. Estas curvas da densidade de estados ajudam-nos a ter uma intuição sobre outros casos onde não possamos resolver analiticamente o problema. Por exemplo, no potencial x4 , deveremos ter uma densidade de estados cujo declive estará algures entre entre o do poço rectangular infinito e o do potencial harmónico. Notemos ainda que o potencial triangular da secção anterior tem uma densidade de estados que aumenta com a energia. 7.1.3 Estados Ligados em Poços finitos Vamos agora estudar o espectro de estados ligados de dois potenciais com profundidade finita, um dos quais já nosso conhecido. Recordemos ainda que na secção 3.2.6 estudamos um outro caso de um potencial rectangular finito, cujos nı́veis de energia se determinaram por um método geométrico. 7.1 Alguns poços de potencial exactamente solúveis 217 x 0.3 0 5 10 15 20 0 0.2 -0.2 0.1 -0.4 0 0 5 10 15 20 x -0.6 -0.1 -0.8 -0.2 -1 -0.3 Figura 7.9: Potencial de Coulomb efectivo para b 6= 0 and b = 0 respectivamente. Poço de potencial efectivo de Coulomb No capı́tulo 6 resolvemos a equação de Schrödinger três dimensional no potencial de Coulomb. Devido à simetria esférica, reduzimos o problema a uma dimensão, com um potencial efectivo do tipo V (x) = a b + 2 , se x > 0 ; x x V (x) = +∞ , se x < 0 . (7.1.39) As constantes a e b têm valores negativo e positivo (ou zero) respectivamente. O potencial está representado na figura 7.9. No caso do problema de Coulomb, estas constantes têm o valor e2 ~2 a=− , b = ℓ(ℓ + 1) . (7.1.40) 4πǫ0 2µ Usando um método análogo ao do capı́tulo 6, mostra-se que os nı́veis de energia são dados por En = − µa2 2~2 1 n+ q 1 4 + 2µb ~2 + 1 2 2 , n = 0, 1, 2, 3, . . . . (7.1.41) Tomando os valores (7.1.40) obtemos o espectro de energias do átomo de Hidrogénio, que está representado na figura 6.5. As funções de onda serão dadas pela parte radial das funções de onda estudadas no capı́tulo 6 para o átomo de Hidrogénio. Note-se que para ℓ = 0 (b = 0) este é um poço infinito. Na secção 7.2.4 voltaremos a analisar este problema usando o método algébrico. 218 Outras soluções exactas da equação de Schrödinger x -4 -2 0 2 4 0 -0.2 -0.4 -0.6 -0.8 -1 Figura 7.10: O potencial de Pöchl-Teller para V0 = 1 = a. Poço de potencial de Pöschl-Teller O poço de potencial V (x) = − V0 cosh2 x a , V0 , a > 0 , (7.1.42) denominado potencial de Pöschl-Teller, admite solução analı́tica exacta (ver Folha 1, Problema 3). Este potencial é representado na figura 7.10. O espectro de energias tem a forma " r #2 ~2 1 1 8mV0 a2 En = − +1− n+ , n = 0, 1, 2, . . . , N , (7.1.43) 2ma2 2 ~2 2 onde N é o maior inteiro que satisfaz a desigualdade r 1 8mV0 a2 1 +1 . N+ < 2 2 ~2 (7.1.44) As funções de onda têm a forma diferente dependendo da paridade de n. Para valores ı́mpares de n, obtemos a função de onda x x −2λ n 1 3 n 1 2 x Φn = cn sinh cosh , F − + , −2λ + + , ; − sinh a a 2 2 2 2 2 a enquanto que para valores pares de n obtemos a função de onda n n 1 x −2λ 2 x , F − , −2λ + , ; − sinh Φn = cn cosh a 2 2 2 a (7.1.45) (7.1.46) 7.1 Alguns poços de potencial exactamente solúveis 219 1 0.5 x -3 -2 -1 0 1 2 3 0 -0.5 -1 Figura 7.11: Funções de onda dos três estados estacionários de energia mais baixa do potencial de Pöschl-Teller (não normalisadas). Usamos λ = 2, a = 1. O número de nodos aumenta com a energia. onde F (a, b, c; z) são funções hipergeométricas e λ é dado pela expressão ! r 8mV0 a2 1 1+ λ≡ −1 . 4 ~2 (7.1.47) Notamos que a função hipergeométrica tem expansão F (a, b, c; χ) = +∞ X (a)p (b)p χp p=0 (c)p p! . (7.1.48) Devido ao primeiro argumento da função hipergeométrica ser um inteiro negativo (quer no caso par, quer ı́mpar), a função reduz-se a um polinómio finito, de grau n. Explicitamente, para as três primeiras funções de onda usamos F (0, b, c; χ) = 1 , b F (−1, b, c; χ) = 1 − χ . c (7.1.49) As funções de onda dos três primeiros estados estacionários encontram-se representadas na figura 7.11. Notemos que este poço de profundidade finita admite um número finito de estados ligados, enquanto que o poço de potencial efectivo de Coulomb, sendo ainda de profundidade finita, admite um número infinito de estados ligados. 220 7.2 Outras soluções exactas da equação de Schrödinger Método algébrico para potenciais com forma invariante Quando, no capı́tulo 5, estudamos o oscilador harmónico, deduzimos o seu espectro e funções próprias usando dois métodos diferentes: um método algébrico baseado na introdução de operadores de criação e destruição (secções 5.1.1 e 5.1.2); um método diferencial de resolução directa da equação de Schrödinger, com um “ansatz” apropriado que introduz uma série de potências que deverá ser finita por normalizabilidade da função de onda. O primeiro método é, sem dúvida, bem mais elegante e prático. Os potenciais estudados na secção 7.1 são, tradicionalmente, resolvidos usando o segundo método. Existe, no entanto, um método algébrico aplicável a estes e outros potenciais, que nos permitirá, de um modo mais prático, extrair o espectro e as funções próprias do problema (e também os factores de transmissão e reflexão, quando aplicável, mas que não será aqui tratado). O método que vamos descrever tem a sua origem em técnicas de “supersimetria” - uma simetria (ainda não observada) que relaciona bosões com fermiões - mas que é essencialmente equivalente a um método de factorização introduzido por Schrödinger em 1940 (Proc. Roy. Irish Acad. A46 (1940) 9). 7.2.1 O superpotencial e potenciais parceiros Consideramos o operador Hamiltoniano na representação |xi: 2 2 ˆ = − ~ d + Ṽ (x) . H̃ 1 1 2m dx2 (7.2.1) Assumimos que o potencial é limitado inferiormente e tem um espectro de estados ligados, acima do qual poderá, ou não, existir um contı́nuo de estados. É uma propriedade universal que o estado fundamental Φ0 não tem nodos. Este estado tem energia Ẽ0 e obedece a − ~2 d2 Φ0 + Ṽ1 (x)Φ0 = Ẽ0 Φ0 , 2m dx2 que, invertendo, resulta em Ṽ1 (x) = ~2 1 d2 Φ0 + Ẽ0 . 2m Φ0 dx2 (7.2.2) 7.2 Método algébrico para potenciais com forma invariante 221 Conhecendo, pois, o estado fundamental de um problema, podemos facilmente reconstruir o potencial, a menos de uma constante (a energia de ponto zero). No que se segue iremos considerar o potencial que é obtido do original através da subtracção da energia de ponto zero, o que garante que o estado fundamental do novo potencial tem energia zero: Ṽ1 − Ẽ0 = V1 , ˆ − Ẽ 1̂ = Ĥ . H̃ 1 0 1 (7.2.3) Podemos agora factorizar o operador Hamiltoniano da seguinte maneira Ĥ1 = †  , (7.2.4) onde os operadores  e † são adjuntos e tomam a forma, na representação |xi: ~ d + W (x) ,  = √ 2m dx ~ d † = − √ + W (x) . 2m dx (7.2.5) A função W (x) é denominada superpotencial. Da equivalência entre (7.2.1) e (7.2.4), ~ d ~ d ~2 d 2 √ −√ + W (x) + W (x) = − + V1 (x) , 2m dx2 2m dx 2m dx resulta que ~ dW V1 (x) = W (x)2 − √ . 2m dx (7.2.6) Esta equação é denominada equação de Riccati. Dado um potencial Ṽ1 (x) = V1 (x) + Ẽ0 , usamo-la para determinar o superpotencial, descobrindo simultaneamente a energia de ponto zero do potencial Ṽ1 (x). O estado definido por ÂΦ = 0, obedece a Ĥ1 Φ = † ÂΦ = 0; isto é tem a energia do estado fundamental. Como o espectro é não degenerado (caracterı́stica genérica de problemas um dimensionais), este deve ser o estado fundamental: ÂΦ0 = 0 ⇔ ~ 1 dΦ0 W (x) = − √ . 2m Φ0 dx (7.2.7) Substituindo em (7.2.6) obtemos V1 (x) = ~2 1 d2 Φ0 , 2m Φ0 dx2 (7.2.8) 222 Outras soluções exactas da equação de Schrödinger em concordância com (7.2.2) após a transformação (7.2.3). Por outro lado, de (7.2.7), temos que dado o superpotencial podemos determinar Φ0 (x) por ! √ Z 2m W (x)dx . Φ0 (x) = exp − ~ (7.2.9) Exemplo: Consideremos o oscilador harmónico tratado no capı́tulo 5. Usando a representação |xi, escrevemos os operadores de criação e destruição (5.1.4) da seguinte maneira ! ! r r 2 2 1 ~ mω mω ~ 1 d d √ ↠= √ −√ + x , â = √ + x . (7.2.10) 2 2 2m dx 2m dx ω~ ω~ O Hamiltoniano escreve-se, em termos destes operadores ! 1̂ ˆ − ~ω 1̂ = (√~ω↠)(√~ωâ) , ˆ = ~ω ↠â + ⇔ H̃ H̃ 1 1 2 2 de onde concluimos que os operadores  e † são dados por † = √ ~ω↠,  = √ ~ωâ , (7.2.11) e o superpotencial é linear W (x) = r mω 2 x. 2 (7.2.12) Usando (7.2.9), obtemos ainda que a função de onda do estado fundamental é uma Gaussiana do tipo Φ0 = Ce−mωx 2 /(2~) , em concordância com (5.1.36), e obtemos de (7.2.8) V1 (x) = mω 2 2 ~ω x − , 2 2 (7.2.13) que é, de facto, o potencial harmónico com a energia de ponto zero removida. Para introduzir a noção de potencial parceiro, definimos um novo Hamiltoniano, Ĥ2 , Ĥ2 = † , (7.2.14) obtido invertendo a ordem de  e † . Usando (7.2.5) ~ d ~2 d 2 ~ dW (x) ~ d + W (x) −√ + W (x) = − + W (x)2 + √ , Ĥ2 = √ 2 2m dx 2m dx 2m dx 2m dx 7.2 Método algébrico para potenciais com forma invariante 223 de onde definimos o potencial parceiro, V2 (x) por ~ dW (x) . V2 (x) = W (x)2 + √ 2m dx (7.2.15) A designação de potenciais parceiros para V1 (x) e V2 (x) surge porque os seus espectros e funções próprias (e matrizes de difusão quando aplicável) estão relacionados. De facto, (1) se {Φn }, n ≥ 0, for o conjunto de funções próprias de Ĥ1 , com correspondente espectro (1) En ≥ 0, ∀n, (1) (1) Ĥ1 Φ(1) n = En Φn , (1) (1) então, as funções ÂΦn , com n > 0, são funções próprias de Ĥ2 com valor próprio En : † (1) (1) (1) (1) (1) (1) Ĥ2 ÂΦ(1) =   ÂΦ =  Ĥ Φ = ÂE Φ = E ÂΦ . 1 n n n n n n n Note-se que o estado fundamental de Ĥ1 não origina, por este procedimento, nenhuma função própria não trivial de Ĥ2 . (2) De um modo semelhante, se {Φn }, n ≥ 0, for o conjunto de funções próprias de Ĥ2 , (2) com correspondente espectro En > 0, ∀n, (2) (2) Ĥ2 Φ(2) n = En Φn , (2) (2) então, as funções † Φn , com n ≥ 0, são funções próprias de Ĥ1 com valor próprio En : † † (2) † (2) † (2) (2) (2) † (2) Ĥ1 † Φ(2) = Â Â Â Φ =  Ĥ Φ =  E Φ = E Â Φ . 2 n n n n n n n (2) Note-se que Ĥ2 Φ0 6= 0, pelo que o estado fundamental de Ĥ2 origina, por este procedimento, uma função própria não trivial de Ĥ1 . Concluimos pois que os espectros dos potenciais parceiros estão relacionados por (1) En(2) = En+1 , n ≥ 0, (1) E0 = 0 ; (7.2.16) as funções próprias estão relacionadas por Φ(2) n = q 1 (1) En+1 (1) ÂΦn+1 , (1) ou Φn+1 = q 1 (2) En † Φ(2) n , (7.2.17) 224 Outras soluções exactas da equação de Schrödinger (1) (2) E3 (1) E2 E2 † (1) (2) E1 (1) 0 = E0 (2) E1 E0  Figura 7.12: Espectros de potenciais parceiros e acção dos operadores  e † . Note-se que o operador Â/† destroi/cria um nodo na função de onda. Nesse sentido os operadores são ainda operadores de destruição/criação. (1) (2) que estão normalizadas, assumindo normalização de Φn ou Φn respectivamente. Na figura 7.12 ilustramos a relação entre os espectros de potenciais parceiros. Exemplo 1: No caso do oscilador harmónico, os operadores  e † são proporcionais aos operadores de criação e destruição. Logo, é de prever que o potencial parceiro do oscilador harmónico seja ainda um potencial harmónico. Facilmente se verifica que, tomando o superpotencial (7.2.12) se obtém, de (7.2.15) V2 (x) = mω 2 2 ~ω x + , 2 2 (2) que é de facto um potencial harmónico com energia de ponto zero E0 = ~ω - figura 7.13. Esta energia de ponto zero corresponde, de facto, à energia do primeiro estado excitado do potencial parceiro (7.2.13). Vemos pois que o potencial harmónico tem forma invariante; isto é não modifica a sua forma relativamente ao potencial parceiro. Potenciais de forma invariante irão desempenhar um importante papel no que se segue. Exemplo 2: Consideramos o poço de potencial rectangular de profundidade infinita (revisto em 7.1.1), que subtraido da sua energia de ponto zero, tomamos como o potencial V1 (x). O espectro de energias fica então: En(1) = π 2 ~2 n(n + 2)π 2 ~2 (n + 1)2 π 2 ~2 − = ,n ≥ 0 ; 2mL2 2mL2 2mL2 (7.2.18) 7.2 Método algébrico para potenciais com forma invariante 225 E E V(x) 1 V(x) 2 x x Figura 7.13: Potencial harmónico com energia de ponto zero nula (esquerda) e o seu potencial parceiro (direita), que é um potencial harmónico igual mas subido de ~ω. as funções próprias são Φ(1) n = r 2 sin L (n + 1)πx L , x ∈ [0, L] , (7.2.19) e zero no complementar. Usando (7.2.7) obtemos o superpotencial W (x) = − √ ~π πx , cot L 2mL (7.2.20) e como tal, o potencial parceiro, usando (7.2.15), ~2 π 2 2 πx V2 (x) = 2 cot +1 . 2mL2 L (7.2.21) Concluimos pois, de (7.2.16), que o espectro deste potencial é En(2) = (n + 1)(n + 3)π 2 ~2 ,n ≥ 0 . 2mL2 (7.2.22) As funções próprias do potencial parceiro, por sua vez, são obtidas das de Ĥ1 pela açcão do operador ~  = √ 2m π πx d − cot dx L L . Usando (7.2.17) obtemos as funções de onda do potencial parceiro: s (n + 2)πx πx (n + 2)πx 2 (2) Φn = (n + 2) cos . − cot sin (n + 1)(n + 3)L L L L As três primeiras funções de onda encontram-se representadas na figura 7.15. (7.2.23) 226 Outras soluções exactas da equação de Schrödinger V(x) 2 V(x) 1 E x Figura 7.14: Poço de potencial rectangular com energia de ponto zero nula (esquerda) e o seu potencial parceiro (direita), que é um potencial do tipo π 2 ~2 /mL2 (2 cot2 (πx/L) + 1). Vale a pena notar, neste segundo exemplo, que o potencial parceiro do poço de potencial rectangular de profundidade infinita, que é bastante trivial de resolver, é um potencial altamente não trivial de resolver - figura 7.14. Notemos ainda que V2 (x) − ~2 π 2 π 2 ~2 πx = cot2 , 2 2 2mL mL L (7.2.24) que é o potencial (7.1.16), com V0 = π 2 ~2 /mL2 . Para este valor especial de V0 , a variável λ (7.1.18) toma o valor de 1/2 e o espectro de energias (7.1.17) En = (n(n + 2) − 1) π 2 ~2 , 2mL2 n = 1, 2, 3, . . . , (7.2.25) (2) o que coincide exactamente com En − π 2 ~2 /2mL2 , em acordo com o cálculo anterior. 7.2.2 Hierarquia de Hamiltonianos Vamos assumir que conhecemos um potencial que é exactamente solúvel, Ṽ1 (x) e conhecemos o seu espectro e funções de onda. Se assim é, podemos, aparentemente, construir um número infinito de potenciais exactamente solúveis. O método é o seguinte. (1) (1) Conhecendo o estado fundamental de um Hamiltoniano Ĥ1 , Φ0 , que tem energia E0 igual a zero, podemos encontrar o superpotencial W1 (x), usando (7.2.7). Os operadores Â1 e †1 , podem então ser construidos usando (7.2.5), e podem ser usados para factorizar o Hamiltoniano, escrevendo-o na forma Ĥ1 = †1 Â1 . O estado fundamental do Hamiltoniano (2) (2) parceiro Ĥ2 = Â1 †1 , Φ0 , que tem energia E0 maior do que zero, é obtido a partir do 7.2 Método algébrico para potenciais com forma invariante 227 1.5 1 0.5 x 0 0.2 0.4 0.6 0.8 1 0 -0.5 -1 -1.5 Figura 7.15: Funções de onda dos três estados estacionários de energia mais baixa do potencial do tipo cot2 (πx/L). O número de nodos aumenta com a energia. (2) primeiro estado excitado de Ĥ1 , pela aplicação do operador Â1 . O Hamiltoniano Ĥ2 −E0 1̂ (2) tem estado fundamental Φ0 com energia igual a zero. Podemos por isso recomeçar o processo e calcular um novo superpotencial W2 (x), novos operadores Â2 e †2 que factorizam o Hamiltoniano Ĥ2 = †2 Â2 e um novo Hamiltoniano parceiro Ĥ3 = Â2 †2 , com um novo (3) estado fundamental, Φ0 , que tem energia maior do que zero. O Hamiltoniano Ĥ3 − (3) (3) E0 1̂ tem estado fundamental Φ0 com energia igual a zero. Podemos recomeçar agora novamente o processo. Construimos assim toda uma hierarquia de Hamiltonianos, criados por refactorizações repetidas. A razão pela qual, genericamente, não construimos por este método um conjunto infinito de potenciais exactamente solúveis é que, genericamente, os potenciais parceiros vão ter a mesma forma do potencial original, apenas com parâmetros diferentes. Isto é, potenciais exactamente solúveis são, genericamente, potenciais de forma invariante que tratamos de seguida. Usando a condição de invariância de forma apropriada podemos resolver um potencial de primeiros princı́pios, e não apenas resolver um potencial dado o conhecimento do seu potencial parceiro. 228 7.2.3 Outras soluções exactas da equação de Schrödinger Potenciais de forma invariante Se um potencial tem a mesma forma do seu potencial parceiro, isto é, se o potencial V1 (x; ai ) e o seu parceiro V2 (x; aj ), onde ai,j são os parâmetros que definem o potencial, obedecerem a V2 (x; ai ) = V1 (x; f (ai )) + R(ai ) , (7.2.26) então dizemos que o potencial tem forma invariante. f (ai ) e R(ai ) são duas funções dos parâmetros ai . Esta condição é uma condição de integrabilidade. Usando-a podemos, de um modo sistemático, obter as funções próprias e os valores próprios de qualquer potencial de forma invariante. Vejamos como. Consideramos um Hamiltoniano, Ĥ1 construido com um potencial, V1 (x; a), que obedece à condição de invariância de forma. Se Ĥ1 = − ~2 d 2 + V1 (x, a) , 2m dx2 pela condição de invariância de forma, o Hamiltoniano parceiro será Ĥ2 = − ~2 d 2 + V1 (x, f (a)) + R(a) . 2m dx2 O Hamiltoniano Ĥ1 tem energia de ponto zero igual a zero, por construção, para qualquer conjunto de parâmetros a. O Hamiltoniano Ĥ2 é igual ao Hamiltoniano Ĥ1 , com um conjunto de parâmetros f (a) - que ainda terá energia do estado fundamental igual a zero - somado de R(a). Logo a energia do estado fundamental de Ĥ2 , que é igual à energia do primeiro estado excitado de Ĥ1 é (1) (2) E1 = E0 = R(a) . (7.2.27) Subtraindo a energia de ponto zero ao Hamiltoniano Ĥ2 , Ĥ2′ = Ĥ2 − R(a)1̂, terá como Hamiltoniano parceiro Ĥ3 = − ~2 d 2 + V1 (x, f 2 (a)) + R(f (a)) , 2m dx2 de onde concluimos que a energia do segundo estado excitado de Ĥ1 será (1) E2 = R(a) + R(f (a)) . 7.2 Método algébrico para potenciais com forma invariante 229 Logo, para potenciais de forma invariante, podemos construir uma hierarquia de Hamiltonianos, Ĥs , s = 1, 2, 3, . . ., em que Ĥn tem o mesmo espectro que Ĥ1 , a menos dos primeiros n−1 nı́veis de Ĥ1 , que estão ausentes em Ĥn , sendo as suas energias subtraı́das no espectro de Ĥn . Usando repetidamente a condição de invariância de forma, temos que Ĥs = − ~2 d 2 + V1 (x, f s−1(a)) + R(f s−2(a)) . 2m dx2 Logo, a energia do nı́vel n do Hamiltoniano Ĥ1 é En(1) = n−1 X k=0 R(f k (a)) , n ≥ 1 , (1) , E0 = 0 . Consideremos agora o cálculo das funções de onda dos estados estacionários. Dado o potencial original V1 (x; a), podemos encontrar o superpotencial W (x; a), via (7.2.6), a função de onda do estado fundamental Φ0 (x; a), via (7.2.7) e os operadores Â(x; a) e † (x; a) usando (7.2.5). Como o potencial é de forma invariante, o potencial parceiro é, a (1) menos de uma constante (E1 ), V1 (x; f (a)). A função de onda do estado fundamental do potencial parceiro será, por isso, Φ0 (x; f (a)). Logo, a função de onda do primeiro estado excitado de V1 (x; a) será, usando (7.2.17), Analogamente, Φ1 (x; a) = q Φn (x; a) = q 1 (1) † (x; a)Φ0 (x; f (a)) . E1 1 (1) En † (x; a)Φn−1 (x; f (a)) . (7.2.28) Deste modo construimos, com um método algébrico em tudo análogo ao usado no oscilador harmónico, todas as funções de onda do problema original. 7.2.4 Potenciais de forma invariante relacionados por translação Há, essencialmente, duas classes de potenciais de forma invariante que têm sido estudados: i) Potenciais que estão relacionados com o parceiro por uma translação f (a) = a + α ; (7.2.29) 230 Outras soluções exactas da equação de Schrödinger ii) Potenciais que estão relacionados com o parceiro por uma transformação de escala f (a) = qa . (7.2.30) Existem ainda outras classes discutidas na literatura. Contudo é um facto notável que todos os modelos exactamente solúveis que se encontram genericamente nos livros de Mecânica Quântica não relativista pertencem à primeira classe descrita em cima. Consideremos dois exemplos. Oscilador Harmónico generalizado Consideramos um potencial harmónico centrado no ponto x = a. Vamos assumir que nada sabemos da teoria quântica deste potencial; em particular desconhecemos a energia de ponto zero, Ẽ0 . O potencial harmónico com energia de ponto zero nula será 1 V1 (x) = mω 2 (x − a)2 − Ẽ0 . 2 (7.2.31) O superpotencial está relacionado com V1 (x) por ~ dW V1 (x) = W (x)2 − √ ; 2m dx (7.2.32) Tomamos como ansatz para o superpotencial W (x) = α(x + β) ; (7.2.33) inserindo este ansatz juntamente com a forma de V1 (x) na equação anterior obtemos r m ~ω α=± ω , β = −a ⇒ Ẽ0 = ± . (7.2.34) 2 2 Isto é encontrando o superpotencial que origina a parte não constante do potencial, encontramos também a energia de ponto zero! De facto temos duas hipóteses para a energia de ponto zero; mas uma delas, associada ao sinal inferior, não é fı́sica pois diminui a energia dos estados excitados em vez de a aumentar. Assim tomamos o sinal superior e r m ω(x − a) . W (x) = 2 (7.2.35) 7.2 Método algébrico para potenciais com forma invariante 231 O potencial parceiro é 1 ~ω ~ dW = mω 2 (x − a)2 + . V2 (x) = W (x)2 + √ 2 2 2m dx (7.2.36) V2 (x) = V1 (x) + ~ω, (7.2.37) Logo que demonstra que o potencial é de forma invariante. Daqui deduzimos, por (7.2.27) que (1) E1 (2) = E0 = ~ω. Subtraindo a energia de ponto zero do potencial V2 (x) recuperamos exactamente o potencial original V1 (x) e podemos recomeçar o processo. No cálculo do novo potencial parceiro iremos ganhar novamente uma energia de ~ω, pelo que (1) E2 = ~ω + ~ω = 2~ω . (7.2.38) Repetindo o procedimento verificamos facilmente que En(1) = n~ω ⇒ 1 , Ẽn = ~ω n + 2 (7.2.39) onde repusemos a energia de ponto zero, de acordo com (7.2.3). Consideramos agora o cálculo das funções próprias. O operador † é, r √ ~ d m †  = − √ + ω(x − a) = ω~↠, 2 2m dx (7.2.40) onde ↠é o operador de criação habitual (em termos da variável x − a). Logo, por (7.2.28) temos, para as funções de onda normalizadas, 1 √ Φn (x) = √ ~ω↠Φn−1 (x) , n~ω (7.2.41) exactamente de acordo com (5.1.30). Esta é uma relação iterativa; o conhecimento de todas as funções de onda decorre do conhecimento da função de onda do estado fundamental. Este pode ser determinado usando (7.2.7), que, dado o superpotencial, determina a função de onda através de: √ Z 2m ln Φ0 = − W (x)dx + constante , ~ que neste caso é facilmente integrável para dar mω 2 Φ0 (x) = C0 e− 2~ (x−a) , como esperado. (7.2.42) (7.2.43) 232 Outras soluções exactas da equação de Schrödinger Potencial efectivo de Coulomb Num campo de forças central, escolhendo o ansatz, Φ(r, θ, φ) = R(r) m Y (θ, φ) , r ℓ (7.2.44) a equação de Schrödinger independente do tempo fica reduzida a uma equação de Schrödinger um dimensional 2 2 ~ d + Vef e (r) R(r) = ER(r) , − 2µ dr 2 (7.2.45) com potencial efectivo Vef e = ℓ(ℓ + 1)~2 + V (r) , 2µr 2 (7.2.46) onde µ é a massa da partı́cula e V (r) o potencial central a que a partı́cula está sujeita. Tomando para V (r) o potencial de Coulomb e2 ~2 V (r) = − =− , 4πǫ0 r µa0 r (7.2.47) temos V1 (r; ℓ) = ~2 ℓ(ℓ + 1)~2 − − Ẽ0 (ℓ) , 2µr 2 µa0 r (7.2.48) onde o último termo corresponde a subtrair a menor energia possı́vel para uma orbital com número quântico angular ℓ e usamos o raio de Bohr a0 , dado por (6.4.22). Para encontrar o superpotencial, i.e. resolver ~ dW , V1 (r, ℓ) = W (r, ℓ)2 − √ 2µ dr (7.2.49) parece natural tomar o ansatz W (r; ℓ) = α(ℓ) + β(ℓ) . r (7.2.50) Inserindo esta forma na equação anterior, juntamente com V1 (r; ℓ) obtemos ~ ~ ~2 √ √ , − − (ℓ + 1) , , 2µa20 (ℓ + 1)2 2µ 2µa0 (ℓ + 1) β(ℓ) = α(ℓ) = Ẽ0 = ~ ~ ~2 −√ √ ℓ, − , . 2µ 2µa0 ℓ 2µa20 ℓ2 (7.2.51) 7.2 Método algébrico para potenciais com forma invariante 233 A solução inferior diminui a energia dos estados excitados (para além de divergir para ℓ = 0) e por isso tomamos a solução superior. Nesse caso, a energia de ponto zero coincide, de facto com a menor energia possı́vel para uma orbital com número quântico angular ℓ do átomo de hidrogénio (6.4.23). Assim, de um modo extremamente simples derivamos a energia de um número infinito de orbitais do átomo de hidrogénio! Tomamos, por isso V1 (r; ℓ) = ~2 ~2 ℓ(ℓ + 1)~2 − + ; 2µr 2 µa0 r 2µa20 (ℓ + 1)2 (7.2.52) o superpotencial é ~ W (r; ℓ) = √ 2µ e o potencial parceiro V2 (r; ℓ) = ℓ+1 1 − a0 (ℓ + 1) r , (7.2.53) (ℓ + 2)(ℓ + 1)~2 ~2 ~2 − + . 2µr 2 µa0 r 2µa20 (ℓ + 1)2 (7.2.54) Logo ~2 V2 (r; ℓ) = V1 (r; ℓ + 1) + 2µa20 1 1 − 2 (ℓ + 1) (ℓ + 2)2 , (7.2.55) o que confirma que o potencial em questão é de forma invariante. Como tal ~2 1 1 (1) (2) E1 = E0 = − . 2µa20 (ℓ + 1)2 (ℓ + 2)2 (7.2.56) Tomando o potencial V2 (r; ℓ) com energia de ponto zero nula recuperamos o potencial original V1 (r; ℓ̃), com parâmetro ℓ̃ = ℓ + 1 e podemos recomeçar o processo. No cálculo do novo potencial parceiro iremos ganhar novamente uma energia de 1 ~2 1 , − 2µa20 (ℓ̃ + 1)2 (ℓ̃ + 2)2 (7.2.57) pelo que (1) E2 ~2 = 2µa20 1 1 1 1 − − + 2 2 2 (ℓ + 1) (ℓ + 2) (ℓ̃ + 1) (ℓ̃ + 2)2 ~2 1 1 = − 2 2 2µa0 (ℓ + 1) (ℓ + 3)2 , Repetindo o procedimento verificamos facilmente que 1 ~2 1 ~2 (1) ⇒ Ẽ = − − , En = n 2µa20 (ℓ + 1)2 (ℓ + 1 + n)2 2µa20 (ℓ + 1 + n)2 (7.2.58) (7.2.59) 234 Outras soluções exactas da equação de Schrödinger onde repusemos a energia de ponto zero, de acordo com (7.2.3). Consideremos agora o cálculo das funções próprias. O operador de criação é d ~ 1 ℓ+1 † − + .  (ℓ) = √ − dr a0 (ℓ + 1) r 2µ (7.2.60) Usando (7.2.28), temos neste caso Rn (r; ℓ) = q a0 1 (ℓ+1)2 − 1 (n+ℓ+1)2 d 1 ℓ+1 − + Rn−1 (r; ℓ + 1) . − dr a0 (ℓ + 1) r (7.2.61) Para usarmos esta relação de recorrência, comecemos por determinar a função de onda do estado fundamental. Usando (7.2.42) temos neste caso √ Z 2µ W (r; ℓ)dr + constante , ln R0 (r; ℓ) = − ~ (7.2.62) de onde resulta r − (ℓ+1)a R0 (r; ℓ) = C(ℓ)r ℓ+1e 0 . (7.2.63) Comparando com as funções de onda dadas na secção 6.4 verificamos que a dependência radial é de facto a correcta para os nı́veis com N = ℓ + 1, que, para cada ℓ, correspondem ao ‘estado fundamental’. Tomando os casos especı́ficos com ℓ = 0, 1, temos − ar R0 (r; 0) = C(0)re 0 ; − 2ar R0 (r; 1) = C(1)r 2 e 0 . (7.2.64) O primeiro estado excitado com ℓ = 0 é obtido por acção do operador de criação no estado fundamental com ℓ = 1: √ r 2a0 1 1 d − r R1 (r; 0) = √ R0 (r; 1) = − 3a0 rC(1) 2 − e 2a0 . − − + dr a0 r a0 3 (7.2.65) Notando que a parte espacial da função de onda com números quânticos (N, ℓ, m) (na notação do capı́tulo 6) é Φ(N,ℓ,m) = RN −ℓ−1 (r; ℓ) m Yℓ (θ, φ) , r obtemos Φ(1,0,0) C(0) = √ e−r/a0 , 4π r Φ(2,0,0) = − r 3 e−r/2a0 , a0 C(1) 2 − 4π a0 (7.2.66) 7.3 Sumário 235 r 3 rC(1) cos θe−r/2a0 , 4π que com as normalizações adequadas concordam (a menos de uma fase que é irrelevante) Φ(2,1,0) = com as funções de onda calculadas no capı́tulo 6. 7.3 Sumário Neste capı́tulo discutimos alguns potenciais nos quais a equação de Schrödinger tem solução exacta. Começamos por exemplificar alguns casos de poços de potencial de profundidade finita e infinita, que são normalmente resolvidos por um método diferencial (ver folha de exercı́cios 1). Seguidamente introduzimos um método algébrico baseado no conceito de superpotencial, que permite factorizar o Hamiltoniano e introduzir operadores de criação e destruição. Este método permite calcular o espectro de energias e as funções próprias de potenciais de forma invariante, sendo muito análogo ao dos operadores de criação e destruição usados no oscilador harmónico. O método foi exemplificado construindo o espectro de energias e funções de onda do problema de Coulomb. Genericamente o método pode ser sumarizado na seguinte receita: i) Dado um potencial, que denominamos Ṽ1 (x; ai ), escrevemos o potencial V1 (x; ai ) = Ṽ1 (x; ai ) − Ẽ0 , que é igual ao anterior, mas com energia de ponto zero nula. Note-se que Ẽ0 é desconhecida neste momento. ii) Usando a equação de Riccati ~ dW (x; ai ) V1 (x; ai ) = W (x; ai )2 − √ , dx 2m determinamos o superpotencial W (x; ai ) e a energia de ponto zero. Este é o ponto onde alguma intuição é necessária para escolher um bom ansatz para o superpotencial. iii) Determinamos o potencial parceiro ~ dW (x; ai ) V2 (x; ai ) = W (x; ai )2 + √ . dx 2m 236 Outras soluções exactas da equação de Schrödinger iv) Se o potencial for de forma invariante, isto é, se existirem funções f (ai ) e R(ai ) tal que V2 (x; ai ) = V1 (x; f (ai )) + R(ai ) , então podemos determinar o espectro e funções de onda de V1 (x; ai ) (e logo de Ṽ1 (x; ai )) analiticamente. v) O espectro de Ṽ1 (x; ai ) é dado por Ẽn = Ẽ0 + n−1 X R(f s (ai )) , s=0 n≥0 onde f 0 (ai ) = ai , f 1 (ai ) = f (ai ), etc. vi) As funções de onda de Ṽ1 (x; ai ) (que são as mesmas das funções de onda de V1 (x; ai )) são dadas por: • Estado fundamental √ 2m Φ0 (x; ai ) = exp − ~ Z ! W (x; ai )dx , onde tem que se escolher a constante de integração de modo a normalizar a função de onda; • nesimo estado excitado (n ≥ 1) Φn (x; ai ) = qP n−1 s=0 onde 1 † (x; ai )Φn−1 (x; f (ai )) , R(f s (ai )) ~ d + W (x; ai ) . † (x; ai ) = − √ 2m dx Parte II Métodos de aproximação e Spin CAPÍTULO 8 A aproximação WKB A introdução da equação de Schrödinger completa a nova mecânica ondulatória e torna alguns dos postulados introduzidos arbitrariamente na “velha teoria quântica” naturais. Por exemplo, a quantificação introduzida por Planck (capı́tulo 2) torna-se um problema de modos normais e frequências próprias num potencial de oscilador harmónico (capı́tulo 5). Contudo não nos devemos esquecer que as ondas descritas pela equação de Schrödinger diferem de ondas clássicas, como as electromagnéticas, de duas maneiras: são ondas de probabilidade (interpretação de Born); são ondas complexas. Como vimos no capı́tulo anterior, existem casos em que se pode resolver exactamente a equação de Schrödinger correspondentes a potenciais de forma invariante. Mas, em geral, tal não é possı́vel e como tal necessitamos de métodos aproximados. Alguns destes, como métodos perturbativos ou variacionais, são muito gerais e ganham força quando discutidos num contexto mais abrangente do que apenas problemas em uma dimensão. Mas existe um método de grande interesse para problemas em uma dimensão: a aproximação WKB cujo método é moralmente análogo ao usado no capı́tulo 3 para potenciais constantes por pedaços e origina um resultado para a função de onda formalmente semelhante às ondas planas vistas nesse caso. É este método que agora consideramos. Esta aproximação foi aplicada à equação de Schrödinger quase simultaneamente por 8.1 O método 239 G.Wentzel [Zeits.f.Phys. 38 (1926) 518], H.A.Kramers [Zeits.f.Phys. 39 (1926) 828] e L.Brillouin [Comptes Rendus 183 (1926) 24], sendo por isso conhecida como aproximação ou método WKB. Alternativamente, a aproximação é por vezes denominada BWK, WBK ou por razões que se discutirão em baixo, aproximação semi-clássica ou aproximação da fase integral. 8.1 O método Consideremos o cálculo de estados estacionários da equação de Schrödinger através da resolução da equação de Schrödinger independente do tempo em uma dimensão ~2 d 2 − + V (x) Φ(x) = EΦ(x) , 2m dx2 (8.1.1) ou equivalentemente d2 Φ(x) 2m + 2 (E − V (x))Φ(x) = 0 dx2 ~ ⇔ Φ(x)′′ + [k(x)]2 Φ(x) = 0 , onde as ‘linhas’ denotam derivadas em ordem a x e definimos p 2m(E − V (x)) k(x) ≡ . ~ (8.1.2) (8.1.3) A equação (8.1.2) tem a forma da equação de Helmholtz, muito familiar na teoria ondulatória. Sabemos que quando k é constante a solução é da forma e±ikx (capı́tulo 3); isto sugere que se V não for constante mas variar lentamente com x, possamos tomar o ansatz Φ(x) = eiu(x) , (8.1.4) onde a função u(x) não deverá ser simplesmente proporcional a x. Introduzindo este ansatz em (8.1.2) obtemos a equação d2 u i 2− dx du dx 2 + [k(x)]2 = 0 . (8.1.5) Esta equação é totalmente equivalente a (8.1.1). Só que é não linear em u(x), pelo que poderemos pensar que estamos pior do que começamos! A aproximação WKB toma partido 240 A aproximação WKB desta não linearidade para construir uma aproximação a (8.1.5), através de um método iterativo; este método é sugerido pelo facto de que a segunda derivada é zero para uma partı́cula livre (i.e potencial constante): • Primeira aproximação (aproximação clássica - ver secção 8.4): Se o potencial variar suficientemente lentamente, negligenciamos o termo da segunda derivada. Designando esta aproximação a u(x) por u0 (x) (8.1.5) fica du0 dx 2 2 = [k(x)] ⇔ u0 (x) = ± Z k(x)dx + C0 . (8.1.6) Esta quantidade, designada por fase integral, é a quantidade fundamental na aproximação. • Aproximações seguintes: Escrevemos a equação de Schrödinger na forma (8.1.5) mas reflectindo já o método iterativo 2 d2 u n dun+1 = [k(x)]2 + i 2 ; dx dx (8.1.7) isto é, tomamos do lado direito a aproximação de ordem n, un , e obtemos do lado esquerdo a aproximação de ordem n + 1, un+1 , que portanto se pode escrever na forma Z r d2 u n un+1 (x) = ± [k(x)]2 + i 2 dx + Cn+1 . dx • Segunda aproximação (aproximação WKB): Em particular Z r Z r 2u d dk 0 u1 (x) = ± [k(x)]2 + i 2 dx + C1 = ± [k(x)]2 ± i dx + C1 . dx dx (8.1.8) (8.1.9) Esta segunda aproximação é designada por aproximação semi-clássica ou WKB. Para fazer sentido que este procedimento iterativo seja truncado aqui, é necessário que u1 (x) esteja próximo de u0 (x), isto é, que u1 (x) seja uma pequena correcção a u0 (x) na aproximação à verdadeira função u(x). Em particular isto significa que |dk/dx| ≪ |k 2 (x)| . (8.1.10) 8.2 Interpretação da validade da aproximação 241 Se assim for, u1 (x) ≃ ± Z Z i i dk dx + C1 = ± k(x)dx + log k(x) + C1 , k(x) ± 2k dx 2 (8.1.11) e como tal, na aproximação WKB a função de onda toma a forma Φ(x) = Aei Φ(x) = R k(x)dx R Be + A′ e−i p k(x) k̃(x)dx R k(x)dx + B ′ e− q k̃(x) , R 2m(E − V (x)) , se E > V (x) , ~ p 2m(V (x) − E) , se E < V (x) . k̃(x) ≡ ~ k(x) ≡ k̃(x)dx , p (8.1.12) A constante C1 pôde ser negligenciada pois a função de onda terá de ser, de qualquer modo, normalizada. Comparando com a secção 3.2.1 concluimos a semelhança formal anteriormente anunciada com a função de onda em potenciais constantes por pedaços. 8.2 Interpretação da validade da aproximação Da análise anterior resulta que a condição de validade da aproximação WKB significa que a fase varia muito mais rapidamente do que a amplitude da função de onda. Mas para interpretar de um modo mais fı́sico a condição (8.1.10) de validade da aproximação definimos, para E > V (x), um comprimento de onda efectivo λ(x) = 2π . k(x) (8.2.1) Notando ainda que podemos atribuir um momento à partı́cula pela relação p(x) = ~k(x), a condição (8.1.10) pode ser escrita |dp/dx| |p| 2π ≪ ~ ~ λ ⇒ λ(x)|dp(x)/dx| ≪ |p(x)| . (8.2.2) Ou seja, a condição da validade da aproximação WKB é que a alteração do momento da partı́cula ao longo de um comprimento de onda deve ser muito menor que o próprio momento. Esta condição é violada: 242 A aproximação WKB V(x) E x=a Figura 8.1: Um potencial V (x) perto de um ponto de viragem clássico x = a. • Se o potencial variar muito rapidamente, ou equivalentemente, se k(x) variar muito rapidamente. Se este for o caso a aproximação WKB não será aplicável; • Nos pontos de viragem clássicos onde E = V (x) ou equivalentemente k(x) = 0. Logo, para podermos usar o método WKB temos de compreender como extender as soluções (8.1.12) através dos pontos de viragem clássicos. Estes pontos existem tanto no estudo de estados ligados como no cálculo do factor de transmissão por efeito túnel. Precisamos pois de estabelecer fórmulas de ligação que permitirão relacionar os coeficientes Ai e Bi nas funções de onda (8.1.12). Essas fórmulas de ligação desempenharão o mesmo papel que as condições de continuidade da função de onda e da sua derivada desempenharam nos potenciais contı́nuos por pedaços do capı́tulo 3. 8.3 Fórmulas de ligação Suponhamos que x = a é um ponto de viragem clássico - figura 8.1. Assumimos que a aproximação WKB é aplicável, excepto na vizinhança imediata dos pontos de viragem clássicos; por outras palavras o potencial não varia demasiado rapidamente. Fazemos a seguinte mudança de variáveis v(x) = p k(x)Φ(x) , y= Z x k(x′ )dx′ . (8.3.1) 8.3 Fórmulas de ligação 243 Logo 1 d2 Φ(x) =p 2 dx k(x) 1 dΦ(x) =p dx k(x) dv(x) v(x) dk(x) − dx 2k(x) dx , (8.3.2) d2 v(x) 1 dk(x) dv(x) v(x) d2 k(x) 3 v(x) − − + dx2 k(x) dx dx 2k(x) dx2 4 [k(x)]2 dk(x) dx 2 ! ; (8.3.3) notamos ainda que d2 v =k dx2 d2 v dk dv +k 2 dy dy dy , d2 k =k dx2 dk dy 2 d2 k +k 2 dy de modo que a equação de Schrödinger (8.1.2) fica " # 2 d2 v dk 1 d2 k 1 + +1 v =0 . − dy 2 4k 2 dy 2k dy 2 ! , (8.3.4) (8.3.5) Também esta equação é completamente equivalente à equação de Schrödinger (8.1.1). Da discussão da secção anterior resulta que a aproximação WKB é tomar o termo dentro do parêntises [. . .] igual à unidade. Nesse caso v(y) = e±iy , (8.3.6) o que, com as definições (8.3.1) se reduz à função de onda anteriormente calculada com a aproximação WKB (8.1.12). Em geral y = y(x) é uma variável real se E > V (x) e imaginária se E < V (x). Considerando um potencial como o da figura 8.1 temos que: • y é real à esquerda do ponto de viragem clássico; logo na aproximação WKB, a equação (8.3.5) tem solução v(y) = Aeiy + A′ e−iy ; (8.3.7) • y é imaginário à direito do ponto de viragem clássico; logo na aproximação WKB, a equação (8.3.5) tem solução v(y) = Be|y| + B ′ e−|y| . (8.3.8) 244 A aproximação WKB O nosso objectivo é relacionar as constantes A, A′ com B, B ′ de modo a v(y) ser a função de onda de um mesmo estado em regiões distintas. Note-se que nestas variáveis, as soluções são exactamente às mesmas que em potenciais constantes. Dado que a aproximação WKB falha perto do ponto de viragem clássico, para construirmos esta relação temos de considerar a equação de Schrödinger completa (8.3.5) perto deste ponto. Fazemo-lo aproximando o potencial perto de x = a por uma função linear V (x) − E ≃ α(x − a) , α>0. (8.3.9) Com esta aproximação p 2m(E − V (x)) k(x) = ~ p 2mα(a − x) k(x) = x<a ~ p ⇒ k(x) = ±i 2mα(x − a) x > a ~ A variável y por seu lado fica √ Z xp 2mα(a − x′ ) ′ 2 2mα y(x) = dx = − (a − x)3/2 x<a, ~ 3 ~ a √ Z x p 2mα(x′ − a) ′ 2i 2mα y(x) = dx = ± (x − a)3/2 x>a. ±i ~ 3 ~ a . (8.3.10) (8.3.11) Escolhemos a solução negativa, de modo a que e+iy = e+|y| . A variável y = y(x) tornou-se uma medida da distância entre x e o ponto de viragem clássico. Reexpressemos k(x) como k(y) usando a expressão para x < a: √ 1/3 2mα √ 3mα k= . a−x= − 2 y ~ ~ Logo 1 4k 2 dk dy 2 1 d2 k 5 − = . 2 2k dy 36y 2 (8.3.12) (8.3.13) O mesmo resultado é obtido considerando a expressão para x > a. Logo, a equação de Schrödinger (8.3.5) fica d2 v 5 v=0. + 1+ dy 2 36y 2 (8.3.14) Para |y| elevado, o termo 5/36y 2 pode ser negligenciado e obtemos a aproximação WKB. Para |y| pequeno - perto do ponto de viragem clássico - a equação torna-se exacta. O que 8.3 Fórmulas de ligação 245 V(x) E x=b Figura 8.2: Um potencial V (x) perto de um ponto de viragem clássico x = b. estamos a assumir é que para valores intermedios esta equação é uma boa aproximação de modo a conseguirmos ligar a aproximação WKB de ambos os lados.1 Um estudo detalhado da equação (8.3.14) permite-nos então relacionar a solução WKB à esquerda com a solução WKB à direita do ponto de viragem clássico da figura 8.1 da seguinte forma cos −y − π4 1 e−|y| √ , ←→ 2 k̃ k sin −y − π4 e|y| √ . ←→ − k̃ k (8.3.15) Estas são as chamadas fórmulas de ligação. Em termos da coordenada original x e especificando os dois casos possı́veis para pontos de viragem temos as seguintes fórmulas de ligação: • Caso da figura 8.1 Z a Rx 2 π 1 ′ ′ ′ ′ √ cos k(x )dx − ←→ p e− a k̃(x )dx 4 k x k̃ Z a 1 π 1 Rx ′ ′ √ sin k(x′ )dx′ − ←→ − p e a k̃(x )dx 4 k x k̃ 1 F órmula i (8.3.16) F órmula ii Este procedimento é problematico se o valor de E estiver próximo de um extremo do potencial; aqui iremos negligenciar essa subtileza. 246 A aproximação WKB I B’1 II x=b x E B1 A III x=a A’ B’2 B2 V(x) −V 0 Figura 8.3: Um estado com energia E num poço de potencial V (x); x = b e x = a são os pontos de viragem clássicos.A região I é desde x = −∞ até ligeiramente antes de x = b; a região II é desde ligeiramente depois de x = b até ligeiramente antes de x = a; a região III é desde ligeiramente depois de x = a até x = +∞. • Caso da figura 8.2 Z x 1 − R b k̃(x′ )dx′ 2 π ′ ′ p e x ←→ √ cos k(x )dx − 4 k b k̃ Z x R b 1 1 π ′ )dx′ k̃(x ′ ′ −p e x ←→ √ sin k(x )dx − 4 k b k̃ F órmula iii F órmula iv (8.3.17) Estas fórmulas de ligação desempenham, na aproximação WKB, o mesmo papel das considções de continuidade desempenharam no nosso estudo de potenciais constantes por pedaços no capı́tulo 3. 8.4 Aplicação ao cálculo de estados ligados Vamos agora usar a aproximação WKB para calcular o espectro de estados ligados num poço de potencial do tipo da figura 8.3. Consideramos um estado com energia E, com −V0 < E < 0. Na aproximação WKB, as soluções da equação de Schrödinger independente 8.4 Aplicação ao cálculo de estados ligados 247 do tempo nas várias regiões esquematizadas na figura 8.3 são: R R p − xb k̃(x′ )dx′ ′ xb k̃(x′ )dx′ 2m(V (x) − E) B e + B e 1 1 q com k̃(x) ≡ Região I Φ(x) = ~ k̃(x) R R p x x ′ ′ ′ ′ 2m(E − V (x)) Aei b k(x )dx + A′ e−i b k(x )dx p Região II Φ(x) = com k(x) ≡ . ~ k(x) Rx Rx ′ ′ ′ ′ a k̃(x )dx + B ′ e− a k̃(x )dx B e 2 2 q Região III Φ(x) = k̃(x) (8.4.1) Para a função de onda ser normalizavel, as funções que crescem exponencialmente quando x → ±∞ têm que ser rigorosamente zero, isto é B1′ = 0 = B2 . Logo, na região I a função de onda não normalizada será B1 − R b k̃(x′ )dx′ , x<b. e x Φ(x) ≃ q k̃(x) (8.4.2) Pela fórmula de ligação iii, esta função de onda tem a forma, na região II 2B1 Φ(x) ≃ p cos k(x) Z x π k(x )dx − 4 ′ b ′ , b<x<a. Reescrevemos esta função de onda como Z a Z a π 2B1 ′ ′ k(x)dx − k(x )dx − Φ(x) ≃ √ cos 4 k b x Z a Z a 2B1 π ′ ′ k(x)dx − = √ sin k(x )dx + 4 k b x Z a Z a π 2B1 ′ ′ k(x)dx sin k(x )dx − = − √ cos 4 k b x Z a Z a π 2B1 k(x)dx cos k(x′ )dx′ − + √ sin 4 k b x (8.4.3) . (8.4.4) Pelas fórmulas de ligação i e ii, obtemos finalmente que a função de onda na região III tem a forma Φ(x) = 2B1 cos Z b a Z a − R x k̃(x′ )dx′ R x k̃(x′ )dx′ e a ea q q + B1 sin . k(x)dx k(x)dx b k̃(x) k̃(x) (8.4.5) 248 A aproximação WKB Comparando com (8.4.1), verificamos que B2 = 2B1 cos Z a b k(x)dx , (8.4.6) pelo que a condição de normalizabilidade B2 = 0 requer que Z a b 1 π, k(x)dx = n + 2 n ∈ N0 . (8.4.7) Note-se que n ∈ N0 e não Z, pois o lado esquerdo desta equação é positivo. Esta equação determina o espectro de energias dos estados ligados. Exemplo: Consideramos o potencial do oscilador harmónico V (x) = mω 2 x2 /2 e um estado com energia E. Os pontos de viragem clássicos, a e b, obedecem a V (a) = E = V (b), p e tomam neste caso a forma ± 2E/mω 2 . Logo, a condição (8.4.7) fica Z q − 2E mω 2 q 2E mω 2 p m(2E − mω 2 x2 ) 1 π, dx = n + ~ 2 (8.4.8) de onde se conclui que 1 E = ~ω n + , 2 (8.4.9) que é o valor exacto incluindo a energia de ponto zero! Exercı́cio: Calcule a função de onda do oscilador harmónico para os nı́veis n = 0 e n = 1 na aproximação WKB. Se introduzissemos o momento clássico pela relação p(x) = ±~k(x), o movimento limitado no poço de potencial corresponde a uma trajectória fechada no espaço de fase - figura 8.4. A condição (8.4.7) pode ser reescrita como I 1 p(x)dx = n + h. 2 (8.4.10) Esta condição é muito semelhante a uma outras impostas na velha teoria quântica, que corespondiam a um passo intermédio entre a teoria clássica e a teoria quântica completa. 8.4 Aplicação ao cálculo de estados ligados 249 p b a x Figura 8.4: Movimento no espaço de fase de uma partı́cula clássica confinada entre x = b e x = a no potencial da figura 8.3. Por exemplo a quantificação sugerida por Bohr, discutida no capı́tulo 2 podia ser escrita como I p(x)dx = nh . (8.4.11) Por esta razão a aproximação WKB é frequentemente designada por aproximação semiclássica. Isso é também confirmado notando que o ansatz Φ(x) = exp (iS(x))/~ transforma, se negligenciarmos as segundas derivadas, a equação de Schrödinger completa ∂Ψ ~2 d 2 i~ = − + V (x, t) Ψ , ∂t 2m dx2 (8.4.12) na equação de Hamilton-Jacobi da mecânica clássica (1.3.51) 1 ∂S = − ∂t 2m ∂S ∂x 2 + V (x, t) . (8.4.13) Portanto, a fase S(x, t) comporta-se como a acção função da mecânica clássica. Isto justifica a classificação da primeira aproximação na secção 8.1 como ‘aproximação clássica’. A segunda aproximação (primeira ordem em ~) é a aproximação WKB. A fórmula (8.4.7) ajuda-nos também a pensar na função de onda da seguinte maneira. Podemos entender esta relação como expressando que a mudança de fase ao longo do poço, de a para b, é igual a (n + 1/2)π. Dividindo por 2π, concluimos que a função de onda na aproximação WKB tem n/2 + 1/4 (quase) comprimentos de onda no poço. Assim n representa o número de nodos da função de onda, facto que ajuda a visualizar Ψ. 250 A aproximação WKB V(x) A1 A’1 B A2 B’ A’2 E I x=a II x=b III x Figura 8.5: Um estado com energia E numa barreira de potencial V (x); x = a e x = b são os pontos de viragem clássicos. A região I é desde x = −∞ até ligeiramente antes de x = a; a região II é desde ligeiramente depois de x = a até ligeiramente antes de x = b; a região III é desde ligeiramente depois de x = b até x = +∞. 8.5 Aplicação ao cálculo do factor de transmissão Aplicamos agora o método WKB ao cálculo do factor de transmissão através de uma barreira com altura maior do que a energia da partı́cula - figura 8.5. Este problema é semelhante ao da barreira rectângular estudado no capı́tulo 3, mas nenhuma hipótese especifica é feita relativamente à forma concreta da barreira. Assumimos que a aproximação WKB é válida nas três regiões. Isto é, o potencial não varia demasiado rapidamente. Nesta aproximação obtemos as seguintes três soluções da equação de Schrödinger independente do tempo: Rx Rx p ′ ′ ′ ′ 2m(E − V (x)) A1 ei a k(x )dx + A′1 e−i a k(x )dx p Região I : Φ(x) = com k(x) ≡ ~ k(x) R R p x x ′ ′ ′ ′ 2m(V (x) − E) Be a k̃(x )dx + B ′ e− a k̃(x )dx q com k̃(x) ≡ Região II : Φ(x) = ~ k̃(x) R R x x ′ ′ ′ ′ A2 ei b k(x )dx + A′2 e−i b k(x )dx p . Φ(x) = Região III : k(x) (8.5.1) O nosso objectivo é usar as fórmulas de ligação para relacionar os coeficientes A1 , A′1 com A2 , A′2 , de modo a poder comparar a onda incidente com a transmitida. Com esse objectivo notamos que: 8.5 Aplicação ao cálculo do factor de transmissão 251 • Usando as fórmulas de ligação i e ii, ligamos a solução na região II à região I: Rx Be Φ(x) = a em I −→ = Rx k̃(x′ )dx′ ′ ′ + B ′ e− a k̃(x )dx q k̃(x) Z a Z a ′ π π B 2B ′ ′ ′ ′ p cos sin k(x )dx − k(x )dx − −p 4 4 k(x) k(x) x x 2B ′ + iB −iπ/4 i R a k(x′ )dx′ 2B ′ − iB iπ/4 −i R a k(x′ )dx′ p e e x + p e e x . 2 k(x) 2 k(x) Logo 2B ′ − iB iπ/4 e A1 = 2 ′ A′1 = 2B + iB e−iπ/4 2 ⇔ • Denotamos (8.5.2) A′ eiπ/4 + A1 e−iπ/4 B′ = 1 2 ′ iπ/4 − A1 e−iπ/4 B = A1 e i Rb θ≡e a k̃(x)dx . . (8.5.3) (8.5.4) Usando as fórmulas de ligação iii e iv, ligamos a solução na região II à região III Φ(x) = Rx Be em III −→ = a k̃(x′ )dx′ Rx ′ Rb ′ ′ ′ Rb ′ ′ B ′ e x k̃(x )dx + Bθ2 e− x k̃(x )dx + B ′ e− a k̃(x )dx q q = k̃(x) θ k̃(x) Z x Z x ′ B π π 2Bθ ′ ′ ′ ′ − p sin cos k(x )dx − k(x )dx − +p 4 4 θ k(x) k(x) b b 2θB + iB ′ /θ −iπ/4 i R x k(x′ )dx′ 2θB − iB ′ /θ iπ/4 −i R x k(x′ )dx′ p p + . e e b e e b 2 k(x) 2 k(x) Logo 2θB + iB ′ /θ −iπ/4 e A2 = 2 ′ A′2 = 2θB − iB /θ eiπ/4 2 ⇔ A2 eiπ/4 − A′2 e−iπ/4 θ B′ = i iπ/4 + A′2 e−iπ/4 B = A2 e 2θ Igualando as duas soluções (8.5.3) a (8.5.6) obtemos 1 1 A2 + i 2θ − A′2 2A1 = 2θ + 2θ 2θ 1 1 ′ 2A1 = i −2θ + A2 + 2θ + A′2 2θ 2θ . (8.5.5) . (8.5.6) (8.5.7) 252 A aproximação WKB O factor de transmissão, T , foi definido por (3.2.24) como sendo a intensidade da onda transmitida sobre a intensidade da onda reflectida. A intensidade de um onda foi, por sua vez, definida na secção 3.2.1 como a densidade de probabilidade vezes a velocidade; assim sendo temos, para o nosso caso √ |Φt kt |2 |A2 |2 |Φt |2 vt √ = . = T = |Φi |2 vi |A1 |2 |Φi ki |2 (8.5.8) Assumindo que temos uma onda incidente de x = −∞, não deverá existir onda incidente da direita; logo A′2 = 0. Assim sendo |A2 |2 = |A1 |2 4θ 2 4θ + 1 2 . (8.5.9) Para uma barreira larga e alta, θ ≫ 1; este factor é uma medida da opacidade da barreira. Neste caso T ≃ R √ 1 −2 ab 2m(V (x)−E)/~ = e . θ2 (8.5.10) Esta é fórmula (3.2.46) usada no capı́tulo 3 para estudar a radioactividade α, com uma justificação vaga. A sua verdadeira justificação é a aproximação WKB como acabamos de deduzir. Nesse caso T é chamado o factor de Gamow. 8.6 Sumário Neste capı́tulo estabelecemos um método, denominado aproximação WKB, que permite, para uma vasta classe de potenciais e em analogia próxima com o tratamento de potenciais constantes por pedaços do capı́tulo 3, calcular o espectro de estados ligados e o factor de transmissão através de barreiras de potencial. CAPÍTULO 9 Teoria Geral do Momento Angular e Spin No capı́tulo 6 estudamos o momento angular orbital em Mecânica Quântica. Em particular vimos que as componentes do operador momento angular orbital, L̂i , i = 1, 2, 3, obedecem às relações de comutação (6.1.4), [L̂j , L̂k ] = i~ǫjkl L̂l , onde ǫjkl é o sı́mbolo de Levi-Civita, que tem valor1 +1 se (jkl) = Π (123) par ǫjkl = −1 se (jkl) = Π (123) (9.0.1) , (9.0.2) ímpar onde Π... (123) significa “permutação par” ou “permutação ı́mpar” da sequência (123). Estas relações de comutação resultam da quantificação canónica do momento angular ~ ≡ ~r × p~, e das relações de comutação canónicas. No entanto vamos agora orbital, L tomar uma perspectiva mais abrangente. Vamos tomar estas relações de comutação como definindo os operadores de momento angular. Para manifestar que estes poderão ter outra origem que não a orbital, denotamos os operadores mais gerais de momento angular por J~i ; as relações de comutação são assim [Jˆj , Jˆk ] = i~ǫjkl Jˆl . 1 (9.0.3) Em linguagem de geometria diferencial o sı́mbolo de Levi-Civita que estamos a definir é uma densidade tensorial e não um tensor, pois mantém a forma (9.0.2) em todos os sistemas coordenados. 254 Teoria Geral do Momento Angular e Spin Vamos começar por demonstrar que esta álgebra admite mais representações do que as que correspondem à acção do momento angular orbital. Estas últimas descrevem partı́culas com spin inteiro; as novas representações descrevem partı́culas com spin semi-inteiro. Um spin semi-inteiro é uma quantidade que não tem equivalente em mecânica clássica, mas cuja existência fı́sica estabeleceremos seguidamente, como consequência de resultados experimentais. 9.1 Representações da álgebra do momento angular A álgebra (9.0.3) é um caso particular de uma álgebra de Lie. Como estas álgebras são centrais no estudo de grupos de simetria contı́nuos (grupos de Lie), e estes descrevem muitas simetrias que aparecem em sistemas fı́sicos, vamos enquadrar a nossa discussão desta secção no contexto mais geral de álgebras e grupos de Lie. Começamos por definir álgebra de Lie: Definição: Seja L um espaço vectorial de dimensão finita sobre um corpo K (K = R ou K = C). L é uma álgebra de Lie sobre K se existir, em L, uma regra de composição X, Y −→ [X, Y ] , (9.1.1) que satisfaça os seguintes axiomas para ∀X, Y, Z ∈ L: i) linearidade; ∀α, β ∈ K, [αX + βY, Z] = α[X, Z] + β[Y, Z] ; (9.1.2) [X, Y ] = −[Y, X] ; (9.1.3) ii) anti-simetria, iii) identidade (ou associatividade) de Jacobi, [X, [Y, Z]] + [Z, [X, Y ]] + [Y, [Z, X]] = 0 . (9.1.4) 9.1 Representações da álgebra do momento angular 255 A operação [. . . , . . .] é denominada multiplicação de Lie. Esta multiplicação é genericamente anti-comutativa e não associativa. Notemos que um exemplo de produto de Lie, que encontramos na secção 1.3.1, é dado pelos parêntesis de Poisson; um outro, que é a razão pela qual introduzimos aqui a teoria de Lie, é o comutador quântico. Consideremos algumas definições importantes relativas a uma álgebra de Lie: • Uma álgebra de Lie é dita abeliana ou comutativa se, ∀X, Y ∈ L, [X, Y ] = 0. • Um sub-espaço vectorial de L, L1 ⊂ L, é uma sub-álgebra de Lie se [X, Y ] ∈ L1 , ∀X, Y ∈ L1 . (9.1.5) • Um sub-espaço vectorial de L, L1 ⊂ L, é um ideal se [X, Y ] ∈ L1 , ∀X ∈ L1 , ∀Y ∈ L ; (9.1.6) um ideal é, portanto, um sub-conjunto “absorvente” da álgebra e qualquer ideal é uma sub-álgebra. • Um sub-espaço vectorial de L, L1 ⊂ L, é um ideal máximo ou centro se [X, Y ] = 0 , ∀X ∈ L1 , ∀Y ∈ L ; (9.1.7) o centro comuta, portanto, com toda a álgebra e constitui uma sub-álgebra abeliana. • Seja {ei } uma base de L. A multiplicação de Lie para esta base define as constantes de estrutura da álgebra de Lie, cij k , [ei , ej ] = cij k ek . (9.1.8) Note-se que como consequência dos axiomas, as constantes de estrutura obedecem a cjki = −ckji , cis p cjks + cjsp ckis + cksp cij s = 0 . (9.1.9) Note-se ainda que estas “constantes” dependem da base; de facto transformamse como um tensor com dois ı́ndices covariantes e um contravariante numa transformação de base. 256 Teoria Geral do Momento Angular e Spin • Uma representação da álgebra de Lie, denotada por D, é uma aplicação linear de L para um espaço vectorial V, que preserva o produto de Lie; isto é D : L −→ V , (9.1.10) D([X, Y ]) = [D(X), D(Y )] . (9.1.11) tal que Para definir a representação necessitamos pois de definir o produto de Lie em V. Geralmente as representações são classificadas pelos valores próprios dos chamados invariantes de Casimir, que são operadores que comutam com os geradores da álgebra; encontram-se por isso no centro da mesma.2 No caso da âlgebra do momento ângular o invariante de Casimir será Jˆ2 . • Uma representação matricial de dimensão n da álgebra da Lie é uma aplicação da álgebra de Lie para o espaço de matrizes, em geral de entradas complexas, de n × n. É fácil de verificar que este é um espaço vectorial sobre o corpo C. O produto de Lie no espaço vectorial das matrizes é definido como o comutador [X, Y ] = X · Y − Y · X , (9.1.12) e onde “·” é o produto usual de matrizes. Com esta forma de multiplicação de Lie, é simples verificar a identidade de Jacobi, que surge como consequência da associatividade do produto de matrizes. O espaço vectorial onde a representação matricial actua tem como base os estados fı́sicos do sistema. Dizemos que os estados se transformam pela acção da representação n dimensional da álgebra de Lie. Por exemplo, para a álgebra do momento angular, estados escalares transformam-se pela acção da representação um dimensional; estados spinoriais pela acção da representação dois dimensional; estados vectoriais pela acção da representação três dimensional, etc. Vamos agora estudar representações matriciais da álgebra do momento angular, isto é um conjunto de matrizes Ji que obedecem a (9.0.3). Começamos por definir os operadores 2 Como os invariantes de Casimir são geralmente quadráticos ou até de ordem mais elevada nos geradores, poderão não ser vectores de L; ainda assim dizemos que se encontram no centro da álgebra. 9.1 Representações da álgebra do momento angular 257 não hermı́ticos em escada análogos a (6.2.32): Jˆ+ = Jˆx + iJˆy , Jˆ− = Jˆx − iJˆy , (9.1.13) que obedecem às relações de comutação h i Jˆ2 , Jˆ± = 0 , h i Jˆ− , Jˆ+ = −2~Jˆz , h i Jˆz , Jˆ± = ±~Jˆ± , (9.1.14) exactamente análogas a (6.2.33), onde definimos o momento angular total Jˆ2 como Jˆ2 ≡ Jˆx2 + Jˆy2 + Jˆz2 . (9.1.15) Queremos considerar os estados com momento angular bem definido. No caso do momento angular orbital estes estados diagonalizavam simultaneamente L̂2 e, por escolha, L̂z ; na notação de Dirac tais estados foram denotados |ℓ, mi. L̂2 e L̂z formam um C.C.O.C. para o problema dos estados com momento angular orbital bem definido; isto é, especificando ℓ e m, que determinam univocamente os valores próprios de L̂2 e L̂z , especifica um único estado de momento angular orbital bem definido. Por analogia vamos assumir que: • Os estados com momento angular bem definido diagonalizam simultaneamente Jˆ2 e Jˆz ; • Estes estados, denotados |j, mi, são rotulados pelos números quânticos j e m, que determinam univocamente os valores próprios de Jˆ2 e Jˆz ; • A correspondência entre o rótulo m e o valor próprio de Jˆz é Jˆz |j, mi = m~|j, mi . (9.1.16) Note-se que, como Jˆ2 e Jˆz são observáveis, estados próprios com valores próprios distintos são ortogonais; assumindo normalização temos hj ′ , m′ |j, mi = δj ′ j δm′ m . (9.1.17) Para construir as representações pretendidas, consideramos a álgebra h i Jˆz , Jˆ± = ±~Jˆ± , (9.1.18) 258 Teoria Geral do Momento Angular e Spin que implica que Jˆ± |j, mi é estado próprio de Jˆz com valor próprio (m ± 1)~; logo Jˆ+ |j, mi = Cjm |j, m + 1i , Jˆ− |j, mi = C̃jm |j, m − 1i . (9.1.19) As constantes introduzidas Cjm e C̃jm não são todas independentes; de facto (Cjm )∗ = (hj, m + 1|Jˆ+ |j, mi)∗ = hj, m|Jˆ− |j, m + 1i = C̃jm+1 . (9.1.20) Por outro lado, a relação de comutação h i ˆ ˆ J− , J+ = −2~Jˆz , (9.1.21) origina hj, m|Jˆ− Jˆ+ − Jˆ+ Jˆ− |j, mi = −2~hj, m|Jˆz |j, mi ⇔ C̃jm Cjm−1 − Cjm C̃jm+1 = 2~2 m . (9.1.22) Juntamente com (9.1.20) esta relação implica |Cjm−1 |2 − |Cjm |2 = 2~2 m , (9.1.23) que tem como solução geral3 |Cjm |2 = (C − m(m + 1))~2 |C̃jm |2 = (C − m(m − 1))~2 , ⇒ (9.1.24) onde C é uma constante real, dado que |Cjm |2 é real. Como os lados esquerdos de (9.1.24) são positivos e os lados direitos se tornam negativos para m suficientemente grande em 3 Para ver isto escreva |Cjm |2 ≡ f (m) como uma série de potências f (m) = +∞ X an mn . n=0 A equação (9.1.23) é reescrita f (m − 1) − f (m) = 2~2 m ⇔ +∞ X n=0 an ((m − 1)n − mn ) = 2~2 m . Logo an = 0 para n > 2, e a equação anterior fica (1 − 2m)a2 − a1 = 2~2 m ou ainda a2 = −~2 , a1 = a2 . Logo f (m) = −~2 (m + m2 ) + a0 , que é equivalente à primeira expressão em (9.1.24). 9.1 Representações da álgebra do momento angular 259 módulo, temos de concluir que os valores possı́veis para m têm um máximo e um mı́nimo, denotados por m̄ e m, respectivamente: m = m, m + 1, . . . , m̄ − 1, m̄ . (9.1.25) Em termos destes valores, (9.1.24) deve ser escrito como |Cjm |2 = (m̄(m̄ + 1) − m(m + 1))~2 |C̃jm |2 = (m(m − 1) − m(m − 1))~2 , (9.1.26) e como |Cjm |2 = |C̃jm+1 |2 , concluimos que m̄(m̄ + 1) = m(m − 1), o que pode ser reescrito (m̄ + m)(m̄ − m + 1) = 0 ⇒ m = −m̄ ∨ m = m̄ + 1 . (9.1.27) A segunda possibilidade é excluı́da pois m̄ > m, por hipótese. Como m̄ − m ∈ Z+ 0 (dado que diferem de um múltiplo da unidade e o primeiro é maior do que o segundo), obtemos que 2m̄ ∈ Z+ 0 , pelo que concluimos que 3 5 1 m̄ = 0, , 1, , 2, , . . . 2 2 2 (9.1.28) Para vermos os valores próprios de Jˆ2 notamos que 1ˆ ˆ 2 ˆ ˆ ˆ J+ J− + J− J+ + Jˆz2 . J = 2 (9.1.29) O valor esperado deste operador num estado |j, mi é 1 9.1.26 hj, m|Jˆ2 |j, mi = |Cjm−1 |2 + |Cjm |2 + m2 ~2 = ~2 m̄(m̄ + 1) . 2 (9.1.30) Mas |j, mi é função própria de Jˆ2 pelo que concluimos que o valor próprio é m̄(m̄ + 1)~2 . Denotando m̄ ≡ j temos então Jˆ2 |j, mi = j(j + 1)~2 |j, mi , Jˆz |j, mi = m~|j, mi p Jˆ± |j, mi = ~ j(j + 1) − m(m ± 1)|j, m ± 1i , (9.1.31) onde 2j ∈ N0 , m = −j, −j + 1, . . . , j − 1, j. Descobrimos, pois um conjunto infinito de representações da álgebra (9.0.3), rotuladas por j e que denotamos Dj , com dimensão 2j+1. Estas representações são todas irredutı́veis, 260 Teoria Geral do Momento Angular e Spin pois em cada uma delas podemos transformar |j, mi em |j, m′ i, ∀m, m′ , pela acção de Jˆ+ e Jˆ− . A base do espaço vectorial onde a representação Dj actua é {|j, mi}, com m = −j, −j + 1, . . . , j − 1, j. Os geradores da álgebra terão, em cada representação Dj , uma representação matricial em termos de matrizes quadradas de dimensão 2j + 1, com componentes (Ji )m′ m = hj, m′ |Jˆi |j, mi . (9.1.32) Consideremos as primeiras representações, para o que irá ser útil notar que Jˆ+ + Jˆ− , Jˆx = 2 Jˆ+ − Jˆ− Jˆy = , 2i (9.1.33) logo p ~ p j(j + 1) − m(m + 1)δm′ ,m+1 + j(j + 1) − m(m − 1)δm′ ,m−1 , 2 p ~ p hj, m′ |Jˆy |j, mi = j(j + 1) − m(m + 1)δm′ ,m+1 − j(j + 1) − m(m − 1)δm′ ,m−1 , 2i hj, m′ |Jˆx |j, mi = hj, m′ |Jˆz |j, mi = ~mδm′ ,m . (9.1.34) • j = 0, representação 1-dimensional; base do espaço onde a representação actua é {|0, 0i}; elementos de matriz: h0, 0|Jˆx |0, 0i = 0 ; h0, 0|Jˆy |0, 0i = 0 ; h0, 0|Jˆx |0, 0i = 0 . (9.1.35) Logo todos os geradores da álgebra são representados por ‘zero’. Esta representação é trivial e não é fiel (i.e não é injectiva). O único vector da base corresponde ao harmónico esférico Y00 , que é constante e não é alterado pelo grupo de transformações (rotações) geradas pela álgebra do momento angular. • j = 1/2, representação 2-dimensional; a base do espaço vectorial onde a representação 9.1 Representações da álgebra do momento angular 261 actua é {|1/2, 1/2i, |1/2, −1/2i}; elementos de matriz: 0 1 ~ ≡ ~ σx h1/2, m′ |Jˆx |1/2, mi = 2 2 1 0 0 −i ~ ≡ ~ σy h1/2, m′ |Jˆy |1/2, mi = 2 2 i 0 1 0 ~ ≡ ~ σz h1/2, m′|Jˆz |1/2, mi = 2 2 0 −1 . (9.1.36) As matrizes σx , σy e σz são denominadas matrizes de Pauli. O espaço onde esta representação actua, tal como os de outras representações com j semi-inteiro, deve ser visto como um espaço vectorial interno; neste caso esse espaço é denominado espaço de spin 1/2 ou simplesmente espaço de spin e os Jˆi são usualmente representados como Ŝi . Esta representação é fiel. • j = 1, representação 3-dimensional; a base do espaço vectorial onde a representação actua é {|1, 1i, |1, 0i, |1, −1i}; elementos de matriz: 0 1 0 ~ h1, m′ |Jˆx |1, mi = √ 1 0 1 , 2 0 1 0 0 1 0 ~ h1, m′ |Jˆy |1, mi = √ −1 0 1 , 2i 0 −1 0 1 0 0 h1, m′ |Jˆz |1, mi = ~ 0 0 0 . 0 0 −1 (9.1.37) A base do espaço vectorial onde esta representação actua corresponde aos harmónicos esféricos Y1±1 e Y10 . De acordo com as relações (6.5.49) podemos fazer a mudança de base |xi −1 r 2π r i |yi = 3 |zi 0 0 1 |1, 1i 0 i |1, 0i √ 2 0 |1, −1i . (9.1.38) 262 Teoria Geral do Momento Angular e Spin Tomando agora a base {|xi, |yi, |zi} para a representação j = 1, temos os elementos de matriz: hx |Jˆk |xj i = i 1 X hxi |1, m′ ih1, m′ |Jˆk |1, mih1, m|xj i ; (9.1.39) m,m′ =−1 obtemos assim as matrizes que representam os geradores da álgebra do momento angular na base {|xi, |yi, |zi}: 0 0 0 i ˆ j hx |Jx |x i = i~ 0 0 1 0 −1 0 0 0 1 j ˆ hx |Jy |x i = i~ 0 0 0 −1 0 0 0 1 0 i ˆ j hx |Jz |x i = i~ −1 0 0 0 0 0 i . (9.1.40) Reconhecemos os geradores das rotações em R3 . Por exemplo, uma rotação finita por um ângulo θ em torno do eixo Oz é obtida exponenciando o respectivo gerador: cos θ sin θ 0 ˆ Rz (θ) = e−iθJz /~ = − sin θ cos θ 0 . 0 0 1 (9.1.41) As representações matriciais de dimensão mais elevada podem ser construidas de um modo análogo. Exercı́cio: Construa a representação com j = 3/2. Relação com o grupo de Lie O mapa exponencial exemplificado em (9.1.41) é a relação genérica entre uma álgebra de Lie e o grupo de Lie respectivo. Comecemos por relembrar a estrutura de grupo: Definição: Um grupo G é um conjunto de elementos {g} com uma lei de composição ‘◦’ que obedece às seguintes condições: i) O grupo é uma estrutura fechada: g1 ◦ g2 ∈ G , ∀g1 , g2 ∈ G; 9.1 Representações da álgebra do momento angular 263 ii) A lei de composição do grupo é associativa: (g1 ◦ g2 ) ◦ g3 = g1 ◦ (g2 ◦ g3 ) , ∀g1 , g2 , g3 ∈ G; iii) Existe um elemento neutro (identidade) denotado por 1: 1 ◦ g = g ◦ 1 , ∀g ∈ G; iv) Existe um inverso para qualquer elemento do grupo g, que é denotado por g −1 : ∀g , ∃g −1: g ◦ g −1 = g −1 ◦ g = 1. Um grupo de Lie é um grupo contı́nuo, isto é um grupo cujos elementos são rotulados por parâmetros que variam continuamente. Essa continuidade dá uma estrutura de variedade diferenciável aos grupos de Lie, com uma determinada geometria local e uma determinada topologia. Dada uma álgebra de Lie, L podemos obter um grupo de Lie GL exponenciando os geradores da álgebra, tal como em (9.1.41): X∈L ⇒ e−iαX ∈ GL ; (9.1.42) o ponto fundamental (que não vamos demonstrar) é que a identidade de Jacobi da álgebra garante a associatividade da lei de composição do grupo. Podemos agora ver duas propriedades genéricas das matrizes do grupo associado à álgebra do momento angular: • Para qualquer representação o traço das matrizes que representam a álgebra do momento angular é zero para qualquer dos geradores. Usamos então o seguinte facto: se duas matrizes A e B obedecem a A = eB então det A = eTrB . Logo se o traço das matrizes que representam os geradores de uma álgebra de Lie é zero o determinante das matrizes que representam o grupo é igual a um. Tais matrizes denominam-se especiais; • Como os geradores da álgebra do momento angular são hermı́ticos, os elementos do grupo de Lie associado obedecem a g † = (e−iθJ )† = eiθJ = g −1 . Os elementos do grupo são portanto operadores unitários: gg † = g † g = 1. No caso da representação três dimensional pudemos escolher uma base em que os geradores são matrizes puramente imaginárias e anti-simétricas (9.1.40). Nesse caso, 264 Teoria Geral do Momento Angular e Spin as matrizes da representação do grupo de Lie são ortogonais; de facto, nesse caso o expoente torna-se real e uma matriz anti-simétrica A, pelo que g T = (eθA )T = e−θA = g −1 , o que implica que gg T = g T g = 1, o que é a definção de operadores ortogonais. Considermos pois as várias representações do grupo de Lie associado ao momento angular: • j = 0: dado que os geradores da álgebra são representados por zero, os elementos do grupo reduzem-se todos ao operador identidade Rk (θ) = e−iθJk /~ = 1 ; (9.1.43) os estados que formam a base do espaço vectorial onde o grupo actua são pois invariantes pela acção do grupo e denominam-se estados escalares. • j = 1/2: Os elementos do grupo têm a forma Rk (θ) = e−iθJk /~ = e−iθσk /2 . (9.1.44) Para escrevermos os elementos do grupo mais explicitamente notamos a identidade ~ σ · B) ~ =A ~ ·B ~ 1̂ + i~σ · (A ~ × B) ~ , (~σ · A)(~ (9.1.45) ~ e B ~ são dois vectores arbitrários e ~σ = (σx , σy , σz ) as matrizes de Pauli onde A (9.1.36). Seja ~u um vector unitário. Pela fórmula anterior concluimos que 1̂ se n par 2 n (~σ · ~u) = 1 ; logo (~σ · ~u) = . ~σ · ~u se n ímpar (9.1.46) torno do eixo definido por ~u é dada por θ θ θ − iu sin (−iu − u ) sin cos z x y 2 2 2 . Ru~ (θ) = e−iθ~σ·~u/2 = (−iux + uy ) sin θ2 cos θ2 + iuz sin 2θ (9.1.47) Logo, a representação dos elementos do grupo correspondentes a uma rotação em Note-se que Ru~ (2π) = −1 e Ru~ (4π) = 1. Ou seja para voltar ao mesmo estado no espaço de spin 1/2 necessitamos de fazer uma rotação por um ângulo 4π. 9.2 Emergência Fı́sica do Spin 265 • j = 1: Os elementos do grupo têm a forma 1 0 0 Rx (θ) = e−iθJx /~ = 0 cos θ sin θ 0 − sin θ cos θ Ry (θ) = e−iθJy /~ = cos θ sin θ 0 Rz (θ) = e−iθJz /~ = − sin θ cos θ 0 0 0 1 . cos θ 0 0 sin θ 1 0 − sin θ 0 cos θ (9.1.48) Estas são as bem conhecidas matrizes de rotação a actuar em R3 . Acabamos de construir várias representações dos operadores de rotação. Estes operadores são os elementos do grupo de Lie que descreve as rotações. Este grupo é designado por SU(2), pois é constituido por Special Unitary matrices sendo a sua representação fundamental de dimensão 2 - as matrizes de Pauli. Este é o grupo de Lie associado à álgebra do momento angular. Um seu sub-grupo é SO(3) o grupo de Special Orthogonal matrices que está associado apenas às representações do momento angular orbital e cuja representação fundamental é três dimensional. A álgebra de Lie associada a SU(2) é denotada su(2), enquanto que a álgebra de Lie associada a SO(3) é denotada so(3). Como vimos estas álgebras são isomórficas. su(2) ∼ = so(3) . (9.1.49) Mas os grupos distinguem-se pelo facto de SU(2) ter mais representações que SO(3), sendo SO(3) um grupo mais reduzido do que SU(2).4 9.2 Emergência Fı́sica do Spin No tratamento do átomo de hidrogénio que efectuamos no capı́tulo 6 descrevemos os estados estacionários do electrão através de uma função de onda Φ(~r) que depende somente das 4 Geometricamente o grupo SU (2) é uma 3-esfera, S 3 , enquanto que SO(3) é uma 3-esfera com pontos identificados S 3 /Z2 . 266 Teoria Geral do Momento Angular e Spin variáveis espaciais ~r. Este tratamento permitiu-nos deduzir o espectro de energias para o átomo de hidrogénio que havia sido introduzido fenomenologicamente por Bohr. Claro que um tratamento baseado na equação de Schrödinger não é relativista. Para justificarmos que a aproximação não relativista é aceitável estimemos classicamente a velocidade de um electrão numa órbita circular, que obedece a me e2 v2 = ; r 4πǫ0 r 2 (9.2.1) estimando o raio da órbita r pelo raio de Bohr (6.4.22) e introduzindo a constante de estrutura fina (2.2.4) concluimos que e2 = me v ∼ 4πǫ0 a0 2 e2 4πǫ0 ~c 2 me c2 ⇔ v ∼ αc . (9.2.2) Como a constante de estrutura fina é da ordem de α ∼ 1/137, a aproximação não relativista é justificada. Contudo, é de esperar que surjam correcções relativistas no problema do átomo de hidrogénio. A equação relativista da mecânica quântica, designada por equação de Dirac introduz, de facto, não só correcções cinemáticas para as variáveis de posição que descrevem o electrão - como a variação da massa com a velocidade -, mas ainda uma caracterı́stica totalmente nova para o electrão: o spin. Historicamente, contudo, o spin do electrão foi descoberto experimentalmente antes da introdução da equação de Dirac, proposta em 1928. Tais resultados experimentais, que serão discutidos seguidamente, levaram George Uhlenbeck e Samuel Goudsmit a propôr, em 1925, a ideia de um momento angular intrı́nseco para o electrão; Pauli, em 1927, formalizaria esta ideia propondo uma teoria - fenomenológica - que permitia incorporar o spin na mecânica quântica não relativista, usando alguns postulados suplementares. Esta teoria foi motivada por vários resultados experimentais, dos quais discutiremos agora três: A estrutura fina Um estudo preciso das linhas espectrais do átomo de hidrogénio (por exemplo), revela uma sub-estrutura denominada estrutura fina.5 Cada linha na figura 2.12 é na verdade composta 5 A estrutura fina de linhas espectrais foi descoberta usando interferometria por A.A.Michelson em 1891-92: Phil. Mag. 31 (1891) 338; ibid. 34 (1892) 280. 9.2 Emergência Fı́sica do Spin 267 por várias linhas, com frequências muito idênticas mas que podem ser distinguidas por um espectrómetro com boa resolução. Por exemplo, a transição 2p → 1s é na verdade um dupleto de linhas espectrais, com as duas linhas separadas por cerca de 10−4 eV . Esta separação é cerca de 105 vezes menor que a diferença de energia entre o nı́vel n = 2 e n = 1, que é de cerca de 10.2 eV . Este dupleto será estudado em detalhe na secção 11.1.4. Isto significa que existem grupos de nı́veis atómicos energeticamente muito próximos mas distintos, o que não é previsto pela descrição quântica do átomo de hidrogénio feita no capı́tulo 6, i.e sem spin, que se baseava apenas no Hamiltoniano H= p2 e2 − . 2µ 4πǫ0 r (9.2.3) A teoria completa do átomo de hidrogénio tem de levar em conta vários outros termos no Hamiltoniano, todos eles aparecendo de um modo natural da equação de Dirac. As primeiras correcções a (9.2.3), responsáveis pela estrutura fina, são as seguintes:6 i) Correcções relativistas à energia cinética. A velocidade do electrão é da ordem de αc e como tal não é “muito relativista”, pelo que podemos considerar apenas a primeira correcção relativista à energia cinética, que tem a forma Wmv = − p4 . 8µ3 c2 (9.2.4) Os estados estacionários do átomo de hidrogénio sem spin não são estados próprios deste operador (depois de quantificação canónica deste termo), pelo que ele deverá ser tratado como uma perturbação (cf. capı́tulo 11). Pode-se estimar que as correcções ao espectro de energias do átomo de hidrogénio provenientes desta perturbação são supressas por um factor de α2 relativamente ao espectro não perturbado - ou seja as correcções são cerca de 104 − 105 vezes menores que o espectro não perturbado. ii) Acoplamento spin-órbita. O electrão do átomo de hidrogénio vê uma corrente, devido ao facto de no seu referencial o núcleo estar em movimento. Assim o electrão vê um 6 Todos estes termos serão discutidos em maior detalhe na secção 11.1.4. 268 Teoria Geral do Momento Angular e Spin campo magnético, pelo que, se ele tem um momento magnético intrı́nseco ~µS , existe um acoplamento do tipo ~ , WSO = −~µS · B ~µS = g µB ~ S, ~ (9.2.5) no Hamiltoniano, onde g é a razão giromagnética do electrão e µB o magnetão de ~ o que pode ser Bohr. A forma explı́cita desta perturbação requer então calcular B, ~ do núcleo visto num feito através de uma transformação de Lorentz do campo E referencial onde este está parado. Para esse cálculo tem de ser também levada em conta a chamada precessão de Thomas. Chega-se assim ao resultado: WSO = 1 e2 g ~ ~ L·S . 3 2 4πǫ0 r 2m2 c2 (9.2.6) Esta correcção irá ser da mesma ordem que a correcção relativista. iii) Existe ainda uma outra correcção da mesma ordem de grandeza das duas anteriores, denominada termo de Darwin. Este termo surge pelo facto de, na expansão em v/c da equação de Dirac, o electrão ser afectado numa vizinhança da ordem do comprimento de onda de Compton pelo potencial do protão, e não apenas num ponto. O termo tem a forma WD = ~2 ∆V , 8m2 c2 (9.2.7) onde ∆V é o laplaciano da energia potencial de Coulomb. A teoria de Pauli irá introduzir a correcção ii), o que irá explicar, qualitativamente, algumas caracterı́sticas da estrutura fina. O efeito Zeeman Anómalo Como vimos na secção 6.5.4, quando um átomo é imerso num campo magnético uniforme, cada uma das suas linhas espectrais separa-se num certo número de linhas equidistantes, cuja distância é proporcional ao campo magnético - efeito Zeeman. A explicação deste efeito baseia-se no Hamiltoniano (6.5.10) que inclui o acoplamento paramagnético ~ , H1 = −~µL · B ~µL = µB ~ L. ~ (9.2.8) 9.2 Emergência Fı́sica do Spin 269 Negligenciando o acoplamento diamagnético obtemos o espectro (6.5.39) E(N,m) = EN − µB Bm . (9.2.9) Esta descrição teórica é verificada experimentalmente em certos casos - efeito Zeeman normal - mas não noutros - efeito Zeeman anómalo. A anomalia mais importante aparece para átomos com Z ı́mpar, que inclui o hidrogénio: os seus nı́veis de energia dividem-se num número par de sub-nı́veis, enquanto que a teoria prevê um número ı́mpar igual a 2ℓ+1 para o nı́vel com número quântico ℓ, que é inteiro. A teoria de Pauli irá substituir ℓ por j que pode tomar valores semi-inteiros, resolvendo este problema. A experiência de Stern Gerlach (1922) A experiência consiste em estudar a deflexão de um feixe de átomos de prata 47 Ag (que são paramagnéticos e neutros) num campo magnético fortemente não uniforme. O aparato ~ tem as seguintes experimental está representado na figura 9.1. O campo magnético B caracterı́sticas: • Tem um plano de simetria yOz; • Não depende de y (negligenciamos efeitos de bordo); • Não tem componente segundo y; • A sua maior componente é segundo z. Examinemos o cálculo clássico da deflexão. Sendo neutros, os átomos de prata não estão sujeitos à força de Lorentz; a interacção entre os átomos e o campo resulta apenas do acoplamento dipolar ~ ; H = −~µ · B ~ , logo F~ = ∇(~µ · B) (9.2.10) ~ fosse constante. Concluimos que é a força sentida pelos átomos, que seria zero caso B a força depende do momento magnético; mas o momento magnético tem uma dinâmica própria devido a um torque exercido pelo campo magnético externo da forma ~ ; ~τ = ~µ × B (9.2.11) 270 Teoria Geral do Momento Angular e Spin Figura 9.1: a) Átomos de prata estão contidos na fornalha E, que é aquecida a altas temperaturas. Os átomos podem ser emitidos da fornalha através de uma pequena abertura. Uma outra pequena abertura F colima o feixe de átomos, escolhendo aqueles cuja velocidade é paralela à direcção Oy. Os átomos são então deflectidos pelo gradiente do campo magnético criado por A e condensam no ponto N do alvo P ; b) Perfil das linhas de força do campo magnético (extraı́do de Cohen et al,‘Quantum Mechanics’ ). assumindo que este momento magnético resulta de um momento angular, ~µ = gµB ~ S, ~ (9.2.12) então a lei fundamental da mecânica de rotação diz-nos que ~ dS ~ = ~µ × B dt ⇔ ~ dS gµB ~ ~ S ×B . = dt ~ (9.2.13) Esta equação diz-nos que o dipólo precessa em torno do campo magnético. Como o campo magnético é essencialmente segundo a direcção Oz, o dipolo precessa essencialmente em torno do eixo Oz. Logo a média temporal das componentes µx e µy será aproximadamente zero, pelo que não deverão influir na força que os átomos de prata sentem. Com esta aproximação F~ ≃ µz ∇Bz ; (9.2.14) por hipótese ∂Bz /∂y = 0 e no plano de simetria ∂Bz /∂x = 0. Logo a força é essencialmente paralela a Oz e proporcional a µz , F~ ≃ µz ∂z Bz ez . Como tal, deflexão HN é uma medida 9.2 Emergência Fı́sica do Spin 271 Figura 9.2: Resultado clássico esperado (linha tracejada) e observado (linha sólida) na experiência de Stern-Gerlach (extraı́do de Cohen et al,‘Quantum Physics’ ). de µz . O resultado esperado classicamente para a experiência anterior baseia-se na seguinte observação. Os átomos de prata deveriam ter uma distribuição de momento magnético isotrópica quando saem da fornalha. Logo todos os valores de µz entre −|~µ| e +|~µ| deveriam ser encontrados, pelo que se esperaria um padrão do tipo da linha tracejada na figura 9.2, i.e. deflexões entre N1 e N2 . Note-se que a dispersão das velocidades e a largura finita da fenda explicam a curva extender-se um pouco além de Ni . O resultado observado é, contudo, muito diferente. Observam-se 2 pontos de impacto priveligiados - linhas sólidas na figura 9.2; ou seja a medição de µz só pode originar dois resultados possı́veis. Descrevemos agora a interpretação quântica da experiência anterior. Os átomos de prata têm um electrão desemparelhado e o seu momento magnético resulta do spin desse electrão por (9.2.12). Assim, uma medição de µz é uma medição de Sz , que, de acordo com a experiência de Stern-Gerlach, só pode tomar dois valores possı́veis. Pelo estudo das representações do momento angular da secção 9.1, na representação Dj , Sz tem 2j + 1 valores possı́veis, pelo que j = 1/2. Esta será a representação escolhida para descrever o electrão na teoria de Pauli. Notas: 272 Teoria Geral do Momento Angular e Spin • Se fizéssemos a experiência com electrões, como a carga não seria zero, a força de Lorentz iria disfarçar o efeito do spin. O objectivo de usar átomos de prata é ter uma partı́cula de spin 1/2 sem carga. • As condições experimentais podem ser escolhidas de modo a que a dispersão espacial da função de onda seja suficientemente pequena para poder tratar as variáveis posição e momento classicamente. A experiência anterior pode ser teorizada com o seguinte formalismo: i) O electrão tem graus de liberdade externos ou orbitais (~r e ~p) e um grau de liberdade ~ interno (o spin S); ii) O espaço vectorial interno tem dimensão 2 e base |+i = |1/2, 1/2i , |−i = |1/2, −1/2i , (9.2.15) tal que ~ Ŝz |±i = ± |±i , 2 (9.2.16) o que equivale a dizer que, nesta base, a componente z do operador de momento angular intrı́nseco tem representação 1 0 ~ ≡ ~ σz ; Ŝz = 2 2 0 −1 a álgebra do momento angular é obedecida se escolhermos 0 1 0 −i ~ ~ ≡ ~ σx , ≡ ~ σy . Ŝx = Ŝy = 2 2 2 2 1 0 i 0 (9.2.17) (9.2.18) Esta é a representação dois dimensional de su(2), (9.1.36). • Note que o ponto fundamental da experiência de Stern-Gerlach é não só a confirmação da quantificação do momento magnético do electrão (e como tal do seu spin) mas também, e sobretudo, mostrar que j = 1/2. 9.3 Postulados da teoria de Pauli 9.3 273 Postulados da teoria de Pauli Para explicar os resultados experimentais anteriores, Uhlenbeck e Goudsmit propuseram, em 1925, que o electrão tem um momento angular intrı́nseco - spin. Este spin confere-lhe um momento magnético ~µS = 2µB ~ S. ~ (9.3.1) Ou seja, a razão giromagnética do electrão é g = 2 (chamado valor quântico), que era necessária para explicar quantitativamente as deflexões observadas na experiência de SternGerlach e as separações espectrais no efeito Zeeman anómalo. Note-se que a razão giromagnética orbital é g = 1 (chamado valor clássico), metade da de spin. O valor g = 2 que aqui é imposto fenomenologicamente é extraı́do naturalmente da equação de Dirac. Pauli elaborou a proposta de Uhlenbeck e Goudsmit tornando-a um pouco mais precisa e conferindo-lhe o carácter de postulados adicionais da mecânica quântica que agora descrevemos. Em primeiro lugar notamos que o nosso estudo até ao momento incidiu sobre a quantificação de variáveis orbitais, como a posição ~r e o momento p~, às quais associamos op~ ~ eradores R̂ e P̂ que actuam num espaço de estados E~r , que é isomórfico ao espaço das funções de onda. Denominamos E~r como espaço de estados orbitais. A estas variáveis orbitais temos de adicionar as variáveis de spin que satisfazem os seguintes postulados: ~ i) O operador de spin, Ŝ é um momento angular, o que significa que [Ŝj , Ŝk ] = i~ǫjkl Ŝl ; (9.3.2) ii) Os operadores de spin actuam num novo espaço vectorial, denominado espaço de estados de spin, ES , onde Ŝ 2 e Ŝz são um C.C.O.C.; o espaço ES tem como base os estados próprios comuns a Ŝ 2 e Ŝz , {|s, mi}: Ŝ 2 |s, mi = s(s + 1)~2 |s, mi , Ŝz |s, mi = m~|s, mi , (9.3.3) onde 2s ∈ N0 e m = −s, −s + 1, . . . , s − 1, s. Uma dada partı́cula é caracterizada por um único valor de s; dizemos que a partı́cula tem spin s. Logo, ES tem sempre 274 Teoria Geral do Momento Angular e Spin dimensão finita e igual a 2s + 1; todos os estados de spin de uma dada partı́cula são vectores próprios de Ŝ 2 com o mesmo valor próprio s(s + 1)~2 ; iii) O espaço de estados completo, E, é o produto tensorial de E~r com ES : E = E~r ⊗ ES . Isto significa que todas as observáveis de spin comutam com todas as observáveis orbitais. Daqui resulta que, excepto para o caso com s = 0, é insuficiente especificar o ket de E~r para caracterizar o estado da partı́cula. É necessário também especificar o estado de spin; isto é C.C.O.C. = {observáveis orbitais, observáveis de spin} . Qualquer estado da partı́cula é uma combinação linear de vectores que são o produto tensorial de um ket de E~r com outro de ES ; iv) O electrão é uma partı́cula de spin 1/2 (s = 1/2). Logo, para o electrão ES é 2dimensional. O momento magnético intrı́nseco do electrão é dado por (9.3.1). O operador Hamiltoniano que descreve o comportamento de um electrão na presença ~ e φ é dado por de um campo electromagnético descrito pelos potenciais A Ĥ = ~ ~ (P̂ − q Â)2 q~ ~ + q φ̂ − ~σ · B̂ , 2me 2me (9.3.4) que, usando as propriedades das matrizes de Pauli, pode ser reescrito na forma Ĥ = ~ ~ [~σ · (P̂ − q Â)]2 + q φ̂ . 2me (9.3.5) Este é o Hamiltoniano de Pauli. 9.4 Descrição não relativista de partı́culas de spin 1 2 Vamos agora considerar em detalhe os graus de liberdade de spin para o caso s = 1/2. ES tem dimensão 2 e tomamos como base {|+i, |−i}, que obedece a 3 Ŝ 2 |±i = ~2 |±i , 4 ~ Ŝz |±i = ± |±i . 2 (9.4.1) 9.4 Descrição não relativista de partı́culas de spin 1 2 275 As relações de ortonormalização podem então ser escritas: h+|−i = 0 , h−|−i = 1 , h+|+i = 1 , (9.4.2) e a relação de fecho |+ih+| + |−ih−| = 1̂ . (9.4.3) O estado de spin mais geral tem a forma |χi = c+ |+i + c− |−i , c± ∈ C . (9.4.4) Todos os kets de ES são vectores próprios de Ŝ 2 com valor próprio 3~2 /4. Logo Ŝ 2 = 3~2 1̂ . 4 (9.4.5) Podemos definir os operadores em escada Ŝ± = Ŝx ± iŜy , (9.4.6) que têm acção Ŝ+ |+i = 0 , Ŝ+ |−i = ~|+i , Ŝ− |+i = ~|−i , Ŝ− |−i = 0 . (9.4.7) Todos os operadores que actuam em ES são representados na base {|+i, |−i} por matrizes de 2 × 2; os operadores de momento angular têm a representação ~ ~ Ŝ = ~σ , 2 (9.4.8) onde ~σ são as matrizes de Pauli (9.1.36). Estas matrizes têm as seguintes propriedades Trσi = 0 , det σi = −1 . (9.4.9) Juntamente com a identidade, as matrizes de Pauli formam uma base do conjunto de matrizes de 2 × 2 com entradas complexas GL(2, C). 276 9.4.1 Teoria Geral do Momento Angular e Spin Juntando os graus de liberdade de spin aos orbitais Podemos agora juntar num único formalismo os graus de liberdade de spin e orbitais. O espaço de estados tem como base os estados próprios de um C.C.O.C. de E, que é obtido pela justaposição de um C.C.O.C. de E~r com um de ES . Assim, vários C.C.O.C. possı́veis para um electrão livre são: {X̂, Ŷ , Ẑ, Ŝ 2 , Ŝz } , {P̂x , P̂y , P̂z , Ŝ 2 , Ŝz } , {Ĥ, L̂2 , L̂z , Ŝ 2 , Ŝz } . Note-se que como todos os kets em E têm o mesmo valor próprio de Ŝ 2 , este pode ser omitido do C.C.O.C.; de facto este valor caracteriza a partı́cula, independentemente do estado em que se encontra (tal como a massa em repouso ou a carga eléctrica). Consideremos o primeiro destes C.C.O.C.. A base de E é |~r, ǫi = |x, y, z, ǫi = |~ri ⊗ |ǫi , (9.4.10) onde |~ri = |x, y, zi ∈ E~r e |ǫi ∈ ES . Os rótulos tomam os valores x, y, z ∈ R e ǫ = ±1. A acção dos operadores que constituem o C.C.O.C. nestes estados é X̂|~r, ǫi = x|~r, ǫi , Ŷ |~r, ǫi = y|~r, ǫi , Ẑ|~r, ǫi = z|~r, ǫi , 3~2 ~ Ŝ |~r, ǫi = |~r, ǫi , Ŝz |~r, ǫi = ǫ |~r, ǫi . 4 2 (9.4.11) 2 A base {|~r, ǫi} é ortonormal, no sentido extenso da ortogonalidade por deltas de Dirac, h~r′, ǫ′ |~r, ǫi = δǫ′ ǫ δ(~r′ − ~r) . A relação de fecho é Z Z XZ 3 3 1̂ = d ~r|~r, ǫih~r, ǫ| = d ~r|~r, +ih~r, +| + d3~r|~r, −ih~r, −| . (9.4.12) (9.4.13) ǫ Estados na representação {|~r, ǫi} Qualquer estado |Ψi em E pode ser expandido na base {|~r, ǫi}, usando a relação de fecho XZ XZ 3 |Ψi = d ~r|~r, ǫih~r, ǫ|Ψi ≡ d3~r|~r, ǫiΨǫ (~r) . (9.4.14) ǫ ǫ 9.4 Descrição não relativista de partı́culas de spin 1 2 277 Vemos assim que para caracterizar completamente o estado de um electrão é necessário especificar duas funções espaciais: Ψ+ (~r) = h~r, +|Ψi , Ψ− (~r) = h~r, −|Ψi , (9.4.15) que podem ser escritas na forma de um spinor de dois componentes ou 2-spinor : Ψ+ (~r) . [Ψ](~r) = (9.4.16) Ψ− (~r) O bra hΨ| associado ao ket |Ψi é o adjunto de (9.4.14) XZ XZ 3 hΨ| = d ~rhΨ|~r, ǫih~r, ǫ| ≡ d3~r Ψ∗ǫ h~r, ǫ| , ǫ (9.4.17) ǫ que pode ser representado na forma de um spinor que é adjunto de (9.4.16) [Ψ]† (~r) = Ψ∗+ (~r), Ψ∗− (~r) . O produto escalar hΨ|Φi é representado por Z XZ 3 hΨ|Φi = d ~rhΨ|~r, ǫih~r, ǫ|Φi = d3~r Ψ∗+ (~r)Φ+ (~r) + Ψ∗− (~r)Φ− (~r) Zǫ = d3~r[Ψ]† (~r)[Φ](~r) . Logo a condição de normalização é Z Z 3 † hΨ|Ψi = d ~r[Ψ] (~r)[Ψ](~r) = d3~r |Ψ+ (~r)|2 + |Ψ− (~r)|2 = 1 . (9.4.18) (9.4.19) (9.4.20) Um caso particular de estados de E são estados obtidos pelo produto tensorial de um estado de E~r com outro de ES , isto é |Ψi = |Φi ⊗ |χi , (9.4.21) com |Φi = Z d3~rΦ(~r)|~ri ∈ E~r , |χi = c+ |+i + c− |−i ∈ ES . Nesse caso as funções de onda orbitais e de spin separam c+ , [Ψ](~r) = Φ(~r) c− (9.4.22) (9.4.23) tal como as relações de normalização 2 2 1̂ = hΨ|Ψi = hΦ|Φihχ|χi = (|c+ | + |c− | ) Z d3~r|Φ(~r)|2 . (9.4.24) 278 Teoria Geral do Momento Angular e Spin Operadores na representação {|~r, ǫi} Consideremos a acção de um operador linear  num ket |Ψi ∈ E Â|Ψi = |Ψ′i . (9.4.25) Este operador tem uma representação matricial que actua em 2-spinors Â[Ψ](~r) = [Ψ′ ](~r) , (9.4.26) onde os elementos de matriz que representam  serão, em geral, operadores diferenciais que actuam na variável ~r. Consideremos os vários casos possı́veis: • Operadores de spin: estes actuam apenas no ı́ndice ǫ da base {|~r, ǫi}. Um exemplo é um dos operadores em escada (9.4.6): Ŝ+ = 0 1 ~ . (σx + iσy ) = ~ 2 0 0 (9.4.27) • Operadores orbitais: estes deixam invariante o ı́ndice ǫ pelo que as suas matrizes associadas são proporcionais à matriz identidade. Dois exemplos são os operadores: x 0 ∂/∂x 0 , P̂x = −i~ . X̂ = (9.4.28) 0 x 0 ∂/∂x • Operadores mistos: os operadores mais gerais a actuar em E serão representados por matrizes de 2 × 2 cujos elementos são operadores diferencias relativamente à variável ~r. Um exemplo é um produto de um operador orbital com um operador de spin −i~∂/∂ϕ 0 ~ ; L̂z Ŝz = (9.4.29) 2 0 i~∂/∂ϕ mas mais geralmente teremos combinações lineares de produtos de operadores orbitais com operadores de spin; por exemplo ~ ~ Ŝ · P̂ = ~ 2 σx P̂x + σy P̂y + σz P̂z = − 2 ∂/∂z ∂/∂x − i∂/∂y i~ . 2 ∂/∂x + i∂/∂y −∂/∂z (9.4.30) 9.4 Descrição não relativista de partı́culas de spin 1 2 Notamos ainda que o elemento de matriz de um operador é dado por Z hΨ|Â|Φi = d3~r[Ψ]† (~r)Â[Φ](~r) . 279 (9.4.31) Se, alternativamente, tivéssemos considerado o C.C.O.C.={P̂x , P̂y , P̂z , Ŝ 2 , Ŝz }, terı́amos a representação {|~p, ǫi}, em que cada vector |Ψi ∈ E é o 2-spinor Ψ̄+ (~p) , [Ψ̄](~p) = Ψ̄− (~p) (9.4.32) com Ψ̄+ (~p) = h~p, +|Ψi , Ψ− (~p) = h~p, −|Ψi . (9.4.33) Notando que h~r, ǫ|~p, ǫ′ i = h~r|~pihǫ|ǫ′ i = 1 ei~p·~r/~δǫǫ′ , 3/2 (2π~) (9.4.34) concluı́mos que Ψ̄+ (~p) e Ψ̄− (~p) são transformadas de Fourier de Ψ+ (~r) e Ψ− (~r), respectivamente: XZ Ψ̄ǫ (~p) = h~p, ǫ|Ψi = d3~rh~p, ǫ|~r, ǫ′ ih~r, ǫ′ |Ψi Z ǫ′ (9.4.35) 1 3 −i~ p·~ r/~ d ~re Ψǫ (~r) . = (2π~)3/2 Finalmente, notamos que os postulados do capı́tulo 4 se aplicam naturalmente neste formalismo. Por exemplo, a probabilidade d3 P(~r, +) de encontrar um electrão num volume infinitesimal d3~r em torno do ponto ~r com o spin para cima, Sz = +~/2, é d3 P(~r, +) = |h~r, +|Ψi|2d3~r = |Ψ+ (~r)|2 d3~r , (9.4.36) enquanto que a probabilidade d3 P(~r) de encontrar um electrão num volume infinitesimal d3~r em torno de ~r, qualquer que seja o spin, é d3 P(~r) = (|Ψ+ (~r)|2 + |Ψ− (~r)|2 )d3~r . (9.4.37) Operador de rotação para uma partı́cula de spin 1/2 ~ Uma partı́cula de spin 1/2 pode possuir, para além do seu momento angular intrı́nseco S, ~ O seu momento angular total será um momento angular orbital L. ~ +S ~ . J~ = L (9.4.38) 280 Teoria Geral do Momento Angular e Spin Como se comporta a função de onda de uma partı́cula de spin 1/2 sob a acção de uma rotação? O operador de rotação a actuar no espaço de estados orbitais E~r toma a forma, ~ Ru~ (α) = e−iαL·~u/~ , (9.4.39) em que a rotação é em torno de um eixo definido pelo versor ~u e de um ângulo α. Naturalmente, o operador de rotação que actua no espaço de estados E terá a forma ~ Ru~ (α) = e−iαJ ·~u/~ . (9.4.40) ~ ~ Como L̂ só actua em E~r e Ŝ só actua em ES , podemos escrever Ru~ (α) na forma de um produto tensorial (~ r) (S) Ru~ (α) = Ru~ (α) ⊗ Ru~ (α) , (9.4.41) onde ~ (~ r) ~ (S) Ru~ (α) = e−iαL·~u/~ , Ru~ (α) = e−iαS·~u/~ , (9.4.42) são os operadores de rotação que actuam em E~r e ES respectivamente. Deste modo, se a partı́cula de spin 1/2 estiver num estado que seja um produto tensorial, do tipo (9.4.21), o seu estado após a rotação será (~ r) (S) |Ψ′ i = Ru~ (α)|Ψi = [Ru~ (α)|Φi] ⊗ [Ru~ (α)|χi] . (~ r) (9.4.43) (S) Claro que Ru~ (2π) = 1̂ pois esta é uma rotação orbital; mas por (9.1.47), Ru~ (2π) = −1̂; logo (~ r) (S) Ru~ (2π) = Ru~ (2π) ⊗ Ru~ (2π) = −1̂ . (9.4.44) Esta é uma famosa propriedade de uma partı́cula de spin 1/2: uma tal partı́cula necessita de dar duas voltas para voltar ao mesmo estado, i.e ser descrita pelo mesmo spinor; de facto (~ r) (S) Ru~ (4π) = Ru~ (4π) ⊗ Ru~ (4π) = 1̂ . (9.4.45) A periodicidade de 4π dos fermiões de spin 1/2 foi observada directamente em experiências de interferência com neutrões lentos (S.A.Warner et al, Phys. Rev. Lett. 35 (1975) 1053.) 9.4 Descrição não relativista de partı́culas de spin 1 2 281 Note-se, no entanto, que uma observável não muda de sinal pela acção de uma rotação de 2π: Â′ = Ru~ (2π)ÂRu~ (2π)† =  . (9.4.46) O comportamento global de uma partı́cula de spin 1/2 sob a acção de uma rotação pode ser visto do seguinte modo: o estado |Ψi é representado pelo 2-spinor [Ψ](~r) com componentes Ψǫ (~r) = h~r, ǫ|Ψi , (9.4.47) sob a acção de uma rotação |Ψ′i = R̂|Ψi, onde R̂ = R̂(~r) ⊗ R̂(S) , obtemos um novo 2-spinor, cujas componentes são Ψ′ǫ (~r) ′ = h~r, ǫ|Ψ i = h~r, ǫ|R̂|Ψi = mas XZ ǫ′ d3 r~′ h~r, ǫ|R̂|r~′ , ǫ′ ihr~′, ǫ′ |Ψi ; (S) (S) h~r, ǫ|R̂|r~′ , ǫ′ i = h~r|R̂(~r) |r~′ihǫ|R̂(S) |ǫ′ i ≡ hR−1~r|r~′ iRǫǫ′ = δ(R−1~r − r~′ )Rǫǫ′ . (9.4.48) (9.4.49) Logo Ψ′ǫ (~r) = X (S) Rǫǫ′ Ψǫ′ (R−1~r) . (9.4.50) ǫ′ Explicitamente, em notação tensorial temos (S) (S) ′ −1 Ψ (~r) R R+− Ψ (R ~r) + = ++ + . (S) (S) Ψ′− (~r) Ψ− (R−1~r) R−+ R−− (9.4.51) Note-se a analogia com o caso de spin 1. Exemplo: Para ilustrar a fı́sica das partı́culas com spin 1/2 vamos considerar um problema de difusão um dimensional do tipo do capı́tulo 3, mas adicionando um campo magnético, tal como representado na figura 9.3. Uma partı́cula de spin 1/2, massa m, sem carga e com razão giromagnética g incide no potencial, proveniente de x = −∞. Para além ~ = B0 ez . Logo, o operador do salto de potencial existe na região II um campo magnético B Hamiltoniano para o sistema, escrito na forma (9.3.4) é P̂ 2 P̂ 2 ~ ~ + V (X̂) − µ̂ · B = + θ(x) V0 + ω Ŝz , Ĥ = 2m 2m (9.4.52) 282 Teoria Geral do Momento Angular e Spin V(x) ~ =0 B I ~ = B0 ez B II V 0 ~µ = ~ gµB S~ E 0 x Figura 9.3: Um salto de potencial com campo magnético na região II. onde ω = −gµB B0 /~ e θ(x) é a função de Heaviside, que toma valores 0, x<0 θ(x) ≡ . 1, x>0 Podemos tomar como C.C.O.C.={Ĥ, P̂y , P̂z , Ŝz } e a base de estados para o sistema, que são estados estacionários, sendo ± |Φ± E,py ,pz i = |ΦE i ⊗ |py i ⊗ |pz i ⊗ |±i . (9.4.53) A equação de Schrödinger ± Ĥ|Φ± E,py ,pz i = E|ΦE,py ,pz i , reduz-se a ! p2y + p2z P̂x2 ω~ ± |Φ± + + θ(x) V0 ± E i = E|ΦE i . 2m 2m 2 ± Projectando na representação |xi, hx|Φ± E i = ΦE (x) e assumindo py = pz = 0 obtemos ~2 d 2 ~ω ± − Φ± (9.4.54) + θ(x) V0 ± E (x) = EΦE (x) . 2m dx2 2 A inclusão do spin, tornada visı́vel pela presença do campo magnético, dá origem a um potencial efectivo diferente para cada um dos dois modos da partı́cula, isto é Vef e = V0 ± ~ω/2, para os modos |+i e |−i, respectivamente. Esta é a lição genérica a reter: o potencial efectivo pode ser diferente para feixes com polarizações diferentes. A partir daqui podemos calcular o factor de transmissão e reflexão, para cada um dos dois modos, usando os métodos do capı́tulo 3. 9.5 Adição de momento angular 9.5 283 Adição de momento angular Tendo estabelecido que uma partı́cula quântica pode ter um momento angular intrı́nseco, para além do momento angular orbital, ambos quantificados, coloca-se a questão de saber quais são os valores possı́veis para o seu momento angular total. O mesmo se pode perguntar relativamente a um sistema fı́sico constituı́do por dois sub-sistemas (por exemplo, um sistema de duas partı́culas), cada um possuindo momento angular. É esta a questão que vamos agora considerar. 7 Analisemos, por exemplo, um sistema de duas partı́culas, que se identificarão por ı́ndices 1 e 2. Designamos por J~1 e J~2 os respectivos momentos angulares e seja J~ = J~1 + J~2 , o momento angular total do sistema, com componentes (Jx , Jy , Jz ). Admitimos que se conhece, no espaço de estados do sistema i, Ei, i = 1, 2, a base padrão {|ki, Ji , Mi i} constituı́da por vectores próprios comuns a Jˆi2 e a Jˆiz : Jˆi2 |ki, Ji , Mi i = Ji (Ji + 1)~2 |ki , Ji , Mi i , (9.5.1) Jˆiz |ki, Ji , Mi i = Mi ~ |ki, Ji , Mi i , (9.5.2) Jˆi± |ki, Ji , Mi i = ~ p Ji (Ji + 1) − Mi (Mi ± 1) |ki, Ji , Mi ± 1i , (9.5.3) onde ki representa o conjunto de números quânticos adicionais necessários à especificação completa do estado do sistema. O espaço de estados do sistema total, E, é o produto tensorial de E1 e E2 : E = E1 ⊗ E2 . (9.5.4) Uma base neste espaço é obtida fazendo o produto tensorial das bases de E1 e de E2 : {| k1 , k2 ; J1 , J2 ; M1 , M2 i} = {| k1 , J1 , M1 i ⊗ | k2 , J2 , M2 i} , 7 Esta secção foi escrita com a colaboração da Prof. Fátima Mota. (9.5.5) 284 Teoria Geral do Momento Angular e Spin que é uma base própria comum aos operadores Jˆ12 , Jˆ22 , Jˆ1z , Jˆ2z . Um outro C.C.O.C. em E é Jˆ12 , Jˆ22 , Jˆ2 , Jˆz , (9.5.6) e podemos escolher uma base própria comum a estas observáveis: {|k, J1, J2 ; J, Mi} . (9.5.7) A questão que se põe é a de determinar esta base em termos da base conhecida (9.5.5). O problema é tanto mais relevante quando se sabe que, genericamente, num sistema de partı́culas com interacção apenas o momento angular total é uma constante de movimento, isto é, apenas o momento angular total comutará com o Hamiltoniano. Consequentemente, os estados estacionários (e a evolução do sistema) podem ser determinados se se conhecer a base (9.5.7). Mesmo num sistema de uma só partı́cula, surge genericamente um acoplamento entre o momento angular intrı́nseco e o orbital, o acoplamento spin-órbita, ˆ~ ˆ ~ˆ · S. 9.2, proporcional a L Na presença deste termo apenas J~ ≡ já discutido na secção ˆ~ ~ˆ + S L comuta com o Hamiltoniano do sistema, pelo que os estados estacionários deverão ser rotulados pelo valor próprio de Jˆ e não dos momentos angulares individuais, como será visto, para o átomo de Hidrogénio, na secção 11.1.4. Enunciamos e provamos agora o teorema de adição de dois momentos angulares. Teorema de adição de dois momentos angulares: No espaço E gerado pelos vectores |k; J1 , J2 ; M1 , M2 i (k, J1 , J2 , fixos; M1 , M2 variáveis), que tem dimensão (2J1 + 1)(2J2 + 1): • Os valores possı́veis de J são: J1 + J2 , J1 + J2 − 1, J1 + J2 − 2, . . . |J1 − J2 | . (9.5.8) • A cada valor de J correspondem 2J + 1 vectores próprios |J, Mi do momento angular total. Demonstração: 9.5 Adição de momento angular 285 A demonstração do teorema tem por base três observações: (1) O número quântico M toma valores J1 +J2 , J1 +J2 −1, J1 +J2 −2, . . . , −J1 −J2 . De facto o ket | k1 ; J1 , J2 ; M1 , M2 i é ket próprio das observáveis Jˆ1z , Jˆ2z e de Jˆz . Em particular: ˆ ˆ ˆ Jz |k; J1 , J2 ; M1 , M2 i = J1z + J2z |k; J1, J2 ; M1 , M2 i = ~ (M1 + M2 ) |k; J1, J2 ; M1 , M2 i . Logo M = M1 + M2 . Como Mi toma todos os valores entre −Ji e Ji , M toma todos os valores entre −(J1 +J2 ) e J1 +J2 , o que demonstra a afirmação. Sem perda de generalidade, no desenvolvimento que se segue, considerar-se-á J1 ≥ J2 . (2) A degenerescência dos valores de M, g(M), é: 0, |M| > J1 + J2 , g(M) = g(−M) J1 + J2 + 1 − |M| , J1 + J2 ≥ |M| ≥ |J1 − J2 | , 2J2 + 1 , |J1 − J2 | ≥ |M| ≥ 0 . Para deteminar g(M) pode proceder-se como se segue. Num diagrama bidimensional, associa-se a cada ket |k; J1 , J2 ; M1 , M2 i um ponto cuja abcissa é M1 e cuja ordenada é M2 . Na figura 9.4 mostra-se o caso especı́fico de J1 = 2 e J2 = 1. Sendo M = M1 + M2 todos os pontos do diagrama que estão sobre rectas de declive -1 têm o mesmo M. O número desses pontos é g(M). Analisem-se os diferentes valores de M: • M = J1 + J2 = 3 é não degenerado. Portanto g(J1 + J2 ) = 1 . (9.5.9) • M = J1 + J2 − 1 = 2 é duplamente degenerado. Portanto: g(J1 + J2 − 1) = 2 . (9.5.10) • O grau de degenerescência cresce então de 1 cada vez que M decresce de 1, até se atingir o vértice inferior direito do diagrama (M1 = J1 , M2 = −J2 ), isto é M = J1 −J2 . A degenerescência de M é máxima para este ponto e vale: g(J1 − J2 ) = 2J2 + 1 . (9.5.11) 286 Teoria Geral do Momento Angular e Spin m2 (-2,1) (-1,1) (-2,0) (-1,0) (0,1) (0,0) (1,1) (2,1) (1,0) (2,0) m1 (-2,-1) (-1,-1) (0,-1) (1,-1) (2,-1) Figura 9.4: Análise da degenerescência da componente azimutal do momento angular total. • Para valores de M < J1 − J2 a degenerescência de M mantém-se constante e igual ao seu valor máximo até que a linha atravessa o vértice superior esquerdo do diagrama (M1 = −J1 , M2 = J2 ), isto é M = −J1 + J2 : g(M) = 2J2 + 1 , para − (J1 − J2 ) ≤ M ≤ J1 − J2 . (9.5.12) • Finalmente para valores de M inferiores a −(J1 − J2 ), g(M) decresce de 1 cada vez que M diminui de 1, até atingir novamente o valor 1 quando M = −(J1 + J2 ) (vértice inferior esquerdo do diagrama). Ou seja: g(−M) = g(M) . (9.5.13) (3) Para J1 e J2 fixos, os valores próprios de J 2 correspondem a J = J1 + J2 , J1 + J2 − 1, J1 + J2 − 2, . . . , |J1 − J2 |, (9.5.14) e a cada um destes valores corresponde um único subespaço invariante E(J), isto é, um multipleto de valores de M.8 Designe-se por p(J) o número de multipletos associados a um dado valor J. Os valores de p(J) e de g(M) estão relacionados de uma forma simples: g(M) = p(J = |M|) + p(J = |M| + 1) + p(J = |M| + 2) + . . . . 8 (9.5.15) No presente contexto, um multipleto corresponde a um conjunto de estados que se transformam entre si numa rotação. Mais geralmente, o multipleto de estados numa determinada representação de um grupo de Lie são estados que se transformam entre si pela acção desse grupo. 9.5 Adição de momento angular 287 Invertendo (9.5.15) obtém-se: p(M) = g(M = J) − g(M = J + 1) (9.5.16) = g(M = −J) − g(M = −J − 1) (9.5.17) Usando os resultados da observação (2) obtém-se sucessivamente: • p(J) = 0 para J > J1 + J2 , pois g(M) = 0 se |M| > J1 + J2 . • Usando (9.5.9) e (9.5.10) obtém-se: p(J = J1 + J2 ) = g(M = J1 + J2 ) = 1 , p(J = J1 + J2 − 1) = g(M = J1 + J2 − 1) − g(M = J1 + J2 ) = 1 . Por iteracção obtêm-se todos os valores de p(J): p(J = J1 + J2 − 2) = 1 , . . . , p(J = J1 − J2 ) = 1 . • Finalmente: p(J) = 0 para J < J1 − J2 . Concluimos que a cada valor possı́vel de J está associado apenas um multipleto e como tal 2J + 1 vectores próprios do momento angular total. (q.e.d.) Matematicamente podemos escrever que o espaço vectorial obtido como produto tensorial (9.5.4) se decompõe na soma directa de espaços vectoriais que têm como base os vários multipletos, ou seja, na soma directa de várias representações irredutı́veis do momento angular: E(J1 ) ⊗ E(J2 ) = E(J1 + J2 ) ⊕ E(J1 + J2 − 1) ⊕ . . . ⊕ E(|J1 − J2 | + 1) ⊕ E(|J1 − J2 |) . 9.5.1 Cálculo dos vectores próprios comuns a Jˆ2 e a Jˆz Os vectores |J, Mi (rigorosamente dever-se-ia escrever |J1 , J2 , J, Mi, mas na prática usamos a primeira notação) podem-se escrever como combinações lineares dos vectores da base inicial {|J1 , J2 ; M1 , M2 i}: |J, Mi = J1 X J2 X M1 =−J1 M2 =−J2 |J1 , J2 ; M1 , M2 i hJ1 , J2 ; M1 , M2 |J, Mi . (9.5.18) 288 Teoria Geral do Momento Angular e Spin Os coeficientes hJ1 , J2 ; M1 , M2 |J, Mi desta expansão são os coeficientes de Clebsch-Gordan. Não é possı́vel dar uma expressão geral destes coeficientes, mas eles podem ser determinados seguindo o método que a seguir se desenvolve para o caso particular de momentos angulares 1/2 e atendendo a uma série de convenções de fase (por exemplo, os coeficientes de ClebschGordan são reais). O caso particular de dois spins 1/2 Como exemplo consideremos um sistema de duas partı́culas de spin 1/2. De acordo com os resultados anteriores, o momento angular total do sistema será S = 1 ou S = 0. E(S1 = 1/2) ⊗ E(S2 = 1/2) = E(S = 1) ⊕ E(S = 0) (9.5.19) Teremos portanto dois multipletos: um estado tripleto (dado existirem três valores de M para S = 1) e um estado singleto (um único M para S = 0). ⋆ O estado tripleto (subespaço E(S = 1)): Este subespaço, tridimensional, é gerado pela base própria {|1, 1i, |1, 0i, |1, −1i}. É imediato escrever-se, após uma escolha de fase: |1, 1i = |+, +i . (9.5.20) Os outros estados do tripleto são obtidos por aplicação do operador de escada Ŝ− : |1, 0i = 1 √ Ŝ− |1, 1i ~ 2 (9.5.21) = 1 √ (Ŝ1− + Ŝ2− ) |1, 1i ~ 2 (9.5.22) = 1 √ [|+, −i + | −, +i] , 2 (9.5.23) e ainda, |1, −1i = = 1 √ Ŝ− |1, 0i ~ 2 |−, −i . (9.5.24) (9.5.25) 9.5 Adição de momento angular 289 ⋆ O estado singleto (subespaço E(S = 0)): O único vector |0, 0i deste subespaço é determinado, a menos de um factor constante de fase, usando-se a condição de ortogonalidade relativamente aos outros vectores |1, Mi, já determinados. |0, 0i é necessariamente uma combinação linear dos vectores |+, −i e |−, +i: |0, 0i = α|+, −i + β|−, +i . (9.5.26) A condição de normalização implica que: h0, 0|0, 0i = |α|2 + |β|2 = 1 . (9.5.27) A condição de ortogonalidade a |1, 0i (|0, 0i é obviamente ortogonal a |1, 1i e a |1, −1i) implica que: 1 h0, 0|1, 0i = √ (α + β) = 0 . 2 De (9.5.26) e de (9.5.27) conclui-se que: 1 α = −β = √ eiχ , 2 (9.5.28) (9.5.29) onde χ é um número real. Escolhendo χ = 09 donde: 1 |0, 0i = √ [|+, −i − |−, +i] . 2 (9.5.30) Caso geral de dois momentos angulares De acordo com o teorema de adição do dois momentos angulares: E(J1 )⊗E(J2 ) = E(J = J1 +J2 ) ⊕ E(J = J1 +J2 −1) ⊕ . . . ⊕ E(J = |J1 −J2 |) . (9.5.31) Para determinar os vectores |J, Mi que geram os diferentes subespaços segue-se o método exposto no parágrafo anterior. Em especı́fico: i) Considera-se o subespaço de maior multiplicidade, isto é, o maior multipleto, que corresponde a J = J1 + J2 . Aqui o vector |J, Ji é facilmente reconhecido: |J = J1 + J2 , M = J1 + J2 i = |J1 , J2 ; M1 = J1 , M2 = J2 i 9 (9.5.32) Por convenção hJ1 , J2 ; J1 , J − J1 |J, Ji são reais e positivos, hJ1 , J2 ; M1 , J − M1 |J, Ji são reais e o seu sinal é (−1)J1 −M1 . 290 Teoria Geral do Momento Angular e Spin Os outros vectores deste subespaço são determinados por aplicação dos operadores de escada. ii) Os vectores de base dos outros subespaços são determinados escrevendo as combinações lineares de vectores |J1 , J2 ; M1 , M2 i adequadas e usando as condições de ortogonalidade, as condições de normalização e as convenções de fase. Propriedades dos coeficientes de Clebsch-Gordan Como se referiu, a determinação dos coeficientes de Clebsch-Gordan obedece a determinadas convenções. Existem tabelas destes coeficientes. Importa no entanto referir algumas propriedades interessantes destes coeficientes. Em particular: (i) Regras de selecção: De acordo com o que se referiu no ponto (2) da demonstração do teorema de adição de momento angular, os coeficientes de Clebsch-Gordon são nulos se não se verificarem simultaneamente as duas condições: |J1 − J2 | ≤ J ≤ J1 + J2 , M = M1 + M2 . A desigualdade é conhecida como a desigualdade triangular já que tem implı́cito que um triângulo pode ser construı́do com lados de comprimentos J1 , J2 e J. Estes três números desempenham papeis idênticos; a desigualdade pode ser reescrita sob as formas equivalentes: |J − J1 | ≤ J2 ≤ J + J1 , ou |J − J2 | ≤ J1 ≤ J + J2 . (ii) Relações de ortogonalidade: X hJ1 , J2 ; M1 , M2 |J, Mi hJ1 , J2 ; M1 , M2 |J ′ , M ′ i = δJJ ′ δM M ′ , M1 ,M2 X J,M ′ ′ (9.5.33) hJ1 , J2 ; M1 , M2 |J, Mi hJ1 , J2 ; M1 , M2 |J, Mi = δM1 M ′ δM2 M ′ . 1 2 (iii) Relações de recorrência: p J(J + 1) − M (M + 1)hJ1 , J2 ; M1 , M2 |J, M + 1i = p J1 (J1 + 1) − M1 (M1 − 1)hJ1 , J2 ; M1 − 1, M2 |J, M i p + J2 (J2 + 1) − M2 (M2 − 1)hJ1 , J2 ; M1 , M2 − 1|J, M i , (9.5.34) 9.6 Sumário p 9.6 J(J + 1) − M (M − 1)hJ1 , J2 ; M1 , M2 |J, M − 1i = p J1 (J1 + 1) − M1 (M1 + 1)hJ1 , J2 ; M1 + 1, M2 |J, M i p + J2 (J2 + 1) − M2 (M2 + 1)hJ1 , J2 ; M1 , M2 + 1|J, M i . 291 (9.5.35) Sumário Neste capı́tulo começamos por discutir as representações da álgebra do momento angular, descobrindo que existem em maior número do que as que correspondem ao momento angular orbital. As representações extra correspondem a spin semi-inteiro. Vimos seguidamente que estas representações são necessárias para descrever certos resultados experimentais, como a estrutura fina, o efeito Zeeman anómalo e a experiência de Stern-Gerlach. Em particular, estas experiências requerem que se descreva o electrão como uma partı́cula de spin 1/2. Dada esta necessidade, Pauli introduziu certos postulados adicionais na mecânica quântica não relativista, para descrever o spin das partı́culas, que enunciamos. Estudamos em detalhe o formalismo quântico para o caso das partı́culas de spin 1/2, como o electrão, em que o espaço de estados de spin tem dimensão 2. Consideramos o teorema de adição do momento angular e descobrimos quais os valores possı́veis para o momento angular total de um sistema com vários momentos angulares individuais. Na transformação entre a base do momento angular total e dos momentos angulares individuais aparecem os coeficientes de Clebsch-Gordan, que estudamos em detalhe no caso de um sistema de duas partı́culas de spin 1/2. CAPÍTULO 10 Teoria da Difusão Nos capı́tulos anteriores estabelecemos métodos que nos permitem calcular a função de onda dado o potencial. O conhecimento da função de onda permite-nos então calcular quantidades fı́sicas, como o espectro de estados ligados ou o factor de transmissão. Estas são quantidades relacionáveis com a experimentação. Portanto, tendo um modelo teórico do potencial fazemos previsões que podem ser comparadas com a experiência. Muitas vezes, em fı́sica, o problema em mão é o inverso do descrito anteriormente. Temos resultados experimentais e pretendemos obter um modelo teórico. Por exemplo, um tipo de experiências frequente em fı́sica, especialmente em fı́sica das altas energias, consiste em fazer incidir um feixe de partı́culas - que denominamos por ′′ (1)′′ - num alvo composto por outras partı́culas - que denominamos por ′′ (2)′′ - e estudar a colisão resultante. Genericamente mede-se o estado final do sistema após a colisão, isto é, o tipo de partı́culas resultantes e as suas caracterı́sticas, como direcção de emissão, energia, etc. Mas o objectivo fundamental do estudo é determinar as interacções que ocorreram entre as várias partı́culas que entraram no processo de colisão. Os fenómenos observados na colisão, ditos reacções variam em complexidade: • Nos casos mais simples o estado inicial e final do sistema são compostos pelas mesmas 294 Teoria da Difusão partı́culas (1) e (2): (1) + (2) −→ (1) + (2) . Estas reacções são denominadas reacções de difusão, (“scattering” em inglês). • Em casos mais gerais não é assim. As partı́culas (1) e (2) podem ser compostas por outras mais elementares (como núcleos são compostos por nucleões e nucleões por quarks), que se podem redistribuir durante a colisão, originando novas partı́culas compostas, diferentes das partı́culas iniciais: (1) + (2) −→ (3) + (4) + (5) + . . . . Estas reacções são denominadas reacções com rearranjo. • Notemos ainda que a altas energias existe a possibilidade relativista de “materialização” de parte da energia, originando novas partı́culas no estado final. No nosso estudo vamo-nos restringir à difusão. Na maior parte deste capı́tulo vamos considerar ainda que esta difusão é elástica, isto é, que para além de as partı́culas iniciais e finais serem as mesmas, os seus estados internos não se modificam durante a colisão. Isto significa, em particular, que não há emissão ou absorção de energia por estes estados internos. Na secção 10.4 será considerada a difusão inelástica. Se o nosso problema de colisão caisse no âmbito da mecânica clássica, o nosso objectivo seria determinar os desvios das trajectórias das partı́culas incidentes (1) devido à força exercida pelas partı́culas alvo (2). Mas o problema em que estamos interessados ocorre à escala atómica ou nuclear, caindo no âmbito da mecânica quântica. Assim devemos estudar a evolução da função de onda associada às partı́culas incidentes (1) devida à influência das interacções com as partı́culas alvo (2). A função de onda irá ‘difundir-se’, justificando o nome do processo. No nosso estudo iremos usar algumas hipóteses simplificativas: • Consideraremos que as partı́culas (1) e (2) não têm spin. Esta hipótese tem como objectivo simplificar a teoria e não deve ser interpretada como implicando que o spin 295 não tem importância em fenómenos de difusão. Pelo contrário, se no Hamiltoniano houver termos dependentes de spin, diferentes estados de spin difundir-se-ão diferentemente; no final será necessário pesar a contribuição dos diferentes estados de spin. Este estudo será considerado em detalhe no capı́tulo 12, onde estudaremos partı́culas idênticas e consideraremos problemas de difusão com spin. • Não levaremos em consideração uma possı́vel estrutura interna das partı́culas (1) e (2). O formalismo que iremos desenvolver até à secção 10.4 não será portanto aplicável a fenómenos de difusão inelástica onde parte da energia cinética de (1) é absorvida, no estado final pelos graus de liberdade internos de (1) e (2); será apenas para difusão elástica. Na secção 10.4 consideraremos brevemente difusão inelástica. • Assumiremos que o alvo é suficientemente fino para nos permitir negligenciar processos de difusão múltiplos, em que uma partı́cula incidente é difundida várias vezes antes de abandonar o alvo. • Negligenciaremos qualquer possibilidade de coerência entre as ondas difundidas pelas diferentes partı́culas que constituem o alvo. Esta simplificação é justificada quando a dispersão dos pacotes de ondas associados às partı́culas incidentes (1) é pequena comparada com as distâncias tı́picas das partı́culas do alvo. Ou seja, concentrarnos-emos em processos elementares de difusão de uma partı́cula incidente (1), por uma partı́cula do alvo (2). Negligenciando estes efeitos de coerência, o fluxo de partı́culas detectadas é simplesmente a soma dos fluxos difundidos por cada uma das N partı́culas do alvo, isto é, N vezes o fluxo difundido por cada uma das partı́culas do alvo. Note-se que esta aproximação exclui fenómenos interessantes, como difusão coerente de um cristal - difracção de Bragg. • Assumiremos que a interacção entre as partı́culas (1) e (2) pode ser descrita por uma energia potencial V (~r1 − ~r2 ) que depende apenas da posição relativa ~r = ~r1 − ~r2 das partı́culas. Utilizando o referencial do centro de massa, o problema reduz-se ao estudo da difusão de uma partı́cula devido ao potencial V (~r). Esta partı́cula tem 296 Teoria da Difusão massa µ, que é a massa reduzida 1 1 1 + , = µ m1 m2 (10.0.1) onde m1 e m2 são as massas de (1) e de (2). 10.1 Formalismo para descrever processos de difusão 10.1.1 Definição da secção eficaz de difusão Seja Oz a direcção das partı́culas incidentes, de massa µ. O potencial V (~r) está localizado à volta da origem, O - figura 10.1. Seja Fi o fluxo de partı́culas no feixe incidente, isto é, o número de partı́culas que, por unidade de tempo, atravessam uma superfı́cie de área unitária perpendicular a Oz na região com z → −∞. Assumimos que este fluxo é suficientemente pequeno para negligenciar as interacções entre as partı́culas do feixe. Um detector é colocado longe da região onde o potencial é efectivo, numa direcção definida pelos ângulos polar θ e azimutal φ, com a abertura voltada para o centro de difusão O e compreendendo um ângulo sólido dΩ. Podemos assim contar o número de partı́culas dn, difundidas por unidade de tempo para dentro do ângulo sólido dΩ, em torno da direcção definida por (θ, φ). É de esperar que dn seja proporcional a dΩ e também a Fi ; logo1 dn = σ(θ, φ)FidΩ , (10.1.1) onde o coeficiente de proporcionalidade σ(θ, φ) é denominado secção eficaz diferencial de difusão na direcção (θ, φ). Dimensionalmente, a equação anterior é 1 1 = [σ(θ, φ)] T T L2 ⇔ [σ(θ, φ)] = L2 . (10.1.2) Ou seja, a secção eficaz diferencial de difusão tem as dimensões de uma área. Frequentemente, σ(θ, φ) é medida em termos de ‘barns’ 2 1 Note que por vezes são usadas diferentes notações na literatura; o número de partı́culas difundidas por unidade de tempo para dentro do ângulo sólido dΩ é por vezes denotado dn/dt e a secção eficaz diferencial de difusão na direcção (θ, φ) por dσ(θ, φ)/dΩ. 2 O termo “barn” como unidade de área para secções eficazes surge durante o esforço de guerra norteamericano para o desenvolvimento da bomba atómica, durante trabalho feito na Universidade de Purdue 10.1 Formalismo para descrever processos de difusão 297 Detector dΩ feixe incidente θ V(r) O z Fluxo Fi Zona onde o potencial difunde Figura 10.1: Representação dos vários elementos que entram num processo de difusão. e seus sub-múltiplos, onde 1 barn ≡ 10−24 cm2 . De um modo natural define-se a secção eficaz total de difusão σ, como σ≡ Z σ(θ, φ)dΩ . (10.1.3) num projecto precursor do projecto Manhattan - o famoso projecto em Los Alamos onde seriam construidas as primeiras bombas. Como reportado na edição de Julho de 1972 da “Physics Today”, por altura de Dezembro de 1942 os fı́sicos Marshall Holloway e Charles P. Baker da Universidade de Cornell, durante um jantar, atiravam ideias para denominar a unidade para a secção eficaz nuclear tı́pica. Na sequência de uma associação de ideias bem humurada sugeriram o “barn”. Nas suas palavras: “The tradition of naming a unit after some great man closely associated with the field ran into difficulties since no such person could be brought to mind. Failing in this, the names Oppenheimer and Bethe were tried, since these men had suggested and made possible the work on the problem with which the Purdue project was concerned. The ”Oppenheimer” was discarded because of its length, although in retrospect an ”Oppy” or ”Oppie” would seem to be short enough. The ”Bethe” was thought to lend itself to confusion because of the widespread use of the Greek letter. Since John Manley was directing the work at Purdue, his name was tried, but the ”Manley” was thought to be too long. The ”John” was considered, but was discarded because of the use of the term for purposes other than as the name of a person. The rural background of one of the authors then led to the bridging of the gap between the ”John” and the ”barn”. This immediately seemed good and further it was pointed out that a cross section of 10-24 cm2 for nuclear processes was really as big as a barn. Such was the birth of the ”barn”.” Claro que a necessidade de uma nova unidade foi forçada aos fı́sicos nucleares pela necessidade de comunicar telefonicamente com outros sobre tópicos altamente secretos. O nome “pegou” e a unidade “barn” foi adoptada em Los Alamos, tornando-se o seu significado secreto. Os dois autores da proposta descreveram a sua sugestão num relatório de 13 de Setembro de 1944 e daqui resultou o relatório de Los Alamos ”Origin of the Term ‘barn’”(LAMS523) de 5 de Março de 1947. O significado foi “desclassificado” em 4 de Agosto de 1948. 298 Teoria da Difusão Note-se que, na definição de σ(θ, φ), dn contabiliza apenas as partı́culas difundidas. O fluxo destas partı́culas que atingem o detector é inversamente proporcional ao quadrado da distância entre O e o detector. Se se colocar o detector em θ = 0, misturar-se-ão a estas as partı́culas transmitidas, que terão a mesma forma das do feixe incidente, pelo que σ(0, φ) não é obtido directamente, mas por extrapolação de σ(θ, φ) para θ pequeno. 10.1.2 Estados estacionários de difusão Para descrevermos, em Mecânica Quântica, a difusão de uma partı́cula incidente devido a um potencial V (~r) é necessário estudar a evolução temporal do pacote de ondas que descreve a partı́cula. Assumimos conhecer o pacote de ondas para t → −∞ quando a partı́cula está na região negativa do eixo Oz, inafectada pelo potencial V (~r). A evolução subsequente do pacote de ondas é trivialmente estabelecida se expressarmos o pacote de ondas como uma sobreposição de estados estacionários do Hamiltoniano do problema H= p~2 + V (~r) . 2µ (10.1.4) Por isso, e tal como no capı́tulo 3, em vez de estudarmos pacotes de ondas, vamos concentrar-nos nos próprios estados estacionários. A equação de Schrödinger independente do tempo para o Hamiltoniano anterior é: 2 ~ (10.1.5) − ∆ + V (~r) Φ(~r) = EΦ(~r) . 2µ Consideremos apenas energias positivas, E, iguais à energia cinética da partı́cula incidente antes de entrar na zona de influência do potencial E= ~2 k 2 , 2µ (10.1.6) onde k é o módulo do vector de onda ~k que descreve a partı́cula quando é livre. Definindo V (~r) ≡ ~2 U(~r) , 2µ (10.1.7) reescrevemos a equação de Schrödinger como [∆ + k 2 − U(~r)]Φ(~r) = 0 . (10.1.8) 10.1 Formalismo para descrever processos de difusão 299 Para cada energia, isto é, para cada k, existe um número infinito de soluções desta equação, dependendo das condições fronteira; o espectro de energias é infinitamente degenerado. Mas tal como nos problemas de potenciais constantes por pedaços do capı́tulo 3 impusemos restrições de carácter fı́sico às soluções (como normalizabilidade da função de onda que excluia funções com crescimento assimptótico exponencial, ou a existência de apenas uma onda transmitida no lado oposto ao da onda incidente), também aqui impomos restrições fı́sicas às soluções que descrevem um processo de difusão. As funções de onda que obedecem a essas condições, denotadas vkdif (~r), representam os estados estacionários de difusão. Devem ter as seguintes duas propriedades: 1) Para valores grandes negativos de t, a partı́cula incidente é livre pois o potencial é negligenciável. Logo a função de onda que descreve o estado estacionário de difusão deve conter um termo da forma eikz , que descreve a onda incidente vkinc (~r) ∼ eikz . (10.1.9) 2) Quando o pacote de ondas atinge a zona onde o potencial é efectivo, a sua estrutura pode ser drasticamente alterada. Mas para valores grandes e positivos de t esperamos que os estados estacionários sejam compostos por uma onda difundida. Para r → ∞, U(~r) → 0 e como tal a onda difundida obedece a (∆ + k 2 )vkdif ≃ 0 . (10.1.10) Se esta onda fosse isotrópica, isto é se tivesse apenas dependência radial, esta equação ficaria, em coordenadas esféricas, 1 d 2d 2 r + k vkdif (r) = 0 , r 2 dr dr (10.1.11) que se verifica facilmente ter soluções do tipo e±ikr . r (10.1.12) 300 Teoria da Difusão Escolhendo o sinal positivo, de modo a representar uma onda que se propague para fora, e considerando a possibilidade de anisotropia, tomamos a função de onda associada ao estado estacionário de difusão, para ~r → ∞, como tendo a forma ~ r →∞ vkdif (~r) −→ eikz + fk (θ, φ) eikr . r (10.1.13) É na função fk (θ, φ), denominada amplitude de difusão, que surge toda a dependência desta solução assimptótica no potencial. Por exemplo, se V = 0, fk (θ, φ) = 0. Pode-se demonstrar que a equação (10.1.8) tem uma única solução que obedece a (10.1.13). Concluimos esta secção com duas notas: • A equação (10.1.10) é singular em r = 0; assim, a solução (10.1.12) só tem que verificar a equação para r 6= 0. Veremos na secção 10.2.1 que, mais correctamente, (∆ + k 2 ) e±ikr ∝ δ(~r) . r (10.1.14) • O pacote de ondas que representa o estado da partı́cula pode ser expandido em termos dos estados estacionários do Hamiltoniano (que não são ondas planas); a sua função de onda terá a forma Ψ(t, ~r) = Z 0 10.1.3 +∞ dk g(k)vkdif (~r)e−iEk t/~ , Ek = ~2 k 2 . 2µ (10.1.15) Relação entre amplitude e secção eficaz de difusão Como já discutimos anteriormente, num problema fı́sico, uma partı́cula quântica será descrita por um pacote de ondas. Para calcular a secção eficaz de difusão deverı́amos considerar a difusão desse pacote de ondas incidente pelo potencial V (~r). Mas, mais uma vez devido à linearidade da equação de Schrödinger, podemos tratar apenas estados estacionários de difusão. Podemos pensar nesses estados como descrevendo uma corrente estacionária de um fluido de probabilidade e calculamos então a secção eficaz da corrente incidente e difundida. O método é análogo ao usado na barreira quadrada do capı́tulo 3, onde a razão entre a corrente transmitida (ou reflectida) e a corrente incidente dá-nos o coeficiente de 10.1 Formalismo para descrever processos de difusão 301 transmissão (ou reflexão). Assim iremos calcular as contribuições da onda incidente e da onda difundida de um estado estacionário de difusão para a corrente de probabilidade. Recordemos que o vector densidade de corrente de probabilidade (4.4.53), se pode escrever, para um estado estacionário 1 ~ i~ ∗ ∗ ∗ ~ r) = [Φ(~r)∇Φ(~r) − Φ(~r) ∇Φ(~r)] = Re Φ (~r) ∇Φ(~r) . J(~ 2µ µ i (10.1.16) Calculemos o vector densidade de corrente de probabilidade para: • Onda incidente/transmitida eikz . Neste caso só existe componente segundo z 1 k~ i −ikz ~ ikz Jz (~r) = Re e = ike , (10.1.17) µ i µ que não é mais do que a intensidade da função de onda incidente Ii , (3.2.18). • Onda difundida fk (θ, φ)eikr /r. Notamos primeiro que em coordenadas esféricas 1 ∂ ∂ 1 ∂ ; (10.1.18) , , ∇≡ ∂r r ∂θ r sin θ ∂φ logo, as componentes em coordenadas esféricas do vector densidade de corrente de probabilidade são: −ikr 1 1 ~k |fk (θ, φ)|2 ik ikr ~ d ∗e Jr = Re fk − 2+ e fk = , µ r i r r µ r2 Jθd −ikr ~ 1 ~ ikr ∂ ∗e ∗ ∂ fk = 3 Re −ifk fk , = Re fk 3 e µ r i ∂θ µr ∂θ ~ ∂ Jφd = 3 Re −ifk∗ fk . µr sin θ ∂φ (10.1.19) (10.1.20) (10.1.21) Concluimos que, assimptoticamente, Jθ e Jφ são negligenciáveis e a corrente difundida é essencialmente radial. Para relacionarmos σ(θ, φ) com fk (θ, φ) recordemos a definição de secção diferencial de difusão (10.1.1). Quer o fluxo incidente de partı́culas quer o fluxo difundido serão proporcionais às respectivas densidades de corrente de probabilidade com a mesma constante de 302 Teoria da Difusão proporcionalidade.3 Logo, obtemos para o fluxo incidente Fi = C|J i | = C ~k . µ (10.1.22) O número de partı́culas que atinge a abertura do detector por unidade de tempo é proporcional ao fluxo do vector densidade de corrente de probabilidade difundido através da ~ da abertura do detector: superfı́cie dS ~ dn = C J~d · dS assimptoticamente ≃ C(J d )r r 2 dΩ = C ~k |fk (θ, φ)|2dΩ . µ (10.1.23) Logo, (10.1.1) diz-nos que σ(θ, φ) = |fk (θ, φ)|2 . (10.1.24) Ou seja, a secção eficaz diferencial de difusão é o quadrado do módulo da amplitude de difusão, o que justifica o nome da última quantidade. Notemos que no cálculo da corrente probabilidade difundida negligenciamos a interferência entre eikz (corrente incidente) e fk (θ, φ)eikr /r (corrente difundida). Na realidade esta interferência só é importante perto de θ = 0, onde de qualquer modo extrapolamos o resultado para a secção eficaz diferencial a partir dos valores para θ pequeno, como comentamos anteriormente. 10.2 Equação integral de difusão e o método de Born Para demonstrar a existência de estados estacionários cujo comportamento assimptótico é (10.1.13) vamos estabelecer uma equação integral de difusão da qual tais estados serão soluções. Recordemos a equação (10.1.8) que reescrevemos na forma [∆ + k 2 ]Φ(~r) = U(~r)Φ(~r) . (10.2.1) Introduzimos agora a função de Green, G(~r), do operador ∆ + k 2 , definida pela equação: [∆ + k 2 ]G(~r) = δ(~r) , 3 (10.2.2) Da mesma maneira que o fluxo de partı́culas num fluido ou numa corrente eléctrica é proporcional aos respectivos vectores densidade de corrente. 10.2 Equação integral de difusão e o método de Born 303 onde δ(~r) é um delta de Dirac. Podemos tomar partido desta função para construir soluções de (10.2.1). Seja Φ0 (~r) uma solução da equação (10.2.1) com o lado direito igual a zero, isto é [∆ + k 2 ]Φ0 (~r) = 0 . (10.2.3) A função Φ(~r) = Φ0 (~r) + Z d3 r~′ G(~r − r~′ )U(r~′ )Φ(r~′ ) , (10.2.4) é então também solução de (10.2.1). Para demonstrar este facto actuamos com o operador (∆ + k 2 ) em ambos os lados da equação (10.2.4); obtemos 2 2 (∆ + k )Φ(~r) = (∆ + k )Φ0 (~r) + Z d3~r′ U(r~′ )Φ(r~′ )(∆ + k 2 )G(~r − r~′ ) , (10.2.5) onde usamos o facto de que (∆ + k 2 ) actua na variável ~r e não r~′ , e como tal pode ser colocado dentro do integral. Usando agora (10.2.2) e (10.2.3) obtemos 2 (∆ + k )Φ(~r) = Z d3 r~′ U(r~′ )Φ(r~′ )δ(~r − r~′ ) = U(~r)Φ(~r) , (10.2.6) o que demonstra que (10.2.4) é solução de (10.2.1). Reciprocamente pode-se demonstrar que qualquer solução de (10.2.1) se pode apresentar na forma (10.2.4). Isto é intuitivo se pensarmos em (10.2.1) como uma equação diferencial homogénea - lado esquerdo - com uma fonte - termo do lado direito; pensamos então em (10.2.4) como a soma da solução geral da equação homogénea, Φ0 , com uma solução particular que considera o termo de fonte. A equação integral (10.2.4) é denominada equação integral de difusão. A sua principal vantagem relativamente à equação diferencial (10.2.1) é que, escolhendo Φ0 (~r) e G(~r) apropriadamente, podemos obter, sem mais trabalho, Φ(~r) com o comportamento assimptótico desejado. Portanto a equação integral (10.2.4) torna-se equivalente à equação diferencial (10.2.1) mais a condição assimptótica (10.1.13). É exactamente esse resultado que vamos agora estabelecer. 304 10.2.1 Teoria da Difusão Escolha da função de Green e de Φ0 Comecemos por discutir as funções de Green. Com este propósito enunciamos, sem prova, o seguinte resultado 1 ∆ = −4πδ(~r) , r (10.2.7) onde ∆ é o laplaciano em três dimensões, r a coordenada esférica radial e δ(~r) o delta de Dirac em três dimensões.4 Considerando este resultado e a equação de definição da função de Green, (10.2.2), concluimos que, perto de r = 0, r→0 G(~r) ≃ − 1 . 4πr (10.2.8) Por outro lado já vimos, na secção 10.1.2, que para ~r 6= 0, (∆ + k 2 ) e±ikr =0. r (10.2.9) 1 e±ikr , 4π r (10.2.10) Logo, tomamos as funções de Green, G± (~r) = − onde G+ é denominada função de Green ‘outgoing’ e G− é denominada função de Green ‘incoming’. Equivalentemente estamos a estabelecer o resultado e±ikr = −4πδ(~r) . ∆+k r 2 4 (10.2.11) Podemos motivar este resultado (o que não constitui uma prova!) pelo seguinte raciocı́nio. Consideramos a equação de Poisson para o campo gravı́tico com uma massa pontual M , descrita por um delta de Dirac: 1 d 2 d r φ = 4πGM δ(~r) . ∆φ(~r) = 4πGM δ(~r) ⇔ r2 dr dr Integramos ambos numa esfera de raio R. Do lado esquerdo usamos coordenadas esféricas e do lado direito coordenadas cartesianas: Z R Z Z Z 2 1 d 2 d drr 2 r 4π φ = 4πGM dx dy dzδ(x)δ(y)δ(z) , r dr dr 0 logo GM d φ = GM ⇔ φ(R) = − + constante . dR R Colocando esta solução na primeira equação temos GM 1 ∆ − = −4πδ(~r) , + constante = 4πGM δ(~r) ⇔ ∆ r r R2 que é a equação (10.2.7). 10.2 Equação integral de difusão e o método de Born 305 M r r u O r’ r’ P L Figura 10.2: Representação de um ponto assimptoticamente longe da zona de influência de um potencial. O comportamento assimptótico que desejamos obter (10.1.13) sugere que escolhamos Φ0 = eikz , (10.2.12) e a função de Green ‘outgoing’, G(~r) = G+ (~r). Isto é, tomamos os estados estacionários de difusão na forma (10.2.4) com estas escolhas: Z dif ikz vk (~r) = e + d3 r~′ G+ (~r − r~′ )U(r~′ )vkdif (r~′ ) . (10.2.13) Vamos então demonstrar que estes estados estacionários têm o comportamento assimptótico correcto. Para isso consideramos um potencial cuja zona de influência, centrada em ~r = 0, tem uma escala linear L - figura 10.2. Consideramos um ponto longe desta zona de influência, M, para o qual |~r| ≫ L. Considerando o vector de posição de um outro ponto, r~′ temos que |~r − r~′ | = q q ′ ′ (~r − r~ ) · (~r − r~ ) = r 2 − 2~r · r~′ + (r ′ )2 = r s 2r~′ · ~u + 1− r ′ 2 r , (10.2.14) r onde r = |~r|, r ′ = |r~′ | e ~u é o versor na direcção de ~r, ~r = r~u. Especializemos para o caso em que r~′ é a posição de um ponto arbitrário, P , na zona de influência do potencial. Para todos estes pontos verifica-se que |r~′ | < L ≪ |~r|; logo expandimos a expressão anterior em potências de r ′ /r, obtendo |~r − r~′ | ≃ r − r~′ · ~u . (10.2.15) 306 Teoria da Difusão Nestas condições obtemos a expressão assimptótica ~′ G+ (~r − r~′ ) = − 1 eikr −ik~u·r~′ 1 eik|~r−r | ≃− e . 4π |~r − r~′ | 4π r (10.2.16) Substituindo no estado de difusão (10.2.13) obtemos o comportamento assimptótico Z eikr r→∞ ikz ~′ dif d3 r~′ e−ik~u·r U(r~′ )vkdif (r~′ ) . (10.2.17) vk (~r) ≃ e − 4πr Este é, de facto, o comportamento assimptótico (10.1.13), dado que o integral já não depende da distância r, mas apenas dos ângulos θ e φ, através de ~u. Concluimos deste modo que os estados definidos pela equação integral (10.2.13) têm o comportamento assimptótico correcto para serem estados estacionários de difusão. Mais ainda, comparando com (10.1.13) reconhecemos a amplitude de difusão como sendo Z 1 ~′ d3 r~′ e−ik~u·r U(r~′ )vkdif (r~′ ) . fk (θ, φ) = − 4π 10.2.2 (10.2.18) A aproximação de Born Vamos agora estabelecer uma solução aproximada da equação integral de difusão para os estados estacionários de difusão, e como tal para a amplitude de difusão e secção eficaz diferencial de difusão. Começamos por escrever ~ eikz = eiki ·~r , (10.2.19) onde ~ki é o vector de onda incidente. Em termos de ~ki, os estados estacionários de difusão (10.2.13) ficam: vkdif (~r) i~ki ·~ r =e + Z d3 r~′ G+ (~r − r~′ )U(r~′ )vkdif (r~′ ) . Façamos uma mudança de notação: ~r → r~′ e r~′ → r~′′ ; logo Z dif ~′ i~ki ·r~′ vk (r ) = e + d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )vkdif (r~′′ ) . (10.2.20) (10.2.21) Seguidamente inserimos (10.2.21) em (10.2.20) e obtemos Z ~ ~′ dif i~ki ·~ r vk (~r) = e + d3 r~′ G+ (~r − r~′ )U(r~′ )eiki ·r Z Z 3 ~′ ′ ′ + d r G+ (~r − r~ )U(r~ ) d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )vkdif (r~′′ ) . (10.2.22) 10.2 Equação integral de difusão e o método de Born 307 Note-se que agora conhecemos os dois primeiros termos do lado direito. Apenas desconhecemos o terceiro, pois inclui a função desconhecida vkdif . Podemos repetir novamente o procedimento, substituindo em (10.2.20) ~r → r~′′ e r~′ → r~′′′ . Substituindo a expressão resultante em (10.2.22) obtemos i~ki ·~ r Z ~ ~′ =e + d3 r~′ G+ (~r − r~′ )U(r~′ )eiki ·r Z Z ~ ~′′ 3 ~′ ′ ′ + d r G+ (~r − r~ )U(r~ ) d3 r~′′ G+ (r~′ − r~′′ )U(r~′′ )eiki ·r Z Z Z 3 ~′ 3 ~′′ ′ ′ ′ ′′ ′′ ~ ~ ~ ~ ~ + d r G+ (~r − r )U(r ) d r G+ (r − r )U(r ) d3 r~′′′ G+ (r~′′ − r~′′′ )U(r~′′′ )vkdif (r~′′′ ) . vkdif (~r) (10.2.23) Agora, os três primeiros termos do lado direito são conhecidos e apenas o quarto desconhecido. Podemos repetir o processo quantas vezes desejarmos, de modo a ficarmos com os n primeiros termos do lado direito conhecidos e apenas o termo n + 1 desconhecido. Este método, denominado expansão de Born pode ser usado para construir a função de onda dos estados estacionários de difusão, desde que o potencial seja fraco. O ponto principal desta expansão é que cada novo termo introduziu mais uma potência do potencial U(~r). O significado de o potencial ser fraco é de que este novo termo deverá ser pequeno. Sendo L a escala tı́pica do potencial, e U = 2µV /~2 a sua magnitude tı́pica, o significado quantitativo de “o potencial ser fraco” é √ U= √ 2µV 1 ≪ . ~ L (10.2.24) Isto é a escala de energia associada à magnitude do potencial é muito menor do que a escala de energia associada ao seu comprimento. Logo, se o potencial for fraco, a expansão de Born é uma expansão perturbativa; isto é, cada termo é menor do que o anterior, pelo que podemos truncar a expansão num determinado ponto e negligenciar o último termo, e como tal calcular o lado direito da equação. Se substituirmos a expansão de Born para vkdif (r~′ ) em (10.2.18), obtemos a expansão de Born para a amplitude de difusão. A aproximação de Born é truncar a expansão de Born considerando apenas os primeiros dois termos, isto é ~ ~′ vkdif (r~′ ) = eiki ·r , (10.2.25) 308 Teoria da Difusão r r r’’ r’ r’ Figura 10.3: Esquerda: Na aproximação de Born contabilizamos apenas a contribuição da onda incidente e de ondas difundidas uma vez na zona onde o potencial é efectivo. Direita: As aproximações seguintes levam em conta múltiplas difusões, que podem ser negligenciadas, caso o potencial seja fraco. pelo que (10.2.18) fica fkBorn (θ, φ) 1 =− 4π Z ~′ ~ ~′ d3 r~′ e−ik~u·r U(r~′ )eiki ·r . (10.2.26) Denotando o vector de onda difundido ~kd ≡ k~u e o vector de onda transferido ~q ≡ ~kd − ~ki , reescrevemos este resultado como Z Z 1 2µ ~′ Born 3 ~′ −i~ q ·r~′ ′ ~ fk (θ, φ) = − d re U(r ) = − d3 r~′ e−i~q·r V (r~′ ) , 2 4π 4π~ (10.2.27) onde usamos (10.1.7). Finalmente, usando (10.1.24), obtemos para a secção eficaz diferencial de difusão na aproximação de Born σkBorn (θ, φ) µ2 = 2 4 4π ~ Z 2 d3~re−i~q·~r V (~r) . (10.2.28) Concluimos, portanto, que na aproximação de Born, a secção eficaz diferencial de difusão está muito simplesmente relacionada com a transformada de Fourier do potencial. O vector de onda transferido ~q, depende do módulo de ~ki e ~kd (que é o mesmo - k) e da direcção de difusão (θ, φ). Para uma dada direcção de difusão, a secção eficaz de Born varia com k, ou seja com a energia do feixe incidente. Por outro lado, para uma dada energia σ Born varia com (θ, φ). Concluimos que estudando as variações de σ Born com θ, φ ou ainda com a energia incidente, deduzimos informação sobre o potencial V (~r). 10.2.3 Interpretação da aproximação de Born Recordemos a equação (10.2.20). Podemos pensar na função G+ (~r − r~′ ) como representando a amplitude, no ponto ~r, da onda emitida por uma fonte pontual em r~′ . Este ponto de 10.2 Equação integral de difusão e o método de Born 309 vista é corroborado pela expressão (10.2.16). Tomando a aproximação de Born (10.2.25), (10.2.20) diz-nos que a onda difundida em ~r é a soma da onda incidente com um número infinito de ondas provenientes de fontes secundárias; estas fontes secundárias existem em todos os r~′ onde U(r~′ 6= 0) - figura 10.3 esquerda. Os termos seguintes da expansão de Born levam em conta novas fontes secundárias que são elas próprias excitadas por ondas emitidas por fontes secundárias - figura 10.3 direita. Podemos assim interpretar o facto de a expansão de Born ser perturbativa, quando o potencial é fraco, como significando que podemos negligenciar a influência de fontes secundárias umas nas outras. Nota: Os processos de difusão múltipla considerados na expansão de Born nada têm a ver com os processos de difusão múltipla que dissemos ir negligenciar no princı́pio deste capı́tulo. No primeiro caso estamos a falar pela difusão múltipla da partı́cula incidente por uma partı́cula alvo; no segundo na difusão múltipla da partı́cula incidente por diferentes partı́culas do alvo. 10.2.4 A aproximação de Born para potenciais centrais No caso de o potencial difusor ser central, que inclui muitos casos de interesse fı́sico, podemos escrever uma fórmula mais usável para a amplitude de difusão e consequentemente para a secção eficaz de difusão. Esta fórmula é estabelecida usando a seguinte propriedade de transformadas de Fourier três dimensionais: Lema: Seja f (~r) uma função três dimensional com transformada de Fourier f˜(~q) = 1 (2π)3/2 Z d3~rf (~r)e−i~q·~r . (10.2.29) Se f (~r) = f (r), isto é, a função depende apenas do módulo de ~r, r, então: i) f˜ depende apenas do módulo de ~q, q; ii) f˜(q) pode ser calculada pela expressão: 2 f˜(q) = √ 2π q Z +∞ r sin qrf (r)dr . 0 (10.2.30) 310 Teoria da Difusão Demonstração: ˜ q~′ ), onde q~′ = R~q e R é uma rotação arbitrária. Logo i) Consideremos f( Z 1 ~′ ′ ˜ ~ d3~rf (~r)e−iq ·~r . f (q ) = 3/2 (2π) Aplicamos a mesma rotação à variável de integração, r~′ = R~r. Logo Z 1 ~′ ~′ ′ ˜ ~ f (q ) = d3 r~′ f (r~′)e−iq ·r . 3/2 (2π) (10.2.31) (10.2.32) Como o elemento de volume e produto escalar são invariantes por uma rotação d3~r = d3 r~′ , ~q · ~r = q~′ · r~′ , (10.2.33) e como, por hipótese, f (~r) = f (r~′ ), pois a função só depende do módulo, concluimos que f˜(~q) = f˜(q~′ ) . (10.2.34) Logo f˜ depende apenas do módulo de ~q. ii) Podemos, por isso, escolher uma direcção arbitrária de ~q, para calcular a transformada de Fourier (10.2.29). Seja ~q = qez ; (10.2.29) fica: Z 2π Z +∞ Z π 1 2 ˜ dφ r f (r) dθ sin θe−iqr cos θ dr . f (q) = (2π)3/2 0 0 0 (10.2.35) Fazendo os integrais angulares obtemos Z +∞ 2 Z +∞ r f (r) −iqr cos θ θ=π 2rf (r) 1 1 ˜ f (q) = √ e |θ=0 dr = √ sin (qr)dr . (10.2.36) iqr q 2π 0 2π 0 (q.e.d.) Como a amplitude de difusão, na aproximação de Born, é dada por uma transformada de Fourier (10.2.27), podemos para o caso de potenciais centrais V (~r) = V (r), usar este lema. Usando (10.2.29) e (10.2.30) obtemos Z 2µ +∞ Born r sin (qr)V (r)dr . fk (θ) = − 2 q~ 0 (10.2.37) 10.2 Equação integral de difusão e o método de Born 311 É esta expressão que usamos na prática. Note-se que nestes casos a amplitude de difusão fica independente do ângulo azimutal. De facto, toda a dependência angular está contida no vector de onda transferido, ~q, que entra na expressão apenas em módulo q = |~q|. Para incidência segundo o eixo Oz, o vector de onda transferido é ~r ~q = ~kd − ~ki = k − kez , r onde ez é um versor unitário na direcção z; calculamos então facilmente que θ 2z 2 2 + 1 = 2k 2 (1 − cos θ) = 4k 2 sin2 , q =k 1− r 2 (10.2.38) (10.2.39) o que demonstra que |~q| depende apenas, de facto, do ângulo polar θ. Note-se que a independência de φ resulta das simetrias do sistema. De facto tanto o feixe incidente como o potencial difusor são independentes do ângulo azimutal. Consideremos dois exemplos explı́citos de cálculo de secção eficaz diferencial de difusão usando (10.2.37). Poço de potencial esférico Como primeiro exemplo consideramos um poço de potencial esférico −V , r < R 0 V (r) = . 0, r>R (10.2.40) Este é um potencial contı́nuo por pedaços onde é particularmente simples calcular a amplitude de difusão. Note, em primeiro lugar, que a condição de validade da aproximação de Born (10.2.24) é √ 2µV0 1 ≪ . ~ R A expressão geral (10.2.37) fica Z 2µV0 R 2µV0 Born fk (θ) = r sin (qr)dr = 3 2 (sin qR − qR cos qR) . 2 q~ q ~ 0 (10.2.41) (10.2.42) Como tal, obtemos para a secção eficaz diferencial de difusão, na aproximação de Born 2 2 4 4µ V0 R R2 Born (sin qR − qR cos qR)2 , (10.2.43) σ (θ) = 6 (qR) ~4 312 Teoria da Difusão 0.11 0.105 0.1 0.095 0.09 0 0.5 1 1.5 2 2.5 3 theta Figura 10.4: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial (10.2.40) na aproximação de Born. Estão representados três valores de qR, sendo que à medida que a energia da onda enviada diminui (e como tal também qR), a secção se torna cada vez mais constante (i.e isotrópica). onde q = 2k| sin θ/2|. Esta secção eficaz encontra-se representada graficamente na figura 10.4. Esta secção eficaz tem um limite particularmente simples se, para além da condição de validade da aproximação de Born (10.2.41) assumirmos baixas energias k≪ 1 R (⇔ qR ≪ 1) . (10.2.44) Isto é, a escala de energia das ondas difundidas é muito menor que a escala de energia definida pelo alcance do potencial. Neste caso, podemos expandir as funções trigonométricas em série de Taylor e tomar a primeira contribuição não nula. Obtemos σ Born (θ) baixa energia ≃ 4µ2 V02 R6 . 9~4 (10.2.45) A secção eficaz diferencial não tem dependência angular, nesta aproximação, de acordo com o exibido na figura 10.4. A secção eficaz total é σ Born baixa energia ≃ 16π µ2 V02 R6 . 9 ~4 (10.2.46) Iremos recuperar este resultado usando o método das ondas parciais (fórmula (10.3.97)), do qual extrairemos uma maior interpretação fı́sica. 10.2 Equação integral de difusão e o método de Born 313 Potencial de Yukawa Como segundo exemplo calculamos a secção eficaz diferencial de difusão para um potencial do tipo V (~r) = V0 e−αr , r (10.2.47) onde V0 e α são constantes reais e α > 0. O potencial será atractivo (repulsivo) se V0 < 0 (V0 > 0). A magnitude do potencial é caracterizada por |V0 |; o seu alcance por r0 = 1 ; α (10.2.48) pois, para distâncias muito maiores do que 1/α, o potencial é praticamente nulo - figura 10.5. Este potencial é designado por potencial de Yukawa, em homenagem a Hideki Yukawa (1907-1981), que o introduziu em 1935 para descrever as forças nucleares, cujo alcance é da ordem do Fermi (10−15 m). Para explicar a origem deste potencial, Yukawa introduziu uma nova partı́cula - o mesão π - cuja existência foi, de facto, descoberta em 1947 por Cecil Powell (1903-1969). Esta partı́cula, que era vista como a mediadora da força nuclear, possuı́a massa e essa era a razão do curto alcance do potencial. Por estas descobertas Yukawa ganhou o prémio Nobel da Fı́sica em 1949 e Powell em 1950. Contudo, a teoria de Yukawa foi posteriormente ultrapassada pela Cromodinâmica Quântica, como descrição da força nuclear forte. Note-se que para α = 0 o potencial (10.2.47) se torna o potencial de Coulomb, pelo que o potencial de Coulomb se pode considerar um potencial de Yukawa com alcance infinito. Se assumirmos que |V0 | é suficientemente pequeno para a aproximação de Born poder ser usada, isto é (10.2.24) p 2µ|V0| ≪α, ~ (10.2.49) e observando que o potencial é central, temos, por (10.2.37), Z Z 2µV0 +∞ (iq−α)r 2µV0 +∞ −αr Born sin (qr)e dr = − 2 e − e−(α+iq)r dr , (10.2.50) fk (θ, φ) = − 2 ~q 0 ~ q2i 0 que agora se pode integrar facilmente para obter fkBorn (θ, φ) = − 2µV0 1 . 2 2 ~ q + α2 (10.2.51) 314 Teoria da Difusão r 0 2 4 6 8 10 0 -0.2 -0.4 -0.6 -0.8 -1 Figura 10.5: Potencial de Yukawa com α = 1 versus potencial de Coulomb com a mesma magnitude. Claramente o potencial de Yukawa tem um alcance efectivamente finito, enquanto que o potencial de Coulomb tem um alcance infinito. Usando (10.2.39) para expressar q em função do ângulo θ, a secção eficaz diferencial de difusão para o potencial de Yukawa na aproximação de Born fica 2 2 −2 4µ V0 4k 2 sin2 (θ/2) Born Born 2 σ (θ) = |fk (θ, φ)| = 1+ . α 2 ~4 α2 (10.2.52) Este resultado está representado na figura 10.6. Comentários ao resultado: • Esta secção eficaz é independente do ângulo azimutal, come seria de esperar dadas as simetrias do problema: o potencial é central e o feixe é paralelo a Oz, pelo que existe simetria azimutal. • Mas a secção eficaz depende do ângulo polar. Em particular, para energia (k) fixa, é maior para θ = 0 (partı́culas que seguem em frente) do que para θ = π (partı́culas rechaçadas). • A secção eficaz diminui com o aumento de energia. • O sinal de V0 é irrelevante, na aproximação de Born. • A secção eficaz total é σ Born = Z σ Born 4µ2V02 4π . (θ)dΩ = 2 4 2 α ~ [α + 4k 2 ] (10.2.53) 10.2 Equação integral de difusão e o método de Born 315 1 0.8 0.6 0.4 0.2 0 0.5 1 1.5 2 2.5 3 theta Figura 10.6: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial (10.2.47) na aproximação de Born. Estão representados três valores de q/α, sendo que à medida que a energia da onda enviada diminui (e como tal também q/α), a secção se torna cada vez mais constante (i.e isotrópica). Já comentamos anteriormente que o potencial de Coulomb pode ser visto como o caso limite do potencial de Yukawa em que o alcance é infinito; isto é tomando α=0, 2 V0 = Z 1 Z 2 e , q2 , e = 4πǫ0 2 (10.2.54) onde q é a carga do electrão e Z1 q e Z2 q são as cargas das duas partı́culas envolvidas na interacção, (10.2.47) reduz-se ao potencial de Coulomb. Tomando estes valores em (10.2.52), obtemos a secção eficaz diferencial de difusão Born (θ) σ(Coulomb) 4µ2 Z12 Z22 e4 Z12 Z22 e4 = 4 = , ~ 16k 4 sin4 θ/2 16E 2 sin4 θ/2 (10.2.55) onde usamos (10.1.6). Esta é a famosa fórmula de Rutherford que descreve a secção eficaz para o potencial de Coulomb. É curioso que tenhamos obtido a fórmula correcta neste caso, dado que a teoria que desenvolvemos não é aplicável, à priori, ao potencial de Coulomb, devido ao alcance infinito (que implica que a condição (10.2.49) não é obedecida). O resultado encontra-se representado na figura 10.7. 316 Teoria da Difusão 250 200 150 100 50 0 0.5 1 1.5 2 2.5 3 theta Figura 10.7: Secção eficaz de difusão em função do ângulo de difusão θ para o potencial de Coulomb na aproximação de Born. Repare-se que embora Rutherford tenha detectado que algumas partı́culas α completamente rechaçadas - i.e. com θ = π/2-, a probabilidade de isso acontecer é pequenı́ssima. 10.3 Método das ondas parciais para a difusão por um potencial central No caso particular de o potencial difusor ser um potencial central, podemos diagonalizar simultaneamente os operadores Ĥ, L̂2 e L̂z , tal como discutido na secção 6.3. Isto é, existem estados estacionários com momento angular bem definido, aos quais, no contexto da teoria da difusão, chamamos ondas parciais e denotamos por Φk,ℓ,m(~r), ou ainda, na notação de Dirac, |Φk,ℓ,m i. Os valores próprios dos operadores acima mencionados são, nestes estados: Ĥ|Φk,ℓ,m i = ~2 k 2 |Φk,ℓ,mi , 2µ L̂2 |Φk,ℓ,m i = ℓ(ℓ + 1)~2 |Φk,ℓ,m i , L̂z |Φk,ℓ,mi = m~|Φk,ℓ,mi . (10.3.1) A dependência angular destas ondas parciais é sempre dada por harmónicos esféricos Yℓm (θ, φ); o potencial V (r) só influencia a parte radial. Nesta secção iremos começar por estudar estados estacionários com momento angular bem definido para uma partı́cula livre. Denominamos estes estados por ondas esféricas livres e denotamo-los por Φ0k,ℓ,m (~r), ou ainda, na notação de Dirac, |Φ0k,ℓ,m i. Veremos 10.3 Método das ondas parciais para a difusão por um potencial central 317 que, assimptoticamente, a dependência radial destas ondas esféricas livres será dada pela sobreposição de uma onda ‘incoming’ e−ikr /r com uma onda ‘outgoing’ eikr /r, tendo as duas ondas uma diferença de fase bem definida. No caso das ondas parciais para um potencial V (r) que é assimptoticamente negligenciável, esperamos um comportamento semelhante: assimptoticamente a dependência radial deverá ainda ser dada pela sobreposição das ondas ‘incoming’ e ‘outgoing’. Mas neste caso, a diferença de fase entre as duas ondas é diferente daquela que caracteriza as ondas esféricas livres: o potencial V (r) introduz uma diferença de fase adicional ou desfasamento, δℓ . Esta quantidade é a unica diferença entre o comportamento assimptótico de Φ0k,ℓ,m(~r) e Φk,ℓ,m (~r). Logo, se soubermos: 1) Para uma dada energia, a diferença de fase adicional δℓ para todos os ℓ; 2) Expressar os estados estacionários de difusão vkdif (~r) como uma combinação linear das ondas parciais Φk,ℓ,m(~r); saberemos caracterizar o comportamento assimptótico dos estados estacionários de difusão e como tal extrair a amplitude de difusão e a secção eficaz diferencial de difusão. É esta técnica que vamos estabelecer nesta secção. 10.3.1 Ondas esféricas versus ondas planas para uma partı́cula livre Em mecânica clássica, uma partı́cula livre de massa µ tem um movimento rectilı́neo e uniforme. O seu momento ~p, energia E = p~ 2 /2µ e momento angular relativamente à ~ = ~r × ~p, são constantes do movimento (|L| ~ = |~p|b, onde origem do sistema coordenado, L b é o parâmetro de impacto). ~ ~ ~ ~ Em mecânica quântica, os operadores L̂ = R̂ × P̂ e P̂ não comutam, pelo que não podemos classificar os estados fı́sicos de uma partı́cula livre simultaneamente pelo momento angular e pelo momento linear. Portanto, em mecânica quântica, temos (pelo menos) duas opções para o C.C.O.C. que descreve uma partı́cula livre: • C.C.O.C.={P̂x , P̂y , P̂z }. Neste caso os estados próprios são ondas planas. 318 Teoria da Difusão • C.C.O.C.={Ĥ0 , L̂z , L̂2 }. Neste caso os estados próprios são ondas esféricas livres. Consideremos com mais detalhe estas duas possibilidades. Ondas planas Estes estados formam a representação |~pi estudada na secção 4.4.2. Obedecem a ~2 p~2 P̂ |~pi = |~pi . Ĥ0 |~pi = 2µ 2µ P̂i |~pi = pi |~pi , (10.3.2) Notemos ainda que a projecção das ondas planas em estados próprios do operador posição é dada por (4.4.23) h~r|~pi = 3/2 1 2π~ ei~p·~r/~ . (10.3.3) Em termos do vector de onda ~k = ~p/~, definimos os estados |~ki ≡ ~3/2 |~pi , (10.3.4) em termos dos quais as relações anteriores ficam P̂i |~ki = ~ki |~ki , ~k 2 ~2 Ĥ0 |~ki = |~ki , 2µ (10.3.5) 3/2 (10.3.6) e h~r|~ki = 1 2π ~ eik·~r . Ondas esféricas livres ~2 Pretendemos encontrar as funções próprias que diagonalizam simultaneamente Ĥ0 = P̂ /2µ, L̂2 e L̂z . De acordo com a secção 6.3, resolvemos a equação de Schrödinger independente do tempo com o ansatz 0 Φ0k,ℓ,m (~r) = Rk,ℓ (r)Yℓm (θ, φ) , e obtemos (6.3.12) com V (r) = 0, ℓ(ℓ + 1)~2 ~2 d 2 d 0 0 r + Rk,ℓ (r) = ERk,ℓ (r) . − 2µr 2 dr dr 2µr 2 (10.3.7) (10.3.8) 10.3 Método das ondas parciais para a difusão por um potencial central 319 Note-se que como o valor mı́nimo do potencial é zero (de facto é sempre zero!) não pode haver estados estacionários com E < 0; definimos então √ 2µE ~2 k 2 ⇔E= . k= ~ 2µ Esta equação pode ser reescrita como 2 d 2 2 0 2 d + 2r + k r − ℓ(ℓ + 1) Rk,ℓ (r) = 0 , r dr 2 dr (10.3.9) (10.3.10) que é conhecida como a equação de Bessel esférica 5; é uma equação que pode ser transformada numa equação de Bessel com ordem semi-inteira. As suas soluções são bem conhecidas e denominam-se por funções de Bessel esféricas. Aqui iremos construir as soluções desta equação usando um método algébrico, semelhante ao usado na construção dos harmónicos esféricos. 10.3.2 Dedução da forma explı́cita das ondas esféricas livres Comecemos por considerar, tal como na secção 6.4, soluções de (10.3.8) da forma 0 Rk,ℓ a equação (10.3.8) fica então u0k,ℓ = ; r ℓ(ℓ + 1) d2 2 − + k u0k,ℓ (r) = 0 . dr 2 r2 (10.3.11) (10.3.12) Esta equação é suplementada pela condição u0k,ℓ(r = 0) = 0 , (10.3.13) que é necessária para que as ondas esféricas livres não sejam (todas) divergentes em r = 0 (se assim fosse qualquer estado estacionário seria divergente em r = 0, o que não é o caso). Assimptoticamente, a equação (10.3.12) fica 2 d 2 ⇒ u0k,ℓ (r) ≃ Aeikr + A′ e−ikr , + k u0k,ℓ(r) ≃ 0 dr 2 5 (10.3.14) Ver, por exemplo, G.B.Arfken e H.J.Webber, Mathematical Methods for Physicists, secção 11.7, Quarta edição. 320 Teoria da Difusão e como tal Φ0k,ℓ,m (~r) ≃ Aeikr + A′ e−ikr m Yℓ (θ, φ) , r (10.3.15) ou seja, a parte radial da onda esférica livre é, assimptoticamente, a sobreposição de uma onda ‘incoming’ com uma onda ‘outgoing’. A diferença de fase destas duas ondas está contida nos coeficientes A e A′ ; mas para os determinarmos teremos de saber mais do que a solução assimptótica da equação, pois teremos de usar a condição fronteira (10.3.13). Para isso vamos calcular as soluções exactas usando um método algébrico. Começamos por definir o operador P̂+ = P̂x + iP̂y . (10.3.16) As relações de comutação deste operador com os operadores do C.C.O.C são [Ĥ0 , P̂+ ] = 0 , [L̂z , P̂+ ] = ~P̂+ , [L̂2 , P̂+ ] = 2~(P̂+ L̂z − P̂z L̂+ ) + 2~2 P̂+ . (10.3.17) Exercı́cio: Demonstre estas relações usando as relações de comutação canónicas. Usando os operadores L̂+ e P̂+ podemos construir novos estados estacionários à custa de antigos. Em primeiro lugar, recordemos a acção de L̂± nos harmónicos esféricos, dada por (6.2.35); logo L̂± |Φ0k,ℓ,mi ∝ |Φ0k,ℓ,m±1i . (10.3.18) Isto é L̂± |Φ0k,ℓ,m i é ainda um estado próprio de {Ĥ0 , L̂2 , L̂z } com valores próprios rotulados por (k, ℓ, m ± 1). Utilizando as relações de comutação (10.3.17) estabelecemos também que • P̂+ |Φ0k,ℓ,mi é ainda estado próprio de Ĥ0 , com valor próprio rotulado por k. De facto Ĥ0 P̂+ |Φ0k,ℓ,m i = P̂+ Ĥ0 |Φ0k,ℓ,mi = ~2 k 2 P̂+ |Φ0k,ℓ,mi . 2µ (10.3.19) • P̂+ |Φ0k,ℓ,mi é ainda estado próprio de L̂z , com valor próprio rotulado por m + 1. De facto L̂z P̂+ |Φ0k,ℓ,mi = (P̂+ L̂z + ~P̂+ )|Φ0k,ℓ,mi = (m + 1)~P̂+ |Φ0k,ℓ,mi . (10.3.20) 10.3 Método das ondas parciais para a difusão por um potencial central 321 • P̂+ |Φ0k,ℓ,mi não é, em geral, estado próprio de L̂2 ; mas se m = ℓ, então P̂+ |Φ0k,ℓ,ℓ i é estado próprio de L̂2 com valor próprio rotulado por ℓ + 1. De facto L̂2 P̂+ |Φ0k,ℓ,ℓ i = (P̂+ L̂2 +2~(P̂+ L̂z − P̂z L̂+ )+2~2 P̂+ )|Φ0k,ℓ,ℓ i = (ℓ+1)(ℓ+2)~2P̂+ |Φ0k,ℓ,ℓi . (10.3.21) Logo concluimos que P̂+ |Φ0k,ℓ,ℓ i ∝ |Φ0k,ℓ+1,ℓ+1i . (10.3.22) O nosso procedimento vai ser: Primeiro calcular as ondas esféricas livres com ℓ = m = 0 resolvendo a equação (10.3.12) e segundo calcular as restantes usando (10.3.18) e (10.3.22). • Primeiro, a solução da equação (10.3.12) com ℓ = m = 0 e obedecendo à condição (10.3.13) é u0k,0(r) = ak sin kr ⇒ Φ0k,0,0 (~r) u0k,0(r) 0 ak sin kr Y0 = √ . = r 4πr (10.3.23) As constantes ak podem ser obtidas pela condição de ortonormalização ′ δ(k − k ) = Z 3 d ~r ∗ Φ0k,0,0 Φ0k′ ,0,0 ∗ = (ak ) ak′ Z +∞ dr sin kr sin k ′ r . (10.3.24) 0 Escrevendo os senos em termos de exponenciais imaginárias e duplicando o intervalo de integração temos (ak )∗ ak′ δ(k − k ) = 4 ′ Z +∞ −∞ (ak )∗ ak′ ′ ′ ei(k−k )r − ei(k+k )r dr = 2π(δ(k − k ′ ) − δ(k + k ′ )) . 4 (10.3.25) Como tanto k como k ′ são positivos, o segundo delta de Dirac nunca contribui. Concluimos p que ak = 2/π, pelo que podemos escrever as ondas esféricas livres com ℓ = m = 0 como Φ0k,0,0 (~r) = r 2k 2 sin kr 1 √ . π kr 4π (10.3.26) • Segundo, notamos que o operador P̂+ actua, na representação |~xi como P̂+ = −i~ ∂ ∂ +i ∂x ∂y . (10.3.27) 322 Teoria da Difusão A sua acção numa função puramente radial é y d d +i f (r) = −i~ sin θeiφ f (r) . P̂+ f (r) = −i~ r r dr dr x Logo, actuando com este operador em (10.3.26) obtemos cos kr sin kr sin kr iφ 0 0 ∝ sin θe − Φk,1,1 (~r) ∝ P̂+ Φk,0,0 (~r) ∝ P̂+ kr kr (kr)2 cos kr sin kr ∝ Y11 (θ, φ) − . kr (kr)2 (10.3.28) (10.3.29) Aplicando L̂− a esta onda esférica livre calculamos Φ0k,1,0 e Φ0k,1,−1, que têm a mesma dependência radial e dependência angular dada pelos harmónicos esféricos respectivos. Para calcular as ondas esféricas livres com ℓ > 1, notamos que [P̂+ , X̂ + iŶ ] = 0 . (10.3.30) Logo x + iy d sin kr 1 d sin kr Φ0k,2,2 (~r) ∝ P̂+2 Φ0k,0,0 (~r) ∝ P̂+ ∝ (x + iy)P̂+ r dr kr r dr kr 2 sin kr 1 d . ∝ (x + iy)2 r dr kr Em geral 1 d r dr ℓ (10.3.31) sin kr , kr (10.3.32) (x + iy)ℓ = r ℓ sinℓ θeiℓφ ∝ r ℓ Yℓℓ (θ, φ) . (10.3.33) Φ0k,ℓ,ℓ (~r) ∝ (x + iy) ℓ onde notamos que a dependência angular é Se definirmos ℓ jℓ (ρ) ≡ ρ 1 d − ρ dρ ℓ sin ρ , ρ que são as funções de Bessel esféricas de ordem l,6 podemos escrever r 2k 2 0 Φk,ℓ,m (~r) = jℓ (kr)Yℓm (θ, φ) , π 6 (10.3.34) (10.3.35) A fórmula (10.3.34) designa-se por Fórmula de Rayleigh; veja, por exemplo 10.1.25 de ‘Handbook of Mathematical Functions’, Ed. M. Abramowitz and I. Stegun, Dover, Ninth Printing. 10.3 Método das ondas parciais para a difusão por um potencial central 1 0.2 0.8 0.15 0.6 0.1 0.4 0.05 0.2 0 0 5 10 15 20 25 323 30 r -0.05 0 0 5 10 20 15 25 30 r -0.1 -0.2 Figura 10.8: Parte radial das funções de Bessel esféricas (10.3.34). Esquerda: ℓ = 0 e ℓ = 1 (zero na origem); direita ℓ = 4 e ℓ = 5 (começa a oscilar mais à direita). onde a constante de normalização é escolhida de modo a verificar Z ∗ 0 0 hΦk,ℓ,m|Φk′ ,ℓ′ ,m′ i = d3~r Φ0k,ℓ,m Φ0k′ ,ℓ′ ,m′ = δ(k − k ′ )δℓℓ′ δmm′ . (10.3.36) Estas funções formam uma base do espaço de estados (isto é uma base do espaço de funções de quadrado somável em R3 ), o que é manifesto na relação de fecho Z +∞ 0 dk +∞ X ℓ X |Φ0k,ℓ,m ihΦ0k,ℓ,m| = 1̂ , (10.3.37) Φ0k,ℓ,m (~r)Φ0k,ℓ,m (r~′ ) = δ(~r − r~′ ) . (10.3.38) ℓ=0 m=−ℓ ou, equivalentemente Z 0 +∞ dk +∞ X ℓ X ℓ=0 m=−ℓ Na figura 10.8 encontram-se os gráficos da parte radial das funções de Bessel esféricas para vários ℓ’s. 10.3.3 Propriedades das ondas esféricas livres As ondas esféricas livres (10.3.35) têm uma dependência angular totalmente definida pelos números quânticos ℓ e m, que determinam o correspondente harmónico esférico Yℓm , e 324 Teoria da Difusão como tal independente da energia. Utiliza-se, por vezes, a notação dos espectroscopistas mencionada na secção 6.4, no caso das ondas esféricas livres: onda s (ℓ = 0), onda p (ℓ = 1), etc. Assim dizemos que a onda s esférica livre é sempre isotrópica. A dependência radial fica clara nas figuras 10.8. Analisemos, analiticamente, os casos limite: Perto da origem Neste caso podemos escrever: ℓ ℓ X +∞ sin ρ ρ2p 1 d 1 d ℓ ℓ ℓ ℓ (−1)p = (−1) ρ jℓ (ρ) ≡ (−1) ρ ρ dρ ρ ρ dρ (2p + 1)! p=0 ℓ−1 X +∞ 1 d 2p = (−1)ℓ ρℓ (−1)p ρ2p−2 ρ dρ (2p + 1)! p=0 ℓ ℓ = (−1) ρ +∞ X p=0 (−1)p (10.3.39) 2p(2p − 2)(2p − 4) . . . [2p − 2(ℓ − 1)] 2p−2ℓ ρ . (2p + 1)! Os termos com p = 0, 1, . . . , ℓ − 1 são zero na soma. O primeiro termo que contribui, que é o mais importante perto da origem, é ρ→0 jℓ (ρ) ≃ (−1)ℓ ρℓ (−1)ℓ 2ℓ(2ℓ − 2)(2ℓ − 4) . . . 2 ℓ ρℓ 2ℓ(2ℓ − 2)(2ℓ − 4) . . . 2 = ρ ≡ , (2ℓ + 1)! (2ℓ + 1)! (2ℓ + 1)!! (10.3.40) onde definimos N!! = N(N − 2)(N − 4) . . . . (10.3.41) Concluimos pois que todas as funções de Bessel esféricas tendem para zero na origem, excepto a onda s (ℓ = 0), de acordo com as figuras 10.8. Consideremos ainda a densidade de probabilidade de uma partı́cula que se encontre no estado Φ0k,ℓ,m. A probabilidade de encontrar a partı́cula no ângulo sólido dΩ0 em torno da direcção (θ0 , φ0) e entre r e r + dr é proporcional a r 2 jℓ2 (kr)|Yℓm (θ0 , φ0 )|2 drdΩ0 . (10.3.42) Logo, a função radial de interesse para a densidade de probabilidade é jℓ2 (ρ)ρ2 . Esta função encontra-se representada na figura 10.9 para vários ℓ’s. Perto da origem esta função 10.3 Método das ondas parciais para a difusão por um potencial central 325 1.4 1 1.2 0.8 1 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 0 0 5 10 15 20 0 5 rho 10 15 20 rho Figura 10.9: Representação da função ρ2 jℓ2 (r). Esquerda: ℓ = 0 (é exactamente o sin2 ρ) e ℓ = 1 (começa a oscilar mais à direita); direita ℓ = 4 e ℓ = 5 (começa a oscilar mais à direita). comporta-se como ρ2ℓ+2 /(2ℓ + 1)!!. Logo quanto maior for ℓ mais lento será o crescimento desta função perto de ρ = 0. A probabilidade de encontrar a partı́cula para r suficientemente pequeno é, assim, negligenciável; estimamos que para ρ< p ℓ(ℓ + 1) ⇔ p ℓ(ℓ + 1) |L| = , r< k |~p| (10.3.43) a probabilidade de encontrar a partı́cula seja praticamente nula. Este valor é qualitativamente justificado pela figura 10.9. Façamos uma analogia clássica para uma justificação mais quantitativa. Se considerarmos uma partı́cula clássica livre no plano xy, terá equações do movimento x=x +v t 0 x y =y +v t 0 y ⇒ D 2 (t) = x2 +y 2 = x20 +y02 +(vx2 +vy2 )t2 +2(x0 vx +y0vy )t , (10.3.44) onde D 2 (t) é o quadrado da distância à origem. Extremizando esta função calculamos o parâmetro de impacto, b (distância mı́nima à origem): 2 Dmin = (x0 vy − y0 vx )2 vx2 + vy2 ⇒ b = |Dmin | = |L| , |~p| (10.3.45) 326 Teoria da Difusão que é a versão clássica de (10.3.43). Assim, a partı́cula quântica no estado |Φ0k,ℓ,mi é praticamente inafectada pelo que acontece dentro de uma esfera com raio p ℓ(ℓ + 1) . bℓ (k) = k Comportamento assimptótico ℓ ℓ−1 sin ρ cos ρ sin ρ 1 d 1 d ℓ ℓ ℓ ℓ = (−1) ρ − 3 jℓ (ρ) ≡ (−1) ρ ρ dρ ρ ρ dρ ρ2 ρ ℓ−1 ρ→∞ 1 d cos ρ ≃ (−1)ℓ ρℓ . ρ dρ ρ2 Aplicando outra derivada, o termo dominante será a derivada do cosseno ℓ−2 ρ→∞ − sin ρ 1 d ℓ ℓ . jℓ (ρ) ≃ (−1) ρ ρ dρ ρ3 (10.3.46) (10.3.47) (10.3.48) Concluimos que, de um modo geral, o termo assimptoticamente dominante virá de aplicar todas as derivadas à função trigonométrica (e não às potências de ρ) ℓ ℓ ρ→∞ d (−1)ℓ d ℓ ℓ 1 1 jℓ (ρ) ≃ (−1) ρ ℓ sin ρ = sin ρ . ρ ρ dρ ρ dρ Notando que podemos escrever ℓ d ℓπ ℓ . sin ρ = (−1) sin ρ − dρ 2 (10.3.49) (10.3.50) Logo, sin ρ − ℓπ 2 . (10.3.51) jℓ (ρ) ≃ ρ Assim sendo, as ondas esféricas livres (10.3.35) ficam, assimptoticamente, r r ρ→∞ 2k 2 sin(kr − ℓπ/2) m 2k 2 m eikr e−iℓπ/2 − e−ikr eiℓπ/2 0 Φk,ℓ,m ≃ Yℓ (θ, φ) = Yℓ (θ, φ) . π kr π 2ikr (10.3.52) ρ→∞ Este comportamento assimptótico corresponde à sobreposição de uma onda ‘incoming’ (e−ikr /r) com uma onda ‘outgoing’ (eikr /r), com uma diferença de fase ℓπ ℓπ = πℓ . − − ∆ϕ = ϕincoming − ϕoutgoing = 2 2 (10.3.53) Ou seja, as componentes ‘incoming’ e ‘outgoing’ das ondas esféricas livres com ℓ par (ℓ ı́mpar) estão em fase (oposição de fase). Tal como antecipado no inı́cio desta secção, a diferença de fase é bem definida e função do número quântico ℓ. 10.3 Método das ondas parciais para a difusão por um potencial central 327 Expansão de uma onda plana em termos de ondas esféricas livres Estudamos duas ‘bases’ distintas do espaço de funções de quadrado somável em R3 que são bases próprias de Ĥ0 : ondas planas, |~ki = |kx , ky , kz i, e ondas esféricas livres, |Φ0k,ℓ,mi. Dado serem bases é possı́vel expandir qualquer ket de uma base em termos dos kets da outra base. Consideremos o ket |0, 0, ki, que representa a onda plana eikz ; de facto h~r|0, 0, ki = 1 eikz . (2π)3/2 (10.3.54) Este é um estado próprio de Ĥ0 com momento (~p = ~~k) e energia (E = ~2 k 2 /2µ) bem definidos. Para além disso, como eikz = eikr cos θ , (10.3.55) é independente da coordenada φ, na representação |~ri, o ket |0, 0, ki é também um estado próprio de L̂z (L̂z = −i~∂/∂φ), com valor próprio 0: L̂z |0, 0, ki = 0 . (10.3.56) Usando a relação de fecho (10.3.37), podemos escrever |0, 0, ki = Z 0 +∞ dk ′ +∞ X ℓ X ℓ=0 m=−ℓ |Φ0k′ ,ℓ,mihΦ0k′ ,ℓ,m |0, 0, ki . (10.3.57) Para m 6= 0, |0, 0, ki e |Φ0k′ ,ℓ,m i são dois vectores próprios de um operador hermı́tico (L̂z ), com valores próprios diferentes. Logo são ortogonais. São também 2 vectores próprios de Ĥ0 - também hermı́tico - com valores próprios diferentes caso k 6= k ′ ; logo ortogonais. Podemos pois escrever que hΦ0k′ ,ℓ,m |0, 0, ki ∝ δm0 δ(k − k ′ ) , e como tal |0, 0, ki = +∞ X ℓ=0 ck,ℓ |Φ0k,ℓ,0i , (10.3.58) (10.3.59) 328 Teoria da Difusão ou, na representação |~ri, +∞ X eikz ck,ℓ = (2π)3/2 ℓ=0 r 2k 2 jℓ (kr)Yℓ0 (θ) . π Os coeficientes ck,ℓ podem ser calculados explicitamente, obtendo-se7 r 2ℓ + 1 ck,ℓ = iℓ . 4πk 2 (10.3.60) (10.3.61) Logo ikz e +∞ X p iℓ 4π(2ℓ + 1)jℓ (kr)Yℓ0 (θ) . = (10.3.62) ℓ=0 Note-se que, assimptoticamente, usando (10.3.51), (10.3.52) temos a expressão ikz e 10.3.4 r→∞ ≃ +∞ X p eikr e−iℓπ/2 − e−ikr eiℓπ/2 0 Yℓ (θ) . iℓ 4π(2ℓ + 1) 2ikr ℓ=0 (10.3.63) Ondas parciais num potencial V (r) Vamos agora introduzir um potencial central arbitrário V (r). O ponto principal é que para qualquer V (r) com suporte compacto a forma assimptótica das ondas parciais será idêntica à das ondas esféricas livres, apenas mudando o desfasamento entre a onda ‘incoming’ e a onda ‘outgoing’. Consideremos novamente a equação de Schrödinger três dimensional. Para a resolvermos em termos de ondas parciais tomamos um ansatz análogo a (10.3.7) com (10.3.11), Φk,ℓ,m = uk,ℓ(r) m Yℓ (θ, φ) , r onde uk,ℓ (r) é solução da generalização de (10.3.12), isto é 2 d ℓ(ℓ + 1) 2µV (r) 2 − +k − uk,ℓ(r) = 0 , dr 2 r2 ~2 (10.3.64) (10.3.65) com a condição (10.3.13) uk,ℓ (r = 0) = 0 . 7 Este cálculo será efectuado nas aulas teórico-práticas. (10.3.66) 10.3 Método das ondas parciais para a difusão por um potencial central 329 Note-se que isto não é mais do que a equação de Schrödinger para um problema em uma dimensão, onde a partı́cula de massa µ está sob a acção do potencial 2 V (r) + ℓ(ℓ + 1)~ , r > 0 2µr 2 ; Vef f (r) = +∞ , r<0 (10.3.67) esta perspectiva um dimensional justifica a utilização da condição fronteira (10.3.66). Assumindo que o potencial é assimptoticamente negligenciável, (10.3.65) fica, assimptoticamente com solução geral d2 2 + k uk,ℓ(r) dr 2 uk,ℓ (r) r→∞ ≃ r→∞ ≃ 0, (10.3.68) Aeikr + A′ e−ikr . (10.3.69) Podemos pensar nesta solução, na perspectiva do potencial efectivo um dimensional: existe uma onda incidente de r = +∞ (e−ikr ) e uma onda reflectida (eikr ). Como não pode haver onda transmitida para r < 0 - dado que o potencial é infinito nessa região - a corrente reflectida tem que ser igual à transmitida, pelo que concluimos que |A| = |A′ | ⇒ uk,ℓ (r) r→∞ ≃ |A| eikr eϕr + e−ikr eϕi ⇔ uk,ℓ(r) r→∞ ≃ C sin(kr + βℓ ) . (10.3.70) A fase βℓ vai ser determinada pela condição fronteira na origem (10.3.66). No caso das ondas esféricas livres (V (r) = 0), vimos em (10.3.51) que βℓ = −ℓπ/2; tomando este valor como referência escrevemos uk,ℓ (r) r→∞ ≃ ℓπ C sin kr − + δℓ , 2 (10.3.71) onde δℓ , que em geral será função da energia e como tal de k, é a diferença de fase adicional ou desfasamento para as ondas parciais. Concluimos que as ondas parciais terão a forma assimptótica ℓπ r→∞ C sin kr − 2 + δℓ Φk,ℓ,m (~r) ≃ Yℓm (θ, φ) r eikr e−i(ℓπ/2−δℓ ) − e−ikr ei(ℓπ/2−δℓ ) , = CYℓm (θ, φ) 2ir (10.3.72) 330 Teoria da Difusão e vemos que as ondas parciais são ainda a sobreposição de uma onda “incoming” com uma onda “outgoing” com uma diferença de fase ∆ϕ = ϕincoming − ϕoutgoing = ℓπ − 2δℓ . (10.3.73) Portanto, o potencial originou a diferença de fase adicional −2δℓ relativamente ao que aconteceria na ausência de potencial. Este factor traduz o efeito total do potencial numa partı́cula com momento angular ℓ. É conveniente definir uma nova função de onda Φ̃k,ℓ,m (~r) proporcional, assimptoticamente, a (10.3.72), do seguinte modo: • Φ̃k,ℓ,m(~r) = eiδℓ Φk,ℓ,m (~r); esta redefinição por uma fase global é irrelevante fisicamente e é conveniente porque fazendo-o podemos pensar no processo de difusão, na presença do potencial, da seguinte maneira: a onda incidente de r = +∞ é a mesma do que aquela considerada na ausência de potencial, mas a onda reflectida tem a fase adicional 2δℓ . • Tomamos a constante C = 1/k em (10.3.72). Esta escolha nada tem de fı́sico. É apenas uma questão de conveniência como veremos em baixo. Logo Φ̃k,ℓ,m (~r) r→∞ ∼ −Yℓm (θ, φ) e−ikr eiℓπ/2 − eikr e−iℓπ/2 e2iδℓ . 2ikr (10.3.74) Recordemos que as ondas esféricas livres Φ0k,ℓ,m praticamente não penetram na região p com r < ℓ(ℓ + 1)/k, como visto na secção anterior. Se considerarmos um potencial com alcance finito - digamos r0 - tal que V (r) = 0 para r > r0 , necessitamos apenas de considerar a diferença de fase adicional δℓ para ℓ < ℓM , onde p ℓM (ℓM + 1) ≃ r0 k . (10.3.75) Isto é, para potenciais com alcance finito, existe, para cada energia, um ℓ máximo e as únicas diferenças de fase adicionais que necessitamos de calcular acontecerão para as primeiras ondas parciais (s, p, . . .). 10.3 Método das ondas parciais para a difusão por um potencial central 331 Secção eficaz diferencial de difusão em termos de δℓ Como toda a informação sobre o potencial V (r) fica contida, assimptoticamente, em δℓ , deveremos ser capazes de calcular σ(θ, φ) em termos de δℓ . Para isso escrevemos os estados estacionários de difusão em termos das ondas parciais. Tendo em conta as simetrias do problema (onda incidente segundo Oz e potencial central), as únicas ondas parciais que respeitam esta simetria são Φk,ℓ,0 (~r). Logo vkdif (~r) = +∞ X cℓ Φ̃k,ℓ,0(~r) . (10.3.76) ℓ=0 Para estes serem estados estacionários de difusão, têm que ter o comportamento assimptótico correcto. Isso é verificado se escolhermos os coeficientes cℓ apropriadamente: Lema: A forma de cℓ para (10.3.76) ser um estado estacionário de difusão é8 cℓ = iℓ p 4π(2ℓ + 1) . (10.3.77) Demonstração: Introduzindo (10.3.77) em (10.3.76) temos vkdif (~r) +∞ X p iℓ 4π(2ℓ + 1)Φ̃k,ℓ,0 (~r) ; = (10.3.78) ℓ=0 usando a forma assimptótica (10.3.74), r→∞ vkdif (~r) ≃ +∞ X p e−ikr eiℓπ/2 − eikr e−iℓπ/2 e2iδℓ 0 ℓ , − i 4π(2ℓ + 1)Yℓ (θ) 2irk ℓ=0 (10.3.79) ou ainda, escrevendo e2iδℓ = 1 + 2ieiδℓ sin δℓ , (10.3.80) temos r→∞ vkdif (~r) ≃ 8 −ikr iℓπ/2 +∞ X p e e − eikr e−iℓπ/2 e−iℓπ/2 eiδℓ sin δℓ eikr 0 ℓ i 4π(2ℓ + 1)Yℓ (θ) − . − 2irk k r ℓ=0 (10.3.81) Para obter (10.3.74) usamos C = 1/k em (10.3.72); caso tivessemos usado outro valor alteraria a forma de (10.3.77), mas o resultado final (10.3.83) seria inalterado. 332 Teoria da Difusão Comparando com (10.3.63) concluimos que o primeiro termo é a forma assimptótica de eikz ; logo r→∞ vkdif (~r) ≃ ikz e +∞ X p e−iℓπ/2 eiδℓ sin δℓ eikr iℓ 4π(2ℓ + 1)Yℓ0 (θ) . + k r ℓ=0 (10.3.82) Esta é, de facto a forma assimptótica correcta para um estado estacionário de difusão, (10.1.13). Concluimos ainda que a expressão para a amplitude de difusão em termos das diferenças de fase adicionais, δℓ , toma a forma +∞ fk (θ) = 1 Xp 4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) , k ℓ=0 (10.3.83) onde usamos que e−iℓπ/2 = (−i)ℓ . (q.e.d.) A secção eficaz diferencial de difusão é, portanto, +∞ 1 Xp σ(θ) = |fk (θ)| = 4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) k 2 2 . (10.3.84) ℓ=0 Note-se, em particular, que a contribuição da onda s para a secção eficaz diferencial de difusão é independente de θ e toma a forma σ onda s = sin2 δ0 . k2 (10.3.85) A secção eficaz total de difusão é simples de calcular usando a ortonormalização dos harmónicos esféricos, com resultado σ= Z dΩσ(θ) = +∞ 4π X (2ℓ + 1) sin2 δℓ . k2 (10.3.86) ℓ=0 Em particular, a contribuição da onda s para a secção eficaz total é onda s σparcial = 4π sin2 δ0 ; k2 (10.3.87) as contribuições de ondas especı́ficas para a secção eficaz total, são denominadas secções eficazes de difusão parciais. Comentários: 10.3 Método das ondas parciais para a difusão por um potencial central 333 • Não há contribuições provenientes de interferências entre diferentes ℓ’s para σ; • Cada ℓ pode dar uma contribuição máxima de 4π(2ℓ + 1)/k 2 para σ; • Para calcular σ será em princı́pio necessário saber δℓ para todos os ℓ. Há duas situações possı́veis: i) Se V (r) é conhecido isto implica resolver a equação radial para cada ℓ. Frequentemente isto tem de ser feito numericamente. Na prática o método das ondas parciais só é atractivo se δℓ tiver que ser calculado apenas para um número suficientemente pequeno de ℓ’s. Este será o caso para potenciais de alcance finito L, discutido anteriormente, se considerarmos a difusão de modos de baixa energia: k≪ 1 . L (10.3.88) Para estes modos, apenas os desfasamentos com ℓ mais baixo terão de ser calculados. Em particular para energias suficientemente baixas, apenas a onda s deverá ser considerada, pelo que a secção eficaz de difusão será bem aproximada por (10.3.85); ii) Se V (r) for desconhecido, tentaremos reproduzir a curva experimental usando um pequeno número de δℓ ’s, isto é, usando apenas ℓ = 1, 2, . . . , ℓmáximo . A dependência em θ irá sugerir que ℓ’s necessitamos de considerar. Por exemplo, se σ for independente de θ, só necessitamos de considerar ℓ = 0 - dado que Y00 é independente de θ. Pelo mesmo raciocı́nio se σ for dependente de θ, necessitamos de considerar ℓ’s diferentes de zero. Depois de estabelecermos quais os ℓ’s necessários para reproduzir os resultados experimentais, procuramos potenciais que reproduzam os δℓ necessários. Exemplo: Poço de potencial esférico Como exemplo de aplicação do método das ondas parciais consideramos o poço de potencial esférico (10.2.40), já considerado na aproximação de Born. No método das ondas parciais 334 Teoria da Difusão temos de calcular os desfasamentos δℓ para todos os ℓ. Para isso temos de resolver a equação (10.3.65) para o potencial (10.2.40), com a condição fronteira (10.3.66); isto é resolver 2 ℓ(ℓ + 1) 2µV0 d 2 − + k + 2 uk,ℓ (r) = 0 , r < R dr 2 r2 ~ 2 . (10.3.89) ℓ(ℓ + 1) d 2 − + k uk,ℓ(r) = 0 , r > R dr 2 r2 Se kR ≪ 1, apenas a onda s (ℓ = 0) é relevante e neste caso as equações são particularmente simples de resolver. De facto, o problema reduz-se a resolver a equação de Schrödinger um dimensional num potencial contı́nuo por pedaços (capı́tulo 3). As soluções para uk,0(r) são: ′ ′ Aeik r + A′ e−ik r , r < R uk,0(r) = (10.3.90) A eikr + A′ e−ikr , r > R , 1 1 onde p 2µ(V0 + E) . k = ~ Impondo a condição fronteira (10.3.66) (que corresponde à continuidade da função de onda ′ na descontinuidade infinita do potencial em r = 0) e a continuidade da função de onda uk,0(r) e da sua derivada em r = R, obtemos ′ ′ k k ′ −ikR ′ ′ ′ ikR ′ ′ A = −A , A1 = e − cos k R + i sin k R A . cos k R + i sin k R A , A1 = e k k (10.3.91) Concluimos que a função de onda tem a forma 2iA sin k ′ r , r < R ′ uk,0(r) = k ′ ′ cos k R sin k(r − R) + sin k R cos k(r − R) , r > R . 2iA k (10.3.92) Para lermos o desfasamento, escrevemos a parte assimptótica da solução (r > R) na forma (10.3.71), com ℓ = 0, isto é uk,0(r) = 2Ai sin(kr + δ0 ) , r>R. (10.3.93) Expandindo este seno como o seno de uma soma (escrevendo sin[(kr − kR) + (δ0 + kR)]) e igualando a (10.3.92) obtemos δ0 = arctan k ′ tan k R − kR . k′ (10.3.94) 10.3 Método das ondas parciais para a difusão por um potencial central Usando (10.3.87) obtemos para a secção eficaz parcial de difusão 2 k 4π ′ onda s tan k R − kR . σparcial = 2 sin arctan k k′ 335 (10.3.95) A secção eficaz parcial será uma boa aproximação à secção eficaz total no limite de baixas energias, kR ≪ 1 (note-se que esta é a condição (10.2.44). Neste limite podemos aproximar (desde que k ′ R 6= nπ/2) arctan kR tan k ′ R k′R ≃ kR tan k ′ R . k′R Se a energia da partı́cula difundida for baixa, não só relativamente ao alcance do potencial, mas também relativamente à sua magnitude E ≪ V0 , podemos aproximar √ 2µV0 ′ k ≃ k0 = . ~ Logo δ0 ≃ kR tan k0 R −1 k0 R , e onda s σparcial ≃ 4πR 2 tan k0 R −1 k0 R 2 . (10.3.96) Para compararamos com o resultado obtido na aproximação de Born, temos de considerar a aproximação que está sempre presente na aproximação de Born, isto é, que o potencial é fraco. Neste caso, k0 R ≪ 1 (note-se que esta é a condição (10.2.41)). Usando tan x ≃ x + x3 /3, para x ≪ 1 obtemos onda s σparcial ≃ 4πR2 16π µ2 V02 R6 (k0 R)4 = , 9 9 ~4 (10.3.97) em concordância com o resultado (10.2.46) obtido na aproximação de Born. Alguns comentários: • Na aproximação de Born, o potencial é considerado suficientemente fraco. Para além disso podemos, ou não, considerar uma aproximação de baixas energias. Por contraste, no método das ondas parciais, ao aproximarmos a secção eficaz total de difusão pela secção eficaz parcial da onda s estamos a assumir uma aproximação de baixas 336 Teoria da Difusão energias. Para além disso podemos, ou não, considerar uma aproximação de potencial fraco. Claro que só obtemos um acordo entre os dois métodos se considerarmos ambas as aproximações nos dois casos. • Por (10.3.96) vemos que, a secção eficaz aumenta com a profundidade do poço V0 e diverge para tan k0 R = π/2. Esta é a profundidade para a qual o poço admite o primeiro estado ligado (Problema 4, Folha de Problemas 4, Mecânica Quântica I). Se continuarmos a aumentar a profundidade do poço a secção eficaz diminui até zero, valor que é obtido para tan k0 R = k0 R. Aumentando a profundidade do poço a secção eficaz oscila entre 0 e ∞, divergindo sempre que a profundidade do poço permite um novo estado ligado. 10.4 Difusão Inelástica Até agora lidamos neste capı́tulo unicamente com difusão elástica. Porém, existem fenómenos onde parte da energia do feixe incidente é absorvida, no estado final, pelos graus de liberdade internos das diferentes partı́culas iniciais ou das partı́culas alvo. Se estamos essencialmente interessados na parte da difusão elástica, descrevemos esta absorção globalmente, i.e. sem entrar nos detalhes das reacções de absorção. O método das ondas parciais fornece-nos o enquadramento adequado para uma descrição fenomenológica da absorção. Comecemos por discutir, conceptualmente, a modificação do método de modo a incluir o fenómeno de absorção. O método das ondas parciais é usado para potenciais centrais. Por isso vamos assumir que as interacções que conduzem à absorção são também invariantes por rotação. O método baseia-se no cálculo de desfasamentos entre as ondas ‘incoming’ e ‘outgoing’, do tipo e2iδℓ , de acordo com (10.3.74). Como o módulo deste factor é 1, as amplitudes das ondas ‘incoming’ e ‘outgoing’ são iguais, pelo que a corrente de probabilidade que entra é igual à que sai. Isto sugere que, se permitirmos que o desfasamento tenha uma parte imaginária, de modo a que |e2iδℓ | < 1 , (10.4.1) 10.4 Difusão Inelástica 337 teremos uma corrente de probabilidade a sair menor do que aquela que entrou, para a onda parcial ℓ. Este facto manifesta o desaparecimento de algumas partı́culas e como tal um fenómeno de absorção. Com este princı́pio iremos deduzir expressões para as secções eficazes de difusão e absorção. Note que a descrição que aqui é dada é fenomenológica; esconde uma realidade de processos complexos que levam às absorções aqui descritas. 10.4.1 Secções eficazes de difusão elástica e de absorção Denotemos e2iδℓ ≡ ηℓ . (10.4.2) Impomos que |ηℓ | ≤ 1, de modo a descrever difusão elástica (se |ηℓ | = 1) ou difusão com absorção (se |ηℓ | < 1). Reescrevemos (10.3.79) como vkdif (~r) r→∞ ≃ +∞ X p eikr e−iℓπ/2 (ηℓ − 1) + eikr e−iℓπ/2 − e−ikr eiℓπ/2 iℓ 4π(2ℓ + 1)Yℓ0 (θ) , 2irk ℓ=0 (10.4.3) ou, usando (10.3.63) r→∞ vkdif (~r) ≃ ikz e + +∞ X p 4π(2ℓ + 1)Yℓ0 (θ) ℓ=0 (ηℓ − 1) eikr , 2ik r (10.4.4) de onde lemos que a amplitude de difusão é +∞ ηℓ − 1 1 Xp 4π(2ℓ + 1)Yℓ0 (θ) fk (θ) = . k ℓ=0 2i (10.4.5) Logo, a secção eficaz diferencial de difusão, que agora denominamos secção eficaz de difusão elástica e denotamos σel é +∞ ηℓ − 1 1 Xp 4π(2ℓ + 1)Yℓ0 (θ) σel (θ) = 2 k 2i 2 . (10.4.6) ℓ=0 Consequentemente, a secção eficaz total de difusão elástica é σel = Z +∞ π X σel (θ)dΩ = 2 (2ℓ + 1)|ηℓ − 1|2 . k ℓ=0 (10.4.7) 338 Teoria da Difusão Note que a absorção será máxima se ηℓ = 0. Mas mesmo nesse caso a onda ℓ contribui para a secção de difusão elástica! Ou seja, mesmo uma região de interacção que seja um absorvedor perfeito produz difusão elástica. Este é um fenómeno puramente quântico, denominado de difusão por sombras. Analogamente ao que foi feito na secção (10.1.1) para a secção eficaz diferencial de difusão, definimos a secção eficaz de absorção, σabs , como sendo a razão entre o número de partı́culas absorvidas por unidade de tempo dnabs e o fluxo incidente Fi : dnabs = σabs Fi . (10.4.8) Para calcular esta secção eficaz é suficiente calcular a probabilidade total, ∆P, que desa~ parece por unidade de tempo. Esta probabilidade é, por sua vez, obtida da corrente J, associada com a função de onda (10.4.3): ∆P é a diferença entre o fluxo de ondas que entram e o das ondas que saem numa esfera de raio elevado R0 ; ou seja é menos o fluxo total através dessa esfera: ∆P = − Z S2 ~=− J~ · dS Z Jr r 2 dΩ , (10.4.9) r=R0 pois apenas a componente radial Jr contribui. Usando (10.1.16), temos Jr = Re (vkdif )∗ (~r) ~ ∂ dif v (~r) iµ ∂r k . (10.4.10) Como a derivada radial não altera a dependência angular e usando a ortogonalidade dos harmónicos esféricos obtemos ∆P = − +∞ Z X ℓ r=R0 Jr(ℓ) r 2 dΩ , (10.4.11) onde Jr(ℓ) e como tal r→+∞ ≃ − ~k (2ℓ + 1)π (1 − |ηℓ |2 )|Yℓ0 (θ)|2 , µ k2r2 +∞ ~k π X ∆P = (2ℓ + 1)(1 − |ηℓ |2 ) . µ k2 ℓ (10.4.12) (10.4.13) 10.4 Difusão Inelástica 339 A secção eficaz de absorção é a probabilidade ∆P a dividir pela corrente incidente ~k/µ, σabs +∞ π X (2ℓ + 1)(1 − |ηℓ |2 ) . = 2 k ℓ (10.4.14) Note-se que σabs = 0 se todos os |ηℓ | = 1 como seria de esperar quando todos os desfasamentos forem puramente reais. Pelo contrário, se |ηℓ | = 0 a contribuição da onda ℓ para σabs é máxima. 10.4.2 Secção eficaz total e o teorema óptico A secção eficaz total é definida como a soma de todas as secções eficazes (integradas sobre todo o espaço caso sejam secções eficazes diferenciais). Corresponde ao número de partı́culas que, por unidade de tempo, participam numa das reacções possı́veis (i.e são difundidas ou absorvidas), dividido pelo fluxo incidente. Logo σtotal = σel + σabs , (10.4.15) ou usando (10.4.7) e (10.4.14), σtotal +∞ +∞ π X π X 2 2 = 2 (2ℓ + 1) 1 − |ηℓ | + |ηℓ − 1| = 2 (2ℓ + 1) [1 − Re ηℓ ] . k ℓ k ℓ (10.4.16) Usando (10.4.5) e ainda o facto que os harmónicos esféricos envolvidos são, para ângulo polar igual a zero: Yℓ0 (θ obtemos = 0) = r 2ℓ + 1 , 4π +∞ 1 X Im fk (θ = 0) = (2ℓ + 1)Re (1 − ηℓ ) , 2k (10.4.17) (10.4.18) ℓ ou, comparando com (10.4.16) σtotal = 4π Im fk (θ = 0) . k (10.4.19) Este resultado é designado por Teorema óptico. É uma relação entre a secção eficaz total e a parte imaginária da amplitude de difusão elástica na direcção frontal (θ = 0). Note-se 340 Teoria da Difusão que no caso em que não há absorção σtotal = σel e o teorema reduz-se a uma relação entre a amplitude de difusão na direcção frontal e a secção eficaz total de difusão. Que uma tal relação exista é bastante natural. Para o compreender recordemos a forma dos estados estacionários de difusão (10.1.13) ~ r →∞ vkdif (~r) −→ eikr cos θ + fk (θ, φ) eikr ; r (10.4.20) A onda transmitida na direcção frontal é ~ r →∞ vkdif (r, θ = 0, φ) −→ eikr + fk (θ = 0, φ) eikr ; r (10.4.21) que não é mais do que uma sobreposição entre a onda incidente eikr e a onda difundida na direcção frontal fk (θ = 0, φ)eikr /r. A última é determinada pela amplitude de difusão na direcção frontal. A onda transmitida é atenuada (relativamente à onda incidente), devido às partı́culas difundidas em todas as direcções do espaço. Logo a sobreposição entre a onda difundida na direcção frontal e a onda incidente tem de ter a informação sobre as partı́culas difundidas em todas as outras direcções. Logo é natural que exista uma relação entre fk (θ = 0, φ) e σtotal . 10.5 Sumário Neste capı́tulo estudamos reacções de difusão. As quantidades fundamentais do formalismo são a amplitude de difusão, fk (θ, φ), e as secções eficazes (diferencial e total) de difusão σ(θ, φ) e σ. Todo o formalismo pode ser discutido em termos dos estados estacionários de difusão (quando o potencial é indepentente do tempo, que é o caso aqui considerado), que são as funções de onda do problema com o comportamento assimptótico correcto. Por considerações genéricas obtivemos a relação (10.1.24): σ(θ, φ) = |fk (θ, φ)|2 . Esta equação traduz a relação entre a quantidade directamente relacionável com a experiência σ(θ, φ) e a quantidade derivável da teoria, fk (θ, φ). Estudamos seguidamente dois métodos teóricos para calcular a amplitude de difusão. 10.5 Sumário 341 No primeiro método - método de Born - começamos por estabelecer a equação integral de difusão para obter os estados estacionários de difusão. Estabelecemos a expansão de Born e a aproximação de Born que nos permitiu obter uma fórmula aproximada, utilizável, para calcular a amplitude de difusão (e como tal a secção eficaz de difusão) para um determinado potencial (10.2.27): fkBorn (θ, φ) µ =− 2π~2 Z d3~re−i~q·~r V (~r) , q ≡ 2k sin θ . 2 A fórmula é válida para potenciais fracos de acordo com o critério (10.2.24). Como exemplo calculamos a secção eficaz de difusão para um poço de potencial esférico e para o potencial de Yukawa. Para este último caso recuperamos, no limite de alcance infinito, a fórmula de Rutherford. No segundo método - método das ondas parciais -, válido apenas para potenciais com simetria esférica, começamos por estudar em detalhe as ondas esféricas livres e estabelecemos que as ondas parciais num potencial central arbitrário diferem, assimptoticamente, das ondas esféricas livres apenas por um desfasamento. Obtivemos uma expressão exacta para a amplitude de difusão (10.3.83) em termos destes desfasamentos, causadas pelo potencial difusor: +∞ fk (θ) = 1 Xp 4π(2ℓ + 1)eiδℓ sin δℓ Yℓ0 (θ) . k ℓ=0 Embora a fórmula seja exacta, para ser utilizável temos que assumir uma aproximação de baixas energias (10.3.88), de modo a que seja apenas necessario saber os desfasamentos das ondas com ℓ mais baixo. Como aplicação do método consideramos novamente um poço de potencial esférico e recuperamos, no limite de baixas energias e potencial fraco o resultado da aproximação de Born. Finalmente consideramos brevemente a difusão inelástica. Definimos a secção eficaz de absorção, obtivemos uma expressão para o seu cálculo e derivamos o teorema óptico. CAPÍTULO 11 Métodos perturbativos independentes e dependentes do tempo Na secção 9.2 discutimos qualitativamente que, para descrever a estrutura fina do espectro do átomo de hidrogénio, é necessário levar em consideração várias correcções ao Hamiltoniano do problema de Coulomb, estudado no capı́tulo 6. Considerando tais correcções, o problema do átomo de hidrogénio deixa de ser exactamente solúvel e portanto é necessário considerarmos métodos de resolução aproximada. Sendo que tais correcções são pequenas é natural considerarmos um método perturbativo. Neste capı́tulo consideramos sistemas fı́sicos cujo Hamiltoniano pode ser visto como uma soma de dois termos. Um primeiro termo pode ser considerado exactamente, isto é, o seu espectro e funções próprias podem ser calculados analiticamente. O segundo termo não é, genericamente, diagonalizado pelas funções próprias do primeiro termo, e o como tal o Hamiltoniano total não pode ser resolvido exactamente. No entanto, o segundo termo pode ser considerado muito menor do que o primeiro e como tal o Hamiltoniano total pode ser resolvido através de uma expansão perturbativa, que poderá ser truncada na ordem desejada obtendo-se o espectro e funções próprias do Hamiltoniano total com uma precisão que será tanto maior quanto maior for a ordem considerada. Começamos por considerar o cálculo de estados estacionários de sistemas descritos por 344 Métodos perturbativos independentes e dependentes do tempo Hamiltonianos independentes do tempo. Seguidamente estudaremos Hamiltonianos cujas perturbações são dependentes do tempo. 11.1 Teoria das perturbações estacionárias Consideramos o Hamiltoniano Ĥ = Ĥ0 + Ŵ , (11.1.1) onde Ĥ0 é o Hamiltoniano não perturbado e Ŵ é o Hamiltoniano da perturbação. O facto de Ŵ ser uma perturbação significa que a sua contribuição para os valores próprios e os vectores próprios de Ĥ é muito menor do que a contribuição de Ĥ0 ; esquematicamente escrevemos |Ŵ | ≪ |Ĥ0 | , (11.1.2) mas o sentido preciso deste critério será esclarecido posteriormente. Para tornar explı́cita a análise perturbativa, escrevemos Ŵ ≡ λV̂ , onde λ ≪ 1. Assumimos que conhecemos a forma exacta dos valores próprios e estados próprios de Ĥ0 , sendo o seu espectro {Ep0 } discreto: Ĥ0 |φip i = Ep0 |φip i , (11.1.3) onde i = 1, . . . , dp é um ı́ndice no sub-espaço degenerado das energias, e {|φip i} constitui uma base ortonormalizada de estados próprios ′ hφip |φip′ i ii′ = δ δpp′ , dp XX p i=1 |φip ihφip | = 1̂ . (11.1.4) Com este formalismo, podemos calcular soluções aproximadas da equação de valores próprios Ĥ(λ)|Ψ(λ)i = E(λ)|Ψ(λ)i , (11.1.5) onde Ĥ = Ĥ0 + λV̂ , usando uma expansão perturbativa em λ. Para este fim, assumimos que tanto o valor próprio E(λ), como o vector próprio, |Ψ(λ)i, admitem uma expansão em 11.1 Teoria das perturbações estacionárias 345 potências de λ, da forma, respectivamente, 2 E(λ) = ǫ0 + λǫ1 + λ ǫ2 + . . . = +∞ X λn ǫn , (11.1.6) n=0 2 |Ψ(λ)i = |0i + λ|1i + λ |2i + . . . = Substituindo estas expansões em (11.1.5) obtemos ! ! +∞ +∞ X X (Ĥ0 + λV̂ ) λn |ni = λn ǫn n=0 +∞ X n=0 n=0 λn |ni . +∞ X m=0 λm |mi (11.1.7) ! . (11.1.8) Igualando as potências de λ obtemos um conjunto infinito de equações: • Ordem 0 : Ĥ0 |0i = ǫ0 |0i . (11.1.9) Este ordem corresponde ao sistema sem perturbação. • Ordem 1 : • Ordem 2 : Ĥ0 − ǫ0 |1i + V̂ − ǫ1 |0i = 0 ; (11.1.10) Ĥ0 − ǫ0 |2i + V̂ − ǫ1 |1i − ǫ2 |0i = 0 ; (11.1.11) • Ordem n: Ĥ0 − ǫ0 |ni + V̂ − ǫ1 |n − 1i − ǫ2 |n − 2i − . . . − ǫn |0i = 0 . (11.1.12) No que se segue estudaremos as correcção ao espectro e funções próprias até segunda ordem em λ. Para determinarmos a função de onda numa dada ordem em λ, recordamos que a equação de valores próprios (11.1.5) determina a função de onda a menos de uma constante. Esta constante pode ser escolhida de modo a que: i) a função de onda esteja normalizada, hΨ(λ)|Ψ(λ)i = 1; 346 Métodos perturbativos independentes e dependentes do tempo ii) como fica ainda a liberdade residual de escolher a fase da função de onda, tomamos esta fase de modo a que h0|Ψ(λ)i seja real em qualquer ordem da expansão em λ. Com estas duas condições temos: • Ordem 0 : Dado que nesta ordem |Ψ(λ)i = |0i as duas condições traduzem-se em h0|0i = 1; isto é, o estado |0i está normalizado; • Ordem 1 : Nesta ordem |Ψ(λ)i = |0i + λ|1i; a normalização da função de onda, nesta ordem, significa 1 = (h0| + λh1|) (|0i + λ|1i) = h0|0i + λ (h0|1i + h1|0i) + O(λ2 ) ; (11.1.13) usando o resultado de ordem zero, obtemos h0|1i = −h0|1i∗ , ou seja, h0|1i é um imaginário puro. Por outro lado, a condição ii) implica que h0|Ψ(λ)i = h0|0i + λh0|1i = 1 + λh0|1i seja real, ou seja h0|1i tem de ser real. Logo h0|1i = h1|0i = 0 . (11.1.14) • Ordem 2 : Por um raciocı́nio análogo conclui-se que 1 h0|2i = h2|0i = − h1|1i . 2 (11.1.15) • Ordem n: Analogamente conclui-se que 1 h0|ni = hn|0i = − [hn − 1|1i + hn − 2|2i + . . . + h2|n − 2i + h1|n − 1i] . (11.1.16) 2 Para considerarmos em detalhe o efeito da perturabação Ŵ no espectro e vectores próprios de Ĥ0 consideremos separadamente os nı́veis de Ĥ0 degenerado e não degenerados. 11.1 Teoria das perturbações estacionárias 11.1.1 347 Perturbação de um nı́vel não degenerado Consideramos um nı́vel não degenerado de Ĥ0 , com valor próprio En0 e vector próprio associado |φn i. Vamos calcular o valor próprio de Ĥ, En (λ), e a funcão própria correspondente, |Ψn (λ)i, até segunda ordem em λ; ou seja, vamos calcular ǫ0 , ǫ1 , ǫ2 e |0i, |1i, |2i. Ordem 0 Em ordem 0, En (λ) = ǫ0 e |Ψn (λ)i = |0i, isto é, ignoramos a perturbação. A energia e estado correspondem aos de Ĥ0 ǫ0 = En0 , |0i = |φn i . (11.1.17) Ordem 1 Em ordem 1, En (λ) = ǫ0 + λǫ1 e |Ψn (λ)i = |0i + λ|1i. Para calcular ǫ1 projectamos a equação (11.1.10) em hφn | = h0|: hφn | Ĥ0 − ǫ0 |1i + hφn | V̂ − ǫ1 |0i = 0 ; dado que Ĥ0 |φn i = ǫ0 |φn i, o primeiro termo é zero; como |0i = |φn i está normalizado concluimos que ǫ1 = hφn |V̂ |φn i . (11.1.18) En (λ) = En0 + hφn |Ŵ |φn i + O(λ2 ) . (11.1.19) Logo, em primeira ordem A correcção de primeira ordem à energia de um nı́vel não degenerado |φn i é dada pelo valor esperado da perturbação nesse mesmo estado não perturbado |φn i. Para calcularmos o estado em primeira ordem em λ projectamos (11.1.10) em todos os outros estados próprios de Ĥ0 (que não |φn i), {|φip i}. Note-se que os outros nı́veis p 6= n podem ser degenerados, pelo que mantemos o ı́ndice i. Obtemos hφip | Ĥ0 − ǫ0 |1i + hφip | V̂ − ǫ1 |0i = 0 ; 348 Métodos perturbativos independentes e dependentes do tempo Como |φn i e |φip i para n 6= p são estados próprios associados a valores próprios distintos, hφip |φn i = 0; usando ainda que Ĥ0 |φip i = Ep0 |φip i obtemos hφip |V̂ |φn i , En0 − Ep0 hφip |1i = p 6= n . (11.1.20) Como hφn |1i = 0, por (11.1.14) temos todos os coeficientes da projecção de |1i na base de funções próprias de Ĥ0 . Logo |1i = dp XX p i=1 |φip ihφip |1i = dp XX hφip |V̂ |φn i p6=n i=1 En0 − Ep0 |φip i . (11.1.21) Consequentemente, em primeira ordem em λ, o estado próprio de Ĥ é |Ψn (λ)i = |φn i + dp XX hφip |Ŵ |φn i p6=n i=1 En0 − Ep0 |φip i + O(λ2 ) . (11.1.22) A correcção de primeira ordem ao estado próprio |φn i de Ĥ0 é uma mistura de todos os outros estados próprios de Ĥ0 , {|φip i}. A contribuição de um determinado estado |φip i para esta mistura é tanto maior quanto: i) maior for o elemento de matriz da perturbação entre este estado e o estado não perturbado; ii) mais próxima da energia do estado não perturbado for a energia deste estado. Podemos agora precisar o critério (11.1.2) relativo à validade do método perturbativo: 1) Por (11.1.19) requeremos que os elementos diagonais da perturbação sejam muito menores que os elementos diagonais de Ĥ0 correspondentes |hφn |Ŵ |φn i| ≪ |En0 | ; (11.1.23) 2) Por (11.1.22) requeremos que os elementos não diagonais da perturbação sejam muito menores que as diferenças entre os valores próprios de Ĥ0 correspondentes aos estados em questão |hφip|Ŵ |φn i| ≪ |En0 − Ep0 | . (11.1.24) 11.1 Teoria das perturbações estacionárias 349 Ordem 2 Em ordem 2, En (λ) = ǫ0 + λǫ1 + λ2 ǫ2 e |Ψn (λ)i = |0i + λ|1i + λ2 |2i. Para calcular ǫ2 projectamos a equação (11.1.11) em hφn | = h0|: hφn | Ĥ0 − ǫ0 |2i + hφn | V̂ − ǫ1 |1i − ǫ2 hφn |0i = 0 . (11.1.25) Tal como em ordem 1, o primeiro termo é zero; por (11.1.14), hφn |1i = 0 e usando hφn |0i = 1 temos1 ǫ2 = hφn |V̂ |1i (11.1.21) = p6=n i=1 Logo, em segunda ordem em λ: En (λ) = En0 + hφn |Ŵ |φn i + dp XX |hφip|V̂ |φn i|2 En0 − Ep0 dp XX |hφip |Ŵ |φn i|2 p6=n i=1 En0 − Ep0 , + O(λ3 ) . (11.1.26) (11.1.27) Nesta ordem, a contribuição do estado |φip i para o valor próprio da energia do estado não perturbado |φn i, devida à perturbação Ŵ , é tanto maior quanto: i) maior for o acoplamento hφip |Ŵ |φn i; ii) mais próximas forem as energias Ep0 e En0 . Quanto maiores forem estas contribuições mais os estados |φn i e |φip i se repelem. Para calcularmos o estado em segunda ordem em λ projectamos (11.1.11) em todos os outros estados próprios de Ĥ0 (que não |φn i), {|φip i}. Obtemos hφip | Ĥ0 − ǫ0 |2i + hφip | V̂ − ǫ1 |1i + ǫ2 hφip |0i = 0 ; Como |φn i e |φip i para n 6= p são estados próprios associados a valores próprios distintos, hφip |φn i = 0 e o último termo é zero; usando ainda que Ĥ0 |φip i = Ep0 |φip i obtemos hφip | V̂ − ǫ1 |1i , n= 6 p. (11.1.28) hφip |2i = En0 − Ep0 Expandindo |2i na base própria de Ĥ0 , |2i = 1 dp XX p i=1 hφip |2i|φipi = dp XX p6=n i=1 hφip |2i|φipi + hφn |2i|φn i , Note-se que, para conhecer a energia em segunda ordem necessitamos do estado em primeira ordem. Genericamente, para conhecermos a energia em ordem n necessitamos do estado até ordem n − 1. 350 Métodos perturbativos independentes e dependentes do tempo e usando (11.1.28) e a relação (11.1.15) temos dp hφi | V̂ − ǫ XX p 1 |1i h1|1i |φip i − |φn i . |2i = 0 0 En − Ep 2 p6=n i=1 (11.1.29) Usando agora (11.1.21) e (11.1.18), obtemos uma relação explı́cita para |2i em função de elementos de matriz da perturbação na base |φim i: dp dp dm XX XX XX hφip |V̂ |φn ihφn |V̂ |φn i i hφip |V̂ |φjm i hφjm |V̂ |φn i i |φ i − |2i = |φp i p 0 En0 − Ep0 En0 − Em (En0 − Ep0 )2 p6=n i=1 p6=n i=1 m6=n j=1 d p 1 X X |hφip|V̂ |φn i|2 − |φn i 2 p6=n i=1 (En0 − Ep0 )2 . (11.1.30) Logo, em segunda ordem em λ, o estado próprio de Ĥ é ! dp 1 X X |hφip |Ŵ |φn i|2 |Ψn (λ)i = 1 − |φn i 2 p6=n i=1 (En0 − Ep0 )2 ! dp XX hφip |Ŵ |φn i hφn |Ŵ |φn i + 1− |φip i 0 − E0 0 − E0 E E n p n p p6=n i=1 (11.1.31) dp dm XX XX hφip |Ŵ |φjm i hφjm |Ŵ |φn i i + |φp i + O(λ3 ) . 0 0 0 0 En − Ep En − Em p6=n i=1 m6=n j=1 Ordem de grandeza do erro numa aproximação de primeira ordem Se decidirmos truncar a expansão de En (λ) e |Ψ(λ)i em primeira ordem em λ, podemos ter uma ideia do erro envolvido no cálculo majorando o termo da energia de ordem 2. 0 0 Seja Em a energia mais próxima de En0 no espectro de Ĥ0 . Denotemos ∆E ≡ |En0 −Em |. Logo |En0 − Ep0 | ≥ ∆E , ∀p6=n . Podemos assim majorar o termo ǫ2 usando a expressão (11.1.26): # " dp dp XX 1 1 XX i |hφp|V̂ |φn i|2 = |ǫ2 | ≤ |φip ihφip | V̂ |φn i hφn |V̂ ∆E p6=n i=1 ∆E p6=n i=1 2 1 1 2 hφn |V̂ |φn i − hφn |V̂ |φn i . hφn |V̂ 1̂ − |φn ihφn | V̂ |φn i = = ∆E ∆E (11.1.32) (11.1.33) 11.1 Teoria das perturbações estacionárias 351 Logo |λ2 ǫ2 | ≤ (∆Ŵ )2 , ∆E (11.1.34) onde ∆Ŵ é o desvio padrão da perturbação no estado não perturbado. Logo, em ordem 1, a correcção à energia é o valor médio da perturbação no estado não perturbado e o erro é estimado usando o desvio padrão da perturbação nesse mesmo estado. 11.1.2 Perturbação a um nı́vel degenerado Consideremos agora um nı́vel degenerado de Ĥ0 , com valor próprio En0 e grau de degenerescência dn , 1 < dn < +∞. Seja En0 o sub-espaço vectorial gerado pelos vectores próprios de Ĥ0 associados a En0 , {|φin i}. Neste caso vamos limitar a nossa análise à primeira ordem nos valores próprios e ordem zero nos vectores próprios. Ordem 0 Em ordem 0, En (λ) = ǫ0 e |Ψn (λ)i = |0i. Claramente ǫ0 = En0 , |0i = dn X i=1 ci |φin i , onde dn X i=1 |ci |2 = 1 . (11.1.35) Note-se que existe uma indefinição na escolha de |0i, devida à degenerescência do nı́vel em análise. Essa indefinição será levantada em ordens superiores, caso a degenerescência também o seja. Ordem 1 Em ordem 1, En (λ) = ǫ0 +λǫ1 e |Ψn (λ)i = |0i+λ|1i. Para calcular ǫ1 e simultaneamente |0i, projectamos a equação (11.1.10) em hφin |. Por uma análise analoga ao caso não degenerado obtemos hφin |V̂ |0i = ǫ1 hφin |0i . (11.1.36) Inserindo a relação de fecho, dp XX p j=1 hφin |V̂ |φjp ihφjp|0i = ǫ1 hφin |0i . (11.1.37) 352 Métodos perturbativos independentes e dependentes do tempo Por (11.1.35), o termo hφjp |0i só é diferente de zero para p = n; logo dn X j=1 hφin |V̂ |φjn ihφjn |0i = ǫ1 hφin |0i . (11.1.38) Escrevendo os elementos de matriz hφin |V̂ |φjn i ≡ Vnij e usando (11.1.35), esta equação reescreve-se Vnij cj = ǫ1 ci ⇔ V̂n |0i = ǫ1 |0i . (11.1.39) Isto é, para calcular os valores próprios em ordem 1 e simultaneamente o vector próprio em ordem zero, de Ĥ(λ), correspondentes à perturbação de um nı́vel degenerado En0 , temos de diagonalizar a perturbação V̂ no sub-espaço En0 associado a En0 . Cada estado em En0 pode ter uma correcção diferente na energia por acção da perturbação; isto é, em primeira ordem En,j (λ) = En0 + λǫj1 , j = 1, . . . , fn(1) ≤ dn , (11.1.40) onde os vários ǫj1 são obtidos resolvendo a equação caracterı́stica (11.1.39), correspondendo (1) o ı́ndice j ao número de soluções distintas, num total de (em primeira ordem) fn , que necessariamente não irá exceder a dimensão do sub-espaço vectorial degenerado, dn . Relativamente ao vector próprio |0i, existem duas possibilidades: • Se a perturbação levantar totalmente a degenerescência de En0 em primeira ordem, i.e. (1) fn = dn , o vector próprio |0i é unicamente determinado pela equação caracterı́stica (11.1.39). Neste caso existe um único vector próprio de Ĥ(λ) em ordem zero com valor próprio En0 + λǫj1 em ordem 1. • Se a perturbação não levantar totalmente a degenerescência de En0 em primeira ordem, (1) i.e. fn < dn , o vector próprio |0i não é unicamente determinado pela equação caracterı́stica (11.1.39); para cada energia En0 + λǫj1 , em primeira ordem, |0i pertence a um espaço vectorial cuja dimensão é a degenerescência En0 + λǫj1 em ordem 1. 11.1.3 Perturbações X̂, X̂ 2 e X̂ 3 a um potencial harmónico Vamos agora ilustrar o formalismo estudado considerando perturbações do tipo X̂, X̂ 2 e X̂ 3 num potencial harmónico um dimensional. No primeiro e segundo caso, o problema com a 11.1 Teoria das perturbações estacionárias 353 perturbação é ainda exactamente solúvel, pelo que podemos testar o método perturbativo comparando-o com a solução exacta. O terceiro caso não tem solução exacta, mas é de interesse prático, pois um termo do tipo X̂ 3 é o primeiro termo não harmónico na expansão de Taylor de um potencial arbitrário em torno de um ponto estacionário. Note que o espectro de Ĥ0 será não degenerado. Perturbação por um potencial linear Seja Ĥ0 o Hamiltoniano do oscilador harmónico em uma dimensão (5.1.1) Ĥ0 = mω 2 2 P̂ 2 X̂ . + 2m 2 (11.1.41) O seu espectro é En0 = 1 n+ 2 n ∈ N0 , ~ω, (11.1.42) e o conjunto de funções próprias normalizadas é denotado, tal como no capı́tulo 5, {|Φn i}. Consideramos a perturbação √ Ŵ = λ m~ω 3 X̂ . (11.1.43) Analisemos primeiro a solução exacta. O Hamiltoniano total Ĥ(λ) = Ĥ0 + Ŵ pode ser escrito mω 2 P̂ 2 + Ĥ(λ) = 2m 2 X̂ + λ r !2 ~ ω~ 1̂ − λ2 1̂ . mω 2 Concluimos imediatamente que o espectro de Ĥ é 1 − λ2 En (λ) = n + ~ω, 2 n ∈ N0 . (11.1.44) (11.1.45) Para calcularmos as novas funções próprias notamos que o efeito da perturbação consiste, para além da adição de uma energia ao Hamiltoniano, numa translação r ~ X̂ → X̂ + λ 1̂ . mω O Hamiltoniano Ĥ(λ) é ainda um problema harmónico canónico (a menos da soma de uma energia) quando interpretado em termos da posição transladada, dado que o operador momento pode ainda ser interpretado como o momento canónico conjugado da posição 354 Métodos perturbativos independentes e dependentes do tempo transladada. Recordamos que o operador translação foi definido no Problema 8 da folha de problemas 5, como sendo T̂∆x , com acção T̂∆x f (x) = f (x + ∆x) , (11.1.46) e com representação T̂∆x = ei∆xP̂ /~ . (11.1.47) p p Usando ∆x = λ ~/mω e, de (5.1.4), P̂ = −i mω~/2(â − ↠), obtemos, em termos de operadores de criação e destruição √ † )/ T̂∆x = eλ(â−â 2 . (11.1.48) Logo, as funções próprias de Ĥ(λ), |Ψn (λ)i, podem ser obtidas pela acção da translação em |Φn i: √ † )/ |Ψn (λ)i = eλ(â−â 2 |Φn i , ou, usando (5.1.30), (5.1.31) e expandindo a exponencial em série de Taylor, r r n n+1 |Φn−1 i − λ |Φn+1 i + O(λ2 ) . |Ψn (λ)i = |Φn i + λ 2 2 (11.1.49) (11.1.50) Vamos agora usar a teoria de perturbações estacionárias para reproduzir os resultados (11.1.45) e (11.1.50). Começamos por escrever a perturbação Ŵ em termos dos operadores de destruição e criação, usando (5.1.4): r ~ X̂ = (â + ↠) 2mω ⇒ ~ω Ŵ = λ √ (â + ↠) . 2 (11.1.51) Claramente, a perturbação mistura o estado |Φn i apenas com |Φn−1 i e |Φn+1 i; os únicos elementos de matriz da perturbação não nulos são r r n+1 n hΦn+1 |Ŵ |Φn i = λ~ω , hΦn−1 |Ŵ |Φn i = λ~ω . 2 2 Logo, usando (11.1.27), En (λ) em ordem 2 é ~ω 1 − λ2 + O(λ3 ) . En (λ) = ~ω n + 2 2 (11.1.52) (11.1.53) 11.1 Teoria das perturbações estacionárias 355 Nesta ordem obtemos o resultado exacto (11.1.45); pode-se demonstrar que todos os termos de ordem superior a 2 são de facto zero. Usando (11.1.22) obtemos r r n n+1 |Φn−1 i − λ |Φn+1 i + O(λ2 ) , |Ψn (λ)i = |Φn i + λ 2 2 (11.1.54) em acordo com (11.1.50) nesta ordem. Perturbação por um potencial quadrático Perturbamos agora (11.1.41) por um potencial quadrático Ŵ = λ mω 2 2 X̂ . 2 (11.1.55) Obviamente, o Hamiltoniano total é o de um oscilador harmónico canónico com frequência √ ω 1 + λ. Como tal, o espectro de energias é λ λ2 1 En (λ) = ~ω n + 1+ − + ... . (11.1.56) 2 2 8 Podemos também relacionar os operadores de criação e destruição na presença da perturbação e na ausência da perturbação. Como a relação entre eles é complexa, vamos restringir a nossa análise ao espectro. Para usarmos a teoria de perturbações escrevemos a perturbação em termos de operadores de criação e destruição, Ŵ = λ ~ω (↠)2 + â↠+ ↠â + (â)2 , 4 de onde se conclui que os elementos de matriz não nulos são λ~ω 1 hΦn |Ŵ |Φn i = n+ , 2 2 λ~ω p λ~ω p hΦn+2 |Ŵ |Φn i = (n + 1) (n + 2) , hΦn−2 |Ŵ |Φn i = n (n − 1) . 4 4 (11.1.57) (11.1.58) Logo, usando (11.1.27), En (λ) em ordem 2 é 2 2 (n + 1)(n + 2) n(n − 1) λ~ω 1 λ~ω λ~ω 1 + n+ − + En (λ) = ~ω n + 2 2 2 4 2~ω 4 2~ω 2 1 λ λ = ~ω n + 1+ − + . . . + O(λ3 ) , 2 2 8 (11.1.59) em acordo com o cálculo exacto (11.1.56). 356 Métodos perturbativos independentes e dependentes do tempo Perturbação por um potencial cúbico Perturbamos agora (11.1.41) por um potencial cúbico r m3 ω 5 3 X̂ . Ŵ = λ ~ (11.1.60) No problema clássico, x(t) deixa de ser sinusoidal, aparecendo uma série de harmónicos da frequência fundamental; o perı́odo deixa de ser independente da energia e o movimento deixa de ser simétrico relativamente à origem. Relativamente ao problema quântico começamos por exprimir a perturbação em termos de operadores de criação e destruição. Usando (11.1.51) obtemos, usando as relações de comutação entre â, ↠e o operador de número N̂ = ↠â, ~ω Ŵ = λ √ â3 + (↠)3 + 3N̂ ↠+ 3(N̂ + 1)â . 8 (11.1.61) Com esta forma é simples concluir que os únicos elementos de matriz não nulos para a perturbação são λω~ p λω~ p hΦn+3 |Ŵ |Φn i = √ (n + 1)(n + 2)(n + 3) , hΦn−3 |Ŵ |Φn i = √ n(n − 1)(n − 2) , 8 8 3λω~ 3λω~ hΦn+1 |Ŵ |Φn i = √ (n + 1)3/2 , hΦn−1 |Ŵ |Φn i = √ n3/2 . 8 8 (11.1.62) Usando (11.1.27), verificamos que a contribuição de primeira ordem para En (λ) é zero; levando em conta a contribuição de segunda ordem obtemos 2 15 2 1 7 1 − λ ω~ n + − λ2 ω~ + O(λ3 ) . En (λ) = ~ω n + 2 4 2 16 (11.1.63) Em segunda ordem, a perturbação diminui a energia de todos os nı́veis. Quanto mais elevado for o nı́vel maior a diminuição de energia. Note-se que, como tal, nı́veis consecutivos já não são equidistantes. Usando (11.1.22) obtemos, para os estados de Ĥ, em primeira ordem, r r λ (n + 1)(n + 2)(n + 3) λ n(n − 1)(n − 2) |Ψn (λ)i = |Φn i − |Φn+3 i + |Φn−3 i 3 8 3 8 r r n3 (n + 1)3 |Φn−1 i − 3λ |Φn+1 i + O(λ2 ) . +3λ 8 8 (11.1.64) 11.1 Teoria das perturbações estacionárias 357 O efeito da perturbação é misturar o estado |Φn i com os estados |Φn+3 i, |Φn−3 i, |Φn+1 i e |Φn−1 i. 11.1.4 Estrutura fina do átomo de Hidrogénio Como aplicação da teoria de perturbações estacionárias vamos estudar a estrutura fina e hiperfina2 do átomo de Hidrogénio. Como discutido na secção 9.2, o Hamiltoniano usado para descrever o átomo de Hidrogénio no capı́tulo 6, Ĥ0 , é apenas aproximado, dado que negligencia todos os efeitos relativistas, em particular os efeitos magnéticos e de spin, para além de não considerar o spin nuclear. Estes efeitos são necessários para explicar os espectros observados; de facto, embora conduzam a apenas pequenas alterações do espectro estudado no capı́tulo 6, a enorme precisão da espectroscopia evidencia claramente estas alterações. Sendo pequenas podemos usar teoria de perturbações para as estudar. O Hamiltoniano de estrutura fina O Hamiltoniano de estrutura fina pode ser obtido directamente da equação de Dirac. Embora esta equação possa ser resolvida exactamente para um potencial de Coulomb, é instrutivo considerar uma análise perturbativa, que evidencia a interpretação fı́sica de cada um dos termos no problema. O operador Hamiltoniano que descreve o átomo de Hidrogénio, incluindo os termos responsáveis pela estrutura fina, toma a seguinte forma: Ĥ = me c2 1̂ + Ĥ0 + Ŵmv + ŴSO + ŴD . (11.1.65) Consideremos os vários termos individualmente: • me c2 é a energia associada à massa em repouso do electrão; • Ĥ0 é o Hamiltoniano considerado no capı́tulo 6; este leva apenas em conta o termo cinético não relativista e o potencial de Coulomb Ĥ0 = 2 1 e2 P̂ 2 − . 2me 4πǫ0 r A estrutura hiperfina será descrita nas aulas teórico-práticas se houver tempo para tal. (11.1.66) 358 Métodos perturbativos independentes e dependentes do tempo Note-se, que neste termo, o facto de a massa do protão ser finita pode ser levado em consideração substituindo me pela massa reduzida do sistema protão-electrão µ. • Ŵmv é a primeira correcção relativista ao termo cinético: Ŵmv = − P̂ 4 . 8m3e c2 (11.1.67) Este termo é fácil de obter considerando a expressão relativista para a energia s p p~2 ~p2 p~4 2 2 2 2 2 E = c p~ + me c = me c 1 + 2 2 = me c 1 + − + ... ; me c 2m2e c2 8m4e c4 (11.1.68) os três primeiros termos me c2 , p ~2 2me 4 e − 8mp~3 c2 , correspondem a três dos termos pree sentes em (11.1.65): a energia correspondente à massa em repouso, o termo cinético não relativista presente em Ĥ0 e a primeira correcção relativista à energia cinética que resulta da variação da massa com a velocidade. Para estimarmos a ordem de magnitude relativa entre Ŵmv e Ĥ0 estimamos o último pelo termo cinético: |Ŵmv | |Ĥ0 | = |~ p4 | 8m3e c2 |~ p2 | 2me v 2 |~p2 | ∼ α2 ≃ ∼ 2 2 ∼ me c c 1 137 2 , (11.1.69) onde usamos a relação (9.2.2). Como as energias do espectro não perturbado são da ordem de |Ĥ0 | ∼ 10 eV , a perturbação será da ordem de |Ŵmv | ∼ 10−3 eV , o que justifica o uso de teoria de perturbações. • ŴSO é o acoplamento spin-órbita: ŴSO = 1 dV (R̂) ~ ~ L̂ · Ŝ . 2m2e c2 R̂ dR̂ (11.1.70) A origem fı́sica deste termo pode ser compreendida pela seguinte análise clássica: o electrão move-se com velocidade ~v no campo eléctrico do protão. Logo vê um campo magnético que pode ser estimado pela transformação de Lorentz do campo ~ electrostático do protão E ~ ′ ≃ − ~v × E ~ . B c2 (11.1.71) 11.1 Teoria das perturbações estacionárias 359 Como o electrão tem um dipolo magnético que resulta do seu spin, existe uma interação do tipo ′ WSO ~v 1 dV ~r e ~ ′ ~ S · − 2× − . = −~µS · B = − 2 2me c e dr r (11.1.72) ~ obtemos Usando a definição clássica de momento angular me~v × ~r = −L ′ WSO = 1 m2e c2 r dV ~ ~ L·S . dr (11.1.73) A menos de um factor de 1/2, este é o acoplamento spin-órbita. O factor de 1/2 é devido à nossa estimativa do campo magnético produzido pelo núcleo assumir um movimento rectilı́neo, o que não acontece. O movimento não rectilı́neo origina uma precessão do spin electrónico - Precessão de Thomas; quando levada em consideração o factor de 1/2 surge naturalmente. Estimemos agora a ordem de grandeza deste termo, relativamente a Ĥ0 , usando para este último o termo potencial, estimando ~ ∼~, L ~ ∼~, S temos |ŴSO | |Ĥ0 | = r ∼ a0 = e2 ~2 8πǫ0 m2e c2 a30 e2 4πǫ0 a0 ~ , cme α ∼ dV e2 , ∼ dr 4πǫ0 a20 ~2 ∼ α2 . m2e c2 a20 (11.1.74) Este termo é, portanto, da ordem da mesma ordem de grandeza de Ĥmv . • ŴD é o termo de Darwin: ŴD = ~2 ∆V (R̂) . 8m2e c2 (11.1.75) A origem fı́sica deste termo pode ser compreendida da seguinte maneira. Na equação de Dirac a interacção entre o campo do núcleo e o electrão é local, isto é, o electrão é afectado pelo potencial no ponto onde se encontra, ~r. Na aproximação não relativista, no entanto, a expansão em v/c origina uma interacção não local, isto é, o electrão é afectado pelo campo do protão num certo volume, centrado em ~r. Esse volume é da 360 Métodos perturbativos independentes e dependentes do tempo ordem de (~/me c)3 , onde λ = ~/mc é o comprimento de onda de Compton.3 Assim, a energia potencial não é apenas V (~r), mas toma a forma Z Energia potencial ∼ d3 ρf (ρ)V (~r + ρ) , (11.1.76) onde a função f (ρ) tem as seguintes propriedades: i) depende apenas de |ρ|, dado que o potencial tem simetria esférica; ii) tem suporte num volume da ordem de (~/me c)3 , R centrado em ρ = 0; iii) d3 ρf (ρ) = 1. Considerando uma expansão em série de Taylor, de V (~r + ρ) e notando que o integral do termo de ordem um é nulo devido à simetria esférica obtemos que a energia potencial fica Z ρ2 3 d ρf (ρ) V (~r) + ∆V (~r) + . . . . 2 (11.1.77) O primeiro termo é o termo potencial de Ĥ0 ; o segundo termo tem a forma Z ∆V (~r) d3 ρρ2 f (ρ) ∼ ∆V (~r)(~/me c)2 , que, a menos de um factor numérico tem a forma do termo de Darwin. Para estimar a ordem de grandeza do termo de Darwin relativamente a Ĥ0 notamos que, usando (10.2.7) o termo pode ser reescrito ~2 e2 ~2 e2 1 ŴD = − 2 2 = ∆ δ(R̂) . 8me c (4πǫ0 ) 8m2e c2 ǫ0 R̂ (11.1.78) O valor esperado deste operador num estado próprio de Ĥ0 é hŴD i = ~2 e2 |Ψ(0)|2 . 8m2e c2 ǫ0 (11.1.79) Imediatamente concluimos que o termo de Darwin só afecta electrões em orbitais s, pois de acordo com os resultados do capı́tulo 6 (ver por exemplo tabela na secção 3 Uma maneira de pensar neste comprimento de onda é a seguinte: tal como o comprimento de onda de de Broglie de uma partı́cula de massa m e com velocidade v, λdB = ~/mv nos dá a escala na qual o carácter ondulatório de uma partı́cula quântica não pode ser negligenciado, o comprimento de onda de Compton da mesma partı́cula λC = ~/mc dá-nos uma escala para a qual os efeitos relativistas não podem, igualmente, ser negligenciados. Claramente λC < λdB . Na teoria de Dirac, a origem fı́sica do termo de Darwin é um fenómeno denominado zitterbewegung que consiste no facto de que o electrão não se move suavemente, mas sofre flutuações de pequena escala (da ordem de λC ) extremamente rápidas; assim, ao fazermos uma expansão em v/c o electrão vê efectivamente o potencial de Coulomb do núcleo espalhado por uma vizinhança da ordem de λC . 11.1 Teoria das perturbações estacionárias 361 6.4, ou expressão (7.2.63)) estas são as únicas para as quais Ψ(0) 6= 0. Como |Ψ(0)|2 é uma densidade de probabilidade estimamos o seu valor por |Ψ(0)|2 ∼ 1/a30 . Logo |ŴD | |Ĥ0 | = e2 ~2 8m2e c2 a30 ǫ0 p2 2me ∼ me c2 α4 ∼ α2 , me c2 α2 (11.1.80) tal como para os termos anteriores. A estrutura fina do nı́vel N = 2 Vamos exemplificar o efeito da perturbação a Ĥ0 dada em (11.1.65) calculando a estrutura fina do nı́vel N = 2 do átomo de Hidrogénio.4 Recordamos que o espectro deste átomo (6.4.23) depende apenas do número quântico principal 0 EN =− ~2 1 me c2 2 = − α . 2me a20 N 2 2N 2 (11.1.81) Assim, o nı́vel 2s (N = 2, ℓ = 0) e o nı́vel 2p (N = 2, ℓ = 1) têm a mesma energia, dada por E20 me c2 2 =− α . 8 (11.1.82) Para além desta degenerescência, concluimos no capı́tulo 6, que o nı́vel p é ele próprio degenerado, pois o momento angular ℓ = 1 pode ter momento angular azimutal descrito por mℓ = −1, 0, 1. Mas no capı́tulo 6 foi negligenciado o spin. Considerando também o spin, quer do electrão quer do protão, cado um dos 4 nı́veis anteriores tem uma degenerescência adicional de 4. Assim, uma base para o espaço de estados de cada uma das orbitais será: • Orbital 2s: {|N = 2, ℓ = 0, mℓ = 0, mS = ±; mI = ±i}; onde mS refere-se ao spin electrónico e mI ao spin do protão; • Orbital 2p: {|N = 2, ℓ = 1, mℓ = −1, 0, 1, mS = ±; mI = ±i}. A degenerescência total do nı́vel N = 2 é então 4 + 12 = 16. De acordo com os resultados vistos na secção 11.1 para perturbações de um nı́vel degenerado, necessitamos de diagonalizar a perturbação Ŵ neste sub-espaço 16 dimensional. Os 4 Nota: Para o nı́vel N = 1 a perturbação associada à estrutura fina produz apenas uma correcção global ao nı́vel e não levanta a degenerescência. Assim é mais interessante estudar o nı́vel N = 2. 362 Métodos perturbativos independentes e dependentes do tempo valores próprios nesta diagonalização serão as correcções de primeira ordem das energias; os vectores próprios correspondentes serão os vectores próprios de ordem zero. Consideremos então a perturbação Ŵf = Ŵmv + ŴSO + ŴD , (11.1.83) que será responsável pela chamada “estrutura fina”. O cálculo desta estrutura é facilitado pelas duas seguintes observações: i) Dado que esta perturbação não actua no spin do protão, este grau de liberdade pode ser ignorado para a estrutura fina. Assim sendo, a dimensão do espaço degenerado associado a N = 2 reduz-se efectivamente a 8; ii) A perturbação comuta com o momento angular total, [L̂2 , Ŵf ] = 0. De facto L̂2 comuta com Ŵmv pois [L̂2 , P̂ 2] = 0 ⇒ [L̂2 , P̂ 4 ] = 0 ; L̂2 comuta com ŴSO pois [L̂2 , f (R̂)] = 0 , ~ [L̂2 , L̂] = 0 , ~ [L̂2 , Ŝ] = 0 , onde f (R̂) é uma função arbitrária de R̂; devido à primeira relação na última equação L̂2 comuta com ŴD . Logo, Ŵf não mistura estados 2s com estados 2p e a matriz de 8 × 8 que representa Ŵf parte-se numa matriz de 2 × 2 que actua nos estados 2s e uma matriz de 6 × 6 que actua nos estados 2p. De facto é fácil verificar que Ŵf é um operador par e como tal não poderia misturar estados com paridade diferente, como é o caso de estados s e estados p. Consideramos seguidamente e separadamente as representações matriciais de Ŵf que actuam em estados 2s e estados 2p. Estrutura fina para o nı́vel 2s Consideramos a base {|N, ℓ, mℓ , mS i = |2, 0, 0, ±i}. Ŵmv e ŴD não actuam no grau de liberdade de spin, mS . Logo estes operadores são proporcionais ao operador identidade no espaço de spin. Os coeficientes de proporcionalidade serão dados por elementos de matriz puramente orbitais, respectivamente, hŴmv i2s = − 1 h2, 0, 0|P̂ 4|2, 0, 0i , 8m3e c2 hŴD i2s = ~2 h2, 0, 0|∆V (R̂)|2, 0, 0i . 8m2e c2 (11.1.84) 11.1 Teoria das perturbações estacionárias 363 Por outro lado, os elementos de matriz de ŴSO são nulos; de facto hŴSO i2s ∝ h2, 0, 0, ±|L̂x,y,z |2, 0, 0, ±i = 0 , pois qualquer componente do momento angular tem valor esperado nulo no harmónico esférico com ℓ = 0 = mℓ . Assim, o efeito dos termos de estrutura fina nos estados 2s é alterar a sua energia para E2s = − me c2 2 α + hŴmv i2s + hŴD i2s . 8 (11.1.85) Calculemos explicitamente estes elementos de matriz. Para calcular hŴmv i2s notamos que Ĥ0 = P̂ 2 + V (R̂) 2me ⇒ P̂ 2 = 2me (Ĥ0 − V (R̂)) . Logo 2 4m2e e4 2E20 e2 1 1 1 0 2 hŴmv i2s = − 3 2 h Ĥ0 − V (R̂) i2s = − (E2 ) + h i2s + h i2s . 8me c 2me c2 4πǫ0 R̂ (4πǫ0 )2 R̂2 (11.1.86) Para calcular os valores esperados h1/R̂n i2s , recordamos que a parte radial da função de onda do estado 2s é (6.4.33) 2 f(2,0) (r) = (2a0 )3/2 r e−r/2a0 . 1− 2a0 (11.1.87) Como tal h 1 R̂n i2s = Z +∞ 0 Notando que 1 , 2 2 r 4 r 4a0 1− e−r/a0 n dr = 1 3 (2a0 ) 2a0 r , 4a20 a0 ≡ 4πǫ0 ~2 , me e2 a0 α = n=1, (11.1.88) n=2. ~ , me c obtemos me c2 α4 1 13 1 1 hŴmv i2s = − =− − + me c2 α4 . 2 64 16 4 128 (11.1.89) Para calcular hŴD i2s recordamos (11.1.79); logo hŴD i2s = ~2 e2 1 4 me c2 α4 ~2 e2 2 |Ψ(0) | = = , 2s 8m2e c2 ǫ0 8m2e c2 ǫ0 4π (2a0 )3 16 (11.1.90) 364 Métodos perturbativos independentes e dependentes do tempo √ onde usamos (11.1.87) bem como o harmónico esférico Y00 = 1/ 4π. Finalmente podemos juntar os resultados e concluir que a energia dos estados 2s, levando em conta a perturbação da estrutura fina é 2 5 4 α 6 2 + α + O(α ) . E2s = −me c 8 128 (11.1.91) Estrutura fina para o nı́vel 2p Os termos Ŵmv e ŴD não actuam nas variáveis de spin e comutam com as várias ~ componentes de L̂. Logo, no sub-espaço associado aos 6 nı́veis 2p (ignorando o spin do protão), os termos Ŵmv e ŴD serão proporcionais ao operador identidade neste espaço. Para ŴD a constante de proporcionalidade é zero, dado que este termo tem valor esperado não nulo apenas em órbitais s: hŴD i2p = 0 . (11.1.92) O valor de hŴmv i2p pode ser calculado de um modo análogo a hŴmv i2s ; para este cálculo necessitamos da função radial para a orbital 2p que é dada por f(2,1) (r) = 1 r −r/2a0 √ e , (2a0 )3/2 3 a0 (11.1.93) com a qual se conclui que 1 1 h i2p = , 4a0 R̂ h 1 R̂2 i2p = 1 . 12a20 (11.1.94) Usando uma fórmula análoga a (11.1.86) com 2s substituido por 2p obtem-se que hŴmv i2p = − 7 me c2 α4 . 384 (11.1.95) Consideramos agora o termo de spin-órbita. Temos de calcular elementos de matriz do tipo 1 e2 1 ~ ~ hN = 2, ℓ = 1, s = , m′ℓ , m′S | L̂ · Ŝ|N = 2, ℓ = 1, s = , mℓ , mS i . (11.1.96) 2 2 8πǫ0 m2e c2 R̂3 Nestes elementos de matriz podemos separar a parte radial, usando a representação |~ri: e2 1 1 1 ~ ~ h i2p hℓ = 1, s = , m′ℓ , m′S |L̂ · Ŝ|ℓ = 1, s = , mℓ , mS i . 2 2 8πǫ0 me c R̂3 2 2 (11.1.97) 11.1 Teoria das perturbações estacionárias 365 Usando (11.1.93) conclui-se que h 1 R̂3 i2p = 1 , 24a30 de onde se conclui que os elementos de matriz sob consideração podem ser escritos 1 1 α4 ~ ~ me c2 hℓ = 1, s = , m′ℓ , m′S |L̂ · Ŝ|ℓ = 1, s = , mℓ , mS i . 2 48~ 2 2 (11.1.98) ~ ~ O problema reduz-se agora a diagonalizar o operador L̂· Ŝ neste espaço 6 dimensional, o que é automaticamente conseguido se usarmos uma base diferente. A base usada em (11.1.98), no espaço ℓ = 1, s = 1/2, é uma base própria de L̂2 , Ŝ 2 , L̂z e Ŝz . Se introduzirmos o momento angular total (tal como na secção 9.5) ~ˆ ~ ~ J = L̂ + Ŝ , (11.1.99) podemos introduzir a base própria dos operadores L̂2 , Ŝ 2 , Jˆ2 e Jˆz , 1 |ℓ = 1, s = , J, mJ i . 2 (11.1.100) A relação entre as duas bases é dada pelos coeficientes de Clebsch-Gordon, que nos permite traduzir entre elas sem dificuldade. Usando as regras de adição de momento angular, vistas na secção 9.5, J toma dois valores possı́veis: J = 1/2 e J = 3/2, com 2 e 4 valores de mJ associados, respectivamente. ~ ~ Mostramos agora que o operador L̂ · Ŝ está diagonalizado na base (11.1.100), tendo valor esperado diferente para diferentes valores de J. Para isso escrevemos Jˆ2 − L̂2 − Ŝ 2 ~ ~ ~ ~ , Jˆ2 = L̂2 + Ŝ 2 + 2L̂ · Ŝ ⇔ L̂ · Ŝ = 2 (11.1.101) ~ ~ o que demonstra que L̂·Ŝ pode ser escrito em termos de operadores que estão diagonalizados ~ ~ na base (11.1.100). Daqui resulta que é muito simples calcular os valores esperados de L̂ · Ŝ nesta base: 1 1 1 1 ~2 ~ ~ hℓ = 1, s = , J = , mJ |L̂ · Ŝ|ℓ = 1, s = , J = , mJ i = 2 2 2 2 2 3 3 −2− 4 4 = −~2 , (11.1.102) 366 Métodos perturbativos independentes e dependentes do tempo e 1 3 1 3 ~2 ~ ~ hℓ = 1, s = , J = , mJ |L̂ · Ŝ|ℓ = 1, s = , J = , mJ i = 2 2 2 2 2 15 3 −2− 4 4 ~2 . 2 (11.1.103) = Como afirmado anteriormente a correcção à energia irá depender de J, mas não de mJ . Esta é uma caracterı́stica genérica.5 Na notação dos espectroscopistas, introduzida na secção 6.4, adiciona-se por isso um sub-ı́ndice J à notação que tem vindo a ser usada. Assim, para os estados 2p existem agora os nı́veis 2p1/2 e 2p3/2 , enquanto que os estados 2s existe apenas o nı́vel 2s1/2 (tal como para o estado 1s existe apenas 1s1/2 ). O valor esperado nos nı́veis 2p1/2 e 2p3/2 da perturbação ŴSO é: hŴSO i2p1/2 = − α4 me c2 , 48 hŴSO i2p3/2 = α4 me c2 . 96 (11.1.106) Juntando os resultados (11.1.92), (11.1.95) e (11.1.106) obtemos os seguintes nı́veis de energia para os estados 2p: 2 2 α 7α4 α4 5α4 α 2 6 2 = −me c + + + + O(α ) , E2p1/2 = −me c 8 384 48 8 128 (11.1.107) que tem uma degenerescência 2. Curiosamente a correcção à energia devida a Ŵf é a mesma que para o nı́vel 2s1/2 (11.1.91). Esta degenerescência parece ser acidental, ao contrário da degenerescência em mJ que resulta da simetria esférica. No entanto, quando se considera a quantificação do campo electromagnético esta degenerescência é levantada pelo chamado desvio de Lamb; a energia do nı́vel 2s1/2 é então aumentada, relativamente à 5 De facto, a solução exacta, obtida da equação de Dirac, para a energia das orbitais do átomo de Hidrogénio é dada por EN,J = me c2 1 + N −J − 2 1 2 −1/2 α q 2 1 2 + (J + 2 ) − α2 , (11.1.104) onde se vê que existe apenas dependência em N e J. Fazendo uma expansão em potências de α obtém-se: α2 α4 N 3 6 + O(α ) . (11.1.105) EN,J = me c2 1 − − − 2N 2 2N 4 J + 21 4 Por exemplo, tomando N = 2, J = 1/2 obtém-se (11.1.91), que coincide com (11.1.107); tomando N = 2, J = 3/2, obtém-se (11.1.108). 11.1 Teoria das perturbações estacionárias 367 do nı́vel 2p1/2 por uma quantidade que é cerca de dez vezes menor que a separação entre os nı́veis 2p1/2 e 2p3/2 . O desvio de Lamb foi descoberto em 1949 e teve grande importância no desenvolvimento da Electrodinâmica Quântica. Para o nı́vel 2p3/2 obtem-se E2p3/2 = −me c 2 α2 7α4 α4 + − 8 384 96 = −me c 2 α2 α4 + + O(α6 ) 8 128 . (11.1.108) Note-se que a correcção ao nı́vel 2p3/2 é ligeiramente inferior à do nı́vel 2p1/2 , o que levanta parcialmente a degenerescência dos estados 2p. Como tal, se considerarmos a transição 2p −→ 1s, que corresponde à risca α da série de Lyman do espectro do hidrogénio (λ = 1216 ◦ A), esta risca, quando analisada com uma resolução suficiente, divide-se em duas riscas vizinhas 2p −→ 1s 1/2 1/2 2p −→ 1s , 2p −→ 1s 3/2 1/2 que estão separadas por uma energia 4me c2 α4 /128 - figura 11.1. O espectro do Hidrogénio apresenta, de facto, uma estrutura fina. Energia 2 −me c2 α8 “ 2 ” α4 −me c2 α8 + 128 −me c2 “ 4 α2 + 5α 8 128 ” |0,0,+i |0,0,−i |1,0,+i |1,0,−i |1,1,+i 2p3/2 2s1/2 |1,1,−i 2p3/2 |1,−1,+i |1,−1,−i 2p3/2 2p3/2 2s1/2 2p1/2 2p1/2 Figura 11.1: Nı́vel N = 2 do átomo de hidrogénio. As linhas sólidas representam o espectro de Ĥ0 , que tem degenerescência 8, correspondente aos 8 estados possı́veis |ℓ, mℓ , ms i para N = 2. As linhas a tracejado representam o espectro com as correcções da estrutura fina. Há um levantamento parcial da degenerescência que passa a ser 4+4. Note que os estados corrigidos correspondem a combinações lineares dos estados não perturbados. 368 11.2 Métodos perturbativos independentes e dependentes do tempo Teoria das Perturbações dependentes do tempo O objectivo principal da teoria das perturbações estacionárias é a determinação da energia dos estados estacionários. Contudo, existem situações em que essa não é a informação mais importante. Consideremos, por exemplo, um estado excitado de um átomo. Sabese, experimentalmente, que o sistema decai para o estado fundamental ao fim de algum tempo. Isso significa que, na presença do acoplamento ao campo de radiação, o estado excitado não é um estado estacionário do Hamiltoniano. Habitualmente o que interessa é determinar a probabilidade de transição para o estado fundamental do átomo e não os estados estacionários do sistema átomo mais campo electromagnético. É o cálculo deste tipo de probabilidades que iremos descrever nesta secção. 11.2.1 Formulação do problema Consideremos um sistema fı́sico com Hamiltoniano Ĥ0 , estados estacionários {|Φn i} e espectro de energias {En }: Ĥ0 |Φn i = En |Φn i . (11.2.109) Assumimos que o espectro é discreto e não degenerado, de modo a facilitar a exposição; tomando os estados estacionários como normalizados temos hΦn |Φn′ i = δnn′ , X n |Φn ihΦn | = 1̂ . (11.2.110) Note-se que Ĥ0 é independente do tempo, de modo a que os estados |Φn i sejam realmente estados estacionários. No instante t = 0, uma pequena perturbação dependente do tempo é aplicada ao sistema. O Hamiltoniano toma então a forma: Ĥ(t) = Ĥ0 + Ŵ (t) , Ŵ (t) = λV̂ (t) , (11.2.111) onde introduzimos a constante adimensional λ ≪ 1 e a observável V̂ (t), que pode ser explicitamente dependente do tempo e é da mesma ordem de magnitude do que Ĥ0 . A perturbação é zero para t < 0. 11.2 Teoria das Perturbações dependentes do tempo 369 Assumimos que o sistema se encontra inicialmente no estado |Φi i, que é um estado estacionário de Ĥ0 com valor próprio Ei . Depois de aplicada a perturbação Ŵ (t), em t = 0, o sistema evolui, pelo que |Φi i deixará de ser, em geral, um estado estacionário do Hamiltoniano perturbado. O nosso objectivo é calcular a probabilidade Pif (t), de encontrar o sistema num outro estado estacionário de Ĥ0 , |Φf i, no instante t. Ou seja, pretendemos estudar as transições entre estados estacionários do Hamiltoniano não perturbado, que podem ser induzidas pela perturbação Ŵ (t) - figura 11.2. |Φi i Pif (t) t=0 |Φi i −→ |Φf i Ĥ0 Ĥ0 + Ŵ (t) Figura 11.2: Transição entre dois estados estacionários de Ĥ0 induzida por uma perturbação Ŵ (t). Conceptualmente o problema é simples: entre os instantes 0 e t a evolução do sistema é descrita pela equação de Schrödinger i~ h i d |Ψ(t)i = Ĥ0 + λV̂ (t) |Ψ(t)i ; dt (11.2.112) como esta é uma equação diferencial de primeira ordem, impondo a condição inicial |Ψ(t = 0)i = |Φi i , (11.2.113) a solução é única. A probabilidade que pretendemos calcular é: Pif (t) = |hΦf |Ψ(t)i|2 . (11.2.114) Assim, matematicamente, o problema consiste em resolver a equação de Schrödinger (11.2.112) com a condição inicial (11.2.113), o que em geral terá de ser feito perturbativamente. 11.2.2 Solução aproximada da equação de Schrödinger Como o cálculo de (11.2.114) envolve explicitamente os estados estacionários de Ĥ0 , vamos utilizá-los como base, isto é, vamos expandir o estado do sistema |Ψ(t)i na representação {|Φn i}, |Ψ(t)i = X n cn (t)|Φn i , cn (t) = hΦn |Ψ(t)i . (11.2.115) 370 Métodos perturbativos independentes e dependentes do tempo Obviamente, o Hamiltoniano não perturbado é representado nesta base por uma matriz diagonal hΦn |Ĥ0 |Φm i = En δnm , (11.2.116) enquanto que a observável Ŵ (t) tem elementos de matriz hΦn |Ŵ (t)|Φm i = Wnm (t) = λVnm (t) . (11.2.117) Introduzindo na equação de Schrödinger (11.2.112) a relação de fecho h i X d X |Φk ihΦk |Ψ(t)i = |Φk i hΦk |Ĥ0 |Ψ(t)i + hΦk |λV̂ (t)|Ψ(t)i i~ dt k k X d Vkp (t)cp (t) . ⇔ i~ ck (t) = Ek ck (t) + λ dt p (11.2.118) Estas equações ordinárias diferenciais de primeira ordem acopladas (pelos elementos de matriz da perturbação Vkp ) permitem-nos determinar, perturbativamente, os coeficientes ck (t). Vejamos como. Primeiro observamos que se λV̂ (t) = 0, as equações deixam de estar acopladas. Neste caso a solução é muito simples: cn (t) = bn e−iEn t/~ , (11.2.119) onde bn são constantes que dependem das condições iniciais. Por exemplo, com a condição (11.2.113), teremos bi = 1 e bj = 0 para j 6= i. Se λV̂ (t) não for zero mas ainda assim for muito pequeno (i.e. λ ≪ 1 sendo os elementos de matriz de V̂ (t) da ordem dos de Ĥ0 ), a solução deverá ser ainda próxima de (11.2.119). Tomamos como forma para esta solução cn (t) = bn (t)e−iEn t/~ , (11.2.120) e esperamos que bn (t) sejam funções que variam lentamente com o tempo. Inserindo (11.2.120) em (11.2.118) obtemos X d bn (t) e−iEn t/~ = λ Vnp (t)bp (t)e−iEp t/~ . i~ dt p (11.2.121) 11.2 Teoria das Perturbações dependentes do tempo 371 Multiplicando ambos os lados por eiEn t/~ e introduzindo a frequência angular de Bohr : ωnp = En − Ep , ~ X (11.2.122) obtemos i~ d bn (t) dt =λ Vnp (t)bp (t)eiωnp t . (11.2.123) p Este sistema de equações é rigorosamente equivalente à equação de Schrödinger, dado que ainda não introduzimos qualquer aproximação. Mas como em geral não conseguimos encontrar uma solução exacta de (11.2.123), teremos de recorrer a métodos de aproximação. Dado que λ ≪ 1 fazemos uma expansão em série de potências para bn (t) bn (t) = b0n (t) + λb1n (t) + λ2 b2n (t) + ... = +∞ X λk bkn (t) ; (11.2.124) k=0 esperamos que esta expansão convirja rapidamente, permitindo-nos truncá-la numa dada ordem para obter uma solução aproximada. Substituindo esta expansão em (11.2.123) obtemos +∞ i~ d X k k λ bn (t) dt k=0 ! = X Vnp (t) p +∞ X λk+1 bkp (t)eiωnp t ; (11.2.125) k=0 igualando as potências de λ temos: • Ordem λ0 : i~ d 0 b (t) = 0 . dt n (11.2.126) Isto é, b0n não depende do tempo. Este é o resultado esperado para λ = 0; • Ordem λk , k ≥ 1: i~ X d k bn (t) = Vnp (t)eiωnp t bpk−1 . dt p (11.2.127) Obtemos, pois, uma relação de recorrência: inserindo a solução de ordem zero em (11.2.127), obtemos a solução de primeira ordem, que por sua vez inserida no lado direito de (11.2.127) origina a relação de segunda ordem, etc. 372 Métodos perturbativos independentes e dependentes do tempo Examinemos em detalhe a solução até primeira ordem. Assumimos, tal como referido anteriormente, que para t < 0 o sistema se encontra no estado |Φi i. Em t = 0 existe uma descontinuidade no Hamiltoniano, pois t=0 Ĥ = Ĥ0 −→ Ĥ = Ĥ0 + λV̂ (t) ; mas dado que a descontinuidade é finita, a função de onda é contı́nua em t = 0. A condição inicial é bn (t = 0) = δni A equação (11.2.126) implica que ⇒ b0n (t = 0) = δni , (11.2.128) bk (t = 0) = 0 , k ≥ 1 . n b0n (t) = δni , t≥0, (11.2.129) o que determina a solução de ordem zero. Introduzindo esta solução em (11.2.127) com k = 1 temos i~ X d 1 bn (t) = Vnp (t)eiωnp t δpi = Vni (t)eiωni t . dt p (11.2.130) Levando em conta a condição inicial b1n (t = 0) = 0, obtemos Z 1 t ′ 1 bn (t) = Vni(t′ )eiωni t dt′ . i~ 0 (11.2.131) Logo, o estado do sistema em primeira ordem em λ é |Φi i , t < 0 , ! ( ) |Ψ(t)i = X Z t λ ′ e−iEn t/~ + O(λ2 ) |Φn i , Vni (t′ )eiωni t dt′ δni + i~ n 0 t≥0. (11.2.132) Note que a função de onda está normalizada apenas em primeira ordem em λ. A perturbação mistura |Φi i com todos os outros estados próprios de Ĥ0 , |Φn i, para os quais Vni 6= 0. A probabilidade de transição para um estado final |Φf i é dada por Pif (t) = |hΦf |Ψ(t)i|2 = |hΦf | X n cn (t)|Φn i|2 = |cf (t)|2 (11.2.120) = |bf (t)|2 . (11.2.133) 11.2 Teoria das Perturbações dependentes do tempo 373 Queremos considerar uma transição induzida pela perturbação Ŵ (t); logo consideramos o estado final diferente do inicial. Em primeira ordem Z λ t ′ Vf i (t′ )eiωf i t dt′ + O(λ2 ) , bf (t) = 0 + i~ 0 e como tal 1 Pif (t) = 2 ~ Z (11.2.134) 2 t ′ Wf i (t′ )eiωf i t dt′ 0 , i 6= f . (11.2.135) Alguns comentários: • Para t fixo e considerando Pif como função de Ef , a probabilidade de transição é proporcional ao quadrado do módulo da transformada de Fourier da perturbação (à semelhança do que acontece com a aproximação de Born (10.2.28)); • A probabilidade de transição é zero, nesta ordem, se Wf i (t′ ) = 0, ∀t′ ∈ [0, t]; • A aproximação de primeira ordem resulta de substituir na equação de Schrödinger (11.2.123), bp (t) pelos seus valores em t = 0. É natural que esta seja uma boa aproximação para t pequeno, mas para t grande em princı́pio teremos de considerar termos de ordem λ2 , λ3 , etc, que deverão ser importantes. 11.2.3 Aplicação a uma perturbação sinusoidal ou constante Como aplicação do formalismo desenvolvido na secção anterior consideramos uma perturbação com uma das seguintes formas: V̂ (t) = V̂ sin ωt ∨ V̂ (t) = V̂ cos ωt , (11.2.136) onde V̂ é uma observável independente do tempo e ω é uma frequência angular constante. Este tipo de perturbação é a que se encontra, por exemplo, na interacção de uma onda electromagnética monocromática de frequência ω com um sistema fı́sico. Neste caso, Pif (t) representará a probabilidade de transição |Φi i −→ |Φf i induzida pela radiação incidente. Algo ingenuamente poderı́amos ser levados a pensar que esta transição seria possı́vel se e só se ω = ±ωf i . Isto é, que Pif para t fixo e como função de ω teria dois picos (tipo 374 Métodos perturbativos independentes e dependentes do tempo delta de Dirac) em ω = ±ωf i , sendo zero para outros ω. Contudo, devido ao princı́pio da incerteza a situação é um pouco diferente, como agora demonstramos. Na base dos estados estacionários do Hamiltoniano não perturbado, podemos escrever os elementos de matriz da primeira perturbação em (11.2.136) como hΦf |V̂ (t)|Φi i = hΦf |V̂ |Φi i sin ωt ≡ Vf i sin ωt = Vf i eiωt − e−iωt . 2i (11.2.137) Substituindo na fórmula geral (11.2.131) Z ′ ′ ei(ωf i +ω)t − ei(ωf i −ω)t ′ Vf i ei(ωf i +ω)t − 1 ei(ωf i −ω)t − 1 1 t 1 . Vf i dt = − − bf (t) = i~ 0 2i 2i~ ωf i + ω ωf i − ω (11.2.138) Usando (11.2.133), temos em primeira ordem Pif (t) = |bf (t)|2 = λ2 |b1f (t)|2 , (11.2.139) que no caso em estudo depende também do parâmetro da perturbação ω, pelo que escrevemos |Wf i |2 1 − ei(ωf i +ω)t 1 − ei(ωf i −ω)t Pif (t, ω) = ∓ 4~2 ωf i + ω ωf i − ω 2 . (11.2.140) O sinal inferior refere-se ao resultado do mesmo cálculo usando a segunda perturbação (V̂ (t) = V̂ cos ωt) em (11.2.136), em vez da primeira. Para uso posterior consideramos essa perturbação (i.e o cos) no limite ω = 0 em que obtemos uma perturbação constante, para a qual, o resultado é ω t |Wf i |2 sin2 f2i |Wf i |2 iωf i t 2 | = . Pif (t) = 2 2 |1 − e ωf i 2 ωf i ~ ~2 (11.2.141) 2 Vamos agora considerar dois casos distintos: 1) Quando ambos os estados |Φi i e |Φf i pertencem a um espectro discreto; 2) Quando |Φf i pertence a um contı́nuo de estados finais. No primeiro caso Pif representa uma probabilidade, enquanto que no segundo representa uma densidade de probabilidade. 11.2 Teoria das Perturbações dependentes do tempo 375 1) Perturbação sinusoidal que acopla dois estados discretos: um fenómeno de ressonância Fixemos o tempo t, de modo a considerarmos a probabilidade Pif (t, ω) como função apenas da frequência ω. A análise de (11.2.140) envolve analisarmos os termos t 1 − ei(ωf i ±ω)t i(ωf i ±ω)t/2 sin (ωf i ± ω) 2 = −ie . A± = ωf i ± ω (ωf i ± ω)/2 (11.2.142) Se ω ≃ ±ωf i , o denominador de A∓ fica aproximadamente zero. Se simultaneamente t for suficientemente elevado, o argumento do seno no numerador de A∓ não é aproximadamente zero. Nestas condições esperamos que A∓ domine em (11.2.140) sobre A± ; o primeiro e o último designam-se por, respectivamente, termo ressonante e termo anti-ressonante. Estabelecemos desde já, o seguinte critério quantitativo que comentaremos graficamente em baixo: se i) |ω ∓ ωf i | ≪ |ωf i| , ii) 1 ≪ t|ωf i | , (11.2.143) podemos negligenciar A± em (11.2.140); obtemos então: |Wf i |2 Pif (t, ω) ≃ 4~2 sin (ωf i ∓ ω) 2t (ωf i ∓ ω)/2 !2 . (11.2.144) Para t fixo representamos Pif (t, ω) em função de ω na figura 11.3, para ω ≃ ωf i . Notese o fenómeno de ressonância para Pif (t, ω) quando ω = ωf i . Para ω ≃ −ωf i existe um fenómeno semelhante de ressonância em ω = −ωf i , sendo o gráfico respectivo o simétrico relativamente ao eixo w = 0 da figura 11.3. Podemos compreender graficamente o significado das aproximações i) e ii) (11.2.143): i) significa que estamos a considerar o gráfico de Pif (t, ω) na região em que ω está próxima do pico (logo próxima de ωf i ); ii) significa que as zonas do gráfico de (11.2.140) em que A+ e A− dominam estão bem separadas; isto é 2|ωf i| ≫ ∆ω ⇔ |ωf i| ≫ 2π ⇔ |ωf i|t ≫ 1 . t Fisicamente, esta condição significa que temos de esperar tempo suficiente para o sistema perceber que a perturbação é sinusoidal. 376 Métodos perturbativos independentes e dependentes do tempo Figura 11.3: Probabilidade de transição Pif (t, ω) em função de ω para t fixo. Existe um fenómeno de ressonância quando ω = ωf i . A curva apresenta um “padrão de difracção”. Pif (t, ω) tem zeros em ωf i −ω = 2nπ/t; logo, a largura da ressonância, ∆ω, estimada como a distância entre os dois zeros de Pif (t, ω) que rodeiam o máximo é ∆ω = 4π/t (Extraı́do de Cohen et al, ‘Quantum Mechanics’). Notemos a diferente interpretação fı́sica das duas ressonâncias de Pif . A ressonância em ω = ωf i corresponde a um processo com Ef > Ei , ou seja a excitação do sistema pela absorção de um fotão enquanto que a ressonância em ω = −ωf i corresponde a um processo com Ef < Ei , ou seja o decaimento do sistema pela emissão de um fotão - figura 11.4. Ef |Φf i Ef γ γ Ei |Φf i |Φi i Ei |Φi i Figura 11.4: As ressonâncias para ω = ±ωf i têm interpretações de absorção (ω = ωf i ) esquerda - ou emissão (ω = −ωf i ) - direita - de um fotão. Comentários: • Pif (t, ω) tem máximos em ω = ±ωif , correspondendo à absorção/emissão de fotões 11.2 Teoria das Perturbações dependentes do tempo 377 com a frequência de Bohr; mas as ressonâncias têm largura, ∆ω, estimada como a distância entre os dois zeros de Pif (t, ω) que rodeiam o máximo. Esta largura pode ser entendida como uma manifestação da relação de incerteza para tempo e energia. Se tentassemos medir a diferença de energia Ef − Ei = ~ωf i , aplicando uma onda electromagnética, variando ω e tentando encontrar a ressonância, obteriamos uma incerteza na energia: ∆E = ~∆ω ≃ ~ 4π t ⇒ ∆E∆t & ~ , para uma perturbação que actuou um tempo ∆t. Logo, para medir a diferença de energia Ef − Ei com incerteza nula ∆E = 0, teriamos de deixar actuar a perturbação durante um tempo infinito. • No final da secção anterior comentamos que a aproximação de primeira ordem deixará de ser válida para t grande. No entanto, neste exemplo requeremos que t seja suficientemente grande na aproximação que usamos, o que poderá parecer incompatı́vel. De facto, que t não poderá ser demasiado grande é manifesto em que (de (11.2.144) usando limx→0 sin x/x) Pif (t; ω = ωf i ) = |Wf i |2 t2 4~2 t→+∞ −→ +∞ ; em particular a probabilidade torna-se maior do que 1, o que não faz sentido. Necessitamos por isso de impôr |Wf i |t ≪1; ~ o estudo das próximas ordens perturbativas revela que esta condição é, de facto, necessária, se bem que não suficiente, para garantir a validade da análise de primeira ordem aqui feita. • Analisando o gráfico da figura 11.3 vemos que a altura da ressonância depende de Wf i . Se a perturbação tiver elementos de matriz Wf i diferentes para diferentes linhas espectrais, podemos compreender porque é que algumas linhas espectrais são mais 378 Métodos perturbativos independentes e dependentes do tempo intensas do que outras. Esta era uma lacuna importante na teoria de Bohr (capı́tulo 2), que a Mecânica Quântica resolve. • No caso de uma perturbação constante, Pif (t, ω) é dado por (11.2.141) que tem uma ressonância para ω = 0 - figura 11.5, de modo a conservar a energia do sistema. Note-se que a largura da ressonância é a mesma que antes, mas a altura é 4 vezes superior, devido à interferência construtiva entre termo ressonante e anti-ressonante. Figura 11.5: Pif (t, ω) para t constante como função de ω (Extraı́do de Cohen et al, ‘Quantum Mechanics’). 2) Acoplamento entre estados de um espectro contı́nuo Se a energia Ef pertencer a uma zona contı́nua do espectro de Ĥ0 , temos de interpretar |hΦf |Ψi|2 como uma densidade de probabilidade. A probabilidade fı́sica é obtida integrando esta densidade de probabilidade sobre uma conjunto de estados finais. Esta integração introduz uma medida, denominada densidade de estados finais ρ(E), como explicamos com o seguinte exemplo. Consideramos o problema da difusão de uma partı́cula sem spin, de massa m por um potencial W (~r). No instante t, o estado |Ψ(t)i pode ser expandido na representação |~pi, correspondendo a estados com momento bem definido p~, energia E = p~2 /2m e função de 11.2 Teoria das Perturbações dependentes do tempo 379 onda espacial h~r|~pi = 1 2π~ 3/2 ei~p·~r/~ . Se o estado |Ψ(t)i estiver normalizado, a densidade de probabilidade associada ao momento ~p é d3 P(~p) = |h~p|Ψ(t)i|2 d3 ~p . Conceptualmente podemos, numa experiência, programar um detector para dar sinal quando a partı́cula difundida tiver um momento ~pf . Mas na prática, o detector terá uma abertura finita e o seu filtro de energia não será perfeito; dará sinal sempre que o momento da partı́cula difundida estiver num ângulo sólido δΩf , em torno de p~f e a sua energia num intervalo δEf centrada em p~2f /2m. Seja Df o domı́nio no espaço de momentos definido por estas condições. A probabilidade de obter um sinal do detector é Z δP(~pf , t) = |h~p|Ψ(t)i|2d3 p~ . p ~∈Df Mudamos a variável de integração de momento para energia: d3 p~ = p2 dpdΩ ≡ ρ(E)dEdΩ , onde, genericamente, ρ(E) é a densidade de estados finais. No exemplo que estamos a considerar, p2 E= 2m ⇒ logo identificando p2 dp ≡ ρ(E)dE lêmos ρ(E) = p2 dp = r m dE ; 2E √ dp = 2Em3 . dE (11.2.145) (11.2.146) Em termos de um integral na energia, a probabilidade de o detector dar sinal é Z δP(~pf , t) = |h~p|Ψ(t)i|2 ρ(E)dΩdE . (11.2.147) Ω∈δΩf ,E∈δEf A densidade de estados funciona pois como uma medida de integração. Consideramos agora o caso geral. Tomamos um contı́nuo de estados estacionários de Ĥ0 , rotulados por um conjunto de números quânticos que denotamos por α. Estes estados 380 Métodos perturbativos independentes e dependentes do tempo obedecem a hα|α′i = δ(α − α′ ) . A probabilidade de encontrar o sistema num dado grupo de estados finais, denominado Df , com um conjunto de valores de α centrados à volta de αf é Z δP(αf , t) = dα|hα|Ψ(t)i|2 . (11.2.148) α∈Df Tal como no exemplo anterior, mudamos de variável de integração para a energia, o que introduz uma medida de integração ρ(β, E), que é uma densidade de estados finais que pode depender de outros números quânticos que designamos genericamente por β (que existirão caso Ĥ0 não constitua, per se, o C.C.O.C.): dα = ρ(β, E)dβdE . Mudando da base {|αi} para a base {|β, Ei} e sendo o domı́nio Df caracterizado, na nova base, por β ∈ δβf e E ∈ δEf , a probabilidade (11.2.148) fica Z δP(αf , t) = dβdEρ(β, E)|hβ, E|Ψ(t)i|2 . (11.2.149) β∈δβf ,E∈δEf Usando esta expressão vamos agora deduzir um importante resultado para a probabilidade de transição por unidade de tempo, denominado Regra de Ouro de Fermi. Consideramos que o sistema se encontra num estado próprio |Φi i de Ĥ0 . Vimos anteriormente que para o caso de uma perturbação constante a probabilidade de transição |Φi i −→ |Φf i é (11.2.141): ω t |Wf i |2 sin2 f2i Pif (t) = , ωf i 2 ~2 (11.2.150) 2 que reescrevemos na forma |hΦf |Ψ(t)i|2 = |hΦf |Ŵ |Φi i|2 F (t, ωf i ) . ~2 (11.2.151) O cálculo que nos levou a esta fórmula permanece válido se em vez de calcular hΦf |Ψ(t)i tivessemos calculado hβ, E|Ψ(t)i, onde |β, Ei pertence a um contı́nuo de estados finais; neste caso o resultado é reescrito |hβ, E|Ŵ |Φi i|2 F |hβ, E|Ψ(t)i| = ~2 2 E − Ei . t, ~ (11.2.152) 11.2 Teoria das Perturbações dependentes do tempo 381 Usando (11.2.149) obtemos, para a probabilidade de transição de |Φi i para um conjunto de estados num domı́nio em torno do estado com energia Ef e outros números quânticos βf (isto é αf ) 1 δP(Φi , αf , t) = 2 ~ Z 2 β∈δβf ,E∈δEf dβdEρ(β, E)|hβ, E|Ŵ |Φi i| F E − Ei t, ~ . (11.2.153) Analisemos a função F E − Ei t, ~ ≡ E−Ei t 2~ 2 E−Ei 2~ sin2 , para t fixo em função de ωf i . Para t suficientemente grande, esta função pode ser aproximada por um delta de Dirac, centrado em E = Ei . De facto, uma das funções que aproxima um delta de Dirac é: δǫ (x) = ǫ sin2 xǫ , x2 δǫ (x) . ǫ→0 π δ(x) = lim Na figura 11.6 representamos δǫ (x) para diferentes valores de ǫ. Figura 11.6: δǫ (x) para ǫ = 1, 0.5, 0.25, respectivamente. Tomando ǫ = 1/t, x = (E − Ei )/2~, temos δ E − Ei 2~ Logo, para t elevado i t E − Ei 1 sin2 E−E 1 2~ = lim . = lim F t, E−Ei 2 t→∞ tπ t→∞ tπ ~ 2~ F E − Ei t, ~ ≃ tπδ E − Ei 2~ . 382 Métodos perturbativos independentes e dependentes do tempo Usando ainda que para a função delta de Dirac δ(cx) = 1 δ(x) , |c| obtemos, para t elevado, E − Ei ≃ 2~tπδ(E − Ei ) . F t, ~ (11.2.154) Vamos concentrar-nos numa perturbação constante e consideramos as seguintes aproximações: • t é suficientemente elevado para (11.2.154) ser uma boa aproximação; • t é suficientemente pequeno para o tratamento perturbativo de primeira ordem ser boa aproximação; isto significa que os coeficientes bnf (t) não variam demasiado rapida- mente com t; concretamente, se considerarmos b1f (t), temos, por (11.2.131) e para uma perturbação constante Z Vf i t iωf i t′ ′ Vf i iωf i t/2 ωf i t 1 bf (t) = e dt = −2i e sin . i~ 0 ωf i 2 (11.2.155) Para esta quantidade não variar “demasiado rapidamente” tomamos ωf i t 2~ ≪ 1 ⇔ Ef − Ei ≪ , 2 t (11.2.156) que corresponde a frequência de Bohr pequena. Assim, depois de fixar t suficientemente grande para (11.2.154) ser uma boa aproximação tomamos Ef suficientemente próximo de Ei . • No pequeno intervalo de estados finais que resulta das condições da alı́nea anterior, assumimos que δβf é pequeno, pelo que a integração em β é desnecessária. Sob tais condições, (11.2.153) fica δβ 2πt |hβ , E = E |Ŵ |Φ i|2 ρ(β , E = E ) , se E ∈ δE , f f i i f f i i f f ~ δP(Φi , αf , t) = 0 , se E ∈ / δE . i f (11.2.157) 11.2 Teoria das Perturbações dependentes do tempo 383 Ou seja, a perturbação constante só pode induzir transições entre nı́veis com a mesma energia, a menos de uma largura δEf igual a 2π~/t (estimada como a distância entre zeros consecutivos de F (t, (E − Ei )/~)), que resulta da incerteza tempo/energia. Como a probabilidade aumenta linearmente com o tempo6 , a probabilidade de transição por unidade de tempo é constante. A densidade de probabilidade de transição, por unidade de tempo e por unidade da variável βf é: p(Φi , αf ) = 2π d δP(Φi , αf , t) = |hβf , Ef = Ei |Ŵ |Φi i|2 ρ(βf , Ef = Ei ) . dt δβf ~ (11.2.158) Esta é a Regra de Ouro de Fermi (ou, mais correctamente Fermi-Dirac, pois foi Dirac quem fez grande parte do trabalho que levou a esta regra). Mais esquematicamente pi→f = 2π |Wf i |2 ρf . ~ (11.2.159) Note-se que esta regra se aplica a perturbações independentes do tempo, embora seja derivada usando o formalismo de teoria de perturbações dependentes do tempo. Existem muitas aplicações de importância da regra de ouro de Fermi nesta forma; mas a regra pode ser generalizada para perturbações dependentes do tempo. Por exemplo, se em vez de termos considerado a perturbação constante tivéssemos considerado uma perturbação sinusoidal (11.2.136), que acopla |Φi i a um contı́nuo de estados |βf , Ef i, com energias próximas de Ei + ~ω, terı́amos obtido p(Φi , αf ) = π |hβf , Ef = Ei + ~ω|Ŵ |Φi i|2 ρ(βf , Ef = Ei + ~ω) . 2~ (11.2.160) Entre as aplicações da regra de ouro de Fermi encontram-se os cálculos de secção eficaz de difusão e probabilidades de decaimento (como o decaimento beta). Como exemplo de aplicação consideramos de seguida um cálculo de difusão. Exemplo: Derivação da aproximação de Born para a secção eficaz de difusão pela regra de ouro de Fermi. 6 O que será válido apenas para tempos pequenos e é o resultado esperado para uma perturbação constante. 384 Métodos perturbativos independentes e dependentes do tempo Consideramos a difusão de uma partı́cula por um potencial Ŵ , cujos elementos de matriz, na representação {|~ri} são dados por h~r|Ŵ |~r′ i = W (~r)δ(~r − ~r′ ) . Assumimos que o estado inicial do sistema é um estado próprio do momento: |Ψ(t = 0)i = |~pii . (11.2.161) Vamos calcular a probabilidade de transição desta partı́cula (i.e a difusão pelo potencial) para estados com momento p~ em torno de p~f (|~pi | = |~pf |) por unidade de tempo e de ângulo sólido. Pela regra de ouro de Fermi (11.2.158) p(~pi , ~pf ) = 2π |h~pf |Ŵ |~pi i|2 ρ(Ef = Ei ) ; ~ usamos h~pf |Ŵ |~pi i = = = Z Z Z Z d~rd~r′ h~pf |~rih~r|Ŵ |~r′ih~r′ |~pii ′ d~rd~r 3 Z 1 2π~ 1 2π~ 3/2 −i~ pf ·~ r/~ e 1 W (~r)δ(~r − ~r ) 2π~ ′ 3/2 ′ ei~pi ·~r /~ d~rei(~pi −~pf )·~r/~W (~r) ; e levando em consideração (11.2.146) obtemos Z 2 √ 2π i(~ pi −~ pf )·~ r /~ p(~pi , p~f ) = 2mE . m d~ r e W (~ r ) ~(2π~)6 (11.2.162) A secção eficaz diferencial de difusão foi definida por (10.1.1) dn = σ(θ, φ)FidΩ , (11.2.163) e portanto σ(θ, φ) = dn , Fi dΩ [σ] = L2 , que corresponde um “número de partı́culas detectadas por unidade de tempo, fluxo incidente e ângulo sólido”. Comparando com p(~pi , ~pf ) , [p] = 1 , T 11.2 Teoria das Perturbações dependentes do tempo 385 que corresponde a uma “probabilidade de transição por unidade de tempo e ângulo sólido”, concluimos que para identificar p(~pi , p~f ) com σ(θ, φ) necessitamos de dividir a primeira quantidade por um “fluxo”. O candidato natural é o vector densidade de corrente de probabilidade J~i para as partı́culas incidentes: ~ 1 1 ∗ ~ [J~] = [Fluxo] = . Ji (~r) = Re Φ (~r) ∇Φ(~r) , m i T L2 Para Φ(~r) = 1 2π~ 3/2 (11.2.164) ei~pi ·~r/~ , obtemos J~i = p~i m(2π~)3 |J~i| = ⇒ Assim m2 p(~pi , ~pf ) = 2 4 4π ~ |J~i | Z p 1 2Ei m . m(2π~)3 2 d3~rei(~pi −~pf )·~r/~W (~r) , (11.2.165) que coincide com a fórmula para σ(θ, φ) na aproximação de Born (10.2.28). 11.2.4 Probabilidade de transição via operador de evolução A probabilidade de transição (11.2.135), pode ser obtida por um outro método que tem a vantagem de se tornar mais simples em ordens superiores à primeira. A razão é que este outro método emprega uma técnica de diagramas, bastante intuitivos, para construir as amplitudes de transição em cada ordem. O método em questão, que iremos agora estudar, usa o operador de evolução Û(t, t0 ), introduzido na secção 4.5.3, para deduzir a probabilidade de transição Pif (t). Este método levará naturalmente a uma interpretação gráfica da série perturbativa, no espı́rito dos diagramas de Feynman usados em Teoria Quântica de Campo. Com este objectivo começaremos por discutir as várias representações da Mecânica Quântica. As representações de Schrödinger, Heisenberg e Interacção O formalismo com que temos estudado a Mecânica Quântica contém: • Operadores (observáveis) genericamente independentes do tempo: R̂, P̂ , etc. 386 Métodos perturbativos independentes e dependentes do tempo • Um estado genericamente dependente do tempo, |Ψ(t)i, que nesta secção denotamos |ΨS (t)i. A evolução do sistema está inteiramente contida na evolução do estado |ΨS (t)i e é determinada pela equação de Schrödinger; por isso este formalismo é denominado representação de Schrödinger. O operador de evolução Û (t, t0 ) depende do tempo e podemos usa-lo para construir um formalismo em que: • Operadores (observáveis) serão dependentes do tempo; • O estado será independente do tempo, sendo denotado por |ΨH i; Este formalismo é denominado representação de Heisenberg. A unitariedade do operador de evolução garante que as previsões da Mecânica Quântica (probabilidades e valores esperados) feitas nas duas representações são perfeitamente equivalentes. Para confirmarmos que assim é consideremos, mais explicitamente, a relação entre os dois formalismos. Por definição, o operador de evolução relaciona o estado do sistema em dois instantes diferentes do seguinte modo: |ΨS (t)i = Û (t, t0 )|ΨS (t0 )i . (11.2.166) O estado na representação de Heisenberg é introduzido como |ΨH i ≡ |ΨS (t0 )i = Û † (t, t0 )|ΨS (t)i , (11.2.167) onde usamos a unitariedade do operador de evolução. Isto é, o estado na representação de Heisenberg é o estado inicial na representação de Schrödinger e como tal é independente do tempo. Consideramos agora um operador genérico na representação de Schrödinger, que poderá ou não depender do tempo e que denotamos por ÂS (t). O seu valor esperado no estado |ΨS (t)i é dado por hÂi(t) = hΨS (t)|ÂS (t)|ΨS (t)i = hΨS (t0 )|Û † (t, t0 )ÂS (t)Û(t, t0 )|ΨS (t0 )i . (11.2.168) 11.2 Teoria das Perturbações dependentes do tempo 387 Na representação de Heisenberg, a mesma observável será representada pelo operador ÂH (t), e o seu valor esperado será hÂi(t) = hΨH |ÂH (t)|ΨH i . (11.2.169) Requerendo que (11.2.168) e (11.2.169) sejam equivalentes obtemos ÂH (t) = Û † (t, t0 )ÂS (t)Û (t, t0 ) , (11.2.170) que genericamente depende do tempo, mesmo que ÂS não dependa. Calculemos agora a evolução temporal de um operador na representação de Heisenberg. Como cálculo preliminar derivamos (11.2.166) em ordem ao tempo d d i~ |ΨS (t)i = i~ Û (t, t0 ) |ΨS (t0 )i , dt dt (11.2.171) dado que |ΨS (t0 )i não depende do tempo; substituindo o lado esquerdo pelo uso da equação de Schrödinger na forma i~ d |ΨS (t)i = ĤS (t)Û (t, t0 )|ΨS (t0 )i , dt (11.2.172) obtém-se 1 d Û(t, t0 ) = ĤS (t)Û(t, t0 ) . dt i~ (11.2.173) d † 1 Û (t, t0 ) = − Û † (t, t0 )ĤS (t) . dt i~ (11.2.174) A equação adjunta é Derivamos agora (11.2.170) em ordem ao tempo; usando (11.2.173) e (11.2.174) obtemos d ÂH (t) = dt 1 dÂS (t) 1 − Û † (t, t0 )ĤS (t)ÂS (t)Û (t, t0 ) + Û † (t, t0 ) Û(t, t0 ) + Û † (t, t0 )ÂS (t)ĤS (t)Û (t, t0 ) ; i~ dt i~ (11.2.175) Introduzindo 1̂ = Û (t, t0 )Û † (t, t0 ) no primeiro e terceiro termo do lado direito entre os operadores ÂS e ĤS obtemos: h i d i~ ÂH (t) = ÂH (t), ĤH (t) + i~ dt dÂS (t) dt ! . H (11.2.176) 388 Métodos perturbativos independentes e dependentes do tempo Esta é a equação de evolução na representação de Heisenberg. Do mesmo modo que, na representação de Schrödinger, toda a informação sobre a evolução do sistema (contida em |ΨS (t)i) é dada pela equação de Schrödinger, na representação de Heisenberg, toda a informação sobre a evolução do sistema (contida em ÂH (t)) é dada pela equação (11.2.176).7 Note-se a semelhança formal entre (11.2.176) e (1.3.28); na representação de Schrödinger uma tal semelhança existe apenas para a evolução dos valores médios de observáveis (4.4.59). Existe uma terceira representação, que é introduzida para lidar com perturbações a um sistema cuja solução exacta é conhecida: a representação de interacção. Consideremos o Hamiltoniano: Ĥ = Ĥ0 (t) + Ŵ (t) . (11.2.177) Seja Û0 (t, t0 ) o operador de evolução do Hamiltoniano não perturbado Ĥ0 (t); isto é, se Ŵ (t) = 0, então |ΨS (t)i = Û0 (t, t0 )|ΨS (t0 )i . (11.2.178) Seja Û (t, t0 ) o operador de evolução do Hamiltoniano total; então |ΨS (t)i = Û (t, t0 )|ΨS (t0 )i . (11.2.179) Definimos o estado do sistema na representação de interacção |ΨI (t)i como |ΨS (t)i = Û0 (t, t0 )|ΨI (t)i ⇔ |ΨI (t)i = Û0† (t, t0 )|ΨS (t)i , (11.2.180) em que t0 é o instante em que a perturbação começou a actuar. Note-se a semelhança com (11.2.167), substituindo Û ↔ Û0 , o que nos leva a concluir que se o Hamiltoniano fosse apenas o Hamiltoniano no perturbado, o estado de interacção coincidiria com o estado de Heisenberg e seria constante. Para verificarmos isto calculemos a evolução do estado na representação de interacção: d d d † † i~ |ΨI (t)i = i~ Û0 (t, t0 ) |ΨS (t)i + Û0 (t, t0 ) i~ |ΨS (t)i . dt dt dt 7 (11.2.181) Historicamente, as duas representações aparecem no mesmo ano, 1925, com a equação de Schrödinger e a mecânica matricial de Heisenberg. A equivalência foi provada por Schrödinger em Março de 1926 no artigo ‘Über das Verhältnis der Heisenberg-Born-Jordanschen Quantenmechanik zu der meinen’. 11.2 Teoria das Perturbações dependentes do tempo 389 Usando o análogo de (11.2.174) para Û0 , i~ d † Û0 (t, t0 ) = −Û0† (t, t0 )Ĥ0 (t) , dt (11.2.182) no primeiro termo do lado direito e a equação de Schrödinger i~ d |ΨS (t)i = (Ĥ0 (t) + Ŵ (t))|ΨS (t)i , dt (11.2.183) para o segundo termo, (11.2.181) toma a forma: i~ d |ΨI (t)i = Û0† (t, t0 )Ŵ (t)Û0 (t, t0 )|ΨI (t)i ≡ ŴI (t)|ΨI (t)i . dt (11.2.184) Note-se que a relação de ŴI com Ŵ , i.e. da perturbação na representação de interacção e na representação de Schrödinger é semelhante à relação dos operadores na representação de Heisenberg e de Schrödinger (11.2.170), mais uma vez substituindo Û ↔ Û0 . Esta é a equação de evolução na representação de interacção. Se Ŵ = 0, então |ΨI (t)i = constante; por (11.2.180) |ΨS (t)i = Û0 (t, t0 )|ΨI (t)i , (11.2.185) pelo que podemos interpretar o estado constante no tempo como |ΨI (t)i = |ΨS (t0 )i = |ΨH i; logo interpretamos o estado de interacção como a evolução de |ΨS (t0 )i devida somente à perturbação, como ilustrado na figura 11.7. Ĥ0 Û0 (t, t0 )|ΨS (t0 )i Ŵ (t) |ΨI (t)i |ΨS (t0 )i Figura 11.7: Evolução do estado |ΨS (t0 )i, separando as contribuições do Hamiltoniano não perturbado Ĥ0 e da perturbação Ŵ (t). Se Ŵ (t) ≪ Ĥ0 esperamos que a evolução de |ΨI (t)i seja muito mais lenta do que a de Û0 (t, t0 )|ΨS (t0 )i. Podemos integrar, formalmente, a equação (11.2.184), obtendo 1 |ΨI (t)i = |ΨI (t0 )i + i~ Z t t0 dt′ ŴI (t′ )|ΨI (t′ )i ; (11.2.186) 390 Métodos perturbativos independentes e dependentes do tempo onde |ΨI (t0 )i = |ΨS (t0 )i. Substituindo esta equação nela própria repetidamente obtemos: |ΨI (t)i = 1 1̂ + i~ t Z t0 1 dt′ ŴI (t′ ) + (i~)2 Z t dt′ ŴI (t′ ) t0 ! t′ Z t0 dt′′ ŴI (t′′ ) + . . . |ΨI (t0 )i , (11.2.187) ou |ΨI (t)i = ÛI (t, t0 )|ΨI (t0 )i , (11.2.188) que define o operador de evolução na representação de interacção. Usando (11.2.180) temos |ΨI (t)i = Û0† (t, t0 )|ΨS (t)i = Û0† (t, t0 )Û (t, t0 )|ΨS (t0 )i = Û0† (t, t0 )Û(t, t0 )|ΨI (t0 )i ; (11.2.189) comparando com (11.2.187) deduzimos que ÛI (t, t0 ) = Û0† (t, t0 )Û (t, t0 ) . (11.2.190) Esta relação permite-nos mostrar que ÛI (t, t0 ) tem as propriedades adequadas para poder ser considerado um operador de evolução. De facto, usando que Û0 (t, t0 ) e Û(t, t0 ) são operadores de evolução demonstra-se que: a) ÛI (t0 , t0 ) = 1̂; b) ÛI† (t, t0 )ÛI (t, t0 ) = ÛI (t, t0 )ÛI† (t, t0 ) = 1̂; c) ÛI (t, t′ ) = ÛI (t, t′′ )ÛI (t′′ , t′ ). Derivamos agora uma expansão perturbativa para o operador de evolução total. Recordemos a definição do operador de evolução ÛI (t, t0 ) dada em (11.2.187): 1 ÛI (t, t0 ) = 1̂ + i~ Z t t0 1 dt ŴI (t ) + (i~)2 ′ ′ Z t t0 ′ ′ dt ŴI (t ) Z t′ dt′′ ŴI (t′′ ) + . . . ; (11.2.191) t0 usando (11.2.190) para o lado esquerdo da equação, a definição de ŴI (t) dada em (11.2.184), ŴI (t) = Û0† (t, t0 )Ŵ (t)Û0 (t, t0 ) , (11.2.192) 11.2 Teoria das Perturbações dependentes do tempo 391 para o lado direito e multiplicando (11.2.191) por Û0 (t, t0 ) obtemos Z 1 t ′ dt Û0 (t, t0 )Û0† (t′ , t0 )Ŵ (t′ )Û0 (t′ , t0 ) Û (t, t0 ) = Û0 (t, t0 ) + i~ t0 Z t Z t′ 1 dt′′ Û0 (t, t0 )Û0† (t′ , t0 )Ŵ (t′ )Û0 (t′ , t0 )Û0† (t′′ , t0 )Ŵ (t′′ )Û0 (t′′ , t0 ) + . . . ; dt′ + 2 (i~) t0 t0 (11.2.193) notando que Û0† (t′ , t0 ) = Û0 (t0 , t′ ) , (11.2.194) Û0 (t, t0 )Û0† (t′ , t0 ) = Û0 (t, t0 )Û0 (t0 , t′ ) = Û0 (t, t′ ) , (11.2.195) logo e de um modo semelhante para outras combinações análogas, (11.2.193) toma a forma final Û(t, t0 ) = Û0 (t, t0 ) + +∞ X Û (n) (t, t0 ) , (11.2.196) n=1 onde definimos Û (n) 1 (t, t0 ) = (i~)n Z t dt1 t0 Z t1 dt2 . . . Z tn−1 dtn Û0 (t, t1 )Ŵ (t1 )Û0 (t1 , t2 )Ŵ (t2 ) . . . Ŵ (tn )Û0 (tn , t0 ) , t0 t0 (11.2.197) onde t > t1 > . . . > tn−1 . Consideremos agora a probabilidade de transição no instante t, tal como discutida na secção 11.2.1, entre os estados estacionários |Φi i e |Φf i de um Hamiltoniano Ĥ0 independente do tempo, devido a uma perturbação Ŵ (t), ligada em t = 0; em termos do operador de evolução ela pode ser escrita da forma 2 Pif (t) = |hΦf |Û(t, 0)|Φi i| = |hΦf |Û0 (t, 0) + +∞ X n=1 Û (n) (t, 0)|Φii|2 . (11.2.198) Em ordem zero necessitamos dos elementos de matriz: 0 hΦf |Û0 (t, 0)|Φi i = hΦf |e−itĤ0 /~|Φi i = e−iEi t/~δif , (11.2.199) 392 Métodos perturbativos independentes e dependentes do tempo onde En0 é o valor próprio de Ĥ0 associado ao estado próprio |Φn i. Em ordem um necessitamos dos elementos de matriz: hΦf |Û (1) Z 1 t (t, 0)|Φii = hΦf | dt1 Û0 (t, t1 )Ŵ (t1 )Û0 (t1 , 0)|Φi i i~ 0 Z 1 t 0 0 dt1 e−iEf (t−t1 )/~Ŵf i (t1 )e−iEi (t−0)/~ , = i~ 0 (11.2.200) onde denotamos hΦf |Ŵ (t1 )|Φi i = Ŵf i (t1 ). Os elementos de matriz de ordem dois são calculados de maneira semelhante, sendo necessário introduzir a relação de fecho. Obtemse: hΦf |Û (2) (t, 0)|Φii = P Z k (i~)2 t dt1 0 Z t1 0 0 0 dt2 e−iEf (t−t1 )/~Ŵf k (t1 )e−iEk (t1 −t2 )/~Ŵki (t2 )e−iEi (t2 −0)/~ . 0 (11.2.201) Podemos agora interpretar os termos nas várias ordens: • Termo de ordem zero: corresponde ao sistema não perturbado; o operador de evolução é apenas exp (−iEi0 (t − 0)/~); • Termo de ordem um: o sistema evolui de t = 0 → t1 por acção de exp (−iEi0 (t1 − 0)/~); em t1 actua a perturbação que transforma |Φi i → |Φf i; seguidamente o sistema evolui de t1 → t por acção de exp (−iEf0 (t − t1 )/~). Integramos sobre todos os t1 de modo a que a perturbação possa actuar em qualquer instante; • Termo de ordem dois: o sistema evolui de t = 0 → t2 por acção de exp (−iEi0 (t2 − 0)/~); em t2 actua a perturbação que transforma |Φi i → |Φk i que é um estado intermédio arbitrário; seguidamente o sistema evolui de t2 → t1 por acção de exp (−iEk0 (t1 − t2 )/~); em t1 actua a perturbação que transforma |Φk i → |Φf i; seguidamente o sistema evolui de t1 → t por acção de exp (−iEf0 (t − t1 )/~). Integramos sobre todos os t1 , t2 de modo a que as perturbações possam actuar em qualquer instante; somamos sobre todos os estados intermédios de modo que o estado final possa ser atingido usando qualquer estado intermédio. Cada termo nesta série perturbativa pode ser representado por um diagrama. Os três primeiros estão representados na figura 11.8. Aos diagramas associamos as seguintes regras: 11.2 Teoria das Perturbações dependentes do tempo t t 393 t |Φf i |Φf i t2 |Φi i = |Φf i Ŵ (t1 ) t1 Ŵ (t1 ) |Φi i t=0 Ordem 0 Ŵ (t2 ) |Φk i t1 |Φi i t=0 Ordem 1 t=0 Ordem 2 Figura 11.8: Diagramas de ‘Feynman’ que ilustram o processo de ordem zero, um e dois para a teoria de perturbações dependentes do tempo. ⋆ O diagrama lê-se de baixo para cima (ordem temporal) correspondendo à leitura dos elementos de matriz correspondentes (11.2.199), (11.2.200) e (11.2.201) da direita para a esquerda; ⋆ a cada linha recta do diagrama, que une os pontos ti → ti+1 e que traduz a evolução do sistema no tempo sob a acção de Ĥ0 no estado |Φk i, atribui-se o factor de 0 e−iEk (ti+1 −ti )/~ ; (11.2.202) ⋆ A cada vértice do diagrama (correspondente a um instante ti ) atribui-se um factor de Z 1 ti−i dti Ŵab (ti ) , (11.2.203) i~ 0 onde os indices a, b se referem ao estado |Φa i - que se encontra imediatamente no passado do vértice - e |Φb i - que se encontra imediatamente no futuro do vértice; ⋆ Soma-se sobre todos os estados intermédios |Φk i. Com estas regras, que têm o mesmo espı́rito das regras de Feynman usadas em teoria quântica de campo, podemos reconstruir a expressão analı́tica de um termo perturbativo dado o respectivo diagrama. Como exemplo consideramos o termo de ordem três, 394 Métodos perturbativos independentes e dependentes do tempo t Ŵ (t3 ) t3 |Φf i |Φl i t2 Ŵ (t1 ) t1 Ŵ (t2 ) |Φk i |Φi i t=0 Ordem 3 Figura 11.9: Diagrama de ‘Feynman’ que ilustra o processo de ordem três para a teoria de perturbações dependentes do tempo. representado na figura 11.9. A amplitude deste processo, isto é o elemento de matriz hΦf |Û (3) (t, 0)|Φii, reconstruida usando a figura 11.9 e as regras anteriores é: Z Z t1 Z t2 1 X t 0 0 dt1 dt2 dt3 e−iEf (t−t3 )/~Ŵf l (t3 )e−iEl (t3 −t2 )/~× 3 (i~) k,l t0 t0 t0 0 0 ×Ŵlk (t2 )e−iEk (t2 −t1 )/~Ŵki (t1 )e−iEi (t1 −t0 )/~ , (11.2.204) onde t > t3 > t2 > t1 > t0 . A estrutura dos termos seguintes é agora bastante óbvia. Usando as fórmulas para as amplitudes é simples calcular a probabilidade de transição. Para a transição |Φi i e |Φf i, i 6= f , obtém-se, em primeira ordem, (1) 1 0 (t, 0)|Φi i| = 2 e−iEf t/~ ~ 2 Pif (t) = |hΦf |Û Z t 1 = 2 dt1 eiωf i t1 Ŵf i (t1 ) ~ 0 2 Z 0 t 2 0 0 dt1 e−i(Ei −Ef )t1 /~Ŵf i (t1 ) (11.2.205) , onde usamos a frequência angular de Bohr (11.2.122), que é exactamente o resultado (11.2.135). 11.3 Sumário 11.3 395 Sumário Neste capı́tulo estudamos métodos perturbativos independentes e dependentes do tempo, de modo a podermos considerar problemas que não admitem solução exacta. A principal hipótese é que o Hamiltoniano se decompõe num Hamiltoniano que pode ser resolvido exactamente Ĥ0 e numa perturbação Ŵ , que é “pequena”. Para o caso de perturbações estacionárias, o formalismo considera separadamente as perturbações a nı́veis não degenerados e degenerados. Como aplicação do primeiro caso estudamos várias perturbações a um oscilador harmónico em uma dimensão. Como aplicação do segundo caso calculamos a estrutura fina do átomo de Hidrogénio. Para perturbações dependentes do tempo, estudamos como calcular a probabilidade de transições entre estados próprios de Ĥ0 induzidas pela perturbação. Como aplicação estudamos as ressonâncias induzidas por pertubações sinusoidais e a regra de Ouro de Fermi, que usamos para deduzir novamente a secção eficaz na aproximação de Born. Finalmente estudamos um outro método, baseado no operador de evolução e na representação de interacção, para derivar probabilidades de transição em teoria de perturbações dependentes do tempo. Este método introduz uma componente diagramática que torna mais intuitiva a construção das amplitudes de transição. CAPÍTULO 12 Sistemas de partı́culas idênticas Os postulados do capı́tulo 4 para a Mecânica Quântica não relativista foram suplementados, no capı́tulo 10, por um conjunto de outros postulados referentes ao spin. O conjunto resultante de postulados é, ainda assim, insuficiente quando tratamos sistemas com várias partı́culas idênticas, levando a ambiguidades nas previsões fı́sicas. Para eliminar tais ambiguidades introduzimos, neste capı́tulo um novo postulado, relativo à descrição quântica de sistemas de partı́culas idênticas. 12.1 Origem do Problema: a degenerescência de troca Duas partı́culas são ditas idênticas se todas as suas propriedades intrı́nsecas - massa, carga, spin, etc - são exactamente iguais, sendo por isso impossı́vel distinguir uma da outra. Todos os protões ou todos os electrões são, por exemplo, partı́culas idênticas. Consideremos um problema de colisão entre duas partı́culas idênticas, rotuladas por (1) e (2), no referencial de centro de massa, conforme a figura 12.1. Consideremos que um aparelho de medida, D, detecta uma das partı́culas numa determinada direcção após a colisão. A partı́cula detectada no aparelho de medida D foi, claro está, a partı́cula (1) ou a partı́cula (2): 398 Sistemas de partı́culas idênticas Figura 12.1: Descrição clássica de um problema de colisão entre duas partı́culas idênticas. A partı́cula detectada pode ser identificada como sendo a partı́cula (1) ou a partı́cula (2) (Extraı́do de Cohen et al, ‘Quantum Mechanics’). • Classicamente não existe nenhuma ambiguidade; sabendo as condições iniciais sabemos se as trajectórias efectuadas correspondem ao caso a) ou ao caso b) descrito na figura 12.1, e logo se a partı́cula detectada foi (1) ou (2). • Quanticamente existe uma ambiguidade, porque os pactotes de onda se irão misturar e as partı́culas perderão irreversivelmente qualquer caracterı́stica que as distinga Figura 12.2. Figura 12.2: Descrição quântica de um problema de colisão entre duas partı́culas idênticas. A partı́cula detectada não pode ser identificada como sendo a partı́cula (1) ou a partı́cula (2) (Extraı́do de Cohen et al, ‘Quantum Mechanics’). A conclusão é que, quanticamente, não existe nenhuma maneira de dizer se a partı́cula detectada foi a partı́cula (1) ou a partı́cula (2). Para compreender como esta ambiguidade 12.1 Origem do Problema: a degenerescência de troca 399 introduz ambiguidades fı́sicas na descrição quântica de um sistema de partı́culas idênticas consideramos o seguinte exemplo. Suponhamos que temos um sistema com duas partı́culas de spin 1/2 idênticas. Descrevemos matematicamente o sistema rotulando as partı́culas como partı́cula (1) e partı́cula (2); os graus de liberdade de spin são descritos pelo ket |ǫ1 , ǫ2 i , onde ǫi = ±1, i = 1, 2, se refere ao valor próprio da observável de spin Ŝiz , da partı́cula i, que é igual a ǫi ~/2. Imaginemos que medimos estas observáveis e obtemos como resultado +~/2 para uma delas e −~/2 para a outra. Em princı́pio esta medição deveria determinar completamente o estado de spin do sistema. Mas devido à natureza idêntica das partı́culas os kets | + −i , e | − +i , parecem igualmente apropriados, à priori, para descrever o sistema. Existe, neste sentido uma degenerescência de troca. Mais geralmente, qualquer combinação linear normalizada α| + −i + β| − +i , |α|2 + |β|2 = 1 , (12.1.1) poderia descrever matematicamene este sistema, dado que respeita a condição de a componente Ŝz do spin de uma das partı́culas ser ~/2 e a mesma componente do spin da outra partı́cula ser −~/2, sendo irrelevante qual é qual. É esta degenerescência de estados que constitui a degenerescência de troca, que é a afirmação que “num sistema de partı́culas idênticas, uma medição completa de cada uma das partı́culas não permite a determinação de um único ket para descrever o sistema”. Assim, no nosso exemplo, apesar de termos medido individualmente o spin de cada uma das partı́culas sabemos apenas que o estado do sistema é dado por (12.1.1), com α e β indeterminados. Ora, para a descrição da Mecânica Quântica não ser ambigua, nenhuma previsão de quantidades fı́sicas pode depender das constantes α e β. Mas podemos demonstrar facilmente que não é assim. Calculemos, por exemplo, a probabilidade de encontrar as componentes Ŝx do spin de ambas as partı́culas com valor +~/2. 400 Sistemas de partı́culas idênticas Primeiro notamos que na base própria de Ŝz , Ŝx tem a forma (9.2.18) 0 1 ~ . Ŝx = 2 1 0 É fácil verificar que os seus vectores próprios (normalizados) são 1 |+ix = √ (|+i + |−i) , 2 com valores próprios 1 |−ix = √ (|+i − |−i) , 2 (12.1.2) ~ Ŝx |±ix = ± |±ix . 2 Para responder à questão de qual a probabilidade de encontrar as componentes Ŝx dos spins de ambas as partı́culas iguais a ~/2, invertemos (12.1.2) 1 |+i = √ (|+ix + |−ix ) , 2 1 |−i = √ (|+ix − |−ix ) , 2 (12.1.3) de modo a escrever (12.1.1) em termos dos estados próprios da componente Ŝx do spin α| + −i + β| − +i = α|+i ⊗ |−i + β|−i ⊗ |+i |+ix + |−ix |+ix − |−ix |+ix − |−ix |+ix + |−ix √ √ √ √ ⊗ +β ⊗ 2 2 2 2 α+β α+β α−β β−α = |+ix ⊗ |+ix − |−ix ⊗ |−ix − |+ix ⊗ |−ix − |−ix ⊗ |+ix . 2 2 2 2 (12.1.4) =α Logo, a probabilidade pedida é igual a α+β 2 2 , que depende dos coeficientes α e β e como tal temos uma ambiguidade fı́sica. Dificuldades análogas - resultantes da degenerescência de troca - aparecem no estudo de todos os sistema com um número arbitrário de partı́culas idênticas N, N > 1. 12.2 Operadores de permutação Antes de enunciar o postulado adicional da Mecânica Quântica que nos permite remover as ambiguidades resultantes da degenerescência de troca, iremos estudar certos operadores que permutam as várias partı́culas de um sistema e simplificam os cálculos e raciocı́nios que se seguirão. 12.2 Operadores de permutação 12.2.1 401 Sistema de duas partı́culas Consideremos um sistema constituido por duas partı́culas, não necessariamente idênticas (de modo a evitar as ambiguidades fı́sicas discutidas anteriormente), mas com espaços de estados isomórficos. Em particular terão o mesmo spin. Por exemplo, um protão - partı́cula (1) - e um electrão - partı́cula (2). Escolhemos a base {|uii} para o espaço de estados da partı́cula (1), E(1); como este é isomórfico a E(2), {|uii} é também uma base para este espaço. O espaço de estados total, E, tem uma base obtida pelo produto tensorial {|1 : ui i ⊗ |2 : uj i} = {|1 : ui; 2 : uj i} . Note-se que a ordem por que se fez o produto tensorial não é importante, isto é |1 : ui ; 2 : uj i = |2 : uj ; 1 : ui i , o que é importante é qual o estado associado a cada partı́cula: |1 : ui ; 2 : uj i = 6 |1 : uj ; 2 : ui i , para i 6= j . O operador de permutação P̂21 é definido como o operador linear cuja acção nesta base é dada por: P̂21 |1 : ui ; 2 : uj i = |2 : ui ; 1 : uj i = |1 : uj ; 2 : ui i . Sabendo esta acção é fácil concluir qual a acção em qualquer ket, bastando expandi-lo nesta base. Em termos das componentes da função de onda de uma partı́cula com spin e graus de liberdade orbitais, Ψǫ,ǫ′ (~r, ~r′ ) = h1 : ~r, ǫ; 2 : ~r′ , ǫ′ |Ψi , a acção do operador de permutação é P̂ 21 Ψǫ′ ,ǫ (~r′ , ~r) . Ψǫ,ǫ′ (~r, ~r′) −→ Consideremos algumas propriedades do operador de permutação: 402 Sistemas de partı́culas idênticas • É igual ao seu inverso (óbvio pela definição): 2 P̂21 = 1̂ ; • É hermı́tico: † P̂21 = P̂21 ; para o demonstramos notamos que (assumimos que a base {|uii} está ortonormalizada) h1 : ui′ ; 2 : uj ′ |P̂21 |1 : ui ; 2 : uj i = δi′ j δj ′ i . † Por outro lado, os mesmos elementos de matriz para o operador P̂21 são † |1 : ui ; 2 : uj i = h1 : ui ; 2 : uj |P̂21 |1 : ui′ ; 2 : uj ′ i∗ h1 : ui′ ; 2 : uj ′ |P̂21 = (δj ′ i δi′ j )∗ = δj ′ i δi′ j , o que mostra que os elementos de matriz dos dois operadores são iguais e prova que P̂21 é hermı́tico. • Das duas propriedades anteriores resulta que P̂21 é unitário: † = P̂21 P̂21 = 1̂ . P̂21 P̂21 • Por ser hermı́tico os valores próprios de P̂21 são reais; como, para além disso, o seu quadrado é a unidade, os valores próprios de P̂21 terão de ser λ = ±1. Asssociados a cada um destes valores próprios temos um tipo distinto de vectores próprios: ⋆ λ = 1; os vectores próprios associados chamam-se simétricos e denotam-se |ΨS i: P̂21 |ΨS i = |ΨS i. ⋆ λ = −1; os vectores próprios associados chamam-se anti-simétricos e denotam-se |ΨA i: P̂21 |ΨA i = −|ΨA i. 12.2 Operadores de permutação 403 Dado um estado arbitrário, podemos definir dois operadores cuja acção nesse estado origina, um estado próprio de P̂21 , com valor próprio, respectivamente +1 ou −1. Estes operadores chamam-se o simetrizador, Ŝ, e o anti-simetrizador,  e são definidos pelas expressões: Ŝ = 1 1̂ + P̂21 , 2  = 1 1̂ − P̂21 . 2 (12.2.1) Estes operadores têm as seguintes propriedades, todas elas podendo ser facilmente verificadas a partir das definições (12.2.1): • Ambos são operadores de projecção: Ŝ 2 = Ŝ , Â2 =  ; Ŝ = Ŝ † ,  = † ; • Ambos são operadores hermı́ticos: • Ŝ e  projectam em espaços ortogonais e suplementares Ŝ  = ÂŜ = 0 , Ŝ +  = 1̂ . • Como antecipado em cima, a acção destes operadores num estado arbitrário |Ψi de E produz estados próprios do operador de permutação: P̂21 Ŝ|Ψi = Ŝ|Ψi , P̂21 Â|Ψi = −Â|Ψi , o que justifica a denominação dos operadores. Consideremos agora a transformação de observáveis pela acção do operador de permutação. Seja B̂(1) uma observável definida em E(1). Como é observável os seus vectores próprios constituem uma base de E(1). Sem perda de generalidade assumimos que a base {|uii} corresponde à base própria de B̂(1), com valores próprios {bi }. Consideramos a † acção do operador P̂21 B̂(1)P̂21 num ket de E arbitrário: † P̂21 B̂(1)P̂21 |1 : ui ; 2 : uj i = P̂21 B̂(1)|1 : uj ; 2 : uii = bj P̂21 |1 : uj ; 2 : ui i = bj |1 : ui ; 2 : uj i . 404 Sistemas de partı́culas idênticas Por outro lado, se considerarmos a acção da observável análoga em E(2), denotada B̂(2), no mesmo ket, temos B̂(2)|1 : ui ; 2 : uj i = bj |1 : ui ; 2 : uj i . Como o ket é arbitrário concluimos que † P̂21 B̂(1)P̂21 = B̂(2) . Por um método análogo pode-se mostrar que † = B̂(1); • P̂21 B̂(2)P̂21 † • P̂21 (B̂(1) + Ĉ(2))P̂21 = B̂(2) + Ĉ(1); † = B̂(2)Ĉ(1), que pode ser facilmente deduzido introduzindo o operador • P̂21 B̂(1)Ĉ(2)P̂21 † 1̂ = P̂21 P̂21 entre B̂(1) e Ĉ(2). Generalizando para qualquer observável Ô(1, 2), em E, que pode ser expressa em termos de observáveis B̂(1) e Ĉ(2), temos † P̂21 Ô(1, 2)P̂21 = Ô(2, 1) , que é a mesma observável trocando 1 ↔ 2. Uma observável é dita simétrica se ÔS (2, 1) = ÔS (1, 2) . Para uma observável simétrica, (12.2.2) fica † P̂21 ÔS (1, 2)P̂21 = ÔS (2, 1) = ÔS (1, 2) ⇒ P̂21 ÔS (1, 2) = ÔS (1, 2)P̂21 , de onde concluimos que [ÔS (1, 2), P̂21] = 0 , ou seja, as observáveis simétricas comutam com o operador de permutação. (12.2.2) 12.2 Operadores de permutação 12.2.2 405 Sistema de três partı́culas e generalização para N partı́culas Consideramos agora a generalização para N partı́culas dos conceitos da subsecção anterior. Para isso começamos por considerar explicitamente o caso com N = 3 que introduz a estrutura do caso geral. Tomamos a base do espaço de estados de três partı́culas, com espaços de estados individuais isomórficos, como sendo {|1 : ui; 2 : uj ; 3 : uk i} , (12.2.3) e definimos os 3! = 6 operadores de permutação que nela actuam: P̂123 , P̂231 , P̂312 , P̂321 , P̂132 , P̂213 . (12.2.4) A acção destes operadores na base pode ser sumarizada como P̂npq |1 : ui ; 2 : uj ; 3 : uk i = |n : ui ; p : uj ; q : uk i . Logo P̂123 = 1̂. A acção em qualquer ket é facilmente escrita expandindo-o na base (12.2.3). Os N! operadores num sistema de N partı́culas são definidos analogamente. Consideremos algumas propriedades dos operadores de permutação num sistema de N partı́culas, exemplificando com o caso de N = 3: • O conjunto de operadores de permutação, com a multiplicação usual de operadores, constitui um grupo. Verifiquemos os axiomas de grupo (apresentados na secção 9.1): ⋆ O produto de dois operadores de permutação é ainda um operador de permutação; por exemplo P̂312 P̂132 = P̂321 ; (12.2.5) Para calcular o produto do lado esquerdo tome-se o seguinte algoritmo: 1→1 1→3 1→3 1) P̂132 2 → 3 , 2) P̂312 3 → 2 , 3) P̂312 P̂132 2 → 2 . (12.2.6) 3→2 2→1 3→1 Logo a acção de P̂312 P̂132 é a mesma que a ação de P̂321 , como antecipado. 406 Sistemas de partı́culas idênticas ⋆ O produto de permutações é associativo; por exemplo P̂312 P̂132 P̂231 = P̂312 P̂321 = P̂213 , enquanto que associando as duas permutações que actuam em segundo e terceiro lugar, P̂312 P̂132 P̂231 = P̂321 P̂231 = P̂213 , obtemos de facto o mesmo resultado. ⋆ Existe um operador identidade, que é P̂123 ; ⋆ Cada permutação tem uma permutação inversa P̂123 −1 = P̂123 −1 P̂231 = P̂312 , −1 −1 −1 , P̂321 = P̂321 , P̂213 = P̂213 , P̂132 = P̂132 . Obviamente as transposições (a definir de seguida) e a identidade são inversos de si mesmos, como exibido na segunda linha. Notemos que o grupo não é abeliano. Por exemplo se trocarmos a ordem do produto em (12.2.5) obtemos P̂132 P̂312 = P̂213 6= P̂321 , ou seja, as permutações, genericamente, não comutam entre si. • Definimos transposição como uma permutação que troca duas partı́culas e deixa as restantes invariantes. Para N = 3, das seis permutações (12.2.4) três são transposições P̂321 , P̂132 , P̂213 . (12.2.7) Em geral, das N! permutações num sistema de N partı́culas teremos N(N − 1)/2 transposições. Transposições são análogas à permutação P̂21 que definimos num sistema de duas partı́culas. Em particular são operadores hermı́ticos e unitários. 12.2 Operadores de permutação 407 Qualquer permutação pode ser escrita como um produto de transposições. Mas esta “decomposição” não é única. Por exemplo P̂312 = P̂132 P̂213 = P̂321 P̂132 = P̂321 P̂213 P̂132 P̂321 ; no entanto o número de transposições cujo produto origina P̂312 é sempre par. De um modo semelhante, a permutação P̂321 , que é ela própria uma transposição, não tem uma decomposição única, por exemplo pode ser também decomposta como P̂321 = P̂132 P̂213 P̂132 , mas o número de transposições cujo produto origina P̂321 é sempre ı́mpar. Por esta razão, as permutações P̂123 , P̂231 , P̂312 são chamadas permutações pares e as permutações P̂321 , P̂132 , P̂213 são chamadas permutações ı́mpares. No caso com N = 3 todas as permutações ı́mpares são transposições. Genericamente, para um sistema de N partı́culas, definimos permutações pares (ı́mpares) como aquelas que só se podem escrever como produtos de um número par (ı́mpar) de transposições. Notemos ainda que para qualquer N há tantas permutações pares como ı́mpares. • Operadores de permutação são sempre unitários, pois podem ser escritos como produtos de operadores unitários, que são as transposições. De facto notemos que se dois operadores são unitários o seu produto é ainda unitário: se † = 1̂ , B̂ B̂ † = 1̂ , ⇒ (ÂB̂)(ÂB̂)† = ÂB̂ B̂ † † = 1̂ . • Operadores de permutação não são sempre hermı́ticos, pois, embora se escrevam como produtos de operadores hermı́ticos (transposições), estes não comutam entre si, conforme (4.2.31). • O adjunto de uma permutação, que é igual ao seu inverso dado serem operadores unitários, tem a mesma paridade da permutação, pois escreve-se à custa das mesmas transposições, mas em ordem contrária. 408 Sistemas de partı́culas idênticas Consideramos agora a construção, para um sistema de N partı́culas, dos vectores próprios simétricos e anti-simétricos, e também a do simetrizador e do anti-simetrizador. Começamos por notar que, como os operadores de permutação não comutam entre si, não é possı́vel arranjar uma base própria comum a todos eles. Contudo existem, ainda assim, certos estados que são estados próprios comuns a todos os operadores de permutação P̂α . Num sistema de N partı́culas estes estados são de dois tipos: • Estados completamente simétricos P̂α |ΨS i = |ΨS i , que são vectores próprios de todas as permutações com valor próprio +1; • Estados completamente anti-simétricos P̂α |ΨA i = ǫα |ΨA i , que são vectores próprios de todas as permutações par (ı́mpar) com valor próprio +1 (−1). Logo ǫα = (−1)Paridade de P̂α . Tanto o espaço dos kets completamente simétricos ES como o espaço dos kets completamente anti-simétricos EA são sub-espaços do espaço de estados total E; mas ao contrário do caso N = 2, em geral E= 6 ES ⊕ EA , isto é, nem todos os estados podem ser escritos como combinação linear de um estado totalmente simétrico e um estado totalmente anti-simétrico. O simetrizador e o anti-simetrizador para um sistema de N partı́culas são os operadores de projecção em ES e EA , definidos como Ŝ = 1 X P̂α , N! α Consideremos as suas propriedades:  = 1 X ǫα P̂α . N! α (12.2.8) 12.2 Operadores de permutação • São ambos hermı́ticos 409 Ŝ = Ŝ † ,  = † . Esta propriedade pode ser verificada da seguinte maneira. Existe uma correspondência biunı́voca entre as permutações e as suas inversas; a permutação inversa tem a mesma paridade da permutação; logo as somas (12.2.8) podem ser escritas 1 X 1 X P̂α + (P̂α )−1 ,  = ǫα P̂α + (P̂α )−1 . Ŝ = 2N! α 2N! α Como todas as permutações são operadores unitários, P̂α† = (P̂α )−1 e como tal P̂α + (P̂α )−1 é hermı́tico. Como acabamos de escrever Ŝ e  como uma soma de operadores hermı́ticos, mostramos que são hermı́ticos. • Se P̂α′ for uma permutação arbitrária P̂ ′ Ŝ = Ŝ P̂ ′ = Ŝ α α P̂ ′  = ÂP̂ ′ = ǫ ′  α α α • São operadores de projecção: P̂ ′ Ŝ|Ψi = Ŝ|Ψi α ⇒ P̂ ′ Â|Ψi = ǫ ′ Â|Ψi α Ŝ = Ŝ 2 , . (12.2.9) α  = Â2 , em espaços ortogonais Ŝ  = ÂŜ = 0 , mas, como já referido anteriormente, para N > 2, os espaços ES e EA não são suplementares - Figura 12.3 - i.e. Ŝ +  6= 1̂ . Note-se que a dimensão de ES mais a de EA depende de N e da dimensão de {|uii}. Podemos agora considerar a transformação de observáveis pela acção dos operadores de permutação. Escrevendo o operador de permutação como produtos de transposições, podemos argumentar de um modo semelhante ao caso N = 2. Em particular observáveis completamente simétricas na troca dos ı́ndices 1, . . . , N, OS (1, . . . , N), comutam com todos os operadores de permutação [OS (1, . . . , N), P̂α ] = 0 . (12.2.10) 410 Sistemas de partı́culas idênticas E ES EA N =2 E ES EA N >2 Figura 12.3: Representação esquemática do espaço de estados total, E e dos espaços de estados simétricos ES e anti-simétricos EA , para duas partı́culas idênticas, em que são suplementares e para N > 2, em que não são. Note-se que a figura da esquerda não significa que qualquer estado de E pertença a ES ou a EA ; significa que qualquer estado de E pode ser escrito como combinação linear de estados de ES e EA . 12.3 O postulado de simetrização Vamos agora introduzir o postulado que vai levantar a degenerescência de troca e resolver as ambiguidades fı́sicas vistas em sistemas de partı́culas idênticas. O postulado, denominado postulado de simetrização, pode ser enunciado do seguinte modo: “Quando um sistema inclui várias partı́culas idênticas, somente certos kets do seu espaço de estados podem descrever estados fı́sicos. Os kets fı́sicos são, dependendo da natureza das partı́culas idênticas, ou completamente simétricos ou completamente antisimétricos, com respeito à permutação destas partı́culas. As partı́culas para as quais os kets fı́sicos são simétricos (anti-simétricos) chamam-se bosões (fermiões). Este postulado limita o espaço de estados num sistema de partı́culas idênticas. Em vez de ser o produto tensorial dos espaços de estados das partı́culas individuais E (como é para partı́culas distintas), é apenas um sub-espaço de E, respectivamente ES ou EA para bosões ou fermiões. Todas as partı́culas conhecidas1 actualmente obedecem à seguinte regra: Partı́culas com spin semi-inteiro são fermiões (electrão, protão,. . . ); partı́culas com spin inteiro são bosões (fotão, mesões,. . . ). 1 Este facto, resulta de as partı́culas elementares conhecidas obedecerem a esta regra. Contudo, existem partı́culas auxiliares (não são reais) mas usadas na descrição matemática da teoria quântica de campo, denominadas ghosts que não obedecem ao Teorema Spin-Estatı́stica. 12.3 O postulado de simetrização 411 Esta regra, denominada “Teorema Spin-Estatı́stica”, pode ser provada em Teoria Quântica de Campo, usando hipóteses muito gerais.2 Mas não é impossı́vel que: • Um bosão/fermião com spin semi-inteiro/inteiro possa ser descoberto; • Haja kets fı́sicos com simetrias mais complexas do que as que são consideradas pelo postulado anterior. Notemos ainda que este postulado não se aplica em uma e duas dimensões espaciais; em duas dimensões, em particular, existem outras (quasi)partı́culas, denominadas “aniões” (anyons), que se tornaram úteis na descrição de alguns sistemas, como folhas de grafite, ou no tratamento do efeito Hall quântico.3 12.3.1 Levantamento da degenerescência de troca Vejamos agora como o postulado anterior pode resolver as ambiguidades fı́sicas discutidas. Para isso, notamos que a degenerescência de troca pode ser enunciada da seguinte forma: “Seja |ui um ket que descreve matematicamente um estado fı́sico bem definido de um sistema contendo N partı́culas idênticas. O ket P̂α |ui, para qualquer operador de permutação P̂α , descreve o estado fı́sico tão bem quanto |ui. Se o sub-espaço Eu gerado por |ui e todas as suas permutações tiver dimensão maior do que 1, existe degenerescência de troca. Em geral, a dimensão de Eu poderá ir de 1 a N!.” Com o postulado adicional, o ket fı́sico tem de pertencer a ES ou a EA . A degenerescência de troca será levantada se demonstrarmos que Eu contém um único ket de ES ou, caso as partı́culas idênticas sejam fermiões, um único ket de EA . Para demonstrarmos que assim é, recordamos (12.2.9) Ŝ = Ŝ P̂α , 2  = ǫα ÂP̂α , O trabalho original foi feito por W.Pauli: “The Connection Between Spin and Statistics”, Phys. Rev. 58 (1940) 716-722. 3 A existência destas representações foi originalmente discutida em J.M.Leinaas e J.Myrheim, “On the theory of identical particles”, Il Nuovo Cimento, 37B (1977) 1; agradeço ao Prof. João Lopes dos Santos por me ter chamado a atenção para este artigo. 412 Sistemas de partı́culas idênticas que implicam Ŝ|ui = Ŝ P̂α |ui , Â|ui = ǫα ÂP̂α |ui . Ou seja, a projecção em ES ou EA de todos os kets de Eu é a mesma, a menos de um sinal que não tem relevância fı́sica, o que levanta a degenerescência de troca. Deste modo, pelo postulado de simetrização, o ket fı́sico que descreve o estado fı́sico do sistema de um sistema de N partı́culas idênticas é construido da seguinte maneira: i) Numere-se as partı́culas arbitrariamente e construa-se o ket |ui correspondendo ao estado fı́sico considerado com os números quânticos de cada partı́cula determinados. ii) Aplique-se Ŝ ou  a |ui, dependendo de as partı́culas idênticas serem bosões ou fermiões. iii) Normalize-se o ket obtido. Consideremos alguns exemplos: 1) Sistema de duas partı́culas idênticas: Num sistema de duas partı́culas idênticas sabe-se que uma está no estado |φi e outra no estado |χi (normalizados). Apliquemos as regras anteriores: i) Rotulamos a que está no estado |φi/|χi por (1)/(2). Logo construimos o ket |ui = |1 : φ; 2 : χi . ii) Se são bosões simetrizamos: Ŝ|ui = 1 1 1̂ + P̂21 |ui = (|1 : φ; 2 : χi + |1 : χ; 2 : φi) . 2 2 Se são fermiões anti-simetrizamos: 1 1 Â|ui = 1̂ − P̂21 |ui = (|1 : φ; 2 : χi − |1 : χ; 2 : φi) . 2 2 iii) Normalizamos; há que considerar duas hipóteses: 12.3 O postulado de simetrização 413 ⋆ Se os dois estados fı́sicos |φi e |ψi são distintos, podemos assumir que hφ|χi = 0; obtemos o ket fı́sico4 1 |φ, χi = √ [|1 : φ; 2 : χi + ǫ|1 : χ; 2 : φi] , 2 onde ǫ = +1, −1, para bosões e fermiões, respectivamente. ⋆ Se os dois estados fı́sicos são o mesmo |φi = |χi então temos, para bosões Ŝ|ui = |1 : φ; 2 : φi , o que quer dizer que se as partı́culas idênticas são bosões e estão no mesmo estado o ket simetrizado é o mesmo que o ket inicial |ui = Ŝ|ui; para fermiões Â|ui = 0 , o que quer dizer que não existe nenhum ket em EA que descreve dois fermiões no mesmo estado individual |φi. Um tal estado é excluido pelo postulado de simetrização. Acabamos assim, de estabelecer, para um caso particular, o Princı́pio de exclusão de Pauli: “Dois fermiões idênticos não podem estar no mesmo estado individual.” 2) Sistema de três partı́culas idênticas: Num sistema de três partı́culas idênticas sabe-se que uma está no estado |φi, outra no estado |χi e outra no estado |wi (normalizados). Apliquemos as regras anteriores: i) Rotulamos a que está no estado |φi/|χi/|wi por (1)/(2)/(3). Logo construimos o ket |ui = |1 : φ; 2 : χ; 3 : wi . 4 Assumimos, por simplicidade que |φi e |χi são estados próprios de uma observável (com espectro não degenerado) associados a valores próprios distintos. 414 Sistemas de partı́culas idênticas ii) Se são bosões simetrizamos: Ŝ|ui = 1 1 X P̂α |ui = (|1 : φ; 2 : χ; 3 : wi + |1 : w; 2 : φ; 3 : χi + |1 : χ; 2 : w; 3 : φi 3! α 3! +|1 : φ; 2 : w; 3 : χi + |1 : χ; 2 : φ; 3 : wi + |1 : w; 2 : χ; 3 : φi) ; (12.3.1) Se são fermiões anti-simetrizamos: Â|ui = 1X ǫα P̂α |ui , 3! α notando que os sinais são exactamente os dados por um determinante, escrevemos 1 Â|ui = 3! |1 : φi |1 : χi |1 : wi |2 : φi |2 : χi |2 : wi , (12.3.2) |3 : φi |3 : χi |3 : wi que é chamado o determinante de Slater.5 iii) Normalizamos; há que considerar três hipóteses: ⋆ Se todos os estados fı́sicos |φi, |χi e |wi são distintos, podemos assumir ortogonalidade entre todos; obtemos os ket fı́sicos (12.3.1) ou (12.3.2) com 1/3! substituido √ por 1/ 3!. ⋆ Se dois dos estados fı́sicos são iguais, por exemplo |φi = |χi, então temos, para bosões 1 |φ; φ; wi = √ [|1 : φ; 2 : φ; 3 : wi + |1 : φ; 2 : w; 3 : φi + |1 : w; 2 : φ; 3 : φi] , 3 enquanto que para fermiões, o facto de dois estados serem iguais significa que existem duas colunas iguais no determinante de Slater, que como tal é zero. Deste modo, não existe qualquer estado em EA que descreva esta situação. Esta é mais uma manifestação do princı́pio de exclusão de Pauli. 5 Esta técnica de usar um determinante foi introduzida por J.C.Slater em “The Theory of Complex Spectra”, Phys. Rev. 34 (1929) 1293. 12.3 O postulado de simetrização 415 ⋆ Se os três estados fı́sicos são iguais, então temos, para bosões |φ; φ; φi = |1 : φ; 2 : φ; 3 : φi , enquanto que para os fermiões a função de onda é zero. 3) Sistema de N partı́culas idênticas: Genericamente a situação é semelhante aos casos anteriores. Para bosões existe sempre um estado simétrico, mesmo que várias partı́culas estejam no mesmo estado individual. Para fermiões não pode haver repetição do estado individual. Existe uma outra representação de kets fı́sicos que introduz o conceito de número de ocupação. Consideremos um sistema de N partı́culas idênticas. Tomando uma base {|uii} para o espaço de estados de uma partı́cula, construimos a base {|1 : ui; 2 : uj ; . . . ; N : up i} , (12.3.3) para o espaço de estados E. No entanto, a base do espaço de estados fı́sicos ES ou EA é construida actuando com o simetrizador ou o anti-simetrizador na base anterior, o que torna irrelevante qual a numeração da partı́cula que se encontra num estado |uii. O que é realmente relevante é quantas partı́culas se encontram em cada estado, ou seja o número de ocupação de cada estado. Este número corresponde a quantas vezes cada estado aparece num ket da forma (12.3.3). Isso leva-nos a introduzir a notação, para kets fı́sicos |n1 , . . . , nk , . . .i , onde o número de entradas no ket corresponde ao número de estados possı́veis, isto é à dimensão do espaço de estados de uma partı́cula; ni é o número de ocupação do estado |ui i. Subentende-se que este ket corresponde a um ket simetrizado ou anti-simetrizado quando expresso na base (12.3.3). Obviamente X i e para os fermiões ni = {0, 1}. ni = N , 416 Sistemas de partı́culas idênticas 12.3.2 Observáveis e evolução temporal O postulado de simetrização restringe os kets fı́sicos num sistema de partı́culas idênticas aos que são totalmente simétricos ou totalmente anti-simétricos na troca de duas quaisquer partı́culas. Quais as restrições que devemos impôr às observáveis? Em geral, dado que nenhuma propriedade fı́sica é modificada quando os papéis das N partı́culas são permutados, estas N partı́culas devem entrar simetricamente em qualquer observável passı́vel de ser medida, tanto para fermiões como para bosões. Matematicamente, requeremos que as observáveis fı́sicas, Ô, sejam invariantes quando as partı́culas são permutadas, isto é, devem ser operadores simétricos, e como tal de acordo com (12.2.10) devem comutar com os operadores de permutação: [Ô, P̂α ] = 0 , ∀P̂α . (12.3.4) Por exemplo; • Num sistema de duas partı́culas, a observável ~ ~ R̂1 − R̂2 , não é simétrica, e como tal não é fı́sica. A observável fı́sica que reflecte a distância entre as duas partı́culas é q ~ ~ ~ ~ (R̂1 − R̂2 )2 = |R̂1 − R̂2 | . • O operador Hamiltoniano que descreve o átomo de Hélio deverá ser escrito, em primeira aproximação, como P̂ 2 1 P̂ 2 Ĥ(1, 2) = 1 + 2 + 2me 2me 4πǫ0 − 2e2 R̂1 − 2e2 R̂2 + e2 |R̂1 − R̂2 | ! . • O momento angular orbital total num sistema de três partı́culas idênticas será: ~ ~ ~ ~ L̂ = L̂1 + L̂2 + L̂3 . 12.4 Consequências do postulado de simetrização 417 Note-se que o significado de (12.3.4) é também que a acção de uma observável fı́sica num ket fı́sico não retira o ket fı́sico de ES ou EA . Isto é verdade, em particular para o operador Hamiltoniano, que deverá ser uma observável fı́sica. Como este operador é o responsável pela evoluação temporal do sistema, através da equação de Schrödinger, esta evolução não deverá retirar o ket fı́sico do espaço vectorial ES ou EA . Isto atesta a consistência do formalismo. Note-se ainda que as observáveis fı́sicas estarão definidas, à partida, no espaço de estados total E, podendo por isso ter mais vectores próprios (e correspondentes valores próprios) do que aqueles que têm em ES ou EA . Neste sentido, o efeito do postulado de simetrização poderá ser eliminar alguns dos valores próprios de uma observável fı́sica, restrigindo os valores próprios fı́sicos aos que têm vectores próprios associados em ES ou EA . 12.4 Consequências do postulado de simetrização 12.4.1 Diferenças entre bosões e fermiões No enunciado do postulado de simetrização, a diferença entre bosões e fermiões é “apenas” um sinal. Esta diferença de sinal tem, no entanto, consequências notáveis, que são manifestações do princı́pio de exclusão de Pauli, para fermiões, e da ausência de um princı́pio semelhante para bosões. Consideremos duas. Estado fundamental de um sistema de partı́culas idênticas independentes Dado que o Hamiltoniano é uma observável fı́sica tem de ser uma observável simétrica, num sistema de partı́culas idênticas. Vamos assumir que estas são independentes, isto é não se encontram acopladas. Se assim é, o Hamiltoniano pode ser decomposto da seguinte forma: Ĥ(1, 2, . . . , N) = ĥ(1) + ĥ(2) + . . . + ĥ(N) . Note-se que os vários Hamiltonianos individuais são iguais (a menos do ı́ndice de partı́cula), de modo a garantir que o operador Hamiltoniano seja simétrico. Consideremos a base 418 Sistemas de partı́culas idênticas própria de ĥ(j): ĥ(j)|φn i = en |φn i , |φn i ∈ E(j) . Assumimos, por simplicidade, que o espectro é discreto e não degenerado e ordenamos os vectores próprios de modo a que e1 < e2 < e3 < . . .. • Se as partı́culas são bosões, o estado fundamental é (S) |φ1,1,...,1 i = |1 : φ1 ; 2 : φ1 ; . . . ; N : φ1 i , que já está simetrizado, sendo a energia correspondente E1,1,...,1 = Ne1 . • Se as partı́culas são fermiões, o estado fundamental é (A) |φ1,2,...,N i 1 =√ N! |1 : φ1 i ... |1 : φN i ... ... ... , |N : φ1 i . . . |N : φN i sendo a energia correspondente E1,2,...,N = e1 + e2 + . . . + eN . A maior energia individual eN que se encontra no estado fundamental é denominada energia de Fermi. Estatı́stica Quântica Em mecânica estatı́stica clássica (estatı́stica de Maxwell-Boltzmann), as N partı́culas do sistema são tratadas como se tivessem diferentes naturezas, mesmo que sejam idênticas. Dois estados microscópicos, são considerados distintos se as N partı́culas forem idênticas, mas a permutação diferente. Daqui resulta que, em equilı́brio térmico à temperatura T , o número médio de partı́culas com energia Ei é dado por e−βEi P n̄i = N , −βEj je 12.4 Consequências do postulado de simetrização 419 onde a soma é sobre todos os estados microscópicos do sistema e β = 1/KB T . Este resultado é aplicável sempre que a temperatura seja suficientemente alta e a densidade suficientemente baixa para os efeitos quânticos serem negligenciáveis (isto é não haver sobreposição apreciável das funções de onda das partı́culas individuais). Em mecânica estatı́stica quântica o postulado de simetrização tem de ser considerado: • Bosões obedecem à estatı́stica de Bose-Einstein; o número médio de bosões num estado com energia Ei , é dado por 1 n̄i = eα+βEi onde α é determinado pela restrição N= X j −1 , 1 eα+βEj −1 . (12.4.1) Para bosões sem massa (como o fotão), α = 0. Note-se que esta estatı́stica permite que n̄i seja muito elevado. • Fermiões obedecem à estatı́stica de Fermi-Dirac; o número médio de fermiões num estado com energia Ei , é dado por n̄i = 1 eα+βEi +1 , onde α é determinado pela restrição (12.4.1). Note-se que esta estatı́stica limita n̄i a 0 ≤ n̄i ≤ 1, em concordância com o princı́pio de exclusão de Pauli. Estas diferentes estatı́sticas podem ser observadas a baixas temperaturas. Bosões idênticos tendem a acumular-se no estado de menor energia - condensação de Bose-Einstein. Para o 4 He, este fenómeno origina a superfluidez. Para o 3 He, que é um fermião, o mesmo fenómeno não se verifica. A razão de o 3 He ser um fermião e do 4 He ser um bosão é consequência do teorema de adição do momento angular. Note-se que se tentarmos sobrepôr fermiões no mesmo estado quântico, existirá uma força efectiva que contrariará esta tentativa de sobreposição, originando a chamada pressão de Fermi. Esta pressão desempenha um papel importante na evolução estelar. Quando a pressão de radiação deixa de conseguir equilibrar uma estrela, a estrela colapsa. Se a estrela 420 Sistemas de partı́culas idênticas tiver menos de 1.44 massas solares (limite de Chandrasekhar ), a pressão de Fermi devida aos electrões (degenerescência electrónica) evita que o colapso gravitacional continue. Para estrelas com massa superior ao limite de Chandrasekhar, existe energia gravitacional suficiente para forçar os electrões e os protões a combinarem-se em neutrões, formando uma estrela de neutrões. A pressão de Fermi devida aos neutrões pode então travar o colapso gravitacional, se a massa da estrela for inferior a 2 − 3 massas solares. Para massas muito superiores a esta não se conhece nenhum efeito que consiga travar o colapso gravitacional. A estrela evoluirá, em princı́pio, para um buraco negro. 12.4.2 Efeitos de interferência A simetrização/anti-simetrização origina termos de interferência no cálculo de probabilidades. Para vermos este fenómeno consideramos um sistema de duas partı́culas idênticas, uma no estado |φi e outra no estado |χi, ortogonais. O estado fı́sico é i 1 h |φ; χi = √ 1̂ + ǫP̂21 |1 : φ; 2 : χi , 2 onde ǫ = +1, −1 para bosões e fermiões respectivamente. Queremos medir a grandeza fı́sica B, associada às observáveis B̂(1) e B̂(2). Seja {bi } o espectro de B̂, B̂|uii = bi |uii , que tomamos como sendo discreto e não degenerado, por simplicidade. Podemos perguntar qual é a probabilidade de encontrar os valores bn e bn′ (diferentes) numa medição da grandeza fı́sica B das duas partı́culas. Para respondermos, consideramos o ket fı́sico associado a este resultado, que é i 1 h |un ; un′ i = √ 1̂ + ǫP̂21 |1 : un ; 2 : un′ i . 2 12.4 Consequências do postulado de simetrização 421 Logo, a amplitude de probabilidade é 1 † A(bn , bn′ ) = hun ; un′ |φ; χi = h1 : un ; 2 : un′ |(1 + ǫP̂21 )(1 + ǫP̂21 )|1 : φ; 2 : χi 2 = h1 : un ; 2 : un′ |(1 + ǫP̂21 )|1 : φ; 2 : χi = h1 : un ; 2 : un′ |1 : φ; 2 : χi + ǫh1 : un ; 2 : un′ |1 : χ; 2 : φi = hun |φihun′ |χi + ǫhun |χihun′ |φi . Podemos interpretar o resultado para a amplitude de probabilidade do seguinte modo. Associamos os dois kets que descrevem o estado fı́sico |φi e |χi aos dois bras que descrevem o resultado pretendido hun | e hun′ | das duas maneiras possı́veis - figura 12.4. hun | |φi hun | |φi hun′ | |χi hun′ | |χi a) b) Figura 12.4: Associação dos dois kets que descrevem o estado fı́sico |φi e |χi aos dois bras que descrevem o resultado pretendido hun | e hun′ |. O termo a) é denominado termo directo; o termo b) é denominado termo de troca. Cada uma das duas maneiras origina uma amplitude de probabilidade e estas duas amplitudes interferem com sinal diferente para bosões e fermiões, originando probabilidades P(bn , bn′ ) = |A(bn , bn′ )|2 , diferentes. Explicitamente P(bn , bn′ ) = |hun |φihun′ |χi + ǫhun′ |φihun|χi|2 . (12.4.2) Notemos, por contraste, o resultado que seria obtido em Mecânica Quântica se as partı́culas não fossem idênticas. Consideramos que o estado fı́sico que descreve o sistema das duas partı́culas distinguı́veis é |1 : φ; 2 : χi . 422 Sistemas de partı́culas idênticas Fazemos uma medição que, embora as partı́culas sejam distinguiveis, nos dá uma propriedade fı́sica que não distingue entre elas (por exemplo, temos um electrão e um protão e medimos o spin). Logo os dois estados |1 : un ; 2 : un′ i , |1 : un′ ; 2 : un i , descrevem o mesmo resultado da medição. A probabilidade de obtermos os resultados bn e bn′ é dada pela soma das probabilidades de o sistema estar nos estados |1 : un ; 2 : un′ i e |1 : un′ ; 2 : un i: P ′ (bn , bn′ ) = |h1 : un ; 2 : un′ |1 : φ; 2 : χi|2 + |h1 : un′ ; 2 : un |1 : φ; 2 : χi|2 (12.4.3) 2 2 = |hun |φihun′ |χi| + |hun′ |φihun |χi| . Note-se a ausência do termo de interferência, cujo sinal depende de as partı́culas idênticas serem bosões ou fermiões. Este termo manifesta a diferença nas previsões fı́sicas da Mecânica Quântica dependendo se as partı́culas são idênticas - resultado (12.4.2) - ou distinguı́veis - resultado (12.4.3). n O O z z b) a) Figura 12.5: Processo de colisão de partı́culas idênticas no referencial de centro de massa. Assumimos que tanto o estado inicial, a), como o estado final, b), são estados próprios do momento, associados às direcções z e n̂, respectivamente. Para ilustrarmos o significado fı́sico dos termos directo e de troca, consideramos um exemplo mais concreto: a colisão elástica de duas partı́culas idênticas no referencial de centro de massa. Assumimos que o estado fı́sico que representa o estado inicial é 1 |Ψi i = √ (1̂ + ǫP̂21 )|1 : pez ; 2 : −pez i , 2 enquanto que o estado final é descrito por 1 |Ψf i = √ (1̂ + ǫP̂21 )|1 : pn̂; 2 : −pn̂i , 2 12.4 Consequências do postulado de simetrização 423 conforme a figura 12.5. O estado final relaciona-se com o estado inicial através do operador de evolução (4.5.36) |Ψ(t1 )i = Û (t1 , t0 )|Ψi i . Como o Hamiltoniano comuta com P̂21 , também o operador de evolução o fará [Û(t, t′ ), P̂21 ] = 0 . Assim, a amplitude de probabilidade para o processo descrito é: 1 † hΨf |Ψ(t1 )i = h1 : pn̂; 2 : −pn̂|(1̂ + ǫP̂21 )Û (t1 , t0 )(1̂ + ǫP̂21 )|1 : pez ; 2 : −pez i , 2 que, usando † † † (1̂ + ǫP̂21 )Û (t1 , t0 )(1̂ + ǫP̂21 ) = (1̂ + ǫP̂21 )(1̂ + ǫP̂21 )Û(t1 , t0 ) = 2(1̂ + ǫP̂21 )Û (t1 , t0 ) ; pode ser reescrita hΨf |Ψ(t1 )i = h1 : pn̂; 2 : −pn̂|Û(t1 , t0 )|1 : pez ; 2 : −pez i +ǫh1 : −pn̂; 2 : pn̂|Û(t1 , t0 )|1 : pez ; 2 : −pez i . Podemos pensar graficamente nestes dois termos como estando associados aos processos descritos na figura 12.6. Qual termo associamos a qual gráfico é irrelevante. O que importa é que temos de somar ou subtrair as respectivas amplitudes de probabilidade para bosões ou fermiões, respectivamente. n n z a) z b) Figura 12.6: Representação diagramática dos dois processos cujas amplitudes têm de ser consideradas no cálculo da probabilidade do processo descrito na figura 12.5. Um diagrama corresponde ao termo directo, por exemplo a), e outro ao termo de troca, por exemplo b). 424 Sistemas de partı́culas idênticas Fechamos esta subsecção comentando que há situações em que podemos na prática ignorar o postulado de simetrização e trabalhar com a função de onda para partı́culas idênticas, como se fossem partı́culas distinguı́veis. Consideremos dois exemplos. 1) Se as partı́culas idênticas tiverem funções de onda espaciais com uma sobreposição negligenciável, os problemas vistos no inı́cio deste capı́tulo não devem ocorrer, pois as partı́culas não se misturarão e não perderemos o “rasto” de cada uma delas. Em termos matemáticos, sejam U1 e U2 as regiões do espaço onde a função de onda das partı́culas, que rotulamos como (1) e (2), têm suporte. Se perguntarmos qual a probabilidade de encontrarmos uma partı́cula num sub-espaço da região U1 , e a outra num sub-espaço da região U2 , apenas um dos termos - o termo directo, por exemplo -, irá contribuir. O termo de troca será nulo pois corresponde a projectar a função de onda da partı́cula (1)/(2) num sub-espaço de U2 /U1 , onde não têm suporte. A resposta obtida para a densidade de probabilidade será a mesma do que se não simetrizarmos/anti-simetrizarmos a função de onda das partı́culas idênticas. 2) Se as duas partı́culas se encontrarem em estados ortogonais de spin, e o Hamiltoniano de interacção não actuar nas variáveis de spin, o spin funciona como um número quântico conservado que efectivamente distingue as partı́culas. 12.4.3 Difusão de duas partı́culas idênticas com spin A difusão, tal como foi tratada no capı́tulo 10, assumia uma clara separação entre a partı́cula difundida e a partı́cula difusora (modelada por um potencial difusor). O cálculo da secção eficaz de difusão baseava-se na leitura da amplitude de difusão, através da forma assimptótica dos estados estacionários de difusão (10.1.13). No caso de estudarmos difusão de duas partı́culas idênticas, é impossı́vel distinguir entre a partı́cula incidente e a partı́cula difundida. Consequentemente, no referencial de centro de massa, tem-se duas ondas planas incidentes idênticas, em rota de colisão: eikz , e−ikz . A função de onda total que descreve o processo de difusão e é obtida pela resolução da equação de Schrödinger, deverá ser simétrica (para bosões) ou anti-simétrica (para fermiões) na 12.4 Consequências do postulado de simetrização 425 troca das partı́culas ~r1 ↔ ~r2 . Esta troca, no referencial de centro de massa, corresponde a r↔r , θ ↔π−θ , z = r cos θ ↔ −z. (12.4.4) Logo, num sistema de partı́culas idênticas, a parte orbital da função de onda que descreve os estados estacionários de difusão terá a forma assimptótica eikr ~ r →∞ , (~r) −→ eikz ± e−ikz + (f (θ) ± f (π − θ)) vkdif r S,A (12.4.5) e não (10.1.13), onde S, A se referem respectivamente ao sinal ‘+’ e ‘−’ de modo a que a função de onda seja simétrica e anti-simétrica, respectivamente, na troca das duas partı́culas. Note que o sinal desta equação não é determinado pela natureza das partı́culas ser bosónica ou fermiónica. De facto o postulado de simetrização requer que a função de onda total, |Ψi, seja simétrica ou anti-simétrica na troca de duas partı́culas e não a função de onda orbital |vkdif i. Assim, para compreendermos qual o sinal a utilizar na função de onda orbital temos de considerar a função de onda total que terá para além da parte orbital uma parte de spin. Como exemplo consideremos a difusão de dois fermiões de spin 1/2. Vimos na secção 9.5.1 que o momento angular total e a respectiva função de onda de spin, |Si, serão: S = 1 (estado tripleto simétrico) , |1, 1i = |+, +i √ |SiS = |1, 0i = (|+, −i + |−, +i)/ 2 |1, −1i = |−, −i √ |SiA = |0, 0i = (|+, −i − |−, +i)/ 2 . (12.4.6) S = 0 (estado singleto anti − simétrico) , Consideramos agora os dois casos possı́veis: ⋆ Se o sistema estiver polarizado, isto é num estado de momento angular total bem definido (|SiS ou |SiA ), a sua função de onda de spin será simétrica ou anti-simétrica, respectivamente. Como a função de onda total deverá ser anti-simétrica (as partı́culas são fermiões) teremos de escolher a função de onda orbital anti-simétrica ou simétrica respectivamente: |Ψi = |vkdif iA ⊗ |SiS ou |Ψi = |vkdif iS ⊗ |SiA . (12.4.7) 426 Sistemas de partı́culas idênticas Portanto, para um feixe polarizado com S = 1 a secção eficaz diferencial de difusão, dada pelo quadrado do módulo da amplitude de difusão, será: σ(θ, φ)A = |f (θ) − f (π − θ)|2 , (12.4.8) enquanto que para S = 0 será σ(θ, φ)S = |f (θ) + f (π − θ)|2 . (12.4.9) ⋆ Se o sistema não estiver polarizado, isto é estiver numa sobreposição de estado de momento angular total bem definido, a secção eficaz diferencial do processo é obtida calculando uma média de σ(θ, φ)A e σ(θ, φ)S , onde o peso de cada uma é dada pelo número de estados de spin que a ela estão associados. Na prática estamos a considerar todos os estados de spin equiprováveis. No nosso caso temos três estados com S = 1 e um estado com S = 0. Portanto a secção será dada por 3 1 σ(θ, φ) = σ(θ, φ)A + σ(θ, φ)S . 4 4 (12.4.10) O caso geral é agora simples de concluir. Se o spin de cada uma das partı́culas for s haverá 2s + 1 valores possı́veis para o momento angular total S (S = 2s, 2s − 1, . . . , 0); todos os estados no multipleto correspondente a cada S terão a mesma simetria (simétricos ou anti-simétricos na troca de duas partı́culas). A função de onda orbital é escolhida com a simetria apropriada de modo a que a função de onda total seja simétrica (anti-simétrica) se as partı́culas forem bosões (fermiões): ⋆ Se o sistema estiver polarizado no estado com momento angular total S e as partı́culas forem fermiões (bosões) então a secção eficaz diferencial é dada por σ(θ, φ)A = |f (θ) − f (π − θ)|2 , (12.4.11) se o multipleto com momento angular total S for simétrico (anti-simétrico) ou σ(θ, φ)S = |f (θ) + f (π − θ)|2 , (12.4.12) se o multipleto com momento angular total S for anti-simétrico (simétrico). 12.4 Consequências do postulado de simetrização 427 ⋆ Se o sistema não estiver polarizado temos σ(θ, φ) = s+1 s σ(θ, φ)A + σ(θ, φ)S , 2s + 1 2s + 1 (12.4.13) σ(θ, φ) = s s+1 σ(θ, φ)S + σ(θ, φ)A , 2s + 1 2s + 1 (12.4.14) para fermiões e para bosões, dado que genericamente teremos (2s + 1)2 estados de spin dos quais s(2s + 1) serão anti-simétricos e (s + 1)(2s + 1) serão simétricos. Exemplo: Considere a difusão neutrão-neutrão a baixa energia, tomando o potencial de interacção V (r) = ~σ1 · ~σ2 V0 e−αr , r (12.4.15) onde α, V0 são constantes positivas e σi a matriz de Pauli para o neutrão i = 1, 2. Pretendemos calcular a secção eficaz de difusão supondo que os feixes dos neutrões não estão polarizados, na primeira aproximação de Born. Começamos por escrever o operador de spin total do sistema ~ ~ Ŝ = ~ŝ1 + ~ŝ2 = (~σ1 + ~σ2 ) , 2 (12.4.16) dado serem partı́culas de spin 1/2. Logo 1 , se S = 1 2 ~σ1 · ~σ2 = 2 Ŝ 2 − ŝ21 − ŝ22 = . −3 , se S = 0 ~ (12.4.17) Logo, para feixes polarizados o potencial é efectivamente e−αr , se S = 1 V0 r V (r) = . (12.4.18) −αr e −3V0 , se S = 0 r A amplitude de difusão para cada um destes potenciais na primeira aproximação de Born é, usando (10.2.51) e (10.2.39) 2µV0 1 − 2 , se S = 1 2 ~ 4k 2 sin θ2 + α2 fkBorn (θ, φ) = 1 6µV0 , se S = 0 2 θ 2 2 ~ 4k sin 2 + α2 . (12.4.19) 428 Sistemas de partı́culas idênticas A secção eficaz diferencial de difusão é dada por (12.4.10) usando (12.4.8) e (12.4.9) 3 1 σ(θ, φ) = |fkS=1(θ) − fkS=1 (π − θ)|2 + |fkS=0 (θ) + fkS=0 (π − θ)|2 , 4 4 ou 3 2µV0 σ(θ, φ) = − 2 4 ~ 1 6µV0 + 4 ~2 12.5 1 − 2 2 θ 2 2 4k sin 2 + α 4k cos2 2θ + α2 ! 1 1 + 4k 2 sin2 2θ + α2 4k 2 cos2 2θ + α2 1 ! (12.4.20) 2 (12.4.21) 2 . Átomos com vários electrões - A tabela periódica No capı́tulo 6 estudamos o átomo de Hidrogénio, considerando apenas o termo cinético e a interacção de Coulomb entre o electrão e o protão. O problema é exactamente solúvel e obtivemos o espectro e as funções de onda analiticamente. Este estudo foi refinado no capı́tulo 11, em que consideramos as primeiras correcções relativistas e em particular o spin, para perceber e calcular perturbativamente a estrutura fina. Ao considerarmos átomos com vários electrões, o problema, mesmo considerando apenas a interacção de Coulomb, deixa de ser exactamente solúvel. A razão é que existe uma interacção repulsiva de Coulomb entre os vários electrões, que faz com que os electrões deixem de sentir um potencial central. Para um átomo com número atómico Z, o Hamiltoniano será: Z Z X P̂i2 e2 1 X 1 X Ze2 Ĥ = + − , 2me 4πǫ0 i=1 R̂i 4πǫ0 i<j |R̂i − R̂j | i=1 (12.5.1) onde o último termo (que corresponde, de facto, a Z(Z − 1)/2 termos) descreve as interacções entre os electrões do átomo. Note-se que o Hamiltoniano é uma observável simétrica, como requerido para uma observável fı́sica. Podiamos sugerir um tratamento perturbativo para este Hamiltoniano, considerando o terceiro termo em (12.5.1) como uma perturbação aos outros dois, que podem ser resolvidos exactamente. Estimando tanto R̂i como |R̂i − R̂j | pelo raio de Bohr, a razão entre o terceiro e segundo termos em (12.5.1) é Z(Z − 1)/2 , Z2 12.5 Átomos com vários electrões - A tabela periódica 429 que varia entre 1/4 para Z = 2 e 1/2 para Z elevado. Claramente um tratamento perturbativo não será uma boa aproximação. Existe, no entanto uma aproximação que pode ser usada para tratar este problema: a aproximação de campo central. Esta aproximação consiste em considerar que cada electrão sente um potencial efectivo central, Vc (R̂i ), que leva em conta, não só o potencial atractivo do núcleo mas também o potencial repulsivo dos outros electrões. Uma intuição classica revela que o potencial dos outros electrões depende, ele próprio, da localização do electrão que consideramos; para além disso, se o electrão considerado estiver muito próximo de outro electrão e a posição relativa não for radial, o potencial central será uma aproximação pobre. Contudo, em mecânica quântica, onde os electrões se encontram delocalizados, esta aproximação parece ser mais justificada. Assim consideramos o Hamiltoniano do problema (12.5.1) na forma seguinte: Ĥ = Ĥ0 + Ŵ , onde Ĥ0 = Z X i=1 P̂i2 + Vc (R̂i ) 2me ! , Z Z X e2 1 X 1 X Ze2 + − Vc (R̂i ) . Ŵ = − 4πǫ0 i=1 R̂i 4πǫ0 i<j |R̂i − R̂j | i=1 Se o potencial Vc (R̂i ) for escolhido apropriadamente, Ŵ pode ser considerado uma perturbação a Ĥ0 , que por sua vez corresponde a Z cópias de um Hamiltoniano efectivo para uma partı́cula dado por Ĥef e = P̂i2 + Vc (R̂) . 2me (12.5.2) A aproximação de campo central consiste em escolher apropriadamente Vc (R̂), negligenciar Ŵ e resolver Ĥef e . O ponto crucial é a escolha de Vc (R̂), que é um problema complexo e não será aqui tratado. A ideia é procurar uma solução auto-consistente, isto é: i) A escolha do potencial Vc (R̂) tem que garantir que Ŵ é uma perturbação; ii) A função de onda dos outros Z − 1 electrões é calculada usando Vc (R̂); estas funções de onda têm de ser consistentes com o próprio potencial, no sentido que têm de reproduzir a densidade de carga que produz Vc (R̂). 430 Sistemas de partı́culas idênticas Se bem que a determinação exacta de Vc (R̂) seja um problema complexo, a sua forma para pequenas e longas distâncias pode ser vislumbrada de um modo simples. • Para r pequeno, o electrão considerado encontra-se dentro da nuvem electrónica dos outros electrões, sentindo por isso, apenas o potencial nuclear; assim, o potencial será Vc (r) ≃ − 1 Ze2 ; 4πǫ0 r • Para r grande, o electrão considerado encontra-se fora da nuvem electrónica dos outros electrões; efectivamente os Z − 1 electrões anulam Z − 1 cargas positivas do núcleo, pelo que o potencial será Vc (r) ≃ − 1 e2 . 4πǫ0 r Para valores intermédios, Vc (r) interpola entre estes dois comportamentos, de um modo mais ou menos complicado, dependendo do átomo - figura 12.7. Note-se que estes dois potenciais coincidem para o Hidrogénio. Figura 12.7: A tracejado representam-se os potenciais correspondentes às aproximações longe e perto do núcleo. A cheio representa-se um potencial que interpola entre os dois (Extraı́do de Cohen et al, ‘Quantum Mechanics’). 12.5 Átomos com vários electrões - A tabela periódica 12.5.1 431 Nı́veis de energia Estas considerações qualitativas, permitem-nos inferir, qualitativamente, a estrutura do espectro de energias do Hamiltoniano (12.5.2): i) Dado que o potencial efectivo é central, as funções de onda devem ser caracterizadas por um número quântico principal N e um número quântico angular ℓ, tal como no caso do átomo de Hidrogénio. Mas, enquanto que no caso do Hidrogénio, há uma degenerescência acidental (que pode ser ligada a uma simetria escondida do potencial 1/r que alarga o grupo de simetria do problema para SO(4) e não SO(3)) que permite aos valores próprios do Hamiltoniano só dependerem de N, aqui esperamos que os nı́veis de energia dependam de N e ℓ, ou seja, EN,ℓ . Tal como no Hidrogénio, o número quântico principal é introduzido à custa de um inteiro n0 , que surge quando resolvemos a equação radial, e por isso ℓ≤N −1 . ii) Esperamos que a energia aumente com N, para ℓ fixo: EN ′ ,ℓ > EN,ℓ , N′ > N . iii) Esperamos que a energia aumente com ℓ, para N fixo: EN,ℓ′ > EN,ℓ , ℓ′ > ℓ . De facto, quanto maior o momento angular, para N fixo, esperamos que a função de onda esteja localizada mais longe do núcleo, correspondendo portanto a um estado menos ligado. iv) Existe uma degenerescência de 2(2ℓ + 1) de cada nı́vel de energia; o factor (2ℓ + 1) é devido à invariância de rotação (que torna o módulo da função de onda e a energia independentes de mℓ ) e o factor de 2 é devido ao spin. Verifica-se de facto que a hierarquia de energia é muito semelhante para todos os átomos, embora os valores absolutos dependam de Z. A figura 12.8 representa essa hierarquia. Contraste-se o comportamento com o do átomo de Hidrogénio - Figura 6.4. 432 Sistemas de partı́culas idênticas Figura 12.8: Hierarquia energética das várias camadas para um potencial central do tipo representado na figura 12.7. Note-se que para N fixo (na figura representado como n), a energia aumenta com ℓ. Entre parêntises encontra-se a degenerescência de cada nı́vel. Entre chavetas encontram-se nı́veis muito próximos cuja disposição relativa depende do átomo. À direita de cada camada encontram-se os sı́mbolos quı́micos dos átomos cuja última camada ocupada (no estado fundamental) é essa (Extraı́do de Cohen et al, ‘Quantum Mechanics’). 12.5.2 Configurações electrónicas e princı́pio da exclusão de Pauli Como os electrões são fermiões, obedecem ao princı́pio de exclusão de Pauli. Assim, depois de resolvermos o Hamiltoniano (12.5.2) construimos, na aproximação de campo central, as funções de onda de um átomo com número atómico Z através do determinante de Slater, construido com as funções de onda de (12.5.2). O estado fundamental do átomo é assim obtido quando os Z electrões ocupam as orbitais de menor energia de um modo compatı́vel 12.5 Átomos com vários electrões - A tabela periódica 433 com o princı́pio de exclusão de Pauli. Cada nı́vel energético EN,ℓ tem degenerescência 2(2ℓ + 1) e o conjunto de estados individuais associados a essa mesma energia chama-se uma “shell ” ou camada. A lista das camadas ocupadas com os respectivos números de ocupação chama-se a configuração electrónica do átomo. O conhecimento desta configuração electrónica permite-nos interpretar as propriedades fı́sicas e quı́micas de um átomo. A configuração electrónica de um determinado átomo é obtida enchendo as várias camadas, começando no nı́vel de menor energia, 1s, e seguindo a ordem crescente de energia (i.e. pela ordem apresentada na figura 12.8), até esgotar os Z electrões: Z = 1; O átomo de Hidrogénio, no seu estado fundamental, tem o seu único electrão no nı́vel 1s: H : 1s ; Note-se que para o Hidrogénio, a energia não depende de ℓ, pelo que devemos usar a figura 6.4 e não a figura 12.8. Z = 2; O átomo de Hélio, no seu estado fundamental, tem os seus dois electrões no nı́vel 1s: He : 1s2 ; ou seja os dois electrões têm spins opostos; Z = 3; O átomo de Lı́tio, no seu estado fundamental, tem dois electrões no nı́vel 1s e o terceiro no nı́vel 2s: Li : 1s2 , 2s ; Z = 4; O átomo de Berı́lio, no seu estado fundamental, tem dois electrões no nı́vel 1s e dois no nı́vel 2s: Be : 1s2 , 2s2 ; Para Z > 4 começa-se a encher a camada 2p, que pode comportar 6 electrões, correspondendo aos estados fundamentais dos elementos Boro, Carbono, Azoto, Oxigénio, Flúor e 434 Sistemas de partı́culas idênticas Neon. Para Z = 11, 12, enche-se o nı́vel 3s, correspondendo aos estados fundamentais do Sódio e Magnésio, etc. Assim, obtêm-se as configurações electrónicas de todos os átomos, que, em última análise, explicam a tabela periódica de Mandeleev - Figura 12.9. Figura 12.9: Uma tabela periódica dos elementos. Note-se que nı́veis muito próximos (aqueles dentro de chavetas na figura 12.8), podem ser enchidos de uma maneira irregular. Por exemplo, na figura 12.8 a camada 4s é repre- 12.6 Sumário 435 sentada como tendo menos energia que a camada 3d. No entanto, o Crómio (Z = 34) tem 5 electrões na camada 3d e a camada 4s incompleta. Irregularidades semelhantes aparecem para o Cobre (Z = 29), Niobium (Z = 41), etc. Apesar das subtilezas, algumas caracterı́sticas são bastante intuitivas. Por exemplo a energia de ionização para o Hélio é 24.6 eV, ligeiramente menos do que o dobro do valor do Hidrogénio, porque, apesar de existir uma força atractiva entre os electrões e o núcleo que é o dobro daquela que existe no Hidrogénio, existe também uma força repulsiva entre os dois electrões que diminui a energia de ligação. Um comentário final prende-se com o momento angular dos átomos. Pode-se mostrar que numa camada completa, o momento angular total é zero, tal como o momento angular orbital e o momento angular de spin. Assim, o momento angular de um átomo é totalmente devido aos seus electrões exteriores. Por exemplo, o momento angular total do hélio, no seu estado fundamental é zero, tal como para todos os gases raros, enquanto que o momento angular total do Lı́tio é 1/2, devido a um electrão desemparelhado numa orbital s, tal como para todos os metais alcalinos. 12.6 Sumário Neste capı́tulo estudamos a descrição quântica de sistemas com várias partı́culas idênticas. Começamos por observar que existe uma degenerescência de funções de onda que podem descrever o sistema depois de termos feito uma medição do mesmo tão completa quanto possı́vel. Essa “degenerescência de troca” introduz ambiguidades nas previsões fı́sicas. Tais ambiguidades podem ser levantadas introduzindo o postulado de simetrização, que postula que os estados fı́sicos podem ter dois tipos, bosões e fermiões, correspondendo a funções de onda totalmente simétricas ou totalmente anti-simétricas na troca de duas quaisquer partı́culas. As funções de onda fı́sicas são construidas com os operadores simetrizador e anti-simetrizador, definidos à custa dos operadores de permutação, que estudamos em detalhe. Estudamos ainda as diferenças fı́sicas entre bosões e fermiões, a principal das quais é o princı́pio de exclusão de Pauli para os fermiões, inexistente para bosões. A 436 Sistemas de partı́culas idênticas existência deste princı́pio em sistemas de fermiões é responsável pela existência da energia de Fermi e pela ausência de um fenómeno do tipo da condensação de Bose-Einstein. Ele está ainda na origem das diferentes estatı́sticas para bosões e fermiões (Bose-Einstein e Fermi-Dirac). Mostramos como os termos directo e de troca têm interferências diferentes para fermiões e bosões. Terminamos fazendo algumas considerações sobre a estrutura dos átomos com vários electrões. Descrevemos qualitativamente a aproximação de campo central, que nos permite resolver o problema e apresentamos a estrutura dos nı́veis de energia. Juntamente com o princı́pio de exclusão de Pauli, esta estrutura permitiu-nos descrever a configuração electrónica dos átomos, que, por sua vez, permite compreender a estrutura da tabela periódica dos elementos - figura 12.9. CAPÍTULO 13 Introdução à Mecânica Quântica Relativista A teoria quântica que construimos até agora é uma teoria não relativista. A equação de onda de Schrödinger não possui invariância de Lorentz, dado ter sido construida com base na relação de dispersão não relativista (3.0.2). Neste capı́tulo vamos introduzir duas equações de onda invariantes por transformações de Lorentz, i.e. covariantes, de modo a obedecer aos princı́pios da relatividade restrita: a equação de Klein-Gordon e a equação de Dirac. A covariância é necessária para poder aplicar a teoria quântica a partı́culas com energia elevada. Note-se que não é necessário (felizmente!) fazer a teoria totalmente covariante, i.e. compatı́vel com os princı́pios da relatividade geral, pois a interacção gravı́tica é negligenciável nos fenómenos atómicos de interesse para o estudo aqui efectuado. Veremos que, das duas equações, apenas uma - a de Dirac - descreve partı́culas com spin e como tal é a equação relativista apropriada para descrever o electrão. 13.1 A teoria de Klein-Gordon A equação de Schrödinger (3.0.6) foi construı́da no capı́tulo 3 a partir da relação não relativista entre a energia e o momento (3.0.2). Como visto na secção 4.4.2 essa construção 438 Introdução à Mecânica Quântica Relativista pode ser vista como resultando da associação à energia e ao momento dos operadores: E → i~ ∂ , ∂t ~p → −i~∇ . (13.1.1) Se procuramos uma equação fundamental da Mecânica Quântica Relativista é natural fazer esta mesma associação na relação relativista entre a energia e o momento, que é: E 2 = m20 c4 + p2 c2 ⇔ pµ pµ = m20 c2 , (13.1.2) onde m0 é a massa em repouso da partı́cula, c é a velocidade da luz, p2 = p~ · p~ é o quadrado do 3-momento e pµ é o 4-vector momento: E E µ , p~ ⇔ pµ = , −~p , p = c c (13.1.3) onde, em conformidade com a maioria da literatura sobre Mecânica Quântica Relativista e Teoria Quântica de Campo, usamos a métrica de Minkowski com assinatura ‘maioritariamente negativa’ ds2 = ηµν dxµ dxν = (dx0 )2 − δij dxi dxj ; (13.1.4) o 4-vector posição espaço-temporal é: xµ = (x0 , ~x) = (ct, ~x) . Usando (13.1.1) em (13.1.3) obtemos que E 1∂ ∂ pµ = , −~p → i~ , ∇ = i~ µ , c c ∂t ∂x (13.1.5) (13.1.6) ou pµ → i~∂µ , (13.1.7) que é a associação de operadores (13.1.1) em notação manifestamente covariante por transformações de Lorentz (i.e relativista). Usando esta associação em (13.1.2) obtemos a equação de Klein-Gordon:1 m c 2 0 Φ(xµ ) ; 2Φ(x ) = − ~ µ 1 (13.1.8) Esta equação foi descoberta independentemente e praticamente simultaneamente pelo fı́sico sueco Oskar Klein (1894 - 1977), Z.f.Phys. 37 (1926) 895, e pelo fı́sico alemão Walter Gordon (1893-1940), 13.2 Os problemas com a teoria de Klein-Gordon 439 denotamos o operador D’Alambertiano por 2 2 = ∂µ ∂ µ = 1 ∂2 −∆ , c2 ∂t2 (13.1.9) e ∆ é o operador Laplaciano. Estes operadores são a segunda derivada covariante num espaço Lorentziano e Euclidiano respectivamente. Têm uma expressão covariante, isto é válida para um sistema de coordenadas arbitrário e num espaço arbitrário, que é dada pela métrica gµν nesse espaço e nesse sistema de coordenadas: p 1 ∆, 2 . . . = p ∂µ g µν |g|∂ν . . . , |g| (13.1.10) onde |g| é o módulo do determinante da métrica e ‘. . .’ representa a função escalar onde estes operadores actuam. 13.2 Os problemas com a teoria de Klein-Gordon A equação (13.1.8) é de facto uma equação invariante por transformações de Lorentz, ao contrário da equação de Schrödinger. Mas dadas as diferenças fı́sicas entre a Mecânica não relativista e a Mecânica relativista colocam-se duas questões: i) Será que podemos ainda interpretar as soluções da equação de Klein-Gordon Φ(xµ ) como uma função de onda, que descreve uma amplitude de probabilidade, do mesmo modo que fazemos na Mecânica Quântica não relativista? ii) Será que esta é a equação relativista correcta para descrever o electrão? Z.f.Phys. 40 (1926) 117. Contudo, a história parece ser algo mais interessante (ver S.Weinberg, Quantum Field Theory, Vol I, Sec. 1.1). Em 1926 Schrödinger publicou quatro artigos sobre a mecânica ondulatória, em que deriva a ‘sua’ equação, mostra equivalência com a mecânica matricial e só mais tarde, no quarto artigo, apresenta a equação de onda relativista. Contudo, apesar de ter publicado primeiro a equação que tem o seu nome e é não relativista, Schrödinger terá derivado inicialmente a equação relativista (13.1.8). Mas ao calcular o espectro do átomo de hidrogénio, Schrödinger observou que a equação relativista dava o resultado errado para a estrutura fina do átomo de hidrogénio. No limite não relativista, no entanto, a equação (de Klein-Gordon) reduzia-se a uma equação que Schrödinger se apercebeu ser útil (a eq. de Schrödinger) e que foi a eq. inicialmente publicada por ele, apesar de saber que era o limite não relativista de uma eq. incorrecta! Quando, mais tarde, Schrödinger publicou a eq. relativista (Ann. Phys. 81 (1926) 109), esta já havia sido redescoberta por Klein e Gordon. 440 13.2.1 Introdução à Mecânica Quântica Relativista Energias negativas Para respondermos à questão i) consideremos, em primeiro lugar, os estados da equação de Klein-Gordon análogos aos estados estacionários da equação de Schrödinger. Separando variáveis: Φ(xµ ) = T (t)φ(~x) , (13.2.1) a equação de Klein-Gordon fica: − m c 2 1 1 d2 T (t) 1 0 + ∆φ(~ x ) = ; c2 T (t) dt2 φ ~ (13.2.2) pelo argumento habitual esta equção separa-se em duas: − ω2 1 1 d2 T (t) = , c2 T (t) dt2 c2 1 ∆φ(~x) = −k 2 , φ onde introduzimos as constantes ω 2 e k 2 , que obedecem à relação de dispersão: r 2 4 m2 c4 m c ω 2 = k 2 c2 + 02 ⇒ ω± = ± k 2 c2 + 02 . ~ ~ (13.2.3) (13.2.4) A solução geral da primeira equação em (13.2.3) é T (t) = c+ e−iω+ t + c− e−iω− t , (13.2.5) enquanto que a segunda equação pode ser escrita como −∆φ(~x) = k 2 φ(~x) , (13.2.6) que é exactamente a forma da equação de Schrödinger livre e independente do tempo. A diferença fundamental é que no tratamento não relativista o vector de onda de uma partı́cula livre relaciona-se com a frequência por: k2 = p2 2mE 2mω = = 2 2 ~ ~ ~ ⇔ ω= ~k 2 . 2m (13.2.7) e, em particular existe apenas uma frequência para cada vector de onda. No caso relativista, k 2 relaciona-se com a frequência pela relação de dispersão (13.2.4) e, em particular, existem duas frequências possı́veis para cada k 2 , correspondendo a um modo de energia positiva e 13.2 Os problemas com a teoria de Klein-Gordon 441 outro de energia negativa. A existência de dois modos para cada comprimento de onda é uma consequência directa da equação de Klein-Gordon ser de segunda ordem na derivada temporal. Assim, escrevemos a solução como Φ(xµ ) = Φ+ (xµ ) + Φ− (xµ ) , Φ± (xµ ) = φ(~x)e−iω± t , (13.2.8) onde Φ+ (xµ ) (Φ− (xµ )) correspondem ao modo com energia positiva (negativa), como pode ser verificado pela acção do operador (13.1.1). A existência de modos com energia negativa pode ser problemática, se não existir um limite inferior para as energias negativas. Para ilustrar este ponto considermos a equação de Klein-Gordon num intervalo. Isto é, requeremos que φ(x) seja não nulo somente em 0 < x < a, anulando-se, por continuidade nos extremos. Esta situação é o análogo a um poço de potencial de profundidade infinita para a eq. de KG. A solução tem a forma (13.2.8) com φ(x) = A sin(kn x) , kn = nπ , n∈N, a onde A é uma constante de normalização. Por (13.2.4), r n2 π 2 c2 m20 c4 ω± = ± + 2 . a2 ~ (13.2.9) (13.2.10) Logo, a energia não está limitada inferiormente; ω− torna-se arbitrariamente grande e negativo para n grande. Isto implica que somente a teoria livre é consistente. Se introduzirmos interacções que permitam à partı́cula saltar de um nı́vel energético para outro, poderemos extrair uma energia arbitrariamente grande do sistema quando a partı́cula de Klein-Gordon saltar para nı́veis de energia arbitrariamente grande e negativa. A existência de tais nı́veis é uma razão para considerarmos que a equação de Klein-Gordon não é adequada para descrever quânticamente uma partı́cula relativista com interacções. 13.2.2 Probabilidades negativas A interpretação das soluções da equação de Schrödinger como amplitudes de probabilidade foi legitimada por existir um produto escalar. Para sermos concretos consideremos funções 442 Introdução à Mecânica Quântica Relativista de onda em R3 ; esse produto escalar toma a forma (4.1.6) Z (φ, ψ) = d3~xφ∗ (~x)ψ(~x) . (13.2.11) Este produto é: i) positivo (cf. secção 4.1.1), permitindo como tal definir uma norma positiva, Z 2 ||ψ|| = d3~xψ ∗ (~x)ψ(~x) , (13.2.12) associada a uma densidade de probabilidade positiva: P(~x) = ψ ∗ (~x)ψ(~x) ≥ 0 , ∀~x ; (13.2.13) ii) globalmente conservado na evolução do sistema, dada a hermiticiade do operador Hamiltoniano (cf. secção 4.4.4): d (φ, ψ) = 0 . dt (13.2.14) Note que conservação local de probabilidade é expressa pela equação de continuidade (4.4.55) ∂ ~ x, t) = 0 , P(~x, t) + ∇ · J(~ ∂t (13.2.15) onde o vector densidade de corrente de probabilidade é (4.4.53). Para a equação de Klein-Gordon podemos introduzir um 4-vector densidade de corrente conservado, definido por Jµ (xα ) = i [Φ∗ (xα )∂µ Φ(xα ) − Φ(xα )∂µ Φ∗ (xα )] . (13.2.16) A equação de Klein-Gordon garante que ele é conservado: ∂ µ Jµ = 0 . (13.2.17) De facto ∂ µ Jµ = i [∂ µ Φ∗ (xα )∂µ Φ(xα ) + Φ∗ (xα )∂ µ ∂µ Φ(xα ) − ∂ µ Φ(xα )∂µ Φ∗ (xα ) − Φ(xα )∂µ ∂ µ Φ∗ (xα )] = i [Φ∗ (xα )2Φ(xα ) − Φ(xα )2Φ∗ (xα )] h 2 (13.1.8) = i −Φ∗ (xα ) m~0 c Φ(xµ ) + Φ(xα ) m0 c 2 ~ i Φ∗ (xµ ) = 0 . (13.2.18) 13.2 Os problemas com a teoria de Klein-Gordon 443 A equação (13.2.17) é uma versão covariante da equação de continuidade (13.2.15). Por isso usamos a componente temporal do co-vector Jµ para definir um novo produto escalar : Z Z ∗ α α α ∂Φ (x ) 3 α 3 ∗ α ∂Φ(x ) − Φ(x ) , (13.2.19) (Φ, Φ) ≡ d ~xJ0 (x ) = i d ~x Φ (x ) ∂x0 ∂x0 ou, generalizando para campos diferentes e usando x0 = ct Z α ∗ α i 3 ∗ α ∂Ψ(x ) α ∂Φ (x ) d ~x Φ (x ) . (Φ, Ψ) ≡ − Ψ(x ) c ∂t ∂t (13.2.20) Note-se que este produto escalar pressupõe uma foliação particular do espaço-tempo: foi escolhida um certa famı́lia de hiper-superfı́cies espaciais onde se integra. Este produto é i) Conservado d (Φ, Ψ) = 0 ; dt (13.2.21) 2 ∗ α ∂ 2 Ψ(xα ) α ∂ Φ (x ) d ~x Φ (x ) − Ψ(x ) ∂t2 ∂t2 Z (13.1.8) = ic d3~x {Φ∗ (xα )∆Ψ(xα ) − Ψ(xα )∆Φ∗ (xα )} = 0 , (13.2.22) de facto d i (Φ, Ψ) = dt c Z 3 ∗ α onde a última igualdade é verificada integrando por partes e negligenciando o termo fronteira (assume-se que o campo se anula no infinito). ii) Mas não é positivo: Fazendo o produto escalar entre modos de energia positiva (energia negativa) (13.2.8) obtemos 2ω± (Φ , Φ ) = c ± ± Z d3~xφ∗ (~x)φ(~x) , (13.2.23) que é claramente positivo (negativo): modos de energia negativa têm norma negativa. Deste modo o produto escalar conservado não nos permite pensar numa solução genérica da equação de Klein-Gordon como descrevendo uma amplitude de probabilidade, dado que a densidade de probabilidade correspondente poderia ser negativa. A existência de tais normas negativas revela que a interpretação de Born não pode ser extrapolada para as ‘funções de onda de Klein-Gordon’. A Mecânica Quântica não relativista não encontra paralelo na teoria de Klein-Gordon. 444 13.2.3 Introdução à Mecânica Quântica Relativista Inexistência de spin No capı́tulo 1 vimos que a força de Lorentz que actua numa partı́cula carregada,2 ~ v ~ , ~ + ×B (13.2.24) F~ = q E c pode ser reproduzida no formalismo Hamiltoniano tomando H= ~ 2 (~p − q A/c) + qφ . 2m (13.2.25) Como discutido nessa altura vimos que a interacção com o campo magnético é efectivamente considerada pela substituição (designada por acoplamento minimal ) q~ p~ −→ p~ − A . c (13.2.26) Notamos aqui que a interacção com o campo eléctrico é também efectivamente considerada pela substituição E → E − qφ ; (13.2.27) as duas últimas equações correspondem às componentes espaciais e temporal, respectivamente, da seguinte equação covariante: E q E − qφ q~ µ p = , p~ → , ~p − A = pµ − Aµ , c c c c (13.2.28) onde definimos o 4-vector potencial electromagnético como ~ µ = (φ, A) ~ ⇔ A ~ µ = (φ, −A) ~ . A (13.2.29) As substituições (13.2.26) e (13.2.27) transformam a relação relativista para a energia em 2 ~ 2 ⇔ pµ − q Aµ = m2 c2 . (E − qφ)2 = m20 c4 + (c~p − q A) (13.2.30) 0 c A equação de Klein-Gordon minimalmente acoplada a um campo electromagnético, é obtida pela associação (13.1.7) na última equação, obtendo-se q µ q µ i~∂µ − Aµ i~∂ − A Φ(xα ) = m20 c2 Φ(xα ) . c c 2 (13.2.31) Neste capı́tulo vamos usar unidades electromagnéticas diferentes das usadas no capı́tulo 1, de modo a que os campos eléctrico e magnético fiquem com as mesmas dimensões; isto corresponde a transformar ~ → B/c ~ em (1.1.7) e A ~ → A/c ~ em (1.3.20). B 13.2 Os problemas com a teoria de Klein-Gordon 445 Potencial de Coulomb Para testar se o electrão do átomo de Hidrogénio é apropriadamente descrito pela equação de Klein-Gordon (13.2.31), vamos resolver esta equação para o potencial de Coulomb. Tomamos Aµ = e ~ ,0 , 4πǫ0 r q = −e , m0 = me , (13.2.32) onde e é a carga do electrão (em módulo) e procuramos os estados estacionários da equação de Klein Gordon usando o seguinte ansatz: Φ(xµ ) = F (r)Yℓm (θ, φ)e−iEt/~ . (13.2.33) A equação (13.2.31) fica ~∂ e2 e2 ~∂ 2 2 2 i + ~ ∆ − me c F (r)Yℓm (θ, φ)e−iEt/~ = 0 , + + i c ∂t 4πǫ0 cr c ∂t 4πǫ0 cr (13.2.34) ou, usando 1 ∂ ∆= 2 r ∂r L̂2 2 ∂ r − 2 2 , ∂r r ~ (13.2.35) obtemos " E α~ + c r 2 ~2 d + 2 r dr # 2 d ~ ℓ(ℓ + 1) r2 − − m2e c2 F (r) = 0 , dr r2 (13.2.36) onde introduzimos a constante de estrutura fina α, dada por (2.2.4). Escrevendo F (r) = R(r) , r (13.2.37) a equação fica d2 −r R(r) = dr 2 2 E 2 − m2e c4 2 2Eα 2 R(r) . r + r − ℓ(ℓ + 1) − α ~ 2 c2 c~ (13.2.38) Notemos que, em primeira aproximação em v/c, E 2 − m2e c4 = me c2 p 1− (v/c)2 !2 − m2e c4 ≃ m2e v 2 c2 = 2me Ec c2 , E ≃ me c2 , (13.2.39) 446 Introdução à Mecânica Quântica Relativista onde Ec é a expressão habitual para a energia cinética não relativista; negligenciando ainda o termo em α2 em (13.2.38), esta equação reduz-se a 2 2me Ec 2 me e2 2 d R(r) ≃ r + r − (ℓ(ℓ + 1)) R(r) , −r dr 2 ~2 2πǫ0 ~2 (13.2.40) que coincide com a equação (6.4.3) que descreve o átomo de Hidrogénio (sem spin) na mecânica quântica não relativista. Portanto, no limite não relativista, a equação de KleinGordon acoplada a um campo electromagnético dará o espectro correcto para o átomo de hidrogénio (6.4.18). Contudo este resultado só é válido em primeira ordem em α e vimos no capı́tulo 11 as primeiras correcções que originam a estrutura fina. Se a equação de Klein-Gordon for a equação correcta para descrever o electrão do átomo de Hidrogénio, essas correcções deverão emergir naturalmente da solução de (13.2.38). É simples obter a solução exacta desta equação usando os resultados do capı́tulo 6: tal como para (6.4.3), transformamos (13.2.38) na equação de Whittaker (6.4.4) fazendo z2 m2 c4 − E 2 2 2p 2 4 = e 2 2 r ⇔ z= me c − E 2 r , 4 ~c ~c (13.2.41) que é a relação análoga a (6.4.15) e Eα k=p , m2e c4 − E 2 m= s 1 ℓ+ 2 2 − α2 , (13.2.42) que são as relações análogas a (6.4.16). Como visto em detalhe na secção 6.4, para que a função de Whittaker convirja quando z → +∞, tem de existir um inteiro n0 tal que n0 + m − k + 1/2 = 0 , n0 ∈ N0 . (13.2.43) Esta condição fica, com as identificações anteriores s 2 1 Eα 1 + =0, n0 + − α2 − p ℓ+ 2 4 2 2 2 me c − E (13.2.44) que, introduzindo o número quântico principal N ≡ n0 + ℓ + 1 e resolvendo para a energia fica −1/2 α2 EN,ℓ = me c2 1 + 2 q 2 N − ℓ − 21 + ℓ + 12 − α2 . (13.2.45) 13.2 Os problemas com a teoria de Klein-Gordon 447 Este é o espectro de energias exacto obtido da equação de Klein-Gordon acoplada ao potencial de Coulomb; depende de dois números quânticos, N e ℓ que são os números quânticos principal e de momento angular habituais. Podemos agora verificar que este espectro não explica correctamente a estrutura fina do átomo de Hidrogénio. Fazendo uma expansão de (13.2.45) em potências de α obtém-se: EN,ℓ = me c 2 α2 α4 1− − 2N 2 2N 4 3 N 1 − 4 ℓ+ 2 6 + O(α ) . (13.2.46) O primeiro termo é a energia associada à massa em repouso do electrão; o segundo termo é o espectro de energias obtido no capı́tulo 6 para o átomo de Hidrogénio (6.4.18); o terceiro termo deveria ser o termo de estrutura fina. Para o nı́vel N = 2 este termo separa as orbitais 2s e 2p, que passam a ter energia (até ordem α4 ) E2,0 = −me c 2 α2 13α4 + 8 128 , E2,1 = −me c 2 α2 7α4 + 8 384 , (13.2.47) que estão portanto separadas por E2,1 − E2,0 = 8 4me c2 α4 . 3 128 (13.2.48) Como discutido na secção 11.1.4 a separação observada experimentalmente (e correctamente explicada pela teoria perturbativa) é de apenas 4me c2 α4 /128. Portanto a equação de Klein-Gordon não explica correctamente a estrutura fina. Logo a equação de KleinGordon não descreve correctamente a fı́sica do electrão do átomo de Hidrogénio. A razão é que a função de onda de Klein-Gordon não contém graus de liberdade de spin, que é fundamental para obter a estrutura fina correcta. De facto, como visto na secção 9.4, a descrição (não relativista) de partı́culas de spin 1/2 envolve 2-spinores que contêm duas funções de onda espaciais, cada uma descrevendo a amplitude de probabilidade de um estado de spin. A equação de Klein-Gordon só possui uma função espacial, pelo que não possui os graus de liberdade necessários para descrever o spin e como tal para descrever apropriadamente o electrão. 448 13.3 Introdução à Mecânica Quântica Relativista A teoria de Dirac Paul Dirac sugeriu, em 1928, uma equação relativista para o electrão, que naturalmente introduzia o seu spin, explicando correctamente a sua interacção com campos electromagnéticos, e que tinha um produto escalar positivo associado. A intuição de Dirac foi que os problemas da equação de Klein-Gordon, nomeadadamente as probabilidades e energias negativas, estariam associados a esta equação ser de segunda ordem nas derivadas temporais. Dirac tentou, por isso, factorizar a equação de Klein-Gordon para obter uma equação de primeira ordem na derivada temporal e relativista. Dirac tentou factorizar a expressão da energia relativista (13.1.2) escrevendo-a da seguinte forma: pµ pµ − m20 c2 = 0 ⇔ (γ µ pµ + m0 c)(γ ν pν − m0 c) = 0 , (13.3.1) o que é verdade se o objecto γ µ obedecer à seguinte propriedade: γ (µ γ ν) ≡ 1 µ ν (γ γ + γ ν γ µ ) = η µν . 2 (13.3.2) Se as componentes de γ µ forem números é manifestamente impossı́vel resolver estas equações. Por exemplo teriamos de resolver simultaneamente (γ 0 )2 = 1 , (γ 1 )2 = −1 , γ 0γ 1 = 0 . (13.3.3) A grande (enormı́ssima!) intuição de Dirac foi sugerir que as componentes de γ µ poderiam ser matrizes. Como matrizes genericamente não comutam, a factorização (13.3.1) seria verdadeira se {γ µ , γ ν } = 2η µν , (13.3.4) {A, B} ≡ AB + BA . (13.3.5) onde definimos o Anti-comutador As relações de anti-comutação (13.3.4) definem uma álgebra denominada álgebra de Clifford e as matrizes ‘gama’ são designadas por matrizes de Dirac. Usando a associação (13.1.7), obtemos uma equação de primeira ordem igualando a zero qualquer um dos factores em 13.3 A teoria de Dirac 449 (13.3.1), a actuar numa função de onda Ψ(~x), que será um vector coluna no mesmo espaço vectorial em que estão definidas as matrizes γ µ . Escolhendo o segundo factor em (13.3.1), que corresponde à energia positiva, obtemos a equação de Dirac: i~γ µ ∂µ Ψ(xα ) = m0 cΨ(xα ) . (13.3.6) As matrizes γ µ Para estudar detalhadamente a equação de Dirac temos de ter uma forma explı́cita para as matrizes γ µ , µ = 0, 1, 2, 3. Em primeiro lugar podemos perguntar qual será a dimensão destas matrizes. Para cada dimensão espaço-temporal, existe uma dimensão mı́nima para a representação da álgebra de Clifford; em quatro dimensões a representação minimal da álgebra de Clifford tem dimensão quatro que é a dimensão das matrizes γ µ . Há várias escolhas diferentes (ditas representações) para estas matrizes. Aqui iremos usar a seguinte representação: γ0 = 1 0 0 −1 , γi = 0 σi −σi 0 , (13.3.7) onde σi são as matrizes de Pauli (9.1.36) e 1 é a matriz identidade em duas dimensões. A ‘função de onda de Dirac’ Ψ(xα ), será, portanto, representada por um vector coluna quatro dimensional que é um spinor de quatro componentes ou 4-spinor : α Ψ (x ) 1 α α Ψ (x ) [Ψ] (x ) , = 2 Ψ(xα ) = α α χ1 (x ) [χ] (x ) χ2 (xα ) (13.3.8) onde [Ψ]a (xα ), a = 1, 2 representam dois 2-spinores, na notação da secção (9.4.1). Se no caso da equação de Klein-Gordon tinhamos graus de liberdade insuficientes para descrever uma partı́cula com spin 1/2, aparentemente, na equação de Dirac temos demasiados graus de liberdade para tal!... Exercı́cio: Verifique que as matrizes de Dirac (13.3.7) obedecem à álgebra de Clifford (13.3.4). 450 Introdução à Mecânica Quântica Relativista 13.3.1 Os sucessos da equação de Dirac Vamos agora enumerar, sem demonstrar, os sucessos da teoria de Dirac. i) É possı́vel definir um produto escalar, que é invariante por transformações de Lorentz, conservado e definido positivo; a norma de uma função de onda de Dirac é (Ψ, Ψ) = Z 3 † d ~xΨ Ψ = Z d3~x |Ψ1 (xα )|2 + |Ψ2 (xα )|2 + |χ1 (xα )|2 + |χ2 (xα )|2 , (13.3.9) que generaliza para 4-spinores a forma da norma para 2-spinors (9.4.20). ii) No limite não relativista, a teoria de Dirac reduz-se à teoria de Pauli, com o factor giromagnético correcto para o electrão, g = 2. Para obter este resultado é necessário acoplar a equação de Dirac a um campo electromagnético, o que é feito pelo acoplamento minimal (13.2.28). Obetém-se a equação de Dirac na presença de um campo electromagnético descrito pelo 4-potencial Aµ : iq i~γ ∂µ + Aµ Ψ(xα ) = m0 cΨ(xα ) . c~ µ (13.3.10) Especializando para o electrão q = −e. Uma manipulação desta equação com, a aproximação p0 c ≃ m0 c2 + H , (13.3.11) onde H ≪ m0 c2 leva ao resultado, considerando apenas campo magnético HΨ(xα ) ≃ ( ~ 2 e~ (~p + eA/c) ~ + ~σ · B 2m0 2m0 c ) , (13.3.12) que é o Hamiltoniano de Pauli (9.3.4) (com a diferente convenção para os campos electromagnéticos e q = −e) na ausência de campo eléctrico, com a razão giromagnética correcta. iii) Na presença de um campo de Coulomb, a solução exacta para o espectro de energias 13.3 A teoria de Dirac 451 da equação de Dirac é EN,J −1/2 α2 = me c 1 + 2 q 2 N − J − 21 + J + 12 − α2 2 . (13.3.13) Esta é a fórmula (11.1.104) que, como discutido na secção (11.1.4) dá os nı́veis correctos para a estrutura fina do átomo de Hidrogénio. O número quântico J é o número quântico de momento angular total (que tem de ser apropriadamente definido). Notese que é a mesma fórmula que (13.2.45) substituindo J ↔ ℓ o que demonstra que a incapacidade da equação de Klein-Gordon descrever a estrutura fina resulta de não levar em conta o spin. A equação de Dirac possui, tal como a equação de Klein-Gordon, estados de energia negativa, o que, como discutido anteriormente pode originar problemas na teoria interactiva. No entanto, como a equação de Dirac descreve fermiões, Dirac concebeu uma teoria (do ‘mar de electrões’) em que todos estes estados de energia negativa estariam preenchidos (possı́veis vagas eram interpretadas como anti-partı́culas, isto é, positrões). Assim, o problema de os usar para extrair infinita energia do sistema era resolvido. No entanto esta interpretação, bem como a interpretação da teoria de Dirac como descrevendo a Mecânica Quântica Relativista de uma partı́cula de spin 1/2, foi rapidamente ultrapassada. O ponto fundamental é que a Mecânica Quântica Relativista não deve ser vista como a descrição de uma partı́cula. A possibilidade relativista de conversão de massa em energia torna a Mecânica Quântica Relativista necessariamente uma teoria de muitas partı́culas. Esta é a perspectiva da Teoria Quântica de Campo, onde os campos são promovidos a operadores (deixando de ser vistos como funções de onda) sujeitos a regras de comutação ou anti-comutação. Este procedimento de promover os campos a operadores com regras de comutação/anti-comutação é denominado, por vezes, segunda quantificação (pois a primeira é a quantificação das observáveis que discutimos no capı́tulo 4). Em teoria Quântica de Campo, quer a equação de Dirac quer a equação de Klein-Gordon encontram 452 Introdução à Mecânica Quântica Relativista naturalmente o seu lugar, descrevendo a dinâmica de sistemas de partı́culas de spin 1/2 e 0 respectivamente. 13.4 Sumário Neste capı́tulo fizemos uma breve introdução ao casamento das ideias da Relatividade Restrita com as ideias da Mecânica Quântica. Uma primeira tentativa deste matrimónio resulta na equação de Klein-Gordon, que tem vários problemas para ser compatibilizada quer com as ideias da Mecânica Quântica não Relativista, quer com a fı́sica do electrão. Estes problemas podem ser resolvidos pela equação de Dirac. No entanto, a tentativa de extrapolar as ideias da Mecânica Quântica não Relativista para uma Mecânica Quântica Relativista acaba por ser naturalmente ultrapassada por uma descrição que leva em conta muitas partı́culas e não apenas uma - a Teoria Quântica de Campo. Parte III Tópicos Avançados e Modernos CAPÍTULO 14 Formulação de integrais de caminho da Mecânica Quântica CAPÍTULO 15 Mecânica Quântica Super-simétrica CAPÍTULO 16 Introdução à teoria da Informação Quântica Parte IV Apêndices APÊNDICE A Geometria da Transformada de Legendre A transição do Lagrangeano para o Hamiltoniano é um exemplo de uma transformada de Legendre, de que vamos agora fornecer uma interpretação geometrica. Por simplicidade vamos considerar apenas o caso com uma única variável dinâmica. Consideremos uma função diferenciavel L(v), de um variável v. O gráfico de L(v) é uma curva contı́nua de todos os pontos (v, L(v)) como a representada na figura A.1. A derivada da função em cada ponto é denotada p(v) ≡ dL . dv (A.1) A transformada de Legendre é uma maneira de reproduzir a curva inteiramente em termos de p, sem referência a v; p torna-se a variável independente cujos valores são usados para construir a curva. Mas tal como os valores de v sem os valores de L são insuficientes para construir a curva, somente os valores de p são também insuficientes, pelo que necessitamos de uma nova função H(p). A função H(p) é construida da seguinte maneira. Consideremos a tangente à curva L(v) no ponto v = v0 . O declive da tangente é p(v0 ) = p0 , (A.2) 460 Geometria da Transformada de Legendre L(v) v0 v y0 = L(v0 ) − p0 v0 Figura A.1: A curva que representa um ‘Lagrangeano’ L(v) como função da velocidade v. A tangente à curva em v0 tem declive p0 e ordenada na origem y0 ≡ L(v0 ) − p0 v0 . e a ordenada na origem da tangente é y0 = L(v0 ) − p0 v0 . (A.3) Para um ponto arbitrário, (v, L(v)), a tangente à curva tem declive p = dL/dv e tem ordenada na origem y(v, p) = L(v) − pv . (A.4) Vamos assumir que (A.1) é invertivel. Voltaremos a este ponto mais tarde. Podemos então obter v = v(p) de um modo único. Definimos a função H(p) como H(p) = −y(v(p), p) = pv(p) − L(v(p)) . (A.5) O conhecimento de p e H(p) permite-nos reconstruir a curva da figura A.1. De facto, cada combinção (p, H(p)) corresponde a uma linha de declive p e ordenada na origem H(p) no plano (v, L). Geometricamente, a curva L(v) é o envelope destas linhas, a curva contı́nua tangente a todas elas. Esta construção é esquematizada na figura A.2. Analiticamente, a partir do conhecimento de H(p) determinamos v = v(p) dv(p) dL(v(p)) dH(p) =v+p − = v(p) . dp dp dp (A.6) Assumindo a invertibilidade de v = v(p) obtemos p = p(v) e como tal de (A.5) obtemos L(v) = H(p(v)) − p(v)v . (A.7) 461 L(v) v Figura A.2: Conhecendo o declive das tangentes, p, e as suas ordenadas na origem, H(p), é possivel reconstruir a forma da curva L(v). A semelhança desta equação com (A.5) é sugestiva. Tal como (p, H(p)) é a representação da curva L(v) no plano (v, L) pelo (declive, (menos) ordenada na origem) das tangentes a essa curva, também (v, L(v)) é a representação da curva H(p) no plano (p, H) pelas tangentes a essa curva. Uma nota sobre a invertibilidade de p(v). Invertibilidade significa que p(v) é injectiva. Logo p(v) não tem máximos ou mı́nimos. Dado que p(v) = dL/dv, concluimos que L(v) não pode ter pontos de inflexão. Por um raciocı́nio semelhante concluimos que também H(p) não pode ter pontos de inflexão. Em mais do que uma dimensão, invertibilidade significa que as matrizes Hessianas ∂2L , ∂v i ∂v j são não singulares. ∂2H , ∂pi ∂pj (A.8) APÊNDICE B Princı́pio do tempo mı́nimo de Fermat Neste apêndice derivamos as leis da reflexão e refracção ondulatórias recorrendo ao princı́pio do tempo mı́nimo de Fermat. B.1 Reflexão Consideremos dois pontos no plano xy, como na figura B.1. Consideremos um raio de luz que une os dois pontos através de uma linha recta que é reflectida no eixo do x. Várias y ∆x x Figura B.1: Dois pontos que distam de ∆x ao longo do eixo do x podem ser unidos por uma infinidade de trajectórias que reflectem no eixo do x. De todas essas trajectórias, a que minimiza a distância entre os dois pontos obedece à lei da reflexão. 464 Princı́pio do tempo mı́nimo de Fermat y l1 θ1 θ2 l2 x ∆x Figura B.2: A trajectória real vai obedecer a θ1 = θ2 . trajectórias possiveis estão desenhadas na figura B.1. O princı́pio do tempo mı́nimo de Fermat diz-nos que a trajectória real é a que minimiza o tempo que o raio de luz demora de um ponto até ao outro. Como a velocidade é constante, a trajectória real será aquela que minimiza a distância. Considermos uma trajectória possı́vel que faz ângulos θ1 e θ2 com a perpendicular à superfı́cie de reflexão, conforme esquematizado na figura B.2. A distância total percorrida é ∆s(θ1 , θ2 ) = l1 l2 + , cos θ1 cos θ2 (B.1) que é a quantidade que pretendemos minimizar, como função de θ1 e θ2 , mas onde l1 e l2 são fixos. Ou seja pertendemos calcular θ1 e θ2 de modo que 0 = d(∆s(θ1 , θ2 )) = sin θ1 l1 sin θ2 l2 dθ1 + dθ2 . 2 cos θ1 cos2 θ2 (B.2) A extremização está sujeita à condição de que a distância total segundo x, ∆x é constante ∆x = sin θ1 l1 sin θ2 l2 + = constante . cos θ1 cos θ2 (B.3) Diferenciando esta equação obtemos l2 l1 dθ1 + dθ2 = 0 , 2 cos θ1 cos2 θ2 (B.4) que, substituindo em (B.2), resulta em sin θ2 l2 sin θ1 l2 dθ = dθ2 2 cos2 θ2 cos2 θ2 ⇔ sin θ1 = sin θ2 , (B.5) B.2 Refracção 465 ou, como 0 < θ1 , θ2 < π/2, θ1 = θ2 , (B.6) que é a lei da reflexão. B.2 Refracção Consideramos agora dois pontos em dois meios diferentes. No meio 1, a luz move-se à velocidade v1 ; no meio 2 a luz move-se à velocidade v2 . Na figura B.3 mostra-se um conjunto de trajectórias, rectilı́neas em cada meio, que unem os dois pontos. A minimização do tempo de viagem de um raio de luz não corresponde neste caso à minimização da distância devido à diferente velocidade nos dois meios. A minimização do tempo irá corresponder a um compromisso entre viajar o máximo de distância possı́vel no meio onde a velocidade é maior, sem, contudo, aumentar demasiado a distância a percorrer. y MEIO 1 MEIO 2 x Figura B.3: Várias trajectórias possı́veis para um raio de luz unindo dois pontos em meios diferentes. Tomando uma trajectória como aquela exibida na figura B.4, pertendemos extremizar ∆t, dado por ∆t(θ1 , θ2 ) = ∆x l1 l2 = + , v v1 cos θ1 v2 cos θ2 (B.1) ou seja determinar θ1 , θ2 de modo a que 0 = d(∆t(θ1 , θ2 )) = l2 sin θ2 l1 sin θ1 dθ + dθ2 . 1 v1 cos2 θ1 v2 cos2 θ2 (B.2) 466 Princı́pio do tempo mı́nimo de Fermat y l1 θ1 MEIO 1 ∆x MEIO 2 x l2 θ2 Figura B.4: A trajectória real vai obedecer à lei de Snell. A extremização é sujeita à condição de que a distância segundo x, ∆x é constante, ∆x = l1 sin θ1 l2 sin θ2 + = constante . cos θ1 cos θ2 (B.3) Diferenciando a última equação obtemos l1 l2 dθ + dθ2 = 0 , 1 cos2 θ1 cos2 θ2 (B.4) que substituindo em (B.2) resulta em v1 sin θ1 = . sin θ2 v2 Obtemos assim a Lei de Snell. (B.5) APÊNDICE C Análise de Fourier A análise de Fourier fornece a expansão de uma função f (x) em termos de senos e cossenos. Para este próposito distinguem-se dois tipos de funções. C.1 Séries de Fourier Se a função é periódica com perı́odo L ∈ R, isto é f (x) = f (x + L) , então as funções sinusoidais na expansão têm de ter perı́odo 2πn 2πn(x + L) 2πnx kn ≡ = sin , , n ∈ N ⇒ sin L L L (C.1) (C.2) e analogamente para o cosseno. Funções sinusoidais com outros perı́odos não respeitam a periodicidade da função a expandir. Neste caso, a expansão de Fourier é uma Série de Fourier +∞ a0 X + [an cos(kn x) + bn sin(kn x)] , f (x) = 2 n=1 (C.3) e toda a informação acerca da função fica contida nos coeficientes {a0 , an , bn } , (C.4) 468 Análise de Fourier a que se chama o espectro de Fourier de f (x). Uma vantagem das séries de Fourier relativamente a séries de Taylor é que a função a expandir não necessita de ser diferenciável em todos os pontos; de facto pode até ser descontinua num número finito de pontos do intervalo [x0 , x0 + L] para qualquer x0 . A condição essencial para a existência da série de Fourier é integrabilidade.1 O teorema de Fourier diz-nos como calcular os coeficientes (C.4): Teorema: (Fourier) Seja f (x) : R −→ R com as seguintes propriedades i) f(x) é periódica com perı́odo L; ii) f(x) é integrável em [x0 , x0 + L] (ou é uma função de quadrado integrável conforme (C.20)); então, a série de Fourier de f (x), (C.3) onde 2 an = L Z x0 +L f (x) cos(kn x)dx , x0 2 bn = L Z x0 +L f (x) sin(kn x)dx , (C.5) x0 converge para qualquer x ∈ R. Se num dado ponto, y, f (x) é contı́nua, a série converge para f (y); se é descontinua converge para a média dos limites à esquerda e à direita de f (x). Não vamos aqui demonstrar o teorema de Fourier, mas vamos mostrar a compatibilidade de (C.5) com (C.3), introduzindo (C.3) nas expressões (C.5): • a0 : 2 a0 = L Z x0 +L x0 ! +∞ a0 X + [an cos(kn x) + bn sin(kn x)] dx , 2 n=1 (C.6) que é claramente verificada pois, para n ∈ N Z 1 x0 +L sin(kn x)dx = x0 Z x0 +L cos(kn x)dx = 0 . (C.7) x0 Rigorosamente o teorema de Fourier é mais geral do que o exposto aqui; contudo em mecânica quântica a propriedade essencial é integrabilidade. C.1 Séries de Fourier 469 • an : 2 an = L Z ! +∞ a0 X + [am cos(km x) + bm sin(km x)] dx 2 m=1 x0 +L cos(kn x) x0 +∞ X 2 = L m=1 Z x0 +L . (C.8) cos(kn x) (am cos(km x) + bm sin(km x)) dx x0 Assim, temos de lidar com Z x0 +L cos(kn x) cos(km x)dx = x0 L δn,m , 2 (C.9) onde introduzimos o delta de Kronecker, definido como 0 se n 6= m δn,m ≡ , 1 se n = m e Z (C.10) x0 +L cos(kn x) sin(km x)dx = 0 , (C.11) x0 e em baixo iremos também necessitar de Z x0 +L L sin(kn x) sin(km x)dx = δn,m . 2 x0 (C.12) É agora trivial verificar (C.8). • bn : 2 bn = L Z x0 +L x0 +∞ X 2 = L m=1 sin(kn x) Z x0 +L ! +∞ a0 X + [am cos(km x) + bm sin(km x)] dx 2 m=1 , (C.13) sin(kn x) (am cos(km x) + bm sin(km x)) dx x0 que é facilmente verificada usando (C.11) e (C.12). C.1.1 Representação em termos de ondas planas Uma outra maneira de exprimir a série de Fourier é usando exponenciais imaginárias em vez de senos e cossenos. A fórmula de Euler eiθ = cos θ + i sin θ , (C.14) 470 Análise de Fourier permite-nos escrever as funções sinusoidais como cos(kn x) = 1 ikn x e + e−ikn x , 2 sin(kn x) = Podemos então reexpressar (C.3) como +∞ X f (x) = 1 ikn x e − e−ikn x . 2i cn eikn x , (C.15) (C.16) n=−∞ onde o espectro de Fourier é agora descrito pelos coeficientes {cn }, que em geral são complexos, e estão relacionados com {a0 , an , bn } do seguinte modo an − ibn para n ∈ N 2 a0 . cn = para n = 0 2 a−n + ib−n para − n ∈ N 2 (C.17) Nesta representação da série de Fourier, cada coeficiente no espectro de Fourier, cn , aparece associado a uma onda plana eikn x . Note-se, para uso futuro, que o equivalente às relações (C.9), (C.11), (C.12), é, na linguagem de ondas planas, simplesmente Z x0 +L dxei(kn −km ) = Lδn,m , n, m ∈ Z . (C.18) x0 Note-se ainda que o espectro de Fourier é calculado nesta linguagem pela relação Z 1 x0 +L f (x)e−ikn x dx . (C.19) cn = L x0 C.1.2 O Espaço de Hilbert e a Igualdade de Bessel-Parseval Em Mecânica Quântica f (x) irá geralmente representar uma função de onda, denotada por Ψ(x), que é em geral complexa; para ser normalizável no intervalo [a, b] a função de onda tem de obedecer a 2 kΨk ≡ Z a b |Ψ(x)|2 dx < ∞ , (C.20) o que equivale a dizer que é uma função de quadrado somável. O conjunto de todas as funções de quadrado somável em [a, b] formam o Espaço de Hilbert L2 ([a, b]), que é C.2 Integrais de Fourier e Transformadas de Fourier 471 por isso o ‘habitat’ natural das funções de onda fı́sicas que encontramos em Mecânica Quântica. É um resultado de grande importância para a aplicação de séries de Fourier em Mecânica Quântica que todas as funções de quadrado integrável num intervalo admitem uma expansão em série de Fourier nesse intervalo. A norma (ao quadrado) kΨk2 pode ser calculada directamente do espectro de Fourier, uma vez que este contem toda a informação sobre a função. O modo como o fazer é descrito pela Igualdade de Bessel-Parseval : 1 L Z x0 +L 2 dx|f (x)| = x0 +∞ X n=−∞ |cn |2 . (C.21) A demonstração é trivial usando (C.18). Por outro lado, usando (C.17) podemos reescrever a igualdade de Bessel-Parseval em termos de {a0 , an , bn } 1 L C.2 Z x0 +L x0 +∞ |a0 |2 X dx|f (x)| = + |an |2 + |bn |2 . 4 n=1 2 (C.22) Integrais de Fourier e Transformadas de Fourier Se a função f (x) não é periódica, funções sinusoidais com qualquer perı́odo podem ser usadas na expansão de Fourier que passa a ser uma soma sobre todos os valores de k ∈ R e como tal um integral de Fourier em vez de uma série discreta. Assim, esperamos que (C.16) seja substituido por uma expressão do tipo Z +∞ f (x) = c(k)eikx dx . (C.23) −∞ De facto, tirando o limite L → ∞ das expressões que temos para a série de Fourier podemos mostrar que assim é. Denotemos a função com perı́odo L por fL (x). Notando que kn+1 − kn = 2π/L, escolhendo x0 = −L/2 e introduzindo (C.19) em (C.16) obtemos Z L/2 ∞ 1 X ikn x fL (x) = (kn+1 − kn )e fL (y)e−ikny dy , 2π n=−∞ −L/2 (C.24) que tem a forma de uma soma de Riemann. O limite L → ∞ equivale a kn → kn+1 e fL (x) → f (x). Neste limite, o somatório é promovido a um integral e kn passa a ser uma 472 Análise de Fourier variável contı́nua, pelo que obtemos Z +∞ Z +∞ 1 −iky ikx f (y)e dy dk , e f (x) = 2π −∞ −∞ ou 1 f (x) = √ 2π Z 1 f˜(k) ≡ √ 2π Z onde definimos +∞ (C.25) ikx ˜ f(k)e dk , (C.26) f (x)e−ikx dx . (C.27) −∞ +∞ −∞ Claramente f˜(k) desempenha o papel de espectro de Fourier, que passa a ser uma variável contı́nua; ou seja, uma função no plano complexo que contem toda a informação sobre f (x). A este espectro contı́nuo de Fourier chama-se transformada de Fourier. Assim, existe uma dualidade entre as duas funções ˜ f (x) ←→ f(k) , (C.28) isto é são duas descrições diferentes do mesmo objecto. A existência de um integral de Fourier para uma função é garantida se a função e a sua transformada de Fourier forem integráveis: Teorema da Inversão de Fourier: Se f (x) for integrável e f˜(k) definida em (C.27) também o for, então a representação de f (x) como um integral de Fourier (C.26) existe. C.2.1 A fórmula de Parseval-Plancherel Tal como para as séries de Fourier é de esperar que do espectro de Fourier, que neste caso é a transformada de Fourier, se possa deduzir a norma da função. A fórmula análoga à fórmula de Bessel-Parseval,(C.21), é chamada fórmula de Parseval-Plancherel (por vezes também denominada teorema de Fourier-Plancherel): Z +∞ Z +∞ 2 ˜ 2 dk . |f (x)| dx = |f(k)| −∞ (C.29) −∞ Exemplo A1: Consideremos a função 1 se |x| < a f (x) = 0 se |x| > a , a>0 (C.30) C.2 Integrais de Fourier e Transformadas de Fourier cuja transformada de Fourier é r Z +∞ Z a 2 sin ka 1 1 . f˜(k) ≡ √ f (x)e−ikx dx = √ e−ikx dx = π k 2π −∞ 2π −a 473 (C.31) Para verificarmos a fórmula de Parseval-Plancherel temos de calcular tanto a norma de f (x) como a norma de f˜(k) no espaço de Fourier. A primeira é elementar Z +∞ |f (x)|2 dx = 2a . (C.32) −∞ A segunda fica Z 2 +∞ sin2 (ka) 2 ˜ dk . (C.33) |f (k)| dk = π −∞ k2 −∞ A função sin2 x/x2 (tal como sinx/x) não tem uma primitiva que se possa escrever como Z +∞ um número finito de funções elementares. Mas utilizando o teorema dos resı́duos em análise complexa mostra-se que +∞ sin2 x dx = π , (C.34) x2 −∞ resultado com o qual se prova que (C.33) é igual a (C.32). De outro ponto de vista, usando Z o teorema de Parseval-Plancherel fornece um método alternativo aos métodos complexos de calcular o integral (C.34). Exemplo A2: Consideremos a função Gaussiana f (x) = e−x 2 /2a2 , cuja transformada de Fourier é Z +∞ −k 2 a2 /2 Z +∞ 1 e 2 2 2 −ikx ˜ ≡√ f(k) f (x)e dx = √ e−(x+ika ) /2a dx , 2π −∞ 2π −∞ ou, usando o resultado básico em integração de Gaussianas r Z +∞ π −αx2 , α>0, e dx = α −∞ (C.35) (C.36) (C.37) obtemos 2 2 f˜(k) = ae−k a /2 . (C.38) O resultado a reter é que a transformada de Fourier de uma Gaussiana é ainda uma Gaussiana. Mas note que tanto o coeficiente como o expoente se alteram. Usando (C.37) é muito fácil verificar a fórmula de Parseval-Plancherel neste caso. 474 C.2.2 Análise de Fourier Quantidades estatı́sticas e a relação de incerteza Em estatı́stica define-se a função de distribuição de probabilidade ou densidade de probabilidade, P(x), de uma variável aleatória, x, definida no intervalo [a, b], como sendo uma distribuição que obedece a Z P(x) > 0 , b a P(x)dx = 1 . (C.39) xP(x)dx ; (C.40) Definem-se também • Valor esperado de x, ou valor médio de x hxi ≡ Z b a • Analogamente, para uma função de x, h(x), define-se o valor esperado de h(x) hh(x)i ≡ Z b h(x)P(x)dx ; (C.41) a • A variância ou dispersão é definida como 2 Z b σx ≡ h(x − hxi) i = (x − hxi)2 P(x)dx a ; Z b 2 2 2 2 = (x − 2xhxi + hxi )P(x)dx = hx i − hxi (C.42) a • O desvio padrão de x é ∆x = √ σx . (C.43) Como a mecânica quântica fornece uma descrição probabilı́stica dos fenómenos fı́sicos é natural usar esta terminologia estatı́stica. Mais concretamente, a entidade fundamental em mecânica quântica, a função de onda Ψ(x) - uma solução da equação de Schrödinger-, é uma amplitude de probabilidade, em geral uma função complexa. A densidade de probabilidade é P(x) = Ψ(x)Ψ(x)∗ , kΨk2 (C.44) C.2 Integrais de Fourier e Transformadas de Fourier 475 onde ”∗”denota conjugação complexa, que claramente obedece a (C.39). O que a teoria quântica produz para um dado sistema fı́sico são os ‘valores esperados’ das variáveis fı́sicas em jogo. O famoso prı́ncipio da incerteza de Heisenberg, um dos pilares da mecânica quântica, não é mais do que um exemplo da seguinte propriedade das transformadas de Fourier: Relação de incerteza: Seja x uma variável aleatória definida em R, cuja distribuição é descrita por uma ‘função de onda’ Ψ(x) e pela densidade de probabilidade associada P(x). Seja ∆x o desvio padrão de x associado a esta distribuição. Por outro lado seja Ψ̃(k) a transformada de Fourier de Ψ(x). Associemos a esta função de onda no espaço de Fourier uma densidade de probabilidade Pk (k). Seja ∆k o desvio padrão de k associado a esta distribuição. É uma propriedade das transformadas de Fourier (em uma dimensão) que ∆x∆k ≥ 1 . 2 (C.45) O significado desta relação de incerteza é claro quando comparamos a forma de uma Gaussiana (C.35) com a sua transformada de Fourier (C.38). Uma função de onda Gaussiana normalizada pode-se escrever 2 2 e−x /4(∆x) Ψ(x) = p√ , 2π∆x (C.46) onde ∆x é o desvio padrão de x associado à respectiva densidade de probabilidade |Ψ(x)|2 . De (C.35) e (C.38) lêmos que √ √ ∆x = a/ 2 , ∆k = 1/ 2a , ⇒ ∆x∆k = 1 . 2 (C.47) Variando ‘a’ podemos fazer ∆x ou ∆k tão pequeno quanto queiramos; isto é, podemos localizar a variável aleatória perto do valor médio com uma probabilidade tão próxima da unidade quanto desejado. Mas ao localizarmos x, por exemplo, aumentamos necessariamente a dispersão em k. Como discutido no capı́tulo 2, fenómenos microscópicos exibem caracterı́sticas quer corpusculares quer ondulatórias, mas não ambas simultaneamente - dualidade onda partı́cula e complementaridade. Esta realidade é incorporado no formalismo 476 Análise de Fourier da mecânica quântica descrevendo variáveis canónicas conjugadas - posição e momento por exemplo - como transformadas de Fourier uma da outra. Deste modo a incerteza associada à complementaridade é descrita pela existência de um limite inferior do produto de desvios padrão de transformadas de Fourier. Bibliografia [1] Herbert Goldstein, Classical Mechanics, Second Edition, 1980. [2] Jorge V. José, Eugene J. Saletan, Classical Dynamics, a contemporary approach, Cambridge University Press, 1998. [3] Maria Renata Arala Chaves, Sebenta de Mecânica Quântica, 1975. [4] Bernd Thaller, Visual Quantum Mechanics, Springer 2000 (inclui CD-ROM). [5] L.D.Landau, E.M.Lifshitz Quantum Mechanics, Butterworth Heinemann, Third Revised Edition, 1977. [6] Robert Eisberg, Robert Resnick, Quantum Physics of atoms, molecules, solids, nuclei, and particles, John Wiley & Sons, Second Edition, 1985. [7] Eyvind H. Wichmann, Quantum Physics - Berkeley Physics Course - Volume 4, McGraw Hill, 1967. [8] Feynman, Leighton, Sands, The Feynman Lectures on Physics - Volume III, AddisonWesley Publishing Company, 1965. [9] Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, Quantum Mechanics John Wiley & Sons, 1977. 478 [10] Paul A. M. Dirac, The Principles of Quantum Mechanics Oxford Science Publications, Fourth Edition, 1958.