i Centro de Investigaciones en Óptica A.C. Fotónica: Para estudiantes de ciencias e ingenierı́a ii Prefacio Este texto constituye la compilación de mis notas de clase de los curso de Fotónica y Optoelectrónica para la Maestrı́a en Optomecatrónica y de la Maestrı́a y el Doctorado en Ciencias (Óptica) impartida en el Centro de Investigaciones en Óptica. Durante la preparación de mis clases encontré que estos cursos cubren un espectro muy amplio de temas y que, al menos hasta donde tengo conocimiento, no se cuenta con un libro en lengua Española que los cubra todos. La intención de editar estas notas de curso es subsanar la falta de un texto en este tema. Dado que este texto tiene como potenciales usuarios estudiantes de postgrado con formaciones diversas en ingenierı́a y ciencias (principalmente fı́sicos). Asume una formación mas o menos sólida en temas de matemáticas (algebra superior[1], algebra lineal[2], cálculo de una variable[3] y vectorial[4], ecuaciones diferenciales ordinarias y parciales[5] y al menos familiaridad con la idea de tensor) al igual que con conceptos de mecánica clásica[6], se recomienda al lector que no este familiarizado con estos conceptos que se refiera a los libros citados. Índice general 1. Tres fracasos de la fı́sica clásica 1.1. La catástrofe ultravioleta: El cuerpo negro . . . . . . . . . . . 1.2. El átomo de hidrógeno . . . . . . . . . . . . . . . . . . . . . . 1.3. Efecto fotoeléctrico . . . . . . . . . . . . . . . . . . . . . . . . 2. Una nueva teorı́a: Mecánica cuántica 2.1. Ecuación de Schrödinger . . . . . . . . . . . . . . . . . 2.1.1. Espacios de Hilbert, Operadores y Observables 2.2. El pozo de potencial cuadrado infinito . . . . . . . . . 2.3. El pozo de de potencial cuadrado finito . . . . . . . . 2.4. El oscilador armónico . . . . . . . . . . . . . . . . . . 2.5. Momento angular . . . . . . . . . . . . . . . . . . . . . 2.6. El átomo de hidrógeno . . . . . . . . . . . . . . . . . . 2.7. Teorı́a de conducción en sólidos . . . . . . . . . . . . . 2.7.1. Potenciales periódicos . . . . . . . . . . . . . . 2.7.2. Teorı́a de bandas . . . . . . . . . . . . . . . . . 2.8. Óptica cuántica . . . . . . . . . . . . . . . . . . . . . . 2.8.1. Coeficientes de Einstein . . . . . . . . . . . . . 2.8.2. Transiciones . . . . . . . . . . . . . . . . . . . . 2.9. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . 3. Fuentes de luz 3.1. Láseres . . . . . 3.2. LEDs . . . . . 3.3. Heterojunturas 3.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 5 9 . . . . . . . . . . . . . . 11 11 12 15 18 21 22 22 22 23 23 23 23 23 24 . . . . 27 27 27 27 27 4. Detección de luz 29 4.1. Radiometrı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 iii ÍNDICE GENERAL iv 4.2. Fotometı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Fibras Ópticas 5.1. Apertura numérica . . . . . . . . . . . . 5.2. Propagación de ondas en fibras ópticas . 5.3. Comentarios finales sobre fibras ópticas 5.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 29 . . . . 31 31 33 37 37 6. Óptica de materiales 6.1. Óptica de dieléctricos isotrópicos 6.2. Óptica de materiales conductores 6.3. Óptica de cristales anisotrópicos 6.3.1. Birefringencia . . . . . . . 6.3.2. Actividad óptica . . . . . 6.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 42 45 46 50 51 7. Electroóptica y Magnetoóptica 7.1. Efecto Kerr . . . . . . . . . . 7.2. Efecto Pockels . . . . . . . . 7.3. Efecto Faraday . . . . . . . . 7.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 54 54 54 . . . . . . . . 8. Óptica no lineal 8.1. Mas allá de la aproximación 8.2. Efectos de segundo orden . 8.3. Efectos de tercer orden . . . 8.4. Problemas . . . . . . . . . . armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 55 55 55 55 9. Otros temas de interés 9.1. Recubrimientos dieléctricos 9.2. Cristales fotónicos . . . . . 9.3. Plasmones . . . . . . . . . . 9.4. Metamateriales . . . . . . . 9.5. Óptica ultrarrápida . . . . . 9.6. Terahertz . . . . . . . . . . 9.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 57 57 57 57 57 57 57 A. Ecuaciones de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Capı́tulo 1 Tres fracasos de la fı́sica clásica Hacia mediados del siglo XIX la comunidad cientı́fica (particularmente la fı́sica) se encontraba confiada que era cuestión de unos años el poder descifrar todos los secretos de la fı́sica y poder finalmente escribir “el libro de la fı́sica” en el que se contendrı́a la totalidad de las leyes que gobiernan nuestro universo. La mecánica de Newton explicaba con precisión el movimiento de los cuerpos; la electrodinámica de Maxwell explicaba los fenómenos relacionados con el magnetismo y la electricidad incluida, por supuesto, la radiación. De igual forma la termodinámica explicaba todo lo que tenı́a que ver con el calor. Aunque habı́a un puñado de experimentos aislados que no podı́an ser explicados con precisión pero que tampoco contradecı́an de manera fundamental a las leyes conocidas, existı́a cierto consenso de que era solo cuestión de tiempo para que los modelos adecuados emergieran o de que los cálculos pudieran hacerse para poder explicar todo en la fı́sica. Si a caso habrı́a modificaciones menores a las leyes hasta entonces conocidas que no representarı́an un cambio conceptual en la visión que se tenı́a del universo en aquel tiempo. Fue entonces, durante la segunda mitad del siglo XIX, cuando la arrogancia de los fı́sicos de aquellos tiempos se empezó a desmoronar. Un buen número de fenómenos fı́sicos no podı́an ser abordados usando las teorı́as clásicas de manera autoconsistente y otros aun cuando podı́an ser abordados la solución diferı́a fundamentalmente de las mediciones experimentales. En este capı́tulo abordaremos tres de estos problemas usando la visión clásica, discutiremos las soluciones que algunas mentes brillantes del sigo XX dieron a estos problemas y como la construcción de dichas soluciones con1 2 CAPÍTULO 1. TRES FRACASOS DE LA FÍSICA CLÁSICA Figura 1.1: a) Un tı́pico ejemplo de un sistema real que se aproxima a un cuerpo negro es un agujero en la pared una caja. b) Otro ejemplo es el grafito que es un material con una absorbancia muy alta para casi todas las longitudes de onda. dujo a la inevitable conclusión de que la fı́sica clásica tiene limitaciones fundamentales que sólo pueden ser subsanadas con una nueva visión de la fı́sica. 1.1. La catástrofe ultravioleta: El cuerpo negro El cuerpo negro es un objeto teórico cuya caracterı́stica es que la radiación electromagnética que incide sobre él es completamente absorbida sin importar su longitud de onda. Es también un objeto que tiene emisividad igual a 1. Sistemas reales que se aproximen al cuerpo negro son por ejemplo una pequeña abertura en una cavidad metálica, la ventana de un horno, y algunos materiales como el grafito y ciertas clases de nanotubos. Históricamente los primeros intentos por entender el cuerpo negro hallaron dificultades rápidamente. Para la segunda mitad del siglo XIX la ley de Stefan-Boltzman era bien conocida, esta estipula que la densidad de energı́a radiada (por unida de área) de un objeto esta dada por 4 u = σT 4 , c (1.1) donde σ es la constante de Stefan-Boltzman. Sin embargo la teorı́a era inca- 1.1. LA CATÁSTROFE ULTRAVIOLETA: EL CUERPO NEGRO 3 1 0.9 Intensidad (U. Arb.) 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 150 200 Frequencia (THz) 250 300 Figura 1.2: Las curvas muestran la medición experimental (cı́rculos), la distribución de Rayleigh-Jeans (punteada) y la distribución de Plank (contı́nua) a T =300 K. paz de predecir correctamente la distribución espectral de esta radiación, es decir, que no se habı́a podido deducir una expresión para la función ρ(ω, T ) tal que Z ∞ u= ρ(ω, T ) dω. (1.2) 0 Dada la universalidad de la ecuación de Stephan-Boltzman, y que las propiedades de un cuerpo negro deben ser independientes de su composición, los primeros intentos de predecir su espectro de emisión se hicieron asumiendo, por simplicidad, que sus paredes estaban formadas por un conjunto de osciladores armónicos simples acoplados en equilibrio con la radiación electromagnética en su entorno. En este caso la energı́a media del conjunto de osciladores estarı́a dada por Ē = π 2 c3 ρ(ω, T ), ω2 (1.3) utilizando el principio de equipartición de la energı́a, la energı́a media también estarı́a dada por n Ē = kT, (1.4) 2 donde k es la constante de Boltzman y n es el número de grados de libertad 4 CAPÍTULO 1. TRES FRACASOS DE LA FÍSICA CLÁSICA de cada oscilador 1 . Igualando 1.3 y 1.4 obtenemos que ρ(ω, T ) = ω2 kT, π 2 c3 (1.5) que es conocida como la distribución de Rayleigh-Jeans. Si utilizamos esta distribución para hallar la densidad de energı́a radiada obtenemos Z ∞ kT u= ω dω → ∞ ! ! !. (1.6) π 2 c3 0 La aparición de esta divergencia obviamente constituye una contradicción con la ley de Stephan-Boltzman, pero sobre todo, un absurdo, dado que en términos fı́sicos lo que esta ecuación nos dice es que la cantidad total de energı́a radiada por un cuerpo negro es infinita. La incapacidad de predecir una distribución consistente con la realidad es conocida como la “catástrofe ultravioleta”, debido a que la distribución conocida experimentalmente y la de Rayleigh-Jeans diferı́an fuertemente en la región de altas frecuencias (ultravioleta) como se muestra en la figura 1.2. La catástrofe ultravioleta fue uno de los primeros fracasos de la fı́sica clásica y que encendió algunos “focos rojos” entre la comunidad cientı́fica de finales del siglo XIX y principios del XX apuntando en la dirección de la necesidad de revisar a fondo las teorı́as fı́sicas. En en año 1900 Max Planck introdujo una revolucionaria hipótesis ad2 hoc para dar solución al problema de la catástrofe ultravioleta. Esta hipótesis consistió en imponer solo un número discreto de energı́as en los osciladores armónicos que conforman al cuerpo negro capaces de emitir o absorber radiación electromagnética, de tal forma que las energı́as de cada oscilador solo podrı́an pasar entre los valores En = nE0 (con n = 1, 2, ...) por emisión o absorción de paquetes enteros de energı́a, estos paquetes serı́an llamados “cuantos”. La imposición de la hipótesis de Planck nos lleva a ρ(ω, T ) = ω2 E1 . π 2 c3 eE1 /kT − 1 (1.7) Esta distribución espectral combinada con la ley de Wein, que en aquellos tiempos ya era bien conocida, que dice que la distribución espectral deberı́a ser de la forma ρ(ω, T ) = ω 3 f (ω/T ) donde f es una función que no se habı́a podido determinar. Para que la ecuación 1.7 satisfaga la ley de Wein, Planck 1 Por simplicidad en la notación y dado que no afecta de forma alguna este argumento, asumiremos n = 2. 2 Lease “cuchareó” las ecuaciones adecuadamente para llegar al resultado experimental. 1.2. EL ÁTOMO DE HIDRÓGENO 5 nuevamente manipuló de manera adecuada las ecuaciones3 imponiendo E1 = ~ω donde ~ es una constante que después fue nombrada como la Constante de Planck. Esta segunda hipótesis transforma a la ecuación 1.7 en ρ(ω, T ) = ~ω 3 1 , 2 3 ~ω/kT π c e −1 (1.8) que al ser integrada resulta en Z u(T ) = ∞ ρ(ω, T ) dω = 0 π2 k4 4 T , 15c3 ~3 (1.9) lo que es consistente con la ley de Stephan-Boltzman y que a su vez remueve la divergencia que dio lugar a la catástrofe ultravioleta. Es muy importante resaltar en este momento que a pesar de dar un resultado correcto, las dos hipótesis impuestas por Planck eran no solo atrevidas, sino injustificables en el marco de la fı́sica clásica que prevalecı́a en aquellos tiempos, la necesidad de imponer una hipótesis que saliera tan drásticamente de las teorı́as aceptadas fue uno de los primeros indicadores de que algo andaba mal en la teorı́a clásica. 1.2. El átomo de hidrógeno Para el año 1909 Hasn Geiger y Ernest Marsden bajo la dirección de Ernest Rutherford realizaron un experimento para tratar de entender mejor la estructura atómica. Para aquel tiempo era posible conseguir fuentes radioactivas emisoras de partı́culas alfa y también era posible detectarlas usando sulfuro de zinc que emitı́a luz cuando una partı́cula alfa lo golpeaba. El experimento consistı́a en hacer incidir un haz de estas partı́culas alfa sobre una lámina delgada de oro (vease Fig.1.3). Con ello esperaban poder obtener información sobre la distribución de carga en el átomo. En aquellos tiempos el modelo mas aceptado del átomo era el de una esfera donde las cargas positivas estaban distribuidas mas o menos de forma homogénea aglutinadas por un “continuo” de cargas negativas, tal como las pasas se encuentran en un panqué, por lo que éste es conocido como el modelo del panqué de pasas (o del budı́n de pasas). Lo observado por Rutherford y su equipo los sorprendió. Hallaron que casi todas las partı́culas atravesaban la laminilla de oro, que era de esperarse, pero aproximadamente una de cada 8000 rebotaban a ángulos mucho 3 Lease “cuchareó” las ecuaciones para llegar al resultado experimental ... ¡de nuevo! 6 CAPÍTULO 1. TRES FRACASOS DE LA FÍSICA CLÁSICA Figura 1.3: El experimento de Rutherford y su grupo consistió en hacer incidir partı́culas α sobre una lámina delgada de oro. Se halló que la mayorı́a de las partı́culas atravesaban el oro sin interactuar, mientras que aproximadamente una de cada 8000 sufrı́a una deflexión cercana a los 180 grados (flecha). mayores a 90◦ . Esto es totalmente contradictorio con la idea del panqué de pasas y sugerı́a la idea de un núcleo muy pesado con carga positiva, probablemente concentrando casi toda la masa del átomo, rodeado de cargas negativas de masa casi despreciable. La combinación de su gran masa y la carga positiva lo harı́an capaz de desviar significativamente a las partı́culas alfa de su trayectoria. Mas aun, usando un argumento muy simple, que a continuación se describe, fueron capaces de dar una cota superior para el tamaño del núcleo. Asumamos que la partı́cula alfa se mueve en una trayectoria rectilı́nea tal que encontrarı́a al núcleo atómico de frente. Si la partı́cula alfa lleva una cierta energı́a cinética, la fuerza de repulsión electrostática entre el núcleo frenará a la partı́cula alfa por completo cuando la totalidad de esta energı́a cinética se haya convertido en energı́a potencial. Igualando estas dos energı́as obtenemos 1 1 qAu qα mα vα2 = , (1.10) 2 4π0 r donde mα y vα son la masa y la velocidad inicial de la partı́cula alfa, qAu y qα son las cargas del núcleo de oro y de la partı́cula alfa y r es la distancia 1.2. EL ÁTOMO DE HIDRÓGENO 7 de mı́nima aproximación, por lo que r= 1 qAu qα . 2π0 mα vα2 (1.11) La velocidad de emisión de las partı́culas alfa de la fuente radioactiva era de v = 2 × 107 m/s, la carga de las partı́culas alfa es de 2 veces la carga elemental (es decir 2 × 1,6 × 10−19 C, la carga positiva del átomo de oro es de 79 veces la carga elemental (es decir 79 × 1,6 × 10−19 C), la masa de la partı́cula alfa es de 6,7×10−27 Kg, por tanto se estima que r = 2,7×10−14 m, que el grupo de Rutherford dio como una cota superior para el tamaño del núcleo de oro (en realidad el tamaño del núcleo de oro es de 0,73 × 10−14 ). El hallazgo del grupo de Rutherford no solo era inesperado, sino que planteaba una profunda contradicción. La conclusión inmediata es que el modelo del panqué de pasas era erróneo y que la estructura atómica se asemejaba mas bien a un sistema planetario, lo cual era imposible según la teorı́a electromagnética clásica. Un átomo donde las cargas negativas ligeras se encontraban en orbita al rededor del núcleo positivo y pesado perderı́a energı́a rápidamente emitiendo radiación electromagnética y colapsando en una fracción de segundo como se muestra en la Fig.1.4, al igual que en el caso del cuerpo negro, la teorı́a mostraba fuertes discrepancias con lo observado experimentalmente. Además del experimento de Rutherford, en los primeros años del siglo XX se contaba con otro resultado inexplicable, los espectros de emisión de varios gases se conocı́an experimentalmente. Estos consistı́an en una colección de lı́neas discretas, lo que no tenı́a una explicación clara en términos de la teorı́a clásica. Fue entonces cuando Niels Bohr tratando de explicar ambos resultados sugirió otra hipótesis aventurada. Bohr postuló que los átomos sólo podrı́an ganar o perder energı́a del campo electromagnético entre un conjunto discreto de orbitas “permitidas” e impuso4 que el momento angular del sistema tendrı́a que ser de la forma L = n~ con n = 1, 2, ... . La discretización de las orbitas evitarı́a la pérdida continua de energı́a y por tanto el colapso del átomo “planetario”. Para que una orbita sea estacionaria es necesario que la fuerza centrı́peta y la atracción Coulombiana estén equilibradas, por lo que en el caso del de hidrógeno5 m 4 v2 1 e2 = , r 4π0 r2 (1.12) Lease “cuchareó” las ecuaciones para llegar al resultado experimental ... ¡Otra vez! Que al ser formado solo por un protón y un electrón es el mas simple y que por tanto estudiaremos con detalle. 5 8 CAPÍTULO 1. TRES FRACASOS DE LA FÍSICA CLÁSICA Figura 1.4: El modelo planetario del átomo está en franca contradicción con el electromagnetismo clásico que predice que éste colapsará debido a la pérdida de energı́a que tendrı́a el electrón al radiar. donde m y v son la masa y velocidad del electrón, e es la carga elemental y r es el radio de la orbita. De la expresión anterior obtenemos s e2 v= . (1.13) 4π0 mr Si calculamos la energı́a total del átomo de hidrógeno, estará dada por la suma de la energı́a cinética y potencial E = mv 2 /2 − e2 /4π0 r, sustituyendo v de la ecuación 1.13 tenemos que la energı́a total del sistema será E=− e2 . 8π0 r (1.14) Por otro lado tenemos que el momento angular es Ln = mvn r = n~ lo que implica que vn = n~/mr que combinado con 1.13 implica rn = − 4π0 ~2 2 n , e2 m (1.15) que para n = 1 tiene un valor de ∼ 0,5 × 10−10 m y que es conocido como el Radio de Bohr. Sustituyendo de la expresión anterior obtenemos que las energı́as del átomo de hidrógeno estarán dadas por 2 4 1 e m 1 13,6 eV En = − =− . (1.16) 2 2 4π0 2~ n n2 1.3. EFECTO FOTOELÉCTRICO 9 Esta expresión, combinada con la ecuación E = ~ω dada por Planck para resolver el problema del cuerpo negro, logró predecir correctamente las frecuencias de las lı́neas de emisión del hidrógeno. Al igual que la discretización de los estados del oscilador armónico, el postulado de las órbitas permitidas impuesto por Bohr quedaba totalmente fuera del esquema de las teorı́as de la fı́sica clásica y dio un elemento mas para sospechar que algo fundamental estaba mal en las teorı́as que hasta entonces prevalecı́an. 1.3. Efecto fotoeléctrico Un tercer fenómeno que se conocı́a experimentalmente y cuya explicación no habı́a podido ser dada por la fı́sica clásica es el llamado efecto fotoeléctrico. Cuando radiación electromagnética de longitud de onda adecuada incide sobre un material, particularmente sobre ciertos metales, electrones son emitidos de éste. Las observaciones experimentales mostraron que: La energı́a de los electrones emitidos es independiente de la intensidad luminosa. La energı́a de los electrones emitidos aumenta con la frecuencia de la onda luminosa. El número de electrones emitidos depende de la intensidad. Para cada material existe una frecuencia de corte tal que por abajo de ella no se emiten electrones sin importar la intensidad. Siguiendo la misma lógica de Planck y Bohr, si el material sólo puede o bien, absorber un “paquete” de energı́a ~ω o no absorber nada, se tiene que la energı́a cinética de los electrones emitidos es 1 mv 2 = ~ω − W, 2 (1.17) donde W es una cantidad que depende de cada material conocida como la función de trabajo del material. Esta lógica también implica que el número de electrones emitidos será proporcional al número de “paquetes” de energı́a absorbidos. De igual forma este razonamiento implica que habrá una frecuencia mı́nima W ωmin = (1.18) ~ por debajo de la cual los “paquetes” no contarán con suficiente energı́a para “arrancar” electrones del material. Al observar esto, Albert Einstein 10 CAPÍTULO 1. TRES FRACASOS DE LA FÍSICA CLÁSICA hizo una hipótesis aun mas aventurada que las de Planck y Bohr. Einstein postuló que lo que estaba mal no era nuestro modelo del átomo o del oscilador armónico, sino las teorı́as de la fı́sica y postuló la cuantización de la energı́a como un fenómeno universal. Es decir, que en vez de que se vea a la discretización como una consecuencia del mecanismo de intercambio de energı́a entre el sistema y el campo electromagnético, este debe ser visto como un principio fundamental, donde los posibles valores de la energı́a de un sistema, como puede ser un oscilador armónico, un átomo de hidrógeno o el campo electromagnético en si mismo, se encuentran cuantizados, lo cual implica una nueva visión del mundo fı́sico. La idea de Einstein de que radiación electromagnética viaja en “paquetes”, que ahora llamamos fotones, estos deben tener un carácter corpuscular y por tanto, además de ser capaces de transferir energı́a, deben poder transferir momento (p) a pesar de carecer de masa. Usando la famosa ecuación de Einstein E 2 = m2 c4 + p2 c2 (1.19) reemplazamos la masa (m = 0) y la energı́a (E = ~ω = hν) del fotón obteniendo E = hν = pc por lo que p= hν . c (1.20) Sabemos también que para una onda electromagnética λν = c donde λ es la longitud de onda, por lo que h p= , (1.21) λ o bien p = ~k, (1.22) donde k es el vector de onda. La gran aportación que hizo Einstein al explicar el efecto fotoeléctrico y postular la cuantización de la energı́a como un fenómeno universal tuvo profundas implicaciones en la fı́sica, al punto que una nueva teorı́a, la mecánica cuántica, fue desarrollada en las primeras dos y media décadas del siglo XX. La mecánica cuántica nos dio una visión fundamentalmente distinta del universo, y ha permitido el desarrollo de un gran número de componentes electrónicos y optoelectrónicos que incluyen al transistor, el diodo emisor de luz, varios tipos de fotodetectores, el laser entre muchos otros. Capı́tulo 2 Una nueva teorı́a: Mecánica cuántica A lo largo de este sección se dará una breve introducción a la mecánica cuántica. Esta introducción no pretende reemplazar un texto de mecánica cuántica, sino dar una introducción suficiente para el resto del curso de fotónica. Se recomienda al lector interesado consultar textos especializados en el tema como [7]. 2.1. Ecuación de Schrödinger Tras el postulado de Einstein de que las ondas electromagnéticas tienen también propiedades corpusculares es necesario hallar una ecuación que rija el comportamiento de estos sistemas onda-partı́cula. Iniciemos con la ecuación de onda clásica ∇2 ψ − 1 ∂2ψ = 0, v 2 ∂t2 (2.1) sı́ asumimos que la onda es estacionaria y monocromática (es decir monoenergética ya que E = ~ω) tenemos que ψ(r, t) = e−iωt ϕ(r) tenemos que ψ̈ = −ω 2 ψ por lo que sustituyendo en 2.1 tenemos ∇2 ϕ + ω2 ϕ = 0. v2 (2.2) Sabemos que v = λν = λω/2π por tanto ∇2 ϕ + 4π 2 ϕ = 0, λ2 11 (2.3) 12 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA utilizando la ecuación 1.21 tenemos que ∇2 ϕ + p2 ϕ = 0. ~2 (2.4) Por otro lado sabemos de la mecánica clásica que la energı́a total es la suma de la energı́a cinética mas la potencial V por lo que E= p2 + V (r), 2m (2.5) de donde obtenemos p2 = 2m(E − V (r)), (2.6) sustituyendo en 2.4 tenemos que − ~2 2 ∇ ϕ + V (r)ϕ = Eϕ. 2m (2.7) Multiplicando ambos lados de la ecuación anterior por e−iωt obtenemos − ~2 2 ∇ ψ + V (r)ψ = Eψ, 2m (2.8) esta ecuación es conocida como la Ecuación de Schrödinger, sus soluciones ψ para un potencial dado V representan los estados en los que se podrá hallar al sistema, ψ es conocida como la función de onda. El módulo cuadrado de la función de onda ρ(r) = ψ(r)ψ ∗ (r) representa la probabilidad de hallar a “la partı́cula” en la posición r, siempre y cuando esté normalizada, es decir, sı́ se cumple Z ψ(r)ψ ∗ (r) d3 r = 1, (2.9) donde la integral se hace sobre todo el espacio. 2.1.1. Espacios de Hilbert, Operadores y Observables Espacios de Hilbert Los espacios vectoriales son estructuras algebraicas que se definen como un conjunto de objetos (vectores) asociado a un campo numérico (escalares) sobre los cuales está definida una operación de suma entre vectores y un producto por escalares, donde estas dos operaciones deben obedecer ciertos axiomas (véase [2]). Sucede que los espacios de funciones con la suma habitual de funciones y la multiplicación por números reales o complejos 2.1. ECUACIÓN DE SCHRÖDINGER 13 cumplen todos estos axiomas, y por tanto forman un espacio vectorial. De forma totalmente análoga a los espacios vectoriales “tradicionales”, es conveniente definir bases de vectores que nos permitan escribir a todos los otros elementos del espacio vectorial en términos de los elementos de la base. Por ejemplo, el espacio de las funciones periódicas (de perı́odo 2π) tienen como base natural el conjunto {1, cos x, sen x, cos 2x, sen 2x, ...}. El teorema de Fourier garantiza que cualquier función f (x) de periodicidad 2π puede ser escrita como serie de Fourier, es decir f (x) = A0 + ∞ X [An cos nx + Bn sen nx] . (2.10) n=1 Notese que a diferencia de los espacios vectoriales “tradicionales”, en este caso, la base tiene un número infinito de elementos, y por tanto la dimensión de este espacio es infinita. Otro ejemplo de espacios y bases de funciones son el espacio de las funciones real-analı́ticas1 generado por el conjunto {1, x, x2 , x3 , ...}. En el caso de los espacios R2 y R3 se puede dar de manera intuitiva un significado geométrico a los vectores, esta noción geométrica puede ser extendida a los espacios Rn (con n > 3) gracias a que en todos estos espacios se puede definir un producto interior. La existencia de un producto interior nos permite, en general, hablar de las magnitudes de los vectores y de los ángulos formados entre ellos sin necesidad de que se encuentren necesariamente en el plano o el espacio tridimensional. En particular el producto interior nos provee de un método simple para hablar de ortogonalidad entre vectores. De tal forma que para poder dar una “geometrı́a” o al menos tener ciertas nociones geométricas en los espacios de funciones, será necesario definir un producto interior. En general el producto interior hf |gi entre dos funciones esta definido como Z +∞ hf |gi = f (x)g(x)w(x) dx, (2.11) −∞ donde w(x) se conoce como la función de peso, y que depende de la familia particular de funciones con que se este trabajando. En muchos casos simplemente w(x) = 1. Usando esta definición es posible normalizar funciones, hallar funciones ortogonales y hallar “proyecciones” de una función en otra tal como se hace con vectores “tradicionales”. 1 Es decir las funciones que se pueden escribir como serie de Taylor 14 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA Estos nuevos espacios vectoriales generalizados con un producto interior definido son conocidos como Espacios de Hilbert2 . Operadores Al igual que dentro de los espacios vectoriales “tradicionales” se definen transformaciones lineales representadas por matrices, en los espacios de funciones es posible definir operadores. Para propósitos de este texto definiremos un operador Ô como una función Ô : F → F de un espacio de funciones arbitrario F en si mismo, es decir, es un objeto que se aplica a una función y devuelve otra función. La derivada D̂ es un operador, de tal forma que aplicada, por ejemplo, a la función f (x) = sen x obtenemos D̂f (x) = d sen x = cos x, dx (2.12) que es otra función. Diremos que un operador Ô es lineal si sucede que Ô(f + g) = Ôf + Ôg y Ô(cf ) = cÔf donde f y g son funciones y c es un escalar. Debido a que en la mecánica cuántica solo los operadores lineales son de interés, desde este punto en adelante cuando nos refiramos a un operador se obviará que este es lineal. Es claro que en el lado izquierdo de la ecuación 2.8 formalmente ψ no es factorizable, ya que ∇2 no es un número o una función, sin embargo abusando de la notación podemos, por conveniencia, reescribir la ecuación como ~2 2 − ∇ + V (r) ψ = Eψ, (2.13) 2m donde la parte que se encuentra entre corchetes del lado izquierdo puede ser visto como un operador Ĥ = − ~2 2 ∇ + V (r) 2m (2.14) que “opera” sobre la función ψ. Este operador Ĥ es conocido en la mecánica cuántica como el operador Hamiltoniano u operador de energı́a, en analogı́a al Hamiltoniano usado en la mecánica analı́tica clásica (véase [9]). De tal forma que la ecuación 2.8 queda reescrita como Ĥψ = Eψ. 2 (2.15) Estrictamente, además de la existencia del producto interior, hace falta pedir que el espacio sea completo (vea [8]) para poder ser considerado un espacio de Hilbert, esto va mas allá de la discusión de este texto, pero se recomienda al lector interesado revisar la cita anterior. 2.2. EL POZO DE POTENCIAL CUADRADO INFINITO 15 Si las funciones como ψ han adquirido el carácter de vectores y los operadores como Ĥ el de matrices, la ecuación que acabamos de escribir serı́a el análogo a una ecuación de valores y vectores propios del operador Ĥ. Recordemos que la solución (o soluciones) de la ecuación de Shrödinger representa un estado estacionario y monoenergético del sistema. Al reescribir esta ecuación como un problema de vectores y valores propios tenemos que los posibles valores de la energı́a serán los valores propios del operador y los posibles estados del sistema estarán asociados a las funciones propias. En la mecánica cuántica las observables, es decir las variables que son susceptibles de ser medidas a través de un experimento, tienen asociado un operador, tal como la energı́a total del sistema tiene asociado al operador Hamiltoniano. Tenemos pues que resolver un problema de mecánica cuántica se convierte en un problema de funciones propias y valores propios de un operador que corresponde a una observable. Las funciones propias del operador forman una base que genera el espacio completo de posibles soluciones a la ecuación de valores y vectores propios. Dado que las funciones propias son invariantes (salvo por un factor escalar) ante la aplicación del operador, estas representan los estados para los que la observable tiene un valor bien definido y este valor es el valor propio asociado. Debido a que este no es un libro de mecánica cuántica solo mencionaremos, sin mayor justificación, operadores asociados a algunas observables que serán útiles en el resto del texto. El lector interesado puede consultar libros de mecánica cuántica para ver los detalles. El operador asociado al momento lineal es p̂ = i~∇ de tal forma que el operador de energı́a cinética está dado por (−~2 /2m)∇2 consistente con que el operador Hamiltoniano de energı́a total sea como fue definido en la ecuación 2.14. 2.2. El pozo de potencial cuadrado infinito El primer problema de mecánica cuántica que resolveremos es el pozo infinito de potencial. A pesar de ser un problema meramente teórico nos permitirá empezar a tener noción sobre fenómenos cuánticos que no tienen analogı́a ni explicación clásica. Resolvamos pues la ecuación de Schrödinger unidimensional para el potencial 0 para 0 < x < a V (x) = , (2.16) V0 para x < 0 o x > a donde V0 > 0 es un número que haremos tender a infinito. Podemos dividir el dominio en tres regiones, x < 0, 0 < x < a y x > a de tal forma que las 16 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA ecuaciones de Schrödinger en cada una de las tres regiones serán ~2 d2 ψI + V0 ψI = EψI , 2m dx2 (2.17) ~2 d2 ψII = EψII , 2m dx2 (2.18) ~2 d2 ψIII + V0 ψIII = EψIII . 2m dx2 (2.19) − − y − Sean q 2 = 2m(V0 − E)/~2 y k 2 = 2m(E)/~2 . Tenemos que q 2 > 0 si E < V0 y k 2 > 0 para E > 0, las ecuaciones anteriores se pueden reescribir en términos de estas constantes d2 ψI − q 2 ψI = 0, dx2 (2.20) d2 ψII + k 2 ψII = 0 dx2 (2.21) d2 ψIII − q 2 ψIII = 0. dx2 (2.22) y Debido a que q 2 > 0 tenemos que las soluciones en las regiones I y III están dadas por ψI (x) = AI eqx + BI e−qx (2.23) y ψIII (x) = AIII eqx + BIII e−qx , (2.24) de igual forma dado que k 2 > 0 tenemos que en la región II la solución será ψII (x) = AII cos kx + BII sen kx. (2.25) Debido a que la función completa debe ser normalizable para poder ser interpretada como probabilidad tenemos que BI = AIII = 0. Tomando el limite V0 → ∞ tenemos que q → −∞ y por tanto ψI (x) = ψIII (x) ≡ 0. Imponiendo continuidad entre ψI y ψII en x = 0 tenemos que AII = 0 e imponeindo continuidad entre ψII y ψIII en x = a tenemos que k solo puede tomar valores de la forma nπ/a con n = 1, 2, ... por lo que En = π 2 ~2 2 n con n = 1, 2, ... 2ma2 (2.26) 2.2. EL POZO DE POTENCIAL CUADRADO INFINITO 17 1 0.8 0.6 0.4 Ye r!!! laza 0.2 0 e ra d Figu −0.2 −0.4 emp , Re a b e pru −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 2.1: Se muestran de manera esquemática los valores propios del Hamiltoniano del poso infinito y las funciones asociadas a cada uno de estos estados. son los valores permitidos de la energı́a en el sistema. Para que la función de onda se pueda interpretar como una probabilidad, es necesario que Z +∞ ψ(x)ψ ∗ (x) dx = 1, (2.27) −∞ de esta condición de normalización se puede demostrar fácilmente que r BII = 2 a (2.28) para toda n, con lo que tanto las funciones como los valores propios del sistema quedan determinados. En la figura 2.1 podemos observar gráficamente los valores propios de la energı́a En , las funciones de onda ψn (x) asociadas a cada uno de los valores de la energı́a y las distribuciones de probabilidad ρn = |ψn (x)|2 . Es interesante notar varias cosas: La energı́a total del sistema está restringida a tomar los valores En solamente, ya que estos son los únicos que corresponden a soluciones de la ecuación de Schrödinger, es decir, todos los valores intermedios de la energı́a están prohibidos. 18 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA La probabilidad de hallar a la partı́cula justamente en la frontera de la caja es exactamente cero para todos los estados ψn . Además para el estado ψ2 existe un punto en el centro de la caja donde la probabilidad de hallar a la partı́cula es también cero, de tal forma que la partı́cula se halla con mayor probabilidad en las regiones alrededor de a/3 y 2a/3. De manera análoga para ψ3 existen dos puntos de probabilidad cero en a/3 y 2a/3 de tal forma que la partı́cula se puede encontrar principalmente en las regiones cercanas a a/4, a/2 y 3a/4 y ası́ sucesivamente. La energı́a del sistema incluso en el estado de mı́nima energı́a ψ1 no es igual a cero, es decir, la mecánica cuántica prohı́be a este sistema (y a cualquier otro) tener energı́a cinética nula. Este punto es muy importante, y tiene profundas implicaciones en la fı́sica, explica el por que la temperatura de un sistema no puede llegar a 0 K, lo que en mecánica estadı́stica implicarı́a que, por ejemplo, todos los átomos de un material se encontrarı́an en reposo. También tiene importantes implicaciones en términos de la óptica cuántica que discutiremos en detalle en la Sección 2.8. 2.3. El pozo de de potencial cuadrado finito En esta sección trataremos un problema muy similar al anterior. Por conveniencia cambiaremos las definiciones un poco. Tomemos el potencial 0 para x < − a2 o x > a2 V (x) = , (2.29) −V0 para − a2 < x < a2 donde V0 > 0 es la profundidad de un pozo de potencial en −a/2 < x < a/2. Por conveniencia tomemos k 2 = 2m|E|/~2 y q 2 = 2m(V0 − |E|)/~2 y dividamos de nuevo el problema en las regiones I para x < −a/2, II para −a/2 < x < a/2 y III para x > a/2, de tal forma que en cada una de las regiones las soluciones a la ecuación de Schrödinger para −V0 < E < 0 están dadas por ψI (x) = AI eqx + BI e−qx , (2.30) ψII (x) = AII cos kx + BII sen kx (2.31) ψIII (x) = AIII eqx + BIII e−qx (2.32) y donde BI = AIII = 0 debido a que la función de onda tiene que ser normalizable. Ahora tendremos que imponer la continuidad de la función de onda 2.3. EL POZO DE DE POTENCIAL CUADRADO FINITO 19 y su derivada en los puntos x = ±a/2. de donde obtenemos el siguiente sistema de ecuaciones simultaneas 1 1 AI eak/2 = BII cos aq − AII sen aq, 2 2 1 1 BIII e−ak/2 = BII cos aq + AII sen aq, 2 2 1 1 −ak/2 kAI e = q AII cos aq + BII sen aq , 2 2 1 1 −ak/2 −kBIII e = q AII cos aq − BII sen aq . 2 2 (2.33) (2.34) (2.35) (2.36) Combinando 2.33 con 2.35 y 2.34 con 2.36 obtenemos 1 1 1 1 q AII cos aq + BII sen aq = k BII cos aq − AII sen aq , (2.37) 2 2 2 2 1 1 1 1 q AII cos aq − BII sen aq = −k BII cos aq + AII sen aq , 2 2 2 2 (2.38) para que estas dos ecuaciones tengan solución es necesario que AII BII = 0 por lo que tenemos dos familias de soluciones. Analizemos primero el caso AII = 0, de donde tenemos que 1 1 q sen aq = k cos aq. (2.39) 2 2 √ Sean X = aq/2 y Y = 2ma2 V0 /2~. Tenemos pues que 2.39 se puede reescribir √ X2 − Y 2 tan X = , (2.40) X2 los dos lados de esta ecuación se muestran en la figura 2.2. En ella se observa que hay tan solo una cantidad finita de soluciones a la ecuación. A pesar de que no podemos calcular de manera analı́tica los valores de las soluciones se observa que el número de soluciones depende de Y que a su vez es función de m, a y V0 que están determinadas por el sistema y no por su estado. La colección de soluciones Xn de la ecuación dan origen a una colección de valores qn = 2Xn /a de tal forma que las energı́as En = 4~2 Xn2 /2ma2 − V0 quedan nuevamente cuantizadas dando lugar a y una colección de funciones x < − a2 AI eqn x a B sen(kn x) − 2 < x < a2 (2.41) ψn = II −qn x a BIII e x> 2 20 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA 1 0.8 0.6 0.4 r!!! laza Ye 0.2 emp , Re a ueb e pr d a r Figu 0 −0.2 −0.4 −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 2.2: Gráfica de los dos lados de la ecuación 2.40. Se muestran las intersecciones de las dos curvas que representan las soluciones en X. con kn = p 2m|En |/~. De manera totalmente análoga se puede encontrar una segunda familia de soluciones con sus valores de la energı́a y funciones propias para el caso BII = 0. En las funciones de onda de esta segunda familia la función coseno es la que aparece en la región de pozo. Ambas familias de funciones son complementarias y sus energı́as tienen valores intercalados. Es importante notar que estas dos familias de funciones de onda agrupan a funciones pares e impares respectivamente, que en mecánica cuántica se designan simétricas y antisimétricas. Es importante notar que las funciones no se anulan fuera de la caja, donde están definidas como una exponencial. Fuera de la caja clásicamente estarı́a prohibido hallar a la partı́cula sin embargo en el contexto cuántico hay una probabilidad distinta de cero de hallar a la partı́cula para todos los estados propios ψn de la energı́a. Esta es una diferencia fundamental entre las dos teorı́as. Otro detalle de importancia es el hecho de que la energı́a mı́nima del sistema es distinta del potencial mı́nimo, es decir, que incluso en el estado de energı́a mas baja, el sistema tiene una cantidad no nula de energı́a cinética. 2.4. EL OSCILADOR ARMÓNICO 21 1 0.8 0.6 0.4 Ye r!!! laza 0.2 0 e ra d Figu −0.2 −0.4 emp , Re a b e pru −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 2.3: Parabola y aproximaciones de una parabola a un mı́nimo arbitrario 2.4. El oscilador armónico En esta sección abordaremos uno de los sistemas mas importantes en el fı́sica desde el punto de vista cuántico. El oscilador armónico simple es un sistema modelo dentro de la fı́sica por varias razones. Primeramente es un sistema que puede ser resuelto de manera analı́tica exacta, es decir, sin aproximaciones. Segundo, el potencial que corresponde a un oscilador armónico corresponde a una parabola, lo que implica que cualquier potencial que presente un mı́nimo, local o global, “suave” puede ser aproximado al menos localmente por una parabola como se muestra en la figura 2.3. El potencial de un oscilador armónico simple unidimensional esta dado por V (x) = mω 2 x2 /2 donde m es la masa del oscilador y ω es la frecuencia natural de oscilación (clásica), de tal forma que la ecuación de Schrödinger para este problema es ~2 d2 1 2 2 − + mω x ψ = Eψ. (2.42) 2m dx2 2 La ecuación anterior se puede reescribir como ~2 00 1 ψ + mω 2 x2 ψ = Eψ. (2.43) 2m 2 Sea x = α0 ξ donde α0 es una constante que se definirá mas adelante y ξ es una variable auxiliar. Si multiplicamos la ecuación anterior por 2mα0 /~2 22 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA obtenemos − d2 ψ m2 α04 ω 2 2 2m + ξ ψ = 2 α02 Eψ. 2 2 dξ ~ ~ (2.44) Sea α02 = ~/mω, con lo que tenemos que la ecuación se reduce a − 2E d2 ψ + ξ2ψ = ψ. 2 dξ ~ω Propongamos el cambio de variable ψ = e−ξ reescribir la ecuación como 2 /2 (2.45) u(ξ), lo cual nos lleva a u00 (ξ) − 2ξu0 (ξ) + ( − 1)u(ξ) = 0, (2.46) donde = 2E/~ω. Esta es una ecuación de Hermite, cuyas soluciones existen para los casos en que −1 = 2n, con n = 0, 1, ... . Por tanto la solución corresponde a u(ξ) = Hn (ξ) y por tanto la solución a la ecuación de Schrödinger 2 esta dada por ψn (ξ) = Cn e−ξ /2 Hn (ξ) y tenemos que En = ~ω(n + 1/2). Notemos que del calculo anterior se desprende que E0 = ~ω/2 6= 0 2.5. Momento angular 2.6. El átomo de hidrógeno 2.7. Teorı́a de conducción en sólidos Antes de entrar al formalismo cuántico de de conducción en sólidos es pertinente mencionar algunos detalles sobre los sólidos y la vision pre-cuántica de sus propiedades eléctricas. Primeramente hace falta definir con precisión que es un sólido. En el contexto de la fı́sica un sólido, o un cristal, es aquel material que presenta periodicidad en su estructura atómica, es decir, es una sustancia en la que los átomos se encuentran acomodados en un arreglo que se repite en el espacio. La mayorı́a de los metales y muchas otras sustancias son sólidos en condiciones de presión y temperatura ambiente, sin embargo muchos materiales que a los que coloquialmente nos referimos como sólidos no lo son, como el vidrio, cuya estructura atómica es desordenada. De los elementos de la tabla periódica aproximadamente 2/3 son metales, estos se agrupan del lado izquierdo de la tabla y como dijimos anteriormente tienden a formar estructuras cristalinas. 2.8. ÓPTICA CUÁNTICA 2.7.1. Potenciales periódicos 2.7.2. Teorı́a de bandas 2.8. Óptica cuántica 2.8.1. Coeficientes de Einstein 2.8.2. Transiciones 23 24 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA 2.9. Problemas 1. Encuentre las soluciones a la ecuación de Laplace ∇2 φ = 0 con las siguientes condiciones: En una caja cuadrada bidimensional de lado L con condición de frontera f(x) en el lado inferior (con f (0) = f (L) = 0) y cero para los otros cuatro lados. En una esfera de radio 1 centrada en el orı́gen con condiciones de frontera φ(θ, ϕ) = f (θ). 2. Resuelva la ecuación de onda c2 ∇2 φ − ∂ 2 φ/∂t2 = 0 en: una membrana cuadrada de lado L para una condición inicial φ(x, y, t = 0) = f (x, y) y φ̇(x, y, t = 0) = 0. en una membrana circular de radio r para una condición inicial φ(r, θ, t = 0) = f (r, θ) y φ̇(r, θ, t = 0) = g(r, θ). en ambos casos la membrana esta fija en los bordes. 3. Resuelva la ecuación de Schrödinger con el potencial V = V0 > 0 para 0 < x < a y V = 0 fuera de este intervalo. El problema se llama la barrera rectangular de potencial. Dé una interpretación fı́sica de las soluciones. 4. Resuelva la ecuación de Schrödinger para el potencial V = 0 para x ∈ [0, a]∪[a+b, 2a+b], V = V0 > 0 para x ∈ (a, a+b) y “V = ∞” fuera de estos intervalos. Este problema se llama el doble pozo simétrico rectangular. Dé una interpretación fı́sica de las soluciones. 5. Para vectores recı́procos justifique la expresión: A1 = 2π(a2 × a3 ) , a1 · (a2 × a3 ) (2.47) halle expresiones análogas para A2 y A3 permutando indices y calcule el volumen de la primera zona de Brillouin en terminos de a1 , a2 y a3 , sabiendo que V = A1 · A2 × A3 . 6. Calcule la velocidad de recule de un átomo de 198 Hg que ha emitido un fotón de energı́a 4.88 eV. Compare esto con la velocidad media cuadrática térmica a temperatura ambiente T = 300 K. 2.9. PROBLEMAS 25 7. Calcule el voltaje necesario para acelerar un electrón de tal forma que tenga la misma energı́a cinética que un fotón de longitud de onda 870 nm. ¿Como se compara el momento de ambas partı́culas? 8. Si un haz que se propaga en la dirección z (con longitude de onda λ0 ) tiene una intensidad que varı́a de manera transversal como I(x, y) = I0 exp −(x2 + y 2 )1/2 /r0 calcule la probabilidad de que un fotón caiga dentro del cı́rculo de radio r0 centrado en 0. 9. Calcule el tamaño máximo L de una cavidad cúbica de con paredes de oro (Φ = 5,1 eV) que sea capaz de contener fotones de su primer modo pero no de los armónicos superiores debido al efecto fotoeléctrico. ¿De que energı́a son los fotones en la cavidad? 26 CAPÍTULO 2. UNA NUEVA TEORÍA: MECÁNICA CUÁNTICA Capı́tulo 3 Fuentes de luz 3.1. Láseres 3.2. LEDs 3.3. Heterojunturas 3.4. Problemas 1. Calcule la constante de ganancia de un medio laser con las siguientes caracterı́sticas: Inversion de población 1017 m−3 , λ=700 nm, ancho de banda 1 nm, constante de emisión espontanea 10−4 s. 2. Halle todos los posibles tamaños de un resonador adecuado para armar un laser que utiliza la transición entre el estado n = 4 y n = 2 del átomo de hidrógeno. 3. Las energı́as de “bandgap” están dadas por la fórmula: E(T ) = E0 − α T 2 /(T + β) con E0 = 1,17 eV, α = 4,73 × 10−4 eV K−1 y β = 636 K para el silicio y E0 = 1,51 eV, α = 5,4 × 10−4 eV K−1 y β = 204 K para GaAs. Calcule el “bandgap” de ambos para T = 100 K y T = 600 K. 4. * Un pulso laser ultracorto con energı́a total Ep = 1 mJ con longitud de onda central λ0 = 800 nm, cuyo campo eléctrico tiene forma de onda dada por E = E0 cos(2πct/λ0 ) exp(−t2 /τ 2 ) con τ = 10 fs incide sobre una superficie de GaAs a temperatura ambiente. Calcule el numero de fotones contenidos en el pulso y el numero de portadores generados en 27 28 CAPÍTULO 3. FUENTES DE LUZ el material (asuma que no hay perdidas en las interfaces), recuerde los resultados del problema 5. Capı́tulo 4 Detección de luz 4.1. Radiometrı́a 4.2. Fotometı́a 4.3. Problemas 1. Una celda de Golay con volumen interior de 1 cm3 esta rellena de “gas ideal monoatómico”. Como la membrana metálica es delgada asuma que el gas se encuentra a presión constante (atmosférica). Calcule el cambio de volumen inducido por un pulso de 1 mJ en la aproximación adiabática. 2. Un experimento de fotoluminiscencia consiste en hacer incidir un pulso de luz sobre un material y observar emisión producida por la recombinación del sistema al relajarse de nuevo. Suponga que un pulso cuasi-monocromático de 1 µJ a 600 nm se hace incidir sobre un pedazo de GaAs de 1 g. ¿cuanto se calienta la muestra?, ¿de que longitud de onda es la fotoluminiscencia? 3. La eficiencia cuántica de un cierto fotodiodo esta dada por η(λ) ≈ 2 × 10−6 nm−2 λ2 + 0,003nm−1 λ + 0,88 para 450 nm< λ < 1000 nm. Calcule la corriente generada por un haz de 1 mW como función de λ. 4. La función de trabajo de un cierto metal es de 1.5 eV. Si este material se usa para fabricar un tubo fotomultiplicador (de 4 placas) calcule la longitud de onda mı́nima de detección. Calcule el voltaje mı́nimo aplicado al tubo para que haya multiplicación. 29 30 CAPÍTULO 4. DETECCIÓN DE LUZ Capı́tulo 5 Fibras Ópticas Las fibras ópticas representan uno de los avances tecnológicos recientes de mayor impacto en las telecomunicaciones. La importancia de este desarrollo ha sido de tal magnitud que el Premio Nobel de Fı́sica 2009 le fue otorgado a Charles Kao por sus “contribuciones en la transmisión de luz a través de fibras para telecomunicaciones ópticas”. En este capı́tulo daremos una breve introducción a la fı́sica detrás de las fibras ópticas. 5.1. Apertura numérica Las fibras ópticas se valen de la reflexión interna total que sufre la luz al incidir en la interfase entre un un medio de ı́ndice de refracción alto (n1 ) y uno de ı́ndice mas bajo (n2 ). La reflexión interna total ocurre cuando el ángulo de incidencia de la luz es mayor o igual a un ángulo crı́tico θc dado por la condición π n1 senθc = n2 sen = n2 , (5.1) 2 es decir n2 senθc = . (5.2) n1 Supongamos que tenemos un cilindro de un material dieléctrico de ı́ndice de refracción n1 y radio a, que llamaremos el núcleo de la fibra, rodeado de un recubrimiento cilı́ndrico coaxial de material dieléctrico con ı́ndice de refracción n2 como se muestra en la figura 5.1 (n1 > n2 ) al cual llamaremos el recubrimiento. Si un rayo de luz incide sobre la cara frontal del cilindro interior, este se refractará y dependiendo del ángulo de incidencia sobre la interfase de los dieléctricos este puede o no reflejarse totalmente. Es facil ver que de ese momento en adelante que si el rayo es reflejado totalmente 31 32 CAPÍTULO 5. FIBRAS ÓPTICAS 1 0.8 0.6 0.4 r!!! laza Ye 0.2 emp , Re a ueb e pr d a r Figu 0 −0.2 −0.4 −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 5.1: Se muestran de manera esquemática un rayo que sufre refracción y uno que sufre reflexión interna total en una interfase de n1 > n2 . este seguirá “rebotando” hasta alcanzar el otro extremo de la fibra, como se muestra en la figura 5.1, en este caso decimos que el rayo queda guiado por la fibra. Por conveniencia definimos el número ∆= n1 − n2 n1 (5.3) que nos servirá en el desarrollo siguiente. El ángulo θa que corresponde a la inclinación del haz que después de ser refractado en la primera cara de la fibra incide sobre la interfaz en un ángulo θc cumple la condición senθa = n1 senθ1 (5.4) sabemos que sen2 θ1 + cos2 θ1 = 1, además, como se observa en la figura 5.1, el ángulo θ1 es suplementario de θc por lo que " 2 #1/2 n2 senθa = n1 1 − cos2 θ1 = n1 1 − sen2 θc = n1 1 − , (5.5) n1 tenemos pues que senθa = (n21 − n22 )1/2 , (5.6) que es conocido como el ángulo de aceptación y define el cono que separa a los rayos que son guiados en la fibra de los que escapan. Por conveniencia se 5.2. PROPAGACIÓN DE ONDAS EN FIBRAS ÓPTICAS 33 define el parámetro N A = (n21 − n22 )1/2 ≈ n1 (2∆)2 , (5.7) llamado apertura numérica. 5.2. Propagación de ondas en fibras ópticas Para entender la propagación de la luz en una fibra óptica hace falta entenderla desde el punto de vista electromagnético. Por tanto comenzaremos por plantear la ecuación de onda ∇2 u − 1 ∂2u = 0. c2 ∂t2 (5.8) Asumiendo una onda monocromática con una dependencia temporal eiωt en coordenadas cilı́ndricas se reduce a ∂ 2 u 1 ∂u 1 ∂2u ∂2u + + + 2 + n2 k 2 u = 0, ∂r2 r ∂r r2 ∂ϕ2 ∂z (5.9) aplicando separación de variables tenemos que u = R(r)e−ilϕ e−iβz con l = 0, ±1, ±2, . . .. Sustituyendo obtenemos la ecuación 1 l R00 + R0 + n2 k02 − β 2 − 2 R = 0, (5.10) r r que es una Ecuación de Bessel cuyas soluciones son las funciones de Bessel Jl (kT r), r < a , (5.11) R(r) = Kl (γr), r > a con kT2 = n21 k02 − β 2 y γ 2 = β 2 − n22 k02 . Nótese que para ondas guiadas tanto kT como γ son números reales. En r = 0 las soluciones Kl tienen una singularidad, por lo que estas no pueden ser soluciones en el núcleo de la fibra. De igual forma, las soluciones tienen que decaer rápida y monótonamente a cero al encontrarnos en la región de la cubierta ya que ahı́ solo se encontrará el campo evanescente, por lo que en esta región la solución no puede ser Jl que tiene un comportamiento oscilatorio. En la figura 5.2 se muestran las soluciones para l = 0 y l = 3. Sean X = kT a y Y = γa dos variables, definimos V 2 = X 2 + Y 2 , nótese que V 2 = a2 (kT2 + γ 2 ) = (n21 − n22 )k02 a2 = N A2 k0 es una constante para una fibra y una longitud de onda dada. El parámetro V está dado por a V = N Ak0 a = 2π N A, (5.12) λ0 34 CAPÍTULO 5. FIBRAS ÓPTICAS 1 0.8 0.6 0.4 r!!! laza Ye 0.2 emp , Re a ueb e pr d a r Figu 0 −0.2 −0.4 −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 5.2: Se muestran un par de soluciones de la ecuación onda en la fibra óptica. y es una caracterı́stica de la fibra para una longitud de onda λ0 dada. Imponiendo la continuidad de la función de onda y su derivada en la interfaz del núcleo y el recubrimiento tenemos que Jl (kT a) = Kl (γa), (5.13) kT Jl0 (kT a) = γKl0 (γa). (5.14) y Multiplicando la segunda ecuación por a y dividiendo las dos ecuaciones obtenemos kT aJl0 (kT a) γaKl0 (γa) = . (5.15) Jl (kT a) Kl (γa) Usando las relaciones conocidas entre las funciones de Bessel y sus derivadas Jl0 (x) = ±Jl∓1 (x) ∓ lJl (x)/x y Kl0 (x) = −Kl∓1 (x) ∓ lKl (x)/x tenemos que XJl+1 (X) Y Kl+1 (Y ) =± . Jl (X) Kl (Y ) √ V 2 − X 2 tenemos que √ √ XJl+1 (X) V 2 − X 2 Kl+1 ( V 2 − X 2 ) √ =± , Jl (X) Kl ( V 2 − X 2 ) Sustituyendo Y = (5.16) (5.17) 5.2. PROPAGACIÓN DE ONDAS EN FIBRAS ÓPTICAS 35 1 0.8 0.6 0.4 Ye r!!! laza 0.2 0 e ra d Figu −0.2 −0.4 emp , Re a b e pru −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 5.3: Se muestra la gráfica de ambos lados de la ecuación 5.17, las intersecciones representan las soluciones de la ecuación. ambos lados de esta ecuación para l = 0 están graficados en la figura 5.3, las soluciones de la ecuación son los puntos de intersección de ambas curvas. Es importante hacer notar que la primera solución siempre existe incluso para valores de V arbitrariamente pequeños debido a que X = 0 es un cero de la función XJ1 (X)/J0 (X). El número de soluciones adicionales está determinado por la cantidad de ceros αlm de las funciones Jl que caen por abajo del valor V para l = 1, 2, . . .. Llamaremos modos a cada una de las posibles soluciones, cada modo será etiquetado por la combinación (l, m). Es importante notar que la αlm mas pequeña distinta de cero es α11 ≈ 2,405, lo cual implica que si el valor V es menor que 2,405 solo habrá un modo permitido en la fibra, por lo que en este caso diremos que la fibra es monomodo. Si nos encontramos en el caso en que V > 2,405 entonces mas de un modo estará permitido en la fibra en cuyo caso diremos que la fibra es multimodo. Sea M el número de modos permitidos en la fibra, de la figura 5.3 es claro que M crecerá de manera discontinua como función de V , sin embargo para M 1 esta crece de manera “cuasicontinua” y de hecho se puede demostrar que M ≈ 4V 2 /π 2 . De hecho para m grande es posible demostrar también que 1 π π αlm ≈ l + 2m − ± 1 ≈ (l + 2m) . (5.18) 2 2 2 Dada la definición de X en términos de kT y de γ y por tanto de β, esto 36 CAPÍTULO 5. FIBRAS ÓPTICAS implica que para una combinación de l y m tenemos s α2 , βlm = n21 k02 − lm a2 que usando la ecuación 5.18 queda aproximado como r π2 βlm = n21 k02 − (l + 2m)2 2 . 4a (5.19) (5.20) Por otro lado tenemos que M≈ 4 2 4 4 V = 2 N A2 a2 k02 ≈ 2 (2n21 ∆)k02 a2 2 π π π usando esta aproximación obtenemos r βlm ≈ n1 k0 1−2 (l + 2m)2 ∆, M (5.21) (5.22) en caso que ∆ sea pequeña podemos hacer la aproximación de Taylor (1 + δ)1/2 ≈ 1 + δ/2 por lo que (l + 2m)2 βlm ≈ n1 k0 1 − ∆ . (5.23) M Las velocidades de grupo para los distintos modos están dados por dω , (5.24) dβlm √ dado que l + 2m varı́a de 2 a ≈ 2V /π = M , n1 k0 = ω − c1 tenemos que M ≈ 8a2 ω 2 ∆/(π 2 c21 ). Suponiendo que ∆ y c1 son independientes de ω vlm = vlm −1 (l + 2m)2 ≈ c1 1 + ∆ , M (5.25) si tomamos la aproximación de Taylor (1 + δ)−1 ≈ 1 − δ para δ pequeña obtenemos (l + 2m)2 ∆ . (5.26) vlm ≈ c1 1 − M De la ecuación anterior tenemos que la velocidad de grupo varı́a de c1 a c1 (1 − ∆) = c1 n2 /n1 dependiendo del modo. Nótese que ∆ define el número de modos y que una ∆ grande no solo implica un número grande de modos, 5.3. COMENTARIOS FINALES SOBRE FIBRAS ÓPTICAS 37 sino que habrá una gran dispersión entre ellos, por otro lado ∆ pequeña implica que N A será pequeña y por tanto la aceptación de luz será pequeña. La dispersión entre los modos puede tener consecuencias catastróficas para la transmisión de información en la fibra ya que un pulso en la fibra puede terminar viajando en varios modos, la dispersión tendrı́a pues el efecto de alargar los pulsos durante su tránsito por la fibra lo que limita la cantidad de pulsos, y por tanto de información, que se puede enviar por unidad de tiempo. Por el contrario ángulos de aceptación muy pequeños implican que la cantidad de luz que se puede acoplar a la fibra es limitada, lo que a su vez tiene como consecuencia un nivel de señal bajo. Tenemos pues un compromiso entre la intensidad de la señal y el ancho de banda de la información que puede ser transmitida por una fibra óptica. Finalmente el lector debe tomar en cuenta que la polarización de la luz no ha sido incluida, por lo que en realidad existen el doble de modos de los que calculamos anteriormente que corresponden a dos estados de polarización lineal mutuamente ortogonales. Para una l y m dadas, ambos estados de polarización tendrán la misma βlm , en ocasiones esto no es deseable para evitar el intercambio de energı́as entre dos pulsos de polarización ortogonal, para ello se han creado fibras ópticas cuya sección transversal no es circular sino elı́ptica que pueden ser utilizadas para transmitir información independiente en dos canales correspondientes a las dos polarizaciones. 5.3. Comentarios finales sobre fibras ópticas Además de las fibras de escalón existen muchos otros tipos de fibras ópticas. En particular se han fabricado fibras cuyo ı́ndice de refracción es una función continua de la posición radial y que son conocidas como fibras de ı́ndice graduado o GRIN por sus siglas en Inglés. Además existen fibras huecas, cuyo núcleo es de aire (n1 = 1) y finalmente las fibras de cristal fotónico en las que un arreglo con cierta simetrı́a cilı́ndrica de huecos y dieléctrico son utilizados para contener la luz en el núcleo de la fibra. Este ultimo tipo de fibras han dado lugar a muchos y muy importantes avances tecnológicos recientemente. 5.4. Problemas 1. Una fibra óptica esta hecha con un núcleo de radio 100 µm e ı́ndice de refracción 1.45 y una cubierta de ı́ndice de refracción 1.40. Calcule el 38 CAPÍTULO 5. FIBRAS ÓPTICAS ángulo de aceptación. ¿Es esta fibra monomodo o multimodo a 800nm? (recuerde que V = 2πaN A/λ0 ). Capı́tulo 6 Óptica de materiales El entender la propagación de la luz a través de materiales es fundamental para poder aprovechar sus propiedades en la óptica. En este capı́tulo deduciremos de primeros principios el concepto de ı́ndice de refracción para materiales dieléctricos isotrópicos y anisotrópicos al igual que para materiales conductores. Tambien se hará una introducción a los efectos electroópticos y a la óptica no lineal. 6.1. Óptica de dieléctricos isotrópicos Cuando se establece un campo eléctrico en un material dieléctrico las nubes electrónicas de los átomos que forman el material se deforman dando lugar a la formación de pequeños dipolos eléctricos en el material hasta que la superposición del campo eléctrico externo y el de los dipolos resulta en un campo neto igual a cero. La polarización1 del diélectrico P es una cantidad macroscópica que está dada por el momento dipolar −er multiplicada por el número de dipolos por unidad de volumen N P = −N er (6.1) donde r es el desplazamiento promedio de los electrones respecto a su posición de equilibrio en la ausencia de campo externo aplicado. La fuerza restitutiva que mantiene un electrón alrededor de un átomo está dada por la derivada del potencial atómico (vease ecuación FALTA !!! ATOMO DE HIDROGENO). Este potencial puede ser aproximado en la vecindad del mı́nimo como un potencial armónico, es decir podemos aproximar la fuerza 1 Ojo, no confundir la polarización del dieléctrico con la polarización de la luz. 39 40 CAPÍTULO 6. ÓPTICA DE MATERIALES 1 0.8 0.6 0.4 r!!! laza Ye 0.2 emp , Re a ueb e pr d a r Figu 0 −0.2 −0.4 −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 6.1: a) Se muestra el potencial atómico y como este puede ser aproximado por un potencial armónico (parabólico). b) Se muestra la representación gráfica de la aproximación armónica para un electrón. restitutiva electrostática por un resorte como se muestra en la figura 6.1 por tanto tenemos que el electrón siente una fuerza restitutiva “de Hook” y la del campo eléctrico externo que se equilibran −eE = Kr (6.2) donde K es la constante del resorte. Combinando las ecuaciones 6.1 y 6.2 obtenemos N e2 P= E. (6.3) K Si el campo eléctrico no es estático tenemos que la ecuación de movimiento del electrón esta dada por m d2 r dr + mγ + Kr = −eE dt2 dt (6.4) donde m es la masa del electrón, y γ es una constante disipativa que da lugar al término de amortiguamiento. Sea E = E0 e−iωt una onda monocromática, en este caso proponemos la solución r = r0 e−iωt que sustituyendo en la ecuación diferencial resulta en (−mω 2 − iωmγ + K)r = −eE, (6.5) 6.1. ÓPTICA DE DIELÉCTRICOS ISOTRÓPICOS 41 de donde obtenemos que P= N e2 E. −mω 2 − iωmγ + K (6.6) p Sea ω0 = K/m la frecuencia natural de oscilación del oscilador armónico asociado a cada electrón. En este caso tenemos que la ecuación anterior se reescribe N e2 /m P= 2 E. (6.7) ω0 − ω 2 − iωγ Tenemos pues que la ecuación de onda generalizada se escribe 2 1 ∂ 2 E µ 0 N e2 ∂ E 1 ∇ × (∇ × E) = − 2 2 − . 2 2 c ∂t m ω0 − ω − iγω ∂t2 (6.8) Asumiendo una solución de la forma E = E0 ei(Kz−ωt) obtenemos que ω2 N e2 1 2 . (6.9) K = 2 1+ c mε0 ω02 − ω 2 − iγω Si γ 6= 0 esto implica que K es un número complejo K = k + iα, lo que quiere decir que el ı́ndice de refracción es en realidad un número complejo ñ = n + iκ donde ω K = ñ. (6.10) c Es importante hacer notar que ñ no solo es un número complejo, sino que además es función de ω, es decir, el ı́ndice de refracción varı́a como función de la frecuencia o bien de la longitud de onda. La solución de la ecuación de onda (6.8) está dada por E = E0 e−αz ei(kz−ωt) , (6.11) donde α = κω/c. Nótese que la onda decaerá en amplitud exponencialmente al entrar al material siempre que α > 0. Tanto la parte real como la imaginaria del ı́ndice de refracción se muestran en la figura 6.2, al presencia de la resonancia de los osciladores armónicos tiene varias implicaciones importantes. Primero tenemos que ambas componentes complejas son una función de la frecuencia lo que implica que el medio es dispersivo, es decir que la velocidad de propagacion es distinto para distintas frecuencias y que el dieléctrico presenta un espectro de absorción con un pico bien definido que decae asintoticamente a cero, por lo que para frecuencias lejos de la resonancia el material será prácticamente transparente. 42 CAPÍTULO 6. ÓPTICA DE MATERIALES 1 0.8 0.6 0.4 r!!! laza Ye 0.2 emp , Re a ueb e pr d a r Figu 0 −0.2 −0.4 −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 6.2: a) Onda al propagarse en un material que experimenta absorción por la resonancia de los dipolos. Parte real (b) e imeginaria (c) del ı́ndice de refracción tı́pico para un material con una resonancia armónica. Para finalizar esta sección es importante hacer notar que los materiales suelen ser compuestos de varios átomos y que estos, salvo por el hidrógeno, tienen varios electrones en distintos estados, por lo que en un material real existe una colección de electrones que se encuentran mas o menos ligados a los núcleos dependiendo de su estado cuántico, por ello es importante incluir una resonancia distinta por cada uno de los estados electrónicos distintos que se encuentran en el material, lo cual a su vez da lugar a un ı́ndice de refracción con una colección de resonancias ñ = fj N e2 X , 2 mε0 ωj − ω 2 − iγj ω j (6.12) donde N es la densidad de átomos o moléculas en el material, fj es el de electrones en cada estado distinto por átomo o molécula, ωj es la frecuencia de resonancia que corresponde a cada uno de esos estados y γj es la constante de amortiguamiento para cada resonancia. 6.2. Óptica de materiales conductores A diferencia de los dieléctricos, los materiales conductores, como los metales, no tienen sus electrones ligados, por lo que en este caso no hay una 6.2. ÓPTICA DE MATERIALES CONDUCTORES 43 fuerza elástica que mantenga a los portadores cerca de una posición de equilibrio. Esto implica que la presencia de un campo eléctrico E en el material producirá una corriente hasta que el campo externo sea anulado. En este caso los electrones siguen la siguiente ecuación de movimiento m dv + mτ −1 v = −eE, dt (6.13) donde m es la masa del electrón, v es su velocidad y τ es el tiempo medio entre colisiones de los electrones con los núcleos (vease seccion 2.7). La densidad de corriente J está dada por J = N ev. (6.14) Sustituyendo esta expresión en la ecuación 6.13 obtenemos dJ N e2 + τ −1 J = E. dt m (6.15) En el caso de una corriente transitoria, es decir después de “apagar” abruptamente el campo eléctrico, la ecuación anterior se reduce a dJ + τ −1 J = 0, dt (6.16) la cual tiene por solución J = J0 e−t/τ , es decir, la corriente decaerá exponencialmente con una constante de tiempo τ . En el caso estacionario la ecuación 6.15 da lugar a la siguiente solución τ −1 J = N e2 E. m (6.17) Es bien conocido que en el caso estacionario la densidad de corriente y el campo eléctrico siguen la relación J = σE por lo que σ = N e2 τ /m. Supongamos ahora que ambos J y E son ondas armónicas de frecuencia ω, es decir que tienen una dependencia temporal de la forma eiωt . Sustituyendo en la ecuación 6.15 tenemos (−iω + τ −1 )J = τ −1 σE, de donde tenemos que J= σ E, 1 − iωτ (6.18) (6.19) 44 CAPÍTULO 6. ÓPTICA DE MATERIALES lo cual es consistente con que para ω = 0 tenemos que J = σE. Si ahora sustituimos la expresión 6.19 en la ecuación generalizada de onda obtenemos ∇2 E = µ0 σ ∂E 1 ∂2E + . 2 2 c ∂t 1 − iωτ ∂t (6.20) Supongamos que esta ecuación tiene una solución plana E = E0 ei(Kz−ωt) lo cual implica que ω2 iωµ0 σ K2 = 2 + . (6.21) c 1 − iωτ √ 2 Note que p si ω es pequeña entonces K ≈ iωµ0 σ por lo que K ≈ iωµ0 σ = (1+i) ωµ0 σ/2 lo que implica que las partes real e imaginaria de K = k+iα son aproximadamente iguales r ωµ0 σ k≈α≈ (6.22) 2 lo cual a su vez implica que las partes real e imaginaria del ı́ndice de refracción serán r σ n≈κ≈ . (6.23) 2ωε0 Observe que al igual que en el caso de un dieléctrico resulta que para los metales el ı́ndice de refracción es un número complejo que depende de la frecuencia. La llamada profundidad de piel del conductor está dada por s r 1 2 λ0 δ= = = . (6.24) α ωσµ0 2πσµ0 El ı́ndice de refracción cumple ñ2 = 1 − donde s ωp = ωp2 , ω 2 − iωτ −1 N e2 = mε0 r µ0 σc2 . τ (6.25) (6.26) Ambas componentes del ı́ndice de refracción se muestran en la figura 6.3. Se observa que para ω < ωp tenemos que κ > n y viceversa, además κ → 0 para ωp → ∞ lo cual quiere decir que los materiales conductores se vuelven transparentes a frecuencias suficientemente grandes. Esto se observa experimentalmente al usar rayos X que atraviesan sin problema la mayorı́a de los metales. 6.3. ÓPTICA DE CRISTALES ANISOTRÓPICOS 45 1 0.8 0.6 0.4 Ye r!!! laza 0.2 0 e ra d Figu −0.2 −0.4 emp , Re a b e pru −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 6.3: Partes real e imaginaria del ı́ndice de refracción de un metal. Finalmente vale la pena señalar que los materiales semiconductores tienen propiedades que caen entre los dieléctricos y los metales, por lo tanto para estos materiales es de esperarse que el ı́ndice de refracción tenga un componente dieléctrico (ecuación 6.12) y uno metálico (ecuación 6.25, por lo que su ı́ndice de refracción estará dado por ñ2 = 1 − 6.3. ωp2 fj N e2 X + . 2 2 −1 ω − iωτ mε0 ωj − ω 2 − iγj ω j (6.27) Óptica de cristales anisotrópicos Como ya se discutió en la sección 2.7, los cristales son materiales que a diferencia de los gases, los lı́quidos y los mal llamados “sólidos amorfos”2 tienen una estructura atómica ordenada y periódica. Es posible demostrar que existen 16 formas tridimensionales periódicas para acomodar objetos de manera periódica. Estas 16 formas son conocidas como las Redes de Bravais. Dependiendo de la periodicidad particular de un material puede ser que este presente distintas propiedades ópticas. 2 En realidad los sólidos amorfos, como los vidrios, mas bien son lı́quidos cuya viscosidad es tan alta que dan la impresión de ser sólidos. 46 6.3.1. CAPÍTULO 6. ÓPTICA DE MATERIALES Birefringencia Es de esperarse que un cristal cuya distancia interatómica en la dirección x sea diferente de la correspondiente distancia interatómica en la dirección y presente propiedades ópticas muy diferentes dependiendo de si la luz que incide en este tiene su campo eléctrico orientado en la dirección x o y. En el caso de un medio cristal la polarización está dada por Px χ11 χ12 χ13 Ex Py = ε0 χ21 χ22 χ23 Ey , (6.28) Pz χ31 χ32 χ33 Ez que de manera abreviada se puede escribir P = ε0 χ̃E, (6.29) donde χ̃ se llama el tensor de suceptibilidad. Para cristales ordinarios no absorbentes el tensor χ̃ es simétrico, por lo que existe un sistema coordenado en el cual χ11 0 0 χ̃ = 0 χ22 0 . (6.30) 0 0 χ33 Esta es llamada la representación de ejes principales y las tres χii se conocen como las suceptibilidades principales. Además los valores εii dados por ε̃ = ε0 (1 − χ̃) se conocen como las constantes dieléctricas principales. La ecuación generalizada de onda se puede escribir como ∇ × (∇ × E) + 1 ∂2E 1 ∂2E = − χ̃ , c2 ∂t2 c2 ∂t2 (6.31) suponiendo que la solución es una onda plana de la forma ei(k·r−ωt) la ecuación anterior se reduce a k × (k × E) + ω2 ω2 E = − χ̃E, c2 c2 (6.32) que explı́citamente se escribe como el siguiente sistema de ecuaciones ω2 ω2 2 2 −ky − kz + 2 Ex + kx ky Ey + kx kz Ez = − 2 χ11 Ex , (6.33) c c 2 ω ω2 ky kx Ex + −kx2 − kz2 + 2 Ey + ky kz Ez = − 2 χ22 Ey , (6.34) c c 2 ω ω2 kz kx Ex + kz ky Ey + −kx2 − ky2 + 2 Ez = − 2 χ33 Ez . (6.35) c c 6.3. ÓPTICA DE CRISTALES ANISOTRÓPICOS 47 Si tomamos, sin perdida de generalidad, k = kx y ky = kz = 0 tenemos que el sistema se reduce a ω2 ω2 E = − χ11 Ex , x 2 c c2 ω2 ω2 −k 2 + 2 Ey = − 2 χ22 Ey , c c 2 ω ω2 −k 2 + 2 Ez = − 2 χ33 Ez . c c (6.36) (6.37) (6.38) De estas ecuaciones se sigue que Ex = 0, ωp k = 1 + χ22 , c p ω k = 1 + χ33 , c (6.39) (6.40) (6.41) lo cual podrı́a parecer una contradicción, ya que de 6.40 y 6.41 se tendrı́an dos valores distintos para el número k, sin embargo cuando se analiza con detalle es claro que no hay tal contradicción, ya que cada uno de los valores de k corresponde a los números de onda para ondas cuyo campo eléctrico esta polarizado3 en la dirección y y z respectivamente. Ello implica que existirán dos ı́ndices de refracción distintos para esta onda. Sean p n1 = 1 + χ11 , (6.42) p n2 = 1 + χ22 , (6.43) p 1 + χ33 , (6.44) n3 = los ı́ndices de refracción principales. Imponiendo la condición para que el sistema formado por las ecuaciones 6.33, 6.34 y 6.35 tenga solución única en Ex , Ey y Ez tenemos que n1 ω 2 c − ky2 − kz2 ky kx kz kx kx ky − kx2 − kz2 kz ky n2 ω 2 c kx kz k k y z2 n3 ω 2 − kx − ky2 c = 0. (6.45) Sin perdida de generalidad asumamos que el vector k se encuentra en un plano, digamos x, y, por lo que kz = 0. En este caso el determinante se 3 Ojo, no confundir polarización del campo eléctrico con polarización de un dieléctrico 48 CAPÍTULO 6. ÓPTICA DE MATERIALES reduce a n 2 ω 2 2 2 2 − kx − kx − ky = 0. c (6.46) Por lo que uno de los dos multiplicandos debe ser cero. Analizando los dos casos, obtenemos las siguientes ecuaciones n 3 ω 2 − kx2 − x2y c n 1 ω 2 − ky2 c kx2 + ky2 = ky2 kx2 + (n2 ω/c)2 (n1 ω/c)2 n ω 2 3 , c = 1, (6.47) (6.48) que son las ecuaciones de un cı́rculo y una elipse. Las combinaciones de kx y ky que cumplan alguna de las dos ecuaciones determinan las magnitudes permitidas para el vector de onda y por tanto los dos ı́ndices de refracción que aparecen para cada dirección de propagación en el plano x, y como se muestra en la figura 6.4. Note que dependiendo de los parámetros de la elipse y el cı́rculo es posible que estos se toquen tangencialmente con lo cual solo habrá una dirección en la cual existe un único valor para la magnitud del vector k, o bien el circulo y la elipse se pueden cruzar, en cuyo caso habrá dos direcciones distintas en las que el valor de la magnitud de k es único. La o las direcciones en las que esto sucede se les conoce como eje óptico y los cristales en los que existe solo un eje óptico son conocidos como uniaxiales, mientras que aquellos en los que hay dos ejes ópticos son conocidos como biaxiales. Finalmente es importante aclarar que la forma del tensor χ̃ depende de la simetrı́a del cristal, tı́picamente los materiales isotrópicos, como los que tienen un arreglo atómico cubico, tienen un tensor dieléctrico de la forma χ 0 0 χ̃ = 0 χ 0 . 0 0 χ (6.49) Para cristales uniaxiales, cuya simetrı́a cristalográfica suele ser trigonal, tetragonal o hexagonal, el tensor dieléctrico tiene la forma χ11 0 0 χ̃ = 0 χ11 0 . 0 0 χ33 (6.50) 6.3. ÓPTICA DE CRISTALES ANISOTRÓPICOS 49 1 0.8 0.6 0.4 r!!! aza Ye 0.2 0 −0.2 Figu −0.4 e ra d pl eem R , ba prue −0.6 −0.8 −1 0 1 2 3 Equis 4 5 6 Figura 6.4: Dado un plano sobre el cual se propaga una onda luminosa en un cristal se demuestra que existen dos posibles magnitudes del vector k para cada dirección particular de propagación. Los dos posibles valores caen en un circulo y una elipse respectivamente. Existen tres casos de interés que determinan si el cristal es biaxial (con dos ejes ópticos) o uniaxial (con un eje óptico) positivo o negativo. 50 CAPÍTULO 6. ÓPTICA DE MATERIALES Para los cristales biaxiales, con simetrı́as triclı́nicas, monoclı́nicas u ortotómicas, el tensor tiene la forma χ11 0 0 χ̃ = 0 χ22 0 . (6.51) 0 0 χ33 6.3.2. Actividad óptica La actividad óptica es una forma diferente de birefringencia en la que los dos estados de polarización que se propagan a distintas velocidades son los estados circulares levógiro (izquierdo) y dextrógiro (derecho). Es posible demostrar que el tensor de susceptibilidad de un material óptimamente activo tiene la forma χ11 iχ12 0 0 . χ̃ = −iχ12 χ11 (6.52) 0 0 χ33 donde las χij son números reales. Usando la ecuación 6.32 asumiendo que tenemos una onda que se propaga en la dirección z con número de onda k tenemos que ω2 ω2 Ex = − 2 (χ11 Ex + iχ12 Ey ), 2 c c 2 ω ω2 −k 2 Ey + 2 Ey = − 2 (−iχ12 Ex + χ11 Ey ), c c 2 ω ω2 Ez = − 2 χ33 Ez . 2 c c − k 2 Ex + (6.53) (6.54) (6.55) La última de estas ecuaciones implica que Ez = 0, lo cual es de esperarse dado el carácter transverso de las ondas electromagnéticas. Por otro lado, para que las primeras dos ecuaciones tengan una solución no trivial es necesario que 2 2 −k 2 + ωc2 (1 + χ11 ) i ωc2 χ12 = 0, (6.56) 2 2 −k 2 + ωc2 (1 + χ11 ) −i ωc2 χ12 por lo que k debe cumplir k= ωp 1 + χ11 ± χ12 . c (6.57) Sustituyendo estos dos valores de k en las ecuaciones 6.53 y 6.54 obtenemos Ex = ±iEy . De aquı́ que los dos estados de polarización con valores de k 6.4. PROBLEMAS 51 distintos corresponden a los estados dextrógiro y levógiro. De aquı́ que sus dos ı́ndices de refracción están dados por p nR = 1 + χ11 + χ12 , (6.58) p nL = 1 + χ11 − χ12 . (6.59) Los materiales ópticamente activos tienen el efecto de rotar el ángulo de polarización de la luz linealmente polarizada que pasa a través de ellos. La potencia rotatoria se define como δ = (nR − nL ) π πχ12 ≈ , λ no λ (6.60) por lo que la la potencia rotatoria es, aproximadamente, proporcional a la componente imaginaria χ12 del tensor de susceptibilidad que se encuentra fuera de la diagonal. 6.4. Problemas 1. Un metal tiene una frecuencia de plasma de ωp = 1015 Hz y un tiempo de relajación τ = 10−13 s. Halle las partes real e imaginaria de su indice de refracción a las frecuencias ωp , 2ωp y ωp /2. 2. La reflectancia de una material es 80 % a incidencia normal. Si su κ = 4 calcule la parte real de su indice de refracción. 3. La conductividad de la plata es 6,8 × 107 Ω−1 m−1 . Asumiendo que la densidad de portadores de carga (electrones) es 1,5×1028 m−3 , calcule: La frecuencia de plasma, el tiempo de relajación, las partes real e imaginaria de su ı́ndice de refracción y la reflectancia a λ = 1 µm. 4. Para el aluminio a λ = 500 nm se tiene que ñ = 1,5 + 3,2i. Halle la reflectancia a incidencia normal y el cambio de fase. 5. Tome un cristal uniaxial con indices de refracción no y ne cortado de tal forma que el eje óptico se encuentra perpendicular a la superficie. Demuestre que para un rayo que incide desde afuera a un ángulo θ, el ángulo de refracción extraordinario φe cumple: tan φe = no sin θ p . ne n2e − sin2 θ (6.61) 52 CAPÍTULO 6. ÓPTICA DE MATERIALES Capı́tulo 7 Electroóptica y Magnetoóptica En muchos casos la aplicación de un campo eléctrico o magnético estático en un material dieléctrico puede perturbar la dinámica de los electrones que ahı́ se encuentran que son a su vez, como se vio en el capı́tulo anterior, responsables por las propiedades ópticas del material. Por tanto es de esperarse que la aplicación de dicho campo externo pueda modificar las propiedades ópticas del material. 7.1. Efecto Kerr Cuando un campo eléctrico es aplicado sobre un material ya sea isotrópico o anisotrópico este induce dipolos en el material en la dirección paralela al campo aplicado. Esto a su vez rompe la simetrı́a del material induciendo birefringencia, este fenómeno es conocido como el Efecto Kerr. Cada material tiene una constante llamada constante de Kerr que nos relaciona la diferencia entre los ı́ndices de refracción paralelo nk y perpendicular n⊥ al campo aplicado de la siguiente manera nk − n⊥ = KE 2 λ0 , (7.1) donde λ0 es la longitud de onda en el vacı́o y E la magnitud del campo aplicado. Debido a su dependencia cuadrática en E es conocido también el efecto electroóptico cuadrático. El efecto Kerr combinado con un par de polarizadores cruzados se puede usar para producir moduladores de intensidad luminosa como se describirá en la siguiente sección. 53 54 CAPÍTULO 7. ELECTROÓPTICA Y MAGNETOÓPTICA 7.2. Efecto Pockels 7.3. Efecto Faraday 7.4. Problemas 1. Un cristal de KD2 PO4 cuyo coeficiente electrooptico es de 26,8 × 10−12 m/V y con indice de refracción no = 1,50 (a 546 nm) es utilizado para fabricar una celda Pockels. Si el cristal mide 10 mm, calcule el voltage que se necesita aplicar para producir una rotación de 90◦ (es decir un desfase de π entre las componentes). Capı́tulo 8 Óptica no lineal 8.1. Mas allá de la aproximación armónica 8.2. Efectos de segundo orden 8.3. Efectos de tercer orden 8.4. Problemas 1. En un cristal generador de segundo armónico se hace incidir radiación de 1000 nm (n = 1,5) determine la distancia óptima del cristal si el ı́ndice de refracción a 500 nm es n = 1,48. 55 56 CAPÍTULO 8. ÓPTICA NO LINEAL Capı́tulo 9 Otros temas de interés 9.1. Recubrimientos dieléctricos 9.2. Cristales fotónicos 9.3. Plasmones 9.4. Metamateriales 9.5. Óptica ultrarrápida 9.6. Terahertz 9.7. Problemas 1. Si un substrato de vidrio (n = 1,4) es recubierto con una pelı́cula delgada con espesor 200 nm de un material de ı́ndice de refracción 1.18, calcule la reflexión a incidencia normal como función de la longitud de onda. 2. Calcule el espectro de un pulso gausiano con longitud de onda central 800 nm y desviación standard 50 fs. 57 58 CAPÍTULO 9. OTROS TEMAS DE INTERÉS Apéndice A Ecuaciones de Maxwell Las ecuaciones de Maxwell en el espacio son ρ , ε0 ∇ · B = 0, ∂B ∇×E = − , ∂t 1 ∂E ∇×B = 2 + µ0 J, c ∂t ∇·E = donde ρ es la densidad de carga, ... 59 (A.1) (A.2) (A.3) (A.4) 60 APÉNDICE A. ECUACIONES DE MAXWELL Bibliografı́a [1] Luis Cárdenas and Tomás Raggi. Álgebra superior. Editorial Trillas, 1997. (document) [2] S. Lang. Introduction to linear algebra. Springer, 1986. (document), 2.1.1 [3] M. Kline. Calculus: an intuitive and physical approach. Dover Pubns, 1998. (document) [4] JE Marsden and AJ Tromba. Cálculo vectorial. Addison Wesley, 1998. (document) [5] W.E. Boyce and R.C. DiPrima. Elementary differential equations and boundary value problems. Wiley New York, 2001. (document) [6] D. Halliday, R. Resnick, and J. Walker. Fundamentals of physics. Wiley, 2010. (document) [7] Luis de la Peña. Introducción a la mecánica cuántica. Fondon de Cultura Ecónomica, 1991. 2 [8] AN Kolmogorov, SV Fomin, and JL Safko. Introductory Real Analysis. Dover, 1975. 2 [9] H Goldstein, CP Poole, and JL Safko. Classical Mechanics. Addison Wesley, 2001. 2.1.1 61 62 BIBLIOGRAFÍA