(rezende@df.ufpe.br) i Materiais e Dispositivos Eletrônicos Editora Livaria da Fı́sica ii iii Materiais e Dispositivos Eletrônicos SERGIO M. REZENDE Departamento de Fı́sica Universidade Federal de Pernambuco Editora Livraria da Fı́sica São Paulo – 2004 – 2a¯ edição iv Copyright 2004: Editora Livraria da Fı́sica Editor: José Roberto Marinho Capa: Miguel Pachá Filho Revisão: Sergio Machado Rezende Impressão: Gráfica Paym Dados de catalogação na Publicação (CIP) Internacional ( Câmara Brasileira do Livro, SP, Brasil ) Rezende, Sergio Machado Materiais e Dispositivos Eletrônicos/Sergio M. Rezende – 2a¯ ed. – São Paulo: Editora Livraria da Fı́sica, 2004. Bibliografia. 1. Aparelhos e dispositivos eletrônicos 2. Eletrônica I . Tı́tulo 04 - 1157 CDD – 621.381 Índices para catálogo sistemático 1. Materiais e dispositivos: Engenharia eletrônica 621.381 ISBN: 85-88325-27-6 Editora Livraria da Fı́sica Telefone: 0xx11 – 3816 7599 Fax: 0xx11 – 3815 8688 e-mail: livraria@if.usp.br Página na internet: www.livrariadafisica.com.br v Í N D I C E Prefácio ix Capı́tulo 1. Materiais para Eletrônica 1 1.1 Eletrônica e Fı́sica do Estado Sólido 1.2 Ligações Atômicas 1.3 Materiais Cristalinos 1.4 Materiais para Dispositivos Eletrônicos Capı́tulo 2. Ondas e Partı́culas na Matéria 2.1 Ondas Eletromagnéticas 2.2 Ondas Elásticas em Sólidos 2.3 Efeito Fotoelétrico - Ondas e Partı́culas 2.4 O Elétron como uma Onda - Princı́pio da Incerteza 2.5 Fônons e outras Excitações Elementares Capı́tulo 3. Mecânica Quântica: O Elétron no Átomo 3.1 Os Postulados da Mecânica Quântica 3.2 A Equação de Schroedinger Independente do Tempo 3.3 Aplicações Simples da Mecânica Quântica 3.4 Elétron no Átomo de Hidrogênio 3.5 Átomos de Muitos Elétrons 2 5 8 14 27 28 34 40 46 50 55 56 60 62 73 84 vi Capı́tulo 4. Elétrons em Cristais 4.1 Bandas de Energia em Cristais 4.2 Condutores, Isolantes e Semicondutores 4.3 Massa Efetiva 4.4 Comportamento dos Elétrons em T > 0 - Distribuição de Fermi-Dirac 4.5 O Mecanismo da Corrente Elétrica em Metais Capı́tulo 5. Materiais Semicondutores 91 92 98 101 103 109 117 5.1 Semicondutores 5.2 Elétrons e Buracos em Semicondutores Intrı́nsecos 5.3 Semicondutores Extrı́nsecos 5.4 Dinâmica de Elétrons e Buracos em Semicondutores 118 122 135 145 Capı́tulo 6. Dispositivos Semicondutores: Diodos 167 6.1 A Junção p-n 6.2 Corrente na Junção Polarizada 6.3 Heterojunções 6.4 Diodo de Junção 6.5 Diodo de Barreira Schottky 6.6 Ruptura na Polarização Reversa: Diodo Zener 6.7 Outros Tipos de Diodos 168 180 186 192 198 200 202 Capı́tulo 7. Transistores e Outros Dispositivos Semicondutores 215 7.1 O Transistor 7.2 O Transistor Bipolar 7.3 Correntes no Transistor Bipolar 7.4 Aplicações de Transistores 7.5 Transistores de Efeito de Campo 7.6 O Transistor MOSFET 7.7 Dispositivos de Controle de Potência: SCR e TRIAC 7.8 Circuitos Integrados 217 219 225 237 241 251 267 271 vii Capı́tulo 8. Materiais e Dispositivos Opto-Eletrônicos 287 8.1 Propriedades Ópticas dos Materiais 8.2 Interação da Radiação com a Matéria - Modelo Clássico 8.3 Teoria Quântica da Interação Radiação-Matéria 8.4 Fotodetetores 8.5 Diodo Emissor de Luz (LED) 8.6 Emissão Estimulada e Lasers 8.7 O Laser de Diodo Semicondutor 8.8 Aplicações dos Lasers de Diodo 289 298 308 323 342 348 359 372 Capı́tulo 9. Materiais e Dispositivos Magnéticos 383 9.1 Magnetismo e Materiais Magnéticos 9.2 Propriedades Magnéticas da Matéria 9.3 Materiais Magnéticos 9.4 Materiais para Aplicações Tradicionais 9.5 Gravação Magnética 9.6 Dispositivos de Ferrites para Microondas 385 390 400 416 425 442 Capı́tulo 10. Outros Materiais Importantes para a Eletrônica 463 10.1 Materiais Dielétricos 10.2 Materiais Dielétricos para Opto-Eletrônica 10.3 Materiais para Mostradores e Telas de Vı́deo 10.4 Materiais Supercondutores 465 484 493 514 Apêndice A. Teoria de Perturbação: Cálculo da Probabilidade de Transição 535 Apêndice B. Constantes Fı́sicas e Tabela de Conversão de Unidades Energia 539 Apêndice C. Tabela Periódica dos Elementos 540 Índice Analı́tico 541 viii ix Prefácio O advento da eletrônica e das tecnologias a ela relacionadas foi um dos principais responsáveis pelas grandes transformações econômicas e sociais verificadas no final do Século XX. O desenvolvimento destas tecnologias resultou de um enorme investimento em pesquisa básica e aplicada nos paı́ses industrializados. Como conseqüência, estes paı́ses passaram a concentrar a maior parte do conhecimento cientı́fico e tecnológico e, por conseguinte, têm hoje grande vantagem competitiva em relação aos demais numa economia globalizada. O Brasil custou a criar condições para dominar as tecnologias relacionadas à eletrônica. O primeiro curso de engenharia eletrônica só foi criado na década de 1950, no Instituto Tecnológico de Aeronáutica. Em 1958, e portanto dez anos após a descoberta do transistor, haviam no Paı́s menos de dez fı́sicos do Estado Sólido, a área da ciência que mais contribuiu para o desenvolvimento da eletrônica. Todavia, a partir da década de 1960, foi desencadeado um grande esforço de desenvolvimento cientı́fico e tecnológico no Paı́s. Foram criados grupos de pesquisa e cursos de pós-graduação em todas as áreas do conhecimento. Isto resultou numa melhoria considerável nos cursos de ciências e engenharia e, conseqüentemente, na qualidade dos recursos humanos formados para as universidades, as empresas e a sociedade em geral. A despeito do progresso recente, ainda é necessário investir muito em ciência e tecnologia no Brasil. Este livro tem como objetivo contribuir para o aumento da competência do Paı́s na eletrônica, que sem dúvida será uma tecnologia estratégica para o século XXI. Sua proposta básica é introduzir os materiais e dispositivos eletrônicos no estágio inicial dos cursos de graduação de engenharia elétrica, eletrônica e de computadores, fı́sica, informática e outros cursos de ciências e engenharia. Todos sabemos que a compreensão da finalidade e da operação básica dos dispositivos é essencial para projetar equipamentos eletrônicos. Entretanto, as disciplinas de dispositivos, quando constam dos currı́culos, exigem inúmeros pré-requisitos que acarretam sua apresentação em estágio avançado dos cursos universitários. Este livro possibilita o ensino de materiais e dispositivos eletrônicos a partir do 4o¯ semestre dos cursos, pois apresenta também os conceitos básicos de ondas e de mecânica quântica em nı́vel acessı́vel aos estudantes. O livro tem caráter introdutório e não entra nos detalhes técnicos mais especı́ficos dos dispositivos e dos métodos de fabricação de materiais. Preferi sacrificar o detalhe em favor da abrangência, apresentando dispositivos e materi- x ais baseados numa grande variedade de fenômenos. A ênfase é na conceituação fı́sica das propriedades dos materiais e dos princı́pios básicos de funcionamento dos dispositivos. Procurei fazer uma apresentação bastante didática, visando principalmente motivar estudantes, como também profissionais de outras áreas, pela eletrônica. Esta abordagem dá ao livro um caráter original. O material é adequado para dois semestres tradicionais de aulas. Os três primeiros capı́tulos apresentam a introdução básica de materiais para eletrônica e a conceituação fı́sica necessária para a compreensão dos fenômenos que neles ocorrem. Nesta parte o conceito de onda é bastante explorado, pois ele desempenha papel fundamental na mecânica quântica e, por conseguinte, nas propriedades de elétrons nos átomos e nos materiais. O Capı́tulo 4 é dedicado ao estudo das principais propriedades dos elétrons nos materiais, sendo, portanto, também básico para os capı́tulos seguintes. A partir do Capı́tulo 5 os temas tornam-se mais especı́ficos. Neste capı́tulo são apresentados as principais caracterı́sticas dos materiais semicondutores. Os Capı́tulos 6 e 7 são dedicados aos princı́pios de funcionamento dos dispositivos fabricados com estes materiais, diodos, transistores e dispositivos correlatos, que hoje existem numa grande variedade de tipos e categorias. O diodo de junção e o transistor de junção são estudados em maior detalhe, uma vez que suas equações podem ser inteiramente deduzidas a partir das leis e equações básicas, apresentadas nos capı́tulos iniciais. O Capı́tulo 8 apresenta as propriedades básicas da interação da luz com a matéria e uma variedade de dispositivos usados na conversão da luz em corrente elétrica, ou vice-versa. Estes dispositivos são responsáveis pela viabilização da opto-eletrônica e suas aplicações em diversas áreas da ciência, da medicina e da engenharia. Nesta categoria encontram-se os fotodetetores, como os fotodiodos e as células solares, os diodos emissores de luz (LED) e os lasers. Os princı́pios básicos dos lasers de semicondutores e das fibras ópticas são estudados em mais detalhe, em virtude de sua importância nas comunicações ópticas. O Capı́tulo 9 é dedicado a materiais e dispositivos magnéticos, que desempenham um papel fundamental na eletrônica e que normalmente não são apresentados nos livros de dispositivos. Ênfase especial é dada aos processos de gravação magnética, uma vez que esta tecnologia tem importância crescente nos computadores e em inúmeras aplicações da vida diária. Os dispositivos de ferrite para utilização nos sistemas de microondas também têm destaque neste capı́tulo. Finalmente, o Capı́tulo 10 apresenta uma variedade de materiais com xi aplicações especı́ficas, porém muito importantes na gama cada vez maior de dispositivos eletrônicos. Entre eles destacam-se os materiais piezoelétricos, os dielétricos usados na opto-eletrônica, os eletretos e os materiais empregados na fabricação de telas de vı́deo, as cerâmicas fosforescentes, os cristais lı́quidos e os condutores orgânicos. A última seção apresenta as propriedades básicas dos materiais supercondutores, que têm algumas aplicações práticas e têm potencial de futuras aplicações em eletrônica. Os materiais e dispositivos apresentados neste livro são essenciais para o funcionamento dos equipamentos eletrônicos da atualidade e provavelmente dos que serão utilizados nas próximas décadas. Ao decidir escrevê-lo, no inı́cio da década de 1990, a motivação principal era suprir uma lacuna na literatura técnica em lı́ngua portuguesa. A primeira edição foi publicada pela Editora da UFPE em 1996, com o tı́tulo A Fı́sica de Materiais e Dispositivos Eletrônicos. Pela reação inicial positiva que percebi em professores e estudantes, fiquei otimista com a possibilidade de vê-lo adotado como livro texto em diversos cursos. Isto realmente aconteceu, pelo que tenho conhecimento, ele foi adotado em pelo menos quinze universidades brasileiras e uma em Portugal. Isto exigiu que a primeira edição fosse reimpressa duas vezes. Nesta segunda edição retirei a palavra Fı́sica do tı́tulo, pois percebi que em algumas livrarias o livro não era colocado nas seções de Engenharia, mas apenas nas de Fı́sica. Em relação à primeira edição, a atual tem diversas novidades, como exemplos numéricos em todos os capı́tulos, seções com material novo, principalmente nos últimos capı́tulos, além de uma revisão completa do texto, com melhoria de algumas explicações e extensa correção de pequenos erros. É com satisfação que agradeço a colaboração de vários colegas professores do Departamento de Fı́sica da UFPE, feita por meio de sugestões diversas, crı́ticas e revisões de textos. Sou grato em particular a Anderson Gomes, Antônio Azevedo, Celso Melo, Cid Araújo, Fernando Machado, Flávio Aguiar e José Marcı́lio Ferreira. Sou muito grato a Gilvani Holanda pelo competente e dedicado trabalho de digitação, a Carlos Marrocos e Joaquim Antônio Soares pela confecção das figuras, a Jairo Coutinho, pelo belo trabalho de diagramação, e a meu genro, o artista plástico Miguel Pachá, que fez a capa do livro. Minhas atividades de pesquisa, e portanto as condições para a realização deste livro, não seriam possı́veis sem o apoio financeiro do CNPq, FINEP, CAPES, MCT e da UFPE. Desde já deixo os agradecimentos antecipados a todos aqueles que, futuramente, me enviarem crı́ticas e sugestões para a melhoria do livro (smr@df.ufpe.br). xii Não posso perder a oportunidade de deixar registrado o reconhecimento a Leo e Elsa, meus pais, que me educaram e sempre souberam me estimular, e a Cláudia, Isabel e Marta, minhas filhas, que ao se tornarem adultas, compreenderam bem porque não dediquei a elas mais tempo quando eram crianças. Finalmente, meu maior agradecimento é para Adélia, que sempre me incentivou nesta empreitada, ajudou a esclarecer inúmeras dúvidas ortográficas e acompanhou com grande interesse cada uma das fases da elaboração das duas edições do livro. Recife, 29 de janeiro de 2004 O autor Capı́tulo 1 Materiais para Eletrônica 1.1 Eletrônica e Fı́sica do Estado Sólido 2 1.2 Ligações Atômicas 5 1.3 Materiais Cristalinos 8 1.3.1 Redes Cristalinas 1.3.2 Estruturas Cristalinas Simples 1.4 Materiais para Dispositivos Eletrônicos 9 11 14 1.4.1 Monocristais 1.4.2 Cerâmicas e Vidros 1.4.3 Polı́meros 1.4.4 Cristais Lı́quidos 1.4.5 Filmes Finos e Multicamadas 14 17 19 20 21 REFERÊNCIAS 25 PROBLEMAS 25 1 2 Materiais e Dispositivos Eletrônicos Materiais para Eletrônica 1.1 Eletrônica e Fı́sica do Estado Sólido A Eletrônica é o ramo da tecnologia mais marcante do Século XX. Ela surgiu em 1906 com a invenção por Lee De Forest, nos Estados Unidos, da válvula triodo, um dispositivo que tornou possı́vel a amplificação de sinais elétricos. A válvula triodo consiste de um tubo a vácuo contendo três eletrodos: o catodo, que aquecido emite elétrons, o anodo, no qual os elétrons são recebidos, e a grade, situada entre o catodo e o anodo, que serve para controlar o fluxo de elétrons e possibilitar a amplificação de sinais. Além do triodo, há outros tipos de válvulas, como o diodo, que tem dois eletrodos (apenas catodo e anodo), os pentodos com cinco, entre outras. O funcionamento de todas as válvulas é baseado no controle do movimento dos elétrons entre os eletrodos por meio da ação de um campo elétrico sobre sua carga elétrica. Esta é a origem do nome Eletrônica. O principal produto da Eletrônica na primeira metade do século XX foi, o rádio, que possibilitou a comunicação e a difusão de informações à distância através da voz e da música. Mais tarde foi desenvolvido o sistema para a transmissão à distância de imagens em movimento, a televisão. Depois vieram os computadores e também uma grande variedade de equipamentos para diversas finalidades. Porém, a Eletrônica baseada nas válvulas a vácuo tinha grandes limitações e inconvenientes. As válvulas eram grandes, frágeis, aqueciam muito, tinham vida curta e fabricação dispendiosa, além de várias desvantagens técnicas. Por esta razão, desde antes da segunda Grande Guerra procurava-se um dispositivo que pudesse substituir as válvulas nos equipamentos eletrônicos. O grande passo nesta direção foi dado em 1947 por J. Bardeen, W. Brattain e W. Shockley, três fı́sicos dos laboratórios da Bell Telephone que Cap. 1 Materiais para Eletrônica 3 estudavam propriedades de condução eletrônica em semicondutores. Naquele ano eles descobriram o transistor, um dispositivo de três elementos que possibilitava o controle da corrente elétrica no interior de um material semicondutor, e que poderia substituir a válvula triodo. Durante a década de 1950 o transistor foi aperfeiçoado, tornando-se um dispositivo confiável, com aplicações nos mais diversos equipamentos eletrônicos e com custos de fabricação cada vez mais baixos. Na década de 1960 assistimos à miniaturização da eletrônica, com o desenvolvimento dos circuitos integrados, contendo inúmeros transistores e diodos, interligados com resistores e capacitores, fabricados na mesma pastilha de semicondutor. A fabricação dos circuitos integrados com elementos de dimensões da ordem de alguns micrômetros (10−6 metros) deu origem à tecnologia da microeletrônica. Com a crescente miniaturização dos componentes, surgiram na década de 1970 os microprocessadores, com os quais foi possı́vel fabricar os microcomputadores. A produção de circuitos integrados e microprocessadores cada vez mais rápidos e com maior número de elementos está produzindo uma constante evolução na Eletrônica. Esta evolução provocou uma enorme mudança nos costumes da sociedade, proporcionada pelos modernos sistemas de comunicação, a ampla utilização dos computadores, a automação dos meios de produção e os mais variados equipamentos utilizados em nossa vida diária. Por esta razão, a Eletrônica tornou-se um dos principais fatores de desenvolvimento do final do século XX e provavelmente continuará com este papel no século que inicia. Além dos diodos, transitores, circuitos integrados e microprocessadores, cuja operação é baseada nas propriedades de transporte eletrônico dos semicondutores, existe um grande número de outros dispositivos que dão à eletrônica uma enorme variedade de aplicações. Eles são baseados em diversas propriedades de materiais sólidos, ópticas, magnéticas, térmicas, etc. A descoberta desses dispositivos só foi possı́vel graças ao conhecimento acumulado com as atividades de pesquisa em Fı́sica do Estado Sólido. Esta é a área da Fı́sica que investiga as propriedades e os fenômenos que ocorrem em materiais sólidos, e que ganhou um grande impulso com a descoberta do transistor. Até a década de 1950, os trabalhos nesta área estavam concentrados nos sólidos cristalinos, que são aqueles cujos átomos ou ı́ons constituintes têm um arranjo ordenado periódico. Nesses sólidos ocorrem fenômenos que não existem em materiais amorfos. Além disso, como eles têm estrutura cristalina com propriedades de simetria bem definidas, os fenômenos podem ser interpretados pelas leis da Fı́sica com mais facilidade. Com o progresso das técnicas experimentais e teóricas de investigação, esta área se estendeu a materiais mais complexos, como vidros, polı́meros orgânicos diversos, ligas amorfas e até mesmo os lı́quidos, passando a ser conhecida como Fı́sica da Matéria Condensada. 4 Materiais e Dispositivos Eletrônicos Nesta área da Fı́sica trabalham atualmente mais de 40% dos fı́sicos em todo o mundo e a cada ano surgem novas linhas de pesquisa, impulsionadas pela descoberta de novas propriedades, novos fenômenos e novos materiais artificiais. Estes, por sua vez, abrem o potencial para o desenvolvimento de novos dispositivos que encontram aplicações nos mais variados segmentos tecnológicos, e cujo interesse econômico impulsiona as pesquisas básica e aplicada. Foram as descobertas em Fı́sica da Matéria Condensada que possibilitaram o desenvolvimento do transistor, dos circuitos integrados e de inúmeros dispositivos que revolucionaram a eletrônica e os computadores. Os lasers encontraram inúmeras aplicações na indústria e na medicina e propiciaram o advento das comunicações ópticas. Os materiais magnéticos novos são os responsáveis pela melhoria de dispositivos e de processos de gravação, que estão tendo enorme impacto nos meios de comunicação e nos computadores. Entretanto, não foi apenas por causa de sua importância tecnológica que a nova área se desenvolveu rapidamente. A enorme variedade de fenômenos que os elétrons e os núcleos apresentam coletivamente em sólidos deu origem a descobertas fundamentais excitantes. Esta é uma das razões para que cerca de 50% dos prêmios Nobel nos últimos 30 anos tenham sido dados a fı́sicos que trabalharam nesta área. Foram eles J. Bardeen, L.N. Cooper e J.R. Schrieffer (1972 - teoria de supercondutividade), L. Esaki, I. Giaever e B. Josephson (1973 - efeito de tunelamento em sólidos), P.W. Anderson, N.F. Mott e J.H. Van Vleck (1977 - estudos de sólidos amorfos e propriedades magnéticas da matéria), P. Kaptisa (1978 - estudos em baixas temperaturas), N. Bloembergen, A.L. Schawlow e K.M. Siegbahn (1981 - espectroscopia com lasers e de fotoelétrons), K.G. Wilson (1982 - teoria de grupo de renormalização e transições de fase), K. von Klitzing (1985 - efeito Hall quântico), G. Binning, H. Rohrer e E. Ruska (1986 - invenção do microscópio de tunelamento e do microscópio eletrônico), K.A. Müller e G. Bednorz (1987 - descoberta da supercondutividade em altas temperaturas, P. de Gennes (1991 estudos de polı́meros e cristais lı́quidos), B.N. Brockhouse e C.G. Shull (1994 - desenvolvimento de técnicas de espalhamento de nêutrons para o estudo de materiais), D.M. Lee, D.D. Osheroff e R.C. Richardson (1996 - descoberta da superfluidez em Helio 3), R.B. Laughlin, H.L. Stormer e D.C. Tsui (1998 descoberta de fluido quântico com excitações de carga fracionária), e no ano 2000, Z.I. Alferov e H. Kroemer pelo desenvolvimento de heteroestruturas de semicondutores, juntamente com Jack Kilby, um dos maiores responsáveis pela invenção dos circuitos integrados. Assim, o prêmio Nobel de Fı́sica da virada do milênio marcou a importância da área para o desenvolvimento da eletrônica. Foi interessante, também, o fato de o prêmio Nobel de Quı́mica em 2000 ter sido agraciado aos fı́sicos A. Heeger, A. MacDiarmid e H. Shirakawa, pela des- Cap. 1 Materiais para Eletrônica 5 coberta e desenvolvimento dos polı́meros condutores, materiais que começam a ter aplicações comerciais na eletrônica. Os materiais sólidos investigados na Fı́sica da Matéria Condensada ou utilizados em dispositivos eletrônicos, em geral não são encontrados na natureza. Eles são produzidos artificialmente a partir de compostos quı́micos com alto grau de pureza, através de processos diversos. Os processos de fabricação de materiais estão tornando-se cada vez mais sofisticados, possibilitando a obtenção de estruturas artificiais não imagináveis há duas décadas. É possı́vel, por exemplo, utilizando a técnica de epitaxia de feixe molecular (MBE), depositar camadas atômicas individuais, uma após outra, formando uma multicamada ou super-rede cristalina. O domı́nio das técnicas de preparação de materiais é então essencial para a investigação em Fı́sica da Matéria Condensada e para a fabricação de dispositivos eletrônicos. A compreensão dos fenômenos que ocorrem nos sólidos requer o domı́nio de vários conceitos fundamentais que serão apresentados a partir da próxima seção. Vamos iniciar discutindo uma questão básica: por que e como os átomos dos diversos elementos formam materiais sólidos? 1.2 Ligações Atômicas Vamos considerar inicialmente o caso de sólido do tipo do cloreto de sódio, NaC. Por razões conhecidas da quı́mica, e que são explicadas em detalhe pela mecânica quântica, um átomo de cloro, com seus 17 elétrons, tende a capturar outro elétron extra para completar sua terceira “camada” eletrônica e tornar-se estável. Por outro lado, um átomo de sódio com 11 elétrons tende a perder seu único elétron da terceira camada para que as duas camadas interiores formem um núcleo fechado. Então, quando um átomo de cloro está próximo de outro de sódio, este passa seu elétron para o de cloro, dando origem a dois ı́ons com cargas elétricas opostas, que se atraem devido à interação eletrostática. Em outras palavras, os átomos de cloro e de sódio juntos formam um sistema que tem menor energia do que quando estão longe um do outro. Entretanto, quando os dois ı́ons se aproximam muito, a repulsão entre os elétrons mais externos faz com que a energia aumente impedindo uma maior aproximação. A Fig.1.1 mostra a variação da energia de interação entre os dois ı́ons em função da distância entre eles. Quando os ı́ons estão muito afastados, a energia eletrostática diminui com o aumento da distância r, aproximadamente como −(1/r). Por outro lado, quando os ı́ons estão muito próximos, a energia cresce exponencialmente à medida que a distância diminui. Existe 6 Materiais e Dispositivos Eletrônicos Figura 1.1: Energia de interação efetiva entre um ı́on Na+ e um ı́on C− em função da distância entre seus núcleos. então uma distância a na qual a energia é mı́nima e o sistema pode estar em equilı́brio estável. Quando temos 1023 átomos de sódio “próximos” de 1023 átomos de cloro acontece essencialmente o mesmo, mas agora eles tendem a formar um sistema tridimensional em equilı́brio, na forma de um sólido cristalino. Este tipo de ligação é chamada iônica, e é a mais simples de entender. Há outros três tipos de ligações entre átomos nos materiais: covalente, molecular e metálica. Todas elas resultam da interação Coulombiana envolvendo os elétrons e os núcleos dos átomos. O tipo de ligação é determinante de algumas propriedades do material, apresentadas brevemente a seguir. Nos sólidos iônicos, como vimos, a ligação é devida à atração eletrostática entre ı́ons de cargas opostas, como ilustrado esquematicamente em duas dimensões, na Fig.1.2(a). Esta ligação é muito forte e por isso o ponto de fusão do material é alto. Em outras palavras, é preciso uma grande energia de agitação térmica para que os átomos libertem-se uns dos outros para formar o estado lı́quido. Como os elétrons estão fortemente ligados aos átomos, estes cristais têm em geral uma pequena condutividade elétrica e térmica, isto é, são bons isolantes. A ausência de elétrons livres resulta também numa boa transparência óptica em uma grande parte do espectro eletromagnético. Alguns exemplos tı́picos de sólidos iônicos são os halogenetos alcalinos (NaC, KC, NaBr, LiF, etc.), vários óxidos, sulfetos, selenetos, teluretos, e outros. Cap. 1 Materiais para Eletrônica 7 Figura 1.2: Ilustração esquemática dos quatro principais tipos de ligação em sólidos: (a) Ligação iônica; (b) Ligação covalente; (c) Ligação molecular; (d) Ligação metálica. Na ligação covalente os elétrons de valência são compartilhados entre átomos vizinhos, como ilustrado na Fig.1.2(b). Neste caso a atração é devida à presença dos elétrons entre os átomos, que atraem simultaneamente átomos vizinhos que foram deixados positivos com sua ausência. Os sólidos covalentes têm em geral um ponto de fusão menor que os iônicos, porém têm maior dureza. Alguns dos importantes materiais covalentes são os semicondutores, silı́cio, germânio, GaAs, InSb, etc. A ligação molecular é bem mais fraca do que nos dois casos anteriores. Ela resulta da atração entre dipolos elétricos formados nos átomos por um pequeno deslocamento das camadas eletrônicas em relação aos núcleos, como na Fig.1.2(c). Sólidos com esta ligação têm ponto de fusão muito baixo, em geral menor do que 10 K, como é o caso de cristais de gases solidificados, como oxigênio, nitrogênio e outros gases inertes. Em metais, de certa maneira a ligação pode ser considerada iônica. Estes materiais são formados por átomos que têm poucos elétrons fora de sua última camada cheia sendo, portanto, fracamente ligados ao núcleo atômico. Quando postos juntos, estes átomos liberam seus últimos elétrons que ficam “passeando” livremente entre eles, formando um “mar” de elétrons. Este mar negativo de elétrons tende a manter juntos os ı́ons positivos devido à atração 8 Materiais e Dispositivos Eletrônicos eletrostática, como mostrado esquematicamente na Fig.1.2(d). Desta forma a ligação é razoavelmente fraca, o que resulta em ponto de fusão relativamente baixo, maleabilidade, ductibilidade e grande condutividade térmica e elétrica, que são propriedades caracterı́sticas dos metais. 1.3 Materiais Cristalinos Grande parte dos materiais usados na fabricação de dispositivos eletrônicos tem a estrutura de sólidos cristalinos ou cristais. Um cristal perfeito é aquele que tem um arranjo regular e periódico de átomos ou ı́ons, formado pela translação repetitiva de uma célula unitária. O ordenamento regular dos átomos ou ı́ons é o arranjo que minimiza a energia eletrostática total do conjunto. Por esta razão, quando um material é fundido e depois resfriado lentamente, os átomos ou ı́ons procuram as posições de menor energia e tendem a formar cristais. A Fig.1.3(a) mostra a estrutura de um cristal de cloreto de césio. Ela pode ser vista como formada por um par de ı́ons de Cs+ e de C− , associado a cada ponto de uma rede cristalina. Os ı́ons do par formam a base do cristal. A rede cristalina é uma abstração matemática, constituı́da de pontos obtidos pela translação repetitiva dos pontos da célula unitária, definida por três vetores unitários a, b e c. A rede cristalina do cloreto de césio é cúbica simples Figura 1.3: (a) Cristal de cloreto de césio, CsC. A rede cristalina é cúbica simples. A base tem um ı́on Cs+ na posição 000 e um ı́on C− em 12 21 21 . Note que os ı́ons estão desenhados com tamanho pequeno para facilitar a visualização. Num cristal real os ı́ons vizinhos tocam-se. (b) Célula unitária do CsC. Cap. 1 Materiais para Eletrônica 9 e sua célula unitária está mostrada na Fig.1.3(b). Também estão indicados na figura os vetores unitários e a base da estrutura do cristal. A base é composta de um ı́on de Cs+ na posição 000 e outro de C− na posição 12 21 21 (referidas ao comprimento a dos vetores unitários). 1.3.1 Redes Cristalinas Embora o número de estruturas de cristais seja muito grande, existem apenas 14 tipos diferentes de redes critalinas em três dimensões, mostradas na Fig.1.4. As redes são agrupadas em sete sistemas de acordo com o tipo da célula unitária: triclı́nico, monoclı́nico, ortorrômbico, tetragonal, cúbico, trigonal e hexagonal. Na Fig.1.4 estão indicadas as relações entre os ângulos α, β, γ e entre os comprimentos a, b, c das arestas da célula unitária. a, b, c são chamados parâmetros da rede. As células unitárias mostradas na figura são chamadas células convencionais. Elas são as mais fáceis de serem visualizadas mas não são necessariamente as menores que reproduzem a rede pela translação repetitiva. As menores células unitárias que reproduzem a rede são chamadas células primitivas. A Fig.1.5 mostra os vetores primitivos a , b , c da rede cúbica de faces centradas (fcc) e da rede cúbica de corpo centrado (bcc). Os planos e eixos que passam por pontos da rede cristalina são representados por três algarismos que caracterizam suas coordenadas, chamados ı́ndices de Miller. Para obter os ı́ndices de um plano é preciso inicialmente determinar suas interseções com os eixos a, b, c da célula unitária. As interseções são então representadas por números p, q, r que exprimem suas coordenadas pa, qb, rc naqueles eixos. Os ı́ndices de Miller h, k, são os menores números inteiros na mesma proporção de 1p , 1q , 1r . Para representar o plano, os ı́ndices são colocados entre parênteses (hk). O eixo perpendicular ao plano (hk) é representado por [hk]. A Fig.1.6 mostra os três planos e os três eixos mais importantes de uma rede cúbica. Veja que o plano paralelo ao eixo z e que intercepta os eixos x e y nos pontos x = a e y = a respectivamente, é caracterizado pelas interseções p = 1, q = 1, r = ∞. Os recı́procos destes números dão os ı́ndices de Miller do plano, ou seja (110). Note que como a rede cúbica é invariante em relação a rotações de 90◦ em torno do eixo z, o plano (110) é equivalente aos planos (110), (110) e (110), onde a barra acima do ı́ndice indica a interseção no lado negativo do eixo. Esses planos também são equivalentes aos planos (101), (011) 10 Materiais e Dispositivos Eletrônicos Figura 1.4: Células unitárias das 14 possı́veis redes cristalinas em três dimensões. Cap. 1 Materiais para Eletrônica 11 Figura 1.5: Vetores primitivos das redes cúbicas de face centrada e de corpo centrado. e seus equivalentes com ı́ndices negativos. O conjunto de planos equivalentes é representado pelo sı́mbolo {110}. Do mesmo modo, o conjunto de eixos que podem ser obtidos do eixo [110] por operações de simetria é representado pelo sı́mbolo < 110 >. Figura 1.6: Ilustração dos três principais planos e dos eixos de simetria de uma rede cúbica. 1.3.2 Estruturas Cristalinas Simples Em geral muitas substâncias diferentes cristalizam com a mesma estrutura cristalina. Algumas estruturas são simples e são caracterı́sticas de certos materiais importantes na Eletrônica. A seguir apresentamos algumas das estruturas mais conhecidas. A estrutura do cloreto de césio, CsC, está mostrada na Fig.1.3. Ela é caracterizada por uma rede cúbica simples com a base formada por dois 12 Materiais e Dispositivos Eletrônicos ı́ons de cargas opostas, o Cs+ na posição 000 e o C− na posição 12 21 21 . Note que basta especificar um ı́on C− na base pois todos oito ı́ons nos vértices da célula unitária são equivalentes, isto é, qualquer um pode ser obtido a partir do outro por uma translação na rede cristalina. Como apenas 18 de cada ı́on C− está contido no interior da célula unitária, para todos efeitos a célula contém apenas um ı́on Cs+ e um ı́on C− . O parâmetro da rede do CsC é a = 4, 11 Å. Outros cristais com a mesma estrutura são TBr (3,97 Å), CuZn (2,94 Å) que é o latão tipo β, AgMg (3,28 Å), e BeCu (2,70 Å). A estrutura do cloreto de sódio, NaC, está mostrada na Fig.1.7(a). Ela é formada por uma rede cúbica de faces centradas com dois ı́ons na base, um de Na+ e outro de C− , separados por meia diagonal do cubo da célula unitária. Note que a célula primitiva, não mostrada na figura, contém apenas um ı́on de cada elemento. Por outro lado, a célula unitária contém quatro ı́ons de cada elemento ( 12 dos 6 nas faces e 18 dos 8 nos vértices). Note também que a estrutura do NaC pode ser vista como formada por duas redes cúbicas de faces centradas entrelaçadas, uma de Na+ e outra de C− , deslocadas de meia diagonal do cubo. O NaC tem parâmetro de rede a = 5,63 Å. Outro cristal que tem a estrutura do NaC é o PbS (5,92 Å), conhecido como galena. Ele é um material semicondutor e foi muito usado para fazer diodos de detecção por contato metálico nos “rádios galena”. Ainda hoje o PbS é utilizado como detetor de radiação infravermelha. Há também vários materiais importantes Figura 1.7: (a) Estrutura do cloreto de sódio, NaC, que pode ser construı́da com duas redes cúbicas de faces centradas, uma de Na+ e outra de C− , deslocadas uma da outra de meia diagonal do cubo. (b) Ilustração do cristal de NaC, no qual o tamanho dos ı́ons é comparável à distância entre eles. Cap. 1 Materiais para Eletrônica 13 para a eletrônica que têm a estrutura do NaC, como MgO (4,20 Å), muito utilizado em componentes ópticos, e o NiO (4,18 Å), empregado em dispositivos de gravação magnética. Note que a Figura 1.7(a) é uma representação simplificada da estrutura do NaC. Como as últimas camadas eletrônicas de ı́ons vizinhos estão muito próximas umas das outras, tudo se passa como se os ı́ons vizinhos se tocassem, como ilustrado na Figura 1.7(b). O raio aparente de cada ı́on é chamado raio iônico. No caso do NaC, o raio iônico do ı́on de Na+ é 1,220 Å e o do C− é 1,595 Å. A soma desses dois raios iônicos é metade do parâmetro de rede do NaC (5,63 Å). A estrutura cristalina do sulfeto de zinco, ZnS, cúbico (zinc-blende), também tem uma rede cúbica de faces centradas, como mostrado na Fig.1.8(a). A base é formada pelo átomo de um dos elementos na posição 000 e por um átomo do outro elemento na posição 14 41 41 . A estrutura pode ser vista como formada por duas redes cúbicas de faces centradas entrelaçadas, uma com átomos de Zn e outra com S, deslocadas uma da outra de 14 da diagonal do cubo. Desta forma, como pode ser visto na Fig.1.8(a), cada átomo de Zn têm quatro vizinhos de S e vice-versa, possibilitando uma ligação covalente tetraédrica entre eles. O parâmetro da rede do ZnS é a = 5,41 Å. Também cristalizam nesta estrutura vários semicondutores importantes formados por elementos dos grupos III e V da tabela periódica e por elementos dos grupos II e VI. Exemplos de semicondutores III-V são o GaAs (5,65 Å), AAs (5,66 Figura 1.8: (a) Célula unitária de sulfeto de zinco, ZnS. A rede também pode ser construı́da por duas redes cúbicas de face centradas, uma de Zn e outra de S, deslocadas de um quarto da diagonal do cubo: (b) Célula unitária da estrutura cristalina do diamante, na qual também cristalizam os semicondutores Si e Ge. 14 Materiais e Dispositivos Eletrônicos Å) e o InSb (6,49 Å), enquanto do tipo II-VI podemos citar CdS (5,82 Å) e CdTe (6,48 Å). Nosso último exemplo de estrutura cristalina importante é a do diamante, cuja célula unitária convencional está mostrada na Fig.1.8(b). Ela é igual a do ZnS, porém todos os átomos são do mesmo elemento. No caso do diamante o elemento é o carbono, C, sendo o parâmetro da rede a = 3,56 Å. A estrutura do diamante, caracterizada pelas ligações tetraédricas entre os vizinhos resulta da ligação covalente. Também cristalizam nesta estrutura os importantes semicondutores silı́cio, Si (5,43 Å), e germânio, Ge (5,65 Å). 1.4 Materiais para Dispositivos Eletrônicos Tradicionalmente, os livros de Ciência e Engenharia de Materiais classificavam os materiais de acordo com suas propriedades mecânicas, nas seguintes categorias: metais, cerâmicas, polı́meros e compósitos. Nos últimos anos, eles introduziram a categoria dos semicondutores, por conta de sua grande importância para a eletrônica. É melhor classificar os materiais utilizados para fabricar dispositivos eletrônicos de acordo com suas principais propriedades fı́sicas. Nos capı́tulos seguintes estudaremos as propriedades e os fenômenos que ocorrem em semicondutores, materiais ópticos, materiais magnéticos, dielétricos e supercondutores. Entretanto, do ponto de vista da fabricação dos materiais, é conveniente classificá-los de acordo com sua microestrutura. A seguir apresentaremos, brevemente, algumas caracterı́sticas dos materiais e de seus processos de preparação, divididos nas seguintes classes: monocristais; cerâmicas e vidros; polı́meros; cristais lı́quidos; filmes finos e multicamadas. 1.4.1 Monocristais Um monocristal, também chamado simplesmente de cristal, é um material que apresenta ordem cristalina ao longo de toda sua extensão utilizável, tendo dimensões tı́picas que variam de alguns milı́metros a muitos centı́metros. Existem inúmeros métodos para fabricar monocristais, sendo cada um adequado a certas classes de materiais. Em geral o cristal é produzido a partir de um lı́quido contendo os elementos que formam a rede cristalina. Quando uma pequena amostra do cristal desejado, a semente, é colocada na solução, se as condições de concentração e temperatura forem adequadas, seu volume au- Cap. 1 Materiais para Eletrônica 15 z Cadinho Solução derretida Semente Bobina para aquecimento de RF T Figura 1.9: Ilustração do cadinho com o gradiente de temperatura usado no método de Bridgman estático. menta formando um cristal maior. O fator essencial para crescer o cristal a partir da semente é possibilitar que os átomos da solução se agreguem lentamente a ela, o que ocorre em posições que minimizam a energia total de ligação, fazendo a rede cristalina crescer gradualmente. Em alguns casos simples, podese utilizar a solução lı́quida da substância num certo solvente. Este é o caso do NaC que pode ser diluı́do em água. É muito comum também derreter os compostos básicos a altas temperaturas, produzindo uma solução fundida. O aquecimento é feito num recipiente, chamado cadinho, usando um forno resistivo ou de rádio freqüência (RF). Os dois métodos mais conhecidos para crescer cristais a partir da solução fundida são o de Bridgman e o de Czochralsky. No primeiro, ilustrado na Fig.1.9, a semente é colocada na parte inferior do cadinho contendo a solução derretida. A temperatura do cadinho é diminuida lentamente mantendo-se um gradiente do tipo da Fig.1.9, de modo que o cristal cresce de baixo para cima. No método de Czochralsky, ilustrado na Fig.1.10, a semente é colocada na extremidade inferior de uma haste em lento movimento de rotação, tocando a superfı́cie da solução derretida. Quando a haste em rotação é puxada lentamente para cima, a solução solidifica gradualmente em torno da semente, fazendo o cristal crescer. A Fig.1.11 mostra um bastão cilı́ndrico (lingote) de silı́cio monocristalino crescido pelo método de Czochralsky, com diâmetro 10,2 cm (4 polegadas). Os dispositivos discretos e os circuitos integrados usados em microeletrônica são fabricados sobre pastilhas, ou lâminas, de Si, obtidas 16 Materiais e Dispositivos Eletrônicos Semente Cristal Bobina para aquecimento de RF Solução derretida Cadinho Figura 1.10: Ilustração do método de Czochralsky para crescer monocristais. Figura 1.11: Bastão monocristal de Si crescido pelo método de Czochralsky, com 10,2 cm de diâmetro. A pastilha mostrada na fotografia é obtida pelo corte do bastão e processada para fabricar uma célula solar (cortesia da Heliodinâmica). Cap. 1 Materiais para Eletrônica 17 pelo corte de bastões, como o da figura. Atualmente, na indústria de microeletrônica, utiliza-se lingotes com até 30 cm de diâmetro. É possı́vel crescer monocristais de certos materiais a temperaturas bem abaixo de seus pontos de fusão devido a propriedades tı́picas de misturas de duas substâncias. Um método muito utilizado é o de epitaxia de fase lı́quida - LPE, usado para crescer camadas do semicondutor GaAs sobre sementes do mesmo material. Isto é possı́vel porque o ponto de fusão de GaAs é 1238◦ C, enquanto a mistura de GaAs com o metal Ga tem uma temperatura de fusão bem menor. Se uma semente de GaAs é mergulhada numa solução de Ga + GaAs, derretida a uma temperatura menor que 1238◦ C, ela se mantém sólida enquanto novas camadas cristalinas são formadas sobre ela com os átomos de Ga e As da solução. 1.4.2 Cerâmicas e Vidros A palavra cerâmica é originária do grego “keramos”, que era o nome do barro utilizado para fazer jarros. Atualmente ela é usada para designar uma variedade de compostos inorgânicos não metálicos, geralmente duros, quebradiços e com elevado ponto de fusão. Eles podem ser sólidos amorfos ou policristalinos. Para entender a diferença entre os dois tipos vamos considerar os exemplos da sı́lica (SiO2 ) e da alumina (A2 O3 ). A ligação atômica nesses materiais tem um caráter misto de iônica e covalente e, dependendo da forma de preparo, pode resultar em sólidos amorfos ou cristalinos. Se o resfriamento da solução fundida for lento o material tende a ficar cristalino. No caso da sı́lica isto ocorre com uma rede cúbica ou hexagonal de átomos de oxigênio, ficando os ı́ons de Si entre eles com ligações tetraédricas, como ilustrado na Fig.1.12(a). Quando a Figura 1.12: (a) Vista em duas dimensões das ligações atômicas num monocristal de SiO2 , o quartzo. (b) Ilustração de um policristal. (c) Ligações em SiO2 amorfo, a sı́lica. 18 Materiais e Dispositivos Eletrônicos cristalização é feita a partir de uma semente, forma-se um monocristal de SiO2 , chamado quartzo. Entretanto, se não houver uma semente única, a cristalização ocorrerá simultaneamente a partir de muitos pontos no material. Neste caso formam-se grãos cristalinos orientados aleatoriamente, constituindo um policristal, como ilustrado na Fig.1.12(b). Por outro lado, se o resfriamento for rápido, os átomos não terão tempo para encontrar as posições de menor energia e não será formada uma rede cristalina. Neste caso não haverá ordem de longo alcance e o material será amorfo, ficando com ligações atômicas conforme ilustrado na Fig.1.12(c) para sı́lica (também chamado de quartzo fundido). O caso do A2 O3 é semelhante ao da sı́lica. Ele pode ser encontrado na forma amorfa, chamada alumina, ou na forma de um cristal, chamado safira. As cerâmicas também podem ser preparadas por sinterização. Neste processo os constituintes do material na forma de pó são misturados e compactados com o formato final desejado. O material é então aquecido até próximo do ponto de fusão e depois de resfriado resulta numa cerâmica formada de grãos policristalinos com uma forte aderência entre si. Este é o processo usado para fabricar objetos de cerâmica de uso diário, como jarros, objetos de adorno, etc. Quando a matéria prima é de alta qualidade e o processamento é feito em condições muito controladas, obtêm-se as chamadas cerâmicas avançadas, que encontram aplicações diversas em eletrônica e em outros ramos da tecnologia. Atualmente é possı́vel fabricar partı́culas com dimensões na escala nanométrica (1 nm = 10−9 m) com grande uniformidade de tamanhos, que ao serem compactadas e processadas termicamente resultam em cerâmicas com propriedades especiais para diversas aplicações. Os materiais amorfos também são chamados de vidros e são caracterizados pela ausência de uma temperatura de fusão bem definida. Quando um vidro é aquecido ele amolece gradualmente até tornar-se um lı́quido, sem uma transição brusca da fase sólida para a fase lı́quida, como ocorre em cristais. Na realidade o vidro pode ser visto como um lı́quido de altı́ssima viscosidade, que para efeitos práticos comporta-se como se os átomos estivessem congelados desordenadamente. Do ponto de vista da condutividade elétrica, os materiais amorfos, ou vidros, podem ser metálicos, isolantes ou semicondutores. Na eletrônica eles encontram muitas aplicações em qualquer das formas. Atualmente o silı́cio cristalino está sendo substituı́do pelo amorfo em vários dispositivos, como por exemplo nas células solares. Cap. 1 Materiais para Eletrônica 1.4.3 19 Polı́meros Os polı́meros consistem de moléculas com estrutura em cadeias longas, lineares ou ramificadas, e que resultam da combinação quı́mica de certo número (tipicamente milhares) de unidades mais simples chamadas monômeros, repetidas de maneira regular ou aleatória. Enquanto que polı́meros naturais, como a borracha, são conhecidos desde tempos imemoriais, só no século XX, com o desenvolvimento da indústria quı́mica, tornou-se possı́vel a preparação em larga escala de polı́meros sintéticos, com as mais variadas propriedades. Não apenas alterações na natureza quı́mica dos monômeros, mas mesmo simples diferenças estruturais no tipo de organização da cadeia, podem levar a moléculas com propriedades fı́sicas e quı́micas profundamente distintas. Isto está ilustrado na Fig.1.13 que mostra as cadeias de dois polı́meros muito utilizados: o polietileno e o cloreto de polivinila (PVC). O polietileno consiste de monômeros com um átomo de carbono e dois átomos de hidrogênio. A substituição de um átomo de hidrogênio no etileno por outro de cloro resulta no PVC, um material completamente diferente. Este exemplo explica a enorme diversidade de polı́meros existentes. Os materiais poliméricos mais utilizados na eletrônica são os “plásticos” que servem de isolantes elétricos para cobertura de fios, para encapsular dispositivos e para fabricar peças com funções variadas. Entretanto, nos últimos anos, foram descobertos polı́meros e substâncias orgânicas que conduzem corrente elétrica de forma semelhante a metais, semicondutores ou mesmo supercondutores. Eles também têm propriedades ópticas semelhantes às dos semicondutores, e começam a ser empregados em dispositivos eletroluminescentes. A atividade de pesquisa em torno deles é muito intensa, e espera-se, que em poucos anos venham substituir semicondutores e metais tradicionais Figura 1.13: Cadeias de dois polı́meros comuns, (a) polietileno e (b) cloreto de polivinila (PVC). 20 Materiais e Dispositivos Eletrônicos em diversos dispositivos e sensores eletrônicos e optoeletrônicos, apresentados na seção 10.3. 1.4.4 Cristais Lı́quidos Os cristais lı́quidos são materiais que têm uma estrutura molecular com caracterı́sticas intermediárias entre a ordem orientacional e posicional de longo alcance dos cristais e a desordem tı́pica dos lı́quidos e gases. Os cristais lı́quidos também apresentam propriedades que não são encontradas nem em lı́quidos nem em sólidos, tais como: formação de monocristais com a aplicação de campos elétricos; atividade óptica muito maior que sólidos e lı́quidos tı́picos e controlável por campos elétricos; grande sensibilidade a temperatura que pode resultar em mudanças de sua cor. Há duas grandes classes de cristais lı́quidos: os liotrópicos e os termotrópicos. Os liotrópicos são em geral obtidos pela dispersão de um composto num solvente. Este é o caso de vários sistemas de importância biológica, tais como lipı́deo-água, lipı́deo-água-proteı́na, etc. Os cristais lı́quidos de importância para eletrônica são os termotrópicos. Eles são formados por moléculas longas, em geral de compostos orgânicos, dispostas em dois tipos de estruturas: nemáticas ou sméticas. Estas estruturas estão ilustradas na Figura 1.14, que também mostra a orientação aleatória das moléculas num Figura 1.14: Ilustração da orientação de moléculas nos seguintes sistemas: (a) lı́quido isotrópico; (b) cristal lı́quido nemático; (c) cristal lı́quido smético A; (d) cristal lı́quido smético C. Cap. 1 Materiais para Eletrônica 21 lı́quido isotrópico. Nos cristais lı́quidos nemáticos as moléculas têm um ordenamento paralelo, ou quase paralelo, como na Fig.1.14(b). Elas são móveis nas três direções e portanto apresentam desordem posicional. Nos cristais lı́quidos sméticos as moléculas também estão orientadas paralelamente entre si, porém apresentam uma estrutura estratificada em camadas. Dentro de uma mesma camada as moléculas ocupam posições aleatórias, mantendo a mesma distância para as moléculas das camadas vizinhas. Nos cristais lı́quidos sméticos tipo A a orientação das moléculas é perpendicular ao plano das camadas, enquanto que no tipo C elas estão inclinadas em relação ao plano das camadas. Os cristais lı́quidos têm grande aplicação em eletrônica, principalmente para a confecção de mostradores, conhecidos como LCD (Liquid Crystal Display). Esta aplicação é baseada no fato de que a orientação das moléculas pode ser controlada pela aplicação de um campo elétrico, possibilitando variar a quantidade de luz transmitida ou refletida pelo material. Isto pode ser feito por meio de baixas tensões e com pequeno consumo de energia, dando aos mostradores de LCD grande vantagem em relação a outros tipos, como apresentado na seção 10.3. 1.4.5 Filmes Finos e Multicamadas Muitos materiais empregados em dispositivos eletrônicos são fabricados na forma de filmes finos, isto é, camadas com espessuras que variam desde alguns angstroms (1 Å = 10−10 m) até dezenas de microns (1 µm = 10−6 m). Os filmes são feitos com metais, isolantes, semicondutores ou supercondutores, dependendo da aplicação desejada. Eles são usados em inúmeras aplicações, como resistores, capacitores, contatos metálicos em dispositivos semicondutores, camadas magnéticas em dispositivos de gravação, camadas dielétricas em dispositivos opto-eletrônicos, dispositivos de filmes semi ou supercondutores, etc. Os filmes finos podem ser preparados por vários métodos diferentes, dependendo da composição, estrutura, espessura e aplicação. Todos eles se baseiam na deposição gradual de átomos ou moléculas do material desejado sobre a superfı́cie de outro material que serve de apoio, chamado substrato. Dentre os métodos mais utilizados estão a deposição em alto vácuo, para filmes mais finos (de algumas camadas atômicas até 1000 Å), a deposição eletroquı́mica, a deposição quı́mica de vapor e a epitaxia de fase lı́quida, para filmes mais espessos. A grande evolução nas técnicas de vácuo nas últimas décadas possibilitou o aperfeiçoamento dos processos de deposição de filmes muito finos. Atual- 22 Materiais e Dispositivos Eletrônicos mente é possı́vel evacuar câmaras com volumes da ordem de 1 m3 , atingindo rotineiramente pressões tão baixas quanto 10−11 − 10−9 Torr (1 Torr = 1 mm de Hg). Isto possibilita fabricar filmes finos através da deposição de camadas individuais de átomos ou moléculas, uma sobre a outra, por meio de diversas técnicas diferentes. Em todas as técnicas o processamento é feito numa câmara de alto vácuo, e consta de três etapas: na primeira etapa os materiais que servem de matéria-prima são fragmentados em átomos neutros, ı́ons ou moléculas, por meio da ação de fontes térmicas, ou de um plasma, ou um laser, ou bombardeio por elétrons ou ı́ons acelerados; na segunda etapa, o vapor fı́sico formado pelos fragmentos da matéria é transportado na direção do substrato; finalmente, na terceira etapa, os fragmentos depositados no substrato interagem fı́sica e quimicamente entre si, nucleando e formando porções maiores de material, resultando no filme desejado. As principais diferenças entre os diversos métodos estão na primeira etapa. Um dos métodos mais simples é o da evaporação térmica, no qual a substância original é aquecida em alta temperatura até evaporar. O aquecimento é feito por meio de uma corrente elétrica num fio ou elemento resistivo de material que suporta altas temperaturas, como o tungstênio. Este método é utilizado para depositar filmes simples de metais ou substâncias simples, para fazer espelhos ou contatos metálicos, por exemplo. Uma das técnicas mais sofisticadas é a epitaxia de feixe molecular (Molecular Beam Epitaxy - MBE), ilustrada na Figura 1.15. As substâncias Figura 1.15: Ilustração do processo de epitaxia de feixe molecular-MBE, com fontes de elementos usados para fabricar multicamadas de GaAs e (GaA)As, dopadas com impurezas de Sn ou de Be. Cap. 1 Materiais para Eletrônica 23 dos elementos que formam o material desejado são aquecidas separadamente em fontes individuais, no interior de uma câmara de alto vácuo. Cada fonte é feita de um cadinho fechado, contendo um pequeno orifı́cio na extremidade. Ao ser aquecida até fundir, a substância gera um vapor sob pressão no interior do cadinho que é ejetado no vácuo através do orifı́cio, produzindo um feixe atômico ou molecular, que incide sobre o substrato. Através do controle preciso das taxas de evaporação e do movimento dos obturadores de cada fonte é possı́vel construir filmes cristalinos de alta qualidade. Com este método é possı́vel também fabricar cristais com mudanças abruptas de composição formando uma multicamada, ou super-rede. Um sistema de grande interesse tecnológico é aquele formado por GaAs e AAs, empregado na fabricação de lasers semicondutores. Os cristais dessas substâncias têm a mesma estrutura cristalina do ZnS, com parâmetros da rede praticamente iguais, a = 5,65 Å. Por causa disto é possı́vel depositar epitaxialmente camadas atômicas cristalinas da liga ternária Ga1−x Ax As sobre um substrato cristalino de GaAs, para construir artificialmente multicamadas, super-redes ou “poços quânticos”, com concentrações x escolhidas. A Figura 1.16(a) ilustra uma multicamada de GaAs e da liga (GaA)As empregada em lasers semicondutores. Estas multicamadas também podem ser feitas por técnicas de epitaxia de feixe de vapor (VPE), das quais a mais comum é a MOCVD (Metal-Organic Chemical Vapor Deposition). A técnica de MBE também é utilizada para fazer muitos outros tipos de multicamadas. A Figura 1.16(b) ilustra uma multicamada Figura 1.16: Ilustração de dois tipos importantes de multicamadas utilizadas em eletrônica: (a) Multicamada de GaAs e (GaA)As, empregada em lasers de semicondutores; (b) Multicamada magnética, empregada em dispositivos de gravação magnética. 24 Materiais e Dispositivos Eletrônicos magnética, formada por várias camadas magnéticas, intercaladas por camadas não-magnéticas, metálicas ou isolantes, empregada em dispositivos de gravação magnética, descritos no Capı́tulo 9. Outra técnica de deposição de filmes e multicamadas muito empregada em instalações industriais é a vaporização catódica, também chamada de pulverização (sputtering), cujo equipamento básico está mostrado na Figura 1.17. Antes de iniciar o processo de deposição, a câmara é evacuada permanecendo com pressão muito baixa (10−11 − 10−8 Torr) durante várias horas, para eliminar gases residuais. Em seguida um gás nobre (Ar, Ne) é injetado na câmara com pressão da ordem de 10−3 Torr, formando uma atmosfera inerte. Uma diferença de potencial da ordem de alguns kV é então aplicada entre os suportes do substrato e do alvo que contém a matéria-prima a ser pulverizada, ionizando o gás na região e formando um plasma. Os ı́ons do plasma são acelerados pela diferença de potencial adquirindo energia suficiente para fragmentar o material do alvo e formando o vapor que deposita no substrato. O processo pode empregar vários alvos, possibilitando assim depositar um filme de certo material sobre outro diferente, sucessivamente, formando uma multicamada. Os sistemas atuais de vaporização catódica utilizam ı́mãs permanentes para criar um campo magnético que serve para confinar o plasma na região do alvo, aumentando a eficiência do processo (magnetron sputtering). A alta tensão aplicada pode ser dc, utilizada para vaporizar metais, ou rf, mais adequada para materiais isolantes. Os aperfeiçoamentos recentes na vaporização catódica têm tornado esta técnica cada vez mais poderosa, contribuindo para dissemi- + Substrato V Plasma Alvo _ Bomba de vácuo Figura 1.17: Componentes básicos de um sistema de vaporização catódica, ou pulverização (sputtering). Cap. 1 Materiais para Eletrônica 25 nar seu uso no processamento de dispositivos eletrônicos, tanto na pesquisa em laboratório quanto em plantas industriais. REFERÊNCIAS W.D. Callister, Jr., Materials Science and Engineering, an Introduction, J. Wiley , New York, 2000. P.J. Collings, Liquid Crystals, Princeton University Press, Princeton, 1990. R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. C. Kittel, Introduction to Solid State Physics, J. Wiley, New York, 1996. D.J. Roulston, An Introducion to the Physics of Semiconductor Devices, Oxford University Press, Oxford, 1999. B.J. Streetman and S. Banerjee, Solid State Electronic Devices, PrenticeHall, New Jersey, 2000. PROBLEMAS 1.1 Calcule o ângulo entre a direção [111] e o plano (001) numa rede cristalina cúbica. 1.2 Calcule os cossenos diretores da direção [122]. 1.3 Mostre, com um desenho claro, quais são os vetores primitivos de uma rede 3d tetragonal simples. Mostre porque não existe rede tetragonal de faces centradas. 1.4 Silı́cio, o semicondutor mais importante da Eletrônica, cristaliza na estrutura do diamante, cuja célula unitária está mostrada na Fig.1.8. À temperatura ambiente o parâmetro da rede é 5,42 Å. Sendo do grupo IV da tabela periódica, o átomo de Si tem quatro elétrons de valência. Calcule o número total de elétrons de valência do Si por unidade de volume, em cm−3 . 1.5 Assim como o Si, o germânio também cristaliza na estrutura do diamante, com parâmetro de rede 5,65 Å. Sabendo que a massa atômica do Ge é 72,59 (referida a massa de H), calcule a massa especı́fica do Ge em g/cm3 e compare com o valor da tabela. 26 Materiais e Dispositivos Eletrônicos 1.6 A liga Ax Ga1−x As é um importante semicondutor utilizado para fabricar dispositivos optoeletrônicos. Na fase cristalina, ela tem a estrutura do cristal de GaAs, no qual átomos de Ga numa fração x são substituı́dos aleatoriamente por átomos de A. Sabendo que GaAs e AAs cristalizam na estrutura do ZnS, Fig.1.8(a), calcule o número de átomos por cm3 e a massa especı́fica de A0,3 Ga0,7As. 1.7 Um modelo matemático para a energia total de uma rede cristalina com ligação iônica é: U = N γe−R/ρ − αq 2 /R onde 2N é o número de ı́ons da rede, q é a carga iônica, γ, ρ e α são constantes que dependem da estrutura cristalina e dos átomos que formam o cristal e R é a distância entre dois vizinhos mais próximos. Para o NaC, que cristaliza na estrutura fcc da Fig.1.7, γ = 1, 05 × 10−15 J, ρ = 0, 321 Å e α = 1, 747/4π0. a) Faça um gráfico das duas parcelas da energia por molécula, U/N, em função da distância R e interprete o significado de cada parcela. Se você tiver um computador com impressora, use-o para fazer um gráfico quantitativo bonito! Observe que a segunda parcela, que resulta da atração entre os dois ı́ons de cargas opostas, tende para −∞ em R = 0. Na realidade aquela expressão não vale para R → 0, pois os ı́ons não são cargas pontuais. Para evitar a divergência de segunda parcela em R → 0, faça um truncamento na energia, considerando que seu valor em R ≤ 1 Å é constante e igual ao valor em R = 1 Å. b) Faça o gráfico da soma das duas parcelas, isto é da energia U/N. (Sugestão: faça a escala horizontal na faixa 0-10 Å. No eixo vertical use como unidade o joule dividido por uma potência de 10 conveniente para evidenciar o mı́nimo da energia, como na Fig.1.1). c) Calcule o valor da distância R de equilı́brio e do parâmetro da rede cristalina, e compare o valor deste com aquele dado no texto. d) Calcule a energia por molécula necessária para desfazer o cristal, isto é, para que a distância entre vizinhos seja infinita. 1.6 Um filme de Fe monocristalino é crescido no plano (100) com uma certa técnica de deposição, a uma taxa de 1,4 Å por segundo. Sabendo que o Fe cristaliza na estrutura bcc, com parâmetro de rede 2,8 Å, calcule o número de átomos depositados durante 20 segundos sobre um substrato na forma de um disco, com diâmetro 1,0 cm. Capı́tulo 2 Ondas e Partı́culas na Matéria 2.1 Ondas Eletromagnéticas 28 2.2 Ondas Elásticas em Sólidos 34 2.3 Efeito Fotoelétrico - Ondas e Partı́culas 40 2.4 O Elétron como uma Onda-Princı́pio da Incerteza 46 2.5 Fônons e outras Excitações Elementares em Sólidos 50 REFERÊNCIAS 51 PROBLEMAS 52 27 28 Materiais e Dispositivos Eletrônicos Ondas e Partı́culas na Matéria 2.1 Ondas Eletromagnéticas O fenômeno de propagação de ondas desempenha papel fundamental na Eletrônica e na Fı́sica da Matéria Condensada. Na eletrônica, o mais importante é, sem dúvida, o emprego de ondas eletromagnéticas para “transportar” sinais de áudio, de vı́deo, ou de dados através de cabos, de fibras ópticas, ou propagando no ar. Porém não é este tipo de aplicação que vai nos interessar aqui. Vamos concentrar nas ondas de diversas naturezas que propagam no interior dos materiais. As vibrações dos átomos da rede cristalina e o movimento dos elétrons nos sólidos, por exemplo, são dois tipos de fenômenos que ocorrem naturalmente na forma de ondas. Além destas, há uma grande variedade de ondas que podem ser produzidas em materiais, tendo elas muitas caracterı́sticas comuns de qualquer onda. Para firmar alguns conceitos importantes, vamos iniciar este capı́tulo revendo as principais caracterı́sticas das ondas eletromagnéticas. A evolução dos campos eletromagnéticos no espaço e no tempo é descrita pelas equações de Maxwell, = ρ ∇.D = 0 ∇.B ∂B ∇ × E = − ∂t = J + ∂ D ∇×H ∂t (2.1) (2.2) (2.3) . (2.4) são os campos elétrico e magnético, respectivamente, B é o vetor onde E e H Cap. 2 Ondas e Partı́culas na Matéria 29 é o vetor deslocamento elétrico, ρ é a densidade de carga indução magnética, D = E livre e J é a densidade de corrente. Num material linear e isotrópico, D = µH, sendo a permissividade elétrica e µ a permeabilidade magnética. eB Se o material é isolante e não tem cargas livres, ρ = 0 e J = 0. Nestas condições, substituindo (2.4) em (2.3) e utilizando (2.1) e conhecidas relações entre operadores diferenciais, obtemos a equação que descreve a evolução do campo elétrico (Problema 2.1), r , t) − µ ∇2 E( r, t) ∂ 2 E( = 0. ∂t2 (2.5) Esta é a equação de ondas para um campo vetorial em três dimensões. Ela relaciona a variação espacial do campo com sua variação temporal. Para ondas planas propagando na direção do eixo x de um sistema de coordenadas, a equação reduz-se a t) t) 1 ∂ 2 E(x, ∂ 2 E(x, = ∂x2 v2 ∂t2 , (2.6) √ onde v = 1/ µ. Uma das soluções da Eq.(2.6) é (Problema 2.3), t) = E0 cos(kx − ωt) E(x, (2.7) onde E0 é um vetor constante. A substituição em (2.6) mostra que (2.7) é sua solução se ω = vk. Utilizando-se (2.1) pode-se mostrar que E0 é necessariamente perpendicular à direção de propagação x. Substituindo (2.7) em (2.3) e utilizando (2.2) obtemos a solução para o campo magnético 0 cos(kx − ωt) H(x, t) = H , (2.8) 0 é perpendicular à direção de propagação x e ao campo E0 , sendo as onde H amplitudes relacionadas por E0 = µ/ H0 . As equações (2.7) e (2.8) mostram que em um ponto qualquer do espaço, de coordenada x1 , os campos E e H variam harmonicamente no tempo com freqüência angular ω. Pode-se definir ω = 2πν e ν = 1/T , onde ν é a freqüência e T o perı́odo da oscilação. Elas têm comportamento idêntico em todos mostram também que tanto E quanto H os pontos do plano x = x1 . Por esta razão, os planos perpendiculares ao eixo 30 Materiais e Dispositivos Eletrônicos de propagação são chamados planos de fase da onda. O vetor perpendicular a estes planos, k = x̂k, é o vetor de onda, e sua interpretação está ligada ao comportamento espacial da onda. Para entender isto considere a variação no espaço em um certo instante qualquer. Como mostra a Fig.2.1, de E e H variam senoidalmente ao longo da direção de propagação, os campos E e H tendo sua fase repetida a cada distância λ, chamada comprimento de onda. Como o argumento kx correspondente a um perı́odo completo é 2π, a relação entre k e λ é 2π . (2.9) λ= k A variação espacial do campo num instante t posterior é dada pela mesma função de onda deslocada em x de uma distância x = ωt/k, como na Figura 2.1. Então, à medida em que o tempo passa, os campos E e H variam como se a função de onda transladasse ao longo do eixo x positivo, com velocidade x/t = ω/k. Esta relação é chamada a velocidade de fase da onda vf , que neste caso é: vf = c ω = k n , (2.10) √ onde n = (µ/µ0 0 )1/2 é o ı́ndice de refração do material e c = 1/ µ0 0 ≃ 3, 0 × 108 m/s é a velocidade da luz. Não é difı́cil ver que no caso em que a onda propaga numa direção qualquer, k é um vetor cuja direção e sentido são os da propagação. Sua direção é normal aos planos de fase e seu módulo é relacionado com o comprimento de onda pela Eq.(2.9). Neste caso geral, (x, t) t t + Dt x Figura 2.1: Variação da intensidade do campo elétrico no espaço em dois instantes, t e t + t. l Cap. 2 Ondas e Partı́culas na Matéria 31 pode-se mostrar que são soluções da Eq.(2.5), r, t) = E0 cos(k.r − ωt + φ) E( r, t) = H 0 cos(k.r − ωt + φ) H( , (2.11) , (2.12) onde 0 = H /µ k × E0 k . (2.13) Além da forma harmônica (2.11), é também muito útil representar os campos na forma complexa, utilizando a identidade de Euler eiθ = cos θ + isenθ. Assim o campo elétrico da Eq.(2.11) pode ser escrito como t) = Re E0 ei(k.r−ωt+φ) E(r, . (2.14) A Fig.2.2 mostra os planos de fase e os campos elétrico e magnético de uma onda propagando numa direção genérica. A função ω(k) é chamada relação de dispersão e contém informações importantes sobre o comportamento das ondas. Uma delas é a velocidade de fase vf = ω/k. Como vimos, no caso de ondas eletromagnéticas, ω(k) = ck/n, isto é, a relação é linear, como mostra a Fig.2.3. Para outros tipos de ondas em sólidos, entretanto, k 0 k H0 (a) l (b) 0 e k no espaço. (b) Planos de fase de uma onda eletromagnética Figura 2.2: (a) Vetores E0 , H em certo instante. Os vetores nos planos representam o campo elétrico. A distância entre dois planos consecutivos que têm o mesmo campo elétrico é igual ao comprimento de onda λ. 32 Materiais e Dispositivos Eletrônicos Figura 2.3: Relação de dispersão de uma onda eletromagnética em material isotrópico, homogêneo e linear. essa relação é uma função mais complicada de k. Na seção seguinte veremos, por exemplo, relações de dispersão não lineares de ondas elásticas em sólidos. Uma forma de gerar ondas eletromagnéticas é através de cargas elétricas em movimento. Ondas harmônicas do tipo (2.11) resultam de cargas em movimento oscilatório, ou correntes alternadas. A freqüência do movimento, ou da corrente, determina a freqüência da onda e portanto o tipo de radiação que é produzido. Correntes de freqüência na faixa de 100 kHz (105 Hz) a 100 MHz (108 Hz), geradas por osciladores a transistor ou a válvula, produzem ondas que são utilizadas para transportar sinais de áudio, chamadas ondas de rádio. A faixa que vai de pouco abaixo de 100 MHz até 1000 MHz, ou 1 GHz (109 Hz), é utilizada para transportar sinais de televisão. Durante a década de 1990, houve uma grande evolução na telefonia móvel, que passou a utilizar freqüências na faixa de centenas de MHz a alguns GHz. As várias regiões do espectro eletromagnético estão ilustradas na Fig.2.4 por meio de escalas logarı́tmicas de freqüência ν, do correspondente comprimento de onda λ no vácuo, do inverso de λ e da energia E (esta será definida na seção 2.3). Não estão representadas na Fig.2.4 a parte superior da faixa de raios-X, que se estende desde 1016 Hz até 1019 Hz, e os raios gama (acima de 1019 Hz). A radiação na faixa de microondas (1 GHz - 300 GHz) também é produzida por osciladores a válvula ou a transistor. Nas regiões infravermelho, visı́vel e ultravioleta, a radiação é produzida por filamentos incandescentes de lâmpadas, por transições atômicas em lâmpadas de descarga elétrica ou em lasers a gás, e também por transições eletrônicas em materiais diversos ou em diodos semicondutores. A função de onda descrita pela Eq.(2.11) representa um campo elétrico que preenche todo o espaço, o que, evidentemente, representa uma situação irreal. Apesar disto, ela é de grande importância em fı́sica por diversas razões. Cap. 2 Ondas e Partı́culas na Matéria 33 Figura 2.4: Ilustração de parte do espectro eletromagnético em unidades de freqüência ν, comprimento de onda λ, inverso de λ e energia E. Uma delas é que qualquer variação do campo elétrico que ocorre na prática pode ser decomposta em uma soma de ondas planas do tipo (2.11), através da técnica de transformada de Fourier. A transformada de Fourier permite decompor qualquer forma de variação em ondas planas de diferentes freqüências e vetores de onda. Por exemplo, vamos considerar um campo elétrico que varia somente na direção x. Em um determinado instante, digamos t = 0, podemos decompor este campo na seguinte forma: ∞ Ek eikx dk (2.15) E(x, 0) = −∞ onde 1 Ek = 2π ∞ −∞ 0) e−ikx dx E(x, . (2.16) A Eq.(2.15) significa que o campo é uma superposição de várias ondas planas, cada uma caracterizada por um vetor de onda k e amplitude Ek . O valor de Ek é dado pela transformada de Fourier (2.16). Vamos considerar o caso de um campo eletromagnético confinado a uma pequena região do espaço, como o representado na Fig.2.5(a), no instante t = 0. À medida que o tempo passa, este pulso propaga-se no espaço. Pode-se mostrar que a transformada de Fourier do pulso tem também a forma de um pulso, mostrado na Fig.2.5(b). Em outras palavras, a superposição de várias ondas planas, com vetores de onda próximos de k0 e com amplitude do tipo representado em 2.5(b), reproduz uma variação espacial na forma do pulso 2.5(a). Pode-se mostrar, ainda, que à 34 Materiais e Dispositivos Eletrônicos Figura 2.5: (a) Pulso de campo elétrico no espaço. (b) Amplitude da transformada de Fourier do pulso mostrado em (a). medida em que o tempo passa, o pulso de campo propaga com a velocidade de grupo, dada por ∂ω vg = . (2.17) ∂k k0 Este resultado vale para qualquer tipo de onda. No caso de ondas eletromagnéticas no vácuo ou em meios isotrópicos, lineares e homogêneos, a velocidade de grupo é igual a velocidade de fase (Problema 2.4). Entretanto, em outras situações como as que encontraremos mais tarde, isto não ocorre, a velocidade de propagação de pulsos é diferente da velocidade de fase. 2.2 Ondas Elásticas em Sólidos Nesta seção vamos estudar algumas propriedades do tipo de onda em cristais mais simples de ser entendido, a onda de vibração da rede cristalina. Uma das razões da simplicidade deste fenômeno é que suas propriedades básicas podem ser deduzidas com a fı́sica clássica, uma vez que os ı́ons que formam a rede são relativamente pesados. Para entender a essência do fenômeno de vibração da rede vamos considerar o caso de dois ı́ons, ligados como explicado na seção 1.2. Classicamente, na situação de equilı́brio, os dois ı́ons ocupam a posição correspondente à mı́nima Cap. 2 Ondas e Partı́culas na Matéria 35 Figura 2.6: (a) Energia de interação efetiva entre dois ı́ons. (b) Sistema equivalente na vizinhança de x = a. energia de ligação, representada na Fig.2.6. Esta situação só ocorre em temperatura T = 0 K, e quando não há qualquer perturbação externa ao sistema. Em sólidos a distância tı́pica de equilı́brio é de alguns Å. Quando os ı́ons são desviados da posição de equilı́brio eles tendem a oscilar em torno dela. Para pequenos desvios, a variação da energia de interação pode ser aproximada por um poço parabólico, fazendo com que o movimento dos ı́ons seja o de um oscilador harmônico. Considerando u = x − a o desvio em torno do ponto de equilı́brio, os primeiros termos da expansão em série de Taylor da energia são: 1 d2 V dV u+ u2 + · · · (2.18) V (u) = V (0) + du 0 2 du2 0 No ponto de equilı́brio a força de interação entre os ı́ons é nula, ou seja, (dV /du)0 = 0. Então, no entorno deste ponto, podemos escrever, 1 V (u) ≃ V (0) + Cu2 2 (2.19) onde C = (d2 V /du2)0 é uma constante caracterı́stica da ligação entre os ı́ons. Nesta aproximação, a força de interação entre os ı́ons é linear, F (u) = − dV = −Cu du , (2.20) como ocorre num oscilador harmônico simples. Este resultado permite concluir 36 Materiais e Dispositivos Eletrônicos que os dois ı́ons ligados pela interação eletrostática, comportam-se como duas massas ligadas por uma mola. Em uma rede cristalina acontece essencialmente o que está ilustrado na Fig.2.7, porém o sistema é tridimensional e o número de ı́ons envolvidos é muito grande. Em T = 0 e sem perturbação externa a rede está em equilı́brio. À medida que aumentamos sua temperatura, seus ı́ons vibram com amplitude cada vez maior. Essa vibração é incoerente, aleatória, no sentido que o movimento de um ı́on não tem qualquer correlação com o de outro. Esta é a principal maneira com a qual a energia térmica é absorvida pelo cristal. Entretanto, a vibração coletiva dos ı́ons pode ser vista como uma superposição de ondas. Em outras palavras, as excitações da rede têm caráter ondulatório. Essas ondas de vibração são chamadas ondas elásticas. Para estudá-las vamos considerar um modelo simplificado da rede, no qual ı́ons iguais estão ligados por molas na forma de uma cadeia infinita, como representado na Fig.2.7(a). A constante C é a constante elástica da cadeia. Chamamos de un o deslocamento do ı́on n de sua posição de equilı́brio, ao longo da cadeia. Sendo a força de interação entre dois ı́ons dada por (2.20), a força sobre o ı́on n exercida por seus dois vizinhos é Fn = C {(un+1 − un ) − (un − un−1 )} = C(un+1 − 2un + un−1) . (2.21) Figura 2.7: (a) Modelo de cadeia monoatômica em equilı́brio. (b) Deslocamentos dos ı́ons quando da passagem de uma onda longitudinal. (c) Deslocamentos numa onda transversal. Cap. 2 Ondas e Partı́culas na Matéria 37 Sendo m a massa dos ı́ons, a equação de movimento do ı́on n é m d2 u n ≡ m ün = C(un+1 − 2un + un−1 ) dt2 . (2.22) Como era de esperar, o movimento do ı́on n depende dos movimentos dos ı́ons n ± 1, que por sua vez dependem dos n ± 2, e assim por diante. O movimento da rede é descrito por um número infinito de equações acopladas. Logo, o movimento da rede é coletivo. Para resolver o sistema infinito de equações, escrevemos a possı́vel solução de un (x, t) sob a forma de onda un (x, t) = uk (t) eikna , (2.23) pois x = na é a coordenada do ı́on n. Substituindo esta função na equação de movimento (2.22) obtemos m ük = Cuk (eika − 2 + e−ika ) = 2 Cuk (cos ka − 1) . (2.24) Assim, obtemos uma só equação para uk (t), a função que exprime a variação do deslocamento de qualquer ı́on no tempo. A variação no espaço, devida ao caráter coletivo do movimento, está contida em (2.23). Veja que (2.24) é a equação de um oscilador harmônico simples, cuja solução é uk (t) = Ae−iωk t . (2.25) Substituindo (2.25) em (2.24) obtemos a freqüência de oscilação da rede em função do número de onda k: 1/2 2C (1 − cos ka)1/2 . (2.26) ω(k) = m Este resultado significa que quando excitada externamente, a cadeia de ı́ons oscila coletivamente com freqüência ω(k), dando origem às ondas elásticas. A onda esquematizada na Fig.2.7(b) é longitudinal, pois os deslocamentos têm a mesma direção da propagação. Poderı́amos ter obtido, de modo semelhante, as equações para as ondas transversais, cujo modo de vibração está ilustrado na Fig.2.7(c). 38 Materiais e Dispositivos Eletrônicos A equação (2.26) é a relação de dispersão das ondas elásticas na cadeia monoatômica linear. Como esta relação é periódica e ω(k) = ω(−k), consideraremos somente os valores de ω entre k = 0 e k = π/a (Fig.2.8), pois este intervalo contém toda informação necessária sobre ω(k). A região −π/a < k < π/a é chamada primeira Zona de Brillouin do espaço de vetor de onda. Observe que em (2.26), ka representa o ângulo de fase entre os movimentos de dois ı́ons vizinhos. Para ondas de grande comprimento de onda, λ a, este ângulo é pequeno e podemos usar a aproximação cos ka ≃ 1 − (ka)2 /2, o que resulta em ω(k) = C/m ka , (2.27) isto é, para ka 1, a relação de dispersão é aproximadamente linear, como em ondas eletromagnéticas. Neste caso as velocidades de fase e de grupo da onda são iguais, sendo dadas por v = C/m a . (2.28) Em geral v é da ordem de 104 m/s, isto é, 104 vezes menor que a velocidade da luz. Para ondas de grande comprimento de onda, podemos aproximar a função deslocamento por uma função contı́nua de x, u(x, t). Neste caso, é possı́vel mostrar que a equação de u(x, t) é igual a equação de ondas para o campo elétrico, Eq.(2.6) (Problema 2.5). Por outro lado, quando o comprimento de onda é pequeno, a natureza discreta da rede torna-se importante. A onda com λ = 2a tem a máxima freqüência de vibração. Fazendo ka = π em (2.26) vemos que o máximo valor de ω é dado por (4C/m)1/2 . O valor desta freqüência varia de um material para outro e está na faixa de 1 a 10 THz (1 THz = 1012 Hz), que corresponde à região do infravermelho distante no espectro eletromagnético (Problema 2.6). Em um cristal qualquer há dois fatos que tornam o problema das ondas elásticas mais complexo: o primeiro é que ele é tridimensional; o segundo é que ele contém ı́ons diferentes. Este segundo fato traz uma caracterı́stica nova, que pode ser entendida de maneira simples, no caso da cadeia unidimensional. Se tivermos uma cadeia com dois tipos de ı́ons intercalados de massas m1 e m2 , ao escrevermos as equações de movimento teremos duas equações da forma (2.22), em vez de apenas uma, como no caso dos ı́ons iguais. Teremos então duas soluções para a freqüência de vibração e, conseqüentemente, dois ramos na relação de dispersão. Sua forma está mostrada na Fig.2.9. Neste caso, as freqüências de vibração possı́veis do sistema formam duas bandas, Cap. 2 Ondas e Partı́culas na Matéria 39 Figura 2.8: Relação de dispersão de ondas elásticas numa cadeia monoatômica linear. definidas pelos dois ramos da relação de dispersão. Entre elas existe uma faixa proibida, cuja largura depende da diferença entre as massas. Quando as duas massas são iguais, a banda proibida desaparece, isto é, o ramo inferior na região 0 ≤ k ≤ π/2a e o ramo superior na região π/2a ≤ k ≤ π/a compõem a relação de dispersão da cadeia monoatômica da Fig.2.8. No ramo inferior da Fig.2.9, chamado acústico, em uma onda com ka 1, dois ı́ons vizinhos movem-se em fase. No ramo superior, chamado óptico, uma onda com ka 1 tem os dois ı́ons vizinhos movendo em oposição de fase. As ondas do ramo acústico podem ser excitadas por um tipo de força que faz átomos vizinhos irem no mesmo sentido, como em uma onda sonora (daı́ seu nome, acústico). Por outro lado, as ondas do ramo óptico são criadas quando a excitação produz efeitos opostos em ı́ons vizinhos, como é o caso do campo elétrico de luz infravermelha atuando em ı́ons vizinhos de cargas opostas. Figura 2.9: (a) Relação de dispersão de ondas elásticas na cadeia diatômica linear mostrada em (b), com os ramos acústico e óptico. 40 Materiais e Dispositivos Eletrônicos Figura 2.10: Curvas de dispersão de ondas elásticas em um cristal cúbico diatômico, com o vetor de onda na direção de um eixo principal (L = longitudinal, T = transversal, O = óptico e A = acústico). A complexidade vinda do caráter tridimensional do cristal resulta na existência de um maior número de graus de liberdade no sistema. Neste caso, o deslocamento de um ı́on de sua posição de equilı́brio r é caracterizado por r , t). As soluções das equações de movimento gerais levam à um vetor R( i(k. r−ωλ t) Rλ (r, t) = Re Ak e , (2.29) onde λ é um ı́ndice que representa o tipo da vibração e a direção do deslo ou seja ele exprime a polarização da onda e seu tipo (óptico ou camento R, acústico). Para uma dada direção de k temos três polarizações para cada tipo de onda. Para direções particulares podemos ter duas ondas transversais e uma longitudinal. A freqüência ωλ (k) depende de k e do tipo da onda. A Fig.2.10 ilustra as formas tı́picas das curvas de dispersão para ondas elásticas em um cristal cúbico com dois ı́ons por célula unitária. 2.3 Efeito Fotoelétrico - Ondas e Partı́culas No fim do século passado surgiram as primeiras evidências de que, em algumas situações, uma onda eletromagnética se comportava com caracterı́sticas tı́picas de partı́culas. Hertz, em 1886-87, realizou diversas experiências que confirmaram a existência de ondas eletromagnéticas e a teoria de Maxwell. Numa Cap. 2 Ondas e Partı́culas na Matéria 41 Figura 2.11: Ilustração do equipamento usado para estudo do efeito fotoelétrico. dessas experiências ele observou que a descarga elétrica entre dois eletrodos ocorria mais facilmente quando luz ultravioleta incidia sobre um dos eletrodos. Mais tarde Lenard verificou que a descarga ocorria mais facilmente porque a luz facilitava a emissão de elétrons da superfı́cie do eletrodo, fenômeno que foi posteriormente chamado de efeito fotoelétrico. A Fig.2.11 mostra um equipamento usado para estudar o efeito fotoelétrico. Ele consiste de um tubo de vidro evacuado, com uma “janela” de quartzo plana por onde passa a luz incidente. A luz monocromática incide sobre a placa de metal que forma o catodo C, fazendo-o liberar elétrons. Estes, chamados fotoelétrons, são atraı́dos para a superfı́cie metálica do anodo A por meio da diferença de potencial V , produzindo uma corrente elétrica que é medida pelo microamperı́metro µA. Numa experiência tı́pica mede-se a variação da corrente em função da diferença de potencial V , que pode ser variada através do potenciômetro. Um aparato deste tipo foi usado em 1914 por Millikan, que por seus estudos do efeito fotoelétrico e da carga do elétron ganhou o prêmio Nobel de Fı́sica em 1923. A curva da Fig.2.12 mostra a variação da corrente fotoelétrica I com a tensão V aplicada, para dois valores da intensidade da luz incidente. Quando V é suficientemente grande e positiva, a corrente tende para o valor de saturação Ia correspondente à intensidade da luz. A saturação da corrente ocorre quando todos fotoelétrons emitidos pelo catodo são coletados pelo anodo. Um dos resultados mais importantes desta experiência é obtido quando o sinal da tensão V é trocado. A corrente não vai bruscamente para zero com a tensão negativa, indicando que os elétrons são emitidos de C com certa energia cinética. En- 42 Materiais e Dispositivos Eletrônicos Figura 2.12: Variação da corrente fotoelétrica com a tensão aplicada, para dois valores de intensidade da luz incidente. A tensão V0 é independente da intensidade de luz, mas a corrente de saturação é diretamente proporcional à mesma. tretanto, quando a tensão atinge um valor −V0 , mesmo os elétrons de maior energia são freados e a corrente vai a zero. Do resultado desta experiência pode-se concluir que a tensão V0 , chamada potencial de retardo, permite medir a energia cinética Tmax dos elétrons que são emitidos com a máxima energia. A relação entre eles é, então, Tmax = e V0 , (2.30) onde e é a carga do elétron. Esta máxima energia cinética é independente da intensidade da luz incidente, como mostrado pela curva b da Fig.2.12, obtida com metade da intensidade usada em a. A Fig.2.13 mostra a variação da tensão V0 em função da freqüência da luz incidente em sódio, medida por Millikan em 1914. Estas medidas mostram que há uma freqüência de corte νc , abaixo da qual o efeito fotoelétrico deixa de ocorrer. O valor desta freqüência varia de um material para outro, sendo que para o sódio νc = 4, 39 × 1014 Hz (λ ≃ 683 nm, que corresponde à luz vermelha, quase no infravermelho). Os resultados observados com o efeito fotoelétrico não puderam ser explicados através da teoria clássica da luz e durante vários anos constituı́ram um grande desafio para os fı́sicos. Mas em 1905, Einstein usou as idéias de quantização, inicialmente propostas por Planck, para explicar o efeito fotoelétrico. Sua teoria lhe valeu o prêmio Nobel de Fı́sica de 1921. O modelo quântico Cap. 2 Ondas e Partı́culas na Matéria 43 Figura 2.13: Medidas de Millikan do limiar de tensão para efeito fotoelétrico em sódio, em função da freqüência da luz incidente. de Einstein para a radiação eletromagnética foi posteriormente explicado de forma coerente pela teoria quântica de campos. Um dos resultados mais importantes dessa teoria é que uma onda eletromagnética é quantizada em energia. Isto significa que se ela tem freqüência ν, ela só pode ser gerada com valores discretos de energia nhν, onde n é um inteiro e h é a constante de Planck (h = 6, 6262 × 10−34 J.s). Segundo Einstein, a energia da radiação eletromagnética é quantizada na forma de pacotes, chamados fótons. Quando uma onda eletromagnética tem energia elevada, isto é, muito maior do que hν, o número de fótons é tão grande, que a natureza discreta da energia não é percebida. Nesta situação, a onda se comporta classicamente. A energia de um fóton de radiação de freqüência ν, ou freqüência angular ω = 2πν, é E = hν = ω , (2.31) onde = h/2π. Os fótons têm, em muitas situações, comportamento tipo partı́cula. No entanto, não são partı́culas comuns, pois só existem com velocidade da luz c e têm massa de repouso nula. A relação entre energia e freqüência, dada por (2.31), permite representar o espectro eletromagnético em unidades de energia, como o eV. Utilizando o valor da constante de Planck e da carga do elétron é possı́vel verificar que para converter Hz em eV é preciso multiplicar por 4, 1357 ×10−15 . Este fator de conversão foi utilizado para construir a Fig.2.4. Assim, a região visı́vel do espectro tem comprimento de onda de 700 nm a 400 nm, freqüência de 4,3 a 7, 5 × 1014 Hz e energia de 1,7 a 3,1 eV. O Apêndice B apresenta uma tabela de conversão entre várias unidades de energia. 44 Materiais e Dispositivos Eletrônicos Sabemos da teoria eletromagnética que o momentum p de uma onda no vácuo está relacionado com sua energia E por p= E c . (2.32) Usando (2.10), com n = 1, e (2.31) em (2.32), obtemos a expressão para o momentum do fóton, p = k . (2.33) Segue, portanto, que em uma onda eletromagnética de freqüência ω e vetor de onda k, tanto a energia quanto o momentum são quantizados. É importante chamar a atenção para o fato de que a teoria não prevê uma quantização espacial da onda eletromagnética. Em outras palavras, não há nada que limite a existência de um fóton a uma região finita do espaço. É possı́vel ter uma onda eletromagnética plana, enchendo todo o espaço, correspondendo a apenas um fóton. A quantização é feita somente em termos de momentum e de energia. É possı́vel, entretanto, ter uma onda eletromagnética confinada numa região limitada do espaço, como por exemplo no pulso de onda da Fig.2.5, contendo apenas um fóton. Neste caso, o fóton fica mais parecido com uma partı́cula, ou um corpúsculo. No efeito fotoelétrico os fótons são absorvidos num processo de interação que resulta na emissão de elétrons. Como há conservação de energia na interação elétron-fóton, quando o elétron é emitido da superfı́cie do metal sua energia cinética é T = hν − W , (2.34) onde W é o trabalho necessário para arrancar o elétron do metal. Como há elétrons que estão mais presos aos átomos do que outros, W varia de um elétron para outro. Os elétrons que estão menos ligados emergem da superfı́cie com a máxima energia cinética. Para eles podemos escrever Tmax = hν − W0 , (2.35) onde W0 , uma grandeza caracterı́stica de cada metal chamada função trabalho, é a mı́nima energia necessária para que um elétron vença as forças de atração internas e atravesse a superfı́cie. A teoria de Einstein explica as principais observações do efeito fotoelétrico. Veja que os elétrons “arrancados” do metal por fótons com energia hνc = W0 , (2.36) Cap. 2 Ondas e Partı́culas na Matéria 45 têm energia cinética nula, não produzindo corrente fotoelétrica com V0 = 0. Então, o valor de νc dado por (2.36) é a freqüência de corte, que é independente da intensidade da luz incidente. Quando ν > νc e V > −V0 , existe uma corrente fotoelétrica resultante da emissão de elétrons. Quando a intensidade de luz aumenta, o número de fótons incidentes por unidade de tempo aumenta proporcionalmente, o que resulta no aumento proporcional da corrente fotoelétrica. Com as equações (2.30) e (2.35) podemos obter a expressão para o potencial do retardo V0 decorrente da teoria de Einstein, eV0 = hν − W0 . (2.37) , (2.38) Utilizando (2.36), obtemos para ν ≥ νc , V0 = h (ν − νc ) e que mostra a variação linear de V0 com νc , em acordo com a medida experimental de Millikan (Fig.2.13). As idéias de quantização da energia e das caracterı́sticas corpusculares da radiação eletromagnética provocaram um profundo impacto na Fı́sica no inı́cio deste século. Com base nestas idéias, vários fı́sicos passaram a procurar nos elétrons efeitos de quantização e de comportamento ondulatório. Estes trabalhos levaram à formulação da mecânica quântica em 1926 por Schroedinger e independentemente por Heisenberg. As equações da mecânica quântica governam o comportamento dos elétrons nos átomos e nos sólidos e seu conhecimento é fundamental para a compreensão dos fenômenos eletrônicos que ocorrem nos diversos materiais. Exemplo 2.1: Numa experiência de efeito fotoelétrico, o material do fotocatodo é o lı́tio, cuja função trabalho é 2,3 eV, e o comprimento de onda da luz usada para iluminar o fotocatodo é 300 nm. Determine: a) A freqüência de corte do lı́tio; b) O potencial de retardo. a) A relação entre a função trabalho e a freqüência de corte é dada pela Eq. (2.36). Então, νc = W0 2, 3 eV × 1, 6 × 10−19 coulomb ≃ h 6, 63 × 10−34 joule-seg ≃ 5, 5 × 1014 Hz Materiais e Dispositivos Eletrônicos 46 b) O potencial de retardo é relacionado com a freqüência de corte e a freqüência da luz pela Eq.(2.38). A freqüência da luz é, ν= 3, 0 × 108 m/s c = = 10, 0 × 1014 Hz . λ 300 × 10−9 m Assim, V0 = = 2.4 h 6, 63 × 10−34 joule-seg (ν − νc ) = × 4, 5 × 1014 Hz e 1, 6 × 10−19 coulomb 1, 86 V O Elétron como uma Onda - Princı́pio da Incerteza Como vimos na seção anterior, a radiação eletromagnética é quantizada em energia, adquirindo em certas situações comportamento do tipo de corpúsculos ou partı́culas. Este conceito foi introduzido na Fı́sica para explicar um resultado experimental, o efeito fotoelétrico, que não podia ser compreendido num contexto clássico. Ao contrário, o conceito de que o elétron, uma partı́cula no sentido clássico, é também uma onda, resultou de uma dedução teórica que só mais tarde foi confirmada experimentalmente. Foi Louis de Broglie, em sua tese de doutorado apresentada em 1924 na Universidade de Paris, que propôs a idéia revolucionária de ondas de matéria. Sua teoria lhe valeu o prêmio Nobel de Fı́sica de 1929, depois que ela foi confirmada experimentalmente. A hipótese de Broglie de que o elétron pode ter comportamento de partı́cula e de onda foi inspirada no conceito, já aceito na época, de que a radiação eletromagnética tem comportamento tipo partı́cula. Ele postulou que o elétron é caracterizado por uma freqüência ν e comprimento de onda λ, relacionados com a energia e o momentum exatamente do mesmo modo que para fótons. Como na Eq.(2.31), a energia do elétron é expressa na forma, E = hν , (2.39) p = h/λ . (2.40) enquanto que o momentum é: Multiplicando e dividindo o lado direito de (2.40) por 2π, e usando k = 2π/λ, obtemos p = k . (2.41) Cap. 2 Ondas e Partı́culas na Matéria 47 que é igual a Eq.(2.33). Se a matéria tem comportamento de onda, por que não notamos isto na vida diária? Considere um objeto de massa m = 1,0 kg movendo com velocidade v = 100 m/s. O comprimento de onda correspondente é: h 6, 6 × 10−34 h = = 6, 6 × 10−36 m . λ= = (2.42) p mv 100 Veja que o comprimento de onda é muito pequeno comparado à dimensão tı́pica de objetos comuns. Por isso, os efeitos de difração e interferência, que são caracterı́sticos de ondas, são inteiramente desprezı́veis. Considere agora um elétron com energia cinética T = 100 eV. O comprimento de onda correspondente é: λ= h h =√ ≃ 1, 2 × 10−10 m = 1, 2 Å p 2mT . (2.43) Este comprimento de onda é da mesma ordem de grandeza da dimensão dos átomos e da distância entre eles na matéria. Por isso, os efeitos ondulatórios são importantı́ssimos na escala atômica. Esses efeitos foram observados por Davisson, Germer e G.P. Thomson em 1927, através de uma experiência na qual um feixe de elétrons acelerados por um potencial elétrico incidia sobre um cristal. Eles verificaram que o cristal, com sua estrutura atômica periódica, atuava como uma rede de difração, produzindo máximos e mı́nimos de interferência no feixe de elétrons espalhados. O fato dos elétrons com energias de dezenas de eV serem ondas, com comprimento de onda várias ordens de grandeza menor do que o da luz visı́vel, tem uma importante aplicação prática. Quando um feixe de elétrons incide sobre um material, a análise dos elétrons espalhados permite observar detalhes muito menores do que se consegue com a luz visı́vel num microscópio óptico. Este é o princı́pio básico de operação do microscópio eletrônico. No microscópio óptico o observador vê a imagem do objeto ampliada por meio de lentes de vidro, que processam a luz espalhada pelos detalhes do material analisado. Como o comprimento de onda mı́nimo da luz visı́vel é da ordem de 3000 Å, não é possı́vel distinguir detalhes com dimensões menores que este valor. Por outro lado, como no microscópio eletrônico a onda utilizada é a de um feixe de elétrons, é possı́vel observar detalhes com dimensões de alguns angstroms. Neste caso, a imagem do objeto é formada por lentes magnéticas (campos magnéticos produzidos por bobinas com formatos adequados) e convertida em sinais elétricos por meio de detetores, de modo a ser observada na tela de um computador. Materiais e Dispositivos Eletrônicos 48 Outra aplicação importante de ondas de matéria é no estudo de sólidos cristalinos por meio de difração. Como o parâmetro da rede nos cristais é da ordem de alguns angstroms, a difração só ocorre com radiação de comprimento de onda próximo deste valor. É possı́vel então usar feixes de elétrons ou de nêutrons de alta velocidade. A vantagem dos nêutrons está no fato de que sendo eletricamente neutros, sua penetração no sólido é muito maior que a dos elétrons. Exemplo 2.2: Calcule as energias e as velocidades de um feixe de elétrons e outro de nêutrons, para que ambos tenham comprimento de onda de 2 Å. A relação entre energia e comprimento de onda é dada pela Eq. (2.43). Então, T = h2 /2mλ2 . Para o feixe de elétrons m = 9, 1 × 10−31 kg, logo, T = = 6, 632 × 10−68 = 6, 0 × 10−18 J 2 × 9, 1 × 10−31 × 22 × 10−20 6, 0 × 10−18 eV = 37, 5 eV 1, 6 × 10−19 A velocidade é relacionada com a energia cinética por T = mv 2 /2. Portanto, a velocidade dos elétrons é, v = (2T /m)1/2 = 2 × 6, 0 × 10−18 9, 1 × 10−31 1/2 = 3, 6 × 106 m/s No caso do feixe de nêutrons, m = 1, 67 × 10−27 kg. Então, T = v = 6, 632 × 10−68 = 3, 3 × 10−21 J 2 × 1, 67 × 10−27 × 22 × 10−20 2 × 3, 3 × 10−21 1, 67 × 10−27 1/2 = 2, 0 × 103 m/s As caracterı́sticas de um elétron podem ser descritas de maneira quantitativa através de uma função de onda Ψ. No próximo capı́tulo ela será definida com precisão. Se o elétron for uma onda plana com um momentum bem definido p0 , ele terá um vetor de onda k0 = p0 / e sua função de onda pode ser escrita na forma Ψ(x, t) = A eik0 x−iωt , (2.44) onde sua freqüência angular ω é relacionada com sua energia por E = ω. A função de onda (2.44) descreve um elétron que preenche todo o espaço, e Cap. 2 Ondas e Partı́culas na Matéria 49 que portanto tem uma incerteza em sua posição x → ∞. É evidente que é muito difı́cil “produzir” um elétron com a função de onda (2.44) em todo o espaço. Entretanto, é possı́vel ter um elétron mais localizado, com uma função de onda como a da Fig.2.14(a). Neste caso, o elétron não tem um vetor de onda bem definido k0 . Ele é descrito, digamos em t = 0, por uma função de onda Ψ(x, 0) que é uma superposição de ondas planas com vetores de onda k próximos de k0 e amplitudes φ(k) com máximo em k = k0 e largura k (Fig.2.14(b)), de modo análogo ao caso do campo elétrico E(x, 0) descrito na seção 2.1. Uma incerteza na determinação de k implica numa incerteza no momentum do elétron p = k. É possı́vel mostrar, pela transformada de Fourier de uma função do tipo da Fig.2.14(a), que xk ≃ 1. Para um elétron descrito por Ψ(x, 0) isto significa que xp ≃ , (2.45) Este resultado tem a seguinte interpretação: Se em uma medida experimental, a posição do elétron é determinada com uma incerteza x, seu momentum também tem uma incerteza p. Isto foi postulado em 1927 por Heisenberg, sendo conhecido como o princı́pio da incerteza. Segundo este princı́pio, em uma experiência não é possı́vel determinar exatamente o valor da posição do elétron x e seu momentum p simultaneamente. Existe uma incerteza mı́nima no processo de medida que é dada por xp ≥ /2 . (2.46) Figura 2.14: (a) Pacote de ondas que descreve o estado de uma partı́cula livre localizada numa região do espaço. (b) Transformada de Fourier do pacote de ondas mostrado em (a). 50 Materiais e Dispositivos Eletrônicos Veja que no caso de uma função de onda plana como a da Eq. (2.44), o momentum é bem determinado (p = 0), em contrapartida x → ∞. Existe uma outra versão do princı́pio da incerteza, relativa à determinação da energia do elétron E e o intervalo de tempo t necessário para medi-la. Segundo Heisenberg, se a medida é efetuada em um intervalo t finito, existe uma incerteza E na determinação de E dada por E t ≥ /2 . (2.47) O princı́pio da incerteza, representado pelas equações (2.46) e (2.47), foi assim proposto por Heisenberg numa época em que o conceito da função de onda do elétron ainda não era conhecido. Ele causou um profundo impacto na Fı́sica e também gerou muitas especulações filosóficas. Na verdade, ele é uma decorrência natural do caráter ondulatório das partı́culas da matéria, cuja formalização é dada pela mecânica quântica, que será estudada no próximo capı́tulo. 2.5 Fônons e outras Excitações Elementares em Sólidos As quantizações da onda eletromagnética e da onda de elétron são apenas dois exemplos de um fenômeno geral que ocorre com qualquer tipo de onda. Este fenômeno é observado experimentalmente através de diversos efeitos e tem uma explicação rigorosa na teoria quântica de campos. Qualquer onda é formada por “pacotes” de energia ω, chamados quanta (plural de quantum) de energia. Assim sendo, a energia de uma onda é discreta e tem valor igual a um múltiplo de ω. O quantum de uma onda tem comportamento tanto de onda como de partı́cula, tendo energia e momentum dados por E = ω , (2.48) p = k , (2.49) que são relações idênticas àquelas vistas anteriormente para ondas eletromagnéticas e para elétrons. As excitações num sólido têm caráter de onda, sendo portanto quantizadas. Os quanta das diversas ondas são chamados de Cap. 2 Ondas e Partı́culas na Matéria 51 excitações elementares. Assim, um quantum de vibração de rede é um pacote de onda elástica, e recebe o nome de fônon. Há muitas outras excitações elementares em sólidos, em geral com nomes terminados em on. O quantum de onda de spin em materiais magnéticos é o magnon. O de uma onda de plasma num metal ou semicondutor chama plasmon. Outras excitações, que não serão apresentadas neste livro são os excitons, polarons, polaritons, helicons, plasmaritons, rotons, etc. REFERÊNCIAS A. Chaves, Fı́sica, Ondas, Relatividade e Fı́sica Quântica, Reichmann & Affonso Editores, Rio de Janeiro, 2001. R. Eisberg e R. Resnick, Fı́sica Quântica, Editora Campus, Rio de Janeiro, 1988. G.R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, New York, 1975. D. Halliday, R. Resnick e J. Walker, Fundamentos da Fı́sica, Livros Técnicos e Cientı́ficos, Rio de Janeiro, 1995. C. Kittel, Introduction to Solid State Physics, J. Wiley, New York, 1996. J. Leite Lopes, A Estrutura Quântica da Matéria, Editora UFRJ, Rio de Janeiro, 1992. H.P. Neff, Jr., Introductory Electromagnetics, J. Wiley, New York, 1991. O. Pessoa, Jr., Conceitos de Fı́sica Quântica, Livraria Editora da Fı́sica, São Paulo, 2003. Materiais e Dispositivos Eletrônicos 52 PROBLEMAS 2.1 Aplique o operador rotacional (∇×) à Eq.(2.3), utilize a Eq.(2.4), juntamente com as relações entre os campos e a identidade vetorial ∇ × (∇× ) = ∇(∇· ) − ∇2 ( ) e mostre que num meio sem cargas ou correntes, o campo elétrico obedece à Eq.(2.5). 2.2 Considere um campo elétrico com amplitude que varia no tempo e no espaço com uma função E(x, t): a) Mostre que esta função será solução da equação de ondas (2.6), se o argumento tiver a forma E(x, t) = f (x − vt) + g(x+ vt), onde f e g são quaisquer funções diferenciáveis; b) Escolha uma função f (x) em t = 0 que satisfaça à equação de ondas e faça um gráfico qualitativo de sua variação com x em dois instantes de tempo t > 0 quaisquer. Interprete o resultado. t) = ŷ E0 cos(kx−ωt) de uma onda eletro2.3 Considere o campo elétrico E(x, magnética plana: a) Mostre que esta forma de E é solução da equação de ondas pela substituição direta em (2.6); b) Mostre que esta função é solução da equação de ondas, pois é um caso particular da solução obtida no problema 2.2; c) Faça um gráfico qualitativo de E em função de x para t = 0 e obtenha a relação com k e ω da distância entre dois máximos consecutivos da onda; d) Faça o gráfico de E em função de x para t = t e relacione a velocidade de deslocamento de um máximo, x/t, com ω e k. 2.4 Considere um pulso de onda eletromagnético de forma gaussiana no instante t = 0, 2 2 E(x, 0) = E0 e−x /2L cos k0 x a) Faça um gráfico semi-quantitativo de E em função de x para E0 = 1 (unidades arbitrárias) e L = 5 × 2π/k0 . Se você tiver um computador com impressora, faça o gráfico quantitativo usando k0 = 1; b) Determine a função E(x, t) que descreve o pulso num instante arbitrário, t, pela imposição de que E(x, t) satisfaça à Eq.(2.6); c) Repita o item a) para o campo obtido no item b). 2.5 Mostre que no limite de grandes comprimentos de onda, λ a, a Eq.(2.22) se reduz a uma equação de ondas para uma variável u contı́nua, 2 ∂2u 2 ∂ u = v ∂t2 ∂x2 Cap. 2 Ondas e Partı́culas na Matéria 53 2.6 As vibrações da rede de um certo cristal podem ser descritas pelo modelo unidimensional dado pela Eq.(2.22), com átomos de peso atômico 56 e constante elástica C = 104 g/s2 : a) Calcule a velocidade de propagação da onda elástica na cadeia no limite de grandes comprimentos de onda, λ a (ou ka 1), em cm/s, e compare com a velocidade da luz; b) Calcule o valor máximo da freqüência de vibração da cadeia em rd/s e em Hz. 2.7 A partir das medidas do efeito fotoelétrico mostradas na Fig.2.13: a) Calcule a função trabalho do sódio, em eV; b) Calcule o potencial de retardo V0 de uma célula com fotocatodo de sódio, iluminada por luz de comprimento de onda λ = 350 nm. 2.8 Uma montagem de medida do efeito fotoelétrico utiliza uma célula com fotocatodo de alumı́nio, cuja função trabalho é 4,2 eV. A luz ultravioleta empregada tem comprimento de onda 180 nm: a) Qual é a freqüência de corte do alumı́nio?; b) Qual o potencial de retardo do alumı́nio para este comprimento de onda?; c) Calcule a energia cinética do elétron mais rápido emitido; d) Qual é a energia do elétron no alumı́nio, que ao ser emitido é o mais lento? 2.9 Um diodo emissor de luz de GaP emite luz de comprimento de onda 549 nm, com potência 1 µW: a) Qual é a energia, em eV, dos fótons emitidos pelo diodo? b) Quantos fótons por segundo são emitidos pelo diodo? 2.10 Numa experiência de efeito fotoelétrico com um laser, luz de intensidade 1,0 watt e certa freqüência, incide sobre um fotocatodo de lı́tio, cuja função trabalho é 2,3 eV. a) Qual é o potencial de retardo para uma freqüência cujo valor é o dobro da freqüência de corte? b) Suponha que a cada dez fótons que chegam ao fotocatodo um elétron é emitido, e que o potencial positivo aplicado entre anodo e catodo é tal que a corrente está saturada. Calcule o valor desta corrente, em ampère. 2.11 Um elétron é descrito por uma função de onda na forma de um pacote gaussiano dado, em t = 0, por 2 2 ψ(x, 0) = A e−x /2L eik0 x , a) Faça um gráfico qualitativo de |ψ(x, 0)|2 em função de x; b) A largura do pacote pode ser caracterizada por x = < x2 > sendo < x2 > o desvio médio quadrático da função em relação ao seu valor médio xm , 2 < x >= |ψ(x, 0)|2(x − xm )2 dx 54 Materiais e Dispositivos Eletrônicos b) Calcule x para o elétron; c) Calcule a transformada de Fourier φ(k) da função de onda, utilizando a definição da Eq.(2.16) com E substituı́do por ψ. Faça um gráfico qualitativo de |φ(k)|2 e calcule a largura k do pacote do mesmo modo que o item b); d) Calcule o produto xk e interprete o resultado. Dados: ∞ ∞ √ 2 −y 2 e dy = 2 y 2 e−y dy = π −∞ −∞ 2.12 Um elétron e um fóton têm, cada um, um comprimento de onda de 3,0 Å. Calcule as energias e os momentos de cada um e interprete o resultado. 2.13 A máxima resolução de um microscópio é limitada pelo comprimento de onda da radiação utilizada, sendo a menor distância que pode ser observada igual ao comprimento de onda. Qual deve ser, em eV, a energia dos elétrons num microscópio eletrônico para que sua resolução seja 10 Å? 2.14 Mostre que a relação de incerteza para uma partı́cula, em termos das incertezas na posição x e no comprimento de onda λ que podem ser medidos simultaneamente, é dada por: x λ ≥ λ2 /4π 2.15 Se a incerteza na medida do comprimento de onda de um fóton for λ/λ = 10−7 , qual será a incerteza na medida da posição de fótons com λ = 5 × 10−4 Å (raios γ), 5 Å (raios X) e 500 nm (luz visı́vel)? 2.16 As vibrações da rede de um certo cristal diatômico podem ser descritas pelo modelo unidimensional estudado na Seção 2.2, com átomos de pesos atômicos 39 e 80 e constante elástica C = 104 g/s2 . a) Calcule o valor da freqüência de vibração da cadeia com k = 0, em rd/s e em Hz; b) Qual é a energia do fônon correspondente à vibração do item a) em eV?; c) Para que o fônon do item b) seja excitado ressonantemente por um fóton de mesma energia, qual deve ser o comprimento de onda deste fóton e em qual região do espectro eletromagnético ele se situa? Capı́tulo 3 Mecânica Quântica: O Elétron no Átomo 3.1 Os Postulados da Mecânica Quântica 3.1.1 A Função de Onda 3.1.2 Operadores Quânticos 3.1.3 Valor Esperado de uma Grandeza 3.1.4 A Equação de Schroedinger 56 57 57 59 60 3.2 A Equação de Schroedinger Independente do Tempo 60 3.3 Aplicações Simples da Mecânica Quântica 62 3.3.1 Elétron Livre 3.3.2 Elétron num Poço de Potencial Infinito 3.3.3 Barreira de Potencial-Efeito Túnel 62 65 69 3.4 Elétron no Átomo de Hidrogênio 73 3.5 Átomos de Muitos Elétrons 84 REFERÊNCIAS 86 PROBLEMAS 87 55 56 Materiais e Dispositivos Eletrônicos Mecânica Quântica: O Elétron no Átomo 3.1 Os Postulados da Mecânica Quântica O modelo de Bohr para o átomo com estados estacionários é baseado no postulado de que o momentum angular do elétron em órbita circular em torno do núcleo é quantizado. Este modelo, quando proposto em 1913, teve um grande sucesso pois conseguiu explicar os resultados experimentais do espectro discreto da radiação emitida pelos átomos de um gás de hidrogênio. Apesar de seu sucesso, o modelo de Bohr deixou os fı́sicos inquietos por causa da quantização imposta ad-hoc. Seu mistério era tão grande quanto o da quantização da energia de uma partı́cula executando um movimento harmônico simples, proposta em 1900 por Planck. Durante anos os fı́sicos procuraram uma teoria mais fundamental que explicasse os resultados de Planck e de Bohr. O postulado de Broglie, relativo à natureza ondulatória da matéria, abriu o caminho para os princı́pios da mecânica quântica, enunciados por Schroedinger em 1926. Na mesma época, Heisenberg desenvolveu uma teoria matricial que à primeira vista era distinta da de Schroedinger. Posteriormente verificou-se que as duas formulações eram equivalentes e seus resultados eram idênticos. Vamos apresentar aqui apenas a formulação de Schroedinger que é matematicamente mais simples. Alguns autores tentam justificar a equação básica da mecânica quântica, a equação de Schroedinger, utilizando argumentos diversos. Entretanto ela é uma equação fundamental da Fı́sica, que não pode ser deduzida a partir das leis clássicas. Sua melhor justificativa é o fato de seus resultados explicarem as observações e medidas experimentais. A mecânica quântica é baseada nos quatro postulados seguintes: Cap. 3 Mecânica Quântica: O Elétron no Átomo 3.1.1 57 A Função de Onda O estado de um elétron, ou de qualquer “partı́cula” material, é caracterizado por uma função de onda complexa Ψ(x, t). Em três dimensões, Ψ é na realidade função de r e não de x, mas vamos manter x por simplicidade. Ψ e suas derivadas em relação a x são contı́nuas, finitas e unı́vocas. Se num instante t fizermos uma medida para determinar a localização da partı́cula com função de onda Ψ(x, t), a probabilidade de encontrá-la entre x e x + dx é dada por P (x, t) dx, onde P (x, t) = Ψ∗ (x, t) Ψ(x, t) . (3.1) Como a probabilidade de encontrar a partı́cula em todo o espaço é 1, ∞ ∞ P (x, t) dx = Ψ∗ (x, t) Ψ(x, t) dx = 1 . (3.2) −∞ −∞ Esta condição é suficiente para determinar a amplitude da função de onda com uma forma conhecida. Dizemos que a função de onda que satisfaz (3.2) está normalizada. 3.1.2 Operadores Quânticos Com a função de onda podemos determinar a probabilidade de “localização” de uma partı́cula em qualquer instante. Entretanto, para calcular outras grandezas relativas ao seu movimento é preciso introduzir o conceito de operador. A cada grandeza fı́sica corresponde um operador matemático, que opera na função de onda. O operador relativo ao momentum em uma dimensão, digamos x, é pop = −i ∂ ∂x , (3.3) onde i é a unidade imaginária. Veja o que acontece quando (3.3) opera na função de onda plana de um elétron livre dada pela Eq. (2.44) pop Ψ(x, t) = −i ∂ A eik0 x−iωt = k0 Ψ(x, t) ∂x . (3.4) 58 Materiais e Dispositivos Eletrônicos Ora, k0 é o momentum de um elétron livre proposto por de Broglie. Então a definição (3.3) está bastante razoável. É importante chamar a atenção de que quando um operador é aplicado a uma função de onda, em geral não se obtém diretamente o valor da grandeza fı́sica a ele associado, como na Eq. (3.4). Quando um operador aplicado a Ψ, reproduz Ψ multiplicada por uma constante, dizemos que Ψ é uma autofunção do operador. Assim, se pop Ψ = pΨ , (3.5) Ψ é uma autofunção de pop , sendo p o autovalor. Quando isto ocorre, o momentum da partı́cula é bem determinado, ou seja, sua incerteza é nula. Este é o caso do elétron descrito por (2.44). No caso mais geral de três dimensões, o operador momentum é ∂ ∂ ∂ pop = −i ∇ = −i x̂ + ŷ + ẑ . ∂x ∂y ∂z (3.6) Outro operador importante é o da energia, dado por, Eop = i ∂ ∂t . (3.7) Para um elétron livre Eop Ψ(x, t) = i ∂ A eik0 x−iωt = ω Ψ(x, t) ∂t . (3.8) Logo, a função de onda de um elétron livre também é uma autofunção do operador energia, com autovalor E = ω , (3.9) o que também está em acordo com a teoria de Broglie. A partir destes operadores é possı́vel construir outros. Por exemplo, a energia cinética é Top = 2 2 1 2 pop . ∇.∇ = − ∇ pop = − 2m 2m 2m (3.10) onde m é a massa da partı́cula e, em coordenadas cartesianas, ∇2 = ∂2 ∂2 ∂2 + + ∂x2 ∂y 2 ∂z 2 (3.11) Cap. 3 Mecânica Quântica: O Elétron no Átomo 59 é o operador Laplaciano. No caso particular de uma dimensão Top = − 2 ∂ 2 2m ∂x2 (3.12) A Tabela abaixo apresenta os operadores quânticos correspondentes a algumas grandezas clássicas importantes. Grandeza Clássica 3.1.3 Operador Quântico x x r r px −i∂/∂x p −i∇ E i∂/∂t T L −(2 /2m)∇2 −ir × ∇ Valor Esperado de uma Grandeza Como foi dito anteriormente, quando um operador atua numa função de onda, em geral o valor da grandeza associada não aparece imediatamente. Neste caso, o valor da grandeza não pode ser determinado com precisão, ele tem uma incerteza. Podemos, no entanto, calcular o valor mais provável, ou seja, seu valor médio no sentido estatı́stico, chamado valor esperado. Sendo a função normalizada, ∞ Ψ∗ Ψ dxdydz = 1 , (3.13) −∞ o valor esperado < Q > de uma grandeza associada a um operador Qop é dado por, ∞ < Q >= −∞ Ψ∗ Qop Ψ dxdydz . (3.14) É comum também representar o valor esperado de um operador por Q. Materiais e Dispositivos Eletrônicos 60 3.1.4 A Equação de Schroedinger A evolução da função de onda de uma partı́cula em um sistema fı́sico é determinada por uma equação diferencial proposta por Schroedinger. Como foi dito anteriormente, esta equação não pode ser deduzida. É preciso aceitá-la, utilizá-la em várias aplicações, até que ela se torne familiar. A equação de Schroedinger exprime que a energia total de uma partı́cula, em termos de operadores atuando sobre a função de onda, é a soma da energia cinética com a potencial. Ela pode ser escrita da seguinte forma, (Top + Vop )Ψ = Eop Ψ . (3.15) Utilizando (3.7) e (3.10) obtemos − ∂Ψ(r, t) 2 2 ∇ Ψ(r, t) + Vop Ψ(r, t) = i 2m ∂t , (3.16) onde o operador Vop representa o potencial de interação a que a partı́cula está sujeita numa dada situação fı́sica, variando, evidentemente, de um problema para outro. Se o movimento da partı́cula está restrito à coordenada x, a Equação de Schroedinger se reduz à − 2 ∂ 2 Ψ ∂Ψ + V Ψ = i 2 2m ∂x ∂t . (3.17) De agora em diante vamos deixar de usar o ı́ndice “op” no operador para simplificar a notação. A Eq.(3.16) é uma equação diferencial de derivadas parciais que tem, para cada potencial V , uma infinidade de soluções. As soluções para cada problema são limitadas pelas condições de contorno que Ψ e ∂Ψ/∂x devem obedecer, bem como pela condição de normalização (3.2) que “amarra” as amplitudes das funções de onda. A Eq. (3.16) tem outra caracterı́stica importante, ela é uma equação diferencial linear, pois os operadores e as funções são elevados à potência um. Uma propriedade importante das equações lineares é que a superposição de duas ou mais de suas soluções, também, é sua solução (ver o Problema 3.1). 3.2 A Equação de Schroedinger Independente do Tempo Quando o potencial V não varia no tempo, o primeiro passo para resolver (3.16) é fazer uma separação de variáveis. Esta é uma técnica comum para Cap. 3 Mecânica Quântica: O Elétron no Átomo 61 resolver equações de derivadas parciais. Se V não é função de t, é possı́vel encontrar para Ψ(r, t) uma solução do tipo Ψ(r, t) = ψ(r)φ(t) , (3.18) onde ψ(r) e φ(t) são funções apenas das variáveis r e t respectivamente. Substituindo (3.18) em (3.16) obtemos: − 2 2 ∂φ(t) ∇ ψ(r) φ(t) + V (r)ψ(r)φ(t) = i ψ(r) 2m ∂t . (3.19) Dividindo os dois membros pelo produto ψ(r)φ(t) vem 1 1 2 2 ∂φ(t) ∇ ψ(r) + V (r)ψ(r = − i ψ(r) 2m φ(t) ∂t . (3.20) Veja que o lado direito de (3.20) não depende de r, enquanto que o lado esquerdo não depende de t. Em conseqüência, o valor comum dos dois lados não pode depender de r ou de t, devendo então ser uma constante, que vamos chamar de E. A equação obtida igualando o lado direito de (3.20) a E é, E dφ(t) = −i φ (t) dt . (3.21) Note que substituı́mos o sı́mbolo da derivada parcial pelo da derivada total, pois φ(t) só é função de t. A solução de (3.21) é E . (3.22) φ(t) = exp −i t Vemos que φ(t) é uma função oscilante no tempo com freqüência angular ω = E/. Assim sendo, podemos associar a constante E introduzida na separação de variáveis com a energia do estado cuja função de onda é solução da Eq.(3.16). A equação obtida igualando o lado esquerdo de (3.20) a E é uma equação diferencial com variáveis do espaço: − 2 2 ∇ ψ(r) + V (r) ψ(r) = E ψ(r) 2m . (3.23) 62 Materiais e Dispositivos Eletrônicos Ela é conhecida como a Equação de Schroedinger independente do tempo. O operador energia total também é chamado o Hamiltoniano do sistema, o que permite escrever (3.23) na forma, H ψ(r) = E ψ(r) onde H=− 2 2 ∇ + V (r) 2m , (3.24) . (3.25) A Eq.(3.24) é uma equação de autovalores. Sua solução dá a parte espacial das autofunções, bem como os autovalores de energia correspondentes. A solução completa de (3.16) fica então E Ψ(r, t) = ψ(r) exp −i t , (3.26) onde ψ(r) representa a autofunção com energia E. Veja que a densidade de probabilidade de encontrar a partı́cula com função de onda (3.26) na posição r, (3.27) P (r, t) = Ψ∗ (r, t)Ψ(r, t) = |ψ(r)|2 , é independente do tempo. Isto significa que se uma partı́cula tem num certo instante uma função de onda dada por uma autofunção do tipo (2.44), ela permanece indefinidamente com a mesma função. Dizemos que a partı́cula nesta situação permanece num estado estacionário. Vamos agora utilizar a equação de Schroedinger em algumas aplicações simples. 3.3 Aplicações Simples da Mecânica Quântica 3.3.1 Elétron Livre O exemplo mais simples de aplicação da equação de Schroedinger é o de um potencial uniforme, V (r) = constante. Classicamente, uma partı́cula nesse potencial é sujeita a uma força F = −∇V = 0. Portanto, ela é uma partı́cula livre e move-se com velocidade constante. Como o valor do potencial constante não influi no movimento, tomamos V = 0. Supondo que o elétron se desloca Cap. 3 Mecânica Quântica: O Elétron no Átomo 63 na direção x, a Eq.(3.23) fica − 2 d2 ψ(x) = E ψ(x) 2m dx2 . (3.28) A solução desta equação pode ser escrita na forma ψ(x) = A eikx + B e−ikx . (3.29) Substituindo (3.29) em (3.28) vemos que E= 2 k 2 2m . (3.30) Como φ(t) = exp(−iEt/), a primeira parcela de (3.29) representa uma onda plana propagando na direção de x positivo: Ψ(x, t) = A eikx−iωt . (3.31) Esta é a função de onda de uma partı́cula livre, movendo-se com velocidade constante na direção +x, como tinha sido antecipado na Eq.(2.44). Da mesma forma, a função de onda correspondente à segunda parcela de (3.29) corresponde a um elétron movendo-se no sentido −x. Em ambos os casos, o momentum p = k é relacionado com a energia pela expressão (3.30), que pode ser escrita na forma, p2 . (3.32) E= 2m Como esperado, a energia é exatamente a energia cinética, pois trata-se de uma partı́cula livre. Veja que neste problema não há qualquer condição que restrinja o valor de E, que pode variar continuamente entre 0 e ∞. Note que da Eq. (3.30) pode-se obter a relação de dispersão ω(k) do elétron livre. Usando E = ω obtemos 2 k , (3.33) ω(k) = 2m que é a função parabólica ilustrada na Fig.3.1. A partı́cula com a função de onda (3.31) comporta-se como uma onda que preenche todo o espaço, tendo comprimento de onda λ= 2π k , (3.34) 64 Materiais e Dispositivos Eletrônicos Figura 3.1: Relação de dispersão parabólica de um elétron livre. onde √ k= 2mE . (3.35) Todos os resultados acima estão em completo acordo com a teoria de de Broglie estudada no Capı́tulo 2. Veja que se a função de onda (3.31) for normalizada através da Eq.(3.2) obtemos A → 0. Portanto, não faz sentido normalizar (3.31) em todo o espaço. Na verdade, não há muito sentido fı́sico em considerar uma partı́cula em todo o espaço. Entretanto, ondas planas do tipo (3.31) podem ser usadas matematicamente para construir um pacote de onda como o da Fig.2.14(a), que representa uma partı́cula confinada em uma região do espaço. Ora, sabemos que um “pacote“ como este propaga com a velocidade de grupo ∂ω vg = . (3.36) ∂k k0 Utilizando a relação de dispersão (3.33) obtemos a velocidade de uma partı́cula representada por este pacote k0 m . (3.37) p = m vpart = k0 , (3.38) vpart = vg = O momentum desta partı́cula é então que está em acordo com o conceito introduzido por de Broglie. Cap. 3 Mecânica Quântica: O Elétron no Átomo 3.3.2 65 Elétron num Poço de Potencial Infinito Vamos obter os estados estacionários de uma partı́cula de massa m que se movimenta livremente no interior de um poço de potencial com paredes infinitamente altas, em uma dimensão. Este poço, mostrado na Fig.3.2, representa aproximadamente a situação de um elétron livre confinado ao interior de um sólido. O fenômeno que impede sua saı́da pelas superfı́cies do sólido é a atração eletrostática exercida pelos átomos ou ı́ons do sólido. Na verdade, como sabemos, este poço não é infinito, pois o elétron pode ser arrancado do sólido, como no efeito fotoelétrico. As autofunções da equação de Schroedinger (3.24) para este problema são determinadas da mesma forma que para um potencial uniforme, sendo neste caso: V (x) = 0 ∞ 0<x<L x≤0 ; x≥L (3.39) No intervalo 0 < x < L a equação é idêntica a do elétron livre, e portanto sua solução é igual a (3.29), ψ(x) = A eikx + B e−ikx (0 < x < L) , (3.40) sendo E = (k)2 /2m. Em x ≤ 0 e x ≥ L, ψ = 0 pois o potencial infinitamente grande não permite que o elétron esteja nesta região. Como o momentum do elétron, dado por −idψ/dx, não pode ser infinito, ψ deve ser uma função contı́nua em x, e portanto ψ(x = 0) = ψ(x = L) = 0 . (3.41) Usando a condição de contorno acima em (3.40) obtemos B = −A. As auto- Figura 3.2: Poço de potencial com paredes infinitamente altas. 66 Materiais e Dispositivos Eletrônicos funções do poço de potencial infinito são então ψn (x) = An senkn x . A condição ψ(L) = 0 imposta a (3.42) restringe os valores de kn a π kn = n (n = 1, 2, 3, 4, ...) . L (3.42) (3.43) Ao contrário do elétron livre, o elétron no poço de potencial infinito não pode ter um valor qualquer de energia. As energias possı́veis são dadas por E = (k)2 /2m, ou seja, E só pode assumir valores discretos, En = 2 π 2 2 n 2mL2 , (3.44) onde n é chamado um número quântico, pois corresponde a valores quantizados da energia. Os En são chamados autovalores e os ψn são as autofunções da equação para o poço infinito. A Fig.3.3 mostra uma representação das funções de onda e das energias correspondentes, para os quatro primeiros valores do número quântico n. Figura 3.3: Funções de onda e correspondentes energias de uma partı́cula num poço de potencial infinito, para os quatro primeiros valores do número quântico n. Cap. 3 Mecânica Quântica: O Elétron no Átomo 67 Alguns resultados deste problema simples são, pelo menos qualitativamente, de validade bastante geral para poços de potencial, independentemente de sua forma detalhada. São eles: • Partı́culas cujo movimento é confinado a uma região limitada do espaço só podem ocupar estados (estacionários) de energia discreta, ou seja, têm energia quantizada. Matematicamente isto decorre das condições de contorno impostas às funções de onda nos limites da região. Esta é a mesma razão pela qual uma corda presa nas extremidades só pode vibrar em certas freqüências discretas. O estado de menor energia é chamado estado fundamental. • A função de onda de um estado confinado a uma região do espaço tem um certo número de zeros, que é tanto maior quanto maior for sua energia. Exemplo 3.1: Uma partı́cula está no estado fundamental num poço de potencial infinito de largura L. Calcule: a) Os valores esperados da posição x e do momentum px ; b) Os desvios médios quadráticos de x e de px . a) A função de onda da partı́cula no estado fundamental é dada por (3.42) e (3.43) com n = 1, ψ = A sen (πx/L). Para normalizar a função de onda usamos a condição (3.1), L 0 A2 sen2 π L L 0 x dx = A2 sen2 π L x dx = A2 L π π sen2 π πx 0 L x d L =1. Como sen2 α = (1 − cos 2α)/2, o integrando pode ser dividido em duas parcelas. Fazendo α ≡ (πx/L), é fácil ver que a integral da primeira parcela é π/2 e a da segunda é nula. Então, 2L π A = 1 , logo A = π 2 O valor esperado de x é ∞ x= −∞ ψ ∗ x ψ dx = L 0 A2 x sen2 π L x dx = 2 . L L A2 0 2 x 1 − cos 2π x L dx Para calcular esta expressão usamos a seguinte integral que pode ser resolvida por partes, x cos ax dx = 1 x cos(ax) + sen(ax) . a2 a Aplicando este resultado na integral definida e usando a = 2π/L, verificamos que a segunda parcela da integral na expressão de x é nula. Assim, x= A2 2 L 0 x dx = L A2 L2 = 2 2 2 Materiais e Dispositivos Eletrônicos 68 Este resultado era, de certa forma, esperado, pois uma partı́cula que se movimenta livremente entre x = 0 e x = L tem uma posição média em x = L/2. O valor esperado do momentum é, ∞ px ψ ∗ (−i ) ∂ψ dx = −i A2 ∂x A2 π 2 L sen = −∞ = −i L sen L 0 π π L 0 x L cos π L x dx 2π x dx = 0 L Este resultado também é natural, pois uma partı́cula que vai e volta dentro de uma caixa, com energia constante, tem velocidade média nula. b) O desvio médio quadrático de x é definido por ∆x2 =< x2 − x2 > Então ∆x2 = = A2 L 0 L A2 2 0 x2 − L2 4 x2 − L2 4 sen2 π L x dx 1 − cos 2π x dx L Para resolver esta expressão, usamos o resultado, 2x cos(ax) a2 x2 − 2 + sen(ax) . 2 a a3 x2 cos(ax) dx = Após algumas contas simples obtemos, finalmente, L 2π ∆x2 = 2 π2 − 6 3 = 0, 033 L2 O desvio médio quadrático do momentum pode ser calculado de maneira semelhante. O resultado é, ∆p2x = π L 2 É interessante notar que as incertezas na determinação da posição e do momentum podem ser consideradas como as raı́zes quadradas dos desvios médios quadráticos. Assim, ∆x = ∆px = ∆x2 ∆p2x 1/2 = 0, 033L = 0, 18 L 1/2 π = L . O produto dessas duas grandezas dá, ∆x ∆px = 0, 18 π = 0, 57 . Este resultado é consistente com o princı́pio da incerteza, que estabelece como limite mı́nimo para o produto das incertezas o valor de /2. Cap. 3 Mecânica Quântica: O Elétron no Átomo 3.3.3 69 Barreira de Potencial-Efeito Túnel Considere um elétron livre, “propagando” na direção +x, que encontra uma barreira de potencial de altura V0 maior do que sua energia E, como ilustrado na Fig.3.4. Se a região 1 é semi-infinita a energia do elétron não é quantizada. Desejamos saber o que acontece com o elétron ao encontrar a barreira de potencial maior do que sua energia. Na região 1, como vimos anteriormente, a função de onda do elétron é dada por ψ1 (x) = A eikx + B e−ikx , (3.45) sendo k = (2mE)1/2 /. Na região 2 a equação de Schroedinger leva a d2 ψ 2m = 2 (V0 − E) ψ 2 dx . (3.46) Sendo (V0 − E) > 0, a solução de (3.46) é ψ2 (x) = C eγx + D e−γx onde γ= 2m(V0 − E)/ , . (3.47) (3.48) Veja que na Eq.(3.47) a primeira parcela é uma função que cresce exponencialmente com x enquanto a segunda decai exponencialmente. Isto é uma conseqüência do fato de a energia do elétron ser menor que a altura da barreira Figura 3.4: Barreira de potencial. Materiais e Dispositivos Eletrônicos 70 de potencial. No caso de E > V0 , o expoente γ em (3.48) é imaginário, e as duas parcelas em (3.47) representam ondas propagantes (Problema 3.6). Para determinar as quatro constantes A, B, C e D que aparecem em (3.45) e (3.47) é preciso usar as condições de contorno para a função de onda. Para x → ∞, a Eq.(3.47) mostra que ψ2 → ∞ se C = 0. Como a função de onda não pode divergir, a constante C deve ser nula. Em x = 0 as funções de onda nas duas regiões devem ser iguais, pois ψ é contı́nua em todo o espaço. Fazendo C = 0, em (3.47), obtemos com ψ1 (0) = ψ2 (0), A+B =D . (3.49) Em x = 0 a derivada de ψ em relação a x também deve ser contı́nua, dψ2 dψ1 = , (3.50) dx 0 dx 0 porque se isto não fosse verdadeiro, a energia cinética, que é proporcional a d2 ψ/dx2 seria infinita em x = 0. Usando (3.45) e (3.47) em (3.50), obtemos ik(A − B) = −γD . (3.51) Com as duas condições (3.49) e (3.51) podemos determinar as amplitudes da onda refletida B e da onda transmitida D em função da amplitude da onda incidente A: D= 2k A k + iγ , B= (k − iγ) A k + iγ . (3.52) Veja que na região 2 a função de onda do elétron é ψ2 (x) = D e−γx , (3.53) o que mostra que existe uma certa probabilidade do elétron ser encontrado na região 2. Este é um efeito puramente quântico, pois classicamente uma partı́cula seria totalmente refletida por uma barreira do potencial maior do que sua energia. Como ilustrado na Fig.3.5, ψ2 (x) decai exponencialmente com x e podemos ter ψ2 (x = a) > 0. Assim, se a barreira tiver uma espessura finita a, a probabilidade do elétron atravessá-la será, aproximadamente, |ψ2 (a)|2 = e−2γa . (3.54) Cap. 3 Mecânica Quântica: O Elétron no Átomo 71 Figura 3.5: Comportamento espacial da função de onda para uma partı́cula sujeita a uma barreira de potencial, como na Fig.3.4. Este fenômeno quântico é chamado efeito túnel, pois classicamente o elétron só atravessaria a barreira de potencial se houvesse um túnel sob ela. Note que o resultado (3.54) é aproximado, porque se tivéssemos considerado a largura da barreira finita desde o inı́cio não poderı́amos ter feito C = 0. Entretanto, se exp(−2γa) é suficientemente pequeno, a amplitude C da “onda refletida” em x = a é desprezı́vel e a expressão (3.54) é uma boa aproximação para o resultado exato. Exemplo 3.2: Outra aplicação importante da mecânica quântica é a de uma partı́cula de massa m submetida a uma interação com um potencial de oscilador harmônico simples do tipo, V (x) = 1 1 kx2 = m ω02 x2 , 2 2 2 onde ω0 = k/m é a freqüência natural do oscilador. Verifique que as funções ψ0 (x) = A0 e−ax 2 e ψ1 (x) = A1 x e−ax são autofunções da equação de Schroedinger para o oscilador harmônico e determine suas energias. A equação de Schroedinger para o oscilador harmônico tem a forma, − 2 1 d2 ψ + m ω02 x2 ψ = E ψ . 2m dx2 2 Para o estado fundamental temos as seguintes derivadas de ψ0 , dψ0 dx d2 ψ0 dx2 2 = −2ax A0 e−ax , = −2a A0 e−ax + 4a2 x2 A0 e−ax . 2 2 Materiais e Dispositivos Eletrônicos 72 Substituindo na equação vem, − 2 2m 2 −2a A0 e−ax + 4a2 x2 A0 e−ax 2 + 2 2 1 m ω02 x2 A0 e−ax = E A0 e−ax . 2 2 Cancelando o fator comum A0 e−ax obtemos, 2 m a−2 2 m a2 x2 + 1 m ω02 x2 = E . 2 Para que esta equação seja satisfeita para qualquer valor de x, é necessário que o termo em x2 seja nulo. Isto permite obter o valor da constante a, m ω0 . a= 2 Substituindo esta expressão na equação anterior vem, 2 E= 1 a = ω0 . m 2 Esta é a energia do estado fundamental. O procedimento para obter a energia do estado ψ1 é semelhante. Calculamos a derivada d2 ψ1 /dx2 , substituı́mos na equação de Schroedinger e cancelamos o fator comum, obtendo, − 2 2m −2ax − 4ax + 4a2 x3 + 1 m ω02 x3 = xE . 2 Neste caso é preciso anular separadamente todos os termos com potências iguais de x. O termo em x3 leva ao mesmo valor de a obtido para o estado fundamental, enquanto o termo em x dá, 2 E=3 a 3 = m 2 ω0 . Esta é a energia do primeiro estado excitado, cuja função de onda é precisamente ψ1 . A solução geral da equação de Schroedinger para o oscilador harmônico, que está apresentada em detalhe nos livros de mecânica quântica, é dada por funções do tipo, 2 ψn (x) = c0 + c1 x + c2 x2 + · · · cn xn e−ax , onde a função entre parênteses é conhecida como polinômio de Hermite. A demonstração de que esta expressão é autofunção da equação de Schroedinger para o oscilador harmônico é feita de maneira análoga ao que fizemos para n = 0 e n = 1, que correspondem aos dois estados de menor energia. A solução geral mostra que a energia do estado excitado de ordem n é dada por, En = 1 n+ 2 ω0 . Este é um resultado importante que mostra que os nı́veis de energia dos estados do oscilador harmônico estão igualmente espaçados, com uma diferença entre dois nı́veis consecutivos de ω0 . Cap. 3 Mecânica Quântica: O Elétron no Átomo 3.4 73 Elétron no Átomo de Hidrogênio Uma das aplicações simples mais importantes da mecânica quântica é no átomo de hidrogênio. Foi este um dos primeiros problemas que Schroedinger tratou com sua equação. A concordância que ele obteve com os autovalores de energia do modelo de Bohr constituiu o primeiro teste importante da validade de sua teoria. O átomo de hidrogênio é o mais simples de todos, pois tem apenas um elétron de carga −e em torno de um próton de carga +e. O potencial que atua sobre o elétron é devido à energia de interação eletrostática: V (r) = − e2 1 4π0 r , (3.55) onde r é a distância entre o elétron e o próton. Apesar da simplicidade deste potencial, a solução da equação de Schroedinger é razoavelmente complicada por causa de sua natureza tridimensional. Para resolvê-la mais facilmente devemos usar um sistema de coordenadas esféricas, ilustrado na Fig.3.6, que utiliza as variáveis r, θ e ϕ para caracterizar a posição do elétron em relação ao núcleo. Em coordenadas esféricas o operador Laplaciano, que aparece na Equação de Schroedinger, tem a seguinte forma 1 ∂ 1 1 ∂2 ∂ ∂ 2 2 ∂ ∇ = 2 + 2 r + 2 2 senθ . (3.56) 2 r ∂r ∂r r sen θ ∂ϕ r senθ ∂θ ∂θ Para resolver a equação de Schroedinger (3.24) com o potencial V (r) dado por (3.55) e o Laplaciano (3.56), vamos supor que a massa do próton é Figura 3.6: Coordenadas esféricas (r, θ, ϕ) de ponto P com coordenadas cartezianas (x, y, z). 74 Materiais e Dispositivos Eletrônicos infinitamente maior que a do elétron. Isto corresponde a dizer que o elétron se movimenta em torno do núcleo sem que este se desloque, o que reduz o problema de duas partı́culas ao de apenas uma. Na Eq. (3.24) podemos então desprezar a energia cinética do próton, o que não seria possı́vel se sua massa não fosse muito grande. Como o potencial (3.55) depende apenas da variável r, é possı́vel encontrar soluções para a equação de Schroedinger da forma Ψ(r, θ, ϕ) = R(r) Θ(θ) Φ(ϕ) . (3.57) Esta solução permite separar a equação diferencial parcial com três variáveis em três equações diferenciais ordinárias nas variáveis r, θ e ϕ, semelhantemente ao que foi feito para tratar a Eq.(3.16). Substituindo a solução (3.57) na Eq. (3.24) com o Laplaciano (3.56) obtemos: ∂ 2 RΘΦ 2 1 ∂ 1 2 ∂RΘΦ − + r + 2m r 2 ∂r ∂r r 2 sen2 θ ∂ϕ2 ∂ 1 ∂RΘΦ senθ + V (r) RΘΦ = E RΘΦ . r 2 senθ ∂θ ∂θ Operando as derivadas parciais segue que, RΘ d2 Φ dΘ RΦ 2 ΘΦ d 2 dR r + 2 2 senθ + 2 − 2 2 2m r dr dr r sen θ dϕ r senθ dθ +V (r) RΘΦ = E RΘΦ . Nesta equação substituı́mos o sı́mbolo da derivada parcial pelo da derivada total porque as funções dependem de apenas uma variável. Multiplicando todos os termos por −2mr 2 sen2 θ/(RΘΦ 2 ) e rearrumando as parcelas vem 1 d2 Φ sen2 θ d senθ d dΘ 2m 2 dR =− r − senθ − 2 r 2 sen2 θ[E − V (r)] . 2 Φ dϕ R dr dr Θ dθ dθ (3.58) Como o lado esquerdo desta equação não depende de r ou θ, enquanto que o direito não depende de ϕ, seu valor comum deve ser uma constante, que vamos designar por −m2 . Assim obtemos duas equações d2 Φ = −m2 Φ dϕ2 , (3.59) Cap. 3 Mecânica Quântica: O Elétron no Átomo 1 d − R dr r 2 dR d 1 − Θsenθ dθ dr dΘ senθ dθ − 75 m2 2m 2 r [E − V (r)] = − 2 sen2 θ . (3.60) A Eq.(3.59) pode ser resolvida por uma função de ϕ, enquanto que a Eq.(3.60) pode ser reescrita na forma 1 d R dr dR r2 dr 2mr 2 1 d m2 + − [E − V (r)] = 2 2 sen θ Θsenθ dθ senθ dΘ dθ , que também pode ser separada nas variáveis r e θ. Usando como constante de separação ( + 1), obtemos as equações nas variáveis r e θ: 1 d dΘ m2 Θ − senθ + 2 = ( + 1)Θ (3.61) senθ dθ dθ sen θ 1 d r 2 dr dR r2 dr + R 2m [E − V (r)]R = ( + 1) 2 2 r . (3.62) As equações (3.59), (3.61) e (3.62) são agora independentes uma das outras e podem ser resolvidas separadamente. A solução completa para a função de onda do elétron é o produto das três soluções daquelas equações. Vamos considerar inicialmente a equação (3.59) para Φ(ϕ). É fácil ver que sua solução é (3.63) Φ(ϕ) = eim ϕ . Matematicamente esta função é solução da equação (3.59) para qualquer valor de m . Entretanto, fisicamente a função de onda do elétron deve ter para ϕ = 0 o mesmo valor que em ϕ = 2π, 4π, 6π, etc. Isto requer que m tenha apenas os seguintes valores (3.64) |m | = 0, 1, 2, 3, ... ou seja, m deve ser um inteiro, positivo ou negativo; ele é um número quântico. As soluções das Eq.(3.61) e (3.62) são bem mais complexas. Entretanto elas são equações bem conhecidas, estudadas exaustivamente em disciplinas de cálculo avançado. As soluções de (3.61) são os chamados polinômios 76 Materiais e Dispositivos Eletrônicos de Legendre associados, e são finitas somente se for um número inteiro, positivo, limitado por (3.65) |m | ≤ . As soluções da equação radial (3.62) são os polinômios de Laguerre, que são finitas se a constante E for dada por E=− me4 22 (4π0 )2 n2 , (3.66) onde n também é um número inteiro, que satisfaz a relação 0≤ ≤n−1 . (3.67) A constante E da Eq.(3.66) é o autovalor de energia da função de onda no átomo de hidrogênio. Este resultado significa que a energia do elétron no átomo de hidrogênio é quantizada (discreta), semelhantemente ao que ocorre no poço de potencial infinito estudado na seção 3.3. Substituindo as constantes em (3.66) podemos exprimir a energia em eV, E=− 13, 6 eV n2 . (3.68) A Fig.3.7 ilustra os nı́veis de energia do poço de potencial infinito e do poço Coulombiano do elétron no átomo (V = −A/r). Note que em ambos os casos o menor valor de energia não é o do potencial no fundo do poço, mas sim um valor acima deste chamado energia de ponto-zero, ou energia do estado fundamental. A solução geral da Equação de Schroedinger para o elétron no átomo de hidrogênio é dada pelo produto das três funções nas variáveis r, θ e ϕ, soluções de (3.59), (3.61) e (3.62), que pode ser escrita na forma Ψnm (r, θ, ϕ) = Rn (r)Θm (θ)Φm (ϕ) , (3.69) onde Φm (ϕ) = eim ϕ Θm (θ) = sen|m | θ × (polinômio em cos θ) Rn (r) = e−Cr/n r × (polinômio em r) . Cap. 3 Mecânica Quântica: O Elétron no Átomo 77 Figura 3.7: (a) Representação de um “poço” de potencial ao qual um elétron está submetido pelo núcleo de um átomo. (b) Diagrama de um modelo de caixa retangular de potencial que se aproxima, grosseiramente, do potencial visto pelo elétron em torno de um núcleo. sendo C uma constante. Embora os autovalores de energia do elétron no átomo com o potencial Coulombiano só dependam do número quântico n, as funções de onda dependem também de e m . O fato de haver três números quânticos, em vez de um apenas como no poço de potencial estudado na seção 3.3, é uma conseqüência da equação de Schroedinger para o átomo conter três variáveis independentes. Agrupando as condições (3.64), (3.65) e (3.67), podemos escrever as relações entre os números quânticos na forma no¯ quântico principal: no¯ quântico azimutal: no¯ quântico magnético: n = 1, 2, 3, ... = 0, 1, 2, ...n − 1 m = −, − + 1, ...0, ... − 1, . é chamado número quântico azimutal porque ele determina a variação angular de ψnm . m é chamado número quântico magnético porque define a separação de energia entre os nı́veis quando o átomo é colocado em um campo magnético. A Tabela 3.1 mostra as autofunções normalizadas correspondentes aos três primeiros valores de n para um átomo com núcleo de carga +Ze (Z é Materiais e Dispositivos Eletrônicos 78 Nos ¯ quânticos n Autofunções m 1 0 0 ψ100 = √1π 2 0 0 ψ200 = 4√12π Z a0 2 1 0 ψ210 = 4√12π Z a0 2 1 ±1 ψ21±1 = 8√1 π Z a0 3 0 0 ψ300 = 81√1 3π Z a0 3 1 0 ψ310 = 81√2π 3 1 ±1 ψ31±1 = 811√π Z a0 3 2 0 ψ320 = 81√1 6π Z a0 3 2 ±1 ψ32±1 = 811√π Z a0 3 2 ±2 ψ32±2 = 1621√π Z a0 Z a0 √ 3/2 Z a0 e−Zr/a0 3/2 3/2 −Zr/2a0 2 − Zr a0 e Zr −Zr/2a0 cos θ a0 e 3/2 Zr −Zr/2a0 senθ e±iϕ a0 e 3/2 2 2 Z r 27 − 18 Zr a0 + 2 a2 0 3/2 6 − Zr a0 3/2 3/2 3/2 6 − Zr a0 Zr −Zr/3a0 a0 e e−Zr/3a0 cos θ Zr −Zr/3a0 senθ e±iϕ a0 e Z 2 r 2 −Zr/3a0 e (3 cos2 θ − 1) a20 Z 2 r 2 −Zr/3a0 e senθ cos θ e±iϕ a20 3/2 Z 2 r 2 −Zr/3a0 e sen2 θ e±2iϕ a20 Tabela 3.1: Autofunções de um átomo com Z prótons no núcleo e um elétron para os primeiros valores de n. a0 = 4π 0 2 /me2 é o raio de Bohr. o número atômico) e apenas um elétron. A função de onda Ψ100 corresponde ao estado de menor energia, chamado estado fundamental. Veja que as funções de onda Ψ200 , Ψ210 e Ψ21±1 são bastante diferentes umas das outras mas têm a mesma auto-energia, pois todas têm n = 2. Os estados com diferentes funções de onda que têm a mesma energia são chamados degenerados. É comum encontrar soluções da equação de Schroedinger que são estados degenerados. Cap. 3 Mecânica Quântica: O Elétron no Átomo 79 Para entender o significado das autofunções do átomo de hidrogênio, vamos calcular algumas grandezas a elas associadas. A primeira é a função densidade de probabilidade Ψ∗ Ψ. Como não podemos fazer seu gráfico em função das três coordenadas simultaneamente, vamos considerar cada uma delas separadamente. Inicialmente consideramos a dependência em r. Como a probabilidade de encontrar o elétron no volume elementar d3 r é Ψ∗ Ψ d3 r, não faz sentido estudar o comportamento somente de Ψ∗ Ψ, pois em coordenadas esféricas d3 r = r 2 senθdrdθdϕ também depende de r. Consideramos então a densidade de probabilidade radial P (r), definida de modo que P (r)dr é a probabilidade de encontrar o elétron com a coordenada radial entre r e r + dr. Para a função de onda Ψnm , esta densidade é dada por (Problema 3.16) ∗ (r)Rn (r) Pn (r) = r 2 Rn , (3.70) onde o fator r 2 é devido ao volume da região entre as esferas de raio r e r + dr. Veja que o número quântico m não influencia na densidade radial pois a função exp(im ϕ) desaparece no produto com o complexo conjugado. A Fig.3.8 representa a densidade de probabilidade radial das autofunções do átomo de hidrogênio para n = 1, 2 e 3, através de grandezas adimensionais nos dois eixos. Esta figura mostra que os elétrons não são partı́culas com órbitas bem definidas, como previsto no modelo de Bohr. Na verdade cada elétron ocupa a região em torno do núcleo, com uma distribuição no espaço tal que a probabilidade de encontrá-lo é máxima num certo raio, cujo valor aumenta quando n cresce. Considere o estado fundamental (n=1), isto é, o estado de mı́nima energia. Vamos calcular a posição de máximo da densidade de probabilidade. Para isto substituı́mos a autofunção Ψ100 da Tabela 3.1 com Z = 1 e ignorando a constante de normalização em (3.70), obtemos: P10 (r) = e−2r/a0 r 2 , que é proporcional à função mostrada na Fig.3.8. O máximo desta função é dado por r dP10 (r) −2r/a0 = 2r e 1− =0 . dr a0 Isto leva ao raio de máxima probabilidade de encontrar o elétron no estado de menor energia. Veja que seu valor é exatamente o raio de Bohr: r = a0 = 4π0 2 ≃ 0, 53 Å me2 . 80 Materiais e Dispositivos Eletrônicos A variação angular da densidade de probabilidade pode ser representada de várias maneiras diferentes. Uma delas é através do gráfico polar, no qual a amplitude da densidade de probabilidade de encontrar o elétron na posição (x, y, z) é representada pela distância do ponto (x, y, z) à origem. A Fig.3.9 mostra os gráficos polares correspondentes aos números quânticos = 0 e = 1. Esses gráficos dão uma idéia do que seria a “nuvem” eletrônica em cada estado. Eles mostram claramente que o elétron não é caracterizado por uma órbita no sentido clássico, mas sim por uma densidade de probabilidade Figura 3.8: Densidade de probabilidade radial para o elétron num átomo de hidrogênio para os valores de n e de indicados. Os triângulos indicam os valores médios de r [Eisberg e Resnick]. Cap. 3 Mecânica Quântica: O Elétron no Átomo 81 Figura 3.9: Representação da função |Θ(θ)Φ(ϕ)|2 , que é proporcional às densidades de probabilidade eletrônicas para = 0 e = 1. de ser encontrado em cada ponto. Entretanto, a variação da densidade com a posição sugere o nome orbital para designar as funções de onda atômicas. Como o número quântico determina a forma de variação angular do orbital, ele é muito importante e é designado por letras provenientes da interpretação dos espectros de emissão de radiação do átomo de hidrogênio. Os orbitais com = 0, 1, 2, 3, 4, ... são designados pelas letras s,p,d,f,g,... A Fig.3.10 mostra outra forma de representar as densidades eletrônicas, que leva em conta sua variação com a distância radial e a posição azimutal. Antes de encerrar esta seção é preciso mencionar dois fatos importantes relativos ao átomo de hidrogênio: primeiro é que o elétron tem, além de massa e carga, um spin. O nome spin vem do inglês e significa rotação. Classicamente o spin corresponderia a uma rotação do elétron em torno de si mesmo, analogamente ao que ocorre com o planeta Terra. Entretanto, o elétron não é propriamente uma partı́cula e não tem sentido falar em rotação em torno dele mesmo. O spin é uma entidade quântica, que surge naturalmente de uma teoria quântica relativı́stica. O spin do elétron é caracterizado por um quarto número quântico, que pode ter dois valores ms = ± 1/2 (corresponderia à rotação em um sentido em torno de um eixo, ou no sentido oposto). Como o spin resulta em um dipolo magnético, o potencial que aparece na equação de Schroedinger para o átomo de hidrogênio é na verdade mais complexo do que (3.55). Conseqüentemente sua solução é mais complexa do que vimos. 82 Materiais e Dispositivos Eletrônicos Entretanto, como o efeito do spin é relativamente pequeno, o problema pode ser tratado aproximadamente com teoria de perturbação. O principal resultado é que a energia do elétron não depende apenas do número quântico n, mas depende também do número quântico orbital . Entretanto a separação de energia de estados com mesmo n e diferentes ’s é pequena comparada com a separação de estados com n’s diferentes. A outra observação importante é sobre as transições eletrônicas. Quando o elétron é “colocado” num certo estado eletrônico caracterizado por uma autofunção da equação de Schroedinger, ele permanece nesse estado se não houver qualquer perturbação no átomo. Uma perturbação possı́vel é a da radiação eletromagnética, que contribui para a equação de Schroedinger com um potencial variável no tempo. Como veremos no Capı́tulo 8, a teoria quântica mostra Figura 3.10: Ilustrações em diferentes escalas das densidades de probabilidade eletrônicas nos vários estados do átomo de hidrogênio. O eixo dos z está colocado no plano da folha [Pohl]. Cap. 3 Mecânica Quântica: O Elétron no Átomo 83 que o elétron pode passar para um estado de maior energia pela absorção de um fóton de freqüência ν, desde que a diferença entre as energias do estado final f e do estado inicial i seja igual a energia do fóton, isto é, Ef − Ei = hν. (3.71) Esta expressão nada mais é do que a equação de conservação de energia. O elétron também pode passar de um estado de energia mais alta para outro de menor energia pela emissão de fótons com freqüência dada por ν = E/h, sendo E a diferença de energia entre os dois nı́veis. As medidas dos espectros de absorção e emissão de luz no inı́cio do Século XX foram muito importantes para mostrar que era necessária uma teoria nova para o átomo de hidrogênio. Posteriormente, a comparação com resultados experimentais foi decisiva para a aceitação da teoria quântica. Até hoje as técnicas de espectroscopia ótica são muito utilizadas para o estudo e para a identificação de átomos, moléculas e sólidos. A Fig.3.11 mostra diversas transições entre nı́veis de menor energia no átomo de hidrogênio. A teoria quântica mostra que as transições acompanhadas de emissão ou absorção de fótons só podem ocorrer quando os números quânticos orbitais dos estados inicial e final diferem de 1, ou seja, = ±1. 2 2 S 0 4d 3d F 4f 2p 1215 -6 1026 -4 4 -1 Energia(10 cm ) 2s 2 D 4p 3p 1 82 6 65 48 4s 3s -2 2 P -8 -10 1s -12 Figura 3.11: Representação de transições com absorção ou emissão de fótons entre nı́veis de energia do átomo de hidrogênio. As linhas diagonais mostram as transições possı́veis. Os comprimentos de onda correspondentes estão indicados em Angstroms. 84 Materiais e Dispositivos Eletrônicos Isto é uma regra de seleção. Somente quando dois estados têm distribuições de carga com orbitais diferindo de = ±1, o campo elétrico consegue induzir transição de dipolo elétrico entre eles. Por esta razão as linhas que indicam as transições na Fig.3.11 são diagonais. Se o campo é linearmente polarizado, outra regra de seleção é ∆m = 0. Mas se o campo é circularmente polarizado, a regra é ∆m = ±1. 3.5 Átomos de Muitos Elétrons Nos átomos com mais de um elétron o potencial V que entra na equação de Schroedinger é muito mais complicado que no átomo de hidrogênio. Isto resulta do fato de que cada elétron interage não apenas com o núcleo, mas também com os outros elétrons. Assim, o “movimento” de um elétron, e portanto sua função de onda, afeta todos os outros elétrons. É possı́vel escrever a equação de Schroedinger para o problema, mas não é possı́vel resolvê-la analiticamente. A solução só pode ser obtida aproximadamente através de cálculos numéricos em computador. Para isto existem vários métodos de aproximação, sendo o do campo médio o mais simples. O método do campo médio, proposto por D.R. Hartree, é essencialmente o seguinte: escreve-se a equação de Schroedinger para um certo elétron levando em conta a interação com o núcleo e com os outros elétrons. Porém, o potencial de interação com os outros elétrons é considerado apenas na média, sendo desprezadas as interações instantâneas. Para resolver o problema para Z elétrons supõe-se inicialmente que cada elétron tenha uma certa função de onda tentativa. Com as densidades eletrônicas correspondentes calcula-se o campo médio ao qual um certo elétron está submetido devido aos outros Z − 1 elétrons. Resolvendo a equação para este elétron obtém-se uma função mais aproximada da verdadeira: o procedimento é então repetido para os outros Z − 1 elétrons, ao fim do qual todas funções de onda são melhores do que as originais. Este processo é repetido várias vezes, até que as diferenças entre as funções obtidas em ciclos sucessivos sejam desprezı́veis. No final obtemos um conjunto auto-consistente de orbitais atômicos, bem como as energias eletrônicas correspondentes. Uma vez obtidos os orbitais atômicos, a pergunta seguinte é: como os Z elétrons do átomo se distribuem nesses orbitais, ou seja, nos nı́veis de energia? A distribuição é baseada em dois princı́pios fundamentais: o primeiro é o que determina que os elétrons devem ocupar os estados de mais baixa energia Cap. 3 Mecânica Quântica: O Elétron no Átomo 85 possı́vel. Entretanto, eles não podem ir todos para o estado fundamental, devido ao princı́pio de exclusão de Pauli. De acordo com este princı́pio, dois elétrons não podem ocupar exatamente o mesmo estado. Como cada elétron pode ter spin ms = ±1/2, a distribuição no átomo é feita preenchendose os estados de menor energia, a partir do estado fundamental, sucessivamente com dois elétrons cada. Assim, na configuração de menor energia, um átomo de número atômico Z tem dois elétrons com números quânticos n = 1, = 0, m = 0, dois com n = 2, = 0, m = 0, dois com n = 2, = 1, m = ±1, e assim sucessivamente. Veja que um orbital pode ter m = 0, ±1, ... ± , e portanto comporta 2(2 + 1) elétrons. Para facilitar a notação, os orbitais são representados por letras correspondentes aos valores do número quântico . Para = 0, 1, 2, 3, 4... dá-se o nome de orbital s,p,d,f,g,... respectivamente. Da mesma forma, ao número quântico n atribui-se uma letra que representa a “camada”, sendo as letras K,L,M,N,O,... associadas respectivamente a n = 1, 2, 3, 4, 5, .... O elemento cujo átomo tem um elétron é o hidrogênio. No estado fundamental este elétron tem orbital representado por 1s. No elemento com dois elétrons, o hélio, ambos os elétrons têm orbital 1s. Seu estado fundamental é representado por 1s2 . Como na camada K, de orbital 1s, somente cabem dois elétrons, o átomo de hélio é formado por uma “camada fechada”. Este fato confere a ele uma grande estabilidade quı́mica, e por isto é chamado de gás nobre. O átomo seguinte é o lı́tio, com três elétrons e portanto representado pela notação 1s2 2s. Assim, os elétrons vão preenchendo sucessivamente estados orbitais e conferindo aos elementos caracterı́sticas quı́micas próprias. É importante notar, entretanto, que vários elementos têm propriedades quı́micas semelhantes, pois há uma repetição periódica na formação das camadas. Por exemplo, o átomo de argônio tem dez elétrons, com a configuração 1s2 2s2 2p6 . Portanto ele tem duas camadas (K e L) fechadas e tem propriedades semelhantes as do hélio. O sódio, com onze elétrons, tem configuração 1s2 2s2 2p6 3s e tem propriedades semelhantes as do lı́tio. Esta periodicidade de comportamento com o número atômico Z é a razão do nome Tabela Periódica, na qual os elementos são organizados, como mostrado na Tabela 3.2. Nesta Tabela estão apresentados o número atômico Z de cada elemento, bem como o número de elétrons e os orbitais correspondentes das últimas camadas ocupadas. A Tabela Periódica do Apêndice C contém outros dados importantes sobre os elementos. 86 Materiais e Dispositivos Eletrônicos Tabela 3.2: Tabela Periódica dos elementos. A notação espectroscópica indica o número de elétrons e os orbitais correspondentes das últimas camadas ocupadas. REFERÊNCIAS A. Chaves, Fı́sica, Ondas, Relatividade e Fı́sica Quântica, Reichman & Affonso Editores, Rio de Janeiro, 2001. R. Eisberg e R. Resnick, Fı́sica Quântica, Editora Campus, Rio de Janeiro, 1988. S. Gasiorowicz, Fı́sica Quântica, Editora Guanabara Dois, Rio de Janeiro, 1974. J. Leite Lopes, A Estrutura Quântica da Matéria, Editora UFRJ, Rio de Janeiro, 1992. H.A. Pohl, Introdução à Mecânica Quântica, Edgard Blücher, Universidade de São Paulo, 1971. Cap. 3 Mecânica Quântica: O Elétron no Átomo 87 L. Solymar and D. Walsh, Lectures on the Electrical Properties of Materials, Oxford University Press, Oxford, 1993. P.A. Tipler, Fı́sica, Volume 3, 4a¯ Edição, Livros Técnicos e Cientı́ficos Editora S.A., 2000. PROBLEMAS 3.1 Mostre que a soma das funções de onda ψ1 = A eikx−iωt e ψ2 = B e−ikx−iωt é solução da equação de Schroedinger (3.17) para uma partı́cula de massa m num potencial constante, V = V0 , e obtenha a relação entre k e ω. 3.2 Calcule as constantes A1 e A2 , definidas na Eq.(3.42), de modo a normalizar as duas autofunções de onda de menor energia de uma partı́cula num poço de potencial infinito. 3.3 Calcule a diferença das energias, em eV, dos dois estados de menor energia de um elétron num poço de potencial infinito de largura: a) L = 30 Å; b) L = 1 cm. 3.4 Considere um elétron num poço de potencial infinito de largura L, no primeiro estado excitado. Calcule: a) O valor esperado da posição x do elétron; b) O desvio médio quadrático da posição, ∆x2 = < (x− < x >)2 >; c) O valor esperado do momentum px ; d) O desvio médio quadrático do momentum; e) O produto das incertezas x px . 3.5 Um elétron move-se com velocidade constante na direção de uma barreira de potencial, como aquela ilustrada na Fig.3.4. Sendo a energia E do elétron maior que a altura V0 da barreira, calcule as probabilidades do elétron refletir ou ultrapassar a barreira, em função de E e V0 . Obtenha os valores numéricos para E = 2V0 . 3.6 Um elétron move-se com energia E numa multicamada formada por dois filmes espessos de um semicondutor A, separados por um filme fino de outro semicondutor B, de espessura d. Em primeira aproximação, o potencial visto pelo elétron é o que está mostrado abaixo: a) Sendo E > V0 , calcule a probabilidade do elétron, inicialmente na camada A da esquerda, atravessar perpendicularmente a camada B e atingir 88 Materiais e Dispositivos Eletrônicos a camada A da direita; b) Qual é a condição para que a probabilidade calculada em a) seja 1; c) Calcule a espessura d para que a probabilidade do elétron atravessar a barreira seja 1, para E = 1, 0 eV e V0 = 0,8 eV; d) Sendo V0 = 1,2 eV e d o valor obtido em c), calcule a probabilidade do elétron atravessar a camada B. 3.7 Considere a situação do Problema 3.6 com E < V0 . Calcule a probabilidade do elétron atravessar a camada B para E = 1, 0 eV, V0 = 1,2 eV e d = 5 Å (efeito túnel). 3.8 Obtenha a função de onda e a energia do segundo estado excitado do oscilador harmônico simples. (Sugestão: use a função polinomial no final do exemplo 3.2 com n = 2). 3.9 Calcule as energias, em eV, dos estados do átomo de hidrogênio com n = 1, 2 e 3 e obtenha as freqüências, em Hz, de todas transições possı́veis entre estes nı́veis. 3.10 a) Mostre que o comprimento de onda do fóton absorvido, ou emitido, numa transição entre os nı́veis n1 e n2 de um átomo de hidrogênio é, em Angstroms, 911 n21 n22 λ(Å) = 2 n2 − n21 . b) Compare o resultado obtido no Problema 3.9 para os nı́veis n = 2 e n = 3 com o desta expressão. Em qual região do espectro eletromagnético situa-se a radiação envolvida nesta transição? 3.11 A atração de um elétron por um buraco num semicondutor, pode ser descrita através do potencial Coulombiano U(r) = − e2 4πr , Cap. 3 Mecânica Quântica: O Elétron no Átomo 89 onde é a permissividade do material. Ao contrário do átomo de Hidrogênio, em que o núcleo é muito mais pesado do que o elétron, os nı́veis de energia dependem da massa reduzida (µ) do par elétron-buraco: µe4 En = Ec − 2 2 (4π)2 n2 . Onde Ec é a energia da banda de condução. Para o Cu2 O, que tem = 100 , as freqüências das transições correspondentes obtidas experimentalmente podem ser descritas por: ν(cm−1 ) = 17.508 − 800 n2 . a) A partir dos resultados acima, determine a massa reduzida do par elétron-buraco; b) Determine também o raio médio da órbita para o estado ψ100 ; c) Desenhe os nı́veis de energia em relação à energia da banda de condução. 3.12 Verifique, por substituição direta, que a autofunção ψ100 dada na Tabela 3.1, é solução da equação de Schroedinger independente no tempo, e obtenha os valores das constantes a0 e E. 3.13 Mostre que as autofunções ψ100 e ψ211 dadas na Tabela 3.1 são normalizadas. 3.14 A partir da expressão do operador momentum angular dada na Seção 3.1.2 , pode-se mostrar que em coordenadas cartesianas sua componente z é dada por Lzop = −i ∂/∂ϕ . e seu módulo ao quadrado é L2op = −2 1 ∂ ∂ 1 ∂2 (senθ ) + senθ ∂θ ∂θ sen2 θ ∂ϕ2 . a) Mostre que as autofunções ψnm do átomo de hidrogênio são autofunções de Lzop e dê uma interpretação para o número quântico m ; b) Mostre que ψnm são autofunções de L2op e interprete o número quântico (Sugestão: use a expressão acima combinada com a Eq.(3.61). 3.15 Um elétron no átomo de hidrogênio tem função de onda ψ = A(6 − r/a0 ) ar0 e−r/3a0 senθ eiϕ . Substitua esta função na equação de Schroedinger e encontre a energia do elétron. 90 Materiais e Dispositivos Eletrônicos 3.16 Faça a integral da densidade de probabilidade Ψ∗ Ψ no volume compreendido entre as esferas de raios r e r + dr, para a função de onda do átomo de hidrogênio dado pela Eq.(3.69), e mostre que a densidade de probabilidade radial é dada pela Eq.(3.70). Capı́tulo 4 Elétrons em Cristais 4.1 Bandas de Energia em Cristais 92 4.2 Condutores, Isolantes e Semicondutores 98 4.3 Massa Efetiva 101 4.4 Comportamento dos Elétrons em T > 0 Distribuição de Fermi-Dirac 103 4.5 O Mecanismo da Corrente Elétrica em Metais 109 REFERÊNCIAS 115 PROBLEMAS 116 91 92 Materiais e Dispositivos Eletrônicos Elétrons em Cristais 4.1 Bandas de Energia em Cristais Neste Capı́tulo estudaremos algumas propriedades básicas de elétrons em cristais, que são fundamentais para a compreensão dos mecanismos responsáveis pela corrente elétrica num material e, portanto, por sua utilização na Eletrônica. Como vimos no Capı́tulo anterior, um elétron num átomo isolado tem estados quânticos estacionários caracterizados por nı́veis de energia discretos e quantizados, correspondendo aos orbitais atômicos designados por 1s, 2s, 2p, 3s, 3p, 3d, etc. Num átomo com muitos elétrons, o estado fundamental é obtido distribuindo os vários elétrons nos nı́veis de menor energia possı́vel, obedecendo ao Princı́pio de Exclusão de Pauli. Como o elétron é dotado de spin, cada estado orbital comporta dois elétrons com spins opostos. A pergunta que fazemos agora é então: como são modificados os estados eletrônicos quando aproximamos um grande número de átomos (cerca de 1022 /cm3 ) para fazer um cristal? O problema quântico é muito mais complicado do que num átomo isolado, pois os elétrons de cada átomo são sujeitos à interação com os átomos vizinhos. Uma primeira explicação do que ocorre é a seguinte: Ao trazermos um átomo isolado para próximo de outro, os nı́veis de energia de cada um são perturbados levemente pela presença do vizinho. Se aproximarmos um grande número de átomos, teremos um grande número de nı́veis próximos uns dos outros, formando uma banda de energia quase contı́nua. Isto está mostrado na Fig.4.1, que apresenta a variação das energias dos estados eletrônicos com a distância interatômica para N átomos de sódio, cuja configuração é (1s)2 Cap. 4 Elétrons em Cristais 93 Figura 4.1: Formação de bandas de nı́veis de energia devido à aproximação dos átomos em um sólido. (2s)2 (2p)6 (3s). Para uma distância infinita, os nı́veis de energia de estados equivalentes coincidem e são iguais aos de um átomo isolado. À medida que a distância diminui, os nı́veis se separam devido à interação com os vizinhos, dando origem à várias bandas de energia. Na distância de separação atômica de equilı́brio r = a, temos quatro bandas, cada uma correspondendo a um estado orbital. É claro, então, que o número de nı́veis em uma banda é igual a 2(2 + 1)N sendo o número quântico orbital. Esta descrição do aparecimento das bandas de energia é extremamente simplificada e esconde algumas caracterı́sticas essenciais dos estados eletrônicos. Na realidade, é a natureza ondulatória dos elétrons nos cristais que dá origem às bandas de energia, de maneira análoga à formação dos vários ramos na relação de dispersão de ondas elásticas, como aqueles da Fig.2.10. O cálculo quântico dos estados eletrônicos e das energias num sólido é bastante complexo, e só pode ser feito com várias aproximações no problema. A primeira consiste em supor que os núcleos dos átomos são fixos e com posições conhecidas na rede cristalina. Outra aproximação consiste em considerar que o problema envolve um só elétron (modelo de um elétron), e que todos os outros elétrons são considerados parte integrante dos ı́ons que criam um potencial periódico. Isto está ilustrado na Fig.4.2, que mostra qualitativamente o potencial visto por um elétron ao longo de um eixo no cristal. O potencial periódico ao qual o elétron está submetido leva à soluções da equação de Schroedinger cujas energias formam bandas. Como a solução para um potencial periódico, 94 Materiais e Dispositivos Eletrônicos Figura 4.2: (a) Energia potencial V de um elétron ao longo do eixo x do cristal mostrado em (b). mesmo o mais simples, é complexa, vamos entender o que ocorre com um modelo aproximado. No caso dos metais alcalinos, como o sódio, o elétron 3s da última camada vê um potencial do núcleo muito blindado pelos elétrons interiores, de modo que ele fica quase livre. Para este elétron podemos supor, em primeira aproximação, que o potencial é um poço com paredes infinitas nas superfı́cies do cristal e constante no seu interior, como na Fig.3.2. Neste caso, como vimos na Seção 3.2, as autofunções do elétron são do tipo Ψ(r, t) = A ei(k.r−ωt) sendo suas energias 2 k 2 E = ω = 2m , , (4.1) (4.2) onde k é sujeito a condições do tipo (3.43). A relação de dispersão (4.2) está representada pela curva tracejada na Fig.4.3. Entretanto, como o potencial não é constante no interior do poço, sua pequena variação periódica altera a propagação da onda de elétron (4.1) e conseqüentemente a relação de dispersão (4.2). Esta alteração pode ser compreendida em analogia com o efeito de uma rede de difração. Considerando a periodicidade da rede em uma dimensão, as ondas mais afetadas são as que têm vetor de onda satisfazendo a condição de Bragg 2 a senθ = m λ = m 2π/k . (4.3) As ondas que satisfazem a relação (4.3) são refletidas pela rede, dando origem a uma onda estacionária. Dependendo da configuração espacial da onda Cap. 4 Elétrons em Cristais Ek 3p a 2p a p a 0 95 elétron livre p a 2p a 3p a k Figura 4.3: Modificação da relação de dispersão pelo efeito do potencial periódico no modelo de elétron quase livre. estacionária em relação à rede, ela pode ter dois valores de energia. Assim, nos pontos k = mπ/a, onde m é um inteiro positivo ou negativo, a curva de dispersão quebra-se em duas. Isto dá origem às linhas cheias da Fig.4.3, que representam a relação de dispersão do elétron no potencial periódico. A separação das linhas resulta em bandas, ou faixas, de energia para os estados eletrônicos. Os elétrons só podem ocupar estados cuja energia está em uma das bandas da Fig.4.3. O modelo de um sólido como um poço de potencial com elétron quase livre é uma aproximação razoável para um metal como o sódio. Em um cristal mais complexo, entretanto, as funções de onda do elétron não têm a forma da onda plana simples (4.1). Apesar disso o problema ainda pode ser tratado com ondas planas por causa de um resultado geral de grande importância, o teorema de Bloch, que resulta da invariância dos cristais a translações. Vamos supor que um meio seja caracterizado em certo ponto por uma grandeza U(r), invariante no tempo. O meio tem simetria de translação em relação a esta grandeza quando o seu deslocamento por um vetor múltiplo de certo vetor unitário o deixa inalterado. Em outras palavras quando U(r + na) = U(r) , (4.4) onde n é um número inteiro qualquer. Um exemplo simples de invariância de translação é o de meio homogêneo e contı́nuo, no qual (4.4) se aplica para um vetor a → 0. Outro exemplo que nos interessa diretamente é o de um cristal perfeito, no qual parâmetros repetem-se regularmente de um ponto 96 Materiais e Dispositivos Eletrônicos para outro distantes de um vetor primitivo da célula unitária. Na equação de Schroedinger, a simetria de translação (4.4) leva a soluções do tipo Ψk (r, t) = e±ik.r uk (r, t) , (4.5) onde uk (r, t) é uma função com a mesma periodicidade que U(r). Esta função de onda representa uma onda plana, cuja amplitude é modulada por uma função periódica que reflete o efeito do potencial cristalino. As funções (4.5) são chamadas funções de Bloch. Este resultado, que pode ser demonstrado por sua substituição na equação de Schroedinger é de grande importância em cristais, pois se aplica a qualquer tipo de excitação. As ondas elásticas estudadas no Capı́tulo 2 são um exemplo de que (4.5) vale para uma cadeia periódica. No caso de elétrons, a conseqüência importante de (4.5) é que eles são descritos no cristal por ondas, caracterizadas por um vetor de onda k e energia Ek . A energia é função, não apenas do módulo de k, mas também de sua direção no cristal. Por isso, as bandas de energia devem ser representadas para as várias direções de k no cristal. Como k pode ter qualquer direção, em geral representa-se a variação de Ek com k para as direções de maior simetria nos cristais. Assim a Fig.4.3 pode representar a variação da energia com o vetor de onda na direção [100] de um cristal cúbico. Esta forma de representar a energia dos estados eletrônicos é chamada de esquema da zona estendida. Outra forma mais útil de representar as bandas de energia é no chamado esquema de zona reduzida. Veja que um elétron com vetor de onda −π/a < k < π/a está na primeira zona de Brillouin, e tem energia na primeira banda. Um Figura 4.4: (a) Ilustração do deslocamento das bandas na segunda zona de Brillouin de ±2π/a. (b) Esquema de bandas reduzido à primeira zona, resultante desse deslocamento. Cap. 4 Elétrons em Cristais 97 elétron com vetor de onda k , π/a < k < 2π/a, na segunda zona de Brillouin tem energia em outra banda. Entretanto, se subtrairmos de k um vetor de onda G = 2π/a, isto resultará num vetor de onda k = k − G que, por causa do resultado (4.5), tem efeito idêntico ao de k . Então é possı́vel transladar as bandas no espaço de momentum de um múltiplo de G, isto é, n 2π/a, de modo a levar todas as bandas para a primeira zona de Brillouin. Esta operação, mostrada na Fig.4.4 para as primeiras bandas, resulta no esquema de bandas reduzido à primeira zona. Neste esquema fica evidente que não há estados eletrônicos entre as bandas de energia. Por esta razão, as regiões entre as bandas são chamadas faixas proibidas. No caso de um cristal tridimensional a representação das bandas é um pouco mais complicada. A Fig.4.5(b) mostra a estrutura de bandas do cobre cristalino com a rede cúbica de faces centradas. A Fig.4.5(a) mostra as superfı́cies que limitam a primeira zona de Brillouin para a rede fcc. Evidentemente, no cristal tridimensional não é possı́vel representar a variação da energia em todas direções de k. Então, escolhe-se as principais direções de k na primeira zona de Brillouin, mostradas em (a). O eixo horizontal é segmentado e em cada trecho representa-se o módulo de k em cada direção, indicada pelas letras que designam os pontos caracterı́sticos da zona de Brillouin. Note que para cada vetor de onda k o elétron pode ter várias funções de onda, cada uma com energia diferente. Para encerrar esta seção é importante chamar a atenção de que devido às condições de contorno nas superfı́cies do cristal, k não pode assumir qualquer valor, ele varia discretamente. Por isso o número de estados em cada banda é finito. Se o número de células unitárias no cristal é N, cada banda contém 2N estados eletrônicos, onde o fator 2 é devido aos dois estados possı́veis para o spin. Este resultado vem da Eq.(3.43) generalizada para três dimensões. Em uma dimensão, k pode assumir valores mπ/Na, onde N é o número de células unitárias de comprimento a. Como m é um inteiro e positivo, entre 0 e π/a há N valores diferentes para k, e, portanto, o número de estados eletrônicos em cada banda é 2N (Note que se deixarmos k assumir valores positivos ou negativos, como é mais apropriado para uma onda progressiva como (4.1), é preciso mudar as condições de contorno de modo que k = m2π/Na, sendo m inteiro positivo ou negativo). A formação do estado fundamental do sólido é feita com o preenchimento dos nı́veis discretos de menor energia pelos elétrons, analogamente ao que ocorre num átomo. Como veremos na próxima seção, o resultado deste preenchimento determina se o sólido é isolante ou condutor elétrico. 98 Materiais e Dispositivos Eletrônicos Figura 4.5: (a) Primeira zona de Brillouin de um cristal fcc; (b) Estrutura de bandas de energia do cobre fcc calculada teoricamente [B. Segal, Phys. Rev. 125, 109 (1962)]. A energia de Fermi EF será definida na seção 4.4. 4.2 Condutores, Isolantes e Semicondutores Num cristal com n elétrons, o estado fundamental é obtido preenchendo os nı́veis de menor energia de modo a ter somente um elétron em cada estado. Como há 2N estados em cada banda, o número de bandas ocupadas no estado fundamental é n/2N. Como n/N é o número de elétrons por célula unitária, ele é um número inteiro, e portanto n/2N é inteiro ou semi-inteiro. Logo, em um cristal a T = 0 K (estado fundamental), há várias bandas cheias com elétrons, sendo a última necessariamente preenchida por completo ou pela metade. As propriedades de condução do cristal dependem fundamentalmente do fato da Cap. 4 Elétrons em Cristais 99 Figura 4.6: Ocupação das bandas em isolantes (a) e em condutores (b). As regiões hachuradas representam as faixas de energia ocupadas pelos elétrons. última banda estar cheia ou não. Isto é devido ao fato do vetor de onda k ter qualquer direção e das bandas serem simétricas, o que resulta em: Σ k = 0 (4.6) todos estados de uma banda Os isolantes, isto é, materiais que não conduzem corrente elétrica, são cristais que têm a última banda completamente cheia. Nestes cristais, a aplicação de um campo elétrico externo não pode alterar o momentum total dos elétrons que é nulo, pois todos estados disponı́veis estão ocupados. Logo não há passagem de corrente elétrica quando o campo é aplicado. Então, a condição necessária para um cristal ser isolante é que ele tenha um número par de elétrons por célula unitária (a condição não é suficiente, como veremos a seguir). A Fig.4.6(a) mostra uma possı́vel distribuição das últimas bandas e sua ocupação por elétrons num cristal isolante. O nı́vel de energia acima do qual não há estados ocupados a temperatura T = 0 K é chamado nı́vel de Fermi E . Na Seção 4.4 discutiremos, em mais detalhe, o importante papel que o nı́vel de Fermi desempenha nas propriedades dos sólidos. Os materiais condutores, também chamados metais, são os que têm a última banda semi-cheia. Isto ocorre sempre que o número de elétrons por célula unitária for ı́mpar. Neste caso é possı́vel mudar os estados dos elétrons com um campo elétrico, resultando em uma corrente elétrica. Nesta categoria estão os metais alcalinos (Li3 , Na11 , K19 , etc.) e os metais nobres (Cu29 , Ag47 , Au79 ), que têm um número ı́mpar de elétrons, sendo os de maior energia externos a última camada completa. A Fig.4.6(b) ilustra a ocupação das bandas 100 Materiais e Dispositivos Eletrônicos Figura 4.7: Ocupação das bandas de energia em semi-metais. nestes metais e o nı́vel de Fermi. É possı́vel também ter um metal formado por átomos com número par de elétrons na célula unitária, como os metais alcalinos terrosos (Be4 , Mg12 , Ca20 , Sr38 , Ba56 ). Nestes metais a distribuição de bandas não é tão simples como as da Fig.4.6. Como mostrado na Fig.4.7, nesses materiais a banda 1, que normalmente seria a última cheia, tem seu máximo acima do mı́nimo da banda 2 seguinte. Como os elétrons ocupam os estados de menor energia, os elétrons que estariam no topo da banda 1 vão para a banda 2, ficando ambas incompletas. Nestes materiais, a aplicação de um campo elétrico externo faz os elétrons mudarem de estados, o que resulta numa corrente elétrica. Logo, eles também são condutores, mas não tão bons como os metais alcalinos. Por isto eles são também chamados de semi-metais. Em um cristal isolante, somente na temperatura T = 0 K a última banda, chamada banda de valência, está completamente cheia. Quando a temperatura é maior que zero, elétrons da banda de valência podem ganhar energia térmica suficiente para atingirem a banda seguinte, chamada banda de condução, que estava vazia a T = 0. A passagem de elétrons para a banda de condução deixa na banda de valência estados que se comportam como portadores de carga elétrica positiva, chamados buracos. Os elétrons na banda de condução e os buracos na banda de valência produzem corrente elétrica sob a ação de um campo externo. A condutividade do material depende do número de elétrons que passam para a banda de condução, o que pode ser calculado probabilisticamente, como veremos na próxima seção. Este número é tanto maior quanto maior for a temperatura e quanto menor for a energia que separa as duas bandas. Esta energia é representada por Eg , onde o ı́ndice g vem da palavra gap, que significa intervalo, em inglês. (Por ser muito simples e conveniente, a palavra gap já foi incorporada ao nosso vocabulário técnico, da mesma forma que o spin). Os materiais que são isolantes a T = 0 Cap. 4 Elétrons em Cristais 101 Figura 4.8: Bandas de valência e de condução em semicondutores. As regiões hachuradas representam a ocupação dos elétrons em T > 0. A distância entre as bandas é o gap de energia Eg . K mas que têm Eg relativamente pequeno, da ordem de 1 eV ou menos, à temperatura ambiente, têm condutividade significativa e por isso são chamados semicondutores. A Fig.4.8 ilustra a ocupação das bandas de valência e de condução num semicondutor. Nesses materiais o número de elétrons na banda de condução pode ser significativo em relação a um isolante, mas é ainda muito menor que o número de elétrons livres num metal. Por isso, a condutividade dos semicondutores é muito menor que a dos metais. A principal diferença entre um isolante e um semicondutor é então o valor de Eg . Por exemplo, o silı́cio tem Eg = 1,1 eV e é um semicondutor, enquanto o diamante, que tem a mesma estrutura do Si formada por átomos de C, tem Eg = 5 eV, sendo um ótimo isolante. O óxido de silı́cio, SiO2 , tem Eg ≃ 8 eV e também é um isolante. A diferença nos valores de Eg pode não parecer tão grande para produzir mudança tão radical na condutividade. Entretanto, como veremos posteriormente, a ocupação da banda de condução decresce exponencialmente com o aumento da razão Eg /kB T . 4.3 Massa Efetiva Para estudar as propriedades elétricas dos metais e dos semicondutores, será preciso entender primeiro como um elétron se comporta no material sob a ação de um campo elétrico externo. Como vimos na Seção 3.3.1, o elétron é Materiais e Dispositivos Eletrônicos 102 descrito por um pacote de onda que se movimenta com a velocidade de grupo vg = ∂ω/∂k. Sendo E = ω a energia do elétron, podemos escrever, ∂E = vg ∂k . (4.7) Se o elétron for submetido a uma força F , de um campo elétrico por exemplo, sua energia varia de dE durante um percurso dx, sendo dE = F dx. Usando (4.7) vemos que a velocidade do elétron está relacionada com a força por, F dx = vg dk . dk dt . Como dx = vg dt vem, F = (4.8) Este resultado talvez já fosse esperado, pois sendo k o momentum do elétron, (4.8) nada mais é do que a segunda lei de Newton. Entretanto, ele não deixa de ser surpreendente, pois talvez esperássemos que o potencial da rede cristalina tivesse um efeito mais drástico sobre o movimento do elétron. Vemos então que a rede não afeta a forma da equação da variação do momentum. O que ela altera é a dependência da energia com o momentum, que corresponde a mudar a massa do elétron. Para mostrar isto exprimimos a aceleração do elétron, em função de E e k a partir de (4.7): a= ∂2E ∂ 2 E dk dvg = −1 = −1 2 dt ∂k∂t ∂k dt . (4.9) Substituindo o valor de dk/dt de (4.8) obtemos F = 2 a ∂ 2 E/∂k 2 . (4.10) Lembrando que F = ma, vemos que sob a ação de uma força externa o elétron no cristal age semelhantemente a um elétron livre, porém com uma massa efetiva 2 m∗ = 2 . (4.11) ∂ E/∂k 2 Este resultado também vale para um elétron livre. Neste caso, usando a relação de dispersão (3.30) obtemos m∗ = m, ou seja, a massa efetiva é a própria massa do elétron livre. Cap. 4 Elétrons em Cristais 103 A expressão (4.11) foi obtida supondo que a energia só depende do módulo de k. Na realidade, como mostra a Fig.4.5, ela também depende da direção de k. Isto significa que a massa efetiva depende da direção de k. Na definição mais geral a massa não é um escalar, é uma grandeza tensorial representada por uma matriz, cujo elemento αβ é dado por m∗αβ = 2 ∂ 2 E/∂kα ∂kβ . (4.12) Esta definição vale para elétrons em metais ou em semicondutores. 4.4 Comportamento dos Elétrons em T > 0 Distribuição de Fermi-Dirac Sabemos que em T = 0 K os elétrons ocupam os estados de menor energia permitidos no cristal, de modo a preencher, um a um, todos os estados até um certo nı́vel EF , o nı́vel de Fermi. Evidentemente, esta distribuição é alterada quando a temperatura do sólido é aumentada para T > 0. A distribuição em equilı́brio térmico é calculada em mecânica estatı́stica e leva em conta que os elétrons são partı́culas indistinguı́veis umas das outras e que obedecem ao princı́pio de exclusão de Pauli. A probabilidade de encontrar os estados com energia na faixa (E, E + dE) ocupados com elétrons a uma temperatura absoluta T é dada por f (E)dE, onde f (E) = 1 1 + e(E−EF )/kB T (4.13) é a distribuição de Fermi-Dirac. Nesta expressão EF é o nı́vel de Fermi e kB é a constante de Boltzmann (kB ≃ 1, 38 × 10−23 J/K). A forma de f (E) está mostrada na Fig.4.9 para várias temperaturas. Note que em T = 0 a função é descontı́nua em E = EF , isto é f (E < EF ) = 1, f (E > EF ) = 0. Isto significa que os estados com E < EF estão ocupados por um elétron enquanto que aqueles com E > EF estão vazios em T = 0. Em temperaturas acima de 0 K a distribuição de Fermi-Dirac se altera principalmente nas proximidades de EF . A probabilidade dos estados com E > EF estarem ocupados deixa de ser zero devido à excitação térmica. Entretanto, seu valor cai quase exponencialmente com a distância E − EF e aumenta exponencialmente com a temperatura. A 104 Materiais e Dispositivos Eletrônicos Figura 4.9: Distribuição de Fermi-Dirac para várias temperaturas. probabilidade f (E) de ocupação dos estados com E > EF corresponde a uma probabilidade 1 − f (E) de que os estados com E < EF estejam vazios. Note que a função de Fermi-Dirac f (E) é simétrica em torno de EF , no qual seu valor é f (EF ) = 1/2. Em cada material o valor de EF depende da forma das bandas e do número de elétrons. A distribuição de Fermi-Dirac f (E) representa a probabilidade de ocupação de um estado com energia E. Para calcular o número de elétrons numa dada faixa de energia, é preciso saber também o número de estados nesta faixa. Este número é dado pela densidade de estados D(E), que pode ser calculada a partir da relação Ek (k). Vamos considerar o modelo de um metal como o da seção 4.1, no qual elétrons livres estão num poço de potencial infinito. Neste caso, a energia do elétron é caracterizada por uma função parabólica em k dada por (4.2), E= 2 k 2 2m . Na realidade este resultado foi demonstrado para um poço unidimensional. Entretanto, ele também vale para um poço de potencial em três dimensões com paredes infinitas. Neste caso o número de onda k dá lugar ao vetor de onda k com três componentes kx , ky , kz , de modo que a energia fica E= 2 2 (k + ky2 + kz2 ) 2m x . (4.14) Analogamente ao problema em uma dimensão, as três componentes do vetor Cap. 4 Elétrons em Cristais 105 de onda só podem assumir valores discretos, determinados pelas condições de contorno nas superfı́cies do cristal. Supondo que o cristal é um cubo de lado L, temos então: 2π 2π 2π , ky = ny , kz = nz , (4.15) kx = nx L L L onde nx , ny e nz são números inteiros positivos ou negativos. Este resultado é uma generalização da equação (3.44) para três dimensões e para ondas progressivas. Devido ao spin do elétron, para cada conjunto de números quânticos (nx , ny , nz ), e portanto, em cada volume (2π/L)3 no espaço k, existem dois estados eletrônicos. A densidade de estados D(E) é a medida do número de estados disponı́veis com energia E. Por definição, V D(E)dE é o número de estados com energia entre E e E + dE, sendo V = L3 o volume do cristal. No espaço de vetor de onda k as superfı́cies de energia constante são esferas de raio k. Portanto, o número de estados com energia na faixa (E, E + dE) é o volume compreendido entre as esferas de raio kE e kE+dE , multiplicado pelo número de estados por unidade de volume no espaço k. Sendo este dado por 2(L/2π)3 , temos 3 L 4πkE2 dk , (4.16) V D(E) dE = 2 2π onde kE é o módulo do vetor de onda correspondente a energia E. De (4.2) temos que 3/2 1 2m 2 kE dk = E 1/2 dE , 2 2 que, substituı́do em (4.16), dá para a densidade de estados 3/2 2m 1 E 1/2 . D(E) = 2 2π 2 (4.17) O gráfico da Fig.4.10 representa a densidade de estados D(E) dos elétrons em uma banda parabólica. Note que a energia é colocada no eixo vertical de modo a facilitar a visualização do preenchimento dos estados de menor energia. Em T = 0, todos estados com energia inferior ao nı́vel de Fermi EF estão preenchidos. Havendo N elétrons na banda, por unidade de volume, a condição que determina EF é, EF D(E)dE = N . (4.18) 0 106 Materiais e Dispositivos Eletrônicos Figura 4.10: Densidade de estados eletrônicos D(E) em uma banda de energia parabólica. Utilizando (4.17) obtemos 2m 1 2 3π 2 3/2 3/2 EF = N . (4.19) A partir de (4.19) obtemos então o nı́vel de Fermi para uma banda parabólica com N elétrons em T = 0, EF = (3π 2 N)2/3 2 2m . (4.20) Em T = 0 todos estados com energia E ≤ EF estão ocupados. Esses estados são caracterizados por vetores de onda com módulo k ≤ kF , onde kF , dado por, 2m EF , (4.21) kF2 = 2 é chamado o vetor de onda de Fermi. A superfı́cie no espaço k no interior da qual todos estados estão ocupados em T = 0, é chamada superfı́cie de Fermi. Numa banda parabólica ela é uma esfera de raio kF dado por (4.21), ilustrada na Fig.4.11(a). A banda parabólica (4.14) só é válida exatamente para elétrons livres. Em cristais, a variação da energia com k é mais complicada, como está ilustrado pelas bandas do cobre na Fig.4.5. Neste caso a superfı́cie de Fermi não é uma esfera, ela tem uma forma mais complexa. A Fig.4.11(b) mostra a superfı́cie de Fermi do cobre, que está contida na primeira zona de Brillouin. Cap. 4 Elétrons em Cristais 107 Figura 4.11: (a) Superfı́cie de Fermi para um sistema de elétrons livres. (b) Superfı́cie de Fermi (SF) e a primeira zona de Brillouin do cobre fcc. Exemplo 4.1: O sódio cristaliza na estrutura bcc, tendo dois átomos por célula unitária, cada um com um elétron 3s. Sabendo que o parâmetro de rede do sódio em T = 5K é 4,225 Å, calcule: a) A energia de Fermi; b) a velocidade dos elétrons com energia no nı́vel de Fermi, chamada velocidade de Fermi vF . a) Para calcular a energia de Fermi, através da Eq.(4.20), é preciso inicialmente calcular o número de elétrons livres por unidade de volume. Havendo dois elétrons por célula unitária com parâmetro de rede a, N= 2 2 = = 2, 65 × 1022 cm−3 = 2, 65 × 1028 m−3 . a3 4, 2253 × 1024 A energia de Fermi é relacionada com N pela Eq.(4.20), EF = (3π 2 N )2/3 2 2m . Em primeira aproximação podemos considerar a massa dos elétrons livres como sendo a massa do elétron no vácuo, 9, 1 × 10−31 kg. Assim, EF = 3 × 3, 142 × 2, 65 × 1028 EF = 2/3 1, 052 × 10−68 2 × 9, 1 × 10−31 5, 15 × 10−19 J = 3, 22 eV 1, 6 × 10−19 C b) Como a energia dos elétrons livres é de natureza cinética, EF = 1 m vF2 . 2 = 5, 15 × 10−19 J ou Materiais e Dispositivos Eletrônicos 108 Logo vF = 2EF m 1/2 = 2 × 5, 15 × 10−19 9, 1 × 10−31 1/2 vF = 1, 06 × 106 m/s = 1, 06 × 108 cm/s A temperaturas acima de zero a probabilidade de ocupação dos estados é dada por f (E), Eq.(4.13), de modo que o número de elétrons, por unidade de volume no intervalo de energia entre E e E + dE é dN = f (E) D(E) dE . (4.22) A Fig.4.12 ilustra o produto das funções f (E) e D(E) e mostra o elemento de área correspondente a dN. Note que os elétrons que passam para estados acima do nı́vel de Fermi provêm principalmente dos estados com energias abaixo e próximas de EF . Este resultado é bastante geral. Sempre que há uma perturbação no sistema de elétrons, os estados com energia próxima de EF são os mais afetados. Esta perturbação pode ser devido à excitação térmica, ou à excitação produzida por campos externos. Na próxima seção veremos o efeito de um campo elétrico. Figura 4.12: População de elétrons N (E) = f (E)D(E) numa banda parabólica a T = 0. dN é o número de elétrons na faixa de energia dE. Exemplo 4.2: Calcule a energia total dos elétrons livres numa amostra de sódio de volume 1 cm3 , em T = 0. A energia dos elétrons por unidade de volume é a soma das energias dos elétrons livres, que pode ser calculada usando (4.22), U = V E dN = E f (E) D(E) dE . Cap. 4 Elétrons em Cristais 109 Em T = 0, a distribuição de Fermi-Dirac tem valor 1 para E < EF e valor 0 para E > EF , logo, com (4.17), U = V = E F 0 1 2π 2 E D(E) dE = 2m 3/2 2 2 5 2m 1 2π 2 5/2 EF 3/2 E 2 0 F E 3/2 dE . Utilizando (4.20) podemos exprimir este resultado na forma, 3 U = N EF . V 5 Portanto, usando os resultados do Exemplo 4.1, obtemos, 3 U = × 2, 65 × 1028 × 5, 15 × 10−19 = 8, 19 × 109 J m−3 . V 5 Então, a energia dos elétrons numa amostra de 1 cm3 é U = 8, 19 × 109 × 10−6 = 8, 19 × 103 J . 4.5 O Mecanismo da Corrente Elétrica em Metais Para entender o mecanismo da passagem de corrente elétrica em metais, teremos que utilizar resultados clássicos combinados com conceitos quânticos. Quando um campo elétrico externo é aplicado ao metal, os elétrons sofrem o efeito deste campo superposto ao do potencial cristalino. O efeito deste último resulta na massa efetiva do elétron m∗ . Desta forma, se o campo externo é E, a aceleração do elétron dada por (4.10) e (4.11) é, a= e dv =− ∗ E dt m . (4.23) Este resultado significa que num cristal perfeito, o campo E constante produz uma aceleração constante e portanto uma velocidade que aumenta linearmente no tempo, v = at. A Eq.(4.23) implica também que, mesmo sem campo externo, os elétrons podem ter velocidade constante e não nula. Isto resulta do fato de que o estado estacionário do elétron no cristal sem campo externo é uma onda plana, dada pela Eq.(4.5). Esta onda tem um momentum k, que 110 Materiais e Dispositivos Eletrônicos Figura 4.13: a) Deslocamento do patinador em movimento “zig-zag” ao longo de uma fileira regular de obstáculos. b) Ilustração da colisão provocada por um obstáculo “fora do lugar”. corresponde a uma velocidade constante. Mas ela só é um estado estacionário quando o cristal é perfeito, a T = 0 e sem campo externo. Podemos entender melhor este comportamento do elétron fazendo uma analogia com o movimento de um patinador. Um patinador pode se deslocar ao longo de uma fileira de obstáculos regularmente espaçados, fazendo um movimento “zig-zag” de modo a contornar cada obstáculo, como ilustrado na Fig.4.13(a). Se o patinador está bem treinado, ele pode executar este movimento de “zig-zag” naturalmente, sem se chocar com os obstáculos, e com velocidade média constante ao longo da fileira. Este movimento é análogo ao do elétron no cristal perfeito, descrito por uma onda plana com amplitude modulada pelo potencial periódico da rede, Eq.(4.5). Entretanto, se um obstáculo está deslocado de sua posição normal, ou se há um obstáculo “extra” entre aqueles da fileira regular, o patinador provavelmente irá colidir com ele, como ilustrado na Fig.4.13(b). O que ocorre com um elétron no sólido é semelhante. Se a regularidade da rede cristalina é perturbada, o elétron só permanece num estado estacionário durante um certo intervalo de tempo. A perturbação provoca uma colisão do elétron, produzindo um espalhamento que resulta na passagem para um outro estado estacionário. As duas principais perturbações da regularidade da rede são a própria vibração dos ı́ons devido à agitação térmica em T = 0 e a presença de átomos ou ı́ons de impurezas. A colisão com a rede em movimento térmico corresponde ao espalhamento de elétrons por fônons. Este processo é semelhante ao da colisão entre partı́culas, no qual há conservação de energia e de momentum. Devido às colisões, a velocidade média do elétron é nula na ausência de campo elétrico externo, como ilustrado na Fig.4.14(a). Quando um campo elétrico é aplicado ao material, ao movimento rápido e aleatório do elétron, causado pelas colisões, superpõe-se um contı́nuo deslocamento na direção do campo elétrico. Este deslocamento resulta numa corrente elétrica chamada de corrente de deriva (drift current), ou corrente de condução. Na descrição quântica do comportamento dos elétrons é preciso considerar que a T = 0 e sem campo externo, todos estados no espaço k no interior da Cap. 4 Elétrons em Cristais 111 Figura 4.14: Ilustração do movimento de um elétron num sólido: a) Sem campo externo aplicado, a velocidade média é nula. b) Na presença de campo elétrico, além do movimento rápido e aleatório há um deslocamento contı́nuo que resulta numa corrente elétrica. superfı́cie de Fermi estão ocupados. Isto está ilustrado na Fig.4.15(a) por um corte no plano kx ky da esfera de Fermi, que vale para o caso de elétrons livres. Como todos estados com k < kF estão preenchidos, a cada estado +k ocupado corresponde outro −k também ocupado. Então Σk = 0 e por conseguinte a corrente é nula. Se um campo elétrico E é aplicado na direção −x no instante t = 0, os elétrons mudam de estado k, de acordo com a Eq.(4.8). Sendo a força sobre os elétrons Fx = (−e)(−E) = eE, a variação de k no intervalo de tempo δt é, eE δt . (4.24) δkx = Como conseqüência de (4.24), cada elétron num estado k passa para outro estado k + x̂δkx após um intervalo δt, resultando na ocupação de estados mostrada na Fig.4.15(b). O resultado lı́quido é um momentum total Nδkx por unidade de volume, sendo N a concentração de elétrons na banda. Isto resulta numa corrente elétrica na direção +x. Note que embora todos elétrons tenham seus estados alterados pela ação do campo elétrico, são os estados próximos da superfı́cie de Fermi que contribuem para fazer a soma vetorial das velocidades ser diferente de zero. Devido às colisões, o deslocamento da esfera de Fermi estaciona após um intervalo médio de tempo τ , chamado tempo de colisão. A velocidade média resultante pode ser obtida a partir de (4.23) ou diretamente de (4.24) usando v = k/m∗ . Esta velocidade média, chamada de velocidade de deriva, é então eE τ vx = . (4.25) m∗ 112 Materiais e Dispositivos Eletrônicos Figura 4.15: (a) Os pontos representam estados ocupados no espaço k no cristal não perturbado. O cı́rculo representa a interseção da esfera de Fermi com o plano kx ky . (b) Com a aplicação de um campo elétrico na direção −x os estados ocupados se deslocam de δkx dado pela Eq.(4.24). Considerando que há N elétrons livres por unidade de volume, obtemos a densidade de corrente Jx = (−e)Nvx = −Ne2 τ E/m∗ . (4.26) Esta equação tem a forma da lei de Ohm que relaciona a tensão aplicada V , a corrente elétrica I e a resistência R V =RI , (4.27) sendo a resistência de um condutor de comprimento L e área da seção transversal A dada por 1L , (4.28) R= σA onde σ = 1/ρ é a condutividade e ρ é a resistividade. Usando (4.28) em (4.27), juntamente com as relações J = I/A e V = EL, a lei de Ohm (4.27) pode ser escrita na forma J = σE . (4.29) Substituindo (4.29) em (4.26) obtemos a condutividade do metal, σ= Ne2 τ m∗ . (4.30) Cap. 4 Elétrons em Cristais 113 Figura 4.16: Variação da resistividade de potássio em baixas temperaturas. Num condutor com uma rede cristalina perfeita a T = 0, o tempo de colisão é infinito e, portanto, a condutividade também é infinita. Num cristal real, τ é limitado por causa do espalhamento dos elétrons pelas impurezas e imperfeições da rede e por fônons. Como a agitação térmica aumenta com a temperatura, o tempo de colisão devido ao espalhamento por fônons diminui com o aumento da temperatura. Por outro lado a contribuição das impurezas e imperfeições não varia com a temperatura e existe mesmo a T = 0. Isto está ilustrado na Fig.4.16 que mostra a variação da resistividade ρ = 1/σ de potássio com a temperatura T . O aumento de ρ com T é devido ao espalhamento por fônons enquanto que a contribuição em T = 0 provém das impurezas e imperfeições. A curva de cima corresponde a um material com maior quantidade de impurezas que a de baixo e, portanto, tem um valor maior de ρ(0). A Fig.4.17 mostra a condutividade à temperatura ambiente para uma variedade de materiais. Ela varia de 10−18 Ω−1 m−1 no quartzo, que é um ótimo isolante, a cerca de 108 Ω−1 m−1 no cobre, que é um bom condutor. Esta faixa de variação de 1026 é a maior verificada numa mesma grandeza fı́sica. Na verdade, a faixa de variação de σ é maior ainda pois os materiais supercondutores têm condutividade várias ordens de grandeza maior do que o cobre. Para encerrar este Capı́tulo vamos estimar numericamente algumas grandezas importantes envolvidas no mecanismo da corrente elétrica. Considere o caso do cobre, que à temperatura ambiente tem condutividade σ ∼ 108 Ω−1 m−1 . Sendo o número de elétrons livres N ∼ 1023 /cm3 , usando (4.30) e os valores para a massa e carga do elétron (Apêndice B), obtemos para 114 Materiais e Dispositivos Eletrônicos Figura 4.17: Condutividade em Ω−1 m−1 de uma variedade de materiais à temperatura ambiente. o tempo de colisão τ ∼ 10−13 s. A distância que o elétron percorre entre duas colisões é o livre caminho médio . Como os elétrons envolvidos na corrente são aqueles próximos da superfı́cie de Fermi, o livre caminho médio é = vF τ , (4.31) onde vF é a velocidade de Fermi, relacionada com o raio da esfera de Fermi kF pela relação vF = kF /m∗ . Usando esta relação e as equações (4.20) e (4.21) obtemos para o cobre vF ∼ 106 m/s. Isto dá para o livre caminho médio no cobre ∼ 10−7 m = 103 Å, que corresponde à distância de centenas de átomos na rede cristalina. De certa forma é surpreendente que um elétron no cobre à temperatura ambiente passe por centenas de átomos sem se chocar com eles. A partir da Eq.(4.25) podemos estimar a velocidade de deriva dos elétrons. Considerando que uma tensão de 10 V é aplicada nas extremidades de um fio de cobre de 1 m de comprimento, o campo elétrico é E = 10 V/m. Usando τ = 10−13 s obtemos de (4.25) vx ∼ 10−1 m/s. Isto mostra que a velocidade de deriva é várias ordens de grandeza menor que a velocidade vF de movimento de elétrons entre duas colisões. Em outras palavras, o movimento de deriva é muitı́ssimo mais lento que o movimento aleatório do elétron entre uma colisão e outra. Exemplo 4.3: Sabendo que o tempo de colisão dos elétrons livres na prata à temperatura ambiente é 3,8 × 10−14 s e que a concentração de elétrons livres é 5,86 × 1022 cm−3 , calcule: a) A resistência de um fio de prata de seção reta 0,1 mm2 e comprimento 100 m; b) A corrente elétrica no fio quando uma tensão de 1,6 V é aplicada nas extremidades; c) A velocidade de deriva dos elétrons na situação do item b. a) Para calcular a resistência é preciso inicialmente obter a condutividade, dada pela Equação Cap. 4 Elétrons em Cristais 115 (4.30), N e2 τ 5, 86 × 1022 × 106 × 1, 62 × 10−38 × 3, 8 × 10−14 = ∗ m 9, 1 × 10−31 σ= σ = 6, 26 × 107 (Ωm)−1 . A resistência do fio é, R= 1 L 100 m = 16 Ω = σ A 6, 26 × 107 Ω−1 m−1 × 1 × 10−7 m2 b) A corrente no fio é, I= 1, 6 V = = 0, 1 A . R 16 c) A velocidade de deriva é relacionada com a corrente por meio da Eq. (4.26), v= J I 0, 1 = = Ne Ne A 5, 86 × 1028 × 1, 6 × 10−19 × 10−7 v = 1, 7 × 10−4 m/s REFERÊNCIAS R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. D. Jiles, Electronic Properties of Materials, Chapman & Hall, London, 1994. C. Kittel, Introduction to Solid State Physics, J. Wiley, New York, 1996. D.J. Roulston, An Introducion to the Physics of Semiconductor Devices, Oxford University Press, Oxford, 1999. L. Solymar and D. Walsh, Lectures on the Electrical Properties of Materials, Oxford University Press, Oxford, 1993. F.F.Y. Wang, Introduction to Solid State Electronics, North-Holland, Amsterdam, 1980. 116 Materiais e Dispositivos Eletrônicos PROBLEMAS 4.1 A prata cristaliza na estrutura fcc, tendo quatro átomos por célula unitária, cada um deles com um elétron 5s. Sabendo que o parâmetro de rede da prata é 4,086 Å, calcule a concentração de elétrons livres em cm−3 . 4.2 Em primeira aproximação, a prata tem banda 5s parabólica. Calcule seu nı́vel de Fermi, EF , em eV, considerando que a massa dos elétrons livres é igual à massa de elétron no vácuo. 4.3 A partir dos resultados dos Problemas 4.1 e 4.2, calcule: a) a velocidade de Fermi vF dos elétrons com energia EF ; b) o comprimento de onda do elétron movendo-se com a velocidade de Fermi e compare com a distância entre os átomos (≃ 4 Å); c) Em qual temperatura a probabilidade de encontrar elétrons com energia E = EF + 0, 1 eV é 10%. 4.4 Um metal tem nı́vel de Fermi EF = 1 eV. Faça um gráfico (de preferência num computador) da função de distribuição de Fermi-Dirac f (E) para T = 5, 5 e 300 K. 4.5 Mostre que a probabilidade de um estado eletrônico de energia E = EF + E estar ocupado é igual a probabilidade do estado com energia E = EF − E estar vazio. 4.6 Num fio de cobre de seção reta 1 mm2 circula uma corrente de 10 A. Sabendo que a concentração de elétrons livres é N = 8, 5 × 1022 cm−3 , calcule: a) O nı́vel de Fermi, nas mesmas aproximações do Problema 4.2; b) A velocidade de Fermi; c) A velocidade de deriva dos elétrons. Compare com vF e interprete o resultado. 4.7 Sabendo que a resistividade do cobre à temperatura ambiente é 1, 7 ×10−8 Ω m, utilize os dados e resultados do problema anterior para calcular: a) O tempo médio de colisão dos elétrons; b) O livre caminho médio dos elétrons. Capı́tulo 5 Materiais Semicondutores 5.1 Semicondutores 118 5.2 Elétrons e Buracos em Semicondutores Intrı́nsecos 122 5.2.1 Massa Efetiva de Elétrons e Buracos 5.2.2 Criação e Recombinação de Pares Elétron-Buraco 5.2.3 Concentração de Portadores em Equilı́brio Térmico 5.3 Semicondutores Extrı́nsecos 122 125 127 135 5.3.1 Nı́vel de Energia de Impureza num Cristal 5.3.2 Concentração de Portadores em Semicondutores Extrı́nsecos 135 139 5.4 Dinâmica de Elétrons e Buracos em Semicondutores 145 5.4.1 Corrente de Condução 5.4.2 Movimento em Campo Magnético-Efeito Hall 5.4.3 Corrente de Difusão 5.4.4 Injeção de Portadores: Difusão com Recombinação 145 150 152 158 REFERÊNCIAS 162 PROBLEMAS 163 117 118 Materiais e Dispositivos Eletrônicos Materiais Semicondutores 5.1 Semicondutores Como vimos no capı́tulo anterior, os semicondutores são caracterizados por uma banda de valência cheia e uma banda de condução vazia a T = 0, separadas por um gap de energia relativamente pequeno, Eg < 2 eV. Devido ao pequeno gap, à temperatura ambiente o número de elétrons na banda de condução é apreciável, embora muito menor que o número de elétrons livres em metais. Isto resulta numa condutividade intermediária entre a dos isolantes e a dos metais, como ilustrado na Fig.4.17. Esta é a razão do nome semicondutor. A concentração de elétrons na banda de condução de um semicondutor puro varia exponencialmente com a temperatura, o que faz sua condutividade depender fortemente da temperatura. Esta é uma das razões pelas quais os semicondutores puros, também chamado intrı́nsecos, são utilizados em poucos dispositivos. A condutividade dos semicondutores também pode ser drasticamente alterada com a presença de impurezas, ou seja, de átomos diferentes dos que compõem o cristal puro. É esta propriedade que possibilita a fabricação de uma variedade de dispositivos eletrônicos a partir do mesmo material semicondutor. O processo de colocar impurezas de elementos conhecidos num semicondutor é chamado dopagem. Semicondutores com impurezas são chamados dopados ou extrı́nsecos. O semicondutor mais importante para a eletrônica é o silı́cio. Ele tem a mesma estrutura cristalina do diamante, mostrada na Fig.1.8, formada apenas Cap. 5 Materiais Semicondutores 119 por átomos do elemento Si, do grupo IV da tabela periódica. A Fig.5.1 mostra a estrutura de bandas de energia do silı́cio. O máximo da banda de valência ocorre em k = 0, o ponto Γ da zona de Brillouin. O topo da banda de valência é tomado como referência na escala de energia, ou seja E = 0. O mı́nimo da banda de condução ocorre num vetor de onda k = 0 na direção [100], próximo do ponto X na fronteira da zona de Brillouin, com energia 1,12 eV. Este é então o valor do gap de energia do Si, Eg = 1, 12 eV. Na realidade o valor do gap varia com a temperatura. Em Si o gap é Eg = 1, 16 eV em T = 0 e diminui com o aumento de T . Outro semicondutor importante é o germânio, também formado por um elemento do grupo IV, o Ge, e que também tem a estrutura cristalina do diamante. O Ge tem estrutura de bandas semelhante a do Si, porém com um gap menor, Eg = 0,66 eV à temperatura ambiente. Isto faz com que suas propriedades elétricas sejam mais sensı́veis a mudanças de temperatura do que em Si. Em germânio e silı́cio as bandas de valência e de condução resultam de estados eletrônicos s e p que se misturam. Como há dois estados s e p, há oito bandas hı́bridas s + p, que se separam em dois conjuntos de quatro bandas cada. As quatro bandas de menor energia podem acomodar 4N elétrons. Como Si e Ge possuem quatro elétrons de valência por átomo, as quatro bandas s + p de menor energia estão completamente cheias, constituindo as bandas de valência, mostradas na Fig.5.1 para Si. Figura 5.1: Estrutura de bandas de energia do silı́cio (Si) [Hummel]. 120 Materiais e Dispositivos Eletrônicos O semicondutor de maior aplicação em opto-eletrônica é o arseneto de gálio, GaAs. Ele é formado pelos elementos Ga e As, dos grupos III e V respectivamente, e cristaliza na estrutura zinc-blende da Fig.1.8(a). Na formação do GaAs, o átomo de As perde um elétron que passa para um vizinho de Ga, ficando ambos com quatro elétrons nas camadas 4s2 4p2 . Semelhantemente a Si e Ge, o GaAs tem 4N elétrons que enchem completamente a banda de valência, deixando vazia a banda de condução. A estrutura de bandas do arseneto de gálio está mostrada na Fig.5.2. Note que neste caso o mı́nimo da banda de condução ocorre no mesmo vetor de onda, k = 0, que o máximo da banda de valência, sendo o gap Eg = 1, 43 eV. Há vários outros semicondutores formados por elementos dos grupos III e V, chamados compostos III-V, como InSb (Eg = 0, 18 eV), InP (1,35 eV) e GaP (2,26 eV), por exemplo. Também há semicondutores compostos II-IV, como CdS (2,42 eV), PbS (0,35 eV), PbTe (0,30 eV) e CdTe (1,45 eV), entre outros. As propriedades de condução dos semicondutores são determinadas principalmente pelo número de elétrons na banda de condução. Então elas dependem fortemente da razão Eg /kB T e portanto do valor do gap Eg , mas não são muito influenciadas pela forma das bandas. Por outro lado, as propriedades ópticas dependem muito da forma das bandas de energia. Como será mostrado no Capı́tulo 8, as transições eletrônicas acompanhadas da emissão ou absorção de fótons num cristal devem conservar energia e momentum, ou seja Ef − Ei = ±ω , Figura 5.2: Estrutura de bandas de energia de arseneto de gálio (GaAs) [Hummel]. (5.1) Cap. 5 Materiais Semicondutores 121 kf − ki = ±k (5.2) , sendo Ef e Ei as energias do elétron nos estados final e inicial, respectivamente, kf e ki os vetores de onda correspondentes, ω e k a freqüência e o vetor de onda do fóton absorvido (Ef > Ei ) ou emitido (Ef < Ei ) na transição. No caso do arseneto de gálio, a transição de um elétron do mı́nimo da banda de condução para o máximo da banda de valência é acompanhada da emissão de um fóton de energia ω = Eg = 1, 43 eV, cujo vetor de onda tem módulo k = 2π/λ = 7, 2 × 104 cm−1 . Como este valor de k é muito menor que o valor da fronteira da zona de Brillouin (kZB ≃ π/a ∼ 108 cm−1 ), ele é desprezı́vel na escala da Fig.5.2. Desta forma o momentum é conservado na emissão do fóton e a transição é permitida. Esta transição, ilustrada na Fig.5.3(a), é chamada de processo direto de emissão. Correspondentemente o semicondutor é denominado de gap direto. No caso do silı́cio ou do germânio, não é possı́vel ter uma transição entre o topo da banda de valência e o mı́nimo da banda de condução apenas com emissão ou absorção de fótons. Isto porque o fóton com energia Eg tem k kZB e esta transição requer uma variação de vetor de onda da ordem de kZB para conservar momentum. Como vimos no Capı́tulo 2, os fônons têm energia Ω Eg e vetor de onda na faixa 0 ≤ k ≤ kZB . É possı́vel então, ter uma Figura 5.3: (a) Bandas de valência e de condução em semicondutor de gap direto. Neste caso, a transição através do gap ocorre com a emissão de um fóton de freqüência ωg = Eg / e com vetor de onda desprezı́vel na escala da figura. (b) No semicondutor de gap indireto, a transição através do gap envolve um fóton de freqüência ω ≈ ωg e k ≈ 0 e um fônon de freqüência Ω muito menor que ωg e vetor de onda k ≃ kZB , de tal forma a conservar energia e momentum totais. 122 Materiais e Dispositivos Eletrônicos transição através do gap, com a emissão ou absorção de um fóton, desde que acompanhada da emissão ou absorção de um fônon. Esta transição, ilustrada na Fig.5.3(b) é chamada de processo indireto. Si e Ge são semicondutores de gap indireto. Como a transição em semicondutores de gap indireto envolve fônons e fótons, a probabilidade de emissão ou absorção de fótons é muito menor que no caso de gap direto. Por esta razão é preciso utilizar semicondutores de gap direto para fabricar lasers e diodos emissores de luz (LED). Entre os semicondutores de gap direto destacam-se GaAs, InSb, InAs, InP, PbS, CdS, CdTe. Nem todos compostos do grupo III-V são de gap direto. GaP e ASb, por exemplo, têm gap indireto. 5.2 Elétrons e Buracos em Semicondutores Intrı́nsecos 5.2.1 Massa Efetiva de Elétrons e Buracos Num semicondutor a uma temperatura finita, a excitação térmica faz com que um certo número de elétrons passe da banda de valência para a de condução. Por conseguinte, se ele é submetido a um campo elétrico, as duas bandas contribuem para a condução de corrente elétrica, pois ambas estão parcialmente senpreenchidas. Os elétrons da banda de condução, sob a ação do campo E, tem uma força F = −eE e movem-se de acordo com a lei de Newton, com massa efetiva dada pela Eq.(4.11). Como os elétrons estão agrupados em torno do mı́nimo da banda de condução, todos têm aproximadamente a mesma massa efetiva, 2 , (5.3) m∗e = 2 (∂ E/∂k 2 )k=kmc onde kmc corresponde ao mı́nimo da banda de condução. Sendo a curvatura da banda de condução para cima, a massa efetiva dos elétrons nela situados é positiva, de modo que eles têm aceleração no sentido oposto ao campo. O comportamento dos elétrons da banda de valência é diferente. Vemos, em primeiro lugar, que os elétrons próximos do topo da banda de valência têm massa efetiva negativa, por causa da curvatura da função E(k). Para entender seu comportamento, vamos supor que há somente um estado vazio no topo da banda. A Fig.5.4 ilustra o comportamento deste estado quando o cristal é submetido a um campo E na direção x̂. Antes da aplicação do campo, o estado Cap. 5 Materiais Semicondutores 123 Figura 5.4: Movimento de elétrons na banda de valência: em (a) sem campo aplicado, Σkc = 0. Em (b) e (c) com campo no sentido +x. vazio deve estar no topo, como na Fig.5.4(a) para que a soma algébrica dos momenta kx de todos elétrons seja nula. Após a aplicação do campo, todos os elétrons tendem a deslocar-se no espaço E(k) no sentido kx negativo, porque, pela Eq.(4.8), dkx = −e Ex . (5.4) dt Desta forma, em instantes posteriores teremos as situações mostradas na Fig.5.4(b) e (c). Note que o deslocamento de todos os elétrons da banda no sentido kx negativo, resulta no deslocamento do estado vazio no mesmo sentido no espaço do momentum. Como todos os outros estados estão ocupados, a existência de um estado vazio (ausência de elétron) com momentum −k1 implica em que o momentum total do sistema é +k1 . Assim sendo, o sistema comporta-se como se fosse formado por um buraco1 de vetor de onda kb = −ke . (5.5) A equação da força pode ser escrita então como dke dkb Fe = = − dt dt . (5.6) Sendo a força proveniente de um campo elétrico, como a carga do elétron é e portanto, negativa, Fe = −eE, 1 O nome universalmente aceito em inglês é hole. Alguns autores brasileiros usam o nome lacuna. Materiais e Dispositivos Eletrônicos 124 +e E = dkb dt . Isto mostra que o buraco se comporta como uma partı́cula de carga positiva. Um desenvolvimento análogo ao das Eqs.(4.9)-(4.11) mostra que massa efetiva do buraco é m∗b = − 2 (∂ 2 E/∂k 2 )k=kmv , (5.7) onde kmv corresponde ao máximo da banda de valência. Como ∂ 2 /∂k 2 no máximo da banda de valência é negativo, a massa do buraco é positiva. Isto é consistente com o fato de que se um campo elétrico é aplicado no sentido +x, os buracos têm momentum kx > 0 e portanto, movimentam-se no sentido +x no espaço real. As Eqs.(5.6) e (5.7) levam à conclusão que os estados vazios, no topo da banda de valência, comportam-se como estados de excitações elementares de carga positiva, com módulo igual ao da carga do elétron, e massa efetiva positiva dada por (5.7). São os estados de buracos. Como as curvaturas das bandas de valência e de condução não são iguais, as massas efetivas dos elétrons e dos buracos são diferentes. Além disso, é possı́vel ter cristais com mais de uma banda de condução ou de valência, e também curvaturas que variam com a direção de k, havendo portanto várias massas de elétrons e de Eg (eV) m∗e /m0 m∗b /m0 Ge 0,66 Si 1,12 GaAs InSb InP 1,43 0,18 1,29 m∗c = 0, 55 m∗e = 0, 12 m∗c = 1, 10 m∗e = 0, 26 0,068 0,013 0,07 m∗v = 0, 31 m∗b = 0, 23 m∗v = 0, 56 m∗b = 0, 38 0,5 0,6 0,4 Cristal Tabela 5.1: Energias do gap e massas efetivas de semicondutores importantes a 300 K. m0 = 9, 1 × 10−31 kg é a massa de repouso do elétron. Em Si e Ge, m∗c e m∗v são as massas que entram no cálculo das densidades de estados das bandas de condução e de valência, enquanto m∗e e m∗b são as massas de deslocamento de elétrons e buracos [Sze e Yang]. Cap. 5 Materiais Semicondutores 125 buracos. Nas Figuras 5.1 e 5.2 vemos que tanto Si como GaAs têm duas bandas de valência degeneradas em k = 0. Os buracos da banda de maior curvatura (maior módulo de ∂ 2 E/∂k 2 ) têm menor massa efetiva, sendo por isso chamados buracos leves, enquanto os da banda de menor curvatura são chamados buracos pesados. Devido à multiplicidade de massas efetivas e também a divergências nas medidas experimentais, os valores das massas encontrados na literatura variam de uma fonte para outra, mesmo nos casos dos semicondutores mais estudados, como Si, Ge e GaAs. A Tabela 5.1 mostra as massas efetivas de alguns semicondutores importantes para aplicações em eletrônica, e também os valores de Eg em T = 300 K. Note que no caso do silı́cio e germânio há duas massas efetivas de elétrons e duas de buracos. m∗c e m∗v são médias geométricas das massas efetivas usadas para calcular as densidades de estados nas bandas de condução e de valência, respectivamente. Por outro lado, m∗e e m∗b são as massas médias usadas para calcular o movimento de elétrons e buracos. 5.2.2 Criação e Recombinação de Pares Elétron-Buraco Num cristal semicondutor puro a T = 0 e sem qualquer perturbação externa, não há elétrons na banda de condução nem buracos na banda de valência. Em outras palavras, não há portadores de carga elétrica e o material é um isolante elétrico. Há vários processos para levar elétrons para a banda de condução. O mais comum é a excitação térmica, pela qual um certo número de elétrons do topo da banda de valência vai para os primeiros nı́veis da banda de condução quando T > 0. A concentração de elétrons e de buracos devido à excitação térmica será calculada na próxima seção. O ponto a ressaltar aqui é que, num semicondutor intrı́nseco, a passagem de um elétron para a banda de condução sempre corresponde à criação de um buraco na banda de valência, ou seja, elétrons e buracos são criados aos pares. Elétrons e buracos também são criados aos pares em outros processos, como o de absorção óptica. Como ilustrado na Fig.5.5, quando um fóton de energia ω é absorvido num semicondutor, um elétron passa da banda de valência para a de condução. Como o vetor de onda do fóton é desprezı́vel, o elétron criado na banda de condução tem o mesmo ke do elétron removido da banda de valência. Isto corresponde à criação de um buraco com vetor de onda kb = −ke . Em outras palavras, a absorção do fóton é acompanhada da criação de duas quase-partı́culas: um elétron e um buraco. Como eles têm momenta 126 Materiais e Dispositivos Eletrônicos Figura 5.5: Absorção de um fóton de energia ω e vetor de onda desprezı́vel acompanhada da criação de um par elétron-buraco em semicondutor de gap direto. ke e −ke , o momentum total antes e depois da absorção do fóton é nulo, ou seja, ele é conservado. Sendo n a concentração de elétrons por unidade de volume na banda de condução do semicondutor puro e p a concentração de buracos na banda de valência, pode-se afirmar então que n = p. Em equilı́brio térmico temos então, n = p = ni , (5.8) onde ni é a concentração de portadores no semicondutor intrı́nseco, que será calculada na próxima seção. Qualquer que seja o mecanismo de criação de pares elétron-buraco, o processo não é estático, é dinâmico. Elétrons vão para a banda de condução, deixando buracos na banda de valência, com uma certa taxa g que representa o número de pares gerados por unidade de volume e por unidade de tempo. Simultaneamente elétrons recombinam com buracos a uma taxa de recombinação r. Isto é evidente no caso da excitação térmica. No processo induzido opticamente isto também é verdade, pois enquanto a absorção de fótons resulta na criação de pares, a recombinação produz emissão de fótons. O fato é que, no regime estacionário, o número de pares é constante. Isto requer que, para cada mecanismo de geração e recombinação de pares, as taxas de criação e de recombinação sejam iguais, isto é, r=g . Este resultado é chamado o princı́pio do balanceamento detalhado. (5.9) Cap. 5 Materiais Semicondutores 127 Exemplo 5.1: Um feixe de laser de comprimento de onda 5145 Å com área 1 mm2 e potência 10 mW incide num semicondutor, sendo totalmente absorvido em processo de geração de pares elétron-buraco ao longo de uma distância 100 µm. Supondo que a eficiência de conversão de fótons em pares elétron-buraco é 10 %, calcule a taxa de criação de pares em cm−3 s−1 . Inicialmente é preciso calcular o número de fótons por unidade de tempo no feixe de laser. Usando (2.31), podemos determinar a energia de cada fóton, hν = h 6, 63 × 10−34 J.s × 3, 0 × 108 m.s−1 c = = 3, 86 × 10−19 J . λ 5145 × 10−10 m O número de fótons por unidade de tempo é a razão entre a potência do laser e a energia do fóton, 10 × 10−3 W P = = 2, 59 × 1016 s−1 . hν 3, 86 × 10−19 J Como a cada 10 fótons absorvidos um par elétron-buraco é gerado, a taxa de criação de pares por unidade de volume é, r= 5.2.3 2, 59 × 1016 s−1 1 = 2, 59 × 1019 cm−3 s−1 −2 10 1 × 10 cm2 × 100 × 10−4 cm Concentração de Portadores em Equilı́brio Térmico Várias propriedades dos semicondutores, como por exemplo a condutividade, dependem fundamentalmente da concentração dos portadores de carga elétrica. Esta concentração depende do número de estados disponı́veis para serem ocupados e da probabilidade de ocupação de cada um. Vamos calcular esta concentração num semicondutor intrı́nseco a uma temperatura T utilizando conceitos apresentados no Capı́tulo 4. A probabilidade dos elétrons ocuparem um estado de energia E é dada pela função de Fermi-Dirac f (E), Eq.(4.13). Uma dificuldade adicional nos semicondutores em relação aos metais é que o nı́vel de Fermi EF não é conhecido, a priori, como veremos a seguir. Vamos considerar um semicondutor com bandas como na Fig.5.6. O topo da banda de valência tem energia Ev e o mı́nimo da banda de condução é Ec , sendo Ec − Ev = Eg . Em T = 0 a banda de valência está cheia e a de condução está vazia. É claro então que o nı́vel de Fermi está situado entre as duas bandas, Ev < EF < Ec , porém sua posição exata no gap depende da forma das bandas. Devido à simetria de f (E) e ao fato de que, em T > 0, o 128 Materiais e Dispositivos Eletrônicos Figura 5.6: Bandas parabólicas em semicondutor utilizadas para o cálculo da densidade de estados. número de elétrons na banda de condução é igual ao número de buracos na banda de valência, se as bandas forem simétricas, EF estará exatamente no meio do gap. Por outro lado, se as bandas não forem simétricas, EF estará próximo mas não exatamente no meio. Na verdade a determinação de EF é feita no próprio cálculo das concentrações de portadores. Para o cálculo da concentração dos portadores no semicondutor é preciso saber também o número de estados eletrônicos disponı́veis para ocupação nas bandas de energia, o que depende da forma das bandas. Como os estados envolvidos são os que estão próximos dos extremos das duas bandas na Fig.5.6, podemos fazer para ambas a aproximação parabólica. Supondo que a energia não varia com a direção de k podemos escrever para a banda de condução, 2 k 2 E − Ec = 2m∗c , (5.10) 2 k 2 Ev − E = 2m∗v , (5.11) e para a banda de valência, onde m∗c e m∗v são, respectivamente, as massas efetivas nas bandas de condução e de valência. Exceto pelo deslocamento da referência, as expressões acima são iguais a Eq.(4.14). Desta forma, os vetores de onda dos estados que podem ser Cap. 5 Materiais Semicondutores 129 ocupados são discretos e dados pela Eq.(4.15). Assim sendo, a densidade de estados eletrônicos na banda de condução é dada por (4.17) com E substituı́do por E − Ec , e m substituı́do por m∗c , ∗ 3/2 2mc 1 D(E) = 2 (E − Ec )1/2 . (5.12) 2π 2 Do mesmo modo, a densidade de estados de buracos na banda de valência é, ∗ 3/2 2mv 1 D(E) = 2 (Ev − E)1/2 . (5.13) 2π 2 A partir desses resultados podemos obter as concentrações de elétrons e buracos em equilı́brio térmico nos semicondutores. A concentração (número/unidade de volume) de elétrons na banda de condução é obtida pela integral do produto da densidade de estados D(E) com a probabilidade de ocupação f (E), ∞ n= D(E)f (E)dE . (5.14) Ec Nesta equação fizemos o limite superior infinito porque a contribuição dos estados com energia muito acima de Ec é desprezı́vel, devido ao fato de que f (E) cai exponencialmente com E. Para facilitar a integração, vamos utilizar uma expressão aproximada para a função de Fermi-Dirac. À temperatura ambiente, T ≃ 290 K, o fator de Boltzmann é kB T ≃ 0, 025 eV. Como EF está próximo do meio do gap e Eg é da ordem de 1 eV, podemos considerar kB T . Logo, (4.13) pode ser aproximada por E − EF f (E) ≃ e−(E−EF )/kB T . (5.15) Substituindo (5.12) e (5.15) em (5.14) vem ∗ 3/2 ∞ 2mc 1 n = (E − Ec )1/2 e−(E−EF )/kB T dE 2 2π 2 Ec 1 = 2π 2 2m∗c 2 3/2 −(Ec −EF )/kB T ∞ e x1/2 e−x/a dx , 0 onde x ≡ (E − Ec ) e a ≡ kB T . A integral definida pode ser calculada analiticamente e seu valor é a3/2 π 1/2 /2. A concentração de elétrons na banda de condução é então 130 Materiais e Dispositivos Eletrônicos n = Nc e−(Ec −EF )/kB T onde Nc = 2 m∗c kB T 2π 2 , (5.16) 3/2 . (5.17) Podemos dar à concentração Nc duas interpretações úteis. Veja que a Eq.(5.16) seria obtida de (5.14) imediatamente se a densidade de estados fosse uma função delta de Dirac em E = Ec , D(E) = Nc δ(E − Ec ) . (5.18) Esta equação significa que Nc faz o papel de uma concentração de estados totalmente localizados na energia E = Ec . Também pode-se ver a concentração de elétrons n como sendo dada, aproximadamente, por uma concentração efetiva de estados com valor constante Nc entre Ec e Ec + kB T e nula fora deste intervalo. De forma análoga, podemos obter a concentração de buracos na banda de valência. Como o número de buracos é dado pela falta de elétrons na banda de valência, temos, Ev p= −∞ Considerando EF − E [1 − f (E)]D(E)dE . (5.19) kB T , podemos usar a aproximação 1 − f (E) ≃ e(E−EF )/kB T . A integral (5.19) pode ser resolvida por um cálculo análogo ao de n, levando ao seguinte resultado para a concentração de buracos, p = Nv e−(EF −Ev )/kB T , (5.20) onde Nv é a concentração efetiva de estados com energia no topo da banda de valência Ev , dada por, ∗ 3/2 mv kB T . (5.21) Nv = 2 2π 2 Cap. 5 Materiais Semicondutores 131 Figura 5.7: Ilustração gráfica do cálculo da concentração de portadores no semicondutor intrı́nseco: (a) As linhas cheias representam as densidades de estados D(E) nas duas bandas; (b) A distribuição de Fermi-Dirac f (E); (c) As densidades de portadores nas duas bandas numa temperatura T > 0. As áreas hachuradas em (c) correspondem às concentrações efetivas de estados. O cálculo de n e p está ilustrado graficamente na Fig.5.7 para o caso de um semicondutor intrı́nseco com bandas aproximadamente simétricas. Neste caso o nı́vel de Fermi está aproximadamente no meio do gap. Na verdade, desde que a função de Fermi-Dirac possa ser aproximada pela expressão (5.15), as equações (5.16)-(5.21) valem para semicondutores intrı́nsecos ou extrı́nsecos. O que diferencia os dois casos é a posição do nı́vel de Fermi, EF , que até o momento não foi calculada. Exemplo 5.2: Calcule a probabilidade de ocupação f (E) de um estado com energia E acima do nı́vel de Fermi, E = EF + 0, 2 eV, a uma temperatura 290 K, usando a expressão exata e também a aproximada (5.15). Inicialmente calculamos o valor da energia térmica em eV, kB T = 1, 38 × 10−23 × 290 J = 1, 38 × 10−23 × 290 = 0, 025 eV . 1, 6 × 10−19 Então, e(E−EF )/kB T = e0,2/0,025 = e8 = 2980, 96 . A probabilidade calculada pela distribuição de Fermi-Dirac é, f (E) = 1 1 = 3, 3535 × 10−4 . = 1 + 2980, 96 1 + e(E−EF )/kB T 132 Materiais e Dispositivos Eletrônicos O valor calculado com a expressão (5.15) é, f (E) = 1 = 3, 3546 × 10−4 , 2980, 96 que é praticamente igual ao calculado com a expressão exata. Para determinar o nı́vel de Fermi EF é preciso utilizar a condição de conservação do número de elétrons. No caso do semicondutor intrı́nseco, a esta condição impõe que o número de elétrons na banda de condução seja igual ao número de buracos na banda de valência, n = p ≡ ni . Igualando (5.16) e (5.20), fazendo EF = Ei (nı́vel de Fermi no semicondutor intrı́nseco) e utilizando (5.17) e (5.21) obtemos a energia de Fermi no material intrı́nseco (Problema 5.2), 1 3 m∗ (5.22) Ei = (Ec + Ev ) + kB T n v∗ . 2 4 mc Esta equação mostra claramente que somente se T = 0, ou se as massas efetivas de elétrons e buracos forem iguais, o nı́vel de Fermi no semicondutor intrı́nseco estará exatamente no meio do gap. No caso geral em que m∗c = m∗v (bandas não simétricas), o nı́vel de Fermi não está exatamente no meio e sua Figura 5.8: Variação das concentrações de portadores intrı́nsecos em Ge, Si e GaAs medidas experimentalmente [Sze]. Cap. 5 Materiais Semicondutores 133 posição depende da temperatura. Entretanto, como à temperatura ambiente kB T Eg , esta correção é muito pequena em Si, Ge e GaAs. Uma vez obtida a energia de Fermi Ei do semicondutor intrı́nseco, podemos imediatamente calcular a concentração ni de elétrons na banda de condução e de buracos na banda de valência. Fazendo EF = Ei em (5.16) e (5.20) obtemos, ni = Nc e−(Ec −Ei )/kB T , (5.23) pi = Nv e−(Ei −Ev )/kB T . (5.24) Fazendo o produto dessas duas equações e usando o fato de que pi = ni , obtemos √ (5.25) ni = pi = ni pi = (Nc Nv )1/2 e−Eg /2kB T . Este resultado mostra que o número de portadores no semicondutor intrı́nseco varia exponencialmente com Eg /kB T . A Fig.5.8 mostra a variação de ni com a temperatura nos três semicondutores mais importantes, medida experimentalmente. Esta variação é devida principalmente ao fator exponencial da Eq.(5.25), mas também contém uma contribuição em T 3/2 proveniente do termo (Nc Nv )1/2 (Problema 5.3). Grandeza Átomos ou moléculas (1022 /cm3 ) Parâmetro da rede a (Å) Constante dielétrica / 0 Gap de energia Eg (eV) Concentração intrı́nseca ni (cm−3 ) Concentração efetiva Nc (cm−3 ) Concentração efetiva Nv (cm−3 ) Mobilidade µn (cm2 /V.s) Mobilidade µp (cm2 /V.s) Coeficiente de difusão Dn (cm2 /s) Coeficiente de difusão Dp (cm2 /s) Ge Si GaAs 4,42 5,658 16,0 0,68 2,5×1013 1,04×1019 6,1×1018 3900 1900 100 50 5,0 5,431 11,8 1,12 1,5×1010 2,8×1019 1,02×1019 1350 480 35 12,5 2,21 5,654 10,9 1,43 107 4,7×1017 7,0×1018 8600 400 220 10 Tabela 5.2: Valores de grandezas importantes em Ge, Si e GaAs a T = 300 K [Sze e Streetman]. Materiais e Dispositivos Eletrônicos 134 A Tabela 5.2 apresenta os valores das concentrações de portadores e outras grandezas importantes para os três principais semicondutores. A mobilidade e o coeficiente de difusão serão definidos na seção 5.5. Note que em todos eles a concentração intrı́nseca está na faixa 107 − 1013 cm−3 . Este valor é extremamente pequeno comparado com o número de portadores em metais Eg . Note que os valores de Nc , (1022 cm−3 ) e resulta do fato de que kB T Nv e ni dados na Tabela 5.2 foram obtidos através de medidas independentes. Por esta razão existe uma pequena discrepância entre eles e os valores obtidos com a Eq.(5.25) (Problema 5.3). Exemplo 5.3: Obtenha uma expressão numérica para a concentração de elétrons na banda de condução de um semicondutor hipotético, intrı́nseco, com m∗c = m∗v = m0 e calcule seu valor para Eg = 1, 0 eV e T = 300 K. Para m∗c = m∗v = m0 , (5.17) e (5.21) dão Nc = Nv = 2 =2 m 0 kB 2π 2 3/2 T 3/2 9, 1 × 10−31 kg × 1, 38 × 10−23 J/K 2 × 3, 14 × 1, 0542 × 10−68 J2 s2 3/2 T 3/2 = 4, 83 × 1021 T 3/2 (kg s2 /J)3/2 . Veja que como o joule é a unidade de energia no sistema internacional, 1 J = 1 kg m2 s2 . Portanto, a unidade da expressão acima é m−3 , que é a unidade de concentração (número por volume) no sistema internacional. Usando (5.25) e convertendo m3 em cm3 , a concentração de elétrons pode ser escrita como, ni = 4, 83 × 1015 T 3/2 e−Eg /2kB T cm−3 K−3/2 . Para calcular o valor da exponencial, vamos exprimir a energia térmica em 300 K em unidades de eV, kB T = 1, 38 × 10−23 × 300 J = 1, 38 × 10−23 × 300 = 0, 026 eV . 1, 6 × 10−19 Então, ni = 4, 83 × 1015 × 3003/2 × e−(1,0/0,052) ni = 1, 12 × 1010 cm−3 Cap. 5 Materiais Semicondutores 5.3 135 Semicondutores Extrı́nsecos Os semicondutores intrı́nsecos são pouco utilizados em dispositivos, entre outras razões, porque sua condutividade é pequena e depende muito da temperatura. Em geral utiliza-se semicondutores com uma certa quantidade de impurezas, de tipo e concentração controlados e colocados propositalmente no cristal. Semicondutores com impurezas são chamados extrı́nsecos. Dizemos também que o semicondutor extrı́nseco é aquele que é dopado com impurezas. Através da dopagem é possı́vel fazer com que o número de elétrons seja maior que o de buracos, ou vice-versa. Os semicondutores com predominância de elétrons são chamados do tipo n (de negativo), enquanto que os de maior concentração de buracos são do tipo p (de positivo). Os semicondutores dopados têm condutividade que varia pouco com a temperatura e cujo valor é controlado pela concentração de impurezas. É o controle das propriedades dos semicondutores através da dopagem que possibilita utilizar estes materiais para fabricar uma enorme variedade de dispositivos eletrônicos. O método mais comum de dopagem de semicondutores é a difusão em alta temperatura. Os átomos da impureza desejada são provenientes de um gás, como AsH3 no caso de As, e difundem para o interior do material através de sua superfı́cie. Este processo é feito num forno onde o material e o gás que fornece a impureza são aquecidos a uma temperatura na faixa de 400 − 700◦C. A profundidade da camada superficial que fica dopada e a concentração de impurezas dependem da temperatura e do tempo de exposição. No processo de difusão a fronteira entre a camada dopada e o material puro não é bem definida. Devido à natureza térmica do processo, a concentração de impurezas varia gradualmente na fronteira. Um outro método que permite a obtenção de regiões dopadas com fronteiras melhor definidas é a implantação iônica. Neste processo um feixe de ı́ons acelerados com energia na faixa 10 - 100 keV bombardeia a superfı́cie do material e penetra no interior. Camadas de impurezas com fronteiras controladas e bem definidas podem ser produzidas por este processo com espessuras de até 1 µm. 5.3.1 Nı́vel de Energia de Impureza num Cristal A presença de defeitos ou impurezas num cristal modifica o potencial eletrostático nas suas vizinhanças, quebrando a simetria de translação do potencial periódico. Essa perturbação pode produzir funções de onda eletrônicas que 136 Materiais e Dispositivos Eletrônicos Figura 5.9: Perturbação do esquema de energia causada por impurezas ou defeitos no cristal. Alguns nı́veis de energia das impurezas estão nas faixas proibidas. são localizadas nas proximidades da impureza, deixando de ser propagantes em todo o cristal. As energias dessas funções de onda são obtidas através da equação de Schroedinger resolvida para o potencial da impureza. Essas energias aparecem na forma de nı́veis discretos que podem estar situadas entre as bandas do cristal perfeito. A Fig.5.9 ilustra possı́veis nı́veis de energia de impurezas nas bandas de um cristal com defeitos. Numa primeira aproximação, esses nı́veis de energia podem ser calculados com um modelo simples. Vamos considerar por exemplo o caso de semicondutores como germânio ou silı́cio, que têm uma ligação covalente uniforme. Os elementos do grupo V da tabela periódica (P, As ou Sb, por exemplo) têm uma camada eletrônica interna igual a do Si ou Ge, mas têm cinco elétrons de valência em vez de quatro. Em pequenas quantidades esses elementos podem facilmente entrar no cristal no lugar dos átomos de Ge ou Si. Isto não produz grandes modificações na rede cristalina, resultando na formação de impurezas substitucionais, como ilustrado na Fig.5.10. A dopagem também pode ser feita com elementos do grupo III (B, A, Ga ou In), que têm um elétron de valência a menos que Ge ou Si. No caso das impurezas do grupo V, como As, quatro de seus cinco elétrons de valência são utilizados na ligação covalente com os átomos vizinhos de Ge ou Si. O quinto elétron fica fracamente ligado ao átomo, que pode ser ionizado termicamente a temperaturas relativamente baixas, como acima de 50 K. Com a ionização o quinto elétron fica livre para se movimentar no cristal, o que equivale a dizer que ele vai para a banda de condução. Isto significa que Cap. 5 Materiais Semicondutores 137 Figura 5.10: Modelo esquemático de um cristal de Ge ou Si dopado com impurezas substitucionais Ga (aceitador) e As (doador). As bolas brancas representam os átomos de Ge ou Si. o nı́vel de energia da impureza de As está próximo da banda de condução. As impurezas de As e dos outros elementos do grupo V são doadoras, pois doam elétrons para a banda de condução, como ilustrado na Fig.5.11(a). Os semicondutores com impurezas doadoras têm maior concentração de elétrons do que de buracos e por isso são chamados do tipo n. No caso de impurezas do grupo III, como o Ga, há um elétron a menos dos quatro necessários para completar a ligação covalente com os vizinhos. Em temperaturas da ordem de 50 a 100 K, elétrons da banda de valência do cristal são capturados para completarem as ligações covalentes, deixando buracos na banda de valência. As impurezas do grupo III são chamadas aceitadoras e formam semicondutores do tipo p. Como ilustrado na Fig.5.11(b), elas têm nı́vel de energia eletrônica próximo da banda de valência. Os nı́veis de energia Figura 5.11: Representação esquemática dos nı́veis de impurezas no gap de semicondutores dopados. Ec e Ev representam as energias mı́nima e máxima das bandas de condução e valência respectivamente. Note que esta figura representa a energia ao longo de uma dimensão fı́sica do semicondutor. 138 Materiais e Dispositivos Eletrônicos das impurezas no gap dos semicondutores podem ser calculados quanticamente com um modelo simples do átomo de hidrogênio. Vamos considerar o caso do As em germânio, por exemplo. O cálculo é feito supondo que o elétron quase livre está ao redor do ı́on positivo de As, com uma massa efetiva m∗e devido ao potencial periódico da rede cristalina. A energia do nı́vel de impureza é dada pela expressão da energia de ionização do átomo de hidrogênio no estado fundamental, Eq.(3.66) com n = 1, m∗e 0 2 m∗e e4 ≡ EH , (5.26) E= 2(4π)2 2 m0 onde é a permissividade do cristal, m∗e é a massa efetiva de condução e EH é a energia no átomo de hidrogênio, cujo valor, calculado com m∗e = m0 e = 0 é EH = 13, 6 eV. No germânio ≃ 16 0 , a massa efetiva de condução dada na Tabela 5.1 é m∗e = 0, 12 m0 , de modo que a energia de ionização das impurezas doadoras neste material é, E1 = 13, 6 × 0, 12 = 0, 006 eV 162 . Silı́cio tem = 120 e maior massa efetiva, tendo portanto uma maior energia de ionização (0,025 eV). Este é o valor de energia necessário para ionizar uma Figura 5.12: Energias de ionização de várias impurezas em Ge e Si em T = 300 K. Os números indicam as distâncias em eV do mı́nimo da banda de condução para os nı́veis acima do meio do gap e do máximo da banda de valência para os nı́veis abaixo do meio do gap. Note que Cu e Au têm vários nı́veis de impurezas, tanto doadoras como aceitadoras [Sze]. Cap. 5 Materiais Semicondutores 139 impureza doadora. Logo ele representa a distância entre o nı́vel da impureza e o mı́nimo da banda de condução. É claro que este modelo rudimentar, que não leva em conta a natureza detalhada do átomo de impureza, dá resultados apenas aproximados. A Fig.5.12 mostra os nı́veis de energia de várias impurezas em Ge e em Si. As impurezas comumente usadas para produzir semicondutores tipo n, como Sb, P e As, têm nı́veis próximos da banda de condução. Por outro lado as utilizadas nos semicondutores tipo p como B, A, Ga e In têm nı́veis próximos da banda de valência. No caso de Cu e Au há vários nı́veis de impurezas no gap do Si ou do Ge. Alguns nı́veis estão longe das bandas e são chamados de nı́veis profundos. Estes nı́veis são utilizados para aumentar a taxa de recombinação de pares elétron-buraco. As concentrações utilizadas variam de 1014 cm−3 (1 parte em 108 , considerando 1022 átomos por cm3 ) a 1020 cm−3 (1 parte em 102 , que é muito forte). 5.3.2 Concentração de Portadores em Semicondutores Extrı́nsecos As Equações (5.14) e (5.19) não são, evidentemente, restritas a semicondutores intrı́nsecos. Elas também valem para semicondutores dopados, tanto com impurezas doadoras como aceitadoras. Assim sendo, os resultados (5.16) e (5.20) também valem para os semicondutores extrı́nsecos, desde que a aproximação (5.15) seja válida. Representando por n0 e p0 as concentrações em equilı́brio térmico de elétrons na banda de condução e de buracos na banda de valência, no semicondutor extrı́nseco, podemos escrever então n0 = Nc e−(Ec −EF )/kB T , (5.27) p0 = Nv e−(EF −Ev )/kB T . (5.28) O cálculo de n0 e p0 num semicondutor tipo n está ilustrado na Fig.5.13. O que difere o semicondutor extrı́nseco do intrı́nseco é a posição do nı́vel de Fermi. Por exemplo, num semicondutor tipo n com impurezas doadoras com energia Ed próxima da banda de condução, em T = 0 os estados com energia Ed estão cheios enquanto que aqueles com energia E > Ec estão vazios. Portanto em T = 0 o nı́vel de Fermi está entre Ed e Ec . Em T > 0 ele pode estar abaixo de Ed , mas não estará muito longe deste nı́vel. Como EF está próximo de Ec , à temperatura ambiente a exponencial em (5.27) é muito maior do que aquela em (5.28), de modo que o número de elétrons é muito maior que o de buracos. Fisicamente o que ocorre é que n0 no semicondutor tipo n aumenta em relação a ni por causa da ionização das impurezas doadoras. Por outro Materiais e Dispositivos Eletrônicos 140 E E E D(E) D(E) Área = n0 Ec EF Ed Ev Área = p0 [1 – f(E)]D(E) D(E) 0 D(E) 1 Figura 5.13: Ilustração gráfica do cálculo das concentrações de portadores num semicondutor tipo n. lado, o número de buracos diminui porque há mais elétrons para recombinar com eles. O produto das concentrações de elétrons e buracos é obtido de (5.27) e (5.28), n0 p0 = Nc Nv e−Eg /kB T . (5.29) Comparando este resultado com (5.25) vemos que n0 p0 = n2i . (5.30) Desta forma, o produto n0 p0 é constante e independe do tipo e da concentração de impurezas. Este resultado, conhecido como a lei de ação das massas, é muito importante e será usado com freqüência posteriormente. Usando (5.23) e (5.24) podemos reescrever (5.27) e (5.28) numa forma conveniente n0 = ni e(EF −Ei )/kB T , (5.31) p0 = ni e(Ei −EF )/kB T . (5.32) Estas relações mostram claramente que n0 = p0 = ni quando EF = Ei , e que n0 e p0 variam exponencialmente quando EF se afasta de Ei . Cap. 5 Materiais Semicondutores 141 Nos semicondutores tipo n o nı́vel de Fermi EF está próximo da banda de condução, de modo que (EF − Ei )/kB T 1. Em conseqüência n0 ni e p0 ni , e por isso os elétrons são chamados portadores majoritários, enquanto os buracos são os portadores minoritários. Por outro lado, nos semicondutores tipo p, (EF − Ei )/kB T é grande e negativo, de modo que ni e p0 ni . Neste caso os buracos são os portadores majoritários n0 enquanto os elétrons são minoritários. Outra relação importante entre as concentrações de portadores resulta da neutralidade de cargas. Sendo Nd+ a concentração de impurezas doadoras ionizadas (impurezas que cederam elétrons para a banda de condução e ficaram carregadas positivamente) e Na− a de impurezas aceitadoras ionizadas (que receberam elétrons da banda de valência e ficaram negativas), a condição para que o material seja eletricamente neutro é: n0 + Na− = p0 + Nd+ . (5.33) Esta é a equação da neutralidade de cargas. Para um dado semicondutor com concentrações de impurezas conhecidas, o conjunto das Equações (5.27)-(5.33) permite calcular o nı́vel de Fermi e as concentrações de elétrons e buracos. Vamos considerar o caso de um semicondutor tipo n com Nd impurezas doadoras, a uma temperatura tal que todas estão ionizadas, ou seja Nd+ ≃ Nd . Neste caso n0 ≃ p0 + Nd . (5.34) Usando a lei de ação das massas (5.30) nesta equação, obtemos Nd + n0 = 2 Nd + p0 = − 2 Nd 2 Nd 2 1/2 2 + n2i , (5.35) 1/2 2 + n2i . (5.36) Normalmente, no semicondutor dopado, a concentração de impurezas é muito ni . Neste caso, desprezando ni maior do que a concentração intrı́seca, Nd em (5.35) obtemos, (5.37) n0 ≃ Nd , 142 Materiais e Dispositivos Eletrônicos como esperado. Por outro lado não podemos desprezar ni completamente em (5.36), pois isto levaria a p0 = 0. Usando a aproximação binomial para a raiz quadrada em (5.36) obtemos p0 ≃ n2i Nd , (5.38) que é compatı́vel com (5.30) e (5.37). Tendo as relações (5.37) e (5.38) para as concentrações de portadores, o nı́vel de Fermi pode ser determinado com as Equações (5.27) ou (5.31). Por exemplo, substituindo (5.37) em (5.27) vem EF = Ec − kB T n Nc Nd . (5.39) Ou substituindo (5.37) em (5.31), obtemos outra expressão útil para EF , EF = Ei + kB T n Nd ni . (5.40) É importante chamar a atenção de que estas expressões para EF só valem para semicondutores tipo n, na condição Nd ni . Exemplo 5.4: Calcule as concentrações de elétrons e de buracos e a posição do nı́vel de Fermi num cristal de silı́cio dopado com 1016 cm−3 átomos de As, à temperatura ambiente T ≃ 290 K. Da Tabela 5.2 temos ni = 1, 5 × 1010 cm−3 . Usando (5.37) e (5.38), n0 ≃ Nd+ ≃ Nd = 1016 cm−3 , n2i = 2, 25 × 104 cm−3 Nd . p0 ≃ Usando kB T ≃ 0, 025 eV e Nc = 2, 8 × 1019 cm−3 em (5.39) vem Ec − EF = 0, 025 n(2, 8 × 103 ) = 0, 20 eV . Comparando este resultado com a energia dada na Fig.(5.12), vê-se que neste caso o nı́vel de Fermi está próximo e um pouco abaixo do nı́vel da impureza de As no silı́cio. Por outro lado com (5.40) obtemos EF = Ei + 0, 34 eV . Cap. 5 Materiais Semicondutores 143 Figura 5.14: Diagrama de energia do silı́cio: (a) Tipo n, com Nd = 1016 cm−3 impurezas doadoras; (b) Tipo p, com Na = 1017 cm−3 impurezas aceitadoras. O diagrama de energia correspondente à situação do Exemplo 5.4 está mostrado na Fig.5.14(a). Este diagrama é tı́pico de semicondutor tipo n, no qual o nı́vel de Fermi está próximo da banda de condução. É importante notar que quando a concentração de impurezas é grande, ou seja, comparável com Nc (2,8 ×1019 cm−3 em Si), o nı́vel de Fermi se aproxima de Ec . Neste caso o resultado (5.39) não vale porque (5.15) não é uma boa aproximação para f (E). O semicondutor com Nd ≃ Nc é chamado degenerado e tem EF ≃ Ec . É fácil ver, por analogia com o desenvolvimento das Equações (5.34)(5.40), que num semicondutor tipo p, dopado com Na impurezas aceitadoras, as expressões para as concentrações e o nı́vel de Fermi são (Problema 5.6): n2i Na (5.41) p0 ≃ Na (5.42) n0 ≃ EF = Ev + kB T n Nv Na EF = Ei − kB T n Na ni (5.43) . (5.44) 144 Materiais e Dispositivos Eletrônicos Exemplo 5.5: Calcule as concentrações de elétrons e buracos e a posição do nı́vel de Fermi num cristal de silı́cio com Na = 1017 cm−3 impurezas de Ga, a T = 290 K. Usando (5.41) e (5.42) vêm, p0 ≃ 1017 cm−3 , 3 −3 n0 ≃ 2, 25 × 10 cm . Usando kB T = 0,025 eV e Nv = 1, 02 × 1019 cm−3 em (5.43) temos EF = Ev + 0, 025 × n (1, 02 × 102 ) EF = Ev + 0, 11 eV . O diagrama de energia correspondente ao Exemplo 5.5 está ilustrado na Figura 5.14(b). Ele é tı́pico de semicondutor tipo p, no qual o nı́vel de Fermi está próximo e um pouco acima do nı́vel de energia da impureza, estando ambos próximos do topo da banda de valência. Para concluir esta seção é importante chamar a atenção de que as aproximações Nd+ ≃ Nd e Na− ≃ Na só valem acima de uma certa temperatura, que, no caso do silı́cio, é da ordem de 100 K. Abaixo desta temperatura as impurezas não estão todas ionizadas e o número de portadores varia com a temperatura (veja Problema 5.8). Entretanto, como na faixa de 100 a 500 K as impurezas estão praticamente todas ionizadas, as concentrações são quase Figura 5.15: Concentração de elétrons em função da temperatura em silı́cio tipo n com Nd = 1016 cm−3 [Yang]. Cap. 5 Materiais Semicondutores 145 independentes da temperatura, como ilustrado na Fig.5.15. Acima de 500 K a concentração intrı́nseca, que cresce exponencialmente com T , passa a ser importante e eventualmente domina a extrı́nseca. 5.4 Dinâmica de Elétrons e Buracos em Semicondutores A operação dos dispositivos semicondutores é baseada na dinâmica dos portadores de carga elétrica, que são os elétrons e buracos. Os principais processos dinâmicos são a criação de pares elétron-buraco, a recombinação de pares e o movimento coletivo desses portadores. O movimento coletivo das cargas resulta em corrente elétrica, que consiste no principal mecanismo de transmissão de informação nos dispositivos. Há dois tipos básicos de movimento coletivo que estudaremos a seguir: o movimento de deriva num campo elétrico e a difusão de cargas devido a um gradiente espacial na concentração de portadores. 5.4.1 Corrente de Condução A corrente de condução, ou deriva (drift current), resulta do lento deslocamento médio de portadores de carga produzido por um campo elétrico externo, simultâneo com o movimento rápido e aleatório caracterı́stico das partı́culas em agitação térmica. Esta corrente é da mesma natureza que nos metais, entretanto, nos semicondutores ela é formada tanto por elétrons quanto por buracos. Quando um campo elétrico é aplicado ao material, elétrons e buracos têm movimentos de deriva em sentidos opostos. Porém, como eles têm cargas opostas, as intensidades das correntes elétricas dos dois tipos de portadores se somam. Como vimos na Seção 4.5, a densidade de corrente de elétrons é relacionada com o campo elétrico E por, Jn = σn E , (5.45) onde σn é a condutividade devida aos elétrons. Usando a Eq.(4.25) temos, σn = e2 n0 τe m∗e , (5.46) 146 Materiais e Dispositivos Eletrônicos onde τe é o tempo de colisão dos elétrons. Nesta expressão utilizamos a concentração de equilı́brio n0 de elétrons porque a aplicação do campo elétrico tem efeito desprezı́vel no valor das concentrações dos portadores. Como a condutividade resulta do movimento médio do conjunto de elétrons, é útil definir uma nova grandeza, que descreva a facilidade com a qual cada elétron se desloca no material sob a ação do campo externo. Esta grandeza é a mobilidade, definida pela razão entre a velocidade de deriva e o campo elétrico, µ= v E . (5.47) Comparando (4.25), (5.46) e (5.47) vemos que a condutividade pode ser escrita como, σn = e n0 µn , (5.48) onde µn é a mobilidade dos elétrons, dada por µn = eτe m∗e . (5.49) Note que, pela definição, a mobilidade envolve explicitamente apenas parâmetros intrı́nsecos do material, pois é uma grandeza caracterı́stica de cada elétron. Entretanto ela depende indiretamente da concentração de impurezas, uma vez que esta é um fator determinante do tempo de colisão τe . A Fig.5.16 Figura 5.16: Mobilidade de elétrons em função da temperatura, em silı́cio tipo n, para várias concentrações de impurezas Nd [Yang]. Cap. 5 Materiais Semicondutores 147 mostra a variação da mobilidade de elétrons com a temperatura, em silı́cio tipo n, para diversas concentrações de impurezas doadoras. Note que a mobilidade diminui com o aumento da concentração de impurezas, devido à diminuição de τe resultante da colisão do elétron com as impurezas. Ela também diminui com a temperatura devido ao aumento das colisões dos elétrons com as vibrações térmicas da rede. Por analogia ao que foi feito para os elétrons, vemos que densidade de corrente de buracos é dada por Jp = σp E , (5.50) sendo σp a condutividade devida aos buracos, dada por, σp = e p0 µp = e2 p0 τb m∗b , (5.51) onde τb é o tempo de colisão, p0 a concentração e µb a mobilidade de buracos. A soma de (5.45) e (5.50) dá a densidade total da corrente, J = (σn + σp )E = σE, onde (5.52) σ = e(n0 µn + p0 µp ) , Figura 5.17: Mobilidade de elétrons e buracos em Si e GaAs em função da concentração de impurezas em T = 300 K [Sze]. 148 Materiais e Dispositivos Eletrônicos é a condutividade total do material. Em cada temperatura, σ pode ser calculada a partir das concentrações de elétrons e buracos, obtidos como na seção 5.3, e do valor da mobilidade. A Fig.5.17 apresenta a variação de µn e µp com a concentração de impurezas em silı́cio e arseneto de gálio em T = 300 K. Note que a mobilidade de elétrons em GaAs é cerca de cinco vezes maior que em Si, devido principalmente a menor massa efetiva dos elétrons em GaAs. Evidentemente, num semicondutor tipo n a corrente é devida essencialmente aos elétrons, enquanto que no material tipo p ela é devida aos buracos. A corrente elétrica numa barra de material semicondutor na qual é aplicado um campo externo resulta da mobilidade de elétrons e buracos. Normalmente este campo é estabelecido por uma diferença de potencial entre as extremidades da barra, criada por um circuito externo, como o da Fig.5.18. A corrente no semicondutor é a soma das contribuições dos dois tipos de portadores de carga, uma vez que os elétrons se movimentam em sentido oposto aos buracos. Evidentemente, no fio metálico que fornece a diferença de potencial para a barra, a corrente é inteiramente devida a elétrons. Cabe agora perguntar o que acontece com os buracos nas extremidades da barra. Como a corrente no fio é igual a corrente na barra, o número de elétrons que passa por uma seção reta do fio por unidade de tempo é a soma dos números de elétrons e de buracos no semicondutor, pois a carga de todos eles tem o mesmo módulo. Isto só é possı́vel porque na interface entre o metal e o semicondutor da extremidade A, existe um processo de criação de pares elétron-buraco. Os elétrons Figura 5.18: Ilustração do movimento de elétrons e buracos num material semicondutor e no circuito externo. Cap. 5 Materiais Semicondutores 149 criados na interface A passam para o fio, enquanto os buracos passam a se mover na barra em direção à extremidade B. Na interface B, por outro lado, os buracos recombinam com o excesso de elétrons provenientes do fio metálico, de tal modo que o número de elétrons no semicondutor seja igual à diferença entre o número de elétrons no fio e o número de buracos. Estes processos de criação e recombinação de pares nas interfaces requerem que estas funcionem como fontes ou sumidores perfeitos de elétrons e buracos, sem qualquer tendência de privilegiar um dos dois portadores de carga. Um contato metal-semicondutor com essas caracterı́sticas é chamado contato ôhmico. Num contato ôhmico a resistência é a mesma em qualquer dos dois sentidos da corrente usada para medi-la. Num circuito real, o contato entre um metal e um semicondutor nunca é perfeitamente ôhmico. As caracterı́sticas do contato metal-semicondutor serão estudadas na seção 6.3.1. Exemplo 5.6: Calcule a resistividade do silı́cio em T = 300 K em duas situações: a) Intrı́nseco; b) Dopado com impurezas de As com concentração Nd = 2 × 1016 cm−3 . a) No Si intrı́nseco a condutividade total é calculada com a Eq.(5.52), utilizando os parâmetros da Tabela 5.2 σ = e(n0 µn + p0 µp ) = e ni (µn + µp ) = 1, 6 × 10−19 × 1, 5 × 1010 (1350 + 480) C cm−3 cm2 /V s = 4, 39 × 10−6 (Ω cm)−1 A resistividade é o inverso da condutividade, logo, ρ= 1 1 = 2, 28 × 105 Ω cm . = σ 4, 39 × 10−6 b) No Si com impurezas doadoras com Nd ni , a concentração de elétrons é dada por (5.37), n0 ≃ Nd = 2 × 1016 cm−3 . Como p0 n0 , a condutividade é σ ≃ e n0 µn , sendo µn dado pelo gráfico da Fig.5.17. σ ≃ 1, 6 × 10−19 × 2 × 1016 × 103 = 3, 2 (Ω cm)−1 Logo, ρ= 1 = 0, 31 Ω cm 3, 2 Veja que uma dopagem relativamente fraca (1 parte em 106 ) aumenta a resistividade do silı́cio em quatro ordens de grandeza. 150 5.4.2 Materiais e Dispositivos Eletrônicos Movimento em Campo Magnético - Efeito Hall Se um campo magnético estático é aplicado numa barra de semicondutor, perpendicularmente à direção de movimento de deriva das cargas, estas tendem a ser defletidas lateralmente, crinado um acúmulo de cargas que resultam numa diferença de potencial transversal à barra. Vamos considerar a geometria mostrada na Fig.5.19, na qual a direção z do sistema de coordenadas é x é a direção da corescolhida como sendo a direção do campo magnético B, rente e y é a direção transversal. A força do campo magnético sobre as cargas é dada por . F = q v × B (5.53) Vamos supor que o semicondutor é tipo p, de modo que a corrente é devida essencialmente aos buracos. Como estes se movimentam na direção +x e têm carga positiva, a força sobre eles tem o sentido −y. Esta força deflete os buracos e resulta no acúmulo de cargas positivas no lado y = −d/2 da barra deixando, por conseguinte, cargas negativas no lado y = +d/2. Estas cargas criam um campo elétrico no sentido +y que, após um transiente inicial, impedem a continuação do movimento dos buracos na direção y. O valor do Figura 5.19: Efeito Hall num semicondutor. A aplicação de um campo magnético numa barra com corrente resulta numa diferença de potencial transversal VH que permite medir a concentração de portadores. Cap. 5 Materiais Semicondutores 151 campo elétrico transversal pode ser calculado considerando que a força total sobre um buraco é dada por F = q (E + v × B) . (5.54) Em regime estacionário a componente y desta força deve ser nula. Então a componente y do campo elétrico é, y = vx Bz Ey = −(v × B) . (5.55) O aparecimento deste campo elétrico transversal é conhecido como o efeito Hall, em homenagem a E.H. Hall que observou o fenômeno em condutores em 1879. A tensão transversal que aparece na barra, VH = Ey d, é chamada a tensão Hall. Utilizando a relação entre a densidade de corrente de buracos e a velocidade, Jp = e p0 vx , temos Ey = Jp Bz ≡ RH Jp Bz ep0 , (5.56) onde RH = (ep0 )−1 é o coeficiente Hall. A medida da tensão Hall permite determinar a concentração de portadores p0 com bastante precisão. Na verdade ela dá informação sobre a diferença entre as concentrações de elétrons e de buracos. Note que no caso da corrente ser produzida por elétrons a velocidade vx é negativa e, portanto, pela Eq.(5.55) o campo elétrico e a tensão Hall têm o sentido oposto ao do caso dos buracos. Assim, o sinal da tensão Hall permite determinar o sinal dos portadores majoritários de carga. No caso da concentração de elétrons ser comparável com a de buracos, o valor da tensão Hall permite determinar a diferença (p0 − n0 ). Apesar de ter sido descoberto há mais de um século, o efeito Hall constitui ainda hoje uma técnica importante de investigação das propriedades de condução dos materiais. Foi com esta técnica que o alemão K. von Klitzing descobriu que quando o movimento de elétrons num semicondutor é confinado a duas dimensões, a tensão Hall varia com o campo magnético em degraus. Este é um efeito quântico resultante da quantização dos nı́veis de energia de elétrons no campo magnético. A descoberta do efeito Hall quântico valeu a von Klitzing o Prêmio Nobel de Fı́sica de 1985. O efeito Hall também tem várias aplicações práticas. Uma das mais importantes é na medida de campos magnéticos. O sensor Hall é constituı́do de uma pequena barra de semicondutor, percorrido por uma certa corrente elétrica. Quando colocado num campo 152 Materiais e Dispositivos Eletrônicos magnético cuja intensidade deseja-se medir, o valor da tensão que aparece transversalmente no sensor fornece uma medida direta do campo. Exemplo 5.7: Uma barra de silı́cio tipo p, com concentração de impurezas Na = 1014 cm−3 , com espessura d = 0, 5 mm, é usada como sensor Hall. Calcule a tensão Hall para uma corrente de prova de 100 mA quando o campo magnético é perpendicular ao plano da dimensão maior e tem intensidade B = 10−1 T. A tensão Hall é dada por VH = Ey e a densidade de corrente é J = I/( d), onde e d são largura e a espessura da barra. Sendo Na ni , p0 ≃ Na n0 , a corrente é dominada pelos buracos. Então, usando (5.56) e convertendo todas as unidades para o sistema internacional temos, I/( d) I Bz = Bz = e p0 e p0 d 10−1 × 10−1 = = 1, 25 V . −19 1, 6 × 10 × 1014 × 106 × 0, 5 × 10−3 VH = Este exemplo mostra que a tensão Hall tem um valor relativamente alto, para circuitos eletrônicos, para um valor de campo tı́pico de laboratórios. Isto não ocorre em metais, porque a concentração de elétrons livres (∼ 1022 cm−3 ) é muito maior do que em semicondutores. 5.4.3 Corrente de Difusão A corrente de condução resulta do movimento de cargas produzido por um campo elétrico, ou seja, pelo gradiente de potencial elétrico. Este não é o único gradiente que produz corrente elétrica num semicondutor. Quando portadores de carga são criados não-uniformemente num material, o gradiente de concentração resultante produz movimento de portadores. Este movimento, chamado de difusão, ocorre no sentido da região de maior para a de menor concentração. Como os portadores têm carga elétrica, seu movimento de difusão resulta numa corrente elétrica, chamada corrente de difusão. O movimento de difusão é muito comum na fı́sica. É através dele que uma gota de tinta azul de caneta, colocada num copo d’água, espalha-se no copo deixando a água uniformemente azulada após um certo tempo. A difusão das moléculas da tinta da água resulta de seu movimento aleatório de agitação térmica. Neste processo, cada molécula, tanto da água quanto da tinta, move-se numa direção arbitrária até colidir com outra molécula. Após o choque a molécula se move em outra direção, resultando num movimento Cap. 5 Materiais Semicondutores 153 completamente aleatório. Desta forma, as moléculas de tinta, que estavam inicialmente concentradas numa certa região, após um certo tempo se encontram completamente difundidas na água. No caso do semicondutor, a difusão dos portadores de carga em excesso, inicialmente concentrados numa certa região, resulta de seu movimento aleatório na rede cristalina do material. Para obter a equação que descreve o movimento de difusão, vamos considerar inicialmente um modelo simples, no qual buracos se movimentam em uma dimensão, digamos a direção x. A concentração de buracos em excesso do equilı́brio é descrita pela função p(x). Seja a distância média percorrida por um buraco entre duas colisões, o livre caminho médio, e τ o tempo médio entre duas colisões. Considere dois planos perpendiculares a x, com coordenadas x e x + ∆x, sendo ∆x = , como na Fig.5.20. No movimento aleatório que caracteriza a difusão, os buracos que estão entre os planos x e x + ∆x têm igual probabilidade de se moverem no sentido +x ou −x. Da mesma forma, os buracos entre os planos x − ∆x e x podem se mover no sentido +x ou −x com igual probabilidade. Se a concentração de buracos for a mesma à esquerda ou à direita de x, o número lı́quido de buracos que atravessa o plano x é nulo, sendo nula também a corrente elétrica. Por outro lado, se houver um gradiente de concentração de buracos, a corrente no plano x será diferente de zero. Ela será proporcional à diferença das concentrações à esquerda e à direita de x. Como metade dos buracos entre x − ∆x e x cruza o plano x, no sentido +x, durante um intervalo de tempo τ , a corrente devido a esses buracos numa seção reta de área A é aproximadamente, Figura 5.20: Ilustração das correntes entrando e saindo de uma região com volume A∆x de carga. Materiais e Dispositivos Eletrônicos 154 1 1 e A p(x − ∆x/2) × , 2 τ porque a corrente é a razão entre a carga total que atravessa a seção e o intervalo de tempo, sendo a carga total igual à carga do buraco vezes o número de buracos. Para obter a densidade de corrente no plano x, é preciso subtrair a contribuição dos buracos que estão entre x e x + ∆x e que cruzam o plano x no sentido −x, e dividir a diferença pela área A. O resultado é, 1 ∆x ∆x e p(x − ) − p(x + ) 2τ 2 2 . Supondo que a variação de p(x) com x ocorra em distâncias muito maiores que ∆x = , podemos considerar que ∆x é muito pequeno, de modo que a expressão entre colchetes é −∆x dp/dx. Assim a densidade de corrente de difusão dos buracos na direção +x é dada por, Jpdif = −e Dp dp(x) dx , (5.57) 2 onde Dp = /2τ é o coeficiente de difusão dos buracos. A corrente de difusão dos elétrons pode ser obtida do mesmo modo que a de buracos. Como o elétron tem carga −e, sua corrente de difusão é Jndif = +e Dn dn(x) dx , (5.58) sendo Dn o coeficiente de difusão e n(x) a concentração de elétrons. Tanto (5.57) quanto (5.58) mostram que, como esperado, a corrente de difusão será nula se não houver variação espacial da concentração de portadores. Estas equações, obtidas supondo que as concentrações só variam na direção x, representam as componentes x das correntes de difusão. No caso mais geral de variação em três dimensões, as componentes y e z são dadas pelas derivadas em relação a y e z. Assim, a generalização de (5.57) e (5.58) leva à duas equações envolvendo o operador gradiente, Jpdif = −e Dp ∇p Jndif = +e Dn ∇n (5.59) . (5.60) Cap. 5 Materiais Semicondutores 155 As Equações (5.59) e (5.60) permitem calcular as correntes de difusão de buracos e de elétrons a partir das variações de suas concentrações. Na maioria das situações, entrentanto, estas não são conhecidas a priori, precisam ser calculadas. Para obter as equações que fornecem a evolução das concentrações é preciso ter outra relação independente entre a corrente de difusão e a concentração. Para obter esta relação, vamos considerar inicialmente o modelo unidimensional da Fig.5.20 para relacionar a densidade de corrente com a variação temporal da densidade. Vamos supor também, inicialmente, que o fenômeno de geração e recombinação de pares elétron-buraco é desprezı́vel. Veja que a corrente lı́quida I que entra no volume assinalado na figura, dividida pelo volume, é a diferença das densidades de corrente em x e em x + ∆x, dividida por ∆x, I J(x) − J(x + ∆x) = . A ∆x ∆x Sendo I = dq/dt, este resultado leva, no limite ∆x → 0, à seguinte equação diferencial, ∂ρ ∂J(x) =− , (5.61) ∂t ∂x onde ρ = q/(A ∆x) é a densidade volumétrica de carga. Esta é a equação da continuidade de carga, que exprime o fato de que a carga total é conservada. Se a densidade de corrente tiver também componentes y e z, (5.61) pode ser generalizada para três dimensões ∂Jx ∂Jy ∂Jz ∂ρ =− + + , ∂t ∂x ∂y ∂z ou ∂ρ ∇ · J = − ∂t . (5.62) Esta é a equação da continuidade de carga em três dimensões. Ela vale qualquer que seja a origem da corrente. Veja que ela está contida nas equações = 0 para qualquer de Maxwell estudadas no Capı́tulo 2. Como ∇ · ∇ × A campo vetorial A, a operação ∇ na Eq.(2.4) juntamente com (2.1) reproduzem a equação da continuidade (5.62). A densidade de carga ρ está relacionada com as concentrações de elétrons e buracos por 156 Materiais e Dispositivos Eletrônicos ρ = e (p − n) . (5.63) Para obter a equação da evolução da concentração, vamos supor, para simplificar, um semicondutor tipo n, isto é, apenas com elétrons em excesso do equilı́brio. Assim, de (5.62) e (5.63) vem, ∇ · J = e ∂n ∂t . (5.64) Substituindo este resultado na Eq.(5.60) submetida ao operador divergência (∇.), obtemos, ∂n =0 . (5.65) Dn ∇ 2 n − ∂t Esta é a equação da difusão, que permite calcular a evolução espacial e temporal da concentração de elétrons em excesso, sujeitos apenas ao movimento de agitação térmica. Uma equação idêntica vale para a concentração p de buracos, com o correspondente coeficiente de difusão Dp , e também para a concentração de moléculas de tinta azul no copo d’água. A equação da difusão mostra que enquanto houver variação espacial da concentração, também haverá variação no tempo. A Figura 5.21 mostra a evolução da concentração n(x) após a produção de um pulso de elétrons na posição x = 0 e t = 0. Em t = 0 os elétrons estão concentrados em x = 0 e podemos escrever n(x) = δ(x). Em t > 0 os elétrons difundem para regiões de menor concentração. A solução de (5.65) é uma função gaussiana (Problema 5.17), que se alarga gradualmente à medida que o tempo passa, como mostrado na Fig.5.21. Como o número total de elétrons é conservado, a área sob a curva não varia com o tempo. Após um longo tempo n(x) é uniforme, de modo que ∇2 n = 0 e portanto n(x) fica constante. Se, além do gradiente de concentração de portadores, houver um campo elétrico E aplicado ao semicondutor, as densidades de corrente de elétrons e de buracos terão componentes de condução e de difusão, Jn = e µn n E + e Dn ∇n Jp = e µp p E − e Dp ∇p (5.66) , (5.67) sendo a corrente total J = Jn + Jp . (5.68) Cap. 5 Materiais Semicondutores 157 Figura 5.21: Ilustração da difusão de elétrons criados por um pulso em x = 0 no instante t = 0. Como veremos no próximo Capı́tulo, todas as componentes da corrente são relevantes para o funcionamento de dispositivos semicondutores. São o campo elétrico e as concentrações de portadores na região de uma junção entre dois semicondutores tipos p e n, que determinam a relação entre a tensão e a corrente num dispositivo de junção e, portanto, o seu funcionamento. Para concluir esta seção, vamos obter uma importante relação entre o coeficiente de difusão e a mobilidade. Quando o semicondutor está em equilı́brio térmico, sem campo externo, tanto a corrente de elétrons quanto a de buracos devem ser nulas. Nesta situação se, devido ao movimento térmico, as cargas produzirem uma variação em sua concentração, o campo elétrico por ela criado produzirá uma corrente de deriva que cancelará a corrente de difusão. A relação entre este campo interno E e o gradiente de concentração em equilı́brio pode ser obtida de (5.66) e (5.67) com Jn = Jp = 0. Como o campo elétrico é o gradiente do potencial, E = −∇φ , (5.69) da Eq.(5.67) com Jp = 0 obtemos, 1 µp ∇φ = − ∇p0 Dp p0 , (5.70) onde p0 é a concentração de equilı́brio de buracos. Uma relação análoga a 158 Materiais e Dispositivos Eletrônicos (5.70) vale para os elétrons. Substituindo em (5.70) a expressão de p0 dada por (5.32) obtemos, µp 1 ∇φ = − ∇(Ei − EF ) Dp kB T . (5.71) O nı́vel de Fermi não pode variar com a posição pois o sistema está em equilı́brio, logo ∇EF = 0. Por outro lado, a energia de um elétron no potencial elétrico φ é E = −eφ. Isto significa que se o potencial elétrico variar no espaço, os nı́veis e bandas de energia do elétron acompanham o potencial, ou seja, ∇Ei = −e∇φ. Usando esta relação em (5.71) vem, kB T Dp = µp e . (5.72) Como a relação obtida para elétrons é idêntica, podemos escrever Dp Dn kB T = = µp µn e . (5.73) Este resultado, conhecido como a relação de Einstein, permite calcular o coeficiente de difusão a partir da medida da mobilidade, ou vice-versa. A Tabela 5.2 apresenta os valores de D e µ para Ge, Si e GaAs em T = 300 K. Verifique que em todos eles D/µ ≃ 0, 026 eV, que é o valor de kB T /e nesta temperatura. 5.4.4 Injeção de Portadores: Difusão com Recombinação. Um processo muito importante na operação de dispositivos, é aquele no qual portadores em excesso do equilı́brio são introduzidos numa região do semicondutor por um mecanismo externo qualquer. Isto é chamado de injeção de portadores. Ela ocorre, por exemplo, quando elétrons, que são os portadores majoritários num semicondutor tipo n, passam para o lado p numa junção p − n. Na região da junção os elétrons são injetados no semicondutor p. No processo de injeção de portadores, o mecanismo de recombinação de pares elétron-buraco não pode ser desprezado como foi feito na seção anterior. Como os portadores injetados estão em excesso da concentração de equilı́brio, é o processo de recombinação que faz sua concentração diminuir e tender para Cap. 5 Materiais Semicondutores 159 o equilı́brio. Considere, por exemplo, buracos injetados num semicondutor de modo que em certo instante sua concentração seja p = p0 + δp . (5.74) A recombinação do excesso de buracos com os elétrons existentes no semicondutor ocorre numa taxa que é tanto maior quanto maior for δp. Em primeira aproximação o processo pode ser descrito por δp ∂δp =− ∂t τp , (5.75) onde τp é o tempo de recombinação de buracos. Veja que se não houver outro mecanismo atuando para a evolução de δp, a solução da Eq.(5.75) é δp(t) = A e−t/τp , (5.76) onde A é o valor de δp no instante t = 0. Este resultado mostra que a recombinação atua no sentido de fazer o excesso de portadores decair exponencialmente no tempo, com um tempo caracterı́stico τp . No caso de elétrons, o excesso de concentração δn é descrito por uma equação análoga a (5.75), com um tempo de recombinação τn , ∂δn δn =− ∂t τn . (5.77) Os portadores injetados numa certa região do semicondutor produzem um gradiente de concentração que, por sua vez, resulta numa corrente de difusão. Assim, no processo de injeção, a evolução espacial e temporal da concentração de portadores é determinada pelos processos de difusão e de recombinação. Para obter a equação que descreve este processo, basta subtrair da derivada temporal da concentração na equação da difusão (5.65) o termo que descreve a recombinação, dado por (5.77). Combinando (5.65) com (5.77) e levando em conta que ∂n0 /∂t = 0, pois a concentração de equilı́brio é constante, obtemos para os elétrons, ∂δn δn = Dn ∇2 δn − ∂t τn Um desenvolvimento análogo para buracos leva à, . (5.78) 160 Materiais e Dispositivos Eletrônicos ∂δp δp = Dp ∇2 δp − ∂t τp . (5.79) Estas são as equações da difusão com recombinação. Elas permitem calcular a evolução no espaço e no tempo das concentrações de portadores injetados num certo instante numa região do semicondutor. Se um pulso na concentração de elétrons é produzido em x = 0 e t = 0, a evolução do pulso no tempo é semelhante ao da Figura 5.21. A diferença para o caso descrito na seção anterior, enunciado no Problema 5.17, é que agora a área sob a curva diminui com o tempo. Isto é devido ao processo de recombinação de pares, que faz a concentração de elétrons em excesso do equilı́brio decair com o tempo caracterı́stico τn . Se, além disso, houver um campo elétrico ao longo da barra, à medida que o pulso de concentração alarga e diminui de área, ele se desloca devido ao efeito de deriva dos elétrons. Para encerrar este Capı́tulo, vamos aplicar a equação da difusão com recombinação ao caso de injeção em regime estacionário. Isto é o que ocorre, por exemplo, quando um feixe de luz incide sobre uma região de um semicondutor com intensidade constante. Os fótons produzem pares elétron-buraco na região iluminada. Se a intensidade do feixe for constante, após o transiente que ocorre quando a luz começa a incidir, o processo entra em regime estacionário. Nesta situação, a taxa de criação de pares é constante e a derivada temporal é nula. Isto também é o que ocorre quando uma corrente constante atravessa uma junção p-n. Quando os portadores majoritários de um lado chegam na junção, eles são injetados no outro lado com uma taxa constante. Em regime estacionário ∂/∂t = 0, e das Eqs.(5.78) e (5.79) obtemos ∇2 δn = δn L2n , (5.80) ∇2 δp = δp L2p , (5.81) √ onde Ln = Dn τn e Lp = Dp τp são os comprimentos de difusão de elétrons e buracos, respectivamente. A razão deste nome ficará clara com o seguinte exemplo: considere uma barra de semicondutor semi-infinito, no qual buracos são injetados uniformemente em x = 0 com uma taxa constante, de modo que o excesso de concentração é mantido constante neste ponto, δp(x = 0) = ∆p. Os buracos injetados difundem ao longo da barra e recombinam com elétrons. Isto resulta numa distribuição do excesso de concentração ao longo da barra, caracterizado pela função δp(x). Para obter δp(x) utilizamos Cap. 5 Materiais Semicondutores 161 (5.81) e consideramos ∂ 2 /∂ 2 y = ∂ 2 /∂z 2 = 0 no Laplaciano, de modo que, d2 δp(x) δp = 2 2 dx Lp . (5.82) A solução desta equação é δp(x) = C1 e−x/Lp + C2 ex/Lp . (5.83) onde C1 e C2 são constantes determinadas pelas condições de contorno. Devido à recombinação ao longo da barra, δp deve tender a zero em x → ∞. Assim C2 = 0. Como em x = 0, δp = ∆p, a constante C1 é igual a ∆p. Portanto, δp(x) = ∆p e−x/Lp . (5.84) Esta função está mostrada na Fig.5.22. Os buracos injetados em x = 0 a uma taxa constante no tempo, resultam numa concentração δp em excesso do equilı́brio p, que cai exponencialmente com x. O comprimento caracterı́stico dessa exponencial é Lp , que é precisamente o comprimento de difusão de buracos. O valor do comprimento de difusão depende do tipo de portador, do semicondutor e da concentração de impurezas. A dependência do portador Figura 5.22: Concentração de buracos resultante de um processo de injeção com taxa constante em x = 0. 162 Materiais e Dispositivos Eletrônicos e do material se dá tanto através do coeficiente de difusão D (veja Tabela 5.2), quanto do tempo de recombinação τ . A dependência da concentração de impurezas ocorre através de τ . Quanto maior a concentração, menor é o tempo 2 −6 −7 de recombinação. Como D varia √ na faixa 10-200 cm /s e τ ∼ 10 −3− 10−2 s, o comprimento de difusão L = Dτ está tipicamente na faixa de 10 −10 cm, ou 10−100 µm. REFERÊNCIAS N.W. Ashcroft e N.D. Mermin, Solid State Physics, Holt, Rinehart and Winston, New York, 1976. A. Bar-Lev, Semiconductors and Electronic Devices, Prentice-Hall, New Jersey, 1984. D.A. Fraser, The Physics of Semiconductor Devices, Claredon Press, Oxford, 1983. R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. K. Kano, Semiconductor Devices, Prentice-Hall, New Jersey, 1998. C. Kittel, Introduction to Solid State Physics, J. Wiley, New York, 1996. H.A. Melo e R.S. de Biasi, Introdução à Fı́sica dos Semicondutores, Edgard Blücher, 1975. D.J. Roulston, An Introducion to the Physics of Semiconductor Devices, Oxford University Press, Oxford, 1999. B.J. Streetman e S. Banerjee, Solid State Electronic Devices, Prentice Hall, New Jersey, 2000. S.M. Sze, Physics of Semiconductor Devices, J. Wiley, New York, 1981. E.S. Yang, Fundamentals of Semiconductor Devices, McGraw-Hill, New York, 1978. F.F.Y. Wang, Introduction to Solid State Electronics, North-Holland, Amsterdam, 1980. J.A. Zuffo, Dispositivos Eletrônicos, McGraw-Hill, São Paulo, 1976. Cap. 5 Materiais Semicondutores 163 PROBLEMAS 5.1 Utilize um desenvolvimento análogo ao da seção 4.3 para demonstrar que a massa efetiva dos buracos é dada pela expressão (5.7). 5.2 Mostre que num semicondutor intrı́nseco, com bandas parabólicas, o nı́vel de Fermi é dado pela Eq.(5.22). 5.3 a) Mostre que as concentrações efetivas de elétrons e de buracos, Nc e Nv , podem ser calculadas numericamente com a expressão ∗ mc,v T 3/2 Nc,v (T ) = 2, 54 × 1019 cm−3 , m0 300 onde T é a temperatura em K. Aplique esta expressão para Si e Ge e compare com os valores da Tabela 5.2; b) Calcule os valores de ni em T = 300 K para Ge, Si e GaAs a partir dos dados da Tabela 5.2 e compare com os valores da Tabela e da Figura 5.8. 5.4 Calcule a distância entre o nı́vel de Fermi EF e o meio do gap em Si e em GaAs puro a T = 300 K. Explique porque EF não está no meio do gap. 5.5 Usando os dados da Tabela 5.2, calcule a energia de ionização de impurezas doadoras em Si no modelo do átomo de hidrogênio desenvolvido na seção 5.3.1. 5.6 Considere um semicondutor tipo p com Na impurezas aceitadoras, todas Na : a) Partindo da lei de ação ionizadas, a uma temperatura tal que ni das massas (5.30) e da equação de neutralidade de cargas (5.33), obtenha as expressões para as concentrações de elétrons e buracos (5.41) e (5.42); b) Utilizando os resultados do item a) e as Eqs.(5.28) e (5.32), mostre que o nı́vel de Fermi é dado por (5.43) ou (5.44); c) Mostre que Ei dado por (5.22) é compatı́vel com as expressões obtidas no item c). 5.7 Três pastilhas de silı́cio são dopadas com impurezas de As com concentrações 1016 , 1017 e 5 × 1018 átomos/cm3 respectivamente. Considere T = 300 K e suponha que todas impurezas sejam ionizadas: a) Calcule o nı́vel de Fermi em cada pastilha; b) Verifique se a aproximação da Eq.(5.15) para a função de Fermi-Dirac é boa nos três casos; c) Calcule a resistividade de cada pastilha. 5.8 A probabilidade dos elétrons ocuparem os nı́veis de energia discretos das impurezas não é dada simplesmente pela estatı́stica de Fermi-Dirac. Podese mostrar que a concentração de impurezas doadoras ionizadas é dada 164 Materiais e Dispositivos Eletrônicos por (ver Ashcroft e Mermin) Nd+ = Nd 1 (Ed −Ef )/kB T 1+ 2 e , onde Ed é o nı́vel de energia da impureza. a) Verifique se a suposição de completa ionização é boa nas três pastilhas do Problema 5.7; b) Faça um gráfico de Nd+ /Nd em função de T para a pastilha do Problema 5.7 com a maior concentração, supondo que Eg não varia em T (0 − 400 K). 5.9 Uma pastilha de GaAs é dopada com impurezas doadoras com concentração 1017 átomos/cm3 . Supondo que todas as impurezas estejam ionizadas, calcule a resistividade da pastilha e compare com o valor obtido no problema 5.7 para o Si com a mesma concentração. 5.10 Calcule as concentrações de impurezas doadoras que tornam Si e GaAs degenerados (EF = Ec ). 5.11 Uma pastilha de silı́cio tem impurezas aceitadoras com concentração Na = 2 × 1014 cm−3 . Suponha que todas estão ionizadas. a) Calcule as concentrações de elétrons e de buracos em T = 300 K. Nesta situação, o semicondutor é considerado intrı́nseco ou extrı́nseco? b) Calcule as concentrações de elétrons e buracos em T = 600 K, sabendo que nesta temperatura o gap diminui para 1,0 eV. Nesta situação o semicondutor é intrı́nseco ou extrı́nseco? 5.12 a) Explique, qualitativamente, usando poucas palavras e alguns gráficos, porque o nı́vel de Fermi no semicondutor tipo n está mais próximo da banda de condução do que da de valência, e no tipo p está mais próximo da banda de valência; b) Explique, qualitativamente, usando poucas palavras e alguns gráficos, como o nı́vel de Fermi varia com a temperatura num semicondutor tipo n. 5.13 Um termistor é um resistor cuja resistência varia com a temperatura. Considere um termistor feito de silı́cio intrı́nseco, cuja resistência é 500 Ω em T = 300 K: a) Supondo que a mobilidade não varia com a temperatura, calcule a taxa de variação da resistência com a temperatura em torno de 300 K, expressa em Ω/◦ C; b) Qual é, aproximadamente, a resistência do termistor em T = 320 K? 5.14 Uma barra de germânio tem comprimento 1 cm e seção reta quadrada de lado 1 mm. (a) Calcule a resistência entre as duas extremidades da barra a T = 300 K no caso do semicondutor intrı́nseco; b) Considere que a barra foi dopada com uma certa concentração de impurezas doadoras Cap. 5 Materiais Semicondutores 165 Nd . Supondo que a mobilidade é a mesma do material puro, qual deve ser o valor de Nd para que a resistência seja 10 Ω a T = 300 K? 5.15 Uma barra de semicondutor com concentração de portadores majoritários 1016 cm−3 tem largura d = 1 mm e espessura 0,5 mm. Qual a tensão Hall na barra quando submetida a um campo magnético B = 0, 1 weber/m2 (1 kG) e percorrida por uma corrente 100 mA? 5.16 Uma barra semi-infinita feita de material semicondutor tem uma distribuição estacionária de buracos mostrada na Figura 5.22. Esta distribuição é mantida por uma certa corrente I constante, entrando na extremidade da barra em x = 0 através de um contato metálico. a) Utilizando a expressão (5.57) para a corrente de difusão, calcule a corrente I = Ip (x = 0) em função de Lp , Dp e da concentração em excesso δp em x = 0; b) Mostre que esta corrente é igual a carga total existente em x > 0, obtida pela integração da distribuição de buracos δp(x), dividida pela vida média τp dos buracos. Explique porque este cálculo leva ao mesmo resultado que o do item a). 5.17 Considere a função gaussiana para a concentração de elétrons em excesso do equilı́brio num semicondutor na forma de uma barra como a da Figura 5.20, numa seção de abcissa x no instante t, ∆N0 2 δn(x, t) = √ e−x /4Dn t 2 πDn t onde ∆N0 é o número de elétrons por unidade de área no instante t = 0 na região entre duas seções espaçadas de ∆x em torno de x = 0, sendo ∆x muito pequeno. a) Mostre que esta função gaussiana é solução da equação de difusão para elétrons, Eq.(5.65); b) Mostre que em t → 0 esta distribuição tende para Aδ(x), sendo A uma constante e δ(x) a função delta de Dirac, que é nula para x = 0, diverge em x = 0 e tem área igual a unidade. Calcule o valor de A; c) Faça um gráfico qualitativo de δn(x) para um instante genérico t1 . Neste instante, calcule a largura δx da distribuição, definida como a distância entre dois pontos nos quais o valor de δn é δn(x = 0)/2. Obtenha a relação entre o coeficiente de difusão Dn , a largura δx e o instante t1 . A partir deste resultado sugira um método para medir o coeficiente de difusão em semicondutores. 166 Materiais e Dispositivos Eletrônicos Capı́tulo 6 Dispositivos Semicondutores: Diodos 6.1 A Junção p-n 168 6.1.1 Fabricação da Junção p-n 6.1.2 A Barreira de Potencial na Junção p-n 6.1.3 Carga e Campo na Junção em Equilı́brio 168 170 175 6.2 Corrente na Junção Polarizada 6.3 Heterojunções 186 6.3.1 Junção Metal-Semicondutor 6.3.2 Heterojunções de Semicondutores 188 190 180 6.4 Diodo de Junção 192 6.4.1 Aplicações 196 6.5 Diodo de Barreira Schottky 6.6 Ruptura na Polarização Reversa: Diodo Zener 6.7 Outros Tipos de Diodos 198 200 202 6.7.1 Varactor 6.7.2 Diodo Túnel 6.7.3 Diodo IMPATT 6.7.4 Diodo Gunn 202 203 206 207 REFERÊNCIAS 210 PROBLEMAS 211 167 168 Materiais e Dispositivos Eletrônicos Dispositivos Semicondutores: Diodos 6.1 A Junção p-n O fato de se poder dopar diversas regiões de um mesmo material semicondutor com diferentes impurezas possibilita a fabricação de uma grande variedade de dispositivos eletrônicos. Num semicondutor contendo uma região tipo p e uma região tipo n, separadas por uma camada fina de transição, é formada o que chamamos de junção p-n. A espessura da camada de transição depende do método de fabricação, estando na faixa de 10−2 a 1 µm. Em quase todos dispositivos semicondutores existe pelo menos uma junção p-n. O comportamento de elétrons e buracos nas junções de um dispositivo determina as caracterı́sticas corrente-tensão (I−V ) de seus diversos terminais. Por esta razão, este Capı́tulo é iniciado com um estudo detalhado da junção p-n. Ele servirá de base para a compreensão da operação dos dispositivos semicondutores. Na próxima seção deduziremos a caracterı́stica I − V do diodo de junção, o dispositivo mais simples de todos, constituı́do de apenas uma junção p-n. Nas seções seguintes descreveremos a operação de outros tipos de diodos. Os transistores e outros dispositivos ativos serão apresentados no Capı́tulo 7. As caracterı́sticas mais detalhadas dos dispositivos semicondutores podem ser encontradas em vários livros listados nas Referências. Os dispositivos semicondutores para aplicações opto-eletrônicas serão abordados no Capı́tulo 8. 6.1.1 Fabricação da Junção p-n A tecnologia de fabricação de junções evoluiu muito desde que o transistor de junção foi inventado em 1948. Os métodos mais empregados atualmente são Cap. 6 Dispositivos Semicondutores: Diodos 169 a difusão e a implantação iônica, mencionadas na Seção 5.3. A Figura 6.1 mostra as etapas mais importantes na fabricação de um diodo de junção p-n por difusão, com a tecnologia planar introduzida no inı́cio da década de 60. O primeiro passo consiste na preparação da pastilha do cristal semicondutor, o substrato, mostrado na Fig.6.1(a). Cerca de 90% dos dispositivos semicondutores são feitos com Si monocristalino. A pastilha, com espessura de alguns décimos de mm, é obtida pelo corte em fatias de um bastão de Si, como o mostrado na Fig.1.11, sendo suas superfı́cies polidas após o corte. Em geral o cristal de Si é crescido com alta concentração de impurezas tipo n, sendo por isso denominado de n+ . A alta concentração facilita a formação de contato ôhmico com a camada metálica depositada posteriormente (Fig.6.1f). Figura 6.1: Etapas da fabricação de um diodo de junção p-n com a tecnologia planar: (a) pastilha de Si usada como substrato; (b) substrato com camada de Si epitaxial dopado com impurezas tipo n; (c) camada óxida sobre o Si; (d) ilustração do processo de fotolitografia para polimerizar certas regiões da resina foto-resistiva; (e) difusão de impurezas tipo p através da janela aberta no óxido; (f) estrutura completa do diodo de junção com contatos metálicos. 170 Materiais e Dispositivos Eletrônicos A etapa seguinte consiste em crescer sobre o substrato uma camada de Si tipo n, com menor concentração de impurezas, usando a técnica de crescimento epitaxial (Fig.6.1b). A pastilha é então levada ao forno numa atmosfera de oxigênio para a formação de uma fina camada (menos de 1 µm de espessura) de óxido SiO2 (Fig.6.1c). A etapa seguinte é a da fotolitografia, que é utilizada para remover seletivamente o óxido de algumas regiões nos quais deseja-se fazer a difusão. Uma pelı́cula de resina foto-resistiva, um lı́quido orgânico polimérico, é espalhada sobre a camada de óxido e levada a um forno para secar. A resina é solúvel em certos solventes, a não ser que esteja polimerizada. A polimerização, em certas regiões, é feita por luz ultra-violeta que passa pelas aberturas de uma máscara colocada sobre a resina, e que contém o desenho desejado. A Fig.6.1(d) mostra a parte opaca da máscara evitando que a área na qual se deseja fazer a difusão seja exposta à radiação ultravioleta. Em seguida usa-se solvente para remover a resina da região não exposta e depois coloca-se a pastilha num banho de ácido, que corrói a camada de óxido na região onde a resina foi removida. Este processo abre uma janela na camada de óxido através da qual é feita a difusão de impurezas tipo p (Fig.6.1e) num forno a alta temperatura (da ordem de 1000◦C). Finalmente, a estrutura é completada com a deposição de filmes metálicos para os contatos externos (Fig.6.1f). A tecnologia planar é empregada para fabricar um simples diodo de junção, ou um transistor com várias junções, ou um complexo circuito integrado contendo milhares de diodos e transistores na mesma pastilha de Si. Um componente importante no processamento da pastilha é a máscara contendo o padrão do circuito a ser produzido. Até a década de 1990, o “layout” original era desenhado em escala grande, para aumentar sua resolução, e posteriormente reduzido fotograficamente para a escala real da máscara. Atualmente o processo é todo feito em computadores através de softwares especı́ficos. Para os modernos circuitos de alta integração, nos quais as dimensões laterais das estruturas são menores que 1 µm, as máscaras são produzidas na escala real por feixes de elétrons. 6.1.2 A Barreira de Potencial na Junção p-n Para tratar matematicamente as equações que descrevem a carga e o potencial elétrico numa junção é necessário fazer algumas aproximações na junção real. A primeira consiste em reduzir o problema para uma dimensão. Veja na Fig.6.1(f), que devido à forma da junção e dos contatos, o movimento dos elétrons e buracos em grande parte do dispositivo ocorre na direção normal Cap. 6 Dispositivos Semicondutores: Diodos 171 à superfı́cie que separa as regiões p e n. Portanto, a suposição de que as grandezas variam apenas em uma direção, digamos x, é uma boa aproximação para o problema real. A segunda aproximação se refere à separação entre as regiões p e n. Na junção real, a variação da concentração de impurezas na fronteira é gradual. A diferença de concentrações, Na − Nd , passa gradualmente de positiva na região p, para negativa na região n, como mostrado pela linha tracejada da Fig.6.2(a). Entretanto, para simplificar o problema, vamos supor que a junção é abrupta, isto é, Na − Nd varia bruscamente de um valor constante e positivo em x < 0 para um valor constante e negativo em x > 0, como na linha cheia da Fig.6.2(a). A Fig.6.2(b) mostra o modelo da junção p-n abrupta, unidimensional, que vamos considerar nesta seção. Para entender o que ocorre na junção em equilı́brio, vamos supor que as regiões p e n do semicondutor estão fisicamente separadas antes da junção ser formada. Nesta situação o nı́vel de Fermi está próximo da banda de condução no lado n e próximo da banda de valência no lado p, como ilustrado na Fig.6.3(a). Suponhamos agora que os dois materiais são postos em contato para formar a junção. Como há excesso de elétrons em relação aos buracos no lado n, há uma difusão de elétrons do lado n para o lado p. Do mesmo modo, ocorre difusão de buracos do lado p para o lado n. Esta difusão de cargas de um lado para o outro produz duas camadas de cargas, ilustradas no topo da Fig.6.3(b), formadas pelas impurezas ionizadas, doadoras no lado n e aceitadores no lado p. Estas camadas de cargas criam um campo elétrico E dirigido do lado n para o lado p, que se opõe à continuação do movimento de cargas causado pela difusão. O campo E empurra os buracos de volta ao lado p e os elétrons de volta ao lado n, através de uma corrente de deriva que se opõe à corrente de difusão. No regime de equilı́brio as correntes de deriva e de difusão se anulam, tanto para elétrons quanto para buracos, de modo que a corrente total é nula. Nesta situação, a distribuição de cargas e o campo elétrico adquirem uma configuração estacionária. A região nas proximidades da junção onde há cargas não compensadas, mostrada nas Figuras 6.2 e 6.3(b), é chamada região de carga espacial. Esta região também é chamada de transição ou de depleção (outro anglicismo técnico: to deplete significa exaurir). O campo E criado nesta região corresponde a uma diferença de potencial V0 entre o lado n e o lado p. Esta diferença de potencial tende a impedir a passagem de portadores majoritários do lado p (buracos) para o lado n e de portadores majoritários do lado n (elétrons) para o lado p. Devido à forma da variação do potencial, ilustrada na Fig.6.3(b), ele é chamado barreira de potencial. A formação da barreira de potencial é o fenômeno fı́sico mais importante que ocorre na junção, sendo o principal 172 Materiais e Dispositivos Eletrônicos Figura 6.2: (a) Variação da concentração de impurezas numa junção p-n. A linha tracejada representa a variação numa junção real enquanto a linha cheia representa uma junção abrupta ideal. (b) Modelo de junção abrupta unidimensional. responsável por suas caracterı́sticas elétricas. A formação da barreira também tem uma implicação importante no comportamento dos nı́veis de energia na junção. Como a energia do elétron é relacionada ao potencial eletrostático φ por E = −eφ, a diferença das energias da banda de condução entre o lado p e o lado n é, Ecp − Ecn = −e(φp − φn ) = eV0 . (6.1) Portanto, a diferença das energias é, em unidades de eVolt, o próprio valor do potencial V0 da barreira. Isto significa que quando a junção é formada, as referências para os nı́veis de energia dos lados p e n se ajustam de modo que a diferença das energias da banda de condução entre os dois lados, bem como da banda de valência, correspondam à diferença de potencial criada pelo campo elétrico produzido na junção. Esta alteração nos nı́veis relativos é decorrência do fato de que o nı́vel de Fermi EF deve ser o mesmo nos dois lados da junção, como mostra a Fig.6.3(b). Pela figura vemos também que como o menor valor possı́vel de EF do lado p é Evp e o maior valor do lado n é Ecn , o valor limite da barreira de potencial é V0 = Eg /e. O potencial se aproxima deste limite Cap. 6 Dispositivos Semicondutores: Diodos 173 Figura 6.3: (a) Semicondutores p e n separados. (b) Carga, campo elétrico, potencial e nı́veis de energia na região de carga espacial da junção p-n. quando as duas regiões da junção estão fortemente dopadas. Na verdade, a explicação para a formação da barreira de potencial poderia ter começado pela análise do nı́vel de Fermi. Ele é relacionado com o potencial quı́mico de um sistema termodinâmico, que é constante quando o sistema está em equilı́brio. Podemos fazer uma analogia entre o nı́vel de Fermi e o nı́vel da água num reservatório, pois todas moléculas da água têm energia (gravitacional) menor que as da superfı́cie. Quando dois reservatórios com nı́veis diferentes são interligados, parte da água do tanque de nı́vel mais alto passa para o outro até que os nı́veis se igualem. O que ocorre quando dois semicondutores são colocados em contato é semelhante. As cargas fluem de um lado para outro até que os nı́veis de Fermi se igualem. Quando isto ocorre, o sistema atinge o equilı́brio. O valor da diferença de potencial V0 da barreira na junção em equilı́brio, também chamado potencial de contato, pode ser calculado de várias maneiras: a mais simples é baseada nos fatos de que o nı́vel de Fermi é constante na junção e o semicondutor intrı́nseco é o mesmo nas duas regiões. Com a Eq.(5.32) podemos escrever as relações entre as energias e as concentrações 174 Materiais e Dispositivos Eletrônicos de equilı́brio de buracos, pp0 do lado p e pn0 do lado n, nas regiões afastadas da junção, pp0 = ni e(Eip −EF )/kB T pn0 = ni e(Ein −EF )/kB T . A razão entre as duas concentrações é então, pp0 = e(Eip −Ein )/kB T pn0 . (6.2) Como o semicondutor intrı́nseco é o mesmo nas regiões p e n, vemos na Fig.6.3(b) que a diferença entre os nı́veis de Fermi intrı́nsecos nos dois lados é precisamente o valor do potencial da barreira em elétron-volt (eV), Eip − Ein = e V0 . Fazendo esta substituição, obtemos V0 = kB T pp0 n e pn0 . (6.3) Este mesmo resultado poderia ser obtido pela integração da Eq.(5.70) que exprime o fato de que na junção em equilı́brio a corrente de buracos é nula (Problema 6.3). Podemos também relacionar o potencial de contato com as concentrações de elétrons nos dois lados da junção. Partindo de (5.31) obtemos V0 = kB T nn0 n e np0 . (6.4) Este resultado também pode ser obtido de (6.3) usando a lei de Ação das Massas. As Eqs.(6.3) e (6.4) podem ser reescritas na forma pp0 nn0 = = eeV0 /kB T pn0 np0 . (6.5) Finalmente, utilizando relações obtidas no Capı́tulo 5, podemos exprimir o potencial de contato em termos das concentrações de impurezas nos dois lados da junção. No lado p, os buracos são os portadores majoritários e sua concentração é, por (5.42), pp0 ≃ Na . Por outro lado, na região n, de acordo com (5.38), pn0 ≃ n2i /Nd . Usando estes valores em (6.3) obtemos, V0 ≃ Na Nd kB T n e n2i . (6.6) Utilizando (5.25) podemos obter outra expressão para o potencial de contato, Cap. 6 Dispositivos Semicondutores: Diodos V0 ≃ kB T Nc Nv Eg − n e e Na Nd . 175 (6.7) Para uma junção de Ge com as mesmas concentrações de impurezas do Exemplo 6.1, pode-se mostrar que (Problema 6.1) V0 = 0,45 V. Veja que a medida que as concentrações de impurezas aumentam, a segunda parcela da Eq.(6.7) diminui e V0 se aproxima de Eg /e. Assim, os máximos valores do potencial de contato são 0,68 V em Ge e 1,12 V em Si. Exemplo 6.1: Considere uma junção p-n de Si, tendo concentrações de impurezas Nd = 1016 cm−3 e Na = 1018 cm−3 . Calcule o potencial de contato da junção em T = 300 K. Usando kB T = 0, 026 eV e os valores de Eg , Nc e Nv da Tabela 5.2, obtemos com a Eq.(6.7), V0 = 1, 12 − 0, 026 n 2, 6 × 1019 × 1, 02 × 1019 1018 × 1016 = 1, 12 − 0, 026 × 10, 18 = 0, 85 V . 6.1.3 Carga e Campo na Junção em Equilı́brio O potencial de contato calculado na seção anterior é a diferença de potencial elétrico entre um ponto no lado p e outro no lado n, ambos afastados da região da junção. Para calcular o campo elétrico é preciso obter a variação do potencial na região de carga espacial, que por sua vez depende da distribuição de cargas na região. Em vez de resolver o problema completo autoconsistentemente, vamos aproximar a distribuição de cargas por uma função simples e calcular o campo e o potencial a partir dela. Para obter esta distribuição vamos considerar o que acontece na região de carga espacial, ilustrada na Fig.6.4(a). Elétrons e buracos estão em trânsito permanente, passando de um lado da junção para outro. Alguns elétrons passam do lado n para o lado p por difusão, recombinam com buracos ou são “empurrados” de volta para o lado n pelo campo elétrico. O mesmo acontece com buracos do outro lado. Como resultado, há poucos elétrons e buracos na região de carga espacial pois eles são varridos de lá pelo campo elétrico. Esta exaustão de cargas móveis da região de carga espacial faz com que esta região também seja chamada de depleção (vem do inglês depletion). Desta forma, as cargas da região são devidas aos ı́ons das impurezas não compensadas, doadoras do lado n e aceitadoras 176 Materiais e Dispositivos Eletrônicos do lado p. Tendo as impurezas doadoras, com concentração Nd , perdido seus elétrons, sua carga é positiva. Por outro lado, as impurezas aceitadoras, com concentração Na , recebem elétrons e tornam-se negativas. Em primeira aproximação podemos então considerar que no lado n, a densidade de carga tem valor ρ = +eNd constante numa camada de espessura n e nulo fora dela. Por outro lado, na região p a densidade é ρ = −eNa numa camada de espessura p e nula fora dela, como ilustrado na Fig.6.4(b). Esta é a chamada aproximação de depleção. Como a carga total deve ser nula, pois a junção é eletricamente neutra, o módulo da carga de um lado é igual ao módulo da carga no outro. Sendo a carga igual ao produto da densidade de carga pelo volume, é fácil ver que as espessuras das camadas são relacionadas com as concentrações de impurezas por, n Nd = p Na . (6.8) Sendo a espessura total da região de carga espacial = p + n , podemos exprimir as espessuras das duas camadas de carga em função das concentrações de impurezas Nd Na p = , n = . (6.9) Na + Nd Na + Nd Estas equações mostram que a espessura é maior do lado de menor dopagem. Para calcular o campo elétrico a partir da distribuição de cargas, utilizamos a lei de Gauss na forma diferencial, Eq.(2.1). Como só há variação = E, a Eq.(2.1) pode ser escrita como: na direção x, usando a relação D dE ρ(x) = dx , (6.10) sendo ρ = eNd em 0 < x < n e ρ = −eNa , em −p < x < 0. A integração de (6.10) com essas densidades resulta numa variação linear do campo elétrico em cada um dos lados, como ilustrado na Fig.6.4(c). Em −p < x < 0, E(x) = − eNa x − E0 , (6.11) onde E0 é uma constante de integração, que corresponde ao valor de E em x = 0. Como E(x = −p ) = 0, pois o campo é nulo fora da região de carga espacial, E0 = eNa p /. De (6.10) vemos também que, em 0 < x < n , E(x) = eNd x − E0 , (6.12) Cap. 6 Dispositivos Semicondutores: Diodos 177 Figura 6.4: Variação da densidade de carga, campo elétrico e potencial eletrostático no modelo unidimensional da junção p-n. onde a constante de integração, determinada por E(x = n ) = 0, deve ser a mesma de (6.11). De fato, usando (6.8), vemos que E0 = eNd n eNa p = . (6.13) A Fig.6.4(c) mostra a variação do campo elétrico dada por (6.11) e (6.12). Note que o campo só é diferente de zero na região de carga espacial, sendo dirigido no sentido −x, como era de se esperar. A partir das expressões do campo elétrico podemos obter a variação do potencial φ(x), usando a relação E(x) = −dφ/dx. A função cuja derivada é a 178 Materiais e Dispositivos Eletrônicos Eq.(6.11) com o sinal trocado é, φ(x) = 1 eNa 2 x + E0 x + C 2 , onde C é uma constante cujo valor depende da escolha da referência do potencial. Tomando como referência φ(x = −p ) = 0 e substituindo a expressão de E0 em (6.13), obtemos C = eNa 2p /2. O potencial em −p ≤ x ≤ 0 é então φ(x) = eNa (x + p )2 2 . (6.14) Para calcular φ(x) em x ≥ 0 integramos (6.12) de maneira análoga e determinamos a constante de integração igualando as expressões dos potenciais nos dois lados em x = 0. O resultado é, para 0 ≤ x ≤ n , eNd 1 2 1 φ(x) = − . (6.15) x − n x − p n 2 2 A variação do potencial dado por (6.14) e (6.15) está mostrada na Fig.6.4(d). Como era esperado, ela tem a forma da barreira de potencial da Fig.6.3(b). O valor do potencial de contato V0 é a diferença de potencial entre os pontos x = n e x = −p , que é simplesmente o valor do potencial em x = n . Usando (6.15) e a expressão de E0 obtemos, V0 = φ(n ) = eNd 1 n = E 0 2 2 . (6.16) Como a diferença de potencial entre dois pontos é a integral do campo elétrico, o resultado (6.16) poderia ter sido facilmente obtido pela área do triângulo que representa a variação de E(x) mostrado na Fig.6.4(c). Partindo das Eqs.(6.9) e (6.16) é possı́vel relacionar as espessuras das camadas de carga com as concentrações de impurezas e o potencial de contato. É fácil mostrar que, V0 = e Na Nd 2 2 Na + Nd de onde obtemos 2V0 = e 1 1 + Na Nd , (6.17) 1/2 . (6.18) Cap. 6 Dispositivos Semicondutores: Diodos 179 Para obter uma expressão para a espessura em função apenas dos parâmetros dos semicondutores que formam a junção, substuı́mos (6.6) em (6.18), obtendo 1/2 2kB T 1 1 Na Nd = + . (6.19) n 2 e2 Na Nd ni A partir desta expressão pode-se calcular as espessuras p e n das camadas de carga nos lados p e n através da Eq.(6.9). Finalmente notamos que, como a diferença de potencial entre os dois lados é produzido por duas camadas de carga, a junção tem uma capacitância C. Sendo A a área da seção reta da junção, as cargas totais nas camadas são +Q e −Q, sendo Q = eNd n A. No caso em que as cargas são distribuı́das nas duas camadas, a capacitância é definida por C = dQ/dV . A partir de (6.9) e (6.18) obtemos então (Problema 6.5): C= A (6.20) onde é dado por (6.19). Vê-se que a capacitância da junção varia inversamente proporcional à espessura da região de carga espacial. Como veremos na próxima seção, pode ser alterado pela aplicação de uma tensão externa, o que permite então variar o valor de C. Exemplo 6.2: Considere uma junção p-n de Si como a do Exemplo 6.1, tendo uma seção reta circular de diâmetro 200 µm. Calcule: a) A espessura da região de carga espacial; b) O campo elétrico máximo; c) A capacitância da junção. a) Para calcular a espessura , usamos a Eq.(6.18), com o valor da carga do elétron e = 1, 6 × 10−19 C, a permissividade do vácuo = 8, 85 × 10−12 Fm−1 . Da Tabela 5.2 temos a constante dielétrica / 0 = 11,8, logo, = 2 × 11, 8 × 8, 85 × 10−12 × 0, 85 1, 6 × 10−19 ≃ 2 × 11, 8 × 8, 85 × 10−12 × 0, 85 1, 6 × 10−19 × 1022 1 1 + 16 1018 × 106 10 × 106 1/2 = 3, 3 × 10−7 m = 0, 33 µm b) De (6.16) vem E0 = 2V0 = 1/2 2 × 0, 85 = 5, 2 × 106 V/m 3, 3 × 10−7 Materiais e Dispositivos Eletrônicos 180 c) Para calcular a capacitância usamos (6.20) com a área A = πR2 , sendo R = 10−4 m o raio da seção circular. C= 6.2 11, 8 × 8, 85 × 10−12 × 3, 14 × 10−8 = 9, 9 × 10−12 F = 9,9 pF . 3, 3 × 10−7 Corrente na Junção Polarizada Quando uma junção é polarizada, isto é, submetida a uma diferença de potencial de um circuito externo, o equilı́brio é alterado resultando numa corrente, cujo sentido depende da tensão aplicada. A caracterı́stica essencial da junção p-n é sua assimetria em relação ao sentido de aplicação da tensão externa. Tensões em sentidos diferentes produzem correntes com intensidades diferentes. Isto pode ser compreendido examinando o efeito da tensão externa na barreira de potencial. Quando uma tensão externa V é aplicada nos terminais da junção, ela aparece quase inteiramente através da região de carga espacial. Isto ocorre porque a densidade de portadores nesta região é muito menor do que nas regiões neutras dos semicondutores e tem portanto resistência muito maior. Assim, a tensão externa soma-se ou subtrai-se do potencial V0 da barreira em equilı́brio, dependendo de seu sentido, como ilustrado na Fig.6.5. Quando a tensão V é aplicada no sentido do lado p para o lado n, chamado direto, ela diminui a barreira de potencial, que passa a ter um valor V0 −V (Fig.6.5b). Por outro lado, se V tem o sentido de n para p, chamado reverso, a barreira aumenta, passando a ter um valor V0 + V (Fig.6.5c). O resultado é que a corrente que atravessa a junção quando a tensão é aplicada no sentido direto é maior que no sentido reverso, dando a junção p-n uma assimetria que é a base de operação dos diodos e dos transistores de junção. É fácil verificar que o campo elétrico e a espessura da região de carga especial também variam com a tensão externa aplicada. Quando a tensão V tem o sentido direto a diferença de potencial na barreira diminui, portanto o campo também diminui. Da mesma forma, a espessura da região de carga diminui, podendo ser calculada pela Eq.(6.18) com V0 − V em lugar de V0 . Por outro lado, quando a junção é polarizada no sentido reverso, a altura da barreira, o campo elétrico e a espessura da região de carga aumentam simultaneamente. Cap. 6 Dispositivos Semicondutores: Diodos 181 Figura 6.5: Efeito de tensão externa na espessura da região de carga espacial e na altura da barreira de potencial: (a) situação em equilı́brio; (b) polarização direta; (c) polarização reversa. Vamos agora considerar o que ocorre com as diversas componentes da corrente na junção, visando calcular sua caracterı́stica I-V . Vamos adotar a convenção de que V é positivo se aplicado no sentido direto e negativo no sentido reverso. Quando uma tensão positiva é aplicada aos terminais da junção, a corrente I entra pelo contato metálico do lado p (Fig.6.2) e sai pelo contato do lado n. Nas duas regiões neutras do semicondutor afastadas da junção, a corrente é inteiramente de deriva e dominada pelos portadores majoritários, buracos no lado p e elétrons no lado n. Esses portadores se movem em direção à região de carga espacial onde se encontram, produzem recombinação e também passam para o outro lado por difusão. Para calcular o valor da corrente I produzida pela tensão V é preciso entender, com detalhe, as várias componentes da corrente na região da junção. Consideremos o que ocorre com os buracos que se movem do lado p em direção à junção. Ao atingirem a região próxima da junção, muitos deles recombinam com elétrons provenientes do lado n. Aqueles que “sobrevivem” chegam à região de depleção, onde a densidade de portadores é bem menor e portanto há pouca recombinação. Ao atingirem a fronteira da região de depleção, o plano de coordenada x ≈ +n na Fig.6.4, os buracos são injetados 182 Materiais e Dispositivos Eletrônicos na região n onde passam a ser portadores minoritários. Nesta região os buracos difundem mais para dentro do lado n enquanto recombinam com os elétrons, resultando numa variação da concentração como aquela obtida na Seção 5.4.4. Os buracos injetados na região n têm uma concentração δp em excesso do valor de equilı́brio p n0 que decai exponencialmente com x. Sendo o comprimento de difusão Lp = Dp τp da ordem de 10−3 cm a 10−1 cm, ele é muito maior que a espessura da camada de carga espacial, ∼ 1 µm = 10−4 cm. Assim, a variação da concentração de buracos pn no lado n da junção tem a forma mostrada na Fig.6.6(a). Comportamento análogo têm os elétrons do lado p, onde são eles os portadores minoritários. Para calcular a corrente total que atravessa a junção podemos tomar como base as correntes dos portadores minoritários nos dois lados. Elas resultam dos movimentos de difusão dos buracos no sentido de p para n e dos elétrons no sentido oposto. Para calculá-las é preciso inicialmente obter as concentrações dos portadores. Para facilitar a notação vamos fazer uma mudança de coordenadas: a coordenada no lado n da junção será representada por x, sendo a origem x = 0 na fronteira da região de carga espacial (plano x = +n na Fig.6.4); no lado p representamos a coordenada por x no sentido −x, sendo x = 0 o ponto x = −p da Fig.6.4. Esta notação está mostrada na Fig.6.6. De acordo com (6.5), a razão entre as concentrações de equilı́brio de buracos nos dois lados é pp0 = eeV0 /kB T . (6.21) pn0 Quando uma tensão externa V é aplicada na junção, o potencial da barreira passa a ser V0 −V , de modo que a diferença entre os nı́veis de Fermi intrı́nsecos nos dois lados fica Eip − Ein = e(V0 − V ). Como mostra a Figura 6.5, este resultado é consistente com uma diferença entre os nı́veis de Fermi nos lados p e n de EF = −eV , devido ao fato de que a junção não está em equilı́brio. Desta forma, a razão entre as concentrações de buracos nas fronteiras da região de carga espacial nos lados p e n, obtida por desenvolvimento análogo ao que levou a Eq.6.2, é dada por, pp (x = 0) = ee(V0 −V )/kB T pn (x = 0) . (6.22) No caso da corrente de junção não ser muito elevada, as concentrações dos portadores majoritários quase não variam em relação aos valores de equilı́brio com a aplicação da tensão externa. Assim, pp (x = 0) ≃ pp0 . Fazendo esta substituição em (6.22) e dividindo esta por (6.21) obtemos, Cap. 6 Dispositivos Semicondutores: Diodos 183 Região de carga espacial Lado p (a) Lado n pn np 0 0 0 0 Ipdif Indif 0 0 I = Ip + In Ipder Inder In Ipdif 0 0 Figura 6.6: Concentrações dos portadores minoritários e correntes nas proximidades da região de carga espacial em junção p-n polarizada diretamente. pn (x = 0) = eeV /kB T pn0 . (6.23) Este resultado mostra que as concentrações de portadores minoritários nas fronteiras da região de carga espacial aumentam exponencialmente com a tensão, no caso de polarização direta. Ao contrário, elas diminuem exponencialmente com a tensão, no caso de polarização reversa. A partir da Eq.(6.23) é simples obter a corrente de difusão de buracos no lado n usando os resultados das seções 5.4.3 e 5.4.4. O incremento na concentração de buracos em relação ao equilı́brio em x = 0, é obtido de (6.23), δpn (x = 0) ≡ pn (x = 0) − pn0 = pn0 (eeV /kB T − 1) . (6.24) A variação de δpn ao longo de x, mostrada na Fig.6.6(a) é obtida uti- 184 Materiais e Dispositivos Eletrônicos lizando (5.84), δpn (x) = pn0 (eeV /kB T − 1) e−x/Lp . (6.25) A partir deste resultado podemos obter a densidade de corrente de difusão de buracos na direção +x. Usando (6.25) em (5.57) vem Jpdif (x) = e Dp pn0 (eeV /kB T − 1) e−x/Lp Lp . (6.26) Sendo A a área da seção reta da junção, a intensidade de corrente de difusão de buracos em x = 0 é então, Ipdif (0) = eA Dp pn0 (eeV /kB T − 1) Lp . (6.27) Na aproximação de que a recombinação na região de carga espacial é desprezı́vel, a corrente de buracos não varia nesta região, como ilustrado na Fig.6.6(c). Por outro lado, um desenvolvimento análogo ao das Eqs.(6.21)-(6.27) leva à corrente de difusão de elétrons na região de carga espacial, Indif (0) = eA Dn np0 (eeV /kB T − 1) Ln . (6.28) Em regime estacionário a corrente total é a mesma em qualquer seção da junção e também igual a corrente I que passa pelos contatos metálicos. Podemos então obter I pela soma das correntes de deriva de elétrons e de buracos na região de carga espacial. Veja na Fig.6.6 que como a corrente total I não varia ao longo de x, as correntes de deriva de elétrons no lado n e de buracos no lado p, são dadas pelas diferenças entre I e as correntes de difusão de buracos e de elétrons, respectivamente. Assim, podemos calcular a corrente total sem utilizar explicitamente as correntes dos portadores majoritários. Somando (6.27) e (6.28) obtemos, I = Is (eeV /kB T − 1) onde Is = eA Dp Dn pno + npo Lp Ln , (6.29) . (6.30) A Eq.(6.29) é chamada a equação do diodo. Ela foi deduzida pela primeira vez por W. Shockley, um dos três fı́sicos que receberam o Prêmio Nobel em 1954 pela descoberta do transistor. Ela permite calcular a corrente I na Cap. 6 Dispositivos Semicondutores: Diodos 185 junção em função da tensão externa V . É importante chamar a atenção para o fato de que na dedução de (6.29)-(6.30) ficou claro que a corrente na junção p-n é dominada pelos portadores minoritários. Note que para tensões negativas e muito maiores que kB T /e (0,026 V à temperatura ambiente), I → −Is . Por esta razão Is é chamada a corrente de saturação reversa. A Eq.(6.30) permite calcular Is em termos unicamente dos parâmetros dos semicondutores que formam a junção. Considerando que à temperatura ambiente as impurezas estão quase totalmente ionizadas, podemos usar as expressões (5.38) e (5.41) para as concentrações de portadores em equilı́brio. Substituindo-as em (6.30) vem Dn Dp 2 + . (6.31) Is = eA ni Lp Nd Ln Na Como ni varia exponencialmente com a energia do gap Eg , a corrente de saturação (6.31) varia muito de um semicondutor para outro. Evidentemente, ela também varia muito com a temperatura. Consideremos uma junção de Ge com concentrações de impurezas Na = 1018 cm−3 e Nd = 1015 cm−3 . Uma Nd é chamada p+ − n. Neste caso o primeiro junção como esta com Na termo em (6.31) domina completamente o segundo. Considerando uma área da junção de A = 10−4 cm2 e tempo de recombinação τp ≃ 0, 1 µs, com os valores de ni e Dp da Tabela 5.2 obtemos, Is ≃ 2, 5 × 10−7 A = 0, 25 µA . A Figura 6.7 mostra a curva I − V dada pela Equação (6.29) com este valor de Is . A parte (b) da figura mostra uma região expandida em torno da origem. Vemos que para V = −0, 1 V a corrente já tem valor praticamente igual a da saturação reversa. Com polarização direta, V > 0, a corrente cresce exponencialmente com V . A Fig.6.7(a) feita numa escala de corrente 105 vezes maior apresenta um aspecto mais familiar da caracterı́stica I − V da junção. Ela é fortemente assimétrica em relação ao sentido de polarização. Com polarização reversa a corrente é desprezı́vel comparada com a de polarização direta, que é a caracterı́stica essencial do diodo. Um aspecto marcante da Fig.6.7(a) é o aumento abrupto da corrente que ocorre num valor de tensão em torno de 0,3 V. Este aspecto da curva é simplesmente o resultado de um crescimento exponencial de I com V . O valor da tensão crı́tica para o qual a corrente cresce bruscamente depende fundamentalmente do semicondutor. Isto pode ser visto substituindo (6.31) em (6.29) e usando a Eq.(5.23) para ni . Desprezando a unidade em presença da exponencial em (6.29) obtemos, Dp Dn + (6.32) I = eA Nc Nv e(eV −Eg )/kB T . Lp Nd Ln Na 186 Materiais e Dispositivos Eletrônicos Figura 6.7: Caracterı́stica I-V de junção p-n ideal dada pela equação do diodo com Is = 0, 25 µA, valor adequado para uma junção de germânio. A curva em (b) é a mesma que em (a), feita em escala ampliada para mostrar o comportamento em torno da origem. Vemos então que a corrente cresce exponencialmente com a diferença entre V e o valor da energia do gap em eV. A tensão crı́tica de crescimento brusco da corrente está na faixa 0,2-0,4 V para junções de germânio e 0,6-0,8 V para junções de silı́cio. Finalmente é preciso notar que em junções reais a resposta I −V desvia de (6.29) devido aos seguintes fatores: a recombinação na região de carga espacial não é completamente desprezı́vel; a concentração de portadores majoritários não permanece em equilı́brio quando a corrente aumenta muito; a junção não é abrupta, como o modelo que consideramos nesta seção. Estes efeitos são tratados em outros livros mais especializados em dispositivos semicondutores. 6.3 Heterojunções Uma junção formada por dois materiais intrinsecamente diferentes é chamada uma heterojunção, em contraste com aquela estudada na seção anterior, que é uma homojunção. Quando os materiais nos dois lados da junção são diferentes, o diagrama de energia exibe uma descontinuidade na interface dos dois materiais, ao contrário do comportamento contı́nuo da Fig.6.3. Em geral Cap. 6 Dispositivos Semicondutores: Diodos 187 são chamadas heterojunções aquelas formadas de semicondutores diferentes, como GaAs e (GaA)As, usada em lasers semicondutores. Porém junções entre metais e semicondutores também são heterojunções e têm utilidade para a fabricação de dispositivos. Junções envolvendo metais têm algumas propriedades e aplicações semelhantes às das junções p-n, mas também têm caracterı́sticas e atrativos peculiares. Este é o caso de junções metal-semicondutor, que são úteis em dispositivos de alta freqüência, e de junções metal-isolante-semicondutor, usadas em circuitos digitais de alta integração. O comportamento de um material numa heterojunção depende fortemente de sua função trabalho W0 , cujo conceito foi introduzido na Seção 2.3. Ela é definida como a energia necessária para “arrancar” um elétron do interior de um material e levá-lo para longe de sua superfı́cie. Tendo estudado as propriedades quânticas de elétrons em metais e em semicondutores, podemos compreender melhor o conceito da função trabalho. No caso de um metal, como os elétrons de energia mais alta estão no nı́vel de Fermi, é fácil ver que a função trabalho é dada por W0 = E0 − EF , onde E0 é a energia do elétron no vácuo e longe do material, como ilustrado na Fig.6.8(a). Em metais costuma-se escrever W0 = eφm , onde φm é um potencial elétrico com valor tipicamente da ordem de 2 a 6 V. Nos semicondutores a definição da função trabalho também é W0 = E0 − EF . Entretanto como não existem elétrons no nı́vel de Fermi, W0 = eφs não é a energia mı́nima necessária para “arrancar” elétrons do semicondutor. Como os elétrons de mais alta energia estão na banda de condução, a energia necessária para removê-los do material Figura 6.8: Ilustração das funções trabalho nos diagramas de energia de um metal (a) e de um semicondutor (b) separados. 188 Materiais e Dispositivos Eletrônicos é E0 − Ec ≡ eX , onde eX é chamada afinidade eletrônica. A Fig.6.8 ilustra esquematicamente as funções trabalho de um metal e de um semicondutor separados e no vácuo. Note que na figura o nı́vel de energia E0 de um elétron no vácuo é o mesmo, quer ele tenha sido removido do metal ou do semicondutor. Desta forma, quando um metal e um semicondutor estão separados, seus nı́veis de Fermi têm posições relativas diferentes, que dependem exclusivamente de suas respectivas funções trabalho eφm eφs . 6.3.1 Junção Metal-Semicondutor Quando um metal é colocado em contato direto com um semicondutor, ocorre uma transferência de cargas de um lado para o outro de modo a igualar os dois nı́veis de Fermi, a semelhança do que acontece numa junção p-n. O sentido de movimento de cargas depende então dos valores relativos das funções trabalho. A diferença para o caso da junção de dois semicondutores é que buracos não podem passar do semicondutor para o metal, pois eles são quase-partı́culas que existem apenas nos semicondutores. Essa transferência cria camadas de cargas nos dois lados da junção resultando numa barreira de potencial, chamada barreira de Schottky, em homenagem ao fı́sico W. Schottky que estudou contatos metal-semicondutor na década de 30. A forma da barreira é bastante diferente da junção p-n, depende do tipo do semicondutor, dos valores relativos das funções trabalho nos dois materiais e da afinidade eletrônica. As formas da barreira Schottky para dois casos tı́picos estão mostradas na Fig.6.9. A Fig.6.9(a) corresponde à junção de um metal com um semicondutor tipo n de função trabalho menor, isto é, com φs < φm . Sendo eφm a energia necessária para arrancar um elétron do metal e −eX a energia para introduzilo no semicondutor, a altura da barreira de energia eφB que um elétron deve vencer para passar do metal para o semicondutor é eφB = e(φm − X ). Analisando as posições relativas de EF e Ec nas Figuras 6.8 e 6.9(a), vemos então que a diferença de energia entre o pico da barreira e o mı́nimo da banda de condução Ec é e(φm − φs ). Esta diferença caracteriza o potencial de contato entre o metal e o semicondutor em equilı́brio, V0 = φm − φs , que impede a passagem de elétrons do semicondutor para o metal. Este potencial pode ser reduzido ou aumentado pela aplicação de uma tensão externa com polarização direta ou reversa, respectivamente. Por esta razão o contato metal-semicondutor tem caracterı́stica I-V semelhante a de uma junção p-n. A Fig.6.9(b) ilustra a barreira Schottky no caso de um semicondutor tipo p com φs > φm . Neste caso, para ocorrer o alinhamento dos nı́veis de Fermi, é Cap. 6 Dispositivos Semicondutores: Diodos 189 Figura 6.9: Diagramas de energia de junções metal-semicondutor em equilı́brio: (a) Semicondutor tipo n com φs < φm ; (b) Semicondutor tipo p com φs > φm . preciso que haja um acúmulo de cargas positivas no lado do metal e de cargas negativas no lado do semicondutor. Isto ocorre com a transferência de elétrons do metal para o semicondutor, onde eles ionizam as impurezas aceitadoras numa camada de depleção. As camadas de carga nos dois lados produzem uma barreira de potencial V0 = φs − φm em equilı́brio que impede a continuação do movimento de transferência. Como no caso anterior, esta barreira pode ser aumentada ou diminuı́da pela aplicação de uma tensão externa. Uma diferença importante da junção metal-semicondutor para a junção p-n é que na primeira a corrente é dominada por portadores majoritários, enquanto que na segunda ela é determinada pelos portadores minoritários. O processo pelo qual os portadores majoritários constituem a corrente na junção metal-semicondutor polarizada diretamente envolve a emissão de elétrons do metal, semelhante à emissão termiônica no catodo quente de uma válvula a vácuo. Seu estudo quantitativo pode ser encontrado em algumas referências citadas no final deste Capı́tulo. Finalmente é importante ressaltar que nos casos dos contatos metalsemicondutor tipo n com φm < φs e metal-semicondutor tipo p com φs < φm , o potencial de contato é negativo e não há formação da barreira de poten- 190 Materiais e Dispositivos Eletrônicos cial. Contatos deste tipo são chamados ôhmicos, porque sua resistência não depende do sentido da corrente. 6.3.2 Heterojunções de Semicondutores Numa heterojunção de semicondutores a descontinuidade de energia na interface resulta dos diferentes gaps de energia nos dois lados. Uma heterojunção com grande aplicação tecnológica é aquela formada por GaAs e pela liga Ga1−x Ax As. Nesta liga uma certa fração x de átomos de A substitui os átomos de Ga de maneira aleatória na rede cristalina. Como GaAs e AAs cristalizam na mesma estrutura (zinc-blende, Fig.1.8a) e têm parâmetros de rede quase idênticos, a substituição de Ga por A não produz distorções na rede. O principal efeito do A na rede de GaAs é o aumento do gap de energia. Como GaAs tem Eg = 1, 43 eV e AAs tem Eg = 2, 16 eV, o gap de Ga1−x Ax As depende da concentração x do alumı́nio. Em primeira aproximação, Eg varia linearmente com x entre os dois valores dos cristais puros. Devido ao fato de que as redes são quase idênticas, é possı́vel crescer Ga1−x Ax As em cima da superfı́cie de um cristal de GaAs, produzindo uma interface cristalina quase perfeita. Isto possibilita a fabricação de heterojunções nas quais os elétrons e buracos passam de um lado para outro sem sofrer espalhamento causado por imperfeições na interface. O crescimento de (GaA)As sobre GaAs é feito tradicionalmente com a técnica LPE, mencionada na Seção 1.4. Atualmente, com a técnica de MBE e outras técnicas de fabrição de filmes, é possı́vel depositar camadas monoatômicas individuais, uma após outra, produzindo redes, interfaces, heterojunções e super-redes quase perfeitas. A Fig.6.10(a) mostra os diagramas de energia de GaAs tipo n e Ga1−x Ax As tipo p, com certa concentração x de A, quando os dois materiais estão separados. Neste caso, cada material é caracterizado por uma função trabalho e uma afinidade eletrônica diferentes, referidas ao nı́vel do vácuo. Quando os dois materiais são postos em contato, ocorre passagem de elétrons e buracos de um lado para outro. Como na homojunção p-n, no equilı́brio os nı́veis de Fermi dos dois lados se igualam. Entretanto, sendo os valores de Eg diferentes, aparecem descontinuidades Ec na banda de condução e Ev na banda de valência, como ilustrado na Fig.6.10(b). Pelo exame dos diagramas de energia vemos facilmente que, Ec = e(X1 − X2 ) , Ev = Eg2 − Eg1 − Ec (6.33) . (6.34) Cap. 6 Dispositivos Semicondutores: Diodos 191 Ec 2 2 1 1 Ev1 Ec 2 DEc Ec1 F1 2 2 Eg1 DEv Eg 2 DEc eV1 Ec1 EF2 Ev 2 EF Ev 2 Ev1 Figura 6.10: Diagramas de energia de uma heterojunção de n-GaAs e p-(GaA)As: (a) Materiais separados; (b) Junção em equilı́brio. Estas descontinuidades são as mesmas, quer os materiais estejam separados quer estejam em contato, uma vez que elas dependem das afinidades eletrônicas e dos gaps. Vemos em (6.33) e (6.34) que quando os valores de χ e Eg são iguais, Ec = Ev = 0. Como as descontinuidades existem nos materiais separados, elas nada têm a ver com a formação das camadas de carga nos dois lados da junção, as quais criam a barreira de potencial V0 . Assim sendo, V0 só depende da variação no nı́vel Ec da banda de condução, descontada a descontinuidade Ec . A altura da barreira é, portanto, dada por V0 = V1 + V2 , (6.35) onde V1 e V2 estão mostrados na Fig.6.10(b). A diferença entre os gaps de energia dos semicondutores numa heterojunção possibilita a fabricação de uma enorme variedade de formas de potenciais para elétrons na banda de condução e buracos na banda de valência. Isto permite a investigação de propriedades quânticas de partı́culas em potenciais fabricados com formas engenhosas, como também a construção de sofisticados dispositivos. Uma heterojunção importante para investigações cientı́ficas e para aplicações está mostrada na Fig.6.11. Ela é formada por dois semicondutores dopados com impurezas tipo n, n-GaAs e n-Gax A1−x As. Devido aos valores das afinidades eletrônicas dos dois materiais, as descontinuidades nas bandas são Ec = 0, 85 Eg e Ev = 0, 15 Eg , sendo Eg = Eg2 − Eg1 . Estas descontinuidades servem para bloquear a difusão de portadores do GaAs para o (GaA)As, o que é importante para os lasers semicondutores que serão estudados no Capı́tulo 8. 192 Materiais e Dispositivos Eletrônicos DEc EF Eg1 DEv Eg 2 Figura 6.11: Heterojunção de n-GaAs e n-(GaA)As. 6.4 Diodo de Junção O diodo é um dispositivo eletrônico de dois terminais que só deixa passar corrente elétrica num sentido. Um diodo ideal deveria apresentar resistência nula à corrente num sentido, como um curto-circuito, e resistência infinita, como um circuito aberto, para a corrente no sentido oposto. Os diodos reais, no entanto, têm num sentido resistência pequena, mas não nula, e resistência muito elevada, porém não infinita, no outro sentido. A Figura 6.12 mostra o sı́mbolo do diodo e a caracterı́stica I-V de um diodo ideal. A parte triangular do sı́mbolo representa a ponta de uma seta, indicando o sentido de passagem da corrente no diodo. O diodo à válvula, que existia antes da era do semicondutor, é feito de um tubo a vácuo no interior do qual há dois elementos, catodo e anodo. O catodo é aquecido por um filamento e emite elétrons, enquanto o anodo não aquecido apenas recebe elétrons provenientes do catodo. Quando uma diferença de potencial positiva é aplicada entre o anodo e o catodo, os elétrons vão do catodo para o anodo e produzem uma corrente. Quando a tensão é aplicada no sentido oposto, o anodo não pode emitir elétrons, pois não é aquecido, resultando em corrente nula. Os diodos semicondutores são feitos com junções p-n ou contatos metal-semicondutor. Enquanto na válvula à vácuo a assimetria é devida ao fato de que o catodo emite elétrons mas o anodo não, nos diodos semicondutores a assimetria é causada pela barreira de potencial. O diodo de junção consiste apenas de uma junção p-n com dois contatos metálicos para entrada e para saı́da de corrente. No lado p o contato entre Cap. 6 Dispositivos Semicondutores: Diodos 193 Figura 6.12: (a) Sı́mbolo do diodo. (b) Caracterı́stica I-V do diodo ideal. o semicondutor e o filme de alumı́nio forma naturalmente um bom contato ôhmico, devido aos valores relativos das funções trabalho. No lado n o contato ôhmico é obtido através de uma dopagem mais forte, produzindo uma região n+ como na Fig.6.1. Por analogia com o diodo à válvula, o terminal p é chamado anodo e o terminal n é chamado catodo. Os diodos de junção têm caracterı́stica I-V como aquela mostrada na Fig.6.7. Quando eles são polarizados diretamente, a corrente só alcança intensidade substancial quando a tensão é próxima ou maior que um valor crı́tico E0 , que depende do semicondutor da junção. Em diodos de Ge este valor é da ordem de 0,2 a 0,4 V, enquanto que em diodos de Si ele varia de 0,6 a 0,8 V. A Fig.6.13 mostra um circuito aproximadamente equivalente ao diodo de junção. Para V < E0 a corrente no circuito é nula, pois a presença da bateria faz a tensão nos terminais do diodo ideal ser negativa. Para V > E0 a corrente aumenta linearmente com a diferença V − E0 , devido ao resistor R em série Figura 6.13: (a) Circuito aproximado equivalente ao diodo de junção. A bateria produz a tensão crı́tica E0 e o resistor determina a inclinação finita da caracterı́stica I-V , mostrada em (b). 194 Materiais e Dispositivos Eletrônicos Figura 6.14: Aspectos fı́sicos comuns de diodos. (a) Baixa corrente. (b) Corrente intermediária. (c) Alta corrente. com o diodo e a bateria. O circuito equivalente da Fig.6.13(a) vale para tensões dc. Para tensão alternada, de freqüência relativamente alta, é preciso considerar o efeito da capacitância da junção. Quando a tensão aplicada ao diodo varia bruscamente, a carga na região de depleção não acompanha imediatamente. Isto limita a resposta em freqüência do diodo. Este efeito pode ser representado por um capacitor em paralelo com o circuito da Fig.6.13(a), cuja capacitância é, em parte, dada pela Eq.(6.20). Também contribui para a capacitância o atraso no tempo do movimento de difusão das cargas nas proximidades da junção. Os valores relativos da capacitância de difusão e da região de carga espacial dependem da geometria da junção e dos materiais que a formam. A Figura 6.14 mostra três aspectos fı́sicos comuns de diodos comerciais. Cada tipo de diodo é identificado por um código alfanumérico (Exemplos: 1N23 e 1N56. O número 1 antes da letra N é usado para identificar diodos). A identificação dos terminais do anodo e do catodo, assim como a caracterı́stica I-V e outros parâmetros do diodo, constam das especificações de cada tipo de diodo. Exemplo 6.3: Calcule as correntes de saturação e faça os gráficos I − V de três diodos ideais, em T = 300 K, um de Ge, um de Si e um de GaAs, considerando que todos têm os seguintes parâmetros: Na = 1017 cm−3 ; Nd = 1015 cm−3 ; A = 10−4 cm2 ; τp = τn = 0, 5 µs. A corrente desaturação é dada por (6.31). Como Na Nd , podemos desprezar o segundo termo. Usand Lp = Dp τp vem, Is ≃ 1/2 e A n2i Dp 1/2 τp Nd . Cap. 6 Dispositivos Semicondutores: Diodos 195 Utilizando os dados do diodo e os parâmetros da Tabela 5.2 convertidos para o Sistema Internacional, temos para o diodo de Ge, Is = 1, 6 × 10−19 × 10−4 × 10−4 × (2, 5 × 1013 × 106 )2 × (50 × 10−4 )1/2 A (0, 5 × 10−6 )1/2 × 1015 × 106 Is = 1, 0 × 10−7 A . Para o diodo de Si vem Is = 1, 6 × 10−19 × 10−4 × 10−4 × (1, 5 × 1010 × 106 )2 × (12, 5 × 10−4 )1/2 A (0, 5 × 10−6 )1/2 × 1015 × 106 Is = 1, 8 × 10−14 A . Para o diodo de GaAs vem Is = 1, 6 × 10−19 × 10−4 × (107 × 106 )2 × (10 × 10−4 )1/2 A (0, 5 × 10−6 )1/2 × 1015 × 106 Is = 7, 2 × 10−21 A . Os gráficos I − V dos três diodos são feitos calculando I em função de V , numericamente, com a Equação do Diodo (6.29), usando os três valores de Is acima. O resultado está mostrado na Figura 6.15 e evidencia a diferença entre as tensões crı́ticas dos diodos feitos com os três materiais. Figura 6.15: Curvas I − V dos diodos de Ge, Si e GaAs do Exemplo 6.3. Materiais e Dispositivos Eletrônicos 196 6.4.1 Aplicações Os diodos de junção têm inúmeras aplicações em circuitos eletrônicos. Uma das mais tradicionais é a retificação de tensão alternada em fontes de alimentação, usadas para fornecer tensão dc para a operação de equipamentos eletrônicos. A Figura 6.16(a) mostra os elementos básicos do circuito retificador de meia onda. O transformador tem a função de transformar a amplitude da tensão alternada da rede de distribuição (em geral 110 V ou 220 V, valor eficaz) para o valor adequado à fonte. A Figura 6.16(b) mostra a tensão senoidal v(t) no secundário do transformador, cujo valor médio é nulo, aplicada na entrada do retificador. Considerando a tensão crı́tica E0 do diodo muito menor que o valor de pico de v(t), o diodo apresenta resistência desprezı́vel nos semiciclos positivos de v(t) e resistência elevada nos semiciclos negativos. Como resultado, a corrente i(t) que atravessa o diodo em série com a resistência de carga R, acompanha v(t) nos semiciclos positivos, porém é desprezı́vel durante os semiciclos negativos, adquirindo a forma mostrada na Fig.6.16(c). A corrente retificada é unidirecional, tem valor médio diferente de zero, porém não é constante, como seria desejado numa fonte dc. Entretanto, a simples adição ao circuito de um capacitor na posição mostrada pelas linhas tracejadas, faz a corrente aproximar-se da forma dc. O capacitor carrega-se durante o semiciclo de condução do diodo e descarrega sobre R no semiciclo negativo, fazendo a corrente adquirir a forma da linha tracejada na Fig.6.16(c). Evidentemente, Figura 6.16: Ilustração da operação de um circuito simples retificador de meia-onda. A tensão v(t) no secundário do transformador resulta na corrente i(t) no diodo e na carga. A linha tracejada representa a forma de onda obtida com a adição do capacitor ao circuito. Cap. 6 Dispositivos Semicondutores: Diodos 197 a condição para que isto ocorra é que a constante de tempo RC seja muito maior que o perı́odo da tensão alternada. Os diodos empregados em circuitos retificadores não precisam ter resposta rápida, uma vez que a tensão ac nesses circuitos tem baixa freqüência (tipicamente 60 Hz nas redes de distribuição). Porém eles precisam satisfazer dois requisitos básicos: o primeiro é que a sua corrente máxima seja maior que a exigida pela carga. Devido às colisões de elétrons e buracos com a rede cristalina, a passagem de corrente aquece o diodo, havendo um valor limite que danifica a junção por superaquecimento. Desta forma, cada diodo, dependendo de suas caracterı́sticas fı́sicas, suporta uma corrente máxima; o outro requisito é que a tensão de pico no semiciclo negativo seja menor que a tensão de ruptura do diodo na polarização reversa. A origem desta tensão de ruptura será apresentada na Seção 6.6. Outra aplicação do diodo, baseada em sua propriedade de retificação, é como detetor de pico, empregado na detecção de onda modulada em amplitude em receptores de rádio AM. Na transmissão por rádio AM, a onda de alta freqüência, chamada portadora, tem uma amplitude que varia de acordo com o sinal de baixa freqüência (por exemplo, de áudio) da informação. Uma onda AM tı́pica está mostrada na Figura 6.17(a), na qual a portadora senoidal de alta freqüência é modulada por um sinal, também senoidal, de baixa freqüência. Se a tensão desta onda AM é aplicada a um circuito com diodo, capacitor e resistência de carga, como o da Fig.6.16, sem o transformador, a tensão na carga tem a forma da Fig.6.17(b). O circuito retificador de meia onda com capacitor corta os semiciclos negativos da portadora, produzindo um sinal que corresponde à variação do valor dos picos positivos. Este sinal é aproximadamente Figura 6.17: a) Onda senoidal de alta freqüência modulada por sinal senoidal de áudio. A linha formada pelos valores de pico corresponde ao sinal de áudio. b) Sinal de áudio produzido pelo detetor de pico com diodo. 198 Materiais e Dispositivos Eletrônicos igual ao sinal senoidal de áudio que modula a amplitude da onda portadora. Os diodos usados em detetores de pico trabalham com tensões muito pequenas e portanto podem ter baixa corrente máxima. Por outro lado, ao contrário dos diodos de retificação de fontes de alimentação, eles devem responder a altas freqüências. 6.5 Diodo de Barreira Schottky Como mencionado na Seção 6.3.1, um contato metal-semicondutor com barreira de Schottky tem caracterı́stica I-V semelhante à da junção p-n sendo, portanto, também um diodo. Na realidade, historicamente o primeiro dispositivo semicondutor construı́do foi o diodo de contato metal-semicondutor. Nos primeiros anos da eletrônica costumava-se fabricar diodos detetores de sinal pressionando uma agulha metálica na superfı́cie de um cristal semicondutor. Um semicondutor usado popularmente era o PbS, a galena, encontrado na natureza na forma cristalina. Daı́ surgiu o nome rádio galena, dado aos receptores de rádio constituı́dos apenas de um circuito LC de sintonia, um diodo detetor de galena e um fone de ouvido. Foi também com contatos metal-semicondutor que Bardeen e Brattain construı́ram em 1947 o primeiro transistor, que se constituiu na maior descoberta tecnológica do século 20. No decorrer dos anos 50 os diodos e os transistores de contato metal-semicondutor, chamados simplesmente de ponto-contato, foram abandonados devido à dificuldade de reprodução das caracterı́sticas I-V . Eles foram então substituı́dos pelos dispositivos de junção p-n que são os mais utilizados até hoje. Entretanto, com o aperfeiçoamento da tecnologia de fabricação e a compreensão teórica de seu funcionamento, os dispositivos de ponto-contato voltaram a ter grande utilidade em certas aplicações. Apesar do diodo de barreira de Schottky ter caracterı́stica I-V semelhante ao diodo de junção, há importantes diferenças entre os dois tipos de diodo. Elas decorrem fundamentalmente do fato de que a corrente na barreira de Schottky é devida a portadores majoritários, enquanto na junção p-n é devida aos portadores minoritários. Quando a tensão numa junção pn é chaveada bruscamente de polarização direta para reversa, os portadores minoritários não são removidos para o outro lado instantaneamente devido ao tempo de recombinação (Seção 5.4.4). Este efeito limita a resposta de freqüência de diodos de junção p-n. Nos diodos de barreira de Schottky não há portadores minoritários para serem removidos, de modo que o tempo de resposta é muito menor. Por esta razão eles têm grande aplicação em circuitos Cap. 6 Dispositivos Semicondutores: Diodos 199 detetores de alta freqüência ou de chaveamento rápido. Outra diferença entre o diodo Schottky e o de junção p-n está no valor da tensão crı́tica E0 da caracterı́stica I-V . Como vimos na Seção 6.1, ela resulta de uma combinação entre o valor da corrente de saturação Is e o efeito do crescimento exponencial de I com V , dada pela Eq.(6.29). Num diodo Schottky feito com um mesmo semicondutor e com a mesma área que outro diodo de junção p-n, a corrente de saturação é muito maior no primeiro, pois é devida a portadores majoritários. Como ilustrado na Fig.6.18 isto resulta numa tensão crı́tica bem menor no diodo Schottky que no de junção p-n, aproximando-o mais de um diodo ideal na polarização direta. Os diodos Schottky não suportam correntes elevadas, pois sendo a área de contato muito pequena, a densidade de corrente torna-se muito grande e danifica o contato. Por esta razão eles não servem para circuitos retificadores. Sua maior aplicação é em circuitos detetores, que exigem resposta em alta freqüência e alta sensibilidade (grande inclinação da curva I-V próximo da origem). Figura 6.18: Comparação entre as caracterı́sticas I-V de um diodo Schottky (a) e um diodo de junção p-n (b) de Silı́cio. Ambas as curvas foram obtidas da Eq.(6.29), sendo usado Is = 2, 5 µA em (a) e Is = 1 nA em (b). 200 Materiais e Dispositivos Eletrônicos 6.6 Ruptura na Polarização Reversa: Diodo Zener De acordo com o modelo apresentado na Seção 6.1, na junção p-n polarizada reversamente circula uma pequena corrente, cuja intensidade tende para um valor de saturação Is à medida que a tensão reversa aumenta. Na verdade isto só ocorre enquanto a tensão reversa for menor (em módulo) que um certo valor VR , chamado tensão de ruptura (breakdown, em inglês). Se a tensão atingir este valor crı́tico, a corrente aumenta bruscamente, como resultado de um processo de ruptura eletrônica da junção. Desde que o circuito externo limite a intensidade da corrente não a deixando ultrapassar um valor máximo (que depende das caracterı́sticas do dispositivo), este processo de ruptura nada tem de destrutivo. Ele é perfeitamente reprodutivo e pode ser repetido uma infinidade de vezes. O processo de ruptura de uma junção pode ocorrer por dois mecanismos diferentes: o chamado efeito Zener e o mecanismo de avalanche. Embora diferentes, ambos resultam do efeito do campo elétrico que existe na região de carga espacial da junção p-n, sobre os portadores de carga. Na junção polarizada reversamente, este campo cresce acompanhando a altura da barreira de potencial, como ilustrado na Figura 6.5(c). O processo de ruptura acontece quando o campo atinge um valor crı́tico. O efeito Zener ocorre em tensões relativamente pequenas, de alguns volts, em junções de semicondutores fortemente dopados. Como mostra a Eq.(6.18), se as concentrações de impurezas Na e Nd nos dois lados da junção aumentam, a espessura da camada de depleção diminui. Com concentrações da ordem de 1019 − 1020 cm−3 , para tensões reversas de alguns volts a espessura é da ordem de 10−5 cm, o que resulta em campos da ordem de 106 V/cm. Campos elétricos com esta intensidade quebram as ligações covalentes e ionizam átomos da rede cristalina. Os elétrons liberados na ionização são acelerados no sentido oposto ao campo, passando para o lado n da junção e produzindo corrente no sentido reverso, muito maior que a corrente de saturação reversa. Em junções com menores concentrações de impurezas, o campo elétrico na região de depleção pode não ser suficiente para produzir ionização direta dos átomos do semicondutor, não havendo, portanto, efeito Zener. Entretanto, sempre haverá um valor de tensão reversa para o qual ocorrerá ruptura na junção através do mecanismo de avalanche. Como o nome sugere, este é um processo no qual ocorrem eventos sucessivos, resultando numa multiplicação no número de portadores. O primeiro evento resulta da aceleração, pelo campo elétrico, de um elétron que entra na junção proveniente do lado p. Se o elétron Cap. 6 Dispositivos Semicondutores: Diodos 201 tiver energia suficiente, sua colisão com a rede cristalina pode produzir um par elétron-buraco, resultando na multiplicação por um fator dois no número de portadores. Em seguida, o elétron criado é acelerado para o lado n, enquanto o buraco é acelerado para o lado p. Se a tensão reversa for suficientemente alta, cada um deles produzirá um par elétron-buraco, que por sua vez produzirão outros pares, num processo de reação em cadeia. O valor de tensão reversa para o qual esta avalanche produz um brusco crescimento na corrente reversa é a tensão de ruptura VR , cujo valor pode variar entre alguns volts e milhares de volts. Independentemente do mecanismo responsável pela ruptura na junção, Zener ou avalanche, a caracterı́stica I-V completa do diodo tem a forma mostrada na Fig.6.19(a). Na polarização reversa o diodo apresenta uma grande resistência, sendo atravessada por uma corrente pequena de valor próximo a Is , desde que a tensão seja menor que VR . Para tensões próximas de VR , qualquer variação em V produz enormes variações na corrente reversa causada pela ruptura da junção. Os diodos que são fabricados para operar na região de ruptura são chamados diodos Zener. Apesar do nome, em geral o mecanismo de ruptura dos diodos Zener é o processo de avalanche. Eles têm o sı́mbolo mostrado na Figura 6.19(b), e podem ser fabricados para apresentar tensão de ruptura VR escolhida, variando na faixa de 1 V a centenas de volts. Nos diodos Zener de boa qualidade a corrente de ruptura é representada por uma linha quase vertical, o que significa que a tensão nos terminais é mantida constante Figura 6.19: (a) Caracterı́stica I-V do diodo de junção, mostrando o brusco aumento da corrente reversa na tensão de ruptura VR . (b) Sı́mbolo do diodo Zener. Materiais e Dispositivos Eletrônicos 202 Figura 6.20: a) Circuito regulador com diodo Zener. b) Tensão variável na entrada. c) Tensão constante na saı́da do regulador. e igual a −VR , independentemente do valor da corrente. A aplicação mais importante dos diodos Zener é como regulador de tensão em fontes de alimentação. A Fig.6.20 mostra a saı́da de um circuito regulador com um diodo Zener de 9 V, quando alimentado por uma tensão tı́pica de um retificador de meia onda. A tensão de entrada tem uma pequena ondulação em torno de um valor médio de 12 V, como a forma de onda da Fig.6.16(c). A presença do diodo Zener com polarização reversa faz com que a tensão de saı́da seja VR = 9 V, independentemente da variação da tensão de entrada. A diferença entre a tensão de entrada e a de saı́da fica aplicada no resistor, cujo papel é “absorver” as flutuações da entrada. 6.7 Outros Tipos de Diodos 6.7.1 Varactor As Eqs.(6.18) e (6.20) mostram que o diodo de junção p-n tem uma capacitância que varia com a tensão da barreira de potencial. Considerando que na polarização reversa com uma tensão V o potencial da barreira é V + V0 , e supondo que V V0 , a Eq.(6.18) dá para a espessura da região de depleção (Problema 6.4), ∝ V 1/2 . (6.36) Como conseqüência deste resultado e da Eq.(6.20), a capacitância da junção varia com a tensão reversa na forma C ∝ V −1/2 . (6.37) Cap. 6 Dispositivos Semicondutores: Diodos 203 Um diodo com corrente de saturação muito pequena, submetido a uma tensão de polarização reversa, comporta-se então como um capacitor cuja capacitância é variável com a tensão. Ele é chamado varactor, termo formado pela união de partes das palavras variable reactor. A dependência da capacitância com a tensão da Eq.(6.37) é válida apenas para uma junção abrupta, como aquela da Fig.6.2. Se a variação da concentração na região da junção for gradual, a dependência de C com V será diferente. Utilizando técnicas de crescimento epitaxial ou de implantação iônica, é possı́vel fabricar junções com diferentes perfis de variação da concentração, escolhidos de modo a obter funções C(V ) adequadas para aplicações especı́ficas do varactor. Os varactores são utilizados em circuitos LC de sintonia de receptores de rádio, no lugar dos capacitores de placa variáveis manualmente. O fato de sua capacitância ser controlada pela tensão possibilita o controle eletrônico da freqüência de sintonia do circuito. Para esta aplicação utiliza-se varactores cuja capacitância varia na forma C ∝ V −2 . Neste caso, a freqüência de sintonia do circuito, ω = (LC)−1/2 , é proporcional à tensão aplicada ao diodo. Eles também são empregados em filtros ativos, geradores de harmônicos e em circuitos de microondas. 6.7.2 Diodo Túnel O diodo túnel é feito com uma junção p-n na qual, em certa faixa de tensão de polarização direta, a corrente é dominada pelo efeito de tunelamento de elétrons através da barreira de potencial na junção. Como mostrado na Seção 3.3.3, existe uma probabilidade finita para um elétron atravessar uma barreira com potencial máximo maior que sua energia cinética. Este é o efeito túnel, de natureza inteiramente quântica. Como vimos na Seção 6.2, a corrente numa junção p-n comum é devida ao movimento de difusão de portadores minoritários nos dois sentidos. Isto resulta numa corrente que decresce exponencialmente com a tensão aplicada, tendendo a zero quando V → 0. O diodo túnel é feito com semicondutores fortemente dopados nos dois lados da junção, o que resulta no tunelamento direto de elétrons do lado n para o lado p, produzindo uma corrente maior que a corrente de difusão quando V é pequena. Para que isto ocorra é essencial, como veremos a seguir, que os dois lados da junção estejam fortemente dopados. O cenário de nı́veis de energia que apresentamos na Seção 5.3 só é válido quando a concentração de impurezas é relativamente pequena, N 1020 cm−3 . 204 Materiais e Dispositivos Eletrônicos Nesta situação as impurezas estão muito afastadas umas das outras, de modo que a interação entre elas é desprezı́vel. Quando a concentração de impurezas é da ordem de 1020 cm−3 ou maior, a interação entre elas deixa de ser desprezı́vel. Neste caso ocorre um fenômeno como aquele ilustrado na Fig.4.1, os nı́veis de energia das impurezas deixam de ser discretos e passam a formar bandas. Se as impurezas forem doadoras, elas formam uma banda de energia que se superpõe a banda de condução, fazendo com que o nı́vel de Fermi esteja acima do mı́nimo desta banda, EF > Ec . Em conseqüência, os estados de energia acima de Ec e abaixo de EF estão preenchidos com elétrons, mesmo em T = 0. Os semicondutores nesta situação são chamados degenerados tipo n. De maneira análoga, um semicondutor fortemente dopado com impurezas tipo p tem EF < Ev , de modo que os estados entre EF e Ev estão preenchidos com buracos. O diodo túnel é feito com uma junção p-n de dois semicondutores degenerados, cujo diagrama de energia está mostrado na Fig.6.21. Na situação de equilı́brio, com tensão externa V = 0, o nı́vel de Fermi EF é o mesmo nos dois lados da junção. Como EF > Ev no lado p e EF < Ec no lado n, existem estados preenchidos na banda de condução no lado n com energia próxima a de estados vazios na banda de valência no lado p. Estes estados estão separados espacialmente pela espessura da região de depleção que, devido à alta concentração de impurezas é bastante estreita (veja a Eq.6.18). Como vimos na Seção 3.3.3, estados cheios separados de estados vazios por uma barreira de potencial estreita e de altura finita, criam as condições favoráveis ao tunelamento de elétrons. Quando V = 0, como vemos na Fig.6.21(a) não há estados cheios e vazios exatamente com a mesma energia. Nesta situação não há tunelamento Figura 6.21: Diagramas de energia de uma junção p-n no diodo túnel: a) V = 0, junção em equilı́brio; b) V < 0, corrente de tunelamento no sentido reverso; c) V > 0, corrente de tunelamento no sentido direto. Cap. 6 Dispositivos Semicondutores: Diodos 205 de elétrons. Entretanto, com V = 0, tanto na polarização reversa como na direta, há estados cheios de um lado com mesma energia de estados vazios do outro lado porque os nı́veis de Fermi nos dois lados são diferentes, resultando em tunelamento. Se V < 0 ocorre tunelamento de elétrons do lado p para o lado n, como mostra a Fig.6.21(b), resultando em corrente no sentido reverso. Por outro lado, se V > 0, pela Fig.6.21(c) vemos que o tunelamento é no sentido de n para p, produzindo corrente direta. Com polarização direta, V > 0, inicialmente a corrente aumenta com a tensão, pois o número de estados vazios no mesmo nı́vel de estados cheios aumenta com V . Entretanto, com o aumento progressivo de V , a partir de um certo valor a banda de condução no lado n fica acima da banda de valência no lado p, reduzindo o tunelamento. Desta forma, quando uma tensão de polarização direta é aplicada ao diodo, a corrente de tunelamento inicialmente aumenta com V , passa por um máximo e depois diminui, resultando numa caracterı́stica I-V mostrada na Fig.6.22(a). Como a corrente de difusão, que aumenta monotonicamente com V , se soma a de tunelamento, a caracterı́stica I-V completa do diodo túnel tem a forma curiosa mostrada na Fig.6.22(b). Uma caracterı́stica importante da curva I-V do diodo túnel é que em certa faixa de tensão dI/dV < 0. Isto corresponde a uma resistência negativa para sinais ac, cujo valor pode ser controlado pela tensão da V aplicada ao diodo. Quando operando nesta região de resistência negativa, o diodo túnel fornece potência ac ao circuito, ao contrário de uma resistência normal que sempre absorve energia. Assim, ele encontra aplicações em osciladores e am- Figura 6.22: Caracterı́stica I-V de diodo túnel: a) somente a componente de tunelamento da corrente; b) caracterı́stica I-V completa incluindo a corrente de difusão. 206 Materiais e Dispositivos Eletrônicos plificadores de sinal. Como o mecanismo de tunelamento não apresenta retardo devido aos processos de deriva e difusão, o diodo túnel também tem aplicações em circuitos de chaveamento rápido. 6.7.3 Diodo IMPATT O nome IMPATT é feito com as letras das palavras IMPact Avalanche Transit Time diode. O diodo IMPATT opera com tensão reversa, próxima do valor de avalanche, tendo uma estrutura que cria um perfil de campo que faz um pacote de elétrons transitar de uma extremidade a outra do dispositivo, produzindo uma oscilação de alta freqüência. A estrutura do diodo IMPATT está mostrada na Fig.6.23(a). Ela consiste de uma junção p+ − n, na qual a região n é extensa e terminada por uma estreita região n+ com dopagem mais forte. Quando o diodo é polarizado reversamente, a variação do potencial tem a forma mostrada na Fig.6.23(b). O potencial tem uma forte variação na região da junção polarizada reversamente, resultando num pico do campo elétrico, mostrado na Fig.6.23(c). Na região n o potencial varia monotonicamente, correspondendo a um campo aproximadamente constante. A região n+ tem uma resistividade menor, resultando numa menor queda de potencial e por conseguinte menor campo elétrico. O diodo IMPATT normalmente opera com um circuito ressonante externo, em regime de oscilação, de modo que as variações do campo e do potencial da Figura 6.23 correspondem aos valores médios daquelas grandezas. A seguir descrevemos qualitativamente o mecanismo que produz a oscilação no diodo. Quando a tensão externa é aplicada ao diodo, um campo elétrico é rapidamente criado tendendo para uma distribuição mostrada na Fig.6.23(c), onde Eav é o valor de campo necessário para produzir avalanche na junção p+ − n. Quando o campo atinge o valor Eav na junção, uma avalanche produz um grande número de pares elétron-buraco. Os buracos criados durante a avalanche deslocam-se no sentido −x na região p+ e atingem o contato metálico, onde recombinam com os elétrons provenientes da corrente externa. Por outro lado, os elétrons criados na avalanche formam um pacote que se desloca pela região n, em movimento de deriva sob a ação do campo elétrico de valor Ed . Logo que o pacote de elétrons sai da região da junção e penetra na região n, ele produz uma queda de potencial em torno de si, o que provoca uma diminuição do campo elétrico na junção. Isto faz o campo cair abaixo do valor Eav , interrompendo o processo de avalanche. O pacote de elétrons Cap. 6 Dispositivos Semicondutores: Diodos 207 Figura 6.23: a) Estrutura do diodo IMPATT. b) Variação do potencial médio ao longo do diodo polarizado reversamente. c) Variação do valor médio do campo elétrico. transita na região n durante um certo tempo, até atingir a região n+ e passar para o circuito externo. Quando o pacote deixa a região n, o campo elétrico na junção volta a aumentar, atinge o valor Eav provocando nova avalanche e reiniciando o processo. Se o diodo IMPATT estiver conectado a um circuito LC, ou uma cavidade de microondas ressonante, cujo perı́odo de oscilação é o dobro do tempo de trânsito do pacote de elétrons, a oscilação se mantém indefinidamente. Durante cada meio ciclo da oscilação, um pacote de elétrons produz corrente no mesmo sentido do meio ciclo, fornecendo energia ao circuito externo e compensando as perdas que nele existam. Os diodos IMPATT são utilizados como geradores de microondas, podendo produzir potências de dezenas de watts. 6.7.4 Diodo Gunn Outro dispositivo utilizado como oscilador de microondas é o diodo Gunn, descoberto por J.B. Gunn em 1963. Este dispositivo é chamado de diodo porque tem dois terminais. Entretanto, ao contrário de todos diodos apresentados anteriormente, em vez de ser formado por uma junção p-n, ele é constituı́do apenas de uma amostra de n-GaAs dopada uniformemente. O mecanismo de 208 Materiais e Dispositivos Eletrônicos oscilação do diodo Gunn é baseado na resistência negativa que ele apresenta em certa faixa de tensão, semelhante a do diodo túnel. Entretanto, ao contrário deste, a resistência negativa resulta de uma propriedade intrı́nseca do GaAs. A Fig.6.24(a) mostra uma parte das bandas de energia do GaAs, obtida da estrutura completa de bandas da Fig.5.2. No semicondutor dopado com impurezas tipo n, no equilı́brio os elétrons ocupam os estados próximos do mı́nimo da banda de condução no ponto Γ1 , tendo massa efetiva m∗1 = 0, 068 m0 (Tabela 5.1). Quando um campo elétrico pequeno é aplicado a uma amostra de n-GaAs, os elétrons com momentum em torno do ponto Γ1 deslocam-se no material, com velocidade de deriva proporcional ao campo. Isto resulta numa densidade de corrente J proporcional ao campo E (Eq.5.52), fazendo com que o material tenha curva J − E linear, como a parte inicial do gráfico da Fig.6.24(b). Quando o campo elétrico aumenta e atinge certo valor crı́tico Ecr ≃ 3 × 105 V/m, os elétrons ganham energia suficiente para passar para o mı́nimo do ponto X1 , cuja energia está E = 0, 36 eV acima. Note que sendo E kB T , esta passagem para o mı́nimo de X1 não ocorre por excitação térmica, o que é uma condição essencial para a operação do dispositivo. Sendo a massa efetiva no ponto X1 muito maior que em Γ1 , em conseqüência do maior raio de curvatura de E(k) e da Eq.5.3, a condutividade do material (Eq.5.46) diminui. A faixa de resistência diferencial negativa da Fig.6.24(b) corresponde a valores de campo para os quais parte dos elétrons de condução está em torno do ponto Γ1 , e parte está no ponto X1 . Com o progressivo aumento de E, a Figura 6.24: Propriedades de n-GaAs: a) detalhe da banda de condução mostrando dois mı́nimos que podem ser ocupados por elétrons. No mı́nimo do ponto Γ1 , os elétrons têm massa efetiva m∗1 = 0, 068 m0 , onde m0 é a massa do elétron livre. No mı́nimo do ponto X1 , a massa efetiva é m∗2 = 1, 2 m0 ; b) caracterı́stica corrente- campo elétrico do material. Cap. 6 Dispositivos Semicondutores: Diodos 209 quase totalidade dos elétrons passa para X1 e a caracterı́stica J − E volta a ser linear, porém com inclinação bem menor que a inicial. Há vários mecanismos pelos quais a oscilação no diodo Gunn pode ocorrer. Vamos considerar aqui apenas o modo de camada de dipolo, ou domı́nio, que ocorre em amostras relativamente longas. A Fig.6.25(a) ilustra uma amostra de n-GaAs submetida a uma diferença de potencial externa entre os terminais negativo e positivo, respectivamente catodo e anodo. A amostra tem elétrons na banda de condução, cujas cargas negativas são compensadas pelas cargas positivas das impurezas doadoras ionizadas fixas na rede. Quando a tensão externa é aplicada, os elétrons injetados através do contato metálico do catodo criam uma camada de carga negativa, que juntamente com as impurezas positivas formam uma camada de dipolo elétrico, ou domı́nio. A camada de dipolo provoca em torno dela uma brusca variação do potencial e, conseqüentemente, um pico de campo elétrico. O gradiente de campo exerce uma força sobre a camada de dipolo, que se movimenta em direção ao anodo. A Fig.6.25(b) mostra o domı́nio viajando do catodo para o anodo, enquanto a Fig.6.25(b) ilustra a variação do potencial resultante. Quando o domı́nio atinge o anodo, um pulso de corrente é produzido no circuito externo. Se a tensão aplicada ao diodo tiver valor apropriado, o campo elétrico no domı́nio estará na região de resistência negativa, resultando em fornecimento energia ao circuito externo. Se este for um circuito LC ou uma cavidade ressonante, o pulso de energia tende a manter a oscilação, desde que o tempo de trânsito Figura 6.25: Operação do diodo Gunn: a) ilustração da amostra de n-GaAs com uma camada de dipolo viajando do catodo para o anodo; b) variação do potencial elétrico na amostra com a presença da camada de dipolo. 210 Materiais e Dispositivos Eletrônicos do domı́nio seja aproximadamente igual a meio perı́odo da oscilação. Após a extinção no anodo, outro domı́nio forma-se no catodo e o ciclo se repete. Os diodos Gunn são largamente utilizados como osciladores de microondas. Eles operam com tensões na faixa de 5 a 20 V, o que representa uma vantagem em relação aos diodos IMPATT, que normalmente requerem tensões de dezenas de volts. Como a velocidade de movimento dos domı́nios aumenta com o aumento da tensão aplicada, a freqüência de oscilação aumenta com a tensão. Por esta razão, a oscilação do diodo Gunn é facilmente modulável em freqüência, pela superposição de uma tensão variável à tensão de polarização. REFERÊNCIAS A. Bar-Lev, Semiconductors and Electronic Devices, Prentice-Hall, New Jersey, 1984. R. Dalven, Introduction to Applied Solid State Physics, Plenum Press, New York, 1996. D.A. Fraser, The Physics of Semiconductor Devices, Claredon Press, Oxford, 1983. P.E. Gray e C.L. Searle, Princı́pios da Eletrônica, Livro Técnico, Rio de Janeiro, 1974. P. Horowitz and W. Hill, The Art of Electronics, Cambridge Univ. Press, Cambridge, 1980. H.A. Loureiro e L.E.P. Fernandes, Laboratório de Dispositivos Eletrô- nicos, Guanabara Dois, Rio de Janeiro, 1982. R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. K. Kano, Semiconductor Devices, Prentice-Hall, New Jersey, 1998. H.A. Melo e R.S. de Biasi, Introdução à Fı́sica dos Semicondutores, Edgard Blücher, 1975. J. Millman e C.C. Halkias, Eletrônica: Dispositivos e Circuitos, McGrawHill, São Paulo, 1981. K.K. Ng, Complete Guide to Semiconductor Devices, McGraw-Hill, New York, 1995. D.J. Roulston, An Introduction to the Physics of Semiconductor Devices, Oxford University Press, Oxford, 1999. Cap. 6 Dispositivos Semicondutores: Diodos 211 G.B. Rutkowski and J.E. Oleksy, Solid State Electronics, MacMillanMcGraw-Hill, Singapore, 1993. B.J. Streetman and S. Banerjee, Solid State Electronic Devices, PrenticeHall, New Jersey, 2000. S.M. Sze, Physics of Semiconductor Devices, J. Wiley, New York, 1981. S.M. Sze, Semiconductor Devices: Physics and Technology, J. Wiley, New York, 1985. E.S. Yang, Fundamentals of Semiconductor Devices, McGraw-Hill, New York, 1978. J.A. Zuffo, Dispositivos Eletrônicos, McGraw-Hill, São Paulo, 1976. PROBLEMAS 6.1 Uma junção p-n de Ge tem em cada lado impurezas com concentrações Nd = 1016 cm−3 e Na = 1018 cm−3 . a) Calcule as posições do nı́vel de Fermi em cada lado a T = 300 K, em relação às bandas de valência e de condução. b) Desenhe o diagrama de energia da junção em equilı́brio, indicando os valores das energias relevantes, e a partir dele determine o potencial de contato V0 . 6.2 Calcule o campo elétrico máximo, a espessura da região de depleção (em µm) e a capacitância da junção p-n do problema 6.1, considerando que ela tem uma seção circular de diâmetro 300 µm. 6.3 Na situação de equilı́brio de uma junção p-n, a corrente de difusão criada pelo gradiente de concentração cancela a corrente de deriva devido ao gradiente de potencial, tanto para elétrons como para buracos. Este equilı́brio é expresso pela Eq.(5.70) para buracos. Faça a integral desta equação em uma dimensão e utilizando a relação de Einstein obtenha a Eq.(6.3) para o potencial de contato. 6.4 Uma diferença de potencial V é aplicada para polarizar uma junção p-n abrupta. Considerando que para V não muito elevada a condição de equilı́brio Eq.(5.70) não é muito alterada, demonstre a Eq.(6.22) e mostre que a espessura da região de depleção é dada por uma equação igual a (6.18), com V0 − V no lugar de V0 . 6.5 Utilize o resultado do Problema 6.4 e a expressão da carga de uma junção p-n para mostrar que a capacitância da junção é dada por (6.20). 6.6 Mostre que a corrente de difusão de elétrons na região de depleção de uma junção p-n é dada por (6.28). 212 Materiais e Dispositivos Eletrônicos 6.7 Considere duas junções p-n abruptas feitas com semicondutores diferentes, uma de Si e outra de Ge. Ambas têm as mesmas concentrações de impurezas, Na = 1018 cm−3 e Nd = 1016 cm−3 , e a mesma seção circular de diâmetro 300 µm. Suponha também que os tempos de recombinação são todos iguais, τp = τn = 1 µs. a) Calcule as correntes de saturação das duas junções em T = 300 K. b) Faça o gráfico I - V , preferivelmente com um computador, com V variando na faixa -1, +1 V e I limitado a 100 mA. 6.8 O campo elétrico de ruptura da junção de Si do Problema 6.7 é 106 V/cm. Calcule a tensão de ruptura da junção. 6.9 Numa junção p+ − n a concentração de impurezas do lado n é desprezı́vel p . Considere uma junção comparada com a do lado p, de modo que n deste tipo com n muito menor que o comprimento de difusão de buracos do lado n, Lp . Mostre que nesta junção polarizada diretamente, a corrente de elétrons é desprezı́vel comparada com a de buracos e que o campo elétrico no lado n, fora da região de depleção, é dado aproximadamente por E(x) = kB T 1 pn (0) e n Nd + pn (x) , onde x é medido a partir da fronteira da região de depleção. 6.10 Um diodo de junção p-n de Si polarizado diretamente com uma corrente constante é utilizado como um termômetro. Em T =27◦ C a tensão no diodo é 700 mV. a) Calcule o coeficiente de temperatura do diodo nesta temperatura, isto é, a razão V /T . b) Qual será a variação na tensão se a temperatura aumentar para 80◦ C? Calcule esta variação exatamente e compare com o valor obtido supondo que ela é linear e caracterizada pelo coeficiente obtido no item a). 6.11 Uma junção p+ − n de Si com seção reta de área 10−2 cm2 tem nos dois lados concentrações Na = 1017 cm−3 e Nd = 1015 cm−3 . Os parâmetros do Si estão dados na Tabela 5.2. Calcule: a) o campo elétrico máximo; b) a espessura da região de depleção (em µm) e c) a capacitância da junção na situação de equilı́brio e quando ela está submetida a uma tensão externa de polarização direta de 0,4 V. 6.12 A Eq.(6.25) para a concentração de buracos no lado n de uma junção p-n vale tanto para polarização direta como reversa. O mesmo ocorre com a equação análoga para a concentração de elétrons no lado p. Para uma junção p-n polarizada reversamente com tensão muito maior que 25 mV: a) Dê as expressões e faça gráficos qualitativos das concentrações Cap. 6 Dispositivos Semicondutores: Diodos 213 dos portadores minoritários np (x ) e pn (x), em função dos parâmetros da junção e de x e x , medidos a partir das fronteiras da região de depleção; b) Calcule as variações com x e x das correntes dos portadores minoritários e faça os gráficos correspondentes. c) A partir dos resultados do item b), calcule a corrente total na junção e explique por que as correntes dos portadores majoritários não são necessárias para o cálculo. 6.13 Considere uma junção p+ − n abrupta de Ge, com concentrações de impurezas Na = 5 × 1016 cm−3 e Nd = 1015 cm−3 , seção reta de 10−3 cm2 e tempos de recombinação τn = τp = 2 µs. A junção está polarizada diretamente e nela circula uma corrente de 100 mA. a) Calcule a tensão na junção. b) Calcule numericamente as concentrações dos portadores minoritários np (x ) e pn (x), e faça gráficos mostrando suas variações com x e x, medidas a partir das fronteiras da região de depleção. c) Calcule numericamente as concentrações dos portadores majoritários nn (x) e pp (x ), e faça gráficos mostrando suas variações com x e x . (Elas podem ser calculadas usando o fato de que a neutralidade de carga fora da região de depleção requer que as concentrações de elétrons e buracos em excesso do equilı́brio sejam iguais em cada ponto, δp(x) = δn(x). 6.14 Um diodo feito com uma junção de Si, como a do Problema 6.7, é colocado no circuito da figura abaixo. A bateria tem força eletromotriz 1,5 V e resistêncica interna 0,2 V e o resistor é de 20 Ω. a) Utilizando a equação do diodo, calcule analiticamente a corrente e a tensão no diodo. b) Utilizando a curva I - V obtida no Problema 6.7, calcule graficamente a corrente e a tensão no diodo e compare com os valores obtidos no item a). 214 Materiais e Dispositivos Eletrônicos Capı́tulo 7 Transistores e Outros Dispositivos Semicondutores 7.1 O Transistor 217 7.2 O Transistor Bipolar 219 7.3 Correntes no Transistor Bipolar 225 7.3.1 Cálculo das Correntes no Modelo Unidimensional 7.3.2 Corrente de Base 7.3.3 Parâmetros do Transistor 7.3.4 Curvas Caracterı́sticas I-V 225 231 233 234 7.4 Aplicações de Transistores 237 7.5 Transistores de Efeito de Campo 241 7.5.1 O Transistor do Efeito de Campo de Junção 7.5.2 Caracterı́stica do Transistor JFET 7.5.3 O Transistor de Efeito de Campo Metal-Semicondutor 7.6 O Transistor MOSFET 7.6.1 O Capacitor MOS 7.6.2 A Tensão Crı́tica de Inversão 7.6.3 A Caracterı́stica I-V do Transistor MOSFET 7.6.4 Aplicações de Transistores MOSFET 215 242 243 248 251 252 257 261 264 216 Materiais e Dispositivos Eletrônicos 7.7 Dispositivos de Controle de Potência: SCR e TRIAC 7.7.1 O Retificador Controlado de Silı́cio-SCR 7.7.2 O TRIAC 7.8 Circuitos Integrados 267 267 270 271 7.8.1 Conceitos Básicos e Técnicas de Fabricação 7.8.2 Dispositivos de Memória de Semicondutor 272 277 REFERÊNCIAS 282 PROBLEMAS 283 Cap. 7 Transistores e Outros Dispositivos Semicondutores 217 Transistores e Outros Dispositivos Semicondutores 7.1 O Transistor O transistor é um dispositivo de três terminais, utilizado para controlar sinais elétricos. Um sinal variável aplicado aos dois terminais de entrada controla eletronicamente o sinal nos dois terminais de saı́da, sendo um deles comum com a entrada. As duas funções mais usuais de controle são a amplificação e o chaveamento. Quando usado para amplificação, o dispositivo fornece na saı́da um sinal com a mesma forma de variação do sinal de entrada, porém com maior amplitude. Isto está mostrado na Fig.7.1 para uma variação senoidal. A potência do sinal de saı́da é em geral maior que a do sinal de entrada, sendo o acréscimo de potência fornecido pela fonte de alimentação dc. Nas aplicações digitais, um sinal digital na entrada faz o transistor chavear entre dois estados, um com corrente e outro sem corrente, representando os bits 0 e 1. Devido a sua capacidade de converter energia de uma fonte dc em energia de um sinal controlado, o transistor é chamado de dispositivo ativo. A invenção do transistor representou um dos maiores avanços tecnológicos do século XX, porque foi decisivo para a enorme evolução da eletrônica. Até meados da década de 1950 o dispositivo de controle eletrônico de maior uso era a válvula triodo. O triodo é formado por um tubo a vácuo contendo um catodo aquecido que emite elétrons e um anodo que os recebe, tendo entre eles um terceiro eletrodo feito de uma malha de fios metálicos, chamado grade. Uma tensão variável aplicada entre a grade e o catodo controla o fluxo de 218 Materiais e Dispositivos Eletrônicos Figura 7.1: Sinais de entrada e de saı́da num dispositivo de amplificação, como um transistor. elétrons do catodo para o anodo passando pela grade. Desta forma, um sinal de tensão entre grade e catodo controla a corrente de saı́da no anodo, tornando a válvula triodo um dispositivo ativo de controle. A partir da década de 1950, as válvulas a vácuo dos equipamentos eletrônicos foram gradualmente dando lugar aos transistores e diodos semicondutores, chamados de dispositivos de estado sólido. O desenvolvimento do transistor resultou de investigações básicas de propriedades de semicondutores. Em 1947 Brattain e Bardeen estudavam, nos laboratórios da Bell Telephone nos Estados Unidos, propriedades de superfı́cie de germânio com contatos metálicos retificadores. Nesses estudos eles observaram que a corrente no diodo semicondutor variava quando uma outra corrente passava por um segundo contato metálico colocado próximo ao primeiro. Em dezembro daquele ano eles anunciaram a descoberta do novo dispositivo de amplificação, batisado por eles de transistor, significando um elemento de transcondutância variável. Apesar de seu grande potencial, o transistor de ponto de contato tinha grandes problemas: ele era muito frágil; o contato degradava com a umidade do ar; seu ruı́do interno era muito grande. O próximo passo no desenvolvimento do transistor ocorreu em 1948, quando W. Shockley, também dos laboratórios Bell, publicou um trabalho teórico propondo a estrutura do transistor de junção. A partir de então muitos laboratórios industriais investiram em técnicas de fabricação e estudo dos transistores e em poucos anos eles se tornaram dispositivos comerciais. Existem atualmente dois tipos principais de transistores: o transistor bipolar de junção, em geral chamado simplesmente de transistor de junção, e o transistor de efeito de campo. O transistor bipolar de junção é feito por duas junções p-n fabricadas na mesma pastilha de semicondutor, sendo que Cap. 7 Transistores e Outros Dispositivos Semicondutores 219 a corrente na primeira junção controla a injeção de portadores minoritários na segunda junção. Como os portadores minoritários podem ser tanto elétrons como buracos, este transistor opera com portadores de cargas positivas e negativas, daı́ o nome bipolar. O transistor de efeito de campo pode ser feito por duas junções ou por contatos metal-óxido-semicondutor. Em ambos os tipos, a tensão de entrada controla o fluxo dos portadores majoritários que passam da entrada para a saı́da do dispositivo. Como estes portadores são elétrons ou buracos, dependendo do tipo de impureza do semicondutor, o transistor de efeito de campo é um dispositivo unipolar. Nesta seção apresentaremos os princı́pios de funcionamento e o modelamento dos transistores bipolares de junção. Os transistores de efeito de campo serão estudados na seção 7.5. 7.2 O Transistor Bipolar O transistor bipolar de junção é o dispositivo semicondutor mais importante da atualidade. Com a tecnologia planar, descrita na Seção 6.1.1, ele pode ser fabricado numa pastilha de semicondutor isoladamente, para formar um único dispositivo de três terminais, ou num conjunto com muitos outros diodos e transistores, formando um circuito integrado. Sua estrutura básica está mostrada na Fig.7.2. Ela consiste de três camadas de dopagens diferentes, feitas no mesmo semicondutor, formando duas junções p-n com polaridades opostas. As três camadas são chamadas de emissor, base e coletor, que são ligadas ao circuito externo através de contatos metálicos nos quais são soldados fios condutores. A estrutura da Fig.7.2 é a de um transistor p-n-p. Se as dopagens p e n forem trocadas obtém-se o transistor n-p-n, que é tão Metal 3 mm 20 mm 2 mm E B SiO2 p n p C Figura 7.2: Estrutura planar do transistor bipolar de junção com algumas dimensões tı́picas. As letras E, B e C representam os terminais do emissor, da base e do coletor, respectivamente. As distâncias indicadas representam espessuras tı́picas. 220 Materiais e Dispositivos Eletrônicos utilizado quanto o p-n-p. Os dois tipos têm operação inteiramente análoga, sendo os papéis dos elétrons e dos buracos trocados entre si. A Fig.7.3 mostra a representação esquemática de um transistor p-n-p com um circuito externo simples para polarização de suas junções. Convencionamos que IE , IB e IC , chamadas respectivamente correntes de emissor, base e coletor, são positivas quando têm os sentidos indicados na figura. A junção p-n entre o emissor e a base é chamada simplesmente de junção do emissor, enquanto a da base-coletor é chamada de junção do coletor. VEB e VCB representam as tensões nas junções do emissor e do coletor respectivamente. A configuração do circuito da Fig.7.3 é chamada de base comum, pois o terminal da base é comum entre os dois terminais de entrada e os dois de saı́da do dispositivo. Embora ela não seja a mais utilizada para polarizar transistores em circuitos práticos, é a mais conveniente para a compreensão dos mecanismos de funcionamento do transistor. Na operação normal do transistor bipolar, a junção do emissor é polarizada diretamente, enquanto a do coletor é polarizada reversamente. Assim, a resistência da junção do emissor é pequena e a corrente IE é relativamente grande. No transistor p-n-p, longe da junção, esta corrente é constituı́da essencialmente de buracos, que são os portadores majoritários no emissor e no coletor (componente 1 na Fig.7.4). Na junção do emissor, os buracos provenientes do emissor são injetados na base, onde se movem por difusão, contribuindo para uma parte da corrente do emissor que chamaremos de IEp . Por outro lado, elétrons passam da base para o emissor constituindo outra parte da corrente, IEn , ilustrada na Fig.7.4 (componente 7). Como vimos nas Eqs.(6.29)-(6.31), IEn se a concentração de impurezas for muito maior no é possı́vel ter IEp Figura 7.3: Representação esquemática de um transistor p-n-p com um circuito simples de polarização de base comum. Cap. 7 Transistores e Outros Dispositivos Semicondutores 221 lado p que no lado n. Note que se a espessura da base fosse muito grande, a junção do coletor estaria isolada da do emissor e o sistema corresponderia a dois diodos em série com polaridades opostas. Neste caso a corrente do coletor seria muito pequena, dada pelo valor de saturação reversa Is da Eq.(6.30) e, portanto, independente da corrente do emissor. Entretanto, a espessura da base é feita propositalmente pequena, menor que o comprimento de difusão Lp de buracos na base. Desta forma, mesmo sendo portadores minoritários, os buracos injetados na base não têm tempo de se recombinar completamente com os elétrons, pois logo atingem a região de depleção da junção do coletor, onde são acelerados pelo campo elétrico para o outro lado da junção. Ao atingirem o coletor tipo p, os buracos voltam a ser portadores majoritários e adquirem um movimento de deriva sob a ação do campo externo, formando a maior parte da corrente IC (componente 2 da Fig.7.4). Vemos então que a corrente no coletor é devida principalmente aos buracos injetados pelo emissor, sendo muito maior que a corrente de saturação reversa da junção do coletor (componentes 4 e 5 da Fig.7.4). A soma das componentes 2 e 4 forma a contribuição dos buracos para a corrente do coletor, que será chamada de ICp . A componente 5 é a contribuição dos elétrons para a corrente do coletor, chamada ICn . Para completar o cenário do funcionamento do transistor, é preciso com- Figura 7.4: Ilustração do fluxo de elétrons e de buracos em transistor p-n-p: 1- Buracos em movimento de deriva no emissor; 2- Buracos que atingem o coletor em movimento de difusão; 3- Buracos que desaparecem na base por recombinação; 4 e 5- Buracos e elétrons gerados termicamente e que formam a corrente de saturação reversa da junção do coletor; 6- Elétrons que recombinam com os buracos da componente 3; 7- Elétrons injetados da base para o emissor formando a corrente IEn . 222 Materiais e Dispositivos Eletrônicos preender o importante papel da corrente da base IB . Como vimos antes, grande parte da corrente IE passa para o coletor porque a espessura da base é muito pequena. Isto resulta numa corrente de coletor com valor próximo, porém menor que a corrente de emissor. Usando a equação de conservação de carga, IE = IB + IC , vemos que fazendo IC IE , a corrente IB será pequena mas não nula. Ela resulta do fluxo de elétrons do circuito externo para a base através do contato B, e consiste de três contribuições distintas: a primeira corresponde aos elétrons que recombinam com parte dos buracos injetados na base pelo emissor (componente 6 na Fig.7.4). Esta contribuição pode ser minimizada fazendo-se a espessura da base muito menor que Lp ; a segunda é relativa aos elétrons que passam da base para o emissor constituindo a corrente IEn (componente 7 na Fig.7.4); destas contribuições se subtrai uma terceira, ICn , produzida pelo fluxo de elétrons gerados termicamente no coletor e que passam para a base através da junção do coletor (componente 5 na Fig.7.4). Como veremos mais adiante, a condição essencial para a função de amplificação do transistor é que a corrente de base seja pequena, IB ∼ 10−2IE . Devido à proporcionalidade entre as correntes, uma variação na pequena corrente de base aparece ampliada na corrente de emissor e portanto também no coletor. Para fabricar um bom transistor é preciso então minimizar IB . Isto é conseguido fazendo-se a base estreita de modo a diminuir a recombinação, e com dopagem muito menor que a do emissor, de modo a reduzir IEn . Entretanto, como a espessura da base não pode ser muito menor do que 1 µm, devido às limitações fı́sicas, o mecanismo de recombinação ainda é significativo. Este fato estabelece um limite mı́nimo para IB . Na próxima seção apresentaremos a dedução das várias componentes das correntes a partir dos mecanismos microscópicos. Para concluir esta seção, vamos definir algumas relações entre as correntes IE , IB e IC que caracterizam parâmetros importantes do transistor. Como vimos anteriormente, a corrente de coletor é constituı́da essencialmente de buracos injetados pelo emissor e que não desaparecem na recombinação com elétrons na base. Na região linear de operação do transistor, esta corrente é proporcional à componente IEp da corrente no emissor. Portanto, ICp = B IEp , (7.1) onde B é o fator de transporte da base, que representa a fração dos buracos injetados pelo emissor que conseguem alcançar o coletor. Num transistor p+ n-p com uma base muito estreita, B < 1. Por outro lado, a componente IEp da corrente é um pouco menor e também proporcional à corrente do emissor Cap. 7 Transistores e Outros Dispositivos Semicondutores 223 IEp = γ IE (7.2) IE , , onde γ < 1 é chamado eficiência de injeção do emissor. Se a corrente de saturação reversa na junção do coletor, ICn , for desprezı́vel, podemos considerar IC = ICp + ICn ≃ ICp . Neste caso, com (7.1) e (7.2) podemos relacionar a corrente do coletor com a do emissor, IC = γ B IE ≡ α IE , (7.3) onde α ≡ γB é o fator de transferência de corrente, que também é menor que 1. A partir de (7.3) e da equação de continuidade de corrente é possı́vel relacionar a corrente de base com a do coletor. Usando (7.3) em IB = IE − IC obtemos, IB = IC 1−α − IC = IC α α , ou então IC = β IB onde β= α 1−α , (7.4) (7.5) é o fator de amplificação ou ganho de corrente. Este fator é um parâmetro caracterı́stico de cada transistor, mas também varia com as tensões de polarização das junções. Num bom transistor, α 1 de modo que o fator β é grande. A Eq.(7.4) exprime a caracterı́stica básica dos transistores no regime linear. Ela mostra que através de variações numa pequena corrente de base, é possı́vel controlar a variação na corrente muito maior que circula no coletor. A explicação fı́sica da proporcionalidade entre as correntes de base e de coletor é a seguinte. A corrente de coletor IC é formada basicamente pelos buracos injetados na base pela corrente do emissor, e que atingem o coletor porque não têm tempo de recombinar com elétrons na base, porque esta é muito estreita (espessura muito menor que o comprimento de difusão dos buracos). Portanto IC aumenta quando aumenta a corrente do emissor IE . A diferença entre IE e IC é a corrente de base IB , que é formada principalmente pelos elétrons que recombinam com os buracos injetados pelo emissor e que não alcançam o coletor. Então, se a corrente de base IB varia, o número de elétrons disponı́veis para recombinação varia, o que força IC a variar também, caso Materiais e Dispositivos Eletrônicos 224 contrário haveria um acúmulo de cargas na base. Desta forma uma variação em IB resulta numa variação em IC e em IE . Em certa faixa de variação a relação entre IB e IC é linear, como expresso na Equação (7.4). Na próxima seção obteremos as expressões que relacionam os parâmetros B, γ, α e β com as grandezas microscópicas dos semicondutores que compõem o transistor. Exemplo 7.1: Um transistor p-n-p em regime estacionário tem as seguintes componentes das correntes de emissor e de coletor: IEp = 10 mA, IEn = 0,1 mA, ICp = 9,98 mA, ICn = 0,001 mA. Calcule os parâmetros B, γ, α e β do transistor e a corrente de base nesta situação. O fator de transporte da base B é dado por (7.1), B= ICp 9, 98 = = 0, 998 . I Ep 10 A eficiência de injeção do emissor γ é dada por (7.2), sendo IE = IEp + IEn . Logo γ= I Ep 10 = = 0, 99 . I Ep + I En 10 + 0, 1 O fator de transferência de corrente α = γB é então, α = 0, 99 × 0, 998 = 0, 988 . Desprezando ICn em presença de ICp , o ganho de corrente é calculado com (7.5), β= 0, 988 α = = 82, 33 . 1−α 1 − 0, 988 A corrente de base pode ser calculada exatamente pela diferença entre as correntes de emissor e de coletor, IB = IE − IC = IEp + IEn − ICp + ICn = 10, 1 − 9, 981 = 0, 119 mA . Podemos também calcular IB usando as relações (7.4) e (7.5), onde (7.5) foi obtida desprezando a contribuição da corrente de saturação para IC . O resultado é, IB = 9, 981 IC = = 0, 121 mA . β 82, 33 Este valor difere do anterior em 0,002 mA, o que corresponde a uma diferença de apenas 1,7%. Cap. 7 Transistores e Outros Dispositivos Semicondutores 7.3 225 Correntes no Transistor Bipolar Como acontece no diodo de junção, as correntes no transistor bipolar de junção são determinadas pelo movimento de difusão dos portadores minoritários nas proximidades das junções. A diferença fundamental entre o diodo e o transistor é que, enquanto no primeiro a solução da equação da difusão é sujeita à condição de contorno na interface de uma junção, no segundo é preciso considerar as interfaces nas duas junções. Para calcular as correntes devemos então resolver a equação da difusão nas três regiões do transistor e impor as condições de contorno nas duas junções. Após obter a variação das concentrações dos portadores minoritários, calcularemos as correntes de difusão como fizemos para o diodo na Seção 6.2. 7.3.1 Cálculo das Correntes no Modelo Unidimensional Vamos analisar um transistor p-n-p com o modelo unidimensional ilustrado na Fig.7.5. Este modelo é bom para o dispositivo da Fig.7.2 porque as dimensões laterais são muito maiores que as espessuras das camadas. Vamos supor que as espessuras do emissor e do coletor são muito grandes comparadas com o comprimento de difusão, enquanto a base tem uma espessura qualquer. No emissor e no coletor os portadores minoritários são os elétrons, cujas concentrações são nE (x) e nC (x) respectivamente. Os buracos injetados pelo emissor são portadores minoritários na base, descritos pela concentração p(x). Como o emissor é longo, nE (x) é descrito por uma exponencial que cai quando se afasta da junção do emissor. A corrente de difusão correspondente é então dada pela mesma expressão obtida na Seção 6.2 para uma junção. Da Eq.(6.28) podemos escrever a contribuição dos elétrons para a corrente de emissor, IEn = e A DnE nE eeVEB /kB T − 1 LnE , (7.6) onde A é a área da seção reta do transistor, nE é a concentração de equilı́brio de elétrons no emissor, DnE e LnE são o coeficiente e o comprimento de difusão respectivamente, e VEB é a tensão entre emissor e base. Do mesmo modo podemos escrever a contribuição dos elétrons para a corrente de coletor, ICn = −e A Dn C nC eeVCB /kB T − 1 LnC , (7.7) 226 Materiais e Dispositivos Eletrônicos Figura 7.5: Modelo unidimensional utilizado para calcular as correntes no transistor p-n-p. Note que as coordenadas x = 0 e x = estão nas extremidades das regiões de depleção das junções do emissor e do coletor. onde a notação é análoga a da Eq.(7.6) e o sinal é negativo pois o sentido positivo de IC vai do lado n para o lado p da junção do coletor e VCB é normalmente negativo. No caso dos buracos na base, a solução para a variação da concentração p(x) é mais complicada porque é preciso considerar a solução geral da equação de difusão, dada por (5.83), δp(x) ≡ p(x) − pB = C1 e−x/Lp + C2 ex/Lp , (7.8) onde pB é a concentração de equilı́brio de buracos na base e Lp é o comprimento de difusão correspondente. Para obter δp(x) basta impor as condições de contorno nas junções do emissor e do coletor, em x = 0 e x = , e calcular as constantes C1 e C2 . Na junção do emissor, desprezando-se a espessura da região de carga espacial, a Eq.(6.24) permite relacionar a concentração de buracos com a tensão de polarização, . (7.9) δpn (x = 0) ≡ pE = pB eeVEB /kB T − 1 Analogamente, na junção do coletor temos δpn () ≡ pC = pB eeVCB /kB T − 1 . (7.10) Note que num transistor em condições normais de operação, a junção do emissor é polarizada diretamente (VEB > 0) enquanto a do coletor é polarizada reversamente (VCB < 0). Nessa situação, para VEB , |VCB | kB T /e (0,025 V Cap. 7 Transistores e Outros Dispositivos Semicondutores 227 em T = 290 K), as condições de contorno (7.9) e (7.10) podem ser aproximadas por, pE ≃ pB eeVEB /kB T pC ≃ −pB pE pB , (7.11) . (7.12) O resultado (7.12) é devido ao fato de que, na junção polarizada reversamente, os buracos em excesso do equilı́brio são “puxados” rapidamente pelo forte campo elétrico para o coletor, fazendo sua concentração ficar próxima de zero. Substituindo (7.9) e (7.10) em (7.8) obtemos pE = C1 + C2 , pC = C1 e−/Lp + C2 e/Lp , das quais obtemos C1 = pE e/Lp − pC 2 senh(/Lp ) C2 = pC − pE e−/Lp 2 senh(/Lp ) , (7.13) , (7.14) Antes de prosseguir na análise das correntes vamos examinar o comportamento das concentrações dos portadores minoritários nas três regiões do transistor. Em condições normais de operação e considerando a concentração de equilı́brio de buracos na base muito pequena, podemos supor que pC ≃ 0. Substituindo (7.13) e (7.14) em (7.8), e usando esta aproximação, obtemos para a região 0 < x < , δp(x) = pE senh[( − x)/Lp ] senh(/Lp ) , (7.15) No caso dos elétrons no emissor e no coletor, suas concentrações são dadas por exponenciais simples, como discutimos anteriormente. A Fig.7.6 ilustra a variação das concentrações no transistor p+ -n-p em condições normais de polarização. Note que em geral a base é feita com espessura pequena, Lp , de modo a minimizar a corrente de base. Por esta razão a variação da concentração de buracos é aproximadamente linear. Tendo obtido a distribuição de buracos na base do transistor, podemos calcular sua contribuição para as 228 Materiais e Dispositivos Eletrônicos Figura 7.6: Variação das concentrações dos portadores minoritários no transistor p-n-p com polarização direta na junção do emissor e reversa no coletor. O valor de ∆pC ≃ −pB está exagerado, pois pB ∆pE . correntes a partir da equação da corrente de difusão (5.57), Ip (x) = −eA Dp dδp dx , que aplicada à (7.8) dá, Ip (x) = eA Dp C1 e−x/Lp − C2 ex/Lp Lp . (7.16) As componentes das correntes do emissor e de coletor devidas aos buracos são dadas pelos valores da Eq.(7.16) em x = 0 e x = , respectivamente, IEp = Ip (0) = e A Dp (C1 − C2 ) Lp ICp = Ip () = e A Dp (C1 e−/Lp − C2 e/Lp ) Lp , (7.17) . (7.18) Substituindo as expressões (7.13) e (7.14) em (7.17) e (7.18) e utilizando as definições das funções hiperbólicas vem: Dp pE coth − pC csch , (7.19) IEp = e A Lp Lp Lp Dp − pC coth pE csch . (7.20) ICp = e A Lp Lp Lp Cap. 7 Transistores e Outros Dispositivos Semicondutores 229 Somando-se as contribuições de elétrons e de buracos, (7.6), (7.7), (7.19) e (7.20), e utilizando as expressões (7.9) e (7.10), obtemos as correntes de emissor e de coletor em função das tensões de polarização e dos parâmetros do material, IE = e A +eA IC = e A Dp pB eeVEB /kB T − 1 coth − eeVCB /kB T − 1 csch Lp Lp Lp Dn E nE eeVEB /kB T − 1 LnE , (7.21) Dp pB eeVEB /kB T − 1 csch − eeVCB /kB T − 1 coth Lp Lp Lp −eA Dn C nC eeVCB /kB T − 1 LnC . (7.22) As Eqs.(7.21) e (7.22) permitem calcular todos parâmetros e curvas caracterı́sticas do transistor. A corrente de base pode ser obtida usando-se estas duas expressões na equação de continuidade, IB = IE − IC . Os parâmetros do transistor podem ser calculados pela substituição de (7.19)-(7.22) nas definições (7.1)-(7.5). Como na forma geral estas equações são difı́ceis de interpretar, vamos calcular as grandezas de interesse fazendo algumas aproximações simplificadoras. Exemplo 7.2: Um transistor p+ -n-p+ de Si em T = 300 K tem as seguintes caracterı́sticas: Área de seção A = 10−3 cm2 ; espessura da base = 1 µm; concentração de impurezas, no emissor NaE = 1017 cm−3 , na base Nd = 5 × 1015 cm−3 , no coletor NaC = 5 × 1017 cm−3 ; tempos de recombinação de portadores minoritários, no emissor e no coletor, τn = 0, 5 µs, na base τp = 1 µs. Calcule as correntes no emissor e no coletor com a junção emissor-base polarizada diretamente no regime de plena condução, com VEB = 0,7 V, tendo a junção coletor-base polarizada reversamente, com VCB = - 10V. Para calcular as correntes por meio das Equações (7.21) e (7.22) é preciso, inicialmente, calcular as concentrações dos portadores minoritários e os comprimentos de difusão. A concentração de equilı́brio dos buracos na base é calculada com (5.38), sendo ni o valor dado na Tabela 5.2. Usando unidades do SI temos, pB = n2i 1, 52 × 1020 × 1012 = = 4, 5 × 1010 m−3 . Nd 5 × 1015 × 106 As concentrações de elétrons em equilı́brio no emissor e no coletor são dadas por (5.41), nE = n2i 1, 52 × 1020 × 1012 = = 2, 2 × 109 m−3 , NaE 1017 × 106 Materiais e Dispositivos Eletrônicos 230 nC = n2i 1, 52 × 1020 × 1012 = = 4, 5 × 108 m−3 . NaC 5 × 1017 × 106 Os comprimentos de difusão são √ calculados através de sua relação com o coeficiente de difusão D e o tempo de recombinação τ , L = Dτ . Usando os valores de D no Si dados na Tabela 5.2 e os valores de τ do enunciado, obtemos no SI, 1/2 1/2 Lp = 12, 5 × 10−4 × 1 × 10−6 Ln = 35 × 10−4 × 0, 5 × 10−6 = 3, 5 × 10−5 m = 35 µm , = 4, 2 × 10−5 m = 42 µm . Vemos então que /Lp 1 e portanto as funções hiperbólicas das equações (7.21) e (7.22) podem ser substituı́das por suas expansões binomiais, com x = /Lp , coth x ≃ 1 x 35 1 + = + = 35, 0095 x 3 1 3 × 35 csch x ≃ x 35 1 1 − = + = 34, 9952 x 6 1 6 × 35 Finalmente, para comparar os valores relativos dos diversos termos das Equações (7.21) e (7.22), é preciso calcular os valores das exponenciais contendo as tensões de polarização. Lembrando que em T = 300 K a energia térmica é kB T = 0, 026 eV, eeVEB /kB T = e0,7/0,026 = e26,92 = 4, 9 × 1011 eeVCB /kB T = e−10/0,026 = e−384,6 ≃ 0 Vemos então que, como exp(eVEB /kB T ) 1, tanto em (7.21) quanto em (7.22), os termos que não contêm este fator podem ser desprezados. Então podemos escrever, IE ≃ e A Dp DnE pB eeVEB /kB T coth + eA nE eeVEB /kB T Lp Lp LnE IC ≃ e A Dp pB eeVEB /kB T csch . Lp Lp Usando os parâmetros da Tabela 5,2, os dados do transistor e os valores obtidos anteriormente temos, no SI, IE = 1, 6 × 10−19 × 10−7 × = 1, 6 × 10−19 × 10−7 × 12, 5 × 10−4 × 4, 5 × 1010 × 4, 9 × 1011 × 35, 0095 3, 5 × 10−5 35 × 10−4 × 2, 2 × 109 × 4, 9 × 1011 4, 2 × 10−5 = 0, 44112 A + 0, 00144 A = 0, 44256 A IC = 1, 6 × 10−19 × 10−7 × = 0, 44094 A . 12, 5 × 10−4 × 4, 5 × 1010 × 4, 9 × 1011 × 35, 9952 3, 5 × 10−5 Cap. 7 Transistores e Outros Dispositivos Semicondutores 231 Evidentemente, os valores das correntes do emissor e do coletor são muito próximos, como era esperado. É importante notar que, se nas expressões de IE e de IC for usado apenas o primeiro termo da expansão binomial da função hiperbólica, e se a contribuição IEn for desprezada, as duas correntes ficarão rigorosamente iguais. Portanto, como a diferença das duas correntes é a corrente de base, é essencial usar nas expansões binomiais os dois primeiros termos. Vemos também que, embora a contribuição dos elétrons gerados termicamente seja pequena, ela não deve ser desprezada a priori, pois estando presente em IE mas não em IC , ela tem significado importante na diferença das duas correntes. 7.3.2 Corrente de Base Como mostram os cálculos feitos no Exemplo 7.2, no transistor p-n-p com polarização normal, o fator exp(e VEB /kB T ) é muito grande, enquanto que o fator exp(e VCB /kB T ) é desprezı́vel. Isto permite obter uma expressão aproximada para a corrente de base, desprezando os termos que não contêm o fator exp(e VEB /kB T ) nas Equações (7.21) e (7.22), DnE e VEB /kB T Dp pB coth − csch nE . IB = IE − IC = e A e + Lp L L LnE Pode-se mostrar (Problema 7.2) que esta expressão se reduz a DnE e VEB /kB T Dp pB tanh nE . + IB = e A e Lp 2Lp LnE (7.23) Este resultado mostra que no transistor p-n-p com polarização normal, a corrente de base é dominada por duas contribuições. O segundo termo em (7.23) corresponde à contribuição dos elétrons injetados da base para o emissor, representado pela componente 7 da Figura 7.4. Para interpretar a outra contribuição, vamos introduzir ∆pE , dado por (7.11), no primeiro termo de (7.23). Desprezando o termo em nE temos, Dp pE tanh . IB ≃ e A Lp 2Lp Supondo que a base é estreita em relação ao comprimento de difusão, podemos usar a aproximação tanh x ≃ x para obter IB ≃ eA pE 2τp , Lp , (7.24) Materiais e Dispositivos Eletrônicos 232 onde τp = L2p /Dp é o tempo de recombinação dos buracos. Esta equação tem uma interpretação fı́sica simples. Sendo a concentração de buracos na base, em excesso do equilı́brio, dada por pE em x = 0 (emissor) e pC = 0 em x = (coletor), epE A /2 ≡ Qp é a carga dos buracos que desaparecem da base por recombinação. Como a recombinação ocorre num intervalo de tempo caracterı́stico τp , a corrente que deve ser fornecida à base para repor a carga que desaparece e manter o regime estacionário, é Qp /τp . Esta é, precisamente, a corrente de base dada por (7.24). Este resultado confirma a interpretação qualitativa da corrente de base descrita no final da Seção 7.2. A Equação (7.24) mostra que para ter uma corrente IB pequena deve-se fazer a base muito estreita comparada com Lp , e com uma concentração de impurezas relativamente baixa de modo que o tempo τp seja longo. Exemplo 7.3: Calcule a corrente de base no transistor do Exemplo 7.2, utilizando a Equação (7.23), e compare com o valor obtido pela diferença entre IE e IC . Substituindo em (7.23) os valores das grandezas do Exemplo 7.2 e usando tanh ( /2Lp ) ≃ ( /2Lp ) vem, IB = 1, 6 × 10−19 × 10−7 × 4, 9 × 1011 × 35 × 10−4 1 12, 5 × 10−4 10 + × 4, 5 × 10 × × 2, 2 × 109 3, 5 × 10−5 2 × 35 4, 2 × 10−5 = 1, 6 × 10−19 × 10−7 × 4, 9 × 1011 × 2, 29 × 1010 + 1, 83 × 1011 = 1, 61 × 10−3 A = 1, 614 mA . É interessante notar que, neste caso, a contribuição dos elétrons térmicos (IEn ) para a corrente de base, dada pelo segundo termo da equação acima, é maior que a contribuição dada pelo primeiro termo. Num transistor p+ -n-p, com concentração de impurezas no emissor muito maior que na base, nE é muito menor e o termo de recombinação predomina sobre IEn . O valor de IB obtido por meio da diferença entre as correntes calculadas no Exemplo 7.2 é IB = IE − IC = 0, 44256 − 0, 44094 = 0, 00162 A = 1, 62 mA que é muito próximo do valor acima. Evidentemente, a diferença entre os dois valores resulta das aproximações feitas nas funções hiperbólicas e nos arredondamentos numéricos. Cap. 7 Transistores e Outros Dispositivos Semicondutores 7.3.3 233 Parâmetros do Transistor Para obter os parâmetros γ, B, α e β do transistor vamos desprezar os termos em pC e a corrente de saturação reversa no coletor, nas Eqs.(7.6)-(7.22). Esta aproximação é válida porque quando usado como amplificador, o transistor sempre tem a junção do coletor polarizada reversamente. Nesta aproximação, usando (7.6), (7.11) e (7.19) na definição da eficiência de injeção (7.2) obtemos, γ= IEp 1 1 = = DnE nE Lp IE 1 + IEn /IEp 1 + Dp pB Ln tanh Lp . E Utilizando-se as relações (5.38) e (5.41) entre as concentrações de equilı́brio dos portadores minoritários e as concentrações de impurezas doadoras (Nd ) na base e aceitadoras (Na ) no emissor, esta expressão pode ser escrita na forma −1 DnE Nd Lp tanh . (7.25) γ = 1+ Dp Na LnE Lp Usando apenas o primeiro termo de (7.22) para IC e o primeiro termo de (7.19) para IEp , com ∆pE dado por (7.9), o fator de transporte da base, definido por (7.1), fica IC csch(/Lp ) = sech B= = . (7.26) IEp coth(/Lp ) Lp Com (7.25) e (7.26), pode-se obter o fator de transferência de corrente α definido em (7.3) −1 DnE Nd Lp IC = Bγ = cosh + senh . (7.27) α= IE Lp Dp Na LnE Lp Finalmente, usando (7.27) em (7.5) obtemos o fator de amplificação β, −1 α DnE Nd Lp IC = senh − 1 . (7.28) β= ≃ cosh + IB 1−α Lp Dp Na LnE Lp 1, podemos obter uma expressão mais simples Considerando que /Lp para β com a utilização das expansões das funções hiperbólicas, senh x ≃ x 1 cosh x ≃ 1 + x2 . 2 234 Materiais e Dispositivos Eletrônicos O fator de amplificação dado por (7.28) fica então, 2 −1 DnE Nd + . β= 2L2p Dp Na LnE (7.29) As expressões (7.26)-(7.29) permitem calcular todos os parâmetros do transistor a partir das caracterı́sticas de sua construção com boa precisão. Exemplo 7.4: Calcule o fator de amplificação do transistor p-n-p de silı́cio com os mesmos parâmetros do Exemplo 7.2. Usando na Eq.(7.29) os parâmetros e as grandezas calculadas no Exemplo 7.2, vem, 35 × 5 × 1015 × 1 1 1 + = 2 β 2 × 35 12, 5 × 1017 × 42 1 1 1 = + = 0, 00374 . β 2450 300 Portanto, o fator de amplificação dado por (7.29) é, β= 1 = 267, 3 . 0, 00374 Podemos também calcular β diretamente, através da razão entre IC , calculado no Exemplo 7.2, e IB , calculado no Exemplo 7.3. O resultado é, β= 0, 44094 IC = 272, 2 . = IB 0, 00162 A diferença entre os dois valores decorre das aproximações feitas na dedução da Eq.(7.29) e também dos arredondamentos numéricos. 7.3.4 Curvas Caracterı́sticas I-V As Eqs.(7.21) e (7.22) descrevem muito bem as correntes no transistor p-n-p. Para entender qualitativamente o comportamento das correntes em função das tensões de polarização, é melhor simplificar a notação e escrevê-las na forma, (7.30) IE = IEs eeVEB /kB T − 1 − αI ICs eeVCB /kB T − 1 , (7.31) IC = αN IEs eeVEB /kB T − 1 − ICs eeVCB /kB T − 1 Cap. 7 Transistores e Outros Dispositivos Semicondutores 235 onde IEs ≡ e A Dp pB e A DnE nE coth + Lp Lp LnE (7.32) ICs ≡ e A Dp pB e A DnC nC coth + Lp Lp LnC (7.33) αN ≡ e A Dp pB csch IEs Lp Lp (7.34) αI ≡ e A Dp pB csch ICs Lp Lp . (7.35) As relações (7.30) e (7.31) foram obtidas originalmente por J.J. Ebers e J.L. Moll e são por isso chamadas equações de Ebers-Moll. Elas têm validade bastante geral, mesmo que o transistor não possa ser representado pelo modelo unidimensional simples da Fig.7.4. No caso geral os parâmetros das equações não são dados pelas expressões (7.32)-(7.35), porém é possı́vel mostrar que eles obedecem a relação αN IEs = αI ICs , (7.36) que também é satisfeita por (7.32)-(7.35). As equações de Ebers-Moll mostram que a corrente no emissor é dada por um termo caracterı́stico do diodo de sua própria junção, superposto a outro termo proporcional à corrente de diodo na junção do coletor. Analogamente, a corrente no coletor é a soma de dois termos, um propocional ao do diodo do emissor e outro do próprio coletor. Essas equações mostram que o transitor pode ser caracterizado por apenas quatro parâmetros, relacionados entre si pela expressão (7.36). Esses parâmetros não são em geral fornecidos pelo fabricante, porém podem ser facilmente medidos no laboratório. Veja na Eq.(7.30) que se a junção coletor-base for curtocircuitada, isto é VCB = 0, a medida de IE e IC em função de VEB fornece IEs e αN IEs respectivamente. Analogamente, fazendo VEB = 0 pode-se medir ICs e αI ICs e completar a caracterização do transistor descrito pelas Eqs.(7.30) e (7.31). As curvas caracterı́sticas I-V do transistor nada mais são que a representação gráfica das equações de Ebers-Moll. Como nas equações há duas tensões, VEB e VCB , e duas correntes, IE e IC , é preciso selecionar algumas grandezas e exprimi-las em função de outras. Multiplicando (7.30) por αN e subtraindo de (7.31) vem 236 Materiais e Dispositivos Eletrônicos IC = αN IE − (1 − αN αI ) ICs (eeVCB /kB T − 1) . Analogamente, multiplicando (7.31) por αI e subtraindo de (7.30) obtemos IE = αI IC + (1 − αN αI ) IEs (eeVEB /kB T − 1) . Estas equações podem ser escritas na forma, IE = αI IC + IE0 (eeVEB /kB T − 1) , (7.37) IC = αN IE − IC0 (eeVCB /kB T − 1) , (7.38) onde IE0 = (1 − αN αI ) IEs , IC0 = (1 − αN αI ) ICs , são, respectivamente, as correntes de saturação do emissor com a junção do coletor aberto (IC = 0) e do coletor com a junção do emissor aberta (IE = 0). A Eq.(7.38) permite fazer o gráfico de IC em função de VCB tendo IE como parâmetro. Para IE = 0, se VCB < 0, a curva IC −VCB é igual à de uma junção polarizada reversamente, como na Fig.6.7. Para pequenos valores de VCB a corrente atinge a saturação com valor IC ≃ IC0 . Se IE = 0, podemos fazer uma curva IC − VCB para cada valor de IE , resultando no conjunto de curvas mostrado na Fig.7.7(a). Note que para IE = 0 e VCB < 0, parte dos buracos injetados na base pela corrente do emissor atinge a junção do coletor e produz uma contribuição adicional à corrente de saturação reversa, IC ≃ IC0 + αN IE . Por esta razão, as várias curvas da Fig.7.7(a) se assemelham a de uma junção polarizada reversamente, deslocada de αN IE . As curvas da Fig.7.7(a) são úteis quando o transistor é usado na configuração de base comum da Fig.7.3. Neste caso, se a corrente de base é nula, a corrente de coletor é muito pequena. Isto pode ser entendido pelo fato de que sendo IC = IE , como a junção do coletor está polarizada reversamente, ambas as correntes devem ser pequenas. À medida que IB aumenta, a diferença entre IE e IC cresce e, mesmo estando a junção do coletor com polarização reversa, o mecanismo de injeção faz IC aumentar. As curvas da Fig.7.7(b) mostram claramente o controle da corrente IC feito pela pequena corrente IB . Quando o transistor é usado na configuração de emissor comum, é mais importante trabalhar com as curvas IC − VCE , tendo a corrente de base IB como parâmetro. A Fig.7.7(b) mostra curvas tı́picas para o transistor p-n-p na configuração de emissor comum. As diversas curvas I-V são caracterı́sticas Cap. 7 Transistores e Outros Dispositivos Semicondutores 237 Região de saturação 10 10 8 8 6 6 4 4 2 2 2 4 6 100 8 75 6 50 4 8 10 – VCB(V) Região ativa Região de corte 25 2 IE = 0 mA 0 10 IC(mA) IC(mA) 125 mA IB = 0 mA 0 2 4 6 8 10 – VCE(V) Figura 7.7: Curvas caracterı́sticas de transistor p-n-p: a) curvas com IE como parâmetro usadas na configuração de base comum; b) curvas com parâmetro IB para configuração de emissor comum. de cada tipo do transistor e são fornecidas pelo fabricante. Na verdade elas variam um pouco de uma medida para outra, mesmo sendo do mesmo tipo, de modo que as curvas dos fabricantes representam dados médios. Como elas também variam com a temperatura, é comum encontrar as curvas para alguns valores de temperatura. Para concluir esta seção observamos que num transistor n-p-n os sentidos das correntes e das tensões são opostos aos do transistor p-n-p. As equações para o transistor n-p-n têm a mesma forma de (7.30)-(7.35), com as letras p e n trocadas, uma vez que os papéis dos elétrons e dos buracos são trocados. 7.4 Aplicações de Transistores Os transistores bipolares de junção têm inúmeras aplicações em circuitos eletrônicos, sendo as mais comuns a amplificação e o chaveamento. A Fig.7.8 mostra os sı́mbolos dos transistores n-p-n e p-n-p utilizados em circuitos, e uma vista externa tı́pica de um transistor de baixa potência encapsulado. Nos sı́mbolos de circuito a única diferença entre os tipos n-p-n e p-n-p é 238 Materiais e Dispositivos Eletrônicos Figura 7.8: a) Sı́mbolos dos transistores n-p-n e p-n-p utilizados em circuitos. b) Vista externa de transistor de baixa potência encapsulado. a seta no terminal do emissor, indicando o sentido direto da corrente. No transistor encapsulado não existe qualquer diferença externa entre os dois tipos. É preciso consultar os dados do fabricante para se saber qual o seu tipo. Para operar em uma região conveniente de sua caracterı́stica I-V , o transistor precisa ter suas junções polarizadas adequadamente. A Fig.7.9(a) mostra um transistor n-p-n na configuração de emissor comum com um circuito simples de polarização. Note que as tensões aplicadas às junções do emissor e do coletor têm os sentidos opostos aos do transistor p-n-p. Como a resposta do transistor é altamente não linear, é preciso usar métodos gráficos para determinar o chamado ponto de operação, cujas coordenadas são as correntes e tensões no regime dc. Como a resistência da junção do emissor é muito pequena, a corrente de base é simplesmente IB ≃ EB /RB . Para calcular a corrente de coletor, utilizamos a curva correspondente ao valor calculado da corrente IB nas caracterı́sticas I-V de emissor comum, como as da Fig.7.7(b). A equação da malha do coletor é EC = RC IC + VCE (IC , IB ) . (7.39) Esta equação é representada no plano IC −VCE por uma reta, chamada reta de carga. Para determinar sua posição basta obter os pontos de interseção com os eixos IC e VCE . É fácil ver na Eq.(7.39) que eles são dados por IC = EC /RC e VCE = EC , como mostrado na Fig.7.9(b). O ponto de interseção da reta de carga com a curva IC − VCE do transistor, o ponto P da Fig.7.9(a), é a solução da Eq.(7.39) e portanto o ponto de operação do circuito. Dependendo da região na caracterı́stica I-V onde o ponto está situado, assim como da forma e amplitude do sinal vs de entrada, o transistor pode exercer diferentes funções. Cap. 7 Transistores e Outros Dispositivos Semicondutores 239 Figura 7.9: a) Circuito amplificador simples com transistor n-p-n na configuração de emissor comum. b) Ilustração do método gráfico para determinação do ponto de operação. Para atuar como um bom amplificador é preciso que o ponto de operação esteja na região ativa das curvas caracterı́sticas, mostrada na Fig.7.7(b). Nesta região, uma variação IB na pequena corrente de base, produzida por um sinal ac aplicado ao circuito através do capacitor na Fig.7.9(a), produz uma variação IC na corrente do coletor. Desde que a corrente de base não se aproxime das regiões de saturação ou de corte, mostradas na Fig.7.7(b), a variação na corrente de coletor é proporcional a da corrente de base, estando relacionadas pelo ganho de corrente, IE /IB ≃ β. Vemos então que a posição do ponto de operação é essencial para o bom funcionamento do transistor. Por esta razão, costuma-se utilizar um circuito de polarização mais complexo que o da Fig.7.9, no qual uma malha de realimentação serve para estabilizar o ponto de operação. Outra aplicação importante de transistores é em circuitos de chaveamento. A Fig.7.10 mostra um desses circuitos com um transistor p-n-p na configuração de emissor comum, com um esquema simples de polarização. No circuito de chaveamento o transistor é geralmente controlado para operar em dois estados de condução, um estado on e outro off. No estado on ele deve comportar-se como uma chave fechada, que deixa passar uma corrente, com resistência muito baixa, enquanto no estado off ele se comporta como uma chave aberta. Este controle é feito na corrente de coletor, por meio de uma corrente de base muito menor. Os dois estados do transistor podem ser alcançados na configuração de emissor comum, como pode ser visto nas curvas da Fig.7.7(b). A reta de carga para o circuito da Fig.7.10 é obtida do mesmo modo que na Fig.7.9. Entretanto, como não existe a bateria EB , a corrente de 240 Materiais e Dispositivos Eletrônicos base na ausência do sinal de entrada vs é nula. Nesta situação a corrente de coletor é muito pequena e o transistor está cortado, ou no estado off. Quando o sinal vs mostrado na Fig.7.10 é aplicado, o circuito opera com a corrente de base variando entre dois valores, um que corta a corrente do coletor e outro que leva o transistor à saturação. A região de corte, mostrada na Fig.7.7(b), é alcançada quando a corrente de base é nula ou negativa. Por outro lado, a região de saturação é atingida quando a corrente de base é positiva e suficientemente grande. Nesta situação a corrente de coletor é grande e o transistor está no estado on. Desta forma, um sinal de pequena potência como vs controla o transistor fazendo-o operar como uma chave que ora está aberta, ora está fechada. Esta chave pode controlar uma corrente de coletor muito maior que a corrente de base, desempenhando um papel semelhante ao de um relé eletromecânico, porém com inúmeras vantagens. Como o relé tem partes móveis e usa contatos mecânicos, ele é muito mais lento e tem durabilidade muito menor que o transistor. Numa chave ideal a passagem do estado off para on, ou vice-versa, deve ser feita instantaneamente. É evidente que isto não ocorre no transistor real. Existe um tempo de transiente finito, devido ao fato de que na passagem do estado de saturação para o estado de corte, ou vice-versa, ocorre a remoção ou introdução de carga distribuı́da na base. Isto não pode ser feito instantaneamente, pois corresponderia a uma corrente infinita. Os tempos de decaimento e de crescimento da carga na base são devidos essencialmente aos mesmos efeitos mencionados no caso do diodo de junção. O transistor de chaveamento é utilizado em inúmeras aplicações de circuitos digitais, uma vez que seus dois estados correspondem aos bits 0 e 1 do sistema binário. Figura 7.10: Circuito simples de chaveamento usando transistor p-n-p na configuração de emissor comum. Cap. 7 Transistores e Outros Dispositivos Semicondutores 7.5 241 Transistores de Efeito de Campo Os transistores de efeito de campo, abreviadamente TEC ou FET (de Field Effect Transistor), constituem uma famı́lia de transistores de grande importância tecnológica. Do mesmo modo que os transistores bipolares, os FETs são dispositivos de três terminais amplamente utilizados para amplificação e chaveamento. Entretanto, do ponto de vista do circuito, há uma grande diferença entre os dois tipos de transistores. Enquanto nos bipolares o sinal de saı́da é controlado por uma corrente de entrada, nos FETs ele é controlado por uma tensão de entrada. Os mecanismos de operação dos transistores de efeito de campo são bastante diferentes dos que ocorrem nos transistores bipolares, estudados na seção anterior. Enquanto nos transistores bipolares o controle do sinal de saı́da é feito através dos portadores minoritários em movimento de difusão na base, nos FETs o controle é feito sobre os portadores majoritários em movimento de deriva. Estes portadores movem-se de um terminal chamado fonte para outro chamado dreno, através de uma região uniforme do semicondutor, o canal. O controle do movimento dos portadores no canal é feito por um campo criado pela tensão aplicada entre um terceiro terminal, chamado porta, e a fonte. Esta é a razão do nome efeito de campo. Há três tipos principais de transistores de efeito de campo: o de junção, o de metal-semicondutor e o de porta isolada. No de junção, abreviado por TECJ em português, ou JFET, em inglês, a tensão aplicada à porta varia a espessura da região de depleção de uma junção p-n reversamente polarizada. No transistor de efeito de campo metal-semicondutor, abreviado por TECMS, ou MESFET em inglês, a porta é formada por uma junção metalsemicondutor. A operação do MESFET é muito semelhante a do JFET, porém ele tem resposta mais rápida, e por isto é muito empregado em aplicações de altas freqüências. Nos transistores de efeito de campo com porta isolada, como o nome diz, o terminal metálico da porta é isolado do semicondutor por uma camada isolante. No caso mais comum este isolante é um óxido do próprio semicondutor, como o SiO2 no caso do silı́cio. Neste caso o transistor é chamado de metal-óxido-semicondutor, sendo abreviado por TEC-MOS ou MOSFET (do inglês, Metal-Oxide-Semiconductor-FET). Ambos os tipos são caracterizados por uma alta impedância de entrada, uma vez que a tensão de controle é aplicada à junção polarizada reversamente, ou através de um isolante. Os 242 Materiais e Dispositivos Eletrônicos MOSFETs têm enorme aplicação em circuitos digitais integrados e constituem dispositivos fundamentais na tecnologia de computadores. 7.5.1 O Transistor de Efeito de Campo de Junção No transistor de efeito de campo de junção, que será referido aqui por sua abreviatura em inglês, JFET, uma tensão variável aplicada à porta controla a seção reta efetiva de um canal semicondutor, por onde fluem portadores majoritários. A Fig.7.11(a) mostra um corte da pastilha de semicondutor de um JFET de canal n, no qual aparecem as regiões tipo n do canal e tipo p+ das portas, bem como os contatos metálicos da fonte (F), porta (P) e dreno (D). Note que há duas regiões p+ das portas, uma superior e outra inferior, que são interligadas eletricamente. Devido a sua simetria, a estrutura com duas portas é mais simples de ser analisada. Entretanto, é comum também fabricar o JFET com apenas uma porta. O JFET de canal p é inteiramente análogo ao de canal n, tendo as regiões p e n trocadas em relação às da Fig.7.11(a). Em comparação com a do transistor bipolar, a operação do JFET é muito simples. Vamos considerar o caso de um JFET de canal n, mostrado na Fig.7.11. A diferença de potencial VD entre dreno e fonte produz uma corrente ID no canal, formada predominantemente por elétrons. Os elétrons se movem por deriva da fonte para o dreno, enquanto o sentido convencional da corrente é o oposto. O valor desta corrente é determinado pela tensão VD Figura 7.11: Transistor de efeito de campo de junção de canal n: a) estrutura planar mostrando as diversas regiões e os terminais da fonte (F), porta (P) e dreno (D); b) modelo simétrico para a região do canal. Cap. 7 Transistores e Outros Dispositivos Semicondutores 243 e também pela resistência do canal, que por sua vez depende da concentração de impurezas, do comprimento e da área efetiva da seção reta do canal. Esta área pode ser controlada pelo tamanho das regiões de depleção das junções p+ -n entre as portas e o canal, uma vez que nestas não existem elétrons de condução. Como a espessura da região de depleção depende da tensão reversa na junção, a corrente de dreno ID varia com a tensão VP entre a porta e a fonte. Desta forma a variação da corrente ID é controlada pela tensão VP . 7.5.2 Caracterı́stica do Transistor JFET Para calcular a caracterı́stica I-V do JFET, vamos considerar o modelo simétrico mostrado na Fig.7.11(b) para a região do canal. O canal tem comprimento L, profundidade D (perpendicular ao plano da figura) e altura efetiva h(x), uma vez que não há elétrons nas regiões de depleção das duas junções canal-porta. Esta altura efetiva é dada por h = 2(a − ), sendo que a espessura da região de depleção depende da tensão reversa na junção. Esta tensão varia com x pois a corrente ID do dreno para a fonte produz uma queda de potencial ao longo do canal. Por conseguinte e h também variam com x, de modo que a área da seção reta efetiva varia ao longo do canal. Isto faz com que a resistência do canal não seja dada simplesmente pela expressão usual, ρL/A. No entanto, a dependência da corrente ID com as tensões VD e VP pode ser calculada a partir de conceitos e relações simples. A densidade de corrente no canal, dada pelas Eqs.(5.45) e (5.48), pode ser escrita na forma: dφ(x) , (7.40) J(x) = σ E(x) = enµn E(x) = −enµn dx onde φ(x) é o potencial elétrico no ponto de coordenada x do canal, em relação à fonte (x = 0). A intensidade de corrente ID no canal é dada pelo produto de J pela área efetiva, ID = 2[a − (x)] D J(x) , (7.41) onde (x) é a espessura das regiões de depleção das junções p+ − n na seção de Nd abcissa x. Considerando que em x a tensão reversa é V (x), supondo Na e potencial de contato desprezı́vel, (x) é dado por (Eq.(6.18) e Problema 6.4) 2 V (x) (x) ≃ e Nd 1/2 , (7.42) 244 Materiais e Dispositivos Eletrônicos onde a tensão reversa na junção V (x) é dada pela diferença de potencial entre um ponto de abcissa x no canal e a porta, ou seja V (x) = φ(x) − VP . Substituindo (7.40) e (7.42) em (7.41), utilizando esta relação para V (x) e fazendo n ≃ Nd , obtemos: 1/2 2 dφ (φ − VP ) ID ≃ −2 eNd µn D a − . eNd dx Podemos agora separar as variáveis φ e x e fazer as integrais nos dois lados entre x = 0 e x = L. Como o potencial nas extremidades do canal é φ(0) = 0 e φ(L) = VD temos, VD L 1/2 2 ID dx = −2eNd µn D (φ − VP ) a− dφ . eNd 0 0 A integral do lado esquerdo é trivial pois a intensidade de corrente ID não varia com x. A integral em φ também é simples de ser efetuada, levando a: 1/2 2eNd µn Da 2 2 VD − (VD − VP )3/2 − (−VP )3/2 . ID = − L 3 eNd a2 (7.43) Esta expressão pode ser simplificada utilizando-se as seguintes considerações. O fator multiplicativo que aparece à esquerda do colchete é o inverso da resistência do canal, sem as regiões de depleção, que é chamada condutância, G0 = σ 2Da 2eNd µn Da 1 = = R L L . (7.44) Note que como V (x) aumenta com x, a altura efetiva do canal, h = 2(a − ), diminui com x em virtude da Eq.(7.42), como mostrado na Fig.7.12. Existe então um valor crı́tico de V (x) para o qual = a, fazendo com que o canal seja obstruı́do. Isto ocorre inicialmente no ponto x = L, no qual V é máximo. O valor crı́tico de V , também chamado de constrição do canal, é dado por (7.42) com = a, eNd a2 . (7.45) Vc = 2 Substituindo as definições (7.44) e (7.45) em (7.43), e observando que o sinal negativo de (7.43) é devido ao fato de que a corrente tem o sentido −x, Cap. 7 Transistores e Outros Dispositivos Semicondutores 245 Figura 7.12: Variação da altura efetiva do canal para dois valores de tensão de dreno. Para VD = Vc + VP o canal sofre uma constrição em x = L. obtemos a expressão final para o módulo da corrente em função das tensões: 3/2 3/2 2 VD − VP VD 2 −VP |ID | = G0 Vc + − . (7.46) Vc 3 Vc 3 Vc É preciso observar que esta expressão só vale se o canal estiver aberto em todos os pontos, ou seja se V (x) < Vc . Como a tensão reversa máxima na junção é V (L) = VD − VP , (7.46) só é válida para VD − VP ≤ Vc . (7.47) Para tensões de dreno maiores que o valor dado por (7.47), a corrente atinge uma saturação, com valor igual ao obtido de (7.46) com VD − VP = Vc . Observe também que normalmente a porta opera com tensão nula ou negativa em relação a fonte, de modo que em todas as expressões acima VP ≤ 0. Exemplo 7.5: Considere um JFET de Si com Nd = 5 × 1015 cm−3 , Na = 1019 cm−3 , a = 1 µm, L = 15 µm e D = 1 mm. Calcule os parâmetros G0 e Vc e faça as curvas ID − VD para diversos valores de VP . Como Na Nd , a espessura da região de depleção pode ser calculada por (7.42). Então, usando os dados da Tabela 5.2 e os parâmetros do transistor em (7.44), vem, 2 e Nd µn D a 2 × 1, 6 × 10−19 × 5 × 1015 × 106 × 1350 × 10−4 × 10−3 × 10−6 = L 15 × 10−6 −2 −1 G0 = 1, 44 × 10 Ω G0 = Com (7.45) obtemos, 1, 6 × 10−19 × 5 × 1015 × 106 × 10−12 e Nd a2 = 2 2 × 11, 8 × 8, 85 × 10−12 Vc = 3, 8 V Vc = 246 Materiais e Dispositivos Eletrônicos Como estes valores de G0 e Vc na Eq.(7.46) obtemos numericamente as curvas mostradas na Figura 7.13. Para entender o comportamento das curvas I-V da Fig.7.13, tomemos inicialmente VP = 0. Nesta situação a corrente dada por (7.46) é: |ID | = G0 Vc VD 2 − Vc 3 VD Vc 3/2 . (7.48) Vc , o primeiro termo Observe que para tensões de dreno baixas, isto é, VD em (7.48) domina o segundo, sendo |ID | ≃ G0 VD . Esta é a região linear da curva caracterı́stica com VP = 0 na Fig.7.13. A presença do termo com potência 3/2 e sinal negativo em (7.48), faz com que a taxa de crescimento de |ID | diminua com o aumento de VD . Fazendo a derivada de |ID | em relação a VD vem, d|ID | = G0 1 − (VD /Vc )1/2 V =0 . (7.49) P dVD Vemos então que |ID | atinge o máximo (dID /dV = 0) exatamente em VD = Vc (para VP = 0). Neste valor de tensão a corrente atinge a saturação, dada por (7.48) com VD = Vc , Figura 7.13: Caracterı́sticas I-V de um transistor de efeito de campo de junção, obtidas da Eq.(7.46) com Vc = 3, 8 V e G0 = 1, 44 × 102 . Cap. 7 Transistores e Outros Dispositivos Semicondutores IDsat = G0 Vc /3 . 247 (7.50) Para VD > Vc a corrente mantém este valor, que corresponde à situação do canal quase totalmente obstruı́do. Isto ocorre porque, se a corrente diminuisse, a queda de tensão no canal também diminuiria e ele seria desobstruı́do. Este delicado equilı́brio mantém a corrente constante para VD > Vc , com valor igual ao de saturação (7.50). Para tensões de porta VP não nulas e negativas o comportamento das curvas ID − VD é qualitativamente o mesmo do descrito para VP = 0. As diferenças fundamentais são que a corrente de saturação e o valor crı́tico de saturação na tensão VD diminuem com o aumento de −VP . A linha tracejada na Fig.7.13 indica o lugar geométrico dos pontos de saturação para VP = 0. Observe que os valores de tensão e corrente mostrados na Fig. 7.13 são tı́picos de um JFET. O transistor trabalha com tensões de dreno e de porta da ordem de alguns volts e corrente de dreno na faixa de mAmp. As curvas caracterı́sticas do transistor de efeito de campo se assemelham as do transistor bipolar mostradas na Fig.7.7(b). A diferença fundamental é que enquanto no bipolar o parâmetro de controle é a corrente de base, no JFET o controle é feito pela tensão da porta. Então, como a tensão de porta no JFET é aplicada numa junção polarizada reversamente, a corrente de entrada é muito pequena comparada com a corrente de base no transistor bipolar. Num JFET tı́pico a corrente na porta é da ordem de 10−9 a 10−12 A. Como a tensão aplicada a porta é de alguns volts, a impedância de entrada excede 108 Ω. Os transistores de efeito de campo de junção são utilizados para amplificação ou chaveamento, em circuitos semelhantes aqueles das Figs. 7.9 e 7.10, em aplicações que requerem alta impedância de entrada. Os sı́mbolos de Figura 7.14: Sı́mbolos de circuito dos transistores de efeito de campo (JFET) de canal n e de canal p. 248 Materiais e Dispositivos Eletrônicos circuito dos JFET de canal n e de canal p estão mostrados na Fig.7.14. 7.5.3 O Transistor de Efeito de Campo Metal-Semicondutor O princı́pio de funcionamento do transistor de efeito de campo metalsemicondutor, que passaremos a chamar de MESFET (Metal Semiconductor Field Effect Transistor), é basicamente o mesmo do JFET. Ele tem três terminais, fonte, porta e dreno. Os portadores de carga majoritários fluem da fonte para o dreno através de um canal semicondutor, tipo n ou tipo p. O controle da corrente é feito por meio de uma tensão aplicada à porta, que controla a espessura do canal e portanto sua resistência. A diferença para o JFET é que no MESFET o terminal metálico da porta está em contato direto com o semicondutor do canal, formando uma junção Schottky, em vez de uma junção p-n. Como na barreira de potencial Schottky não há participação de portadores minoritários, a resposta na variação de espessura do canal devido à variação na tensão da porta, é mais rápida do que nas junções p-n. Por isso, o MESFET é utilizado em aplicações de altas freqüências. Como o GaAs tem maior mobilidade de elétrons do que Si, ele é o semicondutor mais utilizado na fabricação de MESFETs. A Figura 7.15 mostra duas estruturas comuns de MESFET. Em ambas o substrato é uma pastilha de alta resistividade, feita com GaAs o mais puro possı́vel ou com pequena dopagem com Cr. Como o gap de GaAs é grande, Figura 7.15: Estruturas de MESFET: a) Estrutura simples, com terminais metálicos da fonte, porta e dreno, depositados diretamente sobre a camada epitaxial que forma o canal; b) Estrutura na qual as regiões da fonte, canal e dreno são formadas por implantação iônica de impurezas tipo n. Cap. 7 Transistores e Outros Dispositivos Semicondutores 249 o nı́vel de Fermi no meio do gap que ocorre no semicondutor intrı́nseco ou com dopagem de Cr, resulta em resistividades da ordem de 108 Ωcm. Como este valor de resistividade torna o material quase isolante, ele é chamado de semi-isolante. O canal é formado por uma camada de GaAs dopado, com espessura da ordem de 0,1 µm. Como a mobibilidade de elétrons em GaAs é 22 vezes maior que a de buracos (veja Tabela 5.2), utiliza-se dopagem com impurezas doadoras para formar um canal n nos MESFETs para aplicações em altas freqüências. Concentrações de impurezas do grupo VI, como Se, da ordem de 1017 cm−3 , resultam em condutividades adequadas ao canal n, no qual os elétrons fluem da fonte para o dreno. A estrutura dos contatos é feita através de processos sucessivos de fotolitografia. A estrutura mostrada na Figura 7.15(a) é bastante simples, formada apenas por uma fina camada de n-GaAs crescido epitaxialmente sobre o substrato e três contatos metálicos. O contato da porta é feito de A ou ligas de Ti, W ou Au, que são adequados para formar uma barreira Schottky em GaAs. Os contatos da fonte e do dreno devem ser ôhmicos, por isso são feitos com outro metal, em geral uma liga de Ge e Au. Como a fabricação desta estrutura não requer o uso de processos de difusão, ela pode ser feita com dimensões pequenas e muito precisas. Pode-se então fazer canais de comprimentos inferiores a 1 µm, o que possibilita minimizar o tempo de deslocamento dos elétrons e a capacitância da porta, requisitos importantes para aplicações em altas freqüências. Na estrutura da Figura 7.15(b), os contatos ôhmicos da fonte e do dreno são feitos por meio de duas regiões n+ com concentrações de impurezas da ordem de 1018 cm−3 . Devido aos requisitos de precisão e boa definição das fronteiras entre as diversas regiões, as dopagens que formam a fonte, o canal e o dreno são feitas por meio de implantação iônica. Este tipo de estrutura faz com que haja um ótimo isolamento elétrico entre transistores vizinhos, fabricados numa mesma pastilha para formar um circuito integrado, por conta da natureza semi-isolante do substrato. Este não é o caso da estrutura da Figura 7.15(a), pois a camada epitaxial tipo n sobre o substrato estabelece um contato direto entre transistores vizinhos. Para isolar o transistor de elementos vizinhos, ele é circundado por uma vala com cerca de 0,2 µm de profundidade, que atinge o substrato semi-isolante. A vala é produzida por um processo de corrosão numa linha definida por meio de fotolitografia. Como mencionado no inı́cio da seção, o funcionamento do MESFET é basicamente o mesmo do JFET. A junção Schottky formada entre o terminal da porta e o canal n é polarizada inversamente, o que faz com que a impedância de entrada do transistor seja muito alta. A tensão aplicada entre porta e a fonte determina a espessura da região de depleção, que é dada aproximadamente 250 Materiais e Dispositivos Eletrônicos pela mesma expressão (7.42) válida para o JFET. Como o potencial varia ao longo do canal, a espessura da região de depleção também varia, formando a região triangular indicada pela área branca nas estruturas da Figura 7.15. O cálculo da corrente no canal é feito exatamente como para o JFET, de modo que a relação entre a corrente do dreno ID e as tensões VP e VD da porta e do dreno, é dada pela Equação (7.46). Assim, as curvas caracterı́sticas do MESFET têm a mesma forma das curvas do JFET, mostradas na Figura 7.13. Os MESFETs de GaAs podem ser fabricados em circuitos integrados para processar sinais analógicos ou digitais em altas freqüências, alcançando a faixa de microondas. Atualmente eles têm grande aplicação em telefonia móvel, empregando freqüências de alguns GHz. Os MESFETs são usados para fazer osciladores e amplificadores de micro-ondas, que constituem elementos fundamentais dos circuitos dos telefones celulares e telefones sem fio de alta freqüência. A necessidade de aumentar a freqüência de geração e a banda de passagem nos sistemas de comunicações tem estimulado o desenvolvimento de novas estruturas de MESFET. A operação em freqüências mais elevadas requer a diminuição do tempo de trânsito dos elétrons e portanto menores dimensões fı́sicas do canal. Para manter a condutância do canal é preciso então aumentar sua condutividade. Isto pode ser feito até certo ponto com o aumento da concentração de impurezas no canal. Entretanto, concentrações excessivas aumentam o espalhamento dos elétrons e comprometem a mobilidade. Uma forma engenhosa para aumentar a concentração de elétrons sem aumentar a concentração de impurezas doadoras é fazer o canal com duas camadas, uma de n-(GaA)As e outra de GaAs puro, esta crescida diretamente sobre o substrato. Isto resulta em uma heterojunção com estrutura de bandas semelhante à da Figura 6.11. A composição da liga de n-(GaA)As é feita de tal modo que o nı́vel de Fermi está acima do mı́nimo do poço formado na descontinuidade da banda de condução (na Fig.6.11 ele está um pouco abaixo). O resultado é que uma parte dos elétrons da camada de n-(GaA)As salta para a camada de GaAs, ficando aprisionados na interface. Energeticamente o que ocorre é que os elétrons ocupam os estados de energia abaixo do nı́vel de Fermi, ficando aprisionados no poço de potencial. Como a camada de GaAs é pura, o espalhamento dos elétrons é pequeno, resultando num canal de alta mobilidade. O transistor MESFET feito com esta estrutura é chamado de HEMT (High Electron Mobility Transistor). Ele é muito empregado em telefonia móvel utilizando a faixa de microondas, podendo alcançar freqüências em torno de 10 GHz. Cap. 7 Transistores e Outros Dispositivos Semicondutores 7.6 251 O Transistor MOSFET Um outro tipo de transistor de efeito de campo, de importância tecnológica muito maior que o de junção, é o de porta isolada. Neste transistor o controle da corrente no canal é feito por meio do campo num capacitor, formado pelo contato metálico da porta e pelo semicondutor do canal, separados por uma camada de isolante. No caso mais comum o isolante é o óxido de silı́cio, SiO2 , o que dá o nome em inglês Metal-Oxide-Semiconductor FET. Vamos aqui nos referir a este tipo de transistor por sua sigla em inglês, MOSFET. A Fig.7.16 mostra a estrutura planar de um MOSFET de canal n. Ele é formado por duas regiões tipo n+ difundidas (ou implantadas) num substrato tipo p, sendo uma para a fonte (F) e outra para o dreno (D). A fonte e o dreno são ligados ao circuito através de contatos de alumı́nio. O canal de condução entre a fonte e o dreno é induzido no substrato por uma tensão aplicada à porta, cujo contato é isolado do semicondutor por uma camada de óxido, através do fenômeno de inversão que será explicado mais tarde. Se uma tensão for aplicada entre dreno e fonte, em qualquer sentido, uma das duas junções p-n estará polarizada diretamente, enquanto a outra ficará polarizada reversamente. Neste caso, se não houver tensão na porta não haverá canal e, portanto, a corrente entre fonte e dreno será desprezı́vel devido à presença da junção reversa. Quando uma tensão positiva é aplicada à porta, uma camada de cargas negativas é induzida no semicondutor, em frente ao contato metálico da porta. Esta camada de cargas proporciona um canal de condução entre fonte e dreno, resultando numa corrente que varia com a amplitude da tensão da porta. Para compreender o mecanismo de aparecimento do canal de condução é necessário analisar o comportamento das cargas no capacitor formado pelo conjunto metal-óxido-semicondutor, chamado capacitor MOS, o que faremos a seguir. Figura 7.16: Estrutura planar de MOSFET de canal n. Materiais e Dispositivos Eletrônicos 252 7.6.1 O Capacitor MOS A Fig.7.17 mostra os diagramas de energia nas três regiões de um capacitor MOS com semicondutor tipo p, para diversos valores da diferença de potencial V aplicada entre o metal e o semicondutor. Em (a) vemos a situação de equilı́brio com V = 0, na qual os nı́veis de Fermi do metal e do semicondutor são iguais. Na figura estão mostradas as funções trabalho eφm e eφs do metal e do semicondutor. Estando o metal e o semicondutor em contato com o isolante, eφm e eφs são definidas em relação ao nı́vel da banda de condução do óxido e não ao nı́vel do vácuo, como foi feito no caso da Fig.6.8. Por esta razão, essas grandezas também são chamadas funções trabalho modificadas para a interface metal-óxido. Para simplificar a análise do efeito da tensão aplicada, (a) V = 0 (b) V 0 e Ec Ei EFm Acumulação Ec Ei EFm Ev Semicondutor Metal Óxido M e O e Depleção V EFm 0 Ev S Inversão Ec Ec Ei eV M Ev O S V Ei eV M 0 Ev EFm O S V 0 Figura 7.17: Diagramas de energia no capacitor MOS para diversos valores da diferença de potencial V aplicada entre o metal e o semicondutor (tipo p). Cap. 7 Transistores e Outros Dispositivos Semicondutores 253 consideramos na Fig.7.17 que φm = φs . No caso geral, o efeito de φm = φs pode ser facilmente incorporado ao resultado final. Na Fig.7.17(b) vemos o efeito de uma tensão V < 0 aplicada entre o metal e o semicondutor. Neste caso aparecem cargas negativas no metal e cargas positivas no semicondutor, como num capacitor comum. Estas cargas criam um campo elétrico E no sentido do semicondutor para o metal. Como no semicondutor tipo p os portadores majoritários são buracos, o aparecimento de cargas positivas corresponde à acumulação de buracos na interface semicondutoróxido. Esta acumulação de buracos é consistente com o comportamento das energias, como veremos a seguir. Quando a tensão é aplicada entre metal e semicondutor, as energias dos elétrons no metal variam de −eV em relação aos seus valores de equilı́brio. Portanto, sendo V < 0 as energias no metal sofrem um acréscimo de e|V |. Em conseqüência, a banda de condução do óxido fica inclinada e o nı́vel de Fermi no metal EF m fica acima do nı́vel EF s no semicondutor, sendo a diferença entre eles EF m − EF s = e|V |. Isto resulta numa curvatura para cima das energias da banda de valência Ev , da banda de condução Ec e do nı́vel de Fermi intrı́nseco Ei nas proximidades da interface, como mostra a Fig.7.17(b). Por outro lado, como a camada de óxido é isolante, a aplicação de uma tensão externa não resulta em corrente no semicondutor. Em conseqüência, o nı́vel de Fermi EF s não varia ao longo do semicondutor, como ocorre nas junções p-n e metal-semicondutor. Desta forma, a energia Ei se afasta do nı́vel EF s na interface. Sendo a concentração de buracos dada pela Eq.(5.32), (7.51) p = ni e(Ei −EF s)/kB T , vemos que p cresce exponencialmente com a diferença Ei − FF s . Assim, a variação das energias mostradas na Fig.7.17(b) é consistente com a acumulação de buracos no semicondutor na interface com o óxido. O comportamento das energias no caso de tensões positivas do metal em relação ao semicondutor está ilustrado nas Figuras 7.17(c) e (d). Sendo −eV < 0, as energias dos elétrons no metal decrescem em relação aos valores de equilı́brio, de modo que as curvaturas de Ec , Ev e Ei próximo da interface são opostas as do diagrama em (b). Neste caso Ei se aproxima de EF s na interface, de modo que, pela Eq.(7.51), a concentração de buracos diminui nas proximidades do óxido. Se V é menor que um certo valor crı́tico Vc , Ei − EF s diminui em relação ao equilı́brio porém é ainda positivo em todos os pontos, como no diagrama em (c). Neste caso a concentração p na interface é menor que o valor de equilı́brio, o que deixa uma fração das impurezas aceitadoras não compensadas. Portanto o semicondutor fica carregado negativamente en- 254 Materiais e Dispositivos Eletrônicos quanto o metal fica carregado positivamente, como esperado para V > 0. A ausência de buracos nas proximidades da interface é um fenômeno análogo ao que ocorre na região de carga espacial, ou de depleção, de uma junção p-n. Se a tensão V ultrapassa um certo valor crı́tico Vc , a energia Ei na interface cai abaixo do nı́vel EF s , como mostrado na Fig.7.17(d). Neste caso, como se vê na Eq.(7.51), p < ni . Sendo p n = n2i (Eq.(5.30), vemos que n > ni , e por conseguinte os elétrons passam a ser os portadores majoritários. Este é um caso muito interessante no qual o semicondutor tipo p passa a comportar-se como tipo n por ação de uma tensão aplicada e não por causa de uma dopagem. Este fenômeno, chamado inversão constitui a chave para o aparecimento do canal n no semicondutor tipo p do transistor MOSFET. Para calcular a tensão aplicada ao transistor MOSFET acima da qual uma camada de inversão é produzida no semicondutor, é necessário em primeiro lugar entender como se comporta a queda de potencial no óxido e no semicondutor. Para isto vamos, inicialmente, considerar um capacitor MOS ideal no qual não há cargas de superfı́cie e as funções trabalho do metal e do semicondutor são iguais, φm = φs . Posteriormente generalizaremos o resultado para superfı́cies reais. Se uma tensão V é aplicada entre o metal e o semicondutor, parte da queda de potencial ocorre no isolante (Vi ) e parte ocorre no semicondutor (Vs ), de modo que (7.52) V = Vi + Vs . Esta tensão produz cargas Qm na superfı́cie do metal e Qs no semicondutor, sendo Qm = −Qs = Q, como num capacitor. Se V > 0, evidentemente teremos Q > 0. A queda de potencial no isolante é relacionada com a carga através da capacitância obtida como se ele estivesse entre duas placas metálicas, Vi = Q Ci , (7.53) sendo Ci = i A/d, onde i é a permissividade do isolante, d sua espessura e A a área. Para relacionar a queda de potencial no semicondutor com a carga, é preciso resolver o problema da carga distribuı́da. Como o problema completo é muito difı́cil, vamos usar uma aproximação para a distribuição de carga, como foi feito para a junção p-n na Seção 6.1.3. Ela consiste em supor que toda a carga no semicondutor está contida numa camada de espessura , com uma densidade uniforme, como ilustrado na Fig.7.18. Na aproximação de depleção total consideramos que todas impurezas aceitadoras na camada de espessura Cap. 7 Transistores e Outros Dispositivos Semicondutores 255 estão ionizadas, de modo que a carga no semicondutor é Qs = −Q = −eNa A. Nesta situação, a equação da lei de Gauss pode ser facilmente integrada para se obter o campo elétrico e a partir dele a variação do potencial. A relação entre a espessura da região de depleção e a queda de potencial Vs no semicondutor é igual a Eq.(6.18) com V0 substituı́do por Vs e sem o termo em Nd , 1/2 2s Vs , (7.54) = eNa onde s é a permissividade do semicondutor. Observe que este resultado foi obtido na suposição de que a tensão V aplicada é suficiente para produzir depleção total na camada de espessura , mas sem inversão. As Eqs.(7.52)(7.54) permitem calcular em função de V , desde que V seja menor que o valor crı́tico Vc para produzir inversão. Usando (7.54) e Q = eNa A em (7.53) e substituindo Vs e Vi em (7.52), obtemos eNa 2 eNa d + . (7.55) V = i 2s Este resultado mostra que a espessura da camada de depleção cresce com Figura 7.18: Distribuição de carga num capacitor MOS ideal com semicondutor tipo p (canal n), na aproximação de depleção. A linha tracejada indica a carga criada pela inversão quando V > Vc . 256 Materiais e Dispositivos Eletrônicos o aumento da tensão V no capacitor. Na verdade isto só ocorre enquanto V for menor que Vc . Quando V atinge Vc , a inversão produz uma camada fina de carga na interface com o óxido, mostrada na Fig.7.18 pela linha tracejada. Qualquer aumento adicional de V acima deste valor resulta em crescimento da carga de inversão e não em aumento da camada de depleção. A partir de (7.55) podemos obter a capacitância total do capacitor MOS. Colocando a carga Q = eNa A em evidência naquela equação e usando a definição C = dQ/dV vem: A C= . (7.56) d/i + /s Esta expressão também pode ser obtida pela associação em série dos capacitores formados pelo isolante (Ci ) e pelo semicondutor. Como a espessura aumenta com V , a capacitância C diminui com o aumento de V na região 0 ≤ V ≤ Vc . Para V ≥ Vc o valor de C estabiliza em Cmin , como mostrado na Fig.7.19. Com tensões negativas há uma acumulação de buracos na superfı́cie do semicondutor, de modo que = 0 e C é devido ao capacitor formado apenas pelo óxido dielétrico, C = Ci . Observe que quando a medida da capacitância é feita com freqüência muito baixa, tipicamente menor que 100 Hz, a capacitância tende a aproximar-se do valor Ci, como mostrado pelas linhas tracejadas da Fig.7.19. O mecanismo responsável por este efeito é a geração de portadores na região de carga espacial. Quando a variação da tensão é muito lenta, a criação de pares elétron-buraco nesta região mascara a variação da capacitância. Os buracos tendem a neutralizar as impurezas aceitadoras, Figura 7.19: Variação da capacitância com a tensão em capacitor MOS de canal n ideal. As curvas tracejadas para V > Vc são os resultados obtidos quando a medida de C é feita com freqüências muito baixas (tipicamente menores que 100 Hz). Cap. 7 Transistores e Outros Dispositivos Semicondutores 257 eliminando a região de depleção, enquanto os elétrons vão para a interface semicondutor-óxido. Em conseqüência → 0 e a capacitância tende para o valor Ci . 7.6.2 A Tensão Crı́tica de Inversão Para compreender o mecanismo de inversão e o aparecimento do canal n no semicondutor tipo p, vamos analisar em detalhe o diagrama de energia do semicondutor quando a tensão aplicada ao capacitor MOS é positiva. Como mostrado na Fig.7.20, as bandas de condução e de valência, bem como o nı́vel de Fermi intrı́nseco Ei , curvam para baixo nas proximidades da interface. Sendo a energia do elétron relacionada ao potencial elétrico φ por E = −eφ, o desvio da banda de condução de seu valor de equilı́brio Ec é eφ. Como a curvatura de Ei acompanha a de Ec , o desvio de Ei em cada ponto y também é eφ, o que pode ser visto na Fig.7.20. Vemos então que a queda de potencial Vs no semicondutor, estabelecida pela tensão aplicada V , corresponde ao desvio de Ei na interface com o semicondutor, isto é, em y = 0. Vemos também na Fig.7.20 que se Vs > φF , há uma pequena faixa de y em que Ei < EF s , onde portanto a concentração de elétrons é maior que a de buracos. Entretanto não basta ter Ei < EF s para haver um canal de condução significativo. O critério utilizado para definir a condição de forte inversão é que a concentração n de elétrons na superfı́cie seja, no mı́nimo, tão grande quanto a concentração de Figura 7.20: Diagrama de energia no semicondutor p próximo da interface do óxido em capacitor MOS com tensão V > Vc . 258 Materiais e Dispositivos Eletrônicos buracos no substrato, p ≃ Na . Pela Eq.(7.51) vemos que esta condição é Na = ni eeφF /kB T , (7.57) onde eφF é a diferença entre os nı́veis de Fermi Ei e EF s longe da interface. Como n = n2i /p, vemos na Fig.7.20 que para termos n = Na em y = 0 é preciso que Vs = 2φF . Utilizando (7.57) podemos escrever a condição para a existência de uma camada de inversão no semicondutor, Vs ≥ VsI = 2φF = 2 kB T Na n e ni . (7.58) Substituindo este resultado em (7.54) obtemos a máxima espessura da camada de depleção, que é atingida na condição de inversão, 1/2 1/2 4s φF 4s kB T n(Na /ni ) = . (7.59) max = eNa e2 Na Esta é a situação na qual a carga na região de depleção é máxima, sendo seu módulo dado por Qd = eNa max A = 2(s eNa φF )1/2 A . (7.60) Substituindo (7.53) e (7.58) em (7.52) obtemos a tensão crı́tica no capacitor MOS para a criação da camada de inversão, Vc = Qd + 2φF Ci , (7.61) onde Qd é dado por (7.60). Este resultado só vale para um capacitor MOS ideal. Num capacitor real há dois efeitos que devem ser considerados no cálculo de Vc : as funções trabalho φm e φs em geral são diferentes; existem cargas no interior do óxido e na superfı́cie da interface semicondutor-óxido. As funções trabalho modificadas para a interface metal-SiO2 de alguns metais utilizados em contatos metálicos estão apresentadas na Tabela 7.1. No caso dos semicondutores, a função trabalho depende também da concentração de impurezas, porque varia com a posição no nı́vel de Fermi EF s . A Figura 7.21 mostra a diferença das funções trabalho modificadas, φms = φm − φs , para A com Si tipo p e tipo n, em função da concentração de impurezas. Como se vê, neste caso φms é negativo independentemente do tipo de impureza. É fácil ver que se φm < φs , o diagrama de energia em equilı́brio (V = 0) é Cap. 7 Transistores e Outros Dispositivos Semicondutores 259 Figura 7.21: Variação da diferença das funções trabalho φm = φm − φs na interface A-Si em função da concentração de impurezas [Sze]. semelhante aquele da Fig.7.17(c), válido para φm = φs e V > 0. Isto significa que, mesmo em equilı́brio, o metal fica carregado positivamente enquanto o semicondutor fica com cargas negativas. Assim, para tornar as bandas retas como na Fig.7.17(a), seria preciso aplicar uma tensão negativa para compensar a diferença das funções trabalho, com valor precisamente igual a φms . Outro efeito importante nos capacitores MOS é a presença de cargas no isolante e na interface semicondutor-óxido. As cargas no interior do isolante resultam de contaminação no processo de fabricação, como ocorre freqüentemente com ı́ons de Na+ . Essas cargas positivas criam um campo elétrico que altera a distribuição de potencial no capacitor. As cargas na interface Si-SiO2 resultam da existência de estados superficiais criados pela interrupção da rede cristalina na superfı́cie. No processo de oxidação do Si para a fabricação da camada de SiO2 , átomos de Si são removidos da superfı́cie e reagem com o oxigênio. Quando o processo é interrompido, alguns ı́ons de Si permanecem próximos da interface, formando uma camada superficial de cargas. O conjunto das cargas Metal A Ag Au Cu eφm (eV) 4,1 5,1 5,0 4,7 Tabela 7.1: Funções trabalho de metais modificadas para o isolante SiO2 [Sze]. Materiais e Dispositivos Eletrônicos 260 no óxido e na interface pode ser representado por uma carga efetiva Qox . Essa carga produz uma diferença de potencial adicional no capacitor Vox = Qox /Ci , onde Ci é a capacitância do isolante. A tensão crı́tica calculada anteriormente é válida para a situação na qual, com V = 0, as bandas do semicondutor têm curvatura nula. Como a diferença das funções trabalho φms e a presença da carga Qox resultam numa tensão efetiva positiva Vox − φms , a tensão externa que deve ser aplicada ao capacitor para produzir inversão é menor do que Vc obtido para o caso ideal, Eq.(7.61). Assim, o valor da tensão crı́tica no caso geral é Qd Qox Vc = + 2φF + φms − . (7.62) Ci Ci Este resultado mostra que para obter uma tensão crı́tica pequena é necessário fazer a capacitância Ci maior possı́vel. Isto requer uma espessura do óxido isolante muito pequena, em geral da ordem de 0, 1 µm. Exemplo 7.6: Calcule a tensão crı́tica de inversão Vc para um MOSFET de A -SiO2 -pSi com d = 0, 1 µm, Na = 1015 cm−3 , com carga no óxido por unidade de área Qox /A = 8 × 10−8 C/cm2 , sabendo que a constante dielétrica do óxido é 3,9. Usando o valor de ni da Tabela 5.2 para Si obtemos, com (7.58), 2φF = 2 Na kB T 1015 n = 2 × 0, 025 × n = 0, 56 V e ni 1, 5 × 1010 . Usando (7.60) calculamos a carga por unidade de área, 1/2 Qd = 2 × 11, 8 × 8, 85 × 10−12 × 1, 6 × 10−19 × 1015 × 106 × 0, 28 A = 1, 37 × 10−4 C/m2 . A capacitância por unidade de área é determinada pela espessura do óxido e por sua constante dielétrica. Para SiO2 i = 3, 9 0 , logo 3, 9 × 8, 85 × 10−12 Ci i = = A d 10−7 ≃ 3, 45 × 10−4 F/m2 . Usando o valor φms = −0, 9 V da Fig.7.21 e substituindo os dados e parâmetros calculados em (7.62) vem, Vc = 1, 37 × 10−4 8 × 10−8 × 104 + 0, 56 − 0, 9 − 3, 45 × 10−4 3, 45 × 10−4 = 0, 4 + 0, 56 − 0, 9 − 2, 3 = −2, 24 V . Cap. 7 Transistores e Outros Dispositivos Semicondutores 261 Note que a inversão ocorre em baixos valores de tensão, que podem ser fornecidos por pequenas baterias. Este fato é importante pois ele possibilita a operação de circuitos lógicos alimentados por baterias em equipamentos portáteis. 7.6.3 A Caracterı́stica I-V do Transistor MOSFET Estamos agora em condições de entender o mecanismo de operação de um transistor MOSFET com a estrutura da Fig.7.16, assim como calcular a corrente de dreno ID em função das tensões de dreno VD e de porta VP . Se uma diferença de potencial VD positiva for aplicada entre dreno e fonte, a junção p-n entre substrato e dreno estará polarizada reversamente. Portanto só haverá corrente do dreno para a fonte (elétrons vão da fonte para o dreno) se houver uma camada de inversão em toda extensão da interface semicondutor-óxido. Esta camada pode ser induzida por uma tensão VP entre porta e fonte, maior que um certo valor crı́tico VP c . Este valor é diferente de Vc da Eq.(7.62), porque a tensão de dreno eleva o potencial do semicondutor em relação ao metal da porta. Devido à presença da corrente ID , o potencial do semicondutor aumenta gradualmente da fonte para o dreno. Isto resulta numa variação da tensão crı́tica ao longo do capacitor e, por conseguinte, numa diminuição gradual da espessura da camada de inversão da fonte para o dreno, como ilustrado na Fig.7.16. Assim, a tensão de porta mı́nima VP c para que haja um canal de condução em toda extensão do semicondutor é determinada pelo valor da tensão crı́tica na extremidade do dreno, VP c = Vc + VD . (7.63) Para calcular a corrente ID criada pela tensão VD é preciso, inicialmente, determinar a carga na camada de inversão. Para isto vamos considerar o modelo da Fig.7.22 para a variação da camada entre fonte e dreno. O capacitor MOS é dividido em capacitores elementares de largura dx, cujas áreas são dA = Ddx, sendo D a profundidade na direção perpendicular ao plano do papel. Pela Eq.(7.53), a carga elementar em cada capacitor é dQ = Vi (x) dCi, onde dCi = Ci dx/L e Vi (x) é a queda de tensão no isolante no ponto de abcissa x. Vi (x) é determinada pela tensão de porta VP , a tensão efetiva Vox − φms , a queda de potencial Vs no semicondutor e a diferença de potencial φ(x) entre o ponto x e a fonte (x = 0). Na condição de inversão no ponto x, Vs = 2φF , de 262 Materiais e Dispositivos Eletrônicos Figura 7.22: Modelo para a variação da camada de inversão em transistor MOSFET de canal n. modo que a carga elementar no capacitor em dx é, Ci [VP + (Vox − φms − 2φF ) − φ(x)] dx dQ = L . Note que na condição de inversão esta carga é igual àquela existente na região de depleção, cujo valor na faixa dx é dQd = Qd dx/L. Qualquer acréscimo da tensão resulta no aparecimento de uma carga negativa na camada de inversão, cujo módulo é dQn = dQ − dQd , uma vez que a carga na região de depleção não aumenta além do valor dado por (7.60). Temos então Ci Qd [VP + (Vox − φms − 2φF ) − φ(x)] dx − dx . dQn = L L Utilizando a Eq.(7.62) nesse resultado, podemos escrever Ci [VP − Vc − φ(x)] dx . dQn = L (7.64) Sob a ação de uma tensão VD positiva, esta carga (negativa) move-se no sentido fonte-dreno, produzindo uma corrente ID no sentido −x. Sendo h a altura do canal no ponto x, a densidade volumétrica de carga é ρ = −dQn /Dhdx. A densidade de corrente que ela produz é J = ρµn E, onde µn é a mobilidade das cargas no canal e E = −dφ/dx é o campo elétrico. A corrente de dreno é então, dQn dφ . (7.65) ID = J D h = µn dx dx Cap. 7 Transistores e Outros Dispositivos Semicondutores 263 Substituindo (7.64) em (7.65) e passando dx para o lado esquerdo, podemos integrar os dois lados separadamente, L µn Ci VD ID dx = (VP − Vc − φ)dφ . L 0 0 Como ID não varia com x, a integral do lado esquerdo é simplesmente ID L. Efetuando a integral do lado direito e utilizando a definição de VP c em (7.63) obtemos finalmente, ID = µ n Ci 1 (VP − Vc )VD − VD2 2 L 2 . (7.66) Note que µn é a mobilidade dos elétrons próximos da superfı́cie, que em geral é menor que o valor no interior do substrato tipo p. Na Eq.(7.66) é comum utilizar a capacitância por unidade de área, ci = Ci /DL, no lugar de Ci . Esta equação descreve bastante bem o comportamento da corrente de dreno, principalmente para baixos valores de VD . Na verdade este resultado é apenas aproximado porque desprezamos a variação de Qd com x. A Eq.(7.66) mostra que para pequenos valores de VD , a corrente ID cresce linearmente com VD , desde que VP > Vc . Para valores maiores de VD , o termo em VD2 faz a taxa de crescimento de ID diminuir. Observe que a derivada µ n Ci dID = (VP − Vc − VD ) dVD L2 (7.67) é nula em VD = VDs ≡ VP − Vc . Neste valor de tensão, que é exatamente o mesmo de (7.63), a corrente é máxima. Para tensões de dreno maiores que este valor, o canal de condução é interrompido fazendo a corrente saturar, num fenômeno semelhante ao que ocorre no JFET. A Fig.7.23 mostra curvas de ID em função de VD para diversos valores de VP , obtidas da Eq.(7.66) para um MOSFET canal n com Vc = −2 V, Ci /A = 3, 45 × 10−8 F/cm2 , L = 10 µm, D = 300 µm e µn = 675 cm2 /V.s (metade do valor no interior do substrato, dado na Tabela 5.2). Esses valores dão µn Ci /L2 = µn DCi /AL ≃ 0, 7 mA/V2 . Na Fig.7.23 a linha tracejada indica os pontos VD − ID onde a corrente satura. Note que o valor da corrente de saturação é obtido de (7.66) com VP − Vc = VD = VDs , µ n Ci 2 V . (7.68) IDsat = 2L2 Ds Este resultado mostra que a curva de saturação é uma parábola. 264 Materiais e Dispositivos Eletrônicos Figura 7.23: Curvas caracterı́sticas de MOSFET de canal n. 7.6.4 Aplicações de Transistores MOSFET Os transistores MOSFET têm uma variedade de aplicações em circuitos digitais e são largamente utilizados em computadores. Os sı́mbolos de circuito dos MOSFETs de canal n e de canal p estão mostrados na Fig.7.24. Observe que eles têm um quarto terminal, correspondente ao substrato. Como o semicondutor do substrato forma diodos de junção com fonte e dreno, ele deve ser mantido num potencial que faz as junções não conduzirem. Em geral ele é ligado à fonte no MOSFET de canal n e ao dreno no de canal p. No MOSFET que apresentamos em detalhe, o canal é induzido no substrato através do mecanismo de inversão, produzido por uma tensão de porta. Se VP < VP c o canal está fechado e não há corrente de dreno. É possı́vel também fazer um MOSFET dopando uma região n− entre fonte e dreno, de modo que mesmo sem tensão na porta a corrente ID pode ser diferente de zero. Neste tipo, uma polarização negativa na porta repele os elétrons do canal n e reduz a corrente, como no n-JFET. O primeiro tipo, no qual o canal é induzido e aumenta com a tensão VP , é chamado de indução ou de aumento (channel enhancement, em inglês). O segundo tipo, no qual o canal é deprimido com a tensão, é chamado de depleção. É comum utilizar os sı́mbolos da Fig.7.24 para representar os dois tipos de MOSFETs. Cap. 7 Transistores e Outros Dispositivos Semicondutores 265 Figura 7.24: Sı́mbolos dos transistores MOSFET. A principal caracterı́stica dos MOSFETs é o isolamento elétrico da porta. Sua impedância de entrada é da ordem de 1014 Ω, independentemente do sentido da tensão na porta. Uma grande vantagem dos MOSFETs em relação aos JFETs está no seu processo de fabricação, que requer um número reduzido de etapas. Isto facilita a fabricação de um grande número de transistores de dimensões inferiores a 1 µm, interconectados por meio de contatos de alumı́nio na superfı́cie de cima, constituindo circuitos integrados de alta integração (VLSI, Very Large Scale Integration). Nos circuitos integrados digitais utilizando MOSFETs, é possı́vel reduzir drasticamente o consumo de potência com o emprego de pares de transistores interligados, sendo um de canal n e o outro de canal p. Esta tecnologia, chamada de par complementar ou CMOS, possibilita a fabricação de relógios, calculadoras e computadores com dissipação de potência extremamente pequena. A tı́tulo de exemplo do emprego de par complementar, mostramos na Fig.7.25(a) um circuito inversor CMOS com MOSFETs de indução. Os dois transistores são ligados em série e submetidos a uma tensão +VDD . A Fig.7.25(b) mostra as curvas ID -VD dos transistores T1 (canal n) e T2 (canal p), para dois valores das tensões de porta, 0 e +VDD para T1 , e 0 e −VDD para T2 . Note que as curvas de T2 são colocadas no mesmo gráfico de T1 porém invertidas, de modo que a soma das duas tensões de dreno é VDD . Desta forma, o ponto de operação do circuito é dado pela interseção das curvas de T1 e T2 , pois VD1 + VD2 = +VDD e ID1 = ID2 . O circuito da Fig.7.25(a) é um circuito lógico inversor do tipo NÃO. Seu objetivo é dar na saı́da um sinal nulo (0) quando o sinal de entrada for Ve = +VDD (bit 1), e saı́da +VDD (bit 1) quando a entrada for nula (bit 0). Este funcionamento pode ser verificado no gráfico em (b). Se o sinal de entrada é nulo, as tensões nas portas de T1 e T2 (em relação às respectivas fontes) são, respectivamente, VP 1 = 0 e VP 2 = −VDD . Nesta situação T1 se encontra no 266 Materiais e Dispositivos Eletrônicos estado off e T2 no estado on. A interseção das duas curvas é o ponto 1 da figura, sendo a tensão de saı́da +VDD . Por outro lado, se a entrada é +VDD , T1 está on e T2 está off, sendo o sinal de saı́da, dado pelo ponto 0, VD ≃ 0. Note que nas duas situações a corrente no circuito é muito pequena. Este fato permite construir circuitos CMOS com dissipação de potência inferior a 10 nW. As propriedades peculiares dos transistores e capacitores MOS também são utilizadas para a construção de vários tipos de dispositivos que transferem ou armazenam informação digital. Dentre os mais importantes estão as memórias de semicondutores e os dispositivos de acoplamento de carga, ou CCD (do inglês Charge-Coupled-Device). Ele é formado por uma série de capacitores MOS, um ao lado do outro, no mesmo substrato semicondutor. Quando um pulso de tensão é aplicado num capacitor, com amplitude suficiente para produzir inversão, ele cria um pacote de cargas que fica armazenado no capacitor durante um certo tempo. A presença de um pacote de cargas num capacitor representa o dı́gito binário 1, enquanto que a ausência representa 0. O capacitor MOS é o elemento básico das memórias de semicondutor. Um conjunto de capacitores e transmissores MOS num circuito integrado, forma uma memória que armazena as informações expressas em códigos binários. Atualmente há uma variedade de dispositivos de memória de semicondutor, alguns Figura 7.25: (a) Circuito inversor NÃO com par complementar de MOSFETs. (b) Curvas caracterı́sticas para determinação dos pontos de operação. Cap. 7 Transistores e Outros Dispositivos Semicondutores 267 dos quais serão apresentados na seção 7.8.2. Quando os capacitores estão interconectados adequadamente, a aplicação de um pulso de tensão num capacitor vizinho, produz nele um poço de potencial, para o qual o pacote de cargas é transferido através do semicondutor. Desta forma é possı́vel deslocar o dı́gito 1 ao longo da série de capacitores, formando um dispositivo CCD, utilizado para fabricar registros de deslocamento para computadores e em sensores de imagem, apresentados na seção 8.4.4. 7.7 Dispositivos de Controle de Potência: SCR e TRIAC Nesta seção, vamos descrever qualitativamente a operação de dois dispositivos da famı́lia dos tiristores. Os tiristores são dispositivos formados por várias junções p-n, que têm grande aplicação como chave para controlar altas correntes. O controle é feito eletronicamente, através de uma corrente relativamente pequena aplicada a um dos terminais do dispositivo. Os dois principais membros da famı́lia dos tiristores são o retificador controlado de silı́cio, ou SCR (Silicon Controlled Rectifier), e o triodo bidirecional para corrente alternada, ou TRIAC. Ambos dispositivos são feitos de silı́cio monocristalino, porque sendo um material de alta condutividade térmica, facilita o escoamento do calor gerado pela corrente elétrica. 7.7.1 O Retificador Controlado de Silı́cio - SCR O retificador controlado de silı́cio (SCR) é formado por um semicondutor com quatro camadas de impurezas, constituindo uma estrutura p-n-p-n, mostrada na Fig.7.26(a). O dispositivo tem dois terminais nas extremidades, por onde circula a corrente principal a ser controlada, o anodo (A) na região p1 e o catodo (C) na região n2 . Um terceiro terminal na região p2 , chamado porta (P), serve para a entrada da corrente de controle. A Fig.7.26(b) mostra o modelo utilizado para representar as quatro regiões do dispositivo, que formam três junções p-n: J1 , J2 e J3 . Para compreender o mecanismo de operação do SCR, vamos analisar inicialmente o que ocorre no dispositivo p-n-p-n sem a porta, também conhecido como diodo Shockley. Se uma tensão externa positiva é aplicada entre anodo e catodo, as junções J1 e J3 ficam polarizadas diretamente, enquanto J2 recebe polarização reversa. Em conseqüência, as resistências de J1 e J3 são pequenas, enquanto a de J2 é muito grande. Então toda tensão externa aparece em J2 , e 268 Materiais e Dispositivos Eletrônicos Figura 7.26: Retificador controlado de silı́cio-SCR: a) Seção reta da estrutura na forma de um disco; b) Modelo para descrever o dispositivo p-n-p-n. se ela é menor que o valor de ruptura, a corrente tem o valor de saturação reversa, que é muito pequeno. Este é o regime de bloqueio na polarização direta, indicado na linha cheia da caracterı́stica I-V mostrada na Fig.7.27(a). Note que se a tensão externa é negativa, J1 e J3 ficam polarizadas reversamente, e neste caso são elas que limitam a corrente ao valor de saturação, resultando no regime de bloqueio reverso, indicado na curva I-V . O fenômeno mais interessante do dispositivo p-n-p-n acontece quando a tensão externa positiva aumenta e atinge o valor de ruptura da junção J2 . Nesta situação ocorre avalanche em J2 e a corrente tende a aumentar rapidamente, não encontrando resistência nas junções J1 e J3 que estão polarizadas diretamente. Na região p1 esta corrente é formada por buracos movendo-se no sentido anodo-catodo, enquanto em n2 ela é formada por elétrons, indo do catodo para o anodo. Uma vez iniciado o processo de condução, uma parte dos buracos de p1 é injetada na região p2 através de n1 , como se as regiões p1 − n1 − p2 formassem um transistor. Da mesma forma, elétrons de n2 são injetados em n1 , como se n2 − p2 − n1 formassem outro transistor. A corrente passa então a ser produzida pelo processo de injeção de portadores, cessando o processo de avalanche. Isto resulta numa rápida diminuição e até na inversão do sinal da tensão em J2 , de modo que a junção passa a ser polarizada diretamente. No regime de condução direta, mostrado na Figura 7.27(a), a corrente pode atingir valores elevados, sendo limitada apenas pela resistência do circuito externo ou pelo valor de rompimento do dispositivo. Neste regime as três junções ficam polarizadas diretamente. Como a queda de potencial na junção J2 tem o sentido oposto ao das quedas em J1 e J3 , a queda de tensão total no dispositivo corresponde a de apenas uma junção, sendo da ordem de Cap. 7 Transistores e Outros Dispositivos Semicondutores 269 0,7 V no caso do silı́cio. É interessante observar que a curva I-V da Fig.7.27(a) é semelhante a de um tubo de descarga de gás. Para dar inı́cio ao processo de condução, é preciso aumentar a tensão externa até atingir o valor de disparo VD . Entretanto, a introdução da porta no dispositivo p-n-p-n transforma-o num retificador controlado, SCR. Nele é possı́vel passar diretamente do estado de bloqueio para o de condução, por meio de uma corrente relativamente pequena na porta. As linhas tracejadas da Figura 7.27(a) mostram as curvas I-V do SCR para dois valores de corrente de porta. O efeito da corrente entrando na porta é injetar buracos na região p2 , que sendo a base do transistor n2 −p2 −n1 , provoca nele o inı́cio do processo de condução. Isto resulta na injeção de elétrons de n2 em n1 , o que faz o transistor p1 − n1 − p2 também conduzir. Este processo dispara o SCR, fazendo-o passar do regime de bloqueio para o de condução, sem que seja necessário aumentar a tensão externa até o valor de ruptura por avalanche. O efeito da corrente na porta é justamente reduzir o valor da tensão de disparo, como indicado na Fig.7.27(a). Uma vez disparado, o SCR mantém o processo de condução, mesmo que a corrente de porta seja interrompida. Desta forma o SCR pode ser disparado por um pulso de corrente na porta. Por outro lado, um pulso negativo de corrente na porta pode cortar o dispositivo, fazendo-o passar do estado de condução para o de bloqueio. Figura 7.27: (a) Caracterı́stica I-V do SCR: a linha cheia vale para corrente de porta nula; as duas linhas tracejadas correspondem a dois valores de corrente, sendo IP 2 > IP 1 . (b) Sı́mbolo de circuito do SCR. Materiais e Dispositivos Eletrônicos 270 O sı́mbolo de circuito do SCR está mostrado na Fig.7.27(b). Ele é utilizado em uma grande variedade de aplicações em eletrônica industrial e de controle, pois permite controlar a potência entregue a carga por meio de chaveamento com baixa potência. 7.7.2 O TRIAC O triodo para corrente alternada, ou TRIAC, como o nome diz, é uma chave de controle para corrente ac. Ele é formado por um semicondutor com seis regiões de impurezas, constituindo dois SCRs conectados em paralelo e em sentidos opostos. A estrutura do TRIAC e seu sı́mbolo de circuito estão mostrados na Fig.7.28. Na estrutura da Figura (a) podemos identificar claramente dois dispositivos em paralelo, um formado pelas regiões p1 − n1 − p2 − n2 e outro formado pelas regiões n4 − p1 − n1 − p2 . Sem a porta, eles são equivalentes a dois diodos Schockey em paralelo e em sentidos opostos, cuja caracterı́stica I-V é dada pela linha cheia da Fig.7.29. Esse dispositivo é chamado de diodo bidirecional, ou diodo ac (DIAC). Ele pode conduzir corrente em qualquer dos dois sentidos, desde que a tensão externa atinja o valor de disparo ±VD . O terminal da porta serve para disparar o TRIAC em qualquer dos dois sentidos, por meio de pulsos de corrente. Se a tensão entre anodo e catodo for positiva, um pulso de corrente na porta dispara o SCR p1 − n1 − p2 − n2 , produzindo uma corrente no sentido do anodo para o catodo. Por outro lado, se a tensão for negativa, o disparo produzido pelo pulso de corrente na porta faz o SCR p2 − n1 − p1 − n4 conduzir no sentido do catodo para o anodo. Figura 7.28: Seção reta da estrutura (a) e sı́mbolo de circuito (b) de um TRIAC. Cap. 7 Transistores e Outros Dispositivos Semicondutores 271 Figura 7.29: Curvas I-V para um TRIAC com três valores de corrente na porta. Evidentemente, no TRIAC o anodo e o catodo têm papéis semelhantes e a distinção de nomes nem se justifica. Eles são usados apenas para facilitar a descrição. Os TRIACs são amplamente utilizados em eletrônica de controle de potência ac. Eles podem ser construı́dos de tal modo que tanto no ciclo positivo ou no negativo, o disparo seja feito por pulsos positivos, negativos, ou por ambos. A corrente no dispositivo cessa quando a tensão entre anodo e catodo se anula. Ele pode então deixar passar uma corrente alternada se for disparado duas vezes em cada ciclo. 7.8 Circuitos Integrados Todos dispositivos apresentados nos Capı́tulos 6 e 7 podem ser encapsulados separadamente, apresentando dois ou mais terminais externos, para que possam ser conectados a outros dispositivos, formando um circuito eletrônico. Neste caso eles são chamados dispositivos discretos. Porém, a forma mais atual de utilização desses dispositivos, é através dos circuitos integrados. Um circuito integrado é formado por um grande número de transistores, diodos, resistores e capacitores, fabricados na mesma pastilha de semicondutor e interligados entre si através de filmes metálicos, compondo um circuito com- 272 Materiais e Dispositivos Eletrônicos pleto com dimensões microscópicas. O primeiro circuito integrado foi produzido em 1958, pelo americano Jack Kilby. Este feito não representou propriamente um avanço cientı́fico, mas sim uma forma engenhosa de conectar dispositivos cujos princı́pios de funcionamento já eram bem conhecidos. Entretanto, a concepção do circuito integrado revolucionou a eletrônica e possibilitou um grande avanço nos equipamentos cientı́ficos e na ciência. Por isto, Kilby foi agraciado com o prêmio Nobel de Fı́sica no ano 2000. Os primeiros circuitos integrados não tinham mais do que algumas dezenas de transistores. Entretanto, em pouco tempo a tecnologia de integração foi dominada por diversos fabricantes e a competição para ganhar mercado levou a uma corrida para aumentar a quantidade de dispositivos no mesmo circuito. O resultado foi um rápido aumento na capacidade de integração, com a conseqüente melhoria de desempenho e diminuição dos custos de fabricação dos circuitos. No final da década de 1960, os dispositivos nos circuitos integrados tinham dimensões de alguns micrômetros, dando origem à tecnologia da microeletrônica. Naquela época, Gordon Moore, um dos fundadores da Intel, atualmente um dos maiores fabricantes de microprocessadores, observou que o número de transistores por circuito dobrava a cada dezoito meses, e que o custo de produção por função caia à metade no mesmo perı́odo. Esta observação passou a ser conhecida como a Lei de Moore, que tem caraterizado a indústria de semicondutores há mais de três décadas. Esta “lei” continua válida no Século 21, e o número de transitores nos circuitos integrados de microprocessadores se aproxima de um bilhão. Porém, as dimensões laterais dos dispositivos diminuı́ram tanto que atingem a escala de dezenas de nanômetros, e as espessuras de algumas camadas correspondem a poucos átomos. Isto faz prever que até 2010 haverá uma grande redução na taxa de crescimento da integração, a não ser que novos fenômenos e novos dispositivos sejam descobertos nos próximos anos. A pesquisa cientı́fica e tecnológica de fenômenos e propriedades de materiais na escala nanométrica deu origem a um novo campo de conhecimento, a nanociência e nanotecnologia. 7.8.1 Conceitos Básicos e Técnicas de Fabricação Os circuitos integrados (CI) são fabricados através de inúmeras operações fı́sico-quı́micas, como aquelas descritas na Seção 6.1, de tal forma que as diversas etapas de fabricação são realizadas simultaneamente em todos os componentes do circuito. Em cada pastilha de semicondutor são fabricados centenas de CIs completos, o que resulta em grande miniaturização e diminuição do Cap. 7 Transistores e Outros Dispositivos Semicondutores 273 Figura 7.30: Vista externa de alguns circuitos integrados: a) Circuito regulador de voltagem; b) Envólucro de CI comum de dezesseis pinos; c) Pente de memóra de computador. A escala da figura (c) é diferente das outras duas, pois o pente de memória tem dimensões fı́sicas bem maiores que os outros dois. custo de produção. Após o processamento, a pastilha é retalhada em pequenos quadrados ou retângulos de dimensões da ordem ou inferiores a 1×1 mm2 , correspondentes aos CIs individuais. Cada um destes chips, como são chamados, é então testado individualmente. Cada chip aprovado é montado numa base, interligado aos pinos externos através de fios de ouro ou prata, e finalmente encapsulado com uma resina isolante (tipo epoxy). O número de pinos externos pode variar de quatro a algumas centenas, dependendo da sofisticação do circuito. A Fig.7.30 mostra o aspecto externo de alguns circuitos integrados. Os circuitos integrados podem ser classificados de várias maneiras. Com relação a aplicação, eles são em geral chamados de digitais ou lineares (analógicos). Quando são fabricados na pastilha por meio da mesma tecnologia, eles são chamados monolı́ticos. Quando o circuito envolve diferentes tipos de tecnologia, por exemplo interligando dispositivos semicondutores com sensores magnéticos, ele é chamado hı́brido. Atualmente mais de 90% dos circuitos monolı́ticos são feitos com silı́lico monocristalino. Pastilhas (wafers) com diâmetro de 300 mm são utilizadas largamente na indústria de semicondutores. O outro semicondutor mais utilizado na fabricação de CIs é o GaAs, que encontra um número crescente de aplicações em altas freqüências. Os CIs lineares são aqueles que desempenham funções analógicas, ou lineares. Os CIs lineares simples mais comuns são os amplificadores operacionais (conjunto de amplificadores com grande ganho, alta impedância de entrada e baixa impedância de saı́da), reguladores de voltagem e chaves. Em geral estes circuitos são feitos com transistores bipolares e são utilizados como componentes discretos em circuitos eletrônicos, ou como parte de um CI que desempenha funções completas, como um receptor de rádio ou de TV. 274 Materiais e Dispositivos Eletrônicos Os CIs digitais são aqueles que processam informação binária, na forma de on ou off. Os CIs digitais podem ser feitos com a tecnologia bipolar ou MOS. Como vimos na Seção 7.6, o uso de MOSFETs complementares possibilita a fabricação de circuitos de VLSI com baixo consumo de energia. Estes circuitos são a base dos microprocessadores e das memórias de altı́ssima capacidade, utilizados na construção dos modernos computadores. Uma questão importante nos circuitos integrados é o isolamento elétrico entre dispositivos vizinhos, uma vez que o material semicondutor da pastilha permite a passagem de corrente elétrica de um dispositivo para outro. No caso dos dispositivos MOS e MESFET isto não é problema, pois a condução é restrita à região do canal, o que faz a operação de cada dispositivo ser independente do vizinho. Entretanto, no caso dos transistores bipolares, é preciso tomar precauções para isolar um transistor dos vizinhos. Diversas técnicas são utilizadas para isolamento. Conceitualmente, uma das mais simples e mais eficazes é o isolamento com dielétrico, utilizado em certos circuitos integrados de silı́cio. O processo de fabricação inicia com a preparação da pastilha de Si, com pequena dopagem, formando um substrato tipo n. Em seguida é feita a difusão de impurezas doadoras em toda a superfı́cie, de modo a formar uma camada n+ . Depois, através de um processo de fotolitografia, e de corrosão com ácido, um canal é cavado na camada n+ , até atingir o substrato n, circundando toda a região onde será fabricado o dispositivo. O substrato é então colocado num forno com atmosfera de oxigênio, produzindo uma camada de óxido isolante (SiO2 ), que cobre toda a superfı́cie exposta, incluindo a superfı́cie interna do canal. O passo seguinte é a deposição de uma camada de Si policristalino, que preenche o canal, mas também cobre toda a superfı́cie. Finalmente, a pastilha é virada para baixo e polida mecanicamente, de modo a remover todas as camadas sobre a camada epitaxial n+ . Figura 7.31: Ilustração do método de isolamento com junções reversas: a) Substrato tipo p com camada epitaxial tipo n; b) Canal de isolamento tipo p atingindo o substrato. Cap. 7 Transistores e Outros Dispositivos Semicondutores 275 O resultado final é um conjunto de regiões n+ , formando ilhas, circundadas por canais isolantes (como na Fig.7.33 (c), que será explicada adiante). Os dispositivos desejados são então fabricados nas ilhas e depois interconectados por meio de filmes metálicos depositados na superfı́cie. Uma vantagem do processo de isolamento dielétrico é a baixa capacitância parası́tica entre os dispositivos vizinhos e a eliminação de tensões de polarização, necessárias no processo que será apresentado a seguir. A maior desvantagem deste método é o grande número de etapas de processamento e a necessidade de utilizar um processo mecânico de polimento. O método de isolamento mais comum é o de junções reversas. A idéia básica deste método consiste em formar ilhas, nas quais os dispositivos são fabricados, circundados por junções p-n polarizadas reversamente. Como a corrente na junção reversa é muito pequena, as ilhas ficam efetivamente isoladas eletricamente umas das outras. A Fig.7.31 ilustra o processo de formação das ilhas. Inicialmente uma camada epitaxial tipo n é crescida sobre a pastilha de silı́cio tipo p (para o transistor p-n-p seria uma camada p sobre substrato n). Os passos seguintes consistem em oxidar a superfı́cie e por meio de proces- Figura 7.32: Métodos de contatos do transistor bipolar em circuito integrado: a) contatos para operação lateral: b) e c) Coletor em camada enterrada. 276 Materiais e Dispositivos Eletrônicos sos de fotolitografia e corrosão abrir janelas na camada de óxido na forma de linhas que definem as ilhas. Através das janelas é feita difusão de impurezas tipo p, produzindo canais com profundidade tal que atingem o substrato p. Para polarizar a junção p-n reversamente e produzir o isolamento das ilhas é preciso aplicar uma tensão por meio de contatos metálicos. Uma questão adicional nos circuitos integrados com transistores bipolares é o contato com o coletor. No dispositivo discreto da Fig.7.2, o contato do coletor está situado na face oposta a dos contatos do emissor e da base. Isto não pode ser feito no circuito integrado, uma vez que a interligação dos dispositivos é feita através de filmes metálicos na forma de linhas na superfı́cie de cima. A Fig.7.32 ilustra dois métodos utilizados para contato com o coletor na mesma face do emissor e da base. Em (a) o coletor é formado pela difusão de uma região n+ circundando a base. Neste caso a condução entre o emissor e o coletor é feita lateralmente, o que resulta em alta resistência de coletor. Em aplicações que requerem baixa resistência do coletor, a estrutura mais empregada é a da camada enterrada (buried layer). Nesta estrutura o contato efetivo do coletor é uma camada n+ , fabricada por difusão no substrato p, antes da deposição da camada epitaxial tipo n, como na Fig.7.32 (b). A ligação do terminal do coletor com a camada enterrada é feita por meio de uma região n+ , produzida por difusão, como ilustrado na Fig.7.32 (c). Para concluir esta seção, mostramos na Fig.7.33 as etapas de fabricação Figura 7.33: Ilustração das etapas de fabricação de transistor n-p-n num circuito integrado. Cap. 7 Transistores e Outros Dispositivos Semicondutores 277 de transistor n-p-n num circuito integrado. Em (a) aparecem as camadas n+ difundidas no substrato tipo p. Em (b) vê-se a camada epitaxial n depositada sobre o substrato, formando as camadas enterradas. Em (c) aparecem os canais de isolamento, que podem ser feitos com dielétricos ou com junções reversas. Finalmente, na figura (d), aparecem as regiões do emissor (n), da base (p) e do contato do coletor (n+ ). Para completar o circuito, um filme metálico é depositado sobre a superfı́cie, na forma de linhas, estabelecendo contatos com as regiões de interesse através de janelas na camada de óxido. Os terminais do circuito são então ligados aos pinos externos e o conjunto é encapsulado, podendo adquirir diversas feições, como por exemplo aquelas mostradas na Fig.7.30. 7.8.2 Dispositivos de Memória de Semicondutor Dentre os dispositivos mais importantes dos equipamentos eletrônicos nos dias de hoje estão aqueles que armazenam informações, chamados dispositivos de memória. Eles têm sido essenciais para a operação dos computadores, desde que estes foram inventados há cerca de meio século. Por isto mesmo a pesquisa e o desenvolvimento de memórias tornou-se uma área de grande interesse cientı́fico e tecnológico. Mas nas últimas décadas, as memórias passaram a ser utilizadas em uma grande variedade de equipamentos eletrônicos, que incorporaram microprocessadores em seus sistemas. Nestes equipamentos as memórias são essenciais para armazenar os programas, ou códigos, ou sof tware, que fazem o sistema executar suas funções. As memórias internas dos computadores e de certos equipamentos são de dois tipos principais, dispositivos semicondutores e dispositivos magnéticos. Os meios magnéticos armazenam a informação indefinidamente, até que elas sejam apagadas ou substituı́das. Por isto eles são chamados não-voláteis. Nos dispositivos de memória de semicondutores o tempo de armazenamento depende do seu tipo. Alguns têm tempos de armazenamento de alguns mili-segundos ou menos, sendo chamados voláteis, outros podem armazenar a informação por muitos anos, sendo considerados não-voláteis. As principais vantagens das memórias de semicondutores são a maior densidade, maior velocidade de gravação e de leitura, e o fato de não necessitarem de partes móveis. As memórias magnéticas, que serão apresentadas no Capı́tulo 9, têm maior capacidade de armazenamento e são não-voláteis. Dentre os dispositivos de memória removı́veis, para transporte ou armazenamento externo, os mais importantes atualmente são as fitas e discos magnéticos e os discos ópticos (Capı́tulo 8). 278 Materiais e Dispositivos Eletrônicos Os dispositivos de memória de semicondutores podem ser fabricados tanto com a tecnologia de transistores bipolares, quanto com a tecnologia MOS. Nos últimos anos a tecnologia MOS passou a dominar completamente na fabricação das memórias de semicondutores, por conta da maior capacidade de integração, menor custo e menor consumo de energia. O elemento básico das memórias MOS é o capacitor MOS, apresentado na Seção 7.6.1. A presença de carga no capacitor representa o bit 1, enquanto a ausência de carga representa o bit 0. Em geral, as células básicas das memórias de semicondutores são constituı́das de capacitores e transistores MOS. A Fig.7.34 ilustra uma célula tı́pica simples, formada por um transistor MOS de canal n, em série com um capacitor. Os terminais da fonte (F) e da porta (P) do transistor são utilizados para as conecções com os eletrodos de endereçamento, feitos por fitas de filmes finos metálicos. A região n+ do dreno do transistor faz a ligação em série com o capacitor formado pelo semicondutor tipo p do substrato e pelo filme metálico, separados pela camada isolante, em geral o óxido SiO2. Também é comum utilizar uma camada de silı́cio policristalino para a placa do capacitor, no lugar do filme metálico. O terminal da placa do capacitor em geral é ligado à terra do circuito. A região p+ na extremidade direita da figura é utilizada para isolar a célula do elemento vizinho. O processo de carga do capacitor, ou seja, o armazenamento da informação do bit 1, é feito pela aplicação simultânea de dois pulsos de tensão, um entre a fonte e a terra, outro entre a porta e a terra. Os valores das tensões de pico devem ser suficientes para criar uma camada de inversão entre a fonte e o dreno do transistor e outra sob o terminal do capacitor. Após a aplicação dos pulsos, a camada de inversão no transistor desaparece, porém a carga na Figura 7.34: Ilustração de uma célula de memória de semicondutor formada por um transistor em série com um capacitor MOS. Cap. 7 Transistores e Outros Dispositivos Semicondutores 279 Figura 7.35: Ilustração de parte de um circuito integrado de memória RAM formado por um arranjo matricial de células de memória, cada uma contendo um transistor em série com um capacitor MOS. camada de inversão do capacitor permanece armazenada. Esta carga tende a desaparecer depois de um certo tempo devido à geração térmica de portadores, o que limita o tempo de armazenagem a alguns mili-segundos. Este tempo é suficientemente longo para a operação dinâmica de uma memória nos equipamentos cujos relógios trabalhem com perı́odos muito inferiores a 1 ms, como é o caso dos computadores atuais que operam com relógios na região de GHz. Para a operação contı́nua do equipamento é necessário então que a memória seja periodicamente “refrescada”, isto é, que os capacitores das células que armazenam o bit 1 sejam recarregados antes que a carga desapareça. Naturalmente, as informações são perdidas quando o equipamento é desligado. Portanto, uma memória com células como a da Fig.7.34 é do tipo volátil. As memórias de semicondutores são formadas por circuitos integrados contendo um grande número de células conectadas a malhas de eletrodos de endereçamento. Um tipo de circuito está mostrado na Fig.7.35. A malha tem uma forma matricial, na qual as interligações das linhas e das colunas são chamadas de linhas de palavras e linhas de bits, que na figura são representadas respectivamente por WL (Word Line) e por BL (Bit Line). Note que as fontes dos transistores MOS são ligadas às linhas de bits e as portas são ligadas às linhas de palavras, enquanto que os capacitores são ligados à terra, permitindo carregar os capacitores como explicado anteriormente. Este arranjo matricial permite acessar aleatoriamente uma célula com qualquer endereço, tanto para gravação quanto para leitura da informação. Por esta razão 280 Materiais e Dispositivos Eletrônicos Figura 7.36: Estrutura de dispositivo FAMOS utilizado em memórias não-voláteis de semicondutores. este tipo de memória é chamado de acesso aleatório, ou mais comumente por sua sigla em inglês, RAM (de Random Access Memory). O acesso aleatório possibilita uma velocidade de operação, isto é gravação e leitura, maior que no acesso serial, caracterı́stico de fitas e discos magnéticos, nos quais é preciso passar por vários endereços até atingir um endereço especı́fico desejado. É possı́vel construir memórias não-voláteis com semicondutores, utilizando diversas estruturas MOS. A Fig.7.36 mostra uma estrutura de transistor MOSFET, na qual há dois eletrodos de porta. Um deles é metálico, usado para contato externo, enquanto que o outro, chamado de porta flutuante, em geral é feito de uma camada de Si policristalino, completamente envolvido pelo óxido isolante. Nesta estrutura, chamada de porta flutuante, conhecida pela sigla em inglês de FAMOS (Floating-gate Avalanche-injection MOS), a carga pode permanecer na porta flutuante durante vários anos. O armazenamento de carga na porta flutuante pode ser feito por diversos processos. Um processo comum consiste na aplicação de uma tensão na junção do dreno, com valor suficientemente alto para produzir uma forte polarização reversa. Isto resulta na ruptura por avalanche, produzindo grande aceleração dos elétrons na região de depleção da junção. Se uma tensão relativamente alta também for aplicada ao terminal da porta, parte dos elétrons passa para a porta flutuante por injeção direta ou por efeito túnel através da fina camada de óxido. A utilização de uma variedade de estruturas possibilita construir dispositivos de memória de semicondutores, voláteis ou não-voláteis, para inúmeras aplicações. A Fig.7.37 mostra uma classificação de memórias, representadas por suas siglas em inglês. As memórias voláteis são de dois tipos, estática (SRAM, de Static Random Access Memory) ou dinâmica (DRAM, de Dynamic Random Access Memory). A memória dinâmica é como a do tipo das Figuras 7.34 e 7.35, apresentado anteriormente, e que necessita ser Cap. 7 Transistores e Outros Dispositivos Semicondutores 281 Figura 7.37: Classificação dos dispositivos de memória de semicondutores. refrescada periodicamente. A memória estática retém a informação gravada sem a necessidade de refrescar, desde que o dispositivo permaneça energizado. Isto é feito através de circuitos bi-estáveis, também conhecidos como flip-flops, que podem ser chaveados para passar de um estado elétrico estável para outro, um deles representando o bit 0 e outro o bit 1. A variedade de memórias não-voláteis é maior, por isso elas são subdivididas em dois grupos, ROM (Read Only Memory), usadas somente para leitura e RAM, que podem ser gravadas e acessadas para leitura. A rigor, as memórias ROM também são do tipo RAM, pois como vimos anteriormente, é um nome usado para designar memórias cujos endereços podem ser acessados aleatoriamente. Porém, o nome RAM é utilizado para os dispositivos de acesso aleatório, tanto para gravação quanto para leitura das informações. Nas memórias chamadas de EEPROM (Electrically Erasable-Programmable Read Only Memory) as informações são usadas somente para leitura, mas podem ser gravadas ou apagadas eletricamente. Os outros principais tipos de memória ROM são: PROM (Programmable Read Only Memory), que é um dispositivo no qual a informação em cada célula é gravada de forma permanente, por um processo tipo fusı́vel; EPROM (Electrically Programmable Read Only Memory), é uma memória que utiliza dispositivos FAMOS nos quais as informações são gravadas eletricamente. Esta é a memória mais comum para armazenar a programação que dá a partida no processo de operação de um computador, ou de outros equipamentos contendo micro-processadores, quando eles são ligados. As informações na memória EPROM podem ser apagadas globalmente, isto é, em todos os endereços, por meio de radiação 282 Materiais e Dispositivos Eletrônicos ultra-violeta ou raios-X. Os fótons de alta energia levam os elétrons da porta flutuante para a porta de controle ou para o substrato. Para isso, o encapsulamento dos dispositivos EPROM tem uma abertura com uma janela óptica na parte superior, para permitir a passagem da radiação. Finalmente, a memória f lash, uma abreviação para o nome completo de f lash EEPROM, é uma memória na qual as informações são gravadas eletricamente, como na EPROM, mas podem ser apagadas globalmente, de uma só vez, como num f lash. As memórias f lash encontram um número de aplicações cada vez maior como meio de armazenagem não-volátil de grande capacidade. Elas são utilizadas, por exemplo, como memórias removı́veis em câmeras digitais, computadores e outros aparelhos eletrônicos. A necessidade de produzir memórias para diversas aplicações, com maior capacidade de gravação e com maior velocidade de acesso, tem impulsionado a pesquisa e o desenvolvimento de novos dispositivos e de tecnologias de integração cada vez mais sofisticados. Estas atividades têm proporcionado um contı́nuo aperfeiçoamento das memórias e uma busca permanente por novos dispositivos, fabricados com semicondutores ou outros materiais, que possibilitem a realização de funções inusitadas para novos equipamentos ou para inovações na indústria eletrônica. REFERÊNCIAS A. Bar-Lev, Semiconductors and Electronic Devices, Prentice-Hall, New Jersey, 1984. D.A. Fraser, The Physics of Semiconductor Devices, Claredon Press, Oxford, 1983. P.E. Gray e C.L. Searle, Princı́pios da Eletrônica, Livro Técnico, Rio de Janeiro, 1974. P. Horowitz and W. Hill, The Art of Electronics, Cambridge Univ. Press, Cambridge, 1980. H.A. Loureiro e L.E.P. Fernandes, Laboratório de Dispositivos Eletrônicos, Guanabara Dois, Rio de Janeiro, 1982. R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. K. Kano, Semiconductor Devices, Prentice Hall, New Jersey, 1998. H.A. Melo e R.S. de Biasi, Introdução à Fı́sica dos Semicondutores, Edgard Blücher, 1975. Cap. 7 Transistores e Outros Dispositivos Semicondutores 283 J. Millman e C.C. Halkias, Eletrônica: Dispositivos e Circuitos, McGrawHill, São Paulo, 1981. K.K. Ng, Complete Guide to Semiconductor Devices, McGraw-Hill, New York, 1995. D.J. Roulston, An Introduction to the Physics of Semiconductor Devices, Oxford University Press, Oxford, 1999. G.B. Rutkowski and J.E. Oleksy, Solid State Electronics, MacMillan - Mc Graw-Hill, Singapore, 1993. B.J. Streetman and S. Banerjee, Solid State Electronic Devices, Prentice Hall, New Jersey, 2000. S.M. Sze, Physics of Semiconductor Devices, J. Wiley, New York, 1981. S.M. Sze, Semiconductor Devices: Physics and Technology, J. Wiley, New York, 1985. E.S. Yang, Fundamentals of Semiconductor Devices, McGraw-Hill, New York, 1978. J.A. Zuffo, Dispositivos Eletrônicos, McGraw-Hill, São Paulo, 1976. J.A. Zuffo, Compêndio de Microeletrônica, Guanabara Dois, Rio de Janeiro, 1984. PROBLEMAS 7.1 A variação da concentração de buracos em excesso do equilı́brio, δp(x), em função da posição x na base de um transistor p-n-p é dada pela Eq.(7.15). Faça gráficos de δp(x)/pE (de preferência num computador), para três espessuras da base, = 2Lp , 0, 5Lp e 0, 1Lp , onde Lp é o comprimento de difusão. Utilizando os gráficos explique qual das espessuras é a melhor para um bom transistor. 7.2 Mostre que num transistor p+ -n-p+ fortemente polarizado diretamente, a corrente de base é dada pela Eq.(7.23). 7.3 Considere um transistor p+ -n-p+ simétrico, de Si, com as seguintes caracterı́sticas da base, = 2 µm, A = 10−3 cm2 , Nd = 5 × 1015 cm−3 e τp = 0, 5 µs. Sabendo que o emissor e o coletor têm Na = 5 × 1017 cm−3 e τn = 0, 1µs, calcule as correntes do emissor, da base e do coletor, com o transistor polarizado com VEB = 0, 75 V e VCB = - 10 V. 7.4 Calcule os parâmetros α, γ e β do transistor do Problema 7.3. 284 Materiais e Dispositivos Eletrônicos 7.5 Calcule os parâmetros IEs , ICs , αN e αI do transistor do Problema 7.3 e obtenha as correntes do emissor e do coletor usando as Equações (7.37) e (7.38). Compare os resultados com os do Problema 7.3. 7.6 Considere um transistor p+ -n-p+ simétrico, isto é, com todos parâmetros do emissor iguais aos do coletor. a) Escreva as equações de Ebers-Moll para o transistor. b) Obtenha a corrente I em função de V para o transistor no circuito (a) da figura abaixo. c) Calcule VCB quando o transistor está conectado como no circuito (b) da figura a seguir. 7.7 Um transistor p+ -n-p+ simétrico Si tem as seguintes caracterı́sticas da base: = 1 µm, A = 10−3 cm2 , Nd = 1015 cm−3 e τp = 2 µs. O emissor e o coletor têm Na = 5×1016 cm−3 e têm comprimento de difusão metade do valor na base. Os outros parâmetros de Si à temperatura ambiente estão dados na Tabela 5.2. a) Calcule as correntes de saturação do emissor e do coletor, IEs e ICs . b) Escreva as equações de Ebers-Moll para o transistor e dê os valores numéricos dos quatro parâmetros que aparecem nelas. 7.8 Considere o transistor p+ -n-p+ do Problema 7.7. A partir das Eqs.(7.37) e (7.38), obtenha uma equação para a corrente de coletor IC em função apenas da tensão VCE e da corrente de base IB . Use um computador e faça os gráficos do IC em função de (−VCE ), para diversos valores de IB , e compare o resultado com a Figura 7.7(b). 7.9 Para o transistor do Problema 7.3, calcule a corrente I quando ele está conectado, como no circuito abaixo, sendo V = 500 mV. Cap. 7 Transistores e Outros Dispositivos Semicondutores 285 7.10 Um transistor p-n-p com caracterı́sticas dadas na Fig.7.7, é utilizado como amplificador num circuito de polarização simples, análogo ao da Fig.7.9(a). Sendo EB = EC = 10 V e RC = 1 kΩ calcule: a) O valor de RB para que a corrente de base seja 50 µA; b) Os valores de IC e VCE ; c) O ganho de corrente do circuito; d) O máximo sinal de tensão de entrada para o circuito operar na região linear. 7.11 Obtenha a equação da corrente de dreno de um transistor JFET, como o da Fig.7.11, correspondente a (7.43), sem desprezar o potencial de contato V0 das junções. 7.12 Obtenha as expressões da condutância e da tensão crı́tica de um JFET, desprezando o potencial de contato das junções mas sem a condição Na Nd utilizada na dedução das Equações (7.44) e (7.45). 7.13 Um transistor de efeito de campo de junção como o da Fig.7.11 feito de silı́cio, tem regiões p+ com dopagem Na = 1018 cm−3 e canal com Nd = 2 × 1016 cm−3 e meia largura a = 0, 8 µm. a) Calcule a tensão crı́tica Vc supondo V0 = 0. b) Qual o valor de Vc se V0 não for desprezado? c) Qual o valor de VD no qual a corrente satura para VP = −2 V? 7.14 Qual é, aproximadamente, o maior ganho de tensão de um circuito amplificador feito com o transistor de junção da Fig.7.13? 7.15 Um transistor MESFET de GaAs tem barreira de potencial V0 = 0, 8 V e tem no canal concentração de impurezas Nd = 1016 cm−3 , mobilidade µn = 7 × 103 cm2 /V · s e dimensões a = 0, 7 µm, L = 15 µm e D = 10 µm. Calcule a) A condutância do canal; b) A tensão crı́tica; c) A corrente de dreno de saturação para VP = 0 e VP = −1, 0V . 7.16 Um transistor MOSFET de canal n é feito com eletrodos de alumı́nio e semicondutor silı́cio tipo p, com Na = 2 × 1017 cm−3 . A espessura da camada de SiO2 é 100 Å na região da porta, a carga na interface é Qi /A = 10−8 C/cm2 , e as outras dimensões relevantes (Fig.7.21) são L = 10 µm e D = 300 µm. Calcule: a) A tensão crı́tica Vc ; b) A corrente de saturação para VP = 6 V; c) A curva ID − VD para VP = 4 V. 286 Materiais e Dispositivos Eletrônicos Capı́tulo 8 Materiais e Dispositivos Opto-Eletrônicos 8.1 Propriedades Ópticas dos Materiais 289 8.1.1 Ondas Eletromagnéticas em Materiais 8.1.2 Refletividade de Materiais 291 295 8.2 Interação da Radiação com a Matéria - Modelo Clássico 298 8.2.1 Contribuição dos Elétrons Livres em Metais 8.2.2 Contribuição de Elétrons Ligados 299 303 8.3 Teoria Quântica da Interação Radiação - Matéria 308 8.3.1 Transições entre Nı́veis Discretos 8.3.2 Absorção de Luz e Luminescência 8.3.3 Absorção e Emissão de Luz em Isolantes e Semicondutores 8.3.4 Absorção e Emissão de Luz em Materiais com Impurezas 8.4 Fotodetetores 309 312 315 321 323 8.4.1 Foto-resistores 8.4.2 Fotodiodos 8.4.3 Células Solares 8.4.4 Sensor de Imagem CCD 326 330 336 338 287 288 Materiais e Dispositivos Eletrônicos 8.5 Diodo Emissor de Luz (LED) 342 8.6 Emissão Estimulada e Lasers 348 8.6.1 O Mecanismo de Amplificação por Emissão Estimulada 8.6.2 Lasers de Sólidos com Impurezas 8.6.3 Lasers a Gás 8.7 O Laser de Diodo Semicondutor 8.7.1 O Laser de Junção p-n 8.7.2 Lasers de Heterojunções 8.7.3 Laser de Poço Quântico 8.8 Aplicações dos Lasers de Diodo 349 353 357 359 360 363 368 372 8.8.1 Comunicações Ópticas 8.8.2 Gravação e Reprodução em Discos Compactos 372 378 REFERÊNCIAS 380 PROBLEMAS 380 Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 289 Materiais e Dispositivos Opto-Eletrônicos 8.1 Propriedades Ópticas dos Materiais As propriedades ópticas são aquelas que caracterizam como os materiais respondem a uma radiação externa, emitindo, absorvendo, refletindo ou alterando a polarização da luz. Alguns aspectos dessas propriedades estão, sem dúvida, entre os mais facilmente identificáveis nos materiais. Desde tempos imemoriais que o brilho, a cor, a transparência e a opacidade dos materiais fascinam e intrigam a humanidade. São antiquı́ssimas a utilização de metais para fabricar espelhos e o emprego de metais e minerais naturais na confecção de jóias e objetos de adorno. Os estudos cientı́ficos sobre a cor e o efeito de materiais sobre a luz ganharam grande impulso com as experiências de Newton no Século XVII. Newton mostrou que, ao passar por um prisma de vidro, um feixe de luz solar dava origem a uma faixa multicolorida. Na extremidade da faixa formada pelos raios que sofrem o menor desvio ao passar pelo prisma a cor é vermelha, enquanto na outra extremidade a cor é violeta. Atualmente sabe-se que a sensação de cor é produzida no cérebro, e resulta do efeito de ondas eletromagnéticas numa faixa estreita de freqüências ao incidir na retina do olho humano. Comprimentos de onda em torno de 400 nm produzem a sensação da cor violeta, enquanto na outra extremidade do espectro, comprimentos de 700 nm produzem a cor vermelha. A Figura 8.1(a) mostra a resposta padrão do olho humano em função do comprimento de onda da luz visı́vel. A região na qual o olho é mais sensı́vel está em torno de 555 nm, que corresponde a uma cor verde-amarelado. A 290 Materiais e Dispositivos Eletrônicos Figura 8.1: (a) Sensibilidade relativa do olho humano em função do comprimento de onda da luz; (b) Variação do ı́ndice de refração de quartzo fundido com o comprimento de onda. Figura 8.1(b) ilustra a dispersão óptica dos materiais transparentes, que é responsável pela separação do feixe de luz branca em várias cores. O ı́ndice de refração, definido no Capı́tulo 2, varia com o comprimento de onda da luz. Na cor violeta (menor comprimento de onda) o ı́ndice de refração é maior, o que resulta em maior desvio ao passar pelo prisma. Na cor vermelha o ı́ndice de refração é menor e portanto o desvio é menor. A variação do ı́ndice de refração é devida às caracterı́sticas da interação da radiação com a matéria, que serão estudadas na Seção 8.2. A região visı́vel do espectro eletromagnético, com comprimento de onda na faixa 700-400 nm, corresponde a uma energia de fótons na faixa 1,7-3,1 eV. Estes valores são da mesma ordem de grandeza das energias dos gaps em vários semicondutores e também das energias de transições eletrônicas em átomos diversos. Por esta razão, foi possı́vel desenvolver, nas últimas décadas, vários dispositivos que convertem eficientemente luz em corrente elétrica, e vice-versa. Isto deu origem à Opto-eletrônica. Este é o ramo da tecnologia no qual sinais analógicos e digitais são processados por meio de dispositivos que empregam luz e corrente eletrônica, e que formam a base das comunicações ópticas. Uma área correlata, que também está se desenvolvendo rapidamente, é a Fotônica, na qual o processamento de sinais é feito em dispositivos inteiramente ópticos. Neste capı́tulo estudaremos os principais fenômenos envolvidos na interação da radiação eletromagnética com a matéria, bem como suas aplicações em Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 291 dispositivos opto-eletrônicos de semicondutores. Outros dispositivos baseados na interação da luz com diversos materiais serão apresentados no Capı́tulo 10. 8.1.1 Ondas Eletromagnéticas em Materiais Os fenômenos de reflexão, refração e absorção da luz em materiais, podem ser descritos macroscopicamente através das equações de Maxwell (2.1)-(2.4). No capı́tulo 2, estas equações foram resolvidas para ondas planas num meio isolante perfeito, no qual a densidade de corrente J é nula. Nesta situação não existe absorção, ou perda de energia, de modo que as amplitudes dos dados por (2.7) e (2.8), não variam durante a propagação. campos E e H, No caso em que a onda propaga num meio real, metálico, semicondutor ou mesmo isolante, sempre existe perda. Esta perda pode ser descrita por uma densidade de corrente, relacionada ao campo elétrico através da condutividade Neste caso, a equação de ondas propagando na direção do eixo x σ, J = σ E. contém outro termo que não aparece em (2.6). A partir de (2.1)-(2.4) podese mostrar facilmente que para ρ = 0, o campo elétrico variando somente na direção x é descrito por (Problema 8.1), t) t) t) ∂ 2 E(x, ∂ E(x, ∂ 2 E(x, = µ + µσ ∂x2 ∂t2 ∂t (8.1) Na região visı́vel do espectro eletromagnético os efeitos magnéticos são desprezı́veis, de modo que podemos considerar µ = µ0 . Substituindo em (8.1) a solução de campo harmônio (2.14), com k na direção x obtemos, ε (8.2) k 2 = µ0 ω 2 + iωµ0 σ = 2 ω 2 + iω µ0 σ c √ onde c = 1/ µ0 0 é a velocidade da luz no vácuo e ε = /0 é a constante dielétrica do material (também chamada permissividade relativa). Num meio sem perdas a razão entre k e ω leva à definição do ı́ndice de refração n, dado pela Eq.(2.10). Esta definição pode ser generalizada para meios com perdas, através do ı́ndice de refração complexo, 1/2 σ N(ω) = ε + i . (8.3) ω0 Com esta definição a Eq.(8.2) adquire a mesma forma de (2.10), ω k = N(ω) , c (8.4) 292 Materiais e Dispositivos Eletrônicos uma vez que µ0 c2 = 1/0 . O ı́ndice de refração complexo foi representado por N(ω) para não confundir com o número de partı́culas N e também para explicitar sua dependência com ω. Esta dependência não surge apenas do ω que aparece no denominador do segundo termo em (8.3), mas também do fato de que ε(ω) e σ(ω) sempre variam com a freqüência. É precisamente a variação de ε e σ com a freqüência que determina as propriedades ópticas dos materiais, como veremos mais adiante neste capı́tulo. A vantagem de introduzir o ı́ndice de refração complexo é que todas expressões obtidas no Capı́tulo 2 podem ser usadas aqui com a simples substituição do ı́ndice de refração n pelo seu correspondente complexo N(ω). Vamos agora explicitar as partes real e imaginária do ı́ndice complexo, N(ω) = n + iκ . (8.5) Para relacionar as duas parcelas de N(ω) com os parâmetros e σ do meio, elevamos (8.3) e (8.5) ao quadrado e igualamos os dois, N 2 (ω) = n2 − κ2 + i2nκ = ε + i σ ω0 . Como veremos mais tarde, tanto ε quanto σ podem ser complexos. Fazendo ε = ε + iε e σ = σ + iσ e igualando as partes reais e imaginárias das duas formas de N 2 (ω) acima obtemos n2 − κ2 = ε − σ ω0 σ 2nκ = ε + ω0 (8.6) . (8.7) Para entender o significado de n e κ, substituimos (8.5) em (8.4) e obtemos para o módulo do vetor de onda, ωκ ωn +i ≡ k + ik k= c c O campo elétrico da onda, dado por (2.14), passa a ser, com k na direção x, t) = Re E0 ei ωc nx−iωt e− ωc κx E(x, ω ω nx − ωt e− c κx = E0 cos c . (8.8) Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 293 Vemos então que o campo é descrito por uma função harmônica cuja amplitude decai exponencialmente durante a propagação. Note que n, a parte real de N(ω), é a razão entre a velocidade da luz c e a velocidade de fase vf = ω/k = c/n, e portanto é o próprio ı́ndice √ de refração. Somente no caso de meios sem perdas (κ = 0) temos n = ε, como definido na Eq.(2.10). A Eq.(8.8) mostra que κ, a parte imaginária de N(ω), produz um decaimento exponencial na amplitude do campo. Por esta razão ele é chamado coeficiente de amortecimento ou coeficiente de extinção. Para compreender o significado de κ, vamos estudar o que ocorre com a energia da onda. A grandeza que exprime a energia transportada por uma onda eletro definido pela relação, magnética é o vetor de Poynting S, = E × H S . (8.9) é igual à energia por unidade de área e Pode-se mostrar que o módulo de S por unidade de tempo transportada pela onda. Utilizando as expressões (2.11) tem (2.13), é fácil verificar que para uma onda plana num meio sem perdas, S a mesma direção que o vetor propagação k e tem módulo dado por (Problema 8.2), n 2 S(r, t) = E cos2 (k · r − ωt + φ) , (8.10) cµ0 0 o que mostra que S varia harmonicamente no tempo e no espaço. Como nas considerações de energia o mais importante é a média, define-se a intensidade de uma onda como o valor médio do módulo do vetor de Poynting. Sendo o valor médio do cosseno ao quadrado igual a 1/2, temos que a intensidade da onda é n I =<S>= E2 . (8.11) 2cµ0 0 Esta relação mostra que em meio sem perdas, a intensidade de uma onda harmônica plana é constante, ou seja, não varia no espaço nem no tempo. Ela é proporcional ao quadrado da amplitude do campo elétrico e é igual a energia média transportada, por unidade de área e por unidade de tempo. Em outras palavras, a intensidade é a potência média por unidade de área. No Sistema Internacional ela é expressa em W/m2 . É possı́vel relacionar a intensidade de um feixe de luz com o fluxo de fótons. Um feixe com intensidade I e área da seção reta A tem potência média P = IA. Sendo ω a freqüência angular da onda, a energia de cada fóton é ω. Portanto, o fluxo de fótons, definido como o número de fótons Φ que atravessa 294 Materiais e Dispositivos Eletrônicos uma seção reta do feixe, por unidade de tempo e por unidade de área é dado por: I . (8.12) Φ= ω Veja que o número de fótons por unidade de tempo não varia ao longo do feixe porque a amplitude é constante. Este resultado não vale para um material com perdas, no qual N(ω) tem partes real e imaginária. Neste caso, o cálculo do vetor de Poynting tem um complicador na defasagem entre os campos E e introduzida pela parte imaginária de N(ω). Porém, é fácil mostrar que a H intensidade de uma onda com campo dado pela Eq.(8.8) varia no espaço da seguinte forma (Problema 8.3), I(x) = I(0) e−2 c κx ≡ I(0) e−αx ω . (8.13) Esta expressão mostra que κ, a parte imaginária de N(ω), produz ao longo de x um decaimento exponencial na amplitude da onda. A taxa de decaimento é caracterizada pelo coeficiente de absorção, definido por, α=− 1 dI ω =2 κ. I dx c (8.14) Veja que o coeficiente de absorção tem a dimensão do inverso de distância. O seu inverso, 1/α, é a distância caracterı́stica de decaimento da intensidade da onda. Como a amplitude do campo elétrico varia com a raiz quadrada da intensidade, o comprimento caracterı́stico da penetração do campo no material é dado por, c 2 . (8.15) δ= = α ωκ As equações (8.6), (8.7) e (8.14) são válidas em cada valor de freqüência ω. Como veremos mais tarde, em qualquer material todas as grandezas definidas nesta seção variam com ω. Na região visı́vel do espectro eletromagnético os isolantes têm σ ≃ 0, e portanto são transparentes (α = 0). Porém, na região ultravioleta, sua condutividade é finita e eles absorvem fortemente a radiação. O aumento da absorção e da constante dielétrica na região ultravioleta resulta num gradual aumento do ı́ndice de refração com a freqüência na faixa visı́vel. É isto que faz com que o ı́ndice de refração do quartzo fundido diminua com o comprimento de onda (que é inversamente proporcional a ω), como na Fig.8.1(b), e que produz a dispersão da luz branca. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 8.1.2 295 Refletividade de Materiais Uma onda eletromagnética incidindo sobre a superfı́cie de um material qualquer dá origem a uma onda refletida e outra refratada. As leis da óptica geométrica relacionam os ângulos de incidência, reflexão e refração, mas nada dizem em relação às intensidades das ondas. Para obter a relação entre as intensidades é preciso utilizar as condições de contorno na superfı́cie decorrentes das equações de Maxwell. Vamos considerar o caso simples de uma onda com campo E1 = ŷE (no vácuo ou no ar) incidindo perpendicularmente na superfı́cice plana de um material com ı́ndice de refração complexo N(ω), como ilustrado na Fig.8.2. O cálculo dos campos refletidos E2 = ŷE2 e transmitido (ou refratado) E3 = ŷE3 é muito semelhante ao do problema do elétron numa barreira de potencial (Seção 3.3.3 e problema 3.5). O campo complexo no ar, isto é, em x < 0, é, Ey = E1 ei c x−iωt + E2 e−i c x−iωt ω ω enquanto no material, suposto semi-infinito, ele é dado por (8.8) com (8.5), ω Ey = E3 ei c N (ω)x−iωt . Para obter E2 e E3 em função de E1 é preciso aplicar as condições de contorno em x = 0. A continuidade do campo elétrico tangencial em x = 0 dá E3 = E1 + E2 . (8.16) Para impor a continuidade do campo H tangencial, usamos a Eq.(2.13) com √ ε substituı́do por N(ω). O resultado é, N(ω) E3 = E1 − E2 . (8.17) Figura 8.2: Ilustração das ondas incidente, refletida e transmitida (refratada) na superfı́cie de um material. 296 Materiais e Dispositivos Eletrônicos De (8.16) e (8.17) obtemos as amplitudes dos campos refletido e transmitido, 1 − N(ω) E2 = E1 1 + N(ω) E3 2 = E1 1 + N(ω) (8.18) . (8.19) A refletividade R é definida pela razão entre as intensidades das ondas refletida e incidente. Usando (8.18) obtemos, N(ω) − 1 2 . (8.20) R = N(ω) + 1 Em função das partes real e imaginária de N(ω), a refletividade pode ser escrita como, (n − 1)2 + κ2 R= . (8.21) (n + 1)2 + κ2 Note que R é uma grandeza adimensional que freqüentemente é expressa em percentual. Por exemplo, vidro comum tem n ≃ 1, 5 e κ = 0, o que dá R ≃ 0, 04, ou R = 4%. A Eq.(8.21) mostra que a refletividade depende tanto do ı́ndice de refração quanto do coeficiente de extinção. No caso de metais em freqüências abaixo da região visı́vel, a absorção é muito forte, de modo que κ n. Nesta situação as parcelas em n na Eq.(8.21) podem ser desprezadas em presença de κ2 de modo que R ≃ 1. A refletividade próxima de 100% é precisamente uma das caracterı́sticas marcantes dos metais. É fácil verificar que a transmissão, definida como a razão entre as intensidades das ondas transmitida e incidente, é relacionada com R por T = 1 − R. Esta relação também expressa a conservação de energia no processo de incidência de uma onda na superfı́cie de separação de dois meios. Exemplo 8.1: Uma onda eletromagnética de comprimento de onda 500 nm incide na superfı́cie plana de uma amostra de semicondutor de CdTe intrı́nseco. Considerando que neste comprimento de onda CdTe tem condutividade desprezı́vel e constante dielétrica com parte real ε = 8,9 e parte imaginária ε = 2,3. Calcule: a) A velocidade de fase da radiação no comprimento de onda dado; b) O coeficiente de absorção; c) A refletividade; d) A transmissão total de uma placa de CdTe com faces paralelas e espessura 0,1 µm. a) Para calcular a velocidade de fase é necessário relacionar o ı́ndice de refração n com as partes real e imaginária da constante dielétrica. Fazendo σ = 0 e substituindo (8.7) em (8.6) obtemos a Cap. 8 Materiais e Dispositivos Opto-Eletrônicos equação para n, n2 − ε 2n 2 297 = ε , que leva à seguinte equação biquadrática, 2 ε =0. n −ε n − 4 4 2 A solução positiva desta equação é, 1/2 1 . n = √ ε + (ε2 + ε2 )1/2 2 Logo 1/2 1 = 3, 01 . n = √ 8, 9 + (8, 92 + 2, 32 )1/2 2 Então vf = c 3 × 108 = = 9, 97 × 107 m/s . n 3, 01 b) O coeficiente de extinção é calculado por um procedimento análogo, 1/2 1 . κ = √ −ε + (ε2 + ε2 )1/2 2 1/2 1 = 0, 38 . κ = √ −8, 9 + (8, 92 + 2, 32 )1/2 2 O coeficiente de absorção é dado por (8.14), α= 2ωκ 4π ν κ 4π κ = = c c λ α= 4 × 3, 14 × 0, 38 = 9, 55 × 106 m−1 = 9, 55 µm−1 . 500 × 10−9 c) A refletividade é dada por (8.21), R= (3, 01 − 1)2 + 0, 382 = 0, 258 . (3, 01 + 1)2 + 0, 382 Portanto, a refletividade do CdTe em 500 nm é 25,8 %. d) Para calcular a transmissão total é preciso considerar a transmissão nas duas superfı́cies e ao longo da espessura d da placa, T = (1 − R)2 e−αd = (1 − 0, 258)2 × e−9,55×0,1 = 0, 21 . 298 8.2 Materiais e Dispositivos Eletrônicos Interação da Radiação com a Matéria-Modelo Clássico Nesta seção vamos estudar alguns mecanismos de interação de ondas eletromagnéticas com a matéria que podem ser descritos por um modelo clássico. O objetivo é compreender alguns fenômenos básicos com modelos simples que permitam calcular ε(ω) e σ(ω). Como vimos na seção anterior, estes parâmetros determinam n(ω) e κ(ω) e portanto as propriedades ópticas de cada material. Inicialmente estudaremos a interação da radiação com elétrons livres, que tem um papel essencial nas propriedades ópticas de metais. Em seguida estudaremos o modelo clássico da interação com os elétrons ligados. Para compreender em detalhe as propriedades ópticas de isolantes e semicondutores será necessário considerar a natureza quântica desta interação, o que será feito na próxima seção. A interação da radiação com a matéria resulta da força que o campo elétrico da onda exerce sobre as cargas elétricas dos ı́ons e dos elétrons. Como o campo varia com uma certa freqüência ω, ele tende a criar nas cargas um movimento harmônico com a mesma freqüência. Porém, este movimento só será significativo se as cargas tiverem um modo natural de vibração com freqüência próxima da freqüência do campo. Por esta razão, no caso dos ı́ons, a interação com o campo eletromagnético só será importante se este tiver freqüência na faixa 1-10 THz (4-40 meV), caracterı́stica dos modos ópticos de vibração da rede cristalina. Como esta faixa corresponde ao infravermelho distante, as vibrações da rede, ou fônons, só contribuem de maneira mais significativa para as propriedades ópticas nesta região do espectro eletromagnético. No caso de isolantes e semicondutores, os fônons dominam as propriedades ópticas no infravermelho. Entretanto, nos metais predomina a interação do campo com os elétrons livres, fazendo com que a refletividade seja próxima de 1, como veremos a seguir. Nas regiões do infravermelho próximo, visı́vel e ultravioleta, o movimento dos ı́ons é desprezı́vel, de modo que as propriedades ópticas nessas faixas são dominadas pela interação do campo elétrico com os elétrons, livres ou ligados aos átomos. Vamos estudar os diversos aspectos desta interação separadamente em várias subseções. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 8.2.1 299 Contribuição dos Elétrons Livres em Metais Nos metais, o comportamento dos elétrons livres é determinante para as propriedades ópticas numa extensa faixa de freqüências. O movimento dos elétrons sob a ação do campo elétrico de uma onda plana, E = E0 e−ωt , (8.22) pode ser deduzido pela extensão dos conceitos apresentados na seção 4.5, para campos variáveis no tempo. Sendo −eE a força que o campo exerce sobre o elétron, a equação de movimento do elétron fica, dv m m (8.23) + v = −E0 e−iωt , dt τ onde m, v e τ são respectivamente a massa, a velocidade e o tempo de colisão do elétron. O segundo termo de (8.23) representa o amortecimento no movimento do elétron devido às colisões com a rede e com impurezas. Substituindo em (8.23) a solução para regime estacionário v = v0 exp(−iωt), obtemos v0 = −eE0 −imω + m/τ . (8.24) Considerando N elétrons livres por unidade de volume, obtemos para a densidade de corrente, (8.25) J = −eNv0 e−iωt . Substituindo (8.24) em (8.25) e usando a relação J = σE, obtemos para a condutividade do metal, σ(ω) = Ne2 τ m(1 − iωτ ) . (8.26) Este resultado é conhecido como a condutividade do modelo de Drude. Note que fazendo ω = 0 em (8.26), obtemos a condutividade dc dada pela Eq.(4.30), como esperado. Substituindo (8.26) em (8.3) obtemos para o ı́ndice de refração complexo dos metais, N 2 (ω) = εc + iNe2 τ mω0 (1 − iωτ ) , (8.27) onde εc é a contribuição dos elétrons ligados para constante dielétrica. Como veremos mais tarde, esta contribuição é mais importante nas regiões visı́vel e 300 Materiais e Dispositivos Eletrônicos ultravioleta do espectro, sendo aproximadamente constante no infravermelho. O fato de σ(ω) ser complexo faz com que as expressões para as partes real e imaginária de N(ω) sejam relativamente grandes e difı́ceis de analisar. Por esta razão, vamos analisar σ(ω) aproximadamente em dois limites, baixas e altas freqüências. Na aproximação de baixas freqüências fazemos ωτ 1. Como nos metais alcalinos (Li, Na, K, Rb e Cs) e nos metais nobres (Cu, Ag e Au), τ ∼ 10−13 s, esta aproximação corresponde a ω 1013 s−1 . Ela vale então para a região do infravermelho distante. Nesta região, desprezando iωτ na presença de 1 em (8.26), vemos que σ(ω) = n e2 τ /m = σ0 é a própria condutividade dc, dada por (4.30). Então, podemos escrever (8.27) na forma, N 2 (ω) ≃ εc + i σ0 ω0 . (8.28) 9 2 2 Usando os valores σ0 ∼ 108 Ω−1 m−1 (veja Fig.4.17), −1 0 = 36π × 10 Nm /C e ω ∼ 1012 s−1 , vemos que a parte imaginária de N 2 (ω) em (8.28) é muito maior que a parte real, εc ∼ 1. Assim sendo, no infravermelho distante os metais têm ı́ndice de refração complexo, 1/2 1/2 σ0 σ0 1/2 (i) = (1 + i) . N(ω) ≃ ω0 2ω0 Portanto, as partes real e imaginária são iguais e muito maiores que 1, 1/2 σ0 n=κ≃ 1 . (8.29) 2ω0 A substituição de (8.29) em (8.21) mostra que R ≃ 1. Este resultado explica porque os metais são refletores quase perfeitos de ondas eletromagnéticas com freqüências abaixo do infravermelho. Eles não são refletores perfeitos porque uma pequena fração da energia da onda penetra numa camada fina na superfı́cie, sendo absorvida pelos elétrons livres e transformada em calor nos processos de colisão. Este é o efeito pelicular, caracterizado por um comprimento de penetração δ (skin depth) da onda, dado pelo dobro do inverso do coeficiente absorção. Substituindo (8.29) em (8.15) e usando c = (0 µ0 )−1/2 obtemos 1/2 2 c = . (8.30) δ= ωκ ωµ0σ0 Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 301 Para o cobre à temperatura ambiente, com σ0 = 0, 6×108 Ω−1 m−1 , a Eq.(8.30) dá δ = 0, 066 mm em ν = 1 MHz e δ = 6, 6 µm em ν = 100 MHz. Na aproximação de altas freqüências, ωτ 1, válida para as regiões do infravermelho próximo, visı́vel e ultravioleta, podemos desprezar a unidade no denominador de (8.27) e escrever, ωp2 2 N (ω) = εc 1 − 2 , (8.31) ω onde ωp2 = Ne2 m0 εc . (8.32) ωp é chamada a freqüência de plasma do metal. Seu valor é da ordem de 1015 Hz (correspondente a uma energia ωp ∼ 4 eV) nos metais comuns, e portanto está situada no final da faixa visı́vel e inı́cio do ultravioleta. A Eq.(8.31) mostra que para ω < ωp o ı́ndice de refração N(ω) é um imaginário puro, √ ou seja, n = 0 e κ = εc (ωp2 /ω 2 − 1)1/2 . Nesta situação a refletividade, dada por (8.21), é exatamente R = 1. Por esta razão, à semelhança do que ocorre no infravermelho, também na região visı́vel os metais são ótimos refletores de ondas eletromagnéticas. Por outro lado, para ω > ωp , N(ω) é real, o que faz com que a absorção devida aos elétrons livres seja nula. A Fig. 8.3 mostra a variação da refletividade da prata, em (a) com a Figura 8.3: Refletividade da prata: (a) Em função da energia do fóton da onda eletromagnética incidente [H. Ehrenreich et al., Phys. Rev. 128, 1622 (1962)]; (b) Em função do comprimento de onda, em escala ampliada. Materiais e Dispositivos Eletrônicos 302 energia do fóton incidente e em (b) com o comprimento de onda numa escala ampliada para realçar detalhes na região visı́vel. Note que a prata tem refletividade quase 100% em toda a região de energia desde zero até o final da região visı́vel. Por esta razão a prata reflete todo o espectro de luz branca igualmente. A refletividade cai bruscamente para próximo de zero nas proximidades da freqüência de plasma. Para energias mais altas R apresenta outras variações causadas por transições de elétrons ligados, que serão estudadas a seguir. É interessante notar que no caso do cobre, estas transições produzem uma variação na refletividade dentro da região visı́vel. Neste caso, a refletividade é alta em toda a faixa visı́vel porém é maior no vermelho do que no azul. Por esta razão, a reflexão do cobre tem uma cor alaranjada, que contrasta com o “prateado” da prata. Exemplo 8.2: A concentração de elétrons livres na prata é 5, 86 × 1022 cm−3 e o tempo de colisão é 3, 8 × 10−14 s. Calcule: a) O comprimento de penetração na prata de uma onda eletromagnética com freqüência de microondas, ν = 1 GHz; b) O comprimento de penetração de um feixe de laser de argônio com comprimento de onda λ = 514, 5 nm; c) A atenuação sofrida pelo feixe de laser ao atravessar um filme de prata de espessura 50 Å. a) Inicialmente é preciso calcular o produto ωτ , ωτ = 2π × 109 × 3, 8 × 10−14 = 2, 38 × 10−3 . Como ωτ 1, o comprimento de penetração pode ser calculado por (8.30). Usando o valor da condutividade da prata calculada no Exemplo 4.3, σ0 = 6, 26 × 107 (Ωm)−1 , vem, 2 ωµ0 σ0 δ= 1/2 = 2 2π × 109 × 4π × 10−7 × 6, 26 × 107 1/2 δ = 2, 01 × 10−6 m = 2, 01 µm. b) A freqüẽncia do laser de argônio é ω = 2πν = 2π 2π × 3 × 108 c = = 3, 66 × 1015 s−1 , λ 514, 5 × 10−9 então ωτ = 3, 66 × 1015 × 3, 8 × 1014 = 1, 39 × 102 . Neste caso ωτ 1 e o ı́ndice de refração complexo é dado por (8.31). Considerando εc = 1, a freqüência de plasma da prata dada por (8.32) é, ωp2 = N e2 5, 86 × 1022 × 106 × 1, 62 × 10−38 × 36π × 109 = m 0 εc 9, 1 × 10−31 ωp2 = 1, 86 × 1032 s−2 . Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 303 Logo ωp = 1, 36 × 1016 s−1 é maior do que ω, o que faz com que N 2 seja negativo e portanto N é imaginário. De (8.31) vem N=i ωp2 −1 ω2 =i 1, 86 × 1032 −1 3, 662 × 1030 , N = i 12, 9 . A Equação (8.5) mostra que a parte imaginária de N é o próprio coeficiente de extinção κ. O comprimento de penetração é então calculado com (8.15), δ= 3 × 108 c = ωκ 3, 66 × 1015 × 12, 9 δ = 6, 35 × 10−9 m = 63, 5 Å . c) A atenuação do feixe numa distância d = 50 Å é e2d/δ = e100/63,5 = e1,57 = 4, 83 Isto significa que ao atravessar o filme de prata, a intensidade do feixe de laser diminui por um fator 4,83. A atenuação também pode ser expressa em decibéis, A = 10 log 10 e2d/δ = 10 log10 4, 83 A = 6, 84 dB . 8.2.2 Contribuição de Elétrons Ligados Como mencionado anteriormente, as propriedades ópticas dos materiais em energias da ordem ou maiores que 1 eV são devidas principalmente às transições dos elétrons ligados nos átomos, ou elétrons de valência. O tratamento correto dessas transições, que será apresentado na próxima seção, deve ser feito com a mecânica quântica. Entretanto, é possı́vel entender certos aspectos do fenômeno com um modelo simples devido a Lorentz. Neste modelo, baseado na visão clássica do átomo, supõe-se que a aplicação de um campo elétrico externo resulta no deslocamento das camadas eletrônicas negativas em relação ao núcleo positivo, como ilustrado na Figura 8.4(a). Isto produz um momento de dipolo elétrico que contribui para a permissividade do material. Porém, o deslocamento relativo das cargas também cria uma força eletrostática restauradora que influencia o movimento. Na aproximação linear esta força é proporcional ao deslocamento, como num oscilador harmônico. O modelo simplificado mostrado na Figura 8.4(b), consiste de um conjunto massa-mola, no 304 Materiais e Dispositivos Eletrônicos Figura 8.4: (a) Visão clássica do efeito de campo elétrico externo E sobre as cargas num átomo; (b) Modelo simplificado de átomo sob ação de campo elétrico. qual uma partı́cula de massa m e carga −e iguais as do elétron, está sob a ação da força do campo elétrico da radiação. Para um campo elétrico variável com freqüência ω, como em (8.22), a equação de movimento do elétron é, 2 dx dx m + ω02 x = − e E0 e−iωt +Γ (8.33) 2 dt dt onde x é o deslocamento do elétron em relação à sua posição de equilı́brio, ω0 é a freqüência de ressonância do oscilador e Γ é a taxa de amortecimento do movimento. O primeiro termo de (8.33) é a aceleração do elétron, que multiplicada pela massa é igual a soma das forças. O segundo termo é responsável pelo amortecimento do movimento, e corresponde a uma força contrária e proporcional à velocidade do elétron. Ele é semelhante ao segundo termo da Eq.(8.23), porém Γ não é o inverso do tempo de colisão pois no caso presente o elétron está ligado ao átomo. Finalmente, o terceiro termo é a força restauradora da mola que simula a ligação do elétron com o átomo. Sendo k a constante da mola, esta força é −kx, onde k = ω02 m. A solução de (8.33) no regime estacionário é −eE0 e−iωt . (8.34) x(t) = 2 m(ω0 − ω 2 − iωΓ) O deslocamento do elétron, dado por (8.34), produz no átomo um momento de dipolo elétrico p = −ex. Havendo no material N átomos por unidade de volume, a polarização (momento de dipolo elétrico por unidade de volume) resultante é P = −Nex. Lembrando a relação entre o vetor deslocamento, a polarização e o campo elétrico, que define a permissividade, D = 0 E + P ≡ ε 0 E , (8.35) Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 305 obtemos para a constante dielétrica na freqüência ω, ωp2 ε(ω) = 1 + 2 , ω0 − ω 2 − iωΓ sendo ωp2 = Ne2 /m0 . Note que o valor de ε nesta equação tende para 1 quando ω → ∞. Na verdade isto não ocorre, pois esta é apenas a contribuição de um elétron ligado. A contribuição de outros elétrons com freqüências de osciladores maiores faz com que a parte real de ε em altas freqüências seja maior que 1. Representando esta contribuição por ε∞ , podemos escrever a constante dielétrica em freqüências próximas de ω0 como, ωp2 . (8.36) ε(ω) = ε∞ + 2 ω0 − ω 2 − iωΓ A partir de (8.36) obtemos as partes real e imaginária da constante dielétrica, ωp2 (ω02 − ω 2 ) ε (ω) = ε∞ + 2 (8.37) (ω0 − ω 2 )2 + ω 2Γ2 ε (ω) = ωp2 ω Γ (ω02 − ω 2 )2 + ω 2 Γ2 . (8.38) As variações de ε e ε com a freqüência estão mostradas na Fig.8.5 para ωp = 0, 7 ω0 , Γ = 0, 05 ω0 e ε∞ = 2, 0. Veja que a parte real de ε(ω) é desprezı́vel em toda a faixa de freqüência, exceto nas vizinhanças da freqüência de ressonância ω0 . Como a parte imaginária ε (ω) está relacionada com a absorção óptica no material (Eqs.(8.7) e (8.14)), este resultado significa que só existe absorção em ω ≈ ω0 . Esta mesma conclusão é obtida com o tratamento quântico da interação da radiação com a matéria, sendo ω0 a separação de energia entre dois nı́veis quânticos do elétron. A representação gráfica da função que descreve ε (ω) é chamada forma de linha de absorção. Como para Γ ω0 , ε (ω) só é significativa em ω ≈ ω0 , podemos fazer ω0 + ω ≈ 2ω0 ≃ 2ω em (8.38) e reescrever ε (ω) na forma, ωp2 Γ/4ω0 πωp2 ε (ω) ≃ ≡ fL (ω) , (8.39) (ω0 − ω)2 + (Γ/2)2 2ω0 onde fL (ω) = Γ/2π (ω0 − ω)2 + (Γ/2)2 (8.40) 306 Materiais e Dispositivos Eletrônicos Figura 8.5: Partes real e imaginária de ε(ω) = ε (ω) + iε (ω) no modelo clássico de um elétron ligado com freqüência de ressonância ω0 , para ωp = 0, 7 ω0 , Γ = 0, 05 ω0 e ε∞ = 2, 0. é a função Lorentziana. A constante 2π usada na definição faz com que a área sob a curva seja normalizada, fL (ω)dω = 1. O valor máximo desta função ocorre em ω = ω0 , fL (ω0 ) = 2/πΓ, sendo portanto inversamente proporcional à taxa de amortecimento Γ. Por outro lado, a largura de linha, definida como a diferença entre as duas freqüências para as quais fL (ω) = fL (ω0 )/2, é precisamente Γ (Problema 8.7). Desta forma, quanto menor a taxa de amortecimento menor será a largura de linha e maior será o pico da absorção. Este mesmo resultado será obtido na próxima seção através do tratamento quântico da interação radiação-elétron ligado. É importante notar que ε (ω) tem a forma da derivada de ε (ω) em relação à freqüência. Isto não é apenas uma coincidência, é conseqüência de um resultado geral pelo qual ε (ω) é dado pela integral de uma função relacionada com (ω), e vice-versa. Essas equações integrais constituem as relações de Kramers-Kronig que valem para as partes real e imaginária de ε(ω), qualquer que seja o mecanismo da interação radiação-matéria. Finalmente, para encerrar esta seção, vamos achar as constantes ópticas de um material descrito pelo modelo clássico do elétron ligado. Fazendo σ = 0 e substituindo (8.7) em (8.6) obtemos equações biquadráticas para o ı́ndice de refração n e para o coeficiente de amortecimento κ, como mostrado no exemplo 8.1, 1 √ 2 (8.41) ε + ε + ε2 n2 = 2 Cap. 8 Materiais e Dispositivos Opto-Eletrônicos κ2 = √ 1 −ε + ε2 + ε2 2 307 (8.42) A Figura 8.6(a) mostra, graficamente, as funções n(ω) e κ(ω) obtidas de (8.37)-(8.42) com os mesmos parâmetros usados na Fig.8.5. Observe que o ı́ndice de refração é próximo de 1 em toda a faixa de freqüências, exceto nas vizinhanças da freqüência de ressonância, onde ele apresenta uma grande anomalia. Por outro lado o coeficiente de extinção, responsável pela atenuação da onda, é desprezı́vel em toda a faixa mas apresenta um pico em ω = ω0 . Finalmente, é importante notar que o ı́ndice de refração aumenta com a freqüência na região ω < ω0 , como evidenciado na curva n(λ) para o quartzo, mostrada na Fig.8.1(b). É isto que produz o fenômeno da dispersão em materiais transparentes. Isto ocorre porque a freqüência de transição eletrônica desses materiais está acima da faixa visı́vel. A partir de n e κ pode-se calcular a refletividade R do material usando a Eq.(8.21). O gráfico de R(ω) obtido com n(ω) e κ(ω) da Fig.8.6(a) está mostrado na Figura 8.6(b). A refletividade apresenta um pico em freqüência um pouco acima de ω0 e com uma linha mais larga que as de ε (ω) e κ(ω), porque nela também há uma contribuição importante da dispersão de n(ω). Note que num material real há várias transições eletrônicas com diferentes 3 2 1 0 0,6 Refletividade R Índice de refração 4 0,4 0,2 0 Figura 8.6: (a) Variação do ı́ndice de refração n e do coeficiente de extinção (ou amortecimento) κ com a freqüência com os mesmos parâmetros usados na Fig.8.5. (b) Refletividade calculada com a Eq.8.21. 308 Materiais e Dispositivos Eletrônicos freqüências, e portanto R(ω) apresenta vários picos. É um desses picos ocorrendo com energia próxima de 2 eV, que dá ao cobre a coloração alaranjada. Exemplo 8.3: Um material dielétrico tem uma linha de absorção devido a um fônon no infravermelho, com freqüência angular ω0 = 2 × 1014 s−1 , largura de linha Γ = 1013 s−1 e com ωp = 0, 7 ω0 . Sabendo que ε∞ = 2, 0, calcule o coeficiente de absorção e a refletividade do material para um feixe de infravermelho com freqüência igual a do pico de absorção. Inicialmente é preciso calcular as componentes real e imaginária da constante dielétrica. Usando (8.37), com ω = ω0 , vem ε = ε∞ = 2, 0. Usando (8.38), com ω = ω0 , vem, ε = ωp2 0, 72 × 2 × 1014 = 9, 8 . = ω0 Γ 1013 O ı́ndice de refração n e o coeficiente de extinção κ são calculados com (8.41) e (8.42) √ 1/2 1 = 2, 45 n = √ 2 + 4 + 96 2 √ 1/2 1 = 2, 0 κ = √ −2 + 4 + 96 2 O coeficiente de absorção é dado por (8.14), α= 2 × 2 × 1014 × 2, 0 = 2, 67 × 106 m−1 3 × 108 A refletividade é dada por (8.21), R= 6, 10 (2, 45 − 1)2 + 2, 02 = 0, 38 . = (2, 45 + 1)2 + 2, 02 15, 90 Note que os valores obtidos para ε, n, κ e R coincidem com os valores das Figuras 8.5 e 8.6 em ω = ω0 . Observe na Figura 8.6 que o pico em R não ocorre exatamente em ω0 . 8.3 Teoria Quântica da Interação Radiação-Matéria Na seção anterior fizemos a suposição de que os elétrons se comportam como partı́culas clássicas, ligadas ao átomo por uma força do tipo de um oscilador harmônico. Este modelo levou ao resultado de que a absorção óptica ocorre quando a freqüência do campo de radiação é aproximadamente igual a do Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 309 oscilador harmônico. Sabemos, entretanto, que na mecânica quântica o elétron é descrito por uma função de onda, cujo módulo ao quadrado representa a probabilidade de encontrá-lo numa certa posição. É preciso agora entender como a natureza quântica do elétron influencia a absorção da luz pela matéria. Como veremos a seguir, o resultado quântico da interação da luz com um sistema de dois nı́veis é consistente com o do modelo clássico. Entretanto, há vários aspectos desta interação que não estão contidos no modelo clássico e que são essenciais para compreender certas propriedades ópticas de materiais, como por exemplo as transições interbanda e a emissão estimulada de luz. 8.3.1 Transições entre Nı́veis Discretos Vamos considerar inicialmente um sistema no qual um elétron pode ocupar estados com nı́veis discretos de energia. O sistema pode ser um elétron num poço de potencial infinito, ou num átomo por exemplo. Como vimos no Capı́tulo 3, se o potencial do elétron não varia no tempo, ele pode ocupar estados estacionários caracterizados por um número quântico n, descritos por funções de onda, i (8.43) ψ(r, t) = ψn (r) e− En t . Neste caso o valor esperado de qualquer operador não varia no tempo, em virtude da definição (3.14). O elétron permanece nesse estado indefinidamente e sua energia é exatamente En , constante. Vejamos o que acontece se o elétron estiver num estado dado pela combinação linear de dois estados estacionários, como por exemplo, ψ(r, t) = ψ1 e− E1 t + ψ2 e− E2 t i i . (8.44) Esta equação pode ser reescrita na forma ψ(r, t) = e− E1 t (ψ1 + ψ2 e−iω12 t ) i , (8.45) onde ω12 = (E2 − E1 )/. Com a definição (3.14) pode-se escrever o valor esperado de um operador qualquer F no estado (8.45) como ∗ −iω12 t dV + ψ2∗ F ψ1 eiω12 t dV, < F (t) > = < F >1 + < F >2 + ψ1 F ψ2 e onde < F >1 e < F >2 são os valores esperados de F nos estados estacionários 1 e 2, que são constantes. Se F é um operador hermiteano ψ2∗ F ψ1 dV = Materiais e Dispositivos Eletrônicos 310 ψ1∗ F ψ2 dV ∗ = |F12 |eiϕ . Neste caso < F (t) > = < F >1 + < F >2 + 2|F12 | cos(ω12 + ϕ). (8.46) Vemos então que se o elétron está num estado que é uma combinação de estados com energias E1 e E2 , o valor esperado de um operador varia harmonicamente no tempo com freqüência angular ω12 = (E2 − E1 )/. Pode-se mostrar, sem dificuldade, que a probabilidade de encontrar o elétron no estado 1, ou no estado 2, também varia harmonicamente no tempo com freqüência ω12 . Dizemos que o elétron sofre transições de 1 para 2 ou vice-versa. Para que um elétron que esteja inicialmente no estado 1, ou em 2, passe a sofrer transições entre 1 e 2, é preciso ter uma ação externa que varia no tempo com freqüência ω ≃ ω12 . Usando a mecânica quântica, mostraremos a seguir como calcular a probabilidade de ocorrência dessas transições. Consideremos um elétron num átomo, ou num poço de potencial qualquer, submetido a uma perturbação externa dependente do tempo. Esta perturbação pode ser a força do campo elétrico de uma onda eletromagnética, por exemplo. A equação de Schroedinger (3.24) para o elétron é então, ∂ψ , (8.47) [H0 + H (t)] ψ = i ∂t onde H0 é o Hamiltoniano constante correspondente ao poço de potencial e H (t) representa a interação variável no tempo devido à perturbação externa. H , pois a interação que mantém o elétron no poço é muito Normalmente H0 maior que a perturbação externa. Como já sabemos que o efeito da perturbação é provocar transições entre os estados eletrônicos, procuramos soluções para (8.47) na forma de uma expansão em auto-funções ψn do Hamiltoniano não perturbado H0 , que consideramos conhecidas, na forma, Ψ(t) = an (t) ψn e−iEn t/ . (8.48) n Para obter os coeficientes an (t) que determinam a função de onda, substituimos (8.48) em (8.47) e usamos a equação H0 ψn = En ψn . dan En −iEn t/ − i an ψn e−iEn t/ an [En + H (t)]ψn e = i . dt n n Com o cancelamento dos termos em En a equação fica, dan ψn e−iEn t/ = i an H (t) e−iEn t/ dt n n . Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 311 ∗ +iEm t/ Multiplicando os dois lados à esquerda por ψm e , integrando no volume e usando (3.13) que exprime a condição de normalização e ortogonalidade das autofunções obtemos para os coeficientes a expansão, 1 dam i(Em −En )t/ ∗ = an (t) e H (t) ψn dV . (8.49) ψm dt i n Como nenhuma aproximação foi feita até o momento, esta equação é inteiramente equivalente à equação de Schroedinger dependente no tempo. Ela é a base da formulação matricial da mecânica quântica. Agora vamos considerar que a perturbação é produzida por um campo harmônico com freqüência ω, de modo que, (8.50) H (t) = H e−iωt . A Eq.(8.49) toma a forma 1 dam = an (t) Hmn ei(ωmn −ω)t dt i n , (8.51) onde ωmn = (Em − En )/ e Hmn é o elemento de matriz do operador H entre os estados m e n, definido por ∗ H ψn dV . (8.52) Hmn = ψm A Eq.(8.51) pode ser utilizada para calcular a evolução no tempo do estado do sistema devido à perturbação H e−iωt . Vamos supor que um elétron está inicialmente num estado discreto n de um Hamiltoniano H0 , quando uma pequena perturbação externa do tipo (8.50) é aplicada. A partir de (8.51) pode-se calcular o coeficiente correspondente a um estado m num instante t e portanto a probabilidade do elétron ser encontrado neste estado, que é dada por |am |2 . Pode-se mostrar então (Apêndice A) que a probabilidade por unidade de tempo do elétron sofrer uma transição para um conjunto de estados m muito próximos uns dos outros é dada por 2π |Hmn |2 D(Em = En + ω) , (8.53) Wmn = onde D é a densidade de estados com energia Em = En + ω. A Eq.(8.53) é chamada a regra de ouro da teoria de perturbação. No caso da transição entre dois nı́veis de energia alargados pelo efeito de amortecimento, a densidade de estados é dada por uma forma de linha Lorentziana. No caso de transição entre bandas, a densidade de estados tem a forma daquela estudada no Capı́tulo 4. 312 8.3.2 Materiais e Dispositivos Eletrônicos Absorção de Luz e Luminescência Vamos utilizar a teoria de perturbação para calcular os efeitos da interação de uma onda eletromagnética com um sistema de átomos. Inicialmente consideramos um conjunto de N átomos (por unidade de volume) independentes, com nı́veis de energia E1 , E2 , E3 , etc. Esta é a situação que ocorre em gases ou em transições entre nı́veis discretos em sólidos. Quando o sistema está em equilı́brio térmico numa certa temperatura T , os elétrons sofrem transições de um nı́vel para outro devido às interações com fônons térmicos, no caso de sólidos, ou as colisões atômicas, no caso de gases. No entanto, enquanto os elétrons em um certo número saem de um determinado nı́vel, outros elétrons em igual número chegam naquele nı́vel (em outros átomos), de modo a manter o equilı́brio térmico do sistema. É possı́vel mostrar que, no equilı́brio térmico, as populações Ni e Nj dos nı́veis Ei e Ej (Ni é o número de átomos por unidade de volume com elétrons no nı́vel Ei ) obedecem à relação, Ni e−Ei /kB T = −Ej /k T = e−(Ei −Ej )/kB T B Nj e . (8.54) Esta é a distribuição de Boltzmann, que se aplica a um sistema de partı́culas distinguı́veis, que no caso presente são os diferentes átomos do sistema. De acordo com a Eq.(8.54), a população de um certo nı́vel i diminui exponencialmente com o aumento da energia Ei ou com a diminuição da temperatura. Este é um resultado esperado, porque é exatamente a excitação térmica que leva os elétrons do estado fundamental para nı́veis de maior energia. A presença de um campo eletromagnético no sistema tende a produzir transições entre nı́veis de energia cuja separação esteja próxima da energia dos fótons ω. A Eq.(8.53) mostra que a probabilidade de transição induzida pelo campo do nı́vel m para o nı́vel n é igual a de n para m. Desta forma, a tendência do campo é de igualar as populações Nn e Nm . Entretanto, esta igualdade só ocorreria se a intensidade do campo fosse suficientemente alta para vencer o papel da excitação térmica. Este efeito é importante no caso de lasers. Nesta seção vamos supor que o campo é pequeno e que o equilı́brio térmico não é perturbado. Vamos calcular as constantes ópticas de um sistema de átomos considerando, para simplificar, que eles têm apenas dois nı́veis, E1 e E2 (E2 > E1 ), com populações N1 e N2 . Quando um campo elétrico E = ŷ E e−iωt Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 313 2 1 (a) (b) Figura 8.7: Transições eletrônicas em sistema de dois nı́veis, por absorção (a) e por emissão (b) de fótons. é aplicado ao sistema, os elétrons ficam sujeitos a uma interação com energia −eφ(y) = eEy y, que resulta num termo de perturbação do Hamiltoniano dado por H (t) = e E y e−iωt ≡ −E py e−iωt , onde py = −ey é a componente y do operador momento de dipolo elétrico. De acordo com a regra de ouro (8.53) as probabilidades de transição, por unidade de tempo, para o sistema passar do nı́vel 1 para o nı́vel 2, ou vice-versa, são, W12 = W21 = 2π 2 2 E p12 D(E2 − E1 = ω) , (8.55) onde p12 é o elemento de matriz do operador py entre os estados 1 e 2 (omitimos o ı́ndice y para simplificar a notação) Quando há N1 elétrons no nı́vel inferior (por unidade de volume), a potência absorvida do campo eletromagnético pelo sistema é N1 W12 ω, pois N1 W12 é o número de fótons absorvidos por unidade de tempo e volume. Por outro lado, N2 W21 ω é a potência emitida pelos elétrons que passam do nı́vel 2 para o nı́vel 1 pela emissão de fótons. Os processos de absorção e emissão de fótons por transições eletrônicas num sistema de dois nı́veis estão ilustrados na Fig.8.7. A potência lı́quida por unidade de volume absorvida pelo sistema é então P = 2π (N1 − N2 ) E 2 p212 D(ω) ω . Note que a potência absorvida por unidade de volume pode ser identificada como −dI/dx, uma vez que a intensidade da onda I é a potência transmitida Materiais e Dispositivos Eletrônicos 314 por unidade de área. Assim sendo, usando (8.11) e (8.14) na relação dI/dx = −P e observando que D(ω) = D(ω)/, obtemos o coeficiente de extinção κ= 2π (N1 − N2 ) p212 D(ω) n0 . (8.56) Considerando para D(ω) uma forma de linha Lorentziana fL (ω) dada por (8.40), a substituição desta equação em (8.7) fornece a parte imaginária da constante dielétrica ε (ω) = 2 Γ (N1 − N2 ) p212 0 (ω21 − ω)2 + (Γ/2)2 , (8.57) onde ω21 = (E2 −E1 )/. Esta equação tem a mesma forma de (8.39) com ω21 no lugar ω0 e 2(N1 −N2 )p212 /0 lugar de ωp2 /4ω0 (veja Problema 8.8). Isto mostra que o resultado clássico é consistente com o quântico, como foi antecipado. Entretanto, há detalhes importantes do resultado quântico que não aparecem no tratamento clássico. Da Eq.(8.57) concluimos que para haver absorção de energia em transições eletrônicas entre dois nı́veis E1 e E2 é preciso que: 1) A freqüência da radiação seja ω ≃ (E2 − E1 )/; 2) A população do nı́vel inferior seja maior que a do nı́vel superior, ou seja, N1 − N2 > 0; 3) O elemento de matriz p12 do operador momento de dipolo elétrico entre os estados dos dois nı́veis seja diferente de zero. Esta última condição dá origem às regras de seleção para transição de dipolo elétrico que determinam quais transições são possı́veis por absorção ou emissão de fótons. Como foi mencionado na seção 3.4, as regras de seleção para transições no átomo de hidrogênio com campo linearmente polarizado são ∆ = ±1 e ∆m = 0 (Problema 8.10). O processo de absorção de luz que acabamos de tratar, ocorre quando a radiação eletromagnética interage com um conjunto de átomos produzindo transições de nı́veis quânticos de menor energia para outros nı́veis de maior energia. Outro processo óptico muito importante é a emissão espontânea de radiação, que ocorre quando os átomos passam de um estado excitado para outro estado de menor energia, mesmo sem a presença de radiação externa. A probabilidade por unidade de tempo para haver emissão espontânea com transição de nı́vel 2 para o nı́vel 1, como na Figura 8.7(b), também é dada pela Equação (8.55). Porém, neste caso o campo E que aparece em (8.55) é aquele associado às flutuações quânticas do estado fundamental de zero fótons. Havendo um momento de dipolo elétrico entre os estados 1 e 2, a transição de 2 para 1 ocorre com a emissão de um fóton, sendo chamada de transição −1 . Se radiativa. O tempo caracterı́stico desta transição é dado por τR = W12 Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 315 o momento de dipolo entre os dois estados for nulo, a transição de 2 para 1 também pode ocorrer, mas neste caso, em vez de haver emissão do fóton, há emissão de fônon ou de alguma outra excitação elementar. Este tipo de transição é chamada não-radiativa. O processo pelo qual os átomos são colocados em estados excitados, e subseqüentemente decaem por meio de transições radiativas, é chamado de luminescência. Dentre os vários mecanismos que produzem luminescência em materiais, os mais importantes são a fotoluminescência e a eletroluminescência. A fotoluminescência é aquela na qual os átomos são levados para estados excitados por meio da absorção de fótons de maior energia. Este processo é importante em lasers de sólidos com impurezas, que serão apresentados na Seção 8.6.2. A eletroluminescência é aquela na qual a emissão de luz é causada por um estı́mulo elétrico, como a passagem de uma corrente elétrica, como ocorre nos diodos emissores de luz e nos lasers de diodo, ou pela incidência de um feixe de elétrons, ou com a aplicação de um campo elétrico intenso. 8.3.3 Absorção e Emissão de Luz em Isolantes e Semicondutores No caso de cristais, o tratamento quântico da interação radiação-matéria deve levar em conta o fato de que os elétrons são descritos por funções de onda com vetor de onda k. Além disso eles têm energia E(k) na forma de bandas e não em nı́veis discretos. A aplicação da regra de ouro (8.53) para cristais com bandas no esquema reduzido à primeira zona de Brillouin mostra que as transições eletrônicas entre bandas devem conservar energia e momentum. No caso de transições produzidas apenas por fótons tem-se Ef − Ei = ±ω kf − ki = ±k , (8.58) (8.59) onde Ef e Ei são as energias do elétron nos estados final e inicial, respectivamente, kf e ki são os vetores de onda correspondentes, ω e k são a freqüência e o vetor de onda do fóton absorvido (Ef > Ei ) ou emitido (Ef < Ei ) na transição. Para fótons da região visı́vel k ∼ 105 cm−1 , sendo portanto desprezı́vel em relação ao valor da fronteira da zona de Brillouin, de modo que a transição entre bandas ocorre com kf ≃ ki. A Fig.8.8 mostra duas transições de absorção entre as bandas de valência e de condução num isolante ou semicondutor de gap direto. A transição com energia mı́nima é aquela que ocorre 316 Materiais e Dispositivos Eletrônicos Figura 8.8: Absorção de fótons em semicondutor de gap direto. O fóton de mı́nima energia que é absorvido tem freqüência ωg = Eg /. no centro da zona, kf = ki = 0, e com fótons de energia igual ao gap do semicondutor, ωg = Eg . Fótons com energia menor que Eg atravessam o semicondutor sem absorção por transição entre as bandas. Por outro lado, fótons com ω > ωg são facilmente absorvidos porque há um grande número de estados eletrônicos com kf = ki > 0. Usando a Eq.(8.53) para calcular a probabilidade de transição entre as bandas de valência e de condução, com densidades de estados dadas por (5.12) e (5.13), pode-se mostrar que o coeficiente de absorção no semicondutor de gap direto varia com a freqüência na forma, α(ω) ∼ (ω − Eg )1/2 /ω , (8.60) para ω ≥ Eg e α(ω) = 0 para ω < Eg . Este resultado, ilustrado na Fig.8.9, mostra que o coeficiente de absorção aumenta rapidamente com ω acima do valor crı́tico ωg = Eg /. A situação em semicondutores de gap indireto é mais complicada. Como ilustrado pela seta na Fig.8.10, a transição de um elétron do topo da banda de valência para o mı́nimo da banda de condução num semicondutor como silı́cio, requer uma grande mudança no vetor de onda. Isto não pode ser feito somente com a absorção de um fóton pois este tem k ≃ 0. Esta transição pode ocorrer com a absorção de um fóton com energia ω e vetor de onda desprezı́vel (k ≃ 0) acompanhada da absorção de um fônon de energia Ω e Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 317 Figura 8.9: Variação do coeficiente de absorção com a freqüência do fóton em semicondutor de gap direto. momentum k, ou da emissão de um fônon com energia Ω e momentum −k. Neste caso, as equações de conservação de energia e momentum são Ef − Ei = ω ± Ω (8.61) kf − ki = k (8.62) , onde os sinais + e − em (8.61) correspondem, respectivamente, aos processos com absorção e emissão de fônon. Note que no caso do processo com absorção de fônon, a energia mı́nima do fóton necessária para produzir a transição é Eg −Ω, enquanto no caso do processo com emissão de fônon a energia mı́nima é Eg + Ω. Entretanto, os semicondutores de gap indireto também podem ter uma transição direta (k ≃ 0) para um mı́nimo relativo da banda de condução, com energia Eg + E , como ilustrado na Fig.8.10. Como a transição indireta envolve três excitações elementares, ela tem probabilidade de ocorrência menor que a direta, na qual os fônons não participam. Por esta razão, a combinação dos processos indireto e direto resulta num coeficiente de absorção que varia com a freqüência como ilustrado na Fig.8.11. Sendo a energia de fônons (Ω ∼ 0, 05-0,1 eV) muito menor que os valores tı́picos da energia do gap (Eg ∼ 1 eV), em primeira aproximação a energia crı́tica abaixo da qual o semicondutor intrı́nseco (ou isolante) não absorve fótons por transição interbanda é Eg . Por outro lado, fótons de energia maior que Eg são fortemente absorvidos resultando na geração de pares elétron-buraco. Este processo possibilita o uso de semicondutores em detetores de radiação eletromagnética. O processo inverso pelo qual fótons são emitidos 318 Materiais e Dispositivos Eletrônicos Figura 8.10: Transições eletrônicas do topo da banda de valência para dois mı́nimos da banda de condução em semicondutor de gap indireto como Si. A transição indireta envolve fônons e tem energia Eg . A transição direta tem energia Eg + E . na recombinação de pares elétron-buraco, é chamado luminescência. Ele é a base da operação dos diodos emissores de luz e dos lasers semicondutores. A Tabela 8.1 apresenta as energias do gap e os comprimentos de onda correspondentes para vários semicondutores importantes, indicando também a natureza do gap, direto (d) ou indireto (i). Vê-se na tabela que existem semicondutores para fabricar diodos emissores de luz em diversos comprimentos de onda. Além disso, através da combinação de compostos diversos na forma de ligas, como Gax A1−x As, é possı́vel obter materiais com gaps variando continuamente em Figura 8.11: Variação do coeficiente de absorção com a freqüência em semicondutor de gap indireto. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos Semicondutor Si Ge AN AAs GaN GaP GaAs InP InAs InSb CdS CdTe 319 Gap E (eV) λ (µm) i i i i d i d d d d d d 1,12 0,67 5,90 2,16 3,40 2,26 1,43 1,35 0,35 0,18 2,53 1,50 1,11 1,88 0,21 0,57 0,36 0,55 0,86 0,92 3,54 6,87 0,49 0,83 Tabela 8.1: Energias do gap e comprimentos de onda correspondentes de semicondutores importantes à temperatura ambiente [Wilson e Hawkes]. extensas faixas das regiões visı́vel e infravermelho. Os processos de absorção e emissão de luz interbanda em isolantes são iguais aos dos semicondutores. Entretanto, como a energia do gap nos isolantes é da ordem de 10 eV, os fótons da região visı́vel, não têm energia suficiente para produzir transições interbanda. Esta é a razão pela qual cristais isolantes, como diamante, safira, e cloreto de sódio, por exemplo, são quase inteiramente transparentes à luz visı́vel. Para ilustrar as propriedades ópticas mais importantes dos isolantes, mostramos na Figura 8.12 espectros de transmissão da safira, a forma cristalina do A2 O3 . A Fig. 8.12(a) mostra a transmissão em função do comprimento de onda, representado numa escala logarı́tmica para ressaltar toda a faixa de transparência. Ele mostra uma transmissão acima de 80% na faixa de comprimento de onda entre 200 nm (energia de 6,2 eV) e 2500 nm (0,5 eV), estendendo-se do infravermelho ao ultravioleta próximo e abrangendo toda a região visı́vel (400 a 700 nm). A depressão na transmissão na forma de um pico negativo em torno de λ = 3000 nm e a forte diminuição em λ > 6000 nm, resultam da absorção da radiação infravermelha pelos fônons ópticos da safira. Por outro lado, a queda na transmissão na região ultravioleta, em λ < 200 nm, 320 Materiais e Dispositivos Eletrônicos Figura 8.12: Espectros de transmissão medidos em amostras de A2 O3 . (a) Cristal puro, chamado safira, em escala logarı́tmica de comprimento de onda, para mostrar toda a faixa de transparência; (b) comparação dos espectros de safira (A2 O3 puro) e de rubi (A2 O3 com 0,05% de Cr3+ ). é devida à absorção pelas transições interbanda produzidas pelos fótons com energia ω > 6 eV. Na faixa de transparência não há transições para absorver os fótons e portanto o coeficiente de absorção é desprezı́vel. Nesta situação a componente √ imaginária do ı́ndice de refração é desprezı́vel e a componente real é n = ε, que no caso da safira tem valor n = 1, 77. Com este valor de n, a refletividade, dada por (8.21) é R = 0, 077, enquanto a transmissão em uma superfı́cie é T = (1 − R) = 0, 923. Ocorre que o espectro mostrado na Figura 8.12 foi medido numa amostra na forma de uma placa fina, que reflete a onda nas duas superfı́cies. Por esta razão, a transmissão é dada por (1 − R)2 = 0,85, que é o valor observado na Figura 8.12. A presença de uma pequena quantidade de impurezas de Cr3+ na safira produz duas bandas de forte absorção, mostradas na Figura 8.12(b). A banda de maior energia está no azul, centrada em λ = 400 nm (3,1 eV), e a de menor energia está na região verde-amarelo, centrada em λ = 550 nm (2,25 eV). A presença destas bandas faz com que o cristal de Cr3 :A2 O3 tenha uma cor vermelha, como será explicado na próxima seção. Este cristal é o rubi, encontrado na natureza como uma pedra preciosa. O rubi também pode ser crescido sinteticamente por meio das técnicas apresentadas no Capı́tulo 1. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 321 Exemplo 8.4: Uma amostra de CdTe tem a forma de uma placa de faces paralelas, de espessura 0,3 µm com camadas anti-refletoras nas duas faces. Calcule a transmissão de um feixe de luz de laser de He-Ne, comprimento de onda 632,8 nm que incide normalmente sobre a placa. No Exemplo 8.1 calculamos o coeficiente de absorção do CdTe no comprimento de onda λ1 = 500 nm, tendo obtido α(ω1 ) = 9,55×106 m−1 . Como CdTe é um semicondutor de gap direto, a variação do coeficiente de absorção com a energia nas proximidades da energia do gap é dada pela Equação (8.60). Então, o coeficiente de absorção no comprimento de onda λ2 = 632,8 nm pode ser calculado com, ( ω2 − Eg )1/2 ω1 ( ω2 − Eg )1/2 λ2 α(ω2 ) = = 1/2 α(ω1 ) ( ω1 − E g ) ω2 ( ω1 − Eg )1/2 λ1 A energia do gap de CdTe dado na Tabela 8.1 é Eg = 1, 5 eV. As energias dos fótons correspondentes aos dois comprimentos de onda são, ω2 = hc 6, 63 × 10−34 × 3 × 108 = = 3, 14 × 10−19 J λ2 632, 8 × 10−9 ω2 = 3, 14 × 10−19 = 1, 96 eV 1, 6 × 10−19 ω1 = 1, 96 × 632, 8 = 2, 48 eV 500 Logo α(ω2 ) = 9, 55 × 106 (1, 96 − 1, 5)1/2 632, 8 = 8, 28 × 106 m−1 (2, 48 − 1, 5)1/2 500 Como não há reflexão nas superfı́cies, a transmissão é dada por T = e−αd = e−8,28×0,3 = 0, 084 . Portanto a transmissão é 8,4 %. 8.3.4 Absorção e Emissão de Luz em Materiais com Impurezas Em cristais semicondutores ou isolantes contendo impurezas, a presença de nı́veis discretos de energia entre as bandas de valência e de condução dá origem a importantes processos de absorção e emissão de fótons. A Figura 8.13 ilustra processos de emissão em semicondutores tipo n e tipo p. Em (a) um elétron da banda de condução passa para um nı́vel vazio de impureza aceitadora emitindo 322 Materiais e Dispositivos Eletrônicos Figura 8.13: Ilustração de dois tipos de recombinação elétron-buraco envolvendo nı́veis de impureza com emissão de fótons: (a) Impureza aceitadora em semicondutor tipo p; (b) Impureza doadora em semicondutor tipo n. um fóton de energia Ec − Ea . Em (b) um elétron no nı́vel de impureza doadora recombina com um buraco da banda de valência emitindo fóton de energia Ed − Ev . Apesar do número de impurezas num sólido ser muito pequeno comparado com o dos ı́ons de cristal, os processos de emissão e absorção de fótons envolvendo nı́veis de impurezas são muito importantes, especialmente nos semicondutores de gap indireto. Isto é devido ao fato de que a função de onda de um elétron ligado a uma impureza tem uma localização espacial ∆x da ordem da distância interatômica a. Esta incerteza na posição do elétron resulta numa incerteza no seu momentum ∆p, dada por (2.46), ∆x ∆p ≥ /2. Sendo ∆x ∼ a, a incerteza no vetor de onda do elétron é ∆k ∼ 1/2a, que cobre uma larga faixa da zona de Brillouin. Em conseqüência, as transições envolvendo impurezas podem ocorrer por emissão ou absorção de fótons, sem a necessidade da participação dos fônons para ajudar na conservação de momentum. Isto torna estas transições muito mais eficientes do que as transições interbanda nos semicondutores de gap indireto. Devido à facilidade dos elétrons e buracos se recombinarem por este processo de emissão de fótons, as impurezas são chamadas de centros de recombinação. As transições entre nı́veis discretos também são muito importantes em isolantes contendo impurezas de certos elementos, especialmente os do grupo de transição 3d e as terras raras. Como veremos no próximo capı́tulo, nestes elementos a formação dos ı́ons das impurezas deixa uma camada eletrônica incompleta, que freqüentemente tem nı́veis de energias dentro do gap do isolante. Esta é a origem das bandas de absorção que aparecem em cristais de A2 O3 (safira) com impurezas de Cr3+ , mostradas na Figura 8.12(b). A presença das Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 323 Figura 8.14: Nı́veis de energia e transições importantes em Cr3+ :A2 O3 , o rubi. impurezas introduz no gap dois conjuntos numerosos de nı́veis que formam as bandas 4 F1 e 4 F2 , além dos nı́veis discretos 2 E e 2 F2 , mostrados na Figura 8.14. Quando o cristal é iluminado com luz branca, ocorrem transições do estado fundamental 4 A2 para as bandas 4 F1 e 4 F2 por absorção de fótons. Essas transições são responsáveis pelas bandas de absorção da Figura 8.12(b). Subseqüentemente os elétrons da banda 4 F2 decaem rapidamente para o nı́vel 2 E, por transições não-radiativas, e daı́ voltam para o estado 4 A2 por transições radiativas com a emissão de fótons de comprimento de onda 694,3 nm. Desta forma o cristal absorve luz branca e emite luz vermelha, dando ao rubi sua cor vermelho vivo. Este é o processo de fotoluminescência, no qual se baseia o laser de rubi, que foi pioneiro dos lasers, descoberto em 1960. 8.4 Fotodetetores Fotodetetores são dispositivos que convertem luz num sinal elétrico. Existem vários fenômenos que possibilitam a fabricação de um fotodetetor. O primeiro a ter importância tecnológica foi o efeito fotoelétrico, descoberto no final do século XIX e estudado no Capı́tulo 2. Ele é a base da operação das tradicionais células fotoelétricas, feitas de um bulbo a vácuo contendo um fotocatodo e um anodo, aos quais é aplicada uma tensão externa (positivo no anodo). Quando os fótons incidem no fotocatodo, os elétrons emitidos pelo efeito fotoelétrico são acelerados para o anodo produzindo uma corrente elétrica. Isto constitui uma célula fotoelétrica simples. Com a colocação de eletrodos entre o fotocatodo e o anodo é possı́vel multiplicar o número de elétrons e amplificar a corrente. Este é o princı́pio de funcionamento das válvulas fotomultiplicadoras, que são 324 Materiais e Dispositivos Eletrônicos dispositivos extremamente sensı́veis. Atualmente existem válvulas fotomultiplicadoras para aplicações cientı́ficas que detetam a radiação contando fótons individualmente, em nı́veis de algumas contagens por segundo. Assim como ocorreu na eletrônica, o desenvolvimento dos fotodetetores e dos fotoemissores de semicondutor possibilitou a substituição das válvulas e das lâmpadas a vácuo e deu um enorme impulso à opto-eletrônica. Os fotodetetores mais utilizados atualmente nas regiões visı́vel e infravermelho próximo são os fotodiodos e os foto-resistores de semicondutor. Estes dispositivos não operam no infravermelho médio ou distante, pois os fótons não têm energia suficiente para produzir pares elétron-buraco. Nessas regiões utiliza-se fotodetetores térmicos, nos quais a absorção da luz produz um aquecimento no elemento sensor e varia sua resistência elétrica. Nesta seção estudaremos apenas os foto-resistores, os fotodiodos e os sensores de imagem CCD, que são os fotodetetores mais importantes para a opto-eletrônica. Nestes dispositivos, o mecanismo fundamental de conversão de luz em corrente elétrica é a geração de pares elétron-buraco por absorção de fótons. Este processo provoca uma diminuição na intensidade da luz à medida que esta penetra no material. Sendo α o coeficiente de absorção do material na freqüência da luz, a variação da intensidade ao longo da direção x de penetração é dada pela Eq.(8.13), I(x) = I0 e−αx onde I0 é a intensidade da radiação na superfı́cie. Como a intensidade cai exponencialmente com a distância, para assegurar que todos os fótons incidentes sejam absorvidos, é preciso que a espessura d do material seja muito maior que α−1 . A Figura 8.15 mostra a variação do coeficiente de absorção com o comprimento de onda para vários semicondutores importantes. Em geral procura-se trabalhar com materiais com α ∼ 106 m−1 na faixa de operação do dispositivo. Isto assegura que a quase totalidade dos fótons é absorvida numa distância da superfı́cie de apenas alguns µm. Com esta condição vê-se que os melhores materiais para fotodeteção na região visı́vel são Si e GaAs. Nos comprimentos de onda empregados em comunicações ópticas, λ = 1, 3 µm e 1,5 µm, utiliza-se Ga0,3 In0,7 As0,6 P0,4 e Ga0,5In0,5 As respectivamente. Considerando que o semicondutor tem espessura tal que toda a radiação é absorvida, a taxa de criação de pares elétron-buraco é determinada pela intensidade inicial I0 da luz. Logo, o número de fótons absorvidos por unidade de tempo e de área é dado por (8.12), Φ = I0 /ω. Na realidade, sempre existe algum processo de absorção que não resulta em criação de pares elétron-buraco. Define-se a eficiência quântica de conversão η, como a razão entre o número Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 325 Coeficiente de absorção (m–1) 107 Ga0,5In0,5As GaAs 106 Ge 10 5 104 103 0,4 Ga0,3In0,7As0,6P0,4 CdS Si 0,6 0,8 1,0 1,2 1,4 1,6 Comprimento de onda (mm) 1,8 Figura 8.15: Variação do coeficiente de absorção α com o comprimento de onda para vários semicondutores [Wilson e Hawkes]. de pares produzidos e o número de fótons absorvidos. Assim, o número de pares criados por unidade de tempo e de área é ηI0 /ω. Portanto, a taxa de geração de portadores, definida como o número de pares criados por unidade de volume e por unidade de tempo é g= ηI0 ωd , (8.63) sendo d a espessura do semicondutor. Como os elétrons e buracos são criados aos pares, a variação δn na concentração de elétrons devido à radiação é igual à variação na concentração de buracos, δp = δn. As taxas de variação no tempo dessas concentrações são então ∂δn ∂δp = =g ∂t ∂t . (8.64) Esta equação mostra que se a intensidade da luz incidente no semicondutor for constante e se não houver qualquer outro mecanismo além da geração de pares elétron-buraco, o número de portadores crescerá indefinidamente, linearmente no tempo. Na realidade, sempre que as concentrações saem da situação de equilı́brio, ocorrem mecanismos de recombinação que tendem a restaurar o equilı́brio. A taxa com a qual os pares são destruı́dos é determinada pelo tempo de recombinação dos portadores minoritários, τp ou τn , dependendo 326 Materiais e Dispositivos Eletrônicos do tipo do semicondutor. Usando τr para representar este tempo, a taxa de recombinação é dada pela razão entre o excesso de portadores minoritários, δp ou δn, e o tempo τr . Sendo δp = δn, a taxa de recombinação é r= δn δp = τr τr . (8.65) Em regime estacionário r = g, de modo que as concentrações de elétrons e de buracos gerados pela luz, por unidade de tempo, são dadas por δn = δp = g τr = η I0 τr ωd . (8.66) Esta expressão determina o número de portadores criados nos fotodetetores de semicondutor, que serão apresentados a seguir. 8.4.1 Foto-resistores Fotocondutividade é o fenômeno pelo qual a condutividade de um material varia quando a intensidade da luz que incide sobre ele é alterada. A fotocondutividade é a base de funcionamento do fotodetetor mais simples que existe, o foto-resistor. Ele é também chamado de célula ou dispositivo de fotocondução, ou simplesmente LDR (das iniciais de Light Dependent Resistor). A estrutura mais simples de um LDR é constituı́da de uma pequena placa de um semicondutor intrı́nseco, ou com uma dopagem muito pequena, tendo nas extremidades dois eletrodos metálicos para a aplicação de uma tensão externa, como ilustrado na Figura 8.16. Na ausência de luz a resistência do LDR é grande porque o número de portadores é pequeno. Quando ele é iluminado o número de portadores aumenta por causa da criação de pares elétron-buraco. Isto pode fazer a resistência diminuir muito em relação ao seu valor inicial, o que resulta num grande aumento da corrente entre os eletrodos. Para calcular o efeito da luz sobre a corrente utilizamos a Eq.(5.52) para a condutividade, σ = n e µn + p e µp . A incidência da radiação produz uma variação nas concentrações dos portadores dada por (8.66), o que resulta num aumento da condutividade dado por: (8.67) ∆σ = g τr e (µn + µp ) . Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 327 Figura 8.16: Estrutura simples de um foto-resistor, ou LDR. Se a tensão nos eletrodos da placa for V , a variação na densidade de corrente será ∆J = ∆σV /. Portanto, a variação na intensidade de corrente será bd (8.68) g τr e (µn + µp )V . ∆I = É comum definir o ganho da fotocondutividade como a razão entre a variação de corrente devida à variação da condutividade, produzida pela tensão externa dada por (8.68), e a corrente correspondente aos pares elétron-buraco gerados pela luz. Como esta última é a carga total dos elétrons gerada pela radiação por unidade de tempo, o ganho é, G= ∆I egbd . Usando (8.68) nesta expressão, obtemos para o ganho G= τr (µn + µp )V 2 . (8.69) Este resultado mostra que o ganho aumenta com o valor da tensão aplicada e com a diminuição da distância entre os eletrodos. Evidentemente, os valores de µn , µp e τr dependem do material utilizado. A Figura 8.17 mostra a vista de cima do elemento fotocondutivo empregado nos foto-resistores comerciais e a visão do dispositivo encapsulado. O elemento fotocondutivo é formado por uma pastilha de material isolante, na 328 Materiais e Dispositivos Eletrônicos forma de um disco com diâmetro que varia de alguns mm a vários cm. Sobre a pastilha é depositada uma camada policristalina do semicondutor fotosensı́vel (CdS, CdSe, PbS, InSb, Hgx Cd1−x Te, entre outros), e sobre ela um filme metálico (A, Ag, ou Au) para formar os eletrodos. O filme metálico é evaporado através de uma máscara que deixa a área exposta do material fotocondutivo na forma de zig-zag. Isto resulta numa grande área de iluminação do semicondutor, combinada com um pequeno valor da distância entre os eletrodos, de modo a produzir um alto ganho G. Os materiais mais utilizados para fabricar foto-resistores que operam na região visı́vel são CdS e CdSe. No infravermelho próximo usa-se PbS e no infravermelho médio InSb ou Hgx Cd1−x Te. Esses materiais têm valores elevados para o coeficiente de absorção na faixa do espectro de sua operação, e também para as mobilidades µn e µp e o tempo de recombinação τr . Além disso, esses materiais são favoráveis à formação de armadilhas causadas por defeitos na rede ou por impurezas. Estas armadilhas têm o papel de aprisionar, temporariamente, portadores de carga elétrica com determinado sinal. Por exemplo, impurezas de Mn2+ funcionam como armadilhas de elétrons. Assim, enquanto os portadores com certa carga estão presos nas armadilhas, os portadores com a carga oposta podem transitar de um eletrodo para o outro com menor probabilidade de recombinação. Isto resulta num aumento efetivo de τr e portanto num maior ganho do dispositivo. Uma consideração importante em qualquer dispositivo fotodetetor diz respeito ao ruı́do que ele gera na ausência de radiação. A amplitude deste Figura 8.17: (a) Vista de cima do elemento fotocondutivo com o eletrodo metálico; (b) Foto-resistor comercial tı́pico. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 329 ruı́do determina o nı́vel mı́nimo da radiação que pode ser detetada. No caso dos foto-resistores e dos fotodiodos, a principal fonte de ruı́do é a geração térmica de pares elétron-buraco. Como a probabilidade de geração térmica é proporcional a exp(−Eg /2kB T ) [Eq.(5.23)], o ruı́do depende do material utilizado e da temperatura de operação. Então, como os materiais usados em fotodetetores de infravermelho têm energia do gap Eg menores que os do visı́vel, seu ruı́do é maior. Para diminuir o ruı́do dos fotodetetores é comum resfriar o elemento fotocondutivo. Isto pode ser feito eletricamente através de compactos dispositivos termoelétricos, que facilmente produzem temperaturas da ordem de −30◦ C (∼ 240 K). Embora esta temperatura represente uma redução em relação à ambiente de apenas 20%, o efeito no ruı́do é sensı́vel devido à sua variação exponencial com 1/T . Em geral os foto-resistores são dispositivos lentos porque são feitos com semicondutores cujos tempos de recombinação são muito grandes. Por esta razão seu uso é restrito a aplicações que necessitem de altos valores de ganho (103 −104 ) e que não requeiram resposta rápida. Por exemplo, os foto-resistores de CdS e CdSe, cujo tempo de resposta é da ordem de 50 ms, são utilizados nos medidores de intensidade de luz de câmaras fotográficas. Para completar esta seção, apresentamos na Fig.8.18 um circuito simples de polarização de um foto-resistor. O foto-resistor, ou LDR, representado no circuito através de seu sı́mbolo mais comum, é colocado em série com o resistor de carga RL . Quando a intensidade da luz incidente varia, a corrente no circuito acompanha a variação da luz. Isto produz uma tensão através de RL , cuja variação fornece uma medida da intensidade da luz. Quando apenas a componente ac da tensão é de interesse, utiliza-se um capacitor na saı́da para bloquear a parte dc. O valor utilizado para RL depende do valor da resistência RD do LDR e também de sua variação relativa com a máxima intensidade Figura 8.18: (a) Sı́mbolo de circuito do foto-resistor, ou LDR; (b) Circuito simples utilizado para polarizar um LDR. Materiais e Dispositivos Eletrônicos 330 de luz incidente. No caso da variação relativa de RD ser pequena (até 10%), a maior variação de VL é obtida com RL = RD . Por outro lado, quando a variação de RD é muito grande, a linearidade entre as variações da intensidade da luz e de VL ocorre aproximadamente com RD RL . Por esta razão, para que a tensão de saı́da seja alta, deve-se fabricar foto-resistores com o maior valor possı́vel de RD . Este é outro motivo para que a geometria do foto-resistor tenha a forma de uma longa fita em zig-zag, como mostrado na Fig.8.17(a). 8.4.2 Fotodiodos Fotodiodos são detetores de radiação nos quais o sinal elétrico é produzido pela geração de pares elétron-buraco causada por absorção de fótons nas imediações da região de depleção de uma junção p-n. Os elétrons e os buracos dos pares criados pela radiação são acelerados em sentidos opostos pelo campo elétrico da junção. Como o campo tem sentido do lado n para o lado p, os buracos são acelerados no sentido n → p, enquanto os elétrons movem-se no sentido p → n, como ilustrado na Figura 8.19. Isto resulta numa corrente gerada pela radiação no sentido n → p, que é o sentido reverso da corrente na junção. Uma grande diferença dos fotodiodos para os foto-resistores é que neles a fotocorrente é produzida sem a necessidade da aplicação de uma tensão externa. A deteção da radiação nos fotodiodos pode ser feita em dois modos dis- Figura 8.19: Ilustração do processo de criação de pares elétron-buraco por absorção de fótons na região de depleção de uma junção p−n de um fotodiodo, seguida da aceleração das cargas em sentidos opostos. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 331 tintos de operação: no modo fotovoltaico o fotodiodo opera com circuito aberto, e quando a junção é iluminada aparece uma tensão entre os lados p e n que pode ser medida externamente; no modo fotocondutivo o dispositivo é curto-circuitado, ou opera sob uma tensão externa no sentido reverso. Nesta situação uma corrente flui no sentido reverso quando a junção é iluminada. A escolha do modo de operação do fotodiodo depende de sua aplicação. Qualquer um dos modos pode ser empregado na deteção de luz. O modo fotovoltaico é utilizado para converter energia luminosa em energia elétrica, como no caso das células solares. Em qualquer modo de operação, o fotodiodo sob radiação comportase como uma junção p − n cuja corrente tem duas componentes: a primeira é aquela que existe sem a geração de pares por absorção de fótons. Ela é chamada de corrente de escuro e é dada por (6.29), Ie = Is (eeV /kB T − 1) , (8.70) onde Is é a corrente de saturação reversa, dada por (6.30), e V é a tensão na junção; a outra componente é aquela produzida pelos pares elétron-buraco gerados pelos fótons absorvidos nas proximidades da junção. Sendo I0 a intensidade da radiação absorvida e η a eficiência quântica da conversão, o número de pares criados por unidade de volume e de tempo é dado por (8.63), g = ηI0 /ωd. Para calcular o número total de pares deve-se considerar que os portadores minoritários gerados fora da região de depleção (espessura ), porém dentro de uma distância da ordem do comprimento de difusão (Ln e Lp ), são capazes de difundir para a região de depleção e serem acelerados pelo campo para o outro lado. Como em geral Ln , Lp , a contribuição desses pares para a corrente é importante, fazendo com que o volume efetivo de geração de pares seja d A ∼ ( + Ln + Lp )A, onde A é a área de iluminação da junção. A corrente na junção produzida pela luz é então, η e I0 A IL = g d A = . ω Sendo PL = I0 A a potência incidente na área efetiva da junção, usando a relação ω = hc/λ podemos escrever esta contribuição na forma, IL = η e PL λ hc . (8.71) A eficiência quântica de conversão depende do material utilizado e também do comprimento de onda λ da radiação. Como esta corrente tem o sentido reverso, a corrente total no fotodiodo é dada por 332 Materiais e Dispositivos Eletrônicos I = Is (eeV /kB T − 1) − IL . (8.72) A Figura, 8.20, mostra as caracterı́sticas I − V de um fotodiodo no escuro e sob iluminação, para dois valores de potência de luz. O efeito da radiação contribui com uma parcela negativa para a corrente, independente de V , que aumenta proporcionalmente à intensidade de luz. A Eq.(8.72) e sua representação gráfica são usadas para analisar os dois modos de operação do fotodiodo. No modo fotocondutivo o fotodiodo opera em curto-circuito. Neste caso V = 0 e Icc = −IL . O ponto de operação correspondente está mostrado na curva I − V da Fig.8.20 correspondente à potência de luz P2 . No modo fotovoltaico o fotodiodo opera em circuito aberto, portanto I = 0. Nesta situação a absorção de luz dá origem a uma tensão nos terminais do diodo, cujo valor é obtido diretamente de (8.72), IL kB T Vca = n +1 . (8.73) e Is O ponto de operação I = 0, V = Vca é a interseção do eixo de tensão com a curva I − V , mostrada na Fig.8.20. Na realidade, em nenhuma aplicação o fotodiodo opera estritamente nos modos de operação acima. Como veremos a seguir, as células solares atuam próximo do modo fotovoltaico, enquanto os fotodetetores atuam próximo do modo fotocondutivo. Figura 8.20: Caracterı́stica I − V de uma junção p − n no escuro e sob iluminação, para dois valores de potência de luz. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 333 Para fazer o fotodiodo atuar como fotodetetor, aplica-se uma tensão externa reversa que faz a junção operar no terceiro quadrante do diagrama I −V , de modo que I ≃ Is − IL . Se a taxa de geração térmica de pares for muito menor que a de absorção de fótons, a corrente de saturação reversa será desprezı́vel comparada com IL . Neste caso a corrente no fotodiodo será proporcional à potência da radiação incidente na junção. Além da linearidade de sua resposta, o fotodiodo tem outras vantagens em relação ao foto-resistor como detetor de radiação. As mais importantes são a rapidez de resposta, melhor estabilidade e maior faixa dinâmica de operação. Em aplicações que não necessitem de resposta muito rápida, ele ainda tem a vantagem de poder ser usado num circuito muito simples, formado apenas por uma pequena resistência de carga (de um microamperı́metro, ou ligada a um voltı́metro eletrônico). Para pequenas potências de luz a corrente será baixa, de modo que se RL é pequena, V = RL I Vca . Neste caso o ponto de operação está próximo de Icc , V = 0, de modo que a corrente é proporcional à potência incidente. As vantagens no uso de uma bateria adicional para polarizar o diodo reversamente, são o aumento na rapidez de resposta e também na faixa dinâmica de operação. O material mais utilizado para fabricar fotodiodos para a região visı́vel é o silı́cio. A Figura 8.22 mostra a responsividade de um fotodiodo comercial de Si em função do comprimento de onda. Esta grandeza, muito usada para caracterizar a resposta de fotodetetores, é a razão entre a fotocorrente e a potência de luz incidente. A linha tracejada mostrada na figura, é a resposta de um fotodetetor ideal, dada pela Eq.(8.71), com η = 1 para qualquer comprimento de onda (Problema 8.11). Vemos na figura que a responsividade do silı́cio se aproxima da ideal em toda a região visı́vel. A Figura 8.23 mostra a estrutura tı́pica de um fotodiodo de Si. Ela é formada de regiões p+ e n+ Figura 8.21: (a) Sı́mbolo de circuito do fotodiodo; (b) Circuito simples para uso do fotodiodo como detetor de radiação. 334 Materiais e Dispositivos Eletrônicos nas extremidades para facilitar o contato ôhmico com os filmes metálicos. A principal diferença para a estrutura do diodo comum, mostrada na Fig.6.1, é a abertura existente no contato metálico. É comum também depositar sobre a superfı́cie de entrada uma camada dielétrica anti-refletora para aumentar a eficiência de conversão. Como os pares são criados na região de depleção ou em suas proximidades, deve-se fazer a espessura do lado p+ a menor possı́vel para que a luz não seja absorvida antes de chegar nela. De acordo com a Eq.(6.9), numa junção p+ − n a espessura da região de depleção no lado n é muito maior que no lado p+ . Assim sendo, deve-se fazer a espessura da região n suficientemente grande para assegurar que toda radiação incidente no fotodiodo seja absorvida. Uma outra estrutura comumente utilizada em fotodiodos é a do diodo PIN, na qual uma camada de semicondutor intrı́nseco é interposta entre as regiões p+ e n+ da junção p-n, como ilustrado na Figura 8.24. A sigla PIN indica o semicondutor intrı́nseco entre os lados p e n. Na realidade a camada não é intrı́nseca, porém tem uma concentração de impurezas doadoras muito pequena (Nd < 1013 cm−3 ), de modo que sua resistividade é muito alta. Isto resulta numa região de depleção que se estende até o lado n+ , fazendo com que a espessura útil do fotodiodo seja muito maior que na estrutura p − n. Isto Figura 8.22: Responsividade de um fotodiodo de Si (linha cheia). A linha tracejada indica a resposta de um fotodiodo ideal, obtido de (8.71) com η = 1. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 335 SiO2 Região de depleção n Contatos metálicos n+ Figura 8.23: Estrutura da junção p+ -n-n+ de um fotodiodo. melhora a resposta na região de maior comprimento de onda, pois assegura que toda a radiação é absorvida mesmo nesta região de menor coeficiente de absorção. Outros fotodetetores muito utilizados são o fotodiodo de avalanche e o fototransistor. O fotodiodo de avalanche opera sob tensão reversa com um valor suficiente para produzir multiplicação por avalanche, que resulta em ganho de corrente. Isto permite que o dispositivo atue com uma resistência de carga pequena, aumentando assim sua rapidez de resposta. Por outro lado o ganho possibilita gerar na resistência uma tensão apreciável. O fototransistor é um dispositivo no qual a junção emissor-base pode ser iluminada de modo a gerar pares elétron-buraco. Isto resulta numa corrente de emissor que varia com a intensidade da luz, permitindo a deteção da luz com ganho de corrente. Figura 8.24: (a) Modelo da estrutura do fotodiodo PIN; (b) Variação do campo elétrico ao longo do fotodiodo. 336 8.4.3 Materiais e Dispositivos Eletrônicos Células Solares A célula solar é um fotodiodo com uma grande área de exposição à radiação, cuja operação se dá em condições de fornecer energia a uma carga externa. Para que isto ocorra é necessário que ela opere no quarto quadrante da caracterı́stica I − V , de tal forma que a potência absorvida pelo dispositivo, dada pelo produto V I, seja negativa. Nesta situação o fotodiodo converte energia luminosa em energia elétrica. O circuito utilizado para isto é o mesmo da Fig.8.21 exceto que o valor de RL , em vez de ser pequeno, deve ser escolhido para maximizar a potência fornecida. O ponto de operação do circuito é determinado pela interseção da reta de carga da resistência RL com a curva I − V da célula, como ilustrado na Figura 8.25. Note que a área do retângulo cinza indicado na figura representa a potência elétrica Pe = V I entregue à carga. O melhor valor de RL é aquele no qual Pe é máximo. Os valores Vm e Im de operação na condição de Pe máximo são determinados por dPe /dV = 0 (Problema 8.14), sendo dados por: 1 + (IL /Is ) eVm kB T kB T n n 1 + ≃ Vca − , (8.74) Vm = e 1 + (eVm /kB T ) e kB T kB T eVm eVm /kB T ≃ IL 1 − . (8.75) Im = Is e kB T eVm Como (8.74) é uma equação transcendental, não é possı́vel obter uma expressão Figura 8.25: Determinação gráfica do ponto de operação de um circuito série célula solarresistência RL . Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 337 analı́tica para Vm , da qual seria obtida a expressão para o valor ótimo de RL . No entanto, usando o valor de Vca obtido da curva I −V , a Equação (8.74) pode ser resolvida numericamente, fornecendo o valor de Vm . Com este valor podese obter Im de (8.75) e portanto a resistência RL = Vm /Im . A eficiência de conversão da célula solar é a razão entre a potência elétrica máxima fornecida e a potência de luz incidente PL . Pode-se ver que esta eficiência aumenta com o aumento de Vca e da razão IL /PL . Atualmente as melhores células solares comerciais são feitas de Si cristalino, com estrutura mostrada na Figura 8.26. A junção é formada por uma fina camada tipo n produzida por uma forte dopagem Nd ∼ 1018 cm−3 ) num substrato tipo p (Na ∼ 2 × 1015 cm−3 − 5 × 1016 cm−3 ). Sendo fina, a região n deixa passar a radiação incidente num largo espectro de freqüência. Para aumentar a área de exposição e ao mesmo tempo manter baixa a resistência de contato, o eletrodo superior é feito na forma de um pente, com dentes finos, como ilustrado na figura. As células solares de Si cristalino em geral têm forma circular, com diâmetros da ordem de 10 cm, pois esta é a forma das lâminas obtidas no corte dos lingotes de Si. As células feitas de Si amorfo ou policristalino têm forma retangular ou quadrada, cuja vantagem é ocupar toda a área de um painel quando colocadas uma ao lado da outra. As melhores células solares de Si têm eficiência de conversão que se aproxima de 15%. A radiação solar no meio de um dia claro, ao nı́vel do mar, tem intensidade na faixa 70-80 mW/cm2 . Isto produz numa célula com área 40 cm2 , uma tensão de circuito aberto Vca ≃ 0, 6 V e uma corrente de curto Icc ≃ 0, 9 A. Como os valores de operação são um pouco menores que estes, Figura 8.26: Estrutura de uma célula solar de Si retangular: (a) Corte transversal; (b) Vista de cima. 338 Materiais e Dispositivos Eletrônicos é evidente que as células solares devem ser associadas em série e em paralelo para produzirem tensão e corrente adequados para cargas formadas por lâmpadas, motores, etc. Em geral as células são colocadas em grandes painéis, interligados entre si, de modo a coletar energia solar em grandes áreas. A conversão direta de energia solar em energia elétrica ainda é uma fonte de energia de alto custo. Atualmente ela só é econômica em situações onde o acesso a fontes de geração convencional é difı́cil. Entretanto, há uma intensa atividade de pesquisa para produzir células mais eficientes e com menor custo de fabricação. Dentre os materiais investigados estão o Si policristalino e o amorfo, que são mais baratos que o monocristalino, e semicondutores III-IV, como GaAs e CdS, que são mais eficientes. A fabricação de células solares mais eficientes e de menor custo poderá tornar a conversão fotovoltaica de energia solar uma tecnologia importante no Século XXI, principalmente em regiões de grande insolação, como é o caso do Nordeste do Brasil. 8.4.4 Sensor de Imagem CCD Uma imagem preto e branco em duas dimensões, estática como numa fotografia, é formada por um grande número de pontos, ou pequenas áreas (pixel, em inglês), cada um com uma cor que varia de branco a preto, passando por todas as gradações de cinza. Quanto maior o número de pixeis, maior a resolução da imagem. Uma imagem em movimento, como no cinema ou na televisão, é formada por uma seqüência de imagens estáticas, que diferem pouco uma da outra. Elas são mostradas uma após a outra, com um intervalo de tempo pequeno, de tal modo que o sistema de percepção humano tenha a sensação de um movimento contı́nuo. A imagem na televisão é formada por 525 linhas horizontais, com uma taxa de exibição das imagens de 60 Hz. O sensor de imagem é um dispositivo que produz um sinal elétrico correspondente a uma imagem óptica. Ele é usado em câmaras fotográficas ou câmaras de vı́deo. O sinal elétrico do sensor pode ser armazenado em forma analógica ou digital, ou transmitido através de cabos ou ondas eletromagnéticas. Um dos sensores de imagem mais utilizados é o do tipo CCD. A sigla CCD é formada pelas iniciais do nome em inglês Charge-Coupled Device, que significa dispositivo de acoplamento de carga (DAC). O CCD é parte de uma classe de estruturas de dispositivos de transferência de carga, desenvolvidos nos Laboratórios Bell em 1969. Eles são dispositivos dinâmicos, que movem um pacote de carga de uma unidade para outra vizinha, ao longo de uma cadeia, numa seqüência determinada pelos pulsos do relógio de comando. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 339 Figura 8.27: Estrutura básica do sensor de imagem CCD de Si. Esses dispositivos encontram uma variedade de aplicações em eletrônica, tais como em memórias, em várias funções lógicas, processamento de sinais e sensores de imagem. O sensor de imagem CCD é constituı́do por um conjunto de capacitores metal-isolante-semicondutor (MIS), fabricados na mesma pastilha de semicondutor como num circuito integrado, formando uma rede em duas dimensões. O semicondutor usado em sensores de luz visı́vel é Si, e de luz infravermelho é InSb ou HgCdTe. No caso do silı́cio o isolante é SiO2 , e os capacitores são do tipo MOS, estudados na Seção 7.6. A Figura 8.27 ilustra a estrutura básica do sensor de imagem CCD, também chamado de fotodetetor MIS, ou fotodetetor MOS. Os eletrodos metálicos das portas dos capacitores são filmes finos, com espessura da ordem de 100-300 nm, que deixam passar a luz incidente. Cada capacitor tem dimensão da ordem de 10×10 µm2 e corresponde a um pixel da imagem. O conjunto tem dimensão lateral que pode variar de alguns mm a vários cm. Atualmente os sensores de imagem CCD têm estruturas mais sofisticadas, com porta de silı́cio policristalino, em vez de metal, e com eletodos enterrados. A imagem é formada na área do dispositivo por meio do sistema óptico da câmara, fazendo com que sobre cada pixel incida um certo fluxo de fótons. Os fótons com energia maior que a energia do gap criam na região da superfı́cie do semicondutor pares elétron-buraco, com uma taxa proporcional à intensidade de luz em cada pixel. Uma diferença de potencial aplicada entre a porta e o eletrodo na outra face da pastilha (ou no eletrodo enterrado, como estudado na Seção 7.8), atrai os elétrons para a superfı́cie e afasta os buracos, que difundem no susbtrato e são capturados no circuito externo, como ilustrado na Figura 8.27. Durante um intervalo de tempo caracterı́stico da operação do dispositivo, (varia de 100 µs a 100 ms), forma-se sob a porta de cada capacitor um pacote de carga de elétrons, cuja carga total representa a intensidade de luz integrada no intervalo. Após este intervalo de exposição, a informação armazenada em cada 340 Materiais e Dispositivos Eletrônicos Figura 8.28: Ilustração do processo de transferência de carga num dispositivo CCD: a) ligações dos capacitores MOS; b) Variação do potencial elétrico da distribuição de carga; c) Variação dos potenciais das três linhas ao longo do tempo. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 341 linha de capacitores na forma de pacotes de carga, é deslocada rapidamente (em intervalo de tempo muito menor que o de exposição) para a extremidade da linha, produzindo um sinal de corrente elétrica correspondente à imagem na linha. O sinal correspondente a uma linha é seguido do sinal da linha seguinte, e assim por diante, num processo de varredura vertical, de cima para baixo. O sinal correspondente ao conjunto de linhas forma um quadro. Uma imagem estática é formada por apenas um quadro, enquanto uma imagem em movimento é formada por uma seqüência de quadros, tipicamente numa taxa de 60 Hz. A transferência do pacote de cargas de cada capacitor para a extremidade da cadeia é feita pela ação de uma seqüência de pulsos de tensão, aplicados nas portas dos capacitores, num processo caracterı́stico dos dipositivos de transferência de carga, ou de acoplamento de carga. Esta é a razão do nome CCD deste tipo de sensor de imagem. Dentre os diversos tipos de estruturas CCD, as mais utilizadas são as de duas fases e de três fases. A Figura 8.28 ilustra a transferência de carga numa estrutura de três fases. Em (a) estão mostrados alguns capacitores ao longo de uma linha, o esquema de ligação externa para aplicação da seqüência de pulsos de tensão, e um pacote de cargas no capacitor 1, num certo instante de tempo t1 . A Figura 8.28(b) ilustra a variação do potencial elétrico e da carga ao longo da cadeia de capacitores, em quatro instantes de tempo. A Figura 8.28(c) mostra a variação no tempo das tensões nas três linhas de fase, φ1 , φ2 e φ3 . Elas são funções periódicas com dois valores, um alto e um baixo, com perı́odo determinado pelo relógio do sistema. Todas têm a mesma forma, porém a de φ2 está defasada de φ1 por um intervalo de tempo correspondente a um terço do perı́odo, enquanto φ3 está defasada de φ2 também por um terço do perı́odo. A Fig. 8.28(c) mostra que no instante t1 , o potencial φ1 é alto, enquanto φ2 e φ3 são baixos. Como a carga do elétron é negativa, a energia potencial tem a forma de um poço na região do capacitor 1, o que mantém o pacote de cargas naquela região, como ilustrado no diagrama de cima da figura (b). No instante t2 o potencial φ2 é alto, enquanto φ1 permanece alto, de modo que o poço de energia se estende ao capacitor 2, fazendo com que a carga original fique dividida entre os capacitores 1 e 2. No instante t3 o potencial φ1 é menor do que φ2 , que permance alto, de modo que a maior parte da carga passa para o capacitor 2, processo que é concluı́do quando o potencial φ1 atinge o valor baixo enquanto φ2 permanece alto (instante t4 ). Desta forma, em cada ciclo de variação das tensões, a carga passa de um capacitor para o vizinho, e assim sucessivamente até atingir a extremidade da cadeia, dando origem ao sinal de corrente correspondente ao pixel original da 342 Materiais e Dispositivos Eletrônicos imagem na posição do capacitor 1. 8.5 Diodo Emissor de Luz (LED) A conversão de um sinal elétrico em sinal luminoso é uma função de grande importância na eletrônica. Sua aplicação mais elementar é em indicadores e mostradores luminosos usados em equipamentos eletro-eletrônicos, aparelhos de som e vı́deo, equipamentos cientı́ficos e industriais, relógios, etc. Outra aplicação importante é na geração de imagens a partir de um sinal eletrônico, como em cinescópios de computadores e de aparelhos de televisão. A partir da década de 1980, esta função adquiriu importância ainda maior com a disseminação das comunicações ópticas. Nos sistemas de comunicação óptica, um sinal elétrico que contém a informação a ser transmitida é convertido em sinal luminoso num diodo emissor de luz ou num laser semicondutor. Este propaga através de uma fibra óptica até o receptor, onde é convertido outra vez em sinal elétrico num fotodetetor, reproduzindo a informação original. A forma mais simples e mais tradicional de gerar a luz a partir de uma corrente elétrica é através do aquecimento. Quando uma corrente elétrica passa por um fio metálico, os átomos do metal entram em vibração devido às colisões dos elétrons da corrente. Isto resulta em aquecimento do fio e também em radiação eletromagnética produzida pelas cargas atômicas em movimento. Esta radiação ocorre numa ampla faixa do espectro eletromagnético, que pode se estender do infravermelho ao visı́vel, em torno de um valor de energia que aumenta com a temperatura do material. Para que um fio possa ser suficientemente aquecido e emitir na região visı́vel do espectro, ele deve ser feito de material com alto ponto de fusão e colocado no vácuo, ou numa atmosfera inerte, para não entrar em combustão. As lâmpadas incandescentes são feitas com fios de tungstênio, aquecidos à temperatura de cerca de 6.200◦ C. Nesta temperatura o pico do espectro de radiação ocorre na região visı́vel. Entretanto, a maior parte da energia da corrente elétrica é convertida em calor ou radiação infravermelha, fazendo com que a eficiência de conversão em luz visı́vel seja muito baixa. Nas lâmpadas incandescentes comuns, apenas 13% da energia elétrica são convertidos em energia luminosa. Além de ineficientes, essas lâmpadas geram muito calor e têm resposta extremamente lenta. Durante muitas décadas elas foram usadas em indicadores e mostradores de aparelhos eletrônicos, mas a partir da década de 70 foram substituı́das por diodos emissores de luz e outros dispositivos de estado sólido, como os mostradores de cristal lı́quido. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 343 A emissão de luz numa lâmpada incandescente ocorre devido ao aquecimento, um processo fı́sico clássico. Os modernos dispositivos opto-eletrônicos operam com base em processos quânticos de emissão de radiação, através dos processos de luminescência. O funcionamento do diodo emissor de luz, o LED (Light Emitting Diode), é baseado numa forma especial de eletroluminescência, produzida pela injeção de portadores numa junção p-n. Como vimos na Seção 6.2, quando uma junção p-n é polarizada no sentido direto, os buracos do lado p e os elétrons do lado n movem-se em sentidos opostos em direção à região de depleção. Os buracos injetados no lado n recombinam com elétrons que estão chegando na região de depleção, enquanto os elétrons injetados no lado p recombinam com buracos que lá se encontram. Desta forma, todos elétrons e buracos que participam da corrente recombinam nas imediações da região de depleção, numa camada de espessura Lp do lado p e Ln do lado n. Se o semicondutor da junção tiver gap indireto, como Si ou Ge, além dos fótons a recombinação produz fônons e, portanto, calor. Isto torna a emissão de luz muito pouco eficiente nos semicondutores de gap indireto. Por outro lado, se o semicondutor tiver gap direto, a recombinação de cada par elétron-buraco resulta na emissão de um fóton. A Figura 8.29 ilustra o processo de injeção de portadores minoritários nos dois lados de uma junção p-n, produzindo recombinação de pares e emissão de fótons por transições interbanda. Nos diodos feitos com semicondutores de gap direto este processo é extremamente eficiente na conversão de energia elétrica em luz. Se os elétrons de condução estivessem no mı́nimo da banda de condução, com energia Ec , os fótons emitidos na transição interbanda teriam energia igual a do gap do semicondutor, Eg . Em geral, devido à excitação Figura 8.29: Ilustração da recombinação de pares elétron-buraco com emissão de fótons em transições interbanda, devido à injeção de portadores minoritários numa junção p-n polarizada diretamente. 344 Materiais e Dispositivos Eletrônicos térmica, a energia média dos elétrons tem valor próximo de Ec + kB T /2. Isto faz com que a energia dos fótons emitidos na transição seja um pouco maior que Eg . Além da transição interbanda, mostrada na Fig.8.29, é possı́vel ter na junção p-n transições envolvendo nı́veis de impureza, como ilustrado na Fig.8.13. Os materiais mais utilizados na fabricação de LEDs são as ligas ternárias Gax A1−x As e GaAs1−x Px . GaAs é um semicondutor de gap direto, de baixa resistividade, que pode ser facilmente dopado com impurezas n ou p, para a formação da junção p-n. As junções de GaAs têm grande eficiência de luminescência em transições interbanda, que ocorrem num comprimento de onda de aproximadamente 0,87 µm. Este valor corresponde à radiação no infravermelho próximo. Como GaP tem um gap de energia maior, as ligas formadas por GaAs e GaP têm transições interbanda com menor comprimento de onda que em GaAs. É interessante notar que ao contrário de GaAs, GaP tem gap indireto. Com isto, o gap da liga GaAs1−x Px é direto para x < 0, 45, como GaAs, porém torna-se indireto para x > 0, 45. A liga de composição GaAs0,6 P0,4 , com gap direto, é muito utilizada na fabricação de LEDs que produzem luz vermelha em transições interbanda, com λ = 0, 65µm. A liga Gax A1−x As também é muito usada para fabricar LEDs de alta eficiência. É comum encontrar dispositivos feitos com heterojunções de Ga0,3 A0,7 As tipo n e Ga0,6 A0,4 As tipo p. Nesse sistema, os elétrons do lado n são injetados no lado p, onde produzem transições para os nı́veis das impurezas aceitadoras (como na Fig.8.13a), com emissão de fótons de 0,65 µm (vermelho). A radiação produzida no lado p atravessa o lado n sem absorção, pois este tem um gap de energia maior, o que faz com que estes LEDs tenham eficiência próxima de 100%. No final da década de 1990 foi desenvolvida a tecnologia de fabricação de LEDs eficientes de GaN, que têm um gap correspondente à luz azul. Isto permitiu a fabricação de painéis contendo agrupamentos de Figura 8.30: Estrutura tı́pica de um diodo emissor de luz (LED). Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 345 Figura 8.31: Estrutura tı́pica de lâmpada LED utilizada em painéis de equipamentos eletroeletrônicos. LEDs com as três cores básicas do espectro visı́vel, simulando uma fonte de luz branca. O material mais utilizado na fabricação de LEDs de infravermelho é a liga quaternária Gax In1−x Asy P1−y . Dependendo das concentrações dos constituintes, o LED feito com esta liga pode emitir em qualquer comprimento de onda na faixa 1,1-1,6 µm, utilizada para comunicações ópticas. A Figura 8.30 mostra a estrutura tı́pica de um LED de Ga(AsP) que opera no vermelho. Como nos fotodiodos, o contato metálico no lado de cima tem um orifı́cio que forma uma janela para a passagem da radiação. Normalmente o lado p é uma camada fina na parte de cima, feita com dopagem muito menor que no lado n. Isto faz com que a radiação seja produzida ma- Figura 8.32: Estrutura tı́pica do LED tipo Burrus. 346 Materiais e Dispositivos Eletrônicos Figura 8.33: (a) Sı́mbolo de circuito do LED; (b) Circuito simples de alimentação. joritariamente no lado p, próximo da janela de saı́da, por elétrons injetados do lado n, o que minimiza a absorção da radiação emitida pelo LED. As várias camadas da estrutura do LED são produzidas por crescimento epitaxial sobre um substrato de GaAs. Como o GaAs0,6 P0,4 tem parâmetro de rede muito diferente de GaAs, ele não deve ser crescido diretamente sobre o substrato, para evitar o aparecimento de defeitos cristalinos que formam centros de recombinação não-radiativos. Esta é a razão da existência da camada intermediária de GaAs1−y Py . Ela é feita com uma concentração y que varia gradualmente de 0 a 0,4, produzindo um casamento entre as redes cristalinas de GaAs0,6 P0,4 e de GaAs. Figura 8.34: Dois tipos de mostradores de LEDs: (a) Mostrador numérico de 7 segmentos; (b) Mostrador alfanumérico de matriz 7×5. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 347 Os LEDs que operam no visı́vel são muito utilizados para fazer lâmpadas indicadoras para painéis de equipamentos eletro-eletrônicos. Estas lâmpadas são feitas com uma grande variedade de formatos e de cores. A Figura 8.31 mostra uma estrutura tı́pica de uma lâmpada de LED. O chip do LED é montado sobre um dos pinos metálicos utilizados como terminal externo. O contato com o outro terminal é feito por um fio soldado no filme metálico no lado da janela do LED. O conjunto é encapsulado num plástico colorido, cuja parte superior forma uma lente para colimar parcialmente a radiação. Os LEDs de infravermelho são utilizados em sistemas de comunicações ópticas. Como será mostrado na Seção 8.8, estes sistemas são baseados na transmissão de informação por meio de um feixe de luz infravermelho, que propaga confinado numa fibra óptica com diâmetro de alguns µm. Os LEDs para esta finalidade são feitos com uma estrutura conhecida pelo nome de inventor, Burrus. Na estrutura do LED tipo Burrus, mostrada na Fig.8.32, o contato metálico com o semicondutor é confinado a uma região de diâmetro semelhante ao da fibra óptica. Isto faz com que a região ativa de emissão de luz seja pequena, resultando num eficiente acoplamento com a fibra óptica. A fibra é montada rigidamente na estrutura e presa por meio de resina de epoxi, como mostrado na Fig.8.32. Os circuitos de alimentação dos LEDs são bastante simples. Para a emissão de luz com intensidade constante basta fazer passar no sentido direto do diodo uma corrente constante. Nos sistemas de comunicação óptica é preciso incorporar um circuito de modulação da corrente para produzir as variações correspondentes na intensidade da luz. A Fig.8.33 mostra o sı́mbolo de circuito do LED e um circuito simples de alimentação. O resistor Rs em série é necessário para limitar a corrente que passa no LED, pois como este opera com polarização direta, sua resistência é muito pequena. Os LEDs que operam no visı́vel também são muito utilizados atualmente para fazer mostradores luminosos alfanuméricos. A Fig.8.34 mostra dois tipos de mostradores muito comuns. Em (a) está apresentado o sistema de 7 segmentos, utilizado para indicar os algarismos de 0 a 9. Cada segmento é formado por um conjunto de LEDs, conectados em paralelo e encapsulados numa mesma peça, de modo a produzir iluminação uniforme em toda sua extensão. A Fig.8.34(b) mostra a matriz de 7×5 LEDs individuais, que permite exibir algarismos e letras, formando um mostrador alfanumérico. 348 8.6 Materiais e Dispositivos Eletrônicos Emissão Estimulada e Lasers A radiação produzida por uma fonte tradicional de luz, como as lâmpadas incandescentes e fluorescentes, ou por um LED, é composta por fótons emitidos espontaneamente por átomos ou moléculas independentes. No processo de emissão espontânea, um sistema quântico passa de um certo nı́vel de energia para outro de menor energia devido a flutuações aleatórias. Em conseqüência, a fase do campo resultante varia aleatoriamente no espaço e no tempo, fazendo com que a radiação seja incoerente. Outro tipo de radiação é aquela produzida por um laser, nome adotado em português, para os dispositivos de amplificação por emissão estimulada de radiação (do inglês Light Amplification by Stimulated Emission of Radiation). A radiação de um laser resulta das emissões de átomos ou moléculas induzidas, ou estimuladas, por um campo eletromagnético macroscópico. Neste processo as fases dos campos dos fótons emitidos são correlacionadas, e em conseqüência a radiação é coerente. Além de coerente, a radiação do laser é altamente monocromática, isto é, tem freqüências numa estreita faixa do espectro. A intensidade depende do tipo de laser e da magnitude da excitação, podendo variar numa ampla faixa de valores. Os estudos teóricos sobre a operação de lasers foram publicados por C.H. Townes e A.L. Schawlow dos Laboratórios Bell em 1958, pelos quais eles receberam o prêmio Nobel de Fı́sica em 1964 e em 1981, respectivamente. Em 1960 foram descobertos o laser de Rubi e o laser de Hélio-Neônio. Desde então foram descobertas inúmeras variedades de lasers e desenvolvidas muitas aplicações na medicina, na indústria e na ciência. O desenvolvimento do laser semicondutor operando à temperatura ambiente, feito no final da década de 1960, possibilitou uma revolução na comunicação à distância, feita através de fibras ópticas. Os principais componentes de um laser são: o ressoador ou cavidade óptica; o meio ativo; e o mecanismo de bombeamento. A cavidade é formada por dois espelhos parciais, um em frente ao outro, que refletem a maior parte da radiação emitida de volta para a região do meio ativo existente entre os espelhos. A estrutura entra em ressonância em certos comprimentos de onda, resultando num campo eletromagnético macroscópico que produz a emissão estimulada nos átomos ou moléculas do meio. Esta emissão amplifica o campo na cavidade e mantém a radiação do laser. As principais caracterı́sticas do laser são determinadas pela natureza do meio ativo. Os lasers mais comuns são de gás, de lı́quidos orgânicos, de sólidos com nı́veis de impurezas luminescentes e de diodos semicondutores. Para entender o papel do meio ativo é preciso Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 349 estudar a emissão estimulada. 8.6.1 O Mecanismo de Amplificação por Emissão Estimulada. Como vimos na Seção 8.3, um sistema quântico de dois nı́veis de energia, E2 > E1 , com populações N2 e N1 , tem um coeficiente de absorção dado por (8.14) e (8.56), ω 4πω α=2 κ= (8.76) (N1 − N2 ) p212 D(ω) , c n c 0 onde p12 é o elemento de matriz do momento de dipolo elétrico entre os dois nı́veis e D(ω) representa a forma de linha espectral da transição entre os dois nı́veis. Quando uma radiação de freqüência ω atravessa o meio, sua intensidade varia no espaço de acordo com (8.13), I(x) = I(0) e−αx . Em equilı́brio térmico, a população N1 do nı́vel de menor energia é maior que a do nı́vel de maior energia, N2 , de modo que α > 0. Nesta situação a radiação é absorvida pelas transições de E1 para E2 , fazendo com que sua intensidade diminua à medida que ela atravessa o meio. Entretanto, se houver um mecanismo externo de inversão de população, tornando N2 > N1 , teremos α < 0 e portanto a radiação será amplificada pela emissão estimulada. Assim, quando N2 > N1 , definimos o ganho do meio como γ(ω) = −α(ω). Naturalmente o sistema tem perdas, principalmente causadas pela radiação que sai da cavidade ressonante. Desta forma, é preciso que o processo de bombeamento faça a inversão de população ultrapassar um valor crı́tico (N2 − N1 )c para que o ganho total seja maior que as perdas. Nesta situação o sistema gera uma radiação pela emissão estimulada. O valor crı́tico da diferença de população é determinado pela condição na qual o ganho na intensidade ao longo do comprimento do meio ativo iguala às perdas. As perdas têm duas origens, a atenuação ao longo do feixe, causada pela difração e por interações com outras excitações, e a perda por radiação para fora da cavidade óptica. Esta última é grande para freqüências diferentes das freqüências de ressonância da cavidade. Por esta razão, o laser opera somente nos comprimentos de onda correspondentes às ressonâncias da cavidade, dados por 2L (8.77) λ = m 350 Materiais e Dispositivos Eletrônicos Figura 8.35: Espectro de emissão da luz de um laser de He-Ne mostrando os modos longitudinais. onde λ é o comprimento de onda no meio ativo, L é a distância entre os espelhos da cavidade e m é um número inteiro. Sendo λ relacionado com o comprimento de onda no vácuo (praticamente igual ao do ar) por λ = nλ , onde n é o ı́ndice de refração, obtemos as freqüências de operação do laser, c c ν= =m . (8.78) λ 2nL Os lasers operam em uma ou mais freqüências dadas por esta relação e que estão na faixa da curva de ganho do meio ativo. Em geral os lasers operam simultaneamente em vários modos da cavidade, chamados modos longitudinais, cada um com largura de linha da ordem de alguns MHz, que é muito menor que a largura da curva de ganho. Por exemplo, a curva de ganho do laser de He-Ne tem uma largura de cerca de 1 GHz, que comporta 20 modos longitudinais espaçados de 500 MHz, que é o valor obtido com (8.48) para uma cavidade óptica com 30 cm de comprimento. A Figura 8.35 mostra um espectro tı́pico de um laser de He-Ne. A Figura 8.36 ilustra o que ocorre com a curva de ganho γ(ω) de um laser, para três valores da diferença de população ∆N = N2 − N1 . Na curva 1 ∆N é tal que o ganho é menor que a taxa de perdas em qualquer valor de freqüência. Nesta situação o laser não emite radiação. A curva 2 corresponde à taxa de bombeamento crı́tica, para a qual ∆N faz o máximo de γ(ω) igualar a perda. Com uma taxa de bombeamento maior, o ganho supera a perda numa certa faixa de freqüências. Nesta situação, o sistema mantém uma radiação com freqüência ωc determinada pela cavidade ressonante. A depressão que aparece na curva 3 resulta do fato de que a intensa radiação criada na cavidade aumenta Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 351 Figura 8.36: Curvas de ganho de um laser para três valores da diferença de população ∆N = N2 − N1 : ∆N3 > ∆N2 > ∆N1 . as transições do nı́vel 2 para o nı́vel 1, tendendo a igualar as populações. O regime estacionário de operação é atingido quando a taxa de ganho é igual a taxa de perdas. O requisito fundamental para ocorrer emissão estimulada de radiação e ganho é a inversão de população no meio ativo. Há vários métodos para inverter as populações de dois nı́veis, dos quais os mais importantes são: • Bombeamento óptico ou excitação por fótons; • Excitação eletrônica; • Colisão inelástica entre átomos; • Injeção de portadores em semicondutores. A inversão de população entre dois nı́veis envolvidos na emissão estimulada em sistemas homogêneos requer a existência de pelo menos outro nı́vel de energia. A Figura 8.37 mostra dois modos de operação num sistema de três nı́veis. Em (a) os elétrons passam do estado fundamental E1 para um terceiro estado E3 através de um dos possı́veis processos de bombeamento. Este terceiro estado é selecionado de tal maneira que as transições de E1 para E3 sejam bastante eficientes pelo processo de bombeamento usado. De E3 para E2 as transições devem ser rápidas e não radiativas. Com isto há um acúmulo de população em E2 , o que resulta numa inversão de população em relação ao nı́vel E1 . A radiação do laser ocorre então nas transições do nı́vel E2 para o nı́vel Ei . A Figura 8.37(b) ilustra o outro modo possı́vel de operação com três nı́veis, no qual a radiação ocorre em transições do nı́vel mais alto para outro intermediário, que por sua vez relaxa para o estado fundamental. Nos processos de bombeamento óptico utiliza-se uma fonte de luz ex- 352 Materiais e Dispositivos Eletrônicos Figura 8.37: Processos de emissão estimulada em sistemas de 3 nı́veis. terna, que pode ser uma lâmpada de flash de alta potência, para aumentar a população de uma banda acima dos dois nı́veis de interesse. Este método de excitação é empregado em lasers com materiais sólidos, como os de rubi, de outros cristais ou de vidros dopados com impurezas apropriadas. Os processos de excitação eletrônica são em geral utilizados em gases. Na descarga elétrica num gás, os elétrons da corrente são acelerados pela tensão aplicada e colidem com os ı́ons do gás. Nesta colisão eles transferem energia aos ı́ons, fazendo com que elétrons do estado fundamental passem para estados excitados. Este processo é utilizado em lasers de Argônio. Outro processo de bombeamento importante em gases é o de colisão átomo-átomo, no qual numa descarga elétrica um certo tipo de átomo colide com outro deixando este no estado excitado para irradiar. Este processo é importante nos lasers com misturas de gases, como o de Hélio-Neônio. Finalmente, outro método importante é o de injeção de portadores numa junção de semicondutores. Como vimos na Seção 8.5, a corrente elétrica numa junção p+ -n faz buracos do lado p+ difundirem para o lado n, resultando num excesso de buracos em relação aos elétrons. Assim, na região da junção ocorre uma inversão de população, no sentido em que há mais portadores minoritários que haveria na situação de equilı́brio térmico. Isto resulta na recombinação de pares elétron-buraco e na geração de fótons, por emissão espontânea como num LED, ou por radiação estimulada. A seguir apresentaremos alguns detalhes de diversos lasers importantes comercialmente. Devido a sua grande importância na opto-eletrônica, o laser de diodo semicondutor será apresentado em maior detalhe na próxima seção. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 8.6.2 353 Lasers de Sólidos com Impurezas Nos lasers de sólidos com impurezas, também chamados lasers de estado sólido, o meio ativo é um bastão de material cristalino transparente, ou de vidro, dopado com ı́ons de impurezas cujos nı́veis de energia são adequados para emissão estimulada. A cavidade óptica é, em geral, formada por dois espelhos externos, sendo um deles totalmente refletor enquanto o outro transmite uma pequena fração da radiação incidente. É através do espelho parcial que uma parte da energia da radiação armazenada na cavidade passa para o exterior, produzindo o feixe de laser. Os estados excitados das impurezas são populados por bombeamento óptico, produzido por lâmpadas de flash ou por outro laser. A Figura 8.38 mostra o arranjo original utilizado no laser de rubi. O rubi é um cristal de safira, A2 O3 , contendo impurezas de Cr3+ em pequenas concentrações, de 0,01 a 0,1%. Os nı́veis de energia do Cr3+ em A2 O3 e as três transições envolvidas na ação do laser estão mostrados na Fig.8.14. O bombeamento óptico leva os elétrons do estado fundamental, nı́vel 1, para uma banda relativamente larga (3). Eles então decaem num tempo curto, da ordem de 10−8 s, para o nı́vel 2. Como o tempo de decaimento de 2 para 1 é longo (∼ 10−3 s), ocorre um acúmulo de elétrons no nı́vel 2 e inversão de população em relação ao nı́vel 1. A transição estimulada de 2 para 1 gera a radiação vermelha do laser de rubi, com comprimento de onda 694,3 nm. Como a lâmpada de flash é acionada pela descarga de um capacitor, indicado na Fig.8.38, a luz de bombeamento tem a forma de pulsos com duração de Líquido para resfriamento Lâmpada de flash Feixe de saída Bastão de rubi Espelho parcial Espelho externo Figura 8.38: Arranjo utilizado em laser de rubi bombeado por lâmpada de flash. 354 Materiais e Dispositivos Eletrônicos alguns ms. Por esta razão, em vez de gerar uma radiação contı́nua, o laser emite pulsos de luz com uma taxa de repetição determinada pelo circuito de descarga. A escolha da taxa de repetição depende da capacidade de resfriar o bastão de rubi. Este refriamento pode ser feito circulando água em contato com o bastão, como mostrado na Fig.8.38. Note que nos atuais lasers de sólidos com impurezas que empregam lâmpada de flash, ela não é enrolada em torno do bastão, como no arranjo original da Fig.8.38. Ela tem a forma de um tubo cilı́ndrico, colocado paralelo ao bastão do sólido, no interior de uma cavidade metálica, de seção elı́ptica, polida internamente. A lâmpada é colocada num dos focos da elipse e o bastão no outro, de modo que a radiação do flash é focalizada no bastão. Um dos lasers de estado sólido mais importantes da atualidade é o de neodı́mio-YAG, Nd-YAG. Sua ação ocorre nos nı́veis de energia de impurezas de Nd3+ no cristal da granada de alumı́nio e ı́trio, cuja fórmula quı́mica é Y3 A5 O12 . O nome YAG vem das iniciais em inglês, Yttrium Aluminum Garnet. A Figura 8.39 ilustra os nı́veis de energia e as transições importantes do laser de Nd-YAG. O bombeamento óptico feito pela radiação de uma lâmpada de flash, ou de um laser de diodo semicondutor, leva os elétrons do estado fundamental para uma banda larga de estados excitados. De lá eles caem para o estado 4 F3/2 por transições não-radiativas. A transição deste estado para o estado 4 I11/2 produz a radiação laser no comprimento de onda Figura 8.39: Esquema de energias e de transições responsáveis pela radiação de comprimento de onda 1064 nm no laser de Nd-YAG. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 355 λ = 1064 nm, situado no infravermelho próximo. O ganho do laser de Nd-YAG é cerca de 75 vezes maior que o de rubi. Por isto ele pode ser bombeado com luz contı́nua de um laser de diodo, como ilustrado na Figura 8.40. O feixe do laser de diodo passa por duas lentes que o focalizam no eixo do bastão de Nd-YAG. A superfı́cie de entrada do bastão é esférica e recoberta por camadas dielétricas que transmitem a radiação de 809 nm e refletem a radiação de 1064 nm. A superfı́cie plana, na outra extremidade, tem uma camada refletora, formando a cavidade óptica. Quando operado com lâmpadas de flash, ele atinge potências de pico muito altas. Apesar de operar no infravermelho, o laser de Nd-YAG é mais utilizado para aplicações na região visı́vel. Isto é conseguido fazendo o feixe pulsado passar por um cristal gerador de segundo harmônico, que converte a maior parte da radiação em luz verde, com λ = 532 nm. (veja Seção 10.2.2). Os lasers de estado sólido bombeados com a luz do feixe de um laser de diodo, como na Figura 8.40, produzem radiação contı́nua, designada de CW (do inglês Continuous Wave). Os lasers bombeados por lâmpadas de flash produzem luz na forma de pulsos emitidos periodicamente. Os pulsos são longos, com duração de alguns ms, e a taxa de repetição é baixa, com alguns tiros por segundo, porque estas são as caracterı́sticas da descarga elétrica na lâmpada de flash. Os lasers pulsados são importantes em aplicações que requerem alta potência de luz, pois a energia acumulada no perı́odo é emitida num intervalo de tempo muito menor. Existem outros métodos para produzir pulsos de luz em lasers de estado sólido e outros tipos, como a gás e de lı́quidos corantes, com bombeamento contı́nuo. Dois métodos que possibilitam obter pulsos muito curtos são o chaveamento-Q (Q-switching em inglês) e o travamento de modos (mode locking). Em ambos os métodos, os espelhos da 1064 nm Laser de diodo 809 nm Lentes Bastão de Nd: YAG Figura 8.40: Esquema de bombeamento do laser de Nd-YAG com radiação contı́nua de um laser de diodo. 356 Materiais e Dispositivos Eletrônicos cavidade devem ser externos ao meio ativo, pois o mecanismo requer a inserção de um dispositivo no caminho do feixe no interior da cavidade. O método de Q-switching consiste em deteriorar o Q da cavidade durante um certo tempo, impedindo a ação de laser. Como o bombeamento é contı́nuo, enquanto o Q está baixo e não há radiação estimulada, a população dos estados excitados aumenta e ultrapassa muito o valor crı́tico emissão de luz com o Q normal. Periodicamente então o Q é restaurado, proporcionando a emissão de pulsos curtos de alta potência. Um dos mecanismos utilizados para variar o Q é a modulação da polarização da luz por meio de um modulador eletro-óptico (seção 10.2) colocado no interior da cavidade. Quando a polarização da luz é alterada numa passagem do feixe, o feixe refletido num espelho retorna com uma polarização diferente do incidente e não produz interferência construtiva necessária para a ressonância. O método de mode locking também utiliza uma modulação interna na cavidade, mas o mecanismo é baseado na existência de um grande número de modos longitudinais. Pode-se mostrar que a modulação de amplitude com freqüência igual a da separação dos modos produz o travamento das fases dos modos. Como eles têm freqüências diferentes, periodicamente as fases de todos eles coincidem, o que resulta num trem de pulsos de radiação. O perı́odo de emissão dos pulsos é o inverso da freqüência de espaçamento dos modos. Outro laser de estado sólido muito utilizado atualmente por conta de sua versatilidade é o laser de titânio-safira (Ti3+ :A2 O3 ). Este laser pode operar Figura 8.41: Bandas de absorção e de emissão em Ti3+ :A2 O3 . Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 357 nos regimes CW ou pulsado (Q-switching ou mode-locking). As impurezas de Ti3 têm uma banda de absorção com pico em torno de 500 nm, como mostrado na Figura 8.41, e uma banda de emissão larga, podendo operar em toda a faixa de 660 nm−1180 nm, com o uso adequado de filtros e espelhos na cavidade óptica. Sua eficiência de conversão, definida como a potência óptica emitida dividida pela potência elétrica gasta, é de aproximadamente 0,01%. Este valor é baixo comparado com o do laser de Nd:YAG (0,5%), mas é da mesma ordem dos lasers a gás. O laser de Ti:safira é comumente bombeado por um laser de Argônio (514 nm) ou pelo segundo harmônico de um laser de Nd:YAG (532 nm). Para potências ópticas de bombeamento tı́picas da ordem de 10 W, cerca de 1,5 W pode ser emitido no laser de Ti:safira em regime CW. Ele também opera em regime de mode-locking, emitindo pulsos ultracurtos. Como a largura da linha de transição de Ti:safira é de 100 THz, pulsos de duração curta como 10 fs (1 fs = 10−15 s) são produzidos em laboratórios de pesquisa. Os lasers comerciais de Ti:safira emitem pulsos da ordem de 50 fs. 8.6.3 Lasers a Gás Nos lasers a gás, a emissão estimulada ocorre entre estados quânticos de átomos ou moléculas, que são em geral excitados por meio de colisões numa descarga elétrica. A Figura 8.42 mostra os componentes básicos de um laser a gás. A alta tensão aplicada aos eletrodos do tubo mantém uma descarga elétrica no gás, que pode estar confinado ou circulando. Quando a cavidade óptica é formada por espelhos externos, as extremidades do tubo são feitas com placas transparentes, inclinadas com ângulo de Brewster, para minimizar as perdas Tensão para descarga Feixe de saída Janela de Brewster Espelho refletor Figura 8.42: Componentes básicos de um laser a gás. Espelho parcial 358 Materiais e Dispositivos Eletrônicos por reflexão. Nos pequenos lasers a gás, os espelhos são feitos internamente nas próprias extremidades do tubo. O laser de Hélio-Neônio foi o primeiro laser a gás descoberto, sendo ainda hoje muito utilizado em aplicações simples de baixa potência. Na descarga através da mistura dos dois gases, os átomos de He são facilmente excitados por colisões eletrônicas. As excitações desses átomos são transferidas para os estados 2S e 3S do Ne, que coincidentemente têm energias quase iguais as do He. As transições com emissão estimulada ocorrem nos átomos de Ne entre os nı́veis ilustrados na Fig.8.43, que também mostra os comprimentos de onda correspondentes às transições. As transições 3S-3p e 2S-2p ocorrem no infravermelho, enquanto a transição 3S-2p tem λ = 632,8 nm, situada na região vermelha do espectro. O laser de He-Ne é de fabricação simples e opera continuamente com baixa corrente, sendo por isto muito utilizado numa grande variedade de aplicações de baixa potência (alguns mW). Outro laser a gás importante com radiação de luz visı́vel é o laser de Argônio. Ele opera com transições eletrônicas nos ı́ons de Ar, produzindo radiação em várias linhas do espectro visı́vel. As mais intensas ocorrem em λ = 488 nm (azul) e 514,5 nm (verde). Geralmente, o laser de Ar opera Figura 8.43: Nı́veis de energia e transições de laser em átomos de Neônio. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 359 continuamente com potências que vão desde centenas de mW a dezenas de W, encontrando inúmeras aplicações médicas, industriais e cientı́ficas. Na categoria de lasers a gás moleculares, o mais importante é o de dióxido de carbono, CO2 . Neste sistema os nı́veis quânticos envolvidos nas transições do laser estão associados às vibrações da molécula de CO2 . A emissão estimulada tem comprimento de onda em torno de 10 µm, correspondente à radiação infravermelha. O laser de CO2 tem construção fácil e robusta e produz radiação contı́nua com potência de dezenas a centenas de W, sendo também muito empregado na indústria e na medicina. 8.7 O Laser de Diodo Semicondutor O laser de diodo semicondutor, mais conhecido como laser de diodo, é, de longe, o mais importante para a opto-eletrônica. Enquanto todos os lasers mencionados na seção anterior são grandes, dispendiosos e necessitam de potências significativas para funcionar, o de semicondutor tem dimensões submilimétricas, baixo custo e requer baixa potência de alimentação. Ele foi descoberto em 1962, porém foram necessários muitos anos de pesquisa e desenvolvimento para que ele chegasse ao atual estágio tecnológico. Os primeiros lasers eram formados de diodos de junção simples de GaAs e só operavam em temperatura de hélio lı́quido (4,2 K) com correntes relativamente altas. No final da década de 1960 alguns laboratórios conseguiram materializar propostas teóricas do russo Zhores Alferov e do alemão-americano Herbert Kroemer, que mostravam a possibilidade de aumentar o ganho do laser com um confinamento de elétrons e buracos em heterojunções. Dentre os grupos que conseguiram fabricar lasers de heterojunções operando à temperatura ambiente, estava o do Laboratório Bell, integrado pelo fı́sico brasileiro José Ripper Filho. Atualmente os lasers de diodo são feitos com heterojunções múltiplas de ligas de semicondutores de gap direto, operam à temperatura ambiente e com baixas correntes, e produzem potências de luz que variam de alguns mW, comparáveis com as do laser de He-Ne, a dezenas de watts. O laser de diodo semicondutor tornou-se um componente essencial dos sistemas de comunicação óptica, de inúmeros equipamentos eletrônicos e de outras aplicações, o que contribuiu para que Alferov e Kroemer fossem agraciados com o prêmio Nobel de Fı́sica no ano 2000. 360 8.7.1 Materiais e Dispositivos Eletrônicos O Laser de Diodo de Junção p-n Um dos mecanismos básicos para operação de um laser, a inversão de população, ocorre naturalmente numa junção p-n feita de semicondutor de gap direto, polarizada diretamente. Isto porque os elétrons do lado n que se movem em direção à região da junção e são injetados no lado p, produzem na banda de condução do lado p uma concentração maior que a de equilı́brio térmico. Situação semelhante também acontece com os buracos injetados no lado n. A recombinação de pares elétron-buraco, que ocorre para fazer com que as concentrações atinjam o equilı́brio nos dois lados, produz a emissão espontânea caracterı́stica dos LEDs. Entretanto, quando a injeção é suficientemente forte, a condição crı́tica de operação laser pode ser alcançada e o diodo emite radiação estimulada. Para atingir a condição de laser, a junção p-n deve ter grandes dopagens nos dois lados, ou seja, deve ser formada por semicondutores degenerados. Nesta junção, o nı́vel de Fermi EF n do lado n está acima do mı́nimo da banda de condução, Ecn , enquanto no lado p o nı́vel EF p está abaixo do máximo da banda de valência, Evp . A Figura 8.44 ilustra as bandas de energia numa junção deste tipo. Em (a) não existe tensão aplicada, de modo que o nı́vel de Fermi é o mesmo nos dois lados. Em (b) a junção está polarizada diretamente, de modo que as energias do lado p diminuem em relação às energias do lado n, sendo a diferença das energias dos nı́veis de Fermi nos dois lados igual a eV , onde V é a tensão aplicada. Finalmente, a Fig.8.44(c) mostra o que ocorre com uma tensão ainda maior: na região de transição da junção a banda de condução é preenchida com elétrons provenientes do lado n, enquanto a banda de valência recebe buracos do lado p. Isto produz inversão de população nesta região, o que resulta em altas taxas de recombinação acompanhada de emissão espontânea de luz. Os fótons criados neste processo e que ficam confinados na região da junção, fazem a taxa de recombinação aumentar ainda mais através da emissão estimulada. A ação de laser ocorre quando a corrente no diodo ultrapassa um certo valor crı́tico para o qual o ganho óptico iguala as perdas no sistema. A freqüência ν dos fótons emitidos na transição banda-a-banda é dada, no mı́nimo, por hν = Eg . Por outro lado, pela condição de inversão de população ilustrada na Fig.8.44(c), vemos que o máximo valor de ν é dado por EF n − EF p ≥ hν. Portanto, a condição de operação de um laser de junção p-n é, EF n − EF p ≥ hν ≥ Eg . (8.79) Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 361 Figura 8.44: Diagramas de energia em junção p-n formada por semicondutores degenerados: (a) Sem tensão aplicada; (b) Com polarização direta; (c) Com tensão suficientemente alta para produzir inversão de população na região de transição. Para aumentar o ganho, diminuir as perdas e fazer a radiação sair apenas numa direção, é preciso construir uma cavidade óptica na junção. As duas superfı́cies planas e paralelas que formam os espelhos da cavidade são feitas através da clivagem do chip da junção nos planos cristalinos, como ilustrado na Figura 8.45. Como o ı́ndice de refração de GaAs é n = 3, 6, a refletividade de um espelho deste tipo, dada pela Eq.(8.21), é R = 0, 32. Este valor é suficiente para criar uma cavidade óptica entre os dois planos de clivagem. Entretanto, para aumentar o ganho e fazer a radiação sair apenas num sentido, cobre-se um dos lados com filme metálico. Além disso, para evitar que a radiação também saia lateralmente, usa-se um abrasivo para tornar ásperas as duas superfı́cies laterais. Isto elimina o efeito da cavidade ressonante na direção lateral, fazendo com que o feixe de radiação saia apenas pela superfı́cie frontal. 362 Materiais e Dispositivos Eletrônicos Figura 8.45: Ilustração de um laser de junção p-n. A Figura 8.46 mostra o comportamento da intensidade e do espectro da radiação do laser com a corrente na junção. Na Fig. 8.46(a) vemos que quando a corrente é menor que um valor crı́tico Ic , a intensidade da radiação é pequena. Nesta situação ela é devida à emissão espontânea que ocorre nas vizinhanças da junção, como num LED. Neste caso o espectro de radiação é largo, como ilustrado na Fig.8.46(b). Entretanto, se I > Ic , a radiação passa a ter intensidade muito maior, com um espectro confinado a uma faixa estreita de freqüências. Estas duas caracterı́sticas constituem as principais diferenças entre o LED e o laser de junção: o laser emite radiação estimulada com um Figura 8.46: Comportamento da potência luminosa emitida por um laser semicondutor. Quando a corrente I é maior que um valor crı́tico Ic , a potência aumenta bruscamente (a) e seu espectro torna-se estreito (b). Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 363 espectro estreito, enquanto o LED emite radiação espontânea com espectro largo; o laser só opera com corrente acima de um valor crı́tico, ao passo que o LED opera com qualquer corrente. Na realidade, o laser de diodo opera em vários modos longitudinais, com freqüências dentro da faixa da curva de ganho. Exemplo 8.5: Calcule o espaçamento entre os modos longitudinais de um laser de diodo de GaAs, com cavidade óptica de comprimento 1 mm. Sendo λ o comprimento de onda da luz no GaAs, a condição de ressonância na cavidade óptica é L = mλ = m c λ =m , n nν onde n é o ı́ndice de refração, λ é o comprimento de onda no vácuo e ν a freqüência. Então, a diferença entre as freqüências de dois modos vizinhos (m e m ± 1) é ∆ν = c/nL. Considerando o ı́ndice de refração do GaAs n = 3, 6, vem, ∆ν = 3 × 108 = 8, 3 × 1010 Hz = 83 GHz . 3, 6 × 10−3 O laser de semicondutor formado por apenas uma junção p-n, também chamado laser de homojunção, foi o primeiro a ser desenvolvido. Este tipo de laser apresenta vários problemas, sendo os principais: sua corrente crı́tica é alta; para evitar super-aquecimento ele deve ser colocado em baixas temperaturas ou operar em modo pulsado; a largura espectral da radiação é grande comparada com outros tipos de laser; a potência luminosa é pequena comparada com outros tipos de laser; como a radiação é emitida numa região de espessura (< 1 µm) menor que o comprimento de onda, a difração é grande e o feixe não sai colimado. Vários desses problemas são contornados nos lasers de heterojunções, descritos a seguir. 8.7.2 Lasers de Heterojunções No laser de homojunção a inversão de população que produz a recombinação de pares elétron-buraco com emissão de fótons ocorre apenas na região de carga espacial, como mostrado na Fig.8.44(c). Mas nem todos elétrons e buracos que chegam na junção participam deste processo. Muitos deles são injetados no outro lado como portadores minoritários e difundem numa região de espessura 364 Materiais e Dispositivos Eletrônicos na faixa de 1-10 µm. Desta forma, para que a taxa de emissão de fótons seja maior que as perdas ópticas e produzir a operação do laser, é necessário que a corrente seja alta. Este fato é o maior responsável pela elevada corrente crı́tica do laser de homojunção, que é da ordem de 40-100 kA/cm2 em junções de GaAs à temperatura ambiente. Outro efeito que contribui para o alto valor da corrente crı́tica no laser de homojunção é a forte difração da luz. Ela faz com que muitos fótons emitidos saiam da região da junção, deixando de contribuir para a emissão estimulada. Nos lasers de heterojunções estes dois efeitos são muito menores, de modo que as correntes crı́ticas são reduzidas em várias ordens de grandeza em relação ao laser de homojunção, situando-se na faixa de 100-500 A/cm2 . Como vimos na seção 6.3.2, numa heterojunção existe uma barreira de potencial devido Figura 8.47: Estruturas de lasers de heterojunções: (a) heterojunção simples; (b) heterojunção dupla; (c) heterojunção dupla em geometria estriada. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 365 à diferença entre os gaps de energia dos dois lados. Isto permite construir estruturas de heterojunções com barreiras de potencial que produzem confinamento de elétrons e buracos numa camada fina, com espessura da ordem de 0,1-0,5 µm. Ao mesmo tempo, como os ı́ndices de refração nos dois lados da heterojunção são diferentes, devido também à diferença dos gaps de energia dos semicondutores, há um confinamento dos fótons emitidos. O aumento da concentração de pares elétron-buraco e de fótons na mesma região espacial, resulta numa maior taxa de recombinação e portanto numa menor corrente crı́tica. A Figura 8.47 mostra três estruturas de lasers de heterojunções de GaAs e (GaA)As. As estruturas são feitas depositando-se camadas de espessuras e composições desejadas sobre um substrato de GaAs monocristalino. A deposição pode ser feita pela técnica mais simples de epitaxia de fase lı́quida (LPE) ou pela sofisticada técnica de epitaxia de feixe molecular (MBE). A concentração x do A na liga Ga1−x Ax As determina o valor do gap de energia Eg , que varia entre 1,43 eV (x = 0) e 2,16 eV (x = 1). O semicondutor tipo p é feito com difusão de átomos do grupo II, Zn por exemplo, formando impurezas aceitadoras. Para dopagem tipo n podem ser utilizados elementos do grupo IV, como Sn. Os átomos desses elementos doam um elétron para os átomos de Ga ou A, que são do grupo III, formando impurezas doadoras. A Figura 8.48(a) apresenta o modelo unidimensional de um laser com uma junção p-n simples de GaAs e uma heterojunção de p GaAs−p Ga1−x Ax As. A figura 8.48(b) mostra o diagrama de energia sem tensão aplicada e a figura (c) mostra o diagrama com polarização direta. A região central da estrutura é feita do tipo p porque a injeção de elétrons para o lado p é mais eficiente do que a injeção de buracos no sentido oposto. Quando uma tensão é aplicada para polarizar a junção p-n no sentido direto, os elétrons provenientes do lado n são injetados na região central tipo p. A barreira de potencial criada na heterojunção impede a passagem dos elétrons para o lado p GaAAs. Como a espessura da região central é muito menor que o comprimento de difusão, os pares elétron-buraco ficam confinados nesta região e distribuı́dos uniformemente. A diferença entre os ı́ndices de refração de GaAs e GaAAs faz com que os fótons emitidos na recombinação sejam refletidos na interface entre os dois materiais, aumentando a taxa de emissão estimulada. A operação do laser ocorre quando a corrente ultrapassa um certo valor crı́tico, com emissão de fótons com energia aproximadamente igual a do gap de GaAs, Eg = 1, 43 eV. Isto corresponde à radiação no infravermelho próximo, com comprimento de 366 Materiais e Dispositivos Eletrônicos Figura 8.48: Laser de diodo semicondutor com uma junção p-n de GaAs e uma heterojunção de GaAs − GaAAs: (a) modelo unidimensional; (b) diagrama de energia em equilı́brio; (c) diagrama de energia com polarização direta. As linhas tracejadas indicam o nı́vel de Fermi. As bolas pretas representam os elétrons e as bolas brancas representam os buracos. onda λ = 860 nm. A descoberta no final da década de 1960 do laser de heterojunção operando à temperatura ambiente, impulsionou as atividades de pesquisa nesses lasers, principalmente pelo seu potencial na opto-eletrônica e nas comunicações ópticas. Durante os anos 70 e 80, laboratórios de todo o mundo competiram para desenvolver estruturas de heterojunções com menor corrente crı́tica, melhor colimação do feixe de radiação e maior estabilidade de operação de lasers em diferentes comprimentos de onda. O desenvolvimento da Fı́sica do Estado Sólido no Brasil propiciou a criação de um grupo de pesquisa em laser semicondutor na Universidade Estadual de Campinas, liderado por Ripper, que acompanhou de perto a maturação desta tecnologia e a transferiu para empresas nacionais. A estrutura da Fig.8.47(b), chamada de heterojunção dupla, representa um avanço em relação a de heterojunção simples pois aumenta o confinamento Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 367 de portadores e de fótons na região central. A estrutura e o esquema de bandas da heterojunção dupla estão ilustrados na Figura 8.49. O fato da camada de GaAs estar situada entre camadas de GaAAs, que tem um gap de energia maior, acentua o poço de potencial tanto para os elétrons na banda de condução quanto para os buracos na banda de valência. Uma redução maior na corrente crı́tica e na largura do feixe é alcançada utilizando um contato metálico na forma de uma faixa estreita, com largura da ordem de 20 µm, com a geometria mostrada na Fig.8.47(c). O desenvolvimento desta estrutura de heterojunção dupla representou um grande avanço para a utilização prática do laser de diodo semicondutor em comunicações ópticas. Atualmente os lasers de semicondutores utilizam estruturas com inúmeras camadas de ligas com diferentes concentrações dos constituintes e de impurezas. Os objetivos da sofisticação das estruturas são: redução da corrente crı́tica; melhoria da colimação e distribuição espectral da radiação; maior estabilidade de operação e facilidade de modulação; e menor custo de fabricação dentro dos padrões de qualidade para a aplicação desejada. Esses lasers são produzidos por várias técnicas de crescimento epitaxial, como LPE, MBE e MOCVD. O material semicondutor utilizado no laser de diodo depende principalmente do comprimento de onda da radiação desejado. A Tabela 8.2 mostra as faixas cobertas por algumas das principais ligas de semicondutores. A variação das concentrações dos constituintes permite sintonizar o comprimento de onda do laser. Os lasers de (InGa)(AsP) são usados em comunicações ópticas. Uma das aplicações atuais mais importantes dos lasers de (GaA)As no infraver- Figura 8.49: Laser de diodo de heterojunção dupla: (a) modelo unidimensional; (b) diagrama de energia com a junção p-n polarizada, ilustrando o movimento dos elétrons (bolas pretas) e dos buracos (bolas brancas). Materiais e Dispositivos Eletrônicos 368 Liga λ(µm) Região do espectro Pbx Sn1−x Te 7-30 infravermelho (iv) In1−x Gax Asy P1−y 1,1-1,6 iv próximo Ga1−x Ax As 0,7-0,9 iv próximo Ga1−x Ax In1−y Py 0,6-0,8 vermelho e iv In1−x Gax N 0,4-0,5 violeta-azul Tabela 8.2: Faixas de comprimento de onda cobertas por diversas ligas usadas na fabricação de lasers semicondutores. melho é na leitura de discos ópticos, ou discos compactos (CD e DVD), usados em sistemas de som, computadores e vı́deos. Por outro lado, os lasers de (GaA)InP no vermelho estão substituindo os lasers a gás de He-Ne em diversas aplicações, com a enorme vantagem de serem alimentados por pequenas baterias em estruturas portáteis. Os lasers de InGaN, com emissão na região violeta-azul do espectro visı́vel, foram desenvolvidos no final da década de 1990 e estão encontrando inúmeras aplicações, dentre elas em DVD (Digital Video Disc) de alta definição. 8.7.3 Laser de Poço Quântico O diagrama de energia do laser de heteroestrutura dupla da Figura 8.49(b) representa a variação espacial dos nı́veis de energia Ev e Ec , correspondentes ao máximo da banda de valência e ao mı́nimo da banda de condução, respectivamente. Na realidade, em cada seção do modelo unidimensional da Figura 8.49(a), os elétrons podem ocupar estados com energia acima de Ec e os buracos podem ocupar estados com energia abaixo de Ev . Como ilustrado nas bandas de energia da Figura 5.7, a ocupação dos estados excitados é devido à energia térmica. Os elétrons têm energia numa faixa kB T acima de Ec e os buracos têm energia numa faixa kB T abaixo de Ev . Por esta razão, a radiação do laser de heteroestrutura tem uma largura de linha grande, que à temperatura ambiente é da ordem de kB T /h = 6 THz. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 369 Entretanto, se a camada de GaAs for muito fina, os efeitos quânticos do confinamento serão importantes. Neste caso, os estados dos elétrons e dos buracos não serão descritos por ondas propagantes na direção longitudinal, mas sim por ondas estacionárias, tı́picas de partı́culas num poço de potencial, como estudado na Seção 3.3.2. A Figura 8.50 ilustra o diagrama de energia de uma heterojunção de GaAAs/GaAs/GaAAs, com os poços de potencial para os elétrons na banda de condução e para os buracos na banda de valência. Na camada fina de GaAs, a energia mı́nima dos elétrons é E1 , e não Ec , enquanto a máxima energia dos buracos é E1 , e não Ev . Os poços de potencial criados pela diferença entre as energias do gap de GaAs e de GaAAs, têm profundidades que dependem das concentrações de Ga e de A. Como mostra a Tabela 8.1, para altas concentrações de A o gap se aproxima de 2,16 eV, enquanto o gap de GaAs é 1,43 eV. Assim, em heterojunções de ligas com altas concentrações de A, a profundidade do poço na banda de condução é da ordem de 0,5 eV. Como este valor é muito maior que a energia térmica dos elétrons, kB T = 0,025 eV à temperatura ambiente, efeito de confinamento quântico em camadas finas de GaAs é grande. O cálculo exato dos nı́veis de energia é mais complexo do que para um poço de potencial infinito, apresentado na seção 3.3.2. Porém, se a espessura x da camada de GaAs não for pequena demais, o nı́vel E1 estará próximo de Ec , podendo ser calculado aproximadamente como se a profundidade fosse infinita. Assim, usamos a Equação (3.44) com n = 1 para calcular, em primeira aproximação, o nı́vel de menor energia dos elétrons no Figura 8.50: Diagrama de energia de um laser de poço quântico. 370 Materiais e Dispositivos Eletrônicos poço, E1 = Ec + 2 π 2 . 2m∗e 2x (8.80) Do mesmo modo, o nı́vel de maior energia dos buracos é, E1 = Ev − 2 π 2 . 2m∗b 2x (8.81) Vemos que no laser de heteroestrutura dupla com uma camada de GaAs espessa, E1 se aproxima de Ec e E1 se aproxima de Ev . Neste caso, os efeitos de confinamento são pequenos. A radiação laser tem freqüência dada pela Equação (8.79) e largura de linha kB T /h. Por outro lado, se a espessura x é pequena, de tal modo que E1 − Ec dado por (8.80) é comparável ou maior que a energia térmica, a radiação tem largura de linha estreita e freqüência dada pela diferença entre (8.80) e (8.81), 1 2 π 2 1 + ∗ . hν = Eg + (8.82) 2 ∗ 2x me mb O laser de heteroestrutura dupla com x pequeno é chamado laser de poço quântico, ou laser QW (do inglês Quantum Well). Os lasers de poço quântico têm estrutura como aquela da Figura 8.47(c), onde a camada de pGaAs tem espessura da ordem de 100 Å. As principais vantagens do laser de poço quântico são: a largura de linha da radiação é mais estreita; a freqüência do laser pode ser sintonizada pela escolha adequada da espessura x , podendo ser maior que a freqüência de emissão de GaAs. Um problema do laser de poço quântico simples é a pequena área de recombinação dos pares elétron-buraco, o que compromete a intensidade da radiação. Este problema é resolvido no laser de múltiplos poços quânticos, ou MQW (Multiple Quantum Well), formado por um grande número de camadas com a repetição periódica da unidade básica da Figura 8.50. A primeira camada de GaAAs depositada sobre o substrato n-GaAs é dopada com impurezas doadoras, portanto é n-GaAAs. Todas as outras camadas, alternadamente GaAs (espessura de 100 Å ou menos) e GaAAs (espessura da ordem de 100 Å ou mais), são tipo p. Como o comprimento de difusão é da ordem ou maior que 10 µm = 100.000 Å, os elétrons injetados pelo conjunto n-GaAs/n-GaAAs alcançam todas as camadas do conjunto (p-GaAs/pGaAAs)m , mesmo que o número m de repetições seja de algumas dezenas. É importante notar também que como a distância entre dois poços vizinhos é Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 371 menor que o comprimento de onda da radiação, a emissão estimulada de poços vizinhos é sincronizada. Os lasers de múltiplos poços quânticos são fabricados pelas mesmas técnicas de produção dos lasers de heteroestruturas, que experimentaram grande evolução na década de 1990, possibilitando o crescimento de finas camadas de semicondutores com grande precisão e confiabilidade. Exemplo 8.6: Calcule para um laser de poço quântico de GaA As/GaAs( x )/GaA As, a espessura x para a qual: a) A energia E1 −Ec seja igual à energia térmica dos elétrons à temperatura T = 300 K; b) A emissão do laser tenha comprimento de onda de 820 nm. a) A espessura x que satisfaz a condição dada é obtida igualando à diferença de energia da Eq.(8.80) com a energia térmica, 2 π2 2m∗e 2 x = kB T , donde vem, x = π (2m∗e kB T )1/2 . Usando para a massa efetiva dos elétrons m∗e = 0, 068 m0 (Tabela 5.1) x = 1, 05 × 10−34 × 3, 14 (2 × 0, 068 × 9, 1 × 10−31 × 1, 38 × 10−23 × 300)1/2 = 1, 46 × 10−8 m . A espessura é então 146 Å. Camadas de GaAs mais finas resultam num espaçamento de energia E1 − Ec maior que a energia térmica, e portanto têm efeito quântico de confinamento. b) A espessura (8.82), x que resulta numa radiação laser com energia de fóton hν é obtida a partir de x = π 21/2 (hν − Eg )1/2 1 1 + ∗ m∗e mb 1/2 O comprimento de onda 820 nm corresponde a uma energia de fóton, hν = 6, 62 × 10−34 × 3 × 108 hc = eV , λ 820 × 10−9 × 1, 6 × 10−19 hν = 1, 51 eV . Sendo Eg = 1, 43 eV em GaAs, vem, hν − Eg = 0, 08 eV = 1, 28 × 10−20 J . Materiais e Dispositivos Eletrônicos 372 Usando este valor e m∗b = 0, 5 m0 (Tabela 5.1) na expressão de x = 1, 05 × 10−34 × 3, 14 (2 × 1, 28 × 10−20 × 9, 1 × 10−31 )1/2 x vem, 1 1 + 0, 068 0, 5 1/2 −9 m = 88, 6 Å . x = 8, 86 × 10 Veja que, como o parâmetro de rede do GaAs é 5,65 Å, esta espessura da camada de GaAs contém cerca de 16 células unitárias. 8.8 Aplicações dos Lasers de Diodo Os lasers de diodo semicondutor tornaram-se dispositivos essenciais de um grande número de equipamentos e sistemas desenvolvidos nas últimas décadas do Século XX. Suas aplicações vão desde equipamentos muito simples, como o apontador laser, a sofisticados equipamentos de comunicações ópticas de alta velocidade que conectam todo o globo terrestre. Muitos equipamentos tiveram seu desempenho melhorado e o custo reduzido com a substituição da fonte de luz por lasers de diodo, como a leitora óptica de código de barras nos supermercados, os aparelhos de fax e inúmeros equipamentos de diagnóstico médico, por exemplo. Outros equipamentos novos só se tornaram possı́veis com o desenvolvimento do laser de diodo, como os tocadores de discos ópticos compactos (CD player e DVD player). Cada aplicação requer um laser com radiação com comprimento de onda e outras caracterı́sticas especı́ficas, e portanto utilizando materiais e estruturas especı́ficas. Em geral os lasers são feitos com heteroestrutura dupla, mas certas aplicações requerem estruturas de múltiplos poços quânticos. O desenvolvimento de materiais, estruturas e processos de fabricação de lasers de diodo é uma área de atividades de pesquisa em inúmeros laboratórios acadêmicos e industriais em todo o mundo. Nesta seção abordaremos apenas duas das aplicações mais importantes dos lasers de diodo, comunicações ópticas e tocadores de discos compactos. 8.8.1 Comunicações Ópticas O advento das comunicações ópticas foi possı́vel não apenas pelo desenvolvimento dos lasers semicondutores e fotodiodos, mas também das fibras ópticas. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 373 A fibra óptica é um fio fino de seção reta circular, feita de material transparente, em geral vidro ou plástico. A fibra óptica é flexı́vel mecanicamente e não quebra quando é encurvada suavemente, sendo usada para guiar um feixe de luz através de caminhos sinuosos sem interferências do meio externo. A idéia básica do uso de fibra óptica como guia de luz é muito antiga. Um feixe de luz num material transparente com ı́ndice de refração n1 , incidindo na interface com outro material de ı́ndice de refração n2 < n1 , sofre reflexão total se o ângulo de incidência θ1 (em relação a normal) for maior que um valor crı́tico θc = arc sen (n2 /n1 ). Assim, um feixe pode propagar no interior de um cilindro maciço, sofrendo reflexões sucessivas na superfı́cie interna e sendo guiado ao longo do cilindro. Fibras ópticas de vidro ou plástico transparentes são usadas como guias de onda de luz para aplicações simples desde a década de 1930. Todavia, somente a partir da década de 1970 foram desenvolvidas fibras de sı́lica (SiO2 ) com baixas perdas, possibilitando guiar feixes de luz a grandes distâncias. A fibra óptica mais simples é feita de material homogêneo com certo ı́ndice de refração n > 1. Esta fibra não tem muita utilidade porque seu contato com qualquer material externo, como sujeira na superfı́cie, pode resultar em refração e consequente perda da energia luminosa guiada. Por esta razão as fibras ópticas são feitas com duas regiões, um núcleo central com raio R1 e ı́ndice de refração n1 , e uma casca com raio externo R2 > R1 e ı́ndice de refração n2 < n1 . Desta forma, a reflexão interna total ocorre na superfı́cie entre o núcleo e a casca, de modo que a propagação não é perturbada por interferências externas. A Figura 8.51 mostra a seção de uma fibra óptica e os dois perfis comuns de ı́ndice de refração. Na fibra com perfil em degrau, tanto o núcleo como a casca são homogêneos, de modo que n1 e n2 não variam com o raio. Suas principais aplicações são em iluminação e sistemas de imagem. Na fibra com perfil gradual, o ı́ndice de refração do núcleo varia com o raio, n1 (r), enquanto que a casca é homogênea. Uma forma muito comum é a parabólica, na qual n1 diminui a partir do eixo com o quadrado do raio. O material básico usado para a fabricação de fibras ópticas é a sı́lica fundida. A variação no ı́ndice de refração é obtida no processo de fabricação através de dopagens adequadas com diversos materiais, tais como GeO2 , P2 O5 , B2 O3 , etc. A proteção da fibra óptica é feita por meio de um revestimento plástico. A propagação da luz numa fibra óptica está ilustrada na Fig.8.52. Na fibra com perfil em degrau, a luz comporta-se como se fosse formada por raios 374 Materiais e Dispositivos Eletrônicos Figura 8.51: (a) Seção de uma fibra óptica mostrando o núcleo, a casca e o revestimento; (b) perfil de ı́ndice de refração em degrau; (c) perfil gradual. que propagam em linha reta, sofrendo reflexões sucessivas na superfı́cie interna da casca. Na fibra com perfil gradual as trajetórias dos raios são curvas porque eles sofrem refração contı́nua devido à variação do ı́ndice de refração n1 . Na realidade, a visão da onda formada por raios é uma simplificação do fenômeno. A propagação da onda guiada pela fibra é descrita matematicamente pelas soluções das equações de Maxwell na geometria cilı́ndrica da fibra. Essas soluções correspondem a modos discretos de propagação, que podem ser vistos como ondas propagantes ao longo do eixo da fibra e modos de onda estacionária na seção transversal. Os modos de onda estacionária são semelhantes às funções de onda de uma partı́cula num poço de potencial, como na Fig.3.3, com um certo número de máximos e de nulos do campo ao longo do diâmetro. Quanto maior a razão diâmetro/comprimento de onda, maior o número de máximos. Na visão simplificada da óptica geométrica, cada modo de onda estacionária corresponde a um ângulo diferente de propagação dos raios. Vemos então que quanto maior o diâmetro da fibra, maior o número de modos diferentes que podem propagar. Numa fibra de perfil em degrau, com diâmetro do núcleo de 125 µm, podem propagar milhares de modos no comprimento de onda de 0,85 µm. Uma fibra deste tipo é chamada multimodo. As fibras que permitem propagar apenas um modo são chamadas monomodo. A variação transversal do campo eletromagnético numa fibra monomodo se assemelha à função de onda do modo n = 1 na Fig.3.3. As fibras monomodo têm núcleo com diâmetro de cerca de 5-10 µm e casca com diâmetro 125 µm. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 375 Figura 8.52: Ilustração da propagação da luz em fibras ópticas: (a) perfil em degrau; (b) perfil gradual. Uma caracterı́stica fundamental das fibras ópticas é a variação da atenuação da energia luminosa com o comprimento de onda da luz. A Figura 8.53 mostra esta variação para uma fibra de sı́lica. Note que a escala vertical da figura é expressa em dB/km. O valor em decibel de uma atenuação A é dado por A(dB) = 10 log10 A. Assim, uma atenuação por um fator 10 corresponde a 10 dB, 100 corresponde a 20 dB, 1000 a 30 dB, etc. Esta notação é conveniente para exprimir grandezas multiplicativas, porque os valores em dB se somam. Por exemplo, como a atenuação total em dois trechos consecutivos de fibra é o produto das atenuações de cada um, o valor em dB é dado pela soma dos valores individuais em dB. A Figura 8.53 mostra três curvas de atenuação. A curva tracejada corresponde às fibras utilizadas até meados da década de 1990. Os picos na atenuação em 1240 nm e 1390 nm são devidos a modos vibracionais de impurezas de ı́ons OH− causadas pela presença de água dissolvida no vidro. A curva cheia corresponde às fibras comerciais fabricadas atualmente, por processos que reduzem a presença de impurezas. A curva com traço e ponto é produzida em laboratório e permite a utilização de uma faixa contı́nua de comprimentos de onda. A Figura 8.54 mostra os componentes básicos de um sistema de comunicações ópticas. O transmissor é composto por uma fonte de luz e um circuito driver. A fonte de luz é um laser de diodo semicondutor. O circuito driver serve para polarizar a fonte de luz e também para modular a luz de acordo com o sinal elétrico de entrada. O sinal luminoso gerado pelo transmissor é guiado pela fibra óptica até o receptor, onde é convertido em sinal elétrico no fotodetetor, amplificado e depois processado para restaurar o sinal original. Na comunicação em longas distâncias, são utilizados repetidores para amplificar o sinal entre o transmissor e o receptor. A grande vantagem da 376 Materiais e Dispositivos Eletrônicos Figura 8.53: Atenuação da luz em fibra óptica de sı́lica em função do comprimento de onda. comunicação óptica em relação aos sistemas baseados em microondas é sua grande largura espectral, que possibilita a transmissão numa única fibra de milhares de canais de voz ou de vı́deo. Com a crescente da digitalização das informações, a capacidade dos sistemas de comunicação passou a ser expressa em termos da velocidade de transmissão de pulsos, em bits por segundo (b/s). O primeiro sistema comercial de comunicação óptica foi implantado na segunda metade da década de 1980, operando com lasers de semicondutor de GaAs, com comprimento de onda em torno de 800 nm, a uma taxa de repetição de 45 Mb/s. Como a atenuação das fibras nesta região era alta, cerca de 2 dB/km, havia a necessidade de colocar repetidores a cada 10 km de distância. Os repetidores utilizados naquela época eram baseados em amplificadores eletrônicos, portanto eles tinham que detetar o sinal óptico, amplificar o sinal elétrico e depois modular um novo feixe de laser. Na década de 80 foram desenvolvidos sistemas operando em torno de 1300 nm, em que as fibras tinham atenuação de cerca de 0,6 dB/km. Eles empregavam lasers de semicondutor de InGaAsP, podendo operar com até 2 Gb/s e com uma distância de 44 km entre repetidores, que usavam amplificadores óptico-eletrônicos. Mais tarde foram desenvolvidos sistemas para 1550 nm, em que as fibras têm atenuação de 0,2 dB/km, podendo transmitir a distâncias de 70 km sem a necessidade de repetidores. Estes sistemas utilizam lasers de diodo de InGaAsP com uma concentração maior de In, operando com até 4 Gb/s. Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 377 Figura 8.54: Componentes básicos de um sistema de comunicações ópticas. O que possibilitou um grande aumento na velocidade de transmissão foi o desenvolvimento do amplificador óptico no final da década de 1980. O amplificador óptico consiste basicamente de uma fibra óptica com impurezas de terras raras. Na faixa em torno de 1550 nm são usadas fibras de sı́lica dopadas com Er, enquanto em 1300 nm usavam-se vidros fluoratos dopados com Pr. Estas impurezas têm nı́veis de energia que absorvem radiação no visı́vel e emitem no infravermelho. Quando bombeado por um laser de diodo, este sistema amplifica um sinal óptico que propaga na fibra, através de emissão estimulada. Os amplificadores ópticos possibilitaram o advento de uma nova área da tecnologia, na qual o processamento de sinais é inteiramente óptico, chamada fotônica. Na seção 10.2 apresentaremos alguns dispositivos ópticos baseados em materiais dielétricos que são empregados no processamento de sinais ópticos. A amplificação e o processamento totalmente ópticos do sinal permitiram o aumento da distância entre os repetidores. Os primeiros sistemas comerciais totalmente ópticos surgiram em 1990, funcionavam a 10 Gb/s e requeriam distâncias de 60 a 80 km entre os repetidores. Estes avanços cientı́ficos também possibilitaram o desenvolvimento de uma nova tecnologia de transmissão de vários canais numa só fibra, a WDM (Wavelength Division Multiplexing), que contribuiu para o grande aumento na taxa de transmissão de bits. Atualmente os sistemas de comunicação operam com taxas de transmissão superiores a 1 Tb/s. As faixas de comprimento de onda utilizadas para comunicação óptica estão assinaladas na Figura 8.54 e são designadas por letras 378 Materiais e Dispositivos Eletrônicos estabelecidas pela União Internacional de Telecomunicações (ITU, sigla para International Telecommunication Union). A banda S é a faixa que abrange os comprimentos de onda entre 1460 e 1530 nm, a banda C é a faixa entre 1530 e 1565 nm e a banda L é a faixa entre 1565 e 1625 nm. 8.8.2 Gravação e Reprodução em Discos Compactos Uma aplicação dos lasers de diodo semicondutor de importância econômica crescente é nos dispositivos de armazenagem de informação em discos ópticos, também chamados discos compactos, ou CD (Compact Disc). Eles são utilizados em aparelhos de reprodução de som, ou tocadores de CD (CD players), em aparelhos de reprodução de vı́deo, ou DVD (Digital Video Disc), e em unidades de gravação, armazenagem e leitura de informação digital em computadores. As principais vantagens destes dispositivos em relação a outros sistemas estão na grande capacidade de armazenagem dos discos ópticos, facilidade de transporte, e no fato do processo de leitura não requerer contato fı́sico com o disco. A Figura 8.55 ilustra os elementos básicos do processo de armazenagem e leitura em disco óptico. Nos discos ópticos de gravação permanente, a informação digital é registrada na forma de pequenas covas (pits, em inglês), mostradas nas Figuras 8.55 (b) e (c). As covas têm forma ovalada, com dimensões da ordem ou menor que 1 µm, dispostas ao longo de uma trilha em espiral. A presença da cova numa posição representa o bit 1, e a ausência representa o bit 0. O disco é de plástico, e sua preparação é feita por meio de um processo de injeção sobre uma matriz metálica plana, contendo ressaltos nas posições que irão produzir as covas. Após a injeção, a superfı́cie contendo as covas na trilha em espiral é metalizada com um filme de alumı́nio para refletir a luz. Finalmente, o conjunto é recoberto por um polı́mero transparente, visando proteger as covas e formar uma superfı́cie final lisa, para evitar o acúmulo de sujeira. Nos últimos anos foram desenvolvidos sistemas de gravação termo-óptica em CD, permanente ou regravável, compatı́veis com os sistemas tradicionais. Neste caso, o CD virgem consiste de uma camada de polı́mero uniforme, sobre um filme metálico plano. O processo de gravação de um bit 1 numa pequena região da camada é feito por aquecimento, produzido por um pulso de laser de diodo focalizado por uma lente, que resulta na mudança do ı́ndice de refração do material depois que esfria. A profundidade da região alterada é tal que no processo de leitura, a parte da luz que a atravessa e é refletida pelo filme metálico tem uma defasagem de 180◦ em relação à outra parte. Isto produz Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 379 interferência destrutiva na luz indicando a presença do bit 1, como no CD tradicional. As dimensões mostradas na Figura 8.55 (b) são tı́picas de CD de som e de armazenagem digital de computadores. Os lasers de leitura, neste caso, são de heteroestrutura dupla ou de MQW, de GaAs, operando no infravermelho com comprimento de onda de 780 nm. Os discos de vı́deo ou DVD requerem uma maior capacidade de armazenagem. Por isto, as dimensões das covas e a distância entre trilhas são cerca de 50% menores, e os lasers de leitura operam no vermelho, com 650 nm. O desenvolvimento de lasers de diodo operando no azul está possibilitando a redução das dimensões das covas e trilhas e o conseqüente aumento da capacidade de armazenamento, necessária para o DVD de alta definição e outras aplicações. Feixe incidente Trilhas 1,6 mm Superfície refletora 0,5 mm Lente 0,7 mm 1,2 mm Polímero transparente 00 1111 00 1110 1110 111010 1111 0 Figura 8.55: Elementos básicos de um sistema de CD: (a) Vista do disco óptico; (b) Ilustração das covas nas trilhas e da focalização do laser de leitura; (c) Vista lateral das covas através de corte do disco ao longo de uma trilha. 380 Materiais e Dispositivos Eletrônicos REFERÊNCIAS G.P. Agrawal, Fiber-Optic Communication Systems, John Wiley and Sons, New York, 2002. M. Fox, Optical Properties of Solids. Oxford University Press, Oxford, 2001. W.F. Giozza, E. Conforti, H. Waldman, Fibras Ópticas, McGraw Hill, São Paulo, 1991. R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. W.B. Jones, Jr, Introduction to Optical Fiber Communication Systems, Holt, Rinehart and Winston, New York, 1988. J. Leite Lopes, A Estrutura Quântica da Matéria, Editora UFRJ, Rio de Janeiro, 1992. H.P. Neff, Jr., Introductory Electromagnetism, John Wiley and Sons, New York, 1991. S.D. Smith, Optoelectronic Devices, Prentice Hall, New York, 1995. L. Solymar and D. Walsh, Lectures on the Electrical Properties of Materials, Oxford University Press, Oxford, 1988. B.J. Streetman and S. Banerjee, Solid State Electronic Devices, Prentice Hall, New Jersey, 2000. S.M. Sze, Semiconductor Devices, John Wiley and Sons, New York, 1985. J. Wilson and J.E.B. Hawkes, Optoelectronics, Prentice Hall, New York, 1992. D. Wood, Optoelectronic Semiconductor Devices, Prentice Hall, New York, 1994. A. Yariv, Optical Electronics, Holt, Rinehart and Winston, New York, 1991. PROBLEMAS 8.1 Mostre, a partir das equações de Maxwell, (2.1)-(2.4), que num meio de condutividade σ e sem carga elétrica (ρ = 0), o campo elétrico variando somente na direção x é descrito pela equação de onda (8.1). Cap. 8 Materiais e Dispositivos Opto-Eletrônicos 381 8.2 a) Mostre que numa onda plana senoidal com campo elétrico de amplitude E0 propagando num dielétrico com ı́ndice de refração n, o vetor de Poynting é dado pela equação (8.10). b) Calcule a intensidade da luz num feixe de laser com diâmetro 1 mm e potência média 10 W. c) Calcule o valor de E0 no feixe de laser do item b. 8.3 Mostre que numa onda plana senoidal com campo elétrico dado pela Eq.(8.9), a variação de intensidade no espaço é dada por (8.14). 8.4 a) Verifique que o comprimento de penetração δ, dado pela Eq. (8.30), tem a unidade do metro no Sistema Internacional. b) Calcule o valor de δ para a freqüência ν = 10 THz, da região infravermelho. c) Verifique que a freqüência de plasma, dada pela Eq.(8.32), tem a unidade rd/s. d) Calcule ωp para o cobre em Hz e em eV. 8.5 O ı́ndice de refração complexo de germânio para um feixe de luz de comprimento de onda de 400 nm é dado por N = 4,14 + i 2,221. Calcule: a) A velocidade de fase da luz; b) O coeficiente de absorção; c) A refletividade. 8.6 Calcule a transmissão total de uma amostra de germânio na forma de uma placa de faces paralelas e espessura 50 nm de um feixe de luz de comprimento de onda de 400 nm. 8.7 A largura de linha de uma absorção é definida como a diferença entre as duas freqüências para as quais a absorção é metade do valor máximo na ressonância. Mostre que para a função Lorentziana (8.40) a largura de linha é igual a taxa de amortecimento Γ. 8.8 Na comparação das equações (8.57) e (8.38), é necessário que (N1 − N2 )p212 /0 tenha a mesma dimensão que ωp2/ω0 . Mostre que isto é verdadeiro. 8.9 A partir da constante dielétrica para um sistema de dois nı́veis com linha Lorentziana, dado por (8.57), calcule o coeficiente de absorção α, em cm−1 , no pico da linha, para os seguintes valores: ν0 = 3 × 1014 Hz, N2 ≃ 0, N1 = 1018 cm−3 , Γ = 3 × 103 s−1 , p = e a0 , onde e é a carga do elétron e a0 o raio de Bohr. 8.10 Um átomo de hidrogênio está num campo eletromagnético linearmente polarizado com fótons de energia igual a separação dos nı́veis n = 1 e n = 2. Usando as autofunções da Tabela 3.1, mostre que só há transição de dipolo elétrico do estado n, , m = 1, 0, 0 para o estado 1, 1, 0. 8.11 Considere um foto-resistor para o infravermelho com dimensões 30 × 1 × 0, 1 mm3 , feito de Ge intrı́nseco, com tempo de recombinação τr = 10−6 s, submetido a uma tensão de 10 V. a) Calcule a variação de corrente nos terminais, produzida por uma variação de 1 mW na intensidade de uma radiação de λ = 1.100 nm distribuı́da uniformemente na superfı́cie, sabendo 382 Materiais e Dispositivos Eletrônicos que a eficiência quântica do Ge neste comprimento de onda é 80%. b) Calcule a variação da tensão numa resistência de carga RL = RD nas condições do item a. 8.12 Uma célula solar de área 10 cm2 é feita de Si com concentrações de impurezas Na = 2 × 1016 cm−3 e Nd = 5 × 1019 cm−3 , para as quais τn = 10 µs, τp = 0, 5 µs, Dn = 9, 3 cm2 /s e Dp = 2, 5 cm2 /s. Para condições normais de radiação esta célula tem IL = 500 mA. Calcule a tensão de circuito aberto e a máxima potência fornecidas pela célula. 8.13 A responsividade de um fotodetetor é definida como a razão entre a corrente gerada pelos fótons e a potência de luz incidente. Calcule a responsividade de um detetor ideal em função do comprimento de onda da radiação e compare seu valor com um ponto qualquer da linha tracejada da Figura 8.22. 8.14 Mostre que os valores de corrente e tensão numa célula solar na condição de máxima potência, são dados pelas Equações (8.74) e (8.75). 8.15 A largura da curva de ganho de um laser de He-Ne é 1 GHz. Calcule o número de modos longitudinais de uma cavidade óptica de comprimento 0,5 m que podem ser emitidos pelo laser. 8.16 Qual é o ângulo da janela de Brewster de um laser a gás feito com um vidro de n = 1, 46. 8.17 O núcleo e a casca de uma fibra óptica com perfil em degrau têm ı́ndices de refração 1,48 e 1,46 respectivamente. Calcule o ângulo crı́tico de propagação. Capı́tulo 9 Materiais e Dispositivos Magnéticos 9.1 Magnetismo e Materiais Magnéticos 385 9.2 Propriedades Magnéticas da Matéria 390 9.2.1 Origem do Momento Magnético do Elétron 390 9.2.2 Momento Magnético de Átomos e Íons 9.2.3 Paramagnetismo 392 396 9.3 Materiais Magnéticos 400 9.3.1 Magnetização Espontânea e Temperatura de Curie 9.3.2 O Modelo de Campo Molecular 9.3.3 A Interação de Intercâmbio 9.3.4 Materiais Ferrimagnéticos e Ferrites 9.3.5 Curva de Magnetização: Domı́nios Magnéticos 9.4 Materiais para Aplicações Tradicionais 9.4.1 Ímãs Permanentes 9.4.2 Materiais de Alta Permeabilidade 383 400 402 404 408 411 416 417 422 384 Materiais e Dispositivos Eletrônicos 9.5 Gravação Magnética 9.5.1 Conceitos Básicos 9.5.2 Análise Qualitativa 9.5.3 Materiais Apropriados 9.5.4 Novas Tecnologias com Filmes Finos e Nanoestruturas 425 427 430 435 437 9.6 Dispositivos de Ferrites para Microondas 442 9.6.1 O Movimento de Precessão da Magnetização 9.6.2 Susceptibilidade Dinâmica de um Ferrite 9.6.3 Ondas Eletromagnéticas em Ferrites 9.6.4 Dispositivos de Ferrites 443 445 448 452 REFERÊNCIAS 459 PROBLEMAS 460 Cap. 9 Materiais e Dispositivos Magnéticos 385 Materiais e Dispositivos Magnéticos 9.1 Magnetismo e Materiais Magnéticos A palavra magnetismo está associada ao fenômeno pelo qual um ente tem o poder de atrair e influenciar outro ente. Sua origem está ligada ao nome de uma cidade da região da Turquia antiga que era rica em minério de ferro, a Magnésia. A palavra surgiu na Antiguidade, associada à propriedade que fragmentos de ferro têm de serem atraı́dos pela magnetita, um mineral encontrado na natureza, de composição quı́mica Fe3 O4 . Os fenômenos magnéticos foram os primeiros a despertar a curiosidade do homem sobre o interior da matéria. Os primeiros relatos de experiências com a “força misteriosa” da magnetita, o ı́mã natural, são atribuı́dos aos gregos e datam de 800 a.C. A primeira utilização prática do magnetismo foi a bússola, inventada pelos chineses na Antiguidade. Baseada na propriedade de uma agulha magnetizada em se orientar na direção do campo magnético terrestre, a bússola foi importante instrumento para a navegação no inı́cio da era moderna. Os fenômenos magnéticos ganharam uma dimensão muito maior a partir do Século XIX, com a descoberta de sua correlação com a eletricidade. Em 1820 Oersted descobriu que uma corrente elétrica num fio também produzia efeito magnético, mudando a orientação da agulha de uma bússola em suas proximidades. Mais tarde Ampère formulou a lei que relaciona o campo magnético gerado com a intensidade da corrente no fio. O efeito pelo qual um fio com corrente sofre a ação de uma força produzida pelo campo criado por um ı́mã permanente, foi descoberto logo em seguida. Em 1831, Faraday na 386 Materiais e Dispositivos Eletrônicos Inglaterra e Henry nos Estados Unidos, descobriram que um campo variável podia induzir uma corrente elétrica num circuito. No final do Século XIX estes três fenômenos eram perfeitamente compreendidos e já tinham inúmeras aplicações tecnológicas, das quais o motor e o gerador elétrico eram as mais importantes. A invenção da lâmpada incandescente, associada ao desenvolvimento dos geradores elétricos, proporcionou uma revolução nos costumes da sociedade. Por outro lado, a introdução do motor elétrico na indústria e nas oficinas revolucionou as atividades industriais e de serviços. Atualmente os materiais magnéticos desempenham papel muito importante nas aplicações tecnológicas do magnetismo. Nas aplicações tradicionais, como em motores, geradores, transformadores, etc, eles são utilizados em duas categorias: os ı́mãs permanentes são aqueles que têm a propriedade de criar um campo magnético constante; os materiais moles, também chamados doce ou permeáveis, são aqueles que produzem um campo proporcional à corrente num fio enrolado, muito maior ao que seria criado apenas pela corrente. Nas últimas décadas surgiu uma nova aplicação para os materiais magnéticos que adquiriu grande importância na eletrônica: a gravação magnética. Esta aplicação é baseada na propriedade que tem a corrente numa bobina em alterar o estado de magnetização de certos materiais. Isto possibilita armazenar, num meio magnético, a informação contida num sinal elétrico. A recuperação, ou leitura, da informação gravada, é feita através da indução de uma corrente elétrica pelo meio magnético em movimento, ou por meio de outros processos nos quais uma corrente elétrica é influenciada por um campo magnético. A gravação magnética é, atualmente, a melhor tecnologia da eletrônica para armazenamento regravável e não-volátil de informação. Ela é essencial para o funcionamento de computadores, gravadores de som e de vı́deo, além de inúmeros equipamentos acionados por cartões magnéticos. Muitas das aplicações atuais dos materiais magnéticos resultaram dos avanços cientı́ficos e tecnológicos obtidos nas últimas décadas nos centros de pesquisa e laboratórios industriais no Japão, Europa e Estados Unidos. Esses avanços só foram possı́veis graças à compreensão das propriedades atômicas da matéria, com base na mecânica quântica desenvolvida nas décadas de 1920 e 1930. Foram as contribuições fundamentais ao magnetismo que deram o prêmio Nobel a Louis Néel em 1970 e J.H. van Vleck e P.W. Anderson em 1977. Ainda hoje o magnetismo é um dos campos mais férteis e mais ativos da Fı́sica da Matéria Condensada. É o conhecimento acumulado neste campo, juntamente com o progresso na ciência e engenharia de materiais, que têm possibilitado a descoberta de novos fenômenos e a fabricação de novos materiais magnéticos para aplicações em eletrônica. No Brasil esta área também se desenvolveu Cap. 9 Materiais e Dispositivos Magnéticos 387 bastante, e hoje há dezenas de bons grupos de pesquisa em todo o Paı́s. O comportamento dos materiais num campo magnético externo é determinado pela origem de seus dipolos magnéticos e pela natureza da interação entre eles. Os dipolos magnéticos têm origem no momentum angular dos elétrons nos ı́ons ou átomos que formam a matéria. Este momentum tem natureza quântica, como será mostrado na seção 9.2.1. Entretanto, vamos utilizar neste capı́tulo uma combinação de tratamentos quântico e semiclássico visando obter os resultados importantes na forma mais direta possı́vel. Macroscopicamente, a grandeza que representa o estado magnético de um material é o Ele é definido como o momento de dipolo magnético vetor magnetização M. por unidade de volume, = 1 M µi , (9.1) V i onde o somatório é feito sobre todos os pontos i nos quais há dipolos de momento µi , no interior de um volume V . V é escolhido suficientemente grande para que haja uma boa média macroscópica, porém pequeno em relação ao represente uma propriedade magnética lotamanho da amostra para que M cal. O campo magnético pode ser expresso por duas grandezas: o vetor e o vetor intensidade de campo magnético H. Enquanto indução magnética B é relacionado com a corrente que cria o campo, B depende tanto da corH que determina o fluxo rente quanto da magnetização do meio. É o vetor B magnético Φ através de uma superfı́cie S, · da (9.2) Φ= B s onde da é um vetor normal a superfı́cie em cada ponto. Na teoria macroscópica, a magnetização entra nas equações de Maxwell levando informações das pro e H. No Sistema priedades magnéticas do material, através da relação entre B Internacional de unidades, +M ) , = µ 0 (H (9.3) B onde µ0 = 4π×10−7 N/A2 é a permeabilidade magnética do vácuo. No sistema CGS, a relação entre os campos tem a forma, =H + 4π M B . (9.4) Materiais e Dispositivos Eletrônicos 388 =H e µ0 = 1. A resposta do material a um Vemos que no CGS, no vácuo, B campo aplicado H, caracterizada pelo comportamento de M, é representada pela susceptibilidade magnética χ. No caso mais simples, a magnetização é induzida na mesma direção do campo aplicado de modo que χ é um escalar definido por, M . (9.5) χ= H Note que, como M e H têm a mesma dimensão, a susceptibilidade é uma grandeza adimensional. A permeabilidade magnética µ é definida através da e H, razão entre B =µH . B (9.6) A relação entre µ e χ, obtida de (9.3)-(9.6), é, nos dois sistemas de unidades: (SI) µ = µ0 (1 + χ) ; (CGS) µ = 1 + 4πχ . (9.7) O motivo para apresentar as relações entre as grandezas magnéticas em dois sistemas de unidades, é o fato de que ambos os sistemas são muito usados tanto na engenharia quanto na ciência. Por esta razão, também apresentamos na Tabela 9.1 as unidades das grandezas magnéticas nos dois sistemas. Note que a unidade de M no CGS é emu/cm3 , sendo emu (Electromagnetic Units) Grandeza SI CGS Relação Φ weber (Wb) maxwell 1 Wb = 108 maxwells B tesla (T) = Wb/m2 gauss (G) 1 T = 104 G H A/m oersted (Oe) M A/m emu/cm3 1 A/m = 4π × 10−3 Oe = (1/79,58) Oe 1 A/m = 10−3 emu/cm3 µ N/A2 adimensional χ adimensional adimensional Tabela 9.1: Unidades das grandezas magnéticas nos Sistemas Internacional (SI) e Gaussiano (CGS). Cap. 9 Materiais e Dispositivos Magnéticos 389 a unidade de momento magnético. O emu/cm3 é formalmente equivalente ao gauss (G). Entretanto, como o gauss é a unidade de B, e no CGS a relação entre B e M é dada por (9.4), costuma-se usar emu/cm3 para unidade de M e o gauss para 4πM. No SI, por outro lado, a unidade de M é o A/m, enquanto a de µ0 M é o tesla (T). Outra relação importante é a da energia de um dipolo magnético µi num i no ponto i, campo magnético B i Uz = −µi · B . (9.8) Esta equação mostra que a energia é mı́nima quando µi tem a direção e o i . No interior de um sólido, B i é a soma do campo externo sentido do campo B com os campos criados pelos ı́ons vizinhos ao ponto i. Este campo interno é um dos principais responsáveis pela diferenciação das propriedades magnéticas dos vários materiais. O valor da susceptibilidade varia de 10−5 em materiais fracamente magnéticos até 106 em materiais fortemente magnéticos. Em alguns casos a susceptibilidade é pequena e negativa. Em outros casos a relação entre M e H não é linear, de modo que a susceptibilidade varia com a intensidade de campo magnético. Dependendo da origem microscópica de sua magnetização e das interações internas, os materiais são comumente classificados em uma das seguintes categorias: • Diamagnéticos • Paramagnéticos • Ferromagnéticos • Ferrimagnéticos • Antiferromagnéticos Diamagnetismo é o tipo mais fraco de resposta magnética de um sistema e é caracterizado por uma susceptibilidade negativa e da ordem de grandeza de 10−5 . A origem do diamagnetismo está na variação do momentum angular orbital dos elétrons induzida pela aplicação do campo externo. A explicação clássica deste fenômeno vem da lei de Lenz, pela qual uma variação de campo magnético resulta numa corrente elétrica induzida que tende a se opor a esta variação, isto é, criando um campo oposto ao aplicado. Este fenômeno ocorre em qualquer átomo. Mas como ele é muito fraco, só aparece quando no material não há dipolos magnéticos permanentes que produzem efeitos muito mais pronunciados. Os materiais diamagnéticos são aqueles que não possuem dipolos magnéticos permanentes, ou seja, são aqueles cujos átomos ou ı́ons têm 390 Materiais e Dispositivos Eletrônicos camadas eletrônicas completas. Este é o caso dos gases nobres, He, Ne, Ar, Kr, Xe. É também o caso dos sólidos com ligação iônica, cujos átomos trocam elétrons para ficarem com suas últimas camadas completas, tais como NaC, KBr, LiF e CaF2 . Como o diamagnetismo é uma propriedade muito fraca dos materiais, seu estudo não será aprofundado aqui. Os materiais que têm momentos magnéticos atômicos permanentes são classificados em uma das outras categorias acima, ou então têm estrutura magnética mais complexa como é o caso dos chamados vidros de spin. Todavia, para ter extensa aplicação prática é necessário que a magnetização macroscópica seja alta, o que ocorre apenas nos materiais ferro ou ferrimagnéticos. Estes são os materiais usados nas três aplicações anteriormente mencionadas: ı́mãs permanentes; materiais moles; meios de gravação magnética. 9.2 Propriedades Magnéticas da Matéria A magnetização da matéria tem origem no momento magnético associado ao momentum angular do elétron. Assim, para entender melhor o momento magnético, é preciso rever algumas propriedades do momentum angular. 9.2.1 Origem do Momento Magnético do Elétron de uma partı́cula está relacionado com Classicamente, o momentum angular L = r ×p. o momentum linear p e o vetor posição r da partı́cula pela expressão L Sendo o operador momentum linear pop dado por (3.6), o operador momentum angular é op = −i r × ∇ . (9.9) L A partir deste resultado, pode-se mostrar (Problema 9.1) que num átomo hidrogenóide, no qual há apenas um elétron fora da última camada completa, o orbital eletrônico é um auto-estado de L2op e de Lzop . Na realidade isto só é verdade se o spin do elétron for ignorado. As equações de autovalores são L2op Ψnm = 2 ( + 1) Ψnm (9.10) Lzop Ψnm = m Ψnm (9.11) Cap. 9 Materiais e Dispositivos Magnéticos 391 onde Ψnm é a função de onda eletrônica com números quânticos n, , m . Além do momentum angular orbital, o elétron tem momentum angular de spin (spin significa rotação em torno de si próprio), que é representado Se o elétron fosse uma partı́cula clássica de massa m, o pelo operador S. spin poderia ser interpretado como resultante de uma rotação em torno dele mesmo, e cujo valor dependeria da velocidade angular de rotação. Na realidade o elétron não é uma partı́cula clássica e seu spin é uma propriedade intrinsecamente quântica. Devido à presença do spin, a função de onda eletrônica completa deve ser caracterizada pela parte orbital e por uma parte que representa o estado do spin. Esta parte é autofunção das componentes S 2 e Sz do tendo autovalores respectivamente 2 s(s + 1) e ms . Para operador de spin S, um elétron, s = 1/2, de modo que o número quântico ms pode assumir valores +1/2 e -1/2, representando o spin para cima ou para baixo, em relação a um eixo de quantização. Esse eixo é determinado, por exemplo, pela direção de um campo magnético externo. O momentum angular orbital e o momentum angular de spin do elétron dão origem ao momento de dipolo magnético do átomo. A Fig.9.1 ilustra o momento magnético orbital através do modelo de Bohr. O momentum angular clássico do elétron na órbita de raio r com velocidade angular ω é L = I ω = m r 2 ω. Como o elétron tem carga −e, seu movimento corresponde a uma espira circular com corrente i = e ω/2π. Esta espira cria um dipolo magnético, cujo momento é µ = iA = iπr 2 . Note que como a carga do elétron é negativa, o momento magnético tem o sentido oposto do momento angular. Este momento magnético faz o átomo comportar-se como uma minúscula agulha magnética, com pólos norte (N) e sul (S) indicados na Fig.9.1. Dessas expressões podemos obter a relação entre o momento magnético e o momentum angular. No Sistema Internacional, µ = −g e L 2m (9.12) onde g = 1 é o fator g orbital. Se o spin do elétron fosse uma grandeza deveria ser a clássica, a relação entre o momento magnético do spin µs e S a relação é: mesma de (9.12). Entretanto, devido à natureza quântica de S, µs = −gs e S 2m (9.13) onde gs ≃ 2. A diferença dos fatores g orbital e de spin é uma das manifestações da origem não-clássica do spin. 392 Materiais e Dispositivos Eletrônicos Figura 9.1: Órbita de elétron no modelo de Bohr ilustrando o momentum angular orbital e o momentum magnético orbital. O movimento do elétron em torno do núcleo faz com que ele sofra a ação de um campo magnético, resultante da transformação (relativı́stica) do campo eletrostático do referencial do núcleo para o seu referencial. A interação do momento magnético do spin com este campo dá origem à chamada interação spin-órbita. Por causa dessa interação a função de onda eletrônica deixa de ser uma autofunção de Lz e Sz separadamente. Ela passa a ser autofunção de Jz , onde op + S op Jop = L (9.14) é o operador momentum angular total. Neste caso m e ms deixam de ser “bons” números quânticos, mas são ainda úteis para determinar o novo número quântico mj = ms + m . 9.2.2 Momento Magnético de Átomos e Íons Quando o átomo ou o ı́on tem vários elétrons fora da última camada completa, seu comportamento magnético é determinado pelas propriedades desses elétrons. Isto porque numa camada cheia, os elétrons ocupam orbitais com todos valores de m possı́veis, positivos e negativos, bem como todos os valores de ms possı́veis. Desta forma, o momentum angular total da camada fechada é nulo, sendo portanto nulo seu momento magnético. A maneira pela qual os elétrons externos ocupam os orbitais para formar o estado fundamental é determinada pelas condições de mı́nima energia. Essas condições são dadas pelas regras de Hund, enunciadas da seguinte forma: 1. Os elétrons ocupam os estados de modo a maximizar a componente z do spin total, S = ms , sem violar o princı́pio de Pauli. 2. Os elétrons ocupam orbitais que resultam no máximo valor de L = m , consistente com a regra 1 e com o princı́pio de Pauli. Cap. 9 Materiais e Dispositivos Magnéticos 393 3. O valor do número quântico da magnitude do momentum angular total é J = |L − S| quando a camada tem menos da metade do número de elétrons que ela comporta, e J = |L + S| quando tem mais da metade do número de elétrons. Na maioria dos elementos da tabela periódica, para formar sólidos os átomos tendem a ganhar ou perder elétrons, ficando com suas últimas camadas cheias e formando ı́ons diamagnéticos. Este é o caso, por exemplo, do sódio e do cloro no cloreto de sódio. O átomo de sódio tem 11 elétrons, com configuração 1s2 2s2 2p6 3s1 , enquanto o cloro tem configuração 1s2 2s2 2p6 3s2 3p5 . O sódio perde seu elétron 3s, que é o único desemparelhado, para formar o ı́on Na+ . Este elétron vai para o cloro, completando a camada 3p do ı́on C− no NaC. Entretanto, isto não acontece com os ı́ons dos elementos de transição do ferro, Ti, V, Cr, Mn, Fe, Co, Ni. Os átomos destes elementos têm a camada 3d incompleta, mesmo tendo elétrons na camada 4s. São os elétrons 4s que são perdidos na ligação quı́mica, deixando a camada 3d incompleta e formando um ı́on com momento magnético total não nulo. Fenômeno semelhante acontece com as terras raras do grupo dos lantanı́deos (Nd, Pm, Sm, Eu, Gd, Tb, Dy, etc.), que perdem elétrons 6s ficando com a camada 4f incompleta, e com os elementos do grupo dos actinı́deos. Estes são os elementos cujos átomos ou ı́ons têm momentos magnéticos permanentes. Por esta razão, os materiais magnéticos necessariamente contêm um ou mais elementos do grupo de transição do ferro ou de terras raras. Para calcular o momento magnético de um certo átomo ou ı́on isolado, é necessário aplicar as regras de Hund para determinar a configuração do estado fundamental e os valores de S, L e J correspondentes. Isto está apresentado de forma esquemática, a seguir, para alguns ı́ons magnéticos importantes. 2 2 6 2 6 6 Fe2+ - configuração: (1s 2s 2p 3s 3p )3d (átomo de argônio) Os seis elétrons 3d são distribuı́dos da seguinte maneira: Regra 1: ms = 1/2 1/2 1/2 1/2 1/2 - 1/2 →S=2 Regra 2: m = 2 1 0 -1 -2 2 →L=2 Regra 3: J = L + S = 4 O estado fundamental do Fe2+ é representado por 5 D4 , onde a letra maiúscula designa o valor de L (S para L = 0, P para L = 1, D para L = 2, F, G, H, I, Materiais e Dispositivos Eletrônicos 394 etc.), o ı́ndice superior é a multiplicidade 2S + 1 e o inferior é o valor de J. Mn2+ , Fe3+ - configuração: (argônio) 3d5 O ı́on Mn2+ é formado pela perda de dois elétrons 4s enquanto que Fe3+ é formado pela perda de dois elétrons 4s e um 3d. A distribuição dos cinco elétrons 3d é determinada da seguinte maneira: Regra 1: ms = 1/2 1/2 1/2 1/2 1/2 → S = 5/2 Regra 2: m = 2 1 0 -1 -2 →L=0 Regra 3: J = S + L = 5/2 O estado fundamental desses ı́ons é então 6 S5/2 . Para concluir a exemplificação do uso das regras de Hund, consideremos o caso de um elemento de terra rara, o Sm3+ . O ı́on é formado pela perda de dois elétrons 6s e um elétron 4f, restando cinco elétrons na camada 4f. Sm3+ - configuração das últimas camadas: 4f5 5s2 5p6 Regra 1: ms = 1/2 1/2 1/2 1/2 1/2 → S = 5/2 Regra 2: m = 3 2 1 0 -1 →L=5 Regra 3: J = L − S = 5/2 Portanto, o estado fundamental de Sm3+ é 6 H5/2 . O momentum angular total tem as mesmas propriedades de (9.10) e 2 e mJ é o autovalor de Jzop , onde (9.11): J(J + 1) 2 é o autovalor de Jop mJ varia de −J a +J. A determinação de J para cada ı́on através das regras de Hund possibilita calcular as propriedades magnéticas dos materiais contendo aquele ı́on. Usando as relações (9.12)-(9.14), pode-se mostrar que a componente z do momento magnético total de um ı́on magnético livre é, aproximadamente: (9.15) µz = −g µB mJ onde µB é o chamado magneton de Bohr, dado por, (CGS) µB = e = 9, 27 × 10−21 G cm3 2mc Cap. 9 Materiais e Dispositivos Magnéticos (SI) µB = 395 e = 9, 27 × 10−24 A m2 2m (9.16) sendo g o fator de Landé, g =1+ J(J + 1) + S(S + 1) − L(L + 1) 2J(J + 1) . (9.17) Veja, nesta equação, que g = 1 quando S = 0, e g = 2 quando L = 0, como era esperado, pois g = 1 e gs = 2. As regras de Hund são válidas com exatidão para os elétrons em átomos ou ı́ons isolados, nos quais o campo elétrico visto pelos elétrons tem simetria esférica. Todavia, quando um ı́on do grupo 3d está num cristal, os elétrons da camada 3d também sofrem influência do campo elétrico cristalino produzido pelos ı́ons vizinhos. Isto faz com que os orbitais atômicos do tipo da Tabela 3.1 não sejam auto-estados do Hamiltoniano cristalino. Pode-se mostrar que os auto-estados são formados aproximadamente por combinações lineares de orbitais atômicos com números quânticos +mL e −mL . Em conseqüência, o momentum angular efetivo dos ı́ons do grupo 3d nos sólidos é L ≃ 0. Este fenômeno, chamado supressão do momentum angular, faz com que o momento magnético dos materiais contendo ı́ons 3d seja quase inteiramente devido ao spin dos elétrons. Neste caso o momento é calculado pela Eq.(9.15) com g ≃ 2. No caso dos ı́ons de terras raras, os orbitais responsáveis pelo momento magnético correspondem às camadas eletrônicas interiores. Neste caso, o campo elétrico cristalino tem efeito desprezı́vel sobre os elétrons destes orbitais, por causa da blindagem criada pelos elétrons exteriores. Isto faz com que o momentum angular do ı́on no sólido seja igual ao do ı́on livre, e portanto dado pelas regras de Hund. Em consequência, os elementos de terras raras têm, em geral, maior momento magnético que os do grupo 3d. Além disso, eles têm também forte interação entre o spin e o campo cristalino, através da interação spin-órbita. Devido à forte reatividade quı́mica dos elementos de terras raras, a tecnologia de utilização desses elementos demorou a ser desenvolvida. Entretanto, nas últimas décadas eles adquiriram grande importância na indústria de materiais magnéticos. 396 9.2.3 Materiais e Dispositivos Eletrônicos Paramagnetismo Paramagnetismo é o fenômeno que ocorre em materiais que têm momentos magnéticos atômicos permanentes, porém isolados uns dos outros. Na ausência de campo externo os materiais paramagnéticos têm magnetização nula. A aplicação de um campo externo produz uma pequena magnetização na direção do campo. Por esta razão os materiais paramagnéticos têm susceptibilidade positiva, com ordem de grandeza na faixa χ ∼ 10−5 − 10−3 . Os principais materiais paramagnéticos são os metais de elementos não magnéticos e os materiais isolantes que contêm átomos livres ou ı́ons de elementos do grupo de transição do ferro, de terras raras e dos elementos actinı́deos. Os metais são paramagnéticos, porque um campo magnético aplicado separa a banda de condução em duas, uma com elétrons de spin +1/2 e outra de spin -1/2. Isto é devido ao fato de que as energias dos momentos magnéticos de spin +1/2 e -1/2 no campo são diferentes. Com isso, a banda de menor energia fica com um número maior de elétrons do que a de maior energia. Como a banda de menor energia tem momento magnético na direção do campo, a magnetização induzida no material tem a direção do campo. Portanto χ é positiva e o metal é paramagnético. Este tipo de magnetismo é chamado paramagnetismo de Pauli. A Figura 9.2 ilustra algumas caracterı́sticas dos materiais paramagnéticos. A caracterı́stica básica desses materiais é o fato de seus dipolos magnéticos atômicos poderem mudar sua direção livremente, sem influência dos dipolos vizinhos. Numa temperatura finita, com campo nulo, os momentos magnéticos ocupam direções aleatórias devido à agitação térmica, como ilustrado na Fig.9.2(a). Com a aplicação de um campo externo, a orientação média dos dipolos produz uma magnetização resultante na direção do campo. À medida que o campo aumenta, a energia de interação dos dipolos com o campo aumenta (em módulo) em relação à energia térmica, fazendo a ordem no sistema aumentar. Em certas faixas de temperatura, M é proporcional a H, como na Fig.9.2(b). Por outro lado, se o campo for mantido fixo e a temperatura aumentar, a agitação térmica aumenta, resultando numa menor susceptibilidade. Desde o século passado foram feitas experiências que mostram que a susceptibilidade varia com o inverso da temperatura, como mostrado na Fig.9.2(c). Esta forma de variação da susceptibilidade é chamada lei de Curie. Quanticamente, as propriedades básicas de materiais paramagnéticos podem ser entendidas a partir dos resultados que apresentamos anteriormente. Para um campo B aplicado na direção ẑ, os nı́veis de energia de um sistema Cap. 9 Materiais e Dispositivos Magnéticos 397 Figura 9.2: Caracterı́sticas de materiais paramagnéticos: (a) Comportamento dos momentos magnéticos na ausência de campo externo; (b) Variação de M com H (a inclinação da curva é a susceptibilidade); (c) Variação do inverso da susceptibilidade com a temperatura. de momentos magnéticos são obtidos de (9.8) e (9.15), Em = m g µB B . (9.18) Se o sistema tiver N momentos independentes, como num material paramagnético, a razão entre o número Nm+1 de momentos no nı́vel (m + 1) e Nm no nı́vel m, a uma certa temperatura T , é dada pelo fator da estatı́stica de Boltzmann, Eq.(8.54), Nm+1 = e−gµB B/kB T , (9.19) Nm pois gµB B é a diferença de energia entre os dois nı́veis. A Fig.9.3 ilustra a variação da população de cada nı́vel. É claro então que, como os nı́veis de m mais negativo (menor energia) estão mais populados, há uma predominância de e logo M é diferente de zero. Utilizando momentos magnéticos no sentido de B (9.1), (9.5) e (9.19) é possı́vel calcular χ(T ) e obter a lei de Curie. Este foi um dos primeiros sucessos da teoria quântica em materiais. Vamos calcular χ(T ) para o caso simples de S = 1/2 e L = 0, no qual há apenas dois nı́veis de energia. Neste caso J = 1/2, mJ = ±1/2 e g = 2, de modo que a magnetização na direção (z) do campo é: M = (N1 − N2 ) µB , (9.20) onde N1 é o número de momentos magnéticos no sentido do campo, e N2 o número no sentido oposto, por unidade de volume. Substituindo (9.19) em 398 Materiais e Dispositivos Eletrônicos Figura 9.3: Variação com a energia, da população de momentos magnéticos independentes em equilı́brio térmico. (9.20) e usando x ≡ µB B/kB T obtemos M = N µB 1 − e−x = N µB tanh x 1 + e−x , (9.21) onde N = N1 + N2 é o número total de dipolos magnéticos por unidade de volume. A Figura 9.2 mostra qualitativamente a variação da magnetização num material paramagnético com o campo e a temperatura, dada por (9.21). Para x 1, ou seja, para baixos valores de campo e/ou altas temperaturas, (9.21) mostra que M varia linearmente com x, M ≃ N µB x = N µ2B B kB T , o que dá para a susceptibilidade, χ= N µ2B µ0 kB T (9.22) que é a lei de Curie. Por outro lado, para x 1, isto é, para altos valores de campo e/ou baixas temperaturas, M → NµB . Esta situação corresponde a ter todos dipolos alinhados com o campo e portanto a uma saturação da magnetização. Quanticamente, neste estado todos momentos estão no nı́vel de energia E1 , ou seja, N2 = 0 e N1 = N. No caso geral em que o número quântico J é qualquer, o cálculo de M é um pouco mais complexo. Pode-se mostrar que o valor de saturação que a magnetização atinge em altos campos Cap. 9 Materiais e Dispositivos Magnéticos 399 e/ou baixas temperaturas é Ms = Ng J µB . (9.23) Por outro lado, em baixos campos e/ou altas temperaturas, a susceptibilidade é, M C χ= ≃ µ0 (9.24) H T onde C= NJ(J + 1) g 2 µ2B 3kB (9.25) é a constante de Curie. Note que no sistema Gaussiano µ0 = 1 e C tem dimensão de temperatura, pois χ é adimensional. Evidentemente, as expressões (9.24) e (9.25) dão o mesmo resultado de (9.22) no caso J = 1/2, g = 2. Com a Eq.(9.23) é possı́vel calcular o valor da magnetização de saturação nos sólidos. Exemplo 9.1: Considere um material com rede cúbica simples, com parâmetro de rede a = 2, 5 Å, tendo J = 1 e um momento 2µB por célula unitária. Calcule: a) A magnetização de saturação; b) A susceptibilidade em T = 300 K. a) Para calcular Ms com (9.23), é preciso inicialmente calcular N . Como foi dado o momento por célula unitária, N = 1/a3 é o número de momentos por unidade de volume. Usando µB = 9, 27 × 10−21 erg/G, temos no sistema gaussiano, Ms = 2 × 9, 27 × 10−21 = 1, 19 × 103 G 2, 53 × 10−24 . Esta é a ordem de grandeza tı́pica da magnetização de saturação observada tanto nos materiais paramagnéticos como nos ferromagnéticos. b) A susceptibilidade obtida de (9.24) e (9.25) com estes mesmos dados, à temperatura ambiente, T = 300 K, no sistema Gaussiano (µ0 = 1) é, χ= 2 × 22 × 9, 272 × 10−42 2, 53 × 10−24 × 300 × 1, 38 × 10−16 = 1, 06 × 10−3 . A susceptibilidade calculada no Exemplo 9.1, da ordem de 10−3 , observada nos materiais paramagnéticos, é várias ordens de grandeza menor que nos materiais ferromagnéticos. O fato das duas classes de materiais terem magnetizações semelhantes quando todos momentos estão alinhados, o que ocorre 400 Materiais e Dispositivos Eletrônicos em T = 0, indica que a origem dos momentos é a mesma nas duas classes. Entretanto, como muitos materiais ferromagnéticos têm à temperatura ambiente, magnetização da mesma ordem que em T = 0, deve haver uma interação entre seus momentos que tende a mantê-los alinhados. Os materiais que têm uma forte interação entre os momentos magnéticos estão apresentados na próxima seção. 9.3 Materiais Magnéticos Vários metais de elementos do grupo de transição do ferro, como ferro, nı́quel e cobalto, puros ou em ligas com outros elementos, apresentam uma alta magnetização à temperatura ambiente quando submetidos a um pequeno campo externo. Estes materiais são chamados ferromagnéticos. A propriedade que eles têm de serem atraı́dos pela magnetita é conhecida há milênios. Porém, somente no final do Século XIX foram feitas medidas quantitativas das propriedades magnéticas destes materiais. Na metade do Século XX, descobriuse que vários materiais que se supunha serem ferromagnéticos, na realidade são ferrimagnéticos. Estas duas categorias de materiais têm propriedades magnéticas semelhantes e encontram várias aplicações na eletrônica. 9.3.1 Magnetização Espontânea e Temperatura de Curie No final do século XIX, Pierre Curie verificou que a magnetização dos materiais ferromagnéticos diminui com o aumento da temperatura e torna-se nula acima de um certo valor Tc , chamado de temperatura de Curie. Atualmente sabe-se que, localmente, em pequenas regiões chamadas domı́nios, os materiais ferromagnéticos apresentam magnetização finita mesmo sem campo externo. Ela é chamada magnetização espontânea e resulta de uma forte interação entre momentos vizinhos que tende a mantê-los alinhados. A forma qualitativa da variação da magnetização espontânea M com a temperatura está mostrada na Figura 9.4. Em T = 0, M tem valor igual ao da magnetização de saturação, Ms , porque todos momentos estão alinhados. À medida que a temperatura aumenta, M diminui gradualmente devido à agitação térmica dos momentos. Em T > Tc , a energia térmica predomina sobre a energia de ordenamento, de modo que o material passa a ter comportamento paramagnético, com M = 0. A Figura 9.5 apresenta a visão clássica do comportamento dos momentos magnéticos nestas três faixas de temperatura. Cap. 9 Materiais e Dispositivos Magnéticos 401 Figura 9.4: Variação da magnetização espontânea em materiais ferromagnéticos com a temperatura. A Tabela 9.2 apresenta os valores de Tc e da magnetização espontânea em T = 0 e em T = 300 K em alguns ferromagnetos simples. No sistema CGS a magnetização está multiplicada por 4π porque a grandeza que contribui para o campo B é 4πM. Pela mesma razão, no sistema SI, utiliza-se µ0 M. Note que vários materiais têm Tc < 300 K, e portanto não têm magnetização espontânea à temperatura ambiente. Outra observação interessante é que os materiais que têm maior magnetização, não têm necessariamente maior Tc . A razão disto Material Tc K 4πM (0) G 4πM (300 K) G Fe 1043 22.016 21.450 Co 1394 18.171 17.593 Ni 631 6.409 6.095 Gd 293 24.881 0 CrBr3 37 3.393 0 EuO 77 24.002 0 EuS 16,5 14878 0 Tabela 9.2: Dados de alguns materiais ferromagnéticos no sistema CGS. Para obter o valor de µ0 M no SI basta multiplicar o valor de 4πM por 10−4 . 402 Materiais e Dispositivos Eletrônicos Figura 9.5: Visão clássica dos momentos magnéticos num material ferromagnético em três faixas de temperatura. é que o valor de M depende do momento magnético atômico, enquanto Tc depende da interação entre os momentos, como veremos a seguir. 9.3.2 O Modelo de Campo Molecular No inı́cio do Século XX, quando a origem do momento magnético atômico ainda era desconhecida, Pierre Weiss propôs um modelo teórico para o ferromagnetismo, que até hoje continua muito útil. Neste modelo, cada dipolo magnético atômico sofre a ação de um campo magnético efetivo criado pelos vizinhos, que tende a fazer com que eles fiquem alinhados na mesma direção. E , postulado empiricamente por Weiss, chamado campo Este campo efetivo B , molecular de Weiss, é proporcional à magnetização local M E = λ M , B (9.26) sendo λ um parâmetro adimensional, caracterı́stico de cada material. Desta , cuja direção é E e portanto com M forma, cada dipolo tende a se alinhar com B dada pela média de todos dipolos vizinhos. Este modelo pode ser utilizado para calcular a magnetização local em função da temperatura e do campo aplicado H0 . Para isto utilizamos o resultado (9.21), válido apenas para S = 1/2 e g = 2, sendo o parâmetro x determinado pelo campo local total, x= µB (µ0 H0 + λM) µB B = kB T kB T . (9.27) Assim, a magnetização espontânea é dada por (9.21) e (9.27) com H0 = 0, µB λM M = NµB tanh . (9.28) kB T Cap. 9 Materiais e Dispositivos Magnéticos 403 Figura 9.6: Solução gráfica da Eq.(9.28) para a magnetização espontânea em quatro valores de temperatura. Esta é uma equação transcendental, que não tem solução geral analı́tica, mas que pode ser resolvida numericamente ou graficamente. A Figura 9.6 ilustra as soluções de (9.28) para a magnetização espontânea em quatro valores de temperatura. A curva representa a função M(x) dada pela Eq.(9.21), enquanto as retas representam a função M = kB T x/µB λ nas diversas temperaturas. Para T = T1 Tc , a solução de (9.28) é o ponto 1, interseção da curva com a reta correspondente a T1 , que tem baixa inclinação. Neste ponto a magnetização espontânea tem um valor próximo da saturação Ms . É fácil ver que a medida que T aumenta, a inclinação da reta aumenta e portanto o valor de M diminui, como no ponto 2 da Fig.9.6. Este comportamento está em acordo com o resultado experimental da Fig.9.4. A temperatura de Curie é aquela na qual a reta tangencia a curva M(x), pois é o menor valor de T para o qual M = 0 (ponto 3 da figura). Evidentemente, para T > Tc , a solução permanece no ponto 3 e portanto M = 0. Podemos obter a relação entre Tc e os parâmetros do material com a condição de tangenciamento entre a reta e a curva da Fig.9.6. O coeficiente 1, tanh x ≃ x, de modo que o coefiangular da reta é kB T /µB λ. Para x ciente angular da tangente de (9.21) na origem é NµB . Igualando estes dois coeficientes angulares temos, Tc = Nµ2B λ kB . Materiais e Dispositivos Eletrônicos 404 Note que a expressão que multiplica λ neste resultado é exatamente a constante de Curie, C, válida para J = 1/2, g = 2, na Eq.(9.25). Para o caso geral de J qualquer, pode-se mostrar que Tc = λ C . (9.29) Este resultado pode ser obtido de outra maneira interessante. Na fase ferromagnética, T < Tc , não faz sentido definir uma susceptibilidade local, pois M = 0 com H0 = 0. Entretanto, na fase paramagnética, T > Tc , a susceptibilidade local é dada por (9.24), χ = µ0 C/T . Como o campo local é a soma do campo externo com o campo molecular, M= χ C (µ0 H0 + λM) (µ0 H0 + BE ) = µ0 T . Com esta expressão obtemos a susceptibilidade de um material ferromagnético na fase paramagnética, χ= µ0 C M = H0 T − Tc , (9.30) onde Tc = λ C, como em (9.29). Este resultado, conhecido como a lei de Curie-Weiss, mostra que χ diverge quando T → Tc . Isto é consistente com o fato de que em T ≤ Tc , M é finito mesmo com H0 = 0. O resultado (9.29) permite estimar o valor do campo molecular nos materiais ferromagnéticos. Para os metais do grupo de transição do ferro, da Tabela 9.2 temos M ∼ 103 G e Tc ∼ 103 K, e com (9.25) obtemos no sistema Gaussiano C ∼ 1 K. Portanto, λ = Tc /C ∼ 103 e o campo molecular BE = λM é da ordem de 106 G. Este valor é muito elevado em relação aos campos magnéticos tı́picos produzidos em laboratórios, que são no máximo da ordem de 105 G. Ele é também muito maior que o campo magnético que um dipolo atômico cria nos vizinhos, que é da ordem de µB /a3 ∼ 10−20 /10−23 = 103 G. 9.3.3 A Interação de Intercâmbio A origem do campo molecular de Weiss foi explicada muitos anos depois de sua descoberta, através da mecânica quântica. Ela está associada à chamada energia de intercâmbio de Heisenberg, cuja origem é eletrostática porém de natureza quântica, sem analogia clássica. Ela resulta da diferença entre as Cap. 9 Materiais e Dispositivos Magnéticos 405 Figura 9.7: Ilustração da origem da interação de intercâmbio. As direções dos spins dependem da distribuição espacial de carga (função de onda espacial) dos elétrons dos ı́ons vizinhos. energias eletrostáticas de dois elétrons nas situações de spins paralelos e antiparalelos. Podemos entender esta interação com um modelo simples. Sejam 1 e S 2 . O princı́pio de exclusão dois elétrons de ı́ons vizinhos, cujos spins são S de Pauli impõe que a função de onda total dos dois elétrons seja anti-simétrica. A função de onda total é o produto da função espacial e da que descreve o estado de spin. Quando a função espacial é simétrica, os spins devem ser antiparalelos para que a função de onda total seja anti-simétrica. Analogamente, quando a função espacial é anti-simétrica os spins devem ser paralelos. Como a energia eletrostática total do conjunto depende da distribuição espacial de carga elétrica, ela é diferente nos dois casos das Figuras 9.7(a) e (b). A diferença entre os valores da energia eletrostática nas duas situações é chamada a energia de intercâmbio (exchange) entre os dois spins. Como ela depende fundamentalmente dos estados dos spins, pode-se mostrar que ela adquire a forma 1 · S 2 , (9.31) U12 = −2J12 S onde J12 é a integral de Heisenberg, também chamada constante de intercâmbio. Esta integral depende das distribuições eletrônicas dos átomos e de sua distância. Como a interação eletrostática diminui com o aumento da distância, J12 diminui rapidamente à medida que os átomos se afastam. Vemos pela Eq.(9.31) que quando J12 é positivo, o estado de menor energia corresponde aos dois spins paralelos, que é o caso ferromagnético. No caso de substâncias que contém apenas um elemento com momento magnético atômico, J12 é, em geral, positivo. Entretanto, quando a substância contém elementos que intermediam a ligação quı́mica entre os átomos de momentos magnéticos, como é o caso de O, F e C, por exemplo, J12 tende a ser negativo. Neste caso, o estado de menor energia de intercâmbio tem os spins 406 Materiais e Dispositivos Eletrônicos antiparalelos. Isto dá origem ao antiferromagnetismo e ao ferrimagnetismo. Por esta razão, é raro encontrar ferromagnetismo nos óxidos, fluoretos ou cloretos. Evidentemente, quando J12 = 0, o material é paramagnético. É fácil relacionar a constante de intercâmbio com o campo molecular. Consideremos dois átomos vizinhos com momentos magnéticos µ1 e µ2 . Supondo que o momento magnético do ı́on é devido somente ao spin, a Eq.(9.31) pode ser reescrita na forma µ = −g µB S, U12 = − 2 J12 2 µ1 · S gµB . (9.32) Comparando (9.32) com (9.8), vemos que é possı́vel representar a ação do spin 2 /gµB . 12 = −2J12 S 2 sobre o spin 1 na forma de um campo magnético efetivo B Geralmente a constante de intercâmbio é a mesma entre os vizinhos magnéticos mais próximos, sendo representada por J1 , e nula para vizinhos mais afastados. Se um spin tem z1 vizinhos mais próximos, o campo efetivo médio que atua sobre ele é então, 2 S z1 J1 . (9.33) BE = gµB Este é o campo molecular de Weiss. Comparando as equações (9.26) e (9.33) e usando o valor da magnetização a T = 0, Ms = gµB S N, onde N é o número de spins por unidade de volume, vemos que λ= 2 z1 J1 N(gµB )2 . (9.34) Usando (9.29) e (9.25), com J = S, podemos obter a relação entre a temperatura de Curie e a constante de intercâmbio, Tc = 2 S(S + 1) z1 J1 3kB . (9.35) Esta expressão mostra que à medida que a interação de intercâmbio aumenta, Tc aumenta, pois é preciso uma maior temperatura para destruir a ordem magnética. Isto explica a grande variação nos valores de Tc dos materiais da Tabela 9.2. Para concluir esta seção, vamos abordar a questão importante do magnetismo dos materiais metálicos. Até o momento, todas propriedades magnéticas foram tratadas como se os momentos magnéticos fossem associados a ı́ons localizados, fixos na rede cristalina. Isto é válido para isolantes, Cap. 9 Materiais e Dispositivos Magnéticos 407 mas não para metais. Nos metais é preciso considerar o fato de que os elétrons ocupam estados em bandas de energia, e não nı́veis discretos em ı́ons localizados. No caso dos metais de elementos do grupo de transição do ferro, as bandas importantes são aquelas associadas aos nı́veis 3d e 4s. A banda 4s é a dos elétrons quase livres, responsáveis pela maior parte da condutividade. A banda 3d é a do magnetismo, pelas mesmas razões discutidas na seção 9.2.1. Na verdade, as curvas E(k) correspondentes às bandas 3d e 4s se interceptam, como mostrado na Figura 9.8 (a). Como resultado, existe uma mistura de estados 3d e 4s e a curva da densidade de estados tem a forma mostrada na Figura 9.8 (b). Devido à interação de intercâmbio entre os spins eletrônicos, em temperaturas menores que Tc a energia de um elétron no estado k com o spin para cima é menor que a energia de um elétron no mesmo estado k mas com o spin para baixo. Como resultado, a banda de densidade de estados separa-se em duas, uma com menor energia que a outra, como indicado na Figura 9.8(b). Como os estados são ocupados até o nı́vel de Fermi, a banda com menor energia fica com mais estados ocupados que a outra. Isto resulta, em alguns metais do grupo 3d, num momento magnético total por átomo diferente de zero, o que dá origem a uma magnetização espontânea e comportamento ferromagnético. Este é o caso de Fe, Co e Ni, que têm a T = 0 momentos 2, 22µB , 1, 72µB e 0, 16µB por átomo, respectivamente. Apesar das origens do momento magnético nos metais e nos isolantes serem diferentes, as propriedades magnéticas macroscópicas podem ser tratadas da mesma forma nos dois tipos de materiais. Figura 9.8: Ilustração das últimas bandas de energia nos metais do grupo de transição do ferro: (a) Curvas E(k) para T > Tc ; (b) Ocupação dos estados em T < Tc . 408 9.3.4 Materiais e Dispositivos Eletrônicos Materiais Ferrimagnéticos e Ferrites Quando a interação de intercâmbio entre dois ı́ons vizinhos é negativa, seus spins tendem a se alinhar na mesma direção porém em sentidos opostos. Isto dá origem a ordenamentos magnéticos mais complexos que o ferromagnético. A Figura 9.9 ilustra dois tipos de ordenamento simples que ocorrem com J12 < 0, o antiferromagnetismo e o ferrimagnetismo. No antiferromagnetismo os momentos antiparalelos são iguais, fazendo com que a magnetização resultante seja nula. Por esta razão, embora os materiais antiferromagnéticos tenham uma forte interação entre os momentos magnéticos, e por isso sejam de grande interesse cientı́fico, até recentemente eles não tinham aplicações tecnológicas. Atualmente eles são empregados em cabeçotes de leitura de gravação magnética, apresentados na Seção 9.5.4. Os materiais ferrimagnéticos também são caracterizados por uma interação de intercâmbio negativa. Entretanto, como os momentos vizinhos são diferentes, a magnetização resultante é diferente de zero. Na realidade, do ponto de vista macroscópico, as propriedades dos materiais ferrimagnéticos são muito semelhantes as dos ferromagnetos. Uma classe de materiais ferrimagnéticos muito importante para a eletrônica é a dos ferrites. Ferrites são óxidos ferrimagnéticos com estrutura cristalina semelhante ao spinel natural MgA2 O4 . Suas propriedades magnéticas decorrem da existência de ı́ons magnéticos, como Fe, Ni, Co, Mn ou terras raras, no lugar do Mg ou A. Sua estrutura complexa origina a distribuição de spins opostos uns aos outros, mas várias de suas propriedades são semelhantes as dos ferromagnetos. Duas propriedades importantes de al- Figura 9.9: Ilustração de ordenamentos anti- e ferrimagnético simples. Cap. 9 Materiais e Dispositivos Magnéticos 409 guns ferrites dão a eles grande importância tecnológica. São elas a rapidez da resposta da magnetização e a alta resistividade. Esta última permite que eles sejam usados em aplicações de altas freqüências, inclusive na faixa de microondas, porque não desenvolvem correntes parasitas, ou de Foucault, que são responsáveis pelo aquecimento e perda de energia nos metais ferromagnéticos. A Figura 9.10 mostra a estrutura cristalina do spinel natural MgA2 O4 , que é um mineral conhecido encontrado na natureza. Se o A3+ é substituı́do por Fe3+ , e o Mg2+ é substituı́do por um metal divalente M, obtemos o ferrospinel MO.Fe2 O3 , também chamado ferrita. Se o metal divalente for Fe2+ , teremos o ferrite de ferro, ou magnetita, que é o ı́mã encontrado na natureza, Fe3 O4 (ou FeO · Fe2 O3 ). Os ı́ons metálicos na estrutura spinel ocupam duas posições de simetrias diferentes. A posição A tem simetria tetraédrica, isto é, os oxigênios que circundam o ı́on metálico formam um tetraedro. A posição B é a de simetria octaédrica. Na célula unitária do cristal há 8 posições A e 16 posições B. Nos ferrites a interação entre os spins dos ı́ons magnéticos que entram nas posições A e B é ferrimagnética, isto é, os spins nessas posições são antiparalelos. A Figura 9.11 mostra como estão distribuı́dos os ı́ons de Fe3+ (S = 5/2) e Fe2+ (S = 2) na magnetita, Fe2+ O· Fe3+ 2 O3 . Veja que os spins dos 8 ı́ons de Fe3+ na posição A cancelam os outros 8 dos Fe3+ na posição B. Com isso, o momento magnético resultante é devido exclusivamente aos ı́ons Fe2+ , que têm spin S = 2. O momento magnético medido experimentalmente a T = 0 K é 8 × 4, 07 µB por célula unitária, que é um valor próximo do obtido na Figura 9.11, 8 × gµB S = 8 × 4 µB . A diferença é devido à pequena contribuição do momento magnético orbital. É possı́vel obter uma enorme variedade de ferrites com magnetizações diferentes, próprias para cada aplicação, pela substituição adequada dos ı́ons metálicos. O ferrite de magnésio puro Mg2+ Fe3+ 2 O4 , por exemplo, tem magnetização quase nula, pois o ı́on de Mg não é magnético e os spins dos ı́ons Figura 9.10: Estrutura cristalina do spinel natural MgA2 O4 . Os ı́ons de Mg2+ ocupam posições tetraédricas (os oxigênios em torno deles formam um tetraedro). Os ı́ons de A3+ ocupam posições octaédricas (somente dois octantes da célula unitária estão mostrados com todos os ı́ons, para facilitar a visão). 410 Materiais e Dispositivos Eletrônicos Figura 9.11: Ordenamento dos spins na célula unitária da magnetita, Fe2+ O · Fe3+ 2 O3 . de Fe3+ nas posições A e B se cancelam. Mostramos abaixo as fórmulas de alguns ferrites nos quais os ı́ons metálicos são substituı́dos fracionariamente, bem como o momento magnético por célula unitária. Ferrite de Nı́quel Fe3+ 1,0 A 3+ Ni2+ 1,0 Fe1,0 B O4 Momento Magnético = 8 × 2 µB × (↓ 5/2 ↑ 1 ↑ 5/2) = 16 µB Ferrite de Nı́quel com Alumı́nio Fe3+ 1,0 A 3+ Ni2+ 1,0 A0,4 Fe0,6 B O4 Momento Magnético = 8 × 2 µB × (↓ 5/2 ↑ 1 ↑ 0, 6 × 5/2) = 0 Veja que com a substituição de uma pequena fração de ferro por alumı́nio, a magnetização é cancelada. Com a substituição de uma fração menor podemos obter uma magnetização com qualquer valor entre 0 e 16 µB por célula unitária. Os ferrites são cerâmicas, que têm grande dureza e alto ponto de fusão. Eles são geralmente usados na forma policristalina. A preparação de ferrites começa com a mistura de partı́culas finas dos vários óxidos metálicos, que entram em sua composição, na proporção desejada na forma final do material. Essa mistura é aquecida a temperaturas da ordem de 1000◦ C com o objetivo de homogeneizar os óxidos. Ela é então novamente moida e o pó resultante é pressionado para ficar com a forma desejada. Finalmente ela é aquecida a uma temperatura pouco abaixo do ponto de fusão (1200-1500◦C), adquirindo a forma policristalina densa. Esses passos têm durações que variam de material para material e seus detalhamentos constituem segredos industriais dos fabricantes. O desenvolvimento desses processos foi feito durante décadas de Cap. 9 Materiais e Dispositivos Magnéticos 411 trabalhos de pesquisa em laboratórios universitários e industriais, com a participação de fı́sicos, quı́micos e engenheiros de materiais. Um material ferrimagnético de grande importância tecnológica é a granada de ferro e ı́trio (Yttrium Iron Garnet), o YIG, cuja fórmula quı́mica é Y3 Fe5 O12 . Como o ı́on Y3+ é diamagnético, as propriedades magnéticas do YIG são devidas aos ı́ons de Fe3+ , três dos quais têm spins opostos aos outros dois. Com isso o momento magnético por fórmula unitária é 5 µB . Como a célula unitária de YIG tem oito fórmulas Y3 Fe5 O12 , o momento por célula é 40 µB . A aresta da célula unitária de YIG mede a = 12, 376 Å, e sua magnetização a T = 0 é M0 = 40 µB /a3 = 194 G. A temperatura ambiente, M = 140 G. A temperatura de Curie de YIG é 559 K. Este material tem grande importância tecnológica porque apresenta perdas magnéticas e atenuação acústica extremamente reduzidas em freqüências de microondas. Ele é usado tanto na forma cristalina quanto policristalina. Atualmente consegue-se crescer cristais de YIG relativamente grandes (muitos cm3 ). 9.3.5 Curva de Magnetização: Domı́nios Magnéticos A magnetização total de um pedaço de material ferro- ou ferrimagnético sem campo aplicado é em geral muito menor do que a magnetização espontânea. Isto é devido a formação dos chamados domı́nios magnéticos. Nesta seção veremos como esses domı́nios são formados e qual sua influência na curva de magnetização de um material magnético. Num material ferromagnético a uma temperatura T Tc , os momentos magnéticos tendem a se alinhar na mesma direção devido à energia de intercâmbio, mesmo na ausência de um campo aplicado externamente. Se este alinhamento se der ao longo de todo o material, a magnetização será uniforme, como na Fig.9.12(a). Neste caso os pólos magnéticos gerados nas extremidades criam um campo macroscópico externo, como mostrado na figura. Este campo tem uma energia magnética, dada por (µ0 /2) H 2 dV , relativamente alta, de modo que esta configuração não se mantém em equilı́brio. Se metade da amostra tiver magnetização num sentido e metade no outro, como na Fig.9.12(b), o campo externo será menor e a energia será reduzida aproximadamente à metade do valor em (a). A figura (c) mostra uma situação de energia ainda menor, pois as linhas de campo fecham internamente no material, de modo que o campo externo é desprezı́vel. As quatro regiões mostradas em (c) têm, internamente, magnetização saturada, porém a magnetização total é nula. Essas regiões são chamadas domı́nios magnéticos, e 412 Materiais e Dispositivos Eletrônicos Figura 9.12: Ilustração da diminuição da energia magnética devido à formação de domı́nios magnéticos. formam-se espontaneamente para diminuir a energia do sistema. As principais contribuições para a energia são: a energia magnética; a energia Zeeman, devido a interação dos momentos com um campo aplicado externamente; a energia de intercâmbio; e a energia de anisotropia cristalina. Esta última é uma contribuição devida à interação entre os momentos orbitais e o campo elétrico cristalino, que tende a fazer os momentos se alinharem ao longo de um dos eixos cristalinos do material. A forma e o tamanho dos domı́nios são determinados pela minimização da energia total. Um dos resultados importantes é que a fronteira entre os domı́nios não é brusca, pois caso contrário a energia de intercâmbio seria alta. Na fronteira entre dois domı́nios a energia é minimizada com a formação de uma camada onde a orientação dos momentos varia gradualmente. Esta camada é chamada parede de domı́nio, ou parede de Bloch. A Figura 9.13 ilustra uma parede de 180◦ , separando dois domı́nios cujas magnetizações tem sentidos opostos. Como a orientação dos momentos pode variar facilmente, as paredes dos domı́nios têm grande mobilidade. Essas paredes têm espessuras tipicamente da ordem de 1.000 a 10.000 Å. A largura dos domı́nios varia desde alguns µm até vários mm ou cm, dependendo das caracterı́sticas do material e do campo externo aplicado. A Figura 9.14 ilustra o comportamento dos domı́nios numa situação idealizada. Quando o campo é nulo, formam-se domı́nios, como em (a), que resultam em magnetização total nula. Quando um pequeno campo é aplicado ao longo da barra, há um deslocamento das paredes dos domı́nios para diminuir a energia Zeeman. O tamanho dos domı́nios magnetizados no sentido do campo aumenta, enquanto os de sentido oposto ficam menores. Como resultado, a barra passa a ter magnetização total ao longo do campo, como mostrado em (b). Um aumento do campo produz um deslocamento maior das paredes e também rotação dos domı́nios Cap. 9 Materiais e Dispositivos Magnéticos 413 Figura 9.13: Ilustração de uma parede de domı́nio de 180◦ . perpendiculares ao campo, como em (c). Finalmente, com um campo muito maior, todas paredes de domı́nios desaparecem e a barra é saturada, como mostrado em (d). A forma da curva de magnetização em função do campo aplicado, mostrada na Figura 9.15, é determinada pelo comportamento dos domı́nios. A curva (a) corresponde a um material inicialmente desmagnetizado, chamado de virgem. Para pequenos valores de campo, o aumento inicial da magnetização é devido ao deslocamento reversı́vel das paredes de domı́nios. Se o campo for retirado, os domı́nios voltam à configuração inicial. Com um aumento maior do campo, a magnetização cresce em razão dos deslocamentos das paredes, porém esses deslocamentos tornam-se irreversı́veis devido às imperfeições no Figura 9.14: Comportamento dos domı́nios magnéticos numa barra de material ferromagnético submetida a um campo externo. 414 Materiais e Dispositivos Eletrônicos Figura 9.15: Variação da magnetização de material ferro ou ferrimagnético com o campo aplicado: (a) amostra inicialmente desmagnetizada; (b) curva de histerese. material. Finalmente, com valores mais elevados de campo, ocorre rotação de domı́nios até a saturação completa da magnetização em todo o material. A Figura 9.15(b) mostra o comportamento da magnetização M com a variação do campo H após o material ter sido saturado. Quando H diminui, M não retorna pela mesma curva do material virgem, por causa das rotações e deslocamentos irreversı́veis dos domı́nios. Em consequência, mesmo com H = 0, Figura 9.16: Processo de desmagnetização ac de um material ferromagnético: (a) Campo H alternado com amplitude decrescente; (b) Trajetória de M no plano M − H. Cap. 9 Materiais e Dispositivos Magnéticos 415 há um valor finito de M, chamado magnetização remanente, Mr . Ela resulta do aprisionamento de certas paredes que fazem os domı́nios favoráveis prevalecerem sobre os desfavoráveis. Se H aumenta no sentido oposto, M diminui gradualmente e somente com um valor H = −Hc , chamado campo coercitivo (ou coercivo), a magnetização é anulada. A curva da figura (b), chamada curva (ou ciclo) de histerese do material, mostra a variação de M num ciclo completo de variação de H. A forma da curva de histerese é determinante no tipo de aplicação de um material magnético, como veremos na próxima seção. Para concluir esta seção, vejamos o que acontece quando um material é submetido a um campo H alternado, cuja amplitude diminui gradualmente no tempo. A Figura 9.16 ilustra o processo de desmagnetização de um material ferromagnético através de um campo H alternado. A aplicação de um campo ac com amplitude decrescente no tempo, como em (a), resulta numa trajetória da magnetização no plano M − H mostrada em (b). Enquanto a variação de H é periódica, M descreve a curva de histerese externa, atingindo a saturação nos extremos positivo e negativo. Quando a amplitude de H decresce, em cada extremo consecutivo o valor máximo de M é menor que no ciclo anterior. Como resultado, à medida que a amplitude de H tende para zero, o material torna-se gradualmente desmagnetizado. Um processo importante para a gravação magnética de sinais de áudio é a magnetização dc com polarização ac, ilustrado na Figura 9.17. Neste processo Figura 9.17: Processo de magnetização dc com polarização ac: (a) Trajetória de M no plano M − H; (b) Curva de magnetização remanente em função de Hdc , na qual não existe o ciclo de histerese. 416 Materiais e Dispositivos Eletrônicos o material é submetido simultaneamente a dois campos H na mesma direção, sendo um constante Hdc e outro alternado Hac . O campo Hac tem inicialmente amplitude maior que Hdc , e decresce no tempo como na Figura 9.16(a). Neste caso, a medida que Hac diminui, a presença do campo Hdc impede que o valor de M tenda para zero, como no caso da desmagnetização ac. Quando Hac tornase nulo, o material retém uma magnetização finita Mr , cujo valor depende de Hdc , como mostrado na Figura 9.17(a). Naturalmente Mr = 0 se Hdc = 0, e Mr = Ms quando o valor de Hdc é elevado. Como resultado deste processo, a curva Mr − Hdc tem a forma mostrada em (b), na qual não existe o ciclo de histerese. Este processo permite magnetizar um material ferromagnético com uma magnetização proporcional ao campo dc, numa certa faixa de campo em torno da origem. Isto não é possı́vel de ser feito sem a polarização ac por causa do efeito de histerese. 9.4 Materiais para Aplicações Tradicionais Os materiais magnéticos desempenham um importante papel na tecnologia moderna, pois encontram aplicações em um grande número de produtos e processos industriais dos mais variados setores. Essas aplicações vão desde dispositivos com funções muito simples, como os pequenos ı́mãs permanentes usados para fechaduras de móveis e utensı́lios, a inúmeros componentes sofisticados utilizados na indústria eletro-eletrônica e de computadores. A mais notável delas é, sem dúvida, a de gravação magnética, cujo mercado tem expandido enormemente nos últimos 20 anos. No setor eletro-eletrônico, os materiais magnéticos são suplantados em volume de aplicação apenas pelos semicondutores, tendo importância econômica quase tão grande quanto estes, e sendo elementos essenciais de muitos dispositivos e equipamentos. Do ponto de vista das propriedades magnéticas básicas, os materiais magnéticos são classificados em três grandes classes: • Materiais duros, ou ı́mãs permanentes; • Materiais moles, também chamados doces ou permeáveis; • Materiais intermediários, ou meios de gravação magnética. As principais caracterı́sticas desses materiais estão mostradas na Figura 9.18. Os materiais duros, usados em ı́mãs permanentes, têm altos valores de magnetização remanente Mr e de campo coercitivo Hc , e portanto têm um Cap. 9 Materiais e Dispositivos Magnéticos 417 Figura 9.18: Ciclos de histereses de materiais magnéticos: (a) Materiais duros, ou ı́mãs permanentes; (b) Materiais moles, ou permeáveis; (c) Materiais intermediários para gravação magnética. ciclo de histerese retangular, como em (a). Os materiais moles são aqueles facilmente magnetizáveis pela aplicação de um campo externo, e facilmente desmagnetizáveis com a retirada do campo. Então eles devem ter campo coercitivo muito pequeno e, portanto, um ciclo de histerese muito estreito, como em (b). Finalmente, os meios de gravação magnética devem ter um ciclo de histerese intermediário, como em (c). Eles têm Mr e Hc suficientemente grandes para reter a informação contida no campo de gravação, porém menores que nos ı́mãs permanentes, para permitir que a informação seja apagada. Nas seções seguintes apresentamos mais detalhes sobre as aplicações dessas classes de materiais. 9.4.1 Ímãs Permanentes Os ı́mãs permanentes constituem a aplicação mais antiga e mais caracterı́stica dos materiais magnéticos. Sua função é criar um campo magnético fixo numa certa região do espaço, sem a necessidade da passagem de uma corrente elétrica. Os ı́mãs, também chamados magnetos, são feitos de materiais magnéticos duros, de modo que sua magnetização não seja facilmente alterada por campos externos. Os ı́mãs permanentes são empregados em dispositivos eletromagnéticos (geradores e motores de automóveis, aviões, eletrodomésticos, relógios, computadores, etc.), dispositivos eletroacústicos (alto-falantes, fones, microfones, agulhas magnéticas de toca discos, etc.), instrumentos de medida (galvanômetros e balanças), dispositivos de torque (ultracentrı́fugas, medidores de potência elétrica, etc.) equipamentos médicos, dispositivos de ferrites para Materiais e Dispositivos Eletrônicos 418 microondas, instrumentos e equipamentos cientı́ficos diversos, etc. O campo magnético criado por um ı́mã tem intensidade e variação espacial que dependem de sua forma fı́sica e do material de que é feito. Para entender algumas questões importantes, vamos considerar uma geometria simples. A Figura 9.19 mostra uma extremidade plana de um material com magnetização M, perpendicular à superfı́cie. O campo criado pela magnetização pode ser obtido substituindo as relações (9.3) e (9.4) na equação de Maxwell (2.2), = −∇ · 4π M ∇·H (CGS), = −∇ · M ∇·H (SI) . (9.36) Para integrar estas equações, utilizamos o teorema de Gauss, de maneira análoga ao que se faz com a Eq.(2.1) para o campo elétrico. A analogia com o campo elétrico sugere a introdução de uma nova grandeza, fictı́cia, ρm definida por ρm = −∇ · 4π M (CGS), ρm = −∇ · M (SI) , (9.37) onde ρm faz o papel da densidade volumétrica de monopolos magnéticos. Assim, a integral de volume de (9.36) no interior da superfı́cie de Gauss dá, usando as relações (9.37), dv = ρm dv ≡ qm . ∇·H Figura 9.19: (a) Extremidade plana de um ı́mã permanente magnetizado perpendicularmente à superfı́cie; (b) Vista de perfil. Cap. 9 Materiais e Dispositivos Magnéticos Com a aplicação do teorema de Gauss obtemos, · da = qm H s onde, no CGS, qm = 419 (9.38) −∇ · 4π Mdv = s · da −4π M (9.39) representa os dipolos magnéticos não compensados, no interior da superfı́cie S. No SI a expressão de qm é a mesma de (9.39) sem o fator 4π. Embora os dipolos magnéticos sejam produzidos por correntes elétricas, qm é matematicamente equivalente à carga magnética, ou monopolo magnético. Com isto, a Eq.(9.38) é análoga à lei de Gauss da eletrostática. No caso da geometria da Figura 9.19, a superfı́cie utilizada para a aplicação de (9.38) é a de um cilindro com bases paralelas à superfı́cie plana do material. Como a magnetização é M em z < 0 e nula em z > 0, de (9.39) obtemos qm = 4πMA, onde A é a área da base do cilindro. Os monopolos estão distribuı́dos na superfı́cie, com densidade superficial de carga magnética σm = qm /A = 4πM. Tudo se passa então como se a descontinuidade de M na superfı́cie produzisse monopolos magnéticos. A é dirigido tem monopolos positivos, e faz o papel do superfı́cie para a qual M pólo norte (N) do ı́mã. Supondo que a outra extremidade do ı́mã (pólo Sul) criado pela densidade de carga σm é análogo está muito distante, o campo H ao campo elétrico criado por um plano de cargas elétricas. A aplicação de (9.39) ao cilindro da Figura 9.19 dá, no CGS, Hz = σm /2 = 2πM (z > 0) , Hz = −2πM (z < 0). (9.40) Para obter o resultado no SI basta dividir o lado direito por 4π. Vemos no interior do ı́mã tem o sentido oposto ao de M , e portanto que o campo H tende a desmagnetizar o material. Isto requer que o campo coercitivo seja suficientemente grande para evitar a desmagnetização do material. Com (9.4) e (9.40) obtemos o vetor indução magnética, Bz = 2πM (z > 0) , Bz = 2πM (z < 0). (9.41) tem o mesmo valor em z > 0 e z < 0, o Vemos então que o campo B que já era esperado da condição de contorno que estabelece que a componente é contı́nua na superfı́cie. normal de B Outra forma de ı́mã simples para o cálculo do campo é o da ferradura fechada, ilustrada na Figura 9.20. Neste caso, o campo no entreferro (o espaço 420 Materiais e Dispositivos Eletrônicos Figura 9.20: Ímã permanente na forma de ferradura fechada. entre os dois pólos) é a soma dos campos criados pelas duas superfı́cies de monopolos, ou seja, pelos polos norte e sul do ı́mã. Então, na região central do entreferro, o vetor indução magnética e o vetor intensidade de campo são aproximadamente uniformes, com módulos B = H = 4πM no sistema CGS. Por outro lado, no interior do ı́mã e próximo às superfı́cies, B = 4πM e H = 0. Esses dois exemplos simples mostram que os campos B e H, tanto no interior quanto no exterior, dependem fortemente da forma do ı́mã. Isto significa que mesmo sem campo externo aplicado, o valor de M não é o da magnetização tem remanente, pois H = 0 no ı́mã. Devido ao efeito de desmagnetização, H o sentido oposto ao de M no interior, e portanto a região da curva de histerese relevante para um ı́mã permanente é o segundo quadrante. Como as equações e H, é comum representar o ciclo de hisde Maxwell envolvem os campos B em função de H. A Figura 9.21 mostra o segundo quadrante terese com B do ciclo B(H) para um ı́mã permanente. Note que para H = 0, B = Mr . O ponto de operação do ı́mã é determinado pela interseção da curva de histerese com a curva que representa a equação que relaciona B e H, obtida a partir Figura 9.21: Segundo quadrante da curva B − H de material usado em ı́mã permanente. Cap. 9 Materiais e Dispositivos Magnéticos 421 das equações de Maxwell e das condições de contorno. No caso do ı́mã com a forma de ferradura fechada, o ponto de operação na região central interior de um dos polos é o ponto 1 da Figura 9.21. No caso de um ı́mã com a forma de um disco fino, o ponto de operação é o ponto 2 (Problema 9.8). Em geral procura-se colocar o ponto de operação numa situação intermediária entre 1 e 2, porque a energia armazenada no ı́mã é proporcional a integral de volume do produto BH. Por esta razão, uma grandeza que indica a qualidade de um ı́mã é o valor máximo do produto BH, que corresponde a um certo ponto Pm da curva de histerese. Um bom ı́mã permanente tem um alto valor de (BH)max . Para isto é preciso ter altos valores de Mr e de Hc . A Tabela 9.3 apresenta as principais propriedades de materiais usados como ı́mãs permanentes. Os primeiros ı́mãs eram feitos de magnetita, Fe3 O4 , o ı́mã natural. Os primeiros materiais duros artificiais desenvolvidos no começo do Século XX foram os aços, ligas de Fe-C, endurecidos por tratamento térmico especial. Na década de 1930, laboratórios japoneses descobriram que o campo coercitivo em ligas de Fe podia ser aumentado com a mistura de A, Ni e Co, dando origem as ligas de Alnico. A Tabela 9.3 mostra a composição e os parâmetros de Alnico 5, uma liga de baixo custo muito utilizada ainda hoje. A descoberta do Alnico resultou numa grande melhoria dos ı́mãs em relação aos de aço, cujo produto (BH)max é de apenas 1 MG.Oe (106 G.Oe). As propriedades magnéticas destas ligas foram aperfeiçoadas na década de 1940, quando Neél e Kittel introduziram o conceito de partı́cula de domı́nio único. A idéia é fazer o material como um agregado de partı́culas tão pequenas, que energeticamente não possibilitam a formação de paredes de domı́nios. Essas partı́culas são feitas com formas alongadas, como agulhas, orientadas na mesma Material Composição % 4πMs (kG) Hc (kOe) (BH)max MG.Oe Alnico 5 51 Fe, 8 A, 14 Ni, 24 Co, 3 Cu 12,5 0,72 5,0 Ferrite de Bário BaFe12 O19 (ou BaO · 6Fe2 O3 ) 3,95 2,4 3,5 Samário-Cobalto Co5 Sm 9,0 8,7 20 Fe14 Nd2 B1 13,0 14,0 40 Neodı́mio-Ferro-Boro Tabela 9.3: Principais propriedades de materiais duros, usados como ı́mãs permanentes, a temperatura ambiente (Hummel). Materiais e Dispositivos Eletrônicos 422 direção durante o processo de preparação. Na década de 1950, o laboratório da Philips desenvolveu ı́mãs de ferrite de bário, cuja magnetização remanente é menor que em Alnico 5, porém o campo coercitivo é muito maior. Devido ao fato de ter Hc elevado, o ferrite de bário é usado para fazer ı́mãs com qualquer formato. Os ı́mãs de terras raras foram desenvolvidos a partir da década de 1970. Inicialmente ligas de SmCo, e depois as de Nd-Fe-B, representaram um enorme avanço na qualidade dos ı́mãs, como pode ser visto na Tabela 9.3. O grande aumento do produto (BH)max desses materiais possibilitou a fabricação de dispositivos menores e com desempenho muito melhor que os de Alnico. 9.4.2 Materiais de Alta Permeabilidade Os materiais de alta permeabilidade, também chamados materiais magnéticos moles (soft), ou doces, são utilizados para criar um alto fluxo magnético a partir de uma corrente elétrica, ou então para produzir uma grande indução magnética devido a um campo externo variável. Essas propriedades devem ser alcançadas com requisitos diversos de variação no tempo e no espaço e com um mı́nimo de dissipação de energia. Os materiais de alta permeabilidade devem então ter um ciclo de histerese estreito (Hc muito pequeno) e uma grande inclinação na parte inicial da curva B − H. Material Ferro Aço carbono Aço silı́cio Permalloy Sendust Mumetal Ferrite Mn-Zn Composição (%) Permeabilidade máxima µmax /µ0 4πMs (kG) Hc (Oe) Resistividade (µΩ.cm) Fe 5×103 21,5 1,0 10 5×10 3 21,5 1,0 10 7×10 3 Fe-C(0,05) Fe-Si(3), C(0,005) 78Ni, 22Fe 85Fe, 10Si, 5A 77Ni, 16Fe, 5Cu, 2Cr 50Mn, 50Zn 19,7 0,5 60 10 5 10,8 0,05 16 10 4 10,5 - 80 10 5 6,5 0,05 62 2,5 0,1 108 2×10 3 Tabela 9.4: Propriedades de alguns materiais de alta permeabilidade. µmax é o valor máximo da permeabilidade da curva B − H. Cap. 9 Materiais e Dispositivos Magnéticos 423 A Tabela 9.4 apresenta as principais propriedades de alguns materiais de alta permeabilidade usados atualmente. Em dispositivos de baixa freqüência (motores, geradores, transformadores, reatores, entre outros) os materiais mais comuns são: ferro puro; os chamados aços elétricos, feitos com lâminas de aço com pouca concentração de carbono ou silı́cio; ligas de ferro e nı́quel ou ferro e cobalto, na forma de material bruto ou de liga amorfa preparada por esfriamento rápido sobre uma superfı́cie metálica fria. Em dispositivos de freqüência acima de 10 kHz as perdas por correntes parasitas não permitem o uso de ferro, aços ou ligas metálicas. São então utilizados ferrites diversos como os hexagonais (estrutura do BaFe12 O19 , os espinelios (MFe2 O4 ) e as granadas (Y3 Fe5 O12 ), cuja resistividade é bastante alta. As principais aplicações desses materiais são em transformadores e indutores de alta freqüência utilizados em equipamentos eletrônicos, dispositivos de microondas usados em telecomunicações e em radar, bem como em cabeçotes de gravação magnética. A Figura 9.22 mostra um dispositivo usado para gerar um campo magnético proporcional a uma corrente elétrica, que encontra uma variedade de aplicações. Ele consiste de um núcleo de material magnético mole com permeabilidade µ, em torno do qual há um fio enrolado com N espiras. Vamos obter o campo magnético B no entreferro do dispositivo, criado pela corrente i no enrolamento. A relação entre o campo e a corrente tem origem na lei de Ampère, obtida da equação de Maxwell (2.3). Levando em conta que a corrente i atravessa N vezes a superfı́cie apoiada na curva C mostrada na figura, temos no sistema SI, = Ni . H.d (9.42) Sendo µ µ0 , o fluxo magnético produzido pela corrente fica inteiramente confinado no circuito magnético. Isto faz com que a intensidade do campo seja aproximadamente uniforme na seção reta do núcleo magnético, com valor Hi . Considerando o espaçamento d do entreferro pequeno, o campo também é aproximadamente uniforme na região de ar entre os polos, tendo intensidade He . A Eq.(9.42) então dá, Hi + He d = Ni , (9.43) onde é o comprimento da curva C no interior do núcleo. Para obter o campo B no entreferro, utilizamos as relações entre B e H no núcleo (B = µHi ) e é contı́nua na no ar (B = µ0 He ) e o fato de que a componente normal de B fronteira entre dois meios. Como B só tem componente normal na fronteira 424 Materiais e Dispositivos Eletrônicos Figura 9.22: Circuito magnético usado para gerar um campo magnético no entreferro proporcional a corrente i. entre o núcleo e o ar, B = µHi = µ0 He . Substituindo esta relação em (9.43) obtemos, Ni . (9.44) B= /µ + d/µ0 Sendo A a área da seção reta, o fluxo magnético no entreferro, Φ = BA, pode ser escrito na forma, Ni (9.45) Φ= R onde R é a relutância do circuito magnético, R= d + ≡ Rn + Re µA µ0 A . (9.46) A Eq.(9.45) é análoga à relação entre corrente e tensão num circuito elétrico com resistores em série, I = E/R. No circuito magnético o fluxo Φ é análogo à corrente I, Ni é análogo à força eletromotriz E, sendo por isso chamado força magneto-motriz, e R é análoga à resistência. Note que R, dado por (9.46), é a soma das relutâncias do núcleo (Rn ) e do entreferro (Re ). Isto é análogo à resistência de um circuito série, que é a soma das resistências individuais. As cabeças de gravação e leitura utilizadas em gravação magnética têm circuito magnético como o da Figura 9.22. Nessas cabeças é importante obter o maior fluxo Φ possı́vel no entreferro, para uma certa força magnetomotriz Ni. As Eqs.(9.44)-(9.46) mostram que para isto é necessário minimizar a relutância do núcleo. Costuma-se definir a eficiência de uma cabeça de gravação Cap. 9 Materiais e Dispositivos Magnéticos 425 η pela razão entre o fluxo existente no entreferro e seu valor máximo possı́vel, que seria obtido com Rn = 0. Vemos então que a eficiência é dada por Re . (9.47) η= Re + Rn Para fazer η próximo de 1 deve-se utilizar no núcleo materiais com valores muito elevados de µ. Além disso, costuma-se fazer a seção reta do entreferro Re . muito menor que a do núcleo, de modo a tornar Rn Exemplo 9.2: Considere um ı́mã permanente de alnico e um eletromagneto com núcleo de ferro, ambos com a forma das Figuras 9.20 e 9.22, com seção reta circular de diâmetro 10 cm, comprimento médio total 100 cm e espaçamento do entreferro 2 cm. Considerando que o enrolamento tem 800 espiras, calcule a corrente que deve passar no enrolamento para que o campo magnético no entreferro, num ponto próximo do centro da superfı́cie, tenha no eletromagneto o mesmo valor que no ı́mã. O campo no entreferro do ı́mã é calculado usando o resultado (9.40), considerando que a superfı́cie do pólo norte é equivalente a um disco com densidade de carga magnética positiva σm , enquanto o pólo sul tem carga magnética −σm . Então o campo no entreferro do ı́mã é aproximadamente uniforme e tem valor H = σm . O problema é inteiramente análogo ao do campo elétrico entre as placas de um capacitor com seção circular. Usando o valor de 4πM do alnico dado na Tabela 9.3, vemos que o campo no entreferro do ı́mã é H = 12, 5 kOe = 12, 5 × 103 × 79, 58 A/m = 9, 95 × 105 Nm . O campo H no entreferro do eletromagneto é calculado com (9.44), H= Ni B . = µ0 µ0 /µ + d Usando para µ o valor da permeabilidade máxima do ferro, dado na Tabela 9.4, obtemos o valor da corrente que produz um campo igual ao do ı́mã permanente, no SI, i= H( µ0 /µ + d) 9, 95 × 105 (1/5000 + 0, 02) = = 25, 12 A . N 800 Observe que o valor de µ0 /µ é muito menor que o espaçamento do entreferro d. Portanto, é o espaçamento que limita o valor do campo. 9.5 Gravação Magnética A gravação de um sinal, para seu armazenamento e posterior reprodução, é uma das funções mais importantes no processamento de informações. A pos- 426 Materiais e Dispositivos Eletrônicos sibilidade de utilizar um material magnético para gravação de informação foi demonstrada pela primeira vez no final do Século XIX pelo engenheiro dinamarquês Valdemar Poulsen. Ele inventou um instrumento que gravava sinais de voz numa corda de aço magnetizável. No entanto, como o sinal reproduzido era muito fraco e distorcido, durante muitos anos a invenção não passou de uma curiosidade tecnológica. Somente na década de 1940, as fitas magnéticas ganharam importância comercial nos EUA em equipamentos eletrônicos de gravação de áudio. A gravação de sinais de vı́deo foi demonstrada pela primeira vez em 1951, também nos EUA, ganhando importância comercial na década de 60. Graças ao desenvolvimento da microeletrônica e à evolução das fitas magnéticas, os equipamentos de gravação e de reprodução de áudio e de vı́deo tornaram-se muito populares a partir da década de 70. Na área digital a gravação magnética sempre desempenhou papel importante. Os primeiros computadores eletrônicos comerciais produzidos na década de 1950 utilizavam como memória principal, discos ou cilindros cobertos com uma camada magnética. Eles tinham capacidade de armazenamento de 103 -104 bits/polegada2 e acesso muito lento, com tempos da ordem de mili-segundos. Na década de 60 eles deixaram de ser usados como memória principal, dando lugar aos núcleos de ferrite, que possibilitavam acesso mais rápido. A partir dos anos 70, as memórias de acesso rápido e aleatório (Random Access Memory - RAM) passaram a ser feitas com dispositivos semicondutores MOS. No entanto, as fitas e depois os discos magnéticos firmaram-se como o melhor meio de armazenamento não-volátil e regravável de grande quantidade de dados. Foi na área de gravação magnética que ocorreu a maior expansão no mercado de materiais magnéticos nos anos recentes, e por conseguinte nas atividades de pesquisa e desenvolvimento. Como resultado, tem-se verificado grande aumento na capacidade de armazenamento e na velocidade de gravação e acesso. A densidade de armazenamento em disco, por exemplo, tem aumentado continuamente há quatro décadas, sendo hoje superior a 1010 bits/polegada2 . Além da utilização em discos rı́gidos, os meios magnéticos possibilitaram a introdução dos discos flexı́veis, que tornaram muito prático o transporte e armazenamento externo de informações. Como resultado dos avanços nesta área, a gravação magnética domina atualmente o mercado de gravação de sinais analógicos de áudio e de vı́deo e de sinais digitais regraváveis. O sucesso desta tecnologia decorre de vários fatores: a variedade de formatos dos meios (fitas, cartões, folhas, discos rı́gidos ou flexı́veis, etc.); baixo custo; não-volatilidade; alta densidade; e capacidade quase ilimitada de gravar e regravar informações. Cap. 9 Materiais e Dispositivos Magnéticos 9.5.1 427 Conceitos Básicos A Figura 9.23 mostra os elementos básicos de um sistema tradicional de gravação e reprodução com fita magnética. A fita é feita de material plástico, como polietileno, com espessura da ordem de 25 µm, recoberta com uma fina camada de emulsão de partı́culas magnéticas. A fita move-se com velocidade constante, mantendo contato com uma cabeça (ou cabeçote) de gravação e uma cabeça de leitura. Cada cabeça é feita por um núcleo de material magnético de alta permeabilidade, com entreferro estreito, tendo um enrolamento para o sinal de corrente elétrica. É comum também utilizar uma só cabeça, tanto para gravação quanto para leitura. No processo de gravação, a corrente variável no tempo, correspondente ao sinal a ser gravado, produz um campo magnético variável na borda do entreferro da cabeça de gravação. Como a fita está em movimento, o campo cria uma magnetização que varia ao longo da fita, retratando o sinal de entrada. No processo de reprodução, ou leitura, a magnetização da fita cria um campo magnético que produz um fluxo magnético variável na cabeça de leitura. Este fluxo variável induz uma corrente elétrica no enrolamento, que reproduz o sinal original de gravação. No sistema mostrado na Figura 9.23, a magnetização da fita tem a direção longitudinal. Supondo que a corrente da entrada varia senoidalmente Figura 9.23: Elementos básicos de um sistema tradicional de gravação e reprodução com fita magnética. 428 Materiais e Dispositivos Eletrônicos no tempo, com freqüência angular ω, I = I0 sen ωt , (9.48) pode-se mostrar que a magnetização da fita é, em primeira aproximação, M = M0 sen kx (9.49) onde x é a coordenada ao longo da fita e k = ω/v, sendo v a velocidade da fita. A partir desta relação define-se o comprimento de onda da variação espacial, λ= 2π v v = 2π = k ω f (9.50) onde f é a freqüência do sinal. A análise quantitativa dos processos de gravação e reprodução é feita com base nas variações dadas por (9.48) e (9.49), uma vez que um sinal com uma variação qualquer no tempo pode ser decomposto em funções senoidais por transformada de Fourier. Na realidade, o processo de magnetização da fita a partir da corrente na cabeça de gravação é razoavelmente complexo, sendo necessário recorrer a métodos numéricos ou modelos aproximados para obter a variação espacial de M. Contudo a Eq.(9.49) é uma boa aproximação para a variação de M. Esta variação produz um campo interno na fita que tende a desmagnetizá-la, daı́ a necessidade do material ter um campo coercitivo razoavelmente alto. Como será mostrado na próxima seção, o campo de desmagnetização aumenta com a diminuição do comprimento de onda. A variação de M também cria um campo externo na fita. Este campo, que será calculado na próxima seção, tem linhas de indução mostradas na Figura 9.24. Quando a fita passa nas bordas do entreferro da cabeça de leitura, o campo externo gera um fluxo magnético que varia senoidalmente no tempo. Este fluxo variável induz uma força eletromotriz nas espiras da cabeça, que é aproximadamente proporcional à corrente do sinal de gravação. Este processo é utilizado nos três tipos básicos de gravação magnética: sinal analógico de áudio; sinal analógico de vı́deo; e sinais digitais. Na gravação de áudio, a freqüência do sinal está compreendida na faixa 50 Hz - 20 kHz. Sendo a velocidade da fita v = 2 − 8 polegadas/seg ≃ 5-20 cm/seg, o comprimento de onda de gravação está na faixa 2,5 µm - 0,4 cm. Como a espessura do entreferro das cabeças de gravação e de leitura é da ordem de alguns µm, é perfeitamente possı́vel gravar e detetar variações Cap. 9 Materiais e Dispositivos Magnéticos 429 Figura 9.24: Ilustração do campo magnético criado por uma magnetização que varia senoidalmente ao longo da fita. espaciais da magnetização nesta faixa de comprimentos de onda. A gravação de áudio é feita superpondo o sinal de áudio com um sinal de polarização ac de freqüência 100 kHz, para obter uma linearidade na relação M − H, através do processo descrito na seção 9.3.5. Na realidade, foi a descoberta deste processo na década de 1920 que viabilizou a gravação de áudio sem a grande distorção que ocorre na gravação direta. Na gravação de vı́deo o espectro do sinal cobre a faixa 30 Hz − 2 MHz, o que causa dois problemas: o alto valor da razão entre os valores máximo e mı́nimo desta faixa, cerca de 7 × 104 , torna difı́cil a operação dos circuitos de gravação e leitura; o comprimento de onda correspondente à freqüência máxima para uma velocidade de fita de 30 polegadas/seg, λ = 0, 15 µm, é muito pequeno para ser gravado nos meios magnéticos usuais. Duas técnicas são usadas para contornar estes problemas. A primeira consiste em modular a freqüência de uma onda portadora com o sinal de vı́deo. O sinal modulado em FM é então utilizado diretamente na gravação. A freqüência usada na portadora é 3,9 MHz e a banda de passagem tem largura total de 5,6 MHz. Isto reduz enormemente a razão entre os extremos da banda e torna o sistema pouco sensı́vel às flutuações na amplitude do sinal de leitura. A outra técnica importante é o uso de cabeça de gravação rotativa. A fita desliza em baixa velocidade (0,8 polegada/seg) sobre a cabeça na forma de um cilindro girante, com velocidade superficial de 220 polegadas/seg. Isto resulta numa alta velocidade relativa entre a fita e a cabeça, e conseqüentemente em maior comprimento de onda. A gravação digital é, conceitualmente, muito simples, porque o sinal é uma seqüência de pulsos com apenas dois valores, correspondentes aos dı́gitos 0 e 1. Estes dı́gitos podem ser armazenados através da magnetização orientada num dos dois sentidos de uma certa direção. Então o processo de gravação é direto, sem a necessidade das sofisticações usadas nos gravadores de áudio ou 430 Materiais e Dispositivos Eletrônicos de vı́deo. A gravação pode ser feita em fita ou em disco, tanto na direção longitudinal quanto perpendicular. A gravação magnética digital é largamente utilizada em computadores. No entanto, ela está sendo cada vez mais empregada na gravação de sinais de áudio e de vı́deo digitalizados. 9.5.2 Análise Quantitativa Nesta seção vamos analisar em detalhe o processo de reprodução de um sinal gravado num meio magnético. Para simplificar o problema, consideramos uma camada magnética de espessura δ, infinita nas direções x e z. O sistema de coordenadas está mostrado na Figura 9.25, sendo x a direção longitudinal de movimento da camada. Como a fita magnética tem largura finita na direção z, o resultado obtido para a camada infinita será aproximadamente válido para a região central e para pequenas distâncias da fita. O objetivo da análise é obter os campos criados pela fita magnetizada, e a partir deles calcular a tensão induzida na cabeça de leitura. Para isto consideramos que a fita tem magnetização longitudinal, variando senoidalmente na direção x, = x̂ M(x) = x̂ M0 sen kx . M (9.51) Como M não varia na direção z, a geometria do problema é reduzida à duas dimensões, x e y. Para facilitar a solução do problema introduzimos o potencial magnético escalar ψ(x, y), definido pela relação, = −∇ψ H . (9.52) Isto é possı́vel porque o rotacional do gradiente de qualquer função escalar é nulo, e num sistema magnetostático (∂/∂t = 0) sem corrente elétrica, a Figura 9.25: Geometria utilizada para calcular os campos criados por uma fita magnética. Cap. 9 Materiais e Dispositivos Magnéticos 431 = 0. A equação de ψ, obtida substituindo (9.52) e (9.37) Eq.(2.4) fica ∇ × H em (9.36), é, no SI, (9.53) ∇2 ψ = −ρm . Esta equação deve ser resolvida para as três regiões da Figura 9.25, sendo a solução final determinada pelas condições de contorno nas superfı́cies em y = ±δ/2. Na região 1 a densidade magnética ρm é dada por (9.37) aplicada a (9.51), ρm = −M0 cos kx . (9.54) A Eq.(9.53) com ρm = 0 é chamada equação de Poisson. Na parte externa da fita, onde ρm = 0, ela reduz-se a equação de Laplace, ∇2 ψ = 0 . (9.55) Em duas dimensões ela pode ser escrita na forma ∂2ψ ∂2ψ + 2 =0 ∂x2 ∂y . (9.56) As soluções desta equação para as regiões 2 e 3 são ψ2,3 (x, y) ∝ (sen kx, cos kx) · e±ky . (9.57) Note que embora ρm não tenha dependência em y, o potencial no interior da camada deve variar com y, caso contrário não é possı́vel satisfazer as condições de contorno nas superfı́cies. A solução de (9.53) com ρm dado por (9.54) é ψ1 (x, y) = cos kx (A eky + B e−ky + C) . (9.58) A solução final nas três regiões é determinada pelas condições de con eB nas duas superfı́cies. A continuidade da componente torno dos campos H tangencial de H na superfı́cie de separação de dois meios implica que ψ é contı́nuo na superfı́cie. (9.59) não tem componente normal à superfı́cie, a continuidade da compoComo M implica que Hy é contı́nuo, ou seja, nente normal de B ∂ψ é contı́nuo na superfı́cie. ∂y (9.60) Nas regiões 2 e 3 a solução (9.57) contém somente o termo cos kx, uma vez que o termo sen kx não pode satisfazer as condições de contorno com (9.58). Além disso, ψ2 não pode conter o termo exp (ky) pois ele diverge em y → +∞, Materiais e Dispositivos Eletrônicos 432 enquanto ψ3 não pode ter o termo exp (−ky), que diverge em y → −∞. Assim, o potencial nas regiões 2 e 3 é dado por: ψ2 (x, y) = D cos kx e−ky (9.61) ψ3 (x, y) = E cos kx eky (9.62) A aplicação das condições de contorno (9.59) e (9.60) às funções (9.58), (9.61) e (9.62) em y = ±δ/2 e as Eqs.(9.53) e (9.54) dão cinco equações que permitem determinar as cinco constantes. Os potenciais não três regiões são (Problema 9.10): M0 − δ2 ≤ y ≤ δ2 ψ1 (x, y) = − cos kx 2 − e−k(y+δ/2) − ek(y−δ/2) (9.63) 2k δ ≤y 2 ψ2 (x, y) = − M0 (1 − e−kδ ) cos kx e−k(y−δ/2) 2k y ≤ − δ2 ψ3 (x, y) = − M0 (1 − e−kδ ) cos kx ek(y+δ/2) 2k (9.64) . (9.65) A solução (9.63) fornece o campo magnético no interior da camada. Suas componentes são: ∂ψ1 M0 (9.66) Hx = − =− sen kx 2 − e−k(y+δ/2) − ek(y−δ/2) ∂x 2 M0 ∂ψ1 Hy = − = cos kx e−k(y+δ/2) − ek(y−δ/2) . (9.67) ∂y 2 O campo criado pela magnetização na direção longitudinal, (9.66), tem o , e por isto é chamado campo de desmagnetização. sentido oposto ao de M Para que a fita magnética retenha a magnetização produzida pela cabeça de gravação, é necessário que o material tenha um campo coercitivo maior que o campo de desmagnetização em todos os pontos. Vemos na Eq.(9.66) que o campo é nulo no limite ω = k = 0 e cresce a medida que a freqüência aumenta. O máximo valor do campo no limite ω, k → ∞ é M0 /2. Este resultado mostra que as fitas de vı́deo devem ser feitas com materiais de campo coercitivo maior que as fitas de áudio. O campo no exterior da fita é obtido a partir de (9.64) e (9.65). É fácil mostrar que, M0 (1 − e−kδ ) sen kx e−k(±y−δ/2) (9.68) Hx = − 2 Cap. 9 Materiais e Dispositivos Magnéticos Hy = ∓ M0 (1 − e−kδ ) cos kx e−k(±y−δ/2) 2 433 , (9.69) onde os sinais superiores valem para a região acima da fita (y > δ/2) e os inferiores para a região de baixo (y < −δ/2). Este resultado indica que as componentes longitudinal e normal do campo estão defasadas de 90◦ . O fator exp(−ky) tem grande importância no sinal de leitura, pois introduz um decaimento exponencial no campo com a distância da fita. Por exemplo, o campo a uma distância d = λ da fita é reduzido a exp(−2π) ≃ 0, 002 do valor na superfı́cie. Por causa deste resultado, é importante fazer com que a fita seja tensionada para deslizar em contato com a cabeça de leitura. No caso da gravação de vı́deo, como λ é muito pequeno, o ruı́do causado pelas flutuações de amplitude devido ao fator exponencial é evitado através da modulação em freqüência. Para calcular o sinal induzido na cabeça de leitura, consideramos a geometria mostrada na Figura 9.26. Apenas a componente Hx contribui para o fluxo que atravessa as espiras enroladas no núcleo. A presença do núcleo magnético resulta num aumento do campo. Através do método das imagens pode-se mostrar que, num núcleo com permeabilidade µ µ0 , o campo B é duas vezes maior que o campo no ar. Assim, o fluxo magnético que atravessa as espiras é, aproximadamente, ∞ e−kd Φ = ηL Bx dy ≃ −ηµ0 M0 L(1 − e−kδ ) sen kx (9.70) k δ/2+d onde η é a eficiência da cabeça de leitura, L é a largura da fita ou da trilha de gravação e d é a distância entre o núcleo e a fita. A tensão induzida nas N Figura 9.26: Ilustração do fluxo criado pela fita magnética na cabeça de leitura. 434 Materiais e Dispositivos Eletrônicos espiras da cabeça é obtida com a lei de Faraday. Fazendo x = vt vem V (t) = −N dΦ dΦ = −Nv dt dx . (9.71) Substituindo (9.70) em (9.71) obtemos V (t) = Nηµ0 M0 Lv (1 − e−kδ ) e−kd cos ωt (9.72) Este resultado mostra que a tensão elétrica produzida na cabeça de leitura pela magnetização da fita é um sinal alternado, defasado de 90◦ da corrente senoidal de gravação. A amplitude da tensão de saı́da depende da freqüência do sinal, da velocidade da fita, da magnetização remanente e da largura da trilha de gravação. Na gravação digital em computadores, uma exigência importante é a capacidade de armazenamento das memórias magnéticas, expressa em bits/cm2 . O aumento desta capacidade requer a diminuição da área ocupada por um bit, e portanto de L. Vemos então que na leitura convencional uma dificuldade para o aumento da capacidade é a perda do sinal de corrente com a diminuição de L. Exemplo 9.3: Calcule a amplitude do sinal de saı́da de um cabeçote de leitura de uma fita magnética com freqüência de áudio de 1 kHz, tendo os seguintes parâmetros: N = 20, η = 1, µ0 M = 0, 5 T, v = 0, 1 m/s, L = 1 mm, δ = 10 µm e d = 0. O número de onda de um sinal de 1 kHz gravado numa fita com velocidade v = 0, 1 m/s é dado por (9.50), k= 2π × 103 2πf = = 6, 28 × 104 m−1 . v 0, 1 A amplitude do sinal é calculada com (9.72), V = N η µ0 M L v 1 − e−kδ 4 −5 = 20 × 1 × 0, 5 × 10−3 × 0, 1 × 1 − e−6,28×10 ×10 = 4, 66 × 10−4 V = 0, 466 mV . Este valor é facilmente processável para a reprodução final do sinal gravado. Cap. 9 Materiais e Dispositivos Magnéticos 9.5.3 435 Materiais Apropriados Dois tipos de materiais magnéticos são utilizados nos equipamentos de gravação magnética: materiais de alta permeabilidade, que formam os núcleos dos cabeçotes de gravação e leitura; materiais intermediários, que formam as camadas magnéticas dos meios de armazenamento. Os principais materiais usados nos núcleos dos cabeçotes são as ligas metálicas, Permalloy, Sendust e os óxidos ferrites de MnZn e NiZn. As principais vantagens de Permalloy e Sendust, cujos parâmetros estão na Tabela 9.4, são o alto valor da magnetização de saturação e a alta permeabilidade. Além disso, eles têm grande resistência ao desgaste mecânico provocado pelo contato da fita ou disco em movimento. Entretanto, como eles têm baixa resistividade elétrica, o efeito de correntes parasitas só permite seu uso em baixas freqüências. Por isso eles são usados nas cabeças de gravadores de áudio. Os ferrites de MnZn e NiZn têm menor magnetização, porém têm resistividade 105 vezes maior que as ligas metálicas. Por esta razão eles são usados nos cabeçotes de gravação e leitura de vı́deo e de sinais digitais. Quanto aos meios de gravação, há dois tipos de materiais intermediários usados para fazer a camada magnética: os meios particulados, que consistem de partı́culas microscópicas de óxidos ou metais magnéticos em suspensão numa camada polimérica; e os filmes finos de metais ou ligas metálicas ferromagnéticas. Os meios particulados são utilizados para recobrir as fitas de áudio e de vı́deo, os cartões de plástico ou de papelão usados em inúmeras aplicações, e os discos flexı́veis de computadores. Eles também são usados nos discos rı́gidos, porém estão sendo gradualmente substituı́dos por filmes finos metálicos. Os meios particulados são preparados por processos semelhantes ao de fabricação de tintas empregadas para pintar paredes, madeira, telas artı́sticas, etc. Qualquer tinta é formada por partı́culas sólidas diluı́das e em suspensão num meio lı́quido, constituı́do de solventes, diluentes e secantes adicionados a um aglutinante. As partı́culas sólidas são os pigmentos coloridos que dão cor a tinta, enquanto o aglutinante pode ser resina orgânica natural, artificial ou óleo. Depois que a tinta é espalhada na superfı́cie a ser pintada, ocorre o processo de secagem, no qual alguns componentes do lı́quido evaporam e outros reagem quimicamente no aglutinante. Após a secagem, os pigmentos coloridos são fixados na camada de aglutinante que cobre a superfı́cie. No caso do meio magnético, o aglutinante é um polı́mero e as partı́culas são feitas de óxidos ou metais magnéticos, formando o que pode ser chamado de tinta magnética. 436 Materiais e Dispositivos Eletrônicos As partı́culas têm forma alongada, com comprimento da ordem de 1 µm e dimensão transversal da ordem de 0,1 µm. Devido a estas dimensões reduzidas, elas só podem acomodar um domı́nio magnético. A tinta magnética é espalhada sobre a superfı́cie do material da base, que pode ser uma folha de polietileno, no caso das fitas, ou de plástico ou papelão, no caso dos cartões. Durante o processo de secagem ele é submetido a um campo magnético da ordem de 1 kOe, que serve para alinhar as partı́culas na direção que será utilizada para magnetização. Após a secagem, as partı́culas ficam alinhadas e separadas umas das outras na camada magnética. Vários compostos são utilizados para fazer as partı́culas magnéticas. O mais antigo e ainda o mais comum nas fitas de áudio é óxido férrico, com fórmula quı́mica γ-Fe2 O3 . Ele tem magnetização de saturação 4πMs = 4.650 G (ou µ0 Ms = 0, 465 T no SI) e campo coercitivo Hc = 300 Oe. No entanto, como as partı́culas são diluı́das na camada magnética, o valor de 4πMs é reduzido na mesma proporção da diluição, em geral na faixa 30-50 %. O óxido férrico também é utilizado em discos flexı́veis e em cartões de plástico ou bilhetes de papelão. Entretanto, sua aplicação é restrita a baixas freqüências e baixas densidades de gravação devido ao valor de Hc . À medida que o comprimento de onda, e portanto o tamanho do bit de gravação, diminui, o campo de desmagnetização aumenta, tornando necessários valores mais altos de Hc . Na década de 1970 a empresa japonesa TDK descobriu que a impregnação de uma fina camada de cobalto na superfı́cie do óxido férrico eleva o valor de Hc para cerca de 700-800 Oe. Este processo é atualmente empregado nas fitas de áudio de melhor qualidade e nos discos flexı́veis de alta capacidade. Outra substância empregada para fazer partı́culas de tintas magnéticas é dióxido de cromo, CrO2 . Ela tem 4πMs = 6.160 G e Hc = 450 Oe, valores maiores que em óxido férrico puro. O CrO2 foi muito utilizado em fitas de áudio, de vı́deo e de computadores, antes da descoberta do processo de modificação do óxido férrico com cobalto. Atualmente ele é empregado por alguns fabricantes de fitas de vı́deo. Além dos óxidos, também são utilizados nas tintas magnéticas partı́culas metálicas de Fe, Co ou suas ligas. Estas partı́culas têm valores de Ms e de Hc maiores que os óxidos, e portanto apresentam vantagens na gravação de altas freqüências, porém requerem processos de preparação mais sofisticados e dispendiosos. Durante a década de 1990, ganharam espaço na tecnologia de fabricação de discos magnéticos para computadores, os filmes finos metálicos ou multicamadas de elementos do grupo de transição do ferro, terras raras e suas ligas. Uma grande vantagem dos filmes é o alto valor de Ms . Por exemplo, Fe ou Cap. 9 Materiais e Dispositivos Magnéticos 437 Co puros têm valor de Ms uma ordem de grandeza maior que as partı́culas de óxidos diluı́dos nas tintas magnéticas. Os filmes finos magnéticos são preparados pelos processos de evaporação em alto vácuo ou pulverização, descritos na seção 1.4.5. As ligas mais utilizadas no momento são CoNiPt, CoCrTa e CoCrPt, que têm coercividade na faixa 750-1500 Oe. Os filmes são depositados sobre um disco de alumı́nio, tendo espessura de dezenas de nm, e cobertos com uma camada de carbono para dar resistência à corrosão e para lubrificação no contato com o cabeçote de gravação. 9.5.4 Novas Tecnologias com Filmes Finos e Nanoestruturas A necessidade de aumentar a capacidade de armazenamento de dados nos computadores tem levado ao desenvolvimento de novos materiais, dispositivos e processos de gravação e leitura magnéticas. Os desenvolvimentos recentes foram possibilitados por inúmeros avanços cientı́ficos e descobertas fundamentais em filmes finos, multicamadas e estruturas magnéticas na escala nanométrica. Atualmente há um intenso esforço de pesquisa cientı́fica e tecnológica em todo o mundo visando utilizar estas estruturas para aumentar a capacidade de memória e a velocidade de gravação e acesso em discos magnéticos, e para obter novos dispositivos comerciais de memória magnética de acesso randômico MRAM (Magnetic Random Access Memory). A vantagem da MRAM sobre a RAM de semicondutores é sua nãovolatilidade. Nesta seção abordaremos apenas dois produtos das novas tecnologias, a memória magneto-óptica e a cabeça de leitura de magneto-resistência gigante. A tecnologia de memória magneto-óptica é empregada em discos removı́veis de alta capacidade. Nesta tecnologia os bits de informação são gravados no disco em movimento por um processo termomagnético. Como mostrado na Figura 9.27, no processo de gravação o feixe de um laser semicondutor modulado pelo sinal elétrico contendo a informação a ser gravada (0 ou 1), é focalizado por uma lente na camada magnética. O filme é previamente magnetizado na direção perpendicular, para cima, correspondendo ao bit 0. Além disso, na região do foco da lente existe um campo magnético criado por um ı́mã permanente, dirigido para baixo. Este campo tem valor menor que o campo coercitivo do filme à temperatura ambiente, de modo que ele sozinho não altera a magnetização do filme. Para gravar o bit 1 numa pequena região do filme, o feixe do laser aquece esta região e produz uma rápida diminuição de Hc . Isto possibilita ao campo do ı́mã inverter o sentido da magnetização, 438 Materiais e Dispositivos Eletrônicos Figura 9.27: Ilustração de um sistema de gravação e leitura magneto-óptica. como mostrado na Fig.9.27. O processo de leitura é baseado num efeito magneto-óptico. Quando um feixe de luz polarizada incide na superfı́cie de um material magnético, a luz refletida tem polarização em direção um pouco diferente da incidente. O sentido da mudança da polarização depende do sentido da magnetização. Este fenômeno, chamado efeito Kerr magneto-óptico, permite a leitura do sinal gravado através dos seguintes passos: o laser emite um pulso que passa por um polarizador e incide no meio magnético; o feixe refletido atravessa o espelho parcial e o analisador, sendo convertido em sinal elétrico no fotodiodo. Como a polarização do feixe refletido depende do sentido da magnetização na região do foco da lente, a intensidade da luz após o analisador varia, dependendo se o bit gravado for 0 ou 1. A vantagem desta tecnologia em relação à gravação magnética convencional é a maior capacidade de armazenamento. Isto resulta do fato da área de focalização da lente ser muito menor que a área mı́nima necessária para gravar e reproduzir um sinal com cabeçotes indutivos. Os discos magneto-ópticos são feitos de filmes finos ou multicamadas de ligas que apresentam forte efeito magneto-óptico e que produzem magnetização perpendicular ao filme. Os materiais mais utilizados nos filmes são ligas binárias ou ternárias de metais de transição 3d e terras raras, tais como GdCo, GdFe, TbFe, DyFe, GbTbFe e TbDyFe. Cap. 9 Materiais e Dispositivos Magnéticos 439 As principais vantagens da gravação magneto-óptica em relação à gravação tradicional nos discos flexı́veis são o menor tempo de acesso e a maior capacidade de memória. O tempo de acesso é cerca de dez vezes menor porque não há contato do cabeçote de gravação e leitura com o disco, o que permite girar o disco com maior velocidade. A capacidade de memória do disco magneto-óptico é cerca de mil vezes maior que no disco flexı́vel, porque na leitura magneto-óptica o feixe de laser é focalizado pela lente numa área muito menor que a área do bit nos discos flexı́veis. A desvantagem da gravação magneto-óptica e que tem dificultado sua disseminação no mercado é seu maior custo em relação aos dispositivos de discos magnéticos flexı́veis e de discos ópticos compactos. Outro desenvolvimento recente na tecnologia de memórias magnéticas é o cabeçote de magneto-resistência gigante, GMR (Giant Magneto Resistance). A magneto-resistência é o fenômeno pelo qual a resistividade elétrica ρ de um metal, ou de um semicondutor, varia com a aplicação de um campo magnético H. A taxa de variação ∆ρ/∆H depende do material e também do valor de H. Ela é muito maior nos metais ferromagnéticos que nos semicondutores e nos metais não-magnéticos. Além disso, ela pode ser aumentada em até duas ordens de grandeza em multicamadas de filmes finos metálicos, intercalando metais magnéticos e metais não-magnéticos. O aumento da magneto-resistência em multicamadas de filmes finos é devido à influência do spin dos elétrons nas propriedades de transporte. Como vimos na Seção 4.5, o livre caminho médio dos elétrons em metais é da ordem de 1000 Å, ou 100 nm. Por isso, ao atravessar um material massivo ou um filme grosso, com espessura da ordem ou maior que 1 µm, o elétron sofre inúmeras colisões e perde a orientação de seu spin. Por outro lado, ao atravessar um filme fino, com espessura de até dezenas de nm, a orientação do spin é preservada, pois o elétron não sofre colisões no caminho. Numa estrutura de várias camadas metálicas finas, as colisões ocorrem principalmente nas interfaces. Quando um elétron com spin orientado no sentido da magnetização de uma camada magnética passa para outra camada magnética, a probabilidade de ocorrer colisão na interface depende da direção da magnetização desta camada. A probabilidade é pequena se as duas magnetizações estão paralelas, pois o spin do elétron não é perturbado na passagem de uma camada para a outra. Por outro lado, a probabilidade de colisão é maior se as magnetizações são antiparalelas ou têm direções diferentes. O fato do movimento dos elétrons em multicamadas magnéticas depender de seu spin tem conseqüências importantes. Como a condutividade é propor- 440 Materiais e Dispositivos Eletrônicos cional ao tempo de colisão, e esta por sua vez é inversamente proporcional à probabilidade de colisão, a resistividade é menor quando as magnetizações estão paralelas. Em certas multicamadas formadas de filmes magnéticos, intercalados por filmes metálicos não magnéticos, a orientação relativa das magnetizações depende da direção e do valor do campo magnético aplicado. Desta forma, a resistência da multicamada varia muito com o campo magnético. Este fenômeno, chamado de magneto-resistência gigante, foi descoberto em 1988, em pesquisas lideradas pelo fı́sico gaúcho Mario Baibich, quando passava uma temporada na Universidade de Orsay, na França. A descoberta da magneto-resistência gigante estimulou as pesquisas cientı́ficas em nanoestruturas e multicamadas magnéticas, o que resultou na observação de inúmeros outros fenômenos nos quais as propriedades de transporte são controladas pelo spin do elétron. Em conseqüência, vários dispositivos eletrônicos inteiramente novos foram desenvolvidos, dando origem a um novo ramo da tecnologia chamado de spintrônica, ou magneto-eletrônica Um produto importante da spintrônica é a válvula de spin, um dispositivo cuja resistência elétrica é controlada pela direção dos spins, ou seja da magnetização, de uma camada magnética sensora. A estrutura básica de uma válvula de spin está mostrada na Figura 9.28. Ela consiste de quatro camadas de filmes finos, depositados seqüencialmente sobre um substrato apropriado, que pode ser vidro, um cristal isolante (como MgO) ou uma pastilha de semicondutor (como Si ou GaAs). A camada de cima é um filme de metal magnético mole, com baixa anisotropia magnética, como Ni0,81 Fe0,19 (permalloy) ou Co0,9 Fe0,1 , com espessura da ordem de 10 nm. Ela é a camada sensora, pois é a direção de sua magnetização, determinada por um campo externo, que controla a resistência do dispositivo. Sob ela está uma camada fina de um metal condutor não magnético, em geral cobre, com espessura da ordem de 5 nm, por onde passa a maior parte da corrente de prova I. A resistência da camada de cobre depende da direção da magnetização da camada sensora em Figura 9.28: Estrutura básica de uma válvula de spin. Cap. 9 Materiais e Dispositivos Magnéticos 441 relação à da camada presa, por causa do mecanismo explicado anteriormente. Como o nome diz, a camada presa tem magnetização numa direção fixa, que serve de referência para o sensor. Quando a magnetização da camada sensora é paralela à da referência, a resistência R da válvula de spin é baixa, e quando é antiparalela a resistência é alta. O mecanismo que prende a magnetização de referência foi descoberto na década de 1950, porém só foi compreendido no final dos anos 90, sendo conhecido como polarização por intercâmbio (exchange bias). Ele resulta da interação de intercâmbio entre os átomos na interface de uma camada ferromagnética (FM) com uma camada antiferromagnética (AF). Quando o conjunto é resfriado na presença de um campo externo, passando de uma temperatura acima para uma abaixo da temperatura de ordenamento do material AF, os spins da interface no lado AF passam a ser majoritariamente da sub-rede paralela à magnetização da camada FM. Como a camada AF tem magnetização total desprezı́vel, ela não é afetada por campos externos, permanecendo num estado congelado. Assim, a interação de intercâmbio entre os spin do lado AF e os spins do lado FM gera na interface um campo magnético efetivo de dezenas, ou centenas de oersteds, que prende a magnetização da camada FM na direção do campo aplicado durante o resfriamento. A camada AF tem espessura maior que as outras, da ordem de dezenas de nm, para que o arranjo de spins fique congelado. Ela pode ser feita por uma variedade de materiais antiferromagnetos, dentre os quais NiO e IrMn, que têm ordenamento AF à Figura 9.29: Ilustração esquemática do cabeçote de leitura e gravação magnética em discos rı́gidos utilizado em computadores. 442 Materiais e Dispositivos Eletrônicos temperatura ambiente. Uma aplicação importante das válvulas de spin é nos cabeçotes de leitura de gravação magnética em discos rı́gidos de computadores. A Figura 9.29 ilustra o cabeçote de gravação e de leitura utilizado atualmente. A figura representa apenas uma ilustração esquemática para facilitar a visão dos componentes. Na realidade todos os componentes são fabricados na forma de multicamadas de filmes finos, formando um conjunto integrado. No cabeçote mostrado, a gravação é feita com o dispositivo tradicional, no qual a corrente de gravação cria um campo magnético no entreferro do núcleo que magnetiza a camada magnética do disco. A leitura da informação gravada é feita por um sensor formado por uma válvula de spin. Um pulso de corrente passa no sensor quando ele está sobre a região magnetizada a ser detetada. Como a resistência do sensor varia com o campo criado pela magnetização, o valor da tensão resultante indica o bit de informação que está gravado. A principal vantagem do cabeçote de leitura magneto-resistivo é que ele pode detetar a magnetização em regiões menores que a dos cabeçotes indutivos convencionais, pois ele é sensı́vel ao campo criado pela magnetização, enquanto o cabeçote indutivo é sensı́vel ao fluxo magnético, que depende da área ocupada pelo bit. A introdução do sensor de GMR nos sistemas de gravação de discos rı́gidos comerciais ocorreu em 1998, e tem possibilitado o contı́nuo aumento da capacidade de memória, que atualmente ultrapassa 20 Gb/polegada2. 9.6 Dispositivos de Ferrite para Microondas Uma área importante de aplicação dos materiais magnéticos é a de dispositivos não-recı́procos para circuitos de microondas. As ondas eletromagnéticas com freqüência na faixa de microondas, 1-30 GHz, são utilizadas em comunicações entre estações terrestres e com satélites. Elas também são empregadas no radar e em aparelhos cientı́ficos, industriais, e eletrodomésticos. Nos circuitos de microondas existem certos dispositivos, tais como isoladores e circuladores, nos quais o elemento central é feito de ferrite. Para entender o efeito de um ferrite na onda eletromagnética é necessário estudar sua susceptibilidade em altas freqüências. Inicialmente, porém, vamos entender o movimento natural da magnetização num material submetido a um campo externo. Cap. 9 Materiais e Dispositivos Magnéticos 9.6.1 443 O Movimento de Precessão da Magnetização Quando uma onda eletromagnética penetra num meio magnético, seu campo magnético interage com os momentos magnéticos microscópicos. No caso do meio ser condutor e espesso, a amplitude da onda decai rapidamente devido ao efeito pelicular, de modo que o efeito magnético é pequeno. No entanto, se o meio é isolante, a atenuação é pequena e a interação magnética produz um grande efeito na polarização da onda. É por isto que os materiais magnéticos usados em microondas são ferrites isolantes. Para calcular a resposta em altas freqüências, consideramos inicialmente um meio infinito de ferrite, submetido Na situação de equilı́brio, os momentos µ a um campo magnético estático H. pois esta é a situação na qual dos dipolos magnéticos ficam alinhados com H, a energia, dada pela Eq.(9.8), é mı́nima. O torque que o campo exerce sobre o momento é dado por (no SI): τ = µ0 µ × H . (9.73) Porém, quando Evidentemente, o torque é nulo quando µ está na direção de H. µ é desviado desta direção, o torque deixa de ser nulo e produz um movimento no dipolo. A equação de movimento de um momentum angular J submetido a um torque τ é dJ = τ . (9.74) dt No caso do dipolo magnético atômico, µ e J estão relacionados por uma expressão obtida das equações (9.12) - (9.15), µ = −γ µ0 J onde γ= , (9.75) gµB (9.76) é o fator giromagnético do átomo, ou ı́on, magnético. A substituição de (9.73) e (9.75) em (9.74) dá a equação de movimento do momento magnético no campo H, dµ = −γ µ0 µ × H dt . é o momento magnético por unidade de volume, sua Como a magnetização M Materiais e Dispositivos Eletrônicos 444 equação de movimento é, dM ×H = −γ µ0 M dt . (9.77) quando ela é desviada da Para entender o movimento natural de M direção de equilı́brio, escolhemos um sistema de coordenadas no qual o eixo z Podemos então escrever a magnetização tem a direção do campo estático H. na forma, = x̂ mx (t) + ŷ my (t) + ẑ Mz , M (9.78) onde usamos letras minúsculas para as componentes x e y porque elas são variáveis, enquanto a componente ẑ é estática, e também porque mx , my Mz . De (9.77) obtemos as equações para as componentes transversais de M , dmx = −γ µ0 my H dt , dmy = γ µ0 mx H dt . (9.79) my (t) = m0 sen ω0 t . (9.80) Uma solução para (9.79) é: mx (t) = m0 cos ω0 t , está ilustrado na Figura 9.30. O vetor magnetização O movimento de M semelhante executa um movimento de precessão circular em torno do campo H, Mz M H Figura 9.30: Movimento de precessão da magnetização de um ferrite em torno de um campo magnético estático. Cap. 9 Materiais e Dispositivos Magnéticos 445 a um giroscópio no campo gravitacional da terra. A freqüência angular de precessão, obtida pela substituição de (9.80) em (9.79), é ω0 = γ µ0 H = γB , (9.81) é o vetor indução magnética aplicado. No sistema CGS a expressão é onde B ω0 = γH. Esta freqüência é diretamente proporcional à intensidade do campo magnético, onde o coeficiente de proporcionalidade é o próprio fator giromagnético, dado pela Eq.(9.76). Para g = 2, seu valor é γ ≃ 2π × 28 GHz/T, no SI, e γ ≃ 2π × 2, 8 MHz/Oe. Assim, para um campo tı́pico de ı́mãs ou de eletromagnetos, H = 1 kOe, a freqüência de precessão é 2,8 GHz. Vemos então que a resposta natural de um ferrite tem freqüência situada na região de microondas. Esta é razão da importância dos ferrites para os dispositivos de microondas. 9.6.2 Susceptibilidade Dinâmica de um Ferrite Para calcular a resposta do ferrite a uma radiação de microondas, consideramos um campo magnético alternado com freqüência ω, ou campo de rf, transversal ao campo estático. O campo total é então, = (x̂ hx + ŷ hy ) e−iωt + ẑH , H (9.82) H, uma vez que H é da ordem de centenas ou milhares de Oe, onde hx , hy enquanto o campo de rf de uma onda é da ordem de fração de Oe. Substituindo (9.78) e (9.82) em (9.77), obtemos as equações de movimento das componentes , transversais de M dmx = −γ µ0 my H + γ µ0 Mz hy e−iωt (9.83) dt dmy = γ µ0 mx H − γ µ0 Mz hx e−iωt dt . (9.84) Como estamos interessados apenas na resposta estacionária, fazemos mx (t) = mx e−iωt , my (t) = my e−iωt . Substituindo estas expressões em (9.83) e (9.84) e fazendo ω0 = γ µ0 H, vem −iωmx = −ω0 my + γ µ0 Mz hy (9.85) 446 Materiais e Dispositivos Eletrônicos −iωmy = ω0 mx − γ µ0 Mz hx . (9.86) A partir destas expressões podemos escrever a relação entre as compo eH na forma, nentes de rf de M m = χ · h , (9.87) onde os vetores m e h são representados pelas matrizes coluna, ⎛ m =⎝ mx ⎞ ⎛ ⎠ h = ⎝ my hx ⎞ ⎠ , (9.88) hy e χ é o tensor susceptibilidade, representado pela matriz χxy χxx , χ= χyx χyy (9.89) onde χxx (ω) = χyy (ω) = ωM ω0 ω02 − ω 2 χyx (ω) = −χxy (ω) = i ωM ω ω02 − ω 2 (9.90) , (9.91) sendo ωM ≡ γµ0 Mz ≃ γµ0 M. Note que no sistema gaussiano, ωM = γ4πM, pois µ0 = 1 e 4π é o fator que entra na relação entre a permeabilidade e a susceptibilidade, Eq.(9.7). Este resultado mostra que num ferrite, a aplicação de um campo de rf na direção x, produz componentes de rf da magnetização tanto na direção x quanto na direção y. Do mesmo modo, um campo hy produz componentes mx e my . Isto é devido ao fato de que o movimento natural de é a precessão em torno do eixo z. Assim, a aplicação de um campo hx ou hy M produz o movimento de precessão, e em conseqüência componentes mx e my . Por esta razão, a relação entre m e h não é um escalar, mas sim um tensor. As Eqs.(9.90) e (9.91) indicam que a amplitude da resposta do ferrite ao campo de microondas aumenta à medida que ω se aproxima da freqüência de aumenta e ressonância ω0 . Quando isto ocorre, a amplitude da precessão de M Cap. 9 Materiais e Dispositivos Magnéticos 447 precessiona em a relaxação não pode ser desprezada. Na realidade, quando M torno de H, a interação spin-órbita nos átomos faz com que parte da energia magnética seja transferida para a rede cristalina. Isto resulta em relaxação, . Este efeito pode ser representado ou amortecimento, do movimento de M fenomenologicamente pela substituição de ω0 por ω0 − iΓ/2, onde Γ é a taxa de relaxação. Com isto, as componentes do tensor susceptibilidade tomam a forma, ωM ω0 (9.92) χxx = χyy = 2 ω0 − ω 2 − iω0 Γ χyx = −χxy = i onde admitimos que Γ ωM ω 2 ω0 − ω 2 − iω0 Γ (9.93) ω0 . Este resultado mostra que a resposta magnética de um ferrite tem comportamento análogo ao da susceptibilidade elétrica de um átomo submetido a uma radiação eletromagnética, estudada nas seções 8.2.2 e 8.3.2. A grande diferença entre as duas situações é que, enquanto no átomo a freqüência ω0 está na região óptica do espectro, no caso magnético ω0 está na região de microondas. A analogia entre as duas situações permite também dar uma interpretação quântica para o efeito magnético nos ferrites. O movimento de corresponde a transições quânticas entre dois nı́veis de energia separados M pelo campo magnético. Na Eq.(9.18), vemos que a separação de energia entre dois nı́veis vizinhos é ∆E = gµB B. Esta energia corresponde a fótons com freqüência ω0 = ∆E/ = γB, que é precisamente a freqüência de precessão (9.81). Um aspecto importante da resposta de um ferrite ao campo de microondas, é que a freqüência de precessão ω0 varia linearmente com o campo H. Isto permite sintonizar a resposta do ferrite na freqüência desejada, através de H. A Fig.9.31 mostra as partes real e imaginária da componente χxx da susceptibilidade em função do campo aplicado H, para uma freqüência fixa ω/2π = 2, 8 GHz. Os outros parâmetros usados são: g = 2, ωM /γ = 3 kG e Γ/ω = 0, 2. Observe a semelhança entre esta figura e a Fig.8.5 que mostra as partes real e imaginária da permissividade elétrica. A parte imaginária χxx está relacionada à potência de microondas absorvida pelo ferrite. Quando o campo H tem valor igual a ω/γ, χ e a potência absorvida são máximos. O fenômeno pelo qual a potência absorvida cresce bruscamente e passa por um máximo em H = ω/γ é chamado de ressonância ferromagnética. O campo de ressonância é aquele no qual ω = ω0 . A diferença entre os dois valores de 448 Materiais e Dispositivos Eletrônicos Figura 9.31: Partes real (a) e imaginária (b) de χxx em função do campo H para ω/2π = 2, 8 GHz, ωM /γ = 3 kG e ∆H = Γ/γ = 200 Oe. campo para os quais χxx tem metade do valor de pico é chamada largura de linha da ressonância. É fácil verificar que a largura de linha ∆H é relacionada com a taxa de relaxação por ∆H = Γ/γ . (9.94) A largura de linha do ferrite da Fig.9.31 é ∆H = 200 Oe. 9.6.3 Ondas Eletromagnéticas em Ferrites As caracterı́sticas de uma onda eletromagnética propagando num meio de ferrite submetido a um campo estático H são determinadas pelas equações de Maxwell (2.1)-(2.4), com a permeabilidade magnética obtida dos resultados da seção anterior. Como a susceptibilidade do ferrite é um tensor, a permeabilidade, definida por (9.6) e (9.7), também é um tensor. No SI, µ = µ0 (1 + χ) . (9.95) Em conseqüência, além de sofrer defasagem espacial e atenuação, como em qualquer meio, no ferrite a onda pode sofrer mudança da polarização. Os efeitos do ferrite na onda dependem muito das direções de propagação e de Cap. 9 Materiais e Dispositivos Magnéticos 449 polarização, e também da proximidade entre as freqüências da onda e da ressonância ferromagnética. Uma situação especial importante é o da propagação na direção do campo estático. Neste caso, o campo h é perpendicular ao eixo z, e portanto só tem componentes hx e hy . Vejamos o comportamento de ondas circularmente polarizadas nesta região. Com as Equações (9.88) e (9.89) obtemos m± ≡ mx ± imy = (χxx ∓ iχxy ) (hx ± ihy ) , (9.96) onde m+ e m− representam as magnetizações de uma onda circularmente polarizada à direita e à esquerda, respectivamente. Este resultado significa que, embora a relação entre m e h seja tensorial, no caso de ondas circularmente polarizadas a relação é escalar. Representando por b± e h± as componentes circularmente polarizadas dos campos b e h, usando (9.3) e (9.96) vem, b+ = µ+ h+ , b− = µ− h− , (9.97) onde µ± = µ0 (1 + χxx ∓ iχxy ) (9.98) são as permeabilidades escalares das ondas circularmente polarizadas. Se ω for muito diferente de ω0 , a relaxação pode ser desprezada, e de (9.90) e (9.91) vem: ωM (9.99) µ+ = µ0 1 + ω0 + ω ωM . (9.100) µ− = µ0 1 + ω0 − ω Este resultado significa que as relações para ondas em meios com permeabilidade escalar, obtidas no Capı́tulo 8, valem para ondas circularmente polarizadas em ferrites. Por exemplo, os vetores de onda para estas ondas têm módulo 1/2 ωε1/2 ωM ± . (9.101) 1+ k = c ω0 ± ω O fato de ondas circularmente polarizadas à direita e à esquerda terem vetores de propagação diferentes, dá origem ao fenômeno de rotação de Faraday, ilustrado na Figura 9.32. Considere uma onda linearmente polarizada propagando na direção do campo H, no eixo z. Escolhemos o eixo x 450 Materiais e Dispositivos Eletrônicos Figura 9.32: Rotação de Faraday de uma onda eletromagnética propagando na direção do campo magnético num ferrite. como a direção do campo h no plano em z = 0. Sendo h0 a amplitude do campo em z = 0, temos h± (0, t) = Re x̂ h0 e−iωt = x̂ h0 cos ωt . É fácil ver que este campo pode ser decomposto em duas componentes circularmente polarizadas, com amplitudes iguais a h0 /2, girando em sentidos opostos, h = h+ + h− , onde ± h (0, t) = Re x̂ h0 ± ŷ i h0 e−iωt = 2 2 = x̂ h0 h0 cos ωt ± ŷ sen ωt 2 2 . (9.102) Cada onda circularmente polarizada propaga com um vetor de onda diferente, de modo que no plano z = d temos, h± (d, t) = Re h0 h0 ± ŷ i x̂ 2 2 ± eik d−iωt . (9.103) O campo em z = d é dado pela soma dos dois campos em (9.103). Suas componentes podem ser escritas na forma: hx (d, t) = Re h0 cos θ eikm d−iωt (9.104) Cap. 9 Materiais e Dispositivos Magnéticos hy (d, t) = Re h0 sen θ eikm d−iωt onde . km = (k + + k − )/2 e θ = (k − − k + ) d/2 451 (9.105) (9.106) . (9.107) Veja que as equações (9.104) e (9.105) representam um campo linearmente polarizado, fazendo um ângulo θ com o eixo x. Isto mostra que a composição dos dois campos circularmente polarizados em z = d, com fases diferentes daquelas em z = 0, resulta em outro campo linearmente polarizado. Como resultado deste processo, a onda original propaga no ferrite mantendo a polarização linear, porém numa direção que gira gradualmente em torno do campo estático, no sentido de x para y (pois k − > k + ). Este é o fenômeno de rotação de Faraday. O ângulo de rotação da direção de polarização, dado pela Eq.(9.107), é proporcional à distância e à diferença dos vetores de onda das polarizações + e −. É importante observar que o sentido da rotação de e não depende do sentido de Faraday é definido pelo sentido do campo H, propagação da onda. Exemplo 9.4: Considere uma radiação de microondas com freqüência 9,4 GHz propagando ao longo do campo H num ferrite com M = 250 emu/cm3 , g = 2, ∆H = 50 Oe e = 4 0 . Calcule o coeficiente de absorção da onda para H = 2, 5 kOe, considerando: a) Onda circularmente polarizada no sentido +; b) Onda circularmente polarizada no sentido −. a) Os vetores de onda para as polarizações circulares + e − incluindo a relaxação magnética são dados pela Eq. (9.101), com a substituição de ω0 por ω0 − iΓ/2, k± = ωε1/2 c 1+ ωM ω0 ± ω − iΓ/2 1/2 . A introdução do termo imaginário nessa equação faz com que o vetor de onda tenha uma componente imaginária, que produz atenuação na onda. Para calcular a parte imaginária é preciso trabalhar com o número complexo no interior da raiz quadrada, o que leva a expressões grandes para o caso geral. Para simplificar as contas, vamos obter os valores numéricos das grandezas ω0 , Γ e ωM , dadas por (9.81), (9.94) e ωM = γ4πM (no CGS). Como essas grandezas aparecem numa fração, vamos deixar explı́cito o fator 2π que relaciona a freqüência angular com a freqüência. Usando o sistema CGS vem, ω0 = γ H = 2π × 2, 8 × 106 × 2, 5 × 103 = 2π × 7, 0 GHz , Γ0 = γ ∆H = 2π × 2, 8 × 106 × 50 = 2π × 0, 14 GHz , ωM = γ 4πM = 2π × 2, 8 × 106 × 4π × 250 = 2π × 8, 8 GHz , Materiais e Dispositivos Eletrônicos 452 Vemos então que o termo imaginário no denominador da expressão de k± é muito menor que o termo real. Podemos então utilizar a expansão binomial para obter as partes real e imaginária da raiz quadrada. Multiplicando ωM pelo fator 4π, apropriado ao sistema CGS, vem, k± = ω ε1/2 c ≃ ω ε1/2 c ≃ ω ε1/2 c 1+ 1+ 1+ ωM (ω0 ± ω) [1 − Γ/2(ω0 ± ω)] ωM (ω0 ± ω) 1+ iΓ 2(ω0 ± ω) ωM 2(ω0 ± ω) 1+ iΓ 2(ω0 ± ω) 1/2 1/2 . Logo, a parte imaginária é, k± ≃ ω ε1/2 ωM Γ . c (ω0 ± ω)2 De acordo com (8.13), o coeficiente de absorção é o dobro da parte imaginária de k, portanto, ∝± = ω ε1/2 ωM Γ . c 2(ω0 ± ω) Substituindo os valores das grandezas, vem, ∝± = 2π × 9, 4 × 109 × 41/2 8, 8 × 0, 14 1, 23 = 3, 93 . 3 × 1010 (7, 0 ± 9, 4)2 (7, 0 ± 9, 4)2 Assim, para a onda + temos, ∝+ = 3, 93 1, 23 = 0, 018 cm−1 . (7, 0 + 9, 4)2 b) Para a onda − temos, ∝−1 = 3, 93 1, 23 = 0, 84 cm−1 . (7, 0 − 9, 4)2 A onda circularmente polarizada no sentido − tem um coeficiente de absorção muito maior que a onda no sentido + porque ela está mais próxima da condição de ressonância, onde a perda de energia é muito maior. 9.6.4 Dispositivos de Ferrites Nesta seção vamos apresentar, de forma qualitativa, os dispositivos de ferrite mais utilizados em microondas: isoladores; circuladores; e filtros de YIG. Esses dispositivos são usados em toda a região de microondas, de 1 a 100 GHz. Cada Cap. 9 Materiais e Dispositivos Magnéticos 453 unidade opera eficientemente apenas numa estreita faixa de freqüências, cuja largura depende das caracterı́sticas do ferrite e da geometria do dispositivo. O isolador é um dispositivo de duas portas, que transmite a radiação num sentido e absorve integralmente a radiação no sentido oposto. Ele é utilizado na saı́da do gerador de microondas, para evitar que as reflexões produzidas no circuito externo voltem para ele e interfiram no seu funcionamento. A Fig.9.33(a) mostra o sı́mbolo de circuito de um isolador. Como os isoladores são dispositivos não-recı́procos, sua operação depende fundamentalmente de materiais que tenham propriedades não-recı́procas. Na região de microondas, os materiais que têm estas propriedades são os ferrites. Sua origem está no comportamento giroscópico dos momentos magnéticos atômicos, cujo sentido de precessão é determinado pelo sentido do campo estático aplicado. Um dos primeiros isoladores de ferrite construı́dos foi o de rotação de Faraday, mostrado na Figura 9.34 Seus elementos básicos são: um bastão de ferrite magnetizado longitudinalmente por um campo externo, de modo a produzir rotação de Faraday de 45◦ ; duas placas resistivas fazendo um ângulo de 45◦ entre si, colocadas próximas às duas portas e paralelas às direções de maior dimensão dos guias de onda retangulares; guia de onda circular no qual o bastão de ferrite está montado, com transições para as seções retangulares das portas, que fazem ângulo de 45◦ entre si. A onda que entra na porta 1 passa pela placa resistiva sem atenuação, pois tem campo elétrico perpendicular ao plano da placa (no guia retangular, o campo elétrico tem a direção da dimensão menor e o campo magnético tem a direção da dimensão maior), e portanto não produz corrente no plano. Como Figura 9.33: Sı́mbolos de circuito de dispositivos não-recı́procos: (a) Isolador; (b) Circulador de 4 portas; (c) Circulador de 3 portas. 454 Materiais e Dispositivos Eletrônicos Figura 9.34: Isolador de rotação de Faraday. a rotação de Faraday do bastão de ferrite é de 45◦ no sentido horário, ao chegar na porta 2 a onda é transmitida para o guia retangular. Por outro lado, uma onda entrando na porta 2 tem sua polarização girada de 45◦ no mesmo sentido, sendo portanto parcialmente absorvida pela placa resistiva da porta 1 e também ficando a 90◦ da direção de polarização desta porta. Desta forma, o dispositivo transmite a onda no sentido 1→2, mas não a onda no sentido oposto. O isolador de rotação de Faraday não é muito utilizado nas faixas inferiores de freqüências de microondas, pois os guias de onda têm dimensões avantajadas e a estrutura do dispositivo torna-se muito volumosa. Um dispositivo análogo, baseado no efeito Faraday magneto-óptico, é utilizado na região do infravermelho próximo em sistemas de comunicações com fibras ópticas. O isolador de ferrite mais utilizado em microondas é o de ressonância. O isolador para guia de onda, ilustrado na Figura 9.35 consiste de uma seção de guia, uma placa de ferrite situada num certo plano do guia, e um ı́mã permanente que magnetiza o ferrite e determina a freqüência de ressonância ω0 . Para entender o funcionamento do isolador, é importante saber que o campo magnético de microondas tem duas componentes no plano xy, defasadas de 90◦ , e cujas amplitudes variam ao longo da direção x. Em conseqüência, há dois planos do guia, P1 e P2 mostrados na figura, simétricos em relação ao centro, nos quais os campos são circularmente polarizados, sendo um deles à direita e o outro à esquerda. A distância de P1 e P2 para as paredes laterais é determinada pela freqüência da onda e as dimensões do guia (Problema 9.16). O isolador opera numa faixa de freqüências em torno de ω0 . Quando a onda propaga num sentido, a polarização circular no plano P1 , onde está . Neste caso não há o ferrite, tem o sentido oposto ao da precessão de M ressonância, e a onda é transmitida sem atenuação. Entretanto, quando a Cap. 9 Materiais e Dispositivos Magnéticos 455 Figura 9.35: Isolador de ressonância em guia de onda retangular. onda propaga no sentido oposto, os sentidos das polarizações circulares em P1 e P2 são invertidas, fazendo com que ela seja atenuada devido à absorção de ressonância no ferrite. Para aumentar a absorção é comum colocar uma fina placa resistiva junto do ferrite. Os isoladores de ressonância são de construção simples e podem ter razão entre as transmissões nos dois sentidos superior a 1000:1. Eles também são feitos em dispositivos de cabos coaxiais e em estruturas de microondas miniaturizadas, baseadas em linhas de fita (linhas de transmissão, semelhantes às guias feitas em chapas de circuito impresso usadas em eletrônica). Outro dispositivo de ferrite importante é o circulador, também chamado de girador. Ele é um dispositivo de três ou mais portas, que transmite a radiação que entra numa certa porta para outra imediatamente vizinha, num sentido de “mão única”. As Figuras 9.33(b) e (c) mostram os sı́mbolos de circuito de circuladores de três e de quatro portas, respectivamente. Uma aplicação importante do circulador de três portas é em sistemas de transmissão e recepção com uma só antena. Como mostrado na Fig.9.33(b), o circulador faz com que a radiação do transmissor (T) seja dirigida para a antena (A). Por outro lado, a radiação recebida pela antena é dirigida para o receptor (R). E como o sentido do girador é de mão única, o sinal do transmissor não é levado ao receptor. Como ocorreu com o isolador, o primeiro circulador de quatro portas construı́do era baseado na rotação de Faraday. Os seus componentes, mostrados na Figura 9.36, são: um bastão de ferrite num guia de seção circular, com rotação de Faraday de 45◦ ; quatro portas feitas de guias de seção retangular, estando a porta 2 a 45◦ da porta 1, a porta 3 perpendicular a 1, e a porta 4 a 45◦ da 3. Com esta disposição, a radiação que entra em qualquer porta é 456 Materiais e Dispositivos Eletrônicos Figura 9.36: Circulador de 4 portas de rotação de Faraday. girada de 45◦ e sai pela seguinte, ficando as demais isoladas. O circulador da Fig.9.36 não é mais utilizado devido à dificuldade de sua miniaturização. A Figura 9.37 mostra um circulador de três portas em linha de fita, utilizado em circuitos de microondas miniaturizados. Sua operação também é baseada nas propriedades giroscópicas do disco de ferrite, mas a configuração dos campos no disco é complexa e não será analisada aqui. Outro dispositivo magnético de grande aplicação em circuitos de microondas é o filtro de YIG. Como vimos na seção 9.4, o YIG é uma granada ferrimagnética, e não um ferrite. Entretanto, seu enquadramento na categoria de ferrites é justificado pela semelhança das propriedades magnéticas. Os ferrites utilizados em isoladores e circuladores são cerâmicas policristalinas, com larguras de linha de dezenas ou centenas de Oersted. As larguras de linha grandes são necessárias para que os dispositivos possam operar em largas faixas de freqüências. O YIG, por outro lado, é usado na forma de monocristais, cuja largura de linha é da ordem de 0,1 Oe. Como em ω = ω0 as susceptibilidades (9.92) e (9.93) têm amplitude ωM /Γ = M/∆H, este pequeno valor de ∆H faz a ressonância de YIG ser muito intensa. Veja que no ferrite das curvas mostradas na Fig.9.31, o pico da susceptibilidade tem altura 15, enquanto em YIG a altura é M/∆H = 1, 76 × 104 . Estas propriedades possibilitam a construção de filtros de transmissão de banda estreita, sintonizáveis eletricamente. A Figura 9.38 mostra as configurações básicas de filtros de YIG de um e de dois estágios. A estrutura eletromagnética de cada estágio consiste apenas de duas semiespiras de fios finos, dispostas perpendicularmente entre si. Entre elas é colocada uma pequena esfera de YIG, com diâmetro menor ou da ordem Cap. 9 Materiais e Dispositivos Magnéticos 457 Figura 9.37: Circulador de ferrite de 3 portas em linha de fita. de 1 mm, submetida ao campo magnético estático H de um eletromagneto. O valor do campo é ajustado pela corrente no eletromagneto. A corrente de microondas numa das espiras cria um campo magnético de rf h na esfera, perpendicular ao campo estático. Se a freqüência ω da microonda estiver afastada de ω0 = γH, a susceptibilidade é desprezı́vel, fazendo com que mx e my também o sejam. Como as duas espiras são perpendiculares entre si, nesta situação o sinal transmitido de uma para a outra é também desprezı́vel. Quando ω ≃ ω0 , o campo h produzido por uma das espiras cria na esfera de YIG uma magnetização de rf no plano xy, dada por (9.88)-(9.91). A componente de m perpendicular a outra espira induz nela um sinal de saı́da, proporcional ao sinal de entrada. Assim, o dispositivo opera como um filtro de transmissão de banda estreita. Como ω0 = γH, a sintonização do filtro é Figura 9.38: Diagramas esquemáticos de filtros de YIG: (a) Um estágio; (b) Dois estágios. 458 Materiais e Dispositivos Eletrônicos feita através da corrente no eletromagneto. No filtro de um estágio a curva de resposta, sinal transmitido em função da freqüência, tem a forma da curva de ressonância. Para sintetizar formas de resposta mais apropriadas para filtros de transmissão, utiliza-se dispositivos com múltiplos estágios. A Figura 9.38(b) mostra o diagrama de um filtro de dois estágios. As duas esferas de YIG são montadas na mesma estrutura e ficam submetidas ao mesmo campo estático. Desta forma, quando o campo é variado, as freqüências de ressonância das duas esferas variam igualmente. A sintetização da curva de resposta do filtro é possı́vel porque a freqüência de ressonância de cada esfera varia finamente com a direção de seus eixos cristalinos em relação ao campo externo. Como a curva de transmissão do filtro é o produto das respostas dos dois estágios, é possı́vel variar a forma da curva ajustando-se finamente uma esfera em relação a outra. A Figura 9.39 mostra a curva de resposta de um filtro de dois estágios construı́do no Departamento de Fı́sica da UFPE. O filtro tem largura de banda de 15 MHz e pode ser sintonizado na faixa de 4 a 6 GHz. Os filtros de YIG encontram várias aplicações em equipamentos de microondas, em funções que requerem sintonia eletrônica. Eles são utilizados nos estágios de entrada de receptores simples sintonizáveis e em estágios intermediários de receptores super-heterodinos. Eles são também empregados para estabilizar a freqüência de osciladores de microondas, como os de diodo Gunn Figura 9.39: Curva de resposta de um filtro de YIG de dois estágios (A. Belfort de Oliveira, Tese de Mestrado, Departamento de Fı́sica da UFPE, 1981). Cap. 9 Materiais e Dispositivos Magnéticos 459 e osciladores com transistores MESFET de GaAs, com a vantagem de permitir a sintonia eletrônica da freqüência. REFERÊNCIAS H.N. Bertram, Theory of Magnetic Recording, Cambridge University Press, Cambridge, 1994. S. Blundell, Magnetism in Condensed Matter, Oxford Univ. Press, Oxford, 2001. S. Chikazumi, Physics of Magnetism, John Wiley, New York 1964. R.L. Comstock, Introduction to Magnetism and Magnetic Recording, John Wiley, New York, 1999. R. Dalven, Introduction to Applied Solid State Physics, Plenum Press, New York, 1996. J. Helszajn, Passive and Active Microwave Circuits, John Wiley, New York, 1978. R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. C. Kittel, Introduction to Solid State Physics, J. Wiley, New York, 1996. B. Lax e K. Button, Microwave Ferrites and Ferrimagnetics, McGraw-Hill, New York, 1962. J.C. Mallinson, The Foundations of Magnetic Recording, Academic Press, New York, 1987. A.H. Morrish, The Physical Principles of Magnetism, IEEE Press, New York, 2001. R.M. White, Introduction to Magnetic Recording, IEEE Press, New York, 1985. 460 Materiais e Dispositivos Eletrônicos PROBLEMAS 9.1 a) A partir da definição (9.9) do operador momentum angular, obtenha as expressões para os operadores L2op e Lzop . b) Mostre que os orbitais ψ110 e ψ111 do átomo de hidrogênio são auto-estados dos operadores L2op e Lzop e que as equações de autovalores satisfazem as relações (9.10) e (9.11). 9.2 Aplique as regras de Hund para obter os estados fundamentais dos ı́ons Ni2+ e Eu2+ e calcule os fatores g correspondentes. 9.3 Um átomo com S = 1/2 e L = 0 é colocado num campo magnético H = 2 kOe. Calcule a freqüência, em GHz, do fóton emitido pela transição de dipolo magnético entre os dois estados de spin no campo. 9.4 Uma substância paramagnética é formada por 4 × 1022 cm−3 ı́ons magnéticos com S = 2 e L = 0. Calcule a susceptibilidade magnética da substância em T = 4 K e T = 300 K. 9.5 O ferro cristaliza na estrutura bcc, com parâmetro de rede a = 2, 87 Å. Sabendo que o momento magnético do ferro é 2,22 µB por átomo, calcule sua magnetização de saturação e compare com o valor da Tabela 9.2. 9.6 Sabendo que o ferro tem temperatura de Curie Tc = 1.043 K, calcule seu campo molecular e a constante de intercâmbio J1 . 9.7 Um ı́mã permanente tem a forma de um bastão cilı́ndrico de diâmetro 2 cm e comprimento 10 cm, com uma magnetização uniforme, paralela ao eixo, de valor 4πM = 15 kG. Calcule o campo criado pelo ı́mã em pontos ao longo de seu eixo, distantes 1 mm, 10 mm e 50 mm de uma das bases do cilindro. 9.8 Um ı́mã permanente tem a forma de um disco fino, com magnetização M uniforme e perpendicular ao plano. Calcule os campos B e H num ponto externo ao disco, próximo à superfı́cie do pólo norte. Localize o ponto de operação do ı́mã na curva da Figura 9.21. 9.9 Um eletromagneto tem um circuito magnético como o da Figura 9.22, tendo um núcleo cilı́ndrico de diâmetro 10 cm, comprimento 120 cm e entreferro 5 cm. Sabendo que o núcleo é de ferro e que o enrolamento tem 200 espiras, calcule o campo em ponto próximo do centro da superfı́cie do entreferro, produzido por uma corrente de 10 A. 9.10 Mostre que as funções ψ1 , ψ2 e ψ3 dadas pelas Equações (9.63) e (9.65) satisfazem a equação de Poisson (9.53) para o potencial magnético na geometria da Figura 9.25, que representa uma fita magnética com um sinal senoidal gravado. Cap. 9 Materiais e Dispositivos Magnéticos 461 9.11 a) Calcule o comprimento de onda de um sinal de 1 kHz, gravado numa fita magnética de velocidade 8 polegadas/seg. b) Calcule a distância da fita na qual o campo criado por ela é 5 % do valor na superfı́cie. 9.12 Uma fita magnética com magnetização M = 500 emu/cm3 , espessura 15 µm e largura de trilha 1 mm, desliza com velocidade 8 polegadas/seg sob uma cabeça de leitura de eficiência 0,8 com 20 espiras, mantendo uma distância de 2 µm para a mesma. Calcule: a) freqüência do sinal para o qual a amplitude de reprodução é máxima; b) o valor do sinal de saı́da nesta condição. 9.13 A partir das Equações (9.85) e (9.86), mostre que o tensor susceptibilidade magnética dinâmica de um ferrite é dado por (9.90) - (9.91). 9.14 Uma onda eletromagnética de freqüência 9,8 GHz propaga ao longo do num ferrite com parâmetros M = 300 emu/cm3 , g = 2, ∆H = campo H, 100 Oe e = 40 . a) Sendo a onda circularmente polarizada no sentido −, calcule seu coeficiente de absorção para H = 1 kOe e H = 3,5 kOe; b) Calcule o coeficiente de absorção nos mesmos campos do item a), caso a onda seja circularmente polarizada no sentido +. 9.15 Se a onda do problema anterior for linearmente polarizada, calcule o ângulo de rotação de Faraday, em rd/cm, nos dois valores de campo dados. 9.16 O campo magnético de microondas propagando num guia de onda retangular, no modo fundamental, tem duas componentes: ikg a πx ikg z−iωt h0 sen e hx = − π a πx ikg z−iωt e hz = h0 cos a onde z é a direção ao longo do guia, x é a direção transversal maior, a é a largura do guia (na direção x), h0 é a amplitude do campo longitudinal e kg é o módulo do vetor de onda na direção longitudinal, dado por 1/2 /c kg = ω 2 − (πc/a)2 sendo c a velocidade da luz. Sabendo que no guia de banda X, a = 2,3 cm, determine a distância da parede lateral do plano onde deve ser colocada a placa de ferrite num isolador de banda X, para operação em 9,4 GHz. 462 Materiais e Dispositivos Eletrônicos Capı́tulo 10 Outros Materiais Importantes para a Eletrônica 10.1 Materiais Dielétricos 10.1.1 A Polarização dos Materiais 10.1.2 Capacitores 10.1.3 Materiais Piezoelétricos 10.1.4 Materiais Ferroelétricos 10.1.5 Eletretos 10.2 Materiais Dielétricos para Opto-Eletrônica 465 466 469 473 479 481 484 10.2.1 Efeitos Eletro-Ópticos e Elasto-Ópticos 484 10.2.2 Materiais Ópticos Não-Lineares 487 10.2.3 Dispositivos Eletro-Ópticos de Guias de Onda 489 10.3 Materiais para Mostradores e Telas de Vı́deo 493 10.3.1 Materiais Cerâmicos Fosforescentes 10.3.2 Cristais Lı́quidos 10.3.3 Materiais Orgânicos Condutores 463 493 501 507 464 Materiais e Dispositivos Eletrônicos 10.4 Materiais Supercondutores 514 10.4.1 Propriedades Magnéticas dos Supercondutores 10.4.2 A Fı́sica da Supercondutividade 10.4.3 Junções com Supercondutores 10.4.4 Aplicações 517 520 526 529 REFERÊNCIAS 531 PROBLEMAS 532 Cap. 10 Outros Materiais Importantes para a Eletrônica 465 Outros Materiais Importantes para a Eletrônica Neste capı́tulo apresentamos as propriedades fı́sicas básicas e algumas aplicações de certos materiais importantes para a eletrônica, não estudados nos capı́tulos anteriores. Os materiais dielétricos encontram inúmeras aplicações nesta área desde seu surgimento no inı́cio do século. Nas últimas décadas estas aplicações tornaram-se mais diversificadas e sofisticadas com a descoberta de novos materiais e fenômenos e com o desenvolvimento da opto-eletrônica. Este também é o caso das cerâmicas fosforescentes, dos cristais lı́quidos e dos condutores orgânicos, que encontram aplicações cada vez mais sofisticadas em mostradores e telas de monitores de vı́deo. Por outro lado, os supercondutores têm um grande potencial de aplicação, porém a concretização deste potencial ainda depende do desenvolvimento de novos materiais. 10.1 Materiais Dielétricos Como vimos no Capı́tulo 4, os materiais com um grande gap de energia entre as bandas de valência e de condução, não têm elétrons nesta banda e portanto são isolantes elétricos. Os isolantes têm grande importância para a eletrônica, pois são necessários para montar ou isolar eletricamente fios e partes de dispositivos e de circuitos. Os materiais mais usados nessas aplicações são cerâmicas de óxidos inorgânicos, resinas e uma grande variedade de materiais poliméricos comumente chamados plásticos. Entretanto, os elétrons livres não são os únicos responsáveis pela resposta dos materiais a um campo elétrico externo. Em geral os isolantes têm ı́ons ou moléculas que, sob ação de um campo externo, sofrem pequenos deslocamentos ou reorientações. Desta 466 Materiais e Dispositivos Eletrônicos forma, mesmo sem produzir corrente elétrica, esses materiais apresentam uma resposta ao campo elétrico. Eles são chamados materiais dielétricos, e encontram várias aplicações especı́ficas na eletrônica. 10.1.1 A Polarização dos Materiais O comportamento dos materiais dielétricos num campo elétrico externo é determinado pelas propriedades de seus dipolos elétricos microscópicos. Esses dipolos podem ser permanentes, ou induzidos pelo campo elétrico externo. Eles são produzidos pela separação entre as cargas positivas dos núcleos e as negativas dos elétrons, nos átomos, ı́ons ou moléculas que formam o material. Os materiais que têm dipolos elétricos microscópicos permanentes são chamados polares, enquanto os que não têm dipolos permanentes são não-polares. Quando o material é submetido a um campo externo, como este exerce forças opostas sobre as cargas positivas e negativas, os dipolos são orientados como ilustrado na Figura 10.1. Como resultado, os dipolos criam um campo que se superpõe ao campo externo e determinam a resposta dielétrica do material. O dipolo elétrico criado pela separação de duas cargas de sinais opostos, ±q, tem momento distantes uma da outra por um vetor deslocamento d, p = q d . (10.1) Macroscopicamente, a grandeza que representa o estado dielétrico de um material é vetor polarização P . Ele é definido de forma análoga ao vetor Figura 10.1: Orientação dos dipolos microscópicos sob a ação de um campo elétrico. Cap. 10 Outros Materiais Importantes para a Eletrônica 467 magnetização, sendo o momento de dipolo elétrico por unidade de volume, 1 pi , (10.2) P = V i onde o somatório é feito sobre todos os pontos i nos quais há dipolos microscópicos, no interior de um volume V . Como no caso magnético, V é escolhido suficientemente grande para que haja uma boa média macroscópica, porém pequeno em relação ao tamanho da amostra, de modo que P represente uma propriedade local. P está relacionado com o vetor campo elétrico através de relações que dependem do sistema de E e o vetor deslocamento D unidades. No Sistema Internacional, = 0 E + P D , (10.3) onde 0 = (4π × 9 × 109 )−1 C2 /Nm2 é a permissividade do vácuo. Note que a unidade C2 /Nm2 é equivalente ao farad/metro. A unidade de E é V/m, enquanto a de D e P é C/m2 . No CGS 0 = 1, de modo que a relação entre os campos é, = E + 4π P . D (10.4) Ao contrário do caso magnético, onde os sistemas SI e CGS são igualmente usados, no caso elétrico o sistema mais utilizado é o SI. Por esta razão, não mais usaremos o CGS nesta seção. Vemos que como no vácuo não há A resposta de um dielétrico a um campo = 0 E. dipolos, P = 0 e portanto D elétrico pode ser expressa pela susceptibilidade elétrica χ, ou pela permissividade . No caso dos dielétricos simples, o campo E produz uma polarização P na mesma direção, de modo que χ e são escalares. Por definição, χ= P 0 E , = D E . (10.5) A relação entre estas grandezas é obtida substituindo (10.5) em (10.3), = 0 (1 + χ) . (10.6) Também é comum utilizar a permissibidade relativa, ou constante dielétrica, definida por ε = /0 . A resposta de um dielétrico a um campo externo varia com a freqüência do campo. A forma tı́pica de variação da susceptibilidade χ(ω) com a freqüência está mostrada na Figura 10.2. Nas regiões do infravermelho 468 Materiais e Dispositivos Eletrônicos Figura 10.2: Variação da susceptibilidade de um dielétrico com a freqüência do campo aplicado. próximo, visı́vel e ultravioleta, a resposta é dominada pelas transições eletrônicas nos átomos, como estudado nas seções 8.2.2 e 8.3.1. Na região do infravermelho, a principal contribuição para χ(ω) vem da interação entre o campo e os ı́ons que formam o material. Esta contribuição está ilustrada na Figura 10.3(a), que mostra o efeito de um campo elétrico sobre os ı́ons de uma rede cristalina, representada por uma cadeia linear. O campo desloca os ı́ons de cargas + e − em sentidos opostos, produzindo um movimento de vibração tı́pico do modo óptico, estudado na seção 2.2. A susceptibilidade pode ser calculada usando um modelo semelhante ao da seção 8.2.2, e considerando que o campo interage com os ı́ons de carga +q e −q. Com este modelo pode-se mostrar que a contribuição dos ı́ons para a susceptibilidade é, Nq 2 /mr 0 (10.7) χı́on (ω) = 2 ω0 − ω 2 − iωΓ onde mr = M1 M2 /(M1 +M2 ) é a massa reduzida dos ı́ons com massa M1 e M2 , N é o número de células unitárias por unidade de volume, ω0 é a freqüência angular do modo óptico em k = 0 e Γ é a taxa de amortecimento. A contribuição iônica para a resposta dos materiais dielétricos é importante na região do infravermelho, porque é nesta região que estão situadas as freqüências dos modos ópticos de vibração da rede cristalina. A amplitude desta resposta é menor do que a contribuição dos elétrons na região visı́vel porque a massa dos ı́ons é maior que a dos elétrons. É importante notar, entretanto, que embora a Cap. 10 Outros Materiais Importantes para a Eletrônica M1 M2 M1 469 M2 Figura 10.3: Ilustração dos mecanismos de contribuição para a resposta de dielétricos a um campo elétrico externo: (a) iônica; (b) dipolar. contribuição dos elétrons, dada por (8.36), seja máxima na região visı́vel, ela ainda é significativa em freqüências mais baixas. Como a contribuição iônica soma-se à dos elétrons, χ não passa por zero na região do infravermelho, como mostrado na Fig. 10.2. Em freqüências abaixo da região do infravermelho, a resposta dielétrica de certos materiais contém uma contribuição dipolar que se soma às componentes iônica e eletrônica. Isto ocorre em dielétricos que têm moléculas com dipolos permanentes, como ilustrado na Figura 10.3(b). A aplicação do campo tende a produzir uma rotação dos momentos de dipolo em sua direção. Embora esta tendência seja em parte contrabalançada pelo efeito da agitação térmica, há um momento resultante na direção do campo. 10.1.2 Capacitores Uma das aplicações mais tradicionais dos materiais dielétricos na eletrônica é na construção de capacitores. A Figura 10.4 mostra um capacitor simples formado por uma camada dielétrica entre duas placas metálicas paralelas. Uma das funções básicas do capacitor é armazenar carga, e portanto energia elétrica. Quando uma diferença de potencial V é aplicada entre as placas, um campo elétrico é criado no sentido da placa + para a placa −. Longe das bordas o campo é uniforme, com intensidade E = V /d, onde d é a distância entre as placas. Como a capacitância do capacitor é C = Q/V , onde Q é o módulo da carga em cada placa, para calcular C é preciso relacionar o campo elétrico 470 Materiais e Dispositivos Eletrônicos Figura 10.4: Capacitor de placas paralelas. com a carga. Para isto utilizamos a forma integral da Eq.(2.1), D · da = ρdv = q (10.8) S onde ρ é a densidade de cargas livres, e q é a carga livre total no interior do volume limitado pela superfı́cie fechada S. A aplicação da Eq.(10.8) a um cilindro contendo uma base no interior de uma das placas metálicas e a outra no dielétrico (onde não há cargas livres) dá, Q (10.9) A onde σ é a densidade superficial de cargas livres na superfı́cie interna da placa metálica positiva, cuja área é A. A partir deste resultado pode-se obter a capacitância em função das dimensões do capacitor e da permissividade do dielétrico. σA EA A C= = = . (10.10) V V d D=σ= Note que como > 0 , a presença do dielétrico aumenta a capacitância em relação ao seu valor com ar entre as placas. Para compreender melhor o papel do dielétrico no capacitor, vejamos o comportamento da polarização. O vetor e portanto é dirigido da placa + para a placa −. Nesta P é criado pelo campo E, situação os dipolos microscópicos induzidos pelo campo estão uniformemente distribuı́dos e dirigidos para baixo. Em conseqüência, as cargas que formam os dipolos se cancelam no interior do dielétrico. Entretanto, nas duas superfı́cies este cancelamento não ocorre, resultando na formação de cargas superficiais. Elas são chamadas cargas de polarização e resultam da descontinuidade de Cap. 10 Outros Materiais Importantes para a Eletrônica 471 P na superfı́cie. Note que as cargas são negativas na superfı́cie de cima do dielétrico e positivas na superfı́cie de baixo, por conta do sentido de cima para baixo dos dipolos não compensados. Por esta razão elas também são chamadas de cargas de despolarização. Formalmente estas cargas podem ser introduzidas a partir de uma equação semelhante a (2.1), ou de sua forma integral. Sendo ρp a densidade volumétrica de carga de polarização, temos: P · da = − ρp dv . , (10.11) ∇ · P = −ρp S A aplicação da forma integral de (10.11) a um cilindro com uma base no interior da camada dielétrica e outra fora, mostra que o módulo da densidade superficial de carga de polarização é σp = P . Finalmente, a relação entre a carga de polarização e o campo elétrico, obtida substituindo (10.3) e (10.11) em (2.1) é, ∇ · 0 E = ρ + ρp = ρt , (10.12) onde ρt é a densidade de carga total, resultante da soma das cargas livres e de polarização. A integral de (10.12) leva à 0 E · da = (ρ + ρp )dv = qt . (10.13) S Esta é a lei de Gauss para o campo elétrico na presença de materiais dielétricos. O campo E é criado pela soma das cargas livres e de polarização, como se elas estivessem no vácuo. A importância deste resultado para o capacitor vem do fato de que as cargas de polarização têm o sinal oposto ao das cargas livres. Em conseqüência, para uma certa carga Q no capacitor, a presença do dielétrico resulta num campo E menor do que haveria sem ele. Isto produz uma menor diferença de potencial V e, portanto, uma maior capacitância. Diversos materiais dielétricos são utilizados para fazer capacitores. Como vimos no Capı́tulo 7, nos circuitos integrados são utilizados óxidos dos próprios semicondutores empregados para fabricar os circuitos. Um tipo comum de capacitor utilizado no passado era o capacitor de papel. Ele era feito por duas lâminas de alumı́nio intercaladas com folhas de papel encerado. O conjunto era enrolado para formar um pequeno cilindro e, depois da soldagem de terminais às lâminas de alumı́nio, encapsulado. Um tipo de capacitor muito comum atualmente é o eletrolı́tico. No passado o capacitor eletrolı́tico utilizava como dielétrico um lı́quido, ou uma pasta, Materiais e Dispositivos Eletrônicos 472 de solução eletrolı́tica. Posteriormente eles foram substituı́dos por um filme óxido, depositado sobre uma folha de alumı́nio, ou de tântalo, através da eletrólise de uma solução eletrolı́tica. Nesta técnica, após a formação do filme na espessura desejada, a solução lı́quida é removida. A superfı́cie do filme é então coberta com uma camada metálica, formando a segunda placa do capacitor. O conjunto é finalmente enrolado na forma de um cilindro. O filme pode ser feito com espessuras bastante reduzidas, na faixa de 10-100 Å, possibilitando obter capacitâncias na faixa 1-105 µF. Dois dielétricos bastante utilizados em capacitores eletrolı́ticos são o óxido de alumı́nio e o óxido de tântalo. Esses óxidos são facilmente formados sobre as folhas dos metais correspondentes. Além de terem permissividade relativa razoavelmente alta, estes materiais têm valores elevados de campo elétrico de ruptura Er . Esta grandeza, também chamada rigidez dielétrica, é o máximo valor de E suportado pelo dielétrico e que limita o máximo valor de V . No caso de óxido de tântalo ε ≃ 28 e Er ≃ 108 V/m. Finalmente, há várias cerâmicas utilizadas como dielétricos em capacitores, possibilitando obter capacitâncias numa extensa faixa de valores. A vantagem das cerâmicas em relação aos óxidos é sua resistividade muito mais elevada. Em conseqüência, os capacitores de cerâmica têm perda muito menor que os eletrolı́ticos. A Tabela 10.1 apresenta os principais parâmetros de alguns dielétricos importantes para eletrônica. Material Baquelite Mica Óxido de alumı́nio (A2 O3 ) Óxido de tântalo (Ta2 O5 ) Óxido de Titânio (TiO3 ) Papel Porcelana Quartzo fundido (SiO2 ) Teflon (PFTE) ε Er (106 V/m) 4,8 5,4 10 28 94 3,5 6,5 3,8 1,9 12 160 100 6 14 4 8 60 Tabela 10.1: Permissividade relativa ε = / 0 em baixas freqüências e rigidez dielétrica Er de alguns materiais dielétricos à temperatura ambiente. Cap. 10 Outros Materiais Importantes para a Eletrônica 10.1.3 473 Materiais Piezoelétricos Piezoeletricidade é a propriedade que alguns dielétricos têm, de desenvolver uma polarização quando submetidos a uma tensão mecânica. A polarização produzida pela tensão cria cargas de polarização e, portanto, um campo elétrico. Reciprocamente, a aplicação de um campo elétrico num material piezoelétrico resulta numa deformação mecânica (chamado efeito piezoelétrico reverso). Nos dois casos, a mudança no sentido da perturbação produz uma inversão no sentido do efeito. Estes fenômenos foram descobertos no final do Século XIX por Pierre Curie, que cunhou o nome piezoeletricidade ao efeito (piezo significa pressão). A Figura 10.5 mostra, através de um modelo bidimensional, como a compressão de um cristal induz um momento de dipolo elétrico na direção da deformação. No cristal sem deformação, em (a), os três dipolos formados pelo ı́on A e seus vizinhos (cada carga ±e é repartida em três) têm momento total nulo. Entretanto, quando o cristal é deformado como indicado em (b), os ângulos entre os dipolos produzem um momento resultante na direção da deformação. É importante observar que não pode existir piezoeletricidade em cristais Figura 10.5: Ilustração da origem da piezoeletricidade: (a) No cristal em equilı́brio o momento de dipolo elétrico total é nulo; (b) o dipolo elétrico resultante da deformação mecânica não é nulo. 474 Materiais e Dispositivos Eletrônicos com centro de simetria de inversão. Esta propriedade pode ser demonstrada genericamente a partir de relações de simetria entre os campos. Fisicamente ela pode ser compreendida com o modelo bidimensional da Figura 10.6. Veja que na rede quadrada com simetria de inversão, o momento de dipolo elétrico resultante é nulo, tanto na situação de equilı́brio em (a), quanto na rede deformada em (b). A piezoeletricidade não é restrita aos isolantes. Ela também ocorre em diversos semicondutores, tais como CdS e ZnO. A aplicação de uma tensão mecânica em certa direção do cristal resulta, em geral, numa polarização em direção diferente. Assim, as relações entre as várias grandezas envolvidas na piezoeletricidade são tensoriais. Entretanto, em algumas direções particulares dos cristais, os vetores estão na mesma direção. Neste caso as relações são escalares e podem ser escritas na forma, P = d T + 0 χE (10.14) R = sT +dE (10.15) onde T é a tensão aplicada ao material (força por unidade de área), E é o campo aplicado, P é a polarização induzida e R é a deformação por unidade de comprimento resultante. As constantes d, s e χ são parâmetros caracterı́sticos de cada material. A constante d é a que caracteriza a piezoeletricidade, pois relaciona a polarização induzida com a tensão mecânica aplicada, ou a deformação produzida por um campo elétrico aplicado. Como R é adimensional, d tem a unidade inversa do campo elétrico, m/V no SI, ou cm/statvolt no CGS. Na realidade, cada material tem várias constantes piezoelétricas dαβγ , relacionando a polarização induzida na direção α com a componente βγ do tensor que caracteriza a tensão mecânica (força por unidade de área). Como α pode assumir 3 valores e βγ pode assumir 3 × 3 valores, o tensor piezoelétrico pode ter 27 Figura 10.6: Demonstração da ausência de piezoeletricidade em cristais com centro de simetria de inversão. Cap. 10 Outros Materiais Importantes para a Eletrônica 475 componentes. Entretanto, devido à simetria do cristal, vários componentes são iguais entre si e vários são nulos, de modo que somente alguns são relevantes. Atualmente são conhecidos cerca de mil materiais piezoelétricos, porém as aplicações práticas são dominadas por apenas alguns deles. As constantes piezoelétricas e dielétricas dos materiais mais importantes estão apresentadas na Tabela 10.2. Um dos cristais piezoelétricos mais tradicionais é o quartzo (SiO2 ), cuja constante piezoelétrica longitudinal é d11 = 2 × 10−12 m/V. Para ter uma idéia do significado deste valor, consideremos um disco de quartzo de espessura = 1 mm, submetido a uma diferença de potencial V = 100 Volts. A variação ∆ na espessura do disco, dada por (10.15) ∆ V =d (10.16) é de apenas ∆ = 2 × 10−10 m = 2 Å. Nos materiais genuinamente piezoelétricos, a polarização é nula na ausência de tensão mecânica ou campo elétrico externo, como mostra a Eq.(10.14). Há uma outra classe de materiais, que será apresentada na próxima seção, nos quais existe uma polarização espontânea na ausência de campos externos. Eles são chamados materiais ferroelétricos e, como será mostrado na próxima seção apresentam efeito piezoelétrico. Os materiais ferroelétricos e piezoelétricos mais importantes para aplicação em eletrônica são o niobato de lı́tio, o titanato de bário e o titanato de chumbo e zircônio, este conhecido como PZT, cujos parâmetros estão na Tabela 10.2. O PZT é em geral utilizado Material d (10−12 m/V) Piezoelétricos genuı́nos Quartzo (SiO2 ) Turmalina KDP (KH2 PO4 ) -2,3 -3,7 21 Ferroelétricos Titanato de bário (BaTiO3 ) PZT (Pb0,5 Zr0,5 TiO3 ) 390 370 ε 4,5 6,3 40 2.900 1.700 Tabela 10.2: Valores das maiores componentes do tensor constante piezoelétrica e constante dielétrica de materiais piezoelétricos importantes. 476 Materiais e Dispositivos Eletrônicos na forma de cerâmica policristalina, sinterizada num campo elétrico externo. A aplicação do campo durante o processo de resfriamento produz um alinhamento dos grãos cristalinos ao longo de um certo eixo cristalográfico, fazendo com que o material apresente efeito piezoelétrico macroscópico. A cerâmica de PZT é muito utilizada atualmente por causa do valor elevado de sua constante piezoelétrica, d33 = 3, 7 × 10−10 m/V, cerca de duzentas vezes maior que a do quartzo. Uma aplicação importante dos materiais piezoelétricos é na fabricação de transdutores eletromecânicos para a geração de ondas elásticas, como ilustrado na Figura 10.7. Nas aplicações em baixas freqüências (até dezenas de kHz) o material mais usado em transdutores é o PZT, enquanto que em freqüências mais altas (≥ 1 MHz) o quartzo cristalino é o mais empregado. O transdutor é formado por um disco, ou uma placa retangular, de PZT ou quartzo, com as duas faces cobertas por filmes metálicos. A cobertura metálica de uma das faces é estendida para a borda lateral para permitir o contato elétrico com um fio externo. A aplicação de uma diferença de potencial entre os eletrodos cria um campo elétrico no material piezoelétrico, resultando numa deformação mecânica. Quando o transdutor é colocado em contato com um outro material qualquer, a aplicação de uma tensão ac gera uma onda elástica no material. Esta técnica é empregada para gerar ondas de ultrassom, utilizadas em equipamentos médicos, cientı́ficos e industriais. As ondas de ultrassom refletidas são convertidas em sinal elétrico por um outro transdutor de recepção, ou pelo próprio transdutor de transmissão. Figura 10.7: (a) Transdutor piezoelétrico de PZT; (b) Utilização do transdutor para gerar uma onda de ultrassom. Cap. 10 Outros Materiais Importantes para a Eletrônica 477 Embora o quartzo tenha um efeito piezoelétrico muito menor que o PZT, ele encontra várias aplicações importantes na eletrônica por conta de sua baixa perda acústica. Esta propriedade faz com que um bloco de quartzo cristalino seja um ótimo ressoador mecânico, com uma taxa de amortecimento muito pequena. A aplicação de um pulso de tensão no bloco provoca uma vibração mecânica, que por sua vez cria uma tensão elétrica oscilante através do efeito piezoelétrico. Assim, o bloco de quartzo com filmes metálicos em duas faces opostas, é eletricamente equivalente a um circuito ressonante paralelo RLC. As freqüências de vibração dependem das dimensões e do formato do bloco. No caso de uma placa fina com faces paralelas, o modo fundamental de ressonância corresponde a uma onda acústica estacionária, refletindo sucessivamente nas duas faces, tendo comprimento de onda igual ao dobro de espessura da placa. Assim, sendo a espessura da placa e v a velocidade da onda acústica na direção perpendicular à face, a freqüência de oscilação é, v ν= . (10.17) 2 A velocidade da onda depende da direção cristalográfica do corte do cristal. Para o chamado corte X no quartzo, v ≃ 5, 4 × 103 m/s. Então, um cristal com espessura 1 mm neste corte, oscila com freqüência 2,7 MHz. Por causa desta oscilação ressonante, a variação na espessura é muito maior que na situação dc, dada por (10.16). Os cristais de quartzo são utilizados para sincronizar osciladores eletrônicos de relógios, computadores, transmissores e receptores de rádio e TV. O oscilador consiste de um circuito amplificador com realimentação, tendo no lugar do circuito ressonante RLC uma pequena placa de quartzo, com contatos metálicos nas duas faces opostas. A Figura 10.8 mostra o sı́mbolo do circuito do cristal de quartzo e seu circuito elétrico equivalente. Os osciladores de quartzo apresentam duas vantagens em relação aos circuitos RLC: em freqüências da ordem de alguns MHz, eles têm perdas muito menores, e em conseqüência têm fator de qualidade da ressonância muito maior (no circuito RLC o fator de qualidade é Q = ωL/R); a estabilidade da freqüência de ressonância do cristal de quartzo é muito mais elevada que no circuito RLC. Finalmente, uma outra aplicação importante dos materiais piezoelétricos é nos dispositivos de ondas acústicas de superfı́cie, SAW (Surface Acoustic Wave). O dispositivo SAW mais simples, mostrado na Figura 10.9 é formado basicamente por uma lâmina de quartzo ou de niobato de lı́tio, tendo uma das superfı́cies polidas, sobre a qual são feitos dois transdutores interdigitais. Cada transdutor consta de um filme metálico, depositado sobre a lâmina do substrato, tendo a forma de dois pentes com os dentes (ou dedos) intercala- 478 Materiais e Dispositivos Eletrônicos Figura 10.8: (a) Sı́mbolo de circuito de cristal oscilador de quartzo; (b) Circuito elétrico equivalente. dos. Uma tensão ac aplicada entre os dois terminais do transdutor, produz uma perturbação elástica na região próxima à superfı́cie. Isto gera uma onda acústica que propaga na lâmina, confinada a uma camada superficial, com velocidade próxima a das ondas de volume. Esta onda acústica de superfı́cie é detetada pelo segundo transdutor, que converte o sinal acústico em sinal elétrico. Como dois dentes vizinhos têm polaridades opostas, a eficiência do transdutor é máxima para a freqüência cujo comprimento de onda acústica é o dobro da distância entre eles. A tecnologia SAW é utilizada para fabricar diversos dispositivos de processamento de sinais com freqüência na faixa de dezenas ou centenas de MHz, como linhas de atraso e filtros. Antes do advento desta tecnologia, esses dispositivos eram volumosos, feitos por séries de circuitos sintonizados de capacitores e indutores discretos. O desenvolvimento dos dispositivos SAW possibilitou a miniaturização e a integração de circuitos de VHF e UHF. Figura 10.9: Dispositivo de onda acústica de superfı́cie-SAW. Cap. 10 Outros Materiais Importantes para a Eletrônica 10.1.4 479 Materiais Ferroelétricos Materiais ferroelétricos são aqueles que apresentam polarização espontânea, na ausência de campos externos. Esta polarização espontânea tem origem no momento de dipolo elétrico que surge na célula unitária, em decorrência de um deslocamento do centro das cargas positivas em relação ao centro das cargas negativas. Este deslocamento resulta de uma pequena distorção na estrutura cristalina, que ocorre abaixo de certa temperatura crı́tica, visando minimizar a energia do sistema. A Figura 10.10 mostra a célula unitária de titanato de bário (BaTiO3 ), indicando o deslocamento dos ı́ons positivos que produz o momento de dipolo elétrico. Exemplo 10.1: Calcule o deslocamento do ı́on de Ti4+ em relação ao centro da célula unitária no BaTiO3 , sabendo que em T = 300 K sua polarização espontânea é Ps = 0, 26 C/m2 e que o parâmetro de rede é a ≃ 4 Å. Como a polarização é o momento de dipolo elétrico por unidade de volume, o momento da célula unitária é, p = Ps a3 = 0, 26 × (4 × 10−10 )3 = 1, 66 × 10−29 Cm . Como a carga total dos ı́ons de Ba2+ e Ti4+ no interior da célula é 6e, este momento de dipolo é resultante de um deslocamento dado por δ= 1, 66 × 10−29 p m ≃ 0, 17 Å = 6e 6 × 1, 6 × 10−19 , Note que o deslocamento é muito menor que as dimensões da célula. A polarização espontânea nos materiais ferroelétricos desaparece acima de uma certa temperatura Tc , a semelhança do que ocorre com a magnetização nos ferromagnetos. Tc também é chamado temperatura de Curie. No caso de BaTiO3 , Tc = 393 K. Outro material ferroelétrico importante, o niobato de lı́tio, LiNbO3 , tem Tc = 1470 K. A polarização dos materiais ferroelétricos pode ser alterada pela aplicação de um campo externo E. Aqui também há uma semelhança com o caso ferromagnético, pois a variação de P com E segue um ciclo de histerese como o de M −H. No caso de monocristais, a curva tem uma forma retangular, mostrada na Figura 10.11(a), que lembra o ciclo de histerese de ı́mãs permanentes. O material mantém uma polarização remanente Pr , de valor próximo ao da saturação, depois que o campo E é retirado. Para 480 Materiais e Dispositivos Eletrônicos 2+ Ba Ti 4+ O Figura 10.10: Célula unitária do BaTiO3 , com a indicação do deslocamento dos ı́ons positivos que produz o momento de dipolo elétrico. aplicações nas quais o campo E é variável, o loop retangular é indesejável, pois a variação de P é discreta e porque a perda de energia é grande. Isto pode ser contornado com a preparação de materiais cerâmicos, formados por grãos cristalinos alinhados. O alinhamento é obtido através da aplicação de um campo E externo durante o processo de resfriamento. Este processo resulta num ciclo de histerese fino e alongado, como mostrado na Fig.10.11(b). Os materiais ferroelétricos são utilizados em três situações distintas: aplicações que requerem dielétricos de alta permissividade; aplicações baseadas no ciclo de histerese retangular; e como materiais piezoelétricos. A propriedade que todo material ferroelétrico tem em ser piezoelétrico pode ser compreendida através da Figura 10.12. Em (a) vê-se um modelo bidimensional de material Figura 10.11: Ciclos de histerese de materiais ferroelétricos: (a) ciclo retangular observado em cristais; (b) ciclo alongado em cerâmicas policristalinas alinhadas. Cap. 10 Outros Materiais Importantes para a Eletrônica 481 Figura 10.12: Ilustração do efeito piezoelétrico em cristais ferroelétricos: (a) Cristal em repouso; (b) Cristal sob tensão mecânica apresentando variação ∆p no momento de dipolo elétrico. ferroelétrico, no qual existe um momento de dipolo elétrico devido ao deslocamento entre os centros das cargas positivas e negativas. Em (b) está mostrado o cristal deformado pela aplicação de uma tensão mecânica externa. Vemos que a deformação resulta numa variação ∆p no momento de dipolo elétrico da célula unitária, produzindo portanto uma polarização no material. 10.1.5 Eletretos Uma classe especial de materiais dielétricos, com propriedades que se assemelham as dos ferroelétricos, é a dos eletretos. O eletreto é formado por um material dielétrico no qual são depositadas cargas elétricas positivas e negativas. As cargas permanecem aprisionadas, próximas das superfı́cies ou no volume, gerando uma polarização macroscópica e, portanto, um campo elétrico. A Figura 10.13 ilustra várias formas de aprisionamento de cargas em eletretos. Em (a) as cargas negativas aprisionadas na superfı́cie de cima, induzem o aparecimento de cargas de compensação no filme metálico da superfı́cie de baixo. Estas cargas de compensação permanecem no filme pois não conseguem passar pela barreira de potencial entre o metal e o dielétrico. A situação em (b) é semelhante a de (a), porém as cargas negativas estão aprisionadas na superfı́cie e no interior. Em (c) as cargas + e − estão no interior do material, formando domı́nios que se comportam como dipolos elétricos. 482 Materiais e Dispositivos Eletrônicos Figura 10.13: Ilustração de alguns tipos de eletretos. Em (a) e (b) a superfı́cie de baixo está metalizada. Uma diferença básica do eletreto para o ferroelétrico, é que sua polarização decai gradualmente no tempo, ou seja, não é permanente. Isto resulta do fato das cargas serem colocadas artificialmente, gerando um estado metaestável. As cargas permanecem aprisionadas em poços de potencial locais, mas podem ser liberadas através da ativação térmica. O tempo de decaimento das cargas depende do material hospedeiro, das condições de preparação do eletreto, e da temperatura. Sendo ∆E a altura média das barreiras de potencial que aprisionam as cargas, o tempo de decaimento das cargas é τ = τ0 e−∆E/kB T (10.18) onde τ0 é um tempo caracterı́stico do material e das condições de preparação. Vemos então que o tempo de decaimento das cargas diminui com o aumento da temperatura. Assim, à medida que T aumenta, a polarização diminui gradualmente, sem uma transição de fase definida como ocorre nos materiais ferroelétricos. O tempo de decaimento a temperatura ambiente pode variar desde alguns segundos até dezenas ou centenas de anos. Portanto, embora a polarização dos eletretos não seja permanente, para efeitos práticos os materiais com τ ∼ 100 anos comportam-se como se fossem estáveis. Os eletretos podem ser feitos com uma enorme gama de materiais, preparados através de diversas técnicas de carregamento. Os primeiros eletretos estudados foram as ceras vegetais, como a carnaúba. Muitos trabalhos pioneiros nesta área foram realizadas no Brasil, inicialmente na década de 1940 por Bernard Gross, no Rio de Janeiro, e mais tarde pelo grupo de Sergio Mascarenhas, em São Carlos. Muitos materiais formam eletretos bastante estudados, tanto substâncias orgânicas como antraceno, naftaleno e polı́meros diversos, quanto inorgânicos, como quartzo, enxofre e cristais iônicos. Também há diversos eletretos de materiais biológicos, chamados bioeletretos, como ossos, dentes, tecidos, proteı́nas, etc. Dentre os métodos de carregamento, os Cap. 10 Outros Materiais Importantes para a Eletrônica 483 Figura 10.14: Seção transversal de microfone de eletreto simples. mais importantes são: descarga elétrica no ar a partir de uma ponta de alta tensão próxima à superfı́cie do material; radiações ionizantes diversas como raios-X, raios-gama, partı́culas alfa, e ultravioleta. Os eletretos importantes para eletrônica são filmes de polı́meros, principalmente dois tipos de teflon: propileno de polifluoretileno (FEP) e politetrafluoretileno (PTFE). Eles são feitos na forma de filmes com espessura de 10-50 µm, metalizados por evaporação em uma ou nas duas superfı́cies. As cargas são produzidas por descarga de alta tensão, tendo densidades na faixa 10−4 − 10−2 C/m2 e tempo de decaimento τ ∼ 109 s (∼ 32 anos). A maior aplicação desses materiais na eletrônica é como transdutores eletrostáticos para microfones. Os microfones de eletreto são pequenos, muito sensı́veis e são produzidos a custo muito baixo. Conseqüentemente, eles estão substituindo com grande vantagem os microfones magnéticos tradicionais utilizados em telefones e em equipamentos de áudio diversos, e encontrando novas aplicações. A Figura 10.14 mostra a seção transversal de um microfone de eletreto simples. Ele consiste de um diafragma formado por um filme de teflon (FEP ou PTFE) com espessura da ordem de 20 µm, tendo a superfı́cie superior coberta por um filme metálico (espessura ∼500-1000 Å). O filme de teflon, contendo carga superficial como na Figura 10.13 (a), é montado sobre uma placa metálica, apoiado sobre espaçadores que deixam uma camada de ar com certa espessura. Quando uma onda de som atinge o diafragma, produz neste uma deflexão que faz variar a espessura da camada de ar. Assim, o campo elétrico existente entre o filme e a placa metálica produz uma variação na tensão de saı́da proporcional à deflexão no diafragma. Com algumas modificações em relação ao esquema da Fig.10.14, os microfones de eletreto adquirem maior estabilidade e melhor resposta de freqüência. 484 10.2 Materiais e Dispositivos Eletrônicos Materiais Dielétricos para Opto-Eletrônica Os dipositivos opto-eletrônicos apresentados no Capı́tulo 8 têm como função primordial a conversão de um sinal elétrico em sinal óptico, ou vice-versa. O desenvolvimento da opto-eletrônica levou à criação de dispositivos de processamento direto do sinal óptico, evitando a necessidade de sua conversão em sinal eletrônico, o processamento deste, e a conversão de volta ao sinal óptico. Esses dispositivos têm rapidez de resposta muito maior que aqueles que empregam a conversão em sinal eletrônico e também menor perda de inserção, e formam a base da fotônica. A operação de vários destes dispositivos é baseada em propriedades ópticas de materiais dielétricos que apresentaremos a seguir. 10.2.1 Efeitos Eletro-Ópticos e Elasto-Ópticos Estes dois efeitos têm uma forte analogia com o efeito piezoelétrico, estudado na seção anterior. Quando um campo elétrico macroscópico é aplicado a um material dielétrico, ele atua nos momentos de dipolo elétrico, podendo produzir efeitos macroscópicos. A ação do campo nos dipolos iônicos resulta numa deformação da rede cristalina, e portanto no efeito piezoelétrico inverso. Por outro lado, a ação do campo nos dipolos eletrônicos, produz uma alteração na constante dielétrica óptica do material, dando origem ao efeito eletroóptico. Esta alteração tem origem principalmente na variação dos nı́veis de energia eletrônica produzida pelo campo externo, conhecida como efeito Stark. Esta variação resulta numa mudança da constante dielétrica óptica, pois como vimos no Capı́tulo 8, esta depende diretamente das energias das transições eletrônicas. Do mesmo modo que a piezoeletricidade, o efeito eletro-óptico só é observado em materiais que não têm centro de simetria de inversão. Por esta razão, os cristais piezoelétricos também são eletro-ópticos. Como a constante dielétrica de um cristal é caracterizada por um tensor com 9 componentes, enquanto o campo elétrico aplicado pode ter 3 componentes, a relação entre eles envolve um tensor de 27 componentes. Para evitar complicações algébricas, vamos supor que o tensor eletro-óptico é dominado por uma de suas componentes. Neste caso, a relação entre o campo elétrico aplicado E e a variação na constante dielétrica óptica ε relevante toma a forma ∆ 1 ε = rE (10.19) Cap. 10 Outros Materiais Importantes para a Eletrônica 485 onde r é a constante eletro-óptica. Note que como ε é adimensional, r tem a unidade inversa do campo elétrico, sendo então m/V no SI. A mudança da constante dielétrica produzida pelo campo elétrico produz uma variação do ı́ndice de refração n do material. Como ε = n2 , a variação de n com o campo aplicado é dada por 1 ∆n = − n3 r E 2 . (10.20) Os principais cristais eletro-ópticos são também os principais piezoelétricos, devido à questão da simetria, já mencionada. A Tabela 10.3 apresenta os ı́ndices de refração e os valores das maiores compoentes do tensor eletro-óptico de alguns desses materiais. No caso de LiNbO3 , n = 2, 29 e r = 3, 26 × 10−11 m/V para luz visı́vel no comprimento de onda λ = 633 nm. Por conseguinte um campo E = 10 V/m aplicado neste material produz uma mudança no ı́ndice de refração de apenas ∆n = 1, 96 × 10−4. Apesar de pequena, esta variação é suficiente para produzir efeitos macroscópicos que possibilitam a construção de dispositivos eletro-ópticos. O efeito elasto-óptico, também chamado fotoelástico, é o fenômeno pelo qual a deformação elástica de um material resulta numa variação da constante dielétrica óptica, e portanto no ı́ndice de refração. Este efeito tem origem nas variações dos nı́veis de energia eletrônica resultantes da mudança no campo elétrico cristalino, produzida pela deformação da rede. Embora este efeito também seja caracterizado por um tensor, para simplificar vamos considerar Material BaTiO3 CdTe GaAs KDP LiNbO3 Quartzo Ti:LiNbO3 λ (nm) 514 1000 1150 514 633 514 1500 n r (10−12 m/V) 2,44 2,84 3,43 1,51 2,29 1,54 2,20 820,0 4,5 1,43 10,6 32,6 0,53 31,0 Tabela 10.3: Índice de refração ordinário n e principal constante eletro-óptica r e em alguns materiais, medidos no comprimento de onda λ indicado. 486 Materiais e Dispositivos Eletrônicos apenas o caso simples da relação envolvendo a maior variação. 1 =pR ∆ ε (10.21) onde p é a constante fotoelástica e R é uma componente do tensor deformação, definido como a variação na dimensão do material numa certa direção, por unidade de comprimento. Como ε e R são grandezas adimensionais, a constante fotoelástica também o é. A Tabela 10.4 apresenta o valor da principal constante fotoelástica e o ı́ndice de refração de alguns materiais. Note que quartzo fundido, fluoreto de lı́tio, rutila e outros materiais da Tabela 10.4 têm simetria de inversão e apresentam efeito fotoelástico. A razão disto é que o tensor foto-elástico é caracterizado por componentes com quatro ı́ndices, pαβγδ . Neste caso, não é necessário que o material não tenha simetria de inversão para que algumas componentes de pαβγδ sejam diferentes de zero. Do mesmo modo que no efeito eletro-óptico, o efeito elasto-óptico resulta numa variação do ı́ndice de refração n da luz, dada por 1 ∆n = − n3 p R 2 . (10.22) Num material piezoelétrico, o efeito elasto-óptico pode dar origem a um efeito eletro-óptico. A aplicação de um campo E produz uma deformação R, dada por (10.15), que por sua vez resulta numa variação no ı́ndice de refração dada por (10.22). Cobinando estas equações, vemos que a constante eletroóptica resultante deste efeito indireto é r = d p. No caso de quartzo, os valores de d e p das Tabelas 10.2 e 10.4 dão r = 4, 6 × 10−13 m/V, um valor menor que o da constante eletro-óptica da Tabela 10.3. Este resultado, obtido aqui Material n p LiNbO3 LiF Rutila TiO2 Safira (A2 O3 ) Quartzo fundido 2,25 1,39 2,60 1,76 1,46 0,15 0,13 0,05 0,17 0,20 Tabela 10.4: Índice de refração médio e principal constante fotoelástica na região visı́vel em alguns dielétricos. Cap. 10 Outros Materiais Importantes para a Eletrônica 487 para o quartzo, vale para outros materiais. Isto significa que o efeito eletroóptico direto, produzido pelas variações da estrutura eletrônica causadas pelo campo elétrico, é maior que o efeito indireto, resultante da combinação da piezoeletricidade e da fotoelasticidade. A variação do ı́ndice de refração produzida pelos efeitos eletro- e elastoópticos, dá origem a vários fenômenos de interesse, tanto cientı́fico quanto tecnológico. Um dos fenômenos mais evidentes é a birrefringência induzida por um campo, ou por uma deformação externa. Quando uma onda eletromagnética propaga num material, tendo componentes de polarização em duas direções perpendiculares, seu comportamento é influenciado pelos ı́ndices de refração nessas duas direções. Como a direção de mudança do ı́ndice depende da direção da perturbação externa e das caracterı́sticas do material, o efeito eletro-, ou elasto-óptico, pode produzir variação do ı́ndice em apenas uma direção. Assim, se o material em equilı́brio é isotrópico, a perturbação resulta em ı́ndices diferentes nas duas direções. Esta birrefringência causa uma variação na polarização da onda, que pode ser controlada pela perturbação externa, seja ela um campo elétrico ou uma deformação no material. Este fenômeno encontra diversas aplicações em Óptica. Na Seção 10.2.3 apresentaremos alguns dispositivos opto-eletrônicos cuja operação é baseada nos efeitos eletro- e elasto-ópticos. 10.2.2 Materiais Ópticos Não-Lineares Na apresentação do efeito eletro-óptico, consideramos que o campo elétrico no material era criado por uma fonte externa. Na realidade, o próprio campo de uma onda eletromagnética propagando no material pode produzir efeito eletro-óptico. Neste caso, o ı́ndice de refração que determina a velocidade da onda, depende da amplitude do campo da própria onda. Para quantificar este fenômeno, consideremos a variação da polarização P (2) resultante do efeito eletro-óptico criado pelo campo elétrico E da onda. Através de (10.5) e (10.19) obtemos (10.23) P (2) = 0 ∆χ E = 0 ∆ε E = −0 ε2 r E 2 . Este resultado mostra que a contribuição do efeito eletro-óptico para a polarização varia com o quadrado do campo, enquanto a contribuição usual é linear no campo. Os materiais que têm esta propriedade são chamados materiais ópticos não-lineares. Somente cristais sem simetria de inversão apresentam respostas não-lineares do tipo (10.23). Além da não-linearidade quadrática 488 Materiais e Dispositivos Eletrônicos da Eq.(10.23), é possı́vel ter contribuições de ordem superior. A polarização total criada por um campo elétrico pode então ser escrita na forma P = 0 χ(1) E + χ(2) E 2 + χ(3) E 3 + · · · , (10.24) onde χ(1) é a susceptibilidade linear, que anteriormente representamos apenas por χ, e χ(2) e χ(3) são as susceptibilidades quadrática e cúbica. Na realidade, as grandezas E 2 e E 3 que aparecem em (10.24) podem ser produtos de componentes de campos em diferentes direções, Eβ Eγ e Eβ Eγ Eδ , enquanto P é a componente Pα do vetor polarização. Assim, no caso mais geral, as suscepti(1) (2) bilidades que aparecem em (10.24) são componentes dos tensores χαβ , χαβγ e (3) χαβγδ . Enquanto o tensor χ(2) é nulo em cristais com simetria de inversão, o tensor χ(3) não é necessariamente nulo qualquer que seja a simetria do material. Como os efeitos não-lineares variam com o quadrado e o cubo do campo, eles são importantes apenas para campos de maior intensidade, como ilustrado na Figura 10.15. Os efeitos não-lineares se manifestam em ondas de alta potência, tipicamente da ordem ou acima de 1 MW/cm2 . É por esta razão que a óptica não-linear só desenvolveu-se após a invenção do laser. Os efeitos não-lineares têm uma grande variedade de aplicações ópticas. Uma das mais evidentes é a mistura de ondas. Quando duas ondas de freqüências ω1 e ω2 , com amplitudes E1 e E2 , respectivamente, propagam num meio não-linear, elas geram uma polarização P (2) , dada por P (2) = 0 χ(2) E1 E2 e(±iω1 ±iω2 )t . (10.25) Esta polarização resulta numa terceira onda, cuja freqüência é a soma ou a diferença das freqüências originais. Outro efeito não-linear mais simples é o dobramento de freqüência resultante do termo χ(2) E 2 em (10.24). Ele ocorre naturalmente quando uma onda de alta potência atravessa um cristal sem simetria de inversão, como KDP, LiNbO3 ou quartzo. Entretanto, para que a conversão de uma onda de freqüência ω em outra de freqüência 2ω seja eficiente, é necessário que o cristal seja cortado em certa direções cristalográficas, com determinada espessura, para evitar que a dispersão produza interferência destrutiva. Como alguns lasers comerciais operam no infravermelho, os dobradores ou triplicadores de freqüência são muito utilizados para converter a radiação em luz visı́vel. Este é o caso dos lasers de Nd:YAG, que operam em λ = 1060 nm. Os dobradores de freqüência de KDP convertem esta radiação em luz verde, com λ = 530 nm, com eficiência superior a 60%. Cap. 10 Outros Materiais Importantes para a Eletrônica 489 Figura 10.15: Ilustração do desvio da linearidade da polarização para campos intensos em cristal sem simeria de inversão. 10.2.3 Dispositivos Eletro-Ópticos de Guias de Onda A disseminação das comunicações ópticas criou o mercado para inúmeros dispositivos de processamento de sinais ópticos. Atualmente muitos desses dispositivos são baseados na tecnologia de guia de onda óptica. A idéia básica do guia de onda é a mesma da fibra óptica, apresentada na Seção 8.8. Quando uma onda propaga ao longo de um meio com certo ı́ndice de refração, rodeado por outro meio com ı́ndice de menor valor, ela pode sofrer reflexões internas sucessivas e ficar confinada à região do primeiro meio. É possı́vel fabricar guias de onda de luz visı́vel ou infravermelho em substratos de material dielétrico ou semicondutor, utilizando técnicas de fotolitografia e difusão, semelhantes às usadas para fazer circuitos eletrônicos integrados. Estes guias podem ser usados para conduzir a onda de um dispositivo para outro, num conjunto de dispositivos fabricados sobre o mesmo substrato, constituindo um circuito óptico integrado. A Figura 10.16 mostra um guia de onda simples utilizado em dispositivos ópticos. Ele é feito numa lâmina de material dielétrico, como quartzo ou LiNbO3 , ou semicondutor, como GaAs ou Si. O guia é formado através da interdifusão de certa impureza ao longo de uma faixa na superfı́cie da placa. A difusão da impureza produz um canal formado por um material com ı́ndice de refração maior que o do substrato, constituindo um guia de onda de luz, como ilustrado na Figura 10.16(a). O guia tem largura tı́pica de alguns µm e a impureza normalmente utilizada em LiNbO3 é o titânio. A figura (b) ilustra dois métodos utilizados para acoplar luz externa com o guia. No primeiro, a luz externa proveniente de um feixe de laser colimado incide sobre um prisma e sofre reflexão interna total na superfı́cie em contato com a lâmina. Isto 490 Materiais e Dispositivos Eletrônicos Figura 10.16: (a) Guia de onda de luz em lâmina de material dielétrico ou semicondutor; (b) ilustração de métodos usados para acoplar luz externa com o guia de onda. resulta numa onda evanescente que penetra na lâmina, reproduzindo aproximadamente o perfil do modo no guia de onda. Este método permite acoplar eficientemente o guia com um feixe de luz externo, tanto para entrada quanto para saı́da da onda. No caso do acoplamento com fibras ópticas a situação é mais simples, uma vez que o modo na fibra tem configuração semelhante ao do guia. Assim, o acoplamento pode ser feito simplesmente colando a extremidade da fibra na superfı́cie frontal do dispositivo, como mostrado na Fig.10.16(b). Um dispositivo eletro-óptico simples baseado no guia da Fig.10.16 é o defasador, ou modulador de fase. Ele consiste de um guia numa placa de material eletro-óptico, situado entre dois eletrodos formados pela deposição de filmes metálicos sobre a superfı́cie da placa, ilustrado na Figura 10.17. Quando uma tensão V é aplicada entre os dois eletrodos, um campo elétrico é criado através do guia. A intensidade do campo é dada, aproximadamente, por E = V /d, onde d é a distância entre os eletrodos. O campo produz uma variação ∆n no ı́ndice de refração, que resulta numa mudança da defasagem sofrida pela onda no guia ao longo dos eletrodos, ∆φ = L ∆k = 2πL ∆n λ (10.26) onde L é o comprimento dos eletrodos. Usando a Eq.(10.20), pode-se exprimir a mudança de fase em função da tensão aplicada, ∆φ = − πn3 r LV λd . (10.27) Vemos que a mudança de fase é proporcional ao comprimento dos eletro- Cap. 10 Outros Materiais Importantes para a Eletrônica 491 Figura 10.17: Modulador de fase eletro-óptico. dos e à tensão aplicada. É fácil ver que o valor do produto LV necessário para que ∆φ seja igual a π radianos é, (L V )π = λd . n3 r (10.28) Exemplo 10.2: Calcule a tensão que deve ser aplicada entre os eletrodos distantes d = 7µm, num modulador de fase eletro-óptico de LiNbO3 , com um guia de Ti:LiNbO3 . Substituindo os parâmetros de Ti:LiNbO3 dados na Tabela 10.3 na Eq.(10.28) vem, (L V )π = 1, 5 × 10−6 × 7 × 10−6 ≃ 0, 032 Vm = 32 Vmm 2, 23 × 31 × 10−12 . Este resultado significa que para um modulador com 8 mm de comprimento dos eletrodos, uma tensão de 4 V é suficiente para produzir uma mudança de fase de π. Com base na modulação eletro-óptica da fase, é possı́vel construir moduladores de amplitude de luz bastante eficientes. A Figura 10.18 mostra o esquema básico de um modulador de amplitude que utiliza um interferômetro Mach-Zehnder. O interferômetro é formado por duas junções em Y, ligadas em sentidos opostos a dois guias de onda. Um par de eletrodos é depositado em torno de um dos guias, de modo que uma tensão a ele aplicada produz uma defasagem ∆φ na onda que propaga neste guia em relação à onda no outro guia. A onda incidente no terminal de entrada 1 é dividida igualmente entre as duas pernas do Y, dando origem à duas ondas que propagam independentemente nos dois guias com amplitudes iguais E1 . Na junção de saı́da as duas ondas se superpõe, dando origem a uma onda cuja amplitude é 492 Materiais e Dispositivos Eletrônicos Figura 10.18: Vista de cima de modulador de amplitude eletro-óptico com interferômetro Mach-Zehnder. E2 = E1 + E1 ei∆φ . Como a potência na saı́da é proporcional a E2 E2∗, pode-se mostrar (Problema 10.5) que a transmissão do dispositivo, definida como a razão entre a potência de saı́da e a potência de entrada T = P2 /P1 , é dada por T = 1 + cos ∆φ , 2 (10.29) onde ∆φ é proporcional à tensão aplicada aos eletrodos, de acordo com a Eq. (10.27). A Figura 10.19 mostra a curva da transmissão em função de ∆φ. Vemos que a transmissão é máxima em ∆φ = 0, ou seja, quando a tensão aplicada é nula. No dispositivo ideal o valor máximo é 1, porém nos dispositivos reais existem perdas por reflexão nas conecções e nas junções, reduzindo a transmissão máxima para cerca de 0,5 (correspondente a uma perda por inserção de 3 dB). A transmissão cai a zero em ∆φ = π, 3π, etc, o que possibilita modulação digital tipo on/off para V variando entre 0 e o valor dado por (10.28). O dispositivo também pode ser utilizado para modulação analógica. Para isto é necessário superpor ao sinal ac, numa tensão dc de polarização que Figura 10.19: Transmissão do modulador de amplitude em função do ângulo de defasagem ∆φ, o qual é proporcional à tensão aplicada. A é o ponto de operação para modulação analógica. Cap. 10 Outros Materiais Importantes para a Eletrônica 493 coloque o ponto de operação na região linear em torno de ∆φ = π/4 (ponto A da Fig.10.19). Os moduladores eletro-ópticos comerciais operam com tensões de alguns volts e têm largura de banda de modulação superior a 1 GHz, no caso analógico, ou taxa de modulação acima de 1 Gbit/s, no caso digital. A tecnologia de guias de onda está sendo utilizada para o desenvolvimento de inúmeros outros dispositivos eletro-ópticos para comunicações ópticas, tais como chaveadores, acopladores direcionais, multiplexadores, etc. 10.3 Materiais para Mostradores e Telas de Vı́deo Uma das funções mais importantes da eletrônica na atualidade é a transformação de sinais elétricos em informação visual. Esta função é utilizada em mostradores dos mais diversos equipamentos eletro-eletrônicos, para indicar o estado do equipamento ou para transmitir uma informação para o observador externo. Ela também é essencial na apresentação de imagens estáticas ou em movimento, em telas de televisão, equipamentos de vı́deo, monitores de computador e de inúmeros equipamentos cientı́ficos, médicos e industriais, assim como em uma variedade crescente de aparelhos de consumo de massa, fixos ou portáteis. Até a década de 1970 os mostradores luminosos eram feitos com lâmpadas incandescentes, ou lâmpadas de bulbos de gás, de diversos tamanhos. A partir daquela época eles passaram a utilizar dispositivos de estado sólido, como os LEDs e os indicadores de cristal lı́quido, que são muito mais eficientes, resistentes e econômicos. Por outro lado, somente na década de 1990 os monitores de vı́deo tradicionais que utilizam tubos de cinescópios começaram a dar lugar aos monitores de estado sólido. Nesta seção apresentaremos os principais materiais e dispositivos utilizados atualmente na fabricação de mostradores e de telas de vı́deo, que são as cerâmicas fosforescentes, os cristais lı́quidos e os condutores orgânicos. 10.3.1 Materiais Cerâmicos Fosforescentes Como vimos no Capı́tulo 8, a luminescência é a propriedade que tem a matéria de emitir luz quando excitada por certos estı́mulos externos. A emissão de luz ocorre quando os elétrons sofrem transições radiativas de estados excitados para estados de menor energia. Duas formas comuns de luminescência são a 494 Materiais e Dispositivos Eletrônicos fotoluminescência e a eletroluminescência. Na primeira os elétrons são levados a estados excitados por meio da absorção de fótons, enquanto na segunda a excitação resulta de um estı́mulo elétrico. Os materiais que exibem estas propriedades são chamados fotoluminescentes e eletroluminescentes, respectivamente. Uma classe importante de materiais eletroluminescentes é a dos semicondutores, que emitem luz com a passagem de uma corrente elétrica. Como vimos no Capı́tulo 8, a corrente num diodo de junção no sentido direto produz injeção de elétrons e de buracos, que emitem luz ao se recombinarem. Outra classe de importância tecnológica é a das cerâmicas eletroluminescentes, que são excitadas eletricamente de várias maneiras. Uma delas é o bombardeio por elétrons em alta velocidade, como num feixe de elétrons. Ao colidirem com os átomos do material, eles levam os elétrons ligados para estados excitados, que relaxam rapidamente para outros estados com maior vida média e na seqüência sofrem transições radiativas para estados com menor energia, emitindo fótons com energia determinada pela diferença das energias dos estados envolvidos, como estudado na Seção 8.3. Outra forma de excitação elétrica das cerâmicas eletroluminescentes é a aplicação de um campo elétrico intenso. Quando este campo ultrapassa o valor da rigidez dielétrica, que é da ordem de 106 V/cm, certos átomos são ionizados e os elétrons soltos são acelerados. Na seqüência eles chocam-se com outros átomos, levando-os a estados excitados e produzindo luminescência pelo processo descrito anteriormente. Duas propriedades importantes dos materiais luminescentes e que determinam sua aplicação são o tempo de decaimento da transição radiativa e o espectro da luz emitida. O tempo de decaimento determina a duração do pulso de luz produzido após a excitação externa. Quando este tempo é da ordem de nanosegundos ou menos, o processo é chamado fluorescência. Nesta categoria encontram-se a emissão de luz por transições banda a banda nos semicondutores de gap direto e a emissão por transições atômicas nas lâmpadas de gases ionizados, chamadas lâmpadas fluorescentes. Por outro lado, quando a duração da emissão é da ordem de mili-segundos ou maior, o processo é chamado fosforescência. Os materiais fosforescentes têm grande importância na eletrônica por conta de sua aplicação na fabricação de telas de vı́deo. Como a imagem em movimento é formada por uma seqüência de imagens, cada uma diferindo pouco da anterior, é importante que a duração da luminescência, também chamada de persistência, seja da ordem de dezenas de mili-segundos. Isto faz o observador ter a sensação de uma mudança contı́nua na imagem. Tempos Cap. 10 Outros Materiais Importantes para a Eletrônica 495 mais curtos dão sensação de que a imagem pisca, como num estroboscópio enquanto tempos mais longos resultam num borrão, pois uma nova imagem é formada antes que a anterior desapareça. Os materiais cerâmicos fosforescentes empregados em telas de vı́deo são chamados genericamente de fósforos, por conta do sentido literal da palavra, eles acendem quando excitados. Eles são compostos fosfatos, óxidos, tungstatos, sulfatos e sulfitos de diversos metais, como zinco e cádmio, isolantes ou semicondutores, dopados com impurezas de elementos de transição do ferro ou de terras raras. São as impurezas que formam os estados metaestáveis envolvidos nas transições luminescentes. A composição quı́mica determina a persistência e o espectro de emissão de luz, e portanto a aplicação do fósforo. A aplicação mais importante dos fósforos na eletrônica é em telas de vı́deo. A tecnologia mais antiga emprega cinescópios, que ainda hoje são utilizados extensivamente e se constituem um dos poucos remanescentes da eletrônica de tubos a vácuo. A Figura 10.20 mostra a vista externa de um cinescópio, também chamado de tubo de raios catódicos, ou tubo de imagem. O cinescópio consiste de um tubo de vidro reforçado, evacuado e selado, com um formato piramidal e tendo um pescoço alongado na extremidade. No interior do pescoço existe um canhão eletrônico com um catodo e vários eletrodos, que emite um feixe de elétrons. Este é dirigido para a face frontal por meio de uma alta tensão aplicada entre ela e o catodo no canhão. A face frontal é recoberta internamente por uma camada de fósforo, que ao ser bombardeada pelos elétrons emite luz que atravessa o vidro e é vista externamente. O canhão eletrônico é formado por um catodo aquecido, uma grade e alguns eletrodos, sendo montado num soquete com pinos para as conecções externas. Quando aquecido por um filamento de tungstênio atravessado por uma corrente elétrica, o catodo emite elétrons que são acelerados pelas tensões aplicadas nos eletrodos, formando um feixe monoenergético, isto é, com pequena dispersão de velocidade. Ao incidir na camada de fósforo, o feixe de elétrons produz um ponto luminoso na tela do tubo. A formação da imagem na tela requer dois processos: a varredura do feixe, para que o ponto luminoso percorra toda a área da tela; a modulação da intensidade do feixe, ou seja, do número de elétrons por unidade de tempo, por um sinal de vı́deo. A varredura do feixe é feita pelos campos magnéticos criados por dois pares de bobinas colocadas externamente nas paredes do cinescópio, como ilustrado esquematicamente na Figura 10.20. Somente um par de bobinas está mostrado na figura, para facilitar a visão. Ele cria um campo vertical, que deflete o feixe horizontalmente. Outro par de bobinas, no plano vertical, 496 Materiais e Dispositivos Eletrônicos Figura 10.20: Ilustração de um cinescópio, ou tubo de imagem. cria um campo horizontal, que produz a deflexão vertical. Nas bobinas são aplicadas tensões que produzem correntes variando no tempo com a forma de dente de serra, mostrada na Figura 10.20. Esta forma de onda faz o feixe varrer a tela num sentido, e retornar rapidamente no sentido oposto. A aplicação simultânea de tensões nos dois pares de bobinas faz o ponto luminoso percorrer a tela nas direções horizontal e vertical, porém, a cada varredura vertical correspondem muitas varreduras horizontais, como ilustrado na Figura 10.21(a). O ponto luminoso descreve um movimento de zig-zag, da esquerda para a direita na direção horizontal, e de cima para baixo na direção vertical. O padrão tradicional mais utilizado emprega 525 linhas horizontais que formam um quadro da imagem. Para produzir uma imagem em movimento são utilizados 60 quadros por segundo. Desta forma, a freqüência de variação da onda dente de serra da corrente nas bobinas de deflexão vertical é 60 Hz, enquanto a da corrente de deflexão horizontal é 525×60 Hz = 31,5 kHz . Finalmente, para a formação da imagem preto-e-branco, é preciso variar a intensidade do feixe enquanto ele percorre a tela, de modo que a luminosidade de cada ponto corresponda a da imagem. A variação da intensidade do feixe é feita por meio de um sinal de tensão aplicado na grade do canhão eletrônico, o que controla o número de elétrons no feixe. Na Figura 10.20 está ilustrada a forma de um sinal de vı́deo analógico, durante um intervalo de tempo de dois perı́odos da varredura horizontal. Os picos nas extremidades de cada varredura fazem parte do sinal de sincronismo. Eles servem para disparar Cap. 10 Outros Materiais Importantes para a Eletrônica 497 o retorno no circuito oscilador que gera a corrente dente de serra, fazendo com que a varredura do cinescópio fique em sincronia com a da câmara que produziu o sinal de vı́deo. O sentido do sinal de vı́deo é tal que quanto maior o sinal, mais escuro é o ponto luminoso na tela. Desta forma, como o retorno é disparado por um pico do sinal, o ponto luminoso torna-se escuro durante o retorno. Assim, a imagem é formada pelas linhas horizontais percorridas da esquerda para a direita na tela, e apresentados de cima para baixo. Note que durante o perı́odo de uma varredura horizontal existem cerca de 200 variações no sinal de vı́deo, o que faz com que sua freqüência seja da ordem de 6 MHz. Esta é a largura da banda necessária para a transmissão de sinais de vı́deo. O cinescópio de imagens em cores funciona como se houvessem três sistemas de imagens monocromáticas em um mesmo tubo. Ele tem três canhões eletrônicos idênticos, que produzem três feixes de elétrons independentes, paralelos e com mesma velocidade. A intensidade de cada feixe é determinada pelo sinal correspondente a uma das cores básicas. Há duas tecnologias para disposição dos canhões. Eles podem estar um acima do outro, num alinhamento vertical, ou dispostos nos vértices de um triângulo. No primeiro caso os fósforos das três cores são depositados na tela em linhas horizontais, de modo que cada feixe atinge uma linha diferente. No segundo caso os três fósforos são depositados em pequenos cı́rculos adjacentes, com os centros nos vértices de um triângulo, de modo que cada cı́rculo é bombardeado por um dos três feixes. A informação sobre as intensidades das três cores é transportada pelo sinal de vı́deo através de um processo de multiplexação temporal. O intervalo de tempo do sinal correspondente a um pixel da imagem é subdividido Figura 10.21: Ilustração do processo de varredura em telas de vı́deo: (a) Nos cinescópios o ponto luminoso descreve um movimento de zig-zag; (b) Nas telas de estado sólido, os pixeis são acesos em seqüência, da esquerda para a direita, de cima para baixo. 498 Materiais e Dispositivos Eletrônicos em três intervalos iguais, cada um para uma das três cores, seguindo a ordem vermelho, verde e azul. Este sinal é decodificado no receptor, de modo que a informação sobre a intensidade de cada cor é processada, gerando um sinal de tensão que atua no canhão eletrônico correspondente. Apesar de diversos inconvenientes, como alta fragilidade, tamanho, peso e consumo de energia elevados, os tubos de cinescópio continuam sendo fabricados em larga escala para uso nos mais diversos equipamentos. Eles ainda dominam o mercado de monitores, com mais de 60% da fatia do mercado. Uma das razões para isto é seu baixo custo comparado com o das telas de vı́deo de novas tecnologias, uma vez que há muitas fábricas no mundo e todo o custo de desenvolvimento já foi pago. Entretanto, gradualmente eles estão dando lugar a telas de estado sólido, principalmente de cerâmicas eletroluminescentes, de plasma, de cristais lı́quidos e de condutores orgânicos, que serão apresentadas a seguir. Uma tecnologia de estado sólido utilizada para fabricação de telas de vı́deo que estão substituindo os cinescópios em diversas aplicações é a que emprega dispositivos de cerâmicas eletroluminescentes. Na tela eletroluminescente, chamada de ELD (Electro Luminescent Display), a luminescência é produzida diretamente pela aplicação de um campo elétrico intenso, por meio do mecanismo descrito no inı́cio da seção. Desta forma não há necessidade de utilizar canhão eletrônico, o que possibilita que a tela seja plana e com pequena espessura comparada com a dos monitores de cinescópios. A Figura 10.22 ilustra um dispositivo eletroluminescente que produz luz quando submetido a uma tensão elétrica adequada. Ele consiste basicamente de cinco camadas, depositadas sobre um substrato por meio de técnicas de preparação de filmes finos. O fósforo é uma camada de cerâmica eletroluminescente com espessura da ordem de 500−1000 nm. Ele é excitado pelo campo elétrico criado pela tensão aplicada nos dois eletrodos, que são isolados do fósforo por meio de duas camadas finas (da ordem de 300 nm) de material isolante. Os isolantes mais utilizados são óxido de alumı́nio, A2 O3 , e uma liga de A, Ti e O, conhecida como ATO. Um dos eletrodos é uma camada metálica grossa, por exemplo de A, que reflete a luz emitida pelo fósforo. O outro eletrodo é uma camada fina (da ordem de 300 nm) de um condutor transparente, como óxido de ı́ndio e estanho, conhecido com ITO (Indium-Tin-Oxide). Para a emissão de luz pelo fósforo é necessário que o campo elétrico ultrapasse a rigidez dielétrica do material, por isso em geral a tensão aplicada é pulsada e alternada, com amplitude na faixa 120-200 volts. Cada pedacinho da imagem, chamado de pixel, é formado por três dis- Cap. 10 Outros Materiais Importantes para a Eletrônica 499 Figura 10.22: Ilustração de um dispositivo eletroluminescente utilizado em tela de ELD. positivos com o da Figura 10.22, cada um com um fósforo de uma cor básica. Dentre os materiais mais utilizados estão ZnS:Mn, ZnS:C ou CaS:Eu para o vermelho, ZnS:Tb ou SrS:Ce para o verde e Ga2 S3 :Ce, SrS:Eu ou SrS:Ag para o azul. A intensidade da luz emitida por cada dispositivo é controlada pela taxa de repetição dos pulsos da tensão aplicada durante o intervalo correspondente no sinal de vı́deo. Combinando-se as intensidades da emissão nos dispositivos das três cores básicas, é possı́vel obter qualquer cor do espectro visı́vel. A tela é formada por centenas de milhares de pixeis, um ao lado do outro, dispostos em linhas e em colunas, formando um quadro como ilustrado na Figura 10.21(b). A imagem é produzida acendendo-se os pixeis em seqüência, através de um processo de varreduras horizontal e vertical, seguindo o mesmo padrão descrito anteriormente para os cinescópios. A aplicação da tensão em cada dispositivo é feita através de uma malha de eletrodos de endereçamento, ilustrada esquematicamente na Figura 10.23, também fabricada com técnicas de filmes finos usando máscaras apropriadas. A tensão na forma de pulsos é aplicada entre um eletrodo de linha e um eletrodo de coluna, fazendo acender o dispositivo conectado nesses eletrodos. Por exemplo, no caso da Figura 10.23, o dispositivo que está aceso é o correspondente a célula verde do pixel na linha 3 e na coluna 4. Os pixeis são acesos um de cada vez, na seqüência e com a intensidade determinada pelo sinal de vı́deo, num processo de varredura semelhante ao do feixe eletrônico no cinescópio. As telas de ELD têm diversas vantagens em relação aos cinescópios. Elas são mais resistentes, mais duráveis, mais leves, menos volumosas e consomem menos energia. Em relação à tela de cristal lı́quido, a tela de ELD tem as vanta- 500 Materiais e Dispositivos Eletrônicos Figura 10.23: Malha de eletrodos utilizada para aplicar as tensões nas células dos pixeis nas telas de estado sólido. gens de operar numa faixa de temperatura muito maior e de produzir imagens de ótima qualidade por emissão de luz, que podem ser vistas de ângulos rasantes. Uma desvantagem é a necessidade de tensões de centenas de volts para acender o fósforo, o que faz com que ela não seja utilizável em equipamentos portáteis. Elas são utilizadas em aparelhos médicos e industriais, em radar e outros equipamentos de defesa. Atualmente elas respondem por cerca de 10% do mercado de telas de vı́deo de estado sólido. Uma tecnologia que está ganhando terreno rapidamente no segmento de telas planas é a de plasma, conhecida como PDP (Plasma Display Panel). Figura 10.24: Célula de plasma. Cap. 10 Outros Materiais Importantes para a Eletrônica 501 Figura 10.25: Tela de vı́deo de plasma. A tela de plasma também é emissiva e tem como material luminescente as cerâmicas fosforescentes, como as empregadas nos cinescópios e nas telas eletroluminescentes. A diferença para as outras é que a emissão de luz ocorre por fotoluminescência, sendo a excitação produzida por radiação ultravioleta emitida por um plasma. A tela é formada por centenas de milhares de células de vidro, com o formato ilustrado na Figura 10.24, todas seladas hermeticamente e contendo um gás em baixa pressão, com uma mistura de xenônio e hélio. Quando uma tensão ac da ordem de 100 V é aplicada nos eletrodos de endereçamento, ocorre uma descarga no gás e a emissão de radiação ultravioleta. Esta radiação excita a camada de fósforo depositada no fundo da célula, fazendo com que ela emita luz visı́vel. A Figura 10.25 ilustra a disposição das células numa tela de PDP em cores, que são energizadas por uma malha de eletrodos de endereçamento como a da Figura 10.23. As telas de plasma são duráveis, apresentam imagens de ótima qualidade, que podem ser vistas numa grande faixa de ângulos. Como as dimensões da célula de plasma são avantajadas, da ordem de 1 mm, as telas de plasma são grandes. No segmento de telas planas grandes para televisão, elas estão ganhando terreno rapidamente e já respondem por mais de 10% deste mercado. 10.3.2 Cristais Lı́quidos Como vimos na Seção 1.4.4, os cristais lı́quidos são formados por moléculas alongadas, orientadas aproximadamente ao longo de uma mesma direção, porém sem ocupar posições fixas e podendo fluir como num lı́quido. O que caracteriza o cristal lı́quido e o distingue de um lı́quido comum, é o fato de 502 Materiais e Dispositivos Eletrônicos Figura 10.26: Ilustração das posições e orientações das moléculas de certa substância em três faixas de temperatura, caracterizando as fases sólida, cristal lı́quido e lı́quida. suas moléculas serem longas e relativamente rı́gidas. É o “contato” entre as moléculas longas que impede que elas ocupem direções aleatórias, como num lı́quido isotrópico. Uma camada de moléculas num cristal lı́quido é, de certa forma, análoga a um conjunto de toros de madeira, boiando na superfı́cie de um rio. Na realidade, o cristal lı́quido é uma fase que certas substâncias exibem numa faixa de temperatura compreendida entre a fase sólida e a fase lı́quida. A Fig.10.26 ilustra as posições e orientações das moléculas de certa substância em três faixas de temperatura. Em T < T1 a energia de ligação das moléculas predomina, fazendo com que elas ocupem posições fixas e apresentem ordem posicional e orientacional, caracterizando a fase sólida cristalina. Em T > T2 a energia térmica predomina, quebrando as ligações entre as moléculas e fazendo com que elas tenham posições e orientações aleatórias, caracterı́sticas da fase lı́quida. Na faixa intermediária de temperatura, a do cristal lı́quido, a energia térmica é suficiente para vencer a ligação molecular, mas sem destruir completamente a ordem orientacional das moléculas. A direção média de orientação das moléculas na fase cristal lı́quido é chamada diretor, e representa uma direção preferencial de alinhamento. A orientação das moléculas varia aleatoriamente no tempo, mantendo uma média na direção do diretor. Esta situação lembra a configuração dos momentos magnéticos num material ferromagnético em temperaturas elevadas mas ainda abaixo de Tc . Entretanto, no cristal lı́quido as moléculas também apresentam movimento aleatório de deslocamento e podem fluir como num lı́quido. Costuma-se caracterizar a fase ordenada de um sistema fı́sico por Cap. 10 Outros Materiais Importantes para a Eletrônica 503 Figura 10.27: Variação do parâmetro de ordem de uma substância com fase cristal lı́quido com a temperatura. um parâmetro de ordem, que em geral varia com a temperatura. O parâmetro de ordem nos materiais magnéticos é a magnetização, enquanto nos ferroelétricos é a polarização. Nos cristais lı́quidos o parâmetro de ordem numa região com N moléculas é definido por S= 1 3 cos2 θi − 1 /2 N i , (10.30) onde θi é o ângulo entre a direção de cada molécula e o diretor. Note que S é uma média angular cujo valor é 1 para um sistema com ordem orientacional perfeita (θi = 0) e 0 para um sistema isotrópico mbox(Problema 10.7). A Fig.10.27 mostra o comportamento tı́pico do parâmetro de ordem de uma substância com fase de cristal lı́quido. Ele diminui gradualmente com a temperatura na fase cristal lı́quido, caindo bruscamente para zero na transição para a fase lı́quida, que ocorre na temperatura crı́tica Tc . A maior aplicação dos cristais lı́quidos na eletrônica é na fabricação de mostradores e telas de vı́deo. O mostrador de cristal lı́quido, conhecido por sua sigla em inglês, LCD (Liquid Crystal Display), é do tipo passivo, isto é, não gera luz própria. Por esta razão seu consumo de energia é baixı́ssimo, o que dá a ele enorme vantagem em relação aos mostradores emissivos nas aplicações que utilizam pequenas baterias, como os relógios de pulso e as calculadoras de mão. Há dois tipos básicos de LCDs, os de reflexão e os de transmissão. Em 504 Materiais e Dispositivos Eletrônicos Figura 10.28: Ilustração da orientação das moléculas de um cristal lı́quido numa célula de LCD: (a) E = 0; (b) E > Ec . ambos os tipos o cristal lı́quido tem a função de alterar uma iluminação externa, que pode ser do ambiente, de uma lâmpada ou de um LED. O LCD de reflexão utiliza luz frontal, enquanto o de transmissão utiliza luz traseira. O dispositivo consiste de uma camada de cristal lı́quido, com espessura da ordem de 10 µm ou menos, colocado entre duas lâminas transparentes de vidro ou plástico, seladas nas extremidades, formando uma célula fechada. Nas superfı́cies das lâminas depositam-se filmes condutores transparentes, como ITO, que permitem criar um campo elétrico através do cristal lı́quido. O efeito do LCD sobre a luz externa é produzido pelas moléculas do cristal lı́quido, cuja orientação pode ser alterada pelo campo elétrico produzido pelas malhas condutoras nas duas lâminas. Dentre os tipos de cristais lı́quidos apresentados na Seção 1.4, os mais utilizados nos LCDs são os nemáticos. Uma célula muito comum é feita com um cristal lı́quido nemático entre duas lâminas cujas superfı́cies internas são tratadas de modo a forçar as moléculas das camadas mais próximas a se orientarem no plano das superfı́cies, porém perpendicularmente entre si. Sem campo aplicado, o diretor varia gradualmente de uma superfı́cie para a outra, como mostrado na Fig.10.28. Quando uma tensão V é aplicada entre as placas, o campo elétrico criado tende a reorientar as moléculas em sua direção, que é perpendicular à superfı́cie. Todavia, a reorientação só ocorre se o campo for maior que um valor crı́tico Ec , que corresponde a tensões da ordem de alguns volts. Cap. 10 Outros Materiais Importantes para a Eletrônica 505 Figura 10.29: Ilustração da operação de um dispositivo LCD de reflexão. A ação do cristal lı́quido sobre a luz se dá através da forte polarização produzida pelas moléculas orgânicas. Quando uma luz polarizada atravessa a célula com campo E = 0, como na Fig.10.28, sua polarização acompanha a orientação das moléculas e sofre uma rotação de 90◦ . Por outro lado, se houver um campo aplicado com valor maior que o crı́tico E > Ec , a polarização da luz que atravessa a célula não é alterada. A Figura 10.29 ilustra a operação de um dispositivo LCD de reflexão. Ele consiste da célula de cristal lı́quido, duas lâminas polaróides com polarizações cruzadas e um espelho para refletir a luz incidente. A radiação, inicialmente despolarizada, incide da esquerda para à direita. Após passar no polaróide P1, ela é polarizada verticalmente e entra na célula do cristal lı́quido. Se não houver tensão na célula, a polarização sofre rotação de 90◦ , de modo que a radiação atravessa o polaróide P2, reflete no espelho e faz o percurso de volta, como mostrado na Fig.10.29. Desta forma, com E = 0, a radiação incidente é refletida no dispositivo, que aparece claro para um observador externo. Por outro lado, quando uma tensão é aplicada fazendo E > Ec , a radiação não sofre mudança de polarização ao atravessar a célula, sendo absorvida no polarizador P2. Nesta situação a célula aparece escura para um observador externo. Um mostrador de LCD é formado por uma malha de eletrodos de endereçamento conectados à grade de filmes condutores transparentes depositados sobre as duas superfı́cies externas da célula. O conjunto célulapolarizadores-espelho é feito com as lâminas coladas uma na outra, como mostrado na Fig.10.30. O conjunto tem espessura total da ordem de alguns µm a décimos de milı́metros e dimensões laterais que dependem da aplicação, variando desde alguns mm no caso de relógios, a dezenas de cm nas telas de vı́deo. A malha de endereçamento define um quadro de pixeis, cada um ficando claro ou escuro, dependendo da tensão aplicada, formando padrões de letras, 506 Materiais e Dispositivos Eletrônicos Figura 10.30: Ilustração do mostrador do cristal lı́quido de reflexão (LCD). números ou imagens. Como o cristal lı́quido é isolante, a corrente que atravessa a célula é extremamente pequena, como também é a potência consumida. A utilização de tensão dc tende a diminuir a vida do LCD porque depois de um certo número de ciclos ocorrem reações eletromecânicas que dificultam o movimento das moléculas. Por esta razão, usam-se tensões alternadas com forma de onda quadrada, com freqüência na faixa de 25 Hz a 1 kHz. Isto resulta em correntes capacitivas que produzem um pequeno aumento na potência consumida. Depois de dominar inteiramente o mercado de mostradores de relógios e de equipamentos eletrônicos em geral, os cristais lı́quidos entraram no segmento de telas de vı́deo, preto-e-branco ou colorida, de computadores e aparelhos de televisão. O desempenho das telas de LCD é bastante melhorado através da técnica de matriz ativa. Esta técnica consiste em incorporar a cada pixel um dispositivo semicondutor, um diodo ou um transistor. Como a ativação do pixel de cristal lı́quido tem uma resposta não-linear, pois só ocorre para V > Vc , a incorporação de um dispositivo semicondutor não-linear aumenta as possibilidades de endereçamento. Isto permite a fabricação de telas com maior contraste e brilho e portanto melhor qualidade de imagem. As técnicas de produção de telas de vı́deo são bastante sofisticadas, com os dispositivos semicondutores fabricados integradamente nas células de cristal lı́quido, através da deposição de sucessivas camadas de filmes finos. Atualmente as telas de LCD dominam completamente as aplicações em computadores tipo notebook e aparelhos de TV pequenos, respondendo por mais de 70% do mercado de telas de estado sólido. Os cristais lı́quidos utilizados em mostradores de LCD são compostos orgânicos, com moléculas formadas por dois ou três anéis de benzenos ligados diretamente entre si. Esses compostos, sintetizados nos últimos vinte anos, apresentam grande estabilidade quı́mica e fases de cristal lı́quido em extensas faixas de temperatura de trabalho. A função do cristal lı́quido é apenas variar a polarização da luz, possibilitanto o controle de sua intensidade por meio dos polarizadores cruzados. As cores das células que formam os pixeis nas telas coloridas são criadas por meio de filtros ópticos feitos de camadas dielétricas. Cap. 10 Outros Materiais Importantes para a Eletrônica 10.3.3 507 Materiais Orgânicos Condutores Os materiais orgânicos são aqueles que têm em sua estrutura básica átomos de carbono e de hidrogênio. O mundo vegetal e o mundo animal são formados por compostos orgânicos produzidos pela natureza. No Século XX a tecnologia de fabricação de materiais orgânicos artificiais foi desenvolvida, possibilitando a produção comercial de uma grande variedade de materiais para diversas aplicações. Atualmente mais de dois milhões de materiais orgânicos são conhecidos. Eles podem ser agrupados em duas grandes categorias, materiais poliméricos e materiais não-poliméricos. Os materiais poliméricos, comumente chamados plásticos, têm uma enorme variedade de aplicações em nossa vida diária. Como apresentado na seção 1.4.3, os polı́meros consistem de moléculas com estrutura em cadeias longas, formadas pela repetição de unidades mais simples, chamadas monômeros. Estas cadeias são facilmente formadas por átomos de C e de H, e por isso os polı́meros são em geral materiais orgânicos. A riqueza dos polı́meros decorre do fato de que pequenas alterações na constituição dos monômeros resultam em profundas modificações em suas propriedades fı́sico-quı́micas. Embora os polı́meros possam ser sintetizados a partir de uma grande variedade de matérias primas, os processos de fabricação mais econômicos são baseados na transformação de derivados do petróleo. É por isto que o contı́nuo surgimento de novos materiais plásticos após a segunda grande guerra está associado à evolução da indústria petroquı́mica. Os materiais poliméricos utilizados nos setores tradicionais da indústria são isolantes elétricos. Na eletrônica eles são essenciais para a fabricação de partes e peças diversas, tais como: capas de fios e cabos elétricos; suportes isolantes; caixas de equipamentos; botões; teclas; e invólucros diversos. Como os plásticos tradicionais são isolantes, causou grande surpresa na década de 1970 a descoberta de novos polı́meros condutores de eletricidade, tendo propriedades elétricas que se assemelham às de metais, de semicondutores ou mesmo de supercondutores. Estes materiais também são conhecidos como polı́meros não-convencionais. Recentemente estes materiais encontraram aplicações inusitadas na eletrônica, e diversos dispositivos de condutores orgânicos já são fabricados comercialmente. A possibilidade de obter materiais de uso prático, combinando propriedades elétricas tı́picas de materiais inorgânicos com certas caracterı́sticas de plásticos, como a flexibilidade mecânica e a transparência óptica, tem motivado uma grande atividade de pesquisa na área de polı́meros condutores. Vários dos desenvolvimentos recentes nesta área devem-se a descobertas e contribuições cientı́ficas de Alan 508 Materiais e Dispositivos Eletrônicos Figura 10.31: Ilustração de um polı́mero policristalino. J. Heeger, Alan G. MacDiarmid e Hideki Shirakawa, que receberam o Prêmio Nobel de Quı́mica no ano 2000. A ligação entre os átomos que formam as cadeias dos polı́meros é do tipo covalente, na qual os elétrons de valência são compartilhados por átomos vizinhos. Esta ligação é do mesmo tipo que existe na maioria dos semicondutores inorgânicos, sendo muito mais forte que as ligações metálica e molecular. Cada átomo de C, que tal como Si e Ge tem quatro elétrons de valência, compartilha seus elétrons com os átomos de H ligados a ele e com os átomos de C vizinhos na cadeia. É a forte ligação covalente dos átomos ao longo da cadeia que dá a coesão aos polı́meros. Isto possibilita a fabricação de finas folhas de plástico, com espessuras da ordem de alguns µm, tendo maleabilidade não encontrada em folhas feitas de outros tipos de materiais. Em contraste com a forte coesão ao longo das cadeias, a ligação entre cadeias vizinhas é fraca, sendo do tipo molecular. Por esta razão, os plásticos comumente utilizados são feitos com as cadeias entrelaçadas, de modo a produzir resistência uniforme ao longo de todas as direções. No entanto, para aplicação em eletrônica, é importante que o material tenha a maior ordem estrutural possı́vel. Isto pode ser obtido através de estruturas policristalinas, como aquela ilustrada na Figura 10.31. O material é formado por conjuntos ordenados de cadeias poliméricas, separados por regiões amorfas. Um dos polı́meros condutores mais estudados é o poliacetileno. Ele consiste de uma cadeia de monômeros contendo apenas átomos de C e H, representada por (CH)x . Ele é um polı́mero conjugado, nome dado aos polı́meros que têm os carbonos ao longo da cadeia com ligações alternadas, sendo uma simples, com um vizinho, e uma dupla, com o outro vizinho. O poliacetileno pode ser sintetizado em duas formas distintas, designadas por Cap. 10 Outros Materiais Importantes para a Eletrônica 509 Figura 10.32: Dois isômeros de poliacetileno: (a) cis-(CH)x ; (b) trans-(CH)x . cis e trans, mostradas na Figura 10.32. Como as duas formas têm fórmulas quı́micas idênticas, elas são chamadas isômeras. Na forma trans, os átomos de H são ligados aos átomos de C alternadamente, em lados opostos da cadeia, enquanto na forma cis os átomos de H ligados a carbonos vizinhos com ligações duplas estão no mesmo lado da cadeia. Com isto, os átomos vizinhos de H estão mais próximos entre si na forma cis do que na forma trans. O poliacetileno é normalmente sintetizado na forma cis. O aquecimento em 150◦ C por alguns minutos produz a isomerização e transforma a forma cis na configuração trans. As diferentes configurações dos átomos de H nos monômeros de cis-(CH)x e trans-(CH)x resultam em estruturas de bandas de energia eletrônica bastante diferentes, e portanto em propriedades elétricas distintas. Enquanto o cis-(CH)x é eletricamente isolante, o trans-(CH)x é um semicondutor. A Figura 10.33 mostra as estruturas de bandas de trans-(CH)x , calculadas para diversas distâncias das ligações carbono-carbono. Como nos polı́meros conjugados existem dois tipos de ligação ao longo da cadeia, é preciso considerar duas distâncias entre carbonos vizinhos, d1 para a ligação C-C, e d2 para C=C. Vemos, na Figura 10.33, que o gap de energia Eg entre as bandas de valência e condução depende das distâncias das ligações. Em (a), as distâncias iguais d1 = d2 = 1, 39 Å resultam num gap nulo, e portanto em comportamento metálico. Em (b), as distâncias um pouco diferentes, d1 = 1, 43 Å e d2 = 1, 36 Å, já são suficientes para produzir um gap de energia. Em (c), uma diferença maior entre as distâncias das ligações, d1 = 1, 54 Å e d2 = 1, 34 Å, resulta num maior gap. Esta é a razão pela qual os polı́meros conjugados, que têm necessariamente d1 e d2 diferentes, são os que têm propriedades semicondutoras interessantes para a eletrônica. Os valores de d1 e d2 da Figura 10.33(c) são as distâncias reais de transpoliacetileno à temperatura ambiente. Elas resultam num gap direto, com Eg = 1, 5 eV. Este valor é suficientemente pequeno para que elétrons passem 510 Materiais e Dispositivos Eletrônicos Figura 10.33: Bandas de energia em poliacetileno trans-(CH)x para diferentes distâncias das ligações C-C (d1 ) e C=C (d2 ): (a) d1 = d2 = 1, 39 Å; (b) d1 = 1, 43 Å, d2 = 1, 36 Å; (c) valores reais, d1 = 1, 54 Å, d2 = 1, 34 Å[P.M. Grant e I.P. Batra, Solid State Communications, 29, 225 (1979)]. da banda de valência para a de condução por excitação térmica à temperatura ambiente. Na visão da estrutura quı́mica, a passagem de um elétron para a banda de condução corresponde à quebra de uma ligação dupla entre os átomos de carbono. Com isto, ela torna-se uma ligação simples e libera um elétron para conduzir a corrente elétrica. Os elétrons no mı́nimo da banda de valência têm vetor de onda k = π/a, massa efetiva m∗ = 0, 1 m0 e tempo de colisão τe ≃ 10−14 s. Esses valores resultam numa mobilidade ao longo da cadeia, dada por (5.49), µn ≃ 200 cm2 /Vs. Comparando este valor com os dados da Tabela 5.2, vemos que ele é da mesma ordem da mobilidade de buracos nos semicondutores tradicionais Si e GaAs. Por esta razão, uma folha de transpoliacetileno apresenta um brilho óptico semelhante ao do silı́cio, porém com a flexibilidade mecânica tı́pica de plásticos. As propriedades eletrônicas do trans-poliacetileno podem ser alteradas através da dopagem com impurezas doadoras ou aceitadoras, como nos semicondutores inorgânicos. O semicondutor tipo p pode ser obtido com impurezas de pentafluoreto de arsênico (AsF5 ) ou iodo (I2 ), difundidas no (CH)x através de técnicas de fase de vapor ou métodos eletroquı́micos. Com a dopagem, ocorre uma transferência de elétrons dos átomos das cadeias do polı́mero para as moléculas das impurezas, produzindo buracos nas cadeias e con- Cap. 10 Outros Materiais Importantes para a Eletrônica 511 Figura 10.34: Variação da condutividade de trans-poliacetileno com a concentração de impurezas. seqüentemente comportamento de semicondutor tipo p. A Figura 10.34 mostra o aumento da condutividade de trans-(CH)x com a concentração de AsF5 e I2 , expressa em fração de moléculas das impurezas em relação as do polı́mero. Vê-se que a condutividade varia quase sete ordens de grandeza com a dopagem por AsF5 . Comportamento semelhante da condutividade é obtido na dopagem com átomos de metais alcalinos, que produz um semicondutor tipo n. É importante chamar a atenção de que os mecanismos de transporte de cargas nos polı́meros condutores é mais complexo do que nos metais e semicondutores inorgânicos. Estes mecanismos envolvem o movimento de defeitos conformacionais tipo “sóliton” ou “pólaron”, que ocorrem nas ligações alternadas dos polı́meros conjugados e que não têm análogos nos materiais tradicionais. Outros polı́meros conjugados importantes com propriedades semicondutoras são a polianilina e o PPV, cujas estruturas quı́micas estão mostradas na Figura 10.35. A polianilina tem aparência semelhante aos plásticos usados nos filmes fotográficos. Ela foi um dos primeiros polı́meros a serem sintetizados. Sua fabricação é simples, de baixo custo, e ela é estável no ar. Ela tem propriedades fı́sico-quı́micas bem conhecidas, e pode ser sintetizada com impurezas controladas para produzir condutividades adequadas para diferentes aplicações. A Figura 10.35(b) mostra a estrutura quı́mica do poli-fenilenovinileno (PPV), outro polı́mero conjugado importante para a eletrônica. PPV é estável até temperaturas de 400◦C e tem propriedades mecânicas que permitem sua fabricação e processamento na forma de filmes finos, com espessuras na faixa 0,02-1 µm. Uma de suas propriedades mais 512 Materiais e Dispositivos Eletrônicos Figura 10.35: Estruturas quı́micas dos monômeros de dois polı́meros semicondutores importantes: (a) polianilina; (b) poli-fenilenovinileno (PPV). Em (b) as letras C e H indicativas dos átomos são omitidas para simplificar a notação. importantes para aplicação na eletrônica é a eletroluminescência. Semelhantemente ao que ocorre com semicondutores inorgânicos de gap direto, quando elétrons e buracos se encontram em PPV, a recombinação produz fótons com energia aproximadamente igual a Eg . Uma vantagem do PPV sobre muitos dos semicondutores inorgânicos é que ele produz luz no espectro visı́vel, com comprimento de onda que que pode ser sintonizado pela variação das distâncias das ligações quı́micas na cadeia. Além dos polı́meros não-convencionais, existe uma grande variedade de materiais orgânicos com propriedades de condutores elétricos. Alguns são até supercondutores em temperaturas muito baixas. Uma classe desses materiais que tem sido muito investigada é a dos sais de transferência de carga. Um desses sais mais estudados é o TTF-TCNQ, cuja unidade básica consiste de uma molécula de tetratiafulvaleno (TTF) ligada a uma molécula de tetracianoquinodimetano (TCNQ). Estas moléculas têm estrutura plana que se agregam uma sobre a outra, formando pilhas de moléculas, dispostas ao longo de folhas planas. Na ligação ocorre uma transferência de elétrons da molécula de TTF, chamada doadora, para a molécula de TCNQ, chamada de aceitadora. O entrelaçamento das funções de onda ao longo da pilha forma uma banda de condução parcialmente cheia com os elétrons provenientes da transferência de carga. Como resultado, a condutividade ao longo da pilha é razoavelmente alta, da ordem de 2 × 103 Ω−1 cm−1 , enquanto a condutividade ao longo dos planos é baixa, porque a interação entre as pilhas de moléculas é pequena. Por esta razão, o TTF-TCNQ tem condutividade predominantemente em uma dimensão. Outro material orgânico condutor importante é a hidroxiquinolina de Cap. 10 Outros Materiais Importantes para a Eletrônica 513 alumı́nio, conhecida por AQ. Ele pertence a uma classe de compostos conhecidos como de molécula pequena, porque ela contém um número de átomos muito menor que na maioria dos compostos orgânicos. Sua molécula é formada por um grupo AO3 N3 , cercado por seis anéis de benzeno, alguns incompletos. O AQ é preparado na forma de pequenos cristais, dispostos em camadas, apresentando propriedades de condução e de eletroluminescência semelhantes as do PPV. Uma das vantagens dos materiais orgânicos sobre os inorgânicos é que eles podem ser depositados na forma de filmes com estrutura ordenada sobre uma grande variedade de substratos. A fabricação de dispositivos com materiais orgânicos tem baixo custo e pode ser feita sobre lâminas de substratos poliméricos, que podem ser enroladas e utilizadas em aplicações inusitadas. Uma desvantagem dos materiais orgânicos é a baixa mobilidade dos elétrons. Ela é da ordem de 1 cm2 /Vs nos melhores filmes orgânicos, que é muito baixa em comparação com os valores 103 −106 cm2 /Vs caracterı́sticos dos semicondutores inorgânicos. Isto resulta em baixa velocidade de resposta dos dispositivos de condutores orgânicos. Os dispositivos eletrônicos de maior aplicação dos condutores orgânicos são os sensores bioquı́micos, o transistor de filmes poliméricos finos e o diodo emissor de luz orgânico - OLED. O transistor de polı́mero tem baixa rapidez de resposta comparada com os de silı́cio. Por esta razão, sua utilização é restrita a aplicações de baixas freqüências, como é o caso de monitores de vı́deo. Uma aplicação de grande potencial é em telas de cristal lı́quido de matriz ativa, nas quais cada pixel é ativado por um transistor de polı́mero. A vantagem do transistor de polı́mero sobre o de silı́cio é seu menor custo de processamento e a facilidade de sua deposição direta sobre o cristal lı́quido. O dispositivo de material orgânico de maior importância comercial é o OLED (Organic Light Emitting Diode), empregado em mostradores ópticos e telas de imagens. A Figura 10.36 mostra a estrutura básica de um OLED. Ela consiste de um substrato de vidro ou outro material transparente, sobre o qual são depositados sucessivamente cinco filmes: um eletrodo metálico positivo ou anodo; três camadas de material orgânico condutor; e outro eletrodo metálico negativo. O eletrodo positivo é feito de um condutor transparente, como o ITO. O eletrodo negativo, ou catodo, é um filme metálico comum, como alumı́nio, que reflete luz visı́vel. Os materiais orgânicos mais usados entre os dois eletrodos são o PPV e o AQ, que com a adição de corantes emitem luz em qualquer comprimento de onda na faixa visı́vel. O filme que emite luz, feito de semicondutor intrı́nseco, está situado entre um filme dopado com impurezas doadoras e outro com impurezas aceitadoras, chamadas de camadas de transporte de elétrons e de buracos, respectivamente. 514 Materiais e Dispositivos Eletrônicos Figura 10.36: Estrutura básica de um diodo emissor de luz orgânico (OLED). Quando uma tensão é aplicada entre os eletrodos, no sentido mostrado na Figura 10.36, elétrons são injetados no filme do meio por uma camada, enquanto buracos são injetados pela outra camada. A recombinação dos elétrons e buracos produz luz que é refletida pelo filme de alumı́nio e sai frontalmente através da placa de vidro. Uma grande vantagem deste LED é exatamente o fato da luz sair frontalmente, em área extensa, em vez da emissão lateral confinada à região da junção, como ocorre nos diodos de semicondutores inorgânicos. Os OLEDs atuais de PPV ou de AQ operam com tensões da ordem de 10 volt e têm eficiência de conversão de 4%. Eles são empregados em telas planas de mostradores ópticos pequenos, usados em telefones celulares, câmaras digitais e aparelhos de vı́deo miniatura. Neste segmento eles venceram a corrida tecnológica contra os mostradores de cristais lı́quidos porque emitem luz diretamente, tendo maior brilho e maior ângulo de visão. 10.4 Materiais Supercondutores Materiais supercondutores são aqueles que apresentam resistência desprezı́vel à passagem de corrente elétrica. A supercondutividade só é observada em certos elementos ou ligas metálicas, a temperaturas abaixo de um valor crı́tico Tc . Este fenômeno foi descoberto em 1911 pelo fı́sico holandês Kamerlingh Onnes, que três anos antes havia conseguido liquefazer hélio. Ao fazer medidas da resistência elétrica de materiais em torno da temperatura de liquefação do hélio (4,2 K), ele observou que a resistência do mercúrio caia bruscamente para Cap. 10 Outros Materiais Importantes para a Eletrônica 515 valores desprezı́veis numa certa temperatura Tc ≃ 4, 2 K. Uma reprodução do gráfico original feito por Kamerlingh Onnes está mostrada na Fig.10.37. Nos anos seguintes Onnes descobriu que, mesmo em T < Tc , a supercondutividade era destruı́da e a resistência voltava ao normal, quando o material era submetido a um campo magnético de intensidade acima de um valor crı́tico Hc . Ele também observou que a supercondutividade era destruı́da com a passagem de uma corrente elétrica com densidade acima de um valor crı́tico Jc . A partir de então, inúmeros laboratórios e pesquisadores de todo o mundo passaram a investigar as propriedades elétricas e magnéticas de materiais, a procura de novos supercondutores com temperaturas crı́ticas mais elevadas. Por outro lado, fı́sicos teóricos passaram a buscar uma explicação para o fenômeno. Inicialmente descobriu-se que vários metais simples eram supercondutores, porém todos com baixos valores de Tc . O próprio Onnes observou a supercondutividade em chumbo (Pb) em 1913, com Tc = 7, 2 K. Em 1930 foi descoberto o metal simples com a maior temperatura crı́tica, nióbio (Nb) com Tc = 9, 2 K. Em seguida passou-se a investigar ligas e compostos intermetálicos, sendo descobertos vários compostos de Nb com temperaturas crı́ticas mais elevadas. Entretanto, até 1986, a maior temperatura crı́tica conhecida era Tc = 23,2 K, em Nb3 Ge. Naquele ano, Bednorz e Müller, pesquisadores do laboratório da IBM em Zurique, observaram supercondutividade em cerâmicas de LaBaCuO, com temperatura crı́tica próxima de 30 K. Este fato levou os pesquisadores a procurar a supercondutividade numa nova classe de mate- Figura 10.37: Variação da resistência elétrica de uma amostra de mercúrio com a temperatura, medida por Kamerlingh Onnes em 1911. Materiais e Dispositivos Eletrônicos 516 Figura 10.38: Variação da resistividade de Y1 Ba2 Cu3 O7 com a temperatura medida por Chu et al. [Physical Review Letters, 58, 908, 1987)]. riais ainda inexplorada. Logo no ano seguinte, o grupo de Paul Chu, em Houston, descobriu a supercondutividade em cerâmicas com fórmula quı́mica Y1 Ba2 Cu3 O7 , com Tc = 92 K. A Figura 10.38 mostra a medida da resistivi- Material Tc (K) Hc (kOe) λL (Å) ξ (Å) Elementos metálicos A Sn Pb Nb 1,1 3,9 7,2 9,5 0,1 0,3 0,8 2,0 160 340 370 400 16.000 2.300 830 380 Ligas e compostos binários Nb0,3 Ti0,7 Nb3 A Nb3 Sn Nb3 Ge 9,2 17,5 18,1 23,2 140 325 240 380 600 800 - 450 35 - Óxidos cuprosos de alta Tc YBa2 Cu3 O7 Bi2 Ca2 Sr2 Cu3 O10 T2 Ca2 Ba2 Cu3 O10 92 110 > 110 ∼1.500 ∼1.000 > 1.100 4.000 ∼6.000 ∼1.600 ∼10 ∼10 ∼13 Tabela 10.5: Parâmetros de alguns materiais supercondutores. Os valores de Hc , λL e ξ foram medidos em temperaturas próximas de 0 K. Os parâmetros dos óxidos cuprosos dependem das condições de preparação. Cap. 10 Outros Materiais Importantes para a Eletrônica 517 dade elétrica deste composto em função da temperatura, medida pela equipe de Chu. A importância da descoberta de Chu está no fato de que o YBaCuO foi o primeiro material a exibir supercondutividade a temperatura superior a 77 K. Esta é a temperatura de liquefação de nitrogênio, muito maior que a do hélio. Hélio e nitrogênio são os lı́quidos criogênicos mais utilizados para abaixar a temperatura de materiais. Como é muito mais fácil e mais econômico trabalhar com nitrogênio lı́quido do que com hélio lı́quido, a descoberta da supercondutividade em YBaCuO trouxe grande esperança de aplicação prática dos supercondutores. Desde 1987 vários outros óxidos cuprosos supercondutores foram sintetizados com temperaturas crı́ticas acima de 77 K. O material estável de maior Tc conhecido é T2 Ca2 Ba2 Cu3 O10 , que tem Tc = 125 K. Esses materiais são chamados supercondutores de alta T . A Tabela 10.5 apresenta as temperaturas crı́ticas, os campos crı́ticos e dois comprimentos importantes que serão explicados na seção 10.4.2, para materiais supercondutores de diversas classes. 10.4.1 Propriedades Magnéticas dos Supercondutores Os materiais supercondutores apresentam forte comportamento magnético em temperaturas abaixo de Tc . Isto foi primeiro observado por Meissner e Ochsenfeld, em 1933, que descobriram que os metais simples apresentam diamagnetismo perfeito em T < Tc . Eles observaram que quando um supercondutor é submetido a um campo magnético externo, o campo B é expulso do interior ao se diminuir a temperatura abaixo de Tc . Este fenômeno, ilustrado na Figura 10.39, é conhecido como efeito Meissner. Na realidade, este fenômeno só ocorre para campos de intensidade H < Hc , pois acima de Hc o material é normal em qualquer temperatura. Como = µ 0 (H +M ), no SI, o efeito Meissner significa que, em T < Tc e H < Hc , B = −H M (10.31) no interior do supercondutor. Esta magnetização não tem origem em dipolos magnéticos atômicos, como ocorre nos materiais magnéticos. Ela resulta de correntes macroscópicas, induzidas no supercondutor com a aplicação do campo magnético, chamadas supercorrentes. As supercorrentes são induzidas pelo efeito Faraday, e como a resistência do material é desprezı́vel, elas persistem durante um longo tempo (nos materiais puros elas podem durar 518 Materiais e Dispositivos Eletrônicos é Figura 10.39: Ilustração do efeito Meissner numa esfera supercondutora. O campo B expulso do interior da esfera em T < Tc . até milhares de anos). Devido à lei de Lenz, as supercorrentes têm o sentido de contrariar o campo, e por isto criam uma magnetização efetiva no sentido oposto ao de H. Na realidade, somente os supercondutores feitos de metais simples, têm magnetização dada por (10.31) em toda a região H < Hc . Esses materiais, chamados supercondutores tipo I, têm curva de M em função de H mostrada na Figura 10.40(a). Há uma outra classe de materiais, chamados su = −H somente para campos H menores percondutores tipo II, nos quais M que um valor Hc1 . Nestes materiais identificam-se dois campos crı́ticos, Hc1 e Hc2. O campo Hc2 é aquele acima do qual o material deixa de ser supercondutor, isto é, sua resistência é normal, enquanto Hc1 é o campo abaixo do qual o material é perfeitamente diamagnético. Nos supercondutores tipo II, a variação de M com H tem a forma mostrada na Figura 10.40(b). Assim, o comportamento magnético é caracterizado por três fases distintas: em H < Hc1 = −H); ocorre a fase Meissner, na qual o diamagnetismo é completo (M em H > Hc2 temos a fase normal, na qual M = 0; na região intermediária, Hc1 < H < Hc2 , ocorre a fase mixta, na qual o comportamento é mais complexo. Nesta fase o material é diamagnético, porém o diamagnetismo não é perfeito, isto é, |M| < |H| pois a expulsão do campo B do interior do material não é completa. Como mostrado na Figura 10.41, algumas linhas de indução permanecem no interior do material, agrupadas em feixes cilı́ndricos chamados fluxóides. Nas regiões filamentares atravessadas pelas linhas o material encontra-se na fase normal, enquanto no restante ele está na fase supercondu- Cap. 10 Outros Materiais Importantes para a Eletrônica 519 Figura 10.40: Variação da magnetização em função do campo magnético em materiais supercondutores: (a) Tipo I; (b) Tipo II. tora. Nas regiões supercondutoras existem supercorrentes circulando em torno dos filamentos, de modo a manter o campo dos fluxóides. Por esta razão, os filamentos onde existem os fluxóides também são chamados vórtices. Utilizando conceitos de mecânica quântica aplicada a supercondutores, é possı́vel mostrar que o fluxo magnético de cada fluxóide é dado por, Φ0 = h = 2, 067 × 10−7 gauss cm2 2e . (10.32) Assim, o fluxo magnético que atravessa o material é quantizado, sendo igual a um múltiplo de Φ0 . Figura 10.41: Comportamento do campo magnético em supercondutor tipo II nas três fases magnéticas. 520 Materiais e Dispositivos Eletrônicos Figura 10.42: Variação dos campos crı́ticos com a temperatura em supercondutores tı́picos: (a) Pb, tipo I; (b) Nb3 Sn, tipo II. Os supercondutores tipo I são os metais simples, formados por apenas um elemento. Como mostrado na Tabela 10.5, eles têm temperaturas crı́ticas abaixo de 10 K e campos crı́ticos de algumas centenas de Oersteds. Por outro lado, os compostos intermetálicos e os óxidos cuprosos são supercondutores tipo II, com temperatura crı́tica mais elevada. Neste caso, os campos crı́ticos apresentados na Tabela 10.5 são aqueles nos quais a supercondutividade é destruı́da, isto é, Hc2 . Vê-se que os campos crı́ticos nos supercondutores tipo II são muito maiores do que nos supercondutores tipo I. Esta é a principal razão pela qual os supercondutores tipo II são mais importantes tecnologicamente que os tipo I. Os valores de campo crı́tico apresentados na Tabela 10.5 são válidos para temperatura nula. Na realidade, os campos Hc , Hc1 e Hc2 variam com a temperatura. Quanto maior T , menor o valor do campo necessário para destruir a supercondutividade. Este fato está evidenciado na Figura 10.42, que mostra diagramas de fase para supercondutores tı́picos tipo I e tipo II. 10.4.2 A Fı́sica da Supercondutividade A supercondutividade dos materiais tornou-se um dos fenômenos fı́sicos mais intrigantes e desafiadores deste século. Desde sua descoberta casual em 1911, ela atraiu grande interesse por parte de fı́sicos experimentais e teóricos, na busca de novos materiais supercondutores e de explicações teóricas para os fenômenos observados. Em 1934 Hans e Fritz London anunciaram uma teoria Cap. 10 Outros Materiais Importantes para a Eletrônica 521 fenomenológica que explicava o efeito Meissner. Porém, foram necessárias mais duas décadas de trabalho até a formulação de uma teoria microscópica convincente, elaborada por Bardeen, Cooper e Schrieffer e anunciada em 1957. A teoria BCS, como é conhecida, explicava os fenômenos observados até então e parecia resolver todos os mistérios da supercondutividade. Entretanto, com a descoberta dos supercondutores de alta Tc , em 1986, verificou-se que a teoria BCS não explicava a supercondutividade desses materiais, que até o momento não têm uma teoria microscópica. Nesta seção apresentaremos o resultado mais importante da teoria de London e algumas noções sobre o mecanismo básico da teoria BCS. A teoria de London para o comportamento do campo magnético é baseada nas equações do eletromagnetismo e na propriedade básica de um supercondutor, qual seja, resistência nula. Considera-se que a corrente elétrica no material é formada por dois tipos de partı́culas: os elétrons normais, que sofrem espalhamento por impurezas ou por fônons, e as partı́culas supercondutoras, que não sofrem colisões. A componente da corrente das partı́culas supercondutoras é chamada supercorrente. A equação de movimento dessas partı́culas num campo elétrico E é dvs m = q E , (10.33) dt onde m, vs e q são respectivamente a massa, a velocidade e a carga das partı́culas supercondutoras. Sendo ns a concentração dessas partı́culas, a densidade de corrente J = ns qvs obtida de (10.33) satisfaz a seguinte equação; dJ ns q 2 = E . (10.34) dt m Substituindo esta expressão para o campo elétrico na equação de Maxwell (2.3) obtemos, ∂ ns q 2 B =0 . (10.35) ∇ × J + ∂t m = 0 não há Integrando esta equação no tempo e considerando que com B corrente no supercondutor, vem: ∇ × J + ns q 2 B=0 m . (10.36) Esta é a equação de London, que relaciona a corrente com o campo magnético num supercondutor. Para obter a equação do campo substituimos (10.36) na 522 Materiais e Dispositivos Eletrônicos equação de Maxwell (2.4). Considerando o campo estático (∂ D/∂t = 0) e a = µ0 H, válida para o campo microscópico, obtemos: relação B 2 + µ0 ns q B =0 ∇×∇×B m . (10.37) Utilizando conhecidas relações entre operadores diferenciais e a Eq.(2.2), num supercondutor, obtemos a equação que descreve a variação do campo B = ∇2 B onde λL = 1 B λ2L m µ0 ns q 2 (10.38) 1/2 (10.39) é o comprimento de London. A Tabela 10.5 apresenta os valores de λL para alguns supercondutores. Vamos utilizar a Eq.(10.38) para calcular a variação do campo magnético num supercondutor semi-infinito, com superfı́cie plana, ilustrado na Figura 10.43. Supomos que o campo é uniforme na parte externa, = ẑB0 . Como Bz só varia na direção x, x < 0, sendo paralelo à superfı́cie, B a Eq.(10.38) em x > 0 reduz-se a, d2 Bz (x) 1 = 2 Bz (x) 2 dx λL (10.40) Figura 10.43: Ilustração da variação do campo magnético num supercondutor. O campo é praticamente confinado numa camada superficial de espessura λL . Cap. 10 Outros Materiais Importantes para a Eletrônica 523 A solução desta equação é Bz (x) = C1 e−x/λL + C2 ex/λL . (10.41) Como o campo deve ser finito em x → ∞, é preciso que C2 = 0. Devido à continuidade na superfı́cie x = 0, C1 = B0 . Portanto, Bz (x) = B0 e−x/λL . (10.42) Assim, o campo externo aplicado ao supercondutor penetra apenas numa camada de espessura λL na superfı́cie, e decai exponencialmente tendendo a zero no interior. Como λL está na faixa 500-5000 Å, a camada é muito fina, de modo que o campo praticamente não penetra no interior. Este resultado explica o efeito Meissner. Enquanto a teoria de London é fenomenológica e baseada em equações clássicas, a teoria BCS que explica a resistência nula dos supercondutores é microscópica e inteiramente quântica. A compreensão da teoria BCS exige conhecimentos avançados de mecânica quântica e de mecânica estatı́stica, que estão além do nı́vel deste livro. Entretanto, algumas noções elementares do mecanismo da supercondutividade podem ser compreendidas qualitativamente. O primeiro conceito importante da teoria BCS é o de pares de Cooper. Em certas condições, numa rede cristalina, dois elétrons formando um par ligado têm energia menor do que teriam se estivessem independentes. Como os elétrons têm carga de mesmo sinal e portanto sofrem repulsão eletrostática, a formação de um par requer a existência de uma interação atrativa, proveniente de algum outro mecanismo. Utilizando a teoria quântica, Cooper mostrou em 1956, que a interação entre elétrons e fônons numa rede cristalina pode produzir uma interação atrativa entre elétrons e resultar na formação de pares. A Figura 10.44 ilustra como isto é possı́vel. Quando um elétron desloca-se numa rede cristalina em equilı́brio (T = 0 K), os ı́ons da rede ao seu redor são perturbados ligeiramente, devido à interação eletrostática. Assim, ao chegar num certo ponto, o elétron e1 atrai momentaneamente os ı́ons vizinhos. Isto produz uma onda de vibração da rede, ou seja, um fônon. Esta onda propaga na rede e pode produzir, em outro ponto, um deslocamento dos ı́ons no sentido de criar um potencial atrativo para outro elétron e2 . Se a energia deste par for menor que a dos dois elétrons independentes, eles formarão um estado ligado, chamado par de Cooper. O tamanho deste par é caracterizado por uma distância ξ, chamada comprimento de coerência. Como os elétrons que participam deste processo são aqueles que estão próximos da superfı́cie de Fermi, tendo 524 Materiais e Dispositivos Eletrônicos Figura 10.44: Ilustração da interação atrativa entre dois elétrons através da perturbação da rede cristalina. Este é o mecanismo básico para a formação dos pares de Cooper. velocidade vF , pode-se mostrar que o comprimento de coerência é dado por ξ= vF π∆ (10.43) onde ∆ é a redução de energia que um elétron sofre na formação do par de Cooper. ∆ é da ordem de alguns meV, que é a energia tı́pica de fônons. A Tabela 10.5 mostra os valores de ξ para alguns supercondutores. Vemos que nos materiais tradicionais, ξ é muito maior que a distância entre os vizinhos na rede. Isto significa que dois elétrons podem estabelecer uma interação atrativa e formar um par, tendo um grande número de ı́ons entre eles. Na realidade, esta visão do par de Cooper é extremamente simplificada. Como mencionado anteriormente, a interação entre elétrons através dos fônons é um fenômeno eminentemente quântico. Sua descrição é feita no espaço de momentum, e pode-se mostrar que os dois elétrons do par têm vetores de onda opostos, k e −k, assim como spins opostos. Os pares de Cooper, com carga q = −2e e massa m = 2me , são as partı́culas que produzem a supercorrente. Na supercorrente os pares de Cooper têm um movimento de deriva com caráter coletivo. Assim, enquanto os elétrons normais movem-se individualmente sofrendo colisões com fônons e com impurezas, os pares deslocam-se coletivamente, sem colisões. Portanto, o estado supercondutor resulta do ordenamento dos elétrons de condução em pares que se formam para diminuir a energia total do sistema. O estado supercondutor pode ser destruı́do por um aumento da temperatura, ou pela aplicação de um campo magnético. A energia térmica resultante do aumento de temperatura faz a energia efetiva de ligação do par diminuir Cap. 10 Outros Materiais Importantes para a Eletrônica 525 Eg (T) Tc T Figura 10.45: Variação da energia de ligação de um par de Cooper com a temperatura. com T , como mostrado na Figura 10.45. Note a semelhança qualitativa entre esta figura e a da variação da magnetização num ferromagneto com a temperatura, Fig.9.4. Esta semelhança não é acidental. A energia de ligação é o parâmetro de ordem do supercondutor, e portanto tem certa analogia com a magnetização espontânea do ferromagneto. Em ambos os casos a energia térmica é igual à energia de ordenamento na temperatura crı́tica Tc , onde ocorre uma transição de fase. Abaixo desta temperatura a ordem predomina e se estabelece o fenômeno coletivo. A destruição da supercondutividade com a aplicação de um campo magnético acima de um valor crı́tico é explicada pela natureza dos elétrons nos pares de Cooper. Como foi mencionado, os dois elétrons do par têm spins opostos. Então, como o campo H tende a alinhar os spins em sua direção, o aumento de H pode produzir a quebra do par. Isto ocorre quando H ≥ Hc . É de se esperar então que o campo Hc varie com a temperatura de modo semelhante à energia de ligação. Esta é a razão da semelhança entre as Figuras 10.42 e 10.45. O comportamento magnético dos supercondutores, e portanto sua classificação como tipo I ou II, está diretamente associado à relação entre os dois comprimentos relevantes surgidos na teoria, λL e ξ. Os supercondutores tipo I têm ξ ≥ λL , porque eles devem ter a distância entre os elétrons dos pares de Cooper, e portanto a extensão espacial do estado supercondutor, maior que a distância caracterı́stica da variação do campo magnético. Veja que este é o caso dos metais simples A, Hg e Pb, cujos parâmetros estão na Tabela 526 Materiais e Dispositivos Eletrônicos 10.5. Por outro lado, os supercondutores tipo II têm ξ ≤ λL , porque neste caso o campo penetra no material em distâncias maiores que a extensão do estado supercondutor. Assim, o material é caracterizado por regiões normais, na forma de cilindros de raio ξ, atravessadas por linhas de campo, que são os vórtices. Este é o caso dos compostos binários e dos supercondutores de alta Tc , listados na Tabela 10.5. Note que apesar de ser um metal simples, Nb tem comportamento mais próximo de supercondutor tipo II. Para concluir esta seção, é importante mencionar que os mecanismos responsáveis pela supercondutividade dos materiais de alta Tc ainda estão sendo investigados. Sabe-se que a supercorrente é produzida por partı́culas de carga q = −2e, e portanto o estado supercondutor é formado por pares de elétrons, como nos materiais tradicionais. Entretanto, há várias evidências experimentais de que a formação de pares de elétrons não é mediada por fônons. Isto é compatı́vel com o fato desses materiais terem comprimento de coerência comparável com o parâmetro da rede, como mostra a Tabela 10.5. Nesta situação espera-se que a interação atrativa entre elétrons seja mediada por algum mecanismo de interação local, o que não é o caso das ondas de vibração da rede. Este mecanismo não foi, até o momento, identificado em todos os seus detalhes. 10.4.3 Junções com Supercondutores Nos Capı́tulos 5 e 6 foram apresentados vários tipos de junções de materiais distintos, envolvendo semicondutores, metais e isolantes. Em todos os casos o comportamento da corrente na junção em função da tensão aplicada é determinado pelas propriedades das partı́culas responsáveis pela corrente. Como nos supercondutores essas partı́culas são pares de elétrons, é de se esperar que as junções envolvendo estes materiais tenham propriedades diferentes daquelas estudadas anteriormente. Para analisar as junções com materiais supercondutores, é necessário inicialmente compreender certas propriedades dos elétrons de condução. Ao formar os pares de Cooper no estado supercondutor, a energia dos elétrons é reduzida de um valor ∆. Como os elétrons que formam pares são aqueles que estão próximos da superfı́cie de Fermi no espaço de momentum, esta redução produz uma abertura na curva de densidade de estados em torno da energia EF . A Figura 10.46 mostra a densidade de estados eletrônicos D(E) em função da energia num supercondutor. A linha tracejada representa D(E) no metal normal em T > Tc , como na Figura 4.10. Em T < Tc ocorre uma redução ∆ da Cap. 10 Outros Materiais Importantes para a Eletrônica 527 E EF Figura 10.46: Densidade de estados eletrônicos D(E) num supercondutor. Eg D(E) energia dos pares e um correspondente aumento ∆ na energia dos estados com E > EF , de modo que o gap de energia torna-se Eg = 2∆. Em T = 0 somente os estados com energia menor que EF − ∆ estão ocupados. Em T > 0, alguns elétrons têm energia térmica suficiente para passar para o ramo de cima da curva, quebrando os pares de Cooper correspondentes. Consideremos agora uma junção NIS formada por um metal normal (N), separado de um supercondutor (S) por meio de uma fina camada isolante (I), como ilustrado na Figura 10.47(a). Se a camada de isolante tiver espessura da ordem de 100 Å ou maior, a barreira de potencial impede a passagem de elétrons do lado N para o lado S, e vice-versa. Entretanto, se a camada for suficientemente fina (∼ 10 − 20 Å), existirá uma probabilidade significativa para a passagem de elétrons de um lado para outro por meio do efeito túnel. Porém, para que isto ocorra é necessário haver estados ocupados, de um lado, e estados desocupados do outro lado, com a mesma energia. Como pode ser visto na Figura 10.47(b), isto não acontece no equilı́brio. É preciso então aplicar uma diferença de potencial V na junção, em qualquer dos dois sentidos, para fazer o diagrama de energia de um lado subir, ou descer, em relação ao outro, de um valor eV . Assim, somente quando V ≥ Eg /e a corrente de tunelamento I aumentará significativamente. A variação de I com V na junção NIS está mostrada na Figura 10.47(c). Outra junção importante é a SIS, formada por dois supercondutores separados por uma fina camada isolante. Neste caso, se o material supercondutor for o mesmo nos dois lados, o diagrama de energia terá a forma mostrada na Figura 10.48(a). Para ocorrer passagem de elétrons isolados de um lado para outro é preciso haver estados ocupados num lado, com mesma energia de es- 528 Materiais e Dispositivos Eletrônicos Figura 10.47: Junção NIS: (a) modelo unidimensional; (b) diagramas de energia no metal e no supercondutor; (c) caracterı́stica I − V da junção. tados desocupados no outro. Assim, quando a diferença de potencial aplicada à junção é V ≥ Eg /e, há corrente de tunelamento de elétrons isolados, como indicado na Figura 10.48(b). Entretanto, mesmo com V = 0, existe uma corrente de valor máximo I0 , produzida pelo tunelamento de pares de Cooper. Este fenômeno é chamado o efeito Josephson dc, em homenagem ao fı́sico britânico Brian Josephson, que o previu teoricamente em 1962 na sua tese de doutorado. A corrente em V = 0 é de natureza quântica, e pode fluir em qualquer dos dois sentidos. Seu valor depende da defasagem entre as funções de onda do estado supercondutor nos dois lados. A junção SIS também é conhecida como junção Josephson. Na junção SIS ocorre um outro fenômeno importante, chamado efeito Josephson ac. A aplicação de uma tensão contı́nua V na junção produz uma corrente alternada, com freqüência ν= V 2e V = h Φ0 (10.44) onde Φ0 é o quantum de fluxo magnético, dado por (10.32). Este fenômeno, também de natureza quântica, resulta em uma oscilação na corrente de pares de Cooper proveniente da variação da fase da função de onda de um lado da Cap. 10 Outros Materiais Importantes para a Eletrônica 529 Figura 10.48: Junção supercondutor-isolante-supercondutor: (a) diagrama de energia; (b) caracterı́stica I-V, mostrando o efeito Josephson dc em V=0. junção em relação ao outro. Para V = 0,1 mV, a freqüência dada por (10.44) é 48,36 GHz, que está situada na região de microondas. 10.4.4 Aplicações As aplicações tecnológicas mais importantes dos materiais supercondutores no momento estão concentradas em equipamentos que utilizam campos magnéticos intensos. Estes campos são criados por bobinas feitas de fios supercondutores com um grande número de espiras. Como a resistência do fio é muito pequena, ele pode ser percorrido por uma corrente elevada para gerar um campo intenso, sem muito aquecimento. As bobinas supercondutoras são utilizadas em eletromagnetos de laboratórios, em equipamentos médicos de tomografia por ressonância nuclear magnética e em motores e geradores elétricos especiais de grande potência. Em geral elas são feitas com fios multifilamentares de Nb-Ti ou de Nb3 Sn que têm campos crı́ticos Hc2 de 150 e 240 kOe, respectivamente, e corrente crı́tica da ordem de 105 A/cm2 . As bobinas supercondutoras são feitas rotineiramente para campos na faixa 100-200 kOe. Elas operam mergulhadas num banho de hélio lı́quido, para manter a temperatura baixa e assegurar que o fio permaneça na fase supercondutora. Por esta razão, os equipamentos que usam bobinas supercondutoras são volumosos e de alto custo. Os supercondutores de alta Tc ainda não são utilizados nestas aplicações porque são quebradiços, e portanto de difı́cil manuseio para fazer enrolamentos. Além disso, na forma cerâmica eles não têm corrente crı́tica suficientemente elevada. 530 Materiais e Dispositivos Eletrônicos Os materiais supercondutores ainda não encontram aplicações significativas em dispositivos eletrônicos, onde sua principal limitação é a necessidade de operar em baixas temperaturas. Uma possı́vel aplicação potencial é em circuitos eletrônicos de altı́ssima integração, nos quais a redução das dimensões fı́sicas dos componentes limita a dissipação de energia térmica. Neste caso, a substituição dos filmes metálicos dos contatos e das interligações entre os componentes, por filmes supercondutores, possibilitaria maior redução no tamanho dos dispositivos. Em algumas situações a utilização de filmes supercondutores nesses dispositivos pode ser vantajosa, mesmo com a necessidade de mantê-los em baixa temperatura. As junções de supercondutores também têm aplicação potencial na eletrônica. A junção Josephson, com a caracterı́stica I − V da Figura 10.48, apresenta um comportamento com dois estados distintos de corrente: I ≃ 0 para V < Eg /e; I = 0 para V > Eg /e. Nas junções feitas com supercondutores tradicionais, o chaveamento de um estado para o outro é muito rápido, com intervalos de tempo de picosegundo (10−12 s), e com dissipação de potência da ordem de pW. Estas caracterı́sticas tornam as junções Josephson muito atrativas para aplicações digitais, em circuitos lógicos e em memórias de computadores rápidos. Novamente, a maior dificuldade desta tecnologia é a necessidade de operação em baixas temperaturas. O efeito Josephson ac encontra uma aplicação importante em metrologia. O padrão tradicional de diferença de potencial é uma bateria eletroquı́mica, conhecida como célula de Weston. Esta célula tem tensão de 1,018 V e estabilidade da ordem de 1 ppm. Através do efeito Josephson ac é possı́vel converter tensão em freqüência, e vice-versa, com grande precisão na medida de freqüência. Isto possibilita a construção de um padrão de tensão com precisão e estabilidade cerca de 100 vezes maiores que na célula de Weston. Finalmente, outra aplicação atual das junções Josephson é nos dispositivos conhecidos como SQUID, palavra formada pelas letras iniciais de Superconducting Quantum Interference Device. O dispositivo SQUID é formado por duas junções Josephson em paralelo, como ilustrado na Figura 10.49. A corrente I que entra no dispositivo é dividida em duas componentes, que atravessam as duas junções Josephson na forma de correntes de pares de elétrons. Neste caso, pode-se mostrar que a dependência de cada corrente nas fases das funções de onda nos dois lados resulta numa corrente que varia com o fluxo magnético Φ que atravessa o contorno do circuito, na forma Φ (10.45) I = I0 cos π Φ0 Cap. 10 Outros Materiais Importantes para a Eletrônica 531 Figura 10.49: Dispositivo SQUID: (a) esquema da ligação das junções Josephson; (b) Variação da corrente com o fluxo magnético que atravessa o dispositivo. onde Φ0 é o quantum de fluxo dado por (10.32). Este resultado mostra que quando o SQUID é submetido a um campo magnético, a corrente varia periodicamente, passando por máximos consecutivos à medida que o fluxo passa por múltiplos do quantum Φ0 . Então, por meio de um circuito contador digital pode-se contar o número de máximos que a corrente atravessa e assim determinar o fluxo final. Vemos pela Eq.(10.45) que se o circuito tiver área 1 cm2 , o campo correspondente a um quantum Φ0 será B ≃ 2 × 10−7 gauss. Este valor extremamente pequeno (o campo magnético da Terra é cerca de 0,5 gauss) possibilita que o SQUID seja usado para medir campos magnéticos com grande sensibilidade e precisão. Os magnetômetros de SQUID são utilizados rotineiramente em equipamentos cientı́ficos, médicos e industriais. REFERÊNCIAS P.J. Collings, Liquid Crystals, Princeton University Press, Princeton, 1990. M. Cyrot and D. Pavuna, Introduction to Superconductivity and High-Tc Materials, World Scientific, Singapore, 1992. R. Dalven, Introduction to Applied Solid State Physics, Plenum Press, New York, 1996. R.E. Hummel, Electronic Properties of Materials, Springer-Verlag, Berlin, 2001. I.C. Khoo, Liquid Crystals, J. Wiley, New York, 1995. 532 Materiais e Dispositivos Eletrônicos D. Jiles, Electronic Properties of Materials, Chapman & Hall, London, 1994. C. Kittel, Introduction to Solid State Physics, J. Wiley, New York, 1996. M.E. Lines and A.M. Glass, Principles and Applications of Ferroelectrics and Related Materials, Claredon Press, Oxford, 1977. Y.A. Ono, Electroluminescent Displays, World Scientific, Singapore, 1995. C.Z. Rosen, B.V. Hiremath and R. Newnham, eds., Piezoelectricity, American Institute of Physics, New York, 1992. G.M. Sessler, ed., Electrets-Topics in Applied Physics, Springer-Verlag, Berlin, 1983. L. Solymar and D. Walsh, Lectures on the Electrical Properties of Materials, Oxford University Press, Oxford, 1993. R. Syms and J. Cozens, Optical Guided Waves and Devices, Mc Graw-Hill, New York, 1992. A. Yariv, Quantum Electronics, J. Wiley, New York, 1989. PROBLEMAS 10.1 Um capacitor de placas paralelas com um isolante de óxido de tântalo de espessura 1 µm tem capacitância C = 1µF: a) Calcule a tensão máxima de operação do capacitor; b) Calcule a densidade de carga livre e a densidade de carga de polarização quando a tensão aplicada é 10 V. 10.2 Dez discos de PZT de espessura 1 mm são empilhados para formar um microposicionador. Os discos são colocados um sobre o outro, com polaridades alternadas, e separadas por uma lâmina de cobre para aplicação da tensão. Os terminais das lâminas são interligados de modo que todos os discos são submetidos a mesma tensão externa, alternadamente, fazendo com que a expansão da pilha seja a soma das expansões dos discos. Calcule a variação do comprimento do microposicionador ao ser submetido a uma tensão de 100 V. 10.3 Calcule a espessura de uma placa de quartzo, no corte X, utilizada para estabilizar o oscilador do transmissor de uma estação de rádio de freqüência 720 kHz. 10.4 A célula unitária de BaTiO3 tem parâmetro de rede a ≃ 4 Å e momento de dipolo elétrico p ≃ 1, 66×10−29 Cm devido a um pequeno deslocamento espontâneo dos ı́ons Ti4+ . Estime o valor da constante piezoelétrica deste material e compare com o dado da Tabela 10.2. Cap. 10 Outros Materiais Importantes para a Eletrônica 533 10.5 Mostre que num modulador eletro-óptico tipo Mach-Zehnder, a transmissão é dada pela Equação (10.29). 10.6 Um modulador eletro-óptico tipo Mach-Zehnder com guia de Ti:LiNbO3 tem eletrodos com comprimento 5 mm e distantes 5 µm um do outro. Calcule a tensão necessária para produzir o corte numa modulação tipo on/off. 10.7 Num lı́quido isotrópico, as moléculas podem assumir qualquer direção no espaço com igual probabilidade. Mostre que a integral em três dimensões do fator angular da Eq.10.30 é nula nesta situação. 10.8 No estado de vórtices de um supercondutor, cada vórtice tem um fluxo Φ0 . Calcule o número de vórtices por cm2 num material quando o campo magnético que o atravessa é 50 kgauss. 10.9 Calcule o comprimento de London para um metal simples com ns = 1023 /cm3 , m = 2me e q = −2e e compare com os dados da Tabela 10.5. 10.10 Qual a tensão necessária para produzir oscilação com freqüência 100 GHz numa junção Josephson? 10.11 Um magnetômetro SQUID tem um detetor com área 2 cm2 . Qual é, em gauss, a menor variação no campo magnético que pode ser medida pelo magnetômetro? 534 Materiais e Dispositivos Eletrônicos Apêndice A 535 Apêndice A Teoria de Perturbação: Cálculo da Probabilidade de Transição Neste apêndice apresentamos o cálculo da probabilidade de transição, por unidade de tempo, para que um sistema quântico, inicialmente num estado n, passe para outro estado m. O cálculo é baseado na teoria de perturbação dependente do tempo, estudada na Seção 8.3.1. Como mostrado naquela seção, o estado quântico de um sistema com Hamiltoniano H = H0 + H (t) é descrito por uma função de onda Ψ(t), que pode ser expandida como em (8.48) Ψ(t) = an (t)ψn e−iEn t/ , (A.1) n onde ψn são as autofunções da parte constante H0 do Hamiltoniano, com energias En . Sendo as funções de onda ψn conhecidas, para determinar a evolução do sistema submetido a uma excitação variável no tempo H (t) = H exp(−iωt), é preciso obter os coeficientes an (t). O ponto de partida é a Eq.(8.51) dam 1 = an (t)Hmn ei(ωmn −ω)t , (A.2) dt i n onde ωmn = (Em −En )/. Note que este resultado é exato, pois nenhuma aproximação foi feita até o momento. O problema é que a Eq.(A.2) não pode ser resolvida analiticamente de maneira exata. Para resolvê-la aproximadamente, empregamos teoria de perturbação. Para isto consideramos que o Hamiltoniano de excitação no tempo é pequeno comparado com o estático, isto é, H0 . Assim, os coeficientes an (t) podem ser expandidos em série de H potências (1) (2) an = a(0) , (A.3) n + an + an + · · · onde an é o valor que an teria se H = 0, an é o termo de primeira ordem (2) em H , an é o termo de segunda ordem, etc. (0) (1) Materiais e Dispositivos Eletrônicos 536 Substituindo (A.3) em (A.2) vem: 1 (0) (1) (2) (1) (2) = ȧ + ȧ + · · · = + a + a + · · · Hmn ei(ωmn −ω)t a ȧ(0) m m m n n n i n . (A.4) Igualando os termos de mesma ordem nos lados direito e esquerdo desta equação vem: ȧ(0) m = 0 ȧ(1) m = − i (0) a H (t) ei(ωmn −ω)t n n mn ȧ(2) m = − i (1) a H (t) ei(ωmn −ω)t n n mn .. . ȧ(s) m = − i (s−1) an Hmn (t) ei(ωmn −ω)t n . (A.5) (0) A solução de ordem zero é obtida da primeira equação, am = constante. Isto significa que se não houver perturbação, o sistema permanecerá no estado estacionário em que estiver sido colocado inicialmente. Supondo que ele esteja inicialmente no estado n temos a(0) = 1 n a(0) = 0 m , m=n . (A.6) A solução de primeira ordem é obtida da segunda equação em (A.5), que pode ser escrita na forma, i = − Hmn ei(ωmn −ω)t ȧ(1) m . (A.7) Vamos considerar agora que a excitação do sistema é ligada apenas em t = 0, isto é, H = 0 para t < 0. A integração de (A.7) leva à t i (1) ei(ωmn −ω)t dt am (t) = − Hmn 0 Apêndice A = −i−1 Hmn 537 ei(ωmn −ω)t − 1 ωmn − ω . (A.8) Sendo Ψm Ψ∗m a densidade de probabilidade de encontrar o sistema no estado m, pode-se ver que a probabilidade do sistema sofrer transição do estado n para o estado m é dada por, 2 |a(1) m | = |2 sen2 [ 12 (ωmn − ω)t] 4|Hmn 2 (ωmn − ω)2 . (A.9) Como sabemos que a largura de linha de transição não é nula, vamos considerar que n e m são na realidade dois grupos de estados. Assim, a probabilidade do sistema ser encontrado no grupo de estados m é, 4 +∞ 2 sen2 [ 12 (ωmn − ω)t] (1) 2 |Hmn | D(ωmn ) dωmn , (A.10) |am | = 2 −∞ (ωmn − ω)2 onde D(ωmn ) é a densidade de estados associada aos dois grupos de estados m e n. Note que a função de ωmn entre os colchetes tem valor t2 /4 para ωmn = ω. Quando ωmn se afasta de ω, ela oscila com uma amplitude decrescente devido ao aumento do denominador. É fácil ver que a largura de linha desta função em torno de ωmn = ω é da ordem de 2π/t. Então, após um tempo t relativamente grande, a função entre os colchetes tem largura pequena na região ωmn ≃ ω. Assim, a densidade de estados pode ser considerada aproximadamente constante D(ωmn = ω) nesta região, podendo ser retirada da integral. Usando a integral definida +∞ πt sen2 (xt/2) , (A.11) dx = 2 x 2 −∞ obtemos 2 |a(1) m | = 2π|Hmn |2 D(ωmn = ω)t 2 . (A.12) Portanto, a probabilidade por unidade de tempo do sistema passar do (1) grupo de estados n para o grupo de estados m é dada por |am |2 /t, ou Wn→m = 2π 2 |H | D(Em = En + ω) mn , (A.13) onde D(E)dE = D(ω)dω é o número de estados com energia entre E e E +dE. Este resultado é chamado regra de ouro, Eq.(8.53). 538 Materiais e Dispositivos Eletrônicos Apêndice B Constantes Fı́sicas e Tabela de Conversão de Energia Constantes Fı́sicas Grandeza Massa do elétron Carga do elétron (em módulo) Constante de Planck Velocidade da luz Massa do próton Constante de Boltzmann Permissividade de vácuo Sı́mbolo Valor CGS SI m0 e 9,10956 1,60219 4,80325 6,62620 1,05459 2,99792 1,67261 1,38062 - 10−28 g 10−10 esu 10−27 erg.s 10−27 erg.s 1010 cm/s 10−24 g 10−16 erg/K 1 10−31 kg 10−19 C - 1 h = h/2π c Mp kB 0 Permeabilidade de vácuo µ0 10−34 J.s 10−34 J.s 108 m/s 10−27 g 10−23 J/K 107 /4πc2 = 8, 85 × 10−12 C2 /Nm2 4π × 10−7 Tabela de Conversão de Unidades de Energia/Freqüência Hz cm−1 eV J K Oe∗ 1 Hz cm 1 29,979×109 2,4180×1014 1,5092×1033 20,836×109 2,80×106 3,3357×10−11 1 8,0655×103 5,0341×1022 0,69502 9,3399×10−5 eV 4,1357×10−15 1,2398×10−4 1 6,2414×1018 8,6170×10−5 1,1580×10−8 J 6,6262×10−34 1,9865×10−23 1,6022×10−19 1 1,3806×10−23 1,8554×10−27 K Oe 4,7994×10−11 1,4388 1,1605×104 7,2431×1022 1 1,3438×10−4 3,5714×10−7 1,0707×104 8,6355×107 5,3898×1026 7,4413×103 1 Para converter o valor de uma grandeza expressa na unidade da coluna à esquerda, para a unidade correspondente a uma das colunas, multiplique pelo valor da linha e coluna correspondentes. ∗ Calculado com γ = 2, 8 MHz/Oe 540 Materiais e Dispositivos Eletrônicos Apêndice C Tabela Periódica dos Elementos Índice Analı́tico teorema de, 95 Bloembergen, N., 4 Bohr, 56 Boltzmann, 312, 397 Brattain W., 2, 218 Brockhouse, B.N., 4 Buraco, 100, 123 A Absorção óptica, 125, 308, 315 Acumulação de buracos, 253 Afinidade eletrônica, 188 Alferov, Z.I., 4, 359 Ampère, 385 lei de, 423 Amplificação, 217, 237 Amplificador óptico, 377 Anderson, P.W., 4, 386 Antiferromagnetismo, 389, 408 Átomo de hidrogênio, 73 Átomos de muitos elétrons, 84 Autofunção, 58 Autovalor, 58 Avalanche, 200 C Câmara CCD, 338 Campo, coercitivo, 415 crı́tico de cristal lı́quido, 504 crı́tico de supercondutor, 520 de desmagnetização, 432 médio, 84 molecular, 402, 406 Canal de JFET, 242 Capacitor, elétrico, 469 MOS, 251 CCD, 266, 338 CD, 378 Célula primitiva, 9 Célula solar, 336 Célula unitária, 8, 9 Centro de recombinação, 322 Cerâmica, 17 Chaveamento, 217, 237, 239 Chu, Paul, 516 Ciclo de histerese, ferroelétrico, 480 magnético, 415 Cinescópio, 495 Circuito integrado, 3, 271 Circulador de ferrite, 455 CMOS, 265 B Baibich, Mario, 440 Banda de, condução, 100 energia, 92, 95 valência, 100 Bardeen, J., 2, 4, 218, 521 Barreira de potencial, 69, 171 Barreira Schottky, 188 Base, comum, 220 corrente de, 222, 231 de transistor, 219 BCS, teoria, 521 Bednorz, G., 4, 515 Binning, G., 4 Birrefringência, 487 Bloch, função de, 96 541 542 Materiais e Dispositivos Eletrônicos Coeficiente, de absorção, 294 de amortecimento, 293 de difusão, 134, 154 extinção, 293, 314 Hall, 151 Coletor, corrente de, 221 de transistor, 219 Comprimento de, coerência, 523 difusão, 160 London, 522 onda, 30 penetração, 300 Comunicações ópticas, 372 Concentração de portadores, 126, 141 Condutores, 99 Conservação de, carga, 155 energia, 120 momentum, 121 Constante dielétrica, 291, 305, 314 Contato ôhmico, 149, 190 Continuidade de carga, equação de, 155 Cooper, L.N., 4, 521 Corrente crı́tica de, laser de semicondutor, 364 supercondutor, 529 Corrente de, condução, 110, 145 deriva, 110, 145 difusão, 152, 154 escuro, 331 saturação de JFET, 246 saturação reversa, 185 Cristal, 14 Cristal lı́quido, 20, 501 mostrador de, 503 Cristal, crescimento de, 15 Curie, Pierre, 400, 473 constante de, 399 lei de, 398 temperatura de, 400, 479 D DAC, 338 Davisson, Germer e Thomson, 47 de Broglie, Louis, 46 De Forest, Lee, 2 de Gennes, P., 4 Defasador, 490 Densidade de estados, 105, 129, 526 Diamagnetismo, 389 Difusão, equação da, 156, 160 Diodo, de barreira de Schottky, 198 de junção, 192 emissor de luz, 342 equação do, 184 Gunn, 207 túnel, 203, 204 válvula, 2 varactor, 202, 203 Zener, 201, 202 Dipolo, elétrico, 466 magnético, 387 Disco óptico, 378 Disco magnético, 426 Dispositivos eletro-ópticos, 489 Domı́nio, de dipolo, 209 magnéticos, 411 parede de, 412 Dreno de JFET, 241 Drude, modelo de, 299 DVD, 378 E Ebers-Moll, equações de, 235 Efeito, elasto-óptico, 485 eletro-óptico, 484 Faraday, 454 fotoelástico, 485 fotoelétrico, 41 Hall, 151 Josephson, 528 Kerr magneto-óptico, 438 Índice Analítico Efeito, Meissner, 517 pelicular, 300 Stark, 484 túnel, 71, 527 Zener, 200 Eficiência, de cabeça de gravação, 424 de injeção do emissor, 223 quântica, 324 Einstein, 42 relação de, 158 ELD, 498 Eletrônica, 1 Eletreto, 481 microfone de, 483 Eletroluminescência, 315, 494 Emissão, espontânea, 314, 348 estimulada, 349 Emissor, comum, corrente de, 236, 238 corrente de, 220 de transistor, 219 Energia de, elétron, 46, 63, 94, 104, 110 fóton, 43 Fermi, 99 impureza, 136 Epitaxia de, fase lı́quida (LPE), 17 feixe molecular (MBE), 22 Esaki, L., 4 Estado, estacionário, 62 fundamental, 67, 76, 78 F Faixa proibida, 97 Faraday, 385 lei de, 434 rotação de, 449 Fator, de amplificação, 223 de Landé, 395 de transferência de corrente, 223 543 Fator, de transporte da base, 222 giromagnético, 443 Fermi, nı́vel ou energia de, 99, 103, 105, 139 superfı́cie de, 106 velocidade de, 107, 114 vetor de onda de, 106 Fermi-Dirac, distribuição de, 104 Fermi-Dirac, distribuição de, 103 Ferrimagnetismo, 389, 408 Ferrite, 408 dispositivos de, 452 Ferromagnetismo, 389, 400 Fibra óptica, 373 Filme fino, 21 Filtro de YIG, 456 Fı́sica da Matéria Condensada, 3 Fı́sica do Estado Sólido, 3 Fluorescência, 494 Fluxóide, 518 Fluxo magnético, 387 Fonte de JFET, 241 Forma de linha, 305 Lorentziana, 306, 311 Fônon, 51 Fosforescência, 494 Fósforo, 495 Fóton, 43 Fotônica, 290, 377 Foto-resistor, 326 Fotocondutividade, 326 Fotocondutivo, modo, 331 Fotodetetor, 323 Fotodiodo, 330 de avalanche, 335 Fotoelétron, 41 Fotolitografia, 170 Fotoluminescência, 315 Fototransistor, 335 Fotovoltaico, modo, 331 Freqüência de plasma, 301 Função de onda, 48, 57 Função trabalho, 44, 187 544 Materiais e Dispositivos Eletrônicos G Gap, de energia, 100, 118 direto, 121 indireto, 122 Giaever, I., 4 Gravação magnética, 425 cabeça de, 427 de áudio, 428 de vı́deo, 429 digital, 429 materiais para, 435 Gravação magneto-óptica, 439 Gross, Bernard, 482 Gunn, J.B., 207 H Hall, E.H., 151 Hartree, D.R., 84 Heeger, A., 4, 507 Heisenberg, 45, 49, 56, 404 HEMT, 250 Henry, 386 Hertz, 40 Heterojunção, 186 de semicondutor, 190 Homojunção, 186 Hund, regra de, 392 I Ímã permanente, 386, 437 Implantação iônica, 135 Impureza, 135, 139 aceitadora, 137 doadora, 137 Índice de refração, 30, 291 Índices de Miller, 9 Injeção de, buracos, 159, 181, 225 elétrons, 158 portadores, 158 Interação de intercâmbio, 404 Interação radiação-matéria, 290, 298 Interferômetro Mach-Zehnder, 491 Inversão, de população, 349 em capacitor MOS, 251 Isolador, de ferrite, 453 magneto-óptico, 454 Isolantes, 99 J JFET, 241 Josephson, B., 4, 528 Junção, de supercondutores, 526 Josephson, 528 metal-semicondutor, 188 Junção p-n, 168 em equilı́brio, 175 polarizada, 180 K Kamerlingh Onnes, 514 Kaptisa, P., 4 Kilby, Jack, 4, 272 Kittel, 421 Kroemer, H., 4, 359 L Largura de linha, 306, 448 Laser, 348 a gás, 357 de argônio, 358 de CO2 , 359 de diodo semicondutor, 359 de He-Ne, 358 de heterojunções, 363 de Nd-YAG, 354 de poço quântico, 368 de rubi, 353 de sólidos com impurezas, 353 de Ti:safira, 356 Laughlin, R.B., 4 LCD, 503 LDR, 326 LED, 343 orgânico, 513 Índice Analítico Lee, D.M., 4 Lei de ação das massas, 140 Ligação covalente, 7 Ligação molecular, 7 Ligações atômicas, 5 Livre caminho médio, 114, 153 London, comprimento de, 522 Hans e Fritz, 520 teoria de, 521 Lorentz, 303 Lorentziana, função, 306 Luminescência, 315, 318, 343, 493 M MacDiarmid, A., 4, 508 Magnetismo, 385 Magnetização, 387 de saturação, 399 espontânea, 400 remanente, 415 Magneto-eletrônica, 440 Magneto-resistência gigante, 439 Magneton de Bohr, 394 Mascarenhas, Sergio, 482 Massa efetiva, 102, 103, 122, 124 Materiais, amorfos, 17 cerâmicos, 17 cristalinos, 8, 14 de alta permeabilidade, 422 dielétricos, 466 eletroluminescentes, 494 ferroelétricos, 475, 479 fosforescentes, 494 fotoluminescentes, 494 magnéticos, 400 ópticos não-lineares, 487 orgânicos, 19, 507 piezoelétricos, 473 policristalinos, 17 supercondutores, 514 Maxwell, equações de, 28 Mecânica quântica, 56 Memória, de semicondutor, 277 magnética, 437 Memória, óptica, 378 MESFET, 248 Metais, 7 Microeletrônica, 272 Microprocessadores, 3 Microscópio eletrônico, 47 Millikan, 41 MIS, 339 Mobilidade, 146, 148 Mode locking, 355 Modulador eletro-óptico, 490 Momento de, dipolo elétrico, 466 magnético, 387 magnético de átomos e ı́ons, 394 Momentum de, elétron, 46, 57, 64 fóton, 44 Monocristal, 14 Moore, lei de, 272 MOSFET, 241 Mott, N.F., 4 Müller, K.A., 4, 515 Multicamada magnética, 23 N Nanociência e nanotecnologia, 272 Néel, Louis, 386 Neutralidade de cargas, 141 Newton, 289 Número quântico, 66, 75 O Oersted, 385 OLED, 513 Onda, de elétron, 50 elástica, 34, 36 eletromagnética, 28, 291 em ferrites, 448 equação de, 29 Operador quântico, 57, 59 Opto-Eletrônica, 290 Orbital, 81 Oscilador harmônico, 71 545 546 Materiais e Dispositivos Eletrônicos Osheroff, D.D., 4 P Par de Cooper, 523 Par elétron-buraco, 125 Paramagnetismo, 389, 396 de Pauli, 396 Parâmetro, da rede, 9 de ordem, 503, 525 do transistor, 233 Pauli, princı́pio de exclusão, 85 PDP, 500 Permissividade elétrica, 29, 467 magnética, 29 relativa, 291, 467 Piezoeletricidade, 473 Planck, 42, 56 Polarização, 466 espontânea, 479 Policristal, 18 Ponto de operação, 238 Polı́meros, 19 condutores, 507 Porta de JFET, 241 Porta isolada em MOSFET, 251 Portadores, majoritários, 141, 189 minoritários, 141, 185, 189 Potencial de contato, 173 retardo, 42 Poulsen, Valdemar, 426 Princı́pio da incerteza, 46, 49 Princı́pio do balanceamento detalhado, 126 Probabilidade de transição, 313, 316 Q Q-switching, 355, 356 R Raio iônico, 13 Recombinação de pares, 126 centros de, 322 Rede cristalina, 8, 9 Refletividade óptica, 296 Região de, carga espacial, 171 depleção, 171, 175 transição, 171 Regra de, Hund, 392 ouro, 311, 536 seleção, 84 Relação de dispersão de, elétron, 63, 94 onda elástica, 38 onda eletromagnética, 31, 32 Resistência negativa, 205 Responsividade, 333 Ressonância ferromagnética, 447 Reta de carga, 238 Retificador, 196 controlado de silı́cio, 267 Richardson, R.C., 4 Ripper Filho, José, 359, 366 Rohrer, H., 4 Ruska, E., 4 S SAW, dispositivo, 477 Schawlow, A.L., 4, 348 Schottky, W., 188, 198 Schrieffer, J.R., 4, 521 Schroedinger, 45, 56 equação de, 60, 62 SCR, 267 Semicondutor, 101, 118 de gap direto, 121 de gap indireto, 122 degenerado, 143, 204 dopado, 135 extrı́nseco, 118, 135 intrı́nseco, 118 tipo n, 135 tipo p, 135 Sensor de imagem, 338 Shirakawa, H., 4, 508 Shockley, W., 2, 184, 218 Shull, C.G., 4 Siegbahn, K.M., 4 Índice Analítico Sólidos iônicos, 6 Spin, 81, 391 momento magnético de, 392 Spintrônica, 440 Sputtering, 24 SQUID, 530 Stormer, H.L., 4 Substrato, 21, 169 Supercondutor, 514 de alta Tc , 517 tipo I, 518 tipo II, 518 Supercorrente, 517, 521 Susceptibilidade, dinâmica de ferrite, 445 elétrica, 467 magnética, 388 T Tabela periódica dos elementos, 85 Tela, de cinescópio, 495 de cristal lı́quido, 506 de material orgânico, 513 de plasma, 500 eletroluminescente, 498 Temperatura crı́tica de cristal lı́quido, 503 crı́tica de supercondutor, 514, 525 de Curie, 400, 479 Tempo de, colisão, 111 decaimento, 482 recombinação, 159 Tensão crı́tica de inversão de MOSFET, 257 Teoria de perturbação, 82, 312, 535 Tiristor, 267 Townes, C.H., 348 Transição, de dipolo elétrico, 314 não-radiativa, 315 radiativa, 314 Transistor, 3, 218 bipolar, 219 bipolar de junção, 218 de efeito de campo, 218, 241 Transistor, HEMT, 250 MESFET, 248 MOSFET, 251, 264, 265 TRIAC, 270 Triodo, válvula, 2, 217 Tsui, D.C., 4 Tubo de raios catódicos, 495 V Valor esperado, 59 Válvula de spin, 440 Van Vleck, J.H., 4, 386 Varactor, 203 Velocidade de, deriva, 111 fase, 30 Fermi, 107 grupo, 34 Vetor de, onda, 30 Poynting, 293 Vibração de rede, 36 VLSI, 265 von Klitzing, K., 4, 151 Vórtice, 519 W WDM, 377 Weiss, Pierre, 402 Wilson, K.G., 4 Z Zona de Brillouin, 38, 96, 97 547