Análise Real volume 2 Funções de n Variáveis Lima, Elon Lages Análise real, v.2 / Elon Lages Lima. 1 ed. Rio de Janeiro : IMPA, 2014. 202 p. : il. ; 23 cm. (Coleção matemática universitária) Inclui bibliografia. e-ISBN 978-85-244-0381-1 1. Análise Matemática. I. Título. II. Série. CDD-517 COLEÇÃO MATEMÁTICA UNIVERSITÁRIA Análise Real volume 2 Funções de n Variáveis Elon Lages Lima INSTITUTO NACIONAL DE MATEMÁTICA PURA E APLICADA Copyright 2014 by Elon Lages Lima Impresso no Brasil / Printed in Brazil Capa: Rodolfo Capeto, Noni Geiger e Sérgio R. Vaz Coleção Matemática Universitária Comissão Editorial: Elon Lages Lima S. Collier Coutinho Paulo Sad Títulos Publicados: • Análise Real, vol. 1: Funções de uma Variável – Elon Lages Lima • EDP. Um Curso de Graduação – Valéria Iório • Curso de Álgebra, Volume 1 – Abramo Hefez • Álgebra Linear – Elon Lages Lima • Introdução às Curvas Algébricas Planas – Israel Vainsencher • Equações Diferenciais Aplicadas – Djairo G. de Figueiredo e Aloisio Freiria Neves • Geometria Diferencial – Paulo Ventura Araújo • Introdução à Teoria dos Números – José Plínio de Oliveira Santos • Cálculo em uma Variável Complexa – Marcio G. Soares • Geometria Analítica e Álgebra Linear – Elon Lages Lima • Números Primos: Mistérios e Recordes – Paulo Ribenboim • Análise no Espaço Rn – Elon Lages Lima • Análise Real, vol. 2: Funções de n Variáveis – Elon Lages Lima • Álgebra Exterior – Elon Lages Lima • Equações Diferenciais Ordinárias – Claus Ivo Doering e Artur Oscar Lopes • Análise Real, vol. 3: Análise Vetorial – Elon Lages Lima • Álgebra Linear. Exercícios e Soluções – Ralph Costa Teixeira • Números Primos. Velhos Mistérios e Novos Recordes – Paulo Ribenboim Distribuição: IMPA Estrada Dona Castorina, 110 22460-320 Rio de Janeiro, RJ e-mail: ddic@impa.br http://www.impa.br Prefácio Este segundo volume do livro “Análise Real” trata das funções de n variáveis. Sua leitura pressupõe, naturalmente, conhecimento das noções básicas sobre funções de uma variável, conforme estão apresentadas no primeiro volume, ou em algum texto equivalente. Além disso, é conveniente que o leitor tenha alguma familiaridade com os conceitos elementares da Álgebra Linear, tais como dependência linear, transformações lineares e suas matrizes, produto interno etc, a nı́vel de um curso introdutório. Como no seu antecessor, procuramos expor a matéria de modo que ela possa ser coberta num curso com a duração de um semestre letivo. Com isto em mente, procuramos seguir uma trajetória objetiva, visando os resultados mais relevantes, sem preocupação com a extrema generalidade. O objetivo principal do curso é o Cálculo Diferencial das aplicações de Rm (ou de um seu subconjunto) em Rn e das integrais múltiplas. Para atingi-lo, estudamos no capı́tulo inicial as funções contı́nuas f : X → Rn , definidas num subconjunto X ⊂ Rm e, para melhor entendê-las, analisamos as propriedades topológicas desses subconjuntos. Em seguida, consideramos dois casos particulares (e particularmente interessantes) do Cálculo que queremos estudar, a saber: os caminhos, que são aplicações contı́nuas f : I → Rn , definidas em intervalos I ⊂ R e as funções numéricas f : U → R, definidas em conjuntos U ⊂ Rm . Este segundo caso particular nos permite destacar o importante conceito de vetor gradiente, que ficaria diluı́do no contexto geral se não tivéssemos isolado o caso n = 1. Ainda no contexto de funções numéricas, tratamos separadamente os casos de uma só função implı́cita, as hiperfı́cies e o multiplicador de Lagrange. Os capı́tulos 5, 6 e 7 se ocupam do Cálculo Diferencial das aplicações f : U → Rn , onde a derivada, que antes era vista como um vetor (o gradiente) agora aparece como uma transformação linear. O resultado principal é o Teorema da Função Inversa, do qual se derivam o Teorema das Funções Implı́citas e os multiplicadores de Lagrange. Olhando para as funções implı́citas de forma global, somos conduzidos à noção de superfı́cie diferenciável (de dimensão qualquer) no espaço euclidiano e o Cálculo Diferencial nas mesmas. Os capı́tulos 8 e 9 tratam das integrais múltiplas (no sentido de Riemann), culminando com a demonstração da fórmula de mudança de variáveis. O livro contém 170 exercı́cios, propostos ao final de cada capı́tulo. O capı́tulo 10, último do livro, contém as soluções completas de todos eles. O leitor deve considerá-los como um meio de verificar até que ponto assimilou o conteúdo de cada seção. As soluções por mim sugeridas podem ser bem diferentes das suas, mais simples ou mais complicadas do que as que imaginou mas, acima de tudo, devem ser vistas como um auxı́lio a ser solicitado somente depois de tentar seriamente resolver o problema com seus próprios recursos. Um tratamento mais extenso e completo dos assuntos aqui estudados encontra-se no “Curso de Análise”, vol. 2, o qual, entretanto, é um livro muito longo para ser estudado num único semestre. Ao terminar, agradeço ao Professor Hilário Alencar pela leitura de uma versão preliminar, com a correção de vários misprints, e ao Professor Florêncio Guimarães, pela revisão do manuscrito final. Rio de Janeiro, 25 de maio de 2004 Elon Lages Lima Prefácio da sexta edição A partir da segunda edição, foram feitas algumas correções de natureza tipográfica e diversas pequenas mudanças visando tornar mais clara a exposição. Em particular, na quinta edição foi incluı́do um Apêndice ao Capı́tulo 7, sobre o volume do paralelepı́pedo. Agradeço a colaboração de José Regis, Mariana Garcia, Rick Rischter e Raphael Antunes dos Santos por terem apontado certas impropriedades, a Rogerio Dias Trindade e Wilson Góes, que redigitaram o texto. Rio de Janeiro, abril de 2012 Elon Lages Lima Conteúdo 1 Topologia do Espaço Euclidiano 1 O espaço euclidiano n-dimensional 2 Bolas e conjuntos limitados . . . . 3 Conjuntos abertos . . . . . . . . . 4 Seqüências em Rn . . . . . . . . . 5 Conjuntos fechados . . . . . . . . . 6 Conjuntos compactos . . . . . . . . 7 Aplicações contı́nuas . . . . . . . . 8 Continuidade uniforme . . . . . . . 9 Homeomorfismos . . . . . . . . . . 10 Conjuntos conexos . . . . . . . . . 11 Limites . . . . . . . . . . . . . . . 12 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 5 7 10 12 16 19 23 26 27 33 36 2 Caminhos em Rn 1 Caminhos diferenciáveis . . . . 2 Cálculo diferencial de caminhos 3 A integral de um caminho . . . 4 Caminhos retificáveis . . . . . . 5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 43 45 48 52 . . . . . . 55 55 57 65 68 70 75 3 Funções Reais de n Variáveis 1 Derivadas parciais . . . . . 2 Funções de classe C 1 . . . . 3 O Teorema de Schwarz . . . 4 A fórmula de Taylor . . . . 5 Pontos crı́ticos . . . . . . . 6 Funções convexas . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Cap. 0 CONTEÚDO 7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4 Funções Implı́citas 1 Uma função implı́cita . . 2 Hiperfı́cies . . . . . . . . . 3 Multiplicador de Lagrange 4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 84 87 91 96 5 Aplicações Diferenciáveis 1 A derivada como transformação linear 2 Exemplos de derivadas . . . . . . . . . 3 Cálculo diferencial de aplicações . . . 4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 98 100 103 109 . . . . . . . . . . . . . . . . . . . . . . . . 6 Aplicações Inversas e Implı́citas 111 1 O Teorema da Aplicação Inversa . . . . . . . . . . . . . . 111 2 Várias Funções Implı́citas . . . . . . . . . . . . . . . . . . 117 3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 7 Superfı́cies Diferenciáveis 1 Parametrizações . . . . . . . . . . . . . . 2 Superfı́cies diferenciáveis . . . . . . . . . . 3 O espaço vetorial tangente . . . . . . . . . 4 Superfı́cies orientáveis . . . . . . . . . . . 5 Multiplicadores de Lagrange . . . . . . . . 6 Aplicações diferenciáveis entre superfı́cies 7 Exercı́cios . . . . . . . . . . . . . . . . . . 8 Integrais Múltiplas 1 A definição de integral . . . . . . . 2 Conjuntos de medida nula . . . . . 3 Cálculo com integrais . . . . . . . 4 Conjuntos J-mensuráveis . . . . . 5 A integral como limite de somas de 6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 . 124 . 126 . 129 . 132 . 139 . 142 . 146 . . . . . . 148 . 148 . 152 . 159 . 162 . 165 . 170 9 Mudança de Variáveis 172 1 O caso unidimensional . . . . . . . . . . . . . . . . . . . . 173 2 Difeomorfismos primitivos . . . . . . . . . . . . . . . . . . 175 1 CONTEÚDO 3 4 5 Todo difeomorfismo C 1 é localmente admissı́vel . . . . . . 177 Conclusão: todo difeomorfismo de classe C 1 é admissı́vel . 178 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 10 Soluções dos exercı́cios 1 Topologia do Espaço Euclidiano 2 Caminhos diferenciáveis . . . . 3 Funções reais de n variáveis . . 4 Funções implı́citas . . . . . . . 5 Aplicações diferenciáveis . . . . 6 Aplicações Inversas e Implı́citas 7 Superfı́cies Diferenciáveis . . . 8 Integrais múltiplas . . . . . . . 9 Mudança de variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 . 181 . 186 . 188 . 192 . 194 . 195 . 197 . 201 . 203 Referências Bibliográficas 205 Índice Remissivo 206 5 1 Topologia do Espaço Euclidiano 1 O espaço euclidiano n-dimensional Seja n um número natural. O espaço euclidiano n-dimensional Rn é o produto cartesiano de n fatores iguais a R : Rn = R × R × · · · × R. Seus elementos, portanto, são as seqüências (ou listas) de n termos reais x = (x1 , . . . , xn ). Para cada i = 1, . . . , n, o termo xi chama-se a i-ésima coordenada de x. Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), tem-se x = y se, e somente se, x1 = y1 , . . . , xn = yn . Assim, toda igualdade entre dois elementos de Rn equivale a n igualdades entre números reais. R1 = R é o conjunto dos números reais, R2 é o modelo numérico do plano e R3 é o modelo do espaço euclidiano tridimensional. Por simplicidade, adotaremos o hábito de escrever z = (x, y) em vez de x = (x1 , x2 ) e w = (x, y, z) em vez de x = (x1 , x2 , x3 ). Os elementos de Rn às vezes são chamados pontos e às vezes vetores. Este segundo nome se aplica principalmente quando se considerarem entre eles as operações que definiremos agora. A adição faz corresponder a cada par de elementos x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) a soma x + y = (x1 + y1 , . . . , xn + yn ). e a multiplicação do número real α pelo elemento x = (x1 , . . . , xn ) tem como resultado o produto α · x = (αx1 , . . . , αxn ). 2 Topologia do Espaço Euclidiano Cap. 1 O vetor 0 = (0, 0, . . . , 0), cujas coordenadas são todas nulas, chamase a origem de Rn . Para todo x = (x1 , . . . , xn ), o vetor −x = (−x1 , . . . , −xn ) chama-se o oposto, ou simétrico de x. Dados quaisquer x, y, z ∈ Rn e α, β ∈ R valem as igualdades x + y = y + x, x + 0 = x, x + (y + z) = (x + y) + z, (α + β)x = αx + βx, −x + x = 0, α(βx) = (αβ)x, α(x + y) = αx + αy, 1 · x = x. A segunda e a terceira delas dizem que 0 é o elemento neutro da adição e −x é o inverso aditivo de x. Os vetores e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . en = (0, . . . , 1), que têm uma única coordenada não-nula, igual a 1, constituem a base canônica de Rn . A igualdade x = (x1 , . . . , xn ) significa que x = x1 · e1 + · · · + xn · en . Existe ainda uma operação que associa a cada par de vetores x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) o número real hx, yi = x1 y1 + · · · + xn yn , chamado o produto interno de x por y. Para x, y, z ∈ Rn e α ∈ R quaisquer, tem-se hx, yi = hy, xi, hx, y + zi = hx, yi + hx, zi, hαx, yi = α · hx, yi, hx, xi > 0 se x 6= 0. Segue-se que hx+y, zi = hx, zi+hy, zi, hx, αyi = αhx, yi e hx, 0i = 0. Diz-se que os vetores x, y ∈ Rn são ortogonais, e escreve-se x ⊥ y, quando hx, yi = 0. Por exemplo, ei ⊥ ej se i 6= j. Um exemplo menos trivial de ortogonalidade é o seguinte: hx, yi (1.1) Seja x ∈ Rn não-nulo. Para todo y ∈ Rn , o vetor z = y − ·x hx, xi é ortogonal a x. hx, yi · hx, xi = 0. Demonstração: hx, zi = hx, yi − hx, xi hx, yi Escrevendo y = · x + z, vemos assim que, uma vez dado um hx, xi vetor não-nulo x ∈ Rn , todo vetor y ∈ Rn se escreve como soma de um múltiplo de x com um vetor ortogonal a x. Esta decomposição é única O espaço euclidiano n-dimensional Seção 1 3 pois se y = α · x + z com z ⊥ x, tomando-se o produto interno de ambos os membros por x obtemos hx, yi = α · hx, xi, logo α = hx, yi/hx, xi. O vetor αx = (hx, yi/hx, xi)x chama-se a projeção ortogonal de y sobre (a reta que contém) x. z y x hx,yi hx,xi ·x Figura 1.1 p O número não-negativo |x| = hx, xi chama-se a norma (ou o comprimento) do vetor x. Se x = (x1 , . . . , xn ) então |x| = q x21 + · · · + x2n . Por definição, tem-se hx, xi = |x|2 . Quando |x| = 1, diz-se que x é um vetor unitário. Para todo x 6= 0, o vetor u = x/|x| é unitário. (1.2) (Teorema de Pitágoras). Se x ⊥ y então |x + y|2 = |x|2 + |y|2 . Demonstração: |x + y|2 = hx + y, x + yi = hx, xi + 2hx, yi + hy, yi = hx, xi + hy, yi = |x|2 + |y|2 . (1.3) (Desigualdade de Schwarz). Para quaisquer x, y ∈ Rn , tem-se |hx, yi| ≤ |x| · |y|, valendo a igualdade se, e somente se, um dos vetores x, y é múltiplo do outro. Demonstração: Isto é óbvio se x = 0. Supondo x 6= 0, podemos escrever y = αx + z com z ⊥ x e α = hx, yi/|x|2 . Por Pitágoras, |y|2 = α2 |x|2 + |z|2 , logo |y|2 ≥ α2 |x|2 , valendo a igualdade se, e somente se, y = α·x. Entrando com o valor de α, vem |y|2 ≥ hx, yi2 /|x|2 , ou seja, hx, yi2 ≤ |x|2 · |y|2 , o que nos dá |hx, yi| ≤ |x| · |y|, valendo a igualdade se, e somente se, y = α · x. 4 Topologia do Espaço Euclidiano Cap. 1 A norma goza das seguintes propriedades: 1. |x| ≥ 0, valendo |x| = 0 somente quando x = 0; 2. |α · x| = |α| |x|; 3. |x + y| ≤ |x| + |y|. A última desigualdade, referindo-se a números não-negativos, equivale a |x + y|2 ≤ (|x| + |y|)2 . Ora, |x + y|2 = hx + y, x + yi = |x|2 + 2hx, yi + |y|2 ≤ |x|2 + 2|x||y| + |y|2 = (|x| + |y|)2 pois, em virtude da desigualdade de Schwarz, hx, yi ≤ |x| |y|. Mais geralmente, qualquer função Rn → R, que associe a cada vetor x ∈ Rn um número |x| com as três propriedades acima, chama-se uma norma. A norma q |x| = x21 + · · · + x2n , chama-se norma euclidiana. Há duas outras normas que poderemos utilizar em Rn quando houver conveniência. Elas são 1. |x|M = max ·{|x1 |, . . . , |xn |} (norma do máximo), 2. |x|S = |x1 | + · · · + |xn | (norma da soma). As condições que definem uma norma são fáceis de verificar para estas duas. Também é simples mostrar que, para todo x ∈ Rn , vale |x|M ≤ |x| ≤ |x|S ≤ n · |x|M , onde |x| é a norma euclidiana. Quando, num determinado contexto, estivermos usando apenas uma das normas |x|M ou |x|S , podemos indicá-la com a notação |x|, por simplicidade. Para toda norma, vale a desigualdade | |x| − |y| | ≤ |x − y|. Seção 2 Bolas e conjuntos limitados 5 Com efeito, de x = (x − y) + y resulta que |x| ≤ |x − y| + |y|, logo |x| − |y| ≤ |x − y|. Trocando os papéis de x e y, obtemos |y| − |x| ≤ |y − x|. Mas |y − x| = |x − y|, logo |y| − |x| ≤ |x − y|. Conclusão: ||x| − |y|| ≤ |x − y|. Uma norma em Rn dá origem à noção de distância d(x, y) entre dois pontos x, y ∈ Rn . Para x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), pomos p d(x, y) = |x − y| = (x1 − y1 )2 + · · · + (xn − yn )2 . As três condições que definem uma norma implicam que d(x, y) tem as propriedades caracterı́sticas de uma distância, a saber: 1. d(x, y) ≥ 0, com d(x, y) = 0 se, e somente se, x = y; 2. d(x, y) = d(y, x); 3. d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular). Observe que a igualdade |α · x| = |α| |x| com α = −1 dá | − x| = |x|, logo |x−y| = |y−x|. Além disso, |x−z| = |x−y+y−z| ≤ |x−y|+|y−z|, portanto d(x, z) ≤ d(x, y) + d(y, z). 2 Bolas e conjuntos limitados Dados o ponto a ∈ Rn e o número real r > 0, a bola aberta de centro a e raio r é o conjunto B(a; r) dos pontos x ∈ Rn cuja distância ao ponto a é menor que r. Em sı́mbolos: B(a; r) = {x ∈ Rn ; |x − a| < r}. Analogamente, a bola fechada de centro a e raio r é o conjunto B[a; r] assim definido: B[a; r] = {x ∈ Rn ; |x − a| ≤ r}. Por sua vez, a esfera de centro a e raio r é o conjunto S[a; r] = {x ∈ Rn ; |x − a| = r}. Evidentemente, B[a; r] = B(a; r) ∪ S[a; r]. A bola fechada B[a; r] ⊂ Rn também é chamada o disco n-dimensional de centro a e raio r. Em particular, o disco B[0; 1] de centro 0 e raio 1 é chamado o disco unitário de Rn . 6 Topologia do Espaço Euclidiano Cap. 1 Uma notação especial é reservada para a esfera unitária de dimensão n − 1: S n−1 = {x ∈ Rn ; |x| = 1}. Assim, S n−1 é a esfera de centro na origem 0 e raio 1. Quando n = 2, S 1 é a circunferência de centro 0 e raio 1. Acima estamos (pelo menos tacitamente) admitindo que a norma adotada em Rn é a euclidiana, já que não foi feita menção em contrário. Convém, entretanto, observar que a forma geométrica das bolas e esferas em Rn depende da norma que se considera. Por exemplo, se tomarmos em R2 a norma do máximo, a “esfera unitária” é o bordo do quadrado de centro 0 e lados de comprimento 2, paralelos aos eixos. Ainda em R2 , com a norma da soma, o “disco unitário” é o quadrado cujos vértices são os pontos (1, 0), (0, 1), (−1, 0) e (0, −1). (a) (b) (c) Figura 1.2: O conjunto dos pontos z ∈ R2 tais que |z| ≤ 1, conforme a norma seja (a) a euclidiana, (b) do máximo, ou (c) da soma. Observação: Indiquemos com as notações B, BM e BS respectivamente as bolas de centro a e raio r em Rn , relativamente às normas euclidiana, ′ a bola de centro a e raio r/n do máximo e da soma. Seja ainda BM na norma do máximo. As desigualdades |x|M ≤ |x| ≤ |x|S ≤ n|x|M ′ ⊂B ⊂B ⊂B . implicam que BM S M Diz-se que o conjunto X ⊂ Rn é limitado quando está contido em alguma bola B[a; r]. Como B[a; r] ⊂ B[0; k], onde k = r + |a| (conforme veremos agora), dizer que X é limitado equivale a dizer que existe k > 0 tal que |x| ≤ k para todo x ∈ X. Para mostrar que B[a; r] ⊂ B[0; r + |a| ], note que |x − a| ≤ r ⇒ |x| = |x − a + a| ≤ |x − a| + |a| ≤ r + |a|. Assim, x ∈ B[a; r] ⇒ x ∈ B[0; r + |a|]. Seção 3 Conjuntos abertos 7 Uma aplicação f : X → Rn diz-se limitada no conjunto X ⊂ Rm quando sua imagem f (X) ⊂ Rn é um conjunto limitado, isto é, quando existe c > 0 tal que |f (x)| ≤ c para todo x ∈ X. Dados a 6= b em Rn , a reta que une esses dois pontos é o conjunto ab = {(1−t)a+tb ; t ∈ R}. Por sua vez, o segmento de reta de extremos a, b é o conjunto [a, b] = {(1 − t)a + tb ; 0 ≤ t ≤ 1}. Um conjunto X ⊂ Rn chama-se convexo quando o segmento de reta que une dois quaisquer de seus pontos está inteiramente contido em X. Noutros termos, dizer que X é convexo equivale a afirmar que a, b ∈ X, 0≤t≤1 ⇒ (1 − t)a + tb ∈ X . Exemplo 1. Toda bola (aberta ou fechada) é um conjunto convexo. Para fixar as idéias, consideremos a bola fechada B = B[x0 ; r]. Dados a, b ∈ B, temos |a − x0 | ≤ r e |b − x0 | ≤ r. Para qualquer t ∈ [0, 1] vale x0 = (1 − t)x0 + tx0 , logo |(1 − t)a + tb − x0 | = |(1 − t)a + tb − (1 − t)x0 − tx0 | = |(1 − t)(a − x0 ) + t(b − x0 )| ≤ (1 − t)|a − x0 | + t|b − x0 | ≤ (1 − t)r + tr = r, ⊳ Exemplo 2. Seja X = {(x, y) ∈ R2 ; y ≤ x2 }. O conjunto X ⊂ R2 não é convexo. Com efeito os pontos a = (−1, 1) e b = (1, 1) pertencem a X 1 1 mas a + b = (0, 1) não pertence a X. ⊳ 2 2 3 Conjuntos abertos Seja a ∈ X ⊂ Rn . Diz-se que o ponto a é interior ao conjunto X quando, para algum r > 0, tem-se B(a; r) ⊂ X. Isto significa que todos os pontos suficientemente próximos de a também pertencem a X. O conjunto int.X dos pontos interiores a X chama-se o interior do conjunto X. Evidentemente, int.X ⊂ X. Quando a ∈ int.X, diz-se que X é uma vizinhança de a. Exemplo 3. Seja X={(x, y) ∈ R2 ; y ≥ 0} o semi-plano superior fechado. Se p = (a, b) com b > 0, então p ∈ int.X. Com efeito, afirmamos que B = B(p; b) ⊂ X. Isto é claro geometricamente. 8 Topologia do Espaço Euclidiano Cap. 1 b b p a Figura 1.3 Em termos mais precisos, argumentamos assim: p (x, y) ∈ B ⇒ (x − a)2 + (y − b)2 < b ⇒ (y − b)2 < b2 ⇒ y 2 − 2by + b2 < b2 ⇒ y 2 < 2by ⇒ y > 0 (pois b > 0), e portanto (x, y) ∈ X. ⊳ Exemplo 4. Com a notação do Exemplo 3, os pontos da forma q = (a, 0), pertencem a X porém não são interiores a X. Com efeito, nenhuma bola B(q; r) de centro q pode estar contida em X pois o ponto (a, −r/2) pertence a B(q; r) mas não a X. Segue-se então que int.X = {(x, y) ∈ R2 ; y > 0}. Um conjunto A ⊂ Rn chama-se aberto quando todos os seus pontos são interiores, isto é, quando A = int.A. ⊳ y x a Figura 1.4 Exemplo 5. Toda bola aberta B = B(a; r) é um conjunto aberto. Com efeito, seja x ∈ B. Então |x−a| < r, logo s = r −|x−a| > 0. Afirmamos Seção 3 Conjuntos abertos 9 que, B(x; s) ⊂ B. Com efeito, y ∈ B(x; s) ⇒ |y − x| < r − |x − a|. Logo y ∈ B(x; s) ⇒ |y − a| ≤ |y − x| + |x − a| < r − |x − a| + |x − a| = r. Daı́ concluimos que y ∈ B(a; r). ⊳ A fronteira de um conjunto X ⊂ Rn é o conjunto fr.X formado pelos pontos de X que não são interiores a X, juntamente com os pontos de Rn − X que não são interiores a Rn − X. De forma mais simples: tem-se x ∈ fr.X quando toda bola de centro x contém pontos de X e pontos de Rn − X. Exemplo 6. Seja X = {(x, y) ∈ R2 ; y ≥ 0}, como no Exemplo 3. De forma análoga ao argumento usado no Exemplo 3, mostra-se que todo ponto de R2 − X = {(x, y) ∈ R2 ; y < 0} é um ponto interior (ou seja, que R2 − X é um conjunto aberto). Logo, nenhum ponto de R2 − X pode estar na fronteira de X. Segue-se então do Exemplo 4 que fr.X = {(x, 0) ; x ∈ R} = eixo dos xx. Teorema 1. (a) Se A1 , A2 são abertos em Rn então A1 ∩ A2 é aberto. (b) Se (Aλ )λ∈L é umaSfamı́lia arbitrária de conjuntos abertos Aλ ⊂ Rn Aλ é um conjunto aberto. então a reunião A = λ∈L Demonstração: Vide vol. 1, pág. 49. Mesma demonstração, substituindo apenas cada intervalo (a − ε, a + ε) pela bola B(a; ε). Resulta imediatamente do Teorema 1 que a interseção A = A1 ∩ · · · ∩ Ak de um número finito de conjuntos abertos A1 , . . . , Ak é ainda um conjunto aberto. Entretanto, a interseção de infinitos abertos pode ∞ T B(a; 1/k) = {a}. não ser aberta, como mostra o exemplo k=1 Rn . Seja X ⊂ Diz-se que um subconjunto A ⊂ X é aberto em X quando cada ponto a ∈ A é centro de uma bola aberta B(a; r), tal que B(a; r) ∩ X ⊂ A. Isto significa que os pontos de X que estão suficientemente próximos de cada a ∈ A pertencem a A. A reunião U de todas essas bolas é um aberto tal que A = U ∩ X. A recı́proca é óbvia, de modo que um conjunto A ⊂ X é aberto em X se, e somente se, A = U ∩ X onde U é aberto em Rn . Por exemplo, o intervalo (0, 1] é aberto em [0, 1] pois (0, 1] = (0, 2) ∩ [0, 1]. 10 4 Topologia do Espaço Euclidiano Cap. 1 Seqüências em Rn Uma seqüência em Rn é uma função x : N → Rn , que associa a cada número natural k um ponto xk ∈ Rn . As notações para uma seqüência são (x1 , . . . , xk , . . . ), (xk )k∈N ou simplesmente (xk ). Para cada i = 1, . . . , n, indicamos com xki a i-ésima coordenada de xk . Assim, xk = (xk1 , xk2 , . . . , xkn ). Dar uma seqüência em Rn equivale a dar as n seqüências de números reais (xk1 )k∈N , . . . , (xkn )k∈N . Diz-se que a seqüência (xk )k∈N é limitada quando existe uma bola em Rn que contém todos os termos xk . Isto equivale a dizer que existe c > 0 tal que |xk | ≤ c para todo k ∈ N. Em virtude das desigualdades que relacionam as três normas que consideramos em Rn , ser limitada é uma propriedade da seqüência que independe de qual dessas três normas estamos tratando. Se a seqüência (xk ) é limitada então, para todo i = 1, . . . , n, a seqüência (xki )k∈N das i-ésimas coordenadas de xk é também limitada, pois |xki | ≤ |xk |. Vale também a recı́proca. Para prová-la, adotaremos em Rn a norma do máximo. Então, se |xk1 | ≤ c1 , |xk2 | ≤ c2 , . . . , |xkn | ≤ cn para todo k ∈ N, chamando de c o maior dos números c1 , c2 , . . . , cn teremos |xk | = max{|xk1 |, . . . , |xkn |} ≤ c para todo k ∈ N. Assim, se cada (xki )k∈N (i = 1, . . . , n) é limitada, a seqüência (xk )k∈N é limitada. Uma subseqüência de (xk )k∈N é a restrição desta seqüência a um subconjunto infinito N′ = {k1 < · · · < km < . . . } ⊂ N. As notações (xk )k∈N′ , (xkm )m∈N ou (xk1 , . . . , xkm , . . . ) são usadas para indicar uma subseqüência. Diz-se que o ponto a ∈ Rn é o limite da seqüência (xk ) quando, para todo ε > 0 dado arbitrariamente, é possı́vel obter k0 ∈ N tal que k > k0 ⇒ |xk − a| < ε. Noutras palavras: k > k0 ⇒ xk ∈ B(a; ε). Escreve-se então lim xk = a, lim xk = a ou lim xk = a, simplesmente. k→∞ k∈N De acordo com esta definição, tem-se lim xk = a se, e somente se, lim |xk − a| = 0. Dizer que lim xk = a significa afirmar que qualquer bola de centro a contém todos os xk com a possı́vel exceção de um número finito de valores de k (que são 1, 2, . . . , k0 ). Uma seqüência (xk ) em Rn diz-se convergente quando existe a = lim xk . Da observação acima resulta que toda seqüência conver- Seqüências em Rn Seção 4 11 gente é limitada. É também óbvio que qualquer subseqüência de uma seqüência convergente é também convergente e tem o mesmo limite. Observe-se ainda que a definição de limite faz uso de uma norma, porém as desigualdades |x|M ≤ |x| ≤ |x|S ≤ n · |x|M mostram que a existência e o valor do limite não dependem de qual das três normas usuais se está considerando. Este fato será empregado na demonstração do teorema abaixo, onde no final usamos a norma do máximo. Teorema 2. A seqüência (xk ) em Rn converge para o ponto a = (a1 , . . . , an ) se, e somente se, para cada i = 1, . . . , n, tem-se lim xki = ai , isto é, cada coordenada de xk converge para a coordek→∞ nada correspondente de a. Demonstração: Para cada i = 1, . . . , n, tem-se |xki − ai | ≤ |xk − a|, portanto lim xk = a ⇒ lim xki = ai . Reciprocamente, se vale esta k→∞ última igualdade então, dado ε > 0, existem k1 , . . . , kn ∈ N tais que k > ki ⇒ |xki − ai | < ε (i = 1, . . . , n). Tomando k0 = max{k1 , . . . , kn } e adotando em Rn a norma do máximo, vemos que k > k0 ⇒ |xk −a| < ε. Logo lim xk = a. Corolário 1. Se lim xk = a, lim yk = b em Rn e lim αk = α em R então lim(xk + yk ) = a + b e lim αk xk = αa. Tomando cada seqüência de coordenadas, o corolário resulta da propriedade correspondente em R. Além disso, lim hxk , yk i = ha, bi, como se vê facilmente. E a desigualdade ||xk | − |a|| ≤ |xk − a| mostra ainda que se tem lim |xk | = |a| seja qual for a norma adotada. Teorema 3 (Bolzano-Weierstrass). Toda seqüência limitada em Rn possui uma subseqüência convergente. Demonstração: Seja (xk ) uma seqüência limitada em Rn . As primeiras coordenadas dos seus termos formam uma seqüência limitada (xk1 )k∈N de números reais, a qual, pelo Teorema de Bolzano-Weierstrass na reta (vol. 1, pág. 25), possui uma subseqüência convergente. Isto é, existem um subconjunto infinito N1 ⊂ N e um número real a1 tais que lim xk1 = a1 . Por sua vez, a seqüência limitada (xk2 )k∈N1 em R k∈N1 possui uma subseqüência convergente: existem um subconjunto infinito N2 ⊂ N1 e um número real a2 tais que lim xk2 = a2 . E assim por k∈N2 12 Topologia do Espaço Euclidiano Cap. 1 diante, até obtermos n conjuntos infinitos N ⊃ N1 ⊃ N2 ⊃ · · · ⊃ Nn e números reais a1 , a2 , . . . , an tais que lim xki = ai , para i = 1, 2, . . . , n. k∈Ni Então pomos a = (a1 , . . . , an ) e, pelo Teorema 2, temos lim xk = a, o k∈Nn que prova o teorema. Uma seqüência de pontos xk ∈ Rn chama-se uma seqüência de Cauchy quando, para todo ε > 0 dado, existe k0 ∈ N tal que k, r > k0 ⇒ |xk − xr | < ε. Toda seqüência de Cauchy (xk ) é limitada. Com efeito, tomando ε = 1 na definição acima, vemos que existe um ı́ndice k0 tal que, salvo possivelmente os pontos x1 , . . . , xk0 todos os demais termos xk pertencem à bola B(xk0 +1 ; 1). Portanto o conjunto dos termos da seqüência é limitado. A condição para que a seqüência (xk ) seja de Cauchy pode ser reformulada dizendo-se que lim |xk −xr | = 0, isto é, que lim |xk −xr | = 0. k,r→∞ k,r∈N Daı́ resulta que se N′ ⊂ N é um subconjunto infinito, ou seja, se (xr )r∈N′ é uma subseqüência de (xk ) então lim ′ |xk − xr | = 0. k∈N, r∈N Teorema 4 (Critério de Cauchy). Uma seqüência em Rn converge se, e somente se, é uma seqüência de Cauchy. Demonstração: Seja (xk ) uma seqüência de Cauchy em Rn . Sendo liSeja mitada, ela possui uma subseqüência convergente (xr )r∈N′ . a = lim′ xr . Temos lim′ |xr − a| = 0 e lim ′ |xk − xr | = 0, como r∈N r∈N k∈N, r∈N observamos acima. Então, de |xk − a| ≤ |xk − xr | + |xr − a| resulta que lim |xk − a| = 0, ou seja, lim xk = a. Reciprocamente, se (xk ) é k∈N k→∞ convergente, com lim xk = a, então, como |xk − xr | ≤ |xk − a| + |xr − a|, concluı́mos que lim |xk − xr | = 0, ou seja, (xk ) é de Cauchy. k,r→∞ 5 Conjuntos fechados Diz-se que o ponto a é aderente ao conjunto X ⊂ Rn quando existe uma seqüência de pontos xk ∈ X tais que lim xk = a. Chama-se fecho do conjunto X ⊂ Rn ao conjunto X formado por todos os pontos aderentes a X. Portanto a ∈ X ⇔ a = lim xk , xk ∈ X. Dizer que a ∈ X é o mesmo que afirmar que a é aderente a X. Um conjunto F ∈ Rn chama-se fechado quando F = F , isto é, Seção 5 Conjuntos fechados 13 quando o limite de toda seqüência convergente de pontos de F é ainda um ponto de F . Todo ponto x ∈ X é aderente a X pois é limite da seqüência constante (x, x, . . . ). Assim, X ⊂ X qualquer que seja X ⊂ Rn . Também é óbvio que X ⊂ Y ⇒ X ⊂ Y . Exemplo 7. Se |x| = r então x não pertence à bola aberta B = B(0; r) 1 porém é aderente a ela. Com efeito, pondo xk = 1 − x para todo k k ∈ N, temos xk ∈ B(0; r) e lim xk = x, logo x ∈ B. Reciprocamente, se x ∈ B então x = lim xk com |xk | < r para todo k ∈ N, portanto |x| = lim |xk | ≤ r. Conclui-se então que x ∈ B⇔|x|≤r, ou seja, B = B[0; r]. O mesmo argumento mostra que o fecho de toda bola aberta B(a; r) é a bola fechada B[a; r]. O teorema abaixo resume as principais propriedades do fecho de um conjunto. Teorema 5. (a) O ponto a é aderente ao conjunto X ⊂ Rn se, e somente se, toda bola de centro a contém algum ponto de X. (b) Um conjunto F ⊂ Rn é fechado se, e somente se, seu complementar Rn − F é aberto. Equivalentemente: A ⊂ Rn é aberto se, e somente se, Rn − A é fechado. (c) O fecho de qualquer conjunto X ⊂ Rn é fechado. Noutras palavras: para todo X ⊂ Rn tem-se X = X. Demonstração: (a) Se a é aderente a X então a = lim xk , com xk ∈ X para todo k ∈ N. Portanto qualquer bola B(a; r) contém pontos de X, a saber, todos os xk com k suficientemente grande. Reciprocamente, se toda bola de centro a contém pontos de X, podemos escolher, para cada k ∈ N, um ponto xk ∈ X que esteja na bola B(a; 1/k), isto é, |xk − a| < 1/k. Então lim xk = a, logo a é aderente a X. (b) As seguintes afirmações são equivalentes: (1) F é fechado. (2) Se x ∈ Rn − F então x não é aderente a F . (3) Se x ∈ Rn − F então existe r > 0 tal que B(x; r) ⊂ Rn − F (em virtude da parte (a) acima). (4) Rn − F é aberto. Assim, F fechado ⇔ Rn − F aberto. Escrevendo A = Rn − F , donde F = Rn − A, esta última conclusão lê-se assim: A é aberto se, e somente se, Rn − A é fechado. (c) Se x ∈ Rn − X (isto é, x não é aderente a X) então, por (a), existe uma bola B = B(x; r) que não contém pontos de X, ou seja, 14 Topologia do Espaço Euclidiano Cap. 1 X ⊂ Rn − B. Logo X ⊂ Rn − B. Mas, pela parte (b) acima, Rn − B é fechado; portanto X ⊂ Rn − B ou, equivalentemente, B ⊂ Rn − X. Assim, todo ponto x ∈ Rn − X é um ponto interior, logo Rn − X é aberto. Segue-se que X é fechado. Alguns conjuntos X ⊂ Rn não são abertos nem fechados, como X = B(a; r) ∪ {b}, onde |b − a| = r. Ou então X = conjunto dos pontos de Rn com coordenadas racionais (X = Qn ). Chama-se distância do ponto a ∈ Rn ao conjunto X ⊂ Rn ao número d(a; X) = inf{|x − a| ; x ∈ X}. Pela definição de ı́nfimo, para cada k ∈ N existe um ponto xk ∈ X tal 1 que d(a; X) ≤ |xk − a| < d(a, X) + , portanto lim |xk − a| = d(a; X). k→∞ k A seqüência (xk ) é certamente limitada, portanto possui uma subseqüência convergente. Descartando (por serem desnecessários) os termos xk que não estejam nessa subseqüência, vemos que existe um ponto x0 = lim xk tal que d(a, X) = |x0 − a|. Tem-se x0 ∈ X. Se o conjunto X for fechado então x0 ∈ X. Podemos então enunciar o Teorema 6. Seja F ⊂ Rn um conjunto fechado. Dado qualquer a ∈ Rn existe (pelo menos um) x0 ∈ F tal que |x0 −a| ≤ |x−a| para todo x ∈ F . Noutras palavras: Se F ⊂ Rn é fechado então, para a ∈ Rn qualquer, a função f : F → R dada por f (x) = |x − a| assume seu valor mı́nimo em algum ponto x0 ∈ F . Então tem-se d(a, F ) = |x0 − a|. Se X ⊂ Y ⊂ Rn , diz-se que X é denso em Y quando X = Y . Por exemplo, B(a; r) é denso em B[a; r] e Qn é denso em Rn . Dizemos que a ∈ Rn é ponto de acumulação do conjunto X ⊂ Rn quando toda bola de centro a contém algum ponto de X diferente de a. (Noutras palavras, quando a ∈ X − {a}.) Um ponto de acumulação de X pode pertencer a X ou não. Se a ∈ X não é ponto de acumulação de X, diz-se que a é um ponto isolado de X. Isto significa que existe r > 0 tal que B(a; r) ∩ X = {a}. Quando todos os pontos de X são isolados, dizemos que X é um conjunto discreto. Exemplo 8. Todos os pontos de uma bola são pontos de acumulação. O conjunto Zn dos pontos de Rn com coordenadas inteiras é um conjunto discreto. ⊳ Seção 5 Conjuntos fechados 15 As demonstrações dos três teoremas seguintes são omitidas pois são praticamente as mesmas dos seus análogos unidimensionais, provados no volume 1 (págs. 50, 52 e 53). Basta substituir cada intervalo (a−r, a+r) pela bola B(a; r) e considerar |x| como a norma de x. Teorema 7. Sejam a um ponto e X um subconjunto de Rn . As seguintes afirmações são equivalentes: (1) a é um ponto de acumulação de X. (2) a é limite de uma seqüência de pontos xk ∈ X − {a}. (3) Toda bola de centro a contém uma infinidade de pontos de X. Teorema 8. Todo subconjunto infinito limitado X ⊂ Rn admite pelo menos um ponto de acumulação. Teorema 9. (a) Se F1 e F2 são subconjuntos fechados de Rn então F1 ∪ F2 é também fechado. (b) Se (Fλ )λ∈L éTuma famı́lia arbitrária de conjuntos fechados então a Fλ é um conjunto fechado. interseção F = λ∈L Cabe aqui a observação de que (a) implica que a reunião F1 ∪ · · · ∪Fk de um número finito de conjuntos fechados é ainda um conjunto fechado. Entretanto isto não vale para reuniões infinitas. Com efeito, um conjunto qualquer, fechado ou não, é a reunião dos seus pontos, que são conjuntos fechados. Segue-se do item (2) do Teorema 7 que o fecho do conjunto X é formado acrescentando-lhe seus pontos de acumulação que por ventura não pertençam a X. Seja X ⊂ Rn . Diz-se que um subconjunto F ⊂ X é fechado em X quando F contém todos os seus pontos aderentes que pertencem a X. Assim, F é fechado em X se, e somente se, F = F ∩ X. F é fechado em X quando, e somente quando, F = G ∩ X onde G ⊂ Rn é fechado. Com efeito se F = G ∩ X com G fechado então F ⊂ G, logo F = F ∩ X ⊂ F ∩ X ⊂ G ∩ X = F , donde F = F ∩ X e F é fechado em X. O conjunto F ⊂ X é fechado em X se, e somente se, X − F (seu complementar relativamente a X) é aberto em X. Com efeito F = G ∩ X ⇔ X − F = (Rn − G) ∩ X, onde G ⊂ Rn é fechado se, e somente se, Rn − G é aberto. 16 Topologia do Espaço Euclidiano Cap. 1 Analogamente, A ⊂ X é aberto em X se, e somente se, X − A é fechado em X pois A = U ∩ X ⇔ X − A = (Rn − U ) ∩ X e U ⊂ Rn é aberto se, e somente se, Rn − U é fechado. 6 Conjuntos compactos Um conjunto X ⊂ Rn chama-se compacto quando é limitado e fechado. Exemplo 9. Toda bola fechada B[a; r] é compacta e nenhuma bola aberta é. O conjunto Zn é fechado mas não é limitado, logo não é compacto. Toda esfera S[a; r] é compacta. ⊳ Teorema 10. As seguintes afirmações sobre o conjunto K ⊂ Rn são equivalentes: (1) K é compacto; (2) Toda seqüência de pontos xk ∈ K possui uma subseqüência que converge para um ponto de K. Demonstração. Se K é compacto então toda seqüência de pontos xk ∈ K é limitada, pois K é limitado. Por Bolzano-Weierstrass, uma subseqüência (xk )k∈N′ converge para um ponto a = lim′ xk . Como K é k∈N fechado, tem-se a ∈ K. Logo (1) implica (2). Reciprocamente, se vale (2) então K é limitado pois do contrário existiria, para cada k ∈ N, um ponto xk ∈ K tal que |xk | > k. A seqüência (xk ) assim obtida não possuiria subseqüência limitada, logo nenhuma de suas subseqüências seria convergente. Além disso, K é fechado pois se a = lim xk com xk ∈ K para todo k ∈ N então, por (2), uma subseqüência de (xk ) convergiria para um ponto de K. Mas toda subseqüência de (xk ) converge para a. Logo a ∈ K. Isto mostra que (2) ⇒ (1) e completa a demonstração. Estendendo a discussão da seção 5, dados os conjuntos X, Y ⊂ Rn , podemos definir a distância entre eles pondo d(X, Y ) = inf{|x − y|; x ∈ X, y ∈ Y }, cabendo-nos agora indagar se, supondo X e Y fechados, existem x0 ∈ X e y0 ∈ Y tais que d(X, Y ) = |x0 − y0 |. Nem sempre. Com efeito, tomando em R2 o conjunto X como sendo o eixo das abcissas, isto é, X = {(x, 0); x ∈ R} e Y = {(x, 1/x); x > 0}, ou seja, Y = ramo positivo da hipérbole y = 1/x, vemos que X e Y são subconjuntos fechados Seção 6 Conjuntos compactos 17 disjuntos em R2 tais que d(X, Y ) = 0. Entretanto, vale o seguinte resultado, que contém o Teorema 6 como caso particular: Teorema 11. Sejam K ⊂ Rn compacto e F ⊂ Rn fechado. Existem x0 ∈ K e y0 ∈ F tais que |x0 − y0 | ≤ |x − y| para quaisquer x ∈ K e y ∈ F. Demonstração. Da definição de ı́nfimo segue-se que existem seqüências de pontos xk ∈ K e yk ∈ F tais que d(K, F ) = lim |xk − yk |. Passando a uma subseqüência, se necessário, a compacidade de K nos permite admitir que lim xk = x0 ∈ K. Além disso, a seqüência (yk ) é limitada pois |yk | ≤ |yk − xk | + |xk |, onde |yk − xk | é limitada por ser convergente e |xk | é limitada pois xk ∈ K. Logo, passando novamente a uma subseqüência, se necessário, podemos admitir que lim yk = y0 , com y0 ∈ F pois F é fechado. Então |x0 − y0 | = lim |xk − yk | = d(K, F ) ≤ |x − y| para quaisquer x ∈ K e y ∈ F . Corolário 2. Sejam K ⊂ U ⊂ Rn , onde K é compacto e U é aberto. Existe ε > 0 tal que toda bola B(x; ε), de raio ε e centro num ponto x ∈ K, está contida em U . Com efeito, sejam x0 ∈ K e y0 ∈ F = Rn − U tais que |x0 − y0 | ≤ |x − y| para quaisquer x ∈ K e y ∈ F . Ponhamos ε = |x0 − y0 |. Como K ⊂ U , vemos que K ∩ F = ∅, portanto x0 6= y0 e daı́ ε > 0. Assim, se x∈K ey∈ / U , tem-se |x − y| ≥ ε. Noutras palavras, se x ∈ K então B(x; ε) ⊂ U . Se F1 ⊃ F2 ⊃ · · · ⊃ Fk ⊃ . . . é uma seqüência decrescente de ∞ T Fk = ∅. Isto ocorre, fechados não-vazios em Rn , pode ocorrer que k=1 por exemplo, quando tomamos Fk = [k, +∞) em R. O teorema abaixo mostra que isto não acontece quando um dos Fk é limitado (portanto todos os seguintes são). Teorema 12 (Cantor). Seja K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . . uma seqüência decrescente de compactos não-vazios em Rn . Existe pelo menos um ponto a ∈ Rn que pertence a todos os Kk . Noutros termos: ∞ T Kk6= ∅. k=1 Demonstração. Para cada k ∈ N, escolhamos um ponto xk ∈ Kk . A seqüência (xk ) é limitada, logo possui uma subseqüência (xr )r∈N′ , que 18 Topologia do Espaço Euclidiano Cap. 1 converge para a = lim′ xr . Mostremos que a ∈ Kk para todo k ∈ N. r∈N De fato, dado k, temos Kr ⊂ Kk sempre que r ∈ N′ e r > k. Assim, r ∈ N′ , r > k ⇒ xr ∈ Kk . Segue-se que a = lim′ xr pertence ao r∈N conjunto fechado Kk . Uma propriedade fundamental dos conjuntos compactos é o fato de que toda cobertura aberta de um compacto possui uma subcobertura finita. Vejamos isto. Uma cobertura do conjunto X ⊂SRn é uma famı́lia (Cλ )λ∈L de subCλ . Isto significa que para cada conjuntos Cλ ⊂ Rn tais que X ⊂ λ∈L x ∈ X existe um λ ∈ L tal que x ∈ Cλ . Uma subcobertura é uma subfamı́lia (Cλ )λ∈L′ , L′ ⊂ L, tal que ainda S Cλ . se tem X ⊂ λ∈L′ Diz-se que a cobertura S ⊂ ∪Cλ é aberta quando os Cλ forem todos abertos, ou finita quando L é um conjunto finito. Teorema 13 (Borel-Lebesgue). Toda cobertura aberta K ⊂ ∪Aλ de um compacto K ⊂ Rn admite uma subcobertura finita K ⊂ Aλ1 ∪ · · · ∪ Aλk . Inicialmente, prepararemos o terreno para estabelecer um lema que torna a demonstração do teorema quase imediata. Seja X ⊂ Rn um conjunto limitado. O diâmetro de X é o número diam.X = sup{|x − y|; x, y ∈ X}. Segue-se imediatamente desta definição que se diam.X = d e x ∈ X então X ⊂ B[x; d]. Dado α > 0, um cubo de aresta α é um produto cartesiano n Q [ai , ai +α] de n intervalos de comprimento α. Se x = (x1 , . . . , xn ) C= i=1 e y = (y1 , . . . , yn ) pertencem p a C então, para cada i = 1, . . . , n, tem-se √ |xi − yi | ≤ α, logo |x − y| = Σ(xi − yi )2 ≤ α n. Tomando xi = ai e √ √ yi = ai + α temos |x − y| = α n, portanto α n é o diâmetro do cubo de aresta α em Rn . S [mα, (m + 1)α] da reta em intervalos A decomposição R = m∈Z adjacentes de comprimento α determina uma decomposição de Rn como reunião de cubos adjacentes de aresta α. A saber, para cada Seção 7 Aplicações contı́nuas 19 n Q [mi α, (mi + 1)α] e temos m = (m1 , . . . , mn ) ∈ Zn , pomos Cm = i=1 S S (X ∩ Cm ). Se X é Cm . Para todo X ⊂ Rn tem-se X = Rn = m∈Zn m∈Zn limitado, há apenas um número finito de interseções X ∩ Cm não-vazias, logo podemos escrever X = X1 ∪ · · · ∪ Xk √ onde cada Xi é da forma X ∩ Cm , logo tem diâmetro ≤ α n. Se X for compacto então cada Xi é compacto. Isto prova o Lema 1. Seja K ⊂ Rn compacto. Para todo ε > 0 existe uma decomposição K = K1 ∪ · · · ∪ Kk onde cada Ki é compacto e tem diâmetro ≤ ε. Demonstração do Teorema de Borel-Lebesgue. Seja K ⊂ Rn compacto. Suponhamos, por absurdo, que K ⊂ ∪Aλ seja uma cobertura aberta que não admite subcobertura finita. Exprimamos K como reunião finita de compactos, todos com diâmetro < 1. Pelo menos um deles, que chamaremos K1 , é tal que K1 ⊂ ∪Aλ não admite subcobertura finita. Escrevendo K1 como reunião finita de compactos de diâmetro < 1/2, vemos que pelo menos um deles, digamos K2 , não pode ser coberto por um número finito de Aλ ’s. Prosseguindo assim, obtemos uma seqüência decrescente de compactos K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . . com diam Kk < 1/k e tal que nenhum deles está contido numa reunião finita de Aλ ’s. Em particular, todos os Kk são não-vazios. Pelo Teorema ∞ T Kk . Para algum λ, tem-se a ∈ Aλ . Como Aλ é aberto, 12, existe a ∈ k=1 tem-se B(a; 1/k) ⊂ Aλ para algum k. Sendo a ∈ Kk e diam Kk < 1/k, concluı́mos que Kk ⊂ B(a; 1/k), donde Kk ⊂ Aλ , o que é uma contradição. 7 Aplicações contı́nuas Uma aplicação f : X → Rn , definida no conjunto X ⊂ Rm , associa a cada ponto x ∈ X sua imagem f (x) = (f1 (x), . . . , fn (x)). As funções reais f1 , . . . , fn : X → R, assim definidas, chamam-se as funções-coordenada de f . Escreve-se então f = (f1 , . . . , fn ). 20 Topologia do Espaço Euclidiano Cap. 1 Se Y ⊂ Rn é tal que f (X) ⊂ Y podemos (com um abuso de notação que é irrelevante em nosso contexto) escrever f : X → Y em vez de f : X → Rn . Diz-se que f é contı́nua no ponto a ∈ X quando, para cada ε > 0 arbitrariamente dado, pode-se obter δ > 0 tal que x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| < ε. Noutros termos: para cada bola B(f (a); ε) dada, existe uma bola B(a; δ) tal que f (B(a; δ) ∩ X) ⊂ B(f (a); ε). A continuidade de f no ponto a independe das normas que se utilizem em Rm e Rn . Diremos que f : X → Rn é uma aplicação contı́nua no conjunto X ⊂ Rm quando f é contı́nua em todos os pontos a ∈ X. Teorema 14. Sejam X ⊂ Rm , Y ⊂ Rn , f : X → Rn com f (X) ⊂ Y e g : Y → Rp . Se f é contı́nua no ponto a ∈ X e g é contı́nua no ponto f (a) então g ◦ f : X → Rp é contı́nua no ponto a. Ou seja: a composta de duas aplicações contı́nuas é contı́nua. Demonstração. Seja dado ε > 0. A continuidade de g no ponto f (a) assegura a existência de λ > 0 tal que y ∈ Y , |y − f (a)| < λ ⇒ |g(y) − g(f (a))| < ε. Por sua vez, dado λ > 0, a continuidade de f no ponto a fornece δ > 0 tal que x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| < λ ⇒ |g(f (x)) − g(f (a))| < ε, logo g ◦ f é contı́nua no ponto a. Teorema 15. (a) A aplicação f : X → Rn é contı́nua no ponto a ∈ X se, e somente se, para toda seqüência de pontos xk ∈ X com lim xk = a, tem-se lim f (xk ) = f (a). (b) A aplicação f : X → Rn é contı́nua no ponto a ∈ X se, e somente se, suas funções-coordenada f1 , . . . , fn : X → R são contı́nuas nesse ponto. Demonstração. (a) Seja f : X → Rn contı́nua no ponto a. Dada a seqüência de pontos xk ∈ X com lim xk = a, para todo ε > 0 existe δ > 0 tal que f (B(a; δ)) ⊂ B(f (a); ε). Correspondente a δ, existe k0 ∈ N tal que k > k0 ⇒ xk ∈ B(a; δ), logo k > k0 ⇒ f (xk ) ∈ B(f (a); ε). Isto mostra que lim f (xk ) = f (a). Reciprocamente, suponhamos, por absurdo, que lim xk = a implica lim f (xk ) = f (a), porém f seja descontı́nua no ponto a. Então existe ε > 0 com a seguinte propriedade: para todo k ∈ N, podemos encontrar xk ∈ X com |xk − a| < 1/k e Seção 7 Aplicações contı́nuas 21 |f (xk ) − f (a)| ≥ ε. Assim, temos lim xk = a mas não temos lim f (xk ) = f (a), uma contradição. (b) Isto decorre imediatamente do Teorema 2 junto com a parte (a) que acabamos de provar. Teorema 16. Seja X ⊂ Rm . Se as aplicações f, g : X → Rn e α : X → R são contı́nuas no ponto a ∈ X então são também contı́nuas nesse ponto as aplicações f + g : X → Rn , hf, gi : X → R, |f | : X → R e αf : X → Rn , definidas por (f + g)(x) = f (x) + g(x), hf, gi(x) = hf (x), g(x)i, |f |(x) = |f (x)| e (αf )(x) = α(x) · f (x). Demonstração. Isto resulta do Teorema 15(a) juntamente com o Corolário do Teorema 2. Teorema 17. A imagem f (K) do conjunto compacto K ⊂ X pela aplicação contı́nua f : X → Rn é também um conjunto compacto. Demonstração. Seja (yk ) uma seqüência de pontos em f (K). Para cada k ∈ N existe xk ∈ K tal que f (xk ) = yk . Como K é compacto, uma subseqüência (xk )k∈N′ converge para um ponto a ∈ K. Sendo f contı́nua nesse ponto a, de lim′ xk = a resulta, pelo Teorema 15, que k∈N lim′ f (xk ) = f (a). Logo toda seqüência de pontos yk = f (xk ) ∈ f (K) k∈N possui uma subseqüência (yk )k∈N′ convergente para um ponto f (a) ∈ f (K). Noutras palavras: f (K) é compacto. Corolário 3. (Weierstrass.) Seja K ⊂ Rm compacto. Se f : K → R é uma função real contı́nua, então existem x0 , x1 ∈ K tais que f (x0 ) ≤ f (x) ≤ f (x1 ) para todo x ∈ K. Noutas palavras: toda função real contı́nua num conjunto compacto K atinge seus valores mı́nimo e máximo em pontos de K. Para provar o Teorema de Weierstrass basta observar que, sendo f (K) ⊂ R compacto, os números y0 = inf f (K) e y1 = sup f (K) pertencem a f (K), isto é, y0 = f (x0 ) e y1 = f (x1 ), com x0 , x1 ∈ K. Teorema 18. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e somente se, a imagem inversa f −1 (A) de todo conjunto aberto A ⊂ Rn é um subconjunto aberto em X. Demonstração. Seja f contı́nua. Se A ⊂ Rn é aberto então, para todo x ∈ f −1 (A) existe ε > 0 tal que B(f (x); ε) ⊂ A. Pela continuidade de f , x é centro de uma bola aberta Bx tal que f (Bx ∩X)⊂B(f (x); ε)⊂A, logo 22 Topologia do Espaço Euclidiano Cap. 1 x ∈ Bx ∩ X ⊂ f −1 (A). Isto valendo para todo x ∈ f −1 (A), resulta que f −1 (A) ⊂ U ∩X ⊂ f −1 (A), logo f −1 (A) = U ∩X, onde U é a reunião das bolas abertas Bx , x ∈ f −1 (A). Reciprocamente, suponhamos que, para todo aberto A ⊂ Rn , f −1 (A) seja aberto em X, isto é, f −1 (A) = U ∩ X com U aberto em Rm . Então, dados x ∈ X e ε > 0, tomamos A = B(f (x); ε) e obtemos U ⊂ Rm aberto tal que U ∩ X = f −1 (B(f (x); ε)). Certamente x ∈ U , logo existe δ > 0 tal que B(x; δ) ⊂ U e assim f (B(x; δ) ∩ X) ⊂ B(f (x); ε). Portanto, f é contı́nua em todos os pontos x ∈ X. Teorema 19. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e somente se, a imagem inversa de todo conjunto fechado F ⊂ Rn é um subconjunto f −1 (F ) fechado em X. Demonstração. Isto resulta do Teorema 18 se observarmos que, pondo A = Rn − F , então A é aberto em Rn e que f −1 (F ) = X − f −1 (A) é fechado em X se, e somente se, f −1 (A) é aberto em X. Observação. Dada f : X → Rn , se f (X) ⊂ Y ⊂ Rn podemos considerar f como uma aplicação de X em Y e escrever f : X → Y . Se A e F são subconjuntos de Rn então f −1 (A) = f −1 (A ∩ Y ) e f −1 (F ) = f −1 (F ∩ Y ). Logo podemos enunciar os Teoremas 18 e 19 assim: A aplicação f : X → Y é contı́nua se, e somente se, a imagem inversa por f de todo subconjunto aberto (respect. fechado) em Y é um subconjunto aberto (respect. fechado) em X. Corolário 4. Seja X ⊂ Rm aberto (respect. fechado). A fim de que f : X → Rn seja contı́nua é necessário e suficiente que a imagem inversa por f de todo subconjunto aberto (respect. fechado) em Rn seja um conjunto aberto (respect. fechado) em Rm . Corolário 5. Sejam f, g : X → R contı́nuas no conjunto X ⊂ Rm . O conjunto A = {x ∈ X; f (x) < g(x)} é aberto em X enquanto os conjuntos F = {x ∈ X; f (x) ≤ g(x)} e G = {x ∈ X; f (x) = g(x)} são fechados em X. Em particular, tomando g constante, vemos que o conjunto dos pontos x ∈ X tais que f (x) < c é aberto em X enquanto as soluções x ∈ X da inequação f (x) ≤ c ou da equação f (x) = c formam conjuntos fechados em X. Seção 8 Continuidade uniforme 23 Teorema 20. Sejam ϕ : K → Rn contı́nua no compacto K ⊂ Rm e L = ϕ(K) a imagem (compacta) de ϕ. A fim de que uma aplicação f : L → Rp seja contı́nua, é necessário e suficiente que a composta f ◦ ϕ : K → Rp seja contı́nua. K f ◦ϕ Rp ϕ f L Demonstração. Se f é contı́nua então f ◦ ϕ é contı́nua, pelo Teorema 14. Reciprocamente, supondo f ◦ ϕ contı́nua então, para todo conjunto fechado F ⊂ Rp , a imagem inversa (f ◦ ϕ)−1 (F ) = ϕ−1 [f −1 (F )] é um subconjunto fechado de K, logo é compacto. Então, pelo Teorema 17, f −1 (F ) = ϕ[ϕ−1 (f −1 (F ))] é compacto, logo fechado em Rm . Segue-se do Corolário 4 que f é contı́nua. Observação. Quando se tem uma aplicação arbitrária ϕ : K → L entre dois conjuntos, para todo Z ⊂ L vale a inclusão ϕ[ϕ−1 (Z)] ⊂ Z. Entretanto, quando ϕ : K → L é sobrejetiva, como no caso acima, tem-se ϕ[ϕ−1 (Z)] = Z. Exemplo 10. Tomemos K = [0, 2π] ⊂ R, L = S 1 = {(x, y) ∈ R2 ; x2 + y 2 = 1} e ϕ : [0, 2π] → R2 dada por ϕ(t) = (cos t, sen t). Então [0, 2π] e S 1 são compactos e ϕ : [0, 2π] → S 1 é contı́nua e sobrejetiva. Seja agora g : [0, 2π] → Rn uma aplicação contı́nua tal que g(0) = g(2π). A partir de g, podemos definir f : S 1 → Rn , pondo f (cos t, sen t) = g(t). Como g(0) = g(2π), f está bem definida. Além disso, f ◦ ϕ = g é contı́nua. Segue-se do Teorema 20 que f é contı́nua. Isto se exprime dizendo que “para definir uma aplicação contı́nua no cı́rculo S 1 basta defini-la no intervalo [0, 2π] de modo que assuma valores iguais nos extremos 0 e 2π.” ⊳ 8 Continuidade uniforme A adição e a multiplicação de números reais são funções contı́nuas s, p : R2 → R, definidas por s(x, y) = x + y e p(x, y) = x · y. Exa- 24 Topologia do Espaço Euclidiano Cap. 1 minemos a continuidade de cada uma delas no ponto (a, b) ∈ R2 . Para isso, usaremos em R2 a norma do máximo, segundo a qual tem-se (x, y) ∈ B((a, b); δ) se, e somente se, |x − a| < δ e |y − b| < δ. Comecemos com a adição: dado ε > 0, tomemos δ = ε/2. Se |x−a| < ε/2 e |y − b| < ε/2, isto é, (x, y) ∈ B((a, b), δ), então |s(x, y) − s(a, b)| = |x + y − (a + b)| ≤ |x − a| + |y − b| < ε. Em seguida, a multiplicação: dado ε > 0, temos xy − ab = (x − a) (y − b) + (x − a)b + a(y − b), logo, tomando δ > 0 menor do que cada um p ε ε e veremos que se |x − a| < δ dos números ε/3, 3(|a| + 1) 3(|b| + 1) e |y − b| < δ isto é, (x, y) ∈ B((a, b), δ), então |p(x, y) − p(a, b)| = |xy − ab| ≤ |x − a| |y − b| + |x − a| |b| + |a| |y − b| ≤ ε ε ε ≤ + + = ε. 3 3 3 Note-se a diferença: no caso da adição, δ depende apenas de ε, mas não do ponto (a, b) onde a continuidade é testada. Já na multiplicação, δ depende não apenas de ε mas também de (a, b). Se um dos números a ou b aumentar, para o mesmo ε deve-se tomar δ cada vez menor. Isto significa que a adição é uniformemente contı́nua mas a multiplicação não é. Segue-se a definição pertinente: Uma aplicação f : X → Rn diz-se uniformente contı́nua no conjunto X ⊂ Rm quando, para todo ε > 0, for possı́vel obter δ > 0 tal que |x − y| < δ ⇒ |f (x) − f (y)| < ε, sejam quais forem x, y ∈ X. Teorema 21. A fim de que f : X → Rn seja uniformente contı́nua no conjunto X ⊂ Rm é necessário e suficiente que, para todo par de seqüências de pontos xk , yk ∈ X com lim |xk − yk | = 0, se tenha lim |f (xk ) − f (yk )| = 0. Teorema 22. Toda aplicação contı́nua f : X → Rn , definida num conjunto compacto X ⊂ Rm , é uniformemente contı́nua. As demonstrações dos Teoremas 21 e 22 são exatamente as mesmas que se encontram nas páginas 83 e 84 do volume 1. Exemplo 11. Uma aplicação f : X → Rn , definida no conjunto X ⊂ Rm , chama-se lipschitziana quando existe c > 0 tal que |f (x) − f (y)| ≤ c|x − y| para quaisquer x, y ∈ X. O número c é chamado uma constante de Lipschitz de f . Toda aplicação lipschitziana é uniformemente Seção 9 Homeomorfismos 25 contı́nua: dado ε > 0, basta tomar δ = ε/c. A função f : [0, 1] → R, defi√ nida por f (x) = x, é uniformemente contı́nua mas não é lipschitziana. Basta ver que √ √ 1√ | x − y| = √x+ |x − y| y √ √ e que, com x, y ∈ [0, 1] pode-se tornar x + y tão pequeno, (logo √ √ ⊳ ( x + y)−1 tão grande) quanto se queira. Exemplo 12. Toda transformação linear A : Rm → Rn é contı́nua pois, para cada i = 1, 2, . . . , n, a i-ésima função-coordenada de A é a função contı́nua (x1 , . . . , xm ) 7→ ai1 x1 + · · · + aim xm , onde [aij ] é a matriz de A. A esfera unitária S m−1 = {x ∈ Rm ; |x| = 1} é compacta. Logo A é limitada em S m−1 . O número |A| = sup{|A · x|; x ∈ S m−1 } chama-se a norma da transformação A. Para todo vetor v ∈ Rm , tem-se v |A · v| ≤ |A| · |v|. Isto é óbvio quando v = 0. Se v 6= 0 então ∈ S m−1 |v| logo v |A · v| = |v| · |A | ≤ |A| |v|. |v| Para x, y ∈ Rm quaisquer, tem-se |A · x − A · y| = |A(x − y)| ≤ |A| · |x − y|. Logo a transformação linear A é uma aplicação lipschitziana, com constante de Lipschitz |A|. ⊳ Exemplo 13. Dado A ⊂ Rn não-vazio, seja f : Rn → R definida por f (x) = d(x, A). Afirmamos que |d(x, A) − d(y, A)| ≤ |x − y| para quaisquer x, y ∈ Rn . Logo f é lipschitziana, com constante c = 1, donde uniformemente contı́nua. Para provar nossa afirmação, observemos que, dados x, y ∈ Rn , existem ā, b̄ ∈ A tais que d(x, A) = |x − ā| e d(y, A) = |y − b̄|. (Vide seção 5.) Temos b̄ = lim yk , com yk ∈ A. Como |x − ā| ≤ |x − yk | para todo k ∈ N, segue-se que |x−ā| ≤ |x−b̄|. Sem perda de generalidade, podemos supor que d(x, A) ≥ d(y, A), logo |d(x, A)−d(y, A)| = d(x, A)−d(y, A) = |x − ā| − |y − b̄| ≤ |x − b̄| − |y − b̄| ≤ |x − y|, como querı́amos demonstrar. ⊳ Quando |f (x) − f (y)| ≤ |x − y| para quaisquer x, y ∈ X, a aplicação lipschitziana f : X → Rn chama-se uma contração fraca. Se |f (x) − f (y)| ≤ c|x − y| com 0 < c < 1, a aplicação f chama-se uma contração, simplesmente. 26 9 Topologia do Espaço Euclidiano Cap. 1 Homeomorfismos Um homeomorfismo do conjunto X ⊂ Rm sobre um conjunto Y ⊂ Rn é uma bijeção contı́nua f : X → Y cuja inversa f −1 : Y → X também é contı́nua. O gráfico de uma aplicação f : X → Rn , definida no conjunto X ⊂ m R é o conjunto G = {(x, f (x)); x ∈ X} ⊂ Rm × Rn . Se f é contı́nua então seu gráfico G é homeomorfo a seu domı́nio X. Com efeito, a aplicação contı́nua ϕ : X → G, dada por ϕ(x) = (x, f (x)), é um homomorfismo, cujo inverso (x, f (x)) 7→ x é a restrição a G da projeção de Rm × Rn sobre Rm . Exemplo 14. A aplicação f : [0, 2π) → S 1 , onde f (t) = (cos t, sen t), é uma bijeção contı́nua mas não é um homeomorfismo. Sua inversa f −1 : S 1 → [0, 2π) aplica o compacto S 1 sobre o intervalo [0, 2π), que não é compacto, logo é descontı́nua. Mais precisamente, f −1 é descontı́nua no ponto a = (1, 0) = f (0) ∈ S 1 . Com efeito, se pusermos, para cada k ∈ N, tk = (1 − 1/k) · 2π e zk = (cos tk , sen tk ), teremos lim zk = a mas lim f −1 (zk )= lim tk =2π, logo não vale lim f −1 (zk )=f −1 (a)=0. ⊳ Exemplo 15. A bola aberta B = B(0; 1) ⊂ Rn é homeomorfa ao espaço Rn . De fato, as aplicações f : Rn → B e g : B → Rn , definidas por x y f (x) = e g(y) = 1 + |x| 1 − |y| são contı́nuas e, como se verifica sem dificuldade, vale g(f (x)) = x, f (g(y)) = y, para quaisquer x ∈ Rn e y ∈ B, logo g = f −1 . ⊳ Exemplo 16. Sejam S n = {x ∈ Rn+1 ; hx, xi = 1} a esfera unitária n-dimensional e N = (0, . . . , 0, 1) ∈ S n seu pólo norte. A projeção estereográfica ξ : S n − {N } → Rn é um importante exemplo de homeomorfismo. Para todo x ∈ S n − {N }, ξ(x) é o ponto em que a semi-reta ⇀ N x corta o hiperplano xn+1 = 0, o qual identificamos com Rn . Os pontos ⇀ da semi-reta N x são da forma N +t(x−N ) com t > 0. Um tal ponto está no hiperplano Rn quando sua última coordenada 1 + t(xn+1 − 1) é igual a zero, ou seja, quando t = 1/(1 − xn+1 ). Logo ξ(x) = x′ /(1 − xn+1 ), onde x′ = (x1 , . . . , xn ) para x = (x1 , . . . , xn , xn+1 ). Isto mostra que ξ : S n − {N } → Rn é contı́nua. Seja agora ϕ : Rn → S n − {N } dada por ϕ(y) = x, onde x′ = 2y/(|y|2 + 1) e xn+1 = (|y|2 − 1)/(|y|2 + 1). Uma verificação simples mostra que ξ(ϕ(y)) = y para todo y ∈ Rn e Seção 10 Conjuntos conexos 27 ϕ(ξ(x)) = x para todo x ∈ S n . Portanto a aplicação contı́nua ϕ : Rn → S n − {N } é a inversa de ξ e conseqüentemente, ξ e um homeomorfismo. ⊳ Teorema 23. Se K ⊂ Rm é compacto então toda aplicação contı́nua injetiva f : K → Rn é um homeomorfismo sobre sua imagem (compacta) L = f (K). Demonstração. Chamemos de g : L → K a inversa de f . Como L ⊂ Rn é compacto, portanto fechado, pelo Teorema 19, g é contı́nua se, e somente se, para todo conjunto fechado F ⊂ Rm , a imagem inversa g −1 (F ) = g −1 (F ∩ K) é um fechado em Rn . Mas F ∩ K é compacto, logo g −1 (F ∩ K) = f (F ∩ K) é compacto (em virtude do Teorema 17) logo é fechado. O teorema acima resulta do Teorema 20, com f em vez de ϕ e f −1 no lugar de f . Ele mostra por que foi possı́vel dar o Exemplo 14: o intervalo [0, 2π) não é compacto. 10 Conjuntos conexos Uma cisão do conjunto X ⊂ Rn é uma decomposição X = A ∪ B onde A∩B = A∩B = ∅, isto é, nenhum ponto de A é aderente a B e nenhum ponto de B é aderente a A. Um exemplo óbvio é a cisão trivial X = X ∪ ∅. Já R − {0} = (−∞, 0) ∪ (0, +∞) é uma cisão não-trivial. Por outro lado, pondo A = (−∞, 0] e B = (0, +∞) a decomposição R = A ∪ B não é uma cisão pois 0 ∈ A ∩ B. Se X = A ∪ B é uma cisão então os pontos de X que são aderentes a A, não pertencendo a B, estão em A, logo A = A ∩ X. Analogamente, B = B ∩ X. Assim, A e B são ambos fechados em X. Como A = X − B e B = X − A, segue-se que A e B são também abertos em X. Reciprocamente, se A ⊂ X é aberto e fechado em X então, pondo B = X −A, a decomposição X = A∪B é uma cisão. Com efeito, nenhum ponto de X aderente a A pode pertencer a B pois A é fechado em X e, da mesma forma, nenhum ponto de X aderente a B pode pertencer a A. Em particular, se X ⊂ Rn é aberto, uma cisão X = A ∪ B é uma expressão de X como reunião de dois abertos disjuntos. E se X ⊂ Rn é fechado, toda cisão X = A ∪ B é a expressão de X como reunião de 28 Topologia do Espaço Euclidiano Cap. 1 dois conjuntos fechados disjuntos. Mais particularmente ainda, se X é compacto então A e B são compactos. Exemplo 17. Escrevendo as linhas de uma matriz, uma após a outra, 2 numa só lista, identificaremos o espaço Rn com o conjunto das matrizes quadradas n × n. Sejam Gn , G+ e G− respectivamente os conjuntos das matrizes com determinante 6= 0, das matrizes com determinante > 0 e com determinante < 0. A igualdade Gn = G+ ∪ G− é uma cisão, pois uma seqüência de matrizes com determinantes positivos não pode convergir para uma matriz de determinante negativo. Assim G+ ∩ G− = ∅. Analogamente, G+ ∩ G− = ∅. Se X = A ∪ B é uma cisão então, para todo Z ⊂ X, Z = (A ∩ Z) ∪ (B ∩ Z) é uma cisão. Um conjunto X ⊂ Rn chama-se conexo quando só admite a cisão trivial. Caso contrário, diz-se que X é desconexo. Como vimos no Exemplo 17 acima, o conjunto ds matrizes n×n com determinante 6= 0 é desconexo. Na página 51 do vol. 1 foi provado que todo intervalo da reta R (seja ele aberto ou não, limitado ou não) é conexo. Vale a recı́proca: Teorema 24. Os únicos subconjuntos conexos de R são os intervalos. Demonstração. Suponha que X ⊂ R não seja um intervalo. Então existem a < c < b tais que a, b ∈ X e c ∈ / X. Neste caso, pondo A = {x ∈ X; x < c} e B = {x ∈ X; x > c}, vemos que X = A ∪ B é uma cisão. Como a ∈ A e b ∈ B, esta cisão não é trivial. Portanto X é desconexo. Teorema 25. (a) A imagem do conjunto conexo X ⊂ Rm por uma aplicação contı́nua f : X → Rn é um conjunto conexo. S Xλ de uma famı́lia qualquer de conjuntos conexos (b) A reunião X = λ∈L Xλ ⊂ Rn que têm um ponto a em comum é um conjunto conexo. (c) O produto cartesiano X × Y ⊂ Rm+n dos conjuntos X ⊂ Rm e Y ⊂ Rn é um conjunto conexo se, e somente se, X e Y são conexos. (d) Se X ⊂ Rn é conexo e X ⊂ Y ⊂ X então Y é conexo. Em particular, o fecho de um conjunto conexo é conexo. Demonstração. (a) Se f (X) = A ∪ B é uma cisão da imagem de X então A e B são ambos abertos e fechados em f (X), além de disjuntos. Seção 10 Conjuntos conexos 29 Logo f −1 (A) e f −1 (B) são também disjuntos, abertos e fechados em X, portanto X = f −1 (A) ∪ f −1 (B) é uma cisão, a qual é trivial pois X é conexo. Mas A = f (f −1 (A)) e B = f (f −1 (B)) porque A e B estão contidos em f (X). Assim, A ou B é vazio e daı́ a cisão f (X) = A ∪ B é trivial. Então f (X) é conexo. (b) Seja a tal que a ∈ Xλ para todo λ ∈ L. Se X = A ∪ B é uma cisão então o ponto a pertence a um dos conjuntos, A ou B. Digamos que a ∈ A. Para todo λ ∈ L, Xλ = (A ∩ Xλ ) ∪ (B ∩ Xλ ) é uma cisão, a qual é trivial pois XλSé conexo. Como a ∈ A ∩ Xλ , segue-se que B ∩ Xλ é vazio. Logo B = (B ∩ Xλ ) é vazio e a cisão X = A ∪ B é trivial. λ Portanto X é conexo. (c) Se X × Y é conexo então X e Y são conexos porque são as imagens de X × Y pelas projeções p : X × Y → X, p(x, y) = x e q : X × Y → Y , q(x, y) = y, as quais são contı́nuas. Reciprocamente, se X e Y são conexos, tomamos um ponto c = (a, b) ∈ X × Y . Para cada z = (x, y) ∈ X ×Y o conjunto Cz = (X ×{b})∪({x})×Y ) é conexo pois é reunião dos conjuntos conexos X ×{b} e {x}×Y (homeomorfos respectivamente a X e Y ) com o ponto (x, b) em comum. S Além disso, também c = (a, b) ∈ Cz para todo z ∈ X × Y e X × Y = Cz logo, pelo item (b), X × Y é z conexo. (d) Seja Y = A ∪ B uma cisão. Então X = (A ∩ X) ∪ (B ∩ X) também é uma cisão. Como X é conexo, tem-se, digamos, A ∩ X = ∅. De X ⊂ Y e Y = A ∪ B resulta então que X ⊂ B, logo X ⊂ B e daı́ Y ⊂ B, pois Y ⊂ X. Assim, tem-se A = A ∩ Y ⊂ A ∩ B = ∅, ou seja, A = ∅. Portanto toda cisão Y = A ∪ B é trivial e Y é conexo. Corolário 6. Se X1 , . . . , Xk são conexos então X1 × · · · × Xk é conexo. Em particular, Rn = R × · · · × R é conexo. Com efeito, X1 × X2 × X3 = (X1 × X2 ) × X3 e assim por diante. Corolário 7. Se X ⊂ Rn é conexo então a imagem de toda função real contı́nua f : X → R é um intervalo. Com efeito, pelo Teorema 24 todo subconjunto conexo de R é um intervalo. Este corolário é conhecido como o Teorema do Valor Intermediário pois pode também ser enunciado assim: “Sejam X ⊂ Rn conexo e f : X → R contı́nua. Se a, b ∈ X são tais que f (a) < f (b) então, 30 Topologia do Espaço Euclidiano Cap. 1 para cada d com f (a) < d < f (b), existe c ∈ X tal que f (c) = d.” Corolário 8 (“Teorema da Alfândega”). Seja X ⊂ Rn um conjunto arbitrário. Se um conjunto conexo C ⊂ Rn contém um ponto a ∈ X e um ponto b ∈ / X então C contém um ponto c ∈ fr.X. Com efeito, a função contı́nua f : C → R, definida por f (x) = d(x, X) − d(x, Rn − X), é tal que f (a) ≤ 0 e f (b) ≥ 0. Logo, pelo Teorema do Valor Intermediário, deve existir c ∈ C tal que f (c) = 0, isto é, d(c, X) = d(c, Rn − X). Como c ∈ X ou c ∈ Rn − X, um desses dois números é zero, logo ambos o são e daı́ c ∈ fr.X. Como Rn é conexo, resulta do corolário acima que se o conjunto X ⊂ Rn não é vazio nem coincide com Rn então a fronteira de X não é vazia. De fato, se X 6= ∅ e X 6= Rn então o conjunto conexo Rn contém algum ponto de X e algum ponto que não pertence a X, logo contém algum ponto da fronteira de X. Exemplo 18. Para todo n ∈ N, a esfera S n é um conjunto conexo. Com efeito, retirando o pólo norte N = (0, . . . , 0, 1), vemos que X = S n −{N } é conexo por ser homeomorfo a Rn (cfr. Exemplo 16). Como S n = X, segue-se do item (d) que a esfera S n é conexa. Exemplo 19. Uma conseqüência do Teorema do Valor Intermediário é que para toda função real contı́nua f : S 1 → R existe (pelo menos) um ponto z ∈ S 1 tal que f (z) = f (−z). Para ver isto, consideremos a função contı́nua ϕ : S 1 → R, dada por ϕ(z) = f (z) − f (−z). Vale ϕ(−z) = −ϕ(z). Assim, ou ϕ(z) = 0 para todo z (assunto encerrado) ou existe a ∈ S 1 com ϕ(−a) < 0 < ϕ(a), logo ϕ(z) = 0 para algum z ∈ S 1 , pois S 1 é conexo. ⊳ Existe uma noção bem geométrica que fornece uma condição suficiente para a conexidade de um conjunto, que é a conexidade por caminhos. Um caminho num conjunto X ⊂ Rn é uma aplicação contı́nua f : I → X, definida num intervalo I. Por exemplo, dados x, y ∈ Rn , o caminho f : [0, 1] → Rn , definido por f (t) = (1 − t)x + ty, chama-se o caminho retilı́neo que liga x a y. Às vezes nos referiremos a ele como o caminho [x, y]. Diremos que os pontos a, b ∈ X podem ser ligados por um caminho em X quando existe um caminho f : I → X tal que a = f (α), b = f (β) com α < β ∈ I. Seção 10 Conjuntos conexos 31 Por exemplo, se X ⊂ Rn é convexo, dois pontos quaisquer a, b ∈ X podem ser ligados por um caminho em X, a saber, o caminho retilı́neo [a, b]. Se a, b ∈ X podem ser ligados por um caminho f : I → X, então existe um caminho ϕ : [0, 1] → X tal que ϕ(0) = a e ϕ(1) = b. Basta pôr ϕ(t) = f ((1 − t)α + tβ), onde a = f (α) e b = f (β). Se f, g : [0, 1] → X são caminhos em X, com f (1) = g(0), então definimos o caminho justaposto h = f ∨g : [0, 1] → X pondo h(t) = f (2t) se 0 ≤ t ≤ 1/2 e h(t) = g(2t − 1) se 1/2 ≤ t ≤ 1. Note que estas duas expressões definem o mesmo valor de h(1/2). Como h|[0, 1/2] e h|[1/2, 1] são contı́nuas, segue-se que h é contı́nua. Intuitivamente, o caminho h percorre a trajetória de f (com velocidade dobrada) até t = 1/2 e depois, para t ≥ 1/2, descreve (ainda com velocidade dobrada) o percurso de g. Sejam a, b, c pontos do conjunto X ⊂ Rn . Se a, b podem ser ligados por um caminho em X e b, c também podem ser ligados por um caminho em X, então existe um caminho em X ligando a a c. Basta tomar caminhos f, g : [0, 1] → X com f (0) = a, f (1) = b, g(0) = b, g(1) = c e pôr h = f ∨ g. Então h(0) = a, h(1) = c. Um conjunto X ⊂ Rn diz-se conexo por caminhos quando dois pontos quaisquer a, b ∈ X podem ser ligados por um caminho em X. Todo conjunto convexo X ⊂ Rn é conexo por caminhos. Em particular, toda bola (aberta ou fechada) no espaço euclidiano é conexa por caminhos. A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é conexa por caminhos. Com efeito, dados a, b ∈ S n , se a e b não são antı́podas, isto é, se b 6= −a, então f : [0, 1] → S n , definida por f (t) = (1 − t)a + tb |(1 − t)a + tb| é contı́nua (pois seu denominador nunca se anula), com f (0) = a, f (1) = b. Se, porém, b = −a, tomamos um ponto c ∈ S n − {a, b}, ligamos a com c e c com b pelo processo acima. O caminho justaposto ligará o ponto a ao seu antı́poda b. Todo conjunto X ⊂ Rn , conexo por caminhos, é conexo. Com efeito, fixando a ∈ X seja, para cada x ∈ X, Cx a imagem de um caminho em X ligando a até x. Pelo item (a) do Teorema 25, Cx é um conjunto conexo que contém a e x. Logo, pelo item (b) do mesmo S teorema, o conjunto X = Cx é conexo. x∈X 32 Topologia do Espaço Euclidiano Cap. 1 A recı́proca é falsa. O conjunto X0 ⊂ R2 , reunião do gráfico da função f (x) = cos(1/x), 0 < x ≤ 1, com a origem p = (0, 0), é conexo mas não é conexo por caminhos. Com efeito, X0 está compreendido entre o gráfico da função contı́nua f (o qual é conexo por ser homeomorfo a (0, 1]) e o fecho desse mesmo gráfico. Assim, pelo Teorema 25, X0 é conexo. Mas não é conexo por caminhos pois todo caminho λ : [0, 1] → X0 com λ(0) = p é constante. (Ver pag. 103 do livro “Espaços Métricos”, do autor.) Há, porém, um caso particular importante, no qual a conexidade implica em conexidade por caminhos: quando o conjunto X ⊂ Rn é aberto. Diremos que f : [0, 1] → X é um caminho poligonal em X quando f é a justaposição de um número finito de caminhos retilı́neos. Teorema 26. Um aberto A ⊂ Rn é conexo se, e somente se, é conexo por caminhos. Demonstração. Seja A ⊂ Rn aberto e conexo. Fixemos um ponto a ∈ A e consideremos o conjunto U , formado pelos pontos x ∈ A que podem ser ligados ao ponto a por um caminho poligonal contido em A. Afirmamos que U é aberto. Com efeito, seja x ∈ U . Sendo A aberto, existe B = B(x; r), com x ∈ B ⊂ A. Como a bola B é convexa, todo ponto y ∈ B pode ser ligado a x por um segmento de reta contido em B, logo y se liga a a por um caminho poligonal contido em A. Portanto B ⊂ U e U ⊂ A é aberto. Também V = A − U é aberto, pois se v ∈ V então v não pode ser ligado a a por um caminho poligonal contido em A. Tomando uma bola aberta B1 , com v ∈ B1 ⊂ A, todo z ∈ B1 se liga a v por um segmento de reta contido em B1 . Se z pudesse ser ligado a a por um caminho poligonal contido em A, justapondo-se [v, z] a esse caminho, verı́amos que v ∈ U , um absurdo. Temos então A = U ∪ V , uma cisão. Como A é conexo e a ∈ U , temos V = ∅, donde A = U , o que prova o teorema. Corolário 9 (da demonstração). Se A ⊂ Rn é aberto e conexo, dois pontos quaisquer de A podem ser ligados por um caminho poligonal contido em A. Mostraremos a seguir que todo conjunto X ⊂ Rn se exprime como reunião disjunta de subconjuntos conexos máximos, chamados componentes conexas de X. Seção 11 Limites 33 Sejam x ∈ X ⊂ Rn . A componente conexa do ponto x no conjunto X é a reunião Cx de todos os subconjuntos conexos de X que contêm o ponto x. Por exemplo, se X = Q ⊂ R então a componente conexa de qualquer ponto x ∈ X é {x}. Por outro lado, se X ⊂ Rn é conexo então, para todo x ∈ X temos Cx = X. Se X = R − {0} então a componente conexa de 1 em X é (0, +∞) enquanto que a componente conexa de −1 é (−∞, 0). Dados x ∈ X ⊂ Rn , a componente conexa Cx é um conjunto conexo, pelo Teorema 25(b). Na realidade, Cx é o maior subconjunto conexo de X contendo o ponto x. Com efeito, se C ⊂ X é conexo e contém x, então C é um dos conjuntos cuja reunião é Cx , logo C ⊂ Cx . Mais ainda, se C ⊂ X é conexo e tem algum ponto em comum com Cx então C ⊂ Cx , pois C ∪ Cx é conexo contendo x logo C ∪ Cx ⊂ Cx e daı́ C ⊂ Cx . Em particular, nenhum subconjunto conexo de X pode conter Cx propriamente. Sejam x, y dois pontos de X. Suas componentes conexas Cx e Cy ou coincidem ou são disjuntas pois se z ∈ Cx ∩Cy então Cx ⊂ Cy e Cy ⊂ Cx . Assim a relação “x e y pertencem à mesma componente conexa em X ”é uma equivalência no conjunto X. As classes de equivalência são as componentes conexas dos pontos de X. Toda componente conexa Cx é um conjunto fechado em X. Com efeito, sendo Cx ⊂ C x ∩ X ⊂ C x , o Teorema 25(d) nos assegura que C x ∩X é um subconjunto conexo de X, contendo Cx . Logo C x ∩X = Cx , o que mostra que Cx é fechado em X. 11 Limites Sejam f : X → Rn definida no conjunto X ⊂ Rm e a ∈ Rm um ponto de acumulação de X. Diz-se que b ∈ Rn é o limite de f (x) quando x tende para a e escreve-se lim f (x) = b quando a seguinte condição é válida: x→a “para todo ε > 0 dado, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam |f (x) − b| < ε”. O ponto a pode pertencer ou não a X. Em muitos dos exemplos mais importantes de limite, na verdade, tem-se a ∈ / X. Mas, mesmo que a pertença a X, o valor f (a) não desempenha papel algum na definição de limite. 34 Rn Topologia do Espaço Euclidiano Cap. 1 Quando o ponto de acumulação a pertence a X, a aplicação f : X → é contı́nua no ponto a se, e somente se, lim f (x) = f (a). x→a A propriedade seguinte decorre imediatamente da definição mas é útil o bastante para ser destacada como um teorema. Teorema 27 (Permanência do sinal). Sejam a um ponto de acumulação de X ⊂ Rn e f : X → R uma função real. Se b = lim f (x) é x→a um número positivo então existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam f (x) > 0. Demonstração. Como b é positivo, tomamos ε = b. Pela definição de limite, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam b − ε < f (x) < b + ε, isto é, 0 < f (x) < 2b, logo f (x) > 0. Quando X é um intervalo da reta, tem sentido a noção de limite lateral de uma aplicação f : I → Rn , ou seja, de um caminho, num ponto a ∈ I. Por exemplo, se a não é o extremo superior de I, diz-se que b ∈ Rn é o limite à direita de f (t) quando t tende para a, e escreve-se lim f (t) = b, para significar que: t→a+ Para todo ε > 0 dado, existe δ > 0 tal que a < t < a + δ implica t ∈ I e |f (t) − b| < ε. Analogamente se define o limite à esquerda lim f (t). t→a− Assim como a continuidade de uma aplicação, a existência e o valor do limite se exprimem em termos das funções-coordenada, como veremos agora. Teorema 28. Sejam a um ponto de acumulação do conjunto X, f : X → Rn uma aplicação e f1 , f2 . . . , fn : X → R as funções-coordenada de f . Então lim f (x) = b = (b1 , b2 , . . . , bn ) se, e somente se, x→a lim fi (x) = bi para cada i = 1, . . . , n. x→a Demonstração. Se lim f (x) = b então, para cada i = 1, . . . , n, temx→a se lim fi (x) = bi porque |fi (x) − bi | ≤ |f (x) − b|. Reciprocamente, x→a se lim fi (x) = bi para cada i = 1, . . . , n então lim f (x) = b porque x→a x→a n P |fi (x) − bi |. |f (x) − b| ≤ i=1 Seção 11 Limites 35 A proposição seguinte relaciona o limite de aplicações com o limite de seqüências. Teorema 29. Seja a um ponto de acumulação do conjunto X ⊂ Rm . A fim de que se tenha lim f (x) = b é necessário e suficix→a ente que, para toda seqüência de pontos xk ∈ X − {a} com lim xk = a, seja lim f (xk ) = b. A demonstração é idêntica à feita no vol. 1 (pág. 63). Teorema 30. Sejam: a um ponto de acumulação de X ⊂ Rm , b ∈ Y , f : X → Y uma aplicação tal que lim f (x) = b e g : Y → Rp contı́nua x→a no ponto b. Então lim g(f (x)) = g(b). x→a Isto é mais fácil de provar do que enunciar. Basta imitar a demonstração de que a composta de duas aplicações contı́nuas é contı́nua (Teorema 14). Teorema 31. Sejam f, g : X → Rn e α : X → R definidas no conjunto X ⊂ Rm e a um ponto de acumulação de X. Se existem lim f (x) = b, x→a lim g(x) = c e lim α(x) = α0 , então existem os limites e valem as x→a x→a igualdades abaixo: lim α(x) · f (x) = α0 · b lim [f (x) + g(x)] = b + c, x→a x→a lim hf (x), g(x)i = hb, ci, x→a lim |f (x)| = |b|. x→a Demonstração. A aplicação s : Rn × Rn → Rn , definida por s(x, y) = x + y, é contı́nua. Observando que f (x) + g(x) = s(f (x), g(x)), resulta do Teorema 30 que lim [f (x) + g(x)] = lim f (x) + lim g(x) = b + c. x→a x→a x→a Analogamente para as outras três igualdades. Além disso, é útil saber que se lim α(x) = 0 e f : X → Rn é limitada x→a na vizinhança de a (isto é, existem δ > 0 e M > 0 tais que x ∈ X e |x − a| < δ implicam |f (x)| ≤ M ) então lim α(x)f (x) = 0, mesmo que x→a não exista lim f (x). (Muito fácil.) x→a Exemplo 20. Seja g : R2 − {0} → R definida por g(x, y) = x2 y/(x2 + y 2 ). Então podemos escrever g(x, y) = α(x, y) · f (x, y) onde α(x, y) = x e xy x y f (x, y) = 2 =p ·p = cos θ sen θ, 2 2 2 x + y2 x +y x + y2 36 Topologia do Espaço Euclidiano Cap. 1 sendo θ o ângulo de eixo OX com o segmento Oz, z = (x, y). Assim, temos lim α(x, y) = 0 e |f (x, y)| ≤ 1, logo lim g(x, y) = 0. ⊳ (x,y)→(0,0) (x,y)→(0,0) Agora que já vimos ser lim (f (x) − g(x)) = lim f (x) − lim g(x), x→a x→a x→a podemos demonstrar a seguinte conseqüência do Teorema 27: Teorema 32 (Permanência da desigualdade). Sejam f, g : X → R definidas no conjunto X ⊂ Rm e a um ponto de acumulação de X. Se f (x) ≤ g(x) para todo x ∈ X e existem lim f (x) e lim g(x) então tem-se lim f (x) ≤ lim g(x). x→a x→a x→a x→a Demonstração. Se fosse o contrário, lim f (x) > lim g(x), terı́amos x→a x→a lim (f (x) − g(x)) > 0 e então, pelo Teorema 27, valeria f (x) > g(x) para x→a todo x ∈ X suficientemente próximo de a, uma contradição. 12 Exercı́cios Seção 1: O espaço euclidiano n-dimensional 1. Se |u + v| = |u| + |v| com u 6= 0 (norma euclidiana), prove que existe α ≥ 0 tal que v = α · u. 2. Sejam x, y, z ∈ Rn tais que (na norma euclidiana) |x − z| = |x − y| + |y − z|. Prove que existe t ∈ [0, 1] tal que y = (1 − t)x + tz. Mostre que isto seria falso nas normas do máximo e da soma. 3. Sejam x, y ∈ Rn não-nulos. Se todo z ∈ Rn que é ortogonal a x for também ortogonal a y, prove que x e y são múltiplos um do outro. 1 4. Se |x| = |y|, prove que z = (x + y) é ortogonal a y − x. (A mediana de um 2 triângulo isósceles é também altura.) Seção 2: Bolas e conjuntos limitados 1. Dados a 6= b em Rn determine c, pertencente à reta ab, tal que c ⊥ (b − a). Conclua que para todo x ∈ ab, com x 6= c, tem-se |c| < |x|. Interprete geometricamente. 2. Sejam |x| = |y| = r, com x 6= y (norma euclidiana). Se 0 < t < 1, prove que |(1 − t)x + ty| < r. Conclua que a esfera S(0; r) não contém segmentos de reta. 3. Dados o conjunto convexo X ⊂ Rn e o número real r > 0, seja B(X; r) = S B(x; r). Prove que B(X; r) é convexo. x∈X 4. Prove que o conjunto X = {(x, y) ∈ R2 ; x2 ≤ y} é convexo. 5. Seja T : Rm → Rn uma transformação linear. Prove que se T 6= 0 então T não é uma aplicação limitada. Se X ⊂ Rm é um conjunto limitado, prove que a restrição TX : X → Rn de T ao conjunto X é uma aplicação limitada. Seção 12 Seção 3: Exercı́cios 37 Conjuntos abertos 1. Para todo conjunto X ⊂ Rm , prove que int.X é um conjunto aberto, isto é, int.int. X = int.X. 2. Prove que int.X é o maior conjunto aberto contido em X, ou seja, se A é aberto e A ⊂ X então A ⊂ int.X. 3. Dê exemplo de um conjunto X ⊂ Rn cuja fronteira tem interior não-vazio e prove que isto não seria possı́vel se X fosse aberto. 4. Seja πi : Rn → R a projeção sobre a i-ésima coordenada, isto é, se x = (x1 , . . . , xn ) então πi (x) = xi . Prove que se A ⊂ Rn é aberto então sua projeção πi (A) ⊂ R também é um conjunto aberto. 5. Prove que toda coleção de abertos dois a dois disjuntos e não-vazios em Rn é enumerável. Seção 4: Seqüências em Rn 1. Dada a seqüência (xk )k∈N em Rn , sejam N′ e N′′ subconjuntos infinitos de N tais que N = N′ ∪ N′′ . Se as subseqüências (xk )k∈N′ e (xk )k∈N′′ convergem para o mesmo limite a, prove que lim xk = a. k∈N 2. Dada a seqüência (xk )k∈N em Rn , prove que as seguintes afirmações são equivalentes: (a) lim |xk | = +∞ k→∞ (b) (xk )k∈N não possui subseqüências convergentes (c) Para cada conjunto limitado X ⊂ Rn , o conjunto NX = {k ∈ N; xk ∈ X} é finito. 3. Sejam A ⊂ Rn aberto e a ∈ A. Prove que se lim xk = a então existe k0 ∈ N tal que k > k0 ⇒ xk ∈ A. k→∞ 4. Se a ∈ fr.X, prove que existem seqüências de pontos xk ∈ X e yk ∈ Rn − X tais que lim xk = lim yk = a. Vale a recı́proca? Seção 5: Conjuntos fechados 1. Para quaisquer X, Y ⊂ Rn , prove que X ∪ Y = X ∪ Y e X ∩ Y ⊂ X ∩ Y . Dê um exemplo onde não vale X ∩ Y = X ∩ Y . 2. Diz-se que o ponto a ∈ Rn é valor de aderência da seqüência (xk )k∈N quando a é limite de alguma subseqüência de (xk ). Prove que o conjunto dos valores de aderência de qualquer seqüência é fechado. 3. Prove que um conjunto A ⊂ Rn é aberto se, e somente se, A ∩ X ⊂ A ∩ X para todo X ⊂ Rn . 4. Se X ⊂ Rm e Y ⊂ Rn , prove que se tem X × Y = X × Y em Rm+n . 5. Prove que X ⊂ Rn é fechado se, e somente se X ⊃ f r.X. Por outro lado, A ⊂ Rn é aberto se, e somente se, A ∩ f r.A = ∅. 38 Topologia do Espaço Euclidiano Cap. 1 6. Sejam A, B ⊂ Rn conjuntos limitados disjuntos e não-vazios. Se d(A, B) = 0, prove que existe x ∈ f r.A ∩ f r.B. 7. Prove que o fecho de um conjunto convexo é convexo. 8. Prove que se C ⊂ Rn é convexo e fechado então, para todo x ∈ Rn , existe um único x̄ = f (x) ∈ C tal que d(x, C) = |x − x̄|. Seção 6: Conjuntos compactos 1. Seja K ⊂ Rn compacto, não-vazio. Prove que existem x, y ∈ K tais que |x − y| = diam.K. 2. Se toda cobertura aberta de um conjunto X ⊂ Rn admite uma subcobertura finita, prove que X é compacto. 3. Seja (xk ) uma seqüência limitada em Rn que possui um único valor de aderência. Prove que (xk ) é convergente. Dê exemplo de uma sequência (nãolimitada) não-convergente que tem um único valor de aderência. 4. Se K ⊂ U ⊂ Rn , com K compacto e U aberto, prove que existe ε > 0 tal que x ∈ K, y ∈ Rn , |x − y| < ε ⇒ [x, y] ⊂ U . 5. Seja X ⊂ Rn tal que, para todo compacto K ⊂ Rn , a interseção X ∩ K é compacta. Prove que X é fechado. Seção 7: Aplicações contı́nuas 1. Seja f : Rm → Rn contı́nua. Prove que as seguintes condições são equivalentes: (a) Para todo compacto K ⊂ Rn , a imagem inversa f −1 (K) ⊂ Rm é compacta. (b) Se (xk ) é uma seqüência em Rm sem subseqüências convergentes, o mesmo se dá com a seqüência (f (xk )) em Rn . (Ou seja, lim xk = ∞ ⇒ lim f (xk ) = ∞.) 2. Prove que um polinômio complexo não-constante p(z) = a0 + a1 z + · · · + an z n , considerado como uma aplicação p : R2 → R2 , cumpre uma das (portanto ambas) condições do exercı́cio anterior. 3. Sejam X ⊂ Rm , K ⊂ Rn compacto e f : X × K → Rp contı́nua. Suponha que, para cada x ∈ X, exista um único y ∈ K tal que f (x, y) = 0. Prove que y depende continuamente de x. 4. Seja K ⊂ Rn compacto. Prove que a projeção π : Rm ×Rn → Rm , π(x, y) = x, transforma todo subconjunto fechado F ⊂ Rm × K num conjunto fechado π(F ) ⊂ Rm . Dê exemplo de F ⊂ Rm × Rn fechado tal que π(F ) ⊂ Rm não seja fechado. Seção 8: Continuidade uniforme 1. Sejam F, G ⊂ Rn fechados disjuntos não-vazios. A função contı́nua f : Rn → d(x, F ) [0, 1], definida por f (x) = cumpre f (x) = 0 para todo x ∈ F d(x, F ) + d(x, G) e f (x) = 1 para todo x ∈ G. Ela se chama a função de Urysohn do par (F, G). Prove que se ela é uniformemente contı́nua, então d(F, G) > 0. Seção 12 Exercı́cios 39 2. Seja Y ⊂ X ⊂ Rm com Y denso em X. Se a aplicação contı́nua f : X → Rn é tal que sua restrição f |Y é uniformemente contı́nua, prove que f é uniformemente contı́nua. 3. Seja X ⊂ Rm um conjunto limitado. Se f : X → Rn é uniformemente contı́nua, prove que f (X) ⊂ Rn também é limitado. 4. Sejam f, g : X → R uniformemente contı́nuas no conjunto X ⊂ Rm . Prove que a soma f + g : X → R é uniformemente contı́nua e o mesmo se dá com o produto f · g : X → R caso f e g sejam limitadas. 5. Seja C ⊂ Rn convexo. Se x ∈ Rn e x̄ ∈ C são tais que |x − x̄| = d(x, C), prove que hx − x̄, y − x̄i ≤ 0 para todo y ∈ C. 6. Dado C ⊂ Rn convexo e fechado, seja f : Rn → C definida por f (x) = x̄, onde x̄ é o único ponto de C tal que |x− x̄| = d(x, C). Prove que |f (x)−f (y)| ≤ |x−y| para quaisquer x, y ∈ Rn , logo f é uniformemente contı́nua. Seção 9: Homeomorfismos 1. Chama-se semi-reta de origem 0 em Rn a um conjunto do tipo σ = {tv; t ≥ 0, 0 6= v ∈ Rn }. Seja X ⊂ Rn − {0} um conjunto compacto que tem um (único) ponto em comum com cada semi-reta com origem 0. Prove que X é homeomorfo à esfera S n−1 . 2. Estabeleça um homeomorfismo entre Rn − {0} e o produto cartesiano S n−1 × R ⊂ Rn+1 . 3. Mostre que existe um homeomorfismo do produto cartesiano S m × S n sobre um subconjunto de Rm+n+1 . 4. Dê exemplo de conjuntos X, Y ⊂ Rn e pontos a ∈ X, b ∈ Y tais que X − {a} e Y − {b} são homeomorfos mas X não é homeomorfo a Y . 5. Sejam X ⊂ Rm , Y ⊂ Rn compactos, a ∈ X e b ∈ Y . Se X − {a} é homeomorfo a Y − {b}, prove que X e Y são homeomorfos. Seção 10: Conjuntos conexos 1. Prove que um conjunto X ⊂ Rn é conexo se, e somente se, para cada par de pontos a, b ∈ X existe um conjunto conexo Cab ⊂ X tal que a ∈ Cab e b ∈ Cab . 2. Seja Z ⊂ Rn (n ≥ 2) um conjunto enumerável. Dados arbitrariamente os pontos a, b ∈ Rn − Z, prove que existe c ∈ Rn tal que os segmentos de reta [a, c] e [c, b] estão ambos contidos em Rn − Z. Conclua que o complementar de um conjunto enumerável em Rn é conexo. 3. Prove que S 1 e S 2 não são homeomorfos. 4. Prove que S 1 não é homeomorfo a um subconjunto de R. 5. Quantas componentes conexas tem o conjunto X = {(x, y) ∈ R2 ; (x · y)2 = x · y}? Especifique-as. Seção 11: Limites 1. Se f : X → Rn é uniformemente contı́nua no conjunto X ⊂ Rm , prove que, para todo a, ponto de acumulação de X, existe lim f (x). x→a 40 Topologia do Espaço Euclidiano Cap. 1 2. Seja Y ⊂ X ⊂ Rm , com Y denso em X. Para toda aplicação uniformemente contı́nua f : Y → Rn , prove que existe uma única aplicação F : X → Rn , uniformemente contı́nua, tal que F (y) = f (y) para todo y ∈ Y . 3. Dada f : Rm → Rn , diz-se que se tem lim f (x) = ∞ quando para todo B > 0 x→∞ existe A > 0 tal que |x| > A ⇒ |f (x)| > B. Se p : R2 → R2 é um polinômio complexo não-constante, prove que lim p(z) = ∞. z→∞ n 4. Seja X = {x = (x1 , . . . , xn ) ∈ R ; x1 · x2 · · · xn 6= 0}. Defina f : X → R pondo sen(x1 · x2 · · · xn ) f (x) = · Prove que lim f (x) = 1. x→0 x1 · x2 · · · xn 5. Sejam a um ponto de acumulação do domı́nio da função f : X → R, com X ⊂ Rm , e v ∈ Rn um vetor não-nulo. Se lim f (x) · v = v0 então existe x→a lim f (x) = α e v0 = α · v. x→a 2 Caminhos em Rn 1 Caminhos diferenciáveis Seja f : I → Rn um caminho, isto é, uma aplicação contı́nua cujo domı́nio é um intervalo da reta. Para todo t ∈ I, tem-se f (t) = (f1 (t), . . . , fn (t)), onde f1 , . . . , fn : I → R, as funções-coordenada de f , são contı́nuas. Diz-se que o caminho f : I → Rn é diferenciável no ponto t0 ∈ I quando existe o limite f (t0 + h) − f (t0 ) , h→0 h f ′ (t0 ) = lim chamado a derivada , ou o vetor-velocidade de f no ponto t0 . Para todo h 6= 0, as coordenadas do vetor [f (t0 + h) − f (t0 )]/h são os números [fi (t0 + h) − fi (t0 )]/h (i = 1, . . . , n). Pelo Teorema 28 do Capı́tulo 1, o caminho f é diferenciável no ponto t0 se, e somente se, suas funções-coordenada o são. No caso afirmativo, tem-se df (t0 ) f ′ (t0 ) = (f1′ (t0 ), . . . , fn′ (t0 )). Às vezes se usa também a notação dt em vez de f ′ (t0 ). Quando o caminho f : I → Rn é diferenciável em todos os pontos de I, diz-se que ele é diferenciável em I. Neste caso, a correspondência t 7→ f ′ (t) define uma aplicação f ′ : I → Rn . Quando f ′ é contı́nua, o caminho f chama-se de classe C 1 . Mais geralmente, para todo inteiro k > 1, diz-se que f : I → Rn é um caminho de classe C k quando ele é diferenciável e f ′ é de classe C k−1 . Para que f seja de classe C k é 42 Caminhos em Rn Cap. 2 f ′ (t0 ) f (t) f (t0 ) Figura 2.1 necessário e suficiente que cada uma de suas funções-coordenada o seja. Escreve-se então f ∈ C k . No caso em que f ′ (t0 ) 6= 0, a definição acima significa que a reta que passa pelo ponto f (t0 ) e tem a direção dada pelo vetor f ′ (t0 ), isto é, o conjunto {f (t0 ) + α · f ′ (t0 ); α ∈ R}, é o limite quando h → 0 da secante que passa pelos pontos f (t0 ) e f (t0 + h). Logo é natural chamá-la de reta tangente ao caminho f no ponto t0 . Quando f ′ (t0 ) = 0 pode não haver reta alguma que se possa chamar de tangente no ponto f (t0 ). Exemplo 1. Dados a 6= b em Rn , seja f : R → Rn o caminho retilı́neo que passa pelos pontos a e b: f (t) = (1 − t)a + t · b. Para todo t ∈ R, f é diferenciável no ponto t, com f ′ (t) = b − a, como se vê diretamente a partir da definição. Se t0 não é o extremo superior do intervalo I, tem sentido considerar a derivada à direita do caminho f : I → Rn no ponto t0 , a qual é definida por f (t0 + h) − f (t0 ) f+′ (t0 ) = lim , h h→0+ e, de modo análogo, a derivada à esquerda f−′ (t0 ), caso t0 não seja o extremo inferior de I. Quando t0 é um ponto interior de I então f é diferenciável no ponto t0 se, e somente se, existem e são iguais as ⊳ derivadas laterais f+′ (t0 ) e f−′ (t0 ). Exemplo 2. Seja f : R → R2 o caminho definido por f (t) = (t, |t|). Para t > 0 tem-se f (t) = (t, t) e, para t < 0, f (t) = (t, −t). Logo, para todo t 6= 0 existe f ′ (t), sendo f ′ (t) = (1, 1) se t > 0 e f ′ (t) = (1, −1) se t < 0. No ponto t = 0 existem as derivadas laterais f+′ (0) = (1, 1) e f−′ (0) = (1, −1), que são diferentes, logo f não é diferenciável no ponto t = 0. Por outro lado, o caminho g : R → R2 , definido por Seção 2 Cálculo diferencial de caminhos 43 z x y H Figura 2.2 g(t) = (t|t|, t2 ), tem a mesma imagem que f porém é derivável em todos os pontos, inclusive para t = 0, valendo g ′ (0) = (0, 0). Com efeito, se t ≤ 0 então g(t) = (−t2 , t2 ) e se t ≥ 0 vale g(t) = (t2 , t2 ). Portanto g ′ (t) = (−2t, 2t) quando t < 0 e g ′ (t) = (2t, 2t) se t > 0. No ponto t = 0, ′ (0) = g ′ (0) = (0, 0). temos g+ − Exemplo 3. Sejam f : R → R2 e g : R → R3 os caminhos definidos por f (t) = (cos t, sen t) e g(t) = (cos t, sen t, t). A imagem de f é a circunferência unitária S 1 e a imagem de g é a hélice H, cuja projeção sobre o plano z = 0 é S 1 . Ambos, f e g, são de classe C k para todo k ∈ N, por isso se dizem de classe C ∞ . Para todo t ∈ R tem-se f ′ (t) = (− sen t, cos t) e g ′ (t) = (− sen t, cos t, 1). 2 Cálculo diferencial de caminhos Sejam f, g : I → Rn caminhos e α : I → R uma função real. Se f , g e α são diferenciáveis no ponto t0 ∈ I então são também diferenciáveis nesse p ponto os caminhos f + g, αf e as funções hf, gi e |f | = hf, f i, esta última sob a condição de ser f (t0 ) 6= 0. Valem então as regras abaixo: 1. (f + g)′ (t0 ) = f ′ (t0 ) + g ′ (t0 ), 2. (αf )′ (t0 ) = α′ (t0 ) · f (t0 ) + α(t0 ) · f ′ (t0 ), 3. hf, gi′ (t0 ) = hf ′ (t0 ), g(t0 )i + hf (t0 ), g ′ (t0 )i, 4. |f |′ (t0 ) = hf (t0 ),f ′ (t0 )i |f (t0 )| , as quais se provam simplesmente calculando em termos das coordenadas de f e g. 44 Caminhos em Rn Cap. 2 Vimos no Exemplo 3 que, em cada ponto, o vetor-velocidade f ′ (t) = (− sen t, cos t) é perpendicular a f (t) = (cos t, sen t). A última das regras de derivação acima, segundo a qual |f |′ = hf, f ′ i/|f |, mostra que, mais geralmente, se f : I → Rn é um caminho diferenciável com |f | constante (isto é, f (t) pertence a uma esfera de centro 0) então o vetorvelocidade f ′ (t) é perpendicular a f (t), para todo t ∈ I. Reciprocamente, se hf (t), f ′ (t)i = 0 para todo t ∈ I então |f |′ = 0, logo a função real |f | : I → R é constante. Vale também para caminhos diferenciáveis f : I → Rn o fato de que derivada identicamente nula implica f constante. Isto pode ser visto diretamente ou a partir do Teorema do Valor Médio, o qual assume, para caminhos, a forma de uma desigualdade. O Teorema do Valor Médio para uma função diferenciável f : [a, b] → R diz que existe c, com a < c < b, tal que f (b) − f (a) = f ′ (c)(b − a). Tal igualdade não vale sempre para caminhos f : I → Rn . Por exemplo, se considerarmos f : [0, 2π] → R2 , dado por f (t) = (cos t, sen t), temos f (2π) − f (0) = 0 mas, como |f ′ (t)| = 1 para todo t ∈ [0, 2π] não pode existir c ∈ [0, 2π] tal que f (2π) − f (0) = f ′ (c) · (2π − 0). Tem-se entretanto o seguinte importante resultado: Teorema 1 (Desigualdade do Valor Médio). Seja f : [a, b] → Rn um caminho, diferenciável no intervalo aberto (a, b), com |f ′ (t)| ≤ M para todo t ∈ (a, b). Então |f (b) − f (a)| ≤ M · (b − a). Demonstração. Definamos ϕ : [a, b] → R pondo ϕ(t) = hf (t), f (b) − f (a)i. Então, pelo Teorema do Valor Médio (Vol. 1, pág. 96), existe c ∈ (a, b) tal que ϕ(b) − ϕ(a) = ϕ′ (c) · (b − a), pois ϕ é contı́nua, derivável em (a, b), com ϕ′ (t) = hf ′ (t), f (b) − f (a)i. Mas ϕ(b) − ϕ(a) = |f (b) − f (a)|2 . Logo, usando a desigualdade de Schwarz, temos: |f (b) − f (a)|2 = hf ′ (c), f (b) − f (a)i · (b − a) ≤ |f ′ (c)| |f (b) − f (a)| · (b − a) ≤ M · |f (b) − f (a)| · (b − a). Cancelando o fator |f (b) − f (a)|, vem |f (b) − f (a)| ≤ M · (b − a). Corolário 1. Se o caminho f : [a, b] → Rn tem derivada nula em todos os pontos de (a, b) então é constante. Seção 3 A integral de um caminho 45 Teorema 2 (Regra da Cadeia). Sejam ϕ : I → J diferenciável no ponto a ∈ I e f : J → Rn um caminho diferenciável no ponto b = ϕ(a). Então o caminho f ◦ ϕ : I → Rn é diferenciável no ponto a, com (f ◦ ϕ)′ (a) = ϕ′ (a) · f ′ (b). Demonstração. Aplicar a Regra da Cadeia às funções-coordenada fi ◦ϕ do caminho f ◦ ϕ. Exemplo 4. Sejam f : R → R2 e ϕ : R → R, com f (t) = (cos t, sen t) e ϕ(t) = t2 . Então o caminho f ◦ ϕ : R → R2 , dado por (f ◦ ϕ)(t) = (cos t2 , sen t2 ), tem vetor-velocidade (f ◦ ϕ)′ (t) = (−2t sen t2 , 2t cos t2 ) = 2t · (− sen t2 , cos t2 ), múltiplo escalar do vetor-velocidade de f no ponto ϕ(t). De um modo geral, a Regra da Cadeia diz que o caminho t 7→ f (ϕ(t)), cuja imagem está contida na imagem de f , tem, para cada t ∈ I, vetorvelocidade igual a um múltiplo escalar do vetor-velocidade de f em ϕ(t). 3 A integral de um caminho Lembramos que uma partição do intervalo [a, b] é um conjunto finito P = {t0 < t1 < · · · < tk } com t0 = a e tk = b. A norma de P é o número |P | = max{ti − ti−1 ; i = 1, . . . , k}. Diz-se que outra partição Q refina P quando P ⊂ Q. Uma partição pontilhada de [a, b] é um par P ∗ = (P, ξ) onde ξ = {ξ1 , . . . , ξk } com ti−1 ≤ ξi < ti , 1 ≤ i ≤ k. Dados o caminho f : [a, b] → Rn e uma partição pontilhada P ∗ = (P, ξ) de [a, b], a soma de Riemann de f associada a P ∗ é definida como X (f ; P ∗ ) = k X i=1 f (ξi )(ti − ti−1 ). P Diz-se que o vetor v ∈ Rn é o limite da soma de Riemann P (f ; P ∗ ) (f ; P ∗ ), quando a norma de P tende a zero, e escreve-se v = lim |P |→0 para significar que, P dado arbitrariamente ε > 0, existe δ > 0 tal que |P | < δ ⇒ |v − (f ; P ∗ )| < ε, seja qual for a maneira de pontilhar P . Vimos no Volume 1 (págs. 127 e 137) que se f : [a, b] → R é contı́nua Rb P (f ; P ∗ ) = a f (t) dt. Daı́ resulta que, se f : [a, b] → então existe lim |P |→0 Rn é um caminho, existe o limite Z b Z b X ∗ fn (t) dt . f1 (t)dt, . . . , lim (f ; P ) = |P |→0 a a 46 Caminhos em Rn Cap. 2 Pomos, por definição, Z b Z b Z b X ∗ f (t) dt = lim fn (t) dt . (f ; P ) = f1 (t) dt, . . . , |P |→0 a a a Segue-se da propriedade correspondente para funções reais que Z b Z b Z b [αf (t) + βg(t)] dt = α f (t) dt + β g(t) dt, a a a se α, β ∈ R. Além disso, tem-se a importante desigualdade Z b Z b |f (t)| dt, f (t) dt ≤ a a a qual decorre do fato de que, para toda partição pontilhada P ∗ , tem-se X X (f ; P ∗ ) ≤ (|f |; P ∗ ) pois a norma de uma soma é menor do que ou igual à soma das normas das parcelas. Em particular, se |f (t)| ≤ M para todo t ∈ [a, b] então Z b f (t) dt ≤ M · (b − a). a Exemplo 5. Se f : [0, 2π] → R2 e gR: [0, 1] → R2 são dadosR por f (t) = 2π 1 (cos t, sen t) e g(t) = (t, t2 ) então 0 f (t) dt = (0, 0) e 0 g(t) dt = (1/2, 1/3). ⊳ Aplicando o Teorema Fundamental do Cálculo a cada uma das coordenadas do caminho f : [a, b] → Rn , de classe C 1 , obtemos o seguinte Teorema 3 (Teorema Fundamental do Cálculo para Caminhos). Se f : [a, b] → Rn é um caminho de classe C 1 então Z b f ′ (t) dt = f (b) − f (a). a Daı́ resulta outra prova da Desigualdade do Valor Médio (no caso particular de f ∈ C 1 ), pois se |f ′ (t)| ≤ M para todo t ∈ [a, b] então Z b f ′ (t) dt ≤ M · (b − a). |f (b) − f (a)| = a Seção 3 A integral de um caminho 47 Exprimindo novamente a integral de um caminho em termos das integrais de suas funções-coordenada, resulta o Teorema de Mudança de Variável seguinte Se ϕ : [c, d]→[a, b] é de classe C 1 e f : [a, b]→Rn é um caminho então Z ϕ(d) f (t) dt = Z d f (ϕ(t))ϕ′ (t) dt. c ϕ(c) Uma simples aplicação desta fórmula nos permite enunciar o Teorema Fundamental do Cálculo assim: se f R: [a, a+h] → Rn é um caminho 1 de classe C 1 então f (a + h) − f (a) = h · 0 f ′ (a + th) dt. Basta considerar ϕ : [0, 1]→[a, a+h] onde ϕ(t)=a+th e notar que ϕ′ (t)=h. Um caminho f : I → Rn diz-se uniformemente diferenciável quando, para todo t ∈ I existe um vetor f ′ (t) ∈ Rn com a seguinte propriedade: Dado qualquer ε > 0, pode-se obter δ > 0 tal que 0 < |h| < δ e t + h ∈ I implicam |f (t + h) − f (t) − f ′ (t) · h| < ε|h| para qualquer t ∈ I. A diferença entre a diferenciabilidade uniforme e a diferenciabilidade pura e simples situa-se no fato de que o número δ > 0 depende apenas do ε > 0 dado, mas não do ponto t ∈ I onde se toma a derivada f ′ (t). Teorema 4 (Diferenciabilidade Uniforme). Todo caminho f: [a, b] → Rn , de classe C 1 no intervalo compacto [a, b], é uniformemente diferenciável. Demonstração. Pela continuidade uniforme da derivada f ′ : [a, b] → Rn , dado ε > 0 existe δ > 0 tal que |h| < δ e t + h ∈ [a, b] implicam |f ′ (t + h) − f ′ (t)| < ε seja qual for t ∈ [a, b]. Observando que, para R t+h t ∈ [a, b] fixo vale t f ′ (t) ds = f ′ (t) · h, o Teorema Fundamental do Cálculo nos diz que 0 < |h| < δ e t + h ∈ [a, b] implicam ′ |f (t + h) − f (t) − f (t) · h| = Z t+h t [f ′ (s) − f ′ (t)] ds ≤ ε · |h| para qualquer t ∈ [a, b], o que demonstra o teorema. Observação. Vale a recı́proca: todo caminho f : [a, b] → Rn uniformemente diferenciável é de classe C 1 . (Vide “Curso de Análise”, vol. 1, pág. 218 e vol. 2, pág. 88.) 48 4 Caminhos em Rn Cap. 2 Caminhos retificáveis O comprimento de um caminho f : [a, b] → Rn , que definiremos a seguir, é a medida da trajetória percorrida pelo ponto f (t) quando t varia de a até b. Não é o comprimento da curva imagem de f , pois o ponto f (t) pode percorrer essa mesma curva de vários modos diferentes, dando origem a caminhos de comprimentos diversos. Por exemplo, o segmento de reta que vai da origem ao ponto P = (1, 1) do plano tem comprimento √ 2. O caminho f : [0, 2] → R2 , definido por f (t) = (2t − t2 , 2t − t2 ) tem por imagem esse segmento, porém o percorre duas vezes, saindo de f (0) = (0, 0), indo até f (1) = (1, 1) e voltando até f (2) = (0, 0). Seu √ comprimento é, como veremos, igual a 2 2. Dado um caminho f : [a, b] → Rn , cada partição P = {a = t0 < · · · < tk = b} de [a, b] determina uma poligonal inscrita na imagem de f , cujos vértices são os pontos f (a),f (t1 ),. . . ,f (tk−1 ),f (b). O comprimento dessa poligonal é o número l(f ; P ) = k X i=1 |f (ti ) − f (ti−1 )|. Quando não houver perigo de confusão, escreveremos apenas l(P ), em vez de l(f ; P ). Diz-se que o caminho f : [a, b] → Rn é retificável quando o conjunto dos números l(P ), obtidos considerando-se todas as partições P do intervalo [a, b], for limitado. Então o supremo desse conjunto chama-se o comprimento do caminho f , o qual é representado por l(f ). Assim l(f ) = sup l(f ; P ) = sup l(P ). P P Exemplo 6. Seja f : [0, 1] → Rn o caminho retilı́neo f (t) = (1 − t)A + tB. Para toda partição P = {0 < t1 < · · · < tk−1 < 1} de [0, 1] tem-se l(P ) = X |f (ti ) − f (ti−1 )| = X (ti − ti−1 )|B − A| = |B − A|. Assim, obviamente vale l(f ) = |B − A|. ⊳ Seção 4 Caminhos retificáveis 49 Exemplo 7. Um caminho não-retificável f : [a, b] → Rn é aquele em que o ponto f (t) descreve uma trajetória infinitamente longa no tempo finito b − a. Um exemplo de tal situação é o caminho f : [0, 1] → R2 , dado por f (t) = (t, ϕ(t)) o qual percorre o gráfico da função ϕ : [0, 1] → R. Esta função tem, em cada intervalo n n+1 , n+1 n+2 1 · Além disso, n+1 ϕ(1) = 0. Se considerarmos, para cada n ∈ N, a partição n+1 Pn = 0, 1/2, 2/3, . . . , ,1 n+2 o gráfico na forma de um triângulo isósceles de altura do intervalo [0, 1], veremos que l(Pn ) é a soma dos comprimentos dos lados inclinados dos n + 1 primeiros triângulos isósceles que formam o gráfico de ϕ. Logo l(Pn ) é maior do que a soma das alturas desses triângulos, ou seja, l(Pn ) > 1 1 1 + + ··· + · 2 3 n+1 Como a série harmônica é divergente, segue-se que o conjunto dos números l(P ) associados ao caminho f é ilimitado, portanto f não é retificável. O caminho f tem comprimento infinito. Uma observação simples, porém útil, é a seguinte: se a partição Q do intervalo [a, b] refina a partição P então, dado o caminho f : [a, b] → Rn , tem-se l(P ) ≤ l(Q). Para ver isto, basta considerar o caso em que se obtém Q a partir de P acrescentando-lhe um só ponto q, pois cada refinamento de P pode ser pensado como a repetição de um número finito desses acréscimos. Ora, se Q difere de P pela adição do único ponto q, digamos com pj−1 < q < pj , então l(Q) − l(P ) = |f (q) − f (pj−1 )| + |f (pj ) − f (q)| − |f (pj ) − f (pj−1 )| ≥ 0 pois |f (pj ) − f (pj−1 )| = |f (pj ) − f (q) + f (q) − f (pj−1 )| ≤ |f (pj ) − f (q)| + |f (q) − f (pj−1 )|. 50 Caminhos em Rn Cap. 2 f (pj ) f (q) f (pj−1 ) Figura 2.3 Como no caso da integral, dado um caminho f : [a, b] → Rn diremos que o número real A é o limite de l(P ) quando |P | tende a zero, e escreveremos lim l(P ) = A, para significar que, para todo ε > 0 dado, |P |→0 é possı́vel obter δ > 0 tal que |P | < δ implica |l(P ) − A| < ε. Teorema 5. Se lim l(P ) = A então A = sup l(P ), ou seja, o caminho |P |→0 f : [a, b] → Rn é retificável e l(f ) = A. P Demonstração. Se lim l(P ) = A, é claro que A ≤ sup l(P ). Supo|P |→0 P nhamos, por absurdo, que seja A < sup l(P ). Então existe uma partição P Q0 tal que A < l(Q0 ). Seja ε = l(Q0 ) − A. Pela definição do limite, podemos obter δ > 0 tal que |P | < δ ⇒ A − ε < l(P ) < A + ε = l(Q0 ). Tomemos uma partição qualquer P0 tal que |P0 | < δ. A partição P = P0 ∪ Q0 , por um lado cumpre |P | < δ, logo l(P ) < l(Q0 ) e, por outro lado, refina Q0 , logo l(Q0 ) ≤ l(P ). Esta contradição prova o teorema. Observação. Vale a recı́proca: se f é retificável, então l(f ) = lim l(P ). |P |→0 (Vide “Curso de Análise”, vol. 2, pág. 99.) Mas somente o teorema acima será usado a seguir. Teorema 6. Todo caminho f : [a, b] → Rn de classe C 1 é retificável e Z b |f ′ (t)| dt. l(f ) = a Demonstração. Para toda partição P = {t0 < t1 < · · · < tk } de Seção 4 Caminhos retificáveis 51 k k P P P |f (ti ) − f (ti−1 )|. |f ′ (ti−1 )|(ti − ti−1 ) e l(P ) = (P ) = i=1 i=1 Z b P |f ′ (t)| dt. E, pelo Teorema 4, para todo Sabemos que lim (P ) = [a, b], sejam |P |→0 a ε > 0 dado arbitrariamente, existe δ > 0 tal que |P | < δ implica f (ti ) − ε f (ti−1 ) = (f ′ (ti−1 ) + ρi )(ti − ti−1 ) com |ρi | < para i = 1, . . . , k. b−a k k P P |f ′ (ti−1 ) + ρi |(ti − ti−1 ), portanto |f (ti ) − f (ti−1 )| = Logo l(P ) = i=1 i=1 k P P |ρi |(ti − ti−1 ) < ε sempre que |P | < δ. Como | (P ) − l(P )| ≤ Z b Z b i=1 P ′ |f ′ (t)|dt. |f (t)| dt, resulta daı́ que lim l(P ) = lim (P ) = |P |→0 |P |→0 a a Z b ′ |f (t)| dt. Pelo Teorema 5, concluı́mos que l(f ) = a Uma reparametrização do caminho f : [a, b] → Rn é um caminho da forma f ◦ ϕ : [c, d] → Rn , onde ϕ : [c, d] → [a, b] é uma função de classe C 1 tal que ϕ(c) = a, ϕ(d) = b e ϕ′ (u) ≥ 0 para todo u ∈ [c, d]. O teorema acima tem, como conseqüência imediata, o seguinte Corolário 2. Um caminho de classe C 1 , f : [a, b] → Rn , e qualquer sua reparametrização f ◦ ϕ : [c, d] → Rn têm o mesmo comprimento. Com efeito, pelo Teorema, Z d Z b ′ ϕ′ (u) · |f ′ (ϕ(u))| du |f (t)| dt = l(f ) = c a Z d Z d = |ϕ′ (u) · f ′ (ϕ(u))| du = |(f ◦ ϕ)′ (u)| du = l(f ◦ ϕ). c c Rn Para caminhos f : [a, b] → de classe C 1 com a propriedade adi′ cional de que f (t) 6= 0 para todo t ∈ [a, b] (chamados caminhos regulares), existe uma reparametrização especial, “por comprimento de arco”, que apresentamos agora. Dado um tal caminho f , digamos com l(f ) = L, definimos a função ϕ : [a, b] → [0, L] pondo, para todo t ∈ [a, b], Z t ϕ(t) = |f ′ (u)| du = l(f |[a, t]), comprimento do caminho f |[a, t], resa trição de f ao intervalo [a, t]. A função ϕ : [a, b] → [0, L], assim definida, é de classe C 1 , com ′ ϕ (t) = |f ′ (t)| > 0 para todo t ∈ [a, b], e ϕ(a) = 0, ϕ(b) = L. Logo 52 Caminhos em Rn Cap. 2 é uma bijeção de [a, b] sobre [0, L], cuja inversa ϕ−1 : [0, L] → [a, b] é também de classe C 1 , valendo, para todo s = ϕ(t) ∈ [0, L], a fórmula 1 1 = ′ > 0. (Cfr. Vol. 1, pág. 92.) (ϕ−1 )′ (s) = ′ ϕ (t) |f (t)| Consideremos a reparametrização g = f ◦ ϕ−1 : [0, L] → Rn do caminho f . Para todo s = ϕ(t) ∈ [0, L] temos g ′ (s) = (ϕ−1 )′ (s) · f ′ (t) = f ′ (t) , |f ′ (t)| portanto |g ′ (s)| = 1. Então, para todo s ∈ [0, L], o comprimento do caminho restrito g|[0, s] tem o valor Z s Z s ′ du = s. |g (u)| du = l(g|[0, s]) = 0 0 Por este motivo, g = f ◦ ϕ−1 chama-se a reparametrização de f por comprimento de arco. Z b |f ′ (t)| dt é importante teoricamente Observação. A fórmula l(f ) = a mas, em geral, é impraticável procurar calcular essa integral, a não ser numericamente ou então em raros casos especialmente escolhidos, como f (t) = (1 − t)A + tb, f (t) = (cos t, sen t) e outros. 5 Exercı́cios Seção 1: Caminhos diferenciáveis 1. Seja f : I → Rn um caminho diferenciável. Se existirem a ∈ I e b ∈ Rn tais que a é ponto de acumulação do conjunto f −1 (b), prove que f ′ (a) = 0. 2. Seja f : I → R2 um caminho diferenciável cuja imagem coincide com o gráfico da função g : [−1, 1] → R , g(t) = |t|. Se a é um ponto interior de I tal que f (a) = (0, 0), prove que f ′ (a) = 0. 3. Seja f : R → R3 a hélice cilı́ndrica, definida no Exemplo 3 por f (t) = (cos t, sen t, t). Prove que, para todo t ∈ R, a reta que liga os pontos f (t) e f (t) + f ′′ (t) intersecta o eixo vertical de R3 . 4. O caminho g : R → R3 , definido por g(t) = (a cos bt, a sen bt, ct), é também chamado de hélice. Determine a relação entre as constantes a, b, c a fim de que o caminho g esteja parametrizado pelo comprimento de arco. Seção 5 Seção 2: Exercı́cios 53 Cálculo diferencial de caminhos 1. Seja f : [a, b] → Rn um caminho diferenciável tal que f (a) = f (b) = 0. Prove que existe c ∈ (a, b) tal que hf (c), f ′ (c)i = 0. 2. Sejam f1 , f2 : I → Rm caminhos diferenciáveis e ϕ : Rm × Rm → Rn uma aplicação bilinear. Prove que o caminho g : I → Rn , dado por g(t) = ϕ(f1 (t), f2 (t)), é diferenciável e g ′ (t) = ϕ(f1′ (t), f2 (t)) + ϕ(f1 (t), f2′ (t)) para todo t ∈ I. Estenda este resultado para aplicações p-lineares ϕ : Rm × · · · × 2 Rm → Rn e conclua daı́ que se f : (−ε, ε) → Rm é um caminho diferenciável de matrizes m × m com f (0) = Im e g : I → R é a função definida por g(t) = det ·f (t) então g ′ (0) = tr ·a (traço de matriz a), onde a = f ′ (0). 2 3. Seja f : I → Rn um caminho diferenciável cujos valores são matrizes n × n. 2 Prove que g : I → Rn , dado por g(t) = f (t)k , é diferenciável e calcule g ′ (t). Seção 3: A integral de um caminho 1. Sejam f : [a, b] → Rn e ϕ : [a, b] → R de classe C 1 . Se |f ′ (t)| ≤ ϕ′ (t) para todo t ∈ (a, b), prove que |f (b) − f (a)| ≤ ϕ(b) − ϕ(a). 2. Seja f : [a, a + h] → Rn um caminho de classe C k . Prove que f (a + h) = f (a) + h · f ′ (a) + · · · + onde rk = hk (k − 1)! Z 1 0 hk−1 (k−1) f (a) + rk (k − 1)! (1 − t)k−1 f (k) (a + th) dt. 3. Sejam f, g : [a, b] → Rn caminhos de classe C 1 . Prove que Z b Z b hf (t), g ′ (t)idt = hf (b), g(b)i − hf (a), g(a)i − hf ′ (t), g(t)i dt. a a 4. Seja × o produto vetorial em R3 . Para todo v ∈ R3 e todo caminho f : [a, b] → Z b Z b R3 , prove que [v × f (t)]dt = v × f (t)dt. a a 5. Seja A ⊂ Rn convexo. Se o caminho f : [a, b] → Rn cumpre f (t) ∈ A para todo Z b 1 f (t)dt ∈ A. t ∈ [a, b], prove que b−a a Seção 4: Caminhos retificáveis 1. Seja f : [a, b] → Rn um caminho de classe C 1 , com f (a) = A e f (b) = B. Se seu comprimento é l(f ) = |B − A|, prove que f é uma reparametrização do caminho retilı́neo [A, B]. 2. Seja f : [0, L] → S 1 ⊂ R2 um caminho de classe C 1 (com |f (t)| = 1 para todo Z 1 L t ∈ [0, L]). Se seu valor médio m = f (t)dt pertence a S 1 , prove que f é L 0 constante. 54 Caminhos em Rn Cap. 2 3. Seja U ⊂ Rn aberto e conexo. Dados a, b ∈ U , prove que existe um caminho retificável f : I → U começando em a e terminando em b. 4. Dado U ⊂ Rn aberto e conexo, defina a distância intrı́nseca entre os pontos a, b ∈ U como o ı́nfimo dU (a, b) dos comprimentos dos caminhos retificáveis f : I → U , que ligam a e b. Prove que se (xk ) é uma seqüência de pontos em U e a ∈ U , tem-se lim xk = a se, e somente se, lim dU (xk , a) = 0. 3 Funções Reais de n Variáveis 1 Derivadas parciais Seja f : U → R uma função definida no aberto U ⊂ Rn . Para cada i = 1, . . . , n, a i-ésima derivada parcial de f no ponto a = (a1 , . . . , an ) ∈ U é o número ∂f f (a + tei ) − f (a) f (a1 , . . . , ai + t, . . . , an ) − f (a) (a) = lim = lim , t→0 t→0 ∂xi t t caso este limite exista. Como U é aberto, podemos achar δ > 0 tal que a + tei ∈ U para todo t ∈ (−δ, δ). Então está bem definido o caminho retilı́neo λ : (−δ, δ) → U , λ(t) = a + tei . A definição acima ∂f diz que (a) = (f ◦ λ)′ (0) = derivada, no ponto t = 0, da função real ∂xi f ◦ λ : (−δ, δ) → R. Observemos que ∂f /∂xi significa a derivada de f em relação a sua i-ésima variável, seja qual for o nome que se atribua a ela. Assim ∂f ∂f ∂f = = , etc. ∂xi ∂yi ∂zi Uma notação alternativa, que evitaria mal-entendidos, seria ∂i f . Preferimos a notação tradicional ∂f /∂xi porque ela é conveniente quando se usa a regra da cadeia. Quanto n = 2 ou n = 3, escrevemos (x, y) em vez de (x1 , x2 ) e (x, y, z) em vez de (x1 , x2 , x3 ). Assim, ∂f /∂x, ∂f /∂y e ∂f /∂z são as derivadas parciais de f em relação à primeira, a segunda e a terceira variáveis respectivamente. 56 Funções Reais de n Variáveis Cap. 3 Exemplo 1. Seja f : R2 → R definida por f (x, y) = xy/(x2 + y 2 ) se x2 + y 2 6= 0 e f (0, 0) = 0. Como f (0, y) = 0 para todo y e f (x, 0) = 0 ∂f ∂f para todo x, segue-se que (0, 0) = 0 e (0, 0) = 0. Entretanto a ∂x ∂y função f é descontı́nua na origem (0, 0). Com efeito, se chamarmos de θ o ângulo que o vetor não-nulo v = (x, y) forma com o eixo das abcissas, veremos que x y f (x, y) = p ·p = cos θ · sen θ. 2 2 2 x +y x + y2 Logo, atribuindo diferentes valores a θ, podemos fazer com que f (x, y) tenha limites diferentes quando (x, y) tende para (0, 0) ao longo do segmento x = t cos θ, y = t sen θ, ou seja, quando t → 0. ⊳ O exemplo acima mostra que a existência das n derivadas parciais no ponto a não assegura a continuidade da função f nesse ponto. Para cada i = 1, . . . , n, a função λ(t) = f (a + tei ) é essencialmente a restrição de f ao segmento (a − δei , a + δei ) da reta que passa pelo ponto a e é ∂f (a) = paralela ao i-ésimo eixo coordenado de Rn . A derivada parcial ∂xi (f ◦ λ)′ (0) dá informação apenas sobre o comportamento de f ao longo desse segmento. Em particular, a existência das n derivadas parciais de f no ponto a implica que a restrição de f a cada um dos n segmentos paralelos aos eixos, que se cortam no ponto a, é contı́nua, embora não garanta a continuidade de f : U → R em a. Se ∂f /∂xi existe e é positiva em todos os pontos do segmento de reta [a−δei , a+δei ], paralelo ao i-ésimo eixo coordenado, então f é crescente ao longo desse segmento: s < t ⇒ f (a + sei ) < f (a + tei ), desde que |s| ≤ δ e |t| ≤ δ. Isto resulta imediatamente do resultado análogo para funções de uma variável. A noção de derivada parcial também faz sentido para aplicações f : U → Rn , com U ⊂ Rm aberto. Se a ∈ U , põe-se, para cada i = 1, . . . , m: ∂f f (a + tei ) − f (a) (a) = lim · t→0 ∂xi t Evidentemente, ∂f /∂xi é um vetor de Rn . Se f = (f1 , . . . , fn ) então ∂f ∂fn ∂f1 (a) = (a), . . . , (a) . ∂xi ∂xi ∂xi Funções de classe C 1 Seção 2 57 Neste capı́tulo, porém, daremos prioridade às funções com valores numéricos. Para elas tem sentido o vetor gradiente, conceito de forte apelo intuitivo, que contribui para entendermos como cresce (ou decresce) f (x). 2 Funções de classe C 1 Seja f : U → R uma função que possui as n derivadas parciais em todos os pontos do aberto U ⊂ Rn . Ficam então definidas n funções ∂f ∂f ∂f ∂f ,..., : U → R, onde : x 7→ (x). ∂x1 ∂xn ∂xi ∂xi Se estas funções forem contı́nuas em U , diremos que f é uma função de classe C 1 e escreveremos f ∈ C 1 . Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se de classe C 1 quando cada uma de suas funções-coordenada f1 , . . . , fn : U → R é de classe C 1 . Muitas propriedades importantes das funções de classe C 1 resultam de serem elas diferenciáveis no sentido seguinte. Uma função f : U → R, definida no aberto U ⊂ Rn , diz-se diferenciável no ponto a ∈ U quando cumpre as seguintes condições: ∂f ∂f (a), . . . , (a). 1. Existem as derivadas parciais ∂x1 ∂xn 2. Para todo v = (α1 , . . . , αn ) tal que a + v ∈ U , tem-se n X ∂f · αi + r(v), onde f (a + v) − f (a) = ∂xi i=1 lim |v|→0 r(v) = 0. |v| Observações. 1. Acima, e sempre que fizermos considerações em torno ∂f de um ponto especı́fico a, escreveremos, por simplicidade, em vez ∂xi ∂f (a). de ∂xi 2. A essência da definição da diferenciabilidade está na condição lim (r(v)/|v|) = 0, pois a igualdade que define o “resto”r(v) pode ser v→0 escrita para qualquer função que possua as n derivadas parciais. r(v) r(v) De lim = 0 resulta que lim r(v) = 0 pois r(v) = · |v|. v→0 |v| v→0 |v| Segue-se que lim [f (a + v) − f (a)] = 0. Portanto, toda função difev→0 renciável no ponto a é contı́nua nesse ponto. 58 Funções Reais de n Variáveis Cap. 3 Diremos que f : U → R é diferenciável quando f for diferenciável em todos os pontos de U . Quando n = 1, a função f : U → R é diferenciável no ponto a se, e somente se, possui derivada neste ponto pois, como podemos agora dividir por v ∈ R, de f (a + v) − f (a) = (df /dx) · v + r(v) resulta r(v) f (a + v) − f (a) df =± − (a) , |v| v dx portanto lim v→0 df f (a + v) − f (a) r(v) = 0 ⇔ lim = (a). v→0 |v| v dx Teorema 1. Toda função f : U → R de classe C 1 é diferenciável. Demonstração. Por simplicidade, suporemos U ⊂ R2 . O caso geral se trata analogamente, apenas com uma notação mais elaborada. Fixemos c = (a, b) ∈ U e tomemos v = (h, k) tal que c + v ∈ B ⊂ U , onde B é uma bola de centro c. Seja r(v) = r(h, k) = f (a + h, b + k) − f (a, b) − ∂f ∂f ·h− · k, ∂x ∂y onde as derivadas são calculadas no ponto c = (a, b). Podemos escrever r(v) = f (a + h, b + k) − f (a, b + k) + f (a, b + k) − f (a, b) ∂f ∂f ·h− · k. − ∂x ∂x Pelo Teorema do Valor Médio para funções de uma variável real, existem θ1 , θ2 ∈ (0, 1) tais que r(v) = ∂f ∂f ∂f ∂f (a + θ1 h, b + k) · h + (a, b + θ2 k) · k − ·h− · k, ∂x ∂y ∂x ∂y logo r(v) ∂f ∂f h = (a + θ1 h, b + k) − (a, b) √ 2 |v| ∂x ∂x h + k2 ∂f k ∂f (a, b + θ2 k) − (a, b) √ + · 2 ∂y ∂y h + k2 Quando v → 0 os termos dentro dos colchetes acima tendem a zero, pela continuidade das derivadas ∂f /∂x e ∂f /∂y. Além disso, os termos fora Funções de classe C 1 Seção 2 59 dos colchetes têm valor absoluto ≤ 1. Portanto lim r(v)/|v| = 0 e então v→0 f é diferenciável. Corolário 1. Toda função de classe C 1 é contı́nua. Às vezes, como na demonstração a seguir, é mais conveniente tomar ρ = ρ(v) = r(v)/|v| e escrever ρ|v| em vez de r(v). Então a diferenciabilidade de f se exprime como f (a + v) − f (a) = n X ∂f · αi + ρ|v|, ∂xi i=1 com lim ρ = 0. v→0 Teorema 2. Sejam U ⊂ Rm , V ⊂ Rn abertos, f : U → V uma aplicação cujas funções-coordenada f1 , . . . , fn possuem derivadas parciais no ponto a ∈ U e g : V → R uma função diferenciável no ponto b = f (a). Então g ◦ f : U → R possui derivadas parciais no ponto a e vale n ∂(g ◦ f ) X ∂g ∂fk = · , i = 1, . . . , m, ∂xi ∂yk ∂xi k=1 onde as derivadas parciais relativas aos xi são calculadas no ponto a e as relativas a yk são calculadas no ponto b = f (a). Além disso, se f e g são ambas de classe C 1 então g ◦ f ∈ C 1 . Observação. No Capı́tulo 5 provaremos, mais geralmente, que se f e g forem diferenciáveis então g ◦ f é diferenciável. Demonstração. Podemos escrever g(f (a + tei )) − g(f (a)) = n X ∂g · [fk (a + tei ) − fk (a)] ∂yk k=1 + ρ(t) · |f (a + tei ) − f (a)| onde, por simplicidade, escrevemos ρ(t) em vez de ρ(v) com v = f (a + tei ) − f (a). A diferenciabilidade de g nos dá lim ρ(t) = 0. Então t→0 n g(f (a + tei )) − g(f (a)) X ∂g fk (a + tei ) − fk (a) = · t ∂yk t k=1 ± ρ(t) f (a + tei ) − f (a) . t 60 Funções Reais de n Variáveis Cap. 3 Logo n g(f (a + tei )) − g(f (a)) X ∂g ∂fk ∂(g ◦ f ) = lim = · t→0 ∂xi t ∂yk ∂xi k=1 pois lim ρ(t) = 0 e lim t→0 t→0 f (a + tei ) − f (a) ∂f = (a) . t ∂xi O fato de que g ◦ f ∈ C 1 decorre da expressão de ∂(g ◦ f )/∂xi em termos das derivadas parciais de g e das fk , que são contı́nuas. O gradiente de uma função diferenciável f : U → R no ponto a ∈ U é o vetor ∂f ∂f (a), . . . , (a) . grad f (a) = ∂x1 ∂xn Se v é qualquer vetor de Rn , a derivada direcional de f no ponto a, na direção de v é, por definição, f (a + tv) − f (a) ∂f (a) = lim · t→0 ∂v t Estas definições permitem enunciar os seguintes corolários da Regra da Cadeia. O primeiro deles mostra que, quando f é diferenciável no ∂f (a) existe em relação a qualquer vetor ponto a, a derivada direcional ∂v v, dá uma expressão para essa derivada em termos das derivadas parciais de f e das coordenadas de v e, finalmente, mostra que, na definição de ∂f (a), em vez do caminho retilı́neo t 7→ a + tv, pode-se usar qualquer ∂v caminho λ : (−δ, δ) → U desde que se tenha λ(0) = a e λ′ (0) = v. O Corolário 3 é, na realidade, um importante teorema. Corolário 2. Seja f : U → R diferenciável no aberto U ⊂ Rn , com a ∈ U . Dado o vetor v = (α1 , . . . , αn ), se λ : (−δ, δ) → U é qualquer caminho diferenciável tal que λ(0) = a e λ′ (0) = v, tem-se n X ∂f ∂f (a) = (a) · αi . (f ◦ λ) (0) = h grad f (a), vi = ∂v ∂xi ′ i=1 Funções de classe C 1 Seção 2 61 Basta aplicar diretamente a fórmula n X ∂f dλi · , (f ◦ λ) = ∂xi dt ′ i=1 dλi (0). observando que, para λ(t) = (λ1 (t), . . . , λn (t)), tem-se αi = dt ∂f Notar ainda que (a) = (f ◦ λ)′ (0) com λ(t) = a + tv, pois λ′ (0) = v. ∂v Corolário 3 (Teorema do Valor Médio). Dada f : U → R diferenciável no aberto U ⊂ Rn , se o segmento de reta [a, a + v] estiver contido em U então existe θ ∈ (0, 1) tal que ∂f (a + θv) = h grad f (a + θv), vi ∂v n X ∂f (a + θv) · αi = ∂xi f (a + v) − f (a) = i=1 onde v = (α1 , . . . , αn ). Com efeito, considerando o caminho retilı́neo λ : [0, 1] → U , dado por λ(t) = a + tv, vemos que f (a + v) − f (a) = (f ◦ λ)(1) − (f ◦ λ)(0). Pelo Teorema do Valor Médio para funções de uma variável real, existe θ ∈ (0, 1) tal que (f ◦ λ)(1) − (f ◦ λ)(0) = (f ◦ λ)′ (θ). Pela Regra da Cadeia, (f ◦ λ)′ (θ) = n X ∂f ∂f (a + θv) · αi = (a + θv) = h grad f (a + θv), vi. ∂xi ∂v i=1 Corolário 4. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se o segmento de reta [a, a + v] estiver contido em U e existir M > 0 tal que | grad f (a+tv)| ≤ M para todo t ∈ [0, 1] então |f (a+v)−f (a)| ≤ M ·|v|. Com efeito, pela desigualdade de Schwarz, |f (a + v) − f (a)| = |h grad f (a + θv), vi| ≤ | grad f (a + θv)| |v| ≤ M · |v|. Em particular, se U é convexo, se f é diferenciável e se | grad f (x)| ≤ M para todo x ∈ U então |f (y) − f (x)| ≤ M |x − y| quaisquer que sejam x, y ∈ U . Corolário 5. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se U é conexo e grad f (x) = 0 para todo x ∈ U então f é constante. 62 Funções Reais de n Variáveis Cap. 3 Com efeito, pelo Teorema do Valor Médio (Corolário 3), f é constante ao longo de todo segmento de reta contido em U . Ora, sendo o aberto U conexo, dois quaisquer de seus pontos podem ser ligados por um caminho poligonal (justaposição de segmentos de reta) contido em U . Dada f : U → R de classe C 1 , o conjunto f −1 (c) = {x ∈ U ; f (x) = c} é, para todo c ∈ R, chamado o conjunto de nı́vel c da função f . Quando U ⊂ Rn e n = 2 esse conjunto é geralmente chamado a curva ou linha de nı́vel c de f , a qual é definida pela equação f (x, y) = c. Analogamente, quando n = 3, o conjunto f −1 (c), definido pela equação f (x, y, z) = c costuma ser chamado a superfı́cie de nı́vel c da função f . Deve-se observar porém que, para certas funções especialmente escolhidas, tais conjuntos podem ser bem diferentes daquilo que se imagina como uma curva ou uma superfı́cie. Mencionaremos a seguir algumas propriedades do gradiente. Elas justificam a importância desse vetor, o qual dá interessantes informações sobre o comportamento da função. Para isto, fixaremos a∈U , suporemos que f ∈C 1 e que grad f (a) 6= 0. Então: 1) O gradiente aponta para uma direção segundo a qual a função é crescente; 2) Dentre todas as direções ao longo das quais f cresce, a direção do gradiente é a de crescimento mais rápido; 3) O gradiente de f no ponto a é ortogonal ao conjunto de nı́vel de f que passa por a. Vejamos o que significam estas afirmações. Em primeiro lugar, pondo w = grad f (a) temos ∂f (a) = h grad f (a), wi = | grad f (a)|2 > 0 ∂w Isto quer dizer que se λ : (−ε, ε) → U é tal que λ ∈ C 1 , λ(0) = a e = grad f (a) então a função t 7→ f (λ(t)) tem derivada positiva no ponto t = 0. Logo, diminuindo ε se necessário, f ◦ λ : (−ε, ε) → R será uma função crescente. É este o significado de “f cresce na direção do gradiente.” λ′ (0) Funções de classe C 1 Seção 2 63 grad f (x) f −1 (c) Figura 3.1 Como ∂f /∂v = h grad f, vi, os vetores v que apontam para as direções ao longo das quais f cresce são aqueles para os quais se tem h grad f, vi > 0, isto é, aqueles que formam um ângulo agudo com grad f (a). Dizer que o crescimento de f é mais rápido na direção do gradiente significa o seguinte: se v ∈ Rn é tal que |v| = | grad f (a)| então ∂f ∂f (a) ≤ . ∂v ∂(grad f (a)) Com efeito, pela desigualdade de Schwarz: ∂f (a) = h grad f (a), vi ≤ | grad f (a)| · |v| ∂v ∂f = | grad f (a)|2 = · ∂(grad f (a)) Esclareçamos agora a terceira das afirmações acima. Dizer que w ∈ Rn é ortogonal ao conjunto de nı́vel f −1 (c) significa que, dado qualquer caminho λ : (−ε, ε) → f −1 (c), diferenciável no ponto t = 0, com λ(0) = a, tem-se hw, λ′ (0)i = 0. Ora, λ(t) ∈ f −1 (c) significa que f (λ(t)) = c para todo t ∈ (−ε, ε), portanto f ◦ λ : (−ε, ε) → R é constante, igual a c, logo (f ◦ λ)′ (0) = 0, ou seja h grad f (a), λ′ (0)i = 0. Assim, grad f (a) é ortogonal ao vetor velocidade no ponto a = λ(0) de qualquer caminho diferenciável λ contido no conjunto de nı́vel f −1 (c). Ficam portanto constatadas as três propriedades do gradiente acima enunciadas. Vejamos agora alguns exemplos simples. Exemplo 2. Sejam f, g, h : R2 → R definidas por f (x, y) = ax + by (com a2 + b2 6= 0), g(x, y) = x2 + y 2 e h(x, y) = x2 − y 2 . A linha de nı́vel c de f é a reta definida pela equação ax + by = c. O vetor grad f (x, y) é constante: grad f = (a, b) em qualquer ponto (x, y) ∈ R2 . 64 Funções Reais de n Variáveis Cap. 3 Assim as linhas de nı́vel de f são retas paralelas umas às outras, todas perpendiculares ao vetor v = (a, b). O conjunto de nı́vel c da função g(x, y) = x2 + y 2 é vazio se c < 0 e reduz-se ao ponto 0 ∈ R2 quando c = 0. Para c > 0, a linha de nı́vel c é a circunferência de equação x2 + y 2 = c, cujo centro é a origem e cujo √ raio é c. O gradiente de g é grad g(x, y) = (2x, 2y), um vetor colinear com o raio, o que era de esperar pois a tangente da circunferência é perpendicular ao raio no ponto de contacto. A linha de nı́vel 0 da função h(x, y) = x2 − y 2 é o par de retas perpendiculares definidas pela equação x2 − y 2 = 0, que equivale a “x+y = 0 ou x−y = 0”. Se c > 0, x2 −y 2 = c define uma hipérbole cujo eixo é o eixo das abcissas; se c < 0 a hipérbole x2 −y 2 = c tem como eixo o eixo das ordenadas. O gradiente de h é o vetor grad h(x, y) = (2x, −2y). Atribuindo valores particulares a x e y, vemos que este vetor é perpendicular à curva de nı́vel que passa em (x, y) e aponta na direção de crescimento de h. ⊳ (2x, 2y) (a, b) (x, y) x2 + y 2 = c ax + by = c x2 − y 2 = c (x, y) (2x, −2y) Figura 3.2 Chama-se ponto crı́tico de uma função diferenciável f : U → R um ponto a ∈ U tal que grad f (a) = 0. Seção 3 O Teorema de Schwarz 65 A função f do Exemplo 2 não possui ponto crı́tico. As funções g e h do mesmo exemplo têm a origem como ponto crı́tico. Nota-se em ambos os casos uma quebra de regularidade na disposição das curvas de nı́vel quando se atinge um nı́vel em que há ponto crı́tico. 3 O Teorema de Schwarz Seja f : U → R uma função que possui as derivadas parciais ∂f (x), . . . , ∂x1 ∂f (x) em todo ponto x do aberto U ⊂ Rn . A j-ésima derivada parcial ∂xn ∂f : U → R no ponto x ∈ U será indicada por da função ∂xi ∂2f ∂ (x) = ∂xj ∂xi ∂xj ∂f ∂xi (x), i, j = 1, . . . , n. Se essas derivadas parciais de segunda ordem existirem em cada ∂2f ponto x ∈ U , teremos n2 funções : U → R. Quando tais funções ∂xj ∂xi forem contı́nuas, diremos que f é de classe C 2 e escreveremos f ∈ C 2 . Em geral, a mera existência das derivadas parciais de segunda ordem em todos os pontos onde f está definida não assegura que se tenha ∂2f ∂2f = , ∂xj ∂xi ∂xi ∂xj como se vê no exemplo abaixo. xy(x2 − y 2 ) x2 + y 2 quando x2 + y 2 = 6 0 e f (0, 0) = 0. Para todo y = 6 0 tem-se f (0, y) = 0, logo ∂f f (x, y) y(x2 − y 2 ) (0, y) = lim = lim = −y, x→0 x→0 x2 + y 2 ∂x x Exemplo 3. Seja f : R2 → R definida por f (x, y) = Portanto ∂ ∂2f (0, 0) = ∂y∂x ∂y ∂f (0, y) = −1. ∂x 66 Funções Reais de n Variáveis Um cálculo análogo mostra que Cap. 3 ∂2f (0, 0) = 1. Logo ∂x∂y ∂2f ∂2f (0, 0) 6= (0, 0). ∂x∂y ∂y∂x ⊳ Em todo ponto x ∈ U onde existem as derivadas parciais de segunda ∂2f (x) formam ordem da função f : U → R, os números hij (x) = ∂xi ∂xj uma matriz h (x) = [hij (x)], chamada a matriz hessiana da função f . O Teorema de Schwarz afirma que se f é de classe C 2 então a matriz hessiana de f é simétrica. A demonstração que daremos para o Teorema de Schwarz se baseia num resultado, atribuı́do a Leibniz, segundo o qual é permitido derivar sob o sinal de integral, desde que o resultado da derivação seja uma função contı́nua. Por sua vez, a demonstração do Teorema de Leibniz utiliza o lema abaixo, que poderia estar no Capı́tulo 1 mas é colocado aqui para deixar claro como cada proposição depende da anterior. Lema 1. Sejam X ⊂ Rm um conjunto arbitrário e K ⊂ Rn compacto. Fixemos x0 ∈ X. Se f : X × K → Rp é contı́nua então, para todo ε > 0 dado, pode-se obter δ > 0 tal que x ∈ X e |x − x0 | < δ implicam |f (x, t) − f (x0 , t)| < ε, seja qual for t ∈ K. Demonstração. Do contrário existiriam ε > 0 e seqüências de pontos xk ∈ X e tk ∈ K tais que |xk − x0 | < 1/k e |f (xk , tk )−f (x0 , tk )| ≥ ε. Passando a uma subseqüência, se necessário, podemos admitir que lim tk = t0 ∈ K. Como, evidentemente, lim xk = x0 , a continuidade de f nos daria ε ≤ lim |f (xk , tk ) − f (x0 , tk )| = |f (x0 , t0 ) − f (x0 , t0 )| = 0, uma contradição. Teorema 3 (Derivação sob o sinal de integral). Dado U ⊂ Rn aberto, seja f : U × [a, b] → R contı́nua, tal que a i-ésima derivada ∂f parcial (x, t) existe para todo ponto (x, t) ∈ U × [a, b] e a função ∂xi ∂f /∂xi : U × [a, b] → R, assim definida, é contı́nua. Então a função Z b f (x, t)dt, possui a i-ésima derivada ϕ : U → R, dada por ϕ(x) = a Z b ∂f ∂ϕ (x) = (x, t)dt. Em parcial em cada ponto x ∈ U , sendo ∂xi a ∂xi Seção 3 O Teorema de Schwarz 67 suma: pode-se derivar sob o sinal de integral, desde que o integrando resultante seja uma função contı́nua. Demonstração. Para todo s suficientemente pequeno, o segmento de reta [x, x + sei ] está contido em U . Temos Z b ∂f ϕ(x + sei ) − ϕ(x) − (x, t) dt = s ∂x i a Z b f (x + sei , t) − f (x, t) ∂f = − (x, t) dt. s ∂xi a Mostremos que, dado arbitrariamente ε > 0, existe δ > 0 tal que, para todo |s| < δ e todo t ∈ [a, b], a expressão sob o último sinal de integral acima é, em valor absoluto, inferior a ε/(b − a). Isto demonstrará o teorema. Ora, pelo Teorema do Valor Médio, para cada t ∈ [a, b] existe θ = θt ∈ (0, 1) tal que f (x + sei , t) − f (x, t) ∂f = (x + θsei , t). s ∂xi ∂f : U × [a, b] → R é contı́nua, o Lema 1 fornece, a partir do ε ∂xi dado, um δ > 0 tal que se tem Como ∂f ε ∂f (x + θsei , t) − (x, t) < ∂xi ∂xi b−a para todo t ∈ [a, b], desde que seja |s| < δ (e conseqüentemente |θs| < δ). Isto completa a demonstração. Teorema 4 (Schwarz). Se f : U → R é de classe C 2 no aberto U ⊂ Rn então, para quaisquer i, j = 1, . . . , n e x ∈ U , tem-se ∂2f ∂2f (x) = (x). ∂xi ∂xj ∂xj ∂xi Demonstração. Sem perda de generalidade, podemos supor que U = I × J é um retângulo em R2 . Fixando b ∈ J, o Teorema Fundamental do Cálculo nos diz que, para todo (x, y) ∈ U , tem-se Z y ∂f (x, t)dt. f (x, y) = f (x, b) + b ∂y 68 Funções Reais de n Variáveis Cap. 3 Como ∂ 2 f /∂x∂y é contı́nua, podemos derivar sob o sinal de integral, logo Z y 2 ∂f ∂ f ∂f (x, y) = (x, b) + (x, t)dt. ∂x ∂x ∂x∂y b Em seguida, derivamos em relação a y e obtemos ∂2f ∂2f (x, y) = (x, y). ∂y∂x ∂x∂y Mais geralmente, para cada inteiro k ≥ 1, podemos considerar as derivadas parciais de ordem k de uma função f : U → R, definida no aberto U ⊂ Rn . Por exemplo, para 1 ≤ i, j, k ≤ n, 2 ∂3f ∂ ∂ f (a) significa (a). ∂xi ∂xj ∂xk ∂xi ∂xj ∂xk Como toda permutação dos ı́ndices i1 , . . . , ik pode ser obtida por meio de repetidas inversões de ı́ndices adjacentes, segue-se do Teorema de Schwarz que a derivada de ordem k ∂kf (a) ∂xi1 ∂xi2 . . . ∂xik não depende da ordem em que são feitas as derivações, desde que todas as derivadas de ordem k de f existam e sejam contı́nuas. Uma função f : U → R que possui, em cada ponto de U , todas as derivadas parciais de ordem k, as quais são funções contı́nuas em U , chama-se uma função de classe C k . Escreve-se então f ∈ C k . Quando f ∈ C k para todo k = 1, 2, 3, . . . , diz-se que f é uma função de classe C ∞ . 4 A fórmula de Taylor A fórmula de Taylor, que estabeleceremos aqui em sua versão restrita aos termos de até segunda ordem, é fundamental para o estudo do comportamento de uma função de classe C 2 na proximidade de um ponto crı́tico. Ela se baseia no lema abaixo. Lema 2. Seja r : B → R de classe C 2 na bola aberta B ⊂ Rn , de centro ∂r ∂2r 0. Se r(0) = (0) = (0) = 0 para quaisquer i, j = 1, . . . , n, ∂xi ∂xi ∂xj r(v) = 0. então lim v→0 |v|2 Seção 4 A fórmula de Taylor 69 Demonstração. Sendo r : B → R uma função de classe C 1 (portanto diferenciável) que se anula, juntamente com todas as suas derivadas ∂r/∂xi , no ponto v = 0, segue-se da definição de função diferenciável que lim r(v)/|v| = 0. Pelo Teorema do Valor Médio (Corolário 3 do v→0 Teorema 2), para cada v=(α1 , . . . , αn )∈B existe θ tal que 0 < θ < 1 e n n X ∂r r(v) X r(v) = (θv) · αi , logo = ∂xi |v|2 i=1 i=1 ∂r ∂xi (θv) |θv| · θαi · |v| Como cada derivada parcial ∂r/∂xi se anula, juntamente com todas as suas derivadas ∂ 2 r/∂xj ∂xi , no ponto 0, resulta da nossa observação inicial que ∂r (θv)/|θv| = 0 para todo i = 1, . . . , n. lim v→0 ∂xi Além disso, cada quociente θαi /|v| tem valor absoluto ≤ 1. Por conser(v) guinte lim = 0. v→0 |v|2 Teorema 5 (Fórmula de Taylor). Seja f : U → R de classe C 2 no aberto U ⊂ Rn . Fixado a ∈ U , para todo v = (α1 , . . . , αn ) ∈ Rn tal que a + v ∈ U , escrevamos n n X 1 X ∂2f ∂f · αi + · αi αj + r(v), f (a + v) − f (a) = ∂xi 2 ∂xi ∂xj i,j=1 i=1 r(v) = 0. v→0 |v|2 Demonstração. De acordo com o Lema 2 devemos demonstrar que as derivadas sendo calculadas no ponto a. Então lim n n X ∂f 1 X ∂2f r(v) = f (a + v) − f (a) − · αi − · αi αj ∂xi 2 ∂xi ∂xj i=1 i,j=1 se anula, juntamente com suas derivadas parciais de primeira e segunda ordem, no ponto v = 0. Para fazer o cálculo, começamos lembrando que, na expressão de r(v), as variáveis independentes são as coordenadas α1 , . . . , αn de v. É em relação a elas que as derivadas parciais de r devem ser tomadas, embora continuemos escrevendo ∂r/∂xi e ∂ 2 r/∂xi ∂xj . Observemos também que, no somatório duplo que ocorre na definição de r(v), 70 Funções Reais de n Variáveis Cap. 3 cada par de variáveis αi , αj aparece em duas parcelas iguais, a saber, ∂2f ∂2f · αj αi e · αi αj . Levando isto em conta, temos: ∂xj ∂xi ∂xi ∂xj n X ∂2f ∂r ∂f ∂f (v) = (a + v) − (a) − (a) · αi . ∂xj ∂xj ∂xj ∂xi ∂xj i=1 Derivando outra vez, vem: ∂2f ∂2f ∂2r (v) = (a + v) − (a). ∂xi ∂xj ∂xi ∂xj ∂xi ∂xj Conseqüentemente r(0) = 0, quaisquer i, j = 1, . . . , n. ∂2r ∂r (0) = 0 e (0) = 0 para ∂xi ∂xi ∂xj Observação. Se pusermos ρ(v) = fórmula de Taylor se escreve assim: r(v) quando v 6= 0 e ρ(0) = 0, a |v|2 n n X 1 X ∂2f ∂f αi + · αi αj + ρ(v) · |v|2 , f (a + v) − f (a) = ∂xi 2 ∂xi ∂xj i=1 i,j=1 onde lim ρ(v) = 0. v→0 5 Pontos crı́ticos Uma forma quadrática H : Rn → R é uma função cujo valor no vetor n P hij αi αj , onde [hij ] é uma matriz simétrica n × n. v = (α1 , . . . , αn ) é i,j=1 O valor da forma quadrática H no vetor v será indicado com a notação H · v 2 . Portanto H · v2 = n X hij αi αj quando v = (α1 , . . . , αn ). i,j=1 Se t ∈ R então H · (tv)2 = t2 · (H · v 2 ). A forma quadrática H chama-se não-negativa quando H · v 2 ≥ 0 para todo v ∈ Rn , positiva quando H · v 2 > 0 para todo v 6= 0 em Rn e indefinida quando existem v, w ∈ Rn tais que H · v 2 > 0 e H · w2 < 0. De modo análogo se definem forma quadrática negativa e não-positiva. Quando H é positiva ou negativa, diz-se que ela é definida. Seção 5 Pontos crı́ticos 71 Exemplo 4. A forma quadrática H : Rn → R, onde H · v 2 = hv, vi, é positiva. Como hv, vi = α12 + · · · + αn2 , a matriz de H é a identidade. Para todo k ∈ [1, n], H · v 2 = α12 + · · · + αk2 é uma forma quadrática não-negativa em Rn . Por outro lado, se pusermos H · v 2 = 2 α12 + · · · + αk2 − αk+1 − · · · − αn2 com 0 < k < n, teremos uma forma quadrática indefinida. Evidentemente, se H é positiva (respect. nãonegativa) então −H é negativa (respect. não-positiva). Seja H : Rn → R uma forma quadrática cuja matriz é [hij ]. Se chamarmos de H0 : Rn → Rn o operador linear cuja matriz na base canônica de Rn é também [hij ], vemos imediatamente que H · v 2 = hH0 ·v, vi para todo v ∈ Rn . Como a matriz [hij ] do operador H0 na base canônica é simétrica, H0 é auto-adjunto. Reciprocamente, para qualquer operador auto-adjunto H0 : Rn → Rn , a função H : Rn → R, dada por H · v 2 = hH0 · v, vi, é uma forma quadrática. Quando H é definida, o operador H0 é invertı́vel pois hH0 ·v, vi = 6 0 para todo v 6= 0 ⇒ H0 ·v 6= 0 para todo v 6= 0. Dada a função f : U → R, de classe C 2 no aberto U ⊂ Rn , a forma quadrática hessiana = (Hf )(x) de f no ponto x ∈ U é aquela cuja H(x) ∂2f matriz é [hij ] = (x) . Assim, para todo v = (α1 , . . . , αn ) ∈ Rn , ∂xi ∂xj tem-se n X ∂2f 2 (x) · αi αj . H(x) · v = ∂xi ∂xj i,j=1 A forma hessiana é usada para determinar a natureza dos pontos crı́ticos da função f . Diz-se que a ∈ U é um ponto de máximo local da função f : U → R quando existe δ > 0 tal que f (x) ≤ f (a) para todo x ∈ U ∩B(a; δ). Analogamente se define um ponto de mı́nimo local . Um ponto a, de máximo (ou de mı́nimo) local de uma função diferenciável f , é um ponto crı́tico de f . Com efeito, para todo i = 1, . . . , n, se δ > 0 é suficientemente pequeno então a função ϕ : (−δ, δ) → R, dada por ϕ(t) = f (a + tei ), está bem definida e possui um máximo (ou mı́nimo) local no ponto t = 0. ∂f Logo 0 = ϕ′ (0) = (a), i = 1, . . . , n. ∂xi Exemplo 5. A origem 0 ∈ R2 é ponto crı́tico das três funções f, g, h : R2 → R, definidas por f (x, y) = x2 + y 2 , g(x, y) = −x2 − y 2 e h(x, y) = x2 − y 2 . Para f a origem é um ponto de mı́nimo, para g de máximo e 72 Funções Reais de n Variáveis Cap. 3 para h não é máximo nem mı́nimo pois em qualquer disco de centro 0 a função h assume valores maiores e menores do que 0 = h(0, 0). ⊳ Teorema 6. Seja a ∈ U um ponto crı́tico da função f : U → R, de classe C 2 . a) Se a forma quadrática hessiana H(a) for positiva então a é um ponto de mı́nimo local de f . b) Se H(a) for negativa então a é um ponto de máximo local. c) Se H(a) for indefinida, então a não é ponto de máximo nem de mı́nimo local de f . Demonstração. a) Por simplicidade, escrevamos H em vez de H(a). Pelo Teorema de Weierstrass, a função contı́nua positiva H assume um valor mı́nimo 2c > 0 no conjunto compacto S n−1 . Noutras palavras, existe c > 0 tal que H · u2 ≥ 2c para todo vetor u ∈ Rn com |u| = 1. Como a é um ponto crı́tico de f , a fórmula de Taylor se resume a f (a + v) − f (a) = 1 H · v 2 + ρ(v)|v|2 com lim ρ(v) = 0. v→0 2 Como v/|v| é um vetor unitário (pertencente a S n−1 ), temos v 2 |v|2 |v|2 1 ≥ H · v2 = H· · 2c = |v|2 · c. 2 2 |v| 2 Portanto f (a + v) − f (a) ≥ |v|2 (c + ρ(v)). Pela definição de limite, existe δ > 0 tal que a + v ∈ U e 0 < |v| < δ implicam |ρ(v)| < c e conseqüentemente c + ρ(v) > 0. Logo f (a + v) − f (a) > 0, isto é, f (a) < f (a + v) para todo v tal que a + v ∈ U e 0 < |v| < δ. Assim, a é um ponto de mı́nimo local para f . b) Segue as mesmas linhas do caso anterior. c) Dado v ∈ Rn , tem-se a + tv ∈ U para todo t suficientemente pequeno. Então, lembrando que H · (tv)2 = t2 · (H · v 2 ), temos f (a + tv) − f (a) = t2 · i v 2 |v|2 h + ρ(tv) , com lim ρ(tv) = 0. · H· t→0 2 |v| Segue-se, como acima, que para todo t suficientemente pequeno, f (a + tv) − f (a) tem o mesmo sinal que H · v 2 . Assim, se H é indefinida, Seção 5 Pontos crı́ticos 73 com H · v 2 > 0 e H · w2 < 0, em qualquer bola de centro a existem pontos a + tv e a + tw tais que f (a + tv) > f (a) e f (a + tw) < f (a). Portanto f não tem máximo nem mı́nimo local no ponto a. Corolário 6. Se a função f : U → R, de classe C 2 , possui um mı́nimo (respect. máximo) local no ponto a ∈ U então a forma quadrática hessiana de f é não-negativa (respect. não-positiva) nesse ponto. Com efeito, se fosse H · v02 < 0 para algum v0 ∈ Rn , terı́amos f (a + tv0 ) < f (a) para todo t suficientemente pequeno, e então a não seria um ponto de mı́nimo local. Mesmo argumento para máximo local. Exemplo 6. Pela demonstração acima, vê-se que quando a forma quadrática hessiana é positiva (respect. negativa) no ponto a então a é um ponto de mı́nimo (respect. máximo) local estrito, isto é, numa pequena bola de centro a não há outros pontos x com f (x) = f (a). Por exemplo, a origem é um ponto de mı́nimo estrito da função f (x, y) = x2 + y 2 mas todos os pontos (x, 0) do eixo das abcissas são pontos de mı́nimo não-estritos da função g(x, y) = y 2 . (O domı́nio de ambas as funções f, g é R2 .) A forma hessiana de f na origem de R2 é H · v 2 = 2α2 + 2β 2 se v = (α, β) enquanto a de g é K · v 2 = 2β 2 . Vemos que H é positiva e K é apenas não-negativa. Já a forma hessiana da função h(x, y) = x2 − y 2 na origem é L · v 2 = 2α2 − 2β 2 , que é indefinida. Por isso a origem é um ponto crı́tico que não é máximo nem mı́nimo local (ponto de sela). ⊳ Exemplo 7. Poder-se-ia indagar se vale a recı́proca do corolário acima. A resposta é negativa. A função f : R2 → R, dada por f (x, y) = x2 + y 3 tem a origem de R2 como ponto crı́tico, no qual a forma hessiana é H · v 2 = 2α2 , para v = (α, β). A forma H é não-negativa porém a origem não é um ponto de mı́nimo local de f . ⊳ Neste ponto, cabe a pergunta: de que modo podemos determinar se uma dada forma quadrática é positiva, negativa, etc? O método de completar o quadrado, devido a Lagrange, responde a questão. Este método, que se baseia na observação óbvia de que a2 +2ab = (a+b)2 −b2 , consiste em efetuar sucessivas mudanças de variáveis, visando eliminar, na expressão da forma quadrática H, os termos como xy, xz, yz, etc, deixando apenas parcelas do tipo x2 , y 2 , z 2 etc. Os exemplos a seguir ilustram o método de completar os quadrados. 74 Funções Reais de n Variáveis Cap. 3 Exemplo 8. Seja a forma quadrática H(x, y) = x2 − xy + y 2 em R2 . Completando o quadrado, temos y 2 y 2 y − · x2 − xy = x2 − 2x · = x − 2 2 4 Logo y 2 3 2 y 2 y 2 − + y . + y2 = x − H(x, y) = x − 2 4 2 4 √ 2 2 Portanto H(x, y) = s + t com s = x − y/2 e t = ( 3/2) · y. Assim, a forma H é positiva. O mesmo processo, aplicado à forma K, onde K(x, y) = x2 + 3xy + y 2 nos dá 2 3 9 K(x, y) = x + y − y 2 + y 2 , 2 4 ou seja, √ 2 5 2 3 5 3 2 2 y. K(x, y) = x + y − y = s − t com s = x + y e t = 2 4 2 2 Portanto a forma K é indefinida. ⊳ Exemplo 9. Seja em R3 a forma quadrática H(x, y, z) = x2 + y 2 + z 2 + 3xy + 3xz + 4yz. Agrupando os termos que contêm x, temos: 2 9 3 3 2 2 x + 3xy + 3xz = x + 2x · (y + z) = x + (y + z) − (y + z)2 2 2 4 9 9 3 9 = s2 − y 2 − z 2 − yz, com s = x + (y + z). 4 4 2 2 Logo 9 2 9 2 9 y − z − yz + 4yz 4 4 2 5 2 5 2 1 2 = s − y − z − yz. 4 4 2 H(x, y, z) = s2 + y 2 + z 2 − Agrupando os termos que contêm y: 2 5 2 1 1 2 5 5 2 1 2 − y − yz = − z y + yz = − y+ z + 4 2 4 5 4 5 20 1 2 1 5 z com t = y + z. = − t2 + 4 20 5 Seção 6 Funções convexas 75 Portanto: H(x, y, z) = s2 − 5 2 1 2 5 2 5 6 t + z − z = s2 − t2 − z 2 . 4 20 4 4 5 Concluı́mos então que a forma quadrática H é indefinida. Com efeito, para z = 0 temos 5 H(x, y, 0) = s − t2 = 4 2 2 5 3 x + y − y2. 2 4 Logo H(x, 0, 0) = x2 e, em particular, H(1, 0, 0) = 1, enquanto H(−3/2, 1, 0) = −5/4. ⊳ 6 Funções convexas Seja C ⊂ Rn um conjunto convexo. Uma função f : C → R chama-se convexa quando, para quaisquer x, y ∈ C e t ∈ [0, 1], tem-se f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y). Alternativamente: f é convexa quando, para quaisquer x, y ∈ C e α, β ∈ [0, 1] com α + β = 1, tem-se f (αx + βy) ≤ α · f (x) + β · f (y). Diz-se que f : C → R é côncava quando −f é convexa. Isto equivale a dizer que, para quaisquer x, y ∈ C e t ∈ [0, 1] tem-se f ((1 − t)x + ty) ≥ (1 − t)f (x) + tf (y). Todos os resultados a seguir estabelecidos para funções convexas valem, com as óbvias modificações, para funções côncavas. A combinação linear α1 v1 + · · · + αk vk chama-se uma combinação convexa de v1 , . . . , vk ∈ Rn quando α1 + · · · + αk = 1 e αi ≥ 0 para i = 1, . . . , k. Teorema 7. Se C ⊂ Rn é convexo e v1 , . . . , vk ∈ C então toda combinação convexa α1 v1 +· · ·+αk vk pertence a C. Além disso, se f : C → R é uma função convexa, tem-se ! k k X X f αi · f (vi ). αi vi ≤ i=1 i=1 Demonstração. Para k = 1 isto é óbvio e para k = 2 é a definição de conjunto convexo. Mostraremos por indução em k que a combinação 76 Funções Reais de n Variáveis Cap. 3 convexa de k elementos de C ainda pertence a C. Supondo este fato verdadeiro para um certo k, escrevamos uma combinação convexa dos elementos v1 , . . . , vk+1 ∈ C sob a forma k+1 X αi vi = k X αi vi + αk+1 vk+1 . i=1 i=1 Sem perda de generalidade, podemos admitir que αk+1 6= 1. Então, k P αi , temos αk+1 = 1 − α e α 6= 0. Pela hipótese de pondo α = i=1 indução, levando em conta que pertence a C. Logo k+1 X i=1 k α k α P P i i = 1, vemos que v = vi i=1 α i=1 α αi vi = αv + (1 − α)vk+1 ∈ C, pois C é convexo. A segunda parte também se prova por indução, pois f k+1 X i=1 αi vi ! =f k X αi vi + αk+1 vk+1 i=1 =f α· ≤α·f ≤α· k X αi i=1 k X i=1 k X αi i=1 α α ! vi + (1 − α)vk+1 αi vi α ! ! + (1 − α)f (vk+1 ) f (vi ) + (1 − α)f (vk+1 ) = k+1 X αi f (vi ). i=1 Teorema 8. Seja C ⊂ Rn convexo. A fim de que a função f : C → R seja convexa, é necessário e suficiente que, para quaisquer a, b ∈ C, a função ϕ : [0, 1] → R, definida por ϕ(t) = f (a + tv), v = b − a, seja convexa. Equivalentemente: f : C → R é convexa se, e somente se, sua restrição a qualquer segmento de reta [a, b] ⊂ C é convexa. Seção 6 Funções convexas 77 Demonstração. Se f é convexa então, para s, t, α ∈ [0, 1] temos ϕ (1 − α)s + αt = f (a + [(1 − α)s + αt]v) = f [(1 − α) · (a + sv) + α · (a + tv)] ≤ (1 − α)f (a + sv) + αf (a + tv) = (1 − α)ϕ(s) + αϕ(t) logo ϕ é convexa. Reciprocamente, se todas as funções ϕ, definidas do modo acima, são convexas então, dados x, y ∈ C e α ∈ [0, 1], pomos ϕ(t) = f (x + t(y − x)) e temos: f (1 − α)x + αy = f x + α(y − x) = ϕ(α) = ϕ (1 − α) · 0 + α · 1 ≤ (1 − α) · ϕ(0) + α · ϕ(1) = (1 − α) · f (x) + α · f (y), portanto f é convexa. Como aplicação do Teorema 8, mostremos que se f : U → R é uma função convexa e o conjunto convexo U ⊂ Rn é aberto então, para cada a ∈ U , existe a derivada de Gâteux ∂f f (a + tv) − f (a) (a) = lim · + + ∂v t t→0 Com efeito, a função ϕ : [0, 1] → R definida por ϕ(t) = f (a + tv) é convexa, portanto existe a derivada à direita ϕ′+ (0) (veja Vol. 1, ∂f pág. 108). Mas, como se vê facilmente, ϕ′+ (0) = + (a). ∂v Daı́ se conclui, como no Vol. 1, que toda função convexa definida num subconjunto aberto de R é contı́nua. Este resultado continua válido em Rn com n > 1 (ver Apêndice deste capı́tulo) porém não decorre da existência da derivada de Gâteaux, pois uma função em Rn pode ser contı́nua ao longo de cada reta que passa por um ponto a sem que seja necessariamente contı́nua nesse ponto. Teorema 9. Seja f : U → R definida no aberto convexo U ⊂ Rn . Então: a) O conjunto E(f ) = {(x, y) ∈ U × R; y ≥ f (x)} ⊂ Rn+1 , chamado o epigráfico de f , é convexo se, e somente se, f é convexa. b) Supondo-a de classe C 1 , a função f é convexa se, e somente se, para a, a + v ∈ U quaisquer, tem-se f (a + v) ≥ f (a) + h grad f (a), vi. 78 Funções Reais de n Variáveis Cap. 3 c) Quando é de classe C 2 , a função f é convexa se, e somente se, sua forma quadrática hessiana é não-negativa em todos os pontos de U . Demonstração. (a) Seja E(f ) convexo. Para mostrar que f é convexa, tomamos x, x′ ∈ U e α ∈ [0, 1]. Então (x, f (x)) e (x′ , f (x′ )) pertencem a E(f ), portanto (1 − α)x + αx′ , (1 − α) · f (x) + α · f (x′ ) ∈ E(f ). Isto significa que (1 − α) · f (x) + α · f (x′ ) ≥ f [(1 − α)x + αx′ ], logo f é convexa. Reciprocamente, supondo f convexa, sejam z = (x, y), z ′ = (x′ , y ′ ) pontos em E(f ) e α ∈ [0, 1]. Então y ≥ f (x) e y ′ ≥ f (x′ ) e daı́ (1−α)y +αy ′ ≥ (1−α)·f (x)+α·f (x′ ) ≥ f (1−α)x+αx′ , a última desigualdade devendo-se à convexidade de f . Logo (1 − α)z + αz ′ = ′ ′ (1 − α)x + αx , (1 − α)y + αy pertence a E(f ), ou seja, E(f ) é um conjunto convexo. (b) Suponhamos f : U → R convexa, de classe C 1 . Pelo Teorema 8, se a e a + v pertencem a U então a função ϕ : [0, 1] → R, definida por ϕ(t) = f (a + tv), é convexa. Portanto (v. Teorema 4, pág 109, vol. 1) tem-se ϕ(1) ≥ ϕ(0)+ϕ′ (0). Mas ϕ(1) = f (a+v), ϕ(0) = f (a) e ϕ′ (0) = h grad f (a), vi. Logo f (a + v) ≥ f (a) + h grad f (a), vi. Reciprocamente, suponhamos que esta desigualdade valha para quaisquer a, a + v ∈ U . Então, pondo ϕ(t) = f (a + tv), temos uma função ϕ : [0, 1] → R tal que ϕ′ (t) = h grad f (a + tv), vi para todo t ∈ [0, 1]. Ora, para quaisquer t, t0 ∈ [0, 1], tem-se f (a + tv) = f (a + t0 v + (t − t0 )v) = f (a + t0 v + sv), com s = t − t0 logo, pela hipótese admitida sobre f , f (a + tv) ≥ f (a + t0 v) + h grad f (a + t0 v), svi = f (a + t0 v) + h grad f (a + t0 v), vi(t − t0 ), o que pode ser lido como ϕ(t) ≥ ϕ(t0 ) + ϕ′ (t0 )(t − t0 ). Pelo Teorema 4, pág. 109, Volume 1, a função ϕ é convexa. O Teorema 8, acima, assegura então que f é convexa. (c) Novamente, usamos o Teorema 8 acima, o qual permite reduzir a questão ao caso de uma função de uma variável, e então recaı́mos no Corolário 2, pag. 110 do Volume 1. Com efeito, pondo ϕ(t) = f (x + tv), com v = (α1 , . . . , αn ), temos P ∂f ϕ′ (t) = ni=1 ∂x (x + tv)αi e i ϕ′′ (t) = Pn ∂2f i,j=1 ∂xi ∂xj (x + tv)αi αj = H(x + tv) · v 2 . Seção 6 Funções convexas 79 Temos portanto as seguintes equivalências: H(x) é não-negativa para todo x ∈ U ⇔ ϕ′′ (t) ≥ 0 para quaisquer x, x + v ∈ U e t ∈ [0, 1] ⇔ todas as funções ϕ do tipo ϕ(t) = f (x + tv) são convexas ⇔ f : U → R é convexa. Corolário 7. Todo ponto crı́tico a de uma função convexa f : U → R de classe C 1 é um ponto de mı́nimo global, isto é, f (x) ≥ f (a) para todo x ∈ U. Apêndice: Continuidade das funções convexas Teorema 10. Seja U ⊂ Rn um aberto convexo. Toda função convexa f : U → R é contı́nua. A demonstração do Teorema 10 se baseia nos dois lemas abaixo. n Q [ai , bi ] é uma Lema 3. Todo ponto de um bloco retangular B = combinação convexa dos vértices desse bloco. i=1 Demonstração. (Por indução.) Isto é óbvio para n = 1. Seja n > 1. n Q {ai , bi }, os Os vértices do bloco B são os 2n elementos do conjunto i=1 quais denotaremos por vj ou vj conforme sua última coordenada seja da forma ak ou bk . Um ponto arbitrário do bloco B pode ser escrito como n−1 Q [ai , bi ], de p = (x, y), onde y ∈ [an , bn ] e x pertence ao bloco B ′ = i=1 P dimensão n − 1. Pela hipótese de indução, x = αj uj é combinação convexa dos vértices uj ∈ B ′ . Os vértices de B são vj = (u Pj , an ) e vj = P (uj , bn ). Pondo P p0 = (x, an ) e p1 = (x, bn ), temos p0 = αj vj e p1 = αj vj (já que αj = 1). Além disso, y = (1 − t)an + tbn , com P P y − an , logo p = (1 − t)p0 + tp1 = (1 − t)αj vj + tαj vj , o que t= bn − an exprime o ponto arbitrário p do bloco B como combinação convexa dos vértices de B. Lema 4. Toda função convexa f : U → R, definida num aberto convexo U ⊂ Rn , é localmente majorada por uma constante. n Q (ai , bi ) o interior de um bloco retangular Demonstração. Seja A = i=1 contido em U . Se indicarmos comPwj , j = 1, . . . , 2n , os vértices de A teremos,Ppara cada x ∈ A, x = αj wj logo, pela convexidade de f , f (x) ≤ αj · f (wj ) ≤ M , onde M = max {f (wj )}. j 80 Funções Reais de n Variáveis Cap. 3 Demonstração do Teorema 10. Para simplificar a escrita, a fim de provar a continuidade de f no ponto arbitrário a ∈ U , podemos admitir que a = 0 e que f (0) = 0, pois o conjunto U0 = {x ∈ Rn ; a − x ∈ U } é convexo, aberto, contém 0 e a função g : U0 → R, definida por g(x) = f (a − x) − f (a), cumpre g(0) = 0, é convexa e é contı́nua no ponto 0 se, e somente se, f é contı́nua no ponto a. Pelo Lema 4, existem c > 0 e M > 0 tais que |x| ≤ c ⇒ f (x) ≤ M . Seja dado ε > 0. Sem perda de generalidade, podemos supor que ε < M . A convexidade de f nos permite afirmar que f ε ε ε ε x =f 1− x ≤ · f (x) ·0+ M M M M logo ε f (x) ≤ ·f M Tomando δ = M x . ε εc , vemos que M M εc |x| < ⇒ x <c⇒f M ε M x ≤ M ⇒ f (x) ≤ ε. ε Além disso, ε M M x+ − x 0 = f (0) = f M +ε M +ε ε M ε M ≤ f (x) + ·f − x . M +ε M +ε ε Simplificando, vem M · f (x) + ε · f (−M x/ε) ≥ 0, donde: f (x) ≥ ε ε · (−f (−M x/ε)) ≥ · (−M ) = −ε. M M Em resumo: |x| < cε/M ⇒ −ε ≤ f (x) ≤ ε, logo f é contı́nua no ponto 0. Seção 7 7 Exercı́cios 81 Exercı́cios Seção 1. Derivadas parciais 1. Um conjunto X ⊂ Rn chama-se i-convexo (1 ≤ i ≤ n) quando para quaisquer a, b ∈ X tais que b = a + tei , tem-se [a, b] ⊂ X. (Se X ⊂ R2 , diz-se então que X é horizontalmente convexo ou verticalmente convexo, conforme seja i = 1 ou i = 2.) Prove que se o aberto U ⊂ Rn é i-convexo e a função f : U → R ∂f (x) = 0 para todo x ∈ U então f não depende da i-ésima variável, cumpre ∂xi isto é, x, x + tei ∈ U ⇒ f (x + tei ) = f (x). 2. Sejam X = {(x, 0); x ≥ 0)} e U = R2 −X. Defina f : U → R pondo f (x, y) = x2 quando x > 0, y > 0 e f (x, y) = 0 quando x ≤ 0 ou y < 0. Mostre que se tem ∂f = 0 em todos os pontos de U mas f depende de y. ∂y 3. Diz-se que um caminho retilı́neo f : I → Rn é paralelo ao i-ésimo eixo quando ele é da forma f (t) = a+tei , t ∈ I. Se U ⊂ Rn é um aberto conexo, prove que dois pontos a, b ∈ U quaisquer podem ser ligados por um caminho poligonal contido em U , cujos trechos retilı́neos são paralelos aos eixos. Conclua que se ∂f (x) = 0 para todo x ∈ U e qualquer U ⊂ Rn é conexo e f : U → R cumpre ∂xi i com 1 ≤ i ≤ n, então f é constante. ∂f :U → R 4. Seja U ⊂ Rn aberto. Se f : U → R possui derivadas parciais ∂xi (i = 1, . . . , n) limitadas, prove que f é contı́nua. Seção 2. Funções de classe C 1 x2 y se (x, y) 6= (0, 0) e f (0, 0) = 0. + y2 ∂f Mostre que, para todo v = (α, β) ∈ R2 , existe a derivada direcional (0, 0) ∂v mas f não é diferenciável no ponto (0, 0). 2. Seja f : Rn → R uma função contı́nua que possui todas as derivadas direcionais ∂f (u) > 0 para todo u ∈ S n−1 , prove que existe em qualquer ponto de Rn . Se ∂u ∂f a ∈ Rn tal que (a) = 0, seja qual for v ∈ Rn . ∂v 3. Seja f : Rn → R diferenciável no ponto 0. Se f (tx) = t · f (x) para todo t > 0 e todo x ∈ Rn , prove que f é linear. Conclua que a função ϕ : R2 → R, dada por ϕ(x, y) = x3 /(x2 + y 2 ) se (x, y) 6= (0, 0) e ϕ(0, 0) = 0, não é diferenciável na origem. 4. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Prove que, dados a ∈ U e ε > 0, existe δ > 0 tal que x, y ∈ U , |x − a| < δ, |y − a| < δ ⇒ f (x) − f (y) = h grad f (a), x − yi + r(x, y), onde |r(x, y)| < ε|x − y|. 1. Seja f : R2 → R definida por f (x, y) = x2 Seção 3. O Teorema de Schwarz ∂2f é ∂x∂y 2 identicamente nula, prove que existem ϕ : I → R, ψ = J → R de classe C tais que f (x, y) = ϕ(x) + ψ(y) para todo (x, y) ∈ I × J. 1. Seja f : I × J → R de classe C 2 no retângulo aberto I × J ⊂ R2 . Se 82 Funções Reais de n Variáveis Cap. 3 2. Use o exercı́cio anterior para provar que se g : R × R → R é de classe C 2 , com ∂2g ∂2g = , então existem ϕ : R → R e ψ : R → R de classe C 2 , tais que 2 ∂x ∂y 2 g(x, y) = ϕ(x + y) + ψ(x − y) para todo (x, y). 3. Seja f : Rn → R de classe C 2 , tal que f (tx) = t2 ·f (x) para todo t > 0 e todo x ∈ n P Rn . Prove que existem aij ∈ R (i, j = 1, . . . , n) tais que f (x) = aij xi xj i,j=1 x4 + y 4 ? para todo x = (x1 , . . . , xn ) ∈ Rn . Como explicar f (x, y) = 2 x + y2 n+1 2 n 4. Sejam f, ϕ : U → R de classe C no aberto U ⊂ R . (Isto é, as funções∂ϕ (x)i = 0 coordenada de f e ϕ são de classe C 2 .) Suponha que hf (x), ∂xi para todo x ∈ U e todo i = 1, . . . , n. Prove que a matriz [aij (x)], onde ∂f ∂ϕ aij (x) = h (x), (x)i, é simétrica, seja qual for x ∈ U . ∂xi ∂xj Seção 4. A fórmula de Taylor 1. Seja r : U → R uma função de classe C k , definida num aberto U ⊂ Rn que contém a origem 0. Se r, juntamente com todas as suas derivadas parciais até r(v) as de ordem k, se anulam no ponto 0, prove que lim = 0. v→0 |v|k 2. Seja f : U → R de classe C 3 no aberto U ⊂ Rn , o qual contém a e a + v, com P ∂2f P ∂f ·αi , d2 f (a)·v 2 = ·αi ·αj v = (α1 , . . . , αn ). Escreva df (a)·v = i,j ∂xi ∂xj i ∂xi 3 P ∂ f ·αi ·αj ·αk , as derivadas parciais sendo calculadas e d3 f (a)·v 3 = ∂x ∂x i j ∂xk i,j,k no ponto x = a e os ı́ndices i, j, k variando de 1 a n. Ponha f (a + v) − f (a) = df (a) · v + 1 2 1 d f (a) · v 2 + d3 f (a) · v 3 + r3 (v) 2 3! r3 (v) = 0. |v|3 Estenda o resultado para funções de classe C k , 1 ≤ k < +∞. e prove que lim v→0 Seção 5. Pontos crı́ticos 1. Uma função f : U → R, de classe C 2 no aberto U ⊂ Rn , chama-se harmônica n P ∂2f quando (x) = 0 para todo x ∈ U . Prove que a matriz hessiana de i=1 ∂xi ∂xi uma função harmônica não pode ser definida (nem positiva nem negativa). 2. Seja f : U → R uma função arbitrária, definida num aberto U ⊂ Rn . Prove que o conjunto dos pontos de máximo (ou de mı́nimo) local estrito de f é enumerável. 3. Determine os pontos crı́ticos da função f : R2 → R, f (x, y) = cos(x2 + y 2 ). Idem para g(x, y) = x3 − y 3 − x + y. 4. Seja f : U → R diferenciável no aberto limitado U ⊂ Rn . Se, para todo a ∈ fr.U , tem-se lim f (x) = 0, prove que existe em U pelo menos um ponto crı́tico de f . x→a Seção 7 Exercı́cios 83 5. Determine os pontos crı́ticos da função f : R2 → R dada por f (x, y) = x2 + y 2 + (x2 − y 2 − 1)2 e calcule as matrizes hessianas correspondentes. 6. Dados a1 , . . . , ak em Rn , determine o ponto em que a função f : Rn → R, dada k P por f (x) = |x − ai |2 , assume o valor mı́nimo. i=1 Seção 6. Funções convexas 1. Seja A ⊂ Rn um conjunto convexo. Prove que a função f : Rn → R, definida por f (x) = d(x, A), é convexa. 2. Prove que todo ponto de mı́nimo local de uma função convexa é um ponto de mı́nimo global. Além disso, o conjunto dos pontos de mı́nimo é convexo. 3. Prove que uma função convexa, f : U → R, com U aberto, (mesmo nãodiferenciável) não possui pontos de máximo local estrito. 4. Prove que o conjunto dos pontos crı́ticos (todos necessariamente mı́nimos globais) de uma função convexa diferenciável é um conjunto convexo, no qual f é constante. 5. Se f : X → R é convexa, prove que, para todo c ∈ R, o conjunto dos pontos x ∈ X tais que f (x) ≤ c é convexo. Dê exemplo mostrando que a recı́proca é falsa. 6. Uma função f : X → R, definida num conjunto convexo X ⊂ Rn , chama-se quase-convexa quando, para todo c ∈ R, o conjunto Xc = {x ∈ X; f (x) ≤ c} é convexo. Prove que f é quase-convexa se, e somente se, f (1 − t)x + ty ≤ max{f (x), f (y)} para x, y ∈ X e t ∈ [0, 1] quaisquer. 4 Funções Implı́citas 1 Uma função implı́cita Os pontos de Rn+1 serão escritos sob a forma (x, y), onde temos x = (x1 , . . . , xn ) ∈ Rn e y ∈ R. O teorema abaixo dá significado preciso à afirmação de que “a equação f (x, y) = c define implicitamente y como função de x”e estabelece uma condição suficiente para que ela seja verdadeira. Teorema 1 (Teorema da Função Implı́cita). Dada a função f : U → R, de classe C k (k ≥ 1) no aberto U ⊂ Rn+1 , seja (x0 , y0 ) ∈ U tal que ∂f f (x0 , y0 ) = c e (x0 , y0 ) 6= 0. Existem uma bola B = B(x0 ; δ) ⊂ Rn e ∂y um intervalo J = (y0 − ε, y0 + ε) com as seguintes propriedades: ∂f ¯ 1) B × J¯ ⊂ U e (x, y) 6= 0 para todo (x, y) ∈ B × J; ∂y 2) Para todo x ∈ B existe um único y = ξ(x) ∈ J tal que f (x, y) = f (x, ξ(x)) = c. A função ξ : B → J, assim definida, é de classe C k e suas derivadas parciais em cada ponto x ∈ B são dadas por ∂f ∂ξ ∂x (x, ξ(x)) · (x) = − ∂fi ∂xi (x, ξ(x)) ∂y ∂f (x0 , y0 ) > 0. ∂y Pela continuidade de ∂f /∂y, existem δ > 0 e ε > 0 tais que, pondo Demonstração. Para fixar as idéias, admitiremos que Seção 1 Uma função implı́cita R U f −1 (c) 85 R J y0 f c f −1 (c) x0 Rn B Figura 4.1 B = B(x0 , δ) ⊂ Rn e J = (y0 − ε, y0 + ε) ⊂ R, temos B × J¯ ⊂ U e ∂f ¯ Então, para todo x ∈ B, a função (x, y) > 0 para todo (x, y) ∈ B × J. ∂y ¯ Como f (x0 , y0 ) = y 7→ f (x, y) é crescente no intervalo [y0 −ε, y0 +ε] = J. c, segue-se que f (x0 , y0 − ε) < c e f (x0 , y0 + ε) > c. Sendo f contı́nua, podemos supor δ tão pequeno que f (x, y0 − ε) < c e f (x, y0 + ε) > c para todo x ∈ B. Pelo Teorema do Valor Intermediário, para cada x ∈ B, existe um único y = ξ(x) ∈ J¯ tal que f (x, y) = c. Tem-se necessariamente y ∈ J. Mostremos que a função ξ : B → J possui derivadas parciais em todo ponto x ∈ B. Com efeito, pondo k = k(t) = ξ(x + tei ) − ξ(x), vem ξ(x + tei ) = ξ(x) + k, logo f (x + tei , ξ(x) + k) = f (x, ξ(x)) = c. Pelo Teorema do Valor Médio, para todo t existe θ = θ(t) ∈ (0, 1) tal que 0 = f (x + tei , ξ(x) + k) − f (x, ξ(x)) ∂f ∂f = (x + θtei , ξ(x) + θk) · t + (x + θtei , ξ(x) + θk) · k. ∂xi ∂y Logo ∂f k ξ(x + tei ) − ξ(x) ∂x (x + θtei , ξ(x) + θk) = = − ∂fi · t t (x + θtei , ξ(x) + θk) ∂y Neste ponto, admitamos a continuidade de ξ, que será provada abaixo. Então lim k(t) = 0. A continuidade das derivadas parciais de f nos dá t→0 então ∂f ξ(x + tei ) − ξ(x) ∂ξ ∂xi (x, ξ(x)) (x) = lim = − ∂f , (1 ≤ i ≤ n). t→0 ∂xi t (x, ξ(x)) ∂y 86 Funções Implı́citas Cap. 4 A expressão de ∂ξ/∂xi mostra que se f ∈ C k então ∂ξ/∂xi ∈ C k−1 para i = 1, . . . , n, portanto ξ ∈ C k . Demonstração da continuidade de ξ Pelo Teorema 19 do Capı́tulo 1 (v. observação que o segue), basta ¯ a imagem inversa mostrar que, para todo conjunto fechado F ⊂ J, −1 ξ (F ) é fechada em B. Ou seja: se a seqüência de pontos xk ∈ B é tal que ξ(xk ) ∈ F para todo k ∈ N e lim xk = x̄ ∈ B, então ξ(x̄) ∈ F . Ora, F é compacto, logo uma subseqüência de pontos x′k ∈ B é tal que lim ξ(x′k ) = a ∈ F . Logo f (x̄, a) = lim f (x′k , ξ(x′k )) = c. Mas f (x̄, ξ(x̄))=c. Pela unicidade de ξ(x) em J, segue-se que ξ(x̄)=a∈F . Considerando o aberto V = B × J ⊂ Rn+1 , o teorema acima diz que, nas condições das hipóteses, tem-se f −1 (c) ∩ V = {(x, ξ(x)) ∈ Rn+1 ; x ∈ B}. Noutras palavras, f −1 (c) ∩ V é o gráfico da função ξ : B → J. Observação. Evidentemente, não há nada de especial quanto à última coordenada, exceto simplificar a escrita na demonstração. Se, para al∂f gum inteiro i ∈ [1, n + 1], tivermos (z0 ) 6= 0 onde z0 ∈ U e f (z0 ) = c, ∂xi existirá um aberto V ∋ z0 , tal que, para z ∈ V , a equação f (z) = c definirá xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) como função das outras n coordenadas e f −1 (c) ∩ V será o gráfico dessa função ξ, de classe C k . De um modo geral, se grad f (z0 ) 6= 0 e f (z0 ) = c então existe V ∋ z0 aberto tal que f −1 (c) ∩ V é o gráfico de uma função real de n variáveis, de classe C k . Exemplo 1. Seja f : R2 → R definida por f (x, y) = x2 + y 2 . Para ∂f ∂f (x, y) = 2x e (x, y) = 2y. A equação todo (x, y) ∈ R2 , temos ∂x ∂y x2 + y 2 = c define o conjunto vazio quando c < 0. (O Teorema 1 não se aplica, pois não existe o ponto (x0 , y0 ) tal que f (x0 , y0 ) = c.) Quando c = 0, a equação x2 + y 2 = 0 é satisfeita apenas quando x = y = 0. ∂f ∂f (Agora existe (x0 , y0 ) mas (0, 0) = (0, 0) = 0.) Quando c > 0, a ∂x ∂y √ equação x2 +y 2 = c define a circunferência de centro na origem e raio c, a qual não é gráfico de função alguma do tipo y = ξ(x) nem x = ζ(y), pois há retas verticais e horizontais que a cortam em dois pontos. Mas, Seção 2 Hiperfı́cies 87 se considerarmos os abertos V1 = {(x, y) ∈ R2 ; y > 0}, V2 = {(x, y) ∈ R2 ; y < 0}, V3 = {(x, y) ∈ R2 ; x > 0}, V4 = {(x, y) ∈ R2 ; x < 0}, veremos que f −1 (c) ∩ V1 e f −1 (c) ∩ √ V2 são gráficos das √funções ξ1 , ξ2 : (−1, 1) → R, dadas por ξ1 (x) = c − x2 , ξ2 (x) = − c − x2 , −1 (c) ∩ V são os gráficos de ξ , ξ : (−1, 1) → R, enquanto f −1 (c) ∩ Vp 3 ef 4 3 4 p dadas por ξ3 (y) = c − y 2 e ξ4 (y) = − c − y 2 . Assim, em V1 e V2 a equação x2 + y 2 = c (com c > 0) define implicitamente y como função de x enquanto em V3 e V4 define x como função de y. Evidentemente, √ √ salvo na vizinhança dos 4 pontos (± c, 0), (0, ± c), tem-se a opção de tomar y como função de x ou x como função de y. 2 Hiperfı́cies Um conjunto M ⊂ Rn+1 chama-se uma hiperfı́cie de classe C k quando é localmente o gráfico de uma função real de n variáveis de classe C k . Mais precisamente, para cada p ∈ M deve existir um aberto V ⊂ Rn+1 e uma função ξ : U → R, de classe C k num aberto U ⊂ Rn , tais que p ∈ V e V ∩ M = gráfico de ξ. A afirmação “V ∩ M = gráfico de ξ”significa que, para um certo inteiro i ∈ [1, n], tem-se V ∩ M = {(x1 , . . . , xn+1 ) ∈ Rn+1 ; xi = ξ(x1 , . . . , x bi , . . . , xn+1 )}, onde x bi significa “omitir xi ”. Evidentemente, dada qualquer função f : U → R de classe C k no aberto U ⊂ Rn , seu gráfico é uma hiperfı́cie M = {(x, f (x)) ∈ Rn+1 ; x ∈ U } de classe C k . Quando n = 1, uma hiperfı́cie em R2 chama-se uma curva e, quando n = 2, tem-se uma superfı́cie em R3 . Exemplo 2. A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é uma hiperfı́cie C ∞ em Rn+1 . Com efeito, chamando de U a bola aberta de centro 0 e raio 1 em Rn , pondo, para cada i = 1, . . . , n + 1, Vi = {x ∈ Rn+1 ; xi > 0}, Wi = {x ∈ Rn+1 ; xi < 0} e escrevendo x∗ = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ), temos: p x ∈ S n ∩ Vi ⇔ |x∗ | < 1 e xi = 1 − hx∗ , x∗ i; p x ∈ S n ∩ Wi ⇔ |x∗ | < 1 e xi = − 1 − hx∗ , x∗ i. 88 Funções Implı́citas Cap. 4 Logo, considerando a função ξ : U → R, de classe C ∞ , definida por p ξ(u) = 1 − hu, ui, vemos que, para cada i = 1, . . . , n + 1, S n ∩ Vi é o gráfico da função xi = ξ(x∗ ) enquanto que S n ∩ Wi é o gráfico de xi = −ξ(x∗ ). Como todo ponto p ∈ S n pertence a algum Vi ou a algum Wi , concluı́mos que S n é uma hiperfı́cie de classe C ∞ em Rn+1 . ⊳ Seja M ⊂ Rn+1 uma hiperfı́cie de classe C k (k ≥ 1). A cada ponto p ∈ M associaremos o conjunto Tp M , formado por todos os vetoresvelocidade v = λ′ (0) dos caminhos λ : (−δ, δ) → M que são diferenciáveis no ponto 0 e cumprem a condição λ(0) = p. O conjunto Tp M é chamado o espaço vetorial tangente de M no ponto p. Esta denominação se justifica pelo Teorema 2. Tp M é um subespaço vetorial de dimensão n em Rn+1 . Na demonstração abaixo, para simplificar a escrita, escrevemos em último lugar a coordenada do ponto de V ∩ M que é função das outras. Demonstração. Seja ξ : U → R uma função de classe C k no aberto U ⊂ Rn , cujo gráfico, formado pelos pontos (x, ξ(x)) ∈ Rn+1 , x ∈ U , é a interseção M ∩ V , onde V ⊂ Rn+1 é um aberto que contém p = (p0 , ξ(p0 )), p0 ∈ U . Para todo caminho λ : (−δ, δ) → M , com λ(0) = p, tem-se λ(t) = (x1 (t), , . . . , xn (t), ξ(x(t)), onde x(t) = (x1 (t), . . . , xn (t)). Portanto n dx dxn X ∂ξ dxi 1 λ′ (0) = ,..., , · , dt dt ∂xi dt i=1 as derivadas dxi /dt sendo calculadas no ponto t = 0 e ∂ξ/∂xi no ponto p0 . Isto mostra que todo v = λ′ (0) em Tp M é uma combinação linear dos vetores v1 = (1, 0, . . . , 0, ∂ξ/∂x1 ), . . . , vn = (0, . . . , 0, 1, ∂ξ/∂xn ). (Derivadas no ponto p0 .) Reciprocamente, toda combinação linear n P αi vi é o vetor-velocidade λ′ (0) do caminho λ : (−δ, δ) → M v = i=1 assim definido: tomamos v0 = (α1 , . . . , αn ) ∈ Rn e pomos λ(t) = (p0 + tv0 , ξ(p0 + tv0 )), sendo δ > 0 escolhido de modo que o segmento de reta (p0 − δv0 , p0 + δv0 ) esteja contido em U . Observação. Como subespaço vetorial de Rn+1 , o espaço vetorial tangente Tp M contém a origem 0 ∈ Rn+1 e não contém necessariamente o ponto p, embora nas figuras ele apareça passando por p. Nas ilustrações, o que se vê é a variedade afim p + Tp M , paralela a Tp M por p. Seção 2 Hiperfı́cies 89 Exemplo 3. O espaço vetorial tangente Tp S n é, para todo p ∈ S n , o complemento ortogonal de p, isto é, o conjunto [p]⊥ de todos os vetores v ∈ Rn+1 tais que hv, pi = 0. Com efeito, sendo Tp S n e [p]⊥ ambos subespaços vetoriais de dimensão n em Rn+1 , para mostrar que eles coincidem, basta provar que Tp S n ⊂ [p]⊥ . Ora, se v ∈ Tp S n então v = λ′ (0), onde λ : (−δ, δ) → S n é um caminho diferenciável no ponto 0, d com λ(0) = p. Neste caso, 0 = hλ(t), λ(t)i = 2hλ′ (0), λ(0)i = 2hv, pi. dt ⊳ p S n Tp S n Figura 4.2 A seguir, apresentaremos um critério bastante útil para dar exemplos de hiperfı́cies. Um número c ∈ R chama-se um valor regular de uma função f : U → R, de classe C 1 , quando não há pontos crı́ticos de f no nı́vel c, isto é, quando f (x) = c ⇒ grad f (x) 6= 0. Diz-se também que c é um nı́vel regular de f . Quando existe x ∈ U tal que f (x) = c e grad f (x) = 0, diz-se que c é um nı́vel crı́tico de f . Teorema 3. Se c é um valor regular da função f : U → R, de classe C k no aberto U ⊂ Rn+1 , então M = f −1 (c) é uma hiperfı́cie de classe C k , cujo espaço vetorial tangente Tp M é, em cada ponto p ∈ M , o complemento ortogonal de grad f (p). Demonstração. O fato de que f −1 (c) é uma hiperfı́cie é apenas uma reformulação verbal do Teorema da Função Implı́cita. (Ver comentário após a prova do Teorema 1.) Quanto ao espaço vetorial tangente Tp M , como M é uma superfı́cie de nı́vel da função f , vemos que todo vetor v ∈ Tp M é ortogonal a grad f (p), logo Tp M ⊂ [grad f (p)]⊥ . Sendo ambos subespaços de dimensão n em Rn+1 , conclui-se que Tp M = [grad f (p)]⊥ . 90 Funções Implı́citas Cap. 4 Exemplo 4. (Mais uma vez a esfera). À luz do Teorema 3, a esfera unitária S n é a superfı́cie de nı́vel 1 da função f : Rn+1 → R, dada por f (x) = hx, xi. Como grad f (x) = 2x, vemos que zero é o único nı́vel crı́tico de f . Em particular, 1 é valor regular, S n = f −1 (1) é uma hiperfı́cie C ∞ e, para todo p ∈ S n , tem-se Tp S n = [grad f (p)]⊥ = [p]⊥ . ⊳ Exemplo 5. Seja A : Rn → Rn um operador linear auto-adjunto. A função f : Rn → R, definida por f (x) = hA · x, xi é o que se chama uma forma quadrática. Se [aij ] é a matriz (simétrica) de A na base n n P P aij xj e aij xi xj . Logo ∂f /∂xi = 2 canônica de Rn então f (x) = i,j=1 j=1 conseqüentemente grad f (x) = 2A · x. Supondo agora que o operador A seja invertı́vel, o único ponto crı́tico da função f é a origem 0, onde f assume o valor zero. Então, para todo c 6= 0, a equação f (x) = c define uma hiperfı́cie. Costuma-se tomar c = 1 e a hiperfı́cie definida pela n P aij xi xj = 1, chama-se uma quádrica. equação f (x) = 1, ou seja, i,j=1 Em particular, se o operador A é positivo, isto é, se f (x) > 0 para todo x 6= 0, a quádrica f −1 (1) chama-se um elipsóide. ⊳ 2 Exemplo 6. Seja f : Rn → R a função que associa a cada matriz x) = det x . O x = [xij ] de n linhas e n colunas seu determinante f (x desenvolvimento de Laplace relativo à i-ésima linha é x) = f (x n X k=1 (−1)i+k xik · Xik , onde o ik-ésimo menor Xik é o determinante da matriz (n − 1) × (n − 1) que se obtém de x omitindo a i-ésima linha e a k-ésima coluna. Segue∂f x) = (−1)i+j Xij . Em particular, se x = I = matriz se daı́ que (x ∂xij ∂f identidade n × n, temos (II ) = δij (delta de Kronecker , igual a ∂xij 1 quando i = j e 0 quando i 6= j). Portanto grad f (II ) = I . Seja 2 U ⊂ Rn o conjunto aberto formado pelas matrizes (invertı́veis) x tais que det x 6= 0. Para toda x ∈ U , o desenvolvimento de Laplace nos x) 6= 0. Portanto a mostra que algum menor Xij é 6= 0, logo grad f (x função f : U → R não possui pontos crı́ticos: todo número real c é um valor regular de f . Logo M = f −1 (1) = conjunto das matrizes reais n×n Seção 3 Multiplicador de Lagrange 91 com determinante 1 é uma hiperfı́cie C ∞ . M é um grupo em relação à multiplicação de matrizes, conhecido como o grupo unimodular . O espaço vetorial TI (M ), tangente a M na matriz identidade I , é formado pelas matrizes x que são perpendiculares (em termos do produto interno 2 de Rn ) ao gradiente grad f (II ) = I . Ora, x, I i = hx n X xij δij = i,j=1 n X xii = traço de x . i=1 Assim, o espaço vetorial tangente a M no ponto I é o conjunto das matrizes de traço nulo. ⊳ Observação. O Teorema 3 é uma boa fonte de exemplos de hiperfı́cies. Mas nem toda hiperfı́cie M ⊂ Rn+1 pode ser obtida como imagem inversa M = f −1 (c) do valor regular c de uma função f : U → R. Com efeito, as hiperfı́cies desse tipo admitem um campo contı́nuo de vetores não-nulos v = grad f : M → Rn+1 , tais que, para todo x ∈ M , hv(x), wi = 0 qualquer que seja w ∈ Tx M . (Diz-se então que v = grad f é um campo de vetores normais a M .) Tais hiperfı́cies são chamadas de orientáveis. Esta noção será retomada, mais amplamente, no Cap. 7. Um exemplo bem conhecido de superfı́cie não-orientável é a faixa de Moebius. Logo, a faixa de Moebius não é imagem inversa de um valor regular de uma função de classe C 1 definida num aberto de R3 . 3 Multiplicador de Lagrange O método de multiplicador de Lagrange se aplica na seguinte situação: tem-se uma função f : U → R, de classe C 1 no aberto U ⊂ Rn+1 (funçãoobjetivo), uma hiperfı́cie M = ϕ−1 (c), imagem inversa do valor regular c da função ϕ : U → R, de classe C 1 , e procura-se determinar quais são os pontos crı́ticos da restrição f |M , ou seja, os pontos crı́ticos x de f sujeitos à condição ϕ(x) = c. Não se trata de determinar os pontos crı́ticos de f : U → R que estão localizados sobre a hiperfı́cie M mas sim os pontos crı́ticos da função f |M : M → R. É preciso definir o que se entende por isto. Um ponto x ∈ M chama-se um ponto crı́tico da restrição f |M quando, para todo caminho diferenciável λ : (−δ, δ) → M com λ(0) = x tem-se (f ◦ λ)′ (0) = 0. Pondo v = λ′ (0), esta condição significa h grad f (x), vi = 0. Como v é um vetor arbitrário pertencente ao espaço 92 Funções Implı́citas Cap. 4 vetorial tangente Tx M , vemos que x ∈ M é um ponto crı́tico de f |M se, e somente se, grad f (x) é ortogonal ao espaço vetorial tangente Tx M . Ora, grad ϕ(x) é um vetor (não-nulo) ortogonal a Tx M . Como o complemento ortogonal de Tx M em Rn+1 tem dimensão 1, segue-se que grad f (x) ⊥ Tx M se, e somente se, grad f (x) é um múltiplo de grad ϕ(x). Portanto, podemos enunciar: O ponto x ∈ U é um ponto crı́tico da restrição f |M de f à hiperfı́cie M = ϕ−1 (c) se, e somente se: 1) ϕ(x) = c; 2) grad f (x) = λ · grad ϕ(x) para algum λ ∈ R. As condições acima representam um sistema de n+2 equações (pois a igualdade vetorial 2) acima significa n+1 igualdades numéricas) nas n+2 incógnitas x1 , . . . , xn+1 (coordenadas de x) e λ. O fator λ é chamado o multiplicador de Lagrange. Sua presença torna o número de incógnitas igual ao número de equações, o que viabiliza a solução na prática. Deve-se notar que se x ∈ M é um ponto de mı́nimo ou de máximo local de f |M então, para todo caminho diferenciável λ : (−δ, δ) → M com λ(0) = x, a função f ◦ λ : (−δ, δ) → R tem um mı́nimo ou um máximo local no ponto 0, logo (f ◦ λ)′ (0) = 0. Portanto os mı́nimos e máximos locais de f |M estão incluı́dos na definição de ponto crı́tico dada acima. É também evidente que todo ponto crı́tico x ∈ M da função f : U → R é, com maior razão, ponto crı́tico da restrição f |M pois, sendo grad f (x) =0, tem-se h grad f (x), vi = 0 para todo v ∈ Rn+1 . Muitas vezes, a condição adicional ϕ(x) = c é posta sob a forma ϕ(x) = 0. Isto não representa perda de generalidade. Basta usar, em vez de ϕ, a função ψ(x) = ϕ(x) − c. Então ψ(x) = 0 ⇔ ϕ(x) = c e c é valor regular de ϕ se, e somente se, 0 é valor regular de ψ. Exemplo 7. Seja f : R2 → R definida por f (x, y) = ax + by, com a2 + b2 6= 0. O gradiente de f é, em todo ponto (x, y), o vetor constante não-nulo v = (a, b), ortogonal às linhas de nı́vel ax + by = c, que são retas, duas a duas paralelas. A função f não tem pontos crı́ticos. Mas se ϕ : R2 → R for dada por ϕ(x, y) = x2 + y 2 então grad ϕ(x, y) = (2x, 2y), 1 é valor regular de ϕ e M = ϕ−1 (1) é a circunferência unitária x2 +y 2 = 1. Como M é compacta, a restrição f |M possui pelo menos dois pontos crı́ticos, nos quais assume seus valores mı́nimo e máximo. Os pontos Seção 3 Multiplicador de Lagrange 93 crı́ticos de f |M são as soluções (x, y) do sistema grad f (x, y) = λ · grad ϕ(x, y), ϕ(x, y) = 1, ou seja: 2λx = a, 2λy = b, x2 + y 2 = 1. grad f (x, y) grad f (−x, −y) Figura 4.3 Portanto (x, y) é um ponto crı́tico de f |M se, e somente se, o vetor unitário z = (x, y) é um múltiplo do vetor v = (a, b). Isto nos dá a −a b −b √ √ √ √ (x, y) = , , ou (x, y) = . a2 + b2 a2 + b2 a2 + b2 a2 + b2 Estes são os pontos nos quais f (x, y) assume seus valores máximo e mı́nimo em M = S 1 . ⊳ Seja f : Rn → R uma forma quadrática. Para todo n P aij xi xj , onde a = [aij ] é uma max = (x1 , . . . , xn ), tem-se f (x) = Exemplo 8. i,j=1 triz simétrica n × n. Alternativamente, tem-se f (x) = hAx, xi, onde A : Rn → Rn é o operador linear auto-adjunto cuja matriz na base canônica de Rn é a . Quais são os pontos crı́ticos da restrição f |S n−1 , onde S n−1 é a esfera unitária de Rn ? Temos S n−1 = ϕ−1 (1), onde ϕ : Rn → R é definida por ϕ(x) = hx, xi e, como grad ϕ(x) = 2x, 1 n P ∂f é valor regular de ϕ. Por sua vez, aij xj , portanto (x) = 2 · ∂xi j=1 grad f (x) = 2A · x. Portanto os pontos crı́ticos da restrição f |S n−1 são 94 Funções Implı́citas Cap. 4 as soluções do sistema Ax = λx, hx, xi = 1, isto é, são os autovetores do operador A que têm comprimento 1. Como S n−1 é compacta, f admite pelo menos 2 pontos crı́ticos em S n−1 , a saber, os pontos em que assume seus valores mı́nimo e máximo. Isto fornece uma prova de que todo operador auto-adjunto em Rn possui autovetores, o que é o passo fundamental para a demonstração do Teorema Espectral. ⊳ Exemplo 9. Seja U ⊂ Rn o conjunto dos pontos cujas coordenadas são positivas. Consideremos as funções f, ϕ : U → R definidas, para todo x = (x1 , . . . , xn ) ∈ U , como f (x) = x1 · x2 · · · xn e ϕ(x) = x1 + x2 + · · · + xn . Fixando s > 0, procuremos os pontos crı́ticos de f |M onde M = ϕ−1 (s). Observemos que grad ϕ(x) = (1, 1, . . . , 1) para qualquer x ∈ U , de modo que M Q é uma hiperfı́cie. Por sua vez, temos grad f (x) = xj . Assim, x ∈ M é ponto crı́tico de f |M se, (α1 , . . . , αn ) com αi = j6=i Q xj = λ (i = 1, . . . , n). Dividindo e somente se, para algum λ, tem-se j6=i a i-ésima dessas equações pela k-ésima, obtemos xk /xi = 1. Assim, o único ponto crı́tico de f |M é aquele que tem suas coordenadas iguais, ou seja, é p = (s/n, s/n, . . . , s/n). Afirmamos que f (p) = (s/n)n é o maior valor de f |M . Com efeito, a fórmula de f define uma função contı́nua no compacto M̄ , onde possui um ponto de máximo, o qual não pode estar em M̄ − M pois x1 · x2 · · · xn = 0 se x ∈ M̄ − M . Logo esse máximo está em M , portanto é um ponto crı́tico, mas p é o único ponto crı́tico de f |M . Conclusão: quando n números positivos têm soma constante s, seu produto é máximo, igual a (s/n)n , quando eles são iguais. Ou ainda, se x1 , . . . , xn são positivos então x1 · x2 · · · xn ≤ x1 + x2 + · · · + xn n n . A desigualdade acima, posta sob a forma √ n x1 · x2 · · · xn ≤ x1 + x2 + · · · + xn , n diz que a média geométrica de números positivos é menor do que ou igual à média aritmética. Além disso, elas coincidem somente quando os números dados são iguais. ⊳ Seção 3 Multiplicador de Lagrange 95 a M p Figura 4.4 Exemplo 10. Dadas a função f : U → R, de classe C k no aberto U ⊂ Rn+1 , e a hiperfı́cie M ⊂ U , os pontos crı́ticos da restrição f |M são os pontos x ∈ M para os quais grad f (x) é ortogonal ao espaço vetorial tangente Tx M , mesmo quando M não é obtida como imagem inversa ϕ−1 (c) de um valor regular de uma função ϕ : U → R de classe C k . Isto ficou claro na discussão feita no inı́cio desta seção. Como exemplo, consideremos uma hiperfı́cie M ⊂ Rn+1 , um ponto a ∈ Rn+1 não pertencente a M e indaguemos quais são os pontos p ∈ M situados à distância mı́nima de a. Trata-se de obter os pontos que tornam mı́nima a restrição f |M , onde f : U → R, dada por f (x) = |x − a|, tem U p =P Rn+1 − {a} por domı́nio, por isso é de classe C ∞ . Temos (xi − ai )2 , logo ∂f /∂xi = (xi − ai )/|x − a| e daı́ grad f (x) = f (x) = (x − a)/|x − a|. Assim, os pontos crı́ticos de f , entre os quais estão os pontos de M situados à distância mı́nima de a, são os pontos x ∈ M tais que x − a é um vetor normal a M no ponto x, isto é, hx − a, vi = 0 para todo v ∈ Tx M . Em particular, se M = S n , x − a ⊥ Tx S n significa x − a = α · x isto é, x = a/(1 − α). Portanto, neste caso, os únicos pontos crı́ticos de f |S n são os pontos x ∈ S n pertencentes à reta 0a, os quais são ±a/|a|. Um deles minimiza |x − a| e o outro maximiza f . ⊳ Observação. Os pontos crı́ticos da restrição f |M da função f : U → R à hiperfı́cie ϕ−1 (0), onde ϕ : U → R tem 0 como valor regular, são, como vimos, as soluções x do sistema de equações grad f (x) = λ · grad ϕ(x), ϕ(x) = 0. Se considerarmos a função L : U × R → R, definida por L(x, λ) = f (x) − λϕ(x), veremos que grad L(x, λ) = grad f (x) − λ grad ϕ(x) − ϕ(x), portanto os pontos crı́ticos da restrição f |M são simplesmente os pontos crı́ticos (livres) da função L que pertençam a M . A função L é chamada a Lagrangiana do problema. 96 4 Funções Impı́citas Cap. 4 Exercı́cios Seção 1. Uma função implı́cita 1. Seja f : R2 → R de classe C k (k ≥ 1). Suponha que existam um ponto ∂f (x0 , y0 ) ∈ R2 e uma constante M tais que f (x0 , y0 ) = 0, (x, y) 6= 0 e ∂y ∂f ∂f (x, y) (x, y) ≤ M para todo (x, y) ∈ R2 . Prove que, para todo x ∈ R, ∂x ∂y existe um único y = ξ(x) ∈ R tal que f (x, ξ(x)) = 0 e que a função ξ : R → R, assim definida, é de classe C k . 2. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Se f não possui pontos crı́ticos, prove que a imagem f (A) de todo aberto A ⊂ U é um conjunto aberto em R. 3. Seja f : R3 → R dada por f (x, y, z) = x4 + 2x · cos y + sen z. Prove que, numa vizinhança de 0, a equação f (x, y, z) = 0 define z como função de classe C ∞ ∂z ∂z das variáveis x, y. Calcule e · ∂x ∂y 4. Seja f : R × [0, 1) → R a função contı́nua definida por f (x, y) = (x2 + y 2 ) · (ye|x| − 1). Prove que, para cada x ∈ R, existe um único y = ξ(x) ∈ [0, 1) tal que f (x, ξ(x)) = 0 mas a função ξ : R → [0, 1) não é contı́nua. 5. Sejam f, g : Rn → R tais que, para todo x ∈ Rn , vale g(x) = f (x)(1 + f (x)4 ). Se g ∈ C k , k ≥ 1, prove que f também é de classe C k . Seção 2. Hiperfı́cies 2 1. Prove que o conjunto M ⊂ Rn das matrizes n × n de posto n − 1 é uma hiperfı́cie orientável. Determine Tp M , onde p é a matriz n × n cujos elementos são todos nulos exceto os n − 1 primeiros da diagonal, que são iguais a 1. p 2 x2 + y 2 −2 = 1 2. Prove que o conjunto dos pontos (x, y, z) ∈ R3 tais que z 2 + ∞ é uma superfı́cie C . Que forma tem essa superfı́cie? 3. Prove que toda hiperfı́cie M ⊂ Rn+1 é localmente orientável no seguinte sentido: cada ponto p ∈ M possui uma vizinhança V em M na qual está definido um campo contı́nuo v : V → Rn+1 de vetores não-nulos normais a M (ou seja v(x) ⊥ Tx M para todo x ∈ V ). Seção 3. Multiplicadores de Lagrange 1. Seja hAx, xi = 1 a equação de um elipsóide M em Rn+1 . Prove que a maior √ distância de um ponto de M à origem é 1/ µ, onde µ é o menor autovalor do operador positivo A. Ela é atingida num ponto x ∈ M que é autovetor de A, correspondente ao autovalor µ. 2. Seja H o hiperplano de Rn+1 definido pela equação hb, xi = c. Use o método do multiplicador de Lagrange para mostrar que o ponto H mais próximo do c − hb, ai ponto a ∈ Rn+1 é x = a + · b. |b|2 3. Determine os pontos crı́ticos da função f : R2n → R, dada por f (x, y) = hx, yi, restrita à esfera unitária |x|2 + |y|2 = 1, e conclua daı́ a desigualdade de Schwarz. Seção 4 Exercı́cios 2 97 2 n 4. Seja M (n × n) = Rn . Prove que P o2máximo da função f : R → R, dada por x) = det x , restrita à esfera f (x xij = n, é atingido numa matriz ortogonal, i,j logo é igual a 1. Notando que, se as linhas de x são v1 , . . . , vn então x = |v1 | . . . |vn | · w onde todas as linhas de w têm comprimento 1, conclua daı́ a desigualdade de Hadamard: | det x | ≤ |v1 | . . . |vn |. 5. Prove que o menor valor da soma s = x1 + · · · + xn de n números positivos cujo produto p = x1 · x2 · x2 · · · xn é constante é atingido quando esses números √ são iguais, logo valem n p. 5 Aplicações Diferenciáveis 1 A derivada como transformação linear Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se diferenciável no ponto a ∈ U quando cada uma das suas funções-coordenada f1 , . . . , fn : U → R é diferenciável nesse ponto. Se este é o caso então, para todo v = (α1 . . . , αm ) tal que a + v ∈ U e para cada i = 1, . . . , n, tem-se m X ∂fi ri (v) (a) · αj + ri (v) com lim = 0. v→0 |v| ∂xj j=1 ∂fi (a) ∈ M (n × m) chama-se a matriz jacobiA matriz Jf (a) = ∂xj ana de f no ponto a. A transformação linear f ′ (a) : Rm → Rn , cuja matriz em relação às bases canônicas de Rm e Rn é Jf (a), chama-se a derivada da aplicação f no ponto a. De acordo com a definição de matriz de uma transformação linear, para todo v = (α1 , . . . , αm ) ∈ Rm temos fi (a + v) − fi (a) = m X ∂fi ∂fi f (a) · v = (β1 , . . . , βn ) onde βi = (a) · αj = (a). ∂xj ∂v ′ j=1 Assim, se definirmos, como é natural, a derivada direcional da aplicação f , no ponto a, na direção do vetor v, como f (a + tv) − f (a) ∂f (a) = lim , t→0 ∂v t Seção 1 A derivada como transformação linear 99 temos imediatamente ∂f (a) = ∂v ∂f1 ∂fn (a), . . . , (a) = f ′ (a) · v. ∂v ∂v Resulta da Regra da Cadeia para funções (Teorema 2 do Capı́tulo 3), em conformidade com a observação feita logo após sua demonstração, ∂f ∂f (a) tenha sido dada acima como (a) = que embora a definição de ∂v ∂v ∂f (f ◦λ)′ (0), onde λ(t) = a+tv, vale, mais geralmente, a igualdade (a) = ∂v ′ (f ◦ λ) (0) para qualquer caminho diferenciável λ : (−δ, δ) → U , com λ(0) = a e λ′ (0) = v. As n igualdades numéricas que exprimem a diferenciabilidade das funções-coordenada fi se resumem na igualdade abaixo, entre vetores de Rn : f (a + v) − f (a) = f ′ (a) · v + r(v), com lim v→0 r(v) = 0. |v| Algumas vezes, é mais conveniente escrever esta condição sob a forma f (a + v) − f (a) = f ′ (a) · v + ρ(v) · |v| com lim ρ(v) = 0. v→0 Aqui, ρ(v) = r(v)/|v| para todo v 6= 0 tal que a + v ∈ U . A relação acima caracteriza univocamente a derivada da aplicação f no sentido seguinte: se uma transformação linear T : Rm → Rn é tal que, para a, a + v ∈ U tem-se f (a + v) − f (a) = T · v + r(v), com lim v→0 r(v) = 0, |v| então T = f ′ (a). Com efeito, daı́ resulta, tomando tv em vez de v, que: f (a + tv) − f (a) r(tv) =T ·v± · |v|, t |tv| logo ∂f [f (a + tv) − f (a)] = (a) = f ′ (a) · v. t→0 t ∂v Quando f : U → Rn é diferenciável em todos os pontos de U , dizemos que f é diferenciável em U . Neste caso, fica definida uma aplicação f ′ : U → T · v = lim 100 Aplicações Diferenciáveis Cap. 5 L(Rm ; Rn ) que faz corresponder a cada x ∈ U a transformação linear f ′ (x) : Rm → Rn . Quando for conveniente, identificaremos o conjunto L(Rm ; Rn ) das transformações lineares de Rm em Rn com o conjunto M (n × m) das matrizes n × m ou com o espaço Rnm . Dizer que a aplicação derivada f ′ : U → L(Rm ; Rn ) (ou seja f ′ : U → nm R ) é contı́nua equivale a afirmar a continuidade de cada uma de suas nm funções-coordenada ∂fi /∂xj : U → R, isto é, a dizer que f é uma aplicação de classe C 1 conforme a definição dada no Capı́tulo 3. Como foi demonstrado no Teorema 1 daquele capı́tulo, a continuidade das derivadas parciais ∂fi /∂xj : U → R implica a diferenciabilidade de f . Como no caso de funções, aplicações f : U → Rn de classe C k são definidas por indução: diz-se que f ∈ C k quando f é diferenciável e sua derivada f ′ : U → Rnm é de classe C k−1 . Se f ∈ C k para todo k ∈ N diz-se que f é de classe C ∞ : f ∈ C ∞ . Então f ′ ∈ C ∞ também. Observação. Na maioria das vezes, a maneira mais simples de verificar que uma aplicação f é diferenciável consiste em calcular diretamente as ∂fi derivadas parciais (x), mostrar que elas dependem continuamente de ∂xj x e usar o Teorema 1 do Capı́tulo 3, segundo o qual toda função de classe C 1 é diferenciável. Praticamente todas as aplicações diferenciáveis são de classe C 1 . Ocorre, entretanto, que as propriedades mais relevantes das aplicações C 1 resultam da relação que caracteriza sua diferenciabilidade. Daı́ a importância deste conceito. 2 Exemplos de derivadas Exemplo 1. Sejam I ⊂ R um intervalo aberto e f : I → Rn um caminho diferenciável no ponto a ∈ I. Considerando f como uma aplicação, sua derivada no ponto a é a transformação linear f ′ (a) : R → Rn cuja matriz jacobiana tem por única coluna o vetor df1 dfn v= (a), . . . , (a) , dt dt a qual vem a ser o vetor-velocidade do caminho f no ponto a, já indicado com a mesma notação f ′ (a) no Capı́tulo 2. Como transformação linear, f ′ (a) : R → Rn faz corresponder a cada “vetor”t ∈ R o vetor t · v ∈ Rn . Noutros termos: f ′ (a) · t = t · f ′ (a). ⊳ Seção 2 Exemplos de derivadas 101 Exemplo 2. Seja f : U → R uma função definida no aberto U ⊂ Rm , diferenciável no ponto a ∈ U . Sua derivada é uma transformação linear f ′ (a) : Rm → R, portanto um funcional linear, que associa a cada vetor v = (α1 , α2 , . . . , αm ) ∈ Rm o número f ′ (a) · v = ∂f ∂f ∂f (a) · α1 + · · · + (a) · αm = (a) = h grad f (a), vi. ∂x1 ∂xm ∂v Às vezes se escreve df (a) e chama-se diferencial de f à derivada f ′ (a). Em particular, se usarmos a notação tradicional xi : Rm → R para indicar a função que associa a cada ponto x ∈ Rm sua i-ésima coordenada xi , a diferencial dxi desta função é o funcional linear que faz corresponder a cada vetor v = (α1 , . . . , αm ) sua i-ésima coordenada dxi · v = αi . (Mesmo porque, sendo linear, a função xi tem derivada constante, igual a si própria. Vide Exemplo 4, abaixo.) Então df (a) · v = m m X X ∂f ∂f (a) · αi = (a) · dxi · v. ∂xi ∂xi i=1 i=1 Isto atribui um significado à expressão clássica m X ∂f dxi . df = ∂xi ⊳ i=1 Exemplo 3. Se f : U → Rn é constante então f ′ (x) = 0 para todo x ∈ U . Reciprocamente, se o aberto U ⊂ Rm é conexo e f : U → Rn possui derivada 0 em todos os pontos x ∈ U então f é constante. (Conforme o Corolário 5 do Teorema 2, Capı́tulo 3.) Exemplo 4. Se T : Rm → Rn é uma transformação linear então T é diferenciável e T ′ (x) = T para todo x ∈ Rm . Noutras palavras, T ′ (x) · v = T · v quaisquer que sejam x, v ∈ Rm . Isto resulta imediatamente da igualdade T (x + v) − T · x = T · v + r, onde r = 0, ou então do fato óbvio de que a matriz jacobiana de T é a própria matriz de T . Um caso muito particular: a soma S : Rm × Rm → Rm , S(x, y) = x + y é linear, logo S ′ (x, y) · (u, v) = u + v quaisquer que sejam x, y, u, v ∈ Rm . Exemplo 5. Seja B : Rm × Rn → Rp uma aplicação bilinear, isto é, linear em cada uma de suas duas variáveis. Se escrevermos, para cada 102 Aplicações Diferenciáveis Cap. 5 par de vetores (ei , ej ) das bases canônicas de Rm e Rn respectivamente, B(ei , ej ) = vij , então, para x = (x1 , . . . , xm ) e y = (y1 , . . . , yn ) teremos X B(x, y) = xi yj vij . i,j Isto mostra que B é contı́nua, logo assume seu valor máximo |B| no compacto S m−1 × S n−1 . Daı́ resulta que, para quaisquer x ∈ Rm e y ∈ Rn não-nulos, vale |B(x, y)| = |B(x/|x|, y/|y|)| · |x| · |y| ≤ |B| · |x| · |y|. Para x = 0 ou y = 0, a desigualdade |B(x, y)| ≤ |B| · |x| · |y| é imediata pois B(0, y) = B(x, 0) = 0. Mostremos agora que toda aplicação bilinear B é diferenciável, com B ′ (x, y) · (u, v) = B(u, y) + B(x, v). Com efeito, se x, u ∈ Rm e y, v ∈ Rn , temos pela bilinearidade de B: B(x + u, y + v) − B(x, y) = B(u, y) + B(x, v) + B(u, v). p Observando que |(u, v)| = |u|2 + |v|2 ≥ |v|, temos logo lim u,v→0 |B(u, v)| |B| · |u| · |v| ≤ |B| |u|, ≤p |(u, v)| |u|2 + |v|2 B(u, v) = 0, comprovando assim a diferenciabilidade de B. ⊳ |(u, v)| Nos Exemplos 4 e 5 acima (e, obviamente, no Exemplo 3), as aplicações consideradas são de classe C ∞ . De fato, a derivada T ′ = T : Rm → L(Rm ; Rn ) de uma transformação linear T , sendo constante, possui derivada nula e todas as derivadas seguintes também serão nulas. Quanto à aplicação bilinear B, sua derivada B ′ : Rm × Rn → L(Rm × Rn ; Rp ) é a transformação linear (x, y) 7→ B(•, y) + B(x, •), recaindo assim no Exemplo 4. Exemplo 6 (Derivada complexa). Uma função de variável complexa f : U → C, definida no aberto U ⊂ C, pode ser vista como uma aplicação f : U → R2 , definida no aberto U ⊂ R2 . A derivada da função complexa f no ponto z ∈ U é o número complexo f ′ (z), definido como o limite f (z + H) − f (z) , H→0 H f ′ (z) = lim quando tal limite existe. Isto equivale a dizer que f (z + H) − f (z) = f ′ (z) · H + r(H), onde r(H) = 0. H→0 |H| lim Seção 3 Cálculo diferencial de aplicações 103 Acima, f ′ (z) · H é uma multiplicação de números complexos. Portanto, a função complexa f : U → C é derivável no ponto z ∈ U se, e somente se, a aplicação f : U → R2 é diferenciável nesse ponto e, além disso, sua derivada f ′ (z) : R2 → R2 é uma transformação linear do plano que consiste em multiplicar por um número complexo fixo. Ora, se T : R2 → R2 é uma tal transformação, da forma T · z = (a + bi) · z, sua matriz na base canônica tem T · 1 = a + bi e T · i = −b + ai, ou seja, sua as colunas a −b matriz é do tipo . Se, para z = x+yi, f (z) = u(x, y)+i·v(x, y), b a a matriz jacobiana de f é ∂u ∂u ∂x ∂v ∂x ∂y . ∂v ∂y Segue-se então que a função complexa f é derivável em U se, e somente se, valem as relações ∂u/∂x = ∂v/∂y e ∂u/∂y = −∂v/∂x em todo ponto z = x + yi ∈ U . Estas igualdades são conhecidas como as equações de Cauchy-Riemann. A derivada de f , considerada como função de uma variável complexa é f ′ (z) = ∂v ∂v ∂u ∂u +i = −i · ∂x ∂x ∂y ∂y Exemplo 7. Se f, g : U → Rn são diferenciáveis no ponto a ∈ U Rm então a aplicação (f, g) : U → Rn × Rn , definida por (f, g)(x) (f (x), g(x)), é diferenciável no ponto a e sua derivada é (f, g)′ (a) · v (f ′ (a) · v, g ′ (a) · v). Se f, g ∈ C k então (f, g) também é de classe C k . 3 ⊳ ⊂ = = ⊳ Cálculo diferencial de aplicações Teorema 1 (Regra da Cadeia). Sejam U ⊂ Rm , V ⊂ Rn abertos e f : U → Rn , g : V → Rp diferenciáveis nos pontos a ∈ U , b = f (a) ∈ V , com f (U ) ⊂ V . Então g ◦ f : U → Rp é diferenciável no ponto a e (g ◦ f )′ (a) = g ′ (b) · f ′ (a) : Rm → Rp . Resumidamente: a derivada da aplicação composta é a composta das derivadas. 104 Aplicações Diferenciáveis Cap. 5 Demonstração. Podemos escrever f (a + v) = f (a) + f ′ (a) · v + ρ(v) · |v|, com lim ρ(v) = 0 e v→0 g(b + w) = g(b) + g ′ (b) · w + σ(w) · |w|, com lim σ(w) = 0. w→0 Então (g ◦ f )(a + v) = g(f (a) + f ′ (a) · v + ρ(v) · |v|). Pondo w = f ′ (a) · v + ρ(v) · |v|, obtemos: (g ◦ f )(a + v) = g(b + w) = g(b) + g ′ (b) · (f ′ (a) · v) + g ′ (b) · ρ(v)|v| + σ(w) · |w| = (g ◦ f )(a) + [g ′ (b) · f ′ (a)] · v + C(v) · |v|, onde C(v) = g ′ (b) · ρ(v) + σ(w) · f ′ (a) · Se v → 0 então w → 0 e f ′ (a) · provando o teorema. v + ρ(v) . |v| v é limitada. Portanto lim C(v) = 0, v→0 |v| Corolário 1. Se f : U → Rn e g : V → Rp (com U ⊂ Rm e f (U ) ⊂ V ⊂ Rn ) são de classe C k então g ◦ f : U → Rp é de classe C k . Com efeito, a Regra da Cadeia aplicada num ponto genérico x ∈ U , fornece (g ◦ f )′ (x) = g ′ (f (x)) · f ′ (x). Em termos funcionais, temos (g ◦ f )′ = (g ′ ◦ f ) · f ′ : U → L(Rm ; Rp ), onde ◦ é a composição de aplicações e · é a multiplicação de transformações lineares, a qual é bilinear, logo C ∞ . Se f e g são de classe C 1 , esta última igualdade mostra que (g ◦ f )′ é contı́nua, logo g ◦ f ∈ C 1 . Por indução, supondo f e g de classe C k , a mesma igualdade mostra que (g ◦ f )′ ∈ C k−1 , logo g ◦ f ∈ C k . Corolário 2. Nas condições do Teorema 1, a matriz jacobiana de g ◦ f no ponto a é o produto da matriz jacobiana de g no ponto f (a) pela matriz jacobiana de f no ponto a : J(g ◦ f )(a) = Jg(f (a)) · Jf (a). Em termos de derivadas parciais, a igualdade acima lê-se n X ∂gi ∂yk ∂gi = · · ∂xj ∂yk ∂xj k=1 Seção 3 Cálculo diferencial de aplicações 105 Nesta fórmula, escrita da maneira tradicional, os xj são coordenadas de um ponto em U , os yk em V , ∂gi /∂xj é derivada parcial de gi ◦ f enquanto ∂gi /∂yk é derivada parcial de gi e, finalmente, ∂yk /∂xj significa, em nossa notação costumeira, ∂fk /∂xj . Com tais entendimentos tácitos, essa fórmula tem sobrevivido e sido útil através dos anos. Corolário 3 (As regras de derivação). Sejam f, g : U → Rn diferenciáveis no ponto a ∈ U ⊂ Rm , α um número real e B : Rn ×Rn → Rp bilinear. Então: 1) f + g : U → Rn é diferenciável no ponto a, com (f + g)′ (a) = f ′ (a) + g ′ (a). 2) α · f : U → Rn é diferenciável no ponto a, com (αf )′ (a) = α · f ′ (a). 3) B(f, g) : U → Rp , definida por B(f, g)(x) = B(f (x), g(x)), é diferenciável no ponto a, com [B(f, g)]′ (a) · v = B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v). Os itens 1) e 2) podem ser provados diretamente a partir da definição de aplicação diferenciável ou então considerando as transformações lineares S : Rn × Rn → Rn , α∗ : Rn → Rn , definidas por S(x, y) = x + y e α∗ (x) = α · x. Então é só observar que f + g = S ◦ (f, g) e α · f = α∗ ◦ f e usar a Regra da Cadeia, lembrando que S ′ = S e (α∗ )′ = α∗ , logo (f + g)′ = S ◦ (f ′ , g ′ ) = f ′ + g ′ e (α · f )′ = (α∗ ◦ f )′ = α∗ ◦ f ′ = α · f ′ . Quanto ao item 3), basta usar a Regra da Cadeia e os Exemplos 5, 7. Então, como B(f, g) = B ◦ (f, g), temos, para cada v ∈ Rm : [B(f, g)]′ (a) · v = [B ◦ (f, g)]′ (a) · v = B ′ (f (a), g(a)) · (f ′ (a) · v, g ′ (a) · v) = B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v). Observação. Uma aplicação bilinear B : Rn × Rn → Rp pode (e deve) ser considerada como uma forma de multiplicar um elemento de Rn por outro obtendo um produto em Rp . Usando a notação multiplicativa x • y em vez de B(x, y), a regra de derivação do item 3) do Corolário 3 lê-se (f • g)′ = f ′ • g + f • g ′ , isto é, para todo x ∈ U e todo v ∈ Rn , (f • g)′ (x) · v = (f ′ (x) · v) • g(x) + f (x) • (g ′ (x) · v). (O ponto maior • 106 Aplicações Diferenciáveis Cap. 5 é o produto que substitui B e o ponto menor · é a aplicação de uma transformação linear sobre um vetor.) Exemplo 8. Um exemplo freqüente de aplicação bilinear é o produto interno de vetores. Se tivermos ϕ(x) = hf (x), g(x)i, com f, g : U → Rn diferenciáveis em U ⊂ Rm então, para todo v ∈ Rm , vale ϕ′ (x) · v = hf ′ (x)·v, g(x)i+hf (x), g ′ (x)·vi. Em particular, se ϕ(x) = hf (x), f (x)i = |f (x)|2 então ϕ′ (x) · v = 2hf (x), f ′ (x) · vi. Levando em conta a fórmula √ √ ( u)′ = u′ /2 u para a derivada da raiz quadrada de uma função real positiva u, daı́ resulta que, pondo p ξ(x) = hf (x), f (x)i = |f (x)|, tem-se ξ ′ (x) · v = hf ′ (x) · v, f (x)i/|f (x)| sempre que f (x) 6= 0. ⊳ Exemplo 9. Outro exemplo comum de aplicação bilinear é a multiplicação de matrizes (ou de transformações lineares). Vejamos um caso particular desta situação. Se A : Rm → Rm é um operador auto-adjunto então resulta do exemplo anterior que a derivada da forma quadrática ϕ(x) = hAx, xi atua assim: ϕ′ (x) · v = hAv, xi + hAx, vi = 2hAx, vi, levando em conta que hAv, xi = hv, Axi, pela definição de operador auto-adjunto. Algumas pessoas preferem considerar A como uma matriz simétrica a do tipo m×m e x ∈ Rm como uma matriz x do tipo m×1 (matriz-coluna) cuja transposta xT é uma matriz-linha 1 × m. Então a x) = xT ax forma quadrática ϕ se escreve como ϕ(x ax. Desta maneira, para m cada vetor v ∈ R (ou seja, para cada matriz v do tipo m × 1) tem-se x) · v = v T ax + xT av = xT av + xT av = 2xT av ϕ′ (x av, que corresponde a 2hAx, vi na notação de operadores. ⊳ Exemplo 10. Seja U ⊂ M (n × n) o conjunto das matrizes invertı́veis n × n, isto é, das matrizes que têm determinante 6= 0. Como o determinante é uma função contı́nua, U é aberto. Seja f : U → M (n × n) x) = x −1 . Afirmaa aplicação que associa a cada x ∈ U sua inversa f (x mos que f é diferenciável e que, em cada ponto x ∈ U , sua derivada x) : M (n × n) → M (n × n) é a transformação linear definida por f ′ (x x) · v = −x x−1 · v · x −1 , v ∈ M (n × n). Para provar isto, atribuiremos f ′ (x x|, igual à norma da transa cada matriz x ∈ M (n × n) a norma |x formação linear X : Rn → Rn que tem x como matriz na base canônica. x| = sup{|X · u|; (Veja Exemplo 12, Capı́tulo 1.) Mais explicitamente: |x n−1 x · y| ≤ u∈S }. Como se vê facilmente, se x , y ∈ M (n × n) então |x x| · |yy |. Provemos agora a diferenciabilidade de f . Escrevemos |x x + v )−1 − x −1 = −x x−1vx −1 + r(vv ) (x Seção 3 Cálculo diferencial de aplicações 107 e mostramos que lim r(vv )/|vv | = 0. Com este objetivo, multiplicamos v→0 ambos os membros da igualdade acima, à direita, por x + v . Após uma simplificação óbvia, obtemos x−1 · v )2 (x x + v )−1 , r(vv ) = (x donde x−1 |2 |vv |2 |(x x + v )−1 |, |r(vv )| ≤ |x |r(vv )| x−1 |2 |(x x + v )−1 | |vv | ≤ |x |vv | x + v )−1 se justifica pelo fato de e daı́ lim r(vv )/|vv | = 0. (O uso de (x v→0 que, sendo U aberto, x ∈ U ⇒ x + v ∈ U para toda v suficientemente pequena.) ⊳ Observação. Na verdade a inversão de matrizes f : U → U , considerada no Exemplo 10, é uma aplicação C ∞ . Isto pode ser verificado diretamente, a partir da fórmula que exprime x −1 em função de x , utilizando a chamada “adjunta clássica”de uma matriz. (Ver também “Análise no Espaço Rn ”, página 26.) Lembremos que a norma de uma transformação linear T : Rm → Rn é o número |T | = sup{|T · u|; u ∈ S n−1 }. Desta definição resulta que, para todo v ∈ Rm , tem-se |T · v| ≤ |T | · |v| e que, se S : Rn → Rp é outra transformação linear então |S · T | ≤ |S| · |T |. Teorema 2 (Desigualdade do Valor Médio). Seja f : U → Rn diferenciável em todos os pontos do segmento de reta [a, a + v] ⊂ U . Se, para todo t ∈ [0, 1], tem-se |f ′ (a + tv)| ≤ M então |f (a + v) − f (a)| ≤ M · |v|. Demonstração. O caminho λ : [0, 1] → Rn , definido por λ(t) = f (a + tv), é diferenciável, com λ′ (t) = f ′ (a + tv) · v, portanto |λ′ (t)| ≤ |f ′ (a + tv)| · |v| ≤ M · |v| para todo t ∈ [0, 1]. Segue-se então da Desigualdade do Valor Médio para caminhos (Teorema 1 do Capı́tulo 2) que |λ(1) − λ(0)| ≤ M · |v| · (1 − 0), isto é, |f (a + v) − f (a)| ≤ M · |v|. Corolário 4. Se o aberto U ⊂ Rm é convexo e M > 0 é tal que a aplicação diferenciável f : U → Rn cumpre |f ′ (x)| ≤ M para todo x ∈ U então f satisfaz a condição de Lipschitz |f (x) − f (y)| ≤ M |x − y| para quaisquer x, y ∈ U . Teorema 3 (Diferenciabilidade Uniforme). Seja f : U → Rn de classe C 1 no aberto U ⊂ Rm . Se K ⊂ U é compacto então f é uniformemente diferenciável em K. 108 Aplicações Diferenciáveis Cap. 5 Demonstração. Isto significa que, para todo ε > 0 dado, pode-se obter δ > 0 tal que |v| < δ implica |f (x + v) − f (x) − f ′ (x) · v| < ε · |v| qualquer que seja x ∈ K. Para estabelecer este resultado, uma vez dado ε > 0, devemos inicialmente encontrar δ > 0 com a seguinte propriedade: para todo x ∈ K e todo v ∈ Rm com |v| ≤ δ tem-se x + v ∈ U e |f ′ (x + v) − f ′ (x)| < ε. Ora, pelo Corolário 2 do Teorema 11, Capı́tulo 1, existe δ > 0 tal que toda bola de centro num ponto x ∈ K e raio 2δ está contida em U . Seja [ L= B[x; δ] = {y ∈ Rm ; d(y, K) ≤ δ}. x∈K Então L é um compacto, com K ⊂ L ⊂ U . Se x ∈ K e |v| ≤ δ então x + v ∈ L. A aplicação f ′ : L → L(Rm , Rn ) é uniformemente contı́nua. Logo, diminuindo δ se necessário, podemos admitir que |f ′ (x + v) − f ′ (x)| < ε para todo x ∈ K e todo v ∈ Rn com |v| < δ. Evidentemente, isto acarreta que |f ′ (x + tv) − f ′ (x)| < ε para todo t ∈ [0, 1], pois |tv| ≤ |v| quando 0 ≤ t ≤ 1. Cumprida esta etapa, consideremos o caminho λ : [0, 1] → Rn , definido por λ(t) = f (x + tv), com x ∈ K e |v| < δ. Então λ′ (t) = f ′ (x + tv) · v. Pelo Teorema Fundamental do Cálculo para caminhos, Z 1 Z 1 ′ f ′ (x + tv) · v · dt. λ (t)dt = f (x + v) − f (x) = λ(1) − λ(0) = 0 0 Logo ′ |f (x + v) − f (x) − f (x) · v| = Z 0 ′ 1 [f ′ (x + tv) − f ′ (x)] · v · dt ≤ sup |f ′ (x + tv) − f (x)| |v| ≤ ε · |v|. 0≤t≤1 provando assim que f é uniformemente diferenciável em K. Seção 4 4 Exercı́cios 109 Exercı́cios Seção 1. A derivada como transformação linear 1. Seja f : Rm → Rm diferenciável, com f (0) = 0. Se a transformação linear f ′ (0) não admite o autovalor 1, prove que existe uma vizinhança V de 0 em Rm tal que f (x) 6= x para todo x ∈ V − {0}. 2. Dada a aplicação f : S m→ Rn , defina sua extensão radial F : Rm+1 → Rn x pondo F (x) = |x|·f se x 6= 0 e F (0) = 0. Prove que F é diferenciável no |x| ponto 0 ∈ Rm+1 se, e somente se, f é (a restrição a S m de) uma transformação linear. 3. Sejam U ⊂ Rm aberto, a ∈ U e f : U → Rn uma aplicação de classe C 2 . A ′′ m m derivada segunda de f é, por definição, a aplicação bilinear f (x) : R ×R → ∂f ∂ Rn , dada por f ′′ (a) · u · v = (a). Prove que f ′′ (a) · u · v = f ′′ (a) · v · u. ∂v ∂u 4. Dado U ⊂ Rm aberto e conexo, seja f : U → Rn − {0} diferenciável. A fim de que |f (x)| seja constante, prove que é necessário e suficiente que, para todo x ∈ U e todo v ∈ Rm , o vetor f ′ (x) · v seja ortogonal a f (x). Seção 2. Exemplos de derivadas 1. Seja A : U → L(Rm ; Rn ) diferenciável no aberto U ⊂ Rp . Defina f : U × Rm → Rn pondo f (x, v) = A(x) · v. Prove que f é diferenciável, com f ′ (x, v) · (h, k) = (A′ (x) · h) · v + A(x) · k. 2. Seja f : U → R2 definida no aberto U ⊂ R2 . Suponha que, considerada como função complexa, f seja derivável, com f ′ (z0 ) 6= 0 para um certo z0 ∈ U . Considere caminhos α, β : (−ε, ε) → U tais que α(0) = β(0) = z0 e α′ (0) 6= 0, β ′ (0) 6= 0. Prove que o ângulo entre α′ (0) e β ′ (0) é igual ao ângulo entre f ′ (z0 ) · α′ (0) e f ′ (z0 ) · β ′ (0). Noutras palavras: f preserva os ângulos entre curvas. 3. Seja f : R2 → R3 definida por f (x, y) = (x2 , y 2 , (x + y)2 ). Mostre que f ′ (x, y) : R2 → R3 tem posto 2 ⇔ (x, y) 6= (0, 0). 4. Seja f : R3 → R4 , f (x, y, z) = (x2 − y 2 , xy, xz, zy). Mostre que f ′ (x, y, z) é uma transformação linear injetiva, salvo quando x = y = 0. Determine a imagem de f ′ (0, 0, z) : R3 → R4 . 5. Mostre que o posto da derivada da aplicação f : R3 → R3 , dada por f (x, y, z) = (x + y + z, x2 + y 2 + z 2 , x3 + y 3 + z 3 ), tem posto p nos pontos de R3 que têm p coordenadas diferentes. 110 Aplicações Diferenciáveis Cap. 5 Seção 3. Cálculo diferencial de aplicações 1. Seja f : U → Rn diferenciável no aberto U ⊂ Rm . Se |f (x) − f (y)| ≤ M · |x − y| para quaisquer x, y ∈ U (onde M > 0 é uma constante) então |f ′ (x)| ≤ M para todo x ∈ U . 2. Seja U ⊂ Rm aberto. Dadas f : U → Rn g : U → Rp e T : U → L(Rn ; Rp ), defina ϕ : U → R pondo ϕ(x) = hT (x) · f (x), g(x)i. Para x ∈ U e h ∈ Rm quaisquer, determine ϕ′ (x) · h. 3. Sejam U ⊂ Rm , V ⊂ Rn abertos e f : U → V , g : V → Rp aplicações duas vezes diferenciáveis. Para x ∈ U e y = f (x) ∈ V , interprete e prove a igualdade (g ◦ f )′′ (x) = g ′′ (y) · f ′ (x) · f ′ (x) + g ′ (y) · f ′′ (x). 4. Seja U uma bola aberta de centro 0 em Rm . Dada A : U → L(Rm ; Rn ) diferenciável, tome x ∈ U e defina o caminho ϕ : (0, 1) → L(Rm ; Rn ) pondo ϕ(t) = A(tx). Uma das interpretações seguintes para a fórmula ϕ′ (t) = A′ (tx) · x é verdadeira: ϕ′ (t) · v = (A′ (tx) · x) · v ou ϕ′ (t) · v = (A′ (tx) · v) · x. Decida e prove. 5. Seja f : U → Rn contı́nua no aberto U ⊂ Rm com [a, a + v] ⊂ U . Se f é diferenciável em todos os pontos de (a, a + v) então, para toda T ∈ L(Rm ; Rn ), prove que |f (a + v) − f (a) − T · v| ≤ sup |f ′ (a + tv) − T | · |v|. 0<t<1 6. Dada f : U → R, diferenciável no aberto U ⊂ Rn , fixe a ∈ Rm e defina ϕ : U → Rm pondo ϕ(x) = f (x) · a. Para cada x ∈ U , determine ϕ′ (x) : Rn → Rm . 6 Aplicações Inversas e Implı́citas 1 O Teorema da Aplicação Inversa Na página 97 do Volume 1 foi estabelecido que se f : I → R é derivável no intervalo I ⊂ R, com f ′ (x) > 0 para todo x ∈ I, então f é uma bijeção crescente sobre o intervalo J = f (I) e a função inversa g = f −1 : J → I também é derivável, com g ′ (f (x)) = 1/f ′ (x). Evidentemente, resultado análogo vale com f ′ (x) < 0, só que agora f é decrescente. Na verdade, pelo Teorema de Darboux (pág. 95 do Volume 1), bastaria supor f ′ (x) 6= 0 para todo x ∈ I para garantir que f é uma bijeção monótona (crescente ou decrescente) de I sobre J = f (I), com f −1 : J → I derivável. Nos termos da definição que será dada a seguir, isto significa que a função diferenciável sobrejetiva f : I → J, entre intervalos I, J ⊂ R, é um difeomorfismo se, e somente se, f ′ (x) 6= 0 para todo x ∈ I. Em dimensões superiores esta condição significaria que f ′ (x) é um isomorfismo, mas seria apenas necessária para que f possuı́sse uma inversa diferenciável. Sejam U ⊂ Rm , V ⊂ Rn abertos. Uma aplicação f : U → V chamase um difeomorfismo entre U e V quando é uma bijeção diferenciável, cuja inversa g = f −1 : V → U também é diferenciável. Se f : U → V é um difeomorfismo, com g = f −1 : V → U , então de g ◦ f = idU e f ◦ g = idV resulta, pela Regra da Cadeia, que g ′ (f (x)) · f ′ (x) = idRm e f ′ (x) · g ′ (f (x)) = idRn para todo x ∈ U , portanto f ′ (x) : Rm → Rn é um isomorfismo cujo inverso é g ′ (f (x)) : Rn → Rm . 112 Aplicações Inversas e Implı́citas Cap. 6 Em particular, m = n, ou seja, dois abertos em espaços euclidianos de dimensões diferentes não podem ser difeomorfos. Exemplo 1. Resulta do Exemplop15, Capı́tulo 1, que a aplicação f : Rm → B, definida por f (x) = x/ 1 + |x|2 , é um homeomorfismo de Rm sobre apbola aberta B ⊂ Rm , de centro 0 e raio 1, sendo g : B → Rm , g(y) = y/ 1 − |y|2 o homeomorfismo inverso de f . Na verdade, como f e g são ambas aplicações diferenciáveis, as duas são difeomorfismos, um inverso do outro. Deve-se observar, entretanto, que nem todo homeomorfismo diferenciável é um difeomorfismo, isto é, tem inverso diferenciável. O exemplo mais simples disto é f : R → R, com f (x) = x3 . √ Como f ′ (0) = 0, a função inversa de f (que é g(x) = 3 x) não é diferenciável no ponto 0 = f (0). Uma aplicação diferenciável f : U → Rm , definida no aberto U ⊂ m R , chama-se um difeomorfismo local quando, para cada x ∈ U existe uma bola aberta B = B(x; δ) ⊂ U tal que f aplica B difeomorficamente sobre um aberto V contendo f (x). Segue-se daı́ que se f : U → Rm é um difeomorfismo local então f ′ (x) : Rm → Rm é um isomorfismo, para todo x ∈ U . O Teorema da Aplicação Inversa, que provaremos a seguir, diz que quando f ∈ C 1 vale a recı́proca: se f ′ (x) é um isomorfismo para todo x ∈ U então f é um difeomorfismo local. Decorre da definição acima que um difeomorfismo local f : U → Rm é uma aplicação aberta, isto é, a imagem f (A) de qualquer aberto A ⊂ U é um subconjunto aberto de Rm . Com efeito, se tomarmos para cada x ∈ A uma bola aberta Bx ⊂ A, com centro x, tal que f seja S um m difeomorfismo de Bx sobre um aberto Vx ⊂ R , então A = Bx e x∈A f (A) = f (∪Bx ) = ∪f (Bx ) = ∪Vx é uma reunião de abertos, logo é um aberto. Observemos ainda que o difeomorfismo local f : U → Rm é um difeomorfismo (global) de U sobre o aberto V = f (U ) ⊂ Rm se, e somente se, é uma aplicação injetiva. ⊳ Exemplo 2. Seja f : R2 → R2 definida por f (x, y) = (ex cos y, ex sen y). Evidentemente, f ∈ C ∞ . Cada reta vertical x = a é transformada por f , com perı́odo 2π (isto é, f (a, y) = f (a, y ′ ) ⇔ y ′ − y = 2kπ, k ∈ Z), sobre a circunferência de centro 0 e raio ea . Cada reta horizontal y = b é levada por f , bijetivamente, sobre a semi-reta aberta que parte da origem e passa pelo ponto (cos b, sen b) ∈ S 1 . A imagem de f é R2 − {0}. Em termos da variável complexa z = x + iy, tem-se f (z) = ez . A aplicação Seção 1 O Teorema da Aplicação Inversa 113 f é um difeomorfismo local (mas não global pois f (x, y + 2π) = f (x, y)). Isto decorre do Teorema da Aplicação Inversa (Teorema 4, a seguir), pois a matriz jacobiana x e cos y −ex sen y Jf (x, y) = x e sen y ex cos y tem determinante ex , portanto 6= 0, logo f ′ (x, y) : R2 → R2 é um isomorfismo, para todo (x, y) ∈ R2 . Podemos também chegar à mesma conclusão observando que se w0 = f (z0 ) então o ramo da função complexa log w tal que log w0 = z0 é uma aplicação inversa local de f no ponto w0 = f (z0 ). Se I ⊂ R é um intervalo aberto então todo difeomorfismo local f : I → R é um difeomorfismo (global) de I sobre J = f (I). ⊳ Teorema 1. Se o difeomorfismo f : U → V é de classe C k (k ≥ 1) então seu inverso g = f −1 : V → U também é de classe C k . Demonstração. (Indução em k.) Para todo y = f (x) ∈ V , temos g ′ (y)=[f ′ (x)]−1 = [f ′ (f −1 (y))]−1 , portanto a aplicação g ′ : V →L(Rm ) = 2 Rm se exprime como a composta g ′ = (Inv) ◦ f ′ ◦ f −1 onde Inv leva todo operador invertı́vel X : Rm → Rm no seu inverso X −1 , f ′ : U → L(Rm ), leva todo ponto x ∈ U na derivada (invertı́vel) f ′ (x) : Rm → Rm e f −1 : V → U é a aplicação inversa de f . Sabemos que Inv ∈ C ∞ . Portanto, se f ∈ C k então f ′ ∈ C k−1 e, pela hipótese de indução, f −1 ∈ C k−1 , logo g ′ ∈ C k−1 , como composta de três aplicações de classe C k−1 . Por definição, isto significa que g ∈ C k . Teorema 2. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rm . Se, para algum a ∈ U , a derivada f ′ (a) : Rm → Rn é injetiva então existem δ > 0 e c > 0 tais que B = B(a; δ) ⊂ U e, para quaisquer x, y ∈ B tem-se |f (x) − f (y)| ≥ c|x − y|. Em particular, a restrição f |B é injetiva. Demonstração. A função u 7→ |f ′ (a) · u| é positiva em todos os pontos u da esfera unitária S m−1 , a qual é compacta. Pelo Teorema de Weierstrass, existe c > 0 tal que |f ′ (a) · u| ≥ 2c para todo u ∈ S m−1 . Por linearidade, segue-se que |f ′ (a) · v| ≥ 2c · |v| para todo v ∈ Rm . Para todo x ∈ U , escrevamos r(x) = f (x) − f (a) − f ′ (a)(x − a). 114 Aplicações Inversas e Implı́citas Cap. 6 Então, para x, y ∈ U quaisquer, temos f (x) − f (y) = f ′ (a) · (x − y) + r(x) − r(y). Levando em conta que |u + v| ≥ |u| − |v|, segue-se que |f (x) − f (y)| ≥ |f ′ (a) · (x − y)| − |r(x) − r(y)| ≥ 2c · |x − y| − |r(x) − r(y)|. Observemos que a aplicação r, acima definida, é de classe C 1 , com r(a) = 0 e r′ (a) = 0. Pela continuidade de r′ , existe δ > 0 tal que |x − a| < δ ⇒ x ∈ U e |r′ (x)| < c. A Desigualdade do Valor Médio, aplicada a r no conjunto convexo B = B(a; δ) nos assegura que se x, y ∈ B então |r(x) − r(y)| ≤ c|x − y|. Conseqüentemente, x, y ∈ B ⇒ |f (x) − f (y)| ≥ 2c|x − y| − c|x − y|, ou seja, |f (x) − f (y)| ≥ c|x − y|, como querı́amos demonstrar. Teorema 3 (Diferenciabilidade do Homeomorfismo Inverso). Seja f : U → V um homeomorfismo de classe C 1 entre os abertos U, V ⊂ Rm . Se, para algum x ∈ U , a derivada f ′ (x) : Rm → Rm é um operador invertı́vel então o homeomorfismo inverso g = f −1 : V → U é diferenciável no ponto f (x), com g ′ (f (x)) = [f ′ (x)]−1 . Demonstração. Se x, x+v ∈ U , escrevamos f (x) = y e f (x+v) = y+w. Então r(v) =0 v→0 |v| v = g(f (x + v)) − g(f (x)) = g(y + w) − g(y). w = f (x + v) − f (x) = f ′ (x) · v + r(v) onde lim e Para provar que f ′ (x)−1 é a derivada de g no ponto y, escrevamos g(y + w) − g(y) = f ′ (x)−1 · w + s(w) (*) s(w) = 0. Entrando na igualdade (*) com as |w| expressões de v e w acima obtidas, vem: e mostremos que lim w→0 v = f ′ (x)−1 [f ′ (x) · v + r(v)] + s(w), ou seja: v = v + f ′ (x)−1 · r(v) + s(w), Seção 1 O Teorema da Aplicação Inversa 115 donde s(w) = −f (x)−1 · r(v), logo isto é: r(v) |v| s(w) = −f ′ (x)−1 · · , |w| |v| |w| s(w) r(v) |v| = −f ′ (x)−1 · · · |w| |v| |f (x + v) − f (x)| r(v) → 0. |v| Além disso, pelo Teorema 2, existem δ > 0 e c > 0 tais que |v| < δ implica Quando w → 0, tem-se v → 0 pela continuidade de g, logo |f (x + v) − f (x)| ≥ c|v|, portanto s(w) w→0 |w| Assim, lim |v| 1 ≤ · |f (x + v) − f (x)| c = 0. Corolário 1. Se f : U → V é um homeomorfismo de classe C k cuja derivada f ′ (x) : Rm → Rm é invertı́vel para todo x ∈ U então seu inverso g = f −1 : V → U é de classe C k . Com efeito, a derivada g ′ : V → L(Rm ), dada por g ′ (y) = f ′ (g(y))−1 para cada y ∈ V , pode ser escrita como g ′ = Inv ◦ f ′ ◦ g, onde a aplicação Inv, de classe C ∞ , é a inversão de transformações lineares bijetivas e f ′ ∈ C k−1 . Admitindo, por indução, que g ∈ C k−1 , resulta que g ′ ∈ C k−1 , logo g ∈ C k . Teorema 4 (Teorema da Aplicação Inversa). Seja f : U → Rm de classe C k (k ≥ 1) no aberto U ⊂ Rm . Se a ∈ U é tal que f ′ (a) : Rm → Rm é invertı́vel então existe uma bola aberta B = B(a; δ) ⊂ U tal que a restrição f |B é um difeomorfismo sobre um aberto V ∋ f (a). Demonstração. Diminuindo δ, se necessário, no Teorema 2 podemos admitir que B̄ = B[a; δ] ⊂ U e que f é injetiva no conjunto compacto B̄, logo é um homeomorfismo de B sobre f (B). Além disso, como f ′ (x) depende continuamente de x e todo operador linear suficientemente próximo de um invertı́vel é também invertı́vel, podemos supor que, para todo x ∈ B, a derivada f ′ (x) : Rm → Rm é um isomorfismo. Pelo Teorema 3, basta então mostrar que f (B) ⊂ Rm é aberto. Seja então q = f (p), p ∈ B. Chamando de S = S[a, δ] a esfera que é a fronteira de B̄, a injetividade de f |B̄ assegura que q ∈ / f (S), logo existe 116 Aplicações Inversas e Implı́citas Cap. 6 ε > 0 tal que |f (x) − q| ≥ 2ε para todo x ∈ S, pois f (S) é compacto. Afirmamos que B(q; ε) ⊂ f (B). Com efeito, se y ∈ B(q; ε), então, pondo g(x) = f (x) − y, o mı́nimo de |g(x)|, quando x varia no compacto B̄, não é atingido num ponto x ∈ S pois x ∈ S ⇒ |f (x) − y| ≥ ε enquanto |f (p) − y| = |q − y| < ε, com p ∈ B. Assim, o mı́nimo de |f (x) − y|, x ∈ B̄ é atingido num ponto x0 ∈ B. Pelo lema a seguir, isto implica que esse mı́nimo é zero, portanto y = f (x0 ), donde y ∈ f (B), ou seja, B(q; ε) ⊂ f (B). Lema 1. Sejam U ⊂ Rm aberto e g : U → Rn diferenciável no ponto a ∈ U , com g ′ (a) : Rm → Rn sobrejetiva. Se a é um ponto de mı́nimo local de |g(x)|, x ∈ U , então g(a) = 0. Demonstração. Se a é um ponto de mı́nimo local para |g(x)|, será também um ponto de mı́nimo local para a função ϕ : U → R, definida por ϕ(x) = |g(x)|2 = hg(x), g(x)i, logo ϕ′ (a) = 0. Mas, como ϕ′ (a) · v = 2hg ′ (a) · v, g(a)i, isto significa que g(a) é ortogonal à imagem de g ′ (a), a qual é Rn . Logo g(a) = 0. Exemplo 3. Dadas as matrizes x , m ∈ M (n × n), diz-se que x é uma raiz quadrada de m quando x 2 = m . Nem toda matriz m posx2 ) = (det x )2 , uma condição necessária é sui raiz quadrada: como det(x que det m ≥ 0 . Mas esta condição não é suficiente pois é fácil ver que, −1 0 embora a matriz m = tenha determinante positivo, não existe 1 −1 x ∈ M (2 × 2) tal que x 2 = m . O Teorema 4 pode ser usado para mostrar que toda matriz próxima da identidade I n tem raiz quadrada. Com x) = x 2 , efeito, consideremos a aplicação f : M (n × n) → M (n × n), f (x ∞ de classe C . Sua derivada num ponto x ∈ M (n × n) é a transformação 2 2 x) : Rn → Rn , dada por f ′ (x x) · m = m · x + x · m . Em parlinear f ′ (x 2 2 ′ ticular, para x = I n , tem-se f (II n ) · m = 2m 2m, logo f ′ (II n ) : Rn → Rn é um isomorfismo. Segue-se do Teorema 4 que existe um aberto U em M (n × n), contendo a matriz identidade, restrita ao qual f é um difeomorfismo sobre o aberto V = f (U ). Assim, para toda matriz y ∈ V , √ existe uma única matriz x = y ∈ U tal que x 2 = y . Além disso, a √ aplicação f −1 : V → U , y 7→ y , é de classe C ∞ . ⊳ Corolário 2 (do Teorema 4). Seja a ∈ U um ponto crı́tico da função f : U → R, de classe C 2 no aberto U ⊂ Rn . Se a matriz hessiana 2 ∂ f (a) Hf (a) = ∂xi ∂xj Seção 2 Várias Funções Implı́citas 117 é invertı́vel então existe um aberto V , com a ∈ V ⊂ U , no qual não há outros pontos crı́ticos de f . Com efeito, a matriz hessiana Hf (x) é, para todo x ∈ U , a matriz jacobiana da aplicação ∂f ∂f (x), . . . , (x) . F : U → Rn , F (x) = grad f (x) = ∂x1 ∂xn Como Hf (a) é invertı́vel, F é injetiva numa vizinhança V ∋ a, logo F (x) 6= F (a), isto é, grad f (x) 6= 0 para todo x ∈ V − {a}. Quando grad f (a) = 0 e Hf (a) é invertı́vel, a chama-se um ponto crı́tico não-degenerado da função f . O corolário acima diz que os pontos crı́ticos não-degenerados são pontos crı́ticos isolados. 2 Várias Funções Implı́citas Os pontos do espaço Rm+n serão representados sob a forma z = (x, y), onde x = (x1 , . . . , xm ) ∈ Rm e y = (y1 , . . . , yn ) ∈ Rn . Um difeomorfismo h : U → V , entre abertos U, V ⊂ Rm+n , será chamado de vertical quando for do tipo h(x, y) = (x, h2 (x, y)), ou seja, quando deixar invariante a coordenada x. O inverso de um difeomorfismo vertical é ainda vertical. Um difeomorfismo ϕ : U → V é usualmente interpretado como uma transformação geométrica que aplica diferenciavelmente o conjunto U sobre o conjunto V , de forma invertı́vel. Às vezes, porém, é conveniente olhar para ϕ como uma mudança de coordenadas, em que as coordenadas do ponto x ∈ U passam a ser aquelas da sua imagem y = ϕ(x) ∈ V . Sob este ponto de vista, o teorema a seguir diz que se a derivada de uma aplicação f , de classe C k , é sobrejetiva num ponto p então é possı́vel obter (de modo bastante simples) um sistema de coordenadas, válido numa vizinhança aberta Z de p, tal que, em termos dessas novas coordenadas, a aplicação f assume a expressão (x1 , . . . , xm , w1 , . . . , wn ) 7→ (w1 , . . . , wn ). Teorema 5 (Forma Local das Submersões). Seja f = (f1 , . . . , fn ) uma aplicação de classe C k (k ≥ 1) de um aberto U ⊂ Rm+n em Rn . Se, num ponto p = (a, b) ∈ U , a matriz ∂fi (p) (i, j = 1, . . . , n) ∂yj 118 Aplicações Inversas e Implı́citas Cap. 6 é invertı́vel então existem abertos Z ∋ p em Rm+n , V ∋ a em Rm , W ∋ c = f (p) em Rn e um difeomorfismo vertical h : V × W → Z, de classe C k , tal que f (h(x, w)) = w para todo x ∈ V e todo w ∈ W . U Rn Z p f ϕ h V ×W W f ◦ h : (x, w) 7→ w (a, c) c = f (p) Rm V a Figura 6.1 Demonstração. Seja ϕ : U → Rm ×Rn a aplicação de classe C k definida por ϕ(x, y) = (x, f (x, y)). A matriz jacobiana de ϕ tem a forma I 0 , Jϕ = a b onde I é a matriz identidade m × m e a matriz n × n ∂fi (z) b = b (z) = ∂yj é, no ponto p = (a, b), invertı́vel. Pelo Teorema da Aplicação Inversa, ϕ é um difeomorfismo de um aberto Z ∋ p sobre um aberto de Rm × Rn , o qual podemos supor da forma V ×W , onde V ⊂ Rm e W ⊂ Rn , com a ∈ V e c = f (a, b) ∈ W . O difeomorfismo inverso h : V ×W → Z é da forma h(x, w) = (x, h2 (x, w)). Então, para qualquer (x, w) ∈ V × W , tem-se (x, w)=ϕ(h(x, w))=ϕ(x, h2 (x, w))=(x, f (x, h2 (x, w)))=(x, f (h(x, w))), logo f (h(x, w)) = w para qualquer (x, w) ∈ V × W . Seção 2 Várias Funções Implı́citas 119 Dada f : U → Rn , de classe C k no aberto U ⊂ Rm+n , a matriz de sua derivada f ′ (p) : Rm+n → Rn tem n linhas e m + n colunas. Ela é a matriz jacobiana Jf (p). Dizer que a transformação linear f ′ (p) é sobrejetiva significa afirmar que é possı́vel escolher n dessas colunas de modo que a matriz n × n resultante seja invertı́vel. No enunciado do teorema acima, as colunas escolhidas são as n últimas porém isto nada tem de essencial; trata-se apenas de simplificar a notação. Quando a aplicação f : U → Rn , com U ⊂ Rm+n , possui derivada sobrejetiva f ′ (z) : Rm+n → Rn em todo ponto z ∈ U , diz-se que f é uma submersão. No Teorema 5, a restrição de f ao aberto Z é uma submersão. Com esta terminologia, podemos enunciar o Corolário 3. Seja f : U → Rn uma submersão de classe C k , definida no aberto U ⊂ Rm+n . Para cada ponto z ∈ U existem abertos Z ⊂ U , contendo z, W ⊂ Rn contendo c = f (z), V ⊂ Rm e um difeomorfismo h : V × W → Z de classe C k , tais que f (h(x, w)) = w para todo x ∈ V e todo w ∈ W . Como f ′ (z) : Rm+n → Rn é sobrejetiva, n das m + n colunas da matriz jacobiana Jf (z) são linearmente independentes, logo formam uma matriz invertı́vel n × n. Se essas forem as últimas colunas, o corolário é meramente o Teorema 5. Se não forem, modificamos ligeiramente a demonstração daquele teorema, permutando inicialmente as coordenadas em Rm+n de modo que as n colunas linearmente independentes de Jf (z) sejam agora as últimas. Teorema 6 (Teorema das Funções Implı́citas). Seja f = (f1 , . . . , fn ) : U → Rn de classe C k (k ≥ 1) no aberto U ⊂ Rm+n . Suponhamos que, no ponto p = (a, b) ∈ U , com f (p) = c, a matriz n×n ∂fi (p) (i, j = 1, . . . , n) ∂yj seja invertı́vel. Então existem Z ⊂ U , aberto contendo p, V ⊂ Rm , aberto contendo a, e ξ : V → Rn de classe C k , com ξ(a) = b, com a seguinte propriedade: [(x, y) ∈ Z e f (x, y) = c] ⇔ [x ∈ V e y = ξ(x)]. A equivalência acima significa que f −1 (c)∩Z é o gráfico de ξ, isto é, f −1 (c) ∩ Z = {(x, ξ(x)); x ∈ V }. 120 Aplicações Inversas e Implı́citas Cap. 6 Demonstração. Sejam Z, V , W e h como no Teorema 5. Definamos ξ : V → Rn pondo ξ(x) = h2 (x, c), onde h2 : V × W → Rn é a segunda coordenada de h, ou seja, h(x, w) = (x, h2 (x, w)). Assim, (x, y) ∈ Z ⇒ x ∈ V e (x, y) = h(x, w), w ∈ W . Se, além disso, tem-se f (x, y) = c então c = f (x, y) = f (x, ξ(x)) e y = ξ(x). Resumindo: (x, y) ∈ Z e f (x, y) = c implicam x ∈ V e y = ξ(x). Reciprocamente, se x ∈ V e y = ξ(x) então y = h2 (x, c) e f (x, y) = f (x, h2 (x, c)) = f (h(x, c)) = c. O corolário abaixo é uma reformulação mais intrı́nseca do Teorema 6. Corolário 4. Seja f : U → Rn de classe C k no aberto U ⊂ Rm+n . Se, no ponto p ∈ U , com f (p) = c, a derivada f ′ (p) : Rm+n → Rn é sobrejetiva então existe um aberto Z ⊂ U , com p ∈ Z, tal que f −1 (c) ∩ Z é o gráfico de uma aplicação ξ : V → Rn , de classe C k num aberto V ⊂ Rm . A abordagem clássica do Teorema das Funções Implı́citas era a seguinte: “Se f1 , . . . , fn são funções reais de m + n variáveis, k vezes continuamente diferenciáveis, e p = (a1 , . . . , am , b1 , . . . , bn ) é uma solução particular do sistema de equações f1 (x1 , . . . , xm , y1 , . . . , yn ) = c1 f2 (x1 , . . . , xm , y1 , . . . , yn ) = c2 .. . fn (x1 , . . . , xm , y1 , . . . , yn ) = cn , sendo a matriz n × n ∂fi (p) ∂yj invertı́vel, então as equações acima definem, de modo único, na vizinhança do ponto p em Rm+n , as variáveis y1 , . . . , yn como funções de classe C k das variáveis x1 , . . . , xm : y1 = ξ1 (x1 , . . . , xm ), . . . , yn = ξn (x1 , . . . , xm )”. Escrevendo x = (x1 , . . . , xm ) e ξ(x) = (ξ1 (x), . . . , ξn (x)) tem-se, para cada i = 1, . . . , n, com x numa vizinhança de a = (a1 , . . . , am ): fi (x, ξ1 (x), . . . , ξn (x)) = ci , ou fi (x, ξ(x)) = ci . Derivando cada uma dessas n identidades em relação a xj , vem: n ∂fi X ∂fi ∂ξk + · = 0, ∂xj ∂yk ∂xj k=1 j = 1, . . . , m. Seção 2 Várias Funções Implı́citas 121 Em termos matriciais, isto significa que ∂ξ ∂f ∂f1 ∂f1 1 1 ... ∂y1 ∂xj ∂xj ∂yn . . .. .. . = − .. . . . . .. ∂fn ∂fn ∂ξn ∂fn ... ∂xj ∂y1 ∂yn ∂xj ou seja: ∂ξ ∂f1 ∂xj ∂y1 . . = − .. . . ∂ξn ∂fn ∂xj ∂y1 1 ... .. . ... ∂f1 −1 ∂f1 ∂xj ∂yn .. .. . . ∂fn ∂fn ∂yn ∂xj ∂ξi a partir de f1 , . . . , fn , sem ser ∂xj necessário conhecer explicitamente as funções ξ1 , . . . , ξn . Sob o ponto de vista da Álgebra Linear intrı́nseca, a fim de mostrar como a derivada ξ ′ (x) : Rm → Rn pode ser calculada quando se conhece f mas não ξ explicitamente, é preciso estender o conceito de derivada parcial. As transformações lineares Isto exibe as derivadas parciais ∂f (z) : Rm → Rn ∂x e ∂f (z) : Rn → Rn , ∂y cujas matrizes nas bases canônicas dos espaços euclidianos em questão são ∂fi ∂fi (z) ∈ M (n × m) e (z) ∈ M (n × n), ∂xj ∂yj são chamadas as derivadas parciais de f no ponto z, relativamente à decomposição Rm+n = Rm ⊕ Rn , obtida ao se escrever cada z ∈ Rm+n ∂f sob a forma z = (x1 , . . . , xm , y1 , . . . , yn ). Assim, (z) é a restrição ∂x da transformação linear f ′ (z) : Rm+n → Rn ao subespaço Rm ⊂ Rm+n ∂f (z) é a restrição de f ′ (z) ao subespaço formado pelos vetores (x, 0) e ∂y Rn que consiste nos vetores da forma (0, y). Para todo vetor w = (u, v) ∈ Rm+n , tem-se ∂f ∂f (z) · u + (z) · v. f ′ (z) · w = ∂x ∂y 122 Aplicações Inversas e Implı́citas Cap. 6 Usando estas derivadas parciais, a Regra da Cadeia nos permite concluir, a partir da identidade f (x, ξ(x)) = c para todo x ∈ V , que ∂f ∂f (z) + (z) · ξ ′ (x) = 0, com z = (x, ξ(x)). ∂x ∂y Logo −1 ∂f ∂f ξ (x) = − (z) · (z), ∂y ∂x ′ ainda com z = (x, ξ(x)). Note que a hipótese do Teorema das Funções ∂f (z) : Rn → Rn é inImplı́citas assegura que a transformação linear ∂y vertı́vel para todo z na vizinhança de p. Exemplo 4. Diz-se que o número complexo c é uma raiz simples do polinômio p quando se tem p(z) = (z − c)q(z) com q(c) 6= 0. O Teorema 6 pode ser usado para mostrar que as raı́zes simples de um polinômio dependem diferenciavelmente dos coeficientes desse polinômio. A fim de provar isto escrevemos, para cada a = (a0 , . . . , an ) ∈ Cn+1 = R2n+2 e cada z ∈ C = R2 , pa (z) = p(a0 , . . . , an , z) = a0 + a1 z + · · · + an z n . ∂p (c) = p′a (c) = q(c), logo a Então, de pa (z) = (z − c)q(z) resulta ∂z ∂p matriz jacobiana (real) 2 × 2, (c), é invertı́vel, por ser a matriz da ∂z 2 transformação linear de R que consiste na multiplicação pelo número complexo não-nulo q(c). Portanto, em virtude do Teorema 6, existem bolas abertas B = B(a; ε) em Cn+1 e B ′ = B(c; δ) em C tais que, para todo b ∈ B, o polinômio pb possui uma única raiz ξ(b) ∈ B ′ , a qual é simples, e a aplicação ξ : B → R2 , assim definida, é de classe C ∞ . ⊳ 3 Exercı́cios Seção 1. O Teorema da Aplicação Inversa 1. Sejam ϕ : U → Rm de classe C 1 no aberto U ⊂ Rm e c ∈ [0, 1) tais que |ϕ(x) − ϕ(y)| ≤ c|x − y| para quaisquer x, y ∈ U . Prove que f : U → Rm , dada por f (x) = x+ϕ(x), é um difeomorfismo de U sobre o aberto V = f (U ) ⊂ Rm . Se U = Rm , prove que f (U ) = Rm . 2 2. Para todo k ∈ N, prove que existem abertos U, V ⊂ M (n × n) = Rn tais que toda matriz y ∈ V possui uma única raiz k-ésima x ∈ U , isto é, tal que x k = y . Seção 3 Exercı́cios 123 n(n+1) 3. Seja U ⊂ R 2 o conjunto dos operadores positivos A : Rn → Rn (representados por suas matrizes). Use o Teorema Espectral e prove que a aplicação x) = x 2 , é um difeomorfismo C ∞ . f : U → U , dada por f (x 4. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rn , com n > 1. Se o determinante jacobiano de f se anula apenas num conjunto de pontos isolados, prove que f transforma todo aberto A ⊂ U num aberto f (A). Use este fato para demonstrar que todo polinômio complexo não-constante p : R2 → R2 é uma aplicação sobrejetiva, provando assim o Teorema Fundamental da Álgebra. 5. A seqüência de passos deste exercı́cio leva à conclusão de que, dados quaisquer dois pontos a, b no aberto conexo U ⊂ Rn , existe um difeomorfismo h : U → U , de classe C ∞ , tal que h(a) = b. Os passos são: 1 5a. A função α : Rn → R, dada por α(x) = exp − se |x| < 1 e α(x) = 0 1 − |x|2 ∞ se |x| ≥ 1, é de classe C e, pondo ϕ(x) = e · α(x), tem-se ϕ : Rn → R de classe C ∞ , com 0 < ϕ(x) ≤ 1 se |x| < 1, ϕ(0) = 1 e ϕ(x) = 0 se |x| ≥ 1. 5b. Seja c > 0 tal que c · sup · |ϕ′ (y)| · |b − a| < 1. A aplicação g : Rn → Rn , y∈Rn definida por g(x) = x + ϕ(c(x − a)) · (b − a) é um difeomorfismo C ∞ tal que g(a) = b e g(x) = x se |x − a| ≥ 1/c. 5c. Usando o Exemplo 1, vê-se que, para quaisquer pontos a, b numa bola aberta B ⊂ Rn , existe um difeomorfismo k : B → B, de classe C ∞ tal que k(a) = b e k(x) = x fora de um compacto K ⊂ B. 5d. Dados U ⊂ Rn aberto, conexo, e a, b ∈ U , o conjunto A dos pontos x ∈ U tais que existe um difeomorfismo h : U → U , de classe C ∞ , com h(a) = x, é aberto e seu complementar U − A também. Logo A = U e portanto b ∈ A. 5e. O difeomorfismo h : U → U , acima obtido, é tal que existe K ⊂ U compacto, com h(x) = x se x ∈ U − K. Seção 2. Várias funções implı́citas 1. Prove que toda submersão f : U → Rn de classe C 1 é uma aplicação aberta, isto é, A ⊂ U aberto ⇒ f (A) ⊂ Rn aberto. 2. Seja f = (f1 , . . . , fn ) : U → Rn diferenciável. Prove que f é uma submersão se, e somente se, em cada ponto x ∈ U os vetores grad f1 (x), . . . , grad fn (x) são linearmente independentes. 2 3. Seja U ⊂ Rn um conjunto aberto de matrizes n × n. Prove que a função det : U → R é uma submersão se, e somente se, nenhuma matriz em U tem posto ≤ n − 2. 4. Sejam U ⊂ Rm × Rn , V ⊂ Rm abertos, f : U → Rn de classe C k (k ≥ 1), cumprindo as condições do Teorema 6, ξ : V → Rn contı́nua e c ∈ Rn tais que, para todo x ∈ V , tem-se (x, ξ(x)) ∈ U e f (x, ξ(x)) = c. Prove que ξ é de classe C k . Use este resultado para provar que se ξ : V → R é contı́nua no aberto V ⊂ R2 e, para todo (x, y) ∈ V vale (x2 + y 4 ) · ξ(x, y) + ξ(x, y)3 = 1 então ξ ∈ C∞. 7 Superfı́cies Diferenciáveis 1 Parametrizações Uma imersão do aberto U ⊂ Rm no espaço Rn é uma aplicação diferenciável f : U → Rn tal que, para todo x ∈ U , a derivada f ′ (x) : Rm → Rn é uma transformação linear injetiva. Isto, naturalmente, só pode ocorrer quando m ≤ n. Quando m = n, toda imersão de classe C 1 de U ⊂ Rm em Rn é um difeomorfismo local. Em geral, para m ≤ n quaisquer, o Teorema 2 do Capı́tulo 6 assegura que toda imersão de classe C 1 é uma aplicação localmente injetiva. Exemplo 1. Se I ⊂ R é um intervalo aberto, as imersões f : I → Rn são o que chamamos no Capı́tulo 2 de caminhos regulares. Assim, por exemplo, f : R → R2 , definida por f (t) = (t3 − t, t2 ) é uma imersão de R no plano, a qual não é injetiva, pois f (−1) = f (1) = (0, 1). ⊳ (t3 − t, t2 ) t∈R Figura 7.1 Seção 1 Parametrizações 125 Uma parametrização de classe C k e dimensão m de um conjunto V ⊂ Rn é uma imersão ϕ : V0 → V de classe C k que é, ao mesmo tempo, um homeomorfismo do aberto V0 ⊂ Rm sobre V . Exemplo 2. Dada uma aplicação f : V0 → Rn , de classe C k no aberto V0 ⊂ Rm , seja V = {(x, f (x)); x ∈ V0 } ⊂ Rm+n o gráfico de f . A aplicação ϕ : V0 → V , dada por ϕ(x) = (x, f (x)), é uma parametrização de dimensão m e classe C k do conjunto V ⊂ Rm+n . Com efeito, se chamarmos de π : Rm+n → Rm a projeção sobre as m primeiras coordenadas, a igualdade π ◦ ϕ = idV0 mostra que ϕ é um homeomorfismo, cujo inverso é a restrição π|V e, em virtude da Regra da Cadeia, que π · ϕ′ (x) = idRm , logo ϕ′ (x) : Rm → Rm+n é injetiva, para todo x ∈ V0 , portanto ϕ é uma imersão. ⊳ Exemplo 3. Uma imersão ϕ : V0 → V pode muito bem ser bijetiva sem ser um homeomorfismo, logo não é uma parametrização de V . Um exemplo disso pode ser obtido tomando a restrição do caminho f , visto no Exemplo 1 acima, ao intervalo (−1, +∞) ⊂ R. O caminho ϕ : (−1, +∞) → R2 , dado por ϕ(t) = (t3 − t, t2 ), é uma imersão C ∞ bijetiva do intervalo (−1, +∞) em R2 mas não é uma parametrização da sua imagem V pois a função inversa ϕ−1 : V → (−1, +∞) é descontı́nua no ponto (0, 1) ∈ V . Com efeito, se (tn ) é uma seqüência decrescente de números reais com lim tn = −1, vemos que lim ϕ(tn ) = (0, 1) = ϕ(1) sem que se tenha lim tn = 1. (t3 − t, t2 ) t > −1 Figura 7.2 Exemplo 4. Seja N = (0, . . . , 0, 1) o pólo norte da esfera unitária S n = {x ∈ Rn+1 ; hx, xi = 1}. Pondo V = S n − {N } e V0 = Rn , o homeomorfismo ϕ : V0 → V , inverso da projeção estereográfica ξ, (vide Exemplo 16, Capı́tulo 1), é uma parametrização. Evidentemente, ϕ é 126 Superfı́cies Diferenciáveis Cap. 7 de classe C ∞ e sua inversa ξ : S n − {N } → Rn é a restrição de uma aplicação C ∞ (cujo domı́nio é o aberto U = {x ∈ Rn+1 ; xn+1 6= 1}). A igualdade ξ ◦ ϕ = idRn mostra, via Regra da Cadeia, que ϕ é uma imersão, o que completa a verificação. ⊳ 2 Superfı́cies diferenciáveis Um conjunto M ⊂ Rn chama-se uma superfı́cie de dimensão m e classe C k quando todo ponto p ∈ M está contido em algum aberto U ⊂ Rn tal que V = U ∩ M é a imagem de uma parametrização ϕ : V0 → V , de dimensão m e classe C k . O conjunto V é um aberto em M , chamado uma vizinhança parametrizada do ponto p. Escreve-se m = dim ·M . Observação. Na definição acima, supõe-se tacitamente k ≥ 1. Mas teria sentido considerar superfı́cies de classe C 0 . Bastaria admitir “parametrizações de classe C 0 ”, que são meramente homeomorfismos ϕ : V0 → V de abertos V0 ⊂ Rm sobre abertos V ⊂ M . As superfı́cies de classe C 0 são estudadas na Topologia. Seu interesse em Análise é reduzido, principalmente porque não possuem espaços tangentes. Quando dim ·M = 1, a superfı́cie M chama-se uma curva. Exemplo 5. Como R0 = {0} reduz-se a um ponto, uma superfı́cie de dimensão 0 em Rn é simplesmente um conjunto discreto. No extremo oposto, as superfı́cies de dimensão n em Rn são os subconjuntos abertos, pois a imagem de uma parametrização de dimensão n em Rn é aberta, em virtude do Teorema da Aplicação Inversa. ⊳ Exemplo 6. A esfera S n é uma superfı́cie de dimensão n e classe C ∞ em Rn+1 . Com efeito, a inversa da projeção estereográfica é uma parametrização ϕ : Rn → S n −{N }. Para obter uma vizinhança parametrizada do pólo norte N , basta considerar −ϕ : Rn → S n − {N ∗ }, onde N ∗ = −N é o pólo sul. ⊳ Exemplo 7. O produto cartesiano M × N de duas superfı́cies M ⊂ Rn e N ⊂ Rk é uma superfı́cie em Rn+k pois se ϕ : V0 → V ⊂ M e ψ : W0 → W ⊂ N são parametrizações então ξ : V0 × W0 → V × W ⊂ M × N , dada por ξ(x, y) = (ϕ(x), ψ(y)), é uma parametrização. Evidentemente, dim(M × N ) = dim M + dim N . Em particular, o toro m-dimensional T m = S 1 × · · · × S 1 , produto cartesiano de m cı́rculos, é uma superfı́cie de dimensão m e classe C ∞ em R2m . ⊳ Seção 2 Superfı́cies diferenciáveis 127 Exemplo 8. O gráfico de uma aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm , é uma superfı́cie M = {(x, f (x)) ∈ Rm+n ; x ∈ U }, de dimensão m e classe C k em Rm+n . Com efeito, M é a imagem da única parametrização ϕ : U → M , ϕ(x) = (x, f (x)). ⊳ Ser uma superfı́cie é uma propriedade local: se todo ponto p ∈ M está contido num conjunto V ⊂ M , aberto em M , o qual é uma superfı́cie de classe C k e dimensão m, então o conjunto M ⊂ Rn é uma superfı́cie de dimensão m e classe C k . Em particular, se M é localmente o gráfico de uma aplicação f : V0 → Rn , de classe C k num aberto V0 ⊂Rm , então M ⊂Rm+n é uma superfı́cie de classe C k e dimensão m. Assim, por exemplo, as hiperfı́cies, conforme definidas no Capı́tulo 4, são superfı́cies de dimensão n − 1 em Rn . Quando M ⊂ Rn é uma superfı́cie de dimensão m, costuma-se dizer que M tem co-dimensão n − m. Portanto, hiperfı́cies são superfı́cies de co-dimensão 1. No teorema abaixo, M é uma superfı́cie de dimensão m e classe C k em Rn . Por “uma projeção π : Rn → Rm ”entendemos uma aplicação dada por π(x1 , . . . , xn ) = (xi1 , . . . , xim ), definida a partir da escolha de m ı́ndices i1 < · · · < im , compreendidos entre 1 e n. Teorema 1. Seja ϕ : V0 → V uma parametrização em M . Para cada p = ϕ(x0 ) ∈ V existe uma projeção π : Rn → Rm tal que π ◦ ϕ aplica um aberto Z0 , com x0 ∈ Z0 ⊂ V0 , difeomorficamente sobre um aberto W0 ⊂ Rm . V M W ϕ π Rm x0 V0 Z0 π ◦ϕ W0 Figura 7.3 128 Superfı́cies Diferenciáveis Cap. 7 ∂ϕi (x0 ) ∈ M (n × m) tem m Demonstração. A matriz jacobiana ∂xj linhas linearmente independentes, de ı́ndices i1 < i2 < ·· · < im . Essas ∂ϕik linhas formam a matriz m × m invertı́vel J = (x0 ) e os ı́ndices ik ∂xj definem uma projeção π : Rn → Rm . Observando que J é a matriz jacobiana da aplicação π ◦ ϕ : V0 → Rm , o Teorema 1 resulta imediatamente do Teorema da Aplicação Inversa. Corolário 1. Toda superfı́cie de classe C k é localmente o gráfico de uma aplicação de classe C k . Com efeito, usando a notação do Teorema 1, escrevamos os elementos de Rn sob a forma z = (y, y ′ ), onde y = π(z). Ponhamos também W = ϕ(Z0 ). Então a aplicação ψ = ϕ ◦ (π ◦ ϕ)−1 : W0 → W é uma parametrização. Além disso, para todo y ∈ W0 , tem-se π(ψ(y)) = (π ◦ ϕ) ◦ (π ◦ ϕ)−1 (y) = y, logo ψ(y) = (y, y ′ ). Assim, W é o gráfico da aplicação de classe C k , f : W0 → Rn−m , dada por f (y) = y ′ . Corolário 2. Seja M ⊂ Rn uma superfı́cie de classe C k e dimensão m. Se uma aplicação f : V0 → Rn , de classe C k no aberto V0 ⊂ Rp , tiver sua imagem f (V0 ) contida na vizinhança W ⊂ M , parametrizada por ψ : W0 → W , então ψ −1 ◦ f : V0 → Rm é uma aplicação de classe C k . Com efeito, para cada ponto x0 ∈ V0 , com f (x0 ) = ψ(y0 ), existe, pelo Teorema 1, uma projeção π : Rn → Rm tal que π ◦ ψ é um difeomorfismo de uma vizinhança de y0 sobre um aberto de Rm . Então, numa vizinhança de x0 , podemos escrever ψ −1 ◦ f = (π ◦ ψ)−1 ◦ π ◦ f, logo ψ −1 ◦ f é de classe C k . Sejam ϕ : V0 → V e ψ : W0 → W parametrizações numa superfı́cie M , de classe C k e dimensão m. Suponhamos que V ∩ W 6= ∅. Então todo ponto p ∈ V ∩ W pode escrever-se como p = ϕ(x), x ∈ V0 e, como p = ψ(y), y ∈ W0 , pode ser representado pelos m parâmetros que são as coordenadas de x e pelas m coordenadas de y. A correspondência x 7→ y, definida pela relação ϕ(x) = ψ(y), é a aplicação ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ), chamada mudança de parametrização. Seção 3 O espaço vetorial tangente W V M V0 129 ψ ϕ W0 ψ −1 ◦ϕ Rm Figura 7.4 Corolário 3. Numa superfı́cie de classe C k , toda mudança de parametrização ψ −1 ◦ ϕ é um difeomorfismo de classe C k . Com efeito, pelo Corolário 2, ψ −1 ◦ ϕ é uma aplicação de classe C k . Pelo mesmo motivo, sua inversa ϕ−1 ◦ ψ também é de classe C k . Logo ψ −1 ◦ ϕ é um difeomorfismo. Exemplo 9. O conjunto M = {(x, x4/3 ); x ∈ R}, gráfico da função f : R → R, f (x) = x4/3 , é uma curva de classe C 1 em R2 : a aplicação ϕ : R → R2 , dada por ϕ(x) = (x, x4/3 ), é uma parametrização (global) de M . Cabe observar, porém, que se V ⊂ M contém o ponto (0, 0), não pode existir uma parametrização ψ : V0 → V de classe C k com k > 1. Com efeito, se uma tal ψ existisse então o próprio conjunto V seria uma curva de classe C k logo, pelo Corolário 1, uma vizinhança W do ponto (0, 0), com W ⊂ V , seria o gráfico de uma função g : W0 → R, de classe C k . Neste caso, para todo x ∈ W0 terı́amos (x, g(x)) ∈ W ⊂ M , logo g(x) = x4/3 , mas x4/3 é apenas de classe C 1 . Assim, M não é uma curva de classe C 2 . ⊳ 3 O espaço vetorial tangente Seja p um ponto da superfı́cie M , de dimensão m e classe C k em Rn . O espaço vetorial tangente a M no ponto p é um subespaço vetorial Tp M ⊂ Rn que pode ser visto sob dois aspectos: 130 Superfı́cies Diferenciáveis Cap. 7 1) Tp M é o conjunto dos vetores-velocidade v = λ′ (0) dos caminhos diferenciáveis λ : (−ε, ε) → M , tais que λ(0) = p. 2) Tp M = ϕ′ (x0 ) · Rm é a imagem da derivada ϕ′ (x0 ) : Rm → Rn , onde ϕ : V0 → V é uma parametrização em M , com ϕ(x0 ) = p. A primeira descrição de Tp M é intrı́nseca (não depende de escolhas arbitrárias) mas não deixa claro que se trata de um subespaço vetorial de Rn . Pela segunda descrição, Tp M é obviamente um subespaço vetorial de Rn mas não é evidente que para outra parametrização ψ : W0 → W , com ψ(y0 ) = p, se tenha ψ ′ (y0 ) · Rm = ϕ′ (x0 ) · Rm . As dúvidas ficarão sanadas se mostrarmos que os conjuntos definidos em 1) e 2) são o mesmo. Para ver isto, comecemos com o vetorvelocidade v = λ′ (0) de um caminho diferenciável λ : (−ε, ε) → M , com λ(0) = p. Restringindo ε, se necessário, podemos admitir que a imagem de λ esteja contida na imagem V de uma parametrização ϕ : V0 → V ⊂ M , com ϕ(x0 ) = p. Então, pelo Corolário 2, µ = ϕ−1 ◦ λ : (−ε, ε) → V0 é um caminho diferenciável em Rm , com µ(0) = x0 . Pondo u = µ′ (0), temos ϕ′ (x0 ) · u = ϕ′ (x0 ) · (ϕ−1 ◦ λ)′ (0) = (ϕ ◦ ϕ−1 ◦ λ)′ (0) = λ′ (0) = v. Portanto todo vetor v = λ′ (0) pertence à imagem ϕ′ (x0 ) · Rm de Rm pela derivada de alguma parametrização ϕ : V0 → V , com p ∈ V . Reciprocamente, se v = ϕ′ (x0 ) · u então, como u = µ′ (0), onde µ : (−ε, ε) → V0 é dado por µ(t) = x0 + t · u, temos v = λ′ (0) com λ : (−ε, ε) → V , λ(t) = ϕ(µ(t)), logo v está no conjunto definido em 1). Como toda parametrização ϕ é uma imersão, a derivada ϕ′ (x0 ) : m R → Rn é uma transformação linear injetiva, logo sua imagem ϕ′ (x0 ) · Rm = Tp M é um subespaço vetorial m-dimensional de Rn . Os vetores ∂ϕ ∂ϕ (x0 ) = ϕ′ (x0 ) · e1 , . . . , (x0 ) = ϕ′ (x0 ) · em ∂x1 ∂xm formam uma base de Tp M , chamada a base associada à parametrização ϕ. A seguir estenderemos, para superfı́cies quaisquer, o Teorema 3 do Capı́tulo 4, provado para o caso de co-dimensão 1. Seja f : U → Rn uma aplicação diferenciável, definida no aberto U ⊂ Rm+n . Um ponto c ∈ Rn chama-se um valor regular de f quando, Seção 3 O espaço vetorial tangente 131 para todo x ∈ U tal que f (x) = c, a derivada f ′ (x) : Rm+n → Rn é uma transformação linear sobrejetiva. Observe-se que, para n = 1, a transformação linear f ′ (x) : Rm+1 → R é sobrejetiva se, e somente se, é diferente de zero, ou seja, grad f (x) 6= 0. (Vide Exemplo 2, Capı́tulo 5.) Portanto esta definição de valor regular estende a que foi dada anteriormente. Teorema 2. Seja c ∈ Rn um valor regular da aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n . A imagem inversa M = f −1 (c) = {x ∈ U ; f (x) = c} é uma superfı́cie de classe C k e dimensão m em Rm+n . O espaço vetorial tangente Tp M , em cada ponto p ∈ M , é o núcleo da derivada f ′ (p) : Rm+n → Rn . Demonstração. Pelo Corolário 4, Capı́tulo 6, M = f −1 (c) é localmente o gráfico de uma aplicação de classe C k , logo é uma superfı́cie. Além disso, para p ∈ M , todo vetor v ∈ Tp M é da forma v = λ′ (0), onde λ : (−ε, ε) → M é um caminho diferenciável, com λ(0) = p. Logo f ′ (p) · v = (f ◦ λ)′ (0) = 0 pois f ◦ λ : (−ε, ε) → Rn é constante, igual a c. Portanto Tp M está contido no núcleo de f ′ (p). Como f ′ (p) é sobrejetiva, esse núcleo tem dimensão m e então é igual a Tp M . Exemplo 10. Seja O(Rn ) o grupo ortogonal, formado pelas matrizes x ∈ M (n × n), tais que x · x T = I n (matrizes ortogonais). Usaremos o Teorema 2 para mostrar que O(Rn ) é uma superfı́cie (compacta), de 2 classe C ∞ e dimensão n(n − 1)/2 em Rn . Seja então f : M (n × n) → S(Rn ) a aplicação definida no conjunto das matrizes n × n, com valores x) = no conjunto S(Rn ) das matrizes simétricas n × n, pela fórmula f (x 2 T n x · x . Já costumamos fazer a identificação M (n × n) = R . Agora identificaremos S(Rn ) com Rn(n+1)/2 pois uma matriz simétrica n × n fica determinada pelos seus elementos da diagonal e acima dela, em número de n + (n − 1) + · · · + 2 + 1 = n(n + 1)/2. Assim, escrevemos 2 f : Rn → Rn(n+1)/2 e temos O(Rn ) = f −1 (II n ). Resta apenas verificar que a matriz identidade I n é um valor regular de f . Tomando um ponto arbitrário de f −1 (II n ), isto é, uma matriz ortogonal x , sabemos que a 2 x) : Rn → Rn(n+1)/2 é a transformação linear que a toda derivada f ′ (x 2 x) · v = v · x T + x · v T . Para provar que v ∈ Rn faz corresponder f ′ (x ′ x) é sobrejetiva, seja dada s ∈ Rn(n+1)/2 . Tomando v = sx f (x sx/2 temos ′ T T x) · v = sx · x /2 + xx · s /2 = s /2 + s /2 = s . (Lembre que s T = s .) f (x Vale dim O(Rn ) = n2 − n(n + 1)/2 = n(n − 1)/2. 132 Superfı́cies Diferenciáveis Cap. 7 Observemos, em relação ao Exemplo 10, que o espaço vetorial tangente a O(Rn ) no ponto I n é o conjunto das matrizes anti-simétricas n × n, isto é, matrizes v tais que v + v T = 0. Com efeito, sendo a deri2 vada f ′ (II n ) : Rn → Rn(n+1)/2 dada por v 7→ v · I Tn + I n · v T , vemos que o núcleo de f ′ (II n ), ou seja, o espaço vetorial tangente a O(Rn ) no ponto I n , é o conjunto das matrizes anti-simétricas. 4 Superfı́cies orientáveis Como no caso de hiperfı́cies (co-dimensão 1), tratado no Capı́tulo 4, cabe observar que nem toda superfı́cie em Rn pode ser obtida como imagem inversa de um valor regular. Com efeito, se M = f −1 (c) 6= ∅ é a imagem inversa do valor regular c ∈ Rn pela aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n então, chamando de f1 , . . . , fn : U → R as funções-coordenada de f , vemos que grad f1 , . . . , grad fn : U → Rm+n são campos de vetores de classe C k−1 , com as seguintes propriedades: 1) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são ortogonais ao espaço vetorial tangente Tx M . (Diz-se então que os grad fi são campos de vetores normais a M .) 2) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são linearmente independentes. A afirmação 1) resulta do fato de que, para cada i = 1, . . . , n, a função fi : U → R é constante ao longo de M . Todo vetor v ∈ Tx M , para x ∈ M qualquer, é o vetor-velocidade v = λ′ (0) de um caminho λ : (−ε, ε) → M , logo fi ◦ λ : (−ε, ε) → R é constante. Daı́, h grad fi (x), vi = (fi ◦ λ)′ (0) = 0. Por sua vez, a afirmação 2) é equivalente a dizer que c é um valor regular de f , pois grad f1 (x), . . . , grad fn (x) são os vetores-linha da matriz ∂fi jacobiana (x) ∈ M (n×(m+n)). Sua independência linear significa ∂xj que esta matriz, para todo x ∈ M , tem posto n, logo f ′ (x) : Rm+n → Rn é sobrejetiva. Mas nem toda superfı́cie M ⊂ Rm+n , de co-dimensão n, admite n campos contı́nuos linearmente independentes de vetores normais. Uma condição necessária para isto é que M seja orientável, conforme mostraremos agora. Seção 4 Superfı́cies orientáveis 133 Um atlas numa superfı́cie M é um conjunto de parametrizações ϕ : V0 → V cujas imagens V cobrem M . Duas parametrizações ϕ : V0 → V e ψ : W0 → W dizem-se compatı́veis quando V ∩ W = ∅ ou então V ∩ W 6= ∅ e ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ) tem determinante jacobiano positivo em todos os pontos x ∈ ϕ−1 (V ∩ W ). Um atlas A na superfı́cie M chama-se coerente quando duas parametrizações quaisquer ϕ, ψ ∈ A são compatı́veis. Uma superfı́cie M chama-se orientável quando admite um atlas coerente. Teorema 3. Se uma superfı́cie M ⊂ Rm+n , de co-dimensão n, admite n campos contı́nuos linearmente independentes de vetores normais v1 , . . . , vn : M → Rm+n então M é orientável. Demonstração. Seja A o conjunto das parametrizações ϕ : V0 → V em M tais que V0 é conexo e, para todo x ∈ V0 , a matriz ∂ϕ ∂ϕ Φ (x) = (x), . . . , (x), v1 (ϕ(x)), . . . , vn (ϕ(x)) , ∂x1 ∂xm cujas m + n colunas são os vetores de Rm+n aı́ indicados, tem determinante positivo. Como V0 é conexo e os campos vi são contı́nuos, para ser ϕ ∈ A basta que det Φ(x) > 0 para algum x ∈ V0 . Se for det Φ(x) < 0, escrevemos x∗ = (−x1 , x2 , . . . , xm ) quando x = (x1 , x2 , . . . , xm ) e pomos V0∗ = {x∗ ; x ∈ V0 }. Então ϕ∗ : V0∗ → V , dada por ϕ∗ (x) = ϕ(x∗ ), é uma parametrização cuja imagem ainda é V mas det Φ ∗ (x) > 0. Isto mostra que A é um atlas em M . Sejam ϕ, ψ ∈ A, com ϕ : V0 → V , ψ : W0 → W e V ∩ W 6= ∅. Pondo ξ = ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ), temos ϕ = ψ ◦ ξ. A Regra da Cadeia nos dá, para x ∈ ϕ−1 (V ∩ W ), y = ξ(x) e 1 ≤ i, j ≤ m: m X ∂ψi ∂ϕi (x) = (y) · akj (x) , ∂xj ∂yk k=1 onde a (x) = [akj (x)] é a matriz jacobiana de ξ no ponto x. Portanto se, para cada x ∈ ϕ−1 (V ∩ W ) e y = ξ(x), escrevermos ∂ψ ∂ψ Ψ (y) = (y), . . . , (y), v1 (ψ(y)), . . . , vm (ψ(y)) , ∂y1 ∂ym a (x) 0 teremos Φ (x) = Ψ (y) · A (x), onde A (x) = é a matriz (m + 0 I n) × (m + n) formada a partir dos blocos a (x) ∈ M (m × m) e I = matriz 134 Superfı́cies Diferenciáveis Cap. 7 identidade n×n. Então det Φ (x) = det Ψ (y)·det a (x) e daı́ det a (x) > 0. Logo as parametrizações ϕ, ψ ∈ A são compatı́veis. O atlas A é coerente e a superfı́cie M é orientável. Corolário 4. Se M = f −1 (c) é a imagem inversa de um valor regular da aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n , então M é uma superfı́cie m-dimensional orientável. Assim, por exemplo, o grupo ortogonal O(Rn ) é uma superfı́cie orientável. Para co-dimensão 1, vale a recı́proca do Teorema 3. Ela resulta da existência do produto vetorial w = v1 × · · · × vn de n vetores em Rn+1 , que descreveremos agora. O produto w = v1 ×· · ·×vn é igual a zero quando os vetores v1 , . . . , vn são linearmente dependentes. Caso contrário, w é o vetor que é ortogonal ao subespaço gerado por esses n vetores, tem comprimento igual ao volume do paralelepı́pedo n-dimensional por eles determinado e seu sentido é dado pela condição det[v1 , . . . , vn , w] > 0. Em termos formais, seja m = [v1 , . . . , vn ] a matriz (n + 1) × n cujas colunas são os vetores dados. Para cada i = 1, . . . , n + 1, indiquemos com m i a matriz n × n obtida de m omitindo a i-ésima linha. Então o produto vetorial w = v1 × · · · × vn é definido por w = v1 × · · · × vn = n+1 X i=1 (−1)n+i+1 det m i · ei . O desenvolvimento de Laplace de um determinante em relação à sua última coluna mostra que, para todo vetor z ∈ Rn+1 , tem-se hv1 × · · · × vn , zi = det[v1 , . . . , vn , z]. Esta última igualdade mostra que, de fato, v1 × · · · × vn = w é ortogonal a v1 , . . . , vn , que é zero quando esses vetores são linearmente dependentes e que det[v1 , . . . , vn , w] ≥ 0. Além disso, sabe-se que o volume (n + 1)-dimensional do paralelepı́pedo cujas arestas são v1 , . . . , vn , w é o produto do volume n-dimensional Vn de sua base (a qual tem v1 , . . . , vn como arestas) pelo comprimento de sua altura, que é |w|, pois w é ortogonal a essa base. Logo |w| · Vn = vol[v1 , . . . , vn , w] = | det[v1 , . . . , vn , w]| = hv1 × · · · × vn , wi = |w|2 . Seção 4 Superfı́cies orientáveis 135 Simplificando, vem |w| = Vn , ou seja, o comprimento do produto vetorial v1 × · · · × vn é o volume n-dimensional do paralelepı́pedo cujas arestas são os vetores v1 , . . . , vn . (Para maiores detalhes sobre o volume de um paralelepı́pedo, ver o Apêndice a este capı́tulo.) Concluindo estas considerações sobre o produto vetorial, mostraremos agora que se {u1 , . . . , un } e {v1 , . . . , vn } são bases do subespaço vetorial E ⊂ Rn+1 e se a = [aij ] é a matriz de passagem da primeira n P aij ui (j = 1, . . . , n), então para a segunda, isto é, vj = i=1 v1 × · · · × vn = det a · u1 × · · · × un . Com efeito, como ambos estes produtos vetoriais são ortogonais ao subespaço E ⊂ Rn+1 , que tem co-dimensão 1, eles são múltiplos um do outro. Então, fixando os vetores u1 , . . . , un , definimos duas formas n-lineares alternadas f , ∆ em E, pelas condições e v1 × · · · × vn = f (v1 , . . . , vn ) · u1 × · · · × un n X aij ui , j = 1, . . . , n. ∆(v1 , . . . , vn ) = det[aij ] se vj = i=1 Sabe-se (v. “Álgebra Linear”, pág. 261) que as formas n-lineares alternadas num espaço vetorial de dimensão n constituem um espaço vetorial de dimensão 1. Logo existe c ∈ R tal que f = c · ∆, ou seja, f (v1 , . . . , vn ) = c · det[aij ] para quaisquer v1 , . . . , vn ∈ E. Tomando v1 = u1 , . . . , vn = un , temos f (u1 , . . . , un ) = 1 e ∆(u1 , . . . , un ) = 1, logo c = 1 e daı́ f = ∆, isto é, onde v1 × · · · × vn = det a · u1 × · · · × un , n X a = [aij ] e vj = aij ui , j = 1, . . . , n. i=1 Teorema 4. Toda superfı́cie orientável de co-dimensão 1 admite um campo contı́nuo de vetores normais não-nulos. Demonstração. Seja M ⊂ Rn+1 orientável de dimensão n. Para toda parametrização ϕ : V0 → V pertencente ao atlas coerente A, o qual caracteriza a orientabilidade de M , definamos o campo contı́nuo de vetores 136 Superfı́cies Diferenciáveis Cap. 7 normais unitários u : V → Rn+1 pondo, em cada ponto p ∈ V , u(p) = w(p)/|w(p)|, onde w(p) = ∂ϕ ∂ϕ (x) × · · · × (x), x = ϕ−1 (p) ∈ V0 . ∂x1 ∂xn Se ψ : W0 → W for outra parametrização pertencente a A então ϕ e ψ são compatı́veis. Assim, se V ∩ W 6= ∅, para todo p ∈ V ∩ W , com z(p) = ∂ψ ∂ψ (y) × · · · × (y), y = ψ −1 (p) ∈ W0 , ∂y1 ∂yn como vimos acima, temos w(p) = det a ·z(p) onde a é a matriz jacobiana, no ponto x, da mudança de parametrização ψ −1 ◦ ϕ. Logo det a > 0 e, conseqüentemente, w(p) z(p) = = u(p). |w(p)| |z(p)| Deste modo, o campo unitário normal u : M → Rn+1 está bem definido e é, evidentemente, contı́nuo. O Teorema 4 mostra que a definição de hiperfı́cie orientável dada no Capı́tulo 4 é compatı́vel com a definição geral dada aqui. Exemplo 11. Todo subconjunto aberto A de uma superfı́cie orientável M é ainda uma superfı́cie orientável. Com efeito, se A é um atlas coerente em M então as restrições ϕ|(V0 ∩ϕ−1 (A)) → V ∩A das parametrizações ϕ : V0 → V pertencentes a A, com V ∩ A 6= ∅, formam um atlas coerente em A. Portanto se uma superfı́cie bidimensional M contém uma faixa de Moebius então M não é orientável. ⊳ Exemplo 12. O produto M × N de duas superfı́cies orientáveis M e N é uma superfı́cie orientável. Com efeito, se A e B são atlas coerentes em M e N respectivamente então as parametrizações do tipo ϕ × ξ : V0 × W0 → V × W , definidas por (ϕ × ξ)(x, y) = (ϕ(x), ξ(y)), onde ϕ ∈ A e ξ ∈ B, formam um atlas em M × N , o qual é coerente pois (ψ × ζ)−1 ◦ (ϕ × ξ) = (ψ −1 ◦ ϕ) × (ζ −1 ◦ ξ) e o determinante jacobiano de (ψ −1 ◦ ϕ) × (ζ −1 ◦ ξ) é o produto dos determinantes jacobianos de ψ −1 ◦ ϕ e ζ −1 ◦ ξ. Exemplo 13. Em virtude do Teorema 3, a esfera S n é uma hiperfı́cie orientável em Rn+1 , pois admite o óbvio campo contı́nuo de vetores normais unitários u : S n → Rn+1 , u(p) = p. Em particular, o cı́rculo S 1 ⊂ R2 é orientável logo, pelo Exemplo 12, o toro n-dimensional T n = S 1 × · · · × S 1 (n fatores) é uma superfı́cie orientável em R2n . ⊳ Seção 4 Superfı́cies orientáveis 137 Seja A um atlas coerente sobre a superfı́cie M . O par (M, A) chamase uma superfı́cie orientada. Uma parametrização ϕ : V0 → V diz-se positiva quando é compatı́vel com todas as parametrizações ψ ∈ A. Diz-se que ϕ é negativa quando, para toda ψ : W0 → W pertencente a A e todo x ∈ ϕ−1 (V ∩ W ), o determinante jacobiano det J(ψ −1 ◦ ϕ)(x) é negativo. Numa superfı́cie orientada (M, A), duas parametrizações negativas ϕ : V0 → V , ψ : W0 → W são sempre compatı́veis. Com efeito, dado p = ϕ(x) ∈ V ∩ W , seja ξ : Z0 → Z pertencente a A tal que ξ(z) = p. Então os determinantes jacobianos det J(ξ −1 ◦ ϕ)(x) e det J(ψ −1 ◦ ξ)(z) são ambos negativos logo é positivo o seu produto det J(ψ −1 ◦ ξ)(z) · det J(ξ −1 ◦ ϕ)(x) = det J(ψ −1 ◦ ϕ)(x). Teorema 5. Seja (M, A) uma superfı́cie orientada. Se V ⊂ M é conexo, toda parametrização ϕ : V0 → V é positiva ou negativa. Demonstração: Sejam A o conjunto dos pontos p = ϕ(x) ∈ V tais que existe ξ : W0 → W em A, com p ∈ W e det J(ξ −1 ◦ ϕ)(x) < 0, e B o conjunto dos pontos q ∈ V para os quais existe ζ : Z0 → Z, ζ ∈ A, com ζ(z) = q = ϕ(y) e det J(ζ −1 ◦ ϕ)(y) > 0. A e B são abertos em V e A ∪ B = V . Além disso, A ∩ B = ∅ pois se existisse p = ϕ(x) ∈ A∩B, terı́amos as parametrizações ξ : W0 → W , ζ : Z0 → Z, com ξ(w) = ζ(z) = p, ambas em A e, como (ξ −1 ◦ϕ)◦(ζ −1 ◦ϕ)−1 = ξ −1 ◦ζ, viria det J(ξ −1 ◦ ζ)(z) = det J(ξ −1 ◦ ϕ)(x) · [det J(ζ −1 ◦ ϕ)(x)]−1 < 0 e o atlas A não seria coerente. Como V é conexo, tem-se A = ∅ (e então ϕ é positiva) ou B = ∅ (e então ϕ é negativa). Corolário. Se na superfı́cie M há duas parametrizações ϕ : V0 → V , ψ : W0 → W , com V, W conexas, tais que o determinante jacobiano det J(ψ −1 ◦ ϕ)(x) muda de sinal quando x varia em ϕ−1 (V ∩ W ), então M não é orientável . Supondo, por absurdo, que existisse um atlas coerente A sobre M então ϕ e ψ não poderiam ser ambas positivas nem ambas negativas, pois são incompatı́veis. Tampouco pode ser uma delas, digamos ϕ, positiva e a outra, ψ, negativa. Com efeito, se tal ocorresse, A ∪ {ϕ} seria ainda 138 Superfı́cies Diferenciáveis Cap. 7 um atlas coerente, em relação ao qual ψ não seria positiva nem negativa, como se vê pelos sinais do determinante jacobiano de ψ −1 ◦ ϕ. Exemplo 14. Seja M ⊂ R6 o conjunto das matrizes 2 × 3 de posto 1. Cada elemento m ∈ M será escrito sob a forma m = [u, v], onde os vetores u, v ∈ R3 são as suas linhas. Temos M = U ∪ V , onde U é o conjunto das matrizes m = [u, v] de posto 1 tais que u 6= 0, enquanto V ⊂ M é definido pela condição v 6= 0. Pondo U0 = R × (R3 − {0}) as aplicações ϕ : U0 → U e ψ : U0 → V , definidas por ϕ(t, u) = [u, tu] e ψ(t, v) = [tv, v], são parametrizações C ∞ . A interseção U ∩ V é o conjunto das matrizes de posto 1 com ambas as linhas não-nulas, logo ϕ−1 (U ∩ V ) = ψ −1 (U ∩ V ) = (R − {0}) × (R3 − {0}) tem duas componentes conexas R+ × (R3 − {0}) e R− × (R3 − {0}). A mudança de parametrização ξ = ψ −1 ◦ ϕ : ϕ−1 (U ∩ V ) → ψ −1 (U ∩ V ) é dada por ξ(t, x, y, z) = (1/t, tx, ty, tz). Sua matriz jacobiana em cada ponto (t, x, y, z) ∈ ϕ−1 (U ∩ V ) é 1 − 2 0 0 0 t t 0 0 Jξ(t, x, y, z) = x y 0 t 0 z 0 0 t e seu determinante é igual a −t. A mudança de parametrização ξ = ψ −1 ◦ ϕ tem, portanto, jacobiano negativo em R+ × (R3 − {0}) e positivo em R− × (R3 − {0}). Segue-se do Teorema 5 que M é uma superfı́cie C ∞ , não-orientável, de dimensão 4 em R6 . ⊳ Exemplo 12a. Vale a recı́proca do que foi visto no Exemplo 12: se M × N é orientável, então M e N são ambas superfı́cies orientáveis. Com efeito, seja A um atlas coerente em M × N . Fixemos, de uma vez por todas, uma parametrização ξ : Z0 → Z ⊂ N , com Z conexo. Seja B o conjunto das parametrizações ϕ : V0 → V ⊂ M tais que V é conexo e ϕ × ξ : V0 × Z0 → V × Z ⊂ M × N é uma parametrização positiva. Afirmamos que B é um atlas em M . Com efeito, dado qualquer ponto p ∈ M , seja ϕ : V0 → V uma parametrização com V conexo e p ∈ V . Se ϕ×ξ : V0 ×Z0 → V ×Z for positiva, temos ϕ ∈ B. Se, entretanto, ϕ×ξ for negativa então, como na demonstração do Teorema 3, consideramos a parametrização ϕ∗ : V0∗ → V , dada por ϕ∗ (x1 , . . . , xm ) = ϕ(−x1 , . . . , xm ) e vemos que ϕ∗ × ξ : V0∗ × Z0 → V × Z é positiva, logo ϕ ∈ B. Além disso, o atlas B é coerente pois se ϕ : V0 → V e ψ : W0 → W pertencem Seção 5 Multiplicadores de Lagrange 139 a B, com V ∩ W 6= ∅, então, pondo α = (ψ × ξ)−1 ◦ (ϕ × ξ), temos α = (ψ −1 ◦ ϕ) × id. Então o determinante jacobiano de ψ −1 ◦ ϕ é igual ao de α, que é positivo. Portanto o atlas B é coerente e M é orientável. Analogamente para N . 5 Multiplicadores de Lagrange Estenderemos agora, para co-dimensão n qualquer, o método dos multiplicadores de Lagrange, apresentado no Capı́tulo 4 no caso em que a superfı́cie ϕ−1 (c) tem co-dimensão 1, logo há apenas um multiplicador. São dadas uma superfı́cie M , de dimensão m e classe C k , e uma função f : U → R, de classe C k no aberto U , com M ⊂ U ⊂ Rm+n . Quer-se determinar o conjunto dos pontos crı́ticos da restrição f |M . Diz-se que p ∈ M é um ponto crı́tico da restrição f |M quando, para todo caminho diferenciável λ : (−ε, ε) → M , com λ(0) = p, tem-se (f ◦ λ)′ (0) = 0. Como λ′ (0) = v ∈ Tp M e portanto (f ◦ λ)′ (0) = ∂f (p) = h grad f (p), vi, ∂v concluı́mos que p ∈ M é ponto crı́tico de f |M se, e somente se, grad f (p) é ortogonal a todos os vetores v ∈ Tp M , tangentes a M no ponto p, ou seja, grad f (p) ∈ [Tp M ]⊥ . Se p ∈ M é um ponto de mı́nimo (ou máximo) local da restrição f |M e λ : (−ε, ε) → M é um caminho diferenciável com λ(0) = p então 0 é um ponto de mı́nimo (ou máximo) local de f ◦ λ : (−ε, ε) → R, logo (f ◦ λ)′ (0) = 0 e então p é um ponto crı́tico de f |M . Exemplo 15. Dada a superfı́cie M ⊂ Rm+n e fixado um ponto a ∈ Rm+n , suponhamos que exista, entre os pontos de M , (pelo menos) um ponto p situado a uma distância mı́nima de a. Considerando a função f : Rm+n → R, dada por f (x) = |x − a|2 , vemos que p é um ponto de mı́nimo da restrição f |M . Logo grad f (p) é um vetor ortogonal a Tp M . Mas grad f (p) = 2 · (p − a). Portanto os pontos p ∈ M situados à distância mı́nima do ponto a são aqueles tais que o vetor p − a é ortogonal a Tp M . Evidentemente, vale o mesmo para os pontos de M mais afastados de a, caso existam (como ocorre quando M é compacta). ⊳ 140 Superfı́cies Diferenciáveis Cap. 7 Suponhamos agora que a superfı́cie M = ϕ−1 (c) seja obtida como imagem inversa do valor regular c da aplicação ϕ : U → Rn , de classe C k no aberto U ⊂ Rm+n . Se escrevermos ϕ(x) = (ϕ1 (x), . . . , ϕn (x)), a afirmação de que c é um valor regular de ϕ significa que os vetores grad ϕ1 (x), . . . , grad ϕn (x) são linearmente independentes para todo x ∈ U tal que ϕ(x) = c. Com efeito, esses n vetores são as linhas da matriz jacobiana Jϕ(x) ∈ M (n × (m + n)), a qual tem posto n por ser a matriz da transformação linear sobrejetiva ϕ′ (x) : Rm+n → Rn . Além disso, conforme já vimos no inı́cio da Seção 4, em todo ponto x ∈ M = ϕ−1 (c), os vetores grad ϕ1 (x), . . . , grad ϕn (x) são ortogonais a Tx M , portanto formam uma base do complemento ortogonal [Tx M ]⊥ . Podemos então enunciar o Método dos multiplicadores de Lagrange. Sejam f : U → R uma função de classe C k no aberto U ⊂ Rm+n e M = ϕ−1 (c) a imagem inversa do valor regular c pela aplicação ϕ : U → Rn , de classe C k . A fim de que p ∈ M seja um ponto crı́tico da restrição f |M é necessário e suficiente que existam números λ1 , . . . , λn tais que grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p). Os números λ1 , . . . , λn são chamados multiplicadores de Lagrange. De fato, p é ponto crı́tico de f |M se, e somente se, grad f (p) é ortogonal a Tp M . Como {grad ϕ1 (p), . . . , grad ϕn (p)} é uma base do complemento ortogonal de Tp M em Rm+n , dizer que grad f (p) ∈ [Tp M ]⊥ equivale a afirmar que grad f (p) é combinação linear dos gradientes grad ϕ1 (p), . . . , grad ϕn (p). Seja c = (c1 , . . . , cn ). Para encontrar os pontos crı́ticos p da restrição f |M , devemos resolver o sistema abaixo, de m+2n equações com m+2n incógnitas. (As incógnitas são as m + n coordenadas de p mais os n multiplicadores λi .): ( ϕ1 (p) = c1 , . . . , ϕn (p) = cn grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p). A última equação acima é vetorial. Ela equivale às m + n equações numéricas ∂f ∂ϕ1 ∂ϕn (p) = λ1 · (p) + · · · + λn · (p), j = 1, . . . , m + n. ∂xj ∂xj ∂xj Seção 5 Multiplicadores de Lagrange 141 Exemplo 16. Seja A : Rm → Rn uma transformação linear. P Defina m n ∗ f : R × R → R pondo f (x, y) = hA · x, yi = hx, A · yi = aij xj yi (1 ≤ i ≤ n, 1 ≤ j ≤ m). Considerando o valor regular (1,1) da aplicação ϕ : Rm × Rn → R2 , dada por ϕ(x, y) = (|x|2 , |y|2 ), seja M = S m−1 × S n−1 = ϕ−1 (1, 1). Vejamos quais são os pontos crı́ticos da restrição f |M . Para todo (x, y) ∈ Rm × Rn , temos grad f (x, y) = (A∗ · y, A · x) ∈ m R × Rn . Além disso, ϕ = (ϕ1 , ϕ2 ), com grad ϕ1 (x, y) = (2x, 0) e grad ϕ2 (x, y) = (0, 2y). Por conveniência, tomemos λ/2 e µ/2 como multiplicadores de Lagrange. Um ponto p = (x, y) ∈ M é crı́tico para f |M se, e somente se, grad f (x, y) = µ λ · grad ϕ1 (x, y) + · grad ϕ2 (x, y), 2 2 ou seja, (A∗ y, Ax) = (λx, µy). Isto nos dá A · x = µ · y e A∗ y = λ · x, donde µ = hµ · y, yi = hAx, yi = hx, A∗ yi = hx, λ · xi = λ. Portanto, os pontos crı́ticos de f |M são os pontos (x, y) ∈ S m−1 × S n−1 tais que Ax = λy e A∗ y = λx para um certo λ ∈ R. Notemos que então λ = f (x, y) e que z ⊥ x ⇒ Az ⊥ y. Assim, se escrevermos E = {z ∈ Rm ; hz, xi = 0} = complemento ortogonal de x em Rm , e F = complemento ortogonal de y em Rn , a transformação linear A : Rm → Rn aplica E em F . Seja então p1 = (u1 , v1 ) ∈ S m−1 × S n−1 o ponto em que a função f assume seu valor máximo em S m−1 × S n−1 : f (u1 , v1 ) = λ1 . Então p1 é ponto crı́tico de f |M . Temos Au1 = λ1 · v1 e A∗ v1 = λ1 · u1 . Como f (x, −y) = −f (x, y), vemos que λ1 ≥ 0. Se A 6= 0 então f não é identicamente nula em M , logo λ1 > 0. Em seguida consideremos A como uma transformação linear A : E → F , agora com dim E = m−1 e dim F = n−1. Prosseguindo por indução, chegaremos ao seguinte resultado: Teorema dos Valores Singulares. Seja A : Rm → Rn uma transformação linear de posto r. Existem bases ortonormais {u1 , . . . , um } ⊂ Rm e {v1 , . . . , vn } ⊂ Rn tais que Aui = λi vi e A∗ vi = λi ui , onde λi > 0 para i = 1, . . . , r e λi = 0 para i ≥ r + 1. Os números λ1 > 0, . . . , λr > 0 são chamados os valores singulares de A. 142 6 Superfı́cies Diferenciáveis Cap. 7 Aplicações diferenciáveis entre superfı́cies Seja M ⊂ Rn uma superfı́cie de dimensão m e classe C k . Uma aplicação f : M → Rs diz-se de classe C r (r ≤ k) quando, para toda parametrização ϕ : V0 → V , de classe C k em M , a composta f ◦ ϕ : V0 → Rs é de classe C r no aberto V0 ⊂ Rm . Se ϕ : V0 → V e ψ : W0 → W são parametrizações de classe C k em M , com V ∩ W 6= ∅, então segue-se do Corolário 2 que f ◦ ϕ = (f ◦ ψ) ◦ (ψ −1 ◦ ϕ) é de classe C r se, e somente se, f ◦ ψ o é. Daı́ resulta que a definição acima dada é consistente. Dada outra superfı́cie N ⊂ Rs , diremos que a aplicação f : M → N é de classe C r quando, considerada como aplicação de M em Rs , f for de classe C r conforme a definição. A fim de que tal ocorra é necessário e suficiente que, para todo p ∈ M e toda parametrização ψ : W0 → W em N , com q = f (p) ∈ W , exista uma parametrização ϕ : V0 → V , com p ∈ V , f (V ) ⊂ M e ψ −1 ◦ f ◦ ϕ : V0 → W0 ⊂ Rm seja de classe C r . Novamente, admitindo que M e N são de classe C k com k ≥ r, esta definição independe das escolhas de ϕ e ψ. Seja f : M → N de classe C 1 . A derivada de f no ponto p é a transformação linear f ′ (p) : Tp M → Tq N, q = f (p), assim definida: todo vetor v ∈ Tp M é o vetor velocidade v = λ′ (0) de um caminho λ : (−ε, ε) → V , com λ(0) = p. Então pomos f ′ (p) · v = (f ◦ λ)′ (0). v w λ N p f q f ◦λ M w = f ′ (p) · v Figura 7.5 Se ϕ : V0 → V ⊂ M é uma parametrização C 1 com ϕ(x0 ) = p então v = ϕ′ (x0 ) · v0 , v0 ∈ Rm , e f ′ (p) · v = (f ◦ ϕ)′ (x0 ) · v0 . Isto mostra que f ′ (p) é linear. Seção 6 Aplicações diferenciáeis entre superfı́cies 143 Vale a Regra da Cadeia: se f : M → N e g : N → P são de classe C r então g ◦ f : M → P é de classe C r , com (g ◦ f )′ (p) = g ′ (f (p)) · f ′ (p). Diz-se que f : M → N é um difeomorfismo de classe C r quando f possui uma inversa g : N → M que também é de classe C r . Neste caso, para cada ponto p ∈ M , a derivada f ′ (p) : Tp M → Tq N , q = f (p), é um isomorfismo, cujo inverso é g ′ (q) : Tq N → Tp M . Se, para um certo p ∈ M , a derivada f ′ (p) : Tp M → Tq N é um isomorfismo então resulta facilmente do Teorema da Aplicação Inversa que f aplica difeomorficamente uma vizinhança aberta U de p em M sobre uma vizinhança aberta V = f (U ) de q = f (p) em N . Se f ′ (p) é um isomorfismo para todo p ∈ M , diz-se que f : M → N é um difeomorfismo local. Então a aplicação f leva abertos de M em abertos de N e, se for bijetiva, é um difeomorfismo entre M e N . A função de Euler f : R → S 1 , definida por E(t) = (cost, sent), é um difeomorfismo local. Sua restrição a qualquer intervalo aberto (a, a+2π) de comprimento 2π é um difeomorfismo desse intervalo sobre S 1 − {p}, p = E(a). Exemplo 17. O exemplo mais óbvio de uma aplicação diferenciável (de classe C k ) f : M → Rs é a restrição a M de uma aplicação F : U → Rs de classe C k num aberto U , com M ⊂ U ⊂ Rn . Exemplo 18. Seja M ⊂ Rn+1 uma hiperfı́cie orientável de classe C k (k ≥ 2). Se u : M → Rn+1 é um campo contı́nuo de vetores unitários normais a M , então u é uma aplicação de classe C k−1 . (Vide Teorema 4.) Com efeito, para cada parametrização ϕ : V0 → V ⊂ M , de ∂ϕ ∂ϕ classe C k , pondo v(ϕ(x)) = (x) × · · · × (x), temos u(ϕ(x)) = ∂x1 ∂xn ±v(ϕ(x))/|v(ϕ(x))| para cada x ∈ V0 pois u e v, sendo ambos ortogonais a Tϕ(x) M , são colineares. Se V0 (e portanto V ) for conexo, teremos u = v/|v| ou u = −v/|v| em todos os pontos de V , logo u ∈ C k−1 . Exemplo 19. Seja M = R2 − {0}. A aplicação f : M → R3 , definida por f (z) = z |z|, log |z| , é um difeomorfismo C ∞ sobre o cilindro S 1 × R ⊂ R3 . Seu inverso é g : S 1 × R → R2 − {0}, onde g(w, t) = et · w. De modo análogo se tem um difeomorfismo C ∞ entre Rn+1 − {0} e S n × R. Exemplo 20. (Aplicação normal de Gauss.) Um campo contı́nuo de vetores unitários normais numa hiperfı́cie orientável M ⊂ Rn+1 , de classe C k (k ≥ 2) é uma aplicação de classe C k−1 , u : M → S n , chamada a aplicação normal de Gauss. Em cada ponto p ∈ M , tem-se 144 Superfı́cies Diferenciáveis Cap. 7 Tp M = Tu(p) S n pois estes espaços vetoriais são o complemento ortogonal do vetor u(p) em Rn+1 . Portanto a derivada u′ (p) é um operador linear em Tp M , o qual é auto-adjunto. Para provar isto, tomamos uma parametrização ϕ : V0 → V ⊂ M , com ϕ(x) = p, consideramos a base ∂ϕ ∂ϕ { ∂x (x)} ⊂ Tp M , e mostramos que (x), . . . , ∂x n 1 hu′ (p) · ∂ϕ ∂ϕ ∂ϕ ∂ϕ (x), (x)i = h (x), u′ (p) · (x)i, i, j = 1, . . . , n (*) ∂xi ∂xj ∂xi ∂xj Com efeito, para todo x ∈ V0 e todo j = 1, . . . , n, vale a igualdade hu(ϕ(x)), ∂ϕ (x)i = 0. ∂xj Derivando ambos os membros em relação a xi vem: hu′ (p) · ∂ϕ ∂2ϕ ∂ϕ (x), (x)i + hu(p), (x)i = 0 ∂xi ∂xj ∂xi ∂xj (onde p = ϕ(x)). Trocando os papéis de i e j, resulta então do Teorema de Schwarz que valem as igualdades (*) e u′ (p) é auto-adjunto. Os autovalores k1 , . . . , kn do operador u′ (p) chamam-se as curvaturas principais da hiperfı́cie M no ponto p e o produto k1 · k2 · · · kn = det ·u′ (p) = K(p) é chamado a curvatura gaussiana de M nesse ponto. APÊNDICE O volume de um paralelepı́pedo Sejam v1 , . . . , vr vetores linearmente independentes em Rn . O paralelepı́pedo (r-dimensional) P = P (v1 , . . . , vr ) que tem esses vetores r P ti vi , com 0 ≤ como arestas é o conjunto das combinações lineares i=1 ti ≤ 1. O volume r-dimensional do paralelepı́pedo P = P (v1 , . . . , vr ) é definido por indução sobre r. Se r = 1, pomos vol P (v1 ) = |v1 |. Supondo definido o volume (r − 1)-dimensional, pomos vol P (v1 , . . . , vr ) = |h| · vol P (v2 , . . . , vr ), Seção 6 Aplicações diferenciáeis entre superfı́cies 145 onde h ∈ Rn é o vetor-altura de P , ou seja, h = v1 − pr.v1 , sendo pr.v1 a projeção ortogonal de v1 sobre o subespaço E ⊂ Rn gerado por v2 , . . . , vr . O vetor-altura h é ortogonal a v2 , . . . , vr , a diferença v1 − h pertence ao subespaço E que tem v2 , . . . , vr como base e estas duas propriedades caracterizam h. Provaremos, a seguir, que o volume do paralelepı́pedo P é a raiz quadrada do determinante da matriz de Gram g = g (v1 , . . . , vr ) = [hvi , vj i] ∈ M (r × r). Começaremos observando que, se fixarmos arbitrariamente uma base ortonormal no subespaço de Rn gerado por e1 , . . . , er e considerarmos a matriz m ∈ M (r × r) cujas colunas são as coordenadas dos vetores v1 , . . . , vr relativas a essa base, então tem-se det[hvi , vj i] = (det m )2 . Esta igualdade é imediata se notarmos que, segundo a definição de produto de matrizes, tem-se g (v1 , . . . , vr ) = m ⊤ · m , onde m ⊤ é a transposta de m . Portanto det[hvi , vj i] = det g = det m ⊤ · det m = (det m )2 . Daı́ resultam dois fatos. O primeiro é que det m não depende da base ortonormal que foi arbitrariamente escolhida no subespaço gerado por v1 , . . . , vr . O segundo é que det g (v1 , . . . , vr ) = det g (h, v2 . . . , vr ) pois h = v1 −pr.v1 e o determinante de m não se altera quando se subtrai da coluna v1 uma combinação linear das demais colunas. Deste modo, temos (por indução): [vol P (v1 , . . . , vr )]2 = |h|2 · [vol P (v2 , . . . , vr )]2 = = hh, hi · det g (v2 , . . . , vr ) = det g (h, v2 , . . . , vr ) = = det g (v1 , . . . , vr ), sendo a penúltima igualdade devida ao fato de que a primeira linha e a primeira coluna da matriz g (h, v2 , . . . , vr ) têm hh, hi como único elemento não-nulo. Portanto, se v1 , . . . , vn ∈ Rn e indicamos com a notação [v1 , . . . , vn ] a matriz n × n cujo j-ésimo vetor-coluna é vj então o volume do paralelepı́pedo cujas arestas são v1 , . . . , vn é igual a | det[v1 , . . . , vn ]|. Além disso, o quadrado desse volume é igual ao determinante da matriz de Gram g (v1 , . . . , vn ), cujo ij-ésimo elemento é hvi , vj i. 146 7 Superfı́cies Diferenciáveis Cap. 7 Exercı́cios Seção 2. Superfı́cies diferenciáveis 1. Prove que toda superfı́cie M ⊂ Rm+n de classe C k é localmente a imagem inversa de um valor regular de uma aplicação f : U → Rn , de classe C k num aberto U ⊂ Rm+n . Conclua que todo ponto p ∈ M pertence a um aberto V ⊂ M , imagem de uma parametrização ϕ : V0 → V , de classe C k , no qual estão definidos n campos vetoriais v1 , . . . , vn : V → Rm+n tais que v1 ◦ ϕ, . . . , vn ◦ ϕ : V0 → Rm+n são de classe C k−1 e, para cada q ∈ V , v1 (q), . . . , vn (q) são linearmente independentes e ortogonais a Tq M . 2. Seja M ⊂ Rn de classe C k e dimensão m. Prove que o conjunto T M = {(p, v) ∈ Rn ×Rn ; p ∈ M, v ∈ Tp M } é uma superfı́cie de classe C k−1 e dimensão 2m, chamada o fibrado tangente de M . 3. Com a notação do exercı́cio anterior, seja νM = {(p, v) ∈ Rn × Rn ; p ∈ M, v ∈ Tp M ⊥ }. Prove que νM é uma superfı́cie de classe C k−1 e dimensão n, chamada o fibrado normal de M em Rn . 4. Mostre que o conjunto M das matrizes 4 × 4 de posto 2 é uma superfı́cie C ∞ de dimensão 12 em R16 . Generalize para matrizes m × n de posto k. Seção 3. O espaço vetorial tangente 1. Dada uma superfı́cie M ⊂Rn , de classe C k e dimensão m, considere um ponto p∈M e duas parametrizações ϕ : V0 →V , ψ : W0 →W em M , com p∈V ∩W . Seja [aij ] a matriz jacobiana, no ponto x0 = ϕ−1P (p), do difeomorfismo ψ −1 ◦ m ∂ψ ∂ϕ −1 −1 ϕ : ϕ (V ∩ W ) → ψ (V ∩ W ). Mostre que i=1 aij ∂yi (y0 ) = ∂xj (x0 ), onde ψ(y0 ) = p. [Noutras palavras: [aij ] é a matriz de passagem da base ∂ψ ∂ϕ ∂ψ ∂ϕ { ∂y (y0 )} para a base { ∂x (x0 )} em Tp M .] (y0 ), . . . , ∂y (x0 ), . . . , ∂x m m 1 1 2. Seja λ : [a, b] → M um caminho na superfı́cie M ⊂ Rn , com λ(a) = p. Dada uma base ortonormal {u1 , . . . , um } ⊂ Tp M , prove que existem aplicações contı́nuas v1 , . . . , vm : [a, b] → Rn tais que v1 (a) = u1 , . . . , vm (a) = um e, para cada t ∈ [a, b], {v1 (t), . . . , vm (t)} é uma base ortonormal em Tλ(t) M . 3. Dado um caminho λ : [a, b] → M na superfı́cie M ⊂ Rm+n , seja {u1 , . . . , un } ⊂ Tp M ⊥ , com p = λ(a), uma base ortonormal do complemento ortogonal de Tp M em Rm+n . Prove que existem v1 , . . . , vn : [a, b] → Rm+n contı́nuas, tais que, para todo t ∈ [a, b], {v1 (t), . . . , vn (t)} é uma base ortonormal de [Tλ(t) M ]⊥ . 4. Use o Exercı́cio 2 e indução para provar que, dadas duas bases ortonormais {u1 , . . . , un } e {w1 , . . . , wn } em Rn , se as matrizes n × n cujas colunas são esses vetores têm determinantes de mesmo sinal, então existem n aplicações contı́nuas v1 , . . . , vn : [0, 2] → Rn tais que vi (0) = ui , vi (2) = wi (i = 1, 2, . . . , n) e, para cada t ∈ [0, 2], {v1 (t), . . . , vn (t)} ⊂ Rn é uma base ortonormal. Conclua daı́ que o conjunto SO(Rn ) das matrizes ortogonais n × n com determinante igual a 1 é conexo. Seção 4. Superfı́cies orientáveis 1. Sejam ϕ : U0 → U , ψ : V0 → V , ξ : W0 → W parametrizações na superfı́cie M . Suponha que M = U ∪ V ∪ W , que U ∩ V ∩ W 6= ∅ e que o determinante Seção 7 Exercı́cios 147 jacobiano de cada uma das mudanças de coordenadas ψ −1 ◦ ϕ, ξ −1 ◦ ϕ e ξ −1 ◦ ψ tem sinal constante. Prove que M é orientável. 2. Use o exercı́cio anterior para provar que o conjunto M das matrizes 3 × 3 de posto 1 é uma superfı́cie orientável de dimensão 5 em R9 . 3. Prove que o fibrado tangente T M e o fibrado normal νM de qualquer superfı́cie são sempre orientáveis. (V. Exercı́cios 2 e 3, Seção 2.) 4. Seja f : R3 → R4 definida por f (x, y, z) = (x2 − y 2 , xy, xz, yz). Prove que P = f (S 2 ) é uma superfı́cie C ∞ de dimensão 2, compacta e não-orientável em R4 . (P é conhecida como o plano projetivo.) Seção 6. Aplicações diferenciáveis entre superfı́cies 1. Prove que o homeomorfismo h : S 1 × R → R2 − {0}, dado por h(z, t) = et · z, é um difeomorfismo. 2. Use o difeomorfismo do exercı́cio anterior para provar que o toro n-dimensional T = S 1 × · · · × S 1 = (S 1 )n é difeomorfo a uma hiperfı́cie em Rn+1 . 3. Seja f : M → N um difeomorfismo local. Se N é orientável, prove que M também é. 2 2 4. Sejam G ⊂ Rm e H ⊂ Rn superfı́cies que são grupos em relação à multiplicação de matrizes. Se f : G → H é um homomorfismo diferenciável, prove que o posto da derivada f ′ (x) : Tx G → Tf (x) H não depende do ponto x ∈ G. 8 Integrais Múltiplas 1 A definição de integral Um bloco n-dimensional A ⊂ Rn é um produto cartesiano A= n Y [ai , bi ] = [a1 , b1 ] × · · · × [an , bn ] i=1 de n intervalos compactos [ai , bi ], chamados suas arestas. O produto n Q (ai , bi ) dos intervalos abertos (ai , bi ) chama-se bloco ncartesiano i=1 dimensional aberto. Quando todas as arestas do bloco A têm o mesmo comprimento a = bi −ai , diz-se que A é um cubo n-dimensional . Quando n = 1, os blocos são simplesmente intervalos. Se n = 2, o bloco reduz-se a um retângulo e o cubo a um quadrado. n Q Q Li Uma face do bloco A = [ai , bi ] é um conjunto do tipo F = i=1 onde, para cada i = 1, . . . , n, tem-se Li = {ai }, Li = {bi } ou Li = [ai , bi ]. Diz-se que a face F tem dimensão r quando exatamente r dos fatores Li são iguais a [ai , bi ]. As faces de dimensão zero, isto é, os pontos da forma v = (c1 , . . . , cn ), onde ci = ai ou ci = bi para cada i = 1, . . . , n, são chamadas os vértices do bloco. n Q [ai , bi ] é, por definição, o O volume n-dimensional do bloco A = produto n Q i=1 i=1 (bi − ai ) dos comprimentos de suas arestas. Este é também o volume do bloco aberto n Q i=1 (ai , bi ). Seção 1 A definição de integral Uma partição do bloco A = n Q 149 [ai , bi ] é um produto cartesiano i=1 P = P1 × · · · × Pn , onde cada Pi é uma partição do intervalo [ai , bi ] (cfr. Vol. 1, Cap. 10, §2). Diz-se que a partição Q = Q1 × · · · × Qn refina a partição P quando se tem P ⊂ Q. Isto equivale a dizer que P1 ⊂ Q1 , . . . , Pn ⊂ Qn . A partição P decompõe o bloco A numa reunião de sub-blocos B = I1 × · · · × In , onde cada Ij é um intervalo da partição Pj de [aj , bj ]. Estes sub-blocos B ⊂ A chamam-se os blocos da partição P . Escreve-se então B ∈ P . Se a partição Q refina P então cada bloco de P é a reunião dos blocos de Q nele contidos. Se B, B ′ são blocos da partição P , a interseção B ∩ B ′ é uma face comum a B e B ′ ou é vazia. Dada a partição P = P1 × · · · × Pn do bloco A, como o comprimento bi − ai de cada aresta de A é a soma dos comprimentos dos intervalos da partição Pi , segue-se da propriedade distributiva da multiplicação que o volume do bloco A é a soma dos volumes dos blocos B da partição P . Logo, quando Q refina P , o volume de cada bloco de P é a soma dos volumes dos blocos de Q nele contidos. Se P = P1 × · · · × Pn e Q = Q1 × · · · × Qn são partições do bloco A, existem partições de A que refinam ao mesmo tempo P e Q. Uma delas n Q (Pi ∪ Qi ). é R = i=1 Seja f : A → R uma função real limitada no bloco n-dimensional A, digamos com m ≤ f (x) ≤ M para todo x ∈ A. Dada uma partição P do bloco A, para cada bloco B ∈ P , indiquemos com mB o ı́nfimo e com MB o supremo dos valores f (x) quando x varia em B. Definimos então a soma inferior s(f ; P ) e a soma superior S(f ; P ) da função f relativamente à partição P pondo X X s(f ; P ) = mB · vol B e S(f ; P ) = MB · vol B, B∈P B∈P estas somas estendendo-se a todos os blocos B da partição P . Evidentemente mB ≤ MB para todo B ∈ P , logo s(f ; P ) ≤ S(f ; P ). Mais do que isto é verdade: para quaisquer partições P e Q do bloco A, tem-se s(f ; P ) ≤ S(f ; Q). Para comprovar esta afirmação, observamos primeiro que se uma partição P ′ refina a partição P então s(f ; P ) ≤ s(f ; P ′ ) e S(f ; P ′ ) ≤ S(f ; P ). 150 Integrais Múltiplas Cap. 8 Com efeito, se o bloco B ′ da partição P ′ está contido no bloco B da partição P então mB ≤ mB ′ . Lembrando que cada blocoPB ∈ P é vol B ′ , a reunião dos blocos B ′ ∈ P ′ nele contidos, e que vol B = B ′ ⊂B segue-se que s(f ; P ) = X mB · vol B = B∈P ≤ X B ′ ∈P ′ ′ X B∈P X B ′ ⊂B mB · vol B ′ ! mB ′ · vol B = s(f ; P ′ ). Analogamente se vê que S(f ; P ′ ) ≤ S(f ; P ) quando P ′ refina P . Assim, quando se refina uma partição, a soma inferior não diminui e a soma superior não aumenta. Sejam P e Q duas partições quaisquer do bloco A. Tomemos uma partição R de A que refine P e Q simultaneamente. Temos: s(f ; P ) ≤ s(f ; R) ≤ S(f ; R) ≤ S(f ; Q), mostrando portanto que s(f ; P ) ≤ S(f ; Q), ou seja, toda soma inferior de f é menor do que ou igual a qualquer soma superior. R Definimos a seguir a integral inferior f (x)dx e a integral superior R− −A A f (x)dx Z −A da função limitada f : A → R, pondo f (x)dx = sup s(f ; P ) e P Z− f (x)dx = inf S(f ; P ), A P o supremo e o ı́nfimo acima sendo tomados em relação a todas as partições P do bloco A. A desigualdade s(f ; P ) ≤ S(f ; Q) implica que m · vol A ≤ Z −A f (x)dx ≤ se m ≤ f (x) ≤ M para todo x ∈ A. Z− A f (x)dx ≤ M · vol A Seção 1 A definição de integral 151 Diz-se que a função limitada f : A → R é integrável no bloco ndimensional A quando suas integrais inferior e superior coincidem. Escreve-se então Z A f (x)dx = Z −A f (x)dx = Z− f (x)dx A e este número é chamado a integral de f no bloco A. No caso n = 1, o bloco n-dimensional A reduz-se a um segmento de reta e a definição de integral acima dada coincide com aquela apresentada no Capı́tulo 10 do Volume 1. Dada a função f : A → R, limitada no bloco A ⊂ Rn , o conjunto σ das somas inferiores e o conjunto Σ das somas superiores de f relativamente às partições P de A são subconjuntos do intervalo [m · vol A, M · vol A], onde m ≤ f (x) ≤ M para todo x ∈ A. Sabemos que, para quaisquer s ∈ σ e S ∈ Σ, tem-se s ≤ S. A fim de que seja sup σ = inf Σ, isto é, que f seja integrável, é necessário e suficiente que, dado arbitrariamente ε > 0, existam s ∈ σ e S ∈ Σ tais que S − s < ε. Mais explicitamente: f é integrável se, e somente se, para todo ε > 0 dado, existem partições R e Q de A tais que S(f ; R) − s(f ; Q) < ε. Esta condição pode ser aperfeiçoada assim: Teorema 1 (Condição imediata de integrabilidade). A fim de que a função limitada f : A → R seja integrável no bloco A ⊂ Rn é necessário e suficiente que, para todo ε > 0 dado, exista uma partição P de A tal que S(f ; P ) − s(f ; P ) < ε. Demonstração. A suficiência é óbvia pois a condição acima claramente assegura que sup σ = inf Σ. Quanto à necessidade, supondo f integrável, ou seja, admitindo que sup σ = inf Σ, dado ε > 0, existem partições Q e R do bloco A tais que S(f ; R) − s(f ; Q) < ε. Seja P uma partição de A que refine Q e R ao mesmo tempo. Então s(f ; Q) ≤ s(f ; P ) ≤ S(f ; P ) ≤ S(f ; R), portanto S(f ; P ) − s(f ; P ) ≤ S(f ; R) − s(f ; Q) < ε. Para todo subconjunto X ⊂ A, sejam MX o supremo e mX o ı́nfimo dos valores f (x), com x ∈ X. Escreveremos ωX = MX − mX e chamaremos ωX de oscilação de f no conjunto X. Às vezes, quando houver necessidade, usaremos a notação mais precisa ω(f ; X) = MX − mX em vez de ωX . 152 Integrais Múltiplas Cap. 8 Para toda partição P do bloco A, temos X X S(f ; P ) − s(f ; P ) = (MB − mB ) vol B = ωB · vol B. B∈P B∈P Portanto f : A → R é integrável se, e somente se, para todo ε > 0 dado, existe uma partição P de A tal que X ωB · vol B < ε. B∈P Uma conseqüência imediata desta observação é que toda função contı́nua f : A → R é integrável. Com efeito, sendo o bloco A um conjunto compacto, a função contı́nua f é uniformemente contı́nua. Portanto, dado qualquer ε > 0, existe δ > 0 tal que x, y ∈ A, |x − y| < δ ⇒ |f (x) − f (y)| < ε/ vol A. Se tomarmos, em cada aresta [ai , bi ] do bloco A = Π[ai , bi ], uma partição Pi cujos intervalos tenham todos comprimento < δ, e adotarmos em Rn a norma do máximo, então todos os blocos da partição P = P1 × · · · × Pn de A terão diâmetro menor do que δ. A função f sendo contı́nua, em cada bloco B da partição P existem pontos a, b tais que mB = f (a) e MB = f (b), pois B é compacto. Então ωB = MB − mB = f (b) − f (a) < ε/ vol A e daı́ X X ε ε ωB · vol B < · vol B = · vol A = ε. vol A vol A B∈P B∈P Assim f é integrável. O fato de que toda função contı́nua f : A → R é integrável é muito importante mas não é suficiente para nossos propósitos. A fim de definir a integral de funções cujos domı́nios são mais gerais do que blocos, precisamos integrar alguns tipos de funções descontı́nuas. Isto nos leva ao critério de integrabilidade de Lebesgue, o qual se baseia na noção de conjunto de medida nula, que abordaremos no parágrafo seguinte. 2 Conjuntos de medida nula Diz-se que o conjunto X ⊂ Rn tem medida n-dimensional nula (segundo Lebesgue), e escreve-se med.X = 0, quando, para todo ε > 0 dado, é possı́vel obter uma cobertura enumerável X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por ∞ P vol Bk < ε. meio de blocos abertos Bk ⊂ Rn tais que k=1 Seção 2 Conjuntos de medida nula 153 Evidentemente, se med.X = 0 e Y ⊂ X então med.Y = 0. Teorema 2. Uma reunião enumerável de conjuntos de medida nula é ainda um conjunto de medida nula. Demonstração. Sejam X1 , . . . , Xk , . . . subconjuntos de Rn com ∞ S Xk med.Xk = 0 para todo k ∈ N. A fim de provar que X = k=1 tem medida nula, seja dado ε > 0. Para cada k ∈ N podemos obter ∞ S Bki e uma seqüência de blocos Bk1 , Bk2 , . . . , Bki , . . . tais que Xk ⊂ ∞ P i=1 vol Bki < ε/2k . Então X está contido na reunião (enumerável) de i=1 todos os Bki . Dado qualquer subconjunto finito F ⊂ N×N, existe j ∈ N tal que (k, i) ∈ F ⇒ k ≤ j e i ≤ j. Logo " j # j j X X X X ε/2k < ε. vol Bki ≤ vol Bki < (k,i)∈F k=1 i=1 k=1 Portanto,Pseja qual for a maneira de enumerar os Bki numa seqüência, vol Bki ≤ ε. Assim, med.X = 0. teremos k,i Corolário 1. Todo conjunto enumerável tem medida nula. Com efeito, todo conjunto enumerável é reunião dos seus pontos, cada um dos quais tem medida nula. A definição de med.X = 0, dada acima com blocos abertos, é conveniente quando se pretende usar o Teorema de Borel-Lebesgue. Noutras ocasiões, pode ser mais adequado empregar blocos fechados. E ainda em certos casos impõe-se o uso de cubos (abertos ou fechados). Essas alternativas são equivalentes, conforme veremos agora. Teorema 3. As seguintes afirmações a respeito de um conjunto X ⊂ Rn são equivalentes: (a) Para todo ε > 0 dado, pode-se obter uma cobertura enumerável X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por meio de blocos abertos Bk ⊂ Rn tais ∞ P vol Bk < ε. que k=1 (b) Vale a afirmação (a), com blocos fechados em vez de abertos. (c) Vale a afirmação (a), com cubos abertos em vez de blocos. (d) Vale a afirmação (a), com cubos fechados em vez de blocos abertos. 154 Integrais Múltiplas Cap. 8 Demonstração. Mostremos, inicialmente, que (a) ⇔ (b). A implicação (a) ⇒ (b) é imediata, pois X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . implica X ⊂ B 1 ∪ · · · ∪ B k ∪ . . . e vol B k = vol Bk , logo Σ vol Bk < ε ⇒ Σ vol B k < ε. Quanto a (b) ⇒ (a): dado ε > 0, (b) nos autoriza a obter uma cobertura X ⊂ D1 ∪ · · · ∪ Dk ∪ . . . por meio de blocos fechados Dk n Q [aki , bki ] com Σ vol Dk < ε/2. Ora, para cada k ∈ N, o bloco Dk = está contido no bloco aberto Ak = n Q i=1 i=1 (aki − δ, bki + δ) onde δ > 0 pode ser escolhido de modo que vol Ak − vol Dk < ε/2k+1 . (Basta notar que n Q (bki − aki + 2δ) é uma função contı́nua de δ, igual a vol Dk vol Ak = i=1 quando δ = 0.) Então X ⊂ A1 ∪ · · · ∪ Ak ∪ . . . , com ∞ X k=1 vol Ak < ∞ X k=1 vol Dk + ∞ X k=1 ε 2k+1 < ε ε + = ε. 2 2 A equivalência (c) ⇔ (d) se prova exatamente do mesmo modo, bastando observar que, no argumento acima, se Dk é um cubo então Ak também é. Resta portanto, provar que (a) ⇔ (c) ou, o que dá no mesmo, que (b) ⇔ (d). Ora, é óbvio que (d) ⇒ (b). Para demonstrar a implicação (b) ⇒ (d), começamos provando que, dados um bloco B e um número δ > 0, existe um bloco C que é uma reunião finita de cubos, contém B e, além disso, vol C − vol B < δ. Isto é imediato quando as arestas do bloco B = Π[ai , bi ] têm medidas racionais bi − ai = pi /qi . Neste caso, o próprio bloco B é uma reunião finita de cubos: basta considerar o mı́nimo múltiplo comum m dos denominadores qi e tomar em mpi cada aresta [ai , bi ] de B a partição Pi com intervalos, todos de qi comprimento 1/m. Os blocos da partição P = P1 × · · · × Pn do bloco B são cubos de arestas medindo 1/m e B é a reunião deles. No caso geral, observamos que, para i = 1, . . . , m, existem números positivos ηi tão pequenos quanto se queira, tais que bi − ai + ηi é racional. Então o bloco n Q [ai , bi + ηi ] tem arestas com medidas racionais, logo é reunião C = i=1 finita de cubos. Além disso, C contém B e a diferença vol C − vol B = Π(bi − ai + ηi ) − Π(bi − ai ) pode ser tornada tão pequena quanto se deseje, desde que os ηi sejam suficientemente pequenos. Para completar a prova de que (b) ⇒ (d), seja dado ε > 0. Por Seção 2 Conjuntos de medida nula 155 (b), existe uma cobertura X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por blocos Bk tais ∞ P vol Bk < ε/2. Como acabamos de ver, cada Bk está contido que k=1 numa reunião finita de cubos cuja soma dos volumes é menor do que vol Bk + ε/2k+1 . Numerando consecutivamente esses cubos para k = 1, 2, . . . , chegamos a uma cobertura S ⊂ C1 ∪ · · · ∪ Cr ∪ . . . , onde os cubos Cr são tais que ∞ X vol Cr < r=1 ∞ X vol Bk + ∞ X k=1 k=1 ε 2k+1 < ε ε + = ε. 2 2 Isto completa a demonstração do teorema. Teorema 4. Seja f : X → Rn uma aplicação lipschitziana no conjunto X ⊂ Rn . Se medX = 0 então medf (X) = 0. Demonstração. Adotemos em Rn a norma do máximo. Seja c > 0 tal que |f (x)−f (y)| ≤ c|x−y| para quaisquer x, y ∈ X. Dado arbitrariamente ε > 0, existe uma cobertura X ⊂ C1 ∪· · ·∪Ck ∪. . . onde cada ∞ ∞ P P (ak )n < ε/cn . vol Ck = Ck é um cubo cuja aresta mede ak , com k=1 k=1 Se x, y ∈ Ck ∩X então |x−y| ≤ ak , logo |f (x)−f (y)| ≤ c·ak . Isto significa que, para todo i = 1, . . . , n, as i-ésimas coordenadas de f (x) e f (y) pertencem a um intervalo Ji de comprimento c · ak . Portanto f (Ck ∩ X) n Q Ji = Ck′ , de aresta c·ak , logo vol Ck′ = cn ·(ak )n . está contido no cubo i=1 ∞ S Segue-se que f (X) = k=1 ∞ X k=1 f (Ck ∩ X) ⊂ C1′ ∪ · · · ∪ Ck′ ∪ . . . , onde vol Ck′ = cn · ∞ X k=1 (ak )n < cn · ε = ε. cn Logo medf (X) = 0. A aplicação mais freqüente do Teorema 4 ocorre quando f : U → Rn é diferenciável, com derivada limitada no aberto convexo U ⊂ Rn . Se |f ′ (x)| ≤ c para todo x ∈ U então a Desigualdade do Valor Médio nos dá |f (x) − f (y)| ≤ c · |x − y| para quaisquer x, y ∈ U , logo f transforma todo conjunto de medida nula X ⊂ U num conjunto de medida nula f (X) ⊂ Rn . A fim de estender este resultado para funções de classe C 1 em abertos não necessariamente convexos, com derivada limitada ou não, será necessário usar o 156 Integrais Múltiplas Cap. 8 Teorema 5 (Lindelöf ). Toda cobertura aberta X ⊂ S Uλ de um λ∈L conjunto arbitrário X ⊂ Rn admite uma subcobertura enumerável X ⊂ Uλ1 ∪ · · · ∪ Uλk ∪ . . . . Demonstração. Seja B o conjunto dos blocos abertos em Rn cujos vértices têm coordenadas racionais e cada um deles está contido em algum aberto Uλ da cobertura dada. O conjunto B é enumerável, logo podemos escrever B = {B1 , B2 , . . . , Bk , . . . }. Para cada k ∈ N, esco∞ S Uλk = lhamos um ı́ndice λk ∈ L tal que Bk ⊂ Uλk . Afirmamos que k=1 S Uλ . Com efeito, se x ∈ Uλ então, como Uλ é aberto, existe uma λ∈L bola aberta de centro x, contida em Uλ . Se tomarmos em Rn a norma do máximo, essa bola é um cubo, cuja aresta podemos supor racional, logo é um Bk . Assim, x ∈ Bk ⊂ Uλk , portanto todo Uλ , λ ∈ L, está ∞ S S S Uλ . Uλk ⊂ Uλ ⊂ contido na reunião dos Uλk , k ∈ N, ou seja Segue-se que X ⊂ Uλ1 ∪ · · · ∪ Uλk ∪ . . . . λ∈L k=1 λ∈L Teorema 6. Seja f : U → Rn uma aplicação de classe C 1 no aberto U ⊂ Rn . Se X ⊂ U tem medida nula então f (X) ⊂ Rn também tem medida nula. Demonstração. Para cada x ∈ X existe um aberto convexo Ux , com x ∈ Ux ⊂ U , tal que f tem derivada limitada S em Ux , logo f (X ∩Ux ) tem medida nula. A cobertura aberta X ⊂ Ux admite uma subcobertura x∈X ∞ S Uk . Como f (X ∩ Uk ) tem medida nula para cada ∞ ∞ S S f (X ∩ Uk ) tem k ∈ N, segue-se que f (X) = f (X ∩ Uk ) = enumerável X ⊂ medida nula. k=1 k=1 k=1 Corolário 2. Seja f : U → Rn uma aplicação de classe C 1 no aberto U ⊂ Rm . Se m < n então f (U ) ⊂ Rn tem medida nula. Com efeito, se considerarmos Rm como o conjunto dos pontos de n R cujas últimas n − m coordenadas são nulas, veremos que todo bloco m-dimensional B ⊂ Rm ⊂ Rn tem volume n-dimensional nulo, pois podemos cobrir B com um único bloco n-dimensional D = B × [0, η]n−m , cujo volume n-dimensional pode ser tomado tão pequeno quanto se deseje. Daı́ resulta que Rm , visto como subconjunto de Rn , tem medida n-dimensional nula, pois é reunião enumerável de blocos m-dimensionais. Seção 2 Conjuntos de medida nula 157 Em particular, o conjunto U ⊂ Rm tem medida n-dimensional nula. Isto posto, a partir da aplicação f : U → Rn , definamos F : U × Rn−m → Rn pondo F (x, y) = f (x). O conjunto U × 0 ⊂ U × Rn−m tem medida n-dimensional nula, logo med.F (U × 0) = 0, pelo Teorema 6. Mas F (U × 0) = f (U ), o que prova o corolário. Corolário 3. Seja M ⊂ Rn uma superfı́cie m-dimensional de classe C 1 . Se m < n então M tem medida n-dimensional nula. Com efeito, para todo x ∈ M existe um aberto Ux em Rn tal que Vx = Ux ∩ M é uma vizinhança parametrizada de x,Slogo um conjunto de medida nula em Rn . A cobertura aberta M ⊂ Ux admite, por Lindelöf, uma subcobertura enumerável M ⊂ ∞ S x∈M Uk , logo M = k=1 ∞ S k=1 (Uk ∩ M ) é reunião enumerável de conjuntos Vk = Uk ∩ M , de medida nula. Assim, med.M = 0. O teorema seguinte, devido a H. Lebesgue, estabelece o critério geral de integrabilidade em termos da noção de conjunto de medida nula. Em sua demonstração, faremos uso do conceito de oscilação de uma função num ponto, que introduziremos agora. Seja f : X → R uma função limitada no conjunto X ⊂ Rn . Fixemos x ∈ X e, para cada δ > 0, ponhamos Ω(δ) = ω(f ; X ∩ B(x; δ)) = oscilação de f no conjunto dos pontos de X que distam menos de δ do ponto x. Fica assim definida uma função não-negativa Ω : (0, +∞) → R, a qual é limitada pois f também é. Além disso, Ω é não-decrescente. Logo existe o limite ω(f ; x) = lim Ω(δ) = lim ω(f ; X ∩ B(x; δ)) = inf ω(f ; X ∩ B(x; δ)), δ→0 δ→0 δ>0 que chamaremos a oscilação da função f no ponto x. Tem-se ω(f ; x) = 0 se, e somente se, f é contı́nua no ponto x. É claro que se x ∈ int.Y e Y ⊂ X então ω(f ; x) ≤ ω(f ; Y ). Teorema 7 (Lebesgue). A função f : A → R, limitada no bloco A ⊂ Rn , é integrável se, e somente se, o conjunto Df dos seus pontos de descontinuidade tem medida nula. Demonstração. Suponhamos inicialmente que med.Df = 0. Dado ′ arbitrariamente ε > 0, seja Df ⊂ C1′ ∪ · · · ∪ CP k ∪ · · · uma cobertura enumerável de Df por blocos abertos tais que vol Ck′ < ε/2K, onde K = M −m é a diferença entre o sup e o inf de f em A. Para cada ponto 158 Integrais Múltiplas Cap. 8 x ∈ A − Df seja Cx′′ um bloco aberto contendo x, tal que a oscilação de f no fecho de Cx′′ ∩ A seja inferior a ε/(2 · vol A). Sendo A compacto, a cobertura aberta A ⊂ (∪Ck′ ) ∪ (∪Cx′′ ) admite uma subcobertura finita A ⊂ C1′ ∪ · · · ∪ Cr′ ∪ C1′′ ∪ · · · ∪ Cs′′ . Seja P uma partição de A tal que cada bloco aberto B ∈ P esteja contido n Q [ai , bi ] então podemos tomar num dos blocos Ck′ ou num Cj′′ . (Se A = i=1 P = P1 × · · · × Pn onde, para cada i = 1, . . . , n, Pi é formada pelos pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Ck′ ou Cj′′ que pertençam ao intervalo [ai , bi ].) Os blocos de P contidos em algum Ck′ serão genericamente designados por B ′ e os demais blocos de P (necessariamente contidos em algum Cj′′ ) serão chamados B ′′ . A soma dos volumes dos B ′ é menor do que ε/2K e, em cada bloco B ′′ , a oscilação de f não excede ε/(2 · vol A). Portanto X X X ωB ′′ · vol B ′′ ωB ′ · vol B ′ + ωB · vol B = B∈P B′ X B ′′ X ε vol B ′′ 2 · vol A ε ε <K· + · vol A = ε. 2·K 2 · vol A ≤K· vol B ′ + Segue-se que f é integrável. Reciprocamente, suponhamos f integrável. Para cada k ∈ N, ponhamos Dk = {x ∈ A; ω(f ; x) ≥ 1/k}, logo Df = D1 ∪ · · · ∪ Dk ∪ · · · . Para mostrar que Df tem medida nula, basta provar que med.Dk = 0 para cada k ∈ N. Seja, então, dado P ε > 0. Como f é integrável, existe uma partição P de A tal que ωB · vol B < ε/k. Indiquemos geneB∈P ricamente com B ′ os blocos da partição P que contêm algum ponto de Dk em seu interior. Para cada um desses blocos B ′ , vale ωB ′ ≥ 1/k. Portanto X X ε 1X ωB · vol B < · vol B ′ ≤ ωB ′ · vol B ′ ≤ k k B∈P Multiplicando por k, obtemos Σ vol B ′ < ε. Ora, é claro que Dk ⊂ (∪B ′ ) ∪ X, onde X é a reunião das faces próprias dos blocos B ∈ P nos quais há algum ponto de Dk . Sabemos que med.X = 0. Segue-se daı́ que med.Dk = 0. (Ver Observação a seguir.) Seção 3 Cálculo com integrais 159 Observação: Seja Z ⊂ Rn um conjunto tal que, para todo ε > 0 dado, existem blocos B1 , . . . , Bk , . . . e um conjunto X ⊂ Rn com Z ⊂ (∪Bk ) ∪ X, Σvol Bk < ε e med. X = 0. Então med. Z = 0. Com efeito, tomando blocos C1 , . . . , Ck , . . . com X ⊂ ∪Ck e Σ med. Ck < ε, tem-se Z ⊂ (∪Bk ) ∪ (∪Ck ) onde Σ vol Bk + Σ vol Ck < 2ε. 3 Cálculo com integrais Teorema 8. Sejam f, g : A → R funções integráveis no bloco A ⊂ Rn e c um número real. Então; R R (1) fR + g : A → R é integrável e A [f (x) + g(x)]dx = A f (x)dx + A g(x)dx. R R (2) c · f : A → R é integrável e A c · f (x)dx = c · A f (x)dx. (3) O produto f · g : A → R é uma função integrável. (4) Se |g(x)| ≥ k > 0 para todo x ∈ A então f /g : A → R é integrável. R R (5) Se f (x) ≤ g(x) para todo x ∈ A então A f (x)dx ≤ A g(x)dx. R R (6) |f | : A → R é uma função integrável e | A f (x)dx| ≤ A |f (x)|dx. (7) Se A′ Ré um bloco contido em A e f (x) = 0 para todo x ∈ A − A′ R então A f (x)dx = A′ f (x)dx. Demonstração. A integrabilidade das funções f + g, c · f , f · g, f /g e |f | resulta do Teorema 7, pois Df +g ⊂ Df ∪ Dg , Dc·f = Df (se c 6= 0), Df ·g ⊂ Df ∪ Dg e D|f | ⊂ Df . Além disso, se |g(x)| ≥ k > 0 para todo x ∈ A então f /g : A → R é limitada e, como Df /g ⊂ Df ∪ Dg , o quociente f /g é integrável. As demais afirmações do Teorema 8 se provam exatamente como no caso de funções de uma única variável. (Ver Capı́tulo 10 do Volume 1.) O cálculo efetivo da integral de uma função f : A → R, definida num bloco n-dimensional, se faz integrando f sucessivamente em relação a cada uma das suas n variáveis. Basta aplicar diversas vezes o Teorema 9 abaixo, no qual adotamos as seguintes notações: Dados os blocos A1 ⊂ Rm e A2 ⊂ Rn , os pontos do bloco A1 × A2 ⊂ m+n R escrevem-se como (x, y), com x ∈ A1 e y ∈ A2 . Se f : A1 ×A2 → R 160 Integrais Múltiplas Cap. 8 é integrável, sua integral é indicada com Z f (x, y)dxdy. Para cada A1 ×A2 x ∈ A1 , definiremos a função fx : A2 → R pondo fx (y) = f (x, y) para todo y ∈ A2 , portanto fx é essencialmente a restrição de f ao bloco n-dimensional x × A2 . Mesmo que f seja integrável, pode ocorrer que, para alguns valores de x ∈ A1 , a função fx : A1 → R não o seja. Com efeito, os pontos em que f é descontı́nua formam um conjunto D de medida nula em Rm+n mas pode existir x ∈ A1 tal que D ∩ (x × A2 ) não tenha medida n-dimensional nula. Exemplo 1. Sejam A1 = A2 = [0, 1] e f : [0, 1] × [0, 1] → R dada por f (x, y) = 0 se x 6= 1/2, f (1/2, y) = 0 se y é racional, f (1/2, y) = 1 se y é irracional. O conjunto dos pontos de descontinuidade de f é Df = 1/2 × [0, 1], que tem medida nula em [0, 1] × [0, 1], logo f é integrável. (De fato, sua integral é zero.) Mas f1/2 : [0, 1] → R é a função igual a zero nos pontos racionais e igual a 1 nos irracionais, logo fx : [0, 1] → R não é integrável quando x = 1/2. ⊳ Teorema 9 (Integração repetida). Seja f : A1 × A2 → R integrável no produto dos blocos A1 ⊂ Rm e A2 ⊂ Rn . Para todo x ∈ A1 , seja fx : A2 → R definida por fx (y) = f (x, y). Ponhamos ϕ(x) = Z fx (y)dy e − A2 ψ(x) = Z− fx (y)dy. A2 As funções ϕ, ψ : A1 → R, assim definidas, são integráveis, com Z Z Z ϕ(x)dx = ψ(x)dx = f (x, y)dxdy, A1 A1 isto é: Z A1 ×A2 f (x, y)dxdy = Z A1 A1 ×A2 Z Z fx (y)dy = dx − A2 A1 dx − Z A2 fx (y)dy . Demonstração. As partições do bloco A1 × A2 são da forma P = P1 × P2 , onde P1 e P2 são partições dos blocos A1 e A2 respectivamente. Os blocos de P são os produtos B1 × B2 com B1 ∈ P1 e B2 ∈ P2 . Mostraremos que s(f ; P ) ≤ s(ϕ; P1 ) ≤ S(ϕ; P1 ) ≤ S(f ; P ). Seção 3 Cálculo com integrais Daı́ resultará que ϕ é integrável e que Z ϕ(x)dx = A1 Z 161 f (x, y)dxdy. A1 ×A2 Na verdade, basta provar a primeira das desigualdades acima, pois a segunda é óbvia e a terceira é análoga. Também por analogia, não Z Z precisamos provar que ψ(x)dx = f (x, y)dxdy. A1 A1 ×A2 Começamos lembrando que se X ⊂ Y ⊂ R então inf .Y ≤ inf .X. Segue-se que, para todo bloco B1 × B2 ∈ P , tem-se m(f ; B1 × B2 ) ≤ m(fx ; B2 ), seja qual for x ∈ B1 . Portanto X B2 ∈P2 m(f ; B1 ×B2 )·vol B2 ≤ X B2 ∈P2 m(fx ; B2 )·vol B2 = s(fx ; P2 ) ≤ ϕ(x). Como isto vale para todo x ∈ B1 , concluı́mos que: X B2 ∈P2 m(f ; B1 × B2 ) · vol B2 ≤ m(ϕ; B1 ). Portanto s(f ; P ) = X B1 ×B2 ∈P = X B1 ∈P1 ≤ X B1 ∈P1 m(f ; B1 × B2 ) · vol B1 ·vol B2 X B2 ∈P2 m(f ; B1 × B2 ) · vol B2 · vol B1 m(ϕ; B1 ) · vol B1 = s(ϕ; P1 ). Corolário 4. Seja f : A1 × A2 × A3 → R integrável no produto dos blocos A1 ⊂ Rm , A2 ⊂ Rn e A3 ⊂ Rp . Então Z f (x, y, z)dxdydz = A1 ×A2 ×A3 Z A1 = Z A1 dx Z f (x, y, z)dz dy Z− dy − A2 dx Z Z− A2 − A3 f (x, y, z)dz. A3 162 Integrais Múltiplas Cap. 8 Com efeito, Z f (x, y, z)dxdydz = A1 ×A2 ×A3 Z A1 ×A2 = Z A1 = Z dxdy dx dx A1 Z− Z− A2 dy A2 Z− A3 dy Z− f (x, y, z)dz Z− A3 f (x, y, z)dz f (x, y, z)dz. A3 A seguir, vamos estender o conceito de integral para funções definidas em certos subconjuntos X ⊂ Rn que não são necessariamente blocos ndimensionais. 4 Conjuntos J-mensuráveis Dado o conjunto limitado X ⊂ Rn , seja A um bloco n-dimensional contendo X. A função caracterı́stica de X é a função ξX : A → R, definida por ξX (x) = 1 se x ∈ X e ξX (x) = 0 se x ∈ / X. Se X e Y são subconjuntos do bloco A, as seguintes propriedades da função caracterı́stica são evidentes: 1. ξX∪Y = ξX + ξY − ξX∩Y ; 2. ξX∩Y = ξX · ξY ; 3. Tem-se X ⊂ Y se, e somente se, ξX ≤ ξY ; neste caso, vale ξY −X = ξY − ξX . Segue-se de 1. que ξX∪Y = ξX + ξY quando X e Y são disjuntos. Se X estiver contido no interior de A (o que poderemos supor, sempre que for conveniente) então fr .X é o conjunto dos pontos de descontinuidade da função ξX : A → R. O volume interno e o volume externo do conjunto limitado X ⊂ Rn são definidos, respectivamente, pondo: vol . int .X = Z −A ξX (x)dx e vol .ext.X = Z− ξX (x)dx. A Conjuntos J-mensuráveis Seção 4 163 Quando a função caracterı́stica ξX : A → R é integrável, dizemos que X é J-mensurável (mensurável segundo Jordan) e que seu volume ndimensional é Z ξX (x)dx. vol X = A O item (7) do Teorema 8 assegura que os conceitos acima introduzidos não dependem da escolha do bloco A contendo X. Se X ⊂ A e P é uma partição do bloco A, as somas inferior e superior da função ξX : A → R relativas à partição P são s(ξX ; P ) = soma dos volumes dos blocos de P contidos em X; S(ξX ; P ) = soma dos volumes dos blocos de P que intersectam X. Portanto, se escrevermos v = vol . int .X e V = vol .ext.X, veremos que, para todo ε > 0 dado, existe uma partição P do bloco A (o qual contém X) tal que a soma dos volumes dos blocos de P contidos em X é superior a v − ε e a soma dos volumes dos blocos de P que intersectam X é inferior a V + ε. Teorema 10. (1) O conjunto limitado X ⊂ Rn é J-mensurável se, e somente se, sua fronteira tem medida nula. (2) Se X, Y ⊂ Rn são J-mensuráveis então X ∪ Y , X ∩ Y e X − Y são J-mensuráveis, com e vol(X ∪ Y ) = vol X + vol Y − vol(X ∩ Y ) vol(X − Y ) = vol X − vol Y quando Y ⊂ X. Demonstração. (1) Tomando um bloco n-dimensional A que contenha X em seu interior e considerando a função caracterı́stica ξX : A → R, temos as equivalências: X é J-mensurável ⇔ ξX é integrável ⇔ med. DξX = 0 ⇔ med. fr X=0, pois o conjunto DξX das descontinuidades de ξX coincide com a fronteira de X. (2) Basta observar que ξX∪Y = ξX +ξY −ξX∩Y e que, quando Y ⊂ X, vale ainda ξX−Y = ξX − ξY . Exemplo 2. Todo conjunto limitado X ⊂ Rn , cuja fronteira é uma superfı́cie, ou a reunião de um número finito (ou mesmo enumerável) de superfı́cies de dimensão n−1 é J-mensurável. Isto inclui uma bola fechada 164 Integrais Múltiplas Cap. 8 e a região compreendida entre duas bolas fechadas concêntricas. Resulta ainda do item (1) acima que um bloco n-dimensional é J-mensurável. ⊳ Exemplo 3. Seja X ⊂ R o conjunto formado pelo intervalo [0, 1] mais os números racionais do intervalo [1, 2]. O “volume”externo é 2 mas o interno é 1. Portanto X não é J-mensurável. Tomando o produto cartesiano de n cópias de X, obtém-se um subconjunto limitado de Rn que não é J-mensurável. ⊳ Exemplo 4. Se X ⊂ Rn é J-mensurável e int .X = ∅ então vol .X = 0 pois s(ξX ; P ) = 0 para toda partição P de um bloco que contenha X. Resulta daı́ que se X e Y são conjuntos J-mensuráveis sem pontos interiores em comum então vol(X ∪ Y ) = vol X + vol Y , pois vol(X ∩ Y ) = 0. ⊳ Z f (x)dx de uma função limitada Definiremos agora a integral X f : X → R, cujo domı́nio é um conjunto J-mensurável X ⊂ Rn . Para isto, consideramos um bloco n-dimensional A contendo X em seu interior e a função f¯: A → R, definida por f¯(x) = f (x) se x ∈ X e f (x) = 0 se x ∈ A − X. Pomos então, por definição Z Z f (x)dx = f¯(x)dx −X −A e Z− f (x)dx = X − Z f¯(x)dx. A Diremos que f : X → R é integrável quando tivermos − Z Z f (x)dx = f (x)dx −X X ou seja, quando f¯: A → R for integrável. Se f¯: A → R é descontı́nua num ponto x ∈ A, ou f é descontı́nua no ponto x ou x pertence à fronteira de X. Noutros termos, Df¯ ⊂ Df ∪fr .X. Como fr .X tem medida nula e Df ⊂ Df¯, segue-se que f é integrável (ou seja, f¯ é integrável) se, e somente se o conjunto Df dos seus pontos de descontinuidade tem medida nula. Z f (x)dx as mesmas regras Valem, evidentemente, para a integral X operatórias estabelecidas no Teorema 8 para o caso em que X é um bloco retangular. Seção 5 A integral como limite de somas de Riemann 165 Exemplo 5. É claro que um conjunto de volume zero tem medida nula. Se o conjunto dado é J-mensurável, vale a recı́proca (em virtude do Exemplo 4) pois medida nula implica interior vazio. A hipótese de J-mensurabilidade não pode ser omitida pois o conjunto enumerável Q∩[0, 1] tem medida nula mas seu “volume” externo é igual a 1 enquanto o interno é igual a zero. Observação: O item (1) do Teorema 10 pode ser tornado mais preciso: a fronteira de um conjunto J-mensurável tem volume zero. Com efeito, todo conjunto limitado tem fronteira compacta e vale o seguinte Complemento ao Teorema 10. Se X ⊂ Rn é compacto e med.X = 0 então vol X = 0. Demonstração: Seja dado ε > 0. Como são abertos os blocos que ocorrem na definição de med.X = 0, segue-se do Teorema de BorelLebesgue que existem blocos abertos B1 , . . . , Bk tais que X ⊂ B1 ∪ · · · ∪ k P vol Bj < ε. Para cada i = 1, . . . , k, as i-ésimas coordenadas Bk e j=1 dos vértices desses blocos formam um conjunto Pi , cujo menor elemento chamaremos de ai e, o maior, de bi . Cada Pi é, portanto, uma partição do intervalo [ai , bi ] e o conjunto Pn = P1 × · · · × Pn é uma partição do n Q [ai , bi ]. Temos X ⊂ A e o fecho B j de cada um dos blocos bloco A = i=1 iniciais é a reunião dos blocos B ′ ∈ P nele contidos. Segue-se daı́ que se um bloco B ′ ∈ P contém algum ponto de X então B ′ está contido num B j . Assim, a soma dos volumes dos blocos B ′ da partição P que intersectam X é menor do que ou igual à soma dos volume dos Bj , logo é menor do que ε. Portanto vol X = 0. 5 A integral como limite de somas de Riemann Mostraremos agora (veja o Teorema 12) que a integral Z X f (x)dx é o número real cujos valores aproximados são as “somas de Riemann” Σf (ξi ) vol Xi , obtidas quando se faz uma decomposição do tipo X = X1 ∪ · · · ∪ Xk , onde os Xi são conjuntos J-mensuráveis, tais que o interior de cada Xi é disjunto dos demais Xj , tomando-se arbitrariamente ξi ∈ Xi para cada i = 1, . . . , k. Esta é a forma mais comum, e a mais intuitiva, de se pensar na integral. Passemos às definições precisas. 166 Integrais Múltiplas Cap. 8 Seja X ⊂ Rn um conjunto J-mensurável. Diz-se que D = (X1 ,. . . ,Xk ) é uma decomposição de X quando os conjuntos X1 , . . . , Xk são J-mensuráveis, tais que o interior de cada Xi é disjunto dos demais Xj (isto é, Xi ∩Xj ⊂ fr .Xi ∩fr .Xj quando i 6= j), com X = X1 ∪· · ·∪Xk . A norma da decomposição D é o número |D| = max.diam.Xi = maior diâmetro dos conjuntos X1 , . . . , Xk . Por exemplo, se X ⊂ Rn é um bloco n-dimensional, toda partição P determina uma decomposição X = B1 ∪ · · · ∪ Bk , onde os Bi são os blocos da partição P . Seja f : X → R uma função limitada no conjunto J-mensurável X ⊂ Rn . Dada a decomposição D = (X1 , . . . , Xk ) de X escreveremos, para cada i = 1, . . . , k, mi = inf .{f (x); x ∈ Xi } e Mi = sup .{f (x); x ∈ Xi }. Definiremos então a soma inferior s(f ; D) e a soma superior S(f ; D) pondo s(f ; D) = k X i=1 mi · vol Xi e S(f ; D) = k X i=1 Mi · vol Xi . Diz-se que o número real J é o limite de S(f ; D) quando |D| tende a zero, e escreve-se J = lim S(f ; D) |D|→0 para significar que, para todo ε > 0 dado, existe δ > 0 tal que |D| < δ ⇒ |J − S(f ; D)| < ε. Analogamente se define o significado da afirmação I = lim s(f ; D). |D|→0 Teorema 11. Para toda função f : X → R, limitada no conjunto J-mensurável X ⊂ Rn , tem-se Z −X f (x)dx = lim s(f ; D) |D|→0 e − Z X f (x)dx = lim S(f ; D). |D|→0 Na demonstração do Teorema 11 usaremos o lema abaixo, cujo enunciado contém a desigualdade d(Xi , Y ) < δ. Se A e B são subconjuntos não-vazios de Rn , costuma-se escrever d(A, B) = inf .{|x − y|; x ∈ A, y ∈ B}. Por conseguinte, a desigualdade d(A, B) < δ significa que existem x ∈ A e y ∈ B com |x − y| < δ. Seção 5 A integral como limite de somas de Riemann 167 Lema 1. Sejam Y ⊂ X ⊂ Rn J-mensuráveis, com vol Y = 0. Para todo ε > 0 dado, existe δ > 0 tal que, se D é uma decomposição de X com |D| < δ então a soma dos volumes dos conjuntos Xi ∈ D tais que d(Xi , Y ) < δ é menor do que ε. Demonstração. Dado ε > 0, podemos cobrir Y com uma coleção finita de blocos B cuja soma dos volumes é < ε. Tomando arbitrariamente δ > 0, ponhamos cada um desses blocos B = Π[ai , bi ] dentro do bloco B ′ = Π[ai − 2δ, bi + 2δ]. Como lim vol B ′ = vol B, existe δ > 0 tal que a δ→0 soma dos volumes dos blocos B ′ é ainda menor do que ε. Usando a norma do máximo, podemos assegurar que se Z é um conjunto de diâmetro < δ tal que d(Z, B) < δ então Z ⊂ B ′ . Portanto, se D = (X1 , . . . , Xk ) é uma decomposição de X com |D| < δ, vemos que d(Xi , Y ) < δ ⇒ d(Xi , B) < δ para algum B ⇒ Xi ⊂ B ′ . Assim, a soma dos volumes dos conjuntos Xi ∈ D tais que d(Xi , Y ) < δ não excede a soma dos volumes dos blocos B ′ , logo é menor do que ε. Demonstração do Teorema 11. Basta provar a segunda afirmação. Sem perda de generalidade, podemos admitir que 0 ≤ f (x) ≤ K para todo x ∈ X. Com efeito, se somarmos uma constante c à função f , tanto a integral superior como o limite acima serão aumentados de c · vol X. Seja f¯: A → R a extensão de f a um bloco n-dimensional A ⊃ X, com f¯(x) = 0 se x ∈ A − X. Dado ε > 0, queremos achar δ > 0 tal que R− |S(f ; D)− X f (x)dx| < ε para toda decomposição D de X com |D| < δ. Ora, dado ε > 0, existe uma partição P0 de A tal que S(f¯; P0 ) < Z− f (x)dx + ε/2. X Seja Y a reunião das faces próprias dos blocos de P0 . Como vol Y = 0, o Lema 1 assegura a existência de δ > 0 tal que, para toda decomposição D de X com |D| < δ, a soma dos volumes dos conjuntos Xi ∈ D com d(Xi , Y ) < δ é menor do que ε/2K. Seja então D uma decomposição de X com norma |D| < δ. Chamemos de Xα os conjuntos de D tais que d(Xα , Y ) < δ. Os demais conjuntos de D serão chamados de Xβ . Notemos que cada Xβ deve estar contido em algum bloco da partição P0 pois, do contrário, existiriam 168 Integrais Múltiplas Cap. 8 x, y ∈ Xβ em blocos distintos de P0 , logo o segmento de reta [x, y] conteria algum ponto de Y . Como |x − y| < δ, isto daria d(Xβ , Y ) < δ um absurdo. Escrevendo Mα = sup{f (x); x ∈ Xα } e Mβ = sup{f (x); x ∈ Xβ }, vem X X S(f ; D) = Mα · vol Xα + Mβ · vol Xβ , onde X X Mα · vol Xα ≤ K · vol Xα < ε/2 e X X X X Mβ · vol Xβ = Mβ · vol Xβ ≤ MB · vol B B∈P0 Xβ ⊂B = S(f¯; P0 ) < B∈P0 Z− f (x)dx + ε/2. X Assim |D| < δ ⇒ S(f ; D) < R− X f (x)dx R− + ε. Mostraremos agora que S(f ; D) ≥ X f (x)dx para toda decomposição D de X. Com efeito, seja Z a reunião das fronteiras dos conjuntos Xi da decomposição D. Como vol Z = 0, o Lema nos dá δ ′ > 0 tal que, para toda partição P do bloco A com |P | < δ ′ , a soma dos volumes dos blocos de P que intersectam Z é menor do que ε/K. Tomando |P | < δ ′ , temos X X S(f¯; P ) = MB · vol B + MC · vol C, onde chamamos de B os blocos de P que intersectam Z e de C os que estão contidos no interior de algum Xi ∈ D. (Observe que, pelo Teorema da Alfândega, um bloco que não esteja contido no interior de algum Xi deve intersectar Z, pois todo bloco é conexo.) Ora, temos X X MB · vol B ≤ K · vol B < ε e X X X X X MC · vol C ≤ vol C MC · vol C = Mi i ≤ X i C⊂Xi i C⊂Xi Mi · vol Xi = S(f ; D). Vemos assim que, para toda decomposição D do conjunto X ⊂ A e todo ε > 0, pode-se achar uma partição P de bloco A tal que S(f ; P ) ≤ Seção 5 A integral como limite de somas de Riemann S(f ; D)+ε. Sendo segue-se que Z− X Z− 169 f (x)dx o ı́nfimo do conjunto das somas S(f ; P ), X f (x)dx ≤ S(f ; D) + ε. Como ε > 0 é arbitrário, concluı́mos que − Z X f (x)dx ≤ S(f ; D) para toda decomposição de X. Isto conclui a demonstração. Corolário 5 (da demonstração). Para toda função limitada f : X → R no conjunto J-mensurável X ⊂ Rn , tem-se Z −X Z− f (x)dx = sup s(f.D) e D f (x)dx = inf S(f ; D), X D onde o inf e o sup acima se referem a todas as decomposições D de X. Uma decomposição pontilhada do conjunto J-mensurável X ⊂ Rn é um par D∗ = (D, ξ), onde D = (X1 , . . . , Xk ) é uma decomposição de X e ξ = (ξ1 , . . . , ξk ), com ξ1 ∈ X1 , . . . , ξk ∈ Xk . Em termos menos formais, pontilhar a decomposição D = (X1 , . . . , Xk ) é escolher um ponto ξi em cada conjunto Xi , i = 1, . . . , k. A toda partição pontilhada D∗ fica associada a soma de Riemann Σ(f ; D∗ ), definida por k X X f (ξi ) · vol Xi . (f ; D∗ ) = i=1 Diz-se que o número I é o limite das somas de Riemann Σ(f ; D∗ ) quando a norma |D| tende a zero, e escreve-se X I = lim (f ; D∗ ), |D|→0 quando, para todo ε > 0 dado, pode-se obter δ > 0 tal que, para toda decomposição D do conjunto X com norma |D| < δ tem-se |Σ(f ; D∗ ) − I| < ε, seja qual for a maneira D∗ de se pontilhar D. Teorema 12. Se f : X → R é integrável no conjunto J-mensurável X ⊂ Rn então Z f (x)dx = lim Σ(f ; D∗ ). X |D|→0 170 Integrais Múltiplas Cap. 8 Demonstração. Para toda decomposição D de X tem-se X s(f ; D) ≤ (f ; D∗ ) ≤ S(f ; D), seja qual for o modo D∗ de pontilhar D. Pelo Teorema 11, temos Z f (x)dx. lim S(f ; D) = lim s(f ; D) = |D|→0 |D|→0 X Z ∗ f (x)dx. Segue-se imediatamente que lim Σ(f ; D ) = |D|→0 6 X Exercı́cios Seção 1. A definição de integral 1. Sejam f : A → R uma função limitada no bloco n-dimensional A e J um número real com a seguinte propriedade: para todo ε > 0 dado, existe uma partição P0 de A tal que |S(f ; P ) − J| < ε, qualquer que seja a partição P de R− f (x)dx. (Um resultado análogo vale para A que refine P0 . Prove que J = A a integral inferior.) 2. Dada uma partição P0 do bloco A, prove que as integrais inferior e superior de uma função limitada f : A → R podem ser calculadas considerando-se apenas as partições de A que refinam P0 . 3. Sejam C ⊂ A blocos n-dimensionais. Se a função f : A → R é integrável, prove que sua restrição fC = f |C é integrável no bloco C. 4. Se a função f : A → R é contı́nua em todos os pontos do bloco A que têm a primeira coordenada diferente de um certo número c, prove que f é integrável. Seção 2. Conjuntos de medida nula 1. Prove que o gráfico de uma função integrável f : A → R, definida num bloco n-dimensional, tem medida nula em Rn+1 . 2. Prove que um bloco n-dimensional não tem medida n-dimensional nula. Daı́ todo conjunto de medida nula tem interior vazio. 3. Se X ⊂ Rp e v ∈ Rp , escreve-se X + v = {x + v; x ∈ X}. Dadas M, N ⊂ Rp , superfı́cies de classe C 1 tais que dim M + dim N < p, prove que é denso em Rp o conjunto V dos vetores v tais que M + v e N são disjuntos. Se M e N são compactas, além de denso, V é aberto em Rp . 4. Prove que toda função integrável f : A → R é a diferença entre duas funções integráveis não-negativas. Seção 3. Cálculo com integrais 1. Sejam A, B blocos n-dimensionais, com B contido no interior de A. Se f : A → R é a funçãoR igual a 1 nos pontos de B e igual a 0 fora de B, prove que f é integrável e A f (x)dx = vol ·B. Seção 6 Exercı́cios 2. Seja a um número positivo menor do que 1/2, logo ∞ P n=1 171 an = 1 − δ, com 0 < δ < 1. Retire do intervalo [0, 1] um intervalo aberto J1 , de comprimento a e centro no ponto 1/2. Em seguida, com centros nos pontos médios dos intervalos restantes, retire os intervalos abertos J2 e J3 , ambos de comprimento a2 /2. Repetindo o processo n vezes, restam 2n intervalos fechados, dois a dois disjuntos, de iguais comprimentos. A (n+1)-ésima etapa consiste em retirar do centro de cada um deles um intervalo aberto de comprimento an+1 /2n . Seja ∞ S Jk o que restou depois de efetuadas todas essas operações. X = [0, 1] − k=1 Prove que o conjunto X tem as seguintes propriedades: é compacto, tem interior vazio, não possui pontos isolados e, principalmente, não tem medida nula. Ele é chamado um “conjunto de Cantor com medida positiva”. 3. Se a função f : A1 × A2 → R é integrável, prove que existe um conjunto de medida nula X ⊂ A1 tal que fx : A2 → R é integrável para todo x ∈ A1 − X. 4. Se uma função integrável R f : A → R é igual a zero salvo num conjunto de medida nula, prove que A f (x)dx = 0. Seção 4. Conjuntos J-mensuráveis 1. Prove que o volume de um bloco B, definido por meio de uma integral, coincide com aquele definido anteriormente como produto dos comprimentos das arestas. 2. Justifique por que a bola B[a; r] é um conjunto J-mensurável. 3. Prove que o interior de um conjunto J-mensurável X ⊂ Rn também é J-mensurável e vol ·X = vol(int ·X). Prove uma afirmação análoga para o fecho X. 4. Seja f : A → R uma função limitada no bloco A ⊂ Rn , com f (x) ≥ 0 para todo x ∈ A. Prove que se f é integrável então o conjunto R C(f ) = {(x, y) ∈ Rn+1 ; x ∈ A, 0 ≤ y ≤ f (x)} é J-mensurável e vol C(f ) = A f (x)dx. 9 Mudança de Variáveis Demonstraremos neste capı́tulo o importante Teorema da Mudança de Variáveis em integrais múltiplas. Começaremos estabelecendo as notações. U e V são abertos do espaço euclidiano Rn ; h : U → V é um difeomorfismo de classe C 1 . X é um subconjunto compacto J-mensurável de U . A fronteira de X, que tem medida nula, está contida em X (logo em U ) e sua imagem por h, que é a fronteira do compacto h(X), tem medida nula (Teorema 6, Capı́tulo 8). Portanto h(X) também é um conjunto J-mensurável. Finalmente, f : h(X) → R é uma função integrável. O Teorema da Mudança de Variáveis diz que a seguinte igualdade é verdadeira: Z Z f (h(x)) · | det h′ (x)|dx. f (y)dy = h(X) X Ela é análoga para n variáveis daquela estabelecida no Vol. 1. (Vide Teorema 2, Capı́tulo 11.) Notam-se, porém, algumas diferenças. A função que, no caso de uma só variável, desempenhava o papel de h não precisava ser um difeomorfismo. Para n > 1, entretanto, pelo menos injetividade de h (ou algo equivalente) se faz necessário, sem o que a fórmula não vale. (O estudo dessas situações gerais leva à noção de grau, que é analisada em detalhe no livro “Curso de Análise”, Vol. 2.) Outra diferença é o valor absoluto em | det h′ (x)|. É natural que o determinante substitua a derivada h′ (x) pois, quando n > 1, esta não é um número; mas o valor absoluto que ocorre na fórmula acima não Seção 1 O caso unidimensional 173 parece estar presente quando n = 1. Na verdade, porém, ele está oculto na igualdade Z b Z h(b) f (h(x)) · h′ (x)dx. f (y)dy = a h(a) De fato, se chamarmos de I o intervalo [a, b] e J = h(I) o intervalo cujos extremos são h(a) e h(b), temos h(a) > h(b) quando h′ < 0, logo a fórmula acima significa, em qualquer caso, que Z Z f (y)dy = f (h(x)) · |h′ (x)|dx, I J pois Z f (y)dy = J Z h(b) f (y)dy se h(a) < h(b), isto é, se h′ (x) > 0, h(a) e Z J f (y)dy = − Z h(b) f (y)dy se h(b) < h(a), isto é, se h′ (x) < 0. h(a) O Teorema de Mudança de Variáveis será provado por etapas. 1 O caso unidimensional Dado o intervalo I = [a, b], escreveremos |I| = b − a. Teorema 1. Sejam U, V ⊂ R abertos, h : U → V um difeomorfismo C 1 , I ⊂ U um intervalo compacto, J = h(I) e f : J → R uma função limitada. Então − Z f (y)dy = J − Z I f (h(x)) · |h′ (x)|dx. Demonstração. Sem perda de generalidade, podemos admitir que f (y) ≥ 0 para todo y ∈ J pois, se somarmos a mesma constante positiva a f , o lado esquerdo sofrerá o acréscimo de c · |J| enquanto o acréscimo Z sofrido pelo lado direito será de c · I |h′ (x)|ds. Como h′ (x) não muda de sinal para x ∈ I, o valor desta integral é c · |h(b) − h(a)| = c · |J| também. Esta observação nos deixa livres para manipular desigualdades. 174 Mudança de Variáveis Cap. 9 As partições de J = h(I) são do tipo h(P ), dadas por intervalos da forma Jr = h(Ir ), onde os Ir (r = 1, . . . , k) são os intervalos de uma partição P de I. Para cada r, ponhamos Mr = sup f (y) = sup f (h(x)) y∈Jr e cr = sup |h′ (x)|. Evidentemente, |P | → 0 ⇔ |h(P )| → 0. x∈Ir x∈Ir Pelo Teorema do Valor Médio, para cada r = 1, . . . , k existe ξr ∈ Ir tal que |Jr | = |h′ (ξr )| · |Ir |. Pondo ηr = cr − |h′ (ξr )|, temos ηr ≥ 0 e, em virtude da continuidade uniforme de h′ no intervalo I, lim ηr = 0. k P Segue-se que lim |P |→0 r=1 0≤ k X r=1 |P |→0 ηr |Ir | = 0 pois ηr |Ir | ≤ (max ηr ) · r k X r=1 |Ir | = (max ηr ) · |I|. r Então S(f ; h(P )) = k X r=1 Mr · |Jr | = S((f ◦ h) · |h′ |; P ) = k X r=1 k X r=1 Mr cr |Ir | − k X r=1 Mr ηr |Ir | e Nr |Ir |, onde Nr = sup (f (h(x)) · |h′ (x)|) ≤ Mr · cr x∈Ir pois se ϕ, φ : A → R são duas funções não-negativas limitadas quaisquer então sup(ϕ(x) · ψ(x)) ≤ sup ϕ(x) · sup ψ(x). Logo, para toda partição x∈A P do intervalo I, vale: x∈A x∈A S((f ◦ h) · |h′ |; P ) ≤ S(f ; h(P )) + M · k X r=1 ηr · |Ir |, onde M = sup f (y). y∈J Segue-se que Z− I f (h(x)) · |h′ (x)| · dx = lim S((f ◦ h) · |h′ |; P ) |P |→0 ≤ lim S(f ; h(P )) = |P |→0 Z− f (y)dy. J Seção 2 Difeomorfismos primitivos A desigualdade oposta, Z− J 175 Z− f (y)dy≤ f (h(x)) · |h′ (x)|dx, resulta da que I vem de ser provada, usando-se h−1 : J→I em vez de h, (f ◦ h) · |h′ | : I→R em vez de f e levando em conta que, para todo y = h(x), x ∈ I, tem-se (h−1 )′ (y) = 1/h′ (x). Então concluı́mos que − Z 2 f (y)dy = J − Z I f (h(x)) · |h′ (x)|dx. Difeomorfismos primitivos O próximo caso particular que consideraremos é aquele em que h é um difeomorfismo primitivo. Chamam-se primitivos os difeomorfismos h de um dos dois tipos seguintes: Tipo 1. São fixados os ı́ndices i, j, com 1 ≤ i < j ≤ n e h : Rn → Rn é dado por h(x) = h(x1 , . . . , xi , . . . , xj , . . . , xn ) = (x1 , · · · , xj , . . . , xi , . . . , xn ). Tipo 2. Tem-se uma função ϕ : U → R, de classe C 1 , e para todo x ∈ U vale h(x) = (ϕ(x), x2 , . . . , xn ). Teorema 2. Seja h : Rn → Rn um difeomorfismo primitivo do Tipo 1. Para todo conjunto J-mensurável X ⊂ Rn e toda função integrável f : h(X) → R tem-se Z Z f (h(x)) · | det h′ (x)| dx. f (y)dy = X h(X) Demonstração. O difeomorfismo h é um operador linear, com det h′ (x) = −1 paraZ todo x ∈ Rn , Zlogo | det h′ (x)| = 1. Devemos, por- f (h(x))dx. Ora, para todo bloco f (y)dy = tanto, mostrar que h(X) X B ⊂ Rn , sua imagem h(B) é também um bloco, com arestas de mesmo comprimento que as de B, logo vol h(B) = vol B. Como o volume de um conjunto J-mensurável Z ⊂ Rn é o ı́nfimo dos números Σ vol Bi , onde 176 Mudança de Variáveis Cap. 9 os Bi são blocos, com Z ⊂ B1 ∪ · · · ∪ Bk , segue-se que vol ·h(Z) = vol Z. Toda decomposição h(X) = Y1 ∪ · · · ∪ Yk é tal que Yi = h(Xi ), onde X = X1 ∪ · · · ∪ Xk é uma decomposição de X. Todo ponto de Yi é da forma h(ξi ), com ξi ∈ Xi . Logo Z X f (y)dy = lim f (h(ξi )) · vol Yi |D|→0 h(X) Z X = lim f (h(x))dx. f (h(ξi )) · vol Xi = |D|→0 X Teorema 3. O Teorema de Mudança de Variáveis em Integrais Múltiplas é válido quando X ⊂ Rn é um bloco retangular e h : U → V é um difeomorfsmo primitivo do Tipo 2. Demonstração. Por conveniência, escreveremos os pontos de Rn sob a forma x = (s, w), com s ∈ R e w ∈ Rn−1 , e consideraremos o bloco X = I × A como produto cartesiano do intervalo I = [a, b] pelo bloco A ⊂ Rn−1 . Note-se que, para todo w ∈ A fixado, a função ϕw : s 7→ ϕ(s, w) = t é um difeomorfismo do intervalo I sobre o intervalo Jw = ϕw (I) = ϕ(I × w). Observemos ainda que a matriz jacobiana de h tem a primeira linha igual ao gradiente de ϕ e, a partir da segunda linha, coincide com a matriz identidade (n − 1) × (n − 1). Portanto ∂ϕ (s, w) = ϕ′w (s). Seja J ⊂ R um intervalo compacto det h′ (x) = ∂s contendo Jw para todo w ∈ A. Então h(X) ⊂ J × A. Como de praxe, f¯: J × A → R é a função integrável, igual a f nos pontos de h(X) e igual a zero nos demais pontos de J ×A. Então o Teorema 1 nos permite escrever: Z f (y)dy = h(X) Z f (t, w)dt dw = h(X) = Z A = Z A = Z I×A = Z X − Z − Z J I Z f¯(t, w)dt dw J×A f¯w (t)dt dw = Z A − Z Jw fw (ϕ(s, w))|ϕ′w (s)|ds dw fw (t)dt dw f (ϕ(s, w), w) · | det h′ (s, w)|ds dw f (h(x)) · | det h′ (x)|dx. Seção 3 3 Todo difeomorfismo C 1 é localmente admissı́vel 177 Todo difeomorfismo C 1 é localmente admissı́vel Seja D o conjunto dos difeomorfismos de classe C 1 para os quais é válido o Teorema de Mudança de Variáveis. Os elementos de D serão chamados difeomorfismos admissı́veis. Como sabemos, o objetivo deste capı́tulo é provar que todo difeomorfismo de classe C 1 é admissı́vel. Acabamos de ver que os difeomorfismos primitivos pertencem a D. Além disso, como det((h1 ◦ h2 )′ (x)) = det h′1 (h2 (x)) · det h′2 (x), vê-se imediatamente que h1 ◦ h2 ∈ D quando h1 ∈ D e h2 ∈ D. Por exemplo, todo difeomorfismo da forma h(x) = (x1 , . . . , xj−1 , ϕ(x), xj+1 , . . . , xn ) é admissı́vel pois é composto de três difeomorfismos primitivos. Nesta seção, provaremos que todo difeomorfismo de classe C 1 é localmente admissı́vel. Este é o conteúdo do teorema seguinte, o qual, evidentemente, é um resultado provisório. Teorema 4. Seja h : U → V um difeomorfismo de classe C 1 entre abertos de Rn . Todo ponto de U possui uma vizinhança, restrita à qual h é admisı́vel. Demonstração. Basta provar que, dado x0 ∈ U , se h é definido numa vizinhança de x0 e tem a forma h(x) = (ϕ1 (x), . . . , ϕj (x), xj+1 , . . . , xn ), com j > 1, então existe um difeomorfismo k, de classe C 1 , composto de difeomorfismos primitivos, cuja imagem é uma vizinhança de x0 , tal que h(k(w)) = (ψ1 (w), . . . , ψj−1 (w), wj . . . , wn ). Ora, as j primeiras linhas da matriz jacobiana de h são os vetores grad ϕ1 , . . . , grad ϕj e as demais linhas coincidem com as da matriz identidade n × n. Compondo h, se necessário, com um difeomorfismo ∂ϕj do Tipo 1, podemos admitir que (x0 ) 6= 0. Pelo Teorema 5 do ∂xj Capı́tulo 6 (aplicado à função ϕj ) existe um difeomorfismo admissı́vel k : w 7→ (w1 , . . . , kj (w), wj+1 , . . . , wn ) 178 Mudança de Variáveis Cap. 9 cuja imagem é uma vizinhança de x0 tal que ϕj (k(w)) = wj para todo w no domı́nio de k. Então h(k(w)) = (ϕ1 (k(w)), . . . , ϕj−1 (k(w)), wj , . . . , wn ), completando assim a demonstração. 4 Conclusão: todo difeomorfismo de classe C 1 é admissı́vel Para terminar a demonstração do Teorema de Mudança de Variáveis, vamos usar um resultado topológico elementar que estabeleceremos agora. S Cλ uma cobertura do conjunto X ⊂ Rn . Diz-se que Seja X ⊂ λ∈L δ > 0 é um número de Lebesgue dessa cobertura quando todo subconjunto Y ⊂ X com diâmetro < δ está contido em algum Cλ . S Aλ de um conjunto comTeorema 5. Toda cobertura aberta X ⊂ pacto X ⊂ Rn possui número de Lebesgue. λ∈L Demonstração. Se supusermos, por absurdo, que nenhum δ > 0 é número de Lebesgue da cobertura dada, obteremos, para cada k ∈ N, um conjunto Yk ⊂ X, com diam Yk < 1/k mas nenhum Aλ contém Yk . Escolhemos um ponto yk em cada Yk . Passando a uma subseqüência, se necessário, a compacidade de X assegura a existência de a ∈ X tal que lim yk = a. Existe λ0 tal que a ∈ Aλ0 . Existe ainda ε > 0 com B(a; ε) ⊂ Aλ0 , pois Aλ0 é aberto. Tomemos k ∈ N tão grande que 1/k < ε/2 e |a − yk | < ε/2. Então, lembrando que diam Yk < 1/k, para todo y ∈ Yk temos |y − a| ≤ |y − yk | + |yk − a| < 1 ε + < ε. k 2 Segue-se que Yk ⊂ B(a, ε) ⊂ Aλ0 , uma contradição. Exemplo 1. Sejam A1 = {(x, y) ∈ R2 ; x > 0, y > 1/x} e A2 = {(x, y) ∈ R2 ; y < 0}. A cobertura aberta X = A1 ∪ A2 não possui número de Lebesgue. Com efeito, dado qualquer δ > 0, seja p = (x, 0), com 0 < δ 1 < . Então X ∩ B(p; δ/2) é um subconjunto de X com diâmetro < δ, x 2 o qual não está contido em A1 nem A2 . Seção 5 Exercı́cios 179 Teorema 6. Sejam X ⊂ Rn um conjunto compacto J-mensurável, h : U → V um difeomorfismo de classe C 1 entre abertos U, V ⊂ Rn e f : h(X) → R uma função integrável. Então Z Z f (h(x)) · | det h′ (x)|dx. f (y)dy = X h(X) Demonstração. Existe uma cobertura aberta X ⊂ S x∈X Wx ⊂ U tal que a restrição de h a cada Wx é um difeomorfismo admissı́vel. Seja δ > 0 um número de Lebesgue dessa cobertura. Tomamos uma decomposição D = (X1 , . . . , Xk ) de X tal que cada conjunto Xi tenha diâmetro inferior a δ. (Para obter D, basta tomar uma partição P de um bloco A contendo X de modo que os blocos Bi de P tenham arestas < δ na norma do máximo, √ ou δ/ n na norma euclidiana. Em seguida, ponha Xi = Bi ∩ X.) Então Z XZ XZ f (y)dy = f (y)dy = f (h(x)) · | det h′ (x)|dx h(X) = Zi X h(Xi ) i Xi f (h(x)) · | det h′ (x)|dx. Corolário 1. Seja T : Rn → Rn um operador linear. Para todo conjunto compacto J-mensurável X ⊂ Rn tem-se vol T (X) = | det T | · vol X. Basta aplicar o Teorema 6 à função caracterı́stica ξX em lugar de f , observando que é suficiente considerar o caso em que T é invertı́vel. 5 Exercı́cios 1. Seja f : U → Rm de classe C 1 no aberto U ⊂ Rm . Se, no ponto a ∈ U , a derivada f ′ (a) : Rm → Rm é um isomorfismo, prove que lim r→0 vol ·f (B(a; r)) = | det ·f ′ (a)|. vol ·B(a; r) 2. Sejam M ⊂ Rn+1 uma hiperfı́cie orientável, ϕ : V0 → V uma parametrização compatı́vel com a orientação de M e X ⊂ V um compacto tal que X0 = ϕ−1 (X) ⊂ V0 é J-mensurável. Seja ainda v : M → Rn+1 um campo de vetores 180 Integrais Múltiplas Cap. 9 (não necessariamente tangentes ou normais a M ). O fluxo de v através do conjunto X é, por definição, dado pela integral Z f (v, X) = hv(ϕ(x)), w(ϕ(x))idx X0 ∂ϕ ∂ϕ (x) × · · · × (x) (produto vetorial) para todo x ∈ V0 . ∂x1 ∂xn Prove que f (v, X) não depende da parametrização ϕ. onde w(ϕ(x)) = 10 Soluções dos exercı́cios Cada uma das nove seções deste capı́tulo tem o mesmo tı́tulo de um dos nove capı́tulos anteriores e contém soluções para exercı́cios propostos naquele capı́tulo. Em cada uma delas, a notação p·q significa o q-ésimo exercı́cio da seção p do capı́tulo correspondente. 1 Topologia do Espaço Euclidiano 1.1. Se |u+v| = |u|+|v| então |u+v|2 = (|u|+|v|)2 , ou seja, |u|2 +2hu, vi+|v|2 = |u| + 2|u| |v| + |v|2 , logo hu, vi = |u| |v| e daı́ v = α · u, com α ≥ 0. 1.2. Podemos supor que um dos vetores u = x − y e v = y − z, digamos v, é diferente de zero. Então, de |u + v| = |x − z| = |x − y| + |y − z| = |u| + |v| segue-se que v = αu, com α ≥ 0. Logo y − z = αx − αy e daı́ (1 + α)y = z + αx, ou seja y = (1 − t)x + tz, com t = α/(1 + α); portanto 0 ≤ t ≤ 1. hx, yi 1.3. Seja z = · x. Como hy − z, xi = 0, segue-se que hy − z, yi = 0, o que |x|2 nos dá |y|2 = hz, yi e daı́ |x|2 |y|2 = hx, yi2 , logo x e y são colineares. 1.4. Um cálculo imediato mostra que, como |x| = |y|, vale hz, xi = hz, yi, portanto hz, y − xi = 0. 2 2.1. Devemos ter c = a + t(b − a), onde t é tal que hc, bi = hc, ai. Isto nos dá ha, b − ai . O Teorema de Pitágoras assegura que |c| < |x| para todo x 6= c na |b − a|2 reta ab. 2.2. Vale |(1 − t)x + ty| < (1 − t)r + tr = r se 0 < t < 1 em virtude de 1.1. 2.3. Dados a, b ∈ B(X; r), existem A, B ∈ X tais que |a − A| < r e |b − B| < r. Então, para todo t ∈ [0, 1], tem-se (1 − t)A + tB = C ∈ X e |(1 − t)a + tb − C| ≤ (1 − t)|a − A| + t|b − B| < (1 − t)r + tr = r, logo (1 − t)a + tb ∈ B(X; r). 2.4. Isto pode ser provado usando o fato de que a função y = x2 é convexa (cfr. vol. 1, pag. 108) ou, diretamente, assim: dados (a, m) e (b, n) em X, para mostrar que ((1 − t)a + tb, (1 − t)m + tn) ∈ X, basta provar que (1 − t)2 a2 + t2 b2 + 2t(1−t)ab ≤ (1−t)a2 +tb2 pois a2 ≤ m e b2 ≤ n. Levando em conta que 1−t−(1−t)2 = t=− 182 Soluções dos exercı́cios Cap. 10 t(1 − t), isto equivale a provar que 2t(1 − t)ab ≤ t(1 − t)(a2 + b2 ), o que é claro pois a2 + b2 ≥ 2ab. 2.5. Se |T · v| = a > 0 então |T · nv| = n · a logo T não é limitada. Seja c = max{|T e1 |, . . . , |T em |}. Se o conjunto X ⊂ Rm é limitado então existe k > 0 tal m P P que, para todo x = (x1 , . . . , xm ) ∈ X, tem-se |xi | ≤ k, logo |T · x| = | xi · T ei | ≤ i=1 P P |xi | |T ei | ≤ c · |xi | ≤ c · k. 3.1. Se x ∈ int ·X então existe r > 0 com B(x; r) ⊂ X. Para todo y ∈ B(x; r), o argumento do texto mostra que, pondo s = r − |y − x|, tem-se B(y; s) ⊂ B(x; r), donde B(y; s) ⊂ X e daı́ y ∈ int .X. Portanto x ∈ int .X ⇒ x ∈ int . int .X, ou seja, int .X ⊂ int . int .X. A inclusão contrária é óbvia. 3.2. Se A é um aberto contido em X então todo ponto x ∈ A é centro de uma bola contida em A, logo contida em X. Assim A ⊂ int .X. 3.3. A fronteira do conjunto Qn , formado pelos pontos de Rn cujas coordenadas são números racionais, é todo o Rn . Se X ⊂ Rn é aberto então X ∩ fr .X = ∅. Qualquer bola com centro num ponto x ∈ fr .X contém pontos de X portanto pontos fora de fr .X. Assim nenhum ponto x ∈ fr .X é um ponto interior. 3.4. Basta observar que todo aberto A ⊂ Rn é a reunião das bolas abertas nele contidas e que a projeção de uma bola aberta é um intervalo aberto (fato que fica mais evidente quando se usa em Rn a norma do máximo). 3.5. Tome em cada aberto A dessa coleção um ponto pertencente ao conjunto não-vazio A ∩ Qn . Como Qn é enumerável o mesmo ocorre com o conjunto dos pontos escolhidos, a cada um dos quais corresponde um único aberto da coleção pois estes são disjuntos. 4.1. Para todo ε > 0 dado, existem k1 , k2 ∈ N tais que k > k1 , k ∈ N′ implicam |xk − a| < ε e k > k2 , k ∈ N′′ ⇒ |xk − a| < ε. Seja k0 = max{k1 , k2 }. Como N = N′ ∪ N′′ , segue-se que k > k0 ⇒ |xk − a| < ε. Logo lim xk = a. 4.2. Se existissem um subconjunto infinito N′ ⊂ N e um ponto a ∈ Rn tais que lim′ xk = a então existiria k1 ∈ N tal que k ∈ N′ , k > k1 ⇒ |xk − a| < 1 ⇒ n∈N |xk | < |a| + 1. Ao mesmo tempo, se for lim |xk | = +∞, existirá k2 ∈ N tal que k > k2 ⇒ |xk | > |a| + 1. Tomando k0 = max{k1 , k2 }, para todo k > k0 terı́amos |xk | < |a| + 1 e |xk | > |a| + 1, um absurdo. Logo (a) ⇒ (b). Em seguida, se o conjunto NX do item (c) fosse infinito então os termos xk com k ∈ NX formariam uma seqüência limitada, a qual possuiria uma subseqüência convergente. Logo (b) ⇒ (c). Finalmente, admitindo (c), para todo A > 0 o conjunto dos ı́ndices k ∈ N tais que |xk | ≤ A possui um elemento máximo k0 logo k > k0 ⇒ |xk | > A, o que prova a implicação (c) ⇒ (a). 4.3. Tome B(a; ε) ⊂ A. 4.4. Como a ∈ X ∩ (Rn − X), para todo k ∈ N existem xk ∈ X e yk ∈ Rn − X tais que |xk − a| < 1/k e |yk − a| < 1/k, logo lim xk = lim yk = a. A recı́proca é óbvia. 5.1 De X ⊂ X e Y ⊂ Y , segue-se que X ∪ Y ⊂ X ∪ Y . Como X ∪ Y é fechado, resulta daı́ que X ∪ Y ⊂ X ∪ Y . Por outro lado, de X ⊂ X ∪ Y e Y ⊂ X ∪ Y segue-se que X ⊂ X ∪ Y e Y ⊂ X ∪ Y , logo X ∪ Y ⊂ X ∪ Y . Analogamente, X ⊂ X e Y ⊂ Y implicam X ∩ Y ⊂ X ∩ Y logo X ∩ Y ⊂ X ∩ Y porque X ∩ Y é fechado. Tomando X = (a, b) e Y = (b, c) temos X ∩ Y = ∅ e X ∩ Y = {b}. Seção 1 Topologia do Espaço Euclidiano 183 5.2. Para todo k ∈ N, sejam Xk = {xr ; r ≥ k} e F o conjunto dos valores de aderência T de (xk ). Segue-se da definição que a ∈ F ⇔ a ∈ X k para todo k ∈ N. Logo F = X k .̇ portanto F é fechado. k∈N 5.3. Se A é aberto e a ∈ A ∩ X então a = lim xk , xk ∈ X. Para todo k suficientemente grande, tem-se xk ∈ A, isto é, xk ∈ A ∩ X, portanto a ∈ A ∩ X. Para a recı́proca, se A não fosse aberto, existiria um ponto a ∈ A não-interior, logo a ∈ A ∩ X, onde X = Rn − A. Mas, neste caso, A ∩ X = ∅, logo não se teria A ∩ X ⊂ A ∩ X. 5.4. Escrevendo os pontos de Rm+n sob a forma (x, y), com x ∈ Rm e y ∈ Rn , a igualdade X × Y = X × Y resulta do fato de que (a, b) = lim(xk , yk ) ⇔ a = lim xk e b = lim yk . 5.5. As duas afirmações decorrem do seguinte: para todo conjunto X ⊂ Rn , tem-se a reunião disjunta Rn = int .X ∪ fr .X ∪ int .(Rn − X), sendo X fechado se, e somente se, Rn − X é aberto. 5.6. Se d(A, B) = 0 então existem seqüências de pontos xk ∈ A e yk ∈ B tais que lim |xk − yk | = 0. Passando a uma subseqüência, se necessário, podemos admitir que existe a = lim xk , pois A é limitado. Então vale também lim yk = a, logo a ∈ A ∩ B. Como A e B são disjuntos não se pode ter a ∈ int .A nem a ∈ int .B. Logo a ∈ fr .A ∩ fr .B. 5.7. Seja C ⊂ Rn convexo. Se a, b ∈ C e 0 ≤ t ≤ 1 então a = lim ak e b = lim bk com ak , bk ∈ C logo (1 − t)ak + tbk ∈ C. Daı́ (1 − t)a + tb = lim[(1 − t)ak + tbk ] ∈ C, portanto C é convexo. 5.8. Sabemos que existe x̄ ∈ C tal que d(x, C) = |x − x̄|. Se existisse outro ponto ȳ ∈ C com |x − x̄| = |y − ȳ| então, pelo Exercı́cio 2.2 terı́amos |x − z| < |x − x̄| para todo ponto z ∈ [x̄, ȳ] ⊂ C e então não seria |x − x̄| = d(x, C). 6.1. O supremo de um conjunto de números reais pertence ao fecho desse conjunto. Logo diam .K = lim |xk − yk | com xk , yk ∈ K. Passando a uma subseqüência, se necessário, temos lim′ xk = a ∈ K. Analogamente, existe N′′ ⊂ N′ com k∈N lim′′ yk = b ∈ K. Então |a − b| = lim′′ |xk − yk | = diam .K. k∈N k∈N 6.2. Se X não fosse limitado então, para todo k ∈ N, X não estaria contido na bola Bk = B(0; k). Então a cobertura aberta X ⊂ ∪Bk não admitiria subcobertura finita. Portanto X é limitado. Se X não fosse fechado, existiria uma seqüência de pontos xk ∈ X com lim xk = a ∈ / X. Então os abertos Ak = Rn −B[a; 1/k] formariam n uma cobertura de R − {a}, portanto de X, sem subcobertura finita. 6.3. Seja a um valor de aderência de (xk ). Se não fosse a = lim xk , existiriam ε > 0 e uma infinidade de ı́ndices k tais que |xk − a| ≥ ε. Passando a uma subseqüência, se necessário, terı́amos lim′ xk = b, com |b − a| ≥ ε, logo b 6= a seria outro k∈N valor de aderência. Quanto ao exemplo, basta tomar xk = 0 para k ı́mpar e xk = k ·e1 se k é par. 6.4. Como o compacto K e o fechado Rn − U são disjuntos, existem a ∈ K, b ∈ Rn − U tais que x ∈ K, y ∈ Rn − U ⇒ |x − y| ≥ |a − b| = ε > 0. Portanto, para todo x ∈ K, tem-se B(x; ε) ⊂ U . Se x ∈ K e |y − x| < ε então [x, y] ⊂ B(x, ε) logo [x, y] ⊂ U . 6.5. Se a = lim xk com xk ∈ X para todo k ∈ N então o conjunto K, formado pelos pontos xk mais o ponto a, é compacto, logo X ∩K é fechado, portanto a ∈ X ∩K. 184 Soluções dos exercı́cios Cap. 10 Em particular, a ∈ X. Portanto X é fechado. 7.1. Se (f (xk )) possuisse uma subseqüência convergindo para o ponto b, desprezando os termos a ela não pertencentes, o conjunto K = {f (xk ); k ∈ N} ∪ {b} seria compacto logo f −1 (K) seria um compacto contendo todos os xk e então (xk ) possuiria uma subseqüência convergente. Portanto (a) ⇒ (b). Reciprocamente, supondo (b), sejam K ⊂ Rn compacto e (xk ) uma seqüência em f −1 (K). Então a seqüência (f (xk )), contida no compacto K, possui uma subseqüência convergente, com lim′ f (xk ) = b ∈ K. Pela hipótese (b), (xk )k∈N′ tem uma subseqüência converk∈N gente, com lim′′ xk = a. Pela continuidade de f , tem-se f (a) = b, logo a ∈ f −1 (K). k∈N Assim f −1 (K) é compacto. 7.2. Podemos escrever, para todo z 6= 0 em R2 : p(z) = z n a 0 zn + a1 z n−1 + ··· + an−1 + an . z Daı́ resulta que |zk | → +∞ ⇒ |p(zk )| → +∞. 7.3. Para cada x ∈ X, seja ξ(x) ∈ K o único ponto tal que f (x, ξ(x)) = 0. Se lim xk = x0 em X, admitamos que a = lim′ ξ(xk ) e b = lim′′ ξ(xk ) sejam vak∈N k∈N lores de aderência da seqüência (ξ(xk )). Pela continuidade de f tem-se f (x0 , a) = lim′ f (xk , ξ(xk )) = 0 e, analogamente, f (x0 , b) = 0. Logo a = b. A seqüência k∈N de pontos ξ(xk ) no compacto K tem portanto um único valor de aderência, logo converge para o ponto c = lim ξ(xk ) ∈ K, com f (x0 , c) = lim f (xk , ξ(xk )) = 0. Assim c = ξ(x0 ) e ξ é contı́nua. 7.4. Para toda seqüência de pontos xk = π(xk , yk ) ∈ π(F ) com lim xk = a, de (xk , yk ) ∈ F segue-se que yk ∈ K. Passando a uma subseqüência: lim′ yk = b, logo k∈N lim′ (xk , yk ) = (a, b) ∈ F , pois F é fechado. Então a = π(a, b) ∈ π(F ), portanto π(F ) k∈N é fechado. 8.1. Com efeito, se d(F, G) = 0 então existem seqüências de pontos xk ∈ F e yk ∈ G tais que |xk − yk | < 1/k, logo lim |xk − yk | = 0 mas, como f (xk ) = 0 e f (yk ) = 1, tem-se |f (xk ) − f (yk )| = 1 e assim f não é uniformemente contı́nua. 8.2. Dado ε > 0, existe δ > 0 tal que y, y ′ ∈ Y , |y−y ′ | < δ ⇒ |f (y)−f (y ′ )| < ε/2. Sejam agora x, x′ ∈ X com |x − x′ | < δ. Existem seqüências de pontos yk , yk′ ∈ Y tais que lim yk = x e lim yk′ = x′ . Para todo k suficientemente grande, tem-se |yk −yk′ | < δ, portanto |f (yk ) − f (yk′ )| < ε/2. Então |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε. Portanto f : X → Rn é uniformemente contı́nua. 8.3. Se f (X) fosse ilimitado, para cada k ∈ N existiria xk ∈ X tal que |f (xk )| > k. A seqüência (f (xk )) assim obtida não possuiria subseqüência convergente. Mas como X é limitado, a seqüência de pontos xk ∈ X teria uma subseqüência convergente, portanto de Cauchy. E sendo f uniformemente contı́nua, a subseqüência correspondente (f (xk ))k∈N′ seria de Cauchy, logo convergente. Esta contradição mostra que f (X) deve ser limitado. 8.4. Se xk , yk ∈ X são tais que lim |xk − yk | = 0 então lim |f (xk ) − f (yk )| = 0 e lim |g(xk ) − g(yk )| = 0. Como |f (xk ) + g(xk ) − (f (yk ) + g(yk ))| ≤ |f (xk ) − f (yk )| + |g(xk ) − g(yk )|, segue-se que f + g é uniformemente contı́nua. Analogamente, se Seção 1 Topologia do Espaço Euclidiano 185 |f (x)| ≤ A e |g(x)| ≤ B para todo x ∈ X, então |f (xk ) · g(xk ) − f (yk ) · g(yk )| = = |(f (xk ) − f (yk )) · g(xk ) + f (yk )(g(xk ) − g(yk ))| ≤ ≤ |f (xk ) − f (yk )| · B + A · |g(xk ) − g(yk )| donde lim(f (xk ) · g(xk ) − f (yk ) · g(yk )) = 0, logo f · g é uniformemente contı́nua. 8.5. Sejam v = x̄ − x e w = y − x̄. Devemos provar que hv, wi ≥ 0. Para todo t ∈ [0, 1], temos |v| ≤ |v + tw| pois v + tw ∈ C. Elevando ao quadrado, obtemos |v|2 ≤ |v|2 + 2thv, wi + t2 · |w|2 . Simplificando concluı́mos que t[t|w|2 + 2hv, wi] ≥ 0 para todo t ∈ [0, 1]. Daı́ resulta que hv, wi ≥ 0 pois se fosse hv, wi < 0 então terı́amos t[t|w|2 + 2hv, wi] < 0 para todo t positivo, menor do que −2hv, wi/|w|2 . 8.6. Por 8.5, temos hȳ − x̄, x− x̄i ≤ 0 e hx̄− ȳ, y − ȳi ≤ 0. A segunda desigualdade escreve-se hȳ − x̄, ȳ −yi ≤ 0. Somando-a com a primeira, vem hȳ − x̄, x− x̄+ ȳ −yi ≤ 0, donde hȳ − x̄, ȳ − x̄i ≤ hȳ − x̄, y − xi. Por Schwarz: |ȳ − x̄|2 ≤ |ȳ − x̄| |y − x|, logo |ȳ − x̄| ≤ |y − x|. 9.1. A aplicação f : X → S n−1 , definida por f (x) = x/|x|, é contı́nua e bijetiva, logo é um homeomorfismo, pois X é compacto. t 9.2. Defina f : S n−1 × R → Rn − {0} pondo f(x, t) = e · x e observe que y g : Rn − {0} → S n−1 × R, dada por g(y) = , ℓn|y| é a inversa de f . |y| 9.3. Considere a composição das aplicações abaixo indicadas: S m × S n → S m × Rn+1 → S m × R × Rn → (Rm+1 − {0}) × Rn → Rm+n+1 , onde a terceira é dada pelo exercı́cio anterior e as demais são inteiramente óbvias. Todas são homeomorfismos sobre suas imagens. 9.4. X é a reunião de duas circunferências com o ponto a em comum e Y é um intervalo aberto da reta cujo ponto médio é b. 9.5. Seja f : X − {a} → Y − {b} um homeomorfismo. Defina F : X → Y pondo F (x) = f (x) se x 6= a e F (a) = b. Como X é compacto e F é uma bijeção, basta provar que F é contı́nua, ou seja, que lim xk = a ⇒ lim f (xk ) = b (onde xk ∈ X −{a}). Como Y é compacto, basta mostrar que b é o único valor de aderência da seqüência (f (xk )). Ora, se fosse lim′ f (xk ) = d 6= b terı́amos d = f (c), c ∈ X − {a} e lim′ xk = c k∈N k∈N pois f −1 : Y − {b} → X − {a} é contı́nua. Mas devia ser lim′ xk = a. Final. k∈N S Cax , uma reunião de conjuntos conexos 10.1. Fixando a ∈ X, temos X = x∈X com o ponto a em comum, logo X é conexo. Recı́proca óbvia. 10.2. Considere em Rn uma reta r que intersecte o segmento [a, b] em seu ponto médio. Dados x, y ∈ r, os conjuntos [a, x] ∪ [x, b] = Ax e Ay = [a, y] ∪ [y, b] têm apenas os pontos a, b em comum. Supondo, por absurdo, que nenhum dos Ax , x ∈ r, estivesse contido em Rn − Z escolherı́amos, para cada x ∈ r, um ponto f (x) ∈ Ax ∩ Z. Isto definiria uma aplicação injetiva f : r → Z, o que não existe pois Z é enumerável e r não é. 10.3. Sejam a 6= b em S 1 e a′ 6= b′ em S 2 . Então S 1 − {a, b} é desconexo mas 2 S − {a′ , b′ } é conexo, homeomorfo a S 1 × R. 186 Soluções dos exercı́cios Cap. 10 10.4. Um subconjunto de R, para ser homeomorfo a S 1 deveria ser compacto e conexo, logo seria um intervalo [a, b], o qual fica desconexo pela remoção de um ponto interior, mas a remoção de qualquer um dos seus pontos não desconecta S 1 . 10.5. X é a reunião dos dois eixos coordenados mais a hipérbole xy = 1, logo tem 3 componentes conexas. 11.1. O ponto essencial é observar que se f : X → Rn é uniformemente contı́nua então toda seqüência de Cauchy (xk ) em X é transformada por f numa seqüência de Cauchy (f (xk )). Portanto, se lim xk = a então existe lim f (xk ) = b pois toda seqüência de Cauchy em Rn é convergente. O limite b não depende da seqüência (xk ) escolhida pois se lim yk = a, ainda com yk ∈ X, a seqüência (x1 , y1 , x2 , y2 , . . . ) ainda converge para a, logo é de Cauchy, e sua imagem (f (x1 ), f (y1 ), f (x2 ), f (y2 ), . . . ) é de Cauchy, e tem a subseqüência (f (xk )) convergindo para b, logo lim f (yk ) = b. Portanto xk → a ⇒ f (xk ) → b e daı́ lim f (x) = b. x→a 11.2. Pelo exercı́cio anterior, para todo x = X existe lim f (y) = F (x). Isto y→x define F : X → Rn . Para todo ε > 0 dado, tome-se δ > 0 tal que y, y ′ ∈ Y , |y − y ′ | < δ ⇒ |f (y) − f (y ′ )| < ε/2. Agora, se x, x′ ∈ X e |x − x′ | < δ, tomamos seqüências (yk ) e (yk′ ) em Y , com lim yk = x e lim yk′ = x′ . Desprezando alguns termos iniciais, podemos supor que |yk − yk′ | < δ, onde |f (yk ) − f (yk′ )| < ε/2 para todo k ∈ N, logo |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε. k 11.3. Seja p(z) = a0 + a1 z+ · · · + ak z , com ak 6= 0. Então p(z) = a a a 0 1 k−1 z k k + k−1 + · · · + + ak = z k (ϕ(z) + ak ), onde lim ϕ(z) = 0. Logo z→∞ z z z lim p(z) = ∞. z→∞ 11.4. Sabemos que, para todo ε > 0 existe δ > 0 tal que t ∈ R, 0 < |t| < δ ⇒ sen t − 1 < ε. Tomando em Rn a norma do máximo, e supondo δ < 1, vemos que t sen(x1 · x2 · · · xn ) − 1 < ε. 0 < |x| < δ ⇒ |x1 · x2 · · · xn | < δ ⇒ x1 · x2 · · · xn 11.5. Sejam αi uma coordenada não-nula de v e βi a coordenada correspondente βi · Tome α = αi /βi . de v0 . Então lim f (x) · αi = βi , donde lim f (x) = x→a x→a αi 2 Caminhos diferenciáveis 1.1. Temos a = lim tk , com tk 6= a e f (tk ) = b para todo k ∈ N. Portanto f (tk ) − f (a) b−b = lim = 0. f (a) = lim f (tk ) = b e f ′ (a) = lim k→∞ tk − a k→∞ tk − a 1.2. Para todo t ∈ I, temos f (t) = (x(t), |x(t)|), com f (a) = (0, 0). Portanto a é um ponto no qual |x(t)| assume seu valor mı́nimo, logo a derivada da função t 7→ |x(t)| é zero para t = a. Como −|x(t)| ≤ x(t) ≤ |x(t)| para todo t, segue-se que x′ (a) = 0. Logo f ′ (a) = (x′ (a), |x|′ (a)) = (0, 0). 1.3. Na verdade, como f (t) + f ′′ (t) = (0, 0, t), este ponto já pertence ao eixo vertical de R3 . √ 1.4. Temos g ′ (t) = (−ab sen bt, ab cos bt, c), logo |g ′ (t)| = a2 b2 + c2 . Assim, a relação pedida é a2 b2 + c2 = 1. Seção 2 Caminhos diferenciáveis 187 2.1. Aplique o Teorema de Rolle à função ϕ : [a, b] → R, definida por ϕ(t) = |f (t)|2 . 2.2. Simplificamos a notação, escrevendo x • y em vez de ϕ(x, y). Então podemos ver que f1 (t + h) • f2 (t + h) − f1 (t) • f2 (t) = =f1 (t + h) • [f2 (t + h) − f2 (t)] + [f1 (t + h) − f1 (t)] • f2 (t). Dividindo por h e fazendo h → 0 vem g ′ (t) = f1′ (t) • f2 (t) + f1 (t) • f2′ (t). O caso de aplicações p-lineares segue as mesmas linhas: se g(t) = f1 (t) • · · · • fp (t) então p P g ′ (t) = f1 (t) • · · · • fi′ (t) • · · · • fp (t). Quanto ao determinante de uma matriz i=1 m × m, basta notar que ele é uma função m-linear das linhas dessa matriz, a qual assume o valor 1 na matriz identidade m × m. 2.3. A aplicação g é diferenciável (de fato, C ∞ ) porque é a composta t 7→ f (t) 7→ 2 2 ϕ (f (t), . . . , f (t)) −→ f (t)k , onde ϕ : Rn × · · · × Rn é a aplicação k-linear dada pelo produto de matrizes. Rb Rb Rb 3.1. Temos |f (b) − f (a)| = | a f ′ (t)dt| ≤ a |f ′ (t)|dt ≤ a ϕ′ (t)dt = ϕ(b) − ϕ(a). 3.2. Aplique a cada uma das funções-coordenada do caminho f o resultado correspondente já provado no Volume 1 (pag. 135). 3.3. Note que hf (b), g(b)i − hf (a), g(a)i = Z b ϕ′ (t)dt, a onde ϕ(t) = hf (t), g(t)i. Observe ainda que ϕ′ (t) = hf ′ (t), g(t)i + hf (t), g ′ (t)i. 3.4. De um modo geral, se A : Rm → Rn é uma transformação linear e f :R I → Rm Rb b n é um caminho então t 7→ A·f (t) é um caminho em R com a A·f (t)dt = A· a f (t)dt. Isto se vê diretamente a partir da definição de integral de um caminho. Em seguida, note que w 7→ v × w é um operador linear em R3 . 3.5. Aqui usaremos um resultado elementar sobre conjuntos convexos, a ser demonstrado no Capı́tulo 3 (Teorema 7): se A ⊂ Rn é convexo e α1 + · · · + αk = 1 k P com α1 ≥ 0, . . . , αk ≥ 0 então x1 , . . . , xk ∈ A ⇒ αi xi ∈ A. Daı́ resulta que i=1 se (Pk∗ ) é uma seqüência de partições pontilhadas de [a, b] com lim |Pk | = 0 então Z b P 1 1 1 P · f ; Pk∗ ∈A para todo k∈N, portanto f (t)dt = (f, Pk∗ )= b−a b−a b−a a X 1 lim (f ; Pk ) ∈ A. k→∞ b − a 4.1. Para toda partição P = {a = t0 < t1 < · · · < tk = b} tem-se |B − A| ≤ ℓ(f ; P ) ≤ ℓ(f ). Como ℓ(f ) = |B − A|, segue-se que ℓ(f ; P ) = |B − A|. Resulta então do Exercı́cio 1.2 do Capı́tulo 1 que os pontos A = f (t0 ), f (t1 ), . . . , f (tk ) = B estão dispostos ordenadamente sobre o segmento de reta AB. Então, para todo t ∈ [a, b], tem-se f (t) = A + ϕ(t) · v, com v = B − A, e a função ϕ : [a, b] → [0, b] é não-decrescente. Como f ∈ C 1 , segue-se do Exercı́cio 11.5 que ϕ ∈ C 1 e, como é não-decrescente, ϕ′ ≥ 0. Logo f é uma reparametrização do caminho retilı́neo f (t) = A + t · v. 188 Soluções dos exercı́cios Cap. 10 4.2. Seja g : [0, L] → R2 tal que g ′ (t) = f (t) para todo t. (As funções-coordenada RL RL RL de g são primitivas das de f .) Então ℓ(g) = 0 |g ′ (t)|dt = 0 |f (t)|dt = 0 dt = L. Por RL RL outro lado, observando que | 0 f (t)dt| = L, vemos que |g(L) − g(0)| = | 0 g ′ (t)dt| = RL | 0 f (t)dt| = L. Pelo exercı́cio anterior, temos g(t) = g(0) + ϕ(t) · v, com v = g(L) − g(0). Logo 1 = |f (t)| = |g ′ (t)| = |ϕ′ (t)| · |v| = ϕ′ (t) · |v| pois ϕ′ ≥ 0, já que ϕ não muda de sinal, ϕ(0) = 0 e ϕ(L) = 1. Assim, ϕ′ (t) = 1/|v| é constante e o mesmo se dá com f (t) = ϕ′ (t) · v. 4.3. Fixando a ∈ U , seja A o conjunto dos pontos de U que podem ser ligados a a por um caminho poligonal contido em U . É fácil ver que A é aberto e que também é aberto o conjunto B dos pontos que não podem ser ligados a a por um caminho poligonal contido em U . Então U = A ∪ B é uma cisão. Como U é conexo e A 6= ∅, segue-se que U = A. Evidentemente todo caminho poligonal é retificável. 4.4. É claro que |x − a| ≤ dU (x, a) logo lim dU (xk , a) = 0 ⇒ lim xk = a. Para provar a recı́proca, basta observar que se B = B(a; r) é uma bola aberta contida em U então, para pontos xk ∈ B, tem-se dU (xk , a) = |xk − a|, portanto lim xk = a ⇒ lim |xk − a| = 0 ⇒ lim dU (xk , a) = 0 pois xk ∈ B para todo k suficientemente grande. 3 Funções reais de n variáveis 1.1. Se x e x + tei pertencem a U então [x, x + tei ] ⊂ U e f (x + tei ) − f (x) = ∂f (x + θtei ) · t = 0, onde 0 < θ < 1. ∂xi 1.3. Dois pontos quaisquer de uma bola podem ser ligados por um caminho poligonal contido nela, o qual tem seus lados paralelos aos eixos. Segue-se daı́, pelo argumento usado no Exercı́cio 4.3 do Capı́tulo 2, que o mesmo ocorre em qualquer aberto conexo. Fixando a ∈ U , para todo ponto x ∈ U , unindo-o ao ponto a por um caminho desse tipo, em cada segmento retilı́neo do caminho varia apenas a ∂f = 0, a função f se mantém constante ao longo desse i-ésima coordenada e, como ∂xi segmento. Então f (x) = f (a) para todo x ∈ U e f é constante. ∂f 1.4. Seja M ≥ (x) para todo x ∈ U e todo i = 1, 2, . . . , n. Dados x, x + ∂xi v ∈ U , com v = (α1 , . . . , αn ), definamos v0 , v1 , . . . , vn ∈ Rn pondo v0 = 0 e vi = vi−1 + αi ei para i = 1, . . . , n, de modo que vn = v. Então f (x + v) − f (x) = n P f (x + vi ) − f (x + vi−1 ). Pelo Teorema do Valor Médio de uma só variável, temos i=1 |f (x + vi ) − f (x + vi−1 )| = M· n P i=1 ∂f (z) · αi , onde z ∈ [vi−1 , vi ]. Logo |f (x + v) − f (x)| ≤ ∂xi |αi | e daı́ resulta a continuidade de f . (tα)2 tβ α2 β 1 ∂f (0, 0) = lim · = 2 para todo 2 2 t→0 t ∂v (tα) + (tβ) α + β2 ∂f ∂f (0, 0) = 0 e (0, 0) = 0, logo grad f (0, 0) = 0. Se f fosse v 6= 0. Em particular, ∂x ∂y ∂f diferenciável no ponto (0, 0), terı́amos (0, 0) = h grad f (0, 0), vi, o que não ocorre. ∂v 2.1. Se v = (α, β) então Funções reais de n variáveis Seção 3 189 ∂f (u) > 0 se u ∈ S n−1 implica que f (tu) < f (u) para 1 − ε < ∂u t < 1 e ε > 0 suficientemente pequeno. (Cfr. Teorema 4 do Cap. 8, vol. 1.) Portanto o mı́nimo de f (x) para |x| ≤ 1 é atingido num ponto a tal que |a| < 1. Então ϕ(t) = f (a + tv) tem, para todo v ∈ Rn , um mı́nimo local quando t = 0, logo ∂f (a) = ϕ′ (0) = 0. ∂v 2.3. Tem-se f (0) = lim f (tx) = lim t · f (x) = 0. Logo, para todo v ∈ Rn , 2.2. A condição t→0+ t→0+ f (tv) tf (v) ∂f (0) = lim = lim = f (v), ou seja, h grad f (0), vi = f (v). Mudando ∂v t t t→0+ t→0+ a notação, temos f (x) = h grad f (0), xi portanto f é uma função linear de x. A função ϕ cumpre ϕ(tx, ty) = t · ϕ(x, y) para todo t > 0 mas não é linear, logo não é diferenciável no ponto (0, 0). (Observação: quando sabemos que um caminho possui limite num ponto, podemos calculá-lo como um limite lateral.) P ∂f (a) · (xi − ai ) + r(x) mostra que r é uma 2.4. A igualdade f (x) = f (a) + ∂xi ∂r (a) = 0 para i = 1, . . . , n. A continuidade das derivadas função de classe C 1 , com ∂xi ∂r no ponto a e o Teorema do Valor Médio nos asseguram então que, para todo ε > 0 ∂xi dado, existe δ > 0 tal que |x − a| < δ e |y − a| < δ implicam |r(x) − r(y)| < ε|x − y|. Subtraindo membro a membro as desigualdades f (x) = f (a)+h grad f (a), x−ai+r(x) e f (y) = f (a)+h grad f (a), y −ai+r(y) vem f (x)−f (y) = h grad f (a), x−yi+r(x, y), onde, escrevendo r(x, y) = r(x) − r(y), temos |x − a| < δ, |y − a| < δ ⇒ |r(x, y)| < ε|x − y|. ∂ ∂f ∂f ∂ ∂f 3.1. Como não depende de e são identicamente nulas, ∂x ∂y ∂y ∂x ∂y ∂f não depende de y. Fixando (x0 , y0 ) ∈ I × J podemos então definir as funções xe ∂x ∂f ∂f ϕ̄ : I → R e ψ̄ : J → R pondo ϕ̄(x) = (x, y0 ) e ψ̄(y) = (x0 , y), as quais são de ∂x ∂y ∂f ∂f (x, y), ψ̄(y) = (x, y) para todo (x, y) ∈ I × J. classe C 1 e cumprem ϕ̄(x) = ∂x ∂y Então f (x, y) = f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 ) + f (x0 , y0 ) = Z y Z x ∂f ∂f (s, y)ds + (x0 , t)dt + f (x0 , y0 ) = = y0 ∂y x0 ∂x Z x Z y = ϕ̄(s)ds + ψ̄(t)dt + f (x0 , y0 ) = ϕ(x) + ψ(y). x0 y0 3.2. Defina f : R × R → R, pondo f (x, y) = g(x + y, x − y). Verifique que ∂2f ∂x∂y é identicamente nula e aplique o exercı́cio anterior. 3.3. Derivando duas vezes em relação a t, a igualdade f (tx) = t2 · f (x) nos dá 1 P ∂2f f (x) = (tx)xi xj . Tomando o limite quando t → 0 por valores positivos 2 i,j ∂xi ∂xj P 1 ∂2f (0). chegamos a f (x) = aij xi xj , onde aij = 2 ∂xi ∂xj 190 Soluções dos exercı́cios Cap. 10 ∂ϕ ∂ϕ (x)i = 0, hf (x), (x)i = 0, derive a pri∂xi ∂xj meira em relação a xj e a segunda em relação a xi . Use Schwarz. 3.4. Tome as igualdades hf (x), 4.1. Isto é óbvio para k = 1, pela própria definição de diferenciabilidade e, para k = 2, foi provado no texto. No caso geral, pela hipótese de indução, considerando ∂r que as derivadas parciais se anulam, junto com todas as suas derivadas até a ∂xi | grad r(x)| ordem k − 1, no ponto 0, conclui-se que lim = 0. Ora, pelo Teorema do x→0 |x|k−1 Valor Médio, para todo x numa bola de centro 0 contida em U , existe θ ∈ (0, 1) tal que r(x) = r(x) − r(0) = h grad r(θx), xi, logo |h grad r(θx), xi| | grad r(θx)| |r(x)| = ≤ , |x|k |x|k |x|k−1 |r(x)| = 0. |x|k 4.2. Siga as mesmas linhas da demonstração do Teorema 5 (Cap. 3), fazendo uso ∂3f 1 P do exercı́cio anterior e observando que, na expressão (a)αi αj αk a 3! i,j,k ∂xi ∂xj ∂xk i-ésima variável αi ocorre em 3 parcelas (como 1o¯ , 2o¯ ou 3o¯ fator), logo a derivada 1P ∂3f dessa expressão relativamente à sua i-ésima variável é igual a (a)αj αk . 2 j,k ∂xi ∂xj ∂xk O caso geral é análogo. portanto lim x→0 5.1. Se [hij ] é a matriz da forma quadrática H então hii = H · v 2 , com v = ei = (0, . . . , 1, . . . , 0). Portanto os elementos da diagonal da matriz de uma forma quadrática positiva (ou negativa) são todos números positivos (ou negativos) e assim sua soma não pode ser igual a zero. 5.2. Seja X o conjunto dos pontos de máximo local estrito de f . Dado x ∈ X, existe uma bola B(x; 2δ), contida em U , tal que y ∈ B(x; 2δ), y 6= x ⇒ f (y) < f (x). Escolhamos, para cada x ∈ X, um ponto qx ∈ Qn ∩ B(x; δ) e um número racional rx > 0 tal que |x − qx | < rx < δ, portanto B(qx ; rx ) ⊂ B(x; 2δ) e daı́ y ∈ B(qx ; rx ), y 6= x ⇒ f (y) < f (x). A correspondência x 7→ (qx , rx ) é injetiva pois se qx = qx′ e rx = rx′ então x′ ∈ B(qx ; rx ) e x ∈ B(qx′ ; rx′ ). Se fosse x 6= x′ terı́amos f (x)′ < f (x) e f (x) < f (x′ ). 5.3. Como grad f (x, y) = −2 sen(x2 + y 2 ) · (x, y), os pontos crı́ticos de f são a origem x = y = 0 e os pontos das circunferências com centro na origem e raios iguais √ a kπ, k ∈ N. Quanto à função g(x, y) = x3 − y 3 − x + y, cujo gradiente é o vetor 6x 0 2 2 . Os grad g(x, y) = (3x − 1, −3y + 1), sua matriz hessiana é Hg(x, y) = 0 −6y √ √ √ √ √ √ pontos crı́ticos √ de g√são A = ( 3/3, 3/3), B = (− 3/3. 3/3), C = ( 3/3, − 3/3) e D = (− 3/3, pontos, a matriz hessiana de g assume cada um −√ 3/3). Nesses 0√ ±2 3 , os sinais correspondendo aos das coordenadas de A, dos 4 valores 0 ±2 3 B, C e D. Logo Hg, é positiva no ponto C, que é portanto um ponto de mı́nimo local, negativa no ponto B de máximo local e, nos pontos crı́ticos A e D, a forma hessiana Hg é indefinida, logo esses pontos não são máximos nem mı́nimos locais: são os chamados “pontos de sela”. Funções reais de n variáveis Seção 3 191 5.4. A função F : U → R, definida por F (x) = f (x) se x ∈ U e F (x) = 0 se x ∈ fr .U , é contı́nua no compacto U e diferenciável em U . A menos que F seja identicamente nula (em cujo caso todo ponto de U é crı́tico para f ), seu valor máximo ou seu valor mı́nimo é atingido num ponto a ∈ U , o qual é um ponto crı́tico de f . ∂f ∂f 5.5. Como = 2x(2x2 − 2y 2 − 1) e = 2y(2y 2 − 2x2 + 3), os pontos crı́ticos ∂x ∂y √ −2 0 e de f são (0, 0) e (± 22 , 0), onde as matrizes hessianas são Hf (0, 0) = 0 6 √ 4 0 Hf (± 22 , 0) = . Portanto a origem (0, 0) é um ponto de sela (máximo em 0 4 √ relação a x e mı́nimo em relação a y) enquanto os pontos (± 22 , 0) são de mı́nimo local. k,n k P P 5.6. Temos f (x) = hx − ai , x − ai i = (xj − aij )2 onde x = (x1 , . . . , xn ) i=1 i,j=1 P ∂f (x) = 2(kxj − aij ). ∂xj i 1P Portanto, o ponto x é crı́tico para f se, e somente se, xj = aij para todo j, ou k i k 1 P ai . (Baricentro do sistema formado pelos pontos a1 , . . . , ak .) Temos seja, x = k i=1 ∂2f ∂2f (x) = 0 se m 6= j e (x) = 2k, portanto a matriz hessiana é diagonal ainda ∂xm ∂xj ∂x2j k 1 P e positiva, logo o ponto crı́tico x = ai é de mı́nimo. (Note que f é convexa.) k i=1 e ai = (ai1 , . . . , ain ). Então, para j = 1, . . . , n, temos 6.1. Para x, y ∈ Rn e t ∈ [0, 1], sejam x̄, ȳ ∈ A tais que d(x, A) = |x − x̄| e d(y, A) = |y − ȳ|. Então (1 − t)x̄ + tȳ ∈ A (pois o fecho de um conjunto convexo é também convexo). E como d(x, A) = d(x, A), temos: f ((1 − t)x + ty) = d((1 − t)x + ty, A) ≤ |[(1 − t)x + ty] − [(1 − t)x̄ + tȳ]| = |(1 − t)(x − x̄) + t(y − ȳ)| ≤ (1 − t)|x − x̄| + t|y − ȳ| = (1 − t)f (x) + tf (y). 6.2. Seja a ∈ X um ponto de mı́nimo local da função convexa f : X → R. Se existisse x ∈ X tal que f (x) < f (a) então, para todo t ∈ [0, 1], terı́amos f ((1 − t)a + tx) ≤ (1 − t)f (a) + tf (x) < (1 − t)f (a) + tf (a) = f (a). Tomando t > 0 pequeno, obterı́amos pontos y = (1 − t)a + tx tão próximos de a quanto se deseje, com f (y) < f (a), logo a não seria um ponto de mı́nimo local. 6.3. Todo ponto a ∈ U é ponto médio de segmentos de reta [b, c] ⊂ U tão 1 pequenos quanto se queira, logo f (a) ≤ [f (b) + f (c)] e então não se pode ter f (a) > 2 f (b) e f (a) > f (c). 6.4. Se a, b ∈ U são pontos crı́ticos da função convexa diferenciável f : U → R então ambos são pontos de mı́nimo global de f . Em particular, f (a) = f (b). Assim, t ∈ [0, 1] ⇒ f ((1 − t)a + tb) ≤ (1 − t)f (a) + tf (b) = f (a), donde f ((1 − t)a + tb) = f (a) pela minimalidade. 6.5. Se f (x) ≤ c e f (y) ≤ c então, para todo t ∈ [0, 1], vale f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y) ≤ (1 − t)c + tc = c. Para toda função monótona f : I → R, definida num intervalo I ⊂ R, o conjunto {x ∈ I; f (x) ≤ c} é um intervalo, mas f pode não ser convexa. 192 Soluções dos exercı́cios Cap. 10 6.6. Para f : X → R quase-convexa e x, y ∈ X, seja c = max{f (x), f (y)}. Então f (x) ≤ c e f (y) ≤ c, logo f ((1 − t)x + ty) ≤ c = max{f (x), f (y)} para todo t ∈ [0, 1]. Reciprocamente, supondo que f ((1 − t)x + ty) ≤ max{f (x), f (y)} para quaisquer x, y ∈ X e t ∈ [0, 1], sejam x, y ∈ X tais que f (x) ≤ c e f (y) ≤ c. Então max{f (x), f (y)} ≤ c, portanto t ∈ [0, 1] ⇒ f ((1 − t)x + ty) ≤ max{f (x), f (y)} ≤ c e f é quase-convexa. 4 Funções implı́citas 1.1. Seja X o conjunto dos pontos x0 ∈ R que têm uma vizinhança V na qual está definida uma função ξ tal que f (x, ξ(x)) = 0 para todo x ∈ V . Esta função é ∂f única, pois a condição 6= 0 assegura que f é monótona ao longo de cada reta ∂y vertical. Logo, podemos considerar ξ : X → R. Pelo Teorema da Função Implı́cita, X é aberto e ξ é de classe C k . Cada intervalo I, componente de X, é fechado pois ∂f /∂x , temos |ξ ′ | ≤ M em I, se xk ∈ I ⊂ X e lim xk = x0 então, como ξ ′ = − ∂f /∂y portanto ξ : I → R é uniformemente contı́nua e, assim, existe y0 = lim ξ(xk ), com f (x0 , y0 ) = lim(xk , ξ(xk )) = 0. Pelo Teorema da Função Implı́cita, temos x0 ∈ X. Como R é conexo e X 6= ∅, segue-se que X = R. ∂f 1.2. Em cada ponto x0 ∈ A, uma das derivadas parciais de f , digamos , ∂xi é 6= 0. Logo f transforma um segmento de reta paralelo ao i-ésimo eixo, contendo x0 e pequeno bastante para estar contido em A, injetiva e monotonamente sobre um intervalo contendo f (x0 ) e contido em f (A), portanto f (A) é aberto. ∂f = cos z 6= 0 numa vizinhança da origem, logo perto de 0 1.3. Temos ∂z a equação x4 + 2x · cos y + sen z = 0 define z como função de x e y. Tem-se −∂f /∂x −(4x3 + 2 cos y) −∂f /∂y ∂z ∂z 2x sen y = = e = = · ∂x ∂f /∂z cos z ∂y ∂f /∂z cos z 1.4. A função ξ : R → [0, 1) é definida por ξ(0) = 0 e ξ(x) = e−|x| se x 6= 0. Ela é a única função com valores em [0, 1) que cumpre f (x, ξ(x)) = 0 mas não é contı́nua. ∂ϕ (x, y) = 1.5. Seja ϕ : Rn+1 → R definida por ϕ(x, y) = g(x)−y(1+y 4 ). Então ∂y −1 − 5y 4 6= 0 para todo (x, y) ∈ Rn+1 . Assim, para todo x0 ∈ Rn , pondo y0 = f (x0 ) temos ϕ(x0 , y0 ) = 0. Pelo Teorema da Função Implı́cita, existem uma bola B = B(x0 , δ) ⊂ Rn , um intervalo J = [y0 − ε, y0 + ε] e uma função ξ : B → J de classe C k tais que, para todo x ∈ B, ξ(x) é o único ponto em J tal que ϕ(x, ξ(x)) = 0. Como f é contı́nua (prove isto!), podemos tomar δ > 0 tão pequeno que f (B) ⊂ J. E, sabendo que ϕ(x, f (x)) = 0 para todo x ∈ B, concluı́mos que f (x) = ξ(x) se x ∈ B, portanto f é de classe C k . 2 2.1. Seja U ⊂ Rn o conjunto aberto formado pelas matrizes x do tipo n × n para as quais pelo menos um determinante menor Xij é 6= 0. A ij-ésima derivada parcial ∂f x) = det .x x é x) = (−1)i+j Xij , portanto todo da função f : U → R, dada por f (x (x ∂xij número c ∈ R é um valor regular de f . Como M = f −1 (0), concluı́mos que M é uma hiperfı́cie orientável. O espaço tangente Tp M é formado pelas matrizes x ortogonais x) são (−1)i+j Xij . Logo grad f (pp) é a a grad f (pp). Ora, as coordenadas de grad f (x Seção 4 Funções implı́citas 193 matriz n × n cujo único elemento não-nulo é igual a 1 e está na n-ésima linha com a n-ésima coluna. Portanto, uma matriz x = [xij ] é ortogonal a grad f (pp) se, e somente se, xnn = 0. Tais matrizes formam o espaço Tp M . 2.2 Seja U = {(x, y, z) ∈ R3 ; x2 + y 2 6= 0} o complementar do eixo vertical em p R3 . A função f : U → R, definida por f (x, y, z) = z 2 + ( x2 + y 2 − 2)2 , é de classe ! p p 2x( x2 + y 2 − 2) 2y( x2 + y 2 − 2) ∞ p p , , 2z , C e seu gradiente é grad f (x, y, z) = x2 + y 2 x2 + y 2 o qual se anula apenas nos pontos da circunferência x2 + y 2 = 4, z = 0, todos no nı́vel zero de f . Portanto 1 é valor regular e f −1 (1) = M é uma superfı́cie C ∞ em R3 . M é o toro obtido pela rotação de uma circunferência vertical de raio 1, cujo centro descreve a circunferência x2 + y 2 = 4 no plano z = 0. 2.3. Dado p ∈ M , podemos escrever os pontos de Rn+1 sob a forma (x, y), com x ∈ Rn , y ∈ R e tomar um aberto U ⊂ Rn+1 com p ∈ U , tal que V = M ∩ U seja o gráfico V = {(x, ξ(x)); x ∈ V0 } de uma função ξ : V0 → R, de classe C k (k ≥ 1). Então a função f : U → R, definida por f (x, y) = y − ξ(x), não possui pontos crı́ticos ∂f pois ≡ 1. Além disso, V = f −1 (0), portanto em cada ponto z ∈ V , o vetor ∂y v(z) = grad f (z) é ortogonal a Tz M , portanto v : V → Rn+1 é um campo de classe C k−1 de vetores não-nulos normais a M . 3.1. Sejam f, ϕ : Rn+1 → R dadas por f (x) = |x|2 e ϕ(x) = hAx, xi. Então grad f (x) = 2x e grad ϕ(x) = 2Ax. Os pontos crı́ticos de f |M , onde M = ϕ−1 (1) são os pontos x ∈ M tais que grad f (x) = λ · grad ϕ(x), ou seja, x = λ · Ax, logo x é um autovetor de A, correspondente ao autovalor λ−1 . De x = λ · Ax resulta que |x|2 = hx, xi = λhAx, xi = λ. Portanto, quando x varia em M , o maior valor de |x|2 é o maior λ tal que 1/λ é autovalor de A. Noutras palavras, a maior distância de um √ ponto do elipsóide M à origem é 1/ µ, onde µ = 1/λ é o menor autovalor de A. n+1 3.2. Sejam f, ϕ : R → R, f (x) = |x − a|2 , ϕ(x) = hb, xi, H = ϕ−1 (c), grad f (x) = 2(x − a), grad ϕ(x) = b. Se x ∈ H é ponto crı́tico de f |H então hb, xi = c λ e 2(x − a) = λb, ou seja, x = a + b. O produto interno da última igualdade por b nos 2 c − hb, ai c − hb, ai λ 2 λ dá c = hb, xi = hb, ai + |b| , donde = , e daı́ x = a + b. Este 2 2 |b|2 |b|2 2 é o único ponto crı́tico de f |H, logo é o ponto em que |x − a| (e portanto |x − a|) atinge seu menor valor com x ∈ H. 3.3. Consideradas as funções f, ϕ : R2n → R, f (x, y) = hx, yi e ϕ(x, y) = |(x, y)|2 = |x|2 +|y|2 , temos M = ϕ−1 (1), grad f (x, y) = (y, x) e grad ϕ(x, y) = 2(x, y). Portanto (x, y) ∈ M é ponto crı́tico de f |M se, e somente se, (y, x) = 2λ(x, y) logo 1 y = 2λx e x = 2λy, o que nos dá λ = ± e y = ±x. Assim, os pontos crı́ticos de f |M 2 1 são os da forma (x, ±x) com |x|2 = · Os pontos (x, x) são de máximo e os (x, −x) 2 1 1 para todo (x, y) ∈ M . Para todo par de vetores de mı́nimo, logo − ≤ hx, yi ≤ 2 √ √ √ 2 √ 2 2 2 2 1 não-nulos x, y ∈ Rn , tem-se x, y ∈ M , portanto h x, yi ≤ e daı́ 2|x| 2|y| 2|x| 2|y| 2 √ √ 2 2 x=± y, isto é, quando |hx, yi| ≤ |x| |y|, a igualdade valendo apenas quando 2|x| 2|y| x e y são colineares. 194 Soluções dos exercı́cios 3.4. 2 Seja ϕ : Rn x) = → R, ϕ(x Cap. 10 P x2ij . x) = (−1)i+j Xij e Como grad f (x i,j x) = 2[xij ], onde Xij é o ij-ésimo determinante menor de x , se M = ϕ−1 (n), grad ϕ(x o máximo de f |M é atingido na matriz x tal que (*) (−1)i+jP Xij = 2λxij , donde (−1)i+j Xij xij = 2λx2ij . Somando em i e j: n · det x = 2λ x2ij = 2λ · n, logo P i,j P det x = 2λ. Fixando i e somando em j, vem: det x = 2λ · x2ij = det x · x2ij , logo j j as linhas de x têm comprimento 1. A igualdade (*) também dáP(−1)i+j Xij xkj = 2λxij xkj . Tomando k 6= i e somando em j, obtemos 0 = det x · xij xkj , portanto j as linhas de x são duas a duas ortogonais. Assim, x é uma matriz ortogonal, com det x = 1. Daı́ resulta a desigualdade de Hadamard. √ √ √ 3.5. Suponhamos que s = n p + · · · + n p = n n p não seja a menor soma de n números positivos cujo produto é p. Então existiria s̄ = x1 + · · · + xn < snas mesmas s̄ n s n condições. Ora, pelo Exemplo 9, terı́amos x1 · x2 · · · xn ≤ < < p, uma n n contradição. 5 Aplicações diferenciáveis 1.1. Como o operador f ′ (0) não possui ponto fixo no compacto S n−1 , existe ε > 0 tal que |u| = 1 ⇒ |f ′ (0)·u−u| com f (0) = 0, temos f (x) = ≥ ε. Sendo f diferenciável, x ′ ′ f (0) · x + ρ(x) · |x| = |x| f (0) · + ρ(x) e existe δ > 0 tal que 0 < |x| < δ ⇒ |x| x x −|ρ(x)| >0 |ρ(x)| < ε. Portanto, se 0 < |x| < δ então |f (x) − x| ≥ |x| f ′ (0)· − |x| |x| e daı́ f (x) 6= x. 1.2. Pela definição de F , tem-se F (tx)/t = F (x) se t > 0 e F (tx)/t = −F (−x) F (tx) se t < 0. Como F (0) = 0, supondo F diferenciável no ponto 0, existe lim , t→0 t F (tx) = F ′ (0) · x, portanto F coincide com a logo F (x) = −F (−x) e F (x) = lim t→0 t ′ m+1 n transformação linear F (0) : R → R . A recı́proca é óbvia. 1.3. Aplicando oTeorema de Schwarz função-coordenada de f , vemos que a cada ∂f ∂f ∂ ∂ ′′ (a) = (a) = f ′′ (a) · ej · ei e, por bilinearidade, f (a) · ei · ej = ∂xj ∂xi ∂xi ∂xj resulta que f ′′ (a) · u · v = f ′′ (a) · v · u para quaisquer u, v. 1.4. Isto se reduz ao Exercı́cio 2.1 do Capı́tulo 2 se observarmos que f ′ (x) · v é o vetor velocidade do caminho f ◦ λ, onde λ : (−ε, ε) → U é tal que λ(0) = x e λ′ (0) = v. 2.1. Seja R(h, k) = A(x + h) · (v + k) − A(x) · v − (A′ (x) · h) · v − A(x) · k = (A(x + h) − A(x) − A′ (x) · h) · v + (A(x + h) − A(x)) · k = r(h) · v + s(h) · k, onde r(h) |r(h)| |r(h)| |k| lim = 0 e lim s(h) = 0. Então, como ≤ e ≤ 1, segue-se h→0 |h| h→0 |h| + |k| |h| |h| + |k| R(h, k) que lim = 0. h,k→0 |h| + |k| Seção 6 Aplicações Inversas e Implı́citas 195 a −b 2.2. A matriz da transformação linear f ′ (z0 ), sendo da forma , pode b a √ a cos θ − sen θ ser escrita como ρ com ρ = a2 + b2 , cos θ = √ , sen θ = sen θ cos θ a2 + b 2 b √ , logo f ′ (z0 ) é uma rotação de ângulo θ seguida de uma homotetia de razão a2 + b 2 ρ, portanto preserva ângulos. 2.3. As colunas da matriz jacobiana de f são (2x, 0, 2(x + y)) e (0, 2y, 2(x + y)), que são L.I. salvo quando x = y = 0; 2.4. As linhas da matriz jacobiana de f são (2x, −2y, 0), (y, x, 0), (z, 0, x) e (0, z, y). Se x2 + y 2 6= 0, as 3 primeiras são L.I. caso x 6= 0 e a 1a¯ , a 2a¯ e a 4a¯ são L.I. quando y 6= 0. A imagem de f ′ (0, 0, z) é o plano formado pelos pontos (0, 0, s, t) em R4 . 2.5. Basta notar que as linhas da matriz jacobiana de f são (1, 1, 1), (2x, 2y, 2z) e (3x2 , 3y 2 , 3z 2 ), logo o jacobiano de f é igual a 6(z − x)(z − y)(y − x). 3.1. Suponhamos, por absurdo, que |f ′ (x)| > M , ou seja, |f ′ (x)| = M + ε, ε > 0, para algum x ∈ U . Como |f ′ (x)| é o máximo de |f ′ (x) · u| para |u| = 1 e S m−1 é compacta, existiria u ∈ Rm com norma 1, tal que |f ′ (x) · u| = M + ε. Pela definição de diferenciabilidade, a este ε corresponde δ > 0 tal que 0 < t < δ ⇒ |f (x + tu) − f (x)| = |f ′ (x) · tu + r(tu)| ≥ t|f ′ (x) · u| − |r(tu)|, com |r(tu)| < tε. Então 0 < t < δ ⇒ |f (x + tu) − f (x)| > t(M + ε) − tε = t · M . Pondo v = tu, temos |v| = t, logo |f (x + v) − f (x)| > M · |v|, uma contradição. 3.2. Tem-se ϕ′ (x) · h = h(T ′ (x) · h) · f (x), g(x)i + hT (x) · f (x), g ′ (x) · hi + hT (x) · ′ (f (x) · h), g(x)i. 3.3. Levando em conta que (g ◦ f )′ = (g ′ ◦ f ) · f ′ , vale: (g ◦ f )′′ = [(g ′ ◦ f ) · f ′ ]′ = ′ (g ◦ f )′ · f ′ + (g ′ ◦ f ) · f ′′ = (g ′′ ◦ f ) · f ′ · f ′ + (g ′ ◦ f ) · f ′′ . Isto significa que, para x ∈ U , y = f (x) ∈ V e u, v ∈ Rm , tem-se: (g ◦ f )′′ (x) · u · v = g ′′ (y) · (f ′ (x) · u) · (f ′ (x) · v) + g ′ (y) · f ′′ (x) · u · v ∈ Rp . 3.4. A interpretação correta é ϕ′ (t) · v = [A′ (tx) · x] · v, v ∈ Rm . Para dirimir a confusão, suponha que U ⊂ Rp e não U ⊂ Rm . Então A′ (tx) ∈ L(Rp ; Rn ), logo A′ (tx) · v não faz sentido. 3.5. Aplique a Desigualdade do Valor Médio a g : U → Rn , definida por g(x) = f (x) − T · x. 3.6. Tem-se ϕ′ (x) · v = (f ′ (x) · v) · a = h grad f (x), vi · a. 6 Aplicações Inversas e Implı́citas 1.1. Pelo Exercı́cio 3.1 do Capı́tulo 5, temos |ϕ′ (x) · v| < c|v| < |v| para todo x ∈ U e todo v ∈ Rm − {0}, logo |f ′ (x) · v| = |v + ϕ′ (x) · v| ≥ |v| − |ϕ′ (x) · v| > 0 se v 6= 0. Assim, f ′ (x) : Rm → Rm é um isomorfismo, para todo x ∈ U . Pelo Teorema da Aplicação Inversa, f é um difeomorfismo local, portanto transforma cada aberto A ⊂ U num aberto f (A) ⊂ Rm . Além disso, y ∈ U ⇒ |f (x) − f (y)| = |x − y + ϕ(x) − ϕ(y)| ≥ |x − y| − c|x − y| = (1 − c)|x − y| portanto f é injetiva, logo é um difeomorfismo de U sobre o aberto f (U ). Suponhamos agora U = Rm . Para provar que f (Rm ) é fechado, seja (xk ) uma seqüência tal que lim f (xk ) = y ∈ Rm . 1 Como |xk −xr | ≤ |f (xk )−f (xr )|, vemos que (xk ) é de Cauchy portanto converge: 1−c 196 Soluções dos exercı́cios Cap. 10 lim xk = x. Então f (x) = lim f (xk ) = y ∈ f (Rm ). Assim, f (Rm ) é aberto e fechado. Como Rm é conexo, tem-se f (Rm ) = Rm . 2 2 x) = x k , é de classe C ∞ , com 1.2. A aplicação f : Rn → Rn , definida por f (x k P x) · v = f ′ (x x i−1 · v · x k−i . No ponto x = I n (matriz identidade n × n), temos i=1 f ′ (II n ) · v = kvv , logo f ′ (II n ) é um isomorfismo. Pelo Teorema da Aplicação Inversa, existem abertos U , V , ambos contendo I n , tais que f é um difeomorfismo de U sobre V . Eles respondem a questão. 1.3. Em primeiro lugar, note que o conjunto U dos operadores positivos é aberto no espaço vetorial Rn(n+1)/2 dos operadores auto-adjuntos (matrizes simétricas). Isto resulta do critério clássico de positividade: os n menores principais da matriz são positivos. A bijetividade de f é um corolário do Teorema Espectral, segundo o qual todo operador positivo possui uma única raiz quadrada positiva. Resta apenas provar que, para todo X ∈ U , a derivada f ′ (X) : Rn(n+1)/2 → Rn(n+1)/2 é um isomorfismo. Ora, temos f ′ (X) · V = X · V + V · X. Seja {u1 , . . . , un } uma base de Rn formada por autovetores de X, com X · ui = λi ui . Então f ′ (X) · V = 0 ⇒ XV ui + λi V ui = 0 ⇒ X(V ui ) = −λi · (V ui ). Como X não possui autovalores negativos, tem-se V · ui = 0 (i = 1, . . . , n), logo V = 0 e f ′ (X) é injetiva, logo bijetiva. 1.4. Observação preliminar: se U ⊂ Rn é aberto, com n > 1, e q ∈ Rn é um ponto isolado da fronteira de U então U ∪ {q} é aberto. Com efeito, seja B uma bola aberta de centro q, que não contenha outro ponto de fr .U além de q. Como n > 1, o aberto B − {q} é conexo e certamente contém pontos de U pois q ∈ fr .U , mas não contém pontos fora de U pois, pelo Teorema da Alfândega, teria de conter pontos de fr .U . Então B − {q} ⊂ U e daı́ B ⊂ U ∪ {q}, logo q ∈ int .U ∪ {q} e U ∪ {q} é aberto. Isto posto, notemos que basta considerar o caso em que p ∈ U é o único ponto onde det .Jf se anula. Então f em U − {p} é um difeomorfismo local, logo transforma abertos em abertos. É suficiente agora provar que f (U ) é aberto. Isto é claro se existir x 6= p em U com f (x) = f (p). Suporemos então que, pondo q = f (p), temos q 6= f (x) para todo x 6= p em U . Sejam B = B(p; r) tal que B ⊂ U e S = S(p; r). A fronteira do aberto V = f (B − {p}) é {q} ∪ f (S), logo q é um ponto isolado de fr .V e, pela observação preliminar, f (B) = V ∪ {q} é aberto, logo q = f (p) ∈ int f (U ), donde se conclui que f (U ) é aberto. Quanto ao Teorema Fundamental da Álgebra, se p : R2 → R2 é um polinômio complexo não-constante, seu determinante jacobiano em cada ponto z ∈ R2 é igual a |p′ (z)|, logo se anula apenas num número finito de pontos, que são as raı́zes de p′ (z). Portanto p(R2 ) é um conjunto aberto. Por outro lado, como lim p(z) = ∞, p(R2 ) também é fechado. Sendo R2 conexo, segue-se que z→∞ p(R2 ) = R2 , logo existe z ∈ R2 tal que p(z) = 0. 1.5. Os passos para a conclusão do exercı́cio são bastante claros. Para provar que a função α é C ∞ , use o Exercı́cio 10, da Seção 4, Cap. 8 do Volume 1 (pag. 100). Para provar que g é um difeomorfismo, use o Exercı́cio 1, Capı́tulo 6 deste volume. 2.1. Isto resulta imediatamente do Teorema 5 (Forma Local das Submersões) pois cada ponto p ∈ A pertence a um aberto Z ⊂ A tal que f (Z) = W é um aberto em Rn (com a notação do enunciado daquele teorema). 2.2. Basta observar que grad f1 (x), . . . , grad fn (x) são as linhas da matriz jacobiana de f no ponto x, a qual tem posto n se, e somente se, esses vetores são L.I. Seção 7 Superfı́cies Diferenciáveis 197 2.3. Lembrar que, para cada matriz x ∈ U , as n2 coordenadas do gradiente, no ponto x , da função det : U → R são os números (−1)i+j Xij , onde Xij é o determinante da matriz (n − 1) × (n − 1) que se obtém de x omitindo sua i-ésima linha e j-ésima coluna. Portanto x é um ponto crı́tico da função det se, e somente se, todas as submatrizes (n − 1) × (n − 1) de x tiverem determinante igual a zero e então o posto de x é ≤ n − 2. 2.4. Num ponto arbitrário a ∈ V , seja b = ξ(a), logo f (a, b) = c. Pelo Teorema das Funções Implı́citas, existem abertos W, Z, com a ∈ W ⊂ V ⊂ Rm e (a, b) ∈ Z ⊂ U , bem como uma aplicação ξ0 : W → Rn , de classe C k , tais que f −1 (c)∩Z é o gráfico de ξ0 , ou seja, se (x, y) ∈ Z e f (x, y) = c então x ∈ W e y = ξ0 (x). Em particular, como (a, b) ∈ Z e f (a, b) = c, segue-se que ξ0 (a) = b = ξ(a). Como ξ é contı́nua e (a, ξ(a)) ∈ Z, podemos supor W ∋ a tão pequena que x ∈ W ⇒ (x, ξ(x)) ∈ Z, Então x ∈ W ⇒ (y, ξ(x)) ∈ Z e f (y, ξ(x)) = c ⇒ (x, ξ(x)) ∈ f −1 (c)∩Z ⇒ (x, ξ(x)) ∈ gráfico de ξ0 ⇒ ξ(x) = ξ0 (x), logo ξ ∈ C k . Quanto à parte final do exercı́cio, basta observar que, definindo f : R3 → R por f (x, y, z) = (x2 + y 4 )z + z 3 , tem-se ∂f = x2 + y 4 + 3z 2 , ∂z ∂f logo ∂z (x, y, z) 6= 0 sempre que f (x, y, z) = 1. 7 Superfı́cies Diferenciáveis 2.1. Pelo Corolário 1, M é localmente o gráfico de uma aplicação g : V0 → Rn , de classe C k . Ou seja, M é coberta por abertos U ⊂ Rm+n tais que V = U ∩ M = {(x, g(x)); x ∈ V0 }. Definindo f : U → Rn por f (x, y) = y − g(x), vemos que f ∈ C k , 0 é valor regular de f e V = U ∩ M = f −1 (0). Então ϕ : V0 → V , ϕ(x) = (x, g(x)), é uma parametrização C k e, pondo f = (f1 , . . . , fn ), os campos de vetores v1 , . . . , vn : V → Rm+n , dados por v1 (q) = grad f1 (q), . . . , vn (q) = grad fn (q) cumprem o que foi pedido no exercı́cio. 2.2. Seja ϕ : V0 → V ⊂ M uma parametrização de classe C k . O conjunto m e e V = {(p, v); p ∈ V, v ∈ T p M } é aberto em T M e a aplicação Φ : V0 × R → V , dada m P ∂ϕ por Φ(x, α1 , . . . , αm ) = ϕ(x), αi (x) é uma parametrização de classe C k−1 ∂xi i=1 e dimensão 2m em T M . 2.3. Se ϕ : V0 → V ⊂ M é uma parametrização de classe C k então o conjunto Vb = {(p, v); p ∈ V, v ∈ Tp M ⊥ } é aberto em νM . Sejam v1 , . . . , vn−m : V → Rn campos de vetores L.I., com vi ◦ ϕ : V0 → Rn de classe C k−1 e vi (q) ⊥ Tq M para i = 1, . . . , n−m e todo q∈ V . Então Φ : V0 ×Rn−m → Vb , dada por Φ(x, α1 , . . . , αn−m ) = P ϕ(x), αi vi (ϕ(x)) , é uma parametrização de dimensão n e classe C k−1 em νM . Observação: Nos Exercı́cios 2.2 e 2.3, a verificação de que Ve e Vb são abertos é imediata se notarmos que (p, v) 7→ v é contı́nua, logo a imagem inversa de uma aberto é aberta. 2.4. Escrevendo as matrizes 4 × 4 sob a forma m = [x, y, u, v], onde x, y, u, v ∈ R4 são suas colunas então M é o conjunto dessas matrizes para as quais 2 desses vetores são L.I. mas 3 quaisquer não são. Fixando as idéias, seja V = {[x, y, u, v] ∈ M ; x, y são L.I.}. Então [x, y, u, v] ∈ V ⇒ u = αx + βy, v = γx + δy. Seja W = {(x, y) ∈ R4 × R4 ; x, y L.I.}. Pondo V0 = W × R4 , a aplicação ϕ : V0 → V , dada por ϕ(x, y, α, β, γ, δ) = [x, y, u, v], onde u = αx + βy, v = γx + δy, é uma parametrização C ∞ . (Verifique!) É claro que M é coberta por 6 abertos do tipo V , logo 198 Soluções dos exercı́cios Cap. 10 é uma superfı́cie C ∞ de dimensão 12 em R16 . O mesmo argumento vale em geral: as matrizes m × n de posto k formam uma superfı́cie de dimensão (m + n − k)k em Rmn . P 3.1. Pelo enunciado, temos aij ei = (ψ −1 ◦ ϕ)′ (x0 ) · ej = [ψ ′ (y0 )]−1 · ϕ′ (x0 ) · ej , i P P P ∂ψ ∂ϕ aij aij ψ̇ ′ (y0 ) · ei = (x0 ) = ϕ′ (x0 ) · ej = ψ ′ (y0 ) · aij ei = (y0 ), ∂xj ∂yi i i i todos os somatórios sendo com i variando de 1 a m. portanto 3.2. Segue-se da compacidade de [a, b] que o caminho λ pode ser expresso como justaposto de caminhos, cada um dos quais tem sua imagem contida numa vizinhança parametrizada. Portanto não há perda de generalidade em admitir que λ([a, b]) ⊂ V , onde V é a imagem de uma parametrização ψ : W0 → V ⊂ M , com ψ(y0 ) = p. Seja {w1 , . . . , wm } ⊂ Rm uma base tal que ψ ′ (x0 ) · wi = ui (i = 1, . . . , m). Considere a transformação linear T : Rm → Rm tal que T e1 = w1 , . . . , T em = wm . Sejam V0 = T −1 (W0 ), ϕ = ψ ◦ T : V0 → V e x0 = T −1 (y0 ). Então ϕ : V0 → ∂ϕ V é uma parametrização tal que ϕ(x0 ) = p e (x0 ) = ϕ′ (x0 ) · ei = ui , i = ∂xi 1, . . . , m. Para {v1 (t), . . . , vm (t)} ⊂ Tλ(t) M é aquela cada t ∈ [a, b], a base ortonormal ∂ϕ ∂ϕ (λ0 (t)), . . . , (λ0 (t)) pelo processo de Gram-Schmidt, onde obtida de ∂x1 ∂xm ϕ(λ0 (t)) = λ(t). 3.3. Como no exercı́cio anterior, podemos admitir que os valores λ(t), t ∈ [a, b], pertencem a um aberto V ⊂ M , no qual estão definidos n campos vetoriais contı́nuos w1′ , . . . , wn′ : V → Rm+n , com w1′ (q), . . . , wn′ (q) L.I. e ortogonais a Tq M , para todo n P q ∈ V . No ponto p = λ(a), temos uj = aij wi′ (p), j = 1, . . . , n. Os campos i=1 P wj : V → Rm+n , dados por wj (q) = aij wi′ (q), são ainda L.I. e ortogonais a Tq M , i agora com wj (p) = uj (j = 1, . . . , n). Usando o processo de ortonormalização de Gram-Schmidt, obtemos os campos v1 , . . . , vn : V → Rm+n tais que t 7→ {v1 (λ(t)), . . . , vn (λ(t))} cumpre as condições estipuladas no exercı́cio. Observação: O processo de ortonormalização de Gram-Schmidt faz passar de um conjunto {w1 , . . . , wn } de vetores L.I. para um conjunto ortonormal {v1 , . . . , vn } que gera o mesmo subespaço, de tal modo que cada vetor vj depende continuamente (e mesmo em classe C ∞ ) de w1 , . . . , wn . 3.4. A matriz de passagem da base {u1 , . . . , un } para a base {w1 , . . . , wn } tem determinante > 0. Como S n−1 é conexo, existe um caminho λ : [0, 1] → S n−1 , com λ(0) = un e λ(1) = wn . Sendo {u1 , . . . , un−1 } ⊂ Tun S n−1 uma base ortonormal, o Exercı́cio 2 garante que existe uma aplicação contı́nua t 7→ (v1 (t), . . . , vn−1 (t)) tal que, para todo t ∈ [0, 1] os vj (t) formam uma base ortonormal de Tλ(t) S n−1 , com vj (0) = uj , j = 1, . . . , n − 1. O determinante da matriz de passagem de {v1 (t), . . . , vn−1 (t)} para {w1 , . . . , wn−1 } é 1 quando t = 0 e é 6= 0 para todo t ∈ [0, 1], logo é > 0 para t = 1. Pela hipótese de indução, existe uma aplicação contı́nua t 7→ {v1 (t),· · · ,vn−1 (t)}, definida para 1 ≤ t ≤ 2, tal que os vj (t), t ∈ [1, 2], formam um conjunto ortonormal e v1 (2) = w1 , . . . , vn−1 (2) = wn−1 . Mantendo λ(t) = vn (t) = wn constante para 1 ≤ t ≤ 2, chegamos ao fim da 1a¯ parte do exercı́cio. Quando à conclusão, basta observar que os elementos de SO(Rn ) são matrizes de determinante > 0 cujas colunas formam uma base ortonormal de Rn . Seção 7 Superfı́cies Diferenciáveis 199 4.1. A observação crucial é que se ϕ : V0 → V é uma parametrização, com V0 ⊂ Rm , e T : Rm → Rm é dada por T (x1 , . . . , xm ) = (−x1 , x2 , . . . , xm ) então, pondo V1 = T −1 (V0 ) e ϕ1 = ϕ ◦ T : V1 → V , obtém-se uma parametrização ϕ1 com a seguinte propriedade: para toda parametrização ψ : W0 → W com V ∩ W 6= ∅, os determinantes jacobianos de ψ −1 ◦ ϕ1 e ψ −1 ◦ ϕ nos pontos x ∈ V1 e T (x) ∈ V0 têm sinais opostos. Diz-se então que ϕ1 é obtida invertendo a orientação de ϕ. Isto posto, notemos ainda que, em ϕ−1 (U ∩ V ∩ W ) vale ξ −1 ◦ ϕ = (ξ −1 ◦ ψ) ◦ (ψ −1 ◦ ϕ), portanto, ao analisar o sinal do determinante jacobiano, basta considerar ξ −1 ◦ ψ e ψ −1 ◦ ϕ. Ora, os sinais dos determinantes jacobianos de ξ −1 ◦ ψ e ψ −1 ◦ ϕ, nesta ordem, podem ocorrer de quatro formas: + +, +−, −+ e − −. No primeiro caso, {ϕ, ψ, ξ} é um atlas coerente. No segundo caso, invertemos a orientação de ϕ, no terceiro a de ξ e, no quarto, a de ψ, para termos um atlas coerente em M , a qual é portanto uma superfı́cie orientável. 4.2. Seja [u, v, w] ∈ M representada por seus vetores-coluna u, v, w ∈ R3 .Temos M = U ∪ V ∪ W , onde [u, v, w] pertence a U , a V ou a W conforme sua primeira, segunda ou terceira coluna seja 6= 0. Pondo U0 = {(u, s, t) ∈ R5 ; u = (x, y, z) 6= 0, s, t ∈ R}, definamos as parametrizações ϕ : U0 → U , ψ : U0 → V e ξ : U0 → W por ϕ(u, s, t) = (u, su, tu), ψ(u, s, t) = (su, u, tu) e ξ(u, s, t) = (su, tu, u). As mudanças de parametrização são dadas por (ψ −1 ◦ ϕ)(u, s, t) = (su, 1/s, t/s), (ξ −1 ◦ ϕ)(u, s, t) = (tu, 1/t, s/t) e (ξ −1 ◦ ψ)(u, s, t) = (tu, s/t, 1/t). Um cálculo simples mostra que os determinantes jacobianos desses difeomorfismos são respectivamente iguais a −1, 1, e −1. Pelo exercı́cio anterior, concluı́mos que M é orientável. f as parametrizações em 4.3. Sejam Φ : V0 × Rm → Ve e Ψ : W0 × Rm → W T M definidas, como na solução do Exercı́cio 2.2, pag. 143, a partir das parametrizações ϕ : V0 → V , ψ : W0 → W em M , onde V ∩ W 6= ∅. Pondo ξe = ψ −1 ◦ Φ, temos, para cada x ∈ ϕ−1 (V ∩ W ) e cada u = (α1 , . . . , αm ) ∈ Rm : e u) = (ϕ−1 ◦ ϕ)(x), (ψ −1 ◦ ϕ)′ (x) · u) = (ξ(x), ξ ′ (x) · u), onde ξ = ψ −1 ◦ ϕ. Ou ξ(x, m e α1 , . . . , αm ) = ξ(x), P αk ∂ξ (x) . Daı́ resulta que as colunas da maseja: ξ(x, ∂x k k=1 m ∂ξ P ∂2ξ ∂ ξe e αk = , triz jacobiana J ξ(x) ∈ M (2m × 2m) são os vetores ∂xj ∂xj k=1 ∂xj ∂xk ∂ ξe ∂ξ e = 0, . Como as colunas da matriz jacobiana Jξ são os m vetores ∂αj ∂xj Jξ 0 e ∂ξ/∂xj , segue-se que J ξ = , onde os 4 blocos são matrizes m × m. Portanto ∗ Jξ 2 det . J ξe = (det Jξ) > 0 e a superfı́cie T M é orientável. Quanto ao fibrado normal νM , sua orientabilidade se prova considerando o atlas A, formado pelas parametrizações Φ : V0 × Rn−m → Ve ⊂ νM , associadas a parametrizações ϕ : V0 → V ⊂ M para as quais existem n − m campos de vetores v1 , . . . , vn−m : V → Rn , de classe C k−1 e linearmente independentes. (M é de classe C k .) A parametrização Φ é definida como na solução do Exercı́cio 2.3, pag. 143. Para que se tenha Φ ∈ A, exigiremos que, para todo x ∈ V0 , os vetores ∂ϕ ∂ϕ (x), . . . , (x), v1 (ϕ(x)), . . . , vn−m (ϕ(x)) formem uma base positiva do espaço ∂x1 ∂xm n R , isto é, que a matriz n × n que os tem como colunas tenha determinante positivo. Então o atlas A é coerente e νM é orientável. Observação. Os leitores familiares com a vizinhança tubular de uma superfı́cie 200 Soluções dos exercı́cios Cap. 10 reconhecerão que νM é orientável porque é difeomorfo a um aberto de Rn . 4.4. As colunas da matriz jacobiana de f são (2x, y, z, 0), (−2y, x, 0, z) e (0, 0, x, y). Dois subdeterminantes 3 × 3 são 2x(x2 + y 2 ) e 2y(x2 + y 2 ). Logo f ′ (p) : R3 → R3 é injetiva para todo p ∈ S 2 , exceto p0 = ±(0, 0, 1). Nestes dois pontos, tem-se f ′ (p0 ) · e1 = ±e3 e f ′ (p0 ) · e2 = ±e4 . Assim, f ′ (p0 ) é injetiva no plano gerado por e1 e e2 , que é o plano tangente a S 2 no ponto p0 , logo é a imagem ϕ′ (x0 ) · R2 , onde ϕ é qualquer parametrização de uma vizinhança de p0 em S 2 , com ϕ(x0 ) = p0 . Portanto, se ϕ : V0 → V é uma parametrização arbitrária de V ⊂ S 2 , a composta f ◦ ϕ : V0 → P = f (S 2 ) é uma imersão. Além disso, como f (p) = f (q), com p, q ∈ S 2 , só ocorre quando q = ±p, se V não contém pontos antı́podas, a imersão f ◦ ϕ é injetiva. Para concluir que f ◦ ϕ é uma parametrização (e portanto que P é uma superfı́cie), resta apenas provar que a imagem f (A) de todo aberto A ⊂ S 2 é um aberto em P , ou seja, que F = P − f (A) é fechado (em P ou em R4 , tanto faz, pois P é compacto, logo fechado). Por simplicidade (e conveniência), passaremos a escrever f significando f |S 2 , isto é, o domı́nio de f agora é S 2 . Então, como A ∪ (−A), onde −A = {−x; x ∈ A} é aberto em S 2 , temos f −1 (F ) = S 2 −f −1 (f (A)) = S 2 −[A∪(−A)], logo f −1 (F ) é fechado em S 2 , portanto compacto. Como f : S 2 → P é sobrejetiva, vale f f −1 (F ) = F . Então F é compacto, logo fechado, como imagem por f do compacto f −1 (F ). Isto conclui a verificação de que P é uma superfı́cie C ∞ . Resta mostrar que P não é orientável. Isto pode ser feito observando que todo aberto numa superfı́cie orientável é também uma superfı́cie orientável mas P contém uma faixa de Moebius, imagem por f do conjunto X = {(x, y, z) ∈ S 2 ; −1/2 < z < 1/2, y ≥ 0}. 6.1. Basta observar queh ∈ C ∞ e que a aplicação inversa, g : R2 − {0} → S 1 × R, z dada por g(z) = , ℓn|z| , também é de classe C ∞ . |z| 6.2. Para obter um difeomorfismo de S 1 × S 1 sobre uma superfı́cie em R3 , tome a composta S 1 × S 1 → S 1 × R2 → (S 1 × R) × R → (R2 − {0}) × R → R2 × R = R3 . No caso geral, admita por indução que exista um difeomorfismo (S 1 )n−1 → Rn do toro (n − 1)-dimensional sobre uma hiperfı́cie em Rn . Então tome a composta (S 1 )n = S 1 × (S 1 )n−1 → S 1 × Rn → (S 1 × R) × Rn−1 → R2 × Rn−1 → Rn+1 onde as setas têm significados óbvios. 6.3. Seja B um atlas coerente em N . Considere o conjunto A das parametrizações ϕ : V0 → V ⊂ M tais que V é conexo, f |V é um difeomorfismo de V sobre um aberto W ⊂ N e a parametrização f ◦ϕ : V0 → W é compatı́vel com todas as parametrizações ξ ∈ B. Então A é um atlas em M . (Se f ◦ϕ não for compatı́vel com toda ξ ∈ B, inverta a orientação de ϕ.) O atlas A é coerente porque ψ, ϕ ∈ A ⇒ ψ −1 ◦ϕ = (f ◦ψ)−1 ◦(f ◦ϕ). 6.4. Dados x, y ∈ G arbitrários, temos f (x · y) = f (x) · f (y). Isto pode ser escrito como f ◦λx = λf (x) ◦f , usando as translações à esquerda λx : G → G e λf (x) : H → H, definidas por λx (g) = xg e λf (x) (h) = f (x)·h. Note que λx e λf (x) são difeomorfismos, cujos inversos são λx−1 e λf (x)−1 . Para quaisquer p, q ∈ G, pondo x = q ·p−1 , a Regra da Cadeia, aplicada a f ◦ λx = λf (x) ◦ f , nos dá f ′ (q) · λ′x = λ′f (x) · f ′ (p). Como λ′x e λ′f (x) são, em cada ponto, isomorfismos lineares, concluı́mos que f ′ (p) : Tp G → Tf (p) H e f ′ (q) : Tq G → Tf (q) H têm o mesmo posto. Seção 8 8 Integrais múltiplas 201 Integrais múltiplas − R 1.1. Seja I = A f (x)dx. Não se pode ter J < I, pois, como I ≤ S(f ; P ), isto implicaria que S(f ; P ) − J ≥ I − J para toda partição P do bloco A. Tampouco pode ser I < J pois, fixando um número L com I < L < J, existiria uma partição Q do bloco A tal que I ≤ S(f ; Q) < L < J. Então, para qualquer P0 , a partição P = P0 ∪Q refinaria Q, logo S(f ; P ) ≤ S(f ; Q) e daı́ J − S(f ; P ) ≥ J − S(f ; Q) ≥ J − L, embora P refinasse P0 . Segue-se que I = J. 1.2. Sejam Σ o conjunto das somas superiores S(f ; P ), relativas a todas as partições P do bloco A e Σ0 ⊂ Σ o conjunto das somas superiores relativas às partições que refinam P0 . Para toda P tem-se S(f ; P ∪ P0 ) ∈ Σ0 e S(f ; P ∪ P0 ) ≤ S(f ; P ). − R Logo inf Σ0 = inf Σ = A f (x)dx. Analogamente para a integral inferior. P 1.3. Dado ε > 0, existe uma partição P = P1 × · · · × Pn do bloco A tal que wB · vol B < ε. O valor do somatório à esquerda não aumenta quando se refina B∈P a partição P . Seja C = Π[ci , di ] ⊂ A. Para cada i = 1, . . . , n escrevamos Qi = Pi ∪ {ci , di }. Isto nos dá uma partição Q = Q1 × · · · × Qn de A que refina P e, além de Q contidos em C constituem uma partição Q′ de C. Então P P disso, os blocos ′ ωB · vol B < ε pois as parcelas de ambos somatórios são ≥ 0 ωB ′ · vol B ≤ B∈Q B ′ ∈Q′ e as da esquerda estão incluı́das entre as da direita. Segue-se que fC é integrável. n Q 1.4. Seja A = [a1 , b1 ] × A′ , com c ∈ [a1 , b1 ] e A′ = [ai , bi ]. Dado ε > 0, seja i=2 I ⊂ [a1 , b1 ] um intervalo contendo c, tal que vol(I × A′ ) < ε/2K, onde K = M − m e m ≤ f (x) ≤ M para todo x ∈ A e, além disso, c ∈ int .I se c ∈ (a1 , b1 ). Vemos que I × A′ é bloco de uma partição P0 de A. Seja P uma partição de A que refina P0 . Designaremos por B ′ os blocos de P contidos em I × A′ . Nos demais blocos de P , que chamaremos de B ′′ , a função f é contı́nua, logo podemos tomar P de modo que ωB ′′ < ε/2 vol A para todo B ′′ . Então X X X ωB · vol B = ωB ′ · vol B ′ + ωB ′′ · vol B ′′ B∈P B′ B ′′ ′ < K · vol(I × A ) + (ε/2 vol(A)) · vol A < ε ε + = ε. 2 2 2.1 Para toda partição P do bloco A, o gráfico de f está contido na reunião dos blocos (n + 1)-dimensionais B × [mB , MB ], B ∈ P . O volume de cada um desses blocos é igual a ωB · vol B . A P integrabilidade de f assegura que, para todo ε > 0, ωB · vol B < ε. Isto nos diz que o gráfico de f tem existe uma partição P tal que B∈P medida nula. n Q 2.2. Seja A = [ai , bi ]. Dada uma cobertura A ⊂ ∪Bk por blocos fechados, pelo i=1 Teorema 3, podemos supor que os interiores dos Bk cobrem A e, por Borel-Lebesgue, que a cobertura é finita. Para cada i = 1, . . . , n, seja Pi a partição do intervalo [ai , bi ] formada pelos pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Bk que estejam contidas em [ai , bi ]. A partição P = P1 ×P · · · × Pn tem cada um dos seus vol B = vol A. Logo não se blocos contido em algum Bk , portanto Σ vol Bk ≥ B∈P tem med.A = 0. Segue-se daı́ que todo conjunto de medida nula tem interior vazio. 202 Soluções dos exercı́cios Cap. 10 2.3. Considere a aplicação f : M ×N → Rp , de classe C 1 , dada por f (x, y) = y−x. A fim de que v ∈ Rp pertença à imagem f (M ×N ) é necessário e suficiente que existam x ∈ M e y ∈ N tais que v = y − x, ou seja, y = x + v. Isto significa que f (M × N ) = {v ∈ Rp ; (M + v) ∩ N 6= ∅}. Ora, como dim(M × N ) = dim M + dim N < p, a imagem f (M × N ) tem medida nula em Rp , portanto tem interior vazio, isto é, seu complementar é denso em Rp . Se M e N são compactas então f (M × N ) é compacto, logo seu complementar, além de denso, é aberto. 2.4. Defina a parte positiva f+ : A → R e a parte negativa f− : A → R da função f pondo, para cada x ∈ A, f+ (x) = max{f (x), 0} e f− (x) = − min{f (x), 0}. Assim, f+ (x) = f (x) quando f (x) ≥ 0 e f+ (x) = 0 quando f (x) < 0. Por sua vez, f− (x) = −f (x) quando f (x) ≤ 0 e f− (x) = 0 se f (x) > 0. Então f+ (x) = (f (x) + |f (x)|)/2 e f− (x) = (|f (x)| − f (x))/2. Estas igualdades mostram que f+ e f− são contı́nuas em todos os pontos em que f é contı́nua, portanto f integrável implica f+ e f− integráveis. Além disso, é claro que f = f+ − f− e que f+ e f− são ambas não-negativas. 3.1. O conjunto dos pontos de descontinuidade de f é a reunião das faces próprias de B, portanto tem medida nula e f é integrável. Além disso, se considerarmos uma partição P0 de A que contenha B então, para toda partição P do bloco A que refine P0 , R tem-se s(f ; P ) = vol B = S(f ; P ). Segue-se do exercı́cio 1.2 que A f (x)dx = vol B. 3.2. X é a interseção do compacto [0, 1] como complementar do aberto ∪Jk , logo é compacto. Após cada etapa da construção de X, cada intervalo que resta tem comprimento menor do que a metade do comprimento dos intervalos que restaram da etapa anterior, logo X não contém intervalos, ou seja, int .X = ∅. Os extremos dos intervalos omitidos pertencem a X e todo ponto x0 ∈ X, na n-ésima etapa do processo, pertencia ao interior de um intervalo cujo comprimento tendia a zero quando n → ∞, os extremos do qual pertencem a X, logo x0 é ponto de acumulação de X, ou seja, X não possui pontos isolados. Finalmente, se |Jk | é o comprimento do intervalo Jk então Σ|Jk | = Σan = 1 − δ. Dada qualquer cobertura enumerável X ⊂ ∪Ir por intervalos abertos Ir , temos [0, 1] ⊂ (∪Ir ) ∪ (∪Jk ). A solução do exercı́cio 2.2 acima nos dá Σ|Ir | + Σ|Jk | ≥ 1, donde Σ|Ir | ≥ δ. Logo X não tem medida nula. 3.3. Com aR notação do Teorema 9, seja ξ = ψ − ϕ : A1 → R. A função ξ é integrável, com A1 ξ(x)dx = 0 e ξ(x) ≥ 0. Para todo k ∈ N, mostremos que Xk = S Xk tem medida {x ∈ A1 ; ξ(x) ≥ 1/k} tem medida nula. Daı́ resultará que X = k∈N nula, com fx : A2 → R integrável para todo x ∈ A1P − X. Ora, dado arbitrariamente MB · vol B < ε/k. Indiquemos ε > 0, existe uma partição P do bloco A1 tal que B∈P com B ′ os blocos de P tais que MB ′ ≥ 1/k. Então Xk está contido na reunião dos blocos B ′ e X 1 1 Σ vol B ′ = Σ · vol B ′ ≤ ΣMB ′ · vol B ′ ≤ MB · vol B < ε/k. k k B∈P Multiplicando por k, vem Σ vol B ′ < ε, logo med.Xk = 0 3.4. O complementar de um conjunto de medida nula, sendo denso, possui pontos em todo intervalo. Logo, se f (x) ≥ 0 para todo x ∈ A, tem-se mB = R 0, donde P mB ·vol B = 0 seja qual for a partição P do bloco A. Então f (x)dx = s(f ; P ) = B∈P −A R 0 e, como f é integrável, A f (x)dx = 0. No caso geral, f é a diferença de R duas funções integráveis não-negativas, cada uma das quais tem integral nula, logo A f (x)dx = 0. Seção 9 Mudança de variáveis 203 4.1 Isto resulta diretamente do exercı́cio 3.1. 4.2. Porque sua fronteira S(a; r) é uma superfı́cie C ∞ de dimensão n − 1 no espaço Rn , logo tem medida nula. 4.3. O interior U de um conjunto J-mensurável X é também J-mensurável em virtude do Teorema 10, pois fr .U ⊂ fr .X. Além disso, como fr .X tem volume nulo e a reunião X = U ∪ (X ∩ fr .X) é disjunta, tem-se vol .X = vol .U + vol .(X ∩ fr .X) = vol .U . P mB · vol B = 4.4. Para toda partição P do bloco A, tem-se s(f ; P ) = B∈P P P P vol B ′′ , MB · vol B = vol B ′ , onde B ′ = B × [0, mB ], e S(f ; P ) = B∈P B∈P B∈P S S B ′′ , s(f ; P ) ≤ B ′ ⊂ C(f ) ⊂ onde B ′′ = B × [0, MB ]. Evidentemente, B∈P B∈P vol . int .C(f ) ≤ volR.ext C(f )≤S(f ; P ). Portanto f integrável implica C(f ) J-mensurável e vol C(f ) = A f (x)dx. 9 Mudança de variáveis 1. Uma observação preliminar: se f : B(a; r) → R é contı́nua, com m(r) = inf{f (x); x ∈ B(a; r)} e M (r) = sup{f (x); x ∈ B(a; r)} então f (a) = lim m(r) = r→0 lim M (r) e m(r) ≤ f (x) ≤ M (r) para todo x ∈ B(a; r). Segue-se daı́ que r→0 m(r) ≤ 1 vol B(a; r) Z B(a;r) f (x)dx ≤ M (r), portanto Z 1 f (x)dx = f (a). r→0 vol B(a; r) B(a;r) R R Dito isto, vemos que vol ·f (B(a; r)) = f (B(a;r)) 1·dy = B(a;r) | det ·f ′ (x)|dx, portanto lim lim r→0 vol .f (B(a; r)) = | det .f ′ (a)|. vol .B(a; r) 2. A solução deste exercı́cio se faz com o uso imediato do Teorema da Mudança de Variáveis, juntamente com a observação que precede o Teorema 4 do Capı́tulo 7, sobre o produto vetorial. Referências Bibliográficas [1] E.L. Lima. Análise Real, vol. 1. (Sétima edição.) Coleção Matemática Universitária, IMPA, 2004. [2] E.L. Lima. Curso de Análise, vol. 1. (Décima primeira edição.) Projeto Euclides, IMPA, 2004. [3] E.L. Lima. Curso de Análise, vol. 2. (Sexta edição.) Projeto Euclides, IMPA, 2000. [4] E.L. Lima. Álgebra Linear. (Sexta edição.) Coleção Matemática Universitária, IMPA, 2003. [5] E.L. Lima. Análise no Espaço Rn . Coleção Matemática Universitária, IMPA, 2001. [6] S. Lang. Undergraduate Analysis. Springer Verlag, N. York, 1983. (Em inglês.) [7] Th. Bröcker. Analysis II. BI-Wiss.-Verlag. Mannheim, 1992. (Em alemão.) As cinco primeiras referências são citadas no texto, especialmente a primeira, da qual este livro é o prosseguimento. As duas últimas são obras que se destacam entre as congêneres: o livro de Lang, por sua caracterı́stica objetividade; o de Bröcker por ter sabido, com êxito, conciliar elegância, clareza e concisão. Os capı́tulos IV e VII da referência 3, que tratam do que se poderia chamar uma versão moderna da Análise Vetorial clássica, podem formar uma continuação natural dos temas aqui tratados. Índice Remissivo Índice Remissivo i-ésima coordenada, 1 i-ésima derivada parcial, 55 i-ésima variável, 55 i-convexo, 81 Campo de vetores normais, 91, 132 Cisão, 27 Classe C k , 41, 43, 57, 100 Co-dimensão, 127 Cobertura, 18 Combinação convexa, 75 Componente conexa, 32 Comprimento, 3, 48 Conjunto aberto, 8 compacto, 16 conexo, 28 conexo por caminhos, 31 convexo, 7 de nı́vel, 62 denso, 14 discreto, 14 fechado, 12 horizontalmente convexo, 81 limitado, 6 verticalmente convexo, 81 Constante de Lipschitz, 24 Contração, 25 Critério de Cauchy, 12 Cubo, 18 n-dimensional, 148 Curva, 62, 87, 126 Aplicação aberta, 112 contı́nua, 20 lipschitziana, 24 uniformente contı́nua, 24 Arestas, 148 Atlas, 133 coerente, 133 Base associada a uma parametrização, 130 Bloco n-dimensional, 148 Blocos de uma partição, 149 Bola aberta, 5 fechada, 5 Caminho, 30 justaposto, 31 poligonal, 32 regular, 51 retificável, 48 retilı́neo, 30 uniformemente diferenciável, 47 Decomposição, 166 207 208 pontilhada, 169 Delta de Kronecker, 90 Derivada, 41, 142 à direita, 42 à esquerda, 42 de Gâteux, 77 de uma aplicação, 98 direcional, 60, 98 parcial, 121 segunda, 109 Desigualdade de Hadamard, 97 do valor médio, 44, 107 Diâmetro, 18 Difeomorfismo, 111, 143 admissı́vel, 177 local, 112 primitivo, 175 difeomorfismo local, 143 Diferenciável, 41, 98 Diferencial, 101 Disco, 5 Distância, 5, 16 intrı́nseca, 54 Elipsóide, 90 Equações de Cauchy-Riemann, 103 Esfera, 5 Espaço euclidiano n-dimensional, 1 vetorial tangente, 88, 129 Extensão radial, 109 Fórmula de Taylor, 69 Face, 148 Fecho, 12 Fibrado normal, 146 tangente, 146 Índice Remissivo Fluxo, 180 Forma local das submersões, 117 Forma quadrática, 70, 90 hessiana, 71 não-negativa, 70 não-positiva, 70 negativa, 70 positiva, 70 Fronteira, 9 Função côncava, 75 caracterı́stica, 162 convexa, 75 de Urysohn, 38 harmônica, 82 integrável, 151, 164 limitada, 6, 10 quase-convexa, 83 Função-coordenada, 19 Gradiente, 60 Grau, 172 Grupo unimodular, 91 Hélice, 52 Hiperfı́cie, 87 Homeomorfismo, 26 Imersão, 124 Integral, 151 inferior, 150 superior, 150 Interior, 7 Invertendo a orientação, 199 Lagrangiana, 95 Limite, 10, 45, 169 lateral, 34 Linha de nı́vel, 62 Índice Remissivo Máximo local, 71 Máximo ou mı́nimo estrito, 73 Mı́nimo local, 71 Matriz hessiana, 66 jacobiana, 98 Medida n-dimensional nula, 152 Mudança de parametrização, 128 Multiplicador de Lagrange, 92 Multiplicadores de Lagrange, 140 Número de Lebesgue, 178 Nı́vel crı́tico, 89 regular, 89 Norma, 3, 4, 25, 45, 107, 166 euclidiana, 4 Oscilação, 151 num ponto, 157 Parametrização, 125 Parametrizações compatı́veis, 133 Parte negativa, 202 positiva, 202 Partição, 45, 149 pontilhada, 45 Plano projetivo, 147 Ponto aderente, 12 crı́tico, 64, 139 da restrição, 91 não-degenerado, 117 de acumulação, 14 isolado, 14 Produto vetorial, 134 Projeção estereográfica, 26 Quádrica, 90 209 Raiz quadrada de uma matriz, 116 simples, 122 Refinamento, 45, 149 Regra da Cadeia, 45, 103 Reparametrização, 51 Reta tangente, 42 Seqüência, 10 convergente, 10 de Cauchy, 12 Soma de Riemann, 45, 169 inferior, 149, 166 superior, 166 superior, 149 Subcobertura, 18 Submersão, 119 Subseqüência, 10 Superfı́cie, 87, 126 de nı́vel, 62 orientável, 91, 133 Teorema da Alfândega, 30 da aplicação inversa, 115 da derivação sob o sinal de integral, 66 da diferenciabilidade uniforme, 47, 107 da função implı́cita, 84 da integração repetida, 160 da permanência da desigualdade, 36 da permanência do sinal, 34 das funções implı́citas, 119 de Bolzano-Weierstrass, 11 de Borel-Lebesgue, 18 210 de Lebesgue (condição de integrabilidade), 157 de Lindelöf, 156 de Pitágoras, 3 de Schwarz, 67 de Weierstrass, 21 do valor médio, 61 fundamental do cálculo, 46 Toro m-dimensional, 126 Vértices, 148 Valor de aderência, 37 médio, 53 regular, 89, 130 Valores singulares, 141 Vertical, 117 Vetor-velocidade, 41 Vizinhança, 7 parametrizada, 126 Volume n-dimensional, 148, 163 externo, 162 interno, 162 Índice Remissivo