Real Analysis: Functions of n Variables Textbook

Análise Real volume 2 Funções de n Variáveis Lima, Elon Lages Análise real, v.2 / Elon Lages Lima. 1 ed. Rio de Janeiro : IMPA, 2014. 202 p. : il. ; 23 cm. (Coleção matemática universitária) Inclui bibliografia. e-ISBN 978-85-244-0381-1 1. Análise Matemática. I. Título. II. Série. CDD-517 COLEÇÃO MATEMÁTICA UNIVERSITÁRIA Análise Real volume 2 Funções de n Variáveis Elon Lages Lima INSTITUTO NACIONAL DE MATEMÁTICA PURA E APLICADA Copyright  2014 by Elon Lages Lima Impresso no Brasil / Printed in Brazil Capa: Rodolfo Capeto, Noni Geiger e Sérgio R. Vaz Coleção Matemática Universitária Comissão Editorial: Elon Lages Lima S. Collier Coutinho Paulo Sad Títulos Publicados: • Análise Real, vol. 1: Funções de uma Variável – Elon Lages Lima • EDP. Um Curso de Graduação – Valéria Iório • Curso de Álgebra, Volume 1 – Abramo Hefez • Álgebra Linear – Elon Lages Lima • Introdução às Curvas Algébricas Planas – Israel Vainsencher • Equações Diferenciais Aplicadas – Djairo G. de Figueiredo e Aloisio Freiria Neves • Geometria Diferencial – Paulo Ventura Araújo • Introdução à Teoria dos Números – José Plínio de Oliveira Santos • Cálculo em uma Variável Complexa – Marcio G. Soares • Geometria Analítica e Álgebra Linear – Elon Lages Lima • Números Primos: Mistérios e Recordes – Paulo Ribenboim • Análise no Espaço Rn – Elon Lages Lima • Análise Real, vol. 2: Funções de n Variáveis – Elon Lages Lima • Álgebra Exterior – Elon Lages Lima • Equações Diferenciais Ordinárias – Claus Ivo Doering e Artur Oscar Lopes • Análise Real, vol. 3: Análise Vetorial – Elon Lages Lima • Álgebra Linear. Exercícios e Soluções – Ralph Costa Teixeira • Números Primos. Velhos Mistérios e Novos Recordes – Paulo Ribenboim Distribuição: IMPA Estrada Dona Castorina, 110 22460-320 Rio de Janeiro, RJ e-mail: ddic@impa.br http://www.impa.br Prefácio Este segundo volume do livro “Análise Real” trata das funções de n variáveis. Sua leitura pressupõe, naturalmente, conhecimento das noções básicas sobre funções de uma variável, conforme estão apresentadas no primeiro volume, ou em algum texto equivalente. Além disso, é conveniente que o leitor tenha alguma familiaridade com os conceitos elementares da Álgebra Linear, tais como dependência linear, transformações lineares e suas matrizes, produto interno etc, a nı́vel de um curso introdutório. Como no seu antecessor, procuramos expor a matéria de modo que ela possa ser coberta num curso com a duração de um semestre letivo. Com isto em mente, procuramos seguir uma trajetória objetiva, visando os resultados mais relevantes, sem preocupação com a extrema generalidade. O objetivo principal do curso é o Cálculo Diferencial das aplicações de Rm (ou de um seu subconjunto) em Rn e das integrais múltiplas. Para atingi-lo, estudamos no capı́tulo inicial as funções contı́nuas f : X → Rn , definidas num subconjunto X ⊂ Rm e, para melhor entendê-las, analisamos as propriedades topológicas desses subconjuntos. Em seguida, consideramos dois casos particulares (e particularmente interessantes) do Cálculo que queremos estudar, a saber: os caminhos, que são aplicações contı́nuas f : I → Rn , definidas em intervalos I ⊂ R e as funções numéricas f : U → R, definidas em conjuntos U ⊂ Rm . Este segundo caso particular nos permite destacar o importante conceito de vetor gradiente, que ficaria diluı́do no contexto geral se não tivéssemos isolado o caso n = 1. Ainda no contexto de funções numéricas, tratamos separadamente os casos de uma só função implı́cita, as hiperfı́cies e o multiplicador de Lagrange. Os capı́tulos 5, 6 e 7 se ocupam do Cálculo Diferencial das aplicações f : U → Rn , onde a derivada, que antes era vista como um vetor (o gradiente) agora aparece como uma transformação linear. O resultado principal é o Teorema da Função Inversa, do qual se derivam o Teorema das Funções Implı́citas e os multiplicadores de Lagrange. Olhando para as funções implı́citas de forma global, somos conduzidos à noção de superfı́cie diferenciável (de dimensão qualquer) no espaço euclidiano e o Cálculo Diferencial nas mesmas. Os capı́tulos 8 e 9 tratam das integrais múltiplas (no sentido de Riemann), culminando com a demonstração da fórmula de mudança de variáveis. O livro contém 170 exercı́cios, propostos ao final de cada capı́tulo. O capı́tulo 10, último do livro, contém as soluções completas de todos eles. O leitor deve considerá-los como um meio de verificar até que ponto assimilou o conteúdo de cada seção. As soluções por mim sugeridas podem ser bem diferentes das suas, mais simples ou mais complicadas do que as que imaginou mas, acima de tudo, devem ser vistas como um auxı́lio a ser solicitado somente depois de tentar seriamente resolver o problema com seus próprios recursos. Um tratamento mais extenso e completo dos assuntos aqui estudados encontra-se no “Curso de Análise”, vol. 2, o qual, entretanto, é um livro muito longo para ser estudado num único semestre. Ao terminar, agradeço ao Professor Hilário Alencar pela leitura de uma versão preliminar, com a correção de vários misprints, e ao Professor Florêncio Guimarães, pela revisão do manuscrito final. Rio de Janeiro, 25 de maio de 2004 Elon Lages Lima Prefácio da sexta edição A partir da segunda edição, foram feitas algumas correções de natureza tipográfica e diversas pequenas mudanças visando tornar mais clara a exposição. Em particular, na quinta edição foi incluı́do um Apêndice ao Capı́tulo 7, sobre o volume do paralelepı́pedo. Agradeço a colaboração de José Regis, Mariana Garcia, Rick Rischter e Raphael Antunes dos Santos por terem apontado certas impropriedades, a Rogerio Dias Trindade e Wilson Góes, que redigitaram o texto. Rio de Janeiro, abril de 2012 Elon Lages Lima Conteúdo 1 Topologia do Espaço Euclidiano 1 O espaço euclidiano n-dimensional 2 Bolas e conjuntos limitados . . . . 3 Conjuntos abertos . . . . . . . . . 4 Seqüências em Rn . . . . . . . . . 5 Conjuntos fechados . . . . . . . . . 6 Conjuntos compactos . . . . . . . . 7 Aplicações contı́nuas . . . . . . . . 8 Continuidade uniforme . . . . . . . 9 Homeomorfismos . . . . . . . . . . 10 Conjuntos conexos . . . . . . . . . 11 Limites . . . . . . . . . . . . . . . 12 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 5 7 10 12 16 19 23 26 27 33 36 2 Caminhos em Rn 1 Caminhos diferenciáveis . . . . 2 Cálculo diferencial de caminhos 3 A integral de um caminho . . . 4 Caminhos retificáveis . . . . . . 5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 43 45 48 52 . . . . . . 55 55 57 65 68 70 75 3 Funções Reais de n Variáveis 1 Derivadas parciais . . . . . 2 Funções de classe C 1 . . . . 3 O Teorema de Schwarz . . . 4 A fórmula de Taylor . . . . 5 Pontos crı́ticos . . . . . . . 6 Funções convexas . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Cap. 0 CONTEÚDO 7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4 Funções Implı́citas 1 Uma função implı́cita . . 2 Hiperfı́cies . . . . . . . . . 3 Multiplicador de Lagrange 4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 84 87 91 96 5 Aplicações Diferenciáveis 1 A derivada como transformação linear 2 Exemplos de derivadas . . . . . . . . . 3 Cálculo diferencial de aplicações . . . 4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 98 100 103 109 . . . . . . . . . . . . . . . . . . . . . . . . 6 Aplicações Inversas e Implı́citas 111 1 O Teorema da Aplicação Inversa . . . . . . . . . . . . . . 111 2 Várias Funções Implı́citas . . . . . . . . . . . . . . . . . . 117 3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 7 Superfı́cies Diferenciáveis 1 Parametrizações . . . . . . . . . . . . . . 2 Superfı́cies diferenciáveis . . . . . . . . . . 3 O espaço vetorial tangente . . . . . . . . . 4 Superfı́cies orientáveis . . . . . . . . . . . 5 Multiplicadores de Lagrange . . . . . . . . 6 Aplicações diferenciáveis entre superfı́cies 7 Exercı́cios . . . . . . . . . . . . . . . . . . 8 Integrais Múltiplas 1 A definição de integral . . . . . . . 2 Conjuntos de medida nula . . . . . 3 Cálculo com integrais . . . . . . . 4 Conjuntos J-mensuráveis . . . . . 5 A integral como limite de somas de 6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 . 124 . 126 . 129 . 132 . 139 . 142 . 146 . . . . . . 148 . 148 . 152 . 159 . 162 . 165 . 170 9 Mudança de Variáveis 172 1 O caso unidimensional . . . . . . . . . . . . . . . . . . . . 173 2 Difeomorfismos primitivos . . . . . . . . . . . . . . . . . . 175 1 CONTEÚDO 3 4 5 Todo difeomorfismo C 1 é localmente admissı́vel . . . . . . 177 Conclusão: todo difeomorfismo de classe C 1 é admissı́vel . 178 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 10 Soluções dos exercı́cios 1 Topologia do Espaço Euclidiano 2 Caminhos diferenciáveis . . . . 3 Funções reais de n variáveis . . 4 Funções implı́citas . . . . . . . 5 Aplicações diferenciáveis . . . . 6 Aplicações Inversas e Implı́citas 7 Superfı́cies Diferenciáveis . . . 8 Integrais múltiplas . . . . . . . 9 Mudança de variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 . 181 . 186 . 188 . 192 . 194 . 195 . 197 . 201 . 203 Referências Bibliográficas 205 Índice Remissivo 206 5 1 Topologia do Espaço Euclidiano 1 O espaço euclidiano n-dimensional Seja n um número natural. O espaço euclidiano n-dimensional Rn é o produto cartesiano de n fatores iguais a R : Rn = R × R × · · · × R. Seus elementos, portanto, são as seqüências (ou listas) de n termos reais x = (x1 , . . . , xn ). Para cada i = 1, . . . , n, o termo xi chama-se a i-ésima coordenada de x. Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), tem-se x = y se, e somente se, x1 = y1 , . . . , xn = yn . Assim, toda igualdade entre dois elementos de Rn equivale a n igualdades entre números reais. R1 = R é o conjunto dos números reais, R2 é o modelo numérico do plano e R3 é o modelo do espaço euclidiano tridimensional. Por simplicidade, adotaremos o hábito de escrever z = (x, y) em vez de x = (x1 , x2 ) e w = (x, y, z) em vez de x = (x1 , x2 , x3 ). Os elementos de Rn às vezes são chamados pontos e às vezes vetores. Este segundo nome se aplica principalmente quando se considerarem entre eles as operações que definiremos agora. A adição faz corresponder a cada par de elementos x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) a soma x + y = (x1 + y1 , . . . , xn + yn ). e a multiplicação do número real α pelo elemento x = (x1 , . . . , xn ) tem como resultado o produto α · x = (αx1 , . . . , αxn ). 2 Topologia do Espaço Euclidiano Cap. 1 O vetor 0 = (0, 0, . . . , 0), cujas coordenadas são todas nulas, chamase a origem de Rn . Para todo x = (x1 , . . . , xn ), o vetor −x = (−x1 , . . . , −xn ) chama-se o oposto, ou simétrico de x. Dados quaisquer x, y, z ∈ Rn e α, β ∈ R valem as igualdades x + y = y + x, x + 0 = x, x + (y + z) = (x + y) + z, (α + β)x = αx + βx, −x + x = 0, α(βx) = (αβ)x, α(x + y) = αx + αy, 1 · x = x. A segunda e a terceira delas dizem que 0 é o elemento neutro da adição e −x é o inverso aditivo de x. Os vetores e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . en = (0, . . . , 1), que têm uma única coordenada não-nula, igual a 1, constituem a base canônica de Rn . A igualdade x = (x1 , . . . , xn ) significa que x = x1 · e1 + · · · + xn · en . Existe ainda uma operação que associa a cada par de vetores x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) o número real hx, yi = x1 y1 + · · · + xn yn , chamado o produto interno de x por y. Para x, y, z ∈ Rn e α ∈ R quaisquer, tem-se hx, yi = hy, xi, hx, y + zi = hx, yi + hx, zi, hαx, yi = α · hx, yi, hx, xi > 0 se x 6= 0. Segue-se que hx+y, zi = hx, zi+hy, zi, hx, αyi = αhx, yi e hx, 0i = 0. Diz-se que os vetores x, y ∈ Rn são ortogonais, e escreve-se x ⊥ y, quando hx, yi = 0. Por exemplo, ei ⊥ ej se i 6= j. Um exemplo menos trivial de ortogonalidade é o seguinte: hx, yi (1.1) Seja x ∈ Rn não-nulo. Para todo y ∈ Rn , o vetor z = y − ·x hx, xi é ortogonal a x. hx, yi · hx, xi = 0. Demonstração: hx, zi = hx, yi − hx, xi hx, yi Escrevendo y = · x + z, vemos assim que, uma vez dado um hx, xi vetor não-nulo x ∈ Rn , todo vetor y ∈ Rn se escreve como soma de um múltiplo de x com um vetor ortogonal a x. Esta decomposição é única O espaço euclidiano n-dimensional Seção 1 3 pois se y = α · x + z com z ⊥ x, tomando-se o produto interno de ambos os membros por x obtemos hx, yi = α · hx, xi, logo α = hx, yi/hx, xi. O vetor αx = (hx, yi/hx, xi)x chama-se a projeção ortogonal de y sobre (a reta que contém) x. z y x hx,yi hx,xi ·x Figura 1.1 p O número não-negativo |x| = hx, xi chama-se a norma (ou o comprimento) do vetor x. Se x = (x1 , . . . , xn ) então |x| = q x21 + · · · + x2n . Por definição, tem-se hx, xi = |x|2 . Quando |x| = 1, diz-se que x é um vetor unitário. Para todo x 6= 0, o vetor u = x/|x| é unitário. (1.2) (Teorema de Pitágoras). Se x ⊥ y então |x + y|2 = |x|2 + |y|2 . Demonstração: |x + y|2 = hx + y, x + yi = hx, xi + 2hx, yi + hy, yi = hx, xi + hy, yi = |x|2 + |y|2 . (1.3) (Desigualdade de Schwarz). Para quaisquer x, y ∈ Rn , tem-se |hx, yi| ≤ |x| · |y|, valendo a igualdade se, e somente se, um dos vetores x, y é múltiplo do outro. Demonstração: Isto é óbvio se x = 0. Supondo x 6= 0, podemos escrever y = αx + z com z ⊥ x e α = hx, yi/|x|2 . Por Pitágoras, |y|2 = α2 |x|2 + |z|2 , logo |y|2 ≥ α2 |x|2 , valendo a igualdade se, e somente se, y = α·x. Entrando com o valor de α, vem |y|2 ≥ hx, yi2 /|x|2 , ou seja, hx, yi2 ≤ |x|2 · |y|2 , o que nos dá |hx, yi| ≤ |x| · |y|, valendo a igualdade se, e somente se, y = α · x. 4 Topologia do Espaço Euclidiano Cap. 1 A norma goza das seguintes propriedades: 1. |x| ≥ 0, valendo |x| = 0 somente quando x = 0; 2. |α · x| = |α| |x|; 3. |x + y| ≤ |x| + |y|. A última desigualdade, referindo-se a números não-negativos, equivale a |x + y|2 ≤ (|x| + |y|)2 . Ora, |x + y|2 = hx + y, x + yi = |x|2 + 2hx, yi + |y|2 ≤ |x|2 + 2|x||y| + |y|2 = (|x| + |y|)2 pois, em virtude da desigualdade de Schwarz, hx, yi ≤ |x| |y|. Mais geralmente, qualquer função Rn → R, que associe a cada vetor x ∈ Rn um número |x| com as três propriedades acima, chama-se uma norma. A norma q |x| = x21 + · · · + x2n , chama-se norma euclidiana. Há duas outras normas que poderemos utilizar em Rn quando houver conveniência. Elas são 1. |x|M = max ·{|x1 |, . . . , |xn |} (norma do máximo), 2. |x|S = |x1 | + · · · + |xn | (norma da soma). As condições que definem uma norma são fáceis de verificar para estas duas. Também é simples mostrar que, para todo x ∈ Rn , vale |x|M ≤ |x| ≤ |x|S ≤ n · |x|M , onde |x| é a norma euclidiana. Quando, num determinado contexto, estivermos usando apenas uma das normas |x|M ou |x|S , podemos indicá-la com a notação |x|, por simplicidade. Para toda norma, vale a desigualdade | |x| − |y| | ≤ |x − y|. Seção 2 Bolas e conjuntos limitados 5 Com efeito, de x = (x − y) + y resulta que |x| ≤ |x − y| + |y|, logo |x| − |y| ≤ |x − y|. Trocando os papéis de x e y, obtemos |y| − |x| ≤ |y − x|. Mas |y − x| = |x − y|, logo |y| − |x| ≤ |x − y|. Conclusão: ||x| − |y|| ≤ |x − y|. Uma norma em Rn dá origem à noção de distância d(x, y) entre dois pontos x, y ∈ Rn . Para x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), pomos p d(x, y) = |x − y| = (x1 − y1 )2 + · · · + (xn − yn )2 . As três condições que definem uma norma implicam que d(x, y) tem as propriedades caracterı́sticas de uma distância, a saber: 1. d(x, y) ≥ 0, com d(x, y) = 0 se, e somente se, x = y; 2. d(x, y) = d(y, x); 3. d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular). Observe que a igualdade |α · x| = |α| |x| com α = −1 dá | − x| = |x|, logo |x−y| = |y−x|. Além disso, |x−z| = |x−y+y−z| ≤ |x−y|+|y−z|, portanto d(x, z) ≤ d(x, y) + d(y, z). 2 Bolas e conjuntos limitados Dados o ponto a ∈ Rn e o número real r > 0, a bola aberta de centro a e raio r é o conjunto B(a; r) dos pontos x ∈ Rn cuja distância ao ponto a é menor que r. Em sı́mbolos: B(a; r) = {x ∈ Rn ; |x − a| < r}. Analogamente, a bola fechada de centro a e raio r é o conjunto B[a; r] assim definido: B[a; r] = {x ∈ Rn ; |x − a| ≤ r}. Por sua vez, a esfera de centro a e raio r é o conjunto S[a; r] = {x ∈ Rn ; |x − a| = r}. Evidentemente, B[a; r] = B(a; r) ∪ S[a; r]. A bola fechada B[a; r] ⊂ Rn também é chamada o disco n-dimensional de centro a e raio r. Em particular, o disco B[0; 1] de centro 0 e raio 1 é chamado o disco unitário de Rn . 6 Topologia do Espaço Euclidiano Cap. 1 Uma notação especial é reservada para a esfera unitária de dimensão n − 1: S n−1 = {x ∈ Rn ; |x| = 1}. Assim, S n−1 é a esfera de centro na origem 0 e raio 1. Quando n = 2, S 1 é a circunferência de centro 0 e raio 1. Acima estamos (pelo menos tacitamente) admitindo que a norma adotada em Rn é a euclidiana, já que não foi feita menção em contrário. Convém, entretanto, observar que a forma geométrica das bolas e esferas em Rn depende da norma que se considera. Por exemplo, se tomarmos em R2 a norma do máximo, a “esfera unitária” é o bordo do quadrado de centro 0 e lados de comprimento 2, paralelos aos eixos. Ainda em R2 , com a norma da soma, o “disco unitário” é o quadrado cujos vértices são os pontos (1, 0), (0, 1), (−1, 0) e (0, −1). (a) (b) (c) Figura 1.2: O conjunto dos pontos z ∈ R2 tais que |z| ≤ 1, conforme a norma seja (a) a euclidiana, (b) do máximo, ou (c) da soma. Observação: Indiquemos com as notações B, BM e BS respectivamente as bolas de centro a e raio r em Rn , relativamente às normas euclidiana, ′ a bola de centro a e raio r/n do máximo e da soma. Seja ainda BM na norma do máximo. As desigualdades |x|M ≤ |x| ≤ |x|S ≤ n|x|M ′ ⊂B ⊂B ⊂B . implicam que BM S M Diz-se que o conjunto X ⊂ Rn é limitado quando está contido em alguma bola B[a; r]. Como B[a; r] ⊂ B[0; k], onde k = r + |a| (conforme veremos agora), dizer que X é limitado equivale a dizer que existe k > 0 tal que |x| ≤ k para todo x ∈ X. Para mostrar que B[a; r] ⊂ B[0; r + |a| ], note que |x − a| ≤ r ⇒ |x| = |x − a + a| ≤ |x − a| + |a| ≤ r + |a|. Assim, x ∈ B[a; r] ⇒ x ∈ B[0; r + |a|]. Seção 3 Conjuntos abertos 7 Uma aplicação f : X → Rn diz-se limitada no conjunto X ⊂ Rm quando sua imagem f (X) ⊂ Rn é um conjunto limitado, isto é, quando existe c > 0 tal que |f (x)| ≤ c para todo x ∈ X. Dados a 6= b em Rn , a reta que une esses dois pontos é o conjunto ab = {(1−t)a+tb ; t ∈ R}. Por sua vez, o segmento de reta de extremos a, b é o conjunto [a, b] = {(1 − t)a + tb ; 0 ≤ t ≤ 1}. Um conjunto X ⊂ Rn chama-se convexo quando o segmento de reta que une dois quaisquer de seus pontos está inteiramente contido em X. Noutros termos, dizer que X é convexo equivale a afirmar que a, b ∈ X, 0≤t≤1 ⇒ (1 − t)a + tb ∈ X . Exemplo 1. Toda bola (aberta ou fechada) é um conjunto convexo. Para fixar as idéias, consideremos a bola fechada B = B[x0 ; r]. Dados a, b ∈ B, temos |a − x0 | ≤ r e |b − x0 | ≤ r. Para qualquer t ∈ [0, 1] vale x0 = (1 − t)x0 + tx0 , logo |(1 − t)a + tb − x0 | = |(1 − t)a + tb − (1 − t)x0 − tx0 | = |(1 − t)(a − x0 ) + t(b − x0 )| ≤ (1 − t)|a − x0 | + t|b − x0 | ≤ (1 − t)r + tr = r, ⊳ Exemplo 2. Seja X = {(x, y) ∈ R2 ; y ≤ x2 }. O conjunto X ⊂ R2 não é convexo. Com efeito os pontos a = (−1, 1) e b = (1, 1) pertencem a X 1 1 mas a + b = (0, 1) não pertence a X. ⊳ 2 2 3 Conjuntos abertos Seja a ∈ X ⊂ Rn . Diz-se que o ponto a é interior ao conjunto X quando, para algum r > 0, tem-se B(a; r) ⊂ X. Isto significa que todos os pontos suficientemente próximos de a também pertencem a X. O conjunto int.X dos pontos interiores a X chama-se o interior do conjunto X. Evidentemente, int.X ⊂ X. Quando a ∈ int.X, diz-se que X é uma vizinhança de a. Exemplo 3. Seja X={(x, y) ∈ R2 ; y ≥ 0} o semi-plano superior fechado. Se p = (a, b) com b > 0, então p ∈ int.X. Com efeito, afirmamos que B = B(p; b) ⊂ X. Isto é claro geometricamente. 8 Topologia do Espaço Euclidiano Cap. 1 b b p a Figura 1.3 Em termos mais precisos, argumentamos assim: p (x, y) ∈ B ⇒ (x − a)2 + (y − b)2 < b ⇒ (y − b)2 < b2 ⇒ y 2 − 2by + b2 < b2 ⇒ y 2 < 2by ⇒ y > 0 (pois b > 0), e portanto (x, y) ∈ X. ⊳ Exemplo 4. Com a notação do Exemplo 3, os pontos da forma q = (a, 0), pertencem a X porém não são interiores a X. Com efeito, nenhuma bola B(q; r) de centro q pode estar contida em X pois o ponto (a, −r/2) pertence a B(q; r) mas não a X. Segue-se então que int.X = {(x, y) ∈ R2 ; y > 0}. Um conjunto A ⊂ Rn chama-se aberto quando todos os seus pontos são interiores, isto é, quando A = int.A. ⊳ y x a Figura 1.4 Exemplo 5. Toda bola aberta B = B(a; r) é um conjunto aberto. Com efeito, seja x ∈ B. Então |x−a| < r, logo s = r −|x−a| > 0. Afirmamos Seção 3 Conjuntos abertos 9 que, B(x; s) ⊂ B. Com efeito, y ∈ B(x; s) ⇒ |y − x| < r − |x − a|. Logo y ∈ B(x; s) ⇒ |y − a| ≤ |y − x| + |x − a| < r − |x − a| + |x − a| = r. Daı́ concluimos que y ∈ B(a; r). ⊳ A fronteira de um conjunto X ⊂ Rn é o conjunto fr.X formado pelos pontos de X que não são interiores a X, juntamente com os pontos de Rn − X que não são interiores a Rn − X. De forma mais simples: tem-se x ∈ fr.X quando toda bola de centro x contém pontos de X e pontos de Rn − X. Exemplo 6. Seja X = {(x, y) ∈ R2 ; y ≥ 0}, como no Exemplo 3. De forma análoga ao argumento usado no Exemplo 3, mostra-se que todo ponto de R2 − X = {(x, y) ∈ R2 ; y < 0} é um ponto interior (ou seja, que R2 − X é um conjunto aberto). Logo, nenhum ponto de R2 − X pode estar na fronteira de X. Segue-se então do Exemplo 4 que fr.X = {(x, 0) ; x ∈ R} = eixo dos xx. Teorema 1. (a) Se A1 , A2 são abertos em Rn então A1 ∩ A2 é aberto. (b) Se (Aλ )λ∈L é umaSfamı́lia arbitrária de conjuntos abertos Aλ ⊂ Rn Aλ é um conjunto aberto. então a reunião A = λ∈L Demonstração: Vide vol. 1, pág. 49. Mesma demonstração, substituindo apenas cada intervalo (a − ε, a + ε) pela bola B(a; ε). Resulta imediatamente do Teorema 1 que a interseção A = A1 ∩ · · · ∩ Ak de um número finito de conjuntos abertos A1 , . . . , Ak é ainda um conjunto aberto. Entretanto, a interseção de infinitos abertos pode ∞ T B(a; 1/k) = {a}. não ser aberta, como mostra o exemplo k=1 Rn . Seja X ⊂ Diz-se que um subconjunto A ⊂ X é aberto em X quando cada ponto a ∈ A é centro de uma bola aberta B(a; r), tal que B(a; r) ∩ X ⊂ A. Isto significa que os pontos de X que estão suficientemente próximos de cada a ∈ A pertencem a A. A reunião U de todas essas bolas é um aberto tal que A = U ∩ X. A recı́proca é óbvia, de modo que um conjunto A ⊂ X é aberto em X se, e somente se, A = U ∩ X onde U é aberto em Rn . Por exemplo, o intervalo (0, 1] é aberto em [0, 1] pois (0, 1] = (0, 2) ∩ [0, 1]. 10 4 Topologia do Espaço Euclidiano Cap. 1 Seqüências em Rn Uma seqüência em Rn é uma função x : N → Rn , que associa a cada número natural k um ponto xk ∈ Rn . As notações para uma seqüência são (x1 , . . . , xk , . . . ), (xk )k∈N ou simplesmente (xk ). Para cada i = 1, . . . , n, indicamos com xki a i-ésima coordenada de xk . Assim, xk = (xk1 , xk2 , . . . , xkn ). Dar uma seqüência em Rn equivale a dar as n seqüências de números reais (xk1 )k∈N , . . . , (xkn )k∈N . Diz-se que a seqüência (xk )k∈N é limitada quando existe uma bola em Rn que contém todos os termos xk . Isto equivale a dizer que existe c > 0 tal que |xk | ≤ c para todo k ∈ N. Em virtude das desigualdades que relacionam as três normas que consideramos em Rn , ser limitada é uma propriedade da seqüência que independe de qual dessas três normas estamos tratando. Se a seqüência (xk ) é limitada então, para todo i = 1, . . . , n, a seqüência (xki )k∈N das i-ésimas coordenadas de xk é também limitada, pois |xki | ≤ |xk |. Vale também a recı́proca. Para prová-la, adotaremos em Rn a norma do máximo. Então, se |xk1 | ≤ c1 , |xk2 | ≤ c2 , . . . , |xkn | ≤ cn para todo k ∈ N, chamando de c o maior dos números c1 , c2 , . . . , cn teremos |xk | = max{|xk1 |, . . . , |xkn |} ≤ c para todo k ∈ N. Assim, se cada (xki )k∈N (i = 1, . . . , n) é limitada, a seqüência (xk )k∈N é limitada. Uma subseqüência de (xk )k∈N é a restrição desta seqüência a um subconjunto infinito N′ = {k1 < · · · < km < . . . } ⊂ N. As notações (xk )k∈N′ , (xkm )m∈N ou (xk1 , . . . , xkm , . . . ) são usadas para indicar uma subseqüência. Diz-se que o ponto a ∈ Rn é o limite da seqüência (xk ) quando, para todo ε > 0 dado arbitrariamente, é possı́vel obter k0 ∈ N tal que k > k0 ⇒ |xk − a| < ε. Noutras palavras: k > k0 ⇒ xk ∈ B(a; ε). Escreve-se então lim xk = a, lim xk = a ou lim xk = a, simplesmente. k→∞ k∈N De acordo com esta definição, tem-se lim xk = a se, e somente se, lim |xk − a| = 0. Dizer que lim xk = a significa afirmar que qualquer bola de centro a contém todos os xk com a possı́vel exceção de um número finito de valores de k (que são 1, 2, . . . , k0 ). Uma seqüência (xk ) em Rn diz-se convergente quando existe a = lim xk . Da observação acima resulta que toda seqüência conver- Seqüências em Rn Seção 4 11 gente é limitada. É também óbvio que qualquer subseqüência de uma seqüência convergente é também convergente e tem o mesmo limite. Observe-se ainda que a definição de limite faz uso de uma norma, porém as desigualdades |x|M ≤ |x| ≤ |x|S ≤ n · |x|M mostram que a existência e o valor do limite não dependem de qual das três normas usuais se está considerando. Este fato será empregado na demonstração do teorema abaixo, onde no final usamos a norma do máximo. Teorema 2. A seqüência (xk ) em Rn converge para o ponto a = (a1 , . . . , an ) se, e somente se, para cada i = 1, . . . , n, tem-se lim xki = ai , isto é, cada coordenada de xk converge para a coordek→∞ nada correspondente de a. Demonstração: Para cada i = 1, . . . , n, tem-se |xki − ai | ≤ |xk − a|, portanto lim xk = a ⇒ lim xki = ai . Reciprocamente, se vale esta k→∞ última igualdade então, dado ε > 0, existem k1 , . . . , kn ∈ N tais que k > ki ⇒ |xki − ai | < ε (i = 1, . . . , n). Tomando k0 = max{k1 , . . . , kn } e adotando em Rn a norma do máximo, vemos que k > k0 ⇒ |xk −a| < ε. Logo lim xk = a. Corolário 1. Se lim xk = a, lim yk = b em Rn e lim αk = α em R então lim(xk + yk ) = a + b e lim αk xk = αa. Tomando cada seqüência de coordenadas, o corolário resulta da propriedade correspondente em R. Além disso, lim hxk , yk i = ha, bi, como se vê facilmente. E a desigualdade ||xk | − |a|| ≤ |xk − a| mostra ainda que se tem lim |xk | = |a| seja qual for a norma adotada. Teorema 3 (Bolzano-Weierstrass). Toda seqüência limitada em Rn possui uma subseqüência convergente. Demonstração: Seja (xk ) uma seqüência limitada em Rn . As primeiras coordenadas dos seus termos formam uma seqüência limitada (xk1 )k∈N de números reais, a qual, pelo Teorema de Bolzano-Weierstrass na reta (vol. 1, pág. 25), possui uma subseqüência convergente. Isto é, existem um subconjunto infinito N1 ⊂ N e um número real a1 tais que lim xk1 = a1 . Por sua vez, a seqüência limitada (xk2 )k∈N1 em R k∈N1 possui uma subseqüência convergente: existem um subconjunto infinito N2 ⊂ N1 e um número real a2 tais que lim xk2 = a2 . E assim por k∈N2 12 Topologia do Espaço Euclidiano Cap. 1 diante, até obtermos n conjuntos infinitos N ⊃ N1 ⊃ N2 ⊃ · · · ⊃ Nn e números reais a1 , a2 , . . . , an tais que lim xki = ai , para i = 1, 2, . . . , n. k∈Ni Então pomos a = (a1 , . . . , an ) e, pelo Teorema 2, temos lim xk = a, o k∈Nn que prova o teorema. Uma seqüência de pontos xk ∈ Rn chama-se uma seqüência de Cauchy quando, para todo ε > 0 dado, existe k0 ∈ N tal que k, r > k0 ⇒ |xk − xr | < ε. Toda seqüência de Cauchy (xk ) é limitada. Com efeito, tomando ε = 1 na definição acima, vemos que existe um ı́ndice k0 tal que, salvo possivelmente os pontos x1 , . . . , xk0 todos os demais termos xk pertencem à bola B(xk0 +1 ; 1). Portanto o conjunto dos termos da seqüência é limitado. A condição para que a seqüência (xk ) seja de Cauchy pode ser reformulada dizendo-se que lim |xk −xr | = 0, isto é, que lim |xk −xr | = 0. k,r→∞ k,r∈N Daı́ resulta que se N′ ⊂ N é um subconjunto infinito, ou seja, se (xr )r∈N′ é uma subseqüência de (xk ) então lim ′ |xk − xr | = 0. k∈N, r∈N Teorema 4 (Critério de Cauchy). Uma seqüência em Rn converge se, e somente se, é uma seqüência de Cauchy. Demonstração: Seja (xk ) uma seqüência de Cauchy em Rn . Sendo liSeja mitada, ela possui uma subseqüência convergente (xr )r∈N′ . a = lim′ xr . Temos lim′ |xr − a| = 0 e lim ′ |xk − xr | = 0, como r∈N r∈N k∈N, r∈N observamos acima. Então, de |xk − a| ≤ |xk − xr | + |xr − a| resulta que lim |xk − a| = 0, ou seja, lim xk = a. Reciprocamente, se (xk ) é k∈N k→∞ convergente, com lim xk = a, então, como |xk − xr | ≤ |xk − a| + |xr − a|, concluı́mos que lim |xk − xr | = 0, ou seja, (xk ) é de Cauchy. k,r→∞ 5 Conjuntos fechados Diz-se que o ponto a é aderente ao conjunto X ⊂ Rn quando existe uma seqüência de pontos xk ∈ X tais que lim xk = a. Chama-se fecho do conjunto X ⊂ Rn ao conjunto X formado por todos os pontos aderentes a X. Portanto a ∈ X ⇔ a = lim xk , xk ∈ X. Dizer que a ∈ X é o mesmo que afirmar que a é aderente a X. Um conjunto F ∈ Rn chama-se fechado quando F = F , isto é, Seção 5 Conjuntos fechados 13 quando o limite de toda seqüência convergente de pontos de F é ainda um ponto de F . Todo ponto x ∈ X é aderente a X pois é limite da seqüência constante (x, x, . . . ). Assim, X ⊂ X qualquer que seja X ⊂ Rn . Também é óbvio que X ⊂ Y ⇒ X ⊂ Y . Exemplo 7. Se |x| = r então x não pertence à bola aberta B = B(0; r) 1 porém é aderente a ela. Com efeito, pondo xk = 1 − x para todo k k ∈ N, temos xk ∈ B(0; r) e lim xk = x, logo x ∈ B. Reciprocamente, se x ∈ B então x = lim xk com |xk | < r para todo k ∈ N, portanto |x| = lim |xk | ≤ r. Conclui-se então que x ∈ B⇔|x|≤r, ou seja, B = B[0; r]. O mesmo argumento mostra que o fecho de toda bola aberta B(a; r) é a bola fechada B[a; r]. O teorema abaixo resume as principais propriedades do fecho de um conjunto. Teorema 5. (a) O ponto a é aderente ao conjunto X ⊂ Rn se, e somente se, toda bola de centro a contém algum ponto de X. (b) Um conjunto F ⊂ Rn é fechado se, e somente se, seu complementar Rn − F é aberto. Equivalentemente: A ⊂ Rn é aberto se, e somente se, Rn − A é fechado. (c) O fecho de qualquer conjunto X ⊂ Rn é fechado. Noutras palavras: para todo X ⊂ Rn tem-se X = X. Demonstração: (a) Se a é aderente a X então a = lim xk , com xk ∈ X para todo k ∈ N. Portanto qualquer bola B(a; r) contém pontos de X, a saber, todos os xk com k suficientemente grande. Reciprocamente, se toda bola de centro a contém pontos de X, podemos escolher, para cada k ∈ N, um ponto xk ∈ X que esteja na bola B(a; 1/k), isto é, |xk − a| < 1/k. Então lim xk = a, logo a é aderente a X. (b) As seguintes afirmações são equivalentes: (1) F é fechado. (2) Se x ∈ Rn − F então x não é aderente a F . (3) Se x ∈ Rn − F então existe r > 0 tal que B(x; r) ⊂ Rn − F (em virtude da parte (a) acima). (4) Rn − F é aberto. Assim, F fechado ⇔ Rn − F aberto. Escrevendo A = Rn − F , donde F = Rn − A, esta última conclusão lê-se assim: A é aberto se, e somente se, Rn − A é fechado. (c) Se x ∈ Rn − X (isto é, x não é aderente a X) então, por (a), existe uma bola B = B(x; r) que não contém pontos de X, ou seja, 14 Topologia do Espaço Euclidiano Cap. 1 X ⊂ Rn − B. Logo X ⊂ Rn − B. Mas, pela parte (b) acima, Rn − B é fechado; portanto X ⊂ Rn − B ou, equivalentemente, B ⊂ Rn − X. Assim, todo ponto x ∈ Rn − X é um ponto interior, logo Rn − X é aberto. Segue-se que X é fechado. Alguns conjuntos X ⊂ Rn não são abertos nem fechados, como X = B(a; r) ∪ {b}, onde |b − a| = r. Ou então X = conjunto dos pontos de Rn com coordenadas racionais (X = Qn ). Chama-se distância do ponto a ∈ Rn ao conjunto X ⊂ Rn ao número d(a; X) = inf{|x − a| ; x ∈ X}. Pela definição de ı́nfimo, para cada k ∈ N existe um ponto xk ∈ X tal 1 que d(a; X) ≤ |xk − a| < d(a, X) + , portanto lim |xk − a| = d(a; X). k→∞ k A seqüência (xk ) é certamente limitada, portanto possui uma subseqüência convergente. Descartando (por serem desnecessários) os termos xk que não estejam nessa subseqüência, vemos que existe um ponto x0 = lim xk tal que d(a, X) = |x0 − a|. Tem-se x0 ∈ X. Se o conjunto X for fechado então x0 ∈ X. Podemos então enunciar o Teorema 6. Seja F ⊂ Rn um conjunto fechado. Dado qualquer a ∈ Rn existe (pelo menos um) x0 ∈ F tal que |x0 −a| ≤ |x−a| para todo x ∈ F . Noutras palavras: Se F ⊂ Rn é fechado então, para a ∈ Rn qualquer, a função f : F → R dada por f (x) = |x − a| assume seu valor mı́nimo em algum ponto x0 ∈ F . Então tem-se d(a, F ) = |x0 − a|. Se X ⊂ Y ⊂ Rn , diz-se que X é denso em Y quando X = Y . Por exemplo, B(a; r) é denso em B[a; r] e Qn é denso em Rn . Dizemos que a ∈ Rn é ponto de acumulação do conjunto X ⊂ Rn quando toda bola de centro a contém algum ponto de X diferente de a. (Noutras palavras, quando a ∈ X − {a}.) Um ponto de acumulação de X pode pertencer a X ou não. Se a ∈ X não é ponto de acumulação de X, diz-se que a é um ponto isolado de X. Isto significa que existe r > 0 tal que B(a; r) ∩ X = {a}. Quando todos os pontos de X são isolados, dizemos que X é um conjunto discreto. Exemplo 8. Todos os pontos de uma bola são pontos de acumulação. O conjunto Zn dos pontos de Rn com coordenadas inteiras é um conjunto discreto. ⊳ Seção 5 Conjuntos fechados 15 As demonstrações dos três teoremas seguintes são omitidas pois são praticamente as mesmas dos seus análogos unidimensionais, provados no volume 1 (págs. 50, 52 e 53). Basta substituir cada intervalo (a−r, a+r) pela bola B(a; r) e considerar |x| como a norma de x. Teorema 7. Sejam a um ponto e X um subconjunto de Rn . As seguintes afirmações são equivalentes: (1) a é um ponto de acumulação de X. (2) a é limite de uma seqüência de pontos xk ∈ X − {a}. (3) Toda bola de centro a contém uma infinidade de pontos de X. Teorema 8. Todo subconjunto infinito limitado X ⊂ Rn admite pelo menos um ponto de acumulação. Teorema 9. (a) Se F1 e F2 são subconjuntos fechados de Rn então F1 ∪ F2 é também fechado. (b) Se (Fλ )λ∈L éTuma famı́lia arbitrária de conjuntos fechados então a Fλ é um conjunto fechado. interseção F = λ∈L Cabe aqui a observação de que (a) implica que a reunião F1 ∪ · · · ∪Fk de um número finito de conjuntos fechados é ainda um conjunto fechado. Entretanto isto não vale para reuniões infinitas. Com efeito, um conjunto qualquer, fechado ou não, é a reunião dos seus pontos, que são conjuntos fechados. Segue-se do item (2) do Teorema 7 que o fecho do conjunto X é formado acrescentando-lhe seus pontos de acumulação que por ventura não pertençam a X. Seja X ⊂ Rn . Diz-se que um subconjunto F ⊂ X é fechado em X quando F contém todos os seus pontos aderentes que pertencem a X. Assim, F é fechado em X se, e somente se, F = F ∩ X. F é fechado em X quando, e somente quando, F = G ∩ X onde G ⊂ Rn é fechado. Com efeito se F = G ∩ X com G fechado então F ⊂ G, logo F = F ∩ X ⊂ F ∩ X ⊂ G ∩ X = F , donde F = F ∩ X e F é fechado em X. O conjunto F ⊂ X é fechado em X se, e somente se, X − F (seu complementar relativamente a X) é aberto em X. Com efeito F = G ∩ X ⇔ X − F = (Rn − G) ∩ X, onde G ⊂ Rn é fechado se, e somente se, Rn − G é aberto. 16 Topologia do Espaço Euclidiano Cap. 1 Analogamente, A ⊂ X é aberto em X se, e somente se, X − A é fechado em X pois A = U ∩ X ⇔ X − A = (Rn − U ) ∩ X e U ⊂ Rn é aberto se, e somente se, Rn − U é fechado. 6 Conjuntos compactos Um conjunto X ⊂ Rn chama-se compacto quando é limitado e fechado. Exemplo 9. Toda bola fechada B[a; r] é compacta e nenhuma bola aberta é. O conjunto Zn é fechado mas não é limitado, logo não é compacto. Toda esfera S[a; r] é compacta. ⊳ Teorema 10. As seguintes afirmações sobre o conjunto K ⊂ Rn são equivalentes: (1) K é compacto; (2) Toda seqüência de pontos xk ∈ K possui uma subseqüência que converge para um ponto de K. Demonstração. Se K é compacto então toda seqüência de pontos xk ∈ K é limitada, pois K é limitado. Por Bolzano-Weierstrass, uma subseqüência (xk )k∈N′ converge para um ponto a = lim′ xk . Como K é k∈N fechado, tem-se a ∈ K. Logo (1) implica (2). Reciprocamente, se vale (2) então K é limitado pois do contrário existiria, para cada k ∈ N, um ponto xk ∈ K tal que |xk | > k. A seqüência (xk ) assim obtida não possuiria subseqüência limitada, logo nenhuma de suas subseqüências seria convergente. Além disso, K é fechado pois se a = lim xk com xk ∈ K para todo k ∈ N então, por (2), uma subseqüência de (xk ) convergiria para um ponto de K. Mas toda subseqüência de (xk ) converge para a. Logo a ∈ K. Isto mostra que (2) ⇒ (1) e completa a demonstração. Estendendo a discussão da seção 5, dados os conjuntos X, Y ⊂ Rn , podemos definir a distância entre eles pondo d(X, Y ) = inf{|x − y|; x ∈ X, y ∈ Y }, cabendo-nos agora indagar se, supondo X e Y fechados, existem x0 ∈ X e y0 ∈ Y tais que d(X, Y ) = |x0 − y0 |. Nem sempre. Com efeito, tomando em R2 o conjunto X como sendo o eixo das abcissas, isto é, X = {(x, 0); x ∈ R} e Y = {(x, 1/x); x > 0}, ou seja, Y = ramo positivo da hipérbole y = 1/x, vemos que X e Y são subconjuntos fechados Seção 6 Conjuntos compactos 17 disjuntos em R2 tais que d(X, Y ) = 0. Entretanto, vale o seguinte resultado, que contém o Teorema 6 como caso particular: Teorema 11. Sejam K ⊂ Rn compacto e F ⊂ Rn fechado. Existem x0 ∈ K e y0 ∈ F tais que |x0 − y0 | ≤ |x − y| para quaisquer x ∈ K e y ∈ F. Demonstração. Da definição de ı́nfimo segue-se que existem seqüências de pontos xk ∈ K e yk ∈ F tais que d(K, F ) = lim |xk − yk |. Passando a uma subseqüência, se necessário, a compacidade de K nos permite admitir que lim xk = x0 ∈ K. Além disso, a seqüência (yk ) é limitada pois |yk | ≤ |yk − xk | + |xk |, onde |yk − xk | é limitada por ser convergente e |xk | é limitada pois xk ∈ K. Logo, passando novamente a uma subseqüência, se necessário, podemos admitir que lim yk = y0 , com y0 ∈ F pois F é fechado. Então |x0 − y0 | = lim |xk − yk | = d(K, F ) ≤ |x − y| para quaisquer x ∈ K e y ∈ F . Corolário 2. Sejam K ⊂ U ⊂ Rn , onde K é compacto e U é aberto. Existe ε > 0 tal que toda bola B(x; ε), de raio ε e centro num ponto x ∈ K, está contida em U . Com efeito, sejam x0 ∈ K e y0 ∈ F = Rn − U tais que |x0 − y0 | ≤ |x − y| para quaisquer x ∈ K e y ∈ F . Ponhamos ε = |x0 − y0 |. Como K ⊂ U , vemos que K ∩ F = ∅, portanto x0 6= y0 e daı́ ε > 0. Assim, se x∈K ey∈ / U , tem-se |x − y| ≥ ε. Noutras palavras, se x ∈ K então B(x; ε) ⊂ U . Se F1 ⊃ F2 ⊃ · · · ⊃ Fk ⊃ . . . é uma seqüência decrescente de ∞ T Fk = ∅. Isto ocorre, fechados não-vazios em Rn , pode ocorrer que k=1 por exemplo, quando tomamos Fk = [k, +∞) em R. O teorema abaixo mostra que isto não acontece quando um dos Fk é limitado (portanto todos os seguintes são). Teorema 12 (Cantor). Seja K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . . uma seqüência decrescente de compactos não-vazios em Rn . Existe pelo menos um ponto a ∈ Rn que pertence a todos os Kk . Noutros termos: ∞ T Kk6= ∅. k=1 Demonstração. Para cada k ∈ N, escolhamos um ponto xk ∈ Kk . A seqüência (xk ) é limitada, logo possui uma subseqüência (xr )r∈N′ , que 18 Topologia do Espaço Euclidiano Cap. 1 converge para a = lim′ xr . Mostremos que a ∈ Kk para todo k ∈ N. r∈N De fato, dado k, temos Kr ⊂ Kk sempre que r ∈ N′ e r > k. Assim, r ∈ N′ , r > k ⇒ xr ∈ Kk . Segue-se que a = lim′ xr pertence ao r∈N conjunto fechado Kk . Uma propriedade fundamental dos conjuntos compactos é o fato de que toda cobertura aberta de um compacto possui uma subcobertura finita. Vejamos isto. Uma cobertura do conjunto X ⊂SRn é uma famı́lia (Cλ )λ∈L de subCλ . Isto significa que para cada conjuntos Cλ ⊂ Rn tais que X ⊂ λ∈L x ∈ X existe um λ ∈ L tal que x ∈ Cλ . Uma subcobertura é uma subfamı́lia (Cλ )λ∈L′ , L′ ⊂ L, tal que ainda S Cλ . se tem X ⊂ λ∈L′ Diz-se que a cobertura S ⊂ ∪Cλ é aberta quando os Cλ forem todos abertos, ou finita quando L é um conjunto finito. Teorema 13 (Borel-Lebesgue). Toda cobertura aberta K ⊂ ∪Aλ de um compacto K ⊂ Rn admite uma subcobertura finita K ⊂ Aλ1 ∪ · · · ∪ Aλk . Inicialmente, prepararemos o terreno para estabelecer um lema que torna a demonstração do teorema quase imediata. Seja X ⊂ Rn um conjunto limitado. O diâmetro de X é o número diam.X = sup{|x − y|; x, y ∈ X}. Segue-se imediatamente desta definição que se diam.X = d e x ∈ X então X ⊂ B[x; d]. Dado α > 0, um cubo de aresta α é um produto cartesiano n Q [ai , ai +α] de n intervalos de comprimento α. Se x = (x1 , . . . , xn ) C= i=1 e y = (y1 , . . . , yn ) pertencem p a C então, para cada i = 1, . . . , n, tem-se √ |xi − yi | ≤ α, logo |x − y| = Σ(xi − yi )2 ≤ α n. Tomando xi = ai e √ √ yi = ai + α temos |x − y| = α n, portanto α n é o diâmetro do cubo de aresta α em Rn . S [mα, (m + 1)α] da reta em intervalos A decomposição R = m∈Z adjacentes de comprimento α determina uma decomposição de Rn como reunião de cubos adjacentes de aresta α. A saber, para cada Seção 7 Aplicações contı́nuas 19 n Q [mi α, (mi + 1)α] e temos m = (m1 , . . . , mn ) ∈ Zn , pomos Cm = i=1 S S (X ∩ Cm ). Se X é Cm . Para todo X ⊂ Rn tem-se X = Rn = m∈Zn m∈Zn limitado, há apenas um número finito de interseções X ∩ Cm não-vazias, logo podemos escrever X = X1 ∪ · · · ∪ Xk √ onde cada Xi é da forma X ∩ Cm , logo tem diâmetro ≤ α n. Se X for compacto então cada Xi é compacto. Isto prova o Lema 1. Seja K ⊂ Rn compacto. Para todo ε > 0 existe uma decomposição K = K1 ∪ · · · ∪ Kk onde cada Ki é compacto e tem diâmetro ≤ ε. Demonstração do Teorema de Borel-Lebesgue. Seja K ⊂ Rn compacto. Suponhamos, por absurdo, que K ⊂ ∪Aλ seja uma cobertura aberta que não admite subcobertura finita. Exprimamos K como reunião finita de compactos, todos com diâmetro < 1. Pelo menos um deles, que chamaremos K1 , é tal que K1 ⊂ ∪Aλ não admite subcobertura finita. Escrevendo K1 como reunião finita de compactos de diâmetro < 1/2, vemos que pelo menos um deles, digamos K2 , não pode ser coberto por um número finito de Aλ ’s. Prosseguindo assim, obtemos uma seqüência decrescente de compactos K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . . com diam Kk < 1/k e tal que nenhum deles está contido numa reunião finita de Aλ ’s. Em particular, todos os Kk são não-vazios. Pelo Teorema ∞ T Kk . Para algum λ, tem-se a ∈ Aλ . Como Aλ é aberto, 12, existe a ∈ k=1 tem-se B(a; 1/k) ⊂ Aλ para algum k. Sendo a ∈ Kk e diam Kk < 1/k, concluı́mos que Kk ⊂ B(a; 1/k), donde Kk ⊂ Aλ , o que é uma contradição. 7 Aplicações contı́nuas Uma aplicação f : X → Rn , definida no conjunto X ⊂ Rm , associa a cada ponto x ∈ X sua imagem f (x) = (f1 (x), . . . , fn (x)). As funções reais f1 , . . . , fn : X → R, assim definidas, chamam-se as funções-coordenada de f . Escreve-se então f = (f1 , . . . , fn ). 20 Topologia do Espaço Euclidiano Cap. 1 Se Y ⊂ Rn é tal que f (X) ⊂ Y podemos (com um abuso de notação que é irrelevante em nosso contexto) escrever f : X → Y em vez de f : X → Rn . Diz-se que f é contı́nua no ponto a ∈ X quando, para cada ε > 0 arbitrariamente dado, pode-se obter δ > 0 tal que x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| < ε. Noutros termos: para cada bola B(f (a); ε) dada, existe uma bola B(a; δ) tal que f (B(a; δ) ∩ X) ⊂ B(f (a); ε). A continuidade de f no ponto a independe das normas que se utilizem em Rm e Rn . Diremos que f : X → Rn é uma aplicação contı́nua no conjunto X ⊂ Rm quando f é contı́nua em todos os pontos a ∈ X. Teorema 14. Sejam X ⊂ Rm , Y ⊂ Rn , f : X → Rn com f (X) ⊂ Y e g : Y → Rp . Se f é contı́nua no ponto a ∈ X e g é contı́nua no ponto f (a) então g ◦ f : X → Rp é contı́nua no ponto a. Ou seja: a composta de duas aplicações contı́nuas é contı́nua. Demonstração. Seja dado ε > 0. A continuidade de g no ponto f (a) assegura a existência de λ > 0 tal que y ∈ Y , |y − f (a)| < λ ⇒ |g(y) − g(f (a))| < ε. Por sua vez, dado λ > 0, a continuidade de f no ponto a fornece δ > 0 tal que x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| < λ ⇒ |g(f (x)) − g(f (a))| < ε, logo g ◦ f é contı́nua no ponto a. Teorema 15. (a) A aplicação f : X → Rn é contı́nua no ponto a ∈ X se, e somente se, para toda seqüência de pontos xk ∈ X com lim xk = a, tem-se lim f (xk ) = f (a). (b) A aplicação f : X → Rn é contı́nua no ponto a ∈ X se, e somente se, suas funções-coordenada f1 , . . . , fn : X → R são contı́nuas nesse ponto. Demonstração. (a) Seja f : X → Rn contı́nua no ponto a. Dada a seqüência de pontos xk ∈ X com lim xk = a, para todo ε > 0 existe δ > 0 tal que f (B(a; δ)) ⊂ B(f (a); ε). Correspondente a δ, existe k0 ∈ N tal que k > k0 ⇒ xk ∈ B(a; δ), logo k > k0 ⇒ f (xk ) ∈ B(f (a); ε). Isto mostra que lim f (xk ) = f (a). Reciprocamente, suponhamos, por absurdo, que lim xk = a implica lim f (xk ) = f (a), porém f seja descontı́nua no ponto a. Então existe ε > 0 com a seguinte propriedade: para todo k ∈ N, podemos encontrar xk ∈ X com |xk − a| < 1/k e Seção 7 Aplicações contı́nuas 21 |f (xk ) − f (a)| ≥ ε. Assim, temos lim xk = a mas não temos lim f (xk ) = f (a), uma contradição. (b) Isto decorre imediatamente do Teorema 2 junto com a parte (a) que acabamos de provar. Teorema 16. Seja X ⊂ Rm . Se as aplicações f, g : X → Rn e α : X → R são contı́nuas no ponto a ∈ X então são também contı́nuas nesse ponto as aplicações f + g : X → Rn , hf, gi : X → R, |f | : X → R e αf : X → Rn , definidas por (f + g)(x) = f (x) + g(x), hf, gi(x) = hf (x), g(x)i, |f |(x) = |f (x)| e (αf )(x) = α(x) · f (x). Demonstração. Isto resulta do Teorema 15(a) juntamente com o Corolário do Teorema 2. Teorema 17. A imagem f (K) do conjunto compacto K ⊂ X pela aplicação contı́nua f : X → Rn é também um conjunto compacto. Demonstração. Seja (yk ) uma seqüência de pontos em f (K). Para cada k ∈ N existe xk ∈ K tal que f (xk ) = yk . Como K é compacto, uma subseqüência (xk )k∈N′ converge para um ponto a ∈ K. Sendo f contı́nua nesse ponto a, de lim′ xk = a resulta, pelo Teorema 15, que k∈N lim′ f (xk ) = f (a). Logo toda seqüência de pontos yk = f (xk ) ∈ f (K) k∈N possui uma subseqüência (yk )k∈N′ convergente para um ponto f (a) ∈ f (K). Noutras palavras: f (K) é compacto. Corolário 3. (Weierstrass.) Seja K ⊂ Rm compacto. Se f : K → R é uma função real contı́nua, então existem x0 , x1 ∈ K tais que f (x0 ) ≤ f (x) ≤ f (x1 ) para todo x ∈ K. Noutas palavras: toda função real contı́nua num conjunto compacto K atinge seus valores mı́nimo e máximo em pontos de K. Para provar o Teorema de Weierstrass basta observar que, sendo f (K) ⊂ R compacto, os números y0 = inf f (K) e y1 = sup f (K) pertencem a f (K), isto é, y0 = f (x0 ) e y1 = f (x1 ), com x0 , x1 ∈ K. Teorema 18. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e somente se, a imagem inversa f −1 (A) de todo conjunto aberto A ⊂ Rn é um subconjunto aberto em X. Demonstração. Seja f contı́nua. Se A ⊂ Rn é aberto então, para todo x ∈ f −1 (A) existe ε > 0 tal que B(f (x); ε) ⊂ A. Pela continuidade de f , x é centro de uma bola aberta Bx tal que f (Bx ∩X)⊂B(f (x); ε)⊂A, logo 22 Topologia do Espaço Euclidiano Cap. 1 x ∈ Bx ∩ X ⊂ f −1 (A). Isto valendo para todo x ∈ f −1 (A), resulta que f −1 (A) ⊂ U ∩X ⊂ f −1 (A), logo f −1 (A) = U ∩X, onde U é a reunião das bolas abertas Bx , x ∈ f −1 (A). Reciprocamente, suponhamos que, para todo aberto A ⊂ Rn , f −1 (A) seja aberto em X, isto é, f −1 (A) = U ∩ X com U aberto em Rm . Então, dados x ∈ X e ε > 0, tomamos A = B(f (x); ε) e obtemos U ⊂ Rm aberto tal que U ∩ X = f −1 (B(f (x); ε)). Certamente x ∈ U , logo existe δ > 0 tal que B(x; δ) ⊂ U e assim f (B(x; δ) ∩ X) ⊂ B(f (x); ε). Portanto, f é contı́nua em todos os pontos x ∈ X. Teorema 19. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e somente se, a imagem inversa de todo conjunto fechado F ⊂ Rn é um subconjunto f −1 (F ) fechado em X. Demonstração. Isto resulta do Teorema 18 se observarmos que, pondo A = Rn − F , então A é aberto em Rn e que f −1 (F ) = X − f −1 (A) é fechado em X se, e somente se, f −1 (A) é aberto em X. Observação. Dada f : X → Rn , se f (X) ⊂ Y ⊂ Rn podemos considerar f como uma aplicação de X em Y e escrever f : X → Y . Se A e F são subconjuntos de Rn então f −1 (A) = f −1 (A ∩ Y ) e f −1 (F ) = f −1 (F ∩ Y ). Logo podemos enunciar os Teoremas 18 e 19 assim: A aplicação f : X → Y é contı́nua se, e somente se, a imagem inversa por f de todo subconjunto aberto (respect. fechado) em Y é um subconjunto aberto (respect. fechado) em X. Corolário 4. Seja X ⊂ Rm aberto (respect. fechado). A fim de que f : X → Rn seja contı́nua é necessário e suficiente que a imagem inversa por f de todo subconjunto aberto (respect. fechado) em Rn seja um conjunto aberto (respect. fechado) em Rm . Corolário 5. Sejam f, g : X → R contı́nuas no conjunto X ⊂ Rm . O conjunto A = {x ∈ X; f (x) < g(x)} é aberto em X enquanto os conjuntos F = {x ∈ X; f (x) ≤ g(x)} e G = {x ∈ X; f (x) = g(x)} são fechados em X. Em particular, tomando g constante, vemos que o conjunto dos pontos x ∈ X tais que f (x) < c é aberto em X enquanto as soluções x ∈ X da inequação f (x) ≤ c ou da equação f (x) = c formam conjuntos fechados em X. Seção 8 Continuidade uniforme 23 Teorema 20. Sejam ϕ : K → Rn contı́nua no compacto K ⊂ Rm e L = ϕ(K) a imagem (compacta) de ϕ. A fim de que uma aplicação f : L → Rp seja contı́nua, é necessário e suficiente que a composta f ◦ ϕ : K → Rp seja contı́nua. K f ◦ϕ Rp ϕ f L Demonstração. Se f é contı́nua então f ◦ ϕ é contı́nua, pelo Teorema 14. Reciprocamente, supondo f ◦ ϕ contı́nua então, para todo conjunto fechado F ⊂ Rp , a imagem inversa (f ◦ ϕ)−1 (F ) = ϕ−1 [f −1 (F )] é um subconjunto fechado de K, logo é compacto. Então, pelo Teorema 17, f −1 (F ) = ϕ[ϕ−1 (f −1 (F ))] é compacto, logo fechado em Rm . Segue-se do Corolário 4 que f é contı́nua. Observação. Quando se tem uma aplicação arbitrária ϕ : K → L entre dois conjuntos, para todo Z ⊂ L vale a inclusão ϕ[ϕ−1 (Z)] ⊂ Z. Entretanto, quando ϕ : K → L é sobrejetiva, como no caso acima, tem-se ϕ[ϕ−1 (Z)] = Z. Exemplo 10. Tomemos K = [0, 2π] ⊂ R, L = S 1 = {(x, y) ∈ R2 ; x2 + y 2 = 1} e ϕ : [0, 2π] → R2 dada por ϕ(t) = (cos t, sen t). Então [0, 2π] e S 1 são compactos e ϕ : [0, 2π] → S 1 é contı́nua e sobrejetiva. Seja agora g : [0, 2π] → Rn uma aplicação contı́nua tal que g(0) = g(2π). A partir de g, podemos definir f : S 1 → Rn , pondo f (cos t, sen t) = g(t). Como g(0) = g(2π), f está bem definida. Além disso, f ◦ ϕ = g é contı́nua. Segue-se do Teorema 20 que f é contı́nua. Isto se exprime dizendo que “para definir uma aplicação contı́nua no cı́rculo S 1 basta defini-la no intervalo [0, 2π] de modo que assuma valores iguais nos extremos 0 e 2π.” ⊳ 8 Continuidade uniforme A adição e a multiplicação de números reais são funções contı́nuas s, p : R2 → R, definidas por s(x, y) = x + y e p(x, y) = x · y. Exa- 24 Topologia do Espaço Euclidiano Cap. 1 minemos a continuidade de cada uma delas no ponto (a, b) ∈ R2 . Para isso, usaremos em R2 a norma do máximo, segundo a qual tem-se (x, y) ∈ B((a, b); δ) se, e somente se, |x − a| < δ e |y − b| < δ. Comecemos com a adição: dado ε > 0, tomemos δ = ε/2. Se |x−a| < ε/2 e |y − b| < ε/2, isto é, (x, y) ∈ B((a, b), δ), então |s(x, y) − s(a, b)| = |x + y − (a + b)| ≤ |x − a| + |y − b| < ε. Em seguida, a multiplicação: dado ε > 0, temos xy − ab = (x − a) (y − b) + (x − a)b + a(y − b), logo, tomando δ > 0 menor do que cada um p ε ε e veremos que se |x − a| < δ dos números ε/3, 3(|a| + 1) 3(|b| + 1) e |y − b| < δ isto é, (x, y) ∈ B((a, b), δ), então |p(x, y) − p(a, b)| = |xy − ab| ≤ |x − a| |y − b| + |x − a| |b| + |a| |y − b| ≤ ε ε ε ≤ + + = ε. 3 3 3 Note-se a diferença: no caso da adição, δ depende apenas de ε, mas não do ponto (a, b) onde a continuidade é testada. Já na multiplicação, δ depende não apenas de ε mas também de (a, b). Se um dos números a ou b aumentar, para o mesmo ε deve-se tomar δ cada vez menor. Isto significa que a adição é uniformemente contı́nua mas a multiplicação não é. Segue-se a definição pertinente: Uma aplicação f : X → Rn diz-se uniformente contı́nua no conjunto X ⊂ Rm quando, para todo ε > 0, for possı́vel obter δ > 0 tal que |x − y| < δ ⇒ |f (x) − f (y)| < ε, sejam quais forem x, y ∈ X. Teorema 21. A fim de que f : X → Rn seja uniformente contı́nua no conjunto X ⊂ Rm é necessário e suficiente que, para todo par de seqüências de pontos xk , yk ∈ X com lim |xk − yk | = 0, se tenha lim |f (xk ) − f (yk )| = 0. Teorema 22. Toda aplicação contı́nua f : X → Rn , definida num conjunto compacto X ⊂ Rm , é uniformemente contı́nua. As demonstrações dos Teoremas 21 e 22 são exatamente as mesmas que se encontram nas páginas 83 e 84 do volume 1. Exemplo 11. Uma aplicação f : X → Rn , definida no conjunto X ⊂ Rm , chama-se lipschitziana quando existe c > 0 tal que |f (x) − f (y)| ≤ c|x − y| para quaisquer x, y ∈ X. O número c é chamado uma constante de Lipschitz de f . Toda aplicação lipschitziana é uniformemente Seção 9 Homeomorfismos 25 contı́nua: dado ε > 0, basta tomar δ = ε/c. A função f : [0, 1] → R, defi√ nida por f (x) = x, é uniformemente contı́nua mas não é lipschitziana. Basta ver que √ √ 1√ | x − y| = √x+ |x − y| y √ √ e que, com x, y ∈ [0, 1] pode-se tornar x + y tão pequeno, (logo √ √ ⊳ ( x + y)−1 tão grande) quanto se queira. Exemplo 12. Toda transformação linear A : Rm → Rn é contı́nua pois, para cada i = 1, 2, . . . , n, a i-ésima função-coordenada de A é a função contı́nua (x1 , . . . , xm ) 7→ ai1 x1 + · · · + aim xm , onde [aij ] é a matriz de A. A esfera unitária S m−1 = {x ∈ Rm ; |x| = 1} é compacta. Logo A é limitada em S m−1 . O número |A| = sup{|A · x|; x ∈ S m−1 } chama-se a norma da transformação A. Para todo vetor v ∈ Rm , tem-se v |A · v| ≤ |A| · |v|. Isto é óbvio quando v = 0. Se v 6= 0 então ∈ S m−1 |v| logo v |A · v| = |v| · |A | ≤ |A| |v|. |v| Para x, y ∈ Rm quaisquer, tem-se |A · x − A · y| = |A(x − y)| ≤ |A| · |x − y|. Logo a transformação linear A é uma aplicação lipschitziana, com constante de Lipschitz |A|. ⊳ Exemplo 13. Dado A ⊂ Rn não-vazio, seja f : Rn → R definida por f (x) = d(x, A). Afirmamos que |d(x, A) − d(y, A)| ≤ |x − y| para quaisquer x, y ∈ Rn . Logo f é lipschitziana, com constante c = 1, donde uniformemente contı́nua. Para provar nossa afirmação, observemos que, dados x, y ∈ Rn , existem ā, b̄ ∈ A tais que d(x, A) = |x − ā| e d(y, A) = |y − b̄|. (Vide seção 5.) Temos b̄ = lim yk , com yk ∈ A. Como |x − ā| ≤ |x − yk | para todo k ∈ N, segue-se que |x−ā| ≤ |x−b̄|. Sem perda de generalidade, podemos supor que d(x, A) ≥ d(y, A), logo |d(x, A)−d(y, A)| = d(x, A)−d(y, A) = |x − ā| − |y − b̄| ≤ |x − b̄| − |y − b̄| ≤ |x − y|, como querı́amos demonstrar. ⊳ Quando |f (x) − f (y)| ≤ |x − y| para quaisquer x, y ∈ X, a aplicação lipschitziana f : X → Rn chama-se uma contração fraca. Se |f (x) − f (y)| ≤ c|x − y| com 0 < c < 1, a aplicação f chama-se uma contração, simplesmente. 26 9 Topologia do Espaço Euclidiano Cap. 1 Homeomorfismos Um homeomorfismo do conjunto X ⊂ Rm sobre um conjunto Y ⊂ Rn é uma bijeção contı́nua f : X → Y cuja inversa f −1 : Y → X também é contı́nua. O gráfico de uma aplicação f : X → Rn , definida no conjunto X ⊂ m R é o conjunto G = {(x, f (x)); x ∈ X} ⊂ Rm × Rn . Se f é contı́nua então seu gráfico G é homeomorfo a seu domı́nio X. Com efeito, a aplicação contı́nua ϕ : X → G, dada por ϕ(x) = (x, f (x)), é um homomorfismo, cujo inverso (x, f (x)) 7→ x é a restrição a G da projeção de Rm × Rn sobre Rm . Exemplo 14. A aplicação f : [0, 2π) → S 1 , onde f (t) = (cos t, sen t), é uma bijeção contı́nua mas não é um homeomorfismo. Sua inversa f −1 : S 1 → [0, 2π) aplica o compacto S 1 sobre o intervalo [0, 2π), que não é compacto, logo é descontı́nua. Mais precisamente, f −1 é descontı́nua no ponto a = (1, 0) = f (0) ∈ S 1 . Com efeito, se pusermos, para cada k ∈ N, tk = (1 − 1/k) · 2π e zk = (cos tk , sen tk ), teremos lim zk = a mas lim f −1 (zk )= lim tk =2π, logo não vale lim f −1 (zk )=f −1 (a)=0. ⊳ Exemplo 15. A bola aberta B = B(0; 1) ⊂ Rn é homeomorfa ao espaço Rn . De fato, as aplicações f : Rn → B e g : B → Rn , definidas por x y f (x) = e g(y) = 1 + |x| 1 − |y| são contı́nuas e, como se verifica sem dificuldade, vale g(f (x)) = x, f (g(y)) = y, para quaisquer x ∈ Rn e y ∈ B, logo g = f −1 . ⊳ Exemplo 16. Sejam S n = {x ∈ Rn+1 ; hx, xi = 1} a esfera unitária n-dimensional e N = (0, . . . , 0, 1) ∈ S n seu pólo norte. A projeção estereográfica ξ : S n − {N } → Rn é um importante exemplo de homeomorfismo. Para todo x ∈ S n − {N }, ξ(x) é o ponto em que a semi-reta ⇀ N x corta o hiperplano xn+1 = 0, o qual identificamos com Rn . Os pontos ⇀ da semi-reta N x são da forma N +t(x−N ) com t > 0. Um tal ponto está no hiperplano Rn quando sua última coordenada 1 + t(xn+1 − 1) é igual a zero, ou seja, quando t = 1/(1 − xn+1 ). Logo ξ(x) = x′ /(1 − xn+1 ), onde x′ = (x1 , . . . , xn ) para x = (x1 , . . . , xn , xn+1 ). Isto mostra que ξ : S n − {N } → Rn é contı́nua. Seja agora ϕ : Rn → S n − {N } dada por ϕ(y) = x, onde x′ = 2y/(|y|2 + 1) e xn+1 = (|y|2 − 1)/(|y|2 + 1). Uma verificação simples mostra que ξ(ϕ(y)) = y para todo y ∈ Rn e Seção 10 Conjuntos conexos 27 ϕ(ξ(x)) = x para todo x ∈ S n . Portanto a aplicação contı́nua ϕ : Rn → S n − {N } é a inversa de ξ e conseqüentemente, ξ e um homeomorfismo. ⊳ Teorema 23. Se K ⊂ Rm é compacto então toda aplicação contı́nua injetiva f : K → Rn é um homeomorfismo sobre sua imagem (compacta) L = f (K). Demonstração. Chamemos de g : L → K a inversa de f . Como L ⊂ Rn é compacto, portanto fechado, pelo Teorema 19, g é contı́nua se, e somente se, para todo conjunto fechado F ⊂ Rm , a imagem inversa g −1 (F ) = g −1 (F ∩ K) é um fechado em Rn . Mas F ∩ K é compacto, logo g −1 (F ∩ K) = f (F ∩ K) é compacto (em virtude do Teorema 17) logo é fechado. O teorema acima resulta do Teorema 20, com f em vez de ϕ e f −1 no lugar de f . Ele mostra por que foi possı́vel dar o Exemplo 14: o intervalo [0, 2π) não é compacto. 10 Conjuntos conexos Uma cisão do conjunto X ⊂ Rn é uma decomposição X = A ∪ B onde A∩B = A∩B = ∅, isto é, nenhum ponto de A é aderente a B e nenhum ponto de B é aderente a A. Um exemplo óbvio é a cisão trivial X = X ∪ ∅. Já R − {0} = (−∞, 0) ∪ (0, +∞) é uma cisão não-trivial. Por outro lado, pondo A = (−∞, 0] e B = (0, +∞) a decomposição R = A ∪ B não é uma cisão pois 0 ∈ A ∩ B. Se X = A ∪ B é uma cisão então os pontos de X que são aderentes a A, não pertencendo a B, estão em A, logo A = A ∩ X. Analogamente, B = B ∩ X. Assim, A e B são ambos fechados em X. Como A = X − B e B = X − A, segue-se que A e B são também abertos em X. Reciprocamente, se A ⊂ X é aberto e fechado em X então, pondo B = X −A, a decomposição X = A∪B é uma cisão. Com efeito, nenhum ponto de X aderente a A pode pertencer a B pois A é fechado em X e, da mesma forma, nenhum ponto de X aderente a B pode pertencer a A. Em particular, se X ⊂ Rn é aberto, uma cisão X = A ∪ B é uma expressão de X como reunião de dois abertos disjuntos. E se X ⊂ Rn é fechado, toda cisão X = A ∪ B é a expressão de X como reunião de 28 Topologia do Espaço Euclidiano Cap. 1 dois conjuntos fechados disjuntos. Mais particularmente ainda, se X é compacto então A e B são compactos. Exemplo 17. Escrevendo as linhas de uma matriz, uma após a outra, 2 numa só lista, identificaremos o espaço Rn com o conjunto das matrizes quadradas n × n. Sejam Gn , G+ e G− respectivamente os conjuntos das matrizes com determinante 6= 0, das matrizes com determinante > 0 e com determinante < 0. A igualdade Gn = G+ ∪ G− é uma cisão, pois uma seqüência de matrizes com determinantes positivos não pode convergir para uma matriz de determinante negativo. Assim G+ ∩ G− = ∅. Analogamente, G+ ∩ G− = ∅. Se X = A ∪ B é uma cisão então, para todo Z ⊂ X, Z = (A ∩ Z) ∪ (B ∩ Z) é uma cisão. Um conjunto X ⊂ Rn chama-se conexo quando só admite a cisão trivial. Caso contrário, diz-se que X é desconexo. Como vimos no Exemplo 17 acima, o conjunto ds matrizes n×n com determinante 6= 0 é desconexo. Na página 51 do vol. 1 foi provado que todo intervalo da reta R (seja ele aberto ou não, limitado ou não) é conexo. Vale a recı́proca: Teorema 24. Os únicos subconjuntos conexos de R são os intervalos. Demonstração. Suponha que X ⊂ R não seja um intervalo. Então existem a < c < b tais que a, b ∈ X e c ∈ / X. Neste caso, pondo A = {x ∈ X; x < c} e B = {x ∈ X; x > c}, vemos que X = A ∪ B é uma cisão. Como a ∈ A e b ∈ B, esta cisão não é trivial. Portanto X é desconexo. Teorema 25. (a) A imagem do conjunto conexo X ⊂ Rm por uma aplicação contı́nua f : X → Rn é um conjunto conexo. S Xλ de uma famı́lia qualquer de conjuntos conexos (b) A reunião X = λ∈L Xλ ⊂ Rn que têm um ponto a em comum é um conjunto conexo. (c) O produto cartesiano X × Y ⊂ Rm+n dos conjuntos X ⊂ Rm e Y ⊂ Rn é um conjunto conexo se, e somente se, X e Y são conexos. (d) Se X ⊂ Rn é conexo e X ⊂ Y ⊂ X então Y é conexo. Em particular, o fecho de um conjunto conexo é conexo. Demonstração. (a) Se f (X) = A ∪ B é uma cisão da imagem de X então A e B são ambos abertos e fechados em f (X), além de disjuntos. Seção 10 Conjuntos conexos 29 Logo f −1 (A) e f −1 (B) são também disjuntos, abertos e fechados em X, portanto X = f −1 (A) ∪ f −1 (B) é uma cisão, a qual é trivial pois X é conexo. Mas A = f (f −1 (A)) e B = f (f −1 (B)) porque A e B estão contidos em f (X). Assim, A ou B é vazio e daı́ a cisão f (X) = A ∪ B é trivial. Então f (X) é conexo. (b) Seja a tal que a ∈ Xλ para todo λ ∈ L. Se X = A ∪ B é uma cisão então o ponto a pertence a um dos conjuntos, A ou B. Digamos que a ∈ A. Para todo λ ∈ L, Xλ = (A ∩ Xλ ) ∪ (B ∩ Xλ ) é uma cisão, a qual é trivial pois XλSé conexo. Como a ∈ A ∩ Xλ , segue-se que B ∩ Xλ é vazio. Logo B = (B ∩ Xλ ) é vazio e a cisão X = A ∪ B é trivial. λ Portanto X é conexo. (c) Se X × Y é conexo então X e Y são conexos porque são as imagens de X × Y pelas projeções p : X × Y → X, p(x, y) = x e q : X × Y → Y , q(x, y) = y, as quais são contı́nuas. Reciprocamente, se X e Y são conexos, tomamos um ponto c = (a, b) ∈ X × Y . Para cada z = (x, y) ∈ X ×Y o conjunto Cz = (X ×{b})∪({x})×Y ) é conexo pois é reunião dos conjuntos conexos X ×{b} e {x}×Y (homeomorfos respectivamente a X e Y ) com o ponto (x, b) em comum. S Além disso, também c = (a, b) ∈ Cz para todo z ∈ X × Y e X × Y = Cz logo, pelo item (b), X × Y é z conexo. (d) Seja Y = A ∪ B uma cisão. Então X = (A ∩ X) ∪ (B ∩ X) também é uma cisão. Como X é conexo, tem-se, digamos, A ∩ X = ∅. De X ⊂ Y e Y = A ∪ B resulta então que X ⊂ B, logo X ⊂ B e daı́ Y ⊂ B, pois Y ⊂ X. Assim, tem-se A = A ∩ Y ⊂ A ∩ B = ∅, ou seja, A = ∅. Portanto toda cisão Y = A ∪ B é trivial e Y é conexo. Corolário 6. Se X1 , . . . , Xk são conexos então X1 × · · · × Xk é conexo. Em particular, Rn = R × · · · × R é conexo. Com efeito, X1 × X2 × X3 = (X1 × X2 ) × X3 e assim por diante. Corolário 7. Se X ⊂ Rn é conexo então a imagem de toda função real contı́nua f : X → R é um intervalo. Com efeito, pelo Teorema 24 todo subconjunto conexo de R é um intervalo. Este corolário é conhecido como o Teorema do Valor Intermediário pois pode também ser enunciado assim: “Sejam X ⊂ Rn conexo e f : X → R contı́nua. Se a, b ∈ X são tais que f (a) < f (b) então, 30 Topologia do Espaço Euclidiano Cap. 1 para cada d com f (a) < d < f (b), existe c ∈ X tal que f (c) = d.” Corolário 8 (“Teorema da Alfândega”). Seja X ⊂ Rn um conjunto arbitrário. Se um conjunto conexo C ⊂ Rn contém um ponto a ∈ X e um ponto b ∈ / X então C contém um ponto c ∈ fr.X. Com efeito, a função contı́nua f : C → R, definida por f (x) = d(x, X) − d(x, Rn − X), é tal que f (a) ≤ 0 e f (b) ≥ 0. Logo, pelo Teorema do Valor Intermediário, deve existir c ∈ C tal que f (c) = 0, isto é, d(c, X) = d(c, Rn − X). Como c ∈ X ou c ∈ Rn − X, um desses dois números é zero, logo ambos o são e daı́ c ∈ fr.X. Como Rn é conexo, resulta do corolário acima que se o conjunto X ⊂ Rn não é vazio nem coincide com Rn então a fronteira de X não é vazia. De fato, se X 6= ∅ e X 6= Rn então o conjunto conexo Rn contém algum ponto de X e algum ponto que não pertence a X, logo contém algum ponto da fronteira de X. Exemplo 18. Para todo n ∈ N, a esfera S n é um conjunto conexo. Com efeito, retirando o pólo norte N = (0, . . . , 0, 1), vemos que X = S n −{N } é conexo por ser homeomorfo a Rn (cfr. Exemplo 16). Como S n = X, segue-se do item (d) que a esfera S n é conexa. Exemplo 19. Uma conseqüência do Teorema do Valor Intermediário é que para toda função real contı́nua f : S 1 → R existe (pelo menos) um ponto z ∈ S 1 tal que f (z) = f (−z). Para ver isto, consideremos a função contı́nua ϕ : S 1 → R, dada por ϕ(z) = f (z) − f (−z). Vale ϕ(−z) = −ϕ(z). Assim, ou ϕ(z) = 0 para todo z (assunto encerrado) ou existe a ∈ S 1 com ϕ(−a) < 0 < ϕ(a), logo ϕ(z) = 0 para algum z ∈ S 1 , pois S 1 é conexo. ⊳ Existe uma noção bem geométrica que fornece uma condição suficiente para a conexidade de um conjunto, que é a conexidade por caminhos. Um caminho num conjunto X ⊂ Rn é uma aplicação contı́nua f : I → X, definida num intervalo I. Por exemplo, dados x, y ∈ Rn , o caminho f : [0, 1] → Rn , definido por f (t) = (1 − t)x + ty, chama-se o caminho retilı́neo que liga x a y. Às vezes nos referiremos a ele como o caminho [x, y]. Diremos que os pontos a, b ∈ X podem ser ligados por um caminho em X quando existe um caminho f : I → X tal que a = f (α), b = f (β) com α < β ∈ I. Seção 10 Conjuntos conexos 31 Por exemplo, se X ⊂ Rn é convexo, dois pontos quaisquer a, b ∈ X podem ser ligados por um caminho em X, a saber, o caminho retilı́neo [a, b]. Se a, b ∈ X podem ser ligados por um caminho f : I → X, então existe um caminho ϕ : [0, 1] → X tal que ϕ(0) = a e ϕ(1) = b. Basta pôr ϕ(t) = f ((1 − t)α + tβ), onde a = f (α) e b = f (β). Se f, g : [0, 1] → X são caminhos em X, com f (1) = g(0), então definimos o caminho justaposto h = f ∨g : [0, 1] → X pondo h(t) = f (2t) se 0 ≤ t ≤ 1/2 e h(t) = g(2t − 1) se 1/2 ≤ t ≤ 1. Note que estas duas expressões definem o mesmo valor de h(1/2). Como h|[0, 1/2] e h|[1/2, 1] são contı́nuas, segue-se que h é contı́nua. Intuitivamente, o caminho h percorre a trajetória de f (com velocidade dobrada) até t = 1/2 e depois, para t ≥ 1/2, descreve (ainda com velocidade dobrada) o percurso de g. Sejam a, b, c pontos do conjunto X ⊂ Rn . Se a, b podem ser ligados por um caminho em X e b, c também podem ser ligados por um caminho em X, então existe um caminho em X ligando a a c. Basta tomar caminhos f, g : [0, 1] → X com f (0) = a, f (1) = b, g(0) = b, g(1) = c e pôr h = f ∨ g. Então h(0) = a, h(1) = c. Um conjunto X ⊂ Rn diz-se conexo por caminhos quando dois pontos quaisquer a, b ∈ X podem ser ligados por um caminho em X. Todo conjunto convexo X ⊂ Rn é conexo por caminhos. Em particular, toda bola (aberta ou fechada) no espaço euclidiano é conexa por caminhos. A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é conexa por caminhos. Com efeito, dados a, b ∈ S n , se a e b não são antı́podas, isto é, se b 6= −a, então f : [0, 1] → S n , definida por f (t) = (1 − t)a + tb |(1 − t)a + tb| é contı́nua (pois seu denominador nunca se anula), com f (0) = a, f (1) = b. Se, porém, b = −a, tomamos um ponto c ∈ S n − {a, b}, ligamos a com c e c com b pelo processo acima. O caminho justaposto ligará o ponto a ao seu antı́poda b. Todo conjunto X ⊂ Rn , conexo por caminhos, é conexo. Com efeito, fixando a ∈ X seja, para cada x ∈ X, Cx a imagem de um caminho em X ligando a até x. Pelo item (a) do Teorema 25, Cx é um conjunto conexo que contém a e x. Logo, pelo item (b) do mesmo S teorema, o conjunto X = Cx é conexo. x∈X 32 Topologia do Espaço Euclidiano Cap. 1 A recı́proca é falsa. O conjunto X0 ⊂ R2 , reunião do gráfico da função f (x) = cos(1/x), 0 < x ≤ 1, com a origem p = (0, 0), é conexo mas não é conexo por caminhos. Com efeito, X0 está compreendido entre o gráfico da função contı́nua f (o qual é conexo por ser homeomorfo a (0, 1]) e o fecho desse mesmo gráfico. Assim, pelo Teorema 25, X0 é conexo. Mas não é conexo por caminhos pois todo caminho λ : [0, 1] → X0 com λ(0) = p é constante. (Ver pag. 103 do livro “Espaços Métricos”, do autor.) Há, porém, um caso particular importante, no qual a conexidade implica em conexidade por caminhos: quando o conjunto X ⊂ Rn é aberto. Diremos que f : [0, 1] → X é um caminho poligonal em X quando f é a justaposição de um número finito de caminhos retilı́neos. Teorema 26. Um aberto A ⊂ Rn é conexo se, e somente se, é conexo por caminhos. Demonstração. Seja A ⊂ Rn aberto e conexo. Fixemos um ponto a ∈ A e consideremos o conjunto U , formado pelos pontos x ∈ A que podem ser ligados ao ponto a por um caminho poligonal contido em A. Afirmamos que U é aberto. Com efeito, seja x ∈ U . Sendo A aberto, existe B = B(x; r), com x ∈ B ⊂ A. Como a bola B é convexa, todo ponto y ∈ B pode ser ligado a x por um segmento de reta contido em B, logo y se liga a a por um caminho poligonal contido em A. Portanto B ⊂ U e U ⊂ A é aberto. Também V = A − U é aberto, pois se v ∈ V então v não pode ser ligado a a por um caminho poligonal contido em A. Tomando uma bola aberta B1 , com v ∈ B1 ⊂ A, todo z ∈ B1 se liga a v por um segmento de reta contido em B1 . Se z pudesse ser ligado a a por um caminho poligonal contido em A, justapondo-se [v, z] a esse caminho, verı́amos que v ∈ U , um absurdo. Temos então A = U ∪ V , uma cisão. Como A é conexo e a ∈ U , temos V = ∅, donde A = U , o que prova o teorema. Corolário 9 (da demonstração). Se A ⊂ Rn é aberto e conexo, dois pontos quaisquer de A podem ser ligados por um caminho poligonal contido em A. Mostraremos a seguir que todo conjunto X ⊂ Rn se exprime como reunião disjunta de subconjuntos conexos máximos, chamados componentes conexas de X. Seção 11 Limites 33 Sejam x ∈ X ⊂ Rn . A componente conexa do ponto x no conjunto X é a reunião Cx de todos os subconjuntos conexos de X que contêm o ponto x. Por exemplo, se X = Q ⊂ R então a componente conexa de qualquer ponto x ∈ X é {x}. Por outro lado, se X ⊂ Rn é conexo então, para todo x ∈ X temos Cx = X. Se X = R − {0} então a componente conexa de 1 em X é (0, +∞) enquanto que a componente conexa de −1 é (−∞, 0). Dados x ∈ X ⊂ Rn , a componente conexa Cx é um conjunto conexo, pelo Teorema 25(b). Na realidade, Cx é o maior subconjunto conexo de X contendo o ponto x. Com efeito, se C ⊂ X é conexo e contém x, então C é um dos conjuntos cuja reunião é Cx , logo C ⊂ Cx . Mais ainda, se C ⊂ X é conexo e tem algum ponto em comum com Cx então C ⊂ Cx , pois C ∪ Cx é conexo contendo x logo C ∪ Cx ⊂ Cx e daı́ C ⊂ Cx . Em particular, nenhum subconjunto conexo de X pode conter Cx propriamente. Sejam x, y dois pontos de X. Suas componentes conexas Cx e Cy ou coincidem ou são disjuntas pois se z ∈ Cx ∩Cy então Cx ⊂ Cy e Cy ⊂ Cx . Assim a relação “x e y pertencem à mesma componente conexa em X ”é uma equivalência no conjunto X. As classes de equivalência são as componentes conexas dos pontos de X. Toda componente conexa Cx é um conjunto fechado em X. Com efeito, sendo Cx ⊂ C x ∩ X ⊂ C x , o Teorema 25(d) nos assegura que C x ∩X é um subconjunto conexo de X, contendo Cx . Logo C x ∩X = Cx , o que mostra que Cx é fechado em X. 11 Limites Sejam f : X → Rn definida no conjunto X ⊂ Rm e a ∈ Rm um ponto de acumulação de X. Diz-se que b ∈ Rn é o limite de f (x) quando x tende para a e escreve-se lim f (x) = b quando a seguinte condição é válida: x→a “para todo ε > 0 dado, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam |f (x) − b| < ε”. O ponto a pode pertencer ou não a X. Em muitos dos exemplos mais importantes de limite, na verdade, tem-se a ∈ / X. Mas, mesmo que a pertença a X, o valor f (a) não desempenha papel algum na definição de limite. 34 Rn Topologia do Espaço Euclidiano Cap. 1 Quando o ponto de acumulação a pertence a X, a aplicação f : X → é contı́nua no ponto a se, e somente se, lim f (x) = f (a). x→a A propriedade seguinte decorre imediatamente da definição mas é útil o bastante para ser destacada como um teorema. Teorema 27 (Permanência do sinal). Sejam a um ponto de acumulação de X ⊂ Rn e f : X → R uma função real. Se b = lim f (x) é x→a um número positivo então existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam f (x) > 0. Demonstração. Como b é positivo, tomamos ε = b. Pela definição de limite, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam b − ε < f (x) < b + ε, isto é, 0 < f (x) < 2b, logo f (x) > 0. Quando X é um intervalo da reta, tem sentido a noção de limite lateral de uma aplicação f : I → Rn , ou seja, de um caminho, num ponto a ∈ I. Por exemplo, se a não é o extremo superior de I, diz-se que b ∈ Rn é o limite à direita de f (t) quando t tende para a, e escreve-se lim f (t) = b, para significar que: t→a+ Para todo ε > 0 dado, existe δ > 0 tal que a < t < a + δ implica t ∈ I e |f (t) − b| < ε. Analogamente se define o limite à esquerda lim f (t). t→a− Assim como a continuidade de uma aplicação, a existência e o valor do limite se exprimem em termos das funções-coordenada, como veremos agora. Teorema 28. Sejam a um ponto de acumulação do conjunto X, f : X → Rn uma aplicação e f1 , f2 . . . , fn : X → R as funções-coordenada de f . Então lim f (x) = b = (b1 , b2 , . . . , bn ) se, e somente se, x→a lim fi (x) = bi para cada i = 1, . . . , n. x→a Demonstração. Se lim f (x) = b então, para cada i = 1, . . . , n, temx→a se lim fi (x) = bi porque |fi (x) − bi | ≤ |f (x) − b|. Reciprocamente, x→a se lim fi (x) = bi para cada i = 1, . . . , n então lim f (x) = b porque x→a x→a n P |fi (x) − bi |. |f (x) − b| ≤ i=1 Seção 11 Limites 35 A proposição seguinte relaciona o limite de aplicações com o limite de seqüências. Teorema 29. Seja a um ponto de acumulação do conjunto X ⊂ Rm . A fim de que se tenha lim f (x) = b é necessário e suficix→a ente que, para toda seqüência de pontos xk ∈ X − {a} com lim xk = a, seja lim f (xk ) = b. A demonstração é idêntica à feita no vol. 1 (pág. 63). Teorema 30. Sejam: a um ponto de acumulação de X ⊂ Rm , b ∈ Y , f : X → Y uma aplicação tal que lim f (x) = b e g : Y → Rp contı́nua x→a no ponto b. Então lim g(f (x)) = g(b). x→a Isto é mais fácil de provar do que enunciar. Basta imitar a demonstração de que a composta de duas aplicações contı́nuas é contı́nua (Teorema 14). Teorema 31. Sejam f, g : X → Rn e α : X → R definidas no conjunto X ⊂ Rm e a um ponto de acumulação de X. Se existem lim f (x) = b, x→a lim g(x) = c e lim α(x) = α0 , então existem os limites e valem as x→a x→a igualdades abaixo: lim α(x) · f (x) = α0 · b lim [f (x) + g(x)] = b + c, x→a x→a lim hf (x), g(x)i = hb, ci, x→a lim |f (x)| = |b|. x→a Demonstração. A aplicação s : Rn × Rn → Rn , definida por s(x, y) = x + y, é contı́nua. Observando que f (x) + g(x) = s(f (x), g(x)), resulta do Teorema 30 que lim [f (x) + g(x)] = lim f (x) + lim g(x) = b + c. x→a x→a x→a Analogamente para as outras três igualdades. Além disso, é útil saber que se lim α(x) = 0 e f : X → Rn é limitada x→a na vizinhança de a (isto é, existem δ > 0 e M > 0 tais que x ∈ X e |x − a| < δ implicam |f (x)| ≤ M ) então lim α(x)f (x) = 0, mesmo que x→a não exista lim f (x). (Muito fácil.) x→a Exemplo 20. Seja g : R2 − {0} → R definida por g(x, y) = x2 y/(x2 + y 2 ). Então podemos escrever g(x, y) = α(x, y) · f (x, y) onde α(x, y) = x e xy x y f (x, y) = 2 =p ·p = cos θ sen θ, 2 2 2 x + y2 x +y x + y2 36 Topologia do Espaço Euclidiano Cap. 1 sendo θ o ângulo de eixo OX com o segmento Oz, z = (x, y). Assim, temos lim α(x, y) = 0 e |f (x, y)| ≤ 1, logo lim g(x, y) = 0. ⊳ (x,y)→(0,0) (x,y)→(0,0) Agora que já vimos ser lim (f (x) − g(x)) = lim f (x) − lim g(x), x→a x→a x→a podemos demonstrar a seguinte conseqüência do Teorema 27: Teorema 32 (Permanência da desigualdade). Sejam f, g : X → R definidas no conjunto X ⊂ Rm e a um ponto de acumulação de X. Se f (x) ≤ g(x) para todo x ∈ X e existem lim f (x) e lim g(x) então tem-se lim f (x) ≤ lim g(x). x→a x→a x→a x→a Demonstração. Se fosse o contrário, lim f (x) > lim g(x), terı́amos x→a x→a lim (f (x) − g(x)) > 0 e então, pelo Teorema 27, valeria f (x) > g(x) para x→a todo x ∈ X suficientemente próximo de a, uma contradição. 12 Exercı́cios Seção 1: O espaço euclidiano n-dimensional 1. Se |u + v| = |u| + |v| com u 6= 0 (norma euclidiana), prove que existe α ≥ 0 tal que v = α · u. 2. Sejam x, y, z ∈ Rn tais que (na norma euclidiana) |x − z| = |x − y| + |y − z|. Prove que existe t ∈ [0, 1] tal que y = (1 − t)x + tz. Mostre que isto seria falso nas normas do máximo e da soma. 3. Sejam x, y ∈ Rn não-nulos. Se todo z ∈ Rn que é ortogonal a x for também ortogonal a y, prove que x e y são múltiplos um do outro. 1 4. Se |x| = |y|, prove que z = (x + y) é ortogonal a y − x. (A mediana de um 2 triângulo isósceles é também altura.) Seção 2: Bolas e conjuntos limitados 1. Dados a 6= b em Rn determine c, pertencente à reta ab, tal que c ⊥ (b − a). Conclua que para todo x ∈ ab, com x 6= c, tem-se |c| < |x|. Interprete geometricamente. 2. Sejam |x| = |y| = r, com x 6= y (norma euclidiana). Se 0 < t < 1, prove que |(1 − t)x + ty| < r. Conclua que a esfera S(0; r) não contém segmentos de reta. 3. Dados o conjunto convexo X ⊂ Rn e o número real r > 0, seja B(X; r) = S B(x; r). Prove que B(X; r) é convexo. x∈X 4. Prove que o conjunto X = {(x, y) ∈ R2 ; x2 ≤ y} é convexo. 5. Seja T : Rm → Rn uma transformação linear. Prove que se T 6= 0 então T não é uma aplicação limitada. Se X ⊂ Rm é um conjunto limitado, prove que a restrição TX : X → Rn de T ao conjunto X é uma aplicação limitada. Seção 12 Seção 3: Exercı́cios 37 Conjuntos abertos 1. Para todo conjunto X ⊂ Rm , prove que int.X é um conjunto aberto, isto é, int.int. X = int.X. 2. Prove que int.X é o maior conjunto aberto contido em X, ou seja, se A é aberto e A ⊂ X então A ⊂ int.X. 3. Dê exemplo de um conjunto X ⊂ Rn cuja fronteira tem interior não-vazio e prove que isto não seria possı́vel se X fosse aberto. 4. Seja πi : Rn → R a projeção sobre a i-ésima coordenada, isto é, se x = (x1 , . . . , xn ) então πi (x) = xi . Prove que se A ⊂ Rn é aberto então sua projeção πi (A) ⊂ R também é um conjunto aberto. 5. Prove que toda coleção de abertos dois a dois disjuntos e não-vazios em Rn é enumerável. Seção 4: Seqüências em Rn 1. Dada a seqüência (xk )k∈N em Rn , sejam N′ e N′′ subconjuntos infinitos de N tais que N = N′ ∪ N′′ . Se as subseqüências (xk )k∈N′ e (xk )k∈N′′ convergem para o mesmo limite a, prove que lim xk = a. k∈N 2. Dada a seqüência (xk )k∈N em Rn , prove que as seguintes afirmações são equivalentes: (a) lim |xk | = +∞ k→∞ (b) (xk )k∈N não possui subseqüências convergentes (c) Para cada conjunto limitado X ⊂ Rn , o conjunto NX = {k ∈ N; xk ∈ X} é finito. 3. Sejam A ⊂ Rn aberto e a ∈ A. Prove que se lim xk = a então existe k0 ∈ N tal que k > k0 ⇒ xk ∈ A. k→∞ 4. Se a ∈ fr.X, prove que existem seqüências de pontos xk ∈ X e yk ∈ Rn − X tais que lim xk = lim yk = a. Vale a recı́proca? Seção 5: Conjuntos fechados 1. Para quaisquer X, Y ⊂ Rn , prove que X ∪ Y = X ∪ Y e X ∩ Y ⊂ X ∩ Y . Dê um exemplo onde não vale X ∩ Y = X ∩ Y . 2. Diz-se que o ponto a ∈ Rn é valor de aderência da seqüência (xk )k∈N quando a é limite de alguma subseqüência de (xk ). Prove que o conjunto dos valores de aderência de qualquer seqüência é fechado. 3. Prove que um conjunto A ⊂ Rn é aberto se, e somente se, A ∩ X ⊂ A ∩ X para todo X ⊂ Rn . 4. Se X ⊂ Rm e Y ⊂ Rn , prove que se tem X × Y = X × Y em Rm+n . 5. Prove que X ⊂ Rn é fechado se, e somente se X ⊃ f r.X. Por outro lado, A ⊂ Rn é aberto se, e somente se, A ∩ f r.A = ∅. 38 Topologia do Espaço Euclidiano Cap. 1 6. Sejam A, B ⊂ Rn conjuntos limitados disjuntos e não-vazios. Se d(A, B) = 0, prove que existe x ∈ f r.A ∩ f r.B. 7. Prove que o fecho de um conjunto convexo é convexo. 8. Prove que se C ⊂ Rn é convexo e fechado então, para todo x ∈ Rn , existe um único x̄ = f (x) ∈ C tal que d(x, C) = |x − x̄|. Seção 6: Conjuntos compactos 1. Seja K ⊂ Rn compacto, não-vazio. Prove que existem x, y ∈ K tais que |x − y| = diam.K. 2. Se toda cobertura aberta de um conjunto X ⊂ Rn admite uma subcobertura finita, prove que X é compacto. 3. Seja (xk ) uma seqüência limitada em Rn que possui um único valor de aderência. Prove que (xk ) é convergente. Dê exemplo de uma sequência (nãolimitada) não-convergente que tem um único valor de aderência. 4. Se K ⊂ U ⊂ Rn , com K compacto e U aberto, prove que existe ε > 0 tal que x ∈ K, y ∈ Rn , |x − y| < ε ⇒ [x, y] ⊂ U . 5. Seja X ⊂ Rn tal que, para todo compacto K ⊂ Rn , a interseção X ∩ K é compacta. Prove que X é fechado. Seção 7: Aplicações contı́nuas 1. Seja f : Rm → Rn contı́nua. Prove que as seguintes condições são equivalentes: (a) Para todo compacto K ⊂ Rn , a imagem inversa f −1 (K) ⊂ Rm é compacta. (b) Se (xk ) é uma seqüência em Rm sem subseqüências convergentes, o mesmo se dá com a seqüência (f (xk )) em Rn . (Ou seja, lim xk = ∞ ⇒ lim f (xk ) = ∞.) 2. Prove que um polinômio complexo não-constante p(z) = a0 + a1 z + · · · + an z n , considerado como uma aplicação p : R2 → R2 , cumpre uma das (portanto ambas) condições do exercı́cio anterior. 3. Sejam X ⊂ Rm , K ⊂ Rn compacto e f : X × K → Rp contı́nua. Suponha que, para cada x ∈ X, exista um único y ∈ K tal que f (x, y) = 0. Prove que y depende continuamente de x. 4. Seja K ⊂ Rn compacto. Prove que a projeção π : Rm ×Rn → Rm , π(x, y) = x, transforma todo subconjunto fechado F ⊂ Rm × K num conjunto fechado π(F ) ⊂ Rm . Dê exemplo de F ⊂ Rm × Rn fechado tal que π(F ) ⊂ Rm não seja fechado. Seção 8: Continuidade uniforme 1. Sejam F, G ⊂ Rn fechados disjuntos não-vazios. A função contı́nua f : Rn → d(x, F ) [0, 1], definida por f (x) = cumpre f (x) = 0 para todo x ∈ F d(x, F ) + d(x, G) e f (x) = 1 para todo x ∈ G. Ela se chama a função de Urysohn do par (F, G). Prove que se ela é uniformemente contı́nua, então d(F, G) > 0. Seção 12 Exercı́cios 39 2. Seja Y ⊂ X ⊂ Rm com Y denso em X. Se a aplicação contı́nua f : X → Rn é tal que sua restrição f |Y é uniformemente contı́nua, prove que f é uniformemente contı́nua. 3. Seja X ⊂ Rm um conjunto limitado. Se f : X → Rn é uniformemente contı́nua, prove que f (X) ⊂ Rn também é limitado. 4. Sejam f, g : X → R uniformemente contı́nuas no conjunto X ⊂ Rm . Prove que a soma f + g : X → R é uniformemente contı́nua e o mesmo se dá com o produto f · g : X → R caso f e g sejam limitadas. 5. Seja C ⊂ Rn convexo. Se x ∈ Rn e x̄ ∈ C são tais que |x − x̄| = d(x, C), prove que hx − x̄, y − x̄i ≤ 0 para todo y ∈ C. 6. Dado C ⊂ Rn convexo e fechado, seja f : Rn → C definida por f (x) = x̄, onde x̄ é o único ponto de C tal que |x− x̄| = d(x, C). Prove que |f (x)−f (y)| ≤ |x−y| para quaisquer x, y ∈ Rn , logo f é uniformemente contı́nua. Seção 9: Homeomorfismos 1. Chama-se semi-reta de origem 0 em Rn a um conjunto do tipo σ = {tv; t ≥ 0, 0 6= v ∈ Rn }. Seja X ⊂ Rn − {0} um conjunto compacto que tem um (único) ponto em comum com cada semi-reta com origem 0. Prove que X é homeomorfo à esfera S n−1 . 2. Estabeleça um homeomorfismo entre Rn − {0} e o produto cartesiano S n−1 × R ⊂ Rn+1 . 3. Mostre que existe um homeomorfismo do produto cartesiano S m × S n sobre um subconjunto de Rm+n+1 . 4. Dê exemplo de conjuntos X, Y ⊂ Rn e pontos a ∈ X, b ∈ Y tais que X − {a} e Y − {b} são homeomorfos mas X não é homeomorfo a Y . 5. Sejam X ⊂ Rm , Y ⊂ Rn compactos, a ∈ X e b ∈ Y . Se X − {a} é homeomorfo a Y − {b}, prove que X e Y são homeomorfos. Seção 10: Conjuntos conexos 1. Prove que um conjunto X ⊂ Rn é conexo se, e somente se, para cada par de pontos a, b ∈ X existe um conjunto conexo Cab ⊂ X tal que a ∈ Cab e b ∈ Cab . 2. Seja Z ⊂ Rn (n ≥ 2) um conjunto enumerável. Dados arbitrariamente os pontos a, b ∈ Rn − Z, prove que existe c ∈ Rn tal que os segmentos de reta [a, c] e [c, b] estão ambos contidos em Rn − Z. Conclua que o complementar de um conjunto enumerável em Rn é conexo. 3. Prove que S 1 e S 2 não são homeomorfos. 4. Prove que S 1 não é homeomorfo a um subconjunto de R. 5. Quantas componentes conexas tem o conjunto X = {(x, y) ∈ R2 ; (x · y)2 = x · y}? Especifique-as. Seção 11: Limites 1. Se f : X → Rn é uniformemente contı́nua no conjunto X ⊂ Rm , prove que, para todo a, ponto de acumulação de X, existe lim f (x). x→a 40 Topologia do Espaço Euclidiano Cap. 1 2. Seja Y ⊂ X ⊂ Rm , com Y denso em X. Para toda aplicação uniformemente contı́nua f : Y → Rn , prove que existe uma única aplicação F : X → Rn , uniformemente contı́nua, tal que F (y) = f (y) para todo y ∈ Y . 3. Dada f : Rm → Rn , diz-se que se tem lim f (x) = ∞ quando para todo B > 0 x→∞ existe A > 0 tal que |x| > A ⇒ |f (x)| > B. Se p : R2 → R2 é um polinômio complexo não-constante, prove que lim p(z) = ∞. z→∞ n 4. Seja X = {x = (x1 , . . . , xn ) ∈ R ; x1 · x2 · · · xn 6= 0}. Defina f : X → R pondo sen(x1 · x2 · · · xn ) f (x) = · Prove que lim f (x) = 1. x→0 x1 · x2 · · · xn 5. Sejam a um ponto de acumulação do domı́nio da função f : X → R, com X ⊂ Rm , e v ∈ Rn um vetor não-nulo. Se lim f (x) · v = v0 então existe x→a lim f (x) = α e v0 = α · v. x→a 2 Caminhos em Rn 1 Caminhos diferenciáveis Seja f : I → Rn um caminho, isto é, uma aplicação contı́nua cujo domı́nio é um intervalo da reta. Para todo t ∈ I, tem-se f (t) = (f1 (t), . . . , fn (t)), onde f1 , . . . , fn : I → R, as funções-coordenada de f , são contı́nuas. Diz-se que o caminho f : I → Rn é diferenciável no ponto t0 ∈ I quando existe o limite f (t0 + h) − f (t0 ) , h→0 h f ′ (t0 ) = lim chamado a derivada , ou o vetor-velocidade de f no ponto t0 . Para todo h 6= 0, as coordenadas do vetor [f (t0 + h) − f (t0 )]/h são os números [fi (t0 + h) − fi (t0 )]/h (i = 1, . . . , n). Pelo Teorema 28 do Capı́tulo 1, o caminho f é diferenciável no ponto t0 se, e somente se, suas funções-coordenada o são. No caso afirmativo, tem-se df (t0 ) f ′ (t0 ) = (f1′ (t0 ), . . . , fn′ (t0 )). Às vezes se usa também a notação dt em vez de f ′ (t0 ). Quando o caminho f : I → Rn é diferenciável em todos os pontos de I, diz-se que ele é diferenciável em I. Neste caso, a correspondência t 7→ f ′ (t) define uma aplicação f ′ : I → Rn . Quando f ′ é contı́nua, o caminho f chama-se de classe C 1 . Mais geralmente, para todo inteiro k > 1, diz-se que f : I → Rn é um caminho de classe C k quando ele é diferenciável e f ′ é de classe C k−1 . Para que f seja de classe C k é 42 Caminhos em Rn Cap. 2 f ′ (t0 ) f (t) f (t0 ) Figura 2.1 necessário e suficiente que cada uma de suas funções-coordenada o seja. Escreve-se então f ∈ C k . No caso em que f ′ (t0 ) 6= 0, a definição acima significa que a reta que passa pelo ponto f (t0 ) e tem a direção dada pelo vetor f ′ (t0 ), isto é, o conjunto {f (t0 ) + α · f ′ (t0 ); α ∈ R}, é o limite quando h → 0 da secante que passa pelos pontos f (t0 ) e f (t0 + h). Logo é natural chamá-la de reta tangente ao caminho f no ponto t0 . Quando f ′ (t0 ) = 0 pode não haver reta alguma que se possa chamar de tangente no ponto f (t0 ). Exemplo 1. Dados a 6= b em Rn , seja f : R → Rn o caminho retilı́neo que passa pelos pontos a e b: f (t) = (1 − t)a + t · b. Para todo t ∈ R, f é diferenciável no ponto t, com f ′ (t) = b − a, como se vê diretamente a partir da definição. Se t0 não é o extremo superior do intervalo I, tem sentido considerar a derivada à direita do caminho f : I → Rn no ponto t0 , a qual é definida por f (t0 + h) − f (t0 ) f+′ (t0 ) = lim , h h→0+ e, de modo análogo, a derivada à esquerda f−′ (t0 ), caso t0 não seja o extremo inferior de I. Quando t0 é um ponto interior de I então f é diferenciável no ponto t0 se, e somente se, existem e são iguais as ⊳ derivadas laterais f+′ (t0 ) e f−′ (t0 ). Exemplo 2. Seja f : R → R2 o caminho definido por f (t) = (t, |t|). Para t > 0 tem-se f (t) = (t, t) e, para t < 0, f (t) = (t, −t). Logo, para todo t 6= 0 existe f ′ (t), sendo f ′ (t) = (1, 1) se t > 0 e f ′ (t) = (1, −1) se t < 0. No ponto t = 0 existem as derivadas laterais f+′ (0) = (1, 1) e f−′ (0) = (1, −1), que são diferentes, logo f não é diferenciável no ponto t = 0. Por outro lado, o caminho g : R → R2 , definido por Seção 2 Cálculo diferencial de caminhos 43 z x y H Figura 2.2 g(t) = (t|t|, t2 ), tem a mesma imagem que f porém é derivável em todos os pontos, inclusive para t = 0, valendo g ′ (0) = (0, 0). Com efeito, se t ≤ 0 então g(t) = (−t2 , t2 ) e se t ≥ 0 vale g(t) = (t2 , t2 ). Portanto g ′ (t) = (−2t, 2t) quando t < 0 e g ′ (t) = (2t, 2t) se t > 0. No ponto t = 0, ′ (0) = g ′ (0) = (0, 0). temos g+ − Exemplo 3. Sejam f : R → R2 e g : R → R3 os caminhos definidos por f (t) = (cos t, sen t) e g(t) = (cos t, sen t, t). A imagem de f é a circunferência unitária S 1 e a imagem de g é a hélice H, cuja projeção sobre o plano z = 0 é S 1 . Ambos, f e g, são de classe C k para todo k ∈ N, por isso se dizem de classe C ∞ . Para todo t ∈ R tem-se f ′ (t) = (− sen t, cos t) e g ′ (t) = (− sen t, cos t, 1). 2 Cálculo diferencial de caminhos Sejam f, g : I → Rn caminhos e α : I → R uma função real. Se f , g e α são diferenciáveis no ponto t0 ∈ I então são também diferenciáveis nesse p ponto os caminhos f + g, αf e as funções hf, gi e |f | = hf, f i, esta última sob a condição de ser f (t0 ) 6= 0. Valem então as regras abaixo: 1. (f + g)′ (t0 ) = f ′ (t0 ) + g ′ (t0 ), 2. (αf )′ (t0 ) = α′ (t0 ) · f (t0 ) + α(t0 ) · f ′ (t0 ), 3. hf, gi′ (t0 ) = hf ′ (t0 ), g(t0 )i + hf (t0 ), g ′ (t0 )i, 4. |f |′ (t0 ) = hf (t0 ),f ′ (t0 )i |f (t0 )| , as quais se provam simplesmente calculando em termos das coordenadas de f e g. 44 Caminhos em Rn Cap. 2 Vimos no Exemplo 3 que, em cada ponto, o vetor-velocidade f ′ (t) = (− sen t, cos t) é perpendicular a f (t) = (cos t, sen t). A última das regras de derivação acima, segundo a qual |f |′ = hf, f ′ i/|f |, mostra que, mais geralmente, se f : I → Rn é um caminho diferenciável com |f | constante (isto é, f (t) pertence a uma esfera de centro 0) então o vetorvelocidade f ′ (t) é perpendicular a f (t), para todo t ∈ I. Reciprocamente, se hf (t), f ′ (t)i = 0 para todo t ∈ I então |f |′ = 0, logo a função real |f | : I → R é constante. Vale também para caminhos diferenciáveis f : I → Rn o fato de que derivada identicamente nula implica f constante. Isto pode ser visto diretamente ou a partir do Teorema do Valor Médio, o qual assume, para caminhos, a forma de uma desigualdade. O Teorema do Valor Médio para uma função diferenciável f : [a, b] → R diz que existe c, com a < c < b, tal que f (b) − f (a) = f ′ (c)(b − a). Tal igualdade não vale sempre para caminhos f : I → Rn . Por exemplo, se considerarmos f : [0, 2π] → R2 , dado por f (t) = (cos t, sen t), temos f (2π) − f (0) = 0 mas, como |f ′ (t)| = 1 para todo t ∈ [0, 2π] não pode existir c ∈ [0, 2π] tal que f (2π) − f (0) = f ′ (c) · (2π − 0). Tem-se entretanto o seguinte importante resultado: Teorema 1 (Desigualdade do Valor Médio). Seja f : [a, b] → Rn um caminho, diferenciável no intervalo aberto (a, b), com |f ′ (t)| ≤ M para todo t ∈ (a, b). Então |f (b) − f (a)| ≤ M · (b − a). Demonstração. Definamos ϕ : [a, b] → R pondo ϕ(t) = hf (t), f (b) − f (a)i. Então, pelo Teorema do Valor Médio (Vol. 1, pág. 96), existe c ∈ (a, b) tal que ϕ(b) − ϕ(a) = ϕ′ (c) · (b − a), pois ϕ é contı́nua, derivável em (a, b), com ϕ′ (t) = hf ′ (t), f (b) − f (a)i. Mas ϕ(b) − ϕ(a) = |f (b) − f (a)|2 . Logo, usando a desigualdade de Schwarz, temos: |f (b) − f (a)|2 = hf ′ (c), f (b) − f (a)i · (b − a) ≤ |f ′ (c)| |f (b) − f (a)| · (b − a) ≤ M · |f (b) − f (a)| · (b − a). Cancelando o fator |f (b) − f (a)|, vem |f (b) − f (a)| ≤ M · (b − a). Corolário 1. Se o caminho f : [a, b] → Rn tem derivada nula em todos os pontos de (a, b) então é constante. Seção 3 A integral de um caminho 45 Teorema 2 (Regra da Cadeia). Sejam ϕ : I → J diferenciável no ponto a ∈ I e f : J → Rn um caminho diferenciável no ponto b = ϕ(a). Então o caminho f ◦ ϕ : I → Rn é diferenciável no ponto a, com (f ◦ ϕ)′ (a) = ϕ′ (a) · f ′ (b). Demonstração. Aplicar a Regra da Cadeia às funções-coordenada fi ◦ϕ do caminho f ◦ ϕ. Exemplo 4. Sejam f : R → R2 e ϕ : R → R, com f (t) = (cos t, sen t) e ϕ(t) = t2 . Então o caminho f ◦ ϕ : R → R2 , dado por (f ◦ ϕ)(t) = (cos t2 , sen t2 ), tem vetor-velocidade (f ◦ ϕ)′ (t) = (−2t sen t2 , 2t cos t2 ) = 2t · (− sen t2 , cos t2 ), múltiplo escalar do vetor-velocidade de f no ponto ϕ(t). De um modo geral, a Regra da Cadeia diz que o caminho t 7→ f (ϕ(t)), cuja imagem está contida na imagem de f , tem, para cada t ∈ I, vetorvelocidade igual a um múltiplo escalar do vetor-velocidade de f em ϕ(t). 3 A integral de um caminho Lembramos que uma partição do intervalo [a, b] é um conjunto finito P = {t0 < t1 < · · · < tk } com t0 = a e tk = b. A norma de P é o número |P | = max{ti − ti−1 ; i = 1, . . . , k}. Diz-se que outra partição Q refina P quando P ⊂ Q. Uma partição pontilhada de [a, b] é um par P ∗ = (P, ξ) onde ξ = {ξ1 , . . . , ξk } com ti−1 ≤ ξi < ti , 1 ≤ i ≤ k. Dados o caminho f : [a, b] → Rn e uma partição pontilhada P ∗ = (P, ξ) de [a, b], a soma de Riemann de f associada a P ∗ é definida como X (f ; P ∗ ) = k X i=1 f (ξi )(ti − ti−1 ). P Diz-se que o vetor v ∈ Rn é o limite da soma de Riemann P (f ; P ∗ ) (f ; P ∗ ), quando a norma de P tende a zero, e escreve-se v = lim |P |→0 para significar que, P dado arbitrariamente ε > 0, existe δ > 0 tal que |P | < δ ⇒ |v − (f ; P ∗ )| < ε, seja qual for a maneira de pontilhar P . Vimos no Volume 1 (págs. 127 e 137) que se f : [a, b] → R é contı́nua Rb P (f ; P ∗ ) = a f (t) dt. Daı́ resulta que, se f : [a, b] → então existe lim |P |→0 Rn é um caminho, existe o limite Z b Z b X ∗ fn (t) dt . f1 (t)dt, . . . , lim (f ; P ) = |P |→0 a a 46 Caminhos em Rn Cap. 2 Pomos, por definição, Z b Z b Z b X ∗ f (t) dt = lim fn (t) dt . (f ; P ) = f1 (t) dt, . . . , |P |→0 a a a Segue-se da propriedade correspondente para funções reais que Z b Z b Z b [αf (t) + βg(t)] dt = α f (t) dt + β g(t) dt, a a a se α, β ∈ R. Além disso, tem-se a importante desigualdade Z b Z b |f (t)| dt, f (t) dt ≤ a a a qual decorre do fato de que, para toda partição pontilhada P ∗ , tem-se X X (f ; P ∗ ) ≤ (|f |; P ∗ ) pois a norma de uma soma é menor do que ou igual à soma das normas das parcelas. Em particular, se |f (t)| ≤ M para todo t ∈ [a, b] então Z b f (t) dt ≤ M · (b − a). a Exemplo 5. Se f : [0, 2π] → R2 e gR: [0, 1] → R2 são dadosR por f (t) = 2π 1 (cos t, sen t) e g(t) = (t, t2 ) então 0 f (t) dt = (0, 0) e 0 g(t) dt = (1/2, 1/3). ⊳ Aplicando o Teorema Fundamental do Cálculo a cada uma das coordenadas do caminho f : [a, b] → Rn , de classe C 1 , obtemos o seguinte Teorema 3 (Teorema Fundamental do Cálculo para Caminhos). Se f : [a, b] → Rn é um caminho de classe C 1 então Z b f ′ (t) dt = f (b) − f (a). a Daı́ resulta outra prova da Desigualdade do Valor Médio (no caso particular de f ∈ C 1 ), pois se |f ′ (t)| ≤ M para todo t ∈ [a, b] então Z b f ′ (t) dt ≤ M · (b − a). |f (b) − f (a)| = a Seção 3 A integral de um caminho 47 Exprimindo novamente a integral de um caminho em termos das integrais de suas funções-coordenada, resulta o Teorema de Mudança de Variável seguinte Se ϕ : [c, d]→[a, b] é de classe C 1 e f : [a, b]→Rn é um caminho então Z ϕ(d) f (t) dt = Z d f (ϕ(t))ϕ′ (t) dt. c ϕ(c) Uma simples aplicação desta fórmula nos permite enunciar o Teorema Fundamental do Cálculo assim: se f R: [a, a+h] → Rn é um caminho 1 de classe C 1 então f (a + h) − f (a) = h · 0 f ′ (a + th) dt. Basta considerar ϕ : [0, 1]→[a, a+h] onde ϕ(t)=a+th e notar que ϕ′ (t)=h. Um caminho f : I → Rn diz-se uniformemente diferenciável quando, para todo t ∈ I existe um vetor f ′ (t) ∈ Rn com a seguinte propriedade: Dado qualquer ε > 0, pode-se obter δ > 0 tal que 0 < |h| < δ e t + h ∈ I implicam |f (t + h) − f (t) − f ′ (t) · h| < ε|h| para qualquer t ∈ I. A diferença entre a diferenciabilidade uniforme e a diferenciabilidade pura e simples situa-se no fato de que o número δ > 0 depende apenas do ε > 0 dado, mas não do ponto t ∈ I onde se toma a derivada f ′ (t). Teorema 4 (Diferenciabilidade Uniforme). Todo caminho f: [a, b] → Rn , de classe C 1 no intervalo compacto [a, b], é uniformemente diferenciável. Demonstração. Pela continuidade uniforme da derivada f ′ : [a, b] → Rn , dado ε > 0 existe δ > 0 tal que |h| < δ e t + h ∈ [a, b] implicam |f ′ (t + h) − f ′ (t)| < ε seja qual for t ∈ [a, b]. Observando que, para R t+h t ∈ [a, b] fixo vale t f ′ (t) ds = f ′ (t) · h, o Teorema Fundamental do Cálculo nos diz que 0 < |h| < δ e t + h ∈ [a, b] implicam ′ |f (t + h) − f (t) − f (t) · h| = Z t+h t [f ′ (s) − f ′ (t)] ds ≤ ε · |h| para qualquer t ∈ [a, b], o que demonstra o teorema. Observação. Vale a recı́proca: todo caminho f : [a, b] → Rn uniformemente diferenciável é de classe C 1 . (Vide “Curso de Análise”, vol. 1, pág. 218 e vol. 2, pág. 88.) 48 4 Caminhos em Rn Cap. 2 Caminhos retificáveis O comprimento de um caminho f : [a, b] → Rn , que definiremos a seguir, é a medida da trajetória percorrida pelo ponto f (t) quando t varia de a até b. Não é o comprimento da curva imagem de f , pois o ponto f (t) pode percorrer essa mesma curva de vários modos diferentes, dando origem a caminhos de comprimentos diversos. Por exemplo, o segmento de reta que vai da origem ao ponto P = (1, 1) do plano tem comprimento √ 2. O caminho f : [0, 2] → R2 , definido por f (t) = (2t − t2 , 2t − t2 ) tem por imagem esse segmento, porém o percorre duas vezes, saindo de f (0) = (0, 0), indo até f (1) = (1, 1) e voltando até f (2) = (0, 0). Seu √ comprimento é, como veremos, igual a 2 2. Dado um caminho f : [a, b] → Rn , cada partição P = {a = t0 < · · · < tk = b} de [a, b] determina uma poligonal inscrita na imagem de f , cujos vértices são os pontos f (a),f (t1 ),. . . ,f (tk−1 ),f (b). O comprimento dessa poligonal é o número l(f ; P ) = k X i=1 |f (ti ) − f (ti−1 )|. Quando não houver perigo de confusão, escreveremos apenas l(P ), em vez de l(f ; P ). Diz-se que o caminho f : [a, b] → Rn é retificável quando o conjunto dos números l(P ), obtidos considerando-se todas as partições P do intervalo [a, b], for limitado. Então o supremo desse conjunto chama-se o comprimento do caminho f , o qual é representado por l(f ). Assim l(f ) = sup l(f ; P ) = sup l(P ). P P Exemplo 6. Seja f : [0, 1] → Rn o caminho retilı́neo f (t) = (1 − t)A + tB. Para toda partição P = {0 < t1 < · · · < tk−1 < 1} de [0, 1] tem-se l(P ) = X |f (ti ) − f (ti−1 )| = X (ti − ti−1 )|B − A| = |B − A|. Assim, obviamente vale l(f ) = |B − A|. ⊳ Seção 4 Caminhos retificáveis 49 Exemplo 7. Um caminho não-retificável f : [a, b] → Rn é aquele em que o ponto f (t) descreve uma trajetória infinitamente longa no tempo finito b − a. Um exemplo de tal situação é o caminho f : [0, 1] → R2 , dado por f (t) = (t, ϕ(t)) o qual percorre o gráfico da função ϕ : [0, 1] → R. Esta função tem, em cada intervalo n n+1 , n+1 n+2 1 · Além disso, n+1 ϕ(1) = 0. Se considerarmos, para cada n ∈ N, a partição n+1 Pn = 0, 1/2, 2/3, . . . , ,1 n+2 o gráfico na forma de um triângulo isósceles de altura do intervalo [0, 1], veremos que l(Pn ) é a soma dos comprimentos dos lados inclinados dos n + 1 primeiros triângulos isósceles que formam o gráfico de ϕ. Logo l(Pn ) é maior do que a soma das alturas desses triângulos, ou seja, l(Pn ) > 1 1 1 + + ··· + · 2 3 n+1 Como a série harmônica é divergente, segue-se que o conjunto dos números l(P ) associados ao caminho f é ilimitado, portanto f não é retificável. O caminho f tem comprimento infinito. Uma observação simples, porém útil, é a seguinte: se a partição Q do intervalo [a, b] refina a partição P então, dado o caminho f : [a, b] → Rn , tem-se l(P ) ≤ l(Q). Para ver isto, basta considerar o caso em que se obtém Q a partir de P acrescentando-lhe um só ponto q, pois cada refinamento de P pode ser pensado como a repetição de um número finito desses acréscimos. Ora, se Q difere de P pela adição do único ponto q, digamos com pj−1 < q < pj , então l(Q) − l(P ) = |f (q) − f (pj−1 )| + |f (pj ) − f (q)| − |f (pj ) − f (pj−1 )| ≥ 0 pois |f (pj ) − f (pj−1 )| = |f (pj ) − f (q) + f (q) − f (pj−1 )| ≤ |f (pj ) − f (q)| + |f (q) − f (pj−1 )|. 50 Caminhos em Rn Cap. 2 f (pj ) f (q) f (pj−1 ) Figura 2.3 Como no caso da integral, dado um caminho f : [a, b] → Rn diremos que o número real A é o limite de l(P ) quando |P | tende a zero, e escreveremos lim l(P ) = A, para significar que, para todo ε > 0 dado, |P |→0 é possı́vel obter δ > 0 tal que |P | < δ implica |l(P ) − A| < ε. Teorema 5. Se lim l(P ) = A então A = sup l(P ), ou seja, o caminho |P |→0 f : [a, b] → Rn é retificável e l(f ) = A. P Demonstração. Se lim l(P ) = A, é claro que A ≤ sup l(P ). Supo|P |→0 P nhamos, por absurdo, que seja A < sup l(P ). Então existe uma partição P Q0 tal que A < l(Q0 ). Seja ε = l(Q0 ) − A. Pela definição do limite, podemos obter δ > 0 tal que |P | < δ ⇒ A − ε < l(P ) < A + ε = l(Q0 ). Tomemos uma partição qualquer P0 tal que |P0 | < δ. A partição P = P0 ∪ Q0 , por um lado cumpre |P | < δ, logo l(P ) < l(Q0 ) e, por outro lado, refina Q0 , logo l(Q0 ) ≤ l(P ). Esta contradição prova o teorema. Observação. Vale a recı́proca: se f é retificável, então l(f ) = lim l(P ). |P |→0 (Vide “Curso de Análise”, vol. 2, pág. 99.) Mas somente o teorema acima será usado a seguir. Teorema 6. Todo caminho f : [a, b] → Rn de classe C 1 é retificável e Z b |f ′ (t)| dt. l(f ) = a Demonstração. Para toda partição P = {t0 < t1 < · · · < tk } de Seção 4 Caminhos retificáveis 51 k k P P P |f (ti ) − f (ti−1 )|. |f ′ (ti−1 )|(ti − ti−1 ) e l(P ) = (P ) = i=1 i=1 Z b P |f ′ (t)| dt. E, pelo Teorema 4, para todo Sabemos que lim (P ) = [a, b], sejam |P |→0 a ε > 0 dado arbitrariamente, existe δ > 0 tal que |P | < δ implica f (ti ) − ε f (ti−1 ) = (f ′ (ti−1 ) + ρi )(ti − ti−1 ) com |ρi | < para i = 1, . . . , k. b−a k k P P |f ′ (ti−1 ) + ρi |(ti − ti−1 ), portanto |f (ti ) − f (ti−1 )| = Logo l(P ) = i=1 i=1 k P P |ρi |(ti − ti−1 ) < ε sempre que |P | < δ. Como | (P ) − l(P )| ≤ Z b Z b i=1 P ′ |f ′ (t)|dt. |f (t)| dt, resulta daı́ que lim l(P ) = lim (P ) = |P |→0 |P |→0 a a Z b ′ |f (t)| dt. Pelo Teorema 5, concluı́mos que l(f ) = a Uma reparametrização do caminho f : [a, b] → Rn é um caminho da forma f ◦ ϕ : [c, d] → Rn , onde ϕ : [c, d] → [a, b] é uma função de classe C 1 tal que ϕ(c) = a, ϕ(d) = b e ϕ′ (u) ≥ 0 para todo u ∈ [c, d]. O teorema acima tem, como conseqüência imediata, o seguinte Corolário 2. Um caminho de classe C 1 , f : [a, b] → Rn , e qualquer sua reparametrização f ◦ ϕ : [c, d] → Rn têm o mesmo comprimento. Com efeito, pelo Teorema, Z d Z b ′ ϕ′ (u) · |f ′ (ϕ(u))| du |f (t)| dt = l(f ) = c a Z d Z d = |ϕ′ (u) · f ′ (ϕ(u))| du = |(f ◦ ϕ)′ (u)| du = l(f ◦ ϕ). c c Rn Para caminhos f : [a, b] → de classe C 1 com a propriedade adi′ cional de que f (t) 6= 0 para todo t ∈ [a, b] (chamados caminhos regulares), existe uma reparametrização especial, “por comprimento de arco”, que apresentamos agora. Dado um tal caminho f , digamos com l(f ) = L, definimos a função ϕ : [a, b] → [0, L] pondo, para todo t ∈ [a, b], Z t ϕ(t) = |f ′ (u)| du = l(f |[a, t]), comprimento do caminho f |[a, t], resa trição de f ao intervalo [a, t]. A função ϕ : [a, b] → [0, L], assim definida, é de classe C 1 , com ′ ϕ (t) = |f ′ (t)| > 0 para todo t ∈ [a, b], e ϕ(a) = 0, ϕ(b) = L. Logo 52 Caminhos em Rn Cap. 2 é uma bijeção de [a, b] sobre [0, L], cuja inversa ϕ−1 : [0, L] → [a, b] é também de classe C 1 , valendo, para todo s = ϕ(t) ∈ [0, L], a fórmula 1 1 = ′ > 0. (Cfr. Vol. 1, pág. 92.) (ϕ−1 )′ (s) = ′ ϕ (t) |f (t)| Consideremos a reparametrização g = f ◦ ϕ−1 : [0, L] → Rn do caminho f . Para todo s = ϕ(t) ∈ [0, L] temos g ′ (s) = (ϕ−1 )′ (s) · f ′ (t) = f ′ (t) , |f ′ (t)| portanto |g ′ (s)| = 1. Então, para todo s ∈ [0, L], o comprimento do caminho restrito g|[0, s] tem o valor Z s Z s ′ du = s. |g (u)| du = l(g|[0, s]) = 0 0 Por este motivo, g = f ◦ ϕ−1 chama-se a reparametrização de f por comprimento de arco. Z b |f ′ (t)| dt é importante teoricamente Observação. A fórmula l(f ) = a mas, em geral, é impraticável procurar calcular essa integral, a não ser numericamente ou então em raros casos especialmente escolhidos, como f (t) = (1 − t)A + tb, f (t) = (cos t, sen t) e outros. 5 Exercı́cios Seção 1: Caminhos diferenciáveis 1. Seja f : I → Rn um caminho diferenciável. Se existirem a ∈ I e b ∈ Rn tais que a é ponto de acumulação do conjunto f −1 (b), prove que f ′ (a) = 0. 2. Seja f : I → R2 um caminho diferenciável cuja imagem coincide com o gráfico da função g : [−1, 1] → R , g(t) = |t|. Se a é um ponto interior de I tal que f (a) = (0, 0), prove que f ′ (a) = 0. 3. Seja f : R → R3 a hélice cilı́ndrica, definida no Exemplo 3 por f (t) = (cos t, sen t, t). Prove que, para todo t ∈ R, a reta que liga os pontos f (t) e f (t) + f ′′ (t) intersecta o eixo vertical de R3 . 4. O caminho g : R → R3 , definido por g(t) = (a cos bt, a sen bt, ct), é também chamado de hélice. Determine a relação entre as constantes a, b, c a fim de que o caminho g esteja parametrizado pelo comprimento de arco. Seção 5 Seção 2: Exercı́cios 53 Cálculo diferencial de caminhos 1. Seja f : [a, b] → Rn um caminho diferenciável tal que f (a) = f (b) = 0. Prove que existe c ∈ (a, b) tal que hf (c), f ′ (c)i = 0. 2. Sejam f1 , f2 : I → Rm caminhos diferenciáveis e ϕ : Rm × Rm → Rn uma aplicação bilinear. Prove que o caminho g : I → Rn , dado por g(t) = ϕ(f1 (t), f2 (t)), é diferenciável e g ′ (t) = ϕ(f1′ (t), f2 (t)) + ϕ(f1 (t), f2′ (t)) para todo t ∈ I. Estenda este resultado para aplicações p-lineares ϕ : Rm × · · · × 2 Rm → Rn e conclua daı́ que se f : (−ε, ε) → Rm é um caminho diferenciável de matrizes m × m com f (0) = Im e g : I → R é a função definida por g(t) = det ·f (t) então g ′ (0) = tr ·a (traço de matriz a), onde a = f ′ (0). 2 3. Seja f : I → Rn um caminho diferenciável cujos valores são matrizes n × n. 2 Prove que g : I → Rn , dado por g(t) = f (t)k , é diferenciável e calcule g ′ (t). Seção 3: A integral de um caminho 1. Sejam f : [a, b] → Rn e ϕ : [a, b] → R de classe C 1 . Se |f ′ (t)| ≤ ϕ′ (t) para todo t ∈ (a, b), prove que |f (b) − f (a)| ≤ ϕ(b) − ϕ(a). 2. Seja f : [a, a + h] → Rn um caminho de classe C k . Prove que f (a + h) = f (a) + h · f ′ (a) + · · · + onde rk = hk (k − 1)! Z 1 0 hk−1 (k−1) f (a) + rk (k − 1)! (1 − t)k−1 f (k) (a + th) dt. 3. Sejam f, g : [a, b] → Rn caminhos de classe C 1 . Prove que Z b Z b hf (t), g ′ (t)idt = hf (b), g(b)i − hf (a), g(a)i − hf ′ (t), g(t)i dt. a a 4. Seja × o produto vetorial em R3 . Para todo v ∈ R3 e todo caminho f : [a, b] → Z b Z b R3 , prove que [v × f (t)]dt = v × f (t)dt. a a 5. Seja A ⊂ Rn convexo. Se o caminho f : [a, b] → Rn cumpre f (t) ∈ A para todo Z b 1 f (t)dt ∈ A. t ∈ [a, b], prove que b−a a Seção 4: Caminhos retificáveis 1. Seja f : [a, b] → Rn um caminho de classe C 1 , com f (a) = A e f (b) = B. Se seu comprimento é l(f ) = |B − A|, prove que f é uma reparametrização do caminho retilı́neo [A, B]. 2. Seja f : [0, L] → S 1 ⊂ R2 um caminho de classe C 1 (com |f (t)| = 1 para todo Z 1 L t ∈ [0, L]). Se seu valor médio m = f (t)dt pertence a S 1 , prove que f é L 0 constante. 54 Caminhos em Rn Cap. 2 3. Seja U ⊂ Rn aberto e conexo. Dados a, b ∈ U , prove que existe um caminho retificável f : I → U começando em a e terminando em b. 4. Dado U ⊂ Rn aberto e conexo, defina a distância intrı́nseca entre os pontos a, b ∈ U como o ı́nfimo dU (a, b) dos comprimentos dos caminhos retificáveis f : I → U , que ligam a e b. Prove que se (xk ) é uma seqüência de pontos em U e a ∈ U , tem-se lim xk = a se, e somente se, lim dU (xk , a) = 0. 3 Funções Reais de n Variáveis 1 Derivadas parciais Seja f : U → R uma função definida no aberto U ⊂ Rn . Para cada i = 1, . . . , n, a i-ésima derivada parcial de f no ponto a = (a1 , . . . , an ) ∈ U é o número ∂f f (a + tei ) − f (a) f (a1 , . . . , ai + t, . . . , an ) − f (a) (a) = lim = lim , t→0 t→0 ∂xi t t caso este limite exista. Como U é aberto, podemos achar δ > 0 tal que a + tei ∈ U para todo t ∈ (−δ, δ). Então está bem definido o caminho retilı́neo λ : (−δ, δ) → U , λ(t) = a + tei . A definição acima ∂f diz que (a) = (f ◦ λ)′ (0) = derivada, no ponto t = 0, da função real ∂xi f ◦ λ : (−δ, δ) → R. Observemos que ∂f /∂xi significa a derivada de f em relação a sua i-ésima variável, seja qual for o nome que se atribua a ela. Assim ∂f ∂f ∂f = = , etc. ∂xi ∂yi ∂zi Uma notação alternativa, que evitaria mal-entendidos, seria ∂i f . Preferimos a notação tradicional ∂f /∂xi porque ela é conveniente quando se usa a regra da cadeia. Quanto n = 2 ou n = 3, escrevemos (x, y) em vez de (x1 , x2 ) e (x, y, z) em vez de (x1 , x2 , x3 ). Assim, ∂f /∂x, ∂f /∂y e ∂f /∂z são as derivadas parciais de f em relação à primeira, a segunda e a terceira variáveis respectivamente. 56 Funções Reais de n Variáveis Cap. 3 Exemplo 1. Seja f : R2 → R definida por f (x, y) = xy/(x2 + y 2 ) se x2 + y 2 6= 0 e f (0, 0) = 0. Como f (0, y) = 0 para todo y e f (x, 0) = 0 ∂f ∂f para todo x, segue-se que (0, 0) = 0 e (0, 0) = 0. Entretanto a ∂x ∂y função f é descontı́nua na origem (0, 0). Com efeito, se chamarmos de θ o ângulo que o vetor não-nulo v = (x, y) forma com o eixo das abcissas, veremos que x y f (x, y) = p ·p = cos θ · sen θ. 2 2 2 x +y x + y2 Logo, atribuindo diferentes valores a θ, podemos fazer com que f (x, y) tenha limites diferentes quando (x, y) tende para (0, 0) ao longo do segmento x = t cos θ, y = t sen θ, ou seja, quando t → 0. ⊳ O exemplo acima mostra que a existência das n derivadas parciais no ponto a não assegura a continuidade da função f nesse ponto. Para cada i = 1, . . . , n, a função λ(t) = f (a + tei ) é essencialmente a restrição de f ao segmento (a − δei , a + δei ) da reta que passa pelo ponto a e é ∂f (a) = paralela ao i-ésimo eixo coordenado de Rn . A derivada parcial ∂xi (f ◦ λ)′ (0) dá informação apenas sobre o comportamento de f ao longo desse segmento. Em particular, a existência das n derivadas parciais de f no ponto a implica que a restrição de f a cada um dos n segmentos paralelos aos eixos, que se cortam no ponto a, é contı́nua, embora não garanta a continuidade de f : U → R em a. Se ∂f /∂xi existe e é positiva em todos os pontos do segmento de reta [a−δei , a+δei ], paralelo ao i-ésimo eixo coordenado, então f é crescente ao longo desse segmento: s < t ⇒ f (a + sei ) < f (a + tei ), desde que |s| ≤ δ e |t| ≤ δ. Isto resulta imediatamente do resultado análogo para funções de uma variável. A noção de derivada parcial também faz sentido para aplicações f : U → Rn , com U ⊂ Rm aberto. Se a ∈ U , põe-se, para cada i = 1, . . . , m: ∂f f (a + tei ) − f (a) (a) = lim · t→0 ∂xi t Evidentemente, ∂f /∂xi é um vetor de Rn . Se f = (f1 , . . . , fn ) então ∂f ∂fn ∂f1 (a) = (a), . . . , (a) . ∂xi ∂xi ∂xi Funções de classe C 1 Seção 2 57 Neste capı́tulo, porém, daremos prioridade às funções com valores numéricos. Para elas tem sentido o vetor gradiente, conceito de forte apelo intuitivo, que contribui para entendermos como cresce (ou decresce) f (x). 2 Funções de classe C 1 Seja f : U → R uma função que possui as n derivadas parciais em todos os pontos do aberto U ⊂ Rn . Ficam então definidas n funções ∂f ∂f ∂f ∂f ,..., : U → R, onde : x 7→ (x). ∂x1 ∂xn ∂xi ∂xi Se estas funções forem contı́nuas em U , diremos que f é uma função de classe C 1 e escreveremos f ∈ C 1 . Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se de classe C 1 quando cada uma de suas funções-coordenada f1 , . . . , fn : U → R é de classe C 1 . Muitas propriedades importantes das funções de classe C 1 resultam de serem elas diferenciáveis no sentido seguinte. Uma função f : U → R, definida no aberto U ⊂ Rn , diz-se diferenciável no ponto a ∈ U quando cumpre as seguintes condições: ∂f ∂f (a), . . . , (a). 1. Existem as derivadas parciais ∂x1 ∂xn 2. Para todo v = (α1 , . . . , αn ) tal que a + v ∈ U , tem-se n X ∂f · αi + r(v), onde f (a + v) − f (a) = ∂xi i=1 lim |v|→0 r(v) = 0. |v| Observações. 1. Acima, e sempre que fizermos considerações em torno ∂f de um ponto especı́fico a, escreveremos, por simplicidade, em vez ∂xi ∂f (a). de ∂xi 2. A essência da definição da diferenciabilidade está na condição lim (r(v)/|v|) = 0, pois a igualdade que define o “resto”r(v) pode ser v→0 escrita para qualquer função que possua as n derivadas parciais. r(v) r(v) De lim = 0 resulta que lim r(v) = 0 pois r(v) = · |v|. v→0 |v| v→0 |v| Segue-se que lim [f (a + v) − f (a)] = 0. Portanto, toda função difev→0 renciável no ponto a é contı́nua nesse ponto. 58 Funções Reais de n Variáveis Cap. 3 Diremos que f : U → R é diferenciável quando f for diferenciável em todos os pontos de U . Quando n = 1, a função f : U → R é diferenciável no ponto a se, e somente se, possui derivada neste ponto pois, como podemos agora dividir por v ∈ R, de f (a + v) − f (a) = (df /dx) · v + r(v) resulta r(v) f (a + v) − f (a) df =± − (a) , |v| v dx portanto lim v→0 df f (a + v) − f (a) r(v) = 0 ⇔ lim = (a). v→0 |v| v dx Teorema 1. Toda função f : U → R de classe C 1 é diferenciável. Demonstração. Por simplicidade, suporemos U ⊂ R2 . O caso geral se trata analogamente, apenas com uma notação mais elaborada. Fixemos c = (a, b) ∈ U e tomemos v = (h, k) tal que c + v ∈ B ⊂ U , onde B é uma bola de centro c. Seja r(v) = r(h, k) = f (a + h, b + k) − f (a, b) − ∂f ∂f ·h− · k, ∂x ∂y onde as derivadas são calculadas no ponto c = (a, b). Podemos escrever r(v) = f (a + h, b + k) − f (a, b + k) + f (a, b + k) − f (a, b) ∂f ∂f ·h− · k. − ∂x ∂x Pelo Teorema do Valor Médio para funções de uma variável real, existem θ1 , θ2 ∈ (0, 1) tais que r(v) = ∂f ∂f ∂f ∂f (a + θ1 h, b + k) · h + (a, b + θ2 k) · k − ·h− · k, ∂x ∂y ∂x ∂y logo r(v) ∂f ∂f h = (a + θ1 h, b + k) − (a, b) √ 2 |v| ∂x ∂x h + k2 ∂f k ∂f (a, b + θ2 k) − (a, b) √ + · 2 ∂y ∂y h + k2 Quando v → 0 os termos dentro dos colchetes acima tendem a zero, pela continuidade das derivadas ∂f /∂x e ∂f /∂y. Além disso, os termos fora Funções de classe C 1 Seção 2 59 dos colchetes têm valor absoluto ≤ 1. Portanto lim r(v)/|v| = 0 e então v→0 f é diferenciável. Corolário 1. Toda função de classe C 1 é contı́nua. Às vezes, como na demonstração a seguir, é mais conveniente tomar ρ = ρ(v) = r(v)/|v| e escrever ρ|v| em vez de r(v). Então a diferenciabilidade de f se exprime como f (a + v) − f (a) = n X ∂f · αi + ρ|v|, ∂xi i=1 com lim ρ = 0. v→0 Teorema 2. Sejam U ⊂ Rm , V ⊂ Rn abertos, f : U → V uma aplicação cujas funções-coordenada f1 , . . . , fn possuem derivadas parciais no ponto a ∈ U e g : V → R uma função diferenciável no ponto b = f (a). Então g ◦ f : U → R possui derivadas parciais no ponto a e vale n ∂(g ◦ f ) X ∂g ∂fk = · , i = 1, . . . , m, ∂xi ∂yk ∂xi k=1 onde as derivadas parciais relativas aos xi são calculadas no ponto a e as relativas a yk são calculadas no ponto b = f (a). Além disso, se f e g são ambas de classe C 1 então g ◦ f ∈ C 1 . Observação. No Capı́tulo 5 provaremos, mais geralmente, que se f e g forem diferenciáveis então g ◦ f é diferenciável. Demonstração. Podemos escrever g(f (a + tei )) − g(f (a)) = n X ∂g · [fk (a + tei ) − fk (a)] ∂yk k=1 + ρ(t) · |f (a + tei ) − f (a)| onde, por simplicidade, escrevemos ρ(t) em vez de ρ(v) com v = f (a + tei ) − f (a). A diferenciabilidade de g nos dá lim ρ(t) = 0. Então t→0 n g(f (a + tei )) − g(f (a)) X ∂g fk (a + tei ) − fk (a) = · t ∂yk t k=1 ± ρ(t) f (a + tei ) − f (a) . t 60 Funções Reais de n Variáveis Cap. 3 Logo n g(f (a + tei )) − g(f (a)) X ∂g ∂fk ∂(g ◦ f ) = lim = · t→0 ∂xi t ∂yk ∂xi k=1 pois lim ρ(t) = 0 e lim t→0 t→0 f (a + tei ) − f (a) ∂f = (a) . t ∂xi O fato de que g ◦ f ∈ C 1 decorre da expressão de ∂(g ◦ f )/∂xi em termos das derivadas parciais de g e das fk , que são contı́nuas. O gradiente de uma função diferenciável f : U → R no ponto a ∈ U é o vetor ∂f ∂f (a), . . . , (a) . grad f (a) = ∂x1 ∂xn Se v é qualquer vetor de Rn , a derivada direcional de f no ponto a, na direção de v é, por definição, f (a + tv) − f (a) ∂f (a) = lim · t→0 ∂v t Estas definições permitem enunciar os seguintes corolários da Regra da Cadeia. O primeiro deles mostra que, quando f é diferenciável no ∂f (a) existe em relação a qualquer vetor ponto a, a derivada direcional ∂v v, dá uma expressão para essa derivada em termos das derivadas parciais de f e das coordenadas de v e, finalmente, mostra que, na definição de ∂f (a), em vez do caminho retilı́neo t 7→ a + tv, pode-se usar qualquer ∂v caminho λ : (−δ, δ) → U desde que se tenha λ(0) = a e λ′ (0) = v. O Corolário 3 é, na realidade, um importante teorema. Corolário 2. Seja f : U → R diferenciável no aberto U ⊂ Rn , com a ∈ U . Dado o vetor v = (α1 , . . . , αn ), se λ : (−δ, δ) → U é qualquer caminho diferenciável tal que λ(0) = a e λ′ (0) = v, tem-se n X ∂f ∂f (a) = (a) · αi . (f ◦ λ) (0) = h grad f (a), vi = ∂v ∂xi ′ i=1 Funções de classe C 1 Seção 2 61 Basta aplicar diretamente a fórmula n X ∂f dλi · , (f ◦ λ) = ∂xi dt ′ i=1 dλi (0). observando que, para λ(t) = (λ1 (t), . . . , λn (t)), tem-se αi = dt ∂f Notar ainda que (a) = (f ◦ λ)′ (0) com λ(t) = a + tv, pois λ′ (0) = v. ∂v Corolário 3 (Teorema do Valor Médio). Dada f : U → R diferenciável no aberto U ⊂ Rn , se o segmento de reta [a, a + v] estiver contido em U então existe θ ∈ (0, 1) tal que ∂f (a + θv) = h grad f (a + θv), vi ∂v n X ∂f (a + θv) · αi = ∂xi f (a + v) − f (a) = i=1 onde v = (α1 , . . . , αn ). Com efeito, considerando o caminho retilı́neo λ : [0, 1] → U , dado por λ(t) = a + tv, vemos que f (a + v) − f (a) = (f ◦ λ)(1) − (f ◦ λ)(0). Pelo Teorema do Valor Médio para funções de uma variável real, existe θ ∈ (0, 1) tal que (f ◦ λ)(1) − (f ◦ λ)(0) = (f ◦ λ)′ (θ). Pela Regra da Cadeia, (f ◦ λ)′ (θ) = n X ∂f ∂f (a + θv) · αi = (a + θv) = h grad f (a + θv), vi. ∂xi ∂v i=1 Corolário 4. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se o segmento de reta [a, a + v] estiver contido em U e existir M > 0 tal que | grad f (a+tv)| ≤ M para todo t ∈ [0, 1] então |f (a+v)−f (a)| ≤ M ·|v|. Com efeito, pela desigualdade de Schwarz, |f (a + v) − f (a)| = |h grad f (a + θv), vi| ≤ | grad f (a + θv)| |v| ≤ M · |v|. Em particular, se U é convexo, se f é diferenciável e se | grad f (x)| ≤ M para todo x ∈ U então |f (y) − f (x)| ≤ M |x − y| quaisquer que sejam x, y ∈ U . Corolário 5. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se U é conexo e grad f (x) = 0 para todo x ∈ U então f é constante. 62 Funções Reais de n Variáveis Cap. 3 Com efeito, pelo Teorema do Valor Médio (Corolário 3), f é constante ao longo de todo segmento de reta contido em U . Ora, sendo o aberto U conexo, dois quaisquer de seus pontos podem ser ligados por um caminho poligonal (justaposição de segmentos de reta) contido em U . Dada f : U → R de classe C 1 , o conjunto f −1 (c) = {x ∈ U ; f (x) = c} é, para todo c ∈ R, chamado o conjunto de nı́vel c da função f . Quando U ⊂ Rn e n = 2 esse conjunto é geralmente chamado a curva ou linha de nı́vel c de f , a qual é definida pela equação f (x, y) = c. Analogamente, quando n = 3, o conjunto f −1 (c), definido pela equação f (x, y, z) = c costuma ser chamado a superfı́cie de nı́vel c da função f . Deve-se observar porém que, para certas funções especialmente escolhidas, tais conjuntos podem ser bem diferentes daquilo que se imagina como uma curva ou uma superfı́cie. Mencionaremos a seguir algumas propriedades do gradiente. Elas justificam a importância desse vetor, o qual dá interessantes informações sobre o comportamento da função. Para isto, fixaremos a∈U , suporemos que f ∈C 1 e que grad f (a) 6= 0. Então: 1) O gradiente aponta para uma direção segundo a qual a função é crescente; 2) Dentre todas as direções ao longo das quais f cresce, a direção do gradiente é a de crescimento mais rápido; 3) O gradiente de f no ponto a é ortogonal ao conjunto de nı́vel de f que passa por a. Vejamos o que significam estas afirmações. Em primeiro lugar, pondo w = grad f (a) temos ∂f (a) = h grad f (a), wi = | grad f (a)|2 > 0 ∂w Isto quer dizer que se λ : (−ε, ε) → U é tal que λ ∈ C 1 , λ(0) = a e = grad f (a) então a função t 7→ f (λ(t)) tem derivada positiva no ponto t = 0. Logo, diminuindo ε se necessário, f ◦ λ : (−ε, ε) → R será uma função crescente. É este o significado de “f cresce na direção do gradiente.” λ′ (0) Funções de classe C 1 Seção 2 63 grad f (x) f −1 (c) Figura 3.1 Como ∂f /∂v = h grad f, vi, os vetores v que apontam para as direções ao longo das quais f cresce são aqueles para os quais se tem h grad f, vi > 0, isto é, aqueles que formam um ângulo agudo com grad f (a). Dizer que o crescimento de f é mais rápido na direção do gradiente significa o seguinte: se v ∈ Rn é tal que |v| = | grad f (a)| então ∂f ∂f (a) ≤ . ∂v ∂(grad f (a)) Com efeito, pela desigualdade de Schwarz: ∂f (a) = h grad f (a), vi ≤ | grad f (a)| · |v| ∂v ∂f = | grad f (a)|2 = · ∂(grad f (a)) Esclareçamos agora a terceira das afirmações acima. Dizer que w ∈ Rn é ortogonal ao conjunto de nı́vel f −1 (c) significa que, dado qualquer caminho λ : (−ε, ε) → f −1 (c), diferenciável no ponto t = 0, com λ(0) = a, tem-se hw, λ′ (0)i = 0. Ora, λ(t) ∈ f −1 (c) significa que f (λ(t)) = c para todo t ∈ (−ε, ε), portanto f ◦ λ : (−ε, ε) → R é constante, igual a c, logo (f ◦ λ)′ (0) = 0, ou seja h grad f (a), λ′ (0)i = 0. Assim, grad f (a) é ortogonal ao vetor velocidade no ponto a = λ(0) de qualquer caminho diferenciável λ contido no conjunto de nı́vel f −1 (c). Ficam portanto constatadas as três propriedades do gradiente acima enunciadas. Vejamos agora alguns exemplos simples. Exemplo 2. Sejam f, g, h : R2 → R definidas por f (x, y) = ax + by (com a2 + b2 6= 0), g(x, y) = x2 + y 2 e h(x, y) = x2 − y 2 . A linha de nı́vel c de f é a reta definida pela equação ax + by = c. O vetor grad f (x, y) é constante: grad f = (a, b) em qualquer ponto (x, y) ∈ R2 . 64 Funções Reais de n Variáveis Cap. 3 Assim as linhas de nı́vel de f são retas paralelas umas às outras, todas perpendiculares ao vetor v = (a, b). O conjunto de nı́vel c da função g(x, y) = x2 + y 2 é vazio se c < 0 e reduz-se ao ponto 0 ∈ R2 quando c = 0. Para c > 0, a linha de nı́vel c é a circunferência de equação x2 + y 2 = c, cujo centro é a origem e cujo √ raio é c. O gradiente de g é grad g(x, y) = (2x, 2y), um vetor colinear com o raio, o que era de esperar pois a tangente da circunferência é perpendicular ao raio no ponto de contacto. A linha de nı́vel 0 da função h(x, y) = x2 − y 2 é o par de retas perpendiculares definidas pela equação x2 − y 2 = 0, que equivale a “x+y = 0 ou x−y = 0”. Se c > 0, x2 −y 2 = c define uma hipérbole cujo eixo é o eixo das abcissas; se c < 0 a hipérbole x2 −y 2 = c tem como eixo o eixo das ordenadas. O gradiente de h é o vetor grad h(x, y) = (2x, −2y). Atribuindo valores particulares a x e y, vemos que este vetor é perpendicular à curva de nı́vel que passa em (x, y) e aponta na direção de crescimento de h. ⊳ (2x, 2y) (a, b) (x, y) x2 + y 2 = c ax + by = c x2 − y 2 = c (x, y) (2x, −2y) Figura 3.2 Chama-se ponto crı́tico de uma função diferenciável f : U → R um ponto a ∈ U tal que grad f (a) = 0. Seção 3 O Teorema de Schwarz 65 A função f do Exemplo 2 não possui ponto crı́tico. As funções g e h do mesmo exemplo têm a origem como ponto crı́tico. Nota-se em ambos os casos uma quebra de regularidade na disposição das curvas de nı́vel quando se atinge um nı́vel em que há ponto crı́tico. 3 O Teorema de Schwarz Seja f : U → R uma função que possui as derivadas parciais ∂f (x), . . . , ∂x1 ∂f (x) em todo ponto x do aberto U ⊂ Rn . A j-ésima derivada parcial ∂xn ∂f : U → R no ponto x ∈ U será indicada por da função ∂xi ∂2f ∂ (x) = ∂xj ∂xi ∂xj ∂f ∂xi (x), i, j = 1, . . . , n. Se essas derivadas parciais de segunda ordem existirem em cada ∂2f ponto x ∈ U , teremos n2 funções : U → R. Quando tais funções ∂xj ∂xi forem contı́nuas, diremos que f é de classe C 2 e escreveremos f ∈ C 2 . Em geral, a mera existência das derivadas parciais de segunda ordem em todos os pontos onde f está definida não assegura que se tenha ∂2f ∂2f = , ∂xj ∂xi ∂xi ∂xj como se vê no exemplo abaixo. xy(x2 − y 2 ) x2 + y 2 quando x2 + y 2 = 6 0 e f (0, 0) = 0. Para todo y = 6 0 tem-se f (0, y) = 0, logo ∂f f (x, y) y(x2 − y 2 ) (0, y) = lim = lim = −y, x→0 x→0 x2 + y 2 ∂x x Exemplo 3. Seja f : R2 → R definida por f (x, y) = Portanto ∂ ∂2f (0, 0) = ∂y∂x ∂y ∂f (0, y) = −1. ∂x 66 Funções Reais de n Variáveis Um cálculo análogo mostra que Cap. 3 ∂2f (0, 0) = 1. Logo ∂x∂y ∂2f ∂2f (0, 0) 6= (0, 0). ∂x∂y ∂y∂x ⊳ Em todo ponto x ∈ U onde existem as derivadas parciais de segunda ∂2f (x) formam ordem da função f : U → R, os números hij (x) = ∂xi ∂xj uma matriz h (x) = [hij (x)], chamada a matriz hessiana da função f . O Teorema de Schwarz afirma que se f é de classe C 2 então a matriz hessiana de f é simétrica. A demonstração que daremos para o Teorema de Schwarz se baseia num resultado, atribuı́do a Leibniz, segundo o qual é permitido derivar sob o sinal de integral, desde que o resultado da derivação seja uma função contı́nua. Por sua vez, a demonstração do Teorema de Leibniz utiliza o lema abaixo, que poderia estar no Capı́tulo 1 mas é colocado aqui para deixar claro como cada proposição depende da anterior. Lema 1. Sejam X ⊂ Rm um conjunto arbitrário e K ⊂ Rn compacto. Fixemos x0 ∈ X. Se f : X × K → Rp é contı́nua então, para todo ε > 0 dado, pode-se obter δ > 0 tal que x ∈ X e |x − x0 | < δ implicam |f (x, t) − f (x0 , t)| < ε, seja qual for t ∈ K. Demonstração. Do contrário existiriam ε > 0 e seqüências de pontos xk ∈ X e tk ∈ K tais que |xk − x0 | < 1/k e |f (xk , tk )−f (x0 , tk )| ≥ ε. Passando a uma subseqüência, se necessário, podemos admitir que lim tk = t0 ∈ K. Como, evidentemente, lim xk = x0 , a continuidade de f nos daria ε ≤ lim |f (xk , tk ) − f (x0 , tk )| = |f (x0 , t0 ) − f (x0 , t0 )| = 0, uma contradição. Teorema 3 (Derivação sob o sinal de integral). Dado U ⊂ Rn aberto, seja f : U × [a, b] → R contı́nua, tal que a i-ésima derivada ∂f parcial (x, t) existe para todo ponto (x, t) ∈ U × [a, b] e a função ∂xi ∂f /∂xi : U × [a, b] → R, assim definida, é contı́nua. Então a função Z b f (x, t)dt, possui a i-ésima derivada ϕ : U → R, dada por ϕ(x) = a Z b ∂f ∂ϕ (x) = (x, t)dt. Em parcial em cada ponto x ∈ U , sendo ∂xi a ∂xi Seção 3 O Teorema de Schwarz 67 suma: pode-se derivar sob o sinal de integral, desde que o integrando resultante seja uma função contı́nua. Demonstração. Para todo s suficientemente pequeno, o segmento de reta [x, x + sei ] está contido em U . Temos Z b ∂f ϕ(x + sei ) − ϕ(x) − (x, t) dt = s ∂x i a Z b f (x + sei , t) − f (x, t) ∂f = − (x, t) dt. s ∂xi a Mostremos que, dado arbitrariamente ε > 0, existe δ > 0 tal que, para todo |s| < δ e todo t ∈ [a, b], a expressão sob o último sinal de integral acima é, em valor absoluto, inferior a ε/(b − a). Isto demonstrará o teorema. Ora, pelo Teorema do Valor Médio, para cada t ∈ [a, b] existe θ = θt ∈ (0, 1) tal que f (x + sei , t) − f (x, t) ∂f = (x + θsei , t). s ∂xi ∂f : U × [a, b] → R é contı́nua, o Lema 1 fornece, a partir do ε ∂xi dado, um δ > 0 tal que se tem Como ∂f ε ∂f (x + θsei , t) − (x, t) < ∂xi ∂xi b−a para todo t ∈ [a, b], desde que seja |s| < δ (e conseqüentemente |θs| < δ). Isto completa a demonstração. Teorema 4 (Schwarz). Se f : U → R é de classe C 2 no aberto U ⊂ Rn então, para quaisquer i, j = 1, . . . , n e x ∈ U , tem-se ∂2f ∂2f (x) = (x). ∂xi ∂xj ∂xj ∂xi Demonstração. Sem perda de generalidade, podemos supor que U = I × J é um retângulo em R2 . Fixando b ∈ J, o Teorema Fundamental do Cálculo nos diz que, para todo (x, y) ∈ U , tem-se Z y ∂f (x, t)dt. f (x, y) = f (x, b) + b ∂y 68 Funções Reais de n Variáveis Cap. 3 Como ∂ 2 f /∂x∂y é contı́nua, podemos derivar sob o sinal de integral, logo Z y 2 ∂f ∂ f ∂f (x, y) = (x, b) + (x, t)dt. ∂x ∂x ∂x∂y b Em seguida, derivamos em relação a y e obtemos ∂2f ∂2f (x, y) = (x, y). ∂y∂x ∂x∂y Mais geralmente, para cada inteiro k ≥ 1, podemos considerar as derivadas parciais de ordem k de uma função f : U → R, definida no aberto U ⊂ Rn . Por exemplo, para 1 ≤ i, j, k ≤ n, 2 ∂3f ∂ ∂ f (a) significa (a). ∂xi ∂xj ∂xk ∂xi ∂xj ∂xk Como toda permutação dos ı́ndices i1 , . . . , ik pode ser obtida por meio de repetidas inversões de ı́ndices adjacentes, segue-se do Teorema de Schwarz que a derivada de ordem k ∂kf (a) ∂xi1 ∂xi2 . . . ∂xik não depende da ordem em que são feitas as derivações, desde que todas as derivadas de ordem k de f existam e sejam contı́nuas. Uma função f : U → R que possui, em cada ponto de U , todas as derivadas parciais de ordem k, as quais são funções contı́nuas em U , chama-se uma função de classe C k . Escreve-se então f ∈ C k . Quando f ∈ C k para todo k = 1, 2, 3, . . . , diz-se que f é uma função de classe C ∞ . 4 A fórmula de Taylor A fórmula de Taylor, que estabeleceremos aqui em sua versão restrita aos termos de até segunda ordem, é fundamental para o estudo do comportamento de uma função de classe C 2 na proximidade de um ponto crı́tico. Ela se baseia no lema abaixo. Lema 2. Seja r : B → R de classe C 2 na bola aberta B ⊂ Rn , de centro ∂r ∂2r 0. Se r(0) = (0) = (0) = 0 para quaisquer i, j = 1, . . . , n, ∂xi ∂xi ∂xj r(v) = 0. então lim v→0 |v|2 Seção 4 A fórmula de Taylor 69 Demonstração. Sendo r : B → R uma função de classe C 1 (portanto diferenciável) que se anula, juntamente com todas as suas derivadas ∂r/∂xi , no ponto v = 0, segue-se da definição de função diferenciável que lim r(v)/|v| = 0. Pelo Teorema do Valor Médio (Corolário 3 do v→0 Teorema 2), para cada v=(α1 , . . . , αn )∈B existe θ tal que 0 < θ < 1 e n n X ∂r r(v) X r(v) = (θv) · αi , logo = ∂xi |v|2 i=1 i=1 ∂r ∂xi (θv) |θv| · θαi · |v| Como cada derivada parcial ∂r/∂xi se anula, juntamente com todas as suas derivadas ∂ 2 r/∂xj ∂xi , no ponto 0, resulta da nossa observação inicial que ∂r (θv)/|θv| = 0 para todo i = 1, . . . , n. lim v→0 ∂xi Além disso, cada quociente θαi /|v| tem valor absoluto ≤ 1. Por conser(v) guinte lim = 0. v→0 |v|2 Teorema 5 (Fórmula de Taylor). Seja f : U → R de classe C 2 no aberto U ⊂ Rn . Fixado a ∈ U , para todo v = (α1 , . . . , αn ) ∈ Rn tal que a + v ∈ U , escrevamos n n X 1 X ∂2f ∂f · αi + · αi αj + r(v), f (a + v) − f (a) = ∂xi 2 ∂xi ∂xj i,j=1 i=1 r(v) = 0. v→0 |v|2 Demonstração. De acordo com o Lema 2 devemos demonstrar que as derivadas sendo calculadas no ponto a. Então lim n n X ∂f 1 X ∂2f r(v) = f (a + v) − f (a) − · αi − · αi αj ∂xi 2 ∂xi ∂xj i=1 i,j=1 se anula, juntamente com suas derivadas parciais de primeira e segunda ordem, no ponto v = 0. Para fazer o cálculo, começamos lembrando que, na expressão de r(v), as variáveis independentes são as coordenadas α1 , . . . , αn de v. É em relação a elas que as derivadas parciais de r devem ser tomadas, embora continuemos escrevendo ∂r/∂xi e ∂ 2 r/∂xi ∂xj . Observemos também que, no somatório duplo que ocorre na definição de r(v), 70 Funções Reais de n Variáveis Cap. 3 cada par de variáveis αi , αj aparece em duas parcelas iguais, a saber, ∂2f ∂2f · αj αi e · αi αj . Levando isto em conta, temos: ∂xj ∂xi ∂xi ∂xj n X ∂2f ∂r ∂f ∂f (v) = (a + v) − (a) − (a) · αi . ∂xj ∂xj ∂xj ∂xi ∂xj i=1 Derivando outra vez, vem: ∂2f ∂2f ∂2r (v) = (a + v) − (a). ∂xi ∂xj ∂xi ∂xj ∂xi ∂xj Conseqüentemente r(0) = 0, quaisquer i, j = 1, . . . , n. ∂2r ∂r (0) = 0 e (0) = 0 para ∂xi ∂xi ∂xj Observação. Se pusermos ρ(v) = fórmula de Taylor se escreve assim: r(v) quando v 6= 0 e ρ(0) = 0, a |v|2 n n X 1 X ∂2f ∂f αi + · αi αj + ρ(v) · |v|2 , f (a + v) − f (a) = ∂xi 2 ∂xi ∂xj i=1 i,j=1 onde lim ρ(v) = 0. v→0 5 Pontos crı́ticos Uma forma quadrática H : Rn → R é uma função cujo valor no vetor n P hij αi αj , onde [hij ] é uma matriz simétrica n × n. v = (α1 , . . . , αn ) é i,j=1 O valor da forma quadrática H no vetor v será indicado com a notação H · v 2 . Portanto H · v2 = n X hij αi αj quando v = (α1 , . . . , αn ). i,j=1 Se t ∈ R então H · (tv)2 = t2 · (H · v 2 ). A forma quadrática H chama-se não-negativa quando H · v 2 ≥ 0 para todo v ∈ Rn , positiva quando H · v 2 > 0 para todo v 6= 0 em Rn e indefinida quando existem v, w ∈ Rn tais que H · v 2 > 0 e H · w2 < 0. De modo análogo se definem forma quadrática negativa e não-positiva. Quando H é positiva ou negativa, diz-se que ela é definida. Seção 5 Pontos crı́ticos 71 Exemplo 4. A forma quadrática H : Rn → R, onde H · v 2 = hv, vi, é positiva. Como hv, vi = α12 + · · · + αn2 , a matriz de H é a identidade. Para todo k ∈ [1, n], H · v 2 = α12 + · · · + αk2 é uma forma quadrática não-negativa em Rn . Por outro lado, se pusermos H · v 2 = 2 α12 + · · · + αk2 − αk+1 − · · · − αn2 com 0 < k < n, teremos uma forma quadrática indefinida. Evidentemente, se H é positiva (respect. nãonegativa) então −H é negativa (respect. não-positiva). Seja H : Rn → R uma forma quadrática cuja matriz é [hij ]. Se chamarmos de H0 : Rn → Rn o operador linear cuja matriz na base canônica de Rn é também [hij ], vemos imediatamente que H · v 2 = hH0 ·v, vi para todo v ∈ Rn . Como a matriz [hij ] do operador H0 na base canônica é simétrica, H0 é auto-adjunto. Reciprocamente, para qualquer operador auto-adjunto H0 : Rn → Rn , a função H : Rn → R, dada por H · v 2 = hH0 · v, vi, é uma forma quadrática. Quando H é definida, o operador H0 é invertı́vel pois hH0 ·v, vi = 6 0 para todo v 6= 0 ⇒ H0 ·v 6= 0 para todo v 6= 0. Dada a função f : U → R, de classe C 2 no aberto U ⊂ Rn , a forma quadrática hessiana = (Hf )(x) de f no ponto x ∈ U é aquela cuja H(x) ∂2f matriz é [hij ] = (x) . Assim, para todo v = (α1 , . . . , αn ) ∈ Rn , ∂xi ∂xj tem-se n X ∂2f 2 (x) · αi αj . H(x) · v = ∂xi ∂xj i,j=1 A forma hessiana é usada para determinar a natureza dos pontos crı́ticos da função f . Diz-se que a ∈ U é um ponto de máximo local da função f : U → R quando existe δ > 0 tal que f (x) ≤ f (a) para todo x ∈ U ∩B(a; δ). Analogamente se define um ponto de mı́nimo local . Um ponto a, de máximo (ou de mı́nimo) local de uma função diferenciável f , é um ponto crı́tico de f . Com efeito, para todo i = 1, . . . , n, se δ > 0 é suficientemente pequeno então a função ϕ : (−δ, δ) → R, dada por ϕ(t) = f (a + tei ), está bem definida e possui um máximo (ou mı́nimo) local no ponto t = 0. ∂f Logo 0 = ϕ′ (0) = (a), i = 1, . . . , n. ∂xi Exemplo 5. A origem 0 ∈ R2 é ponto crı́tico das três funções f, g, h : R2 → R, definidas por f (x, y) = x2 + y 2 , g(x, y) = −x2 − y 2 e h(x, y) = x2 − y 2 . Para f a origem é um ponto de mı́nimo, para g de máximo e 72 Funções Reais de n Variáveis Cap. 3 para h não é máximo nem mı́nimo pois em qualquer disco de centro 0 a função h assume valores maiores e menores do que 0 = h(0, 0). ⊳ Teorema 6. Seja a ∈ U um ponto crı́tico da função f : U → R, de classe C 2 . a) Se a forma quadrática hessiana H(a) for positiva então a é um ponto de mı́nimo local de f . b) Se H(a) for negativa então a é um ponto de máximo local. c) Se H(a) for indefinida, então a não é ponto de máximo nem de mı́nimo local de f . Demonstração. a) Por simplicidade, escrevamos H em vez de H(a). Pelo Teorema de Weierstrass, a função contı́nua positiva H assume um valor mı́nimo 2c > 0 no conjunto compacto S n−1 . Noutras palavras, existe c > 0 tal que H · u2 ≥ 2c para todo vetor u ∈ Rn com |u| = 1. Como a é um ponto crı́tico de f , a fórmula de Taylor se resume a f (a + v) − f (a) = 1 H · v 2 + ρ(v)|v|2 com lim ρ(v) = 0. v→0 2 Como v/|v| é um vetor unitário (pertencente a S n−1 ), temos v 2 |v|2 |v|2 1 ≥ H · v2 = H· · 2c = |v|2 · c. 2 2 |v| 2 Portanto f (a + v) − f (a) ≥ |v|2 (c + ρ(v)). Pela definição de limite, existe δ > 0 tal que a + v ∈ U e 0 < |v| < δ implicam |ρ(v)| < c e conseqüentemente c + ρ(v) > 0. Logo f (a + v) − f (a) > 0, isto é, f (a) < f (a + v) para todo v tal que a + v ∈ U e 0 < |v| < δ. Assim, a é um ponto de mı́nimo local para f . b) Segue as mesmas linhas do caso anterior. c) Dado v ∈ Rn , tem-se a + tv ∈ U para todo t suficientemente pequeno. Então, lembrando que H · (tv)2 = t2 · (H · v 2 ), temos f (a + tv) − f (a) = t2 · i v 2 |v|2 h + ρ(tv) , com lim ρ(tv) = 0. · H· t→0 2 |v| Segue-se, como acima, que para todo t suficientemente pequeno, f (a + tv) − f (a) tem o mesmo sinal que H · v 2 . Assim, se H é indefinida, Seção 5 Pontos crı́ticos 73 com H · v 2 > 0 e H · w2 < 0, em qualquer bola de centro a existem pontos a + tv e a + tw tais que f (a + tv) > f (a) e f (a + tw) < f (a). Portanto f não tem máximo nem mı́nimo local no ponto a. Corolário 6. Se a função f : U → R, de classe C 2 , possui um mı́nimo (respect. máximo) local no ponto a ∈ U então a forma quadrática hessiana de f é não-negativa (respect. não-positiva) nesse ponto. Com efeito, se fosse H · v02 < 0 para algum v0 ∈ Rn , terı́amos f (a + tv0 ) < f (a) para todo t suficientemente pequeno, e então a não seria um ponto de mı́nimo local. Mesmo argumento para máximo local. Exemplo 6. Pela demonstração acima, vê-se que quando a forma quadrática hessiana é positiva (respect. negativa) no ponto a então a é um ponto de mı́nimo (respect. máximo) local estrito, isto é, numa pequena bola de centro a não há outros pontos x com f (x) = f (a). Por exemplo, a origem é um ponto de mı́nimo estrito da função f (x, y) = x2 + y 2 mas todos os pontos (x, 0) do eixo das abcissas são pontos de mı́nimo não-estritos da função g(x, y) = y 2 . (O domı́nio de ambas as funções f, g é R2 .) A forma hessiana de f na origem de R2 é H · v 2 = 2α2 + 2β 2 se v = (α, β) enquanto a de g é K · v 2 = 2β 2 . Vemos que H é positiva e K é apenas não-negativa. Já a forma hessiana da função h(x, y) = x2 − y 2 na origem é L · v 2 = 2α2 − 2β 2 , que é indefinida. Por isso a origem é um ponto crı́tico que não é máximo nem mı́nimo local (ponto de sela). ⊳ Exemplo 7. Poder-se-ia indagar se vale a recı́proca do corolário acima. A resposta é negativa. A função f : R2 → R, dada por f (x, y) = x2 + y 3 tem a origem de R2 como ponto crı́tico, no qual a forma hessiana é H · v 2 = 2α2 , para v = (α, β). A forma H é não-negativa porém a origem não é um ponto de mı́nimo local de f . ⊳ Neste ponto, cabe a pergunta: de que modo podemos determinar se uma dada forma quadrática é positiva, negativa, etc? O método de completar o quadrado, devido a Lagrange, responde a questão. Este método, que se baseia na observação óbvia de que a2 +2ab = (a+b)2 −b2 , consiste em efetuar sucessivas mudanças de variáveis, visando eliminar, na expressão da forma quadrática H, os termos como xy, xz, yz, etc, deixando apenas parcelas do tipo x2 , y 2 , z 2 etc. Os exemplos a seguir ilustram o método de completar os quadrados. 74 Funções Reais de n Variáveis Cap. 3 Exemplo 8. Seja a forma quadrática H(x, y) = x2 − xy + y 2 em R2 . Completando o quadrado, temos y 2 y 2 y − · x2 − xy = x2 − 2x · = x − 2 2 4 Logo y 2 3 2 y 2 y 2 − + y . + y2 = x − H(x, y) = x − 2 4 2 4 √ 2 2 Portanto H(x, y) = s + t com s = x − y/2 e t = ( 3/2) · y. Assim, a forma H é positiva. O mesmo processo, aplicado à forma K, onde K(x, y) = x2 + 3xy + y 2 nos dá 2 3 9 K(x, y) = x + y − y 2 + y 2 , 2 4 ou seja, √ 2 5 2 3 5 3 2 2 y. K(x, y) = x + y − y = s − t com s = x + y e t = 2 4 2 2 Portanto a forma K é indefinida. ⊳ Exemplo 9. Seja em R3 a forma quadrática H(x, y, z) = x2 + y 2 + z 2 + 3xy + 3xz + 4yz. Agrupando os termos que contêm x, temos: 2 9 3 3 2 2 x + 3xy + 3xz = x + 2x · (y + z) = x + (y + z) − (y + z)2 2 2 4 9 9 3 9 = s2 − y 2 − z 2 − yz, com s = x + (y + z). 4 4 2 2 Logo 9 2 9 2 9 y − z − yz + 4yz 4 4 2 5 2 5 2 1 2 = s − y − z − yz. 4 4 2 H(x, y, z) = s2 + y 2 + z 2 − Agrupando os termos que contêm y: 2 5 2 1 1 2 5 5 2 1 2 − y − yz = − z y + yz = − y+ z + 4 2 4 5 4 5 20 1 2 1 5 z com t = y + z. = − t2 + 4 20 5 Seção 6 Funções convexas 75 Portanto: H(x, y, z) = s2 − 5 2 1 2 5 2 5 6 t + z − z = s2 − t2 − z 2 . 4 20 4 4 5 Concluı́mos então que a forma quadrática H é indefinida. Com efeito, para z = 0 temos 5 H(x, y, 0) = s − t2 = 4 2 2 5 3 x + y − y2. 2 4 Logo H(x, 0, 0) = x2 e, em particular, H(1, 0, 0) = 1, enquanto H(−3/2, 1, 0) = −5/4. ⊳ 6 Funções convexas Seja C ⊂ Rn um conjunto convexo. Uma função f : C → R chama-se convexa quando, para quaisquer x, y ∈ C e t ∈ [0, 1], tem-se f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y). Alternativamente: f é convexa quando, para quaisquer x, y ∈ C e α, β ∈ [0, 1] com α + β = 1, tem-se f (αx + βy) ≤ α · f (x) + β · f (y). Diz-se que f : C → R é côncava quando −f é convexa. Isto equivale a dizer que, para quaisquer x, y ∈ C e t ∈ [0, 1] tem-se f ((1 − t)x + ty) ≥ (1 − t)f (x) + tf (y). Todos os resultados a seguir estabelecidos para funções convexas valem, com as óbvias modificações, para funções côncavas. A combinação linear α1 v1 + · · · + αk vk chama-se uma combinação convexa de v1 , . . . , vk ∈ Rn quando α1 + · · · + αk = 1 e αi ≥ 0 para i = 1, . . . , k. Teorema 7. Se C ⊂ Rn é convexo e v1 , . . . , vk ∈ C então toda combinação convexa α1 v1 +· · ·+αk vk pertence a C. Além disso, se f : C → R é uma função convexa, tem-se ! k k X X f αi · f (vi ). αi vi ≤ i=1 i=1 Demonstração. Para k = 1 isto é óbvio e para k = 2 é a definição de conjunto convexo. Mostraremos por indução em k que a combinação 76 Funções Reais de n Variáveis Cap. 3 convexa de k elementos de C ainda pertence a C. Supondo este fato verdadeiro para um certo k, escrevamos uma combinação convexa dos elementos v1 , . . . , vk+1 ∈ C sob a forma k+1 X αi vi = k X αi vi + αk+1 vk+1 . i=1 i=1 Sem perda de generalidade, podemos admitir que αk+1 6= 1. Então, k P αi , temos αk+1 = 1 − α e α 6= 0. Pela hipótese de pondo α = i=1 indução, levando em conta que pertence a C. Logo k+1 X i=1 k α k α P P i i = 1, vemos que v = vi i=1 α i=1 α αi vi = αv + (1 − α)vk+1 ∈ C, pois C é convexo. A segunda parte também se prova por indução, pois f k+1 X i=1 αi vi ! =f k X αi vi + αk+1 vk+1 i=1 =f α· ≤α·f ≤α· k X αi i=1 k X i=1 k X αi i=1 α α ! vi + (1 − α)vk+1 αi vi α ! ! + (1 − α)f (vk+1 ) f (vi ) + (1 − α)f (vk+1 ) = k+1 X αi f (vi ). i=1 Teorema 8. Seja C ⊂ Rn convexo. A fim de que a função f : C → R seja convexa, é necessário e suficiente que, para quaisquer a, b ∈ C, a função ϕ : [0, 1] → R, definida por ϕ(t) = f (a + tv), v = b − a, seja convexa. Equivalentemente: f : C → R é convexa se, e somente se, sua restrição a qualquer segmento de reta [a, b] ⊂ C é convexa. Seção 6 Funções convexas 77 Demonstração. Se f é convexa então, para s, t, α ∈ [0, 1] temos ϕ (1 − α)s + αt = f (a + [(1 − α)s + αt]v) = f [(1 − α) · (a + sv) + α · (a + tv)] ≤ (1 − α)f (a + sv) + αf (a + tv) = (1 − α)ϕ(s) + αϕ(t) logo ϕ é convexa. Reciprocamente, se todas as funções ϕ, definidas do modo acima, são convexas então, dados x, y ∈ C e α ∈ [0, 1], pomos ϕ(t) = f (x + t(y − x)) e temos: f (1 − α)x + αy = f x + α(y − x) = ϕ(α) = ϕ (1 − α) · 0 + α · 1 ≤ (1 − α) · ϕ(0) + α · ϕ(1) = (1 − α) · f (x) + α · f (y), portanto f é convexa. Como aplicação do Teorema 8, mostremos que se f : U → R é uma função convexa e o conjunto convexo U ⊂ Rn é aberto então, para cada a ∈ U , existe a derivada de Gâteux ∂f f (a + tv) − f (a) (a) = lim · + + ∂v t t→0 Com efeito, a função ϕ : [0, 1] → R definida por ϕ(t) = f (a + tv) é convexa, portanto existe a derivada à direita ϕ′+ (0) (veja Vol. 1, ∂f pág. 108). Mas, como se vê facilmente, ϕ′+ (0) = + (a). ∂v Daı́ se conclui, como no Vol. 1, que toda função convexa definida num subconjunto aberto de R é contı́nua. Este resultado continua válido em Rn com n > 1 (ver Apêndice deste capı́tulo) porém não decorre da existência da derivada de Gâteaux, pois uma função em Rn pode ser contı́nua ao longo de cada reta que passa por um ponto a sem que seja necessariamente contı́nua nesse ponto. Teorema 9. Seja f : U → R definida no aberto convexo U ⊂ Rn . Então: a) O conjunto E(f ) = {(x, y) ∈ U × R; y ≥ f (x)} ⊂ Rn+1 , chamado o epigráfico de f , é convexo se, e somente se, f é convexa. b) Supondo-a de classe C 1 , a função f é convexa se, e somente se, para a, a + v ∈ U quaisquer, tem-se f (a + v) ≥ f (a) + h grad f (a), vi. 78 Funções Reais de n Variáveis Cap. 3 c) Quando é de classe C 2 , a função f é convexa se, e somente se, sua forma quadrática hessiana é não-negativa em todos os pontos de U . Demonstração. (a) Seja E(f ) convexo. Para mostrar que f é convexa, tomamos x, x′ ∈ U e α ∈ [0, 1]. Então (x, f (x)) e (x′ , f (x′ )) pertencem a E(f ), portanto (1 − α)x + αx′ , (1 − α) · f (x) + α · f (x′ ) ∈ E(f ). Isto significa que (1 − α) · f (x) + α · f (x′ ) ≥ f [(1 − α)x + αx′ ], logo f é convexa. Reciprocamente, supondo f convexa, sejam z = (x, y), z ′ = (x′ , y ′ ) pontos em E(f ) e α ∈ [0, 1]. Então y ≥ f (x) e y ′ ≥ f (x′ ) e daı́ (1−α)y +αy ′ ≥ (1−α)·f (x)+α·f (x′ ) ≥ f (1−α)x+αx′ , a última desigualdade devendo-se à convexidade de f . Logo (1 − α)z + αz ′ = ′ ′ (1 − α)x + αx , (1 − α)y + αy pertence a E(f ), ou seja, E(f ) é um conjunto convexo. (b) Suponhamos f : U → R convexa, de classe C 1 . Pelo Teorema 8, se a e a + v pertencem a U então a função ϕ : [0, 1] → R, definida por ϕ(t) = f (a + tv), é convexa. Portanto (v. Teorema 4, pág 109, vol. 1) tem-se ϕ(1) ≥ ϕ(0)+ϕ′ (0). Mas ϕ(1) = f (a+v), ϕ(0) = f (a) e ϕ′ (0) = h grad f (a), vi. Logo f (a + v) ≥ f (a) + h grad f (a), vi. Reciprocamente, suponhamos que esta desigualdade valha para quaisquer a, a + v ∈ U . Então, pondo ϕ(t) = f (a + tv), temos uma função ϕ : [0, 1] → R tal que ϕ′ (t) = h grad f (a + tv), vi para todo t ∈ [0, 1]. Ora, para quaisquer t, t0 ∈ [0, 1], tem-se f (a + tv) = f (a + t0 v + (t − t0 )v) = f (a + t0 v + sv), com s = t − t0 logo, pela hipótese admitida sobre f , f (a + tv) ≥ f (a + t0 v) + h grad f (a + t0 v), svi = f (a + t0 v) + h grad f (a + t0 v), vi(t − t0 ), o que pode ser lido como ϕ(t) ≥ ϕ(t0 ) + ϕ′ (t0 )(t − t0 ). Pelo Teorema 4, pág. 109, Volume 1, a função ϕ é convexa. O Teorema 8, acima, assegura então que f é convexa. (c) Novamente, usamos o Teorema 8 acima, o qual permite reduzir a questão ao caso de uma função de uma variável, e então recaı́mos no Corolário 2, pag. 110 do Volume 1. Com efeito, pondo ϕ(t) = f (x + tv), com v = (α1 , . . . , αn ), temos P ∂f ϕ′ (t) = ni=1 ∂x (x + tv)αi e i ϕ′′ (t) = Pn ∂2f i,j=1 ∂xi ∂xj (x + tv)αi αj = H(x + tv) · v 2 . Seção 6 Funções convexas 79 Temos portanto as seguintes equivalências: H(x) é não-negativa para todo x ∈ U ⇔ ϕ′′ (t) ≥ 0 para quaisquer x, x + v ∈ U e t ∈ [0, 1] ⇔ todas as funções ϕ do tipo ϕ(t) = f (x + tv) são convexas ⇔ f : U → R é convexa. Corolário 7. Todo ponto crı́tico a de uma função convexa f : U → R de classe C 1 é um ponto de mı́nimo global, isto é, f (x) ≥ f (a) para todo x ∈ U. Apêndice: Continuidade das funções convexas Teorema 10. Seja U ⊂ Rn um aberto convexo. Toda função convexa f : U → R é contı́nua. A demonstração do Teorema 10 se baseia nos dois lemas abaixo. n Q [ai , bi ] é uma Lema 3. Todo ponto de um bloco retangular B = combinação convexa dos vértices desse bloco. i=1 Demonstração. (Por indução.) Isto é óbvio para n = 1. Seja n > 1. n Q {ai , bi }, os Os vértices do bloco B são os 2n elementos do conjunto i=1 quais denotaremos por vj ou vj conforme sua última coordenada seja da forma ak ou bk . Um ponto arbitrário do bloco B pode ser escrito como n−1 Q [ai , bi ], de p = (x, y), onde y ∈ [an , bn ] e x pertence ao bloco B ′ = i=1 P dimensão n − 1. Pela hipótese de indução, x = αj uj é combinação convexa dos vértices uj ∈ B ′ . Os vértices de B são vj = (u Pj , an ) e vj = P (uj , bn ). Pondo P p0 = (x, an ) e p1 = (x, bn ), temos p0 = αj vj e p1 = αj vj (já que αj = 1). Além disso, y = (1 − t)an + tbn , com P P y − an , logo p = (1 − t)p0 + tp1 = (1 − t)αj vj + tαj vj , o que t= bn − an exprime o ponto arbitrário p do bloco B como combinação convexa dos vértices de B. Lema 4. Toda função convexa f : U → R, definida num aberto convexo U ⊂ Rn , é localmente majorada por uma constante. n Q (ai , bi ) o interior de um bloco retangular Demonstração. Seja A = i=1 contido em U . Se indicarmos comPwj , j = 1, . . . , 2n , os vértices de A teremos,Ppara cada x ∈ A, x = αj wj logo, pela convexidade de f , f (x) ≤ αj · f (wj ) ≤ M , onde M = max {f (wj )}. j 80 Funções Reais de n Variáveis Cap. 3 Demonstração do Teorema 10. Para simplificar a escrita, a fim de provar a continuidade de f no ponto arbitrário a ∈ U , podemos admitir que a = 0 e que f (0) = 0, pois o conjunto U0 = {x ∈ Rn ; a − x ∈ U } é convexo, aberto, contém 0 e a função g : U0 → R, definida por g(x) = f (a − x) − f (a), cumpre g(0) = 0, é convexa e é contı́nua no ponto 0 se, e somente se, f é contı́nua no ponto a. Pelo Lema 4, existem c > 0 e M > 0 tais que |x| ≤ c ⇒ f (x) ≤ M . Seja dado ε > 0. Sem perda de generalidade, podemos supor que ε < M . A convexidade de f nos permite afirmar que f ε ε ε ε x =f 1− x ≤ · f (x) ·0+ M M M M logo ε f (x) ≤ ·f M Tomando δ = M x . ε εc , vemos que M M εc |x| < ⇒ x <c⇒f M ε M x ≤ M ⇒ f (x) ≤ ε. ε Além disso, ε M M x+ − x 0 = f (0) = f M +ε M +ε ε M ε M ≤ f (x) + ·f − x . M +ε M +ε ε Simplificando, vem M · f (x) + ε · f (−M x/ε) ≥ 0, donde: f (x) ≥ ε ε · (−f (−M x/ε)) ≥ · (−M ) = −ε. M M Em resumo: |x| < cε/M ⇒ −ε ≤ f (x) ≤ ε, logo f é contı́nua no ponto 0. Seção 7 7 Exercı́cios 81 Exercı́cios Seção 1. Derivadas parciais 1. Um conjunto X ⊂ Rn chama-se i-convexo (1 ≤ i ≤ n) quando para quaisquer a, b ∈ X tais que b = a + tei , tem-se [a, b] ⊂ X. (Se X ⊂ R2 , diz-se então que X é horizontalmente convexo ou verticalmente convexo, conforme seja i = 1 ou i = 2.) Prove que se o aberto U ⊂ Rn é i-convexo e a função f : U → R ∂f (x) = 0 para todo x ∈ U então f não depende da i-ésima variável, cumpre ∂xi isto é, x, x + tei ∈ U ⇒ f (x + tei ) = f (x). 2. Sejam X = {(x, 0); x ≥ 0)} e U = R2 −X. Defina f : U → R pondo f (x, y) = x2 quando x > 0, y > 0 e f (x, y) = 0 quando x ≤ 0 ou y < 0. Mostre que se tem ∂f = 0 em todos os pontos de U mas f depende de y. ∂y 3. Diz-se que um caminho retilı́neo f : I → Rn é paralelo ao i-ésimo eixo quando ele é da forma f (t) = a+tei , t ∈ I. Se U ⊂ Rn é um aberto conexo, prove que dois pontos a, b ∈ U quaisquer podem ser ligados por um caminho poligonal contido em U , cujos trechos retilı́neos são paralelos aos eixos. Conclua que se ∂f (x) = 0 para todo x ∈ U e qualquer U ⊂ Rn é conexo e f : U → R cumpre ∂xi i com 1 ≤ i ≤ n, então f é constante. ∂f :U → R 4. Seja U ⊂ Rn aberto. Se f : U → R possui derivadas parciais ∂xi (i = 1, . . . , n) limitadas, prove que f é contı́nua. Seção 2. Funções de classe C 1 x2 y se (x, y) 6= (0, 0) e f (0, 0) = 0. + y2 ∂f Mostre que, para todo v = (α, β) ∈ R2 , existe a derivada direcional (0, 0) ∂v mas f não é diferenciável no ponto (0, 0). 2. Seja f : Rn → R uma função contı́nua que possui todas as derivadas direcionais ∂f (u) > 0 para todo u ∈ S n−1 , prove que existe em qualquer ponto de Rn . Se ∂u ∂f a ∈ Rn tal que (a) = 0, seja qual for v ∈ Rn . ∂v 3. Seja f : Rn → R diferenciável no ponto 0. Se f (tx) = t · f (x) para todo t > 0 e todo x ∈ Rn , prove que f é linear. Conclua que a função ϕ : R2 → R, dada por ϕ(x, y) = x3 /(x2 + y 2 ) se (x, y) 6= (0, 0) e ϕ(0, 0) = 0, não é diferenciável na origem. 4. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Prove que, dados a ∈ U e ε > 0, existe δ > 0 tal que x, y ∈ U , |x − a| < δ, |y − a| < δ ⇒ f (x) − f (y) = h grad f (a), x − yi + r(x, y), onde |r(x, y)| < ε|x − y|. 1. Seja f : R2 → R definida por f (x, y) = x2 Seção 3. O Teorema de Schwarz ∂2f é ∂x∂y 2 identicamente nula, prove que existem ϕ : I → R, ψ = J → R de classe C tais que f (x, y) = ϕ(x) + ψ(y) para todo (x, y) ∈ I × J. 1. Seja f : I × J → R de classe C 2 no retângulo aberto I × J ⊂ R2 . Se 82 Funções Reais de n Variáveis Cap. 3 2. Use o exercı́cio anterior para provar que se g : R × R → R é de classe C 2 , com ∂2g ∂2g = , então existem ϕ : R → R e ψ : R → R de classe C 2 , tais que 2 ∂x ∂y 2 g(x, y) = ϕ(x + y) + ψ(x − y) para todo (x, y). 3. Seja f : Rn → R de classe C 2 , tal que f (tx) = t2 ·f (x) para todo t > 0 e todo x ∈ n P Rn . Prove que existem aij ∈ R (i, j = 1, . . . , n) tais que f (x) = aij xi xj i,j=1 x4 + y 4 ? para todo x = (x1 , . . . , xn ) ∈ Rn . Como explicar f (x, y) = 2 x + y2 n+1 2 n 4. Sejam f, ϕ : U → R de classe C no aberto U ⊂ R . (Isto é, as funções∂ϕ (x)i = 0 coordenada de f e ϕ são de classe C 2 .) Suponha que hf (x), ∂xi para todo x ∈ U e todo i = 1, . . . , n. Prove que a matriz [aij (x)], onde ∂f ∂ϕ aij (x) = h (x), (x)i, é simétrica, seja qual for x ∈ U . ∂xi ∂xj Seção 4. A fórmula de Taylor 1. Seja r : U → R uma função de classe C k , definida num aberto U ⊂ Rn que contém a origem 0. Se r, juntamente com todas as suas derivadas parciais até r(v) as de ordem k, se anulam no ponto 0, prove que lim = 0. v→0 |v|k 2. Seja f : U → R de classe C 3 no aberto U ⊂ Rn , o qual contém a e a + v, com P ∂2f P ∂f ·αi , d2 f (a)·v 2 = ·αi ·αj v = (α1 , . . . , αn ). Escreva df (a)·v = i,j ∂xi ∂xj i ∂xi 3 P ∂ f ·αi ·αj ·αk , as derivadas parciais sendo calculadas e d3 f (a)·v 3 = ∂x ∂x i j ∂xk i,j,k no ponto x = a e os ı́ndices i, j, k variando de 1 a n. Ponha f (a + v) − f (a) = df (a) · v + 1 2 1 d f (a) · v 2 + d3 f (a) · v 3 + r3 (v) 2 3! r3 (v) = 0. |v|3 Estenda o resultado para funções de classe C k , 1 ≤ k < +∞. e prove que lim v→0 Seção 5. Pontos crı́ticos 1. Uma função f : U → R, de classe C 2 no aberto U ⊂ Rn , chama-se harmônica n P ∂2f quando (x) = 0 para todo x ∈ U . Prove que a matriz hessiana de i=1 ∂xi ∂xi uma função harmônica não pode ser definida (nem positiva nem negativa). 2. Seja f : U → R uma função arbitrária, definida num aberto U ⊂ Rn . Prove que o conjunto dos pontos de máximo (ou de mı́nimo) local estrito de f é enumerável. 3. Determine os pontos crı́ticos da função f : R2 → R, f (x, y) = cos(x2 + y 2 ). Idem para g(x, y) = x3 − y 3 − x + y. 4. Seja f : U → R diferenciável no aberto limitado U ⊂ Rn . Se, para todo a ∈ fr.U , tem-se lim f (x) = 0, prove que existe em U pelo menos um ponto crı́tico de f . x→a Seção 7 Exercı́cios 83 5. Determine os pontos crı́ticos da função f : R2 → R dada por f (x, y) = x2 + y 2 + (x2 − y 2 − 1)2 e calcule as matrizes hessianas correspondentes. 6. Dados a1 , . . . , ak em Rn , determine o ponto em que a função f : Rn → R, dada k P por f (x) = |x − ai |2 , assume o valor mı́nimo. i=1 Seção 6. Funções convexas 1. Seja A ⊂ Rn um conjunto convexo. Prove que a função f : Rn → R, definida por f (x) = d(x, A), é convexa. 2. Prove que todo ponto de mı́nimo local de uma função convexa é um ponto de mı́nimo global. Além disso, o conjunto dos pontos de mı́nimo é convexo. 3. Prove que uma função convexa, f : U → R, com U aberto, (mesmo nãodiferenciável) não possui pontos de máximo local estrito. 4. Prove que o conjunto dos pontos crı́ticos (todos necessariamente mı́nimos globais) de uma função convexa diferenciável é um conjunto convexo, no qual f é constante. 5. Se f : X → R é convexa, prove que, para todo c ∈ R, o conjunto dos pontos x ∈ X tais que f (x) ≤ c é convexo. Dê exemplo mostrando que a recı́proca é falsa. 6. Uma função f : X → R, definida num conjunto convexo X ⊂ Rn , chama-se quase-convexa quando, para todo c ∈ R, o conjunto Xc = {x ∈ X; f (x) ≤ c} é convexo. Prove que f é quase-convexa se, e somente se, f (1 − t)x + ty ≤ max{f (x), f (y)} para x, y ∈ X e t ∈ [0, 1] quaisquer. 4 Funções Implı́citas 1 Uma função implı́cita Os pontos de Rn+1 serão escritos sob a forma (x, y), onde temos x = (x1 , . . . , xn ) ∈ Rn e y ∈ R. O teorema abaixo dá significado preciso à afirmação de que “a equação f (x, y) = c define implicitamente y como função de x”e estabelece uma condição suficiente para que ela seja verdadeira. Teorema 1 (Teorema da Função Implı́cita). Dada a função f : U → R, de classe C k (k ≥ 1) no aberto U ⊂ Rn+1 , seja (x0 , y0 ) ∈ U tal que ∂f f (x0 , y0 ) = c e (x0 , y0 ) 6= 0. Existem uma bola B = B(x0 ; δ) ⊂ Rn e ∂y um intervalo J = (y0 − ε, y0 + ε) com as seguintes propriedades: ∂f ¯ 1) B × J¯ ⊂ U e (x, y) 6= 0 para todo (x, y) ∈ B × J; ∂y 2) Para todo x ∈ B existe um único y = ξ(x) ∈ J tal que f (x, y) = f (x, ξ(x)) = c. A função ξ : B → J, assim definida, é de classe C k e suas derivadas parciais em cada ponto x ∈ B são dadas por ∂f ∂ξ ∂x (x, ξ(x)) · (x) = − ∂fi ∂xi (x, ξ(x)) ∂y ∂f (x0 , y0 ) > 0. ∂y Pela continuidade de ∂f /∂y, existem δ > 0 e ε > 0 tais que, pondo Demonstração. Para fixar as idéias, admitiremos que Seção 1 Uma função implı́cita R U f −1 (c) 85 R J y0 f c f −1 (c) x0 Rn B Figura 4.1 B = B(x0 , δ) ⊂ Rn e J = (y0 − ε, y0 + ε) ⊂ R, temos B × J¯ ⊂ U e ∂f ¯ Então, para todo x ∈ B, a função (x, y) > 0 para todo (x, y) ∈ B × J. ∂y ¯ Como f (x0 , y0 ) = y 7→ f (x, y) é crescente no intervalo [y0 −ε, y0 +ε] = J. c, segue-se que f (x0 , y0 − ε) < c e f (x0 , y0 + ε) > c. Sendo f contı́nua, podemos supor δ tão pequeno que f (x, y0 − ε) < c e f (x, y0 + ε) > c para todo x ∈ B. Pelo Teorema do Valor Intermediário, para cada x ∈ B, existe um único y = ξ(x) ∈ J¯ tal que f (x, y) = c. Tem-se necessariamente y ∈ J. Mostremos que a função ξ : B → J possui derivadas parciais em todo ponto x ∈ B. Com efeito, pondo k = k(t) = ξ(x + tei ) − ξ(x), vem ξ(x + tei ) = ξ(x) + k, logo f (x + tei , ξ(x) + k) = f (x, ξ(x)) = c. Pelo Teorema do Valor Médio, para todo t existe θ = θ(t) ∈ (0, 1) tal que 0 = f (x + tei , ξ(x) + k) − f (x, ξ(x)) ∂f ∂f = (x + θtei , ξ(x) + θk) · t + (x + θtei , ξ(x) + θk) · k. ∂xi ∂y Logo ∂f k ξ(x + tei ) − ξ(x) ∂x (x + θtei , ξ(x) + θk) = = − ∂fi · t t (x + θtei , ξ(x) + θk) ∂y Neste ponto, admitamos a continuidade de ξ, que será provada abaixo. Então lim k(t) = 0. A continuidade das derivadas parciais de f nos dá t→0 então ∂f ξ(x + tei ) − ξ(x) ∂ξ ∂xi (x, ξ(x)) (x) = lim = − ∂f , (1 ≤ i ≤ n). t→0 ∂xi t (x, ξ(x)) ∂y 86 Funções Implı́citas Cap. 4 A expressão de ∂ξ/∂xi mostra que se f ∈ C k então ∂ξ/∂xi ∈ C k−1 para i = 1, . . . , n, portanto ξ ∈ C k . Demonstração da continuidade de ξ Pelo Teorema 19 do Capı́tulo 1 (v. observação que o segue), basta ¯ a imagem inversa mostrar que, para todo conjunto fechado F ⊂ J, −1 ξ (F ) é fechada em B. Ou seja: se a seqüência de pontos xk ∈ B é tal que ξ(xk ) ∈ F para todo k ∈ N e lim xk = x̄ ∈ B, então ξ(x̄) ∈ F . Ora, F é compacto, logo uma subseqüência de pontos x′k ∈ B é tal que lim ξ(x′k ) = a ∈ F . Logo f (x̄, a) = lim f (x′k , ξ(x′k )) = c. Mas f (x̄, ξ(x̄))=c. Pela unicidade de ξ(x) em J, segue-se que ξ(x̄)=a∈F . Considerando o aberto V = B × J ⊂ Rn+1 , o teorema acima diz que, nas condições das hipóteses, tem-se f −1 (c) ∩ V = {(x, ξ(x)) ∈ Rn+1 ; x ∈ B}. Noutras palavras, f −1 (c) ∩ V é o gráfico da função ξ : B → J. Observação. Evidentemente, não há nada de especial quanto à última coordenada, exceto simplificar a escrita na demonstração. Se, para al∂f gum inteiro i ∈ [1, n + 1], tivermos (z0 ) 6= 0 onde z0 ∈ U e f (z0 ) = c, ∂xi existirá um aberto V ∋ z0 , tal que, para z ∈ V , a equação f (z) = c definirá xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) como função das outras n coordenadas e f −1 (c) ∩ V será o gráfico dessa função ξ, de classe C k . De um modo geral, se grad f (z0 ) 6= 0 e f (z0 ) = c então existe V ∋ z0 aberto tal que f −1 (c) ∩ V é o gráfico de uma função real de n variáveis, de classe C k . Exemplo 1. Seja f : R2 → R definida por f (x, y) = x2 + y 2 . Para ∂f ∂f (x, y) = 2x e (x, y) = 2y. A equação todo (x, y) ∈ R2 , temos ∂x ∂y x2 + y 2 = c define o conjunto vazio quando c < 0. (O Teorema 1 não se aplica, pois não existe o ponto (x0 , y0 ) tal que f (x0 , y0 ) = c.) Quando c = 0, a equação x2 + y 2 = 0 é satisfeita apenas quando x = y = 0. ∂f ∂f (Agora existe (x0 , y0 ) mas (0, 0) = (0, 0) = 0.) Quando c > 0, a ∂x ∂y √ equação x2 +y 2 = c define a circunferência de centro na origem e raio c, a qual não é gráfico de função alguma do tipo y = ξ(x) nem x = ζ(y), pois há retas verticais e horizontais que a cortam em dois pontos. Mas, Seção 2 Hiperfı́cies 87 se considerarmos os abertos V1 = {(x, y) ∈ R2 ; y > 0}, V2 = {(x, y) ∈ R2 ; y < 0}, V3 = {(x, y) ∈ R2 ; x > 0}, V4 = {(x, y) ∈ R2 ; x < 0}, veremos que f −1 (c) ∩ V1 e f −1 (c) ∩ √ V2 são gráficos das √funções ξ1 , ξ2 : (−1, 1) → R, dadas por ξ1 (x) = c − x2 , ξ2 (x) = − c − x2 , −1 (c) ∩ V são os gráficos de ξ , ξ : (−1, 1) → R, enquanto f −1 (c) ∩ Vp 3 ef 4 3 4 p dadas por ξ3 (y) = c − y 2 e ξ4 (y) = − c − y 2 . Assim, em V1 e V2 a equação x2 + y 2 = c (com c > 0) define implicitamente y como função de x enquanto em V3 e V4 define x como função de y. Evidentemente, √ √ salvo na vizinhança dos 4 pontos (± c, 0), (0, ± c), tem-se a opção de tomar y como função de x ou x como função de y. 2 Hiperfı́cies Um conjunto M ⊂ Rn+1 chama-se uma hiperfı́cie de classe C k quando é localmente o gráfico de uma função real de n variáveis de classe C k . Mais precisamente, para cada p ∈ M deve existir um aberto V ⊂ Rn+1 e uma função ξ : U → R, de classe C k num aberto U ⊂ Rn , tais que p ∈ V e V ∩ M = gráfico de ξ. A afirmação “V ∩ M = gráfico de ξ”significa que, para um certo inteiro i ∈ [1, n], tem-se V ∩ M = {(x1 , . . . , xn+1 ) ∈ Rn+1 ; xi = ξ(x1 , . . . , x bi , . . . , xn+1 )}, onde x bi significa “omitir xi ”. Evidentemente, dada qualquer função f : U → R de classe C k no aberto U ⊂ Rn , seu gráfico é uma hiperfı́cie M = {(x, f (x)) ∈ Rn+1 ; x ∈ U } de classe C k . Quando n = 1, uma hiperfı́cie em R2 chama-se uma curva e, quando n = 2, tem-se uma superfı́cie em R3 . Exemplo 2. A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é uma hiperfı́cie C ∞ em Rn+1 . Com efeito, chamando de U a bola aberta de centro 0 e raio 1 em Rn , pondo, para cada i = 1, . . . , n + 1, Vi = {x ∈ Rn+1 ; xi > 0}, Wi = {x ∈ Rn+1 ; xi < 0} e escrevendo x∗ = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ), temos: p x ∈ S n ∩ Vi ⇔ |x∗ | < 1 e xi = 1 − hx∗ , x∗ i; p x ∈ S n ∩ Wi ⇔ |x∗ | < 1 e xi = − 1 − hx∗ , x∗ i. 88 Funções Implı́citas Cap. 4 Logo, considerando a função ξ : U → R, de classe C ∞ , definida por p ξ(u) = 1 − hu, ui, vemos que, para cada i = 1, . . . , n + 1, S n ∩ Vi é o gráfico da função xi = ξ(x∗ ) enquanto que S n ∩ Wi é o gráfico de xi = −ξ(x∗ ). Como todo ponto p ∈ S n pertence a algum Vi ou a algum Wi , concluı́mos que S n é uma hiperfı́cie de classe C ∞ em Rn+1 . ⊳ Seja M ⊂ Rn+1 uma hiperfı́cie de classe C k (k ≥ 1). A cada ponto p ∈ M associaremos o conjunto Tp M , formado por todos os vetoresvelocidade v = λ′ (0) dos caminhos λ : (−δ, δ) → M que são diferenciáveis no ponto 0 e cumprem a condição λ(0) = p. O conjunto Tp M é chamado o espaço vetorial tangente de M no ponto p. Esta denominação se justifica pelo Teorema 2. Tp M é um subespaço vetorial de dimensão n em Rn+1 . Na demonstração abaixo, para simplificar a escrita, escrevemos em último lugar a coordenada do ponto de V ∩ M que é função das outras. Demonstração. Seja ξ : U → R uma função de classe C k no aberto U ⊂ Rn , cujo gráfico, formado pelos pontos (x, ξ(x)) ∈ Rn+1 , x ∈ U , é a interseção M ∩ V , onde V ⊂ Rn+1 é um aberto que contém p = (p0 , ξ(p0 )), p0 ∈ U . Para todo caminho λ : (−δ, δ) → M , com λ(0) = p, tem-se λ(t) = (x1 (t), , . . . , xn (t), ξ(x(t)), onde x(t) = (x1 (t), . . . , xn (t)). Portanto n dx dxn X ∂ξ dxi 1 λ′ (0) = ,..., , · , dt dt ∂xi dt i=1 as derivadas dxi /dt sendo calculadas no ponto t = 0 e ∂ξ/∂xi no ponto p0 . Isto mostra que todo v = λ′ (0) em Tp M é uma combinação linear dos vetores v1 = (1, 0, . . . , 0, ∂ξ/∂x1 ), . . . , vn = (0, . . . , 0, 1, ∂ξ/∂xn ). (Derivadas no ponto p0 .) Reciprocamente, toda combinação linear n P αi vi é o vetor-velocidade λ′ (0) do caminho λ : (−δ, δ) → M v = i=1 assim definido: tomamos v0 = (α1 , . . . , αn ) ∈ Rn e pomos λ(t) = (p0 + tv0 , ξ(p0 + tv0 )), sendo δ > 0 escolhido de modo que o segmento de reta (p0 − δv0 , p0 + δv0 ) esteja contido em U . Observação. Como subespaço vetorial de Rn+1 , o espaço vetorial tangente Tp M contém a origem 0 ∈ Rn+1 e não contém necessariamente o ponto p, embora nas figuras ele apareça passando por p. Nas ilustrações, o que se vê é a variedade afim p + Tp M , paralela a Tp M por p. Seção 2 Hiperfı́cies 89 Exemplo 3. O espaço vetorial tangente Tp S n é, para todo p ∈ S n , o complemento ortogonal de p, isto é, o conjunto [p]⊥ de todos os vetores v ∈ Rn+1 tais que hv, pi = 0. Com efeito, sendo Tp S n e [p]⊥ ambos subespaços vetoriais de dimensão n em Rn+1 , para mostrar que eles coincidem, basta provar que Tp S n ⊂ [p]⊥ . Ora, se v ∈ Tp S n então v = λ′ (0), onde λ : (−δ, δ) → S n é um caminho diferenciável no ponto 0, d com λ(0) = p. Neste caso, 0 = hλ(t), λ(t)i = 2hλ′ (0), λ(0)i = 2hv, pi. dt ⊳ p S n Tp S n Figura 4.2 A seguir, apresentaremos um critério bastante útil para dar exemplos de hiperfı́cies. Um número c ∈ R chama-se um valor regular de uma função f : U → R, de classe C 1 , quando não há pontos crı́ticos de f no nı́vel c, isto é, quando f (x) = c ⇒ grad f (x) 6= 0. Diz-se também que c é um nı́vel regular de f . Quando existe x ∈ U tal que f (x) = c e grad f (x) = 0, diz-se que c é um nı́vel crı́tico de f . Teorema 3. Se c é um valor regular da função f : U → R, de classe C k no aberto U ⊂ Rn+1 , então M = f −1 (c) é uma hiperfı́cie de classe C k , cujo espaço vetorial tangente Tp M é, em cada ponto p ∈ M , o complemento ortogonal de grad f (p). Demonstração. O fato de que f −1 (c) é uma hiperfı́cie é apenas uma reformulação verbal do Teorema da Função Implı́cita. (Ver comentário após a prova do Teorema 1.) Quanto ao espaço vetorial tangente Tp M , como M é uma superfı́cie de nı́vel da função f , vemos que todo vetor v ∈ Tp M é ortogonal a grad f (p), logo Tp M ⊂ [grad f (p)]⊥ . Sendo ambos subespaços de dimensão n em Rn+1 , conclui-se que Tp M = [grad f (p)]⊥ . 90 Funções Implı́citas Cap. 4 Exemplo 4. (Mais uma vez a esfera). À luz do Teorema 3, a esfera unitária S n é a superfı́cie de nı́vel 1 da função f : Rn+1 → R, dada por f (x) = hx, xi. Como grad f (x) = 2x, vemos que zero é o único nı́vel crı́tico de f . Em particular, 1 é valor regular, S n = f −1 (1) é uma hiperfı́cie C ∞ e, para todo p ∈ S n , tem-se Tp S n = [grad f (p)]⊥ = [p]⊥ . ⊳ Exemplo 5. Seja A : Rn → Rn um operador linear auto-adjunto. A função f : Rn → R, definida por f (x) = hA · x, xi é o que se chama uma forma quadrática. Se [aij ] é a matriz (simétrica) de A na base n n P P aij xj e aij xi xj . Logo ∂f /∂xi = 2 canônica de Rn então f (x) = i,j=1 j=1 conseqüentemente grad f (x) = 2A · x. Supondo agora que o operador A seja invertı́vel, o único ponto crı́tico da função f é a origem 0, onde f assume o valor zero. Então, para todo c 6= 0, a equação f (x) = c define uma hiperfı́cie. Costuma-se tomar c = 1 e a hiperfı́cie definida pela n P aij xi xj = 1, chama-se uma quádrica. equação f (x) = 1, ou seja, i,j=1 Em particular, se o operador A é positivo, isto é, se f (x) > 0 para todo x 6= 0, a quádrica f −1 (1) chama-se um elipsóide. ⊳ 2 Exemplo 6. Seja f : Rn → R a função que associa a cada matriz x) = det x . O x = [xij ] de n linhas e n colunas seu determinante f (x desenvolvimento de Laplace relativo à i-ésima linha é x) = f (x n X k=1 (−1)i+k xik · Xik , onde o ik-ésimo menor Xik é o determinante da matriz (n − 1) × (n − 1) que se obtém de x omitindo a i-ésima linha e a k-ésima coluna. Segue∂f x) = (−1)i+j Xij . Em particular, se x = I = matriz se daı́ que (x ∂xij ∂f identidade n × n, temos (II ) = δij (delta de Kronecker , igual a ∂xij 1 quando i = j e 0 quando i 6= j). Portanto grad f (II ) = I . Seja 2 U ⊂ Rn o conjunto aberto formado pelas matrizes (invertı́veis) x tais que det x 6= 0. Para toda x ∈ U , o desenvolvimento de Laplace nos x) 6= 0. Portanto a mostra que algum menor Xij é 6= 0, logo grad f (x função f : U → R não possui pontos crı́ticos: todo número real c é um valor regular de f . Logo M = f −1 (1) = conjunto das matrizes reais n×n Seção 3 Multiplicador de Lagrange 91 com determinante 1 é uma hiperfı́cie C ∞ . M é um grupo em relação à multiplicação de matrizes, conhecido como o grupo unimodular . O espaço vetorial TI (M ), tangente a M na matriz identidade I , é formado pelas matrizes x que são perpendiculares (em termos do produto interno 2 de Rn ) ao gradiente grad f (II ) = I . Ora, x, I i = hx n X xij δij = i,j=1 n X xii = traço de x . i=1 Assim, o espaço vetorial tangente a M no ponto I é o conjunto das matrizes de traço nulo. ⊳ Observação. O Teorema 3 é uma boa fonte de exemplos de hiperfı́cies. Mas nem toda hiperfı́cie M ⊂ Rn+1 pode ser obtida como imagem inversa M = f −1 (c) do valor regular c de uma função f : U → R. Com efeito, as hiperfı́cies desse tipo admitem um campo contı́nuo de vetores não-nulos v = grad f : M → Rn+1 , tais que, para todo x ∈ M , hv(x), wi = 0 qualquer que seja w ∈ Tx M . (Diz-se então que v = grad f é um campo de vetores normais a M .) Tais hiperfı́cies são chamadas de orientáveis. Esta noção será retomada, mais amplamente, no Cap. 7. Um exemplo bem conhecido de superfı́cie não-orientável é a faixa de Moebius. Logo, a faixa de Moebius não é imagem inversa de um valor regular de uma função de classe C 1 definida num aberto de R3 . 3 Multiplicador de Lagrange O método de multiplicador de Lagrange se aplica na seguinte situação: tem-se uma função f : U → R, de classe C 1 no aberto U ⊂ Rn+1 (funçãoobjetivo), uma hiperfı́cie M = ϕ−1 (c), imagem inversa do valor regular c da função ϕ : U → R, de classe C 1 , e procura-se determinar quais são os pontos crı́ticos da restrição f |M , ou seja, os pontos crı́ticos x de f sujeitos à condição ϕ(x) = c. Não se trata de determinar os pontos crı́ticos de f : U → R que estão localizados sobre a hiperfı́cie M mas sim os pontos crı́ticos da função f |M : M → R. É preciso definir o que se entende por isto. Um ponto x ∈ M chama-se um ponto crı́tico da restrição f |M quando, para todo caminho diferenciável λ : (−δ, δ) → M com λ(0) = x tem-se (f ◦ λ)′ (0) = 0. Pondo v = λ′ (0), esta condição significa h grad f (x), vi = 0. Como v é um vetor arbitrário pertencente ao espaço 92 Funções Implı́citas Cap. 4 vetorial tangente Tx M , vemos que x ∈ M é um ponto crı́tico de f |M se, e somente se, grad f (x) é ortogonal ao espaço vetorial tangente Tx M . Ora, grad ϕ(x) é um vetor (não-nulo) ortogonal a Tx M . Como o complemento ortogonal de Tx M em Rn+1 tem dimensão 1, segue-se que grad f (x) ⊥ Tx M se, e somente se, grad f (x) é um múltiplo de grad ϕ(x). Portanto, podemos enunciar: O ponto x ∈ U é um ponto crı́tico da restrição f |M de f à hiperfı́cie M = ϕ−1 (c) se, e somente se: 1) ϕ(x) = c; 2) grad f (x) = λ · grad ϕ(x) para algum λ ∈ R. As condições acima representam um sistema de n+2 equações (pois a igualdade vetorial 2) acima significa n+1 igualdades numéricas) nas n+2 incógnitas x1 , . . . , xn+1 (coordenadas de x) e λ. O fator λ é chamado o multiplicador de Lagrange. Sua presença torna o número de incógnitas igual ao número de equações, o que viabiliza a solução na prática. Deve-se notar que se x ∈ M é um ponto de mı́nimo ou de máximo local de f |M então, para todo caminho diferenciável λ : (−δ, δ) → M com λ(0) = x, a função f ◦ λ : (−δ, δ) → R tem um mı́nimo ou um máximo local no ponto 0, logo (f ◦ λ)′ (0) = 0. Portanto os mı́nimos e máximos locais de f |M estão incluı́dos na definição de ponto crı́tico dada acima. É também evidente que todo ponto crı́tico x ∈ M da função f : U → R é, com maior razão, ponto crı́tico da restrição f |M pois, sendo grad f (x) =0, tem-se h grad f (x), vi = 0 para todo v ∈ Rn+1 . Muitas vezes, a condição adicional ϕ(x) = c é posta sob a forma ϕ(x) = 0. Isto não representa perda de generalidade. Basta usar, em vez de ϕ, a função ψ(x) = ϕ(x) − c. Então ψ(x) = 0 ⇔ ϕ(x) = c e c é valor regular de ϕ se, e somente se, 0 é valor regular de ψ. Exemplo 7. Seja f : R2 → R definida por f (x, y) = ax + by, com a2 + b2 6= 0. O gradiente de f é, em todo ponto (x, y), o vetor constante não-nulo v = (a, b), ortogonal às linhas de nı́vel ax + by = c, que são retas, duas a duas paralelas. A função f não tem pontos crı́ticos. Mas se ϕ : R2 → R for dada por ϕ(x, y) = x2 + y 2 então grad ϕ(x, y) = (2x, 2y), 1 é valor regular de ϕ e M = ϕ−1 (1) é a circunferência unitária x2 +y 2 = 1. Como M é compacta, a restrição f |M possui pelo menos dois pontos crı́ticos, nos quais assume seus valores mı́nimo e máximo. Os pontos Seção 3 Multiplicador de Lagrange 93 crı́ticos de f |M são as soluções (x, y) do sistema grad f (x, y) = λ · grad ϕ(x, y), ϕ(x, y) = 1, ou seja: 2λx = a, 2λy = b, x2 + y 2 = 1. grad f (x, y) grad f (−x, −y) Figura 4.3 Portanto (x, y) é um ponto crı́tico de f |M se, e somente se, o vetor unitário z = (x, y) é um múltiplo do vetor v = (a, b). Isto nos dá a −a b −b √ √ √ √ (x, y) = , , ou (x, y) = . a2 + b2 a2 + b2 a2 + b2 a2 + b2 Estes são os pontos nos quais f (x, y) assume seus valores máximo e mı́nimo em M = S 1 . ⊳ Seja f : Rn → R uma forma quadrática. Para todo n P aij xi xj , onde a = [aij ] é uma max = (x1 , . . . , xn ), tem-se f (x) = Exemplo 8. i,j=1 triz simétrica n × n. Alternativamente, tem-se f (x) = hAx, xi, onde A : Rn → Rn é o operador linear auto-adjunto cuja matriz na base canônica de Rn é a . Quais são os pontos crı́ticos da restrição f |S n−1 , onde S n−1 é a esfera unitária de Rn ? Temos S n−1 = ϕ−1 (1), onde ϕ : Rn → R é definida por ϕ(x) = hx, xi e, como grad ϕ(x) = 2x, 1 n P ∂f é valor regular de ϕ. Por sua vez, aij xj , portanto (x) = 2 · ∂xi j=1 grad f (x) = 2A · x. Portanto os pontos crı́ticos da restrição f |S n−1 são 94 Funções Implı́citas Cap. 4 as soluções do sistema Ax = λx, hx, xi = 1, isto é, são os autovetores do operador A que têm comprimento 1. Como S n−1 é compacta, f admite pelo menos 2 pontos crı́ticos em S n−1 , a saber, os pontos em que assume seus valores mı́nimo e máximo. Isto fornece uma prova de que todo operador auto-adjunto em Rn possui autovetores, o que é o passo fundamental para a demonstração do Teorema Espectral. ⊳ Exemplo 9. Seja U ⊂ Rn o conjunto dos pontos cujas coordenadas são positivas. Consideremos as funções f, ϕ : U → R definidas, para todo x = (x1 , . . . , xn ) ∈ U , como f (x) = x1 · x2 · · · xn e ϕ(x) = x1 + x2 + · · · + xn . Fixando s > 0, procuremos os pontos crı́ticos de f |M onde M = ϕ−1 (s). Observemos que grad ϕ(x) = (1, 1, . . . , 1) para qualquer x ∈ U , de modo que M Q é uma hiperfı́cie. Por sua vez, temos grad f (x) = xj . Assim, x ∈ M é ponto crı́tico de f |M se, (α1 , . . . , αn ) com αi = j6=i Q xj = λ (i = 1, . . . , n). Dividindo e somente se, para algum λ, tem-se j6=i a i-ésima dessas equações pela k-ésima, obtemos xk /xi = 1. Assim, o único ponto crı́tico de f |M é aquele que tem suas coordenadas iguais, ou seja, é p = (s/n, s/n, . . . , s/n). Afirmamos que f (p) = (s/n)n é o maior valor de f |M . Com efeito, a fórmula de f define uma função contı́nua no compacto M̄ , onde possui um ponto de máximo, o qual não pode estar em M̄ − M pois x1 · x2 · · · xn = 0 se x ∈ M̄ − M . Logo esse máximo está em M , portanto é um ponto crı́tico, mas p é o único ponto crı́tico de f |M . Conclusão: quando n números positivos têm soma constante s, seu produto é máximo, igual a (s/n)n , quando eles são iguais. Ou ainda, se x1 , . . . , xn são positivos então x1 · x2 · · · xn ≤ x1 + x2 + · · · + xn n n . A desigualdade acima, posta sob a forma √ n x1 · x2 · · · xn ≤ x1 + x2 + · · · + xn , n diz que a média geométrica de números positivos é menor do que ou igual à média aritmética. Além disso, elas coincidem somente quando os números dados são iguais. ⊳ Seção 3 Multiplicador de Lagrange 95 a M p Figura 4.4 Exemplo 10. Dadas a função f : U → R, de classe C k no aberto U ⊂ Rn+1 , e a hiperfı́cie M ⊂ U , os pontos crı́ticos da restrição f |M são os pontos x ∈ M para os quais grad f (x) é ortogonal ao espaço vetorial tangente Tx M , mesmo quando M não é obtida como imagem inversa ϕ−1 (c) de um valor regular de uma função ϕ : U → R de classe C k . Isto ficou claro na discussão feita no inı́cio desta seção. Como exemplo, consideremos uma hiperfı́cie M ⊂ Rn+1 , um ponto a ∈ Rn+1 não pertencente a M e indaguemos quais são os pontos p ∈ M situados à distância mı́nima de a. Trata-se de obter os pontos que tornam mı́nima a restrição f |M , onde f : U → R, dada por f (x) = |x − a|, tem U p =P Rn+1 − {a} por domı́nio, por isso é de classe C ∞ . Temos (xi − ai )2 , logo ∂f /∂xi = (xi − ai )/|x − a| e daı́ grad f (x) = f (x) = (x − a)/|x − a|. Assim, os pontos crı́ticos de f , entre os quais estão os pontos de M situados à distância mı́nima de a, são os pontos x ∈ M tais que x − a é um vetor normal a M no ponto x, isto é, hx − a, vi = 0 para todo v ∈ Tx M . Em particular, se M = S n , x − a ⊥ Tx S n significa x − a = α · x isto é, x = a/(1 − α). Portanto, neste caso, os únicos pontos crı́ticos de f |S n são os pontos x ∈ S n pertencentes à reta 0a, os quais são ±a/|a|. Um deles minimiza |x − a| e o outro maximiza f . ⊳ Observação. Os pontos crı́ticos da restrição f |M da função f : U → R à hiperfı́cie ϕ−1 (0), onde ϕ : U → R tem 0 como valor regular, são, como vimos, as soluções x do sistema de equações grad f (x) = λ · grad ϕ(x), ϕ(x) = 0. Se considerarmos a função L : U × R → R, definida por L(x, λ) = f (x) − λϕ(x), veremos que grad L(x, λ) = grad f (x) − λ grad ϕ(x) − ϕ(x), portanto os pontos crı́ticos da restrição f |M são simplesmente os pontos crı́ticos (livres) da função L que pertençam a M . A função L é chamada a Lagrangiana do problema. 96 4 Funções Impı́citas Cap. 4 Exercı́cios Seção 1. Uma função implı́cita 1. Seja f : R2 → R de classe C k (k ≥ 1). Suponha que existam um ponto ∂f (x0 , y0 ) ∈ R2 e uma constante M tais que f (x0 , y0 ) = 0, (x, y) 6= 0 e ∂y ∂f ∂f (x, y) (x, y) ≤ M para todo (x, y) ∈ R2 . Prove que, para todo x ∈ R, ∂x ∂y existe um único y = ξ(x) ∈ R tal que f (x, ξ(x)) = 0 e que a função ξ : R → R, assim definida, é de classe C k . 2. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Se f não possui pontos crı́ticos, prove que a imagem f (A) de todo aberto A ⊂ U é um conjunto aberto em R. 3. Seja f : R3 → R dada por f (x, y, z) = x4 + 2x · cos y + sen z. Prove que, numa vizinhança de 0, a equação f (x, y, z) = 0 define z como função de classe C ∞ ∂z ∂z das variáveis x, y. Calcule e · ∂x ∂y 4. Seja f : R × [0, 1) → R a função contı́nua definida por f (x, y) = (x2 + y 2 ) · (ye|x| − 1). Prove que, para cada x ∈ R, existe um único y = ξ(x) ∈ [0, 1) tal que f (x, ξ(x)) = 0 mas a função ξ : R → [0, 1) não é contı́nua. 5. Sejam f, g : Rn → R tais que, para todo x ∈ Rn , vale g(x) = f (x)(1 + f (x)4 ). Se g ∈ C k , k ≥ 1, prove que f também é de classe C k . Seção 2. Hiperfı́cies 2 1. Prove que o conjunto M ⊂ Rn das matrizes n × n de posto n − 1 é uma hiperfı́cie orientável. Determine Tp M , onde p é a matriz n × n cujos elementos são todos nulos exceto os n − 1 primeiros da diagonal, que são iguais a 1. p 2 x2 + y 2 −2 = 1 2. Prove que o conjunto dos pontos (x, y, z) ∈ R3 tais que z 2 + ∞ é uma superfı́cie C . Que forma tem essa superfı́cie? 3. Prove que toda hiperfı́cie M ⊂ Rn+1 é localmente orientável no seguinte sentido: cada ponto p ∈ M possui uma vizinhança V em M na qual está definido um campo contı́nuo v : V → Rn+1 de vetores não-nulos normais a M (ou seja v(x) ⊥ Tx M para todo x ∈ V ). Seção 3. Multiplicadores de Lagrange 1. Seja hAx, xi = 1 a equação de um elipsóide M em Rn+1 . Prove que a maior √ distância de um ponto de M à origem é 1/ µ, onde µ é o menor autovalor do operador positivo A. Ela é atingida num ponto x ∈ M que é autovetor de A, correspondente ao autovalor µ. 2. Seja H o hiperplano de Rn+1 definido pela equação hb, xi = c. Use o método do multiplicador de Lagrange para mostrar que o ponto H mais próximo do c − hb, ai ponto a ∈ Rn+1 é x = a + · b. |b|2 3. Determine os pontos crı́ticos da função f : R2n → R, dada por f (x, y) = hx, yi, restrita à esfera unitária |x|2 + |y|2 = 1, e conclua daı́ a desigualdade de Schwarz. Seção 4 Exercı́cios 2 97 2 n 4. Seja M (n × n) = Rn . Prove que P o2máximo da função f : R → R, dada por x) = det x , restrita à esfera f (x xij = n, é atingido numa matriz ortogonal, i,j logo é igual a 1. Notando que, se as linhas de x são v1 , . . . , vn então x = |v1 | . . . |vn | · w onde todas as linhas de w têm comprimento 1, conclua daı́ a desigualdade de Hadamard: | det x | ≤ |v1 | . . . |vn |. 5. Prove que o menor valor da soma s = x1 + · · · + xn de n números positivos cujo produto p = x1 · x2 · x2 · · · xn é constante é atingido quando esses números √ são iguais, logo valem n p. 5 Aplicações Diferenciáveis 1 A derivada como transformação linear Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se diferenciável no ponto a ∈ U quando cada uma das suas funções-coordenada f1 , . . . , fn : U → R é diferenciável nesse ponto. Se este é o caso então, para todo v = (α1 . . . , αm ) tal que a + v ∈ U e para cada i = 1, . . . , n, tem-se m X ∂fi ri (v) (a) · αj + ri (v) com lim = 0. v→0 |v| ∂xj j=1 ∂fi (a) ∈ M (n × m) chama-se a matriz jacobiA matriz Jf (a) = ∂xj ana de f no ponto a. A transformação linear f ′ (a) : Rm → Rn , cuja matriz em relação às bases canônicas de Rm e Rn é Jf (a), chama-se a derivada da aplicação f no ponto a. De acordo com a definição de matriz de uma transformação linear, para todo v = (α1 , . . . , αm ) ∈ Rm temos fi (a + v) − fi (a) = m X ∂fi ∂fi f (a) · v = (β1 , . . . , βn ) onde βi = (a) · αj = (a). ∂xj ∂v ′ j=1 Assim, se definirmos, como é natural, a derivada direcional da aplicação f , no ponto a, na direção do vetor v, como f (a + tv) − f (a) ∂f (a) = lim , t→0 ∂v t Seção 1 A derivada como transformação linear 99 temos imediatamente ∂f (a) = ∂v ∂f1 ∂fn (a), . . . , (a) = f ′ (a) · v. ∂v ∂v Resulta da Regra da Cadeia para funções (Teorema 2 do Capı́tulo 3), em conformidade com a observação feita logo após sua demonstração, ∂f ∂f (a) tenha sido dada acima como (a) = que embora a definição de ∂v ∂v ∂f (f ◦λ)′ (0), onde λ(t) = a+tv, vale, mais geralmente, a igualdade (a) = ∂v ′ (f ◦ λ) (0) para qualquer caminho diferenciável λ : (−δ, δ) → U , com λ(0) = a e λ′ (0) = v. As n igualdades numéricas que exprimem a diferenciabilidade das funções-coordenada fi se resumem na igualdade abaixo, entre vetores de Rn : f (a + v) − f (a) = f ′ (a) · v + r(v), com lim v→0 r(v) = 0. |v| Algumas vezes, é mais conveniente escrever esta condição sob a forma f (a + v) − f (a) = f ′ (a) · v + ρ(v) · |v| com lim ρ(v) = 0. v→0 Aqui, ρ(v) = r(v)/|v| para todo v 6= 0 tal que a + v ∈ U . A relação acima caracteriza univocamente a derivada da aplicação f no sentido seguinte: se uma transformação linear T : Rm → Rn é tal que, para a, a + v ∈ U tem-se f (a + v) − f (a) = T · v + r(v), com lim v→0 r(v) = 0, |v| então T = f ′ (a). Com efeito, daı́ resulta, tomando tv em vez de v, que: f (a + tv) − f (a) r(tv) =T ·v± · |v|, t |tv| logo ∂f [f (a + tv) − f (a)] = (a) = f ′ (a) · v. t→0 t ∂v Quando f : U → Rn é diferenciável em todos os pontos de U , dizemos que f é diferenciável em U . Neste caso, fica definida uma aplicação f ′ : U → T · v = lim 100 Aplicações Diferenciáveis Cap. 5 L(Rm ; Rn ) que faz corresponder a cada x ∈ U a transformação linear f ′ (x) : Rm → Rn . Quando for conveniente, identificaremos o conjunto L(Rm ; Rn ) das transformações lineares de Rm em Rn com o conjunto M (n × m) das matrizes n × m ou com o espaço Rnm . Dizer que a aplicação derivada f ′ : U → L(Rm ; Rn ) (ou seja f ′ : U → nm R ) é contı́nua equivale a afirmar a continuidade de cada uma de suas nm funções-coordenada ∂fi /∂xj : U → R, isto é, a dizer que f é uma aplicação de classe C 1 conforme a definição dada no Capı́tulo 3. Como foi demonstrado no Teorema 1 daquele capı́tulo, a continuidade das derivadas parciais ∂fi /∂xj : U → R implica a diferenciabilidade de f . Como no caso de funções, aplicações f : U → Rn de classe C k são definidas por indução: diz-se que f ∈ C k quando f é diferenciável e sua derivada f ′ : U → Rnm é de classe C k−1 . Se f ∈ C k para todo k ∈ N diz-se que f é de classe C ∞ : f ∈ C ∞ . Então f ′ ∈ C ∞ também. Observação. Na maioria das vezes, a maneira mais simples de verificar que uma aplicação f é diferenciável consiste em calcular diretamente as ∂fi derivadas parciais (x), mostrar que elas dependem continuamente de ∂xj x e usar o Teorema 1 do Capı́tulo 3, segundo o qual toda função de classe C 1 é diferenciável. Praticamente todas as aplicações diferenciáveis são de classe C 1 . Ocorre, entretanto, que as propriedades mais relevantes das aplicações C 1 resultam da relação que caracteriza sua diferenciabilidade. Daı́ a importância deste conceito. 2 Exemplos de derivadas Exemplo 1. Sejam I ⊂ R um intervalo aberto e f : I → Rn um caminho diferenciável no ponto a ∈ I. Considerando f como uma aplicação, sua derivada no ponto a é a transformação linear f ′ (a) : R → Rn cuja matriz jacobiana tem por única coluna o vetor df1 dfn v= (a), . . . , (a) , dt dt a qual vem a ser o vetor-velocidade do caminho f no ponto a, já indicado com a mesma notação f ′ (a) no Capı́tulo 2. Como transformação linear, f ′ (a) : R → Rn faz corresponder a cada “vetor”t ∈ R o vetor t · v ∈ Rn . Noutros termos: f ′ (a) · t = t · f ′ (a). ⊳ Seção 2 Exemplos de derivadas 101 Exemplo 2. Seja f : U → R uma função definida no aberto U ⊂ Rm , diferenciável no ponto a ∈ U . Sua derivada é uma transformação linear f ′ (a) : Rm → R, portanto um funcional linear, que associa a cada vetor v = (α1 , α2 , . . . , αm ) ∈ Rm o número f ′ (a) · v = ∂f ∂f ∂f (a) · α1 + · · · + (a) · αm = (a) = h grad f (a), vi. ∂x1 ∂xm ∂v Às vezes se escreve df (a) e chama-se diferencial de f à derivada f ′ (a). Em particular, se usarmos a notação tradicional xi : Rm → R para indicar a função que associa a cada ponto x ∈ Rm sua i-ésima coordenada xi , a diferencial dxi desta função é o funcional linear que faz corresponder a cada vetor v = (α1 , . . . , αm ) sua i-ésima coordenada dxi · v = αi . (Mesmo porque, sendo linear, a função xi tem derivada constante, igual a si própria. Vide Exemplo 4, abaixo.) Então df (a) · v = m m X X ∂f ∂f (a) · αi = (a) · dxi · v. ∂xi ∂xi i=1 i=1 Isto atribui um significado à expressão clássica m X ∂f dxi . df = ∂xi ⊳ i=1 Exemplo 3. Se f : U → Rn é constante então f ′ (x) = 0 para todo x ∈ U . Reciprocamente, se o aberto U ⊂ Rm é conexo e f : U → Rn possui derivada 0 em todos os pontos x ∈ U então f é constante. (Conforme o Corolário 5 do Teorema 2, Capı́tulo 3.) Exemplo 4. Se T : Rm → Rn é uma transformação linear então T é diferenciável e T ′ (x) = T para todo x ∈ Rm . Noutras palavras, T ′ (x) · v = T · v quaisquer que sejam x, v ∈ Rm . Isto resulta imediatamente da igualdade T (x + v) − T · x = T · v + r, onde r = 0, ou então do fato óbvio de que a matriz jacobiana de T é a própria matriz de T . Um caso muito particular: a soma S : Rm × Rm → Rm , S(x, y) = x + y é linear, logo S ′ (x, y) · (u, v) = u + v quaisquer que sejam x, y, u, v ∈ Rm . Exemplo 5. Seja B : Rm × Rn → Rp uma aplicação bilinear, isto é, linear em cada uma de suas duas variáveis. Se escrevermos, para cada 102 Aplicações Diferenciáveis Cap. 5 par de vetores (ei , ej ) das bases canônicas de Rm e Rn respectivamente, B(ei , ej ) = vij , então, para x = (x1 , . . . , xm ) e y = (y1 , . . . , yn ) teremos X B(x, y) = xi yj vij . i,j Isto mostra que B é contı́nua, logo assume seu valor máximo |B| no compacto S m−1 × S n−1 . Daı́ resulta que, para quaisquer x ∈ Rm e y ∈ Rn não-nulos, vale |B(x, y)| = |B(x/|x|, y/|y|)| · |x| · |y| ≤ |B| · |x| · |y|. Para x = 0 ou y = 0, a desigualdade |B(x, y)| ≤ |B| · |x| · |y| é imediata pois B(0, y) = B(x, 0) = 0. Mostremos agora que toda aplicação bilinear B é diferenciável, com B ′ (x, y) · (u, v) = B(u, y) + B(x, v). Com efeito, se x, u ∈ Rm e y, v ∈ Rn , temos pela bilinearidade de B: B(x + u, y + v) − B(x, y) = B(u, y) + B(x, v) + B(u, v). p Observando que |(u, v)| = |u|2 + |v|2 ≥ |v|, temos logo lim u,v→0 |B(u, v)| |B| · |u| · |v| ≤ |B| |u|, ≤p |(u, v)| |u|2 + |v|2 B(u, v) = 0, comprovando assim a diferenciabilidade de B. ⊳ |(u, v)| Nos Exemplos 4 e 5 acima (e, obviamente, no Exemplo 3), as aplicações consideradas são de classe C ∞ . De fato, a derivada T ′ = T : Rm → L(Rm ; Rn ) de uma transformação linear T , sendo constante, possui derivada nula e todas as derivadas seguintes também serão nulas. Quanto à aplicação bilinear B, sua derivada B ′ : Rm × Rn → L(Rm × Rn ; Rp ) é a transformação linear (x, y) 7→ B(•, y) + B(x, •), recaindo assim no Exemplo 4. Exemplo 6 (Derivada complexa). Uma função de variável complexa f : U → C, definida no aberto U ⊂ C, pode ser vista como uma aplicação f : U → R2 , definida no aberto U ⊂ R2 . A derivada da função complexa f no ponto z ∈ U é o número complexo f ′ (z), definido como o limite f (z + H) − f (z) , H→0 H f ′ (z) = lim quando tal limite existe. Isto equivale a dizer que f (z + H) − f (z) = f ′ (z) · H + r(H), onde r(H) = 0. H→0 |H| lim Seção 3 Cálculo diferencial de aplicações 103 Acima, f ′ (z) · H é uma multiplicação de números complexos. Portanto, a função complexa f : U → C é derivável no ponto z ∈ U se, e somente se, a aplicação f : U → R2 é diferenciável nesse ponto e, além disso, sua derivada f ′ (z) : R2 → R2 é uma transformação linear do plano que consiste em multiplicar por um número complexo fixo. Ora, se T : R2 → R2 é uma tal transformação, da forma T · z = (a + bi) · z, sua matriz na base canônica tem T · 1 = a + bi e T · i = −b + ai, ou seja, sua as colunas a −b matriz é do tipo . Se, para z = x+yi, f (z) = u(x, y)+i·v(x, y), b a a matriz jacobiana de f é  ∂u ∂u   ∂x    ∂v ∂x ∂y   . ∂v  ∂y Segue-se então que a função complexa f é derivável em U se, e somente se, valem as relações ∂u/∂x = ∂v/∂y e ∂u/∂y = −∂v/∂x em todo ponto z = x + yi ∈ U . Estas igualdades são conhecidas como as equações de Cauchy-Riemann. A derivada de f , considerada como função de uma variável complexa é f ′ (z) = ∂v ∂v ∂u ∂u +i = −i · ∂x ∂x ∂y ∂y Exemplo 7. Se f, g : U → Rn são diferenciáveis no ponto a ∈ U Rm então a aplicação (f, g) : U → Rn × Rn , definida por (f, g)(x) (f (x), g(x)), é diferenciável no ponto a e sua derivada é (f, g)′ (a) · v (f ′ (a) · v, g ′ (a) · v). Se f, g ∈ C k então (f, g) também é de classe C k . 3 ⊳ ⊂ = = ⊳ Cálculo diferencial de aplicações Teorema 1 (Regra da Cadeia). Sejam U ⊂ Rm , V ⊂ Rn abertos e f : U → Rn , g : V → Rp diferenciáveis nos pontos a ∈ U , b = f (a) ∈ V , com f (U ) ⊂ V . Então g ◦ f : U → Rp é diferenciável no ponto a e (g ◦ f )′ (a) = g ′ (b) · f ′ (a) : Rm → Rp . Resumidamente: a derivada da aplicação composta é a composta das derivadas. 104 Aplicações Diferenciáveis Cap. 5 Demonstração. Podemos escrever f (a + v) = f (a) + f ′ (a) · v + ρ(v) · |v|, com lim ρ(v) = 0 e v→0 g(b + w) = g(b) + g ′ (b) · w + σ(w) · |w|, com lim σ(w) = 0. w→0 Então (g ◦ f )(a + v) = g(f (a) + f ′ (a) · v + ρ(v) · |v|). Pondo w = f ′ (a) · v + ρ(v) · |v|, obtemos: (g ◦ f )(a + v) = g(b + w) = g(b) + g ′ (b) · (f ′ (a) · v) + g ′ (b) · ρ(v)|v| + σ(w) · |w| = (g ◦ f )(a) + [g ′ (b) · f ′ (a)] · v + C(v) · |v|, onde C(v) = g ′ (b) · ρ(v) + σ(w) · f ′ (a) · Se v → 0 então w → 0 e f ′ (a) · provando o teorema. v + ρ(v) . |v| v é limitada. Portanto lim C(v) = 0, v→0 |v| Corolário 1. Se f : U → Rn e g : V → Rp (com U ⊂ Rm e f (U ) ⊂ V ⊂ Rn ) são de classe C k então g ◦ f : U → Rp é de classe C k . Com efeito, a Regra da Cadeia aplicada num ponto genérico x ∈ U , fornece (g ◦ f )′ (x) = g ′ (f (x)) · f ′ (x). Em termos funcionais, temos (g ◦ f )′ = (g ′ ◦ f ) · f ′ : U → L(Rm ; Rp ), onde ◦ é a composição de aplicações e · é a multiplicação de transformações lineares, a qual é bilinear, logo C ∞ . Se f e g são de classe C 1 , esta última igualdade mostra que (g ◦ f )′ é contı́nua, logo g ◦ f ∈ C 1 . Por indução, supondo f e g de classe C k , a mesma igualdade mostra que (g ◦ f )′ ∈ C k−1 , logo g ◦ f ∈ C k . Corolário 2. Nas condições do Teorema 1, a matriz jacobiana de g ◦ f no ponto a é o produto da matriz jacobiana de g no ponto f (a) pela matriz jacobiana de f no ponto a : J(g ◦ f )(a) = Jg(f (a)) · Jf (a). Em termos de derivadas parciais, a igualdade acima lê-se n X ∂gi ∂yk ∂gi = · · ∂xj ∂yk ∂xj k=1 Seção 3 Cálculo diferencial de aplicações 105 Nesta fórmula, escrita da maneira tradicional, os xj são coordenadas de um ponto em U , os yk em V , ∂gi /∂xj é derivada parcial de gi ◦ f enquanto ∂gi /∂yk é derivada parcial de gi e, finalmente, ∂yk /∂xj significa, em nossa notação costumeira, ∂fk /∂xj . Com tais entendimentos tácitos, essa fórmula tem sobrevivido e sido útil através dos anos. Corolário 3 (As regras de derivação). Sejam f, g : U → Rn diferenciáveis no ponto a ∈ U ⊂ Rm , α um número real e B : Rn ×Rn → Rp bilinear. Então: 1) f + g : U → Rn é diferenciável no ponto a, com (f + g)′ (a) = f ′ (a) + g ′ (a). 2) α · f : U → Rn é diferenciável no ponto a, com (αf )′ (a) = α · f ′ (a). 3) B(f, g) : U → Rp , definida por B(f, g)(x) = B(f (x), g(x)), é diferenciável no ponto a, com [B(f, g)]′ (a) · v = B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v). Os itens 1) e 2) podem ser provados diretamente a partir da definição de aplicação diferenciável ou então considerando as transformações lineares S : Rn × Rn → Rn , α∗ : Rn → Rn , definidas por S(x, y) = x + y e α∗ (x) = α · x. Então é só observar que f + g = S ◦ (f, g) e α · f = α∗ ◦ f e usar a Regra da Cadeia, lembrando que S ′ = S e (α∗ )′ = α∗ , logo (f + g)′ = S ◦ (f ′ , g ′ ) = f ′ + g ′ e (α · f )′ = (α∗ ◦ f )′ = α∗ ◦ f ′ = α · f ′ . Quanto ao item 3), basta usar a Regra da Cadeia e os Exemplos 5, 7. Então, como B(f, g) = B ◦ (f, g), temos, para cada v ∈ Rm : [B(f, g)]′ (a) · v = [B ◦ (f, g)]′ (a) · v = B ′ (f (a), g(a)) · (f ′ (a) · v, g ′ (a) · v) = B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v). Observação. Uma aplicação bilinear B : Rn × Rn → Rp pode (e deve) ser considerada como uma forma de multiplicar um elemento de Rn por outro obtendo um produto em Rp . Usando a notação multiplicativa x • y em vez de B(x, y), a regra de derivação do item 3) do Corolário 3 lê-se (f • g)′ = f ′ • g + f • g ′ , isto é, para todo x ∈ U e todo v ∈ Rn , (f • g)′ (x) · v = (f ′ (x) · v) • g(x) + f (x) • (g ′ (x) · v). (O ponto maior • 106 Aplicações Diferenciáveis Cap. 5 é o produto que substitui B e o ponto menor · é a aplicação de uma transformação linear sobre um vetor.) Exemplo 8. Um exemplo freqüente de aplicação bilinear é o produto interno de vetores. Se tivermos ϕ(x) = hf (x), g(x)i, com f, g : U → Rn diferenciáveis em U ⊂ Rm então, para todo v ∈ Rm , vale ϕ′ (x) · v = hf ′ (x)·v, g(x)i+hf (x), g ′ (x)·vi. Em particular, se ϕ(x) = hf (x), f (x)i = |f (x)|2 então ϕ′ (x) · v = 2hf (x), f ′ (x) · vi. Levando em conta a fórmula √ √ ( u)′ = u′ /2 u para a derivada da raiz quadrada de uma função real positiva u, daı́ resulta que, pondo p ξ(x) = hf (x), f (x)i = |f (x)|, tem-se ξ ′ (x) · v = hf ′ (x) · v, f (x)i/|f (x)| sempre que f (x) 6= 0. ⊳ Exemplo 9. Outro exemplo comum de aplicação bilinear é a multiplicação de matrizes (ou de transformações lineares). Vejamos um caso particular desta situação. Se A : Rm → Rm é um operador auto-adjunto então resulta do exemplo anterior que a derivada da forma quadrática ϕ(x) = hAx, xi atua assim: ϕ′ (x) · v = hAv, xi + hAx, vi = 2hAx, vi, levando em conta que hAv, xi = hv, Axi, pela definição de operador auto-adjunto. Algumas pessoas preferem considerar A como uma matriz simétrica a do tipo m×m e x ∈ Rm como uma matriz x do tipo m×1 (matriz-coluna) cuja transposta xT é uma matriz-linha 1 × m. Então a x) = xT ax forma quadrática ϕ se escreve como ϕ(x ax. Desta maneira, para m cada vetor v ∈ R (ou seja, para cada matriz v do tipo m × 1) tem-se x) · v = v T ax + xT av = xT av + xT av = 2xT av ϕ′ (x av, que corresponde a 2hAx, vi na notação de operadores. ⊳ Exemplo 10. Seja U ⊂ M (n × n) o conjunto das matrizes invertı́veis n × n, isto é, das matrizes que têm determinante 6= 0. Como o determinante é uma função contı́nua, U é aberto. Seja f : U → M (n × n) x) = x −1 . Afirmaa aplicação que associa a cada x ∈ U sua inversa f (x mos que f é diferenciável e que, em cada ponto x ∈ U , sua derivada x) : M (n × n) → M (n × n) é a transformação linear definida por f ′ (x x) · v = −x x−1 · v · x −1 , v ∈ M (n × n). Para provar isto, atribuiremos f ′ (x x|, igual à norma da transa cada matriz x ∈ M (n × n) a norma |x formação linear X : Rn → Rn que tem x como matriz na base canônica. x| = sup{|X · u|; (Veja Exemplo 12, Capı́tulo 1.) Mais explicitamente: |x n−1 x · y| ≤ u∈S }. Como se vê facilmente, se x , y ∈ M (n × n) então |x x| · |yy |. Provemos agora a diferenciabilidade de f . Escrevemos |x x + v )−1 − x −1 = −x x−1vx −1 + r(vv ) (x Seção 3 Cálculo diferencial de aplicações 107 e mostramos que lim r(vv )/|vv | = 0. Com este objetivo, multiplicamos v→0 ambos os membros da igualdade acima, à direita, por x + v . Após uma simplificação óbvia, obtemos x−1 · v )2 (x x + v )−1 , r(vv ) = (x donde x−1 |2 |vv |2 |(x x + v )−1 |, |r(vv )| ≤ |x |r(vv )| x−1 |2 |(x x + v )−1 | |vv | ≤ |x |vv | x + v )−1 se justifica pelo fato de e daı́ lim r(vv )/|vv | = 0. (O uso de (x v→0 que, sendo U aberto, x ∈ U ⇒ x + v ∈ U para toda v suficientemente pequena.) ⊳ Observação. Na verdade a inversão de matrizes f : U → U , considerada no Exemplo 10, é uma aplicação C ∞ . Isto pode ser verificado diretamente, a partir da fórmula que exprime x −1 em função de x , utilizando a chamada “adjunta clássica”de uma matriz. (Ver também “Análise no Espaço Rn ”, página 26.) Lembremos que a norma de uma transformação linear T : Rm → Rn é o número |T | = sup{|T · u|; u ∈ S n−1 }. Desta definição resulta que, para todo v ∈ Rm , tem-se |T · v| ≤ |T | · |v| e que, se S : Rn → Rp é outra transformação linear então |S · T | ≤ |S| · |T |. Teorema 2 (Desigualdade do Valor Médio). Seja f : U → Rn diferenciável em todos os pontos do segmento de reta [a, a + v] ⊂ U . Se, para todo t ∈ [0, 1], tem-se |f ′ (a + tv)| ≤ M então |f (a + v) − f (a)| ≤ M · |v|. Demonstração. O caminho λ : [0, 1] → Rn , definido por λ(t) = f (a + tv), é diferenciável, com λ′ (t) = f ′ (a + tv) · v, portanto |λ′ (t)| ≤ |f ′ (a + tv)| · |v| ≤ M · |v| para todo t ∈ [0, 1]. Segue-se então da Desigualdade do Valor Médio para caminhos (Teorema 1 do Capı́tulo 2) que |λ(1) − λ(0)| ≤ M · |v| · (1 − 0), isto é, |f (a + v) − f (a)| ≤ M · |v|. Corolário 4. Se o aberto U ⊂ Rm é convexo e M > 0 é tal que a aplicação diferenciável f : U → Rn cumpre |f ′ (x)| ≤ M para todo x ∈ U então f satisfaz a condição de Lipschitz |f (x) − f (y)| ≤ M |x − y| para quaisquer x, y ∈ U . Teorema 3 (Diferenciabilidade Uniforme). Seja f : U → Rn de classe C 1 no aberto U ⊂ Rm . Se K ⊂ U é compacto então f é uniformemente diferenciável em K. 108 Aplicações Diferenciáveis Cap. 5 Demonstração. Isto significa que, para todo ε > 0 dado, pode-se obter δ > 0 tal que |v| < δ implica |f (x + v) − f (x) − f ′ (x) · v| < ε · |v| qualquer que seja x ∈ K. Para estabelecer este resultado, uma vez dado ε > 0, devemos inicialmente encontrar δ > 0 com a seguinte propriedade: para todo x ∈ K e todo v ∈ Rm com |v| ≤ δ tem-se x + v ∈ U e |f ′ (x + v) − f ′ (x)| < ε. Ora, pelo Corolário 2 do Teorema 11, Capı́tulo 1, existe δ > 0 tal que toda bola de centro num ponto x ∈ K e raio 2δ está contida em U . Seja [ L= B[x; δ] = {y ∈ Rm ; d(y, K) ≤ δ}. x∈K Então L é um compacto, com K ⊂ L ⊂ U . Se x ∈ K e |v| ≤ δ então x + v ∈ L. A aplicação f ′ : L → L(Rm , Rn ) é uniformemente contı́nua. Logo, diminuindo δ se necessário, podemos admitir que |f ′ (x + v) − f ′ (x)| < ε para todo x ∈ K e todo v ∈ Rn com |v| < δ. Evidentemente, isto acarreta que |f ′ (x + tv) − f ′ (x)| < ε para todo t ∈ [0, 1], pois |tv| ≤ |v| quando 0 ≤ t ≤ 1. Cumprida esta etapa, consideremos o caminho λ : [0, 1] → Rn , definido por λ(t) = f (x + tv), com x ∈ K e |v| < δ. Então λ′ (t) = f ′ (x + tv) · v. Pelo Teorema Fundamental do Cálculo para caminhos, Z 1 Z 1 ′ f ′ (x + tv) · v · dt. λ (t)dt = f (x + v) − f (x) = λ(1) − λ(0) = 0 0 Logo ′ |f (x + v) − f (x) − f (x) · v| = Z 0 ′ 1 [f ′ (x + tv) − f ′ (x)] · v · dt ≤ sup |f ′ (x + tv) − f (x)| |v| ≤ ε · |v|. 0≤t≤1 provando assim que f é uniformemente diferenciável em K. Seção 4 4 Exercı́cios 109 Exercı́cios Seção 1. A derivada como transformação linear 1. Seja f : Rm → Rm diferenciável, com f (0) = 0. Se a transformação linear f ′ (0) não admite o autovalor 1, prove que existe uma vizinhança V de 0 em Rm tal que f (x) 6= x para todo x ∈ V − {0}. 2. Dada a aplicação f : S m→ Rn , defina sua extensão radial F : Rm+1 → Rn x pondo F (x) = |x|·f se x 6= 0 e F (0) = 0. Prove que F é diferenciável no |x| ponto 0 ∈ Rm+1 se, e somente se, f é (a restrição a S m de) uma transformação linear. 3. Sejam U ⊂ Rm aberto, a ∈ U e f : U → Rn uma aplicação de classe C 2 . A ′′ m m derivada segunda de f é, por definição, a aplicação bilinear f (x) : R ×R → ∂f ∂ Rn , dada por f ′′ (a) · u · v = (a). Prove que f ′′ (a) · u · v = f ′′ (a) · v · u. ∂v ∂u 4. Dado U ⊂ Rm aberto e conexo, seja f : U → Rn − {0} diferenciável. A fim de que |f (x)| seja constante, prove que é necessário e suficiente que, para todo x ∈ U e todo v ∈ Rm , o vetor f ′ (x) · v seja ortogonal a f (x). Seção 2. Exemplos de derivadas 1. Seja A : U → L(Rm ; Rn ) diferenciável no aberto U ⊂ Rp . Defina f : U × Rm → Rn pondo f (x, v) = A(x) · v. Prove que f é diferenciável, com f ′ (x, v) · (h, k) = (A′ (x) · h) · v + A(x) · k. 2. Seja f : U → R2 definida no aberto U ⊂ R2 . Suponha que, considerada como função complexa, f seja derivável, com f ′ (z0 ) 6= 0 para um certo z0 ∈ U . Considere caminhos α, β : (−ε, ε) → U tais que α(0) = β(0) = z0 e α′ (0) 6= 0, β ′ (0) 6= 0. Prove que o ângulo entre α′ (0) e β ′ (0) é igual ao ângulo entre f ′ (z0 ) · α′ (0) e f ′ (z0 ) · β ′ (0). Noutras palavras: f preserva os ângulos entre curvas. 3. Seja f : R2 → R3 definida por f (x, y) = (x2 , y 2 , (x + y)2 ). Mostre que f ′ (x, y) : R2 → R3 tem posto 2 ⇔ (x, y) 6= (0, 0). 4. Seja f : R3 → R4 , f (x, y, z) = (x2 − y 2 , xy, xz, zy). Mostre que f ′ (x, y, z) é uma transformação linear injetiva, salvo quando x = y = 0. Determine a imagem de f ′ (0, 0, z) : R3 → R4 . 5. Mostre que o posto da derivada da aplicação f : R3 → R3 , dada por f (x, y, z) = (x + y + z, x2 + y 2 + z 2 , x3 + y 3 + z 3 ), tem posto p nos pontos de R3 que têm p coordenadas diferentes. 110 Aplicações Diferenciáveis Cap. 5 Seção 3. Cálculo diferencial de aplicações 1. Seja f : U → Rn diferenciável no aberto U ⊂ Rm . Se |f (x) − f (y)| ≤ M · |x − y| para quaisquer x, y ∈ U (onde M > 0 é uma constante) então |f ′ (x)| ≤ M para todo x ∈ U . 2. Seja U ⊂ Rm aberto. Dadas f : U → Rn g : U → Rp e T : U → L(Rn ; Rp ), defina ϕ : U → R pondo ϕ(x) = hT (x) · f (x), g(x)i. Para x ∈ U e h ∈ Rm quaisquer, determine ϕ′ (x) · h. 3. Sejam U ⊂ Rm , V ⊂ Rn abertos e f : U → V , g : V → Rp aplicações duas vezes diferenciáveis. Para x ∈ U e y = f (x) ∈ V , interprete e prove a igualdade (g ◦ f )′′ (x) = g ′′ (y) · f ′ (x) · f ′ (x) + g ′ (y) · f ′′ (x). 4. Seja U uma bola aberta de centro 0 em Rm . Dada A : U → L(Rm ; Rn ) diferenciável, tome x ∈ U e defina o caminho ϕ : (0, 1) → L(Rm ; Rn ) pondo ϕ(t) = A(tx). Uma das interpretações seguintes para a fórmula ϕ′ (t) = A′ (tx) · x é verdadeira: ϕ′ (t) · v = (A′ (tx) · x) · v ou ϕ′ (t) · v = (A′ (tx) · v) · x. Decida e prove. 5. Seja f : U → Rn contı́nua no aberto U ⊂ Rm com [a, a + v] ⊂ U . Se f é diferenciável em todos os pontos de (a, a + v) então, para toda T ∈ L(Rm ; Rn ), prove que |f (a + v) − f (a) − T · v| ≤ sup |f ′ (a + tv) − T | · |v|. 0<t<1 6. Dada f : U → R, diferenciável no aberto U ⊂ Rn , fixe a ∈ Rm e defina ϕ : U → Rm pondo ϕ(x) = f (x) · a. Para cada x ∈ U , determine ϕ′ (x) : Rn → Rm . 6 Aplicações Inversas e Implı́citas 1 O Teorema da Aplicação Inversa Na página 97 do Volume 1 foi estabelecido que se f : I → R é derivável no intervalo I ⊂ R, com f ′ (x) > 0 para todo x ∈ I, então f é uma bijeção crescente sobre o intervalo J = f (I) e a função inversa g = f −1 : J → I também é derivável, com g ′ (f (x)) = 1/f ′ (x). Evidentemente, resultado análogo vale com f ′ (x) < 0, só que agora f é decrescente. Na verdade, pelo Teorema de Darboux (pág. 95 do Volume 1), bastaria supor f ′ (x) 6= 0 para todo x ∈ I para garantir que f é uma bijeção monótona (crescente ou decrescente) de I sobre J = f (I), com f −1 : J → I derivável. Nos termos da definição que será dada a seguir, isto significa que a função diferenciável sobrejetiva f : I → J, entre intervalos I, J ⊂ R, é um difeomorfismo se, e somente se, f ′ (x) 6= 0 para todo x ∈ I. Em dimensões superiores esta condição significaria que f ′ (x) é um isomorfismo, mas seria apenas necessária para que f possuı́sse uma inversa diferenciável. Sejam U ⊂ Rm , V ⊂ Rn abertos. Uma aplicação f : U → V chamase um difeomorfismo entre U e V quando é uma bijeção diferenciável, cuja inversa g = f −1 : V → U também é diferenciável. Se f : U → V é um difeomorfismo, com g = f −1 : V → U , então de g ◦ f = idU e f ◦ g = idV resulta, pela Regra da Cadeia, que g ′ (f (x)) · f ′ (x) = idRm e f ′ (x) · g ′ (f (x)) = idRn para todo x ∈ U , portanto f ′ (x) : Rm → Rn é um isomorfismo cujo inverso é g ′ (f (x)) : Rn → Rm . 112 Aplicações Inversas e Implı́citas Cap. 6 Em particular, m = n, ou seja, dois abertos em espaços euclidianos de dimensões diferentes não podem ser difeomorfos. Exemplo 1. Resulta do Exemplop15, Capı́tulo 1, que a aplicação f : Rm → B, definida por f (x) = x/ 1 + |x|2 , é um homeomorfismo de Rm sobre apbola aberta B ⊂ Rm , de centro 0 e raio 1, sendo g : B → Rm , g(y) = y/ 1 − |y|2 o homeomorfismo inverso de f . Na verdade, como f e g são ambas aplicações diferenciáveis, as duas são difeomorfismos, um inverso do outro. Deve-se observar, entretanto, que nem todo homeomorfismo diferenciável é um difeomorfismo, isto é, tem inverso diferenciável. O exemplo mais simples disto é f : R → R, com f (x) = x3 . √ Como f ′ (0) = 0, a função inversa de f (que é g(x) = 3 x) não é diferenciável no ponto 0 = f (0). Uma aplicação diferenciável f : U → Rm , definida no aberto U ⊂ m R , chama-se um difeomorfismo local quando, para cada x ∈ U existe uma bola aberta B = B(x; δ) ⊂ U tal que f aplica B difeomorficamente sobre um aberto V contendo f (x). Segue-se daı́ que se f : U → Rm é um difeomorfismo local então f ′ (x) : Rm → Rm é um isomorfismo, para todo x ∈ U . O Teorema da Aplicação Inversa, que provaremos a seguir, diz que quando f ∈ C 1 vale a recı́proca: se f ′ (x) é um isomorfismo para todo x ∈ U então f é um difeomorfismo local. Decorre da definição acima que um difeomorfismo local f : U → Rm é uma aplicação aberta, isto é, a imagem f (A) de qualquer aberto A ⊂ U é um subconjunto aberto de Rm . Com efeito, se tomarmos para cada x ∈ A uma bola aberta Bx ⊂ A, com centro x, tal que f seja S um m difeomorfismo de Bx sobre um aberto Vx ⊂ R , então A = Bx e x∈A f (A) = f (∪Bx ) = ∪f (Bx ) = ∪Vx é uma reunião de abertos, logo é um aberto. Observemos ainda que o difeomorfismo local f : U → Rm é um difeomorfismo (global) de U sobre o aberto V = f (U ) ⊂ Rm se, e somente se, é uma aplicação injetiva. ⊳ Exemplo 2. Seja f : R2 → R2 definida por f (x, y) = (ex cos y, ex sen y). Evidentemente, f ∈ C ∞ . Cada reta vertical x = a é transformada por f , com perı́odo 2π (isto é, f (a, y) = f (a, y ′ ) ⇔ y ′ − y = 2kπ, k ∈ Z), sobre a circunferência de centro 0 e raio ea . Cada reta horizontal y = b é levada por f , bijetivamente, sobre a semi-reta aberta que parte da origem e passa pelo ponto (cos b, sen b) ∈ S 1 . A imagem de f é R2 − {0}. Em termos da variável complexa z = x + iy, tem-se f (z) = ez . A aplicação Seção 1 O Teorema da Aplicação Inversa 113 f é um difeomorfismo local (mas não global pois f (x, y + 2π) = f (x, y)). Isto decorre do Teorema da Aplicação Inversa (Teorema 4, a seguir), pois a matriz jacobiana x e cos y −ex sen y Jf (x, y) = x e sen y ex cos y tem determinante ex , portanto 6= 0, logo f ′ (x, y) : R2 → R2 é um isomorfismo, para todo (x, y) ∈ R2 . Podemos também chegar à mesma conclusão observando que se w0 = f (z0 ) então o ramo da função complexa log w tal que log w0 = z0 é uma aplicação inversa local de f no ponto w0 = f (z0 ). Se I ⊂ R é um intervalo aberto então todo difeomorfismo local f : I → R é um difeomorfismo (global) de I sobre J = f (I). ⊳ Teorema 1. Se o difeomorfismo f : U → V é de classe C k (k ≥ 1) então seu inverso g = f −1 : V → U também é de classe C k . Demonstração. (Indução em k.) Para todo y = f (x) ∈ V , temos g ′ (y)=[f ′ (x)]−1 = [f ′ (f −1 (y))]−1 , portanto a aplicação g ′ : V →L(Rm ) = 2 Rm se exprime como a composta g ′ = (Inv) ◦ f ′ ◦ f −1 onde Inv leva todo operador invertı́vel X : Rm → Rm no seu inverso X −1 , f ′ : U → L(Rm ), leva todo ponto x ∈ U na derivada (invertı́vel) f ′ (x) : Rm → Rm e f −1 : V → U é a aplicação inversa de f . Sabemos que Inv ∈ C ∞ . Portanto, se f ∈ C k então f ′ ∈ C k−1 e, pela hipótese de indução, f −1 ∈ C k−1 , logo g ′ ∈ C k−1 , como composta de três aplicações de classe C k−1 . Por definição, isto significa que g ∈ C k . Teorema 2. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rm . Se, para algum a ∈ U , a derivada f ′ (a) : Rm → Rn é injetiva então existem δ > 0 e c > 0 tais que B = B(a; δ) ⊂ U e, para quaisquer x, y ∈ B tem-se |f (x) − f (y)| ≥ c|x − y|. Em particular, a restrição f |B é injetiva. Demonstração. A função u 7→ |f ′ (a) · u| é positiva em todos os pontos u da esfera unitária S m−1 , a qual é compacta. Pelo Teorema de Weierstrass, existe c > 0 tal que |f ′ (a) · u| ≥ 2c para todo u ∈ S m−1 . Por linearidade, segue-se que |f ′ (a) · v| ≥ 2c · |v| para todo v ∈ Rm . Para todo x ∈ U , escrevamos r(x) = f (x) − f (a) − f ′ (a)(x − a). 114 Aplicações Inversas e Implı́citas Cap. 6 Então, para x, y ∈ U quaisquer, temos f (x) − f (y) = f ′ (a) · (x − y) + r(x) − r(y). Levando em conta que |u + v| ≥ |u| − |v|, segue-se que |f (x) − f (y)| ≥ |f ′ (a) · (x − y)| − |r(x) − r(y)| ≥ 2c · |x − y| − |r(x) − r(y)|. Observemos que a aplicação r, acima definida, é de classe C 1 , com r(a) = 0 e r′ (a) = 0. Pela continuidade de r′ , existe δ > 0 tal que |x − a| < δ ⇒ x ∈ U e |r′ (x)| < c. A Desigualdade do Valor Médio, aplicada a r no conjunto convexo B = B(a; δ) nos assegura que se x, y ∈ B então |r(x) − r(y)| ≤ c|x − y|. Conseqüentemente, x, y ∈ B ⇒ |f (x) − f (y)| ≥ 2c|x − y| − c|x − y|, ou seja, |f (x) − f (y)| ≥ c|x − y|, como querı́amos demonstrar. Teorema 3 (Diferenciabilidade do Homeomorfismo Inverso). Seja f : U → V um homeomorfismo de classe C 1 entre os abertos U, V ⊂ Rm . Se, para algum x ∈ U , a derivada f ′ (x) : Rm → Rm é um operador invertı́vel então o homeomorfismo inverso g = f −1 : V → U é diferenciável no ponto f (x), com g ′ (f (x)) = [f ′ (x)]−1 . Demonstração. Se x, x+v ∈ U , escrevamos f (x) = y e f (x+v) = y+w. Então r(v) =0 v→0 |v| v = g(f (x + v)) − g(f (x)) = g(y + w) − g(y). w = f (x + v) − f (x) = f ′ (x) · v + r(v) onde lim e Para provar que f ′ (x)−1 é a derivada de g no ponto y, escrevamos g(y + w) − g(y) = f ′ (x)−1 · w + s(w) (*) s(w) = 0. Entrando na igualdade (*) com as |w| expressões de v e w acima obtidas, vem: e mostremos que lim w→0 v = f ′ (x)−1 [f ′ (x) · v + r(v)] + s(w), ou seja: v = v + f ′ (x)−1 · r(v) + s(w), Seção 1 O Teorema da Aplicação Inversa 115 donde s(w) = −f (x)−1 · r(v), logo isto é: r(v) |v| s(w) = −f ′ (x)−1 · · , |w| |v| |w| s(w) r(v) |v| = −f ′ (x)−1 · · · |w| |v| |f (x + v) − f (x)| r(v) → 0. |v| Além disso, pelo Teorema 2, existem δ > 0 e c > 0 tais que |v| < δ implica Quando w → 0, tem-se v → 0 pela continuidade de g, logo |f (x + v) − f (x)| ≥ c|v|, portanto s(w) w→0 |w| Assim, lim |v| 1 ≤ · |f (x + v) − f (x)| c = 0. Corolário 1. Se f : U → V é um homeomorfismo de classe C k cuja derivada f ′ (x) : Rm → Rm é invertı́vel para todo x ∈ U então seu inverso g = f −1 : V → U é de classe C k . Com efeito, a derivada g ′ : V → L(Rm ), dada por g ′ (y) = f ′ (g(y))−1 para cada y ∈ V , pode ser escrita como g ′ = Inv ◦ f ′ ◦ g, onde a aplicação Inv, de classe C ∞ , é a inversão de transformações lineares bijetivas e f ′ ∈ C k−1 . Admitindo, por indução, que g ∈ C k−1 , resulta que g ′ ∈ C k−1 , logo g ∈ C k . Teorema 4 (Teorema da Aplicação Inversa). Seja f : U → Rm de classe C k (k ≥ 1) no aberto U ⊂ Rm . Se a ∈ U é tal que f ′ (a) : Rm → Rm é invertı́vel então existe uma bola aberta B = B(a; δ) ⊂ U tal que a restrição f |B é um difeomorfismo sobre um aberto V ∋ f (a). Demonstração. Diminuindo δ, se necessário, no Teorema 2 podemos admitir que B̄ = B[a; δ] ⊂ U e que f é injetiva no conjunto compacto B̄, logo é um homeomorfismo de B sobre f (B). Além disso, como f ′ (x) depende continuamente de x e todo operador linear suficientemente próximo de um invertı́vel é também invertı́vel, podemos supor que, para todo x ∈ B, a derivada f ′ (x) : Rm → Rm é um isomorfismo. Pelo Teorema 3, basta então mostrar que f (B) ⊂ Rm é aberto. Seja então q = f (p), p ∈ B. Chamando de S = S[a, δ] a esfera que é a fronteira de B̄, a injetividade de f |B̄ assegura que q ∈ / f (S), logo existe 116 Aplicações Inversas e Implı́citas Cap. 6 ε > 0 tal que |f (x) − q| ≥ 2ε para todo x ∈ S, pois f (S) é compacto. Afirmamos que B(q; ε) ⊂ f (B). Com efeito, se y ∈ B(q; ε), então, pondo g(x) = f (x) − y, o mı́nimo de |g(x)|, quando x varia no compacto B̄, não é atingido num ponto x ∈ S pois x ∈ S ⇒ |f (x) − y| ≥ ε enquanto |f (p) − y| = |q − y| < ε, com p ∈ B. Assim, o mı́nimo de |f (x) − y|, x ∈ B̄ é atingido num ponto x0 ∈ B. Pelo lema a seguir, isto implica que esse mı́nimo é zero, portanto y = f (x0 ), donde y ∈ f (B), ou seja, B(q; ε) ⊂ f (B). Lema 1. Sejam U ⊂ Rm aberto e g : U → Rn diferenciável no ponto a ∈ U , com g ′ (a) : Rm → Rn sobrejetiva. Se a é um ponto de mı́nimo local de |g(x)|, x ∈ U , então g(a) = 0. Demonstração. Se a é um ponto de mı́nimo local para |g(x)|, será também um ponto de mı́nimo local para a função ϕ : U → R, definida por ϕ(x) = |g(x)|2 = hg(x), g(x)i, logo ϕ′ (a) = 0. Mas, como ϕ′ (a) · v = 2hg ′ (a) · v, g(a)i, isto significa que g(a) é ortogonal à imagem de g ′ (a), a qual é Rn . Logo g(a) = 0. Exemplo 3. Dadas as matrizes x , m ∈ M (n × n), diz-se que x é uma raiz quadrada de m quando x 2 = m . Nem toda matriz m posx2 ) = (det x )2 , uma condição necessária é sui raiz quadrada: como det(x que det m ≥ 0 . Mas esta condição não é suficiente pois é fácil ver que, −1 0 embora a matriz m = tenha determinante positivo, não existe 1 −1 x ∈ M (2 × 2) tal que x 2 = m . O Teorema 4 pode ser usado para mostrar que toda matriz próxima da identidade I n tem raiz quadrada. Com x) = x 2 , efeito, consideremos a aplicação f : M (n × n) → M (n × n), f (x ∞ de classe C . Sua derivada num ponto x ∈ M (n × n) é a transformação 2 2 x) : Rn → Rn , dada por f ′ (x x) · m = m · x + x · m . Em parlinear f ′ (x 2 2 ′ ticular, para x = I n , tem-se f (II n ) · m = 2m 2m, logo f ′ (II n ) : Rn → Rn é um isomorfismo. Segue-se do Teorema 4 que existe um aberto U em M (n × n), contendo a matriz identidade, restrita ao qual f é um difeomorfismo sobre o aberto V = f (U ). Assim, para toda matriz y ∈ V , √ existe uma única matriz x = y ∈ U tal que x 2 = y . Além disso, a √ aplicação f −1 : V → U , y 7→ y , é de classe C ∞ . ⊳ Corolário 2 (do Teorema 4). Seja a ∈ U um ponto crı́tico da função f : U → R, de classe C 2 no aberto U ⊂ Rn . Se a matriz hessiana 2 ∂ f (a) Hf (a) = ∂xi ∂xj Seção 2 Várias Funções Implı́citas 117 é invertı́vel então existe um aberto V , com a ∈ V ⊂ U , no qual não há outros pontos crı́ticos de f . Com efeito, a matriz hessiana Hf (x) é, para todo x ∈ U , a matriz jacobiana da aplicação ∂f ∂f (x), . . . , (x) . F : U → Rn , F (x) = grad f (x) = ∂x1 ∂xn Como Hf (a) é invertı́vel, F é injetiva numa vizinhança V ∋ a, logo F (x) 6= F (a), isto é, grad f (x) 6= 0 para todo x ∈ V − {a}. Quando grad f (a) = 0 e Hf (a) é invertı́vel, a chama-se um ponto crı́tico não-degenerado da função f . O corolário acima diz que os pontos crı́ticos não-degenerados são pontos crı́ticos isolados. 2 Várias Funções Implı́citas Os pontos do espaço Rm+n serão representados sob a forma z = (x, y), onde x = (x1 , . . . , xm ) ∈ Rm e y = (y1 , . . . , yn ) ∈ Rn . Um difeomorfismo h : U → V , entre abertos U, V ⊂ Rm+n , será chamado de vertical quando for do tipo h(x, y) = (x, h2 (x, y)), ou seja, quando deixar invariante a coordenada x. O inverso de um difeomorfismo vertical é ainda vertical. Um difeomorfismo ϕ : U → V é usualmente interpretado como uma transformação geométrica que aplica diferenciavelmente o conjunto U sobre o conjunto V , de forma invertı́vel. Às vezes, porém, é conveniente olhar para ϕ como uma mudança de coordenadas, em que as coordenadas do ponto x ∈ U passam a ser aquelas da sua imagem y = ϕ(x) ∈ V . Sob este ponto de vista, o teorema a seguir diz que se a derivada de uma aplicação f , de classe C k , é sobrejetiva num ponto p então é possı́vel obter (de modo bastante simples) um sistema de coordenadas, válido numa vizinhança aberta Z de p, tal que, em termos dessas novas coordenadas, a aplicação f assume a expressão (x1 , . . . , xm , w1 , . . . , wn ) 7→ (w1 , . . . , wn ). Teorema 5 (Forma Local das Submersões). Seja f = (f1 , . . . , fn ) uma aplicação de classe C k (k ≥ 1) de um aberto U ⊂ Rm+n em Rn . Se, num ponto p = (a, b) ∈ U , a matriz ∂fi (p) (i, j = 1, . . . , n) ∂yj 118 Aplicações Inversas e Implı́citas Cap. 6 é invertı́vel então existem abertos Z ∋ p em Rm+n , V ∋ a em Rm , W ∋ c = f (p) em Rn e um difeomorfismo vertical h : V × W → Z, de classe C k , tal que f (h(x, w)) = w para todo x ∈ V e todo w ∈ W . U Rn Z p f ϕ h V ×W W f ◦ h : (x, w) 7→ w (a, c) c = f (p) Rm V a Figura 6.1 Demonstração. Seja ϕ : U → Rm ×Rn a aplicação de classe C k definida por ϕ(x, y) = (x, f (x, y)). A matriz jacobiana de ϕ tem a forma I 0 , Jϕ = a b onde I é a matriz identidade m × m e a matriz n × n ∂fi (z) b = b (z) = ∂yj é, no ponto p = (a, b), invertı́vel. Pelo Teorema da Aplicação Inversa, ϕ é um difeomorfismo de um aberto Z ∋ p sobre um aberto de Rm × Rn , o qual podemos supor da forma V ×W , onde V ⊂ Rm e W ⊂ Rn , com a ∈ V e c = f (a, b) ∈ W . O difeomorfismo inverso h : V ×W → Z é da forma h(x, w) = (x, h2 (x, w)). Então, para qualquer (x, w) ∈ V × W , tem-se (x, w)=ϕ(h(x, w))=ϕ(x, h2 (x, w))=(x, f (x, h2 (x, w)))=(x, f (h(x, w))), logo f (h(x, w)) = w para qualquer (x, w) ∈ V × W . Seção 2 Várias Funções Implı́citas 119 Dada f : U → Rn , de classe C k no aberto U ⊂ Rm+n , a matriz de sua derivada f ′ (p) : Rm+n → Rn tem n linhas e m + n colunas. Ela é a matriz jacobiana Jf (p). Dizer que a transformação linear f ′ (p) é sobrejetiva significa afirmar que é possı́vel escolher n dessas colunas de modo que a matriz n × n resultante seja invertı́vel. No enunciado do teorema acima, as colunas escolhidas são as n últimas porém isto nada tem de essencial; trata-se apenas de simplificar a notação. Quando a aplicação f : U → Rn , com U ⊂ Rm+n , possui derivada sobrejetiva f ′ (z) : Rm+n → Rn em todo ponto z ∈ U , diz-se que f é uma submersão. No Teorema 5, a restrição de f ao aberto Z é uma submersão. Com esta terminologia, podemos enunciar o Corolário 3. Seja f : U → Rn uma submersão de classe C k , definida no aberto U ⊂ Rm+n . Para cada ponto z ∈ U existem abertos Z ⊂ U , contendo z, W ⊂ Rn contendo c = f (z), V ⊂ Rm e um difeomorfismo h : V × W → Z de classe C k , tais que f (h(x, w)) = w para todo x ∈ V e todo w ∈ W . Como f ′ (z) : Rm+n → Rn é sobrejetiva, n das m + n colunas da matriz jacobiana Jf (z) são linearmente independentes, logo formam uma matriz invertı́vel n × n. Se essas forem as últimas colunas, o corolário é meramente o Teorema 5. Se não forem, modificamos ligeiramente a demonstração daquele teorema, permutando inicialmente as coordenadas em Rm+n de modo que as n colunas linearmente independentes de Jf (z) sejam agora as últimas. Teorema 6 (Teorema das Funções Implı́citas). Seja f = (f1 , . . . , fn ) : U → Rn de classe C k (k ≥ 1) no aberto U ⊂ Rm+n . Suponhamos que, no ponto p = (a, b) ∈ U , com f (p) = c, a matriz n×n ∂fi (p) (i, j = 1, . . . , n) ∂yj seja invertı́vel. Então existem Z ⊂ U , aberto contendo p, V ⊂ Rm , aberto contendo a, e ξ : V → Rn de classe C k , com ξ(a) = b, com a seguinte propriedade: [(x, y) ∈ Z e f (x, y) = c] ⇔ [x ∈ V e y = ξ(x)]. A equivalência acima significa que f −1 (c)∩Z é o gráfico de ξ, isto é, f −1 (c) ∩ Z = {(x, ξ(x)); x ∈ V }. 120 Aplicações Inversas e Implı́citas Cap. 6 Demonstração. Sejam Z, V , W e h como no Teorema 5. Definamos ξ : V → Rn pondo ξ(x) = h2 (x, c), onde h2 : V × W → Rn é a segunda coordenada de h, ou seja, h(x, w) = (x, h2 (x, w)). Assim, (x, y) ∈ Z ⇒ x ∈ V e (x, y) = h(x, w), w ∈ W . Se, além disso, tem-se f (x, y) = c então c = f (x, y) = f (x, ξ(x)) e y = ξ(x). Resumindo: (x, y) ∈ Z e f (x, y) = c implicam x ∈ V e y = ξ(x). Reciprocamente, se x ∈ V e y = ξ(x) então y = h2 (x, c) e f (x, y) = f (x, h2 (x, c)) = f (h(x, c)) = c. O corolário abaixo é uma reformulação mais intrı́nseca do Teorema 6. Corolário 4. Seja f : U → Rn de classe C k no aberto U ⊂ Rm+n . Se, no ponto p ∈ U , com f (p) = c, a derivada f ′ (p) : Rm+n → Rn é sobrejetiva então existe um aberto Z ⊂ U , com p ∈ Z, tal que f −1 (c) ∩ Z é o gráfico de uma aplicação ξ : V → Rn , de classe C k num aberto V ⊂ Rm . A abordagem clássica do Teorema das Funções Implı́citas era a seguinte: “Se f1 , . . . , fn são funções reais de m + n variáveis, k vezes continuamente diferenciáveis, e p = (a1 , . . . , am , b1 , . . . , bn ) é uma solução particular do sistema de equações f1 (x1 , . . . , xm , y1 , . . . , yn ) = c1 f2 (x1 , . . . , xm , y1 , . . . , yn ) = c2 .. . fn (x1 , . . . , xm , y1 , . . . , yn ) = cn , sendo a matriz n × n ∂fi (p) ∂yj invertı́vel, então as equações acima definem, de modo único, na vizinhança do ponto p em Rm+n , as variáveis y1 , . . . , yn como funções de classe C k das variáveis x1 , . . . , xm : y1 = ξ1 (x1 , . . . , xm ), . . . , yn = ξn (x1 , . . . , xm )”. Escrevendo x = (x1 , . . . , xm ) e ξ(x) = (ξ1 (x), . . . , ξn (x)) tem-se, para cada i = 1, . . . , n, com x numa vizinhança de a = (a1 , . . . , am ): fi (x, ξ1 (x), . . . , ξn (x)) = ci , ou fi (x, ξ(x)) = ci . Derivando cada uma dessas n identidades em relação a xj , vem: n ∂fi X ∂fi ∂ξk + · = 0, ∂xj ∂yk ∂xj k=1 j = 1, . . . , m. Seção 2 Várias Funções Implı́citas 121 Em termos matriciais, isto significa que   ∂ξ    ∂f  ∂f1 ∂f1 1 1 ...  ∂y1  ∂xj   ∂xj  ∂yn    .   .  ..  ..     .  = −  .. . . . .    ..      ∂fn   ∂fn  ∂ξn  ∂fn ... ∂xj ∂y1 ∂yn ∂xj ou seja:  ∂ξ   ∂f1  ∂xj   ∂y1  .    .  = −  ..  .   .  ∂ξn   ∂fn ∂xj ∂y1 1 ... .. . ...    ∂f1 −1 ∂f1  ∂xj  ∂yn    ..    ..  .   .  ∂fn   ∂fn  ∂yn ∂xj ∂ξi a partir de f1 , . . . , fn , sem ser ∂xj necessário conhecer explicitamente as funções ξ1 , . . . , ξn . Sob o ponto de vista da Álgebra Linear intrı́nseca, a fim de mostrar como a derivada ξ ′ (x) : Rm → Rn pode ser calculada quando se conhece f mas não ξ explicitamente, é preciso estender o conceito de derivada parcial. As transformações lineares Isto exibe as derivadas parciais ∂f (z) : Rm → Rn ∂x e ∂f (z) : Rn → Rn , ∂y cujas matrizes nas bases canônicas dos espaços euclidianos em questão são ∂fi ∂fi (z) ∈ M (n × m) e (z) ∈ M (n × n), ∂xj ∂yj são chamadas as derivadas parciais de f no ponto z, relativamente à decomposição Rm+n = Rm ⊕ Rn , obtida ao se escrever cada z ∈ Rm+n ∂f sob a forma z = (x1 , . . . , xm , y1 , . . . , yn ). Assim, (z) é a restrição ∂x da transformação linear f ′ (z) : Rm+n → Rn ao subespaço Rm ⊂ Rm+n ∂f (z) é a restrição de f ′ (z) ao subespaço formado pelos vetores (x, 0) e ∂y Rn que consiste nos vetores da forma (0, y). Para todo vetor w = (u, v) ∈ Rm+n , tem-se ∂f ∂f (z) · u + (z) · v. f ′ (z) · w = ∂x ∂y 122 Aplicações Inversas e Implı́citas Cap. 6 Usando estas derivadas parciais, a Regra da Cadeia nos permite concluir, a partir da identidade f (x, ξ(x)) = c para todo x ∈ V , que ∂f ∂f (z) + (z) · ξ ′ (x) = 0, com z = (x, ξ(x)). ∂x ∂y Logo −1 ∂f ∂f ξ (x) = − (z) · (z), ∂y ∂x ′ ainda com z = (x, ξ(x)). Note que a hipótese do Teorema das Funções ∂f (z) : Rn → Rn é inImplı́citas assegura que a transformação linear ∂y vertı́vel para todo z na vizinhança de p. Exemplo 4. Diz-se que o número complexo c é uma raiz simples do polinômio p quando se tem p(z) = (z − c)q(z) com q(c) 6= 0. O Teorema 6 pode ser usado para mostrar que as raı́zes simples de um polinômio dependem diferenciavelmente dos coeficientes desse polinômio. A fim de provar isto escrevemos, para cada a = (a0 , . . . , an ) ∈ Cn+1 = R2n+2 e cada z ∈ C = R2 , pa (z) = p(a0 , . . . , an , z) = a0 + a1 z + · · · + an z n . ∂p (c) = p′a (c) = q(c), logo a Então, de pa (z) = (z − c)q(z) resulta ∂z ∂p matriz jacobiana (real) 2 × 2, (c), é invertı́vel, por ser a matriz da ∂z 2 transformação linear de R que consiste na multiplicação pelo número complexo não-nulo q(c). Portanto, em virtude do Teorema 6, existem bolas abertas B = B(a; ε) em Cn+1 e B ′ = B(c; δ) em C tais que, para todo b ∈ B, o polinômio pb possui uma única raiz ξ(b) ∈ B ′ , a qual é simples, e a aplicação ξ : B → R2 , assim definida, é de classe C ∞ . ⊳ 3 Exercı́cios Seção 1. O Teorema da Aplicação Inversa 1. Sejam ϕ : U → Rm de classe C 1 no aberto U ⊂ Rm e c ∈ [0, 1) tais que |ϕ(x) − ϕ(y)| ≤ c|x − y| para quaisquer x, y ∈ U . Prove que f : U → Rm , dada por f (x) = x+ϕ(x), é um difeomorfismo de U sobre o aberto V = f (U ) ⊂ Rm . Se U = Rm , prove que f (U ) = Rm . 2 2. Para todo k ∈ N, prove que existem abertos U, V ⊂ M (n × n) = Rn tais que toda matriz y ∈ V possui uma única raiz k-ésima x ∈ U , isto é, tal que x k = y . Seção 3 Exercı́cios 123 n(n+1) 3. Seja U ⊂ R 2 o conjunto dos operadores positivos A : Rn → Rn (representados por suas matrizes). Use o Teorema Espectral e prove que a aplicação x) = x 2 , é um difeomorfismo C ∞ . f : U → U , dada por f (x 4. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rn , com n > 1. Se o determinante jacobiano de f se anula apenas num conjunto de pontos isolados, prove que f transforma todo aberto A ⊂ U num aberto f (A). Use este fato para demonstrar que todo polinômio complexo não-constante p : R2 → R2 é uma aplicação sobrejetiva, provando assim o Teorema Fundamental da Álgebra. 5. A seqüência de passos deste exercı́cio leva à conclusão de que, dados quaisquer dois pontos a, b no aberto conexo U ⊂ Rn , existe um difeomorfismo h : U → U , de classe C ∞ , tal que h(a) = b. Os passos são: 1 5a. A função α : Rn → R, dada por α(x) = exp − se |x| < 1 e α(x) = 0 1 − |x|2 ∞ se |x| ≥ 1, é de classe C e, pondo ϕ(x) = e · α(x), tem-se ϕ : Rn → R de classe C ∞ , com 0 < ϕ(x) ≤ 1 se |x| < 1, ϕ(0) = 1 e ϕ(x) = 0 se |x| ≥ 1. 5b. Seja c > 0 tal que c · sup · |ϕ′ (y)| · |b − a| < 1. A aplicação g : Rn → Rn , y∈Rn definida por g(x) = x + ϕ(c(x − a)) · (b − a) é um difeomorfismo C ∞ tal que g(a) = b e g(x) = x se |x − a| ≥ 1/c. 5c. Usando o Exemplo 1, vê-se que, para quaisquer pontos a, b numa bola aberta B ⊂ Rn , existe um difeomorfismo k : B → B, de classe C ∞ tal que k(a) = b e k(x) = x fora de um compacto K ⊂ B. 5d. Dados U ⊂ Rn aberto, conexo, e a, b ∈ U , o conjunto A dos pontos x ∈ U tais que existe um difeomorfismo h : U → U , de classe C ∞ , com h(a) = x, é aberto e seu complementar U − A também. Logo A = U e portanto b ∈ A. 5e. O difeomorfismo h : U → U , acima obtido, é tal que existe K ⊂ U compacto, com h(x) = x se x ∈ U − K. Seção 2. Várias funções implı́citas 1. Prove que toda submersão f : U → Rn de classe C 1 é uma aplicação aberta, isto é, A ⊂ U aberto ⇒ f (A) ⊂ Rn aberto. 2. Seja f = (f1 , . . . , fn ) : U → Rn diferenciável. Prove que f é uma submersão se, e somente se, em cada ponto x ∈ U os vetores grad f1 (x), . . . , grad fn (x) são linearmente independentes. 2 3. Seja U ⊂ Rn um conjunto aberto de matrizes n × n. Prove que a função det : U → R é uma submersão se, e somente se, nenhuma matriz em U tem posto ≤ n − 2. 4. Sejam U ⊂ Rm × Rn , V ⊂ Rm abertos, f : U → Rn de classe C k (k ≥ 1), cumprindo as condições do Teorema 6, ξ : V → Rn contı́nua e c ∈ Rn tais que, para todo x ∈ V , tem-se (x, ξ(x)) ∈ U e f (x, ξ(x)) = c. Prove que ξ é de classe C k . Use este resultado para provar que se ξ : V → R é contı́nua no aberto V ⊂ R2 e, para todo (x, y) ∈ V vale (x2 + y 4 ) · ξ(x, y) + ξ(x, y)3 = 1 então ξ ∈ C∞. 7 Superfı́cies Diferenciáveis 1 Parametrizações Uma imersão do aberto U ⊂ Rm no espaço Rn é uma aplicação diferenciável f : U → Rn tal que, para todo x ∈ U , a derivada f ′ (x) : Rm → Rn é uma transformação linear injetiva. Isto, naturalmente, só pode ocorrer quando m ≤ n. Quando m = n, toda imersão de classe C 1 de U ⊂ Rm em Rn é um difeomorfismo local. Em geral, para m ≤ n quaisquer, o Teorema 2 do Capı́tulo 6 assegura que toda imersão de classe C 1 é uma aplicação localmente injetiva. Exemplo 1. Se I ⊂ R é um intervalo aberto, as imersões f : I → Rn são o que chamamos no Capı́tulo 2 de caminhos regulares. Assim, por exemplo, f : R → R2 , definida por f (t) = (t3 − t, t2 ) é uma imersão de R no plano, a qual não é injetiva, pois f (−1) = f (1) = (0, 1). ⊳ (t3 − t, t2 ) t∈R Figura 7.1 Seção 1 Parametrizações 125 Uma parametrização de classe C k e dimensão m de um conjunto V ⊂ Rn é uma imersão ϕ : V0 → V de classe C k que é, ao mesmo tempo, um homeomorfismo do aberto V0 ⊂ Rm sobre V . Exemplo 2. Dada uma aplicação f : V0 → Rn , de classe C k no aberto V0 ⊂ Rm , seja V = {(x, f (x)); x ∈ V0 } ⊂ Rm+n o gráfico de f . A aplicação ϕ : V0 → V , dada por ϕ(x) = (x, f (x)), é uma parametrização de dimensão m e classe C k do conjunto V ⊂ Rm+n . Com efeito, se chamarmos de π : Rm+n → Rm a projeção sobre as m primeiras coordenadas, a igualdade π ◦ ϕ = idV0 mostra que ϕ é um homeomorfismo, cujo inverso é a restrição π|V e, em virtude da Regra da Cadeia, que π · ϕ′ (x) = idRm , logo ϕ′ (x) : Rm → Rm+n é injetiva, para todo x ∈ V0 , portanto ϕ é uma imersão. ⊳ Exemplo 3. Uma imersão ϕ : V0 → V pode muito bem ser bijetiva sem ser um homeomorfismo, logo não é uma parametrização de V . Um exemplo disso pode ser obtido tomando a restrição do caminho f , visto no Exemplo 1 acima, ao intervalo (−1, +∞) ⊂ R. O caminho ϕ : (−1, +∞) → R2 , dado por ϕ(t) = (t3 − t, t2 ), é uma imersão C ∞ bijetiva do intervalo (−1, +∞) em R2 mas não é uma parametrização da sua imagem V pois a função inversa ϕ−1 : V → (−1, +∞) é descontı́nua no ponto (0, 1) ∈ V . Com efeito, se (tn ) é uma seqüência decrescente de números reais com lim tn = −1, vemos que lim ϕ(tn ) = (0, 1) = ϕ(1) sem que se tenha lim tn = 1. (t3 − t, t2 ) t > −1 Figura 7.2 Exemplo 4. Seja N = (0, . . . , 0, 1) o pólo norte da esfera unitária S n = {x ∈ Rn+1 ; hx, xi = 1}. Pondo V = S n − {N } e V0 = Rn , o homeomorfismo ϕ : V0 → V , inverso da projeção estereográfica ξ, (vide Exemplo 16, Capı́tulo 1), é uma parametrização. Evidentemente, ϕ é 126 Superfı́cies Diferenciáveis Cap. 7 de classe C ∞ e sua inversa ξ : S n − {N } → Rn é a restrição de uma aplicação C ∞ (cujo domı́nio é o aberto U = {x ∈ Rn+1 ; xn+1 6= 1}). A igualdade ξ ◦ ϕ = idRn mostra, via Regra da Cadeia, que ϕ é uma imersão, o que completa a verificação. ⊳ 2 Superfı́cies diferenciáveis Um conjunto M ⊂ Rn chama-se uma superfı́cie de dimensão m e classe C k quando todo ponto p ∈ M está contido em algum aberto U ⊂ Rn tal que V = U ∩ M é a imagem de uma parametrização ϕ : V0 → V , de dimensão m e classe C k . O conjunto V é um aberto em M , chamado uma vizinhança parametrizada do ponto p. Escreve-se m = dim ·M . Observação. Na definição acima, supõe-se tacitamente k ≥ 1. Mas teria sentido considerar superfı́cies de classe C 0 . Bastaria admitir “parametrizações de classe C 0 ”, que são meramente homeomorfismos ϕ : V0 → V de abertos V0 ⊂ Rm sobre abertos V ⊂ M . As superfı́cies de classe C 0 são estudadas na Topologia. Seu interesse em Análise é reduzido, principalmente porque não possuem espaços tangentes. Quando dim ·M = 1, a superfı́cie M chama-se uma curva. Exemplo 5. Como R0 = {0} reduz-se a um ponto, uma superfı́cie de dimensão 0 em Rn é simplesmente um conjunto discreto. No extremo oposto, as superfı́cies de dimensão n em Rn são os subconjuntos abertos, pois a imagem de uma parametrização de dimensão n em Rn é aberta, em virtude do Teorema da Aplicação Inversa. ⊳ Exemplo 6. A esfera S n é uma superfı́cie de dimensão n e classe C ∞ em Rn+1 . Com efeito, a inversa da projeção estereográfica é uma parametrização ϕ : Rn → S n −{N }. Para obter uma vizinhança parametrizada do pólo norte N , basta considerar −ϕ : Rn → S n − {N ∗ }, onde N ∗ = −N é o pólo sul. ⊳ Exemplo 7. O produto cartesiano M × N de duas superfı́cies M ⊂ Rn e N ⊂ Rk é uma superfı́cie em Rn+k pois se ϕ : V0 → V ⊂ M e ψ : W0 → W ⊂ N são parametrizações então ξ : V0 × W0 → V × W ⊂ M × N , dada por ξ(x, y) = (ϕ(x), ψ(y)), é uma parametrização. Evidentemente, dim(M × N ) = dim M + dim N . Em particular, o toro m-dimensional T m = S 1 × · · · × S 1 , produto cartesiano de m cı́rculos, é uma superfı́cie de dimensão m e classe C ∞ em R2m . ⊳ Seção 2 Superfı́cies diferenciáveis 127 Exemplo 8. O gráfico de uma aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm , é uma superfı́cie M = {(x, f (x)) ∈ Rm+n ; x ∈ U }, de dimensão m e classe C k em Rm+n . Com efeito, M é a imagem da única parametrização ϕ : U → M , ϕ(x) = (x, f (x)). ⊳ Ser uma superfı́cie é uma propriedade local: se todo ponto p ∈ M está contido num conjunto V ⊂ M , aberto em M , o qual é uma superfı́cie de classe C k e dimensão m, então o conjunto M ⊂ Rn é uma superfı́cie de dimensão m e classe C k . Em particular, se M é localmente o gráfico de uma aplicação f : V0 → Rn , de classe C k num aberto V0 ⊂Rm , então M ⊂Rm+n é uma superfı́cie de classe C k e dimensão m. Assim, por exemplo, as hiperfı́cies, conforme definidas no Capı́tulo 4, são superfı́cies de dimensão n − 1 em Rn . Quando M ⊂ Rn é uma superfı́cie de dimensão m, costuma-se dizer que M tem co-dimensão n − m. Portanto, hiperfı́cies são superfı́cies de co-dimensão 1. No teorema abaixo, M é uma superfı́cie de dimensão m e classe C k em Rn . Por “uma projeção π : Rn → Rm ”entendemos uma aplicação dada por π(x1 , . . . , xn ) = (xi1 , . . . , xim ), definida a partir da escolha de m ı́ndices i1 < · · · < im , compreendidos entre 1 e n. Teorema 1. Seja ϕ : V0 → V uma parametrização em M . Para cada p = ϕ(x0 ) ∈ V existe uma projeção π : Rn → Rm tal que π ◦ ϕ aplica um aberto Z0 , com x0 ∈ Z0 ⊂ V0 , difeomorficamente sobre um aberto W0 ⊂ Rm . V M W ϕ π Rm x0 V0 Z0 π ◦ϕ W0 Figura 7.3 128 Superfı́cies Diferenciáveis Cap. 7 ∂ϕi (x0 ) ∈ M (n × m) tem m Demonstração. A matriz jacobiana ∂xj linhas linearmente independentes, de ı́ndices i1 < i2 < ·· · < im . Essas ∂ϕik linhas formam a matriz m × m invertı́vel J = (x0 ) e os ı́ndices ik ∂xj definem uma projeção π : Rn → Rm . Observando que J é a matriz jacobiana da aplicação π ◦ ϕ : V0 → Rm , o Teorema 1 resulta imediatamente do Teorema da Aplicação Inversa. Corolário 1. Toda superfı́cie de classe C k é localmente o gráfico de uma aplicação de classe C k . Com efeito, usando a notação do Teorema 1, escrevamos os elementos de Rn sob a forma z = (y, y ′ ), onde y = π(z). Ponhamos também W = ϕ(Z0 ). Então a aplicação ψ = ϕ ◦ (π ◦ ϕ)−1 : W0 → W é uma parametrização. Além disso, para todo y ∈ W0 , tem-se π(ψ(y)) = (π ◦ ϕ) ◦ (π ◦ ϕ)−1 (y) = y, logo ψ(y) = (y, y ′ ). Assim, W é o gráfico da aplicação de classe C k , f : W0 → Rn−m , dada por f (y) = y ′ . Corolário 2. Seja M ⊂ Rn uma superfı́cie de classe C k e dimensão m. Se uma aplicação f : V0 → Rn , de classe C k no aberto V0 ⊂ Rp , tiver sua imagem f (V0 ) contida na vizinhança W ⊂ M , parametrizada por ψ : W0 → W , então ψ −1 ◦ f : V0 → Rm é uma aplicação de classe C k . Com efeito, para cada ponto x0 ∈ V0 , com f (x0 ) = ψ(y0 ), existe, pelo Teorema 1, uma projeção π : Rn → Rm tal que π ◦ ψ é um difeomorfismo de uma vizinhança de y0 sobre um aberto de Rm . Então, numa vizinhança de x0 , podemos escrever ψ −1 ◦ f = (π ◦ ψ)−1 ◦ π ◦ f, logo ψ −1 ◦ f é de classe C k . Sejam ϕ : V0 → V e ψ : W0 → W parametrizações numa superfı́cie M , de classe C k e dimensão m. Suponhamos que V ∩ W 6= ∅. Então todo ponto p ∈ V ∩ W pode escrever-se como p = ϕ(x), x ∈ V0 e, como p = ψ(y), y ∈ W0 , pode ser representado pelos m parâmetros que são as coordenadas de x e pelas m coordenadas de y. A correspondência x 7→ y, definida pela relação ϕ(x) = ψ(y), é a aplicação ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ), chamada mudança de parametrização. Seção 3 O espaço vetorial tangente W V M V0 129 ψ ϕ W0 ψ −1 ◦ϕ Rm Figura 7.4 Corolário 3. Numa superfı́cie de classe C k , toda mudança de parametrização ψ −1 ◦ ϕ é um difeomorfismo de classe C k . Com efeito, pelo Corolário 2, ψ −1 ◦ ϕ é uma aplicação de classe C k . Pelo mesmo motivo, sua inversa ϕ−1 ◦ ψ também é de classe C k . Logo ψ −1 ◦ ϕ é um difeomorfismo. Exemplo 9. O conjunto M = {(x, x4/3 ); x ∈ R}, gráfico da função f : R → R, f (x) = x4/3 , é uma curva de classe C 1 em R2 : a aplicação ϕ : R → R2 , dada por ϕ(x) = (x, x4/3 ), é uma parametrização (global) de M . Cabe observar, porém, que se V ⊂ M contém o ponto (0, 0), não pode existir uma parametrização ψ : V0 → V de classe C k com k > 1. Com efeito, se uma tal ψ existisse então o próprio conjunto V seria uma curva de classe C k logo, pelo Corolário 1, uma vizinhança W do ponto (0, 0), com W ⊂ V , seria o gráfico de uma função g : W0 → R, de classe C k . Neste caso, para todo x ∈ W0 terı́amos (x, g(x)) ∈ W ⊂ M , logo g(x) = x4/3 , mas x4/3 é apenas de classe C 1 . Assim, M não é uma curva de classe C 2 . ⊳ 3 O espaço vetorial tangente Seja p um ponto da superfı́cie M , de dimensão m e classe C k em Rn . O espaço vetorial tangente a M no ponto p é um subespaço vetorial Tp M ⊂ Rn que pode ser visto sob dois aspectos: 130 Superfı́cies Diferenciáveis Cap. 7 1) Tp M é o conjunto dos vetores-velocidade v = λ′ (0) dos caminhos diferenciáveis λ : (−ε, ε) → M , tais que λ(0) = p. 2) Tp M = ϕ′ (x0 ) · Rm é a imagem da derivada ϕ′ (x0 ) : Rm → Rn , onde ϕ : V0 → V é uma parametrização em M , com ϕ(x0 ) = p. A primeira descrição de Tp M é intrı́nseca (não depende de escolhas arbitrárias) mas não deixa claro que se trata de um subespaço vetorial de Rn . Pela segunda descrição, Tp M é obviamente um subespaço vetorial de Rn mas não é evidente que para outra parametrização ψ : W0 → W , com ψ(y0 ) = p, se tenha ψ ′ (y0 ) · Rm = ϕ′ (x0 ) · Rm . As dúvidas ficarão sanadas se mostrarmos que os conjuntos definidos em 1) e 2) são o mesmo. Para ver isto, comecemos com o vetorvelocidade v = λ′ (0) de um caminho diferenciável λ : (−ε, ε) → M , com λ(0) = p. Restringindo ε, se necessário, podemos admitir que a imagem de λ esteja contida na imagem V de uma parametrização ϕ : V0 → V ⊂ M , com ϕ(x0 ) = p. Então, pelo Corolário 2, µ = ϕ−1 ◦ λ : (−ε, ε) → V0 é um caminho diferenciável em Rm , com µ(0) = x0 . Pondo u = µ′ (0), temos ϕ′ (x0 ) · u = ϕ′ (x0 ) · (ϕ−1 ◦ λ)′ (0) = (ϕ ◦ ϕ−1 ◦ λ)′ (0) = λ′ (0) = v. Portanto todo vetor v = λ′ (0) pertence à imagem ϕ′ (x0 ) · Rm de Rm pela derivada de alguma parametrização ϕ : V0 → V , com p ∈ V . Reciprocamente, se v = ϕ′ (x0 ) · u então, como u = µ′ (0), onde µ : (−ε, ε) → V0 é dado por µ(t) = x0 + t · u, temos v = λ′ (0) com λ : (−ε, ε) → V , λ(t) = ϕ(µ(t)), logo v está no conjunto definido em 1). Como toda parametrização ϕ é uma imersão, a derivada ϕ′ (x0 ) : m R → Rn é uma transformação linear injetiva, logo sua imagem ϕ′ (x0 ) · Rm = Tp M é um subespaço vetorial m-dimensional de Rn . Os vetores ∂ϕ ∂ϕ (x0 ) = ϕ′ (x0 ) · e1 , . . . , (x0 ) = ϕ′ (x0 ) · em ∂x1 ∂xm formam uma base de Tp M , chamada a base associada à parametrização ϕ. A seguir estenderemos, para superfı́cies quaisquer, o Teorema 3 do Capı́tulo 4, provado para o caso de co-dimensão 1. Seja f : U → Rn uma aplicação diferenciável, definida no aberto U ⊂ Rm+n . Um ponto c ∈ Rn chama-se um valor regular de f quando, Seção 3 O espaço vetorial tangente 131 para todo x ∈ U tal que f (x) = c, a derivada f ′ (x) : Rm+n → Rn é uma transformação linear sobrejetiva. Observe-se que, para n = 1, a transformação linear f ′ (x) : Rm+1 → R é sobrejetiva se, e somente se, é diferente de zero, ou seja, grad f (x) 6= 0. (Vide Exemplo 2, Capı́tulo 5.) Portanto esta definição de valor regular estende a que foi dada anteriormente. Teorema 2. Seja c ∈ Rn um valor regular da aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n . A imagem inversa M = f −1 (c) = {x ∈ U ; f (x) = c} é uma superfı́cie de classe C k e dimensão m em Rm+n . O espaço vetorial tangente Tp M , em cada ponto p ∈ M , é o núcleo da derivada f ′ (p) : Rm+n → Rn . Demonstração. Pelo Corolário 4, Capı́tulo 6, M = f −1 (c) é localmente o gráfico de uma aplicação de classe C k , logo é uma superfı́cie. Além disso, para p ∈ M , todo vetor v ∈ Tp M é da forma v = λ′ (0), onde λ : (−ε, ε) → M é um caminho diferenciável, com λ(0) = p. Logo f ′ (p) · v = (f ◦ λ)′ (0) = 0 pois f ◦ λ : (−ε, ε) → Rn é constante, igual a c. Portanto Tp M está contido no núcleo de f ′ (p). Como f ′ (p) é sobrejetiva, esse núcleo tem dimensão m e então é igual a Tp M . Exemplo 10. Seja O(Rn ) o grupo ortogonal, formado pelas matrizes x ∈ M (n × n), tais que x · x T = I n (matrizes ortogonais). Usaremos o Teorema 2 para mostrar que O(Rn ) é uma superfı́cie (compacta), de 2 classe C ∞ e dimensão n(n − 1)/2 em Rn . Seja então f : M (n × n) → S(Rn ) a aplicação definida no conjunto das matrizes n × n, com valores x) = no conjunto S(Rn ) das matrizes simétricas n × n, pela fórmula f (x 2 T n x · x . Já costumamos fazer a identificação M (n × n) = R . Agora identificaremos S(Rn ) com Rn(n+1)/2 pois uma matriz simétrica n × n fica determinada pelos seus elementos da diagonal e acima dela, em número de n + (n − 1) + · · · + 2 + 1 = n(n + 1)/2. Assim, escrevemos 2 f : Rn → Rn(n+1)/2 e temos O(Rn ) = f −1 (II n ). Resta apenas verificar que a matriz identidade I n é um valor regular de f . Tomando um ponto arbitrário de f −1 (II n ), isto é, uma matriz ortogonal x , sabemos que a 2 x) : Rn → Rn(n+1)/2 é a transformação linear que a toda derivada f ′ (x 2 x) · v = v · x T + x · v T . Para provar que v ∈ Rn faz corresponder f ′ (x ′ x) é sobrejetiva, seja dada s ∈ Rn(n+1)/2 . Tomando v = sx f (x sx/2 temos ′ T T x) · v = sx · x /2 + xx · s /2 = s /2 + s /2 = s . (Lembre que s T = s .) f (x Vale dim O(Rn ) = n2 − n(n + 1)/2 = n(n − 1)/2. 132 Superfı́cies Diferenciáveis Cap. 7 Observemos, em relação ao Exemplo 10, que o espaço vetorial tangente a O(Rn ) no ponto I n é o conjunto das matrizes anti-simétricas n × n, isto é, matrizes v tais que v + v T = 0. Com efeito, sendo a deri2 vada f ′ (II n ) : Rn → Rn(n+1)/2 dada por v 7→ v · I Tn + I n · v T , vemos que o núcleo de f ′ (II n ), ou seja, o espaço vetorial tangente a O(Rn ) no ponto I n , é o conjunto das matrizes anti-simétricas. 4 Superfı́cies orientáveis Como no caso de hiperfı́cies (co-dimensão 1), tratado no Capı́tulo 4, cabe observar que nem toda superfı́cie em Rn pode ser obtida como imagem inversa de um valor regular. Com efeito, se M = f −1 (c) 6= ∅ é a imagem inversa do valor regular c ∈ Rn pela aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n então, chamando de f1 , . . . , fn : U → R as funções-coordenada de f , vemos que grad f1 , . . . , grad fn : U → Rm+n são campos de vetores de classe C k−1 , com as seguintes propriedades: 1) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são ortogonais ao espaço vetorial tangente Tx M . (Diz-se então que os grad fi são campos de vetores normais a M .) 2) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são linearmente independentes. A afirmação 1) resulta do fato de que, para cada i = 1, . . . , n, a função fi : U → R é constante ao longo de M . Todo vetor v ∈ Tx M , para x ∈ M qualquer, é o vetor-velocidade v = λ′ (0) de um caminho λ : (−ε, ε) → M , logo fi ◦ λ : (−ε, ε) → R é constante. Daı́, h grad fi (x), vi = (fi ◦ λ)′ (0) = 0. Por sua vez, a afirmação 2) é equivalente a dizer que c é um valor regular de f , pois grad f1 (x), . . . , grad fn (x) são os vetores-linha da matriz ∂fi jacobiana (x) ∈ M (n×(m+n)). Sua independência linear significa ∂xj que esta matriz, para todo x ∈ M , tem posto n, logo f ′ (x) : Rm+n → Rn é sobrejetiva. Mas nem toda superfı́cie M ⊂ Rm+n , de co-dimensão n, admite n campos contı́nuos linearmente independentes de vetores normais. Uma condição necessária para isto é que M seja orientável, conforme mostraremos agora. Seção 4 Superfı́cies orientáveis 133 Um atlas numa superfı́cie M é um conjunto de parametrizações ϕ : V0 → V cujas imagens V cobrem M . Duas parametrizações ϕ : V0 → V e ψ : W0 → W dizem-se compatı́veis quando V ∩ W = ∅ ou então V ∩ W 6= ∅ e ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ) tem determinante jacobiano positivo em todos os pontos x ∈ ϕ−1 (V ∩ W ). Um atlas A na superfı́cie M chama-se coerente quando duas parametrizações quaisquer ϕ, ψ ∈ A são compatı́veis. Uma superfı́cie M chama-se orientável quando admite um atlas coerente. Teorema 3. Se uma superfı́cie M ⊂ Rm+n , de co-dimensão n, admite n campos contı́nuos linearmente independentes de vetores normais v1 , . . . , vn : M → Rm+n então M é orientável. Demonstração. Seja A o conjunto das parametrizações ϕ : V0 → V em M tais que V0 é conexo e, para todo x ∈ V0 , a matriz ∂ϕ ∂ϕ Φ (x) = (x), . . . , (x), v1 (ϕ(x)), . . . , vn (ϕ(x)) , ∂x1 ∂xm cujas m + n colunas são os vetores de Rm+n aı́ indicados, tem determinante positivo. Como V0 é conexo e os campos vi são contı́nuos, para ser ϕ ∈ A basta que det Φ(x) > 0 para algum x ∈ V0 . Se for det Φ(x) < 0, escrevemos x∗ = (−x1 , x2 , . . . , xm ) quando x = (x1 , x2 , . . . , xm ) e pomos V0∗ = {x∗ ; x ∈ V0 }. Então ϕ∗ : V0∗ → V , dada por ϕ∗ (x) = ϕ(x∗ ), é uma parametrização cuja imagem ainda é V mas det Φ ∗ (x) > 0. Isto mostra que A é um atlas em M . Sejam ϕ, ψ ∈ A, com ϕ : V0 → V , ψ : W0 → W e V ∩ W 6= ∅. Pondo ξ = ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ), temos ϕ = ψ ◦ ξ. A Regra da Cadeia nos dá, para x ∈ ϕ−1 (V ∩ W ), y = ξ(x) e 1 ≤ i, j ≤ m: m X ∂ψi ∂ϕi (x) = (y) · akj (x) , ∂xj ∂yk k=1 onde a (x) = [akj (x)] é a matriz jacobiana de ξ no ponto x. Portanto se, para cada x ∈ ϕ−1 (V ∩ W ) e y = ξ(x), escrevermos ∂ψ ∂ψ Ψ (y) = (y), . . . , (y), v1 (ψ(y)), . . . , vm (ψ(y)) , ∂y1 ∂ym a (x) 0 teremos Φ (x) = Ψ (y) · A (x), onde A (x) = é a matriz (m + 0 I n) × (m + n) formada a partir dos blocos a (x) ∈ M (m × m) e I = matriz 134 Superfı́cies Diferenciáveis Cap. 7 identidade n×n. Então det Φ (x) = det Ψ (y)·det a (x) e daı́ det a (x) > 0. Logo as parametrizações ϕ, ψ ∈ A são compatı́veis. O atlas A é coerente e a superfı́cie M é orientável. Corolário 4. Se M = f −1 (c) é a imagem inversa de um valor regular da aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n , então M é uma superfı́cie m-dimensional orientável. Assim, por exemplo, o grupo ortogonal O(Rn ) é uma superfı́cie orientável. Para co-dimensão 1, vale a recı́proca do Teorema 3. Ela resulta da existência do produto vetorial w = v1 × · · · × vn de n vetores em Rn+1 , que descreveremos agora. O produto w = v1 ×· · ·×vn é igual a zero quando os vetores v1 , . . . , vn são linearmente dependentes. Caso contrário, w é o vetor que é ortogonal ao subespaço gerado por esses n vetores, tem comprimento igual ao volume do paralelepı́pedo n-dimensional por eles determinado e seu sentido é dado pela condição det[v1 , . . . , vn , w] > 0. Em termos formais, seja m = [v1 , . . . , vn ] a matriz (n + 1) × n cujas colunas são os vetores dados. Para cada i = 1, . . . , n + 1, indiquemos com m i a matriz n × n obtida de m omitindo a i-ésima linha. Então o produto vetorial w = v1 × · · · × vn é definido por w = v1 × · · · × vn = n+1 X i=1 (−1)n+i+1 det m i · ei . O desenvolvimento de Laplace de um determinante em relação à sua última coluna mostra que, para todo vetor z ∈ Rn+1 , tem-se hv1 × · · · × vn , zi = det[v1 , . . . , vn , z]. Esta última igualdade mostra que, de fato, v1 × · · · × vn = w é ortogonal a v1 , . . . , vn , que é zero quando esses vetores são linearmente dependentes e que det[v1 , . . . , vn , w] ≥ 0. Além disso, sabe-se que o volume (n + 1)-dimensional do paralelepı́pedo cujas arestas são v1 , . . . , vn , w é o produto do volume n-dimensional Vn de sua base (a qual tem v1 , . . . , vn como arestas) pelo comprimento de sua altura, que é |w|, pois w é ortogonal a essa base. Logo |w| · Vn = vol[v1 , . . . , vn , w] = | det[v1 , . . . , vn , w]| = hv1 × · · · × vn , wi = |w|2 . Seção 4 Superfı́cies orientáveis 135 Simplificando, vem |w| = Vn , ou seja, o comprimento do produto vetorial v1 × · · · × vn é o volume n-dimensional do paralelepı́pedo cujas arestas são os vetores v1 , . . . , vn . (Para maiores detalhes sobre o volume de um paralelepı́pedo, ver o Apêndice a este capı́tulo.) Concluindo estas considerações sobre o produto vetorial, mostraremos agora que se {u1 , . . . , un } e {v1 , . . . , vn } são bases do subespaço vetorial E ⊂ Rn+1 e se a = [aij ] é a matriz de passagem da primeira n P aij ui (j = 1, . . . , n), então para a segunda, isto é, vj = i=1 v1 × · · · × vn = det a · u1 × · · · × un . Com efeito, como ambos estes produtos vetoriais são ortogonais ao subespaço E ⊂ Rn+1 , que tem co-dimensão 1, eles são múltiplos um do outro. Então, fixando os vetores u1 , . . . , un , definimos duas formas n-lineares alternadas f , ∆ em E, pelas condições e v1 × · · · × vn = f (v1 , . . . , vn ) · u1 × · · · × un n X aij ui , j = 1, . . . , n. ∆(v1 , . . . , vn ) = det[aij ] se vj = i=1 Sabe-se (v. “Álgebra Linear”, pág. 261) que as formas n-lineares alternadas num espaço vetorial de dimensão n constituem um espaço vetorial de dimensão 1. Logo existe c ∈ R tal que f = c · ∆, ou seja, f (v1 , . . . , vn ) = c · det[aij ] para quaisquer v1 , . . . , vn ∈ E. Tomando v1 = u1 , . . . , vn = un , temos f (u1 , . . . , un ) = 1 e ∆(u1 , . . . , un ) = 1, logo c = 1 e daı́ f = ∆, isto é, onde v1 × · · · × vn = det a · u1 × · · · × un , n X a = [aij ] e vj = aij ui , j = 1, . . . , n. i=1 Teorema 4. Toda superfı́cie orientável de co-dimensão 1 admite um campo contı́nuo de vetores normais não-nulos. Demonstração. Seja M ⊂ Rn+1 orientável de dimensão n. Para toda parametrização ϕ : V0 → V pertencente ao atlas coerente A, o qual caracteriza a orientabilidade de M , definamos o campo contı́nuo de vetores 136 Superfı́cies Diferenciáveis Cap. 7 normais unitários u : V → Rn+1 pondo, em cada ponto p ∈ V , u(p) = w(p)/|w(p)|, onde w(p) = ∂ϕ ∂ϕ (x) × · · · × (x), x = ϕ−1 (p) ∈ V0 . ∂x1 ∂xn Se ψ : W0 → W for outra parametrização pertencente a A então ϕ e ψ são compatı́veis. Assim, se V ∩ W 6= ∅, para todo p ∈ V ∩ W , com z(p) = ∂ψ ∂ψ (y) × · · · × (y), y = ψ −1 (p) ∈ W0 , ∂y1 ∂yn como vimos acima, temos w(p) = det a ·z(p) onde a é a matriz jacobiana, no ponto x, da mudança de parametrização ψ −1 ◦ ϕ. Logo det a > 0 e, conseqüentemente, w(p) z(p) = = u(p). |w(p)| |z(p)| Deste modo, o campo unitário normal u : M → Rn+1 está bem definido e é, evidentemente, contı́nuo. O Teorema 4 mostra que a definição de hiperfı́cie orientável dada no Capı́tulo 4 é compatı́vel com a definição geral dada aqui. Exemplo 11. Todo subconjunto aberto A de uma superfı́cie orientável M é ainda uma superfı́cie orientável. Com efeito, se A é um atlas coerente em M então as restrições ϕ|(V0 ∩ϕ−1 (A)) → V ∩A das parametrizações ϕ : V0 → V pertencentes a A, com V ∩ A 6= ∅, formam um atlas coerente em A. Portanto se uma superfı́cie bidimensional M contém uma faixa de Moebius então M não é orientável. ⊳ Exemplo 12. O produto M × N de duas superfı́cies orientáveis M e N é uma superfı́cie orientável. Com efeito, se A e B são atlas coerentes em M e N respectivamente então as parametrizações do tipo ϕ × ξ : V0 × W0 → V × W , definidas por (ϕ × ξ)(x, y) = (ϕ(x), ξ(y)), onde ϕ ∈ A e ξ ∈ B, formam um atlas em M × N , o qual é coerente pois (ψ × ζ)−1 ◦ (ϕ × ξ) = (ψ −1 ◦ ϕ) × (ζ −1 ◦ ξ) e o determinante jacobiano de (ψ −1 ◦ ϕ) × (ζ −1 ◦ ξ) é o produto dos determinantes jacobianos de ψ −1 ◦ ϕ e ζ −1 ◦ ξ. Exemplo 13. Em virtude do Teorema 3, a esfera S n é uma hiperfı́cie orientável em Rn+1 , pois admite o óbvio campo contı́nuo de vetores normais unitários u : S n → Rn+1 , u(p) = p. Em particular, o cı́rculo S 1 ⊂ R2 é orientável logo, pelo Exemplo 12, o toro n-dimensional T n = S 1 × · · · × S 1 (n fatores) é uma superfı́cie orientável em R2n . ⊳ Seção 4 Superfı́cies orientáveis 137 Seja A um atlas coerente sobre a superfı́cie M . O par (M, A) chamase uma superfı́cie orientada. Uma parametrização ϕ : V0 → V diz-se positiva quando é compatı́vel com todas as parametrizações ψ ∈ A. Diz-se que ϕ é negativa quando, para toda ψ : W0 → W pertencente a A e todo x ∈ ϕ−1 (V ∩ W ), o determinante jacobiano det J(ψ −1 ◦ ϕ)(x) é negativo. Numa superfı́cie orientada (M, A), duas parametrizações negativas ϕ : V0 → V , ψ : W0 → W são sempre compatı́veis. Com efeito, dado p = ϕ(x) ∈ V ∩ W , seja ξ : Z0 → Z pertencente a A tal que ξ(z) = p. Então os determinantes jacobianos det J(ξ −1 ◦ ϕ)(x) e det J(ψ −1 ◦ ξ)(z) são ambos negativos logo é positivo o seu produto det J(ψ −1 ◦ ξ)(z) · det J(ξ −1 ◦ ϕ)(x) = det J(ψ −1 ◦ ϕ)(x). Teorema 5. Seja (M, A) uma superfı́cie orientada. Se V ⊂ M é conexo, toda parametrização ϕ : V0 → V é positiva ou negativa. Demonstração: Sejam A o conjunto dos pontos p = ϕ(x) ∈ V tais que existe ξ : W0 → W em A, com p ∈ W e det J(ξ −1 ◦ ϕ)(x) < 0, e B o conjunto dos pontos q ∈ V para os quais existe ζ : Z0 → Z, ζ ∈ A, com ζ(z) = q = ϕ(y) e det J(ζ −1 ◦ ϕ)(y) > 0. A e B são abertos em V e A ∪ B = V . Além disso, A ∩ B = ∅ pois se existisse p = ϕ(x) ∈ A∩B, terı́amos as parametrizações ξ : W0 → W , ζ : Z0 → Z, com ξ(w) = ζ(z) = p, ambas em A e, como (ξ −1 ◦ϕ)◦(ζ −1 ◦ϕ)−1 = ξ −1 ◦ζ, viria det J(ξ −1 ◦ ζ)(z) = det J(ξ −1 ◦ ϕ)(x) · [det J(ζ −1 ◦ ϕ)(x)]−1 < 0 e o atlas A não seria coerente. Como V é conexo, tem-se A = ∅ (e então ϕ é positiva) ou B = ∅ (e então ϕ é negativa). Corolário. Se na superfı́cie M há duas parametrizações ϕ : V0 → V , ψ : W0 → W , com V, W conexas, tais que o determinante jacobiano det J(ψ −1 ◦ ϕ)(x) muda de sinal quando x varia em ϕ−1 (V ∩ W ), então M não é orientável . Supondo, por absurdo, que existisse um atlas coerente A sobre M então ϕ e ψ não poderiam ser ambas positivas nem ambas negativas, pois são incompatı́veis. Tampouco pode ser uma delas, digamos ϕ, positiva e a outra, ψ, negativa. Com efeito, se tal ocorresse, A ∪ {ϕ} seria ainda 138 Superfı́cies Diferenciáveis Cap. 7 um atlas coerente, em relação ao qual ψ não seria positiva nem negativa, como se vê pelos sinais do determinante jacobiano de ψ −1 ◦ ϕ. Exemplo 14. Seja M ⊂ R6 o conjunto das matrizes 2 × 3 de posto 1. Cada elemento m ∈ M será escrito sob a forma m = [u, v], onde os vetores u, v ∈ R3 são as suas linhas. Temos M = U ∪ V , onde U é o conjunto das matrizes m = [u, v] de posto 1 tais que u 6= 0, enquanto V ⊂ M é definido pela condição v 6= 0. Pondo U0 = R × (R3 − {0}) as aplicações ϕ : U0 → U e ψ : U0 → V , definidas por ϕ(t, u) = [u, tu] e ψ(t, v) = [tv, v], são parametrizações C ∞ . A interseção U ∩ V é o conjunto das matrizes de posto 1 com ambas as linhas não-nulas, logo ϕ−1 (U ∩ V ) = ψ −1 (U ∩ V ) = (R − {0}) × (R3 − {0}) tem duas componentes conexas R+ × (R3 − {0}) e R− × (R3 − {0}). A mudança de parametrização ξ = ψ −1 ◦ ϕ : ϕ−1 (U ∩ V ) → ψ −1 (U ∩ V ) é dada por ξ(t, x, y, z) = (1/t, tx, ty, tz). Sua matriz jacobiana em cada ponto (t, x, y, z) ∈ ϕ−1 (U ∩ V ) é  1  − 2 0 0 0  t   t 0 0 Jξ(t, x, y, z) =  x   y 0 t 0 z 0 0 t e seu determinante é igual a −t. A mudança de parametrização ξ = ψ −1 ◦ ϕ tem, portanto, jacobiano negativo em R+ × (R3 − {0}) e positivo em R− × (R3 − {0}). Segue-se do Teorema 5 que M é uma superfı́cie C ∞ , não-orientável, de dimensão 4 em R6 . ⊳ Exemplo 12a. Vale a recı́proca do que foi visto no Exemplo 12: se M × N é orientável, então M e N são ambas superfı́cies orientáveis. Com efeito, seja A um atlas coerente em M × N . Fixemos, de uma vez por todas, uma parametrização ξ : Z0 → Z ⊂ N , com Z conexo. Seja B o conjunto das parametrizações ϕ : V0 → V ⊂ M tais que V é conexo e ϕ × ξ : V0 × Z0 → V × Z ⊂ M × N é uma parametrização positiva. Afirmamos que B é um atlas em M . Com efeito, dado qualquer ponto p ∈ M , seja ϕ : V0 → V uma parametrização com V conexo e p ∈ V . Se ϕ×ξ : V0 ×Z0 → V ×Z for positiva, temos ϕ ∈ B. Se, entretanto, ϕ×ξ for negativa então, como na demonstração do Teorema 3, consideramos a parametrização ϕ∗ : V0∗ → V , dada por ϕ∗ (x1 , . . . , xm ) = ϕ(−x1 , . . . , xm ) e vemos que ϕ∗ × ξ : V0∗ × Z0 → V × Z é positiva, logo ϕ ∈ B. Além disso, o atlas B é coerente pois se ϕ : V0 → V e ψ : W0 → W pertencem Seção 5 Multiplicadores de Lagrange 139 a B, com V ∩ W 6= ∅, então, pondo α = (ψ × ξ)−1 ◦ (ϕ × ξ), temos α = (ψ −1 ◦ ϕ) × id. Então o determinante jacobiano de ψ −1 ◦ ϕ é igual ao de α, que é positivo. Portanto o atlas B é coerente e M é orientável. Analogamente para N . 5 Multiplicadores de Lagrange Estenderemos agora, para co-dimensão n qualquer, o método dos multiplicadores de Lagrange, apresentado no Capı́tulo 4 no caso em que a superfı́cie ϕ−1 (c) tem co-dimensão 1, logo há apenas um multiplicador. São dadas uma superfı́cie M , de dimensão m e classe C k , e uma função f : U → R, de classe C k no aberto U , com M ⊂ U ⊂ Rm+n . Quer-se determinar o conjunto dos pontos crı́ticos da restrição f |M . Diz-se que p ∈ M é um ponto crı́tico da restrição f |M quando, para todo caminho diferenciável λ : (−ε, ε) → M , com λ(0) = p, tem-se (f ◦ λ)′ (0) = 0. Como λ′ (0) = v ∈ Tp M e portanto (f ◦ λ)′ (0) = ∂f (p) = h grad f (p), vi, ∂v concluı́mos que p ∈ M é ponto crı́tico de f |M se, e somente se, grad f (p) é ortogonal a todos os vetores v ∈ Tp M , tangentes a M no ponto p, ou seja, grad f (p) ∈ [Tp M ]⊥ . Se p ∈ M é um ponto de mı́nimo (ou máximo) local da restrição f |M e λ : (−ε, ε) → M é um caminho diferenciável com λ(0) = p então 0 é um ponto de mı́nimo (ou máximo) local de f ◦ λ : (−ε, ε) → R, logo (f ◦ λ)′ (0) = 0 e então p é um ponto crı́tico de f |M . Exemplo 15. Dada a superfı́cie M ⊂ Rm+n e fixado um ponto a ∈ Rm+n , suponhamos que exista, entre os pontos de M , (pelo menos) um ponto p situado a uma distância mı́nima de a. Considerando a função f : Rm+n → R, dada por f (x) = |x − a|2 , vemos que p é um ponto de mı́nimo da restrição f |M . Logo grad f (p) é um vetor ortogonal a Tp M . Mas grad f (p) = 2 · (p − a). Portanto os pontos p ∈ M situados à distância mı́nima do ponto a são aqueles tais que o vetor p − a é ortogonal a Tp M . Evidentemente, vale o mesmo para os pontos de M mais afastados de a, caso existam (como ocorre quando M é compacta). ⊳ 140 Superfı́cies Diferenciáveis Cap. 7 Suponhamos agora que a superfı́cie M = ϕ−1 (c) seja obtida como imagem inversa do valor regular c da aplicação ϕ : U → Rn , de classe C k no aberto U ⊂ Rm+n . Se escrevermos ϕ(x) = (ϕ1 (x), . . . , ϕn (x)), a afirmação de que c é um valor regular de ϕ significa que os vetores grad ϕ1 (x), . . . , grad ϕn (x) são linearmente independentes para todo x ∈ U tal que ϕ(x) = c. Com efeito, esses n vetores são as linhas da matriz jacobiana Jϕ(x) ∈ M (n × (m + n)), a qual tem posto n por ser a matriz da transformação linear sobrejetiva ϕ′ (x) : Rm+n → Rn . Além disso, conforme já vimos no inı́cio da Seção 4, em todo ponto x ∈ M = ϕ−1 (c), os vetores grad ϕ1 (x), . . . , grad ϕn (x) são ortogonais a Tx M , portanto formam uma base do complemento ortogonal [Tx M ]⊥ . Podemos então enunciar o Método dos multiplicadores de Lagrange. Sejam f : U → R uma função de classe C k no aberto U ⊂ Rm+n e M = ϕ−1 (c) a imagem inversa do valor regular c pela aplicação ϕ : U → Rn , de classe C k . A fim de que p ∈ M seja um ponto crı́tico da restrição f |M é necessário e suficiente que existam números λ1 , . . . , λn tais que grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p). Os números λ1 , . . . , λn são chamados multiplicadores de Lagrange. De fato, p é ponto crı́tico de f |M se, e somente se, grad f (p) é ortogonal a Tp M . Como {grad ϕ1 (p), . . . , grad ϕn (p)} é uma base do complemento ortogonal de Tp M em Rm+n , dizer que grad f (p) ∈ [Tp M ]⊥ equivale a afirmar que grad f (p) é combinação linear dos gradientes grad ϕ1 (p), . . . , grad ϕn (p). Seja c = (c1 , . . . , cn ). Para encontrar os pontos crı́ticos p da restrição f |M , devemos resolver o sistema abaixo, de m+2n equações com m+2n incógnitas. (As incógnitas são as m + n coordenadas de p mais os n multiplicadores λi .): ( ϕ1 (p) = c1 , . . . , ϕn (p) = cn grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p). A última equação acima é vetorial. Ela equivale às m + n equações numéricas ∂f ∂ϕ1 ∂ϕn (p) = λ1 · (p) + · · · + λn · (p), j = 1, . . . , m + n. ∂xj ∂xj ∂xj Seção 5 Multiplicadores de Lagrange 141 Exemplo 16. Seja A : Rm → Rn uma transformação linear. P Defina m n ∗ f : R × R → R pondo f (x, y) = hA · x, yi = hx, A · yi = aij xj yi (1 ≤ i ≤ n, 1 ≤ j ≤ m). Considerando o valor regular (1,1) da aplicação ϕ : Rm × Rn → R2 , dada por ϕ(x, y) = (|x|2 , |y|2 ), seja M = S m−1 × S n−1 = ϕ−1 (1, 1). Vejamos quais são os pontos crı́ticos da restrição f |M . Para todo (x, y) ∈ Rm × Rn , temos grad f (x, y) = (A∗ · y, A · x) ∈ m R × Rn . Além disso, ϕ = (ϕ1 , ϕ2 ), com grad ϕ1 (x, y) = (2x, 0) e grad ϕ2 (x, y) = (0, 2y). Por conveniência, tomemos λ/2 e µ/2 como multiplicadores de Lagrange. Um ponto p = (x, y) ∈ M é crı́tico para f |M se, e somente se, grad f (x, y) = µ λ · grad ϕ1 (x, y) + · grad ϕ2 (x, y), 2 2 ou seja, (A∗ y, Ax) = (λx, µy). Isto nos dá A · x = µ · y e A∗ y = λ · x, donde µ = hµ · y, yi = hAx, yi = hx, A∗ yi = hx, λ · xi = λ. Portanto, os pontos crı́ticos de f |M são os pontos (x, y) ∈ S m−1 × S n−1 tais que Ax = λy e A∗ y = λx para um certo λ ∈ R. Notemos que então λ = f (x, y) e que z ⊥ x ⇒ Az ⊥ y. Assim, se escrevermos E = {z ∈ Rm ; hz, xi = 0} = complemento ortogonal de x em Rm , e F = complemento ortogonal de y em Rn , a transformação linear A : Rm → Rn aplica E em F . Seja então p1 = (u1 , v1 ) ∈ S m−1 × S n−1 o ponto em que a função f assume seu valor máximo em S m−1 × S n−1 : f (u1 , v1 ) = λ1 . Então p1 é ponto crı́tico de f |M . Temos Au1 = λ1 · v1 e A∗ v1 = λ1 · u1 . Como f (x, −y) = −f (x, y), vemos que λ1 ≥ 0. Se A 6= 0 então f não é identicamente nula em M , logo λ1 > 0. Em seguida consideremos A como uma transformação linear A : E → F , agora com dim E = m−1 e dim F = n−1. Prosseguindo por indução, chegaremos ao seguinte resultado: Teorema dos Valores Singulares. Seja A : Rm → Rn uma transformação linear de posto r. Existem bases ortonormais {u1 , . . . , um } ⊂ Rm e {v1 , . . . , vn } ⊂ Rn tais que Aui = λi vi e A∗ vi = λi ui , onde λi > 0 para i = 1, . . . , r e λi = 0 para i ≥ r + 1. Os números λ1 > 0, . . . , λr > 0 são chamados os valores singulares de A. 142 6 Superfı́cies Diferenciáveis Cap. 7 Aplicações diferenciáveis entre superfı́cies Seja M ⊂ Rn uma superfı́cie de dimensão m e classe C k . Uma aplicação f : M → Rs diz-se de classe C r (r ≤ k) quando, para toda parametrização ϕ : V0 → V , de classe C k em M , a composta f ◦ ϕ : V0 → Rs é de classe C r no aberto V0 ⊂ Rm . Se ϕ : V0 → V e ψ : W0 → W são parametrizações de classe C k em M , com V ∩ W 6= ∅, então segue-se do Corolário 2 que f ◦ ϕ = (f ◦ ψ) ◦ (ψ −1 ◦ ϕ) é de classe C r se, e somente se, f ◦ ψ o é. Daı́ resulta que a definição acima dada é consistente. Dada outra superfı́cie N ⊂ Rs , diremos que a aplicação f : M → N é de classe C r quando, considerada como aplicação de M em Rs , f for de classe C r conforme a definição. A fim de que tal ocorra é necessário e suficiente que, para todo p ∈ M e toda parametrização ψ : W0 → W em N , com q = f (p) ∈ W , exista uma parametrização ϕ : V0 → V , com p ∈ V , f (V ) ⊂ M e ψ −1 ◦ f ◦ ϕ : V0 → W0 ⊂ Rm seja de classe C r . Novamente, admitindo que M e N são de classe C k com k ≥ r, esta definição independe das escolhas de ϕ e ψ. Seja f : M → N de classe C 1 . A derivada de f no ponto p é a transformação linear f ′ (p) : Tp M → Tq N, q = f (p), assim definida: todo vetor v ∈ Tp M é o vetor velocidade v = λ′ (0) de um caminho λ : (−ε, ε) → V , com λ(0) = p. Então pomos f ′ (p) · v = (f ◦ λ)′ (0). v w λ N p f q f ◦λ M w = f ′ (p) · v Figura 7.5 Se ϕ : V0 → V ⊂ M é uma parametrização C 1 com ϕ(x0 ) = p então v = ϕ′ (x0 ) · v0 , v0 ∈ Rm , e f ′ (p) · v = (f ◦ ϕ)′ (x0 ) · v0 . Isto mostra que f ′ (p) é linear. Seção 6 Aplicações diferenciáeis entre superfı́cies 143 Vale a Regra da Cadeia: se f : M → N e g : N → P são de classe C r então g ◦ f : M → P é de classe C r , com (g ◦ f )′ (p) = g ′ (f (p)) · f ′ (p). Diz-se que f : M → N é um difeomorfismo de classe C r quando f possui uma inversa g : N → M que também é de classe C r . Neste caso, para cada ponto p ∈ M , a derivada f ′ (p) : Tp M → Tq N , q = f (p), é um isomorfismo, cujo inverso é g ′ (q) : Tq N → Tp M . Se, para um certo p ∈ M , a derivada f ′ (p) : Tp M → Tq N é um isomorfismo então resulta facilmente do Teorema da Aplicação Inversa que f aplica difeomorficamente uma vizinhança aberta U de p em M sobre uma vizinhança aberta V = f (U ) de q = f (p) em N . Se f ′ (p) é um isomorfismo para todo p ∈ M , diz-se que f : M → N é um difeomorfismo local. Então a aplicação f leva abertos de M em abertos de N e, se for bijetiva, é um difeomorfismo entre M e N . A função de Euler f : R → S 1 , definida por E(t) = (cost, sent), é um difeomorfismo local. Sua restrição a qualquer intervalo aberto (a, a+2π) de comprimento 2π é um difeomorfismo desse intervalo sobre S 1 − {p}, p = E(a). Exemplo 17. O exemplo mais óbvio de uma aplicação diferenciável (de classe C k ) f : M → Rs é a restrição a M de uma aplicação F : U → Rs de classe C k num aberto U , com M ⊂ U ⊂ Rn . Exemplo 18. Seja M ⊂ Rn+1 uma hiperfı́cie orientável de classe C k (k ≥ 2). Se u : M → Rn+1 é um campo contı́nuo de vetores unitários normais a M , então u é uma aplicação de classe C k−1 . (Vide Teorema 4.) Com efeito, para cada parametrização ϕ : V0 → V ⊂ M , de ∂ϕ ∂ϕ classe C k , pondo v(ϕ(x)) = (x) × · · · × (x), temos u(ϕ(x)) = ∂x1 ∂xn ±v(ϕ(x))/|v(ϕ(x))| para cada x ∈ V0 pois u e v, sendo ambos ortogonais a Tϕ(x) M , são colineares. Se V0 (e portanto V ) for conexo, teremos u = v/|v| ou u = −v/|v| em todos os pontos de V , logo u ∈ C k−1 . Exemplo 19. Seja M = R2 − {0}. A aplicação f : M → R3 , definida por f (z) = z |z|, log |z| , é um difeomorfismo C ∞ sobre o cilindro S 1 × R ⊂ R3 . Seu inverso é g : S 1 × R → R2 − {0}, onde g(w, t) = et · w. De modo análogo se tem um difeomorfismo C ∞ entre Rn+1 − {0} e S n × R. Exemplo 20. (Aplicação normal de Gauss.) Um campo contı́nuo de vetores unitários normais numa hiperfı́cie orientável M ⊂ Rn+1 , de classe C k (k ≥ 2) é uma aplicação de classe C k−1 , u : M → S n , chamada a aplicação normal de Gauss. Em cada ponto p ∈ M , tem-se 144 Superfı́cies Diferenciáveis Cap. 7 Tp M = Tu(p) S n pois estes espaços vetoriais são o complemento ortogonal do vetor u(p) em Rn+1 . Portanto a derivada u′ (p) é um operador linear em Tp M , o qual é auto-adjunto. Para provar isto, tomamos uma parametrização ϕ : V0 → V ⊂ M , com ϕ(x) = p, consideramos a base ∂ϕ ∂ϕ { ∂x (x)} ⊂ Tp M , e mostramos que (x), . . . , ∂x n 1 hu′ (p) · ∂ϕ ∂ϕ ∂ϕ ∂ϕ (x), (x)i = h (x), u′ (p) · (x)i, i, j = 1, . . . , n (*) ∂xi ∂xj ∂xi ∂xj Com efeito, para todo x ∈ V0 e todo j = 1, . . . , n, vale a igualdade hu(ϕ(x)), ∂ϕ (x)i = 0. ∂xj Derivando ambos os membros em relação a xi vem: hu′ (p) · ∂ϕ ∂2ϕ ∂ϕ (x), (x)i + hu(p), (x)i = 0 ∂xi ∂xj ∂xi ∂xj (onde p = ϕ(x)). Trocando os papéis de i e j, resulta então do Teorema de Schwarz que valem as igualdades (*) e u′ (p) é auto-adjunto. Os autovalores k1 , . . . , kn do operador u′ (p) chamam-se as curvaturas principais da hiperfı́cie M no ponto p e o produto k1 · k2 · · · kn = det ·u′ (p) = K(p) é chamado a curvatura gaussiana de M nesse ponto. APÊNDICE O volume de um paralelepı́pedo Sejam v1 , . . . , vr vetores linearmente independentes em Rn . O paralelepı́pedo (r-dimensional) P = P (v1 , . . . , vr ) que tem esses vetores r P ti vi , com 0 ≤ como arestas é o conjunto das combinações lineares i=1 ti ≤ 1. O volume r-dimensional do paralelepı́pedo P = P (v1 , . . . , vr ) é definido por indução sobre r. Se r = 1, pomos vol P (v1 ) = |v1 |. Supondo definido o volume (r − 1)-dimensional, pomos vol P (v1 , . . . , vr ) = |h| · vol P (v2 , . . . , vr ), Seção 6 Aplicações diferenciáeis entre superfı́cies 145 onde h ∈ Rn é o vetor-altura de P , ou seja, h = v1 − pr.v1 , sendo pr.v1 a projeção ortogonal de v1 sobre o subespaço E ⊂ Rn gerado por v2 , . . . , vr . O vetor-altura h é ortogonal a v2 , . . . , vr , a diferença v1 − h pertence ao subespaço E que tem v2 , . . . , vr como base e estas duas propriedades caracterizam h. Provaremos, a seguir, que o volume do paralelepı́pedo P é a raiz quadrada do determinante da matriz de Gram g = g (v1 , . . . , vr ) = [hvi , vj i] ∈ M (r × r). Começaremos observando que, se fixarmos arbitrariamente uma base ortonormal no subespaço de Rn gerado por e1 , . . . , er e considerarmos a matriz m ∈ M (r × r) cujas colunas são as coordenadas dos vetores v1 , . . . , vr relativas a essa base, então tem-se det[hvi , vj i] = (det m )2 . Esta igualdade é imediata se notarmos que, segundo a definição de produto de matrizes, tem-se g (v1 , . . . , vr ) = m ⊤ · m , onde m ⊤ é a transposta de m . Portanto det[hvi , vj i] = det g = det m ⊤ · det m = (det m )2 . Daı́ resultam dois fatos. O primeiro é que det m não depende da base ortonormal que foi arbitrariamente escolhida no subespaço gerado por v1 , . . . , vr . O segundo é que det g (v1 , . . . , vr ) = det g (h, v2 . . . , vr ) pois h = v1 −pr.v1 e o determinante de m não se altera quando se subtrai da coluna v1 uma combinação linear das demais colunas. Deste modo, temos (por indução): [vol P (v1 , . . . , vr )]2 = |h|2 · [vol P (v2 , . . . , vr )]2 = = hh, hi · det g (v2 , . . . , vr ) = det g (h, v2 , . . . , vr ) = = det g (v1 , . . . , vr ), sendo a penúltima igualdade devida ao fato de que a primeira linha e a primeira coluna da matriz g (h, v2 , . . . , vr ) têm hh, hi como único elemento não-nulo. Portanto, se v1 , . . . , vn ∈ Rn e indicamos com a notação [v1 , . . . , vn ] a matriz n × n cujo j-ésimo vetor-coluna é vj então o volume do paralelepı́pedo cujas arestas são v1 , . . . , vn é igual a | det[v1 , . . . , vn ]|. Além disso, o quadrado desse volume é igual ao determinante da matriz de Gram g (v1 , . . . , vn ), cujo ij-ésimo elemento é hvi , vj i. 146 7 Superfı́cies Diferenciáveis Cap. 7 Exercı́cios Seção 2. Superfı́cies diferenciáveis 1. Prove que toda superfı́cie M ⊂ Rm+n de classe C k é localmente a imagem inversa de um valor regular de uma aplicação f : U → Rn , de classe C k num aberto U ⊂ Rm+n . Conclua que todo ponto p ∈ M pertence a um aberto V ⊂ M , imagem de uma parametrização ϕ : V0 → V , de classe C k , no qual estão definidos n campos vetoriais v1 , . . . , vn : V → Rm+n tais que v1 ◦ ϕ, . . . , vn ◦ ϕ : V0 → Rm+n são de classe C k−1 e, para cada q ∈ V , v1 (q), . . . , vn (q) são linearmente independentes e ortogonais a Tq M . 2. Seja M ⊂ Rn de classe C k e dimensão m. Prove que o conjunto T M = {(p, v) ∈ Rn ×Rn ; p ∈ M, v ∈ Tp M } é uma superfı́cie de classe C k−1 e dimensão 2m, chamada o fibrado tangente de M . 3. Com a notação do exercı́cio anterior, seja νM = {(p, v) ∈ Rn × Rn ; p ∈ M, v ∈ Tp M ⊥ }. Prove que νM é uma superfı́cie de classe C k−1 e dimensão n, chamada o fibrado normal de M em Rn . 4. Mostre que o conjunto M das matrizes 4 × 4 de posto 2 é uma superfı́cie C ∞ de dimensão 12 em R16 . Generalize para matrizes m × n de posto k. Seção 3. O espaço vetorial tangente 1. Dada uma superfı́cie M ⊂Rn , de classe C k e dimensão m, considere um ponto p∈M e duas parametrizações ϕ : V0 →V , ψ : W0 →W em M , com p∈V ∩W . Seja [aij ] a matriz jacobiana, no ponto x0 = ϕ−1P (p), do difeomorfismo ψ −1 ◦ m ∂ψ ∂ϕ −1 −1 ϕ : ϕ (V ∩ W ) → ψ (V ∩ W ). Mostre que i=1 aij ∂yi (y0 ) = ∂xj (x0 ), onde ψ(y0 ) = p. [Noutras palavras: [aij ] é a matriz de passagem da base ∂ψ ∂ϕ ∂ψ ∂ϕ { ∂y (y0 )} para a base { ∂x (x0 )} em Tp M .] (y0 ), . . . , ∂y (x0 ), . . . , ∂x m m 1 1 2. Seja λ : [a, b] → M um caminho na superfı́cie M ⊂ Rn , com λ(a) = p. Dada uma base ortonormal {u1 , . . . , um } ⊂ Tp M , prove que existem aplicações contı́nuas v1 , . . . , vm : [a, b] → Rn tais que v1 (a) = u1 , . . . , vm (a) = um e, para cada t ∈ [a, b], {v1 (t), . . . , vm (t)} é uma base ortonormal em Tλ(t) M . 3. Dado um caminho λ : [a, b] → M na superfı́cie M ⊂ Rm+n , seja {u1 , . . . , un } ⊂ Tp M ⊥ , com p = λ(a), uma base ortonormal do complemento ortogonal de Tp M em Rm+n . Prove que existem v1 , . . . , vn : [a, b] → Rm+n contı́nuas, tais que, para todo t ∈ [a, b], {v1 (t), . . . , vn (t)} é uma base ortonormal de [Tλ(t) M ]⊥ . 4. Use o Exercı́cio 2 e indução para provar que, dadas duas bases ortonormais {u1 , . . . , un } e {w1 , . . . , wn } em Rn , se as matrizes n × n cujas colunas são esses vetores têm determinantes de mesmo sinal, então existem n aplicações contı́nuas v1 , . . . , vn : [0, 2] → Rn tais que vi (0) = ui , vi (2) = wi (i = 1, 2, . . . , n) e, para cada t ∈ [0, 2], {v1 (t), . . . , vn (t)} ⊂ Rn é uma base ortonormal. Conclua daı́ que o conjunto SO(Rn ) das matrizes ortogonais n × n com determinante igual a 1 é conexo. Seção 4. Superfı́cies orientáveis 1. Sejam ϕ : U0 → U , ψ : V0 → V , ξ : W0 → W parametrizações na superfı́cie M . Suponha que M = U ∪ V ∪ W , que U ∩ V ∩ W 6= ∅ e que o determinante Seção 7 Exercı́cios 147 jacobiano de cada uma das mudanças de coordenadas ψ −1 ◦ ϕ, ξ −1 ◦ ϕ e ξ −1 ◦ ψ tem sinal constante. Prove que M é orientável. 2. Use o exercı́cio anterior para provar que o conjunto M das matrizes 3 × 3 de posto 1 é uma superfı́cie orientável de dimensão 5 em R9 . 3. Prove que o fibrado tangente T M e o fibrado normal νM de qualquer superfı́cie são sempre orientáveis. (V. Exercı́cios 2 e 3, Seção 2.) 4. Seja f : R3 → R4 definida por f (x, y, z) = (x2 − y 2 , xy, xz, yz). Prove que P = f (S 2 ) é uma superfı́cie C ∞ de dimensão 2, compacta e não-orientável em R4 . (P é conhecida como o plano projetivo.) Seção 6. Aplicações diferenciáveis entre superfı́cies 1. Prove que o homeomorfismo h : S 1 × R → R2 − {0}, dado por h(z, t) = et · z, é um difeomorfismo. 2. Use o difeomorfismo do exercı́cio anterior para provar que o toro n-dimensional T = S 1 × · · · × S 1 = (S 1 )n é difeomorfo a uma hiperfı́cie em Rn+1 . 3. Seja f : M → N um difeomorfismo local. Se N é orientável, prove que M também é. 2 2 4. Sejam G ⊂ Rm e H ⊂ Rn superfı́cies que são grupos em relação à multiplicação de matrizes. Se f : G → H é um homomorfismo diferenciável, prove que o posto da derivada f ′ (x) : Tx G → Tf (x) H não depende do ponto x ∈ G. 8 Integrais Múltiplas 1 A definição de integral Um bloco n-dimensional A ⊂ Rn é um produto cartesiano A= n Y [ai , bi ] = [a1 , b1 ] × · · · × [an , bn ] i=1 de n intervalos compactos [ai , bi ], chamados suas arestas. O produto n Q (ai , bi ) dos intervalos abertos (ai , bi ) chama-se bloco ncartesiano i=1 dimensional aberto. Quando todas as arestas do bloco A têm o mesmo comprimento a = bi −ai , diz-se que A é um cubo n-dimensional . Quando n = 1, os blocos são simplesmente intervalos. Se n = 2, o bloco reduz-se a um retângulo e o cubo a um quadrado. n Q Q Li Uma face do bloco A = [ai , bi ] é um conjunto do tipo F = i=1 onde, para cada i = 1, . . . , n, tem-se Li = {ai }, Li = {bi } ou Li = [ai , bi ]. Diz-se que a face F tem dimensão r quando exatamente r dos fatores Li são iguais a [ai , bi ]. As faces de dimensão zero, isto é, os pontos da forma v = (c1 , . . . , cn ), onde ci = ai ou ci = bi para cada i = 1, . . . , n, são chamadas os vértices do bloco. n Q [ai , bi ] é, por definição, o O volume n-dimensional do bloco A = produto n Q i=1 i=1 (bi − ai ) dos comprimentos de suas arestas. Este é também o volume do bloco aberto n Q i=1 (ai , bi ). Seção 1 A definição de integral Uma partição do bloco A = n Q 149 [ai , bi ] é um produto cartesiano i=1 P = P1 × · · · × Pn , onde cada Pi é uma partição do intervalo [ai , bi ] (cfr. Vol. 1, Cap. 10, §2). Diz-se que a partição Q = Q1 × · · · × Qn refina a partição P quando se tem P ⊂ Q. Isto equivale a dizer que P1 ⊂ Q1 , . . . , Pn ⊂ Qn . A partição P decompõe o bloco A numa reunião de sub-blocos B = I1 × · · · × In , onde cada Ij é um intervalo da partição Pj de [aj , bj ]. Estes sub-blocos B ⊂ A chamam-se os blocos da partição P . Escreve-se então B ∈ P . Se a partição Q refina P então cada bloco de P é a reunião dos blocos de Q nele contidos. Se B, B ′ são blocos da partição P , a interseção B ∩ B ′ é uma face comum a B e B ′ ou é vazia. Dada a partição P = P1 × · · · × Pn do bloco A, como o comprimento bi − ai de cada aresta de A é a soma dos comprimentos dos intervalos da partição Pi , segue-se da propriedade distributiva da multiplicação que o volume do bloco A é a soma dos volumes dos blocos B da partição P . Logo, quando Q refina P , o volume de cada bloco de P é a soma dos volumes dos blocos de Q nele contidos. Se P = P1 × · · · × Pn e Q = Q1 × · · · × Qn são partições do bloco A, existem partições de A que refinam ao mesmo tempo P e Q. Uma delas n Q (Pi ∪ Qi ). é R = i=1 Seja f : A → R uma função real limitada no bloco n-dimensional A, digamos com m ≤ f (x) ≤ M para todo x ∈ A. Dada uma partição P do bloco A, para cada bloco B ∈ P , indiquemos com mB o ı́nfimo e com MB o supremo dos valores f (x) quando x varia em B. Definimos então a soma inferior s(f ; P ) e a soma superior S(f ; P ) da função f relativamente à partição P pondo X X s(f ; P ) = mB · vol B e S(f ; P ) = MB · vol B, B∈P B∈P estas somas estendendo-se a todos os blocos B da partição P . Evidentemente mB ≤ MB para todo B ∈ P , logo s(f ; P ) ≤ S(f ; P ). Mais do que isto é verdade: para quaisquer partições P e Q do bloco A, tem-se s(f ; P ) ≤ S(f ; Q). Para comprovar esta afirmação, observamos primeiro que se uma partição P ′ refina a partição P então s(f ; P ) ≤ s(f ; P ′ ) e S(f ; P ′ ) ≤ S(f ; P ). 150 Integrais Múltiplas Cap. 8 Com efeito, se o bloco B ′ da partição P ′ está contido no bloco B da partição P então mB ≤ mB ′ . Lembrando que cada blocoPB ∈ P é vol B ′ , a reunião dos blocos B ′ ∈ P ′ nele contidos, e que vol B = B ′ ⊂B segue-se que s(f ; P ) = X mB · vol B = B∈P ≤ X B ′ ∈P ′ ′ X B∈P X B ′ ⊂B mB · vol B ′ ! mB ′ · vol B = s(f ; P ′ ). Analogamente se vê que S(f ; P ′ ) ≤ S(f ; P ) quando P ′ refina P . Assim, quando se refina uma partição, a soma inferior não diminui e a soma superior não aumenta. Sejam P e Q duas partições quaisquer do bloco A. Tomemos uma partição R de A que refine P e Q simultaneamente. Temos: s(f ; P ) ≤ s(f ; R) ≤ S(f ; R) ≤ S(f ; Q), mostrando portanto que s(f ; P ) ≤ S(f ; Q), ou seja, toda soma inferior de f é menor do que ou igual a qualquer soma superior. R Definimos a seguir a integral inferior f (x)dx e a integral superior R− −A A f (x)dx Z −A da função limitada f : A → R, pondo f (x)dx = sup s(f ; P ) e P Z− f (x)dx = inf S(f ; P ), A P o supremo e o ı́nfimo acima sendo tomados em relação a todas as partições P do bloco A. A desigualdade s(f ; P ) ≤ S(f ; Q) implica que m · vol A ≤ Z −A f (x)dx ≤ se m ≤ f (x) ≤ M para todo x ∈ A. Z− A f (x)dx ≤ M · vol A Seção 1 A definição de integral 151 Diz-se que a função limitada f : A → R é integrável no bloco ndimensional A quando suas integrais inferior e superior coincidem. Escreve-se então Z A f (x)dx = Z −A f (x)dx = Z− f (x)dx A e este número é chamado a integral de f no bloco A. No caso n = 1, o bloco n-dimensional A reduz-se a um segmento de reta e a definição de integral acima dada coincide com aquela apresentada no Capı́tulo 10 do Volume 1. Dada a função f : A → R, limitada no bloco A ⊂ Rn , o conjunto σ das somas inferiores e o conjunto Σ das somas superiores de f relativamente às partições P de A são subconjuntos do intervalo [m · vol A, M · vol A], onde m ≤ f (x) ≤ M para todo x ∈ A. Sabemos que, para quaisquer s ∈ σ e S ∈ Σ, tem-se s ≤ S. A fim de que seja sup σ = inf Σ, isto é, que f seja integrável, é necessário e suficiente que, dado arbitrariamente ε > 0, existam s ∈ σ e S ∈ Σ tais que S − s < ε. Mais explicitamente: f é integrável se, e somente se, para todo ε > 0 dado, existem partições R e Q de A tais que S(f ; R) − s(f ; Q) < ε. Esta condição pode ser aperfeiçoada assim: Teorema 1 (Condição imediata de integrabilidade). A fim de que a função limitada f : A → R seja integrável no bloco A ⊂ Rn é necessário e suficiente que, para todo ε > 0 dado, exista uma partição P de A tal que S(f ; P ) − s(f ; P ) < ε. Demonstração. A suficiência é óbvia pois a condição acima claramente assegura que sup σ = inf Σ. Quanto à necessidade, supondo f integrável, ou seja, admitindo que sup σ = inf Σ, dado ε > 0, existem partições Q e R do bloco A tais que S(f ; R) − s(f ; Q) < ε. Seja P uma partição de A que refine Q e R ao mesmo tempo. Então s(f ; Q) ≤ s(f ; P ) ≤ S(f ; P ) ≤ S(f ; R), portanto S(f ; P ) − s(f ; P ) ≤ S(f ; R) − s(f ; Q) < ε. Para todo subconjunto X ⊂ A, sejam MX o supremo e mX o ı́nfimo dos valores f (x), com x ∈ X. Escreveremos ωX = MX − mX e chamaremos ωX de oscilação de f no conjunto X. Às vezes, quando houver necessidade, usaremos a notação mais precisa ω(f ; X) = MX − mX em vez de ωX . 152 Integrais Múltiplas Cap. 8 Para toda partição P do bloco A, temos X X S(f ; P ) − s(f ; P ) = (MB − mB ) vol B = ωB · vol B. B∈P B∈P Portanto f : A → R é integrável se, e somente se, para todo ε > 0 dado, existe uma partição P de A tal que X ωB · vol B < ε. B∈P Uma conseqüência imediata desta observação é que toda função contı́nua f : A → R é integrável. Com efeito, sendo o bloco A um conjunto compacto, a função contı́nua f é uniformemente contı́nua. Portanto, dado qualquer ε > 0, existe δ > 0 tal que x, y ∈ A, |x − y| < δ ⇒ |f (x) − f (y)| < ε/ vol A. Se tomarmos, em cada aresta [ai , bi ] do bloco A = Π[ai , bi ], uma partição Pi cujos intervalos tenham todos comprimento < δ, e adotarmos em Rn a norma do máximo, então todos os blocos da partição P = P1 × · · · × Pn de A terão diâmetro menor do que δ. A função f sendo contı́nua, em cada bloco B da partição P existem pontos a, b tais que mB = f (a) e MB = f (b), pois B é compacto. Então ωB = MB − mB = f (b) − f (a) < ε/ vol A e daı́ X X ε ε ωB · vol B < · vol B = · vol A = ε. vol A vol A B∈P B∈P Assim f é integrável. O fato de que toda função contı́nua f : A → R é integrável é muito importante mas não é suficiente para nossos propósitos. A fim de definir a integral de funções cujos domı́nios são mais gerais do que blocos, precisamos integrar alguns tipos de funções descontı́nuas. Isto nos leva ao critério de integrabilidade de Lebesgue, o qual se baseia na noção de conjunto de medida nula, que abordaremos no parágrafo seguinte. 2 Conjuntos de medida nula Diz-se que o conjunto X ⊂ Rn tem medida n-dimensional nula (segundo Lebesgue), e escreve-se med.X = 0, quando, para todo ε > 0 dado, é possı́vel obter uma cobertura enumerável X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por ∞ P vol Bk < ε. meio de blocos abertos Bk ⊂ Rn tais que k=1 Seção 2 Conjuntos de medida nula 153 Evidentemente, se med.X = 0 e Y ⊂ X então med.Y = 0. Teorema 2. Uma reunião enumerável de conjuntos de medida nula é ainda um conjunto de medida nula. Demonstração. Sejam X1 , . . . , Xk , . . . subconjuntos de Rn com ∞ S Xk med.Xk = 0 para todo k ∈ N. A fim de provar que X = k=1 tem medida nula, seja dado ε > 0. Para cada k ∈ N podemos obter ∞ S Bki e uma seqüência de blocos Bk1 , Bk2 , . . . , Bki , . . . tais que Xk ⊂ ∞ P i=1 vol Bki < ε/2k . Então X está contido na reunião (enumerável) de i=1 todos os Bki . Dado qualquer subconjunto finito F ⊂ N×N, existe j ∈ N tal que (k, i) ∈ F ⇒ k ≤ j e i ≤ j. Logo " j # j j X X X X ε/2k < ε. vol Bki ≤ vol Bki < (k,i)∈F k=1 i=1 k=1 Portanto,Pseja qual for a maneira de enumerar os Bki numa seqüência, vol Bki ≤ ε. Assim, med.X = 0. teremos k,i Corolário 1. Todo conjunto enumerável tem medida nula. Com efeito, todo conjunto enumerável é reunião dos seus pontos, cada um dos quais tem medida nula. A definição de med.X = 0, dada acima com blocos abertos, é conveniente quando se pretende usar o Teorema de Borel-Lebesgue. Noutras ocasiões, pode ser mais adequado empregar blocos fechados. E ainda em certos casos impõe-se o uso de cubos (abertos ou fechados). Essas alternativas são equivalentes, conforme veremos agora. Teorema 3. As seguintes afirmações a respeito de um conjunto X ⊂ Rn são equivalentes: (a) Para todo ε > 0 dado, pode-se obter uma cobertura enumerável X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por meio de blocos abertos Bk ⊂ Rn tais ∞ P vol Bk < ε. que k=1 (b) Vale a afirmação (a), com blocos fechados em vez de abertos. (c) Vale a afirmação (a), com cubos abertos em vez de blocos. (d) Vale a afirmação (a), com cubos fechados em vez de blocos abertos. 154 Integrais Múltiplas Cap. 8 Demonstração. Mostremos, inicialmente, que (a) ⇔ (b). A implicação (a) ⇒ (b) é imediata, pois X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . implica X ⊂ B 1 ∪ · · · ∪ B k ∪ . . . e vol B k = vol Bk , logo Σ vol Bk < ε ⇒ Σ vol B k < ε. Quanto a (b) ⇒ (a): dado ε > 0, (b) nos autoriza a obter uma cobertura X ⊂ D1 ∪ · · · ∪ Dk ∪ . . . por meio de blocos fechados Dk n Q [aki , bki ] com Σ vol Dk < ε/2. Ora, para cada k ∈ N, o bloco Dk = está contido no bloco aberto Ak = n Q i=1 i=1 (aki − δ, bki + δ) onde δ > 0 pode ser escolhido de modo que vol Ak − vol Dk < ε/2k+1 . (Basta notar que n Q (bki − aki + 2δ) é uma função contı́nua de δ, igual a vol Dk vol Ak = i=1 quando δ = 0.) Então X ⊂ A1 ∪ · · · ∪ Ak ∪ . . . , com ∞ X k=1 vol Ak < ∞ X k=1 vol Dk + ∞ X k=1 ε 2k+1 < ε ε + = ε. 2 2 A equivalência (c) ⇔ (d) se prova exatamente do mesmo modo, bastando observar que, no argumento acima, se Dk é um cubo então Ak também é. Resta portanto, provar que (a) ⇔ (c) ou, o que dá no mesmo, que (b) ⇔ (d). Ora, é óbvio que (d) ⇒ (b). Para demonstrar a implicação (b) ⇒ (d), começamos provando que, dados um bloco B e um número δ > 0, existe um bloco C que é uma reunião finita de cubos, contém B e, além disso, vol C − vol B < δ. Isto é imediato quando as arestas do bloco B = Π[ai , bi ] têm medidas racionais bi − ai = pi /qi . Neste caso, o próprio bloco B é uma reunião finita de cubos: basta considerar o mı́nimo múltiplo comum m dos denominadores qi e tomar em mpi cada aresta [ai , bi ] de B a partição Pi com intervalos, todos de qi comprimento 1/m. Os blocos da partição P = P1 × · · · × Pn do bloco B são cubos de arestas medindo 1/m e B é a reunião deles. No caso geral, observamos que, para i = 1, . . . , m, existem números positivos ηi tão pequenos quanto se queira, tais que bi − ai + ηi é racional. Então o bloco n Q [ai , bi + ηi ] tem arestas com medidas racionais, logo é reunião C = i=1 finita de cubos. Além disso, C contém B e a diferença vol C − vol B = Π(bi − ai + ηi ) − Π(bi − ai ) pode ser tornada tão pequena quanto se deseje, desde que os ηi sejam suficientemente pequenos. Para completar a prova de que (b) ⇒ (d), seja dado ε > 0. Por Seção 2 Conjuntos de medida nula 155 (b), existe uma cobertura X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por blocos Bk tais ∞ P vol Bk < ε/2. Como acabamos de ver, cada Bk está contido que k=1 numa reunião finita de cubos cuja soma dos volumes é menor do que vol Bk + ε/2k+1 . Numerando consecutivamente esses cubos para k = 1, 2, . . . , chegamos a uma cobertura S ⊂ C1 ∪ · · · ∪ Cr ∪ . . . , onde os cubos Cr são tais que ∞ X vol Cr < r=1 ∞ X vol Bk + ∞ X k=1 k=1 ε 2k+1 < ε ε + = ε. 2 2 Isto completa a demonstração do teorema. Teorema 4. Seja f : X → Rn uma aplicação lipschitziana no conjunto X ⊂ Rn . Se medX = 0 então medf (X) = 0. Demonstração. Adotemos em Rn a norma do máximo. Seja c > 0 tal que |f (x)−f (y)| ≤ c|x−y| para quaisquer x, y ∈ X. Dado arbitrariamente ε > 0, existe uma cobertura X ⊂ C1 ∪· · ·∪Ck ∪. . . onde cada ∞ ∞ P P (ak )n < ε/cn . vol Ck = Ck é um cubo cuja aresta mede ak , com k=1 k=1 Se x, y ∈ Ck ∩X então |x−y| ≤ ak , logo |f (x)−f (y)| ≤ c·ak . Isto significa que, para todo i = 1, . . . , n, as i-ésimas coordenadas de f (x) e f (y) pertencem a um intervalo Ji de comprimento c · ak . Portanto f (Ck ∩ X) n Q Ji = Ck′ , de aresta c·ak , logo vol Ck′ = cn ·(ak )n . está contido no cubo i=1 ∞ S Segue-se que f (X) = k=1 ∞ X k=1 f (Ck ∩ X) ⊂ C1′ ∪ · · · ∪ Ck′ ∪ . . . , onde vol Ck′ = cn · ∞ X k=1 (ak )n < cn · ε = ε. cn Logo medf (X) = 0. A aplicação mais freqüente do Teorema 4 ocorre quando f : U → Rn é diferenciável, com derivada limitada no aberto convexo U ⊂ Rn . Se |f ′ (x)| ≤ c para todo x ∈ U então a Desigualdade do Valor Médio nos dá |f (x) − f (y)| ≤ c · |x − y| para quaisquer x, y ∈ U , logo f transforma todo conjunto de medida nula X ⊂ U num conjunto de medida nula f (X) ⊂ Rn . A fim de estender este resultado para funções de classe C 1 em abertos não necessariamente convexos, com derivada limitada ou não, será necessário usar o 156 Integrais Múltiplas Cap. 8 Teorema 5 (Lindelöf ). Toda cobertura aberta X ⊂ S Uλ de um λ∈L conjunto arbitrário X ⊂ Rn admite uma subcobertura enumerável X ⊂ Uλ1 ∪ · · · ∪ Uλk ∪ . . . . Demonstração. Seja B o conjunto dos blocos abertos em Rn cujos vértices têm coordenadas racionais e cada um deles está contido em algum aberto Uλ da cobertura dada. O conjunto B é enumerável, logo podemos escrever B = {B1 , B2 , . . . , Bk , . . . }. Para cada k ∈ N, esco∞ S Uλk = lhamos um ı́ndice λk ∈ L tal que Bk ⊂ Uλk . Afirmamos que k=1 S Uλ . Com efeito, se x ∈ Uλ então, como Uλ é aberto, existe uma λ∈L bola aberta de centro x, contida em Uλ . Se tomarmos em Rn a norma do máximo, essa bola é um cubo, cuja aresta podemos supor racional, logo é um Bk . Assim, x ∈ Bk ⊂ Uλk , portanto todo Uλ , λ ∈ L, está ∞ S S S Uλ . Uλk ⊂ Uλ ⊂ contido na reunião dos Uλk , k ∈ N, ou seja Segue-se que X ⊂ Uλ1 ∪ · · · ∪ Uλk ∪ . . . . λ∈L k=1 λ∈L Teorema 6. Seja f : U → Rn uma aplicação de classe C 1 no aberto U ⊂ Rn . Se X ⊂ U tem medida nula então f (X) ⊂ Rn também tem medida nula. Demonstração. Para cada x ∈ X existe um aberto convexo Ux , com x ∈ Ux ⊂ U , tal que f tem derivada limitada S em Ux , logo f (X ∩Ux ) tem medida nula. A cobertura aberta X ⊂ Ux admite uma subcobertura x∈X ∞ S Uk . Como f (X ∩ Uk ) tem medida nula para cada ∞ ∞ S S f (X ∩ Uk ) tem k ∈ N, segue-se que f (X) = f (X ∩ Uk ) = enumerável X ⊂ medida nula. k=1 k=1 k=1 Corolário 2. Seja f : U → Rn uma aplicação de classe C 1 no aberto U ⊂ Rm . Se m < n então f (U ) ⊂ Rn tem medida nula. Com efeito, se considerarmos Rm como o conjunto dos pontos de n R cujas últimas n − m coordenadas são nulas, veremos que todo bloco m-dimensional B ⊂ Rm ⊂ Rn tem volume n-dimensional nulo, pois podemos cobrir B com um único bloco n-dimensional D = B × [0, η]n−m , cujo volume n-dimensional pode ser tomado tão pequeno quanto se deseje. Daı́ resulta que Rm , visto como subconjunto de Rn , tem medida n-dimensional nula, pois é reunião enumerável de blocos m-dimensionais. Seção 2 Conjuntos de medida nula 157 Em particular, o conjunto U ⊂ Rm tem medida n-dimensional nula. Isto posto, a partir da aplicação f : U → Rn , definamos F : U × Rn−m → Rn pondo F (x, y) = f (x). O conjunto U × 0 ⊂ U × Rn−m tem medida n-dimensional nula, logo med.F (U × 0) = 0, pelo Teorema 6. Mas F (U × 0) = f (U ), o que prova o corolário. Corolário 3. Seja M ⊂ Rn uma superfı́cie m-dimensional de classe C 1 . Se m < n então M tem medida n-dimensional nula. Com efeito, para todo x ∈ M existe um aberto Ux em Rn tal que Vx = Ux ∩ M é uma vizinhança parametrizada de x,Slogo um conjunto de medida nula em Rn . A cobertura aberta M ⊂ Ux admite, por Lindelöf, uma subcobertura enumerável M ⊂ ∞ S x∈M Uk , logo M = k=1 ∞ S k=1 (Uk ∩ M ) é reunião enumerável de conjuntos Vk = Uk ∩ M , de medida nula. Assim, med.M = 0. O teorema seguinte, devido a H. Lebesgue, estabelece o critério geral de integrabilidade em termos da noção de conjunto de medida nula. Em sua demonstração, faremos uso do conceito de oscilação de uma função num ponto, que introduziremos agora. Seja f : X → R uma função limitada no conjunto X ⊂ Rn . Fixemos x ∈ X e, para cada δ > 0, ponhamos Ω(δ) = ω(f ; X ∩ B(x; δ)) = oscilação de f no conjunto dos pontos de X que distam menos de δ do ponto x. Fica assim definida uma função não-negativa Ω : (0, +∞) → R, a qual é limitada pois f também é. Além disso, Ω é não-decrescente. Logo existe o limite ω(f ; x) = lim Ω(δ) = lim ω(f ; X ∩ B(x; δ)) = inf ω(f ; X ∩ B(x; δ)), δ→0 δ→0 δ>0 que chamaremos a oscilação da função f no ponto x. Tem-se ω(f ; x) = 0 se, e somente se, f é contı́nua no ponto x. É claro que se x ∈ int.Y e Y ⊂ X então ω(f ; x) ≤ ω(f ; Y ). Teorema 7 (Lebesgue). A função f : A → R, limitada no bloco A ⊂ Rn , é integrável se, e somente se, o conjunto Df dos seus pontos de descontinuidade tem medida nula. Demonstração. Suponhamos inicialmente que med.Df = 0. Dado ′ arbitrariamente ε > 0, seja Df ⊂ C1′ ∪ · · · ∪ CP k ∪ · · · uma cobertura enumerável de Df por blocos abertos tais que vol Ck′ < ε/2K, onde K = M −m é a diferença entre o sup e o inf de f em A. Para cada ponto 158 Integrais Múltiplas Cap. 8 x ∈ A − Df seja Cx′′ um bloco aberto contendo x, tal que a oscilação de f no fecho de Cx′′ ∩ A seja inferior a ε/(2 · vol A). Sendo A compacto, a cobertura aberta A ⊂ (∪Ck′ ) ∪ (∪Cx′′ ) admite uma subcobertura finita A ⊂ C1′ ∪ · · · ∪ Cr′ ∪ C1′′ ∪ · · · ∪ Cs′′ . Seja P uma partição de A tal que cada bloco aberto B ∈ P esteja contido n Q [ai , bi ] então podemos tomar num dos blocos Ck′ ou num Cj′′ . (Se A = i=1 P = P1 × · · · × Pn onde, para cada i = 1, . . . , n, Pi é formada pelos pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Ck′ ou Cj′′ que pertençam ao intervalo [ai , bi ].) Os blocos de P contidos em algum Ck′ serão genericamente designados por B ′ e os demais blocos de P (necessariamente contidos em algum Cj′′ ) serão chamados B ′′ . A soma dos volumes dos B ′ é menor do que ε/2K e, em cada bloco B ′′ , a oscilação de f não excede ε/(2 · vol A). Portanto X X X ωB ′′ · vol B ′′ ωB ′ · vol B ′ + ωB · vol B = B∈P B′ X B ′′ X ε vol B ′′ 2 · vol A ε ε <K· + · vol A = ε. 2·K 2 · vol A ≤K· vol B ′ + Segue-se que f é integrável. Reciprocamente, suponhamos f integrável. Para cada k ∈ N, ponhamos Dk = {x ∈ A; ω(f ; x) ≥ 1/k}, logo Df = D1 ∪ · · · ∪ Dk ∪ · · · . Para mostrar que Df tem medida nula, basta provar que med.Dk = 0 para cada k ∈ N. Seja, então, dado P ε > 0. Como f é integrável, existe uma partição P de A tal que ωB · vol B < ε/k. Indiquemos geneB∈P ricamente com B ′ os blocos da partição P que contêm algum ponto de Dk em seu interior. Para cada um desses blocos B ′ , vale ωB ′ ≥ 1/k. Portanto X X ε 1X ωB · vol B < · vol B ′ ≤ ωB ′ · vol B ′ ≤ k k B∈P Multiplicando por k, obtemos Σ vol B ′ < ε. Ora, é claro que Dk ⊂ (∪B ′ ) ∪ X, onde X é a reunião das faces próprias dos blocos B ∈ P nos quais há algum ponto de Dk . Sabemos que med.X = 0. Segue-se daı́ que med.Dk = 0. (Ver Observação a seguir.) Seção 3 Cálculo com integrais 159 Observação: Seja Z ⊂ Rn um conjunto tal que, para todo ε > 0 dado, existem blocos B1 , . . . , Bk , . . . e um conjunto X ⊂ Rn com Z ⊂ (∪Bk ) ∪ X, Σvol Bk < ε e med. X = 0. Então med. Z = 0. Com efeito, tomando blocos C1 , . . . , Ck , . . . com X ⊂ ∪Ck e Σ med. Ck < ε, tem-se Z ⊂ (∪Bk ) ∪ (∪Ck ) onde Σ vol Bk + Σ vol Ck < 2ε. 3 Cálculo com integrais Teorema 8. Sejam f, g : A → R funções integráveis no bloco A ⊂ Rn e c um número real. Então; R R (1) fR + g : A → R é integrável e A [f (x) + g(x)]dx = A f (x)dx + A g(x)dx. R R (2) c · f : A → R é integrável e A c · f (x)dx = c · A f (x)dx. (3) O produto f · g : A → R é uma função integrável. (4) Se |g(x)| ≥ k > 0 para todo x ∈ A então f /g : A → R é integrável. R R (5) Se f (x) ≤ g(x) para todo x ∈ A então A f (x)dx ≤ A g(x)dx. R R (6) |f | : A → R é uma função integrável e | A f (x)dx| ≤ A |f (x)|dx. (7) Se A′ Ré um bloco contido em A e f (x) = 0 para todo x ∈ A − A′ R então A f (x)dx = A′ f (x)dx. Demonstração. A integrabilidade das funções f + g, c · f , f · g, f /g e |f | resulta do Teorema 7, pois Df +g ⊂ Df ∪ Dg , Dc·f = Df (se c 6= 0), Df ·g ⊂ Df ∪ Dg e D|f | ⊂ Df . Além disso, se |g(x)| ≥ k > 0 para todo x ∈ A então f /g : A → R é limitada e, como Df /g ⊂ Df ∪ Dg , o quociente f /g é integrável. As demais afirmações do Teorema 8 se provam exatamente como no caso de funções de uma única variável. (Ver Capı́tulo 10 do Volume 1.) O cálculo efetivo da integral de uma função f : A → R, definida num bloco n-dimensional, se faz integrando f sucessivamente em relação a cada uma das suas n variáveis. Basta aplicar diversas vezes o Teorema 9 abaixo, no qual adotamos as seguintes notações: Dados os blocos A1 ⊂ Rm e A2 ⊂ Rn , os pontos do bloco A1 × A2 ⊂ m+n R escrevem-se como (x, y), com x ∈ A1 e y ∈ A2 . Se f : A1 ×A2 → R 160 Integrais Múltiplas Cap. 8 é integrável, sua integral é indicada com Z f (x, y)dxdy. Para cada A1 ×A2 x ∈ A1 , definiremos a função fx : A2 → R pondo fx (y) = f (x, y) para todo y ∈ A2 , portanto fx é essencialmente a restrição de f ao bloco n-dimensional x × A2 . Mesmo que f seja integrável, pode ocorrer que, para alguns valores de x ∈ A1 , a função fx : A1 → R não o seja. Com efeito, os pontos em que f é descontı́nua formam um conjunto D de medida nula em Rm+n mas pode existir x ∈ A1 tal que D ∩ (x × A2 ) não tenha medida n-dimensional nula. Exemplo 1. Sejam A1 = A2 = [0, 1] e f : [0, 1] × [0, 1] → R dada por f (x, y) = 0 se x 6= 1/2, f (1/2, y) = 0 se y é racional, f (1/2, y) = 1 se y é irracional. O conjunto dos pontos de descontinuidade de f é Df = 1/2 × [0, 1], que tem medida nula em [0, 1] × [0, 1], logo f é integrável. (De fato, sua integral é zero.) Mas f1/2 : [0, 1] → R é a função igual a zero nos pontos racionais e igual a 1 nos irracionais, logo fx : [0, 1] → R não é integrável quando x = 1/2. ⊳ Teorema 9 (Integração repetida). Seja f : A1 × A2 → R integrável no produto dos blocos A1 ⊂ Rm e A2 ⊂ Rn . Para todo x ∈ A1 , seja fx : A2 → R definida por fx (y) = f (x, y). Ponhamos ϕ(x) = Z fx (y)dy e − A2 ψ(x) = Z− fx (y)dy. A2 As funções ϕ, ψ : A1 → R, assim definidas, são integráveis, com Z Z Z ϕ(x)dx = ψ(x)dx = f (x, y)dxdy, A1 A1 isto é: Z A1 ×A2 f (x, y)dxdy = Z A1 A1 ×A2   Z Z   fx (y)dy  = dx  − A2 A1  dx  − Z A2  fx (y)dy  . Demonstração. As partições do bloco A1 × A2 são da forma P = P1 × P2 , onde P1 e P2 são partições dos blocos A1 e A2 respectivamente. Os blocos de P são os produtos B1 × B2 com B1 ∈ P1 e B2 ∈ P2 . Mostraremos que s(f ; P ) ≤ s(ϕ; P1 ) ≤ S(ϕ; P1 ) ≤ S(f ; P ). Seção 3 Cálculo com integrais Daı́ resultará que ϕ é integrável e que Z ϕ(x)dx = A1 Z 161 f (x, y)dxdy. A1 ×A2 Na verdade, basta provar a primeira das desigualdades acima, pois a segunda é óbvia e a terceira é análoga. Também por analogia, não Z Z precisamos provar que ψ(x)dx = f (x, y)dxdy. A1 A1 ×A2 Começamos lembrando que se X ⊂ Y ⊂ R então inf .Y ≤ inf .X. Segue-se que, para todo bloco B1 × B2 ∈ P , tem-se m(f ; B1 × B2 ) ≤ m(fx ; B2 ), seja qual for x ∈ B1 . Portanto X B2 ∈P2 m(f ; B1 ×B2 )·vol B2 ≤ X B2 ∈P2 m(fx ; B2 )·vol B2 = s(fx ; P2 ) ≤ ϕ(x). Como isto vale para todo x ∈ B1 , concluı́mos que: X B2 ∈P2 m(f ; B1 × B2 ) · vol B2 ≤ m(ϕ; B1 ). Portanto s(f ; P ) = X B1 ×B2 ∈P = X B1 ∈P1 ≤ X B1 ∈P1   m(f ; B1 × B2 ) · vol B1 ·vol B2 X B2 ∈P2  m(f ; B1 × B2 ) · vol B2  · vol B1 m(ϕ; B1 ) · vol B1 = s(ϕ; P1 ). Corolário 4. Seja f : A1 × A2 × A3 → R integrável no produto dos blocos A1 ⊂ Rm , A2 ⊂ Rn e A3 ⊂ Rp . Então Z f (x, y, z)dxdydz = A1 ×A2 ×A3 Z A1 = Z A1 dx Z f (x, y, z)dz dy Z− dy − A2 dx Z Z− A2 − A3 f (x, y, z)dz. A3 162 Integrais Múltiplas Cap. 8 Com efeito, Z f (x, y, z)dxdydz = A1 ×A2 ×A3 Z A1 ×A2 = Z A1 = Z dxdy   dx  dx A1  Z− Z− A2 dy A2 Z− A3  dy  Z−  f (x, y, z)dz  Z− A3  f (x, y, z)dz  f (x, y, z)dz. A3 A seguir, vamos estender o conceito de integral para funções definidas em certos subconjuntos X ⊂ Rn que não são necessariamente blocos ndimensionais. 4 Conjuntos J-mensuráveis Dado o conjunto limitado X ⊂ Rn , seja A um bloco n-dimensional contendo X. A função caracterı́stica de X é a função ξX : A → R, definida por ξX (x) = 1 se x ∈ X e ξX (x) = 0 se x ∈ / X. Se X e Y são subconjuntos do bloco A, as seguintes propriedades da função caracterı́stica são evidentes: 1. ξX∪Y = ξX + ξY − ξX∩Y ; 2. ξX∩Y = ξX · ξY ; 3. Tem-se X ⊂ Y se, e somente se, ξX ≤ ξY ; neste caso, vale ξY −X = ξY − ξX . Segue-se de 1. que ξX∪Y = ξX + ξY quando X e Y são disjuntos. Se X estiver contido no interior de A (o que poderemos supor, sempre que for conveniente) então fr .X é o conjunto dos pontos de descontinuidade da função ξX : A → R. O volume interno e o volume externo do conjunto limitado X ⊂ Rn são definidos, respectivamente, pondo: vol . int .X = Z −A ξX (x)dx e vol .ext.X = Z− ξX (x)dx. A Conjuntos J-mensuráveis Seção 4 163 Quando a função caracterı́stica ξX : A → R é integrável, dizemos que X é J-mensurável (mensurável segundo Jordan) e que seu volume ndimensional é Z ξX (x)dx. vol X = A O item (7) do Teorema 8 assegura que os conceitos acima introduzidos não dependem da escolha do bloco A contendo X. Se X ⊂ A e P é uma partição do bloco A, as somas inferior e superior da função ξX : A → R relativas à partição P são s(ξX ; P ) = soma dos volumes dos blocos de P contidos em X; S(ξX ; P ) = soma dos volumes dos blocos de P que intersectam X. Portanto, se escrevermos v = vol . int .X e V = vol .ext.X, veremos que, para todo ε > 0 dado, existe uma partição P do bloco A (o qual contém X) tal que a soma dos volumes dos blocos de P contidos em X é superior a v − ε e a soma dos volumes dos blocos de P que intersectam X é inferior a V + ε. Teorema 10. (1) O conjunto limitado X ⊂ Rn é J-mensurável se, e somente se, sua fronteira tem medida nula. (2) Se X, Y ⊂ Rn são J-mensuráveis então X ∪ Y , X ∩ Y e X − Y são J-mensuráveis, com e vol(X ∪ Y ) = vol X + vol Y − vol(X ∩ Y ) vol(X − Y ) = vol X − vol Y quando Y ⊂ X. Demonstração. (1) Tomando um bloco n-dimensional A que contenha X em seu interior e considerando a função caracterı́stica ξX : A → R, temos as equivalências: X é J-mensurável ⇔ ξX é integrável ⇔ med. DξX = 0 ⇔ med. fr X=0, pois o conjunto DξX das descontinuidades de ξX coincide com a fronteira de X. (2) Basta observar que ξX∪Y = ξX +ξY −ξX∩Y e que, quando Y ⊂ X, vale ainda ξX−Y = ξX − ξY . Exemplo 2. Todo conjunto limitado X ⊂ Rn , cuja fronteira é uma superfı́cie, ou a reunião de um número finito (ou mesmo enumerável) de superfı́cies de dimensão n−1 é J-mensurável. Isto inclui uma bola fechada 164 Integrais Múltiplas Cap. 8 e a região compreendida entre duas bolas fechadas concêntricas. Resulta ainda do item (1) acima que um bloco n-dimensional é J-mensurável. ⊳ Exemplo 3. Seja X ⊂ R o conjunto formado pelo intervalo [0, 1] mais os números racionais do intervalo [1, 2]. O “volume”externo é 2 mas o interno é 1. Portanto X não é J-mensurável. Tomando o produto cartesiano de n cópias de X, obtém-se um subconjunto limitado de Rn que não é J-mensurável. ⊳ Exemplo 4. Se X ⊂ Rn é J-mensurável e int .X = ∅ então vol .X = 0 pois s(ξX ; P ) = 0 para toda partição P de um bloco que contenha X. Resulta daı́ que se X e Y são conjuntos J-mensuráveis sem pontos interiores em comum então vol(X ∪ Y ) = vol X + vol Y , pois vol(X ∩ Y ) = 0. ⊳ Z f (x)dx de uma função limitada Definiremos agora a integral X f : X → R, cujo domı́nio é um conjunto J-mensurável X ⊂ Rn . Para isto, consideramos um bloco n-dimensional A contendo X em seu interior e a função f¯: A → R, definida por f¯(x) = f (x) se x ∈ X e f (x) = 0 se x ∈ A − X. Pomos então, por definição Z Z f (x)dx = f¯(x)dx −X −A e Z− f (x)dx = X − Z f¯(x)dx. A Diremos que f : X → R é integrável quando tivermos − Z Z f (x)dx = f (x)dx −X X ou seja, quando f¯: A → R for integrável. Se f¯: A → R é descontı́nua num ponto x ∈ A, ou f é descontı́nua no ponto x ou x pertence à fronteira de X. Noutros termos, Df¯ ⊂ Df ∪fr .X. Como fr .X tem medida nula e Df ⊂ Df¯, segue-se que f é integrável (ou seja, f¯ é integrável) se, e somente se o conjunto Df dos seus pontos de descontinuidade tem medida nula. Z f (x)dx as mesmas regras Valem, evidentemente, para a integral X operatórias estabelecidas no Teorema 8 para o caso em que X é um bloco retangular. Seção 5 A integral como limite de somas de Riemann 165 Exemplo 5. É claro que um conjunto de volume zero tem medida nula. Se o conjunto dado é J-mensurável, vale a recı́proca (em virtude do Exemplo 4) pois medida nula implica interior vazio. A hipótese de J-mensurabilidade não pode ser omitida pois o conjunto enumerável Q∩[0, 1] tem medida nula mas seu “volume” externo é igual a 1 enquanto o interno é igual a zero. Observação: O item (1) do Teorema 10 pode ser tornado mais preciso: a fronteira de um conjunto J-mensurável tem volume zero. Com efeito, todo conjunto limitado tem fronteira compacta e vale o seguinte Complemento ao Teorema 10. Se X ⊂ Rn é compacto e med.X = 0 então vol X = 0. Demonstração: Seja dado ε > 0. Como são abertos os blocos que ocorrem na definição de med.X = 0, segue-se do Teorema de BorelLebesgue que existem blocos abertos B1 , . . . , Bk tais que X ⊂ B1 ∪ · · · ∪ k P vol Bj < ε. Para cada i = 1, . . . , k, as i-ésimas coordenadas Bk e j=1 dos vértices desses blocos formam um conjunto Pi , cujo menor elemento chamaremos de ai e, o maior, de bi . Cada Pi é, portanto, uma partição do intervalo [ai , bi ] e o conjunto Pn = P1 × · · · × Pn é uma partição do n Q [ai , bi ]. Temos X ⊂ A e o fecho B j de cada um dos blocos bloco A = i=1 iniciais é a reunião dos blocos B ′ ∈ P nele contidos. Segue-se daı́ que se um bloco B ′ ∈ P contém algum ponto de X então B ′ está contido num B j . Assim, a soma dos volumes dos blocos B ′ da partição P que intersectam X é menor do que ou igual à soma dos volume dos Bj , logo é menor do que ε. Portanto vol X = 0. 5 A integral como limite de somas de Riemann Mostraremos agora (veja o Teorema 12) que a integral Z X f (x)dx é o número real cujos valores aproximados são as “somas de Riemann” Σf (ξi ) vol Xi , obtidas quando se faz uma decomposição do tipo X = X1 ∪ · · · ∪ Xk , onde os Xi são conjuntos J-mensuráveis, tais que o interior de cada Xi é disjunto dos demais Xj , tomando-se arbitrariamente ξi ∈ Xi para cada i = 1, . . . , k. Esta é a forma mais comum, e a mais intuitiva, de se pensar na integral. Passemos às definições precisas. 166 Integrais Múltiplas Cap. 8 Seja X ⊂ Rn um conjunto J-mensurável. Diz-se que D = (X1 ,. . . ,Xk ) é uma decomposição de X quando os conjuntos X1 , . . . , Xk são J-mensuráveis, tais que o interior de cada Xi é disjunto dos demais Xj (isto é, Xi ∩Xj ⊂ fr .Xi ∩fr .Xj quando i 6= j), com X = X1 ∪· · ·∪Xk . A norma da decomposição D é o número |D| = max.diam.Xi = maior diâmetro dos conjuntos X1 , . . . , Xk . Por exemplo, se X ⊂ Rn é um bloco n-dimensional, toda partição P determina uma decomposição X = B1 ∪ · · · ∪ Bk , onde os Bi são os blocos da partição P . Seja f : X → R uma função limitada no conjunto J-mensurável X ⊂ Rn . Dada a decomposição D = (X1 , . . . , Xk ) de X escreveremos, para cada i = 1, . . . , k, mi = inf .{f (x); x ∈ Xi } e Mi = sup .{f (x); x ∈ Xi }. Definiremos então a soma inferior s(f ; D) e a soma superior S(f ; D) pondo s(f ; D) = k X i=1 mi · vol Xi e S(f ; D) = k X i=1 Mi · vol Xi . Diz-se que o número real J é o limite de S(f ; D) quando |D| tende a zero, e escreve-se J = lim S(f ; D) |D|→0 para significar que, para todo ε > 0 dado, existe δ > 0 tal que |D| < δ ⇒ |J − S(f ; D)| < ε. Analogamente se define o significado da afirmação I = lim s(f ; D). |D|→0 Teorema 11. Para toda função f : X → R, limitada no conjunto J-mensurável X ⊂ Rn , tem-se Z −X f (x)dx = lim s(f ; D) |D|→0 e − Z X f (x)dx = lim S(f ; D). |D|→0 Na demonstração do Teorema 11 usaremos o lema abaixo, cujo enunciado contém a desigualdade d(Xi , Y ) < δ. Se A e B são subconjuntos não-vazios de Rn , costuma-se escrever d(A, B) = inf .{|x − y|; x ∈ A, y ∈ B}. Por conseguinte, a desigualdade d(A, B) < δ significa que existem x ∈ A e y ∈ B com |x − y| < δ. Seção 5 A integral como limite de somas de Riemann 167 Lema 1. Sejam Y ⊂ X ⊂ Rn J-mensuráveis, com vol Y = 0. Para todo ε > 0 dado, existe δ > 0 tal que, se D é uma decomposição de X com |D| < δ então a soma dos volumes dos conjuntos Xi ∈ D tais que d(Xi , Y ) < δ é menor do que ε. Demonstração. Dado ε > 0, podemos cobrir Y com uma coleção finita de blocos B cuja soma dos volumes é < ε. Tomando arbitrariamente δ > 0, ponhamos cada um desses blocos B = Π[ai , bi ] dentro do bloco B ′ = Π[ai − 2δ, bi + 2δ]. Como lim vol B ′ = vol B, existe δ > 0 tal que a δ→0 soma dos volumes dos blocos B ′ é ainda menor do que ε. Usando a norma do máximo, podemos assegurar que se Z é um conjunto de diâmetro < δ tal que d(Z, B) < δ então Z ⊂ B ′ . Portanto, se D = (X1 , . . . , Xk ) é uma decomposição de X com |D| < δ, vemos que d(Xi , Y ) < δ ⇒ d(Xi , B) < δ para algum B ⇒ Xi ⊂ B ′ . Assim, a soma dos volumes dos conjuntos Xi ∈ D tais que d(Xi , Y ) < δ não excede a soma dos volumes dos blocos B ′ , logo é menor do que ε. Demonstração do Teorema 11. Basta provar a segunda afirmação. Sem perda de generalidade, podemos admitir que 0 ≤ f (x) ≤ K para todo x ∈ X. Com efeito, se somarmos uma constante c à função f , tanto a integral superior como o limite acima serão aumentados de c · vol X. Seja f¯: A → R a extensão de f a um bloco n-dimensional A ⊃ X, com f¯(x) = 0 se x ∈ A − X. Dado ε > 0, queremos achar δ > 0 tal que R− |S(f ; D)− X f (x)dx| < ε para toda decomposição D de X com |D| < δ. Ora, dado ε > 0, existe uma partição P0 de A tal que S(f¯; P0 ) < Z− f (x)dx + ε/2. X Seja Y a reunião das faces próprias dos blocos de P0 . Como vol Y = 0, o Lema 1 assegura a existência de δ > 0 tal que, para toda decomposição D de X com |D| < δ, a soma dos volumes dos conjuntos Xi ∈ D com d(Xi , Y ) < δ é menor do que ε/2K. Seja então D uma decomposição de X com norma |D| < δ. Chamemos de Xα os conjuntos de D tais que d(Xα , Y ) < δ. Os demais conjuntos de D serão chamados de Xβ . Notemos que cada Xβ deve estar contido em algum bloco da partição P0 pois, do contrário, existiriam 168 Integrais Múltiplas Cap. 8 x, y ∈ Xβ em blocos distintos de P0 , logo o segmento de reta [x, y] conteria algum ponto de Y . Como |x − y| < δ, isto daria d(Xβ , Y ) < δ um absurdo. Escrevendo Mα = sup{f (x); x ∈ Xα } e Mβ = sup{f (x); x ∈ Xβ }, vem X X S(f ; D) = Mα · vol Xα + Mβ · vol Xβ , onde X X Mα · vol Xα ≤ K · vol Xα < ε/2 e   X X X X  Mβ · vol Xβ = Mβ · vol Xβ  ≤ MB · vol B B∈P0 Xβ ⊂B = S(f¯; P0 ) < B∈P0 Z− f (x)dx + ε/2. X Assim |D| < δ ⇒ S(f ; D) < R− X f (x)dx R− + ε. Mostraremos agora que S(f ; D) ≥ X f (x)dx para toda decomposição D de X. Com efeito, seja Z a reunião das fronteiras dos conjuntos Xi da decomposição D. Como vol Z = 0, o Lema nos dá δ ′ > 0 tal que, para toda partição P do bloco A com |P | < δ ′ , a soma dos volumes dos blocos de P que intersectam Z é menor do que ε/K. Tomando |P | < δ ′ , temos X X S(f¯; P ) = MB · vol B + MC · vol C, onde chamamos de B os blocos de P que intersectam Z e de C os que estão contidos no interior de algum Xi ∈ D. (Observe que, pelo Teorema da Alfândega, um bloco que não esteja contido no interior de algum Xi deve intersectar Z, pois todo bloco é conexo.) Ora, temos X X MB · vol B ≤ K · vol B < ε e     X X X X X  MC · vol C  ≤ vol C  MC · vol C = Mi  i ≤ X i C⊂Xi i C⊂Xi Mi · vol Xi = S(f ; D). Vemos assim que, para toda decomposição D do conjunto X ⊂ A e todo ε > 0, pode-se achar uma partição P de bloco A tal que S(f ; P ) ≤ Seção 5 A integral como limite de somas de Riemann S(f ; D)+ε. Sendo segue-se que Z− X Z− 169 f (x)dx o ı́nfimo do conjunto das somas S(f ; P ), X f (x)dx ≤ S(f ; D) + ε. Como ε > 0 é arbitrário, concluı́mos que − Z X f (x)dx ≤ S(f ; D) para toda decomposição de X. Isto conclui a demonstração. Corolário 5 (da demonstração). Para toda função limitada f : X → R no conjunto J-mensurável X ⊂ Rn , tem-se Z −X Z− f (x)dx = sup s(f.D) e D f (x)dx = inf S(f ; D), X D onde o inf e o sup acima se referem a todas as decomposições D de X. Uma decomposição pontilhada do conjunto J-mensurável X ⊂ Rn é um par D∗ = (D, ξ), onde D = (X1 , . . . , Xk ) é uma decomposição de X e ξ = (ξ1 , . . . , ξk ), com ξ1 ∈ X1 , . . . , ξk ∈ Xk . Em termos menos formais, pontilhar a decomposição D = (X1 , . . . , Xk ) é escolher um ponto ξi em cada conjunto Xi , i = 1, . . . , k. A toda partição pontilhada D∗ fica associada a soma de Riemann Σ(f ; D∗ ), definida por k X X f (ξi ) · vol Xi . (f ; D∗ ) = i=1 Diz-se que o número I é o limite das somas de Riemann Σ(f ; D∗ ) quando a norma |D| tende a zero, e escreve-se X I = lim (f ; D∗ ), |D|→0 quando, para todo ε > 0 dado, pode-se obter δ > 0 tal que, para toda decomposição D do conjunto X com norma |D| < δ tem-se |Σ(f ; D∗ ) − I| < ε, seja qual for a maneira D∗ de se pontilhar D. Teorema 12. Se f : X → R é integrável no conjunto J-mensurável X ⊂ Rn então Z f (x)dx = lim Σ(f ; D∗ ). X |D|→0 170 Integrais Múltiplas Cap. 8 Demonstração. Para toda decomposição D de X tem-se X s(f ; D) ≤ (f ; D∗ ) ≤ S(f ; D), seja qual for o modo D∗ de pontilhar D. Pelo Teorema 11, temos Z f (x)dx. lim S(f ; D) = lim s(f ; D) = |D|→0 |D|→0 X Z ∗ f (x)dx. Segue-se imediatamente que lim Σ(f ; D ) = |D|→0 6 X Exercı́cios Seção 1. A definição de integral 1. Sejam f : A → R uma função limitada no bloco n-dimensional A e J um número real com a seguinte propriedade: para todo ε > 0 dado, existe uma partição P0 de A tal que |S(f ; P ) − J| < ε, qualquer que seja a partição P de R− f (x)dx. (Um resultado análogo vale para A que refine P0 . Prove que J = A a integral inferior.) 2. Dada uma partição P0 do bloco A, prove que as integrais inferior e superior de uma função limitada f : A → R podem ser calculadas considerando-se apenas as partições de A que refinam P0 . 3. Sejam C ⊂ A blocos n-dimensionais. Se a função f : A → R é integrável, prove que sua restrição fC = f |C é integrável no bloco C. 4. Se a função f : A → R é contı́nua em todos os pontos do bloco A que têm a primeira coordenada diferente de um certo número c, prove que f é integrável. Seção 2. Conjuntos de medida nula 1. Prove que o gráfico de uma função integrável f : A → R, definida num bloco n-dimensional, tem medida nula em Rn+1 . 2. Prove que um bloco n-dimensional não tem medida n-dimensional nula. Daı́ todo conjunto de medida nula tem interior vazio. 3. Se X ⊂ Rp e v ∈ Rp , escreve-se X + v = {x + v; x ∈ X}. Dadas M, N ⊂ Rp , superfı́cies de classe C 1 tais que dim M + dim N < p, prove que é denso em Rp o conjunto V dos vetores v tais que M + v e N são disjuntos. Se M e N são compactas, além de denso, V é aberto em Rp . 4. Prove que toda função integrável f : A → R é a diferença entre duas funções integráveis não-negativas. Seção 3. Cálculo com integrais 1. Sejam A, B blocos n-dimensionais, com B contido no interior de A. Se f : A → R é a funçãoR igual a 1 nos pontos de B e igual a 0 fora de B, prove que f é integrável e A f (x)dx = vol ·B. Seção 6 Exercı́cios 2. Seja a um número positivo menor do que 1/2, logo ∞ P n=1 171 an = 1 − δ, com 0 < δ < 1. Retire do intervalo [0, 1] um intervalo aberto J1 , de comprimento a e centro no ponto 1/2. Em seguida, com centros nos pontos médios dos intervalos restantes, retire os intervalos abertos J2 e J3 , ambos de comprimento a2 /2. Repetindo o processo n vezes, restam 2n intervalos fechados, dois a dois disjuntos, de iguais comprimentos. A (n+1)-ésima etapa consiste em retirar do centro de cada um deles um intervalo aberto de comprimento an+1 /2n . Seja ∞ S Jk o que restou depois de efetuadas todas essas operações. X = [0, 1] − k=1 Prove que o conjunto X tem as seguintes propriedades: é compacto, tem interior vazio, não possui pontos isolados e, principalmente, não tem medida nula. Ele é chamado um “conjunto de Cantor com medida positiva”. 3. Se a função f : A1 × A2 → R é integrável, prove que existe um conjunto de medida nula X ⊂ A1 tal que fx : A2 → R é integrável para todo x ∈ A1 − X. 4. Se uma função integrável R f : A → R é igual a zero salvo num conjunto de medida nula, prove que A f (x)dx = 0. Seção 4. Conjuntos J-mensuráveis 1. Prove que o volume de um bloco B, definido por meio de uma integral, coincide com aquele definido anteriormente como produto dos comprimentos das arestas. 2. Justifique por que a bola B[a; r] é um conjunto J-mensurável. 3. Prove que o interior de um conjunto J-mensurável X ⊂ Rn também é J-mensurável e vol ·X = vol(int ·X). Prove uma afirmação análoga para o fecho X. 4. Seja f : A → R uma função limitada no bloco A ⊂ Rn , com f (x) ≥ 0 para todo x ∈ A. Prove que se f é integrável então o conjunto R C(f ) = {(x, y) ∈ Rn+1 ; x ∈ A, 0 ≤ y ≤ f (x)} é J-mensurável e vol C(f ) = A f (x)dx. 9 Mudança de Variáveis Demonstraremos neste capı́tulo o importante Teorema da Mudança de Variáveis em integrais múltiplas. Começaremos estabelecendo as notações. U e V são abertos do espaço euclidiano Rn ; h : U → V é um difeomorfismo de classe C 1 . X é um subconjunto compacto J-mensurável de U . A fronteira de X, que tem medida nula, está contida em X (logo em U ) e sua imagem por h, que é a fronteira do compacto h(X), tem medida nula (Teorema 6, Capı́tulo 8). Portanto h(X) também é um conjunto J-mensurável. Finalmente, f : h(X) → R é uma função integrável. O Teorema da Mudança de Variáveis diz que a seguinte igualdade é verdadeira: Z Z f (h(x)) · | det h′ (x)|dx. f (y)dy = h(X) X Ela é análoga para n variáveis daquela estabelecida no Vol. 1. (Vide Teorema 2, Capı́tulo 11.) Notam-se, porém, algumas diferenças. A função que, no caso de uma só variável, desempenhava o papel de h não precisava ser um difeomorfismo. Para n > 1, entretanto, pelo menos injetividade de h (ou algo equivalente) se faz necessário, sem o que a fórmula não vale. (O estudo dessas situações gerais leva à noção de grau, que é analisada em detalhe no livro “Curso de Análise”, Vol. 2.) Outra diferença é o valor absoluto em | det h′ (x)|. É natural que o determinante substitua a derivada h′ (x) pois, quando n > 1, esta não é um número; mas o valor absoluto que ocorre na fórmula acima não Seção 1 O caso unidimensional 173 parece estar presente quando n = 1. Na verdade, porém, ele está oculto na igualdade Z b Z h(b) f (h(x)) · h′ (x)dx. f (y)dy = a h(a) De fato, se chamarmos de I o intervalo [a, b] e J = h(I) o intervalo cujos extremos são h(a) e h(b), temos h(a) > h(b) quando h′ < 0, logo a fórmula acima significa, em qualquer caso, que Z Z f (y)dy = f (h(x)) · |h′ (x)|dx, I J pois Z f (y)dy = J Z h(b) f (y)dy se h(a) < h(b), isto é, se h′ (x) > 0, h(a) e Z J f (y)dy = − Z h(b) f (y)dy se h(b) < h(a), isto é, se h′ (x) < 0. h(a) O Teorema de Mudança de Variáveis será provado por etapas. 1 O caso unidimensional Dado o intervalo I = [a, b], escreveremos |I| = b − a. Teorema 1. Sejam U, V ⊂ R abertos, h : U → V um difeomorfismo C 1 , I ⊂ U um intervalo compacto, J = h(I) e f : J → R uma função limitada. Então − Z f (y)dy = J − Z I f (h(x)) · |h′ (x)|dx. Demonstração. Sem perda de generalidade, podemos admitir que f (y) ≥ 0 para todo y ∈ J pois, se somarmos a mesma constante positiva a f , o lado esquerdo sofrerá o acréscimo de c · |J| enquanto o acréscimo Z sofrido pelo lado direito será de c · I |h′ (x)|ds. Como h′ (x) não muda de sinal para x ∈ I, o valor desta integral é c · |h(b) − h(a)| = c · |J| também. Esta observação nos deixa livres para manipular desigualdades. 174 Mudança de Variáveis Cap. 9 As partições de J = h(I) são do tipo h(P ), dadas por intervalos da forma Jr = h(Ir ), onde os Ir (r = 1, . . . , k) são os intervalos de uma partição P de I. Para cada r, ponhamos Mr = sup f (y) = sup f (h(x)) y∈Jr e cr = sup |h′ (x)|. Evidentemente, |P | → 0 ⇔ |h(P )| → 0. x∈Ir x∈Ir Pelo Teorema do Valor Médio, para cada r = 1, . . . , k existe ξr ∈ Ir tal que |Jr | = |h′ (ξr )| · |Ir |. Pondo ηr = cr − |h′ (ξr )|, temos ηr ≥ 0 e, em virtude da continuidade uniforme de h′ no intervalo I, lim ηr = 0. k P Segue-se que lim |P |→0 r=1 0≤ k X r=1 |P |→0 ηr |Ir | = 0 pois ηr |Ir | ≤ (max ηr ) · r k X r=1 |Ir | = (max ηr ) · |I|. r Então S(f ; h(P )) = k X r=1 Mr · |Jr | = S((f ◦ h) · |h′ |; P ) = k X r=1 k X r=1 Mr cr |Ir | − k X r=1 Mr ηr |Ir | e Nr |Ir |, onde Nr = sup (f (h(x)) · |h′ (x)|) ≤ Mr · cr x∈Ir pois se ϕ, φ : A → R são duas funções não-negativas limitadas quaisquer então sup(ϕ(x) · ψ(x)) ≤ sup ϕ(x) · sup ψ(x). Logo, para toda partição x∈A P do intervalo I, vale: x∈A x∈A S((f ◦ h) · |h′ |; P ) ≤ S(f ; h(P )) + M · k X r=1 ηr · |Ir |, onde M = sup f (y). y∈J Segue-se que Z− I f (h(x)) · |h′ (x)| · dx = lim S((f ◦ h) · |h′ |; P ) |P |→0 ≤ lim S(f ; h(P )) = |P |→0 Z− f (y)dy. J Seção 2 Difeomorfismos primitivos A desigualdade oposta, Z− J 175 Z− f (y)dy≤ f (h(x)) · |h′ (x)|dx, resulta da que I vem de ser provada, usando-se h−1 : J→I em vez de h, (f ◦ h) · |h′ | : I→R em vez de f e levando em conta que, para todo y = h(x), x ∈ I, tem-se (h−1 )′ (y) = 1/h′ (x). Então concluı́mos que − Z 2 f (y)dy = J − Z I f (h(x)) · |h′ (x)|dx. Difeomorfismos primitivos O próximo caso particular que consideraremos é aquele em que h é um difeomorfismo primitivo. Chamam-se primitivos os difeomorfismos h de um dos dois tipos seguintes: Tipo 1. São fixados os ı́ndices i, j, com 1 ≤ i < j ≤ n e h : Rn → Rn é dado por h(x) = h(x1 , . . . , xi , . . . , xj , . . . , xn ) = (x1 , · · · , xj , . . . , xi , . . . , xn ). Tipo 2. Tem-se uma função ϕ : U → R, de classe C 1 , e para todo x ∈ U vale h(x) = (ϕ(x), x2 , . . . , xn ). Teorema 2. Seja h : Rn → Rn um difeomorfismo primitivo do Tipo 1. Para todo conjunto J-mensurável X ⊂ Rn e toda função integrável f : h(X) → R tem-se Z Z f (h(x)) · | det h′ (x)| dx. f (y)dy = X h(X) Demonstração. O difeomorfismo h é um operador linear, com det h′ (x) = −1 paraZ todo x ∈ Rn , Zlogo | det h′ (x)| = 1. Devemos, por- f (h(x))dx. Ora, para todo bloco f (y)dy = tanto, mostrar que h(X) X B ⊂ Rn , sua imagem h(B) é também um bloco, com arestas de mesmo comprimento que as de B, logo vol h(B) = vol B. Como o volume de um conjunto J-mensurável Z ⊂ Rn é o ı́nfimo dos números Σ vol Bi , onde 176 Mudança de Variáveis Cap. 9 os Bi são blocos, com Z ⊂ B1 ∪ · · · ∪ Bk , segue-se que vol ·h(Z) = vol Z. Toda decomposição h(X) = Y1 ∪ · · · ∪ Yk é tal que Yi = h(Xi ), onde X = X1 ∪ · · · ∪ Xk é uma decomposição de X. Todo ponto de Yi é da forma h(ξi ), com ξi ∈ Xi . Logo Z X f (y)dy = lim f (h(ξi )) · vol Yi |D|→0 h(X) Z X = lim f (h(x))dx. f (h(ξi )) · vol Xi = |D|→0 X Teorema 3. O Teorema de Mudança de Variáveis em Integrais Múltiplas é válido quando X ⊂ Rn é um bloco retangular e h : U → V é um difeomorfsmo primitivo do Tipo 2. Demonstração. Por conveniência, escreveremos os pontos de Rn sob a forma x = (s, w), com s ∈ R e w ∈ Rn−1 , e consideraremos o bloco X = I × A como produto cartesiano do intervalo I = [a, b] pelo bloco A ⊂ Rn−1 . Note-se que, para todo w ∈ A fixado, a função ϕw : s 7→ ϕ(s, w) = t é um difeomorfismo do intervalo I sobre o intervalo Jw = ϕw (I) = ϕ(I × w). Observemos ainda que a matriz jacobiana de h tem a primeira linha igual ao gradiente de ϕ e, a partir da segunda linha, coincide com a matriz identidade (n − 1) × (n − 1). Portanto ∂ϕ (s, w) = ϕ′w (s). Seja J ⊂ R um intervalo compacto det h′ (x) = ∂s contendo Jw para todo w ∈ A. Então h(X) ⊂ J × A. Como de praxe, f¯: J × A → R é a função integrável, igual a f nos pontos de h(X) e igual a zero nos demais pontos de J ×A. Então o Teorema 1 nos permite escrever: Z f (y)dy = h(X) Z f (t, w)dt dw = h(X) = Z A = Z A = Z     I×A = Z X − Z − Z J I  Z f¯(t, w)dt dw J×A f¯w (t)dt dw = Z A   − Z  Jw fw (ϕ(s, w))|ϕ′w (s)|ds dw fw (t)dt dw f (ϕ(s, w), w) · | det h′ (s, w)|ds dw f (h(x)) · | det h′ (x)|dx.  Seção 3 3 Todo difeomorfismo C 1 é localmente admissı́vel 177 Todo difeomorfismo C 1 é localmente admissı́vel Seja D o conjunto dos difeomorfismos de classe C 1 para os quais é válido o Teorema de Mudança de Variáveis. Os elementos de D serão chamados difeomorfismos admissı́veis. Como sabemos, o objetivo deste capı́tulo é provar que todo difeomorfismo de classe C 1 é admissı́vel. Acabamos de ver que os difeomorfismos primitivos pertencem a D. Além disso, como det((h1 ◦ h2 )′ (x)) = det h′1 (h2 (x)) · det h′2 (x), vê-se imediatamente que h1 ◦ h2 ∈ D quando h1 ∈ D e h2 ∈ D. Por exemplo, todo difeomorfismo da forma h(x) = (x1 , . . . , xj−1 , ϕ(x), xj+1 , . . . , xn ) é admissı́vel pois é composto de três difeomorfismos primitivos. Nesta seção, provaremos que todo difeomorfismo de classe C 1 é localmente admissı́vel. Este é o conteúdo do teorema seguinte, o qual, evidentemente, é um resultado provisório. Teorema 4. Seja h : U → V um difeomorfismo de classe C 1 entre abertos de Rn . Todo ponto de U possui uma vizinhança, restrita à qual h é admisı́vel. Demonstração. Basta provar que, dado x0 ∈ U , se h é definido numa vizinhança de x0 e tem a forma h(x) = (ϕ1 (x), . . . , ϕj (x), xj+1 , . . . , xn ), com j > 1, então existe um difeomorfismo k, de classe C 1 , composto de difeomorfismos primitivos, cuja imagem é uma vizinhança de x0 , tal que h(k(w)) = (ψ1 (w), . . . , ψj−1 (w), wj . . . , wn ). Ora, as j primeiras linhas da matriz jacobiana de h são os vetores grad ϕ1 , . . . , grad ϕj e as demais linhas coincidem com as da matriz identidade n × n. Compondo h, se necessário, com um difeomorfismo ∂ϕj do Tipo 1, podemos admitir que (x0 ) 6= 0. Pelo Teorema 5 do ∂xj Capı́tulo 6 (aplicado à função ϕj ) existe um difeomorfismo admissı́vel k : w 7→ (w1 , . . . , kj (w), wj+1 , . . . , wn ) 178 Mudança de Variáveis Cap. 9 cuja imagem é uma vizinhança de x0 tal que ϕj (k(w)) = wj para todo w no domı́nio de k. Então h(k(w)) = (ϕ1 (k(w)), . . . , ϕj−1 (k(w)), wj , . . . , wn ), completando assim a demonstração. 4 Conclusão: todo difeomorfismo de classe C 1 é admissı́vel Para terminar a demonstração do Teorema de Mudança de Variáveis, vamos usar um resultado topológico elementar que estabeleceremos agora. S Cλ uma cobertura do conjunto X ⊂ Rn . Diz-se que Seja X ⊂ λ∈L δ > 0 é um número de Lebesgue dessa cobertura quando todo subconjunto Y ⊂ X com diâmetro < δ está contido em algum Cλ . S Aλ de um conjunto comTeorema 5. Toda cobertura aberta X ⊂ pacto X ⊂ Rn possui número de Lebesgue. λ∈L Demonstração. Se supusermos, por absurdo, que nenhum δ > 0 é número de Lebesgue da cobertura dada, obteremos, para cada k ∈ N, um conjunto Yk ⊂ X, com diam Yk < 1/k mas nenhum Aλ contém Yk . Escolhemos um ponto yk em cada Yk . Passando a uma subseqüência, se necessário, a compacidade de X assegura a existência de a ∈ X tal que lim yk = a. Existe λ0 tal que a ∈ Aλ0 . Existe ainda ε > 0 com B(a; ε) ⊂ Aλ0 , pois Aλ0 é aberto. Tomemos k ∈ N tão grande que 1/k < ε/2 e |a − yk | < ε/2. Então, lembrando que diam Yk < 1/k, para todo y ∈ Yk temos |y − a| ≤ |y − yk | + |yk − a| < 1 ε + < ε. k 2 Segue-se que Yk ⊂ B(a, ε) ⊂ Aλ0 , uma contradição. Exemplo 1. Sejam A1 = {(x, y) ∈ R2 ; x > 0, y > 1/x} e A2 = {(x, y) ∈ R2 ; y < 0}. A cobertura aberta X = A1 ∪ A2 não possui número de Lebesgue. Com efeito, dado qualquer δ > 0, seja p = (x, 0), com 0 < δ 1 < . Então X ∩ B(p; δ/2) é um subconjunto de X com diâmetro < δ, x 2 o qual não está contido em A1 nem A2 . Seção 5 Exercı́cios 179 Teorema 6. Sejam X ⊂ Rn um conjunto compacto J-mensurável, h : U → V um difeomorfismo de classe C 1 entre abertos U, V ⊂ Rn e f : h(X) → R uma função integrável. Então Z Z f (h(x)) · | det h′ (x)|dx. f (y)dy = X h(X) Demonstração. Existe uma cobertura aberta X ⊂ S x∈X Wx ⊂ U tal que a restrição de h a cada Wx é um difeomorfismo admissı́vel. Seja δ > 0 um número de Lebesgue dessa cobertura. Tomamos uma decomposição D = (X1 , . . . , Xk ) de X tal que cada conjunto Xi tenha diâmetro inferior a δ. (Para obter D, basta tomar uma partição P de um bloco A contendo X de modo que os blocos Bi de P tenham arestas < δ na norma do máximo, √ ou δ/ n na norma euclidiana. Em seguida, ponha Xi = Bi ∩ X.) Então Z XZ XZ f (y)dy = f (y)dy = f (h(x)) · | det h′ (x)|dx h(X) = Zi X h(Xi ) i Xi f (h(x)) · | det h′ (x)|dx. Corolário 1. Seja T : Rn → Rn um operador linear. Para todo conjunto compacto J-mensurável X ⊂ Rn tem-se vol T (X) = | det T | · vol X. Basta aplicar o Teorema 6 à função caracterı́stica ξX em lugar de f , observando que é suficiente considerar o caso em que T é invertı́vel. 5 Exercı́cios 1. Seja f : U → Rm de classe C 1 no aberto U ⊂ Rm . Se, no ponto a ∈ U , a derivada f ′ (a) : Rm → Rm é um isomorfismo, prove que lim r→0 vol ·f (B(a; r)) = | det ·f ′ (a)|. vol ·B(a; r) 2. Sejam M ⊂ Rn+1 uma hiperfı́cie orientável, ϕ : V0 → V uma parametrização compatı́vel com a orientação de M e X ⊂ V um compacto tal que X0 = ϕ−1 (X) ⊂ V0 é J-mensurável. Seja ainda v : M → Rn+1 um campo de vetores 180 Integrais Múltiplas Cap. 9 (não necessariamente tangentes ou normais a M ). O fluxo de v através do conjunto X é, por definição, dado pela integral Z f (v, X) = hv(ϕ(x)), w(ϕ(x))idx X0 ∂ϕ ∂ϕ (x) × · · · × (x) (produto vetorial) para todo x ∈ V0 . ∂x1 ∂xn Prove que f (v, X) não depende da parametrização ϕ. onde w(ϕ(x)) = 10 Soluções dos exercı́cios Cada uma das nove seções deste capı́tulo tem o mesmo tı́tulo de um dos nove capı́tulos anteriores e contém soluções para exercı́cios propostos naquele capı́tulo. Em cada uma delas, a notação p·q significa o q-ésimo exercı́cio da seção p do capı́tulo correspondente. 1 Topologia do Espaço Euclidiano 1.1. Se |u+v| = |u|+|v| então |u+v|2 = (|u|+|v|)2 , ou seja, |u|2 +2hu, vi+|v|2 = |u| + 2|u| |v| + |v|2 , logo hu, vi = |u| |v| e daı́ v = α · u, com α ≥ 0. 1.2. Podemos supor que um dos vetores u = x − y e v = y − z, digamos v, é diferente de zero. Então, de |u + v| = |x − z| = |x − y| + |y − z| = |u| + |v| segue-se que v = αu, com α ≥ 0. Logo y − z = αx − αy e daı́ (1 + α)y = z + αx, ou seja y = (1 − t)x + tz, com t = α/(1 + α); portanto 0 ≤ t ≤ 1. hx, yi 1.3. Seja z = · x. Como hy − z, xi = 0, segue-se que hy − z, yi = 0, o que |x|2 nos dá |y|2 = hz, yi e daı́ |x|2 |y|2 = hx, yi2 , logo x e y são colineares. 1.4. Um cálculo imediato mostra que, como |x| = |y|, vale hz, xi = hz, yi, portanto hz, y − xi = 0. 2 2.1. Devemos ter c = a + t(b − a), onde t é tal que hc, bi = hc, ai. Isto nos dá ha, b − ai . O Teorema de Pitágoras assegura que |c| < |x| para todo x 6= c na |b − a|2 reta ab. 2.2. Vale |(1 − t)x + ty| < (1 − t)r + tr = r se 0 < t < 1 em virtude de 1.1. 2.3. Dados a, b ∈ B(X; r), existem A, B ∈ X tais que |a − A| < r e |b − B| < r. Então, para todo t ∈ [0, 1], tem-se (1 − t)A + tB = C ∈ X e |(1 − t)a + tb − C| ≤ (1 − t)|a − A| + t|b − B| < (1 − t)r + tr = r, logo (1 − t)a + tb ∈ B(X; r). 2.4. Isto pode ser provado usando o fato de que a função y = x2 é convexa (cfr. vol. 1, pag. 108) ou, diretamente, assim: dados (a, m) e (b, n) em X, para mostrar que ((1 − t)a + tb, (1 − t)m + tn) ∈ X, basta provar que (1 − t)2 a2 + t2 b2 + 2t(1−t)ab ≤ (1−t)a2 +tb2 pois a2 ≤ m e b2 ≤ n. Levando em conta que 1−t−(1−t)2 = t=− 182 Soluções dos exercı́cios Cap. 10 t(1 − t), isto equivale a provar que 2t(1 − t)ab ≤ t(1 − t)(a2 + b2 ), o que é claro pois a2 + b2 ≥ 2ab. 2.5. Se |T · v| = a > 0 então |T · nv| = n · a logo T não é limitada. Seja c = max{|T e1 |, . . . , |T em |}. Se o conjunto X ⊂ Rm é limitado então existe k > 0 tal m P P que, para todo x = (x1 , . . . , xm ) ∈ X, tem-se |xi | ≤ k, logo |T · x| = | xi · T ei | ≤ i=1 P P |xi | |T ei | ≤ c · |xi | ≤ c · k. 3.1. Se x ∈ int ·X então existe r > 0 com B(x; r) ⊂ X. Para todo y ∈ B(x; r), o argumento do texto mostra que, pondo s = r − |y − x|, tem-se B(y; s) ⊂ B(x; r), donde B(y; s) ⊂ X e daı́ y ∈ int .X. Portanto x ∈ int .X ⇒ x ∈ int . int .X, ou seja, int .X ⊂ int . int .X. A inclusão contrária é óbvia. 3.2. Se A é um aberto contido em X então todo ponto x ∈ A é centro de uma bola contida em A, logo contida em X. Assim A ⊂ int .X. 3.3. A fronteira do conjunto Qn , formado pelos pontos de Rn cujas coordenadas são números racionais, é todo o Rn . Se X ⊂ Rn é aberto então X ∩ fr .X = ∅. Qualquer bola com centro num ponto x ∈ fr .X contém pontos de X portanto pontos fora de fr .X. Assim nenhum ponto x ∈ fr .X é um ponto interior. 3.4. Basta observar que todo aberto A ⊂ Rn é a reunião das bolas abertas nele contidas e que a projeção de uma bola aberta é um intervalo aberto (fato que fica mais evidente quando se usa em Rn a norma do máximo). 3.5. Tome em cada aberto A dessa coleção um ponto pertencente ao conjunto não-vazio A ∩ Qn . Como Qn é enumerável o mesmo ocorre com o conjunto dos pontos escolhidos, a cada um dos quais corresponde um único aberto da coleção pois estes são disjuntos. 4.1. Para todo ε > 0 dado, existem k1 , k2 ∈ N tais que k > k1 , k ∈ N′ implicam |xk − a| < ε e k > k2 , k ∈ N′′ ⇒ |xk − a| < ε. Seja k0 = max{k1 , k2 }. Como N = N′ ∪ N′′ , segue-se que k > k0 ⇒ |xk − a| < ε. Logo lim xk = a. 4.2. Se existissem um subconjunto infinito N′ ⊂ N e um ponto a ∈ Rn tais que lim′ xk = a então existiria k1 ∈ N tal que k ∈ N′ , k > k1 ⇒ |xk − a| < 1 ⇒ n∈N |xk | < |a| + 1. Ao mesmo tempo, se for lim |xk | = +∞, existirá k2 ∈ N tal que k > k2 ⇒ |xk | > |a| + 1. Tomando k0 = max{k1 , k2 }, para todo k > k0 terı́amos |xk | < |a| + 1 e |xk | > |a| + 1, um absurdo. Logo (a) ⇒ (b). Em seguida, se o conjunto NX do item (c) fosse infinito então os termos xk com k ∈ NX formariam uma seqüência limitada, a qual possuiria uma subseqüência convergente. Logo (b) ⇒ (c). Finalmente, admitindo (c), para todo A > 0 o conjunto dos ı́ndices k ∈ N tais que |xk | ≤ A possui um elemento máximo k0 logo k > k0 ⇒ |xk | > A, o que prova a implicação (c) ⇒ (a). 4.3. Tome B(a; ε) ⊂ A. 4.4. Como a ∈ X ∩ (Rn − X), para todo k ∈ N existem xk ∈ X e yk ∈ Rn − X tais que |xk − a| < 1/k e |yk − a| < 1/k, logo lim xk = lim yk = a. A recı́proca é óbvia. 5.1 De X ⊂ X e Y ⊂ Y , segue-se que X ∪ Y ⊂ X ∪ Y . Como X ∪ Y é fechado, resulta daı́ que X ∪ Y ⊂ X ∪ Y . Por outro lado, de X ⊂ X ∪ Y e Y ⊂ X ∪ Y segue-se que X ⊂ X ∪ Y e Y ⊂ X ∪ Y , logo X ∪ Y ⊂ X ∪ Y . Analogamente, X ⊂ X e Y ⊂ Y implicam X ∩ Y ⊂ X ∩ Y logo X ∩ Y ⊂ X ∩ Y porque X ∩ Y é fechado. Tomando X = (a, b) e Y = (b, c) temos X ∩ Y = ∅ e X ∩ Y = {b}. Seção 1 Topologia do Espaço Euclidiano 183 5.2. Para todo k ∈ N, sejam Xk = {xr ; r ≥ k} e F o conjunto dos valores de aderência T de (xk ). Segue-se da definição que a ∈ F ⇔ a ∈ X k para todo k ∈ N. Logo F = X k .̇ portanto F é fechado. k∈N 5.3. Se A é aberto e a ∈ A ∩ X então a = lim xk , xk ∈ X. Para todo k suficientemente grande, tem-se xk ∈ A, isto é, xk ∈ A ∩ X, portanto a ∈ A ∩ X. Para a recı́proca, se A não fosse aberto, existiria um ponto a ∈ A não-interior, logo a ∈ A ∩ X, onde X = Rn − A. Mas, neste caso, A ∩ X = ∅, logo não se teria A ∩ X ⊂ A ∩ X. 5.4. Escrevendo os pontos de Rm+n sob a forma (x, y), com x ∈ Rm e y ∈ Rn , a igualdade X × Y = X × Y resulta do fato de que (a, b) = lim(xk , yk ) ⇔ a = lim xk e b = lim yk . 5.5. As duas afirmações decorrem do seguinte: para todo conjunto X ⊂ Rn , tem-se a reunião disjunta Rn = int .X ∪ fr .X ∪ int .(Rn − X), sendo X fechado se, e somente se, Rn − X é aberto. 5.6. Se d(A, B) = 0 então existem seqüências de pontos xk ∈ A e yk ∈ B tais que lim |xk − yk | = 0. Passando a uma subseqüência, se necessário, podemos admitir que existe a = lim xk , pois A é limitado. Então vale também lim yk = a, logo a ∈ A ∩ B. Como A e B são disjuntos não se pode ter a ∈ int .A nem a ∈ int .B. Logo a ∈ fr .A ∩ fr .B. 5.7. Seja C ⊂ Rn convexo. Se a, b ∈ C e 0 ≤ t ≤ 1 então a = lim ak e b = lim bk com ak , bk ∈ C logo (1 − t)ak + tbk ∈ C. Daı́ (1 − t)a + tb = lim[(1 − t)ak + tbk ] ∈ C, portanto C é convexo. 5.8. Sabemos que existe x̄ ∈ C tal que d(x, C) = |x − x̄|. Se existisse outro ponto ȳ ∈ C com |x − x̄| = |y − ȳ| então, pelo Exercı́cio 2.2 terı́amos |x − z| < |x − x̄| para todo ponto z ∈ [x̄, ȳ] ⊂ C e então não seria |x − x̄| = d(x, C). 6.1. O supremo de um conjunto de números reais pertence ao fecho desse conjunto. Logo diam .K = lim |xk − yk | com xk , yk ∈ K. Passando a uma subseqüência, se necessário, temos lim′ xk = a ∈ K. Analogamente, existe N′′ ⊂ N′ com k∈N lim′′ yk = b ∈ K. Então |a − b| = lim′′ |xk − yk | = diam .K. k∈N k∈N 6.2. Se X não fosse limitado então, para todo k ∈ N, X não estaria contido na bola Bk = B(0; k). Então a cobertura aberta X ⊂ ∪Bk não admitiria subcobertura finita. Portanto X é limitado. Se X não fosse fechado, existiria uma seqüência de pontos xk ∈ X com lim xk = a ∈ / X. Então os abertos Ak = Rn −B[a; 1/k] formariam n uma cobertura de R − {a}, portanto de X, sem subcobertura finita. 6.3. Seja a um valor de aderência de (xk ). Se não fosse a = lim xk , existiriam ε > 0 e uma infinidade de ı́ndices k tais que |xk − a| ≥ ε. Passando a uma subseqüência, se necessário, terı́amos lim′ xk = b, com |b − a| ≥ ε, logo b 6= a seria outro k∈N valor de aderência. Quanto ao exemplo, basta tomar xk = 0 para k ı́mpar e xk = k ·e1 se k é par. 6.4. Como o compacto K e o fechado Rn − U são disjuntos, existem a ∈ K, b ∈ Rn − U tais que x ∈ K, y ∈ Rn − U ⇒ |x − y| ≥ |a − b| = ε > 0. Portanto, para todo x ∈ K, tem-se B(x; ε) ⊂ U . Se x ∈ K e |y − x| < ε então [x, y] ⊂ B(x, ε) logo [x, y] ⊂ U . 6.5. Se a = lim xk com xk ∈ X para todo k ∈ N então o conjunto K, formado pelos pontos xk mais o ponto a, é compacto, logo X ∩K é fechado, portanto a ∈ X ∩K. 184 Soluções dos exercı́cios Cap. 10 Em particular, a ∈ X. Portanto X é fechado. 7.1. Se (f (xk )) possuisse uma subseqüência convergindo para o ponto b, desprezando os termos a ela não pertencentes, o conjunto K = {f (xk ); k ∈ N} ∪ {b} seria compacto logo f −1 (K) seria um compacto contendo todos os xk e então (xk ) possuiria uma subseqüência convergente. Portanto (a) ⇒ (b). Reciprocamente, supondo (b), sejam K ⊂ Rn compacto e (xk ) uma seqüência em f −1 (K). Então a seqüência (f (xk )), contida no compacto K, possui uma subseqüência convergente, com lim′ f (xk ) = b ∈ K. Pela hipótese (b), (xk )k∈N′ tem uma subseqüência converk∈N gente, com lim′′ xk = a. Pela continuidade de f , tem-se f (a) = b, logo a ∈ f −1 (K). k∈N Assim f −1 (K) é compacto. 7.2. Podemos escrever, para todo z 6= 0 em R2 : p(z) = z n a 0 zn + a1 z n−1 + ··· + an−1 + an . z Daı́ resulta que |zk | → +∞ ⇒ |p(zk )| → +∞. 7.3. Para cada x ∈ X, seja ξ(x) ∈ K o único ponto tal que f (x, ξ(x)) = 0. Se lim xk = x0 em X, admitamos que a = lim′ ξ(xk ) e b = lim′′ ξ(xk ) sejam vak∈N k∈N lores de aderência da seqüência (ξ(xk )). Pela continuidade de f tem-se f (x0 , a) = lim′ f (xk , ξ(xk )) = 0 e, analogamente, f (x0 , b) = 0. Logo a = b. A seqüência k∈N de pontos ξ(xk ) no compacto K tem portanto um único valor de aderência, logo converge para o ponto c = lim ξ(xk ) ∈ K, com f (x0 , c) = lim f (xk , ξ(xk )) = 0. Assim c = ξ(x0 ) e ξ é contı́nua. 7.4. Para toda seqüência de pontos xk = π(xk , yk ) ∈ π(F ) com lim xk = a, de (xk , yk ) ∈ F segue-se que yk ∈ K. Passando a uma subseqüência: lim′ yk = b, logo k∈N lim′ (xk , yk ) = (a, b) ∈ F , pois F é fechado. Então a = π(a, b) ∈ π(F ), portanto π(F ) k∈N é fechado. 8.1. Com efeito, se d(F, G) = 0 então existem seqüências de pontos xk ∈ F e yk ∈ G tais que |xk − yk | < 1/k, logo lim |xk − yk | = 0 mas, como f (xk ) = 0 e f (yk ) = 1, tem-se |f (xk ) − f (yk )| = 1 e assim f não é uniformemente contı́nua. 8.2. Dado ε > 0, existe δ > 0 tal que y, y ′ ∈ Y , |y−y ′ | < δ ⇒ |f (y)−f (y ′ )| < ε/2. Sejam agora x, x′ ∈ X com |x − x′ | < δ. Existem seqüências de pontos yk , yk′ ∈ Y tais que lim yk = x e lim yk′ = x′ . Para todo k suficientemente grande, tem-se |yk −yk′ | < δ, portanto |f (yk ) − f (yk′ )| < ε/2. Então |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε. Portanto f : X → Rn é uniformemente contı́nua. 8.3. Se f (X) fosse ilimitado, para cada k ∈ N existiria xk ∈ X tal que |f (xk )| > k. A seqüência (f (xk )) assim obtida não possuiria subseqüência convergente. Mas como X é limitado, a seqüência de pontos xk ∈ X teria uma subseqüência convergente, portanto de Cauchy. E sendo f uniformemente contı́nua, a subseqüência correspondente (f (xk ))k∈N′ seria de Cauchy, logo convergente. Esta contradição mostra que f (X) deve ser limitado. 8.4. Se xk , yk ∈ X são tais que lim |xk − yk | = 0 então lim |f (xk ) − f (yk )| = 0 e lim |g(xk ) − g(yk )| = 0. Como |f (xk ) + g(xk ) − (f (yk ) + g(yk ))| ≤ |f (xk ) − f (yk )| + |g(xk ) − g(yk )|, segue-se que f + g é uniformemente contı́nua. Analogamente, se Seção 1 Topologia do Espaço Euclidiano 185 |f (x)| ≤ A e |g(x)| ≤ B para todo x ∈ X, então |f (xk ) · g(xk ) − f (yk ) · g(yk )| = = |(f (xk ) − f (yk )) · g(xk ) + f (yk )(g(xk ) − g(yk ))| ≤ ≤ |f (xk ) − f (yk )| · B + A · |g(xk ) − g(yk )| donde lim(f (xk ) · g(xk ) − f (yk ) · g(yk )) = 0, logo f · g é uniformemente contı́nua. 8.5. Sejam v = x̄ − x e w = y − x̄. Devemos provar que hv, wi ≥ 0. Para todo t ∈ [0, 1], temos |v| ≤ |v + tw| pois v + tw ∈ C. Elevando ao quadrado, obtemos |v|2 ≤ |v|2 + 2thv, wi + t2 · |w|2 . Simplificando concluı́mos que t[t|w|2 + 2hv, wi] ≥ 0 para todo t ∈ [0, 1]. Daı́ resulta que hv, wi ≥ 0 pois se fosse hv, wi < 0 então terı́amos t[t|w|2 + 2hv, wi] < 0 para todo t positivo, menor do que −2hv, wi/|w|2 . 8.6. Por 8.5, temos hȳ − x̄, x− x̄i ≤ 0 e hx̄− ȳ, y − ȳi ≤ 0. A segunda desigualdade escreve-se hȳ − x̄, ȳ −yi ≤ 0. Somando-a com a primeira, vem hȳ − x̄, x− x̄+ ȳ −yi ≤ 0, donde hȳ − x̄, ȳ − x̄i ≤ hȳ − x̄, y − xi. Por Schwarz: |ȳ − x̄|2 ≤ |ȳ − x̄| |y − x|, logo |ȳ − x̄| ≤ |y − x|. 9.1. A aplicação f : X → S n−1 , definida por f (x) = x/|x|, é contı́nua e bijetiva, logo é um homeomorfismo, pois X é compacto. t 9.2. Defina f : S n−1 × R → Rn − {0} pondo f(x, t) = e · x e observe que y g : Rn − {0} → S n−1 × R, dada por g(y) = , ℓn|y| é a inversa de f . |y| 9.3. Considere a composição das aplicações abaixo indicadas: S m × S n → S m × Rn+1 → S m × R × Rn → (Rm+1 − {0}) × Rn → Rm+n+1 , onde a terceira é dada pelo exercı́cio anterior e as demais são inteiramente óbvias. Todas são homeomorfismos sobre suas imagens. 9.4. X é a reunião de duas circunferências com o ponto a em comum e Y é um intervalo aberto da reta cujo ponto médio é b. 9.5. Seja f : X − {a} → Y − {b} um homeomorfismo. Defina F : X → Y pondo F (x) = f (x) se x 6= a e F (a) = b. Como X é compacto e F é uma bijeção, basta provar que F é contı́nua, ou seja, que lim xk = a ⇒ lim f (xk ) = b (onde xk ∈ X −{a}). Como Y é compacto, basta mostrar que b é o único valor de aderência da seqüência (f (xk )). Ora, se fosse lim′ f (xk ) = d 6= b terı́amos d = f (c), c ∈ X − {a} e lim′ xk = c k∈N k∈N pois f −1 : Y − {b} → X − {a} é contı́nua. Mas devia ser lim′ xk = a. Final. k∈N S Cax , uma reunião de conjuntos conexos 10.1. Fixando a ∈ X, temos X = x∈X com o ponto a em comum, logo X é conexo. Recı́proca óbvia. 10.2. Considere em Rn uma reta r que intersecte o segmento [a, b] em seu ponto médio. Dados x, y ∈ r, os conjuntos [a, x] ∪ [x, b] = Ax e Ay = [a, y] ∪ [y, b] têm apenas os pontos a, b em comum. Supondo, por absurdo, que nenhum dos Ax , x ∈ r, estivesse contido em Rn − Z escolherı́amos, para cada x ∈ r, um ponto f (x) ∈ Ax ∩ Z. Isto definiria uma aplicação injetiva f : r → Z, o que não existe pois Z é enumerável e r não é. 10.3. Sejam a 6= b em S 1 e a′ 6= b′ em S 2 . Então S 1 − {a, b} é desconexo mas 2 S − {a′ , b′ } é conexo, homeomorfo a S 1 × R. 186 Soluções dos exercı́cios Cap. 10 10.4. Um subconjunto de R, para ser homeomorfo a S 1 deveria ser compacto e conexo, logo seria um intervalo [a, b], o qual fica desconexo pela remoção de um ponto interior, mas a remoção de qualquer um dos seus pontos não desconecta S 1 . 10.5. X é a reunião dos dois eixos coordenados mais a hipérbole xy = 1, logo tem 3 componentes conexas. 11.1. O ponto essencial é observar que se f : X → Rn é uniformemente contı́nua então toda seqüência de Cauchy (xk ) em X é transformada por f numa seqüência de Cauchy (f (xk )). Portanto, se lim xk = a então existe lim f (xk ) = b pois toda seqüência de Cauchy em Rn é convergente. O limite b não depende da seqüência (xk ) escolhida pois se lim yk = a, ainda com yk ∈ X, a seqüência (x1 , y1 , x2 , y2 , . . . ) ainda converge para a, logo é de Cauchy, e sua imagem (f (x1 ), f (y1 ), f (x2 ), f (y2 ), . . . ) é de Cauchy, e tem a subseqüência (f (xk )) convergindo para b, logo lim f (yk ) = b. Portanto xk → a ⇒ f (xk ) → b e daı́ lim f (x) = b. x→a 11.2. Pelo exercı́cio anterior, para todo x = X existe lim f (y) = F (x). Isto y→x define F : X → Rn . Para todo ε > 0 dado, tome-se δ > 0 tal que y, y ′ ∈ Y , |y − y ′ | < δ ⇒ |f (y) − f (y ′ )| < ε/2. Agora, se x, x′ ∈ X e |x − x′ | < δ, tomamos seqüências (yk ) e (yk′ ) em Y , com lim yk = x e lim yk′ = x′ . Desprezando alguns termos iniciais, podemos supor que |yk − yk′ | < δ, onde |f (yk ) − f (yk′ )| < ε/2 para todo k ∈ N, logo |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε. k 11.3. Seja p(z) = a0 + a1 z+ · · · + ak z , com ak 6= 0. Então p(z) = a a a 0 1 k−1 z k k + k−1 + · · · + + ak = z k (ϕ(z) + ak ), onde lim ϕ(z) = 0. Logo z→∞ z z z lim p(z) = ∞. z→∞ 11.4. Sabemos que, para todo ε > 0 existe δ > 0 tal que t ∈ R, 0 < |t| < δ ⇒ sen t − 1 < ε. Tomando em Rn a norma do máximo, e supondo δ < 1, vemos que t sen(x1 · x2 · · · xn ) − 1 < ε. 0 < |x| < δ ⇒ |x1 · x2 · · · xn | < δ ⇒ x1 · x2 · · · xn 11.5. Sejam αi uma coordenada não-nula de v e βi a coordenada correspondente βi · Tome α = αi /βi . de v0 . Então lim f (x) · αi = βi , donde lim f (x) = x→a x→a αi 2 Caminhos diferenciáveis 1.1. Temos a = lim tk , com tk 6= a e f (tk ) = b para todo k ∈ N. Portanto f (tk ) − f (a) b−b = lim = 0. f (a) = lim f (tk ) = b e f ′ (a) = lim k→∞ tk − a k→∞ tk − a 1.2. Para todo t ∈ I, temos f (t) = (x(t), |x(t)|), com f (a) = (0, 0). Portanto a é um ponto no qual |x(t)| assume seu valor mı́nimo, logo a derivada da função t 7→ |x(t)| é zero para t = a. Como −|x(t)| ≤ x(t) ≤ |x(t)| para todo t, segue-se que x′ (a) = 0. Logo f ′ (a) = (x′ (a), |x|′ (a)) = (0, 0). 1.3. Na verdade, como f (t) + f ′′ (t) = (0, 0, t), este ponto já pertence ao eixo vertical de R3 . √ 1.4. Temos g ′ (t) = (−ab sen bt, ab cos bt, c), logo |g ′ (t)| = a2 b2 + c2 . Assim, a relação pedida é a2 b2 + c2 = 1. Seção 2 Caminhos diferenciáveis 187 2.1. Aplique o Teorema de Rolle à função ϕ : [a, b] → R, definida por ϕ(t) = |f (t)|2 . 2.2. Simplificamos a notação, escrevendo x • y em vez de ϕ(x, y). Então podemos ver que f1 (t + h) • f2 (t + h) − f1 (t) • f2 (t) = =f1 (t + h) • [f2 (t + h) − f2 (t)] + [f1 (t + h) − f1 (t)] • f2 (t). Dividindo por h e fazendo h → 0 vem g ′ (t) = f1′ (t) • f2 (t) + f1 (t) • f2′ (t). O caso de aplicações p-lineares segue as mesmas linhas: se g(t) = f1 (t) • · · · • fp (t) então p P g ′ (t) = f1 (t) • · · · • fi′ (t) • · · · • fp (t). Quanto ao determinante de uma matriz i=1 m × m, basta notar que ele é uma função m-linear das linhas dessa matriz, a qual assume o valor 1 na matriz identidade m × m. 2.3. A aplicação g é diferenciável (de fato, C ∞ ) porque é a composta t 7→ f (t) 7→ 2 2 ϕ (f (t), . . . , f (t)) −→ f (t)k , onde ϕ : Rn × · · · × Rn é a aplicação k-linear dada pelo produto de matrizes. Rb Rb Rb 3.1. Temos |f (b) − f (a)| = | a f ′ (t)dt| ≤ a |f ′ (t)|dt ≤ a ϕ′ (t)dt = ϕ(b) − ϕ(a). 3.2. Aplique a cada uma das funções-coordenada do caminho f o resultado correspondente já provado no Volume 1 (pag. 135). 3.3. Note que hf (b), g(b)i − hf (a), g(a)i = Z b ϕ′ (t)dt, a onde ϕ(t) = hf (t), g(t)i. Observe ainda que ϕ′ (t) = hf ′ (t), g(t)i + hf (t), g ′ (t)i. 3.4. De um modo geral, se A : Rm → Rn é uma transformação linear e f :R I → Rm Rb b n é um caminho então t 7→ A·f (t) é um caminho em R com a A·f (t)dt = A· a f (t)dt. Isto se vê diretamente a partir da definição de integral de um caminho. Em seguida, note que w 7→ v × w é um operador linear em R3 . 3.5. Aqui usaremos um resultado elementar sobre conjuntos convexos, a ser demonstrado no Capı́tulo 3 (Teorema 7): se A ⊂ Rn é convexo e α1 + · · · + αk = 1 k P com α1 ≥ 0, . . . , αk ≥ 0 então x1 , . . . , xk ∈ A ⇒ αi xi ∈ A. Daı́ resulta que i=1 se (Pk∗ ) é uma seqüência de partições pontilhadas de [a, b] com lim |Pk | = 0 então Z b P 1 1 1 P · f ; Pk∗ ∈A para todo k∈N, portanto f (t)dt = (f, Pk∗ )= b−a b−a b−a a X 1 lim (f ; Pk ) ∈ A. k→∞ b − a 4.1. Para toda partição P = {a = t0 < t1 < · · · < tk = b} tem-se |B − A| ≤ ℓ(f ; P ) ≤ ℓ(f ). Como ℓ(f ) = |B − A|, segue-se que ℓ(f ; P ) = |B − A|. Resulta então do Exercı́cio 1.2 do Capı́tulo 1 que os pontos A = f (t0 ), f (t1 ), . . . , f (tk ) = B estão dispostos ordenadamente sobre o segmento de reta AB. Então, para todo t ∈ [a, b], tem-se f (t) = A + ϕ(t) · v, com v = B − A, e a função ϕ : [a, b] → [0, b] é não-decrescente. Como f ∈ C 1 , segue-se do Exercı́cio 11.5 que ϕ ∈ C 1 e, como é não-decrescente, ϕ′ ≥ 0. Logo f é uma reparametrização do caminho retilı́neo f (t) = A + t · v. 188 Soluções dos exercı́cios Cap. 10 4.2. Seja g : [0, L] → R2 tal que g ′ (t) = f (t) para todo t. (As funções-coordenada RL RL RL de g são primitivas das de f .) Então ℓ(g) = 0 |g ′ (t)|dt = 0 |f (t)|dt = 0 dt = L. Por RL RL outro lado, observando que | 0 f (t)dt| = L, vemos que |g(L) − g(0)| = | 0 g ′ (t)dt| = RL | 0 f (t)dt| = L. Pelo exercı́cio anterior, temos g(t) = g(0) + ϕ(t) · v, com v = g(L) − g(0). Logo 1 = |f (t)| = |g ′ (t)| = |ϕ′ (t)| · |v| = ϕ′ (t) · |v| pois ϕ′ ≥ 0, já que ϕ não muda de sinal, ϕ(0) = 0 e ϕ(L) = 1. Assim, ϕ′ (t) = 1/|v| é constante e o mesmo se dá com f (t) = ϕ′ (t) · v. 4.3. Fixando a ∈ U , seja A o conjunto dos pontos de U que podem ser ligados a a por um caminho poligonal contido em U . É fácil ver que A é aberto e que também é aberto o conjunto B dos pontos que não podem ser ligados a a por um caminho poligonal contido em U . Então U = A ∪ B é uma cisão. Como U é conexo e A 6= ∅, segue-se que U = A. Evidentemente todo caminho poligonal é retificável. 4.4. É claro que |x − a| ≤ dU (x, a) logo lim dU (xk , a) = 0 ⇒ lim xk = a. Para provar a recı́proca, basta observar que se B = B(a; r) é uma bola aberta contida em U então, para pontos xk ∈ B, tem-se dU (xk , a) = |xk − a|, portanto lim xk = a ⇒ lim |xk − a| = 0 ⇒ lim dU (xk , a) = 0 pois xk ∈ B para todo k suficientemente grande. 3 Funções reais de n variáveis 1.1. Se x e x + tei pertencem a U então [x, x + tei ] ⊂ U e f (x + tei ) − f (x) = ∂f (x + θtei ) · t = 0, onde 0 < θ < 1. ∂xi 1.3. Dois pontos quaisquer de uma bola podem ser ligados por um caminho poligonal contido nela, o qual tem seus lados paralelos aos eixos. Segue-se daı́, pelo argumento usado no Exercı́cio 4.3 do Capı́tulo 2, que o mesmo ocorre em qualquer aberto conexo. Fixando a ∈ U , para todo ponto x ∈ U , unindo-o ao ponto a por um caminho desse tipo, em cada segmento retilı́neo do caminho varia apenas a ∂f = 0, a função f se mantém constante ao longo desse i-ésima coordenada e, como ∂xi segmento. Então f (x) = f (a) para todo x ∈ U e f é constante. ∂f 1.4. Seja M ≥ (x) para todo x ∈ U e todo i = 1, 2, . . . , n. Dados x, x + ∂xi v ∈ U , com v = (α1 , . . . , αn ), definamos v0 , v1 , . . . , vn ∈ Rn pondo v0 = 0 e vi = vi−1 + αi ei para i = 1, . . . , n, de modo que vn = v. Então f (x + v) − f (x) = n P f (x + vi ) − f (x + vi−1 ). Pelo Teorema do Valor Médio de uma só variável, temos i=1 |f (x + vi ) − f (x + vi−1 )| = M· n P i=1 ∂f (z) · αi , onde z ∈ [vi−1 , vi ]. Logo |f (x + v) − f (x)| ≤ ∂xi |αi | e daı́ resulta a continuidade de f . (tα)2 tβ α2 β 1 ∂f (0, 0) = lim · = 2 para todo 2 2 t→0 t ∂v (tα) + (tβ) α + β2 ∂f ∂f (0, 0) = 0 e (0, 0) = 0, logo grad f (0, 0) = 0. Se f fosse v 6= 0. Em particular, ∂x ∂y ∂f diferenciável no ponto (0, 0), terı́amos (0, 0) = h grad f (0, 0), vi, o que não ocorre. ∂v 2.1. Se v = (α, β) então Funções reais de n variáveis Seção 3 189 ∂f (u) > 0 se u ∈ S n−1 implica que f (tu) < f (u) para 1 − ε < ∂u t < 1 e ε > 0 suficientemente pequeno. (Cfr. Teorema 4 do Cap. 8, vol. 1.) Portanto o mı́nimo de f (x) para |x| ≤ 1 é atingido num ponto a tal que |a| < 1. Então ϕ(t) = f (a + tv) tem, para todo v ∈ Rn , um mı́nimo local quando t = 0, logo ∂f (a) = ϕ′ (0) = 0. ∂v 2.3. Tem-se f (0) = lim f (tx) = lim t · f (x) = 0. Logo, para todo v ∈ Rn , 2.2. A condição t→0+ t→0+ f (tv) tf (v) ∂f (0) = lim = lim = f (v), ou seja, h grad f (0), vi = f (v). Mudando ∂v t t t→0+ t→0+ a notação, temos f (x) = h grad f (0), xi portanto f é uma função linear de x. A função ϕ cumpre ϕ(tx, ty) = t · ϕ(x, y) para todo t > 0 mas não é linear, logo não é diferenciável no ponto (0, 0). (Observação: quando sabemos que um caminho possui limite num ponto, podemos calculá-lo como um limite lateral.) P ∂f (a) · (xi − ai ) + r(x) mostra que r é uma 2.4. A igualdade f (x) = f (a) + ∂xi ∂r (a) = 0 para i = 1, . . . , n. A continuidade das derivadas função de classe C 1 , com ∂xi ∂r no ponto a e o Teorema do Valor Médio nos asseguram então que, para todo ε > 0 ∂xi dado, existe δ > 0 tal que |x − a| < δ e |y − a| < δ implicam |r(x) − r(y)| < ε|x − y|. Subtraindo membro a membro as desigualdades f (x) = f (a)+h grad f (a), x−ai+r(x) e f (y) = f (a)+h grad f (a), y −ai+r(y) vem f (x)−f (y) = h grad f (a), x−yi+r(x, y), onde, escrevendo r(x, y) = r(x) − r(y), temos |x − a| < δ, |y − a| < δ ⇒ |r(x, y)| < ε|x − y|. ∂ ∂f ∂f ∂ ∂f 3.1. Como não depende de e são identicamente nulas, ∂x ∂y ∂y ∂x ∂y ∂f não depende de y. Fixando (x0 , y0 ) ∈ I × J podemos então definir as funções xe ∂x ∂f ∂f ϕ̄ : I → R e ψ̄ : J → R pondo ϕ̄(x) = (x, y0 ) e ψ̄(y) = (x0 , y), as quais são de ∂x ∂y ∂f ∂f (x, y), ψ̄(y) = (x, y) para todo (x, y) ∈ I × J. classe C 1 e cumprem ϕ̄(x) = ∂x ∂y Então f (x, y) = f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 ) + f (x0 , y0 ) = Z y Z x ∂f ∂f (s, y)ds + (x0 , t)dt + f (x0 , y0 ) = = y0 ∂y x0 ∂x Z x Z y = ϕ̄(s)ds + ψ̄(t)dt + f (x0 , y0 ) = ϕ(x) + ψ(y). x0 y0 3.2. Defina f : R × R → R, pondo f (x, y) = g(x + y, x − y). Verifique que ∂2f ∂x∂y é identicamente nula e aplique o exercı́cio anterior. 3.3. Derivando duas vezes em relação a t, a igualdade f (tx) = t2 · f (x) nos dá 1 P ∂2f f (x) = (tx)xi xj . Tomando o limite quando t → 0 por valores positivos 2 i,j ∂xi ∂xj P 1 ∂2f (0). chegamos a f (x) = aij xi xj , onde aij = 2 ∂xi ∂xj 190 Soluções dos exercı́cios Cap. 10 ∂ϕ ∂ϕ (x)i = 0, hf (x), (x)i = 0, derive a pri∂xi ∂xj meira em relação a xj e a segunda em relação a xi . Use Schwarz. 3.4. Tome as igualdades hf (x), 4.1. Isto é óbvio para k = 1, pela própria definição de diferenciabilidade e, para k = 2, foi provado no texto. No caso geral, pela hipótese de indução, considerando ∂r que as derivadas parciais se anulam, junto com todas as suas derivadas até a ∂xi | grad r(x)| ordem k − 1, no ponto 0, conclui-se que lim = 0. Ora, pelo Teorema do x→0 |x|k−1 Valor Médio, para todo x numa bola de centro 0 contida em U , existe θ ∈ (0, 1) tal que r(x) = r(x) − r(0) = h grad r(θx), xi, logo |h grad r(θx), xi| | grad r(θx)| |r(x)| = ≤ , |x|k |x|k |x|k−1 |r(x)| = 0. |x|k 4.2. Siga as mesmas linhas da demonstração do Teorema 5 (Cap. 3), fazendo uso ∂3f 1 P do exercı́cio anterior e observando que, na expressão (a)αi αj αk a 3! i,j,k ∂xi ∂xj ∂xk i-ésima variável αi ocorre em 3 parcelas (como 1o¯ , 2o¯ ou 3o¯ fator), logo a derivada 1P ∂3f dessa expressão relativamente à sua i-ésima variável é igual a (a)αj αk . 2 j,k ∂xi ∂xj ∂xk O caso geral é análogo. portanto lim x→0 5.1. Se [hij ] é a matriz da forma quadrática H então hii = H · v 2 , com v = ei = (0, . . . , 1, . . . , 0). Portanto os elementos da diagonal da matriz de uma forma quadrática positiva (ou negativa) são todos números positivos (ou negativos) e assim sua soma não pode ser igual a zero. 5.2. Seja X o conjunto dos pontos de máximo local estrito de f . Dado x ∈ X, existe uma bola B(x; 2δ), contida em U , tal que y ∈ B(x; 2δ), y 6= x ⇒ f (y) < f (x). Escolhamos, para cada x ∈ X, um ponto qx ∈ Qn ∩ B(x; δ) e um número racional rx > 0 tal que |x − qx | < rx < δ, portanto B(qx ; rx ) ⊂ B(x; 2δ) e daı́ y ∈ B(qx ; rx ), y 6= x ⇒ f (y) < f (x). A correspondência x 7→ (qx , rx ) é injetiva pois se qx = qx′ e rx = rx′ então x′ ∈ B(qx ; rx ) e x ∈ B(qx′ ; rx′ ). Se fosse x 6= x′ terı́amos f (x)′ < f (x) e f (x) < f (x′ ). 5.3. Como grad f (x, y) = −2 sen(x2 + y 2 ) · (x, y), os pontos crı́ticos de f são a origem x = y = 0 e os pontos das circunferências com centro na origem e raios iguais √ a kπ, k ∈ N. Quanto à função g(x, y) = x3 − y 3 − x + y, cujo gradiente é o vetor 6x 0 2 2 . Os grad g(x, y) = (3x − 1, −3y + 1), sua matriz hessiana é Hg(x, y) = 0 −6y √ √ √ √ √ √ pontos crı́ticos √ de g√são A = ( 3/3, 3/3), B = (− 3/3. 3/3), C = ( 3/3, − 3/3) e D = (− 3/3, pontos, a matriz hessiana de g assume cada um −√ 3/3). Nesses 0√ ±2 3 , os sinais correspondendo aos das coordenadas de A, dos 4 valores 0 ±2 3 B, C e D. Logo Hg, é positiva no ponto C, que é portanto um ponto de mı́nimo local, negativa no ponto B de máximo local e, nos pontos crı́ticos A e D, a forma hessiana Hg é indefinida, logo esses pontos não são máximos nem mı́nimos locais: são os chamados “pontos de sela”. Funções reais de n variáveis Seção 3 191 5.4. A função F : U → R, definida por F (x) = f (x) se x ∈ U e F (x) = 0 se x ∈ fr .U , é contı́nua no compacto U e diferenciável em U . A menos que F seja identicamente nula (em cujo caso todo ponto de U é crı́tico para f ), seu valor máximo ou seu valor mı́nimo é atingido num ponto a ∈ U , o qual é um ponto crı́tico de f . ∂f ∂f 5.5. Como = 2x(2x2 − 2y 2 − 1) e = 2y(2y 2 − 2x2 + 3), os pontos crı́ticos ∂x ∂y √ −2 0 e de f são (0, 0) e (± 22 , 0), onde as matrizes hessianas são Hf (0, 0) = 0 6 √ 4 0 Hf (± 22 , 0) = . Portanto a origem (0, 0) é um ponto de sela (máximo em 0 4 √ relação a x e mı́nimo em relação a y) enquanto os pontos (± 22 , 0) são de mı́nimo local. k,n k P P 5.6. Temos f (x) = hx − ai , x − ai i = (xj − aij )2 onde x = (x1 , . . . , xn ) i=1 i,j=1 P ∂f (x) = 2(kxj − aij ). ∂xj i 1P Portanto, o ponto x é crı́tico para f se, e somente se, xj = aij para todo j, ou k i k 1 P ai . (Baricentro do sistema formado pelos pontos a1 , . . . , ak .) Temos seja, x = k i=1 ∂2f ∂2f (x) = 0 se m 6= j e (x) = 2k, portanto a matriz hessiana é diagonal ainda ∂xm ∂xj ∂x2j k 1 P e positiva, logo o ponto crı́tico x = ai é de mı́nimo. (Note que f é convexa.) k i=1 e ai = (ai1 , . . . , ain ). Então, para j = 1, . . . , n, temos 6.1. Para x, y ∈ Rn e t ∈ [0, 1], sejam x̄, ȳ ∈ A tais que d(x, A) = |x − x̄| e d(y, A) = |y − ȳ|. Então (1 − t)x̄ + tȳ ∈ A (pois o fecho de um conjunto convexo é também convexo). E como d(x, A) = d(x, A), temos: f ((1 − t)x + ty) = d((1 − t)x + ty, A) ≤ |[(1 − t)x + ty] − [(1 − t)x̄ + tȳ]| = |(1 − t)(x − x̄) + t(y − ȳ)| ≤ (1 − t)|x − x̄| + t|y − ȳ| = (1 − t)f (x) + tf (y). 6.2. Seja a ∈ X um ponto de mı́nimo local da função convexa f : X → R. Se existisse x ∈ X tal que f (x) < f (a) então, para todo t ∈ [0, 1], terı́amos f ((1 − t)a + tx) ≤ (1 − t)f (a) + tf (x) < (1 − t)f (a) + tf (a) = f (a). Tomando t > 0 pequeno, obterı́amos pontos y = (1 − t)a + tx tão próximos de a quanto se deseje, com f (y) < f (a), logo a não seria um ponto de mı́nimo local. 6.3. Todo ponto a ∈ U é ponto médio de segmentos de reta [b, c] ⊂ U tão 1 pequenos quanto se queira, logo f (a) ≤ [f (b) + f (c)] e então não se pode ter f (a) > 2 f (b) e f (a) > f (c). 6.4. Se a, b ∈ U são pontos crı́ticos da função convexa diferenciável f : U → R então ambos são pontos de mı́nimo global de f . Em particular, f (a) = f (b). Assim, t ∈ [0, 1] ⇒ f ((1 − t)a + tb) ≤ (1 − t)f (a) + tf (b) = f (a), donde f ((1 − t)a + tb) = f (a) pela minimalidade. 6.5. Se f (x) ≤ c e f (y) ≤ c então, para todo t ∈ [0, 1], vale f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y) ≤ (1 − t)c + tc = c. Para toda função monótona f : I → R, definida num intervalo I ⊂ R, o conjunto {x ∈ I; f (x) ≤ c} é um intervalo, mas f pode não ser convexa. 192 Soluções dos exercı́cios Cap. 10 6.6. Para f : X → R quase-convexa e x, y ∈ X, seja c = max{f (x), f (y)}. Então f (x) ≤ c e f (y) ≤ c, logo f ((1 − t)x + ty) ≤ c = max{f (x), f (y)} para todo t ∈ [0, 1]. Reciprocamente, supondo que f ((1 − t)x + ty) ≤ max{f (x), f (y)} para quaisquer x, y ∈ X e t ∈ [0, 1], sejam x, y ∈ X tais que f (x) ≤ c e f (y) ≤ c. Então max{f (x), f (y)} ≤ c, portanto t ∈ [0, 1] ⇒ f ((1 − t)x + ty) ≤ max{f (x), f (y)} ≤ c e f é quase-convexa. 4 Funções implı́citas 1.1. Seja X o conjunto dos pontos x0 ∈ R que têm uma vizinhança V na qual está definida uma função ξ tal que f (x, ξ(x)) = 0 para todo x ∈ V . Esta função é ∂f única, pois a condição 6= 0 assegura que f é monótona ao longo de cada reta ∂y vertical. Logo, podemos considerar ξ : X → R. Pelo Teorema da Função Implı́cita, X é aberto e ξ é de classe C k . Cada intervalo I, componente de X, é fechado pois ∂f /∂x , temos |ξ ′ | ≤ M em I, se xk ∈ I ⊂ X e lim xk = x0 então, como ξ ′ = − ∂f /∂y portanto ξ : I → R é uniformemente contı́nua e, assim, existe y0 = lim ξ(xk ), com f (x0 , y0 ) = lim(xk , ξ(xk )) = 0. Pelo Teorema da Função Implı́cita, temos x0 ∈ X. Como R é conexo e X 6= ∅, segue-se que X = R. ∂f 1.2. Em cada ponto x0 ∈ A, uma das derivadas parciais de f , digamos , ∂xi é 6= 0. Logo f transforma um segmento de reta paralelo ao i-ésimo eixo, contendo x0 e pequeno bastante para estar contido em A, injetiva e monotonamente sobre um intervalo contendo f (x0 ) e contido em f (A), portanto f (A) é aberto. ∂f = cos z 6= 0 numa vizinhança da origem, logo perto de 0 1.3. Temos ∂z a equação x4 + 2x · cos y + sen z = 0 define z como função de x e y. Tem-se −∂f /∂x −(4x3 + 2 cos y) −∂f /∂y ∂z ∂z 2x sen y = = e = = · ∂x ∂f /∂z cos z ∂y ∂f /∂z cos z 1.4. A função ξ : R → [0, 1) é definida por ξ(0) = 0 e ξ(x) = e−|x| se x 6= 0. Ela é a única função com valores em [0, 1) que cumpre f (x, ξ(x)) = 0 mas não é contı́nua. ∂ϕ (x, y) = 1.5. Seja ϕ : Rn+1 → R definida por ϕ(x, y) = g(x)−y(1+y 4 ). Então ∂y −1 − 5y 4 6= 0 para todo (x, y) ∈ Rn+1 . Assim, para todo x0 ∈ Rn , pondo y0 = f (x0 ) temos ϕ(x0 , y0 ) = 0. Pelo Teorema da Função Implı́cita, existem uma bola B = B(x0 , δ) ⊂ Rn , um intervalo J = [y0 − ε, y0 + ε] e uma função ξ : B → J de classe C k tais que, para todo x ∈ B, ξ(x) é o único ponto em J tal que ϕ(x, ξ(x)) = 0. Como f é contı́nua (prove isto!), podemos tomar δ > 0 tão pequeno que f (B) ⊂ J. E, sabendo que ϕ(x, f (x)) = 0 para todo x ∈ B, concluı́mos que f (x) = ξ(x) se x ∈ B, portanto f é de classe C k . 2 2.1. Seja U ⊂ Rn o conjunto aberto formado pelas matrizes x do tipo n × n para as quais pelo menos um determinante menor Xij é 6= 0. A ij-ésima derivada parcial ∂f x) = det .x x é x) = (−1)i+j Xij , portanto todo da função f : U → R, dada por f (x (x ∂xij número c ∈ R é um valor regular de f . Como M = f −1 (0), concluı́mos que M é uma hiperfı́cie orientável. O espaço tangente Tp M é formado pelas matrizes x ortogonais x) são (−1)i+j Xij . Logo grad f (pp) é a a grad f (pp). Ora, as coordenadas de grad f (x Seção 4 Funções implı́citas 193 matriz n × n cujo único elemento não-nulo é igual a 1 e está na n-ésima linha com a n-ésima coluna. Portanto, uma matriz x = [xij ] é ortogonal a grad f (pp) se, e somente se, xnn = 0. Tais matrizes formam o espaço Tp M . 2.2 Seja U = {(x, y, z) ∈ R3 ; x2 + y 2 6= 0} o complementar do eixo vertical em p R3 . A função f : U → R, definida por f (x, y, z) = z 2 + ( x2 + y 2 − 2)2 , é de classe ! p p 2x( x2 + y 2 − 2) 2y( x2 + y 2 − 2) ∞ p p , , 2z , C e seu gradiente é grad f (x, y, z) = x2 + y 2 x2 + y 2 o qual se anula apenas nos pontos da circunferência x2 + y 2 = 4, z = 0, todos no nı́vel zero de f . Portanto 1 é valor regular e f −1 (1) = M é uma superfı́cie C ∞ em R3 . M é o toro obtido pela rotação de uma circunferência vertical de raio 1, cujo centro descreve a circunferência x2 + y 2 = 4 no plano z = 0. 2.3. Dado p ∈ M , podemos escrever os pontos de Rn+1 sob a forma (x, y), com x ∈ Rn , y ∈ R e tomar um aberto U ⊂ Rn+1 com p ∈ U , tal que V = M ∩ U seja o gráfico V = {(x, ξ(x)); x ∈ V0 } de uma função ξ : V0 → R, de classe C k (k ≥ 1). Então a função f : U → R, definida por f (x, y) = y − ξ(x), não possui pontos crı́ticos ∂f pois ≡ 1. Além disso, V = f −1 (0), portanto em cada ponto z ∈ V , o vetor ∂y v(z) = grad f (z) é ortogonal a Tz M , portanto v : V → Rn+1 é um campo de classe C k−1 de vetores não-nulos normais a M . 3.1. Sejam f, ϕ : Rn+1 → R dadas por f (x) = |x|2 e ϕ(x) = hAx, xi. Então grad f (x) = 2x e grad ϕ(x) = 2Ax. Os pontos crı́ticos de f |M , onde M = ϕ−1 (1) são os pontos x ∈ M tais que grad f (x) = λ · grad ϕ(x), ou seja, x = λ · Ax, logo x é um autovetor de A, correspondente ao autovalor λ−1 . De x = λ · Ax resulta que |x|2 = hx, xi = λhAx, xi = λ. Portanto, quando x varia em M , o maior valor de |x|2 é o maior λ tal que 1/λ é autovalor de A. Noutras palavras, a maior distância de um √ ponto do elipsóide M à origem é 1/ µ, onde µ = 1/λ é o menor autovalor de A. n+1 3.2. Sejam f, ϕ : R → R, f (x) = |x − a|2 , ϕ(x) = hb, xi, H = ϕ−1 (c), grad f (x) = 2(x − a), grad ϕ(x) = b. Se x ∈ H é ponto crı́tico de f |H então hb, xi = c λ e 2(x − a) = λb, ou seja, x = a + b. O produto interno da última igualdade por b nos 2 c − hb, ai c − hb, ai λ 2 λ dá c = hb, xi = hb, ai + |b| , donde = , e daı́ x = a + b. Este 2 2 |b|2 |b|2 2 é o único ponto crı́tico de f |H, logo é o ponto em que |x − a| (e portanto |x − a|) atinge seu menor valor com x ∈ H. 3.3. Consideradas as funções f, ϕ : R2n → R, f (x, y) = hx, yi e ϕ(x, y) = |(x, y)|2 = |x|2 +|y|2 , temos M = ϕ−1 (1), grad f (x, y) = (y, x) e grad ϕ(x, y) = 2(x, y). Portanto (x, y) ∈ M é ponto crı́tico de f |M se, e somente se, (y, x) = 2λ(x, y) logo 1 y = 2λx e x = 2λy, o que nos dá λ = ± e y = ±x. Assim, os pontos crı́ticos de f |M 2 1 são os da forma (x, ±x) com |x|2 = · Os pontos (x, x) são de máximo e os (x, −x) 2 1 1 para todo (x, y) ∈ M . Para todo par de vetores de mı́nimo, logo − ≤ hx, yi ≤ 2 √ √ √ 2 √ 2 2 2 2 1 não-nulos x, y ∈ Rn , tem-se x, y ∈ M , portanto h x, yi ≤ e daı́ 2|x| 2|y| 2|x| 2|y| 2 √ √ 2 2 x=± y, isto é, quando |hx, yi| ≤ |x| |y|, a igualdade valendo apenas quando 2|x| 2|y| x e y são colineares. 194 Soluções dos exercı́cios 3.4. 2 Seja ϕ : Rn x) = → R, ϕ(x Cap. 10 P x2ij . x) = (−1)i+j Xij e Como grad f (x i,j x) = 2[xij ], onde Xij é o ij-ésimo determinante menor de x , se M = ϕ−1 (n), grad ϕ(x o máximo de f |M é atingido na matriz x tal que (*) (−1)i+jP Xij = 2λxij , donde (−1)i+j Xij xij = 2λx2ij . Somando em i e j: n · det x = 2λ x2ij = 2λ · n, logo P i,j P det x = 2λ. Fixando i e somando em j, vem: det x = 2λ · x2ij = det x · x2ij , logo j j as linhas de x têm comprimento 1. A igualdade (*) também dáP(−1)i+j Xij xkj = 2λxij xkj . Tomando k 6= i e somando em j, obtemos 0 = det x · xij xkj , portanto j as linhas de x são duas a duas ortogonais. Assim, x é uma matriz ortogonal, com det x = 1. Daı́ resulta a desigualdade de Hadamard. √ √ √ 3.5. Suponhamos que s = n p + · · · + n p = n n p não seja a menor soma de n números positivos cujo produto é p. Então existiria s̄ = x1 + · · · + xn < snas mesmas s̄ n s n condições. Ora, pelo Exemplo 9, terı́amos x1 · x2 · · · xn ≤ < < p, uma n n contradição. 5 Aplicações diferenciáveis 1.1. Como o operador f ′ (0) não possui ponto fixo no compacto S n−1 , existe ε > 0 tal que |u| = 1 ⇒ |f ′ (0)·u−u| com f (0) = 0, temos f (x) = ≥ ε. Sendo f diferenciável, x ′ ′ f (0) · x + ρ(x) · |x| = |x| f (0) · + ρ(x) e existe δ > 0 tal que 0 < |x| < δ ⇒ |x| x x −|ρ(x)| >0 |ρ(x)| < ε. Portanto, se 0 < |x| < δ então |f (x) − x| ≥ |x| f ′ (0)· − |x| |x| e daı́ f (x) 6= x. 1.2. Pela definição de F , tem-se F (tx)/t = F (x) se t > 0 e F (tx)/t = −F (−x) F (tx) se t < 0. Como F (0) = 0, supondo F diferenciável no ponto 0, existe lim , t→0 t F (tx) = F ′ (0) · x, portanto F coincide com a logo F (x) = −F (−x) e F (x) = lim t→0 t ′ m+1 n transformação linear F (0) : R → R . A recı́proca é óbvia. 1.3. Aplicando oTeorema de Schwarz função-coordenada de f , vemos que a cada ∂f ∂f ∂ ∂ ′′ (a) = (a) = f ′′ (a) · ej · ei e, por bilinearidade, f (a) · ei · ej = ∂xj ∂xi ∂xi ∂xj resulta que f ′′ (a) · u · v = f ′′ (a) · v · u para quaisquer u, v. 1.4. Isto se reduz ao Exercı́cio 2.1 do Capı́tulo 2 se observarmos que f ′ (x) · v é o vetor velocidade do caminho f ◦ λ, onde λ : (−ε, ε) → U é tal que λ(0) = x e λ′ (0) = v. 2.1. Seja R(h, k) = A(x + h) · (v + k) − A(x) · v − (A′ (x) · h) · v − A(x) · k = (A(x + h) − A(x) − A′ (x) · h) · v + (A(x + h) − A(x)) · k = r(h) · v + s(h) · k, onde r(h) |r(h)| |r(h)| |k| lim = 0 e lim s(h) = 0. Então, como ≤ e ≤ 1, segue-se h→0 |h| h→0 |h| + |k| |h| |h| + |k| R(h, k) que lim = 0. h,k→0 |h| + |k| Seção 6 Aplicações Inversas e Implı́citas 195 a −b 2.2. A matriz da transformação linear f ′ (z0 ), sendo da forma , pode b a √ a cos θ − sen θ ser escrita como ρ com ρ = a2 + b2 , cos θ = √ , sen θ = sen θ cos θ a2 + b 2 b √ , logo f ′ (z0 ) é uma rotação de ângulo θ seguida de uma homotetia de razão a2 + b 2 ρ, portanto preserva ângulos. 2.3. As colunas da matriz jacobiana de f são (2x, 0, 2(x + y)) e (0, 2y, 2(x + y)), que são L.I. salvo quando x = y = 0; 2.4. As linhas da matriz jacobiana de f são (2x, −2y, 0), (y, x, 0), (z, 0, x) e (0, z, y). Se x2 + y 2 6= 0, as 3 primeiras são L.I. caso x 6= 0 e a 1a¯ , a 2a¯ e a 4a¯ são L.I. quando y 6= 0. A imagem de f ′ (0, 0, z) é o plano formado pelos pontos (0, 0, s, t) em R4 . 2.5. Basta notar que as linhas da matriz jacobiana de f são (1, 1, 1), (2x, 2y, 2z) e (3x2 , 3y 2 , 3z 2 ), logo o jacobiano de f é igual a 6(z − x)(z − y)(y − x). 3.1. Suponhamos, por absurdo, que |f ′ (x)| > M , ou seja, |f ′ (x)| = M + ε, ε > 0, para algum x ∈ U . Como |f ′ (x)| é o máximo de |f ′ (x) · u| para |u| = 1 e S m−1 é compacta, existiria u ∈ Rm com norma 1, tal que |f ′ (x) · u| = M + ε. Pela definição de diferenciabilidade, a este ε corresponde δ > 0 tal que 0 < t < δ ⇒ |f (x + tu) − f (x)| = |f ′ (x) · tu + r(tu)| ≥ t|f ′ (x) · u| − |r(tu)|, com |r(tu)| < tε. Então 0 < t < δ ⇒ |f (x + tu) − f (x)| > t(M + ε) − tε = t · M . Pondo v = tu, temos |v| = t, logo |f (x + v) − f (x)| > M · |v|, uma contradição. 3.2. Tem-se ϕ′ (x) · h = h(T ′ (x) · h) · f (x), g(x)i + hT (x) · f (x), g ′ (x) · hi + hT (x) · ′ (f (x) · h), g(x)i. 3.3. Levando em conta que (g ◦ f )′ = (g ′ ◦ f ) · f ′ , vale: (g ◦ f )′′ = [(g ′ ◦ f ) · f ′ ]′ = ′ (g ◦ f )′ · f ′ + (g ′ ◦ f ) · f ′′ = (g ′′ ◦ f ) · f ′ · f ′ + (g ′ ◦ f ) · f ′′ . Isto significa que, para x ∈ U , y = f (x) ∈ V e u, v ∈ Rm , tem-se: (g ◦ f )′′ (x) · u · v = g ′′ (y) · (f ′ (x) · u) · (f ′ (x) · v) + g ′ (y) · f ′′ (x) · u · v ∈ Rp . 3.4. A interpretação correta é ϕ′ (t) · v = [A′ (tx) · x] · v, v ∈ Rm . Para dirimir a confusão, suponha que U ⊂ Rp e não U ⊂ Rm . Então A′ (tx) ∈ L(Rp ; Rn ), logo A′ (tx) · v não faz sentido. 3.5. Aplique a Desigualdade do Valor Médio a g : U → Rn , definida por g(x) = f (x) − T · x. 3.6. Tem-se ϕ′ (x) · v = (f ′ (x) · v) · a = h grad f (x), vi · a. 6 Aplicações Inversas e Implı́citas 1.1. Pelo Exercı́cio 3.1 do Capı́tulo 5, temos |ϕ′ (x) · v| < c|v| < |v| para todo x ∈ U e todo v ∈ Rm − {0}, logo |f ′ (x) · v| = |v + ϕ′ (x) · v| ≥ |v| − |ϕ′ (x) · v| > 0 se v 6= 0. Assim, f ′ (x) : Rm → Rm é um isomorfismo, para todo x ∈ U . Pelo Teorema da Aplicação Inversa, f é um difeomorfismo local, portanto transforma cada aberto A ⊂ U num aberto f (A) ⊂ Rm . Além disso, y ∈ U ⇒ |f (x) − f (y)| = |x − y + ϕ(x) − ϕ(y)| ≥ |x − y| − c|x − y| = (1 − c)|x − y| portanto f é injetiva, logo é um difeomorfismo de U sobre o aberto f (U ). Suponhamos agora U = Rm . Para provar que f (Rm ) é fechado, seja (xk ) uma seqüência tal que lim f (xk ) = y ∈ Rm . 1 Como |xk −xr | ≤ |f (xk )−f (xr )|, vemos que (xk ) é de Cauchy portanto converge: 1−c 196 Soluções dos exercı́cios Cap. 10 lim xk = x. Então f (x) = lim f (xk ) = y ∈ f (Rm ). Assim, f (Rm ) é aberto e fechado. Como Rm é conexo, tem-se f (Rm ) = Rm . 2 2 x) = x k , é de classe C ∞ , com 1.2. A aplicação f : Rn → Rn , definida por f (x k P x) · v = f ′ (x x i−1 · v · x k−i . No ponto x = I n (matriz identidade n × n), temos i=1 f ′ (II n ) · v = kvv , logo f ′ (II n ) é um isomorfismo. Pelo Teorema da Aplicação Inversa, existem abertos U , V , ambos contendo I n , tais que f é um difeomorfismo de U sobre V . Eles respondem a questão. 1.3. Em primeiro lugar, note que o conjunto U dos operadores positivos é aberto no espaço vetorial Rn(n+1)/2 dos operadores auto-adjuntos (matrizes simétricas). Isto resulta do critério clássico de positividade: os n menores principais da matriz são positivos. A bijetividade de f é um corolário do Teorema Espectral, segundo o qual todo operador positivo possui uma única raiz quadrada positiva. Resta apenas provar que, para todo X ∈ U , a derivada f ′ (X) : Rn(n+1)/2 → Rn(n+1)/2 é um isomorfismo. Ora, temos f ′ (X) · V = X · V + V · X. Seja {u1 , . . . , un } uma base de Rn formada por autovetores de X, com X · ui = λi ui . Então f ′ (X) · V = 0 ⇒ XV ui + λi V ui = 0 ⇒ X(V ui ) = −λi · (V ui ). Como X não possui autovalores negativos, tem-se V · ui = 0 (i = 1, . . . , n), logo V = 0 e f ′ (X) é injetiva, logo bijetiva. 1.4. Observação preliminar: se U ⊂ Rn é aberto, com n > 1, e q ∈ Rn é um ponto isolado da fronteira de U então U ∪ {q} é aberto. Com efeito, seja B uma bola aberta de centro q, que não contenha outro ponto de fr .U além de q. Como n > 1, o aberto B − {q} é conexo e certamente contém pontos de U pois q ∈ fr .U , mas não contém pontos fora de U pois, pelo Teorema da Alfândega, teria de conter pontos de fr .U . Então B − {q} ⊂ U e daı́ B ⊂ U ∪ {q}, logo q ∈ int .U ∪ {q} e U ∪ {q} é aberto. Isto posto, notemos que basta considerar o caso em que p ∈ U é o único ponto onde det .Jf se anula. Então f em U − {p} é um difeomorfismo local, logo transforma abertos em abertos. É suficiente agora provar que f (U ) é aberto. Isto é claro se existir x 6= p em U com f (x) = f (p). Suporemos então que, pondo q = f (p), temos q 6= f (x) para todo x 6= p em U . Sejam B = B(p; r) tal que B ⊂ U e S = S(p; r). A fronteira do aberto V = f (B − {p}) é {q} ∪ f (S), logo q é um ponto isolado de fr .V e, pela observação preliminar, f (B) = V ∪ {q} é aberto, logo q = f (p) ∈ int f (U ), donde se conclui que f (U ) é aberto. Quanto ao Teorema Fundamental da Álgebra, se p : R2 → R2 é um polinômio complexo não-constante, seu determinante jacobiano em cada ponto z ∈ R2 é igual a |p′ (z)|, logo se anula apenas num número finito de pontos, que são as raı́zes de p′ (z). Portanto p(R2 ) é um conjunto aberto. Por outro lado, como lim p(z) = ∞, p(R2 ) também é fechado. Sendo R2 conexo, segue-se que z→∞ p(R2 ) = R2 , logo existe z ∈ R2 tal que p(z) = 0. 1.5. Os passos para a conclusão do exercı́cio são bastante claros. Para provar que a função α é C ∞ , use o Exercı́cio 10, da Seção 4, Cap. 8 do Volume 1 (pag. 100). Para provar que g é um difeomorfismo, use o Exercı́cio 1, Capı́tulo 6 deste volume. 2.1. Isto resulta imediatamente do Teorema 5 (Forma Local das Submersões) pois cada ponto p ∈ A pertence a um aberto Z ⊂ A tal que f (Z) = W é um aberto em Rn (com a notação do enunciado daquele teorema). 2.2. Basta observar que grad f1 (x), . . . , grad fn (x) são as linhas da matriz jacobiana de f no ponto x, a qual tem posto n se, e somente se, esses vetores são L.I. Seção 7 Superfı́cies Diferenciáveis 197 2.3. Lembrar que, para cada matriz x ∈ U , as n2 coordenadas do gradiente, no ponto x , da função det : U → R são os números (−1)i+j Xij , onde Xij é o determinante da matriz (n − 1) × (n − 1) que se obtém de x omitindo sua i-ésima linha e j-ésima coluna. Portanto x é um ponto crı́tico da função det se, e somente se, todas as submatrizes (n − 1) × (n − 1) de x tiverem determinante igual a zero e então o posto de x é ≤ n − 2. 2.4. Num ponto arbitrário a ∈ V , seja b = ξ(a), logo f (a, b) = c. Pelo Teorema das Funções Implı́citas, existem abertos W, Z, com a ∈ W ⊂ V ⊂ Rm e (a, b) ∈ Z ⊂ U , bem como uma aplicação ξ0 : W → Rn , de classe C k , tais que f −1 (c)∩Z é o gráfico de ξ0 , ou seja, se (x, y) ∈ Z e f (x, y) = c então x ∈ W e y = ξ0 (x). Em particular, como (a, b) ∈ Z e f (a, b) = c, segue-se que ξ0 (a) = b = ξ(a). Como ξ é contı́nua e (a, ξ(a)) ∈ Z, podemos supor W ∋ a tão pequena que x ∈ W ⇒ (x, ξ(x)) ∈ Z, Então x ∈ W ⇒ (y, ξ(x)) ∈ Z e f (y, ξ(x)) = c ⇒ (x, ξ(x)) ∈ f −1 (c)∩Z ⇒ (x, ξ(x)) ∈ gráfico de ξ0 ⇒ ξ(x) = ξ0 (x), logo ξ ∈ C k . Quanto à parte final do exercı́cio, basta observar que, definindo f : R3 → R por f (x, y, z) = (x2 + y 4 )z + z 3 , tem-se ∂f = x2 + y 4 + 3z 2 , ∂z ∂f logo ∂z (x, y, z) 6= 0 sempre que f (x, y, z) = 1. 7 Superfı́cies Diferenciáveis 2.1. Pelo Corolário 1, M é localmente o gráfico de uma aplicação g : V0 → Rn , de classe C k . Ou seja, M é coberta por abertos U ⊂ Rm+n tais que V = U ∩ M = {(x, g(x)); x ∈ V0 }. Definindo f : U → Rn por f (x, y) = y − g(x), vemos que f ∈ C k , 0 é valor regular de f e V = U ∩ M = f −1 (0). Então ϕ : V0 → V , ϕ(x) = (x, g(x)), é uma parametrização C k e, pondo f = (f1 , . . . , fn ), os campos de vetores v1 , . . . , vn : V → Rm+n , dados por v1 (q) = grad f1 (q), . . . , vn (q) = grad fn (q) cumprem o que foi pedido no exercı́cio. 2.2. Seja ϕ : V0 → V ⊂ M uma parametrização de classe C k . O conjunto m e e V = {(p, v); p ∈ V, v ∈ T p M } é aberto em T M e a aplicação Φ : V0 × R → V , dada m P ∂ϕ por Φ(x, α1 , . . . , αm ) = ϕ(x), αi (x) é uma parametrização de classe C k−1 ∂xi i=1 e dimensão 2m em T M . 2.3. Se ϕ : V0 → V ⊂ M é uma parametrização de classe C k então o conjunto Vb = {(p, v); p ∈ V, v ∈ Tp M ⊥ } é aberto em νM . Sejam v1 , . . . , vn−m : V → Rn campos de vetores L.I., com vi ◦ ϕ : V0 → Rn de classe C k−1 e vi (q) ⊥ Tq M para i = 1, . . . , n−m e todo q∈ V . Então Φ : V0 ×Rn−m → Vb , dada por Φ(x, α1 , . . . , αn−m ) = P ϕ(x), αi vi (ϕ(x)) , é uma parametrização de dimensão n e classe C k−1 em νM . Observação: Nos Exercı́cios 2.2 e 2.3, a verificação de que Ve e Vb são abertos é imediata se notarmos que (p, v) 7→ v é contı́nua, logo a imagem inversa de uma aberto é aberta. 2.4. Escrevendo as matrizes 4 × 4 sob a forma m = [x, y, u, v], onde x, y, u, v ∈ R4 são suas colunas então M é o conjunto dessas matrizes para as quais 2 desses vetores são L.I. mas 3 quaisquer não são. Fixando as idéias, seja V = {[x, y, u, v] ∈ M ; x, y são L.I.}. Então [x, y, u, v] ∈ V ⇒ u = αx + βy, v = γx + δy. Seja W = {(x, y) ∈ R4 × R4 ; x, y L.I.}. Pondo V0 = W × R4 , a aplicação ϕ : V0 → V , dada por ϕ(x, y, α, β, γ, δ) = [x, y, u, v], onde u = αx + βy, v = γx + δy, é uma parametrização C ∞ . (Verifique!) É claro que M é coberta por 6 abertos do tipo V , logo 198 Soluções dos exercı́cios Cap. 10 é uma superfı́cie C ∞ de dimensão 12 em R16 . O mesmo argumento vale em geral: as matrizes m × n de posto k formam uma superfı́cie de dimensão (m + n − k)k em Rmn . P 3.1. Pelo enunciado, temos aij ei = (ψ −1 ◦ ϕ)′ (x0 ) · ej = [ψ ′ (y0 )]−1 · ϕ′ (x0 ) · ej , i P P P ∂ψ ∂ϕ aij aij ψ̇ ′ (y0 ) · ei = (x0 ) = ϕ′ (x0 ) · ej = ψ ′ (y0 ) · aij ei = (y0 ), ∂xj ∂yi i i i todos os somatórios sendo com i variando de 1 a m. portanto 3.2. Segue-se da compacidade de [a, b] que o caminho λ pode ser expresso como justaposto de caminhos, cada um dos quais tem sua imagem contida numa vizinhança parametrizada. Portanto não há perda de generalidade em admitir que λ([a, b]) ⊂ V , onde V é a imagem de uma parametrização ψ : W0 → V ⊂ M , com ψ(y0 ) = p. Seja {w1 , . . . , wm } ⊂ Rm uma base tal que ψ ′ (x0 ) · wi = ui (i = 1, . . . , m). Considere a transformação linear T : Rm → Rm tal que T e1 = w1 , . . . , T em = wm . Sejam V0 = T −1 (W0 ), ϕ = ψ ◦ T : V0 → V e x0 = T −1 (y0 ). Então ϕ : V0 → ∂ϕ V é uma parametrização tal que ϕ(x0 ) = p e (x0 ) = ϕ′ (x0 ) · ei = ui , i = ∂xi 1, . . . , m. Para {v1 (t), . . . , vm (t)} ⊂ Tλ(t) M é aquela cada t ∈ [a, b], a base ortonormal ∂ϕ ∂ϕ (λ0 (t)), . . . , (λ0 (t)) pelo processo de Gram-Schmidt, onde obtida de ∂x1 ∂xm ϕ(λ0 (t)) = λ(t). 3.3. Como no exercı́cio anterior, podemos admitir que os valores λ(t), t ∈ [a, b], pertencem a um aberto V ⊂ M , no qual estão definidos n campos vetoriais contı́nuos w1′ , . . . , wn′ : V → Rm+n , com w1′ (q), . . . , wn′ (q) L.I. e ortogonais a Tq M , para todo n P q ∈ V . No ponto p = λ(a), temos uj = aij wi′ (p), j = 1, . . . , n. Os campos i=1 P wj : V → Rm+n , dados por wj (q) = aij wi′ (q), são ainda L.I. e ortogonais a Tq M , i agora com wj (p) = uj (j = 1, . . . , n). Usando o processo de ortonormalização de Gram-Schmidt, obtemos os campos v1 , . . . , vn : V → Rm+n tais que t 7→ {v1 (λ(t)), . . . , vn (λ(t))} cumpre as condições estipuladas no exercı́cio. Observação: O processo de ortonormalização de Gram-Schmidt faz passar de um conjunto {w1 , . . . , wn } de vetores L.I. para um conjunto ortonormal {v1 , . . . , vn } que gera o mesmo subespaço, de tal modo que cada vetor vj depende continuamente (e mesmo em classe C ∞ ) de w1 , . . . , wn . 3.4. A matriz de passagem da base {u1 , . . . , un } para a base {w1 , . . . , wn } tem determinante > 0. Como S n−1 é conexo, existe um caminho λ : [0, 1] → S n−1 , com λ(0) = un e λ(1) = wn . Sendo {u1 , . . . , un−1 } ⊂ Tun S n−1 uma base ortonormal, o Exercı́cio 2 garante que existe uma aplicação contı́nua t 7→ (v1 (t), . . . , vn−1 (t)) tal que, para todo t ∈ [0, 1] os vj (t) formam uma base ortonormal de Tλ(t) S n−1 , com vj (0) = uj , j = 1, . . . , n − 1. O determinante da matriz de passagem de {v1 (t), . . . , vn−1 (t)} para {w1 , . . . , wn−1 } é 1 quando t = 0 e é 6= 0 para todo t ∈ [0, 1], logo é > 0 para t = 1. Pela hipótese de indução, existe uma aplicação contı́nua t 7→ {v1 (t),· · · ,vn−1 (t)}, definida para 1 ≤ t ≤ 2, tal que os vj (t), t ∈ [1, 2], formam um conjunto ortonormal e v1 (2) = w1 , . . . , vn−1 (2) = wn−1 . Mantendo λ(t) = vn (t) = wn constante para 1 ≤ t ≤ 2, chegamos ao fim da 1a¯ parte do exercı́cio. Quando à conclusão, basta observar que os elementos de SO(Rn ) são matrizes de determinante > 0 cujas colunas formam uma base ortonormal de Rn . Seção 7 Superfı́cies Diferenciáveis 199 4.1. A observação crucial é que se ϕ : V0 → V é uma parametrização, com V0 ⊂ Rm , e T : Rm → Rm é dada por T (x1 , . . . , xm ) = (−x1 , x2 , . . . , xm ) então, pondo V1 = T −1 (V0 ) e ϕ1 = ϕ ◦ T : V1 → V , obtém-se uma parametrização ϕ1 com a seguinte propriedade: para toda parametrização ψ : W0 → W com V ∩ W 6= ∅, os determinantes jacobianos de ψ −1 ◦ ϕ1 e ψ −1 ◦ ϕ nos pontos x ∈ V1 e T (x) ∈ V0 têm sinais opostos. Diz-se então que ϕ1 é obtida invertendo a orientação de ϕ. Isto posto, notemos ainda que, em ϕ−1 (U ∩ V ∩ W ) vale ξ −1 ◦ ϕ = (ξ −1 ◦ ψ) ◦ (ψ −1 ◦ ϕ), portanto, ao analisar o sinal do determinante jacobiano, basta considerar ξ −1 ◦ ψ e ψ −1 ◦ ϕ. Ora, os sinais dos determinantes jacobianos de ξ −1 ◦ ψ e ψ −1 ◦ ϕ, nesta ordem, podem ocorrer de quatro formas: + +, +−, −+ e − −. No primeiro caso, {ϕ, ψ, ξ} é um atlas coerente. No segundo caso, invertemos a orientação de ϕ, no terceiro a de ξ e, no quarto, a de ψ, para termos um atlas coerente em M , a qual é portanto uma superfı́cie orientável. 4.2. Seja [u, v, w] ∈ M representada por seus vetores-coluna u, v, w ∈ R3 .Temos M = U ∪ V ∪ W , onde [u, v, w] pertence a U , a V ou a W conforme sua primeira, segunda ou terceira coluna seja 6= 0. Pondo U0 = {(u, s, t) ∈ R5 ; u = (x, y, z) 6= 0, s, t ∈ R}, definamos as parametrizações ϕ : U0 → U , ψ : U0 → V e ξ : U0 → W por ϕ(u, s, t) = (u, su, tu), ψ(u, s, t) = (su, u, tu) e ξ(u, s, t) = (su, tu, u). As mudanças de parametrização são dadas por (ψ −1 ◦ ϕ)(u, s, t) = (su, 1/s, t/s), (ξ −1 ◦ ϕ)(u, s, t) = (tu, 1/t, s/t) e (ξ −1 ◦ ψ)(u, s, t) = (tu, s/t, 1/t). Um cálculo simples mostra que os determinantes jacobianos desses difeomorfismos são respectivamente iguais a −1, 1, e −1. Pelo exercı́cio anterior, concluı́mos que M é orientável. f as parametrizações em 4.3. Sejam Φ : V0 × Rm → Ve e Ψ : W0 × Rm → W T M definidas, como na solução do Exercı́cio 2.2, pag. 143, a partir das parametrizações ϕ : V0 → V , ψ : W0 → W em M , onde V ∩ W 6= ∅. Pondo ξe = ψ −1 ◦ Φ, temos, para cada x ∈ ϕ−1 (V ∩ W ) e cada u = (α1 , . . . , αm ) ∈ Rm : e u) = (ϕ−1 ◦ ϕ)(x), (ψ −1 ◦ ϕ)′ (x) · u) = (ξ(x), ξ ′ (x) · u), onde ξ = ψ −1 ◦ ϕ. Ou ξ(x, m e α1 , . . . , αm ) = ξ(x), P αk ∂ξ (x) . Daı́ resulta que as colunas da maseja: ξ(x, ∂x k k=1 m ∂ξ P ∂2ξ ∂ ξe e αk = , triz jacobiana J ξ(x) ∈ M (2m × 2m) são os vetores ∂xj ∂xj k=1 ∂xj ∂xk ∂ ξe ∂ξ e = 0, . Como as colunas da matriz jacobiana Jξ são os m vetores ∂αj ∂xj Jξ 0 e ∂ξ/∂xj , segue-se que J ξ = , onde os 4 blocos são matrizes m × m. Portanto ∗ Jξ 2 det . J ξe = (det Jξ) > 0 e a superfı́cie T M é orientável. Quanto ao fibrado normal νM , sua orientabilidade se prova considerando o atlas A, formado pelas parametrizações Φ : V0 × Rn−m → Ve ⊂ νM , associadas a parametrizações ϕ : V0 → V ⊂ M para as quais existem n − m campos de vetores v1 , . . . , vn−m : V → Rn , de classe C k−1 e linearmente independentes. (M é de classe C k .) A parametrização Φ é definida como na solução do Exercı́cio 2.3, pag. 143. Para que se tenha Φ ∈ A, exigiremos que, para todo x ∈ V0 , os vetores ∂ϕ ∂ϕ (x), . . . , (x), v1 (ϕ(x)), . . . , vn−m (ϕ(x)) formem uma base positiva do espaço ∂x1 ∂xm n R , isto é, que a matriz n × n que os tem como colunas tenha determinante positivo. Então o atlas A é coerente e νM é orientável. Observação. Os leitores familiares com a vizinhança tubular de uma superfı́cie 200 Soluções dos exercı́cios Cap. 10 reconhecerão que νM é orientável porque é difeomorfo a um aberto de Rn . 4.4. As colunas da matriz jacobiana de f são (2x, y, z, 0), (−2y, x, 0, z) e (0, 0, x, y). Dois subdeterminantes 3 × 3 são 2x(x2 + y 2 ) e 2y(x2 + y 2 ). Logo f ′ (p) : R3 → R3 é injetiva para todo p ∈ S 2 , exceto p0 = ±(0, 0, 1). Nestes dois pontos, tem-se f ′ (p0 ) · e1 = ±e3 e f ′ (p0 ) · e2 = ±e4 . Assim, f ′ (p0 ) é injetiva no plano gerado por e1 e e2 , que é o plano tangente a S 2 no ponto p0 , logo é a imagem ϕ′ (x0 ) · R2 , onde ϕ é qualquer parametrização de uma vizinhança de p0 em S 2 , com ϕ(x0 ) = p0 . Portanto, se ϕ : V0 → V é uma parametrização arbitrária de V ⊂ S 2 , a composta f ◦ ϕ : V0 → P = f (S 2 ) é uma imersão. Além disso, como f (p) = f (q), com p, q ∈ S 2 , só ocorre quando q = ±p, se V não contém pontos antı́podas, a imersão f ◦ ϕ é injetiva. Para concluir que f ◦ ϕ é uma parametrização (e portanto que P é uma superfı́cie), resta apenas provar que a imagem f (A) de todo aberto A ⊂ S 2 é um aberto em P , ou seja, que F = P − f (A) é fechado (em P ou em R4 , tanto faz, pois P é compacto, logo fechado). Por simplicidade (e conveniência), passaremos a escrever f significando f |S 2 , isto é, o domı́nio de f agora é S 2 . Então, como A ∪ (−A), onde −A = {−x; x ∈ A} é aberto em S 2 , temos f −1 (F ) = S 2 −f −1 (f (A)) = S 2 −[A∪(−A)], logo f −1 (F ) é fechado em S 2 , portanto compacto. Como f : S 2 → P é sobrejetiva, vale f f −1 (F ) = F . Então F é compacto, logo fechado, como imagem por f do compacto f −1 (F ). Isto conclui a verificação de que P é uma superfı́cie C ∞ . Resta mostrar que P não é orientável. Isto pode ser feito observando que todo aberto numa superfı́cie orientável é também uma superfı́cie orientável mas P contém uma faixa de Moebius, imagem por f do conjunto X = {(x, y, z) ∈ S 2 ; −1/2 < z < 1/2, y ≥ 0}. 6.1. Basta observar queh ∈ C ∞ e que a aplicação inversa, g : R2 − {0} → S 1 × R, z dada por g(z) = , ℓn|z| , também é de classe C ∞ . |z| 6.2. Para obter um difeomorfismo de S 1 × S 1 sobre uma superfı́cie em R3 , tome a composta S 1 × S 1 → S 1 × R2 → (S 1 × R) × R → (R2 − {0}) × R → R2 × R = R3 . No caso geral, admita por indução que exista um difeomorfismo (S 1 )n−1 → Rn do toro (n − 1)-dimensional sobre uma hiperfı́cie em Rn . Então tome a composta (S 1 )n = S 1 × (S 1 )n−1 → S 1 × Rn → (S 1 × R) × Rn−1 → R2 × Rn−1 → Rn+1 onde as setas têm significados óbvios. 6.3. Seja B um atlas coerente em N . Considere o conjunto A das parametrizações ϕ : V0 → V ⊂ M tais que V é conexo, f |V é um difeomorfismo de V sobre um aberto W ⊂ N e a parametrização f ◦ϕ : V0 → W é compatı́vel com todas as parametrizações ξ ∈ B. Então A é um atlas em M . (Se f ◦ϕ não for compatı́vel com toda ξ ∈ B, inverta a orientação de ϕ.) O atlas A é coerente porque ψ, ϕ ∈ A ⇒ ψ −1 ◦ϕ = (f ◦ψ)−1 ◦(f ◦ϕ). 6.4. Dados x, y ∈ G arbitrários, temos f (x · y) = f (x) · f (y). Isto pode ser escrito como f ◦λx = λf (x) ◦f , usando as translações à esquerda λx : G → G e λf (x) : H → H, definidas por λx (g) = xg e λf (x) (h) = f (x)·h. Note que λx e λf (x) são difeomorfismos, cujos inversos são λx−1 e λf (x)−1 . Para quaisquer p, q ∈ G, pondo x = q ·p−1 , a Regra da Cadeia, aplicada a f ◦ λx = λf (x) ◦ f , nos dá f ′ (q) · λ′x = λ′f (x) · f ′ (p). Como λ′x e λ′f (x) são, em cada ponto, isomorfismos lineares, concluı́mos que f ′ (p) : Tp G → Tf (p) H e f ′ (q) : Tq G → Tf (q) H têm o mesmo posto. Seção 8 8 Integrais múltiplas 201 Integrais múltiplas − R 1.1. Seja I = A f (x)dx. Não se pode ter J < I, pois, como I ≤ S(f ; P ), isto implicaria que S(f ; P ) − J ≥ I − J para toda partição P do bloco A. Tampouco pode ser I < J pois, fixando um número L com I < L < J, existiria uma partição Q do bloco A tal que I ≤ S(f ; Q) < L < J. Então, para qualquer P0 , a partição P = P0 ∪Q refinaria Q, logo S(f ; P ) ≤ S(f ; Q) e daı́ J − S(f ; P ) ≥ J − S(f ; Q) ≥ J − L, embora P refinasse P0 . Segue-se que I = J. 1.2. Sejam Σ o conjunto das somas superiores S(f ; P ), relativas a todas as partições P do bloco A e Σ0 ⊂ Σ o conjunto das somas superiores relativas às partições que refinam P0 . Para toda P tem-se S(f ; P ∪ P0 ) ∈ Σ0 e S(f ; P ∪ P0 ) ≤ S(f ; P ). − R Logo inf Σ0 = inf Σ = A f (x)dx. Analogamente para a integral inferior. P 1.3. Dado ε > 0, existe uma partição P = P1 × · · · × Pn do bloco A tal que wB · vol B < ε. O valor do somatório à esquerda não aumenta quando se refina B∈P a partição P . Seja C = Π[ci , di ] ⊂ A. Para cada i = 1, . . . , n escrevamos Qi = Pi ∪ {ci , di }. Isto nos dá uma partição Q = Q1 × · · · × Qn de A que refina P e, além de Q contidos em C constituem uma partição Q′ de C. Então P P disso, os blocos ′ ωB · vol B < ε pois as parcelas de ambos somatórios são ≥ 0 ωB ′ · vol B ≤ B∈Q B ′ ∈Q′ e as da esquerda estão incluı́das entre as da direita. Segue-se que fC é integrável. n Q 1.4. Seja A = [a1 , b1 ] × A′ , com c ∈ [a1 , b1 ] e A′ = [ai , bi ]. Dado ε > 0, seja i=2 I ⊂ [a1 , b1 ] um intervalo contendo c, tal que vol(I × A′ ) < ε/2K, onde K = M − m e m ≤ f (x) ≤ M para todo x ∈ A e, além disso, c ∈ int .I se c ∈ (a1 , b1 ). Vemos que I × A′ é bloco de uma partição P0 de A. Seja P uma partição de A que refina P0 . Designaremos por B ′ os blocos de P contidos em I × A′ . Nos demais blocos de P , que chamaremos de B ′′ , a função f é contı́nua, logo podemos tomar P de modo que ωB ′′ < ε/2 vol A para todo B ′′ . Então X X X ωB · vol B = ωB ′ · vol B ′ + ωB ′′ · vol B ′′ B∈P B′ B ′′ ′ < K · vol(I × A ) + (ε/2 vol(A)) · vol A < ε ε + = ε. 2 2 2.1 Para toda partição P do bloco A, o gráfico de f está contido na reunião dos blocos (n + 1)-dimensionais B × [mB , MB ], B ∈ P . O volume de cada um desses blocos é igual a ωB · vol B . A P integrabilidade de f assegura que, para todo ε > 0, ωB · vol B < ε. Isto nos diz que o gráfico de f tem existe uma partição P tal que B∈P medida nula. n Q 2.2. Seja A = [ai , bi ]. Dada uma cobertura A ⊂ ∪Bk por blocos fechados, pelo i=1 Teorema 3, podemos supor que os interiores dos Bk cobrem A e, por Borel-Lebesgue, que a cobertura é finita. Para cada i = 1, . . . , n, seja Pi a partição do intervalo [ai , bi ] formada pelos pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Bk que estejam contidas em [ai , bi ]. A partição P = P1 ×P · · · × Pn tem cada um dos seus vol B = vol A. Logo não se blocos contido em algum Bk , portanto Σ vol Bk ≥ B∈P tem med.A = 0. Segue-se daı́ que todo conjunto de medida nula tem interior vazio. 202 Soluções dos exercı́cios Cap. 10 2.3. Considere a aplicação f : M ×N → Rp , de classe C 1 , dada por f (x, y) = y−x. A fim de que v ∈ Rp pertença à imagem f (M ×N ) é necessário e suficiente que existam x ∈ M e y ∈ N tais que v = y − x, ou seja, y = x + v. Isto significa que f (M × N ) = {v ∈ Rp ; (M + v) ∩ N 6= ∅}. Ora, como dim(M × N ) = dim M + dim N < p, a imagem f (M × N ) tem medida nula em Rp , portanto tem interior vazio, isto é, seu complementar é denso em Rp . Se M e N são compactas então f (M × N ) é compacto, logo seu complementar, além de denso, é aberto. 2.4. Defina a parte positiva f+ : A → R e a parte negativa f− : A → R da função f pondo, para cada x ∈ A, f+ (x) = max{f (x), 0} e f− (x) = − min{f (x), 0}. Assim, f+ (x) = f (x) quando f (x) ≥ 0 e f+ (x) = 0 quando f (x) < 0. Por sua vez, f− (x) = −f (x) quando f (x) ≤ 0 e f− (x) = 0 se f (x) > 0. Então f+ (x) = (f (x) + |f (x)|)/2 e f− (x) = (|f (x)| − f (x))/2. Estas igualdades mostram que f+ e f− são contı́nuas em todos os pontos em que f é contı́nua, portanto f integrável implica f+ e f− integráveis. Além disso, é claro que f = f+ − f− e que f+ e f− são ambas não-negativas. 3.1. O conjunto dos pontos de descontinuidade de f é a reunião das faces próprias de B, portanto tem medida nula e f é integrável. Além disso, se considerarmos uma partição P0 de A que contenha B então, para toda partição P do bloco A que refine P0 , R tem-se s(f ; P ) = vol B = S(f ; P ). Segue-se do exercı́cio 1.2 que A f (x)dx = vol B. 3.2. X é a interseção do compacto [0, 1] como complementar do aberto ∪Jk , logo é compacto. Após cada etapa da construção de X, cada intervalo que resta tem comprimento menor do que a metade do comprimento dos intervalos que restaram da etapa anterior, logo X não contém intervalos, ou seja, int .X = ∅. Os extremos dos intervalos omitidos pertencem a X e todo ponto x0 ∈ X, na n-ésima etapa do processo, pertencia ao interior de um intervalo cujo comprimento tendia a zero quando n → ∞, os extremos do qual pertencem a X, logo x0 é ponto de acumulação de X, ou seja, X não possui pontos isolados. Finalmente, se |Jk | é o comprimento do intervalo Jk então Σ|Jk | = Σan = 1 − δ. Dada qualquer cobertura enumerável X ⊂ ∪Ir por intervalos abertos Ir , temos [0, 1] ⊂ (∪Ir ) ∪ (∪Jk ). A solução do exercı́cio 2.2 acima nos dá Σ|Ir | + Σ|Jk | ≥ 1, donde Σ|Ir | ≥ δ. Logo X não tem medida nula. 3.3. Com aR notação do Teorema 9, seja ξ = ψ − ϕ : A1 → R. A função ξ é integrável, com A1 ξ(x)dx = 0 e ξ(x) ≥ 0. Para todo k ∈ N, mostremos que Xk = S Xk tem medida {x ∈ A1 ; ξ(x) ≥ 1/k} tem medida nula. Daı́ resultará que X = k∈N nula, com fx : A2 → R integrável para todo x ∈ A1P − X. Ora, dado arbitrariamente MB · vol B < ε/k. Indiquemos ε > 0, existe uma partição P do bloco A1 tal que B∈P com B ′ os blocos de P tais que MB ′ ≥ 1/k. Então Xk está contido na reunião dos blocos B ′ e X 1 1 Σ vol B ′ = Σ · vol B ′ ≤ ΣMB ′ · vol B ′ ≤ MB · vol B < ε/k. k k B∈P Multiplicando por k, vem Σ vol B ′ < ε, logo med.Xk = 0 3.4. O complementar de um conjunto de medida nula, sendo denso, possui pontos em todo intervalo. Logo, se f (x) ≥ 0 para todo x ∈ A, tem-se mB = R 0, donde P mB ·vol B = 0 seja qual for a partição P do bloco A. Então f (x)dx = s(f ; P ) = B∈P −A R 0 e, como f é integrável, A f (x)dx = 0. No caso geral, f é a diferença de R duas funções integráveis não-negativas, cada uma das quais tem integral nula, logo A f (x)dx = 0. Seção 9 Mudança de variáveis 203 4.1 Isto resulta diretamente do exercı́cio 3.1. 4.2. Porque sua fronteira S(a; r) é uma superfı́cie C ∞ de dimensão n − 1 no espaço Rn , logo tem medida nula. 4.3. O interior U de um conjunto J-mensurável X é também J-mensurável em virtude do Teorema 10, pois fr .U ⊂ fr .X. Além disso, como fr .X tem volume nulo e a reunião X = U ∪ (X ∩ fr .X) é disjunta, tem-se vol .X = vol .U + vol .(X ∩ fr .X) = vol .U . P mB · vol B = 4.4. Para toda partição P do bloco A, tem-se s(f ; P ) = B∈P P P P vol B ′′ , MB · vol B = vol B ′ , onde B ′ = B × [0, mB ], e S(f ; P ) = B∈P B∈P B∈P S S B ′′ , s(f ; P ) ≤ B ′ ⊂ C(f ) ⊂ onde B ′′ = B × [0, MB ]. Evidentemente, B∈P B∈P vol . int .C(f ) ≤ volR.ext C(f )≤S(f ; P ). Portanto f integrável implica C(f ) J-mensurável e vol C(f ) = A f (x)dx. 9 Mudança de variáveis 1. Uma observação preliminar: se f : B(a; r) → R é contı́nua, com m(r) = inf{f (x); x ∈ B(a; r)} e M (r) = sup{f (x); x ∈ B(a; r)} então f (a) = lim m(r) = r→0 lim M (r) e m(r) ≤ f (x) ≤ M (r) para todo x ∈ B(a; r). Segue-se daı́ que r→0 m(r) ≤ 1 vol B(a; r) Z B(a;r) f (x)dx ≤ M (r), portanto Z 1 f (x)dx = f (a). r→0 vol B(a; r) B(a;r) R R Dito isto, vemos que vol ·f (B(a; r)) = f (B(a;r)) 1·dy = B(a;r) | det ·f ′ (x)|dx, portanto lim lim r→0 vol .f (B(a; r)) = | det .f ′ (a)|. vol .B(a; r) 2. A solução deste exercı́cio se faz com o uso imediato do Teorema da Mudança de Variáveis, juntamente com a observação que precede o Teorema 4 do Capı́tulo 7, sobre o produto vetorial. Referências Bibliográficas [1] E.L. Lima. Análise Real, vol. 1. (Sétima edição.) Coleção Matemática Universitária, IMPA, 2004. [2] E.L. Lima. Curso de Análise, vol. 1. (Décima primeira edição.) Projeto Euclides, IMPA, 2004. [3] E.L. Lima. Curso de Análise, vol. 2. (Sexta edição.) Projeto Euclides, IMPA, 2000. [4] E.L. Lima. Álgebra Linear. (Sexta edição.) Coleção Matemática Universitária, IMPA, 2003. [5] E.L. Lima. Análise no Espaço Rn . Coleção Matemática Universitária, IMPA, 2001. [6] S. Lang. Undergraduate Analysis. Springer Verlag, N. York, 1983. (Em inglês.) [7] Th. Bröcker. Analysis II. BI-Wiss.-Verlag. Mannheim, 1992. (Em alemão.) As cinco primeiras referências são citadas no texto, especialmente a primeira, da qual este livro é o prosseguimento. As duas últimas são obras que se destacam entre as congêneres: o livro de Lang, por sua caracterı́stica objetividade; o de Bröcker por ter sabido, com êxito, conciliar elegância, clareza e concisão. Os capı́tulos IV e VII da referência 3, que tratam do que se poderia chamar uma versão moderna da Análise Vetorial clássica, podem formar uma continuação natural dos temas aqui tratados. Índice Remissivo Índice Remissivo i-ésima coordenada, 1 i-ésima derivada parcial, 55 i-ésima variável, 55 i-convexo, 81 Campo de vetores normais, 91, 132 Cisão, 27 Classe C k , 41, 43, 57, 100 Co-dimensão, 127 Cobertura, 18 Combinação convexa, 75 Componente conexa, 32 Comprimento, 3, 48 Conjunto aberto, 8 compacto, 16 conexo, 28 conexo por caminhos, 31 convexo, 7 de nı́vel, 62 denso, 14 discreto, 14 fechado, 12 horizontalmente convexo, 81 limitado, 6 verticalmente convexo, 81 Constante de Lipschitz, 24 Contração, 25 Critério de Cauchy, 12 Cubo, 18 n-dimensional, 148 Curva, 62, 87, 126 Aplicação aberta, 112 contı́nua, 20 lipschitziana, 24 uniformente contı́nua, 24 Arestas, 148 Atlas, 133 coerente, 133 Base associada a uma parametrização, 130 Bloco n-dimensional, 148 Blocos de uma partição, 149 Bola aberta, 5 fechada, 5 Caminho, 30 justaposto, 31 poligonal, 32 regular, 51 retificável, 48 retilı́neo, 30 uniformemente diferenciável, 47 Decomposição, 166 207 208 pontilhada, 169 Delta de Kronecker, 90 Derivada, 41, 142 à direita, 42 à esquerda, 42 de Gâteux, 77 de uma aplicação, 98 direcional, 60, 98 parcial, 121 segunda, 109 Desigualdade de Hadamard, 97 do valor médio, 44, 107 Diâmetro, 18 Difeomorfismo, 111, 143 admissı́vel, 177 local, 112 primitivo, 175 difeomorfismo local, 143 Diferenciável, 41, 98 Diferencial, 101 Disco, 5 Distância, 5, 16 intrı́nseca, 54 Elipsóide, 90 Equações de Cauchy-Riemann, 103 Esfera, 5 Espaço euclidiano n-dimensional, 1 vetorial tangente, 88, 129 Extensão radial, 109 Fórmula de Taylor, 69 Face, 148 Fecho, 12 Fibrado normal, 146 tangente, 146 Índice Remissivo Fluxo, 180 Forma local das submersões, 117 Forma quadrática, 70, 90 hessiana, 71 não-negativa, 70 não-positiva, 70 negativa, 70 positiva, 70 Fronteira, 9 Função côncava, 75 caracterı́stica, 162 convexa, 75 de Urysohn, 38 harmônica, 82 integrável, 151, 164 limitada, 6, 10 quase-convexa, 83 Função-coordenada, 19 Gradiente, 60 Grau, 172 Grupo unimodular, 91 Hélice, 52 Hiperfı́cie, 87 Homeomorfismo, 26 Imersão, 124 Integral, 151 inferior, 150 superior, 150 Interior, 7 Invertendo a orientação, 199 Lagrangiana, 95 Limite, 10, 45, 169 lateral, 34 Linha de nı́vel, 62 Índice Remissivo Máximo local, 71 Máximo ou mı́nimo estrito, 73 Mı́nimo local, 71 Matriz hessiana, 66 jacobiana, 98 Medida n-dimensional nula, 152 Mudança de parametrização, 128 Multiplicador de Lagrange, 92 Multiplicadores de Lagrange, 140 Número de Lebesgue, 178 Nı́vel crı́tico, 89 regular, 89 Norma, 3, 4, 25, 45, 107, 166 euclidiana, 4 Oscilação, 151 num ponto, 157 Parametrização, 125 Parametrizações compatı́veis, 133 Parte negativa, 202 positiva, 202 Partição, 45, 149 pontilhada, 45 Plano projetivo, 147 Ponto aderente, 12 crı́tico, 64, 139 da restrição, 91 não-degenerado, 117 de acumulação, 14 isolado, 14 Produto vetorial, 134 Projeção estereográfica, 26 Quádrica, 90 209 Raiz quadrada de uma matriz, 116 simples, 122 Refinamento, 45, 149 Regra da Cadeia, 45, 103 Reparametrização, 51 Reta tangente, 42 Seqüência, 10 convergente, 10 de Cauchy, 12 Soma de Riemann, 45, 169 inferior, 149, 166 superior, 166 superior, 149 Subcobertura, 18 Submersão, 119 Subseqüência, 10 Superfı́cie, 87, 126 de nı́vel, 62 orientável, 91, 133 Teorema da Alfândega, 30 da aplicação inversa, 115 da derivação sob o sinal de integral, 66 da diferenciabilidade uniforme, 47, 107 da função implı́cita, 84 da integração repetida, 160 da permanência da desigualdade, 36 da permanência do sinal, 34 das funções implı́citas, 119 de Bolzano-Weierstrass, 11 de Borel-Lebesgue, 18 210 de Lebesgue (condição de integrabilidade), 157 de Lindelöf, 156 de Pitágoras, 3 de Schwarz, 67 de Weierstrass, 21 do valor médio, 61 fundamental do cálculo, 46 Toro m-dimensional, 126 Vértices, 148 Valor de aderência, 37 médio, 53 regular, 89, 130 Valores singulares, 141 Vertical, 117 Vetor-velocidade, 41 Vizinhança, 7 parametrizada, 126 Volume n-dimensional, 148, 163 externo, 162 interno, 162 Índice Remissivo

Real Analysis: Functions of n Variables Textbook

Products

Support

Real Analysis: Functions of n Variables Textbook

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib