Uploaded by Raphael Pontes

Análise Real - Volume 2 - Funções de n variáveis (Elon Lages Lima) (Z-Library)

advertisement
Análise Real volume 2
Funções de n Variáveis
Lima, Elon Lages
Análise real, v.2 / Elon Lages Lima. 1 ed. Rio de
Janeiro : IMPA, 2014.
202 p. : il. ; 23 cm. (Coleção matemática universitária)
Inclui bibliografia.
e-ISBN 978-85-244-0381-1
1. Análise Matemática. I. Título. II. Série.
CDD-517
COLEÇÃO MATEMÁTICA UNIVERSITÁRIA
Análise Real volume 2
Funções de n Variáveis
Elon Lages Lima
INSTITUTO NACIONAL DE MATEMÁTICA PURA E APLICADA
Copyright  2014 by Elon Lages Lima
Impresso no Brasil / Printed in Brazil
Capa: Rodolfo Capeto, Noni Geiger e Sérgio R. Vaz
Coleção Matemática Universitária
Comissão Editorial:
Elon Lages Lima
S. Collier Coutinho
Paulo Sad
Títulos Publicados:
• Análise Real, vol. 1: Funções de uma Variável – Elon Lages Lima
• EDP. Um Curso de Graduação – Valéria Iório
• Curso de Álgebra, Volume 1 – Abramo Hefez
• Álgebra Linear – Elon Lages Lima
• Introdução às Curvas Algébricas Planas – Israel Vainsencher
• Equações Diferenciais Aplicadas – Djairo G. de Figueiredo e Aloisio Freiria Neves
• Geometria Diferencial – Paulo Ventura Araújo
• Introdução à Teoria dos Números – José Plínio de Oliveira Santos
• Cálculo em uma Variável Complexa – Marcio G. Soares
• Geometria Analítica e Álgebra Linear – Elon Lages Lima
• Números Primos: Mistérios e Recordes – Paulo Ribenboim
• Análise no Espaço Rn – Elon Lages Lima
• Análise Real, vol. 2: Funções de n Variáveis – Elon Lages Lima
• Álgebra Exterior – Elon Lages Lima
• Equações Diferenciais Ordinárias – Claus Ivo Doering e Artur Oscar Lopes
• Análise Real, vol. 3: Análise Vetorial – Elon Lages Lima
• Álgebra Linear. Exercícios e Soluções – Ralph Costa Teixeira
• Números Primos. Velhos Mistérios e Novos Recordes – Paulo Ribenboim
Distribuição:
IMPA
Estrada Dona Castorina, 110
22460-320 Rio de Janeiro, RJ
e-mail: ddic@impa.br
http://www.impa.br
Prefácio
Este segundo volume do livro “Análise Real” trata das funções de n
variáveis. Sua leitura pressupõe, naturalmente, conhecimento das noções
básicas sobre funções de uma variável, conforme estão apresentadas no
primeiro volume, ou em algum texto equivalente. Além disso, é conveniente que o leitor tenha alguma familiaridade com os conceitos elementares da Álgebra Linear, tais como dependência linear, transformações
lineares e suas matrizes, produto interno etc, a nı́vel de um curso introdutório.
Como no seu antecessor, procuramos expor a matéria de modo que
ela possa ser coberta num curso com a duração de um semestre letivo.
Com isto em mente, procuramos seguir uma trajetória objetiva, visando
os resultados mais relevantes, sem preocupação com a extrema generalidade.
O objetivo principal do curso é o Cálculo Diferencial das aplicações
de Rm (ou de um seu subconjunto) em Rn e das integrais múltiplas. Para
atingi-lo, estudamos no capı́tulo inicial as funções contı́nuas f : X → Rn ,
definidas num subconjunto X ⊂ Rm e, para melhor entendê-las, analisamos as propriedades topológicas desses subconjuntos. Em seguida, consideramos dois casos particulares (e particularmente interessantes) do
Cálculo que queremos estudar, a saber: os caminhos, que são aplicações
contı́nuas f : I → Rn , definidas em intervalos I ⊂ R e as funções
numéricas f : U → R, definidas em conjuntos U ⊂ Rm . Este segundo
caso particular nos permite destacar o importante conceito de vetor gradiente, que ficaria diluı́do no contexto geral se não tivéssemos isolado
o caso n = 1. Ainda no contexto de funções numéricas, tratamos separadamente os casos de uma só função implı́cita, as hiperfı́cies e o
multiplicador de Lagrange.
Os capı́tulos 5, 6 e 7 se ocupam do Cálculo Diferencial das aplicações f : U → Rn , onde a derivada, que antes era vista como um vetor
(o gradiente) agora aparece como uma transformação linear. O resultado
principal é o Teorema da Função Inversa, do qual se derivam o Teorema
das Funções Implı́citas e os multiplicadores de Lagrange. Olhando para
as funções implı́citas de forma global, somos conduzidos à noção de
superfı́cie diferenciável (de dimensão qualquer) no espaço euclidiano e o
Cálculo Diferencial nas mesmas.
Os capı́tulos 8 e 9 tratam das integrais múltiplas (no sentido de
Riemann), culminando com a demonstração da fórmula de mudança de
variáveis.
O livro contém 170 exercı́cios, propostos ao final de cada capı́tulo. O
capı́tulo 10, último do livro, contém as soluções completas de todos eles.
O leitor deve considerá-los como um meio de verificar até que ponto
assimilou o conteúdo de cada seção. As soluções por mim sugeridas
podem ser bem diferentes das suas, mais simples ou mais complicadas
do que as que imaginou mas, acima de tudo, devem ser vistas como um
auxı́lio a ser solicitado somente depois de tentar seriamente resolver o
problema com seus próprios recursos.
Um tratamento mais extenso e completo dos assuntos aqui estudados
encontra-se no “Curso de Análise”, vol. 2, o qual, entretanto, é um livro
muito longo para ser estudado num único semestre.
Ao terminar, agradeço ao Professor Hilário Alencar pela leitura de
uma versão preliminar, com a correção de vários misprints, e ao Professor
Florêncio Guimarães, pela revisão do manuscrito final.
Rio de Janeiro, 25 de maio de 2004
Elon Lages Lima
Prefácio da sexta edição
A partir da segunda edição, foram feitas algumas correções de natureza tipográfica e diversas pequenas mudanças visando tornar mais clara
a exposição. Em particular, na quinta edição foi incluı́do um Apêndice ao
Capı́tulo 7, sobre o volume do paralelepı́pedo. Agradeço a colaboração
de José Regis, Mariana Garcia, Rick Rischter e Raphael Antunes dos
Santos por terem apontado certas impropriedades, a Rogerio Dias Trindade e Wilson Góes, que redigitaram o texto.
Rio de Janeiro, abril de 2012
Elon Lages Lima
Conteúdo
1 Topologia do Espaço Euclidiano
1
O espaço euclidiano n-dimensional
2
Bolas e conjuntos limitados . . . .
3
Conjuntos abertos . . . . . . . . .
4
Seqüências em Rn . . . . . . . . .
5
Conjuntos fechados . . . . . . . . .
6
Conjuntos compactos . . . . . . . .
7
Aplicações contı́nuas . . . . . . . .
8
Continuidade uniforme . . . . . . .
9
Homeomorfismos . . . . . . . . . .
10 Conjuntos conexos . . . . . . . . .
11 Limites . . . . . . . . . . . . . . .
12 Exercı́cios . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
7
10
12
16
19
23
26
27
33
36
2 Caminhos em Rn
1
Caminhos diferenciáveis . . . .
2
Cálculo diferencial de caminhos
3
A integral de um caminho . . .
4
Caminhos retificáveis . . . . . .
5
Exercı́cios . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
43
45
48
52
.
.
.
.
.
.
55
55
57
65
68
70
75
3 Funções Reais de n Variáveis
1
Derivadas parciais . . . . .
2
Funções de classe C 1 . . . .
3
O Teorema de Schwarz . . .
4
A fórmula de Taylor . . . .
5
Pontos crı́ticos . . . . . . .
6
Funções convexas . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
Cap. 0
CONTEÚDO
7
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4 Funções Implı́citas
1
Uma função implı́cita . .
2
Hiperfı́cies . . . . . . . . .
3
Multiplicador de Lagrange
4
Exercı́cios . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
84
84
87
91
96
5 Aplicações Diferenciáveis
1
A derivada como transformação linear
2
Exemplos de derivadas . . . . . . . . .
3
Cálculo diferencial de aplicações . . .
4
Exercı́cios . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
98
98
100
103
109
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Aplicações Inversas e Implı́citas
111
1
O Teorema da Aplicação Inversa . . . . . . . . . . . . . . 111
2
Várias Funções Implı́citas . . . . . . . . . . . . . . . . . . 117
3
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
7 Superfı́cies Diferenciáveis
1
Parametrizações . . . . . . . . . . . . . .
2
Superfı́cies diferenciáveis . . . . . . . . . .
3
O espaço vetorial tangente . . . . . . . . .
4
Superfı́cies orientáveis . . . . . . . . . . .
5
Multiplicadores de Lagrange . . . . . . . .
6
Aplicações diferenciáveis entre superfı́cies
7
Exercı́cios . . . . . . . . . . . . . . . . . .
8 Integrais Múltiplas
1
A definição de integral . . . . . . .
2
Conjuntos de medida nula . . . . .
3
Cálculo com integrais . . . . . . .
4
Conjuntos J-mensuráveis . . . . .
5
A integral como limite de somas de
6
Exercı́cios . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Riemann
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
124
. 124
. 126
. 129
. 132
. 139
. 142
. 146
.
.
.
.
.
.
148
. 148
. 152
. 159
. 162
. 165
. 170
9 Mudança de Variáveis
172
1
O caso unidimensional . . . . . . . . . . . . . . . . . . . . 173
2
Difeomorfismos primitivos . . . . . . . . . . . . . . . . . . 175
1
CONTEÚDO
3
4
5
Todo difeomorfismo C 1 é localmente admissı́vel . . . . . . 177
Conclusão: todo difeomorfismo de classe C 1 é admissı́vel . 178
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
10 Soluções dos exercı́cios
1
Topologia do Espaço Euclidiano
2
Caminhos diferenciáveis . . . .
3
Funções reais de n variáveis . .
4
Funções implı́citas . . . . . . .
5
Aplicações diferenciáveis . . . .
6
Aplicações Inversas e Implı́citas
7
Superfı́cies Diferenciáveis . . .
8
Integrais múltiplas . . . . . . .
9
Mudança de variáveis . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
181
. 181
. 186
. 188
. 192
. 194
. 195
. 197
. 201
. 203
Referências Bibliográficas
205
Índice Remissivo
206
5
1
Topologia do Espaço
Euclidiano
1
O espaço euclidiano n-dimensional
Seja n um número natural. O espaço euclidiano n-dimensional Rn é
o produto cartesiano de n fatores iguais a R : Rn = R × R × · · · × R.
Seus elementos, portanto, são as seqüências (ou listas) de n termos reais
x = (x1 , . . . , xn ). Para cada i = 1, . . . , n, o termo xi chama-se a i-ésima
coordenada de x. Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), tem-se x = y
se, e somente se, x1 = y1 , . . . , xn = yn . Assim, toda igualdade entre dois
elementos de Rn equivale a n igualdades entre números reais. R1 = R
é o conjunto dos números reais, R2 é o modelo numérico do plano e
R3 é o modelo do espaço euclidiano tridimensional. Por simplicidade,
adotaremos o hábito de escrever z = (x, y) em vez de x = (x1 , x2 ) e
w = (x, y, z) em vez de x = (x1 , x2 , x3 ).
Os elementos de Rn às vezes são chamados pontos e às vezes vetores.
Este segundo nome se aplica principalmente quando se considerarem
entre eles as operações que definiremos agora.
A adição faz corresponder a cada par de elementos x = (x1 , . . . , xn )
e y = (y1 , . . . , yn ) a soma
x + y = (x1 + y1 , . . . , xn + yn ).
e a multiplicação do número real α pelo elemento x = (x1 , . . . , xn ) tem
como resultado o produto
α · x = (αx1 , . . . , αxn ).
2
Topologia do Espaço Euclidiano
Cap. 1
O vetor 0 = (0, 0, . . . , 0), cujas coordenadas são todas nulas, chamase a origem de Rn . Para todo x = (x1 , . . . , xn ), o vetor −x =
(−x1 , . . . , −xn ) chama-se o oposto, ou simétrico de x. Dados quaisquer
x, y, z ∈ Rn e α, β ∈ R valem as igualdades
x + y = y + x,
x + 0 = x,
x + (y + z) = (x + y) + z,
(α + β)x = αx + βx,
−x + x = 0,
α(βx) = (αβ)x,
α(x + y) = αx + αy,
1 · x = x.
A segunda e a terceira delas dizem que 0 é o elemento neutro da
adição e −x é o inverso aditivo de x.
Os vetores e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . en = (0, . . . , 1),
que têm uma única coordenada não-nula, igual a 1, constituem a base
canônica de Rn . A igualdade x = (x1 , . . . , xn ) significa que x = x1 · e1
+ · · · + xn · en .
Existe ainda uma operação que associa a cada par de vetores
x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) o número real
hx, yi = x1 y1 + · · · + xn yn ,
chamado o produto interno de x por y.
Para x, y, z ∈ Rn e α ∈ R quaisquer, tem-se
hx, yi = hy, xi,
hx, y + zi = hx, yi + hx, zi,
hαx, yi = α · hx, yi,
hx, xi > 0
se x 6= 0.
Segue-se que hx+y, zi = hx, zi+hy, zi, hx, αyi = αhx, yi e hx, 0i = 0.
Diz-se que os vetores x, y ∈ Rn são ortogonais, e escreve-se x ⊥ y,
quando hx, yi = 0. Por exemplo, ei ⊥ ej se i 6= j.
Um exemplo menos trivial de ortogonalidade é o seguinte:
hx, yi
(1.1) Seja x ∈ Rn não-nulo. Para todo y ∈ Rn , o vetor z = y −
·x
hx, xi
é ortogonal a x.
hx, yi
· hx, xi = 0.
Demonstração: hx, zi = hx, yi −
hx, xi
hx, yi
Escrevendo y =
· x + z, vemos assim que, uma vez dado um
hx, xi
vetor não-nulo x ∈ Rn , todo vetor y ∈ Rn se escreve como soma de um
múltiplo de x com um vetor ortogonal a x. Esta decomposição é única
O espaço euclidiano n-dimensional
Seção 1
3
pois se y = α · x + z com z ⊥ x, tomando-se o produto interno de ambos
os membros por x obtemos hx, yi = α · hx, xi, logo α = hx, yi/hx, xi.
O vetor αx = (hx, yi/hx, xi)x chama-se a projeção ortogonal de y sobre
(a reta que contém) x.
z
y
x
hx,yi
hx,xi ·x
Figura 1.1
p
O número não-negativo |x| = hx, xi chama-se a norma (ou o comprimento) do vetor x. Se x = (x1 , . . . , xn ) então
|x| =
q
x21 + · · · + x2n .
Por definição, tem-se hx, xi = |x|2 . Quando |x| = 1, diz-se que x é um
vetor unitário. Para todo x 6= 0, o vetor u = x/|x| é unitário.
(1.2) (Teorema de Pitágoras). Se x ⊥ y então |x + y|2 = |x|2 + |y|2 .
Demonstração: |x + y|2 = hx + y, x + yi = hx, xi + 2hx, yi + hy, yi =
hx, xi + hy, yi = |x|2 + |y|2 .
(1.3) (Desigualdade de Schwarz). Para quaisquer x, y ∈ Rn , tem-se
|hx, yi| ≤ |x| · |y|, valendo a igualdade se, e somente se, um dos vetores
x, y é múltiplo do outro.
Demonstração: Isto é óbvio se x = 0. Supondo x 6= 0, podemos
escrever y = αx + z com z ⊥ x e α = hx, yi/|x|2 . Por Pitágoras,
|y|2 = α2 |x|2 + |z|2 , logo |y|2 ≥ α2 |x|2 , valendo a igualdade se, e somente
se, y = α·x. Entrando com o valor de α, vem |y|2 ≥ hx, yi2 /|x|2 , ou seja,
hx, yi2 ≤ |x|2 · |y|2 , o que nos dá |hx, yi| ≤ |x| · |y|, valendo a igualdade
se, e somente se, y = α · x.
4
Topologia do Espaço Euclidiano
Cap. 1
A norma goza das seguintes propriedades:
1. |x| ≥ 0, valendo |x| = 0 somente quando x = 0;
2. |α · x| = |α| |x|;
3. |x + y| ≤ |x| + |y|.
A última desigualdade, referindo-se a números não-negativos, equivale a
|x + y|2 ≤ (|x| + |y|)2 .
Ora,
|x + y|2 = hx + y, x + yi = |x|2 + 2hx, yi + |y|2
≤ |x|2 + 2|x||y| + |y|2 = (|x| + |y|)2
pois, em virtude da desigualdade de Schwarz, hx, yi ≤ |x| |y|.
Mais geralmente, qualquer função Rn → R, que associe a cada vetor
x ∈ Rn um número |x| com as três propriedades acima, chama-se uma
norma. A norma
q
|x| = x21 + · · · + x2n ,
chama-se norma euclidiana.
Há duas outras normas que poderemos utilizar em Rn quando houver
conveniência. Elas são
1. |x|M = max ·{|x1 |, . . . , |xn |} (norma do máximo),
2. |x|S = |x1 | + · · · + |xn | (norma da soma).
As condições que definem uma norma são fáceis de verificar para
estas duas. Também é simples mostrar que, para todo x ∈ Rn , vale
|x|M ≤ |x| ≤ |x|S ≤ n · |x|M ,
onde |x| é a norma euclidiana.
Quando, num determinado contexto, estivermos usando apenas uma
das normas |x|M ou |x|S , podemos indicá-la com a notação |x|, por
simplicidade.
Para toda norma, vale a desigualdade
| |x| − |y| | ≤ |x − y|.
Seção 2
Bolas e conjuntos limitados
5
Com efeito, de x = (x − y) + y resulta que |x| ≤ |x − y| + |y|, logo
|x| − |y| ≤ |x − y|.
Trocando os papéis de x e y, obtemos |y| − |x| ≤ |y − x|. Mas
|y − x| = |x − y|, logo |y| − |x| ≤ |x − y|. Conclusão: ||x| − |y|| ≤ |x − y|.
Uma norma em Rn dá origem à noção de distância d(x, y) entre dois
pontos x, y ∈ Rn . Para x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), pomos
p
d(x, y) = |x − y| = (x1 − y1 )2 + · · · + (xn − yn )2 .
As três condições que definem uma norma implicam que d(x, y) tem
as propriedades caracterı́sticas de uma distância, a saber:
1. d(x, y) ≥ 0, com d(x, y) = 0 se, e somente se, x = y;
2. d(x, y) = d(y, x);
3. d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular).
Observe que a igualdade |α · x| = |α| |x| com α = −1 dá | − x| = |x|,
logo |x−y| = |y−x|. Além disso, |x−z| = |x−y+y−z| ≤ |x−y|+|y−z|,
portanto d(x, z) ≤ d(x, y) + d(y, z).
2
Bolas e conjuntos limitados
Dados o ponto a ∈ Rn e o número real r > 0, a bola aberta de centro a
e raio r é o conjunto B(a; r) dos pontos x ∈ Rn cuja distância ao ponto
a é menor que r. Em sı́mbolos:
B(a; r) = {x ∈ Rn ; |x − a| < r}.
Analogamente, a bola fechada de centro a e raio r é o conjunto B[a; r]
assim definido:
B[a; r] = {x ∈ Rn ; |x − a| ≤ r}.
Por sua vez, a esfera de centro a e raio r é o conjunto
S[a; r] = {x ∈ Rn ; |x − a| = r}.
Evidentemente, B[a; r] = B(a; r) ∪ S[a; r].
A bola fechada B[a; r] ⊂ Rn também é chamada o disco n-dimensional de centro a e raio r. Em particular, o disco B[0; 1] de centro 0 e
raio 1 é chamado o disco unitário de Rn .
6
Topologia do Espaço Euclidiano
Cap. 1
Uma notação especial é reservada para a esfera unitária de
dimensão n − 1:
S n−1 = {x ∈ Rn ; |x| = 1}.
Assim, S n−1 é a esfera de centro na origem 0 e raio 1. Quando n = 2,
S 1 é a circunferência de centro 0 e raio 1.
Acima estamos (pelo menos tacitamente) admitindo que a norma
adotada em Rn é a euclidiana, já que não foi feita menção em contrário.
Convém, entretanto, observar que a forma geométrica das bolas e esferas
em Rn depende da norma que se considera. Por exemplo, se tomarmos
em R2 a norma do máximo, a “esfera unitária” é o bordo do quadrado
de centro 0 e lados de comprimento 2, paralelos aos eixos. Ainda em R2 ,
com a norma da soma, o “disco unitário” é o quadrado cujos vértices
são os pontos (1, 0), (0, 1), (−1, 0) e (0, −1).
(a)
(b)
(c)
Figura 1.2: O conjunto dos pontos z ∈ R2 tais que |z| ≤ 1, conforme a norma
seja (a) a euclidiana, (b) do máximo, ou (c) da soma.
Observação: Indiquemos com as notações B, BM e BS respectivamente
as bolas de centro a e raio r em Rn , relativamente às normas euclidiana,
′ a bola de centro a e raio r/n
do máximo e da soma. Seja ainda BM
na norma do máximo. As desigualdades |x|M ≤ |x| ≤ |x|S ≤ n|x|M
′ ⊂B ⊂B ⊂B .
implicam que BM
S
M
Diz-se que o conjunto X ⊂ Rn é limitado quando está contido em
alguma bola B[a; r]. Como B[a; r] ⊂ B[0; k], onde k = r + |a| (conforme
veremos agora), dizer que X é limitado equivale a dizer que existe k > 0
tal que |x| ≤ k para todo x ∈ X.
Para mostrar que B[a; r] ⊂ B[0; r + |a| ], note que |x − a| ≤ r ⇒
|x| = |x − a + a| ≤ |x − a| + |a| ≤ r + |a|.
Assim, x ∈ B[a; r] ⇒ x ∈ B[0; r + |a|].
Seção 3
Conjuntos abertos
7
Uma aplicação f : X → Rn diz-se limitada no conjunto X ⊂ Rm
quando sua imagem f (X) ⊂ Rn é um conjunto limitado, isto é, quando
existe c > 0 tal que |f (x)| ≤ c para todo x ∈ X.
Dados a 6= b em Rn , a reta que une esses dois pontos é o conjunto
ab = {(1−t)a+tb ; t ∈ R}. Por sua vez, o segmento de reta de extremos
a, b é o conjunto [a, b] = {(1 − t)a + tb ; 0 ≤ t ≤ 1}.
Um conjunto X ⊂ Rn chama-se convexo quando o segmento de reta
que une dois quaisquer de seus pontos está inteiramente contido em X.
Noutros termos, dizer que X é convexo equivale a afirmar que
a, b ∈ X,
0≤t≤1
⇒
(1 − t)a + tb ∈ X .
Exemplo 1. Toda bola (aberta ou fechada) é um conjunto convexo.
Para fixar as idéias, consideremos a bola fechada B = B[x0 ; r]. Dados
a, b ∈ B, temos |a − x0 | ≤ r e |b − x0 | ≤ r. Para qualquer t ∈ [0, 1] vale
x0 = (1 − t)x0 + tx0 , logo
|(1 − t)a + tb − x0 | = |(1 − t)a + tb − (1 − t)x0 − tx0 |
= |(1 − t)(a − x0 ) + t(b − x0 )|
≤ (1 − t)|a − x0 | + t|b − x0 |
≤ (1 − t)r + tr = r,
⊳
Exemplo 2. Seja X = {(x, y) ∈ R2 ; y ≤ x2 }. O conjunto X ⊂ R2 não
é convexo. Com efeito os pontos a = (−1, 1) e b = (1, 1) pertencem a X
1
1
mas a + b = (0, 1) não pertence a X.
⊳
2
2
3
Conjuntos abertos
Seja a ∈ X ⊂ Rn . Diz-se que o ponto a é interior ao conjunto X
quando, para algum r > 0, tem-se B(a; r) ⊂ X. Isto significa que
todos os pontos suficientemente próximos de a também pertencem a
X. O conjunto int.X dos pontos interiores a X chama-se o interior do
conjunto X. Evidentemente, int.X ⊂ X. Quando a ∈ int.X, diz-se que
X é uma vizinhança de a.
Exemplo 3. Seja X={(x, y) ∈ R2 ; y ≥ 0} o semi-plano superior fechado. Se p = (a, b) com b > 0, então p ∈ int.X. Com efeito, afirmamos
que B = B(p; b) ⊂ X. Isto é claro geometricamente.
8
Topologia do Espaço Euclidiano
Cap. 1
b
b
p
a
Figura 1.3
Em termos mais precisos, argumentamos assim:
p
(x, y) ∈ B ⇒ (x − a)2 + (y − b)2 < b ⇒ (y − b)2 < b2
⇒ y 2 − 2by + b2 < b2 ⇒ y 2 < 2by ⇒ y > 0 (pois b > 0),
e portanto (x, y) ∈ X.
⊳
Exemplo 4. Com a notação do Exemplo 3, os pontos da forma
q = (a, 0), pertencem a X porém não são interiores a X. Com efeito,
nenhuma bola B(q; r) de centro q pode estar contida em X pois o
ponto (a, −r/2) pertence a B(q; r) mas não a X. Segue-se então que
int.X = {(x, y) ∈ R2 ; y > 0}.
Um conjunto A ⊂ Rn chama-se aberto quando todos os seus pontos
são interiores, isto é, quando A = int.A.
⊳
y
x
a
Figura 1.4
Exemplo 5. Toda bola aberta B = B(a; r) é um conjunto aberto. Com
efeito, seja x ∈ B. Então |x−a| < r, logo s = r −|x−a| > 0. Afirmamos
Seção 3
Conjuntos abertos
9
que, B(x; s) ⊂ B. Com efeito, y ∈ B(x; s) ⇒ |y − x| < r − |x − a|. Logo
y ∈ B(x; s) ⇒ |y − a| ≤ |y − x| + |x − a| < r − |x − a| + |x − a| = r.
Daı́ concluimos que y ∈ B(a; r).
⊳
A fronteira de um conjunto X ⊂ Rn é o conjunto fr.X formado pelos
pontos de X que não são interiores a X, juntamente com os pontos de
Rn − X que não são interiores a Rn − X. De forma mais simples: tem-se
x ∈ fr.X quando toda bola de centro x contém pontos de X e pontos de
Rn − X.
Exemplo 6. Seja X = {(x, y) ∈ R2 ; y ≥ 0}, como no Exemplo 3.
De forma análoga ao argumento usado no Exemplo 3, mostra-se que
todo ponto de R2 − X = {(x, y) ∈ R2 ; y < 0} é um ponto interior
(ou seja, que R2 − X é um conjunto aberto). Logo, nenhum ponto de
R2 − X pode estar na fronteira de X. Segue-se então do Exemplo 4 que
fr.X = {(x, 0) ; x ∈ R} = eixo dos xx.
Teorema 1.
(a) Se A1 , A2 são abertos em Rn então A1 ∩ A2 é aberto.
(b) Se (Aλ )λ∈L é umaSfamı́lia arbitrária de conjuntos abertos Aλ ⊂ Rn
Aλ é um conjunto aberto.
então a reunião A =
λ∈L
Demonstração: Vide vol. 1, pág. 49. Mesma demonstração, substituindo apenas cada intervalo (a − ε, a + ε) pela bola B(a; ε).
Resulta imediatamente do Teorema 1 que a interseção A = A1
∩ · · · ∩ Ak de um número finito de conjuntos abertos A1 , . . . , Ak é ainda
um conjunto aberto. Entretanto, a interseção de infinitos abertos pode
∞
T
B(a; 1/k) = {a}.
não ser aberta, como mostra o exemplo
k=1
Rn .
Seja X ⊂
Diz-se que um subconjunto A ⊂ X é aberto em X
quando cada ponto a ∈ A é centro de uma bola aberta B(a; r), tal
que B(a; r) ∩ X ⊂ A. Isto significa que os pontos de X que estão
suficientemente próximos de cada a ∈ A pertencem a A. A reunião U
de todas essas bolas é um aberto tal que A = U ∩ X. A recı́proca é
óbvia, de modo que um conjunto A ⊂ X é aberto em X se, e somente
se, A = U ∩ X onde U é aberto em Rn .
Por exemplo, o intervalo (0, 1] é aberto em [0, 1] pois (0, 1] =
(0, 2) ∩ [0, 1].
10
4
Topologia do Espaço Euclidiano
Cap. 1
Seqüências em Rn
Uma seqüência em Rn é uma função x : N → Rn , que associa a cada
número natural k um ponto xk ∈ Rn . As notações para uma seqüência
são (x1 , . . . , xk , . . . ), (xk )k∈N ou simplesmente (xk ).
Para cada i = 1, . . . , n, indicamos com xki a i-ésima coordenada
de xk . Assim, xk = (xk1 , xk2 , . . . , xkn ). Dar uma seqüência em
Rn equivale a dar as n seqüências de números reais
(xk1 )k∈N , . . . , (xkn )k∈N .
Diz-se que a seqüência (xk )k∈N é limitada quando existe uma bola
em Rn que contém todos os termos xk . Isto equivale a dizer que existe
c > 0 tal que |xk | ≤ c para todo k ∈ N. Em virtude das desigualdades
que relacionam as três normas que consideramos em Rn , ser limitada é
uma propriedade da seqüência que independe de qual dessas três normas
estamos tratando.
Se a seqüência (xk ) é limitada então, para todo i = 1, . . . , n, a
seqüência (xki )k∈N das i-ésimas coordenadas de xk é também limitada,
pois |xki | ≤ |xk |. Vale também a recı́proca. Para prová-la, adotaremos
em Rn a norma do máximo. Então, se |xk1 | ≤ c1 , |xk2 | ≤ c2 , . . . , |xkn | ≤
cn para todo k ∈ N, chamando de c o maior dos números c1 , c2 , . . . , cn
teremos |xk | = max{|xk1 |, . . . , |xkn |} ≤ c para todo k ∈ N. Assim, se
cada (xki )k∈N (i = 1, . . . , n) é limitada, a seqüência (xk )k∈N é limitada.
Uma subseqüência de (xk )k∈N é a restrição desta seqüência a um
subconjunto infinito N′ = {k1 < · · · < km < . . . } ⊂ N. As notações
(xk )k∈N′ , (xkm )m∈N ou (xk1 , . . . , xkm , . . . ) são usadas para indicar uma
subseqüência.
Diz-se que o ponto a ∈ Rn é o limite da seqüência (xk ) quando,
para todo ε > 0 dado arbitrariamente, é possı́vel obter k0 ∈ N tal que
k > k0 ⇒ |xk − a| < ε. Noutras palavras: k > k0 ⇒ xk ∈ B(a; ε).
Escreve-se então lim xk = a, lim xk = a ou lim xk = a, simplesmente.
k→∞
k∈N
De acordo com esta definição, tem-se lim xk = a se, e somente se,
lim |xk − a| = 0.
Dizer que lim xk = a significa afirmar que qualquer bola de centro
a contém todos os xk com a possı́vel exceção de um número finito de
valores de k (que são 1, 2, . . . , k0 ).
Uma seqüência (xk ) em Rn diz-se convergente quando existe
a = lim xk . Da observação acima resulta que toda seqüência conver-
Seqüências em Rn
Seção 4
11
gente é limitada. É também óbvio que qualquer subseqüência de uma
seqüência convergente é também convergente e tem o mesmo limite.
Observe-se ainda que a definição de limite faz uso de uma norma,
porém as desigualdades |x|M ≤ |x| ≤ |x|S ≤ n · |x|M mostram que a
existência e o valor do limite não dependem de qual das três normas
usuais se está considerando. Este fato será empregado na demonstração
do teorema abaixo, onde no final usamos a norma do máximo.
Teorema 2.
A seqüência (xk ) em Rn converge para o ponto
a = (a1 , . . . , an ) se, e somente se, para cada i = 1, . . . , n, tem-se
lim xki = ai , isto é, cada coordenada de xk converge para a coordek→∞
nada correspondente de a.
Demonstração: Para cada i = 1, . . . , n, tem-se |xki − ai | ≤ |xk − a|,
portanto lim xk = a ⇒ lim xki = ai . Reciprocamente, se vale esta
k→∞
última igualdade então, dado ε > 0, existem k1 , . . . , kn ∈ N tais que
k > ki ⇒ |xki − ai | < ε (i = 1, . . . , n). Tomando k0 = max{k1 , . . . , kn }
e adotando em Rn a norma do máximo, vemos que k > k0 ⇒ |xk −a| < ε.
Logo lim xk = a.
Corolário 1. Se lim xk = a, lim yk = b em Rn e lim αk = α em R então
lim(xk + yk ) = a + b e lim αk xk = αa.
Tomando cada seqüência de coordenadas, o corolário resulta da propriedade correspondente em R.
Além disso, lim hxk , yk i = ha, bi, como se vê facilmente. E a desigualdade ||xk | − |a|| ≤ |xk − a| mostra ainda que se tem lim |xk | = |a|
seja qual for a norma adotada.
Teorema 3 (Bolzano-Weierstrass). Toda seqüência limitada em Rn
possui uma subseqüência convergente.
Demonstração: Seja (xk ) uma seqüência limitada em Rn . As primeiras coordenadas dos seus termos formam uma seqüência limitada
(xk1 )k∈N de números reais, a qual, pelo Teorema de Bolzano-Weierstrass
na reta (vol. 1, pág. 25), possui uma subseqüência convergente. Isto
é, existem um subconjunto infinito N1 ⊂ N e um número real a1 tais
que lim xk1 = a1 . Por sua vez, a seqüência limitada (xk2 )k∈N1 em R
k∈N1
possui uma subseqüência convergente: existem um subconjunto infinito
N2 ⊂ N1 e um número real a2 tais que lim xk2 = a2 . E assim por
k∈N2
12
Topologia do Espaço Euclidiano
Cap. 1
diante, até obtermos n conjuntos infinitos N ⊃ N1 ⊃ N2 ⊃ · · · ⊃ Nn e
números reais a1 , a2 , . . . , an tais que lim xki = ai , para i = 1, 2, . . . , n.
k∈Ni
Então pomos a = (a1 , . . . , an ) e, pelo Teorema 2, temos lim xk = a, o
k∈Nn
que prova o teorema.
Uma seqüência de pontos xk ∈ Rn chama-se uma seqüência de Cauchy quando, para todo ε > 0 dado, existe k0 ∈ N tal que
k, r > k0 ⇒ |xk − xr | < ε.
Toda seqüência de Cauchy (xk ) é limitada. Com efeito, tomando
ε = 1 na definição acima, vemos que existe um ı́ndice k0 tal que, salvo
possivelmente os pontos x1 , . . . , xk0 todos os demais termos xk pertencem à bola B(xk0 +1 ; 1). Portanto o conjunto dos termos da seqüência é
limitado.
A condição para que a seqüência (xk ) seja de Cauchy pode ser reformulada dizendo-se que lim |xk −xr | = 0, isto é, que lim |xk −xr | = 0.
k,r→∞
k,r∈N
Daı́ resulta que se N′ ⊂ N é um subconjunto infinito, ou seja, se (xr )r∈N′
é uma subseqüência de (xk ) então lim ′ |xk − xr | = 0.
k∈N, r∈N
Teorema 4 (Critério de Cauchy). Uma seqüência em Rn converge
se, e somente se, é uma seqüência de Cauchy.
Demonstração: Seja (xk ) uma seqüência de Cauchy em Rn . Sendo liSeja
mitada, ela possui uma subseqüência convergente (xr )r∈N′ .
a = lim′ xr . Temos lim′ |xr − a| = 0 e lim ′ |xk − xr | = 0, como
r∈N
r∈N
k∈N, r∈N
observamos acima. Então, de |xk − a| ≤ |xk − xr | + |xr − a| resulta
que lim |xk − a| = 0, ou seja, lim xk = a. Reciprocamente, se (xk ) é
k∈N
k→∞
convergente, com lim xk = a, então, como |xk − xr | ≤ |xk − a| + |xr − a|,
concluı́mos que lim |xk − xr | = 0, ou seja, (xk ) é de Cauchy.
k,r→∞
5
Conjuntos fechados
Diz-se que o ponto a é aderente ao conjunto X ⊂ Rn quando existe uma
seqüência de pontos xk ∈ X tais que lim xk = a.
Chama-se fecho do conjunto X ⊂ Rn ao conjunto X formado por
todos os pontos aderentes a X. Portanto a ∈ X ⇔ a = lim xk , xk ∈ X.
Dizer que a ∈ X é o mesmo que afirmar que a é aderente a X.
Um conjunto F ∈ Rn chama-se fechado quando F = F , isto é,
Seção 5
Conjuntos fechados
13
quando o limite de toda seqüência convergente de pontos de F é ainda
um ponto de F .
Todo ponto x ∈ X é aderente a X pois é limite da seqüência constante (x, x, . . . ). Assim, X ⊂ X qualquer que seja X ⊂ Rn . Também é
óbvio que X ⊂ Y ⇒ X ⊂ Y .
Exemplo 7. Se |x| = r então x não pertence à bola aberta B = B(0; r)
1
porém é aderente a ela. Com efeito, pondo xk = 1 − x para todo
k
k ∈ N, temos xk ∈ B(0; r) e lim xk = x, logo x ∈ B.
Reciprocamente, se x ∈ B então x = lim xk com |xk | < r para todo
k ∈ N, portanto |x| = lim |xk | ≤ r. Conclui-se então que x ∈ B⇔|x|≤r,
ou seja, B = B[0; r]. O mesmo argumento mostra que o fecho de toda
bola aberta B(a; r) é a bola fechada B[a; r].
O teorema abaixo resume as principais propriedades do fecho de um
conjunto.
Teorema 5. (a) O ponto a é aderente ao conjunto X ⊂ Rn se, e
somente se, toda bola de centro a contém algum ponto de X.
(b) Um conjunto F ⊂ Rn é fechado se, e somente se, seu complementar
Rn − F é aberto. Equivalentemente: A ⊂ Rn é aberto se, e somente
se, Rn − A é fechado.
(c) O fecho de qualquer conjunto X ⊂ Rn é fechado. Noutras palavras:
para todo X ⊂ Rn tem-se X = X.
Demonstração: (a) Se a é aderente a X então a = lim xk , com
xk ∈ X para todo k ∈ N. Portanto qualquer bola B(a; r) contém pontos
de X, a saber, todos os xk com k suficientemente grande. Reciprocamente, se toda bola de centro a contém pontos de X, podemos escolher,
para cada k ∈ N, um ponto xk ∈ X que esteja na bola B(a; 1/k), isto é,
|xk − a| < 1/k. Então lim xk = a, logo a é aderente a X.
(b) As seguintes afirmações são equivalentes: (1) F é fechado. (2) Se
x ∈ Rn − F então x não é aderente a F . (3) Se x ∈ Rn − F então
existe r > 0 tal que B(x; r) ⊂ Rn − F (em virtude da parte (a) acima).
(4) Rn − F é aberto. Assim, F fechado ⇔ Rn − F aberto.
Escrevendo A = Rn − F , donde F = Rn − A, esta última conclusão
lê-se assim: A é aberto se, e somente se, Rn − A é fechado.
(c) Se x ∈ Rn − X (isto é, x não é aderente a X) então, por (a),
existe uma bola B = B(x; r) que não contém pontos de X, ou seja,
14
Topologia do Espaço Euclidiano
Cap. 1
X ⊂ Rn − B. Logo X ⊂ Rn − B. Mas, pela parte (b) acima, Rn − B
é fechado; portanto X ⊂ Rn − B ou, equivalentemente, B ⊂ Rn − X.
Assim, todo ponto x ∈ Rn − X é um ponto interior, logo Rn − X é
aberto. Segue-se que X é fechado.
Alguns conjuntos X ⊂ Rn não são abertos nem fechados, como
X = B(a; r) ∪ {b}, onde |b − a| = r. Ou então X = conjunto dos
pontos de Rn com coordenadas racionais (X = Qn ).
Chama-se distância do ponto a ∈ Rn ao conjunto X ⊂ Rn ao número
d(a; X) = inf{|x − a| ; x ∈ X}.
Pela definição de ı́nfimo, para cada k ∈ N existe um ponto xk ∈ X tal
1
que d(a; X) ≤ |xk − a| < d(a, X) + , portanto lim |xk − a| = d(a; X).
k→∞
k
A seqüência (xk ) é certamente limitada, portanto possui uma subseqüência convergente. Descartando (por serem desnecessários) os termos
xk que não estejam nessa subseqüência, vemos que existe um ponto
x0 = lim xk tal que d(a, X) = |x0 − a|. Tem-se x0 ∈ X. Se o conjunto
X for fechado então x0 ∈ X. Podemos então enunciar o
Teorema 6. Seja F ⊂ Rn um conjunto fechado. Dado qualquer a ∈ Rn
existe (pelo menos um) x0 ∈ F tal que |x0 −a| ≤ |x−a| para todo x ∈ F .
Noutras palavras: Se F ⊂ Rn é fechado então, para a ∈ Rn qualquer,
a função f : F → R dada por f (x) = |x − a| assume seu valor mı́nimo
em algum ponto x0 ∈ F . Então tem-se d(a, F ) = |x0 − a|.
Se X ⊂ Y ⊂ Rn , diz-se que X é denso em Y quando X = Y . Por
exemplo, B(a; r) é denso em B[a; r] e Qn é denso em Rn .
Dizemos que a ∈ Rn é ponto de acumulação do conjunto X ⊂ Rn
quando toda bola de centro a contém algum ponto de X diferente de a.
(Noutras palavras, quando a ∈ X − {a}.) Um ponto de acumulação de
X pode pertencer a X ou não. Se a ∈ X não é ponto de acumulação de
X, diz-se que a é um ponto isolado de X. Isto significa que existe r > 0
tal que B(a; r) ∩ X = {a}. Quando todos os pontos de X são isolados,
dizemos que X é um conjunto discreto.
Exemplo 8. Todos os pontos de uma bola são pontos de acumulação. O
conjunto Zn dos pontos de Rn com coordenadas inteiras é um conjunto
discreto.
⊳
Seção 5
Conjuntos fechados
15
As demonstrações dos três teoremas seguintes são omitidas pois são
praticamente as mesmas dos seus análogos unidimensionais, provados no
volume 1 (págs. 50, 52 e 53). Basta substituir cada intervalo (a−r, a+r)
pela bola B(a; r) e considerar |x| como a norma de x.
Teorema 7. Sejam a um ponto e X um subconjunto de Rn . As seguintes
afirmações são equivalentes:
(1) a é um ponto de acumulação de X.
(2) a é limite de uma seqüência de pontos xk ∈ X − {a}.
(3) Toda bola de centro a contém uma infinidade de pontos de X.
Teorema 8. Todo subconjunto infinito limitado X ⊂ Rn admite pelo
menos um ponto de acumulação.
Teorema 9. (a) Se F1 e F2 são subconjuntos fechados de Rn então
F1 ∪ F2 é também fechado.
(b) Se (Fλ )λ∈L éTuma famı́lia arbitrária de conjuntos fechados então a
Fλ é um conjunto fechado.
interseção F =
λ∈L
Cabe aqui a observação de que (a) implica que a reunião F1 ∪ · · · ∪Fk
de um número finito de conjuntos fechados é ainda um conjunto fechado.
Entretanto isto não vale para reuniões infinitas. Com efeito, um conjunto
qualquer, fechado ou não, é a reunião dos seus pontos, que são conjuntos
fechados.
Segue-se do item (2) do Teorema 7 que o fecho do conjunto X é
formado acrescentando-lhe seus pontos de acumulação que por ventura
não pertençam a X.
Seja X ⊂ Rn . Diz-se que um subconjunto F ⊂ X é fechado em X
quando F contém todos os seus pontos aderentes que pertencem a X.
Assim, F é fechado em X se, e somente se, F = F ∩ X. F é fechado
em X quando, e somente quando, F = G ∩ X onde G ⊂ Rn é fechado.
Com efeito se F = G ∩ X com G fechado então F ⊂ G, logo
F = F ∩ X ⊂ F ∩ X ⊂ G ∩ X = F , donde F = F ∩ X e F é fechado
em X.
O conjunto F ⊂ X é fechado em X se, e somente se, X − F
(seu complementar relativamente a X) é aberto em X. Com efeito
F = G ∩ X ⇔ X − F = (Rn − G) ∩ X, onde G ⊂ Rn é fechado se, e
somente se, Rn − G é aberto.
16
Topologia do Espaço Euclidiano
Cap. 1
Analogamente, A ⊂ X é aberto em X se, e somente se, X − A é
fechado em X pois A = U ∩ X ⇔ X − A = (Rn − U ) ∩ X e U ⊂ Rn é
aberto se, e somente se, Rn − U é fechado.
6
Conjuntos compactos
Um conjunto X ⊂ Rn chama-se compacto quando é limitado e fechado.
Exemplo 9. Toda bola fechada B[a; r] é compacta e nenhuma bola
aberta é. O conjunto Zn é fechado mas não é limitado, logo não é
compacto. Toda esfera S[a; r] é compacta.
⊳
Teorema 10. As seguintes afirmações sobre o conjunto K ⊂ Rn são
equivalentes:
(1) K é compacto;
(2) Toda seqüência de pontos xk ∈ K possui uma subseqüência que
converge para um ponto de K.
Demonstração. Se K é compacto então toda seqüência de pontos
xk ∈ K é limitada, pois K é limitado. Por Bolzano-Weierstrass, uma
subseqüência (xk )k∈N′ converge para um ponto a = lim′ xk . Como K é
k∈N
fechado, tem-se a ∈ K. Logo (1) implica (2). Reciprocamente, se vale
(2) então K é limitado pois do contrário existiria, para cada k ∈ N,
um ponto xk ∈ K tal que |xk | > k. A seqüência (xk ) assim obtida não
possuiria subseqüência limitada, logo nenhuma de suas subseqüências
seria convergente. Além disso, K é fechado pois se a = lim xk com xk ∈
K para todo k ∈ N então, por (2), uma subseqüência de (xk ) convergiria
para um ponto de K. Mas toda subseqüência de (xk ) converge para a.
Logo a ∈ K. Isto mostra que (2) ⇒ (1) e completa a demonstração.
Estendendo a discussão da seção 5, dados os conjuntos X, Y ⊂ Rn ,
podemos definir a distância entre eles pondo
d(X, Y ) = inf{|x − y|; x ∈ X, y ∈ Y },
cabendo-nos agora indagar se, supondo X e Y fechados, existem x0 ∈ X
e y0 ∈ Y tais que d(X, Y ) = |x0 − y0 |. Nem sempre. Com efeito,
tomando em R2 o conjunto X como sendo o eixo das abcissas, isto é,
X = {(x, 0); x ∈ R} e Y = {(x, 1/x); x > 0}, ou seja, Y = ramo positivo
da hipérbole y = 1/x, vemos que X e Y são subconjuntos fechados
Seção 6
Conjuntos compactos
17
disjuntos em R2 tais que d(X, Y ) = 0. Entretanto, vale o seguinte
resultado, que contém o Teorema 6 como caso particular:
Teorema 11. Sejam K ⊂ Rn compacto e F ⊂ Rn fechado. Existem
x0 ∈ K e y0 ∈ F tais que |x0 − y0 | ≤ |x − y| para quaisquer x ∈ K e
y ∈ F.
Demonstração. Da definição de ı́nfimo segue-se que existem seqüências
de pontos xk ∈ K e yk ∈ F tais que d(K, F ) = lim |xk − yk |. Passando
a uma subseqüência, se necessário, a compacidade de K nos permite
admitir que lim xk = x0 ∈ K. Além disso, a seqüência (yk ) é limitada
pois |yk | ≤ |yk − xk | + |xk |, onde |yk − xk | é limitada por ser convergente
e |xk | é limitada pois xk ∈ K. Logo, passando novamente a uma subseqüência, se necessário, podemos admitir que lim yk = y0 , com y0 ∈ F
pois F é fechado. Então |x0 − y0 | = lim |xk − yk | = d(K, F ) ≤ |x − y|
para quaisquer x ∈ K e y ∈ F .
Corolário 2. Sejam K ⊂ U ⊂ Rn , onde K é compacto e U é aberto.
Existe ε > 0 tal que toda bola B(x; ε), de raio ε e centro num ponto
x ∈ K, está contida em U .
Com efeito, sejam x0 ∈ K e y0 ∈ F = Rn − U tais que |x0 − y0 | ≤
|x − y| para quaisquer x ∈ K e y ∈ F . Ponhamos ε = |x0 − y0 |. Como
K ⊂ U , vemos que K ∩ F = ∅, portanto x0 6= y0 e daı́ ε > 0. Assim, se
x∈K ey∈
/ U , tem-se |x − y| ≥ ε. Noutras palavras, se x ∈ K então
B(x; ε) ⊂ U .
Se F1 ⊃ F2 ⊃ · · · ⊃ Fk ⊃ . . . é uma seqüência decrescente de
∞
T
Fk = ∅. Isto ocorre,
fechados não-vazios em Rn , pode ocorrer que
k=1
por exemplo, quando tomamos Fk = [k, +∞) em R. O teorema abaixo
mostra que isto não acontece quando um dos Fk é limitado (portanto
todos os seguintes são).
Teorema 12 (Cantor). Seja K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . . uma
seqüência decrescente de compactos não-vazios em Rn . Existe pelo menos um ponto a ∈ Rn que pertence a todos os Kk . Noutros termos:
∞
T
Kk6= ∅.
k=1
Demonstração. Para cada k ∈ N, escolhamos um ponto xk ∈ Kk . A
seqüência (xk ) é limitada, logo possui uma subseqüência (xr )r∈N′ , que
18
Topologia do Espaço Euclidiano
Cap. 1
converge para a = lim′ xr . Mostremos que a ∈ Kk para todo k ∈ N.
r∈N
De fato, dado k, temos Kr ⊂ Kk sempre que r ∈ N′ e r > k. Assim,
r ∈ N′ , r > k ⇒ xr ∈ Kk . Segue-se que a = lim′ xr pertence ao
r∈N
conjunto fechado Kk .
Uma propriedade fundamental dos conjuntos compactos é o fato de
que toda cobertura aberta de um compacto possui uma subcobertura
finita. Vejamos isto.
Uma cobertura do conjunto X ⊂SRn é uma famı́lia (Cλ )λ∈L de subCλ . Isto significa que para cada
conjuntos Cλ ⊂ Rn tais que X ⊂
λ∈L
x ∈ X existe um λ ∈ L tal que x ∈ Cλ .
Uma subcobertura
é uma subfamı́lia (Cλ )λ∈L′ , L′ ⊂ L, tal que ainda
S
Cλ .
se tem X ⊂
λ∈L′
Diz-se que a cobertura S ⊂ ∪Cλ é aberta quando os Cλ forem todos
abertos, ou finita quando L é um conjunto finito.
Teorema 13 (Borel-Lebesgue). Toda cobertura aberta K ⊂ ∪Aλ
de um compacto K ⊂ Rn admite uma subcobertura finita K ⊂ Aλ1
∪ · · · ∪ Aλk .
Inicialmente, prepararemos o terreno para estabelecer um lema que
torna a demonstração do teorema quase imediata.
Seja X ⊂ Rn um conjunto limitado. O diâmetro de X é o número
diam.X = sup{|x − y|; x, y ∈ X}.
Segue-se imediatamente desta definição que se diam.X = d e x ∈ X
então X ⊂ B[x; d].
Dado α > 0, um cubo de aresta α é um produto cartesiano
n
Q
[ai , ai +α] de n intervalos de comprimento α. Se x = (x1 , . . . , xn )
C=
i=1
e y = (y1 , . . . , yn ) pertencem p
a C então, para cada i = 1, . . . , n, tem-se
√
|xi − yi | ≤ α, logo |x − y| = Σ(xi − yi )2 ≤ α n. Tomando xi = ai e
√
√
yi = ai + α temos |x − y| = α n, portanto α n é o diâmetro do cubo
de aresta α em Rn .
S
[mα, (m + 1)α] da reta em intervalos
A decomposição R =
m∈Z
adjacentes de comprimento α determina uma decomposição de Rn como
reunião de cubos adjacentes de aresta α.
A saber, para cada
Seção 7
Aplicações contı́nuas
19
n
Q
[mi α, (mi + 1)α] e temos
m = (m1 , . . . , mn ) ∈ Zn , pomos Cm =
i=1
S
S
(X ∩ Cm ). Se X é
Cm . Para todo X ⊂ Rn tem-se X =
Rn =
m∈Zn
m∈Zn
limitado, há apenas um número finito de interseções X ∩ Cm não-vazias,
logo podemos escrever
X = X1 ∪ · · · ∪ Xk
√
onde cada Xi é da forma X ∩ Cm , logo tem diâmetro ≤ α n. Se X for
compacto então cada Xi é compacto. Isto prova o
Lema 1. Seja K ⊂ Rn compacto. Para todo ε > 0 existe uma decomposição K = K1 ∪ · · · ∪ Kk onde cada Ki é compacto e tem diâmetro
≤ ε.
Demonstração do Teorema de Borel-Lebesgue. Seja K ⊂ Rn
compacto. Suponhamos, por absurdo, que K ⊂ ∪Aλ seja uma cobertura
aberta que não admite subcobertura finita. Exprimamos K como reunião finita de compactos, todos com diâmetro < 1. Pelo menos um deles,
que chamaremos K1 , é tal que K1 ⊂ ∪Aλ não admite subcobertura
finita. Escrevendo K1 como reunião finita de compactos de diâmetro
< 1/2, vemos que pelo menos um deles, digamos K2 , não pode ser
coberto por um número finito de Aλ ’s. Prosseguindo assim, obtemos
uma seqüência decrescente de compactos K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . .
com diam Kk < 1/k e tal que nenhum deles está contido numa reunião
finita de Aλ ’s. Em particular, todos os Kk são não-vazios. Pelo Teorema
∞
T
Kk . Para algum λ, tem-se a ∈ Aλ . Como Aλ é aberto,
12, existe a ∈
k=1
tem-se B(a; 1/k) ⊂ Aλ para algum k. Sendo a ∈ Kk e diam Kk <
1/k, concluı́mos que Kk ⊂ B(a; 1/k), donde Kk ⊂ Aλ , o que é uma
contradição.
7
Aplicações contı́nuas
Uma aplicação f : X → Rn , definida no conjunto X ⊂ Rm , associa a
cada ponto x ∈ X sua imagem f (x) = (f1 (x), . . . , fn (x)). As funções
reais f1 , . . . , fn : X → R, assim definidas, chamam-se as funções-coordenada de f . Escreve-se então f = (f1 , . . . , fn ).
20
Topologia do Espaço Euclidiano
Cap. 1
Se Y ⊂ Rn é tal que f (X) ⊂ Y podemos (com um abuso de notação
que é irrelevante em nosso contexto) escrever f : X → Y em vez de
f : X → Rn .
Diz-se que f é contı́nua no ponto a ∈ X quando, para cada ε > 0
arbitrariamente dado, pode-se obter δ > 0 tal que
x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| < ε.
Noutros termos: para cada bola B(f (a); ε) dada, existe uma bola B(a; δ)
tal que f (B(a; δ) ∩ X) ⊂ B(f (a); ε).
A continuidade de f no ponto a independe das normas que se utilizem
em Rm e Rn .
Diremos que f : X → Rn é uma aplicação contı́nua no conjunto
X ⊂ Rm quando f é contı́nua em todos os pontos a ∈ X.
Teorema 14. Sejam X ⊂ Rm , Y ⊂ Rn , f : X → Rn com f (X) ⊂ Y
e g : Y → Rp . Se f é contı́nua no ponto a ∈ X e g é contı́nua no ponto
f (a) então g ◦ f : X → Rp é contı́nua no ponto a. Ou seja: a composta
de duas aplicações contı́nuas é contı́nua.
Demonstração. Seja dado ε > 0. A continuidade de g no ponto
f (a) assegura a existência de λ > 0 tal que y ∈ Y , |y − f (a)| < λ ⇒
|g(y) − g(f (a))| < ε. Por sua vez, dado λ > 0, a continuidade de f no
ponto a fornece δ > 0 tal que x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| <
λ ⇒ |g(f (x)) − g(f (a))| < ε, logo g ◦ f é contı́nua no ponto a.
Teorema 15. (a) A aplicação f : X → Rn é contı́nua no ponto a ∈ X
se, e somente se, para toda seqüência de pontos xk ∈ X com lim xk = a,
tem-se lim f (xk ) = f (a).
(b) A aplicação f : X → Rn é contı́nua no ponto a ∈ X se, e somente se,
suas funções-coordenada f1 , . . . , fn : X → R são contı́nuas nesse ponto.
Demonstração. (a) Seja f : X → Rn contı́nua no ponto a. Dada
a seqüência de pontos xk ∈ X com lim xk = a, para todo ε > 0 existe
δ > 0 tal que f (B(a; δ)) ⊂ B(f (a); ε). Correspondente a δ, existe k0 ∈ N
tal que k > k0 ⇒ xk ∈ B(a; δ), logo k > k0 ⇒ f (xk ) ∈ B(f (a); ε).
Isto mostra que lim f (xk ) = f (a). Reciprocamente, suponhamos, por
absurdo, que lim xk = a implica lim f (xk ) = f (a), porém f seja descontı́nua no ponto a. Então existe ε > 0 com a seguinte propriedade:
para todo k ∈ N, podemos encontrar xk ∈ X com |xk − a| < 1/k e
Seção 7
Aplicações contı́nuas
21
|f (xk ) − f (a)| ≥ ε. Assim, temos lim xk = a mas não temos lim f (xk ) =
f (a), uma contradição.
(b) Isto decorre imediatamente do Teorema 2 junto com a parte (a)
que acabamos de provar.
Teorema 16. Seja X ⊂ Rm . Se as aplicações f, g : X → Rn e
α : X → R são contı́nuas no ponto a ∈ X então são também contı́nuas
nesse ponto as aplicações f + g : X → Rn , hf, gi : X → R, |f | : X → R
e αf : X → Rn , definidas por (f + g)(x) = f (x) + g(x), hf, gi(x) =
hf (x), g(x)i, |f |(x) = |f (x)| e (αf )(x) = α(x) · f (x).
Demonstração. Isto resulta do Teorema 15(a) juntamente com o Corolário do Teorema 2.
Teorema 17. A imagem f (K) do conjunto compacto K ⊂ X pela
aplicação contı́nua f : X → Rn é também um conjunto compacto.
Demonstração. Seja (yk ) uma seqüência de pontos em f (K). Para
cada k ∈ N existe xk ∈ K tal que f (xk ) = yk . Como K é compacto,
uma subseqüência (xk )k∈N′ converge para um ponto a ∈ K. Sendo f
contı́nua nesse ponto a, de lim′ xk = a resulta, pelo Teorema 15, que
k∈N
lim′ f (xk ) = f (a). Logo toda seqüência de pontos yk = f (xk ) ∈ f (K)
k∈N
possui uma subseqüência (yk )k∈N′ convergente para um ponto f (a) ∈
f (K). Noutras palavras: f (K) é compacto.
Corolário 3. (Weierstrass.) Seja K ⊂ Rm compacto. Se f : K → R
é uma função real contı́nua, então existem x0 , x1 ∈ K tais que f (x0 ) ≤
f (x) ≤ f (x1 ) para todo x ∈ K.
Noutas palavras: toda função real contı́nua num conjunto compacto
K atinge seus valores mı́nimo e máximo em pontos de K.
Para provar o Teorema de Weierstrass basta observar que, sendo
f (K) ⊂ R compacto, os números y0 = inf f (K) e y1 = sup f (K) pertencem a f (K), isto é, y0 = f (x0 ) e y1 = f (x1 ), com x0 , x1 ∈ K.
Teorema 18. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e
somente se, a imagem inversa f −1 (A) de todo conjunto aberto A ⊂ Rn
é um subconjunto aberto em X.
Demonstração. Seja f contı́nua. Se A ⊂ Rn é aberto então, para todo
x ∈ f −1 (A) existe ε > 0 tal que B(f (x); ε) ⊂ A. Pela continuidade de f ,
x é centro de uma bola aberta Bx tal que f (Bx ∩X)⊂B(f (x); ε)⊂A, logo
22
Topologia do Espaço Euclidiano
Cap. 1
x ∈ Bx ∩ X ⊂ f −1 (A). Isto valendo para todo x ∈ f −1 (A), resulta que
f −1 (A) ⊂ U ∩X ⊂ f −1 (A), logo f −1 (A) = U ∩X, onde U é a reunião das
bolas abertas Bx , x ∈ f −1 (A). Reciprocamente, suponhamos que, para
todo aberto A ⊂ Rn , f −1 (A) seja aberto em X, isto é, f −1 (A) = U ∩ X
com U aberto em Rm . Então, dados x ∈ X e ε > 0, tomamos A =
B(f (x); ε) e obtemos U ⊂ Rm aberto tal que U ∩ X = f −1 (B(f (x); ε)).
Certamente x ∈ U , logo existe δ > 0 tal que B(x; δ) ⊂ U e assim
f (B(x; δ) ∩ X) ⊂ B(f (x); ε). Portanto, f é contı́nua em todos os pontos
x ∈ X.
Teorema 19. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e
somente se, a imagem inversa de todo conjunto fechado F ⊂ Rn é um
subconjunto f −1 (F ) fechado em X.
Demonstração. Isto resulta do Teorema 18 se observarmos que, pondo
A = Rn − F , então A é aberto em Rn e que f −1 (F ) = X − f −1 (A) é
fechado em X se, e somente se, f −1 (A) é aberto em X.
Observação. Dada f : X → Rn , se f (X) ⊂ Y ⊂ Rn podemos considerar f como uma aplicação de X em Y e escrever f : X → Y . Se A
e F são subconjuntos de Rn então f −1 (A) = f −1 (A ∩ Y ) e f −1 (F ) =
f −1 (F ∩ Y ). Logo podemos enunciar os Teoremas 18 e 19 assim: A
aplicação f : X → Y é contı́nua se, e somente se, a imagem inversa por
f de todo subconjunto aberto (respect. fechado) em Y é um subconjunto
aberto (respect. fechado) em X.
Corolário 4. Seja X ⊂ Rm aberto (respect. fechado). A fim de que
f : X → Rn seja contı́nua é necessário e suficiente que a imagem inversa
por f de todo subconjunto aberto (respect. fechado) em Rn seja um
conjunto aberto (respect. fechado) em Rm .
Corolário 5. Sejam f, g : X → R contı́nuas no conjunto X ⊂ Rm .
O conjunto A = {x ∈ X; f (x) < g(x)} é aberto em X enquanto os
conjuntos F = {x ∈ X; f (x) ≤ g(x)} e G = {x ∈ X; f (x) = g(x)} são
fechados em X.
Em particular, tomando g constante, vemos que o conjunto dos pontos x ∈ X tais que f (x) < c é aberto em X enquanto as soluções x ∈ X
da inequação f (x) ≤ c ou da equação f (x) = c formam conjuntos fechados em X.
Seção 8
Continuidade uniforme
23
Teorema 20. Sejam ϕ : K → Rn contı́nua no compacto K ⊂ Rm e
L = ϕ(K) a imagem (compacta) de ϕ. A fim de que uma aplicação
f : L → Rp seja contı́nua, é necessário e suficiente que a composta
f ◦ ϕ : K → Rp seja contı́nua.
K
f ◦ϕ
Rp
ϕ
f
L
Demonstração. Se f é contı́nua então f ◦ ϕ é contı́nua, pelo Teorema 14. Reciprocamente, supondo f ◦ ϕ contı́nua então, para todo conjunto fechado F ⊂ Rp , a imagem inversa (f ◦ ϕ)−1 (F ) = ϕ−1 [f −1 (F )]
é um subconjunto fechado de K, logo é compacto. Então, pelo Teorema 17, f −1 (F ) = ϕ[ϕ−1 (f −1 (F ))] é compacto, logo fechado em Rm .
Segue-se do Corolário 4 que f é contı́nua.
Observação. Quando se tem uma aplicação arbitrária ϕ : K → L entre
dois conjuntos, para todo Z ⊂ L vale a inclusão ϕ[ϕ−1 (Z)] ⊂ Z. Entretanto, quando ϕ : K → L é sobrejetiva, como no caso acima, tem-se
ϕ[ϕ−1 (Z)] = Z.
Exemplo 10. Tomemos K = [0, 2π] ⊂ R, L = S 1 = {(x, y) ∈ R2 ; x2 +
y 2 = 1} e ϕ : [0, 2π] → R2 dada por ϕ(t) = (cos t, sen t). Então [0, 2π] e
S 1 são compactos e ϕ : [0, 2π] → S 1 é contı́nua e sobrejetiva. Seja agora
g : [0, 2π] → Rn uma aplicação contı́nua tal que g(0) = g(2π). A partir
de g, podemos definir f : S 1 → Rn , pondo f (cos t, sen t) = g(t). Como
g(0) = g(2π), f está bem definida. Além disso, f ◦ ϕ = g é contı́nua.
Segue-se do Teorema 20 que f é contı́nua. Isto se exprime dizendo que
“para definir uma aplicação contı́nua no cı́rculo S 1 basta defini-la no
intervalo [0, 2π] de modo que assuma valores iguais nos extremos 0 e
2π.”
⊳
8
Continuidade uniforme
A adição e a multiplicação de números reais são funções contı́nuas
s, p : R2 → R, definidas por s(x, y) = x + y e p(x, y) = x · y. Exa-
24
Topologia do Espaço Euclidiano
Cap. 1
minemos a continuidade de cada uma delas no ponto (a, b) ∈ R2 . Para
isso, usaremos em R2 a norma do máximo, segundo a qual tem-se (x, y) ∈
B((a, b); δ) se, e somente se, |x − a| < δ e |y − b| < δ.
Comecemos com a adição: dado ε > 0, tomemos δ = ε/2. Se |x−a| <
ε/2 e |y − b| < ε/2, isto é, (x, y) ∈ B((a, b), δ), então |s(x, y) − s(a, b)| =
|x + y − (a + b)| ≤ |x − a| + |y − b| < ε.
Em seguida, a multiplicação: dado ε > 0, temos xy − ab = (x − a)
(y − b) + (x − a)b + a(y − b), logo, tomando δ > 0 menor do que cada um
p
ε
ε
e
veremos que se |x − a| < δ
dos números ε/3,
3(|a| + 1) 3(|b| + 1)
e |y − b| < δ isto é, (x, y) ∈ B((a, b), δ), então
|p(x, y) − p(a, b)| = |xy − ab| ≤ |x − a| |y − b| + |x − a| |b| + |a| |y − b| ≤
ε ε ε
≤ + + = ε.
3 3 3
Note-se a diferença: no caso da adição, δ depende apenas de ε, mas
não do ponto (a, b) onde a continuidade é testada. Já na multiplicação,
δ depende não apenas de ε mas também de (a, b). Se um dos números
a ou b aumentar, para o mesmo ε deve-se tomar δ cada vez menor. Isto
significa que a adição é uniformemente contı́nua mas a multiplicação não
é. Segue-se a definição pertinente:
Uma aplicação f : X → Rn diz-se uniformente contı́nua no conjunto
X ⊂ Rm quando, para todo ε > 0, for possı́vel obter δ > 0 tal que
|x − y| < δ ⇒ |f (x) − f (y)| < ε, sejam quais forem x, y ∈ X.
Teorema 21. A fim de que f : X → Rn seja uniformente contı́nua no
conjunto X ⊂ Rm é necessário e suficiente que, para todo par de seqüências de pontos xk , yk ∈ X com lim |xk − yk | = 0, se tenha lim |f (xk ) −
f (yk )| = 0.
Teorema 22. Toda aplicação contı́nua f : X → Rn , definida num conjunto compacto X ⊂ Rm , é uniformemente contı́nua.
As demonstrações dos Teoremas 21 e 22 são exatamente as mesmas
que se encontram nas páginas 83 e 84 do volume 1.
Exemplo 11. Uma aplicação f : X → Rn , definida no conjunto X ⊂
Rm , chama-se lipschitziana quando existe c > 0 tal que |f (x) − f (y)| ≤
c|x − y| para quaisquer x, y ∈ X. O número c é chamado uma constante de Lipschitz de f . Toda aplicação lipschitziana é uniformemente
Seção 9
Homeomorfismos
25
contı́nua: dado ε > 0, basta tomar δ = ε/c. A função f : [0, 1] → R, defi√
nida por f (x) = x, é uniformemente contı́nua mas não é lipschitziana.
Basta ver que
√
√
1√
| x − y| = √x+
|x − y|
y
√
√
e que, com x, y ∈ [0, 1] pode-se tornar x + y tão pequeno, (logo
√
√
⊳
( x + y)−1 tão grande) quanto se queira.
Exemplo 12. Toda transformação linear A : Rm → Rn é contı́nua pois,
para cada i = 1, 2, . . . , n, a i-ésima função-coordenada de A é a função
contı́nua (x1 , . . . , xm ) 7→ ai1 x1 + · · · + aim xm , onde [aij ] é a matriz de
A. A esfera unitária S m−1 = {x ∈ Rm ; |x| = 1} é compacta. Logo A é
limitada em S m−1 . O número
|A| = sup{|A · x|; x ∈ S m−1 }
chama-se a norma da transformação A. Para todo vetor v ∈ Rm , tem-se
v
|A · v| ≤ |A| · |v|. Isto é óbvio quando v = 0. Se v 6= 0 então
∈ S m−1
|v|
logo
v
|A · v| = |v| · |A
| ≤ |A| |v|.
|v|
Para x, y ∈ Rm quaisquer, tem-se |A · x − A · y| = |A(x − y)| ≤ |A| ·
|x − y|. Logo a transformação linear A é uma aplicação lipschitziana,
com constante de Lipschitz |A|.
⊳
Exemplo 13. Dado A ⊂ Rn não-vazio, seja f : Rn → R definida por
f (x) = d(x, A). Afirmamos que |d(x, A) − d(y, A)| ≤ |x − y| para
quaisquer x, y ∈ Rn . Logo f é lipschitziana, com constante c = 1,
donde uniformemente contı́nua. Para provar nossa afirmação, observemos que, dados x, y ∈ Rn , existem ā, b̄ ∈ A tais que d(x, A) = |x − ā| e
d(y, A) = |y − b̄|. (Vide seção 5.)
Temos b̄ = lim yk , com yk ∈ A. Como |x − ā| ≤ |x − yk | para todo
k ∈ N, segue-se que |x−ā| ≤ |x−b̄|. Sem perda de generalidade, podemos
supor que d(x, A) ≥ d(y, A), logo |d(x, A)−d(y, A)| = d(x, A)−d(y, A) =
|x − ā| − |y − b̄| ≤ |x − b̄| − |y − b̄| ≤ |x − y|, como querı́amos demonstrar.
⊳
Quando |f (x) − f (y)| ≤ |x − y| para quaisquer x, y ∈ X, a aplicação
lipschitziana f : X → Rn chama-se uma contração fraca.
Se
|f (x) − f (y)| ≤ c|x − y| com 0 < c < 1, a aplicação f chama-se uma
contração, simplesmente.
26
9
Topologia do Espaço Euclidiano
Cap. 1
Homeomorfismos
Um homeomorfismo do conjunto X ⊂ Rm sobre um conjunto Y ⊂ Rn
é uma bijeção contı́nua f : X → Y cuja inversa f −1 : Y → X também é
contı́nua.
O gráfico de uma aplicação f : X → Rn , definida no conjunto X ⊂
m
R é o conjunto G = {(x, f (x)); x ∈ X} ⊂ Rm × Rn . Se f é contı́nua
então seu gráfico G é homeomorfo a seu domı́nio X. Com efeito, a
aplicação contı́nua ϕ : X → G, dada por ϕ(x) = (x, f (x)), é um homomorfismo, cujo inverso (x, f (x)) 7→ x é a restrição a G da projeção de
Rm × Rn sobre Rm .
Exemplo 14. A aplicação f : [0, 2π) → S 1 , onde f (t) = (cos t, sen t),
é uma bijeção contı́nua mas não é um homeomorfismo. Sua inversa
f −1 : S 1 → [0, 2π) aplica o compacto S 1 sobre o intervalo [0, 2π), que
não é compacto, logo é descontı́nua. Mais precisamente, f −1 é descontı́nua no ponto a = (1, 0) = f (0) ∈ S 1 . Com efeito, se pusermos, para
cada k ∈ N, tk = (1 − 1/k) · 2π e zk = (cos tk , sen tk ), teremos lim zk = a
mas lim f −1 (zk )= lim tk =2π, logo não vale lim f −1 (zk )=f −1 (a)=0.
⊳
Exemplo 15. A bola aberta B = B(0; 1) ⊂ Rn é homeomorfa ao espaço
Rn . De fato, as aplicações f : Rn → B e g : B → Rn , definidas por
x
y
f (x) =
e g(y) =
1 + |x|
1 − |y|
são contı́nuas e, como se verifica sem dificuldade, vale g(f (x)) = x,
f (g(y)) = y, para quaisquer x ∈ Rn e y ∈ B, logo g = f −1 .
⊳
Exemplo 16. Sejam S n = {x ∈ Rn+1 ; hx, xi = 1} a esfera unitária
n-dimensional e N = (0, . . . , 0, 1) ∈ S n seu pólo norte. A projeção
estereográfica ξ : S n − {N } → Rn é um importante exemplo de homeomorfismo. Para todo x ∈ S n − {N }, ξ(x) é o ponto em que a semi-reta
⇀
N x corta o hiperplano xn+1 = 0, o qual identificamos com Rn . Os pontos
⇀
da semi-reta N x são da forma N +t(x−N ) com t > 0. Um tal ponto está
no hiperplano Rn quando sua última coordenada 1 + t(xn+1 − 1) é igual
a zero, ou seja, quando t = 1/(1 − xn+1 ). Logo ξ(x) = x′ /(1 − xn+1 ),
onde x′ = (x1 , . . . , xn ) para x = (x1 , . . . , xn , xn+1 ). Isto mostra que
ξ : S n − {N } → Rn é contı́nua. Seja agora ϕ : Rn → S n − {N } dada
por ϕ(y) = x, onde x′ = 2y/(|y|2 + 1) e xn+1 = (|y|2 − 1)/(|y|2 + 1).
Uma verificação simples mostra que ξ(ϕ(y)) = y para todo y ∈ Rn e
Seção 10
Conjuntos conexos
27
ϕ(ξ(x)) = x para todo x ∈ S n . Portanto a aplicação contı́nua ϕ : Rn →
S n − {N } é a inversa de ξ e conseqüentemente, ξ e um homeomorfismo.
⊳
Teorema 23. Se K ⊂ Rm é compacto então toda aplicação contı́nua
injetiva f : K → Rn é um homeomorfismo sobre sua imagem (compacta)
L = f (K).
Demonstração. Chamemos de g : L → K a inversa de f . Como L ⊂
Rn é compacto, portanto fechado, pelo Teorema 19, g é contı́nua se,
e somente se, para todo conjunto fechado F ⊂ Rm , a imagem inversa
g −1 (F ) = g −1 (F ∩ K) é um fechado em Rn . Mas F ∩ K é compacto,
logo g −1 (F ∩ K) = f (F ∩ K) é compacto (em virtude do Teorema 17)
logo é fechado.
O teorema acima resulta do Teorema 20, com f em vez de ϕ e f −1
no lugar de f . Ele mostra por que foi possı́vel dar o Exemplo 14: o
intervalo [0, 2π) não é compacto.
10
Conjuntos conexos
Uma cisão do conjunto X ⊂ Rn é uma decomposição X = A ∪ B onde
A∩B = A∩B = ∅, isto é, nenhum ponto de A é aderente a B e nenhum
ponto de B é aderente a A.
Um exemplo óbvio é a cisão trivial X = X ∪ ∅. Já R − {0} =
(−∞, 0) ∪ (0, +∞) é uma cisão não-trivial. Por outro lado, pondo A =
(−∞, 0] e B = (0, +∞) a decomposição R = A ∪ B não é uma cisão pois
0 ∈ A ∩ B.
Se X = A ∪ B é uma cisão então os pontos de X que são aderentes a
A, não pertencendo a B, estão em A, logo A = A ∩ X. Analogamente,
B = B ∩ X. Assim, A e B são ambos fechados em X. Como A = X − B
e B = X − A, segue-se que A e B são também abertos em X.
Reciprocamente, se A ⊂ X é aberto e fechado em X então, pondo
B = X −A, a decomposição X = A∪B é uma cisão. Com efeito, nenhum
ponto de X aderente a A pode pertencer a B pois A é fechado em X
e, da mesma forma, nenhum ponto de X aderente a B pode pertencer
a A.
Em particular, se X ⊂ Rn é aberto, uma cisão X = A ∪ B é uma
expressão de X como reunião de dois abertos disjuntos. E se X ⊂ Rn
é fechado, toda cisão X = A ∪ B é a expressão de X como reunião de
28
Topologia do Espaço Euclidiano
Cap. 1
dois conjuntos fechados disjuntos. Mais particularmente ainda, se X é
compacto então A e B são compactos.
Exemplo 17. Escrevendo as linhas de uma matriz, uma após a outra,
2
numa só lista, identificaremos o espaço Rn com o conjunto das matrizes
quadradas n × n. Sejam Gn , G+ e G− respectivamente os conjuntos das
matrizes com determinante 6= 0, das matrizes com determinante > 0
e com determinante < 0. A igualdade Gn = G+ ∪ G− é uma cisão,
pois uma seqüência de matrizes com determinantes positivos não pode
convergir para uma matriz de determinante negativo. Assim G+ ∩ G− =
∅. Analogamente, G+ ∩ G− = ∅.
Se X = A ∪ B é uma cisão então, para todo Z ⊂ X, Z = (A ∩ Z) ∪
(B ∩ Z) é uma cisão.
Um conjunto X ⊂ Rn chama-se conexo quando só admite a cisão
trivial. Caso contrário, diz-se que X é desconexo.
Como vimos no Exemplo 17 acima, o conjunto ds matrizes n×n com
determinante 6= 0 é desconexo.
Na página 51 do vol. 1 foi provado que todo intervalo da reta R (seja
ele aberto ou não, limitado ou não) é conexo.
Vale a recı́proca:
Teorema 24. Os únicos subconjuntos conexos de R são os intervalos.
Demonstração. Suponha que X ⊂ R não seja um intervalo. Então
existem a < c < b tais que a, b ∈ X e c ∈
/ X. Neste caso, pondo
A = {x ∈ X; x < c} e B = {x ∈ X; x > c}, vemos que X = A ∪ B é
uma cisão. Como a ∈ A e b ∈ B, esta cisão não é trivial. Portanto X é
desconexo.
Teorema 25. (a) A imagem do conjunto conexo X ⊂ Rm por uma
aplicação contı́nua f : X → Rn é um conjunto conexo.
S
Xλ de uma famı́lia qualquer de conjuntos conexos
(b) A reunião X =
λ∈L
Xλ ⊂ Rn que têm um ponto a em comum é um conjunto conexo.
(c) O produto cartesiano X × Y ⊂ Rm+n dos conjuntos X ⊂ Rm e
Y ⊂ Rn é um conjunto conexo se, e somente se, X e Y são conexos.
(d) Se X ⊂ Rn é conexo e X ⊂ Y ⊂ X então Y é conexo. Em particular,
o fecho de um conjunto conexo é conexo.
Demonstração. (a) Se f (X) = A ∪ B é uma cisão da imagem de X
então A e B são ambos abertos e fechados em f (X), além de disjuntos.
Seção 10
Conjuntos conexos
29
Logo f −1 (A) e f −1 (B) são também disjuntos, abertos e fechados em X,
portanto X = f −1 (A) ∪ f −1 (B) é uma cisão, a qual é trivial pois X
é conexo. Mas A = f (f −1 (A)) e B = f (f −1 (B)) porque A e B estão
contidos em f (X). Assim, A ou B é vazio e daı́ a cisão f (X) = A ∪ B
é trivial. Então f (X) é conexo.
(b) Seja a tal que a ∈ Xλ para todo λ ∈ L. Se X = A ∪ B é uma cisão
então o ponto a pertence a um dos conjuntos, A ou B. Digamos que
a ∈ A. Para todo λ ∈ L, Xλ = (A ∩ Xλ ) ∪ (B ∩ Xλ ) é uma cisão, a
qual é trivial pois XλSé conexo. Como a ∈ A ∩ Xλ , segue-se que B ∩ Xλ
é vazio. Logo B = (B ∩ Xλ ) é vazio e a cisão X = A ∪ B é trivial.
λ
Portanto X é conexo.
(c) Se X × Y é conexo então X e Y são conexos porque são as imagens
de X × Y pelas projeções p : X × Y → X, p(x, y) = x e q : X × Y → Y ,
q(x, y) = y, as quais são contı́nuas. Reciprocamente, se X e Y são
conexos, tomamos um ponto c = (a, b) ∈ X × Y . Para cada z = (x, y) ∈
X ×Y o conjunto Cz = (X ×{b})∪({x})×Y ) é conexo pois é reunião dos
conjuntos conexos X ×{b} e {x}×Y (homeomorfos respectivamente a X
e Y ) com o ponto (x, b) em comum. S
Além disso, também c = (a, b) ∈ Cz
para todo z ∈ X × Y e X × Y = Cz logo, pelo item (b), X × Y é
z
conexo.
(d) Seja Y = A ∪ B uma cisão. Então X = (A ∩ X) ∪ (B ∩ X) também é
uma cisão. Como X é conexo, tem-se, digamos, A ∩ X = ∅. De X ⊂ Y
e Y = A ∪ B resulta então que X ⊂ B, logo X ⊂ B e daı́ Y ⊂ B, pois
Y ⊂ X. Assim, tem-se A = A ∩ Y ⊂ A ∩ B = ∅, ou seja, A = ∅.
Portanto toda cisão Y = A ∪ B é trivial e Y é conexo.
Corolário 6. Se X1 , . . . , Xk são conexos então X1 × · · · × Xk é conexo.
Em particular, Rn = R × · · · × R é conexo.
Com efeito, X1 × X2 × X3 = (X1 × X2 ) × X3 e assim por diante.
Corolário 7. Se X ⊂ Rn é conexo então a imagem de toda função real
contı́nua f : X → R é um intervalo.
Com efeito, pelo Teorema 24 todo subconjunto conexo de R é um
intervalo.
Este corolário é conhecido como o Teorema do Valor Intermediário
pois pode também ser enunciado assim: “Sejam X ⊂ Rn conexo e
f : X → R contı́nua. Se a, b ∈ X são tais que f (a) < f (b) então,
30
Topologia do Espaço Euclidiano
Cap. 1
para cada d com f (a) < d < f (b), existe c ∈ X tal que f (c) = d.”
Corolário 8 (“Teorema da Alfândega”). Seja X ⊂ Rn um conjunto
arbitrário. Se um conjunto conexo C ⊂ Rn contém um ponto a ∈ X e
um ponto b ∈
/ X então C contém um ponto c ∈ fr.X.
Com efeito, a função contı́nua f : C → R, definida por f (x) =
d(x, X) − d(x, Rn − X), é tal que f (a) ≤ 0 e f (b) ≥ 0. Logo, pelo
Teorema do Valor Intermediário, deve existir c ∈ C tal que f (c) = 0,
isto é, d(c, X) = d(c, Rn − X). Como c ∈ X ou c ∈ Rn − X, um desses
dois números é zero, logo ambos o são e daı́ c ∈ fr.X.
Como Rn é conexo, resulta do corolário acima que se o conjunto
X ⊂ Rn não é vazio nem coincide com Rn então a fronteira de X não é
vazia. De fato, se X 6= ∅ e X 6= Rn então o conjunto conexo Rn contém
algum ponto de X e algum ponto que não pertence a X, logo contém
algum ponto da fronteira de X.
Exemplo 18. Para todo n ∈ N, a esfera S n é um conjunto conexo. Com
efeito, retirando o pólo norte N = (0, . . . , 0, 1), vemos que X = S n −{N }
é conexo por ser homeomorfo a Rn (cfr. Exemplo 16). Como S n = X,
segue-se do item (d) que a esfera S n é conexa.
Exemplo 19. Uma conseqüência do Teorema do Valor Intermediário
é que para toda função real contı́nua f : S 1 → R existe (pelo menos)
um ponto z ∈ S 1 tal que f (z) = f (−z). Para ver isto, consideremos
a função contı́nua ϕ : S 1 → R, dada por ϕ(z) = f (z) − f (−z). Vale
ϕ(−z) = −ϕ(z). Assim, ou ϕ(z) = 0 para todo z (assunto encerrado)
ou existe a ∈ S 1 com ϕ(−a) < 0 < ϕ(a), logo ϕ(z) = 0 para algum
z ∈ S 1 , pois S 1 é conexo.
⊳
Existe uma noção bem geométrica que fornece uma condição suficiente para a conexidade de um conjunto, que é a conexidade por caminhos.
Um caminho num conjunto X ⊂ Rn é uma aplicação contı́nua
f : I → X, definida num intervalo I.
Por exemplo, dados x, y ∈ Rn , o caminho f : [0, 1] → Rn , definido
por f (t) = (1 − t)x + ty, chama-se o caminho retilı́neo que liga x a y.
Às vezes nos referiremos a ele como o caminho [x, y].
Diremos que os pontos a, b ∈ X podem ser ligados por um caminho
em X quando existe um caminho f : I → X tal que a = f (α), b = f (β)
com α < β ∈ I.
Seção 10
Conjuntos conexos
31
Por exemplo, se X ⊂ Rn é convexo, dois pontos quaisquer
a, b ∈ X podem ser ligados por um caminho em X, a saber, o caminho retilı́neo [a, b].
Se a, b ∈ X podem ser ligados por um caminho f : I → X, então
existe um caminho ϕ : [0, 1] → X tal que ϕ(0) = a e ϕ(1) = b. Basta
pôr ϕ(t) = f ((1 − t)α + tβ), onde a = f (α) e b = f (β).
Se f, g : [0, 1] → X são caminhos em X, com f (1) = g(0), então
definimos o caminho justaposto h = f ∨g : [0, 1] → X pondo h(t) = f (2t)
se 0 ≤ t ≤ 1/2 e h(t) = g(2t − 1) se 1/2 ≤ t ≤ 1. Note que estas duas
expressões definem o mesmo valor de h(1/2). Como h|[0, 1/2] e h|[1/2, 1]
são contı́nuas, segue-se que h é contı́nua. Intuitivamente, o caminho h
percorre a trajetória de f (com velocidade dobrada) até t = 1/2 e depois,
para t ≥ 1/2, descreve (ainda com velocidade dobrada) o percurso de g.
Sejam a, b, c pontos do conjunto X ⊂ Rn . Se a, b podem ser ligados
por um caminho em X e b, c também podem ser ligados por um caminho
em X, então existe um caminho em X ligando a a c. Basta tomar
caminhos f, g : [0, 1] → X com f (0) = a, f (1) = b, g(0) = b, g(1) = c
e pôr h = f ∨ g. Então h(0) = a, h(1) = c.
Um conjunto X ⊂ Rn diz-se conexo por caminhos quando dois pontos
quaisquer a, b ∈ X podem ser ligados por um caminho em X.
Todo conjunto convexo X ⊂ Rn é conexo por caminhos. Em particular, toda bola (aberta ou fechada) no espaço euclidiano é conexa por
caminhos.
A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é conexa por caminhos. Com
efeito, dados a, b ∈ S n , se a e b não são antı́podas, isto é, se b 6= −a,
então f : [0, 1] → S n , definida por
f (t) =
(1 − t)a + tb
|(1 − t)a + tb|
é contı́nua (pois seu denominador nunca se anula), com f (0) = a,
f (1) = b. Se, porém, b = −a, tomamos um ponto c ∈ S n − {a, b},
ligamos a com c e c com b pelo processo acima. O caminho justaposto
ligará o ponto a ao seu antı́poda b.
Todo conjunto X ⊂ Rn , conexo por caminhos, é conexo.
Com efeito, fixando a ∈ X seja, para cada x ∈ X, Cx a imagem de
um caminho em X ligando a até x. Pelo item (a) do Teorema 25, Cx é
um conjunto conexo que contém
a e x. Logo, pelo item (b) do mesmo
S
teorema, o conjunto X =
Cx é conexo.
x∈X
32
Topologia do Espaço Euclidiano
Cap. 1
A recı́proca é falsa. O conjunto X0 ⊂ R2 , reunião do gráfico da
função f (x) = cos(1/x), 0 < x ≤ 1, com a origem p = (0, 0), é conexo
mas não é conexo por caminhos. Com efeito, X0 está compreendido entre
o gráfico da função contı́nua f (o qual é conexo por ser homeomorfo a
(0, 1]) e o fecho desse mesmo gráfico. Assim, pelo Teorema 25, X0 é
conexo. Mas não é conexo por caminhos pois todo caminho λ : [0, 1] →
X0 com λ(0) = p é constante. (Ver pag. 103 do livro “Espaços Métricos”,
do autor.)
Há, porém, um caso particular importante, no qual a conexidade
implica em conexidade por caminhos: quando o conjunto X ⊂ Rn é
aberto.
Diremos que f : [0, 1] → X é um caminho poligonal em X quando f
é a justaposição de um número finito de caminhos retilı́neos.
Teorema 26. Um aberto A ⊂ Rn é conexo se, e somente se, é conexo
por caminhos.
Demonstração. Seja A ⊂ Rn aberto e conexo. Fixemos um ponto
a ∈ A e consideremos o conjunto U , formado pelos pontos x ∈ A que
podem ser ligados ao ponto a por um caminho poligonal contido em A.
Afirmamos que U é aberto. Com efeito, seja x ∈ U . Sendo A aberto,
existe B = B(x; r), com x ∈ B ⊂ A. Como a bola B é convexa, todo
ponto y ∈ B pode ser ligado a x por um segmento de reta contido em
B, logo y se liga a a por um caminho poligonal contido em A. Portanto
B ⊂ U e U ⊂ A é aberto. Também V = A − U é aberto, pois se v ∈ V
então v não pode ser ligado a a por um caminho poligonal contido em
A. Tomando uma bola aberta B1 , com v ∈ B1 ⊂ A, todo z ∈ B1 se liga
a v por um segmento de reta contido em B1 . Se z pudesse ser ligado
a a por um caminho poligonal contido em A, justapondo-se [v, z] a esse
caminho, verı́amos que v ∈ U , um absurdo. Temos então A = U ∪ V ,
uma cisão. Como A é conexo e a ∈ U , temos V = ∅, donde A = U , o
que prova o teorema.
Corolário 9 (da demonstração). Se A ⊂ Rn é aberto e conexo,
dois pontos quaisquer de A podem ser ligados por um caminho poligonal
contido em A.
Mostraremos a seguir que todo conjunto X ⊂ Rn se exprime como
reunião disjunta de subconjuntos conexos máximos, chamados componentes conexas de X.
Seção 11
Limites
33
Sejam x ∈ X ⊂ Rn . A componente conexa do ponto x no conjunto
X é a reunião Cx de todos os subconjuntos conexos de X que contêm o
ponto x.
Por exemplo, se X = Q ⊂ R então a componente conexa de qualquer
ponto x ∈ X é {x}. Por outro lado, se X ⊂ Rn é conexo então, para
todo x ∈ X temos Cx = X. Se X = R − {0} então a componente
conexa de 1 em X é (0, +∞) enquanto que a componente conexa de −1
é (−∞, 0).
Dados x ∈ X ⊂ Rn , a componente conexa Cx é um conjunto conexo,
pelo Teorema 25(b). Na realidade, Cx é o maior subconjunto conexo
de X contendo o ponto x. Com efeito, se C ⊂ X é conexo e contém
x, então C é um dos conjuntos cuja reunião é Cx , logo C ⊂ Cx . Mais
ainda, se C ⊂ X é conexo e tem algum ponto em comum com Cx então
C ⊂ Cx , pois C ∪ Cx é conexo contendo x logo C ∪ Cx ⊂ Cx e daı́
C ⊂ Cx . Em particular, nenhum subconjunto conexo de X pode conter
Cx propriamente.
Sejam x, y dois pontos de X. Suas componentes conexas Cx e Cy ou
coincidem ou são disjuntas pois se z ∈ Cx ∩Cy então Cx ⊂ Cy e Cy ⊂ Cx .
Assim a relação “x e y pertencem à mesma componente conexa em X ”é
uma equivalência no conjunto X. As classes de equivalência são as
componentes conexas dos pontos de X.
Toda componente conexa Cx é um conjunto fechado em X. Com
efeito, sendo Cx ⊂ C x ∩ X ⊂ C x , o Teorema 25(d) nos assegura que
C x ∩X é um subconjunto conexo de X, contendo Cx . Logo C x ∩X = Cx ,
o que mostra que Cx é fechado em X.
11
Limites
Sejam f : X → Rn definida no conjunto X ⊂ Rm e a ∈ Rm um ponto de
acumulação de X. Diz-se que b ∈ Rn é o limite de f (x) quando x tende
para a e escreve-se lim f (x) = b quando a seguinte condição é válida:
x→a
“para todo ε > 0 dado, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ
implicam |f (x) − b| < ε”.
O ponto a pode pertencer ou não a X. Em muitos dos exemplos
mais importantes de limite, na verdade, tem-se a ∈
/ X. Mas, mesmo que
a pertença a X, o valor f (a) não desempenha papel algum na definição
de limite.
34
Rn
Topologia do Espaço Euclidiano
Cap. 1
Quando o ponto de acumulação a pertence a X, a aplicação f : X →
é contı́nua no ponto a se, e somente se, lim f (x) = f (a).
x→a
A propriedade seguinte decorre imediatamente da definição mas é
útil o bastante para ser destacada como um teorema.
Teorema 27 (Permanência do sinal). Sejam a um ponto de acumulação de X ⊂ Rn e f : X → R uma função real. Se b = lim f (x) é
x→a
um número positivo então existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ
implicam f (x) > 0.
Demonstração. Como b é positivo, tomamos ε = b. Pela definição
de limite, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam
b − ε < f (x) < b + ε, isto é, 0 < f (x) < 2b, logo f (x) > 0.
Quando X é um intervalo da reta, tem sentido a noção de limite
lateral de uma aplicação f : I → Rn , ou seja, de um caminho, num
ponto a ∈ I. Por exemplo, se a não é o extremo superior de I, diz-se
que b ∈ Rn é o limite à direita de f (t) quando t tende para a, e escreve-se
lim f (t) = b, para significar que:
t→a+
Para todo ε > 0 dado, existe δ > 0 tal que a < t < a + δ implica
t ∈ I e |f (t) − b| < ε.
Analogamente se define o limite à esquerda lim f (t).
t→a−
Assim como a continuidade de uma aplicação, a existência e o valor
do limite se exprimem em termos das funções-coordenada, como veremos
agora.
Teorema 28. Sejam a um ponto de acumulação do conjunto X,
f : X → Rn uma aplicação e f1 , f2 . . . , fn : X → R as funções-coordenada de f . Então lim f (x) = b = (b1 , b2 , . . . , bn ) se, e somente se,
x→a
lim fi (x) = bi para cada i = 1, . . . , n.
x→a
Demonstração. Se lim f (x) = b então, para cada i = 1, . . . , n, temx→a
se lim fi (x) = bi porque |fi (x) − bi | ≤ |f (x) − b|. Reciprocamente,
x→a
se lim fi (x) = bi para cada i = 1, . . . , n então lim f (x) = b porque
x→a
x→a
n
P
|fi (x) − bi |.
|f (x) − b| ≤
i=1
Seção 11
Limites
35
A proposição seguinte relaciona o limite de aplicações com o limite
de seqüências.
Teorema 29.
Seja a um ponto de acumulação do conjunto
X ⊂ Rm . A fim de que se tenha lim f (x) = b é necessário e suficix→a
ente que, para toda seqüência de pontos xk ∈ X − {a} com lim xk = a,
seja lim f (xk ) = b.
A demonstração é idêntica à feita no vol. 1 (pág. 63).
Teorema 30. Sejam: a um ponto de acumulação de X ⊂ Rm , b ∈ Y ,
f : X → Y uma aplicação tal que lim f (x) = b e g : Y → Rp contı́nua
x→a
no ponto b. Então lim g(f (x)) = g(b).
x→a
Isto é mais fácil de provar do que enunciar. Basta imitar a demonstração de que a composta de duas aplicações contı́nuas é contı́nua
(Teorema 14).
Teorema 31. Sejam f, g : X → Rn e α : X → R definidas no conjunto
X ⊂ Rm e a um ponto de acumulação de X. Se existem lim f (x) = b,
x→a
lim g(x) = c e lim α(x) = α0 , então existem os limites e valem as
x→a
x→a
igualdades abaixo:
lim α(x) · f (x) = α0 · b
lim [f (x) + g(x)] = b + c,
x→a
x→a
lim hf (x), g(x)i = hb, ci,
x→a
lim |f (x)| = |b|.
x→a
Demonstração. A aplicação s : Rn × Rn → Rn , definida por s(x, y) =
x + y, é contı́nua. Observando que f (x) + g(x) = s(f (x), g(x)), resulta
do Teorema 30 que lim [f (x) + g(x)] = lim f (x) + lim g(x) = b + c.
x→a
x→a
x→a
Analogamente para as outras três igualdades.
Além disso, é útil saber que se lim α(x) = 0 e f : X → Rn é limitada
x→a
na vizinhança de a (isto é, existem δ > 0 e M > 0 tais que x ∈ X e
|x − a| < δ implicam |f (x)| ≤ M ) então lim α(x)f (x) = 0, mesmo que
x→a
não exista lim f (x). (Muito fácil.)
x→a
Exemplo 20. Seja g : R2 − {0} → R definida por g(x, y) =
x2 y/(x2 + y 2 ). Então podemos escrever g(x, y) = α(x, y) · f (x, y) onde
α(x, y) = x e
xy
x
y
f (x, y) = 2
=p
·p
= cos θ sen θ,
2
2
2
x + y2
x +y
x + y2
36
Topologia do Espaço Euclidiano
Cap. 1
sendo θ o ângulo de eixo OX com o segmento Oz, z = (x, y). Assim,
temos
lim α(x, y) = 0 e |f (x, y)| ≤ 1, logo
lim g(x, y) = 0. ⊳
(x,y)→(0,0)
(x,y)→(0,0)
Agora que já vimos ser lim (f (x) − g(x)) = lim f (x) − lim g(x),
x→a
x→a
x→a
podemos demonstrar a seguinte conseqüência do Teorema 27:
Teorema 32 (Permanência da desigualdade). Sejam f, g : X → R
definidas no conjunto X ⊂ Rm e a um ponto de acumulação de X. Se
f (x) ≤ g(x) para todo x ∈ X e existem lim f (x) e lim g(x) então tem-se
lim f (x) ≤ lim g(x).
x→a
x→a
x→a
x→a
Demonstração. Se fosse o contrário, lim f (x) > lim g(x), terı́amos
x→a
x→a
lim (f (x) − g(x)) > 0 e então, pelo Teorema 27, valeria f (x) > g(x) para
x→a
todo x ∈ X suficientemente próximo de a, uma contradição.
12
Exercı́cios
Seção 1:
O espaço euclidiano n-dimensional
1. Se |u + v| = |u| + |v| com u 6= 0 (norma euclidiana), prove que existe α ≥ 0 tal
que v = α · u.
2. Sejam x, y, z ∈ Rn tais que (na norma euclidiana) |x − z| = |x − y| +
|y − z|. Prove que existe t ∈ [0, 1] tal que y = (1 − t)x + tz. Mostre que
isto seria falso nas normas do máximo e da soma.
3. Sejam x, y ∈ Rn não-nulos. Se todo z ∈ Rn que é ortogonal a x for também
ortogonal a y, prove que x e y são múltiplos um do outro.
1
4. Se |x| = |y|, prove que z = (x + y) é ortogonal a y − x. (A mediana de um
2
triângulo isósceles é também altura.)
Seção 2:
Bolas e conjuntos limitados
1. Dados a 6= b em Rn determine c, pertencente à reta ab, tal que c ⊥ (b − a).
Conclua que para todo x ∈ ab, com x 6= c, tem-se |c| < |x|. Interprete
geometricamente.
2. Sejam |x| = |y| = r, com x 6= y (norma euclidiana). Se 0 < t < 1, prove que
|(1 − t)x + ty| < r. Conclua que a esfera S(0; r) não contém segmentos de reta.
3. Dados
o conjunto convexo X ⊂ Rn e o número real r > 0, seja B(X; r) =
S
B(x; r). Prove que B(X; r) é convexo.
x∈X
4. Prove que o conjunto X = {(x, y) ∈ R2 ; x2 ≤ y} é convexo.
5. Seja T : Rm → Rn uma transformação linear. Prove que se T 6= 0 então T não
é uma aplicação limitada. Se X ⊂ Rm é um conjunto limitado, prove que a
restrição TX : X → Rn de T ao conjunto X é uma aplicação limitada.
Seção 12
Seção 3:
Exercı́cios
37
Conjuntos abertos
1. Para todo conjunto X ⊂ Rm , prove que int.X é um conjunto aberto, isto é,
int.int. X = int.X.
2. Prove que int.X é o maior conjunto aberto contido em X, ou seja, se A é
aberto e A ⊂ X então A ⊂ int.X.
3. Dê exemplo de um conjunto X ⊂ Rn cuja fronteira tem interior não-vazio e
prove que isto não seria possı́vel se X fosse aberto.
4. Seja πi : Rn → R a projeção sobre a i-ésima coordenada, isto é, se
x = (x1 , . . . , xn ) então πi (x) = xi . Prove que se A ⊂ Rn é aberto então
sua projeção πi (A) ⊂ R também é um conjunto aberto.
5. Prove que toda coleção de abertos dois a dois disjuntos e não-vazios em Rn é
enumerável.
Seção 4:
Seqüências em Rn
1. Dada a seqüência (xk )k∈N em Rn , sejam N′ e N′′ subconjuntos infinitos de N
tais que N = N′ ∪ N′′ . Se as subseqüências (xk )k∈N′ e (xk )k∈N′′ convergem para
o mesmo limite a, prove que lim xk = a.
k∈N
2. Dada a seqüência (xk )k∈N em Rn , prove que as seguintes afirmações são equivalentes:
(a) lim |xk | = +∞
k→∞
(b) (xk )k∈N não possui subseqüências convergentes
(c) Para cada conjunto limitado X ⊂ Rn , o conjunto NX = {k ∈ N; xk ∈ X}
é finito.
3. Sejam A ⊂ Rn aberto e a ∈ A. Prove que se lim xk = a então existe k0 ∈ N
tal que k > k0 ⇒ xk ∈ A.
k→∞
4. Se a ∈ fr.X, prove que existem seqüências de pontos xk ∈ X e yk ∈ Rn − X
tais que lim xk = lim yk = a. Vale a recı́proca?
Seção 5:
Conjuntos fechados
1. Para quaisquer X, Y ⊂ Rn , prove que X ∪ Y = X ∪ Y e X ∩ Y ⊂ X ∩ Y . Dê
um exemplo onde não vale X ∩ Y = X ∩ Y .
2. Diz-se que o ponto a ∈ Rn é valor de aderência da seqüência (xk )k∈N quando
a é limite de alguma subseqüência de (xk ). Prove que o conjunto dos valores
de aderência de qualquer seqüência é fechado.
3. Prove que um conjunto A ⊂ Rn é aberto se, e somente se, A ∩ X ⊂ A ∩ X
para todo X ⊂ Rn .
4. Se X ⊂ Rm e Y ⊂ Rn , prove que se tem X × Y = X × Y em Rm+n .
5. Prove que X ⊂ Rn é fechado se, e somente se X ⊃ f r.X. Por outro lado,
A ⊂ Rn é aberto se, e somente se, A ∩ f r.A = ∅.
38
Topologia do Espaço Euclidiano
Cap. 1
6. Sejam A, B ⊂ Rn conjuntos limitados disjuntos e não-vazios. Se d(A, B) = 0,
prove que existe x ∈ f r.A ∩ f r.B.
7. Prove que o fecho de um conjunto convexo é convexo.
8. Prove que se C ⊂ Rn é convexo e fechado então, para todo x ∈ Rn , existe um
único x̄ = f (x) ∈ C tal que d(x, C) = |x − x̄|.
Seção 6:
Conjuntos compactos
1. Seja K ⊂ Rn compacto, não-vazio. Prove que existem x, y ∈ K tais que
|x − y| = diam.K.
2. Se toda cobertura aberta de um conjunto X ⊂ Rn admite uma subcobertura
finita, prove que X é compacto.
3. Seja (xk ) uma seqüência limitada em Rn que possui um único valor de aderência. Prove que (xk ) é convergente. Dê exemplo de uma sequência (nãolimitada) não-convergente que tem um único valor de aderência.
4. Se K ⊂ U ⊂ Rn , com K compacto e U aberto, prove que existe ε > 0 tal que
x ∈ K, y ∈ Rn , |x − y| < ε ⇒ [x, y] ⊂ U .
5. Seja X ⊂ Rn tal que, para todo compacto K ⊂ Rn , a interseção X ∩ K é
compacta. Prove que X é fechado.
Seção 7:
Aplicações contı́nuas
1. Seja f : Rm → Rn contı́nua. Prove que as seguintes condições são equivalentes:
(a) Para todo compacto K ⊂ Rn , a imagem inversa f −1 (K) ⊂ Rm é compacta.
(b) Se (xk ) é uma seqüência em Rm sem subseqüências convergentes, o
mesmo se dá com a seqüência (f (xk )) em Rn . (Ou seja, lim xk = ∞ ⇒
lim f (xk ) = ∞.)
2. Prove que um polinômio complexo não-constante p(z) = a0 + a1 z + · · · + an z n ,
considerado como uma aplicação p : R2 → R2 , cumpre uma das (portanto
ambas) condições do exercı́cio anterior.
3. Sejam X ⊂ Rm , K ⊂ Rn compacto e f : X × K → Rp contı́nua. Suponha que,
para cada x ∈ X, exista um único y ∈ K tal que f (x, y) = 0. Prove que y
depende continuamente de x.
4. Seja K ⊂ Rn compacto. Prove que a projeção π : Rm ×Rn → Rm , π(x, y) = x,
transforma todo subconjunto fechado F ⊂ Rm × K num conjunto fechado
π(F ) ⊂ Rm . Dê exemplo de F ⊂ Rm × Rn fechado tal que π(F ) ⊂ Rm não
seja fechado.
Seção 8:
Continuidade uniforme
1. Sejam F, G ⊂ Rn fechados disjuntos não-vazios. A função contı́nua f : Rn →
d(x, F )
[0, 1], definida por f (x) =
cumpre f (x) = 0 para todo x ∈ F
d(x, F ) + d(x, G)
e f (x) = 1 para todo x ∈ G. Ela se chama a função de Urysohn do par (F, G).
Prove que se ela é uniformemente contı́nua, então d(F, G) > 0.
Seção 12
Exercı́cios
39
2. Seja Y ⊂ X ⊂ Rm com Y denso em X. Se a aplicação contı́nua f : X → Rn é
tal que sua restrição f |Y é uniformemente contı́nua, prove que f é uniformemente contı́nua.
3. Seja X ⊂ Rm um conjunto limitado. Se f : X → Rn é uniformemente contı́nua,
prove que f (X) ⊂ Rn também é limitado.
4. Sejam f, g : X → R uniformemente contı́nuas no conjunto X ⊂ Rm . Prove
que a soma f + g : X → R é uniformemente contı́nua e o mesmo se dá com o
produto f · g : X → R caso f e g sejam limitadas.
5. Seja C ⊂ Rn convexo. Se x ∈ Rn e x̄ ∈ C são tais que |x − x̄| = d(x, C), prove
que hx − x̄, y − x̄i ≤ 0 para todo y ∈ C.
6. Dado C ⊂ Rn convexo e fechado, seja f : Rn → C definida por f (x) = x̄, onde x̄
é o único ponto de C tal que |x− x̄| = d(x, C). Prove que |f (x)−f (y)| ≤ |x−y|
para quaisquer x, y ∈ Rn , logo f é uniformemente contı́nua.
Seção 9:
Homeomorfismos
1. Chama-se semi-reta de origem 0 em Rn a um conjunto do tipo
σ = {tv; t ≥ 0, 0 6= v ∈ Rn }. Seja X ⊂ Rn − {0} um conjunto compacto que
tem um (único) ponto em comum com cada semi-reta com origem 0. Prove
que X é homeomorfo à esfera S n−1 .
2. Estabeleça um homeomorfismo entre Rn − {0} e o produto cartesiano S n−1 ×
R ⊂ Rn+1 .
3. Mostre que existe um homeomorfismo do produto cartesiano S m × S n sobre
um subconjunto de Rm+n+1 .
4. Dê exemplo de conjuntos X, Y ⊂ Rn e pontos a ∈ X, b ∈ Y tais que X − {a}
e Y − {b} são homeomorfos mas X não é homeomorfo a Y .
5. Sejam X ⊂ Rm , Y ⊂ Rn compactos, a ∈ X e b ∈ Y . Se X − {a} é homeomorfo
a Y − {b}, prove que X e Y são homeomorfos.
Seção 10:
Conjuntos conexos
1. Prove que um conjunto X ⊂ Rn é conexo se, e somente se, para cada par de
pontos a, b ∈ X existe um conjunto conexo Cab ⊂ X tal que a ∈ Cab e b ∈ Cab .
2. Seja Z ⊂ Rn (n ≥ 2) um conjunto enumerável. Dados arbitrariamente os
pontos a, b ∈ Rn − Z, prove que existe c ∈ Rn tal que os segmentos de reta
[a, c] e [c, b] estão ambos contidos em Rn − Z. Conclua que o complementar de
um conjunto enumerável em Rn é conexo.
3. Prove que S 1 e S 2 não são homeomorfos.
4. Prove que S 1 não é homeomorfo a um subconjunto de R.
5. Quantas componentes conexas tem o conjunto X = {(x, y) ∈ R2 ; (x · y)2 =
x · y}? Especifique-as.
Seção 11:
Limites
1. Se f : X → Rn é uniformemente contı́nua no conjunto X ⊂ Rm , prove que,
para todo a, ponto de acumulação de X, existe lim f (x).
x→a
40
Topologia do Espaço Euclidiano
Cap. 1
2. Seja Y ⊂ X ⊂ Rm , com Y denso em X. Para toda aplicação uniformemente
contı́nua f : Y → Rn , prove que existe uma única aplicação F : X → Rn ,
uniformemente contı́nua, tal que F (y) = f (y) para todo y ∈ Y .
3. Dada f : Rm → Rn , diz-se que se tem lim f (x) = ∞ quando para todo B > 0
x→∞
existe A > 0 tal que |x| > A ⇒ |f (x)| > B. Se p : R2 → R2 é um polinômio
complexo não-constante, prove que lim p(z) = ∞.
z→∞
n
4. Seja X = {x = (x1 , . . . , xn ) ∈ R ; x1 · x2 · · · xn 6= 0}. Defina f : X → R pondo
sen(x1 · x2 · · · xn )
f (x) =
· Prove que lim f (x) = 1.
x→0
x1 · x2 · · · xn
5. Sejam a um ponto de acumulação do domı́nio da função f : X → R, com
X ⊂ Rm , e v ∈ Rn um vetor não-nulo. Se lim f (x) · v = v0 então existe
x→a
lim f (x) = α e v0 = α · v.
x→a
2
Caminhos em Rn
1
Caminhos diferenciáveis
Seja f : I → Rn um caminho, isto é, uma aplicação contı́nua cujo
domı́nio é um intervalo da reta. Para todo t ∈ I, tem-se f (t) =
(f1 (t), . . . , fn (t)), onde f1 , . . . , fn : I → R, as funções-coordenada de f ,
são contı́nuas.
Diz-se que o caminho f : I → Rn é diferenciável no ponto t0 ∈ I
quando existe o limite
f (t0 + h) − f (t0 )
,
h→0
h
f ′ (t0 ) = lim
chamado a derivada , ou o vetor-velocidade de f no ponto t0 .
Para todo h 6= 0, as coordenadas do vetor [f (t0 + h) − f (t0 )]/h
são os números [fi (t0 + h) − fi (t0 )]/h (i = 1, . . . , n). Pelo Teorema
28 do Capı́tulo 1, o caminho f é diferenciável no ponto t0 se, e somente se, suas funções-coordenada o são. No caso afirmativo, tem-se
df
(t0 )
f ′ (t0 ) = (f1′ (t0 ), . . . , fn′ (t0 )). Às vezes se usa também a notação
dt
em vez de f ′ (t0 ).
Quando o caminho f : I → Rn é diferenciável em todos os pontos
de I, diz-se que ele é diferenciável em I. Neste caso, a correspondência
t 7→ f ′ (t) define uma aplicação f ′ : I → Rn . Quando f ′ é contı́nua, o
caminho f chama-se de classe C 1 . Mais geralmente, para todo inteiro
k > 1, diz-se que f : I → Rn é um caminho de classe C k quando ele
é diferenciável e f ′ é de classe C k−1 . Para que f seja de classe C k é
42
Caminhos em Rn
Cap. 2
f ′ (t0 )
f (t)
f (t0 )
Figura 2.1
necessário e suficiente que cada uma de suas funções-coordenada o seja.
Escreve-se então f ∈ C k .
No caso em que f ′ (t0 ) 6= 0, a definição acima significa que a reta que
passa pelo ponto f (t0 ) e tem a direção dada pelo vetor f ′ (t0 ), isto é, o
conjunto {f (t0 ) + α · f ′ (t0 ); α ∈ R}, é o limite quando h → 0 da secante
que passa pelos pontos f (t0 ) e f (t0 + h). Logo é natural chamá-la de
reta tangente ao caminho f no ponto t0 . Quando f ′ (t0 ) = 0 pode não
haver reta alguma que se possa chamar de tangente no ponto f (t0 ).
Exemplo 1. Dados a 6= b em Rn , seja f : R → Rn o caminho retilı́neo
que passa pelos pontos a e b: f (t) = (1 − t)a + t · b. Para todo t ∈ R,
f é diferenciável no ponto t, com f ′ (t) = b − a, como se vê diretamente
a partir da definição.
Se t0 não é o extremo superior do intervalo I, tem sentido considerar
a derivada à direita do caminho f : I → Rn no ponto t0 , a qual é definida
por
f (t0 + h) − f (t0 )
f+′ (t0 ) = lim
,
h
h→0+
e, de modo análogo, a derivada à esquerda f−′ (t0 ), caso t0 não seja o
extremo inferior de I. Quando t0 é um ponto interior de I então f
é diferenciável no ponto t0 se, e somente se, existem e são iguais as
⊳
derivadas laterais f+′ (t0 ) e f−′ (t0 ).
Exemplo 2. Seja f : R → R2 o caminho definido por f (t) = (t, |t|).
Para t > 0 tem-se f (t) = (t, t) e, para t < 0, f (t) = (t, −t). Logo, para
todo t 6= 0 existe f ′ (t), sendo f ′ (t) = (1, 1) se t > 0 e f ′ (t) = (1, −1)
se t < 0. No ponto t = 0 existem as derivadas laterais f+′ (0) = (1, 1)
e f−′ (0) = (1, −1), que são diferentes, logo f não é diferenciável no
ponto t = 0. Por outro lado, o caminho g : R → R2 , definido por
Seção 2
Cálculo diferencial de caminhos
43
z
x
y
H
Figura 2.2
g(t) = (t|t|, t2 ), tem a mesma imagem que f porém é derivável em todos
os pontos, inclusive para t = 0, valendo g ′ (0) = (0, 0). Com efeito, se
t ≤ 0 então g(t) = (−t2 , t2 ) e se t ≥ 0 vale g(t) = (t2 , t2 ). Portanto
g ′ (t) = (−2t, 2t) quando t < 0 e g ′ (t) = (2t, 2t) se t > 0. No ponto t = 0,
′ (0) = g ′ (0) = (0, 0).
temos g+
−
Exemplo 3. Sejam f : R → R2 e g : R → R3 os caminhos definidos
por f (t) = (cos t, sen t) e g(t) = (cos t, sen t, t). A imagem de f é a
circunferência unitária S 1 e a imagem de g é a hélice H, cuja projeção
sobre o plano z = 0 é S 1 . Ambos, f e g, são de classe C k para todo
k ∈ N, por isso se dizem de classe C ∞ . Para todo t ∈ R tem-se f ′ (t) =
(− sen t, cos t) e g ′ (t) = (− sen t, cos t, 1).
2
Cálculo diferencial de caminhos
Sejam f, g : I → Rn caminhos e α : I → R uma função real. Se f , g e α
são diferenciáveis no ponto t0 ∈ I então são também diferenciáveis
nesse
p
ponto os caminhos f + g, αf e as funções hf, gi e |f | = hf, f i, esta
última sob a condição de ser f (t0 ) 6= 0.
Valem então as regras abaixo:
1. (f + g)′ (t0 ) = f ′ (t0 ) + g ′ (t0 ),
2. (αf )′ (t0 ) = α′ (t0 ) · f (t0 ) + α(t0 ) · f ′ (t0 ),
3. hf, gi′ (t0 ) = hf ′ (t0 ), g(t0 )i + hf (t0 ), g ′ (t0 )i,
4. |f |′ (t0 ) =
hf (t0 ),f ′ (t0 )i
|f (t0 )|
,
as quais se provam simplesmente calculando em termos das coordenadas
de f e g.
44
Caminhos em Rn
Cap. 2
Vimos no Exemplo 3 que, em cada ponto, o vetor-velocidade f ′ (t) =
(− sen t, cos t) é perpendicular a f (t) = (cos t, sen t). A última das regras de derivação acima, segundo a qual |f |′ = hf, f ′ i/|f |, mostra que,
mais geralmente, se f : I → Rn é um caminho diferenciável com |f |
constante (isto é, f (t) pertence a uma esfera de centro 0) então o vetorvelocidade f ′ (t) é perpendicular a f (t), para todo t ∈ I. Reciprocamente, se hf (t), f ′ (t)i = 0 para todo t ∈ I então |f |′ = 0, logo a função
real |f | : I → R é constante.
Vale também para caminhos diferenciáveis f : I → Rn o fato de que
derivada identicamente nula implica f constante. Isto pode ser visto
diretamente ou a partir do Teorema do Valor Médio, o qual assume,
para caminhos, a forma de uma desigualdade.
O Teorema do Valor Médio para uma função diferenciável
f : [a, b] → R diz que existe c, com a < c < b, tal que f (b) − f (a) =
f ′ (c)(b − a). Tal igualdade não vale sempre para caminhos f : I →
Rn . Por exemplo, se considerarmos f : [0, 2π] → R2 , dado por f (t) =
(cos t, sen t), temos f (2π) − f (0) = 0 mas, como |f ′ (t)| = 1 para todo t ∈
[0, 2π] não pode existir c ∈ [0, 2π] tal que f (2π) − f (0) = f ′ (c) · (2π − 0).
Tem-se entretanto o seguinte importante resultado:
Teorema 1 (Desigualdade do Valor Médio). Seja f : [a, b] → Rn
um caminho, diferenciável no intervalo aberto (a, b), com |f ′ (t)| ≤ M
para todo t ∈ (a, b). Então |f (b) − f (a)| ≤ M · (b − a).
Demonstração. Definamos ϕ : [a, b] → R pondo ϕ(t) = hf (t),
f (b) − f (a)i. Então, pelo Teorema do Valor Médio (Vol. 1, pág.
96), existe c ∈ (a, b) tal que ϕ(b) − ϕ(a) = ϕ′ (c) · (b − a), pois ϕ é
contı́nua, derivável em (a, b), com ϕ′ (t) = hf ′ (t), f (b) − f (a)i. Mas
ϕ(b) − ϕ(a) = |f (b) − f (a)|2 . Logo, usando a desigualdade de Schwarz,
temos:
|f (b) − f (a)|2 = hf ′ (c), f (b) − f (a)i · (b − a)
≤ |f ′ (c)| |f (b) − f (a)| · (b − a)
≤ M · |f (b) − f (a)| · (b − a).
Cancelando o fator |f (b) − f (a)|, vem |f (b) − f (a)| ≤ M · (b − a).
Corolário 1. Se o caminho f : [a, b] → Rn tem derivada nula em todos
os pontos de (a, b) então é constante.
Seção 3
A integral de um caminho
45
Teorema 2 (Regra da Cadeia). Sejam ϕ : I → J diferenciável no
ponto a ∈ I e f : J → Rn um caminho diferenciável no ponto b =
ϕ(a). Então o caminho f ◦ ϕ : I → Rn é diferenciável no ponto a, com
(f ◦ ϕ)′ (a) = ϕ′ (a) · f ′ (b).
Demonstração. Aplicar a Regra da Cadeia às funções-coordenada fi ◦ϕ
do caminho f ◦ ϕ.
Exemplo 4. Sejam f : R → R2 e ϕ : R → R, com f (t) = (cos t, sen t)
e ϕ(t) = t2 . Então o caminho f ◦ ϕ : R → R2 , dado por (f ◦ ϕ)(t) =
(cos t2 , sen t2 ), tem vetor-velocidade (f ◦ ϕ)′ (t) = (−2t sen t2 , 2t cos t2 ) =
2t · (− sen t2 , cos t2 ), múltiplo escalar do vetor-velocidade de f no ponto
ϕ(t).
De um modo geral, a Regra da Cadeia diz que o caminho t 7→ f (ϕ(t)),
cuja imagem está contida na imagem de f , tem, para cada t ∈ I, vetorvelocidade igual a um múltiplo escalar do vetor-velocidade de f em ϕ(t).
3
A integral de um caminho
Lembramos que uma partição do intervalo [a, b] é um conjunto finito
P = {t0 < t1 < · · · < tk } com t0 = a e tk = b. A norma de P é o
número |P | = max{ti − ti−1 ; i = 1, . . . , k}. Diz-se que outra partição Q
refina P quando P ⊂ Q. Uma partição pontilhada de [a, b] é um par
P ∗ = (P, ξ) onde ξ = {ξ1 , . . . , ξk } com ti−1 ≤ ξi < ti , 1 ≤ i ≤ k.
Dados o caminho f : [a, b] → Rn e uma partição pontilhada P ∗ =
(P, ξ) de [a, b], a soma de Riemann de f associada a P ∗ é definida como
X
(f ; P ∗ ) =
k
X
i=1
f (ξi )(ti − ti−1 ).
P
Diz-se que o vetor v ∈ Rn é o limite da soma de Riemann P (f ; P ∗ )
(f ; P ∗ ),
quando a norma de P tende a zero, e escreve-se v = lim
|P |→0
para significar que,
P dado arbitrariamente ε > 0, existe δ > 0 tal que
|P | < δ ⇒ |v − (f ; P ∗ )| < ε, seja qual for a maneira de pontilhar P .
Vimos no Volume 1 (págs. 127 e 137) que se f : [a, b] → R é contı́nua
Rb
P
(f ; P ∗ ) = a f (t) dt. Daı́ resulta que, se f : [a, b] →
então existe lim
|P |→0
Rn é um caminho, existe o limite
Z b
Z b
X
∗
fn (t) dt .
f1 (t)dt, . . . ,
lim
(f ; P ) =
|P |→0
a
a
46
Caminhos em Rn
Cap. 2
Pomos, por definição,
Z b
Z b
Z b
X
∗
f (t) dt = lim
fn (t) dt .
(f ; P ) =
f1 (t) dt, . . . ,
|P |→0
a
a
a
Segue-se da propriedade correspondente para funções reais que
Z b
Z b
Z b
[αf (t) + βg(t)] dt = α
f (t) dt + β
g(t) dt,
a
a
a
se α, β ∈ R. Além disso, tem-se a importante desigualdade
Z b
Z b
|f (t)| dt,
f (t) dt ≤
a
a
a qual decorre do fato de que, para toda partição pontilhada P ∗ , tem-se
X
X
(f ; P ∗ ) ≤
(|f |; P ∗ )
pois a norma de uma soma é menor do que ou igual à soma das normas
das parcelas.
Em particular, se |f (t)| ≤ M para todo t ∈ [a, b] então
Z b
f (t) dt ≤ M · (b − a).
a
Exemplo 5. Se f : [0, 2π] → R2 e gR: [0, 1] → R2 são dadosR por f (t) =
2π
1
(cos t, sen t) e g(t) = (t, t2 ) então 0 f (t) dt = (0, 0) e 0 g(t) dt =
(1/2, 1/3).
⊳
Aplicando o Teorema Fundamental do Cálculo a cada uma das coordenadas do caminho f : [a, b] → Rn , de classe C 1 , obtemos o seguinte
Teorema 3 (Teorema Fundamental do Cálculo para Caminhos).
Se f : [a, b] → Rn é um caminho de classe C 1 então
Z b
f ′ (t) dt = f (b) − f (a).
a
Daı́ resulta outra prova da Desigualdade do Valor Médio (no caso
particular de f ∈ C 1 ), pois se |f ′ (t)| ≤ M para todo t ∈ [a, b] então
Z b
f ′ (t) dt ≤ M · (b − a).
|f (b) − f (a)| =
a
Seção 3
A integral de um caminho
47
Exprimindo novamente a integral de um caminho em termos das
integrais de suas funções-coordenada, resulta o Teorema de Mudança de
Variável seguinte
Se ϕ : [c, d]→[a, b] é de classe C 1 e f : [a, b]→Rn é um caminho então
Z
ϕ(d)
f (t) dt =
Z
d
f (ϕ(t))ϕ′ (t) dt.
c
ϕ(c)
Uma simples aplicação desta fórmula nos permite enunciar o Teorema Fundamental do Cálculo assim: se f R: [a, a+h] → Rn é um caminho
1
de classe C 1 então f (a + h) − f (a) = h · 0 f ′ (a + th) dt.
Basta considerar ϕ : [0, 1]→[a, a+h] onde ϕ(t)=a+th e notar que
ϕ′ (t)=h.
Um caminho f : I → Rn diz-se uniformemente diferenciável quando,
para todo t ∈ I existe um vetor f ′ (t) ∈ Rn com a seguinte propriedade:
Dado qualquer ε > 0, pode-se obter δ > 0 tal que 0 < |h| < δ e
t + h ∈ I implicam |f (t + h) − f (t) − f ′ (t) · h| < ε|h| para qualquer t ∈ I.
A diferença entre a diferenciabilidade uniforme e a diferenciabilidade
pura e simples situa-se no fato de que o número δ > 0 depende apenas
do ε > 0 dado, mas não do ponto t ∈ I onde se toma a derivada f ′ (t).
Teorema 4 (Diferenciabilidade Uniforme). Todo caminho f: [a, b] →
Rn , de classe C 1 no intervalo compacto [a, b], é uniformemente diferenciável.
Demonstração. Pela continuidade uniforme da derivada f ′ : [a, b] →
Rn , dado ε > 0 existe δ > 0 tal que |h| < δ e t + h ∈ [a, b] implicam
|f ′ (t + h) − f ′ (t)| < ε seja qual for t ∈ [a, b]. Observando que, para
R t+h
t ∈ [a, b] fixo vale t f ′ (t) ds = f ′ (t) · h, o Teorema Fundamental do
Cálculo nos diz que 0 < |h| < δ e t + h ∈ [a, b] implicam
′
|f (t + h) − f (t) − f (t) · h| =
Z
t+h
t
[f ′ (s) − f ′ (t)] ds ≤ ε · |h|
para qualquer t ∈ [a, b], o que demonstra o teorema.
Observação. Vale a recı́proca: todo caminho f : [a, b] → Rn uniformemente diferenciável é de classe C 1 . (Vide “Curso de Análise”, vol. 1,
pág. 218 e vol. 2, pág. 88.)
48
4
Caminhos em Rn
Cap. 2
Caminhos retificáveis
O comprimento de um caminho f : [a, b] → Rn , que definiremos a seguir,
é a medida da trajetória percorrida pelo ponto f (t) quando t varia de a
até b. Não é o comprimento da curva imagem de f , pois o ponto f (t)
pode percorrer essa mesma curva de vários modos diferentes, dando
origem a caminhos de comprimentos diversos. Por exemplo, o segmento
de reta que vai da origem ao ponto P = (1, 1) do plano tem comprimento
√
2. O caminho f : [0, 2] → R2 , definido por f (t) = (2t − t2 , 2t − t2 )
tem por imagem esse segmento, porém o percorre duas vezes, saindo de
f (0) = (0, 0), indo até f (1) = (1, 1) e voltando
até f (2) = (0, 0). Seu
√
comprimento é, como veremos, igual a 2 2.
Dado um caminho f : [a, b] → Rn , cada partição P =
{a = t0 < · · · < tk = b} de [a, b] determina uma poligonal inscrita na
imagem de f , cujos vértices são os pontos f (a),f (t1 ),. . . ,f (tk−1 ),f (b). O
comprimento dessa poligonal é o número
l(f ; P ) =
k
X
i=1
|f (ti ) − f (ti−1 )|.
Quando não houver perigo de confusão, escreveremos apenas l(P ), em
vez de l(f ; P ).
Diz-se que o caminho f : [a, b] → Rn é retificável quando o conjunto
dos números l(P ), obtidos considerando-se todas as partições P do intervalo [a, b], for limitado. Então o supremo desse conjunto chama-se o
comprimento do caminho f , o qual é representado por l(f ). Assim
l(f ) = sup l(f ; P ) = sup l(P ).
P
P
Exemplo 6. Seja f : [0, 1] → Rn o caminho retilı́neo f (t) =
(1 − t)A + tB. Para toda partição P = {0 < t1 < · · · < tk−1 < 1}
de [0, 1] tem-se
l(P ) =
X
|f (ti ) − f (ti−1 )| =
X
(ti − ti−1 )|B − A| = |B − A|.
Assim, obviamente vale l(f ) = |B − A|.
⊳
Seção 4
Caminhos retificáveis
49
Exemplo 7. Um caminho não-retificável f : [a, b] → Rn é aquele em que
o ponto f (t) descreve uma trajetória infinitamente longa no tempo finito
b − a. Um exemplo de tal situação é o caminho f : [0, 1] → R2 , dado por
f (t) = (t, ϕ(t)) o qual percorre o gráfico da função ϕ : [0, 1] → R. Esta
função tem, em cada intervalo
n
n+1
,
n+1 n+2
1
· Além disso,
n+1
ϕ(1) = 0. Se considerarmos, para cada n ∈ N, a partição
n+1
Pn = 0, 1/2, 2/3, . . . ,
,1
n+2
o gráfico na forma de um triângulo isósceles de altura
do intervalo [0, 1], veremos que l(Pn ) é a soma dos comprimentos dos
lados inclinados dos n + 1 primeiros triângulos isósceles que formam
o gráfico de ϕ. Logo l(Pn ) é maior do que a soma das alturas desses
triângulos, ou seja,
l(Pn ) >
1
1 1
+ + ··· +
·
2 3
n+1
Como a série harmônica é divergente, segue-se que o conjunto dos
números l(P ) associados ao caminho f é ilimitado, portanto f não é
retificável. O caminho f tem comprimento infinito.
Uma observação simples, porém útil, é a seguinte: se a partição Q do
intervalo [a, b] refina a partição P então, dado o caminho f : [a, b] → Rn ,
tem-se l(P ) ≤ l(Q). Para ver isto, basta considerar o caso em que se
obtém Q a partir de P acrescentando-lhe um só ponto q, pois cada
refinamento de P pode ser pensado como a repetição de um número
finito desses acréscimos. Ora, se Q difere de P pela adição do único
ponto q, digamos com pj−1 < q < pj , então
l(Q) − l(P ) = |f (q) − f (pj−1 )| + |f (pj ) − f (q)| − |f (pj ) − f (pj−1 )| ≥ 0
pois
|f (pj ) − f (pj−1 )| = |f (pj ) − f (q) + f (q) − f (pj−1 )|
≤ |f (pj ) − f (q)| + |f (q) − f (pj−1 )|.
50
Caminhos em Rn
Cap. 2
f (pj )
f (q)
f (pj−1 )
Figura 2.3
Como no caso da integral, dado um caminho f : [a, b] → Rn diremos
que o número real A é o limite de l(P ) quando |P | tende a zero, e
escreveremos lim l(P ) = A, para significar que, para todo ε > 0 dado,
|P |→0
é possı́vel obter δ > 0 tal que |P | < δ implica |l(P ) − A| < ε.
Teorema 5. Se lim l(P ) = A então A = sup l(P ), ou seja, o caminho
|P |→0
f : [a, b] → Rn é retificável e l(f ) = A.
P
Demonstração. Se lim l(P ) = A, é claro que A ≤ sup l(P ). Supo|P |→0
P
nhamos, por absurdo, que seja A < sup l(P ). Então existe uma partição
P
Q0 tal que A < l(Q0 ). Seja ε = l(Q0 ) − A. Pela definição do limite,
podemos obter δ > 0 tal que |P | < δ ⇒ A − ε < l(P ) < A + ε =
l(Q0 ). Tomemos uma partição qualquer P0 tal que |P0 | < δ. A partição
P = P0 ∪ Q0 , por um lado cumpre |P | < δ, logo l(P ) < l(Q0 ) e, por
outro lado, refina Q0 , logo l(Q0 ) ≤ l(P ). Esta contradição prova o
teorema.
Observação. Vale a recı́proca: se f é retificável, então l(f ) = lim l(P ).
|P |→0
(Vide “Curso de Análise”, vol. 2, pág. 99.) Mas somente o teorema
acima será usado a seguir.
Teorema 6. Todo caminho f : [a, b] → Rn de classe C 1 é retificável e
Z b
|f ′ (t)| dt.
l(f ) =
a
Demonstração. Para toda partição P = {t0 < t1 < · · · < tk } de
Seção 4
Caminhos retificáveis
51
k
k
P
P
P
|f (ti ) − f (ti−1 )|.
|f ′ (ti−1 )|(ti − ti−1 ) e l(P ) =
(P ) =
i=1
i=1
Z b
P
|f ′ (t)| dt. E, pelo Teorema 4, para todo
Sabemos que lim
(P ) =
[a, b], sejam
|P |→0
a
ε > 0 dado arbitrariamente, existe δ > 0 tal que |P | < δ implica f (ti ) −
ε
f (ti−1 ) = (f ′ (ti−1 ) + ρi )(ti − ti−1 ) com |ρi | <
para i = 1, . . . , k.
b−a
k
k
P
P
|f ′ (ti−1 ) + ρi |(ti − ti−1 ), portanto
|f (ti ) − f (ti−1 )| =
Logo l(P ) =
i=1
i=1
k
P
P
|ρi |(ti − ti−1 ) < ε sempre que |P | < δ. Como
| (P ) − l(P )| ≤
Z b
Z b i=1
P
′
|f ′ (t)|dt.
|f (t)| dt, resulta daı́ que lim l(P ) =
lim
(P ) =
|P
|→0
|P |→0
a
a
Z b
′
|f (t)| dt.
Pelo Teorema 5, concluı́mos que l(f ) =
a
Uma reparametrização do caminho f : [a, b] → Rn é um caminho da
forma f ◦ ϕ : [c, d] → Rn , onde ϕ : [c, d] → [a, b] é uma função de classe
C 1 tal que ϕ(c) = a, ϕ(d) = b e ϕ′ (u) ≥ 0 para todo u ∈ [c, d]. O
teorema acima tem, como conseqüência imediata, o seguinte
Corolário 2. Um caminho de classe C 1 , f : [a, b] → Rn , e qualquer sua
reparametrização f ◦ ϕ : [c, d] → Rn têm o mesmo comprimento.
Com efeito, pelo Teorema,
Z d
Z b
′
ϕ′ (u) · |f ′ (ϕ(u))| du
|f (t)| dt =
l(f ) =
c
a
Z d
Z d
=
|ϕ′ (u) · f ′ (ϕ(u))| du =
|(f ◦ ϕ)′ (u)| du = l(f ◦ ϕ).
c
c
Rn
Para caminhos f : [a, b] →
de classe C 1 com a propriedade adi′
cional de que f (t) 6= 0 para todo t ∈ [a, b] (chamados caminhos regulares), existe uma reparametrização especial, “por comprimento de
arco”, que apresentamos agora. Dado um tal caminho f , digamos com
l(f ) = L, definimos a função ϕ : [a, b] → [0, L] pondo, para todo t ∈ [a, b],
Z t
ϕ(t) =
|f ′ (u)| du = l(f |[a, t]), comprimento do caminho f |[a, t], resa
trição de f ao intervalo [a, t].
A função ϕ : [a, b] → [0, L], assim definida, é de classe C 1 , com
′
ϕ (t) = |f ′ (t)| > 0 para todo t ∈ [a, b], e ϕ(a) = 0, ϕ(b) = L. Logo
52
Caminhos em Rn
Cap. 2
é uma bijeção de [a, b] sobre [0, L], cuja inversa ϕ−1 : [0, L] → [a, b] é
também de classe C 1 , valendo, para todo s = ϕ(t) ∈ [0, L], a fórmula
1
1
= ′
> 0. (Cfr. Vol. 1, pág. 92.)
(ϕ−1 )′ (s) = ′
ϕ (t)
|f (t)|
Consideremos a reparametrização g = f ◦ ϕ−1 : [0, L] → Rn do caminho f . Para todo s = ϕ(t) ∈ [0, L] temos
g ′ (s) = (ϕ−1 )′ (s) · f ′ (t) =
f ′ (t)
,
|f ′ (t)|
portanto |g ′ (s)| = 1.
Então, para todo s ∈ [0, L], o comprimento do caminho restrito
g|[0, s] tem o valor
Z s
Z s
′
du = s.
|g (u)| du =
l(g|[0, s]) =
0
0
Por este motivo, g = f ◦ ϕ−1 chama-se a reparametrização de f por
comprimento de arco.
Z b
|f ′ (t)| dt é importante teoricamente
Observação. A fórmula l(f ) =
a
mas, em geral, é impraticável procurar calcular essa integral, a não ser
numericamente ou então em raros casos especialmente escolhidos, como
f (t) = (1 − t)A + tb, f (t) = (cos t, sen t) e outros.
5
Exercı́cios
Seção 1:
Caminhos diferenciáveis
1. Seja f : I → Rn um caminho diferenciável. Se existirem a ∈ I e b ∈ Rn tais
que a é ponto de acumulação do conjunto f −1 (b), prove que f ′ (a) = 0.
2. Seja f : I → R2 um caminho diferenciável cuja imagem coincide com o gráfico
da função g : [−1, 1] → R , g(t) = |t|. Se a é um ponto interior de I tal que
f (a) = (0, 0), prove que f ′ (a) = 0.
3. Seja f : R → R3 a hélice cilı́ndrica, definida no Exemplo 3 por f (t) =
(cos t, sen t, t). Prove que, para todo t ∈ R, a reta que liga os pontos f (t)
e f (t) + f ′′ (t) intersecta o eixo vertical de R3 .
4. O caminho g : R → R3 , definido por g(t) = (a cos bt, a sen bt, ct), é também
chamado de hélice. Determine a relação entre as constantes a, b, c a fim de
que o caminho g esteja parametrizado pelo comprimento de arco.
Seção 5
Seção 2:
Exercı́cios
53
Cálculo diferencial de caminhos
1. Seja f : [a, b] → Rn um caminho diferenciável tal que f (a) = f (b) = 0. Prove
que existe c ∈ (a, b) tal que hf (c), f ′ (c)i = 0.
2. Sejam f1 , f2 : I → Rm caminhos diferenciáveis e ϕ : Rm × Rm → Rn uma
aplicação bilinear. Prove que o caminho g : I → Rn , dado por g(t) =
ϕ(f1 (t), f2 (t)), é diferenciável e g ′ (t) = ϕ(f1′ (t), f2 (t)) + ϕ(f1 (t), f2′ (t)) para
todo t ∈ I. Estenda este resultado para aplicações p-lineares ϕ : Rm × · · · ×
2
Rm → Rn e conclua daı́ que se f : (−ε, ε) → Rm é um caminho diferenciável
de matrizes m × m com f (0) = Im e g : I → R é a função definida por
g(t) = det ·f (t) então g ′ (0) = tr ·a (traço de matriz a), onde a = f ′ (0).
2
3. Seja f : I → Rn um caminho diferenciável cujos valores são matrizes n × n.
2
Prove que g : I → Rn , dado por g(t) = f (t)k , é diferenciável e calcule g ′ (t).
Seção 3:
A integral de um caminho
1. Sejam f : [a, b] → Rn e ϕ : [a, b] → R de classe C 1 . Se |f ′ (t)| ≤ ϕ′ (t) para todo
t ∈ (a, b), prove que |f (b) − f (a)| ≤ ϕ(b) − ϕ(a).
2. Seja f : [a, a + h] → Rn um caminho de classe C k . Prove que
f (a + h) = f (a) + h · f ′ (a) + · · · +
onde
rk =
hk
(k − 1)!
Z
1
0
hk−1 (k−1)
f
(a) + rk
(k − 1)!
(1 − t)k−1 f (k) (a + th) dt.
3. Sejam f, g : [a, b] → Rn caminhos de classe C 1 . Prove que
Z b
Z b
hf (t), g ′ (t)idt = hf (b), g(b)i − hf (a), g(a)i −
hf ′ (t), g(t)i dt.
a
a
4. Seja × o produto vetorial em R3 . Para todo v ∈ R3 e todo caminho f : [a, b] →
Z b
Z b
R3 , prove que
[v × f (t)]dt = v ×
f (t)dt.
a
a
5. Seja A ⊂ Rn convexo. Se o caminho f : [a, b] → Rn cumpre f (t) ∈ A para todo
Z b
1
f (t)dt ∈ A.
t ∈ [a, b], prove que
b−a a
Seção 4:
Caminhos retificáveis
1. Seja f : [a, b] → Rn um caminho de classe C 1 , com f (a) = A e f (b) = B. Se
seu comprimento é l(f ) = |B − A|, prove que f é uma reparametrização do
caminho retilı́neo [A, B].
2. Seja f : [0, L] → S 1 ⊂ R2 um caminho de classe C 1 (com |f (t)| = 1 para todo
Z
1 L
t ∈ [0, L]). Se seu valor médio m =
f (t)dt pertence a S 1 , prove que f é
L 0
constante.
54
Caminhos em Rn
Cap. 2
3. Seja U ⊂ Rn aberto e conexo. Dados a, b ∈ U , prove que existe um caminho
retificável f : I → U começando em a e terminando em b.
4. Dado U ⊂ Rn aberto e conexo, defina a distância intrı́nseca entre os pontos
a, b ∈ U como o ı́nfimo dU (a, b) dos comprimentos dos caminhos retificáveis
f : I → U , que ligam a e b. Prove que se (xk ) é uma seqüência de pontos em
U e a ∈ U , tem-se lim xk = a se, e somente se, lim dU (xk , a) = 0.
3
Funções Reais de n Variáveis
1
Derivadas parciais
Seja f : U → R uma função definida no aberto U ⊂ Rn . Para cada i =
1, . . . , n, a i-ésima derivada parcial de f no ponto a = (a1 , . . . , an ) ∈ U
é o número
∂f
f (a + tei ) − f (a)
f (a1 , . . . , ai + t, . . . , an ) − f (a)
(a) = lim
= lim
,
t→0
t→0
∂xi
t
t
caso este limite exista. Como U é aberto, podemos achar δ > 0 tal
que a + tei ∈ U para todo t ∈ (−δ, δ). Então está bem definido o
caminho retilı́neo λ : (−δ, δ) → U , λ(t) = a + tei . A definição acima
∂f
diz que
(a) = (f ◦ λ)′ (0) = derivada, no ponto t = 0, da função real
∂xi
f ◦ λ : (−δ, δ) → R.
Observemos que ∂f /∂xi significa a derivada de f em relação a sua
i-ésima variável, seja qual for o nome que se atribua a ela. Assim
∂f
∂f
∂f
=
=
, etc.
∂xi
∂yi
∂zi
Uma notação alternativa, que evitaria mal-entendidos, seria ∂i f . Preferimos a notação tradicional ∂f /∂xi porque ela é conveniente quando se
usa a regra da cadeia.
Quanto n = 2 ou n = 3, escrevemos (x, y) em vez de (x1 , x2 ) e
(x, y, z) em vez de (x1 , x2 , x3 ). Assim, ∂f /∂x, ∂f /∂y e ∂f /∂z são as
derivadas parciais de f em relação à primeira, a segunda e a terceira
variáveis respectivamente.
56
Funções Reais de n Variáveis
Cap. 3
Exemplo 1. Seja f : R2 → R definida por f (x, y) = xy/(x2 + y 2 ) se
x2 + y 2 6= 0 e f (0, 0) = 0. Como f (0, y) = 0 para todo y e f (x, 0) = 0
∂f
∂f
para todo x, segue-se que
(0, 0) = 0 e
(0, 0) = 0. Entretanto a
∂x
∂y
função f é descontı́nua na origem (0, 0). Com efeito, se chamarmos de θ
o ângulo que o vetor não-nulo v = (x, y) forma com o eixo das abcissas,
veremos que
x
y
f (x, y) = p
·p
= cos θ · sen θ.
2
2
2
x +y
x + y2
Logo, atribuindo diferentes valores a θ, podemos fazer com que f (x, y)
tenha limites diferentes quando (x, y) tende para (0, 0) ao longo do segmento x = t cos θ, y = t sen θ, ou seja, quando t → 0.
⊳
O exemplo acima mostra que a existência das n derivadas parciais
no ponto a não assegura a continuidade da função f nesse ponto. Para
cada i = 1, . . . , n, a função λ(t) = f (a + tei ) é essencialmente a restrição
de f ao segmento (a − δei , a + δei ) da reta que passa pelo ponto a e é
∂f
(a) =
paralela ao i-ésimo eixo coordenado de Rn . A derivada parcial
∂xi
(f ◦ λ)′ (0) dá informação apenas sobre o comportamento de f ao longo
desse segmento. Em particular, a existência das n derivadas parciais de
f no ponto a implica que a restrição de f a cada um dos n segmentos
paralelos aos eixos, que se cortam no ponto a, é contı́nua, embora não
garanta a continuidade de f : U → R em a.
Se ∂f /∂xi existe e é positiva em todos os pontos do segmento de reta
[a−δei , a+δei ], paralelo ao i-ésimo eixo coordenado, então f é crescente
ao longo desse segmento: s < t ⇒ f (a + sei ) < f (a + tei ), desde que
|s| ≤ δ e |t| ≤ δ. Isto resulta imediatamente do resultado análogo para
funções de uma variável.
A noção de derivada parcial também faz sentido para aplicações
f : U → Rn , com U ⊂ Rm aberto. Se a ∈ U , põe-se, para cada
i = 1, . . . , m:
∂f
f (a + tei ) − f (a)
(a) = lim
·
t→0
∂xi
t
Evidentemente, ∂f /∂xi é um vetor de Rn . Se f = (f1 , . . . , fn ) então
∂f
∂fn
∂f1
(a) =
(a), . . . ,
(a) .
∂xi
∂xi
∂xi
Funções de classe C 1
Seção 2
57
Neste capı́tulo, porém, daremos prioridade às funções com valores
numéricos. Para elas tem sentido o vetor gradiente, conceito de forte
apelo intuitivo, que contribui para entendermos como cresce (ou decresce) f (x).
2
Funções de classe C 1
Seja f : U → R uma função que possui as n derivadas parciais em todos
os pontos do aberto U ⊂ Rn . Ficam então definidas n funções
∂f
∂f
∂f
∂f
,...,
: U → R, onde
: x 7→
(x).
∂x1
∂xn
∂xi
∂xi
Se estas funções forem contı́nuas em U , diremos que f é uma função de
classe C 1 e escreveremos f ∈ C 1 .
Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se de
classe C 1 quando cada uma de suas funções-coordenada f1 , . . . , fn : U →
R é de classe C 1 .
Muitas propriedades importantes das funções de classe C 1 resultam
de serem elas diferenciáveis no sentido seguinte.
Uma função f : U → R, definida no aberto U ⊂ Rn , diz-se diferenciável no ponto a ∈ U quando cumpre as seguintes condições:
∂f
∂f
(a), . . . ,
(a).
1. Existem as derivadas parciais
∂x1
∂xn
2. Para todo v = (α1 , . . . , αn ) tal que a + v ∈ U , tem-se
n
X
∂f
· αi + r(v), onde
f (a + v) − f (a) =
∂xi
i=1
lim
|v|→0
r(v)
= 0.
|v|
Observações. 1. Acima, e sempre que fizermos considerações em torno
∂f
de um ponto especı́fico a, escreveremos, por simplicidade,
em vez
∂xi
∂f
(a).
de
∂xi
2. A essência da definição da diferenciabilidade está na condição
lim (r(v)/|v|) = 0, pois a igualdade que define o “resto”r(v) pode ser
v→0
escrita para qualquer função que possua as n derivadas parciais.
r(v)
r(v)
De lim
= 0 resulta que lim r(v) = 0 pois r(v) =
· |v|.
v→0 |v|
v→0
|v|
Segue-se que lim [f (a + v) − f (a)] = 0. Portanto, toda função difev→0
renciável no ponto a é contı́nua nesse ponto.
58
Funções Reais de n Variáveis
Cap. 3
Diremos que f : U → R é diferenciável quando f for diferenciável
em todos os pontos de U .
Quando n = 1, a função f : U → R é diferenciável no ponto a se,
e somente se, possui derivada neste ponto pois, como podemos agora
dividir por v ∈ R, de f (a + v) − f (a) = (df /dx) · v + r(v) resulta
r(v)
f (a + v) − f (a)
df
=±
−
(a) ,
|v|
v
dx
portanto lim
v→0
df
f (a + v) − f (a)
r(v)
= 0 ⇔ lim
=
(a).
v→0
|v|
v
dx
Teorema 1. Toda função f : U → R de classe C 1 é diferenciável.
Demonstração. Por simplicidade, suporemos U ⊂ R2 . O caso geral se
trata analogamente, apenas com uma notação mais elaborada. Fixemos
c = (a, b) ∈ U e tomemos v = (h, k) tal que c + v ∈ B ⊂ U , onde B é
uma bola de centro c. Seja
r(v) = r(h, k) = f (a + h, b + k) − f (a, b) −
∂f
∂f
·h−
· k,
∂x
∂y
onde as derivadas são calculadas no ponto c = (a, b). Podemos escrever
r(v) = f (a + h, b + k) − f (a, b + k) + f (a, b + k) − f (a, b)
∂f
∂f
·h−
· k.
−
∂x
∂x
Pelo Teorema do Valor Médio para funções de uma variável real, existem
θ1 , θ2 ∈ (0, 1) tais que
r(v) =
∂f
∂f
∂f
∂f
(a + θ1 h, b + k) · h +
(a, b + θ2 k) · k −
·h−
· k,
∂x
∂y
∂x
∂y
logo
r(v)
∂f
∂f
h
=
(a + θ1 h, b + k) −
(a, b) √
2
|v|
∂x
∂x
h + k2
∂f
k
∂f
(a, b + θ2 k) −
(a, b) √
+
·
2
∂y
∂y
h + k2
Quando v → 0 os termos dentro dos colchetes acima tendem a zero, pela
continuidade das derivadas ∂f /∂x e ∂f /∂y. Além disso, os termos fora
Funções de classe C 1
Seção 2
59
dos colchetes têm valor absoluto ≤ 1. Portanto lim r(v)/|v| = 0 e então
v→0
f é diferenciável.
Corolário 1. Toda função de classe C 1 é contı́nua.
Às vezes, como na demonstração a seguir, é mais conveniente tomar
ρ = ρ(v) = r(v)/|v| e escrever ρ|v| em vez de r(v). Então a diferenciabilidade de f se exprime como
f (a + v) − f (a) =
n
X
∂f
· αi + ρ|v|,
∂xi
i=1
com lim ρ = 0.
v→0
Teorema 2. Sejam U ⊂ Rm , V ⊂ Rn abertos, f : U → V uma
aplicação cujas funções-coordenada f1 , . . . , fn possuem derivadas parciais no ponto a ∈ U e g : V → R uma função diferenciável no ponto
b = f (a). Então g ◦ f : U → R possui derivadas parciais no ponto a e
vale
n
∂(g ◦ f ) X ∂g ∂fk
=
·
, i = 1, . . . , m,
∂xi
∂yk ∂xi
k=1
onde as derivadas parciais relativas aos xi são calculadas no ponto a e
as relativas a yk são calculadas no ponto b = f (a).
Além disso, se f e g são ambas de classe C 1 então g ◦ f ∈ C 1 .
Observação. No Capı́tulo 5 provaremos, mais geralmente, que se f e g
forem diferenciáveis então g ◦ f é diferenciável.
Demonstração. Podemos escrever
g(f (a + tei )) − g(f (a)) =
n
X
∂g
· [fk (a + tei ) − fk (a)]
∂yk
k=1
+ ρ(t) · |f (a + tei ) − f (a)|
onde, por simplicidade, escrevemos ρ(t) em vez de ρ(v) com v =
f (a + tei ) − f (a). A diferenciabilidade de g nos dá lim ρ(t) = 0. Então
t→0
n
g(f (a + tei )) − g(f (a)) X ∂g fk (a + tei ) − fk (a)
=
·
t
∂yk
t
k=1
± ρ(t)
f (a + tei ) − f (a)
.
t
60
Funções Reais de n Variáveis
Cap. 3
Logo
n
g(f (a + tei )) − g(f (a)) X ∂g ∂fk
∂(g ◦ f )
= lim
=
·
t→0
∂xi
t
∂yk ∂xi
k=1
pois
lim ρ(t) = 0 e lim
t→0
t→0
f (a + tei ) − f (a)
∂f
=
(a) .
t
∂xi
O fato de que g ◦ f ∈ C 1 decorre da expressão de ∂(g ◦ f )/∂xi em
termos das derivadas parciais de g e das fk , que são contı́nuas.
O gradiente de uma função diferenciável f : U → R no ponto a ∈ U
é o vetor
∂f
∂f
(a), . . . ,
(a) .
grad f (a) =
∂x1
∂xn
Se v é qualquer vetor de Rn , a derivada direcional de f no ponto a,
na direção de v é, por definição,
f (a + tv) − f (a)
∂f
(a) = lim
·
t→0
∂v
t
Estas definições permitem enunciar os seguintes corolários da Regra
da Cadeia. O primeiro deles mostra que, quando f é diferenciável no
∂f
(a) existe em relação a qualquer vetor
ponto a, a derivada direcional
∂v
v, dá uma expressão para essa derivada em termos das derivadas parciais
de f e das coordenadas de v e, finalmente, mostra que, na definição de
∂f
(a), em vez do caminho retilı́neo t 7→ a + tv, pode-se usar qualquer
∂v
caminho λ : (−δ, δ) → U desde que se tenha λ(0) = a e λ′ (0) = v. O
Corolário 3 é, na realidade, um importante teorema.
Corolário 2. Seja f : U → R diferenciável no aberto U ⊂ Rn , com
a ∈ U . Dado o vetor v = (α1 , . . . , αn ), se λ : (−δ, δ) → U é qualquer
caminho diferenciável tal que λ(0) = a e λ′ (0) = v, tem-se
n
X ∂f
∂f
(a) =
(a) · αi .
(f ◦ λ) (0) = h grad f (a), vi =
∂v
∂xi
′
i=1
Funções de classe C 1
Seção 2
61
Basta aplicar diretamente a fórmula
n
X
∂f dλi
·
,
(f ◦ λ) =
∂xi dt
′
i=1
dλi
(0).
observando que, para λ(t) = (λ1 (t), . . . , λn (t)), tem-se αi =
dt
∂f
Notar ainda que
(a) = (f ◦ λ)′ (0) com λ(t) = a + tv, pois λ′ (0) = v.
∂v
Corolário 3 (Teorema do Valor Médio). Dada f : U → R diferenciável no aberto U ⊂ Rn , se o segmento de reta [a, a + v] estiver
contido em U então existe θ ∈ (0, 1) tal que
∂f
(a + θv) = h grad f (a + θv), vi
∂v
n
X
∂f
(a + θv) · αi
=
∂xi
f (a + v) − f (a) =
i=1
onde v = (α1 , . . . , αn ).
Com efeito, considerando o caminho retilı́neo λ : [0, 1] → U , dado
por λ(t) = a + tv, vemos que f (a + v) − f (a) = (f ◦ λ)(1) − (f ◦ λ)(0).
Pelo Teorema do Valor Médio para funções de uma variável real, existe
θ ∈ (0, 1) tal que (f ◦ λ)(1) − (f ◦ λ)(0) = (f ◦ λ)′ (θ). Pela Regra da
Cadeia,
(f ◦ λ)′ (θ) =
n
X
∂f
∂f
(a + θv) · αi =
(a + θv) = h grad f (a + θv), vi.
∂xi
∂v
i=1
Corolário 4. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se o
segmento de reta [a, a + v] estiver contido em U e existir M > 0 tal que
| grad f (a+tv)| ≤ M para todo t ∈ [0, 1] então |f (a+v)−f (a)| ≤ M ·|v|.
Com efeito, pela desigualdade de Schwarz,
|f (a + v) − f (a)| = |h grad f (a + θv), vi| ≤ | grad f (a + θv)| |v| ≤ M · |v|.
Em particular, se U é convexo, se f é diferenciável e se | grad f (x)| ≤
M para todo x ∈ U então |f (y) − f (x)| ≤ M |x − y| quaisquer que sejam
x, y ∈ U .
Corolário 5. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se U é
conexo e grad f (x) = 0 para todo x ∈ U então f é constante.
62
Funções Reais de n Variáveis
Cap. 3
Com efeito, pelo Teorema do Valor Médio (Corolário 3), f é constante ao longo de todo segmento de reta contido em U . Ora, sendo
o aberto U conexo, dois quaisquer de seus pontos podem ser ligados
por um caminho poligonal (justaposição de segmentos de reta) contido
em U .
Dada f : U → R de classe C 1 , o conjunto f −1 (c) = {x ∈ U ; f (x) = c}
é, para todo c ∈ R, chamado o conjunto de nı́vel c da função f . Quando
U ⊂ Rn e n = 2 esse conjunto é geralmente chamado a curva ou linha de
nı́vel c de f , a qual é definida pela equação f (x, y) = c. Analogamente,
quando n = 3, o conjunto f −1 (c), definido pela equação f (x, y, z) =
c costuma ser chamado a superfı́cie de nı́vel c da função f . Deve-se
observar porém que, para certas funções especialmente escolhidas, tais
conjuntos podem ser bem diferentes daquilo que se imagina como uma
curva ou uma superfı́cie.
Mencionaremos a seguir algumas propriedades do gradiente. Elas
justificam a importância desse vetor, o qual dá interessantes informações
sobre o comportamento da função.
Para isto, fixaremos a∈U , suporemos que f ∈C 1 e que grad f (a) 6= 0.
Então:
1) O gradiente aponta para uma direção segundo a qual a função é
crescente;
2) Dentre todas as direções ao longo das quais f cresce, a direção do
gradiente é a de crescimento mais rápido;
3) O gradiente de f no ponto a é ortogonal ao conjunto de nı́vel de
f que passa por a.
Vejamos o que significam estas afirmações.
Em primeiro lugar, pondo w = grad f (a) temos
∂f
(a) = h grad f (a), wi = | grad f (a)|2 > 0
∂w
Isto quer dizer que se λ : (−ε, ε) → U é tal que λ ∈ C 1 , λ(0) = a e
= grad f (a) então a função t 7→ f (λ(t)) tem derivada positiva no
ponto t = 0. Logo, diminuindo ε se necessário, f ◦ λ : (−ε, ε) → R será
uma função crescente. É este o significado de “f cresce na direção do
gradiente.”
λ′ (0)
Funções de classe C 1
Seção 2
63
grad f (x)
f −1 (c)
Figura 3.1
Como ∂f /∂v = h grad f, vi, os vetores v que apontam para as direções
ao longo das quais f cresce são aqueles para os quais se tem
h grad f, vi > 0, isto é, aqueles que formam um ângulo agudo com
grad f (a). Dizer que o crescimento de f é mais rápido na direção do
gradiente significa o seguinte: se v ∈ Rn é tal que |v| = | grad f (a)| então
∂f
∂f
(a) ≤
.
∂v
∂(grad f (a))
Com efeito, pela desigualdade de Schwarz:
∂f
(a) = h grad f (a), vi ≤ | grad f (a)| · |v|
∂v
∂f
= | grad f (a)|2 =
·
∂(grad f (a))
Esclareçamos agora a terceira das afirmações acima.
Dizer que w ∈ Rn é ortogonal ao conjunto de nı́vel f −1 (c) significa
que, dado qualquer caminho λ : (−ε, ε) → f −1 (c), diferenciável no ponto
t = 0, com λ(0) = a, tem-se hw, λ′ (0)i = 0. Ora, λ(t) ∈ f −1 (c) significa
que f (λ(t)) = c para todo t ∈ (−ε, ε), portanto f ◦ λ : (−ε, ε) → R é
constante, igual a c, logo (f ◦ λ)′ (0) = 0, ou seja h grad f (a), λ′ (0)i = 0.
Assim, grad f (a) é ortogonal ao vetor velocidade no ponto a = λ(0)
de qualquer caminho diferenciável λ contido no conjunto de nı́vel f −1 (c).
Ficam portanto constatadas as três propriedades do gradiente acima
enunciadas. Vejamos agora alguns exemplos simples.
Exemplo 2. Sejam f, g, h : R2 → R definidas por f (x, y) = ax + by
(com a2 + b2 6= 0), g(x, y) = x2 + y 2 e h(x, y) = x2 − y 2 . A linha
de nı́vel c de f é a reta definida pela equação ax + by = c. O vetor
grad f (x, y) é constante: grad f = (a, b) em qualquer ponto (x, y) ∈ R2 .
64
Funções Reais de n Variáveis
Cap. 3
Assim as linhas de nı́vel de f são retas paralelas umas às outras, todas
perpendiculares ao vetor v = (a, b).
O conjunto de nı́vel c da função g(x, y) = x2 + y 2 é vazio se c < 0 e
reduz-se ao ponto 0 ∈ R2 quando c = 0. Para c > 0, a linha de nı́vel c
é a circunferência de equação x2 + y 2 = c, cujo centro é a origem e cujo
√
raio é c. O gradiente de g é grad g(x, y) = (2x, 2y), um vetor colinear
com o raio, o que era de esperar pois a tangente da circunferência é
perpendicular ao raio no ponto de contacto.
A linha de nı́vel 0 da função h(x, y) = x2 − y 2 é o par de retas
perpendiculares definidas pela equação x2 − y 2 = 0, que equivale a
“x+y = 0 ou x−y = 0”. Se c > 0, x2 −y 2 = c define uma hipérbole cujo
eixo é o eixo das abcissas; se c < 0 a hipérbole x2 −y 2 = c tem como eixo o
eixo das ordenadas. O gradiente de h é o vetor grad h(x, y) = (2x, −2y).
Atribuindo valores particulares a x e y, vemos que este vetor é perpendicular à curva de nı́vel que passa em (x, y) e aponta na direção de
crescimento de h.
⊳
(2x, 2y)
(a, b)
(x, y)
x2 + y 2 = c
ax + by = c
x2 − y 2 = c
(x, y)
(2x, −2y)
Figura 3.2
Chama-se ponto crı́tico de uma função diferenciável f : U → R um
ponto a ∈ U tal que grad f (a) = 0.
Seção 3
O Teorema de Schwarz
65
A função f do Exemplo 2 não possui ponto crı́tico. As funções g e h
do mesmo exemplo têm a origem como ponto crı́tico. Nota-se em ambos
os casos uma quebra de regularidade na disposição das curvas de nı́vel
quando se atinge um nı́vel em que há ponto crı́tico.
3
O Teorema de Schwarz
Seja f : U → R uma função que possui as derivadas parciais
∂f
(x), . . . ,
∂x1
∂f
(x) em todo ponto x do aberto U ⊂ Rn . A j-ésima derivada parcial
∂xn
∂f
: U → R no ponto x ∈ U será indicada por
da função
∂xi
∂2f
∂
(x) =
∂xj ∂xi
∂xj
∂f
∂xi
(x),
i, j = 1, . . . , n.
Se essas derivadas parciais de segunda ordem existirem em cada
∂2f
ponto x ∈ U , teremos n2 funções
: U → R. Quando tais funções
∂xj ∂xi
forem contı́nuas, diremos que f é de classe C 2 e escreveremos f ∈ C 2 .
Em geral, a mera existência das derivadas parciais de segunda ordem
em todos os pontos onde f está definida não assegura que se tenha
∂2f
∂2f
=
,
∂xj ∂xi
∂xi ∂xj
como se vê no exemplo abaixo.
xy(x2 − y 2 )
x2 + y 2
quando x2 + y 2 =
6 0 e f (0, 0) = 0. Para todo y =
6 0 tem-se f (0, y) = 0,
logo
∂f
f (x, y)
y(x2 − y 2 )
(0, y) = lim
= lim
= −y,
x→0
x→0 x2 + y 2
∂x
x
Exemplo 3. Seja f : R2 → R definida por f (x, y) =
Portanto
∂
∂2f
(0, 0) =
∂y∂x
∂y
∂f
(0, y) = −1.
∂x
66
Funções Reais de n Variáveis
Um cálculo análogo mostra que
Cap. 3
∂2f
(0, 0) = 1. Logo
∂x∂y
∂2f
∂2f
(0, 0) 6=
(0, 0).
∂x∂y
∂y∂x
⊳
Em todo ponto x ∈ U onde existem as derivadas parciais de segunda
∂2f
(x) formam
ordem da função f : U → R, os números hij (x) =
∂xi ∂xj
uma matriz h (x) = [hij (x)], chamada a matriz hessiana da função f .
O Teorema de Schwarz afirma que se f é de classe C 2 então a matriz
hessiana de f é simétrica.
A demonstração que daremos para o Teorema de Schwarz se baseia
num resultado, atribuı́do a Leibniz, segundo o qual é permitido derivar
sob o sinal de integral, desde que o resultado da derivação seja uma
função contı́nua. Por sua vez, a demonstração do Teorema de Leibniz
utiliza o lema abaixo, que poderia estar no Capı́tulo 1 mas é colocado
aqui para deixar claro como cada proposição depende da anterior.
Lema 1. Sejam X ⊂ Rm um conjunto arbitrário e K ⊂ Rn compacto.
Fixemos x0 ∈ X. Se f : X × K → Rp é contı́nua então, para todo
ε > 0 dado, pode-se obter δ > 0 tal que x ∈ X e |x − x0 | < δ implicam
|f (x, t) − f (x0 , t)| < ε, seja qual for t ∈ K.
Demonstração. Do contrário existiriam ε > 0 e seqüências de pontos
xk ∈ X e tk ∈ K tais que |xk − x0 | < 1/k e |f (xk , tk )−f (x0 , tk )| ≥
ε. Passando a uma subseqüência, se necessário, podemos admitir que
lim tk = t0 ∈ K. Como, evidentemente, lim xk = x0 , a continuidade de
f nos daria ε ≤ lim |f (xk , tk ) − f (x0 , tk )| = |f (x0 , t0 ) − f (x0 , t0 )| = 0,
uma contradição.
Teorema 3 (Derivação sob o sinal de integral). Dado U ⊂ Rn
aberto, seja f : U × [a, b] → R contı́nua, tal que a i-ésima derivada
∂f
parcial
(x, t) existe para todo ponto (x, t) ∈ U × [a, b] e a função
∂xi
∂f /∂xi : U × [a, b] → R, assim definida, é contı́nua. Então a função
Z b
f (x, t)dt, possui a i-ésima derivada
ϕ : U → R, dada por ϕ(x) =
a
Z b
∂f
∂ϕ
(x) =
(x, t)dt. Em
parcial em cada ponto x ∈ U , sendo
∂xi
a ∂xi
Seção 3
O Teorema de Schwarz
67
suma: pode-se derivar sob o sinal de integral, desde que o integrando
resultante seja uma função contı́nua.
Demonstração. Para todo s suficientemente pequeno, o segmento de
reta [x, x + sei ] está contido em U . Temos
Z b
∂f
ϕ(x + sei ) − ϕ(x)
−
(x, t) dt =
s
∂x
i
a
Z b
f (x + sei , t) − f (x, t)
∂f
=
−
(x, t) dt.
s
∂xi
a
Mostremos que, dado arbitrariamente ε > 0, existe δ > 0 tal que, para
todo |s| < δ e todo t ∈ [a, b], a expressão sob o último sinal de integral
acima é, em valor absoluto, inferior a ε/(b − a). Isto demonstrará o
teorema. Ora, pelo Teorema do Valor Médio, para cada t ∈ [a, b] existe
θ = θt ∈ (0, 1) tal que
f (x + sei , t) − f (x, t)
∂f
=
(x + θsei , t).
s
∂xi
∂f
: U × [a, b] → R é contı́nua, o Lema 1 fornece, a partir do ε
∂xi
dado, um δ > 0 tal que se tem
Como
∂f
ε
∂f
(x + θsei , t) −
(x, t) <
∂xi
∂xi
b−a
para todo t ∈ [a, b], desde que seja |s| < δ (e conseqüentemente |θs| < δ).
Isto completa a demonstração.
Teorema 4 (Schwarz). Se f : U → R é de classe C 2 no aberto U ⊂ Rn
então, para quaisquer i, j = 1, . . . , n e x ∈ U , tem-se
∂2f
∂2f
(x) =
(x).
∂xi ∂xj
∂xj ∂xi
Demonstração. Sem perda de generalidade, podemos supor que U =
I × J é um retângulo em R2 . Fixando b ∈ J, o Teorema Fundamental
do Cálculo nos diz que, para todo (x, y) ∈ U , tem-se
Z y
∂f
(x, t)dt.
f (x, y) = f (x, b) +
b ∂y
68
Funções Reais de n Variáveis
Cap. 3
Como ∂ 2 f /∂x∂y é contı́nua, podemos derivar sob o sinal de integral,
logo
Z y 2
∂f
∂ f
∂f
(x, y) =
(x, b) +
(x, t)dt.
∂x
∂x
∂x∂y
b
Em seguida, derivamos em relação a y e obtemos
∂2f
∂2f
(x, y) =
(x, y).
∂y∂x
∂x∂y
Mais geralmente, para cada inteiro k ≥ 1, podemos considerar as
derivadas parciais de ordem k de uma função f : U → R, definida no
aberto U ⊂ Rn . Por exemplo, para 1 ≤ i, j, k ≤ n,
2
∂3f
∂
∂ f
(a) significa
(a).
∂xi ∂xj ∂xk
∂xi ∂xj ∂xk
Como toda permutação dos ı́ndices i1 , . . . , ik pode ser obtida por meio
de repetidas inversões de ı́ndices adjacentes, segue-se do Teorema de
Schwarz que a derivada de ordem k
∂kf
(a)
∂xi1 ∂xi2 . . . ∂xik
não depende da ordem em que são feitas as derivações, desde que todas
as derivadas de ordem k de f existam e sejam contı́nuas.
Uma função f : U → R que possui, em cada ponto de U , todas
as derivadas parciais de ordem k, as quais são funções contı́nuas em
U , chama-se uma função de classe C k . Escreve-se então f ∈ C k .
Quando f ∈ C k para todo k = 1, 2, 3, . . . , diz-se que f é uma função de
classe C ∞ .
4
A fórmula de Taylor
A fórmula de Taylor, que estabeleceremos aqui em sua versão restrita
aos termos de até segunda ordem, é fundamental para o estudo do comportamento de uma função de classe C 2 na proximidade de um ponto
crı́tico. Ela se baseia no lema abaixo.
Lema 2. Seja r : B → R de classe C 2 na bola aberta B ⊂ Rn , de centro
∂r
∂2r
0. Se r(0) =
(0) =
(0) = 0 para quaisquer i, j = 1, . . . , n,
∂xi
∂xi ∂xj
r(v)
= 0.
então lim
v→0 |v|2
Seção 4
A fórmula de Taylor
69
Demonstração. Sendo r : B → R uma função de classe C 1 (portanto
diferenciável) que se anula, juntamente com todas as suas derivadas
∂r/∂xi , no ponto v = 0, segue-se da definição de função diferenciável
que lim r(v)/|v| = 0. Pelo Teorema do Valor Médio (Corolário 3 do
v→0
Teorema 2), para cada v=(α1 , . . . , αn )∈B existe θ tal que 0 < θ < 1 e
n
n
X
∂r
r(v) X
r(v) =
(θv) · αi , logo
=
∂xi
|v|2
i=1
i=1
∂r
∂xi (θv)
|θv|
·
θαi
·
|v|
Como cada derivada parcial ∂r/∂xi se anula, juntamente com todas as
suas derivadas ∂ 2 r/∂xj ∂xi , no ponto 0, resulta da nossa observação
inicial que
∂r
(θv)/|θv| = 0 para todo i = 1, . . . , n.
lim
v→0 ∂xi
Além disso, cada quociente θαi /|v| tem valor absoluto ≤ 1. Por conser(v)
guinte lim
= 0.
v→0 |v|2
Teorema 5 (Fórmula de Taylor). Seja f : U → R de classe C 2 no
aberto U ⊂ Rn . Fixado a ∈ U , para todo v = (α1 , . . . , αn ) ∈ Rn tal que
a + v ∈ U , escrevamos
n
n
X
1 X ∂2f
∂f
· αi +
· αi αj + r(v),
f (a + v) − f (a) =
∂xi
2
∂xi ∂xj
i,j=1
i=1
r(v)
= 0.
v→0 |v|2
Demonstração. De acordo com o Lema 2 devemos demonstrar que
as derivadas sendo calculadas no ponto a. Então lim
n
n
X
∂f
1 X ∂2f
r(v) = f (a + v) − f (a) −
· αi −
· αi αj
∂xi
2
∂xi ∂xj
i=1
i,j=1
se anula, juntamente com suas derivadas parciais de primeira e segunda
ordem, no ponto v = 0.
Para fazer o cálculo, começamos lembrando que, na expressão de
r(v), as variáveis independentes são as coordenadas α1 , . . . , αn de v.
É em relação a elas que as derivadas parciais de r devem ser tomadas, embora continuemos escrevendo ∂r/∂xi e ∂ 2 r/∂xi ∂xj . Observemos também que, no somatório duplo que ocorre na definição de r(v),
70
Funções Reais de n Variáveis
Cap. 3
cada par de variáveis αi , αj aparece em duas parcelas iguais, a saber,
∂2f
∂2f
· αj αi e
· αi αj . Levando isto em conta, temos:
∂xj ∂xi
∂xi ∂xj
n
X ∂2f
∂r
∂f
∂f
(v) =
(a + v) −
(a) −
(a) · αi .
∂xj
∂xj
∂xj
∂xi ∂xj
i=1
Derivando outra vez, vem:
∂2f
∂2f
∂2r
(v) =
(a + v) −
(a).
∂xi ∂xj
∂xi ∂xj
∂xi ∂xj
Conseqüentemente r(0) = 0,
quaisquer i, j = 1, . . . , n.
∂2r
∂r
(0) = 0 e
(0) = 0 para
∂xi
∂xi ∂xj
Observação. Se pusermos ρ(v) =
fórmula de Taylor se escreve assim:
r(v)
quando v 6= 0 e ρ(0) = 0, a
|v|2
n
n
X
1 X ∂2f
∂f
αi +
· αi αj + ρ(v) · |v|2 ,
f (a + v) − f (a) =
∂xi
2
∂xi ∂xj
i=1
i,j=1
onde lim ρ(v) = 0.
v→0
5
Pontos crı́ticos
Uma forma quadrática H : Rn → R é uma função cujo valor no vetor
n
P
hij αi αj , onde [hij ] é uma matriz simétrica n × n.
v = (α1 , . . . , αn ) é
i,j=1
O valor da forma quadrática H no vetor v será indicado com a notação
H · v 2 . Portanto
H · v2 =
n
X
hij αi αj
quando v = (α1 , . . . , αn ).
i,j=1
Se t ∈ R então H · (tv)2 = t2 · (H · v 2 ).
A forma quadrática H chama-se não-negativa quando H · v 2 ≥ 0
para todo v ∈ Rn , positiva quando H · v 2 > 0 para todo v 6= 0 em Rn e
indefinida quando existem v, w ∈ Rn tais que H · v 2 > 0 e H · w2 < 0.
De modo análogo se definem forma quadrática negativa e não-positiva.
Quando H é positiva ou negativa, diz-se que ela é definida.
Seção 5
Pontos crı́ticos
71
Exemplo 4. A forma quadrática H : Rn → R, onde H · v 2 = hv, vi,
é positiva. Como hv, vi = α12 + · · · + αn2 , a matriz de H é a identidade. Para todo k ∈ [1, n], H · v 2 = α12 + · · · + αk2 é uma forma
quadrática não-negativa em Rn . Por outro lado, se pusermos H · v 2 =
2
α12 + · · · + αk2 − αk+1
− · · · − αn2 com 0 < k < n, teremos uma forma
quadrática indefinida. Evidentemente, se H é positiva (respect. nãonegativa) então −H é negativa (respect. não-positiva).
Seja H : Rn → R uma forma quadrática cuja matriz é [hij ].
Se chamarmos de H0 : Rn → Rn o operador linear cuja matriz na
base canônica de Rn é também [hij ], vemos imediatamente que H · v 2 =
hH0 ·v, vi para todo v ∈ Rn . Como a matriz [hij ] do operador H0 na base
canônica é simétrica, H0 é auto-adjunto. Reciprocamente, para qualquer
operador auto-adjunto H0 : Rn → Rn , a função H : Rn → R, dada por
H · v 2 = hH0 · v, vi, é uma forma quadrática. Quando H é definida, o
operador H0 é invertı́vel pois hH0 ·v, vi =
6 0 para todo v 6= 0 ⇒ H0 ·v 6= 0
para todo v 6= 0.
Dada a função f : U → R, de classe C 2 no aberto U ⊂ Rn , a forma
quadrática hessiana
= (Hf )(x) de f no ponto x ∈ U é aquela cuja
H(x)
∂2f
matriz é [hij ] =
(x) . Assim, para todo v = (α1 , . . . , αn ) ∈ Rn ,
∂xi ∂xj
tem-se
n
X
∂2f
2
(x) · αi αj .
H(x) · v =
∂xi ∂xj
i,j=1
A forma hessiana é usada para determinar a natureza dos pontos crı́ticos
da função f .
Diz-se que a ∈ U é um ponto de máximo local da função f : U → R
quando existe δ > 0 tal que f (x) ≤ f (a) para todo x ∈ U ∩B(a; δ). Analogamente se define um ponto de mı́nimo local . Um ponto a, de máximo
(ou de mı́nimo) local de uma função diferenciável f , é um ponto crı́tico
de f . Com efeito, para todo i = 1, . . . , n, se δ > 0 é suficientemente
pequeno então a função ϕ : (−δ, δ) → R, dada por ϕ(t) = f (a + tei ), está
bem definida e possui um máximo (ou mı́nimo) local no ponto t = 0.
∂f
Logo 0 = ϕ′ (0) =
(a), i = 1, . . . , n.
∂xi
Exemplo 5. A origem 0 ∈ R2 é ponto crı́tico das três funções f, g, h :
R2 → R, definidas por f (x, y) = x2 + y 2 , g(x, y) = −x2 − y 2 e h(x, y) =
x2 − y 2 . Para f a origem é um ponto de mı́nimo, para g de máximo e
72
Funções Reais de n Variáveis
Cap. 3
para h não é máximo nem mı́nimo pois em qualquer disco de centro 0 a
função h assume valores maiores e menores do que 0 = h(0, 0).
⊳
Teorema 6. Seja a ∈ U um ponto crı́tico da função f : U → R, de
classe C 2 .
a) Se a forma quadrática hessiana H(a) for positiva então a é um
ponto de mı́nimo local de f .
b) Se H(a) for negativa então a é um ponto de máximo local.
c) Se H(a) for indefinida, então a não é ponto de máximo nem de
mı́nimo local de f .
Demonstração. a) Por simplicidade, escrevamos H em vez de H(a).
Pelo Teorema de Weierstrass, a função contı́nua positiva H assume um
valor mı́nimo 2c > 0 no conjunto compacto S n−1 . Noutras palavras,
existe c > 0 tal que H · u2 ≥ 2c para todo vetor u ∈ Rn com |u| = 1.
Como a é um ponto crı́tico de f , a fórmula de Taylor se resume a
f (a + v) − f (a) =
1
H · v 2 + ρ(v)|v|2 com lim ρ(v) = 0.
v→0
2
Como v/|v| é um vetor unitário (pertencente a S n−1 ), temos
v 2 |v|2
|v|2
1
≥
H · v2 =
H·
· 2c = |v|2 · c.
2
2
|v|
2
Portanto f (a + v) − f (a) ≥ |v|2 (c + ρ(v)).
Pela definição de limite, existe δ > 0 tal que a + v ∈ U e 0 <
|v| < δ implicam |ρ(v)| < c e conseqüentemente c + ρ(v) > 0. Logo
f (a + v) − f (a) > 0, isto é, f (a) < f (a + v) para todo v tal que a + v ∈ U
e 0 < |v| < δ. Assim, a é um ponto de mı́nimo local para f .
b) Segue as mesmas linhas do caso anterior.
c) Dado v ∈ Rn , tem-se a + tv ∈ U para todo t suficientemente
pequeno. Então, lembrando que H · (tv)2 = t2 · (H · v 2 ), temos
f (a + tv) − f (a) = t2 ·
i
v 2
|v|2 h
+ ρ(tv) , com lim ρ(tv) = 0.
· H·
t→0
2
|v|
Segue-se, como acima, que para todo t suficientemente pequeno,
f (a + tv) − f (a) tem o mesmo sinal que H · v 2 . Assim, se H é indefinida,
Seção 5
Pontos crı́ticos
73
com H · v 2 > 0 e H · w2 < 0, em qualquer bola de centro a existem
pontos a + tv e a + tw tais que f (a + tv) > f (a) e f (a + tw) < f (a).
Portanto f não tem máximo nem mı́nimo local no ponto a.
Corolário 6. Se a função f : U → R, de classe C 2 , possui um mı́nimo
(respect. máximo) local no ponto a ∈ U então a forma quadrática hessiana de f é não-negativa (respect. não-positiva) nesse ponto.
Com efeito, se fosse H · v02 < 0 para algum v0 ∈ Rn , terı́amos
f (a + tv0 ) < f (a) para todo t suficientemente pequeno, e então a
não seria um ponto de mı́nimo local. Mesmo argumento para máximo
local.
Exemplo 6. Pela demonstração acima, vê-se que quando a forma
quadrática hessiana é positiva (respect. negativa) no ponto a então
a é um ponto de mı́nimo (respect. máximo) local estrito, isto é, numa
pequena bola de centro a não há outros pontos x com f (x) = f (a). Por
exemplo, a origem é um ponto de mı́nimo estrito da função f (x, y) =
x2 + y 2 mas todos os pontos (x, 0) do eixo das abcissas são pontos
de mı́nimo não-estritos da função g(x, y) = y 2 . (O domı́nio de ambas as funções f, g é R2 .) A forma hessiana de f na origem de R2 é
H · v 2 = 2α2 + 2β 2 se v = (α, β) enquanto a de g é K · v 2 = 2β 2 . Vemos
que H é positiva e K é apenas não-negativa. Já a forma hessiana da
função h(x, y) = x2 − y 2 na origem é L · v 2 = 2α2 − 2β 2 , que é indefinida.
Por isso a origem é um ponto crı́tico que não é máximo nem mı́nimo
local (ponto de sela).
⊳
Exemplo 7. Poder-se-ia indagar se vale a recı́proca do corolário acima.
A resposta é negativa. A função f : R2 → R, dada por f (x, y) = x2 + y 3
tem a origem de R2 como ponto crı́tico, no qual a forma hessiana é
H · v 2 = 2α2 , para v = (α, β). A forma H é não-negativa porém a
origem não é um ponto de mı́nimo local de f .
⊳
Neste ponto, cabe a pergunta: de que modo podemos determinar
se uma dada forma quadrática é positiva, negativa, etc? O método
de completar o quadrado, devido a Lagrange, responde a questão. Este
método, que se baseia na observação óbvia de que a2 +2ab = (a+b)2 −b2 ,
consiste em efetuar sucessivas mudanças de variáveis, visando eliminar,
na expressão da forma quadrática H, os termos como xy, xz, yz, etc,
deixando apenas parcelas do tipo x2 , y 2 , z 2 etc.
Os exemplos a seguir ilustram o método de completar os quadrados.
74
Funções Reais de n Variáveis
Cap. 3
Exemplo 8. Seja a forma quadrática H(x, y) = x2 − xy + y 2 em R2 .
Completando o quadrado, temos
y 2 y 2
y −
·
x2 − xy = x2 − 2x · = x −
2
2
4
Logo
y 2 3 2
y 2 y 2
−
+ y .
+ y2 = x −
H(x, y) = x −
2
4
2
4
√
2
2
Portanto H(x, y) = s + t com s = x − y/2 e t = ( 3/2) · y. Assim,
a forma H é positiva. O mesmo processo, aplicado à forma K, onde
K(x, y) = x2 + 3xy + y 2 nos dá
2
3
9
K(x, y) = x + y − y 2 + y 2 ,
2
4
ou seja,
√
2
5 2
3
5
3
2
2
y.
K(x, y) = x + y − y = s − t com s = x + y e t =
2
4
2
2
Portanto a forma K é indefinida.
⊳
Exemplo 9. Seja em R3 a forma quadrática H(x, y, z) = x2 + y 2 + z 2 +
3xy + 3xz + 4yz. Agrupando os termos que contêm x, temos:
2
9
3
3
2
2
x + 3xy + 3xz = x + 2x · (y + z) = x + (y + z) − (y + z)2
2
2
4
9
9
3
9
= s2 − y 2 − z 2 − yz, com s = x + (y + z).
4
4
2
2
Logo
9 2 9 2 9
y − z − yz + 4yz
4
4
2
5 2 5 2 1
2
= s − y − z − yz.
4
4
2
H(x, y, z) = s2 + y 2 + z 2 −
Agrupando os termos que contêm y:
2
5 2 1
1 2
5
5
2
1
2
− y − yz = −
z
y + yz = −
y+ z +
4
2
4
5
4
5
20
1 2
1
5
z com t = y + z.
= − t2 +
4
20
5
Seção 6
Funções convexas
75
Portanto:
H(x, y, z) = s2 −
5 2
1 2 5 2
5
6
t +
z − z = s2 − t2 − z 2 .
4
20
4
4
5
Concluı́mos então que a forma quadrática H é indefinida. Com efeito,
para z = 0 temos
5
H(x, y, 0) = s − t2 =
4
2
2
5
3
x + y − y2.
2
4
Logo H(x, 0, 0) = x2 e, em particular, H(1, 0, 0) = 1, enquanto
H(−3/2, 1, 0) = −5/4.
⊳
6
Funções convexas
Seja C ⊂ Rn um conjunto convexo. Uma função f : C → R chama-se
convexa quando, para quaisquer x, y ∈ C e t ∈ [0, 1], tem-se
f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y).
Alternativamente: f é convexa quando, para quaisquer x, y ∈ C e
α, β ∈ [0, 1] com α + β = 1, tem-se f (αx + βy) ≤ α · f (x) + β · f (y).
Diz-se que f : C → R é côncava quando −f é convexa. Isto equivale
a dizer que, para quaisquer x, y ∈ C e t ∈ [0, 1] tem-se f ((1 − t)x +
ty) ≥ (1 − t)f (x) + tf (y). Todos os resultados a seguir estabelecidos
para funções convexas valem, com as óbvias modificações, para funções
côncavas.
A combinação linear α1 v1 + · · · + αk vk chama-se uma combinação
convexa de v1 , . . . , vk ∈ Rn quando α1 + · · · + αk = 1 e αi ≥ 0 para
i = 1, . . . , k.
Teorema 7. Se C ⊂ Rn é convexo e v1 , . . . , vk ∈ C então toda combinação convexa α1 v1 +· · ·+αk vk pertence a C. Além disso, se f : C → R
é uma função convexa, tem-se
!
k
k
X
X
f
αi · f (vi ).
αi vi ≤
i=1
i=1
Demonstração. Para k = 1 isto é óbvio e para k = 2 é a definição
de conjunto convexo. Mostraremos por indução em k que a combinação
76
Funções Reais de n Variáveis
Cap. 3
convexa de k elementos de C ainda pertence a C. Supondo este fato
verdadeiro para um certo k, escrevamos uma combinação convexa dos
elementos v1 , . . . , vk+1 ∈ C sob a forma
k+1
X
αi vi =
k
X
αi vi + αk+1 vk+1 .
i=1
i=1
Sem perda de generalidade, podemos admitir que αk+1 6= 1. Então,
k
P
αi , temos αk+1 = 1 − α e α 6= 0. Pela hipótese de
pondo α =
i=1
indução, levando em conta que
pertence a C. Logo
k+1
X
i=1
k α
k α
P
P
i
i
= 1, vemos que v =
vi
i=1 α
i=1 α
αi vi = αv + (1 − α)vk+1 ∈ C,
pois C é convexo.
A segunda parte também se prova por indução, pois
f
k+1
X
i=1
αi vi
!
=f
k
X
αi vi + αk+1 vk+1
i=1
=f
α·
≤α·f
≤α·
k
X
αi
i=1
k
X
i=1
k
X
αi
i=1
α
α
!
vi + (1 − α)vk+1
αi
vi
α
!
!
+ (1 − α)f (vk+1 )
f (vi ) + (1 − α)f (vk+1 ) =
k+1
X
αi f (vi ).
i=1
Teorema 8. Seja C ⊂ Rn convexo. A fim de que a função f : C → R
seja convexa, é necessário e suficiente que, para quaisquer a, b ∈ C, a
função ϕ : [0, 1] → R, definida por ϕ(t) = f (a + tv), v = b − a, seja
convexa.
Equivalentemente: f : C → R é convexa se, e somente se, sua restrição a qualquer segmento de reta [a, b] ⊂ C é convexa.
Seção 6
Funções convexas
77
Demonstração. Se f é convexa então, para s, t, α ∈ [0, 1] temos
ϕ (1 − α)s + αt = f (a + [(1 − α)s + αt]v)
= f [(1 − α) · (a + sv) + α · (a + tv)]
≤ (1 − α)f (a + sv) + αf (a + tv)
= (1 − α)ϕ(s) + αϕ(t)
logo ϕ é convexa.
Reciprocamente, se todas as funções ϕ, definidas do modo acima, são
convexas então, dados x, y ∈ C e α ∈ [0, 1], pomos ϕ(t) = f (x + t(y − x))
e temos:
f (1 − α)x + αy = f x + α(y − x) = ϕ(α) = ϕ (1 − α) · 0 + α · 1
≤ (1 − α) · ϕ(0) + α · ϕ(1) = (1 − α) · f (x) + α · f (y),
portanto f é convexa.
Como aplicação do Teorema 8, mostremos que se f : U → R é uma
função convexa e o conjunto convexo U ⊂ Rn é aberto então, para cada
a ∈ U , existe a derivada de Gâteux
∂f
f (a + tv) − f (a)
(a) = lim
·
+
+
∂v
t
t→0
Com efeito, a função ϕ : [0, 1] → R definida por ϕ(t) = f (a + tv)
é convexa, portanto existe a derivada à direita ϕ′+ (0) (veja Vol. 1,
∂f
pág. 108). Mas, como se vê facilmente, ϕ′+ (0) = + (a).
∂v
Daı́ se conclui, como no Vol. 1, que toda função convexa definida
num subconjunto aberto de R é contı́nua. Este resultado continua válido
em Rn com n > 1 (ver Apêndice deste capı́tulo) porém não decorre da
existência da derivada de Gâteaux, pois uma função em Rn pode ser
contı́nua ao longo de cada reta que passa por um ponto a sem que seja
necessariamente contı́nua nesse ponto.
Teorema 9. Seja f : U → R definida no aberto convexo U ⊂ Rn . Então:
a) O conjunto E(f ) = {(x, y) ∈ U × R; y ≥ f (x)} ⊂ Rn+1 , chamado
o epigráfico de f , é convexo se, e somente se, f é convexa.
b) Supondo-a de classe C 1 , a função f é convexa se, e somente se,
para a, a + v ∈ U quaisquer, tem-se
f (a + v) ≥ f (a) + h grad f (a), vi.
78
Funções Reais de n Variáveis
Cap. 3
c) Quando é de classe C 2 , a função f é convexa se, e somente se,
sua forma quadrática hessiana é não-negativa em todos os pontos
de U .
Demonstração. (a) Seja E(f ) convexo. Para mostrar que f é convexa,
tomamos x, x′ ∈ U e α ∈ [0, 1]. Então (x, f (x)) e (x′ , f (x′ )) pertencem
a E(f ), portanto (1 − α)x + αx′ , (1 − α) · f (x) + α · f (x′ ) ∈ E(f ).
Isto significa que (1 − α) · f (x) + α · f (x′ ) ≥ f [(1 − α)x + αx′ ], logo
f é convexa. Reciprocamente, supondo f convexa, sejam z = (x, y),
z ′ = (x′ , y ′ ) pontos em E(f ) e α ∈ [0, 1]. Então y ≥ f (x) e y ′ ≥ f (x′ ) e
daı́ (1−α)y +αy ′ ≥ (1−α)·f (x)+α·f (x′ ) ≥ f (1−α)x+αx′ , a última
desigualdade devendo-se à convexidade
de f . Logo (1 − α)z + αz ′ =
′
′
(1 − α)x + αx , (1 − α)y + αy pertence a E(f ), ou seja, E(f ) é um
conjunto convexo.
(b) Suponhamos f : U → R convexa, de classe C 1 . Pelo Teorema 8,
se a e a + v pertencem a U então a função ϕ : [0, 1] → R, definida por
ϕ(t) = f (a + tv), é convexa. Portanto (v. Teorema 4, pág 109, vol. 1)
tem-se ϕ(1) ≥ ϕ(0)+ϕ′ (0). Mas ϕ(1) = f (a+v), ϕ(0) = f (a) e ϕ′ (0) =
h grad f (a), vi. Logo f (a + v) ≥ f (a) + h grad f (a), vi. Reciprocamente,
suponhamos que esta desigualdade valha para quaisquer a, a + v ∈ U .
Então, pondo ϕ(t) = f (a + tv), temos uma função ϕ : [0, 1] → R tal que
ϕ′ (t) = h grad f (a + tv), vi para todo t ∈ [0, 1]. Ora, para quaisquer
t, t0 ∈ [0, 1], tem-se f (a + tv) = f (a + t0 v + (t − t0 )v) = f (a + t0 v + sv),
com s = t − t0 logo, pela hipótese admitida sobre f ,
f (a + tv) ≥ f (a + t0 v) + h grad f (a + t0 v), svi
= f (a + t0 v) + h grad f (a + t0 v), vi(t − t0 ),
o que pode ser lido como ϕ(t) ≥ ϕ(t0 ) + ϕ′ (t0 )(t − t0 ). Pelo Teorema 4,
pág. 109, Volume 1, a função ϕ é convexa. O Teorema 8, acima, assegura
então que f é convexa.
(c) Novamente, usamos o Teorema 8 acima, o qual permite reduzir
a questão ao caso de uma função de uma variável, e então recaı́mos no
Corolário 2, pag. 110 do Volume 1. Com efeito, pondo ϕ(t) = f (x + tv),
com v = (α1 , . . . , αn ), temos
P
∂f
ϕ′ (t) = ni=1 ∂x
(x + tv)αi e
i
ϕ′′ (t) =
Pn
∂2f
i,j=1 ∂xi ∂xj (x
+ tv)αi αj = H(x + tv) · v 2 .
Seção 6
Funções convexas
79
Temos portanto as seguintes equivalências: H(x) é não-negativa para
todo x ∈ U ⇔ ϕ′′ (t) ≥ 0 para quaisquer x, x + v ∈ U e t ∈ [0, 1] ⇔ todas
as funções ϕ do tipo ϕ(t) = f (x + tv) são convexas ⇔ f : U → R é
convexa.
Corolário 7. Todo ponto crı́tico a de uma função convexa f : U → R
de classe C 1 é um ponto de mı́nimo global, isto é, f (x) ≥ f (a) para todo
x ∈ U.
Apêndice:
Continuidade das funções convexas
Teorema 10. Seja U ⊂ Rn um aberto convexo. Toda função convexa
f : U → R é contı́nua.
A demonstração do Teorema 10 se baseia nos dois lemas abaixo.
n
Q
[ai , bi ] é uma
Lema 3. Todo ponto de um bloco retangular B =
combinação convexa dos vértices desse bloco.
i=1
Demonstração. (Por indução.) Isto é óbvio para n = 1. Seja n > 1.
n
Q
{ai , bi }, os
Os vértices do bloco B são os 2n elementos do conjunto
i=1
quais denotaremos por vj ou vj conforme sua última coordenada seja da
forma ak ou bk . Um ponto arbitrário do bloco B pode ser escrito como
n−1
Q
[ai , bi ], de
p = (x, y), onde y ∈ [an , bn ] e x pertence ao bloco B ′ =
i=1
P
dimensão n − 1. Pela hipótese de indução, x =
αj uj é combinação
convexa dos vértices uj ∈ B ′ . Os vértices de B são vj = (u
Pj , an ) e
vj = P
(uj , bn ). Pondo P
p0 = (x, an ) e p1 = (x, bn ), temos p0 =
αj vj e
p1 =
αj vj (já que
αj = 1). Além disso, y = (1 − t)an + tbn , com
P
P
y − an
, logo p = (1 − t)p0 + tp1 = (1 − t)αj vj + tαj vj , o que
t=
bn − an
exprime o ponto arbitrário p do bloco B como combinação convexa dos
vértices de B.
Lema 4. Toda função convexa f : U → R, definida num aberto convexo
U ⊂ Rn , é localmente majorada por uma constante.
n
Q
(ai , bi ) o interior de um bloco retangular
Demonstração. Seja A =
i=1
contido em U . Se indicarmos comPwj , j = 1, . . . , 2n , os vértices de A
teremos,Ppara cada x ∈ A, x =
αj wj logo, pela convexidade de f ,
f (x) ≤ αj · f (wj ) ≤ M , onde M = max {f (wj )}.
j
80
Funções Reais de n Variáveis
Cap. 3
Demonstração do Teorema 10. Para simplificar a escrita, a fim de
provar a continuidade de f no ponto arbitrário a ∈ U , podemos admitir
que a = 0 e que f (0) = 0, pois o conjunto U0 = {x ∈ Rn ; a − x ∈ U } é
convexo, aberto, contém 0 e a função g : U0 → R, definida por g(x) =
f (a − x) − f (a), cumpre g(0) = 0, é convexa e é contı́nua no ponto 0
se, e somente se, f é contı́nua no ponto a. Pelo Lema 4, existem c > 0
e M > 0 tais que |x| ≤ c ⇒ f (x) ≤ M . Seja dado ε > 0. Sem perda
de generalidade, podemos supor que ε < M . A convexidade de f nos
permite afirmar que
f
ε ε ε
ε x =f 1−
x ≤
· f (x)
·0+
M
M
M
M
logo
ε
f (x) ≤
·f
M
Tomando δ =
M
x .
ε
εc
, vemos que
M
M
εc
|x| <
⇒
x <c⇒f
M
ε
M
x ≤ M ⇒ f (x) ≤ ε.
ε
Além disso,
ε
M
M
x+
− x
0 = f (0) = f
M +ε
M +ε
ε
M
ε
M
≤
f (x) +
·f − x .
M +ε
M +ε
ε
Simplificando, vem M · f (x) + ε · f (−M x/ε) ≥ 0, donde:
f (x) ≥
ε
ε
· (−f (−M x/ε)) ≥
· (−M ) = −ε.
M
M
Em resumo: |x| < cε/M ⇒ −ε ≤ f (x) ≤ ε, logo f é contı́nua no
ponto 0.
Seção 7
7
Exercı́cios
81
Exercı́cios
Seção 1. Derivadas parciais
1. Um conjunto X ⊂ Rn chama-se i-convexo (1 ≤ i ≤ n) quando para quaisquer
a, b ∈ X tais que b = a + tei , tem-se [a, b] ⊂ X. (Se X ⊂ R2 , diz-se então que
X é horizontalmente convexo ou verticalmente convexo, conforme seja i = 1
ou i = 2.) Prove que se o aberto U ⊂ Rn é i-convexo e a função f : U → R
∂f
(x) = 0 para todo x ∈ U então f não depende da i-ésima variável,
cumpre
∂xi
isto é, x, x + tei ∈ U ⇒ f (x + tei ) = f (x).
2. Sejam X = {(x, 0); x ≥ 0)} e U = R2 −X. Defina f : U → R pondo f (x, y) = x2
quando x > 0, y > 0 e f (x, y) = 0 quando x ≤ 0 ou y < 0. Mostre que se tem
∂f
= 0 em todos os pontos de U mas f depende de y.
∂y
3. Diz-se que um caminho retilı́neo f : I → Rn é paralelo ao i-ésimo eixo quando
ele é da forma f (t) = a+tei , t ∈ I. Se U ⊂ Rn é um aberto conexo, prove que
dois pontos a, b ∈ U quaisquer podem ser ligados por um caminho poligonal
contido em U , cujos trechos retilı́neos são paralelos aos eixos. Conclua que se
∂f
(x) = 0 para todo x ∈ U e qualquer
U ⊂ Rn é conexo e f : U → R cumpre
∂xi
i com 1 ≤ i ≤ n, então f é constante.
∂f
:U → R
4. Seja U ⊂ Rn aberto. Se f : U → R possui derivadas parciais
∂xi
(i = 1, . . . , n) limitadas, prove que f é contı́nua.
Seção 2. Funções de classe C 1
x2 y
se (x, y) 6= (0, 0) e f (0, 0) = 0.
+ y2
∂f
Mostre que, para todo v = (α, β) ∈ R2 , existe a derivada direcional
(0, 0)
∂v
mas f não é diferenciável no ponto (0, 0).
2. Seja f : Rn → R uma função contı́nua que possui todas as derivadas direcionais
∂f
(u) > 0 para todo u ∈ S n−1 , prove que existe
em qualquer ponto de Rn . Se
∂u
∂f
a ∈ Rn tal que
(a) = 0, seja qual for v ∈ Rn .
∂v
3. Seja f : Rn → R diferenciável no ponto 0. Se f (tx) = t · f (x) para todo t > 0
e todo x ∈ Rn , prove que f é linear. Conclua que a função ϕ : R2 → R, dada
por ϕ(x, y) = x3 /(x2 + y 2 ) se (x, y) 6= (0, 0) e ϕ(0, 0) = 0, não é diferenciável
na origem.
4. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Prove que, dados a ∈ U e
ε > 0, existe δ > 0 tal que x, y ∈ U , |x − a| < δ, |y − a| < δ ⇒ f (x) − f (y) =
h grad f (a), x − yi + r(x, y), onde |r(x, y)| < ε|x − y|.
1. Seja f : R2 → R definida por f (x, y) =
x2
Seção 3. O Teorema de Schwarz
∂2f
é
∂x∂y
2
identicamente nula, prove que existem ϕ : I → R, ψ = J → R de classe C
tais que f (x, y) = ϕ(x) + ψ(y) para todo (x, y) ∈ I × J.
1. Seja f : I × J → R de classe C 2 no retângulo aberto I × J ⊂ R2 . Se
82
Funções Reais de n Variáveis
Cap. 3
2. Use o exercı́cio anterior para provar que se g : R × R → R é de classe C 2 , com
∂2g
∂2g
=
, então existem ϕ : R → R e ψ : R → R de classe C 2 , tais que
2
∂x
∂y 2
g(x, y) = ϕ(x + y) + ψ(x − y) para todo (x, y).
3. Seja f : Rn → R de classe C 2 , tal que f (tx) = t2 ·f (x) para todo t > 0 e todo x ∈
n
P
Rn . Prove que existem aij ∈ R (i, j = 1, . . . , n) tais que f (x) =
aij xi xj
i,j=1
x4 + y 4
?
para todo x = (x1 , . . . , xn ) ∈ Rn . Como explicar f (x, y) = 2
x + y2
n+1
2
n
4. Sejam f, ϕ : U → R
de classe C no aberto U ⊂ R . (Isto é, as funções∂ϕ
(x)i = 0
coordenada de f e ϕ são de classe C 2 .) Suponha que hf (x),
∂xi
para todo x ∈ U e todo i = 1, . . . , n. Prove que a matriz [aij (x)], onde
∂f
∂ϕ
aij (x) = h
(x),
(x)i, é simétrica, seja qual for x ∈ U .
∂xi
∂xj
Seção 4. A fórmula de Taylor
1. Seja r : U → R uma função de classe C k , definida num aberto U ⊂ Rn que
contém a origem 0. Se r, juntamente com todas as suas derivadas parciais até
r(v)
as de ordem k, se anulam no ponto 0, prove que lim
= 0.
v→0 |v|k
2. Seja f : U → R de classe C 3 no aberto U ⊂ Rn , o qual contém a e a + v, com
P ∂2f
P ∂f
·αi , d2 f (a)·v 2 =
·αi ·αj
v = (α1 , . . . , αn ). Escreva df (a)·v =
i,j ∂xi ∂xj
i ∂xi
3
P
∂ f
·αi ·αj ·αk , as derivadas parciais sendo calculadas
e d3 f (a)·v 3 =
∂x
∂x
i
j ∂xk
i,j,k
no ponto x = a e os ı́ndices i, j, k variando de 1 a n. Ponha
f (a + v) − f (a) = df (a) · v +
1 2
1
d f (a) · v 2 + d3 f (a) · v 3 + r3 (v)
2
3!
r3 (v)
= 0.
|v|3
Estenda o resultado para funções de classe C k , 1 ≤ k < +∞.
e prove que lim
v→0
Seção 5. Pontos crı́ticos
1. Uma função f : U → R, de classe C 2 no aberto U ⊂ Rn , chama-se harmônica
n
P
∂2f
quando
(x) = 0 para todo x ∈ U . Prove que a matriz hessiana de
i=1 ∂xi ∂xi
uma função harmônica não pode ser definida (nem positiva nem negativa).
2. Seja f : U → R uma função arbitrária, definida num aberto U ⊂ Rn . Prove
que o conjunto dos pontos de máximo (ou de mı́nimo) local estrito de f é
enumerável.
3. Determine os pontos crı́ticos da função f : R2 → R, f (x, y) = cos(x2 + y 2 ).
Idem para g(x, y) = x3 − y 3 − x + y.
4. Seja f : U → R diferenciável no aberto limitado U ⊂ Rn . Se, para todo
a ∈ fr.U , tem-se lim f (x) = 0, prove que existe em U pelo menos um ponto
crı́tico de f .
x→a
Seção 7
Exercı́cios
83
5. Determine os pontos crı́ticos da função f : R2 → R dada por f (x, y) = x2 +
y 2 + (x2 − y 2 − 1)2 e calcule as matrizes hessianas correspondentes.
6. Dados a1 , . . . , ak em Rn , determine o ponto em que a função f : Rn → R, dada
k
P
por f (x) =
|x − ai |2 , assume o valor mı́nimo.
i=1
Seção 6. Funções convexas
1. Seja A ⊂ Rn um conjunto convexo. Prove que a função f : Rn → R, definida
por f (x) = d(x, A), é convexa.
2. Prove que todo ponto de mı́nimo local de uma função convexa é um ponto de
mı́nimo global. Além disso, o conjunto dos pontos de mı́nimo é convexo.
3. Prove que uma função convexa, f : U → R, com U aberto, (mesmo nãodiferenciável) não possui pontos de máximo local estrito.
4. Prove que o conjunto dos pontos crı́ticos (todos necessariamente mı́nimos globais) de uma função convexa diferenciável é um conjunto convexo, no qual f
é constante.
5. Se f : X → R é convexa, prove que, para todo c ∈ R, o conjunto dos pontos
x ∈ X tais que f (x) ≤ c é convexo. Dê exemplo mostrando que a recı́proca é
falsa.
6. Uma função f : X → R, definida num conjunto convexo X ⊂ Rn , chama-se
quase-convexa quando, para todo c ∈ R, o conjunto Xc = {x ∈ X; f (x) ≤ c}
é convexo. Prove que f é quase-convexa se, e somente se, f (1 − t)x + ty ≤
max{f (x), f (y)} para x, y ∈ X e t ∈ [0, 1] quaisquer.
4
Funções Implı́citas
1
Uma função implı́cita
Os pontos de Rn+1 serão escritos sob a forma (x, y), onde temos
x = (x1 , . . . , xn ) ∈ Rn e y ∈ R. O teorema abaixo dá significado preciso à afirmação de que “a equação f (x, y) = c define implicitamente y
como função de x”e estabelece uma condição suficiente para que ela seja
verdadeira.
Teorema 1 (Teorema da Função Implı́cita). Dada a função f : U →
R, de classe C k (k ≥ 1) no aberto U ⊂ Rn+1 , seja (x0 , y0 ) ∈ U tal que
∂f
f (x0 , y0 ) = c e
(x0 , y0 ) 6= 0. Existem uma bola B = B(x0 ; δ) ⊂ Rn e
∂y
um intervalo J = (y0 − ε, y0 + ε) com as seguintes propriedades:
∂f
¯
1) B × J¯ ⊂ U e
(x, y) 6= 0 para todo (x, y) ∈ B × J;
∂y
2) Para todo x ∈ B existe um único y = ξ(x) ∈ J tal que f (x, y) =
f (x, ξ(x)) = c.
A função ξ : B → J, assim definida, é de classe C k e suas derivadas
parciais em cada ponto x ∈ B são dadas por
∂f
∂ξ
∂x (x, ξ(x))
·
(x) = − ∂fi
∂xi
(x, ξ(x))
∂y
∂f
(x0 , y0 ) > 0.
∂y
Pela continuidade de ∂f /∂y, existem δ > 0 e ε > 0 tais que, pondo
Demonstração. Para fixar as idéias, admitiremos que
Seção 1
Uma função implı́cita
R
U
f −1 (c)
85
R
J
y0
f
c
f −1 (c)
x0
Rn
B
Figura 4.1
B = B(x0 , δ) ⊂ Rn e J = (y0 − ε, y0 + ε) ⊂ R, temos B × J¯ ⊂ U e
∂f
¯ Então, para todo x ∈ B, a função
(x, y) > 0 para todo (x, y) ∈ B × J.
∂y
¯ Como f (x0 , y0 ) =
y 7→ f (x, y) é crescente no intervalo [y0 −ε, y0 +ε] = J.
c, segue-se que f (x0 , y0 − ε) < c e f (x0 , y0 + ε) > c. Sendo f contı́nua,
podemos supor δ tão pequeno que f (x, y0 − ε) < c e f (x, y0 + ε) > c
para todo x ∈ B. Pelo Teorema do Valor Intermediário, para cada
x ∈ B, existe um único y = ξ(x) ∈ J¯ tal que f (x, y) = c. Tem-se
necessariamente y ∈ J. Mostremos que a função ξ : B → J possui
derivadas parciais em todo ponto x ∈ B.
Com efeito, pondo k = k(t) = ξ(x + tei ) − ξ(x), vem ξ(x + tei ) =
ξ(x) + k, logo f (x + tei , ξ(x) + k) = f (x, ξ(x)) = c.
Pelo Teorema do Valor Médio, para todo t existe θ = θ(t) ∈ (0, 1)
tal que
0 = f (x + tei , ξ(x) + k) − f (x, ξ(x))
∂f
∂f
=
(x + θtei , ξ(x) + θk) · t +
(x + θtei , ξ(x) + θk) · k.
∂xi
∂y
Logo
∂f
k
ξ(x + tei ) − ξ(x)
∂x (x + θtei , ξ(x) + θk)
= = − ∂fi
·
t
t
(x + θtei , ξ(x) + θk)
∂y
Neste ponto, admitamos a continuidade de ξ, que será provada abaixo.
Então lim k(t) = 0. A continuidade das derivadas parciais de f nos dá
t→0
então
∂f
ξ(x + tei ) − ξ(x)
∂ξ
∂xi (x, ξ(x))
(x) = lim
= − ∂f
, (1 ≤ i ≤ n).
t→0
∂xi
t
(x, ξ(x))
∂y
86
Funções Implı́citas
Cap. 4
A expressão de ∂ξ/∂xi mostra que se f ∈ C k então ∂ξ/∂xi ∈ C k−1
para i = 1, . . . , n, portanto ξ ∈ C k .
Demonstração da continuidade de ξ
Pelo Teorema 19 do Capı́tulo 1 (v. observação que o segue), basta
¯ a imagem inversa
mostrar que, para todo conjunto fechado F ⊂ J,
−1
ξ (F ) é fechada em B. Ou seja: se a seqüência de pontos xk ∈ B é
tal que ξ(xk ) ∈ F para todo k ∈ N e lim xk = x̄ ∈ B, então ξ(x̄) ∈ F .
Ora, F é compacto, logo uma subseqüência de pontos x′k ∈ B é tal
que lim ξ(x′k ) = a ∈ F . Logo f (x̄, a) = lim f (x′k , ξ(x′k )) = c. Mas
f (x̄, ξ(x̄))=c. Pela unicidade de ξ(x) em J, segue-se que ξ(x̄)=a∈F .
Considerando o aberto V = B × J ⊂ Rn+1 , o teorema acima diz que,
nas condições das hipóteses, tem-se
f −1 (c) ∩ V = {(x, ξ(x)) ∈ Rn+1 ; x ∈ B}.
Noutras palavras, f −1 (c) ∩ V é o gráfico da função ξ : B → J.
Observação. Evidentemente, não há nada de especial quanto à última
coordenada, exceto simplificar a escrita na demonstração. Se, para al∂f
gum inteiro i ∈ [1, n + 1], tivermos
(z0 ) 6= 0 onde z0 ∈ U e f (z0 ) = c,
∂xi
existirá um aberto V ∋ z0 , tal que, para z ∈ V , a equação f (z) = c
definirá xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) como função das outras n
coordenadas e f −1 (c) ∩ V será o gráfico dessa função ξ, de classe C k .
De um modo geral, se grad f (z0 ) 6= 0 e f (z0 ) = c então existe V ∋ z0
aberto tal que f −1 (c) ∩ V é o gráfico de uma função real de n variáveis,
de classe C k .
Exemplo 1. Seja f : R2 → R definida por f (x, y) = x2 + y 2 . Para
∂f
∂f
(x, y) = 2x e
(x, y) = 2y. A equação
todo (x, y) ∈ R2 , temos
∂x
∂y
x2 + y 2 = c define o conjunto vazio quando c < 0. (O Teorema 1 não se
aplica, pois não existe o ponto (x0 , y0 ) tal que f (x0 , y0 ) = c.) Quando
c = 0, a equação x2 + y 2 = 0 é satisfeita apenas quando x = y = 0.
∂f
∂f
(Agora existe (x0 , y0 ) mas
(0, 0) =
(0, 0) = 0.) Quando c > 0, a
∂x
∂y
√
equação x2 +y 2 = c define a circunferência de centro na origem e raio c,
a qual não é gráfico de função alguma do tipo y = ξ(x) nem x = ζ(y),
pois há retas verticais e horizontais que a cortam em dois pontos. Mas,
Seção 2
Hiperfı́cies
87
se considerarmos os abertos
V1 = {(x, y) ∈ R2 ; y > 0}, V2 = {(x, y) ∈ R2 ; y < 0},
V3 = {(x, y) ∈ R2 ; x > 0}, V4 = {(x, y) ∈ R2 ; x < 0},
veremos que f −1 (c) ∩ V1 e f −1 (c) ∩ √
V2 são gráficos das √funções
ξ1 , ξ2 : (−1, 1) → R, dadas por ξ1 (x) = c − x2 , ξ2 (x) = − c − x2 ,
−1 (c) ∩ V são os gráficos de ξ , ξ : (−1, 1) → R,
enquanto f −1 (c) ∩ Vp
3 ef
4
3 4
p
dadas por ξ3 (y) = c − y 2 e ξ4 (y) = − c − y 2 . Assim, em V1 e V2 a
equação x2 + y 2 = c (com c > 0) define implicitamente y como função
de x enquanto em V3 e V4 define x como função de y. Evidentemente,
√
√
salvo na vizinhança dos 4 pontos (± c, 0), (0, ± c), tem-se a opção de
tomar y como função de x ou x como função de y.
2
Hiperfı́cies
Um conjunto M ⊂ Rn+1 chama-se uma hiperfı́cie de classe C k quando
é localmente o gráfico de uma função real de n variáveis de classe C k .
Mais precisamente, para cada p ∈ M deve existir um aberto V ⊂ Rn+1
e uma função ξ : U → R, de classe C k num aberto U ⊂ Rn , tais que
p ∈ V e V ∩ M = gráfico de ξ.
A afirmação “V ∩ M = gráfico de ξ”significa que, para um certo
inteiro i ∈ [1, n], tem-se
V ∩ M = {(x1 , . . . , xn+1 ) ∈ Rn+1 ; xi = ξ(x1 , . . . , x
bi , . . . , xn+1 )},
onde x
bi significa “omitir xi ”.
Evidentemente, dada qualquer função f : U → R de classe C k no
aberto U ⊂ Rn , seu gráfico é uma hiperfı́cie M = {(x, f (x)) ∈ Rn+1 ;
x ∈ U } de classe C k .
Quando n = 1, uma hiperfı́cie em R2 chama-se uma curva e, quando
n = 2, tem-se uma superfı́cie em R3 .
Exemplo 2. A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é uma hiperfı́cie
C ∞ em Rn+1 . Com efeito, chamando de U a bola aberta de centro 0 e raio 1 em Rn , pondo, para cada i = 1, . . . , n + 1, Vi =
{x ∈ Rn+1 ; xi > 0}, Wi = {x ∈ Rn+1 ; xi < 0} e escrevendo x∗ =
(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ), temos:
p
x ∈ S n ∩ Vi ⇔ |x∗ | < 1 e xi = 1 − hx∗ , x∗ i;
p
x ∈ S n ∩ Wi ⇔ |x∗ | < 1 e xi = − 1 − hx∗ , x∗ i.
88
Funções Implı́citas
Cap. 4
Logo, considerando
a função ξ : U → R, de classe C ∞ , definida por
p
ξ(u) = 1 − hu, ui, vemos que, para cada i = 1, . . . , n + 1, S n ∩ Vi
é o gráfico da função xi = ξ(x∗ ) enquanto que S n ∩ Wi é o gráfico de
xi = −ξ(x∗ ). Como todo ponto p ∈ S n pertence a algum Vi ou a algum
Wi , concluı́mos que S n é uma hiperfı́cie de classe C ∞ em Rn+1 .
⊳
Seja M ⊂ Rn+1 uma hiperfı́cie de classe C k (k ≥ 1). A cada ponto
p ∈ M associaremos o conjunto Tp M , formado por todos os vetoresvelocidade v = λ′ (0) dos caminhos λ : (−δ, δ) → M que são diferenciáveis
no ponto 0 e cumprem a condição λ(0) = p. O conjunto Tp M é chamado
o espaço vetorial tangente de M no ponto p. Esta denominação se
justifica pelo
Teorema 2. Tp M é um subespaço vetorial de dimensão n em Rn+1 .
Na demonstração abaixo, para simplificar a escrita, escrevemos em
último lugar a coordenada do ponto de V ∩ M que é função das outras.
Demonstração. Seja ξ : U → R uma função de classe C k no aberto
U ⊂ Rn , cujo gráfico, formado pelos pontos (x, ξ(x)) ∈ Rn+1 , x ∈ U ,
é a interseção M ∩ V , onde V ⊂ Rn+1 é um aberto que contém p =
(p0 , ξ(p0 )), p0 ∈ U . Para todo caminho λ : (−δ, δ) → M , com λ(0) = p,
tem-se λ(t) = (x1 (t), , . . . , xn (t), ξ(x(t)), onde x(t) = (x1 (t), . . . , xn (t)).
Portanto
n
dx
dxn X ∂ξ dxi 1
λ′ (0) =
,...,
,
·
,
dt
dt
∂xi dt
i=1
as derivadas dxi /dt sendo calculadas no ponto t = 0 e ∂ξ/∂xi no ponto
p0 . Isto mostra que todo v = λ′ (0) em Tp M é uma combinação linear
dos vetores v1 = (1, 0, . . . , 0, ∂ξ/∂x1 ), . . . , vn = (0, . . . , 0, 1, ∂ξ/∂xn ).
(Derivadas no ponto p0 .) Reciprocamente, toda combinação linear
n
P
αi vi é o vetor-velocidade λ′ (0) do caminho λ : (−δ, δ) → M
v =
i=1
assim definido: tomamos v0 = (α1 , . . . , αn ) ∈ Rn e pomos λ(t) =
(p0 + tv0 , ξ(p0 + tv0 )), sendo δ > 0 escolhido de modo que o segmento
de reta (p0 − δv0 , p0 + δv0 ) esteja contido em U .
Observação. Como subespaço vetorial de Rn+1 , o espaço vetorial tangente Tp M contém a origem 0 ∈ Rn+1 e não contém necessariamente o
ponto p, embora nas figuras ele apareça passando por p. Nas ilustrações,
o que se vê é a variedade afim p + Tp M , paralela a Tp M por p.
Seção 2
Hiperfı́cies
89
Exemplo 3. O espaço vetorial tangente Tp S n é, para todo p ∈ S n , o
complemento ortogonal de p, isto é, o conjunto [p]⊥ de todos os vetores
v ∈ Rn+1 tais que hv, pi = 0. Com efeito, sendo Tp S n e [p]⊥ ambos
subespaços vetoriais de dimensão n em Rn+1 , para mostrar que eles
coincidem, basta provar que Tp S n ⊂ [p]⊥ . Ora, se v ∈ Tp S n então
v = λ′ (0), onde λ : (−δ, δ) → S n é um caminho diferenciável no ponto 0,
d
com λ(0) = p. Neste caso, 0 = hλ(t), λ(t)i = 2hλ′ (0), λ(0)i = 2hv, pi.
dt
⊳
p
S
n
Tp S n
Figura 4.2
A seguir, apresentaremos um critério bastante útil para dar exemplos
de hiperfı́cies.
Um número c ∈ R chama-se um valor regular de uma função f : U →
R, de classe C 1 , quando não há pontos crı́ticos de f no nı́vel c, isto é,
quando f (x) = c ⇒ grad f (x) 6= 0. Diz-se também que c é um nı́vel
regular de f . Quando existe x ∈ U tal que f (x) = c e grad f (x) = 0,
diz-se que c é um nı́vel crı́tico de f .
Teorema 3. Se c é um valor regular da função f : U → R, de classe
C k no aberto U ⊂ Rn+1 , então M = f −1 (c) é uma hiperfı́cie de classe
C k , cujo espaço vetorial tangente Tp M é, em cada ponto p ∈ M , o
complemento ortogonal de grad f (p).
Demonstração. O fato de que f −1 (c) é uma hiperfı́cie é apenas uma
reformulação verbal do Teorema da Função Implı́cita. (Ver comentário
após a prova do Teorema 1.) Quanto ao espaço vetorial tangente Tp M ,
como M é uma superfı́cie de nı́vel da função f , vemos que todo vetor
v ∈ Tp M é ortogonal a grad f (p), logo Tp M ⊂ [grad f (p)]⊥ . Sendo
ambos subespaços de dimensão n em Rn+1 , conclui-se que Tp M =
[grad f (p)]⊥ .
90
Funções Implı́citas
Cap. 4
Exemplo 4. (Mais uma vez a esfera). À luz do Teorema 3, a esfera
unitária S n é a superfı́cie de nı́vel 1 da função f : Rn+1 → R, dada
por f (x) = hx, xi. Como grad f (x) = 2x, vemos que zero é o único
nı́vel crı́tico de f . Em particular, 1 é valor regular, S n = f −1 (1) é uma
hiperfı́cie C ∞ e, para todo p ∈ S n , tem-se Tp S n = [grad f (p)]⊥ = [p]⊥ .
⊳
Exemplo 5. Seja A : Rn → Rn um operador linear auto-adjunto. A
função f : Rn → R, definida por f (x) = hA · x, xi é o que se chama
uma forma quadrática. Se [aij ] é a matriz (simétrica) de A na base
n
n
P
P
aij xj e
aij xi xj . Logo ∂f /∂xi = 2
canônica de Rn então f (x) =
i,j=1
j=1
conseqüentemente grad f (x) = 2A · x. Supondo agora que o operador A
seja invertı́vel, o único ponto crı́tico da função f é a origem 0, onde f
assume o valor zero. Então, para todo c 6= 0, a equação f (x) = c define
uma hiperfı́cie. Costuma-se tomar c = 1 e a hiperfı́cie definida pela
n
P
aij xi xj = 1, chama-se uma quádrica.
equação f (x) = 1, ou seja,
i,j=1
Em particular, se o operador A é positivo, isto é, se f (x) > 0 para todo
x 6= 0, a quádrica f −1 (1) chama-se um elipsóide.
⊳
2
Exemplo 6. Seja f : Rn → R a função que associa a cada matriz
x) = det x . O
x = [xij ] de n linhas e n colunas seu determinante f (x
desenvolvimento de Laplace relativo à i-ésima linha é
x) =
f (x
n
X
k=1
(−1)i+k xik · Xik ,
onde o ik-ésimo menor Xik é o determinante da matriz (n − 1) × (n − 1)
que se obtém de x omitindo a i-ésima linha e a k-ésima coluna. Segue∂f
x) = (−1)i+j Xij . Em particular, se x = I = matriz
se daı́ que
(x
∂xij
∂f
identidade n × n, temos
(II ) = δij (delta de Kronecker , igual a
∂xij
1 quando i = j e 0 quando i 6= j). Portanto grad f (II ) = I . Seja
2
U ⊂ Rn o conjunto aberto formado pelas matrizes (invertı́veis) x tais
que det x 6= 0. Para toda x ∈ U , o desenvolvimento de Laplace nos
x) 6= 0. Portanto a
mostra que algum menor Xij é 6= 0, logo grad f (x
função f : U → R não possui pontos crı́ticos: todo número real c é um
valor regular de f . Logo M = f −1 (1) = conjunto das matrizes reais n×n
Seção 3
Multiplicador de Lagrange
91
com determinante 1 é uma hiperfı́cie C ∞ . M é um grupo em relação
à multiplicação de matrizes, conhecido como o grupo unimodular . O
espaço vetorial TI (M ), tangente a M na matriz identidade I , é formado
pelas matrizes x que são perpendiculares (em termos do produto interno
2
de Rn ) ao gradiente grad f (II ) = I . Ora,
x, I i =
hx
n
X
xij δij =
i,j=1
n
X
xii = traço de x .
i=1
Assim, o espaço vetorial tangente a M no ponto I é o conjunto das
matrizes de traço nulo.
⊳
Observação. O Teorema 3 é uma boa fonte de exemplos de hiperfı́cies.
Mas nem toda hiperfı́cie M ⊂ Rn+1 pode ser obtida como imagem inversa M = f −1 (c) do valor regular c de uma função f : U → R. Com
efeito, as hiperfı́cies desse tipo admitem um campo contı́nuo de vetores não-nulos v = grad f : M → Rn+1 , tais que, para todo x ∈ M ,
hv(x), wi = 0 qualquer que seja w ∈ Tx M . (Diz-se então que v = grad f
é um campo de vetores normais a M .) Tais hiperfı́cies são chamadas de
orientáveis. Esta noção será retomada, mais amplamente, no Cap. 7.
Um exemplo bem conhecido de superfı́cie não-orientável é a faixa de
Moebius. Logo, a faixa de Moebius não é imagem inversa de um valor
regular de uma função de classe C 1 definida num aberto de R3 .
3
Multiplicador de Lagrange
O método de multiplicador de Lagrange se aplica na seguinte situação:
tem-se uma função f : U → R, de classe C 1 no aberto U ⊂ Rn+1 (funçãoobjetivo), uma hiperfı́cie M = ϕ−1 (c), imagem inversa do valor regular
c da função ϕ : U → R, de classe C 1 , e procura-se determinar quais são
os pontos crı́ticos da restrição f |M , ou seja, os pontos crı́ticos x de f
sujeitos à condição ϕ(x) = c.
Não se trata de determinar os pontos crı́ticos de f : U → R que estão
localizados sobre a hiperfı́cie M mas sim os pontos crı́ticos da função
f |M : M → R. É preciso definir o que se entende por isto.
Um ponto x ∈ M chama-se um ponto crı́tico da restrição f |M
quando, para todo caminho diferenciável λ : (−δ, δ) → M com λ(0) =
x tem-se (f ◦ λ)′ (0) = 0. Pondo v = λ′ (0), esta condição significa
h grad f (x), vi = 0. Como v é um vetor arbitrário pertencente ao espaço
92
Funções Implı́citas
Cap. 4
vetorial tangente Tx M , vemos que x ∈ M é um ponto crı́tico de f |M se,
e somente se, grad f (x) é ortogonal ao espaço vetorial tangente Tx M .
Ora, grad ϕ(x) é um vetor (não-nulo) ortogonal a Tx M . Como o
complemento ortogonal de Tx M em Rn+1 tem dimensão 1, segue-se que
grad f (x) ⊥ Tx M se, e somente se, grad f (x) é um múltiplo de grad ϕ(x).
Portanto, podemos enunciar:
O ponto x ∈ U é um ponto crı́tico da restrição f |M de f à hiperfı́cie
M = ϕ−1 (c) se, e somente se:
1) ϕ(x) = c;
2) grad f (x) = λ · grad ϕ(x) para algum λ ∈ R.
As condições acima representam um sistema de n+2 equações (pois a
igualdade vetorial 2) acima significa n+1 igualdades numéricas) nas n+2
incógnitas x1 , . . . , xn+1 (coordenadas de x) e λ. O fator λ é chamado o
multiplicador de Lagrange. Sua presença torna o número de incógnitas
igual ao número de equações, o que viabiliza a solução na prática.
Deve-se notar que se x ∈ M é um ponto de mı́nimo ou de máximo
local de f |M então, para todo caminho diferenciável λ : (−δ, δ) → M
com λ(0) = x, a função f ◦ λ : (−δ, δ) → R tem um mı́nimo ou um
máximo local no ponto 0, logo (f ◦ λ)′ (0) = 0. Portanto os mı́nimos
e máximos locais de f |M estão incluı́dos na definição de ponto crı́tico
dada acima.
É também evidente que todo ponto crı́tico x ∈ M da função
f : U → R é, com maior razão, ponto crı́tico da restrição f |M pois,
sendo grad f (x) =0, tem-se h grad f (x), vi = 0 para todo v ∈ Rn+1 .
Muitas vezes, a condição adicional ϕ(x) = c é posta sob a forma
ϕ(x) = 0. Isto não representa perda de generalidade. Basta usar, em
vez de ϕ, a função ψ(x) = ϕ(x) − c. Então ψ(x) = 0 ⇔ ϕ(x) = c e c é
valor regular de ϕ se, e somente se, 0 é valor regular de ψ.
Exemplo 7. Seja f : R2 → R definida por f (x, y) = ax + by, com
a2 + b2 6= 0. O gradiente de f é, em todo ponto (x, y), o vetor constante
não-nulo v = (a, b), ortogonal às linhas de nı́vel ax + by = c, que são
retas, duas a duas paralelas. A função f não tem pontos crı́ticos. Mas se
ϕ : R2 → R for dada por ϕ(x, y) = x2 + y 2 então grad ϕ(x, y) = (2x, 2y),
1 é valor regular de ϕ e M = ϕ−1 (1) é a circunferência unitária x2 +y 2 =
1. Como M é compacta, a restrição f |M possui pelo menos dois pontos
crı́ticos, nos quais assume seus valores mı́nimo e máximo. Os pontos
Seção 3
Multiplicador de Lagrange
93
crı́ticos de f |M são as soluções (x, y) do sistema
grad f (x, y) = λ · grad ϕ(x, y), ϕ(x, y) = 1,
ou seja:
2λx = a,
2λy = b,
x2 + y 2 = 1.
grad f (x, y)
grad f (−x, −y)
Figura 4.3
Portanto (x, y) é um ponto crı́tico de f |M se, e somente se, o vetor
unitário z = (x, y) é um múltiplo do vetor v = (a, b). Isto nos dá
a
−a
b
−b
√
√
√
√
(x, y) =
,
,
ou (x, y) =
.
a2 + b2
a2 + b2
a2 + b2
a2 + b2
Estes são os pontos nos quais f (x, y) assume seus valores máximo e
mı́nimo em M = S 1 .
⊳
Seja f : Rn → R uma forma quadrática. Para todo
n
P
aij xi xj , onde a = [aij ] é uma max = (x1 , . . . , xn ), tem-se f (x) =
Exemplo 8.
i,j=1
triz simétrica n × n. Alternativamente, tem-se f (x) = hAx, xi, onde
A : Rn → Rn é o operador linear auto-adjunto cuja matriz na base
canônica de Rn é a . Quais são os pontos crı́ticos da restrição f |S n−1 ,
onde S n−1 é a esfera unitária de Rn ? Temos S n−1 = ϕ−1 (1), onde
ϕ : Rn → R é definida por ϕ(x) = hx, xi e, como grad ϕ(x) = 2x, 1
n
P
∂f
é valor regular de ϕ. Por sua vez,
aij xj , portanto
(x) = 2 ·
∂xi
j=1
grad f (x) = 2A · x. Portanto os pontos crı́ticos da restrição f |S n−1 são
94
Funções Implı́citas
Cap. 4
as soluções do sistema Ax = λx, hx, xi = 1, isto é, são os autovetores
do operador A que têm comprimento 1. Como S n−1 é compacta, f admite pelo menos 2 pontos crı́ticos em S n−1 , a saber, os pontos em que
assume seus valores mı́nimo e máximo. Isto fornece uma prova de que
todo operador auto-adjunto em Rn possui autovetores, o que é o passo
fundamental para a demonstração do Teorema Espectral.
⊳
Exemplo 9. Seja U ⊂ Rn o conjunto dos pontos cujas coordenadas são
positivas. Consideremos as funções f, ϕ : U → R definidas, para todo
x = (x1 , . . . , xn ) ∈ U , como f (x) = x1 · x2 · · · xn e ϕ(x) = x1 + x2 +
· · · + xn . Fixando s > 0, procuremos os pontos crı́ticos de f |M onde
M = ϕ−1 (s). Observemos que grad ϕ(x) = (1, 1, . . . , 1) para qualquer
x ∈ U , de modo que M Q
é uma hiperfı́cie. Por sua vez, temos grad f (x) =
xj . Assim, x ∈ M é ponto crı́tico de f |M se,
(α1 , . . . , αn ) com αi =
j6=i
Q
xj = λ (i = 1, . . . , n). Dividindo
e somente se, para algum λ, tem-se
j6=i
a i-ésima dessas equações pela k-ésima, obtemos xk /xi = 1. Assim, o
único ponto crı́tico de f |M é aquele que tem suas coordenadas iguais, ou
seja, é p = (s/n, s/n, . . . , s/n). Afirmamos que f (p) = (s/n)n é o maior
valor de f |M . Com efeito, a fórmula de f define uma função contı́nua no
compacto M̄ , onde possui um ponto de máximo, o qual não pode estar
em M̄ − M pois x1 · x2 · · · xn = 0 se x ∈ M̄ − M . Logo esse máximo
está em M , portanto é um ponto crı́tico, mas p é o único ponto crı́tico
de f |M . Conclusão: quando n números positivos têm soma constante
s, seu produto é máximo, igual a (s/n)n , quando eles são iguais. Ou
ainda, se x1 , . . . , xn são positivos então
x1 · x2 · · · xn ≤
x1 + x2 + · · · + xn
n
n
.
A desigualdade acima, posta sob a forma
√
n
x1 · x2 · · · xn ≤
x1 + x2 + · · · + xn
,
n
diz que a média geométrica de números positivos é menor do que ou
igual à média aritmética. Além disso, elas coincidem somente quando
os números dados são iguais.
⊳
Seção 3
Multiplicador de Lagrange
95
a
M
p
Figura 4.4
Exemplo 10. Dadas a função f : U → R, de classe C k no aberto
U ⊂ Rn+1 , e a hiperfı́cie M ⊂ U , os pontos crı́ticos da restrição f |M
são os pontos x ∈ M para os quais grad f (x) é ortogonal ao espaço
vetorial tangente Tx M , mesmo quando M não é obtida como imagem
inversa ϕ−1 (c) de um valor regular de uma função ϕ : U → R de classe
C k . Isto ficou claro na discussão feita no inı́cio desta seção. Como
exemplo, consideremos uma hiperfı́cie M ⊂ Rn+1 , um ponto a ∈ Rn+1
não pertencente a M e indaguemos quais são os pontos p ∈ M situados à distância mı́nima de a. Trata-se de obter os pontos que tornam
mı́nima a restrição f |M , onde f : U → R, dada por f (x) = |x − a|,
tem U p
=P
Rn+1 − {a} por domı́nio, por isso é de classe C ∞ . Temos
(xi − ai )2 , logo ∂f /∂xi = (xi − ai )/|x − a| e daı́ grad f (x) =
f (x) =
(x − a)/|x − a|. Assim, os pontos crı́ticos de f , entre os quais estão os
pontos de M situados à distância mı́nima de a, são os pontos x ∈ M
tais que x − a é um vetor normal a M no ponto x, isto é, hx − a, vi = 0
para todo v ∈ Tx M . Em particular, se M = S n , x − a ⊥ Tx S n significa
x − a = α · x isto é, x = a/(1 − α). Portanto, neste caso, os únicos pontos
crı́ticos de f |S n são os pontos x ∈ S n pertencentes à reta 0a, os quais
são ±a/|a|. Um deles minimiza |x − a| e o outro maximiza f .
⊳
Observação. Os pontos crı́ticos da restrição f |M da função f : U → R
à hiperfı́cie ϕ−1 (0), onde ϕ : U → R tem 0 como valor regular, são,
como vimos, as soluções x do sistema de equações grad f (x) = λ ·
grad ϕ(x), ϕ(x) = 0. Se considerarmos a função L : U × R → R, definida
por L(x, λ) = f (x) − λϕ(x), veremos que grad L(x, λ) = grad f (x) −
λ grad ϕ(x) − ϕ(x), portanto os pontos crı́ticos da restrição f |M são
simplesmente os pontos crı́ticos (livres) da função L que pertençam a
M . A função L é chamada a Lagrangiana do problema.
96
4
Funções Impı́citas
Cap. 4
Exercı́cios
Seção 1. Uma função implı́cita
1. Seja f : R2 → R de classe C k (k ≥ 1). Suponha que existam um ponto
∂f
(x0 , y0 ) ∈ R2 e uma constante M tais que f (x0 , y0 ) = 0,
(x, y) 6= 0 e
∂y
∂f
∂f
(x, y)
(x, y) ≤ M para todo (x, y) ∈ R2 . Prove que, para todo x ∈ R,
∂x
∂y
existe um único y = ξ(x) ∈ R tal que f (x, ξ(x)) = 0 e que a função ξ : R → R,
assim definida, é de classe C k .
2. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Se f não possui pontos crı́ticos,
prove que a imagem f (A) de todo aberto A ⊂ U é um conjunto aberto em R.
3. Seja f : R3 → R dada por f (x, y, z) = x4 + 2x · cos y + sen z. Prove que, numa
vizinhança de 0, a equação f (x, y, z) = 0 define z como função de classe C ∞
∂z ∂z
das variáveis x, y. Calcule
e
·
∂x ∂y
4. Seja f : R × [0, 1) → R a função contı́nua definida por f (x, y) = (x2 + y 2 ) ·
(ye|x| − 1). Prove que, para cada x ∈ R, existe um único y = ξ(x) ∈ [0, 1) tal
que f (x, ξ(x)) = 0 mas a função ξ : R → [0, 1) não é contı́nua.
5. Sejam f, g : Rn → R tais que, para todo x ∈ Rn , vale g(x) = f (x)(1 + f (x)4 ).
Se g ∈ C k , k ≥ 1, prove que f também é de classe C k .
Seção 2. Hiperfı́cies
2
1. Prove que o conjunto M ⊂ Rn das matrizes n × n de posto n − 1 é uma
hiperfı́cie orientável. Determine Tp M , onde p é a matriz n × n cujos elementos
são todos nulos exceto os n − 1 primeiros da diagonal, que são iguais a 1.
p
2
x2 + y 2 −2 = 1
2. Prove que o conjunto dos pontos (x, y, z) ∈ R3 tais que z 2 +
∞
é uma superfı́cie C . Que forma tem essa superfı́cie?
3. Prove que toda hiperfı́cie M ⊂ Rn+1 é localmente orientável no seguinte sentido: cada ponto p ∈ M possui uma vizinhança V em M na qual está definido
um campo contı́nuo v : V → Rn+1 de vetores não-nulos normais a M (ou seja
v(x) ⊥ Tx M para todo x ∈ V ).
Seção 3. Multiplicadores de Lagrange
1. Seja hAx, xi = 1 a equação de um elipsóide M em Rn+1 . Prove que a maior
√
distância de um ponto de M à origem é 1/ µ, onde µ é o menor autovalor do
operador positivo A. Ela é atingida num ponto x ∈ M que é autovetor de A,
correspondente ao autovalor µ.
2. Seja H o hiperplano de Rn+1 definido pela equação hb, xi = c. Use o método
do multiplicador de Lagrange para mostrar que o ponto H mais próximo do
c − hb, ai
ponto a ∈ Rn+1 é x = a +
· b.
|b|2
3. Determine os pontos crı́ticos da função f : R2n → R, dada por f (x, y) = hx, yi,
restrita à esfera unitária |x|2 + |y|2 = 1, e conclua daı́ a desigualdade de
Schwarz.
Seção 4
Exercı́cios
2
97
2
n
4. Seja M (n × n) = Rn . Prove que
P o2máximo da função f : R → R, dada por
x) = det x , restrita à esfera
f (x
xij = n, é atingido numa matriz ortogonal,
i,j
logo é igual a 1. Notando que, se as linhas de x são v1 , . . . , vn então x =
|v1 | . . . |vn | · w onde todas as linhas de w têm comprimento 1, conclua daı́ a
desigualdade de Hadamard: | det x | ≤ |v1 | . . . |vn |.
5. Prove que o menor valor da soma s = x1 + · · · + xn de n números positivos
cujo produto p = x1 · x2 · x2 · · · xn é constante é atingido quando esses números
√
são iguais, logo valem n p.
5
Aplicações Diferenciáveis
1
A derivada como transformação linear
Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se diferenciável no ponto a ∈ U quando cada uma das suas funções-coordenada
f1 , . . . , fn : U → R é diferenciável nesse ponto.
Se este é o caso então, para todo v = (α1 . . . , αm ) tal que a + v ∈ U
e para cada i = 1, . . . , n, tem-se
m
X
∂fi
ri (v)
(a) · αj + ri (v) com lim
= 0.
v→0 |v|
∂xj
j=1
∂fi
(a) ∈ M (n × m) chama-se a matriz jacobiA matriz Jf (a) =
∂xj
ana de f no ponto a.
A transformação linear f ′ (a) : Rm → Rn , cuja matriz em relação às
bases canônicas de Rm e Rn é Jf (a), chama-se a derivada da aplicação
f no ponto a.
De acordo com a definição de matriz de uma transformação linear,
para todo v = (α1 , . . . , αm ) ∈ Rm temos
fi (a + v) − fi (a) =
m
X
∂fi
∂fi
f (a) · v = (β1 , . . . , βn ) onde βi =
(a) · αj =
(a).
∂xj
∂v
′
j=1
Assim, se definirmos, como é natural, a derivada direcional da aplicação
f , no ponto a, na direção do vetor v, como
f (a + tv) − f (a)
∂f
(a) = lim
,
t→0
∂v
t
Seção 1
A derivada como transformação linear
99
temos imediatamente
∂f
(a) =
∂v
∂f1
∂fn
(a), . . . ,
(a) = f ′ (a) · v.
∂v
∂v
Resulta da Regra da Cadeia para funções (Teorema 2 do Capı́tulo 3),
em conformidade com a observação feita logo após sua demonstração,
∂f
∂f
(a) tenha sido dada acima como
(a) =
que embora a definição de
∂v
∂v
∂f
(f ◦λ)′ (0), onde λ(t) = a+tv, vale, mais geralmente, a igualdade
(a) =
∂v
′
(f ◦ λ) (0) para qualquer caminho diferenciável λ : (−δ, δ) → U , com
λ(0) = a e λ′ (0) = v.
As n igualdades numéricas que exprimem a diferenciabilidade das
funções-coordenada fi se resumem na igualdade abaixo, entre vetores de
Rn :
f (a + v) − f (a) = f ′ (a) · v + r(v),
com
lim
v→0
r(v)
= 0.
|v|
Algumas vezes, é mais conveniente escrever esta condição sob a forma
f (a + v) − f (a) = f ′ (a) · v + ρ(v) · |v| com
lim ρ(v) = 0.
v→0
Aqui, ρ(v) = r(v)/|v| para todo v 6= 0 tal que a + v ∈ U .
A relação acima caracteriza univocamente a derivada da aplicação
f no sentido seguinte: se uma transformação linear T : Rm → Rn é tal
que, para a, a + v ∈ U tem-se
f (a + v) − f (a) = T · v + r(v),
com
lim
v→0
r(v)
= 0,
|v|
então T = f ′ (a).
Com efeito, daı́ resulta, tomando tv em vez de v, que:
f (a + tv) − f (a)
r(tv)
=T ·v±
· |v|,
t
|tv|
logo
∂f
[f (a + tv) − f (a)]
=
(a) = f ′ (a) · v.
t→0
t
∂v
Quando f : U → Rn é diferenciável em todos os pontos de U , dizemos que
f é diferenciável em U . Neste caso, fica definida uma aplicação f ′ : U →
T · v = lim
100
Aplicações Diferenciáveis
Cap. 5
L(Rm ; Rn ) que faz corresponder a cada x ∈ U a transformação linear
f ′ (x) : Rm → Rn . Quando for conveniente, identificaremos o conjunto
L(Rm ; Rn ) das transformações lineares de Rm em Rn com o conjunto
M (n × m) das matrizes n × m ou com o espaço Rnm .
Dizer que a aplicação derivada f ′ : U → L(Rm ; Rn ) (ou seja f ′ : U →
nm
R ) é contı́nua equivale a afirmar a continuidade de cada uma de suas
nm funções-coordenada ∂fi /∂xj : U → R, isto é, a dizer que f é uma
aplicação de classe C 1 conforme a definição dada no Capı́tulo 3. Como
foi demonstrado no Teorema 1 daquele capı́tulo, a continuidade das derivadas parciais ∂fi /∂xj : U → R implica a diferenciabilidade de f .
Como no caso de funções, aplicações f : U → Rn de classe C k são
definidas por indução: diz-se que f ∈ C k quando f é diferenciável e sua
derivada f ′ : U → Rnm é de classe C k−1 . Se f ∈ C k para todo k ∈ N
diz-se que f é de classe C ∞ : f ∈ C ∞ . Então f ′ ∈ C ∞ também.
Observação. Na maioria das vezes, a maneira mais simples de verificar
que uma aplicação f é diferenciável consiste em calcular diretamente as
∂fi
derivadas parciais
(x), mostrar que elas dependem continuamente de
∂xj
x e usar o Teorema 1 do Capı́tulo 3, segundo o qual toda função de classe
C 1 é diferenciável. Praticamente todas as aplicações diferenciáveis são
de classe C 1 . Ocorre, entretanto, que as propriedades mais relevantes das
aplicações C 1 resultam da relação que caracteriza sua diferenciabilidade.
Daı́ a importância deste conceito.
2
Exemplos de derivadas
Exemplo 1. Sejam I ⊂ R um intervalo aberto e f : I → Rn um caminho
diferenciável no ponto a ∈ I. Considerando f como uma aplicação, sua
derivada no ponto a é a transformação linear f ′ (a) : R → Rn cuja matriz
jacobiana tem por única coluna o vetor
df1
dfn
v=
(a), . . . ,
(a) ,
dt
dt
a qual vem a ser o vetor-velocidade do caminho f no ponto a, já indicado
com a mesma notação f ′ (a) no Capı́tulo 2. Como transformação linear,
f ′ (a) : R → Rn faz corresponder a cada “vetor”t ∈ R o vetor t · v ∈ Rn .
Noutros termos: f ′ (a) · t = t · f ′ (a).
⊳
Seção 2
Exemplos de derivadas
101
Exemplo 2. Seja f : U → R uma função definida no aberto U ⊂ Rm ,
diferenciável no ponto a ∈ U . Sua derivada é uma transformação linear
f ′ (a) : Rm → R, portanto um funcional linear, que associa a cada vetor
v = (α1 , α2 , . . . , αm ) ∈ Rm o número
f ′ (a) · v =
∂f
∂f
∂f
(a) · α1 + · · · +
(a) · αm =
(a) = h grad f (a), vi.
∂x1
∂xm
∂v
Às vezes se escreve df (a) e chama-se diferencial de f à derivada f ′ (a).
Em particular, se usarmos a notação tradicional xi : Rm → R para indicar a função que associa a cada ponto x ∈ Rm sua i-ésima coordenada
xi , a diferencial dxi desta função é o funcional linear que faz corresponder a cada vetor v = (α1 , . . . , αm ) sua i-ésima coordenada dxi · v = αi .
(Mesmo porque, sendo linear, a função xi tem derivada constante, igual
a si própria. Vide Exemplo 4, abaixo.) Então
df (a) · v =
m
m
X
X
∂f
∂f
(a) · αi =
(a) · dxi · v.
∂xi
∂xi
i=1
i=1
Isto atribui um significado à expressão clássica
m
X
∂f
dxi .
df =
∂xi
⊳
i=1
Exemplo 3. Se f : U → Rn é constante então f ′ (x) = 0 para todo
x ∈ U . Reciprocamente, se o aberto U ⊂ Rm é conexo e f : U →
Rn possui derivada 0 em todos os pontos x ∈ U então f é constante.
(Conforme o Corolário 5 do Teorema 2, Capı́tulo 3.)
Exemplo 4. Se T : Rm → Rn é uma transformação linear então T
é diferenciável e T ′ (x) = T para todo x ∈ Rm . Noutras palavras,
T ′ (x) · v = T · v quaisquer que sejam x, v ∈ Rm . Isto resulta imediatamente da igualdade T (x + v) − T · x = T · v + r, onde r = 0, ou então do
fato óbvio de que a matriz jacobiana de T é a própria matriz de T . Um
caso muito particular: a soma S : Rm × Rm → Rm , S(x, y) = x + y é
linear, logo S ′ (x, y) · (u, v) = u + v quaisquer que sejam x, y, u, v ∈ Rm .
Exemplo 5. Seja B : Rm × Rn → Rp uma aplicação bilinear, isto é,
linear em cada uma de suas duas variáveis. Se escrevermos, para cada
102
Aplicações Diferenciáveis
Cap. 5
par de vetores (ei , ej ) das bases canônicas de Rm e Rn respectivamente,
B(ei , ej ) = vij , então, para x = (x1 , . . . , xm ) e y = (y1 , . . . , yn ) teremos
X
B(x, y) =
xi yj vij .
i,j
Isto mostra que B é contı́nua, logo assume seu valor máximo |B| no
compacto S m−1 × S n−1 . Daı́ resulta que, para quaisquer x ∈ Rm e
y ∈ Rn não-nulos, vale |B(x, y)| = |B(x/|x|, y/|y|)| · |x| · |y| ≤ |B| · |x| · |y|.
Para x = 0 ou y = 0, a desigualdade |B(x, y)| ≤ |B| · |x| · |y| é imediata
pois B(0, y) = B(x, 0) = 0. Mostremos agora que toda aplicação bilinear
B é diferenciável, com B ′ (x, y) · (u, v) = B(u, y) + B(x, v). Com efeito,
se x, u ∈ Rm e y, v ∈ Rn , temos pela bilinearidade de B:
B(x + u, y + v) − B(x, y) = B(u, y) + B(x, v) + B(u, v).
p
Observando que |(u, v)| = |u|2 + |v|2 ≥ |v|, temos
logo lim
u,v→0
|B(u, v)|
|B| · |u| · |v|
≤ |B| |u|,
≤p
|(u, v)|
|u|2 + |v|2
B(u, v)
= 0, comprovando assim a diferenciabilidade de B. ⊳
|(u, v)|
Nos Exemplos 4 e 5 acima (e, obviamente, no Exemplo 3), as aplicações consideradas são de classe C ∞ . De fato, a derivada T ′ = T : Rm →
L(Rm ; Rn ) de uma transformação linear T , sendo constante, possui derivada nula e todas as derivadas seguintes também serão nulas. Quanto
à aplicação bilinear B, sua derivada B ′ : Rm × Rn → L(Rm × Rn ; Rp )
é a transformação linear (x, y) 7→ B(•, y) + B(x, •), recaindo assim no
Exemplo 4.
Exemplo 6 (Derivada complexa). Uma função de variável complexa
f : U → C, definida no aberto U ⊂ C, pode ser vista como uma aplicação
f : U → R2 , definida no aberto U ⊂ R2 . A derivada da função complexa
f no ponto z ∈ U é o número complexo f ′ (z), definido como o limite
f (z + H) − f (z)
,
H→0
H
f ′ (z) = lim
quando tal limite existe. Isto equivale a dizer que
f (z + H) − f (z) = f ′ (z) · H + r(H),
onde
r(H)
= 0.
H→0 |H|
lim
Seção 3
Cálculo diferencial de aplicações
103
Acima, f ′ (z) · H é uma multiplicação de números complexos. Portanto,
a função complexa f : U → C é derivável no ponto z ∈ U se, e somente
se, a aplicação f : U → R2 é diferenciável nesse ponto e, além disso,
sua derivada f ′ (z) : R2 → R2 é uma transformação linear do plano que
consiste em multiplicar por um número complexo fixo. Ora, se T : R2 →
R2 é uma tal transformação, da forma T · z = (a + bi) · z, sua matriz na
base canônica tem
T · 1 = a + bi e T · i = −b + ai, ou seja, sua
as colunas
a −b
matriz é do tipo
. Se, para z = x+yi, f (z) = u(x, y)+i·v(x, y),
b a
a matriz jacobiana de f é
 ∂u ∂u 
 ∂x


 ∂v
∂x
∂y 

.
∂v 
∂y
Segue-se então que a função complexa f é derivável em U se, e somente
se, valem as relações ∂u/∂x = ∂v/∂y e ∂u/∂y = −∂v/∂x em todo ponto
z = x + yi ∈ U . Estas igualdades são conhecidas como as equações de
Cauchy-Riemann.
A derivada de f , considerada como função de uma variável complexa
é
f ′ (z) =
∂v
∂v
∂u
∂u
+i
=
−i
·
∂x
∂x
∂y
∂y
Exemplo 7. Se f, g : U → Rn são diferenciáveis no ponto a ∈ U
Rm então a aplicação (f, g) : U → Rn × Rn , definida por (f, g)(x)
(f (x), g(x)), é diferenciável no ponto a e sua derivada é (f, g)′ (a) · v
(f ′ (a) · v, g ′ (a) · v). Se f, g ∈ C k então (f, g) também é de classe C k .
3
⊳
⊂
=
=
⊳
Cálculo diferencial de aplicações
Teorema 1 (Regra da Cadeia). Sejam U ⊂ Rm , V ⊂ Rn abertos e
f : U → Rn , g : V → Rp diferenciáveis nos pontos a ∈ U , b = f (a) ∈ V ,
com f (U ) ⊂ V . Então g ◦ f : U → Rp é diferenciável no ponto a e
(g ◦ f )′ (a) = g ′ (b) · f ′ (a) : Rm → Rp .
Resumidamente: a derivada da aplicação composta é a composta das
derivadas.
104
Aplicações Diferenciáveis
Cap. 5
Demonstração. Podemos escrever
f (a + v) = f (a) + f ′ (a) · v + ρ(v) · |v|, com lim ρ(v) = 0 e
v→0
g(b + w) = g(b) + g ′ (b) · w + σ(w) · |w|, com lim σ(w) = 0.
w→0
Então
(g ◦ f )(a + v) = g(f (a) + f ′ (a) · v + ρ(v) · |v|).
Pondo w = f ′ (a) · v + ρ(v) · |v|, obtemos:
(g ◦ f )(a + v) = g(b + w)
= g(b) + g ′ (b) · (f ′ (a) · v) + g ′ (b) · ρ(v)|v| + σ(w) · |w|
= (g ◦ f )(a) + [g ′ (b) · f ′ (a)] · v + C(v) · |v|,
onde
C(v) = g ′ (b) · ρ(v) + σ(w) · f ′ (a) ·
Se v → 0 então w → 0 e f ′ (a) ·
provando o teorema.
v
+ ρ(v) .
|v|
v
é limitada. Portanto lim C(v) = 0,
v→0
|v|
Corolário 1. Se f : U → Rn e g : V → Rp (com U ⊂ Rm e f (U ) ⊂ V ⊂
Rn ) são de classe C k então g ◦ f : U → Rp é de classe C k .
Com efeito, a Regra da Cadeia aplicada num ponto genérico x ∈ U ,
fornece (g ◦ f )′ (x) = g ′ (f (x)) · f ′ (x). Em termos funcionais, temos
(g ◦ f )′ = (g ′ ◦ f ) · f ′ : U → L(Rm ; Rp ),
onde ◦ é a composição de aplicações e · é a multiplicação de transformações lineares, a qual é bilinear, logo C ∞ . Se f e g são de classe C 1 ,
esta última igualdade mostra que (g ◦ f )′ é contı́nua, logo g ◦ f ∈ C 1 .
Por indução, supondo f e g de classe C k , a mesma igualdade mostra
que (g ◦ f )′ ∈ C k−1 , logo g ◦ f ∈ C k .
Corolário 2. Nas condições do Teorema 1, a matriz jacobiana de g ◦ f
no ponto a é o produto da matriz jacobiana de g no ponto f (a) pela
matriz jacobiana de f no ponto a : J(g ◦ f )(a) = Jg(f (a)) · Jf (a).
Em termos de derivadas parciais, a igualdade acima lê-se
n
X ∂gi ∂yk
∂gi
=
·
·
∂xj
∂yk ∂xj
k=1
Seção 3
Cálculo diferencial de aplicações
105
Nesta fórmula, escrita da maneira tradicional, os xj são coordenadas
de um ponto em U , os yk em V , ∂gi /∂xj é derivada parcial de gi ◦ f
enquanto ∂gi /∂yk é derivada parcial de gi e, finalmente, ∂yk /∂xj significa, em nossa notação costumeira, ∂fk /∂xj . Com tais entendimentos
tácitos, essa fórmula tem sobrevivido e sido útil através dos anos.
Corolário 3 (As regras de derivação). Sejam f, g : U → Rn diferenciáveis no ponto a ∈ U ⊂ Rm , α um número real e B : Rn ×Rn → Rp
bilinear. Então:
1) f + g : U → Rn é diferenciável no ponto a, com (f + g)′ (a) =
f ′ (a) + g ′ (a).
2) α · f : U → Rn é diferenciável no ponto a, com (αf )′ (a) = α · f ′ (a).
3) B(f, g) : U → Rp , definida por B(f, g)(x) = B(f (x), g(x)), é diferenciável no ponto a, com
[B(f, g)]′ (a) · v = B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v).
Os itens 1) e 2) podem ser provados diretamente a partir da definição
de aplicação diferenciável ou então considerando as transformações lineares S : Rn × Rn → Rn , α∗ : Rn → Rn , definidas por S(x, y) = x + y
e α∗ (x) = α · x. Então é só observar que f + g = S ◦ (f, g) e α · f = α∗ ◦ f
e usar a Regra da Cadeia, lembrando que S ′ = S e (α∗ )′ = α∗ , logo
(f + g)′ = S ◦ (f ′ , g ′ ) = f ′ + g ′ e (α · f )′ = (α∗ ◦ f )′ = α∗ ◦ f ′ = α · f ′ .
Quanto ao item 3), basta usar a Regra da Cadeia e os Exemplos 5, 7.
Então, como B(f, g) = B ◦ (f, g), temos, para cada v ∈ Rm :
[B(f, g)]′ (a) · v = [B ◦ (f, g)]′ (a) · v = B ′ (f (a), g(a)) · (f ′ (a) · v, g ′ (a) · v)
= B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v).
Observação. Uma aplicação bilinear B : Rn × Rn → Rp pode (e deve)
ser considerada como uma forma de multiplicar um elemento de Rn por
outro obtendo um produto em Rp . Usando a notação multiplicativa
x • y em vez de B(x, y), a regra de derivação do item 3) do Corolário 3
lê-se (f • g)′ = f ′ • g + f • g ′ , isto é, para todo x ∈ U e todo v ∈ Rn ,
(f • g)′ (x) · v = (f ′ (x) · v) • g(x) + f (x) • (g ′ (x) · v). (O ponto maior •
106
Aplicações Diferenciáveis
Cap. 5
é o produto que substitui B e o ponto menor · é a aplicação de uma
transformação linear sobre um vetor.)
Exemplo 8. Um exemplo freqüente de aplicação bilinear é o produto
interno de vetores. Se tivermos ϕ(x) = hf (x), g(x)i, com f, g : U → Rn
diferenciáveis em U ⊂ Rm então, para todo v ∈ Rm , vale ϕ′ (x) · v =
hf ′ (x)·v, g(x)i+hf (x), g ′ (x)·vi. Em particular, se ϕ(x) = hf (x), f (x)i =
|f (x)|2 então ϕ′ (x) · v = 2hf (x), f ′ (x) · vi. Levando em conta a fórmula
√
√
( u)′ = u′ /2 u para a derivada da raiz quadrada de uma função real
positiva u, daı́ resulta que, pondo
p
ξ(x) = hf (x), f (x)i = |f (x)|, tem-se ξ ′ (x) · v = hf ′ (x) · v, f (x)i/|f (x)|
sempre que f (x) 6= 0.
⊳
Exemplo 9. Outro exemplo comum de aplicação bilinear é a multiplicação de matrizes (ou de transformações lineares). Vejamos um caso
particular desta situação. Se A : Rm → Rm é um operador auto-adjunto
então resulta do exemplo anterior que a derivada da forma quadrática
ϕ(x) = hAx, xi atua assim: ϕ′ (x) · v = hAv, xi + hAx, vi = 2hAx, vi,
levando em conta que hAv, xi = hv, Axi, pela definição de operador
auto-adjunto. Algumas pessoas preferem considerar A como uma matriz simétrica a do tipo m×m e x ∈ Rm como uma matriz x do tipo m×1
(matriz-coluna) cuja transposta xT é uma matriz-linha 1 × m. Então a
x) = xT ax
forma quadrática ϕ se escreve como ϕ(x
ax. Desta maneira, para
m
cada vetor v ∈ R (ou seja, para cada matriz v do tipo m × 1) tem-se
x) · v = v T ax + xT av = xT av + xT av = 2xT av
ϕ′ (x
av, que corresponde a
2hAx, vi na notação de operadores.
⊳
Exemplo 10. Seja U ⊂ M (n × n) o conjunto das matrizes invertı́veis
n × n, isto é, das matrizes que têm determinante 6= 0. Como o determinante é uma função contı́nua, U é aberto. Seja f : U → M (n × n)
x) = x −1 . Afirmaa aplicação que associa a cada x ∈ U sua inversa f (x
mos que f é diferenciável e que, em cada ponto x ∈ U , sua derivada
x) : M (n × n) → M (n × n) é a transformação linear definida por
f ′ (x
x) · v = −x
x−1 · v · x −1 , v ∈ M (n × n). Para provar isto, atribuiremos
f ′ (x
x|, igual à norma da transa cada matriz x ∈ M (n × n) a norma |x
formação linear X : Rn → Rn que tem x como matriz na base canônica.
x| = sup{|X · u|;
(Veja Exemplo 12, Capı́tulo 1.) Mais explicitamente: |x
n−1
x · y| ≤
u∈S
}. Como se vê facilmente, se x , y ∈ M (n × n) então |x
x| · |yy |. Provemos agora a diferenciabilidade de f . Escrevemos
|x
x + v )−1 − x −1 = −x
x−1vx −1 + r(vv )
(x
Seção 3
Cálculo diferencial de aplicações
107
e mostramos que lim r(vv )/|vv | = 0. Com este objetivo, multiplicamos
v→0
ambos os membros da igualdade acima, à direita, por x + v . Após uma
simplificação óbvia, obtemos
x−1 · v )2 (x
x + v )−1 ,
r(vv ) = (x
donde
x−1 |2 |vv |2 |(x
x + v )−1 |,
|r(vv )| ≤ |x
|r(vv )|
x−1 |2 |(x
x + v )−1 | |vv |
≤ |x
|vv |
x + v )−1 se justifica pelo fato de
e daı́ lim r(vv )/|vv | = 0. (O uso de (x
v→0
que, sendo U aberto, x ∈ U ⇒ x + v ∈ U para toda v suficientemente
pequena.)
⊳
Observação. Na verdade a inversão de matrizes f : U → U , considerada
no Exemplo 10, é uma aplicação C ∞ . Isto pode ser verificado diretamente, a partir da fórmula que exprime x −1 em função de x , utilizando
a chamada “adjunta clássica”de uma matriz. (Ver também “Análise no
Espaço Rn ”, página 26.)
Lembremos que a norma de uma transformação linear T : Rm → Rn
é o número |T | = sup{|T · u|; u ∈ S n−1 }. Desta definição resulta que,
para todo v ∈ Rm , tem-se |T · v| ≤ |T | · |v| e que, se S : Rn → Rp é outra
transformação linear então |S · T | ≤ |S| · |T |.
Teorema 2 (Desigualdade do Valor Médio). Seja f : U → Rn
diferenciável em todos os pontos do segmento de reta [a, a + v] ⊂ U . Se,
para todo t ∈ [0, 1], tem-se |f ′ (a + tv)| ≤ M então |f (a + v) − f (a)| ≤
M · |v|.
Demonstração. O caminho λ : [0, 1] → Rn , definido por λ(t) =
f (a + tv), é diferenciável, com λ′ (t) = f ′ (a + tv) · v, portanto |λ′ (t)| ≤
|f ′ (a + tv)| · |v| ≤ M · |v| para todo t ∈ [0, 1]. Segue-se então da Desigualdade do Valor Médio para caminhos (Teorema 1 do Capı́tulo 2) que
|λ(1) − λ(0)| ≤ M · |v| · (1 − 0), isto é, |f (a + v) − f (a)| ≤ M · |v|.
Corolário 4. Se o aberto U ⊂ Rm é convexo e M > 0 é tal que a
aplicação diferenciável f : U → Rn cumpre |f ′ (x)| ≤ M para todo x ∈ U
então f satisfaz a condição de Lipschitz |f (x) − f (y)| ≤ M |x − y| para
quaisquer x, y ∈ U .
Teorema 3 (Diferenciabilidade Uniforme). Seja f : U → Rn de
classe C 1 no aberto U ⊂ Rm . Se K ⊂ U é compacto então f é uniformemente diferenciável em K.
108
Aplicações Diferenciáveis
Cap. 5
Demonstração. Isto significa que, para todo ε > 0 dado, pode-se obter
δ > 0 tal que |v| < δ implica
|f (x + v) − f (x) − f ′ (x) · v| < ε · |v|
qualquer que seja x ∈ K. Para estabelecer este resultado, uma vez dado
ε > 0, devemos inicialmente encontrar δ > 0 com a seguinte propriedade:
para todo x ∈ K e todo v ∈ Rm com |v| ≤ δ tem-se x + v ∈ U e
|f ′ (x + v) − f ′ (x)| < ε. Ora, pelo Corolário 2 do Teorema 11, Capı́tulo 1,
existe δ > 0 tal que toda bola de centro num ponto x ∈ K e raio 2δ está
contida em U . Seja
[
L=
B[x; δ] = {y ∈ Rm ; d(y, K) ≤ δ}.
x∈K
Então L é um compacto, com K ⊂ L ⊂ U . Se x ∈ K e |v| ≤ δ então
x + v ∈ L. A aplicação f ′ : L → L(Rm , Rn ) é uniformemente contı́nua.
Logo, diminuindo δ se necessário, podemos admitir que |f ′ (x + v) −
f ′ (x)| < ε para todo x ∈ K e todo v ∈ Rn com |v| < δ. Evidentemente,
isto acarreta que |f ′ (x + tv) − f ′ (x)| < ε para todo t ∈ [0, 1], pois
|tv| ≤ |v| quando 0 ≤ t ≤ 1. Cumprida esta etapa, consideremos o
caminho λ : [0, 1] → Rn , definido por λ(t) = f (x + tv), com x ∈ K e
|v| < δ. Então λ′ (t) = f ′ (x + tv) · v. Pelo Teorema Fundamental do
Cálculo para caminhos,
Z 1
Z 1
′
f ′ (x + tv) · v · dt.
λ (t)dt =
f (x + v) − f (x) = λ(1) − λ(0) =
0
0
Logo
′
|f (x + v) − f (x) − f (x) · v| =
Z
0
′
1
[f ′ (x + tv) − f ′ (x)] · v · dt
≤ sup |f ′ (x + tv) − f (x)| |v| ≤ ε · |v|.
0≤t≤1
provando assim que f é uniformemente diferenciável em K.
Seção 4
4
Exercı́cios
109
Exercı́cios
Seção 1. A derivada como transformação linear
1. Seja f : Rm → Rm diferenciável, com f (0) = 0. Se a transformação linear f ′ (0)
não admite o autovalor 1, prove que existe uma vizinhança V de 0 em Rm tal
que f (x) 6= x para todo x ∈ V − {0}.
2. Dada a aplicação f : S m→ Rn , defina sua extensão radial F : Rm+1 → Rn
x
pondo F (x) = |x|·f
se x 6= 0 e F (0) = 0. Prove que F é diferenciável no
|x|
ponto 0 ∈ Rm+1 se, e somente se, f é (a restrição a S m de) uma transformação
linear.
3. Sejam U ⊂ Rm aberto, a ∈ U e f : U → Rn uma aplicação de classe C 2 . A
′′
m
m
derivada segunda de f é, por definição,
a aplicação bilinear f (x) : R ×R →
∂f
∂
Rn , dada por f ′′ (a) · u · v =
(a). Prove que f ′′ (a) · u · v = f ′′ (a) · v · u.
∂v ∂u
4. Dado U ⊂ Rm aberto e conexo, seja f : U → Rn − {0} diferenciável. A fim
de que |f (x)| seja constante, prove que é necessário e suficiente que, para todo
x ∈ U e todo v ∈ Rm , o vetor f ′ (x) · v seja ortogonal a f (x).
Seção 2. Exemplos de derivadas
1. Seja A : U → L(Rm ; Rn ) diferenciável no aberto U ⊂ Rp . Defina f : U × Rm →
Rn pondo f (x, v) = A(x) · v. Prove que f é diferenciável, com f ′ (x, v) · (h, k) =
(A′ (x) · h) · v + A(x) · k.
2. Seja f : U → R2 definida no aberto U ⊂ R2 . Suponha que, considerada como
função complexa, f seja derivável, com f ′ (z0 ) 6= 0 para um certo z0 ∈ U .
Considere caminhos α, β : (−ε, ε) → U tais que α(0) = β(0) = z0 e α′ (0) 6= 0,
β ′ (0) 6= 0. Prove que o ângulo entre α′ (0) e β ′ (0) é igual ao ângulo entre
f ′ (z0 ) · α′ (0) e f ′ (z0 ) · β ′ (0). Noutras palavras: f preserva os ângulos entre
curvas.
3. Seja f : R2 → R3 definida por f (x, y) = (x2 , y 2 , (x + y)2 ). Mostre que f ′ (x, y) :
R2 → R3 tem posto 2 ⇔ (x, y) 6= (0, 0).
4. Seja f : R3 → R4 , f (x, y, z) = (x2 − y 2 , xy, xz, zy). Mostre que f ′ (x, y, z)
é uma transformação linear injetiva, salvo quando x = y = 0. Determine a
imagem de f ′ (0, 0, z) : R3 → R4 .
5. Mostre que o posto da derivada da aplicação f : R3 → R3 , dada por
f (x, y, z) = (x + y + z, x2 + y 2 + z 2 , x3 + y 3 + z 3 ),
tem posto p nos pontos de R3 que têm p coordenadas diferentes.
110
Aplicações Diferenciáveis
Cap. 5
Seção 3. Cálculo diferencial de aplicações
1. Seja f : U → Rn diferenciável no aberto U ⊂ Rm . Se |f (x) − f (y)| ≤ M · |x − y|
para quaisquer x, y ∈ U (onde M > 0 é uma constante) então |f ′ (x)| ≤ M
para todo x ∈ U .
2. Seja U ⊂ Rm aberto. Dadas f : U → Rn g : U → Rp e T : U → L(Rn ; Rp ),
defina ϕ : U → R pondo ϕ(x) = hT (x) · f (x), g(x)i. Para x ∈ U e h ∈ Rm
quaisquer, determine ϕ′ (x) · h.
3. Sejam U ⊂ Rm , V ⊂ Rn abertos e f : U → V , g : V → Rp aplicações duas vezes
diferenciáveis. Para x ∈ U e y = f (x) ∈ V , interprete e prove a igualdade
(g ◦ f )′′ (x) = g ′′ (y) · f ′ (x) · f ′ (x) + g ′ (y) · f ′′ (x).
4. Seja U uma bola aberta de centro 0 em Rm . Dada A : U → L(Rm ; Rn ) diferenciável, tome x ∈ U e defina o caminho ϕ : (0, 1) → L(Rm ; Rn ) pondo ϕ(t) =
A(tx). Uma das interpretações seguintes para a fórmula ϕ′ (t) = A′ (tx) · x é
verdadeira: ϕ′ (t) · v = (A′ (tx) · x) · v ou ϕ′ (t) · v = (A′ (tx) · v) · x. Decida e
prove.
5. Seja f : U → Rn contı́nua no aberto U ⊂ Rm com [a, a + v] ⊂ U . Se f é
diferenciável em todos os pontos de (a, a + v) então, para toda T ∈ L(Rm ; Rn ),
prove que
|f (a + v) − f (a) − T · v| ≤ sup |f ′ (a + tv) − T | · |v|.
0<t<1
6. Dada f : U → R, diferenciável no aberto U ⊂ Rn , fixe a ∈ Rm e defina ϕ : U →
Rm pondo ϕ(x) = f (x) · a. Para cada x ∈ U , determine ϕ′ (x) : Rn → Rm .
6
Aplicações Inversas
e Implı́citas
1
O Teorema da Aplicação Inversa
Na página 97 do Volume 1 foi estabelecido que se f : I → R é derivável
no intervalo I ⊂ R, com f ′ (x) > 0 para todo x ∈ I, então f é uma bijeção
crescente sobre o intervalo J = f (I) e a função inversa g = f −1 : J → I
também é derivável, com g ′ (f (x)) = 1/f ′ (x). Evidentemente, resultado
análogo vale com f ′ (x) < 0, só que agora f é decrescente. Na verdade, pelo Teorema de Darboux (pág. 95 do Volume 1), bastaria supor
f ′ (x) 6= 0 para todo x ∈ I para garantir que f é uma bijeção monótona
(crescente ou decrescente) de I sobre J = f (I), com f −1 : J → I derivável. Nos termos da definição que será dada a seguir, isto significa que
a função diferenciável sobrejetiva f : I → J, entre intervalos I, J ⊂ R,
é um difeomorfismo se, e somente se, f ′ (x) 6= 0 para todo x ∈ I. Em
dimensões superiores esta condição significaria que f ′ (x) é um isomorfismo, mas seria apenas necessária para que f possuı́sse uma inversa
diferenciável.
Sejam U ⊂ Rm , V ⊂ Rn abertos. Uma aplicação f : U → V chamase um difeomorfismo entre U e V quando é uma bijeção diferenciável,
cuja inversa g = f −1 : V → U também é diferenciável.
Se f : U → V é um difeomorfismo, com g = f −1 : V → U , então de
g ◦ f = idU e f ◦ g = idV resulta, pela Regra da Cadeia, que g ′ (f (x)) ·
f ′ (x) = idRm e f ′ (x) · g ′ (f (x)) = idRn para todo x ∈ U , portanto
f ′ (x) : Rm → Rn é um isomorfismo cujo inverso é g ′ (f (x)) : Rn → Rm .
112
Aplicações Inversas e Implı́citas
Cap. 6
Em particular, m = n, ou seja, dois abertos em espaços euclidianos de
dimensões diferentes não podem ser difeomorfos.
Exemplo 1. Resulta do Exemplop15, Capı́tulo 1, que a aplicação
f : Rm → B, definida por f (x) = x/ 1 + |x|2 , é um homeomorfismo de
Rm sobre apbola aberta B ⊂ Rm , de centro 0 e raio 1, sendo g : B → Rm ,
g(y) = y/ 1 − |y|2 o homeomorfismo inverso de f . Na verdade, como
f e g são ambas aplicações diferenciáveis, as duas são difeomorfismos,
um inverso do outro. Deve-se observar, entretanto, que nem todo homeomorfismo diferenciável é um difeomorfismo, isto é, tem inverso diferenciável. O exemplo mais simples disto é f : R → R, com f (x) = x3 .
√
Como f ′ (0) = 0, a função inversa de f (que é g(x) = 3 x) não é diferenciável no ponto 0 = f (0).
Uma aplicação diferenciável f : U → Rm , definida no aberto U ⊂
m
R , chama-se um difeomorfismo local quando, para cada x ∈ U existe
uma bola aberta B = B(x; δ) ⊂ U tal que f aplica B difeomorficamente
sobre um aberto V contendo f (x). Segue-se daı́ que se f : U → Rm é
um difeomorfismo local então f ′ (x) : Rm → Rm é um isomorfismo, para
todo x ∈ U . O Teorema da Aplicação Inversa, que provaremos a seguir,
diz que quando f ∈ C 1 vale a recı́proca: se f ′ (x) é um isomorfismo para
todo x ∈ U então f é um difeomorfismo local.
Decorre da definição acima que um difeomorfismo local f : U → Rm
é uma aplicação aberta, isto é, a imagem f (A) de qualquer aberto A ⊂ U
é um subconjunto aberto de Rm . Com efeito, se tomarmos para cada
x ∈ A uma bola aberta Bx ⊂ A, com centro x, tal que f seja
S um
m
difeomorfismo de Bx sobre um aberto Vx ⊂ R , então A =
Bx e
x∈A
f (A) = f (∪Bx ) = ∪f (Bx ) = ∪Vx é uma reunião de abertos, logo é um
aberto.
Observemos ainda que o difeomorfismo local f : U → Rm é um difeomorfismo (global) de U sobre o aberto V = f (U ) ⊂ Rm se, e somente
se, é uma aplicação injetiva.
⊳
Exemplo 2. Seja f : R2 → R2 definida por f (x, y) = (ex cos y, ex sen y).
Evidentemente, f ∈ C ∞ . Cada reta vertical x = a é transformada por
f , com perı́odo 2π (isto é, f (a, y) = f (a, y ′ ) ⇔ y ′ − y = 2kπ, k ∈ Z),
sobre a circunferência de centro 0 e raio ea . Cada reta horizontal y = b é
levada por f , bijetivamente, sobre a semi-reta aberta que parte da origem
e passa pelo ponto (cos b, sen b) ∈ S 1 . A imagem de f é R2 − {0}. Em
termos da variável complexa z = x + iy, tem-se f (z) = ez . A aplicação
Seção 1
O Teorema da Aplicação Inversa
113
f é um difeomorfismo local (mas não global pois f (x, y + 2π) = f (x, y)).
Isto decorre do Teorema da Aplicação Inversa (Teorema 4, a seguir),
pois a matriz jacobiana
x
e cos y −ex sen y
Jf (x, y) = x
e sen y ex cos y
tem determinante ex , portanto 6= 0, logo f ′ (x, y) : R2 → R2 é um isomorfismo, para todo (x, y) ∈ R2 . Podemos também chegar à mesma
conclusão observando que se w0 = f (z0 ) então o ramo da função complexa log w tal que log w0 = z0 é uma aplicação inversa local de f no
ponto w0 = f (z0 ).
Se I ⊂ R é um intervalo aberto então todo difeomorfismo local
f : I → R é um difeomorfismo (global) de I sobre J = f (I).
⊳
Teorema 1. Se o difeomorfismo f : U → V é de classe C k (k ≥ 1)
então seu inverso g = f −1 : V → U também é de classe C k .
Demonstração. (Indução em k.) Para todo y = f (x) ∈ V , temos
g ′ (y)=[f ′ (x)]−1 = [f ′ (f −1 (y))]−1 , portanto a aplicação g ′ : V →L(Rm ) =
2
Rm se exprime como a composta
g ′ = (Inv) ◦ f ′ ◦ f −1
onde Inv leva todo operador invertı́vel X : Rm → Rm no seu inverso
X −1 , f ′ : U → L(Rm ), leva todo ponto x ∈ U na derivada (invertı́vel)
f ′ (x) : Rm → Rm e f −1 : V → U é a aplicação inversa de f . Sabemos
que Inv ∈ C ∞ . Portanto, se f ∈ C k então f ′ ∈ C k−1 e, pela hipótese de
indução, f −1 ∈ C k−1 , logo g ′ ∈ C k−1 , como composta de três aplicações
de classe C k−1 . Por definição, isto significa que g ∈ C k .
Teorema 2. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rm . Se, para
algum a ∈ U , a derivada f ′ (a) : Rm → Rn é injetiva então existem δ > 0
e c > 0 tais que B = B(a; δ) ⊂ U e, para quaisquer x, y ∈ B tem-se
|f (x) − f (y)| ≥ c|x − y|. Em particular, a restrição f |B é injetiva.
Demonstração. A função u 7→ |f ′ (a) · u| é positiva em todos os pontos u da esfera unitária S m−1 , a qual é compacta. Pelo Teorema de
Weierstrass, existe c > 0 tal que |f ′ (a) · u| ≥ 2c para todo u ∈ S m−1 .
Por linearidade, segue-se que |f ′ (a) · v| ≥ 2c · |v| para todo v ∈ Rm . Para
todo x ∈ U , escrevamos
r(x) = f (x) − f (a) − f ′ (a)(x − a).
114
Aplicações Inversas e Implı́citas
Cap. 6
Então, para x, y ∈ U quaisquer, temos
f (x) − f (y) = f ′ (a) · (x − y) + r(x) − r(y).
Levando em conta que |u + v| ≥ |u| − |v|, segue-se que
|f (x) − f (y)| ≥ |f ′ (a) · (x − y)| − |r(x) − r(y)|
≥ 2c · |x − y| − |r(x) − r(y)|.
Observemos que a aplicação r, acima definida, é de classe C 1 , com r(a) =
0 e r′ (a) = 0. Pela continuidade de r′ , existe δ > 0 tal que |x − a| <
δ ⇒ x ∈ U e |r′ (x)| < c. A Desigualdade do Valor Médio, aplicada a
r no conjunto convexo B = B(a; δ) nos assegura que se x, y ∈ B então
|r(x) − r(y)| ≤ c|x − y|. Conseqüentemente, x, y ∈ B ⇒ |f (x) − f (y)| ≥
2c|x − y| − c|x − y|, ou seja, |f (x) − f (y)| ≥ c|x − y|, como querı́amos
demonstrar.
Teorema 3 (Diferenciabilidade do Homeomorfismo Inverso).
Seja f : U → V um homeomorfismo de classe C 1 entre os abertos U, V ⊂
Rm . Se, para algum x ∈ U , a derivada f ′ (x) : Rm → Rm é um operador
invertı́vel então o homeomorfismo inverso g = f −1 : V → U é diferenciável no ponto f (x), com g ′ (f (x)) = [f ′ (x)]−1 .
Demonstração. Se x, x+v ∈ U , escrevamos f (x) = y e f (x+v) = y+w.
Então
r(v)
=0
v→0 |v|
v = g(f (x + v)) − g(f (x)) = g(y + w) − g(y).
w = f (x + v) − f (x) = f ′ (x) · v + r(v) onde lim
e
Para provar que f ′ (x)−1 é a derivada de g no ponto y, escrevamos
g(y + w) − g(y) = f ′ (x)−1 · w + s(w)
(*)
s(w)
= 0. Entrando na igualdade (*) com as
|w|
expressões de v e w acima obtidas, vem:
e mostremos que lim
w→0
v = f ′ (x)−1 [f ′ (x) · v + r(v)] + s(w),
ou seja:
v = v + f ′ (x)−1 · r(v) + s(w),
Seção 1
O Teorema da Aplicação Inversa
115
donde
s(w) = −f (x)−1 · r(v), logo
isto é:
r(v) |v|
s(w)
= −f ′ (x)−1 ·
·
,
|w|
|v| |w|
s(w)
r(v)
|v|
= −f ′ (x)−1 ·
·
·
|w|
|v| |f (x + v) − f (x)|
r(v)
→ 0.
|v|
Além disso, pelo Teorema 2, existem δ > 0 e c > 0 tais que |v| < δ
implica
Quando w → 0, tem-se v → 0 pela continuidade de g, logo
|f (x + v) − f (x)| ≥ c|v|, portanto
s(w)
w→0 |w|
Assim, lim
|v|
1
≤ ·
|f (x + v) − f (x)|
c
= 0.
Corolário 1. Se f : U → V é um homeomorfismo de classe C k cuja
derivada f ′ (x) : Rm → Rm é invertı́vel para todo x ∈ U então seu inverso
g = f −1 : V → U é de classe C k .
Com efeito, a derivada g ′ : V → L(Rm ), dada por g ′ (y) = f ′ (g(y))−1
para cada y ∈ V , pode ser escrita como g ′ = Inv ◦ f ′ ◦ g, onde a
aplicação Inv, de classe C ∞ , é a inversão de transformações lineares
bijetivas e f ′ ∈ C k−1 . Admitindo, por indução, que g ∈ C k−1 , resulta
que g ′ ∈ C k−1 , logo g ∈ C k .
Teorema 4 (Teorema da Aplicação Inversa). Seja f : U → Rm de
classe C k (k ≥ 1) no aberto U ⊂ Rm . Se a ∈ U é tal que f ′ (a) : Rm →
Rm é invertı́vel então existe uma bola aberta B = B(a; δ) ⊂ U tal que a
restrição f |B é um difeomorfismo sobre um aberto V ∋ f (a).
Demonstração. Diminuindo δ, se necessário, no Teorema 2 podemos
admitir que B̄ = B[a; δ] ⊂ U e que f é injetiva no conjunto compacto
B̄, logo é um homeomorfismo de B sobre f (B). Além disso, como
f ′ (x) depende continuamente de x e todo operador linear suficientemente próximo de um invertı́vel é também invertı́vel, podemos supor
que, para todo x ∈ B, a derivada f ′ (x) : Rm → Rm é um isomorfismo.
Pelo Teorema 3, basta então mostrar que f (B) ⊂ Rm é aberto. Seja
então q = f (p), p ∈ B. Chamando de S = S[a, δ] a esfera que é a
fronteira de B̄, a injetividade de f |B̄ assegura que q ∈
/ f (S), logo existe
116
Aplicações Inversas e Implı́citas
Cap. 6
ε > 0 tal que |f (x) − q| ≥ 2ε para todo x ∈ S, pois f (S) é compacto.
Afirmamos que B(q; ε) ⊂ f (B). Com efeito, se y ∈ B(q; ε), então, pondo
g(x) = f (x) − y, o mı́nimo de |g(x)|, quando x varia no compacto B̄,
não é atingido num ponto x ∈ S pois x ∈ S ⇒ |f (x) − y| ≥ ε enquanto
|f (p) − y| = |q − y| < ε, com p ∈ B. Assim, o mı́nimo de |f (x) − y|,
x ∈ B̄ é atingido num ponto x0 ∈ B. Pelo lema a seguir, isto implica
que esse mı́nimo é zero, portanto y = f (x0 ), donde y ∈ f (B), ou seja,
B(q; ε) ⊂ f (B).
Lema 1. Sejam U ⊂ Rm aberto e g : U → Rn diferenciável no ponto
a ∈ U , com g ′ (a) : Rm → Rn sobrejetiva. Se a é um ponto de mı́nimo
local de |g(x)|, x ∈ U , então g(a) = 0.
Demonstração. Se a é um ponto de mı́nimo local para |g(x)|, será
também um ponto de mı́nimo local para a função ϕ : U → R, definida
por ϕ(x) = |g(x)|2 = hg(x), g(x)i, logo ϕ′ (a) = 0. Mas, como ϕ′ (a) · v =
2hg ′ (a) · v, g(a)i, isto significa que g(a) é ortogonal à imagem de g ′ (a), a
qual é Rn . Logo g(a) = 0.
Exemplo 3. Dadas as matrizes x , m ∈ M (n × n), diz-se que x é
uma raiz quadrada de m quando x 2 = m . Nem toda matriz m posx2 ) = (det x )2 , uma condição necessária é
sui raiz quadrada: como det(x
que det m ≥ 0 . Mas esta
condição
não é suficiente pois é fácil ver que,
−1 0
embora a matriz m =
tenha determinante positivo, não existe
1 −1
x ∈ M (2 × 2) tal que x 2 = m . O Teorema 4 pode ser usado para mostrar que toda matriz próxima da identidade I n tem raiz quadrada. Com
x) = x 2 ,
efeito, consideremos a aplicação f : M (n × n) → M (n × n), f (x
∞
de classe C . Sua derivada num ponto x ∈ M (n × n) é a transformação
2
2
x) : Rn → Rn , dada por f ′ (x
x) · m = m · x + x · m . Em parlinear f ′ (x
2
2
′
ticular, para x = I n , tem-se f (II n ) · m = 2m
2m, logo f ′ (II n ) : Rn → Rn
é um isomorfismo. Segue-se do Teorema 4 que existe um aberto U em
M (n × n), contendo a matriz identidade, restrita ao qual f é um difeomorfismo sobre o aberto V = f (U ). Assim, para toda matriz y ∈ V ,
√
existe uma única matriz x = y ∈ U tal que x 2 = y . Além disso, a
√
aplicação f −1 : V → U , y 7→ y , é de classe C ∞ .
⊳
Corolário 2 (do Teorema 4). Seja a ∈ U um ponto crı́tico da função
f : U → R, de classe C 2 no aberto U ⊂ Rn . Se a matriz hessiana
2
∂ f
(a)
Hf (a) =
∂xi ∂xj
Seção 2
Várias Funções Implı́citas
117
é invertı́vel então existe um aberto V , com a ∈ V ⊂ U , no qual não há
outros pontos crı́ticos de f .
Com efeito, a matriz hessiana Hf (x) é, para todo x ∈ U , a matriz
jacobiana da aplicação
∂f
∂f
(x), . . . ,
(x) .
F : U → Rn , F (x) = grad f (x) =
∂x1
∂xn
Como Hf (a) é invertı́vel, F é injetiva numa vizinhança V ∋ a, logo
F (x) 6= F (a), isto é, grad f (x) 6= 0 para todo x ∈ V − {a}.
Quando grad f (a) = 0 e Hf (a) é invertı́vel, a chama-se um ponto
crı́tico não-degenerado da função f . O corolário acima diz que os pontos
crı́ticos não-degenerados são pontos crı́ticos isolados.
2
Várias Funções Implı́citas
Os pontos do espaço Rm+n serão representados sob a forma z = (x, y),
onde x = (x1 , . . . , xm ) ∈ Rm e y = (y1 , . . . , yn ) ∈ Rn . Um difeomorfismo
h : U → V , entre abertos U, V ⊂ Rm+n , será chamado de vertical quando
for do tipo h(x, y) = (x, h2 (x, y)), ou seja, quando deixar invariante a
coordenada x. O inverso de um difeomorfismo vertical é ainda vertical.
Um difeomorfismo ϕ : U → V é usualmente interpretado como uma
transformação geométrica que aplica diferenciavelmente o conjunto U
sobre o conjunto V , de forma invertı́vel. Às vezes, porém, é conveniente
olhar para ϕ como uma mudança de coordenadas, em que as coordenadas
do ponto x ∈ U passam a ser aquelas da sua imagem y = ϕ(x) ∈
V . Sob este ponto de vista, o teorema a seguir diz que se a derivada
de uma aplicação f , de classe C k , é sobrejetiva num ponto p então é
possı́vel obter (de modo bastante simples) um sistema de coordenadas,
válido numa vizinhança aberta Z de p, tal que, em termos dessas novas
coordenadas, a aplicação f assume a expressão
(x1 , . . . , xm , w1 , . . . , wn ) 7→ (w1 , . . . , wn ).
Teorema 5 (Forma Local das Submersões). Seja f = (f1 , . . . , fn )
uma aplicação de classe C k (k ≥ 1) de um aberto U ⊂ Rm+n em Rn .
Se, num ponto p = (a, b) ∈ U , a matriz
∂fi
(p) (i, j = 1, . . . , n)
∂yj
118
Aplicações Inversas e Implı́citas
Cap. 6
é invertı́vel então existem abertos Z ∋ p em Rm+n , V ∋ a em Rm ,
W ∋ c = f (p) em Rn e um difeomorfismo vertical h : V × W → Z, de
classe C k , tal que f (h(x, w)) = w para todo x ∈ V e todo w ∈ W .
U
Rn
Z
p
f
ϕ
h
V ×W
W
f ◦ h : (x, w) 7→ w
(a, c)
c = f (p)
Rm
V
a
Figura 6.1
Demonstração. Seja ϕ : U → Rm ×Rn a aplicação de classe C k definida
por ϕ(x, y) = (x, f (x, y)). A matriz jacobiana de ϕ tem a forma
I 0
,
Jϕ =
a b
onde I é a matriz identidade m × m e a matriz n × n
∂fi
(z)
b = b (z) =
∂yj
é, no ponto p = (a, b), invertı́vel.
Pelo Teorema da Aplicação Inversa, ϕ é um difeomorfismo de um
aberto Z ∋ p sobre um aberto de Rm × Rn , o qual podemos supor da
forma V ×W , onde V ⊂ Rm e W ⊂ Rn , com a ∈ V e c = f (a, b) ∈ W . O
difeomorfismo inverso h : V ×W → Z é da forma h(x, w) = (x, h2 (x, w)).
Então, para qualquer (x, w) ∈ V × W , tem-se
(x, w)=ϕ(h(x, w))=ϕ(x, h2 (x, w))=(x, f (x, h2 (x, w)))=(x, f (h(x, w))),
logo f (h(x, w)) = w para qualquer (x, w) ∈ V × W .
Seção 2
Várias Funções Implı́citas
119
Dada f : U → Rn , de classe C k no aberto U ⊂ Rm+n , a matriz de
sua derivada f ′ (p) : Rm+n → Rn tem n linhas e m + n colunas. Ela
é a matriz jacobiana Jf (p). Dizer que a transformação linear f ′ (p) é
sobrejetiva significa afirmar que é possı́vel escolher n dessas colunas de
modo que a matriz n × n resultante seja invertı́vel. No enunciado do
teorema acima, as colunas escolhidas são as n últimas porém isto nada
tem de essencial; trata-se apenas de simplificar a notação.
Quando a aplicação f : U → Rn , com U ⊂ Rm+n , possui derivada
sobrejetiva f ′ (z) : Rm+n → Rn em todo ponto z ∈ U , diz-se que f é
uma submersão. No Teorema 5, a restrição de f ao aberto Z é uma
submersão.
Com esta terminologia, podemos enunciar o
Corolário 3. Seja f : U → Rn uma submersão de classe C k , definida
no aberto U ⊂ Rm+n . Para cada ponto z ∈ U existem abertos Z ⊂ U ,
contendo z, W ⊂ Rn contendo c = f (z), V ⊂ Rm e um difeomorfismo
h : V × W → Z de classe C k , tais que f (h(x, w)) = w para todo x ∈ V
e todo w ∈ W .
Como f ′ (z) : Rm+n → Rn é sobrejetiva, n das m + n colunas da matriz jacobiana Jf (z) são linearmente independentes, logo formam uma
matriz invertı́vel n × n. Se essas forem as últimas colunas, o corolário
é meramente o Teorema 5. Se não forem, modificamos ligeiramente a
demonstração daquele teorema, permutando inicialmente as coordenadas em Rm+n de modo que as n colunas linearmente independentes de
Jf (z) sejam agora as últimas.
Teorema 6 (Teorema das Funções Implı́citas). Seja f =
(f1 , . . . , fn ) : U → Rn de classe C k (k ≥ 1) no aberto U ⊂ Rm+n .
Suponhamos que, no ponto p = (a, b) ∈ U , com f (p) = c, a matriz
n×n
∂fi
(p) (i, j = 1, . . . , n)
∂yj
seja invertı́vel. Então existem Z ⊂ U , aberto contendo p, V ⊂ Rm ,
aberto contendo a, e ξ : V → Rn de classe C k , com ξ(a) = b, com a
seguinte propriedade:
[(x, y) ∈ Z e f (x, y) = c] ⇔ [x ∈ V e y = ξ(x)].
A equivalência acima significa que f −1 (c)∩Z é o gráfico de ξ, isto é,
f −1 (c) ∩ Z = {(x, ξ(x)); x ∈ V }.
120
Aplicações Inversas e Implı́citas
Cap. 6
Demonstração. Sejam Z, V , W e h como no Teorema 5. Definamos
ξ : V → Rn pondo ξ(x) = h2 (x, c), onde h2 : V × W → Rn é a segunda
coordenada de h, ou seja, h(x, w) = (x, h2 (x, w)). Assim, (x, y) ∈ Z ⇒
x ∈ V e (x, y) = h(x, w), w ∈ W . Se, além disso, tem-se f (x, y) = c
então c = f (x, y) = f (x, ξ(x)) e y = ξ(x). Resumindo: (x, y) ∈ Z e
f (x, y) = c implicam x ∈ V e y = ξ(x). Reciprocamente, se x ∈ V e y =
ξ(x) então y = h2 (x, c) e f (x, y) = f (x, h2 (x, c)) = f (h(x, c)) = c.
O corolário abaixo é uma reformulação mais intrı́nseca do Teorema 6.
Corolário 4. Seja f : U → Rn de classe C k no aberto U ⊂ Rm+n .
Se, no ponto p ∈ U , com f (p) = c, a derivada f ′ (p) : Rm+n → Rn é
sobrejetiva então existe um aberto Z ⊂ U , com p ∈ Z, tal que f −1 (c) ∩ Z
é o gráfico de uma aplicação ξ : V → Rn , de classe C k num aberto
V ⊂ Rm .
A abordagem clássica do Teorema das Funções Implı́citas era a seguinte: “Se f1 , . . . , fn são funções reais de m + n variáveis, k vezes continuamente diferenciáveis, e p = (a1 , . . . , am , b1 , . . . , bn ) é uma solução
particular do sistema de equações
f1 (x1 , . . . , xm , y1 , . . . , yn ) = c1
f2 (x1 , . . . , xm , y1 , . . . , yn ) = c2
..
.
fn (x1 , . . . , xm , y1 , . . . , yn ) = cn ,
sendo a matriz n × n
∂fi
(p)
∂yj
invertı́vel, então as equações acima definem, de modo único, na vizinhança do ponto p em Rm+n , as variáveis y1 , . . . , yn como funções de
classe C k das variáveis x1 , . . . , xm : y1 = ξ1 (x1 , . . . , xm ), . . . , yn =
ξn (x1 , . . . , xm )”.
Escrevendo x = (x1 , . . . , xm ) e ξ(x) = (ξ1 (x), . . . , ξn (x)) tem-se, para
cada i = 1, . . . , n, com x numa vizinhança de a = (a1 , . . . , am ):
fi (x, ξ1 (x), . . . , ξn (x)) = ci , ou fi (x, ξ(x)) = ci .
Derivando cada uma dessas n identidades em relação a xj , vem:
n
∂fi X ∂fi ∂ξk
+
·
= 0,
∂xj
∂yk ∂xj
k=1
j = 1, . . . , m.
Seção 2
Várias Funções Implı́citas
121
Em termos matriciais, isto significa que
  ∂ξ 

 ∂f 
∂f1
∂f1
1
1
...
 ∂y1
 ∂xj 
 ∂xj 
∂yn 

 . 
 . 
.. 
..



 .  = −  ..
.
.
.
.

  .. 



 ∂fn

 ∂fn 
∂ξn 
∂fn
...
∂xj
∂y1
∂yn
∂xj
ou seja:
 ∂ξ 

∂f1
 ∂xj 
 ∂y1
 . 

 .  = −  ..
 . 
 .
 ∂ξn 
 ∂fn
∂xj
∂y1
1
...
..
.
...
 

∂f1 −1 ∂f1
 ∂xj 
∂yn 


.. 
  .. 
.   . 
∂fn   ∂fn 
∂yn
∂xj
∂ξi
a partir de f1 , . . . , fn , sem ser
∂xj
necessário conhecer explicitamente as funções ξ1 , . . . , ξn .
Sob o ponto de vista da Álgebra Linear intrı́nseca, a fim de mostrar
como a derivada ξ ′ (x) : Rm → Rn pode ser calculada quando se conhece
f mas não ξ explicitamente, é preciso estender o conceito de derivada
parcial.
As transformações lineares
Isto exibe as derivadas parciais
∂f
(z) : Rm → Rn
∂x
e
∂f
(z) : Rn → Rn ,
∂y
cujas matrizes nas bases canônicas dos espaços euclidianos em questão
são
∂fi
∂fi
(z) ∈ M (n × m) e
(z) ∈ M (n × n),
∂xj
∂yj
são chamadas as derivadas parciais de f no ponto z, relativamente à
decomposição Rm+n = Rm ⊕ Rn , obtida ao se escrever cada z ∈ Rm+n
∂f
sob a forma z = (x1 , . . . , xm , y1 , . . . , yn ). Assim,
(z) é a restrição
∂x
da transformação linear f ′ (z) : Rm+n → Rn ao subespaço Rm ⊂ Rm+n
∂f
(z) é a restrição de f ′ (z) ao subespaço
formado pelos vetores (x, 0) e
∂y
Rn que consiste nos vetores da forma (0, y). Para todo vetor w = (u, v) ∈
Rm+n , tem-se
∂f
∂f
(z) · u +
(z) · v.
f ′ (z) · w =
∂x
∂y
122
Aplicações Inversas e Implı́citas
Cap. 6
Usando estas derivadas parciais, a Regra da Cadeia nos permite concluir, a partir da identidade f (x, ξ(x)) = c para todo x ∈ V , que
∂f
∂f
(z) +
(z) · ξ ′ (x) = 0, com z = (x, ξ(x)).
∂x
∂y
Logo
−1
∂f
∂f
ξ (x) = −
(z) ·
(z),
∂y
∂x
′
ainda com z = (x, ξ(x)). Note que a hipótese do Teorema das Funções
∂f
(z) : Rn → Rn é inImplı́citas assegura que a transformação linear
∂y
vertı́vel para todo z na vizinhança de p.
Exemplo 4. Diz-se que o número complexo c é uma raiz simples do
polinômio p quando se tem p(z) = (z − c)q(z) com q(c) 6= 0. O Teorema
6 pode ser usado para mostrar que as raı́zes simples de um polinômio
dependem diferenciavelmente dos coeficientes desse polinômio. A fim de
provar isto escrevemos, para cada a = (a0 , . . . , an ) ∈ Cn+1 = R2n+2 e
cada z ∈ C = R2 ,
pa (z) = p(a0 , . . . , an , z) = a0 + a1 z + · · · + an z n .
∂p
(c) = p′a (c) = q(c), logo a
Então, de pa (z) = (z − c)q(z) resulta
∂z
∂p
matriz jacobiana (real) 2 × 2,
(c), é invertı́vel, por ser a matriz da
∂z
2
transformação linear de R que consiste na multiplicação pelo número
complexo não-nulo q(c). Portanto, em virtude do Teorema 6, existem
bolas abertas B = B(a; ε) em Cn+1 e B ′ = B(c; δ) em C tais que, para
todo b ∈ B, o polinômio pb possui uma única raiz ξ(b) ∈ B ′ , a qual é
simples, e a aplicação ξ : B → R2 , assim definida, é de classe C ∞ .
⊳
3
Exercı́cios
Seção 1. O Teorema da Aplicação Inversa
1. Sejam ϕ : U → Rm de classe C 1 no aberto U ⊂ Rm e c ∈ [0, 1) tais que
|ϕ(x) − ϕ(y)| ≤ c|x − y| para quaisquer x, y ∈ U . Prove que f : U → Rm , dada
por f (x) = x+ϕ(x), é um difeomorfismo de U sobre o aberto V = f (U ) ⊂ Rm .
Se U = Rm , prove que f (U ) = Rm .
2
2. Para todo k ∈ N, prove que existem abertos U, V ⊂ M (n × n) = Rn tais que
toda matriz y ∈ V possui uma única raiz k-ésima x ∈ U , isto é, tal que x k = y .
Seção 3
Exercı́cios
123
n(n+1)
3. Seja U ⊂ R 2
o conjunto dos operadores positivos A : Rn → Rn (representados por suas matrizes). Use o Teorema Espectral e prove que a aplicação
x) = x 2 , é um difeomorfismo C ∞ .
f : U → U , dada por f (x
4. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rn , com n > 1. Se o determinante jacobiano de f se anula apenas num conjunto de pontos isolados, prove
que f transforma todo aberto A ⊂ U num aberto f (A). Use este fato para
demonstrar que todo polinômio complexo não-constante p : R2 → R2 é uma
aplicação sobrejetiva, provando assim o Teorema Fundamental da Álgebra.
5. A seqüência de passos deste exercı́cio leva à conclusão de que, dados quaisquer
dois pontos a, b no aberto conexo U ⊂ Rn , existe um difeomorfismo h : U → U ,
de classe C ∞ , tal que h(a) = b. Os passos são:
1
5a. A função α : Rn → R, dada por α(x) = exp −
se |x| < 1 e α(x) = 0
1 − |x|2
∞
se |x| ≥ 1, é de classe C e, pondo ϕ(x) = e · α(x), tem-se ϕ : Rn → R de
classe C ∞ , com 0 < ϕ(x) ≤ 1 se |x| < 1, ϕ(0) = 1 e ϕ(x) = 0 se |x| ≥ 1.
5b. Seja c > 0 tal que c · sup · |ϕ′ (y)| · |b − a| < 1. A aplicação g : Rn → Rn ,
y∈Rn
definida por g(x) = x + ϕ(c(x − a)) · (b − a) é um difeomorfismo C ∞ tal que
g(a) = b e g(x) = x se |x − a| ≥ 1/c.
5c. Usando o Exemplo 1, vê-se que, para quaisquer pontos a, b numa bola aberta
B ⊂ Rn , existe um difeomorfismo k : B → B, de classe C ∞ tal que k(a) = b e
k(x) = x fora de um compacto K ⊂ B.
5d. Dados U ⊂ Rn aberto, conexo, e a, b ∈ U , o conjunto A dos pontos x ∈ U tais
que existe um difeomorfismo h : U → U , de classe C ∞ , com h(a) = x, é aberto
e seu complementar U − A também. Logo A = U e portanto b ∈ A.
5e. O difeomorfismo h : U → U , acima obtido, é tal que existe K ⊂ U compacto,
com h(x) = x se x ∈ U − K.
Seção 2. Várias funções implı́citas
1. Prove que toda submersão f : U → Rn de classe C 1 é uma aplicação aberta,
isto é, A ⊂ U aberto ⇒ f (A) ⊂ Rn aberto.
2. Seja f = (f1 , . . . , fn ) : U → Rn diferenciável. Prove que f é uma submersão
se, e somente se, em cada ponto x ∈ U os vetores grad f1 (x), . . . , grad fn (x)
são linearmente independentes.
2
3. Seja U ⊂ Rn um conjunto aberto de matrizes n × n. Prove que a função
det : U → R é uma submersão se, e somente se, nenhuma matriz em U tem
posto ≤ n − 2.
4. Sejam U ⊂ Rm × Rn , V ⊂ Rm abertos, f : U → Rn de classe C k (k ≥ 1),
cumprindo as condições do Teorema 6, ξ : V → Rn contı́nua e c ∈ Rn tais que,
para todo x ∈ V , tem-se (x, ξ(x)) ∈ U e f (x, ξ(x)) = c. Prove que ξ é de classe
C k . Use este resultado para provar que se ξ : V → R é contı́nua no aberto
V ⊂ R2 e, para todo (x, y) ∈ V vale (x2 + y 4 ) · ξ(x, y) + ξ(x, y)3 = 1 então
ξ ∈ C∞.
7
Superfı́cies Diferenciáveis
1
Parametrizações
Uma imersão do aberto U ⊂ Rm no espaço Rn é uma aplicação diferenciável f : U → Rn tal que, para todo x ∈ U , a derivada f ′ (x) : Rm →
Rn é uma transformação linear injetiva. Isto, naturalmente, só pode
ocorrer quando m ≤ n.
Quando m = n, toda imersão de classe C 1 de U ⊂ Rm em Rn é
um difeomorfismo local. Em geral, para m ≤ n quaisquer, o Teorema 2
do Capı́tulo 6 assegura que toda imersão de classe C 1 é uma aplicação
localmente injetiva.
Exemplo 1. Se I ⊂ R é um intervalo aberto, as imersões f : I → Rn
são o que chamamos no Capı́tulo 2 de caminhos regulares. Assim, por
exemplo, f : R → R2 , definida por f (t) = (t3 − t, t2 ) é uma imersão de
R no plano, a qual não é injetiva, pois f (−1) = f (1) = (0, 1).
⊳
(t3 − t, t2 )
t∈R
Figura 7.1
Seção 1
Parametrizações
125
Uma parametrização de classe C k e dimensão m de um conjunto
V ⊂ Rn é uma imersão ϕ : V0 → V de classe C k que é, ao mesmo tempo,
um homeomorfismo do aberto V0 ⊂ Rm sobre V .
Exemplo 2. Dada uma aplicação f : V0 → Rn , de classe C k no aberto
V0 ⊂ Rm , seja V = {(x, f (x)); x ∈ V0 } ⊂ Rm+n o gráfico de f . A
aplicação ϕ : V0 → V , dada por ϕ(x) = (x, f (x)), é uma parametrização
de dimensão m e classe C k do conjunto V ⊂ Rm+n . Com efeito, se
chamarmos de π : Rm+n → Rm a projeção sobre as m primeiras coordenadas, a igualdade π ◦ ϕ = idV0 mostra que ϕ é um homeomorfismo,
cujo inverso é a restrição π|V e, em virtude da Regra da Cadeia, que
π · ϕ′ (x) = idRm , logo ϕ′ (x) : Rm → Rm+n é injetiva, para todo x ∈ V0 ,
portanto ϕ é uma imersão.
⊳
Exemplo 3. Uma imersão ϕ : V0 → V pode muito bem ser bijetiva
sem ser um homeomorfismo, logo não é uma parametrização de V .
Um exemplo disso pode ser obtido tomando a restrição do caminho
f , visto no Exemplo 1 acima, ao intervalo (−1, +∞) ⊂ R. O caminho
ϕ : (−1, +∞) → R2 , dado por ϕ(t) = (t3 − t, t2 ), é uma imersão C ∞
bijetiva do intervalo (−1, +∞) em R2 mas não é uma parametrização da
sua imagem V pois a função inversa ϕ−1 : V → (−1, +∞) é descontı́nua
no ponto (0, 1) ∈ V . Com efeito, se (tn ) é uma seqüência decrescente
de números reais com lim tn = −1, vemos que lim ϕ(tn ) = (0, 1) = ϕ(1)
sem que se tenha lim tn = 1.
(t3 − t, t2 )
t > −1
Figura 7.2
Exemplo 4. Seja N = (0, . . . , 0, 1) o pólo norte da esfera unitária
S n = {x ∈ Rn+1 ; hx, xi = 1}. Pondo V = S n − {N } e V0 = Rn , o
homeomorfismo ϕ : V0 → V , inverso da projeção estereográfica ξ, (vide
Exemplo 16, Capı́tulo 1), é uma parametrização. Evidentemente, ϕ é
126
Superfı́cies Diferenciáveis
Cap. 7
de classe C ∞ e sua inversa ξ : S n − {N } → Rn é a restrição de uma
aplicação C ∞ (cujo domı́nio é o aberto U = {x ∈ Rn+1 ; xn+1 6= 1}).
A igualdade ξ ◦ ϕ = idRn mostra, via Regra da Cadeia, que ϕ é uma
imersão, o que completa a verificação.
⊳
2
Superfı́cies diferenciáveis
Um conjunto M ⊂ Rn chama-se uma superfı́cie de dimensão m e classe
C k quando todo ponto p ∈ M está contido em algum aberto U ⊂ Rn
tal que V = U ∩ M é a imagem de uma parametrização ϕ : V0 → V , de
dimensão m e classe C k . O conjunto V é um aberto em M , chamado
uma vizinhança parametrizada do ponto p. Escreve-se m = dim ·M .
Observação. Na definição acima, supõe-se tacitamente k ≥ 1. Mas
teria sentido considerar superfı́cies de classe C 0 . Bastaria admitir “parametrizações de classe C 0 ”, que são meramente homeomorfismos ϕ : V0 →
V de abertos V0 ⊂ Rm sobre abertos V ⊂ M . As superfı́cies de classe
C 0 são estudadas na Topologia. Seu interesse em Análise é reduzido,
principalmente porque não possuem espaços tangentes.
Quando dim ·M = 1, a superfı́cie M chama-se uma curva.
Exemplo 5. Como R0 = {0} reduz-se a um ponto, uma superfı́cie de
dimensão 0 em Rn é simplesmente um conjunto discreto. No extremo
oposto, as superfı́cies de dimensão n em Rn são os subconjuntos abertos,
pois a imagem de uma parametrização de dimensão n em Rn é aberta,
em virtude do Teorema da Aplicação Inversa.
⊳
Exemplo 6. A esfera S n é uma superfı́cie de dimensão n e classe
C ∞ em Rn+1 . Com efeito, a inversa da projeção estereográfica é uma
parametrização ϕ : Rn → S n −{N }. Para obter uma vizinhança parametrizada do pólo norte N , basta considerar −ϕ : Rn → S n − {N ∗ }, onde
N ∗ = −N é o pólo sul.
⊳
Exemplo 7. O produto cartesiano M × N de duas superfı́cies M ⊂ Rn
e N ⊂ Rk é uma superfı́cie em Rn+k pois se ϕ : V0 → V ⊂ M e ψ : W0 →
W ⊂ N são parametrizações então ξ : V0 × W0 → V × W ⊂ M × N ,
dada por ξ(x, y) = (ϕ(x), ψ(y)), é uma parametrização. Evidentemente,
dim(M × N ) = dim M + dim N . Em particular, o toro m-dimensional
T m = S 1 × · · · × S 1 , produto cartesiano de m cı́rculos, é uma superfı́cie
de dimensão m e classe C ∞ em R2m .
⊳
Seção 2
Superfı́cies diferenciáveis
127
Exemplo 8. O gráfico de uma aplicação f : U → Rn , de classe C k no
aberto U ⊂ Rm , é uma superfı́cie M = {(x, f (x)) ∈ Rm+n ; x ∈ U }, de
dimensão m e classe C k em Rm+n . Com efeito, M é a imagem da única
parametrização ϕ : U → M , ϕ(x) = (x, f (x)).
⊳
Ser uma superfı́cie é uma propriedade local: se todo ponto p ∈ M
está contido num conjunto V ⊂ M , aberto em M , o qual é uma superfı́cie
de classe C k e dimensão m, então o conjunto M ⊂ Rn é uma superfı́cie
de dimensão m e classe C k .
Em particular, se M é localmente o gráfico de uma aplicação f : V0 →
Rn , de classe C k num aberto V0 ⊂Rm , então M ⊂Rm+n é uma superfı́cie
de classe C k e dimensão m. Assim, por exemplo, as hiperfı́cies, conforme
definidas no Capı́tulo 4, são superfı́cies de dimensão n − 1 em Rn .
Quando M ⊂ Rn é uma superfı́cie de dimensão m, costuma-se dizer
que M tem co-dimensão n − m. Portanto, hiperfı́cies são superfı́cies de
co-dimensão 1.
No teorema abaixo, M é uma superfı́cie de dimensão m e classe C k
em Rn . Por “uma projeção π : Rn → Rm ”entendemos uma aplicação
dada por π(x1 , . . . , xn ) = (xi1 , . . . , xim ), definida a partir da escolha de
m ı́ndices i1 < · · · < im , compreendidos entre 1 e n.
Teorema 1. Seja ϕ : V0 → V uma parametrização em M . Para cada
p = ϕ(x0 ) ∈ V existe uma projeção π : Rn → Rm tal que π ◦ ϕ aplica
um aberto Z0 , com x0 ∈ Z0 ⊂ V0 , difeomorficamente sobre um aberto
W0 ⊂ Rm .
V
M
W
ϕ
π
Rm
x0
V0
Z0
π ◦ϕ
W0
Figura 7.3
128
Superfı́cies Diferenciáveis
Cap. 7
∂ϕi
(x0 ) ∈ M (n × m) tem m
Demonstração. A matriz jacobiana
∂xj
linhas linearmente independentes, de ı́ndices i1 < i2 < ·· · < im . Essas
∂ϕik
linhas formam a matriz m × m invertı́vel J =
(x0 ) e os ı́ndices ik
∂xj
definem uma projeção π : Rn → Rm . Observando que J é a matriz jacobiana da aplicação π ◦ ϕ : V0 → Rm , o Teorema 1 resulta imediatamente
do Teorema da Aplicação Inversa.
Corolário 1. Toda superfı́cie de classe C k é localmente o gráfico de
uma aplicação de classe C k .
Com efeito, usando a notação do Teorema 1, escrevamos os elementos
de Rn sob a forma z = (y, y ′ ), onde y = π(z). Ponhamos também
W = ϕ(Z0 ). Então a aplicação ψ = ϕ ◦ (π ◦ ϕ)−1 : W0 → W é uma
parametrização. Além disso, para todo y ∈ W0 , tem-se
π(ψ(y)) = (π ◦ ϕ) ◦ (π ◦ ϕ)−1 (y) = y, logo ψ(y) = (y, y ′ ).
Assim, W é o gráfico da aplicação de classe C k , f : W0 → Rn−m , dada
por f (y) = y ′ .
Corolário 2. Seja M ⊂ Rn uma superfı́cie de classe C k e dimensão m.
Se uma aplicação f : V0 → Rn , de classe C k no aberto V0 ⊂ Rp , tiver
sua imagem f (V0 ) contida na vizinhança W ⊂ M , parametrizada por
ψ : W0 → W , então ψ −1 ◦ f : V0 → Rm é uma aplicação de classe C k .
Com efeito, para cada ponto x0 ∈ V0 , com f (x0 ) = ψ(y0 ), existe,
pelo Teorema 1, uma projeção π : Rn → Rm tal que π ◦ ψ é um difeomorfismo de uma vizinhança de y0 sobre um aberto de Rm . Então, numa
vizinhança de x0 , podemos escrever
ψ −1 ◦ f = (π ◦ ψ)−1 ◦ π ◦ f,
logo ψ −1 ◦ f é de classe C k .
Sejam ϕ : V0 → V e ψ : W0 → W parametrizações numa superfı́cie
M , de classe C k e dimensão m. Suponhamos que V ∩ W 6= ∅. Então
todo ponto p ∈ V ∩ W pode escrever-se como p = ϕ(x), x ∈ V0 e, como
p = ψ(y), y ∈ W0 , pode ser representado pelos m parâmetros que são
as coordenadas de x e pelas m coordenadas de y. A correspondência
x 7→ y, definida pela relação ϕ(x) = ψ(y), é a aplicação
ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ),
chamada mudança de parametrização.
Seção 3
O espaço vetorial tangente
W
V
M
V0
129
ψ
ϕ
W0
ψ −1 ◦ϕ
Rm
Figura 7.4
Corolário 3. Numa superfı́cie de classe C k , toda mudança de parametrização ψ −1 ◦ ϕ é um difeomorfismo de classe C k .
Com efeito, pelo Corolário 2, ψ −1 ◦ ϕ é uma aplicação de classe C k .
Pelo mesmo motivo, sua inversa ϕ−1 ◦ ψ também é de classe C k . Logo
ψ −1 ◦ ϕ é um difeomorfismo.
Exemplo 9. O conjunto M = {(x, x4/3 ); x ∈ R}, gráfico da função
f : R → R, f (x) = x4/3 , é uma curva de classe C 1 em R2 : a aplicação
ϕ : R → R2 , dada por ϕ(x) = (x, x4/3 ), é uma parametrização (global)
de M . Cabe observar, porém, que se V ⊂ M contém o ponto (0, 0), não
pode existir uma parametrização ψ : V0 → V de classe C k com k > 1.
Com efeito, se uma tal ψ existisse então o próprio conjunto V seria uma
curva de classe C k logo, pelo Corolário 1, uma vizinhança W do ponto
(0, 0), com W ⊂ V , seria o gráfico de uma função g : W0 → R, de classe
C k . Neste caso, para todo x ∈ W0 terı́amos (x, g(x)) ∈ W ⊂ M , logo
g(x) = x4/3 , mas x4/3 é apenas de classe C 1 . Assim, M não é uma curva
de classe C 2 .
⊳
3
O espaço vetorial tangente
Seja p um ponto da superfı́cie M , de dimensão m e classe C k em Rn .
O espaço vetorial tangente a M no ponto p é um subespaço vetorial
Tp M ⊂ Rn que pode ser visto sob dois aspectos:
130
Superfı́cies Diferenciáveis
Cap. 7
1) Tp M é o conjunto dos vetores-velocidade v = λ′ (0) dos caminhos
diferenciáveis λ : (−ε, ε) → M , tais que λ(0) = p.
2) Tp M = ϕ′ (x0 ) · Rm é a imagem da derivada ϕ′ (x0 ) : Rm → Rn ,
onde ϕ : V0 → V é uma parametrização em M , com ϕ(x0 ) = p.
A primeira descrição de Tp M é intrı́nseca (não depende de escolhas
arbitrárias) mas não deixa claro que se trata de um subespaço vetorial de
Rn . Pela segunda descrição, Tp M é obviamente um subespaço vetorial
de Rn mas não é evidente que para outra parametrização ψ : W0 → W ,
com ψ(y0 ) = p, se tenha ψ ′ (y0 ) · Rm = ϕ′ (x0 ) · Rm .
As dúvidas ficarão sanadas se mostrarmos que os conjuntos definidos em 1) e 2) são o mesmo. Para ver isto, comecemos com o vetorvelocidade v = λ′ (0) de um caminho diferenciável λ : (−ε, ε) → M , com
λ(0) = p. Restringindo ε, se necessário, podemos admitir que a imagem
de λ esteja contida na imagem V de uma parametrização ϕ : V0 → V ⊂
M , com ϕ(x0 ) = p. Então, pelo Corolário 2, µ = ϕ−1 ◦ λ : (−ε, ε) → V0
é um caminho diferenciável em Rm , com µ(0) = x0 . Pondo u = µ′ (0),
temos
ϕ′ (x0 ) · u = ϕ′ (x0 ) · (ϕ−1 ◦ λ)′ (0) = (ϕ ◦ ϕ−1 ◦ λ)′ (0) = λ′ (0) = v.
Portanto todo vetor v = λ′ (0) pertence à imagem ϕ′ (x0 ) · Rm de Rm
pela derivada de alguma parametrização ϕ : V0 → V , com p ∈ V .
Reciprocamente, se v = ϕ′ (x0 ) · u então, como u = µ′ (0), onde
µ : (−ε, ε) → V0 é dado por µ(t) = x0 + t · u, temos v = λ′ (0) com
λ : (−ε, ε) → V , λ(t) = ϕ(µ(t)), logo v está no conjunto definido em 1).
Como toda parametrização ϕ é uma imersão, a derivada ϕ′ (x0 ) :
m
R → Rn é uma transformação linear injetiva, logo sua imagem ϕ′ (x0 ) ·
Rm = Tp M é um subespaço vetorial m-dimensional de Rn .
Os vetores
∂ϕ
∂ϕ
(x0 ) = ϕ′ (x0 ) · e1 , . . . ,
(x0 ) = ϕ′ (x0 ) · em
∂x1
∂xm
formam uma base de Tp M , chamada a base associada à parametrização
ϕ.
A seguir estenderemos, para superfı́cies quaisquer, o Teorema 3 do
Capı́tulo 4, provado para o caso de co-dimensão 1.
Seja f : U → Rn uma aplicação diferenciável, definida no aberto
U ⊂ Rm+n . Um ponto c ∈ Rn chama-se um valor regular de f quando,
Seção 3
O espaço vetorial tangente
131
para todo x ∈ U tal que f (x) = c, a derivada f ′ (x) : Rm+n → Rn é uma
transformação linear sobrejetiva.
Observe-se que, para n = 1, a transformação linear f ′ (x) : Rm+1 → R
é sobrejetiva se, e somente se, é diferente de zero, ou seja, grad f (x) 6= 0.
(Vide Exemplo 2, Capı́tulo 5.) Portanto esta definição de valor regular
estende a que foi dada anteriormente.
Teorema 2. Seja c ∈ Rn um valor regular da aplicação f : U → Rn ,
de classe C k no aberto U ⊂ Rm+n . A imagem inversa M = f −1 (c) =
{x ∈ U ; f (x) = c} é uma superfı́cie de classe C k e dimensão m em
Rm+n . O espaço vetorial tangente Tp M , em cada ponto p ∈ M , é o
núcleo da derivada f ′ (p) : Rm+n → Rn .
Demonstração. Pelo Corolário 4, Capı́tulo 6, M = f −1 (c) é localmente o gráfico de uma aplicação de classe C k , logo é uma superfı́cie.
Além disso, para p ∈ M , todo vetor v ∈ Tp M é da forma v = λ′ (0),
onde λ : (−ε, ε) → M é um caminho diferenciável, com λ(0) = p. Logo
f ′ (p) · v = (f ◦ λ)′ (0) = 0 pois f ◦ λ : (−ε, ε) → Rn é constante, igual a c.
Portanto Tp M está contido no núcleo de f ′ (p). Como f ′ (p) é sobrejetiva,
esse núcleo tem dimensão m e então é igual a Tp M .
Exemplo 10. Seja O(Rn ) o grupo ortogonal, formado pelas matrizes
x ∈ M (n × n), tais que x · x T = I n (matrizes ortogonais). Usaremos
o Teorema 2 para mostrar que O(Rn ) é uma superfı́cie (compacta), de
2
classe C ∞ e dimensão n(n − 1)/2 em Rn . Seja então f : M (n × n) →
S(Rn ) a aplicação definida no conjunto das matrizes n × n, com valores
x) =
no conjunto S(Rn ) das matrizes simétricas n × n, pela fórmula f (x
2
T
n
x · x . Já costumamos fazer a identificação M (n × n) = R . Agora
identificaremos S(Rn ) com Rn(n+1)/2 pois uma matriz simétrica n × n
fica determinada pelos seus elementos da diagonal e acima dela, em
número de n + (n − 1) + · · · + 2 + 1 = n(n + 1)/2. Assim, escrevemos
2
f : Rn → Rn(n+1)/2 e temos O(Rn ) = f −1 (II n ). Resta apenas verificar
que a matriz identidade I n é um valor regular de f . Tomando um ponto
arbitrário de f −1 (II n ), isto é, uma matriz ortogonal x , sabemos que a
2
x) : Rn → Rn(n+1)/2 é a transformação linear que a toda
derivada f ′ (x
2
x) · v = v · x T + x · v T . Para provar que
v ∈ Rn faz corresponder f ′ (x
′
x) é sobrejetiva, seja dada s ∈ Rn(n+1)/2 . Tomando v = sx
f (x
sx/2 temos
′
T
T
x) · v = sx · x /2 + xx · s /2 = s /2 + s /2 = s . (Lembre que s T = s .)
f (x
Vale dim O(Rn ) = n2 − n(n + 1)/2 = n(n − 1)/2.
132
Superfı́cies Diferenciáveis
Cap. 7
Observemos, em relação ao Exemplo 10, que o espaço vetorial tangente a O(Rn ) no ponto I n é o conjunto das matrizes anti-simétricas
n × n, isto é, matrizes v tais que v + v T = 0. Com efeito, sendo a deri2
vada f ′ (II n ) : Rn → Rn(n+1)/2 dada por v 7→ v · I Tn + I n · v T , vemos que
o núcleo de f ′ (II n ), ou seja, o espaço vetorial tangente a O(Rn ) no ponto
I n , é o conjunto das matrizes anti-simétricas.
4
Superfı́cies orientáveis
Como no caso de hiperfı́cies (co-dimensão 1), tratado no Capı́tulo 4, cabe
observar que nem toda superfı́cie em Rn pode ser obtida como imagem
inversa de um valor regular.
Com efeito, se M = f −1 (c) 6= ∅ é a imagem inversa do valor regular
c ∈ Rn pela aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n
então, chamando de f1 , . . . , fn : U → R as funções-coordenada de f ,
vemos que grad f1 , . . . , grad fn : U → Rm+n são campos de vetores de
classe C k−1 , com as seguintes propriedades:
1) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são ortogonais ao espaço vetorial tangente Tx M . (Diz-se então que os grad fi
são campos de vetores normais a M .)
2) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são linearmente independentes.
A afirmação 1) resulta do fato de que, para cada i = 1, . . . , n,
a função fi : U → R é constante ao longo de M . Todo vetor v ∈
Tx M , para x ∈ M qualquer, é o vetor-velocidade v = λ′ (0) de um
caminho λ : (−ε, ε) → M , logo fi ◦ λ : (−ε, ε) → R é constante. Daı́,
h grad fi (x), vi = (fi ◦ λ)′ (0) = 0.
Por sua vez, a afirmação 2) é equivalente a dizer que c é um valor regular de f , pois grad
f1 (x), . . . , grad fn (x) são os vetores-linha da matriz
∂fi
jacobiana
(x) ∈ M (n×(m+n)). Sua independência linear significa
∂xj
que esta matriz, para todo x ∈ M , tem posto n, logo f ′ (x) : Rm+n → Rn
é sobrejetiva.
Mas nem toda superfı́cie M ⊂ Rm+n , de co-dimensão n, admite n
campos contı́nuos linearmente independentes de vetores normais. Uma
condição necessária para isto é que M seja orientável, conforme mostraremos agora.
Seção 4
Superfı́cies orientáveis
133
Um atlas numa superfı́cie M é um conjunto de parametrizações
ϕ : V0 → V cujas imagens V cobrem M . Duas parametrizações ϕ : V0 →
V e ψ : W0 → W dizem-se compatı́veis quando V ∩ W = ∅ ou então
V ∩ W 6= ∅ e ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ) tem determinante
jacobiano positivo em todos os pontos x ∈ ϕ−1 (V ∩ W ). Um atlas A
na superfı́cie M chama-se coerente quando duas parametrizações quaisquer ϕ, ψ ∈ A são compatı́veis. Uma superfı́cie M chama-se orientável
quando admite um atlas coerente.
Teorema 3. Se uma superfı́cie M ⊂ Rm+n , de co-dimensão n,
admite n campos contı́nuos linearmente independentes de vetores normais v1 , . . . , vn : M → Rm+n então M é orientável.
Demonstração. Seja A o conjunto das parametrizações ϕ : V0 → V em
M tais que V0 é conexo e, para todo x ∈ V0 , a matriz
∂ϕ
∂ϕ
Φ (x) =
(x), . . . ,
(x), v1 (ϕ(x)), . . . , vn (ϕ(x)) ,
∂x1
∂xm
cujas m + n colunas são os vetores de Rm+n aı́ indicados, tem determinante positivo. Como V0 é conexo e os campos vi são contı́nuos, para ser
ϕ ∈ A basta que det Φ(x) > 0 para algum x ∈ V0 . Se for det Φ(x) < 0,
escrevemos x∗ = (−x1 , x2 , . . . , xm ) quando x = (x1 , x2 , . . . , xm ) e pomos
V0∗ = {x∗ ; x ∈ V0 }. Então ϕ∗ : V0∗ → V , dada por ϕ∗ (x) = ϕ(x∗ ), é uma
parametrização cuja imagem ainda é V mas det Φ ∗ (x) > 0. Isto mostra
que A é um atlas em M . Sejam ϕ, ψ ∈ A, com ϕ : V0 → V , ψ : W0 → W
e V ∩ W 6= ∅. Pondo ξ = ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ), temos
ϕ = ψ ◦ ξ. A Regra da Cadeia nos dá, para x ∈ ϕ−1 (V ∩ W ), y = ξ(x)
e 1 ≤ i, j ≤ m:
m
X
∂ψi
∂ϕi
(x) =
(y) · akj (x) ,
∂xj
∂yk
k=1
onde a (x) = [akj (x)] é a matriz jacobiana de ξ no ponto x. Portanto se,
para cada x ∈ ϕ−1 (V ∩ W ) e y = ξ(x), escrevermos
∂ψ
∂ψ
Ψ (y) =
(y), . . . ,
(y), v1 (ψ(y)), . . . , vm (ψ(y)) ,
∂y1
∂ym
a (x) 0
teremos Φ (x) = Ψ (y) · A (x), onde A (x) =
é a matriz (m +
0
I
n) × (m + n) formada a partir dos blocos a (x) ∈ M (m × m) e I = matriz
134
Superfı́cies Diferenciáveis
Cap. 7
identidade n×n. Então det Φ (x) = det Ψ (y)·det a (x) e daı́ det a (x) > 0.
Logo as parametrizações ϕ, ψ ∈ A são compatı́veis. O atlas A é coerente
e a superfı́cie M é orientável.
Corolário 4. Se M = f −1 (c) é a imagem inversa de um valor regular
da aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n , então M
é uma superfı́cie m-dimensional orientável.
Assim, por exemplo, o grupo ortogonal O(Rn ) é uma superfı́cie orientável.
Para co-dimensão 1, vale a recı́proca do Teorema 3. Ela resulta da
existência do produto vetorial w = v1 × · · · × vn de n vetores em Rn+1 ,
que descreveremos agora.
O produto w = v1 ×· · ·×vn é igual a zero quando os vetores v1 , . . . , vn
são linearmente dependentes. Caso contrário, w é o vetor que é ortogonal ao subespaço gerado por esses n vetores, tem comprimento igual
ao volume do paralelepı́pedo n-dimensional por eles determinado e seu
sentido é dado pela condição det[v1 , . . . , vn , w] > 0.
Em termos formais, seja m = [v1 , . . . , vn ] a matriz (n + 1) × n cujas
colunas são os vetores dados. Para cada i = 1, . . . , n + 1, indiquemos
com m i a matriz n × n obtida de m omitindo a i-ésima linha. Então o
produto vetorial w = v1 × · · · × vn é definido por
w = v1 × · · · × vn =
n+1
X
i=1
(−1)n+i+1 det m i · ei .
O desenvolvimento de Laplace de um determinante em relação à sua
última coluna mostra que, para todo vetor z ∈ Rn+1 , tem-se
hv1 × · · · × vn , zi = det[v1 , . . . , vn , z].
Esta última igualdade mostra que, de fato, v1 × · · · × vn = w é ortogonal a v1 , . . . , vn , que é zero quando esses vetores são linearmente dependentes e que det[v1 , . . . , vn , w] ≥ 0. Além disso, sabe-se que o volume
(n + 1)-dimensional do paralelepı́pedo cujas arestas são v1 , . . . , vn , w é o
produto do volume n-dimensional Vn de sua base (a qual tem v1 , . . . , vn
como arestas) pelo comprimento de sua altura, que é |w|, pois w é ortogonal a essa base. Logo
|w| · Vn = vol[v1 , . . . , vn , w] = | det[v1 , . . . , vn , w]|
= hv1 × · · · × vn , wi = |w|2 .
Seção 4
Superfı́cies orientáveis
135
Simplificando, vem |w| = Vn , ou seja, o comprimento do produto vetorial
v1 × · · · × vn é o volume n-dimensional do paralelepı́pedo cujas arestas
são os vetores v1 , . . . , vn . (Para maiores detalhes sobre o volume de um
paralelepı́pedo, ver o Apêndice a este capı́tulo.)
Concluindo estas considerações sobre o produto vetorial, mostraremos agora que se {u1 , . . . , un } e {v1 , . . . , vn } são bases do subespaço
vetorial E ⊂ Rn+1 e se a = [aij ] é a matriz de passagem da primeira
n
P
aij ui (j = 1, . . . , n), então
para a segunda, isto é, vj =
i=1
v1 × · · · × vn = det a · u1 × · · · × un .
Com efeito, como ambos estes produtos vetoriais são ortogonais ao
subespaço E ⊂ Rn+1 , que tem co-dimensão 1, eles são múltiplos um
do outro. Então, fixando os vetores u1 , . . . , un , definimos duas formas
n-lineares alternadas f , ∆ em E, pelas condições
e
v1 × · · · × vn = f (v1 , . . . , vn ) · u1 × · · · × un
n
X
aij ui , j = 1, . . . , n.
∆(v1 , . . . , vn ) = det[aij ] se vj =
i=1
Sabe-se (v. “Álgebra Linear”, pág. 261) que as formas n-lineares
alternadas num espaço vetorial de dimensão n constituem um espaço
vetorial de dimensão 1. Logo existe c ∈ R tal que f = c · ∆, ou seja,
f (v1 , . . . , vn ) = c · det[aij ] para quaisquer v1 , . . . , vn ∈ E. Tomando
v1 = u1 , . . . , vn = un , temos f (u1 , . . . , un ) = 1 e ∆(u1 , . . . , un ) = 1, logo
c = 1 e daı́ f = ∆, isto é,
onde
v1 × · · · × vn = det a · u1 × · · · × un ,
n
X
a = [aij ] e vj =
aij ui , j = 1, . . . , n.
i=1
Teorema 4. Toda superfı́cie orientável de co-dimensão 1 admite um
campo contı́nuo de vetores normais não-nulos.
Demonstração. Seja M ⊂ Rn+1 orientável de dimensão n. Para toda
parametrização ϕ : V0 → V pertencente ao atlas coerente A, o qual caracteriza a orientabilidade de M , definamos o campo contı́nuo de vetores
136
Superfı́cies Diferenciáveis
Cap. 7
normais unitários u : V → Rn+1 pondo, em cada ponto p ∈ V , u(p) =
w(p)/|w(p)|, onde
w(p) =
∂ϕ
∂ϕ
(x) × · · · ×
(x), x = ϕ−1 (p) ∈ V0 .
∂x1
∂xn
Se ψ : W0 → W for outra parametrização pertencente a A então ϕ e ψ
são compatı́veis. Assim, se V ∩ W 6= ∅, para todo p ∈ V ∩ W , com
z(p) =
∂ψ
∂ψ
(y) × · · · ×
(y), y = ψ −1 (p) ∈ W0 ,
∂y1
∂yn
como vimos acima, temos w(p) = det a ·z(p) onde a é a matriz jacobiana,
no ponto x, da mudança de parametrização ψ −1 ◦ ϕ. Logo det a > 0 e,
conseqüentemente,
w(p)
z(p)
=
= u(p).
|w(p)|
|z(p)|
Deste modo, o campo unitário normal u : M → Rn+1 está bem definido
e é, evidentemente, contı́nuo.
O Teorema 4 mostra que a definição de hiperfı́cie orientável dada no
Capı́tulo 4 é compatı́vel com a definição geral dada aqui.
Exemplo 11. Todo subconjunto aberto A de uma superfı́cie orientável
M é ainda uma superfı́cie orientável. Com efeito, se A é um atlas coerente em M então as restrições ϕ|(V0 ∩ϕ−1 (A)) → V ∩A das parametrizações ϕ : V0 → V pertencentes a A, com V ∩ A 6= ∅, formam um atlas
coerente em A. Portanto se uma superfı́cie bidimensional M contém
uma faixa de Moebius então M não é orientável.
⊳
Exemplo 12. O produto M × N de duas superfı́cies orientáveis M e N
é uma superfı́cie orientável. Com efeito, se A e B são atlas coerentes em
M e N respectivamente então as parametrizações do tipo ϕ × ξ : V0 ×
W0 → V × W , definidas por (ϕ × ξ)(x, y) = (ϕ(x), ξ(y)), onde ϕ ∈ A e
ξ ∈ B, formam um atlas em M × N , o qual é coerente pois (ψ × ζ)−1 ◦
(ϕ × ξ) = (ψ −1 ◦ ϕ) × (ζ −1 ◦ ξ) e o determinante jacobiano de (ψ −1 ◦ ϕ) ×
(ζ −1 ◦ ξ) é o produto dos determinantes jacobianos de ψ −1 ◦ ϕ e ζ −1 ◦ ξ.
Exemplo 13. Em virtude do Teorema 3, a esfera S n é uma hiperfı́cie
orientável em Rn+1 , pois admite o óbvio campo contı́nuo de vetores
normais unitários u : S n → Rn+1 , u(p) = p. Em particular, o cı́rculo
S 1 ⊂ R2 é orientável logo, pelo Exemplo 12, o toro n-dimensional T n =
S 1 × · · · × S 1 (n fatores) é uma superfı́cie orientável em R2n .
⊳
Seção 4
Superfı́cies orientáveis
137
Seja A um atlas coerente sobre a superfı́cie M . O par (M, A) chamase uma superfı́cie orientada. Uma parametrização ϕ : V0 → V diz-se
positiva quando é compatı́vel com todas as parametrizações ψ ∈ A.
Diz-se que ϕ é negativa quando, para toda ψ : W0 → W pertencente a
A e todo x ∈ ϕ−1 (V ∩ W ), o determinante jacobiano det J(ψ −1 ◦ ϕ)(x)
é negativo.
Numa superfı́cie orientada (M, A), duas parametrizações negativas
ϕ : V0 → V , ψ : W0 → W são sempre compatı́veis. Com efeito, dado
p = ϕ(x) ∈ V ∩ W , seja ξ : Z0 → Z pertencente a A tal que ξ(z) = p.
Então os determinantes jacobianos det J(ξ −1 ◦ ϕ)(x) e det J(ψ −1 ◦ ξ)(z)
são ambos negativos logo é positivo o seu produto
det J(ψ −1 ◦ ξ)(z) · det J(ξ −1 ◦ ϕ)(x) = det J(ψ −1 ◦ ϕ)(x).
Teorema 5. Seja (M, A) uma superfı́cie orientada. Se V ⊂ M é
conexo, toda parametrização ϕ : V0 → V é positiva ou negativa.
Demonstração: Sejam A o conjunto dos pontos p = ϕ(x) ∈ V tais
que existe ξ : W0 → W em A, com p ∈ W e det J(ξ −1 ◦ ϕ)(x) < 0,
e B o conjunto dos pontos q ∈ V para os quais existe ζ : Z0 → Z,
ζ ∈ A, com ζ(z) = q = ϕ(y) e det J(ζ −1 ◦ ϕ)(y) > 0. A e B são
abertos em V e A ∪ B = V . Além disso, A ∩ B = ∅ pois se existisse
p = ϕ(x) ∈ A∩B, terı́amos as parametrizações ξ : W0 → W , ζ : Z0 → Z,
com ξ(w) = ζ(z) = p, ambas em A e, como (ξ −1 ◦ϕ)◦(ζ −1 ◦ϕ)−1 = ξ −1 ◦ζ,
viria
det J(ξ −1 ◦ ζ)(z) = det J(ξ −1 ◦ ϕ)(x) · [det J(ζ −1 ◦ ϕ)(x)]−1 < 0
e o atlas A não seria coerente. Como V é conexo, tem-se A = ∅ (e então
ϕ é positiva) ou B = ∅ (e então ϕ é negativa).
Corolário. Se na superfı́cie M há duas parametrizações ϕ : V0 → V ,
ψ : W0 → W , com V, W conexas, tais que o determinante jacobiano
det J(ψ −1 ◦ ϕ)(x) muda de sinal quando x varia em ϕ−1 (V ∩ W ), então
M não é orientável .
Supondo, por absurdo, que existisse um atlas coerente A sobre M
então ϕ e ψ não poderiam ser ambas positivas nem ambas negativas, pois
são incompatı́veis. Tampouco pode ser uma delas, digamos ϕ, positiva
e a outra, ψ, negativa. Com efeito, se tal ocorresse, A ∪ {ϕ} seria ainda
138
Superfı́cies Diferenciáveis
Cap. 7
um atlas coerente, em relação ao qual ψ não seria positiva nem negativa,
como se vê pelos sinais do determinante jacobiano de ψ −1 ◦ ϕ.
Exemplo 14. Seja M ⊂ R6 o conjunto das matrizes 2 × 3 de posto
1. Cada elemento m ∈ M será escrito sob a forma m = [u, v], onde
os vetores u, v ∈ R3 são as suas linhas. Temos M = U ∪ V , onde
U é o conjunto das matrizes m = [u, v] de posto 1 tais que u 6= 0,
enquanto V ⊂ M é definido pela condição v 6= 0. Pondo U0 = R × (R3 −
{0}) as aplicações ϕ : U0 → U e ψ : U0 → V , definidas por ϕ(t, u) =
[u, tu] e ψ(t, v) = [tv, v], são parametrizações C ∞ . A interseção U ∩ V
é o conjunto das matrizes de posto 1 com ambas as linhas não-nulas,
logo ϕ−1 (U ∩ V ) = ψ −1 (U ∩ V ) = (R − {0}) × (R3 − {0}) tem duas
componentes conexas R+ × (R3 − {0}) e R− × (R3 − {0}). A mudança
de parametrização ξ = ψ −1 ◦ ϕ : ϕ−1 (U ∩ V ) → ψ −1 (U ∩ V ) é dada
por ξ(t, x, y, z) = (1/t, tx, ty, tz). Sua matriz jacobiana em cada ponto
(t, x, y, z) ∈ ϕ−1 (U ∩ V ) é
 1

− 2 0 0 0
 t


t 0 0
Jξ(t, x, y, z) =  x

 y
0 t 0
z
0 0 t
e seu determinante é igual a −t. A mudança de parametrização ξ =
ψ −1 ◦ ϕ tem, portanto, jacobiano negativo em R+ × (R3 − {0}) e positivo
em R− × (R3 − {0}). Segue-se do Teorema 5 que M é uma superfı́cie
C ∞ , não-orientável, de dimensão 4 em R6 .
⊳
Exemplo 12a. Vale a recı́proca do que foi visto no Exemplo 12: se
M × N é orientável, então M e N são ambas superfı́cies orientáveis.
Com efeito, seja A um atlas coerente em M × N . Fixemos, de uma vez
por todas, uma parametrização ξ : Z0 → Z ⊂ N , com Z conexo. Seja
B o conjunto das parametrizações ϕ : V0 → V ⊂ M tais que V é conexo
e ϕ × ξ : V0 × Z0 → V × Z ⊂ M × N é uma parametrização positiva.
Afirmamos que B é um atlas em M . Com efeito, dado qualquer ponto
p ∈ M , seja ϕ : V0 → V uma parametrização com V conexo e p ∈ V . Se
ϕ×ξ : V0 ×Z0 → V ×Z for positiva, temos ϕ ∈ B. Se, entretanto, ϕ×ξ for
negativa então, como na demonstração do Teorema 3, consideramos a parametrização ϕ∗ : V0∗ → V , dada por ϕ∗ (x1 , . . . , xm ) = ϕ(−x1 , . . . , xm )
e vemos que ϕ∗ × ξ : V0∗ × Z0 → V × Z é positiva, logo ϕ ∈ B. Além
disso, o atlas B é coerente pois se ϕ : V0 → V e ψ : W0 → W pertencem
Seção 5
Multiplicadores de Lagrange
139
a B, com V ∩ W 6= ∅, então, pondo α = (ψ × ξ)−1 ◦ (ϕ × ξ), temos
α = (ψ −1 ◦ ϕ) × id. Então o determinante jacobiano de ψ −1 ◦ ϕ é igual
ao de α, que é positivo. Portanto o atlas B é coerente e M é orientável.
Analogamente para N .
5
Multiplicadores de Lagrange
Estenderemos agora, para co-dimensão n qualquer, o método dos multiplicadores de Lagrange, apresentado no Capı́tulo 4 no caso em que a
superfı́cie ϕ−1 (c) tem co-dimensão 1, logo há apenas um multiplicador.
São dadas uma superfı́cie M , de dimensão m e classe C k , e uma
função f : U → R, de classe C k no aberto U , com M ⊂ U ⊂ Rm+n .
Quer-se determinar o conjunto dos pontos crı́ticos da restrição f |M .
Diz-se que p ∈ M é um ponto crı́tico da restrição f |M quando,
para todo caminho diferenciável λ : (−ε, ε) → M , com λ(0) = p, tem-se
(f ◦ λ)′ (0) = 0.
Como λ′ (0) = v ∈ Tp M e portanto
(f ◦ λ)′ (0) =
∂f
(p) = h grad f (p), vi,
∂v
concluı́mos que p ∈ M é ponto crı́tico de f |M se, e somente se, grad f (p)
é ortogonal a todos os vetores v ∈ Tp M , tangentes a M no ponto p, ou
seja, grad f (p) ∈ [Tp M ]⊥ .
Se p ∈ M é um ponto de mı́nimo (ou máximo) local da restrição
f |M e λ : (−ε, ε) → M é um caminho diferenciável com λ(0) = p então
0 é um ponto de mı́nimo (ou máximo) local de f ◦ λ : (−ε, ε) → R, logo
(f ◦ λ)′ (0) = 0 e então p é um ponto crı́tico de f |M .
Exemplo 15. Dada a superfı́cie M ⊂ Rm+n e fixado um ponto a ∈
Rm+n , suponhamos que exista, entre os pontos de M , (pelo menos) um
ponto p situado a uma distância mı́nima de a. Considerando a função
f : Rm+n → R, dada por f (x) = |x − a|2 , vemos que p é um ponto
de mı́nimo da restrição f |M . Logo grad f (p) é um vetor ortogonal a
Tp M . Mas grad f (p) = 2 · (p − a). Portanto os pontos p ∈ M situados
à distância mı́nima do ponto a são aqueles tais que o vetor p − a é
ortogonal a Tp M . Evidentemente, vale o mesmo para os pontos de M
mais afastados de a, caso existam (como ocorre quando M é compacta).
⊳
140
Superfı́cies Diferenciáveis
Cap. 7
Suponhamos agora que a superfı́cie M = ϕ−1 (c) seja obtida como
imagem inversa do valor regular c da aplicação ϕ : U → Rn , de classe
C k no aberto U ⊂ Rm+n . Se escrevermos ϕ(x) = (ϕ1 (x), . . . , ϕn (x)),
a afirmação de que c é um valor regular de ϕ significa que os vetores grad ϕ1 (x), . . . , grad ϕn (x) são linearmente independentes para todo
x ∈ U tal que ϕ(x) = c.
Com efeito, esses n vetores são as linhas da matriz jacobiana Jϕ(x) ∈
M (n × (m + n)), a qual tem posto n por ser a matriz da transformação
linear sobrejetiva ϕ′ (x) : Rm+n → Rn .
Além disso, conforme já vimos no inı́cio da Seção 4, em todo ponto
x ∈ M = ϕ−1 (c), os vetores grad ϕ1 (x), . . . , grad ϕn (x) são ortogonais a
Tx M , portanto formam uma base do complemento ortogonal [Tx M ]⊥ .
Podemos então enunciar o
Método dos multiplicadores de Lagrange. Sejam f : U → R uma
função de classe C k no aberto U ⊂ Rm+n e M = ϕ−1 (c) a imagem
inversa do valor regular c pela aplicação ϕ : U → Rn , de classe C k . A
fim de que p ∈ M seja um ponto crı́tico da restrição f |M é necessário
e suficiente que existam números λ1 , . . . , λn tais que
grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p).
Os números λ1 , . . . , λn são chamados multiplicadores de Lagrange.
De fato, p é ponto crı́tico de f |M se, e somente se, grad f (p) é ortogonal a Tp M . Como {grad ϕ1 (p), . . . , grad ϕn (p)} é uma base do complemento ortogonal de Tp M em Rm+n , dizer que grad f (p) ∈ [Tp M ]⊥
equivale a afirmar que grad f (p) é combinação linear dos gradientes
grad ϕ1 (p), . . . , grad ϕn (p).
Seja c = (c1 , . . . , cn ). Para encontrar os pontos crı́ticos p da restrição
f |M , devemos resolver o sistema abaixo, de m+2n equações com m+2n
incógnitas. (As incógnitas são as m + n coordenadas de p mais os n
multiplicadores λi .):
(
ϕ1 (p) = c1 , . . . , ϕn (p) = cn
grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p).
A última equação acima é vetorial. Ela equivale às m + n equações
numéricas
∂f
∂ϕ1
∂ϕn
(p) = λ1 ·
(p) + · · · + λn ·
(p), j = 1, . . . , m + n.
∂xj
∂xj
∂xj
Seção 5
Multiplicadores de Lagrange
141
Exemplo 16. Seja A : Rm → Rn uma transformação linear.
P Defina
m
n
∗
f : R × R → R pondo f (x, y) = hA · x, yi = hx, A · yi =
aij xj yi
(1 ≤ i ≤ n, 1 ≤ j ≤ m). Considerando o valor regular (1,1) da aplicação
ϕ : Rm × Rn → R2 , dada por ϕ(x, y) = (|x|2 , |y|2 ), seja M = S m−1 ×
S n−1 = ϕ−1 (1, 1). Vejamos quais são os pontos crı́ticos da restrição
f |M .
Para todo (x, y) ∈ Rm × Rn , temos grad f (x, y) = (A∗ · y, A · x) ∈
m
R × Rn . Além disso, ϕ = (ϕ1 , ϕ2 ), com grad ϕ1 (x, y) = (2x, 0) e
grad ϕ2 (x, y) = (0, 2y). Por conveniência, tomemos λ/2 e µ/2 como
multiplicadores de Lagrange. Um ponto p = (x, y) ∈ M é crı́tico para
f |M se, e somente se,
grad f (x, y) =
µ
λ
· grad ϕ1 (x, y) + · grad ϕ2 (x, y),
2
2
ou seja, (A∗ y, Ax) = (λx, µy). Isto nos dá A · x = µ · y e A∗ y = λ · x,
donde µ = hµ · y, yi = hAx, yi = hx, A∗ yi = hx, λ · xi = λ.
Portanto, os pontos crı́ticos de f |M são os pontos (x, y) ∈ S m−1 ×
S n−1 tais que Ax = λy e A∗ y = λx para um certo λ ∈ R. Notemos
que então λ = f (x, y) e que z ⊥ x ⇒ Az ⊥ y. Assim, se escrevermos
E = {z ∈ Rm ; hz, xi = 0} = complemento ortogonal de x em Rm , e F =
complemento ortogonal de y em Rn , a transformação linear A : Rm → Rn
aplica E em F .
Seja então p1 = (u1 , v1 ) ∈ S m−1 × S n−1 o ponto em que a função
f assume seu valor máximo em S m−1 × S n−1 : f (u1 , v1 ) = λ1 . Então
p1 é ponto crı́tico de f |M . Temos Au1 = λ1 · v1 e A∗ v1 = λ1 · u1 .
Como f (x, −y) = −f (x, y), vemos que λ1 ≥ 0. Se A 6= 0 então f não é
identicamente nula em M , logo λ1 > 0.
Em seguida consideremos A como uma transformação linear A : E →
F , agora com dim E = m−1 e dim F = n−1. Prosseguindo por indução,
chegaremos ao seguinte resultado:
Teorema dos Valores Singulares. Seja A : Rm → Rn uma transformação linear de posto r. Existem bases ortonormais {u1 , . . . , um } ⊂
Rm e {v1 , . . . , vn } ⊂ Rn tais que Aui = λi vi e A∗ vi = λi ui , onde λi > 0
para i = 1, . . . , r e λi = 0 para i ≥ r + 1.
Os números λ1 > 0, . . . , λr > 0 são chamados os valores singulares
de A.
142
6
Superfı́cies Diferenciáveis
Cap. 7
Aplicações diferenciáveis entre superfı́cies
Seja M ⊂ Rn uma superfı́cie de dimensão m e classe C k . Uma aplicação
f : M → Rs diz-se de classe C r (r ≤ k) quando, para toda parametrização ϕ : V0 → V , de classe C k em M , a composta f ◦ ϕ : V0 → Rs é
de classe C r no aberto V0 ⊂ Rm .
Se ϕ : V0 → V e ψ : W0 → W são parametrizações de classe C k
em M , com V ∩ W 6= ∅, então segue-se do Corolário 2 que f ◦ ϕ =
(f ◦ ψ) ◦ (ψ −1 ◦ ϕ) é de classe C r se, e somente se, f ◦ ψ o é. Daı́ resulta
que a definição acima dada é consistente.
Dada outra superfı́cie N ⊂ Rs , diremos que a aplicação f : M → N
é de classe C r quando, considerada como aplicação de M em Rs , f for
de classe C r conforme a definição. A fim de que tal ocorra é necessário
e suficiente que, para todo p ∈ M e toda parametrização ψ : W0 → W
em N , com q = f (p) ∈ W , exista uma parametrização ϕ : V0 → V , com
p ∈ V , f (V ) ⊂ M e ψ −1 ◦ f ◦ ϕ : V0 → W0 ⊂ Rm seja de classe C r .
Novamente, admitindo que M e N são de classe C k com k ≥ r, esta
definição independe das escolhas de ϕ e ψ.
Seja f : M → N de classe C 1 . A derivada de f no ponto p é a
transformação linear
f ′ (p) : Tp M → Tq N, q = f (p),
assim definida: todo vetor v ∈ Tp M é o vetor velocidade v = λ′ (0) de
um caminho λ : (−ε, ε) → V , com λ(0) = p. Então pomos f ′ (p) · v =
(f ◦ λ)′ (0).
v
w
λ
N
p
f
q
f ◦λ
M
w = f ′ (p) · v
Figura 7.5
Se ϕ : V0 → V ⊂ M é uma parametrização C 1 com ϕ(x0 ) = p então
v = ϕ′ (x0 ) · v0 , v0 ∈ Rm , e f ′ (p) · v = (f ◦ ϕ)′ (x0 ) · v0 . Isto mostra que
f ′ (p) é linear.
Seção 6
Aplicações diferenciáeis entre superfı́cies
143
Vale a Regra da Cadeia: se f : M → N e g : N → P são de classe C r
então g ◦ f : M → P é de classe C r , com (g ◦ f )′ (p) = g ′ (f (p)) · f ′ (p).
Diz-se que f : M → N é um difeomorfismo de classe C r quando f
possui uma inversa g : N → M que também é de classe C r . Neste caso,
para cada ponto p ∈ M , a derivada f ′ (p) : Tp M → Tq N , q = f (p), é
um isomorfismo, cujo inverso é g ′ (q) : Tq N → Tp M .
Se, para um certo p ∈ M , a derivada f ′ (p) : Tp M → Tq N é um
isomorfismo então resulta facilmente do Teorema da Aplicação Inversa
que f aplica difeomorficamente uma vizinhança aberta U de p em M
sobre uma vizinhança aberta V = f (U ) de q = f (p) em N .
Se f ′ (p) é um isomorfismo para todo p ∈ M , diz-se que f : M → N
é um difeomorfismo local. Então a aplicação f leva abertos de M em
abertos de N e, se for bijetiva, é um difeomorfismo entre M e N . A
função de Euler f : R → S 1 , definida por E(t) = (cost, sent), é um
difeomorfismo local. Sua restrição a qualquer intervalo aberto (a, a+2π)
de comprimento 2π é um difeomorfismo desse intervalo sobre S 1 − {p},
p = E(a).
Exemplo 17. O exemplo mais óbvio de uma aplicação diferenciável (de
classe C k ) f : M → Rs é a restrição a M de uma aplicação F : U → Rs
de classe C k num aberto U , com M ⊂ U ⊂ Rn .
Exemplo 18. Seja M ⊂ Rn+1 uma hiperfı́cie orientável de classe C k
(k ≥ 2). Se u : M → Rn+1 é um campo contı́nuo de vetores unitários
normais a M , então u é uma aplicação de classe C k−1 . (Vide Teorema 4.) Com efeito, para cada parametrização ϕ : V0 → V ⊂ M , de
∂ϕ
∂ϕ
classe C k , pondo v(ϕ(x)) =
(x) × · · · ×
(x), temos u(ϕ(x)) =
∂x1
∂xn
±v(ϕ(x))/|v(ϕ(x))| para cada x ∈ V0 pois u e v, sendo ambos ortogonais a Tϕ(x) M , são colineares. Se V0 (e portanto V ) for conexo, teremos
u = v/|v| ou u = −v/|v| em todos os pontos de V , logo u ∈ C k−1 .
Exemplo 19. Seja M = R2 − {0}. A aplicação f : M → R3 , definida
por f (z) = z |z|, log |z| , é um difeomorfismo C ∞ sobre o cilindro
S 1 × R ⊂ R3 . Seu inverso é g : S 1 × R → R2 − {0}, onde g(w, t) = et · w.
De modo análogo se tem um difeomorfismo C ∞ entre Rn+1 − {0} e
S n × R.
Exemplo 20. (Aplicação normal de Gauss.) Um campo contı́nuo de
vetores unitários normais numa hiperfı́cie orientável M ⊂ Rn+1 , de
classe C k (k ≥ 2) é uma aplicação de classe C k−1 , u : M → S n , chamada a aplicação normal de Gauss. Em cada ponto p ∈ M , tem-se
144
Superfı́cies Diferenciáveis
Cap. 7
Tp M = Tu(p) S n pois estes espaços vetoriais são o complemento ortogonal do vetor u(p) em Rn+1 . Portanto a derivada u′ (p) é um operador
linear em Tp M , o qual é auto-adjunto. Para provar isto, tomamos uma
parametrização ϕ : V0 → V ⊂ M , com ϕ(x) = p, consideramos a base
∂ϕ
∂ϕ
{ ∂x
(x)} ⊂ Tp M , e mostramos que
(x), . . . , ∂x
n
1
hu′ (p) ·
∂ϕ
∂ϕ
∂ϕ
∂ϕ
(x),
(x)i = h
(x), u′ (p) ·
(x)i, i, j = 1, . . . , n (*)
∂xi
∂xj
∂xi
∂xj
Com efeito, para todo x ∈ V0 e todo j = 1, . . . , n, vale a igualdade
hu(ϕ(x)),
∂ϕ
(x)i = 0.
∂xj
Derivando ambos os membros em relação a xi vem:
hu′ (p) ·
∂ϕ
∂2ϕ
∂ϕ
(x),
(x)i + hu(p),
(x)i = 0
∂xi
∂xj
∂xi ∂xj
(onde p = ϕ(x)). Trocando os papéis de i e j, resulta então do Teorema
de Schwarz que valem as igualdades (*) e u′ (p) é auto-adjunto. Os autovalores k1 , . . . , kn do operador u′ (p) chamam-se as curvaturas principais
da hiperfı́cie M no ponto p e o produto k1 · k2 · · · kn = det ·u′ (p) = K(p)
é chamado a curvatura gaussiana de M nesse ponto.
APÊNDICE
O volume de um paralelepı́pedo
Sejam v1 , . . . , vr vetores linearmente independentes em Rn . O paralelepı́pedo (r-dimensional) P = P (v1 , . . . , vr ) que tem esses vetores
r
P
ti vi , com 0 ≤
como arestas é o conjunto das combinações lineares
i=1
ti ≤ 1.
O volume r-dimensional do paralelepı́pedo P = P (v1 , . . . , vr ) é definido por indução sobre r. Se r = 1, pomos vol P (v1 ) = |v1 |. Supondo
definido o volume (r − 1)-dimensional, pomos
vol P (v1 , . . . , vr ) = |h| · vol P (v2 , . . . , vr ),
Seção 6
Aplicações diferenciáeis entre superfı́cies
145
onde h ∈ Rn é o vetor-altura de P , ou seja, h = v1 − pr.v1 , sendo
pr.v1 a projeção ortogonal de v1 sobre o subespaço E ⊂ Rn gerado por
v2 , . . . , vr .
O vetor-altura h é ortogonal a v2 , . . . , vr , a diferença v1 − h pertence
ao subespaço E que tem v2 , . . . , vr como base e estas duas propriedades
caracterizam h.
Provaremos, a seguir, que o volume do paralelepı́pedo P é a raiz
quadrada do determinante da matriz de Gram
g = g (v1 , . . . , vr ) = [hvi , vj i] ∈ M (r × r).
Começaremos observando que, se fixarmos arbitrariamente uma base
ortonormal no subespaço de Rn gerado por e1 , . . . , er e considerarmos
a matriz m ∈ M (r × r) cujas colunas são as coordenadas dos vetores
v1 , . . . , vr relativas a essa base, então tem-se
det[hvi , vj i] = (det m )2 .
Esta igualdade é imediata se notarmos que, segundo a definição de
produto de matrizes, tem-se g (v1 , . . . , vr ) = m ⊤ · m , onde m ⊤ é a transposta de m . Portanto det[hvi , vj i] = det g = det m ⊤ · det m = (det m )2 .
Daı́ resultam dois fatos. O primeiro é que det m não depende da
base ortonormal que foi arbitrariamente escolhida no subespaço gerado
por v1 , . . . , vr . O segundo é que det g (v1 , . . . , vr ) = det g (h, v2 . . . , vr )
pois h = v1 −pr.v1 e o determinante de m não se altera quando se subtrai
da coluna v1 uma combinação linear das demais colunas. Deste modo,
temos (por indução):
[vol P (v1 , . . . , vr )]2 = |h|2 · [vol P (v2 , . . . , vr )]2 =
= hh, hi · det g (v2 , . . . , vr ) = det g (h, v2 , . . . , vr ) =
= det g (v1 , . . . , vr ),
sendo a penúltima igualdade devida ao fato de que a primeira linha
e a primeira coluna da matriz g (h, v2 , . . . , vr ) têm hh, hi como único
elemento não-nulo.
Portanto, se v1 , . . . , vn ∈ Rn e indicamos com a notação [v1 , . . . , vn ]
a matriz n × n cujo j-ésimo vetor-coluna é vj então o volume do paralelepı́pedo cujas arestas são v1 , . . . , vn é igual a | det[v1 , . . . , vn ]|.
Além disso, o quadrado desse volume é igual ao determinante da
matriz de Gram g (v1 , . . . , vn ), cujo ij-ésimo elemento é hvi , vj i.
146
7
Superfı́cies Diferenciáveis
Cap. 7
Exercı́cios
Seção 2. Superfı́cies diferenciáveis
1. Prove que toda superfı́cie M ⊂ Rm+n de classe C k é localmente a imagem
inversa de um valor regular de uma aplicação f : U → Rn , de classe C k num
aberto U ⊂ Rm+n . Conclua que todo ponto p ∈ M pertence a um aberto V ⊂
M , imagem de uma parametrização ϕ : V0 → V , de classe C k , no qual estão
definidos n campos vetoriais v1 , . . . , vn : V → Rm+n tais que v1 ◦ ϕ, . . . , vn ◦ ϕ :
V0 → Rm+n são de classe C k−1 e, para cada q ∈ V , v1 (q), . . . , vn (q) são
linearmente independentes e ortogonais a Tq M .
2. Seja M ⊂ Rn de classe C k e dimensão m. Prove que o conjunto T M =
{(p, v) ∈ Rn ×Rn ; p ∈ M, v ∈ Tp M } é uma superfı́cie de classe C k−1 e dimensão
2m, chamada o fibrado tangente de M .
3. Com a notação do exercı́cio anterior, seja νM = {(p, v) ∈ Rn × Rn ; p ∈ M,
v ∈ Tp M ⊥ }. Prove que νM é uma superfı́cie de classe C k−1 e dimensão n,
chamada o fibrado normal de M em Rn .
4. Mostre que o conjunto M das matrizes 4 × 4 de posto 2 é uma superfı́cie C ∞
de dimensão 12 em R16 . Generalize para matrizes m × n de posto k.
Seção 3. O espaço vetorial tangente
1. Dada uma superfı́cie M ⊂Rn , de classe C k e dimensão m, considere um ponto
p∈M e duas parametrizações ϕ : V0 →V , ψ : W0 →W em M , com p∈V ∩W .
Seja [aij ] a matriz jacobiana, no ponto x0 = ϕ−1P
(p), do difeomorfismo ψ −1 ◦
m
∂ψ
∂ϕ
−1
−1
ϕ : ϕ (V ∩ W ) → ψ (V ∩ W ). Mostre que
i=1 aij ∂yi (y0 ) = ∂xj (x0 ),
onde ψ(y0 ) = p. [Noutras palavras: [aij ] é a matriz de passagem da base
∂ψ
∂ϕ
∂ψ
∂ϕ
{ ∂y
(y0 )} para a base { ∂x
(x0 )} em Tp M .]
(y0 ), . . . , ∂y
(x0 ), . . . , ∂x
m
m
1
1
2. Seja λ : [a, b] → M um caminho na superfı́cie M ⊂ Rn , com λ(a) = p.
Dada uma base ortonormal {u1 , . . . , um } ⊂ Tp M , prove que existem aplicações
contı́nuas v1 , . . . , vm : [a, b] → Rn tais que v1 (a) = u1 , . . . , vm (a) = um e, para
cada t ∈ [a, b], {v1 (t), . . . , vm (t)} é uma base ortonormal em Tλ(t) M .
3. Dado um caminho λ : [a, b] → M na superfı́cie M ⊂ Rm+n , seja {u1 , . . . , un } ⊂
Tp M ⊥ , com p = λ(a), uma base ortonormal do complemento ortogonal de Tp M
em Rm+n . Prove que existem v1 , . . . , vn : [a, b] → Rm+n contı́nuas, tais que,
para todo t ∈ [a, b], {v1 (t), . . . , vn (t)} é uma base ortonormal de [Tλ(t) M ]⊥ .
4. Use o Exercı́cio 2 e indução para provar que, dadas duas bases ortonormais
{u1 , . . . , un } e {w1 , . . . , wn } em Rn , se as matrizes n × n cujas colunas são
esses vetores têm determinantes de mesmo sinal, então existem n aplicações
contı́nuas v1 , . . . , vn : [0, 2] → Rn tais que vi (0) = ui , vi (2) = wi (i = 1, 2, . . . , n)
e, para cada t ∈ [0, 2], {v1 (t), . . . , vn (t)} ⊂ Rn é uma base ortonormal. Conclua
daı́ que o conjunto SO(Rn ) das matrizes ortogonais n × n com determinante
igual a 1 é conexo.
Seção 4. Superfı́cies orientáveis
1. Sejam ϕ : U0 → U , ψ : V0 → V , ξ : W0 → W parametrizações na superfı́cie M .
Suponha que M = U ∪ V ∪ W , que U ∩ V ∩ W 6= ∅ e que o determinante
Seção 7
Exercı́cios
147
jacobiano de cada uma das mudanças de coordenadas ψ −1 ◦ ϕ, ξ −1 ◦ ϕ e ξ −1 ◦ ψ
tem sinal constante. Prove que M é orientável.
2. Use o exercı́cio anterior para provar que o conjunto M das matrizes 3 × 3 de
posto 1 é uma superfı́cie orientável de dimensão 5 em R9 .
3. Prove que o fibrado tangente T M e o fibrado normal νM de qualquer superfı́cie
são sempre orientáveis. (V. Exercı́cios 2 e 3, Seção 2.)
4. Seja f : R3 → R4 definida por f (x, y, z) = (x2 − y 2 , xy, xz, yz). Prove que
P = f (S 2 ) é uma superfı́cie C ∞ de dimensão 2, compacta e não-orientável em
R4 . (P é conhecida como o plano projetivo.)
Seção 6. Aplicações diferenciáveis entre superfı́cies
1. Prove que o homeomorfismo h : S 1 × R → R2 − {0}, dado por h(z, t) = et · z,
é um difeomorfismo.
2. Use o difeomorfismo do exercı́cio anterior para provar que o toro n-dimensional
T = S 1 × · · · × S 1 = (S 1 )n é difeomorfo a uma hiperfı́cie em Rn+1 .
3. Seja f : M → N um difeomorfismo local. Se N é orientável, prove que M
também é.
2
2
4. Sejam G ⊂ Rm e H ⊂ Rn superfı́cies que são grupos em relação à multiplicação de matrizes. Se f : G → H é um homomorfismo diferenciável, prove
que o posto da derivada f ′ (x) : Tx G → Tf (x) H não depende do ponto x ∈ G.
8
Integrais Múltiplas
1
A definição de integral
Um bloco n-dimensional A ⊂ Rn é um produto cartesiano
A=
n
Y
[ai , bi ] = [a1 , b1 ] × · · · × [an , bn ]
i=1
de n intervalos compactos [ai , bi ], chamados suas arestas. O produto
n
Q
(ai , bi ) dos intervalos abertos (ai , bi ) chama-se bloco ncartesiano
i=1
dimensional aberto. Quando todas as arestas do bloco A têm o mesmo
comprimento a = bi −ai , diz-se que A é um cubo n-dimensional . Quando
n = 1, os blocos são simplesmente intervalos. Se n = 2, o bloco reduz-se
a um retângulo e o cubo a um quadrado.
n
Q
Q
Li
Uma face do bloco A = [ai , bi ] é um conjunto do tipo F =
i=1
onde, para cada i = 1, . . . , n, tem-se Li = {ai }, Li = {bi } ou Li = [ai , bi ].
Diz-se que a face F tem dimensão r quando exatamente r dos fatores
Li são iguais a [ai , bi ]. As faces de dimensão zero, isto é, os pontos da
forma v = (c1 , . . . , cn ), onde ci = ai ou ci = bi para cada i = 1, . . . , n,
são chamadas os vértices do bloco.
n
Q
[ai , bi ] é, por definição, o
O volume n-dimensional do bloco A =
produto
n
Q
i=1
i=1
(bi − ai ) dos comprimentos de suas arestas. Este é também
o volume do bloco aberto
n
Q
i=1
(ai , bi ).
Seção 1
A definição de integral
Uma partição do bloco A =
n
Q
149
[ai , bi ] é um produto cartesiano
i=1
P = P1 × · · · × Pn , onde cada Pi é uma partição do intervalo [ai , bi ]
(cfr. Vol. 1, Cap. 10, §2). Diz-se que a partição Q = Q1 × · · · × Qn
refina a partição P quando se tem P ⊂ Q. Isto equivale a dizer que
P1 ⊂ Q1 , . . . , Pn ⊂ Qn .
A partição P decompõe o bloco A numa reunião de sub-blocos
B = I1 × · · · × In , onde cada Ij é um intervalo da partição Pj de
[aj , bj ]. Estes sub-blocos B ⊂ A chamam-se os blocos da partição P .
Escreve-se então B ∈ P . Se a partição Q refina P então cada bloco de
P é a reunião dos blocos de Q nele contidos.
Se B, B ′ são blocos da partição P , a interseção B ∩ B ′ é uma face
comum a B e B ′ ou é vazia.
Dada a partição P = P1 × · · · × Pn do bloco A, como o comprimento
bi − ai de cada aresta de A é a soma dos comprimentos dos intervalos da
partição Pi , segue-se da propriedade distributiva da multiplicação que
o volume do bloco A é a soma dos volumes dos blocos B da partição P .
Logo, quando Q refina P , o volume de cada bloco de P é a soma dos
volumes dos blocos de Q nele contidos.
Se P = P1 × · · · × Pn e Q = Q1 × · · · × Qn são partições do bloco A,
existem partições de A que refinam ao mesmo tempo P e Q. Uma delas
n
Q
(Pi ∪ Qi ).
é R =
i=1
Seja f : A → R uma função real limitada no bloco n-dimensional A,
digamos com m ≤ f (x) ≤ M para todo x ∈ A. Dada uma partição P
do bloco A, para cada bloco B ∈ P , indiquemos com mB o ı́nfimo e
com MB o supremo dos valores f (x) quando x varia em B. Definimos
então a soma inferior s(f ; P ) e a soma superior S(f ; P ) da função f
relativamente à partição P pondo
X
X
s(f ; P ) =
mB · vol B e S(f ; P ) =
MB · vol B,
B∈P
B∈P
estas somas estendendo-se a todos os blocos B da partição P . Evidentemente mB ≤ MB para todo B ∈ P , logo s(f ; P ) ≤ S(f ; P ).
Mais do que isto é verdade: para quaisquer partições P e Q do bloco
A, tem-se s(f ; P ) ≤ S(f ; Q).
Para comprovar esta afirmação, observamos primeiro que se uma
partição P ′ refina a partição P então s(f ; P ) ≤ s(f ; P ′ ) e S(f ; P ′ ) ≤
S(f ; P ).
150
Integrais Múltiplas
Cap. 8
Com efeito, se o bloco B ′ da partição P ′ está contido no bloco B
da partição P então mB ≤ mB ′ . Lembrando que cada blocoPB ∈ P é
vol B ′ ,
a reunião dos blocos B ′ ∈ P ′ nele contidos, e que vol B =
B ′ ⊂B
segue-se que
s(f ; P ) =
X
mB · vol B =
B∈P
≤
X
B ′ ∈P ′
′
X
B∈P
X
B ′ ⊂B
mB · vol B
′
!
mB ′ · vol B = s(f ; P ′ ).
Analogamente se vê que S(f ; P ′ ) ≤ S(f ; P ) quando P ′ refina P . Assim,
quando se refina uma partição, a soma inferior não diminui e a soma
superior não aumenta.
Sejam P e Q duas partições quaisquer do bloco A. Tomemos uma
partição R de A que refine P e Q simultaneamente. Temos:
s(f ; P ) ≤ s(f ; R) ≤ S(f ; R) ≤ S(f ; Q),
mostrando portanto que s(f ; P ) ≤ S(f ; Q), ou seja, toda soma inferior
de f é menor do que ou igual a qualquer soma superior.
R
Definimos a seguir a integral inferior f (x)dx e a integral superior
R−
−A
A f (x)dx
Z
−A
da função limitada f : A → R, pondo
f (x)dx = sup s(f ; P )
e
P
Z−
f (x)dx = inf S(f ; P ),
A
P
o supremo e o ı́nfimo acima sendo tomados em relação a todas as partições
P do bloco A.
A desigualdade s(f ; P ) ≤ S(f ; Q) implica que
m · vol A ≤
Z
−A
f (x)dx ≤
se m ≤ f (x) ≤ M para todo x ∈ A.
Z−
A
f (x)dx ≤ M · vol A
Seção 1
A definição de integral
151
Diz-se que a função limitada f : A → R é integrável no bloco ndimensional A quando suas integrais inferior e superior coincidem. Escreve-se então
Z
A
f (x)dx =
Z
−A
f (x)dx =
Z−
f (x)dx
A
e este número é chamado a integral de f no bloco A.
No caso n = 1, o bloco n-dimensional A reduz-se a um segmento de
reta e a definição de integral acima dada coincide com aquela apresentada no Capı́tulo 10 do Volume 1.
Dada a função f : A → R, limitada no bloco A ⊂ Rn , o conjunto σ das somas inferiores e o conjunto Σ das somas superiores de
f relativamente às partições P de A são subconjuntos do intervalo
[m · vol A, M · vol A], onde m ≤ f (x) ≤ M para todo x ∈ A. Sabemos que, para quaisquer s ∈ σ e S ∈ Σ, tem-se s ≤ S. A fim de que seja
sup σ = inf Σ, isto é, que f seja integrável, é necessário e suficiente que,
dado arbitrariamente ε > 0, existam s ∈ σ e S ∈ Σ tais que S − s < ε.
Mais explicitamente: f é integrável se, e somente se, para todo ε > 0
dado, existem partições R e Q de A tais que S(f ; R) − s(f ; Q) < ε. Esta
condição pode ser aperfeiçoada assim:
Teorema 1 (Condição imediata de integrabilidade). A fim de
que a função limitada f : A → R seja integrável no bloco A ⊂ Rn é
necessário e suficiente que, para todo ε > 0 dado, exista uma partição
P de A tal que S(f ; P ) − s(f ; P ) < ε.
Demonstração. A suficiência é óbvia pois a condição acima claramente
assegura que sup σ = inf Σ. Quanto à necessidade, supondo f integrável,
ou seja, admitindo que sup σ = inf Σ, dado ε > 0, existem partições Q e
R do bloco A tais que S(f ; R) − s(f ; Q) < ε. Seja P uma partição de A
que refine Q e R ao mesmo tempo. Então s(f ; Q) ≤ s(f ; P ) ≤ S(f ; P ) ≤
S(f ; R), portanto S(f ; P ) − s(f ; P ) ≤ S(f ; R) − s(f ; Q) < ε.
Para todo subconjunto X ⊂ A, sejam MX o supremo e mX o ı́nfimo
dos valores f (x), com x ∈ X. Escreveremos ωX = MX − mX e chamaremos ωX de oscilação de f no conjunto X.
Às vezes, quando houver necessidade, usaremos a notação mais precisa ω(f ; X) = MX − mX em vez de ωX .
152
Integrais Múltiplas
Cap. 8
Para toda partição P do bloco A, temos
X
X
S(f ; P ) − s(f ; P ) =
(MB − mB ) vol B =
ωB · vol B.
B∈P
B∈P
Portanto f : A → R é integrável se, e somente se, para todo ε > 0
dado, existe uma partição P de A tal que
X
ωB · vol B < ε.
B∈P
Uma conseqüência imediata desta observação é que toda função
contı́nua f : A → R é integrável. Com efeito, sendo o bloco A um conjunto compacto, a função contı́nua f é uniformemente contı́nua. Portanto, dado qualquer ε > 0, existe δ > 0 tal que x, y ∈ A, |x − y| < δ ⇒
|f (x) − f (y)| < ε/ vol A.
Se tomarmos, em cada aresta [ai , bi ] do bloco A = Π[ai , bi ], uma
partição Pi cujos intervalos tenham todos comprimento < δ, e adotarmos
em Rn a norma do máximo, então todos os blocos da partição P =
P1 × · · · × Pn de A terão diâmetro menor do que δ. A função f sendo
contı́nua, em cada bloco B da partição P existem pontos a, b tais que
mB = f (a) e MB = f (b), pois B é compacto. Então ωB = MB − mB =
f (b) − f (a) < ε/ vol A e daı́
X
X
ε
ε
ωB · vol B <
·
vol B =
· vol A = ε.
vol A
vol A
B∈P
B∈P
Assim f é integrável.
O fato de que toda função contı́nua f : A → R é integrável é muito
importante mas não é suficiente para nossos propósitos. A fim de definir a integral de funções cujos domı́nios são mais gerais do que blocos,
precisamos integrar alguns tipos de funções descontı́nuas. Isto nos leva
ao critério de integrabilidade de Lebesgue, o qual se baseia na noção de
conjunto de medida nula, que abordaremos no parágrafo seguinte.
2
Conjuntos de medida nula
Diz-se que o conjunto X ⊂ Rn tem medida n-dimensional nula (segundo
Lebesgue), e escreve-se med.X = 0, quando, para todo ε > 0 dado, é
possı́vel obter uma cobertura enumerável X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por
∞
P
vol Bk < ε.
meio de blocos abertos Bk ⊂ Rn tais que
k=1
Seção 2
Conjuntos de medida nula
153
Evidentemente, se med.X = 0 e Y ⊂ X então med.Y = 0.
Teorema 2. Uma reunião enumerável de conjuntos de medida nula é
ainda um conjunto de medida nula.
Demonstração. Sejam X1 , . . . , Xk , . . . subconjuntos de Rn com
∞
S
Xk
med.Xk = 0 para todo k ∈ N. A fim de provar que X =
k=1
tem medida nula, seja dado ε > 0. Para cada k ∈ N podemos obter
∞
S
Bki e
uma seqüência de blocos Bk1 , Bk2 , . . . , Bki , . . . tais que Xk ⊂
∞
P
i=1
vol Bki <
ε/2k .
Então X está contido na reunião (enumerável) de
i=1
todos os Bki . Dado qualquer subconjunto finito F ⊂ N×N, existe j ∈ N
tal que (k, i) ∈ F ⇒ k ≤ j e i ≤ j. Logo
" j
#
j
j
X
X
X
X
ε/2k < ε.
vol Bki ≤
vol Bki <
(k,i)∈F
k=1
i=1
k=1
Portanto,Pseja qual for a maneira de enumerar os Bki numa seqüência,
vol Bki ≤ ε. Assim, med.X = 0.
teremos
k,i
Corolário 1. Todo conjunto enumerável tem medida nula.
Com efeito, todo conjunto enumerável é reunião dos seus pontos,
cada um dos quais tem medida nula.
A definição de med.X = 0, dada acima com blocos abertos, é conveniente quando se pretende usar o Teorema de Borel-Lebesgue. Noutras
ocasiões, pode ser mais adequado empregar blocos fechados. E ainda
em certos casos impõe-se o uso de cubos (abertos ou fechados). Essas
alternativas são equivalentes, conforme veremos agora.
Teorema 3. As seguintes afirmações a respeito de um conjunto X ⊂ Rn
são equivalentes:
(a) Para todo ε > 0 dado, pode-se obter uma cobertura enumerável
X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por meio de blocos abertos Bk ⊂ Rn tais
∞
P
vol Bk < ε.
que
k=1
(b) Vale a afirmação (a), com blocos fechados em vez de abertos.
(c) Vale a afirmação (a), com cubos abertos em vez de blocos.
(d) Vale a afirmação (a), com cubos fechados em vez de blocos abertos.
154
Integrais Múltiplas
Cap. 8
Demonstração. Mostremos, inicialmente, que (a) ⇔ (b). A implicação
(a) ⇒ (b) é imediata, pois X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . implica X ⊂ B 1 ∪
· · · ∪ B k ∪ . . . e vol B k = vol Bk , logo Σ vol Bk < ε ⇒ Σ vol B k <
ε. Quanto a (b) ⇒ (a): dado ε > 0, (b) nos autoriza a obter uma
cobertura X ⊂ D1 ∪ · · · ∪ Dk ∪ . . . por meio de blocos fechados Dk
n
Q
[aki , bki ]
com Σ vol Dk < ε/2. Ora, para cada k ∈ N, o bloco Dk =
está contido no bloco aberto Ak =
n
Q
i=1
i=1
(aki − δ, bki + δ) onde δ > 0 pode
ser escolhido de modo que vol Ak − vol Dk < ε/2k+1 . (Basta notar que
n
Q
(bki − aki + 2δ) é uma função contı́nua de δ, igual a vol Dk
vol Ak =
i=1
quando δ = 0.) Então X ⊂ A1 ∪ · · · ∪ Ak ∪ . . . , com
∞
X
k=1
vol Ak <
∞
X
k=1
vol Dk +
∞
X
k=1
ε
2k+1
<
ε ε
+ = ε.
2 2
A equivalência (c) ⇔ (d) se prova exatamente do mesmo modo, bastando observar que, no argumento acima, se Dk é um cubo então Ak
também é.
Resta portanto, provar que (a) ⇔ (c) ou, o que dá no mesmo, que
(b) ⇔ (d). Ora, é óbvio que (d) ⇒ (b). Para demonstrar a implicação
(b) ⇒ (d), começamos provando que, dados um bloco B e um número
δ > 0, existe um bloco C que é uma reunião finita de cubos, contém
B e, além disso, vol C − vol B < δ. Isto é imediato quando as arestas
do bloco B = Π[ai , bi ] têm medidas racionais bi − ai = pi /qi . Neste
caso, o próprio bloco B é uma reunião finita de cubos: basta considerar o mı́nimo múltiplo comum m dos denominadores qi e tomar em
mpi
cada aresta [ai , bi ] de B a partição Pi com
intervalos, todos de
qi
comprimento 1/m. Os blocos da partição P = P1 × · · · × Pn do bloco B
são cubos de arestas medindo 1/m e B é a reunião deles. No caso geral,
observamos que, para i = 1, . . . , m, existem números positivos ηi tão
pequenos quanto se queira, tais que bi − ai + ηi é racional. Então o bloco
n
Q
[ai , bi + ηi ] tem arestas com medidas racionais, logo é reunião
C =
i=1
finita de cubos. Além disso, C contém B e a diferença vol C − vol B =
Π(bi − ai + ηi ) − Π(bi − ai ) pode ser tornada tão pequena quanto se
deseje, desde que os ηi sejam suficientemente pequenos.
Para completar a prova de que (b) ⇒ (d), seja dado ε > 0. Por
Seção 2
Conjuntos de medida nula
155
(b), existe uma cobertura X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por blocos Bk tais
∞
P
vol Bk < ε/2. Como acabamos de ver, cada Bk está contido
que
k=1
numa reunião finita de cubos cuja soma dos volumes é menor do que
vol Bk + ε/2k+1 . Numerando consecutivamente esses cubos para k =
1, 2, . . . , chegamos a uma cobertura S ⊂ C1 ∪ · · · ∪ Cr ∪ . . . , onde os
cubos Cr são tais que
∞
X
vol Cr <
r=1
∞
X
vol Bk +
∞
X
k=1
k=1
ε
2k+1
<
ε ε
+ = ε.
2 2
Isto completa a demonstração do teorema.
Teorema 4. Seja f : X → Rn uma aplicação lipschitziana no conjunto
X ⊂ Rn . Se medX = 0 então medf (X) = 0.
Demonstração. Adotemos em Rn a norma do máximo. Seja
c > 0 tal que |f (x)−f (y)| ≤ c|x−y| para quaisquer x, y ∈ X. Dado arbitrariamente ε > 0, existe uma cobertura X ⊂ C1 ∪· · ·∪Ck ∪. . . onde cada
∞
∞
P
P
(ak )n < ε/cn .
vol Ck =
Ck é um cubo cuja aresta mede ak , com
k=1
k=1
Se x, y ∈ Ck ∩X então |x−y| ≤ ak , logo |f (x)−f (y)| ≤ c·ak . Isto significa que, para todo i = 1, . . . , n, as i-ésimas coordenadas de f (x) e f (y)
pertencem a um intervalo Ji de comprimento c · ak . Portanto f (Ck ∩ X)
n
Q
Ji = Ck′ , de aresta c·ak , logo vol Ck′ = cn ·(ak )n .
está contido no cubo
i=1
∞
S
Segue-se que f (X) =
k=1
∞
X
k=1
f (Ck ∩ X) ⊂ C1′ ∪ · · · ∪ Ck′ ∪ . . . , onde
vol Ck′ = cn ·
∞
X
k=1
(ak )n < cn ·
ε
= ε.
cn
Logo medf (X) = 0.
A aplicação mais freqüente do Teorema 4 ocorre quando f : U → Rn
é diferenciável, com derivada limitada no aberto convexo U ⊂ Rn . Se
|f ′ (x)| ≤ c para todo x ∈ U então a Desigualdade do Valor Médio nos
dá |f (x) − f (y)| ≤ c · |x − y| para quaisquer x, y ∈ U , logo f transforma
todo conjunto de medida nula X ⊂ U num conjunto de medida nula
f (X) ⊂ Rn . A fim de estender este resultado para funções de classe
C 1 em abertos não necessariamente convexos, com derivada limitada ou
não, será necessário usar o
156
Integrais Múltiplas
Cap. 8
Teorema 5 (Lindelöf ). Toda cobertura aberta X ⊂
S
Uλ de um
λ∈L
conjunto arbitrário X ⊂ Rn admite uma subcobertura enumerável X ⊂
Uλ1 ∪ · · · ∪ Uλk ∪ . . . .
Demonstração. Seja B o conjunto dos blocos abertos em Rn cujos
vértices têm coordenadas racionais e cada um deles está contido em
algum aberto Uλ da cobertura dada. O conjunto B é enumerável, logo
podemos escrever B = {B1 , B2 , . . . , Bk , . . . }. Para cada k ∈ N, esco∞
S
Uλk =
lhamos um ı́ndice λk ∈ L tal que Bk ⊂ Uλk . Afirmamos que
k=1
S
Uλ . Com efeito, se x ∈ Uλ então, como Uλ é aberto, existe uma
λ∈L
bola aberta de centro x, contida em Uλ . Se tomarmos em Rn a norma
do máximo, essa bola é um cubo, cuja aresta podemos supor racional,
logo é um Bk . Assim, x ∈ Bk ⊂ Uλk , portanto todo Uλ , λ ∈ L, está
∞
S
S
S
Uλ .
Uλk ⊂
Uλ ⊂
contido na reunião dos Uλk , k ∈ N, ou seja
Segue-se que X ⊂ Uλ1 ∪ · · · ∪ Uλk ∪ . . . .
λ∈L
k=1
λ∈L
Teorema 6. Seja f : U → Rn uma aplicação de classe C 1 no aberto
U ⊂ Rn . Se X ⊂ U tem medida nula então f (X) ⊂ Rn também tem
medida nula.
Demonstração. Para cada x ∈ X existe um aberto convexo Ux , com
x ∈ Ux ⊂ U , tal que f tem derivada limitada
S em Ux , logo f (X ∩Ux ) tem
medida nula. A cobertura aberta X ⊂
Ux admite uma subcobertura
x∈X
∞
S
Uk . Como f (X ∩ Uk ) tem medida nula para cada
∞
∞
S
S
f (X ∩ Uk ) tem
k ∈ N, segue-se que f (X) = f
(X ∩ Uk ) =
enumerável X ⊂
medida nula.
k=1
k=1
k=1
Corolário 2. Seja f : U → Rn uma aplicação de classe C 1 no aberto
U ⊂ Rm . Se m < n então f (U ) ⊂ Rn tem medida nula.
Com efeito, se considerarmos Rm como o conjunto dos pontos de
n
R cujas últimas n − m coordenadas são nulas, veremos que todo bloco
m-dimensional B ⊂ Rm ⊂ Rn tem volume n-dimensional nulo, pois podemos cobrir B com um único bloco n-dimensional D = B × [0, η]n−m ,
cujo volume n-dimensional pode ser tomado tão pequeno quanto se deseje. Daı́ resulta que Rm , visto como subconjunto de Rn , tem medida
n-dimensional nula, pois é reunião enumerável de blocos m-dimensionais.
Seção 2
Conjuntos de medida nula
157
Em particular, o conjunto U ⊂ Rm tem medida n-dimensional nula. Isto
posto, a partir da aplicação f : U → Rn , definamos F : U × Rn−m → Rn
pondo F (x, y) = f (x). O conjunto U × 0 ⊂ U × Rn−m tem medida
n-dimensional nula, logo med.F (U × 0) = 0, pelo Teorema 6. Mas
F (U × 0) = f (U ), o que prova o corolário.
Corolário 3. Seja M ⊂ Rn uma superfı́cie m-dimensional de classe
C 1 . Se m < n então M tem medida n-dimensional nula.
Com efeito, para todo x ∈ M existe um aberto Ux em Rn tal que
Vx = Ux ∩ M é uma vizinhança parametrizada de x,Slogo um conjunto
de medida nula em Rn . A cobertura aberta M ⊂
Ux admite, por
Lindelöf, uma subcobertura enumerável M ⊂
∞
S
x∈M
Uk , logo M =
k=1
∞
S
k=1
(Uk ∩
M ) é reunião enumerável de conjuntos Vk = Uk ∩ M , de medida nula.
Assim, med.M = 0.
O teorema seguinte, devido a H. Lebesgue, estabelece o critério geral
de integrabilidade em termos da noção de conjunto de medida nula. Em
sua demonstração, faremos uso do conceito de oscilação de uma função
num ponto, que introduziremos agora.
Seja f : X → R uma função limitada no conjunto X ⊂ Rn . Fixemos
x ∈ X e, para cada δ > 0, ponhamos Ω(δ) = ω(f ; X ∩ B(x; δ)) =
oscilação de f no conjunto dos pontos de X que distam menos de δ do
ponto x. Fica assim definida uma função não-negativa Ω : (0, +∞) → R,
a qual é limitada pois f também é. Além disso, Ω é não-decrescente.
Logo existe o limite
ω(f ; x) = lim Ω(δ) = lim ω(f ; X ∩ B(x; δ)) = inf ω(f ; X ∩ B(x; δ)),
δ→0
δ→0
δ>0
que chamaremos a oscilação da função f no ponto x.
Tem-se ω(f ; x) = 0 se, e somente se, f é contı́nua no ponto x. É
claro que se x ∈ int.Y e Y ⊂ X então ω(f ; x) ≤ ω(f ; Y ).
Teorema 7 (Lebesgue). A função f : A → R, limitada no bloco
A ⊂ Rn , é integrável se, e somente se, o conjunto Df dos seus pontos de descontinuidade tem medida nula.
Demonstração. Suponhamos inicialmente que med.Df = 0. Dado
′
arbitrariamente ε > 0, seja Df ⊂ C1′ ∪ · · · ∪ CP
k ∪ · · · uma cobertura
enumerável de Df por blocos abertos tais que
vol Ck′ < ε/2K, onde
K = M −m é a diferença entre o sup e o inf de f em A. Para cada ponto
158
Integrais Múltiplas
Cap. 8
x ∈ A − Df seja Cx′′ um bloco aberto contendo x, tal que a oscilação de
f no fecho de Cx′′ ∩ A seja inferior a ε/(2 · vol A). Sendo A compacto, a
cobertura aberta A ⊂ (∪Ck′ ) ∪ (∪Cx′′ ) admite uma subcobertura finita
A ⊂ C1′ ∪ · · · ∪ Cr′ ∪ C1′′ ∪ · · · ∪ Cs′′ .
Seja P uma partição de A tal que cada bloco aberto B ∈ P esteja contido
n
Q
[ai , bi ] então podemos tomar
num dos blocos Ck′ ou num Cj′′ . (Se A =
i=1
P = P1 × · · · × Pn onde, para cada i = 1, . . . , n, Pi é formada pelos
pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Ck′
ou Cj′′ que pertençam ao intervalo [ai , bi ].) Os blocos de P contidos em
algum Ck′ serão genericamente designados por B ′ e os demais blocos
de P (necessariamente contidos em algum Cj′′ ) serão chamados B ′′ . A
soma dos volumes dos B ′ é menor do que ε/2K e, em cada bloco B ′′ , a
oscilação de f não excede ε/(2 · vol A). Portanto
X
X
X
ωB ′′ · vol B ′′
ωB ′ · vol B ′ +
ωB · vol B =
B∈P
B′
X
B ′′
X
ε
vol B ′′
2 · vol A
ε
ε
<K·
+
· vol A = ε.
2·K
2 · vol A
≤K·
vol B ′ +
Segue-se que f é integrável.
Reciprocamente, suponhamos f integrável. Para cada k ∈ N, ponhamos Dk = {x ∈ A; ω(f ; x) ≥ 1/k}, logo Df = D1 ∪ · · · ∪ Dk ∪ · · · .
Para mostrar que Df tem medida nula, basta provar que med.Dk = 0
para cada k ∈ N. Seja, então, dado
P ε > 0. Como f é integrável, existe
uma partição P de A tal que
ωB · vol B < ε/k. Indiquemos geneB∈P
ricamente com B ′ os blocos da partição P que contêm algum ponto de
Dk em seu interior. Para cada um desses blocos B ′ , vale ωB ′ ≥ 1/k.
Portanto
X
X
ε
1X
ωB · vol B < ·
vol B ′ ≤
ωB ′ · vol B ′ ≤
k
k
B∈P
Multiplicando por k, obtemos Σ vol B ′ < ε. Ora, é claro que Dk ⊂
(∪B ′ ) ∪ X, onde X é a reunião das faces próprias dos blocos B ∈ P nos
quais há algum ponto de Dk . Sabemos que med.X = 0. Segue-se daı́
que med.Dk = 0. (Ver Observação a seguir.)
Seção 3
Cálculo com integrais
159
Observação: Seja Z ⊂ Rn um conjunto tal que, para todo ε > 0 dado,
existem blocos B1 , . . . , Bk , . . . e um conjunto X ⊂ Rn com
Z ⊂ (∪Bk ) ∪ X, Σvol Bk < ε e med. X = 0. Então med. Z = 0.
Com efeito, tomando blocos C1 , . . . , Ck , . . . com X ⊂ ∪Ck e
Σ med. Ck < ε, tem-se Z ⊂ (∪Bk ) ∪ (∪Ck ) onde Σ vol Bk +
Σ vol Ck < 2ε.
3
Cálculo com integrais
Teorema 8. Sejam f, g : A → R funções integráveis no bloco A ⊂ Rn e
c um número real. Então;
R
R
(1) fR + g : A → R é integrável e A [f (x) + g(x)]dx = A f (x)dx +
A g(x)dx.
R
R
(2) c · f : A → R é integrável e A c · f (x)dx = c · A f (x)dx.
(3) O produto f · g : A → R é uma função integrável.
(4) Se |g(x)| ≥ k > 0 para todo x ∈ A então f /g : A → R é integrável.
R
R
(5) Se f (x) ≤ g(x) para todo x ∈ A então A f (x)dx ≤ A g(x)dx.
R
R
(6) |f | : A → R é uma função integrável e | A f (x)dx| ≤ A |f (x)|dx.
(7) Se A′ Ré um bloco contido
em A e f (x) = 0 para todo x ∈ A − A′
R
então A f (x)dx = A′ f (x)dx.
Demonstração. A integrabilidade das funções f + g, c · f , f · g, f /g e
|f | resulta do Teorema 7, pois Df +g ⊂ Df ∪ Dg , Dc·f = Df (se c 6= 0),
Df ·g ⊂ Df ∪ Dg e D|f | ⊂ Df . Além disso, se |g(x)| ≥ k > 0 para
todo x ∈ A então f /g : A → R é limitada e, como Df /g ⊂ Df ∪ Dg ,
o quociente f /g é integrável. As demais afirmações do Teorema 8 se
provam exatamente como no caso de funções de uma única variável.
(Ver Capı́tulo 10 do Volume 1.)
O cálculo efetivo da integral de uma função f : A → R, definida num
bloco n-dimensional, se faz integrando f sucessivamente em relação a
cada uma das suas n variáveis. Basta aplicar diversas vezes o Teorema 9
abaixo, no qual adotamos as seguintes notações:
Dados os blocos A1 ⊂ Rm e A2 ⊂ Rn , os pontos do bloco A1 × A2 ⊂
m+n
R
escrevem-se como (x, y), com x ∈ A1 e y ∈ A2 . Se f : A1 ×A2 → R
160
Integrais Múltiplas
Cap. 8
é integrável, sua integral é indicada com
Z
f (x, y)dxdy. Para cada
A1 ×A2
x ∈ A1 , definiremos a função fx : A2 → R pondo fx (y) = f (x, y) para
todo y ∈ A2 , portanto fx é essencialmente a restrição de f ao bloco
n-dimensional x × A2 . Mesmo que f seja integrável, pode ocorrer que,
para alguns valores de x ∈ A1 , a função fx : A1 → R não o seja. Com
efeito, os pontos em que f é descontı́nua formam um conjunto D de
medida nula em Rm+n mas pode existir x ∈ A1 tal que D ∩ (x × A2 ) não
tenha medida n-dimensional nula.
Exemplo 1. Sejam A1 = A2 = [0, 1] e f : [0, 1] × [0, 1] → R dada por
f (x, y) = 0 se x 6= 1/2, f (1/2, y) = 0 se y é racional, f (1/2, y) = 1 se
y é irracional. O conjunto dos pontos de descontinuidade de f é Df =
1/2 × [0, 1], que tem medida nula em [0, 1] × [0, 1], logo f é integrável.
(De fato, sua integral é zero.) Mas f1/2 : [0, 1] → R é a função igual a
zero nos pontos racionais e igual a 1 nos irracionais, logo fx : [0, 1] → R
não é integrável quando x = 1/2.
⊳
Teorema 9 (Integração repetida). Seja f : A1 × A2 → R integrável
no produto dos blocos A1 ⊂ Rm e A2 ⊂ Rn . Para todo x ∈ A1 , seja
fx : A2 → R definida por fx (y) = f (x, y). Ponhamos
ϕ(x) =
Z
fx (y)dy
e
− A2
ψ(x) =
Z−
fx (y)dy.
A2
As funções ϕ, ψ : A1 → R, assim definidas, são integráveis, com
Z
Z
Z
ϕ(x)dx =
ψ(x)dx =
f (x, y)dxdy,
A1
A1
isto é:
Z
A1 ×A2
f (x, y)dxdy =
Z
A1
A1 ×A2


Z
Z


fx (y)dy  =
dx 
− A2
A1

dx 
−
Z
A2

fx (y)dy  .
Demonstração. As partições do bloco A1 × A2 são da forma P =
P1 × P2 , onde P1 e P2 são partições dos blocos A1 e A2 respectivamente.
Os blocos de P são os produtos B1 × B2 com B1 ∈ P1 e B2 ∈ P2 .
Mostraremos que
s(f ; P ) ≤ s(ϕ; P1 ) ≤ S(ϕ; P1 ) ≤ S(f ; P ).
Seção 3
Cálculo com integrais
Daı́ resultará que ϕ é integrável e que
Z
ϕ(x)dx =
A1
Z
161
f (x, y)dxdy.
A1 ×A2
Na verdade, basta provar a primeira das desigualdades acima, pois a
segunda é óbvia e a terceira
é análoga.
Também por analogia, não
Z
Z
precisamos provar que
ψ(x)dx =
f (x, y)dxdy.
A1
A1 ×A2
Começamos lembrando que se X ⊂ Y ⊂ R então inf .Y ≤ inf .X.
Segue-se que, para todo bloco B1 × B2 ∈ P , tem-se m(f ; B1 × B2 ) ≤
m(fx ; B2 ), seja qual for x ∈ B1 . Portanto
X
B2 ∈P2
m(f ; B1 ×B2 )·vol B2 ≤
X
B2 ∈P2
m(fx ; B2 )·vol B2 = s(fx ; P2 ) ≤ ϕ(x).
Como isto vale para todo x ∈ B1 , concluı́mos que:
X
B2 ∈P2
m(f ; B1 × B2 ) · vol B2 ≤ m(ϕ; B1 ).
Portanto
s(f ; P ) =
X
B1 ×B2 ∈P
=
X
B1 ∈P1
≤
X
B1 ∈P1


m(f ; B1 × B2 ) · vol B1 ·vol B2
X
B2 ∈P2

m(f ; B1 × B2 ) · vol B2  · vol B1
m(ϕ; B1 ) · vol B1 = s(ϕ; P1 ).
Corolário 4. Seja f : A1 × A2 × A3 → R integrável no produto dos
blocos A1 ⊂ Rm , A2 ⊂ Rn e A3 ⊂ Rp . Então
Z
f (x, y, z)dxdydz =
A1 ×A2 ×A3
Z
A1
=
Z
A1
dx
Z
f (x, y, z)dz
dy
Z−
dy
− A2
dx
Z
Z−
A2
− A3
f (x, y, z)dz.
A3
162
Integrais Múltiplas
Cap. 8
Com efeito,
Z
f (x, y, z)dxdydz =
A1 ×A2 ×A3
Z
A1 ×A2
=
Z
A1
=
Z
dxdy 

dx 
dx
A1

Z−
Z−
A2
dy
A2
Z−
A3

dy 
Z−

f (x, y, z)dz 
Z−
A3

f (x, y, z)dz 
f (x, y, z)dz.
A3
A seguir, vamos estender o conceito de integral para funções definidas
em certos subconjuntos X ⊂ Rn que não são necessariamente blocos ndimensionais.
4
Conjuntos J-mensuráveis
Dado o conjunto limitado X ⊂ Rn , seja A um bloco n-dimensional
contendo X. A função caracterı́stica de X é a função ξX : A → R,
definida por ξX (x) = 1 se x ∈ X e ξX (x) = 0 se x ∈
/ X.
Se X e Y são subconjuntos do bloco A, as seguintes propriedades da
função caracterı́stica são evidentes:
1. ξX∪Y = ξX + ξY − ξX∩Y ;
2. ξX∩Y = ξX · ξY ;
3. Tem-se X ⊂ Y se, e somente se, ξX ≤ ξY ; neste caso, vale ξY −X =
ξY − ξX .
Segue-se de 1. que ξX∪Y = ξX + ξY quando X e Y são disjuntos.
Se X estiver contido no interior de A (o que poderemos supor, sempre
que for conveniente) então fr .X é o conjunto dos pontos de descontinuidade da função ξX : A → R.
O volume interno e o volume externo do conjunto limitado X ⊂ Rn
são definidos, respectivamente, pondo:
vol . int .X =
Z
−A
ξX (x)dx
e
vol .ext.X =
Z−
ξX (x)dx.
A
Conjuntos J-mensuráveis
Seção 4
163
Quando a função caracterı́stica ξX : A → R é integrável, dizemos que
X é J-mensurável (mensurável segundo Jordan) e que seu volume ndimensional é
Z
ξX (x)dx.
vol X =
A
O item (7) do Teorema 8 assegura que os conceitos acima introduzidos não dependem da escolha do bloco A contendo X.
Se X ⊂ A e P é uma partição do bloco A, as somas inferior e superior
da função ξX : A → R relativas à partição P são
s(ξX ; P ) = soma dos volumes dos blocos de P contidos em X;
S(ξX ; P ) = soma dos volumes dos blocos de P que intersectam X.
Portanto, se escrevermos v = vol . int .X e V = vol .ext.X, veremos
que, para todo ε > 0 dado, existe uma partição P do bloco A (o qual
contém X) tal que a soma dos volumes dos blocos de P contidos em X
é superior a v − ε e a soma dos volumes dos blocos de P que intersectam
X é inferior a V + ε.
Teorema 10. (1) O conjunto limitado X ⊂ Rn é J-mensurável se, e
somente se, sua fronteira tem medida nula.
(2) Se X, Y ⊂ Rn são J-mensuráveis então X ∪ Y , X ∩ Y e X − Y
são J-mensuráveis, com
e
vol(X ∪ Y ) = vol X + vol Y − vol(X ∩ Y )
vol(X − Y ) = vol X − vol Y quando Y ⊂ X.
Demonstração. (1) Tomando um bloco n-dimensional A que contenha
X em seu interior e considerando a função caracterı́stica ξX : A → R,
temos as equivalências:
X é J-mensurável ⇔ ξX é integrável ⇔ med. DξX = 0 ⇔ med. fr X=0,
pois o conjunto DξX das descontinuidades de ξX coincide com a fronteira
de X.
(2) Basta observar que ξX∪Y = ξX +ξY −ξX∩Y e que, quando Y ⊂ X,
vale ainda ξX−Y = ξX − ξY .
Exemplo 2. Todo conjunto limitado X ⊂ Rn , cuja fronteira é uma superfı́cie, ou a reunião de um número finito (ou mesmo enumerável) de superfı́cies de dimensão n−1 é J-mensurável. Isto inclui uma bola fechada
164
Integrais Múltiplas
Cap. 8
e a região compreendida entre duas bolas fechadas concêntricas. Resulta
ainda do item (1) acima que um bloco n-dimensional é J-mensurável. ⊳
Exemplo 3. Seja X ⊂ R o conjunto formado pelo intervalo [0, 1] mais
os números racionais do intervalo [1, 2]. O “volume”externo é 2 mas
o interno é 1. Portanto X não é J-mensurável. Tomando o produto
cartesiano de n cópias de X, obtém-se um subconjunto limitado de Rn
que não é J-mensurável.
⊳
Exemplo 4. Se X ⊂ Rn é J-mensurável e int .X = ∅ então vol .X =
0 pois s(ξX ; P ) = 0 para toda partição P de um bloco que contenha X. Resulta daı́ que se X e Y são conjuntos J-mensuráveis sem
pontos interiores em comum então vol(X ∪ Y ) = vol X + vol Y , pois
vol(X ∩ Y ) = 0.
⊳
Z
f (x)dx de uma função limitada
Definiremos agora a integral
X
f : X → R, cujo domı́nio é um conjunto J-mensurável X ⊂ Rn . Para
isto, consideramos um bloco n-dimensional A contendo X em seu interior e a função
f¯: A → R,
definida por f¯(x) = f (x) se x ∈ X e f (x) = 0 se x ∈ A − X. Pomos
então, por definição
Z
Z
f (x)dx = f¯(x)dx
−X
−A
e
Z−
f (x)dx =
X
−
Z
f¯(x)dx.
A
Diremos que f : X → R é integrável quando tivermos
−
Z
Z
f (x)dx =
f (x)dx
−X
X
ou seja, quando f¯: A → R for integrável.
Se f¯: A → R é descontı́nua num ponto x ∈ A, ou f é descontı́nua no
ponto x ou x pertence à fronteira de X. Noutros termos, Df¯ ⊂ Df ∪fr .X.
Como fr .X tem medida nula e Df ⊂ Df¯, segue-se que f é integrável (ou
seja, f¯ é integrável) se, e somente se o conjunto Df dos seus pontos de
descontinuidade tem medida nula.
Z
f (x)dx as mesmas regras
Valem, evidentemente, para a integral
X
operatórias estabelecidas no Teorema 8 para o caso em que X é um
bloco retangular.
Seção 5
A integral como limite de somas de Riemann
165
Exemplo 5. É claro que um conjunto de volume zero tem medida
nula. Se o conjunto dado é J-mensurável, vale a recı́proca (em virtude
do Exemplo 4) pois medida nula implica interior vazio. A hipótese de
J-mensurabilidade não pode ser omitida pois o conjunto enumerável
Q∩[0, 1] tem medida nula mas seu “volume” externo é igual a 1 enquanto
o interno é igual a zero.
Observação: O item (1) do Teorema 10 pode ser tornado mais preciso:
a fronteira de um conjunto J-mensurável tem volume zero. Com efeito,
todo conjunto limitado tem fronteira compacta e vale o seguinte
Complemento ao Teorema 10. Se X ⊂ Rn é compacto e med.X = 0
então vol X = 0.
Demonstração: Seja dado ε > 0. Como são abertos os blocos que
ocorrem na definição de med.X = 0, segue-se do Teorema de BorelLebesgue que existem blocos abertos B1 , . . . , Bk tais que X ⊂ B1 ∪ · · · ∪
k
P
vol Bj < ε. Para cada i = 1, . . . , k, as i-ésimas coordenadas
Bk e
j=1
dos vértices desses blocos formam um conjunto Pi , cujo menor elemento
chamaremos de ai e, o maior, de bi . Cada Pi é, portanto, uma partição
do intervalo [ai , bi ] e o conjunto Pn = P1 × · · · × Pn é uma partição do
n
Q
[ai , bi ]. Temos X ⊂ A e o fecho B j de cada um dos blocos
bloco A =
i=1
iniciais é a reunião dos blocos B ′ ∈ P nele contidos. Segue-se daı́ que
se um bloco B ′ ∈ P contém algum ponto de X então B ′ está contido
num B j . Assim, a soma dos volumes dos blocos B ′ da partição P que
intersectam X é menor do que ou igual à soma dos volume dos Bj , logo
é menor do que ε. Portanto vol X = 0.
5
A integral como limite de somas de Riemann
Mostraremos agora (veja o Teorema 12) que a integral
Z
X
f (x)dx é
o número real cujos valores aproximados são as “somas de Riemann”
Σf (ξi ) vol Xi , obtidas quando se faz uma decomposição do tipo X =
X1 ∪ · · · ∪ Xk , onde os Xi são conjuntos J-mensuráveis, tais que o interior de cada Xi é disjunto dos demais Xj , tomando-se arbitrariamente
ξi ∈ Xi para cada i = 1, . . . , k. Esta é a forma mais comum, e a mais
intuitiva, de se pensar na integral. Passemos às definições precisas.
166
Integrais Múltiplas
Cap. 8
Seja X ⊂ Rn um conjunto J-mensurável. Diz-se que D = (X1 ,. . . ,Xk )
é uma decomposição de X quando os conjuntos X1 , . . . , Xk são J-mensuráveis, tais que o interior de cada Xi é disjunto dos demais Xj (isto é,
Xi ∩Xj ⊂ fr .Xi ∩fr .Xj quando i 6= j), com X = X1 ∪· · ·∪Xk . A norma
da decomposição D é o número |D| = max.diam.Xi = maior diâmetro
dos conjuntos X1 , . . . , Xk .
Por exemplo, se X ⊂ Rn é um bloco n-dimensional, toda partição
P determina uma decomposição X = B1 ∪ · · · ∪ Bk , onde os Bi são os
blocos da partição P .
Seja f : X → R uma função limitada no conjunto J-mensurável
X ⊂ Rn . Dada a decomposição D = (X1 , . . . , Xk ) de X escreveremos,
para cada i = 1, . . . , k, mi = inf .{f (x); x ∈ Xi } e Mi = sup .{f (x); x ∈
Xi }. Definiremos então a soma inferior s(f ; D) e a soma superior
S(f ; D) pondo
s(f ; D) =
k
X
i=1
mi · vol Xi
e
S(f ; D) =
k
X
i=1
Mi · vol Xi .
Diz-se que o número real J é o limite de S(f ; D) quando |D| tende
a zero, e escreve-se
J = lim S(f ; D)
|D|→0
para significar que, para todo ε > 0 dado, existe δ > 0 tal que |D| < δ ⇒
|J − S(f ; D)| < ε. Analogamente se define o significado da afirmação
I = lim s(f ; D).
|D|→0
Teorema 11. Para toda função f : X → R, limitada no conjunto
J-mensurável X ⊂ Rn , tem-se
Z
−X
f (x)dx = lim s(f ; D)
|D|→0
e
−
Z
X
f (x)dx = lim S(f ; D).
|D|→0
Na demonstração do Teorema 11 usaremos o lema abaixo, cujo enunciado contém a desigualdade d(Xi , Y ) < δ.
Se A e B são subconjuntos não-vazios de Rn , costuma-se escrever
d(A, B) = inf .{|x − y|; x ∈ A, y ∈ B}. Por conseguinte, a desigualdade
d(A, B) < δ significa que existem x ∈ A e y ∈ B com |x − y| < δ.
Seção 5
A integral como limite de somas de Riemann
167
Lema 1. Sejam Y ⊂ X ⊂ Rn J-mensuráveis, com vol Y = 0. Para
todo ε > 0 dado, existe δ > 0 tal que, se D é uma decomposição de X
com |D| < δ então a soma dos volumes dos conjuntos Xi ∈ D tais que
d(Xi , Y ) < δ é menor do que ε.
Demonstração. Dado ε > 0, podemos cobrir Y com uma coleção finita
de blocos B cuja soma dos volumes é < ε. Tomando arbitrariamente
δ > 0, ponhamos cada um desses blocos B = Π[ai , bi ] dentro do bloco
B ′ = Π[ai − 2δ, bi + 2δ]. Como lim vol B ′ = vol B, existe δ > 0 tal que a
δ→0
soma dos volumes dos blocos B ′ é ainda menor do que ε. Usando a norma
do máximo, podemos assegurar que se Z é um conjunto de diâmetro < δ
tal que d(Z, B) < δ então Z ⊂ B ′ . Portanto, se D = (X1 , . . . , Xk ) é
uma decomposição de X com |D| < δ, vemos que
d(Xi , Y ) < δ ⇒ d(Xi , B) < δ para algum B ⇒ Xi ⊂ B ′ .
Assim, a soma dos volumes dos conjuntos Xi ∈ D tais que d(Xi , Y ) < δ
não excede a soma dos volumes dos blocos B ′ , logo é menor do que ε.
Demonstração do Teorema 11. Basta provar a segunda afirmação.
Sem perda de generalidade, podemos admitir que 0 ≤ f (x) ≤ K para
todo x ∈ X. Com efeito, se somarmos uma constante c à função f , tanto
a integral superior como o limite acima serão aumentados de c · vol X.
Seja f¯: A → R a extensão de f a um bloco n-dimensional A ⊃ X, com
f¯(x) = 0 se x ∈ A − X. Dado ε > 0, queremos achar δ > 0 tal que
R−
|S(f ; D)− X f (x)dx| < ε para toda decomposição D de X com |D| < δ.
Ora, dado ε > 0, existe uma partição P0 de A tal que
S(f¯; P0 ) <
Z−
f (x)dx + ε/2.
X
Seja Y a reunião das faces próprias dos blocos de P0 . Como vol Y = 0, o
Lema 1 assegura a existência de δ > 0 tal que, para toda decomposição
D de X com |D| < δ, a soma dos volumes dos conjuntos Xi ∈ D com
d(Xi , Y ) < δ é menor do que ε/2K.
Seja então D uma decomposição de X com norma |D| < δ. Chamemos de Xα os conjuntos de D tais que d(Xα , Y ) < δ. Os demais conjuntos de D serão chamados de Xβ . Notemos que cada Xβ deve estar
contido em algum bloco da partição P0 pois, do contrário, existiriam
168
Integrais Múltiplas
Cap. 8
x, y ∈ Xβ em blocos distintos de P0 , logo o segmento de reta [x, y] conteria algum ponto de Y . Como |x − y| < δ, isto daria d(Xβ , Y ) < δ um absurdo. Escrevendo Mα = sup{f (x); x ∈ Xα } e Mβ = sup{f (x); x ∈ Xβ },
vem
X
X
S(f ; D) =
Mα · vol Xα +
Mβ · vol Xβ , onde
X
X
Mα · vol Xα ≤ K ·
vol Xα < ε/2 e


X
X
X
X

Mβ · vol Xβ =
Mβ · vol Xβ  ≤
MB · vol B
B∈P0
Xβ ⊂B
= S(f¯; P0 ) <
B∈P0
Z−
f (x)dx + ε/2.
X
Assim |D| < δ ⇒ S(f ; D) <
R−
X f (x)dx
R−
+ ε.
Mostraremos agora que S(f ; D) ≥ X f (x)dx para toda decomposição D de X. Com efeito, seja Z a reunião das fronteiras dos conjuntos Xi da decomposição D. Como vol Z = 0, o Lema nos dá δ ′ > 0
tal que, para toda partição P do bloco A com |P | < δ ′ , a soma dos volumes dos blocos de P que intersectam Z é menor do que ε/K. Tomando
|P | < δ ′ , temos
X
X
S(f¯; P ) =
MB · vol B +
MC · vol C,
onde chamamos de B os blocos de P que intersectam Z e de C os que
estão contidos no interior de algum Xi ∈ D. (Observe que, pelo Teorema
da Alfândega, um bloco que não esteja contido no interior de algum Xi
deve intersectar Z, pois todo bloco é conexo.) Ora, temos
X
X
MB · vol B ≤ K ·
vol B < ε e




X
X X
X
X

MC · vol C  ≤
vol C 
MC · vol C =
Mi 
i
≤
X
i
C⊂Xi
i
C⊂Xi
Mi · vol Xi = S(f ; D).
Vemos assim que, para toda decomposição D do conjunto X ⊂ A e
todo ε > 0, pode-se achar uma partição P de bloco A tal que S(f ; P ) ≤
Seção 5
A integral como limite de somas de Riemann
S(f ; D)+ε. Sendo
segue-se que
Z−
X
Z−
169
f (x)dx o ı́nfimo do conjunto das somas S(f ; P ),
X
f (x)dx ≤ S(f ; D) + ε.
Como ε > 0 é arbitrário, concluı́mos que
−
Z
X
f (x)dx ≤ S(f ; D) para
toda decomposição de X. Isto conclui a demonstração.
Corolário 5 (da demonstração). Para toda função limitada f : X →
R no conjunto J-mensurável X ⊂ Rn , tem-se
Z
−X
Z−
f (x)dx = sup s(f.D) e
D
f (x)dx = inf S(f ; D),
X
D
onde o inf e o sup acima se referem a todas as decomposições D de X.
Uma decomposição pontilhada do conjunto J-mensurável X ⊂ Rn é
um par D∗ = (D, ξ), onde D = (X1 , . . . , Xk ) é uma decomposição de X
e ξ = (ξ1 , . . . , ξk ), com ξ1 ∈ X1 , . . . , ξk ∈ Xk . Em termos menos formais,
pontilhar a decomposição D = (X1 , . . . , Xk ) é escolher um ponto ξi em
cada conjunto Xi , i = 1, . . . , k.
A toda partição pontilhada D∗ fica associada a soma de Riemann
Σ(f ; D∗ ), definida por
k
X
X
f (ξi ) · vol Xi .
(f ; D∗ ) =
i=1
Diz-se que o número I é o limite das somas de Riemann Σ(f ; D∗ )
quando a norma |D| tende a zero, e escreve-se
X
I = lim
(f ; D∗ ),
|D|→0
quando, para todo ε > 0 dado, pode-se obter δ > 0 tal que, para toda
decomposição D do conjunto X com norma |D| < δ tem-se |Σ(f ; D∗ ) −
I| < ε, seja qual for a maneira D∗ de se pontilhar D.
Teorema 12. Se f : X → R é integrável no conjunto J-mensurável
X ⊂ Rn então
Z
f (x)dx = lim Σ(f ; D∗ ).
X
|D|→0
170
Integrais Múltiplas
Cap. 8
Demonstração. Para toda decomposição D de X tem-se
X
s(f ; D) ≤
(f ; D∗ ) ≤ S(f ; D),
seja qual for o modo D∗ de pontilhar
D. Pelo Teorema 11, temos
Z
f (x)dx.
lim S(f ; D) = lim s(f ; D) =
|D|→0
|D|→0
X
Z
∗
f (x)dx.
Segue-se imediatamente que lim Σ(f ; D ) =
|D|→0
6
X
Exercı́cios
Seção 1. A definição de integral
1. Sejam f : A → R uma função limitada no bloco n-dimensional A e J um
número real com a seguinte propriedade: para todo ε > 0 dado, existe uma
partição P0 de A tal que |S(f ; P ) − J| < ε, qualquer que seja a partição P de
R−
f (x)dx. (Um resultado análogo vale para
A que refine P0 . Prove que J =
A
a integral inferior.)
2. Dada uma partição P0 do bloco A, prove que as integrais inferior e superior de
uma função limitada f : A → R podem ser calculadas considerando-se apenas
as partições de A que refinam P0 .
3. Sejam C ⊂ A blocos n-dimensionais. Se a função f : A → R é integrável, prove
que sua restrição fC = f |C é integrável no bloco C.
4. Se a função f : A → R é contı́nua em todos os pontos do bloco A que têm a
primeira coordenada diferente de um certo número c, prove que f é integrável.
Seção 2. Conjuntos de medida nula
1. Prove que o gráfico de uma função integrável f : A → R, definida num bloco
n-dimensional, tem medida nula em Rn+1 .
2. Prove que um bloco n-dimensional não tem medida n-dimensional nula. Daı́
todo conjunto de medida nula tem interior vazio.
3. Se X ⊂ Rp e v ∈ Rp , escreve-se X + v = {x + v; x ∈ X}. Dadas M, N ⊂ Rp ,
superfı́cies de classe C 1 tais que dim M + dim N < p, prove que é denso em Rp
o conjunto V dos vetores v tais que M + v e N são disjuntos. Se M e N são
compactas, além de denso, V é aberto em Rp .
4. Prove que toda função integrável f : A → R é a diferença entre duas funções
integráveis não-negativas.
Seção 3. Cálculo com integrais
1. Sejam A, B blocos n-dimensionais, com B contido no interior de A. Se f : A →
R é a funçãoR igual a 1 nos pontos de B e igual a 0 fora de B, prove que f é
integrável e A f (x)dx = vol ·B.
Seção 6
Exercı́cios
2. Seja a um número positivo menor do que 1/2, logo
∞
P
n=1
171
an = 1 − δ, com
0 < δ < 1. Retire do intervalo [0, 1] um intervalo aberto J1 , de comprimento
a e centro no ponto 1/2. Em seguida, com centros nos pontos médios dos
intervalos restantes, retire os intervalos abertos J2 e J3 , ambos de comprimento
a2 /2. Repetindo o processo n vezes, restam 2n intervalos fechados, dois a dois
disjuntos, de iguais comprimentos. A (n+1)-ésima etapa consiste em retirar do
centro de cada um deles um intervalo aberto de comprimento an+1 /2n . Seja
∞
S
Jk o que restou depois de efetuadas todas essas operações.
X = [0, 1] −
k=1
Prove que o conjunto X tem as seguintes propriedades: é compacto, tem interior vazio, não possui pontos isolados e, principalmente, não tem medida nula.
Ele é chamado um “conjunto de Cantor com medida positiva”.
3. Se a função f : A1 × A2 → R é integrável, prove que existe um conjunto de
medida nula X ⊂ A1 tal que fx : A2 → R é integrável para todo x ∈ A1 − X.
4. Se uma função integrável
R f : A → R é igual a zero salvo num conjunto de
medida nula, prove que A f (x)dx = 0.
Seção 4. Conjuntos J-mensuráveis
1. Prove que o volume de um bloco B, definido por meio de uma integral, coincide com aquele definido anteriormente como produto dos comprimentos das
arestas.
2. Justifique por que a bola B[a; r] é um conjunto J-mensurável.
3. Prove que o interior de um conjunto J-mensurável X ⊂ Rn também é
J-mensurável e vol ·X = vol(int ·X). Prove uma afirmação análoga para o
fecho X.
4. Seja f : A → R uma função limitada no bloco A ⊂ Rn , com f (x) ≥ 0 para
todo x ∈ A. Prove que se f é integrável então o conjunto
R C(f ) = {(x, y) ∈
Rn+1 ; x ∈ A, 0 ≤ y ≤ f (x)} é J-mensurável e vol C(f ) = A f (x)dx.
9
Mudança de Variáveis
Demonstraremos neste capı́tulo o importante Teorema da Mudança de
Variáveis em integrais múltiplas.
Começaremos estabelecendo as notações.
U e V são abertos do espaço euclidiano Rn ; h : U → V é um
difeomorfismo de classe C 1 .
X é um subconjunto compacto J-mensurável de U . A fronteira de
X, que tem medida nula, está contida em X (logo em U ) e sua imagem
por h, que é a fronteira do compacto h(X), tem medida nula (Teorema 6,
Capı́tulo 8). Portanto h(X) também é um conjunto J-mensurável.
Finalmente, f : h(X) → R é uma função integrável.
O Teorema da Mudança de Variáveis diz que a seguinte igualdade é
verdadeira:
Z
Z
f (h(x)) · | det h′ (x)|dx.
f (y)dy =
h(X)
X
Ela é análoga para n variáveis daquela estabelecida no Vol. 1. (Vide
Teorema 2, Capı́tulo 11.) Notam-se, porém, algumas diferenças.
A função que, no caso de uma só variável, desempenhava o papel
de h não precisava ser um difeomorfismo. Para n > 1, entretanto, pelo
menos injetividade de h (ou algo equivalente) se faz necessário, sem o
que a fórmula não vale. (O estudo dessas situações gerais leva à noção
de grau, que é analisada em detalhe no livro “Curso de Análise”, Vol. 2.)
Outra diferença é o valor absoluto em | det h′ (x)|. É natural que o
determinante substitua a derivada h′ (x) pois, quando n > 1, esta não
é um número; mas o valor absoluto que ocorre na fórmula acima não
Seção 1
O caso unidimensional
173
parece estar presente quando n = 1. Na verdade, porém, ele está oculto
na igualdade
Z b
Z h(b)
f (h(x)) · h′ (x)dx.
f (y)dy =
a
h(a)
De fato, se chamarmos de I o intervalo [a, b] e J = h(I) o intervalo
cujos extremos são h(a) e h(b), temos h(a) > h(b) quando h′ < 0, logo
a fórmula acima significa, em qualquer caso, que
Z
Z
f (y)dy = f (h(x)) · |h′ (x)|dx,
I
J
pois
Z
f (y)dy =
J
Z
h(b)
f (y)dy se h(a) < h(b), isto é, se h′ (x) > 0,
h(a)
e
Z
J
f (y)dy = −
Z
h(b)
f (y)dy se h(b) < h(a), isto é, se h′ (x) < 0.
h(a)
O Teorema de Mudança de Variáveis será provado por etapas.
1
O caso unidimensional
Dado o intervalo I = [a, b], escreveremos |I| = b − a.
Teorema 1. Sejam U, V ⊂ R abertos, h : U → V um difeomorfismo
C 1 , I ⊂ U um intervalo compacto, J = h(I) e f : J → R uma função
limitada. Então
−
Z
f (y)dy =
J
−
Z
I
f (h(x)) · |h′ (x)|dx.
Demonstração. Sem perda de generalidade, podemos admitir que
f (y) ≥ 0 para todo y ∈ J pois, se somarmos a mesma constante positiva
a f , o lado esquerdo sofrerá o acréscimo
de c · |J| enquanto o acréscimo
Z
sofrido pelo lado direito será de c ·
I
|h′ (x)|ds. Como h′ (x) não muda de
sinal para x ∈ I, o valor desta integral é c · |h(b) − h(a)| = c · |J| também.
Esta observação nos deixa livres para manipular desigualdades.
174
Mudança de Variáveis
Cap. 9
As partições de J = h(I) são do tipo h(P ), dadas por intervalos da
forma Jr = h(Ir ), onde os Ir (r = 1, . . . , k) são os intervalos de uma
partição P de I. Para cada r, ponhamos Mr = sup f (y) = sup f (h(x))
y∈Jr
e cr = sup |h′ (x)|. Evidentemente, |P | → 0 ⇔ |h(P )| → 0.
x∈Ir
x∈Ir
Pelo Teorema do Valor Médio, para cada r = 1, . . . , k existe ξr ∈ Ir
tal que |Jr | = |h′ (ξr )| · |Ir |. Pondo ηr = cr − |h′ (ξr )|, temos ηr ≥ 0 e,
em virtude da continuidade uniforme de h′ no intervalo I, lim ηr = 0.
k
P
Segue-se que lim
|P |→0 r=1
0≤
k
X
r=1
|P |→0
ηr |Ir | = 0 pois
ηr |Ir | ≤ (max ηr ) ·
r
k
X
r=1
|Ir | = (max ηr ) · |I|.
r
Então
S(f ; h(P )) =
k
X
r=1
Mr · |Jr | =
S((f ◦ h) · |h′ |; P ) =
k
X
r=1
k
X
r=1
Mr cr |Ir | −
k
X
r=1
Mr ηr |Ir |
e
Nr |Ir |,
onde Nr = sup (f (h(x)) · |h′ (x)|) ≤ Mr · cr
x∈Ir
pois se ϕ, φ : A → R são duas funções não-negativas limitadas quaisquer
então sup(ϕ(x) · ψ(x)) ≤ sup ϕ(x) · sup ψ(x). Logo, para toda partição
x∈A
P do intervalo I, vale:
x∈A
x∈A
S((f ◦ h) · |h′ |; P ) ≤ S(f ; h(P )) + M ·
k
X
r=1
ηr · |Ir |, onde M = sup f (y).
y∈J
Segue-se que
Z−
I
f (h(x)) · |h′ (x)| · dx = lim S((f ◦ h) · |h′ |; P )
|P |→0
≤ lim S(f ; h(P )) =
|P |→0
Z−
f (y)dy.
J
Seção 2
Difeomorfismos primitivos
A desigualdade oposta,
Z−
J
175
Z−
f (y)dy≤ f (h(x)) · |h′ (x)|dx, resulta da que
I
vem de ser provada, usando-se h−1 : J→I em vez de h, (f ◦ h) · |h′ | : I→R
em vez de f e levando em conta que, para todo y = h(x), x ∈ I, tem-se
(h−1 )′ (y) = 1/h′ (x).
Então concluı́mos que
−
Z
2
f (y)dy =
J
−
Z
I
f (h(x)) · |h′ (x)|dx.
Difeomorfismos primitivos
O próximo caso particular que consideraremos é aquele em que h é um
difeomorfismo primitivo.
Chamam-se primitivos os difeomorfismos h de um dos dois tipos
seguintes:
Tipo 1. São fixados os ı́ndices i, j, com 1 ≤ i < j ≤ n e h : Rn → Rn
é dado por
h(x) = h(x1 , . . . , xi , . . . , xj , . . . , xn ) = (x1 , · · · , xj , . . . , xi , . . . , xn ).
Tipo 2. Tem-se uma função ϕ : U → R, de classe C 1 , e para todo
x ∈ U vale
h(x) = (ϕ(x), x2 , . . . , xn ).
Teorema 2. Seja h : Rn → Rn um difeomorfismo primitivo do Tipo
1. Para todo conjunto J-mensurável X ⊂ Rn e toda função integrável
f : h(X) → R tem-se
Z
Z
f (h(x)) · | det h′ (x)| dx.
f (y)dy =
X
h(X)
Demonstração. O difeomorfismo h é um operador linear, com
det h′ (x) = −1 paraZ todo x ∈ Rn , Zlogo | det h′ (x)| = 1. Devemos, por-
f (h(x))dx. Ora, para todo bloco
f (y)dy =
tanto, mostrar que
h(X)
X
B ⊂ Rn , sua imagem h(B) é também um bloco, com arestas de mesmo
comprimento que as de B, logo vol h(B) = vol B. Como o volume de um
conjunto J-mensurável Z ⊂ Rn é o ı́nfimo dos números Σ vol Bi , onde
176
Mudança de Variáveis
Cap. 9
os Bi são blocos, com Z ⊂ B1 ∪ · · · ∪ Bk , segue-se que vol ·h(Z) = vol Z.
Toda decomposição h(X) = Y1 ∪ · · · ∪ Yk é tal que Yi = h(Xi ), onde
X = X1 ∪ · · · ∪ Xk é uma decomposição de X. Todo ponto de Yi é da
forma h(ξi ), com ξi ∈ Xi . Logo
Z
X
f (y)dy = lim
f (h(ξi )) · vol Yi
|D|→0
h(X)
Z
X
= lim
f (h(x))dx.
f (h(ξi )) · vol Xi =
|D|→0
X
Teorema 3. O Teorema de Mudança de Variáveis em Integrais Múltiplas é válido quando X ⊂ Rn é um bloco retangular e h : U → V é um
difeomorfsmo primitivo do Tipo 2.
Demonstração. Por conveniência, escreveremos os pontos de Rn sob
a forma x = (s, w), com s ∈ R e w ∈ Rn−1 , e consideraremos o bloco
X = I × A como produto cartesiano do intervalo I = [a, b] pelo bloco
A ⊂ Rn−1 . Note-se que, para todo w ∈ A fixado, a função ϕw : s 7→
ϕ(s, w) = t é um difeomorfismo do intervalo I sobre o intervalo Jw =
ϕw (I) = ϕ(I × w). Observemos ainda que a matriz jacobiana de h
tem a primeira linha igual ao gradiente de ϕ e, a partir da segunda
linha, coincide com a matriz identidade (n − 1) × (n − 1). Portanto
∂ϕ
(s, w) = ϕ′w (s). Seja J ⊂ R um intervalo compacto
det h′ (x) =
∂s
contendo Jw para todo w ∈ A. Então h(X) ⊂ J × A. Como de praxe,
f¯: J × A → R é a função integrável, igual a f nos pontos de h(X) e
igual a zero nos demais pontos de J ×A. Então o Teorema 1 nos permite
escrever:
Z
f (y)dy =
h(X)
Z
f (t, w)dt dw =
h(X)
=
Z
A
=
Z
A
=
Z




I×A
=
Z
X
−
Z
−
Z
J
I

Z
f¯(t, w)dt dw
J×A
f¯w (t)dt dw =
Z
A


−
Z

Jw
fw (ϕ(s, w))|ϕ′w (s)|ds dw
fw (t)dt dw
f (ϕ(s, w), w) · | det h′ (s, w)|ds dw
f (h(x)) · | det h′ (x)|dx.

Seção 3
3
Todo difeomorfismo C 1 é localmente admissı́vel
177
Todo difeomorfismo C 1 é localmente admissı́vel
Seja D o conjunto dos difeomorfismos de classe C 1 para os quais é válido
o Teorema de Mudança de Variáveis. Os elementos de D serão chamados
difeomorfismos admissı́veis.
Como sabemos, o objetivo deste capı́tulo é provar que todo difeomorfismo de classe C 1 é admissı́vel. Acabamos de ver que os difeomorfismos
primitivos pertencem a D. Além disso, como
det((h1 ◦ h2 )′ (x)) = det h′1 (h2 (x)) · det h′2 (x),
vê-se imediatamente que h1 ◦ h2 ∈ D quando h1 ∈ D e h2 ∈ D.
Por exemplo, todo difeomorfismo da forma
h(x) = (x1 , . . . , xj−1 , ϕ(x), xj+1 , . . . , xn )
é admissı́vel pois é composto de três difeomorfismos primitivos.
Nesta seção, provaremos que todo difeomorfismo de classe C 1 é localmente admissı́vel. Este é o conteúdo do teorema seguinte, o qual,
evidentemente, é um resultado provisório.
Teorema 4. Seja h : U → V um difeomorfismo de classe C 1 entre
abertos de Rn . Todo ponto de U possui uma vizinhança, restrita à qual
h é admisı́vel.
Demonstração. Basta provar que, dado x0 ∈ U , se h é definido numa
vizinhança de x0 e tem a forma
h(x) = (ϕ1 (x), . . . , ϕj (x), xj+1 , . . . , xn ),
com j > 1,
então existe um difeomorfismo k, de classe C 1 , composto de difeomorfismos primitivos, cuja imagem é uma vizinhança de x0 , tal que
h(k(w)) = (ψ1 (w), . . . , ψj−1 (w), wj . . . , wn ).
Ora, as j primeiras linhas da matriz jacobiana de h são os vetores
grad ϕ1 , . . . , grad ϕj e as demais linhas coincidem com as da matriz
identidade n × n. Compondo h, se necessário, com um difeomorfismo
∂ϕj
do Tipo 1, podemos admitir que
(x0 ) 6= 0. Pelo Teorema 5 do
∂xj
Capı́tulo 6 (aplicado à função ϕj ) existe um difeomorfismo admissı́vel
k : w 7→ (w1 , . . . , kj (w), wj+1 , . . . , wn )
178
Mudança de Variáveis
Cap. 9
cuja imagem é uma vizinhança de x0 tal que ϕj (k(w)) = wj para todo
w no domı́nio de k. Então
h(k(w)) = (ϕ1 (k(w)), . . . , ϕj−1 (k(w)), wj , . . . , wn ),
completando assim a demonstração.
4
Conclusão: todo difeomorfismo de classe C 1 é admissı́vel
Para terminar a demonstração do Teorema de Mudança de Variáveis, vamos usar um resultado topológico elementar que estabeleceremos agora.
S
Cλ uma cobertura do conjunto X ⊂ Rn . Diz-se que
Seja X ⊂
λ∈L
δ > 0 é um número de Lebesgue dessa cobertura quando todo subconjunto Y ⊂ X com diâmetro < δ está contido em algum Cλ .
S
Aλ de um conjunto comTeorema 5. Toda cobertura aberta X ⊂
pacto X ⊂ Rn possui número de Lebesgue.
λ∈L
Demonstração. Se supusermos, por absurdo, que nenhum δ > 0 é
número de Lebesgue da cobertura dada, obteremos, para cada k ∈ N,
um conjunto Yk ⊂ X, com diam Yk < 1/k mas nenhum Aλ contém Yk .
Escolhemos um ponto yk em cada Yk . Passando a uma subseqüência,
se necessário, a compacidade de X assegura a existência de a ∈ X tal
que lim yk = a. Existe λ0 tal que a ∈ Aλ0 . Existe ainda ε > 0 com
B(a; ε) ⊂ Aλ0 , pois Aλ0 é aberto. Tomemos k ∈ N tão grande que
1/k < ε/2 e |a − yk | < ε/2. Então, lembrando que diam Yk < 1/k, para
todo y ∈ Yk temos
|y − a| ≤ |y − yk | + |yk − a| <
1 ε
+ < ε.
k 2
Segue-se que Yk ⊂ B(a, ε) ⊂ Aλ0 , uma contradição.
Exemplo 1. Sejam A1 = {(x, y) ∈ R2 ; x > 0, y > 1/x} e A2 = {(x, y) ∈
R2 ; y < 0}. A cobertura aberta X = A1 ∪ A2 não possui número de
Lebesgue. Com efeito, dado qualquer δ > 0, seja p = (x, 0), com 0 <
δ
1
< . Então X ∩ B(p; δ/2) é um subconjunto de X com diâmetro < δ,
x
2
o qual não está contido em A1 nem A2 .
Seção 5
Exercı́cios
179
Teorema 6. Sejam X ⊂ Rn um conjunto compacto J-mensurável,
h : U → V um difeomorfismo de classe C 1 entre abertos U, V ⊂ Rn e
f : h(X) → R uma função integrável. Então
Z
Z
f (h(x)) · | det h′ (x)|dx.
f (y)dy =
X
h(X)
Demonstração. Existe uma cobertura aberta X ⊂
S
x∈X
Wx ⊂ U tal que
a restrição de h a cada Wx é um difeomorfismo admissı́vel. Seja δ > 0 um
número de Lebesgue dessa cobertura. Tomamos uma decomposição D =
(X1 , . . . , Xk ) de X tal que cada conjunto Xi tenha diâmetro inferior a δ.
(Para obter D, basta tomar uma partição P de um bloco A contendo X
de modo que os blocos Bi de P tenham arestas < δ na norma do máximo,
√
ou δ/ n na norma euclidiana. Em seguida, ponha Xi = Bi ∩ X.) Então
Z
XZ
XZ
f (y)dy =
f (y)dy =
f (h(x)) · | det h′ (x)|dx
h(X)
=
Zi
X
h(Xi )
i
Xi
f (h(x)) · | det h′ (x)|dx.
Corolário 1. Seja T : Rn → Rn um operador linear. Para todo conjunto
compacto J-mensurável X ⊂ Rn tem-se vol T (X) = | det T | · vol X.
Basta aplicar o Teorema 6 à função caracterı́stica ξX em lugar de f ,
observando que é suficiente considerar o caso em que T é invertı́vel.
5
Exercı́cios
1. Seja f : U → Rm de classe C 1 no aberto U ⊂ Rm . Se, no ponto a ∈ U , a
derivada f ′ (a) : Rm → Rm é um isomorfismo, prove que
lim
r→0
vol ·f (B(a; r))
= | det ·f ′ (a)|.
vol ·B(a; r)
2. Sejam M ⊂ Rn+1 uma hiperfı́cie orientável, ϕ : V0 → V uma parametrização
compatı́vel com a orientação de M e X ⊂ V um compacto tal que X0 =
ϕ−1 (X) ⊂ V0 é J-mensurável. Seja ainda v : M → Rn+1 um campo de vetores
180
Integrais Múltiplas
Cap. 9
(não necessariamente tangentes ou normais a M ). O fluxo de v através do
conjunto X é, por definição, dado pela integral
Z
f (v, X) =
hv(ϕ(x)), w(ϕ(x))idx
X0
∂ϕ
∂ϕ
(x) × · · · ×
(x) (produto vetorial) para todo x ∈ V0 .
∂x1
∂xn
Prove que f (v, X) não depende da parametrização ϕ.
onde w(ϕ(x)) =
10
Soluções dos exercı́cios
Cada uma das nove seções deste capı́tulo tem o mesmo tı́tulo de um dos nove capı́tulos
anteriores e contém soluções para exercı́cios propostos naquele capı́tulo. Em cada uma
delas, a notação p·q significa o q-ésimo exercı́cio da seção p do capı́tulo correspondente.
1
Topologia do Espaço Euclidiano
1.1. Se |u+v| = |u|+|v| então |u+v|2 = (|u|+|v|)2 , ou seja, |u|2 +2hu, vi+|v|2 =
|u| + 2|u| |v| + |v|2 , logo hu, vi = |u| |v| e daı́ v = α · u, com α ≥ 0.
1.2. Podemos supor que um dos vetores u = x − y e v = y − z, digamos v, é
diferente de zero. Então, de |u + v| = |x − z| = |x − y| + |y − z| = |u| + |v| segue-se
que v = αu, com α ≥ 0. Logo y − z = αx − αy e daı́ (1 + α)y = z + αx, ou seja
y = (1 − t)x + tz, com t = α/(1 + α); portanto 0 ≤ t ≤ 1.
hx, yi
1.3. Seja z =
· x. Como hy − z, xi = 0, segue-se que hy − z, yi = 0, o que
|x|2
nos dá |y|2 = hz, yi e daı́ |x|2 |y|2 = hx, yi2 , logo x e y são colineares.
1.4. Um cálculo imediato mostra que, como |x| = |y|, vale hz, xi = hz, yi, portanto hz, y − xi = 0.
2
2.1. Devemos ter c = a + t(b − a), onde t é tal que hc, bi = hc, ai. Isto nos dá
ha, b − ai
. O Teorema de Pitágoras assegura que |c| < |x| para todo x 6= c na
|b − a|2
reta ab.
2.2. Vale |(1 − t)x + ty| < (1 − t)r + tr = r se 0 < t < 1 em virtude de 1.1.
2.3. Dados a, b ∈ B(X; r), existem A, B ∈ X tais que |a − A| < r e |b − B| < r.
Então, para todo t ∈ [0, 1], tem-se (1 − t)A + tB = C ∈ X e |(1 − t)a + tb − C| ≤
(1 − t)|a − A| + t|b − B| < (1 − t)r + tr = r, logo (1 − t)a + tb ∈ B(X; r).
2.4. Isto pode ser provado usando o fato de que a função y = x2 é convexa
(cfr. vol. 1, pag. 108) ou, diretamente, assim: dados (a, m) e (b, n) em X, para
mostrar que ((1 − t)a + tb, (1 − t)m + tn) ∈ X, basta provar que (1 − t)2 a2 + t2 b2 +
2t(1−t)ab ≤ (1−t)a2 +tb2 pois a2 ≤ m e b2 ≤ n. Levando em conta que 1−t−(1−t)2 =
t=−
182
Soluções dos exercı́cios
Cap. 10
t(1 − t), isto equivale a provar que 2t(1 − t)ab ≤ t(1 − t)(a2 + b2 ), o que é claro pois
a2 + b2 ≥ 2ab.
2.5. Se |T · v| = a > 0 então |T · nv| = n · a logo T não é limitada. Seja
c = max{|T e1 |, . . . , |T em |}. Se o conjunto X ⊂ Rm é limitado então existe k > 0 tal
m
P
P
que, para todo x = (x1 , . . . , xm ) ∈ X, tem-se
|xi | ≤ k, logo |T · x| = | xi · T ei | ≤
i=1
P
P
|xi | |T ei | ≤ c · |xi | ≤ c · k.
3.1. Se x ∈ int ·X então existe r > 0 com B(x; r) ⊂ X. Para todo y ∈ B(x; r),
o argumento do texto mostra que, pondo s = r − |y − x|, tem-se B(y; s) ⊂ B(x; r),
donde B(y; s) ⊂ X e daı́ y ∈ int .X. Portanto x ∈ int .X ⇒ x ∈ int . int .X, ou seja,
int .X ⊂ int . int .X. A inclusão contrária é óbvia.
3.2. Se A é um aberto contido em X então todo ponto x ∈ A é centro de uma
bola contida em A, logo contida em X. Assim A ⊂ int .X.
3.3. A fronteira do conjunto Qn , formado pelos pontos de Rn cujas coordenadas
são números racionais, é todo o Rn . Se X ⊂ Rn é aberto então X ∩ fr .X = ∅.
Qualquer bola com centro num ponto x ∈ fr .X contém pontos de X portanto pontos
fora de fr .X. Assim nenhum ponto x ∈ fr .X é um ponto interior.
3.4. Basta observar que todo aberto A ⊂ Rn é a reunião das bolas abertas nele
contidas e que a projeção de uma bola aberta é um intervalo aberto (fato que fica
mais evidente quando se usa em Rn a norma do máximo).
3.5. Tome em cada aberto A dessa coleção um ponto pertencente ao conjunto
não-vazio A ∩ Qn . Como Qn é enumerável o mesmo ocorre com o conjunto dos pontos
escolhidos, a cada um dos quais corresponde um único aberto da coleção pois estes
são disjuntos.
4.1. Para todo ε > 0 dado, existem k1 , k2 ∈ N tais que k > k1 , k ∈ N′ implicam
|xk − a| < ε e k > k2 , k ∈ N′′ ⇒ |xk − a| < ε. Seja k0 = max{k1 , k2 }. Como
N = N′ ∪ N′′ , segue-se que k > k0 ⇒ |xk − a| < ε. Logo lim xk = a.
4.2. Se existissem um subconjunto infinito N′ ⊂ N e um ponto a ∈ Rn tais
que lim′ xk = a então existiria k1 ∈ N tal que k ∈ N′ , k > k1 ⇒ |xk − a| < 1 ⇒
n∈N
|xk | < |a| + 1. Ao mesmo tempo, se for lim |xk | = +∞, existirá k2 ∈ N tal que
k > k2 ⇒ |xk | > |a| + 1. Tomando k0 = max{k1 , k2 }, para todo k > k0 terı́amos
|xk | < |a| + 1 e |xk | > |a| + 1, um absurdo. Logo (a) ⇒ (b). Em seguida, se o
conjunto NX do item (c) fosse infinito então os termos xk com k ∈ NX formariam
uma seqüência limitada, a qual possuiria uma subseqüência convergente. Logo (b) ⇒
(c). Finalmente, admitindo (c), para todo A > 0 o conjunto dos ı́ndices k ∈ N tais
que |xk | ≤ A possui um elemento máximo k0 logo k > k0 ⇒ |xk | > A, o que prova a
implicação (c) ⇒ (a).
4.3. Tome B(a; ε) ⊂ A.
4.4. Como a ∈ X ∩ (Rn − X), para todo k ∈ N existem xk ∈ X e yk ∈ Rn − X
tais que |xk − a| < 1/k e |yk − a| < 1/k, logo lim xk = lim yk = a. A recı́proca é
óbvia.
5.1 De X ⊂ X e Y ⊂ Y , segue-se que X ∪ Y ⊂ X ∪ Y . Como X ∪ Y é fechado,
resulta daı́ que X ∪ Y ⊂ X ∪ Y . Por outro lado, de X ⊂ X ∪ Y e Y ⊂ X ∪ Y segue-se
que X ⊂ X ∪ Y e Y ⊂ X ∪ Y , logo X ∪ Y ⊂ X ∪ Y . Analogamente, X ⊂ X e Y ⊂ Y
implicam X ∩ Y ⊂ X ∩ Y logo X ∩ Y ⊂ X ∩ Y porque X ∩ Y é fechado. Tomando
X = (a, b) e Y = (b, c) temos X ∩ Y = ∅ e X ∩ Y = {b}.
Seção 1
Topologia do Espaço Euclidiano
183
5.2. Para todo k ∈ N, sejam Xk = {xr ; r ≥ k} e F o conjunto dos valores de
aderência
T de (xk ). Segue-se da definição que a ∈ F ⇔ a ∈ X k para todo k ∈ N. Logo
F =
X k .̇ portanto F é fechado.
k∈N
5.3. Se A é aberto e a ∈ A ∩ X então a = lim xk , xk ∈ X. Para todo k
suficientemente grande, tem-se xk ∈ A, isto é, xk ∈ A ∩ X, portanto a ∈ A ∩ X.
Para a recı́proca, se A não fosse aberto, existiria um ponto a ∈ A não-interior, logo
a ∈ A ∩ X, onde X = Rn − A. Mas, neste caso, A ∩ X = ∅, logo não se teria
A ∩ X ⊂ A ∩ X.
5.4. Escrevendo os pontos de Rm+n sob a forma (x, y), com x ∈ Rm e y ∈ Rn , a
igualdade X × Y = X × Y resulta do fato de que (a, b) = lim(xk , yk ) ⇔ a = lim xk e
b = lim yk .
5.5. As duas afirmações decorrem do seguinte: para todo conjunto X ⊂ Rn ,
tem-se a reunião disjunta Rn = int .X ∪ fr .X ∪ int .(Rn − X), sendo X fechado se, e
somente se, Rn − X é aberto.
5.6. Se d(A, B) = 0 então existem seqüências de pontos xk ∈ A e yk ∈ B
tais que lim |xk − yk | = 0. Passando a uma subseqüência, se necessário, podemos
admitir que existe a = lim xk , pois A é limitado. Então vale também lim yk = a, logo
a ∈ A ∩ B. Como A e B são disjuntos não se pode ter a ∈ int .A nem a ∈ int .B.
Logo a ∈ fr .A ∩ fr .B.
5.7. Seja C ⊂ Rn convexo. Se a, b ∈ C e 0 ≤ t ≤ 1 então a = lim ak e b = lim bk
com ak , bk ∈ C logo (1 − t)ak + tbk ∈ C. Daı́ (1 − t)a + tb = lim[(1 − t)ak + tbk ] ∈ C,
portanto C é convexo.
5.8. Sabemos que existe x̄ ∈ C tal que d(x, C) = |x − x̄|. Se existisse outro ponto
ȳ ∈ C com |x − x̄| = |y − ȳ| então, pelo Exercı́cio 2.2 terı́amos |x − z| < |x − x̄| para
todo ponto z ∈ [x̄, ȳ] ⊂ C e então não seria |x − x̄| = d(x, C).
6.1. O supremo de um conjunto de números reais pertence ao fecho desse
conjunto. Logo diam .K = lim |xk − yk | com xk , yk ∈ K. Passando a uma subseqüência, se necessário, temos lim′ xk = a ∈ K. Analogamente, existe N′′ ⊂ N′ com
k∈N
lim′′ yk = b ∈ K. Então |a − b| = lim′′ |xk − yk | = diam .K.
k∈N
k∈N
6.2. Se X não fosse limitado então, para todo k ∈ N, X não estaria contido na
bola Bk = B(0; k). Então a cobertura aberta X ⊂ ∪Bk não admitiria subcobertura
finita. Portanto X é limitado. Se X não fosse fechado, existiria uma seqüência de
pontos xk ∈ X com lim xk = a ∈
/ X. Então os abertos Ak = Rn −B[a; 1/k] formariam
n
uma cobertura de R − {a}, portanto de X, sem subcobertura finita.
6.3. Seja a um valor de aderência de (xk ). Se não fosse a = lim xk , existiriam
ε > 0 e uma infinidade de ı́ndices k tais que |xk − a| ≥ ε. Passando a uma subseqüência, se necessário, terı́amos lim′ xk = b, com |b − a| ≥ ε, logo b 6= a seria outro
k∈N
valor de aderência. Quanto ao exemplo, basta tomar xk = 0 para k ı́mpar e xk = k ·e1
se k é par.
6.4. Como o compacto K e o fechado Rn − U são disjuntos, existem a ∈ K,
b ∈ Rn − U tais que x ∈ K, y ∈ Rn − U ⇒ |x − y| ≥ |a − b| = ε > 0. Portanto, para
todo x ∈ K, tem-se B(x; ε) ⊂ U . Se x ∈ K e |y − x| < ε então [x, y] ⊂ B(x, ε) logo
[x, y] ⊂ U .
6.5. Se a = lim xk com xk ∈ X para todo k ∈ N então o conjunto K, formado
pelos pontos xk mais o ponto a, é compacto, logo X ∩K é fechado, portanto a ∈ X ∩K.
184
Soluções dos exercı́cios
Cap. 10
Em particular, a ∈ X. Portanto X é fechado.
7.1. Se (f (xk )) possuisse uma subseqüência convergindo para o ponto b, desprezando os termos a ela não pertencentes, o conjunto K = {f (xk ); k ∈ N} ∪ {b}
seria compacto logo f −1 (K) seria um compacto contendo todos os xk e então (xk )
possuiria uma subseqüência convergente. Portanto (a) ⇒ (b). Reciprocamente, supondo (b), sejam K ⊂ Rn compacto e (xk ) uma seqüência em f −1 (K). Então a
seqüência (f (xk )), contida no compacto K, possui uma subseqüência convergente,
com lim′ f (xk ) = b ∈ K. Pela hipótese (b), (xk )k∈N′ tem uma subseqüência converk∈N
gente, com lim′′ xk = a. Pela continuidade de f , tem-se f (a) = b, logo a ∈ f −1 (K).
k∈N
Assim f −1 (K) é compacto.
7.2. Podemos escrever, para todo z 6= 0 em R2 :
p(z) = z n
a
0
zn
+
a1
z n−1
+ ··· +
an−1
+ an .
z
Daı́ resulta que |zk | → +∞ ⇒ |p(zk )| → +∞.
7.3. Para cada x ∈ X, seja ξ(x) ∈ K o único ponto tal que f (x, ξ(x)) = 0.
Se lim xk = x0 em X, admitamos que a = lim′ ξ(xk ) e b = lim′′ ξ(xk ) sejam vak∈N
k∈N
lores de aderência da seqüência (ξ(xk )). Pela continuidade de f tem-se f (x0 , a) =
lim′ f (xk , ξ(xk )) = 0 e, analogamente, f (x0 , b) = 0. Logo a = b. A seqüência
k∈N
de pontos ξ(xk ) no compacto K tem portanto um único valor de aderência, logo
converge para o ponto c = lim ξ(xk ) ∈ K, com f (x0 , c) = lim f (xk , ξ(xk )) = 0. Assim
c = ξ(x0 ) e ξ é contı́nua.
7.4. Para toda seqüência de pontos xk = π(xk , yk ) ∈ π(F ) com lim xk = a, de
(xk , yk ) ∈ F segue-se que yk ∈ K. Passando a uma subseqüência: lim′ yk = b, logo
k∈N
lim′ (xk , yk ) = (a, b) ∈ F , pois F é fechado. Então a = π(a, b) ∈ π(F ), portanto π(F )
k∈N
é fechado.
8.1. Com efeito, se d(F, G) = 0 então existem seqüências de pontos xk ∈ F e
yk ∈ G tais que |xk − yk | < 1/k, logo lim |xk − yk | = 0 mas, como f (xk ) = 0 e
f (yk ) = 1, tem-se |f (xk ) − f (yk )| = 1 e assim f não é uniformemente contı́nua.
8.2. Dado ε > 0, existe δ > 0 tal que y, y ′ ∈ Y , |y−y ′ | < δ ⇒ |f (y)−f (y ′ )| < ε/2.
Sejam agora x, x′ ∈ X com |x − x′ | < δ. Existem seqüências de pontos yk , yk′ ∈ Y tais
que lim yk = x e lim yk′ = x′ . Para todo k suficientemente grande, tem-se |yk −yk′ | < δ,
portanto |f (yk ) − f (yk′ )| < ε/2. Então |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε.
Portanto f : X → Rn é uniformemente contı́nua.
8.3. Se f (X) fosse ilimitado, para cada k ∈ N existiria xk ∈ X tal que |f (xk )| > k.
A seqüência (f (xk )) assim obtida não possuiria subseqüência convergente. Mas como
X é limitado, a seqüência de pontos xk ∈ X teria uma subseqüência convergente, portanto de Cauchy. E sendo f uniformemente contı́nua, a subseqüência correspondente
(f (xk ))k∈N′ seria de Cauchy, logo convergente. Esta contradição mostra que f (X)
deve ser limitado.
8.4. Se xk , yk ∈ X são tais que lim |xk − yk | = 0 então lim |f (xk ) − f (yk )| = 0 e
lim |g(xk ) − g(yk )| = 0. Como |f (xk ) + g(xk ) − (f (yk ) + g(yk ))| ≤ |f (xk ) − f (yk )| +
|g(xk ) − g(yk )|, segue-se que f + g é uniformemente contı́nua. Analogamente, se
Seção 1
Topologia do Espaço Euclidiano
185
|f (x)| ≤ A e |g(x)| ≤ B para todo x ∈ X, então
|f (xk ) · g(xk ) − f (yk ) · g(yk )| =
= |(f (xk ) − f (yk )) · g(xk ) + f (yk )(g(xk ) − g(yk ))| ≤
≤ |f (xk ) − f (yk )| · B + A · |g(xk ) − g(yk )|
donde lim(f (xk ) · g(xk ) − f (yk ) · g(yk )) = 0, logo f · g é uniformemente contı́nua.
8.5. Sejam v = x̄ − x e w = y − x̄. Devemos provar que hv, wi ≥ 0. Para todo
t ∈ [0, 1], temos |v| ≤ |v + tw| pois v + tw ∈ C. Elevando ao quadrado, obtemos
|v|2 ≤ |v|2 + 2thv, wi + t2 · |w|2 . Simplificando concluı́mos que t[t|w|2 + 2hv, wi] ≥ 0
para todo t ∈ [0, 1]. Daı́ resulta que hv, wi ≥ 0 pois se fosse hv, wi < 0 então terı́amos
t[t|w|2 + 2hv, wi] < 0 para todo t positivo, menor do que −2hv, wi/|w|2 .
8.6. Por 8.5, temos hȳ − x̄, x− x̄i ≤ 0 e hx̄− ȳ, y − ȳi ≤ 0. A segunda desigualdade
escreve-se hȳ − x̄, ȳ −yi ≤ 0. Somando-a com a primeira, vem hȳ − x̄, x− x̄+ ȳ −yi ≤ 0,
donde hȳ − x̄, ȳ − x̄i ≤ hȳ − x̄, y − xi. Por Schwarz: |ȳ − x̄|2 ≤ |ȳ − x̄| |y − x|, logo
|ȳ − x̄| ≤ |y − x|.
9.1. A aplicação f : X → S n−1 , definida por f (x) = x/|x|, é contı́nua e bijetiva,
logo é um homeomorfismo, pois X é compacto.
t
9.2. Defina f : S n−1 × R → Rn − {0}
pondo f(x, t) = e · x e observe que
y
g : Rn − {0} → S n−1 × R, dada por g(y) =
, ℓn|y| é a inversa de f .
|y|
9.3. Considere a composição das aplicações abaixo indicadas:
S m × S n → S m × Rn+1 → S m × R × Rn → (Rm+1 − {0}) × Rn → Rm+n+1 ,
onde a terceira é dada pelo exercı́cio anterior e as demais são inteiramente óbvias.
Todas são homeomorfismos sobre suas imagens.
9.4. X é a reunião de duas circunferências com o ponto a em comum e Y é um
intervalo aberto da reta cujo ponto médio é b.
9.5. Seja f : X − {a} → Y − {b} um homeomorfismo. Defina F : X → Y pondo
F (x) = f (x) se x 6= a e F (a) = b. Como X é compacto e F é uma bijeção, basta
provar que F é contı́nua, ou seja, que lim xk = a ⇒ lim f (xk ) = b (onde xk ∈ X −{a}).
Como Y é compacto, basta mostrar que b é o único valor de aderência da seqüência
(f (xk )). Ora, se fosse lim′ f (xk ) = d 6= b terı́amos d = f (c), c ∈ X − {a} e lim′ xk = c
k∈N
k∈N
pois f −1 : Y − {b} → X − {a} é contı́nua. Mas devia ser lim′ xk = a. Final.
k∈N
S
Cax , uma reunião de conjuntos conexos
10.1. Fixando a ∈ X, temos X =
x∈X
com o ponto a em comum, logo X é conexo. Recı́proca óbvia.
10.2. Considere em Rn uma reta r que intersecte o segmento [a, b] em seu ponto
médio. Dados x, y ∈ r, os conjuntos [a, x] ∪ [x, b] = Ax e Ay = [a, y] ∪ [y, b] têm
apenas os pontos a, b em comum. Supondo, por absurdo, que nenhum dos Ax , x ∈ r,
estivesse contido em Rn − Z escolherı́amos, para cada x ∈ r, um ponto f (x) ∈ Ax ∩ Z.
Isto definiria uma aplicação injetiva f : r → Z, o que não existe pois Z é enumerável
e r não é.
10.3. Sejam a 6= b em S 1 e a′ 6= b′ em S 2 . Então S 1 − {a, b} é desconexo mas
2
S − {a′ , b′ } é conexo, homeomorfo a S 1 × R.
186
Soluções dos exercı́cios
Cap. 10
10.4. Um subconjunto de R, para ser homeomorfo a S 1 deveria ser compacto e
conexo, logo seria um intervalo [a, b], o qual fica desconexo pela remoção de um ponto
interior, mas a remoção de qualquer um dos seus pontos não desconecta S 1 .
10.5. X é a reunião dos dois eixos coordenados mais a hipérbole xy = 1, logo
tem 3 componentes conexas.
11.1. O ponto essencial é observar que se f : X → Rn é uniformemente contı́nua
então toda seqüência de Cauchy (xk ) em X é transformada por f numa seqüência
de Cauchy (f (xk )). Portanto, se lim xk = a então existe lim f (xk ) = b pois toda
seqüência de Cauchy em Rn é convergente. O limite b não depende da seqüência (xk )
escolhida pois se lim yk = a, ainda com yk ∈ X, a seqüência (x1 , y1 , x2 , y2 , . . . ) ainda
converge para a, logo é de Cauchy, e sua imagem (f (x1 ), f (y1 ), f (x2 ), f (y2 ), . . . ) é
de Cauchy, e tem a subseqüência (f (xk )) convergindo para b, logo lim f (yk ) = b.
Portanto xk → a ⇒ f (xk ) → b e daı́ lim f (x) = b.
x→a
11.2. Pelo exercı́cio anterior, para todo x = X existe lim f (y) = F (x). Isto
y→x
define F : X → Rn . Para todo ε > 0 dado, tome-se δ > 0 tal que y, y ′ ∈ Y ,
|y − y ′ | < δ ⇒ |f (y) − f (y ′ )| < ε/2. Agora, se x, x′ ∈ X e |x − x′ | < δ, tomamos
seqüências (yk ) e (yk′ ) em Y , com lim yk = x e lim yk′ = x′ . Desprezando alguns
termos iniciais, podemos supor que |yk − yk′ | < δ, onde |f (yk ) − f (yk′ )| < ε/2 para
todo k ∈ N, logo |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε.
k
11.3. Seja p(z) = a0 + a1 z+ · · · + ak z , com ak 6= 0. Então p(z) =
a
a
a
0
1
k−1
z k k + k−1 + · · · +
+ ak = z k (ϕ(z) + ak ), onde lim ϕ(z) = 0. Logo
z→∞
z
z
z
lim p(z) = ∞.
z→∞
11.4. Sabemos que, para todo ε > 0 existe δ > 0 tal que t ∈ R, 0 < |t| < δ ⇒
sen t
− 1 < ε. Tomando em Rn a norma do máximo, e supondo δ < 1, vemos que
t
sen(x1 · x2 · · · xn )
− 1 < ε.
0 < |x| < δ ⇒ |x1 · x2 · · · xn | < δ ⇒
x1 · x2 · · · xn
11.5. Sejam αi uma coordenada não-nula de v e βi a coordenada correspondente
βi
· Tome α = αi /βi .
de v0 . Então lim f (x) · αi = βi , donde lim f (x) =
x→a
x→a
αi
2
Caminhos diferenciáveis
1.1. Temos a = lim tk , com tk 6= a e f (tk ) = b para todo k ∈ N. Portanto
f (tk ) − f (a)
b−b
= lim
= 0.
f (a) = lim f (tk ) = b e f ′ (a) = lim
k→∞ tk − a
k→∞
tk − a
1.2. Para todo t ∈ I, temos f (t) = (x(t), |x(t)|), com f (a) = (0, 0). Portanto
a é um ponto no qual |x(t)| assume seu valor mı́nimo, logo a derivada da função
t 7→ |x(t)| é zero para t = a. Como −|x(t)| ≤ x(t) ≤ |x(t)| para todo t, segue-se que
x′ (a) = 0. Logo f ′ (a) = (x′ (a), |x|′ (a)) = (0, 0).
1.3. Na verdade, como f (t) + f ′′ (t) = (0, 0, t), este ponto já pertence ao eixo
vertical de R3 .
√
1.4. Temos g ′ (t) = (−ab sen bt, ab cos bt, c), logo |g ′ (t)| = a2 b2 + c2 . Assim, a
relação pedida é a2 b2 + c2 = 1.
Seção 2
Caminhos diferenciáveis
187
2.1. Aplique o Teorema de Rolle à função ϕ : [a, b] → R, definida por ϕ(t) =
|f (t)|2 .
2.2. Simplificamos a notação, escrevendo x • y em vez de ϕ(x, y). Então podemos
ver que
f1 (t + h) • f2 (t + h) − f1 (t) • f2 (t) =
=f1 (t + h) • [f2 (t + h) − f2 (t)] + [f1 (t + h) − f1 (t)] • f2 (t).
Dividindo por h e fazendo h → 0 vem g ′ (t) = f1′ (t) • f2 (t) + f1 (t) • f2′ (t). O caso
de aplicações p-lineares segue as mesmas linhas: se g(t) = f1 (t) • · · · • fp (t) então
p
P
g ′ (t) =
f1 (t) • · · · • fi′ (t) • · · · • fp (t). Quanto ao determinante de uma matriz
i=1
m × m, basta notar que ele é uma função m-linear das linhas dessa matriz, a qual
assume o valor 1 na matriz identidade m × m.
2.3. A aplicação g é diferenciável (de fato, C ∞ ) porque é a composta t 7→ f (t) 7→
2
2
ϕ
(f (t), . . . , f (t)) −→ f (t)k , onde ϕ : Rn × · · · × Rn é a aplicação k-linear dada pelo
produto de matrizes.
Rb
Rb
Rb
3.1. Temos |f (b) − f (a)| = | a f ′ (t)dt| ≤ a |f ′ (t)|dt ≤ a ϕ′ (t)dt = ϕ(b) − ϕ(a).
3.2. Aplique a cada uma das funções-coordenada do caminho f o resultado
correspondente já provado no Volume 1 (pag. 135).
3.3. Note que
hf (b), g(b)i − hf (a), g(a)i =
Z
b
ϕ′ (t)dt,
a
onde ϕ(t) = hf (t), g(t)i. Observe ainda que ϕ′ (t) = hf ′ (t), g(t)i + hf (t), g ′ (t)i.
3.4. De um modo geral, se A : Rm → Rn é uma transformação
linear e f :R I → Rm
Rb
b
n
é um caminho então t 7→ A·f (t) é um caminho em R com a A·f (t)dt = A· a f (t)dt.
Isto se vê diretamente a partir da definição de integral de um caminho. Em seguida,
note que w 7→ v × w é um operador linear em R3 .
3.5. Aqui usaremos um resultado elementar sobre conjuntos convexos, a ser
demonstrado no Capı́tulo 3 (Teorema 7): se A ⊂ Rn é convexo e α1 + · · · + αk = 1
k
P
com α1 ≥ 0, . . . , αk ≥ 0 então x1 , . . . , xk ∈ A ⇒
αi xi ∈ A. Daı́ resulta que
i=1
se (Pk∗ ) é uma seqüência de partições pontilhadas de [a, b] com lim |Pk | = 0 então
Z b
P
1
1
1 P
· f ; Pk∗ ∈A para todo k∈N, portanto
f (t)dt =
(f, Pk∗ )=
b−a
b−a
b−a a
X
1
lim
(f ; Pk ) ∈ A.
k→∞ b − a
4.1. Para toda partição P = {a = t0 < t1 < · · · < tk = b} tem-se |B − A| ≤
ℓ(f ; P ) ≤ ℓ(f ). Como ℓ(f ) = |B − A|, segue-se que ℓ(f ; P ) = |B − A|. Resulta
então do Exercı́cio 1.2 do Capı́tulo 1 que os pontos A = f (t0 ), f (t1 ), . . . , f (tk ) = B
estão dispostos ordenadamente sobre o segmento de reta AB. Então, para todo
t ∈ [a, b], tem-se f (t) = A + ϕ(t) · v, com v = B − A, e a função ϕ : [a, b] → [0, b]
é não-decrescente. Como f ∈ C 1 , segue-se do Exercı́cio 11.5 que ϕ ∈ C 1 e, como
é não-decrescente, ϕ′ ≥ 0. Logo f é uma reparametrização do caminho retilı́neo
f (t) = A + t · v.
188
Soluções dos exercı́cios
Cap. 10
4.2. Seja g : [0, L] → R2 tal que g ′ (t) = f (t) para todo t. (As funções-coordenada
RL
RL
RL
de g são primitivas das de f .) Então ℓ(g) = 0 |g ′ (t)|dt = 0 |f (t)|dt = 0 dt = L. Por
RL
RL
outro lado, observando que | 0 f (t)dt| = L, vemos que |g(L) − g(0)| = | 0 g ′ (t)dt| =
RL
| 0 f (t)dt| = L. Pelo exercı́cio anterior, temos g(t) = g(0) + ϕ(t) · v, com v =
g(L) − g(0). Logo 1 = |f (t)| = |g ′ (t)| = |ϕ′ (t)| · |v| = ϕ′ (t) · |v| pois ϕ′ ≥ 0, já que ϕ
não muda de sinal, ϕ(0) = 0 e ϕ(L) = 1. Assim, ϕ′ (t) = 1/|v| é constante e o mesmo
se dá com f (t) = ϕ′ (t) · v.
4.3. Fixando a ∈ U , seja A o conjunto dos pontos de U que podem ser ligados a
a por um caminho poligonal contido em U . É fácil ver que A é aberto e que também
é aberto o conjunto B dos pontos que não podem ser ligados a a por um caminho
poligonal contido em U . Então U = A ∪ B é uma cisão. Como U é conexo e A 6= ∅,
segue-se que U = A. Evidentemente todo caminho poligonal é retificável.
4.4. É claro que |x − a| ≤ dU (x, a) logo lim dU (xk , a) = 0 ⇒ lim xk = a. Para
provar a recı́proca, basta observar que se B = B(a; r) é uma bola aberta contida em
U então, para pontos xk ∈ B, tem-se dU (xk , a) = |xk − a|, portanto lim xk = a ⇒
lim |xk − a| = 0 ⇒ lim dU (xk , a) = 0 pois xk ∈ B para todo k suficientemente grande.
3
Funções reais de n variáveis
1.1. Se x e x + tei pertencem a U então [x, x + tei ] ⊂ U e f (x + tei ) − f (x) =
∂f
(x + θtei ) · t = 0, onde 0 < θ < 1.
∂xi
1.3. Dois pontos quaisquer de uma bola podem ser ligados por um caminho poligonal contido nela, o qual tem seus lados paralelos aos eixos. Segue-se daı́, pelo
argumento usado no Exercı́cio 4.3 do Capı́tulo 2, que o mesmo ocorre em qualquer aberto conexo. Fixando a ∈ U , para todo ponto x ∈ U , unindo-o ao ponto
a por um caminho desse tipo, em cada segmento retilı́neo do caminho varia apenas a
∂f
= 0, a função f se mantém constante ao longo desse
i-ésima coordenada e, como
∂xi
segmento. Então f (x) = f (a) para todo x ∈ U e f é constante.
∂f
1.4. Seja M ≥
(x) para todo x ∈ U e todo i = 1, 2, . . . , n. Dados x, x +
∂xi
v ∈ U , com v = (α1 , . . . , αn ), definamos v0 , v1 , . . . , vn ∈ Rn pondo v0 = 0 e vi =
vi−1 + αi ei para i = 1, . . . , n, de modo que vn = v. Então f (x + v) − f (x) =
n
P
f (x + vi ) − f (x + vi−1 ). Pelo Teorema do Valor Médio de uma só variável, temos
i=1
|f (x + vi ) − f (x + vi−1 )| =
M·
n
P
i=1
∂f
(z) · αi , onde z ∈ [vi−1 , vi ]. Logo |f (x + v) − f (x)| ≤
∂xi
|αi | e daı́ resulta a continuidade de f .
(tα)2 tβ
α2 β
1
∂f
(0, 0) = lim ·
= 2
para todo
2
2
t→0 t
∂v
(tα) + (tβ)
α + β2
∂f
∂f
(0, 0) = 0 e
(0, 0) = 0, logo grad f (0, 0) = 0. Se f fosse
v 6= 0. Em particular,
∂x
∂y
∂f
diferenciável no ponto (0, 0), terı́amos
(0, 0) = h grad f (0, 0), vi, o que não ocorre.
∂v
2.1. Se v = (α, β) então
Funções reais de n variáveis
Seção 3
189
∂f
(u) > 0 se u ∈ S n−1 implica que f (tu) < f (u) para 1 − ε <
∂u
t < 1 e ε > 0 suficientemente pequeno. (Cfr. Teorema 4 do Cap. 8, vol. 1.) Portanto
o mı́nimo de f (x) para |x| ≤ 1 é atingido num ponto a tal que |a| < 1. Então
ϕ(t) = f (a + tv) tem, para todo v ∈ Rn , um mı́nimo local quando t = 0, logo
∂f
(a) = ϕ′ (0) = 0.
∂v
2.3. Tem-se f (0) = lim f (tx) = lim t · f (x) = 0. Logo, para todo v ∈ Rn ,
2.2. A condição
t→0+
t→0+
f (tv)
tf (v)
∂f
(0) = lim
= lim
= f (v), ou seja, h grad f (0), vi = f (v). Mudando
∂v
t
t
t→0+
t→0+
a notação, temos f (x) = h grad f (0), xi portanto f é uma função linear de x. A
função ϕ cumpre ϕ(tx, ty) = t · ϕ(x, y) para todo t > 0 mas não é linear, logo não é
diferenciável no ponto (0, 0). (Observação: quando sabemos que um caminho possui
limite num ponto, podemos calculá-lo como um limite lateral.)
P ∂f
(a) · (xi − ai ) + r(x) mostra que r é uma
2.4. A igualdade f (x) = f (a) +
∂xi
∂r
(a) = 0 para i = 1, . . . , n. A continuidade das derivadas
função de classe C 1 , com
∂xi
∂r
no ponto a e o Teorema do Valor Médio nos asseguram então que, para todo ε > 0
∂xi
dado, existe δ > 0 tal que |x − a| < δ e |y − a| < δ implicam |r(x) − r(y)| < ε|x − y|.
Subtraindo membro a membro as desigualdades f (x) = f (a)+h grad f (a), x−ai+r(x)
e f (y) = f (a)+h grad f (a), y −ai+r(y) vem f (x)−f (y) = h grad f (a), x−yi+r(x, y),
onde, escrevendo r(x, y) = r(x) − r(y), temos |x − a| < δ, |y − a| < δ ⇒ |r(x, y)| <
ε|x − y|.
∂
∂f
∂f
∂
∂f
3.1. Como
não depende de
e
são identicamente nulas,
∂x ∂y
∂y ∂x
∂y
∂f
não depende de y. Fixando (x0 , y0 ) ∈ I × J podemos então definir as funções
xe
∂x
∂f
∂f
ϕ̄ : I → R e ψ̄ : J → R pondo ϕ̄(x) =
(x, y0 ) e ψ̄(y) =
(x0 , y), as quais são de
∂x
∂y
∂f
∂f
(x, y), ψ̄(y) =
(x, y) para todo (x, y) ∈ I × J.
classe C 1 e cumprem ϕ̄(x) =
∂x
∂y
Então
f (x, y) = f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 ) + f (x0 , y0 ) =
Z y
Z x
∂f
∂f
(s, y)ds +
(x0 , t)dt + f (x0 , y0 ) =
=
y0 ∂y
x0 ∂x
Z x
Z y
=
ϕ̄(s)ds +
ψ̄(t)dt + f (x0 , y0 ) = ϕ(x) + ψ(y).
x0
y0
3.2. Defina f : R × R → R, pondo f (x, y) = g(x + y, x − y). Verifique que
∂2f
∂x∂y
é identicamente nula e aplique o exercı́cio anterior.
3.3. Derivando duas vezes em relação a t, a igualdade f (tx) = t2 · f (x) nos dá
1 P ∂2f
f (x) =
(tx)xi xj . Tomando o limite quando t → 0 por valores positivos
2 i,j ∂xi ∂xj
P
1 ∂2f
(0).
chegamos a f (x) =
aij xi xj , onde aij =
2 ∂xi ∂xj
190
Soluções dos exercı́cios
Cap. 10
∂ϕ
∂ϕ
(x)i = 0, hf (x),
(x)i = 0, derive a pri∂xi
∂xj
meira em relação a xj e a segunda em relação a xi . Use Schwarz.
3.4. Tome as igualdades hf (x),
4.1. Isto é óbvio para k = 1, pela própria definição de diferenciabilidade e, para
k = 2, foi provado no texto. No caso geral, pela hipótese de indução, considerando
∂r
que as derivadas parciais
se anulam, junto com todas as suas derivadas até a
∂xi
| grad r(x)|
ordem k − 1, no ponto 0, conclui-se que lim
= 0. Ora, pelo Teorema do
x→0
|x|k−1
Valor Médio, para todo x numa bola de centro 0 contida em U , existe θ ∈ (0, 1) tal
que r(x) = r(x) − r(0) = h grad r(θx), xi, logo
|h grad r(θx), xi|
| grad r(θx)|
|r(x)|
=
≤
,
|x|k
|x|k
|x|k−1
|r(x)|
= 0.
|x|k
4.2. Siga as mesmas linhas da demonstração do Teorema 5 (Cap. 3), fazendo uso
∂3f
1 P
do exercı́cio anterior e observando que, na expressão
(a)αi αj αk a
3! i,j,k ∂xi ∂xj ∂xk
i-ésima variável αi ocorre em 3 parcelas (como 1o¯ , 2o¯ ou 3o¯ fator), logo a derivada
1P
∂3f
dessa expressão relativamente à sua i-ésima variável é igual a
(a)αj αk .
2 j,k ∂xi ∂xj ∂xk
O caso geral é análogo.
portanto lim
x→0
5.1. Se [hij ] é a matriz da forma quadrática H então hii = H · v 2 , com v =
ei = (0, . . . , 1, . . . , 0). Portanto os elementos da diagonal da matriz de uma forma
quadrática positiva (ou negativa) são todos números positivos (ou negativos) e assim
sua soma não pode ser igual a zero.
5.2. Seja X o conjunto dos pontos de máximo local estrito de f . Dado x ∈ X,
existe uma bola B(x; 2δ), contida em U , tal que y ∈ B(x; 2δ), y 6= x ⇒ f (y) < f (x).
Escolhamos, para cada x ∈ X, um ponto qx ∈ Qn ∩ B(x; δ) e um número racional
rx > 0 tal que |x − qx | < rx < δ, portanto B(qx ; rx ) ⊂ B(x; 2δ) e daı́ y ∈ B(qx ; rx ),
y 6= x ⇒ f (y) < f (x). A correspondência x 7→ (qx , rx ) é injetiva pois se qx = qx′ e
rx = rx′ então x′ ∈ B(qx ; rx ) e x ∈ B(qx′ ; rx′ ). Se fosse x 6= x′ terı́amos f (x)′ < f (x)
e f (x) < f (x′ ).
5.3. Como grad f (x, y) = −2 sen(x2 + y 2 ) · (x, y), os pontos crı́ticos de f são a
origem
x = y = 0 e os pontos das circunferências com centro na origem e raios iguais
√
a kπ, k ∈ N. Quanto à função g(x, y) = x3 − y 3 − x + y, cujo gradiente
é o vetor
6x
0
2
2
. Os
grad g(x, y) = (3x − 1, −3y + 1), sua matriz hessiana é Hg(x, y) =
0 −6y
√
√
√
√
√
√
pontos crı́ticos
√ de g√são A = ( 3/3, 3/3), B = (− 3/3. 3/3), C = ( 3/3, − 3/3)
e D = (− 3/3,
pontos, a matriz hessiana de g assume cada um
−√ 3/3). Nesses
0√
±2 3
, os sinais correspondendo aos das coordenadas de A,
dos 4 valores
0
±2 3
B, C e D. Logo Hg, é positiva no ponto C, que é portanto um ponto de mı́nimo
local, negativa no ponto B de máximo local e, nos pontos crı́ticos A e D, a forma
hessiana Hg é indefinida, logo esses pontos não são máximos nem mı́nimos locais: são
os chamados “pontos de sela”.
Funções reais de n variáveis
Seção 3
191
5.4. A função F : U → R, definida por F (x) = f (x) se x ∈ U e F (x) = 0
se x ∈ fr .U , é contı́nua no compacto U e diferenciável em U . A menos que F seja
identicamente nula (em cujo caso todo ponto de U é crı́tico para f ), seu valor máximo
ou seu valor mı́nimo é atingido num ponto a ∈ U , o qual é um ponto crı́tico de f .
∂f
∂f
5.5. Como
= 2x(2x2 − 2y 2 − 1) e
= 2y(2y 2 − 2x2 + 3), os pontos crı́ticos
∂x
∂y
√
−2 0
e
de f são (0, 0) e (± 22 , 0), onde as matrizes hessianas são Hf (0, 0) =
0
6
√
4 0
Hf (± 22 , 0) =
. Portanto a origem (0, 0) é um ponto de sela (máximo em
0 4
√
relação a x e mı́nimo em relação a y) enquanto os pontos (± 22 , 0) são de mı́nimo
local.
k,n
k
P
P
5.6. Temos f (x) =
hx − ai , x − ai i =
(xj − aij )2 onde x = (x1 , . . . , xn )
i=1
i,j=1
P
∂f
(x) = 2(kxj −
aij ).
∂xj
i
1P
Portanto, o ponto x é crı́tico para f se, e somente se, xj =
aij para todo j, ou
k i
k
1 P
ai . (Baricentro do sistema formado pelos pontos a1 , . . . , ak .) Temos
seja, x =
k i=1
∂2f
∂2f
(x) = 0 se m 6= j e
(x) = 2k, portanto a matriz hessiana é diagonal
ainda
∂xm ∂xj
∂x2j
k
1 P
e positiva, logo o ponto crı́tico x =
ai é de mı́nimo. (Note que f é convexa.)
k i=1
e ai = (ai1 , . . . , ain ). Então, para j = 1, . . . , n, temos
6.1. Para x, y ∈ Rn e t ∈ [0, 1], sejam x̄, ȳ ∈ A tais que d(x, A) = |x − x̄|
e d(y, A) = |y − ȳ|. Então (1 − t)x̄ + tȳ ∈ A (pois o fecho de um conjunto convexo é também convexo). E como d(x, A) = d(x, A), temos: f ((1 − t)x + ty) =
d((1 − t)x + ty, A) ≤ |[(1 − t)x + ty] − [(1 − t)x̄ + tȳ]| = |(1 − t)(x − x̄) + t(y − ȳ)| ≤
(1 − t)|x − x̄| + t|y − ȳ| = (1 − t)f (x) + tf (y).
6.2. Seja a ∈ X um ponto de mı́nimo local da função convexa f : X → R. Se existisse x ∈ X tal que f (x) < f (a) então, para todo t ∈ [0, 1], terı́amos
f ((1 − t)a + tx) ≤ (1 − t)f (a) + tf (x) < (1 − t)f (a) + tf (a) = f (a). Tomando
t > 0 pequeno, obterı́amos pontos y = (1 − t)a + tx tão próximos de a quanto se
deseje, com f (y) < f (a), logo a não seria um ponto de mı́nimo local.
6.3. Todo ponto a ∈ U é ponto médio de segmentos de reta [b, c] ⊂ U tão
1
pequenos quanto se queira, logo f (a) ≤ [f (b) + f (c)] e então não se pode ter f (a) >
2
f (b) e f (a) > f (c).
6.4. Se a, b ∈ U são pontos crı́ticos da função convexa diferenciável f : U → R
então ambos são pontos de mı́nimo global de f . Em particular, f (a) = f (b). Assim,
t ∈ [0, 1] ⇒ f ((1 − t)a + tb) ≤ (1 − t)f (a) + tf (b) = f (a), donde f ((1 − t)a + tb) = f (a)
pela minimalidade.
6.5. Se f (x) ≤ c e f (y) ≤ c então, para todo t ∈ [0, 1], vale f ((1 − t)x + ty) ≤
(1 − t)f (x) + tf (y) ≤ (1 − t)c + tc = c. Para toda função monótona f : I → R, definida
num intervalo I ⊂ R, o conjunto {x ∈ I; f (x) ≤ c} é um intervalo, mas f pode não
ser convexa.
192
Soluções dos exercı́cios
Cap. 10
6.6. Para f : X → R quase-convexa e x, y ∈ X, seja c = max{f (x), f (y)}.
Então f (x) ≤ c e f (y) ≤ c, logo f ((1 − t)x + ty) ≤ c = max{f (x), f (y)} para todo
t ∈ [0, 1]. Reciprocamente, supondo que f ((1 − t)x + ty) ≤ max{f (x), f (y)} para
quaisquer x, y ∈ X e t ∈ [0, 1], sejam x, y ∈ X tais que f (x) ≤ c e f (y) ≤ c. Então
max{f (x), f (y)} ≤ c, portanto t ∈ [0, 1] ⇒ f ((1 − t)x + ty) ≤ max{f (x), f (y)} ≤ c e
f é quase-convexa.
4
Funções implı́citas
1.1. Seja X o conjunto dos pontos x0 ∈ R que têm uma vizinhança V na qual
está definida uma função ξ tal que f (x, ξ(x)) = 0 para todo x ∈ V . Esta função é
∂f
única, pois a condição
6= 0 assegura que f é monótona ao longo de cada reta
∂y
vertical. Logo, podemos considerar ξ : X → R. Pelo Teorema da Função Implı́cita,
X é aberto e ξ é de classe C k . Cada intervalo I, componente de X, é fechado pois
∂f /∂x
, temos |ξ ′ | ≤ M em I,
se xk ∈ I ⊂ X e lim xk = x0 então, como ξ ′ = −
∂f /∂y
portanto ξ : I → R é uniformemente contı́nua e, assim, existe y0 = lim ξ(xk ), com
f (x0 , y0 ) = lim(xk , ξ(xk )) = 0. Pelo Teorema da Função Implı́cita, temos x0 ∈ X.
Como R é conexo e X 6= ∅, segue-se que X = R.
∂f
1.2. Em cada ponto x0 ∈ A, uma das derivadas parciais de f , digamos
,
∂xi
é 6= 0. Logo f transforma um segmento de reta paralelo ao i-ésimo eixo, contendo
x0 e pequeno bastante para estar contido em A, injetiva e monotonamente sobre um
intervalo contendo f (x0 ) e contido em f (A), portanto f (A) é aberto.
∂f
= cos z 6= 0 numa vizinhança da origem, logo perto de 0
1.3. Temos
∂z
a equação x4 + 2x · cos y + sen z = 0 define z como função de x e y. Tem-se
−∂f /∂x
−(4x3 + 2 cos y)
−∂f /∂y
∂z
∂z
2x sen y
=
=
e
=
=
·
∂x
∂f /∂z
cos z
∂y
∂f /∂z
cos z
1.4. A função ξ : R → [0, 1) é definida por ξ(0) = 0 e ξ(x) = e−|x| se x 6= 0. Ela é
a única função com valores em [0, 1) que cumpre f (x, ξ(x)) = 0 mas não é contı́nua.
∂ϕ
(x, y) =
1.5. Seja ϕ : Rn+1 → R definida por ϕ(x, y) = g(x)−y(1+y 4 ). Então
∂y
−1 − 5y 4 6= 0 para todo (x, y) ∈ Rn+1 . Assim, para todo x0 ∈ Rn , pondo y0 = f (x0 )
temos ϕ(x0 , y0 ) = 0. Pelo Teorema da Função Implı́cita, existem uma bola B =
B(x0 , δ) ⊂ Rn , um intervalo J = [y0 − ε, y0 + ε] e uma função ξ : B → J de classe C k
tais que, para todo x ∈ B, ξ(x) é o único ponto em J tal que ϕ(x, ξ(x)) = 0. Como
f é contı́nua (prove isto!), podemos tomar δ > 0 tão pequeno que f (B) ⊂ J. E,
sabendo que ϕ(x, f (x)) = 0 para todo x ∈ B, concluı́mos que f (x) = ξ(x) se x ∈ B,
portanto f é de classe C k .
2
2.1. Seja U ⊂ Rn o conjunto aberto formado pelas matrizes x do tipo n × n para
as quais pelo menos um determinante menor Xij é 6= 0. A ij-ésima derivada parcial
∂f
x) = det .x
x é
x) = (−1)i+j Xij , portanto todo
da função f : U → R, dada por f (x
(x
∂xij
número c ∈ R é um valor regular de f . Como M = f −1 (0), concluı́mos que M é uma
hiperfı́cie orientável. O espaço tangente Tp M é formado pelas matrizes x ortogonais
x) são (−1)i+j Xij . Logo grad f (pp) é a
a grad f (pp). Ora, as coordenadas de grad f (x
Seção 4
Funções implı́citas
193
matriz n × n cujo único elemento não-nulo é igual a 1 e está na n-ésima linha com a
n-ésima coluna. Portanto, uma matriz x = [xij ] é ortogonal a grad f (pp) se, e somente
se, xnn = 0. Tais matrizes formam o espaço Tp M .
2.2 Seja U = {(x, y, z) ∈ R3 ; x2 + y 2 6= 0} o complementar
do eixo vertical em
p
R3 . A função f : U → R, definida por f (x, y, z) = z 2 + ( x2 + y 2 − 2)2 , é de classe
!
p
p
2x( x2 + y 2 − 2) 2y( x2 + y 2 − 2)
∞
p
p
,
, 2z ,
C e seu gradiente é grad f (x, y, z) =
x2 + y 2
x2 + y 2
o qual se anula apenas nos pontos da circunferência x2 + y 2 = 4, z = 0, todos no
nı́vel zero de f . Portanto 1 é valor regular e f −1 (1) = M é uma superfı́cie C ∞ em
R3 . M é o toro obtido pela rotação de uma circunferência vertical de raio 1, cujo
centro descreve a circunferência x2 + y 2 = 4 no plano z = 0.
2.3. Dado p ∈ M , podemos escrever os pontos de Rn+1 sob a forma (x, y), com
x ∈ Rn , y ∈ R e tomar um aberto U ⊂ Rn+1 com p ∈ U , tal que V = M ∩ U seja
o gráfico V = {(x, ξ(x)); x ∈ V0 } de uma função ξ : V0 → R, de classe C k (k ≥ 1).
Então a função f : U → R, definida por f (x, y) = y − ξ(x), não possui pontos crı́ticos
∂f
pois
≡ 1. Além disso, V = f −1 (0), portanto em cada ponto z ∈ V , o vetor
∂y
v(z) = grad f (z) é ortogonal a Tz M , portanto v : V → Rn+1 é um campo de classe
C k−1 de vetores não-nulos normais a M .
3.1. Sejam f, ϕ : Rn+1 → R dadas por f (x) = |x|2 e ϕ(x) = hAx, xi. Então
grad f (x) = 2x e grad ϕ(x) = 2Ax. Os pontos crı́ticos de f |M , onde M = ϕ−1 (1)
são os pontos x ∈ M tais que grad f (x) = λ · grad ϕ(x), ou seja, x = λ · Ax, logo x
é um autovetor de A, correspondente ao autovalor λ−1 . De x = λ · Ax resulta que
|x|2 = hx, xi = λhAx, xi = λ. Portanto, quando x varia em M , o maior valor de |x|2
é o maior λ tal que 1/λ é autovalor de A. Noutras palavras, a maior distância de um
√
ponto do elipsóide M à origem é 1/ µ, onde µ = 1/λ é o menor autovalor de A.
n+1
3.2. Sejam f, ϕ : R
→ R, f (x) = |x − a|2 , ϕ(x) = hb, xi, H = ϕ−1 (c),
grad f (x) = 2(x − a), grad ϕ(x) = b. Se x ∈ H é ponto crı́tico de f |H então hb, xi = c
λ
e 2(x − a) = λb, ou seja, x = a + b. O produto interno da última igualdade por b nos
2
c − hb, ai
c − hb, ai
λ 2
λ
dá c = hb, xi = hb, ai + |b| , donde
=
, e daı́ x = a +
b. Este
2
2
|b|2
|b|2
2
é o único ponto crı́tico de f |H, logo é o ponto em que |x − a| (e portanto |x − a|)
atinge seu menor valor com x ∈ H.
3.3. Consideradas as funções f, ϕ : R2n → R, f (x, y) = hx, yi e ϕ(x, y) =
|(x, y)|2 = |x|2 +|y|2 , temos M = ϕ−1 (1), grad f (x, y) = (y, x) e grad ϕ(x, y) = 2(x, y).
Portanto (x, y) ∈ M é ponto crı́tico de f |M se, e somente se, (y, x) = 2λ(x, y) logo
1
y = 2λx e x = 2λy, o que nos dá λ = ± e y = ±x. Assim, os pontos crı́ticos de f |M
2
1
são os da forma (x, ±x) com |x|2 = · Os pontos (x, x) são de máximo e os (x, −x)
2
1
1
para todo (x, y) ∈ M . Para todo par de vetores
de mı́nimo, logo − ≤ hx, yi ≤
2
√
√
√ 2 √ 2
2
2
2
1
não-nulos x, y ∈ Rn , tem-se
x,
y ∈ M , portanto h
x,
yi ≤ e daı́
2|x| 2|y|
2|x|
2|y|
2
√
√
2
2
x=±
y, isto é, quando
|hx, yi| ≤ |x| |y|, a igualdade valendo apenas quando
2|x|
2|y|
x e y são colineares.
194
Soluções dos exercı́cios
3.4.
2
Seja ϕ : Rn
x) =
→ R, ϕ(x
Cap. 10
P
x2ij .
x) = (−1)i+j Xij e
Como grad f (x
i,j
x) = 2[xij ], onde Xij é o ij-ésimo determinante menor de x , se M = ϕ−1 (n),
grad ϕ(x
o máximo de f |M é atingido na matriz x tal que (*) (−1)i+jP
Xij = 2λxij , donde
(−1)i+j Xij xij = 2λx2ij . Somando em i e j: n · det x = 2λ x2ij = 2λ · n, logo
P i,j
P
det x = 2λ. Fixando i e somando em j, vem: det x = 2λ · x2ij = det x · x2ij , logo
j
j
as linhas de x têm comprimento 1. A igualdade (*) também dáP(−1)i+j Xij xkj =
2λxij xkj . Tomando k 6= i e somando em j, obtemos 0 = det x ·
xij xkj , portanto
j
as linhas de x são duas a duas ortogonais. Assim, x é uma matriz ortogonal, com
det x = 1. Daı́ resulta a desigualdade de Hadamard.
√
√
√
3.5. Suponhamos que s = n p + · · · + n p = n n p não seja a menor soma de n
números positivos cujo produto é p. Então existiria s̄ = x1 + · · · + xn < snas mesmas
s̄ n
s n
condições. Ora, pelo Exemplo 9, terı́amos x1 · x2 · · · xn ≤
<
< p, uma
n
n
contradição.
5
Aplicações diferenciáveis
1.1. Como o operador f ′ (0) não possui ponto fixo no compacto S n−1 , existe ε > 0
tal que |u| = 1 ⇒ |f ′ (0)·u−u|
com f (0) = 0, temos f (x) =
≥ ε. Sendo f diferenciável,
x
′
′
f (0) · x + ρ(x) · |x| = |x| f (0) ·
+ ρ(x) e existe δ > 0 tal que 0 < |x| < δ ⇒
|x|
x
x
−|ρ(x)| >0
|ρ(x)| < ε. Portanto, se 0 < |x| < δ então |f (x) − x| ≥ |x| f ′ (0)·
−
|x| |x|
e daı́ f (x) 6= x.
1.2. Pela definição de F , tem-se F (tx)/t = F (x) se t > 0 e F (tx)/t = −F (−x)
F (tx)
se t < 0. Como F (0) = 0, supondo F diferenciável no ponto 0, existe lim
,
t→0
t
F (tx)
= F ′ (0) · x, portanto F coincide com a
logo F (x) = −F (−x) e F (x) = lim
t→0
t
′
m+1
n
transformação linear F (0) : R
→ R . A recı́proca é óbvia.
1.3. Aplicando oTeorema
de Schwarz
função-coordenada de f , vemos que
a cada
∂f
∂f
∂
∂
′′
(a) =
(a) = f ′′ (a) · ej · ei e, por bilinearidade,
f (a) · ei · ej =
∂xj ∂xi
∂xi ∂xj
resulta que f ′′ (a) · u · v = f ′′ (a) · v · u para quaisquer u, v.
1.4. Isto se reduz ao Exercı́cio 2.1 do Capı́tulo 2 se observarmos que f ′ (x) · v
é o vetor velocidade do caminho f ◦ λ, onde λ : (−ε, ε) → U é tal que λ(0) = x e
λ′ (0) = v.
2.1. Seja R(h, k) = A(x + h) · (v + k) − A(x) · v − (A′ (x) · h) · v − A(x) · k =
(A(x + h) − A(x) − A′ (x) · h) · v + (A(x + h) − A(x)) · k = r(h) · v + s(h) · k, onde
r(h)
|r(h)|
|r(h)|
|k|
lim
= 0 e lim s(h) = 0. Então, como
≤
e
≤ 1, segue-se
h→0 |h|
h→0
|h| + |k|
|h|
|h| + |k|
R(h, k)
que lim
= 0.
h,k→0 |h| + |k|
Seção 6
Aplicações Inversas e Implı́citas
195
a −b
2.2. A matriz da transformação linear f ′ (z0 ), sendo da forma
, pode
b
a
√
a
cos θ − sen θ
ser escrita como ρ
com ρ = a2 + b2 , cos θ = √
, sen θ =
sen θ
cos θ
a2 + b 2
b
√
, logo f ′ (z0 ) é uma rotação de ângulo θ seguida de uma homotetia de razão
a2 + b 2
ρ, portanto preserva ângulos.
2.3. As colunas da matriz jacobiana de f são (2x, 0, 2(x + y)) e (0, 2y, 2(x + y)),
que são L.I. salvo quando x = y = 0;
2.4. As linhas da matriz jacobiana de f são (2x, −2y, 0), (y, x, 0), (z, 0, x) e
(0, z, y). Se x2 + y 2 6= 0, as 3 primeiras são L.I. caso x 6= 0 e a 1a¯ , a 2a¯ e a 4a¯ são L.I.
quando y 6= 0. A imagem de f ′ (0, 0, z) é o plano formado pelos pontos (0, 0, s, t) em
R4 .
2.5. Basta notar que as linhas da matriz jacobiana de f são (1, 1, 1), (2x, 2y, 2z)
e (3x2 , 3y 2 , 3z 2 ), logo o jacobiano de f é igual a 6(z − x)(z − y)(y − x).
3.1. Suponhamos, por absurdo, que |f ′ (x)| > M , ou seja, |f ′ (x)| = M + ε,
ε > 0, para algum x ∈ U . Como |f ′ (x)| é o máximo de |f ′ (x) · u| para |u| = 1 e
S m−1 é compacta, existiria u ∈ Rm com norma 1, tal que |f ′ (x) · u| = M + ε. Pela
definição de diferenciabilidade, a este ε corresponde δ > 0 tal que 0 < t < δ ⇒
|f (x + tu) − f (x)| = |f ′ (x) · tu + r(tu)| ≥ t|f ′ (x) · u| − |r(tu)|, com |r(tu)| < tε. Então
0 < t < δ ⇒ |f (x + tu) − f (x)| > t(M + ε) − tε = t · M . Pondo v = tu, temos |v| = t,
logo |f (x + v) − f (x)| > M · |v|, uma contradição.
3.2. Tem-se ϕ′ (x) · h = h(T ′ (x) · h) · f (x), g(x)i + hT (x) · f (x), g ′ (x) · hi + hT (x) ·
′
(f (x) · h), g(x)i.
3.3. Levando em conta que (g ◦ f )′ = (g ′ ◦ f ) · f ′ , vale: (g ◦ f )′′ = [(g ′ ◦ f ) · f ′ ]′ =
′
(g ◦ f )′ · f ′ + (g ′ ◦ f ) · f ′′ = (g ′′ ◦ f ) · f ′ · f ′ + (g ′ ◦ f ) · f ′′ . Isto significa que, para x ∈ U ,
y = f (x) ∈ V e u, v ∈ Rm , tem-se: (g ◦ f )′′ (x) · u · v = g ′′ (y) · (f ′ (x) · u) · (f ′ (x) · v) +
g ′ (y) · f ′′ (x) · u · v ∈ Rp .
3.4. A interpretação correta é ϕ′ (t) · v = [A′ (tx) · x] · v, v ∈ Rm . Para dirimir
a confusão, suponha que U ⊂ Rp e não U ⊂ Rm . Então A′ (tx) ∈ L(Rp ; Rn ), logo
A′ (tx) · v não faz sentido.
3.5. Aplique a Desigualdade do Valor Médio a g : U → Rn , definida por g(x) =
f (x) − T · x.
3.6. Tem-se ϕ′ (x) · v = (f ′ (x) · v) · a = h grad f (x), vi · a.
6
Aplicações Inversas e Implı́citas
1.1. Pelo Exercı́cio 3.1 do Capı́tulo 5, temos |ϕ′ (x) · v| < c|v| < |v| para todo
x ∈ U e todo v ∈ Rm − {0}, logo |f ′ (x) · v| = |v + ϕ′ (x) · v| ≥ |v| − |ϕ′ (x) · v| > 0
se v 6= 0. Assim, f ′ (x) : Rm → Rm é um isomorfismo, para todo x ∈ U . Pelo
Teorema da Aplicação Inversa, f é um difeomorfismo local, portanto transforma cada
aberto A ⊂ U num aberto f (A) ⊂ Rm . Além disso, y ∈ U ⇒ |f (x) − f (y)| =
|x − y + ϕ(x) − ϕ(y)| ≥ |x − y| − c|x − y| = (1 − c)|x − y| portanto f é injetiva, logo
é um difeomorfismo de U sobre o aberto f (U ). Suponhamos agora U = Rm . Para
provar que f (Rm ) é fechado, seja (xk ) uma seqüência tal que lim f (xk ) = y ∈ Rm .
1
Como |xk −xr | ≤
|f (xk )−f (xr )|, vemos que (xk ) é de Cauchy portanto converge:
1−c
196
Soluções dos exercı́cios
Cap. 10
lim xk = x. Então f (x) = lim f (xk ) = y ∈ f (Rm ). Assim, f (Rm ) é aberto e fechado.
Como Rm é conexo, tem-se f (Rm ) = Rm .
2
2
x) = x k , é de classe C ∞ , com
1.2. A aplicação f : Rn → Rn , definida por f (x
k
P
x) · v =
f ′ (x
x i−1 · v · x k−i . No ponto x = I n (matriz identidade n × n), temos
i=1
f ′ (II n ) · v = kvv , logo f ′ (II n ) é um isomorfismo. Pelo Teorema da Aplicação Inversa,
existem abertos U , V , ambos contendo I n , tais que f é um difeomorfismo de U sobre
V . Eles respondem a questão.
1.3. Em primeiro lugar, note que o conjunto U dos operadores positivos é aberto
no espaço vetorial Rn(n+1)/2 dos operadores auto-adjuntos (matrizes simétricas). Isto
resulta do critério clássico de positividade: os n menores principais da matriz são
positivos. A bijetividade de f é um corolário do Teorema Espectral, segundo o qual
todo operador positivo possui uma única raiz quadrada positiva. Resta apenas provar
que, para todo X ∈ U , a derivada f ′ (X) : Rn(n+1)/2 → Rn(n+1)/2 é um isomorfismo.
Ora, temos f ′ (X) · V = X · V + V · X. Seja {u1 , . . . , un } uma base de Rn formada por
autovetores de X, com X · ui = λi ui . Então f ′ (X) · V = 0 ⇒ XV ui + λi V ui = 0 ⇒
X(V ui ) = −λi · (V ui ). Como X não possui autovalores negativos, tem-se V · ui = 0
(i = 1, . . . , n), logo V = 0 e f ′ (X) é injetiva, logo bijetiva.
1.4. Observação preliminar: se U ⊂ Rn é aberto, com n > 1, e q ∈ Rn é um
ponto isolado da fronteira de U então U ∪ {q} é aberto. Com efeito, seja B uma bola
aberta de centro q, que não contenha outro ponto de fr .U além de q. Como n > 1,
o aberto B − {q} é conexo e certamente contém pontos de U pois q ∈ fr .U , mas não
contém pontos fora de U pois, pelo Teorema da Alfândega, teria de conter pontos de
fr .U . Então B − {q} ⊂ U e daı́ B ⊂ U ∪ {q}, logo q ∈ int .U ∪ {q} e U ∪ {q} é aberto.
Isto posto, notemos que basta considerar o caso em que p ∈ U é o único ponto onde
det .Jf se anula. Então f em U − {p} é um difeomorfismo local, logo transforma
abertos em abertos. É suficiente agora provar que f (U ) é aberto. Isto é claro se
existir x 6= p em U com f (x) = f (p). Suporemos então que, pondo q = f (p), temos
q 6= f (x) para todo x 6= p em U . Sejam B = B(p; r) tal que B ⊂ U e S = S(p; r). A
fronteira do aberto V = f (B − {p}) é {q} ∪ f (S), logo q é um ponto isolado de fr .V
e, pela observação preliminar, f (B) = V ∪ {q} é aberto, logo q = f (p) ∈ int f (U ),
donde se conclui que f (U ) é aberto. Quanto ao Teorema Fundamental da Álgebra,
se p : R2 → R2 é um polinômio complexo não-constante, seu determinante jacobiano
em cada ponto z ∈ R2 é igual a |p′ (z)|, logo se anula apenas num número finito de
pontos, que são as raı́zes de p′ (z). Portanto p(R2 ) é um conjunto aberto. Por outro
lado, como lim p(z) = ∞, p(R2 ) também é fechado. Sendo R2 conexo, segue-se que
z→∞
p(R2 ) = R2 , logo existe z ∈ R2 tal que p(z) = 0.
1.5. Os passos para a conclusão do exercı́cio são bastante claros. Para provar
que a função α é C ∞ , use o Exercı́cio 10, da Seção 4, Cap. 8 do Volume 1 (pag. 100).
Para provar que g é um difeomorfismo, use o Exercı́cio 1, Capı́tulo 6 deste volume.
2.1. Isto resulta imediatamente do Teorema 5 (Forma Local das Submersões)
pois cada ponto p ∈ A pertence a um aberto Z ⊂ A tal que f (Z) = W é um aberto
em Rn (com a notação do enunciado daquele teorema).
2.2. Basta observar que grad f1 (x), . . . , grad fn (x) são as linhas da matriz
jacobiana de f no ponto x, a qual tem posto n se, e somente se, esses vetores são L.I.
Seção 7
Superfı́cies Diferenciáveis
197
2.3. Lembrar que, para cada matriz x ∈ U , as n2 coordenadas do gradiente, no
ponto x , da função det : U → R são os números (−1)i+j Xij , onde Xij é o determinante da matriz (n − 1) × (n − 1) que se obtém de x omitindo sua i-ésima linha e
j-ésima coluna. Portanto x é um ponto crı́tico da função det se, e somente se, todas
as submatrizes (n − 1) × (n − 1) de x tiverem determinante igual a zero e então o
posto de x é ≤ n − 2.
2.4. Num ponto arbitrário a ∈ V , seja b = ξ(a), logo f (a, b) = c. Pelo Teorema
das Funções Implı́citas, existem abertos W, Z, com a ∈ W ⊂ V ⊂ Rm e (a, b) ∈ Z ⊂
U , bem como uma aplicação ξ0 : W → Rn , de classe C k , tais que f −1 (c)∩Z é o gráfico
de ξ0 , ou seja, se (x, y) ∈ Z e f (x, y) = c então x ∈ W e y = ξ0 (x). Em particular,
como (a, b) ∈ Z e f (a, b) = c, segue-se que ξ0 (a) = b = ξ(a). Como ξ é contı́nua e
(a, ξ(a)) ∈ Z, podemos supor W ∋ a tão pequena que x ∈ W ⇒ (x, ξ(x)) ∈ Z, Então
x ∈ W ⇒ (y, ξ(x)) ∈ Z e f (y, ξ(x)) = c ⇒ (x, ξ(x)) ∈ f −1 (c)∩Z ⇒ (x, ξ(x)) ∈ gráfico
de ξ0 ⇒ ξ(x) = ξ0 (x), logo ξ ∈ C k . Quanto à parte final do exercı́cio, basta observar
que, definindo f : R3 → R por f (x, y, z) = (x2 + y 4 )z + z 3 , tem-se ∂f
= x2 + y 4 + 3z 2 ,
∂z
∂f
logo ∂z (x, y, z) 6= 0 sempre que f (x, y, z) = 1.
7
Superfı́cies Diferenciáveis
2.1. Pelo Corolário 1, M é localmente o gráfico de uma aplicação g : V0 → Rn ,
de classe C k . Ou seja, M é coberta por abertos U ⊂ Rm+n tais que V = U ∩ M =
{(x, g(x)); x ∈ V0 }. Definindo f : U → Rn por f (x, y) = y − g(x), vemos que f ∈ C k ,
0 é valor regular de f e V = U ∩ M = f −1 (0). Então ϕ : V0 → V , ϕ(x) = (x, g(x)), é
uma parametrização C k e, pondo f = (f1 , . . . , fn ), os campos de vetores v1 , . . . , vn :
V → Rm+n , dados por v1 (q) = grad f1 (q), . . . , vn (q) = grad fn (q) cumprem o que foi
pedido no exercı́cio.
2.2. Seja ϕ : V0 → V ⊂ M uma parametrização de classe C k . O conjunto
m
e
e
V = {(p, v); p ∈ V, v ∈ T
p M } é aberto em T M
e a aplicação Φ : V0 × R → V , dada
m
P
∂ϕ
por Φ(x, α1 , . . . , αm ) = ϕ(x),
αi
(x) é uma parametrização de classe C k−1
∂xi
i=1
e dimensão 2m em T M .
2.3. Se ϕ : V0 → V ⊂ M é uma parametrização de classe C k então o conjunto
Vb = {(p, v); p ∈ V, v ∈ Tp M ⊥ } é aberto em νM . Sejam v1 , . . . , vn−m : V → Rn
campos de vetores L.I., com vi ◦ ϕ : V0 → Rn de classe C k−1 e vi (q) ⊥ Tq M para i =
1, . . . , n−m
e todo q∈ V . Então Φ : V0 ×Rn−m → Vb , dada por Φ(x, α1 , . . . , αn−m ) =
P
ϕ(x), αi vi (ϕ(x)) , é uma parametrização de dimensão n e classe C k−1 em νM .
Observação: Nos Exercı́cios 2.2 e 2.3, a verificação de que Ve e Vb são abertos é
imediata se notarmos que (p, v) 7→ v é contı́nua, logo a imagem inversa de uma aberto
é aberta.
2.4. Escrevendo as matrizes 4 × 4 sob a forma m = [x, y, u, v], onde x, y,
u, v ∈ R4 são suas colunas então M é o conjunto dessas matrizes para as quais
2 desses vetores são L.I. mas 3 quaisquer não são. Fixando as idéias, seja V =
{[x, y, u, v] ∈ M ; x, y são L.I.}. Então [x, y, u, v] ∈ V ⇒ u = αx + βy, v = γx + δy.
Seja W = {(x, y) ∈ R4 × R4 ; x, y L.I.}. Pondo V0 = W × R4 , a aplicação ϕ : V0 → V ,
dada por ϕ(x, y, α, β, γ, δ) = [x, y, u, v], onde u = αx + βy, v = γx + δy, é uma parametrização C ∞ . (Verifique!) É claro que M é coberta por 6 abertos do tipo V , logo
198
Soluções dos exercı́cios
Cap. 10
é uma superfı́cie C ∞ de dimensão 12 em R16 . O mesmo argumento vale em geral: as
matrizes m × n de posto k formam uma superfı́cie de dimensão (m + n − k)k em Rmn .
P
3.1. Pelo enunciado, temos
aij ei = (ψ −1 ◦ ϕ)′ (x0 ) · ej = [ψ ′ (y0 )]−1 · ϕ′ (x0 ) · ej ,
i
P
P
P
∂ψ
∂ϕ
aij
aij ψ̇ ′ (y0 ) · ei =
(x0 ) = ϕ′ (x0 ) · ej = ψ ′ (y0 ) · aij ei =
(y0 ),
∂xj
∂yi
i
i
i
todos os somatórios sendo com i variando de 1 a m.
portanto
3.2. Segue-se da compacidade de [a, b] que o caminho λ pode ser expresso como
justaposto de caminhos, cada um dos quais tem sua imagem contida numa vizinhança
parametrizada. Portanto não há perda de generalidade em admitir que λ([a, b]) ⊂ V ,
onde V é a imagem de uma parametrização ψ : W0 → V ⊂ M , com ψ(y0 ) = p.
Seja {w1 , . . . , wm } ⊂ Rm uma base tal que ψ ′ (x0 ) · wi = ui (i = 1, . . . , m). Considere a transformação linear T : Rm → Rm tal que T e1 = w1 , . . . , T em = wm .
Sejam V0 = T −1 (W0 ), ϕ = ψ ◦ T : V0 → V e x0 = T −1 (y0 ). Então ϕ : V0 →
∂ϕ
V é uma parametrização tal que ϕ(x0 ) = p e
(x0 ) = ϕ′ (x0 ) · ei = ui , i =
∂xi
1, . . . , m. Para
{v1 (t), . . . , vm (t)} ⊂ Tλ(t) M é aquela
cada t ∈ [a, b], a base ortonormal
∂ϕ
∂ϕ
(λ0 (t)), . . . ,
(λ0 (t)) pelo processo de Gram-Schmidt, onde
obtida de
∂x1
∂xm
ϕ(λ0 (t)) = λ(t).
3.3. Como no exercı́cio anterior, podemos admitir que os valores λ(t), t ∈ [a, b],
pertencem a um aberto V ⊂ M , no qual estão definidos n campos vetoriais contı́nuos
w1′ , . . . , wn′ : V → Rm+n , com w1′ (q), . . . , wn′ (q) L.I. e ortogonais a Tq M , para todo
n
P
q ∈ V . No ponto p = λ(a), temos uj =
aij wi′ (p), j = 1, . . . , n. Os campos
i=1
P
wj : V → Rm+n , dados por wj (q) =
aij wi′ (q), são ainda L.I. e ortogonais a Tq M ,
i
agora com wj (p) = uj (j = 1, . . . , n). Usando o processo de ortonormalização de
Gram-Schmidt, obtemos os campos v1 , . . . , vn : V
→
Rm+n tais que
t 7→ {v1 (λ(t)), . . . , vn (λ(t))} cumpre as condições estipuladas no exercı́cio.
Observação: O processo de ortonormalização de Gram-Schmidt faz passar de
um conjunto {w1 , . . . , wn } de vetores L.I. para um conjunto ortonormal {v1 , . . . , vn }
que gera o mesmo subespaço, de tal modo que cada vetor vj depende continuamente
(e mesmo em classe C ∞ ) de w1 , . . . , wn .
3.4. A matriz de passagem da base {u1 , . . . , un } para a base {w1 , . . . , wn } tem
determinante > 0. Como S n−1 é conexo, existe um caminho λ : [0, 1] → S n−1 , com
λ(0) = un e λ(1) = wn . Sendo {u1 , . . . , un−1 } ⊂ Tun S n−1 uma base ortonormal, o
Exercı́cio 2 garante que existe uma aplicação contı́nua t 7→ (v1 (t), . . . , vn−1 (t)) tal que,
para todo t ∈ [0, 1] os vj (t) formam uma base ortonormal de Tλ(t) S n−1 , com vj (0) =
uj , j = 1, . . . , n − 1. O determinante da matriz de passagem de {v1 (t), . . . , vn−1 (t)}
para {w1 , . . . , wn−1 } é 1 quando t = 0 e é 6= 0 para todo t ∈ [0, 1], logo é > 0 para
t = 1. Pela hipótese de indução, existe uma aplicação contı́nua t 7→ {v1 (t),· · · ,vn−1 (t)},
definida para 1 ≤ t ≤ 2, tal que os vj (t), t ∈ [1, 2], formam um conjunto ortonormal
e v1 (2) = w1 , . . . , vn−1 (2) = wn−1 . Mantendo λ(t) = vn (t) = wn constante para
1 ≤ t ≤ 2, chegamos ao fim da 1a¯ parte do exercı́cio. Quando à conclusão, basta observar que os elementos de SO(Rn ) são matrizes de determinante > 0 cujas colunas
formam uma base ortonormal de Rn .
Seção 7
Superfı́cies Diferenciáveis
199
4.1. A observação crucial é que se ϕ : V0 → V é uma parametrização, com
V0 ⊂ Rm , e T : Rm → Rm é dada por T (x1 , . . . , xm ) = (−x1 , x2 , . . . , xm ) então,
pondo V1 = T −1 (V0 ) e ϕ1 = ϕ ◦ T : V1 → V , obtém-se uma parametrização ϕ1 com
a seguinte propriedade: para toda parametrização ψ : W0 → W com V ∩ W 6= ∅,
os determinantes jacobianos de ψ −1 ◦ ϕ1 e ψ −1 ◦ ϕ nos pontos x ∈ V1 e T (x) ∈ V0
têm sinais opostos. Diz-se então que ϕ1 é obtida invertendo a orientação de ϕ. Isto
posto, notemos ainda que, em ϕ−1 (U ∩ V ∩ W ) vale ξ −1 ◦ ϕ = (ξ −1 ◦ ψ) ◦ (ψ −1 ◦ ϕ),
portanto, ao analisar o sinal do determinante jacobiano, basta considerar ξ −1 ◦ ψ e
ψ −1 ◦ ϕ. Ora, os sinais dos determinantes jacobianos de ξ −1 ◦ ψ e ψ −1 ◦ ϕ, nesta
ordem, podem ocorrer de quatro formas: + +, +−, −+ e − −. No primeiro caso,
{ϕ, ψ, ξ} é um atlas coerente. No segundo caso, invertemos a orientação de ϕ, no
terceiro a de ξ e, no quarto, a de ψ, para termos um atlas coerente em M , a qual é
portanto uma superfı́cie orientável.
4.2. Seja [u, v, w] ∈ M representada por seus vetores-coluna u, v, w ∈ R3 .Temos
M = U ∪ V ∪ W , onde [u, v, w] pertence a U , a V ou a W conforme sua primeira,
segunda ou terceira coluna seja 6= 0. Pondo U0 = {(u, s, t) ∈ R5 ; u = (x, y, z) 6=
0, s, t ∈ R}, definamos as parametrizações ϕ : U0 → U , ψ : U0 → V e ξ : U0 → W por
ϕ(u, s, t) = (u, su, tu), ψ(u, s, t) = (su, u, tu) e ξ(u, s, t) = (su, tu, u). As mudanças
de parametrização são dadas por (ψ −1 ◦ ϕ)(u, s, t) = (su, 1/s, t/s), (ξ −1 ◦ ϕ)(u, s, t) =
(tu, 1/t, s/t) e (ξ −1 ◦ ψ)(u, s, t) = (tu, s/t, 1/t). Um cálculo simples mostra que os
determinantes jacobianos desses difeomorfismos são respectivamente iguais a −1, 1,
e −1. Pelo exercı́cio anterior, concluı́mos que M é orientável.
f as parametrizações em
4.3. Sejam Φ : V0 × Rm → Ve e Ψ : W0 × Rm → W
T M definidas, como na solução do Exercı́cio 2.2, pag. 143, a partir das parametrizações ϕ : V0 → V , ψ : W0 → W em M , onde V ∩ W 6= ∅. Pondo ξe =
ψ −1 ◦ Φ, temos, para cada x ∈ ϕ−1 (V ∩ W ) e cada u = (α1 , . . . , αm ) ∈ Rm :
e u) = (ϕ−1 ◦ ϕ)(x), (ψ −1 ◦ ϕ)′ (x) · u) = (ξ(x), ξ ′ (x) · u), onde ξ = ψ −1 ◦ ϕ. Ou
ξ(x,
m
e α1 , . . . , αm ) = ξ(x), P αk ∂ξ (x) . Daı́ resulta que as colunas da maseja: ξ(x,
∂x
k
k=1
m
∂ξ P
∂2ξ ∂ ξe
e
αk
=
,
triz jacobiana J ξ(x) ∈ M (2m × 2m) são os vetores
∂xj
∂xj k=1
∂xj ∂xk
∂ ξe
∂ξ e
= 0,
. Como as colunas da matriz jacobiana Jξ são os m vetores
∂αj
∂xj
Jξ 0
e
∂ξ/∂xj , segue-se que J ξ =
, onde os 4 blocos são matrizes m × m. Portanto
∗ Jξ
2
det . J ξe = (det Jξ) > 0 e a superfı́cie T M é orientável.
Quanto ao fibrado normal νM , sua orientabilidade se prova considerando o atlas A, formado pelas parametrizações Φ : V0 × Rn−m → Ve ⊂ νM , associadas a
parametrizações ϕ : V0 → V ⊂ M para as quais existem n − m campos de vetores v1 , . . . , vn−m : V → Rn , de classe C k−1 e linearmente independentes. (M é
de classe C k .) A parametrização Φ é definida como na solução do Exercı́cio 2.3,
pag. 143. Para que se tenha Φ ∈ A, exigiremos que, para todo x ∈ V0 , os vetores
∂ϕ
∂ϕ
(x), . . . ,
(x), v1 (ϕ(x)), . . . , vn−m (ϕ(x)) formem uma base positiva do espaço
∂x1
∂xm
n
R , isto é, que a matriz n × n que os tem como colunas tenha determinante positivo.
Então o atlas A é coerente e νM é orientável.
Observação. Os leitores familiares com a vizinhança tubular de uma superfı́cie
200
Soluções dos exercı́cios
Cap. 10
reconhecerão que νM é orientável porque é difeomorfo a um aberto de Rn .
4.4. As colunas da matriz jacobiana de f são (2x, y, z, 0), (−2y, x, 0, z) e (0, 0, x, y).
Dois subdeterminantes 3 × 3 são 2x(x2 + y 2 ) e 2y(x2 + y 2 ). Logo f ′ (p) : R3 → R3
é injetiva para todo p ∈ S 2 , exceto p0 = ±(0, 0, 1). Nestes dois pontos, tem-se
f ′ (p0 ) · e1 = ±e3 e f ′ (p0 ) · e2 = ±e4 . Assim, f ′ (p0 ) é injetiva no plano gerado por
e1 e e2 , que é o plano tangente a S 2 no ponto p0 , logo é a imagem ϕ′ (x0 ) · R2 ,
onde ϕ é qualquer parametrização de uma vizinhança de p0 em S 2 , com ϕ(x0 ) = p0 .
Portanto, se ϕ : V0 → V é uma parametrização arbitrária de V ⊂ S 2 , a composta
f ◦ ϕ : V0 → P = f (S 2 ) é uma imersão. Além disso, como f (p) = f (q), com p, q ∈ S 2 ,
só ocorre quando q = ±p, se V não contém pontos antı́podas, a imersão f ◦ ϕ é
injetiva. Para concluir que f ◦ ϕ é uma parametrização (e portanto que P é uma
superfı́cie), resta apenas provar que a imagem f (A) de todo aberto A ⊂ S 2 é um
aberto em P , ou seja, que F = P − f (A) é fechado (em P ou em R4 , tanto faz, pois P
é compacto, logo fechado). Por simplicidade (e conveniência), passaremos a escrever
f significando f |S 2 , isto é, o domı́nio de f agora é S 2 . Então, como A ∪ (−A), onde
−A = {−x; x ∈ A} é aberto em S 2 , temos f −1 (F ) = S 2 −f −1 (f (A)) = S 2 −[A∪(−A)],
logo f −1 (F ) é fechado em S 2 , portanto compacto. Como f : S 2 → P é sobrejetiva,
vale f f −1 (F ) = F . Então F é compacto, logo fechado, como imagem por f do
compacto f −1 (F ). Isto conclui a verificação de que P é uma superfı́cie C ∞ . Resta
mostrar que P não é orientável. Isto pode ser feito observando que todo aberto numa
superfı́cie orientável é também uma superfı́cie orientável mas P contém uma faixa de
Moebius, imagem por f do conjunto X = {(x, y, z) ∈ S 2 ; −1/2 < z < 1/2, y ≥ 0}.
6.1. Basta observar
queh ∈ C ∞ e que a aplicação inversa, g : R2 − {0} → S 1 × R,
z
dada por g(z) =
, ℓn|z| , também é de classe C ∞ .
|z|
6.2. Para obter um difeomorfismo de S 1 × S 1 sobre uma superfı́cie em R3 , tome
a composta S 1 × S 1 → S 1 × R2 → (S 1 × R) × R → (R2 − {0}) × R → R2 × R = R3 . No
caso geral, admita por indução que exista um difeomorfismo (S 1 )n−1 → Rn do toro
(n − 1)-dimensional sobre uma hiperfı́cie em Rn . Então tome a composta (S 1 )n =
S 1 × (S 1 )n−1 → S 1 × Rn → (S 1 × R) × Rn−1 → R2 × Rn−1 → Rn+1 onde as setas
têm significados óbvios.
6.3. Seja B um atlas coerente em N . Considere o conjunto A das parametrizações
ϕ : V0 → V ⊂ M tais que V é conexo, f |V é um difeomorfismo de V sobre um aberto
W ⊂ N e a parametrização f ◦ϕ : V0 → W é compatı́vel com todas as parametrizações
ξ ∈ B. Então A é um atlas em M . (Se f ◦ϕ não for compatı́vel com toda ξ ∈ B, inverta
a orientação de ϕ.) O atlas A é coerente porque ψ, ϕ ∈ A ⇒ ψ −1 ◦ϕ = (f ◦ψ)−1 ◦(f ◦ϕ).
6.4. Dados x, y ∈ G arbitrários, temos f (x · y) = f (x) · f (y). Isto pode ser escrito
como f ◦λx = λf (x) ◦f , usando as translações à esquerda λx : G → G e λf (x) : H → H,
definidas por λx (g) = xg e λf (x) (h) = f (x)·h. Note que λx e λf (x) são difeomorfismos,
cujos inversos são λx−1 e λf (x)−1 . Para quaisquer p, q ∈ G, pondo x = q ·p−1 , a Regra
da Cadeia, aplicada a f ◦ λx = λf (x) ◦ f , nos dá f ′ (q) · λ′x = λ′f (x) · f ′ (p). Como λ′x e
λ′f (x) são, em cada ponto, isomorfismos lineares, concluı́mos que f ′ (p) : Tp G → Tf (p) H
e f ′ (q) : Tq G → Tf (q) H têm o mesmo posto.
Seção 8
8
Integrais múltiplas
201
Integrais múltiplas
−
R
1.1. Seja I = A f (x)dx. Não se pode ter J < I, pois, como I ≤ S(f ; P ), isto
implicaria que S(f ; P ) − J ≥ I − J para toda partição P do bloco A. Tampouco pode
ser I < J pois, fixando um número L com I < L < J, existiria uma partição Q do
bloco A tal que I ≤ S(f ; Q) < L < J. Então, para qualquer P0 , a partição P = P0 ∪Q
refinaria Q, logo S(f ; P ) ≤ S(f ; Q) e daı́ J − S(f ; P ) ≥ J − S(f ; Q) ≥ J − L, embora
P refinasse P0 . Segue-se que I = J.
1.2. Sejam Σ o conjunto das somas superiores S(f ; P ), relativas a todas as
partições P do bloco A e Σ0 ⊂ Σ o conjunto das somas superiores relativas às partições
que refinam P0 . Para toda P tem-se S(f ; P ∪ P0 ) ∈ Σ0 e S(f ; P ∪ P0 ) ≤ S(f ; P ).
−
R
Logo inf Σ0 = inf Σ = A f (x)dx. Analogamente para a integral inferior.
P 1.3. Dado ε > 0, existe uma partição P = P1 × · · · × Pn do bloco A tal que
wB · vol B < ε. O valor do somatório à esquerda não aumenta quando se refina
B∈P
a partição P . Seja C = Π[ci , di ] ⊂ A. Para cada i = 1, . . . , n escrevamos Qi =
Pi ∪ {ci , di }. Isto nos dá uma partição Q = Q1 × · · · × Qn de A que refina P e,
além
de Q contidos em C constituem uma partição Q′ de C. Então
P
P disso, os blocos
′
ωB · vol B < ε pois as parcelas de ambos somatórios são ≥ 0
ωB ′ · vol B ≤
B∈Q
B ′ ∈Q′
e as da esquerda estão incluı́das entre as da direita. Segue-se que fC é integrável.
n
Q
1.4. Seja A = [a1 , b1 ] × A′ , com c ∈ [a1 , b1 ] e A′ =
[ai , bi ]. Dado ε > 0, seja
i=2
I ⊂ [a1 , b1 ] um intervalo contendo c, tal que vol(I × A′ ) < ε/2K, onde K = M − m
e m ≤ f (x) ≤ M para todo x ∈ A e, além disso, c ∈ int .I se c ∈ (a1 , b1 ). Vemos que
I × A′ é bloco de uma partição P0 de A. Seja P uma partição de A que refina P0 .
Designaremos por B ′ os blocos de P contidos em I × A′ . Nos demais blocos de P ,
que chamaremos de B ′′ , a função f é contı́nua, logo podemos tomar P de modo que
ωB ′′ < ε/2 vol A para todo B ′′ . Então
X
X
X
ωB · vol B =
ωB ′ · vol B ′ +
ωB ′′ · vol B ′′
B∈P
B′
B ′′
′
< K · vol(I × A ) + (ε/2 vol(A)) · vol A <
ε
ε
+ = ε.
2
2
2.1 Para toda partição P do bloco A, o gráfico de f está contido na reunião dos
blocos (n + 1)-dimensionais B × [mB , MB ], B ∈ P . O volume de cada um desses
blocos é igual a ωB · vol B . A P
integrabilidade de f assegura que, para todo ε > 0,
ωB · vol B < ε. Isto nos diz que o gráfico de f tem
existe uma partição P tal que
B∈P
medida nula.
n
Q
2.2. Seja A =
[ai , bi ]. Dada uma cobertura A ⊂ ∪Bk por blocos fechados, pelo
i=1
Teorema 3, podemos supor que os interiores dos Bk cobrem A e, por Borel-Lebesgue,
que a cobertura é finita. Para cada i = 1, . . . , n, seja Pi a partição do intervalo [ai , bi ]
formada pelos pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Bk
que estejam contidas em [ai , bi ]. A partição P = P1 ×P
· · · × Pn tem cada um dos seus
vol B = vol A. Logo não se
blocos contido em algum Bk , portanto Σ vol Bk ≥
B∈P
tem med.A = 0. Segue-se daı́ que todo conjunto de medida nula tem interior vazio.
202
Soluções dos exercı́cios
Cap. 10
2.3. Considere a aplicação f : M ×N → Rp , de classe C 1 , dada por f (x, y) = y−x.
A fim de que v ∈ Rp pertença à imagem f (M ×N ) é necessário e suficiente que existam
x ∈ M e y ∈ N tais que v = y − x, ou seja, y = x + v. Isto significa que f (M × N ) =
{v ∈ Rp ; (M + v) ∩ N 6= ∅}. Ora, como dim(M × N ) = dim M + dim N < p, a
imagem f (M × N ) tem medida nula em Rp , portanto tem interior vazio, isto é, seu
complementar é denso em Rp . Se M e N são compactas então f (M × N ) é compacto,
logo seu complementar, além de denso, é aberto.
2.4. Defina a parte positiva f+ : A → R e a parte negativa f− : A → R da função
f pondo, para cada x ∈ A, f+ (x) = max{f (x), 0} e f− (x) = − min{f (x), 0}. Assim,
f+ (x) = f (x) quando f (x) ≥ 0 e f+ (x) = 0 quando f (x) < 0. Por sua vez, f− (x) =
−f (x) quando f (x) ≤ 0 e f− (x) = 0 se f (x) > 0. Então f+ (x) = (f (x) + |f (x)|)/2 e
f− (x) = (|f (x)| − f (x))/2. Estas igualdades mostram que f+ e f− são contı́nuas em
todos os pontos em que f é contı́nua, portanto f integrável implica f+ e f− integráveis.
Além disso, é claro que f = f+ − f− e que f+ e f− são ambas não-negativas.
3.1. O conjunto dos pontos de descontinuidade de f é a reunião das faces próprias
de B, portanto tem medida nula e f é integrável. Além disso, se considerarmos uma
partição P0 de A que contenha B então, para toda partição P do bloco
A que refine P0 ,
R
tem-se s(f ; P ) = vol B = S(f ; P ). Segue-se do exercı́cio 1.2 que A f (x)dx = vol B.
3.2. X é a interseção do compacto [0, 1] como complementar do aberto ∪Jk ,
logo é compacto. Após cada etapa da construção de X, cada intervalo que resta tem
comprimento menor do que a metade do comprimento dos intervalos que restaram
da etapa anterior, logo X não contém intervalos, ou seja, int .X = ∅. Os extremos
dos intervalos omitidos pertencem a X e todo ponto x0 ∈ X, na n-ésima etapa do
processo, pertencia ao interior de um intervalo cujo comprimento tendia a zero quando
n → ∞, os extremos do qual pertencem a X, logo x0 é ponto de acumulação de X, ou
seja, X não possui pontos isolados. Finalmente, se |Jk | é o comprimento do intervalo
Jk então Σ|Jk | = Σan = 1 − δ. Dada qualquer cobertura enumerável X ⊂ ∪Ir por
intervalos abertos Ir , temos [0, 1] ⊂ (∪Ir ) ∪ (∪Jk ). A solução do exercı́cio 2.2 acima
nos dá Σ|Ir | + Σ|Jk | ≥ 1, donde Σ|Ir | ≥ δ. Logo X não tem medida nula.
3.3. Com aR notação do Teorema 9, seja ξ = ψ − ϕ : A1 → R. A função ξ é
integrável, com A1 ξ(x)dx = 0 e ξ(x) ≥ 0. Para todo k ∈ N, mostremos que Xk =
S
Xk tem medida
{x ∈ A1 ; ξ(x) ≥ 1/k} tem medida nula. Daı́ resultará que X =
k∈N
nula, com fx : A2 → R integrável para todo x ∈ A1P
− X. Ora, dado arbitrariamente
MB · vol B < ε/k. Indiquemos
ε > 0, existe uma partição P do bloco A1 tal que
B∈P
com B ′ os blocos de P tais que MB ′ ≥ 1/k. Então Xk está contido na reunião dos
blocos B ′ e
X
1
1
Σ vol B ′ = Σ · vol B ′ ≤ ΣMB ′ · vol B ′ ≤
MB · vol B < ε/k.
k
k
B∈P
Multiplicando por k, vem Σ vol B ′ < ε, logo med.Xk = 0
3.4. O complementar de um conjunto de medida nula, sendo denso, possui pontos
em todo intervalo.
Logo, se f (x) ≥ 0 para todo x ∈ A, tem-se mB =
R 0, donde
P
mB ·vol B = 0 seja qual for a partição P do bloco A. Então f (x)dx =
s(f ; P ) =
B∈P
−A
R
0 e, como f é integrável, A f (x)dx = 0. No caso geral, f é a diferença de
R duas funções
integráveis não-negativas, cada uma das quais tem integral nula, logo A f (x)dx = 0.
Seção 9
Mudança de variáveis
203
4.1 Isto resulta diretamente do exercı́cio 3.1.
4.2. Porque sua fronteira S(a; r) é uma superfı́cie C ∞ de dimensão n − 1 no
espaço Rn , logo tem medida nula.
4.3. O interior U de um conjunto J-mensurável X é também J-mensurável em
virtude do Teorema 10, pois fr .U ⊂ fr .X. Além disso, como fr .X tem volume nulo e
a reunião X = U ∪ (X ∩ fr .X) é disjunta, tem-se vol .X = vol .U + vol .(X ∩ fr .X) =
vol .U .
P
mB · vol B =
4.4. Para toda partição P do bloco A, tem-se s(f ; P ) =
B∈P
P
P
P
vol B ′′ ,
MB · vol B =
vol B ′ , onde B ′ = B × [0, mB ], e S(f ; P ) =
B∈P
B∈P
B∈P
S
S
B ′′ , s(f ; P ) ≤
B ′ ⊂ C(f ) ⊂
onde B ′′ = B × [0, MB ]. Evidentemente,
B∈P
B∈P
vol . int .C(f ) ≤ volR.ext C(f )≤S(f ; P ). Portanto f integrável implica C(f ) J-mensurável e vol C(f ) = A f (x)dx.
9
Mudança de variáveis
1. Uma observação preliminar: se f : B(a; r) → R é contı́nua, com m(r) =
inf{f (x); x ∈ B(a; r)} e M (r) = sup{f (x); x ∈ B(a; r)} então f (a) = lim m(r) =
r→0
lim M (r) e m(r) ≤ f (x) ≤ M (r) para todo x ∈ B(a; r). Segue-se daı́ que
r→0
m(r) ≤
1
vol B(a; r)
Z
B(a;r)
f (x)dx ≤ M (r),
portanto
Z
1
f (x)dx = f (a).
r→0 vol B(a; r) B(a;r)
R
R
Dito isto, vemos que vol ·f (B(a; r)) = f (B(a;r)) 1·dy = B(a;r) | det ·f ′ (x)|dx, portanto
lim
lim
r→0
vol .f (B(a; r))
= | det .f ′ (a)|.
vol .B(a; r)
2. A solução deste exercı́cio se faz com o uso imediato do Teorema da Mudança
de Variáveis, juntamente com a observação que precede o Teorema 4 do Capı́tulo 7,
sobre o produto vetorial.
Referências Bibliográficas
[1] E.L. Lima. Análise Real, vol. 1. (Sétima edição.) Coleção Matemática Universitária, IMPA, 2004.
[2] E.L. Lima. Curso de Análise, vol. 1. (Décima primeira edição.)
Projeto Euclides, IMPA, 2004.
[3] E.L. Lima. Curso de Análise, vol. 2. (Sexta edição.) Projeto
Euclides, IMPA, 2000.
[4] E.L. Lima. Álgebra Linear. (Sexta edição.) Coleção Matemática
Universitária, IMPA, 2003.
[5] E.L. Lima. Análise no Espaço Rn . Coleção Matemática Universitária, IMPA, 2001.
[6] S. Lang. Undergraduate Analysis. Springer Verlag, N. York, 1983.
(Em inglês.)
[7] Th. Bröcker. Analysis II. BI-Wiss.-Verlag. Mannheim, 1992. (Em
alemão.)
As cinco primeiras referências são citadas no texto, especialmente a
primeira, da qual este livro é o prosseguimento. As duas últimas são
obras que se destacam entre as congêneres: o livro de Lang, por sua
caracterı́stica objetividade; o de Bröcker por ter sabido, com êxito, conciliar elegância, clareza e concisão. Os capı́tulos IV e VII da referência
3, que tratam do que se poderia chamar uma versão moderna da Análise
Vetorial clássica, podem formar uma continuação natural dos temas aqui
tratados.
Índice Remissivo
Índice Remissivo
i-ésima coordenada, 1
i-ésima derivada parcial, 55
i-ésima variável, 55
i-convexo, 81
Campo de vetores normais, 91,
132
Cisão, 27
Classe C k , 41, 43, 57, 100
Co-dimensão, 127
Cobertura, 18
Combinação convexa, 75
Componente conexa, 32
Comprimento, 3, 48
Conjunto
aberto, 8
compacto, 16
conexo, 28
conexo por caminhos, 31
convexo, 7
de nı́vel, 62
denso, 14
discreto, 14
fechado, 12
horizontalmente convexo, 81
limitado, 6
verticalmente convexo, 81
Constante de Lipschitz, 24
Contração, 25
Critério de Cauchy, 12
Cubo, 18
n-dimensional, 148
Curva, 62, 87, 126
Aplicação
aberta, 112
contı́nua, 20
lipschitziana, 24
uniformente contı́nua, 24
Arestas, 148
Atlas, 133
coerente, 133
Base associada a uma parametrização, 130
Bloco n-dimensional, 148
Blocos de uma partição, 149
Bola
aberta, 5
fechada, 5
Caminho, 30
justaposto, 31
poligonal, 32
regular, 51
retificável, 48
retilı́neo, 30
uniformemente diferenciável,
47
Decomposição, 166
207
208
pontilhada, 169
Delta de Kronecker, 90
Derivada, 41, 142
à direita, 42
à esquerda, 42
de Gâteux, 77
de uma aplicação, 98
direcional, 60, 98
parcial, 121
segunda, 109
Desigualdade
de Hadamard, 97
do valor médio, 44, 107
Diâmetro, 18
Difeomorfismo, 111, 143
admissı́vel, 177
local, 112
primitivo, 175
difeomorfismo local, 143
Diferenciável, 41, 98
Diferencial, 101
Disco, 5
Distância, 5, 16
intrı́nseca, 54
Elipsóide, 90
Equações de Cauchy-Riemann, 103
Esfera, 5
Espaço
euclidiano n-dimensional, 1
vetorial tangente, 88, 129
Extensão radial, 109
Fórmula de Taylor, 69
Face, 148
Fecho, 12
Fibrado
normal, 146
tangente, 146
Índice Remissivo
Fluxo, 180
Forma local das submersões, 117
Forma quadrática, 70, 90
hessiana, 71
não-negativa, 70
não-positiva, 70
negativa, 70
positiva, 70
Fronteira, 9
Função
côncava, 75
caracterı́stica, 162
convexa, 75
de Urysohn, 38
harmônica, 82
integrável, 151, 164
limitada, 6, 10
quase-convexa, 83
Função-coordenada, 19
Gradiente, 60
Grau, 172
Grupo unimodular, 91
Hélice, 52
Hiperfı́cie, 87
Homeomorfismo, 26
Imersão, 124
Integral, 151
inferior, 150
superior, 150
Interior, 7
Invertendo a orientação, 199
Lagrangiana, 95
Limite, 10, 45, 169
lateral, 34
Linha de nı́vel, 62
Índice Remissivo
Máximo local, 71
Máximo ou mı́nimo estrito, 73
Mı́nimo local, 71
Matriz
hessiana, 66
jacobiana, 98
Medida n-dimensional nula, 152
Mudança de parametrização, 128
Multiplicador de Lagrange, 92
Multiplicadores de Lagrange, 140
Número de Lebesgue, 178
Nı́vel
crı́tico, 89
regular, 89
Norma, 3, 4, 25, 45, 107, 166
euclidiana, 4
Oscilação, 151
num ponto, 157
Parametrização, 125
Parametrizações compatı́veis, 133
Parte
negativa, 202
positiva, 202
Partição, 45, 149
pontilhada, 45
Plano projetivo, 147
Ponto
aderente, 12
crı́tico, 64, 139
da restrição, 91
não-degenerado, 117
de acumulação, 14
isolado, 14
Produto vetorial, 134
Projeção estereográfica, 26
Quádrica, 90
209
Raiz
quadrada de uma matriz, 116
simples, 122
Refinamento, 45, 149
Regra da Cadeia, 45, 103
Reparametrização, 51
Reta tangente, 42
Seqüência, 10
convergente, 10
de Cauchy, 12
Soma
de Riemann, 45, 169
inferior, 149, 166
superior, 166
superior, 149
Subcobertura, 18
Submersão, 119
Subseqüência, 10
Superfı́cie, 87, 126
de nı́vel, 62
orientável, 91, 133
Teorema
da Alfândega, 30
da aplicação inversa, 115
da derivação sob o sinal de
integral, 66
da diferenciabilidade uniforme,
47, 107
da função implı́cita, 84
da integração repetida, 160
da permanência
da desigualdade, 36
da permanência do sinal, 34
das funções implı́citas, 119
de Bolzano-Weierstrass, 11
de Borel-Lebesgue, 18
210
de Lebesgue (condição de integrabilidade), 157
de Lindelöf, 156
de Pitágoras, 3
de Schwarz, 67
de Weierstrass, 21
do valor médio, 61
fundamental do cálculo, 46
Toro m-dimensional, 126
Vértices, 148
Valor
de aderência, 37
médio, 53
regular, 89, 130
Valores singulares, 141
Vertical, 117
Vetor-velocidade, 41
Vizinhança, 7
parametrizada, 126
Volume
n-dimensional, 148, 163
externo, 162
interno, 162
Índice Remissivo
Download