Uploaded by Giulio Altomari

Math for CS (M. Campiti)

advertisement
Michele Campiti
Analisi Matematica
elementi principali della teoria
y
f
1
g
0
x
a.a. 2011-2012
Per i corsi di “Analisi Matematica I & II ” della Facoltà di Ingegneria, Università del
Salento
In copertina: Grafico delle funzioni f (x) := exp(x) e g(x) := sin x
Prefazione
Il presente testo contiene gli elementi principali della teoria dei corsi di Analisi Matematica I e II ed è indirizzato principalmente agli studenti dei Corsi
di Laurea in Scienze ed Ingegneria. In diversi capitoli è stato privilegiato l’obiettivo della sintesi degli argomenti trattati, e diverse parti della teoria sono
state introdotte in modo da basare l’esposizione su un numero abbastanza
contenuto di definizioni di base. Sono stati spesso anche utilizzati strumenti
intuitivi, soprattutto per ciò che riguarda gli argomenti introduttivi quali la
teoria degli insiemi, gli insiemi numerici e la topologia degli spazi euclidei.
Tuttavia il presente testo non è concepito come un mero testo di calcolo;
gli elementi della teoria sono stati esposti in modo da favorire la formazione
scientifica degli studenti e da incentivare l’interesse verso un’analisi critica
dei problemi posti. L’acquisizione di nuove nozioni è basata sull’utilizzo di
quelle già apprese in modo da favorire il progressivo approfondimento dei
risultati esposti.
Sono ovviamente graditi suggerimenti e segnalazioni di errori da far pervenire preferibilmente per e-mail all’indirizzo: michele.campiti@unisalento.it.
Michele Campiti
Indice
I
Funzioni di una variabile reale
1
1 Preliminari
1.1 Cenni di calcolo proposizionale . . . . . . . . . . . .
1.1.1 Connettivi logici . . . . . . . . . . . . . . . .
1.1.2 Quantificatori . . . . . . . . . . . . . . . . . .
1.1.3 Notazioni insiemistiche . . . . . . . . . . . . .
1.1.4 Prodotto cartesiano e relazioni tra elementi
insiemi . . . . . . . . . . . . . . . . . . . . . .
1.2 Relazioni funzionali e funzioni . . . . . . . . . . . . .
1.2.1 Immagini dirette e immagini reciproche . . .
1.2.2 Funzioni iniettive, suriettive e biiettive . . . .
1.2.3 Funzioni composte e funzioni inverse . . . . .
. . . .
. . . .
. . . .
. . . .
di due
. . . .
. . . .
. . . .
. . . .
. . . .
.
.
.
.
.
12
17
19
21
23
2 Cenni sugli insiemi numerici
2.1 L’insieme dei numeri naturali e dei numeri interi
2.1.1 Principio di induzione . . . . . . . . . . .
2.1.2 Formula del binomio di Newton . . . . . .
2.1.3 Cenni di calcolo combinatorio . . . . . . .
2.2 L’insieme dei numeri razionali e reali . . . . . . .
2.2.1 Insiemi numerabili . . . . . . . . . . . . .
2.3 Proprietà dei sottoinsiemi di R . . . . . . . . . .
2.3.1 Intervalli di R . . . . . . . . . . . . . . . .
2.3.2 Valore assoluto e distanza in R . . . . . .
2.3.3 Rappresentazione geometrica di Rn , n ≤ 3
2.3.4 Sottoinsiemi limitati ed estremi . . . . . .
2.3.5 Intorni e punti di accumulazione . . . . .
2.3.6 La retta ampliata dei numeri reali . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
29
31
32
34
36
39
41
41
42
44
47
50
50
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
. 5
. 5
. 9
. 11
Indice
iv
3 Numeri complessi e polinomi
3.1 Proprietà generali dei numeri complessi . . .
3.2 Richiami di trigonometria e coordinate polari
3.2.1 Coordinate polari . . . . . . . . . . . .
3.3 Forma trigonometrica dei numeri complessi .
3.4 Forma esponenziale dei numeri complessi . .
3.5 Polinomi ed equazioni algebriche . . . . . . .
3.5.1 Polinomi e relative radici . . . . . . .
3.5.2 Polinomi a coefficienti reali . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
53
57
62
64
67
68
68
73
4 Funzioni reali
4.1 Operazioni con le funzioni reali . . . . . . . . . . . . .
4.2 Estremi di funzioni reali . . . . . . . . . . . . . . . . .
4.3 Proprietà di monotonia . . . . . . . . . . . . . . . . .
4.4 Proprietà di simmetria e periodicità . . . . . . . . . .
4.5 Successioni . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Numero di Nepero . . . . . . . . . . . . . . . .
4.6 Funzioni elementari . . . . . . . . . . . . . . . . . . . .
4.6.1 Funzioni potenza ad esponente intero positivo .
4.6.2 Funzioni radice . . . . . . . . . . . . . . . . . .
4.6.3 Funzione potenza ad esponente intero negativo
4.6.4 Funzioni potenza ad esponente razionale e reale
4.6.5 Funzioni esponenziali e logaritmiche . . . . . .
4.6.6 Funzioni trigonometriche . . . . . . . . . . . .
4.6.7 Funzioni trigonometriche inverse . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
77
81
83
87
88
89
91
91
92
94
96
97
101
103
5 Equazioni e disequazioni
5.1 Equazioni e disequazioni razionali intere . .
5.2 Equazioni e disequazioni razionali fratte . .
5.3 Sistemi di equazioni e disequazioni . . . . .
5.4 Equazioni e disequazioni irrazionali . . . . .
5.5 Equazioni e disequazioni con valore assoluto
5.6 Metodo grafico . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
109
109
112
114
116
119
122
.
.
.
.
.
.
.
127
. 127
. 129
. 132
. 134
. 135
. 141
. 143
6 Limiti delle funzioni reali
6.1 Definizione generale di limite .
6.2 Prime proprietà dei limiti . . .
6.3 Limiti destri e sinistri . . . . .
6.4 Teoremi di confronto . . . . . .
6.5 Operazioni sui limiti . . . . . .
6.6 Limiti delle funzioni monotone
6.7 Limiti delle funzioni elementari
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Indice
v
6.7.1 Funzioni potenza ad esponente intero positivo .
6.7.2 Funzioni radice . . . . . . . . . . . . . . . . . .
6.7.3 Funzioni potenza ad esponente intero negativo
6.7.4 Funzioni potenza ad esponente reale . . . . . .
6.7.5 Funzioni esponenziali . . . . . . . . . . . . . . .
6.7.6 Funzioni logaritmo . . . . . . . . . . . . . . . .
6.7.7 Funzioni trigonometriche . . . . . . . . . . . .
6.7.8 Funzioni trigonometriche inverse . . . . . . . .
6.8 Limiti di polinomi e funzioni razionali . . . . . . . . .
6.9 Limiti notevoli . . . . . . . . . . . . . . . . . . . . . .
6.10 Infinitesimi ed infiniti . . . . . . . . . . . . . . . . . .
6.10.1 Operazioni con infinitesimi ed infiniti . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
144
144
145
145
145
146
146
147
147
149
154
157
7 Successioni e serie numeriche
7.1 Limiti di successioni . . . . . . . . . . . . . . .
7.1.1 Successioni estratte . . . . . . . . . . . .
7.1.2 Massimo e minimo limite . . . . . . . .
7.1.3 Criterio di convergenza di Cauchy . . .
7.1.4 Massimo e minimo limite per le funzioni
7.2 Serie numeriche . . . . . . . . . . . . . . . . . .
7.2.1 Definizioni e proprietà preliminari . . .
7.2.2 Serie a termini positivi . . . . . . . . . .
7.2.3 Serie alternanti . . . . . . . . . . . . . .
7.2.4 Proprietà algebriche . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
163
163
171
172
176
177
179
180
183
190
192
8 Funzioni continue
8.1 Definizioni e proprietà preliminari . . . . . . .
8.2 Funzioni continue su intervalli chiusi e limitati
8.3 Continuità delle funzioni monotone . . . . . . .
8.4 Funzioni uniformemente continue . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
197
197
201
205
207
.
.
.
.
.
.
.
.
211
211
211
217
221
227
230
230
237
9 Calcolo differenziale
9.1 Funzioni derivabili . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Definizioni ed interpretazione geometrica . . . . . .
9.1.2 Regole di derivazione . . . . . . . . . . . . . . . . . .
9.1.3 Derivate delle funzioni elementari . . . . . . . . . . .
9.2 Teoremi di Rolle, Cauchy e Lagrange . . . . . . . . . . . . .
9.3 Applicazioni al calcolo dei limiti . . . . . . . . . . . . . . . .
9.3.1 Teoremi di L’Höpital . . . . . . . . . . . . . . . . . .
9.3.2 Formula di Taylor . . . . . . . . . . . . . . . . . . .
9.3.3 Simboli di Landau e applicazioni della formula di Taylor al calcolo dei limiti . . . . . . . . . . . . . . . . .
. 244
Indice
vi
9.4
Applicazioni allo studio del grafico delle funzioni reali . .
9.4.1 Monotonia e massimi e minimi relativi ed assoluti
9.4.2 Convessità, concavità e flessi . . . . . . . . . . . .
9.4.3 Asintoti . . . . . . . . . . . . . . . . . . . . . . . .
9.4.4 Studio del grafico di una funzione reale . . . . . .
.
.
.
.
.
10 Calcolo integrale
10.1 L’integrale secondo Riemann . . . . . . . . . . . . . . . . .
10.1.1 Suddivisioni di un intervallo . . . . . . . . . . . . . .
10.1.2 Integrabilità delle funzioni limitate . . . . . . . . . .
10.1.3 Interpretazione geometrica e proprietà dell’integrale
esteso . . . . . . . . . . . . . . . . . . . . . . . . . .
10.1.4 Primitive ed integrale indefinito . . . . . . . . . . . .
10.1.5 Integrali indefiniti immediati . . . . . . . . . . . . .
10.1.6 Prime regole di integrazione . . . . . . . . . . . . . .
10.2 Integrazione delle funzioni razionali . . . . . . . . . . . . . .
10.2.1 Caso m = 1 . . . . . . . . . . . . . . . . . . . . . . .
10.2.2 Caso m = 2 . . . . . . . . . . . . . . . . . . . . . . .
10.2.3 Caso m > 2 . . . . . . . . . . . . . . . . . . . . . . .
10.3 Integrali impropri . . . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Integrali impropri di funzioni non limitate . . . . . .
10.3.2 Integrali impropri su intervalli non limitati . . . . .
.
.
.
.
.
246
246
254
262
265
271
. 271
. 271
. 272
.
.
.
.
.
.
.
.
.
.
.
278
281
286
288
290
291
291
292
294
294
301
II Equazioni differenziali e funzioni di più variabili
reali
309
11 Successioni e serie di funzioni
11.1 Convergenza puntuale ed uniforme . . . . . . . . .
11.2 Proprietà del limite di una successione di funzioni .
11.3 Serie di funzioni . . . . . . . . . . . . . . . . . . . .
11.4 Serie di potenze . . . . . . . . . . . . . . . . . . . .
11.5 Serie ottenute per derivazione ed integrazione . . .
11.6 Serie di Taylor . . . . . . . . . . . . . . . . . . . .
11.6.1 Funzione esponenziale . . . . . . . . . . . .
11.6.2 Funzione logaritmo . . . . . . . . . . . . . .
11.6.3 Funzioni seno e coseno . . . . . . . . . . . .
11.6.4 Funzione arcotangente . . . . . . . . . . . .
11.6.5 La serie binomiale . . . . . . . . . . . . . .
11.6.6 La funzione arcoseno . . . . . . . . . . . . .
11.7 Serie di Fourier . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
313
313
315
319
324
329
330
332
333
333
334
334
337
337
Indice
12 Calcolo differenziale in più variabili
12.1 Cenni sulla struttura metrica di Rn . . . . . . .
12.1.1 Prodotti scalari e norme . . . . . . . . .
12.1.2 Sfere ed insiemi aperti e chiusi . . . . .
12.1.3 Intervalli, rette e direzioni di Rn . . . .
12.2 Funzioni di più variabili . . . . . . . . . . . . .
12.3 Derivate direzionali e parziali e differenziabilità
12.3.1 Funzioni lineari . . . . . . . . . . . . . .
12.3.2 Derivate direzionali e parziali . . . . . .
12.3.3 Differenziabilità . . . . . . . . . . . . . .
12.3.4 Derivate successive e formula di Taylor .
12.3.5 Differenziabilità delle funzioni composte
12.4 Punti di massimo e minimo relativo . . . . . .
12.5 Massimo e minimo assoluto . . . . . . . . . . .
12.6 Massimi e minimi vincolati . . . . . . . . . . .
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
343
343
343
349
351
353
356
357
358
360
368
372
374
378
380
13 L’integrale di Riemann in Rn
13.1 Cenni sulla teoria della misura di Peano-Jordan in Rn .
13.2 Cenni sull’integrale di Riemann in Rn . . . . . . . . . .
13.2.1 Integrazione su domini normali . . . . . . . . . .
13.2.2 Cambiamento di variabile negli integrali multipli
.
.
.
.
.
.
.
.
.
.
.
.
383
383
388
391
395
14 Curve, campi vettoriali e superfici
14.1 Curve regolari e lunghezza . . . . . . . . . . . . .
14.2 Integrali curvilinei e campi vettoriali conservativi
14.2.1 Integrali curvilinei . . . . . . . . . . . . .
14.2.2 Integrali curvilinei di un campo vettoriale
14.2.3 Campi vettoriali conservativi . . . . . . .
14.3 Superfici ed integrali superficiali . . . . . . . . .
14.4 Il teorema della divergenza e la formula di Stokes
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
401
401
409
409
411
412
416
418
.
.
.
.
.
419
419
426
430
432
436
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15 Equazioni differenziali ordinarie
15.1 Introduzione e problema di Cauchy . . . . . . . . . . . . . .
15.2 Unicità della soluzione del problema di Cauchy . . . . . . .
15.3 Esistenza della soluzione del problema di Cauchy . . . . . .
15.4 Equazioni differenziali lineari . . . . . . . . . . . . . . . . .
15.4.1 Equazioni differenziali lineari del primo ordine . . .
15.4.2 Equazioni differenziali lineari di ordine n a coefficienti
costanti . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografia
. 437
441
Elenco delle figure
1.1
1.2
13
1.13
Rappresentazione grafica del prodotto cartesiano di due insiemi.
Rappresentazione grafica di una generica relazione tra elementi di due insiemi. . . . . . . . . . . . . . . . . . . . . . . .
Rappresentazione grafica di una relazione riflessiva e di una
non riflessiva. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Rappresentazione grafica di una relazione simmetrica e di
una non simmetrica. . . . . . . . . . . . . . . . . . . . . . . .
Rappresentazione grafica di una relazione antisimmetrica e
di una non antisimmetrica. . . . . . . . . . . . . . . . . . . .
Rappresentazione grafica di una relazione funzionale. . . . . .
Esempi di relazioni non funzionali. . . . . . . . . . . . . . . .
Rappresentazione grafica di una funzione. . . . . . . . . . . .
Rappresentazione grafica dell’immagine diretta. . . . . . . . .
Rappresentazione grafica dell’immagine reciproca. . . . . . . .
Rappresentazione grafica di una funzione iniettiva e di una
funzione non iniettiva. . . . . . . . . . . . . . . . . . . . . . .
Rappresentazione grafica di una funzione suriettiva e di una
funzione non suriettiva. . . . . . . . . . . . . . . . . . . . . .
Rappresentazione grafica di una funzione composta. . . . . . .
2.1
2.2
2.3
2.4
Rappresentazione geometrica dei numeri reali.
Riferimento cartesiano non ortogonale. . . . .
Riferimento cartesiano ortonormale. . . . . .
Riferimento cartesiano dello spazio. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
44
45
46
47
3.1
3.2
3.3
3.4
3.5
Circonferenza trigonometrica. . . . . . . . . .
Interpretazione geometrica della tangente. . .
Interpretazione geometrica della cotangente. .
Coordinate polari. . . . . . . . . . . . . . . .
Radici terze e quinte di un numero complesso.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
58
61
62
64
67
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
1.11
1.12
14
15
15
16
18
18
19
20
21
22
23
24
Elenco delle figure
x
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
4.14
4.15
4.16
4.17
4.18
4.19
Esempio di massimo assoluto e relativo. . . . . . . . . . . . . 83
Funzione strettamente crescente (decrescente) in un intervallo. 84
Funzione strettamente crescente (decrescente) in un punto. . 86
Funzione potenza ad esponente pari (≥ 2). . . . . . . . . . . . 92
Funzione potenza ad esponente dispari (≥ 3). . . . . . . . . . 93
Funzione radice con indice pari. . . . . . . . . . . . . . . . . . 94
Funzione radice con indice dispari. . . . . . . . . . . . . . . . 95
Funzione potenza ad esponente intero negativo pari. . . . . . 95
Funzione potenza ad esponente intero negativo dispari. . . . . 96
Funzione potenza con esponente razionale o reale. . . . . . . . 98
Funzione esponenziale. . . . . . . . . . . . . . . . . . . . . . . 99
Funzione logaritmo. . . . . . . . . . . . . . . . . . . . . . . . 101
Funzioni seno e coseno. . . . . . . . . . . . . . . . . . . . . . 102
Funzione tangente. . . . . . . . . . . . . . . . . . . . . . . . . 103
Funzione cotangente. . . . . . . . . . . . . . . . . . . . . . . . 104
Funzione arcoseno. . . . . . . . . . . . . . . . . . . . . . . . . 105
Funzione arcocoseno. . . . . . . . . . . . . . . . . . . . . . . . 106
Funzione arcotangente. . . . . . . . . . . . . . . . . . . . . . . 107
Funzione arcocotangente. . . . . . . . . . . . . . . . . . . . . . 108
5.1
5.2
5.3
5.4
Metodo
Metodo
Metodo
Metodo
6.1
6.2
Limiti di una funzione monotona. . . . . . . . . . . . . . . . . 144
Limite notevole sinx/x in 0. . . . . . . . . . . . . . . . . . . 151
7.1
Prodotto secondo Cauchy di due serie
8.1
8.2
Teorema degli zeri. . . . . . . . . . . . . . . . . . . . . . . . . 203
Approssimazione delle soluzioni con il teorema degli zeri. . . . 204
9.1
9.2
9.3
9.4
9.5
9.6
9.7
9.8
Interpretazione geometrica della derivata. . . . . . . . . . .
Teorema di Rolle. . . . . . . . . . . . . . . . . . . . . . . . .
Teorema di Lagrange. . . . . . . . . . . . . . . . . . . . . .
Polinomi di Taylor. . . . . . . . . . . . . . . . . . . . . . . .
Funzione convessa o concava in un punto e punti di flesso. .
Asintoto orizzontale e verticale. . . . . . . . . . . . . . . . .
Grafico della funzione. . . . . . . . . . . . . . . . . . . . . .
Grafico della funzione. . . . . . . . . . . . . . . . . . . . . .
grafico
grafico
grafico
grafico
per
per
per
per
le
le
le
le
disequazioni:
disequazioni:
disequazioni:
disequazioni:
Esempio
Esempio
Esempio
Esempio
1
2
3
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
123
124
124
125
. . . . . . . . . . . . . 193
.
.
.
.
.
.
.
.
215
228
230
239
257
263
268
270
10.1 Somma superiore ed inferiore relativa ad una suddivisione. . . 273
Elenco delle figure
xi
10.2 Teorema della media integrale. . . . . . . . . . . . . . . . . . 282
12.1 Esempio di insieme connesso ma non convesso. . . . . . . . . 353
13.1 Esempio di insieme misurabile illimitato. . . . . . . . . . . . 387
13.2 Dominio di integrazione con trasformazione in coordinate polari. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
Parte I
Funzioni di una variabile
reale
Nella prima parte del corso, l’obiettivo principale riguarda lo studio delle funzioni reali di una variabile reale, attraverso lo studio dei limiti e del
calcolo differenziale ed integrale. Per il raggiungimento di tale obiettivo
vengono trattati non solo argomenti di carattere preliminare, quali gli insiemi con particolare riguardo a quelli numerici, le disequazioni e le funzioni
elementari, ma anche diversi argomenti di carattere complementare, quali i
numeri complessi, le successioni e le serie numeriche.
Capitolo 1
Preliminari
1.1
1.1.1
Cenni di calcolo proposizionale
Connettivi logici
Innanzitutto conviene introdurre brevemente alcuni connettivi logici al fine
di precisarne il loro significato e soprattutto il loro utilizzo. L’utilizzo del
calcolo proposizionale risulta uno strumento molto utile nei casi in cui bisogna operare con enunciati che coinvolgono diversi connettivi contemporaneamente in quanto le regole introdotte per la manipolazione degli enunciati
sono di carattere generale.
Si precisa innanzitutto che il termine enunciato o proprietà è da intendere come un qualsiasi frase di senso compiuto. Un enunciato può essere
vero o falso e, più in generale, può essere anche indecidibile (cioè né vero
né falso) o contraddittorio (cioè vero e falso contemporaneamente); avranno
però interesse per i nostri fini soltanto enunciati veri oppure enunciati falsi.
Di solito gli enunciati vengono rappresentati con lettere corsive maiuscole;
ad esempio: A, B, C, . . . , P, Q, . . . Facendo uso dei connettivi logici si
possono introdurre nuovi enunciati partendo da enunciati assegnati.
Uno dei più semplici connettivi logici è quello di negazione; assegnato
un enunciato A, si conviene che il simbolo ⌉A (da leggersi “non A”) denoti
la negazione dell’enunciato A; talvolta vengono usati anche i simboli ¬A e
∼ A. La negazione ⌉A dell’enunciato A risulta un enunciato vero se A è un
enunciato falso e, viceversa, risulta un enunciato falso se A è un enunciato
vero.
Altri connettivi elementari sono quelli di disgiunzione logica e di congiunzione logica; assegnati gli enunciati A e B i simboli A ∨ B (“A o B”) e
A ∧ B (“A e B”) denotano la disgiunzione logica e rispettivamente la con-
Capitolo 1: Preliminari
6
giunzione logica degli enunciati A e B; l’enunciato A ∨ B risulta vero ogni
qualvolta è vero almeno uno degli enunciati A e B (si tratta quindi di una
disgiunzione debole, nel senso che A∨B è vero anche se A e B sono entrambi
veri), mentre l’enunciato A ∧ B è vero solo nel caso in cui sono veri entrambi
gli enunciati A e B.
Introdotto il connettivo negazione “⌉”, gli ulteriori connettivi “∨” e “∧” non risultano
tra loro indipendenti; si può infatti riconoscere facilmente che il significato dell’enunciato
“A ∧ B” coincide con quello del seguente enunciato ⌉((⌉A) ∨ (⌉B)).
◃ Un altro connettivo utile è quello di implicazione logica; se A e B sono enunciati, la scrittura A ⇒ B (“A implica B”) è da intendersi come
un’abbreviazione dell’enunciato “B ∨ (⌉A)”. Dunque “A ⇒ B” è vero se
l’enunciato A è falso oppure se, supposto vero l’enunciato A, risulta vero
anche l’enunciato B; conseguentemente, “A ⇒ B” risulta falso solo nel caso
in cui l’enunciato A è vero e l’enunciato B è falso.
Un ultimo connettivo logico è quello di equivalenza; se A e B sono enunciati, la scrittura A ⇔ B (“A equivale a B”) è da intendersi come un’abbreviazione di “(A ⇒ B) ∧ (B ⇒ A)”. L’equivalenza “A ⇔ B” è un enunciato
vero se e solo se gli enunciati A e B sono entrambi veri oppure entrambi
falsi. Ogni enunciato può essere sostituito, in ogni espressione logica, da un
enunciato ad esso equivalente.
Si riassumono ora alcune proprietà notevoli dei connettivi precedenti.
◃ Se A, B e C sono enunciati, allora:
1. ⌉(⌉A) ⇔ A.
2. A ∨ B ⇔ B ∨ A ,
A∧B ⇔B∧A.
3. A ⇔ A ∨ A ,
A⇔A∧A.
4. A ⇒ A ∨ B ,
A∧B ⇒A.
5. (A ∨ B) ∨ C ⇔ A ∨ (B ∨ C) ,
(A ∧ B) ∧ C ⇔ A ∧ (B ∧ C) .
6. (A ∨ B) ∧ C ⇔ (A ∧ C) ∨ (B ∧ C) ,
7. A ⇔ A
(A ∧ B) ∨ C ⇔ (A ∨ C) ∧ (B ∨ C) .
(proprietà riflessiva dell’equivalenza).
8. Se A ⇔ B allora B ⇔ A
(proprietà simmetrica dell’equivalenza).
9. Se A ⇔ B e B ⇔ C allora A ⇔ C
valenza).
10. Se A ⇒ B e B ⇒ C allora A ⇒ C
cazione).
(proprietà transitiva dell’equi(proprietà transitiva dell’impli-
1.1 Cenni di calcolo proposizionale
7
11. (A ⇒ B) ⇔ (⌉B ⇒⌉A).
Conviene inoltre tener presente la seguente regola di deduzione: “Se A è
un enunciato vero e se è vera l’implicazione A ⇒ B, allora anche l’enunciato
B è vero”.
In alcuni casi, per stabilire la verità o la falsità di un enunciato, si
possono utilizzare le seguenti tavole di verità, nelle quali si conviene di
denotare con 1 o 0 i casi in cui un enunciato sia vero o rispettivamente
falso. Nel caso in cui un enunciato sia composto mediante diversi enunciati,
bisogna considerare tutte le possibili combinazioni che si possono presentare.
Ad esempio, le tavole di verità degli enunciati A ∨ B e A ∧ B sono date
da
A
1
1
0
0
B
1
0
1
0
A
1
1
0
0
A∨B
1
1
1
0
B
1
0
1
0
A∧B
1
0
0
0
e racchiudono il fatto che la disgiunzione logica è falsa (assume il valore 0)
solo quando entrambi gli enunciati sono falsi, mentre la congiunzione logica
è vera (assume il valore 1) solo quando entrambi gli enunciati sono veri.
Le tavole di verità relative agli altri connettivi logici sono le seguenti
A
1
0
⌉A
0
1
A
1
1
0
0
B
1
0
1
0
A⇒B
1
0
1
1
A
1
1
0
0
B
1
0
1
0
A⇔B
1
.
0
0
1
Esempi ed esercizi
1. Considerati gli enunciati:
A = “Antonio vive a Roma e a Milano”,
B = “Domani andrò allo stadio o al cinema”,
C = “Un foglio di quaderno è macchiato”,
scrivere gli enunciati: ⌉A, ⌉B, ⌉C, A ∨ B, A ∨ (⌉C), (⌉B) ∧ C
(Esempio: ⌉A = “Antonio o non vive a Roma o non vive a Milano”).
Capitolo 1: Preliminari
8
2. Scrivere la negazione dei seguenti enunciati:
A = “Tutti i gatti hanno tre zampe”,
B = “Il mio gatto ha tre zampe”,
C = “Esiste un gatto con tre zampe”.
3. Dire se le seguenti implicazioni sono vere:
1 + 1 = 2 ⇒ “La logica è sempre corretta”,
1 + 1 ̸= 2 ⇒ “La logica è sempre corretta”,
1 + 1 ̸= 2 ⇒ “La logica non è sempre corretta”,
1 + 1 = 2 ⇒ “La logica non è sempre corretta”,
1 + 1 = 2 ⇒ “La logica talvolta è corretta”,
1 + 1 ̸= 2 ⇒ “La logica talvolta è corretta”,
4. Scrivere le tavole di verità degli enunciati:
(A ⇒ B) ∨ (⌉A); ,
(A ⇒ B) ∧ A ,
(A∨⌉C) ⇔ B ,
(⌉B) ∨ C ⇒ A ∧ B
(ad esempio, si scrive la tavola di verità dell’ultimo enunciato:
A
1
1
1
1
0
0
0
0
B
1
1
0
0
1
1
0
0
C
1
0
1
0
1
0
1
0
⌉B
0
0
1
1
0
0
1
1
(⌉B) ∨ C
1
0
1
1
1
0
1
1
A∧B
1
1
0
0
1
1
0
0
(⌉B) ∨ C ⇒ A ∧ B
1
1
0
).
0
1
1
0
0
Dalla precedente tavola di verità si deduce anche che l’enunciato considerato è equivalente al solo enunciato B, in quanto ne assume gli
stessi valori di verità. Le tavole di verità costituiscono pertanto anche
un utile strumento per semplificare un enunciato complesso assegnato.
1.1 Cenni di calcolo proposizionale
1.1.2
9
Quantificatori
Nel seguito si denoteranno con lettere maiuscole gli insiemi e con lettere
minuscole gli elementi di un insieme (la distinzione tra oggetti ed insiemi
si riferisce al contesto considerato e non è una distinzione assoluta). Per
indicare che un oggetto x è un elemento (rispettivamente, non è un elemento)
di un insieme E, si scrive x ∈ E (“x appartiene ad E” oppure “x è elemento
di E”) (rispettivamente, x ∈
/ E (“x non appartiene ad E” oppure “x non è
elemento di E”)).
Tra i simboli logici di uso frequente vi sono i quantificatori, definiti come
segue:
∀ Quantificatore universale “per ogni”. Per esprimere la circostanza in
cui una proprietà P (assegnata per ogni elemento x di un insieme E)
sia sempre verificata, si scrive
∀ x ∈ E : P(x)
(si legge “per ogni x in E si ha P(x))”. Il simbolo “:” ha la funzione
di abbreviazione linguistica e si legge “si ha che” oppure “risulta che”.
∃ Quantificatore esistenziale “esiste”. Per esprimere la circostanza in
cui una proprietà P (assegnata per ogni elemento x di un insieme E)
sia verificata per almeno un elemento, si scrive
∃ x ∈ E t.c. P(x)
(si legge “esiste x in E tale che P(x))”. Il simbolo “t.c.” ha la funzione
di abbreviazione linguistica e si legge “tale che”. In molti casi viene
utilizzato anche il simbolo ∋′ come abbreviazione di tale che. Nel caso
in cui esista esattamente un unico elemento di x ∈ E per cui P(x) sia
vera si scrive ∃|x ∈ E t.c. P(x) (si legge “esiste un unico x in E tale
che P(x))”.
L’uso di tali simboli è da intendersi nel modo seguente. Sia E un insieme
e si supponga di poter attribuire a ciascun elemento x ∈ E una proprietà
P(x), vera o falsa (ad esempio, E potrebbe denotare l’insieme delle parole
di un vocabolario e, per ogni x ∈ E, P(x)=“la parola x è formata da più di
dieci lettere”).
Allora la scrittura ∃ x ∈ E : P(x) significa “esiste un elemento x di
E che verifica la proprietà P(x)” (nell’esempio “esiste una parola con più
di dieci lettere”), mentre la scrittura ∀ x ∈ E : P(x) significa che “ogni
elemento x di E verifica la proprietà P(x)” (nell’esempio, “ogni parola è
formata da più di dieci lettere”).
Capitolo 1: Preliminari
10
Si noti che le affermazioni precedenti non sono l’una la negazione dell’altra.
La negazione di ∃ x ∈ E : P(x) è infatti “∀ x ∈ E : P(x) è falsa”,
cioè “∀ x ∈ E : ⌉P(x)”, mentre la negazione di ∀ x ∈ E : P(x) è
“∃ x ∈ E : P(x) sia falsa”, cioè “∃ x ∈ E : ⌉P(x)”.
In alcuni casi oltre all’esistenza di un elemento che verifica una certa
proprietà, si vuole affermare anche la sua unicità. È utile pertanto introdurre il simbolo ∃| che si utilizza nell’espressione ∃| x ∈ E : P(x) per
affermare che “esiste uno ed un solo elemento x in E tale che la proprietà
P(x) sia vera”.
Si riconosce facilmente la validità delle seguenti proprietà, che chiariscono come si comportano i quantificatori in presenza di altri connettivi
logici.
Si intendono fissati un insieme E e le proprietà P(x) e Q(x) definite per
ogni x ∈ E.
1. ⌉(∀ x ∈ E : P(x)) ⇔ ∃ x ∈ E : ⌉P(x)
⌉(∃ x ∈ E : P(x)) ⇔ ∀ x ∈ E : ⌉P(x) ;
ad esempio, negare che tutti gli italiani abbiano una o più automobili,
significa affermare che esiste un italiano che non ha alcuna automobile,
mentre negare che esista un italiano che ha una o più automobili,
significa affermare che tutti gli italiani non hanno un’automobile.
2. (∃ x ∈ E : P(x) ∨ Q(x)) ⇔ (∃ x ∈ E : P(x)) ∨ (∃ x ∈ E : Q(x))
3. (∀ x ∈ E : P(x) ∧ Q(x)) ⇔ (∀ x ∈ E : P(x)) ∧ (∀ x ∈ E : Q(x))
4. (∃ x ∈ E : P(x) ∧ Q(x)) ⇒ (∃ x ∈ E : P(x)) ∧ (∃ x ∈ E : Q(x))
5. (∀ x ∈ E : P(x)) ∨ (∀ x ∈ E : Q(x)) ⇒ (∀ x ∈ E : P(x) ∨ Q(x))
Si osservi che nelle ultime due proprietà non vale l’equivalenza; infatti
se, ad esempio, E denota l’insieme {0, 1, 2} e se, per ogni x ∈ E, si pone
P(x) = “x ≤ 1” e Q(x) =“x = 2”, si vede facilmente che gli enunciati
(∃ x ∈ E : P(x)) e (∃ x ∈ E : Q(x)) sono entrambi veri (e quindi è vera
la loro congiunzione logica) mentre l’enunciato (∃ x ∈ E : P(x) ∧ Q(x)) è
evidentemente falso.
Analogamente, se si considerano le proprietà, definite per ogni x ∈ E,
P(x) = “x ≤ 1” e Q(x) =“x ≥ 1”; allora l’enunciato “∀ x ∈ E : P(x) ∨
Q(x)” è vero, mentre ciascuno degli enunciati “∀ x ∈ E : P(x)′′ e“∀ x ∈
E : Q(x)” è falso (e quindi è falsa la loro disgiunzione logica).
La prima proprietà, apparentemente banale, consente di eseguire correttamente la negazione anche di enunciati complessi, in cui l’intuizione
1.1 Cenni di calcolo proposizionale
11
potrebbe invece incontrare difficoltà. Infatti, è sufficiente osservare che la
negazione di un quantificatore universale si ottiene considerando il quantificatore esistenziale seguito dalla negazione, e viceversa, la negazione di un
quantificatore esistenziale si ottiene considerando il quantificatore universale seguito dalla negazione (cioè ⌉(∀ x ∈ E : . . . ) equivale a ∃ x ∈ E : ⌉(. . . )
mentre ⌉(∃ x ∈ E : . . . ) equivale a ∀ x ∈ E : ⌉(. . . )).
Ad esempio, si considerino tre insiemi E, F e G e sia P(x, y, z) una
proprietà che dipende dagli elementi x ∈ E, y ∈ F e z ∈ G. Allora la
negazione dell’enunciato
∀ x ∈ E : ∃ y ∈ F : ∀ z ∈ G : P(x, y, z)
è data da
∃ x ∈ E : ∀ y ∈ F : ∃ z ∈ G : ⌉P(x, y, z) .
Esempi ed esercizi
1. Dire se sono veri i seguenti enunciati: “−2 è un numero naturale”, “5
è n numero intero”, “−7 è un numero razionale”.
2. Scrivere la negazione dei seguenti enunciati
A = “∀ x ∈ E : ∃ y ∈ E : P(x, y) ,”
B = “∃ x ∈ E : ∀ y ∈ E : P(x, y) ,”
(ad esempio, la negazione dell’enunciato A è data da
∃ x ∈ E : ∀ y ∈ E : ⌉P(x, y) ).
Nelle sezioni seguenti sono raggruppate alcune delle notazioni adoperate
nel seguito del testo.
1.1.3
Notazioni insiemistiche
Gli insiemi vengono solitamente rappresentati con lettere maiuscole: E, F, . . .
ed i loro elementi con lettere minuscole: x, y, . . . . Un insieme contenente
gli oggetti a, b, c, . . . si può indicare con {a, b, c, . . . }; inoltre, se E è un
insieme assegnato e se, per ogni x ∈ E è assegnata anche una proprietà
P(x), l’insieme degli elementi di E per cui la proprietà è vera si denota con
{x ∈ E | P(x)}.
Se in particolare viene assegnata una proprietà che non è soddisfatta da
alcun elemento di E (ad esempio, P(x) =“x non è un elemento di E), si
ottiene un insieme privo di elementi, che viene denominato insieme vuoto e
denotato con ∅. L’insieme vuoto ∅ è caratterizzato dal fatto di non avere
elementi.
Inoltre, si assumono le seguenti notazioni:
Capitolo 1: Preliminari
12
∈ Simbolo di appartenenza. La notazione “x ∈ E” afferma che l’oggetto
x appartiene all’insieme (oppure è elemento di) E). La negazione di
tale circostanza si esprime scrivendo “x ∈
/ E”.
⊂ Simbolo di inclusione. La notazione “E ⊂ F ” afferma che l’insieme E
è contenuto nell’insieme (oppure è un sottoinsieme di) F , cioè gli elementi di E sono anche elementi di F . La negazione di tale circostanza
si esprime scrivendo “E ̸⊂ F ”.
∩ Simbolo di intersezione. La notazione “E ∩ F ” denota l’insieme costituito dagli elementi che appartengono sia ad E che ad F . Più in
generale, se I è un insieme e per ogni i ∈ I è assegnato un insieme
Ei , l’insieme intersezione costituito dagli ∩
elementi che appartengono
a tutti gli insiemi Ei viene denotato con
Ei . Due insiemi E ed F
si dicono disgiunti se E ∩ F = ∅.
i∈I
∪ Simbolo di unione. La notazione “E ∪ F ” denota l’insieme costituito
dagli elementi che appartengono o ad E oppure ad F (cioè ad almeno
uno dei due insiemi). Inoltre, se per ogni i ∈ I è assegnato un insieme
Ei , l’insieme unione costituito dagli elementi che
∪ appartengono ad
almeno uno degli insiemi Ei viene denotato con
Ei .
i∈I
{ Simbolo di complementare. Se E è un sottoinsieme di F , la notazione “{F (E)” denota l’insieme costituito dagli elementi di F che non
appartengono ad E.
r Simbolo di differenza di insiemi. La notazione “F r E” denota l’insieme costituito dagli elementi di F che non appartengono ad E. Si
ha ovviamente F r E = {F (E ∩ F ).
1.1.4
Prodotto cartesiano e relazioni tra elementi di
due insiemi
In questa sezione viene introdotto il prodotto cartesiano di due o più insiemi
e inoltre vengono dati alcuni cenni sulle relazioni tra elementi di due insiemi.
L’obiettivo principale sarà quello di introdurre in maniera precisa il concetto
di funzione utilizzando le relazioni cosiddette funzionali. Per completezza,
verranno citate anche alcune tra le proprietà principali di una relazione.
Se x ed y sono oggetti distinti, l’insieme {x, y} viene denominato coppia
non ordinata (se x = y, si ottiene l’insieme {x} ridotto al solo elemento x).
Per quanto riguarda l’insieme {x, y}, non ha alcuna rilevanza l’ordine con
il quale compaiono i due elementi x ed y; invece nella coppia ordinata (x, y)
1.1 Cenni di calcolo proposizionale
13
di prima coordinata x e seconda coordinata y l’ordine in cui compaiono
gli elementi diventa di importanza sostanziale. Precisamente, si può porre
(x, y) = {{x}, {x, y}} per differenziare il ruolo dei due elementi; tuttavia nel
seguito si preferirà basarsi su una definizione intuitiva nelle dimostrazioni.
Pertanto, si ha (a, b) = (c, d) se e solo se a = c e b = d.
In modo del tutto analogo, assegnati tre oggetti x, y e z, si può definire la
terna ordinata (x, y, z). Nel caso in cui x1 , x2 , . . . , xn siano n oggetti (n ≥ 2),
si definisce con lo stesso metodo la n-pla ordinata di prima coordinata x1 ,
di seconda coordinata x2 , . . . , ed n-esima coordinata xn .
Se E ed F sono due insiemi, si può considerare l’insieme di tutte le
coppie ordinate con prima coordinata in E e seconda coordinata in F . Tale
insieme viene denominato insieme prodotto di E per F e viene denotato con
il simbolo E × F ; se E = F , si può anche scrivere E 2 anziché E × E.
Il prodotto cartesiano E × F può essere rappresentato geometricamente
indicando gli elementi dell’insieme E su un segmento disposto orizzontalmente e gli elementi di F su un segmento disposto verticalmente; gli elementi
del prodotto (coppie ordinate) sono allora rappresentati come elementi del
rettangolo in Figura 1.1.
y
P
• (x, y)
F
x
E
Figura 1.1: Rappresentazione grafica del prodotto cartesiano di due insiemi.
Si osservi che se l’insieme E è formato da n elementi distinti e l’insieme
F è formato da m elementi distinti, allora il prodotto cartesiano E × F
possiede esattamente n · m elementi distinti.
In modo analogo si considera il prodotto cartesiano E × F × G di tre
insiemi E, F e G; esso è l’insieme delle terne ordinate la cui prima coordinata
è un elemento di E, la seconda coordinata è un elemento di F e la terza
coordinata è un elemento di G.
Più in generale, se E1 , E2 , . . . , En sono n insiemi (n ≥ 2), si può definire
il prodotto cartesiano E1 × E2 × · · · × En come l’insieme delle n-ple ordinate
(x1 , . . . , xn ) tali che x1 ∈ E1 , . . . xn ∈ En . Anche in questo caso, se E1 =
E2 = · · · = En = E, si utilizza il simbolo E n per denotare il prodotto
E1 × E2 × · · · × En .
Capitolo 1: Preliminari
14
Si introduce ora il concetto di relazione tra elementi di due insiemi
assegnati. Siano E ed F due insiemi.
Una relazione tra elementi di E ed elementi di F è semplicemente un
sottoinsieme del prodotto cartesiano E × F .
Figura 1.2: Rappresentazione grafica di una generica relazione tra elementi
di due insiemi.
Poiché in particolare ∅ ⊂ E × F e E × F ⊂ E × F , tra le relazioni tra
un insieme E ed un insieme F vanno sempre considerate la relazione vuota
∅ e la relazione totale E × F .
Il fatto che una coppia (x, y) ∈ E × F appartenga alla relazione R indica
che l’elemento x di E è in relazione R con l’elemento y di F . Per denotare
questa circostanza si scrive anche xRy anziché (x, y) ∈ R.
◃ Se in particolare E = F , una relazione R ⊂ E 2 viene denominata
relazione su E.
Si osservi che in questo caso, se E viene rappresentato geometricamente
con un segmento, allora il prodotto cartesiano E 2 diventa un quadrato.
Le relazioni su un insieme E possono avere particolari proprietà. Per
enunciarle, si fissi una relazione R su un insieme E. Allora
• Proprietà riflessiva. Si dice che R è riflessiva se soddisfa la seguente
condizione:
∀ x ∈ E : (x, x) ∈ R .
La proprietà riflessiva si esprime dicendo che ogni elemento di E è in
relazione R con sé stesso.
Geometricamente, è molto semplice riconoscere che una relazione R è
riflessiva se e solo se essa contiene la diagonale principale di E 2 (vedasi
la Figura 1.3
• Proprietà simmetrica.
seguente condizione:
Si dice che R è simmetrica se soddisfa la
∀ x, y ∈ E : (x, y) ∈ R ⇒ (y, x) ∈ R .
1.1 Cenni di calcolo proposizionale
15
Figura 1.3: Rappresentazione grafica di una relazione riflessiva e di una non
riflessiva.
La proprietà simmetrica si esprime dicendo che se un elemento x di
E è in relazione R con un altro elemento y di E, allora anche y è in
relazione R con x.
Anche in questo caso geometricamente è molto semplice riconoscere
che una relazione R è simmetrica se e solo se essa è simmetrica rispetto
alla diagonale principale di E 2 (vedasi la Figura 1.4
Figura 1.4: Rappresentazione grafica di una relazione simmetrica e di una
non simmetrica.
• Proprietà antisimmetrica. Si dice che R è antisimmetrica se soddisfa
la seguente condizione:
∀ x, y ∈ E : (x, y) ∈ R ∧ (y, x) ∈ R ⇒ x = y .
La proprietà antisimmetrica si esprime dicendo che se accade contemporaneamente che un elemento x di E sia in relazione R con un
elemento y di E e y è in relazione R con x, allora necessariamente
x = y.
Nella Figura 1.5 sono rappresentate geometricamente una relazione R
antisimmetrica e una relazione R non antisimmetrica.
16
Capitolo 1: Preliminari
Figura 1.5: Rappresentazione grafica di una relazione antisimmetrica e di
una non antisimmetrica.
• Proprietà transitiva. Si dice che R è transitiva se soddisfa la seguente
condizione:
∀ x, y, z ∈ E : (x, y) ∈ R ∧ (y, z) ∈ R ⇒ (x, z) ∈ R .
In questo caso si rinuncia ad una rappresentazione geometrica in quanto non vi è una caratterizzazione elementare come nei precedenti
casi.
Le precedenti proprietà consentono di introdurre le seguenti due importanti classi di relazioni su un insieme E:
• Si dice che una relazione R su un insieme E è una relazione d’equivalenza su E se essa è riflessiva, simmetrica e transitiva.
• Si dice che una relazione R su un insieme E è una relazione d’ordine
su E se essa è riflessiva, antisimmetrica e transitiva.
Alcuni esempi di relazioni di equivalenza sono:
• Le parole di un vocabolario che cominciano con la stessa lettera. In
questo caso E è l’insieme delle parole del vocabolario ed R = {(x, y) ∈
E 2 | x e y cominciano con la stessa lettera}. Analogamente si possono
considerare le parole che terminano con la stessa lettera, che fanno
rima, che hanno lo stesso numero di lettere e cosı̀ via.
• La classe di appartenenza tra gli abitanti di una città. In questo caso
E è l’insieme degli abitanti della città ed R = {(x, y) ∈ E 2 | x e y
hanno la stessa età}. Analogamente si possono considerare la città
natale, l’iscrizione alla stessa scuola e cosı̀ via.
• Sull’insieme N = {0, 1, 2, . . . } dei numeri naturali, la relazione R1 =
{(n, m) ∈ N2 | n è primo con m} oppure R2 = {(n, m) ∈ N2 | la
somma di n ed m è pari }.
1.2 Relazioni funzionali e funzioni
17
mentre i seguenti sono esempi riguardanti alcune relazioni d’ordine:
• I files più grandi (come dimensioni) tra quelli di un computer. In questo caso E è l’insieme dei files presenti nel computer ed R = {(x, y) ∈
E 2 | x ha una dimensione maggiore o uguale a quella di y}. Analogamente si possono considerare i files più recenti, quelli modificati più
volte, ecc.
• L’ordine alfabetico tra le parole di un vocabolario. In questo caso E è
l’insieme delle parole del vocabolario ed R = {(x, y) ∈ E 2 | x precede
o coincide con y secondo l’ordine alfabetico}.
• Il numero di matricola tra gli studenti universitari. In questo caso E
è l’insieme degli studenti iscritti ad una Università ed R = {(x, y) ∈
E 2 | Il numero di matricola di x è minore o uguale di quello di y}.
• La relazione d’ordine naturale tra i numeri naturali, interi, razionali
e reali.
• La relazione di inclusione tra i sottoinsiemi di un assegnato insieme E
è una relazione d’ordine sull’insieme dei sottoinsiemi di E. In questo
caso, assegnato un insieme E, si ha R = {(A, B) ∈ P(E)2 | A ⊂ B}
(P(E) denota l’insieme di tutti i sottoinsiemi di E).
1.2
Relazioni funzionali e funzioni
Si considera ora un’ulteriore proprietà delle relazioni che sarà alla base della
definizione di funzione.
Siano E ed F insiemi e sia R ⊂ E × F una relazione tra elementi di E
ed elementi di F .
Si dice che R è una relazione funzionale tra elementi di E ed elementi
di F se essa verifica la seguente condizione:
∀ x ∈ E ∃ | y ∈ F t.c. (x, y) ∈ R .
(1.2.1)
Quindi in una relazione funzionale ogni elemento di E è in relazione con
uno ed un solo elemento y di F .
Graficamente questa condizione si può descrivere affermando che le rette
verticali passanti per i punti di E intersecano la relazione in uno ed un solo
punto, come si vede nella Figura 1.6.
Nella Figura 1.7 successiva vengono mostrati invece due casi in cui la
definizione precedente non è verificata.
A questo punto si può definire in maniera precisa il concetto di funzione.
18
Capitolo 1: Preliminari
Figura 1.6: Rappresentazione grafica di una relazione funzionale.
Figura 1.7: Esempi di relazioni non funzionali.
Siano E ed F insiemi. Si dice funzione da E in F ogni terna ordinata f =
(E, F, R) dove R è una relazione funzionale tra elementi di E ed elementi
di F .
Intuitivamente assegnare una funzione vuol dire assegnare tre oggetti:
un insieme di partenza E (denominato anche insieme di definizione oppure dominio di f ), un insieme di arrivo F e una relazione funzionale R
denominata grafico della funzione, che rappresenta la ‘corrispondenza’ che
ad ogni elemento dell’insieme di partenza associa uno ed un solo elemento
dell’insieme di arrivo.
Viene quindi richiesta agli elementi di E di soddisfare la condizione prevista dalla definizione di relazione funzionale e precisamente che ad ogni
elemento x ∈ E corrisponda uno ed un solo elemento di F . Ciò consente di
dare la seguente definizione.
Il valore che una funzione f assume in un elemento x ∈ E viene denotato
con f (x) e rappresenta l’unico elemento y di F tale che (x, y) ∈ R.
Quindi la relazione funzionale può essere scritta nel modo seguente:
R = {(x, y) ∈ E × F | y = f (x)} .
(1.2.2)
Da tale descrizione segue che è equivalente assegnare il grafico della
1.2 Relazioni funzionali e funzioni
19
funzione oppure alternativamente assegnare il valore f (x) delle funzione f
in ogni punto x ∈ E.
Si osservi che il concetto di funzione non prevede che gli elementi di F
soddisfino alcuna condizione.
Molto frequentemente si prenderanno in esame proprietà riguardanti una
generica funzione che ha E come insieme di partenza ed F come insieme
di arrivo. In tali circostanze si rpeferirà la notazione f : E → F (oppure
f
talvolta E → F oppure x 7→ f (x)).
Graficamente, una funzione viene rappresentata con uno dei seguenti
grafici:
Figura 1.8: Rappresentazione grafica di una funzione.
1.2.1
Immagini dirette e immagini reciproche
Sia ora f : E → F una funzione di E in F . Se A è un sottoinsieme di E,
si denomina immagine diretta di A mediante f , e la si denota con f (A), il
seguente sottoinsieme di F :
f (A) := {y ∈ F | ∃ x ∈ A t.c. f (x) = y} .
(1.2.3)
L’immagine diretta di E mediante f viene denominata semplicemente
immagine di f (oppure insieme dei valori di f ) e denotata anche con Im(f ).
Quindi:
f (E) := {y ∈ F | ∃ x ∈ E t.c. f (x) = y} .
Graficamente l’immagine diretta si può rappresentare come nella Figura
1.9.
Se si considerano i sottoinsiemi particolari ∅ ed E stesso di E, si può
affermare quanto segue:
f (∅) = ∅ ,
f (E) ⊂ F ;
Capitolo 1: Preliminari
20
Figura 1.9: Rappresentazione grafica dell’immagine diretta.
quindi l’insieme dei valori è in generale solamente contenuto in F e non
uguale ad F (le funzioni per le quali vale l’uguaglianza f (E) = F verranno
considerate nel seguito è verranno denominate suriettive).
Si osserva inoltre che se A1 ⊂ E e A2 ⊂ E e se A1 ⊂ A2 , si ha f (A1 ) ⊂
f (A2 ).
Inoltre se A1 ⊂ E e A2 ⊂ E sono due arbitrari sottoinsiemi di E, si può
affermare che:
f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ) ,
f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ) .
Nell’ultima relazione non vale in generale l’uguaglianza, come si può riconoscere considerando ad esempio una funzione costante e due sottoinsiemi
A1 e A2 non vuoti e disgiunti.
◃ Sia assegnata ora una funzione f : E → F e si consideri un sottoinsieme B di F . Si definisce immagine reciproca (oppure immagine indiretta o
−1
controimmagine) di B mediante f , e la si denota con f (B), il seguente
sottoinsieme di E:
−1
f (B) := {x ∈ E | f (x) ∈ B} .
(1.2.4)
−1
Se si considera y ∈ F , la controimmagine f ({y}) viene anche denotata
−1
−1
con f (y). Si osservi che f (y) può risultare vuota se la funzione f non
assume il valore y in alcun elemento x ∈ E (come si vedrà nel seguito,
tale circostanza non si verifica se la funzione è suriettiva). Inoltre, qualora
−1
f (y) sia non vuota, non è detto che essa sia costituita da un solo elemento
x ∈ E; le funzioni per le quali quest’ultima condizione è soddisfatta verranno
considerate di seguito e denominate iniettive.
Graficamente l’immagine reciproca si può rappresentare come nella Figura 1.10.
1.2 Relazioni funzionali e funzioni
21
Figura 1.10: Rappresentazione grafica dell’immagine reciproca.
Se si considerano i sottoinsiemi particolari ∅ ed F stesso di F , si può
affermare quanto segue:
−1
f (∅) = ∅ ,
−1
f (F ) = E .
Quindi in questo caso vale l’uguaglianza come diretta conseguenza della
definizione di funzione.
−1
Si osserva inoltre che se B1 ⊂ F e B2 ⊂ F e se B1 ⊂ B2 , si ha f
−1
(B1 ) ⊂ f (B2 ).
Inoltre se B1 ⊂ F e B2 ⊂ F sono due arbitrari sottoinsiemi di F , si può
affermare che:
−1
−1
−1
f (B1 ∪ B2 ) = f (B1 )∪ f (B2 ) ,
1.2.2
−1
−1
−1
f (B1 ∩ B2 ) = f (B1 )∩ f (B2 ) .
Funzioni iniettive, suriettive e biiettive
Siano come al solito E ed F insiemi arbitrari e sia f : E → F una funzione
da E in F .
Si osservi che nella definizione di funzione viene richiesto solo agli elementi di E di soddisfare una precisa condizione mentre non vi è alcuna
analoga richiesta sugli elementi di F .
In particolare, considerato un elemento y ∈ F non è detto che esistano
degli elementi x ∈ E tali che y = f (x) ed anche quando questa condizione
è soddisfatta non si può in generale assicurare che tale elemento x (corrispondente ad y) sia unico. L’unicità e l’esistenza di un “corrispondente”
elemento x per ogni elemento y ∈ F è alla base delle seguenti definizioni.
Si dice che f è iniettiva (o anche ingettiva) se verifica la seguente condizione:
x, y ∈ E, x ̸= y ⇒ f (x) ̸= f (y)
(1.2.5)
Capitolo 1: Preliminari
22
o equivalentemente
x, y ∈ E, f (x) = f (y) ⇒ x = y .
Quindi in questo caso per ogni elemento y ∈ F può esistere al più un
solo elemento x ∈ E tale che y = f (x).
Questa condizione si può esprimere graficamente affermando che ogni
retta orizzontale interseca il grafico della funzione in al più in un punto
(vedasi la Figura 1.11).
Figura 1.11: Rappresentazione grafica di una funzione iniettiva e di una
funzione non iniettiva.
Si osservi che nel caso delle funzioni iniettive non è detto che, assegnato
un elemento y ∈ F , esista sempre un elemento x ∈ E tale che y = f (x);
infatti la condizione prevista nella definizione di funzione iniettiva prevede
solamente l’unicità di tale elemento nel caso in cui esista.
La seguente definizione invece prende in esame l’esistenza di un “corrispondente” elemento x ∈ E per ogni elemento y ∈ F .
Sia f : E → F una funzione da E in F . Si dice f è suriettiva (o anche
surgettiva) se essa verifica la seguente condizione
∀ y ∈ F ∃ x ∈ E t.c. f (x) = y .
(1.2.6)
Tenendo presente che f (E) è l’insieme di tutti i valori della funzione f ,
si riconosce subito che la condizione precedente è equivalente alla seguente:
f (E) = F .
Infatti se f è suriettiva si ha sempre f (E) ⊂ F e quindi bisogna dimostrare l’inclusione
inversa F ⊂ f (E) cioè che ogni elemento di F è un valore della funzione, il che è assicurato
dalla definizione di suriettività. Viceversa si supponga f (E) = F . Allora ogni elemento
di F appartiene a f (E) e per definizione di f (E) deve esistere un elemento x ∈ E tale
che y = f (x) il che dimostra che f è suriettiva.
1.2 Relazioni funzionali e funzioni
23
Quindi in questo caso per ogni elemento y ∈ F deve esistere almeno un
elemento x ∈ E tale che y = f (x).
Questa condizione si può esprimere graficamente affermando che ogni
retta orizzontale interseca il grafico della funzione in almeno un punto
(vedasi la Figura 1.12).
Figura 1.12: Rappresentazione grafica di una funzione suriettiva e di una
funzione non suriettiva.
◃ Infine, una funzione f : E → F viene denominata biiettiva (o anche
bigettiva) se essa è contemporaneamente iniettiva e suriettiva. Dalle (1.2.6)
e (1.2.5), la proprietà di biiettività si caratterizza come segue:
∀ y ∈ F ∃ | x ∈ E t.c. f (x) = y .
(1.2.7)
In questo caso graficamente ogni retta orizzontale interseca il grafico di
f in uno ed un solo punto.
Si ritrova quindi la stessa condizione richiesta sugli elementi di E agli
elementi questa volta di F . Per questo motivo, come si vedrà di seguito,
le funzioni biiettive possono essere collegate all’esistenza di una funzione
inversa, che sarà definita in maniera opportuna.
1.2.3
Funzioni composte e funzioni inverse
Un’ulteriore operazione importante tra funzioni è quella di funzione composta.
Siano assegnati E, F e G insiemi e siano f : E → F una funzione di E
in F e g : F → G una funzione di F in G. Si denomina funzione composta
di f e g, e la si denota con g ◦ f “g cerchietto f ” la funzione avente E come
insieme di partenza, G come insieme di arrivo e tale che, per ogni x ∈ E,
(g ◦ f )(x) := g(f (x)) .
(1.2.8)
Quindi l’elemento di G corrispondente ad un elemento x ∈ E mediante
la funzione composta viene ottenuto considerando il valore f (x) ∈ F di f
Capitolo 1: Preliminari
24
in x e di questo elemento cosı̀ ottenuto considerandone successivamente il
valore g(f (x)) mediante g. Intuitivamente, la funzione composta quindi con
un unico passaggio fa corrispondere all’elemento x ∈ E l’elemento g(f (x))
di G, come mostra la Figura 1.13.
Figura 1.13: Rappresentazione grafica di una funzione composta.
Si osserva che l’operazione di funzione composta è associativa nel senso
che se h : G → H è un’ulteriore funzione da G in un insieme H, allora
(h ◦ g) ◦ f = h ◦ (g ◦ f )
e quindi si può denotare la funzione cosı̀ ottenuta semplicemente con h◦g◦f .
Non vale invece una proprietà commutativa per l’operazione di funzione
composta. Infatti, nelle ipotesi in cui si può considerare la funzione composta g ◦ f non è detto che si possa considerare f ◦ g e anche quando ciò
dovesse accadere non è detto che valga l’uguaglianza g ◦ f = f ◦ g.
Si osserva invece che l’operazione di funzione composta ammette un
elemento neutro a sinistra e a destra. Per precisare questo, assegnato un
qualsiasi insieme E, si consideri la funzione iE : E → E definita ponendo,
per ogni x ∈ E,
iE (x) = x .
Allora è facile riconoscere che se f : E → F è un’arbitraria funzione da E
in F si ha
iF ◦ f = f ,
f ◦ iE = f .
In realtà, la funzione composta può essere definita in circostanze più
generali, in cui non è necessario che l’insieme di arrivo di f coincida con
l’insieme di partenza di g; è sufficiente, infatti, che l’insieme di arrivo di
f sia un sottoinsieme di F affinchè continui ad avere senso la definizione
(1.2.8).
Pertanto, se f : E → F1 e g : F2 → G sono funzioni tali che f (E) ⊂ F2
si può considerare la funzione composta che viene denotata ancora con il
simbolo g◦f : E → G definita ponendo, per ogni x ∈ E, (g◦f )(x) = g(f (x)).
1.2 Relazioni funzionali e funzioni
25
Ciò sarà utile per le funzioni reali che per convenzione avranno sempre
l’insieme R dei numeri reali come insieme di arrivo. In tal caso sarà possibile
comporre tali funzioni con un’ulteriore funzione reale anche se quest’ultima
non è definita in tutto R purché lo sia sull’insieme dei valori della prima
funzione.
A questo proposito, si richiamano alcune convenzioni valide per le funzioni reali.
Spesso tali funzioni vengono assegnate precisando solamente il valore y = f (x) assunto
in un generico elemento x senza precisare né l’insieme di partenza né quello di arrivo. In
questi casi l’insieme di arrivo è sempre da intendere come tutto R, mentre l’insieme di
partenza è il sottoinsieme più grande di R per il quale l’espressione f (x) ha significato.
Ciò, nel caso di funzioni composte, consente di imporre in maniera diretta la condizione
che la seconda funzione sia definita sui valori della prima funzione. Ad esempio, assegnata
√
la funzione y = log x si impone la condizione x ≥ 1 che consente di affermare che
log x ∈ [0, +∞[, insieme in sui è definita la funzione radice.
◃ Risulta utile in pratica saper riconoscere le funzioni dalle quali è composta un’assegnata funzione e ciò per le funzioni reali si ottiene facilmente
osservando come viene calcolato il valore√ di una funzione.
3
Ad esempio, la funzione f (x) = 2sin x si√ottiene componendo successivamente la funzione radice terza x 7→ y = 3 x, la funzione seno y 7→ z =
sin y e la funzione esponenziale z 7→ 2z di base 2.
◃ Si considera ora il concetto di funzione invertibile da intendersi intuitivamente come una funzione per la quale esiste un’ulteriore funzione che
svolge un compito inverso rispetto a quello della funzione f , e cioè che ad un
valore assunto in un determinato punto da f fa corrispondere esattamente
il punto nel quale tale valore è stato assunto e tale che f verifichi la stessa
proprietà rispetto ai valori assunti da tale funzione.
Precisamente, sia f : E → F una funzione da E in F . Si dice che f è
invertibile se esiste un’ulteriore funzione g : F → E tale che
∀ x ∈ E : g(f (x)) = x ,
∀ y ∈ F : f (g(y)) = y .
(1.2.9)
Si riconosce facilmente che la funzione g verificante la condizione (1.2.9)
è unica e viene denominata inversa di f e denotata con il simbolo f −1 .
Dalla (1.2.9) segue
∀ x ∈ E : f −1 (f (x)) = x ,
∀ y ∈ F : f (f −1 (y)) = y
(1.2.10)
e tenendo presente la definizione di funzione composta
f −1 ◦ f = iE ,
f ◦ g = iF .
Da ciò segue anche immediatamente che se f è invertibile anche la sua
inversa f −1 lo è ed ha come inversa la funzione f , cioè (f −1 )−1 = f .
26
Capitolo 1: Preliminari
Come si è anticipato in precedenza, la proprietà di biiettività consente di
definire una funzione che ha le stesse proprietà dell’inversa di una funzione
assegnata. Tale proprietà viene chiarita dal seguente risultato.
Teorema 1.2.1 Siano E ed F insiemi e sia f : E → F una funzione da E
in F . Allora le seguenti proposizioni sono equivalenti:
a) La funzione f è invertibile.
b) La funzione f è biiettiva.
Dimostrazione. Si supponga che f sia invertibile e sia f −1 : F → E la sua inversa.
Per verificare che f è iniettiva siano x, y ∈ E tali che f (x) = f (y). Allora si ha anche
f −1 (f (x)) = f −1 (f (y)) e dalle poprietà delle funzioni inverse x = y. Quindi f è iniettiva.
Si dimostra ora che f è suriettiva. Sia y ∈ F e si consideri l’elemento x = f −1 (y) ∈ E.
Allora, ancora dalle proprietà delle funzioni inverse, f (x) = f (f −1 (y)) = y e ciò dimostra
la proprietà di suriettività.
Viceversa si supponga ora che f sia biiettiva. Dalla proprietà (1.2.7), si può definire
la funzione g : F → E ponendo, per ogni y ∈ F ,
{
x∈E,
g(y) = x ,
dove x è l’unico elemento di E tale che
f (x) = y .
Si verifica ora che la funzione g è l’inversa della funzione f . Sia x ∈ E; allora, per come
è definita la funzione g, si ha g(f (x)) = x1 dove x1 è l’unico elemento di E tale che
f (x1 ) = f (x); dall’unicità di x1 segue x1 = x e quindi g(f (x)) = x. Infine, sia y ∈ F ;
allora g(y) è l’unico elemento di x ∈ E tale che f (x) = y e quindi f (g(y)) = f (x) = y.
Quindi è stata verificata la proprietà (1.2.9) da cui g = f −1 .
Mentre la definizione di funzione invertibile non fornisce indicazioni
su come definire l’inversa, tali informazioni sono invece disponibili dalla
definizione di funzione biiettiva, da cui l’importanza del risultato precedente.
Precisamente, dalla dimostrazione del teorema precedente, segue che se
f : E → F è invertibile allora la sua inversa è la funzione f −1 : F → E
definita ponendo, per ogni y ∈ F ,
{
x∈E,
−1
f (y) := x ,
dove
(1.2.11)
f (x) = y .
Bisogna infine tener presente che la proprietà di biiettività è molto semplice da riconoscere geometricamente, come si è visto in precedenza, mentre
quella di invertibilità richiede di individuare la funzione g che risulta esserne l’inversa. Anche per questo motivo il teorema precedente è un utile
strumento per riconoscere facilmente l’invertibilità di una funzione.
◃ In molte circostanze, una funzione verifica una determinata proprietà
(per esempio, quella di essere iniettiva oppure biiettiva) non su tutto l’insieme di partenza, ma su di un particolare sottoinsieme di esso. In tali
1.2 Relazioni funzionali e funzioni
27
casi, può risultare utile ricorrere al seguente concetto di restrizione di una
funzione.
Siano assegnati una funzione f : E → F ed un sottoinsieme A di E.
Si denomina restrizione di f all’insieme A, e si denota con f|A , la funzione
da A in F definita ponendo, per ogni x ∈ A,
f|A (x) := f (x) .
(1.2.12)
Quindi i valori della restrizione sono gli stessi della funzione; la restrizione
f|A tuttavia risulta definita nel sottoinsieme A anziché nell’intero insieme
E.
Il concetto di restrizione risulta utile soprattutto nei casi in cui si voglia
ottenere una funzione iniettiva partendo da una funzione arbitraria; in tali
casi infatti si considera un particolare sottoinsieme in cui la proprietà di
iniettività è soddisfatta.
D’altra parte, è sempre possibile ottenere una funzione suriettiva partendo da una qualsiasi funzione; infatti, se f : E → F è una funzione da E
in F , si può considerare la ridotta di f , che si denota con f# , ed è definita
in E, ha f (E) come insieme di arrivo e inoltre, per ogni x ∈ E,
f# (x) := f (x) .
(1.2.13)
Si conclude la presente sezione con qualche precisazione riguardante le
funzioni reali, cioè aventi l’insieme R dei numeri reali come insieme di arrivo.
Il fatto di avere tutto R come insieme di arrivo richiede che l’eventuale
inversa sia definita in tutto R.
Tuttavia, si può utilizzare il seguente procedimento per definire un’inversa anche nel caso di funzioni reali iniettive ma non suriettive (quindi non
aventi tutto R come insieme dei valori).
Sia X un sottoinsieme di R e sia f : X → R una funzione reale iniettiva.
Allora la sua ridotta f# : X → f (X) è iniettiva (in quanto i valori della
ridotta sono gli stessi di quelli della funzione) e suriettiva (in quanto le
ridotte sono sempre suriettive). Quindi f# è invertibile e si può considerare
la funzione inversa (f# )−1 : f (X) → X; si ricorda che, per ogni y ∈ f (X),
risulta (f# )−1 (y) = x dove x è l’unico elemento di X tale che f (x) =
f# (x) = y. A questo punto si definisce la seguente funzione f −1 : f (X) → R
ponendo, per ogni y ∈ f (X),
{
x∈X,
−1
f (y) = x ,
dove x è l’unico elemento tale che
f (x) = y .
La funzione f −1 viene ancora denominata inversa di f e denotata di conseguenza con il simbolo f −1 .
28
Capitolo 1: Preliminari
La funzione f −1 risulta iniettiva in quanto assume gli stessi valori della
funzione (f# )−1 (che è invertibile e quindi biiettiva) mentre può non essere
suriettiva (lo è solo se X = R) in quanto i suoi valori appartengono sempre
all’insieme X.
In questo modo si è definita quindi l’inversa di una funzione iniettiva.
Capitolo 2
Cenni sugli insiemi
numerici
2.1
L’insieme dei numeri naturali e dei numeri interi
L’insieme dei numeri naturali: 0, 1, 2, 3, . . . viene denotato con il simbolo
N.
Tra le proprietà algebriche di N ci si limita a segnalare il fatto che in
N sono definite due operazioni algebriche, l’addizione + : N × N → N e la
moltiplicazione · : N × N → N che hanno le seguenti proprietà
• (Proprietà associativa) Per ogni n, m, p ∈ N si ha
(n + m) + p = n + (m + p) ,
(n · m) · p = n · (m · p) .
Come conseguenza di tale proprietà, la somma e il prodotto di n, m e p
potranno essere denotati semplicemente con n+m+p e rispettivamente
con n · m · p.
• (Proprietà commutativa) Per ogni n, m ∈ N si ha
n+m=m+n,
n·m=m·n.
• (Esistenza dell’elemento neutro) Per ogni n ∈ N si ha
n + 0 = n (= 0 + n) ,
n · 1 = n (= 1 · n) .
Quindi lo 0 è l’elemento neutro per l’addizione mentre 1 è l’elemento
neutro per la moltiplicazione.
Capitolo 2: Cenni sugli insiemi numerici
30
Oltre alle proprietà precedenti valgono anche le seguenti proprietà distributive, per ogni n, m, p ∈ N
n · (m + p) = n · m + n · p .
(A secondo membro si è usata la convenzione che in espressioni in cui intervengono sia somme che prodotti, i prodotti vanno eseguiti per primi
nell’ordine in cui compaiono e poi le somme nell’ordine in cui compaiono.)
Sull’insieme dei numeri naturali è definita anche la seguente relazione
d’ordine:
∀ n, m ∈ N :
n ≤ m ⇔ ∃ h ∈ N t.c. m = n + h .
Si verificano facilmente le proprietà riflessiva, antisimmetrica e transitiva
per tale relazione che quindi viene ad essere una relazione d’ordine. Tra le
sue proprietà conviene tener presente la compatibilità con l’addizione
∀ n, m, p ∈ N :
n≤m ⇒ n+p≤m+p
e con la moltiplicazione
∀ n, m, p ∈ N, p ̸= 0 :
n≤m ⇒ n·p≤m·p.
Inoltre la relazione d’ordine di N è una relazione di totale ordine, nel senso che due qualsiasi numeri naturali sono paragonabili mediante questa
relazione:
∀ n, m ∈ N :
(n ≤ m) ∨ (m ≤ m) ,
da cui segue che, per ogni coppia (n, m) di numeri naturali è vera una ed
una sola delle seguenti affermazioni:
n<m,
n=m,
m<m
(la scrittura n < m è da intendersi come abbreviazione di (n ≤ m) ∧ (n ̸=
m)).
Nonostante le proprietà elencate, dal punto di vista della risoluzione
di equazioni algebriche (cioè equazioni in cui compaiono solamente somme
e prodotti) N non è molto soddisfacente: alcune semplici equazioni come
n + 1 = 0 non ammettono alcuna soluzione in N.
Se si considera l’insieme Z dei numeri interi relativi: . . . , -3, -2, -1, 0, 1,
2, 3, . . . , si ottiene un insieme in cui valgono tutte le proprietà algebriche
precedenti e inoltre per l’addizione vale la seguente proprietà
• (Esistenza dell’inverso per l’addizione) Per ogni n ∈ Z esiste m ∈ Z
tale che n + m = 0 (= m + n) .
2.1 L’insieme dei numeri naturali e dei numeri interi
31
L’elemento m previsto nella proprietà precedente è inoltre unico e viene
denominato opposto di n e denotato con −n. Quindi n + (−n) = 0.
La proprietà precedente consente di considerare in Z l’operazione di
sottrazione ponendo, per ogni n, m ∈ Z,
n − m = n + (−m) .
Anche in Z si può definire una relazione d’ordine nel modo seguente:
∀ n, m ∈ Z :
n≤m ⇔ m−n∈N,
che continua ad essere compatibile con l’addizione e la moltiplicazione in Z
e che risulta anch’essa di totale ordine.
Tuttavia anche in Z se da un lato si può risolvere l’equazione precedente
n + 1 = 0 (proprio sottraendo 1 a primo e secondo membro) è facile trovare
equazioni che non possono essere risolte, come ad esempio 2n + 1 = 0. Per
trovare una soluzione di quest’ultima equazione bisogna ricorrere anche in
questo caso ad un insieme più grande. Prima di occuparci di tale aspetto,
conviene però considerare separatamente un’ulteriore proprietà dei numeri
naturali.
2.1.1
Principio di induzione
Per quanto riguarda l’insieme dei numeri naturali, si richiama la seguente proprietà, la cui dimostrazione è basata sulle proprietà della relazione
d’ordine di N.
Proposizione 2.1.1 (Principio di induzione completa) Se A è un sottoinsieme di N tale che
{
1)
0∈A,
2)
n∈A ⇒ n+1∈A,
allora A = N.
Si supponga che, per ogni n ∈ N, sia assegnata una proprietà P(n);
applicando il principio di induzione all’insieme A := {n ∈ N | P(n)}, si
riconosce che se P(0) è vera e se, supposta vera P(n) per un fissato n ∈ N,
risulta vera anche P(n + 1), allora la proprietà P(n) è vera per ogni n ∈ N.
Naturalmente, se anzichè considerare 0 come punto iniziale si considera
un numero naturale n0 , si avrà che la proprietà P(n) sarà vera per ogni
n ≥ n0 .
La proprietà precedente è equivalente a quella cosiddetta di buon ordine di N, che afferma che ogni sottoinsieme di N è dotato del più piccolo
elemento, cioè
A ⊂ N ⇒ ∃ n0 ∈ A t.c. ∀ n ∈ A : n0 ≤ n .
Capitolo 2: Cenni sugli insiemi numerici
32
Infatti si supponga che valga il principio di induzione completa e sia A un sottoinsieme
non vuoto di N. Se 0 ∈ A si ha che 0 è ovviamente il più piccolo elemento di A e quindi A
è dotato del più piccolo elemento. Si supponga ora 0 ∈
/ A e si ponga B = {n ∈ N | ∀ k =
0, . . . , n : k ∈
/ A} (quindi gli elementi di B sono minori o uguali di tutti gli elementi di
A). Ovviamente 0 ∈ B. Se, per ogni n ∈ B, si ha n + 1 ∈ B allora B verifica le ipotesi del
principio di induzione completa da cui B = N. Segue che A = ∅ e ciò è assurdo. Quindi
deve esistere n0 ∈ B tale che n0 + 1 ∈
/ B. Allora, per ogni k = 0, . . . , n0 , si ha k ∈
/ A
mentre n0 + 1 ∈ A e quindi n0 + 1 è il più piccolo elemento di A.
Viceversa si supponga che valga la proprietà di buon ordine di N e sia A un sottoinsieme di N tale che 0 ∈ A e tale che n ∈ A ⇒ n + 1 ∈ A. Se fosse A ̸= N allora il
complementare B = N r A sarebbe non vuoto e quindi sarebbe dotato del più piccolo
elemento n0 . Si osserva che n0 > 0 in quanto 0 ∈ A; quindi si può considerare n0 − 1
che deve essere in A in quanto n0 è il più piccolo elemento di B e n0 − 1 < n0 . Ma
n0 − 1 ∈ A ⇒ n0 = (n0 − 1) + 1 ∈ A e ciò è assurdo in quanto n0 ∈ B. Quindi si piò
concludere che A = N.
◃ Si osserva infine che la proprietà di buon ordine implica quella di totale
ordine di N: infatti se n, m ∈ N basta applicare la proprietà di buon ordine
all’insieme A = {n, m} per ottenere la validità di una delle relazioni n ≤ m
oppure m ≤ n.
La proprietà di buon ordine, e quindi anche il principio di induzione
completa, non valgono in Z (basta considerare come sottoinsieme A tutto
Z).
2.1.2
Formula del binomio di Newton
Il principio di induzione completa consente di riconoscere agevolmente la
seguente formula del binomio di Newton. È necessario tuttavia introdurre
alcune notazioni preliminari.
Innanzitutto, conviene richiamare la definizione di fattoriale di un numero naturale:
0! := 1 ,
∀ n ∈ N : (n + 1)! := (n + 1) · n! .
(2.1.1)
Si possono definire ora i coefficienti binomiali. Se n ∈ N
( e)k = 0, . . . , n,
n
si definisce coefficiente binomiale n su k, e si denota con
, il seguente
k
numero naturale:
( )
n
n!
n(n − 1) · · · (n − k + 1)
:=
=
.
(2.1.2)
k
k! (n − k)!
k!
Il motivo per cui tale numero viene denominato coefficiente binomiale
risulterà chiaro dallo studio della formula del binomio di Newton.
Si possono elencare le seguenti proprietà elementari dei coefficienti binomiali.
2.1 L’insieme dei numeri naturali e dei numeri interi
1. Per ogni n ∈ N, si ha
33
( )
( )
n
n
= 1,
= 1.
0
n
2. Per ogni n ≥ 2 e k = 1, . . . , n − 1, si ha
( )
n
n · (n − 1) · · · (n − k + 1)
=
.
k
k!
3. Per ogni n ∈ N e k = 0, . . . , n
(
) ( )
n
n
=
.
n−k
k
4. Per ogni n ≥ 1 e k = 1, . . . , n, si ha
(
) ( ) (
)
n+1
n
n
=
+
.
k
k
k−1
Infatti, dalla definizione,
(n) ( n )
n!
n!
(n − k + 1) · n! + k · n!
+
=
+
=
k
k−1
k!(n − k)!
(k − 1)!(n − k + 1)!
k!(n − k + 1)!
(n + 1)
(n + 1)!
(n + 1) · n!
=
=
.
=
k
k!(n − k + 1)!
k!(n − k + 1)!
Proposizione 2.1.2 (Formula del binomio di Newton) Per ogni a, b ∈
R ed n ≥ 1, si ha:
n ( )
∑
n k n−k
n
(a + b) =
a b
.
k
k=0
Dimostrazione. Se n = 1, la tesi è ovvia. Si supponga ora che la tesi sia vera per un
numero naturale n ≥ 1.
Allora, dalle proprietà dei coefficienti binomiali,
(a + b)n+1 = (a + b)n · (a + b) = a · (a + b)n + b · (a + b)n
n ( )
n
∑
n k+1 n−k ∑ (n) k n+1−k
=
a
b
+
a b
k
k
k=0
k=0
=
an+1 +
n−1
∑(
k=0
=
=
=
n ( )
∑
n) k+1 n−k
n k n+1−k
a
b
+ bn+1 +
a b
k
k
k=1
n (
n
∑
n ) h n−h+1 ∑ (n) k n+1−k
a b
a b
+
k
h−1
h=1
k=1
)
n ((
∑
n ) (n)
an+1 + bn+1 +
+
ak bn+1−k
k−1
k
k=1
an+1 + bn+1 +
an+1 + bn+1 +
n (
∑
n + 1)
k=1
=
n+1
∑(
k=0
k
n + 1) k n+1−k
a b
,
k
ak bn+1−k
Capitolo 2: Cenni sugli insiemi numerici
34
e quindi la tesi è vera per il numero naturale n + 1. Dal principio di induzione (Proposizione 2.1.1), si ottiene la tesi.
2.1.3
Cenni di calcolo combinatorio
Si introducono ora alcune definizioni di carattere combinatorio.
Definizione 2.1.3 Siano a1 , . . . , an oggetti distinti. Se k è un intero compreso tra 1 ed n, si definisce disposizione semplice degli n oggetti a k a k,
ogni k-pla (aj1 , . . . , ajk ) formata da k oggetti distinti tra gli n assegnati.
Pertanto due disposizioni di n oggetti a k a k possono differire o per un
oggetto oppure anche per l’ordine in cui gli oggetti vengono considerati.
Il numero delle disposizioni di n oggetti a k a k viene indicato con Dn,k .
Tenendo presente che il primo dei k oggetti può essere scelto tra tutti gli n
oggetti, che il secondo può essere scelto tra i rimanenti n − 1 oggetti e cosı̀
via, il numero delle disposizioni di n oggetti a k a k risulta essere:
Dn,k = n(n − 1) · · · (n − k + 1) .
Nel caso particolare in cui k = n, si preferisce parlare di permutazioni di
n oggetti (distinti) anziché di disposizione di n oggetti ad n ad n. Conviene
osservare che due permutazioni possono differire solamente per l’ordine degli
n oggetti in quanto contengono tutti gli n oggetti disponibili. Indicato con
Pn il numero di permutazioni di n oggetti, si ha quindi
Pn = n! .
Il numero Pn quindi indica il numero di modi possibili in cui si possono
ordinare n oggetti distinti.
Si può fornire a questo punto la definizione di combinazione semplice.
Definizione 2.1.4 Siano a1 , . . . , an oggetti distinti. Se k è un intero compreso tra 1 ed n, si definisce combinazione semplice degli n oggetti a k a k,
ogni insieme {aj1 , . . . , ajk } formato da k oggetti distinti tra gli n assegnati.
A differenza delle disposizioni, due combinazioni distinte di n oggetti
a k a k devono differire per almeno un oggetto (l’ordine in cui gli oggetti
vengono considerati in questo caso non ha importanza).
Il numero delle combinazioni semplici di n oggetti a k a k viene indicato
con Cn,k . Tenendo presente che k oggetti possono differire per l’ordine in
Pk modi distinti e che una combinazione individua quindi Pk disposizioni
distinte, si ha
( )
Dn,k
n
Cn,k =
=
.
Pk
k
2.1 L’insieme dei numeri naturali e dei numeri interi
35
Tale numero rappresenta il numero di tutti i sottoinsiemi formati da k
elementi in un insieme di n elementi.
Fino ad ora sono stati considerati sempre oggetti distinti. In molte
applicazioni, tuttavia, è consentito avere la possibilità di ripetere più volte
uno stesso oggetto. In tali casi si fa ricorso alle definizioni seguenti.
Definizione 2.1.5 Siano a1 , . . . , an oggetti distinti. Se k ≥ 1, si definisce
disposizione con ripetizione degli n oggetti a k a k, ogni k-pla (aj1 , . . . , ajk )
formata da k oggetti non necessariamente distinti tra gli n assegnati.
Due disposizioni con ripetizione di n oggetti a k a k possono differire
per un oggetto, per il numero di volte in cui un oggetto compare oppure per
l’ordine in cui gli oggetti vengono considerati.
Il numero delle disposizioni con ripetizione di n oggetti a k a k viene inr
dicato con Dn,k
. Questa volta, sia il primo dei k oggetti che tutti i successivi
possono essere scelti tra tutti gli n oggetti, e quindi
r
= nk .
Dn,k
Anche ora, nel caso particolare in cui k = n, si preferisce parlare di
permutazioni con ripetizione di n oggetti anziché di disposizione con ripetizione di n oggetti ad n ad n. Indicato con Pnr il numero di permutazioni
con ripetizione di n oggetti, si ha:
Pnr = nn .
Un’ultima definizione riguarda le combinazioni con ripetizione.
Definizione 2.1.6 Siano a1 , . . . , an oggetti distinti. Se k ≥ 1, si definisce
combinazione con ripetizione degli n oggetti a k a k, ogni insieme formato
da k oggetti non necessariamente distinti tra gli n assegnati.
Due combinazioni con ripetizione di n oggetti a k a k possono differire per
un oggetto oppure per il numero di volte in cui un oggetto viene considerato,
indipendentemente però dall’ordine.
Il numero delle combinazioni con ripetizione di n oggetti a k a k viene
r
indicato con Cn,k
.
In questo caso, il fatto che i k oggetti non devono essere necessariamente
distinti equivale a supporre che l’insieme di partenza sia formato da n+k −1
elementi distinti anziché da n elementi distinti e che i k oggetti debbano però
essere distinti tra loro. Da ciò segue:
(
)
n+k−1
r
Cn,k
= Cn+k−1,k =
.
k
Capitolo 2: Cenni sugli insiemi numerici
36
2.2
L’insieme dei numeri razionali e reali
L’insieme dei numeri razionali viene denotato con il simbolo
Q
ed è costituito da tutti i numeri che possono essere espressi nella forma
m
,
n
dove m ∈ Z ed
n ∈ N r {0}.
Un numero razionale q ∈ Q si può rappresentare in forma decimale:
q = a0 , a1 . . . ar ar+1 . . . ar+s
dove a0 ∈ Z, a1 . . . ar+s ∈ {0, 1, . . . , 9} e la parte periodica ar+1 . . . ar+s è
da intendersi ripetuta infinite volte.
Anche l’insieme dei numeri razionali è dotato di una struttura algebrica
e di una struttura di ordine. Per quanto riguarda la struttura algebrica,
oltre alle proprietà precedenti, vale al seguente ulteriore proprietà
• (Esistenza dell’inverso per la moltiplicazione) Per ogni q ∈ Q r {0}
esiste r ∈ Z tale che q · r = 1 (= r · q) .
L’elemento r previsto nella proprietà precedente è inoltre unico e viene
denominato reciproco di n e denotato con 1/q oppure con q −1 . Quindi
q · q −1 = 1.
Si osservi che l’esistenza del reciproco è prevista solo per i numeri diversi
da 0.
La proprietà precedente consente di considerare in Q l’operazione di
divisione ponendo, per ogni q, r ∈ Q,
q
= q · r−1 .
r
Tale proprietà consente di risolvere equazioni algebriche che non era
possibile risolvere nell’insieme Z (come ad esempio 2n + 1 = 0 (sottraendo 1
a primo e secondo membro e moltiplicando entrambi i membri per i reciproco
di 2). Tuttavia anche in questo insieme alcune semplici equazioni algebriche,
come n2 − 2 = 0 non hanno alcuna soluzione. Ciò dipende però non più
dalla struttura algebrica ma dalla proprietà di completezza della relazione
d’ordine che sarà discussa di seguito.
Anche in Q infatti si può definire una relazione d’ordine nel modo seguente:
∀ q, q ′ ∈ Q :
q ≤ q ′ ⇔ m · n′ ≤ m′ · n ,
2.2 L’insieme dei numeri razionali e reali
37
dove m, m′ ∈ Z e n, n′ ∈ N r {0} sono tali che q = m/n e q ′ = m′ /n′ e
la relazione d’ordine a secondo membro è quella già nota nell’insieme Z. Si
riconosce infatti che la proprietà a secondo membro dipende solo dai numeri
razionali q e q ′ e non dalla loro particolare rappresentazione sotto forma di
frazione di numeri interi.
La relazione d’ordine di Q continua ad essere compatibile con l’addizione
e la moltiplicazione in Q e risulta ancora di totale ordine.
Per approfondire lo studio della relazione d’ordine di Q conviene introdurre l’insieme dei numeri reali ed evidenziare le differenze tra i due
insiemi.
L’insieme dei numeri reali, viene denotato con
R
ed è costituito da tutti i numeri che in forma decimale hanno la seguente
rappresentazione
a0 , a1 a2 a3 . . .
dove a0 ∈ Z, a1 a2 a3 · · · ∈ {0, 1, . . . , 9} e non vi è necessariamente una parte
periodica.
Dal punto di vista della struttura algebrica anche in R sono definite
l’addizione e la moltiplicazione tra numeri reali, le cui proprietà sono le
stesse dell’insieme Q.
La relazione d’ordine può essere definita anche nell’insieme dei numeri
reali ponendo per ogni a = a0 , a1 a2 a3 · · · ∈ R e b = b0 , b1 b2 b3 · · · ∈ R,
a ≤ b ⇔ ∀ k ∈ N : a0 , a1 a2 a3 . . . ak ≤ b0 , b1 b2 b3 . . . bk ;
si osservi che per ogni k ∈ N, i numeri a0 , a1 a2 a3 . . . ak e b0 , b1 b2 b3 . . . bk
sono razionali e quindi la relazione d’ordine a secondo membro è quella già
definita in Q.
Si considera ora una proprietà rilevante della relazione d’ordine di R.
Innanzitutto, due sottoinsiemi non vuoti A e B di R (o rispettivamente di
Q) vengono denominati separati in R (o rispettivamente in Q) se è verificata
una delle seguenti condizioni
∀a∈A∀b∈B: a≤b
oppure
∀a∈A∀b∈B: b≤a.
Se due insiemi A e B sono separati, si dice elemento separatore di A e B
ogni numero reale (rispettivamente, razionale) λ tale che
∀a∈A∀b∈B: a≤λ≤b
oppure
∀a∈A∀b∈B: b≤λ≤a.
Inoltre due insiemi A e B separati si dicono contigui se
∀ ε>0 ∃ a∈A ∃ b∈B : b−a<ε
(oppure
a − b < ε) .
Capitolo 2: Cenni sugli insiemi numerici
38
Ovviamente due insiemi continui possono ammettere al più un elemento
separatore in quanto se λ, µ fossero due elementi separatori con λ < µ la
proprietà precedente non sarebbe verificata per ε = µ − λ.
Una proprietà rilevante di R riguarda proprio l’esistenza di elementi
separatori di insiemi separati.
Proposizione 2.2.1 (Assioma di completezza di R) Se A e B sono due sottoinsiemi separati di R, essi ammettono almeno un elemento
separatore.
In particolare se A e B sono contigui, essi ammettono uno ed un solo
elemento separatore.
La proprietà precedente differenzia R da Q. Infatti nell’insieme Q non
vale una proprietà analoga. Ad esempio, i seguenti sottoinsiemi
A = {q ∈ Q | q ≥ 0 , q 2 < 2} ,
B = {q ∈ Q | q ≥ 0 , q 2 > 2}
sono separati in Q (anzi sono contigui) ma non ammettono alcun √
elemento
separatore in Q (in R invece l’elemento separatore di tali insiemi è 2, come
seguirà dal teorema di esistenza della radice n-esima).
Il fatto che
√
√
2 non è razionale si può dimostrare per assurdo supponendo che 2 =
m/n con m, n ∈ Nr{0} primi tra loro; infatti da ciò segue m2 /n2 = 2 e quindi m2 = 2n2 ;
allora m2 è pari e ciò comporta che m stesso sia pari, da cui m = 2p con p ∈ N; sostituendo
2p ad m si ottiene 4p2 = 2n2 da cui n2 = 2p2 ; segue che anche n2 , e conseguentemente
n, deve essere pari e ciò è assurdo in quanto si era supposto che m ed n fossero primi tra
loro.
◃ Come conseguenza della proprietà precedente, in R valgono diverse proprietà tra cui una delle più importanti è il seguente teorema sull’esistenza
della radice n-esima.
Teorema 2.2.2 (Esistenza della radice n-esima) Sia n ≥ 1; allora per
ogni a ∈ R con a ≥ 0 esiste uno ed un solo b ∈ R tale che b ≥ 0 e bn = a.
Se a ∈ R e a ≥ 0, l’unico elemento b ∈ R tale che b ≥ 0 e bn = a viene
denominato radice n-esima di a e denotato con uno dei seguenti simboli
√
n
a,
a1/n .
La dimostrazione del teorema precedente è basata sul fatto che gli insiemi
A = {x ∈ R | x ≥ 0 , xn ≤ a} ,
B = {x ∈ R | x ≥ 0 , xn ≥ a}
sono contigui e quindi, per l’assioma di completezza, in R ammettono un
unico elemento separatore b ∈ R che deve essere positivo e soddisfare
necessariamente la condizione bn = a.
2.2 L’insieme dei numeri razionali e reali
39
Proprio utilizzando il teorema precedente in R è possibile risolvere alcune equazioni algebriche che in Q non avevano alcuna soluzione, come
l’equazione n2 − 2 = 0. Tuttavia anche in R si possono trovare equazioni
algebriche che non hanno soluzioni, come l’equazione n2 + 1 = 0. Per risolvere quest’ultima equazione bisognerà ancora una volta introdurre un nuovo
insieme numerico più grande, quello dei numeri complessi, in cui però tutte
le equazioni algebriche avranno finalmente almeno una soluzione.
◃ Una proprietà importante che conviene osservare riguarda la densità dei
numeri razionali e dei numeri irrazionali in R.
• (Proprietà di densità) Per ogni a, b ∈ R con a < b esistono almeno un
numero razionale q ∈ Q ed un numero reale non razionale r ∈ R r Q
tali che
a<q<b,
a<r<b.
Come conseguenza della proprietà precedente si può affermare che tra
due numeri reali esistono sempre infiniti numeri razionali ed infiniti numeri
reali non razionali.
◃ Si conclude la presente sezione con alcune notazioni spesso utilizzate.
Nel seguito sarà utile utilizzare la convenzione di scrivere un asterisco in
alto a destra ad un insieme per denotare lo stesso insieme privato del numero 0, ed il segno + (oppure −) per denotare gli elementi positivi (oppure
negativi) dell’insieme. Pertanto, ad esempio
R∗ = R r {0},
R∗+ = {x ∈ R | x > 0},
Q− = {q ∈ Q | q ≤ 0}.
◃ Un’altra convenzione riguarda la somma e il prodotto di un numero
finito di elementi di un insieme numerico: assegnati i numeri a1 , . . . , an si
pone
n
n
∑
∏
ak := a1 + . . . an ,
ak := a1 · · · an .
k=1
2.2.1
k=1
Insiemi numerabili
Una ulteriore proprietà dell’insieme dei numeri reali, che distingue tale insieme da quelli numerici introdotti in precedenza, riguarda il fatto che esso
è un infinito di ordine maggiore rispetto all’insieme dei numeri razionali,
come viene messo brevemente in evidenza nel presente paragrafo.
Innanzitutto conviene assumere la seguente definizione di carattere generale. Un insieme E si dice numerabile se esiste una funzione biiettiva
φ : N → E (o equivalentemente se esiste una funzione biiettiva ψ : E → N).
40
Capitolo 2: Cenni sugli insiemi numerici
L’esistenza di una funzione biiettiva definita in N comporta che gli elementi di E possano essere “contati” enumerando successivamente i valori
della funzione:
φ(0), φ(1), φ(2), φ(3), . . .
e ciò giustifica la denominazione “numerabile” attribuita all’insieme.
Come conseguenza della definizione, segue subito che N è numerabile.
Inoltre ogni sottoinsieme non vuoto di un insieme numerabile o è finito
oppure è numerabile. Quindi gli insiemi numerabili sono gli insiemi infiniti
“più piccoli”.
Da tale osservazione segue subito, ad esempio, che gli insiemi dei numeri
pari, dei numeri dispari, dei numeri primi sono tutti numerabili.
Si osserva ancora che se esiste una funzione suriettiva da un insieme numerabile E in un insieme F (oppure equivalentemente una funzione iniettiva
da F in un insieme numerabile E) allora F è finito oppure numerabile.
◃ Si riconosce ora che Z è un insieme numerabile. Infatti, una “enumerazione” degli elementi di Z è la seguente
0, 1, −1, 2, −2, 3, −3, 4, −4, 5, −5, . . . ;
la corrispondente funzione biiettiva φ : N → Z si può in questo caso definire
ponendo, per ogni n ∈ N,
[
]
n+1 n + 1
φ(n) = (−1)
,
2
dove [·] denota la funzione parte intera.
◃ Per dimostrare che anche l’insieme dei numeri razionali Q è numerabile, conviene prima osservare che il prodotto di due insiemi numerabili è
numerabile.
Infatti se E ed F sono numerabili e se φ : E → N e ψ : F → N sono biiettive allora
anche la funzione χ : E × F → N definita ponendo, per ogni (m, n) ∈ E × F ,
(m + n)(m + n + 1)
+m
2
è una funzione biiettiva e quindi il prodotto E × F è numerabile.
La funzione χ conta gli elementi del prodotto su ogni diagonale in cui la somma
χ(m, n) =
m + n è costante; infatti si parte da m + n = 0 e si ottiene l’unica coppia (0, 0) alla quale
corrisponde 0; si considerano poi gli indici per cui m + n = 1 e si ottengono le coppie
(0, 1) e (1, 0) alle quali corrisponde 1 e 2; poi si considerano gli indici tali che m + n = 2
e si ottengono le coppie (2, 0), (1, 1) e (0, 2) alle quali corrispondono i numeri naturali 3,
4 e 5 e cosı̀ via. Tale procedimento viene denominato per diagonali.
◃ A questo punto si osserva che il prodotto cartesiano Z × (N r {0}) è
numerabile in quanto prodotto di insiemi numerabili.
2.3 Proprietà dei sottoinsiemi di R
41
Si consideri ora la funzione ψ : Z × (N r {0}) → Q definita ponendo, per
ogni (m, n) ∈ Z × (N r {0}),
ψ(m, n) =
m
.
n
Poiché ψ è suriettiva (quindi Q può essere considerato come un sottoinsieme
del prodotto cartesiano Z×(Nr{0})) allora anche Q deve essere numerabile.
◃ Infine si dimostra che R non è numerabile.
Si consideri infatti una funzione φ : N → R e si definisca il seguente
numero reale
a = a0 , a1 a2 a3 . . .
ponendo a0 uguale alla parte intera di φ(0) aumentata di 1, a1 uguale alla
prima cifra decimale di φ(1) aumentata di 1 oppure uguale a 0 se tale cifra
è uguale a 9, a2 uguale alla seconda cifra decimale di φ(2) aumentata di
1 oppure uguale a 0 se tale cifra è uguale a 9, e cosı̀ via. Allora è chiaro
che a è diverso da ogni elemento φ(n), n ∈ N, e quindi φ non può essere
suriettiva.
Quindi non può esistere alcuna funzione suriettiva (e tanto meno biiettiva) da N in R e da ciò segue la non numerabilità di R.
Proprietà dei sottoinsiemi di R
2.3
In questa sezione vengono raccolte diverse proprietà dei sottoinsiemi di R
che saranno utili per lo studio delle funzioni reali.
2.3.1
Intervalli di R
Innanzitutto si introducono alcuni sottoinsiemi di R di particolare rilevanza.
Essi vengono denominati intervalli di R:
• Intervalli limitati. Siano a, b ∈ R tali che a < b. Si pone:
[a, b] = {x ∈ R | a ≤ x ≤ b} (intervallo limitato chiuso di estremi
a e b);
]a, b[= {x ∈ R | a < x < b} (intervallo limitato aperto di estremi
a e b);
[a, b[= {x ∈ R | a ≤ x < b} (intervallo limitato semichiuso a
sinistra (oppure semiaperto a destra) di estremi a e b);
]a, b] = {x ∈ R | a < x ≤ b} (intervallo limitato semiaperto a
sinistra (oppure semichiuso a destra) di estremi a e b);
Capitolo 2: Cenni sugli insiemi numerici
42
• Intervalli illimitati. Sia c ∈ R. Si pone:
[c, +∞[= {x ∈ R | c ≤ x} (intervallo illimitato a destra chiuso di
estremo c);
]c, +∞[= {x ∈ R | c < x} (intervallo illimitato a destra aperto di
estremo c);
] − ∞, c] = {x ∈ R | x ≤ c} (intervallo illimitato a sinistra chiuso
di estremo c);
] − ∞, c[= {x ∈ R | x < c} (intervallo illimitato a destra aperto
di estremo c).
Le notazioni [c, → [ e ] ←, c] sono equivalenti a [c, +∞[ e ] − ∞, c].
◃ Se x0 ∈ R e δ ∈ R∗+ , si denomina intervallo centrato aperto (rispettivamente, chiuso) di centro x0 e raggio δ, l’intervallo aperto ]x0 − δ, x0 + δ[
(rispettivamente, l’intervallo chiuso [x0 − δ, x0 + δ]). Nel seguito, sarà
opportuno ricorrere alle seguenti notazioni:
Iδ (x0 ) =]x0 − δ, x0 + δ[ ,
2.3.2
Iδ+ (x0 ) = [x0 , x0 + δ[ ,
Iδ− (x0 ) =]x0 − δ, x0 ] .
(2.3.1)
Valore assoluto e distanza in R
Per ogni x ∈ R, il valore assoluto di x viene denotato con |x| ed è definito
al modo seguente
{
x,
se x ≥ 0 ,
|x| :=
(2.3.2)
−x ,
se x < 0 .
In base alla definizione precedente, si dimostrano facilmente le seguenti
proprietà, valide per ogni x, y ∈ R.
1. |x| ≥ 0 ;
2. |x| = 0 ⇔ x = 0 ;
3. | − x| = |x| ;
4. x ≤ |x| ;
5. |x · y| = |x| · |y| ;
6. |x + y| ≤ |x| + |y| ;
(infatti, se x + y ≥ 0, dalla proprietà 4., |x + y| = x + y ≤ |x| + |y|, mentre, se
x + y < 0, sempre dalle 4. e 3., |x + y| = −x − y ≤ | − x| + | − y| = |x| + |y|).
2.3 Proprietà dei sottoinsiemi di R
43
7. | |x| − |y| | ≤ |x − y| ;
(infatti, se |x| − |y| ≥ 0, dalla proprietà 6. si ha |x| = |(x − y) + y| ≤ |x − y| + |y| e
quindi | |x| − |y| | = |x| − |y| ≤ |x − y|; se |x| − |y| < 0, si procede allo stesso modo
invertendo i ruoli di x e y.)
Nello studio delle disequazioni che coinvolgono il valore assoluto risultano
inoltre particolarmente utili le proprietà seguenti, in cui il valore assoluto
viene confrontato con un numero reale a.
8.
i) se a < 0, la diseguaglianza |x| ≤ a non è mai soddisfatta;
ii) se a ≥ 0, si ha |x| ≤ a se e solo se −a ≤ x ≤ a.
9.
i) se a ≤ 0, la diseguaglianza |x| < a non è mai soddisfatta;
ii) se a > 0, si ha |x| < a se e solo se −a < x < a.
10.
i) se a ≤ 0, la diseguaglianza |x| ≥ a è sempre soddisfatta;
ii) se a > 0, si ha |x| ≥ a se e solo se x ≤ −a oppure x ≥ a;
11.
i) se a < 0, la diseguaglianza |x| > a è sempre soddisfatta;
ii) se a ≥ 0, si ha |x| > a se e solo sex < −a oppure x > a.
Il valore assoluto di un numero reale consente di definire la distanza tra
due numeri reali. Precisamente, per ogni coppia di numeri reali (x, y) ∈ R2 ,
la distanza di x da y viene denotata con d(x, y) ed è definita ponendo
d(x, y) := |x − y| .
Valgono le seguenti proprietà della distanza, che seguono direttamente
dalle proprietà 1., 2., 3. e 6. del valore assoluto elencate sopra.
1. ∀ (x, y) ∈ R2 : d(x, y) ≥ 0 ;
2. ∀ (x, y) ∈ R2 : d(x, y) = 0 ⇔ x = y ;
3. ∀ (x, y) ∈ R2 : d(y, x) = d(x, y) (proprietà simmetrica della distanza);
4. ∀ (x, y, z) ∈ R3 : d(x, z) ≤ d(x, y) + d(y, z) (proprietà triangolare
della distanza).
44
2.3.3
Capitolo 2: Cenni sugli insiemi numerici
Rappresentazione geometrica di Rn , n ≤ 3
Nello studio delle funzioni reali, di interesse centrale nel seguito, sarà di
notevole aiuto la rappresentazione geometrica sia di R che di R2 e, per le
funzioni di due variabili, anche di R3 .
L’insieme dei numeri reali viene solitamente rappresentato come l’insieme dei punti di una retta. Infatti, sia r una retta e si fissino due punti
distinti O e U di r corrispondenti ai numeri reali 0 e 1. La semiretta avente
O come estremo e contenente il punto U viene denominata semiasse positivo
ed indicata con r+ ; analogamente, la semiretta di estremo O non contenente
il punto U viene denominata semiasse negativo ed indicata con r− . Si può
allora definire una corrispondenza tra un numero reale x ed uno ed un solo
elemento P della retta r prendendo il segmento OU come unità di misura e
considerando il segmento OP avente lunghezza x con P in r+ se x è positivo
e P in r− se x è negativo. Viceversa, la stessa corrispondenza consente di
far corrispondere ad ogni punto P della retta uno ed un solo numero reale
x. In questo modo ogni numero reale viene identificato con un punto della
retta r e viceversa. Per questo motivo la retta r (o l’insieme R) viene anche
denominata retta reale cosı̀ come gli elementi di R vengono spesso chiamati
punti. Infine la semiretta positiva r+ (denominata anche semiretta positiva)
viene spesso evidenziata mediante una freccia come in Figura 2.1.
:
r
•
•
1
0
Figura 2.1: Rappresentazione geometrica dei numeri reali.
Si considera ora una rappresentazione del prodotto cartesiano R2 . In
questo caso si fissano due rette r1 ed r2 non parallele su un piano π. Si
denota con O il punto di intersezione di r1 ed r2 ed inoltre su ognuna delle
due rette si considera un ulteriore punto distinto da O che verrà denotato
con U1 e rispettivamente U2 . In questo modo si dice che è stato assegnato un riferimento cartesiano ed il piano π viene anche denominato piano
cartesiano. Ad ogni (x, y) ∈ R2 , si può far corrispondere una ed una sola
coppia (P1 , P2 ) con P1 ∈ r1 e P2 ∈ r2 (in quanto sulle rette r1 ed r2 si
può considerare una rappresentazione dei numeri reali) e successivamente
si può considerare il punto P del piano π ottenuto come intersezione delle
2.3 Proprietà dei sottoinsiemi di R
45
rette parallele ad r2 ed r1 e passanti per P1 e rispettivamente P2 (vedasi la
Figura 2.2).
0
y •P
x
-
Figura 2.2: Riferimento cartesiano non ortogonale.
Anche ora con il procedimento inverso, ad ogni punto del piano π si può
far corrispondere una ed una sola coppia di numeri reali. Quindi il piano π
può essere identificato con il prodotto cartesiano R2 .
Il punto O viene denominato origine del riferimento cartesiano e corrisponde ovviamente alla coppia (0,0) (mentre i punti U1 e U2 corrispondono
alle coppie (1,0) e rispettivamente (0,1)).
La retta r1 viene denominata asse delle ascisse e la retta r2 asse delle
ordinate. Inoltre le coordinate della coppia (x, y) al quale corrisponde il
punto P di π vengono anche denominate ascissa e ordinata di P ed il punto
P di coordinate (x, y) viene indicato anche con P (x, y).
Nel caso particolare in cui le due rette r1 e r2 siano perpendicolari, il
riferimento cartesiano si dice ortogonale. Se, in più, i punti U1 ed U2 su r1 e
rispettivamente r2 vengono fissati alla stessa distanza dall’origine O, allora
il riferimento ortogonale viene denominato ortonormale (vedasi la Figura
2.3).
Conviene osservare che la rappresentazione geometrica di R2 su un piano cartesiano consente di definire anche in R2 una distanza con le stesse
proprietà di quella già precedentemente introdotta in R. Infatti, per ogni
coppia x = (x1 , x2 ) e y = (y1 , y2 ) di elementi di R2 la distanza di x da y
viene indicata con d(x, y) ed è definita ponendo
√
d(x, y) := (y1 − x1 )2 + (y2 − x2 )2 .
Capitolo 2: Cenni sugli insiemi numerici
46
6
y
0 P
•
x
-
Figura 2.3: Riferimento cartesiano ortonormale.
◃ La rappresentazione geometrica di R3 si può ottenere in maniera del
tutto analoga a quella discussa considerando tre rette non complanari r1 , r2
ed r3 nello spazio Σ, che si intersecano in un punto 0. Su ognuna delle rette
r1 , r2 ed r3 , che per semplicità vengono supposte perpendicolari tra loro,
viene fissato un ulteriore punto distinto da O e che viene denotato rispettivamente con U1 , U2 e U3 . Il piano contenente le rette r1 , r2 viene spesso
denominato piano xy, quello contenente le rette r1 , r3 viene denominato
piano xz ed infine il piano contenente le rette r2 , r3 viene denominato piano
yz.
Anche in questo caso si dice che è stato assegnato un riferimento cartesiano nello spazio Σ, che viene denominato spazio euclideo. Ad ogni
(x, y, z) ∈ R3 , si può far corrispondere una ed una sola terna (P1 , P2 , P3 )
con P1 ∈ r1 , P2 ∈ r2 e P3 ∈ r3 e successivamente si può considerare il punto
P di Σ ottenuto come intersezione dei piani paralleli ai piani yz, xz e xy e
passanti rispettivamente per i punti P1 , P2 e P3 (vedasi la Figura 2.4).
Il procedimento inverso fa corrispondere ad ogni punto di Σ una ed una
sola terna di numeri reali. Quindi lo spazio Σ può essere identificato con il
prodotto cartesiano R3 .
Anche ora il punto O viene denominato origine del riferimento cartesiano
e corrisponde ovviamente alla terna (0,0,0) (mentre i punti U1 , U2 e U3
corrispondono alle terne (1,0,0), (0,1,0) e rispettivamente (0,0,1)).
La retta r1 viene denominata asse delle ascisse, la retta r2 asse delle
ordinate e infine la retta r3 asse delle altezze.
2.3 Proprietà dei sottoinsiemi di R
47
z6
•
x +
P
y
0
Figura 2.4: Riferimento cartesiano dello spazio.
Inoltre le coordinate della terna (x, y, z) alla quale corrisponde il punto
P di Σ vengono anche denominate ascissa, ordinata e altezza (oppure quota)
di P ed il punto P di coordinate (x, y, x) viene indicato anche con P (x, y, z).
◃ Per n ≥ 4 non è possibile una rappresentazione geometrica di Rn ;
tuttavia, è ancora possibile considerare una distanza che verifica le stesse
proprietà di quella introdotta in R.
Si supponga infatti n ≥ 3. Per ogni coppia di n-ple x = (x1 , . . . , xn ) e
y = (y1 , . . . , yn ) di elementi di Rn , infatti, si può definire la distanza d(x, y)
di x da y ponendo
v
u n
u∑
d(x, y) := t (yi − xi )2 .
i=1
2.3.4
Sottoinsiemi limitati ed estremi
Nella presente sezione si richiamano alcune nozioni relative ai sottoinsiemi
di R che verranno utilizzate in seguito per definire altrettante proprietà delle
funzioni reali.
Sia X un sottoinsieme non vuoto di R. Valgono le seguenti definizioni.
Capitolo 2: Cenni sugli insiemi numerici
48
• Sottoinsiemi limitati. Si dice che X è limitato superiormente (rispettivamente, limitato inferiormente) se
∃ M ∈ R t.c. ∀ x ∈ X : x ≤ M
(rispettivamente, M ≤ x ). (2.3.3)
Ogni elemento M ∈ R verificante la (2.3.3) viene denominato maggiorante (rispettivamente, minorante) di X. Infine, si dice che X è
limitato se è limitato sia superiormente che inferiormente, cioè se
∃ m, M ∈ R t.c. ∀ x ∈ X : m ≤ x ≤ M .
(2.3.4)
Gli intervalli illimitati a sinistra sono particolari esempi di sottoinsiemi limitati superiormente di R, gli intervalli illimitati a destra sono
esempi di sottoinsiemi limitati inferiormente di R ed infine gli intervalli limitati sono sottoinsiemi limitati di R. Viceversa, ogni sottoinsieme
limitato superiormente di R è un sottoinsieme di un intervallo illimitato a sinistra, ogni sottoinsieme limitati inferiormente è un sottoinsieme
di un intervallo illimitato a destra ed ogni sottoinsieme limitato di R
è un sottoinsieme di un intervallo limitato di R.
• Sottoinsiemi dotati di massimo e minimo. Si dice X è dotato di
massimo (rispettivamente, dotato di minimo) se
∃ M ∈ X t.c. ∀ x ∈ X : x ≤ M
(rispettivamente, M ≤ x ). (2.3.5)
(A differenza dei maggioranti e minoranti in cui M ∈ R, questa volta si
pretende M ∈ X.) L’elemento M verificante la (2.3.5), univocamente
determinato dalla condizione M ∈ X, viene denominato massimo di
X (rispettivamente, minimo di X) e denotato con uno dei seguenti
simboli:
max X ,
max x ,
x∈X
(rispettivamente, min X ,
min x ).
x∈X
Gli intervalli semichiusi a destra sono particolari esempi di sottoinsiemi dotati di massimo e quelli semichiusi a sinistra di sottoinsiemi
dotati di minimo.
• Sottoinsiemi dotati di estremi. Si dice X è dotato di estremo
superiore (rispettivamente, dotato di estremo inferiore) se esiste un
elemento ℓ ∈ R tale che

∀ x ∈ X : x ≤ ℓ (rispettivamente, ℓ ≤ x );
 1)
2)
m ∈ R, ∀ x ∈ X : x ≤ m ⇒ ℓ ≤ m
(2.3.6)

(rispettivamente, ∀ x ∈ X : m ≤ x ⇒ m ≤ ℓ ).
2.3 Proprietà dei sottoinsiemi di R
49
Anche in questo caso l’elemento ℓ verificante la (2.3.6) è unico, viene
denominato estremo superiore di X (rispettivamente, estremo inferiore di X) e viene denotato con
sup X ,
sup x ,
(rispettivamente, inf X ,
x∈X
inf x ).
x∈X
La seconda proprietà in (2.3.6) si può esprimere in maniera equivalente
come segue
∀ ε ∈ R∗+ ∃ x ∈ X t.c. ℓ−ε < x (rispettivamente, x < ℓ+ε ). (2.3.7)
Una proprietà notevole dei sottoinsiemi di R è la seguente.
Proposizione 2.3.1 (Seconda forma dell’assioma di completezza)
Ogni sottoinsieme non vuoto limitato superiormente (rispettivamente, limitato inferiormente) di R è dotato (in R) di estremo superiore (rispettivamente, di estremo inferiore).
Si riconosce facilmente che la seconda forma dell’assioma di completezza
è equivalente all’assioma di completezza. Infatti si supponga che valga la
Proposizione 2.2.1 e sia X un sottoinsieme non vuoto e limitato superiormente di R. Allora l’insieme M dei maggioranti di X è non vuoto e inoltre
X ed M sono ovviamente separati. Dalla Proposizione 2.2.1 esiste un elemento separatore ℓ ∈ R di X ed M e quindi risulta, per ogni x ∈ X e per
ogni m ∈ M , x ≤ ℓ ≤ m; dalla prima di tali diseguaglianze segue che ℓ è un
maggiorante di X e dalla seconda che ℓ è il più piccolo maggiorante di X.
Quindi ℓ = sup X.
Si supponga ora che valga la seconda forma dell’assioma di completezza
e siano A e B sottoinsiemi non vuoti e separati di R per i quali si abbia, per
ogni a ∈ A e per ogni b ∈ B, a ≤ b. Allora A è limitato superiormente in
quanto ogni elemento di B è un maggiorante di A. Dalla Proposizione 2.3.1
si può considerare ℓ = sup A. Quindi per ogni a ∈ A risulta a ≤ ℓ in quanto
ℓ è un maggiorante di A; inoltre ogni elemento b ∈ B è un maggiorante
di A e quindi deve essere, per definizione di estremo superiore, ℓ ≤ b. Si
conclude che ℓ è un elemento separatore di A e B e quindi vale l’assioma di
completezza enunciato nella Proposizione 2.2.1.
◃ Nel caso in cui un insieme non sia limitato superiormente (rispettivamente, inferiormente), esso non è dotato di estremo superiore (rispettivamente,
inferiore); in tal caso, si scriverà per convenzione
sup X = +∞ ,
(rispettivamente, inf X = −∞ ).
(2.3.8)
Capitolo 2: Cenni sugli insiemi numerici
50
2.3.5
Intorni e punti di accumulazione
Ogni sottoinsieme I di R contenente un intervallo centrato di centro x0
viene denominato intorno di x0 ; analogamente, ogni sottoinsieme I di R
per cui esista δ ∈ R∗+ tale che Iδ+ (x0 ) ⊂ I (rispettivamente, Iδ− (x0 ) ⊂ I)
viene denominato intorno destro (rispettivamente, intorno sinistro) di x0 .
L’insieme degli intorni di x0 viene denotato con il simbolo I(x0 ); inoltre,
l’insieme degli intorni destri (rispettivamente, sinistri) di x0 viene denotato
con I + (x0 ) (rispettivamente, I − (x0 )).
Per convenzione, inoltre, si denominerà intorno di +∞ (rispettivamente,
di −∞) ogni sottoinsieme di R contenente un intervallo illimitato a destra
(rispettivamente, a sinistra) ed il loro insieme verrà denotato con I(+∞)
(rispettivamente, I(−∞)).
◃ Infine, si dice che x0 ∈ R ∪ {−∞, +∞} è un punto di accumulazione per
un sottoinsieme X di R se, per ogni intorno I di x0 ,
X ∩ I r {x0 } ̸= ∅
(2.3.9)
(quindi, in ogni intorno di x0 vi sono elementi di X diversi da x0 ). Se x0 ∈ R
e la condizione precedente è verificata per ogni intorno destro (rispettivamente, sinistro) di x0 , si dice che x0 è un punto di accumulazione a destra
(rispettivamente, a sinistra) per X.
2.3.6
La retta ampliata dei numeri reali
Per semplificare l’esposizione di alcuni argomenti, può essere utile introdurre
l’insieme
R = R ∪ {−∞, +∞} ,
(2.3.10)
dove −∞ e +∞ sono due oggetti distinti non appartenenti ad R. Tale
insieme viene denominato insieme ampliato dei numeri reali oppure più
brevemente R ampliato. Per denotarlo, possono essere usati anche i simboli:
b oppure R.
e
R
I concetti di intorno e di punto di accumulazione possono essere estesi
anche in R.
Precisamente un intorno di +∞ (rispettivamente, di −∞) viene inteso
come un sottoinsieme I di R che contiene un intervallo illimitato a destra
(rispettivamente, a sinistra):
∃ c ∈ R t.c. ]c, +∞[⊂ I ,
(rispettivamente, ∃ c ∈ R t.c. ] − ∞, c[⊂ I ).
L’insieme degli intorni di +∞ (rispettivamente, di −∞) viene denotato
con il simbolo I(+∞) (rispettivamente, I(−∞)).
2.3 Proprietà dei sottoinsiemi di R
51
In questo caso non ha senso considerare intorni destri e sinistri di +∞
o di −∞.
◃ Infine, si dice che +∞ (rispettivamente, −∞) è un punto di accumulazione per un sottoinsieme X di R se, per ogni intorno I di +∞ (rispettivamente,
−∞), risulta X ∩ I ̸= ∅ (in questo caso i punti +∞ e −∞ sicuramente non
appartengono ad X ∩ I in quanto tale intersezione è un sottoinsieme di R).
Quindi +∞ (rispettivamente, −∞) è un punto di accumulazione per X
se e solo se
∀ c ∈ R : X∩]c, +∞[̸= ∅ ,
(rispettivamente, ∀ c ∈ R : X∩] − ∞, c[̸= ∅ )
e quest’ultima condizione equivale al fatto che X non è dotato di maggioranti (rispettivamente, di minoranti) e quindi al fatto che X non è limitato
superiormente in R (rispettivamente, non è limitato inferiormente in R).
Capitolo 3
Numeri complessi e
polinomi
3.1
Proprietà generali dei numeri complessi
Nell’insieme dei numeri reali R non è possibile risolvere tutte le equazioni
algebriche; ad esempio, l’equazione x2 + 1 = 0 non ammette alcuna soluzione reale. L’insieme dei numeri complessi permetterà di risolvere in modo
definitivo tale problema nel senso che, in tale insieme, tutte le equazioni
algebriche ammetteranno almeno una soluzione. Tuttavia in tale estensione
si perdono alcune proprietà importanti di R, come quelle relative alla relazione d’ordine: nell’insieme dei numeri complessi non è possibile definire
una relazione d’ordine totale compatibile con le operazioni algebriche.
Partendo proprio dall’equazione x2 +1 = 0, se si vuole che essa ammetta
almeno una soluzione, bisogna ammettere l’esistenza di un elemento il cui
quadrato sia −1. Tale elemento, che non può essere un numero reale in
quanto i quadrati dei numeri reali sono sempre positivi, verrà denotato con i
e verrà denominato unità immaginaria. Quindi il ‘numero’ i è caratterizzato
dalla proprietà:
i2 = −1 .
(3.1.1)
Assunta l’esistenza del numero i, anche l’equazione più generale x2 + b2 = 0
(b ∈ R) ammetterà le soluzioni i · b e −i · b; più in generale, le equazioni di
secondo grado della forma (x − a)2 + b2 = 0, con a, b ∈ R ammetteranno
le soluzioni a ± i · b (si può riconoscere facilmente che tutte le equazioni di
secondo grado con discriminante ∆ < 0 si possono scrivere in tale forma).
Tuttavia, bisogna tener presente che le operazioni di addizione e moltiplicazione utilizzate nel simbolo a + i · b non sono state compiutamente definite
54
Capitolo 3: Numeri complessi e polinomi
ma presuppongono un’estensione delle proprietà algebriche dei numeri reali. Per rendere più precisa tale estensione, conviene innanzitutto osservare
che tali numeri sono caratterizzati dalla coppia (a, b) di numeri reali. In
questo modo, è possibile trasferire lo studio di tali operazioni algebriche
nell’insieme già noto R2 . In R2 l’addizione viene definita ponendo, per ogni
(a, b) ∈ R2 , (c, d) ∈ R2 ,
(a, b) + (c, d) = (a + c, b + d) .
(3.1.2)
Tale addizione verifica le proprietà associativa e commutativa, e inoltre l’elemento neutro 0 è dato dalla coppia (0,0); infine, per ogni (a, b) ∈ R2 ,
l’opposto di (a, b), che si denota con −(a, b), è la coppia (−a, −b).
La moltiplicazione di R2 viene invece definita nel seguente modo, per
ogni (a, b) ∈ R2 , (c, d) ∈ R2 ,
(a, b) · (c, d) = (a · c − b · d, a · d + b · c)
(3.1.3)
Anche per la moltiplicazione è facile riconoscere la validità delle proprietà associativa e commutativa, l’esistenza dell’elemento neutro 1 dato dalla coppia
(1,0) e, per ogni (a, b) ̸= (0, 0), l’esistenza dell’elemento inverso (reciproco
1
di (a, b)) che si denota con (a, b)−1 oppure con
, ed è dato dalla coppia
(a, b)
(
)
a
−b
,
a2 + b2 a2 + b2
L’insieme R2 , munito dell’addizione e della moltiplicazione definite rispettivamente dalla (3.1.2) e dalla (3.1.3) viene denominato insieme dei
numeri complessi e denotato con il simbolo C.
Se z = (a, b) ∈ C, il numero (reale) a viene denominato parte reale di
z e denotato con Re z, mentre il numero (reale) b viene denominato parte
immaginaria di z e denotato con il simbolo Im z. In questo modo un numero
complesso z può essere rappresentato come z = (Re z, Im z). La coppia
(Re z, Im z) viene anche denominata forma geometrica di z.
Partendo da una discussione riguardante la possibilità di ottenere delle
soluzioni di opportune equazioni algebriche, si è cosı̀ giunti ad introdurre
l’insieme C, i cui elementi sono stati individuati mediante coppie di numeri
reali. In tale corrispondenza, l’unità immaginaria i è rappresentata ovviamente dalla coppia (0,1). Inoltre un numero reale a è rappresentato dalla
coppia (a, 0); in questo senso l’insieme R dei numeri reali può essere considerato come un sottoinsieme di C, in quanto può essere identificato con
il sottoinsieme di C costituito da tutti gli elementi di C aventi parte immaginaria nulla. Tenendo presente tale identificazione, si ottiene, per ogni
3.1 Proprietà generali dei numeri complessi
55
(a, b) ∈ C,
(a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1) · (b, 0) = (a, 0) + i · (b, 0) = a + i · b ;
si ottiene cosı̀ un’espressione diversa del numero complesso z, detta forma
algebrica di z.
La forma geometrica dei numeri complessi rende possibile la loro rappresentazione come elementi di un piano, sul quale sia stato fissato un sistema
di assi cartesiani; in tal caso si preferisce parlare di piano complesso anziché
di piano cartesiano e di asse reale e asse immaginario anziché di asse delle
ascisse e rispettivamente delle ordinate; tale denominazione è giustificata
dal fatto che tutti e soli i numeri reali considerati come numeri complessi
aventi parte immaginaria nulla vengono cosı̀ a trovarsi sull’asse reale, mentre tutti e soli i numeri complessi aventi parte reale nulla vengono a trovarsi
sull’asse immaginario (gli elementi dell’asse immaginario vengono anche per
questo denominati spesso numeri immaginari puri). L’unità di C rappresenta l’unità sull’asse reale mentre l’unità immaginaria rappresenta l’unità
sull’asse immaginario. Naturalmente, anziché parlare di ascissa ed ordinata
di un numero complesso si preferisce utilizzare le definizioni già introdotte
di parte reale e di parte immaginaria.
La possibilità di considerare diverse forme di un numero complesso è
utile in quanto il grado di difficoltà nello svolgere le varie operazioni in
C dipende spesso dalla forma che si sta adoperando. Inoltre, è chiara la
possibilità di passare in modo immediato dalla forma algebrica a quella
geometrica e viceversa. Si è già visto, ad esempio, che l’unità immaginaria
i si scrive (0,1) in forma geometrica; come ulteriore esempio, si osserva che
l’elemento nullo 0 corrisponde alla coppia (0,0) e l’elemento unità 1 alla
coppia (1,0). Si riconsiderano ora le operazioni descritte sopra utilizzando
la forma algebrica. Siano z = a + ib e w = c + id elementi di C. Allora
(a + ib) + (c + id) = (a + c) + i(b + d) ,
(a + ib) · (c + id) = (ac − bd) + i(ad + bc)
e quindi l’addizione e la moltiplicazione in forma algebrica seguono le regole
classiche della somma e del prodotto di due binomi. Inoltre, −z = −a+i(−b)
e, se z ̸= 0,
a
b
z −1 = 2
−i 2
.
a + b2
a + b2
Conviene tenere presente, inoltre, che calcolando le potenze dell’unità
immaginaria i, si ottiene
i0 = 1 ,
i1 = i ,
i2 = −1 ,
i3 = i2 · i = −i ,
i4 = i2 · i2 = 1 ,
... ;
Capitolo 3: Numeri complessi e polinomi
56
come si vede, le potenze di i si ripetono di quattro in quattro, cioè vale la
proprietà ip+4 = ip per ogni p ∈ N.
Due numeri complessi in forma algebrica o geometrica coincidono se e
solo se coincidono sia le loro parti reali che le loro parti immaginarie.
Si è visto nelle considerazioni iniziali che le soluzioni delle equazioni di
secondo grado a coefficienti reali sono del tipo a ± ib; assegnato, quindi,
un numero complesso z = a + ib, ha un ruolo sicuramente importante il
numero complesso w = a − ib, che ha la stessa parte reale di z, ma parte
immaginaria opposta; esso viene denominato numero complesso coniugato
di z e denotato con il simbolo z.
Infine, come si vede dal calcolo del reciproco di un numero complesso
diverso da 0, è anche
utile definire, per ogni numero complesso z = a + ib,
√
il numero reale a2 + b2 , il quale prende il nome di modulo di z e viene
denotato con il simbolo |z| (l’uso dello stesso simbolo che rappresenta il
valore assoluto di un numero reale non dà luogo ad equivoci in quanto, se
si considera un numero √
reale a ∈ R√come numero complesso della forma
z = a + i · 0, si ha |z| = a2 + 02 = a2 = |a|).
Nel piano complesso, il coniugato di un numero complesso z è il simmetrico di z rispetto all’asse reale mentre il modulo rappresenta la distanza di
z dall’origine.
Seguono ora alcune proprietà del coniugato e del modulo di un numero
complesso.
Proposizione 3.1.1 Per ogni z = a + ib ∈ C e w = c + id ∈ C, valgono le
seguenti proprietà:
1. z + w = z + w ,
z·w =z·w .
2. z = z .
3. z + z = 2 Re z ,
z − z = 2 Im z .
4. z · z = |z|2 .
5. | − z| = |z| .
6. |z| = |z| .
7. Re z ≤ |z| ,
Im z ≤ |z| .
8. |z · w| = |z| · |w| .
9. Se z ̸= 0, allora |z −1 | = |z|−1 .
10. |z + w| ≤ |z| + |w|; .
3.2 Richiami di trigonometria e coordinate polari
57
11. ||z| − |w|| ≤ |z − w| .
Le proprietà precedenti possono tutte essere verificate direttamente usando le definizioni adottate.
È opportuno osservare che non si può considerare in C una relazione
d’ordine totale (in cui cioè due qualsiasi elemento siano confrontabili) compatibile con le operazioni algebriche. Infatti, se una tale relazione d’ordine
≤ esistesse, si avrebbe z > 0 oppure z < 0 per ogni z ∈ C∗ e quindi, dalla compatibilità con le operazioni algebriche, z 2 > 0 per ogni z ∈ C∗ ; in
particolare −1 = i2 > 0, da cui una contraddizione.
Si considerano ora altre forme in cui possono essere espressi i numeri
complessi. È necessario, per questo, un sistema diverso di coordinate nel
piano cartesiano, che richiede alcune nozioni di trigonometria. Si premettono pertanto alcune nozioni elementari di trigonometria e sul sistema di
coordinate polari.
3.2
Richiami di trigonometria e coordinate polari
Si richiama innanzitutto il concetto di circonferenza trigonometrica, che
è da intendersi come una circonferenza nel piano cartesiano avente centro
nell’origine degli assi e raggio uguale ad uno; tale circonferenza inoltre viene
dotata di un verso positivo che per convenzione è quello antiorario e di
un punto iniziale, che per convenzione è il punto A di intersezione di tale
circonferenza con il semiasse positivo delle ascisse (vedasi la Figura 3.1).
Inoltre, si assume per convenzione di denotare con il numero π la lunghezza della semicirconferenza unitaria (risulta all’incirca π = 3, 1415 . . . ;
si dimostra, però, che π è un numero irrazionale uguale anche all’area del
cerchio unitario). Il fatto di aver fissato un punto iniziale, un verso sulla
circonferenza trigonometrica ed un’unità di misura permette di far corrispondere ad ogni numero reale un elemento della circonferenza trigonometrica. Precisamente, assegnato un numero reale x, si può considerare l’arco
di circonferenza che ha un estremo nel punto iniziale A, lunghezza uguale
al valore assoluto di x e verso antiorario se x è positivo, altrimenti orario.
Si può quindi individuare il punto P sulla circonferenza trigonometrica che
rappresenta il secondo estremo dell’arco suddetto (se il numero reale assegnato è maggiore di 2π in valore assoluto, la circonferenza trigonometrica
viene ripercorsa più volte). Ora, assegnato il numero reale x, si consideri il
punto P sulla circonferenza trigonometrica costruito come descritto sopra.
Si definisce seno di x, e lo si denota con sin(x), l’ordinata del punto
P , mentre si definisce coseno di x, e lo si denota con cos(x), l’ascissa del
58
Capitolo 3: Numeri complessi e polinomi
6
.......................................Q
...................
..k
..........Q
...........
.
.........
.
.
.
.
.
.
.
.
...Q
.
.
.
.......
.
.
.
.
.
.
.
.....
.
.
.
.
.
....
.
.
.
.
.....
.
.
.
.........P
.
.
.
.
.
.....
.
.....
...
.
.
.......
...
..
sin(x)
...... x
.
...
.......
....
......
...
...... A
0
.....
...
..
cos(x)
...
1 .....
...
.
..
...
...
...
.
.
...
..
...
..
...
...
.
...
.
..
....
....
....
....
.....
.
.
.
.
......
.....
........
.......
.........
.........
.
.
............
.
.
.
.
.
.
.
.......................... ..............................
....
-
Figura 3.1: Circonferenza trigonometrica.
punto P ; se non vi è possibilità di equivoci, le parentesi che racchiudono la
x vengono omesse e si scrive semplicemente sin x e cos x.
Dalle definizioni adottate segue subito che, per ogni x ∈ R
−1 ≤ sin x ≤ 1 ,
−1 ≤ cos x ≤ 1 .
In particolare, quindi, le funzioni seno e coseno sono limitate. Inoltre, utilizzando il teorema di Pitagora, si ricava la seguente relazione tra il seno ed
il coseno, valida anch’essa per ogni x ∈ R,
sin2 x + cos2 x = 1
(il simbolo sin2 x è da intendersi come (sin x)2 ; la stessa convenzione vale
per il coseno e, più in generale, per tutte le quantità trigonometriche).
Si descrivono ora alcune proprietà del seno e del coseno di un qualsiasi
numero reale x la cui dimostrazione è una immediata conseguenza delle
definizioni adottate.
3.2 Richiami di trigonometria e coordinate polari
59
1. Per ogni x ∈ R: sin(x + 2π) = sin x , cos(x + 2π) = cos x .
Tale relazione esprime la proprietà di periodicità di periodo 2π del
seno e del coseno.
(
(
π)
π)
2. Per ogni x ∈ R: sin x +
= cos x , cos x +
= − sin x .
2
2
(π
)
(π
)
3. Per ogni x ∈ R: sin
− x = cos x , cos
− x = sin x .
2
2
4. Per ogni x ∈ R: sin(x + π) = − sin x ,
cos(x + π) = − cos x .
Le proprietà precedenti conseguono tutte dalle seguenti formule di addizione del seno e del coseno. La dimostrazione di tali formule per brevità
verrà omessa. Per ogni x, y ∈ R, si ha
5. sin(x + y) = sin x cos y + cos x sin y .
6. sin(x − y) = sin x cos y − cos x sin y .
7. cos(x + y) = cos x cos y − sin x sin y .
8. cos(x − y) = cos x cos y + sin x sin y .
Considerando, in particolare, x = y nelle proprietà 5. e 7. precedenti
si ottengono le seguenti ulteriori formule, note con il nome di formule di
moltiplicazione.
9. Per ogni x ∈ R: sin 2x = 2 sin x cos x .
10. Per ogni x ∈ R: cos 2x = cos2 x − sin2 x = 2 cos2 x − 1 = 1 − 2 sin2 x .
Considerando x/2 al posto di x nell’ultima uguaglianza, si ottiene cos x =
2 cos2 (x/2) − 1, dalla quale si ottengono le seguenti formule di bisezione.
11. Per ogni x ∈ R: cos2
x
1 + cos x
=
.
2
2
12. Per ogni x ∈ R: sin2
x
1 − cos x
=
.
2
2
Infine, addizionando e sottraendo a due a due le 5.–6. e le 7.–8., si
ottengono le cosiddette formule di prostaferesi, che consentono di esprimere
il prodotto seni e/o coseni nella somma di seni e/o coseni.
13. Per ogni x, y ∈ R: sin(x + y) + sin(x − y) = 2 sin x cos y .
14. Per ogni x, y ∈ R: sin(x + y) − sin(x − y) = 2 cos x sin y .
Capitolo 3: Numeri complessi e polinomi
60
15. Per ogni x, y ∈ R: cos(x + y) + cos(x − y) = 2 cos x cos y .
16. Per ogni x, y ∈ R: cos(x + y) − cos(x − y) = −2 sin x sin y .
Le formule precedenti possono essere scritte in forma diversa ponendo
x = (α + β)/2 e y = (α − β)/2; se ne lascia per esercizio la trascrizione con
tali posizioni.
Si passa ora ad elencare alcuni valori del seno e del coseno in alcuni archi
particolari che si possono dedurre facilmente da proprietà geometriche sulla
circonferenza trigonometrica.
sin 0 = 0 ,
cos 0 = 1 .
√
π
1
π
3
sin = ,
cos =
.
6
2
6
2
√
√
π
2
π
2
sin =
,
cos =
.
4
2
4
2
√
3
π
π
1
sin =
,
cos = .
3
2
3
2
π
π
cos = 0 .
sin = 1 ,
2
2
Utilizzando le proprietà 1.–4, dagli archi noti precedenti possono esserne
ricavati altri come, ad esempio,
3
π,
4
5
π,
6
π,
7
π,
6
5
π,
4
4
π,
3
3
π,
2
5
π,
3
7
π,
4
11
π.
6
Usando poi la proprietà di periodicità del seno e del coseno si ricavano archi
noti non appartenenti a [0, 2π[.
A questo punto si possono definire ulteriori nozioni trigonometriche.
Sia x ∈ R, x ̸= π/2 + kπ per ogni k ∈ Z e si consideri il corrispondente
punto P sulla circonferenza trigonometrica. Poiché P non si trova sull’asse
delle ordinate, la semiretta passante per l’origine e il punto P interseca la
retta parallela all’asse delle ordinate passante per il punto A di coordinate
(1, 0) in uno ed un solo punto Q. Allora la tangente di x si definisce come
l’ordinata di tale punto Q.
Utilizzando la similitudine dei triangoli di vertici OBP e OAQ rappresentati in Figura 3.2, si deduce facilmente la relazione sin x : tan x =
cos x : 1, dalla quale si ricava
tan x =
sin x
.
cos x
3.2 Richiami di trigonometria e coordinate polari
61
6
.......................................
...................
...........
...........
.........
.
.
.
.
.
.
.
........
Q
........
.
......
.
.
.
.
.
.
.....P
.
.
.
.
.
.
.
.
......
...
........
...
...
.......
....
....... tan(x)
.
..
..
...
x ......
..
.
.......
....
......
....
...... A
O
B
.....
...
..
...
1 .....
...
.
..
...
...
...
.
.
...
..
...
..
...
...
.
...
.
..
....
....
....
....
.....
.
.
.
.
......
.....
........
.......
.........
.........
.
.
.
............
.
.
.
.
.
.
...........................................................
-
Figura 3.2: Interpretazione geometrica della tangente.
Le proprietà della tangente derivano pertanto da quelle del seno e del
coseno.
Ad esempio, per ogni x ∈ Rr{π/2+kπ | k ∈ Z}, si ottiene tan(x+π) =
tan(x) = tan(x − π), e quindi la tangente è periodica di periodo π. Inoltre,
sin(−x)
− sin x
tan(−x) =
=
= − tan x.
cos(−x)
cos x
Nello stesso modo è possibile ricavare i valori della tangente in alcuni
archi particolari.
In modo analogo a quanto visto per la tangente, si può procedere considerando x ∈ R tale che x ̸= kπ per ogni k ∈ Z e considerando ancora il
punto P corrispondente sulla circonferenza trigonometrica. Allora P non
si trova sull’asse delle ascisse e quindi la semiretta passante per l’origine e
il punto P interseca la retta parallela all’asse delle ascisse passante per il
punto C di coordinate (0, 1) in uno ed un solo punto Q. Allora la cotangente
di x si definisce come l’ascissa di tale punto Q.
Anche ora, utilizzando la similitudine dei triangoli di vertici OBP e
62
Capitolo 3: Numeri complessi e polinomi
OCQ rappresentati in Figura 3.3, si deduce facilmente la relazione sin x :
1 = cos x : cot x, dalla quale si ricava
cos x
cot x =
.
sin x
6
........................ cot(x)
..............C
............
...................
...........
.........
.
.
.
.
.
.
.
.
........
.
.
.
.
.
.
.
......
..
.....
.....P
.
.
.
.
.....
.
.
.
B
.
.....
.
.
.
........
.
.
.
.
.
.......
.
.
...
......
.
...
x .......
....
.......
.
..
......
....
.......
O
....
...
..
...
1 .....
...
.
...
..
...
..
...
....
.
...
..
...
...
...
.
.
....
...
....
....
.....
....
.
.
......
.
.....
........
.......
.........
........
.
............
.
.
.
.
.
.
.
.
.
...
....................
.....................................
Q
A
-
Figura 3.3: Interpretazione geometrica della cotangente.
Le proprietà della cotangente si discutono in maniera analoga a quanto
svolto per la tangente e dipendono ancora una volta da quelle delle funzioni
seno e coseno.
Si richiama solamente l’attenzione sul fatto che la cotangente è anch’essa
periodica di periodo π, ma non verifica proprietà di simmetria.
3.2.1
Coordinate polari
Si è visto in precedenza che gli elementi di un piano rappresentano geometricamente gli elementi di R2 ; ora se ne studia una diversa rappresentazione,
utile soprattutto in questa fase per poter esprimere i numeri complessi in
una forma alternativa.
3.2 Richiami di trigonometria e coordinate polari
63
Sia assegnato un piano π e si fissi su di esso un riferimento cartesiano ortonormale; quindi ogni elemento P ∈ π può essere univocamente individuato
mediante una coppia (x, y). Si osservi ora che se il punto P non coincide con
l’origine, esso può essere individuato in modo alternativo assegnando la sua
distanza ρ dall’origine e l’arco di circonferenza unitaria θ compreso tra il
semiasse positivo dell’asse reale e la semiretta uscente dall’origine e passante
per P . Gli elementi ρ e θ cosı̀ definiti vengono denominati coordinate polari
del punto P . Il numero ρ viene denominato modulo (oppure raggio vettore)
di P , mentre il numero θ viene denominato argomento (oppure anomalia)
di P . Bisogna osservare che l’argomento non è individuato univocamente;
infatti se θ è un argomento di P , ogni altro numero del tipo θ + 2kπ con
k ∈ Z, è ancora un argomento di P . Tuttavia, esiste sicuramente uno ed un
solo argomento θ di P che verifica le condizioni −π < θ ≤ π; tale argomento
viene denominato argomento principale di P . Per quanto riguarda l’origine,
essa è individuata univocamente dalla condizione ρ = 0; per convenzione,
all’origine si può attribuire un argomento arbitrario. Se si conoscono le
coordinate cartesiane (x, y) di un punto P diverso dall’origine, il modulo ρ
di P si ottiene dalla formula
√
ρ = x2 + y 2 ,
(3.2.1)
mentre un argomento θ di P può essere individuato dalle condizioni
cos θ =
x
,
ρ
sin θ =
y
;
ρ
(3.2.2)
in particolare, se x = 0, l’argomento principale è
{
π/2 ,
se y > 0 ,
θ=
−π/2 ,
se y < 0 ;
se invece x ̸= 0, l’argomento principale è

se x > 0 ,
arctan xy ,



y
π + arctan x ,
se x < 0, y ≥ 0 ,
θ=



−π + arctan xy ,
se x < 0, y < 0 .
Viceversa, se sono note le coordinate polari (ρ, θ) di P , si possono
ricavare facilmente le coordinate cartesiane di P ponendo
{
x = ρ cos θ ,
(3.2.3)
y = ρ sin θ ,
Capitolo 3: Numeri complessi e polinomi
64
6
y − − − − − − − − − − − − −• P
|
|
ρ
|
....
......
|
.........
...
... θ
.
..
..
..
|
..
..
..
0 x
.
-
Figura 3.4: Coordinate polari.
3.3
Forma trigonometrica dei numeri complessi
La forma trigonometrica di un numero complesso z si ottiene semplicemente considerando le coordinate polari del punto P del piano complesso
corrispondente a z.
Sia z = a + ib ∈ C; essendo (a, b) la forma geometrica di z, le √
coordinate
polari si possono ottenere dalle (3.2.1)–(3.2.2) ponendo ρ = a2 + b2 e
considerando θ soddisfacente le relazioni cos θ = x/ρ e sin θ = y/ρ; tenendo
presenti le (3.2.3), il numero z si potrà quindi scrivere nella forma
z = ρ(cos θ + i sin θ) ,
(3.3.1)
che viene appunto denominata forma trigonometrica di z. Ad esempio,
1√ = cos 0 + i sin 0, −1 = cos π + i sin π, i = cos(π/2) + i sin(π/2), 1 + i =
2(cos(π/4) + i sin(π/4)).
Dalle considerazioni svolte riguardanti le coordinate polari, si ricava che
la forma trigonometrica di z non è univocamente determinata; gli argomenti di z sono del tipo θ + 2kπ con k ∈ Z; in particolare, il numero 0 ha
modulo 0 e argomento arbitrario. Tuttavia, l’argomento di un numero complesso diverso da 0 risulta univocamente determinato se si considera quello
principale compreso nell’intervallo ] − π, π]. Come conseguenza di ciò, si ottiene il seguente principio di uguaglianza di due numeri complessi in forma
trigonometrica.
3.3 Forma trigonometrica dei numeri complessi
65
Proposizione 3.3.1 Siano z = ρ(cos θ + i sin θ) e w = σ(cos φ + i sin φ)
due numeri complessi in forma trigonometrica diversi da 0. Si ha z = w se
e solo se ρ = σ ed esiste k ∈ Z tale che θ = φ + 2kπ.
Inoltre, se θ è l’argomento principale di z e φ è l’argomento principale
di w, si ha z = w se e solo se ρ = σ e θ = φ.
Si studiano a questo punto le varie operazioni algebriche in forma trigonometrica. Le operazioni di somma e differenza di due numeri complessi
non sono immediate in forma trigonometrica e per tali operazioni conviene
utilizzare soprattutto la forma algebrica o geometrica. Al contrario, si fa
vedere ora che le operazioni di prodotto, reciproco, quoziente, potenza e
radice si possono eseguire in modo molto semplice utilizzando proprio la
forma trigonometrica.
Siano, infatti, z = ρ(cos θ + i sin θ) e w = σ(cos φ + i sin φ) due numeri
complessi. Poiché la forma algebrica di z e w è data da z = (ρ cos θ) +
i(ρ sin θ), w = (σ cos φ) + i(σ sin φ) il prodotto z · w è dato da
z·w
= ρ · σ((cos θ cos φ − sin θ sin φ) + i(cos θ sin φ + sin θ cos φ))
= ρ · σ(cos(θ + φ) + i sin(θ + φ)) .
Quindi si conclude che il prodotto in forma trigonometrica di due numeri
complessi z e w ha come modulo il prodotto dei moduli di z e di w e come
argomento la somma degli argomenti di z e di w:
z · w = ρ · σ(cos(θ + φ) + i sin(θ + φ)) .
(3.3.2)
Tuttavia, in generale, conviene tener presente che se θ e φ sono gli argomenti principali di z e rispettivamente di w, non è detto che θ + φ sia l’argomento principale di z · w; per ottenerlo, potrebbe infatti essere necessario
aggiungere o sottrarre 2π.
Sia ora z = ρ(cos θ +i sin θ) un numero complesso diverso da 0; si verifica
facilmente che il reciproco di z è dato da
z −1 = ρ−1 (cos(−θ) + i sin(−θ))
(3.3.3)
Pertanto, il reciproco di un numero complesso diverso da 0 ha come modulo
il reciproco del modulo di z e come argomento quello opposto all’argomento
di z.
Da tale regola, si ricava anche la regola sul quoziente di due numeri
complessi. Infatti, se z = ρ(cos θ + i sin θ) e w = σ(cos φ + i sin φ) con
w ̸= 0, allora, dalle (3.3.2) e (3.3.3),
ρ
z
= z · w−1 = (cos(θ − φ) + i sin(θ − φ)) .
w
σ
(3.3.4)
Capitolo 3: Numeri complessi e polinomi
66
Si conclude che il quoziente di z e w ha come modulo il quoziente dei moduli
di z e di w e come argomento la differenza degli argomenti di z e di w
Come conseguenza della regola sul prodotto, si ottiene facilmente anche il
calcolo delle potenze di un numero complesso z = ρ(cos θ +i sin θ). Ponendo
w = z nella (3.3.2) si ha infatti z 2 = ρ2 (cos(2θ)+i sin(2θ)) e più in generale,
procedendo per induzione, per ogni n ≥ 1,
z n = ρn (cos(nθ) + i sin(nθ)) .
(3.3.5)
La formula (3.3.5) precedente viene denominata formula di De Moivre.
Viene considerato infine, il calcolo delle radici n-esime (n ≥ 2) di un
numero complesso z = ρ(cos θ + i sin θ). Una radice di z è definita come
un numero complesso w ∈ C che verifica la proprietà wn = z. Si riconosce
in modo immediato che l’unica radice di 0 è il numero 0. Si supponga
quindi che z ̸= 0. Se si pone w = σ(cos φ + i sin φ), dalla (3.3.5) si ricava
wn = σ n (cos(nφ) + i sin(nφ)), e quindi, imponendo l’uguaglianza wn = z,
dal principio di uguaglianza di due numeri complessi in forma trigonometrica
(Proposizione 3.3.1) segue:
ρ = σn ,
nφ = θ + 2kπ
con k ∈ Z;
θ + 2kπ
√
n ρ e φ =
, con k ∈ Z; si osserva a questo punto che, al
n
θ + 2kπ
variare di k ∈ Z, gli argomenti φ =
non danno tutti luogo a numeri
n
complessi distinti, in quanto, per ogni k ∈ Z,
quindi σ =
θ + 2kπ
θ + 2(k + n)π
=
+ 2π ;
n
n
quindi si possono considerare solo n argomenti distinti corrispondenti ai
valori k = 0, . . . , n − 1 e tali argomenti forniscono tutte le possibili radici
n-esime di z, che sono date quindi da:
wk =
θ + 2kπ
θ + 2kπ
√
n
ρ (cos
+ i sin
),
n
n
k = 0, 1, . . . , n − 1 . (3.3.6)
Quindi ogni numero complesso z diverso da 0 ammette esattamente n
radici distinte. Dalla formula precedente, si ricava che le radici n-esime di z
si trovano tutte su una stessa circonferenza con centro nell’origine e raggio
uguale alla radice n-esima del modulo di z e formano i vertici di un poligono
regolare con n lati (geometricamente, quindi, è sufficiente individuare uno
dei vertici che ha argomento uguale alla n-esima parte dell’argomento di z).
Nella Figura 3.5 si rappresenta un esempio di radici terze e quinte di un
numero complesso z.
3.4 Forma esponenziale dei numeri complessi
6
6
r
............................................
................
...........
..........
.........
.........
........
.......
.
......
.
.
.
.
......
.....
.
.
.
....
..
.
....
.
.
....
...
.
.
...
...
.
...
..
...
.
..
...
.
...
....
..
...
..
..
...
..
...
..
..
..
..
..
..
..
..
.
..
.
...
...
...
..
...
...
...
..
..
...
.
.
....
...
....
...
....
....
.....
...
......
......
.
.
.
.
.......
.
......
........
.........
........
.............
.........
.........................................................
r
0
r
r
67
r
•
z
-
z
•
r
0
-
............................................
................
...........
..........
.........
.........
........
.......
.
......
.
.
.
.
......
.....
.
.
.
....
..
.
....
.
.
....
...
.
.
...
...
.
...
..
...
.
..
...
.
...
....
..
...
..
..
...
..
...
..
..
..
..
..
..
..
..
.
..
.
...
...
...
..
...
...
...
..
..
...
.
.
....
...
....
...
....
....
.....
...
......
......
.
.
.
.
.......
.
......
........
.........
........
.............
.........
.........................................................
r
r
Figura 3.5: Radici terze e quinte di un numero complesso.
Dalla 3.3.6 è facile constatare che le radici quadrate di un numero complesso sono l’una l’opposta dell’altra (in quanto i loro argomenti differiscono
di π); in particolare, le due radici complesse di un numero reale positivo sono
una reale positiva (che coincide con la radice quadrata aritmetica) e l’altra
reale negativa (l’opposta della prima); se, invece, si considera un numero reale strettamente negativo, le due radici complesse saranno immaginarie pure
l’una l’opposta dell’altra). Per quanto riguarda le radici terze complesse di
un numero reale, si può osservare che esse sono una reale (coincidente con
la radice terza aritmetica) e due tra loro complesse coniugate.
3.4
Forma esponenziale dei numeri complessi
Se z = x + iy è un numero complesso, si pone innanzitutto
ez = ex (cos y + i sin y) ;
(3.4.1)
si osservi che x, y ∈ R e quindi le funzioni a secondo membro sono quelle
già note nel caso reale. In particolare, se θ ∈ R, si ha
ei θ = cos θ + i sin θ ;
(3.4.2)
conseguentemente, se si conosce la forma trigonometrica z = ρ(cos θ+i sin θ)
di un numero complesso z si può scrivere
z = ρei θ .
(3.4.3)
Capitolo 3: Numeri complessi e polinomi
68
La (3.4.3) viene denominata forma esponenziale di z. Dalla forma esponenziale è anche immediato passare alla forma trigonometrica e viceversa
utilizzando la (3.4.2). Inoltre, dalle (3.4.1) e (3.4.2) si ottengono facilmente
le seguenti proprietà di ez , che valgono per ogni z, w ∈ C e θ ∈ R.
1. ez+w = ez · ew ;
2. ez ̸= 0 ;
3. |ei θ | = 1 ;
4. ez+2kπi = ez ;
5. |ez | = eRe z ;
6. ez = eRe z (cos(Im z) + i sin(Im z)) .
Dalla (3.4.2) si ottiene anche, per ogni θ ∈ R, e−i θ = cos θ − i sin θ e
tale formula, unita alla (3.4.2) permette di ricavare le cosiddette formule di
Eulero:
ei θ − e−i θ
ei θ + e−i θ
sin θ =
, cos θ =
.
(3.4.4)
2i
2
3.5
3.5.1
Polinomi ed equazioni algebriche
Polinomi e relative radici
Le funzioni elementari che si possono considerare più semplici dal punto
di vista del calcolo esplicito sono sicuramente le funzioni potenza ad esponente intero positivo. In questa sezione vengono considerate combinazioni
lineari di tali funzioni. Esse verranno definite in tutto l’insieme dei numeri
complessi, per studiarne alcune proprietà generali; si eviterà di enunciare
o approfondire proprietà che, sebbene di interesse generale, non verranno
utilizzate esplicitamente nel seguito.
Definizione 3.5.1 Sia n ∈ N. Si dice polinomio di grado n ogni funzione
P : C → C per cui esistono a0 , . . . , an ∈ C con an ≠= 0 tali che, per ogni
z ∈ C,
P (z) = a0 + a1 z + · · · + an z n .
(3.5.1)
Il grado di un polinomio è, quindi, il più grande dei numeri naturali k per
cui il coefficiente della potenza z k è diverso da 0. Il grado di un polinomio
P viene indicato spesso con il simbolo deg(P ).
Il coefficiente a0 del termine di grado 0 di un polinomio viene spesso
denominato termine noto del polinomio.
3.5 Polinomi ed equazioni algebriche
69
Si denomina zero (oppure radice, oppure soluzione) del polinomio P
ogni numero complesso z0 ∈ C tale che P (z0 ) = 0. Nel seguito avranno
particolare interesse i polinomi per cui i coefficienti a0 , . . . , an sono numeri
reali. Essi verranno denominati polinomi a coefficienti reali.
Conviene osservare che se P è un polinomio a coefficienti reali allora, per
ogni x ∈ R, P (x) è anch’esso un numero reale; in tale circostanza, quindi,
il polinomio P può essere anche riguardato come funzione da R in R. Sarà
chiaro dal contesto, nel seguito, se tali polinomi vengono considerati definiti
in R (come funzioni reali) oppure in C.
Si considera ora qualche esempio. In base alla definizione adottata, un
polinomio di grado 0 è una funzione costante P : C → C di costante valore
un numero a0 ∈ C∗ . Un polinomio di grado 0 ovviamente non ammette
alcuna radice. Invece, la funzione costante di costante valore 0 viene denominata polinomio nullo; per definizione di grado di un polinomio, il grado
del polinomio nullo non può essere zero: si assume, per convenzione, che
il grado del polinomio nullo sia -1. In effetti, il polinomio nullo è l’unico
ad avere infinite radici, come afferma il seguente risultato. Quindi se un
polinomio P ammette infinite radici, allora P è il polinomio nullo. Da tale
affermazione segue il principio di identità di due polinomi, che è utile in
molte circostanze.
Proposizione 3.5.2 (Principio di identità dei polinomi) Siano P e Q
due polinomi. Se P e Q coincidono in infiniti punti, allora P = Q.
Dimostrazione. Infatti, il polinomio P − Q ammette infinite radici e quindi P − Q = 0.
In effetti, se n é il grado massimo dei due polinomi, é sufficiente che i due
polinomi coincidano in n + 1 punti per essere uguali (infatti, in tal caso la
differenza dei due polinomi avrebbe un numero di zeri superiore al proprio
grado e ciò, come si vedrà in seguito, può valere solamente per il polinomio
nullo).
Dalla Proposizione 3.5.2 precedente segue anche che i coefficienti di un
polinomio sono univocamente determinati nel senso che se, per ogni z ∈ C,
P (z) = a0 + a1 z + · · · + an z n con an ̸= 0 e P (z) = b0 + b1 z + · · · + bm z m
con bm ̸= 0, allora n = m e, per ogni k = 0, . . . , n, ak = bk .
Riprendendo gli esempi, un polinomio di grado 1 è una funzione P :
C → C del tipo P (z) = a0 + a1 z (z ∈ C), con a0 ∈ C, a1 ∈ C, a1 ̸= 0.
Un polinomio di grado 1 ammette sempre un’unica radice data da c =
−a0 /a1 . Nel caso in cui le costanti a0 e a1 siano reali, esse vengono indicate
solitamente con n e rispettivamente m; nel piano cartesiano l’equazione
y = mx + n (x ∈ R) fornisce l’equazione della retta di coefficiente angolare
m ed ordinata all’origine n. Ad esempio, il polinomio P (z) = iz + 3i − 3 è
un polinomio di grado 1; la sua unica radice è data da c = −3 − 3i.
Capitolo 3: Numeri complessi e polinomi
70
Un polinomio di grado 2 è del tipo P (z) = a0 + a1 z + a2 z 2 (z ∈ C), con
a0 ∈ C, a1 ∈ C, a2 ∈ C, a2 ̸= 0. I coefficienti a0 , a1 e a2 vengono indicati di
solito con c, b e rispettivamente a. Nel caso in cui tali coefficienti siano reali,
l’equazione di secondo grado y = ax2 + bx + c rappresenta una parabola nel
piano cartesiano. Per determinare gli zeri di un polinomio P (z) = az 2 +bz+c
di grado 2 è importante il seguente numero ∆ = b2 − 4ac(∈ C), denominato
discriminante (o brevemente delta) del polinomio P (z) = az 2 + bz + c.
Infatti, l’equazione az 2 + bz + c = 0 si può scrivere
(
b
z+
2a
)2
−
∆
=0.
4a2
Dall’equazione precedente segue che, denotate con w1 e w2 le radici (complesse) del numero complesso ∆, gli zeri del polinomio P sono forniti da
z1 =
−b + w1
,
2a
z2 =
−b + w2
2a
e il polinomio si può scrivere come P (z) = a(z − z1 )(z − z2 ). I numeri
complessi w1 e w2 , in quanto radici del numero complesso ∆, devono essere
l’uno opposto dell’altro. Quindi, le radici z1 e z2 possono essere espresse
scrivendo
√
√
−b − ∆
−b + ∆
z1 =
,
z2 =
,
2a
2a
dove ∆ denota una qualsiasi delle due radici complesse di ∆. Da ciò segue
che i numeri complessi z1 e z2 sono caratterizzati dalle condizioni seguenti
z1 + z2 = −
b
,
a
z1 · z2 =
c
.
a
Le radici z1 e z2 coincidono solo nel caso in ∆ = 0; se ciò accade, l’unica
radice è data da z0 = −b/2a e si può scrivere P (z) = a(z − z0 )2 (si dice in
questo caso che z0 è una radice di molteplicità 2.
Se il polinomio di secondo grado è a coefficienti reali, cioè se a, b, c√∈ R,
anche ∆√ è un numero reale. Nel caso in cui ∆ > 0, si ha w1 = ∆ e
w2 = − ∆ e quindi il polinomio P ammette le due radici reali distinte
√
√
−b − ∆
−b + ∆
x1 =
,
x2 =
,
2a
2a
e si può scrivere come P (z) = a(z − x1 )(z − x2 ).
Se ∆ = 0, P ammette un’unica radice reale data da x0 = −b/(2a) e si
ha P (z) = a(z − x0 )2 .
3.5 Polinomi ed equazioni algebriche
71
√
Infine,
√ se ∆ < 0, le radici complesse di ∆ sono w1 = −i −Delta e
w2 = i −∆; quindi il polinomio P ammette due radici complesse coniugate
date da
√
√
−b − i −∆
−b + i −∆
z1 =
,
z2 =
.
2a
2a
Per i polinomi di grado 3 oppure 4 esistono delle formule esplicite per
la determinazione degli zeri. Invece, per i polinomi di grado superiore a
4, si dimostra che non è possibile stabilire un procedimento generale che
consenta di ottenerne gli zeri.
Si considera ora la divisione di due polinomi. Si ha innanzitutto il
seguente risultato di cui si omette per brevità la dimostrazione.
Proposizione 3.5.3 Siano P1 un polinomio di grado n e P2 un polinomio
non nullo di grado m. Allora esistono, e sono unici, due polinomi Q ed R
tali che
P1 = Q · P2 + R ,
deg(R) < m .
Inoltre, se m ≤ n si ha deg(Q) = n − m, mentre se m > n si ha Q = 0 e
R = P1 .
I polinomi Q ed R previsti nella proposizione precedente vengono denominati rispettivamente polinomio quoziente e polinomio resto di P1 e
P2 .
Si osservi che se P1 e P2 sono polinomi a coefficienti reali, anche il
quoziente ed il resto lo sono. Un caso particolarmente rilevante si ottiene
quando il resto della divisione tra due polinomi è il polinomio nullo.
Definizione 3.5.4 Siano P1 e P2 polinomi con P2 non nullo. Si dice che
P1 è divisibile per P2 (oppure che P2 divide P1 ) se il polinomio resto della
divisione di P1 e P2 è il polinomio nullo e quindi se esiste un polinomio Q
tale che P1 = Q · P2 .
Un caso particolarmente interessante è quello in cui il polinomio P2 è
del tipo P2 (z) = z − z0 , con z0 ∈ C. La divisione di un polinomio P con P2
deve avere come resto un polinomio di grado minore di 1, cioè deve essere
R(z) = a, con a ∈ C. Inoltre, dalla relazione P (z) = Q(z) · P2 (z) + R(z) =
(z − z0 ) · Q(z) + a si ricava P (z0 ) = a e quindi R(z) = P (z0 ). Dunque,
il resto della divisione di un polinomio P per il polinomio z − z0 è un
polinomio costante di costante valore P (z0 ). Da ciò segue immediatamente
la caratterizzazione della divisibilità per z − z0 , con z0 ∈ C
Proposizione 3.5.5 Sia P un polinomio e sia z0 ∈ C. Allora, le seguenti
proposizioni sono equivalenti:
Capitolo 3: Numeri complessi e polinomi
72
a) Il polinomio P è divisibile per z − z0 .
b) z0 è una radice di P .
Quindi, se un polinomio P di grado n ≥ 1 ammette una radice z0 ∈ C,
esso si decompone nel prodotto
P (z) = (z − z0 )Q(z)|; ,
(3.5.2)
con Q polinomio di grado n − 1 in quanto il coefficiente di z n−1 di Q deve
coincidere con il coefficiente di z n di P .
Uno dei più importanti risultati riguardanti i polinomi e le equazioni
algebriche è il fatto che i polinomi aventi grado maggiore o uguale di 1
ammettono sempre almeno una radice. Per brevità, ci si limita ad enunciare
solamente tale risultato, studiandone poi qualche conseguenza.
Teorema 3.5.6 (Teorema fondamentale dell’algebra) Se P è un polinomio di grado n ≥ 1, allora esiste z0 ∈ C tale che P (z0 ) = 0.
Dalla (3.5.2) si ottiene la seguente conseguenza del teorema fondamentale dell’algebra.
Corollario 3.5.7 Se P (z) = a0 + · · · + an z n (an ̸= 0) è un polinomio di
grado n ≥ 1, allora esistono esattamente n elementi z1 , . . . , zn ∈ C tali che
P (z) = an · (z − z1 ) · · · (z − zn ) .
(3.5.3)
Dimostrazione. Si procede per induzione completa sul numero naturale n ≥ 1. Se n = 1,
si ha P (z) = a0 + a1 z e la tesi si verifica direttamente. Si supponga che la tesi sia vera
per n ∈ N e che il grado di P sia n + 1, cioè P (z) = an+1 z n+1 + an z n + · · · + a0 ,
an+1 ̸= 0. Dal Teorema 3.5.6, esiste zn+1 ∈ C tale che P (zn+1 ) = 0 e quindi, dalla
(3.5.2), P (z) = (z − zn+1 )Q(z), con Q polinomio di grado n; inoltre, il coefficiente di z n
del polinomio Q è an+1 ̸= 0. Per l’ipotesi di induzione, esistono z1 , . . . , zn ∈ C tali che
Q(z) = an+1 · (z − z1 ) · · · (z − zn ) e quindi P (z) = an+1 · (z − z1 ) · · · (z − zn ) · (z − zn+1 );
la tesi è quindi vera per il numero naturale n + 1. Dal principio di induzione completa
segue la tesi per ogni n ≥ 1.
Ognuno dei numeri z1 , . . . , zn ∈ C verificanti la (3.5.3) è una radice di
P ; tuttavia, tali radici non sono necessariamente tutte distinte. Per tener
conto di ciò, conviene dare la seguente definizione.
Definizione 3.5.8 Sia P un polinomio di grado n ≥ 1 e sia h ∈ N, h ≥ 1.
Si dice che una radice z0 di P ha molteplicità h se esiste un polinomio Q di
grado n − h tale che Q(z0 ) ̸= 0 (cioè z0 non deve essere una radice di Q) e
inoltre, per ogni z ∈ C,
P (z) = (z − z0 )h · Q(z) .
(3.5.4)
3.5 Polinomi ed equazioni algebriche
73
In qualche caso, per comodità la definizione precedente può essere estesa
al caso h = 0 convenendo di denominare di molteplicità 0 un numero che
non è radice di P .
Il Corollario 3.5.7 si può esprimere dicendo che un polinomio di grado
n ≥ 1 ha esattamente n radici, se ognuna di esse viene contata con la propria
molteplicità; se z1 , . . . , zs sono le radici distinte di P e se h1 , . . . , hs sono le
rispettive molteplicità, si ha
P (z) = an · (z − z1 )h1 · · · (z − zs )hs
(3.5.5)
con h1 + . . . hs = n.
Dalla formula precedente segue in particolare che un polinomio di grado
n ≥ 1 ha al più n radici distinte. Conseguentemente, due polinomi P e
Q, entrambi di grado minore o uguale di n, che coincidono in n + 1 punti
distinti sono necessariamente uguali (infatti il polinomio P − Q si annulla
in n + 1 punti distinti).
Uno dei metodi più comunemente utilizzati per determinare le radici di
un polinomio P consiste nell’applicazione della regola di Ruffini, che per il
suo carattere elementare non viene qui approfondita.
3.5.2
Polinomi a coefficienti reali
Ci si sofferma ora maggiormente sui polinomi a coefficienti reali, in quanto
per tali polinomi si possono aggiungere alcune proprietà interessanti che
risulteranno particolarmente utili nel seguito.
Per esporre compiutamente tali proprietà, conviene introdurre il polinomio coniugato di un assegnato polinomio (a coefficienti complessi) e
studiarne il comportamento delle radici.
Definizione 3.5.9 Siano a0 , . . . , an ∈ C con an ̸= 0 e si consideri il polinomio P (z) = a0 + · · · + an z n . Si denomina polinomio coniugato di P , e si
denota con P il polinomio
P (z) = a0 + · · · + an z n .
Quindi il polinomio coniugato di un polinomio P ha come coefficienti i
coniugati dei coefficienti di P . Se P ha grado n, anche il polinomio coniugato
ha grado n. Ad esempio il coniugato del polinomio P (z) = iz 4 − 2z 3 + (2 −
i)z + 1 + i è il polinomio P (z) = −iz 4 − 2z 3 + (2 + i)z + 1 − i.
Ovviamente, un polinomio coincide con il suo polinomio coniugato se e
solo se è a coefficienti reali.
Per quanto riguarda le radici del polinomio coniugato, vale la proprietà
seguente.
74
Capitolo 3: Numeri complessi e polinomi
Proposizione 3.5.10 Se P è un polinomio e z0 ∈ C è una radice di P ,
allora il numero complesso coniugato z0 di z0 è una radice del polinomio
coniugato P .
Dimostrazione. Siano a0 , . . . , an ∈ C con an ̸= 0 tali che P (z) = a0 +· · ·+an z n . Allora,
dalla Definizione 3.5.9, P (z0 ) = a0 + a1 z0 + · · · + an z0 n = a0 + · · · + an z0n = P (z0 ) e
quindi si ha P (z0 ) = 0 se e solo se P (z0 ) = 0
Si può osservare in più che sez1 , . . . , zs sono le radici distinte di P aventi
rispettivamente molteplicità h1 , . . . , hs , dalla (3.5.5) si ha P (z) = an · (z −
z1 )h1 · · · (z − zs )hs con h1 + . . . hs = n e quindi
P (z) = an · (z − z1 )h1 · · · (z − zs )hs
(3.5.6)
Dunque z1 , . . . , zs sono le radici distinte del polinomio coniugato P ed hanno
le stesse molteplicità h1 , . . . , hs di z1 , . . . , zs .
Dalla proprietà precedente si è in grado di ricavare alcune proprietà delle
radici di un polinomio a coefficienti reali.
Proposizione 3.5.11 Sia P un polinomio a coefficienti reali. Se z0 ∈ C è
una radice di P , allora anche il numero complesso coniugato z0 è una radice
di P avente la stessa molteplicità di z0 .
La dimostrazione della proposizione precedente è ovvia, tenendo presente
che nel caso in esame P = P .
Poiché le radici di un polinomio di grado n sono esattamente n se si tiene
conto della molteplicità, si deduce che le radici complesse non reali devono
essere a due a due coniugate e quindi sono in numero pari. Pertanto si ha
la seguente proprietà.
Proposizione 3.5.12 Sia P un polinomio a coefficienti reali di grado n ≥
1, con n dispari. Allora esiste almeno una radice reale di P .
Come ulteriore conseguenza della Proposizione 3.5.11, si può ricavare
un’utile decomposizione di un polinomio a coefficienti reali.
Sia P (z) = a0 + · · · + an z n un polinomio con coefficienti a0 , . . . , an ∈ R,
an ̸= 0. Dalla (3.5.5), e tenendo presente che le radici complesse sono tra
loro coniugate (e quindi possono essere moltiplicate tra loro dando luogo a
termini di secondo grado con ∆ < 0), si deduce che il polinomio P si può
decomporre nel modo seguente:
P (x) = an (x − x1 )h1 · · · (x − xp )hp (x2 + b1 x + c1 )k1 · · · (x2 + bq x + cq )kq ,
(3.5.7)
dove x1 , . . . , xp sono le radici reali di P aventi rispettivamente molteplicità
h1 , . . . , hp , e k1 , . . . , kq sono le molteplicità delle radici complesse coniugate
3.5 Polinomi ed equazioni algebriche
75
dei termini x2 + b1 x + c1 , . . . , x2 + bq x + cq con ∆1 = b21 − 4c1 < 0, . . . , ∆q =
b2q − 4cq < 0. Poiché la somma di tutte le molteplicità deve essere n, si deve
infine avere
h1 + · · · + hp + 2(k1 + · · · + kq ) = n .
Capitolo 4
Funzioni reali
Lo studio delle funzioni reali (aventi cioè R come insieme di arrivo) è
l’obiettivo principale dello studio seguente.
Nella prima parte saranno considerate funzioni reali definite in un sottoinsieme di R (tali funzioni vengono denominate di variabile reale) mentre
nella seconda parte si considereranno funzioni reali definite più in generale
in un sottoinsieme di Rn , n ≥ 2 (tali funzioni vengono denominate di più
variabili reali ).
4.1
Operazioni con le funzioni reali
Per le funzioni reali, valgono tutti i concetti introdotti nella Sezione 1.2 e
in quelle successive. Inoltre, la struttura algebrica di R consente di definire
un’analoga struttura algebrica sull’insieme delle funzioni reali definite in
uno stesso insieme X.
Per precisare tale struttura algebrica si denoti con F(X, R) l’insieme
delle funzioni reali definite in X (tale insieme viene denotato spesso anche
con il simbolo RX ).
Allora su F(X, R) sono definite le seguenti operazioni:
1. Addizione. Si considera la funzione + : F(X, R) × F(X, R) →
F(X, R) che in ogni coppia (f, g) ∈ F(X, R) × F (X, R) assume come valore la funzione f + g : F(X, R) → R definita ponendo, per ogni
x∈X
(f + g)(x) = f (x) + g(x) .
La funzione f + g viene denominata funzione somma di f e g.
In questo modo la somma di due funzioni viene ricondotta alla somma dei valori delle due funzioni e quindi alla somma di numeri reali.
78
Capitolo 4: Funzioni reali
Per questo motivo, per l’addizione continuano a valere le proprietà
dell’addizione tra numeri reali e precisamente:
• (Proprietà associativa) Per ogni f, g, h ∈ F (X, R): (f + g) + h =
f + (g + h). Pertanto è superfluo l’uso delle parentesi e si può
scrivere più semplicemente f + g + h.
• (Proprietà commutativa) Per ogni f, g ∈ F (X, R): f + g = g + f .
• (Esistenza dell’elemento neutro) Si consideri la funzione nulla
0 : X → R definita ponendo, per ogni x ∈ X, 0(x) = 0. Allora,
per ogni f ∈ F(X, R), risulta f + 0 = f = 0 + f .
• (Esistenza della funzione opposta) Per ogni f ∈ F(X, R), si
consideri la funzione −f : X → R definita ponendo, per ogni
x ∈ X, (−f )(x) = −f (x). Allora, per ogni f ∈ F(X, R), risulta
f + (−f ) = 0 = (−f ) + f e per tale motivo la funzione −f viene
denominata funzione opposta di f .
2. Moltiplicazione. Si considera la funzione · : F(X, R) × F(X, R) →
F(X, R) che in ogni coppia (f, g) ∈ F (X, R) × F(X, R) assume come
valore la funzione f · g : F(X, R) → R definita ponendo, per ogni
x ∈ X,
(f · g)(x) := f (x) · g(x) .
La funzione f · g viene denominata funzione prodotto di f e g. Anche
in questo caso valgono le proprietà si ottengono facilmente da quelle
del prodotto di due numeri reali e precisamente valgono le seguenti
proprietà.
• (Proprietà associativa) Per ogni f, g, h ∈ F(X, R): (f · g) · h =
f · (g · h). Pertanto anche in questo caso è superfluo l’uso delle
parentesi e si può scrivere più semplicemente f · g · h.
• (Proprietà commutativa) Per ogni f, g ∈ F(X, R): f · g = g · f .
• (Esistenza dell’elemento neutro) Si consideri la funzione unità
1 : X → R definita ponendo, per ogni x ∈ X, 1(x) = 1. Allora,
per ogni f ∈ F(X, R), risulta f · 1 = f = 1 · f .
• (Esistenza della funzione reciproca) Sia f ∈ F(X, R) e si supponga che, per ogni x ∈ X, risulti f (x) ̸= 0. Allora si può
1
considerare la funzione
: X → R definita ponendo, per ogni
f
1
1
1
1
. Ovviamente si ha f · = 1 = · f e per
x ∈ X, (x) =
f
f (x)
f
f
1
tale motivo la funzione
viene denominata funzione reciproca
f
4.1 Operazioni con le funzioni reali
79
di f . Si osservi che la funzione reciproca non esiste per ogni funzione diversa da quella nulla, ma solo per le funzioni che non si
annullano in ogni elemento dell’insieme di definizione.
3. Moltiplicazione esterna. Si considera la funzione · : R×F (X, R) →
F(X, R) che in ogni coppia (λ, f ) ∈ R × F (X, R) assume come valore
la funzione λ · f : F(X, R) → R definita ponendo, per ogni x ∈ X,
(λ · f )(x) := λ · f (x) .
La funzione f · g viene denominata ancora funzione prodotto di λ ed
f . Anche in questo caso le proprietà seguenti si ottengono facilmente
da quelle del prodotto di due numeri reali.
• Per ogni λ, µ ∈ R e per ogni f ∈ F(X, R): (λ+µ)·f = λ·f +µ·f .
• Per ogni λ ∈ R e per ogni f, g ∈ F (X, R): λ · (f + g) = λ · f + λ · g.
• Per ogni λ, µ ∈ R e per ogni f ∈ F(X, R): (λ · µ) · f = λ · (µ · f ).
• Per ogni f ∈ F (X, R): 1 · f = f .
Analogamente al caso della funzione nulla e della funzione unità, se
λ ∈ R si può convenire di denotare ancora con λ la funzione costante
di costante valore λ (cioè ∀ x ∈ X : λ(x) = λ). Con tale convenzione la moltiplicazione esterna risulta essere un caso particolare della
moltiplicazione tra due funzioni.
Dal punto di vista della struttura algebrica, l’insieme F(X, R) con
l’addizione e la moltiplicazione esterna risulta essere uno spazio vettoriale reale e con l’aggiunta della moltiplicazione tra funzioni risulta
essere un algebra reale.
Tuttavia in molte questioni riguardanti lo studio delle funzioni reali
risulta utile definire le operazioni di somma e prodotto anche se le
funzioni reali in esame non sono definite nello stesso sottoinsieme di
R.
Infatti, se f : X → R e g : Y → R sono funzioni reali definite rispettivamente in X ⊂ R e Y ⊂ R si possono definire le funzioni
f + g : X ∩ Y → R e f · g : X ∩ Y → R ponendo, per ogni x ∈ X ∩ Y ,
(f + g)(x) = f (x) + g(x) ,
(f · g)(x) = f (x) · g(x) .
Tali funzioni continuano ad essere denominate somma e rispettivamente prodotto delle funzioni f e g.
In maniera analoga si può definire la funzione reciproca di una funzione
reale in una situazione più generale. Infatti se f : X → R è una
Capitolo 4: Funzioni reali
80
funzione reale non identicamente nulla (cioè diversa dalla funzione
nulla o equivalentemente che assume almeno in un punto un valore
diverso da 0), si può definire il seguente sottoinsieme
X0 = {x ∈ X | f (x) ̸= 0}
e conseguentemente si può considerare la funzione
ponendo, per ogni x ∈ X0 ,
1
: X0 → R definita
f
1
1
(x) =
.
f
f (x)
1
continua ad essere denominata
f
funzione reciproca della funzione f .
Anche in questo caso la funzione
In questo modo, se f : X → R e g : Y → R sono funzioni reali definite
in X ⊂ R e rispettivamente Y ⊂ R, si può considerare la funzione
f
quoziente di f e g che si denota con ed è definita nel modo seguente
g
1
f
=f·
g
g
(prodotto di f con la reciproca di g). Ovviamente, la funzione quoziente è definita in {x ∈ X ∩ Y | g(x) ̸= 0}.
Si ricordano infine la convenzioni utilizzate nella sezione 1.2.3 che consentono di definire una funzione inversa di una funzione reale iniettiva
e di considerare la funzione composta in circostanze più generali.
Funzione inversa. Siano X un sottoinsieme di R ed f : X → R
una funzione reale iniettiva. Allora la funzione ridotta f# di f (vedasi la (1.2.13)) risulta biiettiva e quindi ammette un’inversa (f# )−1 :
f (X) → X. Estendendo l’insieme di arrivo all’intero R (per ottenere
una funzione reale) si considera infine la funzione f −1 : f (X) → R
definita ponendo, per ogni y ∈ f (X), f −1 (y) = (f# )−1 (y). Tale funzione viene ancora denominata funzione inversa di f e, per come è
definita, in ogni y ∈ f (X) assume come valore l’unico elemento x ∈ X
tale che y = f (x). La funzione f −1 risulta essere iniettiva al pari di
f.
Tale procedimento verrà applicato in particolare per ottenere le funzioni inverse delle funzioni elementari (in qualche caso bisognerà inoltre considerare opportune restrizioni che consentano di ottenere la
proprietà di iniettività).
4.2 Estremi di funzioni reali
81
Funzione composta. Se X ed Y sono sottoinsiemi di R e f : X → R
e g : Y → R sono funzioni reali tali che f (X) ⊂ Y , si può considerare
la funzione reale composta g ◦ f : X → R definita ponendo, per ogni
x ∈ X, (g ◦ f )(x) = g(f (x)) (vedasi la (1.2.8)).
4.2
Estremi di funzioni reali
Tutte le proprietà esposte nella Sezione 2.3.4 possono essere riferite alle funzioni reali applicandole all’immagine della funzione, che è un sottoinsieme
di R. Pertanto, se X è un sottoinsieme1 di Red f : X ∈ R è una funzione
reale, si ottengono le seguenti definizioni:
• Funzioni limitate. Si dice che f è limitata superiormente (rispettivamente, limitata inferiormente) se f (X) è un sottoinsieme limitato
superiormente (rispettivamente, inferiormente) di R, cioè se
∃ M ∈ R t.c. ∀ x ∈ X : f (x) ≤ M
(rispettivamente, M ≤ f (x) )
(4.2.1)
(si è tenuto conto del fatto che per ogni y ∈ f (X) esiste x ∈ X tale
che y = f (x)).
Ogni elemento M ∈ R verificante la (4.2.1) viene ovviamente denominato maggiorante (rispettivamente, minorante) di f . Infine, si dice
che f è limitata se è limitata sia superiormente che inferiormente.
• Funzioni dotate di massimo e minimo. Si dice f è dotata di
massimo (rispettivamente, dotata di minimo) se tale è il sottoinsieme
f (X) di R, e quindi se esiste M ∈ R tale che
{
1)
∃ x ∈ X t.c. f (x0 ) = M ;
2)
∀ x ∈ X : f (x) ≤ M (rispettivamente, M ≤ f (x) ).
(4.2.2)
L’elemento M verificante la (4.2.2) è unico e viene denominato massimo di f (rispettivamente, minimo di f ) e si denota con uno dei
seguenti simboli:
max f ,
max f (x) ,
x∈X
(rispettivamente, min X ,
min f (x) ).
x∈X
Spesso a tale elemento M si attribuisce anche la denominazione di
massimo assoluto (rispettivamente, minimo assoluto di f per distinguerlo dai massimi e minimi relativi di cui si tratterà di seguito.
1 In tutto il seguito, l’insieme di definizione di una funzione verrà implicitamente
supposto non vuoto, anche se non precisato esplicitamente.
Capitolo 4: Funzioni reali
82
Al contrario, l’elemento x0 ∈ X previsto in 1) non è necessariamente unico. Ogni elemento x0 ∈ X verificante la condizione 1) precedente viene denominato punto di massimo (rispettivamente, punto di
minimo) per f .
Accanto alle definizioni precedenti, conviene a questo punto introdurre
la seguente.
Definizione 4.2.1 Siano f : X → R una funzione reale e sia x0 ∈ X. Si
dice che x0 è un punto di massimo (rispettivamente, di minimo) relativo
per f se esiste un numero reale δ > 0 tale che:2
∀ x ∈ X ∩ Iδ (x0 ) r {x0 } : f (x) ≤ f (x0 )
(rispettivamente, f (x0 ) ≤ f (x) ).
(4.2.3)
Se la (4.2.3) vale con una diseguaglianza stretta (“<” al posto di “≤”),
il punto di massimo (rispettivamente, di minimo) per f viene denominato
proprio.
Il valore f (x0 ) che la funzione assume in un punto di massimo (rispettivamente, di minimo) relativo per f , viene denominato massimo relativo
(rispettivamente, minimo relativo) di f .
In Figura 4.1 viene raffigurata geometricamente una funzione che ha il
massimo assoluto M assunto nel punto m ed ulteriori punti di massimo
relativo p e q, con valori P e rispettivamente Q.
• Funzioni dotate di estremi. Si dice f è dotata di estremo superiore
(rispettivamente, dotata di estremo inferiore) se tale è il sottoinsieme
f (X) di R, e quindi se esiste un elemento ℓ ∈ R tale che

∀ x ∈ X : f (x) ≤ ℓ (rispettivamente, ℓ ≤ f (x) );
 1)
2)
m ∈ R, ∀ x ∈ X : f (x) ≤ m ⇒ ℓ ≤ m

(rispettivamente, ∀ x ∈ X : m ≤ f (x) ⇒ m ≤ ℓ ).
(4.2.4)
L’elemento ℓ verificante la (4.2.4) è unico, viene denominato estremo superiore di f (rispettivamente, estremo inferiore di f ) e viene
denotato con uno dei seguenti simboli:
sup f ,
sup f (x) ,
x∈X
(rispettivamente, inf X ,
inf f (x) ).
x∈X
Anche ora naturalmente la seconda proprietà in (4.2.4) si può esprimere in maniera equivalente come segue
∀ ε ∈ R∗+ ∃x ∈ X t.c. ℓ − ε < f (x) (rispettivamente, f (x) < ℓ + ε ).
(4.2.5)
2 Si
ricorda che Iδ (x0 ) =]x0 − δ, x0 + δ[ (vedasi la (2.3.1) a pag. 42).
4.3 Proprietà di monotonia
83
y
M
P
Q
m
0 p
q
x
Figura 4.1: Esempio di massimo assoluto e relativo.
Dalla seconda forma dell’assioma di completezza (Proposizione 2.3.1)
segue che ogni funzione limitata superiormente è dotata di estremo superiore ed analogamente ogni funzione limitata inferiormente è dotata
di estremo inferiore.
Se f non è limitata superiormente (rispettivamente, inferiormente), si
scriverà per convenzione
sup f = +∞ ,
4.3
inf f = −∞ .
Proprietà di monotonia
Le proprietà considerate nella presente sezione sono molto importanti per
lo studio qualitativo del grafico di una funzione reale.
Definizione 4.3.1 Siano X un sottoinsieme di R ed f : X → R una funzione reale. Si dice che f è crescente (rispettivamente, strettamente crescente,
Capitolo 4: Funzioni reali
84
decrescente, strettamente decrescente) se:
∀ x, y ∈ X : x < y
⇒
f (x) ≤ f (y)
(rispettivamente, ∀ x, y ∈ X : x < y
∀ x, y ∈ X : x < y
∀ x, y ∈ X : x < y
⇒
⇒
⇒
f (x) < f (y) , (4.3.2)
f (x) ≥ f (y) , (4.3.3)
f (x) > f (y) ). (4.3.4)
(4.3.1)
Inoltre, f si dice monotona se verifica una qualsiasi delle condizioni
precedenti e viene denominata strettamente monotona se invece verifica la
(4.3.2) oppure la (4.3.4).
Infine, se A è un sottoinsieme di X, si dice che f è crescente (rispettivamente, strettamente crescente, decrescente, strettamente decrescente) in
A se la restrizione f|A di f al sottoinsieme A verifica tale proprietà.
In Figura 4.2 viene mostrato un esempio di una funzione strettamente
crescente in un intervallo I e strettamente decrescente in un intervallo J.
y
0
J
x
I
Figura 4.2: Funzione strettamente crescente (decrescente) in un intervallo.
Proposizione 4.3.2 Una funzione f : X → R risulta strettamente monotona se e solo se è monotona e iniettiva.
Dimostrazione. Se f è strettamente monotona essa è ovviamente monotona. Inoltre, se x, y ∈ X e x ̸= y, si può supporre x < y a meno di uno
scambio di notazioni. Se f verifica la (4.3.2) allora f (x) < f (y), mentre se
f verifica la (4.3.4) si ha f (y) < f (x); in ogni caso risulta f (x) ̸= f (y) e ciò
dimostra che f è iniettiva.
4.3 Proprietà di monotonia
85
Si supponga ora f monotona; se f non fosse strettamente monotona
dalle (4.3.2) e (4.3.4) esisterebbero x, y ∈ X con x < y e f (x) = f (y), il che
contraddirebbe l’iniettività di f .
Anche ora conviene prendere in considerazione una nozione locale di
monotonia, che nel seguito per le funzioni derivabili potrà essere messa in
relazione con il segno della derivata prima.
Definizione 4.3.3 Siano X un sottoinsieme di R, f : X → R una funzione
reale e x0 ∈ X. Si dice che f è crescente (rispettivamente, strettamente
crescente, decrescente, strettamente decrescente) in x0 se esiste un numero
reale δ > 0 tale che
{
∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) ≤ f (x0 ) ,
∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) ≤ f (x)
(rispettivamente,
{
{
{
∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) < f (x0 ) ,
∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) < f (x) ;
∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) ≥ f (x0 ) ,
∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) ≥ f (x) ;
∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) > f (x0 ) ,
∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) > f (x) ).
In Figura 4.3, viene mostrato geometricamente un punto a in cui una
funzione è strettamente crescente ed un punto b in cui è strettamente decrescente.
Nell’osservazione seguente si considera per brevità una funzione crescente; con ovvie modifiche, analoghe proprietà possono essere stabilite nel caso
in cui f sia strettamente crescente, decrescente o strettamente decrescente.
Osservazione 4.3.4 Dalle definizioni adottate, segue subito che:
1. Se f : X → R è crescente, allora f è crescente in x0 per ogni x0 ∈ X.
2. Se X è un intervallo, allora f : X → R è crescente se e solo se f è
crescente in ogni x0 ∈ X.
Infatti, tenendo conto della proprietà precedente, bisogna solo dimostrare che se
f è crescente in ogni punto x0 ∈ X, allora f è crescente. Infatti, in tal caso, siano
x, y ∈ X tali che x < y. Poiché X è un intervallo, si ha [x, y] ⊂ X e quindi si può
considerare l’insieme A := {t ∈ [x, y] | f (x) ≤ f (t)} . L’insieme A è non vuoto
(infatti x ∈ A) e limitato superiormente (in quanto contenuto in [x, y]); dalla
Capitolo 4: Funzioni reali
86
y
a
0
b
x
Figura 4.3: Funzione strettamente crescente (decrescente) in un punto.
seconda forma dell’assioma di completezza, esso è dotato di estremo superiore
x0 ∈ [x, y]. Poiché f è crescente in x0 , esiste δ ∈ R∗+ verificante le proprietà
previste nella Definizione 4.3.3. Dalla seconda proprietà dell’estremo superiore,
si può trovare t ∈ A tale che x0 − δ < t ≤ x0 , da cui segue f (x) ≤ f (t) ≤
f (x0 ); quindi x0 ∈ A. Inoltre, non può essere x0 < y altrimenti, considerato
t ∈ X∩]x0 , x0 + δ[∩]x0 , y], si avrebbe f (x0 ) ≤ f (t) e conseguentemente anche
f (x0 ) ≤ f (t); ciò comporterebbe t ∈ A in contraddizione con il fatto che x0 < t
e che x0 = sup A. Si è cosı̀ dimostrato che y = x0 ∈ A e quindi, dalla definizione
di A, f (x) ≤ f (y). Dall’arbitrarietà di x, y ∈ X tali che x < y segue che f è
crescente.
In generale, la parte 1) dell’osservazione precedente non si può invertire
nel caso in cui X non sia un intervallo.
Ad esempio, la funzione f : R∗ → R definita ponendo, per ogni x ∈ R∗ ,
f (x) = −1/x è strettamente crescente in ogni punto, ma non è strettamente
crescente (le sue restrizioni agli intervalli ]−∞, 0[ e ]0, +∞[ sono chiaramente
strettamente crescenti ma, ad esempio, si ha −1 < 1 e f (−1) > f (1)).
La nozione di crescenza o decrescenza in un punto non va confusa con
quella di crescenza o decrescenza in un intervallo aperto contenente tale
punto. Infatti, ad esempio, la funzione f : R → R definita ponendo, per
4.4 Proprietà di simmetria e periodicità
ogni x ∈ R,

 x+1,
0,
f (x) :=

x−1,
87
x<0,
x=0,
x>0,
è strettamente decrescente in 0, mentre è strettamente crescente in ogni
x0 ∈ R∗ .
4.4
Proprietà di simmetria e periodicità
Anche le proprietà seguenti sono utili per lo studio qualitativo del grafico di
una funzione reale in quanto consentono di limitare lo studio della funzione
a quello di una sua opportuna restrizione.
Definizione 4.4.1 Siano X un sottoinsieme di R ed f : X → R una funzione reale. Si dice che f è pari (rispettivamente, dispari) se è verificata la
seguente condizione:
{
1)
∀ x ∈ X : −x ∈ X ,
2)
∀ x ∈ X : f (−x) = f (x) (rispettivamente, f (−x) = −f (x) ).
Le proprietà 1) precedente si esprime anche dicendo che X è simmetrico.
Innanzitutto, quindi, è importante verificare tale condizione, senza la quale
non ha senso chiedersi se la funzione è pari o dispari.
Diversi esempi di funzioni pari o dispari saranno considerati in seguito
quando saranno studiate le funzioni elementari.
Il grafico di una funzione pari è simmetrico rispetto all’asse delle ordinate, mentre il grafico di una funzione dispari è simmetrico rispetto all’origine.
Pertanto, si può studiare una funzione pari o dispari dapprima in X∩[0, +∞[
(oppure in X∩] − ∞, 0] e poi si può ricavare il comportamento nella parte
rimanente dell’insieme di definizione in base alle proprietà di simmetria.
A questo punto si passa a studiare la proprietà di periodicità, anch’essa
utile per ridurre lo studio di una funzione a quello di una sua opportuna
restrizione.
Definizione 4.4.2 Siano X un sottoinsieme di R, f: X → R una funzione
reale e ω ∈ R∗+ . Si dice che f è periodica di periodo ω (oppure, brevemente,
ω-periodica) se è verificata la seguente condizione:
{
1)
∀ x∈X : x−ω ∈X , x+ω ∈X ,
2)
∀ x ∈ X : f (x − ω) = f (x) = f (x + ω) .
Capitolo 4: Funzioni reali
88
La proprietà 1) precedente si esprime anche dicendo che X è ω-periodico.
Gli esempi più importanti di funzioni periodiche saranno le funzioni
trigonometriche; si vedrà che le funzioni seno e coseno sono periodiche di
periodo 2π, mentre le funzioni tangente e cotangente sono periodiche di
periodo π.
Come segue dalla condizione 2) della Definizione 4.4.2, il grafico di
una funzione ω-periodica si ripete ad intervalli di periodo ω. Pertanto,
è sufficiente studiare tali funzioni in un intervallo di ampiezza ω.
Se, in più, una funzione è anche pari o dispari, si può scegliere l’insieme
simmetrico [−ω/2, ω/2] come intervallo di ampiezza ω e quindi ridurre lo
studio della funzione al sottoinsieme X ∩ [0, ω/2] (oppure X ∩ [−ω/2, 0]) a
causa della proprietà di simmetria.
4.5
Successioni
Una funzione a : N → E viene denominata successione di elementi di E.
Nel caso in cui E = R si userà la denominazione di successione reale.
L’insieme dei valori di una successione viene denominato insieme degli
elementi della successione.
Pertanto, tutte le definizioni e le proprietà delle funzioni reali possono
essere applicate al caso delle successioni di numeri reali, riguardando queste
come particolari funzioni aventi N come insieme di definizione.
Per le successioni, tuttavia, si adoperano una terminologia e delle notazioni particolari. Cosı̀, anzichè utilizzare le notazioni tipiche delle funzioni,
per le successioni si preferisce utilizzare la notazione (an )n∈N evidenziando
in tal modo il ‘valore’ an = a(n) che la successione assume in un generico
elemento n ∈ N.
A titolo di esempio, si passano ora in rassegna alcune delle definizioni
viste in generale per le funzioni traducendole nel caso delle successioni.
Se (an )n∈N e (bn )n∈N sono successioni reali, la somma e il prodotto delle
due successioni sono definite al modo seguente:
(an )n∈N + (bn )n∈N := (an + bn )n∈N ,
(an )n∈N · (bn )n∈N := (an · bn )n∈N .
Una successione (an )n∈N si dice limitata superiormente (rispettivamente,
limitata inferiormente) se esiste M ∈ R tale che
∀ n ∈ N : an ≤ M
(rispettivamente, ∀ n ∈ N : M ≤ an ).
Se una successione (an )n∈N è limitata superiormente (rispettivamente,
inferiormente), l’estremo superiore (rispettivamente, inferiore) ℓ di (an )n∈N
4.5 Successioni
89
è caratterizzato dalle seguenti proprietà:

∀ n ∈ N : an ≤ ℓ (rispettivamente, ℓ ≤ an );
 1)
2)
m ∈ R, ∀ n ∈ N : an ≤ m ⇒ ℓ ≤ m

(rispettivamente, ∀ n ∈ N : m ≤ an ⇒ m ≤ ℓ )
e viene denotato con il simbolo supn∈N an (rispettivamente, inf n∈N an ).
Se (an )n∈N non è limitata superiormente (rispettivamente, inferiormente), si scriverà supn∈N an = +∞ (rispettivamente, inf n∈N an = −∞).
Una successione (an )n∈N si dice crescente se:3
∀ n ∈ N : an ≤ an+1 .
(4.5.1)
In modo analogo si considerano le definizioni di successione strettamente
crescente, decrescente, e strettamente decrescente.
Per le successioni è spesso importante stabilire le proprietà definitive,
che sono cioè vere da un certo indice n in poi. Cosı̀, ad esempio, si dice che
una successione (an )n∈N è definitivamente crescente se:
∃ ν ∈ N t.c. ∀ n ∈ N, n ≥ ν : an ≤ an+1 .
Analogamente, si dice che gli elementi di una successione (an )n∈N sono
definitivamente minori o uguali di quelli di una successione (bn )n∈N (o, più
brevemente, che (an )n∈N è definitivamente minore o uguale di (bn )n∈N ) se
esiste ν ∈ N tale che, per ogni n ∈ N, n ≥ ν, si abbia an ≤ bn .
In base a quanto sopra, in generale potrebbe non interessare il comportamento di una successione in un numero finito di elementi e addirittura
la successione (si continua a denominare tale) potrebbe essere definita solo
da un certo numero naturale p in poi, nel qual caso si adopera la notazione
(an )n≥p .
Si conclude la presente sezione con un esempio molto importante di
successione che consente di definire il numero di Nepero.
4.5.1
Numero di Nepero
Si consideri la successione reale definita ponendo, per ogni n ≥ 1,
(
)n
1
.
en := 1 +
n
3 È
facile riconoscere che tale condizione è equivalente alla seguente
∀ n, m ∈ N : n < m ⇒ an ≤ am .
Infatti, è ovvio che quest’ultima implica la (4.5.1) considerando m = n + 1. Per stabilire
il viceversa, si può procedere per induzione completa sul numero naturale p = m − n
(vedasi la Proposizione 2.1.1).
Capitolo 4: Funzioni reali
90
Si osservi che e1 = 2 e inoltre, dalla formula del binomio di Newton (Proposizione
2.1.2), si ha, per ogni n ≥ 2,
(
)
n ( )
n
∑
∑
1 n
n 1
n(n − 1) · · · (n − k + 1) 1
1+
=
=1+1+
(4.5.2)
k
k
n
n
k!
nk
k=0
k=2
=
=
n
∑
n−k+1
1 n n−1
···
k!
n
n
n
k=2
(
)
(
)
n
∑ 1
1
k−1
2+
1−
··· 1 −
.
k!
n
n
k=2
2+
Pertanto, 2 è il minimo della successione (en )n≥1 .
Proposizione 4.5.1 La successione (en )n≥1 è limitata superiormente.
Dimostrazione. Per ogni n ≥ 2, dalle (4.5.2) segue
en ≤ 2 +
n
∑
1
;
k!
k=2
inoltre, poichè 2k−1 ≤ k! per ogni k ≥ 2 (tale diseguaglianza si stabilisce facilmente per
induzione completa (vedasi la Proposizione 2.1.1), si ottiene
en ≤ 2 +
n
∑
k=2
1
2k−1
=2+
n−1
∑
h=1
n−1
∑ 1
1
=
1
+
.
2h
2h
h=0
A questo punto, ricordando che
∀ a, b ∈ R : an − bn = (a − b)
n−1
∑
ak bn−1−k
k=0
(anche questa uguaglianza si stabilisce direttamente per induzione completa), si conclude
en ≤
1
1 − 1/2n
= 1 + 2 − n−1 < 3 .
1 − 1/2
2
In base alla proposizione precedente, si può considerare l’estremo superiore della successione (en )n≥1 , il quale viene denominato numero di Nepero
e denotato con e:
(
)n
1
e := sup 1 +
.
(4.5.3)
n
n≥1
Dalle osservazioni precedenti si ha 2 < e ≤ 3; un’analisi più precisa
permette di riconoscere che e ∼ 2, 718281828945 . . . . Si può dimostrare
inoltre, ma non si approfondisce tale aspetto, che e è un numero irrazionale.
Un’ulteriore proprietà importante della successione (en )n≥1 , che consentirà di scrivere il numero di Nepero come limite della successione (en )n≥1 ,
viene invece stabilita di seguito.
4.6 Funzioni elementari
91
Proposizione 4.5.2 La successione (en )n≥1 è strettamente crescente.
Dimostrazione. Infatti, per ogni n ≥ 1, dalle (4.5.2), si ha
(
)
(
)
n
∑
1
1
k−1
en < 2 +
1−
··· 1 −
k!
n+1
n+1
k=2
<
2+
n+1
∑
k=2
4.6
1
k!
(
1−
1
n+1
)
(
)
k−1
··· 1 −
= en+1 .
n+1
Funzioni elementari
Vengono a questo punto considerate alcune tra le più importanti funzioni
reali; esse vengono denominate funzioni elementari in quanto le funzioni
reali di cui ci si occuperà in seguito si otterranno in generale da esse mediante
operazioni algebriche oppure di composizione tra funzioni. Le proprietà e il
grafico di tali funzioni si riveleranno molto utili nei capitoli successivi.
4.6.1
Funzioni potenza ad esponente intero positivo
Per ogni n ∈ N, la funzione potenza ad esponente intero positivo n è la
funzione fn : R → R definita ponendo, per ogni x ∈ R,
fn (x) = xn .
Dalle proprietà elementari delle potenze di numeri reali, si ricavano facilmente le seguenti proprietà delle funzioni fn .
1. fn (0) = 0 ,
fn (1) = 1 .
2. Se x, y ∈ R e 0 ≤ x < y, allora fn (x) < fn (y).
Tale proprietà può essere dimostrata facilmente utilizzando il principio di induzione
completa. Se n = 1, la proprietà è ovviamente vera. Si supponga che sia vera per n
e siano x, y ∈ R tali che 0 ≤ x < y. Dall’ipotesi di induzione si ha fn (x) < fn (y),
cioè xn < y n e da qui si ricava xn+1 = xn · x < y n · x < y n · y = y n+1 , cioè
fn+1 (x) < fn+1 (y). Quindi la proprietà è vera per n + 1. Lo schema della
presente dimostrazione, fornita a titolo di esempio, si applica anche a diverse
proprietà successive.
3. Se x ∈ R e 0 ≤ x ≤ 1, allora 0 ≤ fn+1 (x) ≤ fn (x) ≤ 1.
4. Se x ∈ R e x ≥ 1, allora 1 ≤ fn (x) ≤ fn+1 (x).
5. Se n è pari fn è una funzione pari mentre se n è dispari fn è una
funzione dispari.
Capitolo 4: Funzioni reali
92
Tenendo presente le proprietà precedenti, si può ora tracciare approssimativamente il grafico delle funzioni potenza con esponente pari e dispari. Tali grafici sono utili anche perché riassumono in modo geometrico le
proprietà enunciate sopra.
Nelle Figure 4.4–4.5, il grafico continuo rappresenta la funzione potenza
n-esima, mentre quello tratteggiato rappresenta la potenza (n + 2)-esima.
In Figura 4.4 viene illustrato il grafico tipico delle funzioni potenza nel caso
n pari, mentre in Figura 4.5 quello nel caso n dispari (n ≥ 3).
y
1
-1
0
1
x
Figura 4.4: Funzione potenza ad esponente pari (≥ 2).
4.6.2
Funzioni radice
Innanzitutto si osserva che, come conseguenza dell’assioma di completezza,
per ogni n ≥ 2 e per ogni b ∈ R+ esiste uno ed un solo a ∈ R+ tale che
an = b (l’elemento a, infatti, può essere definito come estremo superiore
dell’insieme {x ∈ R+ | xn < b}). Tale elemento viene denominato radice
n-esima di b e denotato con uno dei seguenti simboli:
√
n
b,
b1/n ;
nella notazione
√
n
b si può omettere l’indice n nel caso n = 2.
y
4.6 Funzioni elementari
93
1
-1
0
1
x
-1
Figura 4.5: Funzione potenza ad esponente dispari (≥ 3).
Tale risultato consente ora di definire la funzione radice. Sia n ≥ 2; se
n è pari, la funzione radice f1/n : R+ → R è definita ponendo, per ogni
x ∈ R+ ,
√
f1/n (x) := n x .
(4.6.1)
Se n è dispari, la funzione radice può essere definita
√ in tutto R (ciò dipende
dal fatto che, se b ∈ R− , allora l’elemento a := − n −b è l’unico numero reale
(negativo) verificante la condizione an = b). Quindi, la funzione radice nesima in questo caso è la funzione f1/n : R → R definita ponendo, per ogni
x ∈ R+ ,
{ √
n
x,
se x ≥ 0 ;
f1/n (x) :=
(4.6.2)
√
− n −x ,
se x < 0 .
Alternativamente, la funzione radice n-esima può essere definita tenendo
presente quanto osservato nella Sezione 4.1, considerando l’inversa della
restrizione di fn ad R+ nel caso n pari, e l’inversa di fn nel caso n dispari.
Dalla (1.2.11), infatti, tale inversa assume come valore in x proprio l’unico
numero reale y tale che y n = x e quindi coincide con la funzione sopra
definita.
Seguono, a titolo di esempio, alcune delle proprietà delle radici n-esime.
1. f1/n (0) = 0 ,
f1/n (1) = 1.
Capitolo 4: Funzioni reali
94
2. Se x ∈ R+ , f1/n (x) ≥ 0 .
3. Se x, y ∈ R+ e x < y, allora f1/n (x) < f1/n (y).
Infatti, se fosse
√
n
y ≤
√
n
x, elevando alla potenza n-esima, dalle proprietà delle
potenze seguirebbe y ≤ x, in contraddizione con le ipotesi.
4. Se x ∈]0, 1[, allora f1/n (x) < f1/(n+1) (x) .
5. Se x ∈]1, +∞[, allora f1/(n+1) (x) < f1/n (x) .
6. Se n è dispari, la funzione radice n-esima risulta una funzione dispari
(mentre se n è pari non ha senso chiedersi se la funzione radice n-esima
sia simmetrica in quanto essa è definita in un insieme non simmetrico).
Nelle Figure 4.6–4.7, approssimativamente il grafico delle funzioni radice
nei casi n pari ed n dispari; viene usato il tratto continuo per la radice
n-esima, e tratteggiato per la radice (n + 2)-esima.
y
1
0
x
1
Figura 4.6: Funzione radice con indice pari.
4.6.3
Funzione potenza ad esponente intero negativo
Si fissi ora un numero naturale n ≥ 2 e si consideri la funzione reale f−n :
R∗ → R definita ponendo, per ogni x ∈ R∗ ,
f−n (x) :=
1
.
xn
(4.6.3)
Tale funzione viene denominata funzione potenza ad esponente intero
negativo n. Dalla definizione adottata, tale funzione non è altro che la
funzione reciproca della funzione potenza ad esponente intero positivo n.
4.6 Funzioni elementari
95
y
1
-1
0
1
x
-1
Figura 4.7: Funzione radice con indice dispari.
Dalla definizione adottata e dalle proprietà già viste delle funzioni potenza ad esponente intero positivo, si possono ricavare altrettante proprietà
della funzione f−n , che per brevità vengono omesse.
Si conclude pertanto con le Figure 4.8–4.9, nelle quali viene tracciato
approssimativamente il grafico delle funzioni potenza ad esponente intero
negativo nei casi n pari ed n dispari; viene usato il tratto continuo per la
funzione f−n , e tratteggiato per la funzione f−n−2 .
y
1
0
-1
1
x
Figura 4.8: Funzione potenza ad esponente intero negativo pari.
Capitolo 4: Funzioni reali
96
y
1
x
1
-1
-1
Figura 4.9: Funzione potenza ad esponente intero negativo dispari.
4.6.4
Funzioni potenza ad esponente razionale e reale
Si vuole ora studiare il caso delle funzioni potenza in cui l’esponente sia un
numero razionale oppure reale.
Nel caso di un esponente razionale q ∈ Q, si possono considerare m ∈ Z
ed n ∈ N tali che n ̸= 0 e q = m/n. Per ogni numero reale strettamente
positivo x, ha senso considerare la potenza ad esponente razionale xq che si
definisce ponendo
√
1/n
xq := (xm )
(= n xm ) ;
se q > 0, tale definizione può essere estesa ad x = 0 ponendo 0q = 0.
Conviene subito osservare che se si considera un’altra rappresentazione del
′
1/n′
numero razionale q del tipo q = m′ /n′ , si ha (xm )
= (xm )
1/n
in quanto
4.6 Funzioni elementari
97
′
′
m′ · n = m · n′ e conseguentemente xm ·n = xm·n . Pertanto il numero xq
non dipende dalla particolare rappresentazione del numero razionale q.
Si fissi un numero reale arbitrario r e sia x un numero reale strettamente
positivo. Per ogni numero razionale q < r ha senso considerare, per quanto
visto sopra, la potenza xq ; allora la potenza ad esponente reale xr viene
definita ponendo

inf xq , se 0 < x < 1 ;

q∈Q, q≤r
r
x :=
(4.6.4)
q
 sup x , se x ≥ 1 .
q∈Q, q≤r
Alternativamente, si potrebbero considerare i numeri razionali q > r e
porre

 sup xq , se 0 < x < 1 ;
q∈Q, q≥r
xr :=

inf xq , se x ≥ 1 .
q∈Q, q≥r
Si può dimostrare che le due definizioni sono equivalenti. Se r > 0, si
pone inoltre 0r = 0.
A questo punto, si considera la funzione potenza ad esponente reale.
Precisamente, se r > 0, si considera la funzione fr : [0, +∞[→ R definita
ponendo, per ogni x ∈ [0, +∞[,
fr (x) := xr .
Se r ≤ 0, la funzione potenza ad esponente reale fr :]0, +∞[→ R viene
definita allo stesso modo, ma non è definita in 0 e quindi ha come insieme
di definizione l’insieme ]0, +∞[.
Se q ∈ Q, le proprietà della funzione fq possono essere ricavate tenendo
presente contemporaneamente le proprietà delle funzioni ad esponente intero
e delle funzioni radice; conseguentemente, dalla (4.6.4), si possono considerare le proprietà delle funzioni potenza ad esponente reale. Per brevità,
ci si limita ad osservare che l’andamento grafico di tali funzioni è quello
tipico di una funzione potenza ad esponente intero positivo nel caso r > 1,
di una funzione radice nel caso 0 < r < 1 e di una funzione potenza ad
esponente intero negativo nel caso q < 0.
Nella Figura 4.10, sono riportati i grafici generali delle funzioni potenza
ad esponente reale.
4.6.5
Funzioni esponenziali e logaritmiche
Nel paragrafo precedente si è attribuito un significato alla potenza avente
come base un numero reale strettamente positivo e come esponente un numero reale arbitrario. Fissato poi un numero reale arbitrario r, si è studiata
Capitolo 4: Funzioni reali
98
y
1
0
1
x
Figura 4.10: Funzione potenza con esponente razionale o reale.
la funzione potenza fr , cioè il comportamento della potenza xr al variare
della base.
Si vuole invece ora studiare la funzione ottenuta fissando la base della
potenza ad esponente reale e facendo variare l’esponente. Si deve osservare
che la base deve essere un numero strettamente positivo, mentre l’esponente
può essere un numero reale qualsiasi. Sia pertanto a ∈ R∗+ e si supponga,
per evitare casi banali, a ̸= 1. Si consideri la funzione expa : R → R definita
ponendo, per ogni x ∈ R,
expa (x) := ax .
(4.6.5)
Tale funzione prende il nome di funzione esponenziale di base a. Le proprietà
di tale funzione sono conseguenza delle proprietà delle potenze ad esponente
reale. Si osservi che la funzione esponenziale è definita in tutto R ed assume
valori strettamente positivi. Nel caso particolare in cui a sia il numero e
di Nepero (vedasi la (4.5.3)), la funzione esponenziale viene denominata
semplicemente funzione esponenziale e denotata con il simbolo exp (quindi,
per ogni x ∈ R, exp(x) := ex ).
Il comportamento della funzione esponenziale dipende dai casi 0 < a < 1
oppure a > 1.
Alcune proprietà delle funzioni esponenziali sono elencate di seguito:
4.6 Funzioni elementari
99
1. expa (0) = 1 e expa (1) = a;
2. Per ogni x, y ∈ R, risulta expa (x + y) = expa (x) · expa (y);
3. La funzione expa è strettamente crescente se a > 1 e strettamente
decrescente se 0 < a < 1;
4. Per ogni x ∈ R, risulta expa (x) = ax = (1/a)−x = exp1/a (−x); quindi
i grafici di expa e exp1/a risultano simmetrici tra di essi rispetto all’asse
delle ordinate;
5. Per ogni x, y ∈ R, risulta (expa (x))y = expa (x y).
Riassumendo, l’andamento del grafico delle funzioni esponenziali è del
tipo tracciato nelle Figura 4.11. Come si può notare, il comportamento
della funzione esponenziale dipende dai casi 0 < a < 1 oppure a > 1; la
curva continua rappresenta il grafico di una funzione esponenziale con base
a > 1, mentre quella tratteggiata il grafico di una funzione esponenziale con
base 0 < a < 1.
y
a
1
a
0
1
x
Figura 4.11: Funzione esponenziale.
Si osservi che la funzione esponenziale expa è strettamente monotona e
quindi iniettiva. Pertanto, tenendo presente quanto osservato nella Sezione
4.1, si può considerare l’inversa di expa , che viene denominata funzione
logaritmo di base a e denotata con loga . Tenendo presente che l’immagine
Capitolo 4: Funzioni reali
100
di expa è R∗+ , la funzione logaritmo è definita in R∗+ (ed a valori in R):
loga : R∗+ → R; inoltre, dalla (1.2.11), per ogni x ∈ R∗+ , loga (x) è l’unico
numero y ∈ R tale che expa (y) = x.
Anche ora, se a = e, la funzione logaritmo viene denominata semplicemente funzione logaritmo e denotata con il simbolo loga (quindi, per ogni
x ∈ R∗+ , log(x) := loge (x)).
Le proprietà di tale funzione sono conseguenza delle proprietà generali
delle funzioni inverse e dipendono da quelle delle funzioni esponenziali. Ad
esempio, si ha
1. loga (1) = 0 ,
loga (a) = 1 .
2. Per ogni x ∈ R: loga (expa (x)) = x .
3. Per ogni x ∈ R∗+ : expa (loga (x)) = x .
Altre proprietà derivano da quelle generali dei logaritmi; per comodità,
si richiamano di seguito quelle di più frequente utilizzo (la verifica di tali
proprietà è diretta usando la definizione di logaritmo e le proprietà delle
funzioni esponenziali). Nelle proprietà successive, i numeri a e b che figurano
come base dei logaritmi devono chiaramente intendersi strettamente positivi
e diversi da 1.
4. Per ogni x, y ∈ R∗+ : loga (x · y) = loga (x) + loga (y) .
5. Per ogni x ∈
R∗+ :
6. Per ogni x, y ∈
( )
1
loga
= − loga (x) .
x
R∗+ :
( )
x
loga
= loga (x) − loga (y) .
y
7. Per ogni x ∈ R∗+ ed y ∈ R: loga (xy ) = y loga (x) .
8. Per ogni x ∈ R∗+ : logb (x) =
loga (x)
.
loga (b)
Anche il comportamento della funzione logaritmo dipende dai casi 0 <
a < 1 oppure a > 1 (questa volta i grafici di loga e log1/a risultano
simmetrici tra di essi rispetto all’asse delle ascisse).
Il grafico delle funzioni logaritmo è del tipo tracciato nella Figura 4.12.
4.6 Funzioni elementari
101
y
1
0
a
1
a
x
Figura 4.12: Funzione logaritmo.
4.6.6
Funzioni trigonometriche
Per ogni x ∈ R, si può considerare un punto P corrispondente sulla circonferenza trigonometrica ottenuto considerando il secondo estremo dell’arco
di lunghezza x avente come primo estremo il punto A di coordinate (1, 0) e
percorrendo la circonferenza in senso orario se x è positivo e in senso orario
se x è negativo. Le coordinate cartesiane del punto P vengono denominate
coseno e rispettivamente seno di x. Tali quantità sono definite per ogni
x ∈ R e quindi si possono considerare la funzione seno e la funzione coseno,
che verranno denotate rispettivamente con sin e cos, e fanno corrispondere
ad ogni numero reale x, i numeri sin x e cos x appena definiti.
Le proprietà delle funzioni seno e coseno si deducono facilmente da quelle
del seno e del coseno elencate nella Sezione 3.2.
Da tali proprietà si deduce la periodicità di periodo 2π di tali funzioni.
Inoltre esse sono limitate ed hanno 1 come massimo e −1 come minimo (vi
sono infiniti punti di massimo dati da π/2 + 2kπ con k ∈ Z per la funzione
seno e da 2kπ con k ∈ Z per la funzione coseno e infiniti punti di minimo
dati da −π/2 + 2kπ con k ∈ Z per la funzione seno e da π + 2kπ con k ∈ Z
per la funzione coseno).
Inoltre la funzione seno è una funzione dispari mentre la funzione coseno
è pari.
Da tali proprietà e dai valori di tali funzioni negli archi noti è facile
Capitolo 4: Funzioni reali
102
tracciare il grafico delle funzioni seno e coseno con sufficiente precisione.
Il grafico delle funzioni seno e coseno è tracciato approssimativamente
nella Figura 4.13.
y
1
-π
π
-2
0
π
2
π
-1
Figura 4.13: Funzioni seno e coseno.
{π
}
A questo punto si osserva che la tangente è definita per ogni x ∈
+ kπ | k ∈ Z
2
e quindi si può considerare la funzione tangente
definita in
{π
} tale insieme e
denotata ancora con tan; dunque tan : Rr
+ kπ | k ∈ Z → R è definita
2}
{π
ponendo, per ogni x ∈ R r
+ kπ | k ∈ Z ,
2
tan x :=
sin x
.
cos x
(4.6.6)
Dalle proprietà della tangente richiamate nella Sezione 3.2, si deduce che
sin(−x)
la funzione tangente è periodica di periodo π. Inoltre, tan(−x) =
=
cos(−x)
− sin x
= − tan x e quindi la funzione tangente è dispari (si osservi che il
cos x
suo insieme di definizione è simmetrico).
Dai valori degli archi noti per il seno e per il coseno si deducono altrettanti archi noti per la tangente.
Il grafico della funzione tangente è approssimativamente quello tracciato
nella Figura 4.14.
In modo analogo a quanto visto per la funzione tangente, si può procedere considerando il rapporto tra la funzione coseno e quella seno. Poichè
la funzione seno si annulla nell’insieme {kπ | k ∈ Z}, tale rapporto
è definito in R r {kπ | k ∈ Z}. Si ottiene pertanto la funzione cotangente cot : R r {kπ | k ∈ Z} → R definita ponendo, per ogni
x ∈ R r {kπ | k ∈ Z},
cos x
.
(4.6.7)
cot x :=
sin x
x
4.6 Funzioni elementari
103
y
-π
π
- 2
0
π
2
π
x
Figura 4.14: Funzione tangente.
Le proprietà della cotangente si discutono in maniera analoga a quanto
svolto per la tangente e dipendono ancora una volta da quelle delle funzioni
seno e coseno.
Si richiama solamente l’attenzione sul fatto che la funzione cotangente
è anch’essa periodica di periodo π, ma non è simmetrica.
Il grafico della funzione cotangente è approssimativamente quello tracciato nella Figura 4.15.
4.6.7
Funzioni trigonometriche inverse
Si è ora interessati alla possibilità di determinare una funzione inversa per
le funzioni trigonometriche studiate nella sottosezione precedente.
Si considera innanzitutto la funzione seno. Al fine di ottenere una funzione iniettiva, si considera la restrizione della funzione seno all’intervallo
[−π/2, π/2]; a questo punto, tenendo presente quanto osservato nella Sezione 4.1, si può considerare la funzione inversa di tale restrizione, che viene
denominata funzione arcoseno e denotata con arcsin. Tenendo presente che
l’immagine di sin è [−1, 1], la funzione arcoseno è definita in [−1, 1]; inoltre,
Capitolo 4: Funzioni reali
104
y
-π
π
-2
0
π
2
π
x
Figura 4.15: Funzione cotangente.
dalla (1.2.11), arcsin : [−1, 1] → R è definita ponendo, per ogni x ∈ [−1, 1],
arcsin x = y dove y è l’unico elemento dell’intervallo [−π/2, π/2] tale che
sin y = x.
Dal calcolo del seno di alcuni archi noti, si può dedurre il valore della
funzione arcoseno in altrettanti punti particolari; infatti, ad esempio,
sin 0 = 0
π
1
sin =
6 √2
π
2
sin =
4
2
√
π
3
sin =
3
2
π
sin = 1
2
⇒
⇒
⇒
⇒
⇒
arcsin 0 = 0 ,
1
π
arcsin = ,
2√ 6
2
π
arcsin
= ,
2
4
√
3
π
arcsin
= ,
2
3
π
arcsin 1 = .
2
Inoltre, poiché la funzione seno ristretta all’intervallo [−π/2, π/2] continua ad essere una funzione dispari, anche la funzione arcoseno è dispari
4.6 Funzioni elementari
105
(infatti se arcsin x = y, allora y ∈ [−π/2, π/2] e sin y = x, da cui segue anche −y ∈ [−π/2, π/2] e sin(−y) = − sin y = −x; quindi arcsin(−x) = −y =
− arcsin x). Nello stesso modo si può anche riconoscere che la funzione
arcoseno è strettamente crescente.
Il grafico della funzione arcoseno è approssimativamente quello tracciato
nella Figura 4.16.
y
π
2
1
-1
x
π
-2
Figura 4.16: Funzione arcoseno.
Si procede ora in modo analogo con la funzione coseno. Questa volta
si considera la restrizione della funzione coseno all’intervallo [0, π], la quale
è strettamente decrescente e quindi iniettiva. Con lo stesso procedimento
adottato per la funzione arcoseno si può definire la funzione arcocoseno
arccos : [−1, 1] → R ponendo, per ogni x ∈ [−1, 1], arccos x = y dove y è
l’unico elemento dell’intervallo [0, π] tale che cos y = x.
Si verifica facilmente che la funzione arcocoseno è strettamente decrescente. Inoltre, come per la funzione arcoseno, dal calcolo del coseno di
alcuni archi noti, si può dedurre il valore della funzione arcocoseno in alcuni
punti particolari, che in questo caso per brevità non vengono elencati.
Capitolo 4: Funzioni reali
106
Il grafico della funzione arcocoseno è approssimativamente quello tracciato nella Figura 4.17.
y
π
π
2
-1
0
1
x
Figura 4.17: Funzione arcocoseno.
Anche per la funzione tangente si adopera un procedimento analogo.
La restrizione della funzione tangente all’intervallo aperto ] − π/2, π/2[ è
strettamente crescente ed è quindi iniettiva. Si definisce pertanto la funzione
arcotangente arctan : R → R ponendo, per ogni x ∈ R, arctan x = y, dove
y è l’unico elemento dell’intervallo ] − π/2, π/2[ tale che tan y = x.
Come nei casi precedenti, si possono ottenere i valori della funzione arcotangente in alcuni punti particolari: ad esempio, arctan 0 = 0, arctan 1 =
π/4 e arctan(−1) = −π/4 (la determinazione di altri valori corrispondenti
agli altri archi noti viene lasciata per esercizio). Si può inoltre riconoscere
che la funzione arcotangente è dispari e strettamente crescente.
Il grafico della funzione arcotangente è approssimativamente quello tracciato nella Figura 4.18.
Infine, con procedimento esattamente analogo a quello svolto, si considera la restrizione della funzione cotangente all’intervallo aperto ]0, π[, la
4.6 Funzioni elementari
107
y
π
2
0
x
π
-2
Figura 4.18: Funzione arcotangente.
quale risulta strettamente decrescente e quindi iniettiva. Ciò consente di definire la funzione arcocotangente arccot : R → R ponendo, per ogni x ∈ R,
arccot x = y, dove y è l’unico elemento di ]0, π[ tale che cot y = x. Tra
le proprietà di questa funzione si segnala il fatto che essa è strettamente
decrescente, e arccot 0 = π/2, arccot 1 = π/4, arccot (−1) = 3π/4.
Il grafico della funzione arcocotangente è approssimativamente quello
tracciato nella Figura 4.19.
y
π
π
2
0
Figura 4.19: Funzione arcocotangente.
x
Capitolo 5
Alcuni metodi di
risoluzione di equazioni e
disequazioni
Siano X ed Y sottoinsiemi di R ed f : X → R e g : Y → R funzioni reali.
Un’equazione si presenta nella forma seguente
f (x) = g(x) .
Risolvere la precedente equazione significa determinare l’insieme
S := {x ∈ X ∩ Y | f (x) = g(x)} .
In maniera analoga, una disequazione si presenta in una delle seguenti
forme
f (x) ≤ g(x) ,
f (x) ≥ g(x) ,
f (x) < g(x) ,
f (x) > g(x)
e risolverla significa determinare l’insieme degli elementi di X ∩ Y per cui
la diseguaglianza indicata risulta vera.
5.1
Equazioni e disequazioni razionali intere
Un tipo molto semplice di equazioni e disequazioni é costituito da quelle di
tipo algebrico. Esse si presentano nella forma
P (x) = 0
Capitolo 5: Equazioni e disequazioni
110
oppure, rispettivamente,
P (x) ≤ 0 ,
P (x) ≥ 0 ,
P (x) < 0 ,
P (x) > 0 ,
con P polinomio.
In precedenza ci si è soffermati sulle soluzioni delle equazioni polinomiali
e pertanto ora si prenderanno in considerazione soprattutto le disequazioni; ovviamente, queste hanno senso solo per polinomi a coefficienti reali in
quanto in C non si possono considerare disequazioni. Passando, se necessario, alla disequazione opposta, nel seguito si potrà supporre, qualora lo si
ritenga conveniente, che il coefficiente della potenza di grado massimo del
polinomio sia strettamente positivo.
Si studiano dapprima i casi più semplici in cui il grado del polinomio P
è 0, 1 oppure 2 e poi si passa al caso generale.
Si supponga dapprima che P sia un polinomio di grado 0, cioè P (x) = a0
per ogni x ∈ R con a0 ̸= 0. In questo caso, se a0 > 0, le disequazioni
P (x) ≤ 0 e P (x) < 0 non sono mai soddisfatte per cui S = ∅, mentre le
disequazioni P (x) ≥ 0 e P (x) > 0 sono sempre soddisfatte per cui S = R;
il caso a0 < 0 si discute in maniera analoga.
Si considera ora il caso in cui P sia un polinomio di grado 1, cioè P (x) =
mx + n per ogni x ∈ R con m, n ∈ R ed m > 0; in questo caso, è facile
vedere che le disequazioni in esame hanno rispettivamente come soluzioni i
seguenti intervalli: S =] − ∞, −n/m], S = [−n/m, +∞[, S =] − ∞, −n/m[,
S =] − n/m, +∞[. Ad esempio, la disequazione 2x+3¿0, ha come soluzioni
l’insieme S =] − 3/2, +∞[, mentre la disequazione 3 − 4(5 − x) ≤ 2x + 5 ha
come soluzioni l’insieme S =] − ∞, 11].
Sia ora P (x) = ax2 +bx+c un polinomio di secondo grado con a, b, c ∈ R
ed a > 0. In questo caso bisogna tener presente che:
• Se ∆ > 0, denotate con x1 e x2 le due radici distinte di P con x1 <
x2 , risulta P (x) ≥ 0 in ] − ∞, x1 ] ∪ [x2 , +∞[ e P (x) ≤ 0 in [x1 , x2 ]
(se a < 0, si ha ovviamente P (x) ≥ 0 in [x1 , x2 ] e P (x) ≤ 0 in
] − ∞, x1 ] ∪ [x2 , +∞[).
• Se ∆ = 0, risulta sempre P (x) ≥ 0 e P si annulla solo nell’unica radice
x0 = −b/2a (se a < 0, risulta sempre P (x) ≤ 0 e P si annulla solo
nell’unica radice x0 ).
• Se ∆ < 0, risulta sempre P (x) > 0 (se a < 0, risulta sempre P (x) < 0).
Da quanto osservato si deduce facilmente l’insieme delle soluzioni di
ognuna delle disequazioni in esame. Ad esempio, la disequazione 2x2 −
2x + 1 ≤ 0 non è mai soddisfatta il quanto il polinomio 2x2 − 2x + 1 ha
∆ = 4 − 8 = −4 < 0 ed è quindi sempre strettamente positivo. Invece, la
5.1 Equazioni e disequazioni razionali intere
111
disequazione x2 − x − 6 > 0 è soddisfatta in ] − ∞, −2[∪]3, +∞[ in quanto
il polinomio x2 − x − 6 ha due radici reali −2 e 3.
Si considera, infine, il caso generale. Siano n ∈ N ed a0 , . . . , an ∈ R con
an ̸= 0 e si consideri il polinomio
P (x) = a0 + a1 x + · · · + an xn ,
x∈R.
Essendo a coefficienti reali, il polinomio P si può decomporre come segue
(vedasi la Sezione 3.5.2, formula (3.5.7))
P (x) = an (x − x1 )h1 · · · (x − xp )hp (x2 + b1 x + c1 )k1 · · · (x2 + bq x + cq )kq ,
dove x1 , . . . , xp sono le radici reali di P aventi rispettivamente molteplicità
h1 , . . . , hp , e k1 , . . . , kq sono le molteplicità delle radici complesse coniugate
dei termini x2 + b1 x + c1 , . . . , x2 + bq x + cq con ∆1 = b21 − 4c1 < 0, . . . , ∆q =
b2q − 4cq < 0. Poiché la somma di tutte le molteplicità deve essere n, si deve
infine avere
h1 + · · · + hp + 2(k1 + · · · + kq ) = n .
Per ottenere tale decomposizione, si può procedere in modo diretto per i
polinomi di grado minore o uguale di 2 (oppure anche per quelli di grado 3
e 4), oppure utilizzare la regola di Ruffini per i polinomi di grado superiore.
La decomposizione del polinomio è il punto di partenza per lo studio delle
disequazioni algebriche. Una volta ottenuta tale decomposizione, si può
studiare il segno di ogni fattore e dedurre poi il segno del prodotto tenendo
presente che il prodotto di un numero dispari di numeri negativi è negativo
e il prodotto di un numero pari di numeri negativi è un numero positivo.
Inoltre, poiché i fattori di secondo grado hanno tutti discriminante negativo,
tali fattori hanno tutti segno costante strettamente positivo (in quanto il
coefficiente di x2 è 1 > 0). Per rendere più chiaro lo studio dei segni dei
singoli fattori, ci si può avvalere di uno schema grafico utilizzando per ogni
fattore un tratto continuo per rappresentare gli intervalli in cui è positivo
e tratteggiato per gli intervalli in cui è negativo; ad esempio, il segno del
fattore x − 1 viene rappresentato come segue
x−1≥0
1
−−−−−−−−−−−−•
e quello del fattore x2 − 2x − 3 nel modo seguente
x2 −2x−3 ≥ 0
−1
3
• −−−−−−−− •
In questo modo, il segno del polinomio sarà positivo negli intervalli in
cui vi è un numero pari di fattori negativi e negativo negli intervalli in cui vi
è un numero dispari di fattori negativi. Alla fine, si considerano gli intervalli
corrispondenti al tipo di disequazione richiesta.
Capitolo 5: Equazioni e disequazioni
112
Ad esempio, si consideri la disequazione x3 +x2 −4x−4 > 0; il polinomio
P (x) = x3 + x2 − 4x − 4 si può decomporre utilizzando la regola di Ruffini
come segue P (x) = (x−2)(x+1)(x+2); nello schema seguente si rappresenta
il segno di ogni fattore e quello del prodotto:
−2
−1
2
x−2≥0
−−−−−−−−−−−−−−−−−
•−−−−−−−−−−−−−−−−−−−−−−−−
x+1≥0
−−−−−−−−−−−
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
x+2≥0
−−−−−−−
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
P (x) ≥ 0
−−−−−−−
•−−−−−−−−−−−−−−−−
• −−−−−−
•−−−−−−−−−−−−−−−−−−−−−−−−
Poiché si vuole che il segno di P sia strettamente positivo, alla fine
vanno considerate le soluzioni date dall’insieme S :=]−2, −1[∪]2, +∞[; nella
seguente rappresentazione geometrica si é convenuto di rappresentare con
un cerchietto pieno gli estremi inclusi nell’insieme, o in cui é soddisfatta la
diseguaglianza in esame, e con un cerchietto vuoto i rimanenti estremi.
S
−2
−1
◦−−−−−−−−−−−−−◦
2
◦−−−−−−−−−−−−−−−−−−−−−−−
Anziché utilizzare i simboli • e ◦ spesso si ricorre ai simboli [ e ] con le
stesse convenzioni che riguardano gli intervalli; pertanto, l’insieme S si può
anche rappresentare nel modo seguente.
−2
S
5.2
−1
]−−−−−−−−−−−−−−[
2
]−−−−−−−−−−−−−−−−−−−−−−−−
Equazioni e disequazioni razionali fratte
Si considerano ora equazioni e disequazioni in cui sono coinvolte funzioni
razionali fratte. Si ricorda che una funzione R : X → R definita in un
sottoinsieme X di R si dice funzione razionale fratta (oppure semplicemente
funzione razionale) se esistono due polinomi P e Q, con Q non nullo, tali
che
X := {x ∈ R | Q(x) ̸= 0}
5.2 Equazioni e disequazioni razionali fratte
113
e inoltre, per ogni x ∈ X,
R(x) :=
P (x)
.
Q(x)
Poiché il polinomio Q ha sempre un numero finito di radici, le funzioni
razionali non sono definite al più in un numero finito di punti.
Per quanto riguarda le equazioni con funzioni razionali, esse si riducono
a quelle polinomiali. Infatti, si ha R(x) = 0 se e solo se P (x) = 0 e Q(x) ̸= 0;
bisogna quindi trovare le radici del polinomio P e verificare che in esse non
si annulli anche il denominatore, nel qual caso la funzione razionale non
risulterebbe definita. Ad esempio l’equazione
(x − 1)(x − 2)
=0
x2 − x
ha come unica radice l’elemento 2, in quanto l’altra radice 1 del numeratore
annulla anche il denominatore e quindi non ha senso considerare l’equazione in tale punto. Anche lo studio delle disequazioni razionali fratte viene
condotto in modo molto simile a quello delle disequazioni razionali intere.
Bisogna innanzitutto decomporre entrambi i polinomi P e Q in fattori di
primo e secondo grado con discriminante minore di 0 e successivamente studiare il segno di ogni fattore (sia del numeratore che del denominatore);
infine si tiene presente che il segno della funzione razionale sarà, come nel
caso delle disequazioni razionali intere, positivo negli intervalli in cui vi è un
numero pari di fattori negativi e negativo negli intervalli in cui vi è un numero dispari di segni negativi. Rispetto al caso polinomiale, nel considerare
gli intervalli corrispondenti alla disequazione richiesta, bisogna comunque
escludere i punti in cui si annulla il polinomio Q al denominatore.
Ad esempio, si consideri la disequazione
x−2
≤2;
x−1
essa è equivalente a
x−2
−2≤0,
x−1
e quindi, considerando il minimo comune multiplo,
−x
≤0.
x−1
Pertanto, bisogna studiare i segni di −x e x − 1, da cui si ottiene
Capitolo 5: Equazioni e disequazioni
114
0
1
−x ≥ 0
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
• −−−−−−−−−−−−−−−
x−1≥0
−−−−−−−−−−−−−−−−
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
R(x) ≥ 0
−−−−−−−−−
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
• −−−−−−−−
dove R(x) denota la funzione razionale −x/(x − 1).
Poiché nel caso in esame si vuole che R(x) ≤ 0, le soluzioni sono date dall’insieme S :=] − ∞, 0]∪]1, +∞[, che si può rappresentare nel modo
seguente.
0
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−•
S
5.3
1
◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Sistemi di equazioni e disequazioni
Nelle sezioni successive, si studieranno alcuni casi in cui le equazioni o disequazioni in esame possono essere ricondotte ad una o più equazioni o
disequazioni di tipo più semplice. Quando, in generale, si hanno più equazioni (rispettivamente, disequazioni) che devono essere soddisfatte contemporaneamente si preferisce parlare di sistemi di equazioni (rispettivamente,
sistemi di disequazioni ) e raggruppare le disequazioni con una parentesi
graffa. Un sistema di equazioni (rispettivamente, disequazioni) si presenta
nella forma

f1 (x) = g1 (x) ,



 f2 (x) = g2 (x) ,
..

.



fn (x) = gn (x)
(rispettivamente,

f1 (x) ≤ g1 (x) ,



 f2 (x) ≤ g2 (x) ,
..

.



fn (x) ≤ gn (x) ),
con f1 : X1 → R, . . . , fn : Xn → R e g1 : Y1 → R, . . . , gn : Yn → R funzioni
reali assegnate.
5.3 Sistemi di equazioni e disequazioni
115
Le soluzioni di un sistema di equazioni (rispettivamente, disequazioni)
sono date dall’insieme
S := {x ∈ X1 ∩ · · · ∩ Xn ∩ Y1 ∩ · · · ∩ Yn | f1 (x) = g1 (x), . . . , fn (x) = gn (x)}
(rispettivamente,
S := {x ∈ X1 ∩ · · · ∩ Xn ∩ Y1 ∩ · · · ∩ Yn | f1 (x) ≤ g1 (x), . . . , fn (x) ≤ gn (x)} ).
Quindi, per determinare l’insieme S si determinano separatamente gli insiemi S1 , . . . , Sn di ognuna delle equazioni (rispettivamente, disequazioni) del
sistema. Allora l’insieme S é dato da S1 ∩ · · · ∩ Sn . Quanto osservato vale
anche per i sistemi misti, che contengono sia equazioni che disequazioni.
Ad esempio, si consideri il sistema

 2x > 5 ,
x2 − 5x + 6 = 0 ,

x ̸= 0 .
La prima disequazione ha come soluzioni l’insieme S1 =]5/2, +∞[; la seconda equazione l’insieme S2 = 2, 3 e la terza l’insieme R∗ . Quindi l’insieme
S delle soluzioni del sistema è dato da S = S1 ∩ S2 ∩ S3 = {3}.
L’intersezione può essere facilmente determinata graficamente considerando i punti comuni agli insiemi delle soluzioni di ogni disequazione o
equazione.
S1
0
S2
S3
2
•
5/2
3
◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
•
−−−−−−−−−−−−−−−−−−−◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S
•
Si consideri ora il sistema
 2
 x + 5 ≤ 2x2 + 4 ,
x4 − 16 < 0 ,

2x − 1 > 0 .
L’insieme S1 delle soluzioni della prima disequazione é dato da S1 :=
] − ∞, −1] ∪ [1, +∞[, l’insieme S2 delle soluzioni della seconda disequazione
Capitolo 5: Equazioni e disequazioni
116
é dato da S2 :=] − 2, 2[ ed infine l’insieme S3 delle soluzioni della terza
disequazione é dato da S3 :=]1/2, +∞[. Pertanto, le soluzioni del sistema
sono date dall’insieme S := S1 ∩ S2 ∩ S3 = [1, 2[, come si riconosce anche
dal grafico seguente.
S1
S2
−2
−1
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−•
1
2
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦
◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S3
•−−−−−−−−−−◦
S
5.4
1/2
Equazioni e disequazioni irrazionali
Si considerano innanzitutto equazioni irrazionali del tipo
√
n
f (x) = g(x) .
Se n è pari, sia la funzione f che la funzione g devono essere positive,
la prima in quanto argomento della radice n-esima, la seconda in quanto
deve soddisfare l’uguaglianza prevista; una volta che ciò sia stato imposto,
si possono elevare primo e secondo membro alla potenza n-esima ed ottenere
un’equazione in cui non figura più la radice n-esima. Se n invece è dispari,
non è necessario imporre la positività delle funzioni f e g e quindi si possono
elevare direttamente alla potenza n-esima entrambi i membri dell’equazione.
Si conclude che l’equazione in esame è equivalente al seguente sistema

 f (x) ≥ 0 ,
g(x) ≥ 0 ,

f (x) = g(x)n ,
se n é pari, altrimenti é equivalente all’equazione
f (x) = g(x)n
se n é dispari.
Per quanto riguarda le disequazioni irrazionali conviene considerare separatamente i seguenti due casi:
√
√
n
f (x) ≤ g(x) ,
f (x) ≤ n g(x)
5.4 Equazioni e disequazioni irrazionali
117
(le diseguaglianze strette < al posto di ≤ vengono trattate in maniera analoga). Se n é dispari entrambi i tipi di disequazioni sono equivalenti a quelle
che si ottengono elevando entrambi i membri alla potenza n-esima. Se n é
pari, con ragionamento analogo a quello svolto per le equazioni, si riconosce
che la prima disequazione in esame é equivalente al sistema

 f (x) ≥ 0 ,
g(x) ≥ 0 ,

f (x) ≤ g(x)n ,
mentre la seconda é equivalente ai due sistemi

{
 f (x) ≥ 0 ,
f (x) ≤ 0 ,
g(x) ≥ 0 ,
g(x) ≥ 0 ,

f (x)n ≤ g(x) ,
nel senso che le soluzioni della disequazione sono date dall’unione delle
soluzioni dei due sistemi.
Ad esempio, si consideri la disequazione
√
x2 − x − 2 < x + 1 .
In base alla discussione precedente, essa é equivalente al sistema
 2
 x −x−2≥0,
x+1≥0,
 2
x − x − 2 < x2 + 2x + 1 ;
denotati con S1 , S2 e rispettivamente S3 gli insieme delle soluzioni della
prima, seconda e rispettivamente terza disequazione, si ottiene facilmente
S1 =] − ∞, −1[∪[2, +∞[ ,
S2 = [−1, +∞[ ,
S3 =] − 1, +∞[
e conseguentemente la disequazione assegnata é soddisfatta nell’insieme S =
S1 ∩ S2 ∩ S3 = [2, +∞[.
S1
−1
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−•
2
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S2
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S3
◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Capitolo 5: Equazioni e disequazioni
118
Al contrario, la disequazione opposta
√
x2 − x − 2 > x + 1
é equivalente ai due sistemi
{
 2
 x −x−2≥0,
x+1≥0,
 2
x − x − 2 > x2 + 2x + 1 ;
x −x−2≥0,
x+1<0,
2
in base alla discussione precedente, si riconosce facilmente che il primo sistema ha come soluzioni l’insieme S ′ =] − ∞, −1[, mentre il secondo sistema
non é mai soddisfatto (S ′′ = ∅); allora le soluzioni della disequazione sono
date da S = S ′ ∪ S ′′ =] − ∞, −1[ (si osservi che in questo caso alla fine viene
considerata l’unione delle soluzioni dei due sistemi).
Come ulteriore esempio, si consideri la disequazione
2−x<
√
x2 − 1 ;
essa é ancora una volta equivalente ai due sistemi
{

 2−x≥0,
x2 − 1 ≥ 0 ,

4 − 4x + x2 < x2 − 1 .
2−x<0,
x2 − 1 ≥ 0 ,
Per quanto riguarda il primo sistema, la prima disequazione é soddisfatta
in S1′ =]2, +∞[ e la seconda in S2′ =] − ∞, −1] ∪ [1, +∞[, per cui le soluzioni
del primo sistema sono date dall’insieme S ′ =]2, +∞[.
S1′
S2′
S′
−1
−−−−−−−−−−−−−−−−−−−−•
1
2
◦−−−−−−−−−−−−−−−−−−−
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
◦−−−−−−−−−−−−−−−−−−−
Il secondo sistema ha invece come soluzioni l’insieme S ′′ =]5/4, 2], in
quanto la prima disequazione é soddisfatta in S1′′ =] − ∞, 2], la seconda in
S2′′ =] − ∞, −1] ∪ [1, +∞[ e la terza in S3′′ =]5/4, +∞[.
5.5 Equazioni e disequazioni con valore assoluto
−1
1
119
5/4
S1′′
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−•
S2′′
−−−−−−−−−−−−−−−−−−−−•
2
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S3′′
◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S ′′
◦−−−−−−−−−−−−−•
Si conclude che le soluzioni della disequazione assegnata sono date dall’insieme S = S1 ∪ S2 =]5/4, +∞[.
5/4
S′
5.5
2
◦−−−−−−−−−−−−−−−−−−−
S ′′
◦−−−−−−−−−−−−−•
S
◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Equazioni e disequazioni con valore assoluto
Per ogni x ∈ R, il valore assoluto |x| di x è definito ponendo
{
x,
x≥0;
|x| :=
−x ,
x<0.
Un’equazione del tipo
|f (x)| = g(x) ,
con f e g funzioni reali assegnate, può essere ricondotta facilmente ad un
sistema di equazioni e disequazioni in cui non compare più il valore assoluto.
Infatti, tenendo presente che deve essere necessariamente g(x) ≥ 0 in quanto
il valore assoluto a primo membro è positivo, le soluzioni sono date dai due
sistemi:
{
{
g(x) ≥ 0 ,
g(x) ≥ 0 ,
f (x) = g(x) ,
f (x) = −g(x) .
Ad esempio, l’equazione
|x2 + x + 1| = x2 − 3x + 2
120
Capitolo 5: Equazioni e disequazioni
ha come soluzioni quelle dei due sistemi
{ 2
{ 2
x − 3x + 2 ≥ 0 ,
x − 3x + 2 ≥ 0 ,
x2 + x + 1 = x2 − 3x + 2 ,
x2 + x + 1 = −(x2 − 3x + 2) .
Il primo di essi è soddisfatto in S1 = (]−∞, 1]∪[2, +∞[)∩{1/4} = {1/4};
il secondo invece non ha soluzioni in quanto l’equazione x2 + x + 1 = −(x2 −
3x+2), equivalente a 2x2 −2x+3 = 0 non è mai soddisfatta. Si conclude che
l’equazione assegnata ammette come unica soluzione il punto x = {1/4}.
Alternativamente, l’equazione |f (x)| = g(x) può essere risolta anche distinguendo i casi in cui f (x) è positivo o negativo e utilizzando la definizione
di valore assoluto. In tal modo le soluzioni sono date dai due sistemi:
{
{
f (x) ≥ 0 ,
f (x) < 0 ,
f (x) = g(x) ,
−f (x) = g(x) ,
che sono ovviamente equivalenti a quelli considerati.
Si considerano ora le disequazioni che coinvolgono il valore assoluto.
Innanzitutto conviene considerare separatamente quelle che si presentano nella forma
|f (x)| ≤ g(x) ,
da quelle del tipo
f (x) ≤ |g(x)|
(nel caso di diseguaglianze strette i metodi di risoluzione sono del tutto
analoghi e pertanto per brevità vengono omessi).
Tenendo presente che la disequazione |x| ≤ a non é mai soddisfatta se
a < 0 ed é soddisfatta per −a ≤ x ≤ a se a ≥ 0, la prima disequazione é
equivalente al seguente sistema

g(x) ≥ 0 ,



−g(x) ≤ f (x) ,



f (x) ≤ g(x) ,
in cui non é più coinvolto il valore assoluto.
◃ Alternativamente, si ottengono le stesse soluzioni tenendo presente la
definizione di valore assoluto e distinguendo i casi in cui f (x) ≥ 0 e f (x) < 0.
In tal modo le soluzioni della prima disequazione sono date dai seguenti due
sistemi:
{
{
f (x) ≥ 0 ,
f (x) < 0 ,
f (x) ≤ g(x) ,
−f (x) ≤ g(x) .
5.5 Equazioni e disequazioni con valore assoluto
121
Analogamente, tenendo presente che la disequazione a ≤ |x| é sempre
soddisfatta se a < 0 ed é soddisfatta sia per x ≥ a che per x ≤ −a se a ≥ 0,
allora la seconda disequazione in esame é equivalente ai seguenti tre sistemi
(nel senso che l’insieme delle soluzioni é dato dall’unione degli insiemi delle
soluzioni dei tre sistemi)
{
{
{
f (x) < 0 ,
f (x) ≥ 0 ,
f (x) ≥ 0 ,
x ∈ Xg ;
g(x) ≥ f (x) ;
g(x) ≤ −f (x) ,
dove nel primo sistema si é denotato con Xg l’insieme di definizione della
funzione g (infatti la condizione f (x) < 0 assicura la validità di f (x) ≤ |g(x)|
purché anche la funzione g sia definita in x).
◃ Anche ora si ottengono le stesse soluzioni distinguendo i casi in cui
g(x) ≥ 0 e g(x) < 0. In tal modo le soluzioni della seconda disequazione
sono date dai seguenti due sistemi:
{
{
g(x) ≥ 0 ,
g(x) < 0 ,
f (x) ≤ g(x) ,
f (x) ≤ −g(x) .
Ad esempio, si consideri la disequazione |x2 − 9x + 7| ≤ 7. Da quanto
osservato, essa si riconduce al sistema

7≥0,



x2 − 9x + 7 ≤ 7 ,



−7 ≤ x2 − 9x + 7 .
La prima disequazione è sempre soddisfatta (S1 = R). La seconda si
può scrivere x2 − 9x + 14 ≥ 0; poiché ∆ = 25, si hanno due radici x1 = 2
e x2 = 7 e la disequazione è soddisfatta per x ≤ 2 o per x ≥ 7, cioé in
S2 =] − ∞, 2] ∪ [7, +∞[. L’ultima disequazione si scrive come x2 − 9x ≤ 0
e quindi è soddisfatta in S3 = [0, 9]. Quindi la disequazione assegnata ha
come soluzioni l’insieme S = [0, 2] ∪ [7, 9].
0
2
7
9
S1
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S2
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−•
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
S3
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
•
S
•−−−−−−−−−−
•
•−−−−−−−−−−
•
Capitolo 5: Equazioni e disequazioni
122
Si consideri ora la disequazione
x + 1 < |x2 − 3x − 8| ,
che in base alla discussione effettuata, si riconduce ai tre sistemi
{
{
{
x+1≥0,
x+1≥0,
x+1<0,
x2 − 3x − 8 < −x − 1 ,
x + 1 < x2 − 3x − 8 .
Il primo sistema ha come soluzioni l’insieme S ′ =] − ∞, −1[.
Per quanto riguarda il secondo sistema, la disequazione x + 1 ≥ 0 è
soddisfatta per x ≥ −1, e la disequazione x2 − 3x − 8√
< −x − 1 è equivalente
√
a x2 − 2x − 7 < 0; si hanno due soluzioni
x
=
1
−
2
1
√
√ 2 e x2 = 1 + 2 2 e la
disequazione è soddisfatta per 1 − 2 2 < x < 1 + 2 √2; pertanto il secondo
sistema ha come soluzioni l’insieme S ′′ = [−1, 1 + 2 2[.
Infine, la prima disequazione x + 1 ≥ 0 del terzo sistema è soddisfatta
per x ≥ −1; la seconda disequazione x + 1 < √
x2 − 3x − 8 è √
equivalente a
2
x −4x−9 > 0; si hanno due soluzioni x3 √
= 2− 13 e x4 = 2+
√ 13, e quindi
la disequazione è soddisfatta per x < 2 − 13 e per√x > 2 + 13; pertanto il
terzo sistema ha come soluzioni l’insieme S ′′′ =]2+ 13, +∞[. Concludendo,
le soluzioni √
della disequazione
iniziale sono date da S = S1 ∪ S2 ∪ S3 =
√
] − ∞, 1 + 2 2[∪]2 + 13, +∞[.
S′
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦
S ′′
1
5.6
√
1+ 13
•−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦
S ′′′
S
√
1+2 2
◦−−−−−−−−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦
◦−−−−−−−−−−−−−−−−−−−−−−−−−
Metodo grafico
Si considerano ora alcuni tipi di equazioni e disequazioni in cui sono coinvolte funzioni esponenziali, logaritmiche, trigonometriche e trigonometriche
inverse.
Uno dei metodi più semplici per la risoluzione di tali equazioni consiste
nel confrontare i grafici delle funzioni che compaiono al primo ed al secondo
membro della disequazione in esame e dedurre da tale grafico l’insieme delle
5.6 Metodo grafico
123
soluzioni della disequazione; per tale confronto bisogna comunque sempre
imporre che le funzioni siano definite nei punti considerati.
Il confronto grafico può essere effettuato molto facilmente nei casi in cui
una delle funzioni sia una retta o, più in particolare, una retta orizzontale,
nel qual caso uno dei membri della disequazione é costante.
Si considera qualche esempio, al fine di illustrare più chiaramente il
metodo descritto.
Si consideri la disequazione
log x < 1 .
Confrontando il grafico della funzione log con la retta orizzontale passante
per il punto (0, 1), si deduce in maniera immediata che la disequazione é
soddisfatta nell’insieme S =]0, e[ (vedasi la Figura 5.1).
y
1
0
1
S
e
x
Figura 5.1: Metodo grafico per le disequazioni: Esempio 1
Si consideri ora la disequazione
1
.
2
Confrontando il grafico della funzione sin con la retta orizzontale passante
per il punto (0, 1/2), si deduce subito che nell’intervallo [−π, π], la disequazione é soddisfatta nell’insieme S0 =]π/6, 5π/6[ (vedasi la Figura 5.2).
Tenendo poi conto della periodicità della funzione seno, si ricava l’insieme S di tutte le soluzioni dato da
[
∪ ]π
5
S=
+ 2kπ, π + 2kπ .
6
6
sin x >
k∈Z
Capitolo 5: Equazioni e disequazioni
124
y
0
-π
S0
π
x
Figura 5.2: Metodo grafico per le disequazioni: Esempio 2
Si prende ora in esame la disequazione
arcsin x ≤
π
.
6
Confrontando il grafico della funzione arcsin con la retta orizzontale passante per il punto (0, π/6), si deduce subito che la disequazione é soddisfatta
nell’insieme S = [−1, 1/2[ (vedasi la Figura 5.3).
y
π
2
π
6
1
2
-1
1
x
π
-2
Figura 5.3: Metodo grafico per le disequazioni: Esempio 3
Più generale, il metodo descritto negli esempi precedenti può essere applicato anche nei casi in cui il confronto non sia necessariamente con una
5.6 Metodo grafico
125
retta; in tali casi l’utilizzo del calcolo differenziale può essere utile per la
dimostrazione di qualche diseguaglianza. Inoltre, il teorema degli zeri può
anche essere utilizzato per una determinazione approssimata delle soluzioni,
nei casi in cui non sia possibile descrivere le soluzioni in maniera precisa.
Ad esempio, si consideri la seguente disequazione:
x4 + ex ≤ 1 .
y
0
S
x
Figura 5.4: Metodo grafico per le disequazioni: Esempio 4
Confrontando i grafici della funzione 1 − ex e della funzione x4 (vedasi la
Figura 5.4), si riconosce subito che tali funzioni assumono lo stesso valore in
un punto x0 < 0 e in 0 e conseguentemente, le soluzioni della disequazione
assegnata sono date dall’insieme S =]x0 , 0[. Il punto x0 non può essere
determinato in modo preciso, tuttavia esso è sicuramente compreso tra −1
e −1/2 in quanto nel punto −1/2 la disequazione é soddisfatta (come si
verifica direttamente), mentre nel punto −1 non lo è.
Capitolo 6
Limiti delle funzioni reali
6.1
Definizione generale di limite
Lo studio dei limiti delle funzioni reali costituisce uno strumento utile per
la conoscenza delle proprietà locali di una funzione reale assegnata.
Per comodità, viene considerato il caso di funzioni definite in sottoinsiemi arbitrari di R; tuttavia, quando l’esposizione di alcuni argomenti potrà
risultare semplificata, ci si limiterà a considerare il caso più significativo di
funzioni definite in un intervallo.
Si espone dapprima la definizione generale di limite di una funzione
reale in un punto e, dopo averne visto alcune proprietà, si considereranno i
risultati più importanti riguardanti il calcolo dei limiti.
Definizione 6.1.1 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un
punto di accumulazione per X ed ℓ ∈ R. Se f : X → R è una funzione reale
definita in X, si dice che ℓ è il limite di f in x0 , oppure che f tende verso
ℓ per x tendente verso x0 , e si scrive
lim f (x) = ℓ
x→x0
“il limite di f (x) per x tendente verso x0 è uguale a ℓ” se è verificata la
seguente condizione:
∀ I ∈ I(ℓ) ∃ J ∈ I(x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : f (x) ∈ I .
(6.1.1)
La lettera x che compare nella notazione del limite è “muta” nel senso
che essa può essere sostituita con una qualsiasi altra lettera che non sia già
stata utilizzata nello stesso contesto.
Capitolo 6: Limiti delle funzioni reali
128
Una funzione che ammette un limite ℓ ∈ R in un punto x0 ∈ R viene spesso denominata convergente in x0 ; se, invece, ammette come limite +∞ oppure −∞ viene denominata divergente (positivamente oppure negativamente)
in x0 .
Per poter considerare il limite di una funzione in un punto x0 è dunque
necessario che il punto x0 sia di accumulazione per l’insieme di definizione
della funzione. Tale ipotesi, infatti, assicura che l’intersezione X ∩ J r {x0 }
sia non vuota per ogni intorno J di x0 e quindi che gli elementi x ∈ X ∩
J r {x0 } verificanti la (6.1.1) esistano effettivamente.
Naturalmente, se x0 = +∞ oppure x0 = −∞, l’ipotesi che esso sia di
accumulazione per X, significa esattamente che X non è limitato superiormente oppure rispettivamente inferiormente.
Nel caso in cui x0 ∈ R, inoltre, conviene precisare subito che non ha
alcuna importanza, ai fini del limite, il fatto che la funzione sia definita o
meno nel punto x0 ; nel caso lo sia, poi, non vi è alcuna relazione tra il valore
f (x0 ) che f assume nel punto x0 ed il limite della funzione in tale punto
(in seguito, avranno un ruolo importante le funzioni f : X → R che in
punto x0 ∈ X hanno limite uguale proprio ad f (x0 ); tali funzioni verranno
denominate continue in x0 ).
La definizione generale di limite vale sia nel caso in cui x0 ed ℓ siano reali
o infiniti. Nelle applicazioni, tuttavia, in cui x0 ed ℓ sono noti, la Definizione
(6.1.1) può essere precisata meglio tenendo conto della definizione adottata
di intorno di un numero reale o degli elementi +∞ e −∞.
Nel caso in cui sia noto che ℓ ∈ R, gli intorni di ℓ possono essere considerati del tipo Iε (x0 ) (vedasi la (2.3.1) a pag. 42) al variare di ε > 0
(infatti, ogni Iε (x0 ) è un intorno di ℓ e viceversa ogni intorno di ℓ contiene
un intervallo Iε (x0 )); pertanto, la condizione (6.1.1) si può scrivere come
segue:
∀ ε > 0 ∃ J ∈ I(x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : ℓ − ε < f (x) < ℓ + ε .
Nei casi in cui ℓ = +∞ (rispettivamente, ℓ = −∞), ragionando come
sopra si possono considerare intorni di ℓ del tipo ]M, +∞[ (e rispettivamente
] − ∞, M [) e quindi la condizione (6.1.1) si può scrivere come segue:
∀ M ∈ R ∃ J ∈ I(x0 ) t.c.
(rispettivamente,
∀ x ∈ X ∩ J r {x0 } : M < f (x)
∀ x ∈ X ∩ J r {x0 } : f (x) < M ).
Le stesse osservazioni appena svolte per l’elemento ℓ valgono anche per
il punto di accumulazione x0 .
Ritornando al caso generale ℓ ∈ R, se x0 ∈ R, la condizione (6.1.1)
equivale alla seguente
∀ I ∈ I(ℓ) ∃ δ > 0 t.c. ∀ x ∈ X ∩ Iδ (x0 ) r {x0 } : f (x) ∈ I ,
6.2 Prime proprietà dei limiti
129
mentre, se x0 = +∞ (rispettivamente, x0 = −∞), diventa
∀ I ∈ I(ℓ) ∃ c ∈ R t.c.
(rispettivamente,
∀ x ∈ X∩]c, +∞[ : f (x) ∈ I ,
∀ x ∈ X∩] − ∞, c[ : f (x) ∈ I ).
Nei casi in cui siano noti sia ℓ che x0 si possono applicare entrambe
le considerazioni precedenti. Cosı̀, ad esempio, se ℓ ∈ R, x0 ∈ R, si ha
limx→x0 f (x) = ℓ se e solo se
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X ∩ Iδ (x0 ) r {x0 } : ℓ − ε < f (x) < ℓ + ε ,
mentre, si ha limx→−∞ f (x) = +∞ se e solo se
∀ M ∈ R ∃ c ∈ R t.c. ∀ x ∈ X : x < c ⇒ f (x) > M .
6.2
Prime proprietà dei limiti
La definizione di limite data nella sezione precedente è pienamente giustificata dal seguente teorema di unicità.
Teorema 6.2.1 (Teorema di unicità del limite)
Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione
per X ed f : X → R una funzione reale. Se ℓ1 ∈ R, ℓ2 ∈ R e
lim f (x) = ℓ1 ,
x→x0
lim f (x) = ℓ2 ,
x→x0
allora necessariamente ℓ1 = ℓ2 .
Dimostrazione. Si supponga, per assurdo, che ℓ1 ̸= ℓ2 . Allora si possono trovare un
intorno I1 ∈ I(ℓ1 ) ed un intorno I2 ∈ I(ℓ2 ) tali che I1 ∩ I2 = ∅.
Dalle ipotesi segue da un lato l’esistenza di un intorno J1 ∈ I(x0 ) tale che, per ogni
x ∈ X ∩ J1 r {x0 }, f (x) ∈ I1 , e dall’altro l’esistenza di un ulteriore intorno J2 ∈ I(x0 )
tale che, per ogni x ∈ X ∩ J2 r {x0 }, f (x) ∈ I2 . Si consideri ora J = J1 ∩ J2 ; tale
insieme è anch’esso un intorno di x0 e poiché x0 è un punto di accumulazione per X,
deve essere X ∩ J r {x0 } ̸= ∅. Si considera un qualsiasi elemento x ∈ X ∩ J r {x0 }, si ha
sia x ∈ X ∩ J1 r {x0 }, da cui f (x) ∈ I1 ed anche x ∈ X ∩ J2 r {x0 }, da cui f (x) ∈ I2 ;
dunque f (x) ∈ I1 ∩ I2 e ciò è escluso dal fatto che gli intorni I1 ed I2 sono disgiunti. Altre proprietà, di immediata verifica, sono elencate di seguito.
Proposizione 6.2.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un
punto di accumulazione per X, ℓ ∈ R ed f : X → R una funzione reale tale
che limx→x0 f (x) = ℓ.
Allora valgono le seguenti proprietà:
Capitolo 6: Limiti delle funzioni reali
130
1. (Limitatezza locale) Se ℓ ∈ R ∪ {+∞} (rispettivamente, ℓ ∈ R ∪
{−∞}), allora f è limitata inferiormente (rispettivamente, superiormente) in un intorno di x0 , cioè esistono M0 ∈ R ed un intorno J0
di x0 tali che, per ogni x ∈ X ∩ J0 , M0 ≤ f (x) (rispettivamente,
f (x) ≤ M0 ).
In particolare, se ℓ ∈ R allora f è limitata in un intorno di x0 , cioè
esistono m0 , M0 ∈ R ed un intorno J0 di x0 tali che, per ogni x ∈
X ∩ J0 , m0 ≤ f (x) ≤ M0 .
2. (Permanenza del segno)
i) Se ℓ ∈]0, +∞[∪{+∞} (rispettivamente, ℓ ∈] − ∞, 0[∪{−∞})
esistono un numero reale r > 0 ed un intorno J0 di x0 tali che, per
ogni x ∈ X ∩ J0 r {x0 }, f (x) ≥ r (rispettivamente, f (x) ≤ −r0 ).
ii) Viceversa, se esiste un intorno J0 di x0 tale che, per ogni
x ∈ X ∩ J0 r {x0 }, si ha f (x) ≥ 0 (rispettivamente, f (x) ≤ 0) allora
si ha anche ℓ ∈ [0, +∞[∪{+∞} (rispettivamente, ℓ ∈]−∞, 0]∪{−∞}).
iii) Se, per ogni intorno J di x0 , esistono x1 ∈ X ∩ J r {x0 } e
x2 ∈ X ∩ J r {x0 } tali che f (x1 ) ≥ 0, f (x2 ) ≤ 0, allora deve essere
necessariamente ℓ = 0.
iv) Se, per ogni intorno J di x0 , esiste x ∈ X ∩ J r {x0 } tale che
f (x) = 0, allora deve essere necessariamente ℓ = 0.
3. (Monotonia del limite)
Si supponga che g : X → R sia un’ulteriore funzione reale tale che
limx→x0 g(x) = ℓ′ con ℓ′ ∈ R.
Allora, se ℓ < ℓ′ , esiste un intorno J0 di x0 tale che, per ogni x ∈
X ∩ J0 r {x0 }, f (x) < g(x).
Viceversa, se esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩
J0 r {x0 }, f (x) ≤ g(x), deve essere necessariamente ℓ ≤ ℓ′ .
Dimostrazione. Si dimostra innanzitutto la proprietà 1. Si supponga ℓ ∈ R ∪ {+∞};
se ℓ ∈ R si pone I = [ℓ − 1, +∞[ mentre se ℓ = +∞ si pone I = [0, +∞[. Tenendo
presente che I è un intorno di ℓ, applicando la definizione di limite a tale intorno, si
ottiene un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, ℓ − 1 ≤ f (x) se ℓ ∈ R e
0 ≤ f (x) se ℓ = +∞. A questo punto se x0 ∈
/ X è sufficiente porre M0 = ℓ − 1 se ℓ ∈ R
e M0 = 0 se ℓ = +∞; se invece x0 ∈ X, si può porre M0 = min{ℓ − 1, f (x0 )} se ℓ ∈ R
e M0 = min{0, f (x0 )} se ℓ = +∞ e la tesi è verificata in ogni caso. Il caso rispettivo si
dimostra analogamente e infine se ℓ ∈ R basta applicare contemporaneamente sia il caso
dimostrato che quello rispettivo.
Si dimostra ora la 2. Si considera dapprima la proprietà i). Se ℓ ∈]0, +∞[ si pone
r = |ℓ|/2 mentre se ℓ = +∞ si pone r = 1; applicando la definizione di limite all’intorno
I := [r, +∞[ di ℓ si ottiene interamente la tesi. Il caso rispettivo è analogo.
6.2 Prime proprietà dei limiti
131
Per quanto riguarda la ii), si supponga che esista un intorno J0 di x0 tale che, per
ogni x ∈ X ∩ J0 r {x0 }, f (x) ≥ 0. Se fosse per assurdo ℓ < 0 oppure ℓ = −∞, dalla
proprietà i) esisterebbero r > 0 ed un intorno J1 di x0 tali che, per ogni x ∈ X ∩J1 r{x0 },
f (x) ≤ −r. Considerato x ∈ X ∩(J0 ∩J1 )r{x0 } si avrebbe contemporaneamente f (x) ≥ 0
e f (x) ≤ −r e ciò è assurdo. Quindi deve essere ℓ ≥ 0 oppure ℓ = +∞.
Infine, le proprietà iii) e iv) seguono anch’esse dalla i) procedendo per assurdo.
Per quanto riguarda la 3., si supponga dapprima ℓ < ℓ′ . Allora si possono considerare
due intervalli disgiunti I ∈ I(ℓ) e I ′ ∈ I(ℓ′ ); quindi, per ogni y ∈ I e per ogni y ′ ∈ I ′ , si
ha y < y ′ . Applicando la definizione di limite, si ottiene l’esistenza di un intorno Jdix0
tale che, per ogni x ∈ X ∩ J r {x0 }, f (x) ∈ I ed un intorno J ′ di x0 tale che, per ogni
x ∈ X ∩ J ′ r {x0 }, g(x) ∈ I ′ . Si consideri ora l’insieme J0 = J ∩ J ′ ; esso è un intorno di
x0 e, per ogni x ∈ X ∩ J0 r {x0 }, risulta f (x) < g(x) in quanto f (x) ∈ I e g(x) ∈ I ′ .
Viceversa, si supponga che esista un intorno J0 di x0 tale che, per ogni x ∈ X ∩
J0 r {x0 }, f (x) ≤ g(x). Se, per assurdo, fosse ℓ′ < ℓ, dalla prima parte dimostrata si
dedurrebbe l’esistenza di un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, si
abbia g(x) < f (x). Considerato x ∈ X ∩ (J0 ∩ J1 ) r {x0 } si avrebbe contemporaneamente
f (x) ≤ g(x) e f (x) > g(x) e ciò è assurdo. Quindi deve essere ℓ ≤ ℓ′ .
◃ Un’altra proprietà importante del limite di una funzione riguarda il suo
carattere locale.
Si considerino due funzioni reali f, g : X → R e sia x0 ∈ R un punto
di accumulazione per X. Se esiste un intorno J0 di x0 tale che, per ogni
x ∈ X ∩ J0 r {x0 }, si abbia f (x) = g(x) allora il limite di f in x0 esiste se
e solo se esiste il limite di g in x0 e in tal caso i due limiti coincidono (tale
proprietà si esprime semplicemente affermando che i limiti limx→x0 f (x) e
limx→x0 g(x) sono equivalenti).
Infatti si supponga che limx→x0 f (x) = ℓ con ℓ ∈ R. Se I ∈ I(ℓ), allora esiste un intorno
J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, risulti f (x) ∈ I. Posto J = J0 ∩ J1 si ha
che J è un intorno di x0 e, per ogni x ∈ X ∩ J1 r {x0 }, si ha g(x) = f (x) ∈ I. Quindi
si ha limx→x0 f (x) = ℓ. Analogamente si riconosce che se limx→x0 g(x) = ℓ allora anche
limx→x0 f (x) = ℓ e quindi la tesi è vera.
Dalla proprietà precedente segue che è equivalente considerare il limite
di una funzione f : X → R in un punto di accumulazione x0 ∈ R per X e
quello della sua restrizione f|X∩J0 ad un intorno J0 di x0 . Quindi i limiti
limx→x0 f (x) e limx→x0 f|X∩J0 (x) sono equivalenti nel senso che uno esiste
se e solo se esiste anche l’altro e in tal caso sono uguali.
Viceversa se A è un sottoinsieme di X tale che x0 sia ancora di accumulazione per A, non si può affermare in generale che se limx→x0 f|A (x) = ℓ
allora anche limx→x0 f (x) = ℓ. I due limiti limx→x0 f|A (x) e limx→x0 f (x)
sono equivalenti nel caso in cui A soddisfi la seguente condizione:
∃ J0 ∈ I(x0 ) t.c. X ∩ J0 r {x0 } = A ∩ J0 r {x0 }
(quindi A contiene tutti i punti appartenenti ad X in J0 r {x0 }).
Capitolo 6: Limiti delle funzioni reali
132
6.3
Limiti destri e sinistri
Il calcolo del limite di una funzione in un punto si rivelerà uno strumento essenziale per lo studio delle funzioni condotto a partire dal presente capitolo.
In alcuni casi, tuttavia, tale limite non esiste e quindi ha senso investigare
se sono verificate almeno proprietà più deboli. In questo ambito si inserisce
la ricerca dei limiti da destra e da sinistra, come precisato dalla seguente
definizione.
Definizione 6.3.1 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un
punto di accumulazione a destra (rispettivamente, a sinistra) per X, ℓ ∈ R
ed f : X → R una funzione reale.
Si dice che ℓ è il limite destro (rispettivamente, sinistro) di f in x0 , oppure che f tende verso ℓ per x tendente verso x0 da destra (rispettivamente,
da sinistra), e si scrive
lim f (x) = ℓ ,
x→x+
0
(rispettivamente, lim− f (x) = ℓ )
x→x0
(si legge “il limite di f (x) per x tendente verso x0 da destra è uguale ad
ℓ” (rispettivamente, il limite di f (x) per x tendente verso x0 da sinistra è
uguale ad ℓ”)) se è verificata la seguente condizione
∀ I ∈ I(ℓ) ∃ J ∈ I + (x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : f (x) ∈ I (6.3.1)
(rispettivamente,∃ J ∈ I − (x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : f (x) ∈ I ).
Tenendo presente che x0 ∈ R e che ogni intorno destro (rispettivamente,
sinistro) di x0 contiene un intervallo [x0 , x0 +δ[ (rispettivamente, ]x0 −δ, x0 ]),
la condizione (6.3.1) è equivalente alla seguente:
∀ I ∈ I(ℓ) ∃ δ > 0 t.c. ∀ x ∈ X∩]x0 , x0 + δ[: f (x) ∈ I
(6.3.2)
(rispettivamente,∀ x ∈ X∩]x0 − δ, x0 [: f (x) ∈ I ).
Ovviamente, nei casi in cui è possibile precisare se ℓ ∈ R oppure ℓ = ±∞,
valgono le stesse considerazioni relative alla definizione generale di limite
(6.1.1).
Sostanzialmente, calcolare il limite destro (rispettivamente, sinistro) in
un punto x0 significa considerare solamente i valori della funzione a destra (rispettivamente, a sinistra) di x0 ; precisamente, nelle ipotesi della
Definizione 6.3.1, i seguenti limiti
lim f (x) ,
x→x+
0
(rispettivamente, lim f (x) ,
x→x−
0
lim f|X∩]x0 ,+∞[ (x) ,
x→x0
lim f|X∩]−∞,x0 [ (x) )
x→x0
(6.3.3)
6.3 Limiti destri e sinistri
133
sono equivalenti (cioè uno dei due limiti esiste se e solo se esiste anche l’altro
e in tal caso sono uguali).
Trattandosi di un particolare limite, quindi, valgono tutte le proprietà
esposte nella sezione precedente; in particolare, anche il limite destro e quello
sinistro, quando esistono, sono unici.
Inoltre, sempre dalle uguaglianze precedenti, segue che il punto x0 è di
accumulazione solo a destra (rispettivamente, solo a sinistra) l’esistenza del
limite della funzione in x0 equivale a quella del limite destro (rispettivamente, sinistro) in x0 . In questo caso, quindi, il limite destro o sinistro non
aggiunge nulla di nuovo rispetto al limite.
Nel caso, invece, in cui il punto x0 sia di accumulazione sia a sinistra
che a destra per X, si ha la seguente caratterizzazione.
Proposizione 6.3.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un
punto di accumulazione sia a sinistra che a destra per X ed f : X → R una
funzione reale.
Allora, le seguenti proposizioni sono equivalenti:
a) Esiste il limite di f in x0 .
b) Esistono entrambi i limiti sinistro e destro di f in x0 e sono uguali.
Inoltre, vera l’una e quindi l’altra delle proposizioni equivalenti precedenti,
si ha:
lim f (x) = lim+ f (x) = lim− f (x) .
x→x0
x→x0
x→x0
Dimostrazione. a) ⇒ b) Ovvia in quanto ogni intorno di x0 è un intorno sia destro che
sinistro di x0 .
b) ⇒ a) Si denoti con ℓ il valore comune dei due limiti sinistro e destro di f in x0 e sia
I ∈ I(ℓ); dalla (6.3.2), considerando ℓ come limite destro, esiste δ1 > 0 tale che, per ogni
x ∈ X∩]x0 , x0 +δ1 [, si abbia f (x) ∈ I; inoltre, considerando ℓ come limite sinistro, sempre
dalla (6.3.2), esiste δ2 > 0 tale che, per ogni x ∈ X∩]x0 − δ2 , x0 [, si abbia f (x) ∈ I.
Si è cosı̀ trovato l’intorno J =]x0 −δ2 , x0 +δ1 [ di x0 tale che, per ogni x ∈ X ∩J r{x0 },
risulta f (x) ∈ I. Poiché l’intorno I di ℓ, si deduce che è vera la a).
La proposizione precedente può essere utilizzata, in qualche caso, anche
per dimostrare che un limite assegnato non esiste (facendo cioè vedere o che
non esiste uno dei limiti sinistro o destro, oppure che esistono entrambi ma
sono diversi tra loro).
Nelle sezioni successive verranno esposti molti risultati limitandosi al
caso dei limiti; con opportune semplici modifiche, se necessarie, tali risultati
si possono adattare anche ai limiti sinistri e destri.
Capitolo 6: Limiti delle funzioni reali
134
6.4
Teoremi di confronto
I teoremi esposti nella presente sezione sono largamente utilizzati nel calcolo dei limiti soprattutto per ricondurre quelli che coinvolgono funzioni
abbastanza complesse a funzioni più semplici.
Si considerano distintamente il caso di limiti reali e di limiti infiniti.
Si intendono fissati in tutto il seguito un sottoinsieme non vuoto X di
R, un punto di accumulazione x0 ∈ R per X ed ℓ ∈ R.
Teorema 6.4.1 (Primo teorema di confronto)
Se ℓ ∈ R e se f : X → R, g : X → R ed h : X → R sono funzioni reali
verificanti le seguenti condizioni:
1. Esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 },
g(x) ≤ f (x) ≤ h(x) ;
2. Esistono i limiti di g ed h in x0 e si ha
lim g(x) = ℓ ,
x→x0
lim h(x) = ℓ .
x→x0
Allora, esiste anche il limite di f in x0 e si ha
lim f (x) = ℓ .
x→x0
Dimostrazione. Sia ε > 0; poiché limx→x0 g(x) = ℓ, esiste un intorno J1 di x0 tale che,
per ogni x ∈ X ∩ J1 r {x0 },
ℓ − ε < g(x) < ℓ + ε ,
e analogamente, poiché limx→x0 h(x) = ℓ, esiste un intorno J2 di x0 tale che, per ogni
x ∈ X ∩ J2 r {x0 }
ℓ − ε < h(x) < ℓ + ε .
Allora, l’insieme J = J0 ∩ J1 ∩ J2 risulta un intorno di x0 e per ogni x ∈ X ∩ J r {x0 },
si ha
g(x) ≤ f (x) ≤ h(x) , ℓ − ε < g(x) < ℓ + ε , ℓ − ε < h(x) < ℓ + ε .
Da ciò segue
ℓ − ε < g(x) ≤ f (x) ≤ h(x) < ℓ + ε ,
e quindi, dall’arbitrarietà di ε > 0, è verificata la definizione di limite.
Teorema 6.4.2 (Secondo teorema di confronto per i limiti)
Se f : X → R e g : X → R sono funzioni reali verificanti le seguenti
condizioni:
1. Esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 },
g(x) ≤ f (x)
(rispettivamente, f (x) ≤ g(x) );
6.5 Operazioni sui limiti
135
2. Esiste il limite di g in x0 e si ha limx→x0 g(x) = +∞ (rispettivamente,
limx→x0 g(x) = −∞).
Allora, esiste anche il limite di f in x0 e si ha limx→x0 f (x) = +∞
(rispettivamente, limx→x0 f (x) = −∞).
Dimostrazione. Sia M ∈ R; poiché limx→x0 g(x) = +∞, esiste un intorno J1 di x0 tale
che, per ogni x ∈ X ∩ J1 r {x0 }, M < g(x). Allora, considerato l’intorno J = J0 ∩ J1
di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha g(x) ≤ f (x) e M < g(x), da cui M < f (x).
Dall’arbitrarietà di M ∈ R segue la tesi. Il caso rispettivo si dimostra in maniera analoga.
6.5
Operazioni sui limiti
Si studia ora il comportamento del limite rispetto alle operazioni algebriche
tra funzioni.
Si intendono fissati un sottoinsieme X non vuoto di R, un punto di
accumulazione x0 ∈ R per X, ℓ1 ∈ R, ℓ2 ∈ R e due funzioni reali f : X → R
e g : X → R.
Teorema 6.5.1 (Primo teorema sul limite della somma)
Se ℓ1 , ℓ2 ∈ R e
lim f (x) = ℓ1 ,
x→x0
lim g(x) = ℓ2 ,
x→x0
allora, esiste anche il limite di f + g in x0 e si ha
lim (f (x) + g(x)) = ℓ1 + ℓ2 .
x→x0
Dimostrazione. Sia ε > 0; dalle ipotesi, segue l’esistenza di un intorno J1 di x0 tale
che, per ogni x ∈ X ∩ J1 r {x0 }, ℓ1 − ε/2 < f (x) < ℓ1 + ε/2 e analogamente esiste
un intorno J2 di x0 tale che, per ogni x ∈ X ∩ J2 r {x0 }, ℓ2 − ε/2 < g(x) < ℓ2 + ε/2.
Allora, considerato l’intorno J = J1 ∩ J2 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha
contemporaneamente ℓ1 − ε/2 < f (x) < ℓ1 + ε/2 e ℓ2 − ε/2 < g(x) < ℓ2 + ε/2 e quindi
ℓ1 + ℓ2 − ε < f (x) + g(x) < ℓ1 + ℓ2 + ε
. Da ciò, essendo ε > 0 arbitrario, segue la tesi.
Il teorema precedente riguarda il caso in cui esistono entrambi i limiti
delle funzioni f e g e sono numeri reali; esso si può enunciare dicendo che
in questo caso il limite della somma di due funzioni è uguale alla somma
dei loro limiti. Bisogna tener presente, tuttavia, che tale regola non vale in
generale. Nel caso in cui uno solo dei due limiti sia infinito, si ha quanto
segue.
Capitolo 6: Limiti delle funzioni reali
136
Teorema 6.5.2 (Secondo teorema sul limite della somma)
Sono verificate le seguenti condizioni:
1. limx→x0 f (x) = +∞ (rispettivamente, limx→x0 f (x) = −∞);
2. g è limitata inferiormente (rispettivamente, superiormente) in un intorno di x0 , cioè esistono M0 ∈ R ed un intorno J0 di x0 tali che, per
ogni x ∈ X ∩ J0 , M0 ≤ g(x) (rispettivamente, g(x) ≤ M0 ).
Allora, esiste anche il limite di f + g in x0 e si ha
lim (f (x) + g(x)) = +∞
x→x0
(rispettivamente, lim (f (x) + g(x)) = −∞) .
x→x0
Dimostrazione. Sia M ∈ R; dall’ipotesi 1. si ottiene l’esistenza di un intorno J1 di x0
tale che, per ogni x ∈ X ∩ J1 r {x0 }, M − M0 < f (x). Alora, considerato l’intorno
= J0 ∩ J1 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha sia M0 ≤ g(x) che M − M0 < f (x) e
pertanto M = M − M0 + M0 < f (x) + g(x). Dall’arbitrarietà di M ∈ R segue la tesi. La
dimostrazione del caso rispettivo è analoga.
Conviene osservare che l’ipotesi 2. del Teorema 6.5.2 non prevede l’esistenza del limite di g in x0 . Ovviamente, se esiste il limite di g in x0 ed
è un numero reale oppure +∞ (rispettivamente, è un numero reale oppure
−∞), dalla Proposizione 6.2.2, 1. segue che la funzione g è limitata inferiormente (rispettivamente, superiormente) in un intorno di x0 . Quindi, in
questo caso, si ha ancora
lim (f (x) + g(x)) = +∞
x→x0
(rispettivamente, lim (f (x) + g(x)) = +∞ ).
x→x0
Nel caso in cui si abbia
lim f (x) = +∞ ,
x→x0
lim g(x) = −∞ ,
x→x0
(o viceversa), non si può concludere nulla sul limite della somma. In tale
circostanza, si dice che il limite limx→x0 (f (x)+g(x)) si presenta nella forma
indeterminata +∞ − ∞ (oppure −∞ + ∞).
Nel seguito si introdurranno gli strumenti opportuni che consentiranno
di studiare anche tali tipi di limiti.
Si considera ora il caso del limite del prodotto di due funzioni. Anche
ora conviene distinguere il caso in cui le due funzioni siano dotate di limiti
reali da quello in cui una delle due ammetta un limite infinito.
Teorema 6.5.3 (Primo teorema sul limite del prodotto)
Se ℓ1 , ℓ2 ∈ R e
lim f (x) = ℓ1 ,
x→x0
lim g(x) = ℓ2 ,
x→x0
6.5 Operazioni sui limiti
137
allora, esiste anche il limite di f · g in x0 e si ha
lim (f (x) · g(x)) = ℓ1 · ℓ2 .
x→x0
Dimostrazione. Preliminarmente, si osserva che la funzione g, essendo dotata di limite
reale, dalla Proposizione 6.2.2, 1., risulta limitata in un intorno di x0 , e quindi esistono
M0 ∈ R ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 , |g(x)| ≤ M0 . Sia ora ε > 0;
poiché limx→x0 f (x) = ℓ1 , esiste un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 },
|f (x) − ℓ1 | < ε/(2(M + 1)), e analogamente, poiché limx→x0 g(x) = ℓ2 , esiste un intorno
J2 di x0 tale che, per ogni x ∈ X ∩ J2 r {x0 }, |g(x) − ℓ2 | < ε/(2(|ℓ1 | + 1)).
Allora, considerato l’intorno J = J0 ∩ J1 ∩ J2 di x0 , per ogni x ∈ X ∩ J r {x0 },
|f (x) · g(x) − ℓ1 · ℓ2 |
=
|f (x) · g(x) − ℓ1 · g(x) + ℓ1 · g(x) − ℓ1 · ℓ2 |
=
|(f (x) − ℓ1 ) · g(x) + ℓ1 · (g(x) − ℓ2 )|
≤
|(f (x) − ℓ1 ) · g(x)| + |ℓ1 · (g(x) − ℓ2 )|
|f (x) − ℓ1 | · |g(x)| + |ℓ1 | · |g(x) − ℓ2 |
ε
ε
<
· M + |ℓ1 | ·
2(M + 1)
2(|ℓ1 | + 1)
ε
ε
<
+ =ε,
2
2
e da ciò, essendo ε > 0 arbitrario, segue la tesi.
=
Quindi, anche nel caso del limite del prodotto di due funzioni, si può
dire che esistono entrambi i limiti delle funzioni f e g e sono numeri reali,
il limite del prodotto di due funzioni è uguale al prodotto dei loro limiti.
Tale regola non si può estendere in generale al caso in cui i limiti delle due
funzioni non siano entrambi reali.
Si ha tuttavia il seguente risultato.
Teorema 6.5.4 (Secondo teorema sul limite del prodotto)
Se limx→x0 f (x) = +∞ e g è strettamente maggiore di un numero positivo
(rispettivamente, strettamente minore di un numero negativo) in un intorno
di x0 eccetto al più il punto x0 (cioè, esistono r > 0 ed un intorno J0 di x0
tali che, per ogni x ∈ X ∩J0 r{x0 }, g(x) ≥ r (rispettivamente, g(x) ≤ −r)),
allora esiste anche il limite di f · g in x0 e si ha
lim f (x) · g(x) = +∞
x→x0
(rispettivamente, lim f (x) · g(x) = −∞) ).
x→x0
Dimostrazione. Sia M ∈ R e si supponga, come è lecito, M > 0 (rispettivamente,
M < 0). Poiché limx→x0 f (x) = +∞, esiste un intorno J1 di x0 tale che, per ogni
x ∈ X ∩ J1 r {x0 }, f (x) > M/r (rispettivamente, f (x) < −M/r). Allora, considerato
l’intorno J = J0 ∩ J1 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha
M
m
r (rispettivamente, f (x) · g(x) < −
(−r) = M ).
r
r
Dall’arbitrarietà di M ∈ R segue la tesi.
f (x) · g(x) >
Si osservi che se limx→x0 f (x) = −∞ e g è strettamente maggiore di
un numero positivo (rispettivamente, strettamente minore di un numero
Capitolo 6: Limiti delle funzioni reali
138
negativo) in un intorno di x0 eccetto al più il punto x0 , allora si può applicare il teorema precedente alle funzioni −f e −g, tenendo presente che
f · g = (−f ) · (−g). Conseguentemente si ha limx→x0 f (x) · g(x) = −∞
(rispettivamente, limx→x0 f (x) · g(x) = +∞).
Nel caso in cui esista anche il limite della funzione g e sia uguale ad ℓ2 ̸=
0, essa verifica le ipotesi del teorema precedente a causa della Proposizione
6.2.2, 2., e quindi
• Se ℓ1 = +∞ ed ℓ2 ∈]0, +∞[∪{+∞} (rispettivamente, ℓ2 ∈]−∞, 0[∪{−∞}),
esiste il limite di f · g in x0 ed è uguale a +∞ (rispettivamente, −∞).
• Se ℓ1 = −∞ ed ℓ2 ∈]0, +∞[∪{+∞} (rispettivamente, ℓ2 ∈]−∞, 0[∪{−∞}),
esiste il limite di f · g in x0 ed è uguale a −∞ (rispettivamente, +∞).
Se invece accade che uno dei limiti sia infinito e l’altro sia 0, i teoremi
sul prodotto non consentono di concludere nulla. In questo caso, si dice che
il limite si presenta nella forma indeterminata 0 · (+∞) oppure 0 · (−∞).
Si studia a questo punto il comportamento del limite della funzione
reciproca.
Teorema 6.5.5 (Teorema sul limite della funzione reciproca)
Sia ℓ ∈ R e si supponga che f : X → R sia una funzione reale tale che
limx→x0 f (x) = ℓ. Si supponga, inoltre, che per ogni x ∈ X, f (x) ̸= 0 e si
1
1
1
consideri la funzione reciproca : X → R (per ogni x ∈ X, (x) =
).
f
f
f (x)
Allora:
1
1
1. Se ℓ ∈ R r {0}, si ha lim
= .
x→x0 f (x)
ℓ
2. Se ℓ = +∞ oppure ℓ = −∞, si ha lim
x→x0
1
= 0.
f (x)
1
= +∞ e inoltre
f (x)
i) Se f è positiva in un intorno di x0 eccetto al più il punto x0
(cioè, esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 },
1
f (x) > 0), allora lim
= +∞.
x→x0 f (x)
ii) Se f è negativa in un intorno di x0 eccetto al più il punto x0
(cioè, esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 },
1
f (x) < 0), allora lim
= −∞.
x→x0 f (x)
iii) Se f non verifica le condizioni i) e ii) precedenti (cioè, in ogni
intorno J di x0 esistono due punti x1 , x2 ∈ X ∩ J r {x0 } tali che
3. Se ℓ = 0, si ha lim
x→x0
6.5 Operazioni sui limiti
139
f (x1 ) < 0 < f (x2 )), allora il limite della funzione reciproca in x0 non
esiste.
Dimostrazione. 1. Essendo ℓ ̸= 0, dalla Proposizione 6.2.2, 2., esistono un numero reale
r > 0 ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 r {x0 }, |f (x)| > r. Sia ora ε > 0
e si consideri un intorno J1 di x0 tale che, per ogni x ∈ X ∩J1 r{x0 }, |f (x)−ℓ| < r ·|ℓ|·ε.
Allora, considerato l’intorno J = J0 ∩ J1 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha
1
|f (x) − ℓ|
|f (x) − ℓ|
r · |ℓ| · ε
1
−
=
≤
≤
=ε
f (x)
ℓ
|f (x)| · |ℓ|
r · |ℓ|
r · |ℓ|
e ciò, essendo ε > 0 arbitrario, completa la dimostrazione del primo caso.
2. Sia ε > 0. Sia nel caso ℓ = +∞ oppure ℓ = −∞, si ha comunque limx→x0 |f (x)| = +∞
e pertanto, posto M = 1/ε, esiste un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 },
|f (x)| > M . Osservato che M > 0, si ha, per ogni x ∈ X ∩ J r {x0 },
1
1
≤
=ε
f (x)
M
e da ciò, essendo ε > 0 arbitrario, segue il caso 2.
3. Si dimostra innanzitutto che limx→x0 |1/f (x)| = +∞. Infatti, sia M > 0 e si ponga
ε = 1/M ; poichè limx→x0 f (x) = 0, esiste un intorno J di x0 tale che, per ogni x ∈
X ∩ J r {x0 }, |f (x)| ≤ ε, da cui |1/f (x)| ≥ 1/ε = M . Dall’arbitrarietà di M > 0, segue
la prima parte della tesi.
noindent i) Si supponga ora che esista un intorno J0 di x0 tale che, per ogni x ∈
X ∩ J0 r {x0 }, f (x) > 0. Allora, poichè f e |f | coincidono in X ∩ J0 r {x0 }, da quanto
dimostrato preliminarmente e dal carattere locale del limite segue limx→x0 1/f (x) =
limx→x0 |1/f (x)| = +∞.
ii) Si dimostra in maniera analoga al caso precedente (tenendo presente che in questo
caso f = −|f | in X ∩ J0 r {x0 }.
iii) Si supponga, per assurdo, che il limite della funzione reciproca esista e sia uguale ad
un numero ℓ1 ∈ R. Dalla Proposizione 6.2.2, 2., se fosse ℓ1 ∈]0, +∞[∪+∞, la funzione
f verificherebbe l’ipotesi i), mentre se fosse ℓ1 ∈] − ∞, 0[∪−∞, la funzione f verificherebbe l’ipotesi ii). Quindi dovrà essere necessariamente ℓ1 = 0. Da quanto dimostrato
preliminarmente, segue
lim |f (x)| = lim
x→x0
x→x0
1
= +∞
|1/f (x)|
e ciò contraddice il fatto che limx→x0 f (x) = 0.
Quando il limite della funzione è 0 e si vuole calcolare il limite della
funzione reciproca, è dunque necessario studiare il segno della funzione f (o
equivalentemente della reciproca di f ) in un intorno del punto x0 per poter
decidere in quale sottocaso ci si trova.
Il Teorema 6.5.5 consente di concludere in ogni caso come si comporta
il limite della funzione reciproca; non vi sono quindi forme indeterminate a
tale proposito.
Si esamina ora il caso del quoziente di due funzioni.
In questo caso, essendo f /g = f · (1/g), dallo studio del limite della
funzione reciproca e da quello del limite del prodotto di due funzioni, si
deduce direttamente il comportamento del limite della funzione quoziente.
Capitolo 6: Limiti delle funzioni reali
140
Tuttavia, tali teoremi non consentono di determinare il comportamento
della funzione quoziente in tutti i possibili casi; infatti, se le funzioni f e g
tendono entrambe a 0 oppure entrambe a ±∞, non si può prevedere nulla.
In tali casi si dice che il limite del quoziente si presenta in una delle seguenti
forme indeterminate
0
,
0
+∞
,
+∞
+∞
,
−∞
−∞
,
+∞
−∞
,.
−∞
Tutti i risultati esposti valgono anche per i limiti sinistri (rispettivamente, destri) nel caso in cui x0 sia un punto di accumulazione a sinistra
(rispettivamente, a destra), purché si sostituiscano gli intorni di x0 con
intorni sinistri (rispettivamente, destri) tanto negli enunciati quanto nelle
dimostrazioni.
Si considera infine il caso delle funzioni composte.
Teorema 6.5.6 (Limite delle funzioni composte)
Siano X e Y sottoinsiemi non vuoti di R ed f : X → R e g : Y → R
funzioni reali tali che f (X) ⊂ Y . Sia x0 un punto di accumulazione per X
e si supponga che:
1. limx→x0 f (x) = y0 , con y0 ∈ R punto di accumulazione per Y .
2. Esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 },
f (x) ̸= y0 .
3. limy→y0 g(y) = ℓ, con ℓ ∈ R.
Allora, la funzione composta g ◦ f : X → R è dotata di limite in x0 e si
ha
lim (g ◦ f )(x) = ℓ .
x→x0
Dimostrazione. Sia I un intorno di ℓ. Dall’ipotesi 3. segue l’esistenza di un intorno I ′ di
y0 tale che, per ogni y ∈ Y ∩I ′ r{y0 }, g(y) ∈ I. Poiché I ′ ∈ I(y0 ), dall’ipotesi 1. esiste un
intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, f (x) ∈ I ′ . Si consideri ora l’intorno
J = J0 ∩ J1 di x0 , dove J0 è l’intorno previsto nell’ipotesi 2. Per ogni x ∈ X ∩ J r {x0 },
si ha f (x) ∈ Y (in quanto f (X) ⊂ Y ), f (x) ∈ I ′ (in quanto x ∈ X ∩ J1 r {x0 }) e,
infine, f (x) ̸= y0 (in quanto x ∈ X ∩ J0 r {x0 }). Quindi, risulta f (x) ∈ Y ∩ I ′ r {y0 } e
conseguentemente (g ◦ f )(x) = g(f (x)) ∈ I. Dall’arbitrarietà dell’intorno I di ℓ, segue la
tesi.
L’ipotesi 2. è automaticamente soddisfatta se y0 = ±∞, e non è necessaria nel caso in cui y0 ∈ Y e limy→y0 g(y) = g(y0 ) (cioè, come si vedrà in
seguito, g è continua in y0 ).
6.6 Limiti delle funzioni monotone
141
Formalmente, applicare il teorema precedente significa effettuare la sostituzione y = f (x) e tener conto del fatto che y → y0 quando x → x0 . Tale
modo di esprimersi è molto frequente nelle applicazioni; tuttavia, bisogna
sempre verificare la condizione f (x) = y ̸= y0 per x ̸= x0 in un opportuno
intorno di x0 .
6.6
Limiti delle funzioni monotone
Le funzioni monotone hanno proprietà molto interessanti riguardo l’esistenza dei limiti sinistri e destri, evidenziate dal risultato seguente.
Teorema 6.6.1 (Teorema sul limite delle funzioni monotone)
Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione
a sinistra (rispettivamente, a destra) per X ed f : X → R una funzione reale
monotona. Allora, esiste il limite sinistro (rispettivamente, destro) di f in
x0 si ha:1
1. Se f è crescente:
lim f (x) =
x→x−
0
sup
( lim+ f (x) =
f (x) ,
x→x0
x∈X, x<x0
inf
f (x) );
sup
f (x) ).
x∈X, x>x0
2. Se f è decrescente:
lim f (x) =
x→x−
0
inf
x∈X, x<x0
( lim+ f (x) =
f (x) ,
x→x0
x∈X, x>x0
Dimostrazione. Si considera per brevità solamente il caso 1. in cui f è crescente (il caso
2. può essere dedotto dal caso 1. applicato alla funzione −f ). Si ponga, per brevità,
ℓ = supx∈X, x<x0 f (x) (rispettivamente, ℓ = inf x∈X, x>x0 f (x). Si supponga dapprima
che ℓ = +∞ (rispettivamente, ℓ = −∞). Dunque, in questo caso la funzione non è
limitata superiormente in X∩] − ∞, x0 [. Per dimostrare che limx→x− f (x) = +∞, si fissi
0
M ∈ R; da quanto osservato, M non può essere un maggiorante di f (X∩] − ∞, x0 [) e
quindi deve esistere x1 ∈ X, x1 < x0 tale che M < f (x1 ). Per ogni x ∈ X∩]x1 , x0 [, dalla
crescenza di f , si ha M < f (x1 ) ≤ f (x). Ciò, per l’arbitrarietà di M ∈ R, dimostra che
limx→x− f (x) = +∞.
0
Nel caso rispettivo la funzione f non è limitata inferiormente a destra di x0 . Pertanto, fissato M ∈ R, esso non può essere un minorante di f (X∩]x0 , +∞[) e quindi deve
esistere x1 ∈ X, x0 < x1 tale che f (x1 ) < M . Allora, per ogni x ∈ X∩]x0 , x1 [, si
ha, dalla crescenza di f , f (x) ≤ f (x1 ) < M . Per l’arbitrarietà di M ∈ R, deve essere
limx→x+ f (x) = −∞.
0
1 Per
convenzione, se Y ⊂ X si scrive sup f (x) = +∞ per indicare che f|Y non è
x∈Y
limitata superiormente in Y e analogamente inf f (x) = −∞ per indicare che f|Y non
x∈Y
è limitata inferiormente in Y . Nel teorema in esame si considera Y = X∩] − ∞, x0 [
(rispettivamente, Y = X∩]x0 , +∞[).
Capitolo 6: Limiti delle funzioni reali
142
Si supponga ora ℓ ∈ R e si fissi ε > 0; dalla seconda proprietà dell’estremo superiore,
esiste x1 ∈ X, x1 < x0 tale che ℓ − ε < f (x1 ). Per ogni x ∈ X∩]x1 , x0 [, si ha da un
lato x1 < x per cui, dalla crescenza di f, ℓ − ε < f (x1 ) ≤ f (x) e dall’altro x < x0 per
cui, dalla prima proprietà dell’estremo superiore, f (x) ≤ ℓ < ℓ + ε. Quindi, per ogni
x ∈ X∩]x1 , x0 [, si ha ℓ − ε < f (x) < ℓ + ε e ciò, per l’arbitrarietà di ε > 0, comporta
limx→x− f (x) = ℓ.
0
Nel caso rispettivo si procede in modo analogo usando le proprietà dell’estremo
inferiore.
In ogni caso, il teorema precedente garantisce l’esistenza del limite sinistro e destro per una funzione monotona in tutti i punti reali di accumulazione a sinistra e a destra.
Se, invece, il punto x0 è di accumulazione sia a sinistra che a destra, si
ha il seguente risultato.
Corollario 6.6.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un
punto di accumulazione sia a sinistra che a destra per X ed f : X → R una
funzione reale monotona. Allora, esistono i limiti sinistro e destro di f in
x0 e si ha
(6.6.1)
lim+ f (x) ∈ R .
lim− f (x) ∈ R ,
x→x0
x→x0
Inoltre, se f è crescente (rispettivamente, decrescente) si ha:
lim f (x) ≤ lim+ f (x)
x→x−
0
x→x0
(rispettivamente, lim− f (x) ≥ lim+ f (x) ),
x→x0
x→x0
(6.6.2)
e in più, se x0 ∈ X, si ha anche
lim f (x) ≤ f (x0 )
x→x−
0
(rispettivamente, lim− f (x) ≥ f (x0 )
x→x0
≤ lim+ f (x)
(6.6.3)
x→x0
≥ lim+ f (x) ).
x→x0
Dimostrazione. . Si supponga f crescente. Per ogni x1 , x2 ∈ X tali che x1 < x0 < x2
(tali elementi esistono in quanto x0 è di accumulazione sia a sinistra che a destra), si ha
f (x1 ) ≤ f (x2 ); dall’arbitrarietà di x1 ∈ X, x1 < x0 , risulta anche supx∈X,
x<x0
f (x) ≤
f (x2 ) (conseguentemente tale estremo superiore è reale) e da quest’ultima, essendo x2 ∈
X, x0 < x2 arbitrario, segue supx∈X, x<x0 f (x) ≤ inf x∈X, x>x0 f (x). Dal Teorema 6.6.1
segue la (6.6.2). Infine, se x0 ∈ X, si può osservare che, per ogni x ∈ X, x < x0 , si ha
f (x) ≤ f (x0 ) da cui la prima delle (6.6.3) e inoltre, per ogni x ∈ X, x0 < x, si ha
f (x0 ) ≤ f (x) da cui la seconda delle (6.6.3).
Ovviamente, anche se è garantita sia l’esistenza del limite sinistro che
destro in un punto x0 di accumulazione sia a sinistra che a destra, non si
può dire nulla per quanto riguarda l’esistenza del limite in x0 ; il limite esiste
6.7 Limiti delle funzioni elementari
143
se e solo se i limiti da destra e da sinistra coincidono e, in tal caso, dalla
(6.6.3) segue anche
lim f (x) = f (x0 ) .
(6.6.4)
x→x0
Quindi una funzione monotona definita in un punto x0 di accumulazione
sia a sinistra che a destra, non può avere in x0 un limite diverso dal valore
f (x0 ). Se il punto x0 non è di accumulazione sia a sinistra che a destra,
questo non vale più; ad esempio, basta considerare la funzione crescente
{
x−1,
x ∈ [−1, 0[ ;
f (x) =
0,
x=0,
nel punto x0 = 0.
Nel caso in cui x0 = ±∞, si ha il seguente risultato analogo al Teorema
6.6.1; la dimostrazione è del tutto analoga a quella del Teorema 6.6.1 e viene
omessa per brevità.
Teorema 6.6.3 Siano X un sottoinsieme di R non limitato superiormente
(rispettivamente, inferiormente) ed f : X → R una funzione reale monotona. Allora esiste il limite di f in +∞ (rispettivamente, in −∞) e si
ha:
1. Se f è crescente:
lim f (x) = sup f (x)
x→+∞
(rispettivamente,
x∈X
lim f (x) = inf f (x) ).
x→−∞
x∈X
2. Se f è decrescente:
lim f (x) = inf f (x)
x→+∞
x∈X
(rispettivamente,
lim f (x) = sup f (x) ).
x→−∞
x∈X
In Figura 6.1 è rappresentata una funzione decrescente definita in tutto
R che ha limite +∞ in −∞ ed un limite reale ℓ in +∞.
6.7
Limiti delle funzioni elementari
Visto il carattere locale del limite, il Teorema 6.6.1 studiato nella sezione
precedente può essere applicato più in generale a funzioni monotone in un
intorno sinistro o destro del punto x0 nel caso in cui x0 sia reale oppure in
un intorno di +∞ o −∞ nel caso in cui x0 = +∞ o x0 = −∞.
In tal modo è possibile calcolare i limiti delle funzioni elementari nei punti di accumulazione per l’insieme di definizione. Si elencano ora brevemente
tali limiti.
Capitolo 6: Limiti delle funzioni reali
144
y
l
x
Figura 6.1: Limiti di una funzione monotona.
6.7.1
Funzioni potenza ad esponente intero positivo
Si consideri la funzione potenza fn : R → R. Allora
• Se x0 ∈ R, si ha lim xn = xn0 .
x→x0
• Se x0 = +∞, si ha lim xn = +∞.
x→+∞
• Se x0 = −∞, si ha lim = +∞ se n è pari e lim xn = −∞ se n è
x→−∞
x→−∞
dispari.
Basta infatti applicare quanto osservato preliminarmente osservando che
n è dispari la funzione potenza è strettamente crescente, mentre n è pari
è strettamente crescente in [0, +∞[ e strettamente decrescente in ] − ∞, 0].
In tutti i punti reali, si possono cosı̀ ricavare i limiti sinistri e destri; poiché
questi coincidono, si ottiene il limite della funzione.
Lo stesso tipo di ragionamento si applica anche nei casi che seguono.
6.7.2
Funzioni radice
Si consideri la funzione radice f1/n . Allora:
6.7 Limiti delle funzioni elementari
145
1/n
• Se x0 ∈ R+ , si ha lim x1/n = x0 .
x→x0
Se n è dispari, la stessa
uguaglianza vale per ogni x ∈ R.
• Se x0 = +∞, si ha
lim x1/n = +∞. Se n è dispari, si ha anche
x→+∞
lim x1/n = −∞.
x→−∞
6.7.3
Funzioni potenza ad esponente intero negativo
Si consideri la funzione potenza ad esponente intero negativo f−n : R r
{0} → R. Allora
• Se x0 ∈ R r {0}, si ha lim 1/xn = 1/xn0
x→x0
• Se x0 = 0 ed n è pari, si ha lim 1/xn = +∞. Se n è dispari, si ha
x→0
lim+ 1/xn = +∞ e lim 1/xn = −∞; conseguentemente, il limite
x→0
lim 1/xn non esiste
x→0−
x→0
• Se x0 = +∞ oppure x0 = −∞, si ha lim 1/xn = 0.
x→±∞
6.7.4
Funzioni potenza ad esponente reale
Si consideri la funzione potenza ad esponente reale fr :]0, +∞[→ R con
r ∈ R. Allora
• Se x0 > 0, si ha lim xr = xr0 .
x→x0
• Se x0 = 0 ed r > 0, si ha lim xr = 0 (= xr0 ). Se r < 0, si ha
x→0
lim xr = +∞.
x→0
• Se x0 = +∞ ed r > 0, si ha
lim xr = 0.
lim xr = +∞. Se r < 0, si ha invece
x→+∞
x→+∞
6.7.5
Funzioni esponenziali
Sia a > 0, a ̸= 1 e si consideri la funzione esponenziale expa : R → R. Allora
• Se x0 ∈ R, si ha lim ax = ax0 .
x→x0
• Se x0 = +∞ ed a > 1, si ha
invece lim ax = 0.
x→+∞
lim ax = +∞. Se 0 < a < 1, si ha
x→+∞
Capitolo 6: Limiti delle funzioni reali
146
• Se x0 = −∞ ed a > 1, si ha
lim ax = +∞.
lim ax = 0. Se 0 < a < 1, si ha
x→−∞
x→−∞
6.7.6
Funzioni logaritmo
Sia a > 0, a ̸= 1 e si consideri la funzione logaritmo loga :]0, +∞[→ R.
Allora
• Se x0 > 0, si ha lim loga x = loga x0 .
x→x0
• Se x0 = 0 ed a > 1, si ha lim loga x = −∞. Se 0 < a < 1, si ha invece
x→0
lim loga x = +∞.
x→0
• Se x0 = +∞ ed a > 1, si ha lim loga x = +∞. Se 0 < a < 1, si ha
lim loga x = −∞.
x→+∞
x→+∞
6.7.7
Funzioni trigonometriche
Per quanto riguarda le funzioni seno, coseno, tangente e cotangente, la proprietà di monotonia non è verificata in un intorno di alcuni punti ed il
corrispondente limite non esiste. Per il momento ci si limita a segnalare tale eventualità, in quanto la relativa dimostrazione sarà molto più semplice
come applicazione della caratterizzazione sequenziale del limite (Teorema
7.1.3).
• Se x0 ∈ R, si ha lim sin x = sin x0 . Se x0 = +∞ oppure x0 = −∞, il
x→x0
limite lim sin x non esiste.
x→±∞
• Se x0 ∈ R, si ha lim cos x = cos x0 . Se x0 = +∞ oppure x0 = −∞,
x→x0
il limite lim cos x non esiste.
x→±∞
• Se x0 ∈ R, x0 ̸= π/2 + kπ, k ∈ Z, si ha lim tan = tan x0 . Se x0 =
x→x0
π/2 + kπ con k ∈ Z, il limite non esiste e si ha
e
lim
x→π/2+kπ +
lim
x→π/2+kπ −
tan x = +∞
tan x = −∞. Infine, se x0 = +∞ oppure x0 = −∞, il
limite della tangente in x0 non esiste.
• Se x0 ∈ R, x0 ̸= kπ, k ∈ Z, si ha lim cot x = cot x0 . Se x0 = kπ con
k ∈ Z, il limite non esiste e si ha
x→x0
lim cot x = −∞ e
x→kπ −
lim cot x =
x→kπ +
+∞. Infine, se x0 = +∞ oppure x0 = −∞, il limite della cotangente
in x0 non esiste.
6.8 Limiti di polinomi e funzioni razionali
6.7.8
147
Funzioni trigonometriche inverse
Infine, si considerano le funzioni arcoseno, arcocoseno, arcotangente e arcocotangente. Allora
• Se x0 ∈ [−1, 1], si ha lim arcsin x = arcsin x0 .
x→x0
• Se x0 ∈ [−1, 1], si ha lim arccos x = arccos x0 .
x→x0
• Se x0 ∈ R, si ha lim arctan x = arctan x0 . Se x0 = +∞, allora
x→x0
lim arctan x = π/2 e infine, se x0 = −∞, si ha
x→+∞
−π/2.
lim arctan x =
x→−∞
• Se x0 ∈ R, si ha lim arccot x = arccot x0 . Se x0 = +∞, allora
x→x0
lim arccot x = 0 e infine, se x0 = −∞, si ha lim arccot x = π.
x→+∞
6.8
x→−∞
Limiti di polinomi e funzioni razionali
Le operazioni sui limiti applicate alle funzioni elementari consentono il calcolo dei limiti nella maggior parte dei casi in cui non si presentano forme
indeterminate.
Conoscendo i limiti delle funzioni potenza ad esponente intero positivo,
è immediato calcolare il limite di un polinomio. Tale limite ha senso per
ogni x0 ∈ R in quanto i polinomi sono definiti in tutto R.
Sia P (x) = a0 + · · · + an xn con a0 , . . . , an ∈ R, an ̸= 0, un polinomio di
grado n. Allora
1. Se x0 ∈ R, si ha lim P (x) = P (x0 ).
x→x0
2. Se x0 = ±∞, si ha
{
lim P (x) = lim an xn =
x→+∞
x→+∞
{
n
lim P (x) = lim an x =
x→−∞
x→−∞
+∞ ,
se an > 0 ;
−∞ ,
se an < 0 ;
+∞ ,
se (−1)n an > 0 ;
−∞ ,
se an < 0 ;
(si osservi che (−1)n an > 0 se n e pari e an > 0 oppure se n è
dispari e an < 0). L’ultima uguaglianza si ottiene facilmente mettendo
in evidenza il termine an xn (si ottiene il limite del prodotto di due
funzioni di cui una è un infinito e l’altra tende ad 1).
148
Capitolo 6: Limiti delle funzioni reali
Un altro caso abbastanza semplice e di notevole interesse è quello delle
funzioni razionali.
Siano P : R → R un polinomio di grado n e Q : R → R un polinomio di
grado m aventi la forma
P (x) = a0 + · · · + an xn ,
Q(x) = b0 + · · · + bm xm ,
con an ̸= 0 e bm ̸= 0.
Posto X = {x ∈ R | Q(x) ̸= 0}, si considera la funzione razionale
R : X → R definita ponendo, per ogni x ∈ X,
R(x) =
P (x)
Q(x)
Poiché X differisce da R al più per un numero finito di punti, tutti gli
elementi di R sono di accumulazione per X.
Ha senso quindi considerare il limite
lim
x→x0
P (x)
Q(x)
per ogni x0 ∈ R ed anche per x0 = ±∞.
Di seguito, si considerano i diversi casi che si possono presentare, che
si ottengono tutti applicando i teoremi sul limite della funzione reciproca
(Teorema 6.5.5) e sul prodotto (Teoremi 6.5.3–6.5.4) di due funzioni.
1. Caso x0 ∈ X. In questo caso si ha x0 ∈ R, Q(x0 ) ̸= 0 e conseguentemente
P (x)
P (x0 )
lim
=
.
x→x0 Q(x)
Q(x0 )
2. Caso x0 ∈ R, Q(x0 ) = 0. Si suppone, inoltre, che P (x0 ) ̸= 0 in quanto,
se fosse anche P (x0 ) = 0, il rapporto P (x)/Q(x) si potrebbe scrivere
nella forma
P (x)
(x − x0 ) · P1 (x)
P1 (x)
=
=
,
Q(x)
(x − x0 ) · Q1 (x)
Q1 (x)
con P1 e Q1 polinomi opportuni di grado n−1 e rispettivamente m−1
ed il limite si ricondurrebbe a quello del rapporto tra i polinomi P1 e
Q1 ; tale procedimento si potrebbe reiterare fino a trovare almeno uno
dei due polinomi diverso da 0 in x0 .
Premesso ciò, nel caso Q(x0 ) = 0 e P (x0 ) ̸= 0, la funzione reciproca
tende a 0 e quindi, per il Teorema 6.5.5, è necessario studiare il segno
del rapporto P (x)/Q(x) in un intorno del punto x0 . Poiché una funzione razionale cambia segno al più un numero finito di volte (in quanto
6.9 Limiti notevoli
149
cosı̀ si comportano i polinomi al numeratore ed al denominatore), si
hanno i seguenti casi possibili:
i) Se in un intorno del punto x0 , il rapporto P (x)/Q(x) è positivo,
si ha
P (x)
lim
= +∞ .
xt ox0 Q(x)
ii) Se in un intorno del punto x0 , il rapporto P (x)/Q(x) è negativo, si ha
P (x)
= −∞ .
lim
xt ox0 Q(x)
iii) Se il rapporto P (x)/Q(x) cambia segno nel punto x0 , il limite
P (x)
limxt ox0 Q(x)
non esiste.
In questo caso, tuttavia, il rapporto P (x)/Q(x) è necessariamente
positivo in un intorno sinistro di x0 e negativo in un intorno destro di
x0 oppure viceversa (in quanto una funzione razionale può cambiare
segno un numero finito di volte) e quindi si ha
lim−
P (x)
P (x)
= +∞ , lim+
= −∞
Q(x)
Q(x)
xt ox0
lim
P (x)
P (x)
= −∞ , lim
= +∞ .
+ Q(x)
Q(x)
xt ox0
xt ox0
oppure
xt ox−
0
3. Caso x0 = +∞ oppure x0 = −∞. Mettendo in evidenza al numeratore ed al denominatore del rapporto P (x)/Q(x) il termine di grado
massimo (an xn e bm xm , rispettivamente), si ottiene facilmente
P (x)
an xn
= lim
xt o±∞ Q(x)
xt o±∞ bm xm
lim
e da quest’ultima uguaglianza è immediato ottenere il risultato del
limite (si evita per brevità di scrivere tutti i possibili sottocasi).
6.9
Limiti notevoli
I teoremi sui limiti esaminati fino ad ora non sono applicabili nel caso
in cui si presenti una forma indeterminata; le forme indeterminate che si
presentano solitamente possono essere riassunte come segue:
• Forme indeterminate della somma di due funzioni: +∞−∞, −∞+∞;
Capitolo 6: Limiti delle funzioni reali
150
• Forme indeterminate del prodotto di due funzioni: 0 · (±∞), ±∞ · 0;
• Forme indeterminate del quoziente di due funzioni:
0 ±∞
,
;
0 ±∞
• Forme indeterminate delle potenze di due funzioni:
2
00 , +∞0 , 1±∞ .
I tentativi che si possono effettuare per risolvere un limite che si presenta
in una delle forme indeterminate elencate sopra sono di vario genere; tra i
metodi più semplici vi sono l’utilizzo dei limiti notevoli, oppure della teoria
degli infinitesimi e degli infiniti, della regola di L’Hôpital e della formula di
Taylor.
Nella presente sezione ci si occupa dei limiti notevoli, mentre nella
prossima della teoria degli infinitesimi e degli infiniti.
L’utilizzo della regola di l’Hôpital e della formula di Taylor richiede
invece la conoscenza del calcolo differenziale.
Si elencano ora i limiti notevoli più comunemente utilizzati.
1. lim
x→0
sin x
= 1.
x
Infatti, sia 0 < x < π/2. Da semplici considerazioni geometriche, si ha: sin x ≤
x ≤ tan x (infatti, il triangolo OAP di area sin x/2 è contenuto nel settore circolare
OAP di area πx/(2π) = x/2 il quale a sua volta è contenuto nel triangolo OAQ
di area tan x/2 e confrontare le rispettive aree; vedasi la Figura 6.2).
Considerando i reciproci delle diseguaglianze precedenti e moltiplicando tutti i
sin x
membri per sin x, si ha cos x ≤
≤ 1. Poichè le funzioni a primo, secondo e
x
terzo membro sono tutte pari, la stessa diseguaglianza vale se −π/2 < x < 0. Dal
primo teorema di confronto (Teorema 6.4.1), tenendo presente che limx→0 cos x =
1 (vedasi la Sezione 6.7.7, si deduce allora la tesi.
2. lim
x→0
tan x
= 1.
x
Infatti, tenendo presente il limite 1. precedente,
lim
x→0
tan x
sin x
1
= lim
·
=1
x→0 x
x
cos x
.
2 Tali forme indeterminate derivano dai limiti del tipo lim
g(x) (con f stretx→x0 f (x)
tamente positiva) che si possono scrivere al modo seguente: limx→x0 exp(g(x) log f (x)).
Pertanto, tali limiti vengono ricondotti al limite del prodotto limx→x0 g(x) log f (x) per
il quale si possono presentare le forme indeterminate del prodotto viste sopra; tenendo
presente che log f (x) tende a +∞ in +∞, a −∞ in 0 ed a 0 in 1, le forme indeterminate
del prodotto si presentano nei seguenti casi: 1) f tende a 0 e g tende a 0; 2) f tende a
+∞ e g tende a 0; 3) f tende a 1 e g tende a ±∞.
6.9 Limiti notevoli
151
6
.......................................
...................
...........
...........
.........
.
.
.
.
Q
.
.
.
........
........
.
......
.
.
.
.
.
.
.
.
.
.
.
....P
....
......
....
........
...
.
.
.......x
....
.......
.
..
...... tan x
...
..
.......
.
sin x
....
......
....
....... 1
O
..
B
-
A
Figura 6.2: Limite notevole sinx/x in 0.
3. lim
x→0
1 − cos x
1
= .
x2
2
Infatti, tenendo presente il limite 1. precedente,
lim
x→0
1 − cos x
x2
=
=
1
1 − cos2 x
(1 − cos x)(1 + cos x)
=
lim
2
x→0
x (1 + cos x)
2 x→0
x2
(
)2
sin x
1
1
lim
=
2 x→0
x
2
lim
.
4. lim
x→0
arcsin x
= 1.
x
Infatti, posto y = arcsin x (da cui x = sin y) e osservato che y → 0 per x → 0 e
inoltre che arcsin x ̸= 0 per ogni x ∈ [−1, 1] r {0}, si può applicare il teorema sul
arcsin x
limite delle funzioni composte (Teorema 6.5.6) dal quale si ricava lim
=
x→0
x
y
= 1.
lim
y→0 sin y
5. lim
x→0
arctan x
= 1.
x
Si procede come nel caso precedente ponendo y = arctan x;dal teorema sul limite
y
arctan x
= lim
= 1.
y→0 tan y
x→0
x
delle funzioni composte (Teorema 6.5.6) si ottiene lim
Come si può facilmente constatare, i limiti notevoli 2.–5. si ottengono
tutti dal limite notevole 1. applicando i teoremi sulle varie operazioni sui limiti. Si studia ora un altro limite notevole dal quale sarà possibile derivarne
diversi altri.
Capitolo 6: Limiti delle funzioni reali
152
Innanzitutto, è necessaria una breve premessa riguardante i limiti di
successioni che saranno approfonditi nel capitolo seguente.
Sia (an )n∈N una successione di numeri reali. Essa può essere riguardata
come una funzione reale definita in N; poiché non vi sono punti di accumulazione reali per N ed N non è limitato superiormente, l’unico punto in cui
ha senso considerare il limite di una successione è +∞. In conformità con
le notazioni assunte per le successioni, tale limite, se esiste, viene denotato
con il simbolo
lim an .
n→+∞
Ovviamente, tutti i teoremi visti sui limiti di funzioni valgono anche per i
limiti di successioni. In particolare, dal teorema sul limite delle funzioni monotone, si ottiene che ogni successione (an )n∈N crescente (rispettivamente,
decrescente) è dotata di limite e si ha
lim an = sup an
n→+∞
n∈N
(rispettivamente,
lim an = inf an ).
n→+∞
n∈N
In particolare, si è visto che la successione ((1 + 1/n)n )n≥1 , utilizzata per
definire il numero di Nepero, è strettamente crescente (Proposizione 4.5.2)
e pertanto, da quanto osservato, si ottiene il seguente limite notevole.
(
)n
1
6. lim
1+
=e.
n→+∞
n
Come per il limite notevole 1., anche ora se ne possono ottenere altri
derivati.
(
)x
1
7. lim
1+
=e.
x→+∞
x
La differenza rispetto al limite precedente consiste nel fatto che ora la funzione di
cui si considera il limite x 7→ (x + 1/x)x è definita in ] − ∞, −1[∪]0, +∞[ e non
solo sui numeri naturali.
Per ogni x ≥ 1, tenendo presente che [x] ≤ x < [x] + 1 ([x] denota la parte intera
di x), si ha
)[x] (
)
(
)
(
1 x
1 [x]+1
1
≤ 1+
≤ 1+
1+
[x] + 1
x
[x]
e inoltre, dal limite precedente,
(
)[x]
(
)n
1
1
1+
lim
1+
=
lim
x→+∞
n→+∞
[x] + 1
n+1
(
)n+1
1
1
=
lim
1+
·
=e,
1
n→+∞
n+1
1+
n+1
(
)
(
)
(
) (
)
1 [x]+1
1 n+1
1 n
1
lim
1+
= lim
1+
= lim
1+
1+
=e.
x→+∞
n→+∞
n→+∞
[x]
n
n
n
Allora, dal primo teorema di confronto per i limiti (Teorema 6.4.1 si ottiene la
tesi.
6.9 Limiti notevoli
(
8.
lim
x→−∞
1+
1
x
153
)x
=e.
Si osserva innanzitutto che ha senso considerare tale limite in quanto per x < −1,
la base 1 + 1/x è strettamente positiva. Si ha poi, per ogni x < −1,
(
)
1 x
1+
x
(
)
(
)|x| (
)
1 −|x|
|x|
|x| − 1 + 1 |x|
1−
=
=
|x|
|x| − 1
|x| − 1
(
)|x| (
)|x|−1 (
)
1
1
1
1+
= 1+
1+
.
|x| − 1
|x| − 1
|x| − 1
=
=
e quindi, posto y = |x| − 1 e osservato che y → +∞ per x → −∞, dal limite
notevole precedente si ottiene
(
)
(
) (
)
1 x
1 y
1
lim
1+
1+
=e.
= lim
1+
x→−∞
y→+∞
x
y
y
9. Per ogni a ̸= 0: lim
x→+∞
(
1+
a )x
= ea ,
x
(
lim
x→−∞
1+
a )x
= ea .
x
Infatti, se a > 0,
(
lim
x→±∞
1+
a )x
= lim
x→±∞
x
((
1+
1
x/a
)x/a )a
((
lim
y→±∞
1+
1
y
)y )a
= ea ,
dove si è posto y = x/a.
Se a < 0, si procede come sopra tenendo presente che la sostituzione y = x/a
comporta y → ∓∞.
10. Per ogni c ̸= 0: lim (1 + cx)1/x = ec .
x→0
Infatti, considerando separatamente i limiti da sinistra e da destra e ponendo
y = 1/x, si ha
(
)
c y
1+
lim (1 + cx)1/x = lim
= ec ,
y→+∞
y
x→0+
(
)
c y
lim (1 + cx)1/x = lim
1+
= ec ,
y→−∞
y
x→0−
11. Per ogni c ̸= 0 e per ogni a > 0, a ̸= 1: lim
x→0
particolare: lim
x→0
loga (1 + cx)
c
=
. In
x
log a
log(1 + cx)
= c.
x
Infatti, dal limite notevole precedente,
lim
x→0
loga (1 + cx)
c
= lim loga (1 + cx)1/x = loga ec = c · loga e =
.
x→0
x
log a
Capitolo 6: Limiti delle funzioni reali
154
12. Per ogni a > 0, a ̸= 1: lim
x→0
1.
ax − 1
ex − 1
= log a. In particolare: lim
=
x→0
x
x
Ponendo y = ax − 1, si ha x = loga (1 + y) e quindi dal limite notevole precedente
e dal teorema sul limite della funzione reciproca (Teorema 6.5.5), si ha
lim
x→0
ax − 1
y
= lim
= log a .
y→0 loga 1 + y
x
(1 + x)a − 1
= a.
x→0
x
13. Per ogni a ̸= 0: lim
Si ha, infatti,
lim
x→0
(1 + x)a − 1
(1 + x)a − 1 log(1 + x)
(1 + x)a − 1
= lim
= lim
.
x→0 log(1 + x)
x→0 log(1 + x)
x
x
A questo punto, posto y = (1+x)a −1, si ricava 1+y = (1+x)a da cui log(1+y) =
a·log(1+x); allora, dal teorema sul limite della funzione reciproca (Teorema 6.5.5),
segue
ay
(1 + x)a − 1
= lim
=a
lim
y→0 log(1 + y)
x→0 log(1 + x)
e da ciò la tesi.
6.10
Infinitesimi ed infiniti
La teoria che si vuole esporre nella presente sezione risulta utile per risolvere
gran parte dei limiti in cui compare una forma indeterminata ed in cui non
possono essere utilizzati direttamente i teoremi sui limiti studiati fino ad
ora.
Si considera fissato in tutto il seguito un sottoinsieme non vuoto X di
R ed un punto x0 ∈ R di accumulazione per X.
Inoltre, tutte le funzioni reali f : X → R prese in considerazione
verificano la condizione seguente
∃ J0 ∈ I(x0 ) t.c. ∀ x ∈ X ∩ J0 r {x0 } : f (x) ̸= 0 .
(6.10.1)
Sia allora f : X → R una funzione reale, si dice che f è un infinitesimo
(rispettivamente, un infinito) in x0 se
lim f (x) = 0
x→x0
(rispettivamente, lim |f (x)| = +∞ ).
x→x0
(6.10.2)
Pertanto, una funzione f è un infinitesimo (rispettivamente, un infinito)
in x0 se e solo se la funzione reciproca 1/f è un infinito (rispettivamente,
un infinitesimo) in x0 (ha senso considerare la funzione reciproca almeno in
un intorno del punto x0 a causa dell’ipotesi (6.10.1)).
6.10 Infinitesimi ed infiniti
155
La definizione successiva è alla base delle considerazioni svolte nella presente sezione. Per comodità vengono considerate funzioni definite in uno
stesso insieme X, anche se per il carattere locale del limite, si potrebbe
supporre che le funzioni in esame siano definite in insiemi aventi la stessa
intersezione con un intorno di x0 (privato al più del punto x0 ).
Definizione 6.10.1 Siano f : X → R e g : X → R due infinitesimi
(rispettivamente, infiniti) in x0 . Si dice che:
1. f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine
maggiore di g se
lim
x→x0
|f (x)|
=0
|g(x)|
rispettivamente, = +∞ ).
(6.10.3)
In tal caso si scrive
ord f (x) > ord g(x) .
x→x0
x→x0
2. f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine
minore di g se
lim
x→x0
|f (x)|
= +∞
|g(x)|
rispettivamente, = 0 ).
(6.10.4)
In tal caso si scrive
ord f (x) < ord g(x) .
x→x0
x→x0
3. f è un infinitesimo (rispettivamente, un infinito) in x0 dello stesso ordine di g (oppure che f e g sono infinitesimi (rispettivamente, infiniti)
dello stesso ordine in x0 ) se
lim
x→x0
|f (x)|
=ℓ>0.
|g(x)|
(6.10.5)
Se, in più, è verificata la condizione
lim
x→x0
f (x)
=1,
g(x)
(6.10.6)
allora f e g si dicono equivalenti in x0 . Per denotare la circostanza
in cui f e g siano infinitesimi (rispettivamente, infiniti) dello stesso
ordine in x0 si usa la scrittura
ord f (x) = ord g(x) ,
x→x0
x→x0
Capitolo 6: Limiti delle funzioni reali
156
mentre per indicare il fatto che f e g sono infinitesimi (rispettivamente, infiniti) equivalenti in x0 si scrive
f (x) ∼ g(x) ,
x → x0
oppure f (x) equiv g(x) .
x→x0
4. f e g non sono confrontabili in x0 se non verificano nessuna delle
condizioni precedenti.
Osservazione 6.10.2 Se si suppone che f e g siano due infinitesimi (rispettivamente, infiniti) in x0 aventi lo stesso ordine e se esiste il limite
lim
x→x0
f (x)
= ℓ ∈ R r {0} ,
g(x)
(6.10.7)
allora la funzione f (x) è equivalente in x0 alla funzione ℓ · g(x)
Bisogna osservare, tuttavia, che la condizione (6.10.5) non comporta, in
generale, l’esistenza del limite (6.10.7). Ad esempio, la funzione (−1)[1/x] /x
è un infinito in 0 dello stesso ordine di 1/x, ma le due funzioni non sono
equivalenti in 0 (infatti, il limite del rapporto delle due funzioni non esiste
mentre in valore assoluto tende ad 1).
Le definizioni assunte fino ad ora consentono di confrontare tra loro gli
infinitesimi e gli infiniti in un punto; il passo successivo è ora quello di
attribuire un valore numerico ad alcuni infinitesimi ed infiniti che saranno
presi come campione, in modo da poter confrontare ogni altro infinitesimo
o infinito con tali valori numerici. Le funzioni più semplici che conviene
considerare come infinitesimi ed infiniti campione sono precisate di seguito.
Definizione 6.10.3 Sia α > 0. Si definisce infinitesimo (rispettivamente,
infinito) campione in x0 di ordine α, la funzione
1
),
|x − x0 |α
|x − x0 |α ,
(rispettivamente,
1
,
|x|α
(rispettivamente, |x|α ),
se x0 ∈ R ,
se x0 = ±∞ .
Inoltre, se f : X → R è un infinitesimo (rispettivamente, un infinito)
in x0 , si dice che f ha ordine maggiore di α (oppure minore, di α oppure
uguale ad α) e si scrive
ord f (x) > α
x→x0
(oppure ord f (x) < α ,
x→x0
ord f (x) = α )
x→x0
se f ha ordine maggiore dell’infinitesimo (rispettivamente, dell’infinito)
campione in x0 di ordine α.
Infine, si dice che f è un infinitesimo (rispettivamente, un infinito) in
x0 di ordine arbitrariamente piccolo (oppure arbitrariamente grande) se f
ha ordine minore (oppure maggiore) di α per ogni α > 0.
6.10 Infinitesimi ed infiniti
157
L’ordine di infinitesimo o di infinito non deve essere considerato come
un numero reale; in molti casi si può solo dire che esso è maggiore o minore
di un numero α > 0, ma non esiste alcun numero α > 0 per cui l’ordine sia
uguale ad α. Gli esempi più importanti da questo punto di vista sono la
funzione logaritmo nei punti 0 e +∞ e la funzione esponenziale nei punti
±∞. Si può dimostrare, infatti, il seguente importante risultato.
Proposizione 6.10.4 Sia a > 0, a ̸= 1. Allora:
1. La funzione logaritmo loga è un infinito in 0 (da destra) di ordine
arbitrariamente piccolo.
2. La funzione logaritmo loga è un infinito in +∞ di ordine arbitrariamente piccolo.
3. Se a > 1 (rispettivamente, se 0 < α < 1), la funzione esponenziale
expa è un infinito (rispettivamente, un infinitesimo) in +∞ di ordine
arbitrariamente grande.
4. Se a > 1 (rispettivamente, se 0 < α < 1), la funzione esponenziale
expa è un infinitesimo (rispettivamente, un infinito) in −∞ di ordine
arbitrariamente grande.
Si è preferito enunciare la proposizione precedente per la sua importanza nelle applicazioni. La sua dimostrazione, tuttavia, non viene trattata
a questo punto in quanto sarà un immediata conseguenza della regola di
L’Hôpital.
6.10.1
Operazioni con infinitesimi ed infiniti
Lo studio delle operazioni sugli infinitesimi ed infiniti è importante nello
studio di un limite a causa della seguente regola di sostituzione.
Proposizione 6.10.5 (Regola di sostituzione)
Siano f1 , f2 , g1 e g2 infinitesimi (rispettivamente, infiniti) in x0 e si supponga che
f1 (x) equiv f2 (x) ,
g1 (x) equiv g2 (x) .
x→x0
x→x0
f1 (x)
f2 (x)
esiste se e solo se esiste il limite lim
e,
x→x0 g1 (x)
x→x0 g2 (x)
in tal caso, i due limiti coincidono.
Allora, il limite lim
Dimostrazione. Ovvia, in quanto dalle ipotesi assunte, segue
lim
x→x0
f1 (x) f2 (x) g2 (x)
f2 (x)
f1 (x)
= lim
= lim
.
x→x0 f2 (x) g2 (x) g1 (x)
x→x0 g2 (x)
g1 (x)
Capitolo 6: Limiti delle funzioni reali
158
Si passa ora ad esaminare il comportamento della somma di due infinitesimi o infiniti.
Teorema 6.10.6 (Somma di due infinitesimi o infiniti)
Siano f e g due infinitesimi (rispettivamente, infiniti) in x0 . Allora:
1. Se ord f (x) < ord g(x), allora la somma f + g è un infinitesimo
x→x0
x→x0
(rispettivamente, un infinito) in x0 e si ha
f (x) + g(x) equiv f (x)
(rispettivamente, f (x) + g(x) equiv g(x) ).
x→x0
x→x0
f (x)
= ℓ con ℓ ∈ R r {0} e
g(x)
ℓ ̸= −1, allora la somma f + g è un infinitesimo (rispettivamente, un
infinito) in x0 e si ha
2. Se ord f (x) = ord g(x), e se lim
x→x0
x→x0
x→x0
f (x) + g(x) equiv (ℓ + 1)g(x) .
x→x0
f (x)
= −1, allora la somma f + g è un infinitesimo in x0
g(x)
di ordine maggiore di quello degli infinitesimi f e g (rispettivamente,
non è detto che f +g sia un infinito in x0 ; nel caso ciò accada, l’ordine
di f + g è minore di quello degli infiniti f e g).
3. Se limx→x0
Dimostrazione. 1. Supposto ord x→x0 f (x) < ord x→x0 g(x), si ha
(
)
f (x) + g(x)
g(x)
lim
= lim 1 +
=1
x→x0
x→x0
f (x)
f (x)
(rispettivamente,
lim
x→x0
f (x) + g(x)
= lim
x→x0
g(x)
(
)
f (x)
+ 1 = 1 ),
g(x)
e da ciò segue la tesi.
2. Nelle ipotesi previste, si ha
lim
x→x0
3. Infatti, se limx→x0
ℓ
1
f (x) + g(x)
=
+
=1.
(ℓ + 1) g(x)
ℓ+1
ℓ+1
f (x)
= −1, si ha
g(x)
lim
x→x0
e analogamente limx→x0
f (x) + g(x)
= −1 + 1 = 0
g(x)
f (x)+g(x)
g(x)
= −1 + 1 = 0.
6.10 Infinitesimi ed infiniti
159
Quindi la somma di due infinitesimi (rispettivamente, infiniti) non aventi lo stesso ordine in x0 , è equivalente all’infinitesimo di ordine minore
(rispettivamente, all’infinito di ordine maggiore).
Inoltre, nel caso della differenza di due infinitesimi o infiniti equivalenti, si può prevedere il comportamento della somma nel caso in cui le due
funzioni non siano equivalenti (vedasi la 2. del teorema precedente); se ciò
accade, si può solo affermare la 3. del teorema precedente.
Teorema 6.10.7 (Prodotto di due infinitesimi o di due infiniti)
Siano f e g due infinitesimi (rispettivamente, due infiniti) in x0 . Allora, il
prodotto f · g è un infinitesimo (rispettivamente, un infinito) in x0 avente
ordine maggiore sia di f che di g in x0 .
In particolare, se α, β > 0, si ha
>
ord f (x) < α ,
=
x→x0
>
ord g(x) < β
=
x→x0
⇒
>
ord f (x) · g(x) < α + β .
=
x→x0
Dimostrazione. La dimostrazione è un’ovvia conseguenza delle definizioni di ordine e di
infinitesimi ed infiniti campione.
A titolo di esempio, si considera il caso in cui f sia un infinitesimo di ordine maggiore
di α, g sia un infinitesimo di ordine maggiore di β ed il punto x0 sia reale. In questo caso
lim
x→x0
|f (x) · g(x)|
|f (x)|
|g(x)|
= lim
=0,
x→x0 |x − x0 |α |x − x0 |β
|x − x0 |α+β
cioè ord x→x0 f (x) · g(x) > α + β.
In particolare, dal teorema precedente si deduce anche che f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine arbitrariamente piccolo
e se g è un è un infinitesimo (rispettivamente, un infinito) in x0 di ordine
minore di β per un certo β > 0, allora il prodotto f · g è un infinitesimo
(rispettivamente, un infinito) in x0 di ordine arbitrariamente piccolo in x0 .
Analogamente, se f è un infinitesimo (rispettivamente, un infinito) in
x0 di ordine arbitrariamente grande e se g è un è un infinitesimo (rispettivamente, un infinito) in x0 di ordine maggiore di β per un certo β > 0,
allora il prodotto f · g è un infinitesimo (rispettivamente, un infinito) in x0
di ordine arbitrariamente grande in x0 .
Se, invece, vengono moltiplicati un infinitesimo ed un infinito, si ha il
seguente risultato che si riconosce in maniera analoga.
Teorema 6.10.8 (Prodotto di un infinitesimo e di un infinito)
Siano f un infinitesimo e g un infinito in x0 . Si ha:
1. Se ord x→x0 f (x) < ord x→x0
1
, allora f · g è un infinito in x0 e si
g(x)
ha
ord f (x) · g(x) < ord g(x) ;
x→x0
x→x0
Capitolo 6: Limiti delle funzioni reali
160
in particolare,
ord f (x) = α ,
x→x0
ord g(x) = β
x→x0
2. Se ord x→x0 f (x) > ord x→x0
⇒ ord f (x) · g(x) = β − α .
x→x0
1
, allora f · g è un infinitesimo in x0
g(x)
e si ha
ord f (x) · g(x) < ord f (x) ;
x→x0
x→x0
in particolare,
ord f (x) = α ,
x→x0
ord g(x) = β
x→x0
⇒ ord f (x) · g(x) = α − β .
x→x0
3. Se f e g hanno lo stesso ordine in x0 , allora il prodotto f · g non è né
infinitesimo né infinito in x0 .
Lo studio del quoziente tra due infinitesimi e/o infiniti in x0 deriva direttamente dai teoremi precedenti, tenendo presente che dividere per un
infinitesimo (rispettivamente, un infinito) in x= equivale a moltiplicare per
l’infinito (rispettivamente, infinitesimo) reciproco in x0 (ciò vale anche per
gli infinitesimi ed infiniti campione).
Osservazione 6.10.9 Nel caso in cui siano noti gli ordini di infinitesimo o
di infinito in x0 delle funzioni che figurano in un rapporto, si può utilizzare
un metodo pratico abbastanza semplice per determinare l’ordine del rapporto. Innanzitutto si sceglie valutare l’ordine in termini di infinitesimi o
infiniti in x0 . Nel primo caso si addizionano tutti gli ordini degli infinitesimi
in x0 che compaiono al numeratore e degli infiniti in x0 che compaiono al
denominatore e a tale numero si sottrae la somma degli ordini degli infiniti
in x0 che compaiono al numeratore e degli infinitesimi in x0 che compaiono al denominatore. Se il numero cosı̀ ottenuto è strettamente positivo, il
rapporto sarà un infinitesimo in x0 avente come ordine tale numero, se invece è strettamente negativo, il rapporto sarà un infinito in x0 avente come
ordine l’opposto di tale numero (l’ordine in un punto è sempre un numero
strettamente positivo).
Nel secondo caso, si sceglie di valutare gli infiniti in x0 , si addizionano
tutti gli ordini degli infiniti in x0 che compaiono al numeratore e degli infinitesimi in x0 che compaiono al denominatore e poi si sottrae la somma degli
ordini degli infinitesimi in x0 che compaiono al numeratore e degli infiniti in
x0 che compaiono al denominatore. Se si ottiene un numero strettamente
positivo, il rapporto sarà un infinito in x0 avente come ordine tale numero,
se invece si ottiene un numero strettamente negativo, il rapporto sarà un
infinitesimo in x0 avente come ordine l’opposto di tale numero.
6.10 Infinitesimi ed infiniti
161
In altre parole, ad un infinitesimo di un certo ordine, viene attribuito un
ordine di infinito opposto e analogamente, un infinito può essere riguardato
come un infinitesimo di ordine opposto. Ad una funzione che nonè né infinitesima nè infinita, ma tende verso un numero reale (diverso da 0) in x0 ,
viene attribuito un ordine di infinitesimo e di infinito uguale a 0.
Tale metodo è basato naturalmente sui teoremi sul prodotto e sul quoziente di infinitesimi ed infiniti.
Infine, si esamina il caso delle funzioni composte.
Teorema 6.10.10 (Funzioni composte di infinitesimi o infiniti)
Siano X e Y sottoinsiemi di R e siano f : X → R e g : Y → R funzioni reali.
Si supponga che f (X) ⊂ Y e si consideri la funzione composta g◦f : X → R.
Siano, inoltre, x0 ∈ R un punto di accumulazione per X e si supponga che
limx→x0 f (x) = y0 , con y0 ∈ R punto di accumulazione per Y .
Se la funzione g è un infinitesimo (rispettivamente, un infinito) in y0 ,
allora la funzione composta è un infinitesimo (rispettivamente, un infinito)
in x0 . Inoltre, se α, β > 0, si ha:
1. Se y0 ∈ R:
>
ord (f (x) − y0 ) < α ,
=
x→x0
>
ord g(x) < β
=
x→x0
⇒
>
ord g(f (x)) < α · β .
=
x→x0
2. Se y0 = ±∞:
>
ord f (x) < α ,
=
>
ord g(x) < β
=
x→x0
x→x0
⇒
>
ord g(f (x)) < α · β .
=
x→x0
Dimostrazione. Il fatto che la funzione composta sia un infinitesimo (rispettivamente,
un infinito) in x0 segue direttamente dal Teorema 6.5.6 sul limite delle funzioni composte.
Per quanto riguarda la parte rimanente, si considera solo il caso x0 , y0 ∈ R con
ord (f (x) − y0 ) = α ,
x→x0
ord g(x) = β ,
x→x0
essendo la dimostrazione di tutti gli altri casi del tutto analoga.
Nelle ipotesi di sopra, si ha
lim x → x0
|g(f (x))|
|x − x0 |α·β
=
=
e quindi la tesi è vera.
|g(f (x))| |f (x) − y0 |β
|f (x) − y0 |β |x − x0 |α·β
(
)
|g(y))|
|f (x) − y0 | β
lim y → y0
lim
=1,
β
α
|y − y0 | x→x0
|x − x0 |
lim x → x0
Capitolo 7
Successioni e serie
numeriche
7.1
Limiti di successioni
Nella Sezione 6.9 del Capitolo 6, si è visto come la definizione generale di
limite può essere applicata anche al caso delle successioni di numeri reali,
potendo queste essere riguardate come funzioni reali definite in N. Avendo
N come unico punto di accumulazione +∞, ha senso considerare il limite di
una successione (an )n∈N solamente in +∞; nel caso in cui tale limite esista,
esso viene denotato con uno dei simboli
lim an ,
n→+∞
lim an
n
e viene denominato il limite della successione (an )n∈N (si può sottintendere
“nel punto +∞” in quanto ciò non dà luogo ad equivoci).
Più esplicitamente, una successione (an )n∈N che ammette un limite ℓ ∈
R, viene denominata regolare. Nel caso invece in cui non esista il limite,
la successione si dice invece non regolare oppure oscillante. Una successione regolare che ha come limite un numero reale, si dice convergente; se,
invece, ha come limite +∞ oppure −∞, essa viene denominata divergente
positivamente oppure divergente negativamente.
La proprietà di una successione di essere convergente, divergente positivamente o negativamente oppure oscillante viene spesso definita come
carattere della successione.
Esplicitamente, una successione (an )n∈N risulta
164
Capitolo 7: Successioni e serie numeriche
• convergente verso un numero reale ℓ se verifica la seguente condizione:
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : |an − ℓ| < ε ;
• divergente positivamente se verifica la seguente condizione:
∀ M ∈ R ∃ ν ∈ N t.c. ∀ n ≥ ν : an > M ;
• divergente negativamente se verifica la seguente condizione:
∀ M ∈ R ∃ ν ∈ N t.c. ∀ n ≥ ν : an < M .
Ovviamente, il modo in cui è stato definito il limite di una successione
consente di applicare tutti i risultati già visti per i limiti di una funzione nel
punto +∞. Tuttavia, alcuni di questi risultati assumono una forma particolare nel caso delle successioni ed altri possono essere espressi utilizzando
le notazioni tipiche delle successioni. Pertanto, si passano brevemente in
rassegna quei risultati che assumono una forma particolare nel caso delle
successioni.
Uno dei risultati che può essere notevolmente migliorato nel caso delle
successioni è quello che riguarda la locale limitatezza. Infatti, la convergenza
di una successione comporta la sua limitatezza globale, come di seguito
dimostrato.
Teorema 7.1.1 Sia (an )n∈N una successione di numeri reali. Allora:
1. (Limitatezza delle successioni convergenti)
Se (an )n∈N è convergente, allora (an )n∈N è limitata.
2. Se (an )n∈N è divergente positivamente (rispettivamente, divergente negativamente), allora (an )n∈N è limitata inferiormente (rispettivamente, superiormente).
Dimostrazione. 1) Si denoti con ℓ il limite della successione (an )n∈N . Applicando la
definizione di limite con ε = 1 si trova ν ∈ N tale che, per ogni n ≥ ν, si abbia ℓ − 1 <
an < ℓ + 1. Osservato che l’insieme {a0 , a1 , . . . , aν } è finito, si possono ora considerare i
numeri m = min{a0 , a1 , . . . , aν , ℓ − 1}, M = max{a0 , a1 , . . . , aν , ℓ + 1}. Allora, per ogni
n ∈ N, si ha m ≤ an ≤ M (ciò si riconosce facilmente distinguendo i casi in cui n ≤ ν e
n ≥ ν) e ciò completa la prima parte della dimostrazione.
2) Si supponga che (an )n∈N sia divergente positivamente. Applicando la definizione di
limite con M = 0, si trova ν ∈ N tale che, per ogni n ≥ ν, an > 0. Posto m =
min{a0 , a1 , . . . , aν , 0}, si ha, per ogni n ∈ N, m ≤ an e quindi la successione è limitata
inferiormente. La dimostrazione del caso rispettivo è analoga.
Un ulteriore risultato che conviene considerare è l’analogo del Teorema
6.6.3 sul limite delle funzioni monotone, che nel caso delle successioni si
esprime come segue.
7.1 Limiti di successioni
165
Teorema 7.1.2 (Teorema sul limite delle successioni monotone)
Ogni successione monotona (an )n∈N di numeri reali è regolare; precisamente, se (an )n∈N è crescente (rispettivamente, decrescente), si ha:
lim an = sup an ,
n→+∞
(rispettivamente,
n∈N
lim an = inf an ).
n→+∞
n∈N
(7.1.1)
Inoltre, se (an )n∈N è anche limitata, essa risulta convergente.
Dimostrazione. La prima parte della tesi segue dal Teorema 6.6.3. L’ultima parte deriva
dalla (7.1.1) e dal fatto che se una successione è limitata, allora supn∈N an ∈ R (nel caso
rispettivo, inf n∈N an ∈ R).
Ovviamente, per il carattere locale del limite, il teorema precedente continua a valere anche se si suppone che la successione (an )n∈N sia definitivamente crescente (rispettivamente, definitivamente decrescente); in questo
caso, tuttavia, se ν ∈ N è tale che (an )n≥ν sia crescente (rispettivamente,
decrescente), la (7.1.1) deve essere sostituita con la seguente:
lim an = sup an ,
n→+∞
(rispettivamente,
n≥ν
lim an = inf an ).
n→+∞
n≥ν
Poiché per le successioni valgono teoremi analoghi a quelli visti per i
limiti di funzioni, i limiti delle successioni possono spesso essere trattati e
risolti nello stesso modo dei limiti di funzioni nel punto +∞. Nel seguito,
tuttavia, sarà possibile analizzare alcuni risultati specifici per le successioni.
Prima di esaminarli, si studia la seguente caratterizzazione dell’esistenza
del limite di una funzione mediante limite di successioni, che costituisce
appunto un legame tra limiti di funzioni e limiti di successioni.
Teorema 7.1.3 (Caratterizzazione sequenziale del limite)
Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione
per X, f : X → R una funzione reale ed ℓ ∈ R.
Allora, le seguenti proposizioni sono equivalenti:
a) lim f (x) = ℓ.
x→x0
b) Se (an )n∈N è una successione di elementi di X r {x0 } (cioè, per ogni
n ∈ N, si ha an ∈ X r{x0 }) e se lim an = x0 , allora lim f (an ) =
n→+∞
n→+∞
ℓ.
Dimostrazione. a) ⇒ b) Sia (an )n∈N una successione di elementi di X r {x0 } tale che
limn→+∞ an = x0 . Per dimostrare la b), si fissi un intorno arbitrario I di ℓ; dalla a), si
può considerare un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, si abbia f (x) ∈ I.
Poiché limn→+∞ an = x0 , in corrispondenza dell’intorno J di x0 , deve esistere ν ∈ N
Capitolo 7: Successioni e serie numeriche
166
tale che, per ogni n ≥ ν, risulti an ∈ J. Allora, per ogni n ≥ ν, si ha an ∈ X ∩ J r {x0 }
e conseguentemente f (an ) ∈ I. Dall’arbitrarietà dell’intorno I di ℓ, segue la b).
b) ⇒ a) Si supponga, per assurdo, che la a) sia falsa. Allora, deve esistere un intorno I
di ℓ tale che, comunque si consideri un intorno J di x0 , deve esistere x ∈ X ∩ J r {x0 }
verificante la condizione f (x) ∈
/ I. Si ponga ora, per ogni n ∈ N,

1
1

, x0 +
[,
se x0 ∈ R ;
 ]x0 −
n
+
1
n
+
1
Jn =
]n,
+∞[
,
se x0 = +∞ ;


] − ∞, −n[ ,
se x0 = −∞ .
Per ogni n ∈ N, Jn è un intorno di x0 e quindi deve esistere an ∈ X ∩ Jn r {x0 } tale che
f (an ) ∈
/ I. Si consideri ora la successione (an )n∈N di elementi di X r {x0 }. Si riconosce
facilmente che essa tende verso x0 ; infatti, per ogni n ∈ N, risulta |an − x0 | < 1/(n + 1)
se x0 ∈ R, mentre an > n oppure an < −n se x0 = +∞ oppure x0 = −∞. Allora, dalla
b) segue che la successione (f (an ))n∈N deve tendere verso ℓ e ciò è assurdo in quanto,
per ogni n ∈ N, f (an ) ∈
/ I.
Osservazione 7.1.4 La caratterizzazione precedente viene spesso utilizzata per dimostrare che un limite assegnato non esiste. A tal fine si può
procedere in vari modi:
1. Si trovano due successioni (an )n∈N e (bn )n∈N di elementi di X r {x0 }
tali che lim an = x0 e lim bn = x0 , mentre lim f (an ) = ℓ1 e
n→+∞
n→+∞
n→+∞
lim f (bn ) = ℓ2 con ℓ1 ̸= ℓ2 .
n→+∞
In questo caso il limite di f in x0 non può esistere perché dal Teorema
7.1.3 dovrebbe essere da un lato uguale ad ℓ1 e dall’altro ad ℓ2 e ciò
contraddice il teorema sull’unicità del limite.
2. Si trova una successione (an )n∈N di elementi di X r{x0 } che verifica la
condizione lim an = x0 , mentre il lim f (an ) non esiste. In questo
n→+∞
n→+∞
caso il limite di f in x0 non può esistere altrimenti, dal Teorema 7.1.3,
dovrebbe coincidere con il limite della successione (f (an ))n∈N .
3. Si trova una successione (an )n∈N di elementi di X r {x0 } che verifica
la condizione lim an = x0 e per cui la successione (f (an ))n∈N sia lin→+∞
mitata superiormente (rispettivamente, inferiormente), mentre la funzione non è limitata superiormente (rispettivamente, inferiormente)
in alcun intorno di x0 . In questo caso, per la proprietà di limitatezza
locale, il limite di f in x0 potrebbe essere solamente +∞ (rispettivamente, −∞) e ciò comporterebbe, per il Teorema 7.1.3, che anche la
successione (f (an ))n∈N dovrebbe essere divergente positivamente (rispettivamente, negativamente) in contraddizione con quanto assunto.
Le ipotesi sopra previste sono soddisfatte se si trova una successione
7.1 Limiti di successioni
167
di elementi di X r {x0 } tendente verso x0 e in cui il limite è reale (oppure la funzione è limitata) ed un’altra successione tendente verso x0
di punti di accumulazione per X in ognuno dei quali la funzione è un
infinito; in questo caso la contraddizione deriva dal fatto che avendo
trovato una successione con un limite reale oppure in cui la funzione
è limitata l’eventuale limite deve essere esso stesso reale; d’altra parte
se vi è una successione di punti in ognuno dei quali la funzione non è
limitata, la funzione non risulta limitata in alcun intorno di x0 in contrasto con la proprietà di limitatezza locale (ad esempio, si consideri
il limite lim 1/(x cos x) e le successioni an = 2nπ e bn = π/2 + nπ).
x→+∞
Si considera ora qualche esempio.
Esempi 7.1.5
1. Utilizzando il teorema precedente, si dimostra che il limite
lim sin x
x→+∞
non esiste.
Infatti, si considerino le successioni (π/2 + 2nπ)n∈N e (3π/2 + 2nπ)n∈N , entrambe
divergenti positivamente. Si ha
(
)
)
(π
3
+ 2nπ = 1 ,
lim sin
π + 2nπ = −1
lim sin
n→+∞
n→+∞
2
2
e quindi, per l’Osservazione 7.1.4, 1., il limite in esame non esiste.
2. Più in generale, l’esempio precedente dimostra che una funzione periodica non costante non ammette limite nei punti +∞ e −∞. Infatti,
si consideri una funzione f : X → R periodica non costante di periodo
ω > 0 e siano x1 ∈ X e x2 ∈ X tali che f (x1 ) ̸= f (x2 ). Si considerino le successioni (x1 + nω)n∈N e (x2 + nω)n∈N ; esse sono entrambe divergenti positivamente e inoltre limn→+∞ f (x1 + nω) = f (x1 ),
limn→+∞ f (x2 + nω) = f (x2 ) con f (x1 ) ̸= f (x2 ); allora, per l’Osservazione 7.1.4, 1., il limite limx→+∞ f (x) non può esistere. Per quanto
riguarda il punto −∞, si procede in modo analogo considerando le
successioni (x1 − nω)n∈N e (x2 − nω)n∈N .
Dal presente risultato si ricava in particolare che le funzioni trigonometriche sin, cos, tan e cot non ammettono limite nei punti ±∞.
3. Si studi il limite
tan2 x + 1
.
x→−∞
x2
lim
Capitolo 7: Successioni e serie numeriche
168
Si consideri la funzione f (x) := (tan2 x + 1)/x2 e la successione divergente negativamente (−nπ)n∈N . Tenendo presente che tan2 (−nπ) = 0
per ogni n ∈ N, se esistesse il limite assegnato, dovrebbe essere
lim f (x) = lim f (−nπ) = 0 .
x→−∞
n→+∞
Tuttavia, considerato un arbitrario intorno J di −∞, esiste sicuramente k ∈ Z tale che π/2 + kπ ∈ J. Poiché limx→π/2+kπ |f (x)| = +∞, la
funzione non è limitata in un intorno di π/2 + kπ e quindi in J. Per
l’Osservazione 7.1.4, 3., il limite assegnato non può esistere.
◃ Si espongono ora alcuni risultati riguardanti la successione delle medie aritmetiche e quella delle medie geometriche di una successione assegnata. Se (an )n∈N è
una successione di numeri reali, la successione delle medie aritmetiche di (an )n∈N
è la successione (A[an ])n∈N definita ponendo
A[an ] :=
a0 + · · · + an
n+1
n
1 ∑
ak ).
n+1
(=
k=0
Inoltre, se an > 0 per ogni n ∈ N,1 si può definire la successione (G[an ])n∈N
delle medie geometriche di (an )n∈N ponendo
G[an ] :
√
n+1
a0 · · · an
(=
v
u n
u∏
t
ak ).
n+1
k=0
I risultati seguenti sono noti come teoremi di Cesàro.
Teorema 7.1.6 (Teorema di Cesàro sulla media aritmetica)
Sia (an )n∈N una successione regolare di numeri reali e sia ℓ ∈ R il suo limite.
Allora la successione (A[an ])n∈N delle medie aritmetiche di (an )n∈N è anch’essa
regolare e tende verso ℓ.
Dimostrazione. Si supponga dapprima che (an )n∈N sia convergente, cioè che ℓ ∈ R e sia
ε > 0; allora esiste ν1 ∈ N tale che
∀ n ≥ ν1 : |an − ℓ| <
(
Poiché la successione
1
n+1
∑ν1
k=0
)
|ak − ℓ|
ℓ| è costante, esiste ν2 ∈ N tale che
∀ n ≥ ν2 :
1 Ciò
n∈N
ε
.
2
tende a 0 in quanto il termine
∑ν1
k=0
|ak −
ν1
1 ∑
ε
|ak − ℓ| < .
n + 1 k=0
2
assicura che la successione delle medie geometriche non sia definitivamente nulla.
7.1 Limiti di successioni
169
Allora, per ogni n > max{ν1 , ν2 }, si ha
n
1 ∑
ak − ℓ
n + 1 k=0
≤
n
1 ∑
|ak − ℓ|
n + 1 k=0
=
ν1
1 ∑
1
|ak − ℓ| +
n + 1 k=0
n+1
<
n
∑
|ak − ℓ|
k=ν1 +1
ε
1
ε
ε
ε
+
(n − ν1 ) < + = ε .
2
n+1
2
2
2
Dall’arbitrarietà di ε > 0, segue la tesi.
Si supponga ora che (an )n∈N sia divergente positivamente e sia M > 0. Allora esiste
ν1 ∈ N tale che
∀ n ≥ ν1 : an > 4M .
Procedendo come prima, si può considerare ν2 ∈ N tale che
∀ n ≥ ν2 :
ν1
∑
1
ak < M .
n + 1 k=0
Allora, per ogni n > max{2ν1 + 1, ν2 }, si ha innanzitutto (n − 1)/2 ≥ ν1 da cui n − ν1 ≥
n − (n − 1)/2 = (n + 1)/2 e pertanto
n
1 ∑
ak
n + 1 k=0
=
≥
>
≥
ν1
1 ∑
1
ak +
n + 1 k=0
n+1
−
n
∑
ak
k=ν1 +1
ν1
∑
1
1
ak +
n + 1 k=0
n+1
n
∑
ak
k=ν1 +1
1
(n − ν1 ) 4M
n+1
1 n+1
−M +
4M = −M + 2M = M .
n+1 2
−M +
Dall’arbitrarietà di M > 0, segue la tesi anche in questo caso.
Se la successione è divergente negativamente, si procede in maniera analoga e quindi
la tesi è completamente dimostrata.
Il risultato precedente non può essere invertito, nel senso che la successione
delle medie aritmetiche può risultare regolare pur non essendolo la successione di
partenza, come ad esempio per la successione ((−1)n )n∈N .
In alcuni casi l’utilizzo del risultato precedente consente di studiare più agevolmente la regolarità di una successione assegnata.
Ad esempio, si consideri la successione (log n!/n)n≥1 ; poiché log n! = log n +
log(n−1)+· · ·+log 2+log 1, essa è la media aritmetica della successione (log n)n≥1 ,
la quale diverge positivamente; dal teorema precedente, segue pertanto che anche
(log n!/n)n≥1 è divergente positivamente.
Teorema 7.1.7 (Teorema di Cesàro sulla media geometrica)
Sia (an )n∈N una successione regolare di numeri reali strettamente positivi e sia
ℓ ∈ R il suo limite. Allora la successione (G[an ])n∈N delle medie geometriche di
(an )n∈N è anch’essa regolare e tende verso ℓ.
Capitolo 7: Successioni e serie numeriche
170
Dimostrazione. Si supponga dapprima che ℓ ∈]0, +∞[. Sia 0 < ε < 3; poiché la
successione (an /ℓ)n∈N converge verso 1, esiste ν1 ∈ N tale che
ε
an
ε
∀ n > ν1 : 1 − <
<1+ ;
3
ℓ
3
da ciò segue, per ogni n ≥ ν1 + 1,
(
(
(
ε )n+1 (
ε )n−ν1
aν +1
an
ε )n−ν1
ε )n+1
1−
< 1−
< 1
···
< 1+
< 1+
3
3
ℓ
ℓ
3
3
e quindi
ε
<
3
√
aν1 +1
an
ε
···
<1+ .
ℓ
ℓ
3
( √
)
converge verso 1 e quindi esiste ν2 ∈ N
Anche la successione n+1 a0 /ℓ · · · aν1 /ℓ
1−
n+1
n∈N
√
ε
a0
aν
ε
∀ n ≥ ν2 : 1 − < n+1
··· 1 < 1 + .
3
ℓ
ℓ
3
Allora, per ogni n ≥= max{ν1 + 1, ν2 }, si ha
√
√
(
ε )2 (
ε) (
ε)
a0
aν
aν1 +1
an
1−
= 1−
1−
< n+1
· · · 1 n+1
···
=
3
3
3
ℓ
ℓ
ℓ
ℓ
tale che
e analogamente
√
n+1
√
n+1
a0
an
···
ℓ
ℓ
(
an
ε )2
a0
···
< 1+
.
ℓ
ℓ
3
Da ciò segue, essendo ε < 3,
√
2
a0
an
1
2
1
n+1
···
− 1 < ε + ε2 < ε + 3ε = ε .
ℓ
ℓ
3
9
3
9
Dall’arbitrarietà di ε > 0, si ottiene
√
n+1 a · · · a
n
0
lim
= lim
n→+∞
n→+∞
ℓ
√
n+1
an
a0
···
=1
ℓ
ℓ
e quindi la tesi nel caso in esame.
Si supponga ora ℓ = +∞ e sia (M > 0. Allora esiste ν1 ∈ N) tale che an > 2M per
√
ogni n ≥ ν1 . Poiché la successione n+1 a0 /(2M ) · · · aν1 /(2M )
tende ad 1, si può
n∈N
trovare ν2 ∈ N tale che, per ogni n ≥ ν2 ,
√
1
aν
1
3
a0
1
= 1 − < n+1
··· 1 − 1 < 1 + = .
2
2
2M
2M
2
2
Allora, posto ν = max{ν1 , ν2 }, per ogni n ≥ ν, si ha
√
1
aν
a0
√
M = 2M · < 2M · n+1
· · · 1 = n+1 a0 · · · aν1 2M (2M )−(ν1 +1)/(n+1)
2
2M
2M
√
√
(n−ν1 )/(n+1)
n+1 a · · · a
=
< n+1 a0 · · · aν1 (an )(n−ν1 )/(n+1)
ν1 (2M )
0
e dall’arbitrarietà di M > 0, segue la tesi anche in questo caso.
Tenendo presente che gli elementi della successione (an )n∈N sono strettamente positivi, resta da considerare solamente il caso in cui ℓ = 0. Se ciò accade, si ha limn→+∞ 1/an =
+∞ e quindi, per il caso precedente,
√
1
1
n+1
···
= +∞ ,
lim
n→+∞
a0
aν1
7.1 Limiti di successioni
171
√
cioè limn→+∞ 1/ n+1 a0 · · · aν1 = +∞; considerando il limite della successione reciproca
√
si ottiene quindi limn→+∞ n+1 a0 · · · aν1 = 0 e la tesi è completamente dimostrata. Anche per le medie geometriche, il risultato precedente non può essere invertito, in quanto esistono successioni di numeri reali strettamente positivi che non
sono regolari, ma per le quali le successioni delle medie geometriche lo sono.
√
√
◃ Ad esempio, si consideri il limite limn→+∞ n n!; il termine generale n n! è la
media geometrica della successione (n)
√n≥1 che è divergente positivamente. Dal
Teorema 7.1.7, anche la successione ( n n!)n≥1 risulta divergente positivamente.
7.1.1
Successioni estratte
Come si è visto in precedenza molti risultati visti per le funzioni assumono una forma ed una terminologia particolare per le successioni; in accordo a ciò, si preferisce introdurre per le successioni il seguente concetto di
successione estratta anzichè far ricorso a quello più generale di funzione
composta.
Definizione 7.1.8 Sia (an )n∈N una successione di numeri reali e si consideri una successione strettamente crescente (k(n))n∈N di numeri naturali.
Allora la successione (ak(n) )n∈N viene denominata successione estratta di
(an )n∈N .
Denotando la successione (an )n∈N come funzione a : N → R e la successione (k(n))n∈N come funzione k : N → N, la successione estratta (ak(n) )n∈N
risulta essere la funzione composta a ◦ k : N → R; tuttavia, nel caso delle successioni si richiede in più la stretta crescenza di (k(n))n∈N in modo
che le proprietà del limite della successione di partenza si conservino per le
successioni estratte.
( 2
)
+2n+1
◃ Ad esempio, la successione 2n n+2
si ottiene come estratta dalla
n∈N
( 2 )
+1
, considerando la successione di interi strettamente
successione nn+1
n∈N
crescente (2n + 1)n∈N .
◃ Si osserva che se (k(n))n∈N è una successione strettamente crescente di
numeri naturali, allora, per ogni n ∈ N, si ha n ≤ k(n).
Infatti, se n = 0 la proprietà è vera e supposto che essa valga per n ∈ N, dalla stretta
crescenza si ha k(n) < k(n + 1) da cui n + 1 ≤ k(n) + 1 ≤ k(n + 1).
Da tale semplice proprietà segue il comportamento del limite delle successioni estratte descritto nella proposizione successiva.
Capitolo 7: Successioni e serie numeriche
172
Proposizione 7.1.9 Sia (an )n∈N una successione regolare di numeri reali.
Allora, ogni successione estratta (ak(n) )n∈N di (an )n∈N è anch’essa regolare
e si ha
lim ak(n) = lim an .
n→+∞
n→+∞
Dimostrazione. Sia ℓ ∈ R il limite della successione (an )n∈N e sia I un intorno di ℓ;
allora esiste ν ∈ N tale che an ∈ I per ogni n ≥ ν. Da quanto osservato per ogni n ≥ ν
si ha anche k(n) ≥ n ≥ ν e quindi ak(n) ∈ I. Dall’arbitrarietà dell’intorno I di ℓ, segue
la tesi.
◃ Come conseguenza della Proposizione 7.1.9, tutte le successioni estratte
di una successione regolare convergono verso lo stesso limite. Si deduce che
una successione (an )n∈N che ammette un’estratta non regolare oppure con
due estratte regolari aventi limiti diversi, non può essere regolare. Questo
metodo viene spesso utilizzato per dimostrare che il limite di una successione
assegnata non esiste.
Ad esempio, si studi il limite della successione ((−1)n an )n∈N , dove (an )n∈N
è una successione regolare tendente ad un numero ℓ ̸= 0. Allora, considerando l’estratta corrispondente alla successione strettamente crescente (2n)n∈N ,
si ottiene la successione (a2n )n∈N che tende verso ℓ; considerando invece l’estratta corrispondente alla successione strettamente crescente (2n + 1)n∈N ,
si ottiene la successione (−a2n+1 )n∈N che tende verso −ℓ. Si deduce che il
limite della successione assegnata non esiste in quanto ℓ ̸= 0.
7.1.2
Massimo e minimo limite
Se una successione non è regolare, si ricorre ad ulteriori strumenti che consentono di studiarne il comportamento, tra cui ad esempio il massimo e
minimo limite, definiti come segue.
Si consideri una successione (an )n∈N . Se essa non è limitata superiormente, il suo massimo limite viene assunto, per definizione, uguale a +∞
e analogamente, se essa non è limitata inferiormente, il suo minimo limite
viene assunto uguale a −∞.
Si supponga ora che (an )n∈N sia limitata superiormente (rispettivamente, inferiormente); per ogni k ∈ N, la successione estratta (ak )n≥k (ottenuta
considerando gli indici k(n) = k + n) ha lo stesso comportamento della
successione (an )n∈N . Si considerino le quantità
e′′k := sup an
n≥k
(rispettivamente, e′k := inf an ).
n≥k
7.1 Limiti di successioni
173
È immediato riconoscere che la nuova successione (e′′k )k∈N è decrescente e
quindi essa risulta regolare; il limite
ℓ′′ := lim e′′k
k→+∞
(= inf e′′k )
k∈N
viene denominato massimo limite della successione (an )n∈N e viene denotato
con uno dei seguenti simboli
lim sup an ,
n→+∞
lim′′
n→+∞
an ,
lim an .
n→+∞
Poichè (e′′k )k∈N è decrescente, il massimo limite è sicuramente diverso da
+∞.
Nel caso rispettivo, la successione (e′k )k∈N è crescente ed il suo limite
ℓ′ := lim e′k
k→+∞
(= sup e′k )
k∈N
viene denominato minimo limite della successione (an )n∈N e viene denotato
con uno dei seguenti simboli
lim inf an ,
n→+∞
lim′
n→+∞
an ,
lim an .
n→+∞
Poichè (e′k )k∈N è crescente, il minimo limite è sicuramente diverso da
−∞.
Il massimo ed il minimo limite sono unici ed a differenza del limite di
una successione esistono sempre.
◃ Nella proposizione successiva vengono enunciate le proprietà caratteristiche
del massimo e minimo limite, alle quali conviene ricorrere nelle applicazioni.
Proposizione 7.1.10 Sia (an )n∈N una successione di numeri reali e sia ℓ ∈ R.
Allora, le seguenti proposizioni sono equivalenti:
a) ℓ = lim sup an (rispettivamente, ℓ = lim inf an );
n→+∞
b)
n→+∞
1) ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : an < ℓ + ε
(rispettivamente, ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : ℓ − ε < an ).
2) ∀ ε > 0 ∀ ν ∈ N ∃ n ≥ ν t.c. ℓ − ε < an
(rispettivamente, ∀ ε > 0 ∀ ν ∈ N ∃ n ≥ ν t.c. an < ℓ + ε ).
Dimostrazione. Si considera solamente il primo caso, essendo quello rispettivo del tutto
analogo.
a)⇒ b) Poiché ℓ ∈ R, la successione (an )n∈N è necessariamente limitata superiormente.
Fissato ε > 0, dalla seconda proprietà dell’estremo inferiore esiste ν ∈ N tale che e′′
ν <
ℓ + ε; conseguentemente, dalla prima proprietà dell’estremo superiore si ha, per ogni
n ≥ ν, an < ℓ + ε. Ciò dimostra la proprietà 1). Siano ora ε > 0 e ν ∈ N fissati. Dalla
Capitolo 7: Successioni e serie numeriche
174
prima proprietà dell’estremo inferiore, si ha ℓ − ε < e′′
ν ; conseguentemente, dalla seconda
proprietà dell’estremo superiore si deduce l’esistenza di n ≥ ν tale che ℓ − ε < an .
b)⇒ a) Basta far vedere che ℓ verifica le proprietà caratteristiche dell’estremo inferiore
della successione (e′′
k )k∈N . Infatti, sia k ∈ N; dalla 2) della b), per ogni ε > 0 esiste n ∈ N
′′
tale che n ≥ k e ℓ − ε < an ; da ciò segue ℓ − ε < supn≥k an = e′′
k e quindi ℓ ≤ ek + ε;
′′
poiché ε > 0 è arbitrario, si deve avere ℓ ≤ ek . Ciò dimostra che ℓ verifica la prima
proprietà caratteristica dell’estremo inferiore. Sia ora ε > 0; dalla 1) della b), esiste
ν ∈ N tale che an < ℓ + ε per ogni n ≥ ν; allora ℓ + ε è un maggiorante della successione
(an )n≥ν e quindi deve essere e′′
ν ≤ ℓ + ε; pertanto ℓ verifica anche la seconda proprietà
caratteristica dell’estremo inferiore da cui la tesi.
◃ La proprietà 2) della b) si può esprimere equivalentemente nel modo seguente:
2’) Per ogni ε > 0, l’insieme {n ∈ N | ℓ − ε < an } è infinito
(rispettivamente, per ogni ε > 0, l’insieme {n ∈ N | an < ℓ + ε}) è infinito.
Infatti, si supponga vera la proprietà 2) e si fissi ε > 0. Se, per assurdo, l’insieme
{n ∈ N | ℓ−ε < an } fosse finito, esso sarebbe dotato di massimo ν ∈ N. Allora, applicando
la proprietà 2) al numero naturale ν + 1 si troverebbe un elemento n ≥ ν + 1 tale che
ℓ−ε < an e ciò contraddirebbe il fatto che ν è il massimo {n ∈ N | ℓ−ε < an }. Viceversa,
si supponga vera la proprietà 2’) e siano ε > 0 e ν ∈ N. Se, per assurdo, non esistesse
alcun elemento n ≥ ν tale che ℓ−ε < an , l’insieme {n ∈ N | ℓ−ε < an } sarebbe contenuto
in {0, 1, 2, . . . , ν} e quindi sarebbe finito; ciò contraddice evidentemente la proprietà 2’).
◃ Poiché ovviamente e′k ≤ e′′k per ogni k ∈ N si ha sempre
ℓ′ ≤ ℓ′′ .
L’uguaglianza del massimo e del minimo limite è caratterizzata dalla proposizione
successiva.
Proposizione 7.1.11 Se (an )n∈N è una successione di numeri reali, le seguenti
proposizioni sono equivalenti:
a) La successione (an )n∈N è regolare;
b) lim sup an = lim inf an .
n→+∞
n→+∞
Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti,
risulta
lim an = lim sup an = lim inf an .
n→+∞
n→+∞
n→+∞
Dimostrazione. Per brevità si denotano con ℓ′′ e rispettivamente ℓ′ il massimo e rispettivamente il minimo limite della successione (an )n∈N .
a)⇒ b) Si ponga ℓ = limn→+∞ an . Se ℓ = +∞ si ha e′k = +∞ per ogni k ∈ N e quindi
ℓ′ = ℓ′′ = +∞ da cui la tesi. Analogamente, se ℓ = −∞, si ha e′′
k = −∞ per ogni k ∈ N
e quindi ancora ℓ′ = ℓ′′ = −∞. Si supponga pertanto ℓ ∈ R; in tal caso, è immediato
verificare che ℓ verifica le proprietà caratteristiche sia del massimo che del minimo limite
(Proposizione 7.1.10) e quindi ℓ = ℓ′ = ℓ′′ ; da ciò segue anche l’ultima parte della tesi.
b)⇒ a) Si ponga ℓ = ℓ′ (= ℓ′′ ). Se ℓ = +∞, si ha ℓ′ = +∞ e quindi, per ogni M ∈ R deve
esistere ν ∈ N tale che e′k > M per ogni n ≥ ν; considerando n = ν, dalla definizione
7.1 Limiti di successioni
175
di e′ν segue allora an > M per ogni n ≥ ν e ciò dimostra che la successione (an )n∈N è
divergente positivamente. Se ℓ = −∞, si procede in maniera analoga considerando ℓ′′ .
Si supponga ora ℓ ∈ R; dalle proprietà caratteristiche del massimo e del minimo limite
(Proposizione 7.1.10), segue, per ogni ε > 0, da un lato l’esistenza di ν1 ∈ N tale che
an < ℓ + ε per ogni n ≥ ν1 , e dall’altro l’esistenza di ν2 ∈ N tale che ℓ − ε < an per
ogni n ≥ ν2 ; posto ν = max{ν1 , ν2 }, per ogni n ≥ ν, si ha allora ℓ − ε < an < ℓ + ε.
Dall’arbitrarietà di ε > 0, segue ℓ = limn→+∞ an .
◃ Per dimostrare facilmente la proprietà successiva, conviene osservare che come
conseguenza delle proprietà caratteristiche del massimo e del minimo limite enunciate nella Proposizione 7.1.10, si ha anche la seguente, dove ℓ denota il massimo
limite (rispettivamente, il minimo limite) della successione (an )n∈N
∀ ε > 0 ∀ ν ∈ N ∃ n ≥ ν t.c. ℓ − ε < an < ℓ + ε .
(7.1.2)
Infatti, se ℓ è il massimo limite della successione (an )n∈N , fissati ε > 0 e ν ∈ N, dalla
proprietà 1) della b) nella Proposizione 7.1.10, si ha l’esistenza di ν1 ∈ N tale che an < ℓ+ε
per ogni n ≥ ν1 . Applicando la proprietà 2) della b) nella stessa Proposizione 7.1.10 con
max{ν, ν1 } al posto di ν si ottiene l’esistenza di n ≥ max{ν, ν1 } tale che ℓ − ε < an ;
dunque n ≥ ν e poiché n ≥ ν1 , per tale n si ha anche an < ℓ + ε, da cui la tesi. Se ℓ è il
minimo limite della successione (an )n∈N , si procede ovviamente in maniera analoga.
◃ Si è visto in precedenza che se una successione è regolare, tutte le sue estratte
lo sono e tendono verso lo stesso limite (Proposizione 7.1.9). Nel caso generale, si
ha il seguente risultato.
Proposizione 7.1.12 Sia (an )n∈N una successione di numeri reali e siano ℓ′′ ed
ℓ′ il suo massimo limite e rispettivamente il suo minimo limite. Allora esistono
almeno due successioni estratte (ak1 (n) )n∈N e (ak2 (n) )n∈N regolari e tali che
lim ak1 (n) = ℓ′′ ,
n→+∞
lim ak2 (n) = ℓ′ .
n→+∞
Dimostrazione. Si dimostra solamente l’esistenza dell’estratta (ak1 (n) )n∈N . La successione strettamente crescente (k1 (n))n∈N di numeri naturali viene definita induttivamente
applicando la proprietà (7.1.2). Considerando ε = 1 e ν = 0, dalla (7.1.2), si ottiene
l’esistenza di k(0) ∈ N tale che ℓ′′ − 1 < ak(0) < ℓ′′ + 1. Si riapplica ora la stessa proprietà (7.1.2) con ε = 1/2 e ν = k(0) + 1 e si ottiene l’esistenza di un elemento k(1) ∈ N,
k(1) ≥ ν tale che ℓ′′ − 1/2 < ak(1) < ℓ′′ + 1/2; si osservi che k(1) > k(0) in quanto si
è considerato ν = k(0) + 1. Procedendo in questo modo, si può considerare una successione strettamente crescente (k(n))n∈N di interi positivi tale che, per ogni n ∈ N, risulti
ℓ′′ − 1/(n + 1) < ak(n) < ℓ′′ + 1/(n + 1). Dal primo teorema di confronto per i limiti
segue subito che la successione estratta (ak(n) )n∈N converge verso ℓ′′ .
Come conseguenza del risultato precedente, si può enunciare il seguente corollario.
Corollario 7.1.13 Sia (an )n∈N una successione di numeri reali. Allora:
176
Capitolo 7: Successioni e serie numeriche
1) Se (an )n∈N non è limitata superiormente, essa ammette un’estratta divergente positivamente.
2) Se (an )n∈N non è limitata inferiormente, essa ammette un’estratta divergente negativamente.
3) Se (an )n∈N è limitata superiormente oppure inferiormente, essa ammette
un’estratta convergente.
Dimostrazione. Nel primo caso il massimo limite della successione è +∞ e quindi la tesi
segue dalla Proposizione 7.1.12 precedente. Il secondo caso è analogo in quanto il minimo
limite è −∞. Infine, se la successione è limitata superiormente oppure inferiormente
almeno uno tra il massimo limite ed il minimo limite della successione è un numero reale
e quindi la tesi segue ancora dalla Proposizione 7.1.12.
◃ A questo punto si può dimostrare facilmente un risultato molto importante
per le sue numerose applicazioni.
Si osserva innanzitutto che se (an )n∈N è una successione di numeri reali convergente verso un numero reale ℓ e se l’insieme A := {an | n ∈ N} degli elementi
della successione è infinito, allora ℓ è un punto di accumulazione per A.
Infatti, considerato ε > 0, esiste ν ∈ N tale che an ∈]ℓ − ε, ℓ + ε[ per ogni n ≥ ν. Gli
elementi della successione (an )n∈N sono infiniti e quindi deve esistere almeno un n ≥ ν
tale che an ̸= ℓ; l’elemento an appartiene dunque all’insieme A∩]ℓ − ε, ℓ + ε[r{ℓ} che
risulta pertanto non vuoto. Poiché ε > 0 è arbitrario, si conclude che ℓ è un punto di
accumulazione per A.
Teorema 7.1.14 (Teorema di Bolzano-Weierstrass) Sia X un sottoinsieme
limitato ed infinito di R. Allora X è dotato di almeno un punto di accumulazione.
Dimostrazione. L’insieme X è infinito e quindi si può considerare una successione
(an )n∈N di elementi di X a due a due distinti; infatti, considerato a0 ∈ X, poiché X è infinito si può considerare poi a1 ∈ X r {a0 }; procedendo in questo modo, supposto di aver
definito l’elemento an , si sceglie poi an+1 nell’insieme (infinito) X r {a0 , a1 , . . . , an }. Si
ottiene cosı̀ una successione (an )n∈N di elementi di X tale che an ̸= am per ogni n ̸= m e
quindi il cui insieme degli elementi è sicuramente infinito. Gli elementi della successione
(an )n∈N appartengono all’insieme limitato X e quindi (an )n∈N è anch’essa limitata; dal
Corollario 7.1.13, 3), si ottiene l’esistenza di una successione estratta (ak(n) )n∈N della
successione (an )n∈N convergente verso un numero reale ℓ. Allora anche (ak(n) )n∈N è
una successione di elementi distinti di X e dalle osservazioni preliminari ℓ è un punto di
accumulazione per l’insieme dei suoi elementi; ma tale insieme è contenuto in X e quindi
ℓ è un punto di accumulazione anche per X.
7.1.3
Criterio di convergenza di Cauchy
Il criterio di convergenza di seguito esposto è utile per stabilire la convergenza di una successione senza necessariamente individuarne il limite.
7.1 Limiti di successioni
177
Teorema 7.1.15 (Criterio di Cauchy per le successioni)
Sia (an )n∈N una successione di numeri reali. Allora, le seguenti proposizioni
sono equivalenti:
a) La successione (an )n∈N è convergente.
b) La successione (an )n∈N verifica la seguente condizione
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν, ∀ m ≥ ν : |an − am | < ε .
Dimostrazione. a)⇒ b) Sia ℓ il limite della successione (an )n∈N e si fissi ε > 0. Allora
esiste ν ∈ N tale che |an −ℓ| < ε/2 per ogni n ≥ ν. Conseguentemente, per ogni n, m ≥ ν,
si ha |an − am | = |(an − ℓ) + (ℓ − am )| ≤ |an − ℓ| + |am − ℓ| < ε/2 + ε/2 = ε e quindi
(an )n∈N verifica la condizione la b).
b)⇒ a) Si dimostra innanzitutto che la successione (an )n∈N è limitata. Applicando la
proprietà b) con ε = 1, si ottiene l’esistenza di ν ∈ N tale che |an − am | < 1 per ogni
n, m ≥ ν; in particolare, per ogni n ≥ ν, si ha aν − 1 < an < aν + 1. Allora, posto
m = min{a0 , . . . , aν−1 , aν − 1} ed M = max{a0 , . . . , aν−1 , aν + 1}, si ha m ≤ an ≤ M
per ogni n ∈ N e ciò dimostra che la successione (an )n∈N è limitata. Si denotino ora con
ℓ′′ ed ℓ′ il massimo limite e rispettivamente il minimo limite della successione (an )n∈N ,
che per quanto osservato devono essere reali e ℓ′ ≤ ℓ′′ . Si fissi ora ε > 0; dalla b), esiste
ν ∈ N tale che |an − am | < ε/3 per ogni n, m ≥ ν. Dalla seconda proprietà caratteristica
del massimo limite applicata ad ε/3 e ν (vedasi la b) della Proposizione 7.1.10, esiste
n ≥ ν tale che ℓ′′ − ε/3 < an e analogamente, dalla seconda proprietà caratteristica del
minimo limite, esiste m ≥ ν tale che am < ℓ′ + ε/3. Allora, poiché n, m ≥ ν, si ha
ε
2
ε
2
ε
− am + ≤ |an − am | + ε < + ε = ε,
3
3
3
3
3
e conseguentemente ℓ′′ < ℓ′ + ε; poiché ε > 0 è arbitrario, segue ℓ′′ ≤ ℓ′ e quindi ℓ′′ = ℓ′ .
ℓ′′ − ℓ′ < an +
Dalla Proposizione 7.1.11, si conclude che (an )n∈N è convergente.
◃ Una successione (an )n∈N che verifica la condizione b) del Teorema 7.1.15
precedente viene denominata successione di Cauchy (oppure successione
fondamentale).
7.1.4
Massimo e minimo limite per le funzioni
Il massimo e minimo limite può essere introdotto anche più in generale per
il limite di una funzione arbitraria. Nella presente sezione viene considerata
brevemente tale possibilità.
Siano X un sottoinsieme di R, x0 ∈ R un punto di accumulazione per X
ed f : X → R una funzione reale. Se f non è limitata superiormente in alcun
intorno di x0 , il massimo limite viene assunto uguale a +∞ e analogamente
se f non è limitata inferiormente in alcun intorno di x0 , il minimo limite
viene assunto uguale a −∞. Nel seguito, pertanto, si escluderanno tali casi
e, poiché le nozioni che si vogliono introdurre sono di carattere locale, si
supporrà che la funzione f sia limitata (altrimenti basta sostituirla con una
restrizione ad un opportuno intorno di x0 in cui è limitata).
Capitolo 7: Successioni e serie numeriche
178
Se x0 ∈ R, per ogni δ > 0, si definiscono i numeri
e′′ (δ) := sup{f (x) | x ∈ X∩]x0 − δ, x0 + δ[r{x0 }} ,
e′ (δ) := inf{f (x) | x ∈ X∩]x0 − δ, x0 + δ[r{x0 }} .
La funzione δ 7→ e′′ (δ) da ]0, +∞[ in R è crescente e la funzione δ 7→ e′ (δ)
da ]0, +∞[ in R è decrescente e inoltre, per ogni δ1 > 0, δ2 > 0, risulta
e′ (δ1 ) ≤ e′′ (δ2 ). Dal teorema sul limite delle funzioni monotone, si possono
considerare i seguenti limiti
lim e′′ (δ)
δ→0+
(= inf e′′ (δ)) ,
δ>0
lim e′ (δ)
δ→0+
(= sup e′ (δ)) ,
δ>0
i quali vengono denominati massimo limite e rispettivamente minimo limite
di f in x0 e denotati con uno dei seguenti simboli
lim sup f (x) ,
x→x0
lim′′
x→x0
f (x) ,
lim′
x→x0
f (x) ,
lim f (x) ,
x→x0
e rispettivamente
lim inf f (x) ,
x→x0
lim f (x) .
x→x0
Se x0 = +∞ (rispettivamente, x0 = −∞), si procede in maniera analoga
definendo i seguenti numeri, per ogni c ∈ R,
e′′ (c)
(rispettivamente, e′′ (c)
:= sup{f (x) | x ∈ X∩]c, +∞[}
:= sup{f (x) | x ∈ X∩] − ∞, c[} )
e
e′ (c) := inf{f (x) | x ∈ X∩]c, +∞[}
(rispettivamente, e′ (c) := inf{f (x) | x ∈ X∩] − ∞, c[} ).
La funzione c 7→ e′′ (c) da R in R è ovviamente decrescente (rispettivamente,
crescente), mentre la funzione c 7→ e′ (c) da R in R è crescente (rispettivamente, decrescente) e per ogni c1 , c2 ∈ R, risulta e′ (c1 ) ≤ e′′ (c2 ). Il massimo
limite ed il minimo limite possono ora essere definiti tramite i seguenti limiti,
esistenti sempre per il teorema sul limite delle funzioni monotone
lim e′′ (c) ,
(rispettivamente,
lim e′ (c) ,
(rispettivamente,
c→+∞
e
c→+∞
lim e′′ (c) ),
c→−∞
lim e′ (c) ).
c→−∞
7.2 Serie numeriche
179
◃ Le proprietà caratteristiche del massimo e del minimo limite di una funzione possono essere ottenute in maniera esattamente analoga a quanto già
visto per le successioni. A causa della stretta analogia con il caso delle successioni, ci si limita a questo punto ad enunciare alcune proprietà omettendo
le dimostrazioni.
Proposizione 7.1.16 Si considerino un sottoinsieme X di R, un punto di
accumulazione x0 ∈ R per X ed una funzione reale f : X → R. Allora le
seguenti proposizioni sono equivalenti:
a) Esiste il limite lim f (x).
x→x0
b) lim sup f (x) = lim inf f (x) .
x→x0
x→x0
Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti, risulta
lim f (x) = lim sup f (x) = lim inf f (x) .
x→x0
x→x0
x→x0
◃ Se X è un sottoinsieme di R, x0 ∈ R è un punto di accumulazione per
X ed f : X → R è una funzione reale, si dice che f verifica la condizione di
Cauchy in x0 se
∀ ε > 0 ∃ I ∈ I(x0 ) t.c. ∀ x, y ∈ X ∩ I r {x0 } : |f (x) − f (y)| < ε .
Teorema 7.1.17 (Criterio di Cauchy per le funzioni)
Si considerino un sottoinsieme X di R, un punto di accumulazione x0 ∈ R
per X ed una funzione reale f : X → R. Allora, le seguenti proposizioni
sono equivalenti:
a) Esiste ed è finito il limite lim f (x).
x→x0
b) f verifica la condizione di Cauchy in x0 .
7.2
Serie numeriche
Lo studio delle serie numeriche trova diverse applicazioni in analisi riguardanti, ad esempio, la possibilità di esprimere le funzioni elementari come
somma di funzioni potenza ad esponente intero positivo, con il conseguente vantaggio di ricondurre il calcolo di limiti, derivate ed integrali a quello
di funzioni potenza oppure lo stretto legame con la teoria degli integrali
impropri su intervalli illimitati.
Capitolo 7: Successioni e serie numeriche
180
7.2.1
Definizioni e proprietà preliminari
Assegnata una successione (an )n∈N di numeri reali, per ogni m ∈ N, si
definisce somma parziale m-esima di (an )n∈N il numero sm definito come
segue
m
∑
sm :=
an .
n=0
La successione (sn )n∈N viene denominata serie di termine generale nesimo an ; i numeri sm , m ∈ N, vengono anche denominati somme parziali
della serie. Una serie viene in genere indicata con il simbolo
+∞
∑
an
n=0
e talvolta anche con a0 + a1 + · · · + an + . . . Il carattere della successione
(sn )n∈N viene indicato come carattere della serie; pertanto, si dice che una
serie è regolare, convergente, divergente positivamente oppure divergente
negativamente se tale è la successione delle sue somme parziali. Una serie
non regolare viene denominata indeterminata. Nel caso in cui la serie sia
regolare, il limite della successione delle somme parziali viene denominato
+∞
∑
somma della serie e denotato ancora con il simbolo
an ; sarà chiaro dal
n=0
contesto l’uso di tale simbolo.
Esplicitamente, se s ∈ R, si ha
s=
+∞
∑
an ⇐⇒ ∀ ε > 0 ∃ ν ∈ N t.c.∀ n ≥ ν : s −
n=0
Analogamente, si ha
se
n
∑
ak < ε .
k=0
+∞
∑
an = +∞ (rispettivamente
n=0
∀ M ∈ R ∃ ν ∈ N t.c.∀ n ≥ ν :
+∞
∑
an = −∞) se e solo
n=0
n
∑
ak > M
(rispettivamente < M ).
k=0
Una prima condizione necessaria per la convergenza di una serie può
essere ricavata facilmente dalle definizioni assunte.
Proposizione 7.2.1
Sia (an )n∈N una successione di numeri reali e si sup∑+∞
ponga che la serie n=0 an sia convergente. Allora limn→+∞ an = 0.
7.2 Serie numeriche
181
Dimostrazione. Si consideri la successione (sn )n∈N delle somme parziali della serie
∑
+∞
n=0 an e sia s ∈ R la somma della stessa serie. Allora
lim an =
n→+∞
lim (sn − sn−1 ) =
n→+∞
lim sn −
n→+∞
lim sn−1 = s − s = 0.
n→+∞
◃ La condizione precedente non è in generale sufficiente ad assicurare la
convergenza di una serie. Ad esempio, la successione (log(1 + 1/n))n≥1 è
ovviamente infinitesima, ma la somma parziale n-esima è data da
(
)
3
n+1
3 4
n+1
sn = log 2 + log + · · · + log
= log 2 · · · · ·
= log(n + 1) ,
2
n
2 3
n
∑+∞
e quindi la serie n=0 log(1 + 1/n) è divergente positivamente.
Esempio 7.2.2 (Serie geometrica)
Un esempio importante per il seguito è dato dalla serie
+∞
∑
an ,
n=0
con a ∈ R, la quale viene denominata serie geometrica di ragione a. Per
ogni n ∈ N, denotata con sn la somma parziale n-esima, risulta an+1 − 1 =
(a − 1)(an + an−1 + · · · + a + 1) = (a − 1)sn , e quindi, supposto a ̸= 1,
sn =
an+1 − 1
.
a−1
Da ciò consegue direttamente che, se |a| < 1, la serie è convergente e si ha
+∞
∑
n=0
an = lim sn =
n→+∞
1
.
1−a
Se a ≥ 1 oppure a ≤ −1, la successione (an )n∈N non è infinitesima e quindi
dalla Proposizione 7.2.1 la serie geometrica non può essere convergente.
Precisamente, se a ≥ 1, essa diverge positivamente (infatti, per ogni n ∈ N,
risulta sn ≥ n), mentre se a ≤ −1, la serie è indeterminata; infatti, si ha
sn ≥ 1 per n pari ed sn ≤ 0 per n dispari.
◃
Una prima condizione necessaria e sufficiente per la convergenza di una serie può
essere ricavata dal criterio di convergenza di Cauchy per le successioni.∑Sia (an )n∈N una
+∞
successione di numeri reali e sia n ∈ N. Il resto n-esimo della serie
n=0 an (oppure
serie resto di ordine n) è per definizione la nuova serie
+∞
∑
k=n+1
ak .
Capitolo 7: Successioni e serie numeriche
182
Si riconosce facilmente che una serie e le sue serie resto hanno lo stesso carattere e inoltre,
se una delle due è convergente risulta
+∞
∑
an = sn +
n=0
+∞
∑
ak .
k=n+1
∑
Dall’uguaglianza precedente segue che se la serie +∞
n=0 an è convergente, allora necessariamente la successione
(rn )n∈N dei resti n-esimi è infinitesima. Infatti, denotata con s
∑+∞
la somma della serie n=0 an , deve essere limn→+∞ rn = limn→+∞ s − sn = 0.
La somma parziale p-esima del resto n-esimo rn viene denominata resto parziale della
serie di indici n e p e viene denotato con rn,p ; quindi
rn,p =
n+p
∑
ak = sn+p − sn .
k=n+1
Si può ora enunciare il seguente criterio di convergenza di Cauchy, la cui dimostrazione è immediata conseguenza del Teorema 7.1.15 applicato alla successione delle somme
parziali.
Teorema 7.2.3 (Criterio di Cauchy per le serie numeriche)
Se (an )n∈N è una successione di numeri reali, le seguenti proposizioni sono equivalenti:
a) La serie
+∞
∑
an è convergente.
n=0
b)
lim
sup |rn,p | = 0 .
n→+∞ p∈N
Esempio 7.2.4 (Serie armonica) Si consideri la serie
+∞
∑
1
,
n
+
1
n=0
la quale viene denominata serie armonica. Per ogni n, p ∈ N si ha
|rn,p | =
n+p
∑
k=n+1
1
1
1
1
1
=
+
+ ··· +
≥p
;
k+1
n+2 n+3
n+p+1
n+p+1
considerando in particolare p = n + 1, si ottiene
|rn,n+1 | ≥
n+1
1
=
2n + 2
2
e quindi la b) del Teorema 7.2.3 non può essere verificata. Si conclude che
la serie armonica non è convergente. Osservando inoltre che la successione delle somme parziali risulta crescente, la serie dovrà essere divergente
positivamente.
◃
Alcune semplici operazioni algebriche sulle serie possono essere dedotte dai teoremi
sui limiti ∑
di successioni.
Si considerino due successioni (an )n∈N e (bn )n∈N di numeri reali
∑+∞
e le serie +∞
n=0 an e
n=0 bn si ha quanto segue
7.2 Serie numeriche
183
1) Se le due serie sono entrambe convergenti, anche la loro somma
convergente e si ha
+∞
+∞
+∞
∑
∑
∑
(an + bn ) =
an +
bn ;
n=0
n=0
∑+∞
n=0 (an
+ bn ) è
n=0
2) Se una delle due serie è divergente positivamente (rispettivamente, negativamente), e se le somme parziali dell’altra sono limitate inferiormente (rispettivamente,
superiormente) (in particolare, se l’altra serie è convergente), allora la serie
∑+∞
n=0 (an +bn ) risulta divergente positivamente (rispettivamente, negativamente).
∑+∞
∑+∞
3) Se la serie
n=0 an è convergente e se λ ∈ R, allora anche la serie
n=0 λan è
convergente e si ha
+∞
+∞
∑
∑
λan = λ
an .
n=0
n=0
∑
4) Se la serie +∞
(rispettivamente, negativamente)
n=0 an è divergente positivamente
∑+∞
e se λ > 0, allora anche la serie
positivamente (rispetn=0 λan è divergente
∑+∞
tivamente, negativamente). Se invece λ < 0, la serie
n=0 λan è divergente
negativamente (rispettivamente, positivamente).
7.2.2
Serie a termini positivi
∑+∞
Una serie n=0 an tale che an ≥ 0 per ogni n ∈ N viene denominata serie
a termini positivi ; se an > 0 per ogni n ∈ N si dice anche che la serie è
a termini strettamente positivi . Per tali serie è possibile stabilire diversi
criteri di convergenza, la cui validità può essere estesa alle serie a termini
definitivamente positivi per le quali la condizione an ≥ 0 è verificata per
ogni n ≥ ν, con ν ∈ N opportuno ed anche, con ovvie modifiche, alle serie
negative oppure definitivamente negative.
Inoltre conviene tenere presente che una serie a termini positivi può essere sempre ricondotta ad una serie a termini strettamente positivi trascurando i termini uguali a 0. Pertanto non sarà restrittivo all’occorrenza supporre che la serie sia a termini strettamente positivi anziché semplicemente
positivi.
Una proprietà rilevante delle serie a termini positivi è il fatto che la
successione delle somme parziali risulta crescente e pertanto essa potrà essere convergente (se le somme parziali sono limitate superiormente) oppure
divergente positivamente (se le somme parziali non sono∑
limitate superior+∞
mente). In tema di notazioni, per indicare che una serie n=0 an a termini
positivi è convergente, si scrive spesso
+∞
∑
an < +∞ .
n=0
Da quanto osservato segue anche che una serie indeterminata deve avere necessariamente infiniti termini strettamente positivi ed infiniti termini
strettamente negativi.
Capitolo 7: Successioni e serie numeriche
184
Un primo criterio elementare di confronto si può ricavare direttamente
dai teoremi di confronto per i limiti.
Proposizione 7.2.5 (Primo criterio di confronto per le serie a termini positivi)
∑+∞
∑+∞
Si considerino due serie n=0 an e n=0 bn a termini positivi e si supponga
che esista ν ∈ N tale che, per ogni n ≥ ν, risulti an ≤ bn . Allora
∑+∞
∑+∞
1) Se la serie
n=0 bn è convergente, lo è anche la serie
n=0 an e
risulta
+∞
+∞
∑
∑
an ≤
bn .
n=0
2) Se la serie
∑+∞
n=0 bn .
◃
∑+∞
n=0
n=0
an è divergente positivamente, lo è anche la serie
Il criterio precedente può essere applicato nel caso seguente.
Corollario 7.2.6 (Secondo
confronto per le serie a termini positivi)
∑di
∑+∞criterio
+∞
Si considerino due serie
n=0 bn a termini strettamente positivi e si supn=0 an e
ponga che esista il limite limn→+∞ an /bn = ℓ. Allora
1) Se 0 < ℓ < +∞, le due serie hanno lo stesso carattere.
∑+∞
∑+∞
bn è convergente, anche la serie
2) Se ℓ = 0 e se la serie
n=0 an è conn=0
∑+∞
an è divergente positivamente, anche la serie
vergente. Se invece la serie
n=0
∑+∞
n=0 bn è divergente positivamente.
∑
∑
converge,
a è convergente, anche la serie +∞
3) Se ℓ = +∞ e se la serie +∞
n=0 bn
∑
∑+∞ n=0 n
mentre se la serie n=0 bn è divergente positivamente anche la serie +∞
n=0 an è
divergente positivamente.
Dimostrazione. 1) Dalla definizione di limite, esiste ν ∈ N tale che ℓ/2 < an /bn < 3ℓ/2
per ogni n ≥ ν, da cui
ℓ
3ℓ
b n < an <
bn .
2
2
Applicando il primo criterio di confronto (Proposizione 7.2.5) tenendo conto di entrambe
le diseguaglianze, si deduce che le due serie hanno lo stesso carattere.
2) Dalla definizione di limite, esiste ν ∈ N tale che −1 < an /bn < 1 per ogni n ≥ ν, da
cui, in particolare, an < bn . Allora, dalla Proposizione 7.2.5, segue interamente la tesi.
3) Basta applicare il caso 2) invertendo i ruoli delle due serie e tenendo presente che, nel
caso in esame, limn→+∞ bn /an = 0.
◃ A questo punto si possono enunciare i criteri di convergenza maggiormente utilizzati nelle applicazioni.
Teorema 7.2.7 (Criterio del rapporto di D’Alembert per le serie
a termini positivi)
+∞
∑
Sia
an una serie a termini strettamente positivi. Allora
n=0
7.2 Serie numeriche
185
∑
an+1
< 1, allora la serie
an è convergente.
n→+∞ an
n=0
(
)
an+1
2) Se la successione
è definitivamente maggiore o uguale di
an n∈N
+∞
∑
1, allora la serie
an è divergente positivamente.
+∞
1) Se lim sup
n=0
an+1
; poiché ℓ′′ < 1, si può considerare ℓ′′ <
an
q < 1 e dalla prima proprietà caratteristica del massimo limite (applicata con ε := q − ℓ′′ )
esiste ν ∈ N tali che, per ogni n ≥ ν, an+1 /an < q, da cui an+1 < qan . Si riconosce ora
che, per ogni n ≥ ν, risulta an ≤ q n−ν aν ; infatti, tale proprietà è ovviamente vera per
n = ν e, supposta vera per un ∑
certo n ≥ ν, si ha an+1 < q · q n−ν aν = q n+1−ν aν . Poiché
n
0 < q < 1, la serie geometrica +∞
n=0 q è convergente e quindi, per la Proposizione 7.2.5,
∑
lo è anche la serie +∞
a
.
n=0 n
2) Dalle ipotesi fatte, segue che la successione (an )n∈N è definitivamente crescente e
Dimostrazione. 1) Si ponga ℓ′′ := lim sup
n→+∞
quindi, essendo a termini positivi, essa non può essere infinitesima. Dalla Proposizione
∑
7.2.1, segue che la serie +∞
n=0 an non è convergente e quindi essa deve essere divergente
positivamente.
an+1
◃ Si supponga che esista il lim
e lo si denoti con ℓ. Allora, la
n→+∞ an
∑+∞
serie n=0 an è convergente se ℓ < 1 (in tal caso infatti ℓ′′ = ℓ < 1) ed è
divergente positivamente se ℓ > 1 (in tal caso, infatti, si ha an+1 /an > 1
definitivamente); se ℓ = 1, non si può invece dire nulla.
◃ Ad esempio, si consideri la serie
+∞ n
∑
a
,
n!
n=0
a∈R.
Per ogni n ∈ N, posto an := an /n!, risulta
an+1
an+1 n!
a
=
=
n
an
(n + 1)! a
n+1
e quindi limn→+∞ an+1 /an = 0. Dal Teorema 7.2.7 segue allora che la serie
è convergente per ogni a ∈ R.
Teorema 7.2.8 (Criterio della radice di Cauchy per le serie a termini positivi)
Sia (an )n∈N una successione di numeri reali positivi. Allora:
∑+∞
√
1) Se lim sup n an < 1, la serie n=0 an è convergente.
n→+∞
Capitolo 7: Successioni e serie numeriche
186
2) Se lim sup
n→+∞
∑+∞
√
n
an > 1, la serie n=0 an è divergente positivamente.
√
Dimostrazione. 1) Si ponga ℓ′′ := lim supn→+∞ n an e si consideri q ∈ R tale che
ℓ′′ < q < 1; dalla prima proprietà caratteristica del massimo limite, esiste ν ∈ N tale che,
√
per ogni n ≥ ν, si abbia n an < q, e quindi an < q n . Poiché q < 1, la serie geometrica
∑+∞ n
e quindi, per il primo criterio di confronto (Proposizione 7.2.5),
n=0 q è convergente
∑
anche la serie +∞
a
è
convergente.
n
n=0
2) Dalla seconda proprietà caratteristica del massimo limite applicata con ε = ℓ′′ − 1,
segue che l’insieme {n ∈ N | an > 1} è infinito e quindi la successione (an )n∈N non può
∑+∞
essere infinitesima. Dalla Proposizione 7.2.1 segue che la serie
n=0 an non può essere
convergente e pertanto essa è necessariamente divergente positivamente.
√
◃ Ovviamente, anche in questo caso se esiste il limite limn→+∞ n an = ℓ,
la serie è convergente se ℓ < 1 ed è divergente positivamente se ℓ > 1, mentre
non si può dire nulla nel caso ℓ = 1.
∑+∞
◃ Ad esempio, si consideri la serie n=0 an , dove
{ −n
2 ,
n pari;
an =
3−n ,
n dispari.
√
Si ha lim supn→+∞ n an = max{1/2, 1/3} = 1/2 e quindi dal Teorema 7.2.8,
la serie è convergente. Si osservi che il criterio del rapporto in questo caso
non è applicabile.
Si enuncia ora un ulteriore criterio generale di convergenza.
Teorema 7.2.9 (Criterio di Raabe-Duhamel per le serie a termini
positivi)
Sia (an )n∈N una successione di numeri reali strettamente positivi. Si ha
quanto segue:
1) Se esistono q > 1 e ν ∈ N tali che, per ogni n ≥ ν, si abbia
(
)
an
n
−1 ≥q ,
an+1
allora la serie
∑+∞
n=0
an è convergente.
2) Se esiste ν ∈ N tale che, per ogni n ≥ ν, si abbia
(
)
an
n
−1 ≤1,
an+1
allora la serie
∑+∞
n=0
an è divergente positivamente.
7.2 Serie numeriche
187
Dimostrazione. 1) Per ogni n ≥ ν, si ha q · an+1 − an+1 ≤ n(an − an+1 ) − an+1 e quindi
nan − (n + 1)an+1
.
q−1
∑+∞
Denotata con sn la somma parziale n-esima della serie
n=0 an , da quest’ultima relazione segue, per ogni n ≥ ν,
an+1 ≤
sn+1
=
≤
=
≤
sν + aν+1 + · · · + an+1
νaν − (ν + 1)aν+1
nan − (n + 1)an+1
sν +
+ ··· +
q−1
q−1
νaν
(n + 1)an+1
sν +
−
q−1
q−1
νaν
sν +
.
q−1
Quindi le somme parziali della serie in esame sono limitate superiormente da cui la
convergenza della serie
2) Dalle ipotesi segue, per ogni n ≥ ν, nan ≤ (n + 1)an+1 e quindi, in particolare,
νaν ≤ (n + 1)an+1 ; allora, per ogni n ≥ ν, si ha an+1 ≥ νaν /(n + 1); poiché la serie
∑+∞
armonica
n=0 1/(n + 1) è divergente positivamente, si conclude che anche la serie in
esame è divergente positivamente.
Anche ora l’esistenza del limite
(
)
an
lim n
−1 =ℓ,
n→+∞
an+1
∑+∞
consente di affermare la convergenza della serie n=0 an nel caso ℓ > 1 e la
sua divergenza positiva nel caso ℓ < 1, mentre il caso ℓ = 1 non consente di
dire nulla.
Esempio 7.2.10 (Serie armonica generalizzata)
Si consideri la serie
+∞
∑
1
(n
+
1)p
n=0
con p ∈]0, +∞[, la quale viene denominata serie armonica generalizzata di
ordine p (o semplicemente serie armonica se p = 1).
Poiché
(
)
(
)
1/(n + 1)p
(n + 2)p
lim n
−1
=
lim n
−1
n→+∞
n→+∞
1/(n + 2)p
(n + 1)p
((
)p
)
1
=
lim n
1+
−1
n→+∞
n+1
n (1 + 1/(n + 1))p − 1
=p,
=
lim
n→+∞ n + 1
1/(n + 1)
Capitolo 7: Successioni e serie numeriche
188
applicando il criterio di Raabe-Duhamel, si riconosce che la serie armonica
generalizzata è convergente se p > 1 ed è divergente positivamente se p < 1;
nel caso p = 1, si è già riconosciuto direttamente che essa risulta ancora
divergente positivamente. Si osservi che a tale serie non era applicabile né
il criterio del rapporto né quello della radice.
◃ Nel caso di successioni decrescenti, vi è un ulteriore strumento molto
utile nelle applicazioni.
Teorema 7.2.11 (Criterio di condensazione di Cauchy per le serie
a termini positivi)
Sia (an )n∈N una successione decrescente di numeri reali positivi.
Allora le due serie
+∞
∑
+∞
∑
an ,
n=0
2n a2n ,
n=0
sono entrambe convergenti oppure entrambe divergenti positivamente.
Dimostrazione. Si indichi con sn la somma parziale n-esima della serie
∑
n
n
σn quella della serie +∞
n=0 2 a2 .
Per ogni k ∈ N, si ha
2k+1
∑−1
∑+∞
n=0
an e con
aj ≤ 2k a2k ,
j=2k
in quanto il primo membro è somma di 2k addendi ognuno dei quali è minore o uguale
al primo addendo a2k (a causa della decrescenza della successione (an )n∈N ). Sommando
per k = 0, . . . , n si ha
s2n+1 −1 =
2n+1
∑−1
k=1
k+1
ak =
n 2 ∑−1
∑
aj ≤
n
∑
2k a2k = σn ,
k=0
k=0 j=2k
e quindi la convergenza della seconda serie implica quella della prima.
Viceversa, procedendo in maniera analoga, per ogni k ≥ 1,
k
1 k
2 a2k = 2k−1 a2k ≤
2
2
∑
aj
j=2k−1 +1
(il numero degli addendi a secondo è infatti 2k − 2k−1 − 1 + 1 = 2 · 2k−1 − 2k−1 = 2k−1
ed ognuno di essi è maggiore o uguale di quello con l’indice maggiore, cioè a2k ) e quindi,
sommando per k = 1, . . . , n,
)
( n
2n
n
∑
1
1∑ k
1 ∑ k
ak = s2n − a0 − a1 ;
2 a2k ≤
(σn − a1 ) =
2 a2 k + a1 − a1 =
2
2 k=1
2 k=1
k=2
da ciò segue che la convergenza della prima serie implica quella della seconda.
7.2 Serie numeriche
189
◃ Ad esempio, si consideri la serie
+∞
∑
1
,
n
|
log
n|p
n=2
p ∈]0, +∞[ .
Posto an := 1/(n | log n|p ), si ha
2n a2n = 2n
1
1
= p
2n | log 2n |p
n | log 2|p
e inoltre la successione (an )n≥2 è decrescente. Poiché la serie armonica
generalizzata è convergente per p > 1 e divergente positivamente per p ≤ 1,
dal Teorema 7.2.11, segue che la serie in esame si comporta allo stesso modo.
◃ Nelle applicazioni i criteri precedenti possono essere utilizzati anche per
serie che non hanno segno costante, riferendoli alla serie dei valori assoluti,
che è in ogni caso a termini positivi.
Infatti, se (an )n∈N è una successione arbitraria di numeri reali, si può
considerare la serie
+∞
∑
|an |
n=0
di termine generale n-esimo |an |; tale serie è a termini positivi e quindi deve
essere o convergente o∑
divergente positivamente.
+∞
Si dice che la serie n=0 an è assolutamente convergente (rispettivamen∑+∞
te, assolutamente divergente) se la serie n=0 |an | è convergente (rispettivamente, divergente positivamente).
La condizione di assoluta convergenza è più restrittiva della convergenza
di una serie, come si riconosce nella proposizione successiva.
Proposizione
7.2.12 Sia (an )n∈N una successione di numeri reali. Se la
∑+∞
serie n=0 an è assolutamente convergente, allora essa è anche convergente.
Dimostrazione.
Sia ε > 0; dal criterio di convergenza di Cauchy applicato alla serie
∑+∞
n=0 |an |, esiste ν ∈ N tale che, per ogni n ≥ ν e per ogni p ∈ N, risulti
n+p
∑
|ak | < ε .
k=n+1
Allora si ha anche
n+p
∑
k=n+1
ak ≤
n+p
∑
|ak | < ε ,
k=n+1
e quindi, sempre dal criterio di convergenza di Cauchy segue che la serie
convergente.
∑+∞
n=0
an è
190
Capitolo 7: Successioni e serie numeriche
Viceversa, una serie può essere convergente senza essere assolutamente
convergente; in tal caso si dice anche che la serie è semplicemente convergente (oppure semiconvergente).
Se la serie dei valori assoluti di una serie assegnata verifica qualcuno
dei criteri di convergenza precedenti, la serie risulterà assolutamente convergente e quindi, dalla Proposizione 7.2.12, risulterà a maggior ragione
convergente.
Invece, il fatto che una serie sia assolutamente divergente non comporta
che essa non possa essere convergente.
Un ulteriore criterio di convergenza assoluta si ottiene applicando la
Proposizione 7.2.5 alla serie armonica generalizzata.
Teorema
∑+∞ 7.2.13 (Criterio dell’ordine di infinitesimo per le serie)
Sia n=0 an una serie arbitraria di numeri reali. Allora
1) Se la successione (an )n∈N è un
infinitesimo di ordine maggiore o
∑+∞
uguale di α, con α > 1, la serie n=0 an è assolutamente convergente.
2) Se la successione
(an )n∈N è un infinitesimo di ordine minore o uguale
∑+∞
di 1, la serie n=0 an è assolutamente divergente.
Dimostrazione. 1) Poiché la successione (an )n∈N è un infinitesimo di ordine maggiore
o uguale di α, con α > 1, si ha limn→+∞ nα |an | = ℓ con ℓ ∈ R (eventualmente, può
anche accadere ℓ = 0). Dalla definizione di limite si ottiene l’esistenza di ν ∈ N tale
che, per ∑
ogni n ≥ ν, risulti nα |an | ≤ ℓ + 1, da cui |an | ≤ (ℓ + 1)/nα . Poiché la serie
+∞
α è convergente (si veda l’Esempio 7.2.10), dalla Proposizione 7.2.5
(ℓ + 1)
n=0 1/n
∑
segue che anche la serie +∞
n=0 |an | è convergente.
2) Poiché la successione (an )n∈N è un infinitesimo di ordine minore o uguale di 1, si ha
limn→+∞ n|an | = ℓ con ℓ > 0 oppure ℓ = +∞ (se l’ordine di infinitesimo è minore di
1). Dalla definizione di limite, considerato β > 0 tale che β < ℓ, esiste ν ∈ N tale che,
∑
per ogni n ≥ ν, si abbia n|an | ≥ β, da cui |an | ≥ β/n. La serie +∞
n=1 β/n è divergente
∑
positivamente (Esempio 7.2.4) e quindi, dalla Proposizione 7.2.5, anche la serie +∞
n=0 |an |
è divergente positivamente.
7.2.3
Serie alternanti
Si studia ora un ulteriore criterio di convergenza per serie che non sono a
termini positivi.
Sia (an )n∈N ∑
una successione di numeri reali positivi (oppure negativi).
+∞
n
Allora la serie
n=0 (−1) an viene denominata a segni alterni (oppure
alternante). Si ha il seguente criterio di convergenza.
Teorema 7.2.14 (Criterio di Leibnitz per le serie alternanti)
Sia (an )n∈N una successione decrescente
di numeri reali po∑+∞ed infinitesima
n
sitivi. Allora, la serie alternante
(−1)
a
è
convergente
e inoltre,
n
n=0
7.2 Serie numeriche
191
denotata con s la sua somma e, per ogni n ∈ N, con sn la somma parziale
n-esima, si ha
|s − sn | ≤ an+1 .
(7.2.1)
Dimostrazione. Tenendo presente che la successione (an )n∈N è decrescente, valgono le
relazioni
s2(n+1) = s2n − a2n+1 + a2n+2 ≤ s2n ,
(1)
s2(n+1)+1 = s2n+1 − a2n+2 + a2n+3 ≥ s2n+1 ,
(2)
s2n − s2n+1 = a2n+1 .
(3)
Dalle uguaglianze (1) e (2) segue che la successione estratta (s2n )n∈N è decrescente,
mentre la successione estratta (s2n+1 )n∈N è crescente; inoltre, dalla (3), s2n+1 ≤ s2n per
ogni n ∈ N e quindi s1 ≤ s2n e s2n+1 ≤ s0 . Dunque, le successioni (s2n )n∈N e (s2n+1 )n∈N
sono monotone e limitate e quindi, dal Teorema 7.1.2, esse sono convergenti. Posto
s = limn→+∞ s2n e tenendo presente che la successione (an )n∈N è infinitesima, si ha
anche limn→+∞ s2n+1 = limn→+∞ s2n − a2n+1 = limn→+∞ s2n − limn→+∞ a2n+1 = s.
Infine, dalla monotonia delle successioni (s2n )n∈N e (s2n+1 )n∈N e dalla (3) segue, per
ogni n ∈ N,
|s − s2n |
=
s2n − s ≤ s2n − s2n+1 = a2n+1 ,
|s − s2n+1 |
=
s − s2n+1 ≤ s2n+2 − s2n+1 = a2n+2 ;
quindi sia nel caso in cui n sia pari o dispari si ha |s − sn | ≤ an+1 ; da ciò segue che la
successione (sn )n∈N delle somme parziali converge verso s e vale la (7.2.1).
La (7.2.1) si può enunciare dicendo che l’errore commesso approssimando
la somma di una serie a termini alterni con una somma parziale è minore o
uguale del valore assoluto del primo termine trascurato.
Esempio 7.2.15 (Serie armonica a segni alterni)
Si consideri la serie
+∞
∑
1
(−1)n
,
(n + 1)p
n=0
con p ∈]0, +∞[, la quale viene denominata serie armonica a segni alterni
di ordine p; se p = 1, essa viene denominata semplicemente serie armonica
a segni alterni.
Si è già visto che tale serie è assolutamente convergente (e quindi convergente per la Proposizione 7.2.12) se p > 1. Se p ≤ 1, si può tener presente
che la successione (n−p )n≥1 è decrescente ed infinitesima e quindi per il criterio di Leibnitz la serie risulta ancora convergente (ma non assolutamente).
Infine, denotata con s la somma della serie, per ogni n ≥ 1, dalla (7.2.1)
segue
n
∑
1
1
s−
(−1)k
.
≤
(k + 1)p
(n + 2)p
k=0
Capitolo 7: Successioni e serie numeriche
192
7.2.4
Proprietà algebriche
Alcune proprietà algebriche elementari delle serie numeriche sono state già
considerate in precedenza. Si esamina ora il comportamento delle serie
numeriche rispetto ad ulteriori operazioni algebriche.
La prima operazione che si prende in considerazione è quella di prodotto
secondo Cauchy di due serie numeriche.
∑+∞
∑+∞
◃ Siano
n=0 an e
n=0 bn due serie numeriche di numeri reali. Si
definisce serie prodotto secondo Cauchy delle due serie, e si denota con
+∞
∑
an ·
n=0
la serie
∑+∞
n=0 cn
+∞
∑
bn ,
n=0
di termine n-esimo
cn :=
n
∑
ak bn−k .
(7.2.2)
k=0
Il termine n-esimo della serie prodotto secondo Cauchy si ottiene sommando i prodotti dei termini delle due serie la cui somma degli indici è
uguale ad n. Nel diagramma seguente, che conviene tener presente per le
diseguaglianze utilizzate nella proposizione successiva, i termini della serie prodotto si ottengono sommando gli elementi delle diagonali. Quindi
la somma parziale n-esima della serie prodotto secondo Cauchy si ottiene sommando tutti gli elementi che si trovano al di sotto della diagonale
n-esima.
∑+∞
∑+∞
Proposizione 7.2.16 Siano
n=0 bn due serie assolutamenn=0 an e
te
convergenti
di
numeri
reali.
Allora
la
serie
prodotto secondo Cauchy
∑+∞
è assolutamente convergente.
n=0 cn definita dalla (7.2.2)
∑+∞
∑+∞
∑+∞
Inoltre, posto s :=
n=0 cn , risulta
n=0 bn e u :=
n=0 an , t :=
u = s · t.
∑+∞
∑
a termini
Dimostrazione. Si supponga dapprima che le serie +∞
n=0 bn siano∑
n=0 an e
positivi e, per ogni n ∈ N, si denoti con sn la somma parziale n-esima della serie +∞
n=0 an ,
∑+∞
con tn la somma parziale n-esima della serie n=0
bn ed infine con un la somma parziale
∑
n-esima della serie +∞
n=0 cn . Allora, per ogni n ∈ N, si ha
un
=
a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 bn + a1 bn−1 + · · · + an−1 b1 + an b0 )
≤
a0 (b0 + · · · + bn ) + · · · + an (b0 + · · · + bn )
=
(a0 + · · · + an )(b0 + · · · + bn )
=
sn tn
≤
a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 b2n + a1 b2n−1 + · · · + a2n−1 b1 + a2n b0 )
=
u2n .
7.2 Serie numeriche
•
b7
•
b6
•
b5
•
b4
•
b3
•
b2
•
b1
•
b0
193
a b
• 0 7
@
@
@• a1 b6
@
@ ab
• 2 5
@
@
@ a3 b4
•
@
@
@ a4 b3
•
@
@
@ a 5 b2
•@
@
@• a6 b1
@
@
@• a7 b0
a0
•
a1
•
a2
a3
•
a4
•
•
a5
•
a6
•
a7
•
Figura 7.1: Prodotto secondo Cauchy di due serie
Per l’ultima diseguaglianza conviene tener presente che gli elementi al di sotto della
diagonale n-esima appartengono a quelli interni al quadrato avente come vertici gli elementi a0 b0 , an b0 , an bn e a0 bn e che questi ultimi si trovano al di sotto della diagonale
2n-esima.
Dalla diseguaglianza un
sn tn , tenendo presente che la successione (un )n∈N è cre∑≤
+∞
scente, segue che la serie
n=0 cn è convergente. Inoltre, dalla diseguaglianza un ≤
sn tn ≤ u2n , segue u ≤ s · t ≤ u, da cui segue interamente
la tesi. ∑
∑+∞
+∞
Si considera ora il caso generale. Poiché le serie
n=0 bn sono asson=0 an e
lutamente
convergenti,
dalla
prima
parte
dimostrata
segue
che
la
serie
prodotto delle
∑+∞
∑+∞
serie
n=0 |an | e
n=0 |bn | è convergente. Il termine n-esimo di tale serie è dato da
∑
n
k=0 |ak bn−k |; poiché, per ogni n ∈ N,
n
∑
ak bn−k ≤
|ak bn−k | ,
k=0
k=0
— la serie prodotto secondo Cauchy di
Infine, si riconosce facilmente che
|sn tn − un | ≤
n
∑
∑+∞
2n
∑
k=0
n=0
an e
∑+∞
|ak bn−k | −
n=0 bn
n
∑
k=0
è assolutamente convergente.
|ak bn−k | ,
194
Capitolo 7: Successioni e serie numeriche
e quindi, passando al limite per n → +∞, si ha limn→+∞ |sn tn −un | = 0, da cui u = s·t.
t
◃ Si potrebbe riconoscere, ma si omette per brevità la dimostrazione, che
la serie prodotto secondo Cauchy converge anche se una sola delle due serie
è assolutamente convergente e l’altra è convergente (Teorema di Mertens).
Inoltre, se due serie sono convergenti, la serie prodotto secondo Cauchy
non può risultare divergente positivamente né divergente negativamente,
ma deve essere necessariamente convergente oppure indeterminata. Nel caso
in cui la serie prodotto secondo Cauchy sia convergente, vale in ogni caso
l’uguaglianza con il prodotto delle somme delle due serie.
◃ Si è già osservato che l’alterazione di un numero finito di termini di una
serie non influisce sul suo carattere. Si esaminano ora alcune proprietà delle
serie che riguardano invece l’alterazione di un numero non necessariamente
finito di termini. Per brevità, si omettono le dimostrazioni delle proprietà
successive.
∑+∞
◃ Se n=0 an è una serie di numeri reali e se (k(n))n∈N è una successione
strettamente crescente di interi positivi tale che k(0) = 0, la serie


k(n+1)−1
+∞
∑
∑

aj 
n=0
j=k(n)
∑k(n+1)−1
∑+∞
di termine n-esimo j=k(n) aj si dice ottenuta dalla serie n=0 an raggruppandone i termini.
La proprietà
∑+∞ di completa additività delle serie convergenti asserisce che
se la serie n=0 an è convergente (rispettivamente, divergente positivamente, divergente negativamente, assolutamente convergente, assolutamente divergente), allora anche le serie ottenute da essa raggruppandone i termini
sono convergenti (rispettivamente, divergenti positivamente, divergenti negativamente, assolutamente convergenti, assolutamente divergenti) e le loro
somme coincidono.
Conviene osservare che una serie ottenuta raggruppando i termini può
essere convergente senza che lo sia la serie di partenza. In particolare,
se una serie è indeterminata, non è detto che una serie ottenuta da essa
raggruppandone
i termini sia anch’essa indeterminata. Ad esempio, la serie
∑+∞
n
(−1)
è
indeterminata
in quanto il termine n-esimo non è infinitesimo,
n=0
ma se si considera la successione (2n)n∈N strettamente crescente di interi si
ottiene una serie con tutti i termini nulli che quindi converge a 0.
◃ Si considera infine una estensione
della proprietà commutativa della
∑+∞
somma di numeri reali. Se n=0 an è una serie di numeri reali e se σ :
7.2 Serie numeriche
195
N → N è una permutazione
∑+∞ dell’insieme N (cioè, una funzione bigettiva di
N in N), allora la serie n=0 aσ(n) di termine n-esimo aσ(n) si dice ottenuta
∑+∞
dalla serie
n=0 an riordinandone i termini. Inoltre, si dice che la serie
∑+∞
a
è
incondizionatamente
convergente se ogni serie da essa ottenuta
n
n=0
riordinandone i termini è convergente e si ha
+∞
∑
n=0
aσ(n) =
+∞
∑
an .
n=0
Si può riconoscere che una serie è incondizionatamente convergente se e
solo se essa è assolutamente convergente.
Capitolo 8
Funzioni continue
Una delle proprietà più importanti delle funzioni elementari riguarda il fatto che il limite in un punto x0 in cui la funzione è definita si può determinare semplicemente calcolando la funzione in x0 . Tale proprietà viene
approfondita nel presente capitolo.
8.1
Definizioni e proprietà preliminari
Definizione 8.1.1 Siano X un sottoinsieme non vuoto di R, x0 ∈ X ed
f : X → R una funzione reale. Si dice che f è continua in x0 se verifica la
seguente condizione
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X∩]x0 − δ, x0 + δ[: |f (x) − f (x0 )| < ε .
Se x0 ∈ X non è un punto di accumulazione per X, la condizione precedente è sempre soddisfatta (basta considerare δ > 0 tale che X∩]x0 −
δ, x0 + δ[r{x0 } = ∅), mentre se x0 è di accumulazione per X, la condizione
precedente equivale all’esistenza del limite di f in x0 ed alla condizione
lim f (x) = f (x0 ) .
x→x0
◃ Se A è un sottoinsieme di X, si dice che f è continua in A se f è continua
in ogni x0 ∈ A. Infine, si dice che f è continua, se essa è continua in X.
◃ In modo analogo si forniscono le definizioni di funzione continua a sinistra e continua a destra; precisamente, si dice che f è continua a destra
(rispettivamente, continua a sinistra) in x0 se verifica la seguente condizione
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X ∩ [x0 , x0 + δ[: |f (x) − f (x0 )| < ε
Capitolo 8: Funzioni continue
198
(rispettivamente,
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X∩]x0 − δ, x0 ] : |f (x) − f (x0 )| < ε ).
Si riconosce facilmente che se x0 è un punto di accumulazione a destra
(rispettivamente, a sinistra) per X, allora f è continua a destra (rispettivamente, a sinistra) in x0 se e solo se esiste il limite destro (rispettivamente,
sinistro) di f in x0 e si ha
lim f (x) = f (x0 )
(rispettivamente, lim f (x) = f (x0 ) ).
x→x−
0
x→x+
0
◃ Ad esempio, la funzione f :] − 1, +∞[→ R definita ponendo, per ogni
x ∈] − 1, +∞[,
{
log(1 + x)
,
x ̸= 0
f (x) :=
x
1,
x=0,
è continua nel punto x0 = 0.
◃ Invece, la funzione f : R → R definita ponendo, per ogni x ∈ R,
{ 1/x
e
,
x ̸= 0
f (x) :=
0,
x=0,
è continua a sinistra in x0 = 0, ma non a destra in quanto limx→0+ e1/x =
+∞.
◃ Un punto in cui una funzione f : X → R è definita ma non è continua,
viene denominato punto di discontinuità per f . Si osservi che un punto di
discontinuità x0 ∈ X deve essere necessariamente di accumulazione per X
e quindi in un tale punto si può considerare il limite di f ma, se esiste, non
deve coincidere con f (x0 ). A seconda del comportamento di tale limite, si
possono classificare diversi tipi di punti di discontinuità di seguito specificati.
Siano X un sottoinsieme non vuoto di R, f : X → R una funzione reale
ed x0 ∈ X un punto di discontinuità per f .
1) Si dice che x0 è un punto di discontinuità eliminabile per f se esiste
ed è finito il limx→x0 f (x) e si ha
lim f (x) ̸= f (x0 ) .
x→x0
2) Si dice che x0 è un punto di discontinuità di prima specie per f se
esistono e sono finiti il limite sinistro limx→x− f (x) ed il limite destro
0
limx→x+ f (x) e si ha
0
lim f (x) ̸= lim+ f (x) .
x→x−
0
x→x0
8.1 Definizioni e proprietà preliminari
199
3) In tutti i casi rimanenti, cioè se uno dei due limiti da sinistra o
da destra non esiste oppure è infinito, si dice che x0 è un punto di
discontinuità di seconda specie.
◃ Se x0 è un punto di discontinuità eliminabile per f , si può definire la
funzione f˜ : X → R ponendo, per ogni x ∈ X,
{
f (x) ,
x ̸= x0 ,
f˜(x) :=
lim f (x) ,
x = x0 ,
x→x0
la quale risulta continua in x0 ; ciò giustifica la denominazione data a questo
tipo di discontinuità.
np Se x0 ∈ X è un punto di discontinuità di prima specie, esso è necessariamente di accumulazione sia a sinistra che a destra per X e non è possibile
ridefinire la funzione nel punto x0 in modo da ottenere una funzione continua. Si possono tuttavia definire le funzioni f˜− : X → R e f˜+ : X → R
ponendo, per ogni x ∈ X,
{
{
f (x) ,
x ̸= x0 ,
f (x) ,
x ̸= x0 ,
f˜+ (x) :=
f˜− (x) :=
x = x0 ,
lim f (x) ,
x = x0 ,
lim f (x) ,
x→x−
0
x→x+
0
le quali sono la prima continua solamente a sinistra in x0 e la seconda
continua solamente a destra in x0 .
Il numero reale
s(x0 ) := lim f (x) − lim f (x)
x→x+
0
x→x−
0
viene denominato salto della funzione f nel punto x0 .
◃ Ad esempio, la funzione segno sign : R → R definita ponendo, per ogni
x ∈ R,
{
|x|/x ,
x ̸= 0 ,
sign(x) :=
0,
x=0,
ha una discontinuità di prima specie nel punto 0 ed il salto della funzione
nel punto 0 è uguale a 2.
◃ Un noto esempio di funzione che presenta discontinuità di seconda specie
in ogni punto del suo insieme di definizione è la funzione di Dirichlet d :
[0, 1] → R definita ponendo, per ogni x ∈ [0, 1],
{
1,
x ∈ [0, 1] ∩ Q ,
d(x) :=
(8.1.1)
0,
x ∈ [0, 1] ∩ (R r Q) .
◃ Dai teoremi sui limiti, segue subito il seguente risultato riguardante le
operazioni sulle funzioni continue.
200
Capitolo 8: Funzioni continue
Teorema 8.1.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ X un punto
di accumulazione per X ed f : X → R e g : X → R funzioni reali. Allora:
1) Se f e g sono continue in x0 , anche la funzione somma f +g è continua
in x0 ; conseguentemente, se f e g sono continue, f + g è continua.
2) Se f e g sono continue in x0 , anche la funzione prodotto f ·g è continua
in x0 ; conseguentemente, se f e g sono continue, f · g è continua.
In particolare, se λ ∈ R ed f è continua in x0 , anche la funzione λ · f
è continua in x0 ; conseguentemente, se f è continua, λ · f è anch’essa
continua.
3) Se, per ogni x ∈ X, f (x) ̸= 0 ed f è continua in x0 , anche la funzione
reciproca 1/f è continua in x0 ; conseguentemente, se f è continua,
anche 1/f è continua.
4) Se, per ogni x ∈ X, g(x) ̸= 0 ed f e g sono continue in x0 , anche la
funzione quoziente f /g è continua in x0 ; conseguentemente, se f e g
sono continue, f /g è continua.
Teorema 8.1.3 (Continuità delle funzioni composte)
Siano X e Y sottoinsiemi non vuoti di R, x0 ∈ X un punto di accumulazione
per X ed f : X → R e g : Y → R funzioni reali tali che f (X) ⊂ Y e si
ponga y0 = f (x0 ). Se f è continua in x0 e g è continua in y0 , allora la
funzione composta g ◦f : X → R risulta continua in x0 . Conseguentemente,
se f e g sono continue, la funzione composta g ◦ f è continua.
Dimostrazione. La dimostrazione può essere considerata una conseguenza del Teorema
6.5.6 sul limite delle funzioni composte, tuttavia si può fonire facilmente una dimostrazione diretta. Fissato ε > 0, dalla continuità di g in y0 segue l’esistenza di δ1 > 0 tale
che, per ogni y ∈ Y ∩]y0 − δ1 , y0 + δ1 [, si abbia g(y0 ) − ε < g(y) < g(y0 ) + ε; inoltre,
poiché f è continua in x0 , si può trovare δ > 0 tale che, per ogni x ∈ X∩]x0 − δ, x0 + δ[,
risulti f (x0 ) − δ1 < f (x) < f (x0 ) + δ1 . Allora, per ogni x ∈ X∩]x0 − δ, x0 + δ[, si ha
anche f (x) ∈ Y ∩]y0 − δ1 , y0 + δ1 [ e conseguentemente g(y0 ) − ε < g(f (x)) < g(y0 ) + ε.
Dall’arbitrarietà di ε > 0 segue la tesi.
I teoremi precedenti consentono di affermare la continuità di una funzione ottenuta mediante le operazioni algebriche di somma, prodotto e
composizione di funzioni continue.
Se X è un sottoinsieme non vuoto di R, l’insieme di tutte le funzioni
reali continue definite in X viene denotato con C(X)
C(X) := {f : X → R | f è continua} .
8.2 Funzioni continue su intervalli chiusi e limitati
201
In termini algebrici, le proprietà precedenti consentono di affermare che
l’insieme C(X), munito delle operazioni di somma di due funzioni e prodotto
di un numero reale per una funzione, risulta uno spazio vettoriale reale.
Le funzioni maggiormente studiate nel seguito si ottengono applicando
opportune operazioni algebriche di somma, prodotto e composta alle funzioni elementari, per cui la continuità delle funzioni elementari sarà in generale
sufficiente ad assicurarne la continuità delle funzioni in esame. D’altra parte, la continuità delle funzioni elementari è un’immediata conseguenza dello
studio dei limiti delle funzioni elementari effettuato in precedenza, in base
al quale si può affermare che tutte le funzioni elementari sono continue.
Inoltre, anche i polinomi e le funzioni razionali sono continue, in quanto
somma e quoziente di funzioni continue.
8.2
Funzioni continue su intervalli chiusi e limitati
Alcune importanti proprietà delle funzioni continue si ottengono nel caso in
cui esse sono definite in intervalli chiusi e limitati.
Teorema 8.2.1 (Teorema di Weierstrass)
Sia f : [a, b] → R una funzione continua. Allora f è dotata di minimo e di
massimo, cioè esistono c ∈ [a, b] e d ∈ [a, b] tali che, per ogni x ∈ [a, b],
f (c) ≤ f (x) ≤ f (d) .
Dimostrazione. Si dimostra in una prima fase che ogni funzione continua f : [a, b] → R
è limitata. Infatti, se per assurdo f non fosse limitata superiormente, essa non ammetterebbe maggioranti e quindi, in particolare, per ogni n ∈ N esisterebbe xn ∈ [a, b] tale che f (xn ) > n. La successione (xn )n∈N è limitata e quindi, dal Corollario 7.1.13,
ammette un’estratta (xk(n) )n∈N convergente verso un elemento x0 ∈ [a, b]. Poiché
limn→+∞ f (xk(n) ) = +∞ (in quanto f (k(n)) > k(n) ≥ n), dalla caratterizzazione sequenziale del limite (Teorema 7.1.3) viene contraddetta la continuità di f in x0 . Quindi
f deve essere limitata superiormente. Nello stesso modo si dimostra che f deve essere
limitata inferiormente.
Si dimostra ora che f è dotata di massimo; dalla prima parte già dimostrata, si può
considerare l’estremo superiore ℓ := sup f di f e quindi è sufficiente dimostrare che esso
è un valore della funzione. Infatti, dalla definizione di estremo superiore, per ogni n ∈ N
segue l’esistenza di yn ∈ [a, b] tale che ℓ − 1/(n + 1) < f (yn ) ≤ ℓ; anche in questo caso
la successione (yn )n∈N è limitata e quindi, dal Corollario 7.1.13, ammette un’estratta
(yk(n) )n∈N convergente verso un elemento d ∈ [a, b]. Poiché limn→+∞ f (yk(n) ) = ℓ dalla
continuità di f in y0 e dalla caratterizzazione sequenziale del limite (Teorema 7.1.3) segue
ℓ = f (d) e ciò completa la dimostrazione dell’esistenza del massimo. Nello stesso modo
si dimostra infine quella del minimo di f .
Capitolo 8: Funzioni continue
202
◃ Oltre alla continuità, si osserva che l’ipotesi che l’insieme di definizione
sia un intervallo chiuso e limitato è essenziale, come si riconosce, ad esempio,
considerando le restrizioni della funzioni logaritmo all’intervallo semiaperto
]0, 1] ed all’intervallo non limitato [1, +∞[.
La proprietà successiva giustifica la terminologia adottata per la proprietà di continuità.
Teorema 8.2.2 (Teorema degli zeri)
Sia f : [a, b] → R una funzione continua tale che f (a) f (b) < 0. Allora
esiste x0 ∈]a, b[ tale che f (x0 ) = 0.
Dimostrazione. L’ipotesi f (a) f (b) < 0 esprime il fatto che negli estremi a e b la funzione
f assume valori di segno opposto. Si supponga, per fissare le notazioni, che f (a) < 0 e
f (b) > 0 (la dimostrazione è analoga nel caso f (a) > 0 e f (b) < 0).
Si ponga I1 := [a, b] e si consideri il punto medio x1 ∈ [a, b]; se f (x1 ) = 0, la
tesi è vera, altrimenti la funzione f assume valori di segno opposto in almeno uno degli
intervalli [a, x1 ] e [x1 , b]; denotato con I2 tale intervallo si denota ora con x2 il punto
medio di I2 e si considera il valore f (x2 ). Se f (x2 ) = 0, la tesi è vera, altrimenti la
funzione f assume valori di segno opposto in almeno uno degli intervalli aventi come
estremi x2 ed uno dei punti considerati in precedenza; tale intervallo viene denotato I3 e
si ripete il procedimento esposto. Se dopo n iterazioni di tale procedimento si trova un
punto xn ∈ [a, b] tale che f (xn ) = 0, la tesi è vera, altrimenti si trova una successione di
intervalli (In )n≥1 tale che, per ogni n ≥ 1, In+1 ⊂ In e In ha ampiezza (b − a)/2n−1 .
Per ogni n ≥ 1 si denotino con an e bn gli estremi di In e precisamente con an l’estremo
in cui f assume un valore negativo e con bn l’estremo in cui f assume un valore positivo;
si ottengono cosı̀ le successioni (an )n∈N e (bn )n∈N di elementi di [a, b]. La successione
(an )n∈N è limitata e quindi, dal Corollario 7.1.13, essa ammette un’estratta (ak(n) )n∈N
b−a
convergente verso un elemento x0 ∈ [a, b]. Poiché k(n) ≤ n, si ha k(n)−1
≤ 2b−a
n−1 e
2
conseguentemente
ak(n) −
b−a
b−a
b−a
b−a
≤ ak(n) − k(n)−1 ≤ bk(n) ≤ ak(n) + k(n)−1 ≤ ak(n) − n−1
2n−1
2
2
2
(in realtà, bk(n) coincide con ak(n) − (b − a)/k(n) oppure con ak(n) + (b − a)/k(n)),
si ha anche per confronto limn→+∞ bk(n) = x0 ; dalla continuità di f in x0 e dalla
caratterizzazione sequenziale del limite (Teorema 7.1.3) segue
lim f (ak(n) ) = f (x0 ) ,
n→+∞
lim f (bk(n) ) = f (x0 ) ;
n→+∞
infine, poiché f (an ) ≤ 0 deve essere anche f (x0 ) ≤ 0 e analogamente, poiché f (bn ) ≥ 0
deve essere anche f (x0 ) ≥ 0; si conclude che deve essere f (x0 ) = 0 e ciò completa la
dimostrazione.
Corollario 8.2.3 (Teorema di Bolzano o dei valori intermedi)
Sia f : [a, b] → R una funzione continua e siano m ∈ R ed M ∈ R il minimo
e rispettivamente il massimo di f . Se λ ∈ R e m ≤ λ ≤ M , allora esiste
x0 ∈ [a, b] tale che f (x0 ) = λ.
Dimostrazione. Siano c ∈ [a, b] e d ∈ [a, b] tali che f (c) = m e f (d) = M . La tesi è
ovvia se λ = m oppure λ = M considerando x0 = c oppure x0 = d. Si supponga quindi
8.2 Funzioni continue su intervalli chiusi e limitati
203
y
a
x0
0
b
x
Figura 8.1: Teorema degli zeri.
m < λ < M e si denoti con I l’intervallo chiuso avente come estremi i punti c e d; si
consideri la funzione g : I → R definita ponendo, per ogni x ∈ I, g(x) = f (x) − λ. Allora
g è continua e inoltre g(c) g(d) < 0. Dal Teorema degli zeri 8.2.2 segue l’esistenza di
x0 ∈ I tale che g(x0 ) = 0; dunque x0 ∈ [a, b] e f (x0 ) = λ.
Osservazione 8.2.4 (Conseguenza del teorema di Weierstrass e di Bolzano)
Sia f : [a, b] → R una funzione continua. Dal Teorema 8.2.1 di Weierstrass, segue l’esistenza di c ∈ [a, b] e d ∈ [a, b] tali che, per ogni x ∈ [a, b],
f (c) ≤ f (x) ≤ f (d), cioè f ([a, b]) ⊂ [f (c), f (d)].
D’altra parte, dal teorema di Bolzano (Corollario 8.2.3), segue che ogni
elemento dell’intervallo [f (c), f (d)] è un valore della funzione e quindi si
deve avere [f (c), f (d)] ⊂ f ([a, b]). In conclusione deve essere
f ([a, b]) = [f (c), f (d)] ,
cioè l’immagine di un intervallo chiuso e limitato mediante una funzione
continua è un intervallo chiuso e limitato avente come estremi il minimo e
rispettivamente il massimo della funzione in tale intervallo.
Osservazione 8.2.5 Un’importante applicazione del teorema degli zeri riguarda la possibilità di approssimare le soluzioni di un’equazione. Sia I un
Capitolo 8: Funzioni continue
204
intervallo e sia f : I → R una funzione continua; si consideri l’equazione
f (x) = 0 .
Il primo passo consiste nel cercare due elementi a, b ∈ I tali che f (a) f (b) <
0. A questo punto, applicando il metodo descritto nella dimostrazione del
Teorema degli zeri 8.2.2, alla restrizione di f all’intervallo [a, b], si riesce ad
approssimare una soluzione dell’equazione con la precisione desiderata.
Ad esempio, si supponga di voler determinare una soluzione dell’equazione
ex = −x
con una precisione pari a 3 · 10−1 .
y
0
x0
x
Figura 8.2: Approssimazione delle soluzioni con il teorema degli zeri.
Confrontando i grafici delle funzioni ex e −x si riconosce facilmente
l’esistenza di un’unica soluzione x0 ∈ R, che risulta negativa. Si cerca ora
di applicare il ragionamento sopra esposto alla funzione f (x) = ex + x,
per determinare il punto x0 con la precisione richiesta. Nel punto 0 risulta
f (0) = 1 > 0, mentre nel punto −1 si ha f (−1) = e−1 − 1 < 0, da cui, per
il teorema degli zeri, x0 ∈] − 1, 0[; si considera ora il punto −1/2, nel quale
risulta f (−1/2) = e−1/2 − 1/2 > 0 (in quanto e−1 > 1/4); essendo f (−1)
8.3 Continuità delle funzioni monotone
205
e f (−1/2) discordi, deve essere x0 ∈] − 1, −1/2[. Si considera ora il punto
−3/4. La condizione e−3/4 > 3/4 è equivalente a 4e−3/4 /3 > 1 e, elevando
alla potenza quarta entrambi i membri (tenendo presente che sono positivi)
a 256/(81e3 ) > 1, che non è vera; quindi si ha f (−3/4) = e−3/4 − 3/4 < 0 e
da ciò segue che la soluzione x0 deve trovarsi nell’intervallo ] − 3/4, −1/2[,
agli estremi del quale la funzione assume valori di segno discorde. Essendo
−1/2 − (−3/4) = 1/4 < 3 · 10−1 si è ottenuta la precisione desiderata. Si
osserva tuttavia che il metodo precedente richiede in generale molti calcoli
se si richiede una precisione elevata e per questo motivo viene utilizzato
solamente nei casi in cui sia necessaria una stima molto approssimativa
della posizione degli zeri di una funzione.
8.3
Continuità delle funzioni monotone
Ci si occupa ora di alcune proprietà particolari che riguardano la continuità
delle funzioni monotone.
Innanzitutto conviene studiare la continuità delle funzioni inverse; a tal
fine, è opportuno premettere alcuni risultati di interesse generale.
◃ Conviene innanzitutto osservare che se f : X → R è una funzione reale
monotona e se l’immagine f (X) di f è un intervallo, allora necessariamente
f deve essere continua.
Infatti, si supponga ad esempio che f sia crescente e sia per assurdo x0 ∈ X tale
che f non sia continua in x0 . Allora, tenendo presente il Teorema 6.6.1, deve risultare
limx→x− f (x) < f (x0 ) oppure f (x0 ) < limx→x+ f (x). In entrambi i casi la crescenza di
0
0
f comporta che la funzione non assuma valori nell’intervallo tra uno dei limiti ed f (x0 )
e ciò contraddice il fatto che f (X) è un intervallo.
Una delle poprietà generali delle funzioni strettamente monotone è quella di essere iniettiva. Il viceversa non vale necessariamente (ad esempio, si
consideri la funzione f : [−1, 1] → R definita ponendo, per ogni x ∈ [−1, 1],
f (x) = |x| − sign (x), dove sign è la funzione segno già introdotta in precedenza). tuttavia, se si suppone in più che la funzione sia continua si ottiene
il seguente risultato.
Proposizione 8.3.1 Se I è un intervallo ed f : I → R è una funzione reale
continua ed iniettiva, allora f è strettamente monotona.
Dimostrazione. Si supponga, per assurdo, che esistano x1 , x2 ∈ I tali che x1 < x2 e
f (x1 ) ≤ f (x2 ) (per cui f non è strettamente decrescente) e che esistano x3 , x4 ∈ I tali
che x3 < x4 e f (x3 ) ≥ f (x4 ) (per cui f non è strettamente crescente). Dunque, posto a =
min{x1 , x3 } e b = max{x2 , x4 }, f non risulta né strettamente crescente né strettamente
decrescente in [a, b]. Poiché f è iniettiva, deve essere f (a) < f (b) oppure f (b) < f (a);
si supponga f (a) < f (b). Per ogni x0 ∈]a, b[ si deve avere f (a) < f (x0 ) < f (b); infatti,
206
Capitolo 8: Funzioni continue
se fosse f (x0 ) < f (a), dal teorema di Bolzano (Corollario 8.2.3) esisterebbe un elemento
y ∈]x0 , b[ tale che f (y) = f (a) ed f non sarebbe iniettiva; nello stesso modo, se fosse
f (b) < f (x0 ), sempre dal teorema di Bolzano esisterebbe y ∈]a, x0 [ tale che f (y) = f (b)
contro l’iniettività di f ; le uguaglianze f (x0 ) = f (a) e f (x0 ) = f (b) sono da escludere
sempre a causa dell’iniettività di f . Si è cosı̀ dimostrato che f è strettamente crescente in
[a, b] e ciò era stato escluso. Nello stesso modo si dimostra che la condizione f (b) < f (a)
comporta la stretta decrescenza di f in [a, b], anche questa esclusa. Dunque la tesi deve
essere vera.
Se f : X → R è iniettiva, posto Y = f (X) si è convenuto di denotare
con f −1 : Y → R la funzione inversa di f ottenuta considerando a valori in
tutto R l’inversa della ridotta di f . Tale funzione inversa può ovviamente
essere considerata se f è strettamente monotona; per quanto riguarda la
continuità della funzione f −1 , si ha quanto segue.
Teorema 8.3.2 (Continuità della funzione inversa)
Siano I un intervallo, f : I → R una funzione reale iniettiva e, posto
Y = f (I), si consideri la funzione inversa f −1 : Y → R. Se f è strettamente monotona, la funzione inversa f −1 è continua. In particolare, se f
è continua, anche la funzione inversa f −1 è continua.
Dimostrazione. Si riconosce facilmente che la funzione inversa f −1 risulta anch’essa
strettamente monotona ed inoltre ha come immagine l’intervallo I. Da quanto osservato
preliminarmente, segue che f −1 è continua. Se si suppone che f sia continua, dalla Proposizione 8.3.1 precedente, essa risulta strettamente monotona e quindi si può applicare
quanto già dimostrato.
◃ Si approfondisce ora l’analisi degli eventuali punti di discontinuità di una
funzione monotona. Si osserva innanzitutto che come conseguenza diretta
del Teorema 6.6.1 sul limite delle funzioni monotone, se f : X → R è una
funzione reale monotona e se x0 ∈ X è un punto di accumulazione sia a
sinistra che a destra per X, allora f è continua in x0 se e solo se esiste il
limite limx→x0 f (x) di f in x0 .
Da ciò segue che una funzione monotona f : X → R può avere solamente
discontinuità di prima specie nei punti di accumulazione a sinistra e a destra.
Nei punti di accumulazione solamente a sinistra o solamente a destra
vi possono invece essere solamente discontinuità eliminabili; infatti, le discontinuità di seconda specie sono escluse in quanto affinché una funzione
monotona f : X → R possa essere non limitata superiormente oppure inferiormente è necessario che X sia non limitato oppure che inf(X) ∈
/ X
oppure sup(X) ∈
/ X; in tutti questi casi la funzione f non è definita nei
punti inf(X) e sup(X) e quindi in tali punti non ha senso chiedersi se la
funzione presenta in tali punti una discontinuità.
8.4 Funzioni uniformemente continue
207
Teorema 8.3.3 (Numerabilità delle discontinuità delle funzioni monotone)
Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione reale
monotona. Allora l’insieme
D(f ) := {x0 ∈ X | f non è continua in x0 }
dei punti di discontinuità di f è finito oppure al più numerabile.
Dimostrazione. Si può supporre che f sia crescente, altrimenti basta applicare lo stesso
procedimento alla funzione −f . Per ogni x0 ∈ X, si denoti con s(x0 ) il salto della funzione
f in x0 , definito come segue

lim f (x) − lim f (x) , x0 di accumulazione a sinistra e a destra per X ,


x→x+
x→x−

0
0


lim f (x) − f (x0 ) ,
x0 di accumulazione solo a destra per X ,
s(x0 ) :=
+
x→x

0


 f (x0 ) − lim f (x) ,
x0 di accumulazione solo a sinistra per X .

−
x→x0
Per ogni m ∈ N, si considera inoltre l’insieme
{
Dm (f ) := x0 ∈ X | s(x0 ) ≥
1
m+1
}
dei punti di discontinuità di f in cui il salto della funzione è maggiore o uguale di 1/(m+1).
Ovviamente,
∪
D(f ) =
Dm (f ) .
m∈N
Si considerino ora una successione decrescente (an )n∈N ed una successione crescente
(bn )n∈N di elementi di X tali che limn→+∞ an = inf(X) e limn→+∞ bn = sup(X).
In ogni insieme X ∩ [an , bn ] la funzione è limitata in quanto è crescente ed è definita
agli estremi; segue che per ogni m ∈ N l’insieme Dn,m (f ) := Dm (f ) ∩ X ∩ [an , bn ] è finito
in quanto la somma di un numero finito di salti maggiori o uguali di 1/(m + 1) non può
superare la differenza f (bm ) − f (am ). Allora


∪
∪
∪

D(f ) =
Dm (f ) =
Dn,m (f )
m∈N
m∈N
n∈N
è unione numerabile di insiemi finiti e pertanto è finito oppure al più numerabile.
8.4
Funzioni uniformemente continue
Si supponga che una funzione f : X → R sia continua; allora, per definizione,
∀ x ∈ X ∀ ε > 0 ∃ δ > 0 t.c. ∀ y ∈ X∩]x − δ, x + δ[: |f (x) − f (y)| < ε .
Pertanto, il numero reale strettamente positivo δ dipende oltre che dal numero ε > 0 anche dall’elemento x ∈ X fissato. Ci si occuperà ora delle
Capitolo 8: Funzioni continue
208
funzioni continue per le quali sia possibile scegliere in corrispondenza di
ogni ε > 0 un numero δ che soddisfi la condizione precedente per ogni
x ∈ X.
Precisamente, si assume la seguente definizione.
Definizione 8.4.1 Siano X un sottoinsieme non vuoto di R ed f : X → R
una funzione reale. Si dice che f è una funzione uniformemente continua
se soddisfa la condizione seguente
∀ ε > 0 ∃ δ > 0 t.c. ∀ x, y ∈ X : |x − y| < δ ⇒ |f (x) − f (y)| < ε . (8.4.1)
Ovviamente, una funzione uniformemente continua risulta sempre continua. Il viceversa non vale in generale.
Ad esempio, se si considera la funzione potenza f (x) = x2 , x ∈ R, la
diseguaglianza |f (x) − f (y)| < ε, con ε > 0 fissato, si scrive |x2 − y 2 | < ε ed
è equivalente a |(x − y)(x + y)| < ε; se si considera y = x + δ/2 con δ > 0,
la diseguaglianza precedente diventa |δ/2 (2x + δ/2)| < ε e non può essere
soddisfatta se x ≥ 0 e x ≥ ε/delta − δ/4. Quindi in questo caso comunque
si scelga il numero δ, la (8.4.1) non può essere soddisfatta per ogni x, y ∈ R
tali che |x − y| < δ.
◃ Si riconosce facilmente che la somma di due funzioni uniformemente
continue è anch’essa uniformemente continua. Se le funzioni sono limitate e
uniformemente continue, anche la funzione prodotto è uniformemente continua. Senza l’ipotesi di limitatezza in generale non si può affermare che
il prodotto di due funzioni uniformemente continue è uniformemente continua, come accade, ad esempio, per la funzione identica f (x) = x, x ∈ R,
moltiplicata per sé stessa.
◃ Nel caso in cui la funzione sia definita in un intervallo chiuso e limitato,
la proprietà di uniforme continuità equivale a quella di continuità.
Teorema 8.4.2 (Teorema sull’uniforme continuità di Heine-Cantor)
Se f : [a, b] → R è una funzione continua, allora f è uniformemente
continua.
Dimostrazione. Si supponga, per assurdo, che f non sia uniformemente continua. Allora,
negando la condizione (8.4.1), deve esistere ε0 > 0 tale che, per ogni δ > 0, si possono
trovare x ∈ [a, b] e y ∈ [a, b] verificanti le condizioni |x − y| < δ e |f (x) − f (y)| ≥ ε0 . In
particolare, per ogni n ∈ N, applicando tale proprietà con δ = 1/(n + 1), si ottengono
an ∈ [a, b] e bn ∈ [a, b] tali che |an − bn | < 1/(n + 1) e |f (an ) − f (bn )| ≥ ε0 . Si considerino
ora le successioni (an )n∈N e (bn )n∈N di elementi di [a, b]. Esse sono limitate e quindi dal
Corollario 7.1.13 esiste una successione (ak(n) )n∈N estratta dalla successione (an )n∈N
convergente verso un numero reale x0 ∈ R; poiché an ∈ [a, b] per ogni n ∈ N, deve essere
anche x0 ∈ [a, b]. Inoltre, per ogni n ∈ N,
0 ≤ |ak(n) − bk(n) | <
1
1
≤
k(n) + 1
n+1
(1)
8.4 Funzioni uniformemente continue
209
e quindi limn→+∞ |ak(n) −bk(n) | = 0, da cui limn→+∞ bk(n) = limn→+∞ ak(n) +(bk(n) −
ak(n) ) = x0 . Poiché la funzione f è continua in x0 , dalla caratterizzazione sequenziale del
limite (Teorema 7.1.3) si deve avere limn→+∞ f (ak(n) ) = f (x0 ), limn→+∞ f (bk(n) ) =
f (x0 ) e conseguentemente limn→+∞ |f (ak(n) ) − f (bk(n) )| = 0. A questo punto, poiché
ε0 > 0, dalla definizione di limite, deve esistere ν ∈ N tale che, per ogni n ≥ ν, |f (ak(n) )−
f (bk(n) )| < ε0 , e ciò contraddice la (1).
◃ Una funzione reale f : X → R si dice lipschitziana se esiste un numero
reale L ∈ R+ tale che, per ogni x, y ∈ X,
|f (x) − f (y)| ≤ L|x − y| .
(8.4.2)
Il numero L viene denominato inoltre costante di Lipschitz della funzione
f.
Spesso si dice anche che f è L-lipschitziana per indicare che f è lipschitziana e che L è una sua costante di Lipschitz.
◃ Vale il seguente legame con le funzioni uniformemente continue.
Proposizione 8.4.3 Siano X un sottoinsieme non vuoto di R ed f : X →
R una funzione lipschitziana. Allora f è uniformemente continua.
Dimostrazione. Sia L ∈ R+ una costante di Lipschitz di f . Fissato ε > 0 e posto
δ = ε/(L + 1), dalla (8.4.2) si ha, per ogni x, y ∈ X tali che |x − y| < δ,
L
ε<ε
L+1
e ciò, per l’arbitrarietà di ε > 0, dimostra che f è uniformemente continua.
|f (x) − f (y)| ≤ L|x − y| < Lδ =
La proposizione precedente non può essere invertita nemmeno se f è
uniformemente continua in un intervallo chiuso e limitato. Ad esempio, la
restrizione della funzione radice quadrata all’intervallo [0, 1] è continua e
quindi, per il Teorema 8.4.2, è anche uniformemente√ continua, ma non è
√
lipschitziana; infatti, se L ∈ R+ , la diseguaglianza
x − y| ≤ L|x − y|
√ | √
comporta, moltiplicando entrambi i membri per x + y,
√
√
|x − y| ≤ L|x − y|( x + y)
√
√
e può essere verificata solo se x = y oppure se L ̸= 0 e x + y ≥ 1/L.
◃ Si osserva infine che se f : X → R e g : X → R sono funzioni reali
lipschitziane con costanti di Lipschitz L1 e rispettivamente L2 , allora
1) f + g è (L1 + L2 )-lipschitziana.
2) Se f e g sono limitate e se, per ogni x ∈ X, |f (x)| ≤ M1 e |g(x)| ≤ M2 ,
il prodotto f · g è (L1 M2 + L2 M1 )-lipschitziana.
3) Se λ ∈ R, la funzione λ f è |λ| L-lipschitziana.
Capitolo 9
Calcolo differenziale
Il calcolo differenziale mette a disposizione alcuni degli strumenti più efficaci
per lo studio di una funzione reale. Nella prima sezione ci si occupa delle
definizioni, della loro interpretazione geometrica e delle regole di derivazione;
nella seconda sezione si studiano i risultati più importanti riguardanti le
funzioni derivabili ed infine nell’ultima sezione i risultati ottenuti vengono
applicati allo studio delle funzioni reali.
9.1
9.1.1
Funzioni derivabili
Definizioni ed interpretazione geometrica
Definizione 9.1.1 Siano X un sottoinsieme di R, x0 ∈ X un punto di
accumulazione per X ed f : X → R una funzione reale. Si dice che f è
dotata di derivata in x0 se esiste il limite
lim
x→x0
f (x) − f (x0 )
.
x − x0
In tal caso, tale limite viene denominato derivata di f in x0 (oppure derivata
prima di f in x0 ) e denotato con uno dei simboli:
(
)
df (x0 )
df (x)
f ′ (x0 ) , Df (x0 ) ,
(talvolta (Df (x))x=x0 ,
);
dx
dx x=x0
pertanto
f (x) − f (x0 )
.
(9.1.1)
x − x0
Se, in più, il limite (9.1.1) esiste ed è finito, si dice che f è derivabile
in x0 .
f ′ (x0 ) := lim
x→x0
Capitolo 9: Calcolo differenziale
212
Inoltre, se A è un sottoinsieme di X, si dice che f è dotata di derivata in A (rispettivamente, derivabile in A) se essa è dotata di derivata
(rispettivamente, derivabile) in ogni elemento x0 ∈ A.
Infine, si dice che f è dotata di derivata (rispettivamente, derivabile) se
è dotata di derivata in X (rispettivamente, derivabile in X).
Posto h := x − x0 , il limite (9.1.1) può essere espresso come segue
f ′ (x0 ) = lim
h→0
f (x0 + h) − f (x0 )
.
h
La funzione Rx0 (f ) : X r {x0 } → R definita ponendo, per ogni x ∈
X r {x0 },
f (x) − f (x0 )
Rx0 (f )(x) :=
(9.1.2)
x − x0
viene denominata funzione rapporto incrementale di f in x0 . Quindi f è
dotata di derivata in x0 se e solo la funzione rapporto incrementale di f in
x0 è dotata di limite in x0 e che, in tal caso, si ha
f ′ (x0 ) = lim Rx0 (f )(x) .
x→x0
Inoltre, se f è derivabile in x0 , la funzione Rx0 (f ) può essere definita anche
in x0 ponendo Rx0 (f ) := f ′ (x0 ) e in tal modo risulta continua in x0 . Nel
seguito, la funzione Rx0 (f ) si intenderà definita in tutto X nel case in cui
f sia derivabile.
Se il punto x0 è di accumulazione a destra oppure a sinistra si può definire
in maniera analoga la derivata destra o sinistra di f in x0 . Precisamente, se
x0 ∈ X è un punto di accumulazione a destra (rispettivamente, a sinistra)
per X ed f : X → R è una funzione reale, si dice che f è dotata di derivata
destra (rispettivamente, sinistra) in x0 se esiste il limite
lim+
x→x0
f (x) − f (x0 )
x − x0
(rispettivamente, lim−
x→x0
f (x) − f (x0 )
).
x − x0
Il limite precedente, se esiste, viene denominato derivata destra (rispettivamente, sinistra) di f in x0 e denotato con uno dei simboli:
′
f+
(x0 ) ,
Dd f (x0 )
′
(rispettivamente, f−
(x0 ) ,
Ds f (x0 ) );
pertanto
′
f+
(x0 )
:=
′
(rispettivamente, f−
(x0 )
:=
lim
f (x) − f (x0 )
,
x − x0
lim
f (x) − f (x0 )
).
x − x0
x→x+
0
x→x−
0
(9.1.3)
9.1 Funzioni derivabili
213
Se il limite (9.1.3) esiste ed è finito, si dice che f è derivabile a destra
(rispettivamente, a sinistra) in x0 .
Anche in questo caso, se A è un sottoinsieme di X, si dice che f è dotata
di derivata destra (rispettivamente, dotata di derivata sinistra, derivabile
a destra, derivabile a sinistra) in A se essa è dotata di derivata destra
(rispettivamente, dotata di derivata sinistra, derivabile a destra, derivabile
a sinistra) in ogni elemento x0 ∈ A. Quando il sottoinsieme A non viene
specificato si intende l’intero X.
Assegnata una funzione reale f : X → R, e considerati gli insiemi
X′
:=
{x0 ∈ X | f è derivabile in x0 } ,
′
X+
′
X−
:=
:=
{x0 ∈ X | f è derivabile a destra in x0 } ,
{x0 ∈ X | f è derivabile a sinistra in x0 } ,
′
′
→R
→ R e g− : X−
si possono definire le funzioni g : X ′ → R, g+ : X+
′
′
′
′
′
′
′
ponendo g(x) := f (x) (x ∈ X ), g+ (x) := f+ (x) (x ∈ X+ ), g− (x) := f−
(x)
′
(x ∈ X− ); la funzione g viene denominata funzione derivata prima di f e
denotata con il simbolo f ′ , mentre le funzioni g+ e g− vengono denominate
rispettivamente funzione derivata destra e funzione derivata sinistra di f e
′
′
denotate con il simbolo f+
e rispettivamente f−
.
◃ Dalle definizioni assunte e dai teoremi sui limiti segue direttamente che
se x0 ∈ X è un punto di accumulazione sia a destra che a sinistra per X,
allora una funzione reale f : X → R è dotata di derivata (rispettivamente,
è derivabile) in x0 se e solo se f è dotata di derivata a destra e a sinistra
(rispettivamente, f è derivabile sia a destra che a sinistra) in x0 ed inoltre
′
′
(x0 ).
(x0 ) = f−
f+
◃ Nel risultato seguente si esaminano le relazioni esistenti tra derivabilità
e continuità.
Proposizione 9.1.2 (Continuità delle funzioni derivabili)
Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X
ed f : X → R una funzione reale. Se f è derivabile in x0 , allora essa è
continua in x0 .
Conseguentemente, se f è derivabile, allora f è anche continua.
Dimostrazione. Per ogni x ∈ X r {x0 }, si può scrivere
f (x) = f (x) − f (x0 ) + f (x0 ) =
f (x) − f (x0 )
(x − x0 ) + f (x0 ) ;
x − x0
poiché f è derivabile in x0 , segue
(
)
f (x) − f (x0 )
lim f (x) = lim
(x − x0 ) + f (x0 ) = f ′ (x0 ) · 0 + f (x0 ) = f (x0 ) ,
x→x0
x→x0
x − x0
Capitolo 9: Calcolo differenziale
214
da cui la tesi.
Si osserva che la Proposizione 9.1.2 non può essere invertita.
Ad esempio, la funzione valore assoluto è continua in 0 ma non è derivabile in 0 in quanto
lim+
x→0
|x| − |0|
x
= lim = 1 ,
x→0 x
x−0
lim−
x→0
|x| − |0|
−x
= lim
= −1 ,
x→0 x
x−0
e quindi la derivata destra non coincide con quella sinistra.
◃ Si considera ora un’interpretazione geometrica della derivata di una funzione in un punto x0 . Si supponga che f : X → R sia dotata di derivata
in x0 e sia t ∈ X r {x0 }; si denoti con P0 il punto del piano cartesiano di
coordinate (x0 , f (x0 )) e con P quello di coordinate (t, f (t)). Allora la retta
passante per i punti P0 e P ha equazione
y − f (x0 )
f (t) − f (x0 )
=
.
x − x0
t − x0
Tale retta viene denominata secante il grafico di f nei punti P0 e P
ed il suo coefficiente angolare è dato dal rapporto incrementale di f in x0
calcolato in t.
Considerando il limite del rapporto incrementale nel punto x0 , il coefficiente angolare della retta secante tende verso il numero f ′ (x0 ), che rappresenta ancora il coefficiente angolare di una retta passante per P0 . Tale
retta viene denominata retta tangente al grafico di f nel punto P0 .
Considerando il limite per t → x0 nell’equazione della retta secante,
segue che se f è derivabile in x0 , l’equazione della retta tangente è data da
y = f (x0 ) + f ′ (x0 )(x − x0 ) .
(9.1.4)
mentre se f è dotata di derivata in x0 uguale a +∞ oppure a −∞, l’equazione della retta tangente è
x = x0 .
(9.1.5)
◃ La stessa interpretazione geometrica può essere fornita per le funzioni
che non sono dotate di derivata in x0 , ma per cui esiste la derivata destra
in x0 e la derivata sinistra in x0 . Ad esempio, se f è derivabile a destra e
′
′
a sinistra in x0 e se f+
(x0 ) ̸= f−
(x0 ), allora non si può considerare la retta
tangente al grafico di f in x0 , ma si possono considerare la retta tangente
a destra al grafico di f in x0 , di equazione
′
y = f (x0 ) + f+
(x0 )(x − x0 )
9.1 Funzioni derivabili
215
y
P
P0
0
x0
t
x
Figura 9.1: Interpretazione geometrica della derivata.
e la retta tangente a sinistra al grafico di f in x0 , di equazione
′
y = f (x0 ) + f−
(x0 )(x − x0 ) ;
in questo caso, il punto x0 viene detto punto angoloso.
Ad esempio, la funzione valore assoluto nel punto 0 è dotata di retta
tangente a destra in 0 di equazione y = x e di retta tangente a sinistra in 0
di equazione y = −x.
Si può anche presentare il caso in cui la funzione sia dotata di derivata a
sinistra di x0 uguale a +∞ oppure a −∞ e sia invece derivabile a destra di
x0 (o viceversa); in tal caso, la retta tangente a sinistra in x0 ha equazione
x = x0 , mentre l’equazione della tangente destra è data da y = f (x0 ) +
′
f+
(x0 )(x − x0 ). Il punto x0 viene denominato punto angoloso anche in
questo caso.
Ad esempio, si può considerare ne punto 0 la funzione f : R → R
definita ponendo f (0) := 0 e f (x) := e1/x se x ̸= 0. In questo caso la retta
di equazione x = 0 è tangente a destra al grafico di f in 0, mentre la retta
y = 0 è tangente a sinistra al grafico di f in 0.
Infine, si può presentare il caso in cui la derivata destra in x0 è uguale
a +∞ e quella sinistra è uguale a −∞ oppure viceversa. In questo caso il
Capitolo 9: Calcolo differenziale
216
punto x0 viene denominato punto cuspidale. Si osservi che il grafico di f è
dotato di retta tangente sia a sinistra che a destra di equazione x = x0 .
Ad esempio, si
per ogni
√consideri la funzione f : R → R definita ponendo,
′
(0) = +∞
x ∈ R, f (x) := |x|. Nel punto 0 si verifica facilmente che f+
′
mentre f−
(0) = −∞.
◃ Se f : X → R è una funzione reale, si è già considerato l’insieme X ′
degli elementi di X in cui f è derivabile e si è definita la funzione derivata
prima f ′ : X ′ → R; naturalmente, se x0 ∈ X ′ è un punto di accumulazione
per X ′ ha senso chiedersi se la funzione f ′ sia a sua volta derivabile in x0 .
Vale quindi la seguente definizione.
Definizione 9.1.3 Siano X un sottoinsieme di R, x0 ∈ X un punto di
accumulazione per X ed f : X → R una funzione reale. Si dice che f è
dotata di derivata seconda (rispettivamente, derivabile due volte) in x0 se
esiste δ > 0 tale che f sia derivabile in X∩]x0 −δ, x0 +δ[ e inoltre la funzione
derivata prima f ′ è dotata di derivata (rispettivamente, derivabile) in x0 .
In tal caso, la derivata (f ′ )′ (x0 ) viene denominata derivata seconda di f in
x0 e denotata con uno dei seguenti simboli
f ′′ (x0 ) ,
D2 f (x0 ) ,
d2 f
(x0 ) .
dx2
Inoltre, se A è un sottoinsieme di X, si dice che f è dotata di derivata seconda (rispettivamente, derivabile) in A, se essa è dotata di derivata
seconda (rispettivamente, derivabile) in ogni x0 ∈ A.
Infine, si dice che f è dotata di derivata seconda (rispettivamente, derivabile) se essa è dotata di derivata seconda (rispettivamente, derivabile) in
X.
In base alla definizione precedente, si può considerare l’insieme
X ′′ := {x ∈ X | f è derivabile due volte in x}
e si può definire la funzione g : X ′′ → R ponendo, per ogni x ∈ X ′′ ,
g(x) = f ′′ (x).
Tale funzione viene denominata derivata seconda di f e denotata con il
d2 f
simbolo f ′′ (oppure D2 f ,
).
dx2
In maniera analoga si definiscono le derivate successive di f in un punto
oppure in un sottoinsieme.
Fissato un numero naturale n ≥ 1, la derivata n-esima di f in un punto
x0 si denota con uno dei simboli
f (n) (x0 ) ,
Dn f (x0 ) ,
dn f
(x0 ) ,
dxn
9.1 Funzioni derivabili
e la funzione derivata n-esima con il simbolo f (n) (oppure Dn f ,
Per uniformità di notazioni conviene anche porre f (0) = f .
217
dn f
).
dxn
◃ Se X è un sottoinsieme di R, si ricorda che il simbolo C(X) denota
l’insieme di tutte le funzioni reali continue definite in X.
Più in generale, sarà utile considerare, per ogni numero naturale n ∈ N,
l’insieme
C n (X) := {f ∈ C(X) | f è derivabile n volte in X e f (n) è continua} .
L’insieme C 0 (X) coincide con C(X) e l’insieme C 1 (X) è costituito dalle
funzioni derivabili tali che f ′ ∈ C(X).
Le funzioni f : X → R che sono derivabili n volte per ogni n ∈ N
vengono denominate infinite volte derivabili ; si pone
C ∞ (X) := {f ∈ C(X) | f è infinite volte derivabile in X} ;
ovviamente, la derivata n-esima f (n) di una funzione f ∈ C ∞ (X) è sicuramente continua in quanto è a sua volta derivabile (anzi, f (n) ∈ C ∞ (X)).
9.1.2
Regole di derivazione
Assegnata una funzione reale, lo studio della sua derivabilità ed il calcolo
della derivata può essere effettuato utilizzando le regole di derivazione presentate e il calcolo delle derivate delle funzioni elementari di cui ci si occupa
nella presente sezione e nella successiva.
Per semplicità, viene considerato solamente il caso di funzioni derivabili;
una discussione del tutto analoga vale per funzioni derivabili a destra oppure
a sinistra.
Teorema 9.1.4 (Derivabilità della funzione somma)
Siano X un sottoinsieme non vuoto di R ed f : X → R e g : X → R
funzioni reali. Se x0 ∈ X è un punto di accumulazione per X ed f e g sono
derivabili in x0 , allora f + g è derivabile in x0 e si ha
(f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ) .
Conseguentemente, se f e g sono derivabili, anche la funzione somma f + g
è derivabile e si ha
(f + g)′ = f ′ + g ′ .
Dimostrazione. Dal primo teorema sul limite della somma si ha
(f + g)(x) − (f + g)(x0 )
f (x) − f (x0 )
g(x) − g(x0 )
lim
=
lim
+ lim
x→x0
x→x0
x→x0
x − x0
x − x0
x − x0
= f ′ (x0 ) + g ′ (x0 ) ,
da cui segue interamente la tesi.
Capitolo 9: Calcolo differenziale
218
Teorema 9.1.5 (Regola di Leibnitz sulla derivabilità della funzione
prodotto)
Siano X un sottoinsieme non vuoto di R ed f : X → R e g : X → R
funzioni reali. Se x0 ∈ X è un punto di accumulazione per X ed f e g sono
derivabili in x0 , allora la funzione f · g è derivabile in x0 e si ha
(f · g)′ (x0 ) = f ′ (x0 )g(x0 ) + f (x0 )g ′ (x0 ) .
Conseguentemente, se f e g sono derivabili, anche la funzione prodotto f · g
è derivabile e si ha
(f · g)′ = f ′ · g + f · g ′ .
Dimostrazione. Dal primo teorema sul limite del prodotto e tenendo presente che g è
continua in x0 (Proposizione 9.1.2), si ha
lim
(f · g)(x) − (f · g)(x0 )
x − x0
f (x)g(x) − f (x0 )g(x)
f (x0 )g(x) − f (x0 )g(x0 )
= lim
+ lim
x→x0
x→x0
x − x0
x − x0
f (x) − f (x0 )
g(x) − g(x0 )
= lim g(x)
+ lim f (x0 )
x→x0
x→x0
x − x0
x − x0
′
′
= g(x0 )f (x0 ) + f (x0 )g (x0 ) ,
x→x0
e da ciò segue la tesi.
Teorema 9.1.6 (Derivabilità della funzione reciproca)
Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione reale
tale che, per ogni x ∈ X, f (x) ̸= 0. Se x0 ∈ X è un punto di accumulazione
per X e se f è derivabile in x0 , allora la funzione reciproca 1/f è derivabile
in x0 e si ha
( )′
1
f ′ (x0 )
(x0 ) = −
.
f
f (x0 )2
Conseguentemente, se f è derivabile, anche la funzione reciproca 1/f è
derivabile e si ha
( )′
1
f′
=− 2 .
f
f
Dimostrazione. Dalla Proposizione 9.1.2, la funzione f è continua in x0 e quindi
lim
x→x0
(1/f )(x) − (1/f )(x0 )
−(f (x) − f (x0 ))
1
f ′ (x0 )
= lim
=−
,
x→x0
x − x0
x − x0
f (x) f (x0 )
f (x0 )2
da cui la tesi.
9.1 Funzioni derivabili
219
Teorema 9.1.7 (Derivabilità della funzione quoziente)
Siano X un sottoinsieme non vuoto di R ed f : X → R e g : X → R
funzioni reali. Si supponga che, per ogni x ∈ X, g(x) ̸= 0. Se x0 ∈ X è
un punto di accumulazione per X ed f e g sono derivabili in x0 , allora la
funzione f /g è derivabile in x0 e si ha
( )′
f ′ (x0 ) g(x0 ) − f (x0 ) g ′ (x0 )
f
(x0 ) =
.
g
g(x0 )2
Conseguentemente, se f e g sono derivabili, anche la funzione quoziente
f /g è derivabile in x0 e si ha
( )′
f
f ′ g − f g′
=
.
g
g2
Dimostrazione. Poiché
f
1
=f· ,
g
g
la derivabilità di f /g deriva direttamente dai Teoremi 9.1.6 e 9.1.5 precedenti; inoltre,
dagli stessi teoremi segue
( )′
( )′
1
1
f ′ (x0 ) g(x0 ) − f (x0 ) g ′ (x0 )
f
(x0 ) = f ′ (x0 )
+ f (x0 )
(x0 ) =
.
g
g(x0 )
g
g(x0 )2
e ciò completa la dimostrazione.
Si esamina, infine, la derivabilità delle funzioni composte e delle funzioni
inverse.
Teorema 9.1.8 (Teorema di derivazione delle funzioni composte)
Siano X e Y sottoinsiemi non vuoti di R ed f : X → R e g : Y → R
funzioni reali tali che f (X) ⊂ Y . Sia x0 ∈ X un punto di accumulazione
per X e si supponga che f sia derivabile in x0 e, posto y0 := f (x0 ), che
y0 sia di accumulazione per Y e g sia derivabile in y0 . Allora, la funzione
composta g ◦ f : X → R è derivabile in x0 e si ha
(g ◦ f )′ (x0 ) = g ′ (y0 ) f ′ (x0 ) .
Dimostrazione. Per quanto osservato in precedenza (vedasi la (9.1.2)), la funzione
Ry0 (g) : Y → R è continua in y0 e inoltre, dalla Proposizione 9.1.2, la funzione f è
continua in x0 . Allora, dal teorema sulla continuità delle funzioni composte (Teorema
8.1.3), la funzione Ry0 (g) ◦ f è continua in x0 e pertanto
lim
x→x0
g(f (x)) − g(y0 )
= g ′ (y0 ) .
f (x) − y0
Da ciò segue
lim
x→x0
g(f (x)) − g(f (x0 ))
x − x0
=
=
=
lim
g(f (x)) − g(f (x0 )) f (x) − f (x0 )
f (x) − f (x0 )
x − x0
lim
g(f (x)) − g(y0 )
f (x) − y0
x→x0
x→x0
g ′ (y0 )f ′ (x0 )
lim
x→x0
f (x) − f (x0 )
x − x0
Capitolo 9: Calcolo differenziale
220
e quindi la tesi.
Se f : X → R è una funzione reale iniettiva, posto Y = f (X), si può
considerare la funzione “inversa” f −1 : Y → R di f . Se x0 ∈ X è un punto
di accumulazione per X e se f è continua in x0 , allora l’elemento y0 = f (x0 )
di Y è un punto di accumulazione per Y .
Infatti, considerato un intorno I di y0 , dalla continuità di f in x0 , si può trovare un
intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, f (x) ∈ I; l’insieme X ∩ J r {x0 } è
non vuoto in quanto x0 è di accumulazione per X e considerato x ∈ X ∩ J r {x0 }, dalla
iniettività di f , segue f (x) ̸= y0 , per cui f (x) ∈ Y ∩ I r {y0 }; segue pertanto che l’insieme
Y ∩ I r {y0 } è non vuoto e ciò, essendo I un intorno arbitrario di y0 , dimostra che y0 è
di accumulazione per Y .
Per quanto riguarda la derivabilità di f −1 in y0 , si ha quanto segue.
Teorema 9.1.9 (Derivabilità della funzione inversa)
Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione reale
iniettiva. Sia x0 ∈ X un punto di accumulazione per X e si supponga che f
sia derivabile in x0 e che f ′ (x0 ) ̸= 0. Posto Y = f (X) e y0 = f (x0 ), se la
funzione inversa f −1 : Y → R di f è continua in y0 , allora f −1 è derivabile
in y0 e si ha
1
(f −1 )′ (y0 ) = ′
.
f (x0 )
Conseguentemente, se f è derivabile e se f −1 è continua, allora f −1 è
derivabile e si ha
1
(f −1 )′ = ′
.
f ◦ f −1
Dimostrazione. La funzione Rx0 (f ) : X → R è continua in x0 (vedasi la (9.1.2)) e inoltre
nel punto x0 assume il valore f ′ (x0 ) ̸= 0 e, dalla iniettività di f , Rx0 (f )(x) ̸= 0 per ogni
x ∈ X r {x0 }. Quindi Rx0 (f ) assume valori sempre diversi da 0 e se ne può considerare
la funzione reciproca 1/Rx0 (f ) : X → R, la quale risulta continua in y0 . Inoltre f −1 è
continua in y0 e quindi, dal teorema sulla continuità delle funzioni composte (Teorema
8.1.3), si ha
)
(
)
(
1
1
◦ f −1 (y) =
◦ f −1 (y0 ) ;
lim
y→y0
Rx0 (f )
Rx0 (f )
da tale relazione, essendo per ogni y ∈ Y r {y0 },
(
)
1
1
f −1 (y) − x0
f −1 (y) − f −1 (y0 )
◦ f −1 (y) =
=
=
f (f −1 (y)) − f (x0 )
Rx0 (f )
f (f −1 (y)) − f (x0 )
y − y0
f −1 (y) − x0
e inoltre
(
1
◦ f −1
Rx0 (f )
si ha direttamente la tesi.
)
(y) =
1
1
(x0 ) = ′
,
Rx0 (f )
f (x0 )
◃ Se non si suppone che f −1 sia continua in y0 , la tesi del teorema precedente in generale non vale.
9.1 Funzioni derivabili
221
Ad esempio, si consideri la funzione reale f :] − 1, 1] → R definita
ponendo, per ogni x ∈] − 1, 1],
{
f (x) :=
x ∈] − 1, 0] ,
x ∈]0, 1] ;
x+1,
x−1,
Nel punto x0 = 1, f è derivabile e si verifica direttamente che f’(1)=1=S
0/0; inoltre f è iniettiva e la funzione f −1 risulta definita in ] − 1, 1] e si ha,
per ogni y ∈] − 1, 1],
f −1 (y) =
{
y−1,
y+1,
y ∈] − 1, 0] ,
y ∈]0, 1] .
−1
Nel punto y0 = f (1) = 0, f −1 non è continua e risulta f+
(0) = 1 e
−1
−1
f− (0) = −1, per cui f
non è derivabile in 0.
9.1.3
Derivate delle funzioni elementari
Nella presente sezione vengono calcolate le derivate delle funzioni elementari.
Funzioni potenza ad esponente intero positivo
Si consideri la funzione potenza n-esima fn : R → R, n ≥ 1, e sia x0 ∈ R.
Per ogni x ∈ R, si ha
xn − xn0 = (x − x0 )
n−1
∑
xk x0n−k
k=0
e quindi
∑
xn − xn0
= lim
xk x0n−k = nxn−1
0
x→x0
x − x0
n−1
lim
x→x0
k=0
(se n = 1, si assume per convenzione x00 = 1 per x0 = 0). Pertanto la
funzione potenza fn è derivabile in x0 e (fn )′ (x0 ) = nxn−1
.
0
Dall’arbitrarietà di x0 ∈ R, segue che fn è derivabile e, per ogni x ∈ R,
Dxn = nxn−1 .
Capitolo 9: Calcolo differenziale
222
Funzioni radice
Si consideri la funzione radice f1/n , n ≥ 1. Se x0 ̸= 0, si ha
√
√
√
√
n
n
√
x0 + h − n x
1
x0 + h − n x
n
lim
=
x0 lim √
h→0
h→0 n x0
h
h
√
n
h/x0 − 1
√
= n x0 lim
h→0
h
(
)1/n
h
√
1+
−1
n x
x0
0
=
lim
x0 h→0
h/x0
=
1
(1 + y)1/n − 1
1
1
√
√
lim
=
.
y
n
n
n
n−1 y→0
x0
xn−1
0
Segue che f1/n è derivabile in ogni x ∈]0, +∞[ per n pari ed in ogni
x ∈ R r {0} se n è dispari e la sua derivata è data da
1
1
√
.
n n xn−1
Per quanto riguarda il punto x0 = 0, per ogni n ≥ 2 risulta
√
n
x
lim
= +∞
x→0 x
e quindi la funzione radice n-esima è dotata di derivata in 0 uguale a +∞.
Funzioni potenza ad esponente intero negativo
Si consideri la funzione potenza ad esponente intero negativo f−n : R r{
0} → R, n ≥ 1.
Tale funzione è la reciproca della restrizione della funzione potenza fn
all’insieme R r {0}; essa pertanto è derivabile e, per ogni x ∈ R r {0}, si ha
( )
1
nxn−1
n
D
=
−
= − n+1 .
n
2n
x
x
x
Funzioni potenza ad esponente razionale o reale
Si consideri la funzione potenza ad esponente razionale o reale fr definita
in ]0, +∞[ per r ≤ 0 ed in [0, +∞[ per r > 0. Per ogni x0 ∈]0, +∞[ risulta
(x0 + h)r − xr0
h→0
h
lim
xr0
(1 + h/x0 )r − 1
lim
h→0 x0 h→0
h/x0
r
(1
+
y)
−
1
= xr−1
lim
= rxr−1
.
0
0
y→0
y
= xr0 lim
9.1 Funzioni derivabili
223
Quindi fr è derivabile in x0 e la sua derivata è rxr−1
. Si conclude che fr è
0
derivabile in ]0, +∞[ e, per ogni x ∈]0, +∞[ si ha
D(xr ) = rxr−1 .
Se r > 0, nel punto x0 = 0, si ha

 0,
xr
1,
lim+
=

x
x→0
+∞ ,
r>1;
r=1;
0<r<1.
Quindi, se r ≥ 1, fr è derivabile in 0 con derivata nulla per r > 1 ed uguale
ad 1 per r = 1 ed è dotata di derivata in 0 uguale a +∞ se 0 < r < 1.
Funzioni esponenziali
Sia a > 0, a ̸= 1 e si consideri la funzione esponenziale expa : R → R.
Allora, per ogni x0 ∈ R, si ha
ax0 +h − ax0
ah − 1
= ax0 lim
= ax0 log a .
h→0
h→0
h
h
lim
Quindi expa è derivabile e, per ogni x ∈ R,
D(ax ) = ax log a .
In particolare, per ogni x ∈ R, si ha D(ex ) = ex .
Funzioni logaritmo
Sia a > 0, a ̸= 1 e si consideri la funzione logaritmo loga :]0, +∞[→ R.
Dal Teorema 9.1.9 segue che essa è derivabile e, per ogni x ∈]0, +∞[, posto
y = loga x, si ha
D(loga x) =
1
1
1
= y
=
.
y
D(a )
a log a
x log a
In particolare, per ogni x ∈ R, D(log x) = 1/x.
Funzioni trigonometriche
Si considerano ora le funzioni seno, coseno, tangente e cotangente. Per ogni
x0 ∈ R, risulta
lim
h→0
sin(x0 + h) − sin x0
h
sin x0 cos h + cos x0 sin h − sin x0
h
cos h − 1
sin h
+ sin x0 lim
= cos x0 lim
h→0
h→0 h
h
= cos x0
=
lim
h→0
Capitolo 9: Calcolo differenziale
224
e analogamente
lim
h→0
cos(x0 + h) − cos x0
h
=
=
=
cos x0 cos h − sin x0 sin h − cos x0
h
sin h
cos h − 1
− sin x0 lim
+ cos x0 lim
h→0 h
h→0
h
− sin x0 .
lim
h→0
Quindi le funzioni seno e coseno sono derivabili e si ha, per ogni x ∈ R,
D(sin x) = cos x ,
D(cos x) = − sin x .
Essendo quoziente di funzioni derivabili, dal Teorema 9.1.7 segue che anche
le funzioni tangente e cotangente sono derivabili e si ha, per ogni x ∈ R r
{π/2 + kπ | k ∈ Z},
D(tan x) =
1
= 1 + tan2 x .
cos2 x
e analogamente, per ogni x ∈ R r {kπ | k ∈ Z},
D(cot x) = −
1
= −(1 + cot2 x) .
sin2 x
Funzioni trigonometriche inverse
Infine, si considerano le funzioni arcoseno, arcocoseno, arcotangente e arcocotangente.
La restrizione della funzione seno all’intervallo [−π/2, π/2] è derivabile e
la sua derivata si annulla solamente nei punti −π/2 e π/2, che sono i valori
della funzione arcoseno agli estremi dell’intervallo [−1, 1]. Dal Teorema 9.1.9
segue che la funzione arcoseno è derivabile in ] − 1, 1[ e per ogni √
x ∈] − 1, 1[,
posto y = arcsin x ∈] − π/2, π/2[, si ottiene sin y = x e cos y = 1 − x2 (si
è tenuto presente che nell’intervallo ] − π/2, π/2[ il coseno è positivo), per
cui
1
1
1
D(arcsin x) =
=
=√
.
D(sin y)
cos y
1 − x2
Per quanto riguarda i punti −1 ed 1, si verifica direttamente che in tali
punti la funzione arcoseno è dotata di derivata uguale a +∞.
Per la funzione arcocoseno il procedimento è analogo a quello precedente; si osserva che la restrizione della funzione coseno all’intervallo [0, π] è
derivabile e la sua derivata si annulla solamente nei punti 0 e π; tali valori
sono assunti dalla funzione arcocoseno nei punti 1 e rispettivamente −1.
Applicando il Teorema 9.1.9 si deduce che la funzione arcocoseno è derivabile in ] − 1, 1[ e per ogni x ∈] − 1, 1[, posto y = arccos x ∈]0, π[, si ottiene
9.1 Funzioni derivabili
cos y = x e sin y =
]0, π[; pertanto
225
√
1 − x2 in quanto il coseno è positivo nell’intervallo
D(arccos x) =
1
1
1
=−
=−√
.
D(cos y)
sin y
1 − x2
Nei punti −1 ed 1, si verifica direttamente che la funzione arcocoseno è
dotata di derivata uguale a −∞.
Si consideri ora la funzione arcotangente. In questo caso, la restrizione
della funzione tangente all’intervallo ]−π/2, π/2[ è derivabile e la sua derivata è sempre diversa da 0. Dal Teorema 9.1.9 segue che la funzione arcotangente è derivabile e inoltre, per ogni x ∈ R, posto y = arctan x ∈]−π/2, π/2[,
si ottiene tan y = x, per cui
D(arctan x) =
1
1
1
=
=
.
2
D(tan y)
1 + x2
1 + tan y
Infine, per quanto riguarda la derivabilità della funzione arcocotangente,
si può procedere come nel caso precedente; la restrizione della funzione
cotangente all’intervallo ]0, π[ è derivabile e la sua derivata è sempre diversa
da 0. Dal Teorema 9.1.9 segue che la funzione arcocotangente è derivabile e
inoltre, per ogni x ∈ R, posto y = arccot x ∈]0, π[, si ottiene cot y = x, per
cui
1
1
1
D(arccot x) =
=−
=−
.
2
D(cot y)
1 + x2
1 + cot y
La derivabilità ed il calcolo della derivata delle funzioni arcocoseno ed
arcocotangente potevano essere ottenute alternativamente dalle uguaglianze
arccos =
π
− arcsin ,
2
arctan =
π
− arccot .
2
Funzione valore assoluto
Si è già osservato che tale funzione non è derivabile in 0 e che in tale punto
ha derivata destra uguale ad 1 e derivata sinistra uguale a −1.
Sia ora x0 ∈ R r {0}; se x0 > 0, si ha
lim
x→x0
|x| − |x0 |
x − x0
= lim
=1,
x→x0 x − x0
x − x0
mentre, se x0 < 0, risulta
lim
x→x0
x − x0
|x| − |x0 |
= lim −
= −1 ,
x→x0
x − x0
x − x0
226
Capitolo 9: Calcolo differenziale
Quindi la funzione valore assoluto è derivabile in R r {0} e, per ogni x ∈
R r {0}, si ha
x
|x|
D(|x|) =
(=
).
|x|
x
Osservazione 9.1.10 (Studio della derivabilità di una funzione reale) Le
regole di derivazione e le derivate delle funzioni elementari consentono in numerosi casi di discutere la derivabilità e, in caso affermativo, di determinare
la derivata di una funzione reale f : X → R ottenuta mediante operazioni
algebriche sulle funzioni elementari. In generale si procede come segue:
1. Innanzitutto, si determina il sottoinsieme D di X dei punti in cui non
si può assicurare subito la derivabilità della funzione. Se la funzione è
ottenuta mediante operazioni algebriche o di composizione di funzioni
elementari, i punti dell’insieme D sono i seguenti:
a) punti in cui l’argomento di una funzione radice o di una funzione
potenza con esponente compreso tra 0 e 1 è uguale a 0 (in quanto
tali funzioni non sono derivabili in 0);
b) punti in cui l’argomento di una funzione arcoseno oppure arcoseno è uguale a 1 oppure a −1 (in quanto le funzioni arcoseno e
arcocoseno non sono derivabili nei punti ±1);
c) punti in cui l’argomento di un valore assoluto è uguale a 0 (in
quanto la funzione valore assoluto non è derivabile nel punto 0).
Esclusi i punti precedenti, si può asserire che la funzione f è derivabile
in X r D.
2. Utilizzando le regole di derivazione, si calcola la derivata di f nell’insieme X r D.
3. Si studia la derivabilità di f in ogni punto x0 ∈ D. Poiché in questo
caso non si possono utilizzare le regole di derivazione, bisogna verificare direttamente la derivabilità attraverso la definizione; nel seguito,
si studierà la proprietà di continuità della derivata prima (Teorema
9.3.3) in base alla quale la derivata di f in x0 , se esiste, viene data dal
limite limx→x0 f ′ (x) e quindi per lo studio della derivabilità nei punti
x0 ∈ D, ci si può avvalere dell’espressione della derivata ottenuta al
punto 2) precedente.
A questo punto si raccolgono le informazioni ottenute e si precisa
definitivamente il sottoinsieme X ′ di X in cui f è derivabile fornendone
il valore della derivata in ogni punto di X ′ .
9.2 Teoremi di Rolle, Cauchy e Lagrange
9.2
227
Teoremi di Rolle, Cauchy e Lagrange
Anche per le funzioni derivabili valgono risultati di notevole interesse nel
caso in cui queste vengano considerate su un intervallo chiuso e limitato.
Teorema 9.2.1 (Teorema di Rolle)
Sia f : [a, b] → R una funzione reale continua in [a, b] e derivabile nell’intervallo aperto ]a, b[. Se f (a) = f (b), allora esiste almeno un punto x0 ∈]a, b[
tale che f ′ (x0 ) = 0.
Dimostrazione. Poiché f è continua, dal teorema di Weierstrass (Teorema 8.2.1), essa è
dotata di minimo e di massimo e quindi esistono c, d ∈ [a, b] tali che, per ogni x ∈ [a, b],
f (c) ≤ f (x) ≤ f (d). Si supponga dapprima che entrambi i punti c e d siano estremi
dell’intervallo [a, b] (c, d ∈ a, b). Dall’ipotesi f (a) = f (b), segue f (c) = f (d) e quindi la
funzione f deve essere costante. Allora la derivata di f è costantemente nulla e quindi la
tesi è verificata considerando un qualsiasi elemento x0 ∈]a, b[.
Si considera ora il caso in cui almeno uno dei punti c oppure d sia interno all’intervallo
[a, b]. Si supponga che c ∈]a, b[ per cui f è derivabile in c. Se fosse f ′ (c) > 0, per la
proprietà di permanenza del segno applicata alla funzione rapporto incrementale di f
relativa a c, si può trovare δ > 0 tale che, per ogni x ∈ [a, b]∩]c − δ, c + δ[r{c},
f (x) − f (c)
>0.
x−c
Poiché c è interno all’intervallo [a, b], l’intersezione [a, b]∩]c − δ, c[ risulta non vuota;
considerato x ∈ [a, b]∩]c − δ, c[, risulta innanzitutto (f (x) − f (c))/(x − c) > 0; essendo
x − c < 0, dovrà essere anche f (x) − f (c) < 0, da cui f (x) < f (c) e ciò contraddice il
fatto che f (c) è il minimo di f . Se fosse f ′ (c) < 0, si troverebbe δ > 0 tale che, per ogni
x ∈ [a, b]∩]c − δ, c + δ[r{c},
f (x) − f (c)
<0.
x−c
Poiché c è interno all’intervallo [a, b], si può considerare x ∈ [a, b]∩]c, c + δ[ per il quale
(f (x) − f (c))/(x − c) < 0; allora, essendo x − c > 0, si avrebbe ancora f (x) − f (c) < 0 e
quindi f (x) < f (c), contraddicendo anche in questo caso il fatto che f (c) è il minimo di
f.
x0
Si conclude che deve essere necessariamente f ′ (c) = 0 e la tesi segue considerando
= c. Se il punto d è interno all’intervallo [a, b], si dimostra in modo analogo che
f ′ (d) = 0 e quindi si può considerare x0 = d.
Tenendo presente l’interpretazione geometrica della derivata, e che il
coefficiente angolare di una retta è uguale a 0 se e solo se la retta è parallela
all’asse delle ascisse, si può dire che per una funzione continua in un intervallo chiuso e limitato e derivabile tranne al più che agli estremi, esiste una
tangente orizzontale in almeno un punto interno a tale intervallo. Si osservi
inoltre che i punti interni in cui la derivata di f si annulla sono quelli di
massimo e di minimo per f .
Dal teorema di Rolle possono essere dedotti facilmente i seguenti ulteriori
risultati.
Capitolo 9: Calcolo differenziale
228
y
0
x0
x
Figura 9.2: Teorema di Rolle.
Teorema 9.2.2 (Teorema di Cauchy)
Siano f : [a, b] → R e g : [a, b] → R funzioni reali continue in [a, b] e
derivabili in ]a, b[ e si supponga che, per ogni x ∈]a, b[, g ′ (x) ̸= 0. Allora
g(a) ̸= g(b) ed inoltre esiste almeno un punto x0 ∈]a, b[ tale che
f ′ (x0 )
f (b) − f (a)
=
.
g ′ (x0 )
g(b) − g(a)
(9.2.1)
Dimostrazione. Se fosse g(a) = g(b), si potrebbe applicare il teorema di Rolle precedente
alla funzione g e si otterrebbe l’esistenza di un punto interno all’intervallo [a, b] in cui
la derivata di g si annullerebbe, il che è stato escluso per ipotesi. Quindi deve essere
g(a) ̸= g(b).
Si definisce ora la funzione h : [a, b] → R ponendo, per ogni x ∈ [a, b],
h(x) := f (x) −
f (b) − f (a)
(g(x) − g(a)) .
g(b) − g(a)
Tale funzione è continua in quanto somma di funzioni continue ed è derivabile in ]a, b[ in
quanto somma di funzioni derivabili in ]a, b[; si ha inoltre
h(a)
=
f (a) −
f (b) − f (a)
(g(a) − g(a)) = f (a) ,
g(b) − g(a)
h(b)
=
f (b) −
f (b) − f (a)
(g(b) − g(a)) = f (b) − f (b) + f (a) = f (a) ,
g(b) − g(a)
e quindi h(a) = h(b). Si può pertanto applicare il teorema di Rolle alla funzione h, e si
conclude che esiste x0 ∈]a, b[ tale che h′ (x0 ) = 0. Poiché, per ogni x ∈]a, b[,
h′ (x) = f ′ (x) −
f (b) − f (a) ′
g (x) ,
g(b) − g(a)
9.2 Teoremi di Rolle, Cauchy e Lagrange
da h′ (x0 ) = 0 segue
f ′ (x0 ) =
229
f (b) − f (a) ′
g (x0 ) ,
g(b) − g(a)
e dividendo entrambi i membri per g ′ (x0 ) ̸= 0, si ottiene la tesi.
Teorema 9.2.3 (Teorema di Lagrange, o del valor medio)
Sia f : [a, b] → R una funzione reale continua in [a, b] e derivabile in ]a, b[.
Allora esiste almeno un punto x0 ∈]a, b[ tale che
f ′ (x0 ) =
f (b) − f (a)
.
b−a
(9.2.2)
Dimostrazione. Si consideri l’ulteriore funzione g : [a, b] → R definita ponendo, per ogni
x ∈ [a, b], g(x) = x. Tale funzione è derivabile e, per ogni x ∈ [a, b], g ′ (x) = 1 ̸= 0. Sono
quindi soddisfatte le ipotesi del teorema di Cauchy precedente e pertanto esiste un punto
x0 ∈]a, b[ tale che
f (b) − f (a)
f ′ (x0 )
=
;
g ′ (x0 )
g(b) − g(a)
poiché g ′ (x0 ) = 1 e g(b) − g(a) = b − a, la tesi è completamente dimostrata.
Anche il teorema di Lagrange può essere interpretato geometricamente
in modo molto semplice. Si denoti infatti con A il punto del piano cartesiano
avente coordinate (a, f (a)) e con B quello di coordinate (b, f (b)); la retta
del piano passante per i punti A e B (cioè, la retta secante il grafico di f
nei punti a e b) ha equazione
y − f (a)
f (b) − f (a)
=
;
x−a
b−a
da ciò segue che il secondo membro della (9.2.2) rappresenta il coefficiente
angolare della retta passante per i punti A e B. Dal teorema di Lagrange,
esiste un punto interno x0 ∈]a, b[ tale che la retta tangente al grafico di f
in x0 abbia lo stesso coefficiente angolare della retta secante al grafico di
f nei punti a e b. Quindi, si conclude che se f : [a, b] → R è continua in
[a, b] e derivabile in ]a, b[, esiste almeno un punto interno x0 ∈]a, b[ in cui la
retta tangente al grafico di f in x0 e la retta secante il grafico di f nei punti
estremi a e b sono parallele.
Il teorema di Lagrange è stato dedotto dal teorema di Cauchy il quale a
sua volta è stato dimostrato come conseguenza del teorema di Rolle. Si può
osservare inoltre che il teorema di Rolle è un caso particolare del teorema
di Lagrange in quanto, se f (a) = f (b), il secondo membro della (9.2.2) è
nullo. Si conclude che i Teoremi 9.2.1, 9.2.2 e 9.2.3 sono tra loro equivalenti
e conseguono dal teorema di Weierstrass per le funzioni continue e derivabili
all’interno di un intervallo chiuso e limitato.
Capitolo 9: Calcolo differenziale
230
y
B
A
0 x0
x
Figura 9.3: Teorema di Lagrange.
9.3
9.3.1
Applicazioni al calcolo dei limiti
Teoremi di L’Höpital
Un’importante applicazione del calcolo differenziale riguarda la possibilità
di risolvere in maniera elementare alcuni limiti che si presentano in una
forma indeterminata. Si riconosce subito, infatti, che se f : X → R e
g : X → R sono funzioni derivabili in un punto x0 ∈ X con g ′ (x0 ) ̸= 0 e se
f (x0 ) = g(x0 ) = 0, allora per il limite
lim
x→x0
f (x)
,
g(x)
che si presenta nella forma indeterminata
lim
x→x0
0
, si ha
0
f (x)
f ′ (x0 )
= ′
.
g(x)
g (x0 )
9.3 Applicazioni al calcolo dei limiti
231
Infatti, basta osservare che
f (x) − f (x0 )
f (x)
f (x) − f (x0 )
f ′ (x0 )
x − x0
lim
= lim
= lim
= ′
.
x→x0 g(x)
x→x0 g(x) − g(x0 )
x→x0 g(x) − g(x0 )
g (x0 )
x − x0
Una situazione più generale viene esaminata nei risultati successivi.
Teorema 9.3.1 (Prima regola di L’Höpital)
Sia x0 ∈ R e si denoti con I uno degli intervalli ]a, x0 [ oppure ]x0 , b[ (a, b ∈
R). Siano f : I → R e g : I → R funzioni reali tali che
1. Per ogni x ∈ I, g(x) ̸= 0;
2. lim f (x) = 0, lim g(x) = 0;
x→x0
x→x0
3. f e g sono derivabili con g ′ (x) ̸= 0 per ogni x ∈ I;
4. Esiste il limite lim
x→x0
f ′ (x)
.
g ′ (x)
Allora esiste anche il limite lim
x→x0
lim
x→x0
f (x)
e si ha
g(x)
f (x)
f ′ (x)
= lim ′
.
g(x) x→x0 g (x)
(9.3.1)
Dimostrazione. Per brevità si considera solo il caso in cui I =]a, x0 [. Si ponga ℓ :=
limx→x0 f ′ (x)/g ′ (x). Per ogni x ∈ I, risulta g(x) ̸= 0, altrimenti g tenderebbe allo stesso
valore 0 in due punti distinti e la sua derivata, come conseguenza del Teorema 9.2.1, si
dovrebbe annullare in almeno un punto interno all’intervallo che ha come estremi tali
due punti e ciò è escluso dalle ipotesi. In una prima fase si considera il caso in cui ℓ ∈ R.
Allora, fissato ε > 0, deve esistere x1 ∈ I tale che, per ogni x ∈]x1 , x0 [,
ℓ−
ε
f ′ (x)
ε
< ′
<ℓ+ .
2
g (x)
2
Per ogni x, t ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, esiste c ∈]x1 , x0 [ tale che
f ′ (c)
f (x) − f (t)
=
g ′ (c)
g(x) − g(t)
e quindi
ε
f (x) − f (t)
−ℓ <
(1)
g(x) − g(t)
2
Sia ora x ∈]x1 , x0 [; dal fatto che limt→x0 f (t) = 0 e limt→x0 g(t) = 0, segue anche
limt→x0 (f (x) − f (t))/(g(x) − g(t)) = f (x)/g(x); se fosse
f (x)
ε
−ℓ > ,
g(x)
2
Capitolo 9: Calcolo differenziale
232
dal fatto che ]−∞, ℓ−ε/2[∪]ℓ+ε/2, +∞[ è un intorno di f (x)/g(x), seguirebbe l’esistenza
di δ > 0 tale che, per ogni t ∈ I∩]x − δ, x + δ[r{x},
f (x) − f (t)
ε
−ℓ >
g(x) − g(t)
2
e ciò contraddice la (1).
Quindi deve essere, per ogni x ∈]x1 , x0 [
ε
f (x)
−ℓ ≤ <ε.
g(x)
2
Dall’arbitrarietà di ε > 0 segue quindi la tesi.
Si considera ora il caso in cui ℓ = +∞ (se ℓ = −∞ si procede analogamente). Allora,
fissato M ∈ R, esiste x1 ∈ I tale che, per ogni x ∈]x1 , x0 [,
f ′ (x)
>M +1.
g ′ (x)
Come nel caso precedente, per ogni x, t ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, si
trova c ∈]x1 , x0 [ tale che
f ′ (c)
f (x) − f (t)
=
g ′ (c)
g(x) − g(t)
e quindi
f (x) − f (t)
> M + 1.
(2)
g(x) − g(t)
Sia ora x ∈]x1 , x0 [; dal fatto che limt→x0 f (t) = 0 e limt→x0 g(t) = 0, segue anche
limt→x0 (f (x) − f (t))/(g(x) − g(t)) = f (x)/g(x); se fosse
f (x)
<M +1,
g(x)
esisterebbe δ > 0 tale che, per ogni t ∈ I∩]x − δ, x + δ[r{x},
f (x) − f (t)
<M +1
g(x) − g(t)
e ciò contraddice la (2). Allora, per ogni x ∈]x1 , x0 [, deve essere
f (x)
≥M +1>M
g(x)
e dall’arbitrarietà di M ∈ R si ha la tesi anche in questo caso.
Teorema 9.3.2 (Seconda regola di L’Höpital)
Sia x0 ∈ R e si denoti con I uno degli intervalli ]a, x0 [ oppure ]x0 , b[ (a, b ∈
R). Siano f : I → R e g : I → R funzioni reali tali che
1. lim |f (x)| = +∞,
x→x0
lim |g(x)| = +∞;
x→x0
2. f e g sono derivabili con g ′ (x) ̸= 0 per ogni x ∈ I;
3. Esiste il limite lim
x→x0
f ′ (x)
.
g ′ (x)
9.3 Applicazioni al calcolo dei limiti
Allora esiste anche il limite lim
x→x0
lim
x→x0
233
f (x)
e si ha
g(x)
f (x)
f ′ (x)
= lim ′
.
g(x) x→x0 g (x)
(9.3.2)
Dimostrazione. In questo caso l’ipotesi che g sia diversa da 0 in un intorno di x0 è
assicurata dal fatto che il limite del suo valore assoluto è infinito. Anche ora si considera
per brevità il caso in cui I =]a, x0 [ e si pone ℓ := limx→x0 f ′ (x)/g ′ (x).
Si suppone in una prima fase che ℓ ∈ R e si fissa ε > 0. Essendo limx→x0 f ′ (x)/g ′ (x) =
ℓ, si può trovare x1 ∈ I tale che, per ogni x ∈]x1 , x0 [,
f ′ (x)
ε
−ℓ < .
g ′ (x)
2
Si fissi t ∈]x1 , x0 [; per ogni x ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, esiste
c ∈]x1 , x0 [ tale che
f ′ (c)
f (t) − f (x)
=
g ′ (c)
g(t) − g(x)
e quindi
f (t) − f (x)
ε
ε
<ℓ+ .
(1)
ℓ− <
2
g(t) − g(x)
2
Poiché limx→x0 |f (x)| = +∞, limx→x0 |g(x)| = +∞, si può trovare x2 ∈]x1 , x0 [ tale che,
per ogni x ∈]x2 , x0 [, |f (t)| < |f (x)| e |g(t)| < |g(x)|. Pertanto, posto
f (t)
f (x)
χ(x) :=
g(t)
1−
g(x)
1−
per ogni x ∈]x2 , x0 [, si ha χ(x) > 0 e
f (t) − f (x)
f (x)
=
χ(x) ;
g(t) − g(x)
g(x)
conseguentemente, la (1) può essere scritta al modo seguente, per ogni x ∈]x2 , x0 [,
f (x)
ℓ + ε/2
ℓ − ε/2
<
<
.
χ(x)
g(x)
χ(x)
(2)
Poiché limx→x0 χ(x) = 1, si può considerare x3 ∈]x2 , x0 [ tale che, per ogni x ∈]x3 , x0 [,
ℓ−ε≤
ℓ − ε/2
,
χ(x)
ℓ + ε/2
≤ℓ+ε
χ(x)
e quindi, dalla (2),
ℓ−ε<
f (x)
<ℓ+ε.
g(x)
Dall’arbitrarietà di ε > 0 segue limx→x0 f (x)/g(x) = ℓ e quindi la tesi.
Si considera ora il caso in cui ℓ = +∞ (se ℓ = −∞ il procedimento è analogo).
Fissato M ∈ R, da limx→x0 f ′ (x)/g ′ (x) = ℓ, segue l’esistenza di x1 ∈ I tale che, per ogni
x ∈]x1 , x0 [,
f ′ (x)
>M +1.
g ′ (x)
Capitolo 9: Calcolo differenziale
234
Si fissi ora t ∈]x1 , x0 [; per ogni x ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, esiste
c ∈]x1 , x0 [ tale che
f ′ (c)
f (t) − f (x)
=
g ′ (c)
g(t) − g(x)
e quindi
f (t) − f (x)
>M +1.
(3)
g(t) − g(x)
Come nel caso precedente, poiché limx→x0 |f (x)| = +∞, limx→x0 |g(x)| = +∞, esiste
x2 ∈]x1 , x0 [ tale che, per ogni x ∈]x2 , x0 [, |f (t)| < |f (x)| e |g(t)| < |g(x)| e quindi, posto
f (t)
f (x)
χ(x) :=
;
g(t)
1−
g(x)
1−
dunque, la (3) diviene, per ogni x ∈]x2 , x0 [,
f (x)
M +1
>
.
g(x)
χ(x)
(4)
Essendo limx→x0 χ(x) = 1, risulta limx→x0 (M + 1)/χ(x) = M + 1 e pertanto si può
considerare x3 ∈]x2 , x0 [ tale che, per ogni x ∈]x3 , x0 [,
M +1
>M .
χ(x)
Dalla (4) segue, per ogni x ∈]x3 , x0 [,
f (x)
>M .
g(x)
Dall’arbitrarietà di M ∈ R si ottiene la tesi.
◃ Nei risultati precedenti sono state considerate funzioni reali definite in
intervalli del tipo ]a, x0 [ oppure ]x0 , b[ e quindi i limiti considerati coincidono
con i limiti da sinistra oppure da destra in x0 . Naturalmente, considerando
separatamente i limiti da destra e da sinistra in x0 , gli stessi risultati valgono
per funzioni definite in ]a, b[r{x0 } (a, b ∈ R).
◃ Conviene osservare che i Teoremi 9.3.1 e 9.3.2 forniscono condizioni sufficienti per l’esistenza del limite del rapporto di due funzioni. Nel caso in
cui il limite del rapporto delle derivate delle due funzioni non esista, non
si può concludere nulla per quanto riguarda il limite del rapporto delle due
funzioni e bisogna ricorrere a metodi differenti.
◃ Ad esempio, si consideri il limite
lim
x→+∞
x
,
x + sin x
il quale si presenta nella forma indeterminata
per ogni x > 1,
+∞
; tenendo presente che,
+∞
x
x
x
≤
≤
,
x+1
x + sin x
x−1
9.3 Applicazioni al calcolo dei limiti
235
si riconosce subito che tale limite è uguale ad 1; invece, il limite lim 1/(1+
x→+∞
cos x) del rapporto delle derivate non esiste.
◃ Bisogna naturalmente anche accertarsi che il limite si presenti in una
delle forme indeterminate previste nei teoremi precedenti, altrimenti l’applicazione delle regole di L’Höpital può portare a risultati errati.
Ad esempio, il limite
log(cos x) + x tan x
x→+∞
x+1
lim
non esiste, mentre il limite limx→+∞ x (1+tan2 x) del rapporto delle derivate
è uguale a +∞.
◃ In generale, può anche capitare che il limite del rapporto delle derivate
si presenti anch’esso in una forma indeterminata. In tal caso, si può cercare
di continuare ad applicare ancora la stessa regola di L’Höpital e studiare
cosı̀ il limite del rapporto delle derivate seconde o ancora successive delle
due funzioni. Più precisamente, se f : I → R e g : I → R sono funzioni
reali derivabili n volte (n ≥ 1) e si supponga che, per ogni k = 1, . . . , n e
per ogni x ∈ I, g (k) (x) ̸= 0. Se, per ogni k = 0, . . . , n − 1,
lim f (k) (x) = 0 ,
x→x0
lim g (k) (x) = 0
x→x0
oppure
lim |f (k) (x)| = +∞ ,
x→x0
e se esiste il limite lim
x→x0
lim |g (k) (x)| = +∞ ,
x→x0
f (n) (x)
f (x)
, allora esiste anche il limite lim
e si
x→x0 g(x)
g (n) (x)
ha
lim
x→x0
f (x)
f (n) (x)
.
= lim (n)
g(x) x→x0 g (x)
◃ Le regole di L’Höpital possono essere applicate in maniera opportuna
anche ad altre forme indeterminate.
• la forma indeterminata 0·(±∞) può essere ricondotta a quelle previste
nei risultati precedenti tenendo presente che, per ogni x ∈ I,
f (x) g(x) =
g(x)
f (x)
=
.
1/g(x)
1/f (x)
236
Capitolo 9: Calcolo differenziale
• Anche la forma indeterminata +∞ − ∞ può essere ricondotta a quelle
previste dalle regole di L’Höpital tenendo presente che, per ogni x ∈ I,
f (x) + g(x)
1
1
+
f (x)g(x)
f (x) g(x)
f (x) + g(x) =
=
.
1
1
f (x)g(x)
f (x)g(x)
Alternativamente, si può tenere presente che, per ogni x ∈ I,
(
)
)
(
g(x)
f (x)
f (x) + g(x) = f (x) 1 +
+1 .
= g(x)
f (x)
g(x)
• Anche le forme indeterminate 1+∞ , 00 , (±∞)0 possono essere ricondotte ai casi già considerati tenendo presente che, se f : I → R e
g : I → R sono funzioni reali e se, per ogni x ∈ I, f (x) > 0 allora, per
ogni x ∈ I,
f (x)g(x) = eg(x) log(f (x)) .
◃ Una interessante conseguenza della prima regola di L’Höpital riguarda
la continuità della derivata prima; si può osservare, infatti, che il limite del
(x0 )
rapporto incrementale limx→x0 f (x)−f
di una funzione f continua in un
x−x0
punto x0 si presenta nella forma indeterminata 0/0; applicando il Teorema
9.3.1 a tale limite si ottiene il seguente criterio di derivabilità.
Teorema 9.3.3 (Continuità della derivata)
Siano I un intervallo di R, x0 ∈ I ed f : I → R una funzione continua in
I e derivabile in I r {x0 }. Se esiste il limx→x0 f ′ (x), allora f è dotata di
derivata in x0 e si ha
f ′ (x0 ) = lim f ′ (x) .
(9.3.3)
x→x0
Dimostrazione. Poiché f è continua in x0 , il limite del rapporto incrementale di f in x0
si presenta nella forma indeterminata 0/0. Inoltre, per tale limite sono soddisfatte tutte
le ipotesi del Teorema 9.3.1 e da esso si ottiene la tesi.
Dal risultato precedente segue che se il limite limx→x0 f ′ (x) esiste ed è
finito, la funzione f è derivabile in x0 e vale la (9.3.3) (se il limite esiste ma
non è finito, la funzione risulta solamente dotata di derivata in x0 ).
Come conseguenza di tale risultato, se la derivabilità di una funzione
in un punto non viene assicurata dalle regole di derivazione si può studiare
semplicemente il limite della derivata prima in tale punto piuttosto che il
limite del rapporto incrementale.
9.3 Applicazioni al calcolo dei limiti
9.3.2
237
Formula di Taylor
Sia f : X → R una funzione derivabile in un punto x0 ∈ X di accumulazione
per X; si è visto nella sezione precedente che il grafico di f è dotato di retta
tangente nel punto x0 avente equazione
y = f (x0 ) + f ′ (x0 )(x − x0 ) .
Se x ∈ X, la differenza tra il valore della funzione e quello della retta
tangente in x è data da f (x) − f (x0 ) − f ′ (x0 )(x − x0 ) e si ha
lim
x→x0
f (x) − f (x0 ) − f ′ (x0 )(x − x0 )
f (x) − f (x0 )
= lim
− f ′ (x0 ) = 0 ;
x→x0
x − x0
x − x0
quindi la differenza tra il valore della funzione e quello della retta tangente
al grafico di f in x0 è un infinitesimo di ordine maggiore di 1. Ci si può ora
chiedere in modo abbastanza naturale se sia possibile ottenere un’approssimazione più soddisfacente dei valori della funzione considerando polinomi
di grado maggiore di 1. I polinomi adatti a tale scopo si ottengono imponendo nel punto x0 il valore del polinomio e quello delle sue derivate fino
ad un ordine fissato uguali rispettivamente al valore della funzione e delle
sue derivate nel punto x0 fino allo stesso ordine.
Definizione 9.3.4 Siano X un sottoinsieme di R, x0 ∈ X un punto di
accumulazione per X ed f : X → R una funzione reale derivabile n volte in
x0 (n ∈ N). Si dice polinomio di Taylor di f di grado n relativo ad x0 il
polinomio Tn : R → R definito ponendo, per ogni x ∈ R,
Tn (x)
:=
f (x0 ) + f ′ (x0 )(x − x0 ) + f ′′ (x0 )
(x − x0 )n
n!
n
∑
(x − x0 )k
f (k) (x0 )
k!
(x − x0 )2
+
2
(9.3.4)
+ · · · + f (n) (x0 )
=
(9.3.5)
k=0
(per k = 0, valgono le convenzioni f (0) (x0 ) = f (x0 ) e (x − x0 )0 = 1 se
x = x0 ).1
Il polinomio T0 si riduce alla funzione costante di costante valore f (x0 ),
mentre T1 fornisce l’equazione della retta tangente al grafico di f in x0 .
1 Se occorre specificare la funzione f alla quale si riferisce il polinomio di Taylor T
n
viene preferita la notazione Tn (f ) e se occorre specificare anche il punto x0 si usa la
notazione Tn (f, x0 ).
Capitolo 9: Calcolo differenziale
238
Si riconosce facilmente che, per ogni k, p ∈ N,

 k(k − 1) · · · (k − p + 1)(x − x0 )k−p ,
p
k
k! ,
D ((x − x0 ) ) =

0,
p<k,
p = k ;,
p>k,
(9.3.6)
e conseguentemente, per ogni k = 0, . . . , n,
Tn(k) (x0 ) = f (k) (x0 ) .
(9.3.7)
Si osserva ancora che, per induzione su j = 0, . . . , n, dalla (9.3.6) si
riconosce facilmente la validità della formula
Tn (f )(j) = Tn−j (f (j) ) ,
(9.3.8)
cioè la derivata j-esima del polinomio di Taylor di ordine n della funzione
f in x0 coincide con il polinomio di Taylor di ordine n − j della derivata
j-esima di f in x0 .
◃ Ad esempio, si consideri la funzione f (x) := x sin x, x ∈ R ed il punto
iniziale x0 = 0; si ha, per ogni x ∈ R,
T1 (x) = 0 ,
2
x4
6
T8 (x) = T9 (x) = x −
x4
6
2
T2 (x) = T3 (x) = x ,
T4 (x) = T5 (x) = x2 −
T6 (x) = T7 (x) = x2 −
4
x
6
,
T10 (x) = x2 −
x4
6
+
x6
120
+
x6
120
,
+
x6
120
−
−
x8
5040
+
x8
5040
,
x10
362880
;
nella Figura 9.4 viene tracciato approssimativamente il grafico di T2 , T4 , T6 ,
T8 e T10 = x2 − x4 /6 + x6 /120 − x8 /5040 + x10 /362880) e si può notare
come i polinomi di Taylor approssimino in maniera sempre più accurata la
funzione assegnata in un intorno del punto 0.
Tale aspetto dei polinomi di Taylor viene messo in evidenza nel risultato
seguente.
Teorema 9.3.5 (Formula di Taylor con il resto di Peano)
Siano I un intervallo, x0 ∈ I ed f : I → R una funzione reale derivabile n
volte in x0 ed n − 1 volte in I r {x0 } con n ≥ 1.
Allora esiste una funzione σn : I → R tale che, per ogni x ∈ I,
f (x) = Tn (x) + σn (x)
(x − x0 )n
,
n!
(9.3.9)
ed inoltre
lim σn (x) = 0 .
x→x0
(9.3.10)
9.3 Applicazioni al calcolo dei limiti
239
y
T10
T2 T6
f
x
0
T4
T8
Figura 9.4: Polinomi di Taylor.
Dimostrazione. L’uguaglianza (3.6) è verificata considerando la funzione σn : I → R
definita ponendo, per ogni x ∈ I,

n!

(f (x) − Tn (x)) , x ̸= x0 ,
σn (x) :=
(x − x0 )n

0,
x = x0 .
Bisogna pertanto dimostrare la (9.3.10), cioè che σn è continua in x0 . Il limite (9.3.10) si
presenta nella forma indeterminata 0/0 e ad esso si può applicare la regola di L’Höpital.
Dalle (9.3.7) e (9.3.8), segue
lim f (n−j) (x) − Tj (f (n−j) )(x) = f (n−j) (x0 ) − Tj (f (n−j) )(x0 ) = 0
x→x0
per ogni j = 1, . . . , n − 1 e quindi, ancora dalla (9.3.8) e dal Teorema 9.3.1, si ottiene
lim σn (x)
x→x0
n!
=
(n − 1)! lim
=
f (n−1) (x) − T1 (f (n−1) )(x)
lim
x→x0
x − x0
=
=
lim
f (x) − Tn (f )(x)
f ′ (x) − Tn−1 (f ′ )(x)
= n! lim
x→x0
(x − x0 )n
n(x − x0 )n−1
=
x→x0
x→x0
f ′′ (x) − Tn−2 (f ′′ )(x)
= ...
(n − 1)(x − x0 )n−2
f (n−1) (x) − f (n−1) (x0 ) − f (n) (x0 )(x − x0 )
x − x0
(
)
(n−1)
(n−1)
f
(x) − f
(x0 )
lim
− f (n) (x0 ) = 0
x→x0
x − x0
lim
x→x0
e quindi la tesi è completamente dimostrata.
Capitolo 9: Calcolo differenziale
240
La formula (9.3.6) viene denominata formula di Taylor di f di punto
iniziale x0 e di ordine n con il resto di Peano. Nel caso in cui x0 = 0, essa
viene denominata formula di Mc Laurin di f di ordine n con il resto di
Peano e diventa, per ogni x ∈ I,
f (x) =
n
∑
k=0
f (k) (0)
xk
xn
+ σn (x)
.
k!
n!
(9.3.11)
◃ Un modo alternativo di esprimere il resto è espresso nel risultato successivo che rappresenta una generalizzazione del teorema di Lagrange. Per comodità, se x0 ed x sono numeri reali distinti, conviene denotare con I(x0 , x)
l’intervallo aperto di estremi x0 ed x, cioé
{
]x0 , x[ ,
x0 < x ,
I(x0 , x) :=
]x, x0 [ ,
x < x0 .
Teorema 9.3.6 (Formula di Taylor con il resto di Lagrange)
Siano I un intervallo, x0 ∈ I ed f : I → R una funzione reale derivabile n
volte (n ≥ 1) in I r {x0 } ed n − 1 volte in x0 con f (n−1) continua in x0 .
Allora, per ogni x ∈ I r {x0 }, esiste ξ ∈ I(x0 , x) tale che
f (x) = Tn−1 (x) + f (n) (ξ)
(x − x0 )n
.
n!
(9.3.12)
Dimostrazione. Si fissi x ∈ I r {x0 } e si denoti con I l’intervallo chiuso avente x ed x0
come estremi. Si definisce ora la funzione F : I → R ponendo, per ogni t ∈ I,
F (t)
:=
=
(x − t)n
(f (x) − Tn−1 (f, x0 )(x))
(x − x0 )n
(
)
n−1
n−1
∑
∑
(x − t)n
(x − x0 )k
(x − t)k
(k)
+
f
(x)
−
f
(x
)
.
f (k) (t)
0
k!
(x − x0 )n
k!
k=0
k=0
Tn−1 (f, t)(x) +
Dalle ipotesi assunte sulla funzione f , segue che F è continua in I e derivabile in I(x0 , x);
inoltre
F (x)
=
Tn−1 (f, x)(x) = f (x) ,
F (x0 )
=
Tn−1 (f, x0 )(x) + (f (x) − Tn−1 (f, x0 )(x)) = f (x) ,
e quindi, dal Teorema 9.2.1 di Rolle, esiste ξ ∈ I(x0 , x) tale che F ′ (ξ) = 0. Tenendo
presente che, per ogni t ∈ I(x0 , x),
)
n−1
∑(
(x − t)k−1
(x − t)k
F ′ (t) = f ′ (t) +
f (k+1) (t)
− f (k) (t)
k!
(k − 1)!
k=1
(
)
n−1
∑
n(x − t)n−1
(x − x0 )k
(k)
−
f
(x)
−
f
(x
)
0
(x − x0 )n
k!
k=0
=
f ′ (t) +
n−1
∑
k=1
f (k+1) (t)
n−2
∑
(x − t)k
(x − t)k
f (k+1) (t)
−
k!
k!
k=0
9.3 Applicazioni al calcolo dei limiti
−
=
=
=
n(x − t)n−1
(x − x0 )n
(
f (x) −
n−1
∑
f (k) (x0 )
k=0
241
(x − x0 )k
k!
)
(x − t)n−1
f (t) + f (t)
− f ′ (t)
(n − 1)!
)
(
n−1
∑
n(x − t)n−1
(x − x0 )k
(k)
−
f
(x)
−
f
(x
)
0
(x − x0 )n
k!
k=0
(
)
n−1
∑
(x − x0 )k
(x − t)n−1
n(x − t)n−1
(k)
f
(x
)
f (n) (t)
−
f
(x)
−
0
(n − 1)!
(x − x0 )n
k!
k=0
(
(
))
n−1
∑
(x − x0 )n
(x − x0 )k
n(x − t)n−1
(n)
(k)
f (t)
− f (x) −
f (x0 )
,
(x − x0 )n
n!
k!
k=0
′
(n)
si conclude che deve essere
f (n) (ξ)
n−1
∑
(x − x0 )n
(x − x0 )k
= f (x) −
f (k) (x0 )
n!
k!
k=0
e da quest’ultima si ottiene la tesi.
La formula (9.3.12) viene denominata formula di Taylor di f di punto
iniziale x0 e di ordine n con il resto di Lagrange.
Anche in questo caso, se x0 = 0, essa viene denominata formula di Mc
Laurin di f di ordine n con il resto di Lagrange e si scrive nel seguente
modo, per ogni x ∈ I r {0},
f (x) =
n−1
∑
k=0
f (k) (0)
xk
xn
+ f (n) (ξ)
,
k!
n!
(9.3.13)
|ξ| < |x|.
Nel caso n = 1, la (9.3.12) si riduce ovviamente al Teorema 9.2.3 di
Lagrange.
Osservazione 9.3.7 La formula di Taylor con il resto di Lagrange consente
anche di valutare l’errore che si commette approssimando una funzione con
il polinomio di Taylor di ordine n in un intorno di un punto x0 .
Infatti, nelle ipotesi del Teorema 9.3.6 e supposto che f (n) sia limitata
in I r {x0 }, allora, posto M := supx∈Ir{x0 } |f (n) (x)|, per ogni x ∈ I, si ha
|f (x) − Tn−1 (x)| ≤ M
|x − x0 |n
.
n!
(9.3.14)
Conviene a questo punto scrivere la formula di Taylor per alcune funzioni
elementari.
Capitolo 9: Calcolo differenziale
242
Formula di Taylor per i polinomi
Sia P : R → R un polinomio di grado n e siano a0 , . . . , an ∈ R, con an ̸= 0,
tali che P (x) = a0 + · · · + an xn per ogni x ∈ R. Ovviamente, P è una
funzione infinite volte derivabile e si ha P (n) (x) = an per ogni x ∈ R, mentre
tutte le derivate successive P (k) con k > n sono nulle. Fissato x0 ∈ R, la
formula di Taylor di P di ordine n relativa ad x0 con il resto di Lagrange;
in questo caso, per ogni x ∈ R, considerato l’elemento ξ ∈ I(x0 , x) previsto
nella (9.3.12), si ha P (n) (ξ) = an = P (n) (x0 ) e quindi
P (x) =
n
∑
P (k) (x0 )
k=0
(x − x0 )k
k!
per ogni x ∈ R. Dunque il polinomio P viene completamente determinato
dal valore che assume in x0 insieme a quelli delle sue derivate in x0 fino
all’ordine n.
Formula di Taylor per le funzioni esponenziali
Sia a > 0, a ̸= 1 e si consideri la funzione esponenziale expa di base a. Tale
funzione è infinite volte derivabile e si riconosce facilmente per induzione su
n che, per ogni n ∈ N ed x ∈ R, risulta Dn (ax ) = ax logn a. In particolare,
per ogni n ∈ N, la derivata n-esima della funzione expa assume il valore
logn a nel punto 0; pertanto, la formula di Mc Laurin di expa di ordine n si
scrive, per ogni x ∈ R,
ax =
n−1
∑
logk a
k=0
xk
xn
+ aξ logn a
,
k!
n!
con ξ ∈ I(0, x).
Inoltre, dalla (9.3.14) si ottiene, per ogni x ∈ R,
ax −
n−1
∑
logk a
k=0
xk
|x|n
.
≤ max{ax , 1} | logn a|
k!
n!
Nel caso della funzione esponenziale avente come base il numero di Nepero,
le formule precedenti diventano, per ogni x ∈ R,
ex =
n−1
∑
k=0
xk
xn
+ eξ
,
k!
n!
con ξ ∈ I(0, x) e
e −
x
n−1
∑
k=0
xk
|x|n
.
≤ max{ex , 1}
k!
n!
9.3 Applicazioni al calcolo dei limiti
243
Formula di Taylor per le funzioni logaritmiche
Sia a > 0 con a ̸= 1 e si consideri la funzione logaritmo loga di base a.
Tale funzione è infinite volte derivabile e procedendo per induzione su n, si
riconosce che, per ogni n ≥ 1 ed x ∈]0, +∞[,
Dn (loga x) = (−1)n−1
(n − 1)!
.
xn log a
In particolare, per ogni n ∈ N, la derivata n-esima della funzione loga
assume il valore (−1)n−1 (n − 1)!/ log a nel punto 1. Conseguentemente,
tenendo presente che loga 1 = 0, la formula di Taylor di loga di ordine n
relativa al punto 1 si scrive, per ogni x ∈]0, +∞[,
loga x =
n−1
∑
k=1
(−1)k−1
(−1)n−1
(x − 1)k + n
(x − 1)n ,
k log a
nξ log a
con ξ ∈ I(1, x). In varie applicazioni può essere utile scrivere quest’ultima
formula nella forma seguente, per ogni x ∈] − 1, 1],
loga (1 + x) =
n−1
∑
k=1
(−1)k−1 k (−1)n−1 n
x + n
x ;
k log a
nξ log a
poiché x ∈] − 1, 1], si ha anche |ξ| < |x| e quindi il resto di Lagrange verifica
la condizione
(−1)n−1 n
1
x ≤
.
nξ n log a
n| log a|
Formula di Taylor per le funzioni seno e coseno
Procedendo con gli stessi metodi dei casi precedenti, si possono scrivere le
formule di Mc Laurin di ordine 2n + 1 e rispettivamente 2n delle funzioni
seno e coseno. Tenendo presente che D(sin x) = cos x e D(cos x) = − sin x,
si deduce che le derivate di ogni ordine di tali funzioni assumono valori
compresi tra −1 ed 1. Inoltre, nel punto 0 le derivate di ordine pari della
funzione seno e quelle di ordine dispari della funzione coseno sono nulle.
Pertanto le relative formule di Mc Laurin assumono la seguente forma, per
ogni x ∈ R,
sin x
=
n−1
∑
k=0
cos x
=
n−1
∑
k=0
(−1)k 2k+1
x2n+1
x
+ θ(x)
,
(2k + 1)!
(2n + 1)!
(−1)k 2k
x2n
x + η(x)
,
(2k)!
(2n)!
Capitolo 9: Calcolo differenziale
244
con θ(x) ∈ [−1, 1] ed η(x) ∈ [−1, 1] opportuni.
Si ottiene ovviamente, per ogni x ∈ R,
sin x −
n−1
∑
k=0
(−1)k 2k+1
x
(2k + 1)!
cos x −
n−1
∑
k=0
(−1)k 2k
x
(2k)!
≤
|x|2n+1
,
(2n + 1)!
≤
|x|2n
.
(2n)!
Gli esempi precedenti possono essere estesi con gli stessi metodi per
scrivere la formula di Taylor di ogni funzione elementare relativa ad un
fissato punto x0 .
9.3.3
Simboli di Landau e applicazioni della formula di
Taylor al calcolo dei limiti
La formula di Taylor può essere utilizzata alternativamente alle regole di
L’Höpital per la risoluzione delle forme indeterminate.
Si introducono innanzitutto alcune notazioni che evidenziano la parte
principale di un infinitesimo; tali notazioni consistono nell’uso dei simboli
di Landau che vengono introdotti nel modo seguente.
Siano X un sottoinsieme di R, x0 un punto di accumulazione per X ed
f : X → R, g : X → R due funzioni definite in X.
Si dice che “f (x) è o piccolo di g(x) per x tendente verso x0 ” e si scrive
f (x) = o(g(x)) ,
x → x0 ,
f (x)
= 0 (se f e g sono infinitesime in x0 , ciò equivale al fatto che
g(x)
f è un infinitesimo in x0 di ordine maggiore di g).
Inoltre, si dice che “f (x) è o grande di g(x) per x tendente verso x0 ” e
si scrive
f (x) = O(g(x)) ,
x → x0 ,
se lim
x→x0
f (x)
è limitato in un intorno di x0 (se f e g sono infinitesime
g(x)
in x0 , ciò equivale al fatto che f è un infinitesimo in x0 di ordine maggiore
o uguale di g).
Tali notazioni consentono di scrivere in modo più semplice diverse formule evitando l’introduzione di funzioni che denotano infinitesimi di ordine
superiore.
Ad esempio, la formula di Taylor (9.3.9) si può scrivere
se il rapporto
f (x) = Tn (x) + o((x − x0 )n ) ,
x → x0 ,
9.3 Applicazioni al calcolo dei limiti
245
in quanto σn (x)(x − x0 )n /n! = o((x − x0 )n ) per x → x0 .
In modo analogo, nelle ipotesi dell’Osservazione 9.3.7, la (9.3.14) diventa
f (x) − Tn−1 (x) = O((x − x0 )n ) ,
x → x0 ,
in quanto M (x − x0 )n /n! = O((x − x0 )n ) per x → x0 .
Si lascia per esercizio lo sviluppo delle funzioni elementari utilizzando
i simboli di Landau e le formule di Mc Laurin con il resto di Peano; ad
esempio,
ex
=
loga (1 + x) =
sin x =
cos x =
n
∑
xk
k!
k=0
n
∑
+ o(xn ) ,
x→0,
(−1)k−1 k
x + o(xn ) ,
k log a
k=1
n
∑
x→0,
(−1)k
x2k+1 + o(x2n+1 ) ,
(2k + 1)!
k=0
n
∑
(−1)k 2k
x + o(x2n ) ,
(2k)!
k=0
x→0,
x→0.
◃ Nel calcolo dei limiti è spesso conveniente utilizzare la formula di Taylor per esprimere un infinitesimo in maniera equivalente mediante funzioni
potenza; a tal fine è sufficiente considerare la prima derivata non nulla delle
funzioni in esame nel punto x0 ; ad esempio, le prime derivate della funzione
f (x) := arcsin2 (x) nel punto 0 sono date da
f (0) = 0 ,
f ′ (0) = 0 ,
f ′′ (0) = 2
e quindi f (x) = 2x2 /2! + o(x2 ) = x2 + o(x2 ) per x → 0; quindi f (x) ∼ x2
per x → 0.
Si considera come esempio lo studio del limite
lim
x→0
x − arcsin x
.
sin x − arcsin x
Si determinano dapprima le derivate della funzione f (x) := x − arcsin x nel
punto 0 al fine di trovarne la prima non nulla. Si ha
f (0) = 0 ,
f ′ (0) = 0 ,
f ′′ (0) = 0 ,
f ′′′ (0) = −1
e quindi il numeratore è un infinitesimo di ordine 3 equivalente a −x3 /3!
(infatti f (x) = −x3 /3! + o(x3 )).
Capitolo 9: Calcolo differenziale
246
Si procede ora in maniera analoga per la funzione g(x) := sin x−arcsin x
e si ha
g(0) = 0 ,
g ′ (0) = 0 ,
g ′′ (0) = 0 ,
g ′′′ (0) = −2
e quindi il denominatore è un infinitesimo di ordine 3 equivalente a −2x3 /3!
(infatti g(x) = −2x3 /3! + o(x3 )).
Allora, dalla regola di sostituzione Proposizione 6.10.5, si ha
x − arcsin x
−x3 /3!
1
= lim
= .
x→0 sin x − arcsin x
x→0 −2x3 /3!
2
lim
◃ Si vuole approssimare il numero di Nepero con un errore minore di
1/100. Applicando la stima già ottenuta nel punto x = 1, si ha, per ogni
n ≥ 1,
n−1
∑ 1
e
3
e−
≤
<
.
k!
n!
n!
k=0
Pertanto, bisogna trovare n ≥ 1 tale che 3/n! < 1/100 e quindi basta
considerare, ad esempio, n = 6. Il valore approssimato richiesto è quindi
dato da
e∼
5
∑
1
1 1
1
1
163
=1+1++ + +
+
=
∼ 2, 71667 .
k!
2 6 24 120
60
k=0
9.4
Applicazioni allo studio del grafico delle
funzioni reali
Nella presente sezione verranno esaminate innanzitutto le connessioni tra
il segno della derivata prima e la monotonia di una funzione; verranno poi
studiate ulteriori proprietà delle funzioni reali quali la convessità, la concavità ed i punti di flesso e la loro connessione con lo studio della derivata
seconda.
Inoltre si definiscono gli asintoti verticali, orizzontali ed obliqui al grafico
di una funzione reale e se ne studia l’esistenza.
Infine, viene descritto il metodo generale per lo studio del grafico di una
funzione reale.
9.4.1
Monotonia e massimi e minimi relativi ed assoluti
Poiché la nozione di derivata ha carattere locale, trattandosi di un limite,
si possono ottenere in maniera diretta alcune connessioni tra il segno della
9.4 Applicazioni allo studio del grafico delle funzioni reali
247
derivata prima in un punto e la crescenza e decrescenza della funzione nello
stesso punto.
Proposizione 9.4.1 Siano X un sottoinsieme di R, x0 ∈ X un punto di
accumulazione per X ed f : X → R una funzione reale derivabile in x0 . Si
ha
1) Se f ′ (x0 ) > 0 (rispettivamente, f ′ (x0 ) < 0), allora f è strettamente
crescente (rispettivamente, strettamente decrescente) in x0 .
2) Se f è crescente (rispettivamente, decrescente) in x0 , allora f ′ (x0 ) ≥ 0
(rispettivamente, f ′ (x0 ) ≤ 0).
Dimostrazione. 1) Dalla proprietà di permanenza del segno per i limiti, esiste δ > 0 tale
che, per ogni x ∈ X r {x0 },
x0 − δ < x < x0 + δ =⇒
f (x) − f (x0 )
>0.
x − x0
Pertanto il numeratore ed il denominatore del rapporto incrementale devono avere lo
stesso segno, da cui
x0 < x < x0 + δ =⇒ f (x) − f (x0 ) > 0 =⇒ f (x0 ) < f (x) ,
x0 − δ < x < x0 =⇒ f (x) − f (x0 ) < 0 =⇒ f (x) < f (x0 ) ,
e quindi f è strettamente crescente in x0 . Il caso rispettivo si dimostra in maniera
analoga.
2) Si supponga che f sia crescente in x0 . Se fosse, per assurdo, f ′ (x0 ) < 0, dal caso
1) appena dimostrato seguirebbe che f è strettamente decrescente in x0 e si avrebbe una
contraddizione. Il caso rispettivo è analogo.
Una prima conseguenza della Proposizione 9.4.1 riguarda una condizione
necessaria per massimi e minimi relativi di una funzione.
Corollario 9.4.2 (Condizione necessaria per massimi e minimi relativi) Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione a
sinistra e a destra per X ed f : X → R una funzione reale derivabile in x0 .
Se x0 è un punto di massimo o di minimo relativo per f , allora f ′ (x0 ) = 0.
Dimostrazione. Si supponga per assurdo che f ′ (x0 ) > 0. Dalla Proposizione 9.4.1,
segue che f è strettamente crescente in x0 e quindi esiste δ1 > 0 tale che, per ogni
x ∈ X∩]x0 − δ1 , x0 + δ1 [r{x0 },
x0 < x < x0 + δ1 =⇒ f (x) > f (x0 ) ,
x0 − δ1 < x < x0 =⇒ f (x) < f (x0 ) .
Inoltre, x0 è un punto di massimo (rispettivamente, di minimo) relativo per f e quindi
esiste δ2 > 0 tale che, per ogni x ∈ X∩]x0 − δ2 , x0 + δ2 [,
f (x) ≤ f (x0 )
(rispettivamente, f (x) ≥ f (x0 ) ).
Si ponga ora δ = min{δ1 , δ2 }; poiché x0 è di accumulazione a destra per X, si può
considerare x ∈ X∩]x0 , x0 + δ[, per il quale si ottiene contemporaneamente f (x) >
Capitolo 9: Calcolo differenziale
248
f (x0 ) e f (x) ≤ f (x0 ) e quindi una contraddizione; nel caso rispettivo, poiché x0 è di
accumulazione anche a sinistra, si considera x ∈ X∩]x0 − δ, x0 [ e si ricava ancora una
contraddizione. Dunque non può essere f ′ (x0 ) > 0. In modo analogo si riconosce che la
condizione f ′ (x0 ) < 0 conduce ad una contraddizione e quindi deve essere f ′ (x0 ) = 0. Si osservi che nella dimostrazione precedente l’assurdo è derivato dal
fatto che il punto x0 è stato supposto di accumulazione sia a sinistra che a
destra per X. Infatti, si riconosce facilmente che una funzione che ammette
un massimo o un minimo relativo in un estremo ed é ivi derivabile, non ha
necessariamente derivata nulla in tale estremo. Ad esempio, si consideri la
funzione f : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1], f (x) := x.
◃ Se una funzione f : I → R è definita in un intervallo I, le connessioni
tra la monotonia globale e locale studiate nell’Osservazione 4.3.4 insieme
alla Proposizione 9.4.1 forniscono subito il seguente risultato.
Proposizione 9.4.3 Siano I un intervallo di R ed f : I → R una funzione
reale derivabile. Si ha
1. (Caratterizzazione della monotonia) f è crescente (rispettivamente,
decrescente) se e solo se verifica la condizione seguente
∀ x0 ∈ I : f ′ (x0 ) ≥ 0
(rispettivamente, f ′ (x0 ) ≤ 0 ).
(9.4.1)
2. (Caratterizzazione della stretta monotonia) f è strettamente crescente (rispettivamente, strettamente decrescente) se e solo se verifica la
condizione (9.4.1) ed inoltre f ′ non è costantemente nulla in alcun
intervallo contenuto in I, cioè
a, b ∈ I , a < b =⇒ ∃ x0 ∈]a, b[ t.c. f ′ (x0 ) ̸= 0 .
(9.4.2)
Dimostrazione. 1) Se f è crescente, essa verifica ovviamente la condizione (9.4.1) come
conseguenza della Proposizione 9.4.1. Viceversa, si supponga che, per ogni x0 ∈ I,
f ′ (x0 ) ≥ 0. Se f non fosse crescente, esisterebbero due elementi a, b ∈ I con a < b
tali che f (b) < f (a). Dal Teorema 9.2.3 di Lagrange applicato alla restrizione di f
all’intervallo [a, b], si otterrebbe x0 ∈]a, b[ tale che f ′ (x0 ) = (f (b) − f (a))/(b − a) < 0
e ciò è escluso. Quindi f deve essere crescente. La dimostrazione è analoga nel caso
rispettivo.
2) Se f è strettamente crescente essa è anche crescente e quindi dalla prima parte deve
soddisfare la condizione (9.4.1). Se f ′ fosse costantemente uguale a 0 in un intervallo
[a, b] ⊂ I, dalla stretta crescenza si avrebbe innanzitutto f (a) < f (b); inoltre, dal Teorema
9.2.3 di Lagrange applicato alla restrizione di f all’intervallo [a, b], si otterrebbe x0 ∈]a, b[
tale che f ′ (x0 ) = (f (b)−f (a))/(b−a) > 0 e ciò è assurdo in quanto deve essere f ′ (x0 ) = 0.
Pertanto, anche la condizione (9.4.2) è dimostrata.
Viceversa, dalla (9.4.1) e dalla prima parte dimostrata segue innanzitutto che f è crescente e pertanto è sufficiente dimostrare che essa è anche iniettiva (vedasi la Proposizione
4.3.2). Si supponga, per assurdo, che esistano due elementi a, b ∈ I, con a < b, tali che
9.4 Applicazioni allo studio del grafico delle funzioni reali
249
f (a) = f (b). Dalla monotonia di f , per ogni x ∈ [a, b], si deve avere f (x) = f (a) = f (b);
essendo f costante in [a, b], la sua derivata si annulla nell’intervallo [a, b] e ciò contraddice la condizione (9.4.2). Quindi f è iniettiva e ciò completa la dimostrazione. Il caso
rispettivo si dimostra in maniera analoga.
Le caratterizzazioni precedenti non valgono se la funzione non è definita
in un intervallo; ad esempio, la derivata della funzione f (x) = −1/x, x ∈
R r {0} è strettamente positiva in tutto R r {0}, ma la funzione non è
strettamente crescente (ad esempio, −1 < 1 ma f (−1) > f (1)).
Le caratterizzazioni ottenute possono comunque essere sempre applicate
alle restrizioni della funzione ad ogni intervallo contenuto nell’insieme di
definizione.
◃ Nella dimostrazione della seconda parte della proposizione precedente,
si è visto anche che se f : I → R ha derivata costantemente nulla in un
intervallo I, allora essa è costante.
Anche in questo caso la tesi risulta falsa se la funzione non è definita in un
intervallo; ad esempio, si consideri la funzione f (x) = x/|x| con x ∈ Rr{0}.
◃ Si studiano ora alcune condizioni sufficienti per i punti di massimo e
minimo relativo.
Il primo criterio segue direttamente dalla Proposizione 9.4.1.
Proposizione 9.4.4 (Primo criterio per massimi e minimi relativi)
Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f :
X → R una funzione reale continua in x0 e derivabile in un intorno di x0
tranne al più nel punto x0 , cioè esiste δ > 0 tale che f sia derivabile in
]x0 − δ, x0 + δ[r{x0 }.2
Se
∀ x ∈]x0 − δ, x0 [: f ′ (x) ≥ 0 ,
∀ x ∈]x0 , x0 + δ[: f ′ (x) ≤ 0
(oppure rispettivamente,
∀ x ∈]x0 − δ, x0 [: f ′ (x) ≤ 0 ,
∀ x ∈]x0 , x0 + δ[: f ′ (x) ≥ 0) ),
allora x0 è un punto di massimo (rispettivamente, di minimo) relativo per
f.
Se, in più, esiste δ > 0 tale che f ′ (x) ̸= 0 per ogni x ∈]x0 − δ, x0 +
δ[r{x0 }, allora x0 è un punto di massimo (rispettivamente, di minimo)
relativo proprio per f .
2 Un punto x si dice interno ad X se esiste δ > 0 tale che ]x − δ, x + δ[⊂ X, in
0
0
0
altri termini se X è un intorno di x0 . Un punto interno ad X è sempre ovviamente di
accumulazione per X. Nelle ipotesi di derivabilità di f si è pertanto supposto lecitamente
che ]x0 − δ, x0 + δ[⊂ X.
Capitolo 9: Calcolo differenziale
250
Dimostrazione. Dalle ipotesi fatte, tenendo conto della Proposizione 9.4.3, 1), segue che
f è crescente in ]x0 − δ, x0 [ e decrescente in ]x0 , x0 + δ[ (rispettivamente, f è decrescente
in ]x0 − δ, x0 [ e crescente in ]x0 , x0 + δ[); dal Teorema 6.6.1 sul limite delle funzioni
monotone e tenendo presente che f è continua in x0 , si ha
f (x0 ) =
sup
f (x) =
x∈]x0 −δ,x0 [
sup
f (x)
x∈]x0 ,x0 +δ[
(rispettivamente,
f (x0 ) =
inf
x∈]x0 −δ,x0 [
f (x) =
inf
f (x) ).
x∈]x0 ,x0 +δ[
Pertanto, per ogni x ∈]x0 − δ, x0 + δ[r{x0 }, risulta f (x) ≤ f (x0 ) (rispettivamente,
f (x0 ) ≤ f (x)) e quindi x0 è un punto di massimo relativo (rispettivamente, di minimo
relativo) per f .
Per quanto riguarda l’ultima parte della tesi, se il punto x0 non fosse un punto di
massimo (rispettivamente, di minimo) relativo proprio per f , esisterebbe x1 ∈]x0 −δ, x0 +
δ[r{x0 } tale che f (x1 ) = f (x0 ); applicando il Teorema 9.2.1 di Rolle alla restrizione di
f all’intervallo chiuso di estremi x0 ed x1 , si troverebbe x ∈ I(x0 , x1 ) tale che f ′ (x) = 0
contraddicendo le ipotesi assunte nell’ultima parte.
Proposizione 9.4.5 (Secondo criterio per massimi e minimi relativi)
Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : I → R
una funzione reale derivabile due volte in x0 .
Se f ′ (x0 ) = 0 e f ′′ (x0 ) < 0 (rispettivamente, f ′′ (x0 ) > 0), allora x0 è
un punto di massimo (rispettivamente, di minimo) relativo proprio per f .
Dimostrazione. Poiché f è derivabile due volte in x0 , deve innanzitutto esistere un
intorno J di x0 tale che f sia derivabile in J (si è supposto lecitamente J ⊂ X in quanto
x0 è interno ad X); inoltre, la condizione f ′′ (x0 ) < 0 (rispettivamente, f ′′ (x0 ) > 0)
comporta, dalla Proposizione 9.4.1, che f ′ sia strettamente decrescente (rispettivamente,
strettamente crescente) in x0 e quindi deve esistere δ > 0 tale che ]x0 − δ, x0 + δ[⊂ J e,
per ogni xx0 },
x < x0
=⇒
f ′ (x0 ) < f ′ (x) (rispettivamente, f ′ (x) < f ′ (x0 ) ),
x > x0
=⇒
f ′ (x) < f ′ (x0 ) (rispettivamente, f ′ (x0 ) < f ′ (x) ).
Tenendo presente che f ′ (x0 ) = 0, le condizioni precedenti consentono di applicare la Proposizione 9.4.4 e concludere che x0 è un punto di massimo (rispettivamente, di minimo)
relativo proprio per f .
Corollario 9.4.6 Siano X un sottoinsieme di R, x0 ∈ X un punto interno
ad X ed f : X → R una funzione reale derivabile due volte in x0 . Se x0
è un punto di massimo (rispettivamente, di minimo) relativo per f , allora
deve essere f ′′ (x0 ) ≤ 0 (rispettivamente, f ′′ (x0 ) ≥ 0).
9.4 Applicazioni allo studio del grafico delle funzioni reali
251
Dimostrazione. Infatti, se fosse f ′′ (x0 ) > 0 (rispettivamente, f ′′ (x0 ) < 0), dalla Proposizione 9.4.5 precedente e dal Corollario 9.4.2, x0 sarebbe un punto di minimo (rispettivamente, di massimo) relativo proprio per f .
◃ Se un punto interno x0 ∈ X è di massimo (rispettivamente, di minimo)
relativo per f e se f : X → R è derivabile due volte in x0 , dai Corollari
9.4.2 e 9.4.6 seguono entrambe le condizioni
f ′ (x0 ) = 0 , f ′′ (x0 ) ≤ 0 (rispettivamente, f ′′ (x0 ) ≥ 0 ).
Esse non sono tuttavia sufficienti ad assicurare che un punto x0 sia di massimo (rispettivamente, di minimo) relativo per f . Ad esempio, la funzione f (x) = x3 , x ∈ R, nel punto 0 verifica la condizione precedente ma è
strettamente crescente in 0.
Si osserva inoltre che i criteri esposti non valgono in generale se il punto
x0 non è interno ad X; ad esempio, la funzione f : [0, 1] → R definita
ponendo, per ogni x ∈ [0, 1], f (x) := x2 ha derivata seconda strettamente
positiva nel punto di minimo 0, ma anche nel punto di massimo 1.
Infine, nei casi in cui sia la derivata prima che seconda di una funzione
si annullino, può essere utile il seguente ulteriore criterio che si deduce dalla
formula di Taylor.
Proposizione 9.4.7 (Terzo criterio per massimi e minimi relativi)
Siano I un intervallo di R, x0 ∈ I ed f : I → R una funzione reale derivabile
n volte in x0 , con n ≥ 2 e si supponga che
∀ k = 1, . . . , n − 1 : f (k) (x0 ) = 0 ,
f (n) (x0 ) ̸= 0 .
Allora
1. Se n è dispari e f (n) (x0 ) > 0, allora f è strettamente crescente in x0 ,
mentre se f (n) (x0 ) < 0, allora f è strettamente decrescente in x0 .
2. Se n è pari e f (n) (x0 ) > 0, allora x0 è un punto di minimo relativo
proprio per f , mentre se f (n) (x0 ) < 0, allora x0 è un punto di massimo
relativo proprio per f .
Dimostrazione. Poiché f è derivabile n volte in x0 , si può supporre che la derivata
di ordine n − 1 di f sia definita in un intervallo I ∩ J, con J intorno opportuno di
x0 . Applicando la formula di Taylor (Teorema 9.3.5) alla restrizione di f a I ∩ J si
trova una funzione σn : I ∩ J → R tale che limx→x0 σn (x) = 0 e, per ogni x ∈ I ∩ J,
f (x) = Tn (x) + σn (x)(x − x0 )n /n!, dove Tn denota il polinomio di Taylor di ordine n di
f relativo ad x0 ; dalle ipotesi e dalla definizione di Tn segue, per ogni x ∈ I ∩ J,
f (x) − f (x0 ) =
(x − x0 )n (n)
(f (x) + σn (x)) .
n!
(1)
Capitolo 9: Calcolo differenziale
252
Poiché limx→x0 σn (x) = 0 e |f (n) (x)| > 0, si può trovare δ > 0 tale che I∩]x0 −δ, x0 +δ[⊂
I ∩ J e inoltre, per ogni x ∈ I∩]x0 − δ, x0 + δ[,
|σn (x)| <
|f (n) (x)|
.
2
(2)
Se f (n) (x) > 0, dalla (2) si ottiene, per ogni x ∈ I∩]x0 − δ, x0 + δ[,
−
f (n) (x)
f (n) (x)
< σn (x) <
2
2
e conseguentemente
0<
f (n) (x)
3 f (n) (x)
< f (n) (x) + σn (x) <
2
2
mentre, se f (n) (x) < 0, sempre dalla (2) si ottiene, per ogni x ∈ I∩]x0 − δ, x0 + δ[,
f (n) (x)
f (n) (x)
< σn (x) < −
2
2
e quindi
3 f (n) (x)
f (n) (x)
< f (n) (x) + σn (x) <
<0.
2
2
n
Da ciò, e tenendo presente che il termine (x − x0 ) è sempre positivo per n pari, mentre è
positivo in [x0 , +∞[ e negativo in ] − ∞, x0 ] per n dispari, dalla (1) si ottiene interamente
la tesi.
Osservazione 9.4.8 Massimi e minimi relativi di una funzione. I criteri
forniti sopra consentono di individuare i punti di massimo e di minimo relativo di una funzione nel caso in cui essi siano interni all’insieme di definizione
e la funzione sia derivabile una o più volte in tali punti. Per determinare
tutti i punti di massimo e di minimo relativo di una funzione occorre pertanto tenere conto anche dei punti estremi in cui la funzione è definita e dei
punti in cui la funzione non è derivabile.
Pertanto, se f : X → R è una funzione reale definita in un sottoinsieme
X di R, si può procedere nel modo seguente:
1. Si determina l’insieme X ′ = {x0 ∈ X |f è derivabile in x0 } dei punti in
cui la funzione è derivabile. Per il Corollario 9.4.2, i punti di massimo
e di minimo relativo appartenenti ad X ′ e di accumulazione a sinistra
e a destra per X devono soddisfare l’equazione
f ′ (x) = 0 ,
x ∈ X′ .
Pertanto, conviene determinare l’insieme X0 delle soluzioni di tale
equazione. In generale accade che X0 è un sottoinsieme finito (in
qualche caso numerabile) di R.
9.4 Applicazioni allo studio del grafico delle funzioni reali
253
2. Non è detto che un elemento x0 ∈ X0 sia un punto di massimo o di
minimo relativo per f in quanto la condizione f ′ (x0 ) = 0 è solamente
necessaria. Quindi occorre verificare se ognuno degli elementi di X0 è
effettivamente un punto di massimo o di minimo relativo per f utilizzando i criteri esposti nelle Proposizioni 9.4.4, 9.4.5 ed eventualmente
9.4.7. Se l’applicazione di tali criteri non consente di concludere se
un punto è effettivamente di massimo o di minimo relativo occorre
procedere ad una verifica diretta mediante la definizione di punto di
massimo e di minimo relativo.
3. Bisogna considerare i punti esclusi nei casi precedenti, che sono gli elementi di X che non appartengono ad X ′ (cioè in cui f non è derivabile)
e gli elementi di X che non sono di accumulazione a sinistra e a destra
per X (in generale gli estremi appartenenti ad X degli intervalli di cui
X è costituito). Tali punti si presentano solitamente in numero finito
(in qualche caso numerabile) e per ognuno di essi bisogna verificare
in maniera diretta se si tratta di un punto di massimo o di minimo
relativo per f . Per quanto riguarda i punti in cui la funzione non è
derivabile conviene osservare che se in uno di tali punti la funzione è
continua ed il punto è angoloso o cuspidale, il primo criterio potrebbe
comunque assicurare se si tratta o meno di un punto di massimo o minimo relativo; ad esempio, in un punto angoloso i segni delle derivate
destre e sinistre descrivono precisamente il punto (se la derivata sinistra e quella destra sono entrambe positive in un punto x0 la funzione
è strettamente crescente in x0 , se sono entrambe negative la funzione
è strettamente decrescente in x0 , se la derivata sinistra è positiva e
quella destra è negativa il punto x0 è di massimo relativo per f ed
infine se la derivata sinistra è negativa e quella destra è positiva il
punto x0 è di minimo relativo per f ).
Osservazione 9.4.9 Massimi e minimi assoluti di una funzione. La discussione precedente consente in generale di individuare tutti i punti di
massimo e di minimo relativo per una funzione. Ci si può porre a questo
punto il problema della determinazione degli eventuali punti di massimo o
di minimo assoluto per f . A tale proposito, bisogna innanzitutto osservare
che in generale non è detto che tali punti esistano a meno che la funzione
non sia continua in un sottoinsieme chiuso e limitato di R (in tal caso l’esistenza del massimo e del minimo assoluto di f viene assicurata dal teorema
di Weierstrass e per determinare il massimo o il minimo assoluto di f è sufficiente confrontare i valori della funzione nei punti di massimo o di minimo
relativo). In generale, per determinare tali eventuali punti si confrontano
dapprima i valori della funzione in tutti i punti di massimo e di minimo
relativo (eventuali); si studia poi il comportamento della funzione in tutti i
254
Capitolo 9: Calcolo differenziale
punti di accumulazione in cui non è definita oppure in cui è definita ma non
è continua (in effetti, con l’estremo superiore o con l’estremo inferiore se f
è limitata superiormente o inferiormente; in caso contrario, evidentemente
f non può essere dotata di massimo o di minimo). Dal confronto, poi, si
potrà dedurre se il massimo ed il minimo assoluto della funzione esistono e,
in caso affermativo, potranno anche essere determinati.
◃ Ad esempio, si studiano la monotonia e gli eventuali punti di massimo
e di minimo relativo ed assoluto della funzione
f (x) := x2 + |x − 3| .
La funzione è definita in tutto R ed è derivabile nell’insieme R r {3};
per ogni x ∈ R r {3}, si ha
{
|x − 3|
2x + 1 ,
x>3,
′
=
f (x) = 2x +
2x − 1 ,
x<3.
x−3
dunque la derivata è strettamente positiva in ]1/2, +∞[r{3} e strettamente
negativa in ] − ∞, 1/2[; poiché f è continua nel punto 3, da ciò segue direttamente che f è strettamente crescente negli intervalli [1/2, 3] e [3, +∞[
(quindi in [1/2, +∞[) ed è strettamente decrescente in ] − ∞, 1/2]. Nel
′
punto 3 la funzione non è derivabile in quanto f+
(3) = limx→3+ f ′ (x) = 7
′
(3) = limx→3− f ′ (x) = 5. Inoltre, il punto 1/2 è di minimo per
mentre f−
la funzione e si ha f (1/2) = 11/4. Per quanto riguarda gli eventuali punti
di massimo e di minimo assoluto si osserva che agli estremi dell’insieme di
definizione si ha limx→+∞ f (x) = +∞ e limx→−∞ f (x) = −∞; quindi f
non è limitata superiormente e conseguentemente non è dotata di massimo
mentre il punto 1/2 è il punto di minimo assoluto della funzione (il minimo
assoluto è uguale a 11/4).
9.4.2
Convessità, concavità e flessi
Le proprietà introdotte nel presente paragrafo costituiscono un ulteriore
strumento per lo studio delle funzioni reali.
Le proprietà sulle quali ci si soffermerà saranno quelle di convessità e
concavità di una funzione. Parallelamente a quanto visto per la crescenza e
la decrescenza, anche queste ultime possono essere introdotte globalmente
ed in un punto; la nozione legata al calcolo differenziale è quella locale
ma in intervalli le due nozioni coincidono; per tale motivo ci si soffermerà
fin dall’inizio sulla nozione locale. Tuttavia, al solo fine della completezza,
conviene precisare che una funzione f : I → R definita in un intervallo I si
dice convessa (rispettivamente, concava) se considerati due qualsiasi punti
9.4 Applicazioni allo studio del grafico delle funzioni reali
255
x1 , x2 ∈ I con x1 < x2 , il suo grafico nell’intervallo ]x1 , x2 [ si trova al di
sotto (rispettivamente, al di sopra) di quello della retta secante il grafico di f
nei punti (x1 , f (x1 )) e (x2 , f (x2 )). La retta passante per i punti (x1 , f (x1 ))
e (x2 , f (x2 )) ha equazione
y − f (x1 )
f (x2 ) − f (x1 )
=
x − x1
x2 − x1
cioè
y = f (x1 ) +
f (x2 ) − f (x1 )
(x − x1 )
x2 − x1
e tenendo presente che gli elementi dell’intervallo x ∈]x1 , x2 [ possono essere
scritti nella forma x = λx2 + (1 − λ)x1 l’equazione della retta considerata
diventa
y = f (x2 ) + λ(f (x2 ) − f (x1 ))
cioè y = λ f (x2 ) + (1 − λ)f (x1 ); conseguentemente, la funzione f risulta
convessa (rispettivamente, concava) se e solo se, per ogni x1 , x2 ∈ I e per
ogni λ ∈]0, 1[, risulta
f (λx2 + (1 − λ)x1 ) ≤ λ f (x2 ) + (1 − λ)f (x1 )
(rispettivamente,
f (λx2 + (1 − λ)x1 ) ≥ λ f (x2 ) + (1 − λ)f (x1 ) ).
Inoltre la funzione f si dice strettamente convessa (rispettivamente,
strettamente concava) se le condizioni precedenti valgono con una diseguaglianza stretta, cioè se
f (λx2 + (1 − λ)x1 ) < λ f (x2 ) + (1 − λ)f (x1 )
(rispettivamente,
f (λx2 + (1 − λ)x1 ) < λ f (x2 ) + (1 − λ)f (x1 )).
La definizione precedente vale per qualsiasi funzione definita in un intervallo senza richiedere proprietà di derivabilità. Tuttavia, per riconoscere la
validità di tali proprietà può essere utilizzato il calcolo differenziale introducendo anche una nozione locale di convessità e di concavità. In questo modo
si possono ottenere proprietà e legami con il calcolo differenziale in maniera
abbastanza simile a quanto svolto per i concetti di crescenza, decrescenza e
massimi e minimi relativi.
Si considera pertanto la seguente definizione locale.
Capitolo 9: Calcolo differenziale
256
Definizione 9.4.10 Sia X un sottoinsieme di R e siano x0 ∈ X un punto
di accumulazione per X ed f : X → R una funzione reale derivabile in x0 .
Si dice che f è convessa (rispettivamente, concava) in x0 se esiste δ > 0
tale che, per ogni x ∈ X∩]x0 − δ, x0 + δ[,
f (x0 )+f ′ (x0 )(x−x0 ) ≤ f (x) (rispettivamente, f (x) ≤ f (x0 )+f ′ (x0 )(x−x0 )).
Inoltre, si dice che f è strettamente convessa (rispettivamente, strettamente
concava) in x0 se esiste δ > 0 tale che, per ogni x ∈ X∩]x0 −δ, x0 +δ[r{x0 },
f (x0 )+f ′ (x0 )(x−x0 ) < f (x) (rispettivamente, f (x) < f (x0 )+f ′ (x0 )(x−x0 )).
Infine, si dice che x0 è un punto di flesso ascendente (rispettivamente,
discendente) per f se esiste δ > 0 tale che
∀ x ∈ X∩]x0 − δ, x0 [: f (x) ≤ f (x0 ) + f ′ (x0 )(x − x0 ) ,
∀ x ∈ X∩]x0 , x0 + δ[: f (x0 ) + f ′ (x0 )(x − x0 ) ≤ f (x) ,
(rispettivamente,
∀ x ∈ X∩]x0 − δ, x0 [:
f (x0 ) + f ′ (x0 )(x − x0 ) ≤ f (x) ,
∀ x ∈ X∩]x0 , x0 + δ[: f (x) ≤ f (x0 ) + f ′ (x0 )(x − x0 ) ),
Se la condizione precedente è verificata con una diseguaglianza stretta si
dice anche che x0 è un punto di flesso proprio per f .
Se una funzione è convessa (rispettivamente, concava) in un punto x0 ,
si dice anche che f volge la concavità verso l’alto (rispettivamente, verso il
basso) in x0 .
Una funzione convessa (rispettivamente, concava, strettamente convessa,
strettamente concava) in tutti i punti di un sottoinsieme A di X viene denominata convessa (rispettivamente, concava, strettamente convessa, strettamente concava) in A; se l’insieme A non viene precisato è da intendersi
A = X.
◃ Pertanto geometricamente una funzione è convessa (rispettivamente,
concava) in un punto x0 se in un intorno di x0 il suo grafico si trova al
di sopra (rispettivamente, al di sotto) della retta tangente al grafico in x0 ;
se x0 è un punto di flesso, la retta tangente al grafico in x0 viene anche denominata tangente flessionale in x0 oppure tangente di flesso in x0 e in un
intorno di un punto di flesso, il grafico della funzione si trova da un lato al
di sotto e dall’altro al di sopra (oppure viceversa) della tangente flessionale.
Per convenzione, si può continuare a denominare punto di flesso ascendente
(rispettivamente, discendente) anche un elemento x0 ∈ X in cui f è dotata
9.4 Applicazioni allo studio del grafico delle funzioni reali
257
di derivata uguale a −∞− (rispettivamente, +∞). In tal caso, la tangente
flessionale è una retta verticale di equazione x = x0 .
Nella Figura successiva 9.5 viene rappresentata una funzione f convessa
in un punto x0 , concava in un punto x1 , ed un punto x2 di flesso per f .
y
x0
x1
0
x2
x
Figura 9.5: Funzione convessa o concava in un punto e punti di flesso.
◃ Si osservi che può accadere che una funzione sia derivabile in un punto x0
e che non verifichi alcuna delle condizioni previste nella Definizione 9.4.10;
ad esempio, la funzione
{ 3
x sin x1 ,
x ̸= 0 ,
f (x) :=
0,
x=0,
è derivabile in 0 e risulta f ′ (0) = 0; conseguentemente, la retta tangente al
grafico di f in 0 ha equazione y = 0, mentre la funzione non è né positiva
né negativa in alcun intorno di 0.
◃ I criteri maggiormente utilizzati per lo studio della convessità e della concavità di una funzione sono collegati allo studio del segno della sua
derivata seconda.
Tali criteri sono essenzialmente basati sull’osservazione seguente.
Osservazione 9.4.11 Sia X un sottoinsieme di R e siano x0 ∈ X un punto
di accumulazione per X ed f : X → R una funzione reale; si supponga che
la derivata prima di f sia definita in X ∩ I con I intorno di x0 e si consideri
la funzione ϕ : X ∩ I → R definita ponendo, per ogni x ∈ X ∩ I,
ϕ(x) := f (x) − f (x0 ) − f ′ (x0 )(x − x0 )
258
Capitolo 9: Calcolo differenziale
(ϕ rappresenta la differenza tra la funzione f e la retta tangente al grafico
di f nel punto x0 ).
Allora valgono le seguenti proprietà:
1. f è convessa (rispettivamente, strettamente convessa, concava, strettamente concava) in x0 se e solo se il punto x0 è di minimo relativo
(rispettivamente, di minimo relativo proprio, di massimo relativo, di
massimo relativo proprio) per ϕ.
2. Il punto x0 è un flesso ascendente (rispettivamente, un flesso ascendente proprio, un flesso discendente, un flesso discendente proprio) per f
se e solo se ϕ è decrescente (rispettivamente, strettamente decrescente,
crescente, strettamente crescente) in x0 .
(Basta tenere presente le definizioni adottate e che ϕ(x0 ) = 0, da cui segue che ϕ è
positiva (rispettivamente, negativa) in un intorno di x0 se e solo se x0 è di minimo
(rispettivamente, di massimo) relativo per ϕ.
)
Dall’osservazione precedente, la proprietà di convessità, di concavità in
un punto per la funzione f viene ricondotta alla proprietà di minimo e di
massimo relativo per la funzione ϕ e analogamente i punti di flesso per f
vengono ricondotti alla proprietà di crescenza e decrescenza di ϕ. Si tenga
inoltre presente che ϕ è derivabile in X ∩ I e che, per ogni x ∈ X ∩ I, risulta
ϕ′ (x) = f ′ (x) − f ′ (x0 ) e in particolare ϕ′ (x0 ) = 0. Quanto osservato si può
chiaramente applicare nel caso in cui la funzione f sia dotata di derivata
seconda in x0 , in quanto ciò comporta che essa deve essere necessariamente
derivabile in X ∩ I, con I intorno opportuno di x0 . In tal caso, inoltre,
ϕ risulta anch’essa derivabile due volte in x0 e si ha ϕ′′ (x0 ) = f ′′ (x0 ).
Applicando tali proprietà ed i risultati ottenuti nel paragrafo precedente
alla funzione ϕ, si stabiliscono direttamente i seguenti criteri.
Proposizione 9.4.12 Siano X un sottoinsieme di R, x0 ∈ X un punto di
accumulazione per X ed f : X → R una funzione reale derivabile due volte
in x0 . Allora
1. Se f ′′ (x0 ) > 0 (rispettivamente, f ′′ (x0 ) < 0), allora f è strettamente
convessa (rispettivamente, strettamente concava) in x0 .
2. Se f è convessa (rispettivamente, concava) in x0 , allora f ′′ (x0 ) ≥ 0
(rispettivamente, f ′′ (x0 ) ≤ 0).
Dimostrazione. 1) Si ha ϕ′′ (x0 ) > 0 e quindi ϕ′ è strettamente crescente in x0 ; poiché
ϕ′ (x0 ) = 0, ϕ′ deve essere strettamente negativa in un intorno sinistro di x0 e strettamente
positiva in un intorno destro di x0 . Dalla Proposizione 9.4.4, il punto x0 è un minimo
9.4 Applicazioni allo studio del grafico delle funzioni reali
259
relativo proprio per ϕ, e quindi f è strettamente convessa in x0 . In modo analogo si
stabiliscono i casi rispettivi.
2) Se f è convessa in x0 , allora x0 è un punto di minimo relativo per ϕ; dal Corollario
9.4.2, segue ϕ′′ (x0 ) ≥ 0 e quindi f ′′ (x0 ) ≥ 0. Il caso rispettivo si stabilisce in maniera
analoga.
Come conseguenza della Proposizione 9.4.12 si stabilisce una prima condizione necessaria per i punti di flesso.
Corollario 9.4.13 (Condizione necessaria per punti di flesso) Siano
X un sottoinsieme di R, x0 ∈ X un punto di accumulazione a sinistra e a
destra per X ed f : X → R una funzione reale derivabile due volte in x0 .
Se x0 è un punto di flesso per f , allora necessariamente f ′′ (x0 ) = 0.
Dimostrazione. Si supponga, ad esempio, che x0 sia un punto di flesso ascendente
per f . Se, per assurdo, fosse f ′′ (x0 ) > 0, dalla Proposizione 9.4.12, f risulterebbe
strettamente convessa in x0 . Allora, si potrebbe trovare δ > 0 tale che, per ogni x ∈
X∩]x0 − δ, x0 [, f (x) ≤ f (x0 ) + f ′ (x0 )(x − x0 ) (in quanto x0 è un flesso ascendente) e
f (x) > f (x0 ) + f ′ (x0 )(x − x0 ) (in quanto f è strettamente convessa in x0 ). Tenendo
presente che l’intersezione X∩]x0 − δ, x0 [ è non vuota in quanto x0 è di accumulazione
a sinistra per X, le condizioni precedenti portano ad un assurdo. In modo analogo,
utilizzando il fatto che x0 è di accumulazione anche a destra per X, si deduce che non
può essere f ′′ (x0 ) < 0 e quindi deve essere f ′′ (x0 ) = 0.
′′
La condizione f (x0 ) = 0 può essere soddisfatta anche quando il punto
x0 non è di flesso per f come accade, ad esempio, per la funzione f (x) := x4 ,
x ∈ R, nel punto x0 = 0.
Si deducono ora le seguenti condizioni per lo studio della convessità e
concavità in intervalli; la loro dimostrazione viene tralasciata per brevità in
quanto segue le stesse linee di quelle già viste.
Proposizione 9.4.14 Siano I un intervallo di R ed f : I → R una funzione
reale derivabile due volte in I. Si ha
1. f è convessa (rispettivamente, concava) se e solo se verifica la condizione seguente:
∀ x0 ∈ I : f ′′ (x0 ) ≥ 0
(rispettivamente, ∀ x0 ∈ I : f ′′ (x0 ) ≤ 0 ).
(9.4.3)
2. f è strettamente convessa (rispettivamente, strettamente concava) se
e solo se f verifica la condizione (9.4.3) ed inoltre f ′′ non è costantemente nulla in alcun intervallo contenuto in I, cioè
a, b ∈ I , a < b =⇒ ∃ x0 ∈]a, b[ t.c. f ′′ (x0 ) ̸= 0 .
(9.4.4)
Capitolo 9: Calcolo differenziale
260
Si enunciano infine i criteri maggiormente utilizzati per la determinazione dei punti di flesso di una funzione.
Proposizione 9.4.15 (Primo criterio per i punti di flesso)
Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : X → R
una funzione reale. Si supponga che esista δ > 0 tale che f sia derivabile
due volte in X∩]x0 − δ, x0 + δ[r{x0 } e inoltre che la derivata prima di f
sia continua in x0 . Se
∀ x ∈]x0 − δ, x0 [: f ′′ (x) ≤ 0 ,
∀ x ∈]x0 , x0 + δ[: f ′′ (x) ≥ 0
(oppure rispettivamente,
∀ x ∈]x0 − δ, x0 [: f ′′ (x) ≥ 0 ,
∀ x ∈]x0 , x0 + δ[: f ′′ (x) ≤ 0) ),
allora x0 è un punto di flesso ascendente (rispettivamente, discendente) per
f.
Se, in più, la derivata seconda di f non si annulla in X∩]x0 − δ, x0 +
δ[r{x0 }, allora x0 è un punto di flesso proprio per f .
Dimostrazione. Dalla Proposizione 9.4.4, applicata alla derivata prima di f , segue che x0
è un punto di minimo (rispettivamente, di massimo) relativo per f ′ e quindi, per quanto
osservato preliminarmente, anche per ϕ′ , da cui la prima parte della tesi. L’ultima parte
della tesi si ottiene nello stesso modo osservando che in questo caso il punto x0 risulta
un minimo (rispettivamente, un massimo) relativo proprio per f ′ per quanto osservato
nell’ultima parte della Proposizione 9.4.4.
Proposizione 9.4.16 (Secondo criterio per i punti di flesso)
Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : I → R
una funzione reale derivabile tre volte in x0 . Se f ′′ (x0 ) = 0 e f (3) (x0 ) > 0
(rispettivamente, f (3) (x0 ) < 0), allora x0 è un punto di flesso ascendente
(rispettivamente, discendente) proprio per f .
Dimostrazione. Dalla Proposizione 9.4.5 segue che x0 è un punto di minimo (rispettivamente, di massimo) relativo proprio per f ′ e quindi anche per ϕ′ ; allora, la tesi segue
direttamente da quanto osservato preliminarmente.
Corollario 9.4.17 Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : X → R una funzione reale derivabile tre volte in x0 . Se x0
è un punto di flesso ascendente (rispettivamente, discendente) per f , allora
deve essere f (3) (x0 ) ≥ 0 (rispettivamente, f (3) (x0 ) ≤ 0).
9.4 Applicazioni allo studio del grafico delle funzioni reali
261
Dimostrazione. Deve essere innanzitutto f ′′ (x0 ) = 0 per il Corollario 9.4.13. Se, poi, fosse f (3) (x0 ) < 0 (rispettivamente, f (3) (x0 ) > 0), dalla Proposizione 9.4.16 x0 sarebbe un
punto di flesso discendente (rispettivamente, ascendente) proprio per f , in contraddizione
con le ipotesi.
Se f : X → R è derivabile tre volte in un punto x0 interno ad X, dai
Corollari 9.4.13 e 9.4.17 si ottengono le seguenti condizioni necessarie per i
punti di flesso ascendenti (rispettivamente, discendenti)
f ′′ (x0 ) = 0 , f (3) (x0 ) ≤ 0
(rispettivamente, f (3) (x0 ) ≥ 0 ).
Infine, se le derivate seconda e terza di una funzione sono entrambe
nulle, si può cercare di utilizzare il seguente ulteriore criterio dedotto dalla
formula di Taylor.
Proposizione 9.4.18 (Terzo criterio per i punti di flesso)
Siano I un intervallo di R, x0 ∈ I ed f : I → R una funzione reale derivabile
n volte in x0 , con n ≥ 3 e si supponga che
∀ k = 2, . . . , n − 1 : f (k) (x0 ) = 0 ,
f (n) (x0 ) ̸= 0 .
Allora
1. Se n è dispari e f (n) (x0 ) > 0, allora x0 è un punto di flesso ascendente
proprio per f , mentre se f (n) (x0 ) < 0, allora x0 è un punto di flesso
discendente proprio per f .
2. Se n è pari e f (n) (x0 ) > 0, allora f è strettamente convessa in x0 ,
mentre se f (n) (x0 ) < 0, allora f è strettamente concava in x0 .
Dimostrazione. Basta applicare la Proposizione 9.4.7 alla derivata prima di f , con n − 1
al posto di n, tenendo conto delle osservazioni preliminari e del fatto che i punti di minimo
e di massimo per f ′ sono gli stessi della funzione ϕ′ .
In analogia con l’Osservazione 9.4.8 a proposito dei punti di massimo e di
minimo relativo di una funzione, anche ora bisogna ricordare di considerare
separatamente gli eventuali punti di flesso in cui la funzione non è derivabile
due volte; quindi, in generale i punti di flesso vanno ricercati tra le soluzioni
dell’equazione f ′′ (x) = 0 ed i punti in cui la funzione non è derivabile
due volte (tali punti costituiscono di solito un sottoinsieme finito oppure
numerabile dell’insieme di definizione della funzione).
◃ Ad esempio, si studiano la concavità, la convessità e gli eventuali punti
di flesso della funzione
(
)
1 3
5 2 4
2
f (x) := x
x −
x + x−2 ,
x∈R.
20
12
3
Capitolo 9: Calcolo differenziale
262
La funzione è un polinomio e quindi è infinite volte derivabile; la derivata
seconda è data da f ′′ (x) = x3 − 5x2 + 8x − 4 = (x − 1)(x − 2)2 ed è
strettamente positiva nell’intervallo ]1, +∞[r{2} e strettamente negativa
in ] − ∞, 1[; pertanto, f è strettamente convessa in [1, +∞[ e strettamente
concava in ] − ∞, 1] e, per il primo criterio per i punti di flesso (Proposizione
9.4.15), il punto 1 è un punto di flesso, mentre il punto 2 non lo è; allo stesso
risultato si perviene applicando il secondo criterio per i punti di flesso nel
punto 1 ed il terzo criterio nel punto 2.
9.4.3
Asintoti
Le nozioni seguenti possono risultare utili per una descrizione più dettagliata del comportamento di una funzione reale sia in punti di accumulazione
reali nei quali la funzione non è definita oppure non è continua (mediante
gli asintoti verticali), sia nei punti +∞ e −∞ nel caso in cui la funzione
sia definita in un insieme non limitato superiormente oppure inferiormente
(mediante gli asintoti orizzontali oppure obliqui).
Definizione 9.4.19 Siano X un sottoinsieme di R, x0 ∈ R un punto di
accumulazione a destra (rispettivamente, a sinistra) per X ed f : X → R
una funzione reale.
Si dice che la retta di equazione x = x0 è un asintoto verticale a destra
(rispettivamente, a sinistra) per f se limx→x+ f (x) = ±∞, (rispettivamente,
0
limx→x− = ±∞).
0
Più precisamente, l’asintoto viene denominato in alto se il limite è
uguale a +∞ ed in basso se è uguale a −∞.
Evidentemente, i punti x0 ∈ R in cui vi possono essere asintoti verticali
per una funzione devono essere innanzitutto di accumulazione per il suo
insieme di definizione ed in essi o la funzione non deve essere definita oppure
non deve essere continua in quanto solo in tali casi infatti il limite della
funzione potrebbe risultare infinito. La verifica poi del fatto che la retta
x = x0 rappresenti o meno l’equazione di un asintoto verticale per f viene
effettuata mediante il calcolo diretto del limite destro oppure sinistro della
funzione.
Può accadere che se il punto x0 è di accumulazione sia a destra che a
sinistra per X, la retta di equazione x = x0 rappresenti un asintoto verticale
per f solamente a sinistra oppure solamente a destra; ad esempio, per la
funzione f (x) := e1/x , x ̸= 0, la retta di equazione x = 0 è un asintoto
verticale in alto solamente a destra. Può anche accadere che la retta di
equazione x = x0 sia un asintoto da un lato in alto e dall’altro in basso,
come ad esempio, per la funzione f (x) := 1/x, x ∈ R r {0}, nel punto
x0 = 0.
9.4 Applicazioni allo studio del grafico delle funzioni reali
263
Definizione 9.4.20 Siano X un sottoinsieme non limitato superiormente
(rispettivamente, inferiormente) di R ed f : X → R una funzione reale. Se b ∈ R, si dice che la retta di equazione y = b è un asintoto orizzontale a destra (rispettivamente, a sinistra) per f se limx→+∞ f (x) = b
(rispettivamente, limx→−∞ f (x) = b).
Più in generale, se a, b ∈ R, si dice che la retta di equazione y =
ax + b è un asintoto obliquo a destra (rispettivamente, a sinistra) per f se
limx→+∞ f (x) − ax − b = 0, (rispettivamente, limx→−∞ f (x) − ax − b = 0).
La verifica dell’esistenza di un asintoto orizzontale a destra (rispettivamente, a sinistra) per f , nel caso in cui la funzione sia definita in un
insieme non limitato superiormente (rispettivamente, inferiormente), è immediata in quanto basta verificare che il limite della funzione nel punto +∞
(rispettivamente, −∞) esista e sia finito; il valore b di tale limite fornisce
poi direttamente l’equazione dell’asintoto orizzontale.
Nella Figura 9.6 seguente è mostrata una funzione con un asintoto
orizzontale a destra e a sinistra ed un asintoto verticale nel punto x0 .
y
0
x0
x
Figura 9.6: Asintoto orizzontale e verticale.
◃ Per discutere l’esistenza dell’asintoto obliquo e determinarne eventualmente l’equazione, non si può invece ricorrere direttamente alla definizione
Capitolo 9: Calcolo differenziale
264
in quanto i numeri a, b ∈ R previsti nell’equazione dell’asintoto obliquo non
sono in generale assegnati.
Tuttavia si riconosce facilmente che f è dotata di asintoto obliquo a
destra (rispettivamente, a sinistra) se e solo se esistono, e sono finiti, i
seguenti limiti
f (x)
=a∈R,
x→+∞ x
lim
lim f (x) − ax = b ∈ R ,
x→+∞
(rispettivamente,
lim
x→−∞
f (x)
=a∈R,
x
lim f (x) − ax = b ∈ R ).
x→−∞
In tal caso, l’asintoto obliquo a destra (rispettivamente, a sinistra) per f ha
equazione y = ax + b.
(Infatti se F è dotata di asintoto obliquo a destra di equazione y = ax + b, con a, b ∈ R,
allora
f (x) − ax − b
ax + b
f (x)
= lim
+ lim
=a,
lim
x→+∞
x→+∞
x→+∞ x
x
x
ed inoltre
lim f (x) − ax = lim (f (x) − ax − b) + b = b .
x→+∞
x→+∞
Viceversa si ottiene direttamente
lim f (x) − ax − b = b − b = 0
x→+∞
e quindi la proprietà è completamente dimostrata insieme all’espressione dell’equazione
dell’asintoto obliquo. Nel caso degli asintoti obliqui a sinistra si procede in maniera del
)
tutto analoga.
L’importanza della proposizione precedente risiede nel fatto che essa
fornisce un metodo per individuare il possibile coefficiente angolare ed il
termine noto dell’equazione dell’asintoto obliquo. Bisogna tuttavia sempre
verificare che entrambi i limiti previsti esistano e siano finiti; ad esempio,
la funzione logaritmo non è dotata di asintoto obliquo a destra in quanto
limx→+∞ log x/x = 0, ma limx→+∞ (log x − 0 · x) = +∞.
◃ Ad esempio, si determinano gli eventuali asintoti della funzione
f (x) := x +
1
1
+ arctan x + arctan ,
x−1
x
x ∈ R r {0, 1} .
La funzione è definita e continua in R r {0, 1} e quindi può presentare
un asintoto verticale solamente nei punti 0 e 1. Risulta limx→0− f (x) =
−1 − π/2 e limx→0+ f (x) = −1 + π/2 e quindi la retta di equazione x = 0
non è asintoto né a sinistra né a destra per f . Inoltre limx→1− f (x) = −∞
9.4 Applicazioni allo studio del grafico delle funzioni reali
265
e limx→1+ f (x) = +∞ e quindi la retta di equazione x = 1 è asintoto a
sinistra in basso e a destra in alto per f .
Infine, si ha limx→±∞ f (x) = ±∞ e quindi non esistono asintoti orizzontali, mentre
lim
x→±∞
f (x)
=1,
x
lim f (x) − x = ±
x→±∞
π
,
2
e quindi la retta di equazione y = x + π/2 è un asintoto obliquo a destra per
f mentre la retta di equazione y = x − π/2 è un asintoto obliquo a sinistra
per f .
9.4.4
Studio del grafico di una funzione reale
Una funzione reale viene spesso assegnata precisando il valore assunto in
un generico elemento dell’insieme di definizione. Lo scopo della discussione seguente è quello di determinare le informazioni che possono essere utili ad una descrizione più dettagliata della funzione ed a tracciarne
approssimativamente il grafico.
Il primo passo è sicuramente quello di determinare l’insieme X di definizione della funzione ricordando che per convenzione esso è costituito da
tutti i numeri reali in cui ha senso l’espressione assegnata (in altre parole,
si sceglie il sottoinsieme più grande di R in cui la funzione può essere definita). Conviene poi subito vedere se l’insieme di definizione X è simmetrico
oppure periodico, e in caso affermativo verificare se la funzione è pari, dispari oppure periodica; tali informazioni possono semplificare lo studio di
tutti i punti successivi e per questo motivo è opportuno stabilire subito tali
proprietà. Se una funzione è pari oppure dispari, essa può essere studiata
solamente in X ∩ [0, +∞[ (oppure in X∩] − ∞, 0]) e se è periodica di periodo
T > 0, può essere studiata in X ∩ [a, a + T ], dove a è un numero reale scelto
arbitrariamente.
Si passa poi allo studio del segno della funzione risolvendo la disequazione f (x) ≥ 0 ed allo studio delle intersezioni con l’asse x, fornite dalle
soluzioni dell’equazione f (x) = 0; l’eventuale intersezione con l’asse y esiste
se 0 ∈ X ed è in questo caso il punto di coordinate (0, f (0)).
Segue lo studio della continuità della funzione; i punti in cui la funzione
non è continua vengono utilizzati per verificare in essi l’eventuale esistenza di asintoti verticali. Si considerano quindi anche gli eventuali asintoti
orizzontali oppure obliqui se la funzione è definita in un insieme non limitato.
Infine, lo studio della derivabilità prima e seconda e del segno delle
derivate prima e seconda consentono di determinare crescenza e decrescenza della funzione e massimi e minimi relativi ed assoluti, e la convessità,
concavità e punti di flesso.
Capitolo 9: Calcolo differenziale
266
Tutte le informazioni ottenute vengono poi riassunte con un grafico
approssimativo della funzione.
Pertanto, lo schema seguente è quello che viene solitamente seguito per
lo studio di una funzione di cui è assegnato il generico valore y = f (x):
1) Determinazione dell’insieme di definizione.
2) Eventuale parità, disparità e periodicità.
3) Studio del segno della funzione ed eventuali intersezioni con gli assi.
4) Continuità.
5) Asintoti verticali, orizzontali ed obliqui.
6) Derivabilità della funzione e calcolo delle derivate prima e seconda.
7) Studio della crescenza e della decrescenza.
8) Punti di massimo e di minimo relativo ed eventualmente assoluti.
9) Studio della convessità, concavità e flessi (eventuali tangenti flessionali).
10) Grafico riassuntivo della funzione.
◃ Ad esempio, si studia la seguente funzione tracciandone approssimativamente il grafico
√
x2 − 5x + 6
f (x) :=
.
x2 − 1
Per determinare l’insieme di definizione, bisogna imporre le condizioni
{ 2
x − 5x + 6 ≥ 0 ,
x2 − 1 ̸= 0 ;
si deduce che f è definita nell’insieme
Xf :=] − ∞, −1[∪] − 1, 1[∪]1, 2] ∪ [3, +∞[ ;
poiché Xf non è simmetrico né periodico, la funzione non può verificare
condizioni di simmetria o di periodicità.
Inoltre, il segno della funzione dipende solamente dal denominatore x2 −1
e quindi la funzione è positiva negli intervalli ] − ∞, −1[, ]1, 2] e [3, +∞[ e
9.4 Applicazioni allo studio del grafico delle funzioni reali
267
negativa nell’intervallo ] − 1, 1[; vi sono due intersezioni con l’asse delle
ascisse nei punti A(2, 0), B(3, 0) mentre
l’unica intersezione con l’asse delle
√
ordinate è data dal punto C(0, − 6).
La funzione è continua in tutto Xf ; pertanto si possono presentare eventuali asintoti verticali solamente nei punti −1 e 1 (che sono di accumulazione
ma in cui f non è definita), nei quali si ha
lim f (x) = +∞ ,
x→−1−
lim f (x) = −∞ ,
x→1−
lim f (x) = −∞ ,
x→−1+
lim f (x) = +∞ ;
x→1+
quindi la retta di equazione x = −1 è un asintoto verticale in alto a sinistra
e in basso a destra per f , mentre la retta di equazione x = 1 è un asintoto
verticale in basso a sinistra e in alto a destra.
Si ha inoltre limx→±∞ f (x) = 0 e quindi la retta di equazione y = 0 è
un asintoto orizzontale sia a sinistra che a destra per f .
L’argomento della radice nella definizione di f si annulla solamente nei
punti 2 e 3 e quindi la funzione è infinite volte derivabile in Xf r {2, 3} e si
ha, per ogni x ∈ Xf r {2, 3},
f ′ (x) =
f ′′ (x) =
2x3 − 15x2 + 26x − 5
√
,
2(x2 − 1)2 x2 − 5x + 6
8x6 − 120x5 + 615x4 − 1400x3 + 1458x2 − 720x + 287
√
.
4(x2 − 1)3 x2 − 5x + 6(x2 − 5x + 6)
−
Nei punti 2 e 3 la derivata prima tende a −∞ e rispettivamente a +∞; quindi
f è dotata di derivata nei punti 2 e 3 e si ha f ′ (2) = −∞ e f ′ (3) = +∞.
Utilizzando la regola di Ruffini si riconosce subito che il punto x0 := 5 è
una radice del polinomio 2x3 −15x2 +26x−5; a questo punto possono
essere
√
determinate facilmente anche le altre radici, che
sono
x
:=
(5−
17)/4
(ap1
√
prossimativamente, x1 ∼ 0, 22) e x2 := (5 + 17)/4 (approssimativamente,
x2 ∼ 2, 28; dunque, x2 ∈
/ Xf ); si può allora dedurre che la derivata prima è
strettamente positiva in ] − ∞, −1[∪] − 1, x1 [∪]3, 5[ e strettamente negativa
in ]x1 , 1[∪]1, 2[∪]5, +∞[. La funzione è pertanto strettamente crescente in
ognuno degli intervalli ]−∞, −1[, ]−1, x1 ] e [3, 5] e strettamente decrescente
in [x1 , 1[, ]1, 2] e [5, +∞[; i punti x0 e x1 di massimo relativo proprio per f
ed i punti corrispondenti del grafico hanno coordinate
(
( √ )
√ √ √
(√
))
√
2 25 17 + 103
17 + 5
5 − 17
6
√
D
,−
,
E 5,
4
24
10 17 + 38
(approssimativamente, f (x1 ) ∼ −2, 33, f (x0 ) ∼ 0, 1). I punti 2 e 3 sono
inoltre di minimo relativo proprio per f , mentre non esistono punti di mas-
Capitolo 9: Calcolo differenziale
268
simo o di minimo assoluto in quanto f non è limitata né superiormente né
inferiormente (infatti, è dotata di asintoti verticali sia in alto che in basso).
Lo studio del segno della derivata seconda si presenta abbastanza complicato e quindi si passa direttamente a tracciare il grafico della funzione
delineato approssimativamente nella Figura 9.7 successiva.
y
D
-1 0 1
A B
x
CE
Figura 9.7: Grafico della funzione.
◃ Come ulteriore esempio, si studia la seguente funzione e se ne traccia
approssimativamente il grafico
f (x) := log
x−2
−1 .
x+3
La funzione è definita per (x − 2)/(x + 3) > 0 e quindi nell’insieme
Xf :=] − ∞, −3[∪]2, +∞[ .
Inoltre essa non è né pari, né dispari, né periodica; è sempre positiva e
si annulla per log(x − 2)/(x + 3) = 1, cioè per (x − 2)/(x + 3) = e; tale
equazione ammette un’unica soluzione x0 = −(3e + 2)/(e − 1). Quindi
vi è un’unica intersezione con l’asse delle ascisse nel punto di coordinate
9.4 Applicazioni allo studio del grafico delle funzioni reali
269
A(−(3e + 2)(e − 1), 0). Non vi sono intersezioni con l’asse delle ordinate in
quanto 0 ∈
/ Xf .
Inoltre f è continua in tutto Xf e, per quanto riguarda gli estremi, si ha
lim f (x) = +∞ ,
lim f (x) = +∞ ,
x→−3
x→2
lim f (x) = 1 ,
lim f (x) = 1 ;
x→−∞
x→+∞
quindi le rette di equazione x = −3 e x = 2 sono asintoti verticali in alto
per f , mentre la retta di equazione y = 1 è un asintoto orizzontale sia a
sinistra che a destra per f .
La funzione è infinite volte derivabile in Xf r {x0 } e, per ogni x ∈
Xf r {x0 }, si ha
f ′ (x) =
log
x−2
x+3
log
x−2
x+3
(
)
log
x−2
D log
−1 =
x+3
−1
log
−1
x−2
x+3
x−2
x+3
−1
5
;
(x
−
2)(x
+ 3)
−1
il prodotto (x − 2)(x + 3) è sempre positivo in Xf r {x0 } e quindi il segno
della derivata prima di f dipende solamente dal fattore log(x−2)/(x+3)−1,
che è positivo per (x − 2)/(x + 3) > e; si conclude che f ′ è strettamente
positiva in ]x0 , −3[ e strettamente negativa in ] − ∞, x0 [∪]2, +∞[; quindi
f è strettamente crescente in [x0 , −3[ e strettamente decrescente in ognuno
degli intervalli ] − ∞, x0 ] e ]2, +∞[; il punto x0 è di minimo relativo (anzi
assoluto) per il primo criterio sui massimi e minimi relativi (Proposizione
9.4.4) e si ha f (x0 ) = 0. Nel punto x0 la funzione non è derivabile in quanto
′
f−
(x0 ) =
′
f+
(x0 ) =
lim− f ′ (x) = lim− −
x→x0
x→x0
lim+ f ′ (x) = lim+
x→x0
x→x0
5
(e − 1)2
=−
,
(x − 2)(x + 3)
5e
5
(e − 1)2
=
.
(x − 2)(x + 3)
5e
Infine, per ogni x ∈ Xf r {x0 }, si ha
f ′′ (x) = −
log
5(2x + 1)
2
2
(x − 2) (x + 3) log
x−2
x+3
−1
x−2
x+3
−1
.
Dallo studio del segno della derivata seconda, si deduce che f è strettamente
convessa in ognuno degli intervalli ]2, +∞[ e [x0 , −3[ mentre è strettamente
concava nell’intervallo ] − ∞, x0 ]. Il grafico della funzione viene tracciato
approssimativamente nella Figura 9.8 seguente.
y
A
0
Figura 9.8: Grafico della funzione.
x
Capitolo 10
Calcolo integrale
Nel presente capitolo viene introdotta la teoria generale dell’integrazione
su intervalli limitati e successivamente viene anche considerato l’integrale
improprio di funzioni non limitate oppure su intervalli non limitati.
10.1
L’integrale secondo Riemann
La teoria dell’integrazione secondo Riemann risponde in maniera soddisfacente a criteri di semplicità e naturalezza.
Tale integrale sarà sufficiente nelle applicazioni che si ci propone di
considerare anche a riguardo delle connessioni con la teoria della misura,
concernenti prevalentemente misure di aree, volumi e lunghezza di curve.
10.1.1
Suddivisioni di un intervallo
Sono necessarie alcune considerazioni introduttive riguardanti gli intervalli
chiusi e limitati. Nel seguito del paragrafo si intenderà fissato un intervallo
chiuso e limitato [a, b] con a, b ∈ R, a < b.
Se n ≥ 1, si dice che una famiglia finita P = (xi )i=0,...,n di numeri reali
è una suddivisione di [a, b] se
x0 = a ,
xn = b ,
∀ i = 0, . . . , n − 1 : xi < xi+1 .
(10.1.1)
L’insieme di tutte le suddivisioni dell’intervallo [a, b] viene denotato per
comodità con il simbolo Σ([a, b]).
Se P = (xi )i=0,...,n è una suddivisione di [a, b], si denomina ampiezza di
P , e la si denota con |P |, il seguente numero reale
|P | :=
max
i=1,...,n−1
(xi+1 − xi ) .
Capitolo 10: Calcolo integrale
272
◃ Una prima proprietà utile per il seguito riguarda la possibilità di ottenere
suddivisioni di ampiezza arbitrariamente piccola. Infatti, per ogni ε > 0,
esiste una suddivisione P di [a, b] tale che |P | ≤ ε.
(Infatti, considerato un numero naturale n ≥ 1 tale che n ≥ (b − a)/ε e posto, per ogni
i = 0, . . . , n,
i
xi := a + (b − a) ;
n
allora la famiglia finita P = (xi )i=0,...,n è una suddivisione di [a, b] e si ha, per ogni
i = 0, . . . , n − 1, xi+1 − xi = (b − a)/n ≤ ε, da cui anche |P | ≤ ε.
)
Le suddivisioni considerate nella dimostrazione precedente hanno la particolare proprietà che la distanza tra due elementi successivi xi e xi+1 ,
i = 0, . . . , n − 1, è costante e coincide con l’ampiezza della suddivisione;
tali suddivisioni vengono denominate equispaziate.
◃ La possibilità di confrontare due suddivisioni è basata sulla seguente
definizione. Se P1 = (xi )i=0,...,n e P2 = (xi )i=0,...,n sono due suddivisioni di
[a, b], si dice che P1 è meno fine di P2 (oppure, equivalentemente, che P2
è più fine di P1 ) se l’insieme degli elementi di P1 è contenuto nell’insieme
degli elementi di P2 , cioè se
∀ i = 0, . . . , n : ∃ j = 0, . . . , m t.c. xi = yj .
Si verifica facilmente che se P1 è meno fine di P2 , allora |P2 | ≤ |P1 |.
◃ Una proprietà importante riguardante la relazione introdotta riguarda
il fato che, se P1 = (xi )i=0,...,n e P2 = (xi )i=0,...,n sono due arbitrarie
suddivisioni di [a, b], allora esiste sempre un’ulteriore suddivisione P di [a, b]
più fine sia di P1 che di P2 .
(Infatti, basta riordinare tutti gli elementi delle due suddivisioni per ottenere quelli della
suddivisione P . Precisamente, siano X1 l’insieme degli elementi della suddivisione P1 ,
X2 l’insieme degli elementi della suddivisione P2 e si ponga X := X1 ∪ X2 . L’insieme X
è finito; posto p = card(X), si può definire la famiglia finita P = (zi )i=0,...,p ponendo
z0 := min X e per ogni i = 1, . . . , p, zi = min(X r {z0 , . . . , zi−1 }); è facile verificare a
questo punto che P è una suddivisione di [a, b] e che verifica le condizioni richieste.
10.1.2
)
Integrabilità delle funzioni limitate
Si fissa ora una funzione limitata f : [a, b] → R su un intervallo chiuso e
limitato [a, b] (a, b ∈ R, a < b).
Se P = (xi )i=0,...,n è una suddivisione dell’intervallo [a, b], per ogni i =
0, . . . , n, si possono considerare
Mi :=
sup
x∈[xi ,xi+1 ]
f (x) ,
mi :=
inf
x∈[xi ,xi+1 ]
f (x) .
10.1 L’integrale secondo Riemann
273
Si denomina somma superiore (rispettivamente, somma inferiore) di f
relativa alla suddivisione P , e la si denota con il simbolo S(f, P ) (rispettivamente, s(f, P )), il seguente numero reale
S(f, P ) :=
n−1
∑
Mi (xi+1 −xi ) (rispettivamente, s(f, P ) :=
i=0
n−1
∑
mi (xi+1 −xi ) ).
i=0
(10.1.2)
Si può fornire facilmente una interpretazione geometrica delle somme
superiori ed inferiori tenendo presente che l’addendo i-esimo delle somme
in (10.1.2) rappresenta l’area di un rettangolo avente come base xi+1 −
xi ed altezza Mi (rispettivamente, mi ). Pertanto, la somma superiore ed
inferiore relativa ad una suddivisione rappresenta l’area di un sottoinsieme
di R2 costituito da un numero finito di rettangoli, illustrati nella Figura
10.1 successiva.
y
0
y
x
x
0
Figura 10.1: Somma superiore ed inferiore relativa ad una suddivisione.
Si indicano ora alcune proprietà importanti delle somme superiori ed
inferiori.
Proposizione 10.1.1 Valgono le seguenti proprietà:
1. Se P è una suddivisione dell’intervallo [a, b], allora s(f, P ) ≤ S(f, P ).
2. Se P1 e P2 sono suddivisioni dell’intervallo [a, b] e se P1 è meno fine
di P2 , allora
S(f, P2 ) ≤ S(f, P1 ) ,
s(f, P1 ) ≤ s(f, P2 ) .
3. Se P1 e P2 sono due arbitrarie suddivisioni dell’intervallo [a, b], allora
s(f, P1 ) ≤ S(f, P2 ) .
Capitolo 10: Calcolo integrale
274
Dimostrazione. 1) Segue direttamente dalle definizioni adottate.
2) Sia P1 = (xi )i=0,...,n una suddivisione meno fine di un’ulteriore suddivisione P2 =
(yi )i=0,...,m . Per ogni i = 0, . . . , n si denoti con j(i) il numero naturale tale che yj(i) = xi .
Allora
j(i+1)−1
∑
Mi (xi+1 − xi ) = Mi (yj(i+1) − yj(i) ) ≥
Mj (yj+1 − yj ) ,
j=j(i)
e analogamente
∑
j(i+1)−1
mi (xi+1 − xi ) = mi (yj(i+1) − yj(i) ) ≤
mj (yj+1 − yj ) .
j=j(i)
Sommando i termini precedenti per i = 0, . . . , n − 1 si ottiene la tesi.
3) Si consideri una suddivisione P di [a, b] più fine sia di P1 che di P2 . Dalla 2) e dalla
1) già dimostrate segue allora s(f, P1 ) ≤ s(f, P ) ≤ S(f, P ) ≤ S(f, P2 ).
Dalla Proposizione 10.1.1, 3) precedente segue, per ogni P ∈ Σ([a, b]),
s(f, P1 ) ≤ S(f, P ) e quindi il sottoinsieme
S(f ) := {S(f, P ) | P ∈ Σ([a, b])}
di R costituito da tutte le somme superiori di f è limitato inferiormente;
l’estremo inferiore di tale sottoinsieme viene denominato integrale superiore
di f in [a, b] e denotato con uno dei simboli
∫
∫
b
f,
a
b
f (x) dx .
a
Pertanto, l’integrale superiore di f è l’estremo inferiore delle somme superiori di f e soddisfa la seguente condizione, per ogni P1 ∈ Σ([a, b])
∫
s(f, P1 ) ≤
b
f,
a
cioè l’integrale superiore è un maggiorante di tutte le somme inferiori di f .
Pertanto, anche il sottoinsieme
s(f ) := {s(f, P ) | P ∈ Σ([a, b])}
di R costituito da tutte le somme inferiori di f è limitato superiormente ed
il suo estremo superiore viene denominato integrale inferiore di f in [a, b] e
denotato con uno dei simboli
∫ b
∫ b
f,
f (x) dx .
a
a
10.1 L’integrale secondo Riemann
275
Pertanto, l’integrale inferiore di f è l’estremo superiore delle somme inferiori
di f e ricordando che l’integrale superiore è un maggiorante delle somme
inferiori, si ottiene la relazione
∫ b
∫ b
f≤
f.
a
a
◃ L’integrale superiore ed inferiore può essere definito per una qualsiasi
funzione limitata in [a, b]. In generale, non ci si può aspettare che nella
formula precedente valga un’uguaglianza.
Ad esempio, si consideri la funzione di Dirichlet d : [0, 1] → R definita
ponendo, per ogni x ∈ [0, 1],
{
1,
x ∈ [0, 1] ∩ Q ,
d(x) :=
0,
x ∈ [0, 1] ∩ (R r Q) .
Tale funzione è stata già considerata nella (8.1.1) e si è osservato che essa
non è continua in alcun punto dell’intervallo [0, 1]. Se P = (xi )i=0,...,n è una
suddivisione di [a, b], in ogni intervallo [xi , xi+1 ], i = 0, . . . , n − 1, vi sono
sia punti razionali che irrazionali e quindi risulta Mi = 1 e mi = 0; pertanto
S(d, P ) =
n−1
∑
(xi+1 − xi ) = 1 ,
s(d, P ) = 0 ;
i=0
dall’arbitrarietà della suddivisione segue S(d) = {1}, s(d) = {0} e quindi
anche
∫ b
∫ b
d=0,
d=1.
a
a
Le considerazioni precedenti giustificano la seguente definizione di funzione integrabile.
Definizione 10.1.2 Se f : [a, b] → R è una funzione limitata, si dice che f
è integrabile secondo Riemann in [a, b] se l’integrale superiore di f coincide
con l’integrale inferiore di f
∫ b
∫ b
f=
f.
a
a
In tal caso il valore comune dell’integrale superiore ed inferiore di f viene
denominato integrale di f esteso all’intervallo [a, b] e si denota con uno dei
seguenti simboli
∫
∫
∫ b
∫ b
f,
f (x) dx
(=
f=
f ).
[a,b]
[a,b]
a
a
Capitolo 10: Calcolo integrale
276
(Talvolta viene anche utilizzata la notazione
∫b
a
f .)
L’insieme delle funzioni f : [a, b] → R integrabili secondo Riemann in
[a, b] viene denotato con il simbolo R([a, b]).
◃ Dalla definizione adottata segue subito che se f : [a, b] → R è una funzione costante di costante valore c ∈ R, essa è integrabile secondo Riemann
in [a, b] e si ha
∫
c dx = c(b − a) .
[a,b]
Infatti in questo caso si ha s(f, P ) = S(f, P ) = c(b − a) per ogni P ∈
Σ([a, b]).
Tuttavia, in generale la definizione precedente non risulta sufficientemente maneggevole nelle applicazioni al fine di stabilire se una funzione
è o meno integrabile secondo Riemann. Per questo motivo, è particolarmente utile avere a disposizione dei criteri di integrabilità di più semplice
applicazione.
Proposizione 10.1.3 (Primo criterio di integrabilità mediante suddivisioni)
Sia f : [a, b] → R una funzione limitata. Allora, le seguenti proposizioni
sono equivalenti:
a) f è integrabile secondo Riemann in [a, b].
b) ∀ ε > 0 ∃ P1 , P2 ∈ Σ([a, b]) t.c. S(f, P2 ) − s(f, P1 ) < ε.
c) ∀ ε > 0 ∃ P ∈ Σ([a, b]) t.c. S(f, P ) − s(f, P ) < ε.
Dimostrazione. a)⇒ b) Si supponga che f sia integrabile secondo Riemann in [a, b] e
sia ε > 0; dalla definizione di integrale inferiore e dalla seconda proprietà dell’estremo
superiore, si può trovare una suddivisione P1 di[a, b] tale che
∫
ε
f − < s(f, P1 ) ;
2
[a,b]
analogamente, dalla definizione di integrale superiore e dalla seconda proprietà dell’estremo inferiore, si può trovare una suddivisione P2 di [a, b] tale che
∫
ε
S(f, P2 ) <
f− .
2
[a,b]
Allora, S(f, P2 ) − s(f, P1 ) < ε/2 + ε/2 = ε e ciò dimostra la b).
b)⇒ c) Si fissi ε > 0; dalla b), si possono trovare P1 , P2 ∈ Σ([a, b]) tali che S(f, P2 ) −
s(f, P1 ) < ε. Allora, considerata una suddivisione P di [a, b] più fine sia di P1 che di P2 ,
si ha S(f, P ) − s(f, P ) ≤ S(f, P2 ) − s(f, P1 ) < ε.
∫
∫
c)⇒ a) Bisogna dimostrare che ab f = ab f o equivalentemente che, fissato ε > 0, risulta
∫b ∫b
a f a < ε; infatti dalla c), si può considerare una suddivisione P di [a, b] tale che
10.1 L’integrale secondo Riemann
277
S(f, P ) − s(f, P ) < ε; allora, dalla prima proprietà dell’estremo inferiore e superiore,
∫b
a f∫ ≤ S(f, P ) e analogamente, dalla prima proprietà dell’estremo superiore, segue
s(f, P ) ≤ ab f . Pertanto
risulta
∫
b
∫
f−
a
b
f ≤ S(f, P ) − s(f, P ) < ε .
a
Il primo criterio di integrabilità stabilito nella proposizione precedente
è sufficiente per stabilire l’integrabilità di diverse classi di funzioni. Si riconosce subito, ad esempio, l’integrabilità delle funzioni monotone e delle
funzioni continue.
Teorema 10.1.4 (Integrabilità delle funzioni monotone)
Se f : [a, b] → R è una funzione monotona, allora f è integrabile secondo
Riemann in [a, b].
Dimostrazione. Si osserva innanzitutto che f è limitata; infatti, se f è crescente risulta,
per ogni x ∈ [a, b], f (a) ≤ f (x) ≤ f (b) mentre, se f è decrescente si ha, per ogni x ∈ [a, b],
f (b) ≤ f (x) ≤ f (a).
Si supponga che f sia crescente e si fissi ε > 0. Posto δ = ε/(f (b) − f (a) + 1),
si può considerare una suddivisione P = (xi )i=0,...,n di [a, b] tale che |P | ≤ δ. Per
ogni i = 0, . . . , n − 1, dalla crescenza di f segue Mi := supx∈[xi ,xi+1 ] f (x) = f (xi+1 ) e
mi := inf x∈[xi ,xi+1 ] f (x) = f (xi ) da cui
S(f, P ) − s(f, P )
=
n−1
∑
(f (xi+1 ) − f (xi ))(xi+1 − xi )
i=0
≤
δ
n−1
∑
(f (xi+1 ) − f (xi ))
i=0
=
δ(−f (x0 ) + f (xn )) =
ε
(f (b) − f (a)) < ε .
f (b) − f (a) + 1
Dalla Proposizione 10.1.3, segue che f è integrabile.
Teorema 10.1.5 (Integrabilità delle funzioni continue)
Se f : [a, b] → R è una funzione continua, allora f è integrabile secondo
Riemann in [a, b].
Dimostrazione. Anche ora conviene osservare subito che f è sicuramente limitata come
conseguenza del teorema di Weierstrass (Teorema 8.2.1.
Dal teorema sull’uniforme continuità di Cantor (Teorema 8.4.2), f è uniformemente
continua e quindi, fissato ε > 0, si può trovare δ > 0 tale che, per ogni x, y ∈ [a, b]
verificanti la condizione |x − y| ≤ δ, si abbia |f (x) − f (y)| ≤ ε/(b − a). Si fissi ora
una suddivisione P = (xi )i=0,...,n di [a, b] tale che |P | ≤ δ. Per ogni i = 0, . . . , n −
1, dal teorema di Weierstrass applicato alla restrizione di f all’intervallo [xi , xi+1 ], si
possono trovare ci , di ∈ [xi , xi+1 ] tali che f (ci ) = maxx∈[xi ,xi+1 ] f (x) =: Mi e f (di ) =
Capitolo 10: Calcolo integrale
278
minx∈[xi ,xi+1 ] f (x) =: mi . Poiché |ci − di | ≤ xi+1 − xi ≤ |P | ≤ δ, deve essere anche
f (di ) − f (ci ) ≤ ε/(b − a); pertanto,
S(f, P ) − s(f, P )
=
n−1
∑
(f (di ) − f (ci ))(xi+1 − xi ) ≤
i=0
=
n−1
ε ∑
(xi+1 − xi )
b − a i=0
ε
ε
(−x0 + xn ) =
(b − a) < ε .
b−a
b−a
Dunque è verificata la condizione c) della Proposizione 10.1.3 e pertanto f è integrabile
secondo Riemann in [a, b].
10.1.3
Interpretazione geometrica e proprietà dell’integrale esteso
La definizione fornita di integrale definito di una funzione limitata si presta
in modo naturale ad essere interpretata come area di una opportuna figura
piana.
Se X ⊂ R ed f : X → R è una funzione positiva, si denomina trapezoide
relativo ad f di base X e lo si denota con T (f ) il seguente sottoinsieme di
R2
T (f ) := {(x, y) ∈ R2 | x ∈ X , 0 ≤ y ≤ f (x)} .
Sia ora f : [a, b] → R una funzione integrabile secondo Riemann in [a, b].
Si supponga dapprima che f sia positiva. Fissata una suddivisione P
di [a,b], si è visto che la somma superiore di f relativa a P rappresenta
l’area di un sottoinsieme di R2 , più precisamente di un plurintervallo chiuso1
contenente T (f ), mentre la somma inferiore di f relativa a P rappresenta
l’area di un plurintervallo chiuso contenuto in T (f ).
Poiché f è integrabile, l’estremo inferiore dei plurintervalli contenenti
T (f ) è uguale all’estremo superiore dei plurintervalli contenuti in T (f ) e
quindi il valore comune di tali estremi, cioè l’integrale esteso di f , deve
necessariamente coincidere con l’area del trapezoide T (f ) relativo ad f .
Se f : [a, b] → R è invece negativa, si può applicare quanto sopra alla
funzione −f e riconoscere che l’integrale esteso di f ad [a, b] coincide con
l’opposto dell’area dell’insieme T (f ) := {(x, y) ∈ R2 | x ∈ [a, b] , f (x) ≤
y ≤ 0}.
Infine, se f : [a, b] → R non è né positiva né negativa, si può comunque
fornire un’interpretazione geometrica dell’integrale definito di f considerando separatamente gli intervalli in cui la funzione è positiva e quelli in cui è
negativa; si stabilisce in questo modo che l’integrale esteso di f ad [a, b] coincide con l’area dell’insieme T+ (f ) := {(x, y) ∈ R2 | x ∈ [a, b] , 0 ≤ y ≤ f (x)}
1 Si denomina intervallo chiuso in Rn ogni insieme del tipo I := [a , b ] × · · · × [a , b ],
n n
1 1
cioè prodotto cartesiano di n intervalli chiusi reali. Un plurintervallo chiuso è l’unione
di un numero finito di intervalli chiusi.
10.1 L’integrale secondo Riemann
279
alla quale bisogna sottrarre l’area dell’insieme T− (f ) := {(x, y) ∈ R2 | x ∈
[a, b] , f (x) ≤ y ≤ 0}.
Si considerano ora alcune proprietà generali degli integrali estesi.
Proposizione 10.1.6 Valgono le seguenti proprietà dell’integrale esteso:
1. (Proprietà dei linearità dell’integrale esteso) Siano f : [a, b] → R e
g : [a, b] → R funzioni integrabili secondo Riemann in [a, b] e siano
α, β ∈ R. Allora la funzione αf + βg è integrabile secondo Riemann
in [a, b] e si ha
∫
∫
∫
(αf (x) + βg(x)) dx = α
f (x) dx + β
g(x) dx .
[a,b]
[a,b]
[a,b]
2. (Proprietà di monotonia dell’integrale esteso) Siano f : [a, b] → R e
g : [a, b] → R funzioni integrabili secondo Riemann in [a, b] e tali che,
per ogni x ∈ [a, b], f (x) ≤ g(x). Allora
∫
∫
f (x) dx ≤
g(x) dx .
[a,b]
[a,b]
3. (Proprietà di integrabilità del valore assoluto) Sia f : [a, b] → R una
funzione integrabile secondo Riemann in [a, b]. Allora, la funzione |f |
è anch’essa integrabile secondo Riemann in [a, b] e si ha
∫
∫
f (x) dx ≤
[a,b]
|f (x)| dx .
[a,b]
4. (Proprietà di additività dell’integrale esteso) Sia f : [a, b] → R una
funzione integrabile secondo Riemann in [a, b] e sia c ∈]a, b[. Allora,
le funzioni f|[a,c] e f|[c,b] sono integrabili secondo Riemann in [a, c] e
rispettivamente [c, b] e si ha
∫
∫
∫
f (x) dx =
f (x) dx +
f (x) dx .
[a,b]
[a,c]
[c,b]
5. (Proprietà di monotonia dell’integrale esteso delle funzioni positive
rispetto ad intervalli) Sia f : [a, b] → R una funzione positiva e integrabile secondo Riemann in [a, b] e siano c, d ∈ [a, b] tali che c < d.
Allora f|[c,d] è integrabile secondo Riemann in [c, d] e si ha
∫
∫
f (x) dx ≤
f (x) dx .
[c,d]
[a,b]
Capitolo 10: Calcolo integrale
280
6. (Proprietà di invarianza dell’integrale esteso rispetto ad insiemi finiti)
Sia f : [a, b] → R una funzione integrabile secondo Riemann in [a, b] e
sia g : [a, b] → R una funzione limitata. Se esiste un sottoinsieme finito H di [a, b] tale che f|[a,b]rH = g|[a,b]rH , allora anche g è integrabile
secondo Riemann in [a, b] e si ha
∫
∫
f (x) dx =
g(x) dx .
[a,b]
[a,b]
Dimostrazione. Le proprietà enunciate sono tutte basate sulle definizioni e sul criterio di integrabilità mediante suddivisioni. Per brevità, si omettono i dettagli della
dimostrazione.
Si considerano a questo punto alcune proprietà valide per le funzioni
continue.
◃ Un criterio di integrabilità (Teorema di Vitali) può essere enunciato
considerando il sottoinsieme H di [a, b] costituito dagli elementi di [a, b] in
cui una funzione f : [a, b] → R non è continua. Tale risultato stabilisce che
f è integrabile secondo Riemann in [a, b] se e solo se l’insieme H verifica la
seguente condizione:
Per ogni ε > 0 esiste una successione ([an , bn ])n∈N di intervalli contenuti in [a, b] tali che
H⊂
∪
[an , bn ] ,
n∈N
+∞
∑
(bn − an ) < ε . .
n=0
Tale condizione esprime il fatto che l’insieme H ha misura nulla secondo
una teoria della misura denominata di Lebesgue. Per brevità, si rinuncia
alla dimostrazione di tale risultato.
◃ Si riconosce facilmente, invece, che l’unica funzione continua e positiva
avente integrale uguale a 0 è la funzione nulla. Precisamente, se f : [a, b] →
R è una
∫ funzione continua e positiva e se esiste x0 ∈ [a, b] tale che f (x0 ) > 0,
allora [a,b] f > 0.
(Infatti f è continua in x0 e quindi, dalla proprietà di permanenza del segno, esistono
r > 0 e δ > 0 tali che, per ogni x ∈ [a, b] ∩ [x0 − δ, x0 + δ], f (x) ≥ r. Allora, posto
c := max{x0 − δ, a} e d := min{x0 + δ, b}, si ha
∫
∫
∫
f (x) dx ≥
f (x) dx ≥
r dx ≥ r(d − c) > 0 .
)
[a,b]
[c,d]
[a,b]
Si enuncia infine un ulteriore risultato importante per le funzioni continue.
10.1 L’integrale secondo Riemann
281
Teorema 10.1.7 (Teorema della media integrale)
Sia f : [a, b] → R una funzione continua. Allora esiste x0 ∈]a, b[ tale che
∫
f (x) dx = f (x0 )(b − a) .
[a,b]
Dimostrazione. Poiché f è continua, dal Teorema 8.2.1 di Weierstrass, essa è dotata di
massimo e di minimo e quindi esistono c, d ∈ [a, b] tali che, per ogni x ∈ [a, b], f (c) ≤
f (x) ≤ f (d). Dalla proprietà di monotonia dell’integrale definito segue allora
∫
∫
∫
f (c)(b − a) =
f (c) dx ≤
f (x) dx ≤
f (d) dx = f (d)(b − a)
[a,b]
[a,b]
e pertanto
f (c) ≤
∫
1
b−a
[a,b]
∫
f (x) dx ≤ f (d) .
[a,b]
Allora il numero reale [a,b] f (x) dx/(b − a) è compreso tra il minimo ed il massimo di f
e quindi ∫dal teorema di Bolzano (Corollario 8.2.3), segue l’esistenza di x0 ∈ [a, b] per cui
f (x0 ) = [a,b] f (x) dx/(b − a).
Infine, il punto x0 può essere considerato in ]a, b[. Infatti, se il teorema fosse valido
solamente per x0 = a o per x0 = b, la funzione essendo continua dovrebbe assumere valori
sempre strettamente maggiori oppure sempre strettamente minori di f (x0 ) in ]a, b[. Nel
primo caso, f (x0 ) sarebbe il minimo di f ; si consideri x1 ∈]a, b[ tale che f (x1 ) > f (x0 )
e si fissi r ∈ R tale che f (x0 ) < r < f (x1 ); dalla continuità di f ed essendo [r, +∞[ un
intorno di f (x1 ), si può trovare un intervallo ]x1 − δ, x1 + δ[⊂]a, b[ tale che f (x) ≥ r per
ogni x ∈]x1 − δ, x1 + δ[; allora
∫
∫
∫
∫
f
f+
f+
f =
[a,x1 −δ]
[a,b]
[x1 −δ,x1 +δ]
[x1 +δ,b]
≥
f (x0 )(x1 − δ − a) + r(x1 + δ − (x1 − δ)) + f (x0 )(b − x1 − δ)
≥
f (x0 )(x1 − δ − a) + 2rδ + f (x0 )(b − x1 − δ)
=
f (x0 )(b − a) + 2(r − f (x0 ))δ > f (x0 )(b − a) ,
e quindi non potrebbe valere l’uguaglianza prevista nella tesi. Allo stesso risultato si
perviene in maniera analoga se f assume sempre valori strettamente minori di f (x0 ) in
]a, b[. Pertanto la tesi è completamente dimostrata.
Geometricamente, il Teorema 10.1.7 esprime il fatto che l’area del trapezoide relativo ad una funzione continua e positiva è equivalente all’area di un
rettangolo avente come base l’intervallo [a, b] ed altezza l’intervallo [0, f (x0 )]
per un opportuno elemento x0 di ]a, b[ (vedasi la Figura 10.2 successiva).
10.1.4
Primitive ed integrale indefinito
Uno degli strumenti più efficaci per il calcolo dell’integrale definito di una
funzione viene fornito dalle primitive di una funzione, di cui ci si occupa nel
presente paragrafo.
Capitolo 10: Calcolo integrale
282
y
0
x0
x
Figura 10.2: Teorema della media integrale.
Definizione 10.1.8 Siano X un sottoinsieme di R ed f : X → R una
funzione reale. Si dice che una funzione F : X → R è una primitiva
(oppure antiderivata) di f se F è derivabile e, per ogni x ∈ X,
F ′ (x) = f (x) .
Inoltre, l’insieme di tutte le primitive di f viene denominato integrale indefinito di f e denotato con uno dei seguenti simboli
∫
∫
f,
f (x) dx .
◃ Valgono le seguenti proprietà delle primitive:
1. Siano X è un sottoinsieme di R, f : X → R una funzione reale ed
F : X → R una primitiva di f. Allora, per ogni c ∈ R, anche la
funzione F + c è una primitiva di f .
Dimostrazione. Infatti F + c è derivabile e, per ogni x ∈ X, (F + c)′ (x) =
F ′ (x) + 0 = f (x).
2. Viceversa, se la funzione f è definita in un intervallo, due qualsiasi
primitive di f differiscono sempre per una costante. Precisamente,
10.1 L’integrale secondo Riemann
283
siano I un intervallo di R, f : I → R una funzione reale ed F : I → R
e F : I → R due primitive di f . Allora esiste c ∈ R tale che G = F +c.
Dimostrazione. La funzione G − F è derivabile in quanto differenza di funzioni
derivabili e, per ogni x ∈ I, si ha (G − F )′ (x) = G′ (x) − F ′ (x) = f (x) − f (x) = 0.
Poiché I è un intervallo, G − F è costante e quindi esiste c ∈ R tale che G − F = c,
da cui la tesi.
◃ Il risultato precedente non vale se f non è definita in un intervallo. Ad
esempio, è facile constatare che la funzione log |x| è una primitiva della
funzione f (x) := 1/x, x ∈ R r {0}, ma tutte le primitive di f non si
ottengono aggiungendo una costante arbitraria a tale funzione, bensı̀ sono
del tipo
{
log |x| + c1 ,
x<0,
F (x) :=
log |x| + c2 ,
x>0,
con c1 , c2 ∈ R. In generale, per ottenere tutte le primitive e quindi l’integrale indefinito, bisogna aggiungere una costante arbitraria per ognuno degli
intervalli (massimali) in cui la funzione è definita.
Ritornando al caso delle funzioni f : I → R definite in un intervallo
I, da quanto osservato segue che, se è nota una primitiva F di f , tutte le
primitive di f si ottengono considerando le funzioni F + c, con c ∈ R e
pertanto
∫
f = {F + c | c ∈ R} ;
più frequentemente si usa scrivere per convenzione
∫
f = F (x) + c ,
c∈R;
in quanto in generale i procedimenti applicati per il calcolo degli integrali
indefiniti conducono direttamente all’espressione F (x) della primitiva in un
generico elemento x in cui questa è definita.
In particolare, se f : I → R è derivabile e se f ′ è continua, risulta
∫
f ′ (x) dx = f (x) + c ,
c∈R.
◃ Si approfondisce ora lo studio delle proprietà degli integrali indefiniti
di una funzione continua. Si può dimostrare che tali funzioni sono sempre
dotate di primitive e inoltre vale un importante legame tra l’integrale esteso
ad un intervallo [a, b] e la differenza dei valori che una primitiva assume
negli estremi b ed a.
Capitolo 10: Calcolo integrale
284
Per enunciare tali proprietà è necessario assumere alcune convenzioni
riguardanti le funzioni continue su un intervallo arbitrario di R.
Sia pertanto I un intervallo di R e si consideri una funzione continua
f : I → R. Se a, b ∈ I e a < b, la restrizione f[a,b] di f all’intervallo
[a, b] è sicuramente
integrabile in [a, b] (Teorema 10.1.5) e quindi ha senso
∫
considerare [a,b] f .
Si definisce ora l’integrale definito di f nel modo seguente, per ogni
a, b ∈ I,
 ∫


f,
a<b;



∫ b
 [a,b]
0,
a=b;
f (x) dx :=
(10.1.3)
∫

a




f,
a>b.

[b,a]
Naturalmente, le proprietà viste in generale per gli integrali estesi ad un
intervallo [a, b] si estendono facilmente agli integrali definiti utilizzando la
definizione precedente e pertanto, per brevità, vengono omesse.
Anche il teorema della media integrale può essere rienunciato come segue
considerando gli integrali definiti.
Teorema 10.1.9 (Teorema della media integrale per gli integrali
definiti)
Sia f : I → R una funzione continua in un intervallo I. Allora, per ogni
a, b ∈ I, esiste x0 ∈ I(a, b) tale che
∫ b
f (x) dx = f (x0 )(b − a) .
a
◃ Si studia ora l’esistenza delle primitive per le funzioni continue. Se f :
I → R è una funzione continua e se a ∈ I, dalla (10.1.3) si può considerare
la funzione Fa : I → R definita ponendo, per ogni x ∈ I,
∫ x
Fa (x) =
f (t) dt .
(10.1.4)
a
La funzione Fa viene denominata funzione integrale di f di punto iniziale
a; nel risultato successivo si riconosce che Fa è una primitiva della funzione
f.
Teorema 10.1.10 (Teorema fondamentale del calcolo integrale (teorema di Torricelli))
Siano I un intervallo di R ed f : I → R una funzione continua. Allora, per
ogni a ∈ I, la funzione Fa : I → R definita dalla (10.1.4) è una primitiva
di f .
10.1 L’integrale secondo Riemann
285
Dimostrazione. Bisogna dimostrare che, per ogni x0 ∈ I, Fa è derivabile in x0 e F ′ (x0 ) =
f (x0 ), cioè che
Fa (x) − Fa (x0 )
lim
= f (x0 ) .
x→x0
x − x0
Si fissi pertanto x0 ∈ I e sia ε > 0. Poiché f è continua in x0 , si può considerare δ > 0
tale che, per ogni x ∈ I∩]x0 − δ, x0 + δ[, si abbia f (x0 ) − ε < f (x) < f (x0 ) + ε.
Si fissi ora x ∈ I∩]x0 − δ, x0 + δ[r{x0 }; dal Teorema 10.1.7 della media, esiste un
elemento ξ ∈ I(x0 , x) tale che
∫ x
f (t) dt = f (ξ)(x0 − x) .
x0
Poiché
∫
Fa (x) − Fa (x0 ) =
x
∫
f (t) dt −
a
∫
x0
x
f (t) dt =
a
f (t) dt = f (ξ)(x0 − x)
x0
si ottiene
Fa (x) − Fa (x0 )
= f (ξ) .
x − x0
Inoltre ξ ∈ I∩]x0 − δ, x0 + δ[, e quindi f (x0 ) − ε < f (ξ) < f (x0 ) + ε. Si è cosı̀ dimostrato
che, per ogni x ∈ I∩]x0 − δ, x0 + δ[,
Fa (x) − Fa (x0 )
< f (x0 ) + ε ,
x − x0
e ciò, essendo ε > 0 arbitrario, dimostra la tesi.
f (x0 ) − ε <
Dunque l’insieme delle primitive di una funzione continua è sempre non
vuoto.
Il risultato successivo mette in relazione le primitive di una funzione
continua con il calcolo degli integrali definiti.
Teorema 10.1.11 (Formula fondamentale del calcolo integrale)
Siano I un intervallo di R, f : I → R una funzione continua e G : I → R
una primitiva di f . Allora, per ogni a, b ∈ I,
∫ b
f (x) dx = G(b) − G(a) .
(10.1.5)
a
Dimostrazione. Siano a, b ∈ I e si consideri la funzione integrale Fa : I → R di f
di punto iniziale a. Dal Teorema 10.1.10, anche Fa è una primitiva di f e quindi, dalle
proprietà generali delle primitive, deve esistere c ∈ R tale che G = Fa +c. Dunque G(b) =
∫
∫
Fa (b) + c = ab +c e G(a) = Fa (a) + c = c e pertanto si conclude che G(b) − G(a) = ab f .
Per comodità, il secondo membro della (10.1.5) viene spesso denotato
con uno dei seguenti simboli
[G(x)]ba ,
G(x)
b
a
;
ciò è dovuto essenzialmente al fatto che nel calcolo esplicito delle primitive
di una funzione si perviene solitamente al valore che essa assume in un
generico elemento x in cui è definita.
Capitolo 10: Calcolo integrale
286
10.1.5
Integrali indefiniti immediati
Il legame espresso dalla formula fondamentale del calcolo integrale sposta il
problema del calcolo dell’integrale definito di una funzione continua a quello
della ricerca di una primitiva di tale funzione. Per questo motivo nel seguito
ci si occuperà in modo più dettagliato dei metodi per il calcolo degli integrali
indefiniti; si cominciano ad esaminare dapprima alcuni integrali indefiniti
immediati che seguono direttamente dalle derivate delle funzioni elementari
e successivamente di alcune regole di integrazione.
Dalle derivate delle funzioni elementari, è immediato verificare gli integrali indefiniti considerati di seguito.
1. Per ogni a ∈ R, a ̸= −1, risulta
∫
xa+1
xa dx =
+c,
a+1
c∈R
in ogni intervallo I in cui la funzione xa è definita e precisamente,
I = R se a ∈ N, I =]0, +∞[ oppure I =] − ∞, 0[ se a ∈ Z r N,
I = [0, +∞[ se a ∈]0, +∞[rN e infine I =]0, +∞[ se a ∈] − ∞, 0[rZ.
∫
2. Si ha
1
dx = log |x| + c ,
x
c∈R,
in ognuno degli intervalli [0, +∞[ oppure ] − ∞, 0].
3. Per ogni a ∈]0, +∞[r{1}, risulta
∫
ax
ax dx =
+c,
log a
4. Si ha
∫
sin x dx = − cos x + c ,
5. Si ha
∫
c∈R, x∈R.
∫
cos x dx = sin x + c ,
1
dx = tan x + c ,
cos2 x
c∈R, x∈R.
c∈R,
in ognuno degli intervalli ] − π/2 + kπ, π/2 + kπ[, k ∈ Z e
∫
1
dx = − cot x + c ,
c∈R,
sin2 x
in ognuno degli intervalli ]kπ, π + kπ[, k ∈ Z.
10.1 L’integrale secondo Riemann
287
6. Si ha
∫
1
√
dx = arcsin x+c = − arccos x+c ,
1 − x2
7. Si ha
∫
1
dx = arctan x + c = −arccot x + c ,
1 + x2
c ∈ R , x ∈]−1, 1[ .
c∈R, x∈R.
Se f : I → R è una funzione derivabile in un intervallo I, le formule
precedenti possono essere generalizzate componendo la funzione f con una
delle funzioni elementari sopra considerate.
Per brevità non vengono ripetuti tutti i casi precedenti ma si riportano
solamente alcuni esempi, anche in previsione del fatto che l’applicazione
della successiva regola di sostituzione consentirà di ottenere risultati più
generali.
∫
1. Si ha
f ′ (x)
dx = log |f (x)| + c ,
f (x)
c∈R,
purché f (x) > 0 per ogni x ∈ I oppure f (x) < 0 per ogni x ∈ I.
2. Per ogni a ∈]0, +∞[r{1}, risulta
∫
3. Si ha
4. Si ha
∫
af (x) f ′ (x) dx =
af (x)
+c,
log a
c∈R, x∈I.
sin f (x) f ′ (x) dx = − cos f (x) + c ,
∫
1
f ′ (x) dx = tan f (x) + c ,
f (x)
cos2
c∈R, x∈I.
c∈R,
purché esista k ∈ Z tale che −π/2 + kπ < f (x) < π/2 + kπ per ogni
x ∈ I.
Le precisazioni effettuate di volta in volta sulla validità delle formule
precedenti sono indispensabili per il calcolo degli integrali definiti mediante
la formula fondamentale del calcolo integrale. Il calcolo degli integrali indefiniti può invece essere esteso a funzioni definite nell’unione di più intervalli
considerando una costante arbitraria in ognuno di essi.
Capitolo 10: Calcolo integrale
288
10.1.6
Prime regole di integrazione
Per estendere il calcolo degli integrali indefiniti, è necessario ricorrere ad
opportune regole di integrazione di seguito esposte.
Una prima regola di integrazione può essere ricavata direttamente dalla
proprietà di linearità dell’integrale definito (Proposizione 10.1.6, 1.); tale
regola può essere enunciata ovviamente anche per gli integrali indefiniti e si
enuncia come segue
Se f, g : I → R sono funzioni continue ed α, β ∈ R, allora
∫
∫
∫
(αf (x) + βg(x)) dx = α f (x) dx + β g(x) dx .2
Si considerano ora due ulteriori regole di integrazione di frequente applicazione.
Proposizione 10.1.12 (Regola di integrazione per sostituzione)
1. (Formula di cambiamento di variabile per gli integrali definiti). Sia
φ : [a, b] → R una funzione derivabile con derivata continua e sia f :
I → R una funzione continua in un intervallo I tale che φ([a, b]) ⊂ I.
Allora
∫
∫
b
φ(b)
f (φ(x)) φ′ (x) dx =
f (t) dt .
a
φ(a)
2. Siano I e J intervalli di R, φ : J → R una funzione derivabile con
derivata continua ed f : I → R una funzione continua tale che φ(J) ⊂
I. Se F : I → R è una primitiva di f , allora
∫
f (φ(x)) φ′ (x) dx = F (φ(x)) + c ,
c∈R.
Dimostrazione. Si osserva innanzitutto che la funzione (f ◦ φ) · φ′ è continua e quindi
è integrabile per il Teorema 10.1.5. Si considerino ora le funzioni F : [a, b] → R e
G : [a, b] → R definite ponendo, per ogni y ∈ [a, b],
∫ y
∫ y
F (y) :=
f (t) dt ,
G(y) :=
f (φ(x)) φ′ (x) dx .
φ(a)
2 Ricordando
a
che l’integrale indefinito è un insieme di funzioni, si precisa che il prodotto
α · A di uno scalare per un sottoinsieme è da intendersi come α · A := {αa | a ∈ A}; inoltre
la somma di due insiemi che è da intendersi al modo seguente: A + B := {a + b | a ∈
A , b ∈ B}. Quindi, nel caso in esame, il secondo membro significa
{
}
∫
∫
∫
∫
α f (x) dx + β g(x) dx = αF + βG | F ∈
f (x) dx , G ∈
g(x) dx .
10.1 L’integrale secondo Riemann
289
Dal teorema fondamentale del calcolo integrale (Teorema 10.1.10), la funzione F è una
primitiva di f e la funzione G è una primitiva di (f ◦ φ) · φ′ . Poiché, per ogni t ∈ [a, b],
risulta anche (F ◦ φ)′ (t) = F ′ (φ(t)) φ′ (t) = f (φ(t))φ′ (t), le funzioni G ed F ◦ φ devono
differire per una costante; essendo, poi, G(a) = 0 e F (φ(a)) = 0, tale costante deve essere
nulla e si ottiene G = F ◦ φ; in particolare G(b) = F (φ(b)) da cui la tesi.
2) Basta osservare che F ◦ φ è una primitiva di (f ◦ φ) · φ′ .
Nelle applicazioni concrete è come se si effettuasse materialmente la sostituzione t = φ(x) e si sostituisse il differenziale φ′ (x) dx con dt (spesso
si scrive dφ(x) anziché φ′ (x)dx). L’uguaglianza φ′ (x) dx = dt si ottiene
formalmente derivando entrambi i membri dell’uguaglianza t = φ(x) rispetto alla variabile t a primo membro ed alla variabile x a secondo membro.
Tali osservazioni giustificano la denominazione attribuita alla Proposizione
10.1.12. Nelle applicazioni riguardanti il calcolo degli integrali definiti, si
può scegliere se determinare dapprima una primitiva della funzione da integrare e quindi applicare la formula fondamentale del calcolo integrale oppure
se applicare direttamente la parte 1) della Proposizione 10.1.12 cambiando
anche gli estremi di integrazione nell’integrale assegnato.
Proposizione 10.1.13 (Regola di integrazione per parti)
Siano I un intervallo di R, f : I → R una funzione continua e g : I → R una
funzione derivabile con derivata continua. Se F : I → R è una primitiva di
f , si ha
∫
∫
f (x) g(x) dx = F (x) g(x) − F (x) g ′ (x) dx .
e conseguentemente, per ogni a, b ∈ I,
∫ b
∫
[
]b
f (x) g(x) dx = F (x) g(x) a −
a
b
F (x) g ′ (x) dx .
a
Dimostrazione. Dalla regola di derivazione del prodotto di due funzioni risulta (F · g)′ =
F ′ · g + F · g ′ = f · g + F · g ′ e quindi f · g = (F · g)′ − F · g ′ ; poiché le funzioni f · g
e (F · g)′ − F · g ′ sono definite nell’intervallo I, le primitive di f · g coincidono con le
primitive di (F · g)′ − F · g ′ ; ma F · g è una primitiva di (F · g)′ e pertanto le primitive di
(F · g)′ − F · g ′ sono date dalla differenza di F · g e le primitive di F · g ′ e da ciò deriva
la tesi. L’ultima parte segue direttamente da quanto dimostrato.
◃ Ad esempio, si vuole calcolare il seguente integrale definito
∫ e
log x dx .
1
Si determina dapprima l’integrale indefinito. Dalla regola di integrazione
per parti, si ha
∫
∫
∫
log x dx = 1 · log x dx = x log x − x D(log x) dx = x log x − x + c ,
Capitolo 10: Calcolo integrale
290
con c ∈ R. Allora, scegliendo la primitiva con c = 0, dalla formula fondamentale del calcolo integrale (Teorema 10.1.11) l’integrale definito assegnato
è dato da
∫ e
[
]e
log x dx = x log x − x 1 = e − e − (−1) = 1 .
1
◃ L’integrale seguente viene calcolato in maniera analoga
∫
∫
arctan x dx =
1 · arctan x dx
∫
x
dx
= x arctan x −
1 + x2
1
= x arctan x − log(1 + x2 ) + c ,
2
con c ∈ R.∫ Nell’ultima uguaglianza si è utilizzato l’integrale indefinito
f ′ (x)
immediato
dx = log |f (x)| + c.
f (x)
◃ Si consideri ora l’integrale indefinito
∫
sin x cos x
dx .
sin4 x + cos4 x
In ogni intervallo ] − π/2 + kπ, π/2 + kπ[ con k ∈ Z, si può scrivere
∫
∫
∫
sin x cos x dx
sin x cos x dx
tan x dx
(
)
=
=
4
4
4
2
4
cos x(1 + tan x)
cos x 1 + (tan2 x)2
sin x + cos x
e quindi, posto t = tan2 x, da cui dt = 2 tan x dx/ cos2 x, si ottiene
∫
∫
sin x cos x
1
1
1
1
dx =
dt = arctan t + c = arctan tan2 x + c
2
1 + t2
2
2
sin4 x + cos4 x
con c ∈ R. Anche se la funzione assegnata è definita in tutto R, in questo
caso è stato possibile determinare un primitiva solamente in ogni intervallo
] − π/2 + kπ, π/2 + kπ[ con k ∈ Z.
10.2
Integrazione delle funzioni razionali
Una classe abbastanza ampia di funzioni per le quali è possibile stabilire
un metodo generale per il calcolo dell’integrale indefinito è costituita dalle
10.2 Integrazione delle funzioni razionali
291
funzioni razionali, cioè delle funzioni rapporto di due polinomi. Nella presente sezione si espone sinteticamente il metodo generale per il calcolo di
un integrale della forma
∫
P (x)
dx ,
Q(x)
dove, per ogni x ∈ R,
P (x) = a0 + a1 x + · · · + an xn ,
Q(x) = b0 + b1 x + · · · + bm xm ,
a0 , . . . , an ∈ R , an ̸= 0 ,
b 0 , . . . , b m ∈ R , bm =
̸ 0,
e si suppone n < m in quanto ci si può sempre ricondurre a questo caso
effettuando la divisione dei polinomi P e Q.
10.2.1
Caso m = 1
In questo caso Q(x) = ax + b con a ̸= 0 e si ottiene l’integrale
∫
1
dx = log |ax + b| + C ,
C∈R,
ax + b
in ognuno degli intervalli ] − ∞, −b/a[ e ] − b/a, +∞[.
10.2.2
Caso m = 2
In questo caso Q(x) = ax2 + bx + c con a ̸= 0 e P può essere di grado 0
oppure 1.
Si considera innanzitutto il seguente tipo di integrale
∫
1
dx .
ax2 + bx + c
Posto ∆ = b2 − 4ac, si procede come segue:
• Caso ∆ > 0. Denotate con x1 e x2 le due soluzioni reali distinte e tali
che x1 < x2 dell’equazione ax2 +bx+c = 0 e imponendo l’uguaglianza
ax2
1
A
B
dx =
+
+ bx + c
x − x1
x − x2
si determinano le costanti A e B e quindi l’integrale diventa
∫
1
dx = A log |x − x1 | + B log |x − x2 | + C ,
ax2 + bx + c
dove la costante arbitraria C dipende da ognuno degli intervalli ] −
∞, x1 [, ]x1 , x2 [ e ]x2 , +∞[.
Capitolo 10: Calcolo integrale
292
• Caso ∆ = 0. Denotata con x0 l’unica soluzione reale dell’equazione
ax2 + bx + c = 0, si ha ax2 + bx + c = a(x − x0 )2 e quindi
∫
∫
1
1
1
dx
=
dx = −
+C ,
2
2
ax + bx + c
a(x − x0 )
a(x − x0 )
dove la costante arbitraria C dipende da ognuno degli intervalli ] −
∞, x0 [ e ]x0 , +∞[.
• Caso ∆ < 0. Con semplici manipolazioni algebriche si scrive
ax2
2
1
2a
=√
(
)
+ bx + c
−∆ 2ax + b 2
√
+1
−∆
e quindi
∫
2ax + b
1
2
arctan √
+C ,
dx = √
ax2 + bx + c
−∆
−∆
con C costante arbitraria in tutto R.
Si considera ora il caso in cui P (x) = mx + n, con m ̸= 0, ha grado 1.
In questo caso si ottiene
(
)∫
∫
∫
mx + n
m
2ax + b
mb
1
dx =
dx + n −
dx
ax2 + bx + c
2a
ax2 + bx + c
2a
ax2 + bx + c
(
)∫
m
mb
1
=
log |ax2 + bx + c| + n −
dx
2a
2a
ax2 + bx + c
e l’ultimo integrale viene risolto come nel caso precedente.
10.2.3
Caso m > 2
Il polinomio Q può essere decomposto nella seguente forma (vedasi la (3.5.7))
Q(x) = bm (x − x1 )h1 · · · (x − xp )hp (x2 + b1 x + c1 )k1 · · · (x2 + bq x + cq )kq ,
dove x1 , . . . , xp sono le radici reali di Q aventi rispettivamente molteplicità
h1 , . . . , hp , e k1 , . . . , kq sono le molteplicità delle radici complesse coniugate
dei termini x2 + b1 x + c1 , . . . , x2 + bq x + cq con ∆1 = b21 − 4c1 < 0, . . . , ∆q =
b2q − 4cq < 0. Poiché la somma di tutte le molteplicità deve essere m, si deve
avere
h1 + · · · + hp + 2(k1 + · · · + kq ) = m .
10.2 Integrazione delle funzioni razionali
293
Il rapporto P (x)/Q(x) viene decomposto facendo corrispondere ad ogni
fattore x − xr un addendo della forma
Ar
x − xr
con Ar costante da determinare e ad ogni fattore x2 + bs x + cs = 0 un
addendo della forma
Bs x + Cs
x2 + bs x + cs
con Bs e Cs costanti da determinare; infine si tiene conto della molteplicità
considerando un addendo ulteriore della forma
M (x) =
d Γ(x)
,
dx R(x)
dove al denominatore figurano tutti i fattori con molteplicità diminuita di
una unità (quindi non figurano i fattori con molteplicità 1):
R(x) = (x−x1 )h1 −1 · · · (x−xp )hp −1 (x2 +b1 x+c1 )k1 −1 · · · (x2 +bq x+cq )kq −1
e al numeratore il polinomio Γ ha grado uguale a quello del denominatore
diminuito di una unità
Γ(x) = γ0 + γ1 x + · · · + γt xt
con t = (h1 − 1) + · · · + (hp − 1) + 2(k1 − 1) + · · · + 2(kq − 1) − 1 e le costanti
γ1 , . . . , γt sono da determinare.
Tutte le costanti vengono determinate imponendo nella uguaglianza
P (x)
A1
Ap
B1 x + C1
Bq x + Cq
=
+· · ·+
+ 2
+· · ·+ 2
+ M (x)
Q(x)
x − x1
x − xp x + b1 x + c1
x + bq x + cq
che i coefficienti dello stesso grado coincidano e in questo modo si ottiene
un sistema lineare di p + 2q + t + 1 equazioni in p + 2q + t + 1 incognite il
cui determinante dei coefficienti è diverso da 0.
Pertanto l’integrale diventa
∫
P (x)
dx =A1 log |x − x1 | + · · · + Ap log |x − xp |
Q(x)
∫
∫
Γ(x)
B1 x + C1
Bq x + Cq
+
dx + · · · +
dx +
2
2
x + b1 x + c1
x + bq x + cq
R(x)
dove tutti gli integrali da calcolare rientrano nei casi già discussi.
Capitolo 10: Calcolo integrale
294
10.3
Integrali impropri
La definizione di funzione integrabile secondo Riemann è stata data inizialmente per funzioni limitate e definite in un intervallo chiuso e limitato. Si
vuole ora estendere tale definizione anche al caso di funzioni non limitate
oppure definite in un insieme non limitato; in tal caso si parlerà di integrali
in senso improprio (oppure anche in senso generalizzato).
10.3.1
Integrali impropri di funzioni non limitate
Si considera innanzitutto il caso di funzioni non necessariamente limitate
definite però su un intervallo chiuso e limitato.
Nel seguito, si intende fissato un intervallo [a, b] con a, b ∈ R, a < b e si
prendono in esame le funzioni che soddisfano la condizione seguente.
Definizione 10.3.1 Una funzione reale f : [a, b] → R si dice generalmente
continua se ammette al più un numero finito di punti di discontinuità.
Poiché l’integrale definito di una funzione è invariante rispetto ad insiemi finiti, non è importante per i nostri fini il valore che una funzione
generalmente continua assume nei punti di discontinuità; in tali punti, anzi,
la funzione potrebbe anche non essere definita. Precisamente, se H è un
sottoinsieme finito di [a, b] e se f : [a, b] r H → R è continua, essa può
essere considerata come funzione generalmente continua in [a, b] identificandola con una qualsiasi funzione definita anche in H e che coincide con f in
[a, b] r H.
Ad esempio, la funzione f (x) = 1/ log x è una funzione generalmente
continua nell’intervallo [0, 1], in quanto attribuendole un valore arbitrario
nei punti 0 e 1, tali punti risultano gli unici suoi punti di discontinuità in
[0, 1].
Per estendere la definizione di integrale definito a tali funzioni, si considera innanzitutto il caso in cui f : [a, b] → R abbia un unico punto di
discontinuità in uno degli estremi.
Definizione 10.3.2 Sia f : [a, b] → R una funzione generalmente continua
e si supponga che a (rispettivamente, b) sia l’unico punto di discontinuità
di f .
Se esiste il seguente limite
∫ b−ε
∫ b
f (x) dx ), (10.3.1)
lim+
f (x) dx ,
(rispettivamente, lim+
ε→0
ε→0
a+ε
a
esso viene denominato integrale improprio di f e denotato con il simbolo
∫ b
f (x) dx .
a
10.3 Integrali impropri
295
Si osservi che f è integrabile in [a + ε, b] (rispettivamente, in [a, b − ε]) in
quanto continua in tale intervallo.
Inoltre, se il limite (10.3.1) è un numero reale si dice anche che l’integrale improprio di f in [a, b] è convergente oppure che f è integrabile in
senso improprio in [a, b]; se il limite (10.3.1) è infinito, si dice che l’integrale
improprio di f in [a, b] è divergente.
Se f : [a, b] → R è continua in [a, b] r {x0 }, con x0 ∈]a, b[, l’integrale
improprio può essere definito applicando la Definizione 10.3.2 separatamente
alle restrizioni f|[a,x0 ] e f|[x0 ,b] . Si richiede quindi che esistano entrambi i
limiti
∫ x0 −ε
∫ b
lim+
f (x) dx ,
lim+
f (x) dx .
(10.3.2)
ε→0
ε→0
a
x0 +ε
Se tali limiti sono finiti, si dice che la funzione è integrabile in senso
improprio in [a, b] oppure che l’integrale improprio di f è convergente; se
uno dei due limiti è finito e l’altro è uguale a +∞ (rispettivamente, a −∞)
oppure se i due limiti sono entrambi uguali a +∞ (rispettivamente, uguali
a −∞), si dice che l’integrale improprio di f è divergente positivamente
(rispettivamente, negativamente).
Se f è integrabile in senso improprio in [a, b], dal primo teorema sul
limite della somma di due funzioni (Teorema 6.5.1), il valore dell’integrale
può essere calcolato considerando il limite
∫
(∫
b
f (x) dx = lim
a
)
b
f (x) dx +
ε→0+
a
∫
x0 −ε
f (x) dx
.
(10.3.3)
x0 +ε
Tuttavia, l’integrabilità in senso improprio di f non può essere dedotta
dal fatto che l’ultimo limite sia finito; infatti, tale limite può essere finito
anche se i due limiti (10.3.1) sono uno divergente positivamente e l’altro
negativamente; in tal caso, il limite (10.3.3) viene comunque denominato
valore principale dell’integrale improprio di f e denotato con uno dei simboli
∫
∫
b
(v.p.)
f (x) dx ,
a
b
∗
f (x) dx .
a
◃ Ad esempio, si consideri la funzione generalmente continua 1/x nell’intervallo [−1, 1]; si ha
∫
lim+
ε→0
ε
1
1
1
dx = lim+ [log x]ε = lim+ − log ε = +∞ ,
x
ε→0
ε→0
Capitolo 10: Calcolo integrale
296
e quindi tale funzione non può essere integrabile in senso improprio in
[−1, 1]; risulta inoltre
(∫
lim+
ε→0
−ε
−1
e quindi (v.p.)
1
dx +
x
∫1
1
−1 x
∫
1
ε
1
dx
x
)
)
(
1
−ε
= lim+ [log −x]−1 + [log x]ε = 0
ε→0
dx = 0.
◃ Se f : [a, b] → R è una funzione generalmente continua discontinua in n
punti x1 , . . . xn ∈ [a, b], l’integrabilità in senso improprio di f viene definita applicando quanto sopra separatamente a ciascuno dei punti x1 , . . . xn ;
precisamente, si consideri una suddivisione y0 , . . . , yn di [a, b] in n intervalli
tali che ogni xi appartenga solamente all’intervallo [yi−1 , yi ], i = 1, . . . , n,
allora si dice che f è integrabile in senso improprio in [a, b] oppure che l’integrale improprio di f è convergente se, per ogni i = 1, . . . , n, la restrizione
di f all’intervallo [yi−1 , yi ] (che presenta un solo punto di discontinuità) è
integrabile in senso improprio in [yi−1 , yi ], cioè esistono e sono finiti i limiti
∫
lim
ε→0+
∫
xi −ε
f (x) dx ,
yi−1
yi
lim
ε→0+
f (x) dx
xi +ε
(ovviamente, il primo limite non va considerato se xi = a e il secondo
se xi = b). Se qualcuno dei limiti precedenti è divergente positivamente
(rispettivamente, negativamente) ed i rimanenti sono convergenti, si dice
che l’integrale improprio di f è divergente positivamente (rispettivamente,
negativamente).
◃ In base alle definizioni assunte, si può studiare l’integrabilità in senso
improprio nel caso di un unico punto di discontinuità; i criteri ottenuti vanno
poi applicati separatamente a ciascun punto di discontinuità di f (affinché
f sia integrabile in senso improprio è necessario che lo sia rispetto a ciascun
punto di discontinuità).
Osservazione 10.3.3 Si riconoscono facilmente alcune proprietà relative
alle operazioni sulle funzioni integrabili in senso improprio; ad esempio,
si enunciano le seguenti omettendone per brevità la dimostrazione, basata
essenzialmente sulle definizioni assunte:
1. Se f : [a, b] → R è una funzione generalmente continua dotata di
punti di discontinuità solamente eliminabili o di prima specie, essa è
integrabile in senso improprio in [a, b]. Quindi, i punti di discontinuità
in un intorno dei quali può fallire l’integrabilità della funzione sono
quelli di seconda specie, che per tale motivo vengono denominati anche
punti singolari della funzione.
10.3 Integrali impropri
297
2. Se f : [a, b] → R e g : [a, b] → R sono funzioni generalmente continue
integrabili in senso improprio in [a, b], allora la somma f +g è anch’essa
integrabile in senso improprio in [a, b] e si ha
∫ b
∫ b
∫ b
(f (x) + g(x)) dx =
f (x) dx +
g(x) dx .
a
a
a
3. Se f : [a, b] → R e g : [a, b] → R sono funzioni generalmente continue
integrabili in senso improprio in [a, b] e se esiste un sottoinsieme finito
H di [a, b] tale che, per ogni x ∈ [a, b] r H, f (x) ≤ g(x), allora si ha
anche
∫
∫
b
b
f (x) dx ≤
a
g(x) dx .
a
4. Sia f : [a, b] → R una funzione generalmente continua e positiva, integrabile in senso improprio in [a, b]; considerato l’insieme finito H dei
punti di discontinuità di f , si definisce il trapezoide T (f ) := {(x, y) ∈
∫b
R2 | x ∈ [a, b] r H , 0 ≤ y ≤ f (x)}. Allora a f (x) dx = Area (T (f )).
Per i criteri successivi risulta utile la definizione seguente.
Definizione 10.3.4 Sia f : [a, b] → R una funzione generalmente continua. Si dice che f è assolutamente integrabile in senso improprio in [a, b]
se la funzione |f | è integrabile in senso improprio in [a, b]. Inoltre, si dice che l’integrale improprio di f è assolutamente divergente se l’integrale
improprio di |f | è divergente positivamente.
◃ Si supponga che f : [a, b] → R sia continua in ]a, b]. Poiché |f | è
positiva, la funzione g :]a, b] → R definita ponendo, per ogni x ∈]a, b],
∫b
g(x) := x |f (t)| dt è decrescente e quindi, per il teorema sul limite delle
funzioni monotone (Teorema 6.6.1), è dotata di limite nel punto a dato da
∫b
supx∈]a,b] x |f (t)| dt.
Pertanto, l’integrale improprio di |f | è necessariamente convergente oppure divergente positivamente.
Lo stesso discorso può essere applicato nel caso in cui f non sia continua
in b oppure in uno o più punti interni all’intervallo [a, b].
Quindi, si può concludere che una funzione generalmente continua risulta
o assolutamente integrabile in senso improprio oppure l’integrale in senso
improprio è assolutamente divergente.
Per questo motivo per indicare che una funzione è assolutamente integrabile in senso improprio è sufficiente scrivere
∫ b
|f (x)| dx < +∞ .
a
Capitolo 10: Calcolo integrale
298
◃ Se f è positiva, l’assoluta integrabilità equivale ovviamente all’integrabilità in senso improprio.
In generale, si può solamente affermare che se f : [a, b] → R è una funzione generalmente continua e assolutamente integrabile in senso improprio
in [a, b], allora f è integrabile in senso improprio in [a, b] e si ha
∫
∫
b
b
f (x) dx ≤
|f (x)| dx .
a
a
Vale inoltre il seguente criterio di confronto.
Proposizione 10.3.5 (Criterio di confronto per gli integrali impropri)
Siano f : [a, b] → R e g : [a, b] → R funzioni generalmente continue e si
supponga che, per ogni x ∈ [a, b], |f (x)| ≤ g(x). Si ha
1. Se g è integrabile in senso improprio, allora f è assolutamente integrabile in senso improprio.
2. Se l’integrale improprio di f è assolutamente divergente, allora anche
l’integrale improprio di g è divergente positivamente.
Dimostrazione. 1) La prima parte segue dalle definizioni applicando la proprietà di
monotonia dell’integrale definito e del limite. La seconda parte segue invece direttamente
dalla prima.
Esempio 10.3.6 (Integrali impropri campione) Siano x0 ∈ [a, b] e α > 0.
Si consideri la funzione f : [a, b] r {x0 } → R definita ponendo, per ogni
x ∈ [a, b] r {x0 },
1
f (x) :=
.
|x − x0 |a
Si tratta di una funzione generalmente continua in [a, b] avente x0 come
unico punto di discontinuità. Si supponga x0 < b; per ogni ε > 0, se α = 1
∫
b
x0 +ε
1
b
dx = [log |x − x0 |]x0 +ε = log(b − x0 ) − log ε ,
|x − x0 |α
mentre, se α ̸= 1,
∫
b
x0 +ε
1
dx =
|x − x0 |α
=
[
]b
1
|x − x0 |−α+1 x +ε
0
−α + 1
(
)
1
(b − x0 )−α+1 − ε−α+1 .
−α + 1
10.3 Integrali impropri
299
Si deduce allora che
∫
lim+
ε→0
b
x0 +ε

1−α

 (b − x0 )
,
1
1−α
dx
=

|x − x0 |α

+∞ ,
0<α<1,
α≥1.
∫ x −ε
Le stesse conclusioni valgono se si suppone a < x0 e si considera a 0 1/|x−
x0 |α dx. Quindi f è integrabile in senso improprio in [a, b] se 0 < α < 1,
mentre non lo è se α ≥ 1.
Utilizzando l’esempio e il criterio di confronto precedenti si ottiene il
seguente risultato di frequente applicazione.
Teorema 10.3.7 (Criterio dell’ordine di infinito)
Sia f : [a, b] → R una funzione continua in [a, b] r {x0 }, con x0 ∈ [a, b]. Si
ha
1. Se f è un infinito in x0 di ordine minore o uguale di α, con α ∈
]0, 1[ (oppure se f non è un infinito in x0 ), allora f è assolutamente
integrabile in senso improprio in [a, b].
2. Se f è un infinito in x0 di ordine maggiore o uguale di 1, allora
l’integrale improprio di f è assolutamente divergente.
Dimostrazione. 1) Dalle ipotesi fatte, esistono δ > 0 ed M ∈ R tali che, per ogni
x ∈ [a, b]∩]x0 − δ, x0 + δ[, |f (x)| ≤ M/|x − x0 |α (ciò vale anche se f non è un infinito
in x0 considerando α ∈]0, 1[ arbitrario). Poiché α < 1, dall’Esempio 10.3.6 e dalla
Proposizione 10.3.5, 1), segue che f è assolutamente integrabile in senso improprio in
[a, b].
2) Dal fatto che f è un infinito in x0 di ordine maggiore o uguale di 1, si deduce l’esistenza
di δ > 0 ed M ∈ R tali che, per ogni x ∈ [a, b]∩]x0 −δ, x0 +δ[, |f (x)| ≥ M/|x−x0 |. Ancora
dall’Esempio 10.3.6 e dalla Proposizione 10.3.5, 2), segue che l’integrale improprio di f è
assolutamente divergente.
◃ In generale, per stabilire l’integrabilità in senso improprio di una funzione generalmente continua, si cerca prima di applicare il Teorema 10.3.7 in
ognuno dei punti di discontinuità per f . Se si trova un punto di discontinuità
in cui vale la parte 2), si conclude subito che la funzione non è integrabile
in senso improprio. Se invece in tutti i punti di discontinuità è soddisfatta
la parte 1), la funzione è integrabile in senso improprio in [a, b].
Può capitare che in qualche punto il criterio dell’ordine di infinito non si
possa applicare, cioè che la funzione sia un infinito in un punto x0 di ordine
minore di 1, ma maggiore di α per ogni α ∈]0, 1[.
In questi casi bisogna ricorrere ad altri metodi per lo studio dell’integrabilità, ad esempio, rifacendosi direttamente alle definizioni assunte. Si
Capitolo 10: Calcolo integrale
300
osserva infine che i criteri di integrabilità in senso improprio, nel caso in
cui possano essere applicati, consentono di stabilire solamente l’integrabilità della funzione ma non forniscono il valore dell’integrale improprio, per il
quale bisogna in generale utilizzare la definizione ed i metodi di integrazione
per gli integrali definiti.
◃ Ad esempio, si consideri l’integrale improprio
∫
0
1/2
1
dx ,
x logn x
n≥1.
Nel punto 0 la funzione è un infinito di ordine minore di 1, ma di ordine
maggiore di α per ogni 0 < α < 1 e pertanto il criterio sull’ordine di infinito
non può essere applicato (l’ordine minore di 1 esclude la seconda parte e
l’ordine maggiore di α per ogni 0 < α < 1 esclude la prima parte del
teorema).
Pertanto, si ricorre direttamente alla definizione. Se n = 1 si ha, per
ogni ε > 0,
∫
1/2
ε
1
1/2
dx = [log | log x|]ε = log log 2 − log | log ε| ,
x log x
mentre, se n ≥ 2,
∫
ε
1/2
[ −n+1 ]1/2
(
)
1
log
x
1
−n+1 1
−n+1
dx
=
=
−
log
−
log
ε
.
x logn x
−n + 1 ε
n−1
2
Si deduce che
∫
0
1/2

1

,
1
dx
=
(n
−
1)
logn−1 2
n

x log x
−∞ ,
n≥2,
n=1.
Quindi l’integrale improprio è convergente se e solo se n ≥ 2.
◃ Si consideri l’integrale improprio
∫ 1√
(1 − ex ) log x
dx .
sin(πx)
0
La funzione in esame è generalmente continua e non
√ è definita nei punti
0 e 1. Per quanto riguarda il punto 0, la funzione (1 − ex ) log x è un
infinitesimo di ordine minore di 1/2, ma maggiore di ogni numero strettamente positivo minore di 1/2, mentre la funzione sin πx è un infinitesimo di
ordine 1. Si deduce che il rapporto è un infinito di ordine maggiore di 1/2
10.3 Integrali impropri
301
ma minore di ogni numero maggiore di 1/2, ad esempio di 3/4; dal criterio
dell’ordine di infinito (Teorema 10.3.7), segue l’assoluta integrabilità della
funzione in un intorno del punto 0.
Nel punto 1 la funzione al numeratore è un infinitesimo di ordine 1/2 e
quella al denominatore è un infinitesimo di ordine 1; il rapporto è quindi un
infinito di ordine 1/2 e la funzione è integrabile nel punto 1 sempre per il
criterio dell’ordine di infinito.
Poiché si è stabilita l’integrabilità della funzione in ogni punto di discontinuità, si conclude che essa è integrabile. Tuttavia le regole di integrazione note non consentono in questo caso di calcolare il valore dell’integrale
improprio.
◃ Si consideri l’integrale improprio
∫ π
(2x − π) tan x dx .
0
L’unico punto di discontinuità da discutere in questo caso è il punto π/2,
nel quale la funzione è un il prodotto di un infinitesimo di ordine 1 e di un
infinito di ordine 1; pertanto in tale punto la funzione non è un infinito ed
è di conseguenza integrabile in senso improprio in [0, π].
◃ Si consideri l’integrale improprio
∫
0
1
log2 (1 − x)
dx .
1−x
Vi è solamente il punto 1 da discutere; in tale punto la funzione è il
rapporto di un infinito di ordine arbitrariamente piccolo e di un infinitesimo
di ordine 1; quindi è un infinito di ordine maggiore di 1 (e minore di 1 + ε
per ogni ε > 0); dal criterio dell’ordine di infinito, tenendo presente che la
funzione è positiva, l’integrale improprio è divergente positivamente.
10.3.2
Integrali impropri su intervalli non limitati
Si considera ora il caso di funzioni definite in un intervallo illimitato. La
discussione è analoga al caso precedente e per questo motivo si tralasceranno
alcuni dettagli in caso di completa analogia.
Definizione 10.3.8 Sia f : [a, +∞[→ R (rispettivamente, f :]−∞, b] → R)
una funzione continua. Se esiste il limite
∫
lim
b→+∞
∫
b
f (x) dx ,
a
(rispettivamente,
lim
a→−∞
b
f (x) dx ),
a
(10.3.4)
Capitolo 10: Calcolo integrale
302
esso viene denominato integrale improprio di f in [a, +∞[ (rispettivamente,
in ] − ∞, b]) e denotato con uno dei simboli
∫
∫
+∞
f (x) dx ,
a
∫
+∞
f,
∫
b
(rispettivamente,
b
f (x) dx ,
−∞
a
f ).
−∞
Inoltre, se il limite (10.3.4) è un numero reale si dice anche che l’integrale
improprio di f è convergente oppure che f è integrabile in senso improprio; se il limite (10.3.4) è infinito, si dice che l’integrale improprio di f è
divergente.
Se f : R → R è una funzione continua, si dirà poi che essa è integrabile
in senso improprio in R se esistono e sono finiti entrambi i limiti
∫
lim
b→+∞
∫
b
f (x) dx ,
c
c
lim
a→−∞
f (x) dx ,
(10.3.5)
a
dove c ∈ R è fissato arbitrariamente. In tal caso l’integrale improprio di f
può essere calcolato anche considerando il limite
∫ +∞
∫ a
f (x) dx = lim
f (x) dx ;
(10.3.6)
−∞
a→+∞
−a
Anche ora conviene osservare che l’esistenza del limite (10.3.6) non comporta in generale che f sia integrabile in senso improprio in tutto R.
Se uno dei limiti (10.3.5) tende a ±∞ e l’altro ad un numero reale,
oppure se tendono entrambi a +∞ o a −∞, si dice che l’integrale improprio
di f è divergente (positivamente o negativamente).
Una situazione più generale è quella in cui la funzione è generalmente
continua in un intervallo illimitato. In questo caso l’integrabilità in senso
improprio viene considerata separatamente in un intorno di ogni punto di
discontinuità ed eventualmente nei punti +∞ e −∞; è sufficiente che l’integrabilità fallisca in un intorno di tali punti per concludere che la funzione
non è integrabile in senso improprio.
Per quanto osservato, si può ora trattare separatamente solamente il
caso di funzioni continue su intervalli illimitati.
Nel seguito si considera l’intervallo [a, +∞[; considerazioni analoghe
valgono in ] − ∞, b] ed R.
◃ Si possono stabilire proprietà analoghe a quelle enunciate per gli integrali
impropri di funzioni limitate.
1. Se f : [a, +∞[→ R e g : [a, +∞[→ R sono funzioni continue integrabili in senso improprio in [a, +∞[, allora la somma f + g è anch’essa
10.3 Integrali impropri
303
integrabile in senso improprio in [a, +∞[ e si ha
∫ +∞
∫ +∞
∫
(f (x) + g(x)) dx =
f (x) dx +
a
a
+∞
g(x) dx .
a
2. Se f : [a, +∞[→ R e g : [a, +∞[→ R sono funzioni continue integrabili
in senso improprio in [a, +∞[ e se, per ogni x ∈ [a, b], f (x) ≤ g(x),
allora si ha anche
∫ +∞
∫ +∞
f (x) dx ≤
g(x) dx .
a
a
3. Se f : [a, +∞[→ R è una funzione continua e positiva, integrabile in
senso improprio in [a, +∞[, considerato il trapezoide T (f ) := {(x, y) ∈
∫ +∞
R2 | x ≥ a , 0 ≤ y ≤ f (x)}, si ha a f (x) dx = Area (T (f )).
L’assoluta integrabilità viene definita come in precedenza.
Se f : [a, +∞[→ R è una funzione continua, si dice che f è assolutamente
integrabile in senso improprio in [a, +∞[ se la funzione |f | è integrabile in
senso improprio in [a, +∞[.
Inoltre, si dice che l’integrale improprio di f è assolutamente divergente
se l’integrale improprio di |f | è divergente positivamente.
◃ Anche ora, dal teorema sul limite delle funzioni monotone, si deduce che
una funzione continua f : [a, +∞[→ R o è assolutamente integrabile in senso
improprio oppure il suo integrale improprio è assolutamente divergente; per
evidenziare il fatto che una funzione
∫ +∞ è assolutamente integrabile in senso
improprio si scrive solitamente a |f (x)|dx < +∞.
Ovviamente, le nozioni di assoluta integrabilità in senso improprio e di
integrabilità in senso improprio sono equivalenti se la funzione è positiva.
In generale, si può solamente dire che se f : [a, +∞[→ R è una funzione
continua e assolutamente integrabile in senso improprio in [a, +∞[, allora f
è integrabile in senso improprio in [a, +∞[ e si ha
∫ +∞
∫ +∞
f (x) dx ≤
|f (x)| dx .
a
a
Inoltre se f : [a, +∞[→ R e g : [a, +∞[→ R sono funzioni continue tali
che, per ogni x ∈ [a, +∞[, |f (x)| ≤ g(x), si ha
1. Se g è integrabile in senso improprio, allora f è assolutamente integrabile in senso improprio.
2. Se l’integrale improprio di f è assolutamente divergente, allora anche
l’integrale improprio di g è divergente positivamente.
304
Capitolo 10: Calcolo integrale
◃ Utilizzando la definizione si riconosce facilmente che l’integrale improprio
∫ +∞
1
dx
α
x
1
è convergente per α > 1 ed è divergente positivamente se 0 < α < 1.
Si può infine enunciare il seguente criterio dell’ordine di infinitesimo.
Teorema 10.3.9 (Criterio dell’ordine di infinitesimo)
Sia f : [a, +∞[→ R una funzione continua. Allora:
1. Se f è un infinitesimo in +∞ di ordine maggiore o uguale di α, con
α > 1, allora f è assolutamente integrabile in senso improprio in
[a, +∞[.
2. Se f è un infinitesimo in +∞ di ordine minore o uguale di 1 (oppure
se tende ad un limite diverso da 0 in +∞), allora l’integrale improprio
di f è assolutamente divergente.
Dimostrazione. Se f è un infinitesimo in +∞ di ordine maggiore o uguale di α, con
α > 1, si possono trovare c ∈ [a, +∞[ ed M ∈ R tali che, per ogni x ∈ [c, +∞[, |f (x)| ≤
M/|x|α . Poiché α > 1, la funzione 1/|x|α è integrabile in senso improprio in [a, +∞[ e
quindi anche f lo è.
2) Se f è un infinitesimo in +∞ di ordine minore o uguale di 1 oppure se f tende ad un
limite diverso da 0 in +∞, esistono c ∈ [a, +∞[ ed M ∈ R tali che, per ogni x ∈ [c, +∞[,
|f (x)| ≥ M/|x|. Allora la tesi segue dal fatto che la funzione M/|x| non è integrabile in
senso improprio in [c, +∞[.
Il criterio dell’ordine di infinitesimo non si può applicare se f : [a, +∞[→
R è un infinitesimo in +∞ di ordine maggiore di 1, ma minore di 1 + ε per
ogni ε > 0. In questi casi si cerca di ricorrere ad altri metodi oppure
direttamente alla definizione.
◃ Ad esempio, si consideri l’integrale improprio
∫ +∞
sin x
dx .
2+1
x
0
La funzione è continua in [0, +∞[ e quindi bisogna discutere l’integrabilità
solamente in un intorno del punto +∞. Per ogni x ∈ [0, +∞[, risulta
sin x
1
≤ 2
2
x +1
x +1
e poiché 1/(x2 + 1) è un infinitesimo di ordine 2 in +∞, dal criterio dell’ordine di infinitesimo (Teorema 10.3.9 segue che l’integrale improprio considerato è assolutamente convergente e quindi convergente.
10.3 Integrali impropri
305
◃ Si consideri l’integrale improprio
∫ +∞
1
dx ,
x logn x
2
n≥1.
La funzione in esame è continua e quindi bisogna discutere l’integrabilità
solamente in un intorno del punto +∞. Nel punto +∞ la funzione è un
infinitesimo di ordine maggiore di 1, ma di ordine minore di α per ogni α > 1
e pertanto il criterio sull’ordine di infinitesimo non può essere applicato
(l’ordine maggiore di 1 esclude la seconda parte e l’ordine minore di α per
ogni α > 1 esclude la prima parte del teorema).
Pertanto, si ricorre direttamente alla definizione. Se n = 1 si ha, per
ogni b > 2,
∫ b
1
b
dx = [log | log x|]2 = log log b − log log 2 ,
2 x log x
mentre, se n ≥ 2,
∫
b
2
[ −n+1 ]b
)
log
x
1 ( −n+1
1
dx
=
=−
log
b − log−n+1 2 .
n
x log x
−n + 1 2
n−1
Si deduce che
∫
0
1/2

1

,
1
dx =
(n − 1) logn−1 2

x logn x
+∞ ,
n≥2,
n=1
e quindi l’integrale improprio è convergente se e solo se n ≥ 2.
◃ Si consideri l’integrale improprio
∫ +∞
Γ(α) :=
xα−1 e−x dx ,
α∈R.
(10.3.7)
0
Bisogna discutere l’integrabilità in un intorno del punto 0 ed in un intorno
del punto +∞.
Nel punto 0, vi è un infinito di ordine 1−α se α < 1 altrimenti la funzione
è limitata e quindi, per il criterio dell’ordine di infinito e tenendo conto della
positività della funzione, l’integrale Γ(α) è convergente per 1 − α < 1, cioè
per α > 0 ed è divergente positivamente per α ≤ 0 in un intorno del punto
0.
Nel punto +∞, la funzione è un infinitesimo di ordine arbitrariamente
grande e quindi è sicuramente integrabile in un intorno del punto +∞ per
il criterio dell’ordine di infinitesimo.
Capitolo 10: Calcolo integrale
306
Si conclude che l’integrale assegnato è convergente per α > 0 e divergente
positivamente per α ≤ 0. La funzione Γ :]0, +∞[→ R definita dalla (10.3.7)
è nota come funzione gamma.
◃ Il criterio dell’ordine di infinitesimo (Teorema 10.3.9) richiama un risultato analogo stabilito per le serie numeriche (Teorema 7.2.13).
In effetti, è possibile
stabilire il seguente legame tra integrali impropri e
∑+∞
serie numeriche. Sia n=0 an una serie numerica e si consideri la funzione
f : [0, +∞[→ R cosı̀ definita; per ogni x ∈ [0, +∞[, considerato l’unico
numero naturale n ∈ N tale che x ∈ [n, n + 1[, si pone
f (x) := an .
Allora, le seguenti proposizioni sono equivalenti:
∑+∞
a) La serie n=0 an è convergente (rispettivamente, assolutamente convergente, divergente);
b) La funzione f è integrabile in senso improprio in [0, +∞[ (rispettivamente, f è assolutamente integrabile in senso improprio in [0, +∞[,
l’integrale improprio di f è divergente).
Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti, si ha
∫ +∞
+∞
∑
an =
f (x) dx .
0
n=0
∫
Dimostrazione. Per ogni n ∈ N, si ha nn+1 f (x) dx = an e quindi, denotata con sn la
somma parziale n-esima della serie, si ha
∫ n+1
n ∫ k+1
n
∑
∑
f (x) dx .
f (x) dx =
ak =
sn =
k=0
k=0
k
0
Da ciò segue subito b)⇒ a); per il viceversa, basta osservare che, per ogni n ∈ N e
∫
b ∈ [n, n + 1[, l’integrale 0b f (x) dx è compreso tra min{sn , sn+1 } e max{sn , sn+1 }. Se ℓ
denota la somma della serie, fissato ε > 0, si può trovare ν ∈ N tale che, per ogni n ≥ ν,
∫
risulti |sn − ℓ| < ε e conseguentemente anche 0b f (x) dx − ℓ < ε. Da ciò segue la b) ed
anche l’uguaglianza prevista nell’ultima parte della tesi.
I casi rispettivi si dimostrano in maniera analoga.
◃ Viceversa, considerata una funzione
∑+∞ f : [0, +∞[→ R integrabile in senso
improprio, si può definire la serie n=0 an di termine generale n-esimo an
ponendo an := f (n), n ∈ N.
Se f : [0, +∞[→ R è positiva e decrescente, allora le seguenti proposizioni
sono equivalenti:
10.3 Integrali impropri
307
a) La funzione f è integrabile in senso improprio in [0, +∞[ (rispettivamente, l’integrale improprio di f è divergente positivamente).
∑+∞
b) La serie n=0 an è convergente (rispettivamente, divergente positivamente).
Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti, si ha
∫
+∞
f (x) dx ≤
0
∫
+∞
∑
+∞
an ≤ f (0) +
f (x) dx .
0
n=0
Dimostrazione. Poiché f è decrescente si ha, per ogni n ∈ N,
∫ n+1
an+1 ≤
f (x) dx ≤ an
e quindi
∑n
k=0
n
∑
k=0
ak+1 ≤
∫ n+1
ak = a0 +
0
n−1
∑
n
f (x) dx ≤
∑n
k=0
∫
ak .
∫
+∞
ak+1 ≤ a0 +
f (x) dx = f (0) +
0
k=0
+∞
f (x) dx
0
e quindi la serie è convergente in quanto è a termini positivi e le sue somme parziali sono
limitate superiormente. Si ha inoltre
+∞
∑
∫
+∞
an ≤ f (0) +
f (x) dx .
0
n=0
Viceversa, per ogni b ∈ [0, +∞[, considerato n ∈ N tale che b ∈ [n, n + 1[, dalla
positività di f segue
∫ n+1
∫ n+1
∫ b
∫ b
n
∑
f (x) dx ≤
ak ;
f (x) dx =
f (x) dx +
f (x) dx ≤
0
b
0
0
k=0
poiché f è positiva e il suo integrale improprio è limitato superiormente dalla somma
della serie, si ottiene la a) e inoltre
∫
0
e ciò completa la dimostrazione.
+∞
f (x) dx ≤
+∞
∑
an ,
n=0
Parte II
Equazioni differenziali e
funzioni di più variabili
reali
Nella seconda parte del corso, viene completato lo studio delle funzioni
di una variabile reale con ulteriori capitoli riguardanti lo studio delle successioni e delle serie di funzioni e quello delle equazioni differenziali ordinarie;
inoltre, vengono illustrati alcuni aspetti riguardanti le funzioni di più variabili reali, quali il calcolo differenziale, lo studio dei massimi e minimi relativi
e vincolati e lo studio degli integrali multipli corredato da alcuni strumenti
elementari di teoria della misura.
Capitolo 11
Successioni e serie di
funzioni
11.1
Convergenza puntuale ed uniforme
Sia X un sottoinsieme non vuoto di R e sia (fn )n∈N una successione di
funzioni reali definite in X.
Fissato un elemento x0 ∈ X, si dice che la successione (fn )n∈N è convergente in x0 se la successione numerica (fn (x0 ))n∈N è convergente.
Inoltre, se A ⊂ X, si dice che la successione (fn )n∈N è puntualmente
convergente in A (oppure semplicemente convergente in A oppure anche
convergente in A) se essa è convergente in ogni elemento di A. Se A =
X si dice che (fn )n∈N è puntualmente convergente oppure semplicemente
convergente.
Si supponga che la successione di funzioni (fn )n∈N sia puntualmente
convergente; allora si può considerare la funzione reale f : X → R definita
ponendo, per ogni x ∈ X,
f (x) := lim fn (x) .
n→+∞
(11.1.1)
Essa viene denominata limite puntuale (oppure limite semplice) della successione (fn )n∈N e viene denotata con
f = lim fn
n→+∞
puntualmente.
Esplicitamente, la condizione precedente pertanto significa
∀ x ∈ X ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : |fn (x) − f (x)| ≤ ε .
(11.1.2)
Capitolo 11: Successioni e serie di funzioni
314
Tale tipo di convergenza tuttavia consente l’applicazione dei risultati ottenuti sulle successioni numeriche in ogni punto prefissato ma non ci si può
aspettare che vengano conservate per la funzione f alcune proprietà qualitative delle funzioni fn , quali la continuità, la derivabilità in un punto o
globale e l’integrabilità.
Per lo studio di tali proprietà della funzione limite è più efficace il concetto di convergenza uniforme in cui si pretende che nella condizione (11.1.2)
il numero naturale ν non dipenda dall’elemento x ∈ X ma solamente da
ε > 0.
Precisamente, se (fn )n∈N è una successione di funzioni reali definite in X
ed f : X → R è una ulteriore funzione, si dice che (fn )n∈N è uniformemente
convergente verso f (oppure che f è il limite uniforme della successione
(fn )n∈N ) se è verificata la seguente condizione:
∀ ε > 0 ∃ ν ∈ N t.c. ∀ x ∈ X ∀ n ≥ ν : |fn (x) − f (x)| ≤ ε ,
(11.1.3)
oppure, equivalentemente,
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : sup |fn (x) − f (x)| ≤ ε .
x∈X
In tal caso, si scrive
f = lim fn
n→+∞
uniformemente.
Inoltre, si dice che la successione (fn )n∈N è uniformemente convergente
in un sottoinsieme A di X se la successione ((fn )|A )n∈N delle restrizioni
all’insieme A è uniformemente convergente.
◃ Evidentemente, la condizione (11.1.3) implica la (11.1.2) e pertanto, se
la successione (fn )n∈N è uniformemente convergente verso f , essa è anche
puntualmente convergente verso f .
Viceversa, se (fn )n∈N converge puntualmente verso f , non è detto che
la convergenza sia uniforme.
◃ Ad esempio, si consideri, per ogni n ≥ 1, la funzione reale fn : R → R definita ponendo, per ogni x ∈ R, fn (x) := sin(x)+x/n. Si riconosce facilmente che sin = limn→+∞ fn . Infatti, per ogni x0 ∈ R, si ha limn→+∞ x0 /n = 0
e conseguentemente limn→+∞ fn (x0 ) = sin x0 . Tuttavia, fissato ε > 0 e
imponendo la condizione | sin x − fn (x)| < ε, si trova |x|/n < ε, che è soddisfatta solamente nell’intervallo ] − nε, nε[ e non in tutto R; si conclude che
la convergenza non può essere uniforme.
Si può completare la discussione della convergenza della successione di
funzioni (fn )n≥1 osservando che la convergenza risulta uniforme in ogni
intervallo I limitato di R. Infatti, posto r := supx∈I |x| si ha I ⊂ [−r, r] e
11.2 Proprietà del limite di una successione di funzioni
315
conseguentemente, per ogni n ≥ 1, supx∈I |fn (x) − f (x)| = supx∈I |x|/n ≤
r/n; pertanto, fissato ε > 0 e considerato ν ≥ 1 tale che ν ≥ rε, si ha
supx∈I |fn (x) − f (x)| ≤ ε for ogni n ≥ ν, da cui l’uniforme convergenza in
I.
◃ Come ulteriore esempio si consideri, per ogni n ∈ N, la funzione reale
fn : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1], fn (x) := xn e sia
f : [0, 1] → R cosı̀ definita
{
0,
0≤x<1,
f (x) :=
1,
x=1.
Allora, la successione di funzioni (fn )n∈N converge puntualmente verso f .
Tuttavia la convergenza non può essere uniforme. Si supponga infatti per
assurdo che fissato ε = 1/3, esista ν ∈ N tale che, per ogni n ≥ ν e per ogni
x ∈ [0, 1], si abbia
√ |fn (x) − f (x)| ≤ 1/3; allora, in particolare, considerando
n = ν ed x := ν 2/3, si dovrebbe avere 2/3 = |fν (x) − f (x)| ≤ 1/3 da cui
un assurdo. Quindi (fn )n∈N non converge uniformemente verso f ; in questo
caso, si può riconoscere che, per ogni 0 < a < 1, la successione (fn )n∈N
converge uniformemente verso f in [0, a].
◃ Si osserva che se (fn )n∈N e (gn )n∈N sono successioni di funzioni di X
in R convergenti puntualmente verso una funzione f : X → R e rispettivamente g : X → R, allora la successione di funzioni (fn + gn )n∈N converge
puntualmente verso f + g e la successione di funzioni (fn · gn )n∈N converge
puntualmente verso f · g. Se (fn )n∈N e (gn )n∈N convergono uniformemente
verso f e rispettivamente g, allora la somma (fn +gn )n∈N converge uniformemente verso f + g, mentre senza ulteriori ipotesi (ad esempio, di limitatezza
di f e g) non si può affermare che il prodotto (fn · gn )n∈N converga uniformemente verso f · g, come si riconosce facilmente considerando ad esempio
fn (x) = gn (x) = x + 1/n per ogni x ∈ R.
11.2
Proprietà del limite di una successione
di funzioni
Si studia ora il comportamento della funzione limite f di una successione
(fn )n∈N di funzioni uniformemente convergente, nelle ipotesi in cui ogni fn
verifichi opportune condizioni.
Il primo risultato è un teorema di carattere generale che stabilisce una
formula di inversione dei limiti per le successioni di funzioni uniformemente
convergenti.
Capitolo 11: Successioni e serie di funzioni
316
Teorema 11.2.1 (Teorema di inversione dei limiti)
Siano X un sottoinsieme non vuoto di R, x0 un punto di accumulazione per
X ed (fn )n∈N una successione di funzioni reali definite in X. Si supponga
che
i) La successione (fn )n∈N converge uniformemente verso una funzione
f : X → R;
ii) Per ogni n ∈ N, risulta lim fn (x) = ℓn ∈ R.
x→x0
Allora, la successione (ℓn )n∈N è convergente e inoltre, posto ℓ := lim ℓn ,
n→+∞
risulta lim f (x) = ℓ.
x→x0
Dimostrazione. Si dimostra innanzitutto che la successione (ℓn )n∈N è convergente,
facendo vedere che essa verifica la seguente condizione di Cauchy:
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n, m ≥ ν : |ℓn − ℓm | ≤ ε .
Si fissi a tal fine ε > 0 e, per la uniforme convergenza di (fn )n∈N verso f , si consideri
ν ∈ N tale che, per ogni n ≥ ν e per ogni x ∈ X, si abbia |fn (x)−f (x)| ≤ ε/4. Si dimostra
ora che, per ogni n, m ≥ ν, risulta |ℓn − ℓm | ≤ ε e ciò completerà la dimostrazione. Si
fissino pertanto n, m ≥ ν; dall’ipotesi i), si possono trovare un intorno J1 di x0 tale che,
per ogni x ∈ X ∩ J1 r {x0 }, |fn (x) − ℓn | ≤ ε/4 ed un intorno J2 di x0 tale che, per ogni
x ∈ X ∩ J2 r {x0 }, |fm (x) − ℓm | ≤ ε/4. Allora, fissato x ∈ X ∩ J1 ∩ J2 r {x0 }, risulta
|ℓn − ℓm |
=
|ℓn − fn (x) − (ℓm − fm (x)) + fn (x) − f (x) − (fm (x) − f (x))|
≤
|ℓn − fn (x)| + |ℓm − fm (x)| + |fn (x) − f (x)| + |fm (x) − f (x)|
ε
ε
ε
ε
≤
+ + + = ε.
4
4
4
4
Si è cosı̀ dimostrato che la successione (ℓn )n∈N è convergente. Si ponga ℓ := lim ℓn .
n→+∞
Sia ora ε > 0; poichè (fn )n∈N è uniformemente convergente verso f , esiste ν1 ∈ N tale
che, per ogni n ≥ ν1 e per ogni x ∈ X, si abbia |fn (x) − f (x)| ≤ ε/3. Inoltre, la
successione (ℓn )n∈N converge verso ℓ e quindi esiste ν2 ∈ N tale che |ℓn − ℓ| ≤ ε/3 per
ogni n ≥ ν2 . Si fissi ora n ≥ max{ν1 , ν2 }; poichè fn converge verso ℓn per x → x0 , si può
trovare un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, risulti |fn (x) − ℓn | ≤ ε/3.
Conseguentemente, per ogni x ∈ X ∩ J r {x0 }, risulta anche |f (x) − ℓ| ≤ |f (x) − fn (x)| +
|fn (x) − ℓn | + |ℓn − ℓ| ≤ ε/3 + ε/3 + ε/3 = ε; dall’arbitrarietà di ε > 0, segue quindi la
tesi.
◃ La tesi del Teorema 11.2.1 precedente esprime la possibilità di invertire
i limiti rispetto alle variabili n → +∞ ed x → x0 ; infatti, si ha
lim
lim fn (x) = lim f (x) = ℓ = lim ℓn = lim
x→x0 n→+∞
x→x0
n→+∞
lim fn (x) .
n→+∞ x→x0
Tale inversione dei limiti non vale, in generale, se la successione di funzioni non è uniformemente convergente; ad esempio, risulta evidentemente
limn→+∞ limx→1− xn = 1 mentre limx→1− limn→+∞ xn = 0.
Come ulteriore conseguenza del risultato precedente, si può ottenere la
proprietà di continuità del limite uniforme.
11.2 Proprietà del limite di una successione di funzioni
317
Teorema 11.2.2 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed (fn )n∈N una successione di funzioni reali definite in X
e continue nel punto x0 . Se la successione (fn )n∈N converge uniformemente
verso una funzione f : X → R, allora anche f risulta continua nel punto
x0 .
Dimostrazione. Basta applicare il Teorema 11.2.1 precedente tenendo presente che, per
ogni n ∈ N, si ha limx→x0 fn (x) = fn (x0 ).
Ovviamente, se ogni funzione fn è è continua in un sottoinsieme A di
X, allora anche il limite uniforme f risulta continuo in A; in particolare, se
ogni fn è continua, il limite uniforme f è anch’esso continuo.
Quest’ultimo risultato può in alcuni casi essere utile per dimostrare che
una successione di funzioni non può essere uniformemente convergente verso
una funzione f . Ad esempio, si consideri, per ogni n ∈ N, la funzione
fn : R → R definita ponendo, per ogni x ∈ R, fn (x) : | sin(πx)|n . Allora,
la successione di funzioni (fn )n∈N converge puntualmente verso la funzione
f : R → R che assume il valore 1 in Z e 0 in R r Z; allora, la convergenza
non può essere uniforme in quanto, per ogni n ∈ N, fn è continua mentre f
evidentemente non lo è.
Si considera ora il comportamento del limite di una successione di funzioni rispetto alle proprietà di integrabilità e derivabilità. Si hanno i seguenti
risultati di carattere generale.
Teorema 11.2.3 (Passaggio al limite sotto il segno di integrale)
Siano a, b ∈ R con a < b ed (fn )n∈N una successione di funzioni reali
continue in [a, b] uniformemente convergente verso una funzione f : [a, b] →
R. Allora f è integrabile in [a, b] ed inoltre
∫
∫
b
f (x) dx = lim
a
n→+∞
b
fn (x) dx .
a
Dimostrazione. Poichè, per ogni n ∈ N, fn è una funzione continua, dal Teorema 11.2.2
precedente segue che anche f è continua e quindi integrabile in [a, b]. Inoltre, fissato
ε > 0, dalla uniforme convergenza di (fn )n∈N verso f , segue l’esistenza di ν ∈ N tale che,
per ogni n ≥ ν e per ogni x ∈ [a, b], si abbia |fn (x) − f (x)| ≤ ε/(b − a); pertanto, per
ogni n ≥ ν, si ha
∫ b
∫ b
∫ b
∫ b
ε
|fn (x) − f (x)| dx ≤
f (x) dx ≤
fn (x) dx −
dx = ε ,
b−a a
a
a
a
e ciò, per l’arbitrarietà di ε > 0, dimostra la tesi.
La denominazione attribuita al teorema precedente deriva dal fatto che
esso può essere espresso dicendo che il limite uniforme (se esistente) di
Capitolo 11: Successioni e serie di funzioni
318
una successione (fn )n∈N di funzioni continue in un intervallo [a, b], risulta
integrabile in [a, b] e si ha
)
∫ b
∫ b(
lim
fn (x) dx =
lim fn (x) dx .
n→+∞
a
n→+∞
a
Teorema 11.2.4 (Passaggio al limite sotto il segno di derivata)
Siano a, b ∈ R con a < b ed (fn )n∈N una successione di funzioni reali
derivabili e con derivata continua in [a, b]. Si supponga che
i) La successione delle derivate (fn′ )n∈N è uniformemente convergente
verso una funzione g : [a, b] → R.
ii) Esiste x0 ∈ [a, b] tale che la successione (fn (x0 ))n∈N sia convergente.
Allora, la successione (fn )n∈N è uniformemente convergente e, denotato
con f := limn→+∞ fn il suo limite uniforme, si ha che f è derivabile in
[a, b] e f ′ = g.
Dimostrazione. Si ponga innanzitutto ℓ0 := limn→+∞ fn (x0 ). Si osserva che, dal Teorema 11.2.2, la funzione g deve essere continua e quindi la funzione integrale f : [a, b] → R
definita ponendo, per ogni x ∈ R,
∫ x
g(t) dt
f (x) := ℓ0 +
x0
risulta derivabile e la sua derivata coincide con g.
Resta da dimostrare pertanto che la successione (fn )n∈N converge uniformemente
verso f .
Sia ε > 0; poiché (fn′ )n∈N converge uniformemente verso g, si può trovare ν1 ∈ N tale
che, per ogni n ≥ ν1 e per ogni x ∈ [a, b], risulti |fn′ (x) − g(x)| ≤ ε/(2(b − a)); inoltre,
poiché la successione (fn (x0 ))n∈N converge verso ℓ0 , esiste ν2 ∈ N tale che |fn (x0 )−ℓ0 | ≤
ε/2 per ogni n ≥ ν2 .
Allora, considerato ν = max{ν1 , ν2 }, per ogni n ≥ ν e per ogni x ∈ [a, b], risulta
∫ x
fn (x) − ℓ0 −
g(t) dt
|fn (x) − f (x)| =
∫
x0
x
=
∫
≤
x0
x
fn′ (t) dt
+ fn (x0 ) − ℓ0 −
∫
x
g(t) dt
x0
|fn′ (t) − g(t)| dt + |fn (x0 ) − ℓ0 |
x0
ε
ε
|x − x0 | +
2(b − a)
2
ε
ε
≤
+ =ε,
2
2
e ciò per l’arbitrarietà di ε > 0, dimostra la tesi.
≤
Anche in questo caso la denominazione del teorema è giustificata dal
fatto che nelle ipotesi previste si ottiene
(
)
D
lim fn = lim D(fn ) .
n→+∞
n→+∞
11.3 Serie di funzioni
11.3
319
Serie di funzioni
Si consideri un sottoinsieme non vuoto X di R e sia (fn )n∈N una successione
di funzioni reali definite in X; per ogni n ∈ N, si consideri la funzione
sn :=
n
∑
fk .
k=0
Essa viene denominata somma parziale n-esima della successione di funzioni
(fn )n∈N e la successione (sn )n∈N viene denominata serieindexserie—di funzioni di termine generale fn (oppure successione delle somme parziali della
successione di funzioni (fn )n∈N ) e viene denotata con il simbolo
+∞
∑
fn .
n=0
Si assume la seguente definizione.
◃ Sia (fn )n∈N una successione di funzioni reali definite in un sottoinsieme
X di R. Si dice che la serie
+∞
∑
fn
(11.3.1)
n=0
è convergente in un punto x0 ∈ X se la successione (sn (x0 ))n∈N delle somme
parziali calcolate in x0 è una serie numerica convergente. Analogamente, si
dice che la serie (11.3.1) è convergente puntualmente (oppure convergente
semplicemente oppure convergente) in un sottoinsieme non vuoto A di X se
la successione (sn )n∈N delle somme parziali è convergente in A. Infine, si dice
che la serie (11.3.1) è convergente (puntualmente oppure semplicemente) (in
X) se la successione (sn )n∈N delle somme parziali è convergente.
Se la serie (11.3.1) è convergente, si può considerare la funzione f : X →
R definita ponendo, per ogni x ∈ X,
f (x) := lim sn (x) (= lim
n→+∞
n→+∞
n
∑
fk (x)) ;
k=0
tale funzione viene denominata∑somma della serie di termine generale fn e,
+∞
per indicare ciò, si scrive f = n=0 fn .
Come si può notare, si è utilizzato lo stesso simbolo per indicare sia la
serie di termine generale fn , che la sua somma nel caso in cui essa risulti
convergente;
sarà comunque chiaro dal contesto in cui si opera se il simbolo
∑+∞
f
si
deve
intendere come la successione delle somme parziali (sn )n∈N
n
n=0
oppure come il limite di tale successione di funzioni.
320
Capitolo 11: Successioni e serie di funzioni
◃ Siano (fn )n∈N è una successione di funzioni reali definite
in un insieme
∑+∞
X e sia f : X → R una ulteriore funzione. Allora, la serie n=0 fn converge
puntualmente verso f se e solo se è soddisfatta la seguente condizione
∀ x ∈ X ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : f (x) −
n
∑
fk (x) ≤ ε .
k=0
Anche per le serie di funzioni si ha una nozione di convergenza uniforme,
di seguito precisata.
◃ Sia (fn )n∈N una successione di funzioni reali definite in un insieme X
e∑sia f : X → R una ulteriore funzione. Si dice che la serie di funzioni
+∞
n=0 fn converge uniformemente verso f e, in tal caso, si scrive
f=
+∞
∑
fn
uniformemente,
n=0
se la successione (sn )n∈N delle somme parziali è uniformemente convergente
verso f .
∑+∞
Pertanto, n=0 fn converge uniformemente verso f se e solo se è soddisfatta la condizione seguente
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν ∀ x ∈ X : f (x) −
n
∑
fk (x) ≤ ε ,
k=0
che può essere scritta anche al seguente modo
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : sup f (x) −
x∈X
n
∑
fk (x) ≤ ε ,
k=0
la quale a sua volta è equivalente a
lim sup f (x) −
n→+∞ x∈X
n
∑
fk (x) = 0 ;
k=0
Da quanto visto sulla convergenza di successioni di funzioni, consegue
evidentemente che una serie di funzioni uniformemente convergente risulta
anche convergente. Le nozioni di convergenza e di convergenza uniforme non
sono tuttavia equivalenti, come si riconosce con qualche semplice esempio.
◃ Si consideri, per ogni n ∈ N, la funzione reale fn : [0, 1] → R definita
ponendo, per ogni x ∈ [0, 1[, fn (x) := xn e sia f : [0, 1[→ R definita
ponendo, per ogni x ∈ [0, 1[, f (x) := 1/(1 − x).
11.3 Serie di funzioni
321
∑n
Fissato x ∈ [0, 1[, risulta limn→+∞ |f (x) − k=0 fk (x)| = 0 e pertanto
la serie di termine generale fn converge verso f puntualmente nell’intervallo
[0, 1[.
Poichè, per ogni n ∈ N,
sup f (x) −
x∈[0,1[
n
∑
fk (x) = sup
x∈[0,1[
k=0
1 − xn+1
xn+1
1
−
= sup
= +∞ ,
1−x
1−x
x∈[0,1[ 1 − x
la serie di termine generale fn non può convergere uniformemente verso f in
[0, 1[. Tuttavia, fissato un elemento a ∈ [0, 1[, si riconosce che la convergenza
della serie è uniforme nell’intervallo [0, a].
Infatti, in questo caso risulta
sup
x∈[0,a]
f (x) −
n
∑
xn+1
an+1
=
,
1−a
x∈[0,a] 1 − x
fk (x) = sup
k=0
in quanto la funzione xn+1 /(1 − x) è strettamente crescente in [0, a] e quindi
assume il massimo in a. Poiché limn→+∞ an+1 /(1 − a) = 0, è soddisfatta la
condizione di convergenza uniforme in [0, a].
Dal teorema di inversione dei limiti e dai teoremi di passaggio al limite per le successioni di funzioni uniformemente convergenti, si ottengono i
seguenti risultati, la cui dimostrazione si ottiene in ogni caso da quella già
vista per le successioni di funzioni considerando la successione delle somme
parziali della serie assegnata.
Teorema 11.3.1 (Teorema di inversione dei limiti per le serie)
Siano X un sottoinsieme non vuoto di R, x0 un punto di accumulazione per
X ed (fn )n∈N una successione di funzioni reali definite in X. Si supponga
che
∑+∞
i) La serie
n=0 fn converge uniformemente verso una funzione f :
X → R;
ii) Per ogni n ∈ N, risulta lim f (x) = ℓn ∈ R;
x→x0
Allora la serie numerica
+∞
∑
ℓn è convergente e posto ℓ :=
n=0
+∞
∑
ℓn , risulta
n=0
lim f (x) = ℓ.
x→x0
Nelle ipotesi del risultato precedente, si ha
lim
x→x0
+∞
∑
n=0
fn (x) = lim f (x) = ℓ =
x→x0
+∞
∑
n=0
ℓn =
+∞
∑
n=0
lim fn (x) .
x→x0
Capitolo 11: Successioni e serie di funzioni
322
Teorema 11.3.2 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed (fn )n∈N una successione
∑+∞ di funzioni reali definite in
X e continue nel punto x0 . Se la serie n=0 fn converge uniformemente
verso una funzione f : X → R, allora anche f risulta continua nel punto
x0 .
Teorema 11.3.3 (Teorema di integrazione termine a termine)
Siano a, b ∈ R con a < b ed (f∑
n )n∈N una successione di funzioni reali
+∞
continue in [a, b] tali che la serie n=0 fn sia uniformemente convergente
verso una funzione f : [a, b] → R. Allora f è integrabile in [a, b] ed inoltre
∫
b
f (x) dx =
a
+∞ ∫
∑
b
fn (x) dx .
a
n=0
Nelle ipotesi del teorema precedente, si ha
+∞ ∫
∑
n=0
∫
b
fn (x) dx =
a
+∞
b∑
fn (x) dx .
a n=0
Teorema 11.3.4 (Teorema di derivazione termine a termine)
Siano a, b ∈ R con a < b ed (fn )n∈N una successione di funzioni reali
derivabili e con derivata continua in [a, b]. Si supponga che
∑+∞ ′
i) La serie
n=0 fn è uniformemente convergente verso una funzione
g : [a, b] → R.
∑+∞
ii) Esiste x0 ∈ [a, b] tale che la serie numerica n=0 fn (x0 ) sia convergente.
∑+∞
Allora, la serie n=0 fn è uniformemente convergente e, denotato con
∑+∞
f :=
n=0 fn il suo limite uniforme, si ha che f è derivabile in [a, b] e
f ′ = g.
Anche ora nelle ipotesi del teorema precedente si ha
( +∞ ) +∞
∑
∑
D
fn =
D(fn ) .
n=0
n=0
◃ Si conclude la presente sezione introducendo alcune nozioni frequentemente utilizzate nello studio della convergenza delle serie di funzioni.
◃ Sia (fn )n∈N una successione
∑+∞di funzioni reali definite in un insieme X. Si
dice che la serie di funzioni n=0 fn di termine generale fn è assolutamente
11.3 Serie di funzioni
323
convergente
∑+∞ (puntualmente oppure rispettivamente uniformemente) se la
serie n=0 |fn | di termine generale |fn | è convergente (puntualmente oppure
rispettivamente uniformemente) (in X).
◃ Ovviamente ogni serie di funzioni assolutamente convergente (puntualmente oppure rispettivamente uniformemente) risulta convergente (puntualmente oppure rispettivamente uniformemente), mentre il viceversa non
vale.
◃ Sia (fn )n∈N una successione di funzioni reali limitate definite in un insieme X e si ponga che, per ogni n ∈ N, ∥fn ∥ := supx∈X |fn (x)|. Si dice che
∑+∞
la serie di funzioni n=0 fn di termine generale fn è totalmente convergente
∑+∞
se la serie numerica n=0 ∥fn ∥ è convergente.
◃ (Criterio di Weierstrass per∑la totale convergenza) Si riconosce facil+∞
mente che una serie di funzioni n=0 fn è totalmente convergente se e solo
se esiste una
successione (an )n∈N di numeri reali (positivi) tale che la serie
∑+∞
numerica n=0 an sia convergente ed inoltre, per ogni n ∈ N e per ogni
x ∈ X, risulti |fn (x)| ≤ an .
◃ Ogni serie di funzioni totalmente convergente risulta anche uniformemente convergente.
∑
Si ricorda innanzitutto che una serie +∞
n=0 an è convergente se e solo se la successione
(sn )n∈N delle sue somme parziali è convergente e quindi se e solo se (sn )n∈N verifica la
condizione di Cauchy, che può essere scritta al modo seguente
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N : |sn+p − sn | ≤ ε ,
∑
∑n+p
∑n
e da ciò, tenendo presente che n+p
k=0 ak = sn+p − sn , si ottiene
k=n+1 ak =
k=0 ak −
la condizione
n+p
∑
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N :
ak ≤ ε .
k=n+1
∑+∞
X → R converge punConseguentemente, una serie di funzioni
n=0 fn , con fn : ∑
+∞
tualmente (in X) se e solo se per ogni x ∈ X la serie numerica
n=0 fn (x) verifica la
condizione di Cauchy precedente, e cioè se e solo se
n+p
∑
∀ x ∈ X ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N :
fk (x) ≤ ε .
k=n+1
L’indice ν previsto
∑+∞ sopra dipende da x ∈ X oltre che da ε > 0. La convergenza uniforme della serie
n=0 fn sarà conseguentemente caratterizzata dalla seguente condizione
di Cauchy
n+p
∑
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N ∀ x ∈ X :
fk (x) ≤ ε .
k=n+1
A questo punto, la condizione di Cauchy per la serie
seguente
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N :
∑+∞
n=0
n+p
∑
k=n+1
∥fn ∥ si esprime al modo
∥fk ∥ ≤ ε ,
324
Capitolo 11: Successioni e serie di funzioni
e da ciò si ottiene la condizione
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N , ∀ x ∈ X :
n+p
∑
k=n+1
fk (x) ≤
n+p
∑
|fk (x)| ≤ ε ,
k=n+1
che è la condizione di Cauchy per l’uniforme convergenza.
11.4
Serie di potenze
Si considerano ora brevemente alcune serie di tipo particolare, ma di uso
molto frequente.
Siano x0 ∈ R ed (an )n∈N una successione di numeri reali. Si denomina
serie di potenze di centro x0 e di termine generale an , n ∈ N, la seguente
serie di funzioni
+∞
∑
an (x − x0 )n
n=0
∑+∞
(quindi, si considera la serie di funzioni n=0 fn , dove, per ogni n ∈ N,
fn : R → R è definita ponendo fn (x) = an (x − x0 )n per ogni x ∈ R); se
n = 0 si assume per convenzione (x − x0 )n = 1 anche quando x = x0 .
Lo studio della convergenza di una serie di potenze è sostanzialmente
basato sul seguente risultato di importanza fondamentale.
Teorema 11.4.1 Siano x0 ∈ R
(an )n∈N una successione di numeri reali e
∑e+∞
si consideri la serie di potenze n=0 an (x−x0 )n . Se la serie converge in un
punto x1 ∈ R e se x2 ∈ R verifica la seguente condizione |x2 −x0 | < |x1 −x0 |
(cioè la distanza di x2 da x0 è minore di quella di x1 da x0 ), allora la serie è
assolutamente convergente anche nel punto x2 . Pertanto, la serie converge
assolutamente nell’intervallo ]x0 − r1 , x0 + r1 [, con r1 := |x1 − x0 |.
Inoltre, la convergenza è totale (e quindi uniforme) in ogni intervallo
[x0 − r, x0 + r], con 0 < r < |x1 − x0 |.
∑+∞
n
Dimostrazione. Poichè la serie numerica
n=0 an (x1 − x0 ) è convergente, la succesn
sione (an (x1 − x0 ) )n∈N deve essere infinitesima, e conseguentemente limitata.1 Quindi,
deve esistere M ∈ R tale che, per ogni n ∈ N, si abbia |an (x1 − x0 )n | ≤ M . Inoltre, per
ogni n ∈ N, risulta
|an (x2 − x0 )n | = |an (x1 − x0 )n |
|x2 − x0 |n
x2 − x0
≤M
|x1 − x0 |n
x1 − x0
n
.
∑
n
n
A questo punto, si osserva che la serie +∞
n=0 |x2 −x0 | /|x1 −x0 | è convergente in quanto
è una serie geometrica di ragione positiva e strettamente minore di 1, e quindi si può
1 In realtà, si potrebbe considerare l’ipotesi leggermente più lieve che la successione
∑+∞
n sia
(an (x1 − x0 )n )n∈N sia limitata anziché supporre che la serie
n=0 an (x1 − x0 )
convergente ed osservare, come appena dimostrato, che la convergenza della serie implica
la limitatezza della successione (an (x1 − x0 )n )n∈N .
11.4 Serie di potenze
325
concludere
di confronto delle serie∑
numeriche a termini positivi, anche
∑ che, per il criterio
+∞
n
n
la serie +∞
n=0 |an (x2 − x0 ) | è convergente e quindi
n=0 an (x2 − x0 ) è assolutamente
convergente.
Per quanto riguarda l’ultima parte della tesi, sia 0 < r < |x1 − x0 |; allora, per quanto
∑+∞
n è convergente e, per ogni x ∈ [x − r, x + r], si ha
dimostrato la serie
0
0
n=0 |an | r
|an (x − x0 )n | ≤ |an | rn ; pertanto, la serie è totalmente convergente in [x0 − r, x0 + r]. ◃ Dalla proprietà precedente segue che l’insieme dei numeri reali per i quali
una serie di potenze risulta convergente costituisce un intervallo di R con
centro x0 ; tale intervallo potrebbe in generale anche ridursi al solo punto x0
oppure coincidere con tutto R e, negli altri casi, potrebbe contenere o meno
uno o entrambi gli estremi.
Per studiare in modo
l’intervallo di convergenza di
∑+∞più approfondito
n
una serie di potenze
a
(x
−
x
)
,
conviene
introdurre il raggio di
0
n=0 n
convergenza R di una serie di potenze, definito nel modo seguente
{
}
+∞
∑
R := sup ρ ∈ [0, +∞[ |
an ρn è convergente .
(11.4.1)
n=0
∑+∞
◃ Si consideri una serie di potenze n=0 an (x − x0 )n e si denoti con R il
suo raggio di convergenza.
Si ha ovviamente R ≥ 0 e può risultare eventualmente R = +∞. Inoltre,
dalla definizione di R e dal Teorema 11.4.1, si ottengono subito le seguenti
proprietà di R:
1. Se R = 0, la serie converge nel punto x0 e non converge in alcun altro
numero reale.
2. Se R = +∞, la serie converge puntualmente in ogni punto di R ed
inoltre la convergenza è uniforme in ogni intervallo limitato di R.
3. Se 0 < R < +∞, la serie converge in ogni punto dell’intervallo aperto
]x0 − R, x0 + R[, e non converge nei punti esterni all’intervallo chiuso
[x0 − R, x0 + R]; nei punti x0 − R e x0 + R, non si può dire nulla in
generale e quindi le serie
+∞
∑
an (x0 − R − x0 )n =
n=0
+∞
∑
(−1)n an Rn ,
n=0
+∞
∑
n=0
an (x0 + R − x0 ) =
n
+∞
∑
an R n
n=0
devono essere esaminate caso per caso. Inoltre, la convergenza della
serie è uniforme in ogni intervallo chiuso [x0 − r, x0 + r], con r < R.
Capitolo 11: Successioni e serie di funzioni
326
Il Teorema di Abel, di cui per brevità non si riporta la dimostrazione,
asserisce che, se 0 < R < +∞ e se la serie di potenze converge anche
nell’estremo x0 − R (rispettivamente, x0 + R), allora la convergenza
è uniforme in ogni intervallo [x0 − R, x0 + r] (rispettivamente, [x0 −
r, x0 + R]), con 0 < r < R. Se la serie di potenze converge in entrambi
gli estremi, la convergenza risulta uniforme in tutto l’intervallo [x0 −
R, x0 + R].
◃ Viste le proprietà precedenti, lo studio di una serie di potenze risulta quasi completamente determinato dalla conoscenza del suo raggio di
convergenza.
Per determinare il raggio di convergenza di una serie di potenze, si possono usare i seguenti due criteri, che traggono spunto dagli analoghi criteri
per le serie numeriche.
∑+∞
1. (Criterio del rapporto) Assegnata la serie di potenze n=0 an (x −
x0 )n , si supponga che esista il seguente limite
|an+1 |
=ℓ;
n→+∞ |an |
lim
Allora, si ha

+∞ ,




0,
R=



 1,
ℓ
ℓ=0;
ℓ = +∞ ;
(11.4.2)
ℓ ∈]0, +∞[ .
2. (Criterio della radice), Assegnata la serie di potenze
x0 )n si supponga che esista il seguente limite
√
lim n |an | = ℓ ;
∑+∞
n=0
an (x −
n→+∞
Allora, anche in questo caso, R viene dato dalla (11.4.2).
Dimostrazione. Infatti, per quanto riguarda la prima proprietà, risulta
lim
n→+∞
|an+1 |
|an+1 (x − x0 )n+1 |
= lim
|x − x0 | = ℓ |x − x0 | ,
n→+∞ |an |
|an (x − x0 )n |
e quindi, dal criterio del rapporto per le serie numeriche, segue che la serie è (assolutamente) convergente per ℓ |x − x0 | < 1 (cioè |x − x0 | < 1/ℓ se ℓ ∈]0, +∞[) ed è assolutamente
divergente positivamente per ℓ |x − x0 | > 1. Dalle proprietà del raggio di convergenza
segue allora la tesi in ognuno dei casi previsti.
La dimostrazione della seconda parte è simile tenendo presente che
√
√
lim n |an (x − x0 )n | = lim n |an | |x − x0 | = ℓ |x − x0 | ,
n→+∞
n→+∞
11.4 Serie di potenze
327
e applicando il criterio della radice per le serie numeriche anzichè quello del rapporto. ◃ Nel caso in cui nessuno dei due limiti previsti nel criterio del rapporto
e della radice esista, si può riconoscere che R viene comunque dato dalla
(11.4.2) con
√
ℓ := lim sup n |an | .
n→+∞
◃ Seguono ora alcuni esempi.
1. Si consideri la serie geometrica di potenze
+∞
∑
xn .
n=0
In questo caso an = 1 per ogni n ∈ N; si può allora applicare facilmente
sia il criterio della radice che del rapporto e si deduce che R = 1; quindi
la serie converge per |x| < 1 e non converge per |x| > 1; nei punti 1 e
−1 si ottengono le serie
+∞
∑
1,
n=0
+∞
∑
(−1)n
n=0
che non sono convergenti (la prima è divergente positivamente in quanto a termini positivi). Pertanto si conclude che la serie converge puntualmente nell’intervallo ] − 1, 1[ e uniformemente in ogni intervallo
[−a, a] con 0 < a < 1. In questo caso è possibile calcolare anche la
somma della serie che, per le proprietà della serie geometrica è data
da
+∞
∑
1
xn =
, −1 < x < 1 .
1−x
n=0
2. Si consideri la serie di potenze
+∞ n
∑
3
(x − 1)n .
3
n
n=1
In questo caso an = 3n /n3 per ogni n ≥ 1 e x0 = 1; applicando il
criterio del rapporto, si ottiene
3n+1 n3
=3
n→+∞ (n + 1)3 3n
lim
Capitolo 11: Successioni e serie di funzioni
328
e pertanto R = 1/3; quindi la serie converge per |x − 1| < 1/3 (cioè
nell’intervallo ]1−1/3, 1+1/3[=]2/3, 4/3[) e non converge per |x−1| >
1/3. Nel punto 2/3 si ottiene la serie
)n ∑
+∞ n (
+∞
∑
3
2
1
−1
=
(−1)n 3
3
n
3
n
n=1
n=1
che converge in quanto è una serie armonica generalizzata a segni
alterni. Inoltre, nel punto 4/3 si ottiene la serie
)n ∑
+∞ n (
+∞
∑
3
1
4
=
−
1
3
n
3
n3
n=1
n=1
che è anch’essa convergente in quanto è una serie armonica generalizzata con esponente maggiore di 1. In conclusione la serie converge in
[2/3, 4/3].
3. Si consideri la serie
+∞
∑
nn (x + 2)n .
n=1
Dal criterio della radice, si ha
lim
n→+∞
√
n
nn = lim n = +∞
n→+∞
e quindi R = 0. Pertanto, la serie converge solo nel punto iniziale −2.
4. Si consideri la serie
+∞
∑
(x − 1)2n .
n=1
In questo caso i coefficienti an della serie di potenze sono dati da
{
an :=
0,
1,
n dispari ;
n pari ;
pertanto il criterio del rapporto e quella radice non possono essere applicati; poiché i coefficienti valgono alternativamente 0 e 1 si riconosce
√
tuttavia facilmente che lim supn→+∞ n an = 1 e quindi il raggio di
convergenza della serie assegnata è 1.
11.5 Serie ottenute per derivazione ed integrazione
11.5
329
Serie ottenute per derivazione ed integrazione
Sia assegnata una serie di potenze
+∞
∑
an (x − x0 )n .
n=0
Allora la serie
+∞
∑
n an (x − x0 )
n−1
=
n=1
+∞
∑
(n + 1) an+1 (x − x0 )n
n=0
∑+∞
n
viene denominata serie ottenuta da
per derivazione,
n=0 an (x − x0 )
mentre la serie
+∞
∑
an
(x − x0 )n+1
n
+
1
n=0
∑+∞
viene denominata serie ottenuta da n=0 an (x − x0 )n per integrazione.
Si riconosce facilmente che
√
√
√
an
n
n
lim sup |an | = lim sup |(n + 1) an+1 | = lim sup n
.
n+1
n→+∞
n→+∞
n→+∞
Pertanto, la serie ottenuta per derivazione e quella ottenuta per integrazione hanno lo stesso raggio di convergenza della serie assegnata. Tuttavia
l’insieme di convergenza delle serie potrebbe differire in quanto quella ottenuta per integrazione potrebbe convergere anche in un estremo in cui la serie
assegnata non converge e analogamente quest’ultima potrebbe convergere
anche in un estremo in cui la serie ottenuta per derivazione non converge.
Invece, se una serie converge in un estremo dell’intervallo di convergenza
quella da essa ottenuta per integrazione è anch’essa convergente nello stesso
estremo (in quanto ha gli stessi termini divisi per n + 1).
◃ Ad esempio, la serie ottenuta per derivazione dalla serie geometrica è
data da
+∞
∑
(n + 1) xn
n=0
che converge in ] − 1, 1[, mentre quella ottenuta per integrazione dalla serie
geometrica è data da
+∞
∑
1
xn+1
n
+
1
n=0
Capitolo 11: Successioni e serie di funzioni
330
che converge questa volta in [−1, 1[.
∑+∞
◃ Si consideri una serie di potenze n=0 an (x − x0 )n e sia R il suo raggio
di convergenza; supposto R > 0, si può considerare la funzione somma
f : I → R definita nell’intervallo di convergenza della serie. Applicando
il Teorema 11.3.2, si ottiene subito che f è sempre una funzione continua
nell’intervallo ]x0 − R, x0 + R[.
Come conseguenza del teorema di Abel (vedasi la discussione delle proprietà del raggio di convergenza) e del Teorema 11.3.2, se uno degli estremi
dell’intervallo I di convergenza della serie appartiene ad I, allora la funzione
somma è continua in tale estremo.
Inoltre, dal Teorema 11.3.4 di derivazione termine a termine, si ricava
che la funzione somma f è infinite volte derivabile in ]x0 −R, x0 +R[ e le sue
derivate si possono ottenere dalle serie ottenute per derivazione da quella
assegnata.
Infine, dal Teorema 11.3.3 di integrazione termine a termine, segue che,
per ogni x ∈]x0 − R, x0 + R[, si ha
∫
+∞
x∑
x0 n=0
an (t − x0 ) dt =
n
+∞
∑
n=0
∫
x
(t − x0 )n dt =
an
x0
+∞
∑
an
(x − x0 )n+1 ,
n
+
1
n=0
e tale uguaglianza vale anche per x = x0 − R oppure per x = x0 + R se la
serie di potenze converge in tali punti.
11.6
Serie di Taylor
La formula di Taylor consente di approssimare una funzione sufficientemente
regolare (cioè derivabile un certo numero di volte) in un intorno di un fissato
punto x0 mediante opportuni polinomi che dipendono dal valore della funzione e da quello delle sue derivate nel punto x0 . Si vuole ora approfondire
tale proprietà utilizzando le serie di potenze.
◃ Sia I un intervallo di R e si consideri una funzione f : I → R derivabile
infinite volte in un punto x0 interno ad I. La serie di potenze
+∞ (n)
∑
f (x0 )
(x − x0 )n ,
n!
n=0
(11.6.1)
viene denominata serie di Taylor di f di punto iniziale x0 .
Inoltre, si dice che f è sviluppabile in serie di Taylor in I se la serie
di potenze (11.6.1) converge puntualmente verso f in I.2 Una funzione
2 Dalle proprietà delle serie di potenze, la convergenza sarà automaticamente uniforme
in ogni intervallo chiuso e limitato contenuto in I.
11.6 Serie di Taylor
331
sviluppabile in serie di Taylor in un intorno di ogni punto interno ad I viene
denominata funzione analitica reale.
◃ In generale non è detto che una funzione infinite volte derivabile in un
punto x0 sia sviluppabile in serie di Taylor in un intorno di tale punto. Ad
esempio, si consideri la funzione f : R → R cosı̀ definita
{
2
e−1/x ,
x ̸= 0 ,
f (x) :=
0,
x=0.
Allora, è facile verificare che f è infinite volte derivabile in R e tutte le sue
derivate sono nulle nel punto 0; pertanto, la serie di Taylor di f di punto
iniziale 0 è la funzione nulla e coincide con f solamente nel punto 0. Quindi
f non è sviluppabile in serie di Taylor in un intorno del punto 0.
Si vuole ora fornire un semplice criterio di sviluppabilità in serie di Taylor. Esso è basato sul fatto che se una funzione f : I → R è infinite volte
derivabile in I, si può applicare la formula di Taylor di ogni ordine in un
punto x0 interno ad I e si ha, per ogni x ∈ I,
f (x) =
n
∑
f (k) (x0 )
k=0
k!
(x − x0 )k +
f (n+1) (ξ)
(x − x0 )n+1 ,
(n + 1)!
dove ξ ∈ I è interno all’intervallo di estremi x0 ed x e dipende da x oltre che
da n. Poichè la somma nella formula precedente coincide con quella parziale
della serie di Taylor di f , è chiaro che, se il resto della formula di Taylor
tende uniformemente a 0, allora f risulta sviluppabile in serie di Taylor in
I. Si ha pertanto il seguente criterio.
Teorema 11.6.1 (Criterio di sviluppabilità in serie di Taylor)
Sia f : I → R una funzione infinite volte derivabile in I e si supponga che
le sue derivate verifichino la seguente condizione
∃ c > 0 , ∃ M > 0 t.c. ∀ n ∈ N ∀ x ∈ I : |f (n) (x)| ≤ c M n .
(11.6.2)
Allora f è sviluppabile in serie di Taylor in I.
Dimostrazione. Da quanto osservato preliminarmente, considerato x0 interno ad I, per
ogni x ∈ I e per ogni n ∈ N, risulta
f (x) =
n
∑
f (k) (x0 )
f (n+1) (ξ)
(x − x0 )k +
(x − x0 )n+1 ,
k!
(n + 1)!
k=0
con ξ ∈ I interno all’intervallo di estremi x0 ed x. Denotata con sn la somma parziale
n-esima della serie di Taylor di f di punto iniziale x0 , dalla formula precedente e dalla
condizione (11.6.2), segue
|f (x) − sn (x)| =
M n+1
|f (n+1) (ξ)|
|x − x0 |n+1 ≤ c
|x − x0 |n+1 .
(n + 1)!
(n + 1)!
Capitolo 11: Successioni e serie di funzioni
332
Si consideri ora la serie
+∞
∑
n=0
M n+1
|x − x0 |n+1 ;
(n + 1)!
si ha
M n+2
(n + 1)!
M
= lim
|x − x0 | = 0
n→+∞ n + 2
(n + 2)! |x − x0 |n+2 M n+1 |x − x0 |n+1
e quindi, dal criterio del rapporto, essa è convergente; da ciò segue che il termine generale
n-esimo deve essere infinitesimo, cioè
lim
n→+∞
lim
n→+∞
M (n+1)
|x − x0 |n+1 = 0 ,
(n + 1)!
e quindi anche
lim |f (x) − sn (x)| = 0 ,
n→+∞
da cui la tesi.
La condizione (11.6.2) è sicuramente soddisfatta nel caso in cui le derivate della funzione f siano equilimitate, cioè
∃ M > 0 t.c. ∀ n ∈ N ∀ x ∈ I : |f (n) (x)| ≤ M .
In base al risultato precedente, si può ora considerare lo sviluppo in serie
di Taylor di alcune funzioni elementari.
11.6.1
Funzione esponenziale
Sia a > 0 tale che a ̸= 1 e si consideri la funzione esponenziale expa di base
a. Essa è infinite volte derivabile e, per ogni n ∈ N ed x ∈ R, si ha
|D(n) expa x| = | logn a| expa x .
Pertanto, fissato un intervallo [−r, r] ⊂ R, risulta, per ogni x ∈ [−r, r],
|D(n) expa x| ≤ c M n ,
con M := | log a| e c := max{expa (−r), expa r}.
Dal Teorema 11.6.1 e dall’arbitrarietà di r > 0, segue allora che la funzione esponenziale è sviluppabile in serie di Taylor di punto iniziale x0 ∈ R
(x0 arbitrario) in tutto R e uniformemente in ogni intervallo limitato. In
particolare, considerando x0 = 0, si ottiene, per ogni x ∈ R,
expa x = 1 + log a x + log2 a
+∞
∑
x2
x3
xn
+ log3 a
+ ··· =
.
logn a
2
6
n!
n=0
Considerando la base di Nepero, la formula precedente diventa, per ogni
x ∈ R,
+∞ n
∑
x3
x
x2
+
+ ··· =
.
exp x = 1 + x +
2
6
n!
n=0
11.6 Serie di Taylor
11.6.2
333
Funzione logaritmo
Dalla serie geometrica si ricava subito il seguente sviluppo in serie, per ogni
x ∈] − 1, 1[,
+∞
∑
1
2
3
= 1 − x + x − x + ··· =
(−1)n xn .
1+x
n=0
(11.6.3)
Allora, integrando termine a termine tra 0 ed x, dal Teorema 11.3.3 si
ottiene, per ogni x ∈] − 1, 1[,
log(1 + x) = x −
+∞
∑
x2
x3
x4
xn+1
+
−
+ ··· =
(−1)n
.
2
3
4
n+1
n=0
Mentre nel punto −1 la serie precedente risulta divergente, nel punto
1 risulta invece convergente e pertanto, dal Teorema 11.3.2, si ottiene la
somma della serie armonica a segni alterni
log 2 =
+∞
∑
(−1)n
n=0
11.6.3
1
.
n+1
Funzioni seno e coseno
Poiché le funzioni seno e coseno sono infinite volte derivabili e poiché, per
ogni n ∈ N ed x ∈ R,
|D(n) sin x| ≤ 1 ,
|D(n) cos x| ≤ 1 ,
(infatti, procedendo per induzione completa su n, si riconosce facilmente
che D(n) sin x = sin(x + nπ/2) e analogamente D(n) cos x = cos(x + nπ/2)),
dal Teorema 11.6.1, si ricava che esse sono sviluppabili in serie di Taylor di
punto iniziale x0 ∈ R (x0 arbitrario) in tutto R. In particolare, considerando
x0 = 0, si ottiene il seguente sviluppo in serie delle funzioni seno e coseno,
valido per ogni x ∈ R e uniformemente in ogni intervallo limitato
sin x = x −
cos x =
1−
+∞
∑
x3
x5
x2n+1
+
− ··· =
(−1)n
,
3!
5!
(2n + 1)!
n=0
+∞
∑
x4
x2n
x2
+
− ··· =
(−1)n
.
2!
4!
(2n)!
n=0
Capitolo 11: Successioni e serie di funzioni
334
11.6.4
Funzione arcotangente
Considerato x2 al posto di x nella (11.6.3), si ottiene, per ogni x ∈] − 1, 1[,
+∞
∑
1
2
4
6
=
1
−
x
+
x
−
x
+
·
·
·
=
(−1)n x2n .
1 + x2
n=0
Integrando termine a termine tra 0 ed x, dal Teorema 11.3.3 si ricava, per
ogni x ∈] − 1, 1[,
arctan x = x −
+∞
∑
x5
x7
x3
x2n+1
+
−
+ ··· =
.
(−1)n
3
5
7
2n + 1
n=0
La serie converge anche negli estremi −1 ed 1 e pertanto la convergenza è
uniforme in [−1, 1]. Dal Teorema 11.3.2, si ottiene allora il seguente sviluppo
in serie del numero π
+∞
∑
π
1
1 1 1
= arctan 1 =
(−1)n
= 1 − + − + ... .
4
2n + 1
3 5 7
n=0
11.6.5
La serie binomiale
Si fissi α ∈ R e la funzione fα (x) := (1 + x)α , definita per x ∈] − 1, ∞[ (se
α > 0, la funzione è definita anche in −1 e fα (−1) = 0).
Essa è derivabile infinite volte in ] − 1, +∞[ e si ha
Dn (1 + x)α = α(α − 1) · · · (α − n + 1) (1 + x)α−n ,
x > −1 .
La formula precedente suggerisce l’introduzione del coefficiente binomiale generalizzato

( )
n=0,
 1,
α
:=
(11.6.4)
 α(α − 1) · · · (α − n + 1) ,
n
n ̸= 0 ,
n!
il quale ha molte proprietà analoghe a quelle dei coefficienti binomiali e che
si omettono per brevità.
La serie di Taylor di fα di punto iniziale 0 è data da
+∞ ( )
∑
α n
x .
(11.6.5)
n
n=0
Tale serie ha raggio di convergenza 1 in quanto, dal criterio del rapporto,
( α )
n−α
α · · · (α − n + 1)(α − n) n!
n+1
(α) = lim
=1.
lim
= lim
n→+∞
n→+∞ n + 1
n→+∞ α · · · (α − n + 1) (n + 1)!
n
11.6 Serie di Taylor
335
Pertanto, la serie converge puntualmente in ] − 1, 1[ ed uniformemente in
ogni intervallo [−r, r] con 0 < r < 1.
◃ Per quanto riguarda la convergenza della serie binomiale (11.6.5) nei
punti estremi, si ha quanto segue
1. Se α ≤ −1, la serie binomiale non converge in alcuno dei due estremi.
2. Se −1 < α < 0, la serie converge (non assolutamente) in 1 ma non in
−1.
3. Se α > 0, la serie converge (anche assolutamente) in entrambi gli
estremi.
Per brevità ci si limita ad osservare che in entrambi gli estremi dal criterio di Raabe
segue la convergenza assoluta nel caso α > 0 e l’assoluta divergenza nel caso α < 0. Se
( )
non è infinitesima e
α ≤ −1, la successione dei coefficienti binomiali generalizzati α
n
pertanto la serie in esame non può convergere. Infine, se −1 < α < 0, la convergenza in
1 segue dal criterio di Leibnitz.
◃ Si studia ora la somma della serie (11.6.5). Si denoti per brevità con g
la funzione somma della serie (11.6.5); dalle proprietà delle serie di potenze
ed applicando il Teorema 11.3.4 di derivazione termine a termine, per ogni
x ∈] − 1, 1[
g ′ (x) =
=
+∞
∑
n α(α − 1) · · · (α − n + 1) n−1
x
n!
n=1
+∞
∑
α(α − 1) · · · (α − n + 1) n−1
x
(n − 1)!
n=1
+∞
∑
(α − 1) · · · (α − 1 − n + 1) n
x
n!
n=0
)
+∞ (
∑
α−1 n
= α
x ;
n
n=0
= α
da ciò si ottiene, utilizzando le proprietà dei coefficienti binomiali genera-
Capitolo 11: Successioni e serie di funzioni
336
lizzati3
′
(1 + x) g (x)
=
α
)
+∞ (
∑
α−1
n=0
+∞ (
∑
n
n
x +α
)
+∞ (
∑
α−1
n=0
+∞ (
∑
)
n
xn+1
)
α−1 n
α−1 n
= α
x +α
x
n
n−1
n=0
n=1
(
) (
)) )
+∞ ((
∑
α−1
α−1
= α 1+
+
xn
n
n
−
1
n=1
(
)
+∞ ( )
∑
α n
= α 1+
x
= α g(x) .
n
n=1
Quindi la funzione g è soluzione dell’equazione differenziale lineare omogenea
α
y′ =
y,
1+x
la quale ammette come soluzione generale y = c(1 + x)α ; poiché g verifica
la condizione iniziale g(0) = 1 deve essere c = 1 e quindi g(x) = (1 + x)α .
Pertanto, la serie binomiale (11.6.5) converge verso la funzione fα nell’intervallo ] − 1, 1[.
3 Nell’ultima
uguaglianza si è utilizzata la proprietà
(α − 1)
n
+
(α − 1 )
n−1
=
(α)
,
n
che è ovvia se n = 1 mentre per ogni n ≥ 2 segue da
(α − 1)
n
+
(α − 1)
n−1
=
=
=
=
(α − 1)(α − 2) · · · (α − 1 − n + 1)
n!
(α − 1)(α − 2) · · · (α − 1 − n + 2)
+
(n − 1)!
(α − 1)(α − 2) · · · (α − n)
(α − 1)(α − 2) · · · (α − n + 1)
+
n!
(n − 1)!
(α − 1)(α − 2) · · · (α − n + 1)(α − n + n)
n!
( α)
.
n
11.7 Serie di Fourier
11.6.6
337
La funzione arcoseno
Considerando α = −1/2 nella serie binomiale (11.6.5), si ottiene in particolare, per ogni x ∈] − 1, 1],
1
√
1+x
)
+∞ (
∑
−1/2 n
x
=
n
n=0
=
1+
=
1+
+∞
∑
n=1
+∞
∑
(−1)n
1 · 3 · · · (2n − 1) n
x
2n n!
(−1)n
(2n − 1)!! n
x ;
(2n)!!
n=1
scrivendo −x2 al posto di x
+∞
∑
1
(2n − 1)!! 2n
√
=1+
x .
2
(2n)!!
1−x
n=1
Integrando termine a termine tra 0 ed x quest’ultima relazione, si ottiene,
per ogni x ∈] − 1, 1[,
arcsin x = x +
+∞
∑
(2n − 1)!!
x2n+1 .
(2n)!!
(2n
+
1)
n=1
Si può dimostrare che la serie a secondo membro converge anche negli
estremi −1 ed 1 e pertanto, considerando ad esempio x = 1, si ottiene il
seguente ulteriore sviluppo in serie del numero π
(
)
+∞
∑
(2n − 1)!!
π =2 1+
.
(2n)!! (2n + 1)
n=1
11.7
Serie di Fourier
Un ulteriore tipo di serie di funzioni frequentemente utilizzata per l’approssimazione di funzioni periodiche è costituito dalle serie di Fourier delle quali
ci si vuole occupare brevemente.
Si denomina polinomio trigonometrico di ordine n ogni funzione T : R →
R definita ponendo
a0 ∑
+
(ak cos kx + bk sin kx) ,
2
n
T (x) :=
k=1
x∈R,
Capitolo 11: Successioni e serie di funzioni
338
con a0 , . . . , an ∈ R e b1 , . . . , bn costanti reali assegnate e |an | + |bn | > 0 (per
n = 0, si assume per convenzione b0 = 0).
Una serie trigonometrica è una serie di funzioni del tipo
a0 ∑
+
(an cos nx + bn sin nx) ,
2
n=1
+∞
x∈R.
(11.7.1)
Quindi le somme parziali di una serie trigonometrica sono polinomi trigonometrici di ordine minore o uguale ad n.
Una serie trigonometrica (11.7.1) si dice serie di coseni (rispettivamente,
serie di seni ) se, per ogni n ≥ 1, si ha bn = 0 (rispettivamente se, per ogni
n ∈ N, si ha an = 0).
Lo studio di una serie trigonometrica può essere effettuato in un intervallo di ampiezza 2π in quanto il termine generale n-esimo della serie è sempre
una funzione periodica di periodo 2π.
Se la serie (11.7.1) converge puntualmente in un intervallo di ampiezza
2π, si può pertanto considerare la funzione somma f : R → R definita
ponendo, per ogni x ∈ R,
a0 ∑
f (x) :=
+
(an cos nx + bn sin nx) ;
2
n=1
+∞
(11.7.2)
tale funzione somma risulta essere sempre 2π-periodica e, se la convergenza
è uniforme, essa è anche continua.
Un semplice criterio che fornisce la convergenza totale (e quindi uniforme) della serie è dato dalla condizione
+∞
∑
(|an | + |bn |) .
n=1
Per ottenere ulteriori criteri, si premettono alcune considerazioni.
Si supponga che la serie trigonometrica (11.7.1) converga uniformemente verso una funzione f : R → R. Allora, integrando termine a termine
l’uguaglianza (11.7.2) tra −π e π, si ottiene
1
a0 =
π
∫
π
f (t) dt ,
−π
11.7 Serie di Fourier
339
e inoltre, per ogni m ∈ N, moltiplicando entrambi i membri della (11.7.2)
per cos mx, integrando tra −π e π e tenendo presenti le formule
{
∫ π
0,
m ̸= n ,
cos mx cos nx dx =
π,
m=n,
−π
{
∫ π
0,
m ̸= n ,
sin mx sin nx dx =
π
,
m
=n,
−π
∫ π
sin mx cos nx dx = 0 ,
−π
si ricava anche
∫ π
1
am =
f (t) cos mt dt ,
π −π
bm
1
=
π
∫
π
f (t) sin mt dt ,
−π
m≥1.
(11.7.3)
◃ Si supponga ora che sia assegnata una funzione 2π-periodica f : R → R.
Se f è assolutamente integrabile in [−π, π], tutte le funzioni f (x) cos mx
e f (x) sin mx sono integrabili in [−π, π] (infatti |f (x) cos mx| ≤ |f (x)| e
|f (x) sin mx| ≤ |f (x)|) e quindi si possono considerare i coefficienti am e bm
precedenti. Tali coefficienti vengono denominati coefficienti di Fourier di f
e la serie
1
2π
∫
π
f (t) dt +
−π
)
+∞ ((∫ π
1∑
f (t) cos nt dt cos nx
π n=1
−π
(∫ π
)
)
+
f (t) sin nt dt sin nx ,
−π
(11.7.4)
x∈R,
viene denominata serie di Fourier di f .
Inoltre, si dice che f è sviluppabile in serie di Fourier se la serie (11.7.4)
è convergente ed ha per somma f (x) in ogni punto x ∈ R in cui f è continua.
◃ Se f è pari (rispettivamente, dispari), le funzioni f (x) cos mx sono anch’esse pari (rispettivamente, dispari) mentre le funzioni f (x) sin mx sono
dispari (rispettivamente, pari) e pertanto si ha bm = 0 per ogni m ≥ 1
(rispettivamente, am = 0 per ogni m ≥ 0). Quindi la serie di Fourier
di una funzione pari (rispettivamente, dispari) è una serie di soli coseni
(rispettivamente, seni).
◃ Se I è un intervallo di R, una funzione f : I → R si dice continua a
tratti se ammette al più un numero finito di punti di discontinuità, tutte
eliminabili o di prima specie; pertanto, se f è continua a tratti, esiste un
sottoinsieme finito H ⊂ I tale che f è continua in I r H e, per ogni x0 ∈ H,
340
Capitolo 11: Successioni e serie di funzioni
esiste ed è finito limx→x− f (x) se x0 > inf I ed esiste ed è finito limx→x+ f (x)
0
0
se x0 < sup I.
Per brevità, nel seguito, si pone
f (x0 −) := lim f (x) ,
x→x−
0
f (x0 +) := lim f (x) .
x→x+
0
Inoltre, si dice che f : I → R è una funzione regolare a tratti se è continua
a tratti ed inoltre è derivabile tranne al più in un un numero finito di punti,
ognuno dei quali risulta di discontinuità di prima specie per f ′ .
Una funzione 2π-periodica f : R → R viene denominata continua a tratti
(rispettivamente, regolare a tratti ) se la sua restrizione all’intervallo [−π, π]
risulta continua a tratti (rispettivamente, regolare a tratti).
Si osserva che una funzione 2π-periodica e continua a tratti è sicuramente
assolutamente integrabile e quindi se ne può considerare la serie di Fourier.
Inoltre, se in più f è anche regolare a tratti, allora f ′ è una funzione
continua a tratti e quindi si può considerare anche la serie di Fourier di f ′ .
A questo punto si possono enunciare le seguenti proprietà delle serie di
Fourier, di cui per brevità viene omessa la dimostrazione.
Teorema 11.7.1 Sia f : R → R una funzione 2π-periodica. Allora, valgono le seguenti proprietà:
1. Se f è continua e se i suoi coefficienti di Fourier sono tutti nulli,
allora f = 0.
2. Se f è continua e se la serie di Fourier di f è uniformemente convergente, allora f è sviluppabile in serie di Fourier.
3. Se f è regolare a tratti, allora la serie di Fourier di f converge puntualmente verso la funzione f˜ : R → R definita ponendo, per ogni
x ∈ R,
f (x+) + f (x−)
f˜(x) :=
2
e quindi f è sviluppabile in serie di Fourier.
Inoltre, la convergenza è uniforme in ogni intervallo chiuso in cui f è
continua.
In particolare, se f è continua e regolare a tratti, allora la serie di
Fourier di f converge uniformemente verso f .
4. Se f è regolare a tratti e se am e bm sono i suoi coefficienti di Fourier,
allora la serie di Fourier di f ′ si ottiene derivando termine a termine
11.7 Serie di Fourier
341
la serie di Fourier di f e inoltre, denotati con a′m e b′m i coefficienti
di Fourier di f ′ , si ha
a′0 = 0 ,
a′m = m bm ,
b′m = −m am ,
m≥1.
Analogamente, la funzione integrale F : R → R definita ponendo, per
ogni x ∈ R,
∫ x(
a0 )
F (x) :=
f (t) −
dt ;
(11.7.5)
2
0
è continua e regolare a tratti e pertanto la serie di Fourier di F converge uniformemente verso F . I coefficienti di Fourier di F si ottengono
integrando termine a termine la serie di Fourier di f e quindi, denotati
con Am e Bm i coefficienti di Fourier di F , si ha
A0 = 2
+∞
∑
bk
k=1
k
Am = −
,
bm
,
m
Bm =
am
,
m
m≥1.
(11.7.6)
La definizione di F data nella (11.7.5) è necessaria per ottenere la continuità di F (considerando la condizione F (π) − F (−π) = 0). Inoltre il valore di A0 nella (11.7.6) segue
dal fatto che dalla (11.7.5) deve essere F (0) = 0 e che
F (0) =
+∞
+∞
∑
∑ bk
A0
A0
+
(Ak cos 0 + Bk sin 0) =
−
.
2
2
k
k=1
k=1
◃ I risultati precedenti sono stati esposti per semplicità per funzioni 2πperiodiche. Se f : R → R è una funzione T -periodica, con T > 0, si
ottengono risultati analoghi, tenendo presente che i coefficienti di Fourier di
f sono in questo caso definiti da
am
bm
=
=
2
T
2
T
∫
∫
T /2
f (t) cos
2πmt
dt ,
T
m≥0,
f (t) sin
2πmt
dt ,
T
m≥1,
−T /2
T /2
−T /2
e la serie di Fourier di f è data da
)
+∞ (
2πnt
2πnt
a0 ∑
+
an cos
+ bn sin
,
2
T
T
n=1
x∈R.
Capitolo 12
Calcolo differenziale in più
variabili
12.1
Cenni sulla struttura metrica di Rn
12.1.1
Prodotti scalari e norme
L’insieme Rn (n ≥ 1) delle n-ple di numeri reali è dotato di una struttura
di spazio vettoriale reale mediante le seguenti operazioni, definite per ogni
x = (x1 , . . . , xn ) ∈ Rn , y = (y1 , . . . , yn ) ∈ Rn e λ ∈ R
x+y
λx
:= (x1 + y1 , . . . , xn + yn ) ,
:= (λx1 , . . . , λxn ) .
La base canonica di Rn è costituita dai vettori
e1 , e2 , . . . , en ,
dove, per ogni i, j = 1, . . . , n, la j-esima coordinata di ei è 0 se i ̸= j ed è 1
se i = j; quindi, ei = (δij )j=1,...,n dove δij è il simbolo di Kronecker definito
ponendo, per ogni i, j = 1, . . . , n,
{
1,
i=j,
δij :=
0,
i ̸= j .
Poiché (ei )i=1,...,n è una base di Rn , ogni elemento x = (x1 , . . . , xn ) ∈ Rn
si esprime in un unico modo come combinazione lineare di e1 , . . . , en ed i
coefficienti di tale combinazione lineare sono proprio le componenti di x,
Capitolo 12: Calcolo differenziale in più variabili
344
cioè
x=
n
∑
xi ei .
i=1
Tuttavia, nel seguito si sarà maggiormente interessati ad approfondire
le proprietà metriche di Rn che derivano dalla possibilità di introdurre in
modo naturale in Rn un prodotto scalare.
Per maggiore chiarezza si premette la definizione generale di prodotto
scalare e qualcuna delle sue principali proprietà; di seguito si considererà il
caso particolare del prodotto scalare di Rn .
◃ Per semplicità si denoterà con K il campo R dei numeri reali oppure il
campo C dei numeri complessi.
Se E è uno spazio vettoriale su K, si dice che una funzione (·|·) : E ×E →
K è un prodotto scalare su E se sono soddisfatte le seguenti proprietà:
1. ∀ x, y, z ∈ E : (x + y|z) = (x|z) + (y|z) ;
2. ∀ x, y ∈ E , ∀ λ ∈ K : (λx|y) = λ (x|y) ;
3. ∀ x, y ∈ E : (y|x) = (x|y) ;
4. ∀ x ∈ E : (x|x) ∈ R e (x|x) ≥ 0; inoltre (x|x) = 0 ⇒ x = 0.
L’elemento (x|y) di K viene denominato prodotto scalare di x ed y.
◃ Se (·|·) : E × E → K è un prodotto scalare su E, allora valgono le
seguenti ulteriori proprietà, di verifica immediata:
1. ∀ x, y, z ∈ E : (z|x + y) = (z|x) + (z|y) ;
2. ∀ x, y ∈ E , ∀ λ ∈ K : (x|λy) = λ(x|y) ;
3. ∀ x ∈ E : (x|0) = (0|x) = 0 .
◃ Se (·|·) : E × E → K è un prodotto scalare su E, allora vale la seguente
diseguaglianza di Cauchy-Schwarz, per ogni x, y ∈ E,
|(x|y)|2 ≤ (x|x) · (y|y) .
(12.1.1)
Infatti, se y = 0, risulta (x|y) = 0 e quindi la proprietà è ovvia. Se y ̸= 0 si ha, per
ogni λ ∈ R,
0
≤
(x + λy|x + λy) = (x|x + λy) + (λy|x + λy)
=
(x|x) + (x|λy) + (λy|x) + (λy|λy) = (x|x) + λ(x|y) + λ(y|x) + λ2 (y|y)
=
(x|x) + λ(x|y) + λ(x|y) + λ2 (y|y) = (x|x) + 2λRe (x|y) + λ2 (y|y)
≤
(x|x) + 2λ|(x|y)| + λ2 (y|y) .
12.1 Cenni sulla struttura metrica di Rn
345
Dunque, per ogni λ ∈ R, risulta 0 ≤ (x|x) + 2λ|(x|y)| + λ2 (y|y) e ciò comporta che il
discriminante ∆ := 4|(x|y)|2 − 4(x|x)(y|y) del polinomio (x|x) + 2λ|(x|y)| + λ2 (y|y) di
secondo grado in λ deve essere negativo. Quindi |(x|y)|2 − (x|x)(y|y) ≤ 0 da cui la tesi.
◃ Se (·|·) : E × E → K è un prodotto scalare su E, allora vale la seguente
diseguaglianza di Minkowski, per ogni x, y ∈ E,
√
√
√
(x + y|x + y) ≤ (x|x) + (y|y) .
Siano x, y ∈ E. Allora
(x + y|x + y)
=
(x|x) + (y|x) + (x|y) + (y|y) = (x|x) + (x|y) + (x|y) + (y|y)
=
(x|x) + 2Re (x|y) + (y|y) ≤ (x|x) + 2|(x|y)| + (y|y)
√
√
√
√
(x|x) + 2 (x|x) (y|y) + (y|y) = ( (x|x) + (y|y))2 ,
≤
dove nell’ultima diseguaglianza si è usata la diseguaglianza di Cauchy-Schwarz. Considerando infine le radici quadrate del primo ed ultimo termine delle diseguaglianze precedenti
si ottiene la tesi.
◃ Si studia ora un’ulteriore nozione generale che potrà essere messa in
relazione con l’esistenza del prodotto scalare.
Se E è uno spazio vettoriale su K, si dice che una funzione ∥ · ∥ : E → R
è una norma su E se sono soddisfatte le seguenti proprietà:
1. ∀ x ∈ E : ∥x∥ ≥ 0 ;
2. ∀ x ∈ E : ∥x∥ = 0 ⇒ x = 0 ;
3. ∀ x ∈ E , ∀ λ ∈ K : ∥λx∥ = |λ| ∥x∥ ;
4. ∀ x, y ∈ E : ∥x + y∥ ≤ ∥x∥ + ∥y∥ .
L’elemento ∥x∥ viene denominato norma di x e la coppia (E, ∥ · ∥) viene
denominata spazio normato su K.
◃ Se (·|·) : E × E → K è un prodotto scalare su E, si può definire in modo
naturale una norma su E, considerando la funzione ∥ · ∥ : E → R definita
ponendo, per ogni x ∈ E,
√
∥x∥ := (x|x) .
(12.1.2)
Si verifica facilmente che la funzione definita dalla (12.1.2) verifica le
proprietà previste nella definizione di norma; la verifica delle proprietà 1)3) delle norme è immediata, mentre la quarta segue dalla diseguaglianza
di Minkowski. Tale norma viene denominata norma dedotta dal prodotto
scalare di E.
346
Capitolo 12: Calcolo differenziale in più variabili
◃ La norma su uno spazio vettoriale consente a sua volta di definire in
modo naturale una distanza su E. Per precisare meglio questa proprietà, si
premette la nozione di distanza.
◃ Se E è un insieme arbitrario, si dice distanza su E una funzione d :
E × E → R verificante le seguenti proprietà, per ogni x, y, z ∈ E,
1. d(x, y) ≥ 0 ;
2. d(x, y) = 0 ⇔ x = y ;
3. (Proprietà simmetrica) d(x, y) = d(y, x) ;
4. (Proprietà triangolare) d(x, z) ≤ d(x, y) + d(y, z) .
Il numero reale d(x, y) viene denominato distanza di x da y e la coppia
(E, d) viene anche denominata spazio metrico.
◃ Se ∥ · ∥ : E → R è una norma su E, si può definire automaticamente una
distanza su E considerando la funzione d : E × E → R definita ponendo,
per ogni x, y ∈ E,
d(x, y) := ∥x − y∥ .
(12.1.3)
Si verifica facilmente che le proprietà previste nella definizione di distanza
discendono direttamente da quelle della norma. La distanza d definita dalla
(12.1.3) viene denominata distanza dedotta dalla norma di E.
Come ulteriore approfondimento, si osserva che la nozione di distanza consente di
definire quella di convergenza. Precisamente, se (E, d) è uno spazio metrico e se (an )n∈N
è una successione di elementi di E, si dice che essa converge verso un elemento ℓ ∈ E se
è soddisfatta la seguente condizione
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : d(an , ℓ) < ε .
Inoltre, si dice che (an )n∈N è una successione di Cauchy se è soddisfatta la seguente
condizione
∀ ε > 0 ∃ ν ∈ N t.c. ∀ n, m ≥ ν : d(an , am ) < ε .
Si verifica facilmente che ogni successione convergente verifica la condizione di Cauchy.
Il viceversa non vale in generale; se accade che ogni successione di Cauchy è anche
convergente, si dice che (E, d) è uno spazio metrico completo.
Se la struttura dello spazio metrico (E, d) viene dedotta da una norma ∥ · ∥ e se (E, d)
è completo, allora lo spazio normato (E, ∥ · ∥) su K viene denominato spazio di Banach
su K. Se la norma di uno spazio di Banach (E, ∥ · ∥) su K viene dedotta da un prodotto
scalare (·|·), allora la coppia (E, (·|·)) viene denominata spazio di Hilbert su K.
◃ Si può dimostrare che la norma ∥ · ∥ di uno spazio normato (E, ∥ · ∥)
deriva da un prodotto scalare se e solo se essa verifica la seguente regola del
parallelogramma, per ogni x, y ∈ E,
∥x + y∥2 + ∥x − y∥2 = 2(∥x∥2 + ∥y∥2 ) .
12.1 Cenni sulla struttura metrica di Rn
347
Esempio 12.1.1
1. Sia n ≥ 1 e si consideri lo spazio vettoriale reale
Rn . Allora la funzione (·|·) : Rn × Rn → R definita ponendo, per ogni
x = (x1 , . . . , xn ) ∈ Rn e per ogni y = (y1 , . . . , yn ) ∈ Rn ,
(x|y) :=
n
∑
xi yi
(12.1.4)
i=1
è un prodotto scalare su Rn .
In questo caso la verifica delle proprietà del prodotto scalare è immediata.
Nel seguito, Rn verrà considerato sempre munito del prodotto scalare
definito dalla (12.1.4).
La norma dedotta dal prodotto scalare in Rn è conseguentemente
definita ponendo, per ogni x = (x1 , . . . , xn ) ∈ Rn ,
v
u n
u∑
∥x∥ = t
x2i ,
(12.1.5)
i=1
ed infine la distanza dedotta dalla norma è definita ponendo, per ogni
x = (x1 , . . . , xn ) ∈ Rn e y = (y1 , . . . , yn ) ∈ Rn ,
v
u n
u∑
d(x, y) = t (xi − yi )2 .
(12.1.6)
i=1
Si consideri una successione (am )m∈N , am = ((am )1 , . . . , (am )n ), di
elementi di Rn . Si verifica facilmente che essa è convergente (rispettivamente, di Cauchy) se e solo se, per ogni i = 1, . . . , n, la successione
((ai )m )m∈N è convergente (rispettivamente, di Cauchy). Allora, dal
criterio di convergenza di Cauchy per le successioni di numeri reali,
segue che ogni successione di Cauchy in Rn è convergente e quindi
(Rn , d) è uno spazio metrico completo. Conseguentemente, (Rn , ∥ · ∥)
è uno spazio di Banach e (Rn , (·|·)) è uno spazio di Hilbert.
2. Sia n ≥ 1 e si consideri lo spazio vettoriale complesso Cn . Allora la funzione (·|·) : Cn × Cn → C definita ponendo, per ogni x =
(x1 , . . . , xn ) ∈ Cn e per ogni y = (y1 , . . . , yn ) ∈ Cn ,
(x|y) :=
n
∑
i=1
è un prodotto scalare su Cn .
xi yi
(12.1.7)
Capitolo 12: Calcolo differenziale in più variabili
348
Anche in questo caso la verifica delle proprietà del prodotto scalare è
immediata.
La norma e la distanza possono essere dedotta come nel caso precedente e si ha, per ogni x = (x1 , . . . , xn ) ∈ Cn e y = (y1 , . . . , yn ) ∈
Cn
v
u n
u∑
∥x∥ = t
|xi |2 ,
(12.1.8)
i=1
e
v
u n
u∑
d(x, y) = t
|xi − yi |2 .
(12.1.9)
i=1
Anche ora, separando le parti reali ed immaginarie, si riconosce facilmente che le successioni di Cauchy in Cn sono convergenti e quindi
anche Cn è completo come spazio metrico, di Banach come spazio
normato e di Hilbert munito del suo prodotto scalare.
3. Siano a, b ∈ R tali che a < b e si consideri lo spazio vettoriale reale
C([a, b]) delle funzioni continue sull’intervallo [a, b] ed a valori in R.
Allora la funzione (·|·) : C([a, b]) × C([a, b]) → R definita ponendo, per
ogni f ∈ C([a, b]) e g ∈ C([a, b]),
∫ b
(f |g) :=
f (x)g(x) dx .
a
risulta un prodotto scalare su C([a, b]).
La norma dedotta dal prodotto scalare viene definita ponendo, per
ogni f ∈ C([a, b]),
√
∫ b
∥f ∥ =
f (x)2 dx ,
a
e la distanza è data, per ogni f, g ∈ C([a, b]), da
√
∫ b
d(f, g) =
|f (x) − g(x)|2 dx .
a
Si può dimostrare tuttavia che con tale distanza C([a, b]) non è uno
spazio metrico completo.
Su C([a, b]) si può anche definire la norma uniforme ponendo
∥f ∥∞ := sup |f (x)| ,
x∈[a,b]
f ∈ C([a, b]) ,
(12.1.10)
12.1 Cenni sulla struttura metrica di Rn
349
e la distanza uniforme da essa dedotta
d∞ (f, g) = sup |f (x) − g(x)| ,
f, g ∈ C([a, b]) .
x∈[a,b]
Con tale distanza, lo spazio metrico (C([a, b], d∞ ) risulta completo e
quindi (C([a, b], ∥ · ∥∞ ) è uno spazio di Banach. Tuttavia, in questo
caso la norma non deriva da un prodotto scalare in quanto non soddisfa
la regola del parallelogramma.
12.1.2
Sfere ed insiemi aperti e chiusi
La distanza definita dalla (12.1.6) in Rn consente di introdurre tutte le
nozioni metriche basate su tale nozione.
◃ Siano x0 ∈ Rn e sia r > 0. Si denomina sfera aperta (rispettivamente,
sfera chiusa) di centro x0 e raggio r, il seguente sottoinsieme di Rn
Br (x0 ) := {x ∈ Rn | d(x, x0 ) < r}
(12.1.11)
Br′ (x0 ) := {x ∈ Rn | d(x, x0 ) ≤ r} .
(12.1.12)
(rispettivamente,
◃ La definizione delle sfere aperte e chiuse consente di definire subito gli
insiemi limitati. Precisamente, un sottoinsieme A di Rn si dice limitato se
esiste r > 0 tale che A ⊂ Br (0). Si è considerato per comodità il punto 0
di Rn , ma esso potrebbe essere sostituito con un qualsiasi altro elemento di
Rn . Quindi gli insiemi limitati in Rn sono i sottoinsiemi delle sfere aperte.
◃ Sempre partendo dalla definizione delle sfere aperte e chiuse, si possono
ora introdurre le seguenti ulteriori definizioni.
1. Se A ⊂ Rn ed x0 ∈ Rn , si dice che A è un intorno di x0 se è soddisfatta
la condizione seguente
∃ r > 0 t.c. Br (x0 ) ⊂ A .
(12.1.13)
2. Se A ⊂ Rn ed x0 ∈ Rn , si dice che x0 è interno ad A se A è un intorno
di x0 e quindi se vale la condizione precedente (12.1.13).
L’insieme di tutti gli intorni di x0 viene denotato con il simbolo I(x0 ).
3. Un sottoinsieme A ⊂ Rn si dice aperto se ogni suo punto è interno
(o, equivalentemente, se A è un intorno di ogni suo punto) e quindi se
vale la condizione (12.1.13) per ogni x0 ∈ A.
Capitolo 12: Calcolo differenziale in più variabili
350
4. Se A è un sottoinsieme arbitrario di Rn , si denomina interno di A
◦
e lo si denota con A il più grande sottoinsieme aperto contenuto
◦
in A. Pertanto A è costituito da tutti i soli i punti interni ad A o
equivalentemente è l’unione di tutti gli insiemi aperti contenuti in A.
Valgono le seguenti proprietà dell’interno di un sottoinsieme A:
◦
i) A è sempre un insieme aperto;
◦
ii) A ⊂ A;
◦
iii) A = A se e solo se A è un insieme aperto.
5. Un sottoinsieme C ⊂ Rn si dice chiuso se il suo complementare Rn rC
è aperto e quindi se e solo se, per ogni punto x0 del suo complementare
esiste una sfera aperta di centro x0 tutta contenuta nel complementare.
6. Se C è un sottoinsieme arbitrario di Rn , si denomina chiusura di C
e lo si denota con C il più piccolo sottoinsieme chiuso contenente C.
Pertanto C è l’intersezione di tutti gli insiemi chiusi contenenti C. La
chiusura di un sottoinsieme C può anche essere espressa utilizzando
la nozione di interno di un sottoinsieme nel modo seguente
◦
z }| {
C = Rn r Rn r C
Valgono le seguenti proprietà della chiusura di un sottoinsieme C:
i) C è sempre un insieme chiuso;
ii) C ⊂ C;
iii) C = C se e solo se C è un insieme chiuso.
7. Se A è un sottoinsieme arbitrario di Rn , si denomina frontiera di A e
la si denota con ∂A (oppure con Fr(A) il seguente sottoinsieme di Rn
∂A := A ∩ (Rn r A) .
8. Infine, si osserva che anche in Rn può essere data la definizione di
punto di accumulazione nel modo seguente. Se A è un sottoinsieme di
Rn e se x0 ∈ Rn , si dice che x0 è un punto di accumulazione per A se
vale la seguente condizione:
∀ δ > 0 : A ∩ Bδ (x0 ) r {x0 } ̸= ∅ ,
cioè, in ogni intorno di x0 devono esservi elementi di A diversi da x0 .
12.1 Cenni sulla struttura metrica di Rn
12.1.3
351
Intervalli, rette e direzioni di Rn
Se a = (a1 , . . . , an ) ∈ Rn e b = (b1 , . . . , bn ) ∈ Rn verificano le condizioni
ai ≤ bi ,
i = 1, . . . , n ,
si possono considerare gli intervalli
[a, b] := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai ≤ xi ≤ bi } ,
]a, b[ := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai < xi < bi } ,
[a, b[ := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai ≤ xi < bi } ,
]a, b] := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai < xi ≤ bi } ,
i quali vengono denominati rispettivamente intervallo chiuso (rispettivamente, aperto, semiaperto a destra, semiaperto a sinistra) di estremi a e
b.
Per molte questioni metriche sarà tuttavia più utile il concetto di sfera
aperta e chiusa definito nella sezione successiva.
Si denomina direzione di Rn ogni elemento v ∈ Rn tale che ∥v∥ = 1.
Si osserva che se v ∈ Rn r {0}, allora v/∥v∥ è una direzione di Rn .
In particolare, i vettori ei , i = 1, . . . , n, della base canonica sono particolari direzioni di Rn .
Se v = (v1 , . . . , vn ) ∈ Rn è una direzione di Rn e se x0 ∈ Rn , l’equazione
della retta passante per x0 e direzione v è data da
x = x0 + tv ,
t∈R,
ed in coordinate parametriche

x1 = (x0 )1 + tv1 ,



 x2 = (x0 )2 + tv2 ,
.

 ..


xn = (x0 )n + tvn ,
t∈R.
Se a = (a1 , . . . , an ) ∈ Rn e b = (b1 , . . . , bn ) ∈ Rn , la retta passante per a
e b ha equazione
x = a + t(b − a) ,
t∈R,
ed in coordinate parametriche


 x1 = a1 + t(b1 − a1 ) ,

 x2 = a2 + t(b2 − a2 ) ,
..

.



xn = an + t(bn − an ) ,
t∈R.
352
Capitolo 12: Calcolo differenziale in più variabili
Il segmento di estremi a e b è invece definito come segue
S[a, b] := {x ∈ Rn | ∃ t ∈ [0, 1] t.c. x = a + t(b − a)} .
Una poligonale P di Rn è l’unione di un numero finito di segmenti aventi a
due a due un estremo in comune; pertanto, devono esistere a0 , . . . , am ∈ Rn
(denominati vertici della poligonale) tali che P = S[a0 , a1 ] ∪ S[a1 , a2 ] ∪ · · · ∪
S[am−1 , am ]. Una poligonale congiungente i punti a e b è una poligonale
del tipo precedente con a = a0 e b = am ; essa viene anche denotata con il
simbolo P [a, b] oppure con P [a0 , . . . , am ] se si vogliono specificare i vertici
della poligonale.
Un sottoinsieme A di Rn si dice connesso per poligonali se, per ogni x, y ∈
A, esiste una poligonale P [x, y] congiungente i punti x ed y interamente
contenuta in A.
Più in generale, un sottoinsieme A di Rn si dice connesso se non è unione
di insiemi aperti disgiunti e non vuoti; quindi A è connesso se ogni volta che
A = A1 ∪ A2 con A1 e A2 insiemi aperti disgiunti, risulta A1 = ∅ oppure
A2 = ∅.
Si può dimostrare che in Rn un sottoinsieme connesso per poligonali è
anche connesso mentre il viceversa non vale (ad esempio, se si “connettono”
due insiemi connessi disgiunti mediante un arco di circonferenza si ottiene
un insieme connesso ma non connesso per poligonali). Tuttavia, Se A è
un sottoinsieme aperto di Rn , esso è connesso se e solo se è connesso per
poligonali.1
◃ Nel caso in cui si considerino poligonali costituite da un solo segmento,
si ottengono particolari insiemi connessi di seguito definiti.
Sia A un sottoinsieme di Rn . Si dice che A è convesso se, per ogni
a, b ∈ A il segmento S[a, b] congiungente a e b è interamente contenuto in
A.
1 Si supponga che A sia un insieme aperto non connesso per poligonali e siano a ∈ A
e b ∈ A non congiungibili con una poligonale. Si considerino gli insiemi A1 := {x ∈
A | ∃ P [a, x] ⊂ A} e A2 := {x ∈ A | @ P [a, x] ⊂ A}; essi verificano ovviamente le
condizioni A1 ∪ A2 = A, A1 ∩ A2 = ∅ e inoltre A1 ̸= ∅ (infatti a ∈ A1 ) e A2 ̸= ∅ (infatti
b ∈ A2 ). Si riconosce ora che A1 ed A2 sono entrambi aperti e ciò dimostrerà che A non
è connesso. Sia x0 ∈ A1 ; poiché A è aperto esiste δ > 0 tale che Bδ (x0 ) ⊂ A; considerata
una poligonale P [a, x0 ] congiungente a ed x0 e contenuta in A, per ogni x ∈ Bδ (x0 )
la poligonale costituita da P [a, x0 ] e dal segmento congiungente x0 ed x risulta essere
interamente contenuta in A e congiunge a ed x, da cui x ∈ A1 ; quindi Bδ (x0 ) ⊂ A1 da
cui si deduce che A1 è aperto. Sia ora x0 ∈ A2 e come prima si consideri δ > 0 tale
che Bδ (x0 ) ⊂ A; se esistesse una poligonale P [a, x] ⊂ A congiungente a ed x allora la
poligonale costituita da P [a, x] e dal segmento congiungente x ed x0 sarebbe contenuta
in A e congiungerebbe a ed x0 , e ciò è escluso dal fatto che x0 ∈
/ A1 ; pertanto x ∈ A2 da
cui Bδ (x0 ) ⊂ A2 e quindi A2 è aperto.
12.2 Funzioni di più variabili
353
Si osservi che un insieme convesso è anche connesso (in quanto è ovviamente connesso per poligonali), ma il viceversa non vale. Ad esempio, il
sottoinsieme A := ([−1, 0] × [0, 1/2]) ∪ [0, 1]2 è connesso ma non convesso.
y
x
Figura 12.1: Esempio di insieme connesso ma non convesso.
12.2
Funzioni di più variabili
Una funzione di n variabili reali è una funzione definita in un sottoinsieme
di Rn con n ≥ 1. Se tale funzione è a valori in R essa viene denominata
funzione reale di n variabili reali.
Per molti aspetti, lo studio di una funzione di più variabili può essere
condotto con metodi simili a quelli utilizzati per le funzioni di una variabile
reale; ad esempio, lo studio dell’insieme di definizione e le stesse definizioni
di limite e di continuità per funzioni di più variabili non presentano novità
sostanziali. Invece, il calcolo differenziale e lo studio dei massimi e minimi
relativi ed assoluti (e vincolati) necessita di un approccio sostanzialmente
più articolato rispetto a quello utilizzato per le funzioni di una sola variabile.
◃ Ad esempio, si consideri la funzione di due variabili
f (x, y) := y log(xy) + x2 esin(x+y) .
Le condizioni da imporre per determinare l’insieme di definizione riguardano
solamente la funzione logaritmo in quanto le altre funzioni sono definite per
qualsiasi valore reale del loro argomento. Pertanto si deve imporre xy > 0
e quindi la funzione è definita nel primo e nel terzo quadrante (esclusi gli
Capitolo 12: Calcolo differenziale in più variabili
354
assi):
Xf
:=
{(x, y) ∈ R2 | x > 0 , y > 0} ∪ {(x, y) ∈ R2 | x < 0 , y < 0}
=
]0, +∞[2 ∪] − ∞, 0[2 .
Si osservi che la funzione è definita in un sottoinsieme aperto non limitato
di R2 .
◃ Come ulteriore esempio si consideri la funzione di tre variabili
√
f (x, y, z) := 1 − x2 − y 2 + arcsin z .
Per determinare l’insieme di definizione, bisogna imporre le condizioni
{
1 − x2 − y 2 ≥ 0 ,
−1 ≤ z ≤ 1 ,
e quindi la funzione è definita nel cilindro di R3 che ha come base il cerchio di
centro l’origine e raggio 1 nel piano xy ed altezza l’intervallo [−1, 1] sull’asse
z:
Xf
:= {(x, y, z) ∈ R3 | x2 + y 2 ≤ 1 , −1 ≤ z ≤ 1}
=
{(x, y) ∈ R2 | x2 + y 2 ≤ 1} × [−1, 1] .
La funzione è definita in un sottoinsieme chiuso e limitato di R3 .
◃ Viene fornita ora la definizione di limite per le funzioni di più variabili.
Come si può notare, essa è del tutto analoga a quella già nota per le funzioni
di una variabile reale.
Definizione 12.2.1 Siano A ⊂ Rn ed f : A → R una funzione reale di più
variabili reali. Se x0 ∈ Rn è un punto di accumulazione per A e se ℓ ∈ R,
si dice che ℓ è il limite di f per x tendente verso x0 e si scrive
lim f (x) = ℓ ,
x→x0
oppure
lim
(x1 ,...,xn )→((x0 )1 ,...,(x0 )n )
f (x1 , . . . , xn ) = ℓ ,
se è soddisfatta le condizione seguente
∀ I ∈ I(ℓ) ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) r {x0 } : f (x) ∈ I .
(12.2.1)
Se ℓ ∈ R la condizione (12.2.1) è equivalente alla seguente
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) r {x0 } : |f (x) − ℓ| < ε ,
(12.2.2)
mentre se ℓ = +∞ (rispettivamente, ℓ = −∞), è equivalente alla seguente
∀ M ∈ R ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) r {x0 } : f (x) > M
(rispettivamente f (x) < M ).
(12.2.3)
12.2 Funzioni di più variabili
355
Vista la naturale generalizzazione della definizione di limite al caso di
più variabili, molti risultati ottenuti per le funzioni di una variabile rimangono validi anche nel caso in esame, come le proprietà di unicità del limite,
della permanenza del segno, della limitatezza locale, della monotonia del limite ed i teoremi di confronto e sulle operazioni sui limiti; non hanno invece
più significato, vista la struttura di Rn , i limiti da sinistra e da destra ed i
teoremi riguardanti funzioni monotone (in quanto tale nozione non ha senso
in più variabili). Per brevità, si omette in questa fase di enunciare tali risultati, riservandosi di richiamarli in maniera più dettagliata ogni qualvolta
vengano utilizzati nel seguito.
◃ Si consideri il seguente limite
log(1 + x3 y 2 )
√
.
(x,y)→(0,1)
x2 + (y − 1)2
lim
Esso si presenta nella forma indeterminata 0/0. Sebbene sia possibile utilizzare i limiti notevoli ed ottenere il limite
log(1 + x3 y 2 )
√
(x,y)→(0,1)
x2 + (y − 1)2
lim
=
log(1 + x3 y 2 )
x3 y 2
√
3
2
2
x y
(x,y)→(0,1)
x + (y − 1)2
=
x3 y 2
√
,
(x,y)→(0,1)
x2 + (y − 1)2
lim
lim
risulta comunque problematico effettuare un confronto tra i due infinitesimi
al numeratore ed al denominatore.
Si può allora ricorrere ad un metodo di frequente utilizzo che consiste
nell’effettuare dapprima una traslazione in modo che il limite venga calcolato
nel punto (0, 0) e poi nel passaggio alle coordinate polari. Infatti, posto
u := x e v := y − 1, l’ultimo limite diventa
x3 y 2
u3 (1 + v)2
√
√
=
lim
,
(x,y)→(0,1)
(u,v)→(0,0)
u2 + v 2
x2 + (y − 1)2
lim
e a questo punto, posto u := ρ cos θ, v := ρ sin θ, si ottiene il limite
lim+
ρ→0
ρ3 cos3 θ(1 + ρ sin θ)2
= lim+ ρ2 cos3 θ(1 + ρ sin θ)2 = 0 .
ρ
ρ→0
Si osservi che l’ultima uguaglianza è giustificata dal fatto che il limite tende
a 0 indipendente da θ; infatti il fattore cos3 θ(1 + ρ sin θ)2 è limitato in un
intorno del punto ρ = 0 e quindi
−M ρ2 ≤ ρ2 cos3 θ(1 + ρ sin θ)2 ≤ M ρ2 ,
356
Capitolo 12: Calcolo differenziale in più variabili
con M > 0 costante opportuna; poiché limρ→0+ M ρ2 = 0, per confronto si
ottiene che anche il limite assegnato è 0.
◃ Si passa ora a considerare la nozione di continuità.
Definizione 12.2.2 Siano A ⊂ Rn ed f : A → R una funzione reale di più
variabili reali. Se x0 ∈ A, si dice che f è continua in x0 se è soddisfatta le
condizione seguente
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) : |f (x) − f (x0 )| < ε .
(12.2.4)
Se x0 è un punto di accumulazione per A, la condizione precedente
equivale a limx→x0 f (x) = f (x0 ), mentre se x0 ∈ A non è un punto di
accumulazione per A, allora f è automaticamente continua in x0 .
Si dirà poi che f è continua in un sottoinsieme B ⊂ A se è continua in
ogni x0 ∈ B.
Infine, si dice che f è continua se è continua in ogni x0 ∈ A.
Le nozioni di continuità a destra ed a sinistra non hanno significato per
le funzioni di più variabili, mentre è possibile estendere il seguente risultato,
di cui per brevità viene omessa la dimostrazione.
Teorema 12.2.3 (Teorema di Weierstrass in più variabili)
Siano A un sottoinsieme chiuso e limitato di Rn ed f : A → R una funzione
reale continua. Allora f è dotata di minimo e di massimo, cioè esistono
c, d ∈ A tali che, per ogni x ∈ A, f (c) ≤ f (x) ≤ f (d).
Anche il teorema degli zeri può essere generalizzato nel caso di funzioni
di più variabili nel modo seguente.
Teorema 12.2.4 (Teorema degli zeri in più variabili)
Siano A un sottoinsieme di Rn ed f : A → R una funzione reale continua.
Se a, b ∈ A sono tali che f (a) · f (b) < 0 e se esiste una poligonale P [a, b] di
estremi a e b interamente contenuta in A, allora esiste c ∈ A (in particolare
c ∈ P [a, b]) tale che f (c) = 0.
Dimostrazione. Basta applicare il teorema degli zeri per funzioni di una variabile reale
alla restrizione di f alla poligonale P [a, b].
12.3
Derivate direzionali e parziali e differenziabilità
Alcune nozioni introdotte nel seguito sono basate su proprietà elementari
delle funzioni lineari, che per comodità si preferisce richiamare preliminarmente.
12.3 Derivate direzionali e parziali e differenziabilità
12.3.1
357
Funzioni lineari
Se E ed F sono spazi vettoriali su K (si ricorda che K denota l’insieme dei
numeri reali R oppure quello dei numeri complessi C), una funzione lineare
da E in F è una funzione L : E → F che verifica le seguenti condizioni, per
ogni x, y ∈ Rn e λ ∈ K,
L(x + y) = L(x) + L(y) ,
L(λ x) = λ L(x) .
Una funzione lineare L : E → K viene denominata anche funzionale lineare
su E.
In particolare, i funzionali lineari su Rn sono funzioni lineari L : Rn → R.
Una proprietà importante di tali funzionali lineari riguarda il fatto che i
valori dipendono solamente da quelli assunti sui vettori della∑base canon
nica; infatti, per ogni x = (x1 , . . . , xn ) ∈ Rn , risulta x =
i=1 xi ei e
conseguentemente, dalle condizioni di linearità,
( n
)
n
n
∑
∑
∑
L(x) = L
xi ei =
L(xi ei ) =
L(ei ) xi .
(12.3.1)
i=1
i=1
i=1
Si deduce in particolare che due funzionali lineari che assumono lo stesso
valore sui vettori della base canonica devono necessariamente coincidere.
Considerato il vettore eL := (L(e1 ), . . . , L(en )), e ricordando la definizione del prodotto scalare in Rn , la formula precedente può essere scritta
come segue
L(x) = (eL |x) .
(12.3.2)
In generale, quindi, un funzionale lineare su Rn è del tipo
L(x1 , . . . , xn ) = a1 x1 + · · · + an xn ,
(x1 , . . . , xn ) ∈ Rn ,
con a1 , . . . , an ∈ R costanti fissate (inoltre ai = L(ei ) per ogni i = 1, . . . , n).
In particolare i funzionali lineari su R, R2 ed R3 assumono rispettivamente la forma
L(x) = ax ,
L(x, y) = ax + by ,
L(x, y, z) = ax + by + cz ,
con a, b, c ∈ R fissati ed x, y, z ∈ R.
Dall’espressione ottenuta dei funzionali lineari segue subito che essi sono
funzioni continue in quanto somma di n funzioni potenza di grado 1.
◃ Sia L : Rn → R un funzionale lineare su Rn . Allora, l’insieme dei punti
ΠL
:=
{(x1 , . . . , xn , y) ∈ Rn+1 | y = L(x1 , . . . , xn )}
=
{(x, y) ∈ R × R | y = (eL |x)}
n
(12.3.3)
Capitolo 12: Calcolo differenziale in più variabili
358
è un sottospazio vettoriale di Rn+1 , denominato iperpiano generato da L.
Se x0 ∈ Rn e se y0 ∈ R, si può considerare l’iperpiano ΠL,(x0 ,y0 ) generato
da L e passante per (x0 , y0 )
ΠL,(x0 ,y0 )
:=
:=
{(x, y) ∈ Rn × R | y = y0 + L(x − x0 )} ,
{(x, y) ∈ Rn × R | y = y0 + (eL |x − x0 )} ,
la cui equazione è data da
y = y0 + L(x − x0 ) ,
x ∈ Rn , y ∈ R ,
oppure, utilizzando il prodotto scalare,
y = y0 + (eL |x − x0 ) ,
12.3.2
x ∈ Rn , y ∈ R .
Derivate direzionali e parziali
Siano A un sottoinsieme di Rn ed f : A → R una funzione reale di n variabili
reali. Se x0 ∈ A è un punto interno ad A e se v ∈ Rn è una direzione di Rn ,
l’insieme
Ix0 ,v := {t ∈ R | x0 + tv ∈ A}
contiene un intorno del punto 0.2 Si può quindi considerare la funzione
fx0 ,v : Ix0 ,v → R definita ponendo, per ogni t ∈ Ix0 ,v ,
fx0 ,v (t) = f (x0 + tv) ,
la quale è definita in un intorno dello 0; tale funzione rappresenta la restrizione della funzione f alla retta passante per x0 di direzione v (si osservi
che il punto x0 si ottiene per t = 0 dall’equazione della retta).
Si può a questo punto assumere la seguente definizione.
Definizione 12.3.1 Si dice che f è derivabile in x0 rispetto alla direzione
v se fx0 ,v è derivabile in 0; in tal caso, fx′ 0 ,v (0) viene denominata derivata
∂f
direzionale di f in x0 rispetto alla direzione v e denotata con
(x0 ).
∂v
Si ha pertanto
∂f
fx ,v (t) − fx0 ,v (0)
f (x0 + tv) − f (x0 )
(x0 ) := lim 0
= lim
t→0
t→0
∂v
t
t
2 Infatti, x è interno ad A e quindi esiste δ > 0 tale che B (x ) ⊂ A; allora, per
0
δ 0
ogni t ∈] − δ, δ[, risulta d(x0 + tv, x0 ) = ∥x0 + tv − x0 ∥ = |t| ∥v∥ = |t| < δ e quindi
] − δ, δ[⊂ Ix0 ,v .
12.3 Derivate direzionali e parziali e differenziabilità
359
e, denotate con (v1 , . . . , vn ) le componenti di v, si può scrivere
∂f
f ((x0 )1 + tv1 , . . . , (x0 )n + tvn ) − f ((x0 )1 , . . . , (x0 )n )
(x0 ) = lim
.
t→0
∂v
t
In particolare, fissato i = 1, . . . , n, si può considerare la direzione ei della
base canonica. In questo caso, la derivata direzionale di f in x0 rispetto
alla direzione ei viene denominata derivata parziale i-esima (oppure rispetto
alla i-esima variabile) e denotata con il simbolo
∂f
(x0 ) .
∂xi
Pertanto, da quanto osservato sopra e tenendo presente che x0 + tei =
(x0 )1 , . . . , (x0 )n ) + t(0, . . . , 1, . . . , 0) = ((x0 )1 , . . . , (x0 )i + t, . . . , (x0 )n ),
f (x0 + tei ) − f (x0 )
t
f ((x0 )1 , . . . , (x0 )i + t, . . . , (x0 )n ) − f ((x0 )1 , . . . , (x0 )n )
= lim
.
t→0
t
∂f
(x0 ) =
∂xi
lim
t→0
Quindi, la derivata parziale rispetto alla variabile i-esima viene effettuata
considerando costanti le variabili diverse da quella i-esima e derivando la
funzione come se dipendesse dall’unica variabile xi . Ciò suggerisce un semplice criterio sia per riconoscere che una funzione è derivabile parzialmente
rispetto ad un’assegnata variabile che per calcolarne la derivata parziale,
utilizzando gli stessi metodi e le stesse regole di derivazione già viste per le
funzioni di una sola variabile reale.
◃ Ad esempio, si consideri la funzione
f (x, y) := ex+y + cos(xy) .
Fissato y ∈ R, la funzione parziale fy (x) := f (x, y), dipendente dalla sola
variabile x, è derivabile in tutto R e si ha fy (x) = ex+y − y sin(xy); pertanto, dall’arbitrarietà di y ∈ R, si conclude che f è derivabile parzialmente
rispetto ad x in ogni (x, y) ∈ R2 e si ha
∂f
(x, y) = ex+y − y sin(xy) .
∂x
In modo analogo, fissato x ∈ R, la funzione parziale fx (y) := f (x, y), dipendente dalla sola variabile y, è derivabile in tutto R e si ha fx (y) =
ex+y − x sin(xy); pertanto, dall’arbitrarietà di x ∈ R, si conclude che f è
derivabile parzialmente anche rispetto ad y in ogni (x, y) ∈ R2 e si ha
∂f
(x, y) = ex+y − x sin(xy) .
∂y
360
Capitolo 12: Calcolo differenziale in più variabili
◃ Se f : A → R è derivabile parzialmente rispetto ad ogni variabile in
un punto x0 ∈ A, si può considerare il gradiente di f in x0 , denotato con
∇f (x0 ) (oppure con grad f (x0 )), e definito come segue
(
)
∂f
∂f
∇f (x0 ) :=
(x0 ), . . . ,
(x0 )
(12.3.4)
∂x1
∂xn
◃ In generale non vi è un legame tra le derivate parziali e le derivate
direzionali, per cui la conoscenza delle derivate parziali non è sufficiente per
determinare tutte le derivate direzionali della funzione in un fissato punto.
◃ I concetti precedenti sono basati su una generalizzazione analitica del
concetto di derivata; infatti si considera una retta passante per x0 e si
restringe la funzione a tale retta (intersecata con l’insieme di definizione)
ottenendo cosı̀ una funzione di una variabile per la quale si può considerare la
derivata già nota per tali funzioni. La difficoltà di introdurre un concetto più
generale dipende dal fatto che il rapporto incrementale (f (x) − f (x0 ))/(x −
x0 ) non ha significato per le funzioni di più variabili.
Tuttavia, il prossimo obiettivo è quello di introdurre una nozione più
forte che tenga conto del comportamento della funzione in tutto un intorno
di x0 e non solo su una particolare retta.
In tali casi dall’esistenza delle derivate parziali si potrà ricavare anche
quella delle derivate rispetto ad una qualsiasi direzione.
Di tale proprietà ci si occupa nella sezione successiva.
12.3.3
Differenziabilità
Si studia ora il concetto di funzione differenziabile in un punto. Tale concetto trae spunto dall’interpretazione geometrica della derivata per le funzioni
di una variabile.
Infatti se f : I → R è una funzione definita in un intervallo I ⊂ R e se
x0 ∈ I, è noto che f è derivabile in x0 se e solo se il suo grafico è dotato
di retta tangente non verticale nel punto (x0 , f (x0 )); tra tutte le rette di
equazione y = f (x0 ) + a(x − x0 ) passanti per (x0 , f (x0 )) la retta tangente,
che ha equazione y = f (x0 )+f ′ (x0 )(x−x0 ), è l’unica che verifica la seguente
condizione
f (x) − (f (x0 ) + f ′ (x0 )(x − x0 ))
lim
=0
x→x0
x − x0
(infatti
f (x) − (f (x0 ) + f ′ (x0 )(x − x0 ))
lim
= lim
x→x0
x→x0
x − x0
(
f (x) − f (x0 )
− f ′ (x0 )
x − x0
)
=0).
12.3 Derivate direzionali e parziali e differenziabilità
361
Pertanto la definizione di derivabilità in x0 equivale a richiedere l’esistenza di un numero a ∈ R tale che
lim
x→x0
f (x) − f (x0 ) − a(x − x0 )
=0
|x − x0 |
(si è potuto dividere per |x − x0 | anziché per x − x0 proprio perché il limite
è stato posto uguale a 0) e in tal caso il numero a risulta essere proprio
f ′ (x0 ).
Si considerino ora un sottoinsieme A di Rn , un punto interno x0 ad A
ed una funzione reale f : A → R di n variabili reali. Si ricorda che i piani
passanti per il punto (x0 , f (x0 )) hanno equazione y = f (x0 ) + L(x − x0 )
dove L : Rn → R è un funzionale lineare su Rn e quindi si può richiedere,
analogamente al caso delle funzioni di una variabile, che esista uno di tali
piani verificante la condizione
lim
x→x0
f (x) − f (x0 ) − L(x − x0 )
=0.
∥x − x0 ∥
Ciò conduce alla seguente definizione.
Definizione 12.3.2 Siano A un sottoinsieme di Rn , x0 ∈ A un punto
interno ad A ed f : A → R una funzione reale di n variabili reali. Si dice
che f è differenziabile in x0 se esiste un funzionale lineare L : Rn → R tale
che
f (x) − f (x0 ) − L(x − x0 )
lim
=0.
(12.3.5)
x→x0
∥x − x0 ∥
Il funzionale lineare L previsto nella definizione precedente è unico3 e
viene denominato differenziale di f in x0 e denotato con df (x0 ).
Da quanto osservato, la definizione di differenziabilità in x0 equivale a richiedere l’esistenza di un piano in Rn+1 tangente al grafico della
3 Infatti, si supponga che L ed L siano funzionali lineari verificanti la (12.3.5). Si
1
2
consideri δ > 0 tale che Bδ (x0 ) ⊂ A e sia 0 < t < δ; allora, per ogni i = 1, . . . , n, risulta
x0 + t ei ∈ A e inoltre
L1 (ei ) − L2 (ei )
=
=
L1 (t ei ) − L2 (t ei )
L1 (x0 + t ei − x0 ) − L2 (x0 + t ei − x0 )
=
t
t
f (x0 + t ei ) − f (x0 ) − L2 (x0 + t ei − x0 )
∥x0 + tei − x0 ∥
f (x0 + t ei ) − f (x0 ) − L1 (x0 + t ei − x0 )
−
;
∥x0 + tei − x0 ∥
quindi, considerando il limite per t → 0, dalla (12.3.5) si ottiene L1 (ei ) = L2 (ei ). Poiché
i = 1, . . . , n è arbitrario, i funzionali lineari L1 ed L2 coincidono sui vettori della base
canonica e quindi devono essere uguali.
Capitolo 12: Calcolo differenziale in più variabili
362
funzione f nel punto (x0 , f (x0 )). Tale piano ha equazione y = f (x0 ) +
df (x0 )(x − x0 ) (oppure anche y = f (x0 ) + (∇f (x0 )|x − x0 )) oppure, ancora
più esplicitamente,
y = f (x0 ) +
n
∑
∂f
(x0 ) (xi − (x0 )i ) ,
∂x
i
i=1
x = (x1 , . . . , xn ) ∈ Rn , y ∈ R ,
ed è pertanto univocamente individuato dal valore della funzione in x0 e da
quello delle sue derivate parziali in x0 .
Si osservi che per n = 1 si ottiene l’equazione già nota della retta
tangente al grafico di f nel punto (x0 , f (x0 )).
Si studiano subito alcune proprietà delle funzioni differenziabili.
Teorema 12.3.3 Siano A un sottoinsieme di Rn , x0 ∈ A un punto interno
ad A ed f : A → R una funzione differenziabile in x0 . Allora f è continua
in x0 .
Dimostrazione. Dalla definizione di differenziabilità e dalla continuità di df (x0 ) segue
subito
( f (x) − f (x ) − df (x )(x − x )
0
0
0
lim
∥x − x0 ∥ + f (x0 )
lim f (x) =
x→x0
x→x0
∥x − x0 ∥
)
+ df (x0 )(x − x0 )
=
f (x0 ) + lim
=
f (x0 )
x→x0
f (x) − f (x0 ) − df (x0 )(x − x0 )
∥x − x0 ∥
∥x − x0 ∥
e quindi la tesi.
Si osservi che se f è derivabile rispetto ad ogni direzione in x0 non è detto
che essa sia continua in x0 (risulta essere continua solamente la restrizione
di f ad ogni retta passante per x0 ).
Esempio 12.3.4 Si consideri la funzione f : R2 → R definita ponendo, per
ogni (x, y) ∈ R2 ,
{ 2
x /y ,
y ̸= 0 ,
f (x, y) :=
0,
y=0.
Si consideri il punto (0, 0) e sia v = (ξ, η) una direzione di R2 ; allora, se
η ̸= 0, si ha
f (tξ, tη) − f (0, 0)
(tξ)2 /(tη)
ξ2
= lim
=
,
t→0
t→0
t
t
η
lim
12.3 Derivate direzionali e parziali e differenziabilità
363
mentre, se η = 0, risulta
f (tξ, tη) − f (0, 0)
=0;
t→0
t
lim
dunque, f è derivabile rispetto ad ogni direzione nel punto (0, 0) e si ha
{ 2
∂f
ξ /η ,
η ̸= 0 ,
(0, 0) =
v = (ξ, η) .
0
,
η=0,
∂v
Tuttavia f non è continua in (0, 0) in quanto, ad esempio, sulla curva di
equazione y = x2 , passante per (0, 0), assume il valore 1 in ogni punto
diverso da (0, 0) mentre in (0, 0) assume il valore 0.
In realtà, sempre con riferimento all’esempio considerato, l’esistenza delle derivate
direzionali comporta la continuità in 0 della restrizione di f ad ogni retta passante per
l’origine; questo, in termini analitici, vuol dire che, fissato ε > 0 e fissata una direzione
v = (ξ, η) di R2 , esiste δ > 0 tale che, per ogni t ∈] − δ, δ[, si abbia |f (tξ, tη) − f (0, 0)| < ε;
tuttavia, in questo caso il numero δ > 0 dipende dalla direzione oltre che da ε (si può
riconoscere facilmente che, imponendo la condizione |(tξ)2 /(tη)| = |f (tξ, tη)−f (0, 0)| < ε
deve essere δ = ε/ξ per ogni ξ ̸= 0) e quindi non è possibile considerare una sfera di centro
l’origine in cui vale la diseguaglianza |f (x, y) − f (0, 0)| < ε.
La differenziabilità di una funzione in un punto comporta l’esistenza
in tal punto di tutte le derivate direzionali; inoltre, le derivate direzionali
possono essere espresse mediante il differenziale, come dimostra il seguente
risultato.
Teorema 12.3.5 Siano A un sottoinsieme di Rn , x0 ∈ A un punto interno
ad A ed f : A → R una funzione differenziabile in x0 . Allora, per ogni
direzione v ∈ Rn di Rn , f è derivabile in x0 rispetto alla direzione v e si ha
∂f
(x0 ) = df (x0 )(v) .
∂v
(12.3.6)
Dimostrazione. Per dimostrare la tesi è sufficiente riconoscere che
f (x0 + tv) − f (x0 )
lim
= df (x0 )(v) ;
t→0
t
dalla definizione di differenziabilità segue, ponendo x = x0 + tv,
f (x0 + tv) − f (x0 ) − df (x0 )(tv)
lim
=0,
t→0
∥tv∥
e quindi, dalla linearità di df (x0 ), dalla limitatezza del rapporto t/|t| per ogni t ̸= 0 e
tenendo presente che ∥tv∥ = |t| ∥v∥ = |t|, si ha anche
(
)
f (x0 + tv) − f (x0 )
f (x0 + tv) − f (x0 ) − t df (x0 )(v)
lim
− df (x0 )(v)
= lim
t→0
t→0
t
t
f (x0 + tv) − f (x0 ) − df (x0 )(tv) |t|
= lim
t→0
∥tv∥
t
= 0,
364
Capitolo 12: Calcolo differenziale in più variabili
da cui segue direttamente la tesi.
Il viceversa del risultato precedente non vale in generale e quindi una
funzione potrebbe essere derivabile rispetto ad ogni direzione in un punto
pur non essendo differenziabile in tale punto; ad esempio, la funzione considerata nell’Esempio 12.3.4 è derivabile rispetto ad ogni direzione in (0, 0),
ma non può essere differenziabile in tale punto altrimenti, per il Teorema
12.3.3, dovrebbe essere continua in (0, 0).
◃ In particolare il risultato precedente asserisce che una funzione differenziale in x0 è dotata in tal punto anche di tutte le derivate parziali e dalla
(12.3.6) si ha, per ogni i = 1, . . . , n,
∂f
(x0 ) = df (x0 )(ei ) .
∂xi
(12.3.7)
Quindi i valori che il differenziale assume nei vettori della base canonica sono
proprio le derivate parziali di f in x0 ; ricordando che tali valori determinano
univocamente il differenziale, dalle espressioni (12.3.1) e (12.3.2) si ottiene
la seguente espressione del differenziale, per ogni x = (x1 , . . . , xn ) ∈ Rn ,
df (x0 )(x) =
n
∑
∂f
(x0 ) xi = (∇f (x0 )|x) .
∂x
i
i=1
(12.3.8)
Utilizzando la definizione del gradiente di f in x0 data dalla (12.3.4), il differenziale
assume anche la seguente espressione
df (x0 )(x) = (∇f (x0 )|x) ,
x ∈ Rn ,
e la condizione di differenziabilità si può anche scrivere nel modo seguente
lim
x→x0
f (x) − f (x0 ) − (∇f (x0 )|x − x0 )
=0.
∥x − x0 ∥
◃ In particolare, dalla (12.3.8) si ricava, per ogni direzione v = (v1 , . . . , vn )
di Rn ,
n
∑
∂f
∂f
(x0 ) =
(x0 ) vi ,
(12.3.9)
∂v
∂xi
i=1
e quindi, se f è differenziabile in x0 , tutte le derivate direzionali in x0 si
esprimono come combinazione lineare delle derivate parziali in x0 . Più precisamente, la proprietà (12.3.9) esprime il fatto che le derivate direzionali sono
coefficienti angolari di rette in Rn+1 passanti per (x0 , f (x0 )) che si trovano
tutte sul piano tangente al grafico della funzione f nel punto (x0 , f (x0 )).
◃ Da quanto osservato, segue che la differenziabilità di una funzione fornisce tutte le informazioni sulle derivate direzionali in x0 utilizzando solamente
12.3 Derivate direzionali e parziali e differenziabilità
365
quelle sulle derivate parziali che, come si è visto, possono essere studiate e
calcolate utilizzando gli strumenti già a disposizione per le funzioni di una
sola variabile reale.
Pertanto, a questo punto è particolarmente utile avere a disposizione dei
criteri di differenziabilità che utilizzino le stesse derivate parziali.
Teorema 12.3.6 (Teorema del differenziale totale)
Siano A un sottoinsieme di Rn , x0 ∈ A un punto interno ad A ed f : A → R
una funzione di n variabili reali tale che
i) esiste δ > 0 tale che, per ogni x ∈ Bδ (x0 ), f sia derivabile parzialmente rispetto ad ogni variabile in x;
ii) le derivate parziali
∂f
∂f
,...
,
∂x1
∂xn
sono continue in x0 .
Allora f è differenziabile in x0 .
Dimostrazione. Per brevità, si dimostra la tesi nel caso in cui f sia una funzione di due
variabili reali derivabile parzialmente rispetto ad x e rispetto ad y in ogni elemento della
sfera Bδ (x0 , y0 ) con derivate parziali continue in (x0 , y0 ). Bisogna allora dimostrare che
lim
(x,y)→(x0 ,y0 )
f (x, y) − f (x0 , y0 ) − ∂f
(x0 , y0 ) (x − x0 ) −
∂x
√
(x − x0 )2 + (y − y0 )2
∂f
(x0 , y0 ) (y
∂y
− y0 )
=0.
A tal fine, si fissi ε > 0 e, dalla continuità delle derivate parziali in (x0 , y0 ), si considerino
δ1 > 0 e δ2 > 0 tali che
∀(x, y) ∈ Bδ1 (x0 , y0 ) :
∀(x, y) ∈ Bδ2 (x0 , y0 ) :
∂f
(x, y) −
∂x
∂f
(x, y) −
∂y
ε
∂f
(x0 , y0 ) < ,
∂x
2
ε
∂f
(x0 , y0 ) < .
∂y
2
Si ponga ora δ0 = min{δ, δ1 , δ2 }; si passa a riconoscere che, per ogni (x, y) ∈ Bδ0 (x0 , y0 ),
si ha
(x0 , y0 ) (x − x0 ) − ∂f
(x0 , y0 ) (y − y0 )
f (x, y) − f (x0 , y0 ) − ∂f
∂x
∂y
√
<ε
(x − x0 )2 + (y − y0 )2
e ciò completerà la dimostrazione.
Sia (x, y) ∈ Bδ0 (x0 , y0 ) e si supponga x ̸= x0 e y ̸= y0 . Denotati con I(x0 , x) e
rispettivamente I(y0 , y) gli intervalli aperti di estremi x0 ed x e rispettivamente y0 ed y,
¯ 0 , x) → R e φ2 : I(y
¯ 0 , y) → R definite ponendo
si considerino le funzioni φ1 : I(x
¯ 0 , x) : φ1 (t) = f (t, y) ,
∀t ∈ I(x
¯ 0 , y) : φ2 (s) = f (x0 , s) .
∀s ∈ I(y
¯ 0 , x) si ha (t, y) ∈ Bδ (x0 , y0 ) e analogamente, per ogni
Si osservi che, per ogni t ∈ I(x
0
¯ 0 , y), si ha (x0 , s) ∈ Bδ (x0 , y0 ) e quindi φ1 e φ2 sono derivabili e si ha
s ∈ I(y
0
¯ 0 , x) : φ′ (t) =
∀t ∈ I(x
1
∂f
(t, y) ,
∂x
¯ 0 , y) : φ′ (s) =
∀s ∈ I(y
2
∂f
(x0 , s) .
∂y
Capitolo 12: Calcolo differenziale in più variabili
366
Dal teorema di Lagrange (Teorema 9.2.3 per le funzioni di una variabile), esistono ξ ∈
I(x0 , x) ed η ∈ I(y0 , y) tali che
φ1 (x) − φ1 (x0 ) = (x − x0 ) φ′1 (ξ) ,
φ2 (y) − φ1 (y0 ) = (y − y0 ) φ′2 (η) ,
da cui
f (x, y) − f (x0 , y) = (x − x0 )
∂f
(ξ, y) ,
∂x
f (x0 , y) − f (x0 , y0 ) = (y − y0 )
∂f
(x0 , η) .
∂y
Tenendo infine presente che
√
√
√
|x − x0 |
(x − x0 )2 + (y − y0 )2
|y − y0 |
(x − x0 )2 + (y − y0 )2
=
√
=
(x − x0 )2
≤1,
(x − x0 )2 + (y − y0 )2
(y − y0 )2
≤1,
(x − x0 )2 + (y − y0 )2
si ottiene
(x0 , y0 ) (x − x0 ) −
f (x, y) − f (x0 , y0 ) − ∂f
∂x
√
(x − x0 )2 + (y − y0 )2
≤
≤
∂f
(x0 , y0 ) (y
∂y
− y0 )
(x0 , y0 ) (x − x0 )
f (x0 , y) − f (x0 , y0 ) − ∂f
(x0 , y0 ) (y − y0 )
f (x, y) − f (x0 , y) − ∂f
∂x
∂y
√
√
+
2
2
2
(x − x0 ) + (y − y0 )
(x − x0 ) + (y − y0 )2
∂f
(ξ, y)
∂x
√
−
∂f
(x0 , y0 )
∂x
|x − x0 |
(x − x0 )2 + (y − y0 )2
+
∂f
(x0 , η)
∂y
√
−
∂f
(x0 , y0 )
∂y
|y − y0 |
(x − x0 )2 + (y − y0 )2
ε
ε
|x − x0 |
|y − y0 |
√
√
+
2
2
2
2
(x − x0 ) + (y − y0 )
(x − x0 )2 + (y − y0 )2
ε
ε
≤ + =ε.
2
2
<
Infine si osserva che se (x, y) = (x0 , y0 ) la diseguaglianza precedente è ovvia, mentre se
x = x0 e y ̸= y0 oppure x ̸= x0 e y = y0 , si può procedere in maniera del tutto analoga
considerando solamente la funzione φ2 oppure φ1 .
Gli esempi seguenti mettono in evidenza il fatto che le condizioni fornite
dal teorema precedente sono solamente sufficienti e non necessarie per assicurare la differenziabilità; pertanto, nei casi in cui le ipotesi del teorema
precedente non siano soddisfatte bisogna procedere ad una verifica diretta
della differenziabilità.
Esempi 12.3.7
1. Si consideri la funzione f : R2 → R definita ponendo,
per ogni (x, y) ∈ R2 ,
f (x, y) := |xy| .
Per ogni (x0 , y0 ) ∈ R2 , si ha
lim
t→0
f (x0 + t, y0 ) − f (x0 , y0 )
|x0 + t| − |x0 |
= |y0 | lim
t→0
t
t
12.3 Derivate direzionali e parziali e differenziabilità
367
e quindi f è derivabile parzialmente rispetto ad x in Ax := {(x0 , y0 ) ∈
R2 | x0 ̸= 0} ∪ {(0, 0)} ed in ognuno di tali punti si ha
∂f
(x0 , y0 ) = |y0 | ;
∂x
analogamente, essendo
f (x0 , y0 + t) − f (x0 , y0 )
|y0 + t| − |y0 |
= |x0 | lim
t→0
t→0
t
t
lim
si deduce che f è derivabile parzialmente rispetto ad y in
Ay := {(x0 , y0 ) ∈ R2 | y0 ̸= 0} ∪ {(0, 0)}
ed in ognuno di tali punti si ha
∂f
(x0 , y0 ) = |x0 | .
∂y
Segue allora che in tutti i punti (x0 , y0 ) ∈ R2 tali che x0 ̸= 0 e y0 ̸= 0
si può applicare il teorema del differenziale totale e si conclude che f
è differenziabile in tali punti con df (x0 , y0 )(x, y) = |y0 |x + |x0 |y per
ogni (x, y) ∈ R2 .
Nei punti degli assi diversi dall’origine la funzione non è differenziabile
in quanto almeno uno delle derivate parziali non esiste in tali punti.
Rimane da discutere il punto (x0 , y0 ) = (0, 0) in cui esistono e si annullano entrambe le derivate parziali, ma non si può applicare il teorema
del differenziale totale in quanto le derivate parziali non sono definite
in tutto un intorno del punto (0, 0). Tuttavia, usando la definizione,
si riconosce subito che
lim
(x,y)→(0,0)
f (x, y) − f (0, 0)
∥(x, y) − (0, 0)∥
|xy|
√
x2 + y 2
ρ2 | sin θ cos θ|
= lim+
=0,
ρ
ρ→0
=
lim
(x,y)→(0,0)
e quindi la funzione è differenziabile in (0, 0).
2. Si consideri ora la funzione f : R2 → R definita ponendo, per ogni
(x, y) ∈ R2 ,
{ 2
1
(x, y) ̸= (0, 0) ,
(x + y 2 ) sin x2 +y
2 ,
f (x, y) :=
0,
(x, y) = (0, 0) .
Capitolo 12: Calcolo differenziale in più variabili
368
Si riconosce facilmente che, per ogni (x0 , y0 ) ∈ R2 r {(0, 0)}, si ha
∂f
1
2x0
1
(x0 , y0 ) = 2x0 sin 2
− 2
cos 2
,
2
2
∂x
x0 + y0
x0 + y0
x0 + y02
∂f
1
2y0
1
(x0 , y0 ) = 2y0 sin 2
− 2
cos 2
,
2
2
∂y
x0 + y0
x0 + y0
x0 + y02
e quindi, per il teorema del differenziale totale, f è differenziabile in
tutti i punti diversi dall’origine.
Nel punto (0, 0) si ha
∂f
t2 sin(1/t2 )
1
(0, 0) = lim
= lim t sin 2 = 0
t→0
t→0
∂x
t
t
e analogamente
∂f
(0, 0) = 0; inoltre
∂y
f (x, y) − f (0, 0)
lim
(x,y)→(0,0) ∥(x, y) − (0, 0)∥
1
(x2 + y 2 ) sin x2 +y
2
√
=
lim
2
2
(x,y)→(0,0)
x +y
√
1
=
lim
x2 + y 2 sin 2
x + y2
(x,y)→(0,0)
1
= lim+ ρ sin 2 = 0 ,
ρ
ρ→0
e quindi la funzione è differenziabile in (0, 0).
12.3.4
Derivate successive e formula di Taylor
Siano A un sottoinsieme di Rn ed f : A → R una funzione reale di n-variabili
reali. Fissato i = 1, . . . , n, si può considerare l’insieme
◦
A′i := {x0 ∈ A | f è derivabile parzialmente in x0 rispetto ad xi }
e conseguentemente si può definire la funzione g : A′i → R definita ponendo,
per ogni x ∈ A′i ,
∂f
g(x) :=
(x) ,
∂xi
la quale viene denominata funzione derivata parziale i-esima di f .
Se x0 ∈ A′i e se j = 1, . . . , n, si dice che f è derivabile parzialmente due
volte in x0 rispetto alle variabili xi ed xj se sono soddisfatte le seguenti
condizioni
12.3 Derivate direzionali e parziali e differenziabilità
369
i) x0 è interno a A′i (cioè, f è derivabile parzialmente rispetto ad xi in
un intorno di x0 );
ii) la derivata parziale
∂f
è derivabile in x0 rispetto ad xj .
∂xi
In tal caso, si pone
∂
∂2f
(x0 ) :=
∂xj ∂xi
∂xj
(
∂f
∂xi
)
(x0 ) .
◃ In generale, se f è derivabile parzialmente due volte in x0 rispetto alle
variabili xi ed xj non è detto che lo sia rispetto alle variabili xj ed xi ed
anche quando ciò accade non si può assicurare l’uguaglianza
∂2f
∂2f
(x0 ) =
(x0 ) .
∂xi ∂xj
∂xj ∂xi
◃ Ad esempio, la funzione f : R2 → R definita ponendo, per ogni (x, y) ∈
R2 ,
f (x, y) := |x| + y ,
è derivabile due volte in (0, 0) rispetto alle variabili y ed x, ma non rispetto
alle variabili x ed y in quanto in (0, 0) non esiste la derivata parziale di f
rispetto ad x.
◃ Il seguente risultato garantisce delle condizioni in cui l’ordine di derivazione può essere invece invertito.
Teorema 12.3.8 (Teorema di Schwarz sull’invertibilità dell’ordine
di derivazione)
Siano A un sottoinsieme di Rn , f : A → R una funzione reale ed x0 un
punto interno ad A. Siano i, j = 1, . . . , n e si supponga che
i) Esiste un intorno di x0 in cui esistono le derivate parziali
∂f
,
∂xi
∂f
,
∂xj
∂2f
,
∂xj ∂xi
ii) Le derivate parziali seconde
∂2f
,
∂xj ∂xi
sono continue in x0 .
∂2f
.
∂xi ∂xj
∂2f
.
∂xi ∂xj
370
Capitolo 12: Calcolo differenziale in più variabili
Allora si ha
∂2f
∂2f
(x0 ) =
(x0 ) .
∂xj ∂xi
∂xi ∂xj
◃ In maniera del tutto analoga, si possono definire le derivate di ordine
superiore. Il significato del simbolo
∂3f
(x0 )
∂xk ∂xj ∂xi
è da intendersi come
∂
∂xk
(
∂2f
∂xj ∂xi
)
(x0 ) ,
2
f
supposto che la derivata parziale seconda ∂x∂j ∂x
esista in tutto un intorno
i
del punto x0 .
Se le derivate parziali sono continue, dal Teorema 12.3.8 di Schwarz
segue che non è importante specificare l’ordine in cui si effettuano le derivazioni parziali ma solamente quante volte viene effettuata la derivata parziale
rispetto ad ogni variabile.
A tal fine, risulta molto utile introdurre i multi-indici, che consentono
di esprimere in maniera più sintetica anche derivate di ordine elevato.
Un multi-indice α = (α1 , . . . , αn ) è da intendersi semplicemente come
una n-pla di numeri naturali (quindi, per ogni i = 1, . . . , n, si ha αi ∈ N).
Inoltre, si definisce lunghezza del multi-indice α il seguente numero naturale
|α| := α1 + · · · + αn .
Se f è derivabile parzialmente |α| volte in un punto x0 e se le sue derivate
parziali sono continue in x0 , il simbolo
Dα f (x0 ) ,
∂ |α| f
(x0 )
n
· · · xα
n
1
∂xα
1
denota la derivata parziale di f in x0 fatta α1 volte rispetto alla variabile
x1 , α2 volte rispetto alla variabile x2 e cosı̀via fino ad αn volte rispetto alla
variabile xn .
◃ Anche per le funzioni di più variabili è possibile enunciare un’analogo
della formula di Taylor per le funzioni di una variabile reale.
Conviene tuttavia ricorrere alle potenze simboliche per esprimere tale
formula nel modo più semplice. Per potenza simbolica bisogna intendere
formalmente una potenza del tipo
(
)(h)
∂f
∂f
φ1 (x)
(x0 ) + · · · + φn (x)
(x0 )
∂x1
∂xn
12.3 Derivate direzionali e parziali e differenziabilità
371
dove l’ordine delle potenze è da intendere come ordine delle derivate parziali
da considerare. Quindi, ad esempio,
(
)(3)
∂f
∂f
x
(x0 , y0 ) + y
(x0 , y0 )
∂x
∂y
3
3
∂3f
∂3f
2
2 ∂ f
3 ∂ f
= x3
(x
,
y
)
+
3x
(x
,
y
)
+
3xy
(x
,
y
)
+
y
(x0 , y0 ) .
y
0
0
0
0
0
0
∂x3
∂x2 ∂y
∂x ∂y 2
∂y 3
Con tale notazione, la formula di Taylor può essere enunciata come segue.
Teorema 12.3.9 (Formula di Taylor per funzioni di più variabili)
Siano A un sottoinsieme aperto di Rn ed f : A → R una funzione reale
dotata di tutte le derivate parziali fino all’ordine p + 1 continue in A. Se
x0 = ((x0 )1 , . . . , (x0 )n ) ∈ A e se x = (x1 , . . . , xn ) ∈ A r {x0 } è tale che il
segmento S[x0 , x] di estremi x0 ed x sia contenuto in A, allora esiste almeno
un punto ξ ∈ A, interno al segmento S[x0 , x], tale che
f (x)
(
p
∑
1
∂f
(x0 ) (x1 − (x0 )1 ) + . . .
(12.3.10)
h! ∂x1
h=1
)(h)
∂f
+
(x0 ) (xn − (x0 )n )
∂xn
(
)(p+1)
1
∂f
∂f
+
(ξ) (x1 − (x0 )1 ) + · · · +
(ξ) (xn − (x0 )n )
(p + 1)! ∂x1
∂xn
p
∑ 1
1
= f (x0 ) +
(∇f (x0 )|x − x0 )(h) +
(∇f (ξ)|x − x0 )(p+1) .
h!
(p + 1)!
=
f (x0 ) +
h=1
Se p = 0, il teorema precedente fornisce una generalizzazione del Teorema 9.2.3 di Lagrange al caso delle funzioni di più variabili reali.
Teorema 12.3.10 (Teorema di Lagrange per funzioni di più variabili)
Siano A un sottoinsieme aperto di Rn ed f : A → R una funzione reale dotata di tutte le derivate parziali continue in A. Se x0 = ((x0 )1 , . . . , (x0 )n ) ∈ A
e se x = (x1 , . . . , xn ) ∈ A r {x0 } è tale che il segmento S[x0 , x] di estremi
x0 ed x sia contenuto in A, allora esiste almeno un punto ξ ∈ A, interno al
segmento S[x0 , x], tale che
f (x) − f (x0 )
∂f
∂f
(ξ) (x1 − (x0 )1 ) + · · · +
(ξ) (xn − (x0 )n )
∂x1
∂xn
= (∇f (ξ)|x − x0 ) .
(12.3.11)
=
372
12.3.5
Capitolo 12: Calcolo differenziale in più variabili
Differenziabilità delle funzioni composte
Sia A un sottoinsieme di Rn e sia m ≥ 1. Una funzione f : A → Rk viene
denominata funzione vettoriale di n-variabili reali. Per ogni k = 1, . . . , m,
si può considerare la funzione reale fk : A → R definita ponendo, per ogni
x ∈ A,
fk (x) := (f (x)|ek ) ,
la quale viene denominata componente k-esima della funzione f (ek denota
il vettore k-esimo della base canonica in Rm e (·|·) il prodotto scalare in
Rm ). Dalle proprietà del prodotto scalare segue subito, per ogni x ∈ A,
f (x) := (f1 (x), . . . , fm (x)) ,
e per mettere in evidenza questa circostanza si scrive spesso f = (f1 , . . . , fm ).
Per le funzioni vettoriali possono essere introdotti tutti i concetti visti
per quelle reali attribuendoli ad ogni componente.
Ad esempio, si fissino un sottoinsieme A di Rn ed una funzione vettoriale
f : A → Rm . Se x0 ∈ Rn è un punto di accumulazione per A e se ℓ =
(ℓ1 , . . . , ℓm ) ∈ Rm , si dice che ℓ è il limite di f in x0 e si scrive limx→x0 f (x) =
ℓ se, per ogni k = 1, . . . , m, si ha limx→x0 fk (x) = ℓk (ciò, in effetti, equivale
alla seguente condizione
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A r {x0 } : ∥x − x0 ∥ < δ ⇒ ∥f (x) − ℓ∥ < ε ).
Analogamente, se x0 ∈ A, si dirà che f è continua in x0 se, per ogni
k = 1, . . . , m, la componente k-esima fk di f è continua in x0 (ciò equivale
alla seguente condizione
∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A : ∥x − x0 ∥ < δ ⇒ ∥f (x) − f (x0 )∥ < ε ).
Nello stesso modo, se x0 è interno ad A e se v ∈ Rn è una direzione
di Rn , si dice che f è derivabile in x0 secondo la direzione v se ogni fk ,
k = 1, . . . , m, è derivabile in x0 secondo la direzione v e, in tal caso, si pone
(
)
∂f
∂f1
∂fm
(x0 ) :=
(x0 ), . . . ,
(x0 ) .
∂v
∂v
∂v
Se v = ei , i = 1, . . . , n, la derivata di f in x0 rispetto alla direzione ei viene
∂f
denominata derivata parziale i-esima di f in x0 e denotata con
(x0 );
∂xi
quindi
(
)
∂f1
∂fm
∂f
(x0 ) :=
(x0 ), . . . ,
(x0 ) .
∂xi
∂xi
∂xi
Infine, si dice che f è differenziabile in un punto interno x0 ∈ A se
ogni fk , k = 1, . . . , m, è differenziabile in x0 . In tal caso il differenziale
12.3 Derivate direzionali e parziali e differenziabilità
373
df (x0 ) : Rn → Rm è una funzione lineare da Rn in Rm le cui componenti
sono i differenziali delle funzioni fk ; pertanto
df (x0 ) = (df1 (x0 ), . . . , dfm (x0 )) .
Si supponga che f sia differenziabile in x0 . Allora, si può considerare la
matrice di tipo (m, n)
(
J(f, x0 )
:=
=
=
)
∂fi
(x0 )
i=1,...,m
∂xj
j=1,...,n

∂f1
∂f1
(x )
(x0 ) . . .
 ∂x1 0
∂x
2

 ∂f
∂f2

2
(x0 )
(x0 ) . . .

 ∂x1
∂x2

..
..
..

.
.
.


 ∂f
∂fm
m
(x0 )
(x0 ) . . .
∂x1
∂x

 2
∇f1 (x0 )
 ∇f2 (x0 ) 



 ,
..


.
∇fm (x0 )
(12.3.12)

∂f1
(x0 )

∂xn


∂f2

(x0 ) 

∂xn

..

.



∂fm
(x0 )
∂xn
la quale viene denominata matrice jacobiana di f in x0 . Se m = n, il suo
determinante det J(f, x0 ) viene denominato determinante jacobiano di f in
x0 e denotato con
∂(f1 , . . . , fn )
(x0 ) .
∂(x1 , . . . , xn )
Dall’espressione del differenziale si ricava in maniera immediata, per ogni
x = (x1 , . . . , xn ) ∈ Rn ,4


n
n
∑
∑
∂f1
∂fm
df (x0 )(x) = J(f, x0 ) · x = 
(x0 ) xj , . . . ,
(x0 ) xj  .
∂x
∂xj
j
j=1
j=1
Inoltre, vale il seguente importante risultato sulla differenziabilità delle
funzioni composte.
4 L’elemento x ∈ Rn può essere identificato all’occorrenza sia con una matrice di tipo
(1, n) che di tipo (n, 1), come nel caso in esame; il prodotto tra matrici fornisce in questo
caso una matrice di tipo (m, 1) che si può identificare a sua volta con un elemento di Rm .
Capitolo 12: Calcolo differenziale in più variabili
374
Teorema 12.3.11 (Differenziabilità delle funzioni composte)
Siano A un sottoinsieme di Rn , B un sottoinsieme di Rm ed f : A → Rm
e g : B → Rp tali che f (A) ⊂ B. Sia x0 ∈ A un punto interno ad A e
si supponga che f sia differenziabile in x0 e inoltre, posto y0 := f (x0 ), si
supponga che y0 sia un punto interno a B e che g sia differenziabile in y0 .
Allora, la funzione composta g ◦ f : A → Rp è differenziabile in x0 e si ha
J(g ◦ f ) = J(g, y0 ) · J(f, x0 ) .
(12.3.13)
In particolare, per ogni h = 1, . . . , p e per ogni i = 1, . . . , n, risulta
∑ ∂gh
∂(g ◦ f )h
∂fj
(x0 ) =
(y0 )
(x0 ) .
∂xi
∂y
∂xi
j
j=1
m
◃ In particolare, si consideri una funzione φ : I → Rn definita in un
intervallo aperto I e derivabile in un punto t0 ∈ I e siano A un sottoinsieme
aperto di Rn tale che φ(I) ⊂ A ed f : A → R una funzione differenziabile
in x0 := φ(t0 ). Allora, la funzione composta f ◦ φ : I → R è derivabile in t0
e si ha
n
∑
∂f
(f ◦ φ)′ (t0 ) =
(x0 ) φ′j (t0 ) = (∇f (x0 )|φ′ (t0 )) ,
∂x
j
j=1
dove, per ogni j = 1, . . . , n, φj denota la componente j-esima della funzione
vettoriale φ.
12.4
Punti di massimo e minimo relativo
Sia f : A → R una funzione reale definita in un sottoinsieme A di Rn . Si
dice che un elemento x0 ∈ A è un punto di massimo (rispettivamente, di
minimo) relativo per f se è verificata la seguente condizione
∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) : f (x) ≤ f (x0 )
(12.4.1)
(rispettivamente, ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) : f (x0 ) ≤ f (x) ).
Se nella condizione precedente si suppone che valga una diseguaglianza stretta per ogni x ∈ A ∩ Bδ (x0 ) r {x0 }, allora il punto di massimo
(rispettivamente, di minimo) viene denominato proprio.
Una prima condizione necessaria viene indicata dalla seguente proposizione.
Proposizione 12.4.1 (Prima condizione necessaria per punti di massimo e minimo relativo per funzioni di più variabili)
12.4 Punti di massimo e minimo relativo
375
Siano A un sottoinsieme di Rn , f : A → R una funzione reale ed x0 un punto interno ad A. Se x0 è un punto di massimo (rispettivamente, di minimo)
relativo per f e se f è differenziabile in x0 , allora si ha
∀ i = 1, . . . , n :
∂f
(x0 ) = 0 .
∂xi
(12.4.2)
Dimostrazione. Sia i = 1, . . . , n e si consideri la funzione fx0 ,ei : Ix0 ,ei → R prevista
nella Definizione 12.3.1. Poiché f è differenziabile in x0 , essa è derivabile parzialmente
rispetto alla variabile xi in x0 ; pertanto, la funzione fx0 ,ei è derivabile in 0 e poiché
0 è un punto di massimo (rispettivamente, di minimo) relativo per fx0 ,ei , deve essere
fx′ 0 ,ei (0) = 0, da cui
∂f
(x0 ) = fx′ 0 ,ei (0) = 0 .
∂xi
Nelle ipotesi delle Proposizione 12.4.1, si deve avere df (x0 ) = 0.
Se f : A → R è una funzione reale definita in un sottoinsieme A di Rn ,
un punto interno x0 ∈ viene denominato punto stazionario per f se f è
differenziabile in x0 e df (x0 ) = 0.
Dalla Proposizione 12.4.1 precedente, si ricava che i punti di massimo e di minimo relativo interni in cui la funzione è differenziabile sono
necessariamente punti stazionari per la funzione.
Può comunque accadere che un punto stazionario x0 non risulti né
di massimo né di minimo relativo per f . In tal caso il punto x0 viene
denominato punto di sella per f .
La proposizione precedente suggerisce il seguente metodo per la ricerca
dei punti di massimo e di minimo relativo.
Osservazione 12.4.2 (Ricerca dei punti di massimo e minimo relativo per funzioni di più variabili)
Sia f : A → R una funzione reale definita in un sottoinsieme A di Rn . Allora
i punti di massimo e di minimo relativo per f vanno ricercati tra:
1. I punti interni stazionari per f ; tali punti si ottengono considerando
il sistema di n equazioni

∂f


(x1 , . . . , x1 ) = 0 ,


∂x1






 ∂f (x1 , . . . , x2 ) = 0 ,
∂x1

..


.






∂f


(x1 , . . . , xn ) = 0 ,
∂x1
376
Capitolo 12: Calcolo differenziale in più variabili
nelle incognite x1 , . . . , xn . Ogni soluzione di tale sistema richiede poi
un’ulteriore indagine per verificare che si tratti effettivamente di un
punto di massimo o di minimo relativo per f oppure di un punto di
sella (si vedano le condizioni necessarie e sufficienti successive).
2. I punti interni in cui la funzione non è differenziabile. Tali punti
richiedono un’analisi diretta caso per caso atta a verificare se si tratta
o meno di punti di massimo o minimo relativo per f .
3. I punti sulla frontiera. La ricerca dei punti di massimo e di minimo
relativo sulla frontiera può essere in parte ricondotta allo studio dei
massimi e minimi vincolati per f ; bisogna tuttavia tener presente che
un massimo o un minimo relativo della restrizione di f alla frontiera
di A potrebbe non essere un punto di massimo o di minimo relativo
per f .
Nel seguito della presente sezione si approfondisce l’analisi dei punti di
massimo e minimo relativo considerati al punto 1. dell’Osservazione 12.4.2.
Si consideri una funzione f : A → R definita in un sottoinsieme A di Rn
e sia x0 un punto interno di A in cui f è dotata di tutte le derivate parziali
seconde continue. Allora si può considerare la matrice jacobiana J(∇f, x0 )
del gradiente di f in x0 . Tale matrice viene denominata matrice hessiana
di f in x0 e denotata con il simbolo H(f, x0 ).
Più esplicitamente, si ha
(
)
∂2f
H(f, x0 ) := J(∇f, x0 ) =
(x0 )
(12.4.3)
∂xi ∂xj
i,j=1,...,n


∂2f
∂2f
∂2f
(x0 )
(x0 ) . . .
(x0 ) 

∂x21
∂x1 ∂x2
∂x1 ∂xn




2
2
2


∂ f
∂ f
∂ f


(x
)
.
.
.
(x
)
(x
)
0
0 
2
 ∂x1 ∂x2 0
∂x2
∂x2 ∂xn
=
 .


..
..
..
.
.


.
.
.
.




2
2
2


∂ f
∂ f
∂ f
(x
)
(x0 )
(x0 ) . . .
0
2
∂x1 ∂xn
∂x2 ∂xn
∂xn
Si osserva che la matrice hessiana è una matrice quadrata di ordine n
simmetrica (per il Teorema 12.3.8 di Schwarz).
Per ogni k = 1, . . . , n, il minore principale5 di H(f, x0 ) di ordine k viene
denominato minore hessiano di ordine k di f in x0 e denotato con Hk (f, x0 ).
5 Si ricorda che se M := (a )
ij i,j=1,...,n è una matrice quadrata di ordine n e se
k = 1, . . . , n, viene denominato minore principale di ordine k di M il determinante Mk
della matrice Mk := (aij )i,j=1,...,k che si ottiene da M considerando le prime k righe e
12.4 Punti di massimo e minimo relativo
377
In particolare, Hn (f, x0 ) (cioè, il determinante della matrice hessiana di f
in x0 ) viene denominato hessiano di f in x0 e denotato con H(f, x0 ).
In tutte le notazioni assunte sopra la funzione f può essere omessa se
ciò non dà luogo ad equivoci; pertanto la matrice hessiana, i minori hessiani
e l’hessiano possono essere rispettivamente denotati con H(x0 ), Hk (x0 ) ed
H(x0 ).
La matrice hessiana consente di stabilire le seguenti ulteriori condizioni
per massimi e minimi relativi.
Proposizione 12.4.3 (Seconda condizione necessaria per punti di
massimo e minimo relativo per funzioni di più variabili)
Siano A un sottoinsieme di Rn , f : A → R una funzione reale ed x0 un punto
interno ad A. Si supponga che f sia derivabile parzialmente due volte in x0
rispetto a tutte le variabili; se x0 è un punto di massimo (rispettivamente,
di minimo) relativo per f , allora si ha
∀ k = 1, . . . , n : (−1)k Hk (f, x0 ) ≥ 0 ,
(12.4.4)
(rispettivamente, ∀ k = 1, . . . , n : Hk (f, x0 ) ≥ 0 ).
Teorema 12.4.4 (Condizione sufficiente per punti di massimo e minimo relativo per funzioni di più variabili)
Siano A un sottoinsieme di Rn , f : A → R una funzione reale, x0 un punto
interno ad A e si supponga che f sia derivabile parzialmente due volte in
x0 rispetto a tutte le variabili.
Se sono soddisfatte le seguenti condizioni
i) per ogni i = 1, . . . , n:
∂f
(x0 ) = 0,
∂xi
ii) per ogni k = 1, . . . , n: (−1)k Hk (f, x0 ) > 0
(rispettivamente, per ogni k = 1, . . . , n: Hk (f, x0 ) > 0),
allora x0 è un punto di massimo (rispettivamente, di minimo) relativo
proprio per f .
Osservazione 12.4.5 Si supponga che A sia un sottoinsieme di R2 e che
f : A → R sia una funzione di 2 variabili reali dotata delle derivate parziali
seconde in un punto stazionario interno (x0 , y0 ) di A. Tenendo conto delle
le prime k colonne; quindi
Mk :=
a11
..
.
ak1
...
..
.
...
a1k
..
.
akk
.
Capitolo 12: Calcolo differenziale in più variabili
378
condizioni necessarie e di quelle sufficienti ottenute nei risultati precedenti
si ha quanto segue
1. Se H(x0 , y0 ) > 0, il punto è necessariamente di massimo oppure di
minimo relativo proprio per f . Infatti, si osserva che le derivate par∂2f
∂2f
ziali
(x0 ) e
(x0 ) devono essere necessariamente diverse da 0
2
∂x
∂y 2
ed avere lo stesso segno altrimenti si avrebbe
H(x0 , y0 ) =
∂2f
∂2f
(x
)
(x0 ) −
0
∂x2
∂y 2
(
∂2f
(x0 )
∂x ∂y
)2
≤0.
Pertanto, tenendo conto del Teorema 12.4.4, si ha in questo caso che
∂2f
(x0 , y0 ) è un punto di massimo relativo proprio per f se
(x0 ) < 0
∂x2
2
∂ f
(o equivalentemente
(x0 ) < 0) ed è un punto di minimo relativo
∂y 2
∂2f
∂2f
proprio per f se
(x0 ) > 0 (o equivalentemente
(x0 ) > 0).
2
∂x
∂y 2
2. Se H(x0 , y0 ) = 0, è soddisfatta in ogni caso la condizione necessaria
fornita dalla Proposizione 12.4.3 ma non la condizione sufficiente del
Teorema 12.4.4. Quindi in questo caso non si può dire nulla e bisogna
ricorrere ad altri strumenti per determinare se (x0 , y0 ) è oppure meno
un punto di massimo o di minimo relativo per f .
3. Se H(x0 , y0 ) < 0, la condizione necessaria fornita dalla Proposizione
12.4.3 non è soddisfatta e quindi (x0 , y0 ) non può essere né un punto
di massimo né un punto di minimo relativo per f . Quindi (x0 , y0 ) è
un punto di sella per f .
12.5
Massimo e minimo assoluto
Una volta determinati i punti di massimo e minimo relativo può essere
discussa anche l’eventuale esistenza del massimo e del minimo assoluto della
funzione. Se la funzione in esame è definita e continua in un insieme chiuso e
limitato essa è sicuramente dotata di minimo e di massimo (assoluto) per il
Teorema 12.2.3 di Weierstrass, e in tal caso il massimo ed il minimo assoluto
possono essere ottenuti confrontando i valori della funzione in tutti i punti
di massimo o di minimo relativo.
Nei casi in cui non è possibile garantire l’esistenza del massimo e del
minimo assoluto, si procede come segue:
12.5 Massimo e minimo assoluto
379
Osservazione 12.5.1 (Ricerca dei punti di massimo e minimo assoluto per funzioni di più variabili)
Sia f : A → R una funzione reale definita in un sottoinsieme A di Rn . Allora
si procede come segue:
1. Si determinano i punti di massimo e di minimo relativo per f come
previsto nell’Osservazione 12.4.2 ed in ognuno di tali punti si calcola il
valore della funzione. Conviene tener presente che in questo caso non
è necessario stabilire se i punti ottenuti dall’Osservazione 12.4.2 siano
effettivamente punti di massimo o minimo relativo per f in quanto
si è interessati solamente al confronto dei valori della funzione in tali
punti. In particolare, non è necessario condurre l’analisi sui minore
della matrice hessiana nei punti stazionari interni.
2. Potrebbe a questo punto accadere che non esiste il più grande (o il più
piccolo) valore della funzione nei punti cosı̀ottenuti6 e in tal caso si
potrà concludere che il massimo assoluto (o il minimo assoluto) della
funzione non esiste in quanto i punti di massimo o minimo assoluto
sono necessariamente anche punti di massimo o minimo relativo.
Se, invece, esiste il valore più grande Mf ∈ R (oppure più piccolo
mf ∈ R) nei punti ottenuti, esso potrebbe essere il massimo (oppure
il minimo) assoluto della funzione ed i punti in cui esso viene assunto
potrebbero cosı̀essere i punti di massimo (o minimo) assoluto della
funzione.
3. Si confronta Mf (oppure mf ) con il comportamento della funzione
nei punti in cui essa è definita ma non è continua oppure i punti di
accumulazione in cui la funzione non è definita. Tale comportamento
viene studiato considerando il limite della funzione oppure, nel caso
in cui esso non esista, considerando il limite minimo e quello massimo. Se in uno di tali punti il valore del limite o del limite massimo è
strettamente maggiore di Mf , si conclude che f non è dotata di massimo assoluto, mentre se accade che in ognuno di tali punti il limite
o il limite massimo è minore o uguale di Mf , allora Mf è il massimo
assoluto della funzione. Analogamente, se in uno dei punti considerati
il valore del limite o del limite minimo è strettamente minore di mf ,
si conclude che f non è dotata di minimo assoluto, mentre se accade
che in ognuno di tali punti il limite o il limite minimo è maggiore o
uguale di mf , allora mf è il minimo assoluto della funzione.
6 Ad esempio, basta considerare la funzione f : R2 → R definita ponendo, per ogni
(x, y) ∈ R2 , f (x, y) := x + sin x − y + sin y. I punti stazionari sono (π + 2hπ, 2kπ) con
h, k ∈ Z e in tali punti la funzioni assume il valore f (π + 2hπ, 2kπ) = π + 2(h − k)π.
L’insieme di tali valori costituisce un insieme non limitato superiormente né inferiormente.
380
12.6
Capitolo 12: Calcolo differenziale in più variabili
Massimi e minimi vincolati
Sia assegnata una funzione f : A → R definita in un sottoinsieme A di Rn .
Si vogliono ora studiare i massimi ed i minimi relativi di f non in tutto
l’insieme A ma in un particolare sottoinsieme di A i cui punti soddisfano
l’equazione di un vincolo, ad esempio F (x) = 0 con F : B → R e B ⊂ Rn .
Si è pertanto interessati a determinare i massimi e minimi relativi di f|V
dove V := A ∩ {x ∈ B | F (x) = 0}. Tali punti vengono denominati di
massimo e minimo vincolato per f .
Nel caso in cui sia possibile esplicitare una delle variabili dell’equazione F (x1 , . . . , xn ) = 0 in funzione delle altre (cioè risolvere l’equazione
rispetto ad una delle variabili si ottiene F (x1 , . . . , xn ) = 0 se e solo se
xi = φ(x1 , . . . , xi−1 , xi+1 , . . . , xn ) e quindi il problema posto equivale a
determinare massimi e minimi relativi della funzione di n − 1 variabili
g(x1 , . . . , xi−1 , xi+1 , . . . , xn )
= f (x1 , . . . , xi−1 , φ(x1 , . . . , xi−1 , xi+1 , . . . , xn ), xi+1 , . . . , xn ) .
◃ Ad esempio, si supponga di voler studiare i massimi e minimi vincolati
della funzione
f (x, y) := x(x − y 2 ) ,
(x, y) ∈ R2 ,
sottoposti al vincolo F (x, y) := x2 − y 2 .
Dall’equazione F (x, y) = 0 si ottiene y = ±x e quindi basta studiare
massimi e minimi relativi delle funzioni di una variabile
g+ (x) := f (x, x) = x(x−x2 ) = x2 (1−x) ,
g− (x) := f (x, −x) = x2 (1−x) ;
pur essendo g+ = g− , esse forniscono punti distinti di massimo e di minimo
relativo per f . Infatti, la funzione g+ ammette un massimo relativo in 0 ed
un minimo relativo in 2/3; segue che f ha un massimo vincolato in (0, 0) e
due minimi vincolati nei punti (2/3, ±2/3), relativi alle funzioni g+ e g− .
Si supponga ora che non sia possibile scrivere l’equazione del vincolo in
forma esplicita. In questo caso si può ricorrere al metodo dei moltiplicatori
di Lagrange.
Tale metodo consiste nel considerare una funzione ausiliaria che dipende
da n + 1 variabili come di seguito specificato. Si supponga assegnata una
funzione f : A → R definita in un sottoinsieme A di Rn e l’equazione di
un vincolo F (x) = 0 con F : B → R e B ⊂ Rn . Si consideri la funzione
g : (A ∩ B) × R → R definita ponendo, per ogni (x, λ) = (x1 , . . . , xn , λ) ∈
(A ∩ B) × R,
g(x, λ) := f (x) + λ F (x) .
12.6 Massimi e minimi vincolati
381
Si può dimostrare che se (x0 , λ0 ) ∈ (A ∩ B) × R è un punto di massimo
(oppure di minimo) relativo per g, allora x0 è un punto di massimo (oppure
di minimo) vincolato per f .
Conseguentemente, per determinare i punti di massimo e di minimo
vincolato, si possono studiare i punti stazionari di g che sono forniti dalle
soluzioni del sistema di n + 1 equazioni in n + 1 incognite

















∂f
∂F
∂g
(x1 , . . . , xn , λ) =
(x1 , . . . , xn ) + λ
(x1 , . . . , xn ) = 0 ,
∂x1
∂x1
∂x1
∂g
∂f
∂F
(x1 , . . . , xn , λ) =
(x1 , . . . , xn ) + λ
(x1 , . . . , xn ) = 0 ,
∂x2
∂x2
∂x2
..
.




∂g
∂f
∂F



(x1 , . . . , xn , λ) =
(x1 , . . . , xn ) + λ
(x1 , . . . , xn ) = 0 ,


∂x
∂x
∂x
n
n
n






 ∂g (x1 , . . . , xn , λ) = F (x1 , . . . , xn ) = 0 .
∂λ
Si osservi che l’ultima equazione del sistema precedente fornisce proprio
l’equazione del vincolo.
◃ Se vi sono più vincoli, la funzione F può essere supposta vettoriale
a valori in Rm con m < n. In questo caso il metodo dei moltiplicatori
di Lagrange è analogo al caso precedente aggiungendo tuttavia una nuova
variabile per ogni componente di F .
Precisamente, si supponga assegnata una funzione f : A → R definita in
un sottoinsieme A di Rn e l’equazione di un vincolo F (x) = 0 con F : B →
Rm con B ⊂ Rn ed m < n. Si consideri la funzione g : (A ∩ B) × Rm → R
definita ponendo, per ogni (x, λ) = (x1 , . . . , xn , λ1 , . . . , λm ) ∈ (A ∩ B) × Rm ,
g(x, λ) := f (x) + λ1 F (x) + · · · + λm Fm (x) .
Anche in questo caso si può dimostrare che se (x0 , λ0 ) ∈ (A ∩ B) × Rm è un
punto di massimo (oppure di minimo) relativo per g, allora x0 è un punto
di massimo (oppure di minimo) vincolato per f .
I punti stazionari di g sono forniti in questo caso dalle soluzioni del
382
Capitolo 12: Calcolo differenziale in più variabili
sistema di n + m equazioni in n + m incognite

∂f
∂F1
∂g


(x1 , . . . , xn , λ1 , . . . , λm ) =
(x1 , . . . , xn ) + λ1
(x1 , . . . , xn )


∂x1
∂x1
∂x1



∂Fm


+ · · · + λm
(x1 , . . . , xn ) = 0 ,



∂x1





∂g
∂f
∂F1


(x1 , . . . , xn , λ1 , . . . , λm ) =
(x1 , . . . , xn ) + λ1
(x1 , . . . , xn )


∂x
∂x
∂x2

2
2


∂Fm



+ · · · + λm
(x1 , . . . , xn ) = 0 ,


∂x2




 ...





 ∂g
∂f
∂F1
(x1 , . . . , xn , λ1 , . . . , λm ) =
(x1 , . . . , xn ) + λ1
(x1 , . . . , xn )
∂x
∂x
∂x
n
n
n



∂Fm


+ · · · + λm
(x1 , . . . , xn ) = 0 ,


∂xn





∂g



(x1 , . . . , xn , λ1 , . . . , λm ) = F1 (x1 , . . . , xn ) = 0 ,


∂λ1





∂g


(x1 , . . . , xn , λ1 , . . . , λm ) = F2 (x1 , . . . , xn ) = 0 ,



∂λ
2



..


.






∂g


(x1 , . . . , xn , λ1 , . . . , λm ) = Fm (x1 , . . . , xn ) = 0 .
∂λm
Si osservi che le ultime m equazioni del sistema precedente forniscono proprio l’equazione del vincolo F (x) = 0.
Capitolo 13
L’integrale di Riemann in
Rn
13.1
Cenni sulla teoria della misura di PeanoJordan in Rn
La teoria della misura di Peano-Jordan, sulla quale si fonda quella dell’integrazione di Riemann, ha il vantaggio di essere basata su semplici proprietà geometriche ed inoltre la teoria dell’integrazione da essa dedotta sarà
sufficiente per il tipo di funzioni di cui si vuole considerare l’integrale.
Si parte dal caso elementare della misura di un intervallo. Sia I = [a, b]
un intervallo di estremi a e b in Rn , con a = (a1 , . . . , an ) e b = (b1 , . . . , bn )
tali che ai ≤ bi per ogni i = 1, . . . , n.
Allora, tenendo conto dell’ovvio significato geometrico nei casi n = 2 ed
n = 3, risulta naturale porre in generale
m(I) :=
n
∏
(bi − ai ) .
i=1
Poiché la misura è nulla se i due punti hanno una delle coordinate uguali, tale
misura rimane immutata se si considera un intervallo aperto (o semiaperto)
anziché un intervallo chiuso.
Si passa ora a considerare la misura di un plurintervallo di Rn . Innanzitutto si precisa che un plurintervallo di Rn è unione di un numero finito
di intervalli di Rn . Quindi P ⊂ Rn è un plurintervallo di Rn se esistono un
Capitolo 13: L’integrale di Riemann in Rn
384
numero finito di intervalli I1 , . . . , Im tali che
P =
m
∪
Ij .
j=1
Per brevità, l’insieme dei plurintervalli di Rn verrà denotato nel seguito
con il simbolo P.
Se, inoltre, è possibile scegliere gli intervalli I1 , . . . , Im tutti chiusi (rispettivamente, aperti oppure semiaperti) allora anche il plurintervallo viene
denominato chiuso (rispettivamente (aperto, semiaperto).
Una proprietà importante dei plurintervalli è messa in evidenza della
seguente proposizione.
Proposizione 13.1.1 Sia P un plurintervallo di Rn . Allora esistono un
numero finito I1 , . . . , Im di intervalli di Rn tali che
◦
1. per ogni j = 1, . . . , m: I j ̸= ∅;
◦
◦
2. per ogni j, k = 1, . . . , m, j ̸= k: I j ∩ I k = ∅;
3. P =
m
∪
Ij .
j=1
Inoltre, se P è un plurintervallo chiuso (rispettivamente, semiaperto), allora
gli intervalli I1 , . . . , Im possono essere considerati anch’essi chiusi (rispettivamente, semiaperti).
Quindi, ogni plurintervallo P si può esprimere come unione di un numero
finito I1 , . . . , Im di intervalli non vuoti e con interni a due a due disgiunti.
Tale proprietà consente anche per i plurintervalli di definire la misura in
maniera naturale, ponendo
m(P ) :=
m
∑
m(Ij ) .
j=1
A questo punto si vuole studiare la misurabilità di un arbitrario sottoinsieme A di Rn .
Si supponga in una prima fase che A sia limitato e dotato di punti
interni. Tali ipotesi consentono rispettivamente di affermare che esistono
sia un intervallo che contiene A sia un intervallo contenuto in A e quindi i
seguenti insiemi sono non vuoti:
Pe (A) :=
{P ∈ P | A ⊂ P } ,
Pi (A) :=
{P ∈ P | P ⊂ A} .
13.1 Cenni sulla teoria della misura di Peano-Jordan in Rn 385
Risulta ovviamente
∀ P1 ∈ Pi (A), ∀ P2 ∈ Pe (A) : m(P1 ) ≤ m(P2 ) ,
e quindi l’insieme delle misure dei plurintervalli contenuti in A è limitato
superiormente e quello delle misure dei plurintervalli contenenti A è limitato
inferiormente. Ha senso quindi porre
mi (A) :=
sup
P1 ∈Pi (A)
m(P1 ) ,
me (A) :=
inf
P2 ∈Pe (A)
m(P2 ) .
Il numero mi (A) viene denominato misura interna secondo Peano-Jordan
di A, mentre il numero me (A) viene denominato misura esterna secondo
Peano-Jordan di A. Dalle definizioni assunte, segue subito
mi (A) ≤ me (A) .
Nel caso in cui valga l’uguaglianza mi (A) = me (A), l’insieme A viene detto
misurabile secondo Peano-Jordan e in tal caso la sua misura m(A) viene
definita ponendo
m(A) = mi (A) = me (A) .
◃ Ad esempio, si consideri l’insieme
B := {x = (x1 , . . . , xn ) ∈ [0, 1]n | x1 , . . . , xn ∈ Q}
e si definisca l’insieme A = B ∪ ([1, 2] × [0, 1]n−1 ). Ovviamente, l’intervallo
I1 := [1, 2] × [0, 1]n−1 ha misura 1, mentre l’intervallo I2 := [0, 2] × [0, 1]n−1
ha misura 2 ed inoltre ogni plurintervallo P1 ∈ Pi (A) è contenuto in I1
mentre ogni intervallo P2 ∈ Pe (A) contiene I2 . Conseguentemente
mi (A) = m(I1 ) = 1 ,
me (A) = m(I2 ) = 2
e quindi A non è misurabile secondo Peano-Jordan.
◃ Come ulteriore esempio, si consideri una funzione f : [a, b] → R positiva
e limitata in un intervallo chiuso e limitato [a, b]. Si ricorda che il trapezoide
di f è il seguente sottoinsieme
T (f ) := {(x, y) ∈ R2 | x ∈ [a, b] , 0 ≤ y ≤ f (x)}
di R2 (vedasi la Sezione 10.1.3 a pag. 278).
Fissata una suddivisione P ∈ Σ([a, b]) di [a, b], la somma superiore
S(f, P ) di f relativa a P rappresenta l’area di un plurintervallo contenente
T (f ), mentre la somma inferiore s(f, P ) di f relativa a P rappresenta l’area
di un plurintervallo contenuto in T (f ).
Capitolo 13: L’integrale di Riemann in Rn
386
Allora si ha
∫ b
f (x) dx =
a
e analogamente
∫ b
f (x) dx =
a
inf
S(f, P ) =
sup
s(f, P ) =
P ∈Σ([a,b])
P ∈Σ([a,b])
inf
m(P ) = me (T (f ))
sup
m(P ) = mi (T (f )).
P ∈Pe (T (f ))
P ∈Pi (T (f ))
Si deduce, come annunciato nella Sezione 10.1.3, che f è integrabile secondo
Riemann se e solo se il trapezoide T (f ) è un sottoinsieme di R2 misurabile
secondo Peano-Jordan e, in tal caso, si ha anche
∫ b
f (x) dx = m(T (f )) .
a
◃ Un’utile caratterizzazione degli insiemi misurabili viene fornita dalla
proposizione seguente.
Proposizione 13.1.2 (Criterio di misurabilità mediante plurintervalli)
Sia A ⊂ Rn limitato e dotato di punti interni. Allora le seguenti proposizioni
sono equivalenti:
a) A è misurabile secondo Peano-Jordan;
b) ∀ ε > 0 ∃ P1 ∈ Pi (A), ∃ P2 ∈ Pe (A) t.c. m(P2 ) − m(P1 ) < ε;
b) ∀ ε > 0 ∃ P ∈ P t.c. Fr(A) ⊂ P , m(P ) < ε.
◃ Si supponga ora che A ⊂ Rn sia limitato ma privo di punti interni.
In tal caso, esso viene definito misurabile se la sua misura esterna secondo
Peano-Jordan è nulla; in tal caso, si pone m(A) = 0. Quindi un sottoinsieme
limitato A di Rn privo di punti interni è misurabile se e solo se verifica la
seguente condizione
∀ ε > 0 ∃ P ∈ P t.c. A ⊂ P , m(P ) < ε .
Dalla caratterizzazione fornita nella Proposizione 13.1.2 si ricava che un
sottoinsieme A ⊂ Rn limitato e dotato di punti interni è misurabile se e solo
se la sua frontiera è misurabile ed ha misura nulla.
◃ Si supponga infine che A sia un sottoinsieme non limitato di Rn . si dice
che A è misurabile secondo Peano-Jordan se sono soddisfatte le seguenti
condizioni:
13.1 Cenni sulla teoria della misura di Peano-Jordan in Rn 387
i) Per ogni r > 0: A ∩ Br (0) è misurabile;
ii) sup m(A ∩ Br (0)) < +∞.
r>0
In tal caso, si pone
m(A) := sup m(A ∩ Br (0))
r>0
(= lim m(A ∩ Br (0))) .
r→+∞
Ovviamente, anziché le sfere Br (0) con centro l’origine si può considerare
una qualsiasi famiglia crescente (Ar )r>0 di sottoinsiemi misurabili di Rn la
cui unione sia uguale a tutto Rn .
◃ Ad esempio, si consideri il sottoinsieme di R2 (vedasi la Figura 13.1)
{
}
1
2
Ap := (x, y) ∈ R | x ≥ 1 , 0 ≤ y ≤ p .
x
y
1
Ap
0
x
1
Figura 13.1: Esempio di insieme misurabile illimitato.
Per ogni r > 1, l’insieme A ∩ [−r, r]2 risulta ovviamente misurabile e
inoltre
 1−p
−1

∫ r
 r
,
p ̸= 1 ,
1
2
1−p
m(A ∩ [−r, r] ) =
dx =
p

1 x

log r ,
p=1.
Poiché
lim m(A ∩ [−r, r] ) =
n
r→+∞



1
,
p−1

 +∞ ,
p>1,
p≤1,
si conclude che Ap è misurabile se e solo se p > 1 e, in tal caso, si ha
m(Ap ) = 1/(p − 1).
Capitolo 13: L’integrale di Riemann in Rn
388
Cenni sull’integrale di Riemann in Rn
13.2
Sia A un sottoinsieme misurabile e limitato di Rn . Si definisce suddivisione
di A una successione finita P = (Ai )i=1,...,m di sottoinsiemi di Rn tali che
1. per ogni i = 1, . . . , m: Ai è non vuoto e misurabile;
◦
◦
2. per ogni i, j = 1, . . . , m, i ̸= j: Ai ∩ Aj = ∅ (i sottoinsiemi Ai ,
i = 1, . . . , m, hanno a due a due interni disgiunti);
3. A =
m
∪
Ai .
i=1
Inoltre, il numero
|P | := max m(Ai )
i=1,...,m
viene denominato ampiezza della suddivisione P .
L’insieme di tutte le suddivisioni di A viene denotato con Σ(A).
◃ Si riconosce facilmente che, fissato ε > 0, esiste sempre una suddivisione
di ampiezza minore o uguale ad ε.
Infatti, posto δ := ε1/n , per ogni r := (r1 , . . . , rn ) ∈ Zn , si può considerare l’intervallo
n
∏
Ir :=
[ri , ri + δ] .
i=1
Poiché A è limitato, solamente un numero finito di tali intervalli hanno
intersezione non vuota con A; denotati con I1 , . . . , Im tali intervalli e posto,
per ogni j = 1, . . . , m, Aj := Ij ∩ A, si verifica facilmente che la successione
finita P = (Ai )i=1,...,m è una suddivisione di A. Inoltre, per ogni j =
1, . . . , m, m(Aj ) ≤ m(Ij ) = δ n = ε da cui |P | ≤ ε.
◃ Sia A un sottoinsieme misurabile e limitato di Rn e si consideri una
funzione limitata f : A → R.
Se P = (Ai )i=1,...,m è una suddivisione di A, posto
∀ i = 1, . . . , m :
Mi := sup f (x) ,
mi := inf f (x) ,
x∈Ai
x∈Ai
si possono definire la somma superiore S(f, P ) e la somma inferiore s(f, P )
di f relativa a P nel modo seguente
S(f, P ) :=
m
∑
i=1
Mi m(Ai ) ,
s(f, P ) :=
m
∑
i=1
mi m(Ai ) .
13.2 Cenni sull’integrale di Riemann in Rn
389
Comunque si considerino due suddivisioni P1 , P2 ∈ Σ(A), risulta
s(f, P1 ) ≤ S(f, P2 ) .
Pertanto il sottoinsieme di R
S(f ) := {S(f, P2 ) | P2 ∈ Σ(A)}
costituito da tutte le somme superiori di f è limitato inferiormente; l’estremo
inferiore di tale sottoinsieme viene denominato integrale superiore di f in A
e denotato con uno dei simboli
∫
∫
∫
∫
f,
f (x) dx ,
···
f (x1 , . . . , xn ) dx1 · · · dxn .
A
A
A
Pertanto, l’integrale superiore di f è l’estremo inferiore delle somme superiori di f e soddisfa la seguente condizione, per ogni P1 ∈ Σ(A)
∫
s(f, P1 ) ≤
f.
A
Da ciò segue che il sottoinsieme di R
s(f ) := {s(f, P ) | P ∈ Σ(A)}
costituito da tutte le somme inferiori di f è limitato superiormente ed il suo
estremo superiore viene denominato integrale inferiore di f in A e denotato
con uno dei simboli
∫
∫
∫
∫
f,
f (x) dx ,
· · · f (x1 , . . . , xn ) dx1 · · · dxn .
A
A
A
Quindi l’integrale inferiore di f è l’estremo superiore delle somme inferiori
di f ; ma l’integrale superiore è un maggiorante delle somme inferiori e da
ciò si ottiene
∫
∫
f≤ f.
A
A
In generale, non ci si può aspettare che nella formula precedente valga
un’uguaglianza; per riconoscere ciò si può ricorrere ad esempi analoghi alla
funzione di Dirichlet considerata in una variabile, definendo ad esempio la
funzione d : [0, 1]n → R ponendo, per ogni x = (x1 , . . . , xn ) ∈ [0, 1]n ,
{
1,
∀ i = 1, . . . , n : xi ∈ [0, 1] ∩ Q ,
d(x) :=
0,
∃ i = 1, . . . , n t.c. xi ∈ [0, 1] ∩ (R r Q) .
Capitolo 13: L’integrale di Riemann in Rn
390
Si riconosce allora che, per ogni suddivisione P ∈ Σ(A), risulta
S(d, P ) = 1 ,
e conseguentemente
∫
s(d, P ) = 0 ,
∫
d=0,
d=1.
A
A
Definizione 13.2.1 Sia A un sottoinsieme misurabile e limitato di Rn e
sia f : A → R una funzione limitata. Si dice che f è integrabile secondo
Riemann in A se l’integrale superiore di f coincide con l’integrale inferiore
di f
∫
∫
f=
A
f.
A
In tal caso il valore comune dell’integrale superiore ed inferiore di f viene
denominato integrale (multiplo) di f e denotato con uno dei seguenti simboli
∫
∫
∫
∫
f,
f (x) dx ,
···
f (x1 , . . . , xn ) dx1 · · · dxn .
A
A
A
L’insieme delle funzioni f : A → R integrabili secondo Riemann in A
viene denotato con il simbolo R(A).
La definizione adottata generalizza in modo naturale quella già vista per
le funzioni di una variabile.
Sussiste anche un criterio di integrabilità mediante suddivisioni del tutto
analogo al caso di funzioni di una sola variabile.
Proposizione 13.2.2 (Criterio di integrabilità mediante suddivisioni)
Sia A un sottoinsieme misurabile e limitato di Rn e sia f : A → R una
funzione limitata. Allora, le seguenti proposizioni sono equivalenti:
a) f è integrabile secondo Riemann in A.
b) ∀ ε > 0 ∃ P1 , P2 ∈ Σ(A) t.c. S(f, P2 ) − s(f, P1 ) < ε.
c) ∀ ε > 0 ∃ P ∈ Σ(A) t.c. S(f, P ) − s(f, P ) < ε.
Il criterio di integrabilità precedente è sufficiente per stabilire l’integrabilità di alcune classi di funzioni, tra cui quelle continue.
Teorema 13.2.3 (Integrabilità delle funzioni continue)
Sia A un sottoinsieme misurabile e limitato di Rn e sia f : A → R una
funzione continua e limitata.1 Allora f è integrabile secondo Riemann in
A.
1 L’ipotesi che f sia limitata è automaticamente soddisfatta, per il teorema di
Weierstrass, se si suppone che A sia chiuso.
13.2 Cenni sull’integrale di Riemann in Rn
391
◃ Anche per gli integrali multipli si può fornire un’interpretazione geometrica.
Sia A un sottoinsieme misurabile e limitato di Rn e sia f : A → R una
funzione limitata e positiva.
Si denomina trapezoide relativo ad f di base A e lo si denota con T (f )
il seguente sottoinsieme di Rn+1
T (f ) := {(x, y) ∈ Rn × R | x ∈ A , 0 ≤ y ≤ f (x)} .
Dal criterio di integrabilità mediante suddivisioni (Proposizione 13.2.2)
e dal criterio di misurabilità mediante plurintervalli (Proposizione 13.1.2)
segue che f è integrabile secondo Riemann in A se e solo se T (f ) è un
sottoinsieme misurabile di Rn+1 e, in tal caso, si ha
∫
f = m(T (f )) .
A
Se f : A → R è negativa, si può applicare quanto sopra alla funzione −f
e riconoscere che f è integrabile se e solo se il trapezoide T (f ) := {(x, y) ∈
Rn × R | x ∈ A , f (x) ≤ y ≤ 0} è un sottoinsieme misurabile di Rn+1 ; in
tal caso, si ha
∫
f = −m(T (f )) .
A
Nel caso in cui f non abbia segno costante, si può applicare quanto sopra
alla parte positiva f+ := sup{f, 0} ed alla parte negativa f− := inf{f, 0} di
f.
Vista la definizione adottata, l’integrale multiplo soddisfa proprietà analoghe a quelle viste nella Proposizione 10.1.6 e nel Teorema 10.1.7; per
brevità si omette di elencare tali proprietà.
Per quanto riguarda invece il calcolo degli integrali multipli non si può
ricorrere a metodi analoghi a quelli utilizzati per le funzioni di una variabile
in quanto non vi è un analogo del concetto di primitiva per una funzione di
più variabili.
Gli strumenti maggiormente utilizzati sono l’integrazione su domini normali ed il cambiamento di variabili.
13.2.1
Integrazione su domini normali
In maniera preliminare si considera separatamente il caso di 2 variabili. Sia
A un sottoinsieme di R2 . Si dice che A è un dominio normale rispetto
all’asse x (oppure secondo l’asse y) se esistono a, b ∈ R con a < b e due
funzioni continue α, β : [a, b] → R tali che α ≤ β e
A := {(x, y) ∈ R2 | x ∈ [a, b] , α(x) ≤ y ≤ β(x)} .
Capitolo 13: L’integrale di Riemann in Rn
392
Un dominio normale rispetto all’asse x è sicuramente chiuso, limitato e
misurabile ed inoltre la sua misura è data da
∫ b
m(A) =
(β(x) − α(x)) dx .
a
Se f : A → R è una funzione continua sul dominio normale A rispetto
all’asse x vale la seguente formula di riduzione degli integrali doppi
)
∫ (∫
∫∫
b
β(x)
f (x, y) dx dy =
A
f (x, y) dy
a
dx .
(13.2.1)
α(x)
L’integrale a secondo membro viene spesso denotato con
∫ b
∫ β(x)
dx
f (x, y) dy
a
α(x)
e quindi la formula di riduzione precedente viene scritta come segue
∫∫
∫ b
∫ β(x)
f (x, y) dx dy =
dx
f (x, y) dy .
A
a
α(x)
◃ In maniera del tutto analoga si può considerare una formula di riduzione
per domini normali rispetto all’asse y.
Si dice che un sottoinsieme A di R2 è un dominio normale rispetto all’asse y (oppure secondo l’asse x) se esistono c, d ∈ R con c < d e due funzioni
continue γ, δ : [c, d] → R tali che γ ≤ δ e
A := {(x, y) ∈ R2 | y ∈ [c, d] , γ(y) ≤ x ≤ δ(y)} .
Un dominio normale rispetto all’asse y è chiuso, limitato e misurabile ed
inoltre
∫
d
(δ(y) − γ(y)) dy .
m(A) =
c
Se f : A → R è una funzione continua sul dominio normale A rispetto
all’asse y vale la seguente formula di riduzione degli integrali doppi
)
∫∫
∫ (∫
d
δ(y)
f (x, y) dx dy =
A
f (x, y) dx
c
dy .
(13.2.2)
γ(y)
Anche in questo caso l’integrale a secondo membro viene denotato con
∫ d
∫ β(y)
dy
f (x, y) dx
c
α(y)
13.2 Cenni sull’integrale di Riemann in Rn
e quindi la formula di riduzione diventa
∫∫
∫ d
∫
f (x, y) dx dy =
dy
A
c
393
β(y)
f (x, y) dx .
α(y)
◃ Si considera ora il caso generale.
Sia A un sottoinsieme di Rn e sia j = 1, . . . , n fissato; si dice che A è
normale rispetto al piano x1 , . . . , xj−1 , xj+1 , . . . , xn individuato dai vettori
e1 , . . . , ej−1 , ej+1 , . . . , en della base canonica (oppure secondo l’asse xj ) se
esistono un sottoinsieme chiuso, limitato e misurabile B ⊂ Rn−1 e due
funzioni continue α, β : B → R tali che α ≤ β e inoltre, posto per brevità
x̂j = (x1 , . . . , xj−1 , xj+1 , . . . , xn ) ∈ Rn−1 per ogni x = (x1 , . . . , xn ) ∈ Rn ,
A = {x = (x1 , . . . , xn ) ∈ Rn | x̂j ∈ B , α(x̂j ) ≤ xj ≤ β(x̂j )} .
Se A è un dominio normale secondo l’asse xj , allora A è chiuso, limitato
e misurabile ed inoltre
∫
∫
m(A) =
···
(β(x̂j ) − α(x̂j )) dx1 · · · dxj−1 dxj+1 · · · dxn .
B
Se f : A → R è una funzione continua sul dominio normale A secondo
l’asse xj vale la seguente formula di riduzione degli integrali multipli
∫
∫
···
f (x1 , . . . , xn ) dx1 · · · dxn
(13.2.3)
A
∫
···
=
∫ (∫
B
β(x̂j )
)
f (x1 , . . . , xn ) dxj dx1 · · · dxj−1 dxj+1 · · · dxn .
α(x̂j )
Anche in questo caso l’integrale a secondo membro viene denotato con
∫
∫
∫ β(x̂j )
···
dx1 · · · dxj−1 dxj+1 · · · dxn
f (x1 , . . . , xn ) dxj
B
α(x̂j )
e quindi la formula di riduzione diventa
∫
∫
···
f (x1 , . . . , xn ) dx1 · · · dxn
A
∫
=
∫
∫
···
dx1 · · · dxj−1 dxj+1 · · · dxn
B
Esempi 13.2.4
β(x̂j )
f (x1 , . . . , xn ) dxj
α(x̂j )
1. Si consideri l’integrale doppio
∫∫
x sin y dx dy ,
A
Capitolo 13: L’integrale di Riemann in Rn
394
con A := {(x, y) ∈ R2 | 0 ≤ x ≤ 1 , x2 ≤ y ≤ x}. Allora, dalle formule
di riduzione per gli integrali doppi si ottiene
∫∫
∫ 1
∫ x
x sin y dx dy =
dx
x sin y dy
A
x2
0
∫
1
0
∫
x
dx [−x cos y]x2
=
1
(−x cos x + x cos x2 ) dx
=
0
∫
1
−x cos x dx +
=
0
∫
1
2
∫
1
2x cos x2 dx
0
]1
1[
sin x2 0
2
0
1
3
= sin 1 − cos 1 + 1 + sin 1 = sin 1 − cos 1 + 1 .
2
2
1
1
= [−x sin x]0 +
sin x dx +
2. Si consideri l’integrale triplo
∫∫∫
xyz dx dy dz ,
A
dove A è il cilindro che ha come base il cerchio unitario C con centro
l’origine nel piano xy ed altezza l’intervallo [0, 1] sull’asse z. Quindi
A := {(x, y, z) ∈ R3 | x2 + y 2 ≤ 1 , 0 ≤ z ≤ 1}
ed inoltre, denotata dalle formule di riduzione per gli integrali multipli
si ottiene
∫∫∫
∫ 1
∫∫
xyz dx dy dz =
z dz
xy dx dy
A
C
∫0∫
=
xy dx dy
∫
C
1
=
∫
x dx
−1
∫ 1
=
[
=
−1
√
1−x2
√
− 1−x2
y dy
x(1 − x2 ) dx
x4
x2
−
2
4
]1
=0.
−1
Il risultato poteva anche essere dedotto dalla simmetria dell’insieme
di integrazione e della funzione integranda.
13.2 Cenni sull’integrale di Riemann in Rn
13.2.2
395
Cambiamento di variabile negli integrali multipli
Siano A e B sottoinsiemi aperti, limitati e misurabili di Rn e sia φ : B → A
una funzione verificante le seguenti condizioni:
1. φ è invertibile;
2. φ è derivabile parzialmente rispetto a tutte le variabili in B e tutte le
derivate parziali sono continue in B;
3. φ è regolare in B, cioè per ogni y0 ∈ B il determinante della matrice
jacobiana J(φ, y0 ) di φ in y0 è diverso da 0:
∀ y0 ∈ B :
∂(φ1 , . . . , φn )
(y0 ) := det J(φ, (y1 , . . . , yn ))(y0 ) ̸= 0 .
∂(y1 , . . . , yn )
Se K ⊂ B è un sottoinsieme chiuso e limitato di B ed f : φ(K) → R
è una funzione continua, allora vale la seguente formula di cambiamento di
variabile degli integrali multipli:
∫
∫
···
f (x1 , . . . , xn ) dx1 · · · dxn
(13.2.4)
∫
=
φ(K)
∫
···
f ◦ φ(y1 , . . . , yn )
K
∂(φ1 , . . . , φn )
(y1 , . . . , yn ) dy1 · · · dyn ,
∂(y1 , . . . , yn )
∂(φ1 , . . . , φn )
(y1 , . . . , yn ) denota il determinante det J(φ, (y1 , . . . , yn )))
∂(y1 , . . . , yn )
della matrice jacobiana della trasformazione φ in (y1 , . . . , yn ).
Si può dimostrare che la formula precedente continua a valere se le condizioni imposte alla trasformazione φ valgono in B r H, con H insieme di
misura nulla. Infatti, in tal caso è possibile decomporre B in un numero
finito di insiemi chiusi, limitati e misurabili con interni a due a due disgiunti e tali che H sia contenuto nella frontiera di tali insiemi; si può quindi
applicare la formula di cambiamento di variabile ad ognuno di tali insiemi
e sommare opportunamente gli integrali ottenuti.
In particolare, la formula sul cambiamento di variabili rimane valida se
il determinante jacobiano si annulla in un numero finito di punti.
dove
◃ Si osservi che la funzione φ esprime il seguente cambiamento di variabili


 x1 := φ1 (y1 , . . . , yn ) ,

 x2 := φ2 (y1 , . . . , yn ) ,
..

.



xn := φn (y1 , . . . , yn ) ,
Capitolo 13: L’integrale di Riemann in Rn
396
dove φ1 , . . . , φn sono le componenti della funzione φ.
◃ Un esempio spesso utilizzato di cambiamento di variabili in R2 è quello
in coordinate polari, ponendo
{
x := ρ cos θ ,
y := ρ sin θ ,
Lo jacobiano J(ρ, θ) di tale trasformazione è quindi dato da

∂x
 ∂ρ
 ∂y
∂ρ

∂x
(
cos θ
∂θ  =
∂y 
sin θ
∂θ
−ρ sin θ
ρ cos θ
)
,
ed il determinante jacobiano è det J(ρ, θ) = ρ.
Poiché il determinante jacobiano si annulla solamente nell’origine, si può
sempre usare la trasformazione in coordinate polari. Pertanto, se A è un
sottoinsieme chiuso, limitato e misurabile di R2 e se f : A → R è una
funzione continua, si ha
∫∫
∫∫
f (x, y) dx dy =
A
f (ρ cos θ, ρ sin θ) ρ dρ dθ ,
B
con B := {(ρ, θ) ∈ [0, +∞] × [−π, π] | (ρ cos θ, ρ sin θ) ∈ A}.
◃ Ad esempio, si consideri il seguente integrale doppio
∫∫
x
√
x2 + y 2 dx dy ,
D
dove D è il settore circolare del cerchio unitario con centro nell’origine
delimitato dalle semirette y = ±x, x ≥ 0.
Utilizzando il cambiamento di variabili in coordinate polari
{
x = ρ cos θ ,
y = ρ sin θ ,
il dominio D è l’immagine del dominio
B
:=
=
π
π
{(ρ, θ) ∈ [0, +∞[×[−π, π] | 0 ≤ ρ ≤ 1 , − ≤ θ ≤ }
4
4
[ π π]
[0, 1] × − ,
4 4
13.2 Cenni sull’integrale di Riemann in Rn
397
y
D
x
Figura 13.2: Dominio di integrazione con trasformazione in coordinate
polari.
e quindi, usando anche le formule di riduzione per gli integrali doppi,
∫∫
∫∫
√
2
2
x x + y dx dy =
ρ cos θ ρ2 dρ dθ
D
B
1
∫
0
=
=
∫
π/4
ρ3 dρ
=
cos θ dθ
−π/4
1
π/4
[sin θ]−π/4
4√
2
.
4
◃ Anche per gli integrali tripli viene spesso utilizzata la trasformazione
in coordinate polari (o coordinate sferiche); considerato un punto P di R3
di coordinate (x, y, z), si considera la variabile ρ data dalla distanza di P
dall’origine (ρ ≥ 0), la variabile θ data dall’arco di circonferenza unitaria
tra il semiasse positivo dell’asse x e la semiretta passante per l’origine e la
proiezione Q(x, y, 0) di P sul piano xy (−π < θ ≤ π) e la variabile φ data
dall’arco di circonferenza unitaria tra il semiasse positivo dell’asse z e la
semiretta passante per l’origine ed il punto P (0 ≤ φ ≤ π). Quindi

 x = ρ cos θ sin φ ,
y = ρ sin θ sin φ ,

z = ρ cos φ .
Capitolo 13: L’integrale di Riemann in Rn
398
Lo jacobiano di tale trasformazione è dato da


cos θ sin φ −ρ sin θ sin φ ρ cos θ cos φ
J(ρ, θ, φ) =  sin θ sin φ ρ cos θ sin φ ρ sin θ cos φ  ,
cos φ
0
−ρ sin φ
ed il suo determinante è
−ρ2 sin φ ,
che si annulla sull’asse z e quindi in un insieme di misura nulla; quindi la
formula di riduzione per gli integrali multipli può essere applicata.
◃ Ad esempio, si vuole calcolare l’integrale triplo
∫∫∫
x2 (y − z) dx dy dz ,
D
dove D è la semisfera unitaria con centro l’origine situata nel semispazio
positivo dell’asse z. Utilizzando la trasformazione in coordinate polari, il
dominio D è l’immagine del seguente dominio
{
π}
B := (ρ, θ, φ) ∈ R3 | 0 ≤ ρ ≤ 1 , −π ≤ θ ≤ π , 0 ≤ φ ≤
2
e quindi l’integrale triplo diventa
∫∫∫
ρ2 cos2 θ sin2 φ ρ (sin θ sin φ − cos φ) ρ2 sin φ dρ dθ dφ
B
∫
∫
π/2
=
−π
0
∫
π
dφ
(cos2 θ sin4 φ sin θ − cos2 θ sin3 φ cos φ) dθ
1
ρ5 dρ
0
[
]π
1
1
4
3
3
− cos θ sin φ − (θ + cos θ sin θ) sin φ cos φ
dφ
3
2
0
−π
(
)
∫
π
1
π
1 π/2 1
4
3
4
3
sin φ − sin φ cos φ − sin φ − sin φ cos φ dφ
=
6 0
3
2
3
2
∫ π/2
π
=−
sin3 φ cos φ dφ
6 0
[
]π/2
π
1
1
π
=−
− cos(2φ) +
cos(4φ)
=−
.
6
8
32
24
0
1
=
6
∫
π/2
◃ Un’altra trasformazione spesso utilizzata è quella in coordinate cilindriche, che consistono nel trasformare in coordinate polari (nel piano xy) le
variabili x ed y lasciando invariata l’ultima variabile z:

 x = ρ cos θ ,
y = ρ sin θ ,

z=z.
13.2 Cenni sull’integrale di Riemann in Rn
Lo jacobiano di tale trasformazione è dato da

cos θ −ρ sin θ
J(ρ, θ, z) =  sin θ ρ cos θ
0
0
399

0
0  ,
1
ed il suo determinante è ρ; il determinante jacobiano pertanto si annulla
solamente sull’asse z e quindi la formula di riduzione per gli integrali multipli
può essere applicata.
◃ Ad esempio, si vuole calcolare l’integrale triplo
∫∫∫ √
x2 + y 2 z dx dy dz ,
D
dove D è il cilindro che ha come base il cerchio unitario con centro l’origine
nel piano xy ed altezza l’intervallo [0, 1] sull’asse z. Utilizzando la trasformazione in coordinate cilindriche, il dominio D è l’immagine del seguente
dominio
{
}
B := (ρ, θ, z) ∈ R3 | 0 ≤ ρ ≤ 1 , −π ≤ θ ≤ π , 0 ≤ z ≤ 1
e quindi l’integrale triplo diventa
∫∫∫
∫
ρ2 z dρ dθ dz =
B
∫
1
0
∫
π
ρ2 dρ
dθ
−π
1
z dz =
0
[ 2 ]1
z
π
1
·π·
= .
3
2 0
3
Capitolo 14
Curve, campi vettoriali e
superfici
14.1
Curve regolari e lunghezza
Una curva in Rn è una funzione vettoriale continua φ : I → Rn definita in
un intervallo I di R.
L’intervallo I viene denominato intervallo intervallo base della curva φ
mentre l’immagine φ∗ = φ(I) ⊂ Rn viene denominata sostegno della curva
φ.
Assegnare quindi la curva φ : I → Rn equivale ad assegnare n funzioni
continue φ1 , . . . , φn : I → Rn (le componenti di φ) che forniscono le seguenti
equazioni parametriche di φ

x1 := φ1 (t) ,



 x2 := φ2 (t) ,
t∈I.
..

.



xn := φn (t) ,
Assegnate le funzioni continue φ1 , . . . , φn : I → R, la curva φ : I → R
avente tali componenti viene data da
φ(t) :=
n
∑
φi (t) ei ,
t∈I.
i=1
Una curva φ : I → Rn viene denominata semplice se può assumere lo
stesso valore solamente negli estremi, cioè se verifica la seguente condizione
∀ t 1 , t2 ∈ I , t 1 < t 2 :
φ(t1 ) = φ(t2 ) =⇒ I = [t1 , t2 ] .
402
Capitolo 14: Curve, campi vettoriali e superfici
Inoltre, una curva si dice chiusa se il suo intervallo base è un intervallo
chiuso e limitato agli estremi del quale la curva assume lo stesso valore;
quindi φ : [a, b] → Rn è chiusa se φ(a) = φ(b).
Esempi 14.1.1
1. Si considerino a = (a1 , . . . , an ) ∈ Rn e b = (b1 , . . . , bn ) ∈
n
R . La curva φ : [0, 1] → Rn definita ponendo, per ogni t ∈ [0, 1],
φ(t) := a + t(b − a) ha come sostegno il segmento S[a, b] di estremi a
e b.
Se a ̸= b, essa è una curva semplice ma non chiusa.
2. Assegnati i punti distinti a0 , a1 , . . . , am ∈ Rn , si può considerare la poligonale p[a0 , . . . , am ] : [0, 1] → Rn congiungente i punti a0 , a1 , . . . , am
definita ponendo, per ogni t ∈ [0, 1],

(
)
[
[
,
 ai + m t − mi (ai+1 − ai ) , t ∈ mi , i+1
m
i = 0, . . . , m − 1 ,
p[a0 , . . . , am ](t) :=

am ,
t=1.
Il supporto della poligonale p[a0 , . . . , am ] è costituito dall’unione dei
segmenti congiungenti ai ed ai+1 , i = 0, . . . , m − 1, cioè
p[a0 , . . . , am ]∗ =
m−1
∪
S[ai , ai+1 ] .
i=0
La poligonale p[a0 , . . . , am ] è chiusa se e solo se a0 = am ed è semplice
se e solo se i segmenti che ne costituiscono il supporto possono avere
in comune solamente i vertici ed ognuno di questi ultimi appartiene al
più a due segmenti distinti.
3. La curva γ : [0, 2π] → R2 definita ponendo, per ogni t ∈ [0, 2π],
γ(t) := (cos t, sin t) ,
ha come supporto la circonferenza unitaria con centro l’origine nel
piano.
Più in generale, si può considerare la circonferenza di centro (x0 , y0 ) ∈
R2 e raggio r > 0 data dal supporto della curva γ(x0 ,y0 ),r : [0, 2π] → R2
definita ponendo, per ogni t ∈ [0, 2π],
γ(x0 ,y0 ),r (t) := (x0 + r cos t, y0 + r sin t) .
4. Curve in coordinate cartesiane Se f : I → R è una funzione
continua, si può considerare in maniera naturale una curva φf : I →
R2 ad essa associata definita ponendo, per ogni t ∈ I,
φf (t) := (t, f (t)) .
14.1 Curve regolari e lunghezza
403
La curva φf è sempre semplice e non chiusa e fornisce le coordinate
parametriche della funzione f .
5. Curve in coordinate polari Se ρ : I → R è una funzione continua e
positiva, si può considerare in maniera naturale una curva γρ : I → R2
ad essa associata definita ponendo, per ogni θ ∈ I,
γρ (θ) := (ρ(θ) cos θ, ρ(θ) sin θ) .
La curva γρ fornisce le coordinate parametriche polari della funzione
ρ.
◃ Assegnate due curve φ : [a, c] → Rn e ψ : [c, b] → Rn tali che φ(c) =
ψ(c), si può considerare la curva unione φ∪ψ : [a, b] → Rn definita ponendo,
per ogni t ∈ [a, b],
{
φ(t) ,
t ∈ [a, c] ,
(φ ∪ ψ)(t) :=
(14.1.1)
ψ(t) ,
t ∈]c, b] .
La denominazione adottata è giustificata dal fatto che il supporto della
curva unione φ ∪ ψ è l’unione dei supporti delle curve φ e ψ, cioè (φ ∪ ψ)∗ =
(φ∗ ) ∪ (ψ ∗ ).
◃ Una curva φ : I → Rn si dice regolare se è derivabile con derivata φ′
continua e, per ogni t ∈ I, si ha φ′ (t) ̸= 0.
Quindi φ è regolare se e solo se le sue componenti φ1 , . . . φn : I → R
sono derivabili in I e le loro derivate sono continue e non si annullano
contemporaneamente
in alcun punto di I (infatti, per ogni t ∈ I, deve
∑n
essere i=1 φ′n (t)2 > 0).
Inoltre, una curva φ : I → Rn si dice regolare a tratti se è unione di un
numero finito di curve regolari e quindi se e solo se esistono t0 , . . . , tm ∈ R
tali che inf I = t0 < t1 < · · · < tm−1 < tm = sup I (se I non è limitato
inferiormente si pone t0 = −∞ e se I non è limitato superiormente si pone
tm = +∞) e inoltre, per ogni i = 0, . . . , m−1, la curva φ|I∩[ti ,ti+1 ] è regolare.
Pertanto, una curva φ : I → Rn è regolare se e solo se φ è derivabile con
derivata non nulla tranne al più che in un numero finito di punti nei quali
tuttavia esistono le derivate sinistre e destre e sono entrambe non nulle.
◃ La condizione di regolarità è utile per definire la tangente ad una curva
in un punto, come di seguito precisato.
Si supponga che φ : I → Rn sia una curva regolare e sia t0 ∈ I. Per ogni
t1 ∈ I r {t0 } la retta secante il grafico di φ nei punti (t0 , φ(t0 )) ∈ Rn+1 e
(t1 , φ(t1 )) ∈ Rn+1 ha equazione
y = φ(t0 ) + (t − t0 )
φ(t1 ) − φ(t0 )
,
t1 − t0
(t, y) ∈ R × Rn ,
Capitolo 14: Curve, campi vettoriali e superfici
404
e considerando il limite per t1 → t0 si ottiene l’equazione della retta tangente
al sostegno di φ nel punto (t0 , φ(t0 ))
y = φ(t0 ) + (t − t0 ) φ′ (t0 ) ,
(t, y) ∈ R × Rn .
(14.1.2)
◃ Nel caso delle curve regolari a tratti, si possono definire in ogni punto
le equazioni delle rette tangenti a sinistra e a destra.
Si verifica facilmente che le curve considerate negli Esempi 14.1.1 precedenti sono regolari a tratti.
Ad esempio, nel caso dell’Esempio 14.1.1, 1., per ogni t0 ∈ [0, 1] si ha
φ′ (t) = b − a e quindi la retta tangente al sostegno di φ nel punto (t0 , φ(t0 ))
ha equazione
y = φ(t0 ) + (t − t0 ) (b − a) = a + t0 (b − a) + (t − t0 ) (b − a) = a + t(b − a) ,
(t, y) ∈ R × Rn .
Si considerino ora i punti distinti a0 , a1 , . . . , am ∈ Rn e sia p[a0 , . . . , am ] :
[0, 1] → Rn la poligonale congiungente i punti a0 , a1 , . . . , am definita nell’Esempio 14.1.1, 2.; allora p[a0 , . . . , am ] è una curva regolare a tratti e, per
ogni i = 0, . . . , m − 1 e t ∈]i/m, (i + 1)/m[ si ha p[a0 , . . . , am ]′ (t) = ai+1 − ai .
Per ogni i = 0, . . . , m − 1 e t0 ∈]i/m, (i + 1)/m[, la retta tangente al sostegno di p[a0 , . . . , am ] in (t0 , φ(t0 )) ha equazione y = ai + t(ai+1 − ai ),
t ∈ R; tale equazione rappresenta anche la retta tangente a destra in
(ai , p[a0 , . . . , am ](ai )) ed a sinistra in (ai+1 , p[a0 , . . . , am ](ai+1 )).
Si consideri infine la curva γ(x0 ,y0 ),r : [0, 2π] → R2 definita nell’Esempio
14.1.1, 3. Essa è regolare e, per ogni t0 ∈ [0, 1],
′
γ(x
(t0 ) := (−r sin t, r cos t) .
0 ,y0 ),r
L’equazione della retta tangente in (t0 , γ(x0 ,y0 ),r (t0 )) ha equazione
(x, y)
′
= γ(x0 ,y0 ),r (t0 ) + (t − t0 ) γ(x
(t0 )
0 ,y0 ),r
= (x0 + r cos t, y0 + r sin t) + (t − t0 ) (−r sin t, r cos t)
=
(x0 + r cos t − r (t − t0 ) sin t, y0 + r sin t + r (t − t0 ) cos t) ,
t ∈ R. In forma parametrica la retta tangente ha quindi le seguenti equazioni
{
x = x0 + r cos t − r (t − t0 ) sin t ,
t∈R.
y = y0 + r sin t + r (t − t0 ) cos t ,
◃ Sia f : I → R una funzione continua e si consideri la curva φf : I → R2
ad essa associata definita ponendo, per ogni t ∈ I,
φf (t) := (t, f (t)) .
14.1 Curve regolari e lunghezza
405
Se f è derivabile e con derivata continua allora la curva φf è regolare e si
ha, per ogni t ∈ I,
φ′f (t) = (1, f ′ (t))
(̸= (0, 0)) .
Se t0 ∈ I, l’equazione della retta tangente in (t0 , φf (t0 )) ha equazione
(x, y) =
φf (t0 ) + (t − t0 ) φ′f (t0 )
= (t0 , f (t0 )) + (t − t0 ) (1, f ′ (t0 ))
= (t, f (t0 ) + f ′ (t0 )(t − t0 )) ,
t ∈ R. In forma parametrica la retta tangente ha quindi le seguenti equazioni
{
x=t,
t∈R,
y = f (t0 ) + f ′ (t0 )(t − t0 ) ,
ed eliminando il parametro t tra le due equazioni, si ottiene
y = f (t0 ) + f ′ (t0 )(x − t0 ) ,
cioè l’equazione della retta tangente al grafico di f nel punto (t0 , f (t0 ))
(vedasi la (9.1.4)).
◃ Sia ρ : I → R una funzione continua e positiva e si consideri la curva
γρ : I → R2 definita ponendo, per ogni θ ∈ I,
γρ (θ) := (ρ(θ) cos θ, ρ(θ) sin θ) .
Se ρ è derivabile con derivata continua e se ρ e ρ′ non si annullano mai
contemporaneamente, allora γρ è regolare.
Infatti, per ogni θ ∈ I,
γρ′ (θ) = (ρ′ (θ) cos θ − ρ(θ) sin θ, ρ′ (θ) sin θ + ρ(θ) cos θ)
√
e poiché ∥γρ′ (θ)∥ = ρ(θ)2 + ρ′ (θ)2 ̸= 0, la curva γρ è regolare.
Per ogni θ0 ∈ I, l’equazione della retta tangente in (θ0 , γρ (θ0 )) ha
equazione
(x, y) = γρ (θ0 ) + (θ − θ0 ) γρ′ (θ0 )
= (ρ(θ0 ) cos θ0 , ρ(θ0 ) sin θ0 )
+(θ − θ0 ) (ρ′ (θ) cos θ − ρ(θ) sin θ, ρ′ (θ) sin θ + ρ(θ) cos θ)
= (ρ(θ0 ) cos θ0 + (θ − θ0 ) (ρ′ (θ) cos θ − ρ(θ) sin θ),
ρ(θ0 ) sin θ0 + (θ − θ0 ) (ρ′ (θ) sin θ + ρ(θ) cos θ)) ,
406
Capitolo 14: Curve, campi vettoriali e superfici
θ ∈ R. In forma parametrica la retta tangente ha quindi le seguenti
equazioni
{
x = ρ(θ0 ) cos θ0 + (θ − θ0 ) (ρ′ (θ) cos θ − ρ(θ) sin θ) ,
θ∈R.
y = ρ(θ0 ) sin θ0 + (θ − θ0 ) (ρ′ (θ) sin θ + ρ(θ) cos θ) ,
◃ Si osservi che l’intervallo base di una curva può essere modificato a
seconda delle necessità considerando una opportuna trasformazione lineare.
Ad esempio, se φ : [a, b] → Rn è una curva definita in un intervallo chiuso e
limitato con a < b e se [c, d] è un ulteriore intervallo di R con c < d si può
considerare la funzione j : [c, d] → [a, b] definita ponendo, per ogni s ∈ [c, d],
j(s) :=
b−a
ad − bc
s+
.
d−c
d−c
Allora, la curva ψ := φ ◦ j : [c, d] → Rn ha lo stesso sostegno di φ e inoltre,
poiché j e j −1 sono derivabili e le loro derivate sono sempre diverse da zero,
la curva ψ è regolare (rispettivamente, regolare a tratti) se e solo se φ è
regolare (rispettivamente, regolare a tratti).
Sia ora t0 ∈ [a, b] tale che φ sia derivabile in t0 con φ′ (t0 ) ̸= 0. Considerato s0 := j −1 (t0 ), si ha che ψ è derivabile in s0 e la sua derivata è
ψ ′ (s0 ) = (d − c)/(b − a). Conseguentemente, la retta tangente al supporto
di ψ in (s0 , ψ(s0 )) ha equazione
y = ψ(s0 )+(s−s0 ) ψ ′ (s0 ) = φ(t0 )+(s−s0 )
d−c ′
φ (t0 ) = φ(t0 )+(t−t0 ) φ′ (t0 ) ,
b−a
(t, y) ∈ R × Rn , e quindi l’equazione della retta tangente non dipende dalla
scelta dell’intervallo base.
◃ Più in generale, le proprietà precedenti possono essere verificate per le
curve equivalenti, nel senso di seguito specificato.
Si dice che due curve φ : I → Rn e ψ : J → Rn sono equivalenti se esiste
una funzione j : J → I invertibile e di classe C 1 insieme alla sua inversa
(cioè sia j che j −1 sono derivabili e con derivata continua) tale che, per ogni
s ∈ J, si abbia j ′ (s) ̸= 0 ed inoltre ψ = φ ◦ j.
Si verifica facilmente che se due curve sono equivalenti, esse hanno lo
stesso sostegno (e quindi se una è chiusa o rispettivamente semplice anche
l’altra lo è) ed inoltre la regolarità (rispettivamente, la regolarità a tratti)
dell’una comporta quella dell’altra; in tal caso, le rette tangenti dipendono
solamente dal punto del sostegno e non dalla curva equivalente considerata.
Assegnate due curve equivalenti φ : I → Rn e ψ : J → Rn con ψ = φ ◦ j,
si dice che φ e ψ hanno lo stesso verso di percorrenza (rispettivamente, che
14.1 Curve regolari e lunghezza
407
hanno versi di percorrenza opposti ) se, per ogni s0 ∈ J, posto t0 := j(s0 ) ∈
I, si ha
ψ(J ∩ [s0 , +∞[) = φ(I ∩ [t0 , +∞[)
rispettivamente,
ψ(J ∩ [s0 , +∞[) = φ(I∩] − ∞, t0 ]) ).
Il primo caso si verifica quando j ha derivata strettamente positiva, mentre
il secondo quando j ha derivata strettamente negativa.
◃ Assegnata una curva φ : [a, b] → Rn , si può considerare la curva opposta
φo : [a, b] → Rn definita ponendo, per ogni t ∈ [a, b],
φo (t) := φ(a + b − t) .
(14.1.3)
La curva opposta φo è equivalente a φ ma ha verso di percorrenza opposto.
◃ Un’altra proprietà invariante delle curve equivalenti viene messa in evidenza dal concetto di lunghezza di una curva, di cui ci si vuole ora occupare.
Innanzitutto, si osserva che la definizione di lunghezza si può dare in
maniera immediata per il segmento p[a, b] congiungente due punti a, b ∈ Rn .
Infatti, si può porre
ℓ(p[a, b]) := ∥b − a∥ .
Conseguentemente, la lunghezza di una poligonale p[a, . . . , am ] di vertici
a0 , . . . , am può essere definita come segue
ℓ(p[a0 , . . . , am ]) :=
m−1
∑
∥ai+1 − ai ∥ .
i=0
Si consideri una curva arbitraria φ : I → Rn . Una poligonale p[a0 , . . . , am ]
si dice inscritta alla curva φ se esistono t0 , . . . , tm ∈ I tali che t0 < t1 <
· · · < tm e inoltre, per ogni i = 0, . . . , m, φ(ti ) = ai .
Si denoti ora con Pφ l’insieme di tutte le poligonali inscritte alla curva
φ. Per ogni poligonale p ∈ Pφ , ha senso per quanto già visto considerare la
lunghezza ℓ(p) di p e ciò giustifica la seguente definizione.
Si dice che la curva φ : I → Rn è rettificabile se
sup ℓ(p) < +∞ .
p∈Pφ
In tal caso, la lunghezza di φ è definita ponendo
ℓ(φ) := sup ℓ(p) .
p∈Pφ
Per le curve regolari a tratti, vale il seguente risultato.
408
Capitolo 14: Curve, campi vettoriali e superfici
Teorema 14.1.2 Sia φ : [a, b] → Rn una curva regolare a tratti definita in
un intervallo chiuso e limitato [a, b]. Allora, φ è rettificabile e si ha1
∫ b
ℓ(φ) =
∥φ′ (t)∥ dt .
(14.1.4)
a
◃ Ad esempio, si consideri la curva γ(x0 ,y0 ),r : [0, 2π] → R2 definita nell’Esempio 14.1.1, 3. Dal Teorema 14.1.2, essa è rettificabile e la sua lunghezza
è data da
∫ 2π √
ℓ(γ(x0 ,y0 ),r ) =
r2 (cos2 t + sin2 t) dt = 2π r .
0
◃ Sia f : [a, b] → R una funzione derivabile e con derivata continua e si
consideri la curva φf : [a, b] → R2 ad essa associata definita ponendo, per
ogni t ∈ [a, b],
φf (t) := (t, f (t)) .
Allora, dal Teorema 14.1.2, φf è rettificabile e
∫ b
ℓ(φ) =
∥φ′f (t)∥ dt
∫
a
∫
a
b
=
b
=
∥(1, f ′ (t))∥ dt
√
1 + f ′ (t)2 dt .
a
◃ Sia ρ : [θ1 , θ2 ] → R una funzione positiva derivabile con derivata continua e tale che ρ e ρ′ non si annullino mai contemporaneamente.
Si consideri la curva γρ : [θ1 , θ2 ] → R2 definita ponendo, per ogni θ ∈
[θ1 , θ2 ],
γρ (θ) := (ρ(θ) cos θ, ρ(θ) sin θ) .
Dal Teorema 14.1.2, γρ è rettificabile e si ha
∫ θ2 √
ρ(θ)2 + ρ′ (θ)2 dθ .
ℓ(γρ ) =
θ1
◃ Tra le proprietà della lunghezza di una curva, conviene segnalare le
seguenti, di immediata verifica
1 Si osservi che la funzione φ′ è continua tranne che in un numero finito di punti di
discontinuità di prima specie; pertanto φ′ è integrabile in [a, b] e conseguentemente lo è
anche ∥φ′ ∥.
14.2 Integrali curvilinei e campi vettoriali conservativi
409
1. Siano φ : [a, c] → Rn e ψ : [c, b] → Rn due curve tali che φ(c) = ψ(c) e
si consideri la curva unione φ ∪ ψ : [a, b] → Rn definita dalla (14.1.1).
Se φ e ψ sono entrambe regolari a tratti, allora anche φ ∪ ψ è regolare
a tratti e la sua lunghezza è data da
ℓ(φ ∪ ψ) = ℓ(φ) + ℓ(ψ) .
2. Sia φ : [a, b] → Rn una curva regolare a tratti. Allora
ℓ(φ) ≤ (b − a) max ∥φ′ (t)∥ .
t∈[a,b]
14.2
Integrali curvilinei e campi vettoriali conservativi
14.2.1
Integrali curvilinei
Sia φ : [a, b] → Rn una curva regolare a tratti e si consideri una funzione
reale continua f : A → R in un sottoinsieme aperto A di Rn contenente il
supporto della curva φ (cioè φ∗ ⊂ A). Si osservi che la funzione (f ◦ φ) ∥φ′ ∥
è integrabile in [a, b] in quanto prodotto di una funzione continua con una
funzione continua a tratti.
Si definisce integrale curvilineo di f lungo la curva φ il seguente numero
reale
∫
∫
b
f ds :=
φ
f (φ(t)) ∥φ′ (t)∥ dt .
(14.2.1)
a
Si osservi che l’integrale curvilineo della funzione costante di costante
valore 1 è uguale alla lunghezza della curva.
L’integrale curvilineo dipende dai valori della funzione f sul supporto
della curva φ, ma non dal suo orientamento, come si evince dalle proprietà
di seguito enunciate.
Proposizione 14.2.1 Valgono le seguenti proprietà degli integrali curvilinei:
1. Proprietà di linearità Siano f, g : A → R funzioni continue in un
sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a
tratti tale che φ∗ ⊂ A. Allora, per ogni λ ∈ R,
∫
∫
∫
∫
∫
(f + g) ds =
f ds +
g ds ,
(λ f ) ds = λ
f ds .
φ
φ
φ
φ
φ
Capitolo 14: Curve, campi vettoriali e superfici
410
2. Proprietà di monotonia Siano f, g : A → R funzioni continue in
un sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a
tratti tale che φ∗ ⊂ A. Se f ≤ g (cioè, per ogni x ∈ A, f (x) ≤ g(x)),
allora si ha anche
∫
∫
f ds ≤
g ds .
φ
φ
3. Siano f : A → R una funzione continua in un sottoinsieme aperto A
di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A.
Allora
∫
f ds ≤ sup |f (x)| ℓ(φ) .
x∈φ∗
φ
4. Siano f : A → R una funzione continua in un sottoinsieme aperto A
di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A.
Considerata la curva opposta φo : [a, b] → Rn definita dalla (14.1.3),
si ha che φo è anch’essa regolare a tratti ed inoltre
∫
∫
f ds =
f ds .
φo
φ
5. Siano f : A → R una funzione continua in un sottoinsieme aperto A
di Rn e φ : [a, c] → Rn e ψ : [c, b] → Rn due curve regolari a tratti
tali che φ(c) = ψ(c) e φ∗ ⊂ A, ψ ∗ ⊂ A. Si consideri la curva unione
φ∪ψ : [a, b] → Rn definita dalla (14.1.1); allora anche φ∪ψ è regolare
a tratti, (φ ∪ ψ)∗ ⊂ A ed inoltre
∫
∫
∫
f ds =
f ds +
f ds .
φ∪ψ
φ
ψ
Dimostrazione. Le proprietà 1. e 2. sono immediata conseguenza della definizione di
integrale curvilineo.
Per quanto riguarda la proprietà 3. basta osservare che
∫ b
∫ b
∫
|f (φ(t))| ∥φ′ (t)∥ dt
f (φ(t)) ∥φ′ (t)∥ dt ≤
=
f ds
a
φ
≤
sup |f (x)|
x∈φ∗
∫
a
b
′
∥φ (t)∥ dt ≤ sup |f (x)| ℓ(φ) .
x∈φ∗
a
Nelle ipotesi della proprietà 4. si ha
∫
∫ b
∫
f (φo (t)) ∥(φo )′ (t)∥ dt =
f ds =
φo
∫
a
=
b
b
f (φ(a + b − t)) ∥ − φ′ (a + b − t)∥ dt
a
a
f (φ(u)) ∥φ′ (u)∥ (−du) =
∫
b
a
f (φ(u)) ∥φ′ (u)∥ du =
∫
f ds .
φ
Infine, la proprietà 5. segue direttamente dalle definizioni di integrale curvilineo e di
curva unione.
14.2 Integrali curvilinei e campi vettoriali conservativi
14.2.2
411
Integrali curvilinei di un campo vettoriale
Una funzione continua vettoriale F : A → Rn definita in un sottoinsieme
aperto A ⊂ Rn viene denominata campo vettoriale.
Se φ : [a, b] → Rn è una curva regolare a tratti tale che φ∗ ⊂ A, si può
definire l’integrale curvilineo del campo vettoriale F ponendo
∫
∫
b
F · dℓ :=
φ
(F (φ(t)) | φ′ (t)) dt =
a
∫
n
b∑
Fi (φ(t)) φ′i (t) dt
(14.2.2)
a i=1
(nell’ultima uguaglianza si sono denotate con φ1 , . . . , φn le componenti di
φ).
Per evidenziare il fatto che l’integrale curvilineo dipende dal verso di percorrenza della curva, spesso si precisa che l’integrale curvilineo deve essere
inteso nel verso da φ(a) a φ(b).
Nonostante l’analogia delle notazioni usate per l’integrale curvilineo di
una funzione e di un campo vettoriale nel caso n = 1, sarà comunque chiaro
dal contesto l’integrale curvilineo da considerare.
Inoltre l’integrale curvilineo di un campo vettoriale F viene spesso denotato anche con il simbolo
∫
(F |dℓ) ,
φ
intendendo dℓ come il differenziale vettoriale (dx1 , . . . , dxn ).
Alcune proprietà degli integrali curvilinei di campi vettoriali sono enunciate nella seguente proposizione.
Proposizione 14.2.2 Valgono le seguenti proprietà degli integrali curvilinei di un campo vettoriale:
1. Proprietà di linearità Siano F, G : A → Rn campi vettoriali in un
sottoinsieme aperto A di Rn e sia φ : [a, b] → Rn una curva regolare
a tratti tale che φ∗ ⊂ A. Allora, per ogni λ ∈ R,
∫
∫
∫
∫
∫
(F +G)·dℓ =
F ·dℓ+ G·dℓ ,
(λ F +G)·dℓ = λ
F ·dℓ .
φ
φ
φ
φ
φ
2. Siano F : A → Rn un campo vettoriale in un sottoinsieme aperto A
di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A.
Allora
∫
F · dℓ ≤ sup ∥F (x)∥ ℓ(φ) .
φ
x∈φ∗
Capitolo 14: Curve, campi vettoriali e superfici
412
3. Siano F : A → Rn un campo vettoriale in un sottoinsieme aperto A
di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A.
Considerata la curva opposta φo : [a, b] → Rn definita dalla (14.1.3),
si ha
∫
∫
F · dℓ = − F · dℓ .
φo
φ
4. Siano F : A → Rn un campo vettoriale in un sottoinsieme aperto A
di Rn e φ : [a, c] → Rn e ψ : [c, b] → Rn due curve regolari a tratti
tali che φ(c) = ψ(c) e φ∗ ⊂ A, ψ ∗ ⊂ A. Si consideri la curva unione
φ ∪ ψ : [a, b] → Rn definita dalla (14.1.1); allora
∫
∫
∫
F · dℓ =
F · dℓ +
F · dℓ .
φ∪ψ
φ
ψ
Dimostrazione. La proprietà 1. è ovvia in base alla definizione di integrale curvilineo.
Per quanto riguarda la proprietà 2. basta osservare che, dalla diseguaglianza (12.1.1)
di Cauchy-Schwarz
∫ b
∫ b
∫
(F (φ(t)) | φ′ (t)) dt
=
(F (φ(t)) | φ′ (t)) dt ≤
F · dℓ
φ
∫
≤
a
a
b
∥(F (φ(t))∥ ∥φ (t))∥ dt ≤ sup ∥F (x)∥
x∈φ∗
a
=
∫
φo
=
b
∫
=
−
∥φ′ (t))∥ dt
a
sup ∥F (x)∥ ℓ(φ) .
n
b∑
a i=1
Fi (φ(u)) (−φ′i (u)) (−du) =
i=1
n
b∑
a i=1
Fi (φ(u)) φ′i (u) du = −
∫
∫
b
Fi (φ(a + b − t)) (−φ′i (a + b − t)) dt
n
a∑
Fi (φ(u)) φ′i (u) du
i=1
F · dℓ .
φ
Infine, la proprietà 4. segue direttamente dalle definizioni.
14.2.3
b
x∈φ∗
Nelle ipotesi della proprietà 3. si ha
∫
∫ b∑
n
Fi (φo (t)) (φoi )′ (t) dt =
F · dℓ =
a i=1
∫ a∑
n
∫
′
Campi vettoriali conservativi
Un campo vettoriale F : A → Rn su un insieme aperto connesso A ⊂ Rn si
dice conservativo se esiste una funzione f : A → R derivabile parzialmente
in A e con derivate parziali continue tale che, per ogni i = 1, . . . , n, denotata
con Fi la componente i-esima di F , si abbia
∂f
= Fi
∂xi
(14.2.3)
14.2 Integrali curvilinei e campi vettoriali conservativi
413
(cioè ∇f = F ).
Ogni funzione f : A → R verificante la (14.2.3) viene denominata
potenziale oppure primitiva del campo vettoriale F .
◃ Nel seguito, per ogni k ∈ N, si denoterà per brevità con C k (A) l’insieme
di tutte le funzioni dotate di tutte le derivate parziali continue fino all’ordine
k in A, con la convenzione C 0 (A) = C(A). Una funzione appartenente a
C k (A) verrà più brevemente denominata di classe C k (A). Tali notazioni
si applicano ovviamente anche alle funzioni vettoriali intendendole vere per
ogni componente (quindi F ∈ C k (A) significa che tutte le componenti di F
sono dotate di tutte le derivate parziali continue fino all’ordine k in A).
◃ Poiché F è continua, affinché valga la (14.2.3), un potenziale deve necessariamente avere tutte le derivate parziali continue e quindi, in base alle
notazioni assunte, f ∈ C 1 (A).
◃ I potenziali di un campo vettoriale su un insieme aperto connesso sono
determinati a meno di una costante, nel senso che aggiungendo una funzione
costante ad un potenziale si ottiene ancora un potenziale e viceversa due
potenziali differiscono sempre per una costante.
I campi vettoriali conservativi sono caratterizzati mediante proprietà
degli integrali curvilinei.
Teorema 14.2.3 Siano A un sottoinsieme aperto connesso di Rn ed F :
A → Rn un campo vettoriale. Allora le seguenti proposizioni sono equivalenti:
a) F è conservativo;
b) Se φ : [a, b] → Rn e ψ : [c, d] → Rn sono curve regolari a tratti tali
che φ∗ ⊂ A, ψ ∗ ⊂ A e φ(a) = ψ(c), φ(b) = ψ(d), allora
∫
∫
F · dℓ =
F · dℓ ;
φ
ψ
c) Se φ : [a, b] → Rn è una curva chiusa tale che φ∗ ⊂ A, si ha
∫
F · dℓ = 0 .
φ
◃ Dal risultato precedente segue che l’integrale curvilineo di un campo
vettoriale conservativo dipende solo dai punti estremi del supporto della
curva e non dal percorso che li congiunge.
Capitolo 14: Curve, campi vettoriali e superfici
414
Se F : A → Rn è un campo vettoriale conservativo su un sottoinsieme
aperto connesso A e se f : A → R è un potenziale di F allora, per ogni
curva regolare a tratti φ : [a, b] → Rn tale che φ∗ ⊂ A, si ha
∫
F · dℓ = f (φ(b)) − f (φ(a)) .
φ
Infatti
∫
F · dℓ
∫
b
=
φ
(F (φ(t)) | φ′ (t)) dt =
a
∫
=
n
b∑
a i=1
∫
n
b∑
a i=1
∂f
(φ(t)) φ′i (t) dt =
∂xi
∫
b
Fi (φ(t)) φ′i (t) dt
(f ◦ φ)′ (t) dt = f (φ(b)) − f (φ(a)) .
a
◃ Il risultato precedente tuttavia viene solitamente applicato per riconoscere che un campo vettoriale non è conservativo. Data l’arbitrarietà delle
curve regolari a tratti previste nelle condizioni b) e c), non risulta infatti
percorribile la verifica di tali condizioni, mentre trovarne una per cui la b) o
la c) non vale significa dimostrare che il campo vettoriale non è conservativo.
◃ Per riconoscere che un campo vettoriale è conservativo bisogna quindi
ricorrere ad ulteriori strumenti che ora ci cercherà di approfondire.
Si supponga che A sia un sottoinsieme aperto di Rn e che F : A → Rn
sia un campo vettoriale di classe C 1 (A). Se f : A → R è un potenziale
di F allora, dalla (14.2.3), si ricava che f ∈ C 2 (A) e inoltre, per ogni
i, j = 1, . . . , n, dal Teorema 12.3.8 sull’invertibilità dell’ordine di derivazione
segue
(
)
(
)
∂Fi
∂
∂f
∂2f
∂2f
∂
∂f
∂Fj
=
=
=
=
=
.
∂xj
∂xj ∂xi
∂xj ∂xi
∂xi ∂xj
∂xi ∂xj
∂xi
Un campo vettoriale F : A → Rn di classe C 1 (A) viene denominato
irrotazionale se verifica la seguente condizione
∂Fi
∂Fj
=
.
∂xj
∂xi
(14.2.4)
Quindi ogni campo vettoriale conservativo F : A → Rn di classe C 1 (A)
è irrotazionale. Il viceversa non è sempre vero e bisogna aggiungere delle
condizioni sulla struttura dell’insieme A per poter assicurare che un campo
irrotazionale sia conservativo.
◃ Siano A ⊂ Rn ed x0 ∈ A. Si dice che A è un insieme stellato rispetto ad
x0 se, per ogni x ∈ A, il segmento congiungente x0 ed x è contenuto in A,
cioè
∀ x ∈ A ∀ t ∈ [0, 1] : x0 + t(x − x0 ) ∈ A .
(14.2.5)
14.2 Integrali curvilinei e campi vettoriali conservativi
415
Inoltre, un insieme A ⊂ Rn si dice stellato se esiste x0 ∈ A rispetto al quale
A è stellato.
◃ Si osservi che ogni insieme convesso è stellato; più precisamente, un
insieme è convesso se e solo se esso è stellato rispetto ad ogni suo punto.
Teorema 14.2.4 Se F : A → Rn è un campo vettoriale irrotazionale di
classe C 1 (A) su un insieme aperto stellato, allora F è conservativo.
Il risultato precedente consente di affermare che un campo vettoriale di
classe C 1 (A) su un insieme aperto stellato è conservativo se e solo se esso
è irrotazionale. La condizione (14.2.4) è di immediata verifica e fornisce un
metodo elementare per riconoscere che un campo vettoriale è conservativo.
Tuttavia, una volta stabilito che un campo vettoriale è conservativo,
rimane aperto il problema di determinarne un potenziale.
A tal fine, i metodi utilizzati più frequentemente sono i seguenti:
1. Si supponga che A sia un sottoinsieme aperto stellato di Rn rispetto
al punto x0 ∈ A e sia F : A → Rn un campo vettoriale conservativo.
Allora la funzione f : A → R definita ponendo, per ogni x ∈ A,
∫
f (x) :=
F · dℓ ,
φ
dove φ : [a, b] → Rn è una qualsiasi curva regolare a tratti con supporto contenuto in A e congiungente i punti x0 ed x (cioè φ(a) = x0
e φ(b) = x),2 è un potenziale di F ; precisamente, è il potenziale di F
che si annulla in x0 .
2. Si supponga che F : A → Rn sia un campo vettoriale conservativo
su un sottoinsieme aperto connesso A di Rn . Si consideri la prima
componente F1 : A → R e, per ogni (x1 , . . . , xn ) ∈ A, una sua primitiva f1 : A → R rispetto alla variabile x1 ; tale primitiva dipende
ovviamente da x2 , . . . , xn al pari quindi della costante arbitraria. Si
ha pertanto
∫
F (x1 , x2 , . . . , xn ) dx1 = f (x1 , x2 , . . . , xn ) + g(x2 , . . . , xn ) ,
dove g è una funzione arbitraria delle variabili x2 , . . . , xn . Per determinare la funzione g si impongono le ulteriori condizioni previste nella
(14.2.4)
∂f1
∂g
+
= Fi ,
i = 2, . . . , n .
∂xi
∂xi
2 Si osservi che la funzione f è ben definita in quanto, dal Teorema 14.2.3, l’integrale
curvilineo non dipende dalla curva ma solamente dai punti x0 ed x.
Capitolo 14: Curve, campi vettoriali e superfici
416
Una volta risolte le equazioni precedenti la funzione f : A → R definita
ponendo, per ogni x = (x1 , . . . , xn ) ∈ A,
f (x1 , . . . , xn ) := f1 (x1 , . . . , xn ) + g(x2 , . . . , xn ) ,
è un potenziale di F .
14.3
Superfici ed integrali superficiali
Sia A un sottoinsieme aperto connesso di R2 . Si dice che una funzione
φ : A → R3 è una superfice regolare se essa verifica le seguenti condizioni
1. φ è iniettiva;
2. φ ∈ C 1 (A), cioè le componenti di φ sono derivabili parzialmente
rispetto a tutte le variabili in A e le derivate parziali sono continue;
3. Per ogni (u, v) ∈ A, la matrice jacobiana

∂φ1
 ∂u (u, v)

 ∂φ2
J(φ, (u, v)) = 
 ∂u (u, v)

 ∂φ
3
(u, v)
∂u
∂φ1
(u, v)
∂v
∂φ2
(u, v)
∂v
∂φ3
(u, v)
∂v








di φ ha rango 2.
Si supponga che K ⊂ R2 sia chiuso, limitato e connesso e coincida con
◦
la chiusura del proprio interno (K = K); una funzione φ : K → R3 si
dice superfice regolare compatta se la sua restrizione all’interno di K è una
superfice regolare. Inoltre, una superfice regolare compatta si dice chiusa
se esiste un sottoinsieme di R3 la cui frontiera coincide con φ(K), cioè
∃ B ⊂ R3 t.c. ∂B = φ(K) .
◃ Un esempio molto importante di superfice regolare viene fornito dalle
superfici regolari cartesiane. Sia K ⊂ R2 chiuso, limitato e connesso e tale
◦
◦
che K = K). Se f : K → R è una funzione di classe C 1 (K), allora la
funzione φf : K → R3 definita ponendo, per ogni (x, y) ∈ K,
φf (x, y) := (x, y, f (x, y)) ,
(14.3.1)
14.3 Superfici ed integrali superficiali
417
è una superfice regolare compatta. Infatti essa è ovviamente iniettiva e
◦
inoltre, per ogni (x, y) ∈ K, la matrice jacobiana di φf

1


0
J(φf , (x, y)) = 

 ∂f
(x, y)
∂x
0
1
∂f
(x, y)
∂y






ha rango 2 in quanto la matrice da essa estratta e costituita dalle prime due
righe ha determinante sempre uguale ad 1.
◃ Assegnata ora una superfice regolare compatta φ : K → R3 , se ne vuole
definire l’area.
◦
Innanzitutto, per ogni (u, v) ∈ K, si pone
(
)
∂φ
∂φ1
∂φ2
∂φ3
(u, v) :=
(u, v),
(u, v),
(u, v) ,
∂u
∂u
∂u
∂u
(
)
∂φ
∂φ1
∂φ2
∂φ3
(u, v) :=
(u, v),
(u, v),
(u, v) ; .
∂v
∂v
∂v
∂v
A questo punto, l’area della superfice compatta φ viene definita come segue3
∫∫
A(φ) :=
K
∂φ
∂φ
(u, v) ∧
(u, v) du dv .
∂u
∂v
(14.3.2)
◦
◃ Sia f : K → R una funzione di classe C 1 (K) e si consideri la funzione
φf : K → R3 definita dalla (14.3.1).
Utilizzando la (14.3.2), l’area della superfice φf , cioè del grafico di f , è
data da
√
(
)2 (
)2
∫∫
∂f
∂f
A(φf ) =
1+
(x, y) +
(x, y) dx dy .
∂x
∂y
K
3 Si ricorda che il prodotto vettoriale x ∧ y di due elementi x = (x , x , x ) ∈ R3 e
1
2
3
y = (y1 , y2 , y3 ) ∈ R3 è definito come segue
x ∧ y := (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ) ;
nel caso in esame
(
)
∂φ2 ∂φ3
∂φ ∂φ
∂φ3 ∂φ2 ∂φ3 ∂φ1
∂φ1 ∂φ3 ∂φ1 ∂φ2
∂φ2 ∂φ1
∧
=
−
,
−
,
−
.
∂u
∂v
∂u ∂v
∂u ∂v ∂u ∂v
∂u ∂v ∂u ∂v
∂u ∂v
Capitolo 14: Curve, campi vettoriali e superfici
418
◃ Si consideri ora una superfice regolare compatta φ : K → R3 e sia A un
sottoinsieme aperto di R3 tale che φ(K) ⊂ A.
Se f : A → R è una funzione continua, si può definire l’integrale
superficiale di f come segue
∫
∫∫
∂φ
∂φ
(u, v) ∧
(u, v) du dv .
(14.3.3)
f dσ :=
f (φ(u, v))
∂u
∂v
φ
K
Analogamente, se F : K → R3 è un campo vettoriale, si può definire il
flusso di F ponendo
)
∫
∫∫ (
∂φ
∂φ
F · ν dσ :=
F (φ(u, v))
(u, v) ∧
(u, v) du dv . (14.3.4)
∂u
∂v
φ
K
Le proprietà generali dell’integrale superficiale e del flusso possono essere
ottenute in maniera simile a quanto già svolto per gli integrali curvilinei di
una funzione e di un campo vettoriale e per brevità vengono omesse.
14.4
Il teorema della divergenza e la formula
di Stokes
◦
Sia D un sottoinsieme di R2 chiuso, limitato e connesso e tale che (D) = D.
Si dice che D è regolare se la sua frontiera è localmente il grafico di una
curva regolare; ciò significa che, per ogni x0 ∈ ∂D, esistono δ > 0 ed una
curva regolare φ : I → R2 tale che φ∗ = ∂D ∩ Bδ (x0 ).
Teorema 14.4.1 (Teorema della divergenza in R2 )
Sia D un dominio regolare di R2 e sia F : D → R2 un campo vettoriale di
◦
classe C 1 (D). Denotato con ν il versore normale esterno al dominio D, si
ha4
∫∫
∫
div F (x, y) dx dy =
(F |ν) ds .
D
∂D
Teorema 14.4.2 (Formula di Stokes in R2 )
Sia D un dominio regolare di R2 e sia F : D → R2 un campo vettoriale di
◦
classe C 1 (D). Denotato con ν il versore normale esterno al dominio D, si
ha
)
∫
∫∫ (
∂F2
∂F1
F · dℓ =
(x, y) −
(x, y) dx dy .
∂x
∂y
+∂D
D
In R3 valgono i seguenti risultati analoghi.
4 Si
ricorda che
div F (x, y) :=
∂F2
∂F1
(x, y) +
(x, y) .
∂x
∂y
Capitolo 15
Equazioni differenziali
ordinarie
15.1
Introduzione e problema di Cauchy
Un’equazione differenziale ordinaria si presenta nella forma
F (x, y(x), y ′ (x), . . . , y (m) (x)) = 0
con F : Ω → R definita in un sottoinsieme Ω di Rm+2 ed esprime una relazione tra la variabile indipendente x ed il valore in x di una funzione incognita
e di quello delle sue derivate fino ad un certo ordine. L’ordine più grande m
delle derivate coinvolte nell’equazione differenziale viene denominato ordine
dell’equazione differenziale.
Lo studio di innumerevoli problemi in tutti i settori scientifici conduce
ad equazioni differenziali e l’obiettivo è quello di determinarne le possibili
soluzioni , cioè le funzioni u : I → R definite in un intervallo I di R che
verificano le seguenti condizioni
1. u è derivabile m volte in I;
2. per ogni x ∈ I, si ha (x, u(x), u′ (x), . . . , u(m) (x)) ∈ Ω;
3. per ogni x ∈ I, si ha F (x, u(x), u′ (x), . . . , u(m) (x)) = 0.
In diverse circostanze, viene richiesto che più equazioni differenziali siano
soddisfatte simultaneamente ed in questi casi la soluzione può essere una
funzione vettoriale in cui ogni componente soddisfa un’assegnata equazione
420
Capitolo 15: Equazioni differenziali ordinarie
differenziale. Un’equazione differenziale vettoriale si presenta quindi nella
forma
F (x, y(x), y ′ (x), . . . , y (m) (x)) = 0
con F : Ω → Rn definita in un sottoinsieme Ω di R(m+1)n+1 in quanto le
funzioni incognite y = (y1 , . . . , yn ) sono a valori in Rn . Quindi la funzione
F è a valori in Rn e, denotate con F1 , . . . , Fn : Ω → R le sue componenti,
l’equazione differenziale può essere scritta nella seguente forma di un sistema
di n equazioni differenziali

F1 (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 ,




F2 (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 ,
..

.



Fn (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 .
In questo caso una soluzione è una funzione u : I → Rn definita in
un intervallo I di R (quindi u = (u1 , . . . , un ) con u1 , . . . , un : I → R) che
verifica le seguenti condizioni
1. u è derivabile m volte in I (cioè, u1 , . . . , un sono derivabili m volte in
I);
2. per ogni x ∈ I, si ha (x, u(x), u′ (x), . . . , u(m) (x)) ∈ Ω (cioè
(x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , u(m)
n (x)) ∈ Ω );
(m)
3. per ogni x ∈ I, si ha F (x, u(x), u′ (x), . . . , u(m) (x)) = 0 (cioè
F (x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , u(m)
n (x)) = 0 ).
(m)
L’ultima equazione può essere espressa in maniera equivalente sotto
forma di un sistema di equazioni differenziali

(m)
(m)

F1 (x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , un (x)) = 0 ,



(m)
(m)
 F2 (x, u1 (x), . . . , un (x), u′ (x), . . . , u′ (x), . . . , u (x), . . . , un (x)) = 0 ,
n
1
1
..


.



(m)
(m)
Fn (x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , un (x)) = 0 .
Nel seguito si cercherà di tenere conto di tali esigenze e pertanto verranno
prese in considerazione equazioni differenziali in cui le funzioni incognite
sono funzioni vettoriali.
Più in generale, un’equazione differenziale potrebbe esprimere una relazione in cui sono coinvolte le derivate parziali di una funzione di più variabili;
15.1 Introduzione e problema di Cauchy
421
queste equazioni differenziali vengono denominate a derivate parziali ed il
loro studio richiede degli strumenti specifici che esulano da una trattazione
introduttiva. Ci si limiterà pertanto a considerare equazioni differenziali
ordinarie in cui la funzione incognita dipende da una sola variabile.
◃ Per applicare diversi risultati riguardanti l’esistenza e l’unicità della soluzione, è opportuno riuscire ad esplicitare le derivate di ordine massimo e
scrivere l’equazione differenziale in forma normale
y (m) = f (x, y, y ′ , . . . , y m−1 )
(15.1.1)
con f : A → Rn definita in un sottoinsieme A di Rm·n+1 .
La funzione f viene denominata secondo membro dell’equazione differenziale (15.1.1).
Nella relazione precedente si è usata la convenzione universalmente adottata di denotare con y, . . . y (m) i valori incogniti y(x), . . . y (m) (x) in x. Denotate con f1 . . . , fn : A → R le componenti di f si ha quindi il seguente
sistema di n equazioni differenziali
 (m)
m−1
′
′
m−1


 y1(m) = f1 (x, y1 , . . . , yn , y1 , . . . , yn , . . . , y1m−1 , . . . , yn ) ,

′
′
 y
= f2 (x, y1 , . . . , yn , y1 , . . . , yn , . . . , y1 , . . . , ynm−1 ) ,
2
(15.1.2)
 ...



 (m)
yn = fn (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) .
◃ Assegnato un punto (x0 , y0 , y0′ . . . , y0
(m−1)
y0 ∈ Rn ,
y0′ ∈ Rn ,
...,
) ∈ A (si osservi che
(m−1)
y0
∈ Rn )
il problema di Cauchy per l’equazione differenziale (15.1.1)
 (m)
y
= f (x, y, y ′ , . . . , y m−1 ) ,




0 ) = y0 ,

 y(x
y ′ (x0 ) = y0′ ,
..



.


 (m−1)
(m−1)
y
(x0 ) = y0
,
consiste nel determinare una soluzione u : I → Rn dell’equazione differenziale (15.1.1) tale che
1. x0 ∈ I;
2. u(x0 ) = y0 , u′ (x0 ) = y0′ , . . . , u(m−1) (x0 ) = y0
(m−1)
.
Capitolo 15: Equazioni differenziali ordinarie
422
Con riferimento al sistema di equazioni differenziali (15.1.2), il problema
di Cauchy si scrive come segue

























y1 = f1 (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) ,
(m)
y2 = f2 (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) ,
..
.
(m)
yn = fn (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) ,
(y1 (x0 ), . . . , yn (x0 )) = y0 ,
..
.
(m)
(m−1)
(y1
(m−1)
(x0 ), . . . , yn
(m−1)
(x0 )) = y0
,
e consiste nel determinare una soluzione u := (u1 , . . . , un ) : I → Rn del
sistema di equazioni differenziali (15.1.2) tale che
1. x0 ∈ I;
2. (u1 (x0 ), . . . , un (x0 )) = y0 ;
(u′1 (x0 ), . . . , u′n (x0 )) = y0′ ;
..
.
(m−1)
(u1
(m−1)
(x0 ), . . . , un
(m−1)
(x0 )) = y0
.
◃ Si riconosce ora che un’equazione differenziale di ordine m può essere
ricondotta ad un sistema di m equazioni differenziali del primo ordine.
Proposizione 15.1.1 Sia f : A → Rn una funzione definita in un sottoinsieme A di Rm·n+1 e si consideri l’equazione differenziale in forma
normale
y (m) = f (x, y, y ′ , . . . , y m−1 ) .
(15.1.3)
Si considerino ora le funzioni g1 , . . . , gm : A → Rn definite ponendo, per
ogni (x, z1 , z2 , . . . , zm ) ∈ A (quindi zi ∈ Rn per ogni i = 1, . . . , m),
g1 (x, z1 , z2 , . . . , zm )
g2 (x, z1 , z2 , . . . , zm )
:=
:=
..
.
gm−1 (x, z1 , z2 , . . . , zm ) :=
gm (x, z1 , z2 , . . . , zm )
:=
z2 ,
z3 ,
zm ,
f (x, z1 , z2 , . . . , zm ) ,
15.1 Introduzione e problema di Cauchy
423
ed il sistema di m equazioni differenziali del primo ordine
 ′
z1 = g1 (x, z1 , z2 , . . . , zm ) ,



 z2′ = g2 (x, z1 , z2 , . . . , zm ) ,
..

.


 ′
zm = gm (x, z1 , z2 , . . . , zm ) .
(15.1.4)
Se u : I → Rn è una soluzione dell’equazione differenziale (15.1.3)
allora, posto
z1 := u ,
z2 := u′ ,
...,
zm := u(m−1) ,
si ha che z := (z1 , . . . , zm ) è soluzione del sistema di equazioni differenziali
(15.1.4).
Viceversa, se z := (z1 , . . . , zm ) è soluzione del sistema del sistema di
equazioni differenziali (15.1.4), allora u := z1 è soluzione dell’equazione
differenziale (15.1.3).
) ∈ A, la soluzione u dell’equazione difInfine, se (x0 , y0 , y0′ , . . . , y0
ferenziale (15.1.3) soddisfa le condizioni iniziali
(m−1)
u(x0 ) = y0 ,
u′ (x0 ) = y0′ ,
...,
(m−1)
u(m−1) (x0 ) = y0
,
se e solo se la corrispondente soluzione z = (z1 , . . . , zm ) del sistema di
equazioni differenziali (15.1.4) soddisfa la condizione iniziale z ′ (x0 ) = z0
(m−1)
).
con z0 := (y0 , y0′ , . . . , y0
Dimostrazione. La dimostrazione è immediata tenendo presente che, dalla definizione
di g1 , . . . , gm , le equazioni del sistema di equazioni differenziali considerato si ottengono
imponendo che le m variabili z1 = y, y ′ = z2 , . . . , y (m−1) = zm siano ognuna la derivata
′ = (y (m−1) )′ = y (m) coincida con
della precedente e inoltre che la derivata di zm (cioè zm
f (x, y, y ′ , . . . , y m−1 ) = gm (x, z1 , z2 , . . . , zm ). Anche la verifica delle condizioni iniziali
segue direttamente dalle definizioni adottate.
A questo punto si può anche riconoscere che un sistema di equazioni
differenziali composto da n equazioni del primo ordine si può ricondurre ad
un’unica equazione differenziale del primo ordine vettoriale a valori in Rn .
Proposizione 15.1.2 Siano f1 , . . . , fn : A → R definite in un sottoinsieme A di Rn+1 e si consideri la funzione f := (f1 , . . . , fn ) : A → Rn di
componenti f1 , . . . , fn .
424
Capitolo 15: Equazioni differenziali ordinarie
Allora, una funzione u := (u1 , . . . , un ) : I → Rn è una soluzione del
sistema di n equazioni differenziali del primo ordine
 ′
y = f1 (x, y1 , . . . , yn ) ,


 1′

y2 = f2 (x, y1 , . . . , yn ) ,
(15.1.5)
..

.


 ′
yn = fn (x, y1 , . . . , yn ) ,
se e solo se essa è una soluzione dell’equazione differenziale vettoriale
y ′ = f (x, y) ,
y := (y1 , . . . , yn ) .
(15.1.6)
Inoltre, se (x0 , y0,1 , . . . , y0,n ) ∈ A, la funzione u considerata come soluzione del sistema di equazioni differenziali (15.1.3) soddisfa le condizioni
iniziali
u1 (x0 ) = y0,1 , , . . . , un (x0 ) = y0,n ,
se e solo se soddisfa la condizione iniziale u(x0 ) = y0 come soluzione dell’equazione differenziale (15.1.6) (si è posto per comodità y0 := (y0,1 , . . . , y0,n )).
Dimostrazione. Anche in questo caso la dimostrazione è immediata in base alle definizioni adottate.
◃ Pertanto, in base alle proposizioni precedenti, non sarà restrittivo considerare nel seguito equazioni differenziali del primo ordine (vettoriali) in
forma normale del tipo
y ′ = f (x, y)
(15.1.7)
con f : A → Rn definita in un sottoinsieme A ⊂ R × Rn (la scrittura R × Rn
al posto di Rn+1 mette in evidenza il fatto che la variabile x è un numero
reale mentre y è una variabile vettoriale in Rn ).
In base alle definizioni adottate, una soluzione dell’equazione differenziale (15.1.7) è una funzione u : I → Rn definita in un intervallo I di R che
soddisfa le seguenti condizioni
1. u è derivabile in I;
2. per ogni x ∈ I si ha (x, u(x)) ∈ A;
3. per ogni x ∈ I si ha u′ (x) = f (x, u(x)).
Assegnato (x0 , y0 ) ∈ A, il problema di Cauchy per l’equazione differenziale (15.1.7)
{ ′
y = f (x, y) ,
(15.1.8)
y(x0 ) = y0 ,
consiste nel determinare una soluzione u : I → Rn dell’equazione differenziale (15.1.7) che verifica le ulteriori condizioni
15.1 Introduzione e problema di Cauchy
425
1. x0 ∈ I;
2. u(x0 ) = y0 .
◃ La proposizione successiva mette in relazione le soluzioni del problema
di Cauchy con quelle di un’opportuna equazione integrale.
Si precisa che, se u : I → Rn è una funzione vettoriale continua, cioè le
sue componenti u1 , . . . , un : I → R sono funzioni reali continue e se a, b ∈ I,
si pone
(∫
)
∫ b
∫ b
b
u(x) dx :=
u1 (x) dx, . . . ,
un (x) dx .
a
a
a
Proposizione 15.1.3 Siano A ⊂ R × R , f : A → Rn una funzione
continua ed (x0 , y0 ) ∈ A.
Se u : I → Rn è una funzione continua in un intervallo I e tale che,
per ogni x ∈ I, si abbia (x, u(x)) ∈ A, allora le seguenti proposizioni sono
equivalenti
n
a) u è soluzione del problema di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 ;
b) u soddisfa la seguente equazione integrale, per ogni x ∈ I,
∫ x
u(x) = y0 +
f (t, u(t)) dt .
(15.1.9)
x0
Dimostrazione. Si supponga che u sia soluzione del problema di Cauchy. Allora u
è derivabile ed inoltre, poiché per ogni x ∈ I, u′ (x) = f (x, u(x)) e sia u che f sono
continue, si ha che u′ è continua. Conseguentemente, per ogni x ∈ I,
∫ x
∫ x
u(x) = u(x0 ) +
u′ (t) dt = y0 +
f (t, u(t)) dt .
x0
x0
Viceversa, si supponga che u soddisfi l’equazione integrale (15.1.9). Poichè u è continua,
la funzione g : I → R definita ponendo, per ogni x ∈ I, g(x) := f (x, u(x)), è anch’essa
continua e conseguentemente la sua funzione integrale di punto iniziale x0 (cioè la funzione
∫
x 7→ xx g(t) dt) è una primitiva di g per cui è derivabile; dalla (15.1.9) si deduce che
0
∫
anche u deve essere derivabile (infatti, per ogni x ∈ I, risulta u(x) = y0 + xx g(t) dt) e
inoltre u′ (x) = g(x) = f (x, u(x)) da cui la tesi.
0
L’equazione integrale (15.1.9) viene denominata equazione integrale di
Volterra ed il problema di determinarne una soluzione viene spesso indicato
come problema di Liouville.
Al fine di utilizzare la Proposizione 15.1.3 precedente per ottenere l’esistenza di soluzioni dell’equazione differenziale y ′ = f (x, y), l’ipotesi di continuità del secondo membro f dell’equazione differenziale verrà usualmente
richiesta in tutti i risultati successivi.
Capitolo 15: Equazioni differenziali ordinarie
426
15.2
Unicità della soluzione del problema di
Cauchy
Lo studio dell’unicità delle soluzioni del problema di Cauchy è basato sul
seguente risultato, noto come lemma di Gronwall .
Proposizione 15.2.1 (Lemma di Gronwall)
Sia w : I → R una funzione reale continua e positiva in un intervallo I e si
supponga che esistano x0 ∈ I ed L > 0 tali che, per ogni x ∈ I,
∫ x
w(t) dt .
w(x) ≤ L
x0
Allora w = 0.
Dimostrazione. Sia ε > 0 e si consideri la funzione vε : I ∩ [x0 , +∞[→ R definita
ponendo, per ogni x ∈ I ∩ [x0 , +∞[
∫ x
vε (x) := ε + L
w(t) dt .
x0
Allora vε è derivabile in quanto w è continua ed inoltre, per ogni x ∈ I ∩ [x0 , +∞[, si ha
vε (x) > 0 e, dalle ipotesi assunte,
∫
L xx w(t) dt
w(x)
vε′ (x)
∫
∫0
=L
≤L
≤L.
vε (x)
ε + L xx w(t) dt
ε + L xx w(t) dt
0
0
Dalla proprietà di monotonia dell’integrale segue, per ogni x ∈ I,
∫ x
∫ x ′
vε (t)
dt ≤ L
dt = L(x − x0 ) ,
x0
x0 vε (t)
e quindi, poiché
∫
x
x0
vε′ (t)
vε (x)
dt = log
,
vε (t)
vε (x0 )
si ha
vε (x) ≤ vε (x0 ) eL(x−x0 ) = ε eL(x−x0 ) .
Essendo, per ipotesi, w(x) ≤ vε (x), risulta anche w(x) ≤ ε eL(x−x0 ) e dall’arbitrarietà di
ε > 0, si ottiene w(x) = 0.
Nell’intervallo I∩] − ∞, x0 ] si procede in maniera analoga oppure applicando quanto
già dimostrato alla funzione w̃(x) := w(x0 − x).
◃ Al fine di applicare il lemma di Gronwall per l’unicità della soluzione del
problema di Cauchy, si definiscono ulteriori proprietà del secondo membro
di un’equazione differenziale.
Si considerino un sottoinsieme A ⊂ R × Rn ed una funzione f : A → Rn .
Si dice che f è lipschitziana rispetto alla seconda variabile se esiste una
costante L > 0 tale che
∀ (x, y) ∈ A ∀ (x, z) ∈ A :
∥f (x, y) − f (x, z)∥ ≤ L ∥y − z∥ . (15.2.1)
15.2 Unicità della soluzione del problema di Cauchy
427
La costante L > 0 viene anche denominata costante di Lipschitz rispetto
alla seconda variabile di f e per evidenziare ciò si dice anche che f è Llipschitziana rispetto alla seconda variabile.1
◃ Si può stabilire a questo il seguente risultato di unicità della soluzione
del problema di Cauchy.
Teorema 15.2.2 (Teorema di unicità)
Siano A ⊂ R × Rn , f : A → Rn una funzione continua ed L-lipschitziana
rispetto alla seconda variabile ed (x0 , y0 ) ∈ A.
Se u1 : I1 → Rn e u2 : I2 → Rn sono soluzioni del problema di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 ,
allora, per ogni x ∈ I1 ∩ I2 , risulta u1 (x) = u2 (x).
Dimostrazione. Si ponga I := I1 ∩ I2 e si consideri la funzione w : I → R definita
ponendo, per ogni x ∈ I,
w(x) = ∥u1 (x) − u2 (x)∥ .
Allora w è continua e positiva e inoltre dalla continuità di f si ottiene, per ogni x ∈ I,
∫ x
∫ x
∥u′1 (t) − u′2 (t)∥ dt
(u′1 (t) − u′2 (t)) dt ≤
w(x) = ∥u1 (x) − u2 (x)∥ =
∫
x0
x
∥f (t, u1 (t)) − f (t, u2 (t))∥ dt ≤ L
=
∫
x0
x
∥u1 (t) − u2 (t)∥ dt
x0
x0
=
∫
x
w(t) dt .
L
x0
Dal lemma di Gronwall (Proposizione 15.2.1) segue allora w = 0 e conseguentemente
u1 = u2 in I.
Osservazione 15.2.3 Le ipotesi del risultato precedente assicurano la validità dell’unicità in grande cioè l’uguaglianza di due soluzioni dello stesso
problema di Cauchy in tutti i punti in cui esse sono entrambe definite.
1 La definizione adottata è basata sulla definizione generale di funzione lipschitziana.
Se E ed F sono spazi normati ed f : A → F è una funzione definita in un sottoinsieme A
di E, si dice che f è lipschitziana se esiste una costante L > 0 tale che, per ogni x, y ∈ A,
risulti
∥f (x) − f (y)∥ ≤ L ∥x − y∥ .
Il numero L viene denominato costante di Lipschitz di f ed f viene anche denominata
funzione L-lipschitziana.
Pertanto, f è lipschitziana se tutti i rapporti incrementali
∥f (x) − f (y)∥
,
∥x − y∥
x, y ∈ A , x ̸= y ,
sono limitati ed in questo caso l’estremo superiore di tali rapporti incrementali risulta
essere una costante di Lipschitz per f .
428
Capitolo 15: Equazioni differenziali ordinarie
Si supponga ora che valga la proprietà di unicità in piccolo, cioè che
f : A → R sia una funzione continua definita in A ⊂ R × Rn e che, per ogni
(x0 , y0 ) ∈ A e per ogni u1 : I1 → Rn e u2 : I2 → Rn soluzioni del problema
di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 ,
esista un intorno J di x0 tale che, per ogni x ∈ J ∩ I1 ∩ I2 , risulti u1 (x) =
u2 (x).
Si riconosce allora che vale anche la proprietà di unicità in grande.
Infatti, siano u1 : I1 → Rn e u2 : I2 → Rn soluzioni dello stesso problema di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 ,
e si consideri l’insieme U := {x ∈ I1 ∩ I2 | u1 (x) = u2 (x)}. Allora U ̸= ∅ in quanto
x0 ∈ I; inoltre U è chiuso in I1 ∩ I2 in quanto u1 e u2 sono funzioni continue. Infine si
riconosce che U è anche aperto in I1 ∩ I2 ; infatti, se x1 ∈ U , posto y1 := u1 (x1 ) = u2 (x1 ),
si può considerare il problema di Cauchy
{ ′
y = f (x, y) ,
y(x1 ) = y1 ,
ed u1 ed u2 sono due sue soluzioni; dalla proprietà di unicità locale segue allora che
u1 = u2 in un intorno J ∩ I1 ∩ I2 di x1 in I1 ∩ I2 . Poiché I1 ∩ I2 è un intervallo ed U
è un suo sottoinsieme non vuoto contemporaneamente chiuso ed aperto in I1 ∩ I2 , deve
essere U = I1 ∩ I2 , da cui u1 = u2 in I1 ∩ I2 .
◃ Dall’Osservazione 15.2.3 precedente segue che il teorema di unicità può
essere ottenuto anche assicurando l’unicità locale della soluzione con ipotesi
quindi locali sulla funzione f .
Si introduce quindi la seguente definizione di funzione localmente lipschitziana rispetto alla seconda variabile.
Si considerino un sottoinsieme A ⊂ R × Rn ed una funzione f : A → Rn .
Si dice che f è localmente lipschitziana rispetto alla seconda variabile se,
per ogni (x0 , y0 ) ∈ A, esistono δ > 0, r > 0 ed una costante L > 0 tali che,
per ogni (x, y) ∈ A ∩ (]x0 − δ, x0 + δ[×Br (y0 )) e (x, z) ∈ A ∩ (]x0 − δ, x0 +
δ[×Br (y0 )), si abbia
∥f (x, y) − f (x, z)∥ ≤ L ∥y − z∥ .
(15.2.2)
Da quanto osservato si ottiene allora il seguente ulteriore teorema di
unicità.
Teorema 15.2.4 (Teorema di unicità nel caso localmente lipschitziano rispetto alla seconda variabile)
15.2 Unicità della soluzione del problema di Cauchy
429
Siano A ⊂ R × Rn , f : A → Rn una funzione continua e localmente
lipschitziana rispetto alla seconda variabile ed (x0 , y0 ) ∈ A.
Se u1 : I1 → Rn e u2 : I2 → Rn sono soluzioni del problema di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 ,
allora, per ogni x ∈ I1 ∩ I2 , risulta u1 (x) = u2 (x).
◃ Per verificare la condizione di locale lipschitzianeità rispetto alla seconda
variabile, si può usare il fatto che tale condizione equivale alla limitatezza
locale dei rapporti incrementali relativi alla seconda variabile di f ; pertanto, se f è derivabile parzialmente rispetto alla seconda variabile y (cioè
rispetto alle variabili y1 , . . . , yn se n > 1) e se derivate parziali rispetto a
tali variabili sono continue in A, allora i rapporti incrementali relativi alla
seconda variabile risultano localmente limitati e quindi la funzione risulta
essere localmente lipschitziana rispetto alla seconda variabile.
◃ Un’altra questione legata all’unicità della soluzione del problema di Cauchy è la possibilità di prolungare le soluzioni ottenendo soluzioni massimali,
che non possono essere cioè ulteriormente prolungate.
Siano A ⊂ R×Rn ed f : A → Rn una funzione continua. Se u1 : I1 → Rn
e u2 : I2 → Rn sono soluzioni dell’equazione differenziale y ′ = f (x, y),
si dice che u2 è un prolungamento di u1 se I1 ⊂ I2 e, per ogni x ∈ I1 ,
risulta u2 (x) = u1 (x) (in effetti, la nozione di prolungamento può essere
fornita anche nel caso in cui u1 ed u2 non siano necessariamente soluzioni
di un’equazione differenziale).
Inoltre, si dice che una soluzione u : I → Rn di y ′ = f (x, y) è massimale
se essa non ammette alcun prolungamento u : I → Rn che sia ancora una soluzione di y ′ = f (x, y) e definito in un intervallo I contenente propriamente
I.
Si osserva che se u1 : I1 → Rn e u2 : I2 → Rn sono soluzioni dell’equazione differenziale y ′ = f (x, y) che coincidono in I1 ∩ I2 , allora, posto
I := I1 ∪ I2 , si può definire la funzione u : I → Rn ponendo, per ogni x ∈ I,
{
u1 (x) ,
x ∈ I1 ,
u(x) :=
u2 (x) ,
x ∈ I2 .
Osservato che la funzione u è derivabile in I in quanto, se x ∈ I1 ∩ I2 , risulta
u′1 (x) = f (x, u1 (x)) = f (x, u2 (x)) = u′2 (x), si ottiene che u è ancora una
soluzione dell’equazione differenziale.
Pertanto, nelle ipotesi in cui valga l’unicità della soluzione, si può affermare che ogni soluzione u : I → Rn di y ′ = f (x, y) ammette un prolungamento massimale, cioè esiste un prolungamento u : I → Rn di u che è
430
Capitolo 15: Equazioni differenziali ordinarie
soluzione massimale di y ′ = f (x, y) (si osservi che tale risultato non assicura
l’esistenza di soluzioni, ma solamente il fatto che, assegnata una soluzione,
essa possa essere prolungata ad una soluzione massimale).
Infatti, è sufficiente considerare l’insieme P(u) := {v : Iv → Rn | v è un
prolungamento di u ed è soluzione di y ′ = f (x, y)} e, posto
∪
I˜ :=
Iv ,
v∈P(u)
definire la funzione ũ : I → Rn ponendo, per ogni x ∈ I, ũ(x) := v(x) dove
v ∈ P(u) e x ∈ Iv . Allora si verifica direttamente che ũ è un prolungamento
di u ed è una soluzione massimale di y ′ = f (x, y).
◃ Dalla discussione precedente segue che, se A ⊂ R × Rn ed f : A → Rn
è continua e localmente lipschitziana rispetto alla seconda variabile, allora
ogni soluzione di y ′ = f (x, y) ammette un prolungamento massimale.
In particolare, tale proprietà è verificata se si suppone che f sia derivabile parzialmente e con derivate parziali continue rispetto alle variabili
y1 , . . . , yn .
◃ Si osservi infine che le soluzioni massimali non devono essere confuse
con le soluzioni in grande che sono le soluzioni definite in tutto l’intervallo
I := {x ∈ R | ∃ y ∈ Rn t.c. (x, y) ∈ A}.
15.3
Esistenza della soluzione del problema di
Cauchy
Per quanto riguarda l’esistenza di soluzioni del problema di Cauchy, i risultati più importanti sono i seguenti teoremi di esistenza in piccolo ed in
grande.
Teorema 15.3.1 (Teorema di Peano di esistenza di soluzioni in piccolo)
◦
Siano A ⊂ R × Rn , f : A → Rn una funzione continua ed (x0 , y0 ) ∈ A. Al◦
lora esiste un intervallo I tale che x0 ∈ I ed esiste una soluzione u : I → Rn
del problema di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 .
Nel teorema precedente non è possibile specificare l’ampiezza dell’intervallo in cui esiste una soluzione del problema di Cauchy né si può affermare
che tale soluzione sia unica. Con l’aggiunta di ulteriori ipotesi sulla funzione
f si può invece ottenere il seguente risultato.
15.3 Esistenza della soluzione del problema di Cauchy
431
Teorema 15.3.2 Siano A := [a, b] × Br′ (y0 ) ed f : A → Rn una funzione continua ed L-lipschitziana rispetto alla seconda variabile e si ponga2 M := supx∈[a,b] ∥f (x, y0 )∥. Allora, per ogni x0 ∈]a, b[, posto δ1 :=
min{x0 − a, r/M } e δ2 := min{b − x0 , r/M }, esiste una ed sola soluzione
u : [x0 − δ1 , x0 + δ2 ] → Rn del problema di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 .
La dimostrazione del risultato precedente è basata sul metodo delle approssimazioni
successive di Peano-Picard.
Dal risultato precedente si deduce il seguente teorema di esistenza in
grande.
Teorema 15.3.3 (Teorema di Cauchy-Lipschitz di esistenza di soluzioni in grande)
Siano A := [a, b] × Rn ed f : A → Rn una funzione continua, limitata ed L-lipschitziana rispetto alla seconda variabile. Allora, per ogni
(x0 , y0 ) ∈]a, b[×Rn , esiste una ed sola soluzione u : [a, b] → Rn del problema
di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 .
Dimostrazione. Si ponga M := supx∈[a,b] ∥f (x, y0 )∥ e si consideri r > 0 tale che r >
M (b − a). A questo punto il Teorema 15.3.2 precedente fornisce un’unica soluzione
nell’intervallo [a, b] in quanto risulta δ1 := min{x0 − a, r/M } = x0 − a e δ2 := min{b −
x0 , r/M } = b − x0 .
Conviene osservare che l’ipotesi che l’intervallo [a, b] sia chiuso e limitato
può essere rimossa considerando un intervallo I arbitrario.
Teorema 15.3.4 Siano I un intervallo di R, A := I × Rn ed f : A →
Rn una funzione continua e tale che, per ogni intervallo [a, b] ⊂ I, la sua
restrizione ad [a, b] × Rn sia lipschitziana rispetto alla seconda variabile.
◦
Allora, per ogni (x0 , y0 ) ∈ I × Rn , esiste una ed sola soluzione u : I → Rn
del problema di Cauchy
{ ′
y = f (x, y) ,
y(x0 ) = y0 .
Dimostrazione. Infatti, dal Teorema 15.3.3, per ogni [a, b] ⊂ I tale che x0 ∈]a, b[, esiste
una ed una sola soluzione u : [a, b] → Rn del problema di Cauchy assegnato. Si consideri
ora una successione crescente (Jn )n∈N di intervalli chiusi e limitati tali che x0 sia interno
2 La funzione f è limitata per il teorema di Weierstrass, essendo continua in un insieme
chiuso e limitato.
Capitolo 15: Equazioni differenziali ordinarie
432
a ciascuno di essi e tale che l’unione sia coincida con I. Per ogni n ∈ N, si denoti con
un : Jn → Rn l’unica soluzione nell’intervallo Jn del problema di Cauchy assegnato. Si
riconosce allora facilmente che la funzione u : I → Rn definita ponendo, per ogni x ∈ I,
u(x) := un (x) dove n ∈ N è tale che x ∈ Jn è ben definita ed è l’unica soluzione del
problema di Cauchy assegnato definita in I.
15.4
Equazioni differenziali lineari
Sia I un intervallo di R e si considerino n+1 funzioni a0 , . . . , an : I → R con
an (x) ̸= 0 per ogni x ∈ I ed un’ulteriore funzione f : I → R. Si consideri
l’equazione differenziale di ordine n
an (x) y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = f (x) .
(15.4.1)
essa viene denominata equazione differenziale lineare di ordine n con coefficienti a0 , . . . , an e termine noto f .
Se f = 0, l’equazione (15.4.1) viene denominata omogenea, mentre se
f ̸= 0, essa viene denominata completa.
Poiché an assume valori sempre diversi da 0, si può dividere primo e
secondo membro per an (x) ed ottenere la (15.4.1) in forma normale.
Non è pertanto restrittivo supporre an (x) = 1 e considerare l’equazione
differenziale lineare in forma normale
y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = f (x) .
(15.4.2)
Una soluzione u : J → Rn dell’equazione differenziale (15.4.2) è pertanto
una funzione derivabile n volte in un intervallo J ⊂ I e tale che, per ogni
x ∈ J, si abbia
u(n) (x) + an−1 (x) u(n−1) (x) + · · · + a1 (x) u′ (x) + a0 (x) u(x) = f (x) .
Il problema di Cauchy per l’equazione differenziale lineare (15.4.2) si
(n−1)
) ∈ Rn e le
ottiene considerando x0 ∈ I ed una n-pla (y0 , y0′ , . . . , y0
condizioni
 (n)
y + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = f (x) ,




0 ) = y0 ,

 y(x
y ′ (x0 ) = y0′ ,
(15.4.3)

 ...



 (n−1)
(n−1)
y
(x0 ) = y0
.
In questo caso una soluzione u : J → Rn del problema di Cauchy (15.4.3) è
una soluzione dell’equazione differenziale (15.4.2) tale che x0 ∈ J ed inoltre
u(x0 ) = y0 ,
u′ (x0 ) = y0′ ,
... ,
(n−1)
u(n−1) (x0 ) = y0
.
15.4 Equazioni differenziali lineari
433
Per studiare l’esistenza e l’unicità della soluzione del problema di Cauchy, nel seguito si supporrà che le funzioni an−1 , . . . , a1 , a0 ed f siano
continue in I.
Si è visto in precedenza che le equazioni differenziali di ordine n possono
essere ricondotte ad un sistema di n equazioni differenziali del primo ordine
che nel caso dell’equazione differenziale (15.4.2) è il seguente
 ′
y = y2 ,


 1′

y

 2 = y3 ,
..
.



y′
= yn ,


 n−1
yn′ = −an−1 (x) yn − · · · − a1 (x) y2 − a0 (x) y1 + f (x) ,
Inoltre, il problema di Cauchy (15.4.3) si ottiene imponendo le ulteriori
condizioni
y1 (x0 ) = y0 ,
y2 (x0 ) = y0′ ,
... ,
(n−1)
yn (x0 ) = y0
.
Infine, il sistema precedente può essere espresso come un’unica equazione differenziale del primo ordine (vettoriale) y ′ = g(x, y) dove il secondo membro è la funzione g : I × Rn → Rn definita ponendo, per ogni
(x, y1 , . . . , yn ) ∈ I × Rn ,
g(x, y1 , . . . , yn ) := (y2 , y3 , . . . , yn , −an−1 (x)yn −· · ·−a1 (x)y2 −a0 (x)y1 +f (x)) .
Quindi le componenti di g sono date dalle funzioni g1 , . . . , gn : I × Rn → R
definite ponendo, per ogni (x, y1 , . . . , yn ) ∈ I × Rn ,

g1 (x, y1 , . . . , yn ) := y2 ,





 g2 (x, y1 , . . . , yn ) := y3 ,
..
.



 gn−1 (x, y1 , . . . , yn ) := yn ,


gn (x, y1 , . . . , yn ) := −an−1 (x) yn − · · · − a1 (x) y2 − a0 (x) y1 + f (x) .
Si dimostra ora che la funzione g verifica le ipotesi del Teorema 15.3.4.
Infatti, g è ovviamente continua ed inoltre, considerato un intervallo chiuso
e limitato [a, b] ⊂ I e posto
M := max max{|a0 (x)|, . . . , |an−1 (x)|} ,
x∈[a,b]
(tale massimo esiste per il teorema di Weierstrass, essendo i coefficienti ed il
termine noto continui nell’intervallo chiuso e limitato [a, b]), si ha, per ogni
Capitolo 15: Equazioni differenziali ordinarie
434
x ∈ [a, b], y = (y1 , . . . , yn ) ∈ Rn e z = (z1 , . . . , zn ) ∈ Rn ,
∥g(x, y) − g(x, z)∥2
= |g1 (x, y) − g1 (x, z)|2 + . . .
+|gn−1 (x, y) − gn−1 (x, z)|2 + |gn (x, y) − gn (x, z)|2
= (y2 − z2 )2 + · · · + (yn − zn )2
+ an−1 (x) (yn − zn ) + . . .
+a1 (x) (y2 − z2 ) + a0 (x) (y1 − z1 )
(
≤ ∥y − z∥2 + M 2 |yn − zn | + . . .
)2
+|y2 − z2 | + |y1 − z1 |
2
≤ ∥y − z∥2 + n2 M 2 ∥y − z∥2
= (1 + n2 M 2 ) ∥y − z∥2 ,
√
da cui ∥g(x, y) − g(x, z)∥ ≤ 1 + n2 M 2 ∥y − z∥. Quindi g è lipschitziana
rispetto alla seconda variabile in [a, b] × Rn .
Conseguentemente, tenendo conto delle Proposizioni 15.1.2 e 15.1.1, esiste sempre una ed una sola soluzione del problema di Cauchy (15.4.3) e tale
soluzione è definita in tutto l’intervallo I.
◃ Si studia ora come determinare le soluzioni dell’equazione differenziale
lineare (15.4.2).
Si considera innanzitutto l’equazione omogenea
y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = 0 ,
(15.4.4)
ottenuta dalla (15.4.2) e si osserva che l’insieme S delle sue soluzioni è un
sottospazio vettoriale di C(I) di dimensione n.
◦
Infatti S è ovviamente un sottospazio vettoriale di C(I). Sia ora x0 ∈ I e, per ogni
i = 1, . . . , n, si denoti con ui l’unica soluzione del problema di Cauchy
{ (n)
y
+ an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = 0 ,
(y(x0 ), y ′ (x0 ), . . . , y (n−1) (x0 )) = ei .
Si riconosce ora che le soluzioni u
1 , . . . , un sono linearmente indipendenti.
∑
n
Infatti, se c1 , . . . , cn ∈ R e
i=1 ci ui = 0, anche per le combinazioni lineari delle
derivate si ha
( n
)
n
∑
∑
(j−1)
j−1
ci u i
=D
ci ui = 0 ,
j = 1, . . . , n ,
i=1
i=1
e calcolandole in x0 si ottiene, per ogni j = 1, . . . , n,
n
∑
i=1
da cui cj = 0.
(j−1)
ci ui
(x0 ) = cj
15.4 Equazioni differenziali lineari
435
Infine, considerata u ∈ S e posto
c1 := u(x0 ) ,
c2 := u′ (x0 ) ,
... ,
cn := u(n−1) (x0 ) ,
dall’unicità della soluzione del problema di Cauchy segue u =
∑n
i=1 ci ui
(infatti le due
soluzioni verificano le stesse condizioni iniziali in x0 ). Quindi le funzioni u1 , . . . , un
costituiscono una base di S e ciò completa la dimostrazione.
◃ Per determinare tutte le soluzioni dell’equazione differenziale omogenea
(15.4.4), è quindi sufficiente trovare n soluzioni linearmente indipendenti
u1 , . . . , un . La soluzione generale della (15.4.4) sarà data da
y = c1 u1 + · · · + cn un ,
c1 , . . . , cn ∈ R .
Assegnate n soluzioni u1 , . . . , un della (15.4.4), si considera il Wronskiano
W : I → R definito ponendo, per ogni x ∈ I,
W (x) := det
u1 (x)
u′1 (x)
..
.
(n−1)
u1
(x)
u2 (x)
u′2 (x)
..
.
(n−1)
u2
...
...
..
.
(x) . . .
un (x)
u′n (x)
..
.
(n−1)
un
(
)
= det ui−1
.
j
i,j=1,...,n
(x)
(15.4.5)
Il seguente risultato riassume le proprietà più importanti del wronskiano.
Proposizione 15.4.1 (Teorema del Wronskiano)
Siano I un intervallo di R ed a0 , . . . , an−1 : I → R funzioni continue e si
consideri l’equazione differenziale lineare omogenea di ordine n
y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = 0 .
Se u1 , . . . , un : I → R sono sue soluzioni, allora le seguenti proposizioni
sono equivalenti
a) u1 , . . . , un sono linearmente indipendenti;
b) esiste x0 ∈ I tale che W (x0 ) ̸= 0;
c) per ogni x ∈ I si ha W (x) ̸= 0.
◃ Una volta determinate le soluzioni dell’equazione omogenea (15.4.4),
cioè n sue soluzioni indipendenti u1 , . . . , un , per risolvere l’equazione completa (15.4.2) è sufficiente trovare una sua soluzione particolare u. Infatti,
in tal caso, tutte le soluzioni della (15.4.2) sono date da
y = c1 u1 + · · · + cn un + u ,
c1 , . . . , c n ∈ R .
436
Capitolo 15: Equazioni differenziali ordinarie
◃ Tuttavia il metodo descritto risulta in generale di difficile applicazione
in quanto anche per le equazioni differenziali del secondo ordine non è immediato determinare due soluzioni linearmente indipendenti dell’equazione
omogenea.
Nel seguito si considerano alcuni casi in cui si può determinare facilmente
la soluzione generale.
15.4.1
Equazioni differenziali lineari del primo ordine
Siano I un intervallo di R, a, b : I → R funzioni continue e si consideri
l’equazione differenziale lineare del primo ordine
y ′ = a(x) y + b(x) .
(15.4.6)
Si verifica direttamente che, denotata con A : I → R una primitiva di a, la
funzione w : I → R definita ponendo, per ogni x ∈ I,
w(x) = eA(x)
è una soluzione dell’equazione omogenea y ′ = a(x) y (infatti w è derivabile
in I e per ogni x ∈ I si ha w′ (x) = A′ (x) eA(x) = a(x) w(x)).
Quindi tutte le soluzioni dell’omogenea sono date da
c∈R.
y = cw ,
Inoltre, una soluzione particolare dell’equazione completa (15.4.6) è la funzione u : I → R definita ponendo, per ogni x ∈ I,
u(x) = w(x) B(x) ,
dove B : I → R è una primitiva della funzione b(x) · e−A(x) (infatti, u è
derivabile in I e, per ogni x ∈ I,
u′ (x)
= w′ (x) B(x) + w(x) B ′ (x) = a(x) w(x) B(x) + b(x) w(x) e−A(x)
= a(x) u(x) + b(x) eA(x) e−A(x) = a(x) u(x) + b(x) ).
Pertanto, la soluzione generale della (15.4.6) è data data
y = cw + u = w · (c + B) ,
c∈R.
Se x0 ∈ I e y0 ∈ R, si riconosce inoltre direttamente che l’unica soluzione
del problema di Cauchy
{ ′
y = a(x) y + b(x) ,
y(x0 ) = y0 ,
è la funzione u : I → R definita ponendo, per ogni x ∈ I,
(
)
∫ x
∫
∫x
− t a(s) ds
a(t) dt
u(x) := e x0
y0 +
b(t) e x0
dt .
x0
15.4 Equazioni differenziali lineari
15.4.2
437
Equazioni differenziali lineari di ordine n a coefficienti costanti
Siano a0 , . . . , an−1 , an ∈ R con an ̸= 0, f : I → R una funzione continua in
un intervallo I di R e si consideri l’equazione differenziale lineare di ordine
n a coefficienti costanti
an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = f (x) .
(15.4.7)
Anche in questo caso per determinarne le soluzioni conviene dapprima
considerare l’equazione omogenea
an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = 0 .
(15.4.8)
L’equazione precedente viene discussa considerando il polinomio caratteristico p : R → R ad essa associato che è definito ponendo, per ogni λ ∈
R,
n
∑
p(λ) := an λn + an−1 λn−1 + · · · + a1 λ + a0 =
ai λ i .
i=0
Poiché p è un polinomio di grado n, esso ammette esattamente n zeri contati
ognuno con la propria molteplicità e poiché i coefficienti di p sono reali, gli
zeri saranno reali oppure complessi coniugati con la stessa molteplicità.
Ad ogni zero del polinomio caratteristico di molteplicità h ≥ 1 vengono fatte corrispondere esattamente h soluzioni linearmente indipendenti
dell’equazione omogenea (15.4.8) come precisato di seguito:
i) se λ0 ∈ R è uno zero reale di molteplicità h ≥ 1 di p, allora le funzioni
u1 , . . . , uh : R → R definite ponendo, per ogni x ∈ R,
u1 (x) := eλ0 x ,
u2 (x) := x eλ0 x ,
... ,
uh (x) := xh−1 eλ0 x
(se h = 1 si considera ovviamente solamente la funzione u1 ) sono
soluzioni linearmente indipendenti dell’equazione omogenea (15.4.8);
ii) se λ = α + iβ ∈ C con β ̸= 0 è uno zero complesso di molteplicità
h ≥ 1 di p, allora anche λ = α − iβ è uno zero di molteplicità h di
p e ai due zeri α ± iβ di molteplicità h si fanno corrispondere le 2h
soluzioni linearmente indipendenti u1 , . . . , uh , v1 , . . . , vh : R → R della
(15.4.8) definite ponendo, per ogni x ∈ R,
u1 (x)
u2 (x)
:=
:=
..
.
uh (x) :=
eα x cos(β x) ,
x eα x cos(β x) ,
v1 (x)
v2 (x)
:= eα x sin(β x) ,
:= x eα x sin(β x) ,
..
.
xh−1 eα x cos(β x) ,
vh (x) :=
xh−1 eα x sin(β x)
(se h = 1 si considerano ovviamente solamente le funzioni u1 e v1 ).
438
Capitolo 15: Equazioni differenziali ordinarie
Applicando il metodo sopra indicato ad ogni zero del polinomio caratteristico, si ottengono esattamente n soluzioni indipendenti u1 , . . . , un dell’equazione omogenea ed a questo punto la soluzione generale della (15.4.8)
è data da
y = c1 u1 + · · · + cn un ,
c1 , . . . , cn ∈ R .
◃ Si discute infine la determinazione di una soluzione particolare dell’equazione completa (15.4.7). A tale proposito si può cercare di applicare
uno dei due metodi discussi di seguito.
Termine noto particolare
Si supponga che P1 e P2 siano polinomi di grado r e rispettivamente s e
siano inoltre α ∈ R e β ∈ R. Si consideri la funzione f : R → R definita
ponendo, per ogni x ∈ R,
f (x) := P1 (x) eα x cos(β x) + P2 (x) eα x sin(β x) .
Allora, una soluzione particolare dell’equazione differenziale completa
an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = f (x) ,
può essere cercata nella forma
u(x) := xh (Q1 (x) eα x cos(β x) + Q2 (x) eα x sin(β x)) ,
x∈R,
dove h è la molteplicità di α±iβ come soluzione del polinomio caratteristico
associato all’equazione omogenea (se α ± iβ non è soluzione del polinomio
caratteristico si pone per convenzione h = 0) e Q1 e Q2 sono entrambi
polinomi di grado uguale ad m := max{r, s} con coefficienti da determinare.
Per determinare i coefficienti di Q1 e Q2 e quindi la soluzione particolare,
si procede come segue
1. Si calcolano le derivate u′ , . . . , u(n) fino all’ordine n di u;
2. Si sostituiscono u e le sue derivate nell’equazione completa e si impone
che u sia una soluzione dell’equazione completa;
3. Si semplifica primo e secondo membro per eα x ;
4. Se β = 0, si ottiene l’uguaglianza di due polinomi di grado m e dal
principio di uguaglianza dei polinomi, imponendo che i coefficienti
dei termini dello stesso grado di entrambi i membri siano uguali, si
ottiene un sistema lineare di m equazioni nelle m incognite costituite
dai coefficienti di Q1 (in questo caso Q2 = 0); risolvendo tale sistema,
si ottengono i coefficienti di Q1 e quindi la soluzione particolare u;
15.4 Equazioni differenziali lineari
439
5. Se β ̸= 0, si scrivono due equazioni ottenute considerando nella prima
solamente i termini con cos(β x) e nella seconda quelli con sin(β x); si
ottengono due equazioni che prevedono ciascuna l’uguaglianza di due
polinomi di grado m (dopo aver semplificato la prima per cos(β x)
e la seconda per sin(β x)); ancora dal principio di uguaglianza dei
polinomi, imponendo che i coefficienti dei termini dello stesso grado
di entrambi i membri siano uguali, si ottiene un sistema lineare di 2m
equazioni nelle 2m incognite costituite dai coefficienti di Q1 e Q2 = 0;
risolvendo tale sistema, si ottengono i coefficienti di Q1 e Q2 e quindi
la soluzione particolare u.
Il presente metodo si può applicare anche nel caso in cui il termine noto
sia somma di due funzioni f1 ed f2 del tipo sopra considerato. In questo caso
si considerano una soluzione particolare u1 relativa ad f1 ed una soluzione
particolare u2 relativa ad f2 e la soluzione particolare relativa alla somma
f = f1 + f2 viene data da u = u1 + u2 .
Infatti, risulta
an u(n) + an−1 u(n−1) + · · · + a1 u′ + a0 u
(n)
= an u1
+
(n−1)
+ an−1 u1
(n)
an u2
+
+ · · · + a1 u′1 + a0 u1
(n−1)
an−1 u2
+ · · · + a1 u′2 + a0 u2
= f1 (x) + f2 (x) = f (x) .
Metodo della variazione delle costanti arbitrarie di Lagrange
Si supponga ora che il termine noto f : I → R dell’equazione differenziale
completa
an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = f (x)
sia una funzione continua che non rientra tra quelle considerate nel caso
precedente. Si può allora ricorrere al metodo della variazione delle costanti
arbitrarie di Lagrange. Una volta determinate le n soluzioni linearmente
indipendenti u1 , . . . , un dell’equazione omogenea, tale metodo consiste nel
cercare una soluzione particolare della forma
u(x) := c1 (x) u1 (x) + · · · + cn (x) un (x) ,
(15.4.9)
dove c1 , . . . , cn : I → R sono funzioni da determinare (da qui deriva la
denominazione del metodo).
Capitolo 15: Equazioni differenziali ordinarie
440
Imponendo le condizioni previste nel seguente sistema di n equazioni
nelle incognite c′1 (x), . . . , c′n (x)
 ′
c1 (x) u1 (x) + · · · + c′n (x) un (x) = 0 ,




c′ (x) u′1 (x) + · · · + c′n (x) u′n (x) = 0 ,

 .1
..
(15.4.10)


(n−2)
(n−2)
′
′

c (x) u1
(x) + · · · + cn (x) un
(x) = 0 ,


 1′
(n−1)
(n−1)
′
c1 (x) u1
(x) + · · · + cn (x) un
(x) = f (x) ,
si riconosce che la corrispondente funzione u è una soluzione dell’equazione
completa.
u=
Infatti,
utilizzando le relazioni previste in (15.4.10), per le derivate della funzione
∑n
i=1 ci ui , si ha
u′
=
u′′
=
n
∑
i=1
n
∑
c′i ui +
c′i u′i +
i=1
n
∑
i=1
n
∑
ci u′i =
ci u′′
i =
i=1
n
∑
ci u′i ,
i=1
n
∑
ci u′′
i ,
i=1
.
..
u(n−1)
u(n)
=
=
n
∑
i=1
n
∑
c′i ui
(n−2)
c′i ui
(n−1)
i=1
+
+
n
∑
i=1
n
∑
(n−1)
ci ui
(n)
ci ui
=f
i=1
n
∑
(n−1)
ci u i
,
i=1
n
∑
(n)
+
ci ui ,
i=1
=
(il calcolo di ogni derivata utilizza l’espressione ottenuta nel passaggio precedente). A
questo punto si osserva che
u(n) + an−1 u(n−1) + · · · + a1 u′ + a0 u
(n−1)
+ · · · + a1 u′1 + a0 u1 )
(n−1)
+ · · · + a1 u′2 + a0 u2 )
(n−1)
+ · · · + a1 u′n + a0 un )
(n)
+ an−1 u1
(n)
+ an−1 u2
(n)
+ an−1 un
= f + c1 (u1
+c2 (u2
+...
+cn (un
e tenendo conto del fatto che u1 , . . . , un sono soluzioni dell’equazione omogenea, si ha
u(n) + an−1 u(n−1) + · · · + a1 u′ + a0 u = f ,
e quindi u è soluzione dell’equazione completa.
Il determinante dei coefficienti del sistema lineare (15.4.10) è proprio il
determinante della matrice Wronskiana W (x) e poiché le soluzioni u1 , . . . , un
sono linearmente indipendenti, esso è diverso da 0. Segue che il sistema (15.4.10) ammette un’unica soluzione c′1 (x), . . . , c′n (x) e considerandone
una loro primitiva, da quanto osservato si ottiene la soluzione particolare
(15.4.9).
Ulteriori riferimenti
L’elenco seguente può essere utile per un approndimento degli argomenti
trattati e per ulteriori esempi ed esercizi.
[1] T. M. Apostol, Calcolo, Vol. I e II, Boringhieri, Torino, 1977.
[2] A. Avantaggiati, Analisi Matematica I, Editrice Ambrosiana,
Milano, 1994.
[3] G. C. Barozzi, S. Matarasso, Analisi Matematica I, Zanichelli,
Bologna, 1986.
[4] P. Boieri, G. Chiti, Precorso di Matematica, Zanichelli, Bologna,
1994.
[5] V. E. Bononcini, G. Fanti, Esercizi di Analisi Matematica, Vol. I,
Cedam, Padova, 1970.
[6] N. Bourbaki, Elementi di storia della matematica, Feltrinelli, Milano,
1963.
[7] R. Caccioppoli, Lezioni di Analisi Matematica, Vol. I, Treves,
Napoli, 1959.
[8] F. Cafiero, A. Zitarosa, Lezioni di Analisi Matematica, Liguori
Editore, Napoli, 1970.
[9] S. Campanato, Lezioni di Analisi Matematica, prima parte, Libreria
Scientifica G. Pellegrini, Pisa, 1977.
[10] S. Campanato, Esercizi e complementi di Analisi Matematica, prima
parte, Libreria Scientifica G. Pellegrini, Pisa, 1975.
[11] M. Campiti, Analisi Matematica I, Teoria ed Esercizi, Liguori Editore,
Napoli, 1995.
442
Ulteriori riferimenti
[12] E. Casari, Questioni di filosofia della matematica, Feltrinelli, Milano,
1964.
[13] J. P. Cecconi, G. Stampacchia, Analisi Matematica, I: Funzioni di
una variabile, Liguori Editore, Napoli, 1974.
[14] J. P. Cecconi, G. Stampacchia, Esercizi e problemi di Analisi
Matematica, I: Funzioni di una variabile, Liguori Editore, Napoli, 1979.
[15] P. O. Cohen, La teoria degli insiemi e l’ipotesi del continuo,
Feltrinelli, Milano, 1973.
[16] F. Conti, Calcolo, Mc Graw-Hill, Milano, 1993.
[17] R. Courant, H. Robbins, Che cos’è la matematica?, Boringhieri,
Torino, 1971.
[18] P. De Lucia, R. Fiorenza, Esercizi di Analisi Matematica, Liguori
Editore, Napoli.
[19] N. Fedele, Corso di Analisi Matematica, Vol. I, Liguori Editore,
Napoli, 1988.
[20] R. Fiorenza, D. Greco, Lezioni di Analisi Matematica, Vol. I,
Liguori Editore, Napoli, 1985.
[21] P. R. Halmos, Teoria elementare degli insiemi, Feltrinelli, Milano,
1970.
[22] G. Geymonat, Lezioni di Analisi Matematica I, Editrice Levrotto &
Bella, Torino, 1981.
[23] A. Ghizzetti, Complementi ed esercizi di Analisi Matematica, Vol. I,
Libreria Veschi, Roma, 1956.
[24] A. Giannone, V. Conserva, Esercitazioni di Matematica, Adriatica
Editrice Salentina, Lecce, 1985.
[25] G. Gilardi, Analisi Uno, Mc Graw-Hill, Milano, 1991.
[26] E. Giusti, Analisi Matematica I, Boringhieri, Torino, 1983.
[27] D. Greco, G. Stampacchia, Esercitazioni di Matematica, Liguori
Editore, Napoli, 1966.
[28] H. J. Keisler, Elementi di Analisi Matematica, Vol. I, Piccin Editore,
Padova, 1982.
Ulteriori riferimenti
443
[29] E. Marcante, M. Montagnana, Lezioni di Analisi Matematica I,
Vol. I e II, Celid, Torino.
[30] P. Marcellini, C. Sbordone, Esercitazioni di Matematica, Vol. I,
Liguori Editore, Napoli, 1988.
[31] E. Mendelson, Introduzione alla logica matematica, Boringhieri,
Torino, 1972.
[32] C. Miranda, Lezioni di Analisi Matematica, Parte prima, Liguori
Editore, Napoli, 1966.
[33] C. D. Pagani, S. Salsa, Analisi Matematica I, Masson, Milano,
1994.
[34] E. R. Pegna, Studio analitico e grafico delle funzioni, Editrice Giorgio,
Torino.
[35] G. Pellacani, G. Pettini, C. Vettori, Istituzioni di Matematica,
Editrice Clueb, Bologna, 1977.
[36] M. Picone, G. Fichera, Corso di Analisi Matematica, Vol. I, Libreria
Veschi, Roma, 1975.
[37] G. Prodi, Analisi Matematica, Boringhieri, Torino, 1970.
[38] A. Schiaffino, Analisi Matematica I, Unitor, Roma, 1990.
[39] G. Scorza Dragoni, Elementi di Analisi Matematica, Cedam, Padova, 1966.
[40] V. I. Smirnov, Corso di Matematica Superiore I, Vol. I, Editori
Riuniti, Roma, 1977.
[41] F. Speranza, Relazioni e strutture, Zanichelli, Bologna, 1970.
[42] M. Stoka, Esercizi e problemi di Analisi Matematica I, Editrice
Levrotto & Bella, Torino, 1989.
[43] M. Stoka, V. Pipitone, Esercizi e problemi di Matematica, Cedam,
Padova, 1988.
[44] M. Stoka, G. Santoro, Esercizi e complementi di Matematica (per
i precorsi universitari), Cedam, Padova, 1988.
[45] M. Troisi, Analisi Matematica I, Liguori Editore, Napoli, 1985.
444
Ulteriori riferimenti
[46] The Open University, Introduzione all’analisi e all’algebra, Analisi,
Mondadori, Milano, 1974.
[47] F. G. Tricomi, Esercizi e complementi di Analisi Matematica, Cedam,
Padova, 1965.
[48] T. Viola, Introduzione alla teoria degli insiemi, Boringhieri, Torino,
1975.
[49] F. Waismann, Introduzione al pensiero matematico, Boringhieri,
Torino, 1971.
[50] M. Zamansky, Introduzione all’algebra e all’analisi moderna, Feltrinelli, Milano, 1966.
[51] G. Zwirner, Esercizi e complementi di Analisi Matematica, parte
prima, Cedam, Padova.
Michele Campiti
Dipartimento di Matematica “E. De Giorgi”
Università del Salento
P.O.Box 193
73100 Lecce
E-Mail: michele.campiti@unisalento.it
Download