Michele Campiti Analisi Matematica elementi principali della teoria y f 1 g 0 x a.a. 2011-2012 Per i corsi di “Analisi Matematica I & II ” della Facoltà di Ingegneria, Università del Salento In copertina: Grafico delle funzioni f (x) := exp(x) e g(x) := sin x Prefazione Il presente testo contiene gli elementi principali della teoria dei corsi di Analisi Matematica I e II ed è indirizzato principalmente agli studenti dei Corsi di Laurea in Scienze ed Ingegneria. In diversi capitoli è stato privilegiato l’obiettivo della sintesi degli argomenti trattati, e diverse parti della teoria sono state introdotte in modo da basare l’esposizione su un numero abbastanza contenuto di definizioni di base. Sono stati spesso anche utilizzati strumenti intuitivi, soprattutto per ciò che riguarda gli argomenti introduttivi quali la teoria degli insiemi, gli insiemi numerici e la topologia degli spazi euclidei. Tuttavia il presente testo non è concepito come un mero testo di calcolo; gli elementi della teoria sono stati esposti in modo da favorire la formazione scientifica degli studenti e da incentivare l’interesse verso un’analisi critica dei problemi posti. L’acquisizione di nuove nozioni è basata sull’utilizzo di quelle già apprese in modo da favorire il progressivo approfondimento dei risultati esposti. Sono ovviamente graditi suggerimenti e segnalazioni di errori da far pervenire preferibilmente per e-mail all’indirizzo: michele.campiti@unisalento.it. Michele Campiti Indice I Funzioni di una variabile reale 1 1 Preliminari 1.1 Cenni di calcolo proposizionale . . . . . . . . . . . . 1.1.1 Connettivi logici . . . . . . . . . . . . . . . . 1.1.2 Quantificatori . . . . . . . . . . . . . . . . . . 1.1.3 Notazioni insiemistiche . . . . . . . . . . . . . 1.1.4 Prodotto cartesiano e relazioni tra elementi insiemi . . . . . . . . . . . . . . . . . . . . . . 1.2 Relazioni funzionali e funzioni . . . . . . . . . . . . . 1.2.1 Immagini dirette e immagini reciproche . . . 1.2.2 Funzioni iniettive, suriettive e biiettive . . . . 1.2.3 Funzioni composte e funzioni inverse . . . . . . . . . . . . . . . . . . . . . di due . . . . . . . . . . . . . . . . . . . . . . . . . 12 17 19 21 23 2 Cenni sugli insiemi numerici 2.1 L’insieme dei numeri naturali e dei numeri interi 2.1.1 Principio di induzione . . . . . . . . . . . 2.1.2 Formula del binomio di Newton . . . . . . 2.1.3 Cenni di calcolo combinatorio . . . . . . . 2.2 L’insieme dei numeri razionali e reali . . . . . . . 2.2.1 Insiemi numerabili . . . . . . . . . . . . . 2.3 Proprietà dei sottoinsiemi di R . . . . . . . . . . 2.3.1 Intervalli di R . . . . . . . . . . . . . . . . 2.3.2 Valore assoluto e distanza in R . . . . . . 2.3.3 Rappresentazione geometrica di Rn , n ≤ 3 2.3.4 Sottoinsiemi limitati ed estremi . . . . . . 2.3.5 Intorni e punti di accumulazione . . . . . 2.3.6 La retta ampliata dei numeri reali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 29 31 32 34 36 39 41 41 42 44 47 50 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . 5 . 5 . 9 . 11 Indice iv 3 Numeri complessi e polinomi 3.1 Proprietà generali dei numeri complessi . . . 3.2 Richiami di trigonometria e coordinate polari 3.2.1 Coordinate polari . . . . . . . . . . . . 3.3 Forma trigonometrica dei numeri complessi . 3.4 Forma esponenziale dei numeri complessi . . 3.5 Polinomi ed equazioni algebriche . . . . . . . 3.5.1 Polinomi e relative radici . . . . . . . 3.5.2 Polinomi a coefficienti reali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 57 62 64 67 68 68 73 4 Funzioni reali 4.1 Operazioni con le funzioni reali . . . . . . . . . . . . . 4.2 Estremi di funzioni reali . . . . . . . . . . . . . . . . . 4.3 Proprietà di monotonia . . . . . . . . . . . . . . . . . 4.4 Proprietà di simmetria e periodicità . . . . . . . . . . 4.5 Successioni . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Numero di Nepero . . . . . . . . . . . . . . . . 4.6 Funzioni elementari . . . . . . . . . . . . . . . . . . . . 4.6.1 Funzioni potenza ad esponente intero positivo . 4.6.2 Funzioni radice . . . . . . . . . . . . . . . . . . 4.6.3 Funzione potenza ad esponente intero negativo 4.6.4 Funzioni potenza ad esponente razionale e reale 4.6.5 Funzioni esponenziali e logaritmiche . . . . . . 4.6.6 Funzioni trigonometriche . . . . . . . . . . . . 4.6.7 Funzioni trigonometriche inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 77 81 83 87 88 89 91 91 92 94 96 97 101 103 5 Equazioni e disequazioni 5.1 Equazioni e disequazioni razionali intere . . 5.2 Equazioni e disequazioni razionali fratte . . 5.3 Sistemi di equazioni e disequazioni . . . . . 5.4 Equazioni e disequazioni irrazionali . . . . . 5.5 Equazioni e disequazioni con valore assoluto 5.6 Metodo grafico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 109 112 114 116 119 122 . . . . . . . 127 . 127 . 129 . 132 . 134 . 135 . 141 . 143 6 Limiti delle funzioni reali 6.1 Definizione generale di limite . 6.2 Prime proprietà dei limiti . . . 6.3 Limiti destri e sinistri . . . . . 6.4 Teoremi di confronto . . . . . . 6.5 Operazioni sui limiti . . . . . . 6.6 Limiti delle funzioni monotone 6.7 Limiti delle funzioni elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Indice v 6.7.1 Funzioni potenza ad esponente intero positivo . 6.7.2 Funzioni radice . . . . . . . . . . . . . . . . . . 6.7.3 Funzioni potenza ad esponente intero negativo 6.7.4 Funzioni potenza ad esponente reale . . . . . . 6.7.5 Funzioni esponenziali . . . . . . . . . . . . . . . 6.7.6 Funzioni logaritmo . . . . . . . . . . . . . . . . 6.7.7 Funzioni trigonometriche . . . . . . . . . . . . 6.7.8 Funzioni trigonometriche inverse . . . . . . . . 6.8 Limiti di polinomi e funzioni razionali . . . . . . . . . 6.9 Limiti notevoli . . . . . . . . . . . . . . . . . . . . . . 6.10 Infinitesimi ed infiniti . . . . . . . . . . . . . . . . . . 6.10.1 Operazioni con infinitesimi ed infiniti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 144 145 145 145 146 146 147 147 149 154 157 7 Successioni e serie numeriche 7.1 Limiti di successioni . . . . . . . . . . . . . . . 7.1.1 Successioni estratte . . . . . . . . . . . . 7.1.2 Massimo e minimo limite . . . . . . . . 7.1.3 Criterio di convergenza di Cauchy . . . 7.1.4 Massimo e minimo limite per le funzioni 7.2 Serie numeriche . . . . . . . . . . . . . . . . . . 7.2.1 Definizioni e proprietà preliminari . . . 7.2.2 Serie a termini positivi . . . . . . . . . . 7.2.3 Serie alternanti . . . . . . . . . . . . . . 7.2.4 Proprietà algebriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 163 171 172 176 177 179 180 183 190 192 8 Funzioni continue 8.1 Definizioni e proprietà preliminari . . . . . . . 8.2 Funzioni continue su intervalli chiusi e limitati 8.3 Continuità delle funzioni monotone . . . . . . . 8.4 Funzioni uniformemente continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 197 201 205 207 . . . . . . . . 211 211 211 217 221 227 230 230 237 9 Calcolo differenziale 9.1 Funzioni derivabili . . . . . . . . . . . . . . . . . . . . . . . 9.1.1 Definizioni ed interpretazione geometrica . . . . . . 9.1.2 Regole di derivazione . . . . . . . . . . . . . . . . . . 9.1.3 Derivate delle funzioni elementari . . . . . . . . . . . 9.2 Teoremi di Rolle, Cauchy e Lagrange . . . . . . . . . . . . . 9.3 Applicazioni al calcolo dei limiti . . . . . . . . . . . . . . . . 9.3.1 Teoremi di L’Höpital . . . . . . . . . . . . . . . . . . 9.3.2 Formula di Taylor . . . . . . . . . . . . . . . . . . . 9.3.3 Simboli di Landau e applicazioni della formula di Taylor al calcolo dei limiti . . . . . . . . . . . . . . . . . . 244 Indice vi 9.4 Applicazioni allo studio del grafico delle funzioni reali . . 9.4.1 Monotonia e massimi e minimi relativi ed assoluti 9.4.2 Convessità, concavità e flessi . . . . . . . . . . . . 9.4.3 Asintoti . . . . . . . . . . . . . . . . . . . . . . . . 9.4.4 Studio del grafico di una funzione reale . . . . . . . . . . . 10 Calcolo integrale 10.1 L’integrale secondo Riemann . . . . . . . . . . . . . . . . . 10.1.1 Suddivisioni di un intervallo . . . . . . . . . . . . . . 10.1.2 Integrabilità delle funzioni limitate . . . . . . . . . . 10.1.3 Interpretazione geometrica e proprietà dell’integrale esteso . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.4 Primitive ed integrale indefinito . . . . . . . . . . . . 10.1.5 Integrali indefiniti immediati . . . . . . . . . . . . . 10.1.6 Prime regole di integrazione . . . . . . . . . . . . . . 10.2 Integrazione delle funzioni razionali . . . . . . . . . . . . . . 10.2.1 Caso m = 1 . . . . . . . . . . . . . . . . . . . . . . . 10.2.2 Caso m = 2 . . . . . . . . . . . . . . . . . . . . . . . 10.2.3 Caso m > 2 . . . . . . . . . . . . . . . . . . . . . . . 10.3 Integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . 10.3.1 Integrali impropri di funzioni non limitate . . . . . . 10.3.2 Integrali impropri su intervalli non limitati . . . . . . . . . . 246 246 254 262 265 271 . 271 . 271 . 272 . . . . . . . . . . . 278 281 286 288 290 291 291 292 294 294 301 II Equazioni differenziali e funzioni di più variabili reali 309 11 Successioni e serie di funzioni 11.1 Convergenza puntuale ed uniforme . . . . . . . . . 11.2 Proprietà del limite di una successione di funzioni . 11.3 Serie di funzioni . . . . . . . . . . . . . . . . . . . . 11.4 Serie di potenze . . . . . . . . . . . . . . . . . . . . 11.5 Serie ottenute per derivazione ed integrazione . . . 11.6 Serie di Taylor . . . . . . . . . . . . . . . . . . . . 11.6.1 Funzione esponenziale . . . . . . . . . . . . 11.6.2 Funzione logaritmo . . . . . . . . . . . . . . 11.6.3 Funzioni seno e coseno . . . . . . . . . . . . 11.6.4 Funzione arcotangente . . . . . . . . . . . . 11.6.5 La serie binomiale . . . . . . . . . . . . . . 11.6.6 La funzione arcoseno . . . . . . . . . . . . . 11.7 Serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 313 315 319 324 329 330 332 333 333 334 334 337 337 Indice 12 Calcolo differenziale in più variabili 12.1 Cenni sulla struttura metrica di Rn . . . . . . . 12.1.1 Prodotti scalari e norme . . . . . . . . . 12.1.2 Sfere ed insiemi aperti e chiusi . . . . . 12.1.3 Intervalli, rette e direzioni di Rn . . . . 12.2 Funzioni di più variabili . . . . . . . . . . . . . 12.3 Derivate direzionali e parziali e differenziabilità 12.3.1 Funzioni lineari . . . . . . . . . . . . . . 12.3.2 Derivate direzionali e parziali . . . . . . 12.3.3 Differenziabilità . . . . . . . . . . . . . . 12.3.4 Derivate successive e formula di Taylor . 12.3.5 Differenziabilità delle funzioni composte 12.4 Punti di massimo e minimo relativo . . . . . . 12.5 Massimo e minimo assoluto . . . . . . . . . . . 12.6 Massimi e minimi vincolati . . . . . . . . . . . vii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 343 343 349 351 353 356 357 358 360 368 372 374 378 380 13 L’integrale di Riemann in Rn 13.1 Cenni sulla teoria della misura di Peano-Jordan in Rn . 13.2 Cenni sull’integrale di Riemann in Rn . . . . . . . . . . 13.2.1 Integrazione su domini normali . . . . . . . . . . 13.2.2 Cambiamento di variabile negli integrali multipli . . . . . . . . . . . . 383 383 388 391 395 14 Curve, campi vettoriali e superfici 14.1 Curve regolari e lunghezza . . . . . . . . . . . . . 14.2 Integrali curvilinei e campi vettoriali conservativi 14.2.1 Integrali curvilinei . . . . . . . . . . . . . 14.2.2 Integrali curvilinei di un campo vettoriale 14.2.3 Campi vettoriali conservativi . . . . . . . 14.3 Superfici ed integrali superficiali . . . . . . . . . 14.4 Il teorema della divergenza e la formula di Stokes . . . . . . . . . . . . . . . . . . . . . 401 401 409 409 411 412 416 418 . . . . . 419 419 426 430 432 436 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Equazioni differenziali ordinarie 15.1 Introduzione e problema di Cauchy . . . . . . . . . . . . . . 15.2 Unicità della soluzione del problema di Cauchy . . . . . . . 15.3 Esistenza della soluzione del problema di Cauchy . . . . . . 15.4 Equazioni differenziali lineari . . . . . . . . . . . . . . . . . 15.4.1 Equazioni differenziali lineari del primo ordine . . . 15.4.2 Equazioni differenziali lineari di ordine n a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografia . 437 441 Elenco delle figure 1.1 1.2 13 1.13 Rappresentazione grafica del prodotto cartesiano di due insiemi. Rappresentazione grafica di una generica relazione tra elementi di due insiemi. . . . . . . . . . . . . . . . . . . . . . . . Rappresentazione grafica di una relazione riflessiva e di una non riflessiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . Rappresentazione grafica di una relazione simmetrica e di una non simmetrica. . . . . . . . . . . . . . . . . . . . . . . . Rappresentazione grafica di una relazione antisimmetrica e di una non antisimmetrica. . . . . . . . . . . . . . . . . . . . Rappresentazione grafica di una relazione funzionale. . . . . . Esempi di relazioni non funzionali. . . . . . . . . . . . . . . . Rappresentazione grafica di una funzione. . . . . . . . . . . . Rappresentazione grafica dell’immagine diretta. . . . . . . . . Rappresentazione grafica dell’immagine reciproca. . . . . . . . Rappresentazione grafica di una funzione iniettiva e di una funzione non iniettiva. . . . . . . . . . . . . . . . . . . . . . . Rappresentazione grafica di una funzione suriettiva e di una funzione non suriettiva. . . . . . . . . . . . . . . . . . . . . . Rappresentazione grafica di una funzione composta. . . . . . . 2.1 2.2 2.3 2.4 Rappresentazione geometrica dei numeri reali. Riferimento cartesiano non ortogonale. . . . . Riferimento cartesiano ortonormale. . . . . . Riferimento cartesiano dello spazio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 45 46 47 3.1 3.2 3.3 3.4 3.5 Circonferenza trigonometrica. . . . . . . . . . Interpretazione geometrica della tangente. . . Interpretazione geometrica della cotangente. . Coordinate polari. . . . . . . . . . . . . . . . Radici terze e quinte di un numero complesso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 61 62 64 67 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 1.11 1.12 14 15 15 16 18 18 19 20 21 22 23 24 Elenco delle figure x 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15 4.16 4.17 4.18 4.19 Esempio di massimo assoluto e relativo. . . . . . . . . . . . . 83 Funzione strettamente crescente (decrescente) in un intervallo. 84 Funzione strettamente crescente (decrescente) in un punto. . 86 Funzione potenza ad esponente pari (≥ 2). . . . . . . . . . . . 92 Funzione potenza ad esponente dispari (≥ 3). . . . . . . . . . 93 Funzione radice con indice pari. . . . . . . . . . . . . . . . . . 94 Funzione radice con indice dispari. . . . . . . . . . . . . . . . 95 Funzione potenza ad esponente intero negativo pari. . . . . . 95 Funzione potenza ad esponente intero negativo dispari. . . . . 96 Funzione potenza con esponente razionale o reale. . . . . . . . 98 Funzione esponenziale. . . . . . . . . . . . . . . . . . . . . . . 99 Funzione logaritmo. . . . . . . . . . . . . . . . . . . . . . . . 101 Funzioni seno e coseno. . . . . . . . . . . . . . . . . . . . . . 102 Funzione tangente. . . . . . . . . . . . . . . . . . . . . . . . . 103 Funzione cotangente. . . . . . . . . . . . . . . . . . . . . . . . 104 Funzione arcoseno. . . . . . . . . . . . . . . . . . . . . . . . . 105 Funzione arcocoseno. . . . . . . . . . . . . . . . . . . . . . . . 106 Funzione arcotangente. . . . . . . . . . . . . . . . . . . . . . . 107 Funzione arcocotangente. . . . . . . . . . . . . . . . . . . . . . 108 5.1 5.2 5.3 5.4 Metodo Metodo Metodo Metodo 6.1 6.2 Limiti di una funzione monotona. . . . . . . . . . . . . . . . . 144 Limite notevole sinx/x in 0. . . . . . . . . . . . . . . . . . . 151 7.1 Prodotto secondo Cauchy di due serie 8.1 8.2 Teorema degli zeri. . . . . . . . . . . . . . . . . . . . . . . . . 203 Approssimazione delle soluzioni con il teorema degli zeri. . . . 204 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 Interpretazione geometrica della derivata. . . . . . . . . . . Teorema di Rolle. . . . . . . . . . . . . . . . . . . . . . . . . Teorema di Lagrange. . . . . . . . . . . . . . . . . . . . . . Polinomi di Taylor. . . . . . . . . . . . . . . . . . . . . . . . Funzione convessa o concava in un punto e punti di flesso. . Asintoto orizzontale e verticale. . . . . . . . . . . . . . . . . Grafico della funzione. . . . . . . . . . . . . . . . . . . . . . Grafico della funzione. . . . . . . . . . . . . . . . . . . . . . grafico grafico grafico grafico per per per per le le le le disequazioni: disequazioni: disequazioni: disequazioni: Esempio Esempio Esempio Esempio 1 2 3 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 124 124 125 . . . . . . . . . . . . . 193 . . . . . . . . 215 228 230 239 257 263 268 270 10.1 Somma superiore ed inferiore relativa ad una suddivisione. . . 273 Elenco delle figure xi 10.2 Teorema della media integrale. . . . . . . . . . . . . . . . . . 282 12.1 Esempio di insieme connesso ma non convesso. . . . . . . . . 353 13.1 Esempio di insieme misurabile illimitato. . . . . . . . . . . . 387 13.2 Dominio di integrazione con trasformazione in coordinate polari. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397 Parte I Funzioni di una variabile reale Nella prima parte del corso, l’obiettivo principale riguarda lo studio delle funzioni reali di una variabile reale, attraverso lo studio dei limiti e del calcolo differenziale ed integrale. Per il raggiungimento di tale obiettivo vengono trattati non solo argomenti di carattere preliminare, quali gli insiemi con particolare riguardo a quelli numerici, le disequazioni e le funzioni elementari, ma anche diversi argomenti di carattere complementare, quali i numeri complessi, le successioni e le serie numeriche. Capitolo 1 Preliminari 1.1 1.1.1 Cenni di calcolo proposizionale Connettivi logici Innanzitutto conviene introdurre brevemente alcuni connettivi logici al fine di precisarne il loro significato e soprattutto il loro utilizzo. L’utilizzo del calcolo proposizionale risulta uno strumento molto utile nei casi in cui bisogna operare con enunciati che coinvolgono diversi connettivi contemporaneamente in quanto le regole introdotte per la manipolazione degli enunciati sono di carattere generale. Si precisa innanzitutto che il termine enunciato o proprietà è da intendere come un qualsiasi frase di senso compiuto. Un enunciato può essere vero o falso e, più in generale, può essere anche indecidibile (cioè né vero né falso) o contraddittorio (cioè vero e falso contemporaneamente); avranno però interesse per i nostri fini soltanto enunciati veri oppure enunciati falsi. Di solito gli enunciati vengono rappresentati con lettere corsive maiuscole; ad esempio: A, B, C, . . . , P, Q, . . . Facendo uso dei connettivi logici si possono introdurre nuovi enunciati partendo da enunciati assegnati. Uno dei più semplici connettivi logici è quello di negazione; assegnato un enunciato A, si conviene che il simbolo ⌉A (da leggersi “non A”) denoti la negazione dell’enunciato A; talvolta vengono usati anche i simboli ¬A e ∼ A. La negazione ⌉A dell’enunciato A risulta un enunciato vero se A è un enunciato falso e, viceversa, risulta un enunciato falso se A è un enunciato vero. Altri connettivi elementari sono quelli di disgiunzione logica e di congiunzione logica; assegnati gli enunciati A e B i simboli A ∨ B (“A o B”) e A ∧ B (“A e B”) denotano la disgiunzione logica e rispettivamente la con- Capitolo 1: Preliminari 6 giunzione logica degli enunciati A e B; l’enunciato A ∨ B risulta vero ogni qualvolta è vero almeno uno degli enunciati A e B (si tratta quindi di una disgiunzione debole, nel senso che A∨B è vero anche se A e B sono entrambi veri), mentre l’enunciato A ∧ B è vero solo nel caso in cui sono veri entrambi gli enunciati A e B. Introdotto il connettivo negazione “⌉”, gli ulteriori connettivi “∨” e “∧” non risultano tra loro indipendenti; si può infatti riconoscere facilmente che il significato dell’enunciato “A ∧ B” coincide con quello del seguente enunciato ⌉((⌉A) ∨ (⌉B)). ◃ Un altro connettivo utile è quello di implicazione logica; se A e B sono enunciati, la scrittura A ⇒ B (“A implica B”) è da intendersi come un’abbreviazione dell’enunciato “B ∨ (⌉A)”. Dunque “A ⇒ B” è vero se l’enunciato A è falso oppure se, supposto vero l’enunciato A, risulta vero anche l’enunciato B; conseguentemente, “A ⇒ B” risulta falso solo nel caso in cui l’enunciato A è vero e l’enunciato B è falso. Un ultimo connettivo logico è quello di equivalenza; se A e B sono enunciati, la scrittura A ⇔ B (“A equivale a B”) è da intendersi come un’abbreviazione di “(A ⇒ B) ∧ (B ⇒ A)”. L’equivalenza “A ⇔ B” è un enunciato vero se e solo se gli enunciati A e B sono entrambi veri oppure entrambi falsi. Ogni enunciato può essere sostituito, in ogni espressione logica, da un enunciato ad esso equivalente. Si riassumono ora alcune proprietà notevoli dei connettivi precedenti. ◃ Se A, B e C sono enunciati, allora: 1. ⌉(⌉A) ⇔ A. 2. A ∨ B ⇔ B ∨ A , A∧B ⇔B∧A. 3. A ⇔ A ∨ A , A⇔A∧A. 4. A ⇒ A ∨ B , A∧B ⇒A. 5. (A ∨ B) ∨ C ⇔ A ∨ (B ∨ C) , (A ∧ B) ∧ C ⇔ A ∧ (B ∧ C) . 6. (A ∨ B) ∧ C ⇔ (A ∧ C) ∨ (B ∧ C) , 7. A ⇔ A (A ∧ B) ∨ C ⇔ (A ∨ C) ∧ (B ∨ C) . (proprietà riflessiva dell’equivalenza). 8. Se A ⇔ B allora B ⇔ A (proprietà simmetrica dell’equivalenza). 9. Se A ⇔ B e B ⇔ C allora A ⇔ C valenza). 10. Se A ⇒ B e B ⇒ C allora A ⇒ C cazione). (proprietà transitiva dell’equi(proprietà transitiva dell’impli- 1.1 Cenni di calcolo proposizionale 7 11. (A ⇒ B) ⇔ (⌉B ⇒⌉A). Conviene inoltre tener presente la seguente regola di deduzione: “Se A è un enunciato vero e se è vera l’implicazione A ⇒ B, allora anche l’enunciato B è vero”. In alcuni casi, per stabilire la verità o la falsità di un enunciato, si possono utilizzare le seguenti tavole di verità, nelle quali si conviene di denotare con 1 o 0 i casi in cui un enunciato sia vero o rispettivamente falso. Nel caso in cui un enunciato sia composto mediante diversi enunciati, bisogna considerare tutte le possibili combinazioni che si possono presentare. Ad esempio, le tavole di verità degli enunciati A ∨ B e A ∧ B sono date da A 1 1 0 0 B 1 0 1 0 A 1 1 0 0 A∨B 1 1 1 0 B 1 0 1 0 A∧B 1 0 0 0 e racchiudono il fatto che la disgiunzione logica è falsa (assume il valore 0) solo quando entrambi gli enunciati sono falsi, mentre la congiunzione logica è vera (assume il valore 1) solo quando entrambi gli enunciati sono veri. Le tavole di verità relative agli altri connettivi logici sono le seguenti A 1 0 ⌉A 0 1 A 1 1 0 0 B 1 0 1 0 A⇒B 1 0 1 1 A 1 1 0 0 B 1 0 1 0 A⇔B 1 . 0 0 1 Esempi ed esercizi 1. Considerati gli enunciati: A = “Antonio vive a Roma e a Milano”, B = “Domani andrò allo stadio o al cinema”, C = “Un foglio di quaderno è macchiato”, scrivere gli enunciati: ⌉A, ⌉B, ⌉C, A ∨ B, A ∨ (⌉C), (⌉B) ∧ C (Esempio: ⌉A = “Antonio o non vive a Roma o non vive a Milano”). Capitolo 1: Preliminari 8 2. Scrivere la negazione dei seguenti enunciati: A = “Tutti i gatti hanno tre zampe”, B = “Il mio gatto ha tre zampe”, C = “Esiste un gatto con tre zampe”. 3. Dire se le seguenti implicazioni sono vere: 1 + 1 = 2 ⇒ “La logica è sempre corretta”, 1 + 1 ̸= 2 ⇒ “La logica è sempre corretta”, 1 + 1 ̸= 2 ⇒ “La logica non è sempre corretta”, 1 + 1 = 2 ⇒ “La logica non è sempre corretta”, 1 + 1 = 2 ⇒ “La logica talvolta è corretta”, 1 + 1 ̸= 2 ⇒ “La logica talvolta è corretta”, 4. Scrivere le tavole di verità degli enunciati: (A ⇒ B) ∨ (⌉A); , (A ⇒ B) ∧ A , (A∨⌉C) ⇔ B , (⌉B) ∨ C ⇒ A ∧ B (ad esempio, si scrive la tavola di verità dell’ultimo enunciato: A 1 1 1 1 0 0 0 0 B 1 1 0 0 1 1 0 0 C 1 0 1 0 1 0 1 0 ⌉B 0 0 1 1 0 0 1 1 (⌉B) ∨ C 1 0 1 1 1 0 1 1 A∧B 1 1 0 0 1 1 0 0 (⌉B) ∨ C ⇒ A ∧ B 1 1 0 ). 0 1 1 0 0 Dalla precedente tavola di verità si deduce anche che l’enunciato considerato è equivalente al solo enunciato B, in quanto ne assume gli stessi valori di verità. Le tavole di verità costituiscono pertanto anche un utile strumento per semplificare un enunciato complesso assegnato. 1.1 Cenni di calcolo proposizionale 1.1.2 9 Quantificatori Nel seguito si denoteranno con lettere maiuscole gli insiemi e con lettere minuscole gli elementi di un insieme (la distinzione tra oggetti ed insiemi si riferisce al contesto considerato e non è una distinzione assoluta). Per indicare che un oggetto x è un elemento (rispettivamente, non è un elemento) di un insieme E, si scrive x ∈ E (“x appartiene ad E” oppure “x è elemento di E”) (rispettivamente, x ∈ / E (“x non appartiene ad E” oppure “x non è elemento di E”)). Tra i simboli logici di uso frequente vi sono i quantificatori, definiti come segue: ∀ Quantificatore universale “per ogni”. Per esprimere la circostanza in cui una proprietà P (assegnata per ogni elemento x di un insieme E) sia sempre verificata, si scrive ∀ x ∈ E : P(x) (si legge “per ogni x in E si ha P(x))”. Il simbolo “:” ha la funzione di abbreviazione linguistica e si legge “si ha che” oppure “risulta che”. ∃ Quantificatore esistenziale “esiste”. Per esprimere la circostanza in cui una proprietà P (assegnata per ogni elemento x di un insieme E) sia verificata per almeno un elemento, si scrive ∃ x ∈ E t.c. P(x) (si legge “esiste x in E tale che P(x))”. Il simbolo “t.c.” ha la funzione di abbreviazione linguistica e si legge “tale che”. In molti casi viene utilizzato anche il simbolo ∋′ come abbreviazione di tale che. Nel caso in cui esista esattamente un unico elemento di x ∈ E per cui P(x) sia vera si scrive ∃|x ∈ E t.c. P(x) (si legge “esiste un unico x in E tale che P(x))”. L’uso di tali simboli è da intendersi nel modo seguente. Sia E un insieme e si supponga di poter attribuire a ciascun elemento x ∈ E una proprietà P(x), vera o falsa (ad esempio, E potrebbe denotare l’insieme delle parole di un vocabolario e, per ogni x ∈ E, P(x)=“la parola x è formata da più di dieci lettere”). Allora la scrittura ∃ x ∈ E : P(x) significa “esiste un elemento x di E che verifica la proprietà P(x)” (nell’esempio “esiste una parola con più di dieci lettere”), mentre la scrittura ∀ x ∈ E : P(x) significa che “ogni elemento x di E verifica la proprietà P(x)” (nell’esempio, “ogni parola è formata da più di dieci lettere”). Capitolo 1: Preliminari 10 Si noti che le affermazioni precedenti non sono l’una la negazione dell’altra. La negazione di ∃ x ∈ E : P(x) è infatti “∀ x ∈ E : P(x) è falsa”, cioè “∀ x ∈ E : ⌉P(x)”, mentre la negazione di ∀ x ∈ E : P(x) è “∃ x ∈ E : P(x) sia falsa”, cioè “∃ x ∈ E : ⌉P(x)”. In alcuni casi oltre all’esistenza di un elemento che verifica una certa proprietà, si vuole affermare anche la sua unicità. È utile pertanto introdurre il simbolo ∃| che si utilizza nell’espressione ∃| x ∈ E : P(x) per affermare che “esiste uno ed un solo elemento x in E tale che la proprietà P(x) sia vera”. Si riconosce facilmente la validità delle seguenti proprietà, che chiariscono come si comportano i quantificatori in presenza di altri connettivi logici. Si intendono fissati un insieme E e le proprietà P(x) e Q(x) definite per ogni x ∈ E. 1. ⌉(∀ x ∈ E : P(x)) ⇔ ∃ x ∈ E : ⌉P(x) ⌉(∃ x ∈ E : P(x)) ⇔ ∀ x ∈ E : ⌉P(x) ; ad esempio, negare che tutti gli italiani abbiano una o più automobili, significa affermare che esiste un italiano che non ha alcuna automobile, mentre negare che esista un italiano che ha una o più automobili, significa affermare che tutti gli italiani non hanno un’automobile. 2. (∃ x ∈ E : P(x) ∨ Q(x)) ⇔ (∃ x ∈ E : P(x)) ∨ (∃ x ∈ E : Q(x)) 3. (∀ x ∈ E : P(x) ∧ Q(x)) ⇔ (∀ x ∈ E : P(x)) ∧ (∀ x ∈ E : Q(x)) 4. (∃ x ∈ E : P(x) ∧ Q(x)) ⇒ (∃ x ∈ E : P(x)) ∧ (∃ x ∈ E : Q(x)) 5. (∀ x ∈ E : P(x)) ∨ (∀ x ∈ E : Q(x)) ⇒ (∀ x ∈ E : P(x) ∨ Q(x)) Si osservi che nelle ultime due proprietà non vale l’equivalenza; infatti se, ad esempio, E denota l’insieme {0, 1, 2} e se, per ogni x ∈ E, si pone P(x) = “x ≤ 1” e Q(x) =“x = 2”, si vede facilmente che gli enunciati (∃ x ∈ E : P(x)) e (∃ x ∈ E : Q(x)) sono entrambi veri (e quindi è vera la loro congiunzione logica) mentre l’enunciato (∃ x ∈ E : P(x) ∧ Q(x)) è evidentemente falso. Analogamente, se si considerano le proprietà, definite per ogni x ∈ E, P(x) = “x ≤ 1” e Q(x) =“x ≥ 1”; allora l’enunciato “∀ x ∈ E : P(x) ∨ Q(x)” è vero, mentre ciascuno degli enunciati “∀ x ∈ E : P(x)′′ e“∀ x ∈ E : Q(x)” è falso (e quindi è falsa la loro disgiunzione logica). La prima proprietà, apparentemente banale, consente di eseguire correttamente la negazione anche di enunciati complessi, in cui l’intuizione 1.1 Cenni di calcolo proposizionale 11 potrebbe invece incontrare difficoltà. Infatti, è sufficiente osservare che la negazione di un quantificatore universale si ottiene considerando il quantificatore esistenziale seguito dalla negazione, e viceversa, la negazione di un quantificatore esistenziale si ottiene considerando il quantificatore universale seguito dalla negazione (cioè ⌉(∀ x ∈ E : . . . ) equivale a ∃ x ∈ E : ⌉(. . . ) mentre ⌉(∃ x ∈ E : . . . ) equivale a ∀ x ∈ E : ⌉(. . . )). Ad esempio, si considerino tre insiemi E, F e G e sia P(x, y, z) una proprietà che dipende dagli elementi x ∈ E, y ∈ F e z ∈ G. Allora la negazione dell’enunciato ∀ x ∈ E : ∃ y ∈ F : ∀ z ∈ G : P(x, y, z) è data da ∃ x ∈ E : ∀ y ∈ F : ∃ z ∈ G : ⌉P(x, y, z) . Esempi ed esercizi 1. Dire se sono veri i seguenti enunciati: “−2 è un numero naturale”, “5 è n numero intero”, “−7 è un numero razionale”. 2. Scrivere la negazione dei seguenti enunciati A = “∀ x ∈ E : ∃ y ∈ E : P(x, y) ,” B = “∃ x ∈ E : ∀ y ∈ E : P(x, y) ,” (ad esempio, la negazione dell’enunciato A è data da ∃ x ∈ E : ∀ y ∈ E : ⌉P(x, y) ). Nelle sezioni seguenti sono raggruppate alcune delle notazioni adoperate nel seguito del testo. 1.1.3 Notazioni insiemistiche Gli insiemi vengono solitamente rappresentati con lettere maiuscole: E, F, . . . ed i loro elementi con lettere minuscole: x, y, . . . . Un insieme contenente gli oggetti a, b, c, . . . si può indicare con {a, b, c, . . . }; inoltre, se E è un insieme assegnato e se, per ogni x ∈ E è assegnata anche una proprietà P(x), l’insieme degli elementi di E per cui la proprietà è vera si denota con {x ∈ E | P(x)}. Se in particolare viene assegnata una proprietà che non è soddisfatta da alcun elemento di E (ad esempio, P(x) =“x non è un elemento di E), si ottiene un insieme privo di elementi, che viene denominato insieme vuoto e denotato con ∅. L’insieme vuoto ∅ è caratterizzato dal fatto di non avere elementi. Inoltre, si assumono le seguenti notazioni: Capitolo 1: Preliminari 12 ∈ Simbolo di appartenenza. La notazione “x ∈ E” afferma che l’oggetto x appartiene all’insieme (oppure è elemento di) E). La negazione di tale circostanza si esprime scrivendo “x ∈ / E”. ⊂ Simbolo di inclusione. La notazione “E ⊂ F ” afferma che l’insieme E è contenuto nell’insieme (oppure è un sottoinsieme di) F , cioè gli elementi di E sono anche elementi di F . La negazione di tale circostanza si esprime scrivendo “E ̸⊂ F ”. ∩ Simbolo di intersezione. La notazione “E ∩ F ” denota l’insieme costituito dagli elementi che appartengono sia ad E che ad F . Più in generale, se I è un insieme e per ogni i ∈ I è assegnato un insieme Ei , l’insieme intersezione costituito dagli ∩ elementi che appartengono a tutti gli insiemi Ei viene denotato con Ei . Due insiemi E ed F si dicono disgiunti se E ∩ F = ∅. i∈I ∪ Simbolo di unione. La notazione “E ∪ F ” denota l’insieme costituito dagli elementi che appartengono o ad E oppure ad F (cioè ad almeno uno dei due insiemi). Inoltre, se per ogni i ∈ I è assegnato un insieme Ei , l’insieme unione costituito dagli elementi che ∪ appartengono ad almeno uno degli insiemi Ei viene denotato con Ei . i∈I { Simbolo di complementare. Se E è un sottoinsieme di F , la notazione “{F (E)” denota l’insieme costituito dagli elementi di F che non appartengono ad E. r Simbolo di differenza di insiemi. La notazione “F r E” denota l’insieme costituito dagli elementi di F che non appartengono ad E. Si ha ovviamente F r E = {F (E ∩ F ). 1.1.4 Prodotto cartesiano e relazioni tra elementi di due insiemi In questa sezione viene introdotto il prodotto cartesiano di due o più insiemi e inoltre vengono dati alcuni cenni sulle relazioni tra elementi di due insiemi. L’obiettivo principale sarà quello di introdurre in maniera precisa il concetto di funzione utilizzando le relazioni cosiddette funzionali. Per completezza, verranno citate anche alcune tra le proprietà principali di una relazione. Se x ed y sono oggetti distinti, l’insieme {x, y} viene denominato coppia non ordinata (se x = y, si ottiene l’insieme {x} ridotto al solo elemento x). Per quanto riguarda l’insieme {x, y}, non ha alcuna rilevanza l’ordine con il quale compaiono i due elementi x ed y; invece nella coppia ordinata (x, y) 1.1 Cenni di calcolo proposizionale 13 di prima coordinata x e seconda coordinata y l’ordine in cui compaiono gli elementi diventa di importanza sostanziale. Precisamente, si può porre (x, y) = {{x}, {x, y}} per differenziare il ruolo dei due elementi; tuttavia nel seguito si preferirà basarsi su una definizione intuitiva nelle dimostrazioni. Pertanto, si ha (a, b) = (c, d) se e solo se a = c e b = d. In modo del tutto analogo, assegnati tre oggetti x, y e z, si può definire la terna ordinata (x, y, z). Nel caso in cui x1 , x2 , . . . , xn siano n oggetti (n ≥ 2), si definisce con lo stesso metodo la n-pla ordinata di prima coordinata x1 , di seconda coordinata x2 , . . . , ed n-esima coordinata xn . Se E ed F sono due insiemi, si può considerare l’insieme di tutte le coppie ordinate con prima coordinata in E e seconda coordinata in F . Tale insieme viene denominato insieme prodotto di E per F e viene denotato con il simbolo E × F ; se E = F , si può anche scrivere E 2 anziché E × E. Il prodotto cartesiano E × F può essere rappresentato geometricamente indicando gli elementi dell’insieme E su un segmento disposto orizzontalmente e gli elementi di F su un segmento disposto verticalmente; gli elementi del prodotto (coppie ordinate) sono allora rappresentati come elementi del rettangolo in Figura 1.1. y P • (x, y) F x E Figura 1.1: Rappresentazione grafica del prodotto cartesiano di due insiemi. Si osservi che se l’insieme E è formato da n elementi distinti e l’insieme F è formato da m elementi distinti, allora il prodotto cartesiano E × F possiede esattamente n · m elementi distinti. In modo analogo si considera il prodotto cartesiano E × F × G di tre insiemi E, F e G; esso è l’insieme delle terne ordinate la cui prima coordinata è un elemento di E, la seconda coordinata è un elemento di F e la terza coordinata è un elemento di G. Più in generale, se E1 , E2 , . . . , En sono n insiemi (n ≥ 2), si può definire il prodotto cartesiano E1 × E2 × · · · × En come l’insieme delle n-ple ordinate (x1 , . . . , xn ) tali che x1 ∈ E1 , . . . xn ∈ En . Anche in questo caso, se E1 = E2 = · · · = En = E, si utilizza il simbolo E n per denotare il prodotto E1 × E2 × · · · × En . Capitolo 1: Preliminari 14 Si introduce ora il concetto di relazione tra elementi di due insiemi assegnati. Siano E ed F due insiemi. Una relazione tra elementi di E ed elementi di F è semplicemente un sottoinsieme del prodotto cartesiano E × F . Figura 1.2: Rappresentazione grafica di una generica relazione tra elementi di due insiemi. Poiché in particolare ∅ ⊂ E × F e E × F ⊂ E × F , tra le relazioni tra un insieme E ed un insieme F vanno sempre considerate la relazione vuota ∅ e la relazione totale E × F . Il fatto che una coppia (x, y) ∈ E × F appartenga alla relazione R indica che l’elemento x di E è in relazione R con l’elemento y di F . Per denotare questa circostanza si scrive anche xRy anziché (x, y) ∈ R. ◃ Se in particolare E = F , una relazione R ⊂ E 2 viene denominata relazione su E. Si osservi che in questo caso, se E viene rappresentato geometricamente con un segmento, allora il prodotto cartesiano E 2 diventa un quadrato. Le relazioni su un insieme E possono avere particolari proprietà. Per enunciarle, si fissi una relazione R su un insieme E. Allora • Proprietà riflessiva. Si dice che R è riflessiva se soddisfa la seguente condizione: ∀ x ∈ E : (x, x) ∈ R . La proprietà riflessiva si esprime dicendo che ogni elemento di E è in relazione R con sé stesso. Geometricamente, è molto semplice riconoscere che una relazione R è riflessiva se e solo se essa contiene la diagonale principale di E 2 (vedasi la Figura 1.3 • Proprietà simmetrica. seguente condizione: Si dice che R è simmetrica se soddisfa la ∀ x, y ∈ E : (x, y) ∈ R ⇒ (y, x) ∈ R . 1.1 Cenni di calcolo proposizionale 15 Figura 1.3: Rappresentazione grafica di una relazione riflessiva e di una non riflessiva. La proprietà simmetrica si esprime dicendo che se un elemento x di E è in relazione R con un altro elemento y di E, allora anche y è in relazione R con x. Anche in questo caso geometricamente è molto semplice riconoscere che una relazione R è simmetrica se e solo se essa è simmetrica rispetto alla diagonale principale di E 2 (vedasi la Figura 1.4 Figura 1.4: Rappresentazione grafica di una relazione simmetrica e di una non simmetrica. • Proprietà antisimmetrica. Si dice che R è antisimmetrica se soddisfa la seguente condizione: ∀ x, y ∈ E : (x, y) ∈ R ∧ (y, x) ∈ R ⇒ x = y . La proprietà antisimmetrica si esprime dicendo che se accade contemporaneamente che un elemento x di E sia in relazione R con un elemento y di E e y è in relazione R con x, allora necessariamente x = y. Nella Figura 1.5 sono rappresentate geometricamente una relazione R antisimmetrica e una relazione R non antisimmetrica. 16 Capitolo 1: Preliminari Figura 1.5: Rappresentazione grafica di una relazione antisimmetrica e di una non antisimmetrica. • Proprietà transitiva. Si dice che R è transitiva se soddisfa la seguente condizione: ∀ x, y, z ∈ E : (x, y) ∈ R ∧ (y, z) ∈ R ⇒ (x, z) ∈ R . In questo caso si rinuncia ad una rappresentazione geometrica in quanto non vi è una caratterizzazione elementare come nei precedenti casi. Le precedenti proprietà consentono di introdurre le seguenti due importanti classi di relazioni su un insieme E: • Si dice che una relazione R su un insieme E è una relazione d’equivalenza su E se essa è riflessiva, simmetrica e transitiva. • Si dice che una relazione R su un insieme E è una relazione d’ordine su E se essa è riflessiva, antisimmetrica e transitiva. Alcuni esempi di relazioni di equivalenza sono: • Le parole di un vocabolario che cominciano con la stessa lettera. In questo caso E è l’insieme delle parole del vocabolario ed R = {(x, y) ∈ E 2 | x e y cominciano con la stessa lettera}. Analogamente si possono considerare le parole che terminano con la stessa lettera, che fanno rima, che hanno lo stesso numero di lettere e cosı̀ via. • La classe di appartenenza tra gli abitanti di una città. In questo caso E è l’insieme degli abitanti della città ed R = {(x, y) ∈ E 2 | x e y hanno la stessa età}. Analogamente si possono considerare la città natale, l’iscrizione alla stessa scuola e cosı̀ via. • Sull’insieme N = {0, 1, 2, . . . } dei numeri naturali, la relazione R1 = {(n, m) ∈ N2 | n è primo con m} oppure R2 = {(n, m) ∈ N2 | la somma di n ed m è pari }. 1.2 Relazioni funzionali e funzioni 17 mentre i seguenti sono esempi riguardanti alcune relazioni d’ordine: • I files più grandi (come dimensioni) tra quelli di un computer. In questo caso E è l’insieme dei files presenti nel computer ed R = {(x, y) ∈ E 2 | x ha una dimensione maggiore o uguale a quella di y}. Analogamente si possono considerare i files più recenti, quelli modificati più volte, ecc. • L’ordine alfabetico tra le parole di un vocabolario. In questo caso E è l’insieme delle parole del vocabolario ed R = {(x, y) ∈ E 2 | x precede o coincide con y secondo l’ordine alfabetico}. • Il numero di matricola tra gli studenti universitari. In questo caso E è l’insieme degli studenti iscritti ad una Università ed R = {(x, y) ∈ E 2 | Il numero di matricola di x è minore o uguale di quello di y}. • La relazione d’ordine naturale tra i numeri naturali, interi, razionali e reali. • La relazione di inclusione tra i sottoinsiemi di un assegnato insieme E è una relazione d’ordine sull’insieme dei sottoinsiemi di E. In questo caso, assegnato un insieme E, si ha R = {(A, B) ∈ P(E)2 | A ⊂ B} (P(E) denota l’insieme di tutti i sottoinsiemi di E). 1.2 Relazioni funzionali e funzioni Si considera ora un’ulteriore proprietà delle relazioni che sarà alla base della definizione di funzione. Siano E ed F insiemi e sia R ⊂ E × F una relazione tra elementi di E ed elementi di F . Si dice che R è una relazione funzionale tra elementi di E ed elementi di F se essa verifica la seguente condizione: ∀ x ∈ E ∃ | y ∈ F t.c. (x, y) ∈ R . (1.2.1) Quindi in una relazione funzionale ogni elemento di E è in relazione con uno ed un solo elemento y di F . Graficamente questa condizione si può descrivere affermando che le rette verticali passanti per i punti di E intersecano la relazione in uno ed un solo punto, come si vede nella Figura 1.6. Nella Figura 1.7 successiva vengono mostrati invece due casi in cui la definizione precedente non è verificata. A questo punto si può definire in maniera precisa il concetto di funzione. 18 Capitolo 1: Preliminari Figura 1.6: Rappresentazione grafica di una relazione funzionale. Figura 1.7: Esempi di relazioni non funzionali. Siano E ed F insiemi. Si dice funzione da E in F ogni terna ordinata f = (E, F, R) dove R è una relazione funzionale tra elementi di E ed elementi di F . Intuitivamente assegnare una funzione vuol dire assegnare tre oggetti: un insieme di partenza E (denominato anche insieme di definizione oppure dominio di f ), un insieme di arrivo F e una relazione funzionale R denominata grafico della funzione, che rappresenta la ‘corrispondenza’ che ad ogni elemento dell’insieme di partenza associa uno ed un solo elemento dell’insieme di arrivo. Viene quindi richiesta agli elementi di E di soddisfare la condizione prevista dalla definizione di relazione funzionale e precisamente che ad ogni elemento x ∈ E corrisponda uno ed un solo elemento di F . Ciò consente di dare la seguente definizione. Il valore che una funzione f assume in un elemento x ∈ E viene denotato con f (x) e rappresenta l’unico elemento y di F tale che (x, y) ∈ R. Quindi la relazione funzionale può essere scritta nel modo seguente: R = {(x, y) ∈ E × F | y = f (x)} . (1.2.2) Da tale descrizione segue che è equivalente assegnare il grafico della 1.2 Relazioni funzionali e funzioni 19 funzione oppure alternativamente assegnare il valore f (x) delle funzione f in ogni punto x ∈ E. Si osservi che il concetto di funzione non prevede che gli elementi di F soddisfino alcuna condizione. Molto frequentemente si prenderanno in esame proprietà riguardanti una generica funzione che ha E come insieme di partenza ed F come insieme di arrivo. In tali circostanze si rpeferirà la notazione f : E → F (oppure f talvolta E → F oppure x 7→ f (x)). Graficamente, una funzione viene rappresentata con uno dei seguenti grafici: Figura 1.8: Rappresentazione grafica di una funzione. 1.2.1 Immagini dirette e immagini reciproche Sia ora f : E → F una funzione di E in F . Se A è un sottoinsieme di E, si denomina immagine diretta di A mediante f , e la si denota con f (A), il seguente sottoinsieme di F : f (A) := {y ∈ F | ∃ x ∈ A t.c. f (x) = y} . (1.2.3) L’immagine diretta di E mediante f viene denominata semplicemente immagine di f (oppure insieme dei valori di f ) e denotata anche con Im(f ). Quindi: f (E) := {y ∈ F | ∃ x ∈ E t.c. f (x) = y} . Graficamente l’immagine diretta si può rappresentare come nella Figura 1.9. Se si considerano i sottoinsiemi particolari ∅ ed E stesso di E, si può affermare quanto segue: f (∅) = ∅ , f (E) ⊂ F ; Capitolo 1: Preliminari 20 Figura 1.9: Rappresentazione grafica dell’immagine diretta. quindi l’insieme dei valori è in generale solamente contenuto in F e non uguale ad F (le funzioni per le quali vale l’uguaglianza f (E) = F verranno considerate nel seguito è verranno denominate suriettive). Si osserva inoltre che se A1 ⊂ E e A2 ⊂ E e se A1 ⊂ A2 , si ha f (A1 ) ⊂ f (A2 ). Inoltre se A1 ⊂ E e A2 ⊂ E sono due arbitrari sottoinsiemi di E, si può affermare che: f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ) , f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ) . Nell’ultima relazione non vale in generale l’uguaglianza, come si può riconoscere considerando ad esempio una funzione costante e due sottoinsiemi A1 e A2 non vuoti e disgiunti. ◃ Sia assegnata ora una funzione f : E → F e si consideri un sottoinsieme B di F . Si definisce immagine reciproca (oppure immagine indiretta o −1 controimmagine) di B mediante f , e la si denota con f (B), il seguente sottoinsieme di E: −1 f (B) := {x ∈ E | f (x) ∈ B} . (1.2.4) −1 Se si considera y ∈ F , la controimmagine f ({y}) viene anche denotata −1 −1 con f (y). Si osservi che f (y) può risultare vuota se la funzione f non assume il valore y in alcun elemento x ∈ E (come si vedrà nel seguito, tale circostanza non si verifica se la funzione è suriettiva). Inoltre, qualora −1 f (y) sia non vuota, non è detto che essa sia costituita da un solo elemento x ∈ E; le funzioni per le quali quest’ultima condizione è soddisfatta verranno considerate di seguito e denominate iniettive. Graficamente l’immagine reciproca si può rappresentare come nella Figura 1.10. 1.2 Relazioni funzionali e funzioni 21 Figura 1.10: Rappresentazione grafica dell’immagine reciproca. Se si considerano i sottoinsiemi particolari ∅ ed F stesso di F , si può affermare quanto segue: −1 f (∅) = ∅ , −1 f (F ) = E . Quindi in questo caso vale l’uguaglianza come diretta conseguenza della definizione di funzione. −1 Si osserva inoltre che se B1 ⊂ F e B2 ⊂ F e se B1 ⊂ B2 , si ha f −1 (B1 ) ⊂ f (B2 ). Inoltre se B1 ⊂ F e B2 ⊂ F sono due arbitrari sottoinsiemi di F , si può affermare che: −1 −1 −1 f (B1 ∪ B2 ) = f (B1 )∪ f (B2 ) , 1.2.2 −1 −1 −1 f (B1 ∩ B2 ) = f (B1 )∩ f (B2 ) . Funzioni iniettive, suriettive e biiettive Siano come al solito E ed F insiemi arbitrari e sia f : E → F una funzione da E in F . Si osservi che nella definizione di funzione viene richiesto solo agli elementi di E di soddisfare una precisa condizione mentre non vi è alcuna analoga richiesta sugli elementi di F . In particolare, considerato un elemento y ∈ F non è detto che esistano degli elementi x ∈ E tali che y = f (x) ed anche quando questa condizione è soddisfatta non si può in generale assicurare che tale elemento x (corrispondente ad y) sia unico. L’unicità e l’esistenza di un “corrispondente” elemento x per ogni elemento y ∈ F è alla base delle seguenti definizioni. Si dice che f è iniettiva (o anche ingettiva) se verifica la seguente condizione: x, y ∈ E, x ̸= y ⇒ f (x) ̸= f (y) (1.2.5) Capitolo 1: Preliminari 22 o equivalentemente x, y ∈ E, f (x) = f (y) ⇒ x = y . Quindi in questo caso per ogni elemento y ∈ F può esistere al più un solo elemento x ∈ E tale che y = f (x). Questa condizione si può esprimere graficamente affermando che ogni retta orizzontale interseca il grafico della funzione in al più in un punto (vedasi la Figura 1.11). Figura 1.11: Rappresentazione grafica di una funzione iniettiva e di una funzione non iniettiva. Si osservi che nel caso delle funzioni iniettive non è detto che, assegnato un elemento y ∈ F , esista sempre un elemento x ∈ E tale che y = f (x); infatti la condizione prevista nella definizione di funzione iniettiva prevede solamente l’unicità di tale elemento nel caso in cui esista. La seguente definizione invece prende in esame l’esistenza di un “corrispondente” elemento x ∈ E per ogni elemento y ∈ F . Sia f : E → F una funzione da E in F . Si dice f è suriettiva (o anche surgettiva) se essa verifica la seguente condizione ∀ y ∈ F ∃ x ∈ E t.c. f (x) = y . (1.2.6) Tenendo presente che f (E) è l’insieme di tutti i valori della funzione f , si riconosce subito che la condizione precedente è equivalente alla seguente: f (E) = F . Infatti se f è suriettiva si ha sempre f (E) ⊂ F e quindi bisogna dimostrare l’inclusione inversa F ⊂ f (E) cioè che ogni elemento di F è un valore della funzione, il che è assicurato dalla definizione di suriettività. Viceversa si supponga f (E) = F . Allora ogni elemento di F appartiene a f (E) e per definizione di f (E) deve esistere un elemento x ∈ E tale che y = f (x) il che dimostra che f è suriettiva. 1.2 Relazioni funzionali e funzioni 23 Quindi in questo caso per ogni elemento y ∈ F deve esistere almeno un elemento x ∈ E tale che y = f (x). Questa condizione si può esprimere graficamente affermando che ogni retta orizzontale interseca il grafico della funzione in almeno un punto (vedasi la Figura 1.12). Figura 1.12: Rappresentazione grafica di una funzione suriettiva e di una funzione non suriettiva. ◃ Infine, una funzione f : E → F viene denominata biiettiva (o anche bigettiva) se essa è contemporaneamente iniettiva e suriettiva. Dalle (1.2.6) e (1.2.5), la proprietà di biiettività si caratterizza come segue: ∀ y ∈ F ∃ | x ∈ E t.c. f (x) = y . (1.2.7) In questo caso graficamente ogni retta orizzontale interseca il grafico di f in uno ed un solo punto. Si ritrova quindi la stessa condizione richiesta sugli elementi di E agli elementi questa volta di F . Per questo motivo, come si vedrà di seguito, le funzioni biiettive possono essere collegate all’esistenza di una funzione inversa, che sarà definita in maniera opportuna. 1.2.3 Funzioni composte e funzioni inverse Un’ulteriore operazione importante tra funzioni è quella di funzione composta. Siano assegnati E, F e G insiemi e siano f : E → F una funzione di E in F e g : F → G una funzione di F in G. Si denomina funzione composta di f e g, e la si denota con g ◦ f “g cerchietto f ” la funzione avente E come insieme di partenza, G come insieme di arrivo e tale che, per ogni x ∈ E, (g ◦ f )(x) := g(f (x)) . (1.2.8) Quindi l’elemento di G corrispondente ad un elemento x ∈ E mediante la funzione composta viene ottenuto considerando il valore f (x) ∈ F di f Capitolo 1: Preliminari 24 in x e di questo elemento cosı̀ ottenuto considerandone successivamente il valore g(f (x)) mediante g. Intuitivamente, la funzione composta quindi con un unico passaggio fa corrispondere all’elemento x ∈ E l’elemento g(f (x)) di G, come mostra la Figura 1.13. Figura 1.13: Rappresentazione grafica di una funzione composta. Si osserva che l’operazione di funzione composta è associativa nel senso che se h : G → H è un’ulteriore funzione da G in un insieme H, allora (h ◦ g) ◦ f = h ◦ (g ◦ f ) e quindi si può denotare la funzione cosı̀ ottenuta semplicemente con h◦g◦f . Non vale invece una proprietà commutativa per l’operazione di funzione composta. Infatti, nelle ipotesi in cui si può considerare la funzione composta g ◦ f non è detto che si possa considerare f ◦ g e anche quando ciò dovesse accadere non è detto che valga l’uguaglianza g ◦ f = f ◦ g. Si osserva invece che l’operazione di funzione composta ammette un elemento neutro a sinistra e a destra. Per precisare questo, assegnato un qualsiasi insieme E, si consideri la funzione iE : E → E definita ponendo, per ogni x ∈ E, iE (x) = x . Allora è facile riconoscere che se f : E → F è un’arbitraria funzione da E in F si ha iF ◦ f = f , f ◦ iE = f . In realtà, la funzione composta può essere definita in circostanze più generali, in cui non è necessario che l’insieme di arrivo di f coincida con l’insieme di partenza di g; è sufficiente, infatti, che l’insieme di arrivo di f sia un sottoinsieme di F affinchè continui ad avere senso la definizione (1.2.8). Pertanto, se f : E → F1 e g : F2 → G sono funzioni tali che f (E) ⊂ F2 si può considerare la funzione composta che viene denotata ancora con il simbolo g◦f : E → G definita ponendo, per ogni x ∈ E, (g◦f )(x) = g(f (x)). 1.2 Relazioni funzionali e funzioni 25 Ciò sarà utile per le funzioni reali che per convenzione avranno sempre l’insieme R dei numeri reali come insieme di arrivo. In tal caso sarà possibile comporre tali funzioni con un’ulteriore funzione reale anche se quest’ultima non è definita in tutto R purché lo sia sull’insieme dei valori della prima funzione. A questo proposito, si richiamano alcune convenzioni valide per le funzioni reali. Spesso tali funzioni vengono assegnate precisando solamente il valore y = f (x) assunto in un generico elemento x senza precisare né l’insieme di partenza né quello di arrivo. In questi casi l’insieme di arrivo è sempre da intendere come tutto R, mentre l’insieme di partenza è il sottoinsieme più grande di R per il quale l’espressione f (x) ha significato. Ciò, nel caso di funzioni composte, consente di imporre in maniera diretta la condizione che la seconda funzione sia definita sui valori della prima funzione. Ad esempio, assegnata √ la funzione y = log x si impone la condizione x ≥ 1 che consente di affermare che log x ∈ [0, +∞[, insieme in sui è definita la funzione radice. ◃ Risulta utile in pratica saper riconoscere le funzioni dalle quali è composta un’assegnata funzione e ciò per le funzioni reali si ottiene facilmente osservando come viene calcolato il valore√ di una funzione. 3 Ad esempio, la funzione f (x) = 2sin x si√ottiene componendo successivamente la funzione radice terza x 7→ y = 3 x, la funzione seno y 7→ z = sin y e la funzione esponenziale z 7→ 2z di base 2. ◃ Si considera ora il concetto di funzione invertibile da intendersi intuitivamente come una funzione per la quale esiste un’ulteriore funzione che svolge un compito inverso rispetto a quello della funzione f , e cioè che ad un valore assunto in un determinato punto da f fa corrispondere esattamente il punto nel quale tale valore è stato assunto e tale che f verifichi la stessa proprietà rispetto ai valori assunti da tale funzione. Precisamente, sia f : E → F una funzione da E in F . Si dice che f è invertibile se esiste un’ulteriore funzione g : F → E tale che ∀ x ∈ E : g(f (x)) = x , ∀ y ∈ F : f (g(y)) = y . (1.2.9) Si riconosce facilmente che la funzione g verificante la condizione (1.2.9) è unica e viene denominata inversa di f e denotata con il simbolo f −1 . Dalla (1.2.9) segue ∀ x ∈ E : f −1 (f (x)) = x , ∀ y ∈ F : f (f −1 (y)) = y (1.2.10) e tenendo presente la definizione di funzione composta f −1 ◦ f = iE , f ◦ g = iF . Da ciò segue anche immediatamente che se f è invertibile anche la sua inversa f −1 lo è ed ha come inversa la funzione f , cioè (f −1 )−1 = f . 26 Capitolo 1: Preliminari Come si è anticipato in precedenza, la proprietà di biiettività consente di definire una funzione che ha le stesse proprietà dell’inversa di una funzione assegnata. Tale proprietà viene chiarita dal seguente risultato. Teorema 1.2.1 Siano E ed F insiemi e sia f : E → F una funzione da E in F . Allora le seguenti proposizioni sono equivalenti: a) La funzione f è invertibile. b) La funzione f è biiettiva. Dimostrazione. Si supponga che f sia invertibile e sia f −1 : F → E la sua inversa. Per verificare che f è iniettiva siano x, y ∈ E tali che f (x) = f (y). Allora si ha anche f −1 (f (x)) = f −1 (f (y)) e dalle poprietà delle funzioni inverse x = y. Quindi f è iniettiva. Si dimostra ora che f è suriettiva. Sia y ∈ F e si consideri l’elemento x = f −1 (y) ∈ E. Allora, ancora dalle proprietà delle funzioni inverse, f (x) = f (f −1 (y)) = y e ciò dimostra la proprietà di suriettività. Viceversa si supponga ora che f sia biiettiva. Dalla proprietà (1.2.7), si può definire la funzione g : F → E ponendo, per ogni y ∈ F , { x∈E, g(y) = x , dove x è l’unico elemento di E tale che f (x) = y . Si verifica ora che la funzione g è l’inversa della funzione f . Sia x ∈ E; allora, per come è definita la funzione g, si ha g(f (x)) = x1 dove x1 è l’unico elemento di E tale che f (x1 ) = f (x); dall’unicità di x1 segue x1 = x e quindi g(f (x)) = x. Infine, sia y ∈ F ; allora g(y) è l’unico elemento di x ∈ E tale che f (x) = y e quindi f (g(y)) = f (x) = y. Quindi è stata verificata la proprietà (1.2.9) da cui g = f −1 . Mentre la definizione di funzione invertibile non fornisce indicazioni su come definire l’inversa, tali informazioni sono invece disponibili dalla definizione di funzione biiettiva, da cui l’importanza del risultato precedente. Precisamente, dalla dimostrazione del teorema precedente, segue che se f : E → F è invertibile allora la sua inversa è la funzione f −1 : F → E definita ponendo, per ogni y ∈ F , { x∈E, −1 f (y) := x , dove (1.2.11) f (x) = y . Bisogna infine tener presente che la proprietà di biiettività è molto semplice da riconoscere geometricamente, come si è visto in precedenza, mentre quella di invertibilità richiede di individuare la funzione g che risulta esserne l’inversa. Anche per questo motivo il teorema precedente è un utile strumento per riconoscere facilmente l’invertibilità di una funzione. ◃ In molte circostanze, una funzione verifica una determinata proprietà (per esempio, quella di essere iniettiva oppure biiettiva) non su tutto l’insieme di partenza, ma su di un particolare sottoinsieme di esso. In tali 1.2 Relazioni funzionali e funzioni 27 casi, può risultare utile ricorrere al seguente concetto di restrizione di una funzione. Siano assegnati una funzione f : E → F ed un sottoinsieme A di E. Si denomina restrizione di f all’insieme A, e si denota con f|A , la funzione da A in F definita ponendo, per ogni x ∈ A, f|A (x) := f (x) . (1.2.12) Quindi i valori della restrizione sono gli stessi della funzione; la restrizione f|A tuttavia risulta definita nel sottoinsieme A anziché nell’intero insieme E. Il concetto di restrizione risulta utile soprattutto nei casi in cui si voglia ottenere una funzione iniettiva partendo da una funzione arbitraria; in tali casi infatti si considera un particolare sottoinsieme in cui la proprietà di iniettività è soddisfatta. D’altra parte, è sempre possibile ottenere una funzione suriettiva partendo da una qualsiasi funzione; infatti, se f : E → F è una funzione da E in F , si può considerare la ridotta di f , che si denota con f# , ed è definita in E, ha f (E) come insieme di arrivo e inoltre, per ogni x ∈ E, f# (x) := f (x) . (1.2.13) Si conclude la presente sezione con qualche precisazione riguardante le funzioni reali, cioè aventi l’insieme R dei numeri reali come insieme di arrivo. Il fatto di avere tutto R come insieme di arrivo richiede che l’eventuale inversa sia definita in tutto R. Tuttavia, si può utilizzare il seguente procedimento per definire un’inversa anche nel caso di funzioni reali iniettive ma non suriettive (quindi non aventi tutto R come insieme dei valori). Sia X un sottoinsieme di R e sia f : X → R una funzione reale iniettiva. Allora la sua ridotta f# : X → f (X) è iniettiva (in quanto i valori della ridotta sono gli stessi di quelli della funzione) e suriettiva (in quanto le ridotte sono sempre suriettive). Quindi f# è invertibile e si può considerare la funzione inversa (f# )−1 : f (X) → X; si ricorda che, per ogni y ∈ f (X), risulta (f# )−1 (y) = x dove x è l’unico elemento di X tale che f (x) = f# (x) = y. A questo punto si definisce la seguente funzione f −1 : f (X) → R ponendo, per ogni y ∈ f (X), { x∈X, −1 f (y) = x , dove x è l’unico elemento tale che f (x) = y . La funzione f −1 viene ancora denominata inversa di f e denotata di conseguenza con il simbolo f −1 . 28 Capitolo 1: Preliminari La funzione f −1 risulta iniettiva in quanto assume gli stessi valori della funzione (f# )−1 (che è invertibile e quindi biiettiva) mentre può non essere suriettiva (lo è solo se X = R) in quanto i suoi valori appartengono sempre all’insieme X. In questo modo si è definita quindi l’inversa di una funzione iniettiva. Capitolo 2 Cenni sugli insiemi numerici 2.1 L’insieme dei numeri naturali e dei numeri interi L’insieme dei numeri naturali: 0, 1, 2, 3, . . . viene denotato con il simbolo N. Tra le proprietà algebriche di N ci si limita a segnalare il fatto che in N sono definite due operazioni algebriche, l’addizione + : N × N → N e la moltiplicazione · : N × N → N che hanno le seguenti proprietà • (Proprietà associativa) Per ogni n, m, p ∈ N si ha (n + m) + p = n + (m + p) , (n · m) · p = n · (m · p) . Come conseguenza di tale proprietà, la somma e il prodotto di n, m e p potranno essere denotati semplicemente con n+m+p e rispettivamente con n · m · p. • (Proprietà commutativa) Per ogni n, m ∈ N si ha n+m=m+n, n·m=m·n. • (Esistenza dell’elemento neutro) Per ogni n ∈ N si ha n + 0 = n (= 0 + n) , n · 1 = n (= 1 · n) . Quindi lo 0 è l’elemento neutro per l’addizione mentre 1 è l’elemento neutro per la moltiplicazione. Capitolo 2: Cenni sugli insiemi numerici 30 Oltre alle proprietà precedenti valgono anche le seguenti proprietà distributive, per ogni n, m, p ∈ N n · (m + p) = n · m + n · p . (A secondo membro si è usata la convenzione che in espressioni in cui intervengono sia somme che prodotti, i prodotti vanno eseguiti per primi nell’ordine in cui compaiono e poi le somme nell’ordine in cui compaiono.) Sull’insieme dei numeri naturali è definita anche la seguente relazione d’ordine: ∀ n, m ∈ N : n ≤ m ⇔ ∃ h ∈ N t.c. m = n + h . Si verificano facilmente le proprietà riflessiva, antisimmetrica e transitiva per tale relazione che quindi viene ad essere una relazione d’ordine. Tra le sue proprietà conviene tener presente la compatibilità con l’addizione ∀ n, m, p ∈ N : n≤m ⇒ n+p≤m+p e con la moltiplicazione ∀ n, m, p ∈ N, p ̸= 0 : n≤m ⇒ n·p≤m·p. Inoltre la relazione d’ordine di N è una relazione di totale ordine, nel senso che due qualsiasi numeri naturali sono paragonabili mediante questa relazione: ∀ n, m ∈ N : (n ≤ m) ∨ (m ≤ m) , da cui segue che, per ogni coppia (n, m) di numeri naturali è vera una ed una sola delle seguenti affermazioni: n<m, n=m, m<m (la scrittura n < m è da intendersi come abbreviazione di (n ≤ m) ∧ (n ̸= m)). Nonostante le proprietà elencate, dal punto di vista della risoluzione di equazioni algebriche (cioè equazioni in cui compaiono solamente somme e prodotti) N non è molto soddisfacente: alcune semplici equazioni come n + 1 = 0 non ammettono alcuna soluzione in N. Se si considera l’insieme Z dei numeri interi relativi: . . . , -3, -2, -1, 0, 1, 2, 3, . . . , si ottiene un insieme in cui valgono tutte le proprietà algebriche precedenti e inoltre per l’addizione vale la seguente proprietà • (Esistenza dell’inverso per l’addizione) Per ogni n ∈ Z esiste m ∈ Z tale che n + m = 0 (= m + n) . 2.1 L’insieme dei numeri naturali e dei numeri interi 31 L’elemento m previsto nella proprietà precedente è inoltre unico e viene denominato opposto di n e denotato con −n. Quindi n + (−n) = 0. La proprietà precedente consente di considerare in Z l’operazione di sottrazione ponendo, per ogni n, m ∈ Z, n − m = n + (−m) . Anche in Z si può definire una relazione d’ordine nel modo seguente: ∀ n, m ∈ Z : n≤m ⇔ m−n∈N, che continua ad essere compatibile con l’addizione e la moltiplicazione in Z e che risulta anch’essa di totale ordine. Tuttavia anche in Z se da un lato si può risolvere l’equazione precedente n + 1 = 0 (proprio sottraendo 1 a primo e secondo membro) è facile trovare equazioni che non possono essere risolte, come ad esempio 2n + 1 = 0. Per trovare una soluzione di quest’ultima equazione bisogna ricorrere anche in questo caso ad un insieme più grande. Prima di occuparci di tale aspetto, conviene però considerare separatamente un’ulteriore proprietà dei numeri naturali. 2.1.1 Principio di induzione Per quanto riguarda l’insieme dei numeri naturali, si richiama la seguente proprietà, la cui dimostrazione è basata sulle proprietà della relazione d’ordine di N. Proposizione 2.1.1 (Principio di induzione completa) Se A è un sottoinsieme di N tale che { 1) 0∈A, 2) n∈A ⇒ n+1∈A, allora A = N. Si supponga che, per ogni n ∈ N, sia assegnata una proprietà P(n); applicando il principio di induzione all’insieme A := {n ∈ N | P(n)}, si riconosce che se P(0) è vera e se, supposta vera P(n) per un fissato n ∈ N, risulta vera anche P(n + 1), allora la proprietà P(n) è vera per ogni n ∈ N. Naturalmente, se anzichè considerare 0 come punto iniziale si considera un numero naturale n0 , si avrà che la proprietà P(n) sarà vera per ogni n ≥ n0 . La proprietà precedente è equivalente a quella cosiddetta di buon ordine di N, che afferma che ogni sottoinsieme di N è dotato del più piccolo elemento, cioè A ⊂ N ⇒ ∃ n0 ∈ A t.c. ∀ n ∈ A : n0 ≤ n . Capitolo 2: Cenni sugli insiemi numerici 32 Infatti si supponga che valga il principio di induzione completa e sia A un sottoinsieme non vuoto di N. Se 0 ∈ A si ha che 0 è ovviamente il più piccolo elemento di A e quindi A è dotato del più piccolo elemento. Si supponga ora 0 ∈ / A e si ponga B = {n ∈ N | ∀ k = 0, . . . , n : k ∈ / A} (quindi gli elementi di B sono minori o uguali di tutti gli elementi di A). Ovviamente 0 ∈ B. Se, per ogni n ∈ B, si ha n + 1 ∈ B allora B verifica le ipotesi del principio di induzione completa da cui B = N. Segue che A = ∅ e ciò è assurdo. Quindi deve esistere n0 ∈ B tale che n0 + 1 ∈ / B. Allora, per ogni k = 0, . . . , n0 , si ha k ∈ / A mentre n0 + 1 ∈ A e quindi n0 + 1 è il più piccolo elemento di A. Viceversa si supponga che valga la proprietà di buon ordine di N e sia A un sottoinsieme di N tale che 0 ∈ A e tale che n ∈ A ⇒ n + 1 ∈ A. Se fosse A ̸= N allora il complementare B = N r A sarebbe non vuoto e quindi sarebbe dotato del più piccolo elemento n0 . Si osserva che n0 > 0 in quanto 0 ∈ A; quindi si può considerare n0 − 1 che deve essere in A in quanto n0 è il più piccolo elemento di B e n0 − 1 < n0 . Ma n0 − 1 ∈ A ⇒ n0 = (n0 − 1) + 1 ∈ A e ciò è assurdo in quanto n0 ∈ B. Quindi si piò concludere che A = N. ◃ Si osserva infine che la proprietà di buon ordine implica quella di totale ordine di N: infatti se n, m ∈ N basta applicare la proprietà di buon ordine all’insieme A = {n, m} per ottenere la validità di una delle relazioni n ≤ m oppure m ≤ n. La proprietà di buon ordine, e quindi anche il principio di induzione completa, non valgono in Z (basta considerare come sottoinsieme A tutto Z). 2.1.2 Formula del binomio di Newton Il principio di induzione completa consente di riconoscere agevolmente la seguente formula del binomio di Newton. È necessario tuttavia introdurre alcune notazioni preliminari. Innanzitutto, conviene richiamare la definizione di fattoriale di un numero naturale: 0! := 1 , ∀ n ∈ N : (n + 1)! := (n + 1) · n! . (2.1.1) Si possono definire ora i coefficienti binomiali. Se n ∈ N ( e)k = 0, . . . , n, n si definisce coefficiente binomiale n su k, e si denota con , il seguente k numero naturale: ( ) n n! n(n − 1) · · · (n − k + 1) := = . (2.1.2) k k! (n − k)! k! Il motivo per cui tale numero viene denominato coefficiente binomiale risulterà chiaro dallo studio della formula del binomio di Newton. Si possono elencare le seguenti proprietà elementari dei coefficienti binomiali. 2.1 L’insieme dei numeri naturali e dei numeri interi 1. Per ogni n ∈ N, si ha 33 ( ) ( ) n n = 1, = 1. 0 n 2. Per ogni n ≥ 2 e k = 1, . . . , n − 1, si ha ( ) n n · (n − 1) · · · (n − k + 1) = . k k! 3. Per ogni n ∈ N e k = 0, . . . , n ( ) ( ) n n = . n−k k 4. Per ogni n ≥ 1 e k = 1, . . . , n, si ha ( ) ( ) ( ) n+1 n n = + . k k k−1 Infatti, dalla definizione, (n) ( n ) n! n! (n − k + 1) · n! + k · n! + = + = k k−1 k!(n − k)! (k − 1)!(n − k + 1)! k!(n − k + 1)! (n + 1) (n + 1)! (n + 1) · n! = = . = k k!(n − k + 1)! k!(n − k + 1)! Proposizione 2.1.2 (Formula del binomio di Newton) Per ogni a, b ∈ R ed n ≥ 1, si ha: n ( ) ∑ n k n−k n (a + b) = a b . k k=0 Dimostrazione. Se n = 1, la tesi è ovvia. Si supponga ora che la tesi sia vera per un numero naturale n ≥ 1. Allora, dalle proprietà dei coefficienti binomiali, (a + b)n+1 = (a + b)n · (a + b) = a · (a + b)n + b · (a + b)n n ( ) n ∑ n k+1 n−k ∑ (n) k n+1−k = a b + a b k k k=0 k=0 = an+1 + n−1 ∑( k=0 = = = n ( ) ∑ n) k+1 n−k n k n+1−k a b + bn+1 + a b k k k=1 n ( n ∑ n ) h n−h+1 ∑ (n) k n+1−k a b a b + k h−1 h=1 k=1 ) n (( ∑ n ) (n) an+1 + bn+1 + + ak bn+1−k k−1 k k=1 an+1 + bn+1 + an+1 + bn+1 + n ( ∑ n + 1) k=1 = n+1 ∑( k=0 k n + 1) k n+1−k a b , k ak bn+1−k Capitolo 2: Cenni sugli insiemi numerici 34 e quindi la tesi è vera per il numero naturale n + 1. Dal principio di induzione (Proposizione 2.1.1), si ottiene la tesi. 2.1.3 Cenni di calcolo combinatorio Si introducono ora alcune definizioni di carattere combinatorio. Definizione 2.1.3 Siano a1 , . . . , an oggetti distinti. Se k è un intero compreso tra 1 ed n, si definisce disposizione semplice degli n oggetti a k a k, ogni k-pla (aj1 , . . . , ajk ) formata da k oggetti distinti tra gli n assegnati. Pertanto due disposizioni di n oggetti a k a k possono differire o per un oggetto oppure anche per l’ordine in cui gli oggetti vengono considerati. Il numero delle disposizioni di n oggetti a k a k viene indicato con Dn,k . Tenendo presente che il primo dei k oggetti può essere scelto tra tutti gli n oggetti, che il secondo può essere scelto tra i rimanenti n − 1 oggetti e cosı̀ via, il numero delle disposizioni di n oggetti a k a k risulta essere: Dn,k = n(n − 1) · · · (n − k + 1) . Nel caso particolare in cui k = n, si preferisce parlare di permutazioni di n oggetti (distinti) anziché di disposizione di n oggetti ad n ad n. Conviene osservare che due permutazioni possono differire solamente per l’ordine degli n oggetti in quanto contengono tutti gli n oggetti disponibili. Indicato con Pn il numero di permutazioni di n oggetti, si ha quindi Pn = n! . Il numero Pn quindi indica il numero di modi possibili in cui si possono ordinare n oggetti distinti. Si può fornire a questo punto la definizione di combinazione semplice. Definizione 2.1.4 Siano a1 , . . . , an oggetti distinti. Se k è un intero compreso tra 1 ed n, si definisce combinazione semplice degli n oggetti a k a k, ogni insieme {aj1 , . . . , ajk } formato da k oggetti distinti tra gli n assegnati. A differenza delle disposizioni, due combinazioni distinte di n oggetti a k a k devono differire per almeno un oggetto (l’ordine in cui gli oggetti vengono considerati in questo caso non ha importanza). Il numero delle combinazioni semplici di n oggetti a k a k viene indicato con Cn,k . Tenendo presente che k oggetti possono differire per l’ordine in Pk modi distinti e che una combinazione individua quindi Pk disposizioni distinte, si ha ( ) Dn,k n Cn,k = = . Pk k 2.1 L’insieme dei numeri naturali e dei numeri interi 35 Tale numero rappresenta il numero di tutti i sottoinsiemi formati da k elementi in un insieme di n elementi. Fino ad ora sono stati considerati sempre oggetti distinti. In molte applicazioni, tuttavia, è consentito avere la possibilità di ripetere più volte uno stesso oggetto. In tali casi si fa ricorso alle definizioni seguenti. Definizione 2.1.5 Siano a1 , . . . , an oggetti distinti. Se k ≥ 1, si definisce disposizione con ripetizione degli n oggetti a k a k, ogni k-pla (aj1 , . . . , ajk ) formata da k oggetti non necessariamente distinti tra gli n assegnati. Due disposizioni con ripetizione di n oggetti a k a k possono differire per un oggetto, per il numero di volte in cui un oggetto compare oppure per l’ordine in cui gli oggetti vengono considerati. Il numero delle disposizioni con ripetizione di n oggetti a k a k viene inr dicato con Dn,k . Questa volta, sia il primo dei k oggetti che tutti i successivi possono essere scelti tra tutti gli n oggetti, e quindi r = nk . Dn,k Anche ora, nel caso particolare in cui k = n, si preferisce parlare di permutazioni con ripetizione di n oggetti anziché di disposizione con ripetizione di n oggetti ad n ad n. Indicato con Pnr il numero di permutazioni con ripetizione di n oggetti, si ha: Pnr = nn . Un’ultima definizione riguarda le combinazioni con ripetizione. Definizione 2.1.6 Siano a1 , . . . , an oggetti distinti. Se k ≥ 1, si definisce combinazione con ripetizione degli n oggetti a k a k, ogni insieme formato da k oggetti non necessariamente distinti tra gli n assegnati. Due combinazioni con ripetizione di n oggetti a k a k possono differire per un oggetto oppure per il numero di volte in cui un oggetto viene considerato, indipendentemente però dall’ordine. Il numero delle combinazioni con ripetizione di n oggetti a k a k viene r indicato con Cn,k . In questo caso, il fatto che i k oggetti non devono essere necessariamente distinti equivale a supporre che l’insieme di partenza sia formato da n+k −1 elementi distinti anziché da n elementi distinti e che i k oggetti debbano però essere distinti tra loro. Da ciò segue: ( ) n+k−1 r Cn,k = Cn+k−1,k = . k Capitolo 2: Cenni sugli insiemi numerici 36 2.2 L’insieme dei numeri razionali e reali L’insieme dei numeri razionali viene denotato con il simbolo Q ed è costituito da tutti i numeri che possono essere espressi nella forma m , n dove m ∈ Z ed n ∈ N r {0}. Un numero razionale q ∈ Q si può rappresentare in forma decimale: q = a0 , a1 . . . ar ar+1 . . . ar+s dove a0 ∈ Z, a1 . . . ar+s ∈ {0, 1, . . . , 9} e la parte periodica ar+1 . . . ar+s è da intendersi ripetuta infinite volte. Anche l’insieme dei numeri razionali è dotato di una struttura algebrica e di una struttura di ordine. Per quanto riguarda la struttura algebrica, oltre alle proprietà precedenti, vale al seguente ulteriore proprietà • (Esistenza dell’inverso per la moltiplicazione) Per ogni q ∈ Q r {0} esiste r ∈ Z tale che q · r = 1 (= r · q) . L’elemento r previsto nella proprietà precedente è inoltre unico e viene denominato reciproco di n e denotato con 1/q oppure con q −1 . Quindi q · q −1 = 1. Si osservi che l’esistenza del reciproco è prevista solo per i numeri diversi da 0. La proprietà precedente consente di considerare in Q l’operazione di divisione ponendo, per ogni q, r ∈ Q, q = q · r−1 . r Tale proprietà consente di risolvere equazioni algebriche che non era possibile risolvere nell’insieme Z (come ad esempio 2n + 1 = 0 (sottraendo 1 a primo e secondo membro e moltiplicando entrambi i membri per i reciproco di 2). Tuttavia anche in questo insieme alcune semplici equazioni algebriche, come n2 − 2 = 0 non hanno alcuna soluzione. Ciò dipende però non più dalla struttura algebrica ma dalla proprietà di completezza della relazione d’ordine che sarà discussa di seguito. Anche in Q infatti si può definire una relazione d’ordine nel modo seguente: ∀ q, q ′ ∈ Q : q ≤ q ′ ⇔ m · n′ ≤ m′ · n , 2.2 L’insieme dei numeri razionali e reali 37 dove m, m′ ∈ Z e n, n′ ∈ N r {0} sono tali che q = m/n e q ′ = m′ /n′ e la relazione d’ordine a secondo membro è quella già nota nell’insieme Z. Si riconosce infatti che la proprietà a secondo membro dipende solo dai numeri razionali q e q ′ e non dalla loro particolare rappresentazione sotto forma di frazione di numeri interi. La relazione d’ordine di Q continua ad essere compatibile con l’addizione e la moltiplicazione in Q e risulta ancora di totale ordine. Per approfondire lo studio della relazione d’ordine di Q conviene introdurre l’insieme dei numeri reali ed evidenziare le differenze tra i due insiemi. L’insieme dei numeri reali, viene denotato con R ed è costituito da tutti i numeri che in forma decimale hanno la seguente rappresentazione a0 , a1 a2 a3 . . . dove a0 ∈ Z, a1 a2 a3 · · · ∈ {0, 1, . . . , 9} e non vi è necessariamente una parte periodica. Dal punto di vista della struttura algebrica anche in R sono definite l’addizione e la moltiplicazione tra numeri reali, le cui proprietà sono le stesse dell’insieme Q. La relazione d’ordine può essere definita anche nell’insieme dei numeri reali ponendo per ogni a = a0 , a1 a2 a3 · · · ∈ R e b = b0 , b1 b2 b3 · · · ∈ R, a ≤ b ⇔ ∀ k ∈ N : a0 , a1 a2 a3 . . . ak ≤ b0 , b1 b2 b3 . . . bk ; si osservi che per ogni k ∈ N, i numeri a0 , a1 a2 a3 . . . ak e b0 , b1 b2 b3 . . . bk sono razionali e quindi la relazione d’ordine a secondo membro è quella già definita in Q. Si considera ora una proprietà rilevante della relazione d’ordine di R. Innanzitutto, due sottoinsiemi non vuoti A e B di R (o rispettivamente di Q) vengono denominati separati in R (o rispettivamente in Q) se è verificata una delle seguenti condizioni ∀a∈A∀b∈B: a≤b oppure ∀a∈A∀b∈B: b≤a. Se due insiemi A e B sono separati, si dice elemento separatore di A e B ogni numero reale (rispettivamente, razionale) λ tale che ∀a∈A∀b∈B: a≤λ≤b oppure ∀a∈A∀b∈B: b≤λ≤a. Inoltre due insiemi A e B separati si dicono contigui se ∀ ε>0 ∃ a∈A ∃ b∈B : b−a<ε (oppure a − b < ε) . Capitolo 2: Cenni sugli insiemi numerici 38 Ovviamente due insiemi continui possono ammettere al più un elemento separatore in quanto se λ, µ fossero due elementi separatori con λ < µ la proprietà precedente non sarebbe verificata per ε = µ − λ. Una proprietà rilevante di R riguarda proprio l’esistenza di elementi separatori di insiemi separati. Proposizione 2.2.1 (Assioma di completezza di R) Se A e B sono due sottoinsiemi separati di R, essi ammettono almeno un elemento separatore. In particolare se A e B sono contigui, essi ammettono uno ed un solo elemento separatore. La proprietà precedente differenzia R da Q. Infatti nell’insieme Q non vale una proprietà analoga. Ad esempio, i seguenti sottoinsiemi A = {q ∈ Q | q ≥ 0 , q 2 < 2} , B = {q ∈ Q | q ≥ 0 , q 2 > 2} sono separati in Q (anzi sono contigui) ma non ammettono alcun √ elemento separatore in Q (in R invece l’elemento separatore di tali insiemi è 2, come seguirà dal teorema di esistenza della radice n-esima). Il fatto che √ √ 2 non è razionale si può dimostrare per assurdo supponendo che 2 = m/n con m, n ∈ Nr{0} primi tra loro; infatti da ciò segue m2 /n2 = 2 e quindi m2 = 2n2 ; allora m2 è pari e ciò comporta che m stesso sia pari, da cui m = 2p con p ∈ N; sostituendo 2p ad m si ottiene 4p2 = 2n2 da cui n2 = 2p2 ; segue che anche n2 , e conseguentemente n, deve essere pari e ciò è assurdo in quanto si era supposto che m ed n fossero primi tra loro. ◃ Come conseguenza della proprietà precedente, in R valgono diverse proprietà tra cui una delle più importanti è il seguente teorema sull’esistenza della radice n-esima. Teorema 2.2.2 (Esistenza della radice n-esima) Sia n ≥ 1; allora per ogni a ∈ R con a ≥ 0 esiste uno ed un solo b ∈ R tale che b ≥ 0 e bn = a. Se a ∈ R e a ≥ 0, l’unico elemento b ∈ R tale che b ≥ 0 e bn = a viene denominato radice n-esima di a e denotato con uno dei seguenti simboli √ n a, a1/n . La dimostrazione del teorema precedente è basata sul fatto che gli insiemi A = {x ∈ R | x ≥ 0 , xn ≤ a} , B = {x ∈ R | x ≥ 0 , xn ≥ a} sono contigui e quindi, per l’assioma di completezza, in R ammettono un unico elemento separatore b ∈ R che deve essere positivo e soddisfare necessariamente la condizione bn = a. 2.2 L’insieme dei numeri razionali e reali 39 Proprio utilizzando il teorema precedente in R è possibile risolvere alcune equazioni algebriche che in Q non avevano alcuna soluzione, come l’equazione n2 − 2 = 0. Tuttavia anche in R si possono trovare equazioni algebriche che non hanno soluzioni, come l’equazione n2 + 1 = 0. Per risolvere quest’ultima equazione bisognerà ancora una volta introdurre un nuovo insieme numerico più grande, quello dei numeri complessi, in cui però tutte le equazioni algebriche avranno finalmente almeno una soluzione. ◃ Una proprietà importante che conviene osservare riguarda la densità dei numeri razionali e dei numeri irrazionali in R. • (Proprietà di densità) Per ogni a, b ∈ R con a < b esistono almeno un numero razionale q ∈ Q ed un numero reale non razionale r ∈ R r Q tali che a<q<b, a<r<b. Come conseguenza della proprietà precedente si può affermare che tra due numeri reali esistono sempre infiniti numeri razionali ed infiniti numeri reali non razionali. ◃ Si conclude la presente sezione con alcune notazioni spesso utilizzate. Nel seguito sarà utile utilizzare la convenzione di scrivere un asterisco in alto a destra ad un insieme per denotare lo stesso insieme privato del numero 0, ed il segno + (oppure −) per denotare gli elementi positivi (oppure negativi) dell’insieme. Pertanto, ad esempio R∗ = R r {0}, R∗+ = {x ∈ R | x > 0}, Q− = {q ∈ Q | q ≤ 0}. ◃ Un’altra convenzione riguarda la somma e il prodotto di un numero finito di elementi di un insieme numerico: assegnati i numeri a1 , . . . , an si pone n n ∑ ∏ ak := a1 + . . . an , ak := a1 · · · an . k=1 2.2.1 k=1 Insiemi numerabili Una ulteriore proprietà dell’insieme dei numeri reali, che distingue tale insieme da quelli numerici introdotti in precedenza, riguarda il fatto che esso è un infinito di ordine maggiore rispetto all’insieme dei numeri razionali, come viene messo brevemente in evidenza nel presente paragrafo. Innanzitutto conviene assumere la seguente definizione di carattere generale. Un insieme E si dice numerabile se esiste una funzione biiettiva φ : N → E (o equivalentemente se esiste una funzione biiettiva ψ : E → N). 40 Capitolo 2: Cenni sugli insiemi numerici L’esistenza di una funzione biiettiva definita in N comporta che gli elementi di E possano essere “contati” enumerando successivamente i valori della funzione: φ(0), φ(1), φ(2), φ(3), . . . e ciò giustifica la denominazione “numerabile” attribuita all’insieme. Come conseguenza della definizione, segue subito che N è numerabile. Inoltre ogni sottoinsieme non vuoto di un insieme numerabile o è finito oppure è numerabile. Quindi gli insiemi numerabili sono gli insiemi infiniti “più piccoli”. Da tale osservazione segue subito, ad esempio, che gli insiemi dei numeri pari, dei numeri dispari, dei numeri primi sono tutti numerabili. Si osserva ancora che se esiste una funzione suriettiva da un insieme numerabile E in un insieme F (oppure equivalentemente una funzione iniettiva da F in un insieme numerabile E) allora F è finito oppure numerabile. ◃ Si riconosce ora che Z è un insieme numerabile. Infatti, una “enumerazione” degli elementi di Z è la seguente 0, 1, −1, 2, −2, 3, −3, 4, −4, 5, −5, . . . ; la corrispondente funzione biiettiva φ : N → Z si può in questo caso definire ponendo, per ogni n ∈ N, [ ] n+1 n + 1 φ(n) = (−1) , 2 dove [·] denota la funzione parte intera. ◃ Per dimostrare che anche l’insieme dei numeri razionali Q è numerabile, conviene prima osservare che il prodotto di due insiemi numerabili è numerabile. Infatti se E ed F sono numerabili e se φ : E → N e ψ : F → N sono biiettive allora anche la funzione χ : E × F → N definita ponendo, per ogni (m, n) ∈ E × F , (m + n)(m + n + 1) +m 2 è una funzione biiettiva e quindi il prodotto E × F è numerabile. La funzione χ conta gli elementi del prodotto su ogni diagonale in cui la somma χ(m, n) = m + n è costante; infatti si parte da m + n = 0 e si ottiene l’unica coppia (0, 0) alla quale corrisponde 0; si considerano poi gli indici per cui m + n = 1 e si ottengono le coppie (0, 1) e (1, 0) alle quali corrisponde 1 e 2; poi si considerano gli indici tali che m + n = 2 e si ottengono le coppie (2, 0), (1, 1) e (0, 2) alle quali corrispondono i numeri naturali 3, 4 e 5 e cosı̀ via. Tale procedimento viene denominato per diagonali. ◃ A questo punto si osserva che il prodotto cartesiano Z × (N r {0}) è numerabile in quanto prodotto di insiemi numerabili. 2.3 Proprietà dei sottoinsiemi di R 41 Si consideri ora la funzione ψ : Z × (N r {0}) → Q definita ponendo, per ogni (m, n) ∈ Z × (N r {0}), ψ(m, n) = m . n Poiché ψ è suriettiva (quindi Q può essere considerato come un sottoinsieme del prodotto cartesiano Z×(Nr{0})) allora anche Q deve essere numerabile. ◃ Infine si dimostra che R non è numerabile. Si consideri infatti una funzione φ : N → R e si definisca il seguente numero reale a = a0 , a1 a2 a3 . . . ponendo a0 uguale alla parte intera di φ(0) aumentata di 1, a1 uguale alla prima cifra decimale di φ(1) aumentata di 1 oppure uguale a 0 se tale cifra è uguale a 9, a2 uguale alla seconda cifra decimale di φ(2) aumentata di 1 oppure uguale a 0 se tale cifra è uguale a 9, e cosı̀ via. Allora è chiaro che a è diverso da ogni elemento φ(n), n ∈ N, e quindi φ non può essere suriettiva. Quindi non può esistere alcuna funzione suriettiva (e tanto meno biiettiva) da N in R e da ciò segue la non numerabilità di R. Proprietà dei sottoinsiemi di R 2.3 In questa sezione vengono raccolte diverse proprietà dei sottoinsiemi di R che saranno utili per lo studio delle funzioni reali. 2.3.1 Intervalli di R Innanzitutto si introducono alcuni sottoinsiemi di R di particolare rilevanza. Essi vengono denominati intervalli di R: • Intervalli limitati. Siano a, b ∈ R tali che a < b. Si pone: [a, b] = {x ∈ R | a ≤ x ≤ b} (intervallo limitato chiuso di estremi a e b); ]a, b[= {x ∈ R | a < x < b} (intervallo limitato aperto di estremi a e b); [a, b[= {x ∈ R | a ≤ x < b} (intervallo limitato semichiuso a sinistra (oppure semiaperto a destra) di estremi a e b); ]a, b] = {x ∈ R | a < x ≤ b} (intervallo limitato semiaperto a sinistra (oppure semichiuso a destra) di estremi a e b); Capitolo 2: Cenni sugli insiemi numerici 42 • Intervalli illimitati. Sia c ∈ R. Si pone: [c, +∞[= {x ∈ R | c ≤ x} (intervallo illimitato a destra chiuso di estremo c); ]c, +∞[= {x ∈ R | c < x} (intervallo illimitato a destra aperto di estremo c); ] − ∞, c] = {x ∈ R | x ≤ c} (intervallo illimitato a sinistra chiuso di estremo c); ] − ∞, c[= {x ∈ R | x < c} (intervallo illimitato a destra aperto di estremo c). Le notazioni [c, → [ e ] ←, c] sono equivalenti a [c, +∞[ e ] − ∞, c]. ◃ Se x0 ∈ R e δ ∈ R∗+ , si denomina intervallo centrato aperto (rispettivamente, chiuso) di centro x0 e raggio δ, l’intervallo aperto ]x0 − δ, x0 + δ[ (rispettivamente, l’intervallo chiuso [x0 − δ, x0 + δ]). Nel seguito, sarà opportuno ricorrere alle seguenti notazioni: Iδ (x0 ) =]x0 − δ, x0 + δ[ , 2.3.2 Iδ+ (x0 ) = [x0 , x0 + δ[ , Iδ− (x0 ) =]x0 − δ, x0 ] . (2.3.1) Valore assoluto e distanza in R Per ogni x ∈ R, il valore assoluto di x viene denotato con |x| ed è definito al modo seguente { x, se x ≥ 0 , |x| := (2.3.2) −x , se x < 0 . In base alla definizione precedente, si dimostrano facilmente le seguenti proprietà, valide per ogni x, y ∈ R. 1. |x| ≥ 0 ; 2. |x| = 0 ⇔ x = 0 ; 3. | − x| = |x| ; 4. x ≤ |x| ; 5. |x · y| = |x| · |y| ; 6. |x + y| ≤ |x| + |y| ; (infatti, se x + y ≥ 0, dalla proprietà 4., |x + y| = x + y ≤ |x| + |y|, mentre, se x + y < 0, sempre dalle 4. e 3., |x + y| = −x − y ≤ | − x| + | − y| = |x| + |y|). 2.3 Proprietà dei sottoinsiemi di R 43 7. | |x| − |y| | ≤ |x − y| ; (infatti, se |x| − |y| ≥ 0, dalla proprietà 6. si ha |x| = |(x − y) + y| ≤ |x − y| + |y| e quindi | |x| − |y| | = |x| − |y| ≤ |x − y|; se |x| − |y| < 0, si procede allo stesso modo invertendo i ruoli di x e y.) Nello studio delle disequazioni che coinvolgono il valore assoluto risultano inoltre particolarmente utili le proprietà seguenti, in cui il valore assoluto viene confrontato con un numero reale a. 8. i) se a < 0, la diseguaglianza |x| ≤ a non è mai soddisfatta; ii) se a ≥ 0, si ha |x| ≤ a se e solo se −a ≤ x ≤ a. 9. i) se a ≤ 0, la diseguaglianza |x| < a non è mai soddisfatta; ii) se a > 0, si ha |x| < a se e solo se −a < x < a. 10. i) se a ≤ 0, la diseguaglianza |x| ≥ a è sempre soddisfatta; ii) se a > 0, si ha |x| ≥ a se e solo se x ≤ −a oppure x ≥ a; 11. i) se a < 0, la diseguaglianza |x| > a è sempre soddisfatta; ii) se a ≥ 0, si ha |x| > a se e solo sex < −a oppure x > a. Il valore assoluto di un numero reale consente di definire la distanza tra due numeri reali. Precisamente, per ogni coppia di numeri reali (x, y) ∈ R2 , la distanza di x da y viene denotata con d(x, y) ed è definita ponendo d(x, y) := |x − y| . Valgono le seguenti proprietà della distanza, che seguono direttamente dalle proprietà 1., 2., 3. e 6. del valore assoluto elencate sopra. 1. ∀ (x, y) ∈ R2 : d(x, y) ≥ 0 ; 2. ∀ (x, y) ∈ R2 : d(x, y) = 0 ⇔ x = y ; 3. ∀ (x, y) ∈ R2 : d(y, x) = d(x, y) (proprietà simmetrica della distanza); 4. ∀ (x, y, z) ∈ R3 : d(x, z) ≤ d(x, y) + d(y, z) (proprietà triangolare della distanza). 44 2.3.3 Capitolo 2: Cenni sugli insiemi numerici Rappresentazione geometrica di Rn , n ≤ 3 Nello studio delle funzioni reali, di interesse centrale nel seguito, sarà di notevole aiuto la rappresentazione geometrica sia di R che di R2 e, per le funzioni di due variabili, anche di R3 . L’insieme dei numeri reali viene solitamente rappresentato come l’insieme dei punti di una retta. Infatti, sia r una retta e si fissino due punti distinti O e U di r corrispondenti ai numeri reali 0 e 1. La semiretta avente O come estremo e contenente il punto U viene denominata semiasse positivo ed indicata con r+ ; analogamente, la semiretta di estremo O non contenente il punto U viene denominata semiasse negativo ed indicata con r− . Si può allora definire una corrispondenza tra un numero reale x ed uno ed un solo elemento P della retta r prendendo il segmento OU come unità di misura e considerando il segmento OP avente lunghezza x con P in r+ se x è positivo e P in r− se x è negativo. Viceversa, la stessa corrispondenza consente di far corrispondere ad ogni punto P della retta uno ed un solo numero reale x. In questo modo ogni numero reale viene identificato con un punto della retta r e viceversa. Per questo motivo la retta r (o l’insieme R) viene anche denominata retta reale cosı̀ come gli elementi di R vengono spesso chiamati punti. Infine la semiretta positiva r+ (denominata anche semiretta positiva) viene spesso evidenziata mediante una freccia come in Figura 2.1. : r • • 1 0 Figura 2.1: Rappresentazione geometrica dei numeri reali. Si considera ora una rappresentazione del prodotto cartesiano R2 . In questo caso si fissano due rette r1 ed r2 non parallele su un piano π. Si denota con O il punto di intersezione di r1 ed r2 ed inoltre su ognuna delle due rette si considera un ulteriore punto distinto da O che verrà denotato con U1 e rispettivamente U2 . In questo modo si dice che è stato assegnato un riferimento cartesiano ed il piano π viene anche denominato piano cartesiano. Ad ogni (x, y) ∈ R2 , si può far corrispondere una ed una sola coppia (P1 , P2 ) con P1 ∈ r1 e P2 ∈ r2 (in quanto sulle rette r1 ed r2 si può considerare una rappresentazione dei numeri reali) e successivamente si può considerare il punto P del piano π ottenuto come intersezione delle 2.3 Proprietà dei sottoinsiemi di R 45 rette parallele ad r2 ed r1 e passanti per P1 e rispettivamente P2 (vedasi la Figura 2.2). 0 y •P x - Figura 2.2: Riferimento cartesiano non ortogonale. Anche ora con il procedimento inverso, ad ogni punto del piano π si può far corrispondere una ed una sola coppia di numeri reali. Quindi il piano π può essere identificato con il prodotto cartesiano R2 . Il punto O viene denominato origine del riferimento cartesiano e corrisponde ovviamente alla coppia (0,0) (mentre i punti U1 e U2 corrispondono alle coppie (1,0) e rispettivamente (0,1)). La retta r1 viene denominata asse delle ascisse e la retta r2 asse delle ordinate. Inoltre le coordinate della coppia (x, y) al quale corrisponde il punto P di π vengono anche denominate ascissa e ordinata di P ed il punto P di coordinate (x, y) viene indicato anche con P (x, y). Nel caso particolare in cui le due rette r1 e r2 siano perpendicolari, il riferimento cartesiano si dice ortogonale. Se, in più, i punti U1 ed U2 su r1 e rispettivamente r2 vengono fissati alla stessa distanza dall’origine O, allora il riferimento ortogonale viene denominato ortonormale (vedasi la Figura 2.3). Conviene osservare che la rappresentazione geometrica di R2 su un piano cartesiano consente di definire anche in R2 una distanza con le stesse proprietà di quella già precedentemente introdotta in R. Infatti, per ogni coppia x = (x1 , x2 ) e y = (y1 , y2 ) di elementi di R2 la distanza di x da y viene indicata con d(x, y) ed è definita ponendo √ d(x, y) := (y1 − x1 )2 + (y2 − x2 )2 . Capitolo 2: Cenni sugli insiemi numerici 46 6 y 0 P • x - Figura 2.3: Riferimento cartesiano ortonormale. ◃ La rappresentazione geometrica di R3 si può ottenere in maniera del tutto analoga a quella discussa considerando tre rette non complanari r1 , r2 ed r3 nello spazio Σ, che si intersecano in un punto 0. Su ognuna delle rette r1 , r2 ed r3 , che per semplicità vengono supposte perpendicolari tra loro, viene fissato un ulteriore punto distinto da O e che viene denotato rispettivamente con U1 , U2 e U3 . Il piano contenente le rette r1 , r2 viene spesso denominato piano xy, quello contenente le rette r1 , r3 viene denominato piano xz ed infine il piano contenente le rette r2 , r3 viene denominato piano yz. Anche in questo caso si dice che è stato assegnato un riferimento cartesiano nello spazio Σ, che viene denominato spazio euclideo. Ad ogni (x, y, z) ∈ R3 , si può far corrispondere una ed una sola terna (P1 , P2 , P3 ) con P1 ∈ r1 , P2 ∈ r2 e P3 ∈ r3 e successivamente si può considerare il punto P di Σ ottenuto come intersezione dei piani paralleli ai piani yz, xz e xy e passanti rispettivamente per i punti P1 , P2 e P3 (vedasi la Figura 2.4). Il procedimento inverso fa corrispondere ad ogni punto di Σ una ed una sola terna di numeri reali. Quindi lo spazio Σ può essere identificato con il prodotto cartesiano R3 . Anche ora il punto O viene denominato origine del riferimento cartesiano e corrisponde ovviamente alla terna (0,0,0) (mentre i punti U1 , U2 e U3 corrispondono alle terne (1,0,0), (0,1,0) e rispettivamente (0,0,1)). La retta r1 viene denominata asse delle ascisse, la retta r2 asse delle ordinate e infine la retta r3 asse delle altezze. 2.3 Proprietà dei sottoinsiemi di R 47 z6 • x + P y 0 Figura 2.4: Riferimento cartesiano dello spazio. Inoltre le coordinate della terna (x, y, z) alla quale corrisponde il punto P di Σ vengono anche denominate ascissa, ordinata e altezza (oppure quota) di P ed il punto P di coordinate (x, y, x) viene indicato anche con P (x, y, z). ◃ Per n ≥ 4 non è possibile una rappresentazione geometrica di Rn ; tuttavia, è ancora possibile considerare una distanza che verifica le stesse proprietà di quella introdotta in R. Si supponga infatti n ≥ 3. Per ogni coppia di n-ple x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) di elementi di Rn , infatti, si può definire la distanza d(x, y) di x da y ponendo v u n u∑ d(x, y) := t (yi − xi )2 . i=1 2.3.4 Sottoinsiemi limitati ed estremi Nella presente sezione si richiamano alcune nozioni relative ai sottoinsiemi di R che verranno utilizzate in seguito per definire altrettante proprietà delle funzioni reali. Sia X un sottoinsieme non vuoto di R. Valgono le seguenti definizioni. Capitolo 2: Cenni sugli insiemi numerici 48 • Sottoinsiemi limitati. Si dice che X è limitato superiormente (rispettivamente, limitato inferiormente) se ∃ M ∈ R t.c. ∀ x ∈ X : x ≤ M (rispettivamente, M ≤ x ). (2.3.3) Ogni elemento M ∈ R verificante la (2.3.3) viene denominato maggiorante (rispettivamente, minorante) di X. Infine, si dice che X è limitato se è limitato sia superiormente che inferiormente, cioè se ∃ m, M ∈ R t.c. ∀ x ∈ X : m ≤ x ≤ M . (2.3.4) Gli intervalli illimitati a sinistra sono particolari esempi di sottoinsiemi limitati superiormente di R, gli intervalli illimitati a destra sono esempi di sottoinsiemi limitati inferiormente di R ed infine gli intervalli limitati sono sottoinsiemi limitati di R. Viceversa, ogni sottoinsieme limitato superiormente di R è un sottoinsieme di un intervallo illimitato a sinistra, ogni sottoinsieme limitati inferiormente è un sottoinsieme di un intervallo illimitato a destra ed ogni sottoinsieme limitato di R è un sottoinsieme di un intervallo limitato di R. • Sottoinsiemi dotati di massimo e minimo. Si dice X è dotato di massimo (rispettivamente, dotato di minimo) se ∃ M ∈ X t.c. ∀ x ∈ X : x ≤ M (rispettivamente, M ≤ x ). (2.3.5) (A differenza dei maggioranti e minoranti in cui M ∈ R, questa volta si pretende M ∈ X.) L’elemento M verificante la (2.3.5), univocamente determinato dalla condizione M ∈ X, viene denominato massimo di X (rispettivamente, minimo di X) e denotato con uno dei seguenti simboli: max X , max x , x∈X (rispettivamente, min X , min x ). x∈X Gli intervalli semichiusi a destra sono particolari esempi di sottoinsiemi dotati di massimo e quelli semichiusi a sinistra di sottoinsiemi dotati di minimo. • Sottoinsiemi dotati di estremi. Si dice X è dotato di estremo superiore (rispettivamente, dotato di estremo inferiore) se esiste un elemento ℓ ∈ R tale che ∀ x ∈ X : x ≤ ℓ (rispettivamente, ℓ ≤ x ); 1) 2) m ∈ R, ∀ x ∈ X : x ≤ m ⇒ ℓ ≤ m (2.3.6) (rispettivamente, ∀ x ∈ X : m ≤ x ⇒ m ≤ ℓ ). 2.3 Proprietà dei sottoinsiemi di R 49 Anche in questo caso l’elemento ℓ verificante la (2.3.6) è unico, viene denominato estremo superiore di X (rispettivamente, estremo inferiore di X) e viene denotato con sup X , sup x , (rispettivamente, inf X , x∈X inf x ). x∈X La seconda proprietà in (2.3.6) si può esprimere in maniera equivalente come segue ∀ ε ∈ R∗+ ∃ x ∈ X t.c. ℓ−ε < x (rispettivamente, x < ℓ+ε ). (2.3.7) Una proprietà notevole dei sottoinsiemi di R è la seguente. Proposizione 2.3.1 (Seconda forma dell’assioma di completezza) Ogni sottoinsieme non vuoto limitato superiormente (rispettivamente, limitato inferiormente) di R è dotato (in R) di estremo superiore (rispettivamente, di estremo inferiore). Si riconosce facilmente che la seconda forma dell’assioma di completezza è equivalente all’assioma di completezza. Infatti si supponga che valga la Proposizione 2.2.1 e sia X un sottoinsieme non vuoto e limitato superiormente di R. Allora l’insieme M dei maggioranti di X è non vuoto e inoltre X ed M sono ovviamente separati. Dalla Proposizione 2.2.1 esiste un elemento separatore ℓ ∈ R di X ed M e quindi risulta, per ogni x ∈ X e per ogni m ∈ M , x ≤ ℓ ≤ m; dalla prima di tali diseguaglianze segue che ℓ è un maggiorante di X e dalla seconda che ℓ è il più piccolo maggiorante di X. Quindi ℓ = sup X. Si supponga ora che valga la seconda forma dell’assioma di completezza e siano A e B sottoinsiemi non vuoti e separati di R per i quali si abbia, per ogni a ∈ A e per ogni b ∈ B, a ≤ b. Allora A è limitato superiormente in quanto ogni elemento di B è un maggiorante di A. Dalla Proposizione 2.3.1 si può considerare ℓ = sup A. Quindi per ogni a ∈ A risulta a ≤ ℓ in quanto ℓ è un maggiorante di A; inoltre ogni elemento b ∈ B è un maggiorante di A e quindi deve essere, per definizione di estremo superiore, ℓ ≤ b. Si conclude che ℓ è un elemento separatore di A e B e quindi vale l’assioma di completezza enunciato nella Proposizione 2.2.1. ◃ Nel caso in cui un insieme non sia limitato superiormente (rispettivamente, inferiormente), esso non è dotato di estremo superiore (rispettivamente, inferiore); in tal caso, si scriverà per convenzione sup X = +∞ , (rispettivamente, inf X = −∞ ). (2.3.8) Capitolo 2: Cenni sugli insiemi numerici 50 2.3.5 Intorni e punti di accumulazione Ogni sottoinsieme I di R contenente un intervallo centrato di centro x0 viene denominato intorno di x0 ; analogamente, ogni sottoinsieme I di R per cui esista δ ∈ R∗+ tale che Iδ+ (x0 ) ⊂ I (rispettivamente, Iδ− (x0 ) ⊂ I) viene denominato intorno destro (rispettivamente, intorno sinistro) di x0 . L’insieme degli intorni di x0 viene denotato con il simbolo I(x0 ); inoltre, l’insieme degli intorni destri (rispettivamente, sinistri) di x0 viene denotato con I + (x0 ) (rispettivamente, I − (x0 )). Per convenzione, inoltre, si denominerà intorno di +∞ (rispettivamente, di −∞) ogni sottoinsieme di R contenente un intervallo illimitato a destra (rispettivamente, a sinistra) ed il loro insieme verrà denotato con I(+∞) (rispettivamente, I(−∞)). ◃ Infine, si dice che x0 ∈ R ∪ {−∞, +∞} è un punto di accumulazione per un sottoinsieme X di R se, per ogni intorno I di x0 , X ∩ I r {x0 } ̸= ∅ (2.3.9) (quindi, in ogni intorno di x0 vi sono elementi di X diversi da x0 ). Se x0 ∈ R e la condizione precedente è verificata per ogni intorno destro (rispettivamente, sinistro) di x0 , si dice che x0 è un punto di accumulazione a destra (rispettivamente, a sinistra) per X. 2.3.6 La retta ampliata dei numeri reali Per semplificare l’esposizione di alcuni argomenti, può essere utile introdurre l’insieme R = R ∪ {−∞, +∞} , (2.3.10) dove −∞ e +∞ sono due oggetti distinti non appartenenti ad R. Tale insieme viene denominato insieme ampliato dei numeri reali oppure più brevemente R ampliato. Per denotarlo, possono essere usati anche i simboli: b oppure R. e R I concetti di intorno e di punto di accumulazione possono essere estesi anche in R. Precisamente un intorno di +∞ (rispettivamente, di −∞) viene inteso come un sottoinsieme I di R che contiene un intervallo illimitato a destra (rispettivamente, a sinistra): ∃ c ∈ R t.c. ]c, +∞[⊂ I , (rispettivamente, ∃ c ∈ R t.c. ] − ∞, c[⊂ I ). L’insieme degli intorni di +∞ (rispettivamente, di −∞) viene denotato con il simbolo I(+∞) (rispettivamente, I(−∞)). 2.3 Proprietà dei sottoinsiemi di R 51 In questo caso non ha senso considerare intorni destri e sinistri di +∞ o di −∞. ◃ Infine, si dice che +∞ (rispettivamente, −∞) è un punto di accumulazione per un sottoinsieme X di R se, per ogni intorno I di +∞ (rispettivamente, −∞), risulta X ∩ I ̸= ∅ (in questo caso i punti +∞ e −∞ sicuramente non appartengono ad X ∩ I in quanto tale intersezione è un sottoinsieme di R). Quindi +∞ (rispettivamente, −∞) è un punto di accumulazione per X se e solo se ∀ c ∈ R : X∩]c, +∞[̸= ∅ , (rispettivamente, ∀ c ∈ R : X∩] − ∞, c[̸= ∅ ) e quest’ultima condizione equivale al fatto che X non è dotato di maggioranti (rispettivamente, di minoranti) e quindi al fatto che X non è limitato superiormente in R (rispettivamente, non è limitato inferiormente in R). Capitolo 3 Numeri complessi e polinomi 3.1 Proprietà generali dei numeri complessi Nell’insieme dei numeri reali R non è possibile risolvere tutte le equazioni algebriche; ad esempio, l’equazione x2 + 1 = 0 non ammette alcuna soluzione reale. L’insieme dei numeri complessi permetterà di risolvere in modo definitivo tale problema nel senso che, in tale insieme, tutte le equazioni algebriche ammetteranno almeno una soluzione. Tuttavia in tale estensione si perdono alcune proprietà importanti di R, come quelle relative alla relazione d’ordine: nell’insieme dei numeri complessi non è possibile definire una relazione d’ordine totale compatibile con le operazioni algebriche. Partendo proprio dall’equazione x2 +1 = 0, se si vuole che essa ammetta almeno una soluzione, bisogna ammettere l’esistenza di un elemento il cui quadrato sia −1. Tale elemento, che non può essere un numero reale in quanto i quadrati dei numeri reali sono sempre positivi, verrà denotato con i e verrà denominato unità immaginaria. Quindi il ‘numero’ i è caratterizzato dalla proprietà: i2 = −1 . (3.1.1) Assunta l’esistenza del numero i, anche l’equazione più generale x2 + b2 = 0 (b ∈ R) ammetterà le soluzioni i · b e −i · b; più in generale, le equazioni di secondo grado della forma (x − a)2 + b2 = 0, con a, b ∈ R ammetteranno le soluzioni a ± i · b (si può riconoscere facilmente che tutte le equazioni di secondo grado con discriminante ∆ < 0 si possono scrivere in tale forma). Tuttavia, bisogna tener presente che le operazioni di addizione e moltiplicazione utilizzate nel simbolo a + i · b non sono state compiutamente definite 54 Capitolo 3: Numeri complessi e polinomi ma presuppongono un’estensione delle proprietà algebriche dei numeri reali. Per rendere più precisa tale estensione, conviene innanzitutto osservare che tali numeri sono caratterizzati dalla coppia (a, b) di numeri reali. In questo modo, è possibile trasferire lo studio di tali operazioni algebriche nell’insieme già noto R2 . In R2 l’addizione viene definita ponendo, per ogni (a, b) ∈ R2 , (c, d) ∈ R2 , (a, b) + (c, d) = (a + c, b + d) . (3.1.2) Tale addizione verifica le proprietà associativa e commutativa, e inoltre l’elemento neutro 0 è dato dalla coppia (0,0); infine, per ogni (a, b) ∈ R2 , l’opposto di (a, b), che si denota con −(a, b), è la coppia (−a, −b). La moltiplicazione di R2 viene invece definita nel seguente modo, per ogni (a, b) ∈ R2 , (c, d) ∈ R2 , (a, b) · (c, d) = (a · c − b · d, a · d + b · c) (3.1.3) Anche per la moltiplicazione è facile riconoscere la validità delle proprietà associativa e commutativa, l’esistenza dell’elemento neutro 1 dato dalla coppia (1,0) e, per ogni (a, b) ̸= (0, 0), l’esistenza dell’elemento inverso (reciproco 1 di (a, b)) che si denota con (a, b)−1 oppure con , ed è dato dalla coppia (a, b) ( ) a −b , a2 + b2 a2 + b2 L’insieme R2 , munito dell’addizione e della moltiplicazione definite rispettivamente dalla (3.1.2) e dalla (3.1.3) viene denominato insieme dei numeri complessi e denotato con il simbolo C. Se z = (a, b) ∈ C, il numero (reale) a viene denominato parte reale di z e denotato con Re z, mentre il numero (reale) b viene denominato parte immaginaria di z e denotato con il simbolo Im z. In questo modo un numero complesso z può essere rappresentato come z = (Re z, Im z). La coppia (Re z, Im z) viene anche denominata forma geometrica di z. Partendo da una discussione riguardante la possibilità di ottenere delle soluzioni di opportune equazioni algebriche, si è cosı̀ giunti ad introdurre l’insieme C, i cui elementi sono stati individuati mediante coppie di numeri reali. In tale corrispondenza, l’unità immaginaria i è rappresentata ovviamente dalla coppia (0,1). Inoltre un numero reale a è rappresentato dalla coppia (a, 0); in questo senso l’insieme R dei numeri reali può essere considerato come un sottoinsieme di C, in quanto può essere identificato con il sottoinsieme di C costituito da tutti gli elementi di C aventi parte immaginaria nulla. Tenendo presente tale identificazione, si ottiene, per ogni 3.1 Proprietà generali dei numeri complessi 55 (a, b) ∈ C, (a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1) · (b, 0) = (a, 0) + i · (b, 0) = a + i · b ; si ottiene cosı̀ un’espressione diversa del numero complesso z, detta forma algebrica di z. La forma geometrica dei numeri complessi rende possibile la loro rappresentazione come elementi di un piano, sul quale sia stato fissato un sistema di assi cartesiani; in tal caso si preferisce parlare di piano complesso anziché di piano cartesiano e di asse reale e asse immaginario anziché di asse delle ascisse e rispettivamente delle ordinate; tale denominazione è giustificata dal fatto che tutti e soli i numeri reali considerati come numeri complessi aventi parte immaginaria nulla vengono cosı̀ a trovarsi sull’asse reale, mentre tutti e soli i numeri complessi aventi parte reale nulla vengono a trovarsi sull’asse immaginario (gli elementi dell’asse immaginario vengono anche per questo denominati spesso numeri immaginari puri). L’unità di C rappresenta l’unità sull’asse reale mentre l’unità immaginaria rappresenta l’unità sull’asse immaginario. Naturalmente, anziché parlare di ascissa ed ordinata di un numero complesso si preferisce utilizzare le definizioni già introdotte di parte reale e di parte immaginaria. La possibilità di considerare diverse forme di un numero complesso è utile in quanto il grado di difficoltà nello svolgere le varie operazioni in C dipende spesso dalla forma che si sta adoperando. Inoltre, è chiara la possibilità di passare in modo immediato dalla forma algebrica a quella geometrica e viceversa. Si è già visto, ad esempio, che l’unità immaginaria i si scrive (0,1) in forma geometrica; come ulteriore esempio, si osserva che l’elemento nullo 0 corrisponde alla coppia (0,0) e l’elemento unità 1 alla coppia (1,0). Si riconsiderano ora le operazioni descritte sopra utilizzando la forma algebrica. Siano z = a + ib e w = c + id elementi di C. Allora (a + ib) + (c + id) = (a + c) + i(b + d) , (a + ib) · (c + id) = (ac − bd) + i(ad + bc) e quindi l’addizione e la moltiplicazione in forma algebrica seguono le regole classiche della somma e del prodotto di due binomi. Inoltre, −z = −a+i(−b) e, se z ̸= 0, a b z −1 = 2 −i 2 . a + b2 a + b2 Conviene tenere presente, inoltre, che calcolando le potenze dell’unità immaginaria i, si ottiene i0 = 1 , i1 = i , i2 = −1 , i3 = i2 · i = −i , i4 = i2 · i2 = 1 , ... ; Capitolo 3: Numeri complessi e polinomi 56 come si vede, le potenze di i si ripetono di quattro in quattro, cioè vale la proprietà ip+4 = ip per ogni p ∈ N. Due numeri complessi in forma algebrica o geometrica coincidono se e solo se coincidono sia le loro parti reali che le loro parti immaginarie. Si è visto nelle considerazioni iniziali che le soluzioni delle equazioni di secondo grado a coefficienti reali sono del tipo a ± ib; assegnato, quindi, un numero complesso z = a + ib, ha un ruolo sicuramente importante il numero complesso w = a − ib, che ha la stessa parte reale di z, ma parte immaginaria opposta; esso viene denominato numero complesso coniugato di z e denotato con il simbolo z. Infine, come si vede dal calcolo del reciproco di un numero complesso diverso da 0, è anche utile definire, per ogni numero complesso z = a + ib, √ il numero reale a2 + b2 , il quale prende il nome di modulo di z e viene denotato con il simbolo |z| (l’uso dello stesso simbolo che rappresenta il valore assoluto di un numero reale non dà luogo ad equivoci in quanto, se si considera un numero √ reale a ∈ R√come numero complesso della forma z = a + i · 0, si ha |z| = a2 + 02 = a2 = |a|). Nel piano complesso, il coniugato di un numero complesso z è il simmetrico di z rispetto all’asse reale mentre il modulo rappresenta la distanza di z dall’origine. Seguono ora alcune proprietà del coniugato e del modulo di un numero complesso. Proposizione 3.1.1 Per ogni z = a + ib ∈ C e w = c + id ∈ C, valgono le seguenti proprietà: 1. z + w = z + w , z·w =z·w . 2. z = z . 3. z + z = 2 Re z , z − z = 2 Im z . 4. z · z = |z|2 . 5. | − z| = |z| . 6. |z| = |z| . 7. Re z ≤ |z| , Im z ≤ |z| . 8. |z · w| = |z| · |w| . 9. Se z ̸= 0, allora |z −1 | = |z|−1 . 10. |z + w| ≤ |z| + |w|; . 3.2 Richiami di trigonometria e coordinate polari 57 11. ||z| − |w|| ≤ |z − w| . Le proprietà precedenti possono tutte essere verificate direttamente usando le definizioni adottate. È opportuno osservare che non si può considerare in C una relazione d’ordine totale (in cui cioè due qualsiasi elemento siano confrontabili) compatibile con le operazioni algebriche. Infatti, se una tale relazione d’ordine ≤ esistesse, si avrebbe z > 0 oppure z < 0 per ogni z ∈ C∗ e quindi, dalla compatibilità con le operazioni algebriche, z 2 > 0 per ogni z ∈ C∗ ; in particolare −1 = i2 > 0, da cui una contraddizione. Si considerano ora altre forme in cui possono essere espressi i numeri complessi. È necessario, per questo, un sistema diverso di coordinate nel piano cartesiano, che richiede alcune nozioni di trigonometria. Si premettono pertanto alcune nozioni elementari di trigonometria e sul sistema di coordinate polari. 3.2 Richiami di trigonometria e coordinate polari Si richiama innanzitutto il concetto di circonferenza trigonometrica, che è da intendersi come una circonferenza nel piano cartesiano avente centro nell’origine degli assi e raggio uguale ad uno; tale circonferenza inoltre viene dotata di un verso positivo che per convenzione è quello antiorario e di un punto iniziale, che per convenzione è il punto A di intersezione di tale circonferenza con il semiasse positivo delle ascisse (vedasi la Figura 3.1). Inoltre, si assume per convenzione di denotare con il numero π la lunghezza della semicirconferenza unitaria (risulta all’incirca π = 3, 1415 . . . ; si dimostra, però, che π è un numero irrazionale uguale anche all’area del cerchio unitario). Il fatto di aver fissato un punto iniziale, un verso sulla circonferenza trigonometrica ed un’unità di misura permette di far corrispondere ad ogni numero reale un elemento della circonferenza trigonometrica. Precisamente, assegnato un numero reale x, si può considerare l’arco di circonferenza che ha un estremo nel punto iniziale A, lunghezza uguale al valore assoluto di x e verso antiorario se x è positivo, altrimenti orario. Si può quindi individuare il punto P sulla circonferenza trigonometrica che rappresenta il secondo estremo dell’arco suddetto (se il numero reale assegnato è maggiore di 2π in valore assoluto, la circonferenza trigonometrica viene ripercorsa più volte). Ora, assegnato il numero reale x, si consideri il punto P sulla circonferenza trigonometrica costruito come descritto sopra. Si definisce seno di x, e lo si denota con sin(x), l’ordinata del punto P , mentre si definisce coseno di x, e lo si denota con cos(x), l’ascissa del 58 Capitolo 3: Numeri complessi e polinomi 6 .......................................Q ................... ..k ..........Q ........... . ......... . . . . . . . . ...Q . . . ....... . . . . . . . ..... . . . . . .... . . . . ..... . . . .........P . . . . . ..... . ..... ... . . ....... ... .. sin(x) ...... x . ... ....... .... ...... ... ...... A 0 ..... ... .. cos(x) ... 1 ..... ... . .. ... ... ... . . ... .. ... .. ... ... . ... . .. .... .... .... .... ..... . . . . ...... ..... ........ ....... ......... ......... . . ............ . . . . . . . .......................... .............................. .... - Figura 3.1: Circonferenza trigonometrica. punto P ; se non vi è possibilità di equivoci, le parentesi che racchiudono la x vengono omesse e si scrive semplicemente sin x e cos x. Dalle definizioni adottate segue subito che, per ogni x ∈ R −1 ≤ sin x ≤ 1 , −1 ≤ cos x ≤ 1 . In particolare, quindi, le funzioni seno e coseno sono limitate. Inoltre, utilizzando il teorema di Pitagora, si ricava la seguente relazione tra il seno ed il coseno, valida anch’essa per ogni x ∈ R, sin2 x + cos2 x = 1 (il simbolo sin2 x è da intendersi come (sin x)2 ; la stessa convenzione vale per il coseno e, più in generale, per tutte le quantità trigonometriche). Si descrivono ora alcune proprietà del seno e del coseno di un qualsiasi numero reale x la cui dimostrazione è una immediata conseguenza delle definizioni adottate. 3.2 Richiami di trigonometria e coordinate polari 59 1. Per ogni x ∈ R: sin(x + 2π) = sin x , cos(x + 2π) = cos x . Tale relazione esprime la proprietà di periodicità di periodo 2π del seno e del coseno. ( ( π) π) 2. Per ogni x ∈ R: sin x + = cos x , cos x + = − sin x . 2 2 (π ) (π ) 3. Per ogni x ∈ R: sin − x = cos x , cos − x = sin x . 2 2 4. Per ogni x ∈ R: sin(x + π) = − sin x , cos(x + π) = − cos x . Le proprietà precedenti conseguono tutte dalle seguenti formule di addizione del seno e del coseno. La dimostrazione di tali formule per brevità verrà omessa. Per ogni x, y ∈ R, si ha 5. sin(x + y) = sin x cos y + cos x sin y . 6. sin(x − y) = sin x cos y − cos x sin y . 7. cos(x + y) = cos x cos y − sin x sin y . 8. cos(x − y) = cos x cos y + sin x sin y . Considerando, in particolare, x = y nelle proprietà 5. e 7. precedenti si ottengono le seguenti ulteriori formule, note con il nome di formule di moltiplicazione. 9. Per ogni x ∈ R: sin 2x = 2 sin x cos x . 10. Per ogni x ∈ R: cos 2x = cos2 x − sin2 x = 2 cos2 x − 1 = 1 − 2 sin2 x . Considerando x/2 al posto di x nell’ultima uguaglianza, si ottiene cos x = 2 cos2 (x/2) − 1, dalla quale si ottengono le seguenti formule di bisezione. 11. Per ogni x ∈ R: cos2 x 1 + cos x = . 2 2 12. Per ogni x ∈ R: sin2 x 1 − cos x = . 2 2 Infine, addizionando e sottraendo a due a due le 5.–6. e le 7.–8., si ottengono le cosiddette formule di prostaferesi, che consentono di esprimere il prodotto seni e/o coseni nella somma di seni e/o coseni. 13. Per ogni x, y ∈ R: sin(x + y) + sin(x − y) = 2 sin x cos y . 14. Per ogni x, y ∈ R: sin(x + y) − sin(x − y) = 2 cos x sin y . Capitolo 3: Numeri complessi e polinomi 60 15. Per ogni x, y ∈ R: cos(x + y) + cos(x − y) = 2 cos x cos y . 16. Per ogni x, y ∈ R: cos(x + y) − cos(x − y) = −2 sin x sin y . Le formule precedenti possono essere scritte in forma diversa ponendo x = (α + β)/2 e y = (α − β)/2; se ne lascia per esercizio la trascrizione con tali posizioni. Si passa ora ad elencare alcuni valori del seno e del coseno in alcuni archi particolari che si possono dedurre facilmente da proprietà geometriche sulla circonferenza trigonometrica. sin 0 = 0 , cos 0 = 1 . √ π 1 π 3 sin = , cos = . 6 2 6 2 √ √ π 2 π 2 sin = , cos = . 4 2 4 2 √ 3 π π 1 sin = , cos = . 3 2 3 2 π π cos = 0 . sin = 1 , 2 2 Utilizzando le proprietà 1.–4, dagli archi noti precedenti possono esserne ricavati altri come, ad esempio, 3 π, 4 5 π, 6 π, 7 π, 6 5 π, 4 4 π, 3 3 π, 2 5 π, 3 7 π, 4 11 π. 6 Usando poi la proprietà di periodicità del seno e del coseno si ricavano archi noti non appartenenti a [0, 2π[. A questo punto si possono definire ulteriori nozioni trigonometriche. Sia x ∈ R, x ̸= π/2 + kπ per ogni k ∈ Z e si consideri il corrispondente punto P sulla circonferenza trigonometrica. Poiché P non si trova sull’asse delle ordinate, la semiretta passante per l’origine e il punto P interseca la retta parallela all’asse delle ordinate passante per il punto A di coordinate (1, 0) in uno ed un solo punto Q. Allora la tangente di x si definisce come l’ordinata di tale punto Q. Utilizzando la similitudine dei triangoli di vertici OBP e OAQ rappresentati in Figura 3.2, si deduce facilmente la relazione sin x : tan x = cos x : 1, dalla quale si ricava tan x = sin x . cos x 3.2 Richiami di trigonometria e coordinate polari 61 6 ....................................... ................... ........... ........... ......... . . . . . . . ........ Q ........ . ...... . . . . . . .....P . . . . . . . . ...... ... ........ ... ... ....... .... ....... tan(x) . .. .. ... x ...... .. . ....... .... ...... .... ...... A O B ..... ... .. ... 1 ..... ... . .. ... ... ... . . ... .. ... .. ... ... . ... . .. .... .... .... .... ..... . . . . ...... ..... ........ ....... ......... ......... . . . ............ . . . . . . ........................................................... - Figura 3.2: Interpretazione geometrica della tangente. Le proprietà della tangente derivano pertanto da quelle del seno e del coseno. Ad esempio, per ogni x ∈ Rr{π/2+kπ | k ∈ Z}, si ottiene tan(x+π) = tan(x) = tan(x − π), e quindi la tangente è periodica di periodo π. Inoltre, sin(−x) − sin x tan(−x) = = = − tan x. cos(−x) cos x Nello stesso modo è possibile ricavare i valori della tangente in alcuni archi particolari. In modo analogo a quanto visto per la tangente, si può procedere considerando x ∈ R tale che x ̸= kπ per ogni k ∈ Z e considerando ancora il punto P corrispondente sulla circonferenza trigonometrica. Allora P non si trova sull’asse delle ascisse e quindi la semiretta passante per l’origine e il punto P interseca la retta parallela all’asse delle ascisse passante per il punto C di coordinate (0, 1) in uno ed un solo punto Q. Allora la cotangente di x si definisce come l’ascissa di tale punto Q. Anche ora, utilizzando la similitudine dei triangoli di vertici OBP e 62 Capitolo 3: Numeri complessi e polinomi OCQ rappresentati in Figura 3.3, si deduce facilmente la relazione sin x : 1 = cos x : cot x, dalla quale si ricava cos x cot x = . sin x 6 ........................ cot(x) ..............C ............ ................... ........... ......... . . . . . . . . ........ . . . . . . . ...... .. ..... .....P . . . . ..... . . . B . ..... . . . ........ . . . . . ....... . . ... ...... . ... x ....... .... ....... . .. ...... .... ....... O .... ... .. ... 1 ..... ... . ... .. ... .. ... .... . ... .. ... ... ... . . .... ... .... .... ..... .... . . ...... . ..... ........ ....... ......... ........ . ............ . . . . . . . . . ... .................... ..................................... Q A - Figura 3.3: Interpretazione geometrica della cotangente. Le proprietà della cotangente si discutono in maniera analoga a quanto svolto per la tangente e dipendono ancora una volta da quelle delle funzioni seno e coseno. Si richiama solamente l’attenzione sul fatto che la cotangente è anch’essa periodica di periodo π, ma non verifica proprietà di simmetria. 3.2.1 Coordinate polari Si è visto in precedenza che gli elementi di un piano rappresentano geometricamente gli elementi di R2 ; ora se ne studia una diversa rappresentazione, utile soprattutto in questa fase per poter esprimere i numeri complessi in una forma alternativa. 3.2 Richiami di trigonometria e coordinate polari 63 Sia assegnato un piano π e si fissi su di esso un riferimento cartesiano ortonormale; quindi ogni elemento P ∈ π può essere univocamente individuato mediante una coppia (x, y). Si osservi ora che se il punto P non coincide con l’origine, esso può essere individuato in modo alternativo assegnando la sua distanza ρ dall’origine e l’arco di circonferenza unitaria θ compreso tra il semiasse positivo dell’asse reale e la semiretta uscente dall’origine e passante per P . Gli elementi ρ e θ cosı̀ definiti vengono denominati coordinate polari del punto P . Il numero ρ viene denominato modulo (oppure raggio vettore) di P , mentre il numero θ viene denominato argomento (oppure anomalia) di P . Bisogna osservare che l’argomento non è individuato univocamente; infatti se θ è un argomento di P , ogni altro numero del tipo θ + 2kπ con k ∈ Z, è ancora un argomento di P . Tuttavia, esiste sicuramente uno ed un solo argomento θ di P che verifica le condizioni −π < θ ≤ π; tale argomento viene denominato argomento principale di P . Per quanto riguarda l’origine, essa è individuata univocamente dalla condizione ρ = 0; per convenzione, all’origine si può attribuire un argomento arbitrario. Se si conoscono le coordinate cartesiane (x, y) di un punto P diverso dall’origine, il modulo ρ di P si ottiene dalla formula √ ρ = x2 + y 2 , (3.2.1) mentre un argomento θ di P può essere individuato dalle condizioni cos θ = x , ρ sin θ = y ; ρ (3.2.2) in particolare, se x = 0, l’argomento principale è { π/2 , se y > 0 , θ= −π/2 , se y < 0 ; se invece x ̸= 0, l’argomento principale è se x > 0 , arctan xy , y π + arctan x , se x < 0, y ≥ 0 , θ= −π + arctan xy , se x < 0, y < 0 . Viceversa, se sono note le coordinate polari (ρ, θ) di P , si possono ricavare facilmente le coordinate cartesiane di P ponendo { x = ρ cos θ , (3.2.3) y = ρ sin θ , Capitolo 3: Numeri complessi e polinomi 64 6 y − − − − − − − − − − − − −• P | | ρ | .... ...... | ......... ... ... θ . .. .. .. | .. .. .. 0 x . - Figura 3.4: Coordinate polari. 3.3 Forma trigonometrica dei numeri complessi La forma trigonometrica di un numero complesso z si ottiene semplicemente considerando le coordinate polari del punto P del piano complesso corrispondente a z. Sia z = a + ib ∈ C; essendo (a, b) la forma geometrica di z, le √ coordinate polari si possono ottenere dalle (3.2.1)–(3.2.2) ponendo ρ = a2 + b2 e considerando θ soddisfacente le relazioni cos θ = x/ρ e sin θ = y/ρ; tenendo presenti le (3.2.3), il numero z si potrà quindi scrivere nella forma z = ρ(cos θ + i sin θ) , (3.3.1) che viene appunto denominata forma trigonometrica di z. Ad esempio, 1√ = cos 0 + i sin 0, −1 = cos π + i sin π, i = cos(π/2) + i sin(π/2), 1 + i = 2(cos(π/4) + i sin(π/4)). Dalle considerazioni svolte riguardanti le coordinate polari, si ricava che la forma trigonometrica di z non è univocamente determinata; gli argomenti di z sono del tipo θ + 2kπ con k ∈ Z; in particolare, il numero 0 ha modulo 0 e argomento arbitrario. Tuttavia, l’argomento di un numero complesso diverso da 0 risulta univocamente determinato se si considera quello principale compreso nell’intervallo ] − π, π]. Come conseguenza di ciò, si ottiene il seguente principio di uguaglianza di due numeri complessi in forma trigonometrica. 3.3 Forma trigonometrica dei numeri complessi 65 Proposizione 3.3.1 Siano z = ρ(cos θ + i sin θ) e w = σ(cos φ + i sin φ) due numeri complessi in forma trigonometrica diversi da 0. Si ha z = w se e solo se ρ = σ ed esiste k ∈ Z tale che θ = φ + 2kπ. Inoltre, se θ è l’argomento principale di z e φ è l’argomento principale di w, si ha z = w se e solo se ρ = σ e θ = φ. Si studiano a questo punto le varie operazioni algebriche in forma trigonometrica. Le operazioni di somma e differenza di due numeri complessi non sono immediate in forma trigonometrica e per tali operazioni conviene utilizzare soprattutto la forma algebrica o geometrica. Al contrario, si fa vedere ora che le operazioni di prodotto, reciproco, quoziente, potenza e radice si possono eseguire in modo molto semplice utilizzando proprio la forma trigonometrica. Siano, infatti, z = ρ(cos θ + i sin θ) e w = σ(cos φ + i sin φ) due numeri complessi. Poiché la forma algebrica di z e w è data da z = (ρ cos θ) + i(ρ sin θ), w = (σ cos φ) + i(σ sin φ) il prodotto z · w è dato da z·w = ρ · σ((cos θ cos φ − sin θ sin φ) + i(cos θ sin φ + sin θ cos φ)) = ρ · σ(cos(θ + φ) + i sin(θ + φ)) . Quindi si conclude che il prodotto in forma trigonometrica di due numeri complessi z e w ha come modulo il prodotto dei moduli di z e di w e come argomento la somma degli argomenti di z e di w: z · w = ρ · σ(cos(θ + φ) + i sin(θ + φ)) . (3.3.2) Tuttavia, in generale, conviene tener presente che se θ e φ sono gli argomenti principali di z e rispettivamente di w, non è detto che θ + φ sia l’argomento principale di z · w; per ottenerlo, potrebbe infatti essere necessario aggiungere o sottrarre 2π. Sia ora z = ρ(cos θ +i sin θ) un numero complesso diverso da 0; si verifica facilmente che il reciproco di z è dato da z −1 = ρ−1 (cos(−θ) + i sin(−θ)) (3.3.3) Pertanto, il reciproco di un numero complesso diverso da 0 ha come modulo il reciproco del modulo di z e come argomento quello opposto all’argomento di z. Da tale regola, si ricava anche la regola sul quoziente di due numeri complessi. Infatti, se z = ρ(cos θ + i sin θ) e w = σ(cos φ + i sin φ) con w ̸= 0, allora, dalle (3.3.2) e (3.3.3), ρ z = z · w−1 = (cos(θ − φ) + i sin(θ − φ)) . w σ (3.3.4) Capitolo 3: Numeri complessi e polinomi 66 Si conclude che il quoziente di z e w ha come modulo il quoziente dei moduli di z e di w e come argomento la differenza degli argomenti di z e di w Come conseguenza della regola sul prodotto, si ottiene facilmente anche il calcolo delle potenze di un numero complesso z = ρ(cos θ +i sin θ). Ponendo w = z nella (3.3.2) si ha infatti z 2 = ρ2 (cos(2θ)+i sin(2θ)) e più in generale, procedendo per induzione, per ogni n ≥ 1, z n = ρn (cos(nθ) + i sin(nθ)) . (3.3.5) La formula (3.3.5) precedente viene denominata formula di De Moivre. Viene considerato infine, il calcolo delle radici n-esime (n ≥ 2) di un numero complesso z = ρ(cos θ + i sin θ). Una radice di z è definita come un numero complesso w ∈ C che verifica la proprietà wn = z. Si riconosce in modo immediato che l’unica radice di 0 è il numero 0. Si supponga quindi che z ̸= 0. Se si pone w = σ(cos φ + i sin φ), dalla (3.3.5) si ricava wn = σ n (cos(nφ) + i sin(nφ)), e quindi, imponendo l’uguaglianza wn = z, dal principio di uguaglianza di due numeri complessi in forma trigonometrica (Proposizione 3.3.1) segue: ρ = σn , nφ = θ + 2kπ con k ∈ Z; θ + 2kπ √ n ρ e φ = , con k ∈ Z; si osserva a questo punto che, al n θ + 2kπ variare di k ∈ Z, gli argomenti φ = non danno tutti luogo a numeri n complessi distinti, in quanto, per ogni k ∈ Z, quindi σ = θ + 2kπ θ + 2(k + n)π = + 2π ; n n quindi si possono considerare solo n argomenti distinti corrispondenti ai valori k = 0, . . . , n − 1 e tali argomenti forniscono tutte le possibili radici n-esime di z, che sono date quindi da: wk = θ + 2kπ θ + 2kπ √ n ρ (cos + i sin ), n n k = 0, 1, . . . , n − 1 . (3.3.6) Quindi ogni numero complesso z diverso da 0 ammette esattamente n radici distinte. Dalla formula precedente, si ricava che le radici n-esime di z si trovano tutte su una stessa circonferenza con centro nell’origine e raggio uguale alla radice n-esima del modulo di z e formano i vertici di un poligono regolare con n lati (geometricamente, quindi, è sufficiente individuare uno dei vertici che ha argomento uguale alla n-esima parte dell’argomento di z). Nella Figura 3.5 si rappresenta un esempio di radici terze e quinte di un numero complesso z. 3.4 Forma esponenziale dei numeri complessi 6 6 r ............................................ ................ ........... .......... ......... ......... ........ ....... . ...... . . . . ...... ..... . . . .... .. . .... . . .... ... . . ... ... . ... .. ... . .. ... . ... .... .. ... .. .. ... .. ... .. .. .. .. .. .. .. .. . .. . ... ... ... .. ... ... ... .. .. ... . . .... ... .... ... .... .... ..... ... ...... ...... . . . . ....... . ...... ........ ......... ........ ............. ......... ......................................................... r 0 r r 67 r • z - z • r 0 - ............................................ ................ ........... .......... ......... ......... ........ ....... . ...... . . . . ...... ..... . . . .... .. . .... . . .... ... . . ... ... . ... .. ... . .. ... . ... .... .. ... .. .. ... .. ... .. .. .. .. .. .. .. .. . .. . ... ... ... .. ... ... ... .. .. ... . . .... ... .... ... .... .... ..... ... ...... ...... . . . . ....... . ...... ........ ......... ........ ............. ......... ......................................................... r r Figura 3.5: Radici terze e quinte di un numero complesso. Dalla 3.3.6 è facile constatare che le radici quadrate di un numero complesso sono l’una l’opposta dell’altra (in quanto i loro argomenti differiscono di π); in particolare, le due radici complesse di un numero reale positivo sono una reale positiva (che coincide con la radice quadrata aritmetica) e l’altra reale negativa (l’opposta della prima); se, invece, si considera un numero reale strettamente negativo, le due radici complesse saranno immaginarie pure l’una l’opposta dell’altra). Per quanto riguarda le radici terze complesse di un numero reale, si può osservare che esse sono una reale (coincidente con la radice terza aritmetica) e due tra loro complesse coniugate. 3.4 Forma esponenziale dei numeri complessi Se z = x + iy è un numero complesso, si pone innanzitutto ez = ex (cos y + i sin y) ; (3.4.1) si osservi che x, y ∈ R e quindi le funzioni a secondo membro sono quelle già note nel caso reale. In particolare, se θ ∈ R, si ha ei θ = cos θ + i sin θ ; (3.4.2) conseguentemente, se si conosce la forma trigonometrica z = ρ(cos θ+i sin θ) di un numero complesso z si può scrivere z = ρei θ . (3.4.3) Capitolo 3: Numeri complessi e polinomi 68 La (3.4.3) viene denominata forma esponenziale di z. Dalla forma esponenziale è anche immediato passare alla forma trigonometrica e viceversa utilizzando la (3.4.2). Inoltre, dalle (3.4.1) e (3.4.2) si ottengono facilmente le seguenti proprietà di ez , che valgono per ogni z, w ∈ C e θ ∈ R. 1. ez+w = ez · ew ; 2. ez ̸= 0 ; 3. |ei θ | = 1 ; 4. ez+2kπi = ez ; 5. |ez | = eRe z ; 6. ez = eRe z (cos(Im z) + i sin(Im z)) . Dalla (3.4.2) si ottiene anche, per ogni θ ∈ R, e−i θ = cos θ − i sin θ e tale formula, unita alla (3.4.2) permette di ricavare le cosiddette formule di Eulero: ei θ − e−i θ ei θ + e−i θ sin θ = , cos θ = . (3.4.4) 2i 2 3.5 3.5.1 Polinomi ed equazioni algebriche Polinomi e relative radici Le funzioni elementari che si possono considerare più semplici dal punto di vista del calcolo esplicito sono sicuramente le funzioni potenza ad esponente intero positivo. In questa sezione vengono considerate combinazioni lineari di tali funzioni. Esse verranno definite in tutto l’insieme dei numeri complessi, per studiarne alcune proprietà generali; si eviterà di enunciare o approfondire proprietà che, sebbene di interesse generale, non verranno utilizzate esplicitamente nel seguito. Definizione 3.5.1 Sia n ∈ N. Si dice polinomio di grado n ogni funzione P : C → C per cui esistono a0 , . . . , an ∈ C con an ≠= 0 tali che, per ogni z ∈ C, P (z) = a0 + a1 z + · · · + an z n . (3.5.1) Il grado di un polinomio è, quindi, il più grande dei numeri naturali k per cui il coefficiente della potenza z k è diverso da 0. Il grado di un polinomio P viene indicato spesso con il simbolo deg(P ). Il coefficiente a0 del termine di grado 0 di un polinomio viene spesso denominato termine noto del polinomio. 3.5 Polinomi ed equazioni algebriche 69 Si denomina zero (oppure radice, oppure soluzione) del polinomio P ogni numero complesso z0 ∈ C tale che P (z0 ) = 0. Nel seguito avranno particolare interesse i polinomi per cui i coefficienti a0 , . . . , an sono numeri reali. Essi verranno denominati polinomi a coefficienti reali. Conviene osservare che se P è un polinomio a coefficienti reali allora, per ogni x ∈ R, P (x) è anch’esso un numero reale; in tale circostanza, quindi, il polinomio P può essere anche riguardato come funzione da R in R. Sarà chiaro dal contesto, nel seguito, se tali polinomi vengono considerati definiti in R (come funzioni reali) oppure in C. Si considera ora qualche esempio. In base alla definizione adottata, un polinomio di grado 0 è una funzione costante P : C → C di costante valore un numero a0 ∈ C∗ . Un polinomio di grado 0 ovviamente non ammette alcuna radice. Invece, la funzione costante di costante valore 0 viene denominata polinomio nullo; per definizione di grado di un polinomio, il grado del polinomio nullo non può essere zero: si assume, per convenzione, che il grado del polinomio nullo sia -1. In effetti, il polinomio nullo è l’unico ad avere infinite radici, come afferma il seguente risultato. Quindi se un polinomio P ammette infinite radici, allora P è il polinomio nullo. Da tale affermazione segue il principio di identità di due polinomi, che è utile in molte circostanze. Proposizione 3.5.2 (Principio di identità dei polinomi) Siano P e Q due polinomi. Se P e Q coincidono in infiniti punti, allora P = Q. Dimostrazione. Infatti, il polinomio P − Q ammette infinite radici e quindi P − Q = 0. In effetti, se n é il grado massimo dei due polinomi, é sufficiente che i due polinomi coincidano in n + 1 punti per essere uguali (infatti, in tal caso la differenza dei due polinomi avrebbe un numero di zeri superiore al proprio grado e ciò, come si vedrà in seguito, può valere solamente per il polinomio nullo). Dalla Proposizione 3.5.2 precedente segue anche che i coefficienti di un polinomio sono univocamente determinati nel senso che se, per ogni z ∈ C, P (z) = a0 + a1 z + · · · + an z n con an ̸= 0 e P (z) = b0 + b1 z + · · · + bm z m con bm ̸= 0, allora n = m e, per ogni k = 0, . . . , n, ak = bk . Riprendendo gli esempi, un polinomio di grado 1 è una funzione P : C → C del tipo P (z) = a0 + a1 z (z ∈ C), con a0 ∈ C, a1 ∈ C, a1 ̸= 0. Un polinomio di grado 1 ammette sempre un’unica radice data da c = −a0 /a1 . Nel caso in cui le costanti a0 e a1 siano reali, esse vengono indicate solitamente con n e rispettivamente m; nel piano cartesiano l’equazione y = mx + n (x ∈ R) fornisce l’equazione della retta di coefficiente angolare m ed ordinata all’origine n. Ad esempio, il polinomio P (z) = iz + 3i − 3 è un polinomio di grado 1; la sua unica radice è data da c = −3 − 3i. Capitolo 3: Numeri complessi e polinomi 70 Un polinomio di grado 2 è del tipo P (z) = a0 + a1 z + a2 z 2 (z ∈ C), con a0 ∈ C, a1 ∈ C, a2 ∈ C, a2 ̸= 0. I coefficienti a0 , a1 e a2 vengono indicati di solito con c, b e rispettivamente a. Nel caso in cui tali coefficienti siano reali, l’equazione di secondo grado y = ax2 + bx + c rappresenta una parabola nel piano cartesiano. Per determinare gli zeri di un polinomio P (z) = az 2 +bz+c di grado 2 è importante il seguente numero ∆ = b2 − 4ac(∈ C), denominato discriminante (o brevemente delta) del polinomio P (z) = az 2 + bz + c. Infatti, l’equazione az 2 + bz + c = 0 si può scrivere ( b z+ 2a )2 − ∆ =0. 4a2 Dall’equazione precedente segue che, denotate con w1 e w2 le radici (complesse) del numero complesso ∆, gli zeri del polinomio P sono forniti da z1 = −b + w1 , 2a z2 = −b + w2 2a e il polinomio si può scrivere come P (z) = a(z − z1 )(z − z2 ). I numeri complessi w1 e w2 , in quanto radici del numero complesso ∆, devono essere l’uno opposto dell’altro. Quindi, le radici z1 e z2 possono essere espresse scrivendo √ √ −b − ∆ −b + ∆ z1 = , z2 = , 2a 2a dove ∆ denota una qualsiasi delle due radici complesse di ∆. Da ciò segue che i numeri complessi z1 e z2 sono caratterizzati dalle condizioni seguenti z1 + z2 = − b , a z1 · z2 = c . a Le radici z1 e z2 coincidono solo nel caso in ∆ = 0; se ciò accade, l’unica radice è data da z0 = −b/2a e si può scrivere P (z) = a(z − z0 )2 (si dice in questo caso che z0 è una radice di molteplicità 2. Se il polinomio di secondo grado è a coefficienti reali, cioè se a, b, c√∈ R, anche ∆√ è un numero reale. Nel caso in cui ∆ > 0, si ha w1 = ∆ e w2 = − ∆ e quindi il polinomio P ammette le due radici reali distinte √ √ −b − ∆ −b + ∆ x1 = , x2 = , 2a 2a e si può scrivere come P (z) = a(z − x1 )(z − x2 ). Se ∆ = 0, P ammette un’unica radice reale data da x0 = −b/(2a) e si ha P (z) = a(z − x0 )2 . 3.5 Polinomi ed equazioni algebriche 71 √ Infine, √ se ∆ < 0, le radici complesse di ∆ sono w1 = −i −Delta e w2 = i −∆; quindi il polinomio P ammette due radici complesse coniugate date da √ √ −b − i −∆ −b + i −∆ z1 = , z2 = . 2a 2a Per i polinomi di grado 3 oppure 4 esistono delle formule esplicite per la determinazione degli zeri. Invece, per i polinomi di grado superiore a 4, si dimostra che non è possibile stabilire un procedimento generale che consenta di ottenerne gli zeri. Si considera ora la divisione di due polinomi. Si ha innanzitutto il seguente risultato di cui si omette per brevità la dimostrazione. Proposizione 3.5.3 Siano P1 un polinomio di grado n e P2 un polinomio non nullo di grado m. Allora esistono, e sono unici, due polinomi Q ed R tali che P1 = Q · P2 + R , deg(R) < m . Inoltre, se m ≤ n si ha deg(Q) = n − m, mentre se m > n si ha Q = 0 e R = P1 . I polinomi Q ed R previsti nella proposizione precedente vengono denominati rispettivamente polinomio quoziente e polinomio resto di P1 e P2 . Si osservi che se P1 e P2 sono polinomi a coefficienti reali, anche il quoziente ed il resto lo sono. Un caso particolarmente rilevante si ottiene quando il resto della divisione tra due polinomi è il polinomio nullo. Definizione 3.5.4 Siano P1 e P2 polinomi con P2 non nullo. Si dice che P1 è divisibile per P2 (oppure che P2 divide P1 ) se il polinomio resto della divisione di P1 e P2 è il polinomio nullo e quindi se esiste un polinomio Q tale che P1 = Q · P2 . Un caso particolarmente interessante è quello in cui il polinomio P2 è del tipo P2 (z) = z − z0 , con z0 ∈ C. La divisione di un polinomio P con P2 deve avere come resto un polinomio di grado minore di 1, cioè deve essere R(z) = a, con a ∈ C. Inoltre, dalla relazione P (z) = Q(z) · P2 (z) + R(z) = (z − z0 ) · Q(z) + a si ricava P (z0 ) = a e quindi R(z) = P (z0 ). Dunque, il resto della divisione di un polinomio P per il polinomio z − z0 è un polinomio costante di costante valore P (z0 ). Da ciò segue immediatamente la caratterizzazione della divisibilità per z − z0 , con z0 ∈ C Proposizione 3.5.5 Sia P un polinomio e sia z0 ∈ C. Allora, le seguenti proposizioni sono equivalenti: Capitolo 3: Numeri complessi e polinomi 72 a) Il polinomio P è divisibile per z − z0 . b) z0 è una radice di P . Quindi, se un polinomio P di grado n ≥ 1 ammette una radice z0 ∈ C, esso si decompone nel prodotto P (z) = (z − z0 )Q(z)|; , (3.5.2) con Q polinomio di grado n − 1 in quanto il coefficiente di z n−1 di Q deve coincidere con il coefficiente di z n di P . Uno dei più importanti risultati riguardanti i polinomi e le equazioni algebriche è il fatto che i polinomi aventi grado maggiore o uguale di 1 ammettono sempre almeno una radice. Per brevità, ci si limita ad enunciare solamente tale risultato, studiandone poi qualche conseguenza. Teorema 3.5.6 (Teorema fondamentale dell’algebra) Se P è un polinomio di grado n ≥ 1, allora esiste z0 ∈ C tale che P (z0 ) = 0. Dalla (3.5.2) si ottiene la seguente conseguenza del teorema fondamentale dell’algebra. Corollario 3.5.7 Se P (z) = a0 + · · · + an z n (an ̸= 0) è un polinomio di grado n ≥ 1, allora esistono esattamente n elementi z1 , . . . , zn ∈ C tali che P (z) = an · (z − z1 ) · · · (z − zn ) . (3.5.3) Dimostrazione. Si procede per induzione completa sul numero naturale n ≥ 1. Se n = 1, si ha P (z) = a0 + a1 z e la tesi si verifica direttamente. Si supponga che la tesi sia vera per n ∈ N e che il grado di P sia n + 1, cioè P (z) = an+1 z n+1 + an z n + · · · + a0 , an+1 ̸= 0. Dal Teorema 3.5.6, esiste zn+1 ∈ C tale che P (zn+1 ) = 0 e quindi, dalla (3.5.2), P (z) = (z − zn+1 )Q(z), con Q polinomio di grado n; inoltre, il coefficiente di z n del polinomio Q è an+1 ̸= 0. Per l’ipotesi di induzione, esistono z1 , . . . , zn ∈ C tali che Q(z) = an+1 · (z − z1 ) · · · (z − zn ) e quindi P (z) = an+1 · (z − z1 ) · · · (z − zn ) · (z − zn+1 ); la tesi è quindi vera per il numero naturale n + 1. Dal principio di induzione completa segue la tesi per ogni n ≥ 1. Ognuno dei numeri z1 , . . . , zn ∈ C verificanti la (3.5.3) è una radice di P ; tuttavia, tali radici non sono necessariamente tutte distinte. Per tener conto di ciò, conviene dare la seguente definizione. Definizione 3.5.8 Sia P un polinomio di grado n ≥ 1 e sia h ∈ N, h ≥ 1. Si dice che una radice z0 di P ha molteplicità h se esiste un polinomio Q di grado n − h tale che Q(z0 ) ̸= 0 (cioè z0 non deve essere una radice di Q) e inoltre, per ogni z ∈ C, P (z) = (z − z0 )h · Q(z) . (3.5.4) 3.5 Polinomi ed equazioni algebriche 73 In qualche caso, per comodità la definizione precedente può essere estesa al caso h = 0 convenendo di denominare di molteplicità 0 un numero che non è radice di P . Il Corollario 3.5.7 si può esprimere dicendo che un polinomio di grado n ≥ 1 ha esattamente n radici, se ognuna di esse viene contata con la propria molteplicità; se z1 , . . . , zs sono le radici distinte di P e se h1 , . . . , hs sono le rispettive molteplicità, si ha P (z) = an · (z − z1 )h1 · · · (z − zs )hs (3.5.5) con h1 + . . . hs = n. Dalla formula precedente segue in particolare che un polinomio di grado n ≥ 1 ha al più n radici distinte. Conseguentemente, due polinomi P e Q, entrambi di grado minore o uguale di n, che coincidono in n + 1 punti distinti sono necessariamente uguali (infatti il polinomio P − Q si annulla in n + 1 punti distinti). Uno dei metodi più comunemente utilizzati per determinare le radici di un polinomio P consiste nell’applicazione della regola di Ruffini, che per il suo carattere elementare non viene qui approfondita. 3.5.2 Polinomi a coefficienti reali Ci si sofferma ora maggiormente sui polinomi a coefficienti reali, in quanto per tali polinomi si possono aggiungere alcune proprietà interessanti che risulteranno particolarmente utili nel seguito. Per esporre compiutamente tali proprietà, conviene introdurre il polinomio coniugato di un assegnato polinomio (a coefficienti complessi) e studiarne il comportamento delle radici. Definizione 3.5.9 Siano a0 , . . . , an ∈ C con an ̸= 0 e si consideri il polinomio P (z) = a0 + · · · + an z n . Si denomina polinomio coniugato di P , e si denota con P il polinomio P (z) = a0 + · · · + an z n . Quindi il polinomio coniugato di un polinomio P ha come coefficienti i coniugati dei coefficienti di P . Se P ha grado n, anche il polinomio coniugato ha grado n. Ad esempio il coniugato del polinomio P (z) = iz 4 − 2z 3 + (2 − i)z + 1 + i è il polinomio P (z) = −iz 4 − 2z 3 + (2 + i)z + 1 − i. Ovviamente, un polinomio coincide con il suo polinomio coniugato se e solo se è a coefficienti reali. Per quanto riguarda le radici del polinomio coniugato, vale la proprietà seguente. 74 Capitolo 3: Numeri complessi e polinomi Proposizione 3.5.10 Se P è un polinomio e z0 ∈ C è una radice di P , allora il numero complesso coniugato z0 di z0 è una radice del polinomio coniugato P . Dimostrazione. Siano a0 , . . . , an ∈ C con an ̸= 0 tali che P (z) = a0 +· · ·+an z n . Allora, dalla Definizione 3.5.9, P (z0 ) = a0 + a1 z0 + · · · + an z0 n = a0 + · · · + an z0n = P (z0 ) e quindi si ha P (z0 ) = 0 se e solo se P (z0 ) = 0 Si può osservare in più che sez1 , . . . , zs sono le radici distinte di P aventi rispettivamente molteplicità h1 , . . . , hs , dalla (3.5.5) si ha P (z) = an · (z − z1 )h1 · · · (z − zs )hs con h1 + . . . hs = n e quindi P (z) = an · (z − z1 )h1 · · · (z − zs )hs (3.5.6) Dunque z1 , . . . , zs sono le radici distinte del polinomio coniugato P ed hanno le stesse molteplicità h1 , . . . , hs di z1 , . . . , zs . Dalla proprietà precedente si è in grado di ricavare alcune proprietà delle radici di un polinomio a coefficienti reali. Proposizione 3.5.11 Sia P un polinomio a coefficienti reali. Se z0 ∈ C è una radice di P , allora anche il numero complesso coniugato z0 è una radice di P avente la stessa molteplicità di z0 . La dimostrazione della proposizione precedente è ovvia, tenendo presente che nel caso in esame P = P . Poiché le radici di un polinomio di grado n sono esattamente n se si tiene conto della molteplicità, si deduce che le radici complesse non reali devono essere a due a due coniugate e quindi sono in numero pari. Pertanto si ha la seguente proprietà. Proposizione 3.5.12 Sia P un polinomio a coefficienti reali di grado n ≥ 1, con n dispari. Allora esiste almeno una radice reale di P . Come ulteriore conseguenza della Proposizione 3.5.11, si può ricavare un’utile decomposizione di un polinomio a coefficienti reali. Sia P (z) = a0 + · · · + an z n un polinomio con coefficienti a0 , . . . , an ∈ R, an ̸= 0. Dalla (3.5.5), e tenendo presente che le radici complesse sono tra loro coniugate (e quindi possono essere moltiplicate tra loro dando luogo a termini di secondo grado con ∆ < 0), si deduce che il polinomio P si può decomporre nel modo seguente: P (x) = an (x − x1 )h1 · · · (x − xp )hp (x2 + b1 x + c1 )k1 · · · (x2 + bq x + cq )kq , (3.5.7) dove x1 , . . . , xp sono le radici reali di P aventi rispettivamente molteplicità h1 , . . . , hp , e k1 , . . . , kq sono le molteplicità delle radici complesse coniugate 3.5 Polinomi ed equazioni algebriche 75 dei termini x2 + b1 x + c1 , . . . , x2 + bq x + cq con ∆1 = b21 − 4c1 < 0, . . . , ∆q = b2q − 4cq < 0. Poiché la somma di tutte le molteplicità deve essere n, si deve infine avere h1 + · · · + hp + 2(k1 + · · · + kq ) = n . Capitolo 4 Funzioni reali Lo studio delle funzioni reali (aventi cioè R come insieme di arrivo) è l’obiettivo principale dello studio seguente. Nella prima parte saranno considerate funzioni reali definite in un sottoinsieme di R (tali funzioni vengono denominate di variabile reale) mentre nella seconda parte si considereranno funzioni reali definite più in generale in un sottoinsieme di Rn , n ≥ 2 (tali funzioni vengono denominate di più variabili reali ). 4.1 Operazioni con le funzioni reali Per le funzioni reali, valgono tutti i concetti introdotti nella Sezione 1.2 e in quelle successive. Inoltre, la struttura algebrica di R consente di definire un’analoga struttura algebrica sull’insieme delle funzioni reali definite in uno stesso insieme X. Per precisare tale struttura algebrica si denoti con F(X, R) l’insieme delle funzioni reali definite in X (tale insieme viene denotato spesso anche con il simbolo RX ). Allora su F(X, R) sono definite le seguenti operazioni: 1. Addizione. Si considera la funzione + : F(X, R) × F(X, R) → F(X, R) che in ogni coppia (f, g) ∈ F(X, R) × F (X, R) assume come valore la funzione f + g : F(X, R) → R definita ponendo, per ogni x∈X (f + g)(x) = f (x) + g(x) . La funzione f + g viene denominata funzione somma di f e g. In questo modo la somma di due funzioni viene ricondotta alla somma dei valori delle due funzioni e quindi alla somma di numeri reali. 78 Capitolo 4: Funzioni reali Per questo motivo, per l’addizione continuano a valere le proprietà dell’addizione tra numeri reali e precisamente: • (Proprietà associativa) Per ogni f, g, h ∈ F (X, R): (f + g) + h = f + (g + h). Pertanto è superfluo l’uso delle parentesi e si può scrivere più semplicemente f + g + h. • (Proprietà commutativa) Per ogni f, g ∈ F (X, R): f + g = g + f . • (Esistenza dell’elemento neutro) Si consideri la funzione nulla 0 : X → R definita ponendo, per ogni x ∈ X, 0(x) = 0. Allora, per ogni f ∈ F(X, R), risulta f + 0 = f = 0 + f . • (Esistenza della funzione opposta) Per ogni f ∈ F(X, R), si consideri la funzione −f : X → R definita ponendo, per ogni x ∈ X, (−f )(x) = −f (x). Allora, per ogni f ∈ F(X, R), risulta f + (−f ) = 0 = (−f ) + f e per tale motivo la funzione −f viene denominata funzione opposta di f . 2. Moltiplicazione. Si considera la funzione · : F(X, R) × F(X, R) → F(X, R) che in ogni coppia (f, g) ∈ F (X, R) × F(X, R) assume come valore la funzione f · g : F(X, R) → R definita ponendo, per ogni x ∈ X, (f · g)(x) := f (x) · g(x) . La funzione f · g viene denominata funzione prodotto di f e g. Anche in questo caso valgono le proprietà si ottengono facilmente da quelle del prodotto di due numeri reali e precisamente valgono le seguenti proprietà. • (Proprietà associativa) Per ogni f, g, h ∈ F(X, R): (f · g) · h = f · (g · h). Pertanto anche in questo caso è superfluo l’uso delle parentesi e si può scrivere più semplicemente f · g · h. • (Proprietà commutativa) Per ogni f, g ∈ F(X, R): f · g = g · f . • (Esistenza dell’elemento neutro) Si consideri la funzione unità 1 : X → R definita ponendo, per ogni x ∈ X, 1(x) = 1. Allora, per ogni f ∈ F(X, R), risulta f · 1 = f = 1 · f . • (Esistenza della funzione reciproca) Sia f ∈ F(X, R) e si supponga che, per ogni x ∈ X, risulti f (x) ̸= 0. Allora si può 1 considerare la funzione : X → R definita ponendo, per ogni f 1 1 1 1 . Ovviamente si ha f · = 1 = · f e per x ∈ X, (x) = f f (x) f f 1 tale motivo la funzione viene denominata funzione reciproca f 4.1 Operazioni con le funzioni reali 79 di f . Si osservi che la funzione reciproca non esiste per ogni funzione diversa da quella nulla, ma solo per le funzioni che non si annullano in ogni elemento dell’insieme di definizione. 3. Moltiplicazione esterna. Si considera la funzione · : R×F (X, R) → F(X, R) che in ogni coppia (λ, f ) ∈ R × F (X, R) assume come valore la funzione λ · f : F(X, R) → R definita ponendo, per ogni x ∈ X, (λ · f )(x) := λ · f (x) . La funzione f · g viene denominata ancora funzione prodotto di λ ed f . Anche in questo caso le proprietà seguenti si ottengono facilmente da quelle del prodotto di due numeri reali. • Per ogni λ, µ ∈ R e per ogni f ∈ F(X, R): (λ+µ)·f = λ·f +µ·f . • Per ogni λ ∈ R e per ogni f, g ∈ F (X, R): λ · (f + g) = λ · f + λ · g. • Per ogni λ, µ ∈ R e per ogni f ∈ F(X, R): (λ · µ) · f = λ · (µ · f ). • Per ogni f ∈ F (X, R): 1 · f = f . Analogamente al caso della funzione nulla e della funzione unità, se λ ∈ R si può convenire di denotare ancora con λ la funzione costante di costante valore λ (cioè ∀ x ∈ X : λ(x) = λ). Con tale convenzione la moltiplicazione esterna risulta essere un caso particolare della moltiplicazione tra due funzioni. Dal punto di vista della struttura algebrica, l’insieme F(X, R) con l’addizione e la moltiplicazione esterna risulta essere uno spazio vettoriale reale e con l’aggiunta della moltiplicazione tra funzioni risulta essere un algebra reale. Tuttavia in molte questioni riguardanti lo studio delle funzioni reali risulta utile definire le operazioni di somma e prodotto anche se le funzioni reali in esame non sono definite nello stesso sottoinsieme di R. Infatti, se f : X → R e g : Y → R sono funzioni reali definite rispettivamente in X ⊂ R e Y ⊂ R si possono definire le funzioni f + g : X ∩ Y → R e f · g : X ∩ Y → R ponendo, per ogni x ∈ X ∩ Y , (f + g)(x) = f (x) + g(x) , (f · g)(x) = f (x) · g(x) . Tali funzioni continuano ad essere denominate somma e rispettivamente prodotto delle funzioni f e g. In maniera analoga si può definire la funzione reciproca di una funzione reale in una situazione più generale. Infatti se f : X → R è una Capitolo 4: Funzioni reali 80 funzione reale non identicamente nulla (cioè diversa dalla funzione nulla o equivalentemente che assume almeno in un punto un valore diverso da 0), si può definire il seguente sottoinsieme X0 = {x ∈ X | f (x) ̸= 0} e conseguentemente si può considerare la funzione ponendo, per ogni x ∈ X0 , 1 : X0 → R definita f 1 1 (x) = . f f (x) 1 continua ad essere denominata f funzione reciproca della funzione f . Anche in questo caso la funzione In questo modo, se f : X → R e g : Y → R sono funzioni reali definite in X ⊂ R e rispettivamente Y ⊂ R, si può considerare la funzione f quoziente di f e g che si denota con ed è definita nel modo seguente g 1 f =f· g g (prodotto di f con la reciproca di g). Ovviamente, la funzione quoziente è definita in {x ∈ X ∩ Y | g(x) ̸= 0}. Si ricordano infine la convenzioni utilizzate nella sezione 1.2.3 che consentono di definire una funzione inversa di una funzione reale iniettiva e di considerare la funzione composta in circostanze più generali. Funzione inversa. Siano X un sottoinsieme di R ed f : X → R una funzione reale iniettiva. Allora la funzione ridotta f# di f (vedasi la (1.2.13)) risulta biiettiva e quindi ammette un’inversa (f# )−1 : f (X) → X. Estendendo l’insieme di arrivo all’intero R (per ottenere una funzione reale) si considera infine la funzione f −1 : f (X) → R definita ponendo, per ogni y ∈ f (X), f −1 (y) = (f# )−1 (y). Tale funzione viene ancora denominata funzione inversa di f e, per come è definita, in ogni y ∈ f (X) assume come valore l’unico elemento x ∈ X tale che y = f (x). La funzione f −1 risulta essere iniettiva al pari di f. Tale procedimento verrà applicato in particolare per ottenere le funzioni inverse delle funzioni elementari (in qualche caso bisognerà inoltre considerare opportune restrizioni che consentano di ottenere la proprietà di iniettività). 4.2 Estremi di funzioni reali 81 Funzione composta. Se X ed Y sono sottoinsiemi di R e f : X → R e g : Y → R sono funzioni reali tali che f (X) ⊂ Y , si può considerare la funzione reale composta g ◦ f : X → R definita ponendo, per ogni x ∈ X, (g ◦ f )(x) = g(f (x)) (vedasi la (1.2.8)). 4.2 Estremi di funzioni reali Tutte le proprietà esposte nella Sezione 2.3.4 possono essere riferite alle funzioni reali applicandole all’immagine della funzione, che è un sottoinsieme di R. Pertanto, se X è un sottoinsieme1 di Red f : X ∈ R è una funzione reale, si ottengono le seguenti definizioni: • Funzioni limitate. Si dice che f è limitata superiormente (rispettivamente, limitata inferiormente) se f (X) è un sottoinsieme limitato superiormente (rispettivamente, inferiormente) di R, cioè se ∃ M ∈ R t.c. ∀ x ∈ X : f (x) ≤ M (rispettivamente, M ≤ f (x) ) (4.2.1) (si è tenuto conto del fatto che per ogni y ∈ f (X) esiste x ∈ X tale che y = f (x)). Ogni elemento M ∈ R verificante la (4.2.1) viene ovviamente denominato maggiorante (rispettivamente, minorante) di f . Infine, si dice che f è limitata se è limitata sia superiormente che inferiormente. • Funzioni dotate di massimo e minimo. Si dice f è dotata di massimo (rispettivamente, dotata di minimo) se tale è il sottoinsieme f (X) di R, e quindi se esiste M ∈ R tale che { 1) ∃ x ∈ X t.c. f (x0 ) = M ; 2) ∀ x ∈ X : f (x) ≤ M (rispettivamente, M ≤ f (x) ). (4.2.2) L’elemento M verificante la (4.2.2) è unico e viene denominato massimo di f (rispettivamente, minimo di f ) e si denota con uno dei seguenti simboli: max f , max f (x) , x∈X (rispettivamente, min X , min f (x) ). x∈X Spesso a tale elemento M si attribuisce anche la denominazione di massimo assoluto (rispettivamente, minimo assoluto di f per distinguerlo dai massimi e minimi relativi di cui si tratterà di seguito. 1 In tutto il seguito, l’insieme di definizione di una funzione verrà implicitamente supposto non vuoto, anche se non precisato esplicitamente. Capitolo 4: Funzioni reali 82 Al contrario, l’elemento x0 ∈ X previsto in 1) non è necessariamente unico. Ogni elemento x0 ∈ X verificante la condizione 1) precedente viene denominato punto di massimo (rispettivamente, punto di minimo) per f . Accanto alle definizioni precedenti, conviene a questo punto introdurre la seguente. Definizione 4.2.1 Siano f : X → R una funzione reale e sia x0 ∈ X. Si dice che x0 è un punto di massimo (rispettivamente, di minimo) relativo per f se esiste un numero reale δ > 0 tale che:2 ∀ x ∈ X ∩ Iδ (x0 ) r {x0 } : f (x) ≤ f (x0 ) (rispettivamente, f (x0 ) ≤ f (x) ). (4.2.3) Se la (4.2.3) vale con una diseguaglianza stretta (“<” al posto di “≤”), il punto di massimo (rispettivamente, di minimo) per f viene denominato proprio. Il valore f (x0 ) che la funzione assume in un punto di massimo (rispettivamente, di minimo) relativo per f , viene denominato massimo relativo (rispettivamente, minimo relativo) di f . In Figura 4.1 viene raffigurata geometricamente una funzione che ha il massimo assoluto M assunto nel punto m ed ulteriori punti di massimo relativo p e q, con valori P e rispettivamente Q. • Funzioni dotate di estremi. Si dice f è dotata di estremo superiore (rispettivamente, dotata di estremo inferiore) se tale è il sottoinsieme f (X) di R, e quindi se esiste un elemento ℓ ∈ R tale che ∀ x ∈ X : f (x) ≤ ℓ (rispettivamente, ℓ ≤ f (x) ); 1) 2) m ∈ R, ∀ x ∈ X : f (x) ≤ m ⇒ ℓ ≤ m (rispettivamente, ∀ x ∈ X : m ≤ f (x) ⇒ m ≤ ℓ ). (4.2.4) L’elemento ℓ verificante la (4.2.4) è unico, viene denominato estremo superiore di f (rispettivamente, estremo inferiore di f ) e viene denotato con uno dei seguenti simboli: sup f , sup f (x) , x∈X (rispettivamente, inf X , inf f (x) ). x∈X Anche ora naturalmente la seconda proprietà in (4.2.4) si può esprimere in maniera equivalente come segue ∀ ε ∈ R∗+ ∃x ∈ X t.c. ℓ − ε < f (x) (rispettivamente, f (x) < ℓ + ε ). (4.2.5) 2 Si ricorda che Iδ (x0 ) =]x0 − δ, x0 + δ[ (vedasi la (2.3.1) a pag. 42). 4.3 Proprietà di monotonia 83 y M P Q m 0 p q x Figura 4.1: Esempio di massimo assoluto e relativo. Dalla seconda forma dell’assioma di completezza (Proposizione 2.3.1) segue che ogni funzione limitata superiormente è dotata di estremo superiore ed analogamente ogni funzione limitata inferiormente è dotata di estremo inferiore. Se f non è limitata superiormente (rispettivamente, inferiormente), si scriverà per convenzione sup f = +∞ , 4.3 inf f = −∞ . Proprietà di monotonia Le proprietà considerate nella presente sezione sono molto importanti per lo studio qualitativo del grafico di una funzione reale. Definizione 4.3.1 Siano X un sottoinsieme di R ed f : X → R una funzione reale. Si dice che f è crescente (rispettivamente, strettamente crescente, Capitolo 4: Funzioni reali 84 decrescente, strettamente decrescente) se: ∀ x, y ∈ X : x < y ⇒ f (x) ≤ f (y) (rispettivamente, ∀ x, y ∈ X : x < y ∀ x, y ∈ X : x < y ∀ x, y ∈ X : x < y ⇒ ⇒ ⇒ f (x) < f (y) , (4.3.2) f (x) ≥ f (y) , (4.3.3) f (x) > f (y) ). (4.3.4) (4.3.1) Inoltre, f si dice monotona se verifica una qualsiasi delle condizioni precedenti e viene denominata strettamente monotona se invece verifica la (4.3.2) oppure la (4.3.4). Infine, se A è un sottoinsieme di X, si dice che f è crescente (rispettivamente, strettamente crescente, decrescente, strettamente decrescente) in A se la restrizione f|A di f al sottoinsieme A verifica tale proprietà. In Figura 4.2 viene mostrato un esempio di una funzione strettamente crescente in un intervallo I e strettamente decrescente in un intervallo J. y 0 J x I Figura 4.2: Funzione strettamente crescente (decrescente) in un intervallo. Proposizione 4.3.2 Una funzione f : X → R risulta strettamente monotona se e solo se è monotona e iniettiva. Dimostrazione. Se f è strettamente monotona essa è ovviamente monotona. Inoltre, se x, y ∈ X e x ̸= y, si può supporre x < y a meno di uno scambio di notazioni. Se f verifica la (4.3.2) allora f (x) < f (y), mentre se f verifica la (4.3.4) si ha f (y) < f (x); in ogni caso risulta f (x) ̸= f (y) e ciò dimostra che f è iniettiva. 4.3 Proprietà di monotonia 85 Si supponga ora f monotona; se f non fosse strettamente monotona dalle (4.3.2) e (4.3.4) esisterebbero x, y ∈ X con x < y e f (x) = f (y), il che contraddirebbe l’iniettività di f . Anche ora conviene prendere in considerazione una nozione locale di monotonia, che nel seguito per le funzioni derivabili potrà essere messa in relazione con il segno della derivata prima. Definizione 4.3.3 Siano X un sottoinsieme di R, f : X → R una funzione reale e x0 ∈ X. Si dice che f è crescente (rispettivamente, strettamente crescente, decrescente, strettamente decrescente) in x0 se esiste un numero reale δ > 0 tale che { ∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) ≤ f (x0 ) , ∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) ≤ f (x) (rispettivamente, { { { ∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) < f (x0 ) , ∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) < f (x) ; ∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) ≥ f (x0 ) , ∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) ≥ f (x) ; ∀ x ∈ X∩ ]x0 − δ, x0 [: f (x) > f (x0 ) , ∀ x ∈ X∩ ]x0 , x0 + δ[: f (x0 ) > f (x) ). In Figura 4.3, viene mostrato geometricamente un punto a in cui una funzione è strettamente crescente ed un punto b in cui è strettamente decrescente. Nell’osservazione seguente si considera per brevità una funzione crescente; con ovvie modifiche, analoghe proprietà possono essere stabilite nel caso in cui f sia strettamente crescente, decrescente o strettamente decrescente. Osservazione 4.3.4 Dalle definizioni adottate, segue subito che: 1. Se f : X → R è crescente, allora f è crescente in x0 per ogni x0 ∈ X. 2. Se X è un intervallo, allora f : X → R è crescente se e solo se f è crescente in ogni x0 ∈ X. Infatti, tenendo conto della proprietà precedente, bisogna solo dimostrare che se f è crescente in ogni punto x0 ∈ X, allora f è crescente. Infatti, in tal caso, siano x, y ∈ X tali che x < y. Poiché X è un intervallo, si ha [x, y] ⊂ X e quindi si può considerare l’insieme A := {t ∈ [x, y] | f (x) ≤ f (t)} . L’insieme A è non vuoto (infatti x ∈ A) e limitato superiormente (in quanto contenuto in [x, y]); dalla Capitolo 4: Funzioni reali 86 y a 0 b x Figura 4.3: Funzione strettamente crescente (decrescente) in un punto. seconda forma dell’assioma di completezza, esso è dotato di estremo superiore x0 ∈ [x, y]. Poiché f è crescente in x0 , esiste δ ∈ R∗+ verificante le proprietà previste nella Definizione 4.3.3. Dalla seconda proprietà dell’estremo superiore, si può trovare t ∈ A tale che x0 − δ < t ≤ x0 , da cui segue f (x) ≤ f (t) ≤ f (x0 ); quindi x0 ∈ A. Inoltre, non può essere x0 < y altrimenti, considerato t ∈ X∩]x0 , x0 + δ[∩]x0 , y], si avrebbe f (x0 ) ≤ f (t) e conseguentemente anche f (x0 ) ≤ f (t); ciò comporterebbe t ∈ A in contraddizione con il fatto che x0 < t e che x0 = sup A. Si è cosı̀ dimostrato che y = x0 ∈ A e quindi, dalla definizione di A, f (x) ≤ f (y). Dall’arbitrarietà di x, y ∈ X tali che x < y segue che f è crescente. In generale, la parte 1) dell’osservazione precedente non si può invertire nel caso in cui X non sia un intervallo. Ad esempio, la funzione f : R∗ → R definita ponendo, per ogni x ∈ R∗ , f (x) = −1/x è strettamente crescente in ogni punto, ma non è strettamente crescente (le sue restrizioni agli intervalli ]−∞, 0[ e ]0, +∞[ sono chiaramente strettamente crescenti ma, ad esempio, si ha −1 < 1 e f (−1) > f (1)). La nozione di crescenza o decrescenza in un punto non va confusa con quella di crescenza o decrescenza in un intervallo aperto contenente tale punto. Infatti, ad esempio, la funzione f : R → R definita ponendo, per 4.4 Proprietà di simmetria e periodicità ogni x ∈ R, x+1, 0, f (x) := x−1, 87 x<0, x=0, x>0, è strettamente decrescente in 0, mentre è strettamente crescente in ogni x0 ∈ R∗ . 4.4 Proprietà di simmetria e periodicità Anche le proprietà seguenti sono utili per lo studio qualitativo del grafico di una funzione reale in quanto consentono di limitare lo studio della funzione a quello di una sua opportuna restrizione. Definizione 4.4.1 Siano X un sottoinsieme di R ed f : X → R una funzione reale. Si dice che f è pari (rispettivamente, dispari) se è verificata la seguente condizione: { 1) ∀ x ∈ X : −x ∈ X , 2) ∀ x ∈ X : f (−x) = f (x) (rispettivamente, f (−x) = −f (x) ). Le proprietà 1) precedente si esprime anche dicendo che X è simmetrico. Innanzitutto, quindi, è importante verificare tale condizione, senza la quale non ha senso chiedersi se la funzione è pari o dispari. Diversi esempi di funzioni pari o dispari saranno considerati in seguito quando saranno studiate le funzioni elementari. Il grafico di una funzione pari è simmetrico rispetto all’asse delle ordinate, mentre il grafico di una funzione dispari è simmetrico rispetto all’origine. Pertanto, si può studiare una funzione pari o dispari dapprima in X∩[0, +∞[ (oppure in X∩] − ∞, 0] e poi si può ricavare il comportamento nella parte rimanente dell’insieme di definizione in base alle proprietà di simmetria. A questo punto si passa a studiare la proprietà di periodicità, anch’essa utile per ridurre lo studio di una funzione a quello di una sua opportuna restrizione. Definizione 4.4.2 Siano X un sottoinsieme di R, f: X → R una funzione reale e ω ∈ R∗+ . Si dice che f è periodica di periodo ω (oppure, brevemente, ω-periodica) se è verificata la seguente condizione: { 1) ∀ x∈X : x−ω ∈X , x+ω ∈X , 2) ∀ x ∈ X : f (x − ω) = f (x) = f (x + ω) . Capitolo 4: Funzioni reali 88 La proprietà 1) precedente si esprime anche dicendo che X è ω-periodico. Gli esempi più importanti di funzioni periodiche saranno le funzioni trigonometriche; si vedrà che le funzioni seno e coseno sono periodiche di periodo 2π, mentre le funzioni tangente e cotangente sono periodiche di periodo π. Come segue dalla condizione 2) della Definizione 4.4.2, il grafico di una funzione ω-periodica si ripete ad intervalli di periodo ω. Pertanto, è sufficiente studiare tali funzioni in un intervallo di ampiezza ω. Se, in più, una funzione è anche pari o dispari, si può scegliere l’insieme simmetrico [−ω/2, ω/2] come intervallo di ampiezza ω e quindi ridurre lo studio della funzione al sottoinsieme X ∩ [0, ω/2] (oppure X ∩ [−ω/2, 0]) a causa della proprietà di simmetria. 4.5 Successioni Una funzione a : N → E viene denominata successione di elementi di E. Nel caso in cui E = R si userà la denominazione di successione reale. L’insieme dei valori di una successione viene denominato insieme degli elementi della successione. Pertanto, tutte le definizioni e le proprietà delle funzioni reali possono essere applicate al caso delle successioni di numeri reali, riguardando queste come particolari funzioni aventi N come insieme di definizione. Per le successioni, tuttavia, si adoperano una terminologia e delle notazioni particolari. Cosı̀, anzichè utilizzare le notazioni tipiche delle funzioni, per le successioni si preferisce utilizzare la notazione (an )n∈N evidenziando in tal modo il ‘valore’ an = a(n) che la successione assume in un generico elemento n ∈ N. A titolo di esempio, si passano ora in rassegna alcune delle definizioni viste in generale per le funzioni traducendole nel caso delle successioni. Se (an )n∈N e (bn )n∈N sono successioni reali, la somma e il prodotto delle due successioni sono definite al modo seguente: (an )n∈N + (bn )n∈N := (an + bn )n∈N , (an )n∈N · (bn )n∈N := (an · bn )n∈N . Una successione (an )n∈N si dice limitata superiormente (rispettivamente, limitata inferiormente) se esiste M ∈ R tale che ∀ n ∈ N : an ≤ M (rispettivamente, ∀ n ∈ N : M ≤ an ). Se una successione (an )n∈N è limitata superiormente (rispettivamente, inferiormente), l’estremo superiore (rispettivamente, inferiore) ℓ di (an )n∈N 4.5 Successioni 89 è caratterizzato dalle seguenti proprietà: ∀ n ∈ N : an ≤ ℓ (rispettivamente, ℓ ≤ an ); 1) 2) m ∈ R, ∀ n ∈ N : an ≤ m ⇒ ℓ ≤ m (rispettivamente, ∀ n ∈ N : m ≤ an ⇒ m ≤ ℓ ) e viene denotato con il simbolo supn∈N an (rispettivamente, inf n∈N an ). Se (an )n∈N non è limitata superiormente (rispettivamente, inferiormente), si scriverà supn∈N an = +∞ (rispettivamente, inf n∈N an = −∞). Una successione (an )n∈N si dice crescente se:3 ∀ n ∈ N : an ≤ an+1 . (4.5.1) In modo analogo si considerano le definizioni di successione strettamente crescente, decrescente, e strettamente decrescente. Per le successioni è spesso importante stabilire le proprietà definitive, che sono cioè vere da un certo indice n in poi. Cosı̀, ad esempio, si dice che una successione (an )n∈N è definitivamente crescente se: ∃ ν ∈ N t.c. ∀ n ∈ N, n ≥ ν : an ≤ an+1 . Analogamente, si dice che gli elementi di una successione (an )n∈N sono definitivamente minori o uguali di quelli di una successione (bn )n∈N (o, più brevemente, che (an )n∈N è definitivamente minore o uguale di (bn )n∈N ) se esiste ν ∈ N tale che, per ogni n ∈ N, n ≥ ν, si abbia an ≤ bn . In base a quanto sopra, in generale potrebbe non interessare il comportamento di una successione in un numero finito di elementi e addirittura la successione (si continua a denominare tale) potrebbe essere definita solo da un certo numero naturale p in poi, nel qual caso si adopera la notazione (an )n≥p . Si conclude la presente sezione con un esempio molto importante di successione che consente di definire il numero di Nepero. 4.5.1 Numero di Nepero Si consideri la successione reale definita ponendo, per ogni n ≥ 1, ( )n 1 . en := 1 + n 3 È facile riconoscere che tale condizione è equivalente alla seguente ∀ n, m ∈ N : n < m ⇒ an ≤ am . Infatti, è ovvio che quest’ultima implica la (4.5.1) considerando m = n + 1. Per stabilire il viceversa, si può procedere per induzione completa sul numero naturale p = m − n (vedasi la Proposizione 2.1.1). Capitolo 4: Funzioni reali 90 Si osservi che e1 = 2 e inoltre, dalla formula del binomio di Newton (Proposizione 2.1.2), si ha, per ogni n ≥ 2, ( ) n ( ) n ∑ ∑ 1 n n 1 n(n − 1) · · · (n − k + 1) 1 1+ = =1+1+ (4.5.2) k k n n k! nk k=0 k=2 = = n ∑ n−k+1 1 n n−1 ··· k! n n n k=2 ( ) ( ) n ∑ 1 1 k−1 2+ 1− ··· 1 − . k! n n k=2 2+ Pertanto, 2 è il minimo della successione (en )n≥1 . Proposizione 4.5.1 La successione (en )n≥1 è limitata superiormente. Dimostrazione. Per ogni n ≥ 2, dalle (4.5.2) segue en ≤ 2 + n ∑ 1 ; k! k=2 inoltre, poichè 2k−1 ≤ k! per ogni k ≥ 2 (tale diseguaglianza si stabilisce facilmente per induzione completa (vedasi la Proposizione 2.1.1), si ottiene en ≤ 2 + n ∑ k=2 1 2k−1 =2+ n−1 ∑ h=1 n−1 ∑ 1 1 = 1 + . 2h 2h h=0 A questo punto, ricordando che ∀ a, b ∈ R : an − bn = (a − b) n−1 ∑ ak bn−1−k k=0 (anche questa uguaglianza si stabilisce direttamente per induzione completa), si conclude en ≤ 1 1 − 1/2n = 1 + 2 − n−1 < 3 . 1 − 1/2 2 In base alla proposizione precedente, si può considerare l’estremo superiore della successione (en )n≥1 , il quale viene denominato numero di Nepero e denotato con e: ( )n 1 e := sup 1 + . (4.5.3) n n≥1 Dalle osservazioni precedenti si ha 2 < e ≤ 3; un’analisi più precisa permette di riconoscere che e ∼ 2, 718281828945 . . . . Si può dimostrare inoltre, ma non si approfondisce tale aspetto, che e è un numero irrazionale. Un’ulteriore proprietà importante della successione (en )n≥1 , che consentirà di scrivere il numero di Nepero come limite della successione (en )n≥1 , viene invece stabilita di seguito. 4.6 Funzioni elementari 91 Proposizione 4.5.2 La successione (en )n≥1 è strettamente crescente. Dimostrazione. Infatti, per ogni n ≥ 1, dalle (4.5.2), si ha ( ) ( ) n ∑ 1 1 k−1 en < 2 + 1− ··· 1 − k! n+1 n+1 k=2 < 2+ n+1 ∑ k=2 4.6 1 k! ( 1− 1 n+1 ) ( ) k−1 ··· 1 − = en+1 . n+1 Funzioni elementari Vengono a questo punto considerate alcune tra le più importanti funzioni reali; esse vengono denominate funzioni elementari in quanto le funzioni reali di cui ci si occuperà in seguito si otterranno in generale da esse mediante operazioni algebriche oppure di composizione tra funzioni. Le proprietà e il grafico di tali funzioni si riveleranno molto utili nei capitoli successivi. 4.6.1 Funzioni potenza ad esponente intero positivo Per ogni n ∈ N, la funzione potenza ad esponente intero positivo n è la funzione fn : R → R definita ponendo, per ogni x ∈ R, fn (x) = xn . Dalle proprietà elementari delle potenze di numeri reali, si ricavano facilmente le seguenti proprietà delle funzioni fn . 1. fn (0) = 0 , fn (1) = 1 . 2. Se x, y ∈ R e 0 ≤ x < y, allora fn (x) < fn (y). Tale proprietà può essere dimostrata facilmente utilizzando il principio di induzione completa. Se n = 1, la proprietà è ovviamente vera. Si supponga che sia vera per n e siano x, y ∈ R tali che 0 ≤ x < y. Dall’ipotesi di induzione si ha fn (x) < fn (y), cioè xn < y n e da qui si ricava xn+1 = xn · x < y n · x < y n · y = y n+1 , cioè fn+1 (x) < fn+1 (y). Quindi la proprietà è vera per n + 1. Lo schema della presente dimostrazione, fornita a titolo di esempio, si applica anche a diverse proprietà successive. 3. Se x ∈ R e 0 ≤ x ≤ 1, allora 0 ≤ fn+1 (x) ≤ fn (x) ≤ 1. 4. Se x ∈ R e x ≥ 1, allora 1 ≤ fn (x) ≤ fn+1 (x). 5. Se n è pari fn è una funzione pari mentre se n è dispari fn è una funzione dispari. Capitolo 4: Funzioni reali 92 Tenendo presente le proprietà precedenti, si può ora tracciare approssimativamente il grafico delle funzioni potenza con esponente pari e dispari. Tali grafici sono utili anche perché riassumono in modo geometrico le proprietà enunciate sopra. Nelle Figure 4.4–4.5, il grafico continuo rappresenta la funzione potenza n-esima, mentre quello tratteggiato rappresenta la potenza (n + 2)-esima. In Figura 4.4 viene illustrato il grafico tipico delle funzioni potenza nel caso n pari, mentre in Figura 4.5 quello nel caso n dispari (n ≥ 3). y 1 -1 0 1 x Figura 4.4: Funzione potenza ad esponente pari (≥ 2). 4.6.2 Funzioni radice Innanzitutto si osserva che, come conseguenza dell’assioma di completezza, per ogni n ≥ 2 e per ogni b ∈ R+ esiste uno ed un solo a ∈ R+ tale che an = b (l’elemento a, infatti, può essere definito come estremo superiore dell’insieme {x ∈ R+ | xn < b}). Tale elemento viene denominato radice n-esima di b e denotato con uno dei seguenti simboli: √ n b, b1/n ; nella notazione √ n b si può omettere l’indice n nel caso n = 2. y 4.6 Funzioni elementari 93 1 -1 0 1 x -1 Figura 4.5: Funzione potenza ad esponente dispari (≥ 3). Tale risultato consente ora di definire la funzione radice. Sia n ≥ 2; se n è pari, la funzione radice f1/n : R+ → R è definita ponendo, per ogni x ∈ R+ , √ f1/n (x) := n x . (4.6.1) Se n è dispari, la funzione radice può essere definita √ in tutto R (ciò dipende dal fatto che, se b ∈ R− , allora l’elemento a := − n −b è l’unico numero reale (negativo) verificante la condizione an = b). Quindi, la funzione radice nesima in questo caso è la funzione f1/n : R → R definita ponendo, per ogni x ∈ R+ , { √ n x, se x ≥ 0 ; f1/n (x) := (4.6.2) √ − n −x , se x < 0 . Alternativamente, la funzione radice n-esima può essere definita tenendo presente quanto osservato nella Sezione 4.1, considerando l’inversa della restrizione di fn ad R+ nel caso n pari, e l’inversa di fn nel caso n dispari. Dalla (1.2.11), infatti, tale inversa assume come valore in x proprio l’unico numero reale y tale che y n = x e quindi coincide con la funzione sopra definita. Seguono, a titolo di esempio, alcune delle proprietà delle radici n-esime. 1. f1/n (0) = 0 , f1/n (1) = 1. Capitolo 4: Funzioni reali 94 2. Se x ∈ R+ , f1/n (x) ≥ 0 . 3. Se x, y ∈ R+ e x < y, allora f1/n (x) < f1/n (y). Infatti, se fosse √ n y ≤ √ n x, elevando alla potenza n-esima, dalle proprietà delle potenze seguirebbe y ≤ x, in contraddizione con le ipotesi. 4. Se x ∈]0, 1[, allora f1/n (x) < f1/(n+1) (x) . 5. Se x ∈]1, +∞[, allora f1/(n+1) (x) < f1/n (x) . 6. Se n è dispari, la funzione radice n-esima risulta una funzione dispari (mentre se n è pari non ha senso chiedersi se la funzione radice n-esima sia simmetrica in quanto essa è definita in un insieme non simmetrico). Nelle Figure 4.6–4.7, approssimativamente il grafico delle funzioni radice nei casi n pari ed n dispari; viene usato il tratto continuo per la radice n-esima, e tratteggiato per la radice (n + 2)-esima. y 1 0 x 1 Figura 4.6: Funzione radice con indice pari. 4.6.3 Funzione potenza ad esponente intero negativo Si fissi ora un numero naturale n ≥ 2 e si consideri la funzione reale f−n : R∗ → R definita ponendo, per ogni x ∈ R∗ , f−n (x) := 1 . xn (4.6.3) Tale funzione viene denominata funzione potenza ad esponente intero negativo n. Dalla definizione adottata, tale funzione non è altro che la funzione reciproca della funzione potenza ad esponente intero positivo n. 4.6 Funzioni elementari 95 y 1 -1 0 1 x -1 Figura 4.7: Funzione radice con indice dispari. Dalla definizione adottata e dalle proprietà già viste delle funzioni potenza ad esponente intero positivo, si possono ricavare altrettante proprietà della funzione f−n , che per brevità vengono omesse. Si conclude pertanto con le Figure 4.8–4.9, nelle quali viene tracciato approssimativamente il grafico delle funzioni potenza ad esponente intero negativo nei casi n pari ed n dispari; viene usato il tratto continuo per la funzione f−n , e tratteggiato per la funzione f−n−2 . y 1 0 -1 1 x Figura 4.8: Funzione potenza ad esponente intero negativo pari. Capitolo 4: Funzioni reali 96 y 1 x 1 -1 -1 Figura 4.9: Funzione potenza ad esponente intero negativo dispari. 4.6.4 Funzioni potenza ad esponente razionale e reale Si vuole ora studiare il caso delle funzioni potenza in cui l’esponente sia un numero razionale oppure reale. Nel caso di un esponente razionale q ∈ Q, si possono considerare m ∈ Z ed n ∈ N tali che n ̸= 0 e q = m/n. Per ogni numero reale strettamente positivo x, ha senso considerare la potenza ad esponente razionale xq che si definisce ponendo √ 1/n xq := (xm ) (= n xm ) ; se q > 0, tale definizione può essere estesa ad x = 0 ponendo 0q = 0. Conviene subito osservare che se si considera un’altra rappresentazione del ′ 1/n′ numero razionale q del tipo q = m′ /n′ , si ha (xm ) = (xm ) 1/n in quanto 4.6 Funzioni elementari 97 ′ ′ m′ · n = m · n′ e conseguentemente xm ·n = xm·n . Pertanto il numero xq non dipende dalla particolare rappresentazione del numero razionale q. Si fissi un numero reale arbitrario r e sia x un numero reale strettamente positivo. Per ogni numero razionale q < r ha senso considerare, per quanto visto sopra, la potenza xq ; allora la potenza ad esponente reale xr viene definita ponendo inf xq , se 0 < x < 1 ; q∈Q, q≤r r x := (4.6.4) q sup x , se x ≥ 1 . q∈Q, q≤r Alternativamente, si potrebbero considerare i numeri razionali q > r e porre sup xq , se 0 < x < 1 ; q∈Q, q≥r xr := inf xq , se x ≥ 1 . q∈Q, q≥r Si può dimostrare che le due definizioni sono equivalenti. Se r > 0, si pone inoltre 0r = 0. A questo punto, si considera la funzione potenza ad esponente reale. Precisamente, se r > 0, si considera la funzione fr : [0, +∞[→ R definita ponendo, per ogni x ∈ [0, +∞[, fr (x) := xr . Se r ≤ 0, la funzione potenza ad esponente reale fr :]0, +∞[→ R viene definita allo stesso modo, ma non è definita in 0 e quindi ha come insieme di definizione l’insieme ]0, +∞[. Se q ∈ Q, le proprietà della funzione fq possono essere ricavate tenendo presente contemporaneamente le proprietà delle funzioni ad esponente intero e delle funzioni radice; conseguentemente, dalla (4.6.4), si possono considerare le proprietà delle funzioni potenza ad esponente reale. Per brevità, ci si limita ad osservare che l’andamento grafico di tali funzioni è quello tipico di una funzione potenza ad esponente intero positivo nel caso r > 1, di una funzione radice nel caso 0 < r < 1 e di una funzione potenza ad esponente intero negativo nel caso q < 0. Nella Figura 4.10, sono riportati i grafici generali delle funzioni potenza ad esponente reale. 4.6.5 Funzioni esponenziali e logaritmiche Nel paragrafo precedente si è attribuito un significato alla potenza avente come base un numero reale strettamente positivo e come esponente un numero reale arbitrario. Fissato poi un numero reale arbitrario r, si è studiata Capitolo 4: Funzioni reali 98 y 1 0 1 x Figura 4.10: Funzione potenza con esponente razionale o reale. la funzione potenza fr , cioè il comportamento della potenza xr al variare della base. Si vuole invece ora studiare la funzione ottenuta fissando la base della potenza ad esponente reale e facendo variare l’esponente. Si deve osservare che la base deve essere un numero strettamente positivo, mentre l’esponente può essere un numero reale qualsiasi. Sia pertanto a ∈ R∗+ e si supponga, per evitare casi banali, a ̸= 1. Si consideri la funzione expa : R → R definita ponendo, per ogni x ∈ R, expa (x) := ax . (4.6.5) Tale funzione prende il nome di funzione esponenziale di base a. Le proprietà di tale funzione sono conseguenza delle proprietà delle potenze ad esponente reale. Si osservi che la funzione esponenziale è definita in tutto R ed assume valori strettamente positivi. Nel caso particolare in cui a sia il numero e di Nepero (vedasi la (4.5.3)), la funzione esponenziale viene denominata semplicemente funzione esponenziale e denotata con il simbolo exp (quindi, per ogni x ∈ R, exp(x) := ex ). Il comportamento della funzione esponenziale dipende dai casi 0 < a < 1 oppure a > 1. Alcune proprietà delle funzioni esponenziali sono elencate di seguito: 4.6 Funzioni elementari 99 1. expa (0) = 1 e expa (1) = a; 2. Per ogni x, y ∈ R, risulta expa (x + y) = expa (x) · expa (y); 3. La funzione expa è strettamente crescente se a > 1 e strettamente decrescente se 0 < a < 1; 4. Per ogni x ∈ R, risulta expa (x) = ax = (1/a)−x = exp1/a (−x); quindi i grafici di expa e exp1/a risultano simmetrici tra di essi rispetto all’asse delle ordinate; 5. Per ogni x, y ∈ R, risulta (expa (x))y = expa (x y). Riassumendo, l’andamento del grafico delle funzioni esponenziali è del tipo tracciato nelle Figura 4.11. Come si può notare, il comportamento della funzione esponenziale dipende dai casi 0 < a < 1 oppure a > 1; la curva continua rappresenta il grafico di una funzione esponenziale con base a > 1, mentre quella tratteggiata il grafico di una funzione esponenziale con base 0 < a < 1. y a 1 a 0 1 x Figura 4.11: Funzione esponenziale. Si osservi che la funzione esponenziale expa è strettamente monotona e quindi iniettiva. Pertanto, tenendo presente quanto osservato nella Sezione 4.1, si può considerare l’inversa di expa , che viene denominata funzione logaritmo di base a e denotata con loga . Tenendo presente che l’immagine Capitolo 4: Funzioni reali 100 di expa è R∗+ , la funzione logaritmo è definita in R∗+ (ed a valori in R): loga : R∗+ → R; inoltre, dalla (1.2.11), per ogni x ∈ R∗+ , loga (x) è l’unico numero y ∈ R tale che expa (y) = x. Anche ora, se a = e, la funzione logaritmo viene denominata semplicemente funzione logaritmo e denotata con il simbolo loga (quindi, per ogni x ∈ R∗+ , log(x) := loge (x)). Le proprietà di tale funzione sono conseguenza delle proprietà generali delle funzioni inverse e dipendono da quelle delle funzioni esponenziali. Ad esempio, si ha 1. loga (1) = 0 , loga (a) = 1 . 2. Per ogni x ∈ R: loga (expa (x)) = x . 3. Per ogni x ∈ R∗+ : expa (loga (x)) = x . Altre proprietà derivano da quelle generali dei logaritmi; per comodità, si richiamano di seguito quelle di più frequente utilizzo (la verifica di tali proprietà è diretta usando la definizione di logaritmo e le proprietà delle funzioni esponenziali). Nelle proprietà successive, i numeri a e b che figurano come base dei logaritmi devono chiaramente intendersi strettamente positivi e diversi da 1. 4. Per ogni x, y ∈ R∗+ : loga (x · y) = loga (x) + loga (y) . 5. Per ogni x ∈ R∗+ : 6. Per ogni x, y ∈ ( ) 1 loga = − loga (x) . x R∗+ : ( ) x loga = loga (x) − loga (y) . y 7. Per ogni x ∈ R∗+ ed y ∈ R: loga (xy ) = y loga (x) . 8. Per ogni x ∈ R∗+ : logb (x) = loga (x) . loga (b) Anche il comportamento della funzione logaritmo dipende dai casi 0 < a < 1 oppure a > 1 (questa volta i grafici di loga e log1/a risultano simmetrici tra di essi rispetto all’asse delle ascisse). Il grafico delle funzioni logaritmo è del tipo tracciato nella Figura 4.12. 4.6 Funzioni elementari 101 y 1 0 a 1 a x Figura 4.12: Funzione logaritmo. 4.6.6 Funzioni trigonometriche Per ogni x ∈ R, si può considerare un punto P corrispondente sulla circonferenza trigonometrica ottenuto considerando il secondo estremo dell’arco di lunghezza x avente come primo estremo il punto A di coordinate (1, 0) e percorrendo la circonferenza in senso orario se x è positivo e in senso orario se x è negativo. Le coordinate cartesiane del punto P vengono denominate coseno e rispettivamente seno di x. Tali quantità sono definite per ogni x ∈ R e quindi si possono considerare la funzione seno e la funzione coseno, che verranno denotate rispettivamente con sin e cos, e fanno corrispondere ad ogni numero reale x, i numeri sin x e cos x appena definiti. Le proprietà delle funzioni seno e coseno si deducono facilmente da quelle del seno e del coseno elencate nella Sezione 3.2. Da tali proprietà si deduce la periodicità di periodo 2π di tali funzioni. Inoltre esse sono limitate ed hanno 1 come massimo e −1 come minimo (vi sono infiniti punti di massimo dati da π/2 + 2kπ con k ∈ Z per la funzione seno e da 2kπ con k ∈ Z per la funzione coseno e infiniti punti di minimo dati da −π/2 + 2kπ con k ∈ Z per la funzione seno e da π + 2kπ con k ∈ Z per la funzione coseno). Inoltre la funzione seno è una funzione dispari mentre la funzione coseno è pari. Da tali proprietà e dai valori di tali funzioni negli archi noti è facile Capitolo 4: Funzioni reali 102 tracciare il grafico delle funzioni seno e coseno con sufficiente precisione. Il grafico delle funzioni seno e coseno è tracciato approssimativamente nella Figura 4.13. y 1 -π π -2 0 π 2 π -1 Figura 4.13: Funzioni seno e coseno. {π } A questo punto si osserva che la tangente è definita per ogni x ∈ + kπ | k ∈ Z 2 e quindi si può considerare la funzione tangente definita in {π } tale insieme e denotata ancora con tan; dunque tan : Rr + kπ | k ∈ Z → R è definita 2} {π ponendo, per ogni x ∈ R r + kπ | k ∈ Z , 2 tan x := sin x . cos x (4.6.6) Dalle proprietà della tangente richiamate nella Sezione 3.2, si deduce che sin(−x) la funzione tangente è periodica di periodo π. Inoltre, tan(−x) = = cos(−x) − sin x = − tan x e quindi la funzione tangente è dispari (si osservi che il cos x suo insieme di definizione è simmetrico). Dai valori degli archi noti per il seno e per il coseno si deducono altrettanti archi noti per la tangente. Il grafico della funzione tangente è approssimativamente quello tracciato nella Figura 4.14. In modo analogo a quanto visto per la funzione tangente, si può procedere considerando il rapporto tra la funzione coseno e quella seno. Poichè la funzione seno si annulla nell’insieme {kπ | k ∈ Z}, tale rapporto è definito in R r {kπ | k ∈ Z}. Si ottiene pertanto la funzione cotangente cot : R r {kπ | k ∈ Z} → R definita ponendo, per ogni x ∈ R r {kπ | k ∈ Z}, cos x . (4.6.7) cot x := sin x x 4.6 Funzioni elementari 103 y -π π - 2 0 π 2 π x Figura 4.14: Funzione tangente. Le proprietà della cotangente si discutono in maniera analoga a quanto svolto per la tangente e dipendono ancora una volta da quelle delle funzioni seno e coseno. Si richiama solamente l’attenzione sul fatto che la funzione cotangente è anch’essa periodica di periodo π, ma non è simmetrica. Il grafico della funzione cotangente è approssimativamente quello tracciato nella Figura 4.15. 4.6.7 Funzioni trigonometriche inverse Si è ora interessati alla possibilità di determinare una funzione inversa per le funzioni trigonometriche studiate nella sottosezione precedente. Si considera innanzitutto la funzione seno. Al fine di ottenere una funzione iniettiva, si considera la restrizione della funzione seno all’intervallo [−π/2, π/2]; a questo punto, tenendo presente quanto osservato nella Sezione 4.1, si può considerare la funzione inversa di tale restrizione, che viene denominata funzione arcoseno e denotata con arcsin. Tenendo presente che l’immagine di sin è [−1, 1], la funzione arcoseno è definita in [−1, 1]; inoltre, Capitolo 4: Funzioni reali 104 y -π π -2 0 π 2 π x Figura 4.15: Funzione cotangente. dalla (1.2.11), arcsin : [−1, 1] → R è definita ponendo, per ogni x ∈ [−1, 1], arcsin x = y dove y è l’unico elemento dell’intervallo [−π/2, π/2] tale che sin y = x. Dal calcolo del seno di alcuni archi noti, si può dedurre il valore della funzione arcoseno in altrettanti punti particolari; infatti, ad esempio, sin 0 = 0 π 1 sin = 6 √2 π 2 sin = 4 2 √ π 3 sin = 3 2 π sin = 1 2 ⇒ ⇒ ⇒ ⇒ ⇒ arcsin 0 = 0 , 1 π arcsin = , 2√ 6 2 π arcsin = , 2 4 √ 3 π arcsin = , 2 3 π arcsin 1 = . 2 Inoltre, poiché la funzione seno ristretta all’intervallo [−π/2, π/2] continua ad essere una funzione dispari, anche la funzione arcoseno è dispari 4.6 Funzioni elementari 105 (infatti se arcsin x = y, allora y ∈ [−π/2, π/2] e sin y = x, da cui segue anche −y ∈ [−π/2, π/2] e sin(−y) = − sin y = −x; quindi arcsin(−x) = −y = − arcsin x). Nello stesso modo si può anche riconoscere che la funzione arcoseno è strettamente crescente. Il grafico della funzione arcoseno è approssimativamente quello tracciato nella Figura 4.16. y π 2 1 -1 x π -2 Figura 4.16: Funzione arcoseno. Si procede ora in modo analogo con la funzione coseno. Questa volta si considera la restrizione della funzione coseno all’intervallo [0, π], la quale è strettamente decrescente e quindi iniettiva. Con lo stesso procedimento adottato per la funzione arcoseno si può definire la funzione arcocoseno arccos : [−1, 1] → R ponendo, per ogni x ∈ [−1, 1], arccos x = y dove y è l’unico elemento dell’intervallo [0, π] tale che cos y = x. Si verifica facilmente che la funzione arcocoseno è strettamente decrescente. Inoltre, come per la funzione arcoseno, dal calcolo del coseno di alcuni archi noti, si può dedurre il valore della funzione arcocoseno in alcuni punti particolari, che in questo caso per brevità non vengono elencati. Capitolo 4: Funzioni reali 106 Il grafico della funzione arcocoseno è approssimativamente quello tracciato nella Figura 4.17. y π π 2 -1 0 1 x Figura 4.17: Funzione arcocoseno. Anche per la funzione tangente si adopera un procedimento analogo. La restrizione della funzione tangente all’intervallo aperto ] − π/2, π/2[ è strettamente crescente ed è quindi iniettiva. Si definisce pertanto la funzione arcotangente arctan : R → R ponendo, per ogni x ∈ R, arctan x = y, dove y è l’unico elemento dell’intervallo ] − π/2, π/2[ tale che tan y = x. Come nei casi precedenti, si possono ottenere i valori della funzione arcotangente in alcuni punti particolari: ad esempio, arctan 0 = 0, arctan 1 = π/4 e arctan(−1) = −π/4 (la determinazione di altri valori corrispondenti agli altri archi noti viene lasciata per esercizio). Si può inoltre riconoscere che la funzione arcotangente è dispari e strettamente crescente. Il grafico della funzione arcotangente è approssimativamente quello tracciato nella Figura 4.18. Infine, con procedimento esattamente analogo a quello svolto, si considera la restrizione della funzione cotangente all’intervallo aperto ]0, π[, la 4.6 Funzioni elementari 107 y π 2 0 x π -2 Figura 4.18: Funzione arcotangente. quale risulta strettamente decrescente e quindi iniettiva. Ciò consente di definire la funzione arcocotangente arccot : R → R ponendo, per ogni x ∈ R, arccot x = y, dove y è l’unico elemento di ]0, π[ tale che cot y = x. Tra le proprietà di questa funzione si segnala il fatto che essa è strettamente decrescente, e arccot 0 = π/2, arccot 1 = π/4, arccot (−1) = 3π/4. Il grafico della funzione arcocotangente è approssimativamente quello tracciato nella Figura 4.19. y π π 2 0 Figura 4.19: Funzione arcocotangente. x Capitolo 5 Alcuni metodi di risoluzione di equazioni e disequazioni Siano X ed Y sottoinsiemi di R ed f : X → R e g : Y → R funzioni reali. Un’equazione si presenta nella forma seguente f (x) = g(x) . Risolvere la precedente equazione significa determinare l’insieme S := {x ∈ X ∩ Y | f (x) = g(x)} . In maniera analoga, una disequazione si presenta in una delle seguenti forme f (x) ≤ g(x) , f (x) ≥ g(x) , f (x) < g(x) , f (x) > g(x) e risolverla significa determinare l’insieme degli elementi di X ∩ Y per cui la diseguaglianza indicata risulta vera. 5.1 Equazioni e disequazioni razionali intere Un tipo molto semplice di equazioni e disequazioni é costituito da quelle di tipo algebrico. Esse si presentano nella forma P (x) = 0 Capitolo 5: Equazioni e disequazioni 110 oppure, rispettivamente, P (x) ≤ 0 , P (x) ≥ 0 , P (x) < 0 , P (x) > 0 , con P polinomio. In precedenza ci si è soffermati sulle soluzioni delle equazioni polinomiali e pertanto ora si prenderanno in considerazione soprattutto le disequazioni; ovviamente, queste hanno senso solo per polinomi a coefficienti reali in quanto in C non si possono considerare disequazioni. Passando, se necessario, alla disequazione opposta, nel seguito si potrà supporre, qualora lo si ritenga conveniente, che il coefficiente della potenza di grado massimo del polinomio sia strettamente positivo. Si studiano dapprima i casi più semplici in cui il grado del polinomio P è 0, 1 oppure 2 e poi si passa al caso generale. Si supponga dapprima che P sia un polinomio di grado 0, cioè P (x) = a0 per ogni x ∈ R con a0 ̸= 0. In questo caso, se a0 > 0, le disequazioni P (x) ≤ 0 e P (x) < 0 non sono mai soddisfatte per cui S = ∅, mentre le disequazioni P (x) ≥ 0 e P (x) > 0 sono sempre soddisfatte per cui S = R; il caso a0 < 0 si discute in maniera analoga. Si considera ora il caso in cui P sia un polinomio di grado 1, cioè P (x) = mx + n per ogni x ∈ R con m, n ∈ R ed m > 0; in questo caso, è facile vedere che le disequazioni in esame hanno rispettivamente come soluzioni i seguenti intervalli: S =] − ∞, −n/m], S = [−n/m, +∞[, S =] − ∞, −n/m[, S =] − n/m, +∞[. Ad esempio, la disequazione 2x+3¿0, ha come soluzioni l’insieme S =] − 3/2, +∞[, mentre la disequazione 3 − 4(5 − x) ≤ 2x + 5 ha come soluzioni l’insieme S =] − ∞, 11]. Sia ora P (x) = ax2 +bx+c un polinomio di secondo grado con a, b, c ∈ R ed a > 0. In questo caso bisogna tener presente che: • Se ∆ > 0, denotate con x1 e x2 le due radici distinte di P con x1 < x2 , risulta P (x) ≥ 0 in ] − ∞, x1 ] ∪ [x2 , +∞[ e P (x) ≤ 0 in [x1 , x2 ] (se a < 0, si ha ovviamente P (x) ≥ 0 in [x1 , x2 ] e P (x) ≤ 0 in ] − ∞, x1 ] ∪ [x2 , +∞[). • Se ∆ = 0, risulta sempre P (x) ≥ 0 e P si annulla solo nell’unica radice x0 = −b/2a (se a < 0, risulta sempre P (x) ≤ 0 e P si annulla solo nell’unica radice x0 ). • Se ∆ < 0, risulta sempre P (x) > 0 (se a < 0, risulta sempre P (x) < 0). Da quanto osservato si deduce facilmente l’insieme delle soluzioni di ognuna delle disequazioni in esame. Ad esempio, la disequazione 2x2 − 2x + 1 ≤ 0 non è mai soddisfatta il quanto il polinomio 2x2 − 2x + 1 ha ∆ = 4 − 8 = −4 < 0 ed è quindi sempre strettamente positivo. Invece, la 5.1 Equazioni e disequazioni razionali intere 111 disequazione x2 − x − 6 > 0 è soddisfatta in ] − ∞, −2[∪]3, +∞[ in quanto il polinomio x2 − x − 6 ha due radici reali −2 e 3. Si considera, infine, il caso generale. Siano n ∈ N ed a0 , . . . , an ∈ R con an ̸= 0 e si consideri il polinomio P (x) = a0 + a1 x + · · · + an xn , x∈R. Essendo a coefficienti reali, il polinomio P si può decomporre come segue (vedasi la Sezione 3.5.2, formula (3.5.7)) P (x) = an (x − x1 )h1 · · · (x − xp )hp (x2 + b1 x + c1 )k1 · · · (x2 + bq x + cq )kq , dove x1 , . . . , xp sono le radici reali di P aventi rispettivamente molteplicità h1 , . . . , hp , e k1 , . . . , kq sono le molteplicità delle radici complesse coniugate dei termini x2 + b1 x + c1 , . . . , x2 + bq x + cq con ∆1 = b21 − 4c1 < 0, . . . , ∆q = b2q − 4cq < 0. Poiché la somma di tutte le molteplicità deve essere n, si deve infine avere h1 + · · · + hp + 2(k1 + · · · + kq ) = n . Per ottenere tale decomposizione, si può procedere in modo diretto per i polinomi di grado minore o uguale di 2 (oppure anche per quelli di grado 3 e 4), oppure utilizzare la regola di Ruffini per i polinomi di grado superiore. La decomposizione del polinomio è il punto di partenza per lo studio delle disequazioni algebriche. Una volta ottenuta tale decomposizione, si può studiare il segno di ogni fattore e dedurre poi il segno del prodotto tenendo presente che il prodotto di un numero dispari di numeri negativi è negativo e il prodotto di un numero pari di numeri negativi è un numero positivo. Inoltre, poiché i fattori di secondo grado hanno tutti discriminante negativo, tali fattori hanno tutti segno costante strettamente positivo (in quanto il coefficiente di x2 è 1 > 0). Per rendere più chiaro lo studio dei segni dei singoli fattori, ci si può avvalere di uno schema grafico utilizzando per ogni fattore un tratto continuo per rappresentare gli intervalli in cui è positivo e tratteggiato per gli intervalli in cui è negativo; ad esempio, il segno del fattore x − 1 viene rappresentato come segue x−1≥0 1 −−−−−−−−−−−−• e quello del fattore x2 − 2x − 3 nel modo seguente x2 −2x−3 ≥ 0 −1 3 • −−−−−−−− • In questo modo, il segno del polinomio sarà positivo negli intervalli in cui vi è un numero pari di fattori negativi e negativo negli intervalli in cui vi è un numero dispari di fattori negativi. Alla fine, si considerano gli intervalli corrispondenti al tipo di disequazione richiesta. Capitolo 5: Equazioni e disequazioni 112 Ad esempio, si consideri la disequazione x3 +x2 −4x−4 > 0; il polinomio P (x) = x3 + x2 − 4x − 4 si può decomporre utilizzando la regola di Ruffini come segue P (x) = (x−2)(x+1)(x+2); nello schema seguente si rappresenta il segno di ogni fattore e quello del prodotto: −2 −1 2 x−2≥0 −−−−−−−−−−−−−−−−− •−−−−−−−−−−−−−−−−−−−−−−−− x+1≥0 −−−−−−−−−−− •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− x+2≥0 −−−−−−− •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− P (x) ≥ 0 −−−−−−− •−−−−−−−−−−−−−−−− • −−−−−− •−−−−−−−−−−−−−−−−−−−−−−−− Poiché si vuole che il segno di P sia strettamente positivo, alla fine vanno considerate le soluzioni date dall’insieme S :=]−2, −1[∪]2, +∞[; nella seguente rappresentazione geometrica si é convenuto di rappresentare con un cerchietto pieno gli estremi inclusi nell’insieme, o in cui é soddisfatta la diseguaglianza in esame, e con un cerchietto vuoto i rimanenti estremi. S −2 −1 ◦−−−−−−−−−−−−−◦ 2 ◦−−−−−−−−−−−−−−−−−−−−−−− Anziché utilizzare i simboli • e ◦ spesso si ricorre ai simboli [ e ] con le stesse convenzioni che riguardano gli intervalli; pertanto, l’insieme S si può anche rappresentare nel modo seguente. −2 S 5.2 −1 ]−−−−−−−−−−−−−−[ 2 ]−−−−−−−−−−−−−−−−−−−−−−−− Equazioni e disequazioni razionali fratte Si considerano ora equazioni e disequazioni in cui sono coinvolte funzioni razionali fratte. Si ricorda che una funzione R : X → R definita in un sottoinsieme X di R si dice funzione razionale fratta (oppure semplicemente funzione razionale) se esistono due polinomi P e Q, con Q non nullo, tali che X := {x ∈ R | Q(x) ̸= 0} 5.2 Equazioni e disequazioni razionali fratte 113 e inoltre, per ogni x ∈ X, R(x) := P (x) . Q(x) Poiché il polinomio Q ha sempre un numero finito di radici, le funzioni razionali non sono definite al più in un numero finito di punti. Per quanto riguarda le equazioni con funzioni razionali, esse si riducono a quelle polinomiali. Infatti, si ha R(x) = 0 se e solo se P (x) = 0 e Q(x) ̸= 0; bisogna quindi trovare le radici del polinomio P e verificare che in esse non si annulli anche il denominatore, nel qual caso la funzione razionale non risulterebbe definita. Ad esempio l’equazione (x − 1)(x − 2) =0 x2 − x ha come unica radice l’elemento 2, in quanto l’altra radice 1 del numeratore annulla anche il denominatore e quindi non ha senso considerare l’equazione in tale punto. Anche lo studio delle disequazioni razionali fratte viene condotto in modo molto simile a quello delle disequazioni razionali intere. Bisogna innanzitutto decomporre entrambi i polinomi P e Q in fattori di primo e secondo grado con discriminante minore di 0 e successivamente studiare il segno di ogni fattore (sia del numeratore che del denominatore); infine si tiene presente che il segno della funzione razionale sarà, come nel caso delle disequazioni razionali intere, positivo negli intervalli in cui vi è un numero pari di fattori negativi e negativo negli intervalli in cui vi è un numero dispari di segni negativi. Rispetto al caso polinomiale, nel considerare gli intervalli corrispondenti alla disequazione richiesta, bisogna comunque escludere i punti in cui si annulla il polinomio Q al denominatore. Ad esempio, si consideri la disequazione x−2 ≤2; x−1 essa è equivalente a x−2 −2≤0, x−1 e quindi, considerando il minimo comune multiplo, −x ≤0. x−1 Pertanto, bisogna studiare i segni di −x e x − 1, da cui si ottiene Capitolo 5: Equazioni e disequazioni 114 0 1 −x ≥ 0 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− • −−−−−−−−−−−−−−− x−1≥0 −−−−−−−−−−−−−−−− •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− R(x) ≥ 0 −−−−−−−−− •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− • −−−−−−−− dove R(x) denota la funzione razionale −x/(x − 1). Poiché nel caso in esame si vuole che R(x) ≤ 0, le soluzioni sono date dall’insieme S :=] − ∞, 0]∪]1, +∞[, che si può rappresentare nel modo seguente. 0 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−• S 5.3 1 ◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−− Sistemi di equazioni e disequazioni Nelle sezioni successive, si studieranno alcuni casi in cui le equazioni o disequazioni in esame possono essere ricondotte ad una o più equazioni o disequazioni di tipo più semplice. Quando, in generale, si hanno più equazioni (rispettivamente, disequazioni) che devono essere soddisfatte contemporaneamente si preferisce parlare di sistemi di equazioni (rispettivamente, sistemi di disequazioni ) e raggruppare le disequazioni con una parentesi graffa. Un sistema di equazioni (rispettivamente, disequazioni) si presenta nella forma f1 (x) = g1 (x) , f2 (x) = g2 (x) , .. . fn (x) = gn (x) (rispettivamente, f1 (x) ≤ g1 (x) , f2 (x) ≤ g2 (x) , .. . fn (x) ≤ gn (x) ), con f1 : X1 → R, . . . , fn : Xn → R e g1 : Y1 → R, . . . , gn : Yn → R funzioni reali assegnate. 5.3 Sistemi di equazioni e disequazioni 115 Le soluzioni di un sistema di equazioni (rispettivamente, disequazioni) sono date dall’insieme S := {x ∈ X1 ∩ · · · ∩ Xn ∩ Y1 ∩ · · · ∩ Yn | f1 (x) = g1 (x), . . . , fn (x) = gn (x)} (rispettivamente, S := {x ∈ X1 ∩ · · · ∩ Xn ∩ Y1 ∩ · · · ∩ Yn | f1 (x) ≤ g1 (x), . . . , fn (x) ≤ gn (x)} ). Quindi, per determinare l’insieme S si determinano separatamente gli insiemi S1 , . . . , Sn di ognuna delle equazioni (rispettivamente, disequazioni) del sistema. Allora l’insieme S é dato da S1 ∩ · · · ∩ Sn . Quanto osservato vale anche per i sistemi misti, che contengono sia equazioni che disequazioni. Ad esempio, si consideri il sistema 2x > 5 , x2 − 5x + 6 = 0 , x ̸= 0 . La prima disequazione ha come soluzioni l’insieme S1 =]5/2, +∞[; la seconda equazione l’insieme S2 = 2, 3 e la terza l’insieme R∗ . Quindi l’insieme S delle soluzioni del sistema è dato da S = S1 ∩ S2 ∩ S3 = {3}. L’intersezione può essere facilmente determinata graficamente considerando i punti comuni agli insiemi delle soluzioni di ogni disequazione o equazione. S1 0 S2 S3 2 • 5/2 3 ◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−− • −−−−−−−−−−−−−−−−−−−◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S • Si consideri ora il sistema 2 x + 5 ≤ 2x2 + 4 , x4 − 16 < 0 , 2x − 1 > 0 . L’insieme S1 delle soluzioni della prima disequazione é dato da S1 := ] − ∞, −1] ∪ [1, +∞[, l’insieme S2 delle soluzioni della seconda disequazione Capitolo 5: Equazioni e disequazioni 116 é dato da S2 :=] − 2, 2[ ed infine l’insieme S3 delle soluzioni della terza disequazione é dato da S3 :=]1/2, +∞[. Pertanto, le soluzioni del sistema sono date dall’insieme S := S1 ∩ S2 ∩ S3 = [1, 2[, come si riconosce anche dal grafico seguente. S1 S2 −2 −1 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−• 1 2 •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− ◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦ ◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S3 •−−−−−−−−−−◦ S 5.4 1/2 Equazioni e disequazioni irrazionali Si considerano innanzitutto equazioni irrazionali del tipo √ n f (x) = g(x) . Se n è pari, sia la funzione f che la funzione g devono essere positive, la prima in quanto argomento della radice n-esima, la seconda in quanto deve soddisfare l’uguaglianza prevista; una volta che ciò sia stato imposto, si possono elevare primo e secondo membro alla potenza n-esima ed ottenere un’equazione in cui non figura più la radice n-esima. Se n invece è dispari, non è necessario imporre la positività delle funzioni f e g e quindi si possono elevare direttamente alla potenza n-esima entrambi i membri dell’equazione. Si conclude che l’equazione in esame è equivalente al seguente sistema f (x) ≥ 0 , g(x) ≥ 0 , f (x) = g(x)n , se n é pari, altrimenti é equivalente all’equazione f (x) = g(x)n se n é dispari. Per quanto riguarda le disequazioni irrazionali conviene considerare separatamente i seguenti due casi: √ √ n f (x) ≤ g(x) , f (x) ≤ n g(x) 5.4 Equazioni e disequazioni irrazionali 117 (le diseguaglianze strette < al posto di ≤ vengono trattate in maniera analoga). Se n é dispari entrambi i tipi di disequazioni sono equivalenti a quelle che si ottengono elevando entrambi i membri alla potenza n-esima. Se n é pari, con ragionamento analogo a quello svolto per le equazioni, si riconosce che la prima disequazione in esame é equivalente al sistema f (x) ≥ 0 , g(x) ≥ 0 , f (x) ≤ g(x)n , mentre la seconda é equivalente ai due sistemi { f (x) ≥ 0 , f (x) ≤ 0 , g(x) ≥ 0 , g(x) ≥ 0 , f (x)n ≤ g(x) , nel senso che le soluzioni della disequazione sono date dall’unione delle soluzioni dei due sistemi. Ad esempio, si consideri la disequazione √ x2 − x − 2 < x + 1 . In base alla discussione precedente, essa é equivalente al sistema 2 x −x−2≥0, x+1≥0, 2 x − x − 2 < x2 + 2x + 1 ; denotati con S1 , S2 e rispettivamente S3 gli insieme delle soluzioni della prima, seconda e rispettivamente terza disequazione, si ottiene facilmente S1 =] − ∞, −1[∪[2, +∞[ , S2 = [−1, +∞[ , S3 =] − 1, +∞[ e conseguentemente la disequazione assegnata é soddisfatta nell’insieme S = S1 ∩ S2 ∩ S3 = [2, +∞[. S1 −1 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−• 2 •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S2 •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S3 ◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− Capitolo 5: Equazioni e disequazioni 118 Al contrario, la disequazione opposta √ x2 − x − 2 > x + 1 é equivalente ai due sistemi { 2 x −x−2≥0, x+1≥0, 2 x − x − 2 > x2 + 2x + 1 ; x −x−2≥0, x+1<0, 2 in base alla discussione precedente, si riconosce facilmente che il primo sistema ha come soluzioni l’insieme S ′ =] − ∞, −1[, mentre il secondo sistema non é mai soddisfatto (S ′′ = ∅); allora le soluzioni della disequazione sono date da S = S ′ ∪ S ′′ =] − ∞, −1[ (si osservi che in questo caso alla fine viene considerata l’unione delle soluzioni dei due sistemi). Come ulteriore esempio, si consideri la disequazione 2−x< √ x2 − 1 ; essa é ancora una volta equivalente ai due sistemi { 2−x≥0, x2 − 1 ≥ 0 , 4 − 4x + x2 < x2 − 1 . 2−x<0, x2 − 1 ≥ 0 , Per quanto riguarda il primo sistema, la prima disequazione é soddisfatta in S1′ =]2, +∞[ e la seconda in S2′ =] − ∞, −1] ∪ [1, +∞[, per cui le soluzioni del primo sistema sono date dall’insieme S ′ =]2, +∞[. S1′ S2′ S′ −1 −−−−−−−−−−−−−−−−−−−−• 1 2 ◦−−−−−−−−−−−−−−−−−−− •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− ◦−−−−−−−−−−−−−−−−−−− Il secondo sistema ha invece come soluzioni l’insieme S ′′ =]5/4, 2], in quanto la prima disequazione é soddisfatta in S1′′ =] − ∞, 2], la seconda in S2′′ =] − ∞, −1] ∪ [1, +∞[ e la terza in S3′′ =]5/4, +∞[. 5.5 Equazioni e disequazioni con valore assoluto −1 1 119 5/4 S1′′ −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−• S2′′ −−−−−−−−−−−−−−−−−−−−• 2 •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S3′′ ◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S ′′ ◦−−−−−−−−−−−−−• Si conclude che le soluzioni della disequazione assegnata sono date dall’insieme S = S1 ∪ S2 =]5/4, +∞[. 5/4 S′ 5.5 2 ◦−−−−−−−−−−−−−−−−−−− S ′′ ◦−−−−−−−−−−−−−• S ◦−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− Equazioni e disequazioni con valore assoluto Per ogni x ∈ R, il valore assoluto |x| di x è definito ponendo { x, x≥0; |x| := −x , x<0. Un’equazione del tipo |f (x)| = g(x) , con f e g funzioni reali assegnate, può essere ricondotta facilmente ad un sistema di equazioni e disequazioni in cui non compare più il valore assoluto. Infatti, tenendo presente che deve essere necessariamente g(x) ≥ 0 in quanto il valore assoluto a primo membro è positivo, le soluzioni sono date dai due sistemi: { { g(x) ≥ 0 , g(x) ≥ 0 , f (x) = g(x) , f (x) = −g(x) . Ad esempio, l’equazione |x2 + x + 1| = x2 − 3x + 2 120 Capitolo 5: Equazioni e disequazioni ha come soluzioni quelle dei due sistemi { 2 { 2 x − 3x + 2 ≥ 0 , x − 3x + 2 ≥ 0 , x2 + x + 1 = x2 − 3x + 2 , x2 + x + 1 = −(x2 − 3x + 2) . Il primo di essi è soddisfatto in S1 = (]−∞, 1]∪[2, +∞[)∩{1/4} = {1/4}; il secondo invece non ha soluzioni in quanto l’equazione x2 + x + 1 = −(x2 − 3x+2), equivalente a 2x2 −2x+3 = 0 non è mai soddisfatta. Si conclude che l’equazione assegnata ammette come unica soluzione il punto x = {1/4}. Alternativamente, l’equazione |f (x)| = g(x) può essere risolta anche distinguendo i casi in cui f (x) è positivo o negativo e utilizzando la definizione di valore assoluto. In tal modo le soluzioni sono date dai due sistemi: { { f (x) ≥ 0 , f (x) < 0 , f (x) = g(x) , −f (x) = g(x) , che sono ovviamente equivalenti a quelli considerati. Si considerano ora le disequazioni che coinvolgono il valore assoluto. Innanzitutto conviene considerare separatamente quelle che si presentano nella forma |f (x)| ≤ g(x) , da quelle del tipo f (x) ≤ |g(x)| (nel caso di diseguaglianze strette i metodi di risoluzione sono del tutto analoghi e pertanto per brevità vengono omessi). Tenendo presente che la disequazione |x| ≤ a non é mai soddisfatta se a < 0 ed é soddisfatta per −a ≤ x ≤ a se a ≥ 0, la prima disequazione é equivalente al seguente sistema g(x) ≥ 0 , −g(x) ≤ f (x) , f (x) ≤ g(x) , in cui non é più coinvolto il valore assoluto. ◃ Alternativamente, si ottengono le stesse soluzioni tenendo presente la definizione di valore assoluto e distinguendo i casi in cui f (x) ≥ 0 e f (x) < 0. In tal modo le soluzioni della prima disequazione sono date dai seguenti due sistemi: { { f (x) ≥ 0 , f (x) < 0 , f (x) ≤ g(x) , −f (x) ≤ g(x) . 5.5 Equazioni e disequazioni con valore assoluto 121 Analogamente, tenendo presente che la disequazione a ≤ |x| é sempre soddisfatta se a < 0 ed é soddisfatta sia per x ≥ a che per x ≤ −a se a ≥ 0, allora la seconda disequazione in esame é equivalente ai seguenti tre sistemi (nel senso che l’insieme delle soluzioni é dato dall’unione degli insiemi delle soluzioni dei tre sistemi) { { { f (x) < 0 , f (x) ≥ 0 , f (x) ≥ 0 , x ∈ Xg ; g(x) ≥ f (x) ; g(x) ≤ −f (x) , dove nel primo sistema si é denotato con Xg l’insieme di definizione della funzione g (infatti la condizione f (x) < 0 assicura la validità di f (x) ≤ |g(x)| purché anche la funzione g sia definita in x). ◃ Anche ora si ottengono le stesse soluzioni distinguendo i casi in cui g(x) ≥ 0 e g(x) < 0. In tal modo le soluzioni della seconda disequazione sono date dai seguenti due sistemi: { { g(x) ≥ 0 , g(x) < 0 , f (x) ≤ g(x) , f (x) ≤ −g(x) . Ad esempio, si consideri la disequazione |x2 − 9x + 7| ≤ 7. Da quanto osservato, essa si riconduce al sistema 7≥0, x2 − 9x + 7 ≤ 7 , −7 ≤ x2 − 9x + 7 . La prima disequazione è sempre soddisfatta (S1 = R). La seconda si può scrivere x2 − 9x + 14 ≥ 0; poiché ∆ = 25, si hanno due radici x1 = 2 e x2 = 7 e la disequazione è soddisfatta per x ≤ 2 o per x ≥ 7, cioé in S2 =] − ∞, 2] ∪ [7, +∞[. L’ultima disequazione si scrive come x2 − 9x ≤ 0 e quindi è soddisfatta in S3 = [0, 9]. Quindi la disequazione assegnata ha come soluzioni l’insieme S = [0, 2] ∪ [7, 9]. 0 2 7 9 S1 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S2 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−• •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− S3 •−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− • S •−−−−−−−−−− • •−−−−−−−−−− • Capitolo 5: Equazioni e disequazioni 122 Si consideri ora la disequazione x + 1 < |x2 − 3x − 8| , che in base alla discussione effettuata, si riconduce ai tre sistemi { { { x+1≥0, x+1≥0, x+1<0, x2 − 3x − 8 < −x − 1 , x + 1 < x2 − 3x − 8 . Il primo sistema ha come soluzioni l’insieme S ′ =] − ∞, −1[. Per quanto riguarda il secondo sistema, la disequazione x + 1 ≥ 0 è soddisfatta per x ≥ −1, e la disequazione x2 − 3x − 8√ < −x − 1 è equivalente √ a x2 − 2x − 7 < 0; si hanno due soluzioni x = 1 − 2 1 √ √ 2 e x2 = 1 + 2 2 e la disequazione è soddisfatta per 1 − 2 2 < x < 1 + 2 √2; pertanto il secondo sistema ha come soluzioni l’insieme S ′′ = [−1, 1 + 2 2[. Infine, la prima disequazione x + 1 ≥ 0 del terzo sistema è soddisfatta per x ≥ −1; la seconda disequazione x + 1 < √ x2 − 3x − 8 è √ equivalente a 2 x −4x−9 > 0; si hanno due soluzioni x3 √ = 2− 13 e x4 = 2+ √ 13, e quindi la disequazione è soddisfatta per x < 2 − 13 e per√x > 2 + 13; pertanto il terzo sistema ha come soluzioni l’insieme S ′′′ =]2+ 13, +∞[. Concludendo, le soluzioni √ della disequazione iniziale sono date da S = S1 ∪ S2 ∪ S3 = √ ] − ∞, 1 + 2 2[∪]2 + 13, +∞[. S′ −−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦ S ′′ 1 5.6 √ 1+ 13 •−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦ S ′′′ S √ 1+2 2 ◦−−−−−−−−−−−−−−−−−−−−−−−−− −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−◦ ◦−−−−−−−−−−−−−−−−−−−−−−−−− Metodo grafico Si considerano ora alcuni tipi di equazioni e disequazioni in cui sono coinvolte funzioni esponenziali, logaritmiche, trigonometriche e trigonometriche inverse. Uno dei metodi più semplici per la risoluzione di tali equazioni consiste nel confrontare i grafici delle funzioni che compaiono al primo ed al secondo membro della disequazione in esame e dedurre da tale grafico l’insieme delle 5.6 Metodo grafico 123 soluzioni della disequazione; per tale confronto bisogna comunque sempre imporre che le funzioni siano definite nei punti considerati. Il confronto grafico può essere effettuato molto facilmente nei casi in cui una delle funzioni sia una retta o, più in particolare, una retta orizzontale, nel qual caso uno dei membri della disequazione é costante. Si considera qualche esempio, al fine di illustrare più chiaramente il metodo descritto. Si consideri la disequazione log x < 1 . Confrontando il grafico della funzione log con la retta orizzontale passante per il punto (0, 1), si deduce in maniera immediata che la disequazione é soddisfatta nell’insieme S =]0, e[ (vedasi la Figura 5.1). y 1 0 1 S e x Figura 5.1: Metodo grafico per le disequazioni: Esempio 1 Si consideri ora la disequazione 1 . 2 Confrontando il grafico della funzione sin con la retta orizzontale passante per il punto (0, 1/2), si deduce subito che nell’intervallo [−π, π], la disequazione é soddisfatta nell’insieme S0 =]π/6, 5π/6[ (vedasi la Figura 5.2). Tenendo poi conto della periodicità della funzione seno, si ricava l’insieme S di tutte le soluzioni dato da [ ∪ ]π 5 S= + 2kπ, π + 2kπ . 6 6 sin x > k∈Z Capitolo 5: Equazioni e disequazioni 124 y 0 -π S0 π x Figura 5.2: Metodo grafico per le disequazioni: Esempio 2 Si prende ora in esame la disequazione arcsin x ≤ π . 6 Confrontando il grafico della funzione arcsin con la retta orizzontale passante per il punto (0, π/6), si deduce subito che la disequazione é soddisfatta nell’insieme S = [−1, 1/2[ (vedasi la Figura 5.3). y π 2 π 6 1 2 -1 1 x π -2 Figura 5.3: Metodo grafico per le disequazioni: Esempio 3 Più generale, il metodo descritto negli esempi precedenti può essere applicato anche nei casi in cui il confronto non sia necessariamente con una 5.6 Metodo grafico 125 retta; in tali casi l’utilizzo del calcolo differenziale può essere utile per la dimostrazione di qualche diseguaglianza. Inoltre, il teorema degli zeri può anche essere utilizzato per una determinazione approssimata delle soluzioni, nei casi in cui non sia possibile descrivere le soluzioni in maniera precisa. Ad esempio, si consideri la seguente disequazione: x4 + ex ≤ 1 . y 0 S x Figura 5.4: Metodo grafico per le disequazioni: Esempio 4 Confrontando i grafici della funzione 1 − ex e della funzione x4 (vedasi la Figura 5.4), si riconosce subito che tali funzioni assumono lo stesso valore in un punto x0 < 0 e in 0 e conseguentemente, le soluzioni della disequazione assegnata sono date dall’insieme S =]x0 , 0[. Il punto x0 non può essere determinato in modo preciso, tuttavia esso è sicuramente compreso tra −1 e −1/2 in quanto nel punto −1/2 la disequazione é soddisfatta (come si verifica direttamente), mentre nel punto −1 non lo è. Capitolo 6 Limiti delle funzioni reali 6.1 Definizione generale di limite Lo studio dei limiti delle funzioni reali costituisce uno strumento utile per la conoscenza delle proprietà locali di una funzione reale assegnata. Per comodità, viene considerato il caso di funzioni definite in sottoinsiemi arbitrari di R; tuttavia, quando l’esposizione di alcuni argomenti potrà risultare semplificata, ci si limiterà a considerare il caso più significativo di funzioni definite in un intervallo. Si espone dapprima la definizione generale di limite di una funzione reale in un punto e, dopo averne visto alcune proprietà, si considereranno i risultati più importanti riguardanti il calcolo dei limiti. Definizione 6.1.1 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione per X ed ℓ ∈ R. Se f : X → R è una funzione reale definita in X, si dice che ℓ è il limite di f in x0 , oppure che f tende verso ℓ per x tendente verso x0 , e si scrive lim f (x) = ℓ x→x0 “il limite di f (x) per x tendente verso x0 è uguale a ℓ” se è verificata la seguente condizione: ∀ I ∈ I(ℓ) ∃ J ∈ I(x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : f (x) ∈ I . (6.1.1) La lettera x che compare nella notazione del limite è “muta” nel senso che essa può essere sostituita con una qualsiasi altra lettera che non sia già stata utilizzata nello stesso contesto. Capitolo 6: Limiti delle funzioni reali 128 Una funzione che ammette un limite ℓ ∈ R in un punto x0 ∈ R viene spesso denominata convergente in x0 ; se, invece, ammette come limite +∞ oppure −∞ viene denominata divergente (positivamente oppure negativamente) in x0 . Per poter considerare il limite di una funzione in un punto x0 è dunque necessario che il punto x0 sia di accumulazione per l’insieme di definizione della funzione. Tale ipotesi, infatti, assicura che l’intersezione X ∩ J r {x0 } sia non vuota per ogni intorno J di x0 e quindi che gli elementi x ∈ X ∩ J r {x0 } verificanti la (6.1.1) esistano effettivamente. Naturalmente, se x0 = +∞ oppure x0 = −∞, l’ipotesi che esso sia di accumulazione per X, significa esattamente che X non è limitato superiormente oppure rispettivamente inferiormente. Nel caso in cui x0 ∈ R, inoltre, conviene precisare subito che non ha alcuna importanza, ai fini del limite, il fatto che la funzione sia definita o meno nel punto x0 ; nel caso lo sia, poi, non vi è alcuna relazione tra il valore f (x0 ) che f assume nel punto x0 ed il limite della funzione in tale punto (in seguito, avranno un ruolo importante le funzioni f : X → R che in punto x0 ∈ X hanno limite uguale proprio ad f (x0 ); tali funzioni verranno denominate continue in x0 ). La definizione generale di limite vale sia nel caso in cui x0 ed ℓ siano reali o infiniti. Nelle applicazioni, tuttavia, in cui x0 ed ℓ sono noti, la Definizione (6.1.1) può essere precisata meglio tenendo conto della definizione adottata di intorno di un numero reale o degli elementi +∞ e −∞. Nel caso in cui sia noto che ℓ ∈ R, gli intorni di ℓ possono essere considerati del tipo Iε (x0 ) (vedasi la (2.3.1) a pag. 42) al variare di ε > 0 (infatti, ogni Iε (x0 ) è un intorno di ℓ e viceversa ogni intorno di ℓ contiene un intervallo Iε (x0 )); pertanto, la condizione (6.1.1) si può scrivere come segue: ∀ ε > 0 ∃ J ∈ I(x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : ℓ − ε < f (x) < ℓ + ε . Nei casi in cui ℓ = +∞ (rispettivamente, ℓ = −∞), ragionando come sopra si possono considerare intorni di ℓ del tipo ]M, +∞[ (e rispettivamente ] − ∞, M [) e quindi la condizione (6.1.1) si può scrivere come segue: ∀ M ∈ R ∃ J ∈ I(x0 ) t.c. (rispettivamente, ∀ x ∈ X ∩ J r {x0 } : M < f (x) ∀ x ∈ X ∩ J r {x0 } : f (x) < M ). Le stesse osservazioni appena svolte per l’elemento ℓ valgono anche per il punto di accumulazione x0 . Ritornando al caso generale ℓ ∈ R, se x0 ∈ R, la condizione (6.1.1) equivale alla seguente ∀ I ∈ I(ℓ) ∃ δ > 0 t.c. ∀ x ∈ X ∩ Iδ (x0 ) r {x0 } : f (x) ∈ I , 6.2 Prime proprietà dei limiti 129 mentre, se x0 = +∞ (rispettivamente, x0 = −∞), diventa ∀ I ∈ I(ℓ) ∃ c ∈ R t.c. (rispettivamente, ∀ x ∈ X∩]c, +∞[ : f (x) ∈ I , ∀ x ∈ X∩] − ∞, c[ : f (x) ∈ I ). Nei casi in cui siano noti sia ℓ che x0 si possono applicare entrambe le considerazioni precedenti. Cosı̀, ad esempio, se ℓ ∈ R, x0 ∈ R, si ha limx→x0 f (x) = ℓ se e solo se ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X ∩ Iδ (x0 ) r {x0 } : ℓ − ε < f (x) < ℓ + ε , mentre, si ha limx→−∞ f (x) = +∞ se e solo se ∀ M ∈ R ∃ c ∈ R t.c. ∀ x ∈ X : x < c ⇒ f (x) > M . 6.2 Prime proprietà dei limiti La definizione di limite data nella sezione precedente è pienamente giustificata dal seguente teorema di unicità. Teorema 6.2.1 (Teorema di unicità del limite) Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione per X ed f : X → R una funzione reale. Se ℓ1 ∈ R, ℓ2 ∈ R e lim f (x) = ℓ1 , x→x0 lim f (x) = ℓ2 , x→x0 allora necessariamente ℓ1 = ℓ2 . Dimostrazione. Si supponga, per assurdo, che ℓ1 ̸= ℓ2 . Allora si possono trovare un intorno I1 ∈ I(ℓ1 ) ed un intorno I2 ∈ I(ℓ2 ) tali che I1 ∩ I2 = ∅. Dalle ipotesi segue da un lato l’esistenza di un intorno J1 ∈ I(x0 ) tale che, per ogni x ∈ X ∩ J1 r {x0 }, f (x) ∈ I1 , e dall’altro l’esistenza di un ulteriore intorno J2 ∈ I(x0 ) tale che, per ogni x ∈ X ∩ J2 r {x0 }, f (x) ∈ I2 . Si consideri ora J = J1 ∩ J2 ; tale insieme è anch’esso un intorno di x0 e poiché x0 è un punto di accumulazione per X, deve essere X ∩ J r {x0 } ̸= ∅. Si considera un qualsiasi elemento x ∈ X ∩ J r {x0 }, si ha sia x ∈ X ∩ J1 r {x0 }, da cui f (x) ∈ I1 ed anche x ∈ X ∩ J2 r {x0 }, da cui f (x) ∈ I2 ; dunque f (x) ∈ I1 ∩ I2 e ciò è escluso dal fatto che gli intorni I1 ed I2 sono disgiunti. Altre proprietà, di immediata verifica, sono elencate di seguito. Proposizione 6.2.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione per X, ℓ ∈ R ed f : X → R una funzione reale tale che limx→x0 f (x) = ℓ. Allora valgono le seguenti proprietà: Capitolo 6: Limiti delle funzioni reali 130 1. (Limitatezza locale) Se ℓ ∈ R ∪ {+∞} (rispettivamente, ℓ ∈ R ∪ {−∞}), allora f è limitata inferiormente (rispettivamente, superiormente) in un intorno di x0 , cioè esistono M0 ∈ R ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 , M0 ≤ f (x) (rispettivamente, f (x) ≤ M0 ). In particolare, se ℓ ∈ R allora f è limitata in un intorno di x0 , cioè esistono m0 , M0 ∈ R ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 , m0 ≤ f (x) ≤ M0 . 2. (Permanenza del segno) i) Se ℓ ∈]0, +∞[∪{+∞} (rispettivamente, ℓ ∈] − ∞, 0[∪{−∞}) esistono un numero reale r > 0 ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 r {x0 }, f (x) ≥ r (rispettivamente, f (x) ≤ −r0 ). ii) Viceversa, se esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, si ha f (x) ≥ 0 (rispettivamente, f (x) ≤ 0) allora si ha anche ℓ ∈ [0, +∞[∪{+∞} (rispettivamente, ℓ ∈]−∞, 0]∪{−∞}). iii) Se, per ogni intorno J di x0 , esistono x1 ∈ X ∩ J r {x0 } e x2 ∈ X ∩ J r {x0 } tali che f (x1 ) ≥ 0, f (x2 ) ≤ 0, allora deve essere necessariamente ℓ = 0. iv) Se, per ogni intorno J di x0 , esiste x ∈ X ∩ J r {x0 } tale che f (x) = 0, allora deve essere necessariamente ℓ = 0. 3. (Monotonia del limite) Si supponga che g : X → R sia un’ulteriore funzione reale tale che limx→x0 g(x) = ℓ′ con ℓ′ ∈ R. Allora, se ℓ < ℓ′ , esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, f (x) < g(x). Viceversa, se esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, f (x) ≤ g(x), deve essere necessariamente ℓ ≤ ℓ′ . Dimostrazione. Si dimostra innanzitutto la proprietà 1. Si supponga ℓ ∈ R ∪ {+∞}; se ℓ ∈ R si pone I = [ℓ − 1, +∞[ mentre se ℓ = +∞ si pone I = [0, +∞[. Tenendo presente che I è un intorno di ℓ, applicando la definizione di limite a tale intorno, si ottiene un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, ℓ − 1 ≤ f (x) se ℓ ∈ R e 0 ≤ f (x) se ℓ = +∞. A questo punto se x0 ∈ / X è sufficiente porre M0 = ℓ − 1 se ℓ ∈ R e M0 = 0 se ℓ = +∞; se invece x0 ∈ X, si può porre M0 = min{ℓ − 1, f (x0 )} se ℓ ∈ R e M0 = min{0, f (x0 )} se ℓ = +∞ e la tesi è verificata in ogni caso. Il caso rispettivo si dimostra analogamente e infine se ℓ ∈ R basta applicare contemporaneamente sia il caso dimostrato che quello rispettivo. Si dimostra ora la 2. Si considera dapprima la proprietà i). Se ℓ ∈]0, +∞[ si pone r = |ℓ|/2 mentre se ℓ = +∞ si pone r = 1; applicando la definizione di limite all’intorno I := [r, +∞[ di ℓ si ottiene interamente la tesi. Il caso rispettivo è analogo. 6.2 Prime proprietà dei limiti 131 Per quanto riguarda la ii), si supponga che esista un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, f (x) ≥ 0. Se fosse per assurdo ℓ < 0 oppure ℓ = −∞, dalla proprietà i) esisterebbero r > 0 ed un intorno J1 di x0 tali che, per ogni x ∈ X ∩J1 r{x0 }, f (x) ≤ −r. Considerato x ∈ X ∩(J0 ∩J1 )r{x0 } si avrebbe contemporaneamente f (x) ≥ 0 e f (x) ≤ −r e ciò è assurdo. Quindi deve essere ℓ ≥ 0 oppure ℓ = +∞. Infine, le proprietà iii) e iv) seguono anch’esse dalla i) procedendo per assurdo. Per quanto riguarda la 3., si supponga dapprima ℓ < ℓ′ . Allora si possono considerare due intervalli disgiunti I ∈ I(ℓ) e I ′ ∈ I(ℓ′ ); quindi, per ogni y ∈ I e per ogni y ′ ∈ I ′ , si ha y < y ′ . Applicando la definizione di limite, si ottiene l’esistenza di un intorno Jdix0 tale che, per ogni x ∈ X ∩ J r {x0 }, f (x) ∈ I ed un intorno J ′ di x0 tale che, per ogni x ∈ X ∩ J ′ r {x0 }, g(x) ∈ I ′ . Si consideri ora l’insieme J0 = J ∩ J ′ ; esso è un intorno di x0 e, per ogni x ∈ X ∩ J0 r {x0 }, risulta f (x) < g(x) in quanto f (x) ∈ I e g(x) ∈ I ′ . Viceversa, si supponga che esista un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, f (x) ≤ g(x). Se, per assurdo, fosse ℓ′ < ℓ, dalla prima parte dimostrata si dedurrebbe l’esistenza di un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, si abbia g(x) < f (x). Considerato x ∈ X ∩ (J0 ∩ J1 ) r {x0 } si avrebbe contemporaneamente f (x) ≤ g(x) e f (x) > g(x) e ciò è assurdo. Quindi deve essere ℓ ≤ ℓ′ . ◃ Un’altra proprietà importante del limite di una funzione riguarda il suo carattere locale. Si considerino due funzioni reali f, g : X → R e sia x0 ∈ R un punto di accumulazione per X. Se esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, si abbia f (x) = g(x) allora il limite di f in x0 esiste se e solo se esiste il limite di g in x0 e in tal caso i due limiti coincidono (tale proprietà si esprime semplicemente affermando che i limiti limx→x0 f (x) e limx→x0 g(x) sono equivalenti). Infatti si supponga che limx→x0 f (x) = ℓ con ℓ ∈ R. Se I ∈ I(ℓ), allora esiste un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, risulti f (x) ∈ I. Posto J = J0 ∩ J1 si ha che J è un intorno di x0 e, per ogni x ∈ X ∩ J1 r {x0 }, si ha g(x) = f (x) ∈ I. Quindi si ha limx→x0 f (x) = ℓ. Analogamente si riconosce che se limx→x0 g(x) = ℓ allora anche limx→x0 f (x) = ℓ e quindi la tesi è vera. Dalla proprietà precedente segue che è equivalente considerare il limite di una funzione f : X → R in un punto di accumulazione x0 ∈ R per X e quello della sua restrizione f|X∩J0 ad un intorno J0 di x0 . Quindi i limiti limx→x0 f (x) e limx→x0 f|X∩J0 (x) sono equivalenti nel senso che uno esiste se e solo se esiste anche l’altro e in tal caso sono uguali. Viceversa se A è un sottoinsieme di X tale che x0 sia ancora di accumulazione per A, non si può affermare in generale che se limx→x0 f|A (x) = ℓ allora anche limx→x0 f (x) = ℓ. I due limiti limx→x0 f|A (x) e limx→x0 f (x) sono equivalenti nel caso in cui A soddisfi la seguente condizione: ∃ J0 ∈ I(x0 ) t.c. X ∩ J0 r {x0 } = A ∩ J0 r {x0 } (quindi A contiene tutti i punti appartenenti ad X in J0 r {x0 }). Capitolo 6: Limiti delle funzioni reali 132 6.3 Limiti destri e sinistri Il calcolo del limite di una funzione in un punto si rivelerà uno strumento essenziale per lo studio delle funzioni condotto a partire dal presente capitolo. In alcuni casi, tuttavia, tale limite non esiste e quindi ha senso investigare se sono verificate almeno proprietà più deboli. In questo ambito si inserisce la ricerca dei limiti da destra e da sinistra, come precisato dalla seguente definizione. Definizione 6.3.1 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione a destra (rispettivamente, a sinistra) per X, ℓ ∈ R ed f : X → R una funzione reale. Si dice che ℓ è il limite destro (rispettivamente, sinistro) di f in x0 , oppure che f tende verso ℓ per x tendente verso x0 da destra (rispettivamente, da sinistra), e si scrive lim f (x) = ℓ , x→x+ 0 (rispettivamente, lim− f (x) = ℓ ) x→x0 (si legge “il limite di f (x) per x tendente verso x0 da destra è uguale ad ℓ” (rispettivamente, il limite di f (x) per x tendente verso x0 da sinistra è uguale ad ℓ”)) se è verificata la seguente condizione ∀ I ∈ I(ℓ) ∃ J ∈ I + (x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : f (x) ∈ I (6.3.1) (rispettivamente,∃ J ∈ I − (x0 ) t.c. ∀ x ∈ X ∩ J r {x0 } : f (x) ∈ I ). Tenendo presente che x0 ∈ R e che ogni intorno destro (rispettivamente, sinistro) di x0 contiene un intervallo [x0 , x0 +δ[ (rispettivamente, ]x0 −δ, x0 ]), la condizione (6.3.1) è equivalente alla seguente: ∀ I ∈ I(ℓ) ∃ δ > 0 t.c. ∀ x ∈ X∩]x0 , x0 + δ[: f (x) ∈ I (6.3.2) (rispettivamente,∀ x ∈ X∩]x0 − δ, x0 [: f (x) ∈ I ). Ovviamente, nei casi in cui è possibile precisare se ℓ ∈ R oppure ℓ = ±∞, valgono le stesse considerazioni relative alla definizione generale di limite (6.1.1). Sostanzialmente, calcolare il limite destro (rispettivamente, sinistro) in un punto x0 significa considerare solamente i valori della funzione a destra (rispettivamente, a sinistra) di x0 ; precisamente, nelle ipotesi della Definizione 6.3.1, i seguenti limiti lim f (x) , x→x+ 0 (rispettivamente, lim f (x) , x→x− 0 lim f|X∩]x0 ,+∞[ (x) , x→x0 lim f|X∩]−∞,x0 [ (x) ) x→x0 (6.3.3) 6.3 Limiti destri e sinistri 133 sono equivalenti (cioè uno dei due limiti esiste se e solo se esiste anche l’altro e in tal caso sono uguali). Trattandosi di un particolare limite, quindi, valgono tutte le proprietà esposte nella sezione precedente; in particolare, anche il limite destro e quello sinistro, quando esistono, sono unici. Inoltre, sempre dalle uguaglianze precedenti, segue che il punto x0 è di accumulazione solo a destra (rispettivamente, solo a sinistra) l’esistenza del limite della funzione in x0 equivale a quella del limite destro (rispettivamente, sinistro) in x0 . In questo caso, quindi, il limite destro o sinistro non aggiunge nulla di nuovo rispetto al limite. Nel caso, invece, in cui il punto x0 sia di accumulazione sia a sinistra che a destra per X, si ha la seguente caratterizzazione. Proposizione 6.3.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione sia a sinistra che a destra per X ed f : X → R una funzione reale. Allora, le seguenti proposizioni sono equivalenti: a) Esiste il limite di f in x0 . b) Esistono entrambi i limiti sinistro e destro di f in x0 e sono uguali. Inoltre, vera l’una e quindi l’altra delle proposizioni equivalenti precedenti, si ha: lim f (x) = lim+ f (x) = lim− f (x) . x→x0 x→x0 x→x0 Dimostrazione. a) ⇒ b) Ovvia in quanto ogni intorno di x0 è un intorno sia destro che sinistro di x0 . b) ⇒ a) Si denoti con ℓ il valore comune dei due limiti sinistro e destro di f in x0 e sia I ∈ I(ℓ); dalla (6.3.2), considerando ℓ come limite destro, esiste δ1 > 0 tale che, per ogni x ∈ X∩]x0 , x0 +δ1 [, si abbia f (x) ∈ I; inoltre, considerando ℓ come limite sinistro, sempre dalla (6.3.2), esiste δ2 > 0 tale che, per ogni x ∈ X∩]x0 − δ2 , x0 [, si abbia f (x) ∈ I. Si è cosı̀ trovato l’intorno J =]x0 −δ2 , x0 +δ1 [ di x0 tale che, per ogni x ∈ X ∩J r{x0 }, risulta f (x) ∈ I. Poiché l’intorno I di ℓ, si deduce che è vera la a). La proposizione precedente può essere utilizzata, in qualche caso, anche per dimostrare che un limite assegnato non esiste (facendo cioè vedere o che non esiste uno dei limiti sinistro o destro, oppure che esistono entrambi ma sono diversi tra loro). Nelle sezioni successive verranno esposti molti risultati limitandosi al caso dei limiti; con opportune semplici modifiche, se necessarie, tali risultati si possono adattare anche ai limiti sinistri e destri. Capitolo 6: Limiti delle funzioni reali 134 6.4 Teoremi di confronto I teoremi esposti nella presente sezione sono largamente utilizzati nel calcolo dei limiti soprattutto per ricondurre quelli che coinvolgono funzioni abbastanza complesse a funzioni più semplici. Si considerano distintamente il caso di limiti reali e di limiti infiniti. Si intendono fissati in tutto il seguito un sottoinsieme non vuoto X di R, un punto di accumulazione x0 ∈ R per X ed ℓ ∈ R. Teorema 6.4.1 (Primo teorema di confronto) Se ℓ ∈ R e se f : X → R, g : X → R ed h : X → R sono funzioni reali verificanti le seguenti condizioni: 1. Esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, g(x) ≤ f (x) ≤ h(x) ; 2. Esistono i limiti di g ed h in x0 e si ha lim g(x) = ℓ , x→x0 lim h(x) = ℓ . x→x0 Allora, esiste anche il limite di f in x0 e si ha lim f (x) = ℓ . x→x0 Dimostrazione. Sia ε > 0; poiché limx→x0 g(x) = ℓ, esiste un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, ℓ − ε < g(x) < ℓ + ε , e analogamente, poiché limx→x0 h(x) = ℓ, esiste un intorno J2 di x0 tale che, per ogni x ∈ X ∩ J2 r {x0 } ℓ − ε < h(x) < ℓ + ε . Allora, l’insieme J = J0 ∩ J1 ∩ J2 risulta un intorno di x0 e per ogni x ∈ X ∩ J r {x0 }, si ha g(x) ≤ f (x) ≤ h(x) , ℓ − ε < g(x) < ℓ + ε , ℓ − ε < h(x) < ℓ + ε . Da ciò segue ℓ − ε < g(x) ≤ f (x) ≤ h(x) < ℓ + ε , e quindi, dall’arbitrarietà di ε > 0, è verificata la definizione di limite. Teorema 6.4.2 (Secondo teorema di confronto per i limiti) Se f : X → R e g : X → R sono funzioni reali verificanti le seguenti condizioni: 1. Esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, g(x) ≤ f (x) (rispettivamente, f (x) ≤ g(x) ); 6.5 Operazioni sui limiti 135 2. Esiste il limite di g in x0 e si ha limx→x0 g(x) = +∞ (rispettivamente, limx→x0 g(x) = −∞). Allora, esiste anche il limite di f in x0 e si ha limx→x0 f (x) = +∞ (rispettivamente, limx→x0 f (x) = −∞). Dimostrazione. Sia M ∈ R; poiché limx→x0 g(x) = +∞, esiste un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, M < g(x). Allora, considerato l’intorno J = J0 ∩ J1 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha g(x) ≤ f (x) e M < g(x), da cui M < f (x). Dall’arbitrarietà di M ∈ R segue la tesi. Il caso rispettivo si dimostra in maniera analoga. 6.5 Operazioni sui limiti Si studia ora il comportamento del limite rispetto alle operazioni algebriche tra funzioni. Si intendono fissati un sottoinsieme X non vuoto di R, un punto di accumulazione x0 ∈ R per X, ℓ1 ∈ R, ℓ2 ∈ R e due funzioni reali f : X → R e g : X → R. Teorema 6.5.1 (Primo teorema sul limite della somma) Se ℓ1 , ℓ2 ∈ R e lim f (x) = ℓ1 , x→x0 lim g(x) = ℓ2 , x→x0 allora, esiste anche il limite di f + g in x0 e si ha lim (f (x) + g(x)) = ℓ1 + ℓ2 . x→x0 Dimostrazione. Sia ε > 0; dalle ipotesi, segue l’esistenza di un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, ℓ1 − ε/2 < f (x) < ℓ1 + ε/2 e analogamente esiste un intorno J2 di x0 tale che, per ogni x ∈ X ∩ J2 r {x0 }, ℓ2 − ε/2 < g(x) < ℓ2 + ε/2. Allora, considerato l’intorno J = J1 ∩ J2 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha contemporaneamente ℓ1 − ε/2 < f (x) < ℓ1 + ε/2 e ℓ2 − ε/2 < g(x) < ℓ2 + ε/2 e quindi ℓ1 + ℓ2 − ε < f (x) + g(x) < ℓ1 + ℓ2 + ε . Da ciò, essendo ε > 0 arbitrario, segue la tesi. Il teorema precedente riguarda il caso in cui esistono entrambi i limiti delle funzioni f e g e sono numeri reali; esso si può enunciare dicendo che in questo caso il limite della somma di due funzioni è uguale alla somma dei loro limiti. Bisogna tener presente, tuttavia, che tale regola non vale in generale. Nel caso in cui uno solo dei due limiti sia infinito, si ha quanto segue. Capitolo 6: Limiti delle funzioni reali 136 Teorema 6.5.2 (Secondo teorema sul limite della somma) Sono verificate le seguenti condizioni: 1. limx→x0 f (x) = +∞ (rispettivamente, limx→x0 f (x) = −∞); 2. g è limitata inferiormente (rispettivamente, superiormente) in un intorno di x0 , cioè esistono M0 ∈ R ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 , M0 ≤ g(x) (rispettivamente, g(x) ≤ M0 ). Allora, esiste anche il limite di f + g in x0 e si ha lim (f (x) + g(x)) = +∞ x→x0 (rispettivamente, lim (f (x) + g(x)) = −∞) . x→x0 Dimostrazione. Sia M ∈ R; dall’ipotesi 1. si ottiene l’esistenza di un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, M − M0 < f (x). Alora, considerato l’intorno = J0 ∩ J1 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha sia M0 ≤ g(x) che M − M0 < f (x) e pertanto M = M − M0 + M0 < f (x) + g(x). Dall’arbitrarietà di M ∈ R segue la tesi. La dimostrazione del caso rispettivo è analoga. Conviene osservare che l’ipotesi 2. del Teorema 6.5.2 non prevede l’esistenza del limite di g in x0 . Ovviamente, se esiste il limite di g in x0 ed è un numero reale oppure +∞ (rispettivamente, è un numero reale oppure −∞), dalla Proposizione 6.2.2, 1. segue che la funzione g è limitata inferiormente (rispettivamente, superiormente) in un intorno di x0 . Quindi, in questo caso, si ha ancora lim (f (x) + g(x)) = +∞ x→x0 (rispettivamente, lim (f (x) + g(x)) = +∞ ). x→x0 Nel caso in cui si abbia lim f (x) = +∞ , x→x0 lim g(x) = −∞ , x→x0 (o viceversa), non si può concludere nulla sul limite della somma. In tale circostanza, si dice che il limite limx→x0 (f (x)+g(x)) si presenta nella forma indeterminata +∞ − ∞ (oppure −∞ + ∞). Nel seguito si introdurranno gli strumenti opportuni che consentiranno di studiare anche tali tipi di limiti. Si considera ora il caso del limite del prodotto di due funzioni. Anche ora conviene distinguere il caso in cui le due funzioni siano dotate di limiti reali da quello in cui una delle due ammetta un limite infinito. Teorema 6.5.3 (Primo teorema sul limite del prodotto) Se ℓ1 , ℓ2 ∈ R e lim f (x) = ℓ1 , x→x0 lim g(x) = ℓ2 , x→x0 6.5 Operazioni sui limiti 137 allora, esiste anche il limite di f · g in x0 e si ha lim (f (x) · g(x)) = ℓ1 · ℓ2 . x→x0 Dimostrazione. Preliminarmente, si osserva che la funzione g, essendo dotata di limite reale, dalla Proposizione 6.2.2, 1., risulta limitata in un intorno di x0 , e quindi esistono M0 ∈ R ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 , |g(x)| ≤ M0 . Sia ora ε > 0; poiché limx→x0 f (x) = ℓ1 , esiste un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, |f (x) − ℓ1 | < ε/(2(M + 1)), e analogamente, poiché limx→x0 g(x) = ℓ2 , esiste un intorno J2 di x0 tale che, per ogni x ∈ X ∩ J2 r {x0 }, |g(x) − ℓ2 | < ε/(2(|ℓ1 | + 1)). Allora, considerato l’intorno J = J0 ∩ J1 ∩ J2 di x0 , per ogni x ∈ X ∩ J r {x0 }, |f (x) · g(x) − ℓ1 · ℓ2 | = |f (x) · g(x) − ℓ1 · g(x) + ℓ1 · g(x) − ℓ1 · ℓ2 | = |(f (x) − ℓ1 ) · g(x) + ℓ1 · (g(x) − ℓ2 )| ≤ |(f (x) − ℓ1 ) · g(x)| + |ℓ1 · (g(x) − ℓ2 )| |f (x) − ℓ1 | · |g(x)| + |ℓ1 | · |g(x) − ℓ2 | ε ε < · M + |ℓ1 | · 2(M + 1) 2(|ℓ1 | + 1) ε ε < + =ε, 2 2 e da ciò, essendo ε > 0 arbitrario, segue la tesi. = Quindi, anche nel caso del limite del prodotto di due funzioni, si può dire che esistono entrambi i limiti delle funzioni f e g e sono numeri reali, il limite del prodotto di due funzioni è uguale al prodotto dei loro limiti. Tale regola non si può estendere in generale al caso in cui i limiti delle due funzioni non siano entrambi reali. Si ha tuttavia il seguente risultato. Teorema 6.5.4 (Secondo teorema sul limite del prodotto) Se limx→x0 f (x) = +∞ e g è strettamente maggiore di un numero positivo (rispettivamente, strettamente minore di un numero negativo) in un intorno di x0 eccetto al più il punto x0 (cioè, esistono r > 0 ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩J0 r{x0 }, g(x) ≥ r (rispettivamente, g(x) ≤ −r)), allora esiste anche il limite di f · g in x0 e si ha lim f (x) · g(x) = +∞ x→x0 (rispettivamente, lim f (x) · g(x) = −∞) ). x→x0 Dimostrazione. Sia M ∈ R e si supponga, come è lecito, M > 0 (rispettivamente, M < 0). Poiché limx→x0 f (x) = +∞, esiste un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, f (x) > M/r (rispettivamente, f (x) < −M/r). Allora, considerato l’intorno J = J0 ∩ J1 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha M m r (rispettivamente, f (x) · g(x) < − (−r) = M ). r r Dall’arbitrarietà di M ∈ R segue la tesi. f (x) · g(x) > Si osservi che se limx→x0 f (x) = −∞ e g è strettamente maggiore di un numero positivo (rispettivamente, strettamente minore di un numero Capitolo 6: Limiti delle funzioni reali 138 negativo) in un intorno di x0 eccetto al più il punto x0 , allora si può applicare il teorema precedente alle funzioni −f e −g, tenendo presente che f · g = (−f ) · (−g). Conseguentemente si ha limx→x0 f (x) · g(x) = −∞ (rispettivamente, limx→x0 f (x) · g(x) = +∞). Nel caso in cui esista anche il limite della funzione g e sia uguale ad ℓ2 ̸= 0, essa verifica le ipotesi del teorema precedente a causa della Proposizione 6.2.2, 2., e quindi • Se ℓ1 = +∞ ed ℓ2 ∈]0, +∞[∪{+∞} (rispettivamente, ℓ2 ∈]−∞, 0[∪{−∞}), esiste il limite di f · g in x0 ed è uguale a +∞ (rispettivamente, −∞). • Se ℓ1 = −∞ ed ℓ2 ∈]0, +∞[∪{+∞} (rispettivamente, ℓ2 ∈]−∞, 0[∪{−∞}), esiste il limite di f · g in x0 ed è uguale a −∞ (rispettivamente, +∞). Se invece accade che uno dei limiti sia infinito e l’altro sia 0, i teoremi sul prodotto non consentono di concludere nulla. In questo caso, si dice che il limite si presenta nella forma indeterminata 0 · (+∞) oppure 0 · (−∞). Si studia a questo punto il comportamento del limite della funzione reciproca. Teorema 6.5.5 (Teorema sul limite della funzione reciproca) Sia ℓ ∈ R e si supponga che f : X → R sia una funzione reale tale che limx→x0 f (x) = ℓ. Si supponga, inoltre, che per ogni x ∈ X, f (x) ̸= 0 e si 1 1 1 consideri la funzione reciproca : X → R (per ogni x ∈ X, (x) = ). f f f (x) Allora: 1 1 1. Se ℓ ∈ R r {0}, si ha lim = . x→x0 f (x) ℓ 2. Se ℓ = +∞ oppure ℓ = −∞, si ha lim x→x0 1 = 0. f (x) 1 = +∞ e inoltre f (x) i) Se f è positiva in un intorno di x0 eccetto al più il punto x0 (cioè, esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, 1 f (x) > 0), allora lim = +∞. x→x0 f (x) ii) Se f è negativa in un intorno di x0 eccetto al più il punto x0 (cioè, esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, 1 f (x) < 0), allora lim = −∞. x→x0 f (x) iii) Se f non verifica le condizioni i) e ii) precedenti (cioè, in ogni intorno J di x0 esistono due punti x1 , x2 ∈ X ∩ J r {x0 } tali che 3. Se ℓ = 0, si ha lim x→x0 6.5 Operazioni sui limiti 139 f (x1 ) < 0 < f (x2 )), allora il limite della funzione reciproca in x0 non esiste. Dimostrazione. 1. Essendo ℓ ̸= 0, dalla Proposizione 6.2.2, 2., esistono un numero reale r > 0 ed un intorno J0 di x0 tali che, per ogni x ∈ X ∩ J0 r {x0 }, |f (x)| > r. Sia ora ε > 0 e si consideri un intorno J1 di x0 tale che, per ogni x ∈ X ∩J1 r{x0 }, |f (x)−ℓ| < r ·|ℓ|·ε. Allora, considerato l’intorno J = J0 ∩ J1 di x0 , per ogni x ∈ X ∩ J r {x0 }, si ha 1 |f (x) − ℓ| |f (x) − ℓ| r · |ℓ| · ε 1 − = ≤ ≤ =ε f (x) ℓ |f (x)| · |ℓ| r · |ℓ| r · |ℓ| e ciò, essendo ε > 0 arbitrario, completa la dimostrazione del primo caso. 2. Sia ε > 0. Sia nel caso ℓ = +∞ oppure ℓ = −∞, si ha comunque limx→x0 |f (x)| = +∞ e pertanto, posto M = 1/ε, esiste un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, |f (x)| > M . Osservato che M > 0, si ha, per ogni x ∈ X ∩ J r {x0 }, 1 1 ≤ =ε f (x) M e da ciò, essendo ε > 0 arbitrario, segue il caso 2. 3. Si dimostra innanzitutto che limx→x0 |1/f (x)| = +∞. Infatti, sia M > 0 e si ponga ε = 1/M ; poichè limx→x0 f (x) = 0, esiste un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, |f (x)| ≤ ε, da cui |1/f (x)| ≥ 1/ε = M . Dall’arbitrarietà di M > 0, segue la prima parte della tesi. noindent i) Si supponga ora che esista un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, f (x) > 0. Allora, poichè f e |f | coincidono in X ∩ J0 r {x0 }, da quanto dimostrato preliminarmente e dal carattere locale del limite segue limx→x0 1/f (x) = limx→x0 |1/f (x)| = +∞. ii) Si dimostra in maniera analoga al caso precedente (tenendo presente che in questo caso f = −|f | in X ∩ J0 r {x0 }. iii) Si supponga, per assurdo, che il limite della funzione reciproca esista e sia uguale ad un numero ℓ1 ∈ R. Dalla Proposizione 6.2.2, 2., se fosse ℓ1 ∈]0, +∞[∪+∞, la funzione f verificherebbe l’ipotesi i), mentre se fosse ℓ1 ∈] − ∞, 0[∪−∞, la funzione f verificherebbe l’ipotesi ii). Quindi dovrà essere necessariamente ℓ1 = 0. Da quanto dimostrato preliminarmente, segue lim |f (x)| = lim x→x0 x→x0 1 = +∞ |1/f (x)| e ciò contraddice il fatto che limx→x0 f (x) = 0. Quando il limite della funzione è 0 e si vuole calcolare il limite della funzione reciproca, è dunque necessario studiare il segno della funzione f (o equivalentemente della reciproca di f ) in un intorno del punto x0 per poter decidere in quale sottocaso ci si trova. Il Teorema 6.5.5 consente di concludere in ogni caso come si comporta il limite della funzione reciproca; non vi sono quindi forme indeterminate a tale proposito. Si esamina ora il caso del quoziente di due funzioni. In questo caso, essendo f /g = f · (1/g), dallo studio del limite della funzione reciproca e da quello del limite del prodotto di due funzioni, si deduce direttamente il comportamento del limite della funzione quoziente. Capitolo 6: Limiti delle funzioni reali 140 Tuttavia, tali teoremi non consentono di determinare il comportamento della funzione quoziente in tutti i possibili casi; infatti, se le funzioni f e g tendono entrambe a 0 oppure entrambe a ±∞, non si può prevedere nulla. In tali casi si dice che il limite del quoziente si presenta in una delle seguenti forme indeterminate 0 , 0 +∞ , +∞ +∞ , −∞ −∞ , +∞ −∞ ,. −∞ Tutti i risultati esposti valgono anche per i limiti sinistri (rispettivamente, destri) nel caso in cui x0 sia un punto di accumulazione a sinistra (rispettivamente, a destra), purché si sostituiscano gli intorni di x0 con intorni sinistri (rispettivamente, destri) tanto negli enunciati quanto nelle dimostrazioni. Si considera infine il caso delle funzioni composte. Teorema 6.5.6 (Limite delle funzioni composte) Siano X e Y sottoinsiemi non vuoti di R ed f : X → R e g : Y → R funzioni reali tali che f (X) ⊂ Y . Sia x0 un punto di accumulazione per X e si supponga che: 1. limx→x0 f (x) = y0 , con y0 ∈ R punto di accumulazione per Y . 2. Esiste un intorno J0 di x0 tale che, per ogni x ∈ X ∩ J0 r {x0 }, f (x) ̸= y0 . 3. limy→y0 g(y) = ℓ, con ℓ ∈ R. Allora, la funzione composta g ◦ f : X → R è dotata di limite in x0 e si ha lim (g ◦ f )(x) = ℓ . x→x0 Dimostrazione. Sia I un intorno di ℓ. Dall’ipotesi 3. segue l’esistenza di un intorno I ′ di y0 tale che, per ogni y ∈ Y ∩I ′ r{y0 }, g(y) ∈ I. Poiché I ′ ∈ I(y0 ), dall’ipotesi 1. esiste un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, f (x) ∈ I ′ . Si consideri ora l’intorno J = J0 ∩ J1 di x0 , dove J0 è l’intorno previsto nell’ipotesi 2. Per ogni x ∈ X ∩ J r {x0 }, si ha f (x) ∈ Y (in quanto f (X) ⊂ Y ), f (x) ∈ I ′ (in quanto x ∈ X ∩ J1 r {x0 }) e, infine, f (x) ̸= y0 (in quanto x ∈ X ∩ J0 r {x0 }). Quindi, risulta f (x) ∈ Y ∩ I ′ r {y0 } e conseguentemente (g ◦ f )(x) = g(f (x)) ∈ I. Dall’arbitrarietà dell’intorno I di ℓ, segue la tesi. L’ipotesi 2. è automaticamente soddisfatta se y0 = ±∞, e non è necessaria nel caso in cui y0 ∈ Y e limy→y0 g(y) = g(y0 ) (cioè, come si vedrà in seguito, g è continua in y0 ). 6.6 Limiti delle funzioni monotone 141 Formalmente, applicare il teorema precedente significa effettuare la sostituzione y = f (x) e tener conto del fatto che y → y0 quando x → x0 . Tale modo di esprimersi è molto frequente nelle applicazioni; tuttavia, bisogna sempre verificare la condizione f (x) = y ̸= y0 per x ̸= x0 in un opportuno intorno di x0 . 6.6 Limiti delle funzioni monotone Le funzioni monotone hanno proprietà molto interessanti riguardo l’esistenza dei limiti sinistri e destri, evidenziate dal risultato seguente. Teorema 6.6.1 (Teorema sul limite delle funzioni monotone) Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione a sinistra (rispettivamente, a destra) per X ed f : X → R una funzione reale monotona. Allora, esiste il limite sinistro (rispettivamente, destro) di f in x0 si ha:1 1. Se f è crescente: lim f (x) = x→x− 0 sup ( lim+ f (x) = f (x) , x→x0 x∈X, x<x0 inf f (x) ); sup f (x) ). x∈X, x>x0 2. Se f è decrescente: lim f (x) = x→x− 0 inf x∈X, x<x0 ( lim+ f (x) = f (x) , x→x0 x∈X, x>x0 Dimostrazione. Si considera per brevità solamente il caso 1. in cui f è crescente (il caso 2. può essere dedotto dal caso 1. applicato alla funzione −f ). Si ponga, per brevità, ℓ = supx∈X, x<x0 f (x) (rispettivamente, ℓ = inf x∈X, x>x0 f (x). Si supponga dapprima che ℓ = +∞ (rispettivamente, ℓ = −∞). Dunque, in questo caso la funzione non è limitata superiormente in X∩] − ∞, x0 [. Per dimostrare che limx→x− f (x) = +∞, si fissi 0 M ∈ R; da quanto osservato, M non può essere un maggiorante di f (X∩] − ∞, x0 [) e quindi deve esistere x1 ∈ X, x1 < x0 tale che M < f (x1 ). Per ogni x ∈ X∩]x1 , x0 [, dalla crescenza di f , si ha M < f (x1 ) ≤ f (x). Ciò, per l’arbitrarietà di M ∈ R, dimostra che limx→x− f (x) = +∞. 0 Nel caso rispettivo la funzione f non è limitata inferiormente a destra di x0 . Pertanto, fissato M ∈ R, esso non può essere un minorante di f (X∩]x0 , +∞[) e quindi deve esistere x1 ∈ X, x0 < x1 tale che f (x1 ) < M . Allora, per ogni x ∈ X∩]x0 , x1 [, si ha, dalla crescenza di f , f (x) ≤ f (x1 ) < M . Per l’arbitrarietà di M ∈ R, deve essere limx→x+ f (x) = −∞. 0 1 Per convenzione, se Y ⊂ X si scrive sup f (x) = +∞ per indicare che f|Y non è x∈Y limitata superiormente in Y e analogamente inf f (x) = −∞ per indicare che f|Y non x∈Y è limitata inferiormente in Y . Nel teorema in esame si considera Y = X∩] − ∞, x0 [ (rispettivamente, Y = X∩]x0 , +∞[). Capitolo 6: Limiti delle funzioni reali 142 Si supponga ora ℓ ∈ R e si fissi ε > 0; dalla seconda proprietà dell’estremo superiore, esiste x1 ∈ X, x1 < x0 tale che ℓ − ε < f (x1 ). Per ogni x ∈ X∩]x1 , x0 [, si ha da un lato x1 < x per cui, dalla crescenza di f, ℓ − ε < f (x1 ) ≤ f (x) e dall’altro x < x0 per cui, dalla prima proprietà dell’estremo superiore, f (x) ≤ ℓ < ℓ + ε. Quindi, per ogni x ∈ X∩]x1 , x0 [, si ha ℓ − ε < f (x) < ℓ + ε e ciò, per l’arbitrarietà di ε > 0, comporta limx→x− f (x) = ℓ. 0 Nel caso rispettivo si procede in modo analogo usando le proprietà dell’estremo inferiore. In ogni caso, il teorema precedente garantisce l’esistenza del limite sinistro e destro per una funzione monotona in tutti i punti reali di accumulazione a sinistra e a destra. Se, invece, il punto x0 è di accumulazione sia a sinistra che a destra, si ha il seguente risultato. Corollario 6.6.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione sia a sinistra che a destra per X ed f : X → R una funzione reale monotona. Allora, esistono i limiti sinistro e destro di f in x0 e si ha (6.6.1) lim+ f (x) ∈ R . lim− f (x) ∈ R , x→x0 x→x0 Inoltre, se f è crescente (rispettivamente, decrescente) si ha: lim f (x) ≤ lim+ f (x) x→x− 0 x→x0 (rispettivamente, lim− f (x) ≥ lim+ f (x) ), x→x0 x→x0 (6.6.2) e in più, se x0 ∈ X, si ha anche lim f (x) ≤ f (x0 ) x→x− 0 (rispettivamente, lim− f (x) ≥ f (x0 ) x→x0 ≤ lim+ f (x) (6.6.3) x→x0 ≥ lim+ f (x) ). x→x0 Dimostrazione. . Si supponga f crescente. Per ogni x1 , x2 ∈ X tali che x1 < x0 < x2 (tali elementi esistono in quanto x0 è di accumulazione sia a sinistra che a destra), si ha f (x1 ) ≤ f (x2 ); dall’arbitrarietà di x1 ∈ X, x1 < x0 , risulta anche supx∈X, x<x0 f (x) ≤ f (x2 ) (conseguentemente tale estremo superiore è reale) e da quest’ultima, essendo x2 ∈ X, x0 < x2 arbitrario, segue supx∈X, x<x0 f (x) ≤ inf x∈X, x>x0 f (x). Dal Teorema 6.6.1 segue la (6.6.2). Infine, se x0 ∈ X, si può osservare che, per ogni x ∈ X, x < x0 , si ha f (x) ≤ f (x0 ) da cui la prima delle (6.6.3) e inoltre, per ogni x ∈ X, x0 < x, si ha f (x0 ) ≤ f (x) da cui la seconda delle (6.6.3). Ovviamente, anche se è garantita sia l’esistenza del limite sinistro che destro in un punto x0 di accumulazione sia a sinistra che a destra, non si può dire nulla per quanto riguarda l’esistenza del limite in x0 ; il limite esiste 6.7 Limiti delle funzioni elementari 143 se e solo se i limiti da destra e da sinistra coincidono e, in tal caso, dalla (6.6.3) segue anche lim f (x) = f (x0 ) . (6.6.4) x→x0 Quindi una funzione monotona definita in un punto x0 di accumulazione sia a sinistra che a destra, non può avere in x0 un limite diverso dal valore f (x0 ). Se il punto x0 non è di accumulazione sia a sinistra che a destra, questo non vale più; ad esempio, basta considerare la funzione crescente { x−1, x ∈ [−1, 0[ ; f (x) = 0, x=0, nel punto x0 = 0. Nel caso in cui x0 = ±∞, si ha il seguente risultato analogo al Teorema 6.6.1; la dimostrazione è del tutto analoga a quella del Teorema 6.6.1 e viene omessa per brevità. Teorema 6.6.3 Siano X un sottoinsieme di R non limitato superiormente (rispettivamente, inferiormente) ed f : X → R una funzione reale monotona. Allora esiste il limite di f in +∞ (rispettivamente, in −∞) e si ha: 1. Se f è crescente: lim f (x) = sup f (x) x→+∞ (rispettivamente, x∈X lim f (x) = inf f (x) ). x→−∞ x∈X 2. Se f è decrescente: lim f (x) = inf f (x) x→+∞ x∈X (rispettivamente, lim f (x) = sup f (x) ). x→−∞ x∈X In Figura 6.1 è rappresentata una funzione decrescente definita in tutto R che ha limite +∞ in −∞ ed un limite reale ℓ in +∞. 6.7 Limiti delle funzioni elementari Visto il carattere locale del limite, il Teorema 6.6.1 studiato nella sezione precedente può essere applicato più in generale a funzioni monotone in un intorno sinistro o destro del punto x0 nel caso in cui x0 sia reale oppure in un intorno di +∞ o −∞ nel caso in cui x0 = +∞ o x0 = −∞. In tal modo è possibile calcolare i limiti delle funzioni elementari nei punti di accumulazione per l’insieme di definizione. Si elencano ora brevemente tali limiti. Capitolo 6: Limiti delle funzioni reali 144 y l x Figura 6.1: Limiti di una funzione monotona. 6.7.1 Funzioni potenza ad esponente intero positivo Si consideri la funzione potenza fn : R → R. Allora • Se x0 ∈ R, si ha lim xn = xn0 . x→x0 • Se x0 = +∞, si ha lim xn = +∞. x→+∞ • Se x0 = −∞, si ha lim = +∞ se n è pari e lim xn = −∞ se n è x→−∞ x→−∞ dispari. Basta infatti applicare quanto osservato preliminarmente osservando che n è dispari la funzione potenza è strettamente crescente, mentre n è pari è strettamente crescente in [0, +∞[ e strettamente decrescente in ] − ∞, 0]. In tutti i punti reali, si possono cosı̀ ricavare i limiti sinistri e destri; poiché questi coincidono, si ottiene il limite della funzione. Lo stesso tipo di ragionamento si applica anche nei casi che seguono. 6.7.2 Funzioni radice Si consideri la funzione radice f1/n . Allora: 6.7 Limiti delle funzioni elementari 145 1/n • Se x0 ∈ R+ , si ha lim x1/n = x0 . x→x0 Se n è dispari, la stessa uguaglianza vale per ogni x ∈ R. • Se x0 = +∞, si ha lim x1/n = +∞. Se n è dispari, si ha anche x→+∞ lim x1/n = −∞. x→−∞ 6.7.3 Funzioni potenza ad esponente intero negativo Si consideri la funzione potenza ad esponente intero negativo f−n : R r {0} → R. Allora • Se x0 ∈ R r {0}, si ha lim 1/xn = 1/xn0 x→x0 • Se x0 = 0 ed n è pari, si ha lim 1/xn = +∞. Se n è dispari, si ha x→0 lim+ 1/xn = +∞ e lim 1/xn = −∞; conseguentemente, il limite x→0 lim 1/xn non esiste x→0− x→0 • Se x0 = +∞ oppure x0 = −∞, si ha lim 1/xn = 0. x→±∞ 6.7.4 Funzioni potenza ad esponente reale Si consideri la funzione potenza ad esponente reale fr :]0, +∞[→ R con r ∈ R. Allora • Se x0 > 0, si ha lim xr = xr0 . x→x0 • Se x0 = 0 ed r > 0, si ha lim xr = 0 (= xr0 ). Se r < 0, si ha x→0 lim xr = +∞. x→0 • Se x0 = +∞ ed r > 0, si ha lim xr = 0. lim xr = +∞. Se r < 0, si ha invece x→+∞ x→+∞ 6.7.5 Funzioni esponenziali Sia a > 0, a ̸= 1 e si consideri la funzione esponenziale expa : R → R. Allora • Se x0 ∈ R, si ha lim ax = ax0 . x→x0 • Se x0 = +∞ ed a > 1, si ha invece lim ax = 0. x→+∞ lim ax = +∞. Se 0 < a < 1, si ha x→+∞ Capitolo 6: Limiti delle funzioni reali 146 • Se x0 = −∞ ed a > 1, si ha lim ax = +∞. lim ax = 0. Se 0 < a < 1, si ha x→−∞ x→−∞ 6.7.6 Funzioni logaritmo Sia a > 0, a ̸= 1 e si consideri la funzione logaritmo loga :]0, +∞[→ R. Allora • Se x0 > 0, si ha lim loga x = loga x0 . x→x0 • Se x0 = 0 ed a > 1, si ha lim loga x = −∞. Se 0 < a < 1, si ha invece x→0 lim loga x = +∞. x→0 • Se x0 = +∞ ed a > 1, si ha lim loga x = +∞. Se 0 < a < 1, si ha lim loga x = −∞. x→+∞ x→+∞ 6.7.7 Funzioni trigonometriche Per quanto riguarda le funzioni seno, coseno, tangente e cotangente, la proprietà di monotonia non è verificata in un intorno di alcuni punti ed il corrispondente limite non esiste. Per il momento ci si limita a segnalare tale eventualità, in quanto la relativa dimostrazione sarà molto più semplice come applicazione della caratterizzazione sequenziale del limite (Teorema 7.1.3). • Se x0 ∈ R, si ha lim sin x = sin x0 . Se x0 = +∞ oppure x0 = −∞, il x→x0 limite lim sin x non esiste. x→±∞ • Se x0 ∈ R, si ha lim cos x = cos x0 . Se x0 = +∞ oppure x0 = −∞, x→x0 il limite lim cos x non esiste. x→±∞ • Se x0 ∈ R, x0 ̸= π/2 + kπ, k ∈ Z, si ha lim tan = tan x0 . Se x0 = x→x0 π/2 + kπ con k ∈ Z, il limite non esiste e si ha e lim x→π/2+kπ + lim x→π/2+kπ − tan x = +∞ tan x = −∞. Infine, se x0 = +∞ oppure x0 = −∞, il limite della tangente in x0 non esiste. • Se x0 ∈ R, x0 ̸= kπ, k ∈ Z, si ha lim cot x = cot x0 . Se x0 = kπ con k ∈ Z, il limite non esiste e si ha x→x0 lim cot x = −∞ e x→kπ − lim cot x = x→kπ + +∞. Infine, se x0 = +∞ oppure x0 = −∞, il limite della cotangente in x0 non esiste. 6.8 Limiti di polinomi e funzioni razionali 6.7.8 147 Funzioni trigonometriche inverse Infine, si considerano le funzioni arcoseno, arcocoseno, arcotangente e arcocotangente. Allora • Se x0 ∈ [−1, 1], si ha lim arcsin x = arcsin x0 . x→x0 • Se x0 ∈ [−1, 1], si ha lim arccos x = arccos x0 . x→x0 • Se x0 ∈ R, si ha lim arctan x = arctan x0 . Se x0 = +∞, allora x→x0 lim arctan x = π/2 e infine, se x0 = −∞, si ha x→+∞ −π/2. lim arctan x = x→−∞ • Se x0 ∈ R, si ha lim arccot x = arccot x0 . Se x0 = +∞, allora x→x0 lim arccot x = 0 e infine, se x0 = −∞, si ha lim arccot x = π. x→+∞ 6.8 x→−∞ Limiti di polinomi e funzioni razionali Le operazioni sui limiti applicate alle funzioni elementari consentono il calcolo dei limiti nella maggior parte dei casi in cui non si presentano forme indeterminate. Conoscendo i limiti delle funzioni potenza ad esponente intero positivo, è immediato calcolare il limite di un polinomio. Tale limite ha senso per ogni x0 ∈ R in quanto i polinomi sono definiti in tutto R. Sia P (x) = a0 + · · · + an xn con a0 , . . . , an ∈ R, an ̸= 0, un polinomio di grado n. Allora 1. Se x0 ∈ R, si ha lim P (x) = P (x0 ). x→x0 2. Se x0 = ±∞, si ha { lim P (x) = lim an xn = x→+∞ x→+∞ { n lim P (x) = lim an x = x→−∞ x→−∞ +∞ , se an > 0 ; −∞ , se an < 0 ; +∞ , se (−1)n an > 0 ; −∞ , se an < 0 ; (si osservi che (−1)n an > 0 se n e pari e an > 0 oppure se n è dispari e an < 0). L’ultima uguaglianza si ottiene facilmente mettendo in evidenza il termine an xn (si ottiene il limite del prodotto di due funzioni di cui una è un infinito e l’altra tende ad 1). 148 Capitolo 6: Limiti delle funzioni reali Un altro caso abbastanza semplice e di notevole interesse è quello delle funzioni razionali. Siano P : R → R un polinomio di grado n e Q : R → R un polinomio di grado m aventi la forma P (x) = a0 + · · · + an xn , Q(x) = b0 + · · · + bm xm , con an ̸= 0 e bm ̸= 0. Posto X = {x ∈ R | Q(x) ̸= 0}, si considera la funzione razionale R : X → R definita ponendo, per ogni x ∈ X, R(x) = P (x) Q(x) Poiché X differisce da R al più per un numero finito di punti, tutti gli elementi di R sono di accumulazione per X. Ha senso quindi considerare il limite lim x→x0 P (x) Q(x) per ogni x0 ∈ R ed anche per x0 = ±∞. Di seguito, si considerano i diversi casi che si possono presentare, che si ottengono tutti applicando i teoremi sul limite della funzione reciproca (Teorema 6.5.5) e sul prodotto (Teoremi 6.5.3–6.5.4) di due funzioni. 1. Caso x0 ∈ X. In questo caso si ha x0 ∈ R, Q(x0 ) ̸= 0 e conseguentemente P (x) P (x0 ) lim = . x→x0 Q(x) Q(x0 ) 2. Caso x0 ∈ R, Q(x0 ) = 0. Si suppone, inoltre, che P (x0 ) ̸= 0 in quanto, se fosse anche P (x0 ) = 0, il rapporto P (x)/Q(x) si potrebbe scrivere nella forma P (x) (x − x0 ) · P1 (x) P1 (x) = = , Q(x) (x − x0 ) · Q1 (x) Q1 (x) con P1 e Q1 polinomi opportuni di grado n−1 e rispettivamente m−1 ed il limite si ricondurrebbe a quello del rapporto tra i polinomi P1 e Q1 ; tale procedimento si potrebbe reiterare fino a trovare almeno uno dei due polinomi diverso da 0 in x0 . Premesso ciò, nel caso Q(x0 ) = 0 e P (x0 ) ̸= 0, la funzione reciproca tende a 0 e quindi, per il Teorema 6.5.5, è necessario studiare il segno del rapporto P (x)/Q(x) in un intorno del punto x0 . Poiché una funzione razionale cambia segno al più un numero finito di volte (in quanto 6.9 Limiti notevoli 149 cosı̀ si comportano i polinomi al numeratore ed al denominatore), si hanno i seguenti casi possibili: i) Se in un intorno del punto x0 , il rapporto P (x)/Q(x) è positivo, si ha P (x) lim = +∞ . xt ox0 Q(x) ii) Se in un intorno del punto x0 , il rapporto P (x)/Q(x) è negativo, si ha P (x) = −∞ . lim xt ox0 Q(x) iii) Se il rapporto P (x)/Q(x) cambia segno nel punto x0 , il limite P (x) limxt ox0 Q(x) non esiste. In questo caso, tuttavia, il rapporto P (x)/Q(x) è necessariamente positivo in un intorno sinistro di x0 e negativo in un intorno destro di x0 oppure viceversa (in quanto una funzione razionale può cambiare segno un numero finito di volte) e quindi si ha lim− P (x) P (x) = +∞ , lim+ = −∞ Q(x) Q(x) xt ox0 lim P (x) P (x) = −∞ , lim = +∞ . + Q(x) Q(x) xt ox0 xt ox0 oppure xt ox− 0 3. Caso x0 = +∞ oppure x0 = −∞. Mettendo in evidenza al numeratore ed al denominatore del rapporto P (x)/Q(x) il termine di grado massimo (an xn e bm xm , rispettivamente), si ottiene facilmente P (x) an xn = lim xt o±∞ Q(x) xt o±∞ bm xm lim e da quest’ultima uguaglianza è immediato ottenere il risultato del limite (si evita per brevità di scrivere tutti i possibili sottocasi). 6.9 Limiti notevoli I teoremi sui limiti esaminati fino ad ora non sono applicabili nel caso in cui si presenti una forma indeterminata; le forme indeterminate che si presentano solitamente possono essere riassunte come segue: • Forme indeterminate della somma di due funzioni: +∞−∞, −∞+∞; Capitolo 6: Limiti delle funzioni reali 150 • Forme indeterminate del prodotto di due funzioni: 0 · (±∞), ±∞ · 0; • Forme indeterminate del quoziente di due funzioni: 0 ±∞ , ; 0 ±∞ • Forme indeterminate delle potenze di due funzioni: 2 00 , +∞0 , 1±∞ . I tentativi che si possono effettuare per risolvere un limite che si presenta in una delle forme indeterminate elencate sopra sono di vario genere; tra i metodi più semplici vi sono l’utilizzo dei limiti notevoli, oppure della teoria degli infinitesimi e degli infiniti, della regola di L’Hôpital e della formula di Taylor. Nella presente sezione ci si occupa dei limiti notevoli, mentre nella prossima della teoria degli infinitesimi e degli infiniti. L’utilizzo della regola di l’Hôpital e della formula di Taylor richiede invece la conoscenza del calcolo differenziale. Si elencano ora i limiti notevoli più comunemente utilizzati. 1. lim x→0 sin x = 1. x Infatti, sia 0 < x < π/2. Da semplici considerazioni geometriche, si ha: sin x ≤ x ≤ tan x (infatti, il triangolo OAP di area sin x/2 è contenuto nel settore circolare OAP di area πx/(2π) = x/2 il quale a sua volta è contenuto nel triangolo OAQ di area tan x/2 e confrontare le rispettive aree; vedasi la Figura 6.2). Considerando i reciproci delle diseguaglianze precedenti e moltiplicando tutti i sin x membri per sin x, si ha cos x ≤ ≤ 1. Poichè le funzioni a primo, secondo e x terzo membro sono tutte pari, la stessa diseguaglianza vale se −π/2 < x < 0. Dal primo teorema di confronto (Teorema 6.4.1), tenendo presente che limx→0 cos x = 1 (vedasi la Sezione 6.7.7, si deduce allora la tesi. 2. lim x→0 tan x = 1. x Infatti, tenendo presente il limite 1. precedente, lim x→0 tan x sin x 1 = lim · =1 x→0 x x cos x . 2 Tali forme indeterminate derivano dai limiti del tipo lim g(x) (con f stretx→x0 f (x) tamente positiva) che si possono scrivere al modo seguente: limx→x0 exp(g(x) log f (x)). Pertanto, tali limiti vengono ricondotti al limite del prodotto limx→x0 g(x) log f (x) per il quale si possono presentare le forme indeterminate del prodotto viste sopra; tenendo presente che log f (x) tende a +∞ in +∞, a −∞ in 0 ed a 0 in 1, le forme indeterminate del prodotto si presentano nei seguenti casi: 1) f tende a 0 e g tende a 0; 2) f tende a +∞ e g tende a 0; 3) f tende a 1 e g tende a ±∞. 6.9 Limiti notevoli 151 6 ....................................... ................... ........... ........... ......... . . . . Q . . . ........ ........ . ...... . . . . . . . . . . . ....P .... ...... .... ........ ... . . .......x .... ....... . .. ...... tan x ... .. ....... . sin x .... ...... .... ....... 1 O .. B - A Figura 6.2: Limite notevole sinx/x in 0. 3. lim x→0 1 − cos x 1 = . x2 2 Infatti, tenendo presente il limite 1. precedente, lim x→0 1 − cos x x2 = = 1 1 − cos2 x (1 − cos x)(1 + cos x) = lim 2 x→0 x (1 + cos x) 2 x→0 x2 ( )2 sin x 1 1 lim = 2 x→0 x 2 lim . 4. lim x→0 arcsin x = 1. x Infatti, posto y = arcsin x (da cui x = sin y) e osservato che y → 0 per x → 0 e inoltre che arcsin x ̸= 0 per ogni x ∈ [−1, 1] r {0}, si può applicare il teorema sul arcsin x limite delle funzioni composte (Teorema 6.5.6) dal quale si ricava lim = x→0 x y = 1. lim y→0 sin y 5. lim x→0 arctan x = 1. x Si procede come nel caso precedente ponendo y = arctan x;dal teorema sul limite y arctan x = lim = 1. y→0 tan y x→0 x delle funzioni composte (Teorema 6.5.6) si ottiene lim Come si può facilmente constatare, i limiti notevoli 2.–5. si ottengono tutti dal limite notevole 1. applicando i teoremi sulle varie operazioni sui limiti. Si studia ora un altro limite notevole dal quale sarà possibile derivarne diversi altri. Capitolo 6: Limiti delle funzioni reali 152 Innanzitutto, è necessaria una breve premessa riguardante i limiti di successioni che saranno approfonditi nel capitolo seguente. Sia (an )n∈N una successione di numeri reali. Essa può essere riguardata come una funzione reale definita in N; poiché non vi sono punti di accumulazione reali per N ed N non è limitato superiormente, l’unico punto in cui ha senso considerare il limite di una successione è +∞. In conformità con le notazioni assunte per le successioni, tale limite, se esiste, viene denotato con il simbolo lim an . n→+∞ Ovviamente, tutti i teoremi visti sui limiti di funzioni valgono anche per i limiti di successioni. In particolare, dal teorema sul limite delle funzioni monotone, si ottiene che ogni successione (an )n∈N crescente (rispettivamente, decrescente) è dotata di limite e si ha lim an = sup an n→+∞ n∈N (rispettivamente, lim an = inf an ). n→+∞ n∈N In particolare, si è visto che la successione ((1 + 1/n)n )n≥1 , utilizzata per definire il numero di Nepero, è strettamente crescente (Proposizione 4.5.2) e pertanto, da quanto osservato, si ottiene il seguente limite notevole. ( )n 1 6. lim 1+ =e. n→+∞ n Come per il limite notevole 1., anche ora se ne possono ottenere altri derivati. ( )x 1 7. lim 1+ =e. x→+∞ x La differenza rispetto al limite precedente consiste nel fatto che ora la funzione di cui si considera il limite x 7→ (x + 1/x)x è definita in ] − ∞, −1[∪]0, +∞[ e non solo sui numeri naturali. Per ogni x ≥ 1, tenendo presente che [x] ≤ x < [x] + 1 ([x] denota la parte intera di x), si ha )[x] ( ) ( ) ( 1 x 1 [x]+1 1 ≤ 1+ ≤ 1+ 1+ [x] + 1 x [x] e inoltre, dal limite precedente, ( )[x] ( )n 1 1 1+ lim 1+ = lim x→+∞ n→+∞ [x] + 1 n+1 ( )n+1 1 1 = lim 1+ · =e, 1 n→+∞ n+1 1+ n+1 ( ) ( ) ( ) ( ) 1 [x]+1 1 n+1 1 n 1 lim 1+ = lim 1+ = lim 1+ 1+ =e. x→+∞ n→+∞ n→+∞ [x] n n n Allora, dal primo teorema di confronto per i limiti (Teorema 6.4.1 si ottiene la tesi. 6.9 Limiti notevoli ( 8. lim x→−∞ 1+ 1 x 153 )x =e. Si osserva innanzitutto che ha senso considerare tale limite in quanto per x < −1, la base 1 + 1/x è strettamente positiva. Si ha poi, per ogni x < −1, ( ) 1 x 1+ x ( ) ( )|x| ( ) 1 −|x| |x| |x| − 1 + 1 |x| 1− = = |x| |x| − 1 |x| − 1 ( )|x| ( )|x|−1 ( ) 1 1 1 1+ = 1+ 1+ . |x| − 1 |x| − 1 |x| − 1 = = e quindi, posto y = |x| − 1 e osservato che y → +∞ per x → −∞, dal limite notevole precedente si ottiene ( ) ( ) ( ) 1 x 1 y 1 lim 1+ 1+ =e. = lim 1+ x→−∞ y→+∞ x y y 9. Per ogni a ̸= 0: lim x→+∞ ( 1+ a )x = ea , x ( lim x→−∞ 1+ a )x = ea . x Infatti, se a > 0, ( lim x→±∞ 1+ a )x = lim x→±∞ x (( 1+ 1 x/a )x/a )a (( lim y→±∞ 1+ 1 y )y )a = ea , dove si è posto y = x/a. Se a < 0, si procede come sopra tenendo presente che la sostituzione y = x/a comporta y → ∓∞. 10. Per ogni c ̸= 0: lim (1 + cx)1/x = ec . x→0 Infatti, considerando separatamente i limiti da sinistra e da destra e ponendo y = 1/x, si ha ( ) c y 1+ lim (1 + cx)1/x = lim = ec , y→+∞ y x→0+ ( ) c y lim (1 + cx)1/x = lim 1+ = ec , y→−∞ y x→0− 11. Per ogni c ̸= 0 e per ogni a > 0, a ̸= 1: lim x→0 particolare: lim x→0 loga (1 + cx) c = . In x log a log(1 + cx) = c. x Infatti, dal limite notevole precedente, lim x→0 loga (1 + cx) c = lim loga (1 + cx)1/x = loga ec = c · loga e = . x→0 x log a Capitolo 6: Limiti delle funzioni reali 154 12. Per ogni a > 0, a ̸= 1: lim x→0 1. ax − 1 ex − 1 = log a. In particolare: lim = x→0 x x Ponendo y = ax − 1, si ha x = loga (1 + y) e quindi dal limite notevole precedente e dal teorema sul limite della funzione reciproca (Teorema 6.5.5), si ha lim x→0 ax − 1 y = lim = log a . y→0 loga 1 + y x (1 + x)a − 1 = a. x→0 x 13. Per ogni a ̸= 0: lim Si ha, infatti, lim x→0 (1 + x)a − 1 (1 + x)a − 1 log(1 + x) (1 + x)a − 1 = lim = lim . x→0 log(1 + x) x→0 log(1 + x) x x A questo punto, posto y = (1+x)a −1, si ricava 1+y = (1+x)a da cui log(1+y) = a·log(1+x); allora, dal teorema sul limite della funzione reciproca (Teorema 6.5.5), segue ay (1 + x)a − 1 = lim =a lim y→0 log(1 + y) x→0 log(1 + x) e da ciò la tesi. 6.10 Infinitesimi ed infiniti La teoria che si vuole esporre nella presente sezione risulta utile per risolvere gran parte dei limiti in cui compare una forma indeterminata ed in cui non possono essere utilizzati direttamente i teoremi sui limiti studiati fino ad ora. Si considera fissato in tutto il seguito un sottoinsieme non vuoto X di R ed un punto x0 ∈ R di accumulazione per X. Inoltre, tutte le funzioni reali f : X → R prese in considerazione verificano la condizione seguente ∃ J0 ∈ I(x0 ) t.c. ∀ x ∈ X ∩ J0 r {x0 } : f (x) ̸= 0 . (6.10.1) Sia allora f : X → R una funzione reale, si dice che f è un infinitesimo (rispettivamente, un infinito) in x0 se lim f (x) = 0 x→x0 (rispettivamente, lim |f (x)| = +∞ ). x→x0 (6.10.2) Pertanto, una funzione f è un infinitesimo (rispettivamente, un infinito) in x0 se e solo se la funzione reciproca 1/f è un infinito (rispettivamente, un infinitesimo) in x0 (ha senso considerare la funzione reciproca almeno in un intorno del punto x0 a causa dell’ipotesi (6.10.1)). 6.10 Infinitesimi ed infiniti 155 La definizione successiva è alla base delle considerazioni svolte nella presente sezione. Per comodità vengono considerate funzioni definite in uno stesso insieme X, anche se per il carattere locale del limite, si potrebbe supporre che le funzioni in esame siano definite in insiemi aventi la stessa intersezione con un intorno di x0 (privato al più del punto x0 ). Definizione 6.10.1 Siano f : X → R e g : X → R due infinitesimi (rispettivamente, infiniti) in x0 . Si dice che: 1. f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine maggiore di g se lim x→x0 |f (x)| =0 |g(x)| rispettivamente, = +∞ ). (6.10.3) In tal caso si scrive ord f (x) > ord g(x) . x→x0 x→x0 2. f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine minore di g se lim x→x0 |f (x)| = +∞ |g(x)| rispettivamente, = 0 ). (6.10.4) In tal caso si scrive ord f (x) < ord g(x) . x→x0 x→x0 3. f è un infinitesimo (rispettivamente, un infinito) in x0 dello stesso ordine di g (oppure che f e g sono infinitesimi (rispettivamente, infiniti) dello stesso ordine in x0 ) se lim x→x0 |f (x)| =ℓ>0. |g(x)| (6.10.5) Se, in più, è verificata la condizione lim x→x0 f (x) =1, g(x) (6.10.6) allora f e g si dicono equivalenti in x0 . Per denotare la circostanza in cui f e g siano infinitesimi (rispettivamente, infiniti) dello stesso ordine in x0 si usa la scrittura ord f (x) = ord g(x) , x→x0 x→x0 Capitolo 6: Limiti delle funzioni reali 156 mentre per indicare il fatto che f e g sono infinitesimi (rispettivamente, infiniti) equivalenti in x0 si scrive f (x) ∼ g(x) , x → x0 oppure f (x) equiv g(x) . x→x0 4. f e g non sono confrontabili in x0 se non verificano nessuna delle condizioni precedenti. Osservazione 6.10.2 Se si suppone che f e g siano due infinitesimi (rispettivamente, infiniti) in x0 aventi lo stesso ordine e se esiste il limite lim x→x0 f (x) = ℓ ∈ R r {0} , g(x) (6.10.7) allora la funzione f (x) è equivalente in x0 alla funzione ℓ · g(x) Bisogna osservare, tuttavia, che la condizione (6.10.5) non comporta, in generale, l’esistenza del limite (6.10.7). Ad esempio, la funzione (−1)[1/x] /x è un infinito in 0 dello stesso ordine di 1/x, ma le due funzioni non sono equivalenti in 0 (infatti, il limite del rapporto delle due funzioni non esiste mentre in valore assoluto tende ad 1). Le definizioni assunte fino ad ora consentono di confrontare tra loro gli infinitesimi e gli infiniti in un punto; il passo successivo è ora quello di attribuire un valore numerico ad alcuni infinitesimi ed infiniti che saranno presi come campione, in modo da poter confrontare ogni altro infinitesimo o infinito con tali valori numerici. Le funzioni più semplici che conviene considerare come infinitesimi ed infiniti campione sono precisate di seguito. Definizione 6.10.3 Sia α > 0. Si definisce infinitesimo (rispettivamente, infinito) campione in x0 di ordine α, la funzione 1 ), |x − x0 |α |x − x0 |α , (rispettivamente, 1 , |x|α (rispettivamente, |x|α ), se x0 ∈ R , se x0 = ±∞ . Inoltre, se f : X → R è un infinitesimo (rispettivamente, un infinito) in x0 , si dice che f ha ordine maggiore di α (oppure minore, di α oppure uguale ad α) e si scrive ord f (x) > α x→x0 (oppure ord f (x) < α , x→x0 ord f (x) = α ) x→x0 se f ha ordine maggiore dell’infinitesimo (rispettivamente, dell’infinito) campione in x0 di ordine α. Infine, si dice che f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine arbitrariamente piccolo (oppure arbitrariamente grande) se f ha ordine minore (oppure maggiore) di α per ogni α > 0. 6.10 Infinitesimi ed infiniti 157 L’ordine di infinitesimo o di infinito non deve essere considerato come un numero reale; in molti casi si può solo dire che esso è maggiore o minore di un numero α > 0, ma non esiste alcun numero α > 0 per cui l’ordine sia uguale ad α. Gli esempi più importanti da questo punto di vista sono la funzione logaritmo nei punti 0 e +∞ e la funzione esponenziale nei punti ±∞. Si può dimostrare, infatti, il seguente importante risultato. Proposizione 6.10.4 Sia a > 0, a ̸= 1. Allora: 1. La funzione logaritmo loga è un infinito in 0 (da destra) di ordine arbitrariamente piccolo. 2. La funzione logaritmo loga è un infinito in +∞ di ordine arbitrariamente piccolo. 3. Se a > 1 (rispettivamente, se 0 < α < 1), la funzione esponenziale expa è un infinito (rispettivamente, un infinitesimo) in +∞ di ordine arbitrariamente grande. 4. Se a > 1 (rispettivamente, se 0 < α < 1), la funzione esponenziale expa è un infinitesimo (rispettivamente, un infinito) in −∞ di ordine arbitrariamente grande. Si è preferito enunciare la proposizione precedente per la sua importanza nelle applicazioni. La sua dimostrazione, tuttavia, non viene trattata a questo punto in quanto sarà un immediata conseguenza della regola di L’Hôpital. 6.10.1 Operazioni con infinitesimi ed infiniti Lo studio delle operazioni sugli infinitesimi ed infiniti è importante nello studio di un limite a causa della seguente regola di sostituzione. Proposizione 6.10.5 (Regola di sostituzione) Siano f1 , f2 , g1 e g2 infinitesimi (rispettivamente, infiniti) in x0 e si supponga che f1 (x) equiv f2 (x) , g1 (x) equiv g2 (x) . x→x0 x→x0 f1 (x) f2 (x) esiste se e solo se esiste il limite lim e, x→x0 g1 (x) x→x0 g2 (x) in tal caso, i due limiti coincidono. Allora, il limite lim Dimostrazione. Ovvia, in quanto dalle ipotesi assunte, segue lim x→x0 f1 (x) f2 (x) g2 (x) f2 (x) f1 (x) = lim = lim . x→x0 f2 (x) g2 (x) g1 (x) x→x0 g2 (x) g1 (x) Capitolo 6: Limiti delle funzioni reali 158 Si passa ora ad esaminare il comportamento della somma di due infinitesimi o infiniti. Teorema 6.10.6 (Somma di due infinitesimi o infiniti) Siano f e g due infinitesimi (rispettivamente, infiniti) in x0 . Allora: 1. Se ord f (x) < ord g(x), allora la somma f + g è un infinitesimo x→x0 x→x0 (rispettivamente, un infinito) in x0 e si ha f (x) + g(x) equiv f (x) (rispettivamente, f (x) + g(x) equiv g(x) ). x→x0 x→x0 f (x) = ℓ con ℓ ∈ R r {0} e g(x) ℓ ̸= −1, allora la somma f + g è un infinitesimo (rispettivamente, un infinito) in x0 e si ha 2. Se ord f (x) = ord g(x), e se lim x→x0 x→x0 x→x0 f (x) + g(x) equiv (ℓ + 1)g(x) . x→x0 f (x) = −1, allora la somma f + g è un infinitesimo in x0 g(x) di ordine maggiore di quello degli infinitesimi f e g (rispettivamente, non è detto che f +g sia un infinito in x0 ; nel caso ciò accada, l’ordine di f + g è minore di quello degli infiniti f e g). 3. Se limx→x0 Dimostrazione. 1. Supposto ord x→x0 f (x) < ord x→x0 g(x), si ha ( ) f (x) + g(x) g(x) lim = lim 1 + =1 x→x0 x→x0 f (x) f (x) (rispettivamente, lim x→x0 f (x) + g(x) = lim x→x0 g(x) ( ) f (x) + 1 = 1 ), g(x) e da ciò segue la tesi. 2. Nelle ipotesi previste, si ha lim x→x0 3. Infatti, se limx→x0 ℓ 1 f (x) + g(x) = + =1. (ℓ + 1) g(x) ℓ+1 ℓ+1 f (x) = −1, si ha g(x) lim x→x0 e analogamente limx→x0 f (x) + g(x) = −1 + 1 = 0 g(x) f (x)+g(x) g(x) = −1 + 1 = 0. 6.10 Infinitesimi ed infiniti 159 Quindi la somma di due infinitesimi (rispettivamente, infiniti) non aventi lo stesso ordine in x0 , è equivalente all’infinitesimo di ordine minore (rispettivamente, all’infinito di ordine maggiore). Inoltre, nel caso della differenza di due infinitesimi o infiniti equivalenti, si può prevedere il comportamento della somma nel caso in cui le due funzioni non siano equivalenti (vedasi la 2. del teorema precedente); se ciò accade, si può solo affermare la 3. del teorema precedente. Teorema 6.10.7 (Prodotto di due infinitesimi o di due infiniti) Siano f e g due infinitesimi (rispettivamente, due infiniti) in x0 . Allora, il prodotto f · g è un infinitesimo (rispettivamente, un infinito) in x0 avente ordine maggiore sia di f che di g in x0 . In particolare, se α, β > 0, si ha > ord f (x) < α , = x→x0 > ord g(x) < β = x→x0 ⇒ > ord f (x) · g(x) < α + β . = x→x0 Dimostrazione. La dimostrazione è un’ovvia conseguenza delle definizioni di ordine e di infinitesimi ed infiniti campione. A titolo di esempio, si considera il caso in cui f sia un infinitesimo di ordine maggiore di α, g sia un infinitesimo di ordine maggiore di β ed il punto x0 sia reale. In questo caso lim x→x0 |f (x) · g(x)| |f (x)| |g(x)| = lim =0, x→x0 |x − x0 |α |x − x0 |β |x − x0 |α+β cioè ord x→x0 f (x) · g(x) > α + β. In particolare, dal teorema precedente si deduce anche che f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine arbitrariamente piccolo e se g è un è un infinitesimo (rispettivamente, un infinito) in x0 di ordine minore di β per un certo β > 0, allora il prodotto f · g è un infinitesimo (rispettivamente, un infinito) in x0 di ordine arbitrariamente piccolo in x0 . Analogamente, se f è un infinitesimo (rispettivamente, un infinito) in x0 di ordine arbitrariamente grande e se g è un è un infinitesimo (rispettivamente, un infinito) in x0 di ordine maggiore di β per un certo β > 0, allora il prodotto f · g è un infinitesimo (rispettivamente, un infinito) in x0 di ordine arbitrariamente grande in x0 . Se, invece, vengono moltiplicati un infinitesimo ed un infinito, si ha il seguente risultato che si riconosce in maniera analoga. Teorema 6.10.8 (Prodotto di un infinitesimo e di un infinito) Siano f un infinitesimo e g un infinito in x0 . Si ha: 1. Se ord x→x0 f (x) < ord x→x0 1 , allora f · g è un infinito in x0 e si g(x) ha ord f (x) · g(x) < ord g(x) ; x→x0 x→x0 Capitolo 6: Limiti delle funzioni reali 160 in particolare, ord f (x) = α , x→x0 ord g(x) = β x→x0 2. Se ord x→x0 f (x) > ord x→x0 ⇒ ord f (x) · g(x) = β − α . x→x0 1 , allora f · g è un infinitesimo in x0 g(x) e si ha ord f (x) · g(x) < ord f (x) ; x→x0 x→x0 in particolare, ord f (x) = α , x→x0 ord g(x) = β x→x0 ⇒ ord f (x) · g(x) = α − β . x→x0 3. Se f e g hanno lo stesso ordine in x0 , allora il prodotto f · g non è né infinitesimo né infinito in x0 . Lo studio del quoziente tra due infinitesimi e/o infiniti in x0 deriva direttamente dai teoremi precedenti, tenendo presente che dividere per un infinitesimo (rispettivamente, un infinito) in x= equivale a moltiplicare per l’infinito (rispettivamente, infinitesimo) reciproco in x0 (ciò vale anche per gli infinitesimi ed infiniti campione). Osservazione 6.10.9 Nel caso in cui siano noti gli ordini di infinitesimo o di infinito in x0 delle funzioni che figurano in un rapporto, si può utilizzare un metodo pratico abbastanza semplice per determinare l’ordine del rapporto. Innanzitutto si sceglie valutare l’ordine in termini di infinitesimi o infiniti in x0 . Nel primo caso si addizionano tutti gli ordini degli infinitesimi in x0 che compaiono al numeratore e degli infiniti in x0 che compaiono al denominatore e a tale numero si sottrae la somma degli ordini degli infiniti in x0 che compaiono al numeratore e degli infinitesimi in x0 che compaiono al denominatore. Se il numero cosı̀ ottenuto è strettamente positivo, il rapporto sarà un infinitesimo in x0 avente come ordine tale numero, se invece è strettamente negativo, il rapporto sarà un infinito in x0 avente come ordine l’opposto di tale numero (l’ordine in un punto è sempre un numero strettamente positivo). Nel secondo caso, si sceglie di valutare gli infiniti in x0 , si addizionano tutti gli ordini degli infiniti in x0 che compaiono al numeratore e degli infinitesimi in x0 che compaiono al denominatore e poi si sottrae la somma degli ordini degli infinitesimi in x0 che compaiono al numeratore e degli infiniti in x0 che compaiono al denominatore. Se si ottiene un numero strettamente positivo, il rapporto sarà un infinito in x0 avente come ordine tale numero, se invece si ottiene un numero strettamente negativo, il rapporto sarà un infinitesimo in x0 avente come ordine l’opposto di tale numero. 6.10 Infinitesimi ed infiniti 161 In altre parole, ad un infinitesimo di un certo ordine, viene attribuito un ordine di infinito opposto e analogamente, un infinito può essere riguardato come un infinitesimo di ordine opposto. Ad una funzione che nonè né infinitesima nè infinita, ma tende verso un numero reale (diverso da 0) in x0 , viene attribuito un ordine di infinitesimo e di infinito uguale a 0. Tale metodo è basato naturalmente sui teoremi sul prodotto e sul quoziente di infinitesimi ed infiniti. Infine, si esamina il caso delle funzioni composte. Teorema 6.10.10 (Funzioni composte di infinitesimi o infiniti) Siano X e Y sottoinsiemi di R e siano f : X → R e g : Y → R funzioni reali. Si supponga che f (X) ⊂ Y e si consideri la funzione composta g◦f : X → R. Siano, inoltre, x0 ∈ R un punto di accumulazione per X e si supponga che limx→x0 f (x) = y0 , con y0 ∈ R punto di accumulazione per Y . Se la funzione g è un infinitesimo (rispettivamente, un infinito) in y0 , allora la funzione composta è un infinitesimo (rispettivamente, un infinito) in x0 . Inoltre, se α, β > 0, si ha: 1. Se y0 ∈ R: > ord (f (x) − y0 ) < α , = x→x0 > ord g(x) < β = x→x0 ⇒ > ord g(f (x)) < α · β . = x→x0 2. Se y0 = ±∞: > ord f (x) < α , = > ord g(x) < β = x→x0 x→x0 ⇒ > ord g(f (x)) < α · β . = x→x0 Dimostrazione. Il fatto che la funzione composta sia un infinitesimo (rispettivamente, un infinito) in x0 segue direttamente dal Teorema 6.5.6 sul limite delle funzioni composte. Per quanto riguarda la parte rimanente, si considera solo il caso x0 , y0 ∈ R con ord (f (x) − y0 ) = α , x→x0 ord g(x) = β , x→x0 essendo la dimostrazione di tutti gli altri casi del tutto analoga. Nelle ipotesi di sopra, si ha lim x → x0 |g(f (x))| |x − x0 |α·β = = e quindi la tesi è vera. |g(f (x))| |f (x) − y0 |β |f (x) − y0 |β |x − x0 |α·β ( ) |g(y))| |f (x) − y0 | β lim y → y0 lim =1, β α |y − y0 | x→x0 |x − x0 | lim x → x0 Capitolo 7 Successioni e serie numeriche 7.1 Limiti di successioni Nella Sezione 6.9 del Capitolo 6, si è visto come la definizione generale di limite può essere applicata anche al caso delle successioni di numeri reali, potendo queste essere riguardate come funzioni reali definite in N. Avendo N come unico punto di accumulazione +∞, ha senso considerare il limite di una successione (an )n∈N solamente in +∞; nel caso in cui tale limite esista, esso viene denotato con uno dei simboli lim an , n→+∞ lim an n e viene denominato il limite della successione (an )n∈N (si può sottintendere “nel punto +∞” in quanto ciò non dà luogo ad equivoci). Più esplicitamente, una successione (an )n∈N che ammette un limite ℓ ∈ R, viene denominata regolare. Nel caso invece in cui non esista il limite, la successione si dice invece non regolare oppure oscillante. Una successione regolare che ha come limite un numero reale, si dice convergente; se, invece, ha come limite +∞ oppure −∞, essa viene denominata divergente positivamente oppure divergente negativamente. La proprietà di una successione di essere convergente, divergente positivamente o negativamente oppure oscillante viene spesso definita come carattere della successione. Esplicitamente, una successione (an )n∈N risulta 164 Capitolo 7: Successioni e serie numeriche • convergente verso un numero reale ℓ se verifica la seguente condizione: ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : |an − ℓ| < ε ; • divergente positivamente se verifica la seguente condizione: ∀ M ∈ R ∃ ν ∈ N t.c. ∀ n ≥ ν : an > M ; • divergente negativamente se verifica la seguente condizione: ∀ M ∈ R ∃ ν ∈ N t.c. ∀ n ≥ ν : an < M . Ovviamente, il modo in cui è stato definito il limite di una successione consente di applicare tutti i risultati già visti per i limiti di una funzione nel punto +∞. Tuttavia, alcuni di questi risultati assumono una forma particolare nel caso delle successioni ed altri possono essere espressi utilizzando le notazioni tipiche delle successioni. Pertanto, si passano brevemente in rassegna quei risultati che assumono una forma particolare nel caso delle successioni. Uno dei risultati che può essere notevolmente migliorato nel caso delle successioni è quello che riguarda la locale limitatezza. Infatti, la convergenza di una successione comporta la sua limitatezza globale, come di seguito dimostrato. Teorema 7.1.1 Sia (an )n∈N una successione di numeri reali. Allora: 1. (Limitatezza delle successioni convergenti) Se (an )n∈N è convergente, allora (an )n∈N è limitata. 2. Se (an )n∈N è divergente positivamente (rispettivamente, divergente negativamente), allora (an )n∈N è limitata inferiormente (rispettivamente, superiormente). Dimostrazione. 1) Si denoti con ℓ il limite della successione (an )n∈N . Applicando la definizione di limite con ε = 1 si trova ν ∈ N tale che, per ogni n ≥ ν, si abbia ℓ − 1 < an < ℓ + 1. Osservato che l’insieme {a0 , a1 , . . . , aν } è finito, si possono ora considerare i numeri m = min{a0 , a1 , . . . , aν , ℓ − 1}, M = max{a0 , a1 , . . . , aν , ℓ + 1}. Allora, per ogni n ∈ N, si ha m ≤ an ≤ M (ciò si riconosce facilmente distinguendo i casi in cui n ≤ ν e n ≥ ν) e ciò completa la prima parte della dimostrazione. 2) Si supponga che (an )n∈N sia divergente positivamente. Applicando la definizione di limite con M = 0, si trova ν ∈ N tale che, per ogni n ≥ ν, an > 0. Posto m = min{a0 , a1 , . . . , aν , 0}, si ha, per ogni n ∈ N, m ≤ an e quindi la successione è limitata inferiormente. La dimostrazione del caso rispettivo è analoga. Un ulteriore risultato che conviene considerare è l’analogo del Teorema 6.6.3 sul limite delle funzioni monotone, che nel caso delle successioni si esprime come segue. 7.1 Limiti di successioni 165 Teorema 7.1.2 (Teorema sul limite delle successioni monotone) Ogni successione monotona (an )n∈N di numeri reali è regolare; precisamente, se (an )n∈N è crescente (rispettivamente, decrescente), si ha: lim an = sup an , n→+∞ (rispettivamente, n∈N lim an = inf an ). n→+∞ n∈N (7.1.1) Inoltre, se (an )n∈N è anche limitata, essa risulta convergente. Dimostrazione. La prima parte della tesi segue dal Teorema 6.6.3. L’ultima parte deriva dalla (7.1.1) e dal fatto che se una successione è limitata, allora supn∈N an ∈ R (nel caso rispettivo, inf n∈N an ∈ R). Ovviamente, per il carattere locale del limite, il teorema precedente continua a valere anche se si suppone che la successione (an )n∈N sia definitivamente crescente (rispettivamente, definitivamente decrescente); in questo caso, tuttavia, se ν ∈ N è tale che (an )n≥ν sia crescente (rispettivamente, decrescente), la (7.1.1) deve essere sostituita con la seguente: lim an = sup an , n→+∞ (rispettivamente, n≥ν lim an = inf an ). n→+∞ n≥ν Poiché per le successioni valgono teoremi analoghi a quelli visti per i limiti di funzioni, i limiti delle successioni possono spesso essere trattati e risolti nello stesso modo dei limiti di funzioni nel punto +∞. Nel seguito, tuttavia, sarà possibile analizzare alcuni risultati specifici per le successioni. Prima di esaminarli, si studia la seguente caratterizzazione dell’esistenza del limite di una funzione mediante limite di successioni, che costituisce appunto un legame tra limiti di funzioni e limiti di successioni. Teorema 7.1.3 (Caratterizzazione sequenziale del limite) Siano X un sottoinsieme non vuoto di R, x0 ∈ R un punto di accumulazione per X, f : X → R una funzione reale ed ℓ ∈ R. Allora, le seguenti proposizioni sono equivalenti: a) lim f (x) = ℓ. x→x0 b) Se (an )n∈N è una successione di elementi di X r {x0 } (cioè, per ogni n ∈ N, si ha an ∈ X r{x0 }) e se lim an = x0 , allora lim f (an ) = n→+∞ n→+∞ ℓ. Dimostrazione. a) ⇒ b) Sia (an )n∈N una successione di elementi di X r {x0 } tale che limn→+∞ an = x0 . Per dimostrare la b), si fissi un intorno arbitrario I di ℓ; dalla a), si può considerare un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, si abbia f (x) ∈ I. Poiché limn→+∞ an = x0 , in corrispondenza dell’intorno J di x0 , deve esistere ν ∈ N Capitolo 7: Successioni e serie numeriche 166 tale che, per ogni n ≥ ν, risulti an ∈ J. Allora, per ogni n ≥ ν, si ha an ∈ X ∩ J r {x0 } e conseguentemente f (an ) ∈ I. Dall’arbitrarietà dell’intorno I di ℓ, segue la b). b) ⇒ a) Si supponga, per assurdo, che la a) sia falsa. Allora, deve esistere un intorno I di ℓ tale che, comunque si consideri un intorno J di x0 , deve esistere x ∈ X ∩ J r {x0 } verificante la condizione f (x) ∈ / I. Si ponga ora, per ogni n ∈ N, 1 1 , x0 + [, se x0 ∈ R ; ]x0 − n + 1 n + 1 Jn = ]n, +∞[ , se x0 = +∞ ; ] − ∞, −n[ , se x0 = −∞ . Per ogni n ∈ N, Jn è un intorno di x0 e quindi deve esistere an ∈ X ∩ Jn r {x0 } tale che f (an ) ∈ / I. Si consideri ora la successione (an )n∈N di elementi di X r {x0 }. Si riconosce facilmente che essa tende verso x0 ; infatti, per ogni n ∈ N, risulta |an − x0 | < 1/(n + 1) se x0 ∈ R, mentre an > n oppure an < −n se x0 = +∞ oppure x0 = −∞. Allora, dalla b) segue che la successione (f (an ))n∈N deve tendere verso ℓ e ciò è assurdo in quanto, per ogni n ∈ N, f (an ) ∈ / I. Osservazione 7.1.4 La caratterizzazione precedente viene spesso utilizzata per dimostrare che un limite assegnato non esiste. A tal fine si può procedere in vari modi: 1. Si trovano due successioni (an )n∈N e (bn )n∈N di elementi di X r {x0 } tali che lim an = x0 e lim bn = x0 , mentre lim f (an ) = ℓ1 e n→+∞ n→+∞ n→+∞ lim f (bn ) = ℓ2 con ℓ1 ̸= ℓ2 . n→+∞ In questo caso il limite di f in x0 non può esistere perché dal Teorema 7.1.3 dovrebbe essere da un lato uguale ad ℓ1 e dall’altro ad ℓ2 e ciò contraddice il teorema sull’unicità del limite. 2. Si trova una successione (an )n∈N di elementi di X r{x0 } che verifica la condizione lim an = x0 , mentre il lim f (an ) non esiste. In questo n→+∞ n→+∞ caso il limite di f in x0 non può esistere altrimenti, dal Teorema 7.1.3, dovrebbe coincidere con il limite della successione (f (an ))n∈N . 3. Si trova una successione (an )n∈N di elementi di X r {x0 } che verifica la condizione lim an = x0 e per cui la successione (f (an ))n∈N sia lin→+∞ mitata superiormente (rispettivamente, inferiormente), mentre la funzione non è limitata superiormente (rispettivamente, inferiormente) in alcun intorno di x0 . In questo caso, per la proprietà di limitatezza locale, il limite di f in x0 potrebbe essere solamente +∞ (rispettivamente, −∞) e ciò comporterebbe, per il Teorema 7.1.3, che anche la successione (f (an ))n∈N dovrebbe essere divergente positivamente (rispettivamente, negativamente) in contraddizione con quanto assunto. Le ipotesi sopra previste sono soddisfatte se si trova una successione 7.1 Limiti di successioni 167 di elementi di X r {x0 } tendente verso x0 e in cui il limite è reale (oppure la funzione è limitata) ed un’altra successione tendente verso x0 di punti di accumulazione per X in ognuno dei quali la funzione è un infinito; in questo caso la contraddizione deriva dal fatto che avendo trovato una successione con un limite reale oppure in cui la funzione è limitata l’eventuale limite deve essere esso stesso reale; d’altra parte se vi è una successione di punti in ognuno dei quali la funzione non è limitata, la funzione non risulta limitata in alcun intorno di x0 in contrasto con la proprietà di limitatezza locale (ad esempio, si consideri il limite lim 1/(x cos x) e le successioni an = 2nπ e bn = π/2 + nπ). x→+∞ Si considera ora qualche esempio. Esempi 7.1.5 1. Utilizzando il teorema precedente, si dimostra che il limite lim sin x x→+∞ non esiste. Infatti, si considerino le successioni (π/2 + 2nπ)n∈N e (3π/2 + 2nπ)n∈N , entrambe divergenti positivamente. Si ha ( ) ) (π 3 + 2nπ = 1 , lim sin π + 2nπ = −1 lim sin n→+∞ n→+∞ 2 2 e quindi, per l’Osservazione 7.1.4, 1., il limite in esame non esiste. 2. Più in generale, l’esempio precedente dimostra che una funzione periodica non costante non ammette limite nei punti +∞ e −∞. Infatti, si consideri una funzione f : X → R periodica non costante di periodo ω > 0 e siano x1 ∈ X e x2 ∈ X tali che f (x1 ) ̸= f (x2 ). Si considerino le successioni (x1 + nω)n∈N e (x2 + nω)n∈N ; esse sono entrambe divergenti positivamente e inoltre limn→+∞ f (x1 + nω) = f (x1 ), limn→+∞ f (x2 + nω) = f (x2 ) con f (x1 ) ̸= f (x2 ); allora, per l’Osservazione 7.1.4, 1., il limite limx→+∞ f (x) non può esistere. Per quanto riguarda il punto −∞, si procede in modo analogo considerando le successioni (x1 − nω)n∈N e (x2 − nω)n∈N . Dal presente risultato si ricava in particolare che le funzioni trigonometriche sin, cos, tan e cot non ammettono limite nei punti ±∞. 3. Si studi il limite tan2 x + 1 . x→−∞ x2 lim Capitolo 7: Successioni e serie numeriche 168 Si consideri la funzione f (x) := (tan2 x + 1)/x2 e la successione divergente negativamente (−nπ)n∈N . Tenendo presente che tan2 (−nπ) = 0 per ogni n ∈ N, se esistesse il limite assegnato, dovrebbe essere lim f (x) = lim f (−nπ) = 0 . x→−∞ n→+∞ Tuttavia, considerato un arbitrario intorno J di −∞, esiste sicuramente k ∈ Z tale che π/2 + kπ ∈ J. Poiché limx→π/2+kπ |f (x)| = +∞, la funzione non è limitata in un intorno di π/2 + kπ e quindi in J. Per l’Osservazione 7.1.4, 3., il limite assegnato non può esistere. ◃ Si espongono ora alcuni risultati riguardanti la successione delle medie aritmetiche e quella delle medie geometriche di una successione assegnata. Se (an )n∈N è una successione di numeri reali, la successione delle medie aritmetiche di (an )n∈N è la successione (A[an ])n∈N definita ponendo A[an ] := a0 + · · · + an n+1 n 1 ∑ ak ). n+1 (= k=0 Inoltre, se an > 0 per ogni n ∈ N,1 si può definire la successione (G[an ])n∈N delle medie geometriche di (an )n∈N ponendo G[an ] : √ n+1 a0 · · · an (= v u n u∏ t ak ). n+1 k=0 I risultati seguenti sono noti come teoremi di Cesàro. Teorema 7.1.6 (Teorema di Cesàro sulla media aritmetica) Sia (an )n∈N una successione regolare di numeri reali e sia ℓ ∈ R il suo limite. Allora la successione (A[an ])n∈N delle medie aritmetiche di (an )n∈N è anch’essa regolare e tende verso ℓ. Dimostrazione. Si supponga dapprima che (an )n∈N sia convergente, cioè che ℓ ∈ R e sia ε > 0; allora esiste ν1 ∈ N tale che ∀ n ≥ ν1 : |an − ℓ| < ( Poiché la successione 1 n+1 ∑ν1 k=0 ) |ak − ℓ| ℓ| è costante, esiste ν2 ∈ N tale che ∀ n ≥ ν2 : 1 Ciò n∈N ε . 2 tende a 0 in quanto il termine ∑ν1 k=0 |ak − ν1 1 ∑ ε |ak − ℓ| < . n + 1 k=0 2 assicura che la successione delle medie geometriche non sia definitivamente nulla. 7.1 Limiti di successioni 169 Allora, per ogni n > max{ν1 , ν2 }, si ha n 1 ∑ ak − ℓ n + 1 k=0 ≤ n 1 ∑ |ak − ℓ| n + 1 k=0 = ν1 1 ∑ 1 |ak − ℓ| + n + 1 k=0 n+1 < n ∑ |ak − ℓ| k=ν1 +1 ε 1 ε ε ε + (n − ν1 ) < + = ε . 2 n+1 2 2 2 Dall’arbitrarietà di ε > 0, segue la tesi. Si supponga ora che (an )n∈N sia divergente positivamente e sia M > 0. Allora esiste ν1 ∈ N tale che ∀ n ≥ ν1 : an > 4M . Procedendo come prima, si può considerare ν2 ∈ N tale che ∀ n ≥ ν2 : ν1 ∑ 1 ak < M . n + 1 k=0 Allora, per ogni n > max{2ν1 + 1, ν2 }, si ha innanzitutto (n − 1)/2 ≥ ν1 da cui n − ν1 ≥ n − (n − 1)/2 = (n + 1)/2 e pertanto n 1 ∑ ak n + 1 k=0 = ≥ > ≥ ν1 1 ∑ 1 ak + n + 1 k=0 n+1 − n ∑ ak k=ν1 +1 ν1 ∑ 1 1 ak + n + 1 k=0 n+1 n ∑ ak k=ν1 +1 1 (n − ν1 ) 4M n+1 1 n+1 −M + 4M = −M + 2M = M . n+1 2 −M + Dall’arbitrarietà di M > 0, segue la tesi anche in questo caso. Se la successione è divergente negativamente, si procede in maniera analoga e quindi la tesi è completamente dimostrata. Il risultato precedente non può essere invertito, nel senso che la successione delle medie aritmetiche può risultare regolare pur non essendolo la successione di partenza, come ad esempio per la successione ((−1)n )n∈N . In alcuni casi l’utilizzo del risultato precedente consente di studiare più agevolmente la regolarità di una successione assegnata. Ad esempio, si consideri la successione (log n!/n)n≥1 ; poiché log n! = log n + log(n−1)+· · ·+log 2+log 1, essa è la media aritmetica della successione (log n)n≥1 , la quale diverge positivamente; dal teorema precedente, segue pertanto che anche (log n!/n)n≥1 è divergente positivamente. Teorema 7.1.7 (Teorema di Cesàro sulla media geometrica) Sia (an )n∈N una successione regolare di numeri reali strettamente positivi e sia ℓ ∈ R il suo limite. Allora la successione (G[an ])n∈N delle medie geometriche di (an )n∈N è anch’essa regolare e tende verso ℓ. Capitolo 7: Successioni e serie numeriche 170 Dimostrazione. Si supponga dapprima che ℓ ∈]0, +∞[. Sia 0 < ε < 3; poiché la successione (an /ℓ)n∈N converge verso 1, esiste ν1 ∈ N tale che ε an ε ∀ n > ν1 : 1 − < <1+ ; 3 ℓ 3 da ciò segue, per ogni n ≥ ν1 + 1, ( ( ( ε )n+1 ( ε )n−ν1 aν +1 an ε )n−ν1 ε )n+1 1− < 1− < 1 ··· < 1+ < 1+ 3 3 ℓ ℓ 3 3 e quindi ε < 3 √ aν1 +1 an ε ··· <1+ . ℓ ℓ 3 ( √ ) converge verso 1 e quindi esiste ν2 ∈ N Anche la successione n+1 a0 /ℓ · · · aν1 /ℓ 1− n+1 n∈N √ ε a0 aν ε ∀ n ≥ ν2 : 1 − < n+1 ··· 1 < 1 + . 3 ℓ ℓ 3 Allora, per ogni n ≥= max{ν1 + 1, ν2 }, si ha √ √ ( ε )2 ( ε) ( ε) a0 aν aν1 +1 an 1− = 1− 1− < n+1 · · · 1 n+1 ··· = 3 3 3 ℓ ℓ ℓ ℓ tale che e analogamente √ n+1 √ n+1 a0 an ··· ℓ ℓ ( an ε )2 a0 ··· < 1+ . ℓ ℓ 3 Da ciò segue, essendo ε < 3, √ 2 a0 an 1 2 1 n+1 ··· − 1 < ε + ε2 < ε + 3ε = ε . ℓ ℓ 3 9 3 9 Dall’arbitrarietà di ε > 0, si ottiene √ n+1 a · · · a n 0 lim = lim n→+∞ n→+∞ ℓ √ n+1 an a0 ··· =1 ℓ ℓ e quindi la tesi nel caso in esame. Si supponga ora ℓ = +∞ e sia (M > 0. Allora esiste ν1 ∈ N) tale che an > 2M per √ ogni n ≥ ν1 . Poiché la successione n+1 a0 /(2M ) · · · aν1 /(2M ) tende ad 1, si può n∈N trovare ν2 ∈ N tale che, per ogni n ≥ ν2 , √ 1 aν 1 3 a0 1 = 1 − < n+1 ··· 1 − 1 < 1 + = . 2 2 2M 2M 2 2 Allora, posto ν = max{ν1 , ν2 }, per ogni n ≥ ν, si ha √ 1 aν a0 √ M = 2M · < 2M · n+1 · · · 1 = n+1 a0 · · · aν1 2M (2M )−(ν1 +1)/(n+1) 2 2M 2M √ √ (n−ν1 )/(n+1) n+1 a · · · a = < n+1 a0 · · · aν1 (an )(n−ν1 )/(n+1) ν1 (2M ) 0 e dall’arbitrarietà di M > 0, segue la tesi anche in questo caso. Tenendo presente che gli elementi della successione (an )n∈N sono strettamente positivi, resta da considerare solamente il caso in cui ℓ = 0. Se ciò accade, si ha limn→+∞ 1/an = +∞ e quindi, per il caso precedente, √ 1 1 n+1 ··· = +∞ , lim n→+∞ a0 aν1 7.1 Limiti di successioni 171 √ cioè limn→+∞ 1/ n+1 a0 · · · aν1 = +∞; considerando il limite della successione reciproca √ si ottiene quindi limn→+∞ n+1 a0 · · · aν1 = 0 e la tesi è completamente dimostrata. Anche per le medie geometriche, il risultato precedente non può essere invertito, in quanto esistono successioni di numeri reali strettamente positivi che non sono regolari, ma per le quali le successioni delle medie geometriche lo sono. √ √ ◃ Ad esempio, si consideri il limite limn→+∞ n n!; il termine generale n n! è la media geometrica della successione (n) √n≥1 che è divergente positivamente. Dal Teorema 7.1.7, anche la successione ( n n!)n≥1 risulta divergente positivamente. 7.1.1 Successioni estratte Come si è visto in precedenza molti risultati visti per le funzioni assumono una forma ed una terminologia particolare per le successioni; in accordo a ciò, si preferisce introdurre per le successioni il seguente concetto di successione estratta anzichè far ricorso a quello più generale di funzione composta. Definizione 7.1.8 Sia (an )n∈N una successione di numeri reali e si consideri una successione strettamente crescente (k(n))n∈N di numeri naturali. Allora la successione (ak(n) )n∈N viene denominata successione estratta di (an )n∈N . Denotando la successione (an )n∈N come funzione a : N → R e la successione (k(n))n∈N come funzione k : N → N, la successione estratta (ak(n) )n∈N risulta essere la funzione composta a ◦ k : N → R; tuttavia, nel caso delle successioni si richiede in più la stretta crescenza di (k(n))n∈N in modo che le proprietà del limite della successione di partenza si conservino per le successioni estratte. ( 2 ) +2n+1 ◃ Ad esempio, la successione 2n n+2 si ottiene come estratta dalla n∈N ( 2 ) +1 , considerando la successione di interi strettamente successione nn+1 n∈N crescente (2n + 1)n∈N . ◃ Si osserva che se (k(n))n∈N è una successione strettamente crescente di numeri naturali, allora, per ogni n ∈ N, si ha n ≤ k(n). Infatti, se n = 0 la proprietà è vera e supposto che essa valga per n ∈ N, dalla stretta crescenza si ha k(n) < k(n + 1) da cui n + 1 ≤ k(n) + 1 ≤ k(n + 1). Da tale semplice proprietà segue il comportamento del limite delle successioni estratte descritto nella proposizione successiva. Capitolo 7: Successioni e serie numeriche 172 Proposizione 7.1.9 Sia (an )n∈N una successione regolare di numeri reali. Allora, ogni successione estratta (ak(n) )n∈N di (an )n∈N è anch’essa regolare e si ha lim ak(n) = lim an . n→+∞ n→+∞ Dimostrazione. Sia ℓ ∈ R il limite della successione (an )n∈N e sia I un intorno di ℓ; allora esiste ν ∈ N tale che an ∈ I per ogni n ≥ ν. Da quanto osservato per ogni n ≥ ν si ha anche k(n) ≥ n ≥ ν e quindi ak(n) ∈ I. Dall’arbitrarietà dell’intorno I di ℓ, segue la tesi. ◃ Come conseguenza della Proposizione 7.1.9, tutte le successioni estratte di una successione regolare convergono verso lo stesso limite. Si deduce che una successione (an )n∈N che ammette un’estratta non regolare oppure con due estratte regolari aventi limiti diversi, non può essere regolare. Questo metodo viene spesso utilizzato per dimostrare che il limite di una successione assegnata non esiste. Ad esempio, si studi il limite della successione ((−1)n an )n∈N , dove (an )n∈N è una successione regolare tendente ad un numero ℓ ̸= 0. Allora, considerando l’estratta corrispondente alla successione strettamente crescente (2n)n∈N , si ottiene la successione (a2n )n∈N che tende verso ℓ; considerando invece l’estratta corrispondente alla successione strettamente crescente (2n + 1)n∈N , si ottiene la successione (−a2n+1 )n∈N che tende verso −ℓ. Si deduce che il limite della successione assegnata non esiste in quanto ℓ ̸= 0. 7.1.2 Massimo e minimo limite Se una successione non è regolare, si ricorre ad ulteriori strumenti che consentono di studiarne il comportamento, tra cui ad esempio il massimo e minimo limite, definiti come segue. Si consideri una successione (an )n∈N . Se essa non è limitata superiormente, il suo massimo limite viene assunto, per definizione, uguale a +∞ e analogamente, se essa non è limitata inferiormente, il suo minimo limite viene assunto uguale a −∞. Si supponga ora che (an )n∈N sia limitata superiormente (rispettivamente, inferiormente); per ogni k ∈ N, la successione estratta (ak )n≥k (ottenuta considerando gli indici k(n) = k + n) ha lo stesso comportamento della successione (an )n∈N . Si considerino le quantità e′′k := sup an n≥k (rispettivamente, e′k := inf an ). n≥k 7.1 Limiti di successioni 173 È immediato riconoscere che la nuova successione (e′′k )k∈N è decrescente e quindi essa risulta regolare; il limite ℓ′′ := lim e′′k k→+∞ (= inf e′′k ) k∈N viene denominato massimo limite della successione (an )n∈N e viene denotato con uno dei seguenti simboli lim sup an , n→+∞ lim′′ n→+∞ an , lim an . n→+∞ Poichè (e′′k )k∈N è decrescente, il massimo limite è sicuramente diverso da +∞. Nel caso rispettivo, la successione (e′k )k∈N è crescente ed il suo limite ℓ′ := lim e′k k→+∞ (= sup e′k ) k∈N viene denominato minimo limite della successione (an )n∈N e viene denotato con uno dei seguenti simboli lim inf an , n→+∞ lim′ n→+∞ an , lim an . n→+∞ Poichè (e′k )k∈N è crescente, il minimo limite è sicuramente diverso da −∞. Il massimo ed il minimo limite sono unici ed a differenza del limite di una successione esistono sempre. ◃ Nella proposizione successiva vengono enunciate le proprietà caratteristiche del massimo e minimo limite, alle quali conviene ricorrere nelle applicazioni. Proposizione 7.1.10 Sia (an )n∈N una successione di numeri reali e sia ℓ ∈ R. Allora, le seguenti proposizioni sono equivalenti: a) ℓ = lim sup an (rispettivamente, ℓ = lim inf an ); n→+∞ b) n→+∞ 1) ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : an < ℓ + ε (rispettivamente, ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : ℓ − ε < an ). 2) ∀ ε > 0 ∀ ν ∈ N ∃ n ≥ ν t.c. ℓ − ε < an (rispettivamente, ∀ ε > 0 ∀ ν ∈ N ∃ n ≥ ν t.c. an < ℓ + ε ). Dimostrazione. Si considera solamente il primo caso, essendo quello rispettivo del tutto analogo. a)⇒ b) Poiché ℓ ∈ R, la successione (an )n∈N è necessariamente limitata superiormente. Fissato ε > 0, dalla seconda proprietà dell’estremo inferiore esiste ν ∈ N tale che e′′ ν < ℓ + ε; conseguentemente, dalla prima proprietà dell’estremo superiore si ha, per ogni n ≥ ν, an < ℓ + ε. Ciò dimostra la proprietà 1). Siano ora ε > 0 e ν ∈ N fissati. Dalla Capitolo 7: Successioni e serie numeriche 174 prima proprietà dell’estremo inferiore, si ha ℓ − ε < e′′ ν ; conseguentemente, dalla seconda proprietà dell’estremo superiore si deduce l’esistenza di n ≥ ν tale che ℓ − ε < an . b)⇒ a) Basta far vedere che ℓ verifica le proprietà caratteristiche dell’estremo inferiore della successione (e′′ k )k∈N . Infatti, sia k ∈ N; dalla 2) della b), per ogni ε > 0 esiste n ∈ N ′′ tale che n ≥ k e ℓ − ε < an ; da ciò segue ℓ − ε < supn≥k an = e′′ k e quindi ℓ ≤ ek + ε; ′′ poiché ε > 0 è arbitrario, si deve avere ℓ ≤ ek . Ciò dimostra che ℓ verifica la prima proprietà caratteristica dell’estremo inferiore. Sia ora ε > 0; dalla 1) della b), esiste ν ∈ N tale che an < ℓ + ε per ogni n ≥ ν; allora ℓ + ε è un maggiorante della successione (an )n≥ν e quindi deve essere e′′ ν ≤ ℓ + ε; pertanto ℓ verifica anche la seconda proprietà caratteristica dell’estremo inferiore da cui la tesi. ◃ La proprietà 2) della b) si può esprimere equivalentemente nel modo seguente: 2’) Per ogni ε > 0, l’insieme {n ∈ N | ℓ − ε < an } è infinito (rispettivamente, per ogni ε > 0, l’insieme {n ∈ N | an < ℓ + ε}) è infinito. Infatti, si supponga vera la proprietà 2) e si fissi ε > 0. Se, per assurdo, l’insieme {n ∈ N | ℓ−ε < an } fosse finito, esso sarebbe dotato di massimo ν ∈ N. Allora, applicando la proprietà 2) al numero naturale ν + 1 si troverebbe un elemento n ≥ ν + 1 tale che ℓ−ε < an e ciò contraddirebbe il fatto che ν è il massimo {n ∈ N | ℓ−ε < an }. Viceversa, si supponga vera la proprietà 2’) e siano ε > 0 e ν ∈ N. Se, per assurdo, non esistesse alcun elemento n ≥ ν tale che ℓ−ε < an , l’insieme {n ∈ N | ℓ−ε < an } sarebbe contenuto in {0, 1, 2, . . . , ν} e quindi sarebbe finito; ciò contraddice evidentemente la proprietà 2’). ◃ Poiché ovviamente e′k ≤ e′′k per ogni k ∈ N si ha sempre ℓ′ ≤ ℓ′′ . L’uguaglianza del massimo e del minimo limite è caratterizzata dalla proposizione successiva. Proposizione 7.1.11 Se (an )n∈N è una successione di numeri reali, le seguenti proposizioni sono equivalenti: a) La successione (an )n∈N è regolare; b) lim sup an = lim inf an . n→+∞ n→+∞ Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti, risulta lim an = lim sup an = lim inf an . n→+∞ n→+∞ n→+∞ Dimostrazione. Per brevità si denotano con ℓ′′ e rispettivamente ℓ′ il massimo e rispettivamente il minimo limite della successione (an )n∈N . a)⇒ b) Si ponga ℓ = limn→+∞ an . Se ℓ = +∞ si ha e′k = +∞ per ogni k ∈ N e quindi ℓ′ = ℓ′′ = +∞ da cui la tesi. Analogamente, se ℓ = −∞, si ha e′′ k = −∞ per ogni k ∈ N e quindi ancora ℓ′ = ℓ′′ = −∞. Si supponga pertanto ℓ ∈ R; in tal caso, è immediato verificare che ℓ verifica le proprietà caratteristiche sia del massimo che del minimo limite (Proposizione 7.1.10) e quindi ℓ = ℓ′ = ℓ′′ ; da ciò segue anche l’ultima parte della tesi. b)⇒ a) Si ponga ℓ = ℓ′ (= ℓ′′ ). Se ℓ = +∞, si ha ℓ′ = +∞ e quindi, per ogni M ∈ R deve esistere ν ∈ N tale che e′k > M per ogni n ≥ ν; considerando n = ν, dalla definizione 7.1 Limiti di successioni 175 di e′ν segue allora an > M per ogni n ≥ ν e ciò dimostra che la successione (an )n∈N è divergente positivamente. Se ℓ = −∞, si procede in maniera analoga considerando ℓ′′ . Si supponga ora ℓ ∈ R; dalle proprietà caratteristiche del massimo e del minimo limite (Proposizione 7.1.10), segue, per ogni ε > 0, da un lato l’esistenza di ν1 ∈ N tale che an < ℓ + ε per ogni n ≥ ν1 , e dall’altro l’esistenza di ν2 ∈ N tale che ℓ − ε < an per ogni n ≥ ν2 ; posto ν = max{ν1 , ν2 }, per ogni n ≥ ν, si ha allora ℓ − ε < an < ℓ + ε. Dall’arbitrarietà di ε > 0, segue ℓ = limn→+∞ an . ◃ Per dimostrare facilmente la proprietà successiva, conviene osservare che come conseguenza delle proprietà caratteristiche del massimo e del minimo limite enunciate nella Proposizione 7.1.10, si ha anche la seguente, dove ℓ denota il massimo limite (rispettivamente, il minimo limite) della successione (an )n∈N ∀ ε > 0 ∀ ν ∈ N ∃ n ≥ ν t.c. ℓ − ε < an < ℓ + ε . (7.1.2) Infatti, se ℓ è il massimo limite della successione (an )n∈N , fissati ε > 0 e ν ∈ N, dalla proprietà 1) della b) nella Proposizione 7.1.10, si ha l’esistenza di ν1 ∈ N tale che an < ℓ+ε per ogni n ≥ ν1 . Applicando la proprietà 2) della b) nella stessa Proposizione 7.1.10 con max{ν, ν1 } al posto di ν si ottiene l’esistenza di n ≥ max{ν, ν1 } tale che ℓ − ε < an ; dunque n ≥ ν e poiché n ≥ ν1 , per tale n si ha anche an < ℓ + ε, da cui la tesi. Se ℓ è il minimo limite della successione (an )n∈N , si procede ovviamente in maniera analoga. ◃ Si è visto in precedenza che se una successione è regolare, tutte le sue estratte lo sono e tendono verso lo stesso limite (Proposizione 7.1.9). Nel caso generale, si ha il seguente risultato. Proposizione 7.1.12 Sia (an )n∈N una successione di numeri reali e siano ℓ′′ ed ℓ′ il suo massimo limite e rispettivamente il suo minimo limite. Allora esistono almeno due successioni estratte (ak1 (n) )n∈N e (ak2 (n) )n∈N regolari e tali che lim ak1 (n) = ℓ′′ , n→+∞ lim ak2 (n) = ℓ′ . n→+∞ Dimostrazione. Si dimostra solamente l’esistenza dell’estratta (ak1 (n) )n∈N . La successione strettamente crescente (k1 (n))n∈N di numeri naturali viene definita induttivamente applicando la proprietà (7.1.2). Considerando ε = 1 e ν = 0, dalla (7.1.2), si ottiene l’esistenza di k(0) ∈ N tale che ℓ′′ − 1 < ak(0) < ℓ′′ + 1. Si riapplica ora la stessa proprietà (7.1.2) con ε = 1/2 e ν = k(0) + 1 e si ottiene l’esistenza di un elemento k(1) ∈ N, k(1) ≥ ν tale che ℓ′′ − 1/2 < ak(1) < ℓ′′ + 1/2; si osservi che k(1) > k(0) in quanto si è considerato ν = k(0) + 1. Procedendo in questo modo, si può considerare una successione strettamente crescente (k(n))n∈N di interi positivi tale che, per ogni n ∈ N, risulti ℓ′′ − 1/(n + 1) < ak(n) < ℓ′′ + 1/(n + 1). Dal primo teorema di confronto per i limiti segue subito che la successione estratta (ak(n) )n∈N converge verso ℓ′′ . Come conseguenza del risultato precedente, si può enunciare il seguente corollario. Corollario 7.1.13 Sia (an )n∈N una successione di numeri reali. Allora: 176 Capitolo 7: Successioni e serie numeriche 1) Se (an )n∈N non è limitata superiormente, essa ammette un’estratta divergente positivamente. 2) Se (an )n∈N non è limitata inferiormente, essa ammette un’estratta divergente negativamente. 3) Se (an )n∈N è limitata superiormente oppure inferiormente, essa ammette un’estratta convergente. Dimostrazione. Nel primo caso il massimo limite della successione è +∞ e quindi la tesi segue dalla Proposizione 7.1.12 precedente. Il secondo caso è analogo in quanto il minimo limite è −∞. Infine, se la successione è limitata superiormente oppure inferiormente almeno uno tra il massimo limite ed il minimo limite della successione è un numero reale e quindi la tesi segue ancora dalla Proposizione 7.1.12. ◃ A questo punto si può dimostrare facilmente un risultato molto importante per le sue numerose applicazioni. Si osserva innanzitutto che se (an )n∈N è una successione di numeri reali convergente verso un numero reale ℓ e se l’insieme A := {an | n ∈ N} degli elementi della successione è infinito, allora ℓ è un punto di accumulazione per A. Infatti, considerato ε > 0, esiste ν ∈ N tale che an ∈]ℓ − ε, ℓ + ε[ per ogni n ≥ ν. Gli elementi della successione (an )n∈N sono infiniti e quindi deve esistere almeno un n ≥ ν tale che an ̸= ℓ; l’elemento an appartiene dunque all’insieme A∩]ℓ − ε, ℓ + ε[r{ℓ} che risulta pertanto non vuoto. Poiché ε > 0 è arbitrario, si conclude che ℓ è un punto di accumulazione per A. Teorema 7.1.14 (Teorema di Bolzano-Weierstrass) Sia X un sottoinsieme limitato ed infinito di R. Allora X è dotato di almeno un punto di accumulazione. Dimostrazione. L’insieme X è infinito e quindi si può considerare una successione (an )n∈N di elementi di X a due a due distinti; infatti, considerato a0 ∈ X, poiché X è infinito si può considerare poi a1 ∈ X r {a0 }; procedendo in questo modo, supposto di aver definito l’elemento an , si sceglie poi an+1 nell’insieme (infinito) X r {a0 , a1 , . . . , an }. Si ottiene cosı̀ una successione (an )n∈N di elementi di X tale che an ̸= am per ogni n ̸= m e quindi il cui insieme degli elementi è sicuramente infinito. Gli elementi della successione (an )n∈N appartengono all’insieme limitato X e quindi (an )n∈N è anch’essa limitata; dal Corollario 7.1.13, 3), si ottiene l’esistenza di una successione estratta (ak(n) )n∈N della successione (an )n∈N convergente verso un numero reale ℓ. Allora anche (ak(n) )n∈N è una successione di elementi distinti di X e dalle osservazioni preliminari ℓ è un punto di accumulazione per l’insieme dei suoi elementi; ma tale insieme è contenuto in X e quindi ℓ è un punto di accumulazione anche per X. 7.1.3 Criterio di convergenza di Cauchy Il criterio di convergenza di seguito esposto è utile per stabilire la convergenza di una successione senza necessariamente individuarne il limite. 7.1 Limiti di successioni 177 Teorema 7.1.15 (Criterio di Cauchy per le successioni) Sia (an )n∈N una successione di numeri reali. Allora, le seguenti proposizioni sono equivalenti: a) La successione (an )n∈N è convergente. b) La successione (an )n∈N verifica la seguente condizione ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν, ∀ m ≥ ν : |an − am | < ε . Dimostrazione. a)⇒ b) Sia ℓ il limite della successione (an )n∈N e si fissi ε > 0. Allora esiste ν ∈ N tale che |an −ℓ| < ε/2 per ogni n ≥ ν. Conseguentemente, per ogni n, m ≥ ν, si ha |an − am | = |(an − ℓ) + (ℓ − am )| ≤ |an − ℓ| + |am − ℓ| < ε/2 + ε/2 = ε e quindi (an )n∈N verifica la condizione la b). b)⇒ a) Si dimostra innanzitutto che la successione (an )n∈N è limitata. Applicando la proprietà b) con ε = 1, si ottiene l’esistenza di ν ∈ N tale che |an − am | < 1 per ogni n, m ≥ ν; in particolare, per ogni n ≥ ν, si ha aν − 1 < an < aν + 1. Allora, posto m = min{a0 , . . . , aν−1 , aν − 1} ed M = max{a0 , . . . , aν−1 , aν + 1}, si ha m ≤ an ≤ M per ogni n ∈ N e ciò dimostra che la successione (an )n∈N è limitata. Si denotino ora con ℓ′′ ed ℓ′ il massimo limite e rispettivamente il minimo limite della successione (an )n∈N , che per quanto osservato devono essere reali e ℓ′ ≤ ℓ′′ . Si fissi ora ε > 0; dalla b), esiste ν ∈ N tale che |an − am | < ε/3 per ogni n, m ≥ ν. Dalla seconda proprietà caratteristica del massimo limite applicata ad ε/3 e ν (vedasi la b) della Proposizione 7.1.10, esiste n ≥ ν tale che ℓ′′ − ε/3 < an e analogamente, dalla seconda proprietà caratteristica del minimo limite, esiste m ≥ ν tale che am < ℓ′ + ε/3. Allora, poiché n, m ≥ ν, si ha ε 2 ε 2 ε − am + ≤ |an − am | + ε < + ε = ε, 3 3 3 3 3 e conseguentemente ℓ′′ < ℓ′ + ε; poiché ε > 0 è arbitrario, segue ℓ′′ ≤ ℓ′ e quindi ℓ′′ = ℓ′ . ℓ′′ − ℓ′ < an + Dalla Proposizione 7.1.11, si conclude che (an )n∈N è convergente. ◃ Una successione (an )n∈N che verifica la condizione b) del Teorema 7.1.15 precedente viene denominata successione di Cauchy (oppure successione fondamentale). 7.1.4 Massimo e minimo limite per le funzioni Il massimo e minimo limite può essere introdotto anche più in generale per il limite di una funzione arbitraria. Nella presente sezione viene considerata brevemente tale possibilità. Siano X un sottoinsieme di R, x0 ∈ R un punto di accumulazione per X ed f : X → R una funzione reale. Se f non è limitata superiormente in alcun intorno di x0 , il massimo limite viene assunto uguale a +∞ e analogamente se f non è limitata inferiormente in alcun intorno di x0 , il minimo limite viene assunto uguale a −∞. Nel seguito, pertanto, si escluderanno tali casi e, poiché le nozioni che si vogliono introdurre sono di carattere locale, si supporrà che la funzione f sia limitata (altrimenti basta sostituirla con una restrizione ad un opportuno intorno di x0 in cui è limitata). Capitolo 7: Successioni e serie numeriche 178 Se x0 ∈ R, per ogni δ > 0, si definiscono i numeri e′′ (δ) := sup{f (x) | x ∈ X∩]x0 − δ, x0 + δ[r{x0 }} , e′ (δ) := inf{f (x) | x ∈ X∩]x0 − δ, x0 + δ[r{x0 }} . La funzione δ 7→ e′′ (δ) da ]0, +∞[ in R è crescente e la funzione δ 7→ e′ (δ) da ]0, +∞[ in R è decrescente e inoltre, per ogni δ1 > 0, δ2 > 0, risulta e′ (δ1 ) ≤ e′′ (δ2 ). Dal teorema sul limite delle funzioni monotone, si possono considerare i seguenti limiti lim e′′ (δ) δ→0+ (= inf e′′ (δ)) , δ>0 lim e′ (δ) δ→0+ (= sup e′ (δ)) , δ>0 i quali vengono denominati massimo limite e rispettivamente minimo limite di f in x0 e denotati con uno dei seguenti simboli lim sup f (x) , x→x0 lim′′ x→x0 f (x) , lim′ x→x0 f (x) , lim f (x) , x→x0 e rispettivamente lim inf f (x) , x→x0 lim f (x) . x→x0 Se x0 = +∞ (rispettivamente, x0 = −∞), si procede in maniera analoga definendo i seguenti numeri, per ogni c ∈ R, e′′ (c) (rispettivamente, e′′ (c) := sup{f (x) | x ∈ X∩]c, +∞[} := sup{f (x) | x ∈ X∩] − ∞, c[} ) e e′ (c) := inf{f (x) | x ∈ X∩]c, +∞[} (rispettivamente, e′ (c) := inf{f (x) | x ∈ X∩] − ∞, c[} ). La funzione c 7→ e′′ (c) da R in R è ovviamente decrescente (rispettivamente, crescente), mentre la funzione c 7→ e′ (c) da R in R è crescente (rispettivamente, decrescente) e per ogni c1 , c2 ∈ R, risulta e′ (c1 ) ≤ e′′ (c2 ). Il massimo limite ed il minimo limite possono ora essere definiti tramite i seguenti limiti, esistenti sempre per il teorema sul limite delle funzioni monotone lim e′′ (c) , (rispettivamente, lim e′ (c) , (rispettivamente, c→+∞ e c→+∞ lim e′′ (c) ), c→−∞ lim e′ (c) ). c→−∞ 7.2 Serie numeriche 179 ◃ Le proprietà caratteristiche del massimo e del minimo limite di una funzione possono essere ottenute in maniera esattamente analoga a quanto già visto per le successioni. A causa della stretta analogia con il caso delle successioni, ci si limita a questo punto ad enunciare alcune proprietà omettendo le dimostrazioni. Proposizione 7.1.16 Si considerino un sottoinsieme X di R, un punto di accumulazione x0 ∈ R per X ed una funzione reale f : X → R. Allora le seguenti proposizioni sono equivalenti: a) Esiste il limite lim f (x). x→x0 b) lim sup f (x) = lim inf f (x) . x→x0 x→x0 Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti, risulta lim f (x) = lim sup f (x) = lim inf f (x) . x→x0 x→x0 x→x0 ◃ Se X è un sottoinsieme di R, x0 ∈ R è un punto di accumulazione per X ed f : X → R è una funzione reale, si dice che f verifica la condizione di Cauchy in x0 se ∀ ε > 0 ∃ I ∈ I(x0 ) t.c. ∀ x, y ∈ X ∩ I r {x0 } : |f (x) − f (y)| < ε . Teorema 7.1.17 (Criterio di Cauchy per le funzioni) Si considerino un sottoinsieme X di R, un punto di accumulazione x0 ∈ R per X ed una funzione reale f : X → R. Allora, le seguenti proposizioni sono equivalenti: a) Esiste ed è finito il limite lim f (x). x→x0 b) f verifica la condizione di Cauchy in x0 . 7.2 Serie numeriche Lo studio delle serie numeriche trova diverse applicazioni in analisi riguardanti, ad esempio, la possibilità di esprimere le funzioni elementari come somma di funzioni potenza ad esponente intero positivo, con il conseguente vantaggio di ricondurre il calcolo di limiti, derivate ed integrali a quello di funzioni potenza oppure lo stretto legame con la teoria degli integrali impropri su intervalli illimitati. Capitolo 7: Successioni e serie numeriche 180 7.2.1 Definizioni e proprietà preliminari Assegnata una successione (an )n∈N di numeri reali, per ogni m ∈ N, si definisce somma parziale m-esima di (an )n∈N il numero sm definito come segue m ∑ sm := an . n=0 La successione (sn )n∈N viene denominata serie di termine generale nesimo an ; i numeri sm , m ∈ N, vengono anche denominati somme parziali della serie. Una serie viene in genere indicata con il simbolo +∞ ∑ an n=0 e talvolta anche con a0 + a1 + · · · + an + . . . Il carattere della successione (sn )n∈N viene indicato come carattere della serie; pertanto, si dice che una serie è regolare, convergente, divergente positivamente oppure divergente negativamente se tale è la successione delle sue somme parziali. Una serie non regolare viene denominata indeterminata. Nel caso in cui la serie sia regolare, il limite della successione delle somme parziali viene denominato +∞ ∑ somma della serie e denotato ancora con il simbolo an ; sarà chiaro dal n=0 contesto l’uso di tale simbolo. Esplicitamente, se s ∈ R, si ha s= +∞ ∑ an ⇐⇒ ∀ ε > 0 ∃ ν ∈ N t.c.∀ n ≥ ν : s − n=0 Analogamente, si ha se n ∑ ak < ε . k=0 +∞ ∑ an = +∞ (rispettivamente n=0 ∀ M ∈ R ∃ ν ∈ N t.c.∀ n ≥ ν : +∞ ∑ an = −∞) se e solo n=0 n ∑ ak > M (rispettivamente < M ). k=0 Una prima condizione necessaria per la convergenza di una serie può essere ricavata facilmente dalle definizioni assunte. Proposizione 7.2.1 Sia (an )n∈N una successione di numeri reali e si sup∑+∞ ponga che la serie n=0 an sia convergente. Allora limn→+∞ an = 0. 7.2 Serie numeriche 181 Dimostrazione. Si consideri la successione (sn )n∈N delle somme parziali della serie ∑ +∞ n=0 an e sia s ∈ R la somma della stessa serie. Allora lim an = n→+∞ lim (sn − sn−1 ) = n→+∞ lim sn − n→+∞ lim sn−1 = s − s = 0. n→+∞ ◃ La condizione precedente non è in generale sufficiente ad assicurare la convergenza di una serie. Ad esempio, la successione (log(1 + 1/n))n≥1 è ovviamente infinitesima, ma la somma parziale n-esima è data da ( ) 3 n+1 3 4 n+1 sn = log 2 + log + · · · + log = log 2 · · · · · = log(n + 1) , 2 n 2 3 n ∑+∞ e quindi la serie n=0 log(1 + 1/n) è divergente positivamente. Esempio 7.2.2 (Serie geometrica) Un esempio importante per il seguito è dato dalla serie +∞ ∑ an , n=0 con a ∈ R, la quale viene denominata serie geometrica di ragione a. Per ogni n ∈ N, denotata con sn la somma parziale n-esima, risulta an+1 − 1 = (a − 1)(an + an−1 + · · · + a + 1) = (a − 1)sn , e quindi, supposto a ̸= 1, sn = an+1 − 1 . a−1 Da ciò consegue direttamente che, se |a| < 1, la serie è convergente e si ha +∞ ∑ n=0 an = lim sn = n→+∞ 1 . 1−a Se a ≥ 1 oppure a ≤ −1, la successione (an )n∈N non è infinitesima e quindi dalla Proposizione 7.2.1 la serie geometrica non può essere convergente. Precisamente, se a ≥ 1, essa diverge positivamente (infatti, per ogni n ∈ N, risulta sn ≥ n), mentre se a ≤ −1, la serie è indeterminata; infatti, si ha sn ≥ 1 per n pari ed sn ≤ 0 per n dispari. ◃ Una prima condizione necessaria e sufficiente per la convergenza di una serie può essere ricavata dal criterio di convergenza di Cauchy per le successioni.∑Sia (an )n∈N una +∞ successione di numeri reali e sia n ∈ N. Il resto n-esimo della serie n=0 an (oppure serie resto di ordine n) è per definizione la nuova serie +∞ ∑ k=n+1 ak . Capitolo 7: Successioni e serie numeriche 182 Si riconosce facilmente che una serie e le sue serie resto hanno lo stesso carattere e inoltre, se una delle due è convergente risulta +∞ ∑ an = sn + n=0 +∞ ∑ ak . k=n+1 ∑ Dall’uguaglianza precedente segue che se la serie +∞ n=0 an è convergente, allora necessariamente la successione (rn )n∈N dei resti n-esimi è infinitesima. Infatti, denotata con s ∑+∞ la somma della serie n=0 an , deve essere limn→+∞ rn = limn→+∞ s − sn = 0. La somma parziale p-esima del resto n-esimo rn viene denominata resto parziale della serie di indici n e p e viene denotato con rn,p ; quindi rn,p = n+p ∑ ak = sn+p − sn . k=n+1 Si può ora enunciare il seguente criterio di convergenza di Cauchy, la cui dimostrazione è immediata conseguenza del Teorema 7.1.15 applicato alla successione delle somme parziali. Teorema 7.2.3 (Criterio di Cauchy per le serie numeriche) Se (an )n∈N è una successione di numeri reali, le seguenti proposizioni sono equivalenti: a) La serie +∞ ∑ an è convergente. n=0 b) lim sup |rn,p | = 0 . n→+∞ p∈N Esempio 7.2.4 (Serie armonica) Si consideri la serie +∞ ∑ 1 , n + 1 n=0 la quale viene denominata serie armonica. Per ogni n, p ∈ N si ha |rn,p | = n+p ∑ k=n+1 1 1 1 1 1 = + + ··· + ≥p ; k+1 n+2 n+3 n+p+1 n+p+1 considerando in particolare p = n + 1, si ottiene |rn,n+1 | ≥ n+1 1 = 2n + 2 2 e quindi la b) del Teorema 7.2.3 non può essere verificata. Si conclude che la serie armonica non è convergente. Osservando inoltre che la successione delle somme parziali risulta crescente, la serie dovrà essere divergente positivamente. ◃ Alcune semplici operazioni algebriche sulle serie possono essere dedotte dai teoremi sui limiti ∑ di successioni. Si considerino due successioni (an )n∈N e (bn )n∈N di numeri reali ∑+∞ e le serie +∞ n=0 an e n=0 bn si ha quanto segue 7.2 Serie numeriche 183 1) Se le due serie sono entrambe convergenti, anche la loro somma convergente e si ha +∞ +∞ +∞ ∑ ∑ ∑ (an + bn ) = an + bn ; n=0 n=0 ∑+∞ n=0 (an + bn ) è n=0 2) Se una delle due serie è divergente positivamente (rispettivamente, negativamente), e se le somme parziali dell’altra sono limitate inferiormente (rispettivamente, superiormente) (in particolare, se l’altra serie è convergente), allora la serie ∑+∞ n=0 (an +bn ) risulta divergente positivamente (rispettivamente, negativamente). ∑+∞ ∑+∞ 3) Se la serie n=0 an è convergente e se λ ∈ R, allora anche la serie n=0 λan è convergente e si ha +∞ +∞ ∑ ∑ λan = λ an . n=0 n=0 ∑ 4) Se la serie +∞ (rispettivamente, negativamente) n=0 an è divergente positivamente ∑+∞ e se λ > 0, allora anche la serie positivamente (rispetn=0 λan è divergente ∑+∞ tivamente, negativamente). Se invece λ < 0, la serie n=0 λan è divergente negativamente (rispettivamente, positivamente). 7.2.2 Serie a termini positivi ∑+∞ Una serie n=0 an tale che an ≥ 0 per ogni n ∈ N viene denominata serie a termini positivi ; se an > 0 per ogni n ∈ N si dice anche che la serie è a termini strettamente positivi . Per tali serie è possibile stabilire diversi criteri di convergenza, la cui validità può essere estesa alle serie a termini definitivamente positivi per le quali la condizione an ≥ 0 è verificata per ogni n ≥ ν, con ν ∈ N opportuno ed anche, con ovvie modifiche, alle serie negative oppure definitivamente negative. Inoltre conviene tenere presente che una serie a termini positivi può essere sempre ricondotta ad una serie a termini strettamente positivi trascurando i termini uguali a 0. Pertanto non sarà restrittivo all’occorrenza supporre che la serie sia a termini strettamente positivi anziché semplicemente positivi. Una proprietà rilevante delle serie a termini positivi è il fatto che la successione delle somme parziali risulta crescente e pertanto essa potrà essere convergente (se le somme parziali sono limitate superiormente) oppure divergente positivamente (se le somme parziali non sono∑ limitate superior+∞ mente). In tema di notazioni, per indicare che una serie n=0 an a termini positivi è convergente, si scrive spesso +∞ ∑ an < +∞ . n=0 Da quanto osservato segue anche che una serie indeterminata deve avere necessariamente infiniti termini strettamente positivi ed infiniti termini strettamente negativi. Capitolo 7: Successioni e serie numeriche 184 Un primo criterio elementare di confronto si può ricavare direttamente dai teoremi di confronto per i limiti. Proposizione 7.2.5 (Primo criterio di confronto per le serie a termini positivi) ∑+∞ ∑+∞ Si considerino due serie n=0 an e n=0 bn a termini positivi e si supponga che esista ν ∈ N tale che, per ogni n ≥ ν, risulti an ≤ bn . Allora ∑+∞ ∑+∞ 1) Se la serie n=0 bn è convergente, lo è anche la serie n=0 an e risulta +∞ +∞ ∑ ∑ an ≤ bn . n=0 2) Se la serie ∑+∞ n=0 bn . ◃ ∑+∞ n=0 n=0 an è divergente positivamente, lo è anche la serie Il criterio precedente può essere applicato nel caso seguente. Corollario 7.2.6 (Secondo confronto per le serie a termini positivi) ∑di ∑+∞criterio +∞ Si considerino due serie n=0 bn a termini strettamente positivi e si supn=0 an e ponga che esista il limite limn→+∞ an /bn = ℓ. Allora 1) Se 0 < ℓ < +∞, le due serie hanno lo stesso carattere. ∑+∞ ∑+∞ bn è convergente, anche la serie 2) Se ℓ = 0 e se la serie n=0 an è conn=0 ∑+∞ an è divergente positivamente, anche la serie vergente. Se invece la serie n=0 ∑+∞ n=0 bn è divergente positivamente. ∑ ∑ converge, a è convergente, anche la serie +∞ 3) Se ℓ = +∞ e se la serie +∞ n=0 bn ∑ ∑+∞ n=0 n mentre se la serie n=0 bn è divergente positivamente anche la serie +∞ n=0 an è divergente positivamente. Dimostrazione. 1) Dalla definizione di limite, esiste ν ∈ N tale che ℓ/2 < an /bn < 3ℓ/2 per ogni n ≥ ν, da cui ℓ 3ℓ b n < an < bn . 2 2 Applicando il primo criterio di confronto (Proposizione 7.2.5) tenendo conto di entrambe le diseguaglianze, si deduce che le due serie hanno lo stesso carattere. 2) Dalla definizione di limite, esiste ν ∈ N tale che −1 < an /bn < 1 per ogni n ≥ ν, da cui, in particolare, an < bn . Allora, dalla Proposizione 7.2.5, segue interamente la tesi. 3) Basta applicare il caso 2) invertendo i ruoli delle due serie e tenendo presente che, nel caso in esame, limn→+∞ bn /an = 0. ◃ A questo punto si possono enunciare i criteri di convergenza maggiormente utilizzati nelle applicazioni. Teorema 7.2.7 (Criterio del rapporto di D’Alembert per le serie a termini positivi) +∞ ∑ Sia an una serie a termini strettamente positivi. Allora n=0 7.2 Serie numeriche 185 ∑ an+1 < 1, allora la serie an è convergente. n→+∞ an n=0 ( ) an+1 2) Se la successione è definitivamente maggiore o uguale di an n∈N +∞ ∑ 1, allora la serie an è divergente positivamente. +∞ 1) Se lim sup n=0 an+1 ; poiché ℓ′′ < 1, si può considerare ℓ′′ < an q < 1 e dalla prima proprietà caratteristica del massimo limite (applicata con ε := q − ℓ′′ ) esiste ν ∈ N tali che, per ogni n ≥ ν, an+1 /an < q, da cui an+1 < qan . Si riconosce ora che, per ogni n ≥ ν, risulta an ≤ q n−ν aν ; infatti, tale proprietà è ovviamente vera per n = ν e, supposta vera per un ∑ certo n ≥ ν, si ha an+1 < q · q n−ν aν = q n+1−ν aν . Poiché n 0 < q < 1, la serie geometrica +∞ n=0 q è convergente e quindi, per la Proposizione 7.2.5, ∑ lo è anche la serie +∞ a . n=0 n 2) Dalle ipotesi fatte, segue che la successione (an )n∈N è definitivamente crescente e Dimostrazione. 1) Si ponga ℓ′′ := lim sup n→+∞ quindi, essendo a termini positivi, essa non può essere infinitesima. Dalla Proposizione ∑ 7.2.1, segue che la serie +∞ n=0 an non è convergente e quindi essa deve essere divergente positivamente. an+1 ◃ Si supponga che esista il lim e lo si denoti con ℓ. Allora, la n→+∞ an ∑+∞ serie n=0 an è convergente se ℓ < 1 (in tal caso infatti ℓ′′ = ℓ < 1) ed è divergente positivamente se ℓ > 1 (in tal caso, infatti, si ha an+1 /an > 1 definitivamente); se ℓ = 1, non si può invece dire nulla. ◃ Ad esempio, si consideri la serie +∞ n ∑ a , n! n=0 a∈R. Per ogni n ∈ N, posto an := an /n!, risulta an+1 an+1 n! a = = n an (n + 1)! a n+1 e quindi limn→+∞ an+1 /an = 0. Dal Teorema 7.2.7 segue allora che la serie è convergente per ogni a ∈ R. Teorema 7.2.8 (Criterio della radice di Cauchy per le serie a termini positivi) Sia (an )n∈N una successione di numeri reali positivi. Allora: ∑+∞ √ 1) Se lim sup n an < 1, la serie n=0 an è convergente. n→+∞ Capitolo 7: Successioni e serie numeriche 186 2) Se lim sup n→+∞ ∑+∞ √ n an > 1, la serie n=0 an è divergente positivamente. √ Dimostrazione. 1) Si ponga ℓ′′ := lim supn→+∞ n an e si consideri q ∈ R tale che ℓ′′ < q < 1; dalla prima proprietà caratteristica del massimo limite, esiste ν ∈ N tale che, √ per ogni n ≥ ν, si abbia n an < q, e quindi an < q n . Poiché q < 1, la serie geometrica ∑+∞ n e quindi, per il primo criterio di confronto (Proposizione 7.2.5), n=0 q è convergente ∑ anche la serie +∞ a è convergente. n n=0 2) Dalla seconda proprietà caratteristica del massimo limite applicata con ε = ℓ′′ − 1, segue che l’insieme {n ∈ N | an > 1} è infinito e quindi la successione (an )n∈N non può ∑+∞ essere infinitesima. Dalla Proposizione 7.2.1 segue che la serie n=0 an non può essere convergente e pertanto essa è necessariamente divergente positivamente. √ ◃ Ovviamente, anche in questo caso se esiste il limite limn→+∞ n an = ℓ, la serie è convergente se ℓ < 1 ed è divergente positivamente se ℓ > 1, mentre non si può dire nulla nel caso ℓ = 1. ∑+∞ ◃ Ad esempio, si consideri la serie n=0 an , dove { −n 2 , n pari; an = 3−n , n dispari. √ Si ha lim supn→+∞ n an = max{1/2, 1/3} = 1/2 e quindi dal Teorema 7.2.8, la serie è convergente. Si osservi che il criterio del rapporto in questo caso non è applicabile. Si enuncia ora un ulteriore criterio generale di convergenza. Teorema 7.2.9 (Criterio di Raabe-Duhamel per le serie a termini positivi) Sia (an )n∈N una successione di numeri reali strettamente positivi. Si ha quanto segue: 1) Se esistono q > 1 e ν ∈ N tali che, per ogni n ≥ ν, si abbia ( ) an n −1 ≥q , an+1 allora la serie ∑+∞ n=0 an è convergente. 2) Se esiste ν ∈ N tale che, per ogni n ≥ ν, si abbia ( ) an n −1 ≤1, an+1 allora la serie ∑+∞ n=0 an è divergente positivamente. 7.2 Serie numeriche 187 Dimostrazione. 1) Per ogni n ≥ ν, si ha q · an+1 − an+1 ≤ n(an − an+1 ) − an+1 e quindi nan − (n + 1)an+1 . q−1 ∑+∞ Denotata con sn la somma parziale n-esima della serie n=0 an , da quest’ultima relazione segue, per ogni n ≥ ν, an+1 ≤ sn+1 = ≤ = ≤ sν + aν+1 + · · · + an+1 νaν − (ν + 1)aν+1 nan − (n + 1)an+1 sν + + ··· + q−1 q−1 νaν (n + 1)an+1 sν + − q−1 q−1 νaν sν + . q−1 Quindi le somme parziali della serie in esame sono limitate superiormente da cui la convergenza della serie 2) Dalle ipotesi segue, per ogni n ≥ ν, nan ≤ (n + 1)an+1 e quindi, in particolare, νaν ≤ (n + 1)an+1 ; allora, per ogni n ≥ ν, si ha an+1 ≥ νaν /(n + 1); poiché la serie ∑+∞ armonica n=0 1/(n + 1) è divergente positivamente, si conclude che anche la serie in esame è divergente positivamente. Anche ora l’esistenza del limite ( ) an lim n −1 =ℓ, n→+∞ an+1 ∑+∞ consente di affermare la convergenza della serie n=0 an nel caso ℓ > 1 e la sua divergenza positiva nel caso ℓ < 1, mentre il caso ℓ = 1 non consente di dire nulla. Esempio 7.2.10 (Serie armonica generalizzata) Si consideri la serie +∞ ∑ 1 (n + 1)p n=0 con p ∈]0, +∞[, la quale viene denominata serie armonica generalizzata di ordine p (o semplicemente serie armonica se p = 1). Poiché ( ) ( ) 1/(n + 1)p (n + 2)p lim n −1 = lim n −1 n→+∞ n→+∞ 1/(n + 2)p (n + 1)p (( )p ) 1 = lim n 1+ −1 n→+∞ n+1 n (1 + 1/(n + 1))p − 1 =p, = lim n→+∞ n + 1 1/(n + 1) Capitolo 7: Successioni e serie numeriche 188 applicando il criterio di Raabe-Duhamel, si riconosce che la serie armonica generalizzata è convergente se p > 1 ed è divergente positivamente se p < 1; nel caso p = 1, si è già riconosciuto direttamente che essa risulta ancora divergente positivamente. Si osservi che a tale serie non era applicabile né il criterio del rapporto né quello della radice. ◃ Nel caso di successioni decrescenti, vi è un ulteriore strumento molto utile nelle applicazioni. Teorema 7.2.11 (Criterio di condensazione di Cauchy per le serie a termini positivi) Sia (an )n∈N una successione decrescente di numeri reali positivi. Allora le due serie +∞ ∑ +∞ ∑ an , n=0 2n a2n , n=0 sono entrambe convergenti oppure entrambe divergenti positivamente. Dimostrazione. Si indichi con sn la somma parziale n-esima della serie ∑ n n σn quella della serie +∞ n=0 2 a2 . Per ogni k ∈ N, si ha 2k+1 ∑−1 ∑+∞ n=0 an e con aj ≤ 2k a2k , j=2k in quanto il primo membro è somma di 2k addendi ognuno dei quali è minore o uguale al primo addendo a2k (a causa della decrescenza della successione (an )n∈N ). Sommando per k = 0, . . . , n si ha s2n+1 −1 = 2n+1 ∑−1 k=1 k+1 ak = n 2 ∑−1 ∑ aj ≤ n ∑ 2k a2k = σn , k=0 k=0 j=2k e quindi la convergenza della seconda serie implica quella della prima. Viceversa, procedendo in maniera analoga, per ogni k ≥ 1, k 1 k 2 a2k = 2k−1 a2k ≤ 2 2 ∑ aj j=2k−1 +1 (il numero degli addendi a secondo è infatti 2k − 2k−1 − 1 + 1 = 2 · 2k−1 − 2k−1 = 2k−1 ed ognuno di essi è maggiore o uguale di quello con l’indice maggiore, cioè a2k ) e quindi, sommando per k = 1, . . . , n, ) ( n 2n n ∑ 1 1∑ k 1 ∑ k ak = s2n − a0 − a1 ; 2 a2k ≤ (σn − a1 ) = 2 a2 k + a1 − a1 = 2 2 k=1 2 k=1 k=2 da ciò segue che la convergenza della prima serie implica quella della seconda. 7.2 Serie numeriche 189 ◃ Ad esempio, si consideri la serie +∞ ∑ 1 , n | log n|p n=2 p ∈]0, +∞[ . Posto an := 1/(n | log n|p ), si ha 2n a2n = 2n 1 1 = p 2n | log 2n |p n | log 2|p e inoltre la successione (an )n≥2 è decrescente. Poiché la serie armonica generalizzata è convergente per p > 1 e divergente positivamente per p ≤ 1, dal Teorema 7.2.11, segue che la serie in esame si comporta allo stesso modo. ◃ Nelle applicazioni i criteri precedenti possono essere utilizzati anche per serie che non hanno segno costante, riferendoli alla serie dei valori assoluti, che è in ogni caso a termini positivi. Infatti, se (an )n∈N è una successione arbitraria di numeri reali, si può considerare la serie +∞ ∑ |an | n=0 di termine generale n-esimo |an |; tale serie è a termini positivi e quindi deve essere o convergente o∑ divergente positivamente. +∞ Si dice che la serie n=0 an è assolutamente convergente (rispettivamen∑+∞ te, assolutamente divergente) se la serie n=0 |an | è convergente (rispettivamente, divergente positivamente). La condizione di assoluta convergenza è più restrittiva della convergenza di una serie, come si riconosce nella proposizione successiva. Proposizione 7.2.12 Sia (an )n∈N una successione di numeri reali. Se la ∑+∞ serie n=0 an è assolutamente convergente, allora essa è anche convergente. Dimostrazione. Sia ε > 0; dal criterio di convergenza di Cauchy applicato alla serie ∑+∞ n=0 |an |, esiste ν ∈ N tale che, per ogni n ≥ ν e per ogni p ∈ N, risulti n+p ∑ |ak | < ε . k=n+1 Allora si ha anche n+p ∑ k=n+1 ak ≤ n+p ∑ |ak | < ε , k=n+1 e quindi, sempre dal criterio di convergenza di Cauchy segue che la serie convergente. ∑+∞ n=0 an è 190 Capitolo 7: Successioni e serie numeriche Viceversa, una serie può essere convergente senza essere assolutamente convergente; in tal caso si dice anche che la serie è semplicemente convergente (oppure semiconvergente). Se la serie dei valori assoluti di una serie assegnata verifica qualcuno dei criteri di convergenza precedenti, la serie risulterà assolutamente convergente e quindi, dalla Proposizione 7.2.12, risulterà a maggior ragione convergente. Invece, il fatto che una serie sia assolutamente divergente non comporta che essa non possa essere convergente. Un ulteriore criterio di convergenza assoluta si ottiene applicando la Proposizione 7.2.5 alla serie armonica generalizzata. Teorema ∑+∞ 7.2.13 (Criterio dell’ordine di infinitesimo per le serie) Sia n=0 an una serie arbitraria di numeri reali. Allora 1) Se la successione (an )n∈N è un infinitesimo di ordine maggiore o ∑+∞ uguale di α, con α > 1, la serie n=0 an è assolutamente convergente. 2) Se la successione (an )n∈N è un infinitesimo di ordine minore o uguale ∑+∞ di 1, la serie n=0 an è assolutamente divergente. Dimostrazione. 1) Poiché la successione (an )n∈N è un infinitesimo di ordine maggiore o uguale di α, con α > 1, si ha limn→+∞ nα |an | = ℓ con ℓ ∈ R (eventualmente, può anche accadere ℓ = 0). Dalla definizione di limite si ottiene l’esistenza di ν ∈ N tale che, per ∑ ogni n ≥ ν, risulti nα |an | ≤ ℓ + 1, da cui |an | ≤ (ℓ + 1)/nα . Poiché la serie +∞ α è convergente (si veda l’Esempio 7.2.10), dalla Proposizione 7.2.5 (ℓ + 1) n=0 1/n ∑ segue che anche la serie +∞ n=0 |an | è convergente. 2) Poiché la successione (an )n∈N è un infinitesimo di ordine minore o uguale di 1, si ha limn→+∞ n|an | = ℓ con ℓ > 0 oppure ℓ = +∞ (se l’ordine di infinitesimo è minore di 1). Dalla definizione di limite, considerato β > 0 tale che β < ℓ, esiste ν ∈ N tale che, ∑ per ogni n ≥ ν, si abbia n|an | ≥ β, da cui |an | ≥ β/n. La serie +∞ n=1 β/n è divergente ∑ positivamente (Esempio 7.2.4) e quindi, dalla Proposizione 7.2.5, anche la serie +∞ n=0 |an | è divergente positivamente. 7.2.3 Serie alternanti Si studia ora un ulteriore criterio di convergenza per serie che non sono a termini positivi. Sia (an )n∈N ∑ una successione di numeri reali positivi (oppure negativi). +∞ n Allora la serie n=0 (−1) an viene denominata a segni alterni (oppure alternante). Si ha il seguente criterio di convergenza. Teorema 7.2.14 (Criterio di Leibnitz per le serie alternanti) Sia (an )n∈N una successione decrescente di numeri reali po∑+∞ed infinitesima n sitivi. Allora, la serie alternante (−1) a è convergente e inoltre, n n=0 7.2 Serie numeriche 191 denotata con s la sua somma e, per ogni n ∈ N, con sn la somma parziale n-esima, si ha |s − sn | ≤ an+1 . (7.2.1) Dimostrazione. Tenendo presente che la successione (an )n∈N è decrescente, valgono le relazioni s2(n+1) = s2n − a2n+1 + a2n+2 ≤ s2n , (1) s2(n+1)+1 = s2n+1 − a2n+2 + a2n+3 ≥ s2n+1 , (2) s2n − s2n+1 = a2n+1 . (3) Dalle uguaglianze (1) e (2) segue che la successione estratta (s2n )n∈N è decrescente, mentre la successione estratta (s2n+1 )n∈N è crescente; inoltre, dalla (3), s2n+1 ≤ s2n per ogni n ∈ N e quindi s1 ≤ s2n e s2n+1 ≤ s0 . Dunque, le successioni (s2n )n∈N e (s2n+1 )n∈N sono monotone e limitate e quindi, dal Teorema 7.1.2, esse sono convergenti. Posto s = limn→+∞ s2n e tenendo presente che la successione (an )n∈N è infinitesima, si ha anche limn→+∞ s2n+1 = limn→+∞ s2n − a2n+1 = limn→+∞ s2n − limn→+∞ a2n+1 = s. Infine, dalla monotonia delle successioni (s2n )n∈N e (s2n+1 )n∈N e dalla (3) segue, per ogni n ∈ N, |s − s2n | = s2n − s ≤ s2n − s2n+1 = a2n+1 , |s − s2n+1 | = s − s2n+1 ≤ s2n+2 − s2n+1 = a2n+2 ; quindi sia nel caso in cui n sia pari o dispari si ha |s − sn | ≤ an+1 ; da ciò segue che la successione (sn )n∈N delle somme parziali converge verso s e vale la (7.2.1). La (7.2.1) si può enunciare dicendo che l’errore commesso approssimando la somma di una serie a termini alterni con una somma parziale è minore o uguale del valore assoluto del primo termine trascurato. Esempio 7.2.15 (Serie armonica a segni alterni) Si consideri la serie +∞ ∑ 1 (−1)n , (n + 1)p n=0 con p ∈]0, +∞[, la quale viene denominata serie armonica a segni alterni di ordine p; se p = 1, essa viene denominata semplicemente serie armonica a segni alterni. Si è già visto che tale serie è assolutamente convergente (e quindi convergente per la Proposizione 7.2.12) se p > 1. Se p ≤ 1, si può tener presente che la successione (n−p )n≥1 è decrescente ed infinitesima e quindi per il criterio di Leibnitz la serie risulta ancora convergente (ma non assolutamente). Infine, denotata con s la somma della serie, per ogni n ≥ 1, dalla (7.2.1) segue n ∑ 1 1 s− (−1)k . ≤ (k + 1)p (n + 2)p k=0 Capitolo 7: Successioni e serie numeriche 192 7.2.4 Proprietà algebriche Alcune proprietà algebriche elementari delle serie numeriche sono state già considerate in precedenza. Si esamina ora il comportamento delle serie numeriche rispetto ad ulteriori operazioni algebriche. La prima operazione che si prende in considerazione è quella di prodotto secondo Cauchy di due serie numeriche. ∑+∞ ∑+∞ ◃ Siano n=0 an e n=0 bn due serie numeriche di numeri reali. Si definisce serie prodotto secondo Cauchy delle due serie, e si denota con +∞ ∑ an · n=0 la serie ∑+∞ n=0 cn +∞ ∑ bn , n=0 di termine n-esimo cn := n ∑ ak bn−k . (7.2.2) k=0 Il termine n-esimo della serie prodotto secondo Cauchy si ottiene sommando i prodotti dei termini delle due serie la cui somma degli indici è uguale ad n. Nel diagramma seguente, che conviene tener presente per le diseguaglianze utilizzate nella proposizione successiva, i termini della serie prodotto si ottengono sommando gli elementi delle diagonali. Quindi la somma parziale n-esima della serie prodotto secondo Cauchy si ottiene sommando tutti gli elementi che si trovano al di sotto della diagonale n-esima. ∑+∞ ∑+∞ Proposizione 7.2.16 Siano n=0 bn due serie assolutamenn=0 an e te convergenti di numeri reali. Allora la serie prodotto secondo Cauchy ∑+∞ è assolutamente convergente. n=0 cn definita dalla (7.2.2) ∑+∞ ∑+∞ ∑+∞ Inoltre, posto s := n=0 cn , risulta n=0 bn e u := n=0 an , t := u = s · t. ∑+∞ ∑ a termini Dimostrazione. Si supponga dapprima che le serie +∞ n=0 bn siano∑ n=0 an e positivi e, per ogni n ∈ N, si denoti con sn la somma parziale n-esima della serie +∞ n=0 an , ∑+∞ con tn la somma parziale n-esima della serie n=0 bn ed infine con un la somma parziale ∑ n-esima della serie +∞ n=0 cn . Allora, per ogni n ∈ N, si ha un = a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 bn + a1 bn−1 + · · · + an−1 b1 + an b0 ) ≤ a0 (b0 + · · · + bn ) + · · · + an (b0 + · · · + bn ) = (a0 + · · · + an )(b0 + · · · + bn ) = sn tn ≤ a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 b2n + a1 b2n−1 + · · · + a2n−1 b1 + a2n b0 ) = u2n . 7.2 Serie numeriche • b7 • b6 • b5 • b4 • b3 • b2 • b1 • b0 193 a b • 0 7 @ @ @• a1 b6 @ @ ab • 2 5 @ @ @ a3 b4 • @ @ @ a4 b3 • @ @ @ a 5 b2 •@ @ @• a6 b1 @ @ @• a7 b0 a0 • a1 • a2 a3 • a4 • • a5 • a6 • a7 • Figura 7.1: Prodotto secondo Cauchy di due serie Per l’ultima diseguaglianza conviene tener presente che gli elementi al di sotto della diagonale n-esima appartengono a quelli interni al quadrato avente come vertici gli elementi a0 b0 , an b0 , an bn e a0 bn e che questi ultimi si trovano al di sotto della diagonale 2n-esima. Dalla diseguaglianza un sn tn , tenendo presente che la successione (un )n∈N è cre∑≤ +∞ scente, segue che la serie n=0 cn è convergente. Inoltre, dalla diseguaglianza un ≤ sn tn ≤ u2n , segue u ≤ s · t ≤ u, da cui segue interamente la tesi. ∑ ∑+∞ +∞ Si considera ora il caso generale. Poiché le serie n=0 bn sono asson=0 an e lutamente convergenti, dalla prima parte dimostrata segue che la serie prodotto delle ∑+∞ ∑+∞ serie n=0 |an | e n=0 |bn | è convergente. Il termine n-esimo di tale serie è dato da ∑ n k=0 |ak bn−k |; poiché, per ogni n ∈ N, n ∑ ak bn−k ≤ |ak bn−k | , k=0 k=0 — la serie prodotto secondo Cauchy di Infine, si riconosce facilmente che |sn tn − un | ≤ n ∑ ∑+∞ 2n ∑ k=0 n=0 an e ∑+∞ |ak bn−k | − n=0 bn n ∑ k=0 è assolutamente convergente. |ak bn−k | , 194 Capitolo 7: Successioni e serie numeriche e quindi, passando al limite per n → +∞, si ha limn→+∞ |sn tn −un | = 0, da cui u = s·t. t ◃ Si potrebbe riconoscere, ma si omette per brevità la dimostrazione, che la serie prodotto secondo Cauchy converge anche se una sola delle due serie è assolutamente convergente e l’altra è convergente (Teorema di Mertens). Inoltre, se due serie sono convergenti, la serie prodotto secondo Cauchy non può risultare divergente positivamente né divergente negativamente, ma deve essere necessariamente convergente oppure indeterminata. Nel caso in cui la serie prodotto secondo Cauchy sia convergente, vale in ogni caso l’uguaglianza con il prodotto delle somme delle due serie. ◃ Si è già osservato che l’alterazione di un numero finito di termini di una serie non influisce sul suo carattere. Si esaminano ora alcune proprietà delle serie che riguardano invece l’alterazione di un numero non necessariamente finito di termini. Per brevità, si omettono le dimostrazioni delle proprietà successive. ∑+∞ ◃ Se n=0 an è una serie di numeri reali e se (k(n))n∈N è una successione strettamente crescente di interi positivi tale che k(0) = 0, la serie k(n+1)−1 +∞ ∑ ∑ aj n=0 j=k(n) ∑k(n+1)−1 ∑+∞ di termine n-esimo j=k(n) aj si dice ottenuta dalla serie n=0 an raggruppandone i termini. La proprietà ∑+∞ di completa additività delle serie convergenti asserisce che se la serie n=0 an è convergente (rispettivamente, divergente positivamente, divergente negativamente, assolutamente convergente, assolutamente divergente), allora anche le serie ottenute da essa raggruppandone i termini sono convergenti (rispettivamente, divergenti positivamente, divergenti negativamente, assolutamente convergenti, assolutamente divergenti) e le loro somme coincidono. Conviene osservare che una serie ottenuta raggruppando i termini può essere convergente senza che lo sia la serie di partenza. In particolare, se una serie è indeterminata, non è detto che una serie ottenuta da essa raggruppandone i termini sia anch’essa indeterminata. Ad esempio, la serie ∑+∞ n (−1) è indeterminata in quanto il termine n-esimo non è infinitesimo, n=0 ma se si considera la successione (2n)n∈N strettamente crescente di interi si ottiene una serie con tutti i termini nulli che quindi converge a 0. ◃ Si considera infine una estensione della proprietà commutativa della ∑+∞ somma di numeri reali. Se n=0 an è una serie di numeri reali e se σ : 7.2 Serie numeriche 195 N → N è una permutazione ∑+∞ dell’insieme N (cioè, una funzione bigettiva di N in N), allora la serie n=0 aσ(n) di termine n-esimo aσ(n) si dice ottenuta ∑+∞ dalla serie n=0 an riordinandone i termini. Inoltre, si dice che la serie ∑+∞ a è incondizionatamente convergente se ogni serie da essa ottenuta n n=0 riordinandone i termini è convergente e si ha +∞ ∑ n=0 aσ(n) = +∞ ∑ an . n=0 Si può riconoscere che una serie è incondizionatamente convergente se e solo se essa è assolutamente convergente. Capitolo 8 Funzioni continue Una delle proprietà più importanti delle funzioni elementari riguarda il fatto che il limite in un punto x0 in cui la funzione è definita si può determinare semplicemente calcolando la funzione in x0 . Tale proprietà viene approfondita nel presente capitolo. 8.1 Definizioni e proprietà preliminari Definizione 8.1.1 Siano X un sottoinsieme non vuoto di R, x0 ∈ X ed f : X → R una funzione reale. Si dice che f è continua in x0 se verifica la seguente condizione ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X∩]x0 − δ, x0 + δ[: |f (x) − f (x0 )| < ε . Se x0 ∈ X non è un punto di accumulazione per X, la condizione precedente è sempre soddisfatta (basta considerare δ > 0 tale che X∩]x0 − δ, x0 + δ[r{x0 } = ∅), mentre se x0 è di accumulazione per X, la condizione precedente equivale all’esistenza del limite di f in x0 ed alla condizione lim f (x) = f (x0 ) . x→x0 ◃ Se A è un sottoinsieme di X, si dice che f è continua in A se f è continua in ogni x0 ∈ A. Infine, si dice che f è continua, se essa è continua in X. ◃ In modo analogo si forniscono le definizioni di funzione continua a sinistra e continua a destra; precisamente, si dice che f è continua a destra (rispettivamente, continua a sinistra) in x0 se verifica la seguente condizione ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X ∩ [x0 , x0 + δ[: |f (x) − f (x0 )| < ε Capitolo 8: Funzioni continue 198 (rispettivamente, ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ X∩]x0 − δ, x0 ] : |f (x) − f (x0 )| < ε ). Si riconosce facilmente che se x0 è un punto di accumulazione a destra (rispettivamente, a sinistra) per X, allora f è continua a destra (rispettivamente, a sinistra) in x0 se e solo se esiste il limite destro (rispettivamente, sinistro) di f in x0 e si ha lim f (x) = f (x0 ) (rispettivamente, lim f (x) = f (x0 ) ). x→x− 0 x→x+ 0 ◃ Ad esempio, la funzione f :] − 1, +∞[→ R definita ponendo, per ogni x ∈] − 1, +∞[, { log(1 + x) , x ̸= 0 f (x) := x 1, x=0, è continua nel punto x0 = 0. ◃ Invece, la funzione f : R → R definita ponendo, per ogni x ∈ R, { 1/x e , x ̸= 0 f (x) := 0, x=0, è continua a sinistra in x0 = 0, ma non a destra in quanto limx→0+ e1/x = +∞. ◃ Un punto in cui una funzione f : X → R è definita ma non è continua, viene denominato punto di discontinuità per f . Si osservi che un punto di discontinuità x0 ∈ X deve essere necessariamente di accumulazione per X e quindi in un tale punto si può considerare il limite di f ma, se esiste, non deve coincidere con f (x0 ). A seconda del comportamento di tale limite, si possono classificare diversi tipi di punti di discontinuità di seguito specificati. Siano X un sottoinsieme non vuoto di R, f : X → R una funzione reale ed x0 ∈ X un punto di discontinuità per f . 1) Si dice che x0 è un punto di discontinuità eliminabile per f se esiste ed è finito il limx→x0 f (x) e si ha lim f (x) ̸= f (x0 ) . x→x0 2) Si dice che x0 è un punto di discontinuità di prima specie per f se esistono e sono finiti il limite sinistro limx→x− f (x) ed il limite destro 0 limx→x+ f (x) e si ha 0 lim f (x) ̸= lim+ f (x) . x→x− 0 x→x0 8.1 Definizioni e proprietà preliminari 199 3) In tutti i casi rimanenti, cioè se uno dei due limiti da sinistra o da destra non esiste oppure è infinito, si dice che x0 è un punto di discontinuità di seconda specie. ◃ Se x0 è un punto di discontinuità eliminabile per f , si può definire la funzione f˜ : X → R ponendo, per ogni x ∈ X, { f (x) , x ̸= x0 , f˜(x) := lim f (x) , x = x0 , x→x0 la quale risulta continua in x0 ; ciò giustifica la denominazione data a questo tipo di discontinuità. np Se x0 ∈ X è un punto di discontinuità di prima specie, esso è necessariamente di accumulazione sia a sinistra che a destra per X e non è possibile ridefinire la funzione nel punto x0 in modo da ottenere una funzione continua. Si possono tuttavia definire le funzioni f˜− : X → R e f˜+ : X → R ponendo, per ogni x ∈ X, { { f (x) , x ̸= x0 , f (x) , x ̸= x0 , f˜+ (x) := f˜− (x) := x = x0 , lim f (x) , x = x0 , lim f (x) , x→x− 0 x→x+ 0 le quali sono la prima continua solamente a sinistra in x0 e la seconda continua solamente a destra in x0 . Il numero reale s(x0 ) := lim f (x) − lim f (x) x→x+ 0 x→x− 0 viene denominato salto della funzione f nel punto x0 . ◃ Ad esempio, la funzione segno sign : R → R definita ponendo, per ogni x ∈ R, { |x|/x , x ̸= 0 , sign(x) := 0, x=0, ha una discontinuità di prima specie nel punto 0 ed il salto della funzione nel punto 0 è uguale a 2. ◃ Un noto esempio di funzione che presenta discontinuità di seconda specie in ogni punto del suo insieme di definizione è la funzione di Dirichlet d : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1], { 1, x ∈ [0, 1] ∩ Q , d(x) := (8.1.1) 0, x ∈ [0, 1] ∩ (R r Q) . ◃ Dai teoremi sui limiti, segue subito il seguente risultato riguardante le operazioni sulle funzioni continue. 200 Capitolo 8: Funzioni continue Teorema 8.1.2 Siano X un sottoinsieme non vuoto di R, x0 ∈ X un punto di accumulazione per X ed f : X → R e g : X → R funzioni reali. Allora: 1) Se f e g sono continue in x0 , anche la funzione somma f +g è continua in x0 ; conseguentemente, se f e g sono continue, f + g è continua. 2) Se f e g sono continue in x0 , anche la funzione prodotto f ·g è continua in x0 ; conseguentemente, se f e g sono continue, f · g è continua. In particolare, se λ ∈ R ed f è continua in x0 , anche la funzione λ · f è continua in x0 ; conseguentemente, se f è continua, λ · f è anch’essa continua. 3) Se, per ogni x ∈ X, f (x) ̸= 0 ed f è continua in x0 , anche la funzione reciproca 1/f è continua in x0 ; conseguentemente, se f è continua, anche 1/f è continua. 4) Se, per ogni x ∈ X, g(x) ̸= 0 ed f e g sono continue in x0 , anche la funzione quoziente f /g è continua in x0 ; conseguentemente, se f e g sono continue, f /g è continua. Teorema 8.1.3 (Continuità delle funzioni composte) Siano X e Y sottoinsiemi non vuoti di R, x0 ∈ X un punto di accumulazione per X ed f : X → R e g : Y → R funzioni reali tali che f (X) ⊂ Y e si ponga y0 = f (x0 ). Se f è continua in x0 e g è continua in y0 , allora la funzione composta g ◦f : X → R risulta continua in x0 . Conseguentemente, se f e g sono continue, la funzione composta g ◦ f è continua. Dimostrazione. La dimostrazione può essere considerata una conseguenza del Teorema 6.5.6 sul limite delle funzioni composte, tuttavia si può fonire facilmente una dimostrazione diretta. Fissato ε > 0, dalla continuità di g in y0 segue l’esistenza di δ1 > 0 tale che, per ogni y ∈ Y ∩]y0 − δ1 , y0 + δ1 [, si abbia g(y0 ) − ε < g(y) < g(y0 ) + ε; inoltre, poiché f è continua in x0 , si può trovare δ > 0 tale che, per ogni x ∈ X∩]x0 − δ, x0 + δ[, risulti f (x0 ) − δ1 < f (x) < f (x0 ) + δ1 . Allora, per ogni x ∈ X∩]x0 − δ, x0 + δ[, si ha anche f (x) ∈ Y ∩]y0 − δ1 , y0 + δ1 [ e conseguentemente g(y0 ) − ε < g(f (x)) < g(y0 ) + ε. Dall’arbitrarietà di ε > 0 segue la tesi. I teoremi precedenti consentono di affermare la continuità di una funzione ottenuta mediante le operazioni algebriche di somma, prodotto e composizione di funzioni continue. Se X è un sottoinsieme non vuoto di R, l’insieme di tutte le funzioni reali continue definite in X viene denotato con C(X) C(X) := {f : X → R | f è continua} . 8.2 Funzioni continue su intervalli chiusi e limitati 201 In termini algebrici, le proprietà precedenti consentono di affermare che l’insieme C(X), munito delle operazioni di somma di due funzioni e prodotto di un numero reale per una funzione, risulta uno spazio vettoriale reale. Le funzioni maggiormente studiate nel seguito si ottengono applicando opportune operazioni algebriche di somma, prodotto e composta alle funzioni elementari, per cui la continuità delle funzioni elementari sarà in generale sufficiente ad assicurarne la continuità delle funzioni in esame. D’altra parte, la continuità delle funzioni elementari è un’immediata conseguenza dello studio dei limiti delle funzioni elementari effettuato in precedenza, in base al quale si può affermare che tutte le funzioni elementari sono continue. Inoltre, anche i polinomi e le funzioni razionali sono continue, in quanto somma e quoziente di funzioni continue. 8.2 Funzioni continue su intervalli chiusi e limitati Alcune importanti proprietà delle funzioni continue si ottengono nel caso in cui esse sono definite in intervalli chiusi e limitati. Teorema 8.2.1 (Teorema di Weierstrass) Sia f : [a, b] → R una funzione continua. Allora f è dotata di minimo e di massimo, cioè esistono c ∈ [a, b] e d ∈ [a, b] tali che, per ogni x ∈ [a, b], f (c) ≤ f (x) ≤ f (d) . Dimostrazione. Si dimostra in una prima fase che ogni funzione continua f : [a, b] → R è limitata. Infatti, se per assurdo f non fosse limitata superiormente, essa non ammetterebbe maggioranti e quindi, in particolare, per ogni n ∈ N esisterebbe xn ∈ [a, b] tale che f (xn ) > n. La successione (xn )n∈N è limitata e quindi, dal Corollario 7.1.13, ammette un’estratta (xk(n) )n∈N convergente verso un elemento x0 ∈ [a, b]. Poiché limn→+∞ f (xk(n) ) = +∞ (in quanto f (k(n)) > k(n) ≥ n), dalla caratterizzazione sequenziale del limite (Teorema 7.1.3) viene contraddetta la continuità di f in x0 . Quindi f deve essere limitata superiormente. Nello stesso modo si dimostra che f deve essere limitata inferiormente. Si dimostra ora che f è dotata di massimo; dalla prima parte già dimostrata, si può considerare l’estremo superiore ℓ := sup f di f e quindi è sufficiente dimostrare che esso è un valore della funzione. Infatti, dalla definizione di estremo superiore, per ogni n ∈ N segue l’esistenza di yn ∈ [a, b] tale che ℓ − 1/(n + 1) < f (yn ) ≤ ℓ; anche in questo caso la successione (yn )n∈N è limitata e quindi, dal Corollario 7.1.13, ammette un’estratta (yk(n) )n∈N convergente verso un elemento d ∈ [a, b]. Poiché limn→+∞ f (yk(n) ) = ℓ dalla continuità di f in y0 e dalla caratterizzazione sequenziale del limite (Teorema 7.1.3) segue ℓ = f (d) e ciò completa la dimostrazione dell’esistenza del massimo. Nello stesso modo si dimostra infine quella del minimo di f . Capitolo 8: Funzioni continue 202 ◃ Oltre alla continuità, si osserva che l’ipotesi che l’insieme di definizione sia un intervallo chiuso e limitato è essenziale, come si riconosce, ad esempio, considerando le restrizioni della funzioni logaritmo all’intervallo semiaperto ]0, 1] ed all’intervallo non limitato [1, +∞[. La proprietà successiva giustifica la terminologia adottata per la proprietà di continuità. Teorema 8.2.2 (Teorema degli zeri) Sia f : [a, b] → R una funzione continua tale che f (a) f (b) < 0. Allora esiste x0 ∈]a, b[ tale che f (x0 ) = 0. Dimostrazione. L’ipotesi f (a) f (b) < 0 esprime il fatto che negli estremi a e b la funzione f assume valori di segno opposto. Si supponga, per fissare le notazioni, che f (a) < 0 e f (b) > 0 (la dimostrazione è analoga nel caso f (a) > 0 e f (b) < 0). Si ponga I1 := [a, b] e si consideri il punto medio x1 ∈ [a, b]; se f (x1 ) = 0, la tesi è vera, altrimenti la funzione f assume valori di segno opposto in almeno uno degli intervalli [a, x1 ] e [x1 , b]; denotato con I2 tale intervallo si denota ora con x2 il punto medio di I2 e si considera il valore f (x2 ). Se f (x2 ) = 0, la tesi è vera, altrimenti la funzione f assume valori di segno opposto in almeno uno degli intervalli aventi come estremi x2 ed uno dei punti considerati in precedenza; tale intervallo viene denotato I3 e si ripete il procedimento esposto. Se dopo n iterazioni di tale procedimento si trova un punto xn ∈ [a, b] tale che f (xn ) = 0, la tesi è vera, altrimenti si trova una successione di intervalli (In )n≥1 tale che, per ogni n ≥ 1, In+1 ⊂ In e In ha ampiezza (b − a)/2n−1 . Per ogni n ≥ 1 si denotino con an e bn gli estremi di In e precisamente con an l’estremo in cui f assume un valore negativo e con bn l’estremo in cui f assume un valore positivo; si ottengono cosı̀ le successioni (an )n∈N e (bn )n∈N di elementi di [a, b]. La successione (an )n∈N è limitata e quindi, dal Corollario 7.1.13, essa ammette un’estratta (ak(n) )n∈N b−a convergente verso un elemento x0 ∈ [a, b]. Poiché k(n) ≤ n, si ha k(n)−1 ≤ 2b−a n−1 e 2 conseguentemente ak(n) − b−a b−a b−a b−a ≤ ak(n) − k(n)−1 ≤ bk(n) ≤ ak(n) + k(n)−1 ≤ ak(n) − n−1 2n−1 2 2 2 (in realtà, bk(n) coincide con ak(n) − (b − a)/k(n) oppure con ak(n) + (b − a)/k(n)), si ha anche per confronto limn→+∞ bk(n) = x0 ; dalla continuità di f in x0 e dalla caratterizzazione sequenziale del limite (Teorema 7.1.3) segue lim f (ak(n) ) = f (x0 ) , n→+∞ lim f (bk(n) ) = f (x0 ) ; n→+∞ infine, poiché f (an ) ≤ 0 deve essere anche f (x0 ) ≤ 0 e analogamente, poiché f (bn ) ≥ 0 deve essere anche f (x0 ) ≥ 0; si conclude che deve essere f (x0 ) = 0 e ciò completa la dimostrazione. Corollario 8.2.3 (Teorema di Bolzano o dei valori intermedi) Sia f : [a, b] → R una funzione continua e siano m ∈ R ed M ∈ R il minimo e rispettivamente il massimo di f . Se λ ∈ R e m ≤ λ ≤ M , allora esiste x0 ∈ [a, b] tale che f (x0 ) = λ. Dimostrazione. Siano c ∈ [a, b] e d ∈ [a, b] tali che f (c) = m e f (d) = M . La tesi è ovvia se λ = m oppure λ = M considerando x0 = c oppure x0 = d. Si supponga quindi 8.2 Funzioni continue su intervalli chiusi e limitati 203 y a x0 0 b x Figura 8.1: Teorema degli zeri. m < λ < M e si denoti con I l’intervallo chiuso avente come estremi i punti c e d; si consideri la funzione g : I → R definita ponendo, per ogni x ∈ I, g(x) = f (x) − λ. Allora g è continua e inoltre g(c) g(d) < 0. Dal Teorema degli zeri 8.2.2 segue l’esistenza di x0 ∈ I tale che g(x0 ) = 0; dunque x0 ∈ [a, b] e f (x0 ) = λ. Osservazione 8.2.4 (Conseguenza del teorema di Weierstrass e di Bolzano) Sia f : [a, b] → R una funzione continua. Dal Teorema 8.2.1 di Weierstrass, segue l’esistenza di c ∈ [a, b] e d ∈ [a, b] tali che, per ogni x ∈ [a, b], f (c) ≤ f (x) ≤ f (d), cioè f ([a, b]) ⊂ [f (c), f (d)]. D’altra parte, dal teorema di Bolzano (Corollario 8.2.3), segue che ogni elemento dell’intervallo [f (c), f (d)] è un valore della funzione e quindi si deve avere [f (c), f (d)] ⊂ f ([a, b]). In conclusione deve essere f ([a, b]) = [f (c), f (d)] , cioè l’immagine di un intervallo chiuso e limitato mediante una funzione continua è un intervallo chiuso e limitato avente come estremi il minimo e rispettivamente il massimo della funzione in tale intervallo. Osservazione 8.2.5 Un’importante applicazione del teorema degli zeri riguarda la possibilità di approssimare le soluzioni di un’equazione. Sia I un Capitolo 8: Funzioni continue 204 intervallo e sia f : I → R una funzione continua; si consideri l’equazione f (x) = 0 . Il primo passo consiste nel cercare due elementi a, b ∈ I tali che f (a) f (b) < 0. A questo punto, applicando il metodo descritto nella dimostrazione del Teorema degli zeri 8.2.2, alla restrizione di f all’intervallo [a, b], si riesce ad approssimare una soluzione dell’equazione con la precisione desiderata. Ad esempio, si supponga di voler determinare una soluzione dell’equazione ex = −x con una precisione pari a 3 · 10−1 . y 0 x0 x Figura 8.2: Approssimazione delle soluzioni con il teorema degli zeri. Confrontando i grafici delle funzioni ex e −x si riconosce facilmente l’esistenza di un’unica soluzione x0 ∈ R, che risulta negativa. Si cerca ora di applicare il ragionamento sopra esposto alla funzione f (x) = ex + x, per determinare il punto x0 con la precisione richiesta. Nel punto 0 risulta f (0) = 1 > 0, mentre nel punto −1 si ha f (−1) = e−1 − 1 < 0, da cui, per il teorema degli zeri, x0 ∈] − 1, 0[; si considera ora il punto −1/2, nel quale risulta f (−1/2) = e−1/2 − 1/2 > 0 (in quanto e−1 > 1/4); essendo f (−1) 8.3 Continuità delle funzioni monotone 205 e f (−1/2) discordi, deve essere x0 ∈] − 1, −1/2[. Si considera ora il punto −3/4. La condizione e−3/4 > 3/4 è equivalente a 4e−3/4 /3 > 1 e, elevando alla potenza quarta entrambi i membri (tenendo presente che sono positivi) a 256/(81e3 ) > 1, che non è vera; quindi si ha f (−3/4) = e−3/4 − 3/4 < 0 e da ciò segue che la soluzione x0 deve trovarsi nell’intervallo ] − 3/4, −1/2[, agli estremi del quale la funzione assume valori di segno discorde. Essendo −1/2 − (−3/4) = 1/4 < 3 · 10−1 si è ottenuta la precisione desiderata. Si osserva tuttavia che il metodo precedente richiede in generale molti calcoli se si richiede una precisione elevata e per questo motivo viene utilizzato solamente nei casi in cui sia necessaria una stima molto approssimativa della posizione degli zeri di una funzione. 8.3 Continuità delle funzioni monotone Ci si occupa ora di alcune proprietà particolari che riguardano la continuità delle funzioni monotone. Innanzitutto conviene studiare la continuità delle funzioni inverse; a tal fine, è opportuno premettere alcuni risultati di interesse generale. ◃ Conviene innanzitutto osservare che se f : X → R è una funzione reale monotona e se l’immagine f (X) di f è un intervallo, allora necessariamente f deve essere continua. Infatti, si supponga ad esempio che f sia crescente e sia per assurdo x0 ∈ X tale che f non sia continua in x0 . Allora, tenendo presente il Teorema 6.6.1, deve risultare limx→x− f (x) < f (x0 ) oppure f (x0 ) < limx→x+ f (x). In entrambi i casi la crescenza di 0 0 f comporta che la funzione non assuma valori nell’intervallo tra uno dei limiti ed f (x0 ) e ciò contraddice il fatto che f (X) è un intervallo. Una delle poprietà generali delle funzioni strettamente monotone è quella di essere iniettiva. Il viceversa non vale necessariamente (ad esempio, si consideri la funzione f : [−1, 1] → R definita ponendo, per ogni x ∈ [−1, 1], f (x) = |x| − sign (x), dove sign è la funzione segno già introdotta in precedenza). tuttavia, se si suppone in più che la funzione sia continua si ottiene il seguente risultato. Proposizione 8.3.1 Se I è un intervallo ed f : I → R è una funzione reale continua ed iniettiva, allora f è strettamente monotona. Dimostrazione. Si supponga, per assurdo, che esistano x1 , x2 ∈ I tali che x1 < x2 e f (x1 ) ≤ f (x2 ) (per cui f non è strettamente decrescente) e che esistano x3 , x4 ∈ I tali che x3 < x4 e f (x3 ) ≥ f (x4 ) (per cui f non è strettamente crescente). Dunque, posto a = min{x1 , x3 } e b = max{x2 , x4 }, f non risulta né strettamente crescente né strettamente decrescente in [a, b]. Poiché f è iniettiva, deve essere f (a) < f (b) oppure f (b) < f (a); si supponga f (a) < f (b). Per ogni x0 ∈]a, b[ si deve avere f (a) < f (x0 ) < f (b); infatti, 206 Capitolo 8: Funzioni continue se fosse f (x0 ) < f (a), dal teorema di Bolzano (Corollario 8.2.3) esisterebbe un elemento y ∈]x0 , b[ tale che f (y) = f (a) ed f non sarebbe iniettiva; nello stesso modo, se fosse f (b) < f (x0 ), sempre dal teorema di Bolzano esisterebbe y ∈]a, x0 [ tale che f (y) = f (b) contro l’iniettività di f ; le uguaglianze f (x0 ) = f (a) e f (x0 ) = f (b) sono da escludere sempre a causa dell’iniettività di f . Si è cosı̀ dimostrato che f è strettamente crescente in [a, b] e ciò era stato escluso. Nello stesso modo si dimostra che la condizione f (b) < f (a) comporta la stretta decrescenza di f in [a, b], anche questa esclusa. Dunque la tesi deve essere vera. Se f : X → R è iniettiva, posto Y = f (X) si è convenuto di denotare con f −1 : Y → R la funzione inversa di f ottenuta considerando a valori in tutto R l’inversa della ridotta di f . Tale funzione inversa può ovviamente essere considerata se f è strettamente monotona; per quanto riguarda la continuità della funzione f −1 , si ha quanto segue. Teorema 8.3.2 (Continuità della funzione inversa) Siano I un intervallo, f : I → R una funzione reale iniettiva e, posto Y = f (I), si consideri la funzione inversa f −1 : Y → R. Se f è strettamente monotona, la funzione inversa f −1 è continua. In particolare, se f è continua, anche la funzione inversa f −1 è continua. Dimostrazione. Si riconosce facilmente che la funzione inversa f −1 risulta anch’essa strettamente monotona ed inoltre ha come immagine l’intervallo I. Da quanto osservato preliminarmente, segue che f −1 è continua. Se si suppone che f sia continua, dalla Proposizione 8.3.1 precedente, essa risulta strettamente monotona e quindi si può applicare quanto già dimostrato. ◃ Si approfondisce ora l’analisi degli eventuali punti di discontinuità di una funzione monotona. Si osserva innanzitutto che come conseguenza diretta del Teorema 6.6.1 sul limite delle funzioni monotone, se f : X → R è una funzione reale monotona e se x0 ∈ X è un punto di accumulazione sia a sinistra che a destra per X, allora f è continua in x0 se e solo se esiste il limite limx→x0 f (x) di f in x0 . Da ciò segue che una funzione monotona f : X → R può avere solamente discontinuità di prima specie nei punti di accumulazione a sinistra e a destra. Nei punti di accumulazione solamente a sinistra o solamente a destra vi possono invece essere solamente discontinuità eliminabili; infatti, le discontinuità di seconda specie sono escluse in quanto affinché una funzione monotona f : X → R possa essere non limitata superiormente oppure inferiormente è necessario che X sia non limitato oppure che inf(X) ∈ / X oppure sup(X) ∈ / X; in tutti questi casi la funzione f non è definita nei punti inf(X) e sup(X) e quindi in tali punti non ha senso chiedersi se la funzione presenta in tali punti una discontinuità. 8.4 Funzioni uniformemente continue 207 Teorema 8.3.3 (Numerabilità delle discontinuità delle funzioni monotone) Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione reale monotona. Allora l’insieme D(f ) := {x0 ∈ X | f non è continua in x0 } dei punti di discontinuità di f è finito oppure al più numerabile. Dimostrazione. Si può supporre che f sia crescente, altrimenti basta applicare lo stesso procedimento alla funzione −f . Per ogni x0 ∈ X, si denoti con s(x0 ) il salto della funzione f in x0 , definito come segue lim f (x) − lim f (x) , x0 di accumulazione a sinistra e a destra per X , x→x+ x→x− 0 0 lim f (x) − f (x0 ) , x0 di accumulazione solo a destra per X , s(x0 ) := + x→x 0 f (x0 ) − lim f (x) , x0 di accumulazione solo a sinistra per X . − x→x0 Per ogni m ∈ N, si considera inoltre l’insieme { Dm (f ) := x0 ∈ X | s(x0 ) ≥ 1 m+1 } dei punti di discontinuità di f in cui il salto della funzione è maggiore o uguale di 1/(m+1). Ovviamente, ∪ D(f ) = Dm (f ) . m∈N Si considerino ora una successione decrescente (an )n∈N ed una successione crescente (bn )n∈N di elementi di X tali che limn→+∞ an = inf(X) e limn→+∞ bn = sup(X). In ogni insieme X ∩ [an , bn ] la funzione è limitata in quanto è crescente ed è definita agli estremi; segue che per ogni m ∈ N l’insieme Dn,m (f ) := Dm (f ) ∩ X ∩ [an , bn ] è finito in quanto la somma di un numero finito di salti maggiori o uguali di 1/(m + 1) non può superare la differenza f (bm ) − f (am ). Allora ∪ ∪ ∪ D(f ) = Dm (f ) = Dn,m (f ) m∈N m∈N n∈N è unione numerabile di insiemi finiti e pertanto è finito oppure al più numerabile. 8.4 Funzioni uniformemente continue Si supponga che una funzione f : X → R sia continua; allora, per definizione, ∀ x ∈ X ∀ ε > 0 ∃ δ > 0 t.c. ∀ y ∈ X∩]x − δ, x + δ[: |f (x) − f (y)| < ε . Pertanto, il numero reale strettamente positivo δ dipende oltre che dal numero ε > 0 anche dall’elemento x ∈ X fissato. Ci si occuperà ora delle Capitolo 8: Funzioni continue 208 funzioni continue per le quali sia possibile scegliere in corrispondenza di ogni ε > 0 un numero δ che soddisfi la condizione precedente per ogni x ∈ X. Precisamente, si assume la seguente definizione. Definizione 8.4.1 Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione reale. Si dice che f è una funzione uniformemente continua se soddisfa la condizione seguente ∀ ε > 0 ∃ δ > 0 t.c. ∀ x, y ∈ X : |x − y| < δ ⇒ |f (x) − f (y)| < ε . (8.4.1) Ovviamente, una funzione uniformemente continua risulta sempre continua. Il viceversa non vale in generale. Ad esempio, se si considera la funzione potenza f (x) = x2 , x ∈ R, la diseguaglianza |f (x) − f (y)| < ε, con ε > 0 fissato, si scrive |x2 − y 2 | < ε ed è equivalente a |(x − y)(x + y)| < ε; se si considera y = x + δ/2 con δ > 0, la diseguaglianza precedente diventa |δ/2 (2x + δ/2)| < ε e non può essere soddisfatta se x ≥ 0 e x ≥ ε/delta − δ/4. Quindi in questo caso comunque si scelga il numero δ, la (8.4.1) non può essere soddisfatta per ogni x, y ∈ R tali che |x − y| < δ. ◃ Si riconosce facilmente che la somma di due funzioni uniformemente continue è anch’essa uniformemente continua. Se le funzioni sono limitate e uniformemente continue, anche la funzione prodotto è uniformemente continua. Senza l’ipotesi di limitatezza in generale non si può affermare che il prodotto di due funzioni uniformemente continue è uniformemente continua, come accade, ad esempio, per la funzione identica f (x) = x, x ∈ R, moltiplicata per sé stessa. ◃ Nel caso in cui la funzione sia definita in un intervallo chiuso e limitato, la proprietà di uniforme continuità equivale a quella di continuità. Teorema 8.4.2 (Teorema sull’uniforme continuità di Heine-Cantor) Se f : [a, b] → R è una funzione continua, allora f è uniformemente continua. Dimostrazione. Si supponga, per assurdo, che f non sia uniformemente continua. Allora, negando la condizione (8.4.1), deve esistere ε0 > 0 tale che, per ogni δ > 0, si possono trovare x ∈ [a, b] e y ∈ [a, b] verificanti le condizioni |x − y| < δ e |f (x) − f (y)| ≥ ε0 . In particolare, per ogni n ∈ N, applicando tale proprietà con δ = 1/(n + 1), si ottengono an ∈ [a, b] e bn ∈ [a, b] tali che |an − bn | < 1/(n + 1) e |f (an ) − f (bn )| ≥ ε0 . Si considerino ora le successioni (an )n∈N e (bn )n∈N di elementi di [a, b]. Esse sono limitate e quindi dal Corollario 7.1.13 esiste una successione (ak(n) )n∈N estratta dalla successione (an )n∈N convergente verso un numero reale x0 ∈ R; poiché an ∈ [a, b] per ogni n ∈ N, deve essere anche x0 ∈ [a, b]. Inoltre, per ogni n ∈ N, 0 ≤ |ak(n) − bk(n) | < 1 1 ≤ k(n) + 1 n+1 (1) 8.4 Funzioni uniformemente continue 209 e quindi limn→+∞ |ak(n) −bk(n) | = 0, da cui limn→+∞ bk(n) = limn→+∞ ak(n) +(bk(n) − ak(n) ) = x0 . Poiché la funzione f è continua in x0 , dalla caratterizzazione sequenziale del limite (Teorema 7.1.3) si deve avere limn→+∞ f (ak(n) ) = f (x0 ), limn→+∞ f (bk(n) ) = f (x0 ) e conseguentemente limn→+∞ |f (ak(n) ) − f (bk(n) )| = 0. A questo punto, poiché ε0 > 0, dalla definizione di limite, deve esistere ν ∈ N tale che, per ogni n ≥ ν, |f (ak(n) )− f (bk(n) )| < ε0 , e ciò contraddice la (1). ◃ Una funzione reale f : X → R si dice lipschitziana se esiste un numero reale L ∈ R+ tale che, per ogni x, y ∈ X, |f (x) − f (y)| ≤ L|x − y| . (8.4.2) Il numero L viene denominato inoltre costante di Lipschitz della funzione f. Spesso si dice anche che f è L-lipschitziana per indicare che f è lipschitziana e che L è una sua costante di Lipschitz. ◃ Vale il seguente legame con le funzioni uniformemente continue. Proposizione 8.4.3 Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione lipschitziana. Allora f è uniformemente continua. Dimostrazione. Sia L ∈ R+ una costante di Lipschitz di f . Fissato ε > 0 e posto δ = ε/(L + 1), dalla (8.4.2) si ha, per ogni x, y ∈ X tali che |x − y| < δ, L ε<ε L+1 e ciò, per l’arbitrarietà di ε > 0, dimostra che f è uniformemente continua. |f (x) − f (y)| ≤ L|x − y| < Lδ = La proposizione precedente non può essere invertita nemmeno se f è uniformemente continua in un intervallo chiuso e limitato. Ad esempio, la restrizione della funzione radice quadrata all’intervallo [0, 1] è continua e quindi, per il Teorema 8.4.2, è anche uniformemente√ continua, ma non è √ lipschitziana; infatti, se L ∈ R+ , la diseguaglianza x − y| ≤ L|x − y| √ | √ comporta, moltiplicando entrambi i membri per x + y, √ √ |x − y| ≤ L|x − y|( x + y) √ √ e può essere verificata solo se x = y oppure se L ̸= 0 e x + y ≥ 1/L. ◃ Si osserva infine che se f : X → R e g : X → R sono funzioni reali lipschitziane con costanti di Lipschitz L1 e rispettivamente L2 , allora 1) f + g è (L1 + L2 )-lipschitziana. 2) Se f e g sono limitate e se, per ogni x ∈ X, |f (x)| ≤ M1 e |g(x)| ≤ M2 , il prodotto f · g è (L1 M2 + L2 M1 )-lipschitziana. 3) Se λ ∈ R, la funzione λ f è |λ| L-lipschitziana. Capitolo 9 Calcolo differenziale Il calcolo differenziale mette a disposizione alcuni degli strumenti più efficaci per lo studio di una funzione reale. Nella prima sezione ci si occupa delle definizioni, della loro interpretazione geometrica e delle regole di derivazione; nella seconda sezione si studiano i risultati più importanti riguardanti le funzioni derivabili ed infine nell’ultima sezione i risultati ottenuti vengono applicati allo studio delle funzioni reali. 9.1 9.1.1 Funzioni derivabili Definizioni ed interpretazione geometrica Definizione 9.1.1 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale. Si dice che f è dotata di derivata in x0 se esiste il limite lim x→x0 f (x) − f (x0 ) . x − x0 In tal caso, tale limite viene denominato derivata di f in x0 (oppure derivata prima di f in x0 ) e denotato con uno dei simboli: ( ) df (x0 ) df (x) f ′ (x0 ) , Df (x0 ) , (talvolta (Df (x))x=x0 , ); dx dx x=x0 pertanto f (x) − f (x0 ) . (9.1.1) x − x0 Se, in più, il limite (9.1.1) esiste ed è finito, si dice che f è derivabile in x0 . f ′ (x0 ) := lim x→x0 Capitolo 9: Calcolo differenziale 212 Inoltre, se A è un sottoinsieme di X, si dice che f è dotata di derivata in A (rispettivamente, derivabile in A) se essa è dotata di derivata (rispettivamente, derivabile) in ogni elemento x0 ∈ A. Infine, si dice che f è dotata di derivata (rispettivamente, derivabile) se è dotata di derivata in X (rispettivamente, derivabile in X). Posto h := x − x0 , il limite (9.1.1) può essere espresso come segue f ′ (x0 ) = lim h→0 f (x0 + h) − f (x0 ) . h La funzione Rx0 (f ) : X r {x0 } → R definita ponendo, per ogni x ∈ X r {x0 }, f (x) − f (x0 ) Rx0 (f )(x) := (9.1.2) x − x0 viene denominata funzione rapporto incrementale di f in x0 . Quindi f è dotata di derivata in x0 se e solo la funzione rapporto incrementale di f in x0 è dotata di limite in x0 e che, in tal caso, si ha f ′ (x0 ) = lim Rx0 (f )(x) . x→x0 Inoltre, se f è derivabile in x0 , la funzione Rx0 (f ) può essere definita anche in x0 ponendo Rx0 (f ) := f ′ (x0 ) e in tal modo risulta continua in x0 . Nel seguito, la funzione Rx0 (f ) si intenderà definita in tutto X nel case in cui f sia derivabile. Se il punto x0 è di accumulazione a destra oppure a sinistra si può definire in maniera analoga la derivata destra o sinistra di f in x0 . Precisamente, se x0 ∈ X è un punto di accumulazione a destra (rispettivamente, a sinistra) per X ed f : X → R è una funzione reale, si dice che f è dotata di derivata destra (rispettivamente, sinistra) in x0 se esiste il limite lim+ x→x0 f (x) − f (x0 ) x − x0 (rispettivamente, lim− x→x0 f (x) − f (x0 ) ). x − x0 Il limite precedente, se esiste, viene denominato derivata destra (rispettivamente, sinistra) di f in x0 e denotato con uno dei simboli: ′ f+ (x0 ) , Dd f (x0 ) ′ (rispettivamente, f− (x0 ) , Ds f (x0 ) ); pertanto ′ f+ (x0 ) := ′ (rispettivamente, f− (x0 ) := lim f (x) − f (x0 ) , x − x0 lim f (x) − f (x0 ) ). x − x0 x→x+ 0 x→x− 0 (9.1.3) 9.1 Funzioni derivabili 213 Se il limite (9.1.3) esiste ed è finito, si dice che f è derivabile a destra (rispettivamente, a sinistra) in x0 . Anche in questo caso, se A è un sottoinsieme di X, si dice che f è dotata di derivata destra (rispettivamente, dotata di derivata sinistra, derivabile a destra, derivabile a sinistra) in A se essa è dotata di derivata destra (rispettivamente, dotata di derivata sinistra, derivabile a destra, derivabile a sinistra) in ogni elemento x0 ∈ A. Quando il sottoinsieme A non viene specificato si intende l’intero X. Assegnata una funzione reale f : X → R, e considerati gli insiemi X′ := {x0 ∈ X | f è derivabile in x0 } , ′ X+ ′ X− := := {x0 ∈ X | f è derivabile a destra in x0 } , {x0 ∈ X | f è derivabile a sinistra in x0 } , ′ ′ →R → R e g− : X− si possono definire le funzioni g : X ′ → R, g+ : X+ ′ ′ ′ ′ ′ ′ ′ ponendo g(x) := f (x) (x ∈ X ), g+ (x) := f+ (x) (x ∈ X+ ), g− (x) := f− (x) ′ (x ∈ X− ); la funzione g viene denominata funzione derivata prima di f e denotata con il simbolo f ′ , mentre le funzioni g+ e g− vengono denominate rispettivamente funzione derivata destra e funzione derivata sinistra di f e ′ ′ denotate con il simbolo f+ e rispettivamente f− . ◃ Dalle definizioni assunte e dai teoremi sui limiti segue direttamente che se x0 ∈ X è un punto di accumulazione sia a destra che a sinistra per X, allora una funzione reale f : X → R è dotata di derivata (rispettivamente, è derivabile) in x0 se e solo se f è dotata di derivata a destra e a sinistra (rispettivamente, f è derivabile sia a destra che a sinistra) in x0 ed inoltre ′ ′ (x0 ). (x0 ) = f− f+ ◃ Nel risultato seguente si esaminano le relazioni esistenti tra derivabilità e continuità. Proposizione 9.1.2 (Continuità delle funzioni derivabili) Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale. Se f è derivabile in x0 , allora essa è continua in x0 . Conseguentemente, se f è derivabile, allora f è anche continua. Dimostrazione. Per ogni x ∈ X r {x0 }, si può scrivere f (x) = f (x) − f (x0 ) + f (x0 ) = f (x) − f (x0 ) (x − x0 ) + f (x0 ) ; x − x0 poiché f è derivabile in x0 , segue ( ) f (x) − f (x0 ) lim f (x) = lim (x − x0 ) + f (x0 ) = f ′ (x0 ) · 0 + f (x0 ) = f (x0 ) , x→x0 x→x0 x − x0 Capitolo 9: Calcolo differenziale 214 da cui la tesi. Si osserva che la Proposizione 9.1.2 non può essere invertita. Ad esempio, la funzione valore assoluto è continua in 0 ma non è derivabile in 0 in quanto lim+ x→0 |x| − |0| x = lim = 1 , x→0 x x−0 lim− x→0 |x| − |0| −x = lim = −1 , x→0 x x−0 e quindi la derivata destra non coincide con quella sinistra. ◃ Si considera ora un’interpretazione geometrica della derivata di una funzione in un punto x0 . Si supponga che f : X → R sia dotata di derivata in x0 e sia t ∈ X r {x0 }; si denoti con P0 il punto del piano cartesiano di coordinate (x0 , f (x0 )) e con P quello di coordinate (t, f (t)). Allora la retta passante per i punti P0 e P ha equazione y − f (x0 ) f (t) − f (x0 ) = . x − x0 t − x0 Tale retta viene denominata secante il grafico di f nei punti P0 e P ed il suo coefficiente angolare è dato dal rapporto incrementale di f in x0 calcolato in t. Considerando il limite del rapporto incrementale nel punto x0 , il coefficiente angolare della retta secante tende verso il numero f ′ (x0 ), che rappresenta ancora il coefficiente angolare di una retta passante per P0 . Tale retta viene denominata retta tangente al grafico di f nel punto P0 . Considerando il limite per t → x0 nell’equazione della retta secante, segue che se f è derivabile in x0 , l’equazione della retta tangente è data da y = f (x0 ) + f ′ (x0 )(x − x0 ) . (9.1.4) mentre se f è dotata di derivata in x0 uguale a +∞ oppure a −∞, l’equazione della retta tangente è x = x0 . (9.1.5) ◃ La stessa interpretazione geometrica può essere fornita per le funzioni che non sono dotate di derivata in x0 , ma per cui esiste la derivata destra in x0 e la derivata sinistra in x0 . Ad esempio, se f è derivabile a destra e ′ ′ a sinistra in x0 e se f+ (x0 ) ̸= f− (x0 ), allora non si può considerare la retta tangente al grafico di f in x0 , ma si possono considerare la retta tangente a destra al grafico di f in x0 , di equazione ′ y = f (x0 ) + f+ (x0 )(x − x0 ) 9.1 Funzioni derivabili 215 y P P0 0 x0 t x Figura 9.1: Interpretazione geometrica della derivata. e la retta tangente a sinistra al grafico di f in x0 , di equazione ′ y = f (x0 ) + f− (x0 )(x − x0 ) ; in questo caso, il punto x0 viene detto punto angoloso. Ad esempio, la funzione valore assoluto nel punto 0 è dotata di retta tangente a destra in 0 di equazione y = x e di retta tangente a sinistra in 0 di equazione y = −x. Si può anche presentare il caso in cui la funzione sia dotata di derivata a sinistra di x0 uguale a +∞ oppure a −∞ e sia invece derivabile a destra di x0 (o viceversa); in tal caso, la retta tangente a sinistra in x0 ha equazione x = x0 , mentre l’equazione della tangente destra è data da y = f (x0 ) + ′ f+ (x0 )(x − x0 ). Il punto x0 viene denominato punto angoloso anche in questo caso. Ad esempio, si può considerare ne punto 0 la funzione f : R → R definita ponendo f (0) := 0 e f (x) := e1/x se x ̸= 0. In questo caso la retta di equazione x = 0 è tangente a destra al grafico di f in 0, mentre la retta y = 0 è tangente a sinistra al grafico di f in 0. Infine, si può presentare il caso in cui la derivata destra in x0 è uguale a +∞ e quella sinistra è uguale a −∞ oppure viceversa. In questo caso il Capitolo 9: Calcolo differenziale 216 punto x0 viene denominato punto cuspidale. Si osservi che il grafico di f è dotato di retta tangente sia a sinistra che a destra di equazione x = x0 . Ad esempio, si per ogni √consideri la funzione f : R → R definita ponendo, ′ (0) = +∞ x ∈ R, f (x) := |x|. Nel punto 0 si verifica facilmente che f+ ′ mentre f− (0) = −∞. ◃ Se f : X → R è una funzione reale, si è già considerato l’insieme X ′ degli elementi di X in cui f è derivabile e si è definita la funzione derivata prima f ′ : X ′ → R; naturalmente, se x0 ∈ X ′ è un punto di accumulazione per X ′ ha senso chiedersi se la funzione f ′ sia a sua volta derivabile in x0 . Vale quindi la seguente definizione. Definizione 9.1.3 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale. Si dice che f è dotata di derivata seconda (rispettivamente, derivabile due volte) in x0 se esiste δ > 0 tale che f sia derivabile in X∩]x0 −δ, x0 +δ[ e inoltre la funzione derivata prima f ′ è dotata di derivata (rispettivamente, derivabile) in x0 . In tal caso, la derivata (f ′ )′ (x0 ) viene denominata derivata seconda di f in x0 e denotata con uno dei seguenti simboli f ′′ (x0 ) , D2 f (x0 ) , d2 f (x0 ) . dx2 Inoltre, se A è un sottoinsieme di X, si dice che f è dotata di derivata seconda (rispettivamente, derivabile) in A, se essa è dotata di derivata seconda (rispettivamente, derivabile) in ogni x0 ∈ A. Infine, si dice che f è dotata di derivata seconda (rispettivamente, derivabile) se essa è dotata di derivata seconda (rispettivamente, derivabile) in X. In base alla definizione precedente, si può considerare l’insieme X ′′ := {x ∈ X | f è derivabile due volte in x} e si può definire la funzione g : X ′′ → R ponendo, per ogni x ∈ X ′′ , g(x) = f ′′ (x). Tale funzione viene denominata derivata seconda di f e denotata con il d2 f simbolo f ′′ (oppure D2 f , ). dx2 In maniera analoga si definiscono le derivate successive di f in un punto oppure in un sottoinsieme. Fissato un numero naturale n ≥ 1, la derivata n-esima di f in un punto x0 si denota con uno dei simboli f (n) (x0 ) , Dn f (x0 ) , dn f (x0 ) , dxn 9.1 Funzioni derivabili e la funzione derivata n-esima con il simbolo f (n) (oppure Dn f , Per uniformità di notazioni conviene anche porre f (0) = f . 217 dn f ). dxn ◃ Se X è un sottoinsieme di R, si ricorda che il simbolo C(X) denota l’insieme di tutte le funzioni reali continue definite in X. Più in generale, sarà utile considerare, per ogni numero naturale n ∈ N, l’insieme C n (X) := {f ∈ C(X) | f è derivabile n volte in X e f (n) è continua} . L’insieme C 0 (X) coincide con C(X) e l’insieme C 1 (X) è costituito dalle funzioni derivabili tali che f ′ ∈ C(X). Le funzioni f : X → R che sono derivabili n volte per ogni n ∈ N vengono denominate infinite volte derivabili ; si pone C ∞ (X) := {f ∈ C(X) | f è infinite volte derivabile in X} ; ovviamente, la derivata n-esima f (n) di una funzione f ∈ C ∞ (X) è sicuramente continua in quanto è a sua volta derivabile (anzi, f (n) ∈ C ∞ (X)). 9.1.2 Regole di derivazione Assegnata una funzione reale, lo studio della sua derivabilità ed il calcolo della derivata può essere effettuato utilizzando le regole di derivazione presentate e il calcolo delle derivate delle funzioni elementari di cui ci si occupa nella presente sezione e nella successiva. Per semplicità, viene considerato solamente il caso di funzioni derivabili; una discussione del tutto analoga vale per funzioni derivabili a destra oppure a sinistra. Teorema 9.1.4 (Derivabilità della funzione somma) Siano X un sottoinsieme non vuoto di R ed f : X → R e g : X → R funzioni reali. Se x0 ∈ X è un punto di accumulazione per X ed f e g sono derivabili in x0 , allora f + g è derivabile in x0 e si ha (f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ) . Conseguentemente, se f e g sono derivabili, anche la funzione somma f + g è derivabile e si ha (f + g)′ = f ′ + g ′ . Dimostrazione. Dal primo teorema sul limite della somma si ha (f + g)(x) − (f + g)(x0 ) f (x) − f (x0 ) g(x) − g(x0 ) lim = lim + lim x→x0 x→x0 x→x0 x − x0 x − x0 x − x0 = f ′ (x0 ) + g ′ (x0 ) , da cui segue interamente la tesi. Capitolo 9: Calcolo differenziale 218 Teorema 9.1.5 (Regola di Leibnitz sulla derivabilità della funzione prodotto) Siano X un sottoinsieme non vuoto di R ed f : X → R e g : X → R funzioni reali. Se x0 ∈ X è un punto di accumulazione per X ed f e g sono derivabili in x0 , allora la funzione f · g è derivabile in x0 e si ha (f · g)′ (x0 ) = f ′ (x0 )g(x0 ) + f (x0 )g ′ (x0 ) . Conseguentemente, se f e g sono derivabili, anche la funzione prodotto f · g è derivabile e si ha (f · g)′ = f ′ · g + f · g ′ . Dimostrazione. Dal primo teorema sul limite del prodotto e tenendo presente che g è continua in x0 (Proposizione 9.1.2), si ha lim (f · g)(x) − (f · g)(x0 ) x − x0 f (x)g(x) − f (x0 )g(x) f (x0 )g(x) − f (x0 )g(x0 ) = lim + lim x→x0 x→x0 x − x0 x − x0 f (x) − f (x0 ) g(x) − g(x0 ) = lim g(x) + lim f (x0 ) x→x0 x→x0 x − x0 x − x0 ′ ′ = g(x0 )f (x0 ) + f (x0 )g (x0 ) , x→x0 e da ciò segue la tesi. Teorema 9.1.6 (Derivabilità della funzione reciproca) Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione reale tale che, per ogni x ∈ X, f (x) ̸= 0. Se x0 ∈ X è un punto di accumulazione per X e se f è derivabile in x0 , allora la funzione reciproca 1/f è derivabile in x0 e si ha ( )′ 1 f ′ (x0 ) (x0 ) = − . f f (x0 )2 Conseguentemente, se f è derivabile, anche la funzione reciproca 1/f è derivabile e si ha ( )′ 1 f′ =− 2 . f f Dimostrazione. Dalla Proposizione 9.1.2, la funzione f è continua in x0 e quindi lim x→x0 (1/f )(x) − (1/f )(x0 ) −(f (x) − f (x0 )) 1 f ′ (x0 ) = lim =− , x→x0 x − x0 x − x0 f (x) f (x0 ) f (x0 )2 da cui la tesi. 9.1 Funzioni derivabili 219 Teorema 9.1.7 (Derivabilità della funzione quoziente) Siano X un sottoinsieme non vuoto di R ed f : X → R e g : X → R funzioni reali. Si supponga che, per ogni x ∈ X, g(x) ̸= 0. Se x0 ∈ X è un punto di accumulazione per X ed f e g sono derivabili in x0 , allora la funzione f /g è derivabile in x0 e si ha ( )′ f ′ (x0 ) g(x0 ) − f (x0 ) g ′ (x0 ) f (x0 ) = . g g(x0 )2 Conseguentemente, se f e g sono derivabili, anche la funzione quoziente f /g è derivabile in x0 e si ha ( )′ f f ′ g − f g′ = . g g2 Dimostrazione. Poiché f 1 =f· , g g la derivabilità di f /g deriva direttamente dai Teoremi 9.1.6 e 9.1.5 precedenti; inoltre, dagli stessi teoremi segue ( )′ ( )′ 1 1 f ′ (x0 ) g(x0 ) − f (x0 ) g ′ (x0 ) f (x0 ) = f ′ (x0 ) + f (x0 ) (x0 ) = . g g(x0 ) g g(x0 )2 e ciò completa la dimostrazione. Si esamina, infine, la derivabilità delle funzioni composte e delle funzioni inverse. Teorema 9.1.8 (Teorema di derivazione delle funzioni composte) Siano X e Y sottoinsiemi non vuoti di R ed f : X → R e g : Y → R funzioni reali tali che f (X) ⊂ Y . Sia x0 ∈ X un punto di accumulazione per X e si supponga che f sia derivabile in x0 e, posto y0 := f (x0 ), che y0 sia di accumulazione per Y e g sia derivabile in y0 . Allora, la funzione composta g ◦ f : X → R è derivabile in x0 e si ha (g ◦ f )′ (x0 ) = g ′ (y0 ) f ′ (x0 ) . Dimostrazione. Per quanto osservato in precedenza (vedasi la (9.1.2)), la funzione Ry0 (g) : Y → R è continua in y0 e inoltre, dalla Proposizione 9.1.2, la funzione f è continua in x0 . Allora, dal teorema sulla continuità delle funzioni composte (Teorema 8.1.3), la funzione Ry0 (g) ◦ f è continua in x0 e pertanto lim x→x0 g(f (x)) − g(y0 ) = g ′ (y0 ) . f (x) − y0 Da ciò segue lim x→x0 g(f (x)) − g(f (x0 )) x − x0 = = = lim g(f (x)) − g(f (x0 )) f (x) − f (x0 ) f (x) − f (x0 ) x − x0 lim g(f (x)) − g(y0 ) f (x) − y0 x→x0 x→x0 g ′ (y0 )f ′ (x0 ) lim x→x0 f (x) − f (x0 ) x − x0 Capitolo 9: Calcolo differenziale 220 e quindi la tesi. Se f : X → R è una funzione reale iniettiva, posto Y = f (X), si può considerare la funzione “inversa” f −1 : Y → R di f . Se x0 ∈ X è un punto di accumulazione per X e se f è continua in x0 , allora l’elemento y0 = f (x0 ) di Y è un punto di accumulazione per Y . Infatti, considerato un intorno I di y0 , dalla continuità di f in x0 , si può trovare un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, f (x) ∈ I; l’insieme X ∩ J r {x0 } è non vuoto in quanto x0 è di accumulazione per X e considerato x ∈ X ∩ J r {x0 }, dalla iniettività di f , segue f (x) ̸= y0 , per cui f (x) ∈ Y ∩ I r {y0 }; segue pertanto che l’insieme Y ∩ I r {y0 } è non vuoto e ciò, essendo I un intorno arbitrario di y0 , dimostra che y0 è di accumulazione per Y . Per quanto riguarda la derivabilità di f −1 in y0 , si ha quanto segue. Teorema 9.1.9 (Derivabilità della funzione inversa) Siano X un sottoinsieme non vuoto di R ed f : X → R una funzione reale iniettiva. Sia x0 ∈ X un punto di accumulazione per X e si supponga che f sia derivabile in x0 e che f ′ (x0 ) ̸= 0. Posto Y = f (X) e y0 = f (x0 ), se la funzione inversa f −1 : Y → R di f è continua in y0 , allora f −1 è derivabile in y0 e si ha 1 (f −1 )′ (y0 ) = ′ . f (x0 ) Conseguentemente, se f è derivabile e se f −1 è continua, allora f −1 è derivabile e si ha 1 (f −1 )′ = ′ . f ◦ f −1 Dimostrazione. La funzione Rx0 (f ) : X → R è continua in x0 (vedasi la (9.1.2)) e inoltre nel punto x0 assume il valore f ′ (x0 ) ̸= 0 e, dalla iniettività di f , Rx0 (f )(x) ̸= 0 per ogni x ∈ X r {x0 }. Quindi Rx0 (f ) assume valori sempre diversi da 0 e se ne può considerare la funzione reciproca 1/Rx0 (f ) : X → R, la quale risulta continua in y0 . Inoltre f −1 è continua in y0 e quindi, dal teorema sulla continuità delle funzioni composte (Teorema 8.1.3), si ha ) ( ) ( 1 1 ◦ f −1 (y) = ◦ f −1 (y0 ) ; lim y→y0 Rx0 (f ) Rx0 (f ) da tale relazione, essendo per ogni y ∈ Y r {y0 }, ( ) 1 1 f −1 (y) − x0 f −1 (y) − f −1 (y0 ) ◦ f −1 (y) = = = f (f −1 (y)) − f (x0 ) Rx0 (f ) f (f −1 (y)) − f (x0 ) y − y0 f −1 (y) − x0 e inoltre ( 1 ◦ f −1 Rx0 (f ) si ha direttamente la tesi. ) (y) = 1 1 (x0 ) = ′ , Rx0 (f ) f (x0 ) ◃ Se non si suppone che f −1 sia continua in y0 , la tesi del teorema precedente in generale non vale. 9.1 Funzioni derivabili 221 Ad esempio, si consideri la funzione reale f :] − 1, 1] → R definita ponendo, per ogni x ∈] − 1, 1], { f (x) := x ∈] − 1, 0] , x ∈]0, 1] ; x+1, x−1, Nel punto x0 = 1, f è derivabile e si verifica direttamente che f’(1)=1=S 0/0; inoltre f è iniettiva e la funzione f −1 risulta definita in ] − 1, 1] e si ha, per ogni y ∈] − 1, 1], f −1 (y) = { y−1, y+1, y ∈] − 1, 0] , y ∈]0, 1] . −1 Nel punto y0 = f (1) = 0, f −1 non è continua e risulta f+ (0) = 1 e −1 −1 f− (0) = −1, per cui f non è derivabile in 0. 9.1.3 Derivate delle funzioni elementari Nella presente sezione vengono calcolate le derivate delle funzioni elementari. Funzioni potenza ad esponente intero positivo Si consideri la funzione potenza n-esima fn : R → R, n ≥ 1, e sia x0 ∈ R. Per ogni x ∈ R, si ha xn − xn0 = (x − x0 ) n−1 ∑ xk x0n−k k=0 e quindi ∑ xn − xn0 = lim xk x0n−k = nxn−1 0 x→x0 x − x0 n−1 lim x→x0 k=0 (se n = 1, si assume per convenzione x00 = 1 per x0 = 0). Pertanto la funzione potenza fn è derivabile in x0 e (fn )′ (x0 ) = nxn−1 . 0 Dall’arbitrarietà di x0 ∈ R, segue che fn è derivabile e, per ogni x ∈ R, Dxn = nxn−1 . Capitolo 9: Calcolo differenziale 222 Funzioni radice Si consideri la funzione radice f1/n , n ≥ 1. Se x0 ̸= 0, si ha √ √ √ √ n n √ x0 + h − n x 1 x0 + h − n x n lim = x0 lim √ h→0 h→0 n x0 h h √ n h/x0 − 1 √ = n x0 lim h→0 h ( )1/n h √ 1+ −1 n x x0 0 = lim x0 h→0 h/x0 = 1 (1 + y)1/n − 1 1 1 √ √ lim = . y n n n n−1 y→0 x0 xn−1 0 Segue che f1/n è derivabile in ogni x ∈]0, +∞[ per n pari ed in ogni x ∈ R r {0} se n è dispari e la sua derivata è data da 1 1 √ . n n xn−1 Per quanto riguarda il punto x0 = 0, per ogni n ≥ 2 risulta √ n x lim = +∞ x→0 x e quindi la funzione radice n-esima è dotata di derivata in 0 uguale a +∞. Funzioni potenza ad esponente intero negativo Si consideri la funzione potenza ad esponente intero negativo f−n : R r{ 0} → R, n ≥ 1. Tale funzione è la reciproca della restrizione della funzione potenza fn all’insieme R r {0}; essa pertanto è derivabile e, per ogni x ∈ R r {0}, si ha ( ) 1 nxn−1 n D = − = − n+1 . n 2n x x x Funzioni potenza ad esponente razionale o reale Si consideri la funzione potenza ad esponente razionale o reale fr definita in ]0, +∞[ per r ≤ 0 ed in [0, +∞[ per r > 0. Per ogni x0 ∈]0, +∞[ risulta (x0 + h)r − xr0 h→0 h lim xr0 (1 + h/x0 )r − 1 lim h→0 x0 h→0 h/x0 r (1 + y) − 1 = xr−1 lim = rxr−1 . 0 0 y→0 y = xr0 lim 9.1 Funzioni derivabili 223 Quindi fr è derivabile in x0 e la sua derivata è rxr−1 . Si conclude che fr è 0 derivabile in ]0, +∞[ e, per ogni x ∈]0, +∞[ si ha D(xr ) = rxr−1 . Se r > 0, nel punto x0 = 0, si ha 0, xr 1, lim+ = x x→0 +∞ , r>1; r=1; 0<r<1. Quindi, se r ≥ 1, fr è derivabile in 0 con derivata nulla per r > 1 ed uguale ad 1 per r = 1 ed è dotata di derivata in 0 uguale a +∞ se 0 < r < 1. Funzioni esponenziali Sia a > 0, a ̸= 1 e si consideri la funzione esponenziale expa : R → R. Allora, per ogni x0 ∈ R, si ha ax0 +h − ax0 ah − 1 = ax0 lim = ax0 log a . h→0 h→0 h h lim Quindi expa è derivabile e, per ogni x ∈ R, D(ax ) = ax log a . In particolare, per ogni x ∈ R, si ha D(ex ) = ex . Funzioni logaritmo Sia a > 0, a ̸= 1 e si consideri la funzione logaritmo loga :]0, +∞[→ R. Dal Teorema 9.1.9 segue che essa è derivabile e, per ogni x ∈]0, +∞[, posto y = loga x, si ha D(loga x) = 1 1 1 = y = . y D(a ) a log a x log a In particolare, per ogni x ∈ R, D(log x) = 1/x. Funzioni trigonometriche Si considerano ora le funzioni seno, coseno, tangente e cotangente. Per ogni x0 ∈ R, risulta lim h→0 sin(x0 + h) − sin x0 h sin x0 cos h + cos x0 sin h − sin x0 h cos h − 1 sin h + sin x0 lim = cos x0 lim h→0 h→0 h h = cos x0 = lim h→0 Capitolo 9: Calcolo differenziale 224 e analogamente lim h→0 cos(x0 + h) − cos x0 h = = = cos x0 cos h − sin x0 sin h − cos x0 h sin h cos h − 1 − sin x0 lim + cos x0 lim h→0 h h→0 h − sin x0 . lim h→0 Quindi le funzioni seno e coseno sono derivabili e si ha, per ogni x ∈ R, D(sin x) = cos x , D(cos x) = − sin x . Essendo quoziente di funzioni derivabili, dal Teorema 9.1.7 segue che anche le funzioni tangente e cotangente sono derivabili e si ha, per ogni x ∈ R r {π/2 + kπ | k ∈ Z}, D(tan x) = 1 = 1 + tan2 x . cos2 x e analogamente, per ogni x ∈ R r {kπ | k ∈ Z}, D(cot x) = − 1 = −(1 + cot2 x) . sin2 x Funzioni trigonometriche inverse Infine, si considerano le funzioni arcoseno, arcocoseno, arcotangente e arcocotangente. La restrizione della funzione seno all’intervallo [−π/2, π/2] è derivabile e la sua derivata si annulla solamente nei punti −π/2 e π/2, che sono i valori della funzione arcoseno agli estremi dell’intervallo [−1, 1]. Dal Teorema 9.1.9 segue che la funzione arcoseno è derivabile in ] − 1, 1[ e per ogni √ x ∈] − 1, 1[, posto y = arcsin x ∈] − π/2, π/2[, si ottiene sin y = x e cos y = 1 − x2 (si è tenuto presente che nell’intervallo ] − π/2, π/2[ il coseno è positivo), per cui 1 1 1 D(arcsin x) = = =√ . D(sin y) cos y 1 − x2 Per quanto riguarda i punti −1 ed 1, si verifica direttamente che in tali punti la funzione arcoseno è dotata di derivata uguale a +∞. Per la funzione arcocoseno il procedimento è analogo a quello precedente; si osserva che la restrizione della funzione coseno all’intervallo [0, π] è derivabile e la sua derivata si annulla solamente nei punti 0 e π; tali valori sono assunti dalla funzione arcocoseno nei punti 1 e rispettivamente −1. Applicando il Teorema 9.1.9 si deduce che la funzione arcocoseno è derivabile in ] − 1, 1[ e per ogni x ∈] − 1, 1[, posto y = arccos x ∈]0, π[, si ottiene 9.1 Funzioni derivabili cos y = x e sin y = ]0, π[; pertanto 225 √ 1 − x2 in quanto il coseno è positivo nell’intervallo D(arccos x) = 1 1 1 =− =−√ . D(cos y) sin y 1 − x2 Nei punti −1 ed 1, si verifica direttamente che la funzione arcocoseno è dotata di derivata uguale a −∞. Si consideri ora la funzione arcotangente. In questo caso, la restrizione della funzione tangente all’intervallo ]−π/2, π/2[ è derivabile e la sua derivata è sempre diversa da 0. Dal Teorema 9.1.9 segue che la funzione arcotangente è derivabile e inoltre, per ogni x ∈ R, posto y = arctan x ∈]−π/2, π/2[, si ottiene tan y = x, per cui D(arctan x) = 1 1 1 = = . 2 D(tan y) 1 + x2 1 + tan y Infine, per quanto riguarda la derivabilità della funzione arcocotangente, si può procedere come nel caso precedente; la restrizione della funzione cotangente all’intervallo ]0, π[ è derivabile e la sua derivata è sempre diversa da 0. Dal Teorema 9.1.9 segue che la funzione arcocotangente è derivabile e inoltre, per ogni x ∈ R, posto y = arccot x ∈]0, π[, si ottiene cot y = x, per cui 1 1 1 D(arccot x) = =− =− . 2 D(cot y) 1 + x2 1 + cot y La derivabilità ed il calcolo della derivata delle funzioni arcocoseno ed arcocotangente potevano essere ottenute alternativamente dalle uguaglianze arccos = π − arcsin , 2 arctan = π − arccot . 2 Funzione valore assoluto Si è già osservato che tale funzione non è derivabile in 0 e che in tale punto ha derivata destra uguale ad 1 e derivata sinistra uguale a −1. Sia ora x0 ∈ R r {0}; se x0 > 0, si ha lim x→x0 |x| − |x0 | x − x0 = lim =1, x→x0 x − x0 x − x0 mentre, se x0 < 0, risulta lim x→x0 x − x0 |x| − |x0 | = lim − = −1 , x→x0 x − x0 x − x0 226 Capitolo 9: Calcolo differenziale Quindi la funzione valore assoluto è derivabile in R r {0} e, per ogni x ∈ R r {0}, si ha x |x| D(|x|) = (= ). |x| x Osservazione 9.1.10 (Studio della derivabilità di una funzione reale) Le regole di derivazione e le derivate delle funzioni elementari consentono in numerosi casi di discutere la derivabilità e, in caso affermativo, di determinare la derivata di una funzione reale f : X → R ottenuta mediante operazioni algebriche sulle funzioni elementari. In generale si procede come segue: 1. Innanzitutto, si determina il sottoinsieme D di X dei punti in cui non si può assicurare subito la derivabilità della funzione. Se la funzione è ottenuta mediante operazioni algebriche o di composizione di funzioni elementari, i punti dell’insieme D sono i seguenti: a) punti in cui l’argomento di una funzione radice o di una funzione potenza con esponente compreso tra 0 e 1 è uguale a 0 (in quanto tali funzioni non sono derivabili in 0); b) punti in cui l’argomento di una funzione arcoseno oppure arcoseno è uguale a 1 oppure a −1 (in quanto le funzioni arcoseno e arcocoseno non sono derivabili nei punti ±1); c) punti in cui l’argomento di un valore assoluto è uguale a 0 (in quanto la funzione valore assoluto non è derivabile nel punto 0). Esclusi i punti precedenti, si può asserire che la funzione f è derivabile in X r D. 2. Utilizzando le regole di derivazione, si calcola la derivata di f nell’insieme X r D. 3. Si studia la derivabilità di f in ogni punto x0 ∈ D. Poiché in questo caso non si possono utilizzare le regole di derivazione, bisogna verificare direttamente la derivabilità attraverso la definizione; nel seguito, si studierà la proprietà di continuità della derivata prima (Teorema 9.3.3) in base alla quale la derivata di f in x0 , se esiste, viene data dal limite limx→x0 f ′ (x) e quindi per lo studio della derivabilità nei punti x0 ∈ D, ci si può avvalere dell’espressione della derivata ottenuta al punto 2) precedente. A questo punto si raccolgono le informazioni ottenute e si precisa definitivamente il sottoinsieme X ′ di X in cui f è derivabile fornendone il valore della derivata in ogni punto di X ′ . 9.2 Teoremi di Rolle, Cauchy e Lagrange 9.2 227 Teoremi di Rolle, Cauchy e Lagrange Anche per le funzioni derivabili valgono risultati di notevole interesse nel caso in cui queste vengano considerate su un intervallo chiuso e limitato. Teorema 9.2.1 (Teorema di Rolle) Sia f : [a, b] → R una funzione reale continua in [a, b] e derivabile nell’intervallo aperto ]a, b[. Se f (a) = f (b), allora esiste almeno un punto x0 ∈]a, b[ tale che f ′ (x0 ) = 0. Dimostrazione. Poiché f è continua, dal teorema di Weierstrass (Teorema 8.2.1), essa è dotata di minimo e di massimo e quindi esistono c, d ∈ [a, b] tali che, per ogni x ∈ [a, b], f (c) ≤ f (x) ≤ f (d). Si supponga dapprima che entrambi i punti c e d siano estremi dell’intervallo [a, b] (c, d ∈ a, b). Dall’ipotesi f (a) = f (b), segue f (c) = f (d) e quindi la funzione f deve essere costante. Allora la derivata di f è costantemente nulla e quindi la tesi è verificata considerando un qualsiasi elemento x0 ∈]a, b[. Si considera ora il caso in cui almeno uno dei punti c oppure d sia interno all’intervallo [a, b]. Si supponga che c ∈]a, b[ per cui f è derivabile in c. Se fosse f ′ (c) > 0, per la proprietà di permanenza del segno applicata alla funzione rapporto incrementale di f relativa a c, si può trovare δ > 0 tale che, per ogni x ∈ [a, b]∩]c − δ, c + δ[r{c}, f (x) − f (c) >0. x−c Poiché c è interno all’intervallo [a, b], l’intersezione [a, b]∩]c − δ, c[ risulta non vuota; considerato x ∈ [a, b]∩]c − δ, c[, risulta innanzitutto (f (x) − f (c))/(x − c) > 0; essendo x − c < 0, dovrà essere anche f (x) − f (c) < 0, da cui f (x) < f (c) e ciò contraddice il fatto che f (c) è il minimo di f . Se fosse f ′ (c) < 0, si troverebbe δ > 0 tale che, per ogni x ∈ [a, b]∩]c − δ, c + δ[r{c}, f (x) − f (c) <0. x−c Poiché c è interno all’intervallo [a, b], si può considerare x ∈ [a, b]∩]c, c + δ[ per il quale (f (x) − f (c))/(x − c) < 0; allora, essendo x − c > 0, si avrebbe ancora f (x) − f (c) < 0 e quindi f (x) < f (c), contraddicendo anche in questo caso il fatto che f (c) è il minimo di f. x0 Si conclude che deve essere necessariamente f ′ (c) = 0 e la tesi segue considerando = c. Se il punto d è interno all’intervallo [a, b], si dimostra in modo analogo che f ′ (d) = 0 e quindi si può considerare x0 = d. Tenendo presente l’interpretazione geometrica della derivata, e che il coefficiente angolare di una retta è uguale a 0 se e solo se la retta è parallela all’asse delle ascisse, si può dire che per una funzione continua in un intervallo chiuso e limitato e derivabile tranne al più che agli estremi, esiste una tangente orizzontale in almeno un punto interno a tale intervallo. Si osservi inoltre che i punti interni in cui la derivata di f si annulla sono quelli di massimo e di minimo per f . Dal teorema di Rolle possono essere dedotti facilmente i seguenti ulteriori risultati. Capitolo 9: Calcolo differenziale 228 y 0 x0 x Figura 9.2: Teorema di Rolle. Teorema 9.2.2 (Teorema di Cauchy) Siano f : [a, b] → R e g : [a, b] → R funzioni reali continue in [a, b] e derivabili in ]a, b[ e si supponga che, per ogni x ∈]a, b[, g ′ (x) ̸= 0. Allora g(a) ̸= g(b) ed inoltre esiste almeno un punto x0 ∈]a, b[ tale che f ′ (x0 ) f (b) − f (a) = . g ′ (x0 ) g(b) − g(a) (9.2.1) Dimostrazione. Se fosse g(a) = g(b), si potrebbe applicare il teorema di Rolle precedente alla funzione g e si otterrebbe l’esistenza di un punto interno all’intervallo [a, b] in cui la derivata di g si annullerebbe, il che è stato escluso per ipotesi. Quindi deve essere g(a) ̸= g(b). Si definisce ora la funzione h : [a, b] → R ponendo, per ogni x ∈ [a, b], h(x) := f (x) − f (b) − f (a) (g(x) − g(a)) . g(b) − g(a) Tale funzione è continua in quanto somma di funzioni continue ed è derivabile in ]a, b[ in quanto somma di funzioni derivabili in ]a, b[; si ha inoltre h(a) = f (a) − f (b) − f (a) (g(a) − g(a)) = f (a) , g(b) − g(a) h(b) = f (b) − f (b) − f (a) (g(b) − g(a)) = f (b) − f (b) + f (a) = f (a) , g(b) − g(a) e quindi h(a) = h(b). Si può pertanto applicare il teorema di Rolle alla funzione h, e si conclude che esiste x0 ∈]a, b[ tale che h′ (x0 ) = 0. Poiché, per ogni x ∈]a, b[, h′ (x) = f ′ (x) − f (b) − f (a) ′ g (x) , g(b) − g(a) 9.2 Teoremi di Rolle, Cauchy e Lagrange da h′ (x0 ) = 0 segue f ′ (x0 ) = 229 f (b) − f (a) ′ g (x0 ) , g(b) − g(a) e dividendo entrambi i membri per g ′ (x0 ) ̸= 0, si ottiene la tesi. Teorema 9.2.3 (Teorema di Lagrange, o del valor medio) Sia f : [a, b] → R una funzione reale continua in [a, b] e derivabile in ]a, b[. Allora esiste almeno un punto x0 ∈]a, b[ tale che f ′ (x0 ) = f (b) − f (a) . b−a (9.2.2) Dimostrazione. Si consideri l’ulteriore funzione g : [a, b] → R definita ponendo, per ogni x ∈ [a, b], g(x) = x. Tale funzione è derivabile e, per ogni x ∈ [a, b], g ′ (x) = 1 ̸= 0. Sono quindi soddisfatte le ipotesi del teorema di Cauchy precedente e pertanto esiste un punto x0 ∈]a, b[ tale che f (b) − f (a) f ′ (x0 ) = ; g ′ (x0 ) g(b) − g(a) poiché g ′ (x0 ) = 1 e g(b) − g(a) = b − a, la tesi è completamente dimostrata. Anche il teorema di Lagrange può essere interpretato geometricamente in modo molto semplice. Si denoti infatti con A il punto del piano cartesiano avente coordinate (a, f (a)) e con B quello di coordinate (b, f (b)); la retta del piano passante per i punti A e B (cioè, la retta secante il grafico di f nei punti a e b) ha equazione y − f (a) f (b) − f (a) = ; x−a b−a da ciò segue che il secondo membro della (9.2.2) rappresenta il coefficiente angolare della retta passante per i punti A e B. Dal teorema di Lagrange, esiste un punto interno x0 ∈]a, b[ tale che la retta tangente al grafico di f in x0 abbia lo stesso coefficiente angolare della retta secante al grafico di f nei punti a e b. Quindi, si conclude che se f : [a, b] → R è continua in [a, b] e derivabile in ]a, b[, esiste almeno un punto interno x0 ∈]a, b[ in cui la retta tangente al grafico di f in x0 e la retta secante il grafico di f nei punti estremi a e b sono parallele. Il teorema di Lagrange è stato dedotto dal teorema di Cauchy il quale a sua volta è stato dimostrato come conseguenza del teorema di Rolle. Si può osservare inoltre che il teorema di Rolle è un caso particolare del teorema di Lagrange in quanto, se f (a) = f (b), il secondo membro della (9.2.2) è nullo. Si conclude che i Teoremi 9.2.1, 9.2.2 e 9.2.3 sono tra loro equivalenti e conseguono dal teorema di Weierstrass per le funzioni continue e derivabili all’interno di un intervallo chiuso e limitato. Capitolo 9: Calcolo differenziale 230 y B A 0 x0 x Figura 9.3: Teorema di Lagrange. 9.3 9.3.1 Applicazioni al calcolo dei limiti Teoremi di L’Höpital Un’importante applicazione del calcolo differenziale riguarda la possibilità di risolvere in maniera elementare alcuni limiti che si presentano in una forma indeterminata. Si riconosce subito, infatti, che se f : X → R e g : X → R sono funzioni derivabili in un punto x0 ∈ X con g ′ (x0 ) ̸= 0 e se f (x0 ) = g(x0 ) = 0, allora per il limite lim x→x0 f (x) , g(x) che si presenta nella forma indeterminata lim x→x0 0 , si ha 0 f (x) f ′ (x0 ) = ′ . g(x) g (x0 ) 9.3 Applicazioni al calcolo dei limiti 231 Infatti, basta osservare che f (x) − f (x0 ) f (x) f (x) − f (x0 ) f ′ (x0 ) x − x0 lim = lim = lim = ′ . x→x0 g(x) x→x0 g(x) − g(x0 ) x→x0 g(x) − g(x0 ) g (x0 ) x − x0 Una situazione più generale viene esaminata nei risultati successivi. Teorema 9.3.1 (Prima regola di L’Höpital) Sia x0 ∈ R e si denoti con I uno degli intervalli ]a, x0 [ oppure ]x0 , b[ (a, b ∈ R). Siano f : I → R e g : I → R funzioni reali tali che 1. Per ogni x ∈ I, g(x) ̸= 0; 2. lim f (x) = 0, lim g(x) = 0; x→x0 x→x0 3. f e g sono derivabili con g ′ (x) ̸= 0 per ogni x ∈ I; 4. Esiste il limite lim x→x0 f ′ (x) . g ′ (x) Allora esiste anche il limite lim x→x0 lim x→x0 f (x) e si ha g(x) f (x) f ′ (x) = lim ′ . g(x) x→x0 g (x) (9.3.1) Dimostrazione. Per brevità si considera solo il caso in cui I =]a, x0 [. Si ponga ℓ := limx→x0 f ′ (x)/g ′ (x). Per ogni x ∈ I, risulta g(x) ̸= 0, altrimenti g tenderebbe allo stesso valore 0 in due punti distinti e la sua derivata, come conseguenza del Teorema 9.2.1, si dovrebbe annullare in almeno un punto interno all’intervallo che ha come estremi tali due punti e ciò è escluso dalle ipotesi. In una prima fase si considera il caso in cui ℓ ∈ R. Allora, fissato ε > 0, deve esistere x1 ∈ I tale che, per ogni x ∈]x1 , x0 [, ℓ− ε f ′ (x) ε < ′ <ℓ+ . 2 g (x) 2 Per ogni x, t ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, esiste c ∈]x1 , x0 [ tale che f ′ (c) f (x) − f (t) = g ′ (c) g(x) − g(t) e quindi ε f (x) − f (t) −ℓ < (1) g(x) − g(t) 2 Sia ora x ∈]x1 , x0 [; dal fatto che limt→x0 f (t) = 0 e limt→x0 g(t) = 0, segue anche limt→x0 (f (x) − f (t))/(g(x) − g(t)) = f (x)/g(x); se fosse f (x) ε −ℓ > , g(x) 2 Capitolo 9: Calcolo differenziale 232 dal fatto che ]−∞, ℓ−ε/2[∪]ℓ+ε/2, +∞[ è un intorno di f (x)/g(x), seguirebbe l’esistenza di δ > 0 tale che, per ogni t ∈ I∩]x − δ, x + δ[r{x}, f (x) − f (t) ε −ℓ > g(x) − g(t) 2 e ciò contraddice la (1). Quindi deve essere, per ogni x ∈]x1 , x0 [ ε f (x) −ℓ ≤ <ε. g(x) 2 Dall’arbitrarietà di ε > 0 segue quindi la tesi. Si considera ora il caso in cui ℓ = +∞ (se ℓ = −∞ si procede analogamente). Allora, fissato M ∈ R, esiste x1 ∈ I tale che, per ogni x ∈]x1 , x0 [, f ′ (x) >M +1. g ′ (x) Come nel caso precedente, per ogni x, t ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, si trova c ∈]x1 , x0 [ tale che f ′ (c) f (x) − f (t) = g ′ (c) g(x) − g(t) e quindi f (x) − f (t) > M + 1. (2) g(x) − g(t) Sia ora x ∈]x1 , x0 [; dal fatto che limt→x0 f (t) = 0 e limt→x0 g(t) = 0, segue anche limt→x0 (f (x) − f (t))/(g(x) − g(t)) = f (x)/g(x); se fosse f (x) <M +1, g(x) esisterebbe δ > 0 tale che, per ogni t ∈ I∩]x − δ, x + δ[r{x}, f (x) − f (t) <M +1 g(x) − g(t) e ciò contraddice la (2). Allora, per ogni x ∈]x1 , x0 [, deve essere f (x) ≥M +1>M g(x) e dall’arbitrarietà di M ∈ R si ha la tesi anche in questo caso. Teorema 9.3.2 (Seconda regola di L’Höpital) Sia x0 ∈ R e si denoti con I uno degli intervalli ]a, x0 [ oppure ]x0 , b[ (a, b ∈ R). Siano f : I → R e g : I → R funzioni reali tali che 1. lim |f (x)| = +∞, x→x0 lim |g(x)| = +∞; x→x0 2. f e g sono derivabili con g ′ (x) ̸= 0 per ogni x ∈ I; 3. Esiste il limite lim x→x0 f ′ (x) . g ′ (x) 9.3 Applicazioni al calcolo dei limiti Allora esiste anche il limite lim x→x0 lim x→x0 233 f (x) e si ha g(x) f (x) f ′ (x) = lim ′ . g(x) x→x0 g (x) (9.3.2) Dimostrazione. In questo caso l’ipotesi che g sia diversa da 0 in un intorno di x0 è assicurata dal fatto che il limite del suo valore assoluto è infinito. Anche ora si considera per brevità il caso in cui I =]a, x0 [ e si pone ℓ := limx→x0 f ′ (x)/g ′ (x). Si suppone in una prima fase che ℓ ∈ R e si fissa ε > 0. Essendo limx→x0 f ′ (x)/g ′ (x) = ℓ, si può trovare x1 ∈ I tale che, per ogni x ∈]x1 , x0 [, f ′ (x) ε −ℓ < . g ′ (x) 2 Si fissi t ∈]x1 , x0 [; per ogni x ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, esiste c ∈]x1 , x0 [ tale che f ′ (c) f (t) − f (x) = g ′ (c) g(t) − g(x) e quindi f (t) − f (x) ε ε <ℓ+ . (1) ℓ− < 2 g(t) − g(x) 2 Poiché limx→x0 |f (x)| = +∞, limx→x0 |g(x)| = +∞, si può trovare x2 ∈]x1 , x0 [ tale che, per ogni x ∈]x2 , x0 [, |f (t)| < |f (x)| e |g(t)| < |g(x)|. Pertanto, posto f (t) f (x) χ(x) := g(t) 1− g(x) 1− per ogni x ∈]x2 , x0 [, si ha χ(x) > 0 e f (t) − f (x) f (x) = χ(x) ; g(t) − g(x) g(x) conseguentemente, la (1) può essere scritta al modo seguente, per ogni x ∈]x2 , x0 [, f (x) ℓ + ε/2 ℓ − ε/2 < < . χ(x) g(x) χ(x) (2) Poiché limx→x0 χ(x) = 1, si può considerare x3 ∈]x2 , x0 [ tale che, per ogni x ∈]x3 , x0 [, ℓ−ε≤ ℓ − ε/2 , χ(x) ℓ + ε/2 ≤ℓ+ε χ(x) e quindi, dalla (2), ℓ−ε< f (x) <ℓ+ε. g(x) Dall’arbitrarietà di ε > 0 segue limx→x0 f (x)/g(x) = ℓ e quindi la tesi. Si considera ora il caso in cui ℓ = +∞ (se ℓ = −∞ il procedimento è analogo). Fissato M ∈ R, da limx→x0 f ′ (x)/g ′ (x) = ℓ, segue l’esistenza di x1 ∈ I tale che, per ogni x ∈]x1 , x0 [, f ′ (x) >M +1. g ′ (x) Capitolo 9: Calcolo differenziale 234 Si fissi ora t ∈]x1 , x0 [; per ogni x ∈]x1 , x0 [, x ̸= t, dal Teorema 9.2.2 di Cauchy, esiste c ∈]x1 , x0 [ tale che f ′ (c) f (t) − f (x) = g ′ (c) g(t) − g(x) e quindi f (t) − f (x) >M +1. (3) g(t) − g(x) Come nel caso precedente, poiché limx→x0 |f (x)| = +∞, limx→x0 |g(x)| = +∞, esiste x2 ∈]x1 , x0 [ tale che, per ogni x ∈]x2 , x0 [, |f (t)| < |f (x)| e |g(t)| < |g(x)| e quindi, posto f (t) f (x) χ(x) := ; g(t) 1− g(x) 1− dunque, la (3) diviene, per ogni x ∈]x2 , x0 [, f (x) M +1 > . g(x) χ(x) (4) Essendo limx→x0 χ(x) = 1, risulta limx→x0 (M + 1)/χ(x) = M + 1 e pertanto si può considerare x3 ∈]x2 , x0 [ tale che, per ogni x ∈]x3 , x0 [, M +1 >M . χ(x) Dalla (4) segue, per ogni x ∈]x3 , x0 [, f (x) >M . g(x) Dall’arbitrarietà di M ∈ R si ottiene la tesi. ◃ Nei risultati precedenti sono state considerate funzioni reali definite in intervalli del tipo ]a, x0 [ oppure ]x0 , b[ e quindi i limiti considerati coincidono con i limiti da sinistra oppure da destra in x0 . Naturalmente, considerando separatamente i limiti da destra e da sinistra in x0 , gli stessi risultati valgono per funzioni definite in ]a, b[r{x0 } (a, b ∈ R). ◃ Conviene osservare che i Teoremi 9.3.1 e 9.3.2 forniscono condizioni sufficienti per l’esistenza del limite del rapporto di due funzioni. Nel caso in cui il limite del rapporto delle derivate delle due funzioni non esista, non si può concludere nulla per quanto riguarda il limite del rapporto delle due funzioni e bisogna ricorrere a metodi differenti. ◃ Ad esempio, si consideri il limite lim x→+∞ x , x + sin x il quale si presenta nella forma indeterminata per ogni x > 1, +∞ ; tenendo presente che, +∞ x x x ≤ ≤ , x+1 x + sin x x−1 9.3 Applicazioni al calcolo dei limiti 235 si riconosce subito che tale limite è uguale ad 1; invece, il limite lim 1/(1+ x→+∞ cos x) del rapporto delle derivate non esiste. ◃ Bisogna naturalmente anche accertarsi che il limite si presenti in una delle forme indeterminate previste nei teoremi precedenti, altrimenti l’applicazione delle regole di L’Höpital può portare a risultati errati. Ad esempio, il limite log(cos x) + x tan x x→+∞ x+1 lim non esiste, mentre il limite limx→+∞ x (1+tan2 x) del rapporto delle derivate è uguale a +∞. ◃ In generale, può anche capitare che il limite del rapporto delle derivate si presenti anch’esso in una forma indeterminata. In tal caso, si può cercare di continuare ad applicare ancora la stessa regola di L’Höpital e studiare cosı̀ il limite del rapporto delle derivate seconde o ancora successive delle due funzioni. Più precisamente, se f : I → R e g : I → R sono funzioni reali derivabili n volte (n ≥ 1) e si supponga che, per ogni k = 1, . . . , n e per ogni x ∈ I, g (k) (x) ̸= 0. Se, per ogni k = 0, . . . , n − 1, lim f (k) (x) = 0 , x→x0 lim g (k) (x) = 0 x→x0 oppure lim |f (k) (x)| = +∞ , x→x0 e se esiste il limite lim x→x0 lim |g (k) (x)| = +∞ , x→x0 f (n) (x) f (x) , allora esiste anche il limite lim e si x→x0 g(x) g (n) (x) ha lim x→x0 f (x) f (n) (x) . = lim (n) g(x) x→x0 g (x) ◃ Le regole di L’Höpital possono essere applicate in maniera opportuna anche ad altre forme indeterminate. • la forma indeterminata 0·(±∞) può essere ricondotta a quelle previste nei risultati precedenti tenendo presente che, per ogni x ∈ I, f (x) g(x) = g(x) f (x) = . 1/g(x) 1/f (x) 236 Capitolo 9: Calcolo differenziale • Anche la forma indeterminata +∞ − ∞ può essere ricondotta a quelle previste dalle regole di L’Höpital tenendo presente che, per ogni x ∈ I, f (x) + g(x) 1 1 + f (x)g(x) f (x) g(x) f (x) + g(x) = = . 1 1 f (x)g(x) f (x)g(x) Alternativamente, si può tenere presente che, per ogni x ∈ I, ( ) ) ( g(x) f (x) f (x) + g(x) = f (x) 1 + +1 . = g(x) f (x) g(x) • Anche le forme indeterminate 1+∞ , 00 , (±∞)0 possono essere ricondotte ai casi già considerati tenendo presente che, se f : I → R e g : I → R sono funzioni reali e se, per ogni x ∈ I, f (x) > 0 allora, per ogni x ∈ I, f (x)g(x) = eg(x) log(f (x)) . ◃ Una interessante conseguenza della prima regola di L’Höpital riguarda la continuità della derivata prima; si può osservare, infatti, che il limite del (x0 ) rapporto incrementale limx→x0 f (x)−f di una funzione f continua in un x−x0 punto x0 si presenta nella forma indeterminata 0/0; applicando il Teorema 9.3.1 a tale limite si ottiene il seguente criterio di derivabilità. Teorema 9.3.3 (Continuità della derivata) Siano I un intervallo di R, x0 ∈ I ed f : I → R una funzione continua in I e derivabile in I r {x0 }. Se esiste il limx→x0 f ′ (x), allora f è dotata di derivata in x0 e si ha f ′ (x0 ) = lim f ′ (x) . (9.3.3) x→x0 Dimostrazione. Poiché f è continua in x0 , il limite del rapporto incrementale di f in x0 si presenta nella forma indeterminata 0/0. Inoltre, per tale limite sono soddisfatte tutte le ipotesi del Teorema 9.3.1 e da esso si ottiene la tesi. Dal risultato precedente segue che se il limite limx→x0 f ′ (x) esiste ed è finito, la funzione f è derivabile in x0 e vale la (9.3.3) (se il limite esiste ma non è finito, la funzione risulta solamente dotata di derivata in x0 ). Come conseguenza di tale risultato, se la derivabilità di una funzione in un punto non viene assicurata dalle regole di derivazione si può studiare semplicemente il limite della derivata prima in tale punto piuttosto che il limite del rapporto incrementale. 9.3 Applicazioni al calcolo dei limiti 9.3.2 237 Formula di Taylor Sia f : X → R una funzione derivabile in un punto x0 ∈ X di accumulazione per X; si è visto nella sezione precedente che il grafico di f è dotato di retta tangente nel punto x0 avente equazione y = f (x0 ) + f ′ (x0 )(x − x0 ) . Se x ∈ X, la differenza tra il valore della funzione e quello della retta tangente in x è data da f (x) − f (x0 ) − f ′ (x0 )(x − x0 ) e si ha lim x→x0 f (x) − f (x0 ) − f ′ (x0 )(x − x0 ) f (x) − f (x0 ) = lim − f ′ (x0 ) = 0 ; x→x0 x − x0 x − x0 quindi la differenza tra il valore della funzione e quello della retta tangente al grafico di f in x0 è un infinitesimo di ordine maggiore di 1. Ci si può ora chiedere in modo abbastanza naturale se sia possibile ottenere un’approssimazione più soddisfacente dei valori della funzione considerando polinomi di grado maggiore di 1. I polinomi adatti a tale scopo si ottengono imponendo nel punto x0 il valore del polinomio e quello delle sue derivate fino ad un ordine fissato uguali rispettivamente al valore della funzione e delle sue derivate nel punto x0 fino allo stesso ordine. Definizione 9.3.4 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale derivabile n volte in x0 (n ∈ N). Si dice polinomio di Taylor di f di grado n relativo ad x0 il polinomio Tn : R → R definito ponendo, per ogni x ∈ R, Tn (x) := f (x0 ) + f ′ (x0 )(x − x0 ) + f ′′ (x0 ) (x − x0 )n n! n ∑ (x − x0 )k f (k) (x0 ) k! (x − x0 )2 + 2 (9.3.4) + · · · + f (n) (x0 ) = (9.3.5) k=0 (per k = 0, valgono le convenzioni f (0) (x0 ) = f (x0 ) e (x − x0 )0 = 1 se x = x0 ).1 Il polinomio T0 si riduce alla funzione costante di costante valore f (x0 ), mentre T1 fornisce l’equazione della retta tangente al grafico di f in x0 . 1 Se occorre specificare la funzione f alla quale si riferisce il polinomio di Taylor T n viene preferita la notazione Tn (f ) e se occorre specificare anche il punto x0 si usa la notazione Tn (f, x0 ). Capitolo 9: Calcolo differenziale 238 Si riconosce facilmente che, per ogni k, p ∈ N, k(k − 1) · · · (k − p + 1)(x − x0 )k−p , p k k! , D ((x − x0 ) ) = 0, p<k, p = k ;, p>k, (9.3.6) e conseguentemente, per ogni k = 0, . . . , n, Tn(k) (x0 ) = f (k) (x0 ) . (9.3.7) Si osserva ancora che, per induzione su j = 0, . . . , n, dalla (9.3.6) si riconosce facilmente la validità della formula Tn (f )(j) = Tn−j (f (j) ) , (9.3.8) cioè la derivata j-esima del polinomio di Taylor di ordine n della funzione f in x0 coincide con il polinomio di Taylor di ordine n − j della derivata j-esima di f in x0 . ◃ Ad esempio, si consideri la funzione f (x) := x sin x, x ∈ R ed il punto iniziale x0 = 0; si ha, per ogni x ∈ R, T1 (x) = 0 , 2 x4 6 T8 (x) = T9 (x) = x − x4 6 2 T2 (x) = T3 (x) = x , T4 (x) = T5 (x) = x2 − T6 (x) = T7 (x) = x2 − 4 x 6 , T10 (x) = x2 − x4 6 + x6 120 + x6 120 , + x6 120 − − x8 5040 + x8 5040 , x10 362880 ; nella Figura 9.4 viene tracciato approssimativamente il grafico di T2 , T4 , T6 , T8 e T10 = x2 − x4 /6 + x6 /120 − x8 /5040 + x10 /362880) e si può notare come i polinomi di Taylor approssimino in maniera sempre più accurata la funzione assegnata in un intorno del punto 0. Tale aspetto dei polinomi di Taylor viene messo in evidenza nel risultato seguente. Teorema 9.3.5 (Formula di Taylor con il resto di Peano) Siano I un intervallo, x0 ∈ I ed f : I → R una funzione reale derivabile n volte in x0 ed n − 1 volte in I r {x0 } con n ≥ 1. Allora esiste una funzione σn : I → R tale che, per ogni x ∈ I, f (x) = Tn (x) + σn (x) (x − x0 )n , n! (9.3.9) ed inoltre lim σn (x) = 0 . x→x0 (9.3.10) 9.3 Applicazioni al calcolo dei limiti 239 y T10 T2 T6 f x 0 T4 T8 Figura 9.4: Polinomi di Taylor. Dimostrazione. L’uguaglianza (3.6) è verificata considerando la funzione σn : I → R definita ponendo, per ogni x ∈ I, n! (f (x) − Tn (x)) , x ̸= x0 , σn (x) := (x − x0 )n 0, x = x0 . Bisogna pertanto dimostrare la (9.3.10), cioè che σn è continua in x0 . Il limite (9.3.10) si presenta nella forma indeterminata 0/0 e ad esso si può applicare la regola di L’Höpital. Dalle (9.3.7) e (9.3.8), segue lim f (n−j) (x) − Tj (f (n−j) )(x) = f (n−j) (x0 ) − Tj (f (n−j) )(x0 ) = 0 x→x0 per ogni j = 1, . . . , n − 1 e quindi, ancora dalla (9.3.8) e dal Teorema 9.3.1, si ottiene lim σn (x) x→x0 n! = (n − 1)! lim = f (n−1) (x) − T1 (f (n−1) )(x) lim x→x0 x − x0 = = lim f (x) − Tn (f )(x) f ′ (x) − Tn−1 (f ′ )(x) = n! lim x→x0 (x − x0 )n n(x − x0 )n−1 = x→x0 x→x0 f ′′ (x) − Tn−2 (f ′′ )(x) = ... (n − 1)(x − x0 )n−2 f (n−1) (x) − f (n−1) (x0 ) − f (n) (x0 )(x − x0 ) x − x0 ( ) (n−1) (n−1) f (x) − f (x0 ) lim − f (n) (x0 ) = 0 x→x0 x − x0 lim x→x0 e quindi la tesi è completamente dimostrata. Capitolo 9: Calcolo differenziale 240 La formula (9.3.6) viene denominata formula di Taylor di f di punto iniziale x0 e di ordine n con il resto di Peano. Nel caso in cui x0 = 0, essa viene denominata formula di Mc Laurin di f di ordine n con il resto di Peano e diventa, per ogni x ∈ I, f (x) = n ∑ k=0 f (k) (0) xk xn + σn (x) . k! n! (9.3.11) ◃ Un modo alternativo di esprimere il resto è espresso nel risultato successivo che rappresenta una generalizzazione del teorema di Lagrange. Per comodità, se x0 ed x sono numeri reali distinti, conviene denotare con I(x0 , x) l’intervallo aperto di estremi x0 ed x, cioé { ]x0 , x[ , x0 < x , I(x0 , x) := ]x, x0 [ , x < x0 . Teorema 9.3.6 (Formula di Taylor con il resto di Lagrange) Siano I un intervallo, x0 ∈ I ed f : I → R una funzione reale derivabile n volte (n ≥ 1) in I r {x0 } ed n − 1 volte in x0 con f (n−1) continua in x0 . Allora, per ogni x ∈ I r {x0 }, esiste ξ ∈ I(x0 , x) tale che f (x) = Tn−1 (x) + f (n) (ξ) (x − x0 )n . n! (9.3.12) Dimostrazione. Si fissi x ∈ I r {x0 } e si denoti con I l’intervallo chiuso avente x ed x0 come estremi. Si definisce ora la funzione F : I → R ponendo, per ogni t ∈ I, F (t) := = (x − t)n (f (x) − Tn−1 (f, x0 )(x)) (x − x0 )n ( ) n−1 n−1 ∑ ∑ (x − t)n (x − x0 )k (x − t)k (k) + f (x) − f (x ) . f (k) (t) 0 k! (x − x0 )n k! k=0 k=0 Tn−1 (f, t)(x) + Dalle ipotesi assunte sulla funzione f , segue che F è continua in I e derivabile in I(x0 , x); inoltre F (x) = Tn−1 (f, x)(x) = f (x) , F (x0 ) = Tn−1 (f, x0 )(x) + (f (x) − Tn−1 (f, x0 )(x)) = f (x) , e quindi, dal Teorema 9.2.1 di Rolle, esiste ξ ∈ I(x0 , x) tale che F ′ (ξ) = 0. Tenendo presente che, per ogni t ∈ I(x0 , x), ) n−1 ∑( (x − t)k−1 (x − t)k F ′ (t) = f ′ (t) + f (k+1) (t) − f (k) (t) k! (k − 1)! k=1 ( ) n−1 ∑ n(x − t)n−1 (x − x0 )k (k) − f (x) − f (x ) 0 (x − x0 )n k! k=0 = f ′ (t) + n−1 ∑ k=1 f (k+1) (t) n−2 ∑ (x − t)k (x − t)k f (k+1) (t) − k! k! k=0 9.3 Applicazioni al calcolo dei limiti − = = = n(x − t)n−1 (x − x0 )n ( f (x) − n−1 ∑ f (k) (x0 ) k=0 241 (x − x0 )k k! ) (x − t)n−1 f (t) + f (t) − f ′ (t) (n − 1)! ) ( n−1 ∑ n(x − t)n−1 (x − x0 )k (k) − f (x) − f (x ) 0 (x − x0 )n k! k=0 ( ) n−1 ∑ (x − x0 )k (x − t)n−1 n(x − t)n−1 (k) f (x ) f (n) (t) − f (x) − 0 (n − 1)! (x − x0 )n k! k=0 ( ( )) n−1 ∑ (x − x0 )n (x − x0 )k n(x − t)n−1 (n) (k) f (t) − f (x) − f (x0 ) , (x − x0 )n n! k! k=0 ′ (n) si conclude che deve essere f (n) (ξ) n−1 ∑ (x − x0 )n (x − x0 )k = f (x) − f (k) (x0 ) n! k! k=0 e da quest’ultima si ottiene la tesi. La formula (9.3.12) viene denominata formula di Taylor di f di punto iniziale x0 e di ordine n con il resto di Lagrange. Anche in questo caso, se x0 = 0, essa viene denominata formula di Mc Laurin di f di ordine n con il resto di Lagrange e si scrive nel seguente modo, per ogni x ∈ I r {0}, f (x) = n−1 ∑ k=0 f (k) (0) xk xn + f (n) (ξ) , k! n! (9.3.13) |ξ| < |x|. Nel caso n = 1, la (9.3.12) si riduce ovviamente al Teorema 9.2.3 di Lagrange. Osservazione 9.3.7 La formula di Taylor con il resto di Lagrange consente anche di valutare l’errore che si commette approssimando una funzione con il polinomio di Taylor di ordine n in un intorno di un punto x0 . Infatti, nelle ipotesi del Teorema 9.3.6 e supposto che f (n) sia limitata in I r {x0 }, allora, posto M := supx∈Ir{x0 } |f (n) (x)|, per ogni x ∈ I, si ha |f (x) − Tn−1 (x)| ≤ M |x − x0 |n . n! (9.3.14) Conviene a questo punto scrivere la formula di Taylor per alcune funzioni elementari. Capitolo 9: Calcolo differenziale 242 Formula di Taylor per i polinomi Sia P : R → R un polinomio di grado n e siano a0 , . . . , an ∈ R, con an ̸= 0, tali che P (x) = a0 + · · · + an xn per ogni x ∈ R. Ovviamente, P è una funzione infinite volte derivabile e si ha P (n) (x) = an per ogni x ∈ R, mentre tutte le derivate successive P (k) con k > n sono nulle. Fissato x0 ∈ R, la formula di Taylor di P di ordine n relativa ad x0 con il resto di Lagrange; in questo caso, per ogni x ∈ R, considerato l’elemento ξ ∈ I(x0 , x) previsto nella (9.3.12), si ha P (n) (ξ) = an = P (n) (x0 ) e quindi P (x) = n ∑ P (k) (x0 ) k=0 (x − x0 )k k! per ogni x ∈ R. Dunque il polinomio P viene completamente determinato dal valore che assume in x0 insieme a quelli delle sue derivate in x0 fino all’ordine n. Formula di Taylor per le funzioni esponenziali Sia a > 0, a ̸= 1 e si consideri la funzione esponenziale expa di base a. Tale funzione è infinite volte derivabile e si riconosce facilmente per induzione su n che, per ogni n ∈ N ed x ∈ R, risulta Dn (ax ) = ax logn a. In particolare, per ogni n ∈ N, la derivata n-esima della funzione expa assume il valore logn a nel punto 0; pertanto, la formula di Mc Laurin di expa di ordine n si scrive, per ogni x ∈ R, ax = n−1 ∑ logk a k=0 xk xn + aξ logn a , k! n! con ξ ∈ I(0, x). Inoltre, dalla (9.3.14) si ottiene, per ogni x ∈ R, ax − n−1 ∑ logk a k=0 xk |x|n . ≤ max{ax , 1} | logn a| k! n! Nel caso della funzione esponenziale avente come base il numero di Nepero, le formule precedenti diventano, per ogni x ∈ R, ex = n−1 ∑ k=0 xk xn + eξ , k! n! con ξ ∈ I(0, x) e e − x n−1 ∑ k=0 xk |x|n . ≤ max{ex , 1} k! n! 9.3 Applicazioni al calcolo dei limiti 243 Formula di Taylor per le funzioni logaritmiche Sia a > 0 con a ̸= 1 e si consideri la funzione logaritmo loga di base a. Tale funzione è infinite volte derivabile e procedendo per induzione su n, si riconosce che, per ogni n ≥ 1 ed x ∈]0, +∞[, Dn (loga x) = (−1)n−1 (n − 1)! . xn log a In particolare, per ogni n ∈ N, la derivata n-esima della funzione loga assume il valore (−1)n−1 (n − 1)!/ log a nel punto 1. Conseguentemente, tenendo presente che loga 1 = 0, la formula di Taylor di loga di ordine n relativa al punto 1 si scrive, per ogni x ∈]0, +∞[, loga x = n−1 ∑ k=1 (−1)k−1 (−1)n−1 (x − 1)k + n (x − 1)n , k log a nξ log a con ξ ∈ I(1, x). In varie applicazioni può essere utile scrivere quest’ultima formula nella forma seguente, per ogni x ∈] − 1, 1], loga (1 + x) = n−1 ∑ k=1 (−1)k−1 k (−1)n−1 n x + n x ; k log a nξ log a poiché x ∈] − 1, 1], si ha anche |ξ| < |x| e quindi il resto di Lagrange verifica la condizione (−1)n−1 n 1 x ≤ . nξ n log a n| log a| Formula di Taylor per le funzioni seno e coseno Procedendo con gli stessi metodi dei casi precedenti, si possono scrivere le formule di Mc Laurin di ordine 2n + 1 e rispettivamente 2n delle funzioni seno e coseno. Tenendo presente che D(sin x) = cos x e D(cos x) = − sin x, si deduce che le derivate di ogni ordine di tali funzioni assumono valori compresi tra −1 ed 1. Inoltre, nel punto 0 le derivate di ordine pari della funzione seno e quelle di ordine dispari della funzione coseno sono nulle. Pertanto le relative formule di Mc Laurin assumono la seguente forma, per ogni x ∈ R, sin x = n−1 ∑ k=0 cos x = n−1 ∑ k=0 (−1)k 2k+1 x2n+1 x + θ(x) , (2k + 1)! (2n + 1)! (−1)k 2k x2n x + η(x) , (2k)! (2n)! Capitolo 9: Calcolo differenziale 244 con θ(x) ∈ [−1, 1] ed η(x) ∈ [−1, 1] opportuni. Si ottiene ovviamente, per ogni x ∈ R, sin x − n−1 ∑ k=0 (−1)k 2k+1 x (2k + 1)! cos x − n−1 ∑ k=0 (−1)k 2k x (2k)! ≤ |x|2n+1 , (2n + 1)! ≤ |x|2n . (2n)! Gli esempi precedenti possono essere estesi con gli stessi metodi per scrivere la formula di Taylor di ogni funzione elementare relativa ad un fissato punto x0 . 9.3.3 Simboli di Landau e applicazioni della formula di Taylor al calcolo dei limiti La formula di Taylor può essere utilizzata alternativamente alle regole di L’Höpital per la risoluzione delle forme indeterminate. Si introducono innanzitutto alcune notazioni che evidenziano la parte principale di un infinitesimo; tali notazioni consistono nell’uso dei simboli di Landau che vengono introdotti nel modo seguente. Siano X un sottoinsieme di R, x0 un punto di accumulazione per X ed f : X → R, g : X → R due funzioni definite in X. Si dice che “f (x) è o piccolo di g(x) per x tendente verso x0 ” e si scrive f (x) = o(g(x)) , x → x0 , f (x) = 0 (se f e g sono infinitesime in x0 , ciò equivale al fatto che g(x) f è un infinitesimo in x0 di ordine maggiore di g). Inoltre, si dice che “f (x) è o grande di g(x) per x tendente verso x0 ” e si scrive f (x) = O(g(x)) , x → x0 , se lim x→x0 f (x) è limitato in un intorno di x0 (se f e g sono infinitesime g(x) in x0 , ciò equivale al fatto che f è un infinitesimo in x0 di ordine maggiore o uguale di g). Tali notazioni consentono di scrivere in modo più semplice diverse formule evitando l’introduzione di funzioni che denotano infinitesimi di ordine superiore. Ad esempio, la formula di Taylor (9.3.9) si può scrivere se il rapporto f (x) = Tn (x) + o((x − x0 )n ) , x → x0 , 9.3 Applicazioni al calcolo dei limiti 245 in quanto σn (x)(x − x0 )n /n! = o((x − x0 )n ) per x → x0 . In modo analogo, nelle ipotesi dell’Osservazione 9.3.7, la (9.3.14) diventa f (x) − Tn−1 (x) = O((x − x0 )n ) , x → x0 , in quanto M (x − x0 )n /n! = O((x − x0 )n ) per x → x0 . Si lascia per esercizio lo sviluppo delle funzioni elementari utilizzando i simboli di Landau e le formule di Mc Laurin con il resto di Peano; ad esempio, ex = loga (1 + x) = sin x = cos x = n ∑ xk k! k=0 n ∑ + o(xn ) , x→0, (−1)k−1 k x + o(xn ) , k log a k=1 n ∑ x→0, (−1)k x2k+1 + o(x2n+1 ) , (2k + 1)! k=0 n ∑ (−1)k 2k x + o(x2n ) , (2k)! k=0 x→0, x→0. ◃ Nel calcolo dei limiti è spesso conveniente utilizzare la formula di Taylor per esprimere un infinitesimo in maniera equivalente mediante funzioni potenza; a tal fine è sufficiente considerare la prima derivata non nulla delle funzioni in esame nel punto x0 ; ad esempio, le prime derivate della funzione f (x) := arcsin2 (x) nel punto 0 sono date da f (0) = 0 , f ′ (0) = 0 , f ′′ (0) = 2 e quindi f (x) = 2x2 /2! + o(x2 ) = x2 + o(x2 ) per x → 0; quindi f (x) ∼ x2 per x → 0. Si considera come esempio lo studio del limite lim x→0 x − arcsin x . sin x − arcsin x Si determinano dapprima le derivate della funzione f (x) := x − arcsin x nel punto 0 al fine di trovarne la prima non nulla. Si ha f (0) = 0 , f ′ (0) = 0 , f ′′ (0) = 0 , f ′′′ (0) = −1 e quindi il numeratore è un infinitesimo di ordine 3 equivalente a −x3 /3! (infatti f (x) = −x3 /3! + o(x3 )). Capitolo 9: Calcolo differenziale 246 Si procede ora in maniera analoga per la funzione g(x) := sin x−arcsin x e si ha g(0) = 0 , g ′ (0) = 0 , g ′′ (0) = 0 , g ′′′ (0) = −2 e quindi il denominatore è un infinitesimo di ordine 3 equivalente a −2x3 /3! (infatti g(x) = −2x3 /3! + o(x3 )). Allora, dalla regola di sostituzione Proposizione 6.10.5, si ha x − arcsin x −x3 /3! 1 = lim = . x→0 sin x − arcsin x x→0 −2x3 /3! 2 lim ◃ Si vuole approssimare il numero di Nepero con un errore minore di 1/100. Applicando la stima già ottenuta nel punto x = 1, si ha, per ogni n ≥ 1, n−1 ∑ 1 e 3 e− ≤ < . k! n! n! k=0 Pertanto, bisogna trovare n ≥ 1 tale che 3/n! < 1/100 e quindi basta considerare, ad esempio, n = 6. Il valore approssimato richiesto è quindi dato da e∼ 5 ∑ 1 1 1 1 1 163 =1+1++ + + + = ∼ 2, 71667 . k! 2 6 24 120 60 k=0 9.4 Applicazioni allo studio del grafico delle funzioni reali Nella presente sezione verranno esaminate innanzitutto le connessioni tra il segno della derivata prima e la monotonia di una funzione; verranno poi studiate ulteriori proprietà delle funzioni reali quali la convessità, la concavità ed i punti di flesso e la loro connessione con lo studio della derivata seconda. Inoltre si definiscono gli asintoti verticali, orizzontali ed obliqui al grafico di una funzione reale e se ne studia l’esistenza. Infine, viene descritto il metodo generale per lo studio del grafico di una funzione reale. 9.4.1 Monotonia e massimi e minimi relativi ed assoluti Poiché la nozione di derivata ha carattere locale, trattandosi di un limite, si possono ottenere in maniera diretta alcune connessioni tra il segno della 9.4 Applicazioni allo studio del grafico delle funzioni reali 247 derivata prima in un punto e la crescenza e decrescenza della funzione nello stesso punto. Proposizione 9.4.1 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale derivabile in x0 . Si ha 1) Se f ′ (x0 ) > 0 (rispettivamente, f ′ (x0 ) < 0), allora f è strettamente crescente (rispettivamente, strettamente decrescente) in x0 . 2) Se f è crescente (rispettivamente, decrescente) in x0 , allora f ′ (x0 ) ≥ 0 (rispettivamente, f ′ (x0 ) ≤ 0). Dimostrazione. 1) Dalla proprietà di permanenza del segno per i limiti, esiste δ > 0 tale che, per ogni x ∈ X r {x0 }, x0 − δ < x < x0 + δ =⇒ f (x) − f (x0 ) >0. x − x0 Pertanto il numeratore ed il denominatore del rapporto incrementale devono avere lo stesso segno, da cui x0 < x < x0 + δ =⇒ f (x) − f (x0 ) > 0 =⇒ f (x0 ) < f (x) , x0 − δ < x < x0 =⇒ f (x) − f (x0 ) < 0 =⇒ f (x) < f (x0 ) , e quindi f è strettamente crescente in x0 . Il caso rispettivo si dimostra in maniera analoga. 2) Si supponga che f sia crescente in x0 . Se fosse, per assurdo, f ′ (x0 ) < 0, dal caso 1) appena dimostrato seguirebbe che f è strettamente decrescente in x0 e si avrebbe una contraddizione. Il caso rispettivo è analogo. Una prima conseguenza della Proposizione 9.4.1 riguarda una condizione necessaria per massimi e minimi relativi di una funzione. Corollario 9.4.2 (Condizione necessaria per massimi e minimi relativi) Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione a sinistra e a destra per X ed f : X → R una funzione reale derivabile in x0 . Se x0 è un punto di massimo o di minimo relativo per f , allora f ′ (x0 ) = 0. Dimostrazione. Si supponga per assurdo che f ′ (x0 ) > 0. Dalla Proposizione 9.4.1, segue che f è strettamente crescente in x0 e quindi esiste δ1 > 0 tale che, per ogni x ∈ X∩]x0 − δ1 , x0 + δ1 [r{x0 }, x0 < x < x0 + δ1 =⇒ f (x) > f (x0 ) , x0 − δ1 < x < x0 =⇒ f (x) < f (x0 ) . Inoltre, x0 è un punto di massimo (rispettivamente, di minimo) relativo per f e quindi esiste δ2 > 0 tale che, per ogni x ∈ X∩]x0 − δ2 , x0 + δ2 [, f (x) ≤ f (x0 ) (rispettivamente, f (x) ≥ f (x0 ) ). Si ponga ora δ = min{δ1 , δ2 }; poiché x0 è di accumulazione a destra per X, si può considerare x ∈ X∩]x0 , x0 + δ[, per il quale si ottiene contemporaneamente f (x) > Capitolo 9: Calcolo differenziale 248 f (x0 ) e f (x) ≤ f (x0 ) e quindi una contraddizione; nel caso rispettivo, poiché x0 è di accumulazione anche a sinistra, si considera x ∈ X∩]x0 − δ, x0 [ e si ricava ancora una contraddizione. Dunque non può essere f ′ (x0 ) > 0. In modo analogo si riconosce che la condizione f ′ (x0 ) < 0 conduce ad una contraddizione e quindi deve essere f ′ (x0 ) = 0. Si osservi che nella dimostrazione precedente l’assurdo è derivato dal fatto che il punto x0 è stato supposto di accumulazione sia a sinistra che a destra per X. Infatti, si riconosce facilmente che una funzione che ammette un massimo o un minimo relativo in un estremo ed é ivi derivabile, non ha necessariamente derivata nulla in tale estremo. Ad esempio, si consideri la funzione f : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1], f (x) := x. ◃ Se una funzione f : I → R è definita in un intervallo I, le connessioni tra la monotonia globale e locale studiate nell’Osservazione 4.3.4 insieme alla Proposizione 9.4.1 forniscono subito il seguente risultato. Proposizione 9.4.3 Siano I un intervallo di R ed f : I → R una funzione reale derivabile. Si ha 1. (Caratterizzazione della monotonia) f è crescente (rispettivamente, decrescente) se e solo se verifica la condizione seguente ∀ x0 ∈ I : f ′ (x0 ) ≥ 0 (rispettivamente, f ′ (x0 ) ≤ 0 ). (9.4.1) 2. (Caratterizzazione della stretta monotonia) f è strettamente crescente (rispettivamente, strettamente decrescente) se e solo se verifica la condizione (9.4.1) ed inoltre f ′ non è costantemente nulla in alcun intervallo contenuto in I, cioè a, b ∈ I , a < b =⇒ ∃ x0 ∈]a, b[ t.c. f ′ (x0 ) ̸= 0 . (9.4.2) Dimostrazione. 1) Se f è crescente, essa verifica ovviamente la condizione (9.4.1) come conseguenza della Proposizione 9.4.1. Viceversa, si supponga che, per ogni x0 ∈ I, f ′ (x0 ) ≥ 0. Se f non fosse crescente, esisterebbero due elementi a, b ∈ I con a < b tali che f (b) < f (a). Dal Teorema 9.2.3 di Lagrange applicato alla restrizione di f all’intervallo [a, b], si otterrebbe x0 ∈]a, b[ tale che f ′ (x0 ) = (f (b) − f (a))/(b − a) < 0 e ciò è escluso. Quindi f deve essere crescente. La dimostrazione è analoga nel caso rispettivo. 2) Se f è strettamente crescente essa è anche crescente e quindi dalla prima parte deve soddisfare la condizione (9.4.1). Se f ′ fosse costantemente uguale a 0 in un intervallo [a, b] ⊂ I, dalla stretta crescenza si avrebbe innanzitutto f (a) < f (b); inoltre, dal Teorema 9.2.3 di Lagrange applicato alla restrizione di f all’intervallo [a, b], si otterrebbe x0 ∈]a, b[ tale che f ′ (x0 ) = (f (b)−f (a))/(b−a) > 0 e ciò è assurdo in quanto deve essere f ′ (x0 ) = 0. Pertanto, anche la condizione (9.4.2) è dimostrata. Viceversa, dalla (9.4.1) e dalla prima parte dimostrata segue innanzitutto che f è crescente e pertanto è sufficiente dimostrare che essa è anche iniettiva (vedasi la Proposizione 4.3.2). Si supponga, per assurdo, che esistano due elementi a, b ∈ I, con a < b, tali che 9.4 Applicazioni allo studio del grafico delle funzioni reali 249 f (a) = f (b). Dalla monotonia di f , per ogni x ∈ [a, b], si deve avere f (x) = f (a) = f (b); essendo f costante in [a, b], la sua derivata si annulla nell’intervallo [a, b] e ciò contraddice la condizione (9.4.2). Quindi f è iniettiva e ciò completa la dimostrazione. Il caso rispettivo si dimostra in maniera analoga. Le caratterizzazioni precedenti non valgono se la funzione non è definita in un intervallo; ad esempio, la derivata della funzione f (x) = −1/x, x ∈ R r {0} è strettamente positiva in tutto R r {0}, ma la funzione non è strettamente crescente (ad esempio, −1 < 1 ma f (−1) > f (1)). Le caratterizzazioni ottenute possono comunque essere sempre applicate alle restrizioni della funzione ad ogni intervallo contenuto nell’insieme di definizione. ◃ Nella dimostrazione della seconda parte della proposizione precedente, si è visto anche che se f : I → R ha derivata costantemente nulla in un intervallo I, allora essa è costante. Anche in questo caso la tesi risulta falsa se la funzione non è definita in un intervallo; ad esempio, si consideri la funzione f (x) = x/|x| con x ∈ Rr{0}. ◃ Si studiano ora alcune condizioni sufficienti per i punti di massimo e minimo relativo. Il primo criterio segue direttamente dalla Proposizione 9.4.1. Proposizione 9.4.4 (Primo criterio per massimi e minimi relativi) Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : X → R una funzione reale continua in x0 e derivabile in un intorno di x0 tranne al più nel punto x0 , cioè esiste δ > 0 tale che f sia derivabile in ]x0 − δ, x0 + δ[r{x0 }.2 Se ∀ x ∈]x0 − δ, x0 [: f ′ (x) ≥ 0 , ∀ x ∈]x0 , x0 + δ[: f ′ (x) ≤ 0 (oppure rispettivamente, ∀ x ∈]x0 − δ, x0 [: f ′ (x) ≤ 0 , ∀ x ∈]x0 , x0 + δ[: f ′ (x) ≥ 0) ), allora x0 è un punto di massimo (rispettivamente, di minimo) relativo per f. Se, in più, esiste δ > 0 tale che f ′ (x) ̸= 0 per ogni x ∈]x0 − δ, x0 + δ[r{x0 }, allora x0 è un punto di massimo (rispettivamente, di minimo) relativo proprio per f . 2 Un punto x si dice interno ad X se esiste δ > 0 tale che ]x − δ, x + δ[⊂ X, in 0 0 0 altri termini se X è un intorno di x0 . Un punto interno ad X è sempre ovviamente di accumulazione per X. Nelle ipotesi di derivabilità di f si è pertanto supposto lecitamente che ]x0 − δ, x0 + δ[⊂ X. Capitolo 9: Calcolo differenziale 250 Dimostrazione. Dalle ipotesi fatte, tenendo conto della Proposizione 9.4.3, 1), segue che f è crescente in ]x0 − δ, x0 [ e decrescente in ]x0 , x0 + δ[ (rispettivamente, f è decrescente in ]x0 − δ, x0 [ e crescente in ]x0 , x0 + δ[); dal Teorema 6.6.1 sul limite delle funzioni monotone e tenendo presente che f è continua in x0 , si ha f (x0 ) = sup f (x) = x∈]x0 −δ,x0 [ sup f (x) x∈]x0 ,x0 +δ[ (rispettivamente, f (x0 ) = inf x∈]x0 −δ,x0 [ f (x) = inf f (x) ). x∈]x0 ,x0 +δ[ Pertanto, per ogni x ∈]x0 − δ, x0 + δ[r{x0 }, risulta f (x) ≤ f (x0 ) (rispettivamente, f (x0 ) ≤ f (x)) e quindi x0 è un punto di massimo relativo (rispettivamente, di minimo relativo) per f . Per quanto riguarda l’ultima parte della tesi, se il punto x0 non fosse un punto di massimo (rispettivamente, di minimo) relativo proprio per f , esisterebbe x1 ∈]x0 −δ, x0 + δ[r{x0 } tale che f (x1 ) = f (x0 ); applicando il Teorema 9.2.1 di Rolle alla restrizione di f all’intervallo chiuso di estremi x0 ed x1 , si troverebbe x ∈ I(x0 , x1 ) tale che f ′ (x) = 0 contraddicendo le ipotesi assunte nell’ultima parte. Proposizione 9.4.5 (Secondo criterio per massimi e minimi relativi) Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : I → R una funzione reale derivabile due volte in x0 . Se f ′ (x0 ) = 0 e f ′′ (x0 ) < 0 (rispettivamente, f ′′ (x0 ) > 0), allora x0 è un punto di massimo (rispettivamente, di minimo) relativo proprio per f . Dimostrazione. Poiché f è derivabile due volte in x0 , deve innanzitutto esistere un intorno J di x0 tale che f sia derivabile in J (si è supposto lecitamente J ⊂ X in quanto x0 è interno ad X); inoltre, la condizione f ′′ (x0 ) < 0 (rispettivamente, f ′′ (x0 ) > 0) comporta, dalla Proposizione 9.4.1, che f ′ sia strettamente decrescente (rispettivamente, strettamente crescente) in x0 e quindi deve esistere δ > 0 tale che ]x0 − δ, x0 + δ[⊂ J e, per ogni xx0 }, x < x0 =⇒ f ′ (x0 ) < f ′ (x) (rispettivamente, f ′ (x) < f ′ (x0 ) ), x > x0 =⇒ f ′ (x) < f ′ (x0 ) (rispettivamente, f ′ (x0 ) < f ′ (x) ). Tenendo presente che f ′ (x0 ) = 0, le condizioni precedenti consentono di applicare la Proposizione 9.4.4 e concludere che x0 è un punto di massimo (rispettivamente, di minimo) relativo proprio per f . Corollario 9.4.6 Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : X → R una funzione reale derivabile due volte in x0 . Se x0 è un punto di massimo (rispettivamente, di minimo) relativo per f , allora deve essere f ′′ (x0 ) ≤ 0 (rispettivamente, f ′′ (x0 ) ≥ 0). 9.4 Applicazioni allo studio del grafico delle funzioni reali 251 Dimostrazione. Infatti, se fosse f ′′ (x0 ) > 0 (rispettivamente, f ′′ (x0 ) < 0), dalla Proposizione 9.4.5 precedente e dal Corollario 9.4.2, x0 sarebbe un punto di minimo (rispettivamente, di massimo) relativo proprio per f . ◃ Se un punto interno x0 ∈ X è di massimo (rispettivamente, di minimo) relativo per f e se f : X → R è derivabile due volte in x0 , dai Corollari 9.4.2 e 9.4.6 seguono entrambe le condizioni f ′ (x0 ) = 0 , f ′′ (x0 ) ≤ 0 (rispettivamente, f ′′ (x0 ) ≥ 0 ). Esse non sono tuttavia sufficienti ad assicurare che un punto x0 sia di massimo (rispettivamente, di minimo) relativo per f . Ad esempio, la funzione f (x) = x3 , x ∈ R, nel punto 0 verifica la condizione precedente ma è strettamente crescente in 0. Si osserva inoltre che i criteri esposti non valgono in generale se il punto x0 non è interno ad X; ad esempio, la funzione f : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1], f (x) := x2 ha derivata seconda strettamente positiva nel punto di minimo 0, ma anche nel punto di massimo 1. Infine, nei casi in cui sia la derivata prima che seconda di una funzione si annullino, può essere utile il seguente ulteriore criterio che si deduce dalla formula di Taylor. Proposizione 9.4.7 (Terzo criterio per massimi e minimi relativi) Siano I un intervallo di R, x0 ∈ I ed f : I → R una funzione reale derivabile n volte in x0 , con n ≥ 2 e si supponga che ∀ k = 1, . . . , n − 1 : f (k) (x0 ) = 0 , f (n) (x0 ) ̸= 0 . Allora 1. Se n è dispari e f (n) (x0 ) > 0, allora f è strettamente crescente in x0 , mentre se f (n) (x0 ) < 0, allora f è strettamente decrescente in x0 . 2. Se n è pari e f (n) (x0 ) > 0, allora x0 è un punto di minimo relativo proprio per f , mentre se f (n) (x0 ) < 0, allora x0 è un punto di massimo relativo proprio per f . Dimostrazione. Poiché f è derivabile n volte in x0 , si può supporre che la derivata di ordine n − 1 di f sia definita in un intervallo I ∩ J, con J intorno opportuno di x0 . Applicando la formula di Taylor (Teorema 9.3.5) alla restrizione di f a I ∩ J si trova una funzione σn : I ∩ J → R tale che limx→x0 σn (x) = 0 e, per ogni x ∈ I ∩ J, f (x) = Tn (x) + σn (x)(x − x0 )n /n!, dove Tn denota il polinomio di Taylor di ordine n di f relativo ad x0 ; dalle ipotesi e dalla definizione di Tn segue, per ogni x ∈ I ∩ J, f (x) − f (x0 ) = (x − x0 )n (n) (f (x) + σn (x)) . n! (1) Capitolo 9: Calcolo differenziale 252 Poiché limx→x0 σn (x) = 0 e |f (n) (x)| > 0, si può trovare δ > 0 tale che I∩]x0 −δ, x0 +δ[⊂ I ∩ J e inoltre, per ogni x ∈ I∩]x0 − δ, x0 + δ[, |σn (x)| < |f (n) (x)| . 2 (2) Se f (n) (x) > 0, dalla (2) si ottiene, per ogni x ∈ I∩]x0 − δ, x0 + δ[, − f (n) (x) f (n) (x) < σn (x) < 2 2 e conseguentemente 0< f (n) (x) 3 f (n) (x) < f (n) (x) + σn (x) < 2 2 mentre, se f (n) (x) < 0, sempre dalla (2) si ottiene, per ogni x ∈ I∩]x0 − δ, x0 + δ[, f (n) (x) f (n) (x) < σn (x) < − 2 2 e quindi 3 f (n) (x) f (n) (x) < f (n) (x) + σn (x) < <0. 2 2 n Da ciò, e tenendo presente che il termine (x − x0 ) è sempre positivo per n pari, mentre è positivo in [x0 , +∞[ e negativo in ] − ∞, x0 ] per n dispari, dalla (1) si ottiene interamente la tesi. Osservazione 9.4.8 Massimi e minimi relativi di una funzione. I criteri forniti sopra consentono di individuare i punti di massimo e di minimo relativo di una funzione nel caso in cui essi siano interni all’insieme di definizione e la funzione sia derivabile una o più volte in tali punti. Per determinare tutti i punti di massimo e di minimo relativo di una funzione occorre pertanto tenere conto anche dei punti estremi in cui la funzione è definita e dei punti in cui la funzione non è derivabile. Pertanto, se f : X → R è una funzione reale definita in un sottoinsieme X di R, si può procedere nel modo seguente: 1. Si determina l’insieme X ′ = {x0 ∈ X |f è derivabile in x0 } dei punti in cui la funzione è derivabile. Per il Corollario 9.4.2, i punti di massimo e di minimo relativo appartenenti ad X ′ e di accumulazione a sinistra e a destra per X devono soddisfare l’equazione f ′ (x) = 0 , x ∈ X′ . Pertanto, conviene determinare l’insieme X0 delle soluzioni di tale equazione. In generale accade che X0 è un sottoinsieme finito (in qualche caso numerabile) di R. 9.4 Applicazioni allo studio del grafico delle funzioni reali 253 2. Non è detto che un elemento x0 ∈ X0 sia un punto di massimo o di minimo relativo per f in quanto la condizione f ′ (x0 ) = 0 è solamente necessaria. Quindi occorre verificare se ognuno degli elementi di X0 è effettivamente un punto di massimo o di minimo relativo per f utilizzando i criteri esposti nelle Proposizioni 9.4.4, 9.4.5 ed eventualmente 9.4.7. Se l’applicazione di tali criteri non consente di concludere se un punto è effettivamente di massimo o di minimo relativo occorre procedere ad una verifica diretta mediante la definizione di punto di massimo e di minimo relativo. 3. Bisogna considerare i punti esclusi nei casi precedenti, che sono gli elementi di X che non appartengono ad X ′ (cioè in cui f non è derivabile) e gli elementi di X che non sono di accumulazione a sinistra e a destra per X (in generale gli estremi appartenenti ad X degli intervalli di cui X è costituito). Tali punti si presentano solitamente in numero finito (in qualche caso numerabile) e per ognuno di essi bisogna verificare in maniera diretta se si tratta di un punto di massimo o di minimo relativo per f . Per quanto riguarda i punti in cui la funzione non è derivabile conviene osservare che se in uno di tali punti la funzione è continua ed il punto è angoloso o cuspidale, il primo criterio potrebbe comunque assicurare se si tratta o meno di un punto di massimo o minimo relativo; ad esempio, in un punto angoloso i segni delle derivate destre e sinistre descrivono precisamente il punto (se la derivata sinistra e quella destra sono entrambe positive in un punto x0 la funzione è strettamente crescente in x0 , se sono entrambe negative la funzione è strettamente decrescente in x0 , se la derivata sinistra è positiva e quella destra è negativa il punto x0 è di massimo relativo per f ed infine se la derivata sinistra è negativa e quella destra è positiva il punto x0 è di minimo relativo per f ). Osservazione 9.4.9 Massimi e minimi assoluti di una funzione. La discussione precedente consente in generale di individuare tutti i punti di massimo e di minimo relativo per una funzione. Ci si può porre a questo punto il problema della determinazione degli eventuali punti di massimo o di minimo assoluto per f . A tale proposito, bisogna innanzitutto osservare che in generale non è detto che tali punti esistano a meno che la funzione non sia continua in un sottoinsieme chiuso e limitato di R (in tal caso l’esistenza del massimo e del minimo assoluto di f viene assicurata dal teorema di Weierstrass e per determinare il massimo o il minimo assoluto di f è sufficiente confrontare i valori della funzione nei punti di massimo o di minimo relativo). In generale, per determinare tali eventuali punti si confrontano dapprima i valori della funzione in tutti i punti di massimo e di minimo relativo (eventuali); si studia poi il comportamento della funzione in tutti i 254 Capitolo 9: Calcolo differenziale punti di accumulazione in cui non è definita oppure in cui è definita ma non è continua (in effetti, con l’estremo superiore o con l’estremo inferiore se f è limitata superiormente o inferiormente; in caso contrario, evidentemente f non può essere dotata di massimo o di minimo). Dal confronto, poi, si potrà dedurre se il massimo ed il minimo assoluto della funzione esistono e, in caso affermativo, potranno anche essere determinati. ◃ Ad esempio, si studiano la monotonia e gli eventuali punti di massimo e di minimo relativo ed assoluto della funzione f (x) := x2 + |x − 3| . La funzione è definita in tutto R ed è derivabile nell’insieme R r {3}; per ogni x ∈ R r {3}, si ha { |x − 3| 2x + 1 , x>3, ′ = f (x) = 2x + 2x − 1 , x<3. x−3 dunque la derivata è strettamente positiva in ]1/2, +∞[r{3} e strettamente negativa in ] − ∞, 1/2[; poiché f è continua nel punto 3, da ciò segue direttamente che f è strettamente crescente negli intervalli [1/2, 3] e [3, +∞[ (quindi in [1/2, +∞[) ed è strettamente decrescente in ] − ∞, 1/2]. Nel ′ punto 3 la funzione non è derivabile in quanto f+ (3) = limx→3+ f ′ (x) = 7 ′ (3) = limx→3− f ′ (x) = 5. Inoltre, il punto 1/2 è di minimo per mentre f− la funzione e si ha f (1/2) = 11/4. Per quanto riguarda gli eventuali punti di massimo e di minimo assoluto si osserva che agli estremi dell’insieme di definizione si ha limx→+∞ f (x) = +∞ e limx→−∞ f (x) = −∞; quindi f non è limitata superiormente e conseguentemente non è dotata di massimo mentre il punto 1/2 è il punto di minimo assoluto della funzione (il minimo assoluto è uguale a 11/4). 9.4.2 Convessità, concavità e flessi Le proprietà introdotte nel presente paragrafo costituiscono un ulteriore strumento per lo studio delle funzioni reali. Le proprietà sulle quali ci si soffermerà saranno quelle di convessità e concavità di una funzione. Parallelamente a quanto visto per la crescenza e la decrescenza, anche queste ultime possono essere introdotte globalmente ed in un punto; la nozione legata al calcolo differenziale è quella locale ma in intervalli le due nozioni coincidono; per tale motivo ci si soffermerà fin dall’inizio sulla nozione locale. Tuttavia, al solo fine della completezza, conviene precisare che una funzione f : I → R definita in un intervallo I si dice convessa (rispettivamente, concava) se considerati due qualsiasi punti 9.4 Applicazioni allo studio del grafico delle funzioni reali 255 x1 , x2 ∈ I con x1 < x2 , il suo grafico nell’intervallo ]x1 , x2 [ si trova al di sotto (rispettivamente, al di sopra) di quello della retta secante il grafico di f nei punti (x1 , f (x1 )) e (x2 , f (x2 )). La retta passante per i punti (x1 , f (x1 )) e (x2 , f (x2 )) ha equazione y − f (x1 ) f (x2 ) − f (x1 ) = x − x1 x2 − x1 cioè y = f (x1 ) + f (x2 ) − f (x1 ) (x − x1 ) x2 − x1 e tenendo presente che gli elementi dell’intervallo x ∈]x1 , x2 [ possono essere scritti nella forma x = λx2 + (1 − λ)x1 l’equazione della retta considerata diventa y = f (x2 ) + λ(f (x2 ) − f (x1 )) cioè y = λ f (x2 ) + (1 − λ)f (x1 ); conseguentemente, la funzione f risulta convessa (rispettivamente, concava) se e solo se, per ogni x1 , x2 ∈ I e per ogni λ ∈]0, 1[, risulta f (λx2 + (1 − λ)x1 ) ≤ λ f (x2 ) + (1 − λ)f (x1 ) (rispettivamente, f (λx2 + (1 − λ)x1 ) ≥ λ f (x2 ) + (1 − λ)f (x1 ) ). Inoltre la funzione f si dice strettamente convessa (rispettivamente, strettamente concava) se le condizioni precedenti valgono con una diseguaglianza stretta, cioè se f (λx2 + (1 − λ)x1 ) < λ f (x2 ) + (1 − λ)f (x1 ) (rispettivamente, f (λx2 + (1 − λ)x1 ) < λ f (x2 ) + (1 − λ)f (x1 )). La definizione precedente vale per qualsiasi funzione definita in un intervallo senza richiedere proprietà di derivabilità. Tuttavia, per riconoscere la validità di tali proprietà può essere utilizzato il calcolo differenziale introducendo anche una nozione locale di convessità e di concavità. In questo modo si possono ottenere proprietà e legami con il calcolo differenziale in maniera abbastanza simile a quanto svolto per i concetti di crescenza, decrescenza e massimi e minimi relativi. Si considera pertanto la seguente definizione locale. Capitolo 9: Calcolo differenziale 256 Definizione 9.4.10 Sia X un sottoinsieme di R e siano x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale derivabile in x0 . Si dice che f è convessa (rispettivamente, concava) in x0 se esiste δ > 0 tale che, per ogni x ∈ X∩]x0 − δ, x0 + δ[, f (x0 )+f ′ (x0 )(x−x0 ) ≤ f (x) (rispettivamente, f (x) ≤ f (x0 )+f ′ (x0 )(x−x0 )). Inoltre, si dice che f è strettamente convessa (rispettivamente, strettamente concava) in x0 se esiste δ > 0 tale che, per ogni x ∈ X∩]x0 −δ, x0 +δ[r{x0 }, f (x0 )+f ′ (x0 )(x−x0 ) < f (x) (rispettivamente, f (x) < f (x0 )+f ′ (x0 )(x−x0 )). Infine, si dice che x0 è un punto di flesso ascendente (rispettivamente, discendente) per f se esiste δ > 0 tale che ∀ x ∈ X∩]x0 − δ, x0 [: f (x) ≤ f (x0 ) + f ′ (x0 )(x − x0 ) , ∀ x ∈ X∩]x0 , x0 + δ[: f (x0 ) + f ′ (x0 )(x − x0 ) ≤ f (x) , (rispettivamente, ∀ x ∈ X∩]x0 − δ, x0 [: f (x0 ) + f ′ (x0 )(x − x0 ) ≤ f (x) , ∀ x ∈ X∩]x0 , x0 + δ[: f (x) ≤ f (x0 ) + f ′ (x0 )(x − x0 ) ), Se la condizione precedente è verificata con una diseguaglianza stretta si dice anche che x0 è un punto di flesso proprio per f . Se una funzione è convessa (rispettivamente, concava) in un punto x0 , si dice anche che f volge la concavità verso l’alto (rispettivamente, verso il basso) in x0 . Una funzione convessa (rispettivamente, concava, strettamente convessa, strettamente concava) in tutti i punti di un sottoinsieme A di X viene denominata convessa (rispettivamente, concava, strettamente convessa, strettamente concava) in A; se l’insieme A non viene precisato è da intendersi A = X. ◃ Pertanto geometricamente una funzione è convessa (rispettivamente, concava) in un punto x0 se in un intorno di x0 il suo grafico si trova al di sopra (rispettivamente, al di sotto) della retta tangente al grafico in x0 ; se x0 è un punto di flesso, la retta tangente al grafico in x0 viene anche denominata tangente flessionale in x0 oppure tangente di flesso in x0 e in un intorno di un punto di flesso, il grafico della funzione si trova da un lato al di sotto e dall’altro al di sopra (oppure viceversa) della tangente flessionale. Per convenzione, si può continuare a denominare punto di flesso ascendente (rispettivamente, discendente) anche un elemento x0 ∈ X in cui f è dotata 9.4 Applicazioni allo studio del grafico delle funzioni reali 257 di derivata uguale a −∞− (rispettivamente, +∞). In tal caso, la tangente flessionale è una retta verticale di equazione x = x0 . Nella Figura successiva 9.5 viene rappresentata una funzione f convessa in un punto x0 , concava in un punto x1 , ed un punto x2 di flesso per f . y x0 x1 0 x2 x Figura 9.5: Funzione convessa o concava in un punto e punti di flesso. ◃ Si osservi che può accadere che una funzione sia derivabile in un punto x0 e che non verifichi alcuna delle condizioni previste nella Definizione 9.4.10; ad esempio, la funzione { 3 x sin x1 , x ̸= 0 , f (x) := 0, x=0, è derivabile in 0 e risulta f ′ (0) = 0; conseguentemente, la retta tangente al grafico di f in 0 ha equazione y = 0, mentre la funzione non è né positiva né negativa in alcun intorno di 0. ◃ I criteri maggiormente utilizzati per lo studio della convessità e della concavità di una funzione sono collegati allo studio del segno della sua derivata seconda. Tali criteri sono essenzialmente basati sull’osservazione seguente. Osservazione 9.4.11 Sia X un sottoinsieme di R e siano x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale; si supponga che la derivata prima di f sia definita in X ∩ I con I intorno di x0 e si consideri la funzione ϕ : X ∩ I → R definita ponendo, per ogni x ∈ X ∩ I, ϕ(x) := f (x) − f (x0 ) − f ′ (x0 )(x − x0 ) 258 Capitolo 9: Calcolo differenziale (ϕ rappresenta la differenza tra la funzione f e la retta tangente al grafico di f nel punto x0 ). Allora valgono le seguenti proprietà: 1. f è convessa (rispettivamente, strettamente convessa, concava, strettamente concava) in x0 se e solo se il punto x0 è di minimo relativo (rispettivamente, di minimo relativo proprio, di massimo relativo, di massimo relativo proprio) per ϕ. 2. Il punto x0 è un flesso ascendente (rispettivamente, un flesso ascendente proprio, un flesso discendente, un flesso discendente proprio) per f se e solo se ϕ è decrescente (rispettivamente, strettamente decrescente, crescente, strettamente crescente) in x0 . (Basta tenere presente le definizioni adottate e che ϕ(x0 ) = 0, da cui segue che ϕ è positiva (rispettivamente, negativa) in un intorno di x0 se e solo se x0 è di minimo (rispettivamente, di massimo) relativo per ϕ. ) Dall’osservazione precedente, la proprietà di convessità, di concavità in un punto per la funzione f viene ricondotta alla proprietà di minimo e di massimo relativo per la funzione ϕ e analogamente i punti di flesso per f vengono ricondotti alla proprietà di crescenza e decrescenza di ϕ. Si tenga inoltre presente che ϕ è derivabile in X ∩ I e che, per ogni x ∈ X ∩ I, risulta ϕ′ (x) = f ′ (x) − f ′ (x0 ) e in particolare ϕ′ (x0 ) = 0. Quanto osservato si può chiaramente applicare nel caso in cui la funzione f sia dotata di derivata seconda in x0 , in quanto ciò comporta che essa deve essere necessariamente derivabile in X ∩ I, con I intorno opportuno di x0 . In tal caso, inoltre, ϕ risulta anch’essa derivabile due volte in x0 e si ha ϕ′′ (x0 ) = f ′′ (x0 ). Applicando tali proprietà ed i risultati ottenuti nel paragrafo precedente alla funzione ϕ, si stabiliscono direttamente i seguenti criteri. Proposizione 9.4.12 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed f : X → R una funzione reale derivabile due volte in x0 . Allora 1. Se f ′′ (x0 ) > 0 (rispettivamente, f ′′ (x0 ) < 0), allora f è strettamente convessa (rispettivamente, strettamente concava) in x0 . 2. Se f è convessa (rispettivamente, concava) in x0 , allora f ′′ (x0 ) ≥ 0 (rispettivamente, f ′′ (x0 ) ≤ 0). Dimostrazione. 1) Si ha ϕ′′ (x0 ) > 0 e quindi ϕ′ è strettamente crescente in x0 ; poiché ϕ′ (x0 ) = 0, ϕ′ deve essere strettamente negativa in un intorno sinistro di x0 e strettamente positiva in un intorno destro di x0 . Dalla Proposizione 9.4.4, il punto x0 è un minimo 9.4 Applicazioni allo studio del grafico delle funzioni reali 259 relativo proprio per ϕ, e quindi f è strettamente convessa in x0 . In modo analogo si stabiliscono i casi rispettivi. 2) Se f è convessa in x0 , allora x0 è un punto di minimo relativo per ϕ; dal Corollario 9.4.2, segue ϕ′′ (x0 ) ≥ 0 e quindi f ′′ (x0 ) ≥ 0. Il caso rispettivo si stabilisce in maniera analoga. Come conseguenza della Proposizione 9.4.12 si stabilisce una prima condizione necessaria per i punti di flesso. Corollario 9.4.13 (Condizione necessaria per punti di flesso) Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione a sinistra e a destra per X ed f : X → R una funzione reale derivabile due volte in x0 . Se x0 è un punto di flesso per f , allora necessariamente f ′′ (x0 ) = 0. Dimostrazione. Si supponga, ad esempio, che x0 sia un punto di flesso ascendente per f . Se, per assurdo, fosse f ′′ (x0 ) > 0, dalla Proposizione 9.4.12, f risulterebbe strettamente convessa in x0 . Allora, si potrebbe trovare δ > 0 tale che, per ogni x ∈ X∩]x0 − δ, x0 [, f (x) ≤ f (x0 ) + f ′ (x0 )(x − x0 ) (in quanto x0 è un flesso ascendente) e f (x) > f (x0 ) + f ′ (x0 )(x − x0 ) (in quanto f è strettamente convessa in x0 ). Tenendo presente che l’intersezione X∩]x0 − δ, x0 [ è non vuota in quanto x0 è di accumulazione a sinistra per X, le condizioni precedenti portano ad un assurdo. In modo analogo, utilizzando il fatto che x0 è di accumulazione anche a destra per X, si deduce che non può essere f ′′ (x0 ) < 0 e quindi deve essere f ′′ (x0 ) = 0. ′′ La condizione f (x0 ) = 0 può essere soddisfatta anche quando il punto x0 non è di flesso per f come accade, ad esempio, per la funzione f (x) := x4 , x ∈ R, nel punto x0 = 0. Si deducono ora le seguenti condizioni per lo studio della convessità e concavità in intervalli; la loro dimostrazione viene tralasciata per brevità in quanto segue le stesse linee di quelle già viste. Proposizione 9.4.14 Siano I un intervallo di R ed f : I → R una funzione reale derivabile due volte in I. Si ha 1. f è convessa (rispettivamente, concava) se e solo se verifica la condizione seguente: ∀ x0 ∈ I : f ′′ (x0 ) ≥ 0 (rispettivamente, ∀ x0 ∈ I : f ′′ (x0 ) ≤ 0 ). (9.4.3) 2. f è strettamente convessa (rispettivamente, strettamente concava) se e solo se f verifica la condizione (9.4.3) ed inoltre f ′′ non è costantemente nulla in alcun intervallo contenuto in I, cioè a, b ∈ I , a < b =⇒ ∃ x0 ∈]a, b[ t.c. f ′′ (x0 ) ̸= 0 . (9.4.4) Capitolo 9: Calcolo differenziale 260 Si enunciano infine i criteri maggiormente utilizzati per la determinazione dei punti di flesso di una funzione. Proposizione 9.4.15 (Primo criterio per i punti di flesso) Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : X → R una funzione reale. Si supponga che esista δ > 0 tale che f sia derivabile due volte in X∩]x0 − δ, x0 + δ[r{x0 } e inoltre che la derivata prima di f sia continua in x0 . Se ∀ x ∈]x0 − δ, x0 [: f ′′ (x) ≤ 0 , ∀ x ∈]x0 , x0 + δ[: f ′′ (x) ≥ 0 (oppure rispettivamente, ∀ x ∈]x0 − δ, x0 [: f ′′ (x) ≥ 0 , ∀ x ∈]x0 , x0 + δ[: f ′′ (x) ≤ 0) ), allora x0 è un punto di flesso ascendente (rispettivamente, discendente) per f. Se, in più, la derivata seconda di f non si annulla in X∩]x0 − δ, x0 + δ[r{x0 }, allora x0 è un punto di flesso proprio per f . Dimostrazione. Dalla Proposizione 9.4.4, applicata alla derivata prima di f , segue che x0 è un punto di minimo (rispettivamente, di massimo) relativo per f ′ e quindi, per quanto osservato preliminarmente, anche per ϕ′ , da cui la prima parte della tesi. L’ultima parte della tesi si ottiene nello stesso modo osservando che in questo caso il punto x0 risulta un minimo (rispettivamente, un massimo) relativo proprio per f ′ per quanto osservato nell’ultima parte della Proposizione 9.4.4. Proposizione 9.4.16 (Secondo criterio per i punti di flesso) Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : I → R una funzione reale derivabile tre volte in x0 . Se f ′′ (x0 ) = 0 e f (3) (x0 ) > 0 (rispettivamente, f (3) (x0 ) < 0), allora x0 è un punto di flesso ascendente (rispettivamente, discendente) proprio per f . Dimostrazione. Dalla Proposizione 9.4.5 segue che x0 è un punto di minimo (rispettivamente, di massimo) relativo proprio per f ′ e quindi anche per ϕ′ ; allora, la tesi segue direttamente da quanto osservato preliminarmente. Corollario 9.4.17 Siano X un sottoinsieme di R, x0 ∈ X un punto interno ad X ed f : X → R una funzione reale derivabile tre volte in x0 . Se x0 è un punto di flesso ascendente (rispettivamente, discendente) per f , allora deve essere f (3) (x0 ) ≥ 0 (rispettivamente, f (3) (x0 ) ≤ 0). 9.4 Applicazioni allo studio del grafico delle funzioni reali 261 Dimostrazione. Deve essere innanzitutto f ′′ (x0 ) = 0 per il Corollario 9.4.13. Se, poi, fosse f (3) (x0 ) < 0 (rispettivamente, f (3) (x0 ) > 0), dalla Proposizione 9.4.16 x0 sarebbe un punto di flesso discendente (rispettivamente, ascendente) proprio per f , in contraddizione con le ipotesi. Se f : X → R è derivabile tre volte in un punto x0 interno ad X, dai Corollari 9.4.13 e 9.4.17 si ottengono le seguenti condizioni necessarie per i punti di flesso ascendenti (rispettivamente, discendenti) f ′′ (x0 ) = 0 , f (3) (x0 ) ≤ 0 (rispettivamente, f (3) (x0 ) ≥ 0 ). Infine, se le derivate seconda e terza di una funzione sono entrambe nulle, si può cercare di utilizzare il seguente ulteriore criterio dedotto dalla formula di Taylor. Proposizione 9.4.18 (Terzo criterio per i punti di flesso) Siano I un intervallo di R, x0 ∈ I ed f : I → R una funzione reale derivabile n volte in x0 , con n ≥ 3 e si supponga che ∀ k = 2, . . . , n − 1 : f (k) (x0 ) = 0 , f (n) (x0 ) ̸= 0 . Allora 1. Se n è dispari e f (n) (x0 ) > 0, allora x0 è un punto di flesso ascendente proprio per f , mentre se f (n) (x0 ) < 0, allora x0 è un punto di flesso discendente proprio per f . 2. Se n è pari e f (n) (x0 ) > 0, allora f è strettamente convessa in x0 , mentre se f (n) (x0 ) < 0, allora f è strettamente concava in x0 . Dimostrazione. Basta applicare la Proposizione 9.4.7 alla derivata prima di f , con n − 1 al posto di n, tenendo conto delle osservazioni preliminari e del fatto che i punti di minimo e di massimo per f ′ sono gli stessi della funzione ϕ′ . In analogia con l’Osservazione 9.4.8 a proposito dei punti di massimo e di minimo relativo di una funzione, anche ora bisogna ricordare di considerare separatamente gli eventuali punti di flesso in cui la funzione non è derivabile due volte; quindi, in generale i punti di flesso vanno ricercati tra le soluzioni dell’equazione f ′′ (x) = 0 ed i punti in cui la funzione non è derivabile due volte (tali punti costituiscono di solito un sottoinsieme finito oppure numerabile dell’insieme di definizione della funzione). ◃ Ad esempio, si studiano la concavità, la convessità e gli eventuali punti di flesso della funzione ( ) 1 3 5 2 4 2 f (x) := x x − x + x−2 , x∈R. 20 12 3 Capitolo 9: Calcolo differenziale 262 La funzione è un polinomio e quindi è infinite volte derivabile; la derivata seconda è data da f ′′ (x) = x3 − 5x2 + 8x − 4 = (x − 1)(x − 2)2 ed è strettamente positiva nell’intervallo ]1, +∞[r{2} e strettamente negativa in ] − ∞, 1[; pertanto, f è strettamente convessa in [1, +∞[ e strettamente concava in ] − ∞, 1] e, per il primo criterio per i punti di flesso (Proposizione 9.4.15), il punto 1 è un punto di flesso, mentre il punto 2 non lo è; allo stesso risultato si perviene applicando il secondo criterio per i punti di flesso nel punto 1 ed il terzo criterio nel punto 2. 9.4.3 Asintoti Le nozioni seguenti possono risultare utili per una descrizione più dettagliata del comportamento di una funzione reale sia in punti di accumulazione reali nei quali la funzione non è definita oppure non è continua (mediante gli asintoti verticali), sia nei punti +∞ e −∞ nel caso in cui la funzione sia definita in un insieme non limitato superiormente oppure inferiormente (mediante gli asintoti orizzontali oppure obliqui). Definizione 9.4.19 Siano X un sottoinsieme di R, x0 ∈ R un punto di accumulazione a destra (rispettivamente, a sinistra) per X ed f : X → R una funzione reale. Si dice che la retta di equazione x = x0 è un asintoto verticale a destra (rispettivamente, a sinistra) per f se limx→x+ f (x) = ±∞, (rispettivamente, 0 limx→x− = ±∞). 0 Più precisamente, l’asintoto viene denominato in alto se il limite è uguale a +∞ ed in basso se è uguale a −∞. Evidentemente, i punti x0 ∈ R in cui vi possono essere asintoti verticali per una funzione devono essere innanzitutto di accumulazione per il suo insieme di definizione ed in essi o la funzione non deve essere definita oppure non deve essere continua in quanto solo in tali casi infatti il limite della funzione potrebbe risultare infinito. La verifica poi del fatto che la retta x = x0 rappresenti o meno l’equazione di un asintoto verticale per f viene effettuata mediante il calcolo diretto del limite destro oppure sinistro della funzione. Può accadere che se il punto x0 è di accumulazione sia a destra che a sinistra per X, la retta di equazione x = x0 rappresenti un asintoto verticale per f solamente a sinistra oppure solamente a destra; ad esempio, per la funzione f (x) := e1/x , x ̸= 0, la retta di equazione x = 0 è un asintoto verticale in alto solamente a destra. Può anche accadere che la retta di equazione x = x0 sia un asintoto da un lato in alto e dall’altro in basso, come ad esempio, per la funzione f (x) := 1/x, x ∈ R r {0}, nel punto x0 = 0. 9.4 Applicazioni allo studio del grafico delle funzioni reali 263 Definizione 9.4.20 Siano X un sottoinsieme non limitato superiormente (rispettivamente, inferiormente) di R ed f : X → R una funzione reale. Se b ∈ R, si dice che la retta di equazione y = b è un asintoto orizzontale a destra (rispettivamente, a sinistra) per f se limx→+∞ f (x) = b (rispettivamente, limx→−∞ f (x) = b). Più in generale, se a, b ∈ R, si dice che la retta di equazione y = ax + b è un asintoto obliquo a destra (rispettivamente, a sinistra) per f se limx→+∞ f (x) − ax − b = 0, (rispettivamente, limx→−∞ f (x) − ax − b = 0). La verifica dell’esistenza di un asintoto orizzontale a destra (rispettivamente, a sinistra) per f , nel caso in cui la funzione sia definita in un insieme non limitato superiormente (rispettivamente, inferiormente), è immediata in quanto basta verificare che il limite della funzione nel punto +∞ (rispettivamente, −∞) esista e sia finito; il valore b di tale limite fornisce poi direttamente l’equazione dell’asintoto orizzontale. Nella Figura 9.6 seguente è mostrata una funzione con un asintoto orizzontale a destra e a sinistra ed un asintoto verticale nel punto x0 . y 0 x0 x Figura 9.6: Asintoto orizzontale e verticale. ◃ Per discutere l’esistenza dell’asintoto obliquo e determinarne eventualmente l’equazione, non si può invece ricorrere direttamente alla definizione Capitolo 9: Calcolo differenziale 264 in quanto i numeri a, b ∈ R previsti nell’equazione dell’asintoto obliquo non sono in generale assegnati. Tuttavia si riconosce facilmente che f è dotata di asintoto obliquo a destra (rispettivamente, a sinistra) se e solo se esistono, e sono finiti, i seguenti limiti f (x) =a∈R, x→+∞ x lim lim f (x) − ax = b ∈ R , x→+∞ (rispettivamente, lim x→−∞ f (x) =a∈R, x lim f (x) − ax = b ∈ R ). x→−∞ In tal caso, l’asintoto obliquo a destra (rispettivamente, a sinistra) per f ha equazione y = ax + b. (Infatti se F è dotata di asintoto obliquo a destra di equazione y = ax + b, con a, b ∈ R, allora f (x) − ax − b ax + b f (x) = lim + lim =a, lim x→+∞ x→+∞ x→+∞ x x x ed inoltre lim f (x) − ax = lim (f (x) − ax − b) + b = b . x→+∞ x→+∞ Viceversa si ottiene direttamente lim f (x) − ax − b = b − b = 0 x→+∞ e quindi la proprietà è completamente dimostrata insieme all’espressione dell’equazione dell’asintoto obliquo. Nel caso degli asintoti obliqui a sinistra si procede in maniera del ) tutto analoga. L’importanza della proposizione precedente risiede nel fatto che essa fornisce un metodo per individuare il possibile coefficiente angolare ed il termine noto dell’equazione dell’asintoto obliquo. Bisogna tuttavia sempre verificare che entrambi i limiti previsti esistano e siano finiti; ad esempio, la funzione logaritmo non è dotata di asintoto obliquo a destra in quanto limx→+∞ log x/x = 0, ma limx→+∞ (log x − 0 · x) = +∞. ◃ Ad esempio, si determinano gli eventuali asintoti della funzione f (x) := x + 1 1 + arctan x + arctan , x−1 x x ∈ R r {0, 1} . La funzione è definita e continua in R r {0, 1} e quindi può presentare un asintoto verticale solamente nei punti 0 e 1. Risulta limx→0− f (x) = −1 − π/2 e limx→0+ f (x) = −1 + π/2 e quindi la retta di equazione x = 0 non è asintoto né a sinistra né a destra per f . Inoltre limx→1− f (x) = −∞ 9.4 Applicazioni allo studio del grafico delle funzioni reali 265 e limx→1+ f (x) = +∞ e quindi la retta di equazione x = 1 è asintoto a sinistra in basso e a destra in alto per f . Infine, si ha limx→±∞ f (x) = ±∞ e quindi non esistono asintoti orizzontali, mentre lim x→±∞ f (x) =1, x lim f (x) − x = ± x→±∞ π , 2 e quindi la retta di equazione y = x + π/2 è un asintoto obliquo a destra per f mentre la retta di equazione y = x − π/2 è un asintoto obliquo a sinistra per f . 9.4.4 Studio del grafico di una funzione reale Una funzione reale viene spesso assegnata precisando il valore assunto in un generico elemento dell’insieme di definizione. Lo scopo della discussione seguente è quello di determinare le informazioni che possono essere utili ad una descrizione più dettagliata della funzione ed a tracciarne approssimativamente il grafico. Il primo passo è sicuramente quello di determinare l’insieme X di definizione della funzione ricordando che per convenzione esso è costituito da tutti i numeri reali in cui ha senso l’espressione assegnata (in altre parole, si sceglie il sottoinsieme più grande di R in cui la funzione può essere definita). Conviene poi subito vedere se l’insieme di definizione X è simmetrico oppure periodico, e in caso affermativo verificare se la funzione è pari, dispari oppure periodica; tali informazioni possono semplificare lo studio di tutti i punti successivi e per questo motivo è opportuno stabilire subito tali proprietà. Se una funzione è pari oppure dispari, essa può essere studiata solamente in X ∩ [0, +∞[ (oppure in X∩] − ∞, 0]) e se è periodica di periodo T > 0, può essere studiata in X ∩ [a, a + T ], dove a è un numero reale scelto arbitrariamente. Si passa poi allo studio del segno della funzione risolvendo la disequazione f (x) ≥ 0 ed allo studio delle intersezioni con l’asse x, fornite dalle soluzioni dell’equazione f (x) = 0; l’eventuale intersezione con l’asse y esiste se 0 ∈ X ed è in questo caso il punto di coordinate (0, f (0)). Segue lo studio della continuità della funzione; i punti in cui la funzione non è continua vengono utilizzati per verificare in essi l’eventuale esistenza di asintoti verticali. Si considerano quindi anche gli eventuali asintoti orizzontali oppure obliqui se la funzione è definita in un insieme non limitato. Infine, lo studio della derivabilità prima e seconda e del segno delle derivate prima e seconda consentono di determinare crescenza e decrescenza della funzione e massimi e minimi relativi ed assoluti, e la convessità, concavità e punti di flesso. Capitolo 9: Calcolo differenziale 266 Tutte le informazioni ottenute vengono poi riassunte con un grafico approssimativo della funzione. Pertanto, lo schema seguente è quello che viene solitamente seguito per lo studio di una funzione di cui è assegnato il generico valore y = f (x): 1) Determinazione dell’insieme di definizione. 2) Eventuale parità, disparità e periodicità. 3) Studio del segno della funzione ed eventuali intersezioni con gli assi. 4) Continuità. 5) Asintoti verticali, orizzontali ed obliqui. 6) Derivabilità della funzione e calcolo delle derivate prima e seconda. 7) Studio della crescenza e della decrescenza. 8) Punti di massimo e di minimo relativo ed eventualmente assoluti. 9) Studio della convessità, concavità e flessi (eventuali tangenti flessionali). 10) Grafico riassuntivo della funzione. ◃ Ad esempio, si studia la seguente funzione tracciandone approssimativamente il grafico √ x2 − 5x + 6 f (x) := . x2 − 1 Per determinare l’insieme di definizione, bisogna imporre le condizioni { 2 x − 5x + 6 ≥ 0 , x2 − 1 ̸= 0 ; si deduce che f è definita nell’insieme Xf :=] − ∞, −1[∪] − 1, 1[∪]1, 2] ∪ [3, +∞[ ; poiché Xf non è simmetrico né periodico, la funzione non può verificare condizioni di simmetria o di periodicità. Inoltre, il segno della funzione dipende solamente dal denominatore x2 −1 e quindi la funzione è positiva negli intervalli ] − ∞, −1[, ]1, 2] e [3, +∞[ e 9.4 Applicazioni allo studio del grafico delle funzioni reali 267 negativa nell’intervallo ] − 1, 1[; vi sono due intersezioni con l’asse delle ascisse nei punti A(2, 0), B(3, 0) mentre l’unica intersezione con l’asse delle √ ordinate è data dal punto C(0, − 6). La funzione è continua in tutto Xf ; pertanto si possono presentare eventuali asintoti verticali solamente nei punti −1 e 1 (che sono di accumulazione ma in cui f non è definita), nei quali si ha lim f (x) = +∞ , x→−1− lim f (x) = −∞ , x→1− lim f (x) = −∞ , x→−1+ lim f (x) = +∞ ; x→1+ quindi la retta di equazione x = −1 è un asintoto verticale in alto a sinistra e in basso a destra per f , mentre la retta di equazione x = 1 è un asintoto verticale in basso a sinistra e in alto a destra. Si ha inoltre limx→±∞ f (x) = 0 e quindi la retta di equazione y = 0 è un asintoto orizzontale sia a sinistra che a destra per f . L’argomento della radice nella definizione di f si annulla solamente nei punti 2 e 3 e quindi la funzione è infinite volte derivabile in Xf r {2, 3} e si ha, per ogni x ∈ Xf r {2, 3}, f ′ (x) = f ′′ (x) = 2x3 − 15x2 + 26x − 5 √ , 2(x2 − 1)2 x2 − 5x + 6 8x6 − 120x5 + 615x4 − 1400x3 + 1458x2 − 720x + 287 √ . 4(x2 − 1)3 x2 − 5x + 6(x2 − 5x + 6) − Nei punti 2 e 3 la derivata prima tende a −∞ e rispettivamente a +∞; quindi f è dotata di derivata nei punti 2 e 3 e si ha f ′ (2) = −∞ e f ′ (3) = +∞. Utilizzando la regola di Ruffini si riconosce subito che il punto x0 := 5 è una radice del polinomio 2x3 −15x2 +26x−5; a questo punto possono essere √ determinate facilmente anche le altre radici, che sono x := (5− 17)/4 (ap1 √ prossimativamente, x1 ∼ 0, 22) e x2 := (5 + 17)/4 (approssimativamente, x2 ∼ 2, 28; dunque, x2 ∈ / Xf ); si può allora dedurre che la derivata prima è strettamente positiva in ] − ∞, −1[∪] − 1, x1 [∪]3, 5[ e strettamente negativa in ]x1 , 1[∪]1, 2[∪]5, +∞[. La funzione è pertanto strettamente crescente in ognuno degli intervalli ]−∞, −1[, ]−1, x1 ] e [3, 5] e strettamente decrescente in [x1 , 1[, ]1, 2] e [5, +∞[; i punti x0 e x1 di massimo relativo proprio per f ed i punti corrispondenti del grafico hanno coordinate ( ( √ ) √ √ √ (√ )) √ 2 25 17 + 103 17 + 5 5 − 17 6 √ D ,− , E 5, 4 24 10 17 + 38 (approssimativamente, f (x1 ) ∼ −2, 33, f (x0 ) ∼ 0, 1). I punti 2 e 3 sono inoltre di minimo relativo proprio per f , mentre non esistono punti di mas- Capitolo 9: Calcolo differenziale 268 simo o di minimo assoluto in quanto f non è limitata né superiormente né inferiormente (infatti, è dotata di asintoti verticali sia in alto che in basso). Lo studio del segno della derivata seconda si presenta abbastanza complicato e quindi si passa direttamente a tracciare il grafico della funzione delineato approssimativamente nella Figura 9.7 successiva. y D -1 0 1 A B x CE Figura 9.7: Grafico della funzione. ◃ Come ulteriore esempio, si studia la seguente funzione e se ne traccia approssimativamente il grafico f (x) := log x−2 −1 . x+3 La funzione è definita per (x − 2)/(x + 3) > 0 e quindi nell’insieme Xf :=] − ∞, −3[∪]2, +∞[ . Inoltre essa non è né pari, né dispari, né periodica; è sempre positiva e si annulla per log(x − 2)/(x + 3) = 1, cioè per (x − 2)/(x + 3) = e; tale equazione ammette un’unica soluzione x0 = −(3e + 2)/(e − 1). Quindi vi è un’unica intersezione con l’asse delle ascisse nel punto di coordinate 9.4 Applicazioni allo studio del grafico delle funzioni reali 269 A(−(3e + 2)(e − 1), 0). Non vi sono intersezioni con l’asse delle ordinate in quanto 0 ∈ / Xf . Inoltre f è continua in tutto Xf e, per quanto riguarda gli estremi, si ha lim f (x) = +∞ , lim f (x) = +∞ , x→−3 x→2 lim f (x) = 1 , lim f (x) = 1 ; x→−∞ x→+∞ quindi le rette di equazione x = −3 e x = 2 sono asintoti verticali in alto per f , mentre la retta di equazione y = 1 è un asintoto orizzontale sia a sinistra che a destra per f . La funzione è infinite volte derivabile in Xf r {x0 } e, per ogni x ∈ Xf r {x0 }, si ha f ′ (x) = log x−2 x+3 log x−2 x+3 ( ) log x−2 D log −1 = x+3 −1 log −1 x−2 x+3 x−2 x+3 −1 5 ; (x − 2)(x + 3) −1 il prodotto (x − 2)(x + 3) è sempre positivo in Xf r {x0 } e quindi il segno della derivata prima di f dipende solamente dal fattore log(x−2)/(x+3)−1, che è positivo per (x − 2)/(x + 3) > e; si conclude che f ′ è strettamente positiva in ]x0 , −3[ e strettamente negativa in ] − ∞, x0 [∪]2, +∞[; quindi f è strettamente crescente in [x0 , −3[ e strettamente decrescente in ognuno degli intervalli ] − ∞, x0 ] e ]2, +∞[; il punto x0 è di minimo relativo (anzi assoluto) per il primo criterio sui massimi e minimi relativi (Proposizione 9.4.4) e si ha f (x0 ) = 0. Nel punto x0 la funzione non è derivabile in quanto ′ f− (x0 ) = ′ f+ (x0 ) = lim− f ′ (x) = lim− − x→x0 x→x0 lim+ f ′ (x) = lim+ x→x0 x→x0 5 (e − 1)2 =− , (x − 2)(x + 3) 5e 5 (e − 1)2 = . (x − 2)(x + 3) 5e Infine, per ogni x ∈ Xf r {x0 }, si ha f ′′ (x) = − log 5(2x + 1) 2 2 (x − 2) (x + 3) log x−2 x+3 −1 x−2 x+3 −1 . Dallo studio del segno della derivata seconda, si deduce che f è strettamente convessa in ognuno degli intervalli ]2, +∞[ e [x0 , −3[ mentre è strettamente concava nell’intervallo ] − ∞, x0 ]. Il grafico della funzione viene tracciato approssimativamente nella Figura 9.8 seguente. y A 0 Figura 9.8: Grafico della funzione. x Capitolo 10 Calcolo integrale Nel presente capitolo viene introdotta la teoria generale dell’integrazione su intervalli limitati e successivamente viene anche considerato l’integrale improprio di funzioni non limitate oppure su intervalli non limitati. 10.1 L’integrale secondo Riemann La teoria dell’integrazione secondo Riemann risponde in maniera soddisfacente a criteri di semplicità e naturalezza. Tale integrale sarà sufficiente nelle applicazioni che si ci propone di considerare anche a riguardo delle connessioni con la teoria della misura, concernenti prevalentemente misure di aree, volumi e lunghezza di curve. 10.1.1 Suddivisioni di un intervallo Sono necessarie alcune considerazioni introduttive riguardanti gli intervalli chiusi e limitati. Nel seguito del paragrafo si intenderà fissato un intervallo chiuso e limitato [a, b] con a, b ∈ R, a < b. Se n ≥ 1, si dice che una famiglia finita P = (xi )i=0,...,n di numeri reali è una suddivisione di [a, b] se x0 = a , xn = b , ∀ i = 0, . . . , n − 1 : xi < xi+1 . (10.1.1) L’insieme di tutte le suddivisioni dell’intervallo [a, b] viene denotato per comodità con il simbolo Σ([a, b]). Se P = (xi )i=0,...,n è una suddivisione di [a, b], si denomina ampiezza di P , e la si denota con |P |, il seguente numero reale |P | := max i=1,...,n−1 (xi+1 − xi ) . Capitolo 10: Calcolo integrale 272 ◃ Una prima proprietà utile per il seguito riguarda la possibilità di ottenere suddivisioni di ampiezza arbitrariamente piccola. Infatti, per ogni ε > 0, esiste una suddivisione P di [a, b] tale che |P | ≤ ε. (Infatti, considerato un numero naturale n ≥ 1 tale che n ≥ (b − a)/ε e posto, per ogni i = 0, . . . , n, i xi := a + (b − a) ; n allora la famiglia finita P = (xi )i=0,...,n è una suddivisione di [a, b] e si ha, per ogni i = 0, . . . , n − 1, xi+1 − xi = (b − a)/n ≤ ε, da cui anche |P | ≤ ε. ) Le suddivisioni considerate nella dimostrazione precedente hanno la particolare proprietà che la distanza tra due elementi successivi xi e xi+1 , i = 0, . . . , n − 1, è costante e coincide con l’ampiezza della suddivisione; tali suddivisioni vengono denominate equispaziate. ◃ La possibilità di confrontare due suddivisioni è basata sulla seguente definizione. Se P1 = (xi )i=0,...,n e P2 = (xi )i=0,...,n sono due suddivisioni di [a, b], si dice che P1 è meno fine di P2 (oppure, equivalentemente, che P2 è più fine di P1 ) se l’insieme degli elementi di P1 è contenuto nell’insieme degli elementi di P2 , cioè se ∀ i = 0, . . . , n : ∃ j = 0, . . . , m t.c. xi = yj . Si verifica facilmente che se P1 è meno fine di P2 , allora |P2 | ≤ |P1 |. ◃ Una proprietà importante riguardante la relazione introdotta riguarda il fato che, se P1 = (xi )i=0,...,n e P2 = (xi )i=0,...,n sono due arbitrarie suddivisioni di [a, b], allora esiste sempre un’ulteriore suddivisione P di [a, b] più fine sia di P1 che di P2 . (Infatti, basta riordinare tutti gli elementi delle due suddivisioni per ottenere quelli della suddivisione P . Precisamente, siano X1 l’insieme degli elementi della suddivisione P1 , X2 l’insieme degli elementi della suddivisione P2 e si ponga X := X1 ∪ X2 . L’insieme X è finito; posto p = card(X), si può definire la famiglia finita P = (zi )i=0,...,p ponendo z0 := min X e per ogni i = 1, . . . , p, zi = min(X r {z0 , . . . , zi−1 }); è facile verificare a questo punto che P è una suddivisione di [a, b] e che verifica le condizioni richieste. 10.1.2 ) Integrabilità delle funzioni limitate Si fissa ora una funzione limitata f : [a, b] → R su un intervallo chiuso e limitato [a, b] (a, b ∈ R, a < b). Se P = (xi )i=0,...,n è una suddivisione dell’intervallo [a, b], per ogni i = 0, . . . , n, si possono considerare Mi := sup x∈[xi ,xi+1 ] f (x) , mi := inf x∈[xi ,xi+1 ] f (x) . 10.1 L’integrale secondo Riemann 273 Si denomina somma superiore (rispettivamente, somma inferiore) di f relativa alla suddivisione P , e la si denota con il simbolo S(f, P ) (rispettivamente, s(f, P )), il seguente numero reale S(f, P ) := n−1 ∑ Mi (xi+1 −xi ) (rispettivamente, s(f, P ) := i=0 n−1 ∑ mi (xi+1 −xi ) ). i=0 (10.1.2) Si può fornire facilmente una interpretazione geometrica delle somme superiori ed inferiori tenendo presente che l’addendo i-esimo delle somme in (10.1.2) rappresenta l’area di un rettangolo avente come base xi+1 − xi ed altezza Mi (rispettivamente, mi ). Pertanto, la somma superiore ed inferiore relativa ad una suddivisione rappresenta l’area di un sottoinsieme di R2 costituito da un numero finito di rettangoli, illustrati nella Figura 10.1 successiva. y 0 y x x 0 Figura 10.1: Somma superiore ed inferiore relativa ad una suddivisione. Si indicano ora alcune proprietà importanti delle somme superiori ed inferiori. Proposizione 10.1.1 Valgono le seguenti proprietà: 1. Se P è una suddivisione dell’intervallo [a, b], allora s(f, P ) ≤ S(f, P ). 2. Se P1 e P2 sono suddivisioni dell’intervallo [a, b] e se P1 è meno fine di P2 , allora S(f, P2 ) ≤ S(f, P1 ) , s(f, P1 ) ≤ s(f, P2 ) . 3. Se P1 e P2 sono due arbitrarie suddivisioni dell’intervallo [a, b], allora s(f, P1 ) ≤ S(f, P2 ) . Capitolo 10: Calcolo integrale 274 Dimostrazione. 1) Segue direttamente dalle definizioni adottate. 2) Sia P1 = (xi )i=0,...,n una suddivisione meno fine di un’ulteriore suddivisione P2 = (yi )i=0,...,m . Per ogni i = 0, . . . , n si denoti con j(i) il numero naturale tale che yj(i) = xi . Allora j(i+1)−1 ∑ Mi (xi+1 − xi ) = Mi (yj(i+1) − yj(i) ) ≥ Mj (yj+1 − yj ) , j=j(i) e analogamente ∑ j(i+1)−1 mi (xi+1 − xi ) = mi (yj(i+1) − yj(i) ) ≤ mj (yj+1 − yj ) . j=j(i) Sommando i termini precedenti per i = 0, . . . , n − 1 si ottiene la tesi. 3) Si consideri una suddivisione P di [a, b] più fine sia di P1 che di P2 . Dalla 2) e dalla 1) già dimostrate segue allora s(f, P1 ) ≤ s(f, P ) ≤ S(f, P ) ≤ S(f, P2 ). Dalla Proposizione 10.1.1, 3) precedente segue, per ogni P ∈ Σ([a, b]), s(f, P1 ) ≤ S(f, P ) e quindi il sottoinsieme S(f ) := {S(f, P ) | P ∈ Σ([a, b])} di R costituito da tutte le somme superiori di f è limitato inferiormente; l’estremo inferiore di tale sottoinsieme viene denominato integrale superiore di f in [a, b] e denotato con uno dei simboli ∫ ∫ b f, a b f (x) dx . a Pertanto, l’integrale superiore di f è l’estremo inferiore delle somme superiori di f e soddisfa la seguente condizione, per ogni P1 ∈ Σ([a, b]) ∫ s(f, P1 ) ≤ b f, a cioè l’integrale superiore è un maggiorante di tutte le somme inferiori di f . Pertanto, anche il sottoinsieme s(f ) := {s(f, P ) | P ∈ Σ([a, b])} di R costituito da tutte le somme inferiori di f è limitato superiormente ed il suo estremo superiore viene denominato integrale inferiore di f in [a, b] e denotato con uno dei simboli ∫ b ∫ b f, f (x) dx . a a 10.1 L’integrale secondo Riemann 275 Pertanto, l’integrale inferiore di f è l’estremo superiore delle somme inferiori di f e ricordando che l’integrale superiore è un maggiorante delle somme inferiori, si ottiene la relazione ∫ b ∫ b f≤ f. a a ◃ L’integrale superiore ed inferiore può essere definito per una qualsiasi funzione limitata in [a, b]. In generale, non ci si può aspettare che nella formula precedente valga un’uguaglianza. Ad esempio, si consideri la funzione di Dirichlet d : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1], { 1, x ∈ [0, 1] ∩ Q , d(x) := 0, x ∈ [0, 1] ∩ (R r Q) . Tale funzione è stata già considerata nella (8.1.1) e si è osservato che essa non è continua in alcun punto dell’intervallo [0, 1]. Se P = (xi )i=0,...,n è una suddivisione di [a, b], in ogni intervallo [xi , xi+1 ], i = 0, . . . , n − 1, vi sono sia punti razionali che irrazionali e quindi risulta Mi = 1 e mi = 0; pertanto S(d, P ) = n−1 ∑ (xi+1 − xi ) = 1 , s(d, P ) = 0 ; i=0 dall’arbitrarietà della suddivisione segue S(d) = {1}, s(d) = {0} e quindi anche ∫ b ∫ b d=0, d=1. a a Le considerazioni precedenti giustificano la seguente definizione di funzione integrabile. Definizione 10.1.2 Se f : [a, b] → R è una funzione limitata, si dice che f è integrabile secondo Riemann in [a, b] se l’integrale superiore di f coincide con l’integrale inferiore di f ∫ b ∫ b f= f. a a In tal caso il valore comune dell’integrale superiore ed inferiore di f viene denominato integrale di f esteso all’intervallo [a, b] e si denota con uno dei seguenti simboli ∫ ∫ ∫ b ∫ b f, f (x) dx (= f= f ). [a,b] [a,b] a a Capitolo 10: Calcolo integrale 276 (Talvolta viene anche utilizzata la notazione ∫b a f .) L’insieme delle funzioni f : [a, b] → R integrabili secondo Riemann in [a, b] viene denotato con il simbolo R([a, b]). ◃ Dalla definizione adottata segue subito che se f : [a, b] → R è una funzione costante di costante valore c ∈ R, essa è integrabile secondo Riemann in [a, b] e si ha ∫ c dx = c(b − a) . [a,b] Infatti in questo caso si ha s(f, P ) = S(f, P ) = c(b − a) per ogni P ∈ Σ([a, b]). Tuttavia, in generale la definizione precedente non risulta sufficientemente maneggevole nelle applicazioni al fine di stabilire se una funzione è o meno integrabile secondo Riemann. Per questo motivo, è particolarmente utile avere a disposizione dei criteri di integrabilità di più semplice applicazione. Proposizione 10.1.3 (Primo criterio di integrabilità mediante suddivisioni) Sia f : [a, b] → R una funzione limitata. Allora, le seguenti proposizioni sono equivalenti: a) f è integrabile secondo Riemann in [a, b]. b) ∀ ε > 0 ∃ P1 , P2 ∈ Σ([a, b]) t.c. S(f, P2 ) − s(f, P1 ) < ε. c) ∀ ε > 0 ∃ P ∈ Σ([a, b]) t.c. S(f, P ) − s(f, P ) < ε. Dimostrazione. a)⇒ b) Si supponga che f sia integrabile secondo Riemann in [a, b] e sia ε > 0; dalla definizione di integrale inferiore e dalla seconda proprietà dell’estremo superiore, si può trovare una suddivisione P1 di[a, b] tale che ∫ ε f − < s(f, P1 ) ; 2 [a,b] analogamente, dalla definizione di integrale superiore e dalla seconda proprietà dell’estremo inferiore, si può trovare una suddivisione P2 di [a, b] tale che ∫ ε S(f, P2 ) < f− . 2 [a,b] Allora, S(f, P2 ) − s(f, P1 ) < ε/2 + ε/2 = ε e ciò dimostra la b). b)⇒ c) Si fissi ε > 0; dalla b), si possono trovare P1 , P2 ∈ Σ([a, b]) tali che S(f, P2 ) − s(f, P1 ) < ε. Allora, considerata una suddivisione P di [a, b] più fine sia di P1 che di P2 , si ha S(f, P ) − s(f, P ) ≤ S(f, P2 ) − s(f, P1 ) < ε. ∫ ∫ c)⇒ a) Bisogna dimostrare che ab f = ab f o equivalentemente che, fissato ε > 0, risulta ∫b ∫b a f a < ε; infatti dalla c), si può considerare una suddivisione P di [a, b] tale che 10.1 L’integrale secondo Riemann 277 S(f, P ) − s(f, P ) < ε; allora, dalla prima proprietà dell’estremo inferiore e superiore, ∫b a f∫ ≤ S(f, P ) e analogamente, dalla prima proprietà dell’estremo superiore, segue s(f, P ) ≤ ab f . Pertanto risulta ∫ b ∫ f− a b f ≤ S(f, P ) − s(f, P ) < ε . a Il primo criterio di integrabilità stabilito nella proposizione precedente è sufficiente per stabilire l’integrabilità di diverse classi di funzioni. Si riconosce subito, ad esempio, l’integrabilità delle funzioni monotone e delle funzioni continue. Teorema 10.1.4 (Integrabilità delle funzioni monotone) Se f : [a, b] → R è una funzione monotona, allora f è integrabile secondo Riemann in [a, b]. Dimostrazione. Si osserva innanzitutto che f è limitata; infatti, se f è crescente risulta, per ogni x ∈ [a, b], f (a) ≤ f (x) ≤ f (b) mentre, se f è decrescente si ha, per ogni x ∈ [a, b], f (b) ≤ f (x) ≤ f (a). Si supponga che f sia crescente e si fissi ε > 0. Posto δ = ε/(f (b) − f (a) + 1), si può considerare una suddivisione P = (xi )i=0,...,n di [a, b] tale che |P | ≤ δ. Per ogni i = 0, . . . , n − 1, dalla crescenza di f segue Mi := supx∈[xi ,xi+1 ] f (x) = f (xi+1 ) e mi := inf x∈[xi ,xi+1 ] f (x) = f (xi ) da cui S(f, P ) − s(f, P ) = n−1 ∑ (f (xi+1 ) − f (xi ))(xi+1 − xi ) i=0 ≤ δ n−1 ∑ (f (xi+1 ) − f (xi )) i=0 = δ(−f (x0 ) + f (xn )) = ε (f (b) − f (a)) < ε . f (b) − f (a) + 1 Dalla Proposizione 10.1.3, segue che f è integrabile. Teorema 10.1.5 (Integrabilità delle funzioni continue) Se f : [a, b] → R è una funzione continua, allora f è integrabile secondo Riemann in [a, b]. Dimostrazione. Anche ora conviene osservare subito che f è sicuramente limitata come conseguenza del teorema di Weierstrass (Teorema 8.2.1. Dal teorema sull’uniforme continuità di Cantor (Teorema 8.4.2), f è uniformemente continua e quindi, fissato ε > 0, si può trovare δ > 0 tale che, per ogni x, y ∈ [a, b] verificanti la condizione |x − y| ≤ δ, si abbia |f (x) − f (y)| ≤ ε/(b − a). Si fissi ora una suddivisione P = (xi )i=0,...,n di [a, b] tale che |P | ≤ δ. Per ogni i = 0, . . . , n − 1, dal teorema di Weierstrass applicato alla restrizione di f all’intervallo [xi , xi+1 ], si possono trovare ci , di ∈ [xi , xi+1 ] tali che f (ci ) = maxx∈[xi ,xi+1 ] f (x) =: Mi e f (di ) = Capitolo 10: Calcolo integrale 278 minx∈[xi ,xi+1 ] f (x) =: mi . Poiché |ci − di | ≤ xi+1 − xi ≤ |P | ≤ δ, deve essere anche f (di ) − f (ci ) ≤ ε/(b − a); pertanto, S(f, P ) − s(f, P ) = n−1 ∑ (f (di ) − f (ci ))(xi+1 − xi ) ≤ i=0 = n−1 ε ∑ (xi+1 − xi ) b − a i=0 ε ε (−x0 + xn ) = (b − a) < ε . b−a b−a Dunque è verificata la condizione c) della Proposizione 10.1.3 e pertanto f è integrabile secondo Riemann in [a, b]. 10.1.3 Interpretazione geometrica e proprietà dell’integrale esteso La definizione fornita di integrale definito di una funzione limitata si presta in modo naturale ad essere interpretata come area di una opportuna figura piana. Se X ⊂ R ed f : X → R è una funzione positiva, si denomina trapezoide relativo ad f di base X e lo si denota con T (f ) il seguente sottoinsieme di R2 T (f ) := {(x, y) ∈ R2 | x ∈ X , 0 ≤ y ≤ f (x)} . Sia ora f : [a, b] → R una funzione integrabile secondo Riemann in [a, b]. Si supponga dapprima che f sia positiva. Fissata una suddivisione P di [a,b], si è visto che la somma superiore di f relativa a P rappresenta l’area di un sottoinsieme di R2 , più precisamente di un plurintervallo chiuso1 contenente T (f ), mentre la somma inferiore di f relativa a P rappresenta l’area di un plurintervallo chiuso contenuto in T (f ). Poiché f è integrabile, l’estremo inferiore dei plurintervalli contenenti T (f ) è uguale all’estremo superiore dei plurintervalli contenuti in T (f ) e quindi il valore comune di tali estremi, cioè l’integrale esteso di f , deve necessariamente coincidere con l’area del trapezoide T (f ) relativo ad f . Se f : [a, b] → R è invece negativa, si può applicare quanto sopra alla funzione −f e riconoscere che l’integrale esteso di f ad [a, b] coincide con l’opposto dell’area dell’insieme T (f ) := {(x, y) ∈ R2 | x ∈ [a, b] , f (x) ≤ y ≤ 0}. Infine, se f : [a, b] → R non è né positiva né negativa, si può comunque fornire un’interpretazione geometrica dell’integrale definito di f considerando separatamente gli intervalli in cui la funzione è positiva e quelli in cui è negativa; si stabilisce in questo modo che l’integrale esteso di f ad [a, b] coincide con l’area dell’insieme T+ (f ) := {(x, y) ∈ R2 | x ∈ [a, b] , 0 ≤ y ≤ f (x)} 1 Si denomina intervallo chiuso in Rn ogni insieme del tipo I := [a , b ] × · · · × [a , b ], n n 1 1 cioè prodotto cartesiano di n intervalli chiusi reali. Un plurintervallo chiuso è l’unione di un numero finito di intervalli chiusi. 10.1 L’integrale secondo Riemann 279 alla quale bisogna sottrarre l’area dell’insieme T− (f ) := {(x, y) ∈ R2 | x ∈ [a, b] , f (x) ≤ y ≤ 0}. Si considerano ora alcune proprietà generali degli integrali estesi. Proposizione 10.1.6 Valgono le seguenti proprietà dell’integrale esteso: 1. (Proprietà dei linearità dell’integrale esteso) Siano f : [a, b] → R e g : [a, b] → R funzioni integrabili secondo Riemann in [a, b] e siano α, β ∈ R. Allora la funzione αf + βg è integrabile secondo Riemann in [a, b] e si ha ∫ ∫ ∫ (αf (x) + βg(x)) dx = α f (x) dx + β g(x) dx . [a,b] [a,b] [a,b] 2. (Proprietà di monotonia dell’integrale esteso) Siano f : [a, b] → R e g : [a, b] → R funzioni integrabili secondo Riemann in [a, b] e tali che, per ogni x ∈ [a, b], f (x) ≤ g(x). Allora ∫ ∫ f (x) dx ≤ g(x) dx . [a,b] [a,b] 3. (Proprietà di integrabilità del valore assoluto) Sia f : [a, b] → R una funzione integrabile secondo Riemann in [a, b]. Allora, la funzione |f | è anch’essa integrabile secondo Riemann in [a, b] e si ha ∫ ∫ f (x) dx ≤ [a,b] |f (x)| dx . [a,b] 4. (Proprietà di additività dell’integrale esteso) Sia f : [a, b] → R una funzione integrabile secondo Riemann in [a, b] e sia c ∈]a, b[. Allora, le funzioni f|[a,c] e f|[c,b] sono integrabili secondo Riemann in [a, c] e rispettivamente [c, b] e si ha ∫ ∫ ∫ f (x) dx = f (x) dx + f (x) dx . [a,b] [a,c] [c,b] 5. (Proprietà di monotonia dell’integrale esteso delle funzioni positive rispetto ad intervalli) Sia f : [a, b] → R una funzione positiva e integrabile secondo Riemann in [a, b] e siano c, d ∈ [a, b] tali che c < d. Allora f|[c,d] è integrabile secondo Riemann in [c, d] e si ha ∫ ∫ f (x) dx ≤ f (x) dx . [c,d] [a,b] Capitolo 10: Calcolo integrale 280 6. (Proprietà di invarianza dell’integrale esteso rispetto ad insiemi finiti) Sia f : [a, b] → R una funzione integrabile secondo Riemann in [a, b] e sia g : [a, b] → R una funzione limitata. Se esiste un sottoinsieme finito H di [a, b] tale che f|[a,b]rH = g|[a,b]rH , allora anche g è integrabile secondo Riemann in [a, b] e si ha ∫ ∫ f (x) dx = g(x) dx . [a,b] [a,b] Dimostrazione. Le proprietà enunciate sono tutte basate sulle definizioni e sul criterio di integrabilità mediante suddivisioni. Per brevità, si omettono i dettagli della dimostrazione. Si considerano a questo punto alcune proprietà valide per le funzioni continue. ◃ Un criterio di integrabilità (Teorema di Vitali) può essere enunciato considerando il sottoinsieme H di [a, b] costituito dagli elementi di [a, b] in cui una funzione f : [a, b] → R non è continua. Tale risultato stabilisce che f è integrabile secondo Riemann in [a, b] se e solo se l’insieme H verifica la seguente condizione: Per ogni ε > 0 esiste una successione ([an , bn ])n∈N di intervalli contenuti in [a, b] tali che H⊂ ∪ [an , bn ] , n∈N +∞ ∑ (bn − an ) < ε . . n=0 Tale condizione esprime il fatto che l’insieme H ha misura nulla secondo una teoria della misura denominata di Lebesgue. Per brevità, si rinuncia alla dimostrazione di tale risultato. ◃ Si riconosce facilmente, invece, che l’unica funzione continua e positiva avente integrale uguale a 0 è la funzione nulla. Precisamente, se f : [a, b] → R è una ∫ funzione continua e positiva e se esiste x0 ∈ [a, b] tale che f (x0 ) > 0, allora [a,b] f > 0. (Infatti f è continua in x0 e quindi, dalla proprietà di permanenza del segno, esistono r > 0 e δ > 0 tali che, per ogni x ∈ [a, b] ∩ [x0 − δ, x0 + δ], f (x) ≥ r. Allora, posto c := max{x0 − δ, a} e d := min{x0 + δ, b}, si ha ∫ ∫ ∫ f (x) dx ≥ f (x) dx ≥ r dx ≥ r(d − c) > 0 . ) [a,b] [c,d] [a,b] Si enuncia infine un ulteriore risultato importante per le funzioni continue. 10.1 L’integrale secondo Riemann 281 Teorema 10.1.7 (Teorema della media integrale) Sia f : [a, b] → R una funzione continua. Allora esiste x0 ∈]a, b[ tale che ∫ f (x) dx = f (x0 )(b − a) . [a,b] Dimostrazione. Poiché f è continua, dal Teorema 8.2.1 di Weierstrass, essa è dotata di massimo e di minimo e quindi esistono c, d ∈ [a, b] tali che, per ogni x ∈ [a, b], f (c) ≤ f (x) ≤ f (d). Dalla proprietà di monotonia dell’integrale definito segue allora ∫ ∫ ∫ f (c)(b − a) = f (c) dx ≤ f (x) dx ≤ f (d) dx = f (d)(b − a) [a,b] [a,b] e pertanto f (c) ≤ ∫ 1 b−a [a,b] ∫ f (x) dx ≤ f (d) . [a,b] Allora il numero reale [a,b] f (x) dx/(b − a) è compreso tra il minimo ed il massimo di f e quindi ∫dal teorema di Bolzano (Corollario 8.2.3), segue l’esistenza di x0 ∈ [a, b] per cui f (x0 ) = [a,b] f (x) dx/(b − a). Infine, il punto x0 può essere considerato in ]a, b[. Infatti, se il teorema fosse valido solamente per x0 = a o per x0 = b, la funzione essendo continua dovrebbe assumere valori sempre strettamente maggiori oppure sempre strettamente minori di f (x0 ) in ]a, b[. Nel primo caso, f (x0 ) sarebbe il minimo di f ; si consideri x1 ∈]a, b[ tale che f (x1 ) > f (x0 ) e si fissi r ∈ R tale che f (x0 ) < r < f (x1 ); dalla continuità di f ed essendo [r, +∞[ un intorno di f (x1 ), si può trovare un intervallo ]x1 − δ, x1 + δ[⊂]a, b[ tale che f (x) ≥ r per ogni x ∈]x1 − δ, x1 + δ[; allora ∫ ∫ ∫ ∫ f f+ f+ f = [a,x1 −δ] [a,b] [x1 −δ,x1 +δ] [x1 +δ,b] ≥ f (x0 )(x1 − δ − a) + r(x1 + δ − (x1 − δ)) + f (x0 )(b − x1 − δ) ≥ f (x0 )(x1 − δ − a) + 2rδ + f (x0 )(b − x1 − δ) = f (x0 )(b − a) + 2(r − f (x0 ))δ > f (x0 )(b − a) , e quindi non potrebbe valere l’uguaglianza prevista nella tesi. Allo stesso risultato si perviene in maniera analoga se f assume sempre valori strettamente minori di f (x0 ) in ]a, b[. Pertanto la tesi è completamente dimostrata. Geometricamente, il Teorema 10.1.7 esprime il fatto che l’area del trapezoide relativo ad una funzione continua e positiva è equivalente all’area di un rettangolo avente come base l’intervallo [a, b] ed altezza l’intervallo [0, f (x0 )] per un opportuno elemento x0 di ]a, b[ (vedasi la Figura 10.2 successiva). 10.1.4 Primitive ed integrale indefinito Uno degli strumenti più efficaci per il calcolo dell’integrale definito di una funzione viene fornito dalle primitive di una funzione, di cui ci si occupa nel presente paragrafo. Capitolo 10: Calcolo integrale 282 y 0 x0 x Figura 10.2: Teorema della media integrale. Definizione 10.1.8 Siano X un sottoinsieme di R ed f : X → R una funzione reale. Si dice che una funzione F : X → R è una primitiva (oppure antiderivata) di f se F è derivabile e, per ogni x ∈ X, F ′ (x) = f (x) . Inoltre, l’insieme di tutte le primitive di f viene denominato integrale indefinito di f e denotato con uno dei seguenti simboli ∫ ∫ f, f (x) dx . ◃ Valgono le seguenti proprietà delle primitive: 1. Siano X è un sottoinsieme di R, f : X → R una funzione reale ed F : X → R una primitiva di f. Allora, per ogni c ∈ R, anche la funzione F + c è una primitiva di f . Dimostrazione. Infatti F + c è derivabile e, per ogni x ∈ X, (F + c)′ (x) = F ′ (x) + 0 = f (x). 2. Viceversa, se la funzione f è definita in un intervallo, due qualsiasi primitive di f differiscono sempre per una costante. Precisamente, 10.1 L’integrale secondo Riemann 283 siano I un intervallo di R, f : I → R una funzione reale ed F : I → R e F : I → R due primitive di f . Allora esiste c ∈ R tale che G = F +c. Dimostrazione. La funzione G − F è derivabile in quanto differenza di funzioni derivabili e, per ogni x ∈ I, si ha (G − F )′ (x) = G′ (x) − F ′ (x) = f (x) − f (x) = 0. Poiché I è un intervallo, G − F è costante e quindi esiste c ∈ R tale che G − F = c, da cui la tesi. ◃ Il risultato precedente non vale se f non è definita in un intervallo. Ad esempio, è facile constatare che la funzione log |x| è una primitiva della funzione f (x) := 1/x, x ∈ R r {0}, ma tutte le primitive di f non si ottengono aggiungendo una costante arbitraria a tale funzione, bensı̀ sono del tipo { log |x| + c1 , x<0, F (x) := log |x| + c2 , x>0, con c1 , c2 ∈ R. In generale, per ottenere tutte le primitive e quindi l’integrale indefinito, bisogna aggiungere una costante arbitraria per ognuno degli intervalli (massimali) in cui la funzione è definita. Ritornando al caso delle funzioni f : I → R definite in un intervallo I, da quanto osservato segue che, se è nota una primitiva F di f , tutte le primitive di f si ottengono considerando le funzioni F + c, con c ∈ R e pertanto ∫ f = {F + c | c ∈ R} ; più frequentemente si usa scrivere per convenzione ∫ f = F (x) + c , c∈R; in quanto in generale i procedimenti applicati per il calcolo degli integrali indefiniti conducono direttamente all’espressione F (x) della primitiva in un generico elemento x in cui questa è definita. In particolare, se f : I → R è derivabile e se f ′ è continua, risulta ∫ f ′ (x) dx = f (x) + c , c∈R. ◃ Si approfondisce ora lo studio delle proprietà degli integrali indefiniti di una funzione continua. Si può dimostrare che tali funzioni sono sempre dotate di primitive e inoltre vale un importante legame tra l’integrale esteso ad un intervallo [a, b] e la differenza dei valori che una primitiva assume negli estremi b ed a. Capitolo 10: Calcolo integrale 284 Per enunciare tali proprietà è necessario assumere alcune convenzioni riguardanti le funzioni continue su un intervallo arbitrario di R. Sia pertanto I un intervallo di R e si consideri una funzione continua f : I → R. Se a, b ∈ I e a < b, la restrizione f[a,b] di f all’intervallo [a, b] è sicuramente integrabile in [a, b] (Teorema 10.1.5) e quindi ha senso ∫ considerare [a,b] f . Si definisce ora l’integrale definito di f nel modo seguente, per ogni a, b ∈ I, ∫ f, a<b; ∫ b [a,b] 0, a=b; f (x) dx := (10.1.3) ∫ a f, a>b. [b,a] Naturalmente, le proprietà viste in generale per gli integrali estesi ad un intervallo [a, b] si estendono facilmente agli integrali definiti utilizzando la definizione precedente e pertanto, per brevità, vengono omesse. Anche il teorema della media integrale può essere rienunciato come segue considerando gli integrali definiti. Teorema 10.1.9 (Teorema della media integrale per gli integrali definiti) Sia f : I → R una funzione continua in un intervallo I. Allora, per ogni a, b ∈ I, esiste x0 ∈ I(a, b) tale che ∫ b f (x) dx = f (x0 )(b − a) . a ◃ Si studia ora l’esistenza delle primitive per le funzioni continue. Se f : I → R è una funzione continua e se a ∈ I, dalla (10.1.3) si può considerare la funzione Fa : I → R definita ponendo, per ogni x ∈ I, ∫ x Fa (x) = f (t) dt . (10.1.4) a La funzione Fa viene denominata funzione integrale di f di punto iniziale a; nel risultato successivo si riconosce che Fa è una primitiva della funzione f. Teorema 10.1.10 (Teorema fondamentale del calcolo integrale (teorema di Torricelli)) Siano I un intervallo di R ed f : I → R una funzione continua. Allora, per ogni a ∈ I, la funzione Fa : I → R definita dalla (10.1.4) è una primitiva di f . 10.1 L’integrale secondo Riemann 285 Dimostrazione. Bisogna dimostrare che, per ogni x0 ∈ I, Fa è derivabile in x0 e F ′ (x0 ) = f (x0 ), cioè che Fa (x) − Fa (x0 ) lim = f (x0 ) . x→x0 x − x0 Si fissi pertanto x0 ∈ I e sia ε > 0. Poiché f è continua in x0 , si può considerare δ > 0 tale che, per ogni x ∈ I∩]x0 − δ, x0 + δ[, si abbia f (x0 ) − ε < f (x) < f (x0 ) + ε. Si fissi ora x ∈ I∩]x0 − δ, x0 + δ[r{x0 }; dal Teorema 10.1.7 della media, esiste un elemento ξ ∈ I(x0 , x) tale che ∫ x f (t) dt = f (ξ)(x0 − x) . x0 Poiché ∫ Fa (x) − Fa (x0 ) = x ∫ f (t) dt − a ∫ x0 x f (t) dt = a f (t) dt = f (ξ)(x0 − x) x0 si ottiene Fa (x) − Fa (x0 ) = f (ξ) . x − x0 Inoltre ξ ∈ I∩]x0 − δ, x0 + δ[, e quindi f (x0 ) − ε < f (ξ) < f (x0 ) + ε. Si è cosı̀ dimostrato che, per ogni x ∈ I∩]x0 − δ, x0 + δ[, Fa (x) − Fa (x0 ) < f (x0 ) + ε , x − x0 e ciò, essendo ε > 0 arbitrario, dimostra la tesi. f (x0 ) − ε < Dunque l’insieme delle primitive di una funzione continua è sempre non vuoto. Il risultato successivo mette in relazione le primitive di una funzione continua con il calcolo degli integrali definiti. Teorema 10.1.11 (Formula fondamentale del calcolo integrale) Siano I un intervallo di R, f : I → R una funzione continua e G : I → R una primitiva di f . Allora, per ogni a, b ∈ I, ∫ b f (x) dx = G(b) − G(a) . (10.1.5) a Dimostrazione. Siano a, b ∈ I e si consideri la funzione integrale Fa : I → R di f di punto iniziale a. Dal Teorema 10.1.10, anche Fa è una primitiva di f e quindi, dalle proprietà generali delle primitive, deve esistere c ∈ R tale che G = Fa +c. Dunque G(b) = ∫ ∫ Fa (b) + c = ab +c e G(a) = Fa (a) + c = c e pertanto si conclude che G(b) − G(a) = ab f . Per comodità, il secondo membro della (10.1.5) viene spesso denotato con uno dei seguenti simboli [G(x)]ba , G(x) b a ; ciò è dovuto essenzialmente al fatto che nel calcolo esplicito delle primitive di una funzione si perviene solitamente al valore che essa assume in un generico elemento x in cui è definita. Capitolo 10: Calcolo integrale 286 10.1.5 Integrali indefiniti immediati Il legame espresso dalla formula fondamentale del calcolo integrale sposta il problema del calcolo dell’integrale definito di una funzione continua a quello della ricerca di una primitiva di tale funzione. Per questo motivo nel seguito ci si occuperà in modo più dettagliato dei metodi per il calcolo degli integrali indefiniti; si cominciano ad esaminare dapprima alcuni integrali indefiniti immediati che seguono direttamente dalle derivate delle funzioni elementari e successivamente di alcune regole di integrazione. Dalle derivate delle funzioni elementari, è immediato verificare gli integrali indefiniti considerati di seguito. 1. Per ogni a ∈ R, a ̸= −1, risulta ∫ xa+1 xa dx = +c, a+1 c∈R in ogni intervallo I in cui la funzione xa è definita e precisamente, I = R se a ∈ N, I =]0, +∞[ oppure I =] − ∞, 0[ se a ∈ Z r N, I = [0, +∞[ se a ∈]0, +∞[rN e infine I =]0, +∞[ se a ∈] − ∞, 0[rZ. ∫ 2. Si ha 1 dx = log |x| + c , x c∈R, in ognuno degli intervalli [0, +∞[ oppure ] − ∞, 0]. 3. Per ogni a ∈]0, +∞[r{1}, risulta ∫ ax ax dx = +c, log a 4. Si ha ∫ sin x dx = − cos x + c , 5. Si ha ∫ c∈R, x∈R. ∫ cos x dx = sin x + c , 1 dx = tan x + c , cos2 x c∈R, x∈R. c∈R, in ognuno degli intervalli ] − π/2 + kπ, π/2 + kπ[, k ∈ Z e ∫ 1 dx = − cot x + c , c∈R, sin2 x in ognuno degli intervalli ]kπ, π + kπ[, k ∈ Z. 10.1 L’integrale secondo Riemann 287 6. Si ha ∫ 1 √ dx = arcsin x+c = − arccos x+c , 1 − x2 7. Si ha ∫ 1 dx = arctan x + c = −arccot x + c , 1 + x2 c ∈ R , x ∈]−1, 1[ . c∈R, x∈R. Se f : I → R è una funzione derivabile in un intervallo I, le formule precedenti possono essere generalizzate componendo la funzione f con una delle funzioni elementari sopra considerate. Per brevità non vengono ripetuti tutti i casi precedenti ma si riportano solamente alcuni esempi, anche in previsione del fatto che l’applicazione della successiva regola di sostituzione consentirà di ottenere risultati più generali. ∫ 1. Si ha f ′ (x) dx = log |f (x)| + c , f (x) c∈R, purché f (x) > 0 per ogni x ∈ I oppure f (x) < 0 per ogni x ∈ I. 2. Per ogni a ∈]0, +∞[r{1}, risulta ∫ 3. Si ha 4. Si ha ∫ af (x) f ′ (x) dx = af (x) +c, log a c∈R, x∈I. sin f (x) f ′ (x) dx = − cos f (x) + c , ∫ 1 f ′ (x) dx = tan f (x) + c , f (x) cos2 c∈R, x∈I. c∈R, purché esista k ∈ Z tale che −π/2 + kπ < f (x) < π/2 + kπ per ogni x ∈ I. Le precisazioni effettuate di volta in volta sulla validità delle formule precedenti sono indispensabili per il calcolo degli integrali definiti mediante la formula fondamentale del calcolo integrale. Il calcolo degli integrali indefiniti può invece essere esteso a funzioni definite nell’unione di più intervalli considerando una costante arbitraria in ognuno di essi. Capitolo 10: Calcolo integrale 288 10.1.6 Prime regole di integrazione Per estendere il calcolo degli integrali indefiniti, è necessario ricorrere ad opportune regole di integrazione di seguito esposte. Una prima regola di integrazione può essere ricavata direttamente dalla proprietà di linearità dell’integrale definito (Proposizione 10.1.6, 1.); tale regola può essere enunciata ovviamente anche per gli integrali indefiniti e si enuncia come segue Se f, g : I → R sono funzioni continue ed α, β ∈ R, allora ∫ ∫ ∫ (αf (x) + βg(x)) dx = α f (x) dx + β g(x) dx .2 Si considerano ora due ulteriori regole di integrazione di frequente applicazione. Proposizione 10.1.12 (Regola di integrazione per sostituzione) 1. (Formula di cambiamento di variabile per gli integrali definiti). Sia φ : [a, b] → R una funzione derivabile con derivata continua e sia f : I → R una funzione continua in un intervallo I tale che φ([a, b]) ⊂ I. Allora ∫ ∫ b φ(b) f (φ(x)) φ′ (x) dx = f (t) dt . a φ(a) 2. Siano I e J intervalli di R, φ : J → R una funzione derivabile con derivata continua ed f : I → R una funzione continua tale che φ(J) ⊂ I. Se F : I → R è una primitiva di f , allora ∫ f (φ(x)) φ′ (x) dx = F (φ(x)) + c , c∈R. Dimostrazione. Si osserva innanzitutto che la funzione (f ◦ φ) · φ′ è continua e quindi è integrabile per il Teorema 10.1.5. Si considerino ora le funzioni F : [a, b] → R e G : [a, b] → R definite ponendo, per ogni y ∈ [a, b], ∫ y ∫ y F (y) := f (t) dt , G(y) := f (φ(x)) φ′ (x) dx . φ(a) 2 Ricordando a che l’integrale indefinito è un insieme di funzioni, si precisa che il prodotto α · A di uno scalare per un sottoinsieme è da intendersi come α · A := {αa | a ∈ A}; inoltre la somma di due insiemi che è da intendersi al modo seguente: A + B := {a + b | a ∈ A , b ∈ B}. Quindi, nel caso in esame, il secondo membro significa { } ∫ ∫ ∫ ∫ α f (x) dx + β g(x) dx = αF + βG | F ∈ f (x) dx , G ∈ g(x) dx . 10.1 L’integrale secondo Riemann 289 Dal teorema fondamentale del calcolo integrale (Teorema 10.1.10), la funzione F è una primitiva di f e la funzione G è una primitiva di (f ◦ φ) · φ′ . Poiché, per ogni t ∈ [a, b], risulta anche (F ◦ φ)′ (t) = F ′ (φ(t)) φ′ (t) = f (φ(t))φ′ (t), le funzioni G ed F ◦ φ devono differire per una costante; essendo, poi, G(a) = 0 e F (φ(a)) = 0, tale costante deve essere nulla e si ottiene G = F ◦ φ; in particolare G(b) = F (φ(b)) da cui la tesi. 2) Basta osservare che F ◦ φ è una primitiva di (f ◦ φ) · φ′ . Nelle applicazioni concrete è come se si effettuasse materialmente la sostituzione t = φ(x) e si sostituisse il differenziale φ′ (x) dx con dt (spesso si scrive dφ(x) anziché φ′ (x)dx). L’uguaglianza φ′ (x) dx = dt si ottiene formalmente derivando entrambi i membri dell’uguaglianza t = φ(x) rispetto alla variabile t a primo membro ed alla variabile x a secondo membro. Tali osservazioni giustificano la denominazione attribuita alla Proposizione 10.1.12. Nelle applicazioni riguardanti il calcolo degli integrali definiti, si può scegliere se determinare dapprima una primitiva della funzione da integrare e quindi applicare la formula fondamentale del calcolo integrale oppure se applicare direttamente la parte 1) della Proposizione 10.1.12 cambiando anche gli estremi di integrazione nell’integrale assegnato. Proposizione 10.1.13 (Regola di integrazione per parti) Siano I un intervallo di R, f : I → R una funzione continua e g : I → R una funzione derivabile con derivata continua. Se F : I → R è una primitiva di f , si ha ∫ ∫ f (x) g(x) dx = F (x) g(x) − F (x) g ′ (x) dx . e conseguentemente, per ogni a, b ∈ I, ∫ b ∫ [ ]b f (x) g(x) dx = F (x) g(x) a − a b F (x) g ′ (x) dx . a Dimostrazione. Dalla regola di derivazione del prodotto di due funzioni risulta (F · g)′ = F ′ · g + F · g ′ = f · g + F · g ′ e quindi f · g = (F · g)′ − F · g ′ ; poiché le funzioni f · g e (F · g)′ − F · g ′ sono definite nell’intervallo I, le primitive di f · g coincidono con le primitive di (F · g)′ − F · g ′ ; ma F · g è una primitiva di (F · g)′ e pertanto le primitive di (F · g)′ − F · g ′ sono date dalla differenza di F · g e le primitive di F · g ′ e da ciò deriva la tesi. L’ultima parte segue direttamente da quanto dimostrato. ◃ Ad esempio, si vuole calcolare il seguente integrale definito ∫ e log x dx . 1 Si determina dapprima l’integrale indefinito. Dalla regola di integrazione per parti, si ha ∫ ∫ ∫ log x dx = 1 · log x dx = x log x − x D(log x) dx = x log x − x + c , Capitolo 10: Calcolo integrale 290 con c ∈ R. Allora, scegliendo la primitiva con c = 0, dalla formula fondamentale del calcolo integrale (Teorema 10.1.11) l’integrale definito assegnato è dato da ∫ e [ ]e log x dx = x log x − x 1 = e − e − (−1) = 1 . 1 ◃ L’integrale seguente viene calcolato in maniera analoga ∫ ∫ arctan x dx = 1 · arctan x dx ∫ x dx = x arctan x − 1 + x2 1 = x arctan x − log(1 + x2 ) + c , 2 con c ∈ R.∫ Nell’ultima uguaglianza si è utilizzato l’integrale indefinito f ′ (x) immediato dx = log |f (x)| + c. f (x) ◃ Si consideri ora l’integrale indefinito ∫ sin x cos x dx . sin4 x + cos4 x In ogni intervallo ] − π/2 + kπ, π/2 + kπ[ con k ∈ Z, si può scrivere ∫ ∫ ∫ sin x cos x dx sin x cos x dx tan x dx ( ) = = 4 4 4 2 4 cos x(1 + tan x) cos x 1 + (tan2 x)2 sin x + cos x e quindi, posto t = tan2 x, da cui dt = 2 tan x dx/ cos2 x, si ottiene ∫ ∫ sin x cos x 1 1 1 1 dx = dt = arctan t + c = arctan tan2 x + c 2 1 + t2 2 2 sin4 x + cos4 x con c ∈ R. Anche se la funzione assegnata è definita in tutto R, in questo caso è stato possibile determinare un primitiva solamente in ogni intervallo ] − π/2 + kπ, π/2 + kπ[ con k ∈ Z. 10.2 Integrazione delle funzioni razionali Una classe abbastanza ampia di funzioni per le quali è possibile stabilire un metodo generale per il calcolo dell’integrale indefinito è costituita dalle 10.2 Integrazione delle funzioni razionali 291 funzioni razionali, cioè delle funzioni rapporto di due polinomi. Nella presente sezione si espone sinteticamente il metodo generale per il calcolo di un integrale della forma ∫ P (x) dx , Q(x) dove, per ogni x ∈ R, P (x) = a0 + a1 x + · · · + an xn , Q(x) = b0 + b1 x + · · · + bm xm , a0 , . . . , an ∈ R , an ̸= 0 , b 0 , . . . , b m ∈ R , bm = ̸ 0, e si suppone n < m in quanto ci si può sempre ricondurre a questo caso effettuando la divisione dei polinomi P e Q. 10.2.1 Caso m = 1 In questo caso Q(x) = ax + b con a ̸= 0 e si ottiene l’integrale ∫ 1 dx = log |ax + b| + C , C∈R, ax + b in ognuno degli intervalli ] − ∞, −b/a[ e ] − b/a, +∞[. 10.2.2 Caso m = 2 In questo caso Q(x) = ax2 + bx + c con a ̸= 0 e P può essere di grado 0 oppure 1. Si considera innanzitutto il seguente tipo di integrale ∫ 1 dx . ax2 + bx + c Posto ∆ = b2 − 4ac, si procede come segue: • Caso ∆ > 0. Denotate con x1 e x2 le due soluzioni reali distinte e tali che x1 < x2 dell’equazione ax2 +bx+c = 0 e imponendo l’uguaglianza ax2 1 A B dx = + + bx + c x − x1 x − x2 si determinano le costanti A e B e quindi l’integrale diventa ∫ 1 dx = A log |x − x1 | + B log |x − x2 | + C , ax2 + bx + c dove la costante arbitraria C dipende da ognuno degli intervalli ] − ∞, x1 [, ]x1 , x2 [ e ]x2 , +∞[. Capitolo 10: Calcolo integrale 292 • Caso ∆ = 0. Denotata con x0 l’unica soluzione reale dell’equazione ax2 + bx + c = 0, si ha ax2 + bx + c = a(x − x0 )2 e quindi ∫ ∫ 1 1 1 dx = dx = − +C , 2 2 ax + bx + c a(x − x0 ) a(x − x0 ) dove la costante arbitraria C dipende da ognuno degli intervalli ] − ∞, x0 [ e ]x0 , +∞[. • Caso ∆ < 0. Con semplici manipolazioni algebriche si scrive ax2 2 1 2a =√ ( ) + bx + c −∆ 2ax + b 2 √ +1 −∆ e quindi ∫ 2ax + b 1 2 arctan √ +C , dx = √ ax2 + bx + c −∆ −∆ con C costante arbitraria in tutto R. Si considera ora il caso in cui P (x) = mx + n, con m ̸= 0, ha grado 1. In questo caso si ottiene ( )∫ ∫ ∫ mx + n m 2ax + b mb 1 dx = dx + n − dx ax2 + bx + c 2a ax2 + bx + c 2a ax2 + bx + c ( )∫ m mb 1 = log |ax2 + bx + c| + n − dx 2a 2a ax2 + bx + c e l’ultimo integrale viene risolto come nel caso precedente. 10.2.3 Caso m > 2 Il polinomio Q può essere decomposto nella seguente forma (vedasi la (3.5.7)) Q(x) = bm (x − x1 )h1 · · · (x − xp )hp (x2 + b1 x + c1 )k1 · · · (x2 + bq x + cq )kq , dove x1 , . . . , xp sono le radici reali di Q aventi rispettivamente molteplicità h1 , . . . , hp , e k1 , . . . , kq sono le molteplicità delle radici complesse coniugate dei termini x2 + b1 x + c1 , . . . , x2 + bq x + cq con ∆1 = b21 − 4c1 < 0, . . . , ∆q = b2q − 4cq < 0. Poiché la somma di tutte le molteplicità deve essere m, si deve avere h1 + · · · + hp + 2(k1 + · · · + kq ) = m . 10.2 Integrazione delle funzioni razionali 293 Il rapporto P (x)/Q(x) viene decomposto facendo corrispondere ad ogni fattore x − xr un addendo della forma Ar x − xr con Ar costante da determinare e ad ogni fattore x2 + bs x + cs = 0 un addendo della forma Bs x + Cs x2 + bs x + cs con Bs e Cs costanti da determinare; infine si tiene conto della molteplicità considerando un addendo ulteriore della forma M (x) = d Γ(x) , dx R(x) dove al denominatore figurano tutti i fattori con molteplicità diminuita di una unità (quindi non figurano i fattori con molteplicità 1): R(x) = (x−x1 )h1 −1 · · · (x−xp )hp −1 (x2 +b1 x+c1 )k1 −1 · · · (x2 +bq x+cq )kq −1 e al numeratore il polinomio Γ ha grado uguale a quello del denominatore diminuito di una unità Γ(x) = γ0 + γ1 x + · · · + γt xt con t = (h1 − 1) + · · · + (hp − 1) + 2(k1 − 1) + · · · + 2(kq − 1) − 1 e le costanti γ1 , . . . , γt sono da determinare. Tutte le costanti vengono determinate imponendo nella uguaglianza P (x) A1 Ap B1 x + C1 Bq x + Cq = +· · ·+ + 2 +· · ·+ 2 + M (x) Q(x) x − x1 x − xp x + b1 x + c1 x + bq x + cq che i coefficienti dello stesso grado coincidano e in questo modo si ottiene un sistema lineare di p + 2q + t + 1 equazioni in p + 2q + t + 1 incognite il cui determinante dei coefficienti è diverso da 0. Pertanto l’integrale diventa ∫ P (x) dx =A1 log |x − x1 | + · · · + Ap log |x − xp | Q(x) ∫ ∫ Γ(x) B1 x + C1 Bq x + Cq + dx + · · · + dx + 2 2 x + b1 x + c1 x + bq x + cq R(x) dove tutti gli integrali da calcolare rientrano nei casi già discussi. Capitolo 10: Calcolo integrale 294 10.3 Integrali impropri La definizione di funzione integrabile secondo Riemann è stata data inizialmente per funzioni limitate e definite in un intervallo chiuso e limitato. Si vuole ora estendere tale definizione anche al caso di funzioni non limitate oppure definite in un insieme non limitato; in tal caso si parlerà di integrali in senso improprio (oppure anche in senso generalizzato). 10.3.1 Integrali impropri di funzioni non limitate Si considera innanzitutto il caso di funzioni non necessariamente limitate definite però su un intervallo chiuso e limitato. Nel seguito, si intende fissato un intervallo [a, b] con a, b ∈ R, a < b e si prendono in esame le funzioni che soddisfano la condizione seguente. Definizione 10.3.1 Una funzione reale f : [a, b] → R si dice generalmente continua se ammette al più un numero finito di punti di discontinuità. Poiché l’integrale definito di una funzione è invariante rispetto ad insiemi finiti, non è importante per i nostri fini il valore che una funzione generalmente continua assume nei punti di discontinuità; in tali punti, anzi, la funzione potrebbe anche non essere definita. Precisamente, se H è un sottoinsieme finito di [a, b] e se f : [a, b] r H → R è continua, essa può essere considerata come funzione generalmente continua in [a, b] identificandola con una qualsiasi funzione definita anche in H e che coincide con f in [a, b] r H. Ad esempio, la funzione f (x) = 1/ log x è una funzione generalmente continua nell’intervallo [0, 1], in quanto attribuendole un valore arbitrario nei punti 0 e 1, tali punti risultano gli unici suoi punti di discontinuità in [0, 1]. Per estendere la definizione di integrale definito a tali funzioni, si considera innanzitutto il caso in cui f : [a, b] → R abbia un unico punto di discontinuità in uno degli estremi. Definizione 10.3.2 Sia f : [a, b] → R una funzione generalmente continua e si supponga che a (rispettivamente, b) sia l’unico punto di discontinuità di f . Se esiste il seguente limite ∫ b−ε ∫ b f (x) dx ), (10.3.1) lim+ f (x) dx , (rispettivamente, lim+ ε→0 ε→0 a+ε a esso viene denominato integrale improprio di f e denotato con il simbolo ∫ b f (x) dx . a 10.3 Integrali impropri 295 Si osservi che f è integrabile in [a + ε, b] (rispettivamente, in [a, b − ε]) in quanto continua in tale intervallo. Inoltre, se il limite (10.3.1) è un numero reale si dice anche che l’integrale improprio di f in [a, b] è convergente oppure che f è integrabile in senso improprio in [a, b]; se il limite (10.3.1) è infinito, si dice che l’integrale improprio di f in [a, b] è divergente. Se f : [a, b] → R è continua in [a, b] r {x0 }, con x0 ∈]a, b[, l’integrale improprio può essere definito applicando la Definizione 10.3.2 separatamente alle restrizioni f|[a,x0 ] e f|[x0 ,b] . Si richiede quindi che esistano entrambi i limiti ∫ x0 −ε ∫ b lim+ f (x) dx , lim+ f (x) dx . (10.3.2) ε→0 ε→0 a x0 +ε Se tali limiti sono finiti, si dice che la funzione è integrabile in senso improprio in [a, b] oppure che l’integrale improprio di f è convergente; se uno dei due limiti è finito e l’altro è uguale a +∞ (rispettivamente, a −∞) oppure se i due limiti sono entrambi uguali a +∞ (rispettivamente, uguali a −∞), si dice che l’integrale improprio di f è divergente positivamente (rispettivamente, negativamente). Se f è integrabile in senso improprio in [a, b], dal primo teorema sul limite della somma di due funzioni (Teorema 6.5.1), il valore dell’integrale può essere calcolato considerando il limite ∫ (∫ b f (x) dx = lim a ) b f (x) dx + ε→0+ a ∫ x0 −ε f (x) dx . (10.3.3) x0 +ε Tuttavia, l’integrabilità in senso improprio di f non può essere dedotta dal fatto che l’ultimo limite sia finito; infatti, tale limite può essere finito anche se i due limiti (10.3.1) sono uno divergente positivamente e l’altro negativamente; in tal caso, il limite (10.3.3) viene comunque denominato valore principale dell’integrale improprio di f e denotato con uno dei simboli ∫ ∫ b (v.p.) f (x) dx , a b ∗ f (x) dx . a ◃ Ad esempio, si consideri la funzione generalmente continua 1/x nell’intervallo [−1, 1]; si ha ∫ lim+ ε→0 ε 1 1 1 dx = lim+ [log x]ε = lim+ − log ε = +∞ , x ε→0 ε→0 Capitolo 10: Calcolo integrale 296 e quindi tale funzione non può essere integrabile in senso improprio in [−1, 1]; risulta inoltre (∫ lim+ ε→0 −ε −1 e quindi (v.p.) 1 dx + x ∫1 1 −1 x ∫ 1 ε 1 dx x ) ) ( 1 −ε = lim+ [log −x]−1 + [log x]ε = 0 ε→0 dx = 0. ◃ Se f : [a, b] → R è una funzione generalmente continua discontinua in n punti x1 , . . . xn ∈ [a, b], l’integrabilità in senso improprio di f viene definita applicando quanto sopra separatamente a ciascuno dei punti x1 , . . . xn ; precisamente, si consideri una suddivisione y0 , . . . , yn di [a, b] in n intervalli tali che ogni xi appartenga solamente all’intervallo [yi−1 , yi ], i = 1, . . . , n, allora si dice che f è integrabile in senso improprio in [a, b] oppure che l’integrale improprio di f è convergente se, per ogni i = 1, . . . , n, la restrizione di f all’intervallo [yi−1 , yi ] (che presenta un solo punto di discontinuità) è integrabile in senso improprio in [yi−1 , yi ], cioè esistono e sono finiti i limiti ∫ lim ε→0+ ∫ xi −ε f (x) dx , yi−1 yi lim ε→0+ f (x) dx xi +ε (ovviamente, il primo limite non va considerato se xi = a e il secondo se xi = b). Se qualcuno dei limiti precedenti è divergente positivamente (rispettivamente, negativamente) ed i rimanenti sono convergenti, si dice che l’integrale improprio di f è divergente positivamente (rispettivamente, negativamente). ◃ In base alle definizioni assunte, si può studiare l’integrabilità in senso improprio nel caso di un unico punto di discontinuità; i criteri ottenuti vanno poi applicati separatamente a ciascun punto di discontinuità di f (affinché f sia integrabile in senso improprio è necessario che lo sia rispetto a ciascun punto di discontinuità). Osservazione 10.3.3 Si riconoscono facilmente alcune proprietà relative alle operazioni sulle funzioni integrabili in senso improprio; ad esempio, si enunciano le seguenti omettendone per brevità la dimostrazione, basata essenzialmente sulle definizioni assunte: 1. Se f : [a, b] → R è una funzione generalmente continua dotata di punti di discontinuità solamente eliminabili o di prima specie, essa è integrabile in senso improprio in [a, b]. Quindi, i punti di discontinuità in un intorno dei quali può fallire l’integrabilità della funzione sono quelli di seconda specie, che per tale motivo vengono denominati anche punti singolari della funzione. 10.3 Integrali impropri 297 2. Se f : [a, b] → R e g : [a, b] → R sono funzioni generalmente continue integrabili in senso improprio in [a, b], allora la somma f +g è anch’essa integrabile in senso improprio in [a, b] e si ha ∫ b ∫ b ∫ b (f (x) + g(x)) dx = f (x) dx + g(x) dx . a a a 3. Se f : [a, b] → R e g : [a, b] → R sono funzioni generalmente continue integrabili in senso improprio in [a, b] e se esiste un sottoinsieme finito H di [a, b] tale che, per ogni x ∈ [a, b] r H, f (x) ≤ g(x), allora si ha anche ∫ ∫ b b f (x) dx ≤ a g(x) dx . a 4. Sia f : [a, b] → R una funzione generalmente continua e positiva, integrabile in senso improprio in [a, b]; considerato l’insieme finito H dei punti di discontinuità di f , si definisce il trapezoide T (f ) := {(x, y) ∈ ∫b R2 | x ∈ [a, b] r H , 0 ≤ y ≤ f (x)}. Allora a f (x) dx = Area (T (f )). Per i criteri successivi risulta utile la definizione seguente. Definizione 10.3.4 Sia f : [a, b] → R una funzione generalmente continua. Si dice che f è assolutamente integrabile in senso improprio in [a, b] se la funzione |f | è integrabile in senso improprio in [a, b]. Inoltre, si dice che l’integrale improprio di f è assolutamente divergente se l’integrale improprio di |f | è divergente positivamente. ◃ Si supponga che f : [a, b] → R sia continua in ]a, b]. Poiché |f | è positiva, la funzione g :]a, b] → R definita ponendo, per ogni x ∈]a, b], ∫b g(x) := x |f (t)| dt è decrescente e quindi, per il teorema sul limite delle funzioni monotone (Teorema 6.6.1), è dotata di limite nel punto a dato da ∫b supx∈]a,b] x |f (t)| dt. Pertanto, l’integrale improprio di |f | è necessariamente convergente oppure divergente positivamente. Lo stesso discorso può essere applicato nel caso in cui f non sia continua in b oppure in uno o più punti interni all’intervallo [a, b]. Quindi, si può concludere che una funzione generalmente continua risulta o assolutamente integrabile in senso improprio oppure l’integrale in senso improprio è assolutamente divergente. Per questo motivo per indicare che una funzione è assolutamente integrabile in senso improprio è sufficiente scrivere ∫ b |f (x)| dx < +∞ . a Capitolo 10: Calcolo integrale 298 ◃ Se f è positiva, l’assoluta integrabilità equivale ovviamente all’integrabilità in senso improprio. In generale, si può solamente affermare che se f : [a, b] → R è una funzione generalmente continua e assolutamente integrabile in senso improprio in [a, b], allora f è integrabile in senso improprio in [a, b] e si ha ∫ ∫ b b f (x) dx ≤ |f (x)| dx . a a Vale inoltre il seguente criterio di confronto. Proposizione 10.3.5 (Criterio di confronto per gli integrali impropri) Siano f : [a, b] → R e g : [a, b] → R funzioni generalmente continue e si supponga che, per ogni x ∈ [a, b], |f (x)| ≤ g(x). Si ha 1. Se g è integrabile in senso improprio, allora f è assolutamente integrabile in senso improprio. 2. Se l’integrale improprio di f è assolutamente divergente, allora anche l’integrale improprio di g è divergente positivamente. Dimostrazione. 1) La prima parte segue dalle definizioni applicando la proprietà di monotonia dell’integrale definito e del limite. La seconda parte segue invece direttamente dalla prima. Esempio 10.3.6 (Integrali impropri campione) Siano x0 ∈ [a, b] e α > 0. Si consideri la funzione f : [a, b] r {x0 } → R definita ponendo, per ogni x ∈ [a, b] r {x0 }, 1 f (x) := . |x − x0 |a Si tratta di una funzione generalmente continua in [a, b] avente x0 come unico punto di discontinuità. Si supponga x0 < b; per ogni ε > 0, se α = 1 ∫ b x0 +ε 1 b dx = [log |x − x0 |]x0 +ε = log(b − x0 ) − log ε , |x − x0 |α mentre, se α ̸= 1, ∫ b x0 +ε 1 dx = |x − x0 |α = [ ]b 1 |x − x0 |−α+1 x +ε 0 −α + 1 ( ) 1 (b − x0 )−α+1 − ε−α+1 . −α + 1 10.3 Integrali impropri 299 Si deduce allora che ∫ lim+ ε→0 b x0 +ε 1−α (b − x0 ) , 1 1−α dx = |x − x0 |α +∞ , 0<α<1, α≥1. ∫ x −ε Le stesse conclusioni valgono se si suppone a < x0 e si considera a 0 1/|x− x0 |α dx. Quindi f è integrabile in senso improprio in [a, b] se 0 < α < 1, mentre non lo è se α ≥ 1. Utilizzando l’esempio e il criterio di confronto precedenti si ottiene il seguente risultato di frequente applicazione. Teorema 10.3.7 (Criterio dell’ordine di infinito) Sia f : [a, b] → R una funzione continua in [a, b] r {x0 }, con x0 ∈ [a, b]. Si ha 1. Se f è un infinito in x0 di ordine minore o uguale di α, con α ∈ ]0, 1[ (oppure se f non è un infinito in x0 ), allora f è assolutamente integrabile in senso improprio in [a, b]. 2. Se f è un infinito in x0 di ordine maggiore o uguale di 1, allora l’integrale improprio di f è assolutamente divergente. Dimostrazione. 1) Dalle ipotesi fatte, esistono δ > 0 ed M ∈ R tali che, per ogni x ∈ [a, b]∩]x0 − δ, x0 + δ[, |f (x)| ≤ M/|x − x0 |α (ciò vale anche se f non è un infinito in x0 considerando α ∈]0, 1[ arbitrario). Poiché α < 1, dall’Esempio 10.3.6 e dalla Proposizione 10.3.5, 1), segue che f è assolutamente integrabile in senso improprio in [a, b]. 2) Dal fatto che f è un infinito in x0 di ordine maggiore o uguale di 1, si deduce l’esistenza di δ > 0 ed M ∈ R tali che, per ogni x ∈ [a, b]∩]x0 −δ, x0 +δ[, |f (x)| ≥ M/|x−x0 |. Ancora dall’Esempio 10.3.6 e dalla Proposizione 10.3.5, 2), segue che l’integrale improprio di f è assolutamente divergente. ◃ In generale, per stabilire l’integrabilità in senso improprio di una funzione generalmente continua, si cerca prima di applicare il Teorema 10.3.7 in ognuno dei punti di discontinuità per f . Se si trova un punto di discontinuità in cui vale la parte 2), si conclude subito che la funzione non è integrabile in senso improprio. Se invece in tutti i punti di discontinuità è soddisfatta la parte 1), la funzione è integrabile in senso improprio in [a, b]. Può capitare che in qualche punto il criterio dell’ordine di infinito non si possa applicare, cioè che la funzione sia un infinito in un punto x0 di ordine minore di 1, ma maggiore di α per ogni α ∈]0, 1[. In questi casi bisogna ricorrere ad altri metodi per lo studio dell’integrabilità, ad esempio, rifacendosi direttamente alle definizioni assunte. Si Capitolo 10: Calcolo integrale 300 osserva infine che i criteri di integrabilità in senso improprio, nel caso in cui possano essere applicati, consentono di stabilire solamente l’integrabilità della funzione ma non forniscono il valore dell’integrale improprio, per il quale bisogna in generale utilizzare la definizione ed i metodi di integrazione per gli integrali definiti. ◃ Ad esempio, si consideri l’integrale improprio ∫ 0 1/2 1 dx , x logn x n≥1. Nel punto 0 la funzione è un infinito di ordine minore di 1, ma di ordine maggiore di α per ogni 0 < α < 1 e pertanto il criterio sull’ordine di infinito non può essere applicato (l’ordine minore di 1 esclude la seconda parte e l’ordine maggiore di α per ogni 0 < α < 1 esclude la prima parte del teorema). Pertanto, si ricorre direttamente alla definizione. Se n = 1 si ha, per ogni ε > 0, ∫ 1/2 ε 1 1/2 dx = [log | log x|]ε = log log 2 − log | log ε| , x log x mentre, se n ≥ 2, ∫ ε 1/2 [ −n+1 ]1/2 ( ) 1 log x 1 −n+1 1 −n+1 dx = = − log − log ε . x logn x −n + 1 ε n−1 2 Si deduce che ∫ 0 1/2 1 , 1 dx = (n − 1) logn−1 2 n x log x −∞ , n≥2, n=1. Quindi l’integrale improprio è convergente se e solo se n ≥ 2. ◃ Si consideri l’integrale improprio ∫ 1√ (1 − ex ) log x dx . sin(πx) 0 La funzione in esame è generalmente continua e non √ è definita nei punti 0 e 1. Per quanto riguarda il punto 0, la funzione (1 − ex ) log x è un infinitesimo di ordine minore di 1/2, ma maggiore di ogni numero strettamente positivo minore di 1/2, mentre la funzione sin πx è un infinitesimo di ordine 1. Si deduce che il rapporto è un infinito di ordine maggiore di 1/2 10.3 Integrali impropri 301 ma minore di ogni numero maggiore di 1/2, ad esempio di 3/4; dal criterio dell’ordine di infinito (Teorema 10.3.7), segue l’assoluta integrabilità della funzione in un intorno del punto 0. Nel punto 1 la funzione al numeratore è un infinitesimo di ordine 1/2 e quella al denominatore è un infinitesimo di ordine 1; il rapporto è quindi un infinito di ordine 1/2 e la funzione è integrabile nel punto 1 sempre per il criterio dell’ordine di infinito. Poiché si è stabilita l’integrabilità della funzione in ogni punto di discontinuità, si conclude che essa è integrabile. Tuttavia le regole di integrazione note non consentono in questo caso di calcolare il valore dell’integrale improprio. ◃ Si consideri l’integrale improprio ∫ π (2x − π) tan x dx . 0 L’unico punto di discontinuità da discutere in questo caso è il punto π/2, nel quale la funzione è un il prodotto di un infinitesimo di ordine 1 e di un infinito di ordine 1; pertanto in tale punto la funzione non è un infinito ed è di conseguenza integrabile in senso improprio in [0, π]. ◃ Si consideri l’integrale improprio ∫ 0 1 log2 (1 − x) dx . 1−x Vi è solamente il punto 1 da discutere; in tale punto la funzione è il rapporto di un infinito di ordine arbitrariamente piccolo e di un infinitesimo di ordine 1; quindi è un infinito di ordine maggiore di 1 (e minore di 1 + ε per ogni ε > 0); dal criterio dell’ordine di infinito, tenendo presente che la funzione è positiva, l’integrale improprio è divergente positivamente. 10.3.2 Integrali impropri su intervalli non limitati Si considera ora il caso di funzioni definite in un intervallo illimitato. La discussione è analoga al caso precedente e per questo motivo si tralasceranno alcuni dettagli in caso di completa analogia. Definizione 10.3.8 Sia f : [a, +∞[→ R (rispettivamente, f :]−∞, b] → R) una funzione continua. Se esiste il limite ∫ lim b→+∞ ∫ b f (x) dx , a (rispettivamente, lim a→−∞ b f (x) dx ), a (10.3.4) Capitolo 10: Calcolo integrale 302 esso viene denominato integrale improprio di f in [a, +∞[ (rispettivamente, in ] − ∞, b]) e denotato con uno dei simboli ∫ ∫ +∞ f (x) dx , a ∫ +∞ f, ∫ b (rispettivamente, b f (x) dx , −∞ a f ). −∞ Inoltre, se il limite (10.3.4) è un numero reale si dice anche che l’integrale improprio di f è convergente oppure che f è integrabile in senso improprio; se il limite (10.3.4) è infinito, si dice che l’integrale improprio di f è divergente. Se f : R → R è una funzione continua, si dirà poi che essa è integrabile in senso improprio in R se esistono e sono finiti entrambi i limiti ∫ lim b→+∞ ∫ b f (x) dx , c c lim a→−∞ f (x) dx , (10.3.5) a dove c ∈ R è fissato arbitrariamente. In tal caso l’integrale improprio di f può essere calcolato anche considerando il limite ∫ +∞ ∫ a f (x) dx = lim f (x) dx ; (10.3.6) −∞ a→+∞ −a Anche ora conviene osservare che l’esistenza del limite (10.3.6) non comporta in generale che f sia integrabile in senso improprio in tutto R. Se uno dei limiti (10.3.5) tende a ±∞ e l’altro ad un numero reale, oppure se tendono entrambi a +∞ o a −∞, si dice che l’integrale improprio di f è divergente (positivamente o negativamente). Una situazione più generale è quella in cui la funzione è generalmente continua in un intervallo illimitato. In questo caso l’integrabilità in senso improprio viene considerata separatamente in un intorno di ogni punto di discontinuità ed eventualmente nei punti +∞ e −∞; è sufficiente che l’integrabilità fallisca in un intorno di tali punti per concludere che la funzione non è integrabile in senso improprio. Per quanto osservato, si può ora trattare separatamente solamente il caso di funzioni continue su intervalli illimitati. Nel seguito si considera l’intervallo [a, +∞[; considerazioni analoghe valgono in ] − ∞, b] ed R. ◃ Si possono stabilire proprietà analoghe a quelle enunciate per gli integrali impropri di funzioni limitate. 1. Se f : [a, +∞[→ R e g : [a, +∞[→ R sono funzioni continue integrabili in senso improprio in [a, +∞[, allora la somma f + g è anch’essa 10.3 Integrali impropri 303 integrabile in senso improprio in [a, +∞[ e si ha ∫ +∞ ∫ +∞ ∫ (f (x) + g(x)) dx = f (x) dx + a a +∞ g(x) dx . a 2. Se f : [a, +∞[→ R e g : [a, +∞[→ R sono funzioni continue integrabili in senso improprio in [a, +∞[ e se, per ogni x ∈ [a, b], f (x) ≤ g(x), allora si ha anche ∫ +∞ ∫ +∞ f (x) dx ≤ g(x) dx . a a 3. Se f : [a, +∞[→ R è una funzione continua e positiva, integrabile in senso improprio in [a, +∞[, considerato il trapezoide T (f ) := {(x, y) ∈ ∫ +∞ R2 | x ≥ a , 0 ≤ y ≤ f (x)}, si ha a f (x) dx = Area (T (f )). L’assoluta integrabilità viene definita come in precedenza. Se f : [a, +∞[→ R è una funzione continua, si dice che f è assolutamente integrabile in senso improprio in [a, +∞[ se la funzione |f | è integrabile in senso improprio in [a, +∞[. Inoltre, si dice che l’integrale improprio di f è assolutamente divergente se l’integrale improprio di |f | è divergente positivamente. ◃ Anche ora, dal teorema sul limite delle funzioni monotone, si deduce che una funzione continua f : [a, +∞[→ R o è assolutamente integrabile in senso improprio oppure il suo integrale improprio è assolutamente divergente; per evidenziare il fatto che una funzione ∫ +∞ è assolutamente integrabile in senso improprio si scrive solitamente a |f (x)|dx < +∞. Ovviamente, le nozioni di assoluta integrabilità in senso improprio e di integrabilità in senso improprio sono equivalenti se la funzione è positiva. In generale, si può solamente dire che se f : [a, +∞[→ R è una funzione continua e assolutamente integrabile in senso improprio in [a, +∞[, allora f è integrabile in senso improprio in [a, +∞[ e si ha ∫ +∞ ∫ +∞ f (x) dx ≤ |f (x)| dx . a a Inoltre se f : [a, +∞[→ R e g : [a, +∞[→ R sono funzioni continue tali che, per ogni x ∈ [a, +∞[, |f (x)| ≤ g(x), si ha 1. Se g è integrabile in senso improprio, allora f è assolutamente integrabile in senso improprio. 2. Se l’integrale improprio di f è assolutamente divergente, allora anche l’integrale improprio di g è divergente positivamente. 304 Capitolo 10: Calcolo integrale ◃ Utilizzando la definizione si riconosce facilmente che l’integrale improprio ∫ +∞ 1 dx α x 1 è convergente per α > 1 ed è divergente positivamente se 0 < α < 1. Si può infine enunciare il seguente criterio dell’ordine di infinitesimo. Teorema 10.3.9 (Criterio dell’ordine di infinitesimo) Sia f : [a, +∞[→ R una funzione continua. Allora: 1. Se f è un infinitesimo in +∞ di ordine maggiore o uguale di α, con α > 1, allora f è assolutamente integrabile in senso improprio in [a, +∞[. 2. Se f è un infinitesimo in +∞ di ordine minore o uguale di 1 (oppure se tende ad un limite diverso da 0 in +∞), allora l’integrale improprio di f è assolutamente divergente. Dimostrazione. Se f è un infinitesimo in +∞ di ordine maggiore o uguale di α, con α > 1, si possono trovare c ∈ [a, +∞[ ed M ∈ R tali che, per ogni x ∈ [c, +∞[, |f (x)| ≤ M/|x|α . Poiché α > 1, la funzione 1/|x|α è integrabile in senso improprio in [a, +∞[ e quindi anche f lo è. 2) Se f è un infinitesimo in +∞ di ordine minore o uguale di 1 oppure se f tende ad un limite diverso da 0 in +∞, esistono c ∈ [a, +∞[ ed M ∈ R tali che, per ogni x ∈ [c, +∞[, |f (x)| ≥ M/|x|. Allora la tesi segue dal fatto che la funzione M/|x| non è integrabile in senso improprio in [c, +∞[. Il criterio dell’ordine di infinitesimo non si può applicare se f : [a, +∞[→ R è un infinitesimo in +∞ di ordine maggiore di 1, ma minore di 1 + ε per ogni ε > 0. In questi casi si cerca di ricorrere ad altri metodi oppure direttamente alla definizione. ◃ Ad esempio, si consideri l’integrale improprio ∫ +∞ sin x dx . 2+1 x 0 La funzione è continua in [0, +∞[ e quindi bisogna discutere l’integrabilità solamente in un intorno del punto +∞. Per ogni x ∈ [0, +∞[, risulta sin x 1 ≤ 2 2 x +1 x +1 e poiché 1/(x2 + 1) è un infinitesimo di ordine 2 in +∞, dal criterio dell’ordine di infinitesimo (Teorema 10.3.9 segue che l’integrale improprio considerato è assolutamente convergente e quindi convergente. 10.3 Integrali impropri 305 ◃ Si consideri l’integrale improprio ∫ +∞ 1 dx , x logn x 2 n≥1. La funzione in esame è continua e quindi bisogna discutere l’integrabilità solamente in un intorno del punto +∞. Nel punto +∞ la funzione è un infinitesimo di ordine maggiore di 1, ma di ordine minore di α per ogni α > 1 e pertanto il criterio sull’ordine di infinitesimo non può essere applicato (l’ordine maggiore di 1 esclude la seconda parte e l’ordine minore di α per ogni α > 1 esclude la prima parte del teorema). Pertanto, si ricorre direttamente alla definizione. Se n = 1 si ha, per ogni b > 2, ∫ b 1 b dx = [log | log x|]2 = log log b − log log 2 , 2 x log x mentre, se n ≥ 2, ∫ b 2 [ −n+1 ]b ) log x 1 ( −n+1 1 dx = =− log b − log−n+1 2 . n x log x −n + 1 2 n−1 Si deduce che ∫ 0 1/2 1 , 1 dx = (n − 1) logn−1 2 x logn x +∞ , n≥2, n=1 e quindi l’integrale improprio è convergente se e solo se n ≥ 2. ◃ Si consideri l’integrale improprio ∫ +∞ Γ(α) := xα−1 e−x dx , α∈R. (10.3.7) 0 Bisogna discutere l’integrabilità in un intorno del punto 0 ed in un intorno del punto +∞. Nel punto 0, vi è un infinito di ordine 1−α se α < 1 altrimenti la funzione è limitata e quindi, per il criterio dell’ordine di infinito e tenendo conto della positività della funzione, l’integrale Γ(α) è convergente per 1 − α < 1, cioè per α > 0 ed è divergente positivamente per α ≤ 0 in un intorno del punto 0. Nel punto +∞, la funzione è un infinitesimo di ordine arbitrariamente grande e quindi è sicuramente integrabile in un intorno del punto +∞ per il criterio dell’ordine di infinitesimo. Capitolo 10: Calcolo integrale 306 Si conclude che l’integrale assegnato è convergente per α > 0 e divergente positivamente per α ≤ 0. La funzione Γ :]0, +∞[→ R definita dalla (10.3.7) è nota come funzione gamma. ◃ Il criterio dell’ordine di infinitesimo (Teorema 10.3.9) richiama un risultato analogo stabilito per le serie numeriche (Teorema 7.2.13). In effetti, è possibile stabilire il seguente legame tra integrali impropri e ∑+∞ serie numeriche. Sia n=0 an una serie numerica e si consideri la funzione f : [0, +∞[→ R cosı̀ definita; per ogni x ∈ [0, +∞[, considerato l’unico numero naturale n ∈ N tale che x ∈ [n, n + 1[, si pone f (x) := an . Allora, le seguenti proposizioni sono equivalenti: ∑+∞ a) La serie n=0 an è convergente (rispettivamente, assolutamente convergente, divergente); b) La funzione f è integrabile in senso improprio in [0, +∞[ (rispettivamente, f è assolutamente integrabile in senso improprio in [0, +∞[, l’integrale improprio di f è divergente). Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti, si ha ∫ +∞ +∞ ∑ an = f (x) dx . 0 n=0 ∫ Dimostrazione. Per ogni n ∈ N, si ha nn+1 f (x) dx = an e quindi, denotata con sn la somma parziale n-esima della serie, si ha ∫ n+1 n ∫ k+1 n ∑ ∑ f (x) dx . f (x) dx = ak = sn = k=0 k=0 k 0 Da ciò segue subito b)⇒ a); per il viceversa, basta osservare che, per ogni n ∈ N e ∫ b ∈ [n, n + 1[, l’integrale 0b f (x) dx è compreso tra min{sn , sn+1 } e max{sn , sn+1 }. Se ℓ denota la somma della serie, fissato ε > 0, si può trovare ν ∈ N tale che, per ogni n ≥ ν, ∫ risulti |sn − ℓ| < ε e conseguentemente anche 0b f (x) dx − ℓ < ε. Da ciò segue la b) ed anche l’uguaglianza prevista nell’ultima parte della tesi. I casi rispettivi si dimostrano in maniera analoga. ◃ Viceversa, considerata una funzione ∑+∞ f : [0, +∞[→ R integrabile in senso improprio, si può definire la serie n=0 an di termine generale n-esimo an ponendo an := f (n), n ∈ N. Se f : [0, +∞[→ R è positiva e decrescente, allora le seguenti proposizioni sono equivalenti: 10.3 Integrali impropri 307 a) La funzione f è integrabile in senso improprio in [0, +∞[ (rispettivamente, l’integrale improprio di f è divergente positivamente). ∑+∞ b) La serie n=0 an è convergente (rispettivamente, divergente positivamente). Inoltre, vera l’una e quindi ciascuna delle proposizioni equivalenti precedenti, si ha ∫ +∞ f (x) dx ≤ 0 ∫ +∞ ∑ +∞ an ≤ f (0) + f (x) dx . 0 n=0 Dimostrazione. Poiché f è decrescente si ha, per ogni n ∈ N, ∫ n+1 an+1 ≤ f (x) dx ≤ an e quindi ∑n k=0 n ∑ k=0 ak+1 ≤ ∫ n+1 ak = a0 + 0 n−1 ∑ n f (x) dx ≤ ∑n k=0 ∫ ak . ∫ +∞ ak+1 ≤ a0 + f (x) dx = f (0) + 0 k=0 +∞ f (x) dx 0 e quindi la serie è convergente in quanto è a termini positivi e le sue somme parziali sono limitate superiormente. Si ha inoltre +∞ ∑ ∫ +∞ an ≤ f (0) + f (x) dx . 0 n=0 Viceversa, per ogni b ∈ [0, +∞[, considerato n ∈ N tale che b ∈ [n, n + 1[, dalla positività di f segue ∫ n+1 ∫ n+1 ∫ b ∫ b n ∑ f (x) dx ≤ ak ; f (x) dx = f (x) dx + f (x) dx ≤ 0 b 0 0 k=0 poiché f è positiva e il suo integrale improprio è limitato superiormente dalla somma della serie, si ottiene la a) e inoltre ∫ 0 e ciò completa la dimostrazione. +∞ f (x) dx ≤ +∞ ∑ an , n=0 Parte II Equazioni differenziali e funzioni di più variabili reali Nella seconda parte del corso, viene completato lo studio delle funzioni di una variabile reale con ulteriori capitoli riguardanti lo studio delle successioni e delle serie di funzioni e quello delle equazioni differenziali ordinarie; inoltre, vengono illustrati alcuni aspetti riguardanti le funzioni di più variabili reali, quali il calcolo differenziale, lo studio dei massimi e minimi relativi e vincolati e lo studio degli integrali multipli corredato da alcuni strumenti elementari di teoria della misura. Capitolo 11 Successioni e serie di funzioni 11.1 Convergenza puntuale ed uniforme Sia X un sottoinsieme non vuoto di R e sia (fn )n∈N una successione di funzioni reali definite in X. Fissato un elemento x0 ∈ X, si dice che la successione (fn )n∈N è convergente in x0 se la successione numerica (fn (x0 ))n∈N è convergente. Inoltre, se A ⊂ X, si dice che la successione (fn )n∈N è puntualmente convergente in A (oppure semplicemente convergente in A oppure anche convergente in A) se essa è convergente in ogni elemento di A. Se A = X si dice che (fn )n∈N è puntualmente convergente oppure semplicemente convergente. Si supponga che la successione di funzioni (fn )n∈N sia puntualmente convergente; allora si può considerare la funzione reale f : X → R definita ponendo, per ogni x ∈ X, f (x) := lim fn (x) . n→+∞ (11.1.1) Essa viene denominata limite puntuale (oppure limite semplice) della successione (fn )n∈N e viene denotata con f = lim fn n→+∞ puntualmente. Esplicitamente, la condizione precedente pertanto significa ∀ x ∈ X ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : |fn (x) − f (x)| ≤ ε . (11.1.2) Capitolo 11: Successioni e serie di funzioni 314 Tale tipo di convergenza tuttavia consente l’applicazione dei risultati ottenuti sulle successioni numeriche in ogni punto prefissato ma non ci si può aspettare che vengano conservate per la funzione f alcune proprietà qualitative delle funzioni fn , quali la continuità, la derivabilità in un punto o globale e l’integrabilità. Per lo studio di tali proprietà della funzione limite è più efficace il concetto di convergenza uniforme in cui si pretende che nella condizione (11.1.2) il numero naturale ν non dipenda dall’elemento x ∈ X ma solamente da ε > 0. Precisamente, se (fn )n∈N è una successione di funzioni reali definite in X ed f : X → R è una ulteriore funzione, si dice che (fn )n∈N è uniformemente convergente verso f (oppure che f è il limite uniforme della successione (fn )n∈N ) se è verificata la seguente condizione: ∀ ε > 0 ∃ ν ∈ N t.c. ∀ x ∈ X ∀ n ≥ ν : |fn (x) − f (x)| ≤ ε , (11.1.3) oppure, equivalentemente, ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : sup |fn (x) − f (x)| ≤ ε . x∈X In tal caso, si scrive f = lim fn n→+∞ uniformemente. Inoltre, si dice che la successione (fn )n∈N è uniformemente convergente in un sottoinsieme A di X se la successione ((fn )|A )n∈N delle restrizioni all’insieme A è uniformemente convergente. ◃ Evidentemente, la condizione (11.1.3) implica la (11.1.2) e pertanto, se la successione (fn )n∈N è uniformemente convergente verso f , essa è anche puntualmente convergente verso f . Viceversa, se (fn )n∈N converge puntualmente verso f , non è detto che la convergenza sia uniforme. ◃ Ad esempio, si consideri, per ogni n ≥ 1, la funzione reale fn : R → R definita ponendo, per ogni x ∈ R, fn (x) := sin(x)+x/n. Si riconosce facilmente che sin = limn→+∞ fn . Infatti, per ogni x0 ∈ R, si ha limn→+∞ x0 /n = 0 e conseguentemente limn→+∞ fn (x0 ) = sin x0 . Tuttavia, fissato ε > 0 e imponendo la condizione | sin x − fn (x)| < ε, si trova |x|/n < ε, che è soddisfatta solamente nell’intervallo ] − nε, nε[ e non in tutto R; si conclude che la convergenza non può essere uniforme. Si può completare la discussione della convergenza della successione di funzioni (fn )n≥1 osservando che la convergenza risulta uniforme in ogni intervallo I limitato di R. Infatti, posto r := supx∈I |x| si ha I ⊂ [−r, r] e 11.2 Proprietà del limite di una successione di funzioni 315 conseguentemente, per ogni n ≥ 1, supx∈I |fn (x) − f (x)| = supx∈I |x|/n ≤ r/n; pertanto, fissato ε > 0 e considerato ν ≥ 1 tale che ν ≥ rε, si ha supx∈I |fn (x) − f (x)| ≤ ε for ogni n ≥ ν, da cui l’uniforme convergenza in I. ◃ Come ulteriore esempio si consideri, per ogni n ∈ N, la funzione reale fn : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1], fn (x) := xn e sia f : [0, 1] → R cosı̀ definita { 0, 0≤x<1, f (x) := 1, x=1. Allora, la successione di funzioni (fn )n∈N converge puntualmente verso f . Tuttavia la convergenza non può essere uniforme. Si supponga infatti per assurdo che fissato ε = 1/3, esista ν ∈ N tale che, per ogni n ≥ ν e per ogni x ∈ [0, 1], si abbia √ |fn (x) − f (x)| ≤ 1/3; allora, in particolare, considerando n = ν ed x := ν 2/3, si dovrebbe avere 2/3 = |fν (x) − f (x)| ≤ 1/3 da cui un assurdo. Quindi (fn )n∈N non converge uniformemente verso f ; in questo caso, si può riconoscere che, per ogni 0 < a < 1, la successione (fn )n∈N converge uniformemente verso f in [0, a]. ◃ Si osserva che se (fn )n∈N e (gn )n∈N sono successioni di funzioni di X in R convergenti puntualmente verso una funzione f : X → R e rispettivamente g : X → R, allora la successione di funzioni (fn + gn )n∈N converge puntualmente verso f + g e la successione di funzioni (fn · gn )n∈N converge puntualmente verso f · g. Se (fn )n∈N e (gn )n∈N convergono uniformemente verso f e rispettivamente g, allora la somma (fn +gn )n∈N converge uniformemente verso f + g, mentre senza ulteriori ipotesi (ad esempio, di limitatezza di f e g) non si può affermare che il prodotto (fn · gn )n∈N converga uniformemente verso f · g, come si riconosce facilmente considerando ad esempio fn (x) = gn (x) = x + 1/n per ogni x ∈ R. 11.2 Proprietà del limite di una successione di funzioni Si studia ora il comportamento della funzione limite f di una successione (fn )n∈N di funzioni uniformemente convergente, nelle ipotesi in cui ogni fn verifichi opportune condizioni. Il primo risultato è un teorema di carattere generale che stabilisce una formula di inversione dei limiti per le successioni di funzioni uniformemente convergenti. Capitolo 11: Successioni e serie di funzioni 316 Teorema 11.2.1 (Teorema di inversione dei limiti) Siano X un sottoinsieme non vuoto di R, x0 un punto di accumulazione per X ed (fn )n∈N una successione di funzioni reali definite in X. Si supponga che i) La successione (fn )n∈N converge uniformemente verso una funzione f : X → R; ii) Per ogni n ∈ N, risulta lim fn (x) = ℓn ∈ R. x→x0 Allora, la successione (ℓn )n∈N è convergente e inoltre, posto ℓ := lim ℓn , n→+∞ risulta lim f (x) = ℓ. x→x0 Dimostrazione. Si dimostra innanzitutto che la successione (ℓn )n∈N è convergente, facendo vedere che essa verifica la seguente condizione di Cauchy: ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n, m ≥ ν : |ℓn − ℓm | ≤ ε . Si fissi a tal fine ε > 0 e, per la uniforme convergenza di (fn )n∈N verso f , si consideri ν ∈ N tale che, per ogni n ≥ ν e per ogni x ∈ X, si abbia |fn (x)−f (x)| ≤ ε/4. Si dimostra ora che, per ogni n, m ≥ ν, risulta |ℓn − ℓm | ≤ ε e ciò completerà la dimostrazione. Si fissino pertanto n, m ≥ ν; dall’ipotesi i), si possono trovare un intorno J1 di x0 tale che, per ogni x ∈ X ∩ J1 r {x0 }, |fn (x) − ℓn | ≤ ε/4 ed un intorno J2 di x0 tale che, per ogni x ∈ X ∩ J2 r {x0 }, |fm (x) − ℓm | ≤ ε/4. Allora, fissato x ∈ X ∩ J1 ∩ J2 r {x0 }, risulta |ℓn − ℓm | = |ℓn − fn (x) − (ℓm − fm (x)) + fn (x) − f (x) − (fm (x) − f (x))| ≤ |ℓn − fn (x)| + |ℓm − fm (x)| + |fn (x) − f (x)| + |fm (x) − f (x)| ε ε ε ε ≤ + + + = ε. 4 4 4 4 Si è cosı̀ dimostrato che la successione (ℓn )n∈N è convergente. Si ponga ℓ := lim ℓn . n→+∞ Sia ora ε > 0; poichè (fn )n∈N è uniformemente convergente verso f , esiste ν1 ∈ N tale che, per ogni n ≥ ν1 e per ogni x ∈ X, si abbia |fn (x) − f (x)| ≤ ε/3. Inoltre, la successione (ℓn )n∈N converge verso ℓ e quindi esiste ν2 ∈ N tale che |ℓn − ℓ| ≤ ε/3 per ogni n ≥ ν2 . Si fissi ora n ≥ max{ν1 , ν2 }; poichè fn converge verso ℓn per x → x0 , si può trovare un intorno J di x0 tale che, per ogni x ∈ X ∩ J r {x0 }, risulti |fn (x) − ℓn | ≤ ε/3. Conseguentemente, per ogni x ∈ X ∩ J r {x0 }, risulta anche |f (x) − ℓ| ≤ |f (x) − fn (x)| + |fn (x) − ℓn | + |ℓn − ℓ| ≤ ε/3 + ε/3 + ε/3 = ε; dall’arbitrarietà di ε > 0, segue quindi la tesi. ◃ La tesi del Teorema 11.2.1 precedente esprime la possibilità di invertire i limiti rispetto alle variabili n → +∞ ed x → x0 ; infatti, si ha lim lim fn (x) = lim f (x) = ℓ = lim ℓn = lim x→x0 n→+∞ x→x0 n→+∞ lim fn (x) . n→+∞ x→x0 Tale inversione dei limiti non vale, in generale, se la successione di funzioni non è uniformemente convergente; ad esempio, risulta evidentemente limn→+∞ limx→1− xn = 1 mentre limx→1− limn→+∞ xn = 0. Come ulteriore conseguenza del risultato precedente, si può ottenere la proprietà di continuità del limite uniforme. 11.2 Proprietà del limite di una successione di funzioni 317 Teorema 11.2.2 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed (fn )n∈N una successione di funzioni reali definite in X e continue nel punto x0 . Se la successione (fn )n∈N converge uniformemente verso una funzione f : X → R, allora anche f risulta continua nel punto x0 . Dimostrazione. Basta applicare il Teorema 11.2.1 precedente tenendo presente che, per ogni n ∈ N, si ha limx→x0 fn (x) = fn (x0 ). Ovviamente, se ogni funzione fn è è continua in un sottoinsieme A di X, allora anche il limite uniforme f risulta continuo in A; in particolare, se ogni fn è continua, il limite uniforme f è anch’esso continuo. Quest’ultimo risultato può in alcuni casi essere utile per dimostrare che una successione di funzioni non può essere uniformemente convergente verso una funzione f . Ad esempio, si consideri, per ogni n ∈ N, la funzione fn : R → R definita ponendo, per ogni x ∈ R, fn (x) : | sin(πx)|n . Allora, la successione di funzioni (fn )n∈N converge puntualmente verso la funzione f : R → R che assume il valore 1 in Z e 0 in R r Z; allora, la convergenza non può essere uniforme in quanto, per ogni n ∈ N, fn è continua mentre f evidentemente non lo è. Si considera ora il comportamento del limite di una successione di funzioni rispetto alle proprietà di integrabilità e derivabilità. Si hanno i seguenti risultati di carattere generale. Teorema 11.2.3 (Passaggio al limite sotto il segno di integrale) Siano a, b ∈ R con a < b ed (fn )n∈N una successione di funzioni reali continue in [a, b] uniformemente convergente verso una funzione f : [a, b] → R. Allora f è integrabile in [a, b] ed inoltre ∫ ∫ b f (x) dx = lim a n→+∞ b fn (x) dx . a Dimostrazione. Poichè, per ogni n ∈ N, fn è una funzione continua, dal Teorema 11.2.2 precedente segue che anche f è continua e quindi integrabile in [a, b]. Inoltre, fissato ε > 0, dalla uniforme convergenza di (fn )n∈N verso f , segue l’esistenza di ν ∈ N tale che, per ogni n ≥ ν e per ogni x ∈ [a, b], si abbia |fn (x) − f (x)| ≤ ε/(b − a); pertanto, per ogni n ≥ ν, si ha ∫ b ∫ b ∫ b ∫ b ε |fn (x) − f (x)| dx ≤ f (x) dx ≤ fn (x) dx − dx = ε , b−a a a a a e ciò, per l’arbitrarietà di ε > 0, dimostra la tesi. La denominazione attribuita al teorema precedente deriva dal fatto che esso può essere espresso dicendo che il limite uniforme (se esistente) di Capitolo 11: Successioni e serie di funzioni 318 una successione (fn )n∈N di funzioni continue in un intervallo [a, b], risulta integrabile in [a, b] e si ha ) ∫ b ∫ b( lim fn (x) dx = lim fn (x) dx . n→+∞ a n→+∞ a Teorema 11.2.4 (Passaggio al limite sotto il segno di derivata) Siano a, b ∈ R con a < b ed (fn )n∈N una successione di funzioni reali derivabili e con derivata continua in [a, b]. Si supponga che i) La successione delle derivate (fn′ )n∈N è uniformemente convergente verso una funzione g : [a, b] → R. ii) Esiste x0 ∈ [a, b] tale che la successione (fn (x0 ))n∈N sia convergente. Allora, la successione (fn )n∈N è uniformemente convergente e, denotato con f := limn→+∞ fn il suo limite uniforme, si ha che f è derivabile in [a, b] e f ′ = g. Dimostrazione. Si ponga innanzitutto ℓ0 := limn→+∞ fn (x0 ). Si osserva che, dal Teorema 11.2.2, la funzione g deve essere continua e quindi la funzione integrale f : [a, b] → R definita ponendo, per ogni x ∈ R, ∫ x g(t) dt f (x) := ℓ0 + x0 risulta derivabile e la sua derivata coincide con g. Resta da dimostrare pertanto che la successione (fn )n∈N converge uniformemente verso f . Sia ε > 0; poiché (fn′ )n∈N converge uniformemente verso g, si può trovare ν1 ∈ N tale che, per ogni n ≥ ν1 e per ogni x ∈ [a, b], risulti |fn′ (x) − g(x)| ≤ ε/(2(b − a)); inoltre, poiché la successione (fn (x0 ))n∈N converge verso ℓ0 , esiste ν2 ∈ N tale che |fn (x0 )−ℓ0 | ≤ ε/2 per ogni n ≥ ν2 . Allora, considerato ν = max{ν1 , ν2 }, per ogni n ≥ ν e per ogni x ∈ [a, b], risulta ∫ x fn (x) − ℓ0 − g(t) dt |fn (x) − f (x)| = ∫ x0 x = ∫ ≤ x0 x fn′ (t) dt + fn (x0 ) − ℓ0 − ∫ x g(t) dt x0 |fn′ (t) − g(t)| dt + |fn (x0 ) − ℓ0 | x0 ε ε |x − x0 | + 2(b − a) 2 ε ε ≤ + =ε, 2 2 e ciò per l’arbitrarietà di ε > 0, dimostra la tesi. ≤ Anche in questo caso la denominazione del teorema è giustificata dal fatto che nelle ipotesi previste si ottiene ( ) D lim fn = lim D(fn ) . n→+∞ n→+∞ 11.3 Serie di funzioni 11.3 319 Serie di funzioni Si consideri un sottoinsieme non vuoto X di R e sia (fn )n∈N una successione di funzioni reali definite in X; per ogni n ∈ N, si consideri la funzione sn := n ∑ fk . k=0 Essa viene denominata somma parziale n-esima della successione di funzioni (fn )n∈N e la successione (sn )n∈N viene denominata serieindexserie—di funzioni di termine generale fn (oppure successione delle somme parziali della successione di funzioni (fn )n∈N ) e viene denotata con il simbolo +∞ ∑ fn . n=0 Si assume la seguente definizione. ◃ Sia (fn )n∈N una successione di funzioni reali definite in un sottoinsieme X di R. Si dice che la serie +∞ ∑ fn (11.3.1) n=0 è convergente in un punto x0 ∈ X se la successione (sn (x0 ))n∈N delle somme parziali calcolate in x0 è una serie numerica convergente. Analogamente, si dice che la serie (11.3.1) è convergente puntualmente (oppure convergente semplicemente oppure convergente) in un sottoinsieme non vuoto A di X se la successione (sn )n∈N delle somme parziali è convergente in A. Infine, si dice che la serie (11.3.1) è convergente (puntualmente oppure semplicemente) (in X) se la successione (sn )n∈N delle somme parziali è convergente. Se la serie (11.3.1) è convergente, si può considerare la funzione f : X → R definita ponendo, per ogni x ∈ X, f (x) := lim sn (x) (= lim n→+∞ n→+∞ n ∑ fk (x)) ; k=0 tale funzione viene denominata∑somma della serie di termine generale fn e, +∞ per indicare ciò, si scrive f = n=0 fn . Come si può notare, si è utilizzato lo stesso simbolo per indicare sia la serie di termine generale fn , che la sua somma nel caso in cui essa risulti convergente; sarà comunque chiaro dal contesto in cui si opera se il simbolo ∑+∞ f si deve intendere come la successione delle somme parziali (sn )n∈N n n=0 oppure come il limite di tale successione di funzioni. 320 Capitolo 11: Successioni e serie di funzioni ◃ Siano (fn )n∈N è una successione di funzioni reali definite in un insieme ∑+∞ X e sia f : X → R una ulteriore funzione. Allora, la serie n=0 fn converge puntualmente verso f se e solo se è soddisfatta la seguente condizione ∀ x ∈ X ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : f (x) − n ∑ fk (x) ≤ ε . k=0 Anche per le serie di funzioni si ha una nozione di convergenza uniforme, di seguito precisata. ◃ Sia (fn )n∈N una successione di funzioni reali definite in un insieme X e∑sia f : X → R una ulteriore funzione. Si dice che la serie di funzioni +∞ n=0 fn converge uniformemente verso f e, in tal caso, si scrive f= +∞ ∑ fn uniformemente, n=0 se la successione (sn )n∈N delle somme parziali è uniformemente convergente verso f . ∑+∞ Pertanto, n=0 fn converge uniformemente verso f se e solo se è soddisfatta la condizione seguente ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν ∀ x ∈ X : f (x) − n ∑ fk (x) ≤ ε , k=0 che può essere scritta anche al seguente modo ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : sup f (x) − x∈X n ∑ fk (x) ≤ ε , k=0 la quale a sua volta è equivalente a lim sup f (x) − n→+∞ x∈X n ∑ fk (x) = 0 ; k=0 Da quanto visto sulla convergenza di successioni di funzioni, consegue evidentemente che una serie di funzioni uniformemente convergente risulta anche convergente. Le nozioni di convergenza e di convergenza uniforme non sono tuttavia equivalenti, come si riconosce con qualche semplice esempio. ◃ Si consideri, per ogni n ∈ N, la funzione reale fn : [0, 1] → R definita ponendo, per ogni x ∈ [0, 1[, fn (x) := xn e sia f : [0, 1[→ R definita ponendo, per ogni x ∈ [0, 1[, f (x) := 1/(1 − x). 11.3 Serie di funzioni 321 ∑n Fissato x ∈ [0, 1[, risulta limn→+∞ |f (x) − k=0 fk (x)| = 0 e pertanto la serie di termine generale fn converge verso f puntualmente nell’intervallo [0, 1[. Poichè, per ogni n ∈ N, sup f (x) − x∈[0,1[ n ∑ fk (x) = sup x∈[0,1[ k=0 1 − xn+1 xn+1 1 − = sup = +∞ , 1−x 1−x x∈[0,1[ 1 − x la serie di termine generale fn non può convergere uniformemente verso f in [0, 1[. Tuttavia, fissato un elemento a ∈ [0, 1[, si riconosce che la convergenza della serie è uniforme nell’intervallo [0, a]. Infatti, in questo caso risulta sup x∈[0,a] f (x) − n ∑ xn+1 an+1 = , 1−a x∈[0,a] 1 − x fk (x) = sup k=0 in quanto la funzione xn+1 /(1 − x) è strettamente crescente in [0, a] e quindi assume il massimo in a. Poiché limn→+∞ an+1 /(1 − a) = 0, è soddisfatta la condizione di convergenza uniforme in [0, a]. Dal teorema di inversione dei limiti e dai teoremi di passaggio al limite per le successioni di funzioni uniformemente convergenti, si ottengono i seguenti risultati, la cui dimostrazione si ottiene in ogni caso da quella già vista per le successioni di funzioni considerando la successione delle somme parziali della serie assegnata. Teorema 11.3.1 (Teorema di inversione dei limiti per le serie) Siano X un sottoinsieme non vuoto di R, x0 un punto di accumulazione per X ed (fn )n∈N una successione di funzioni reali definite in X. Si supponga che ∑+∞ i) La serie n=0 fn converge uniformemente verso una funzione f : X → R; ii) Per ogni n ∈ N, risulta lim f (x) = ℓn ∈ R; x→x0 Allora la serie numerica +∞ ∑ ℓn è convergente e posto ℓ := n=0 +∞ ∑ ℓn , risulta n=0 lim f (x) = ℓ. x→x0 Nelle ipotesi del risultato precedente, si ha lim x→x0 +∞ ∑ n=0 fn (x) = lim f (x) = ℓ = x→x0 +∞ ∑ n=0 ℓn = +∞ ∑ n=0 lim fn (x) . x→x0 Capitolo 11: Successioni e serie di funzioni 322 Teorema 11.3.2 Siano X un sottoinsieme di R, x0 ∈ X un punto di accumulazione per X ed (fn )n∈N una successione ∑+∞ di funzioni reali definite in X e continue nel punto x0 . Se la serie n=0 fn converge uniformemente verso una funzione f : X → R, allora anche f risulta continua nel punto x0 . Teorema 11.3.3 (Teorema di integrazione termine a termine) Siano a, b ∈ R con a < b ed (f∑ n )n∈N una successione di funzioni reali +∞ continue in [a, b] tali che la serie n=0 fn sia uniformemente convergente verso una funzione f : [a, b] → R. Allora f è integrabile in [a, b] ed inoltre ∫ b f (x) dx = a +∞ ∫ ∑ b fn (x) dx . a n=0 Nelle ipotesi del teorema precedente, si ha +∞ ∫ ∑ n=0 ∫ b fn (x) dx = a +∞ b∑ fn (x) dx . a n=0 Teorema 11.3.4 (Teorema di derivazione termine a termine) Siano a, b ∈ R con a < b ed (fn )n∈N una successione di funzioni reali derivabili e con derivata continua in [a, b]. Si supponga che ∑+∞ ′ i) La serie n=0 fn è uniformemente convergente verso una funzione g : [a, b] → R. ∑+∞ ii) Esiste x0 ∈ [a, b] tale che la serie numerica n=0 fn (x0 ) sia convergente. ∑+∞ Allora, la serie n=0 fn è uniformemente convergente e, denotato con ∑+∞ f := n=0 fn il suo limite uniforme, si ha che f è derivabile in [a, b] e f ′ = g. Anche ora nelle ipotesi del teorema precedente si ha ( +∞ ) +∞ ∑ ∑ D fn = D(fn ) . n=0 n=0 ◃ Si conclude la presente sezione introducendo alcune nozioni frequentemente utilizzate nello studio della convergenza delle serie di funzioni. ◃ Sia (fn )n∈N una successione ∑+∞di funzioni reali definite in un insieme X. Si dice che la serie di funzioni n=0 fn di termine generale fn è assolutamente 11.3 Serie di funzioni 323 convergente ∑+∞ (puntualmente oppure rispettivamente uniformemente) se la serie n=0 |fn | di termine generale |fn | è convergente (puntualmente oppure rispettivamente uniformemente) (in X). ◃ Ovviamente ogni serie di funzioni assolutamente convergente (puntualmente oppure rispettivamente uniformemente) risulta convergente (puntualmente oppure rispettivamente uniformemente), mentre il viceversa non vale. ◃ Sia (fn )n∈N una successione di funzioni reali limitate definite in un insieme X e si ponga che, per ogni n ∈ N, ∥fn ∥ := supx∈X |fn (x)|. Si dice che ∑+∞ la serie di funzioni n=0 fn di termine generale fn è totalmente convergente ∑+∞ se la serie numerica n=0 ∥fn ∥ è convergente. ◃ (Criterio di Weierstrass per∑la totale convergenza) Si riconosce facil+∞ mente che una serie di funzioni n=0 fn è totalmente convergente se e solo se esiste una successione (an )n∈N di numeri reali (positivi) tale che la serie ∑+∞ numerica n=0 an sia convergente ed inoltre, per ogni n ∈ N e per ogni x ∈ X, risulti |fn (x)| ≤ an . ◃ Ogni serie di funzioni totalmente convergente risulta anche uniformemente convergente. ∑ Si ricorda innanzitutto che una serie +∞ n=0 an è convergente se e solo se la successione (sn )n∈N delle sue somme parziali è convergente e quindi se e solo se (sn )n∈N verifica la condizione di Cauchy, che può essere scritta al modo seguente ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N : |sn+p − sn | ≤ ε , ∑ ∑n+p ∑n e da ciò, tenendo presente che n+p k=0 ak = sn+p − sn , si ottiene k=n+1 ak = k=0 ak − la condizione n+p ∑ ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N : ak ≤ ε . k=n+1 ∑+∞ X → R converge punConseguentemente, una serie di funzioni n=0 fn , con fn : ∑ +∞ tualmente (in X) se e solo se per ogni x ∈ X la serie numerica n=0 fn (x) verifica la condizione di Cauchy precedente, e cioè se e solo se n+p ∑ ∀ x ∈ X ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N : fk (x) ≤ ε . k=n+1 L’indice ν previsto ∑+∞ sopra dipende da x ∈ X oltre che da ε > 0. La convergenza uniforme della serie n=0 fn sarà conseguentemente caratterizzata dalla seguente condizione di Cauchy n+p ∑ ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N ∀ x ∈ X : fk (x) ≤ ε . k=n+1 A questo punto, la condizione di Cauchy per la serie seguente ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N : ∑+∞ n=0 n+p ∑ k=n+1 ∥fn ∥ si esprime al modo ∥fk ∥ ≤ ε , 324 Capitolo 11: Successioni e serie di funzioni e da ciò si ottiene la condizione ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν , ∀ p ∈ N , ∀ x ∈ X : n+p ∑ k=n+1 fk (x) ≤ n+p ∑ |fk (x)| ≤ ε , k=n+1 che è la condizione di Cauchy per l’uniforme convergenza. 11.4 Serie di potenze Si considerano ora brevemente alcune serie di tipo particolare, ma di uso molto frequente. Siano x0 ∈ R ed (an )n∈N una successione di numeri reali. Si denomina serie di potenze di centro x0 e di termine generale an , n ∈ N, la seguente serie di funzioni +∞ ∑ an (x − x0 )n n=0 ∑+∞ (quindi, si considera la serie di funzioni n=0 fn , dove, per ogni n ∈ N, fn : R → R è definita ponendo fn (x) = an (x − x0 )n per ogni x ∈ R); se n = 0 si assume per convenzione (x − x0 )n = 1 anche quando x = x0 . Lo studio della convergenza di una serie di potenze è sostanzialmente basato sul seguente risultato di importanza fondamentale. Teorema 11.4.1 Siano x0 ∈ R (an )n∈N una successione di numeri reali e ∑e+∞ si consideri la serie di potenze n=0 an (x−x0 )n . Se la serie converge in un punto x1 ∈ R e se x2 ∈ R verifica la seguente condizione |x2 −x0 | < |x1 −x0 | (cioè la distanza di x2 da x0 è minore di quella di x1 da x0 ), allora la serie è assolutamente convergente anche nel punto x2 . Pertanto, la serie converge assolutamente nell’intervallo ]x0 − r1 , x0 + r1 [, con r1 := |x1 − x0 |. Inoltre, la convergenza è totale (e quindi uniforme) in ogni intervallo [x0 − r, x0 + r], con 0 < r < |x1 − x0 |. ∑+∞ n Dimostrazione. Poichè la serie numerica n=0 an (x1 − x0 ) è convergente, la succesn sione (an (x1 − x0 ) )n∈N deve essere infinitesima, e conseguentemente limitata.1 Quindi, deve esistere M ∈ R tale che, per ogni n ∈ N, si abbia |an (x1 − x0 )n | ≤ M . Inoltre, per ogni n ∈ N, risulta |an (x2 − x0 )n | = |an (x1 − x0 )n | |x2 − x0 |n x2 − x0 ≤M |x1 − x0 |n x1 − x0 n . ∑ n n A questo punto, si osserva che la serie +∞ n=0 |x2 −x0 | /|x1 −x0 | è convergente in quanto è una serie geometrica di ragione positiva e strettamente minore di 1, e quindi si può 1 In realtà, si potrebbe considerare l’ipotesi leggermente più lieve che la successione ∑+∞ n sia (an (x1 − x0 )n )n∈N sia limitata anziché supporre che la serie n=0 an (x1 − x0 ) convergente ed osservare, come appena dimostrato, che la convergenza della serie implica la limitatezza della successione (an (x1 − x0 )n )n∈N . 11.4 Serie di potenze 325 concludere di confronto delle serie∑ numeriche a termini positivi, anche ∑ che, per il criterio +∞ n n la serie +∞ n=0 |an (x2 − x0 ) | è convergente e quindi n=0 an (x2 − x0 ) è assolutamente convergente. Per quanto riguarda l’ultima parte della tesi, sia 0 < r < |x1 − x0 |; allora, per quanto ∑+∞ n è convergente e, per ogni x ∈ [x − r, x + r], si ha dimostrato la serie 0 0 n=0 |an | r |an (x − x0 )n | ≤ |an | rn ; pertanto, la serie è totalmente convergente in [x0 − r, x0 + r]. ◃ Dalla proprietà precedente segue che l’insieme dei numeri reali per i quali una serie di potenze risulta convergente costituisce un intervallo di R con centro x0 ; tale intervallo potrebbe in generale anche ridursi al solo punto x0 oppure coincidere con tutto R e, negli altri casi, potrebbe contenere o meno uno o entrambi gli estremi. Per studiare in modo l’intervallo di convergenza di ∑+∞più approfondito n una serie di potenze a (x − x ) , conviene introdurre il raggio di 0 n=0 n convergenza R di una serie di potenze, definito nel modo seguente { } +∞ ∑ R := sup ρ ∈ [0, +∞[ | an ρn è convergente . (11.4.1) n=0 ∑+∞ ◃ Si consideri una serie di potenze n=0 an (x − x0 )n e si denoti con R il suo raggio di convergenza. Si ha ovviamente R ≥ 0 e può risultare eventualmente R = +∞. Inoltre, dalla definizione di R e dal Teorema 11.4.1, si ottengono subito le seguenti proprietà di R: 1. Se R = 0, la serie converge nel punto x0 e non converge in alcun altro numero reale. 2. Se R = +∞, la serie converge puntualmente in ogni punto di R ed inoltre la convergenza è uniforme in ogni intervallo limitato di R. 3. Se 0 < R < +∞, la serie converge in ogni punto dell’intervallo aperto ]x0 − R, x0 + R[, e non converge nei punti esterni all’intervallo chiuso [x0 − R, x0 + R]; nei punti x0 − R e x0 + R, non si può dire nulla in generale e quindi le serie +∞ ∑ an (x0 − R − x0 )n = n=0 +∞ ∑ (−1)n an Rn , n=0 +∞ ∑ n=0 an (x0 + R − x0 ) = n +∞ ∑ an R n n=0 devono essere esaminate caso per caso. Inoltre, la convergenza della serie è uniforme in ogni intervallo chiuso [x0 − r, x0 + r], con r < R. Capitolo 11: Successioni e serie di funzioni 326 Il Teorema di Abel, di cui per brevità non si riporta la dimostrazione, asserisce che, se 0 < R < +∞ e se la serie di potenze converge anche nell’estremo x0 − R (rispettivamente, x0 + R), allora la convergenza è uniforme in ogni intervallo [x0 − R, x0 + r] (rispettivamente, [x0 − r, x0 + R]), con 0 < r < R. Se la serie di potenze converge in entrambi gli estremi, la convergenza risulta uniforme in tutto l’intervallo [x0 − R, x0 + R]. ◃ Viste le proprietà precedenti, lo studio di una serie di potenze risulta quasi completamente determinato dalla conoscenza del suo raggio di convergenza. Per determinare il raggio di convergenza di una serie di potenze, si possono usare i seguenti due criteri, che traggono spunto dagli analoghi criteri per le serie numeriche. ∑+∞ 1. (Criterio del rapporto) Assegnata la serie di potenze n=0 an (x − x0 )n , si supponga che esista il seguente limite |an+1 | =ℓ; n→+∞ |an | lim Allora, si ha +∞ , 0, R= 1, ℓ ℓ=0; ℓ = +∞ ; (11.4.2) ℓ ∈]0, +∞[ . 2. (Criterio della radice), Assegnata la serie di potenze x0 )n si supponga che esista il seguente limite √ lim n |an | = ℓ ; ∑+∞ n=0 an (x − n→+∞ Allora, anche in questo caso, R viene dato dalla (11.4.2). Dimostrazione. Infatti, per quanto riguarda la prima proprietà, risulta lim n→+∞ |an+1 | |an+1 (x − x0 )n+1 | = lim |x − x0 | = ℓ |x − x0 | , n→+∞ |an | |an (x − x0 )n | e quindi, dal criterio del rapporto per le serie numeriche, segue che la serie è (assolutamente) convergente per ℓ |x − x0 | < 1 (cioè |x − x0 | < 1/ℓ se ℓ ∈]0, +∞[) ed è assolutamente divergente positivamente per ℓ |x − x0 | > 1. Dalle proprietà del raggio di convergenza segue allora la tesi in ognuno dei casi previsti. La dimostrazione della seconda parte è simile tenendo presente che √ √ lim n |an (x − x0 )n | = lim n |an | |x − x0 | = ℓ |x − x0 | , n→+∞ n→+∞ 11.4 Serie di potenze 327 e applicando il criterio della radice per le serie numeriche anzichè quello del rapporto. ◃ Nel caso in cui nessuno dei due limiti previsti nel criterio del rapporto e della radice esista, si può riconoscere che R viene comunque dato dalla (11.4.2) con √ ℓ := lim sup n |an | . n→+∞ ◃ Seguono ora alcuni esempi. 1. Si consideri la serie geometrica di potenze +∞ ∑ xn . n=0 In questo caso an = 1 per ogni n ∈ N; si può allora applicare facilmente sia il criterio della radice che del rapporto e si deduce che R = 1; quindi la serie converge per |x| < 1 e non converge per |x| > 1; nei punti 1 e −1 si ottengono le serie +∞ ∑ 1, n=0 +∞ ∑ (−1)n n=0 che non sono convergenti (la prima è divergente positivamente in quanto a termini positivi). Pertanto si conclude che la serie converge puntualmente nell’intervallo ] − 1, 1[ e uniformemente in ogni intervallo [−a, a] con 0 < a < 1. In questo caso è possibile calcolare anche la somma della serie che, per le proprietà della serie geometrica è data da +∞ ∑ 1 xn = , −1 < x < 1 . 1−x n=0 2. Si consideri la serie di potenze +∞ n ∑ 3 (x − 1)n . 3 n n=1 In questo caso an = 3n /n3 per ogni n ≥ 1 e x0 = 1; applicando il criterio del rapporto, si ottiene 3n+1 n3 =3 n→+∞ (n + 1)3 3n lim Capitolo 11: Successioni e serie di funzioni 328 e pertanto R = 1/3; quindi la serie converge per |x − 1| < 1/3 (cioè nell’intervallo ]1−1/3, 1+1/3[=]2/3, 4/3[) e non converge per |x−1| > 1/3. Nel punto 2/3 si ottiene la serie )n ∑ +∞ n ( +∞ ∑ 3 2 1 −1 = (−1)n 3 3 n 3 n n=1 n=1 che converge in quanto è una serie armonica generalizzata a segni alterni. Inoltre, nel punto 4/3 si ottiene la serie )n ∑ +∞ n ( +∞ ∑ 3 1 4 = − 1 3 n 3 n3 n=1 n=1 che è anch’essa convergente in quanto è una serie armonica generalizzata con esponente maggiore di 1. In conclusione la serie converge in [2/3, 4/3]. 3. Si consideri la serie +∞ ∑ nn (x + 2)n . n=1 Dal criterio della radice, si ha lim n→+∞ √ n nn = lim n = +∞ n→+∞ e quindi R = 0. Pertanto, la serie converge solo nel punto iniziale −2. 4. Si consideri la serie +∞ ∑ (x − 1)2n . n=1 In questo caso i coefficienti an della serie di potenze sono dati da { an := 0, 1, n dispari ; n pari ; pertanto il criterio del rapporto e quella radice non possono essere applicati; poiché i coefficienti valgono alternativamente 0 e 1 si riconosce √ tuttavia facilmente che lim supn→+∞ n an = 1 e quindi il raggio di convergenza della serie assegnata è 1. 11.5 Serie ottenute per derivazione ed integrazione 11.5 329 Serie ottenute per derivazione ed integrazione Sia assegnata una serie di potenze +∞ ∑ an (x − x0 )n . n=0 Allora la serie +∞ ∑ n an (x − x0 ) n−1 = n=1 +∞ ∑ (n + 1) an+1 (x − x0 )n n=0 ∑+∞ n viene denominata serie ottenuta da per derivazione, n=0 an (x − x0 ) mentre la serie +∞ ∑ an (x − x0 )n+1 n + 1 n=0 ∑+∞ viene denominata serie ottenuta da n=0 an (x − x0 )n per integrazione. Si riconosce facilmente che √ √ √ an n n lim sup |an | = lim sup |(n + 1) an+1 | = lim sup n . n+1 n→+∞ n→+∞ n→+∞ Pertanto, la serie ottenuta per derivazione e quella ottenuta per integrazione hanno lo stesso raggio di convergenza della serie assegnata. Tuttavia l’insieme di convergenza delle serie potrebbe differire in quanto quella ottenuta per integrazione potrebbe convergere anche in un estremo in cui la serie assegnata non converge e analogamente quest’ultima potrebbe convergere anche in un estremo in cui la serie ottenuta per derivazione non converge. Invece, se una serie converge in un estremo dell’intervallo di convergenza quella da essa ottenuta per integrazione è anch’essa convergente nello stesso estremo (in quanto ha gli stessi termini divisi per n + 1). ◃ Ad esempio, la serie ottenuta per derivazione dalla serie geometrica è data da +∞ ∑ (n + 1) xn n=0 che converge in ] − 1, 1[, mentre quella ottenuta per integrazione dalla serie geometrica è data da +∞ ∑ 1 xn+1 n + 1 n=0 Capitolo 11: Successioni e serie di funzioni 330 che converge questa volta in [−1, 1[. ∑+∞ ◃ Si consideri una serie di potenze n=0 an (x − x0 )n e sia R il suo raggio di convergenza; supposto R > 0, si può considerare la funzione somma f : I → R definita nell’intervallo di convergenza della serie. Applicando il Teorema 11.3.2, si ottiene subito che f è sempre una funzione continua nell’intervallo ]x0 − R, x0 + R[. Come conseguenza del teorema di Abel (vedasi la discussione delle proprietà del raggio di convergenza) e del Teorema 11.3.2, se uno degli estremi dell’intervallo I di convergenza della serie appartiene ad I, allora la funzione somma è continua in tale estremo. Inoltre, dal Teorema 11.3.4 di derivazione termine a termine, si ricava che la funzione somma f è infinite volte derivabile in ]x0 −R, x0 +R[ e le sue derivate si possono ottenere dalle serie ottenute per derivazione da quella assegnata. Infine, dal Teorema 11.3.3 di integrazione termine a termine, segue che, per ogni x ∈]x0 − R, x0 + R[, si ha ∫ +∞ x∑ x0 n=0 an (t − x0 ) dt = n +∞ ∑ n=0 ∫ x (t − x0 )n dt = an x0 +∞ ∑ an (x − x0 )n+1 , n + 1 n=0 e tale uguaglianza vale anche per x = x0 − R oppure per x = x0 + R se la serie di potenze converge in tali punti. 11.6 Serie di Taylor La formula di Taylor consente di approssimare una funzione sufficientemente regolare (cioè derivabile un certo numero di volte) in un intorno di un fissato punto x0 mediante opportuni polinomi che dipendono dal valore della funzione e da quello delle sue derivate nel punto x0 . Si vuole ora approfondire tale proprietà utilizzando le serie di potenze. ◃ Sia I un intervallo di R e si consideri una funzione f : I → R derivabile infinite volte in un punto x0 interno ad I. La serie di potenze +∞ (n) ∑ f (x0 ) (x − x0 )n , n! n=0 (11.6.1) viene denominata serie di Taylor di f di punto iniziale x0 . Inoltre, si dice che f è sviluppabile in serie di Taylor in I se la serie di potenze (11.6.1) converge puntualmente verso f in I.2 Una funzione 2 Dalle proprietà delle serie di potenze, la convergenza sarà automaticamente uniforme in ogni intervallo chiuso e limitato contenuto in I. 11.6 Serie di Taylor 331 sviluppabile in serie di Taylor in un intorno di ogni punto interno ad I viene denominata funzione analitica reale. ◃ In generale non è detto che una funzione infinite volte derivabile in un punto x0 sia sviluppabile in serie di Taylor in un intorno di tale punto. Ad esempio, si consideri la funzione f : R → R cosı̀ definita { 2 e−1/x , x ̸= 0 , f (x) := 0, x=0. Allora, è facile verificare che f è infinite volte derivabile in R e tutte le sue derivate sono nulle nel punto 0; pertanto, la serie di Taylor di f di punto iniziale 0 è la funzione nulla e coincide con f solamente nel punto 0. Quindi f non è sviluppabile in serie di Taylor in un intorno del punto 0. Si vuole ora fornire un semplice criterio di sviluppabilità in serie di Taylor. Esso è basato sul fatto che se una funzione f : I → R è infinite volte derivabile in I, si può applicare la formula di Taylor di ogni ordine in un punto x0 interno ad I e si ha, per ogni x ∈ I, f (x) = n ∑ f (k) (x0 ) k=0 k! (x − x0 )k + f (n+1) (ξ) (x − x0 )n+1 , (n + 1)! dove ξ ∈ I è interno all’intervallo di estremi x0 ed x e dipende da x oltre che da n. Poichè la somma nella formula precedente coincide con quella parziale della serie di Taylor di f , è chiaro che, se il resto della formula di Taylor tende uniformemente a 0, allora f risulta sviluppabile in serie di Taylor in I. Si ha pertanto il seguente criterio. Teorema 11.6.1 (Criterio di sviluppabilità in serie di Taylor) Sia f : I → R una funzione infinite volte derivabile in I e si supponga che le sue derivate verifichino la seguente condizione ∃ c > 0 , ∃ M > 0 t.c. ∀ n ∈ N ∀ x ∈ I : |f (n) (x)| ≤ c M n . (11.6.2) Allora f è sviluppabile in serie di Taylor in I. Dimostrazione. Da quanto osservato preliminarmente, considerato x0 interno ad I, per ogni x ∈ I e per ogni n ∈ N, risulta f (x) = n ∑ f (k) (x0 ) f (n+1) (ξ) (x − x0 )k + (x − x0 )n+1 , k! (n + 1)! k=0 con ξ ∈ I interno all’intervallo di estremi x0 ed x. Denotata con sn la somma parziale n-esima della serie di Taylor di f di punto iniziale x0 , dalla formula precedente e dalla condizione (11.6.2), segue |f (x) − sn (x)| = M n+1 |f (n+1) (ξ)| |x − x0 |n+1 ≤ c |x − x0 |n+1 . (n + 1)! (n + 1)! Capitolo 11: Successioni e serie di funzioni 332 Si consideri ora la serie +∞ ∑ n=0 M n+1 |x − x0 |n+1 ; (n + 1)! si ha M n+2 (n + 1)! M = lim |x − x0 | = 0 n→+∞ n + 2 (n + 2)! |x − x0 |n+2 M n+1 |x − x0 |n+1 e quindi, dal criterio del rapporto, essa è convergente; da ciò segue che il termine generale n-esimo deve essere infinitesimo, cioè lim n→+∞ lim n→+∞ M (n+1) |x − x0 |n+1 = 0 , (n + 1)! e quindi anche lim |f (x) − sn (x)| = 0 , n→+∞ da cui la tesi. La condizione (11.6.2) è sicuramente soddisfatta nel caso in cui le derivate della funzione f siano equilimitate, cioè ∃ M > 0 t.c. ∀ n ∈ N ∀ x ∈ I : |f (n) (x)| ≤ M . In base al risultato precedente, si può ora considerare lo sviluppo in serie di Taylor di alcune funzioni elementari. 11.6.1 Funzione esponenziale Sia a > 0 tale che a ̸= 1 e si consideri la funzione esponenziale expa di base a. Essa è infinite volte derivabile e, per ogni n ∈ N ed x ∈ R, si ha |D(n) expa x| = | logn a| expa x . Pertanto, fissato un intervallo [−r, r] ⊂ R, risulta, per ogni x ∈ [−r, r], |D(n) expa x| ≤ c M n , con M := | log a| e c := max{expa (−r), expa r}. Dal Teorema 11.6.1 e dall’arbitrarietà di r > 0, segue allora che la funzione esponenziale è sviluppabile in serie di Taylor di punto iniziale x0 ∈ R (x0 arbitrario) in tutto R e uniformemente in ogni intervallo limitato. In particolare, considerando x0 = 0, si ottiene, per ogni x ∈ R, expa x = 1 + log a x + log2 a +∞ ∑ x2 x3 xn + log3 a + ··· = . logn a 2 6 n! n=0 Considerando la base di Nepero, la formula precedente diventa, per ogni x ∈ R, +∞ n ∑ x3 x x2 + + ··· = . exp x = 1 + x + 2 6 n! n=0 11.6 Serie di Taylor 11.6.2 333 Funzione logaritmo Dalla serie geometrica si ricava subito il seguente sviluppo in serie, per ogni x ∈] − 1, 1[, +∞ ∑ 1 2 3 = 1 − x + x − x + ··· = (−1)n xn . 1+x n=0 (11.6.3) Allora, integrando termine a termine tra 0 ed x, dal Teorema 11.3.3 si ottiene, per ogni x ∈] − 1, 1[, log(1 + x) = x − +∞ ∑ x2 x3 x4 xn+1 + − + ··· = (−1)n . 2 3 4 n+1 n=0 Mentre nel punto −1 la serie precedente risulta divergente, nel punto 1 risulta invece convergente e pertanto, dal Teorema 11.3.2, si ottiene la somma della serie armonica a segni alterni log 2 = +∞ ∑ (−1)n n=0 11.6.3 1 . n+1 Funzioni seno e coseno Poiché le funzioni seno e coseno sono infinite volte derivabili e poiché, per ogni n ∈ N ed x ∈ R, |D(n) sin x| ≤ 1 , |D(n) cos x| ≤ 1 , (infatti, procedendo per induzione completa su n, si riconosce facilmente che D(n) sin x = sin(x + nπ/2) e analogamente D(n) cos x = cos(x + nπ/2)), dal Teorema 11.6.1, si ricava che esse sono sviluppabili in serie di Taylor di punto iniziale x0 ∈ R (x0 arbitrario) in tutto R. In particolare, considerando x0 = 0, si ottiene il seguente sviluppo in serie delle funzioni seno e coseno, valido per ogni x ∈ R e uniformemente in ogni intervallo limitato sin x = x − cos x = 1− +∞ ∑ x3 x5 x2n+1 + − ··· = (−1)n , 3! 5! (2n + 1)! n=0 +∞ ∑ x4 x2n x2 + − ··· = (−1)n . 2! 4! (2n)! n=0 Capitolo 11: Successioni e serie di funzioni 334 11.6.4 Funzione arcotangente Considerato x2 al posto di x nella (11.6.3), si ottiene, per ogni x ∈] − 1, 1[, +∞ ∑ 1 2 4 6 = 1 − x + x − x + · · · = (−1)n x2n . 1 + x2 n=0 Integrando termine a termine tra 0 ed x, dal Teorema 11.3.3 si ricava, per ogni x ∈] − 1, 1[, arctan x = x − +∞ ∑ x5 x7 x3 x2n+1 + − + ··· = . (−1)n 3 5 7 2n + 1 n=0 La serie converge anche negli estremi −1 ed 1 e pertanto la convergenza è uniforme in [−1, 1]. Dal Teorema 11.3.2, si ottiene allora il seguente sviluppo in serie del numero π +∞ ∑ π 1 1 1 1 = arctan 1 = (−1)n = 1 − + − + ... . 4 2n + 1 3 5 7 n=0 11.6.5 La serie binomiale Si fissi α ∈ R e la funzione fα (x) := (1 + x)α , definita per x ∈] − 1, ∞[ (se α > 0, la funzione è definita anche in −1 e fα (−1) = 0). Essa è derivabile infinite volte in ] − 1, +∞[ e si ha Dn (1 + x)α = α(α − 1) · · · (α − n + 1) (1 + x)α−n , x > −1 . La formula precedente suggerisce l’introduzione del coefficiente binomiale generalizzato ( ) n=0, 1, α := (11.6.4) α(α − 1) · · · (α − n + 1) , n n ̸= 0 , n! il quale ha molte proprietà analoghe a quelle dei coefficienti binomiali e che si omettono per brevità. La serie di Taylor di fα di punto iniziale 0 è data da +∞ ( ) ∑ α n x . (11.6.5) n n=0 Tale serie ha raggio di convergenza 1 in quanto, dal criterio del rapporto, ( α ) n−α α · · · (α − n + 1)(α − n) n! n+1 (α) = lim =1. lim = lim n→+∞ n→+∞ n + 1 n→+∞ α · · · (α − n + 1) (n + 1)! n 11.6 Serie di Taylor 335 Pertanto, la serie converge puntualmente in ] − 1, 1[ ed uniformemente in ogni intervallo [−r, r] con 0 < r < 1. ◃ Per quanto riguarda la convergenza della serie binomiale (11.6.5) nei punti estremi, si ha quanto segue 1. Se α ≤ −1, la serie binomiale non converge in alcuno dei due estremi. 2. Se −1 < α < 0, la serie converge (non assolutamente) in 1 ma non in −1. 3. Se α > 0, la serie converge (anche assolutamente) in entrambi gli estremi. Per brevità ci si limita ad osservare che in entrambi gli estremi dal criterio di Raabe segue la convergenza assoluta nel caso α > 0 e l’assoluta divergenza nel caso α < 0. Se ( ) non è infinitesima e α ≤ −1, la successione dei coefficienti binomiali generalizzati α n pertanto la serie in esame non può convergere. Infine, se −1 < α < 0, la convergenza in 1 segue dal criterio di Leibnitz. ◃ Si studia ora la somma della serie (11.6.5). Si denoti per brevità con g la funzione somma della serie (11.6.5); dalle proprietà delle serie di potenze ed applicando il Teorema 11.3.4 di derivazione termine a termine, per ogni x ∈] − 1, 1[ g ′ (x) = = +∞ ∑ n α(α − 1) · · · (α − n + 1) n−1 x n! n=1 +∞ ∑ α(α − 1) · · · (α − n + 1) n−1 x (n − 1)! n=1 +∞ ∑ (α − 1) · · · (α − 1 − n + 1) n x n! n=0 ) +∞ ( ∑ α−1 n = α x ; n n=0 = α da ciò si ottiene, utilizzando le proprietà dei coefficienti binomiali genera- Capitolo 11: Successioni e serie di funzioni 336 lizzati3 ′ (1 + x) g (x) = α ) +∞ ( ∑ α−1 n=0 +∞ ( ∑ n n x +α ) +∞ ( ∑ α−1 n=0 +∞ ( ∑ ) n xn+1 ) α−1 n α−1 n = α x +α x n n−1 n=0 n=1 ( ) ( )) ) +∞ (( ∑ α−1 α−1 = α 1+ + xn n n − 1 n=1 ( ) +∞ ( ) ∑ α n = α 1+ x = α g(x) . n n=1 Quindi la funzione g è soluzione dell’equazione differenziale lineare omogenea α y′ = y, 1+x la quale ammette come soluzione generale y = c(1 + x)α ; poiché g verifica la condizione iniziale g(0) = 1 deve essere c = 1 e quindi g(x) = (1 + x)α . Pertanto, la serie binomiale (11.6.5) converge verso la funzione fα nell’intervallo ] − 1, 1[. 3 Nell’ultima uguaglianza si è utilizzata la proprietà (α − 1) n + (α − 1 ) n−1 = (α) , n che è ovvia se n = 1 mentre per ogni n ≥ 2 segue da (α − 1) n + (α − 1) n−1 = = = = (α − 1)(α − 2) · · · (α − 1 − n + 1) n! (α − 1)(α − 2) · · · (α − 1 − n + 2) + (n − 1)! (α − 1)(α − 2) · · · (α − n) (α − 1)(α − 2) · · · (α − n + 1) + n! (n − 1)! (α − 1)(α − 2) · · · (α − n + 1)(α − n + n) n! ( α) . n 11.7 Serie di Fourier 11.6.6 337 La funzione arcoseno Considerando α = −1/2 nella serie binomiale (11.6.5), si ottiene in particolare, per ogni x ∈] − 1, 1], 1 √ 1+x ) +∞ ( ∑ −1/2 n x = n n=0 = 1+ = 1+ +∞ ∑ n=1 +∞ ∑ (−1)n 1 · 3 · · · (2n − 1) n x 2n n! (−1)n (2n − 1)!! n x ; (2n)!! n=1 scrivendo −x2 al posto di x +∞ ∑ 1 (2n − 1)!! 2n √ =1+ x . 2 (2n)!! 1−x n=1 Integrando termine a termine tra 0 ed x quest’ultima relazione, si ottiene, per ogni x ∈] − 1, 1[, arcsin x = x + +∞ ∑ (2n − 1)!! x2n+1 . (2n)!! (2n + 1) n=1 Si può dimostrare che la serie a secondo membro converge anche negli estremi −1 ed 1 e pertanto, considerando ad esempio x = 1, si ottiene il seguente ulteriore sviluppo in serie del numero π ( ) +∞ ∑ (2n − 1)!! π =2 1+ . (2n)!! (2n + 1) n=1 11.7 Serie di Fourier Un ulteriore tipo di serie di funzioni frequentemente utilizzata per l’approssimazione di funzioni periodiche è costituito dalle serie di Fourier delle quali ci si vuole occupare brevemente. Si denomina polinomio trigonometrico di ordine n ogni funzione T : R → R definita ponendo a0 ∑ + (ak cos kx + bk sin kx) , 2 n T (x) := k=1 x∈R, Capitolo 11: Successioni e serie di funzioni 338 con a0 , . . . , an ∈ R e b1 , . . . , bn costanti reali assegnate e |an | + |bn | > 0 (per n = 0, si assume per convenzione b0 = 0). Una serie trigonometrica è una serie di funzioni del tipo a0 ∑ + (an cos nx + bn sin nx) , 2 n=1 +∞ x∈R. (11.7.1) Quindi le somme parziali di una serie trigonometrica sono polinomi trigonometrici di ordine minore o uguale ad n. Una serie trigonometrica (11.7.1) si dice serie di coseni (rispettivamente, serie di seni ) se, per ogni n ≥ 1, si ha bn = 0 (rispettivamente se, per ogni n ∈ N, si ha an = 0). Lo studio di una serie trigonometrica può essere effettuato in un intervallo di ampiezza 2π in quanto il termine generale n-esimo della serie è sempre una funzione periodica di periodo 2π. Se la serie (11.7.1) converge puntualmente in un intervallo di ampiezza 2π, si può pertanto considerare la funzione somma f : R → R definita ponendo, per ogni x ∈ R, a0 ∑ f (x) := + (an cos nx + bn sin nx) ; 2 n=1 +∞ (11.7.2) tale funzione somma risulta essere sempre 2π-periodica e, se la convergenza è uniforme, essa è anche continua. Un semplice criterio che fornisce la convergenza totale (e quindi uniforme) della serie è dato dalla condizione +∞ ∑ (|an | + |bn |) . n=1 Per ottenere ulteriori criteri, si premettono alcune considerazioni. Si supponga che la serie trigonometrica (11.7.1) converga uniformemente verso una funzione f : R → R. Allora, integrando termine a termine l’uguaglianza (11.7.2) tra −π e π, si ottiene 1 a0 = π ∫ π f (t) dt , −π 11.7 Serie di Fourier 339 e inoltre, per ogni m ∈ N, moltiplicando entrambi i membri della (11.7.2) per cos mx, integrando tra −π e π e tenendo presenti le formule { ∫ π 0, m ̸= n , cos mx cos nx dx = π, m=n, −π { ∫ π 0, m ̸= n , sin mx sin nx dx = π , m =n, −π ∫ π sin mx cos nx dx = 0 , −π si ricava anche ∫ π 1 am = f (t) cos mt dt , π −π bm 1 = π ∫ π f (t) sin mt dt , −π m≥1. (11.7.3) ◃ Si supponga ora che sia assegnata una funzione 2π-periodica f : R → R. Se f è assolutamente integrabile in [−π, π], tutte le funzioni f (x) cos mx e f (x) sin mx sono integrabili in [−π, π] (infatti |f (x) cos mx| ≤ |f (x)| e |f (x) sin mx| ≤ |f (x)|) e quindi si possono considerare i coefficienti am e bm precedenti. Tali coefficienti vengono denominati coefficienti di Fourier di f e la serie 1 2π ∫ π f (t) dt + −π ) +∞ ((∫ π 1∑ f (t) cos nt dt cos nx π n=1 −π (∫ π ) ) + f (t) sin nt dt sin nx , −π (11.7.4) x∈R, viene denominata serie di Fourier di f . Inoltre, si dice che f è sviluppabile in serie di Fourier se la serie (11.7.4) è convergente ed ha per somma f (x) in ogni punto x ∈ R in cui f è continua. ◃ Se f è pari (rispettivamente, dispari), le funzioni f (x) cos mx sono anch’esse pari (rispettivamente, dispari) mentre le funzioni f (x) sin mx sono dispari (rispettivamente, pari) e pertanto si ha bm = 0 per ogni m ≥ 1 (rispettivamente, am = 0 per ogni m ≥ 0). Quindi la serie di Fourier di una funzione pari (rispettivamente, dispari) è una serie di soli coseni (rispettivamente, seni). ◃ Se I è un intervallo di R, una funzione f : I → R si dice continua a tratti se ammette al più un numero finito di punti di discontinuità, tutte eliminabili o di prima specie; pertanto, se f è continua a tratti, esiste un sottoinsieme finito H ⊂ I tale che f è continua in I r H e, per ogni x0 ∈ H, 340 Capitolo 11: Successioni e serie di funzioni esiste ed è finito limx→x− f (x) se x0 > inf I ed esiste ed è finito limx→x+ f (x) 0 0 se x0 < sup I. Per brevità, nel seguito, si pone f (x0 −) := lim f (x) , x→x− 0 f (x0 +) := lim f (x) . x→x+ 0 Inoltre, si dice che f : I → R è una funzione regolare a tratti se è continua a tratti ed inoltre è derivabile tranne al più in un un numero finito di punti, ognuno dei quali risulta di discontinuità di prima specie per f ′ . Una funzione 2π-periodica f : R → R viene denominata continua a tratti (rispettivamente, regolare a tratti ) se la sua restrizione all’intervallo [−π, π] risulta continua a tratti (rispettivamente, regolare a tratti). Si osserva che una funzione 2π-periodica e continua a tratti è sicuramente assolutamente integrabile e quindi se ne può considerare la serie di Fourier. Inoltre, se in più f è anche regolare a tratti, allora f ′ è una funzione continua a tratti e quindi si può considerare anche la serie di Fourier di f ′ . A questo punto si possono enunciare le seguenti proprietà delle serie di Fourier, di cui per brevità viene omessa la dimostrazione. Teorema 11.7.1 Sia f : R → R una funzione 2π-periodica. Allora, valgono le seguenti proprietà: 1. Se f è continua e se i suoi coefficienti di Fourier sono tutti nulli, allora f = 0. 2. Se f è continua e se la serie di Fourier di f è uniformemente convergente, allora f è sviluppabile in serie di Fourier. 3. Se f è regolare a tratti, allora la serie di Fourier di f converge puntualmente verso la funzione f˜ : R → R definita ponendo, per ogni x ∈ R, f (x+) + f (x−) f˜(x) := 2 e quindi f è sviluppabile in serie di Fourier. Inoltre, la convergenza è uniforme in ogni intervallo chiuso in cui f è continua. In particolare, se f è continua e regolare a tratti, allora la serie di Fourier di f converge uniformemente verso f . 4. Se f è regolare a tratti e se am e bm sono i suoi coefficienti di Fourier, allora la serie di Fourier di f ′ si ottiene derivando termine a termine 11.7 Serie di Fourier 341 la serie di Fourier di f e inoltre, denotati con a′m e b′m i coefficienti di Fourier di f ′ , si ha a′0 = 0 , a′m = m bm , b′m = −m am , m≥1. Analogamente, la funzione integrale F : R → R definita ponendo, per ogni x ∈ R, ∫ x( a0 ) F (x) := f (t) − dt ; (11.7.5) 2 0 è continua e regolare a tratti e pertanto la serie di Fourier di F converge uniformemente verso F . I coefficienti di Fourier di F si ottengono integrando termine a termine la serie di Fourier di f e quindi, denotati con Am e Bm i coefficienti di Fourier di F , si ha A0 = 2 +∞ ∑ bk k=1 k Am = − , bm , m Bm = am , m m≥1. (11.7.6) La definizione di F data nella (11.7.5) è necessaria per ottenere la continuità di F (considerando la condizione F (π) − F (−π) = 0). Inoltre il valore di A0 nella (11.7.6) segue dal fatto che dalla (11.7.5) deve essere F (0) = 0 e che F (0) = +∞ +∞ ∑ ∑ bk A0 A0 + (Ak cos 0 + Bk sin 0) = − . 2 2 k k=1 k=1 ◃ I risultati precedenti sono stati esposti per semplicità per funzioni 2πperiodiche. Se f : R → R è una funzione T -periodica, con T > 0, si ottengono risultati analoghi, tenendo presente che i coefficienti di Fourier di f sono in questo caso definiti da am bm = = 2 T 2 T ∫ ∫ T /2 f (t) cos 2πmt dt , T m≥0, f (t) sin 2πmt dt , T m≥1, −T /2 T /2 −T /2 e la serie di Fourier di f è data da ) +∞ ( 2πnt 2πnt a0 ∑ + an cos + bn sin , 2 T T n=1 x∈R. Capitolo 12 Calcolo differenziale in più variabili 12.1 Cenni sulla struttura metrica di Rn 12.1.1 Prodotti scalari e norme L’insieme Rn (n ≥ 1) delle n-ple di numeri reali è dotato di una struttura di spazio vettoriale reale mediante le seguenti operazioni, definite per ogni x = (x1 , . . . , xn ) ∈ Rn , y = (y1 , . . . , yn ) ∈ Rn e λ ∈ R x+y λx := (x1 + y1 , . . . , xn + yn ) , := (λx1 , . . . , λxn ) . La base canonica di Rn è costituita dai vettori e1 , e2 , . . . , en , dove, per ogni i, j = 1, . . . , n, la j-esima coordinata di ei è 0 se i ̸= j ed è 1 se i = j; quindi, ei = (δij )j=1,...,n dove δij è il simbolo di Kronecker definito ponendo, per ogni i, j = 1, . . . , n, { 1, i=j, δij := 0, i ̸= j . Poiché (ei )i=1,...,n è una base di Rn , ogni elemento x = (x1 , . . . , xn ) ∈ Rn si esprime in un unico modo come combinazione lineare di e1 , . . . , en ed i coefficienti di tale combinazione lineare sono proprio le componenti di x, Capitolo 12: Calcolo differenziale in più variabili 344 cioè x= n ∑ xi ei . i=1 Tuttavia, nel seguito si sarà maggiormente interessati ad approfondire le proprietà metriche di Rn che derivano dalla possibilità di introdurre in modo naturale in Rn un prodotto scalare. Per maggiore chiarezza si premette la definizione generale di prodotto scalare e qualcuna delle sue principali proprietà; di seguito si considererà il caso particolare del prodotto scalare di Rn . ◃ Per semplicità si denoterà con K il campo R dei numeri reali oppure il campo C dei numeri complessi. Se E è uno spazio vettoriale su K, si dice che una funzione (·|·) : E ×E → K è un prodotto scalare su E se sono soddisfatte le seguenti proprietà: 1. ∀ x, y, z ∈ E : (x + y|z) = (x|z) + (y|z) ; 2. ∀ x, y ∈ E , ∀ λ ∈ K : (λx|y) = λ (x|y) ; 3. ∀ x, y ∈ E : (y|x) = (x|y) ; 4. ∀ x ∈ E : (x|x) ∈ R e (x|x) ≥ 0; inoltre (x|x) = 0 ⇒ x = 0. L’elemento (x|y) di K viene denominato prodotto scalare di x ed y. ◃ Se (·|·) : E × E → K è un prodotto scalare su E, allora valgono le seguenti ulteriori proprietà, di verifica immediata: 1. ∀ x, y, z ∈ E : (z|x + y) = (z|x) + (z|y) ; 2. ∀ x, y ∈ E , ∀ λ ∈ K : (x|λy) = λ(x|y) ; 3. ∀ x ∈ E : (x|0) = (0|x) = 0 . ◃ Se (·|·) : E × E → K è un prodotto scalare su E, allora vale la seguente diseguaglianza di Cauchy-Schwarz, per ogni x, y ∈ E, |(x|y)|2 ≤ (x|x) · (y|y) . (12.1.1) Infatti, se y = 0, risulta (x|y) = 0 e quindi la proprietà è ovvia. Se y ̸= 0 si ha, per ogni λ ∈ R, 0 ≤ (x + λy|x + λy) = (x|x + λy) + (λy|x + λy) = (x|x) + (x|λy) + (λy|x) + (λy|λy) = (x|x) + λ(x|y) + λ(y|x) + λ2 (y|y) = (x|x) + λ(x|y) + λ(x|y) + λ2 (y|y) = (x|x) + 2λRe (x|y) + λ2 (y|y) ≤ (x|x) + 2λ|(x|y)| + λ2 (y|y) . 12.1 Cenni sulla struttura metrica di Rn 345 Dunque, per ogni λ ∈ R, risulta 0 ≤ (x|x) + 2λ|(x|y)| + λ2 (y|y) e ciò comporta che il discriminante ∆ := 4|(x|y)|2 − 4(x|x)(y|y) del polinomio (x|x) + 2λ|(x|y)| + λ2 (y|y) di secondo grado in λ deve essere negativo. Quindi |(x|y)|2 − (x|x)(y|y) ≤ 0 da cui la tesi. ◃ Se (·|·) : E × E → K è un prodotto scalare su E, allora vale la seguente diseguaglianza di Minkowski, per ogni x, y ∈ E, √ √ √ (x + y|x + y) ≤ (x|x) + (y|y) . Siano x, y ∈ E. Allora (x + y|x + y) = (x|x) + (y|x) + (x|y) + (y|y) = (x|x) + (x|y) + (x|y) + (y|y) = (x|x) + 2Re (x|y) + (y|y) ≤ (x|x) + 2|(x|y)| + (y|y) √ √ √ √ (x|x) + 2 (x|x) (y|y) + (y|y) = ( (x|x) + (y|y))2 , ≤ dove nell’ultima diseguaglianza si è usata la diseguaglianza di Cauchy-Schwarz. Considerando infine le radici quadrate del primo ed ultimo termine delle diseguaglianze precedenti si ottiene la tesi. ◃ Si studia ora un’ulteriore nozione generale che potrà essere messa in relazione con l’esistenza del prodotto scalare. Se E è uno spazio vettoriale su K, si dice che una funzione ∥ · ∥ : E → R è una norma su E se sono soddisfatte le seguenti proprietà: 1. ∀ x ∈ E : ∥x∥ ≥ 0 ; 2. ∀ x ∈ E : ∥x∥ = 0 ⇒ x = 0 ; 3. ∀ x ∈ E , ∀ λ ∈ K : ∥λx∥ = |λ| ∥x∥ ; 4. ∀ x, y ∈ E : ∥x + y∥ ≤ ∥x∥ + ∥y∥ . L’elemento ∥x∥ viene denominato norma di x e la coppia (E, ∥ · ∥) viene denominata spazio normato su K. ◃ Se (·|·) : E × E → K è un prodotto scalare su E, si può definire in modo naturale una norma su E, considerando la funzione ∥ · ∥ : E → R definita ponendo, per ogni x ∈ E, √ ∥x∥ := (x|x) . (12.1.2) Si verifica facilmente che la funzione definita dalla (12.1.2) verifica le proprietà previste nella definizione di norma; la verifica delle proprietà 1)3) delle norme è immediata, mentre la quarta segue dalla diseguaglianza di Minkowski. Tale norma viene denominata norma dedotta dal prodotto scalare di E. 346 Capitolo 12: Calcolo differenziale in più variabili ◃ La norma su uno spazio vettoriale consente a sua volta di definire in modo naturale una distanza su E. Per precisare meglio questa proprietà, si premette la nozione di distanza. ◃ Se E è un insieme arbitrario, si dice distanza su E una funzione d : E × E → R verificante le seguenti proprietà, per ogni x, y, z ∈ E, 1. d(x, y) ≥ 0 ; 2. d(x, y) = 0 ⇔ x = y ; 3. (Proprietà simmetrica) d(x, y) = d(y, x) ; 4. (Proprietà triangolare) d(x, z) ≤ d(x, y) + d(y, z) . Il numero reale d(x, y) viene denominato distanza di x da y e la coppia (E, d) viene anche denominata spazio metrico. ◃ Se ∥ · ∥ : E → R è una norma su E, si può definire automaticamente una distanza su E considerando la funzione d : E × E → R definita ponendo, per ogni x, y ∈ E, d(x, y) := ∥x − y∥ . (12.1.3) Si verifica facilmente che le proprietà previste nella definizione di distanza discendono direttamente da quelle della norma. La distanza d definita dalla (12.1.3) viene denominata distanza dedotta dalla norma di E. Come ulteriore approfondimento, si osserva che la nozione di distanza consente di definire quella di convergenza. Precisamente, se (E, d) è uno spazio metrico e se (an )n∈N è una successione di elementi di E, si dice che essa converge verso un elemento ℓ ∈ E se è soddisfatta la seguente condizione ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n ≥ ν : d(an , ℓ) < ε . Inoltre, si dice che (an )n∈N è una successione di Cauchy se è soddisfatta la seguente condizione ∀ ε > 0 ∃ ν ∈ N t.c. ∀ n, m ≥ ν : d(an , am ) < ε . Si verifica facilmente che ogni successione convergente verifica la condizione di Cauchy. Il viceversa non vale in generale; se accade che ogni successione di Cauchy è anche convergente, si dice che (E, d) è uno spazio metrico completo. Se la struttura dello spazio metrico (E, d) viene dedotta da una norma ∥ · ∥ e se (E, d) è completo, allora lo spazio normato (E, ∥ · ∥) su K viene denominato spazio di Banach su K. Se la norma di uno spazio di Banach (E, ∥ · ∥) su K viene dedotta da un prodotto scalare (·|·), allora la coppia (E, (·|·)) viene denominata spazio di Hilbert su K. ◃ Si può dimostrare che la norma ∥ · ∥ di uno spazio normato (E, ∥ · ∥) deriva da un prodotto scalare se e solo se essa verifica la seguente regola del parallelogramma, per ogni x, y ∈ E, ∥x + y∥2 + ∥x − y∥2 = 2(∥x∥2 + ∥y∥2 ) . 12.1 Cenni sulla struttura metrica di Rn 347 Esempio 12.1.1 1. Sia n ≥ 1 e si consideri lo spazio vettoriale reale Rn . Allora la funzione (·|·) : Rn × Rn → R definita ponendo, per ogni x = (x1 , . . . , xn ) ∈ Rn e per ogni y = (y1 , . . . , yn ) ∈ Rn , (x|y) := n ∑ xi yi (12.1.4) i=1 è un prodotto scalare su Rn . In questo caso la verifica delle proprietà del prodotto scalare è immediata. Nel seguito, Rn verrà considerato sempre munito del prodotto scalare definito dalla (12.1.4). La norma dedotta dal prodotto scalare in Rn è conseguentemente definita ponendo, per ogni x = (x1 , . . . , xn ) ∈ Rn , v u n u∑ ∥x∥ = t x2i , (12.1.5) i=1 ed infine la distanza dedotta dalla norma è definita ponendo, per ogni x = (x1 , . . . , xn ) ∈ Rn e y = (y1 , . . . , yn ) ∈ Rn , v u n u∑ d(x, y) = t (xi − yi )2 . (12.1.6) i=1 Si consideri una successione (am )m∈N , am = ((am )1 , . . . , (am )n ), di elementi di Rn . Si verifica facilmente che essa è convergente (rispettivamente, di Cauchy) se e solo se, per ogni i = 1, . . . , n, la successione ((ai )m )m∈N è convergente (rispettivamente, di Cauchy). Allora, dal criterio di convergenza di Cauchy per le successioni di numeri reali, segue che ogni successione di Cauchy in Rn è convergente e quindi (Rn , d) è uno spazio metrico completo. Conseguentemente, (Rn , ∥ · ∥) è uno spazio di Banach e (Rn , (·|·)) è uno spazio di Hilbert. 2. Sia n ≥ 1 e si consideri lo spazio vettoriale complesso Cn . Allora la funzione (·|·) : Cn × Cn → C definita ponendo, per ogni x = (x1 , . . . , xn ) ∈ Cn e per ogni y = (y1 , . . . , yn ) ∈ Cn , (x|y) := n ∑ i=1 è un prodotto scalare su Cn . xi yi (12.1.7) Capitolo 12: Calcolo differenziale in più variabili 348 Anche in questo caso la verifica delle proprietà del prodotto scalare è immediata. La norma e la distanza possono essere dedotta come nel caso precedente e si ha, per ogni x = (x1 , . . . , xn ) ∈ Cn e y = (y1 , . . . , yn ) ∈ Cn v u n u∑ ∥x∥ = t |xi |2 , (12.1.8) i=1 e v u n u∑ d(x, y) = t |xi − yi |2 . (12.1.9) i=1 Anche ora, separando le parti reali ed immaginarie, si riconosce facilmente che le successioni di Cauchy in Cn sono convergenti e quindi anche Cn è completo come spazio metrico, di Banach come spazio normato e di Hilbert munito del suo prodotto scalare. 3. Siano a, b ∈ R tali che a < b e si consideri lo spazio vettoriale reale C([a, b]) delle funzioni continue sull’intervallo [a, b] ed a valori in R. Allora la funzione (·|·) : C([a, b]) × C([a, b]) → R definita ponendo, per ogni f ∈ C([a, b]) e g ∈ C([a, b]), ∫ b (f |g) := f (x)g(x) dx . a risulta un prodotto scalare su C([a, b]). La norma dedotta dal prodotto scalare viene definita ponendo, per ogni f ∈ C([a, b]), √ ∫ b ∥f ∥ = f (x)2 dx , a e la distanza è data, per ogni f, g ∈ C([a, b]), da √ ∫ b d(f, g) = |f (x) − g(x)|2 dx . a Si può dimostrare tuttavia che con tale distanza C([a, b]) non è uno spazio metrico completo. Su C([a, b]) si può anche definire la norma uniforme ponendo ∥f ∥∞ := sup |f (x)| , x∈[a,b] f ∈ C([a, b]) , (12.1.10) 12.1 Cenni sulla struttura metrica di Rn 349 e la distanza uniforme da essa dedotta d∞ (f, g) = sup |f (x) − g(x)| , f, g ∈ C([a, b]) . x∈[a,b] Con tale distanza, lo spazio metrico (C([a, b], d∞ ) risulta completo e quindi (C([a, b], ∥ · ∥∞ ) è uno spazio di Banach. Tuttavia, in questo caso la norma non deriva da un prodotto scalare in quanto non soddisfa la regola del parallelogramma. 12.1.2 Sfere ed insiemi aperti e chiusi La distanza definita dalla (12.1.6) in Rn consente di introdurre tutte le nozioni metriche basate su tale nozione. ◃ Siano x0 ∈ Rn e sia r > 0. Si denomina sfera aperta (rispettivamente, sfera chiusa) di centro x0 e raggio r, il seguente sottoinsieme di Rn Br (x0 ) := {x ∈ Rn | d(x, x0 ) < r} (12.1.11) Br′ (x0 ) := {x ∈ Rn | d(x, x0 ) ≤ r} . (12.1.12) (rispettivamente, ◃ La definizione delle sfere aperte e chiuse consente di definire subito gli insiemi limitati. Precisamente, un sottoinsieme A di Rn si dice limitato se esiste r > 0 tale che A ⊂ Br (0). Si è considerato per comodità il punto 0 di Rn , ma esso potrebbe essere sostituito con un qualsiasi altro elemento di Rn . Quindi gli insiemi limitati in Rn sono i sottoinsiemi delle sfere aperte. ◃ Sempre partendo dalla definizione delle sfere aperte e chiuse, si possono ora introdurre le seguenti ulteriori definizioni. 1. Se A ⊂ Rn ed x0 ∈ Rn , si dice che A è un intorno di x0 se è soddisfatta la condizione seguente ∃ r > 0 t.c. Br (x0 ) ⊂ A . (12.1.13) 2. Se A ⊂ Rn ed x0 ∈ Rn , si dice che x0 è interno ad A se A è un intorno di x0 e quindi se vale la condizione precedente (12.1.13). L’insieme di tutti gli intorni di x0 viene denotato con il simbolo I(x0 ). 3. Un sottoinsieme A ⊂ Rn si dice aperto se ogni suo punto è interno (o, equivalentemente, se A è un intorno di ogni suo punto) e quindi se vale la condizione (12.1.13) per ogni x0 ∈ A. Capitolo 12: Calcolo differenziale in più variabili 350 4. Se A è un sottoinsieme arbitrario di Rn , si denomina interno di A ◦ e lo si denota con A il più grande sottoinsieme aperto contenuto ◦ in A. Pertanto A è costituito da tutti i soli i punti interni ad A o equivalentemente è l’unione di tutti gli insiemi aperti contenuti in A. Valgono le seguenti proprietà dell’interno di un sottoinsieme A: ◦ i) A è sempre un insieme aperto; ◦ ii) A ⊂ A; ◦ iii) A = A se e solo se A è un insieme aperto. 5. Un sottoinsieme C ⊂ Rn si dice chiuso se il suo complementare Rn rC è aperto e quindi se e solo se, per ogni punto x0 del suo complementare esiste una sfera aperta di centro x0 tutta contenuta nel complementare. 6. Se C è un sottoinsieme arbitrario di Rn , si denomina chiusura di C e lo si denota con C il più piccolo sottoinsieme chiuso contenente C. Pertanto C è l’intersezione di tutti gli insiemi chiusi contenenti C. La chiusura di un sottoinsieme C può anche essere espressa utilizzando la nozione di interno di un sottoinsieme nel modo seguente ◦ z }| { C = Rn r Rn r C Valgono le seguenti proprietà della chiusura di un sottoinsieme C: i) C è sempre un insieme chiuso; ii) C ⊂ C; iii) C = C se e solo se C è un insieme chiuso. 7. Se A è un sottoinsieme arbitrario di Rn , si denomina frontiera di A e la si denota con ∂A (oppure con Fr(A) il seguente sottoinsieme di Rn ∂A := A ∩ (Rn r A) . 8. Infine, si osserva che anche in Rn può essere data la definizione di punto di accumulazione nel modo seguente. Se A è un sottoinsieme di Rn e se x0 ∈ Rn , si dice che x0 è un punto di accumulazione per A se vale la seguente condizione: ∀ δ > 0 : A ∩ Bδ (x0 ) r {x0 } ̸= ∅ , cioè, in ogni intorno di x0 devono esservi elementi di A diversi da x0 . 12.1 Cenni sulla struttura metrica di Rn 12.1.3 351 Intervalli, rette e direzioni di Rn Se a = (a1 , . . . , an ) ∈ Rn e b = (b1 , . . . , bn ) ∈ Rn verificano le condizioni ai ≤ bi , i = 1, . . . , n , si possono considerare gli intervalli [a, b] := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai ≤ xi ≤ bi } , ]a, b[ := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai < xi < bi } , [a, b[ := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai ≤ xi < bi } , ]a, b] := {x = (x1 , . . . , xn ) ∈ Rn | ∀ i = 1, . . . , n : ai < xi ≤ bi } , i quali vengono denominati rispettivamente intervallo chiuso (rispettivamente, aperto, semiaperto a destra, semiaperto a sinistra) di estremi a e b. Per molte questioni metriche sarà tuttavia più utile il concetto di sfera aperta e chiusa definito nella sezione successiva. Si denomina direzione di Rn ogni elemento v ∈ Rn tale che ∥v∥ = 1. Si osserva che se v ∈ Rn r {0}, allora v/∥v∥ è una direzione di Rn . In particolare, i vettori ei , i = 1, . . . , n, della base canonica sono particolari direzioni di Rn . Se v = (v1 , . . . , vn ) ∈ Rn è una direzione di Rn e se x0 ∈ Rn , l’equazione della retta passante per x0 e direzione v è data da x = x0 + tv , t∈R, ed in coordinate parametriche x1 = (x0 )1 + tv1 , x2 = (x0 )2 + tv2 , . .. xn = (x0 )n + tvn , t∈R. Se a = (a1 , . . . , an ) ∈ Rn e b = (b1 , . . . , bn ) ∈ Rn , la retta passante per a e b ha equazione x = a + t(b − a) , t∈R, ed in coordinate parametriche x1 = a1 + t(b1 − a1 ) , x2 = a2 + t(b2 − a2 ) , .. . xn = an + t(bn − an ) , t∈R. 352 Capitolo 12: Calcolo differenziale in più variabili Il segmento di estremi a e b è invece definito come segue S[a, b] := {x ∈ Rn | ∃ t ∈ [0, 1] t.c. x = a + t(b − a)} . Una poligonale P di Rn è l’unione di un numero finito di segmenti aventi a due a due un estremo in comune; pertanto, devono esistere a0 , . . . , am ∈ Rn (denominati vertici della poligonale) tali che P = S[a0 , a1 ] ∪ S[a1 , a2 ] ∪ · · · ∪ S[am−1 , am ]. Una poligonale congiungente i punti a e b è una poligonale del tipo precedente con a = a0 e b = am ; essa viene anche denotata con il simbolo P [a, b] oppure con P [a0 , . . . , am ] se si vogliono specificare i vertici della poligonale. Un sottoinsieme A di Rn si dice connesso per poligonali se, per ogni x, y ∈ A, esiste una poligonale P [x, y] congiungente i punti x ed y interamente contenuta in A. Più in generale, un sottoinsieme A di Rn si dice connesso se non è unione di insiemi aperti disgiunti e non vuoti; quindi A è connesso se ogni volta che A = A1 ∪ A2 con A1 e A2 insiemi aperti disgiunti, risulta A1 = ∅ oppure A2 = ∅. Si può dimostrare che in Rn un sottoinsieme connesso per poligonali è anche connesso mentre il viceversa non vale (ad esempio, se si “connettono” due insiemi connessi disgiunti mediante un arco di circonferenza si ottiene un insieme connesso ma non connesso per poligonali). Tuttavia, Se A è un sottoinsieme aperto di Rn , esso è connesso se e solo se è connesso per poligonali.1 ◃ Nel caso in cui si considerino poligonali costituite da un solo segmento, si ottengono particolari insiemi connessi di seguito definiti. Sia A un sottoinsieme di Rn . Si dice che A è convesso se, per ogni a, b ∈ A il segmento S[a, b] congiungente a e b è interamente contenuto in A. 1 Si supponga che A sia un insieme aperto non connesso per poligonali e siano a ∈ A e b ∈ A non congiungibili con una poligonale. Si considerino gli insiemi A1 := {x ∈ A | ∃ P [a, x] ⊂ A} e A2 := {x ∈ A | @ P [a, x] ⊂ A}; essi verificano ovviamente le condizioni A1 ∪ A2 = A, A1 ∩ A2 = ∅ e inoltre A1 ̸= ∅ (infatti a ∈ A1 ) e A2 ̸= ∅ (infatti b ∈ A2 ). Si riconosce ora che A1 ed A2 sono entrambi aperti e ciò dimostrerà che A non è connesso. Sia x0 ∈ A1 ; poiché A è aperto esiste δ > 0 tale che Bδ (x0 ) ⊂ A; considerata una poligonale P [a, x0 ] congiungente a ed x0 e contenuta in A, per ogni x ∈ Bδ (x0 ) la poligonale costituita da P [a, x0 ] e dal segmento congiungente x0 ed x risulta essere interamente contenuta in A e congiunge a ed x, da cui x ∈ A1 ; quindi Bδ (x0 ) ⊂ A1 da cui si deduce che A1 è aperto. Sia ora x0 ∈ A2 e come prima si consideri δ > 0 tale che Bδ (x0 ) ⊂ A; se esistesse una poligonale P [a, x] ⊂ A congiungente a ed x allora la poligonale costituita da P [a, x] e dal segmento congiungente x ed x0 sarebbe contenuta in A e congiungerebbe a ed x0 , e ciò è escluso dal fatto che x0 ∈ / A1 ; pertanto x ∈ A2 da cui Bδ (x0 ) ⊂ A2 e quindi A2 è aperto. 12.2 Funzioni di più variabili 353 Si osservi che un insieme convesso è anche connesso (in quanto è ovviamente connesso per poligonali), ma il viceversa non vale. Ad esempio, il sottoinsieme A := ([−1, 0] × [0, 1/2]) ∪ [0, 1]2 è connesso ma non convesso. y x Figura 12.1: Esempio di insieme connesso ma non convesso. 12.2 Funzioni di più variabili Una funzione di n variabili reali è una funzione definita in un sottoinsieme di Rn con n ≥ 1. Se tale funzione è a valori in R essa viene denominata funzione reale di n variabili reali. Per molti aspetti, lo studio di una funzione di più variabili può essere condotto con metodi simili a quelli utilizzati per le funzioni di una variabile reale; ad esempio, lo studio dell’insieme di definizione e le stesse definizioni di limite e di continuità per funzioni di più variabili non presentano novità sostanziali. Invece, il calcolo differenziale e lo studio dei massimi e minimi relativi ed assoluti (e vincolati) necessita di un approccio sostanzialmente più articolato rispetto a quello utilizzato per le funzioni di una sola variabile. ◃ Ad esempio, si consideri la funzione di due variabili f (x, y) := y log(xy) + x2 esin(x+y) . Le condizioni da imporre per determinare l’insieme di definizione riguardano solamente la funzione logaritmo in quanto le altre funzioni sono definite per qualsiasi valore reale del loro argomento. Pertanto si deve imporre xy > 0 e quindi la funzione è definita nel primo e nel terzo quadrante (esclusi gli Capitolo 12: Calcolo differenziale in più variabili 354 assi): Xf := {(x, y) ∈ R2 | x > 0 , y > 0} ∪ {(x, y) ∈ R2 | x < 0 , y < 0} = ]0, +∞[2 ∪] − ∞, 0[2 . Si osservi che la funzione è definita in un sottoinsieme aperto non limitato di R2 . ◃ Come ulteriore esempio si consideri la funzione di tre variabili √ f (x, y, z) := 1 − x2 − y 2 + arcsin z . Per determinare l’insieme di definizione, bisogna imporre le condizioni { 1 − x2 − y 2 ≥ 0 , −1 ≤ z ≤ 1 , e quindi la funzione è definita nel cilindro di R3 che ha come base il cerchio di centro l’origine e raggio 1 nel piano xy ed altezza l’intervallo [−1, 1] sull’asse z: Xf := {(x, y, z) ∈ R3 | x2 + y 2 ≤ 1 , −1 ≤ z ≤ 1} = {(x, y) ∈ R2 | x2 + y 2 ≤ 1} × [−1, 1] . La funzione è definita in un sottoinsieme chiuso e limitato di R3 . ◃ Viene fornita ora la definizione di limite per le funzioni di più variabili. Come si può notare, essa è del tutto analoga a quella già nota per le funzioni di una variabile reale. Definizione 12.2.1 Siano A ⊂ Rn ed f : A → R una funzione reale di più variabili reali. Se x0 ∈ Rn è un punto di accumulazione per A e se ℓ ∈ R, si dice che ℓ è il limite di f per x tendente verso x0 e si scrive lim f (x) = ℓ , x→x0 oppure lim (x1 ,...,xn )→((x0 )1 ,...,(x0 )n ) f (x1 , . . . , xn ) = ℓ , se è soddisfatta le condizione seguente ∀ I ∈ I(ℓ) ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) r {x0 } : f (x) ∈ I . (12.2.1) Se ℓ ∈ R la condizione (12.2.1) è equivalente alla seguente ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) r {x0 } : |f (x) − ℓ| < ε , (12.2.2) mentre se ℓ = +∞ (rispettivamente, ℓ = −∞), è equivalente alla seguente ∀ M ∈ R ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) r {x0 } : f (x) > M (rispettivamente f (x) < M ). (12.2.3) 12.2 Funzioni di più variabili 355 Vista la naturale generalizzazione della definizione di limite al caso di più variabili, molti risultati ottenuti per le funzioni di una variabile rimangono validi anche nel caso in esame, come le proprietà di unicità del limite, della permanenza del segno, della limitatezza locale, della monotonia del limite ed i teoremi di confronto e sulle operazioni sui limiti; non hanno invece più significato, vista la struttura di Rn , i limiti da sinistra e da destra ed i teoremi riguardanti funzioni monotone (in quanto tale nozione non ha senso in più variabili). Per brevità, si omette in questa fase di enunciare tali risultati, riservandosi di richiamarli in maniera più dettagliata ogni qualvolta vengano utilizzati nel seguito. ◃ Si consideri il seguente limite log(1 + x3 y 2 ) √ . (x,y)→(0,1) x2 + (y − 1)2 lim Esso si presenta nella forma indeterminata 0/0. Sebbene sia possibile utilizzare i limiti notevoli ed ottenere il limite log(1 + x3 y 2 ) √ (x,y)→(0,1) x2 + (y − 1)2 lim = log(1 + x3 y 2 ) x3 y 2 √ 3 2 2 x y (x,y)→(0,1) x + (y − 1)2 = x3 y 2 √ , (x,y)→(0,1) x2 + (y − 1)2 lim lim risulta comunque problematico effettuare un confronto tra i due infinitesimi al numeratore ed al denominatore. Si può allora ricorrere ad un metodo di frequente utilizzo che consiste nell’effettuare dapprima una traslazione in modo che il limite venga calcolato nel punto (0, 0) e poi nel passaggio alle coordinate polari. Infatti, posto u := x e v := y − 1, l’ultimo limite diventa x3 y 2 u3 (1 + v)2 √ √ = lim , (x,y)→(0,1) (u,v)→(0,0) u2 + v 2 x2 + (y − 1)2 lim e a questo punto, posto u := ρ cos θ, v := ρ sin θ, si ottiene il limite lim+ ρ→0 ρ3 cos3 θ(1 + ρ sin θ)2 = lim+ ρ2 cos3 θ(1 + ρ sin θ)2 = 0 . ρ ρ→0 Si osservi che l’ultima uguaglianza è giustificata dal fatto che il limite tende a 0 indipendente da θ; infatti il fattore cos3 θ(1 + ρ sin θ)2 è limitato in un intorno del punto ρ = 0 e quindi −M ρ2 ≤ ρ2 cos3 θ(1 + ρ sin θ)2 ≤ M ρ2 , 356 Capitolo 12: Calcolo differenziale in più variabili con M > 0 costante opportuna; poiché limρ→0+ M ρ2 = 0, per confronto si ottiene che anche il limite assegnato è 0. ◃ Si passa ora a considerare la nozione di continuità. Definizione 12.2.2 Siano A ⊂ Rn ed f : A → R una funzione reale di più variabili reali. Se x0 ∈ A, si dice che f è continua in x0 se è soddisfatta le condizione seguente ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) : |f (x) − f (x0 )| < ε . (12.2.4) Se x0 è un punto di accumulazione per A, la condizione precedente equivale a limx→x0 f (x) = f (x0 ), mentre se x0 ∈ A non è un punto di accumulazione per A, allora f è automaticamente continua in x0 . Si dirà poi che f è continua in un sottoinsieme B ⊂ A se è continua in ogni x0 ∈ B. Infine, si dice che f è continua se è continua in ogni x0 ∈ A. Le nozioni di continuità a destra ed a sinistra non hanno significato per le funzioni di più variabili, mentre è possibile estendere il seguente risultato, di cui per brevità viene omessa la dimostrazione. Teorema 12.2.3 (Teorema di Weierstrass in più variabili) Siano A un sottoinsieme chiuso e limitato di Rn ed f : A → R una funzione reale continua. Allora f è dotata di minimo e di massimo, cioè esistono c, d ∈ A tali che, per ogni x ∈ A, f (c) ≤ f (x) ≤ f (d). Anche il teorema degli zeri può essere generalizzato nel caso di funzioni di più variabili nel modo seguente. Teorema 12.2.4 (Teorema degli zeri in più variabili) Siano A un sottoinsieme di Rn ed f : A → R una funzione reale continua. Se a, b ∈ A sono tali che f (a) · f (b) < 0 e se esiste una poligonale P [a, b] di estremi a e b interamente contenuta in A, allora esiste c ∈ A (in particolare c ∈ P [a, b]) tale che f (c) = 0. Dimostrazione. Basta applicare il teorema degli zeri per funzioni di una variabile reale alla restrizione di f alla poligonale P [a, b]. 12.3 Derivate direzionali e parziali e differenziabilità Alcune nozioni introdotte nel seguito sono basate su proprietà elementari delle funzioni lineari, che per comodità si preferisce richiamare preliminarmente. 12.3 Derivate direzionali e parziali e differenziabilità 12.3.1 357 Funzioni lineari Se E ed F sono spazi vettoriali su K (si ricorda che K denota l’insieme dei numeri reali R oppure quello dei numeri complessi C), una funzione lineare da E in F è una funzione L : E → F che verifica le seguenti condizioni, per ogni x, y ∈ Rn e λ ∈ K, L(x + y) = L(x) + L(y) , L(λ x) = λ L(x) . Una funzione lineare L : E → K viene denominata anche funzionale lineare su E. In particolare, i funzionali lineari su Rn sono funzioni lineari L : Rn → R. Una proprietà importante di tali funzionali lineari riguarda il fatto che i valori dipendono solamente da quelli assunti sui vettori della∑base canon nica; infatti, per ogni x = (x1 , . . . , xn ) ∈ Rn , risulta x = i=1 xi ei e conseguentemente, dalle condizioni di linearità, ( n ) n n ∑ ∑ ∑ L(x) = L xi ei = L(xi ei ) = L(ei ) xi . (12.3.1) i=1 i=1 i=1 Si deduce in particolare che due funzionali lineari che assumono lo stesso valore sui vettori della base canonica devono necessariamente coincidere. Considerato il vettore eL := (L(e1 ), . . . , L(en )), e ricordando la definizione del prodotto scalare in Rn , la formula precedente può essere scritta come segue L(x) = (eL |x) . (12.3.2) In generale, quindi, un funzionale lineare su Rn è del tipo L(x1 , . . . , xn ) = a1 x1 + · · · + an xn , (x1 , . . . , xn ) ∈ Rn , con a1 , . . . , an ∈ R costanti fissate (inoltre ai = L(ei ) per ogni i = 1, . . . , n). In particolare i funzionali lineari su R, R2 ed R3 assumono rispettivamente la forma L(x) = ax , L(x, y) = ax + by , L(x, y, z) = ax + by + cz , con a, b, c ∈ R fissati ed x, y, z ∈ R. Dall’espressione ottenuta dei funzionali lineari segue subito che essi sono funzioni continue in quanto somma di n funzioni potenza di grado 1. ◃ Sia L : Rn → R un funzionale lineare su Rn . Allora, l’insieme dei punti ΠL := {(x1 , . . . , xn , y) ∈ Rn+1 | y = L(x1 , . . . , xn )} = {(x, y) ∈ R × R | y = (eL |x)} n (12.3.3) Capitolo 12: Calcolo differenziale in più variabili 358 è un sottospazio vettoriale di Rn+1 , denominato iperpiano generato da L. Se x0 ∈ Rn e se y0 ∈ R, si può considerare l’iperpiano ΠL,(x0 ,y0 ) generato da L e passante per (x0 , y0 ) ΠL,(x0 ,y0 ) := := {(x, y) ∈ Rn × R | y = y0 + L(x − x0 )} , {(x, y) ∈ Rn × R | y = y0 + (eL |x − x0 )} , la cui equazione è data da y = y0 + L(x − x0 ) , x ∈ Rn , y ∈ R , oppure, utilizzando il prodotto scalare, y = y0 + (eL |x − x0 ) , 12.3.2 x ∈ Rn , y ∈ R . Derivate direzionali e parziali Siano A un sottoinsieme di Rn ed f : A → R una funzione reale di n variabili reali. Se x0 ∈ A è un punto interno ad A e se v ∈ Rn è una direzione di Rn , l’insieme Ix0 ,v := {t ∈ R | x0 + tv ∈ A} contiene un intorno del punto 0.2 Si può quindi considerare la funzione fx0 ,v : Ix0 ,v → R definita ponendo, per ogni t ∈ Ix0 ,v , fx0 ,v (t) = f (x0 + tv) , la quale è definita in un intorno dello 0; tale funzione rappresenta la restrizione della funzione f alla retta passante per x0 di direzione v (si osservi che il punto x0 si ottiene per t = 0 dall’equazione della retta). Si può a questo punto assumere la seguente definizione. Definizione 12.3.1 Si dice che f è derivabile in x0 rispetto alla direzione v se fx0 ,v è derivabile in 0; in tal caso, fx′ 0 ,v (0) viene denominata derivata ∂f direzionale di f in x0 rispetto alla direzione v e denotata con (x0 ). ∂v Si ha pertanto ∂f fx ,v (t) − fx0 ,v (0) f (x0 + tv) − f (x0 ) (x0 ) := lim 0 = lim t→0 t→0 ∂v t t 2 Infatti, x è interno ad A e quindi esiste δ > 0 tale che B (x ) ⊂ A; allora, per 0 δ 0 ogni t ∈] − δ, δ[, risulta d(x0 + tv, x0 ) = ∥x0 + tv − x0 ∥ = |t| ∥v∥ = |t| < δ e quindi ] − δ, δ[⊂ Ix0 ,v . 12.3 Derivate direzionali e parziali e differenziabilità 359 e, denotate con (v1 , . . . , vn ) le componenti di v, si può scrivere ∂f f ((x0 )1 + tv1 , . . . , (x0 )n + tvn ) − f ((x0 )1 , . . . , (x0 )n ) (x0 ) = lim . t→0 ∂v t In particolare, fissato i = 1, . . . , n, si può considerare la direzione ei della base canonica. In questo caso, la derivata direzionale di f in x0 rispetto alla direzione ei viene denominata derivata parziale i-esima (oppure rispetto alla i-esima variabile) e denotata con il simbolo ∂f (x0 ) . ∂xi Pertanto, da quanto osservato sopra e tenendo presente che x0 + tei = (x0 )1 , . . . , (x0 )n ) + t(0, . . . , 1, . . . , 0) = ((x0 )1 , . . . , (x0 )i + t, . . . , (x0 )n ), f (x0 + tei ) − f (x0 ) t f ((x0 )1 , . . . , (x0 )i + t, . . . , (x0 )n ) − f ((x0 )1 , . . . , (x0 )n ) = lim . t→0 t ∂f (x0 ) = ∂xi lim t→0 Quindi, la derivata parziale rispetto alla variabile i-esima viene effettuata considerando costanti le variabili diverse da quella i-esima e derivando la funzione come se dipendesse dall’unica variabile xi . Ciò suggerisce un semplice criterio sia per riconoscere che una funzione è derivabile parzialmente rispetto ad un’assegnata variabile che per calcolarne la derivata parziale, utilizzando gli stessi metodi e le stesse regole di derivazione già viste per le funzioni di una sola variabile reale. ◃ Ad esempio, si consideri la funzione f (x, y) := ex+y + cos(xy) . Fissato y ∈ R, la funzione parziale fy (x) := f (x, y), dipendente dalla sola variabile x, è derivabile in tutto R e si ha fy (x) = ex+y − y sin(xy); pertanto, dall’arbitrarietà di y ∈ R, si conclude che f è derivabile parzialmente rispetto ad x in ogni (x, y) ∈ R2 e si ha ∂f (x, y) = ex+y − y sin(xy) . ∂x In modo analogo, fissato x ∈ R, la funzione parziale fx (y) := f (x, y), dipendente dalla sola variabile y, è derivabile in tutto R e si ha fx (y) = ex+y − x sin(xy); pertanto, dall’arbitrarietà di x ∈ R, si conclude che f è derivabile parzialmente anche rispetto ad y in ogni (x, y) ∈ R2 e si ha ∂f (x, y) = ex+y − x sin(xy) . ∂y 360 Capitolo 12: Calcolo differenziale in più variabili ◃ Se f : A → R è derivabile parzialmente rispetto ad ogni variabile in un punto x0 ∈ A, si può considerare il gradiente di f in x0 , denotato con ∇f (x0 ) (oppure con grad f (x0 )), e definito come segue ( ) ∂f ∂f ∇f (x0 ) := (x0 ), . . . , (x0 ) (12.3.4) ∂x1 ∂xn ◃ In generale non vi è un legame tra le derivate parziali e le derivate direzionali, per cui la conoscenza delle derivate parziali non è sufficiente per determinare tutte le derivate direzionali della funzione in un fissato punto. ◃ I concetti precedenti sono basati su una generalizzazione analitica del concetto di derivata; infatti si considera una retta passante per x0 e si restringe la funzione a tale retta (intersecata con l’insieme di definizione) ottenendo cosı̀ una funzione di una variabile per la quale si può considerare la derivata già nota per tali funzioni. La difficoltà di introdurre un concetto più generale dipende dal fatto che il rapporto incrementale (f (x) − f (x0 ))/(x − x0 ) non ha significato per le funzioni di più variabili. Tuttavia, il prossimo obiettivo è quello di introdurre una nozione più forte che tenga conto del comportamento della funzione in tutto un intorno di x0 e non solo su una particolare retta. In tali casi dall’esistenza delle derivate parziali si potrà ricavare anche quella delle derivate rispetto ad una qualsiasi direzione. Di tale proprietà ci si occupa nella sezione successiva. 12.3.3 Differenziabilità Si studia ora il concetto di funzione differenziabile in un punto. Tale concetto trae spunto dall’interpretazione geometrica della derivata per le funzioni di una variabile. Infatti se f : I → R è una funzione definita in un intervallo I ⊂ R e se x0 ∈ I, è noto che f è derivabile in x0 se e solo se il suo grafico è dotato di retta tangente non verticale nel punto (x0 , f (x0 )); tra tutte le rette di equazione y = f (x0 ) + a(x − x0 ) passanti per (x0 , f (x0 )) la retta tangente, che ha equazione y = f (x0 )+f ′ (x0 )(x−x0 ), è l’unica che verifica la seguente condizione f (x) − (f (x0 ) + f ′ (x0 )(x − x0 )) lim =0 x→x0 x − x0 (infatti f (x) − (f (x0 ) + f ′ (x0 )(x − x0 )) lim = lim x→x0 x→x0 x − x0 ( f (x) − f (x0 ) − f ′ (x0 ) x − x0 ) =0). 12.3 Derivate direzionali e parziali e differenziabilità 361 Pertanto la definizione di derivabilità in x0 equivale a richiedere l’esistenza di un numero a ∈ R tale che lim x→x0 f (x) − f (x0 ) − a(x − x0 ) =0 |x − x0 | (si è potuto dividere per |x − x0 | anziché per x − x0 proprio perché il limite è stato posto uguale a 0) e in tal caso il numero a risulta essere proprio f ′ (x0 ). Si considerino ora un sottoinsieme A di Rn , un punto interno x0 ad A ed una funzione reale f : A → R di n variabili reali. Si ricorda che i piani passanti per il punto (x0 , f (x0 )) hanno equazione y = f (x0 ) + L(x − x0 ) dove L : Rn → R è un funzionale lineare su Rn e quindi si può richiedere, analogamente al caso delle funzioni di una variabile, che esista uno di tali piani verificante la condizione lim x→x0 f (x) − f (x0 ) − L(x − x0 ) =0. ∥x − x0 ∥ Ciò conduce alla seguente definizione. Definizione 12.3.2 Siano A un sottoinsieme di Rn , x0 ∈ A un punto interno ad A ed f : A → R una funzione reale di n variabili reali. Si dice che f è differenziabile in x0 se esiste un funzionale lineare L : Rn → R tale che f (x) − f (x0 ) − L(x − x0 ) lim =0. (12.3.5) x→x0 ∥x − x0 ∥ Il funzionale lineare L previsto nella definizione precedente è unico3 e viene denominato differenziale di f in x0 e denotato con df (x0 ). Da quanto osservato, la definizione di differenziabilità in x0 equivale a richiedere l’esistenza di un piano in Rn+1 tangente al grafico della 3 Infatti, si supponga che L ed L siano funzionali lineari verificanti la (12.3.5). Si 1 2 consideri δ > 0 tale che Bδ (x0 ) ⊂ A e sia 0 < t < δ; allora, per ogni i = 1, . . . , n, risulta x0 + t ei ∈ A e inoltre L1 (ei ) − L2 (ei ) = = L1 (t ei ) − L2 (t ei ) L1 (x0 + t ei − x0 ) − L2 (x0 + t ei − x0 ) = t t f (x0 + t ei ) − f (x0 ) − L2 (x0 + t ei − x0 ) ∥x0 + tei − x0 ∥ f (x0 + t ei ) − f (x0 ) − L1 (x0 + t ei − x0 ) − ; ∥x0 + tei − x0 ∥ quindi, considerando il limite per t → 0, dalla (12.3.5) si ottiene L1 (ei ) = L2 (ei ). Poiché i = 1, . . . , n è arbitrario, i funzionali lineari L1 ed L2 coincidono sui vettori della base canonica e quindi devono essere uguali. Capitolo 12: Calcolo differenziale in più variabili 362 funzione f nel punto (x0 , f (x0 )). Tale piano ha equazione y = f (x0 ) + df (x0 )(x − x0 ) (oppure anche y = f (x0 ) + (∇f (x0 )|x − x0 )) oppure, ancora più esplicitamente, y = f (x0 ) + n ∑ ∂f (x0 ) (xi − (x0 )i ) , ∂x i i=1 x = (x1 , . . . , xn ) ∈ Rn , y ∈ R , ed è pertanto univocamente individuato dal valore della funzione in x0 e da quello delle sue derivate parziali in x0 . Si osservi che per n = 1 si ottiene l’equazione già nota della retta tangente al grafico di f nel punto (x0 , f (x0 )). Si studiano subito alcune proprietà delle funzioni differenziabili. Teorema 12.3.3 Siano A un sottoinsieme di Rn , x0 ∈ A un punto interno ad A ed f : A → R una funzione differenziabile in x0 . Allora f è continua in x0 . Dimostrazione. Dalla definizione di differenziabilità e dalla continuità di df (x0 ) segue subito ( f (x) − f (x ) − df (x )(x − x ) 0 0 0 lim ∥x − x0 ∥ + f (x0 ) lim f (x) = x→x0 x→x0 ∥x − x0 ∥ ) + df (x0 )(x − x0 ) = f (x0 ) + lim = f (x0 ) x→x0 f (x) − f (x0 ) − df (x0 )(x − x0 ) ∥x − x0 ∥ ∥x − x0 ∥ e quindi la tesi. Si osservi che se f è derivabile rispetto ad ogni direzione in x0 non è detto che essa sia continua in x0 (risulta essere continua solamente la restrizione di f ad ogni retta passante per x0 ). Esempio 12.3.4 Si consideri la funzione f : R2 → R definita ponendo, per ogni (x, y) ∈ R2 , { 2 x /y , y ̸= 0 , f (x, y) := 0, y=0. Si consideri il punto (0, 0) e sia v = (ξ, η) una direzione di R2 ; allora, se η ̸= 0, si ha f (tξ, tη) − f (0, 0) (tξ)2 /(tη) ξ2 = lim = , t→0 t→0 t t η lim 12.3 Derivate direzionali e parziali e differenziabilità 363 mentre, se η = 0, risulta f (tξ, tη) − f (0, 0) =0; t→0 t lim dunque, f è derivabile rispetto ad ogni direzione nel punto (0, 0) e si ha { 2 ∂f ξ /η , η ̸= 0 , (0, 0) = v = (ξ, η) . 0 , η=0, ∂v Tuttavia f non è continua in (0, 0) in quanto, ad esempio, sulla curva di equazione y = x2 , passante per (0, 0), assume il valore 1 in ogni punto diverso da (0, 0) mentre in (0, 0) assume il valore 0. In realtà, sempre con riferimento all’esempio considerato, l’esistenza delle derivate direzionali comporta la continuità in 0 della restrizione di f ad ogni retta passante per l’origine; questo, in termini analitici, vuol dire che, fissato ε > 0 e fissata una direzione v = (ξ, η) di R2 , esiste δ > 0 tale che, per ogni t ∈] − δ, δ[, si abbia |f (tξ, tη) − f (0, 0)| < ε; tuttavia, in questo caso il numero δ > 0 dipende dalla direzione oltre che da ε (si può riconoscere facilmente che, imponendo la condizione |(tξ)2 /(tη)| = |f (tξ, tη)−f (0, 0)| < ε deve essere δ = ε/ξ per ogni ξ ̸= 0) e quindi non è possibile considerare una sfera di centro l’origine in cui vale la diseguaglianza |f (x, y) − f (0, 0)| < ε. La differenziabilità di una funzione in un punto comporta l’esistenza in tal punto di tutte le derivate direzionali; inoltre, le derivate direzionali possono essere espresse mediante il differenziale, come dimostra il seguente risultato. Teorema 12.3.5 Siano A un sottoinsieme di Rn , x0 ∈ A un punto interno ad A ed f : A → R una funzione differenziabile in x0 . Allora, per ogni direzione v ∈ Rn di Rn , f è derivabile in x0 rispetto alla direzione v e si ha ∂f (x0 ) = df (x0 )(v) . ∂v (12.3.6) Dimostrazione. Per dimostrare la tesi è sufficiente riconoscere che f (x0 + tv) − f (x0 ) lim = df (x0 )(v) ; t→0 t dalla definizione di differenziabilità segue, ponendo x = x0 + tv, f (x0 + tv) − f (x0 ) − df (x0 )(tv) lim =0, t→0 ∥tv∥ e quindi, dalla linearità di df (x0 ), dalla limitatezza del rapporto t/|t| per ogni t ̸= 0 e tenendo presente che ∥tv∥ = |t| ∥v∥ = |t|, si ha anche ( ) f (x0 + tv) − f (x0 ) f (x0 + tv) − f (x0 ) − t df (x0 )(v) lim − df (x0 )(v) = lim t→0 t→0 t t f (x0 + tv) − f (x0 ) − df (x0 )(tv) |t| = lim t→0 ∥tv∥ t = 0, 364 Capitolo 12: Calcolo differenziale in più variabili da cui segue direttamente la tesi. Il viceversa del risultato precedente non vale in generale e quindi una funzione potrebbe essere derivabile rispetto ad ogni direzione in un punto pur non essendo differenziabile in tale punto; ad esempio, la funzione considerata nell’Esempio 12.3.4 è derivabile rispetto ad ogni direzione in (0, 0), ma non può essere differenziabile in tale punto altrimenti, per il Teorema 12.3.3, dovrebbe essere continua in (0, 0). ◃ In particolare il risultato precedente asserisce che una funzione differenziale in x0 è dotata in tal punto anche di tutte le derivate parziali e dalla (12.3.6) si ha, per ogni i = 1, . . . , n, ∂f (x0 ) = df (x0 )(ei ) . ∂xi (12.3.7) Quindi i valori che il differenziale assume nei vettori della base canonica sono proprio le derivate parziali di f in x0 ; ricordando che tali valori determinano univocamente il differenziale, dalle espressioni (12.3.1) e (12.3.2) si ottiene la seguente espressione del differenziale, per ogni x = (x1 , . . . , xn ) ∈ Rn , df (x0 )(x) = n ∑ ∂f (x0 ) xi = (∇f (x0 )|x) . ∂x i i=1 (12.3.8) Utilizzando la definizione del gradiente di f in x0 data dalla (12.3.4), il differenziale assume anche la seguente espressione df (x0 )(x) = (∇f (x0 )|x) , x ∈ Rn , e la condizione di differenziabilità si può anche scrivere nel modo seguente lim x→x0 f (x) − f (x0 ) − (∇f (x0 )|x − x0 ) =0. ∥x − x0 ∥ ◃ In particolare, dalla (12.3.8) si ricava, per ogni direzione v = (v1 , . . . , vn ) di Rn , n ∑ ∂f ∂f (x0 ) = (x0 ) vi , (12.3.9) ∂v ∂xi i=1 e quindi, se f è differenziabile in x0 , tutte le derivate direzionali in x0 si esprimono come combinazione lineare delle derivate parziali in x0 . Più precisamente, la proprietà (12.3.9) esprime il fatto che le derivate direzionali sono coefficienti angolari di rette in Rn+1 passanti per (x0 , f (x0 )) che si trovano tutte sul piano tangente al grafico della funzione f nel punto (x0 , f (x0 )). ◃ Da quanto osservato, segue che la differenziabilità di una funzione fornisce tutte le informazioni sulle derivate direzionali in x0 utilizzando solamente 12.3 Derivate direzionali e parziali e differenziabilità 365 quelle sulle derivate parziali che, come si è visto, possono essere studiate e calcolate utilizzando gli strumenti già a disposizione per le funzioni di una sola variabile reale. Pertanto, a questo punto è particolarmente utile avere a disposizione dei criteri di differenziabilità che utilizzino le stesse derivate parziali. Teorema 12.3.6 (Teorema del differenziale totale) Siano A un sottoinsieme di Rn , x0 ∈ A un punto interno ad A ed f : A → R una funzione di n variabili reali tale che i) esiste δ > 0 tale che, per ogni x ∈ Bδ (x0 ), f sia derivabile parzialmente rispetto ad ogni variabile in x; ii) le derivate parziali ∂f ∂f ,... , ∂x1 ∂xn sono continue in x0 . Allora f è differenziabile in x0 . Dimostrazione. Per brevità, si dimostra la tesi nel caso in cui f sia una funzione di due variabili reali derivabile parzialmente rispetto ad x e rispetto ad y in ogni elemento della sfera Bδ (x0 , y0 ) con derivate parziali continue in (x0 , y0 ). Bisogna allora dimostrare che lim (x,y)→(x0 ,y0 ) f (x, y) − f (x0 , y0 ) − ∂f (x0 , y0 ) (x − x0 ) − ∂x √ (x − x0 )2 + (y − y0 )2 ∂f (x0 , y0 ) (y ∂y − y0 ) =0. A tal fine, si fissi ε > 0 e, dalla continuità delle derivate parziali in (x0 , y0 ), si considerino δ1 > 0 e δ2 > 0 tali che ∀(x, y) ∈ Bδ1 (x0 , y0 ) : ∀(x, y) ∈ Bδ2 (x0 , y0 ) : ∂f (x, y) − ∂x ∂f (x, y) − ∂y ε ∂f (x0 , y0 ) < , ∂x 2 ε ∂f (x0 , y0 ) < . ∂y 2 Si ponga ora δ0 = min{δ, δ1 , δ2 }; si passa a riconoscere che, per ogni (x, y) ∈ Bδ0 (x0 , y0 ), si ha (x0 , y0 ) (x − x0 ) − ∂f (x0 , y0 ) (y − y0 ) f (x, y) − f (x0 , y0 ) − ∂f ∂x ∂y √ <ε (x − x0 )2 + (y − y0 )2 e ciò completerà la dimostrazione. Sia (x, y) ∈ Bδ0 (x0 , y0 ) e si supponga x ̸= x0 e y ̸= y0 . Denotati con I(x0 , x) e rispettivamente I(y0 , y) gli intervalli aperti di estremi x0 ed x e rispettivamente y0 ed y, ¯ 0 , x) → R e φ2 : I(y ¯ 0 , y) → R definite ponendo si considerino le funzioni φ1 : I(x ¯ 0 , x) : φ1 (t) = f (t, y) , ∀t ∈ I(x ¯ 0 , y) : φ2 (s) = f (x0 , s) . ∀s ∈ I(y ¯ 0 , x) si ha (t, y) ∈ Bδ (x0 , y0 ) e analogamente, per ogni Si osservi che, per ogni t ∈ I(x 0 ¯ 0 , y), si ha (x0 , s) ∈ Bδ (x0 , y0 ) e quindi φ1 e φ2 sono derivabili e si ha s ∈ I(y 0 ¯ 0 , x) : φ′ (t) = ∀t ∈ I(x 1 ∂f (t, y) , ∂x ¯ 0 , y) : φ′ (s) = ∀s ∈ I(y 2 ∂f (x0 , s) . ∂y Capitolo 12: Calcolo differenziale in più variabili 366 Dal teorema di Lagrange (Teorema 9.2.3 per le funzioni di una variabile), esistono ξ ∈ I(x0 , x) ed η ∈ I(y0 , y) tali che φ1 (x) − φ1 (x0 ) = (x − x0 ) φ′1 (ξ) , φ2 (y) − φ1 (y0 ) = (y − y0 ) φ′2 (η) , da cui f (x, y) − f (x0 , y) = (x − x0 ) ∂f (ξ, y) , ∂x f (x0 , y) − f (x0 , y0 ) = (y − y0 ) ∂f (x0 , η) . ∂y Tenendo infine presente che √ √ √ |x − x0 | (x − x0 )2 + (y − y0 )2 |y − y0 | (x − x0 )2 + (y − y0 )2 = √ = (x − x0 )2 ≤1, (x − x0 )2 + (y − y0 )2 (y − y0 )2 ≤1, (x − x0 )2 + (y − y0 )2 si ottiene (x0 , y0 ) (x − x0 ) − f (x, y) − f (x0 , y0 ) − ∂f ∂x √ (x − x0 )2 + (y − y0 )2 ≤ ≤ ∂f (x0 , y0 ) (y ∂y − y0 ) (x0 , y0 ) (x − x0 ) f (x0 , y) − f (x0 , y0 ) − ∂f (x0 , y0 ) (y − y0 ) f (x, y) − f (x0 , y) − ∂f ∂x ∂y √ √ + 2 2 2 (x − x0 ) + (y − y0 ) (x − x0 ) + (y − y0 )2 ∂f (ξ, y) ∂x √ − ∂f (x0 , y0 ) ∂x |x − x0 | (x − x0 )2 + (y − y0 )2 + ∂f (x0 , η) ∂y √ − ∂f (x0 , y0 ) ∂y |y − y0 | (x − x0 )2 + (y − y0 )2 ε ε |x − x0 | |y − y0 | √ √ + 2 2 2 2 (x − x0 ) + (y − y0 ) (x − x0 )2 + (y − y0 )2 ε ε ≤ + =ε. 2 2 < Infine si osserva che se (x, y) = (x0 , y0 ) la diseguaglianza precedente è ovvia, mentre se x = x0 e y ̸= y0 oppure x ̸= x0 e y = y0 , si può procedere in maniera del tutto analoga considerando solamente la funzione φ2 oppure φ1 . Gli esempi seguenti mettono in evidenza il fatto che le condizioni fornite dal teorema precedente sono solamente sufficienti e non necessarie per assicurare la differenziabilità; pertanto, nei casi in cui le ipotesi del teorema precedente non siano soddisfatte bisogna procedere ad una verifica diretta della differenziabilità. Esempi 12.3.7 1. Si consideri la funzione f : R2 → R definita ponendo, per ogni (x, y) ∈ R2 , f (x, y) := |xy| . Per ogni (x0 , y0 ) ∈ R2 , si ha lim t→0 f (x0 + t, y0 ) − f (x0 , y0 ) |x0 + t| − |x0 | = |y0 | lim t→0 t t 12.3 Derivate direzionali e parziali e differenziabilità 367 e quindi f è derivabile parzialmente rispetto ad x in Ax := {(x0 , y0 ) ∈ R2 | x0 ̸= 0} ∪ {(0, 0)} ed in ognuno di tali punti si ha ∂f (x0 , y0 ) = |y0 | ; ∂x analogamente, essendo f (x0 , y0 + t) − f (x0 , y0 ) |y0 + t| − |y0 | = |x0 | lim t→0 t→0 t t lim si deduce che f è derivabile parzialmente rispetto ad y in Ay := {(x0 , y0 ) ∈ R2 | y0 ̸= 0} ∪ {(0, 0)} ed in ognuno di tali punti si ha ∂f (x0 , y0 ) = |x0 | . ∂y Segue allora che in tutti i punti (x0 , y0 ) ∈ R2 tali che x0 ̸= 0 e y0 ̸= 0 si può applicare il teorema del differenziale totale e si conclude che f è differenziabile in tali punti con df (x0 , y0 )(x, y) = |y0 |x + |x0 |y per ogni (x, y) ∈ R2 . Nei punti degli assi diversi dall’origine la funzione non è differenziabile in quanto almeno uno delle derivate parziali non esiste in tali punti. Rimane da discutere il punto (x0 , y0 ) = (0, 0) in cui esistono e si annullano entrambe le derivate parziali, ma non si può applicare il teorema del differenziale totale in quanto le derivate parziali non sono definite in tutto un intorno del punto (0, 0). Tuttavia, usando la definizione, si riconosce subito che lim (x,y)→(0,0) f (x, y) − f (0, 0) ∥(x, y) − (0, 0)∥ |xy| √ x2 + y 2 ρ2 | sin θ cos θ| = lim+ =0, ρ ρ→0 = lim (x,y)→(0,0) e quindi la funzione è differenziabile in (0, 0). 2. Si consideri ora la funzione f : R2 → R definita ponendo, per ogni (x, y) ∈ R2 , { 2 1 (x, y) ̸= (0, 0) , (x + y 2 ) sin x2 +y 2 , f (x, y) := 0, (x, y) = (0, 0) . Capitolo 12: Calcolo differenziale in più variabili 368 Si riconosce facilmente che, per ogni (x0 , y0 ) ∈ R2 r {(0, 0)}, si ha ∂f 1 2x0 1 (x0 , y0 ) = 2x0 sin 2 − 2 cos 2 , 2 2 ∂x x0 + y0 x0 + y0 x0 + y02 ∂f 1 2y0 1 (x0 , y0 ) = 2y0 sin 2 − 2 cos 2 , 2 2 ∂y x0 + y0 x0 + y0 x0 + y02 e quindi, per il teorema del differenziale totale, f è differenziabile in tutti i punti diversi dall’origine. Nel punto (0, 0) si ha ∂f t2 sin(1/t2 ) 1 (0, 0) = lim = lim t sin 2 = 0 t→0 t→0 ∂x t t e analogamente ∂f (0, 0) = 0; inoltre ∂y f (x, y) − f (0, 0) lim (x,y)→(0,0) ∥(x, y) − (0, 0)∥ 1 (x2 + y 2 ) sin x2 +y 2 √ = lim 2 2 (x,y)→(0,0) x +y √ 1 = lim x2 + y 2 sin 2 x + y2 (x,y)→(0,0) 1 = lim+ ρ sin 2 = 0 , ρ ρ→0 e quindi la funzione è differenziabile in (0, 0). 12.3.4 Derivate successive e formula di Taylor Siano A un sottoinsieme di Rn ed f : A → R una funzione reale di n-variabili reali. Fissato i = 1, . . . , n, si può considerare l’insieme ◦ A′i := {x0 ∈ A | f è derivabile parzialmente in x0 rispetto ad xi } e conseguentemente si può definire la funzione g : A′i → R definita ponendo, per ogni x ∈ A′i , ∂f g(x) := (x) , ∂xi la quale viene denominata funzione derivata parziale i-esima di f . Se x0 ∈ A′i e se j = 1, . . . , n, si dice che f è derivabile parzialmente due volte in x0 rispetto alle variabili xi ed xj se sono soddisfatte le seguenti condizioni 12.3 Derivate direzionali e parziali e differenziabilità 369 i) x0 è interno a A′i (cioè, f è derivabile parzialmente rispetto ad xi in un intorno di x0 ); ii) la derivata parziale ∂f è derivabile in x0 rispetto ad xj . ∂xi In tal caso, si pone ∂ ∂2f (x0 ) := ∂xj ∂xi ∂xj ( ∂f ∂xi ) (x0 ) . ◃ In generale, se f è derivabile parzialmente due volte in x0 rispetto alle variabili xi ed xj non è detto che lo sia rispetto alle variabili xj ed xi ed anche quando ciò accade non si può assicurare l’uguaglianza ∂2f ∂2f (x0 ) = (x0 ) . ∂xi ∂xj ∂xj ∂xi ◃ Ad esempio, la funzione f : R2 → R definita ponendo, per ogni (x, y) ∈ R2 , f (x, y) := |x| + y , è derivabile due volte in (0, 0) rispetto alle variabili y ed x, ma non rispetto alle variabili x ed y in quanto in (0, 0) non esiste la derivata parziale di f rispetto ad x. ◃ Il seguente risultato garantisce delle condizioni in cui l’ordine di derivazione può essere invece invertito. Teorema 12.3.8 (Teorema di Schwarz sull’invertibilità dell’ordine di derivazione) Siano A un sottoinsieme di Rn , f : A → R una funzione reale ed x0 un punto interno ad A. Siano i, j = 1, . . . , n e si supponga che i) Esiste un intorno di x0 in cui esistono le derivate parziali ∂f , ∂xi ∂f , ∂xj ∂2f , ∂xj ∂xi ii) Le derivate parziali seconde ∂2f , ∂xj ∂xi sono continue in x0 . ∂2f . ∂xi ∂xj ∂2f . ∂xi ∂xj 370 Capitolo 12: Calcolo differenziale in più variabili Allora si ha ∂2f ∂2f (x0 ) = (x0 ) . ∂xj ∂xi ∂xi ∂xj ◃ In maniera del tutto analoga, si possono definire le derivate di ordine superiore. Il significato del simbolo ∂3f (x0 ) ∂xk ∂xj ∂xi è da intendersi come ∂ ∂xk ( ∂2f ∂xj ∂xi ) (x0 ) , 2 f supposto che la derivata parziale seconda ∂x∂j ∂x esista in tutto un intorno i del punto x0 . Se le derivate parziali sono continue, dal Teorema 12.3.8 di Schwarz segue che non è importante specificare l’ordine in cui si effettuano le derivazioni parziali ma solamente quante volte viene effettuata la derivata parziale rispetto ad ogni variabile. A tal fine, risulta molto utile introdurre i multi-indici, che consentono di esprimere in maniera più sintetica anche derivate di ordine elevato. Un multi-indice α = (α1 , . . . , αn ) è da intendersi semplicemente come una n-pla di numeri naturali (quindi, per ogni i = 1, . . . , n, si ha αi ∈ N). Inoltre, si definisce lunghezza del multi-indice α il seguente numero naturale |α| := α1 + · · · + αn . Se f è derivabile parzialmente |α| volte in un punto x0 e se le sue derivate parziali sono continue in x0 , il simbolo Dα f (x0 ) , ∂ |α| f (x0 ) n · · · xα n 1 ∂xα 1 denota la derivata parziale di f in x0 fatta α1 volte rispetto alla variabile x1 , α2 volte rispetto alla variabile x2 e cosı̀via fino ad αn volte rispetto alla variabile xn . ◃ Anche per le funzioni di più variabili è possibile enunciare un’analogo della formula di Taylor per le funzioni di una variabile reale. Conviene tuttavia ricorrere alle potenze simboliche per esprimere tale formula nel modo più semplice. Per potenza simbolica bisogna intendere formalmente una potenza del tipo ( )(h) ∂f ∂f φ1 (x) (x0 ) + · · · + φn (x) (x0 ) ∂x1 ∂xn 12.3 Derivate direzionali e parziali e differenziabilità 371 dove l’ordine delle potenze è da intendere come ordine delle derivate parziali da considerare. Quindi, ad esempio, ( )(3) ∂f ∂f x (x0 , y0 ) + y (x0 , y0 ) ∂x ∂y 3 3 ∂3f ∂3f 2 2 ∂ f 3 ∂ f = x3 (x , y ) + 3x (x , y ) + 3xy (x , y ) + y (x0 , y0 ) . y 0 0 0 0 0 0 ∂x3 ∂x2 ∂y ∂x ∂y 2 ∂y 3 Con tale notazione, la formula di Taylor può essere enunciata come segue. Teorema 12.3.9 (Formula di Taylor per funzioni di più variabili) Siano A un sottoinsieme aperto di Rn ed f : A → R una funzione reale dotata di tutte le derivate parziali fino all’ordine p + 1 continue in A. Se x0 = ((x0 )1 , . . . , (x0 )n ) ∈ A e se x = (x1 , . . . , xn ) ∈ A r {x0 } è tale che il segmento S[x0 , x] di estremi x0 ed x sia contenuto in A, allora esiste almeno un punto ξ ∈ A, interno al segmento S[x0 , x], tale che f (x) ( p ∑ 1 ∂f (x0 ) (x1 − (x0 )1 ) + . . . (12.3.10) h! ∂x1 h=1 )(h) ∂f + (x0 ) (xn − (x0 )n ) ∂xn ( )(p+1) 1 ∂f ∂f + (ξ) (x1 − (x0 )1 ) + · · · + (ξ) (xn − (x0 )n ) (p + 1)! ∂x1 ∂xn p ∑ 1 1 = f (x0 ) + (∇f (x0 )|x − x0 )(h) + (∇f (ξ)|x − x0 )(p+1) . h! (p + 1)! = f (x0 ) + h=1 Se p = 0, il teorema precedente fornisce una generalizzazione del Teorema 9.2.3 di Lagrange al caso delle funzioni di più variabili reali. Teorema 12.3.10 (Teorema di Lagrange per funzioni di più variabili) Siano A un sottoinsieme aperto di Rn ed f : A → R una funzione reale dotata di tutte le derivate parziali continue in A. Se x0 = ((x0 )1 , . . . , (x0 )n ) ∈ A e se x = (x1 , . . . , xn ) ∈ A r {x0 } è tale che il segmento S[x0 , x] di estremi x0 ed x sia contenuto in A, allora esiste almeno un punto ξ ∈ A, interno al segmento S[x0 , x], tale che f (x) − f (x0 ) ∂f ∂f (ξ) (x1 − (x0 )1 ) + · · · + (ξ) (xn − (x0 )n ) ∂x1 ∂xn = (∇f (ξ)|x − x0 ) . (12.3.11) = 372 12.3.5 Capitolo 12: Calcolo differenziale in più variabili Differenziabilità delle funzioni composte Sia A un sottoinsieme di Rn e sia m ≥ 1. Una funzione f : A → Rk viene denominata funzione vettoriale di n-variabili reali. Per ogni k = 1, . . . , m, si può considerare la funzione reale fk : A → R definita ponendo, per ogni x ∈ A, fk (x) := (f (x)|ek ) , la quale viene denominata componente k-esima della funzione f (ek denota il vettore k-esimo della base canonica in Rm e (·|·) il prodotto scalare in Rm ). Dalle proprietà del prodotto scalare segue subito, per ogni x ∈ A, f (x) := (f1 (x), . . . , fm (x)) , e per mettere in evidenza questa circostanza si scrive spesso f = (f1 , . . . , fm ). Per le funzioni vettoriali possono essere introdotti tutti i concetti visti per quelle reali attribuendoli ad ogni componente. Ad esempio, si fissino un sottoinsieme A di Rn ed una funzione vettoriale f : A → Rm . Se x0 ∈ Rn è un punto di accumulazione per A e se ℓ = (ℓ1 , . . . , ℓm ) ∈ Rm , si dice che ℓ è il limite di f in x0 e si scrive limx→x0 f (x) = ℓ se, per ogni k = 1, . . . , m, si ha limx→x0 fk (x) = ℓk (ciò, in effetti, equivale alla seguente condizione ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A r {x0 } : ∥x − x0 ∥ < δ ⇒ ∥f (x) − ℓ∥ < ε ). Analogamente, se x0 ∈ A, si dirà che f è continua in x0 se, per ogni k = 1, . . . , m, la componente k-esima fk di f è continua in x0 (ciò equivale alla seguente condizione ∀ ε > 0 ∃ δ > 0 t.c. ∀ x ∈ A : ∥x − x0 ∥ < δ ⇒ ∥f (x) − f (x0 )∥ < ε ). Nello stesso modo, se x0 è interno ad A e se v ∈ Rn è una direzione di Rn , si dice che f è derivabile in x0 secondo la direzione v se ogni fk , k = 1, . . . , m, è derivabile in x0 secondo la direzione v e, in tal caso, si pone ( ) ∂f ∂f1 ∂fm (x0 ) := (x0 ), . . . , (x0 ) . ∂v ∂v ∂v Se v = ei , i = 1, . . . , n, la derivata di f in x0 rispetto alla direzione ei viene ∂f denominata derivata parziale i-esima di f in x0 e denotata con (x0 ); ∂xi quindi ( ) ∂f1 ∂fm ∂f (x0 ) := (x0 ), . . . , (x0 ) . ∂xi ∂xi ∂xi Infine, si dice che f è differenziabile in un punto interno x0 ∈ A se ogni fk , k = 1, . . . , m, è differenziabile in x0 . In tal caso il differenziale 12.3 Derivate direzionali e parziali e differenziabilità 373 df (x0 ) : Rn → Rm è una funzione lineare da Rn in Rm le cui componenti sono i differenziali delle funzioni fk ; pertanto df (x0 ) = (df1 (x0 ), . . . , dfm (x0 )) . Si supponga che f sia differenziabile in x0 . Allora, si può considerare la matrice di tipo (m, n) ( J(f, x0 ) := = = ) ∂fi (x0 ) i=1,...,m ∂xj j=1,...,n ∂f1 ∂f1 (x ) (x0 ) . . . ∂x1 0 ∂x 2 ∂f ∂f2 2 (x0 ) (x0 ) . . . ∂x1 ∂x2 .. .. .. . . . ∂f ∂fm m (x0 ) (x0 ) . . . ∂x1 ∂x 2 ∇f1 (x0 ) ∇f2 (x0 ) , .. . ∇fm (x0 ) (12.3.12) ∂f1 (x0 ) ∂xn ∂f2 (x0 ) ∂xn .. . ∂fm (x0 ) ∂xn la quale viene denominata matrice jacobiana di f in x0 . Se m = n, il suo determinante det J(f, x0 ) viene denominato determinante jacobiano di f in x0 e denotato con ∂(f1 , . . . , fn ) (x0 ) . ∂(x1 , . . . , xn ) Dall’espressione del differenziale si ricava in maniera immediata, per ogni x = (x1 , . . . , xn ) ∈ Rn ,4 n n ∑ ∑ ∂f1 ∂fm df (x0 )(x) = J(f, x0 ) · x = (x0 ) xj , . . . , (x0 ) xj . ∂x ∂xj j j=1 j=1 Inoltre, vale il seguente importante risultato sulla differenziabilità delle funzioni composte. 4 L’elemento x ∈ Rn può essere identificato all’occorrenza sia con una matrice di tipo (1, n) che di tipo (n, 1), come nel caso in esame; il prodotto tra matrici fornisce in questo caso una matrice di tipo (m, 1) che si può identificare a sua volta con un elemento di Rm . Capitolo 12: Calcolo differenziale in più variabili 374 Teorema 12.3.11 (Differenziabilità delle funzioni composte) Siano A un sottoinsieme di Rn , B un sottoinsieme di Rm ed f : A → Rm e g : B → Rp tali che f (A) ⊂ B. Sia x0 ∈ A un punto interno ad A e si supponga che f sia differenziabile in x0 e inoltre, posto y0 := f (x0 ), si supponga che y0 sia un punto interno a B e che g sia differenziabile in y0 . Allora, la funzione composta g ◦ f : A → Rp è differenziabile in x0 e si ha J(g ◦ f ) = J(g, y0 ) · J(f, x0 ) . (12.3.13) In particolare, per ogni h = 1, . . . , p e per ogni i = 1, . . . , n, risulta ∑ ∂gh ∂(g ◦ f )h ∂fj (x0 ) = (y0 ) (x0 ) . ∂xi ∂y ∂xi j j=1 m ◃ In particolare, si consideri una funzione φ : I → Rn definita in un intervallo aperto I e derivabile in un punto t0 ∈ I e siano A un sottoinsieme aperto di Rn tale che φ(I) ⊂ A ed f : A → R una funzione differenziabile in x0 := φ(t0 ). Allora, la funzione composta f ◦ φ : I → R è derivabile in t0 e si ha n ∑ ∂f (f ◦ φ)′ (t0 ) = (x0 ) φ′j (t0 ) = (∇f (x0 )|φ′ (t0 )) , ∂x j j=1 dove, per ogni j = 1, . . . , n, φj denota la componente j-esima della funzione vettoriale φ. 12.4 Punti di massimo e minimo relativo Sia f : A → R una funzione reale definita in un sottoinsieme A di Rn . Si dice che un elemento x0 ∈ A è un punto di massimo (rispettivamente, di minimo) relativo per f se è verificata la seguente condizione ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) : f (x) ≤ f (x0 ) (12.4.1) (rispettivamente, ∃ δ > 0 t.c. ∀ x ∈ A ∩ Bδ (x0 ) : f (x0 ) ≤ f (x) ). Se nella condizione precedente si suppone che valga una diseguaglianza stretta per ogni x ∈ A ∩ Bδ (x0 ) r {x0 }, allora il punto di massimo (rispettivamente, di minimo) viene denominato proprio. Una prima condizione necessaria viene indicata dalla seguente proposizione. Proposizione 12.4.1 (Prima condizione necessaria per punti di massimo e minimo relativo per funzioni di più variabili) 12.4 Punti di massimo e minimo relativo 375 Siano A un sottoinsieme di Rn , f : A → R una funzione reale ed x0 un punto interno ad A. Se x0 è un punto di massimo (rispettivamente, di minimo) relativo per f e se f è differenziabile in x0 , allora si ha ∀ i = 1, . . . , n : ∂f (x0 ) = 0 . ∂xi (12.4.2) Dimostrazione. Sia i = 1, . . . , n e si consideri la funzione fx0 ,ei : Ix0 ,ei → R prevista nella Definizione 12.3.1. Poiché f è differenziabile in x0 , essa è derivabile parzialmente rispetto alla variabile xi in x0 ; pertanto, la funzione fx0 ,ei è derivabile in 0 e poiché 0 è un punto di massimo (rispettivamente, di minimo) relativo per fx0 ,ei , deve essere fx′ 0 ,ei (0) = 0, da cui ∂f (x0 ) = fx′ 0 ,ei (0) = 0 . ∂xi Nelle ipotesi delle Proposizione 12.4.1, si deve avere df (x0 ) = 0. Se f : A → R è una funzione reale definita in un sottoinsieme A di Rn , un punto interno x0 ∈ viene denominato punto stazionario per f se f è differenziabile in x0 e df (x0 ) = 0. Dalla Proposizione 12.4.1 precedente, si ricava che i punti di massimo e di minimo relativo interni in cui la funzione è differenziabile sono necessariamente punti stazionari per la funzione. Può comunque accadere che un punto stazionario x0 non risulti né di massimo né di minimo relativo per f . In tal caso il punto x0 viene denominato punto di sella per f . La proposizione precedente suggerisce il seguente metodo per la ricerca dei punti di massimo e di minimo relativo. Osservazione 12.4.2 (Ricerca dei punti di massimo e minimo relativo per funzioni di più variabili) Sia f : A → R una funzione reale definita in un sottoinsieme A di Rn . Allora i punti di massimo e di minimo relativo per f vanno ricercati tra: 1. I punti interni stazionari per f ; tali punti si ottengono considerando il sistema di n equazioni ∂f (x1 , . . . , x1 ) = 0 , ∂x1 ∂f (x1 , . . . , x2 ) = 0 , ∂x1 .. . ∂f (x1 , . . . , xn ) = 0 , ∂x1 376 Capitolo 12: Calcolo differenziale in più variabili nelle incognite x1 , . . . , xn . Ogni soluzione di tale sistema richiede poi un’ulteriore indagine per verificare che si tratti effettivamente di un punto di massimo o di minimo relativo per f oppure di un punto di sella (si vedano le condizioni necessarie e sufficienti successive). 2. I punti interni in cui la funzione non è differenziabile. Tali punti richiedono un’analisi diretta caso per caso atta a verificare se si tratta o meno di punti di massimo o minimo relativo per f . 3. I punti sulla frontiera. La ricerca dei punti di massimo e di minimo relativo sulla frontiera può essere in parte ricondotta allo studio dei massimi e minimi vincolati per f ; bisogna tuttavia tener presente che un massimo o un minimo relativo della restrizione di f alla frontiera di A potrebbe non essere un punto di massimo o di minimo relativo per f . Nel seguito della presente sezione si approfondisce l’analisi dei punti di massimo e minimo relativo considerati al punto 1. dell’Osservazione 12.4.2. Si consideri una funzione f : A → R definita in un sottoinsieme A di Rn e sia x0 un punto interno di A in cui f è dotata di tutte le derivate parziali seconde continue. Allora si può considerare la matrice jacobiana J(∇f, x0 ) del gradiente di f in x0 . Tale matrice viene denominata matrice hessiana di f in x0 e denotata con il simbolo H(f, x0 ). Più esplicitamente, si ha ( ) ∂2f H(f, x0 ) := J(∇f, x0 ) = (x0 ) (12.4.3) ∂xi ∂xj i,j=1,...,n ∂2f ∂2f ∂2f (x0 ) (x0 ) . . . (x0 ) ∂x21 ∂x1 ∂x2 ∂x1 ∂xn 2 2 2 ∂ f ∂ f ∂ f (x ) . . . (x ) (x ) 0 0 2 ∂x1 ∂x2 0 ∂x2 ∂x2 ∂xn = . .. .. .. . . . . . . 2 2 2 ∂ f ∂ f ∂ f (x ) (x0 ) (x0 ) . . . 0 2 ∂x1 ∂xn ∂x2 ∂xn ∂xn Si osserva che la matrice hessiana è una matrice quadrata di ordine n simmetrica (per il Teorema 12.3.8 di Schwarz). Per ogni k = 1, . . . , n, il minore principale5 di H(f, x0 ) di ordine k viene denominato minore hessiano di ordine k di f in x0 e denotato con Hk (f, x0 ). 5 Si ricorda che se M := (a ) ij i,j=1,...,n è una matrice quadrata di ordine n e se k = 1, . . . , n, viene denominato minore principale di ordine k di M il determinante Mk della matrice Mk := (aij )i,j=1,...,k che si ottiene da M considerando le prime k righe e 12.4 Punti di massimo e minimo relativo 377 In particolare, Hn (f, x0 ) (cioè, il determinante della matrice hessiana di f in x0 ) viene denominato hessiano di f in x0 e denotato con H(f, x0 ). In tutte le notazioni assunte sopra la funzione f può essere omessa se ciò non dà luogo ad equivoci; pertanto la matrice hessiana, i minori hessiani e l’hessiano possono essere rispettivamente denotati con H(x0 ), Hk (x0 ) ed H(x0 ). La matrice hessiana consente di stabilire le seguenti ulteriori condizioni per massimi e minimi relativi. Proposizione 12.4.3 (Seconda condizione necessaria per punti di massimo e minimo relativo per funzioni di più variabili) Siano A un sottoinsieme di Rn , f : A → R una funzione reale ed x0 un punto interno ad A. Si supponga che f sia derivabile parzialmente due volte in x0 rispetto a tutte le variabili; se x0 è un punto di massimo (rispettivamente, di minimo) relativo per f , allora si ha ∀ k = 1, . . . , n : (−1)k Hk (f, x0 ) ≥ 0 , (12.4.4) (rispettivamente, ∀ k = 1, . . . , n : Hk (f, x0 ) ≥ 0 ). Teorema 12.4.4 (Condizione sufficiente per punti di massimo e minimo relativo per funzioni di più variabili) Siano A un sottoinsieme di Rn , f : A → R una funzione reale, x0 un punto interno ad A e si supponga che f sia derivabile parzialmente due volte in x0 rispetto a tutte le variabili. Se sono soddisfatte le seguenti condizioni i) per ogni i = 1, . . . , n: ∂f (x0 ) = 0, ∂xi ii) per ogni k = 1, . . . , n: (−1)k Hk (f, x0 ) > 0 (rispettivamente, per ogni k = 1, . . . , n: Hk (f, x0 ) > 0), allora x0 è un punto di massimo (rispettivamente, di minimo) relativo proprio per f . Osservazione 12.4.5 Si supponga che A sia un sottoinsieme di R2 e che f : A → R sia una funzione di 2 variabili reali dotata delle derivate parziali seconde in un punto stazionario interno (x0 , y0 ) di A. Tenendo conto delle le prime k colonne; quindi Mk := a11 .. . ak1 ... .. . ... a1k .. . akk . Capitolo 12: Calcolo differenziale in più variabili 378 condizioni necessarie e di quelle sufficienti ottenute nei risultati precedenti si ha quanto segue 1. Se H(x0 , y0 ) > 0, il punto è necessariamente di massimo oppure di minimo relativo proprio per f . Infatti, si osserva che le derivate par∂2f ∂2f ziali (x0 ) e (x0 ) devono essere necessariamente diverse da 0 2 ∂x ∂y 2 ed avere lo stesso segno altrimenti si avrebbe H(x0 , y0 ) = ∂2f ∂2f (x ) (x0 ) − 0 ∂x2 ∂y 2 ( ∂2f (x0 ) ∂x ∂y )2 ≤0. Pertanto, tenendo conto del Teorema 12.4.4, si ha in questo caso che ∂2f (x0 , y0 ) è un punto di massimo relativo proprio per f se (x0 ) < 0 ∂x2 2 ∂ f (o equivalentemente (x0 ) < 0) ed è un punto di minimo relativo ∂y 2 ∂2f ∂2f proprio per f se (x0 ) > 0 (o equivalentemente (x0 ) > 0). 2 ∂x ∂y 2 2. Se H(x0 , y0 ) = 0, è soddisfatta in ogni caso la condizione necessaria fornita dalla Proposizione 12.4.3 ma non la condizione sufficiente del Teorema 12.4.4. Quindi in questo caso non si può dire nulla e bisogna ricorrere ad altri strumenti per determinare se (x0 , y0 ) è oppure meno un punto di massimo o di minimo relativo per f . 3. Se H(x0 , y0 ) < 0, la condizione necessaria fornita dalla Proposizione 12.4.3 non è soddisfatta e quindi (x0 , y0 ) non può essere né un punto di massimo né un punto di minimo relativo per f . Quindi (x0 , y0 ) è un punto di sella per f . 12.5 Massimo e minimo assoluto Una volta determinati i punti di massimo e minimo relativo può essere discussa anche l’eventuale esistenza del massimo e del minimo assoluto della funzione. Se la funzione in esame è definita e continua in un insieme chiuso e limitato essa è sicuramente dotata di minimo e di massimo (assoluto) per il Teorema 12.2.3 di Weierstrass, e in tal caso il massimo ed il minimo assoluto possono essere ottenuti confrontando i valori della funzione in tutti i punti di massimo o di minimo relativo. Nei casi in cui non è possibile garantire l’esistenza del massimo e del minimo assoluto, si procede come segue: 12.5 Massimo e minimo assoluto 379 Osservazione 12.5.1 (Ricerca dei punti di massimo e minimo assoluto per funzioni di più variabili) Sia f : A → R una funzione reale definita in un sottoinsieme A di Rn . Allora si procede come segue: 1. Si determinano i punti di massimo e di minimo relativo per f come previsto nell’Osservazione 12.4.2 ed in ognuno di tali punti si calcola il valore della funzione. Conviene tener presente che in questo caso non è necessario stabilire se i punti ottenuti dall’Osservazione 12.4.2 siano effettivamente punti di massimo o minimo relativo per f in quanto si è interessati solamente al confronto dei valori della funzione in tali punti. In particolare, non è necessario condurre l’analisi sui minore della matrice hessiana nei punti stazionari interni. 2. Potrebbe a questo punto accadere che non esiste il più grande (o il più piccolo) valore della funzione nei punti cosı̀ottenuti6 e in tal caso si potrà concludere che il massimo assoluto (o il minimo assoluto) della funzione non esiste in quanto i punti di massimo o minimo assoluto sono necessariamente anche punti di massimo o minimo relativo. Se, invece, esiste il valore più grande Mf ∈ R (oppure più piccolo mf ∈ R) nei punti ottenuti, esso potrebbe essere il massimo (oppure il minimo) assoluto della funzione ed i punti in cui esso viene assunto potrebbero cosı̀essere i punti di massimo (o minimo) assoluto della funzione. 3. Si confronta Mf (oppure mf ) con il comportamento della funzione nei punti in cui essa è definita ma non è continua oppure i punti di accumulazione in cui la funzione non è definita. Tale comportamento viene studiato considerando il limite della funzione oppure, nel caso in cui esso non esista, considerando il limite minimo e quello massimo. Se in uno di tali punti il valore del limite o del limite massimo è strettamente maggiore di Mf , si conclude che f non è dotata di massimo assoluto, mentre se accade che in ognuno di tali punti il limite o il limite massimo è minore o uguale di Mf , allora Mf è il massimo assoluto della funzione. Analogamente, se in uno dei punti considerati il valore del limite o del limite minimo è strettamente minore di mf , si conclude che f non è dotata di minimo assoluto, mentre se accade che in ognuno di tali punti il limite o il limite minimo è maggiore o uguale di mf , allora mf è il minimo assoluto della funzione. 6 Ad esempio, basta considerare la funzione f : R2 → R definita ponendo, per ogni (x, y) ∈ R2 , f (x, y) := x + sin x − y + sin y. I punti stazionari sono (π + 2hπ, 2kπ) con h, k ∈ Z e in tali punti la funzioni assume il valore f (π + 2hπ, 2kπ) = π + 2(h − k)π. L’insieme di tali valori costituisce un insieme non limitato superiormente né inferiormente. 380 12.6 Capitolo 12: Calcolo differenziale in più variabili Massimi e minimi vincolati Sia assegnata una funzione f : A → R definita in un sottoinsieme A di Rn . Si vogliono ora studiare i massimi ed i minimi relativi di f non in tutto l’insieme A ma in un particolare sottoinsieme di A i cui punti soddisfano l’equazione di un vincolo, ad esempio F (x) = 0 con F : B → R e B ⊂ Rn . Si è pertanto interessati a determinare i massimi e minimi relativi di f|V dove V := A ∩ {x ∈ B | F (x) = 0}. Tali punti vengono denominati di massimo e minimo vincolato per f . Nel caso in cui sia possibile esplicitare una delle variabili dell’equazione F (x1 , . . . , xn ) = 0 in funzione delle altre (cioè risolvere l’equazione rispetto ad una delle variabili si ottiene F (x1 , . . . , xn ) = 0 se e solo se xi = φ(x1 , . . . , xi−1 , xi+1 , . . . , xn ) e quindi il problema posto equivale a determinare massimi e minimi relativi della funzione di n − 1 variabili g(x1 , . . . , xi−1 , xi+1 , . . . , xn ) = f (x1 , . . . , xi−1 , φ(x1 , . . . , xi−1 , xi+1 , . . . , xn ), xi+1 , . . . , xn ) . ◃ Ad esempio, si supponga di voler studiare i massimi e minimi vincolati della funzione f (x, y) := x(x − y 2 ) , (x, y) ∈ R2 , sottoposti al vincolo F (x, y) := x2 − y 2 . Dall’equazione F (x, y) = 0 si ottiene y = ±x e quindi basta studiare massimi e minimi relativi delle funzioni di una variabile g+ (x) := f (x, x) = x(x−x2 ) = x2 (1−x) , g− (x) := f (x, −x) = x2 (1−x) ; pur essendo g+ = g− , esse forniscono punti distinti di massimo e di minimo relativo per f . Infatti, la funzione g+ ammette un massimo relativo in 0 ed un minimo relativo in 2/3; segue che f ha un massimo vincolato in (0, 0) e due minimi vincolati nei punti (2/3, ±2/3), relativi alle funzioni g+ e g− . Si supponga ora che non sia possibile scrivere l’equazione del vincolo in forma esplicita. In questo caso si può ricorrere al metodo dei moltiplicatori di Lagrange. Tale metodo consiste nel considerare una funzione ausiliaria che dipende da n + 1 variabili come di seguito specificato. Si supponga assegnata una funzione f : A → R definita in un sottoinsieme A di Rn e l’equazione di un vincolo F (x) = 0 con F : B → R e B ⊂ Rn . Si consideri la funzione g : (A ∩ B) × R → R definita ponendo, per ogni (x, λ) = (x1 , . . . , xn , λ) ∈ (A ∩ B) × R, g(x, λ) := f (x) + λ F (x) . 12.6 Massimi e minimi vincolati 381 Si può dimostrare che se (x0 , λ0 ) ∈ (A ∩ B) × R è un punto di massimo (oppure di minimo) relativo per g, allora x0 è un punto di massimo (oppure di minimo) vincolato per f . Conseguentemente, per determinare i punti di massimo e di minimo vincolato, si possono studiare i punti stazionari di g che sono forniti dalle soluzioni del sistema di n + 1 equazioni in n + 1 incognite ∂f ∂F ∂g (x1 , . . . , xn , λ) = (x1 , . . . , xn ) + λ (x1 , . . . , xn ) = 0 , ∂x1 ∂x1 ∂x1 ∂g ∂f ∂F (x1 , . . . , xn , λ) = (x1 , . . . , xn ) + λ (x1 , . . . , xn ) = 0 , ∂x2 ∂x2 ∂x2 .. . ∂g ∂f ∂F (x1 , . . . , xn , λ) = (x1 , . . . , xn ) + λ (x1 , . . . , xn ) = 0 , ∂x ∂x ∂x n n n ∂g (x1 , . . . , xn , λ) = F (x1 , . . . , xn ) = 0 . ∂λ Si osservi che l’ultima equazione del sistema precedente fornisce proprio l’equazione del vincolo. ◃ Se vi sono più vincoli, la funzione F può essere supposta vettoriale a valori in Rm con m < n. In questo caso il metodo dei moltiplicatori di Lagrange è analogo al caso precedente aggiungendo tuttavia una nuova variabile per ogni componente di F . Precisamente, si supponga assegnata una funzione f : A → R definita in un sottoinsieme A di Rn e l’equazione di un vincolo F (x) = 0 con F : B → Rm con B ⊂ Rn ed m < n. Si consideri la funzione g : (A ∩ B) × Rm → R definita ponendo, per ogni (x, λ) = (x1 , . . . , xn , λ1 , . . . , λm ) ∈ (A ∩ B) × Rm , g(x, λ) := f (x) + λ1 F (x) + · · · + λm Fm (x) . Anche in questo caso si può dimostrare che se (x0 , λ0 ) ∈ (A ∩ B) × Rm è un punto di massimo (oppure di minimo) relativo per g, allora x0 è un punto di massimo (oppure di minimo) vincolato per f . I punti stazionari di g sono forniti in questo caso dalle soluzioni del 382 Capitolo 12: Calcolo differenziale in più variabili sistema di n + m equazioni in n + m incognite ∂f ∂F1 ∂g (x1 , . . . , xn , λ1 , . . . , λm ) = (x1 , . . . , xn ) + λ1 (x1 , . . . , xn ) ∂x1 ∂x1 ∂x1 ∂Fm + · · · + λm (x1 , . . . , xn ) = 0 , ∂x1 ∂g ∂f ∂F1 (x1 , . . . , xn , λ1 , . . . , λm ) = (x1 , . . . , xn ) + λ1 (x1 , . . . , xn ) ∂x ∂x ∂x2 2 2 ∂Fm + · · · + λm (x1 , . . . , xn ) = 0 , ∂x2 ... ∂g ∂f ∂F1 (x1 , . . . , xn , λ1 , . . . , λm ) = (x1 , . . . , xn ) + λ1 (x1 , . . . , xn ) ∂x ∂x ∂x n n n ∂Fm + · · · + λm (x1 , . . . , xn ) = 0 , ∂xn ∂g (x1 , . . . , xn , λ1 , . . . , λm ) = F1 (x1 , . . . , xn ) = 0 , ∂λ1 ∂g (x1 , . . . , xn , λ1 , . . . , λm ) = F2 (x1 , . . . , xn ) = 0 , ∂λ 2 .. . ∂g (x1 , . . . , xn , λ1 , . . . , λm ) = Fm (x1 , . . . , xn ) = 0 . ∂λm Si osservi che le ultime m equazioni del sistema precedente forniscono proprio l’equazione del vincolo F (x) = 0. Capitolo 13 L’integrale di Riemann in Rn 13.1 Cenni sulla teoria della misura di PeanoJordan in Rn La teoria della misura di Peano-Jordan, sulla quale si fonda quella dell’integrazione di Riemann, ha il vantaggio di essere basata su semplici proprietà geometriche ed inoltre la teoria dell’integrazione da essa dedotta sarà sufficiente per il tipo di funzioni di cui si vuole considerare l’integrale. Si parte dal caso elementare della misura di un intervallo. Sia I = [a, b] un intervallo di estremi a e b in Rn , con a = (a1 , . . . , an ) e b = (b1 , . . . , bn ) tali che ai ≤ bi per ogni i = 1, . . . , n. Allora, tenendo conto dell’ovvio significato geometrico nei casi n = 2 ed n = 3, risulta naturale porre in generale m(I) := n ∏ (bi − ai ) . i=1 Poiché la misura è nulla se i due punti hanno una delle coordinate uguali, tale misura rimane immutata se si considera un intervallo aperto (o semiaperto) anziché un intervallo chiuso. Si passa ora a considerare la misura di un plurintervallo di Rn . Innanzitutto si precisa che un plurintervallo di Rn è unione di un numero finito di intervalli di Rn . Quindi P ⊂ Rn è un plurintervallo di Rn se esistono un Capitolo 13: L’integrale di Riemann in Rn 384 numero finito di intervalli I1 , . . . , Im tali che P = m ∪ Ij . j=1 Per brevità, l’insieme dei plurintervalli di Rn verrà denotato nel seguito con il simbolo P. Se, inoltre, è possibile scegliere gli intervalli I1 , . . . , Im tutti chiusi (rispettivamente, aperti oppure semiaperti) allora anche il plurintervallo viene denominato chiuso (rispettivamente (aperto, semiaperto). Una proprietà importante dei plurintervalli è messa in evidenza della seguente proposizione. Proposizione 13.1.1 Sia P un plurintervallo di Rn . Allora esistono un numero finito I1 , . . . , Im di intervalli di Rn tali che ◦ 1. per ogni j = 1, . . . , m: I j ̸= ∅; ◦ ◦ 2. per ogni j, k = 1, . . . , m, j ̸= k: I j ∩ I k = ∅; 3. P = m ∪ Ij . j=1 Inoltre, se P è un plurintervallo chiuso (rispettivamente, semiaperto), allora gli intervalli I1 , . . . , Im possono essere considerati anch’essi chiusi (rispettivamente, semiaperti). Quindi, ogni plurintervallo P si può esprimere come unione di un numero finito I1 , . . . , Im di intervalli non vuoti e con interni a due a due disgiunti. Tale proprietà consente anche per i plurintervalli di definire la misura in maniera naturale, ponendo m(P ) := m ∑ m(Ij ) . j=1 A questo punto si vuole studiare la misurabilità di un arbitrario sottoinsieme A di Rn . Si supponga in una prima fase che A sia limitato e dotato di punti interni. Tali ipotesi consentono rispettivamente di affermare che esistono sia un intervallo che contiene A sia un intervallo contenuto in A e quindi i seguenti insiemi sono non vuoti: Pe (A) := {P ∈ P | A ⊂ P } , Pi (A) := {P ∈ P | P ⊂ A} . 13.1 Cenni sulla teoria della misura di Peano-Jordan in Rn 385 Risulta ovviamente ∀ P1 ∈ Pi (A), ∀ P2 ∈ Pe (A) : m(P1 ) ≤ m(P2 ) , e quindi l’insieme delle misure dei plurintervalli contenuti in A è limitato superiormente e quello delle misure dei plurintervalli contenenti A è limitato inferiormente. Ha senso quindi porre mi (A) := sup P1 ∈Pi (A) m(P1 ) , me (A) := inf P2 ∈Pe (A) m(P2 ) . Il numero mi (A) viene denominato misura interna secondo Peano-Jordan di A, mentre il numero me (A) viene denominato misura esterna secondo Peano-Jordan di A. Dalle definizioni assunte, segue subito mi (A) ≤ me (A) . Nel caso in cui valga l’uguaglianza mi (A) = me (A), l’insieme A viene detto misurabile secondo Peano-Jordan e in tal caso la sua misura m(A) viene definita ponendo m(A) = mi (A) = me (A) . ◃ Ad esempio, si consideri l’insieme B := {x = (x1 , . . . , xn ) ∈ [0, 1]n | x1 , . . . , xn ∈ Q} e si definisca l’insieme A = B ∪ ([1, 2] × [0, 1]n−1 ). Ovviamente, l’intervallo I1 := [1, 2] × [0, 1]n−1 ha misura 1, mentre l’intervallo I2 := [0, 2] × [0, 1]n−1 ha misura 2 ed inoltre ogni plurintervallo P1 ∈ Pi (A) è contenuto in I1 mentre ogni intervallo P2 ∈ Pe (A) contiene I2 . Conseguentemente mi (A) = m(I1 ) = 1 , me (A) = m(I2 ) = 2 e quindi A non è misurabile secondo Peano-Jordan. ◃ Come ulteriore esempio, si consideri una funzione f : [a, b] → R positiva e limitata in un intervallo chiuso e limitato [a, b]. Si ricorda che il trapezoide di f è il seguente sottoinsieme T (f ) := {(x, y) ∈ R2 | x ∈ [a, b] , 0 ≤ y ≤ f (x)} di R2 (vedasi la Sezione 10.1.3 a pag. 278). Fissata una suddivisione P ∈ Σ([a, b]) di [a, b], la somma superiore S(f, P ) di f relativa a P rappresenta l’area di un plurintervallo contenente T (f ), mentre la somma inferiore s(f, P ) di f relativa a P rappresenta l’area di un plurintervallo contenuto in T (f ). Capitolo 13: L’integrale di Riemann in Rn 386 Allora si ha ∫ b f (x) dx = a e analogamente ∫ b f (x) dx = a inf S(f, P ) = sup s(f, P ) = P ∈Σ([a,b]) P ∈Σ([a,b]) inf m(P ) = me (T (f )) sup m(P ) = mi (T (f )). P ∈Pe (T (f )) P ∈Pi (T (f )) Si deduce, come annunciato nella Sezione 10.1.3, che f è integrabile secondo Riemann se e solo se il trapezoide T (f ) è un sottoinsieme di R2 misurabile secondo Peano-Jordan e, in tal caso, si ha anche ∫ b f (x) dx = m(T (f )) . a ◃ Un’utile caratterizzazione degli insiemi misurabili viene fornita dalla proposizione seguente. Proposizione 13.1.2 (Criterio di misurabilità mediante plurintervalli) Sia A ⊂ Rn limitato e dotato di punti interni. Allora le seguenti proposizioni sono equivalenti: a) A è misurabile secondo Peano-Jordan; b) ∀ ε > 0 ∃ P1 ∈ Pi (A), ∃ P2 ∈ Pe (A) t.c. m(P2 ) − m(P1 ) < ε; b) ∀ ε > 0 ∃ P ∈ P t.c. Fr(A) ⊂ P , m(P ) < ε. ◃ Si supponga ora che A ⊂ Rn sia limitato ma privo di punti interni. In tal caso, esso viene definito misurabile se la sua misura esterna secondo Peano-Jordan è nulla; in tal caso, si pone m(A) = 0. Quindi un sottoinsieme limitato A di Rn privo di punti interni è misurabile se e solo se verifica la seguente condizione ∀ ε > 0 ∃ P ∈ P t.c. A ⊂ P , m(P ) < ε . Dalla caratterizzazione fornita nella Proposizione 13.1.2 si ricava che un sottoinsieme A ⊂ Rn limitato e dotato di punti interni è misurabile se e solo se la sua frontiera è misurabile ed ha misura nulla. ◃ Si supponga infine che A sia un sottoinsieme non limitato di Rn . si dice che A è misurabile secondo Peano-Jordan se sono soddisfatte le seguenti condizioni: 13.1 Cenni sulla teoria della misura di Peano-Jordan in Rn 387 i) Per ogni r > 0: A ∩ Br (0) è misurabile; ii) sup m(A ∩ Br (0)) < +∞. r>0 In tal caso, si pone m(A) := sup m(A ∩ Br (0)) r>0 (= lim m(A ∩ Br (0))) . r→+∞ Ovviamente, anziché le sfere Br (0) con centro l’origine si può considerare una qualsiasi famiglia crescente (Ar )r>0 di sottoinsiemi misurabili di Rn la cui unione sia uguale a tutto Rn . ◃ Ad esempio, si consideri il sottoinsieme di R2 (vedasi la Figura 13.1) { } 1 2 Ap := (x, y) ∈ R | x ≥ 1 , 0 ≤ y ≤ p . x y 1 Ap 0 x 1 Figura 13.1: Esempio di insieme misurabile illimitato. Per ogni r > 1, l’insieme A ∩ [−r, r]2 risulta ovviamente misurabile e inoltre 1−p −1 ∫ r r , p ̸= 1 , 1 2 1−p m(A ∩ [−r, r] ) = dx = p 1 x log r , p=1. Poiché lim m(A ∩ [−r, r] ) = n r→+∞ 1 , p−1 +∞ , p>1, p≤1, si conclude che Ap è misurabile se e solo se p > 1 e, in tal caso, si ha m(Ap ) = 1/(p − 1). Capitolo 13: L’integrale di Riemann in Rn 388 Cenni sull’integrale di Riemann in Rn 13.2 Sia A un sottoinsieme misurabile e limitato di Rn . Si definisce suddivisione di A una successione finita P = (Ai )i=1,...,m di sottoinsiemi di Rn tali che 1. per ogni i = 1, . . . , m: Ai è non vuoto e misurabile; ◦ ◦ 2. per ogni i, j = 1, . . . , m, i ̸= j: Ai ∩ Aj = ∅ (i sottoinsiemi Ai , i = 1, . . . , m, hanno a due a due interni disgiunti); 3. A = m ∪ Ai . i=1 Inoltre, il numero |P | := max m(Ai ) i=1,...,m viene denominato ampiezza della suddivisione P . L’insieme di tutte le suddivisioni di A viene denotato con Σ(A). ◃ Si riconosce facilmente che, fissato ε > 0, esiste sempre una suddivisione di ampiezza minore o uguale ad ε. Infatti, posto δ := ε1/n , per ogni r := (r1 , . . . , rn ) ∈ Zn , si può considerare l’intervallo n ∏ Ir := [ri , ri + δ] . i=1 Poiché A è limitato, solamente un numero finito di tali intervalli hanno intersezione non vuota con A; denotati con I1 , . . . , Im tali intervalli e posto, per ogni j = 1, . . . , m, Aj := Ij ∩ A, si verifica facilmente che la successione finita P = (Ai )i=1,...,m è una suddivisione di A. Inoltre, per ogni j = 1, . . . , m, m(Aj ) ≤ m(Ij ) = δ n = ε da cui |P | ≤ ε. ◃ Sia A un sottoinsieme misurabile e limitato di Rn e si consideri una funzione limitata f : A → R. Se P = (Ai )i=1,...,m è una suddivisione di A, posto ∀ i = 1, . . . , m : Mi := sup f (x) , mi := inf f (x) , x∈Ai x∈Ai si possono definire la somma superiore S(f, P ) e la somma inferiore s(f, P ) di f relativa a P nel modo seguente S(f, P ) := m ∑ i=1 Mi m(Ai ) , s(f, P ) := m ∑ i=1 mi m(Ai ) . 13.2 Cenni sull’integrale di Riemann in Rn 389 Comunque si considerino due suddivisioni P1 , P2 ∈ Σ(A), risulta s(f, P1 ) ≤ S(f, P2 ) . Pertanto il sottoinsieme di R S(f ) := {S(f, P2 ) | P2 ∈ Σ(A)} costituito da tutte le somme superiori di f è limitato inferiormente; l’estremo inferiore di tale sottoinsieme viene denominato integrale superiore di f in A e denotato con uno dei simboli ∫ ∫ ∫ ∫ f, f (x) dx , ··· f (x1 , . . . , xn ) dx1 · · · dxn . A A A Pertanto, l’integrale superiore di f è l’estremo inferiore delle somme superiori di f e soddisfa la seguente condizione, per ogni P1 ∈ Σ(A) ∫ s(f, P1 ) ≤ f. A Da ciò segue che il sottoinsieme di R s(f ) := {s(f, P ) | P ∈ Σ(A)} costituito da tutte le somme inferiori di f è limitato superiormente ed il suo estremo superiore viene denominato integrale inferiore di f in A e denotato con uno dei simboli ∫ ∫ ∫ ∫ f, f (x) dx , · · · f (x1 , . . . , xn ) dx1 · · · dxn . A A A Quindi l’integrale inferiore di f è l’estremo superiore delle somme inferiori di f ; ma l’integrale superiore è un maggiorante delle somme inferiori e da ciò si ottiene ∫ ∫ f≤ f. A A In generale, non ci si può aspettare che nella formula precedente valga un’uguaglianza; per riconoscere ciò si può ricorrere ad esempi analoghi alla funzione di Dirichlet considerata in una variabile, definendo ad esempio la funzione d : [0, 1]n → R ponendo, per ogni x = (x1 , . . . , xn ) ∈ [0, 1]n , { 1, ∀ i = 1, . . . , n : xi ∈ [0, 1] ∩ Q , d(x) := 0, ∃ i = 1, . . . , n t.c. xi ∈ [0, 1] ∩ (R r Q) . Capitolo 13: L’integrale di Riemann in Rn 390 Si riconosce allora che, per ogni suddivisione P ∈ Σ(A), risulta S(d, P ) = 1 , e conseguentemente ∫ s(d, P ) = 0 , ∫ d=0, d=1. A A Definizione 13.2.1 Sia A un sottoinsieme misurabile e limitato di Rn e sia f : A → R una funzione limitata. Si dice che f è integrabile secondo Riemann in A se l’integrale superiore di f coincide con l’integrale inferiore di f ∫ ∫ f= A f. A In tal caso il valore comune dell’integrale superiore ed inferiore di f viene denominato integrale (multiplo) di f e denotato con uno dei seguenti simboli ∫ ∫ ∫ ∫ f, f (x) dx , ··· f (x1 , . . . , xn ) dx1 · · · dxn . A A A L’insieme delle funzioni f : A → R integrabili secondo Riemann in A viene denotato con il simbolo R(A). La definizione adottata generalizza in modo naturale quella già vista per le funzioni di una variabile. Sussiste anche un criterio di integrabilità mediante suddivisioni del tutto analogo al caso di funzioni di una sola variabile. Proposizione 13.2.2 (Criterio di integrabilità mediante suddivisioni) Sia A un sottoinsieme misurabile e limitato di Rn e sia f : A → R una funzione limitata. Allora, le seguenti proposizioni sono equivalenti: a) f è integrabile secondo Riemann in A. b) ∀ ε > 0 ∃ P1 , P2 ∈ Σ(A) t.c. S(f, P2 ) − s(f, P1 ) < ε. c) ∀ ε > 0 ∃ P ∈ Σ(A) t.c. S(f, P ) − s(f, P ) < ε. Il criterio di integrabilità precedente è sufficiente per stabilire l’integrabilità di alcune classi di funzioni, tra cui quelle continue. Teorema 13.2.3 (Integrabilità delle funzioni continue) Sia A un sottoinsieme misurabile e limitato di Rn e sia f : A → R una funzione continua e limitata.1 Allora f è integrabile secondo Riemann in A. 1 L’ipotesi che f sia limitata è automaticamente soddisfatta, per il teorema di Weierstrass, se si suppone che A sia chiuso. 13.2 Cenni sull’integrale di Riemann in Rn 391 ◃ Anche per gli integrali multipli si può fornire un’interpretazione geometrica. Sia A un sottoinsieme misurabile e limitato di Rn e sia f : A → R una funzione limitata e positiva. Si denomina trapezoide relativo ad f di base A e lo si denota con T (f ) il seguente sottoinsieme di Rn+1 T (f ) := {(x, y) ∈ Rn × R | x ∈ A , 0 ≤ y ≤ f (x)} . Dal criterio di integrabilità mediante suddivisioni (Proposizione 13.2.2) e dal criterio di misurabilità mediante plurintervalli (Proposizione 13.1.2) segue che f è integrabile secondo Riemann in A se e solo se T (f ) è un sottoinsieme misurabile di Rn+1 e, in tal caso, si ha ∫ f = m(T (f )) . A Se f : A → R è negativa, si può applicare quanto sopra alla funzione −f e riconoscere che f è integrabile se e solo se il trapezoide T (f ) := {(x, y) ∈ Rn × R | x ∈ A , f (x) ≤ y ≤ 0} è un sottoinsieme misurabile di Rn+1 ; in tal caso, si ha ∫ f = −m(T (f )) . A Nel caso in cui f non abbia segno costante, si può applicare quanto sopra alla parte positiva f+ := sup{f, 0} ed alla parte negativa f− := inf{f, 0} di f. Vista la definizione adottata, l’integrale multiplo soddisfa proprietà analoghe a quelle viste nella Proposizione 10.1.6 e nel Teorema 10.1.7; per brevità si omette di elencare tali proprietà. Per quanto riguarda invece il calcolo degli integrali multipli non si può ricorrere a metodi analoghi a quelli utilizzati per le funzioni di una variabile in quanto non vi è un analogo del concetto di primitiva per una funzione di più variabili. Gli strumenti maggiormente utilizzati sono l’integrazione su domini normali ed il cambiamento di variabili. 13.2.1 Integrazione su domini normali In maniera preliminare si considera separatamente il caso di 2 variabili. Sia A un sottoinsieme di R2 . Si dice che A è un dominio normale rispetto all’asse x (oppure secondo l’asse y) se esistono a, b ∈ R con a < b e due funzioni continue α, β : [a, b] → R tali che α ≤ β e A := {(x, y) ∈ R2 | x ∈ [a, b] , α(x) ≤ y ≤ β(x)} . Capitolo 13: L’integrale di Riemann in Rn 392 Un dominio normale rispetto all’asse x è sicuramente chiuso, limitato e misurabile ed inoltre la sua misura è data da ∫ b m(A) = (β(x) − α(x)) dx . a Se f : A → R è una funzione continua sul dominio normale A rispetto all’asse x vale la seguente formula di riduzione degli integrali doppi ) ∫ (∫ ∫∫ b β(x) f (x, y) dx dy = A f (x, y) dy a dx . (13.2.1) α(x) L’integrale a secondo membro viene spesso denotato con ∫ b ∫ β(x) dx f (x, y) dy a α(x) e quindi la formula di riduzione precedente viene scritta come segue ∫∫ ∫ b ∫ β(x) f (x, y) dx dy = dx f (x, y) dy . A a α(x) ◃ In maniera del tutto analoga si può considerare una formula di riduzione per domini normali rispetto all’asse y. Si dice che un sottoinsieme A di R2 è un dominio normale rispetto all’asse y (oppure secondo l’asse x) se esistono c, d ∈ R con c < d e due funzioni continue γ, δ : [c, d] → R tali che γ ≤ δ e A := {(x, y) ∈ R2 | y ∈ [c, d] , γ(y) ≤ x ≤ δ(y)} . Un dominio normale rispetto all’asse y è chiuso, limitato e misurabile ed inoltre ∫ d (δ(y) − γ(y)) dy . m(A) = c Se f : A → R è una funzione continua sul dominio normale A rispetto all’asse y vale la seguente formula di riduzione degli integrali doppi ) ∫∫ ∫ (∫ d δ(y) f (x, y) dx dy = A f (x, y) dx c dy . (13.2.2) γ(y) Anche in questo caso l’integrale a secondo membro viene denotato con ∫ d ∫ β(y) dy f (x, y) dx c α(y) 13.2 Cenni sull’integrale di Riemann in Rn e quindi la formula di riduzione diventa ∫∫ ∫ d ∫ f (x, y) dx dy = dy A c 393 β(y) f (x, y) dx . α(y) ◃ Si considera ora il caso generale. Sia A un sottoinsieme di Rn e sia j = 1, . . . , n fissato; si dice che A è normale rispetto al piano x1 , . . . , xj−1 , xj+1 , . . . , xn individuato dai vettori e1 , . . . , ej−1 , ej+1 , . . . , en della base canonica (oppure secondo l’asse xj ) se esistono un sottoinsieme chiuso, limitato e misurabile B ⊂ Rn−1 e due funzioni continue α, β : B → R tali che α ≤ β e inoltre, posto per brevità x̂j = (x1 , . . . , xj−1 , xj+1 , . . . , xn ) ∈ Rn−1 per ogni x = (x1 , . . . , xn ) ∈ Rn , A = {x = (x1 , . . . , xn ) ∈ Rn | x̂j ∈ B , α(x̂j ) ≤ xj ≤ β(x̂j )} . Se A è un dominio normale secondo l’asse xj , allora A è chiuso, limitato e misurabile ed inoltre ∫ ∫ m(A) = ··· (β(x̂j ) − α(x̂j )) dx1 · · · dxj−1 dxj+1 · · · dxn . B Se f : A → R è una funzione continua sul dominio normale A secondo l’asse xj vale la seguente formula di riduzione degli integrali multipli ∫ ∫ ··· f (x1 , . . . , xn ) dx1 · · · dxn (13.2.3) A ∫ ··· = ∫ (∫ B β(x̂j ) ) f (x1 , . . . , xn ) dxj dx1 · · · dxj−1 dxj+1 · · · dxn . α(x̂j ) Anche in questo caso l’integrale a secondo membro viene denotato con ∫ ∫ ∫ β(x̂j ) ··· dx1 · · · dxj−1 dxj+1 · · · dxn f (x1 , . . . , xn ) dxj B α(x̂j ) e quindi la formula di riduzione diventa ∫ ∫ ··· f (x1 , . . . , xn ) dx1 · · · dxn A ∫ = ∫ ∫ ··· dx1 · · · dxj−1 dxj+1 · · · dxn B Esempi 13.2.4 β(x̂j ) f (x1 , . . . , xn ) dxj α(x̂j ) 1. Si consideri l’integrale doppio ∫∫ x sin y dx dy , A Capitolo 13: L’integrale di Riemann in Rn 394 con A := {(x, y) ∈ R2 | 0 ≤ x ≤ 1 , x2 ≤ y ≤ x}. Allora, dalle formule di riduzione per gli integrali doppi si ottiene ∫∫ ∫ 1 ∫ x x sin y dx dy = dx x sin y dy A x2 0 ∫ 1 0 ∫ x dx [−x cos y]x2 = 1 (−x cos x + x cos x2 ) dx = 0 ∫ 1 −x cos x dx + = 0 ∫ 1 2 ∫ 1 2x cos x2 dx 0 ]1 1[ sin x2 0 2 0 1 3 = sin 1 − cos 1 + 1 + sin 1 = sin 1 − cos 1 + 1 . 2 2 1 1 = [−x sin x]0 + sin x dx + 2. Si consideri l’integrale triplo ∫∫∫ xyz dx dy dz , A dove A è il cilindro che ha come base il cerchio unitario C con centro l’origine nel piano xy ed altezza l’intervallo [0, 1] sull’asse z. Quindi A := {(x, y, z) ∈ R3 | x2 + y 2 ≤ 1 , 0 ≤ z ≤ 1} ed inoltre, denotata dalle formule di riduzione per gli integrali multipli si ottiene ∫∫∫ ∫ 1 ∫∫ xyz dx dy dz = z dz xy dx dy A C ∫0∫ = xy dx dy ∫ C 1 = ∫ x dx −1 ∫ 1 = [ = −1 √ 1−x2 √ − 1−x2 y dy x(1 − x2 ) dx x4 x2 − 2 4 ]1 =0. −1 Il risultato poteva anche essere dedotto dalla simmetria dell’insieme di integrazione e della funzione integranda. 13.2 Cenni sull’integrale di Riemann in Rn 13.2.2 395 Cambiamento di variabile negli integrali multipli Siano A e B sottoinsiemi aperti, limitati e misurabili di Rn e sia φ : B → A una funzione verificante le seguenti condizioni: 1. φ è invertibile; 2. φ è derivabile parzialmente rispetto a tutte le variabili in B e tutte le derivate parziali sono continue in B; 3. φ è regolare in B, cioè per ogni y0 ∈ B il determinante della matrice jacobiana J(φ, y0 ) di φ in y0 è diverso da 0: ∀ y0 ∈ B : ∂(φ1 , . . . , φn ) (y0 ) := det J(φ, (y1 , . . . , yn ))(y0 ) ̸= 0 . ∂(y1 , . . . , yn ) Se K ⊂ B è un sottoinsieme chiuso e limitato di B ed f : φ(K) → R è una funzione continua, allora vale la seguente formula di cambiamento di variabile degli integrali multipli: ∫ ∫ ··· f (x1 , . . . , xn ) dx1 · · · dxn (13.2.4) ∫ = φ(K) ∫ ··· f ◦ φ(y1 , . . . , yn ) K ∂(φ1 , . . . , φn ) (y1 , . . . , yn ) dy1 · · · dyn , ∂(y1 , . . . , yn ) ∂(φ1 , . . . , φn ) (y1 , . . . , yn ) denota il determinante det J(φ, (y1 , . . . , yn ))) ∂(y1 , . . . , yn ) della matrice jacobiana della trasformazione φ in (y1 , . . . , yn ). Si può dimostrare che la formula precedente continua a valere se le condizioni imposte alla trasformazione φ valgono in B r H, con H insieme di misura nulla. Infatti, in tal caso è possibile decomporre B in un numero finito di insiemi chiusi, limitati e misurabili con interni a due a due disgiunti e tali che H sia contenuto nella frontiera di tali insiemi; si può quindi applicare la formula di cambiamento di variabile ad ognuno di tali insiemi e sommare opportunamente gli integrali ottenuti. In particolare, la formula sul cambiamento di variabili rimane valida se il determinante jacobiano si annulla in un numero finito di punti. dove ◃ Si osservi che la funzione φ esprime il seguente cambiamento di variabili x1 := φ1 (y1 , . . . , yn ) , x2 := φ2 (y1 , . . . , yn ) , .. . xn := φn (y1 , . . . , yn ) , Capitolo 13: L’integrale di Riemann in Rn 396 dove φ1 , . . . , φn sono le componenti della funzione φ. ◃ Un esempio spesso utilizzato di cambiamento di variabili in R2 è quello in coordinate polari, ponendo { x := ρ cos θ , y := ρ sin θ , Lo jacobiano J(ρ, θ) di tale trasformazione è quindi dato da ∂x ∂ρ ∂y ∂ρ ∂x ( cos θ ∂θ = ∂y sin θ ∂θ −ρ sin θ ρ cos θ ) , ed il determinante jacobiano è det J(ρ, θ) = ρ. Poiché il determinante jacobiano si annulla solamente nell’origine, si può sempre usare la trasformazione in coordinate polari. Pertanto, se A è un sottoinsieme chiuso, limitato e misurabile di R2 e se f : A → R è una funzione continua, si ha ∫∫ ∫∫ f (x, y) dx dy = A f (ρ cos θ, ρ sin θ) ρ dρ dθ , B con B := {(ρ, θ) ∈ [0, +∞] × [−π, π] | (ρ cos θ, ρ sin θ) ∈ A}. ◃ Ad esempio, si consideri il seguente integrale doppio ∫∫ x √ x2 + y 2 dx dy , D dove D è il settore circolare del cerchio unitario con centro nell’origine delimitato dalle semirette y = ±x, x ≥ 0. Utilizzando il cambiamento di variabili in coordinate polari { x = ρ cos θ , y = ρ sin θ , il dominio D è l’immagine del dominio B := = π π {(ρ, θ) ∈ [0, +∞[×[−π, π] | 0 ≤ ρ ≤ 1 , − ≤ θ ≤ } 4 4 [ π π] [0, 1] × − , 4 4 13.2 Cenni sull’integrale di Riemann in Rn 397 y D x Figura 13.2: Dominio di integrazione con trasformazione in coordinate polari. e quindi, usando anche le formule di riduzione per gli integrali doppi, ∫∫ ∫∫ √ 2 2 x x + y dx dy = ρ cos θ ρ2 dρ dθ D B 1 ∫ 0 = = ∫ π/4 ρ3 dρ = cos θ dθ −π/4 1 π/4 [sin θ]−π/4 4√ 2 . 4 ◃ Anche per gli integrali tripli viene spesso utilizzata la trasformazione in coordinate polari (o coordinate sferiche); considerato un punto P di R3 di coordinate (x, y, z), si considera la variabile ρ data dalla distanza di P dall’origine (ρ ≥ 0), la variabile θ data dall’arco di circonferenza unitaria tra il semiasse positivo dell’asse x e la semiretta passante per l’origine e la proiezione Q(x, y, 0) di P sul piano xy (−π < θ ≤ π) e la variabile φ data dall’arco di circonferenza unitaria tra il semiasse positivo dell’asse z e la semiretta passante per l’origine ed il punto P (0 ≤ φ ≤ π). Quindi x = ρ cos θ sin φ , y = ρ sin θ sin φ , z = ρ cos φ . Capitolo 13: L’integrale di Riemann in Rn 398 Lo jacobiano di tale trasformazione è dato da cos θ sin φ −ρ sin θ sin φ ρ cos θ cos φ J(ρ, θ, φ) = sin θ sin φ ρ cos θ sin φ ρ sin θ cos φ , cos φ 0 −ρ sin φ ed il suo determinante è −ρ2 sin φ , che si annulla sull’asse z e quindi in un insieme di misura nulla; quindi la formula di riduzione per gli integrali multipli può essere applicata. ◃ Ad esempio, si vuole calcolare l’integrale triplo ∫∫∫ x2 (y − z) dx dy dz , D dove D è la semisfera unitaria con centro l’origine situata nel semispazio positivo dell’asse z. Utilizzando la trasformazione in coordinate polari, il dominio D è l’immagine del seguente dominio { π} B := (ρ, θ, φ) ∈ R3 | 0 ≤ ρ ≤ 1 , −π ≤ θ ≤ π , 0 ≤ φ ≤ 2 e quindi l’integrale triplo diventa ∫∫∫ ρ2 cos2 θ sin2 φ ρ (sin θ sin φ − cos φ) ρ2 sin φ dρ dθ dφ B ∫ ∫ π/2 = −π 0 ∫ π dφ (cos2 θ sin4 φ sin θ − cos2 θ sin3 φ cos φ) dθ 1 ρ5 dρ 0 [ ]π 1 1 4 3 3 − cos θ sin φ − (θ + cos θ sin θ) sin φ cos φ dφ 3 2 0 −π ( ) ∫ π 1 π 1 π/2 1 4 3 4 3 sin φ − sin φ cos φ − sin φ − sin φ cos φ dφ = 6 0 3 2 3 2 ∫ π/2 π =− sin3 φ cos φ dφ 6 0 [ ]π/2 π 1 1 π =− − cos(2φ) + cos(4φ) =− . 6 8 32 24 0 1 = 6 ∫ π/2 ◃ Un’altra trasformazione spesso utilizzata è quella in coordinate cilindriche, che consistono nel trasformare in coordinate polari (nel piano xy) le variabili x ed y lasciando invariata l’ultima variabile z: x = ρ cos θ , y = ρ sin θ , z=z. 13.2 Cenni sull’integrale di Riemann in Rn Lo jacobiano di tale trasformazione è dato da cos θ −ρ sin θ J(ρ, θ, z) = sin θ ρ cos θ 0 0 399 0 0 , 1 ed il suo determinante è ρ; il determinante jacobiano pertanto si annulla solamente sull’asse z e quindi la formula di riduzione per gli integrali multipli può essere applicata. ◃ Ad esempio, si vuole calcolare l’integrale triplo ∫∫∫ √ x2 + y 2 z dx dy dz , D dove D è il cilindro che ha come base il cerchio unitario con centro l’origine nel piano xy ed altezza l’intervallo [0, 1] sull’asse z. Utilizzando la trasformazione in coordinate cilindriche, il dominio D è l’immagine del seguente dominio { } B := (ρ, θ, z) ∈ R3 | 0 ≤ ρ ≤ 1 , −π ≤ θ ≤ π , 0 ≤ z ≤ 1 e quindi l’integrale triplo diventa ∫∫∫ ∫ ρ2 z dρ dθ dz = B ∫ 1 0 ∫ π ρ2 dρ dθ −π 1 z dz = 0 [ 2 ]1 z π 1 ·π· = . 3 2 0 3 Capitolo 14 Curve, campi vettoriali e superfici 14.1 Curve regolari e lunghezza Una curva in Rn è una funzione vettoriale continua φ : I → Rn definita in un intervallo I di R. L’intervallo I viene denominato intervallo intervallo base della curva φ mentre l’immagine φ∗ = φ(I) ⊂ Rn viene denominata sostegno della curva φ. Assegnare quindi la curva φ : I → Rn equivale ad assegnare n funzioni continue φ1 , . . . , φn : I → Rn (le componenti di φ) che forniscono le seguenti equazioni parametriche di φ x1 := φ1 (t) , x2 := φ2 (t) , t∈I. .. . xn := φn (t) , Assegnate le funzioni continue φ1 , . . . , φn : I → R, la curva φ : I → R avente tali componenti viene data da φ(t) := n ∑ φi (t) ei , t∈I. i=1 Una curva φ : I → Rn viene denominata semplice se può assumere lo stesso valore solamente negli estremi, cioè se verifica la seguente condizione ∀ t 1 , t2 ∈ I , t 1 < t 2 : φ(t1 ) = φ(t2 ) =⇒ I = [t1 , t2 ] . 402 Capitolo 14: Curve, campi vettoriali e superfici Inoltre, una curva si dice chiusa se il suo intervallo base è un intervallo chiuso e limitato agli estremi del quale la curva assume lo stesso valore; quindi φ : [a, b] → Rn è chiusa se φ(a) = φ(b). Esempi 14.1.1 1. Si considerino a = (a1 , . . . , an ) ∈ Rn e b = (b1 , . . . , bn ) ∈ n R . La curva φ : [0, 1] → Rn definita ponendo, per ogni t ∈ [0, 1], φ(t) := a + t(b − a) ha come sostegno il segmento S[a, b] di estremi a e b. Se a ̸= b, essa è una curva semplice ma non chiusa. 2. Assegnati i punti distinti a0 , a1 , . . . , am ∈ Rn , si può considerare la poligonale p[a0 , . . . , am ] : [0, 1] → Rn congiungente i punti a0 , a1 , . . . , am definita ponendo, per ogni t ∈ [0, 1], ( ) [ [ , ai + m t − mi (ai+1 − ai ) , t ∈ mi , i+1 m i = 0, . . . , m − 1 , p[a0 , . . . , am ](t) := am , t=1. Il supporto della poligonale p[a0 , . . . , am ] è costituito dall’unione dei segmenti congiungenti ai ed ai+1 , i = 0, . . . , m − 1, cioè p[a0 , . . . , am ]∗ = m−1 ∪ S[ai , ai+1 ] . i=0 La poligonale p[a0 , . . . , am ] è chiusa se e solo se a0 = am ed è semplice se e solo se i segmenti che ne costituiscono il supporto possono avere in comune solamente i vertici ed ognuno di questi ultimi appartiene al più a due segmenti distinti. 3. La curva γ : [0, 2π] → R2 definita ponendo, per ogni t ∈ [0, 2π], γ(t) := (cos t, sin t) , ha come supporto la circonferenza unitaria con centro l’origine nel piano. Più in generale, si può considerare la circonferenza di centro (x0 , y0 ) ∈ R2 e raggio r > 0 data dal supporto della curva γ(x0 ,y0 ),r : [0, 2π] → R2 definita ponendo, per ogni t ∈ [0, 2π], γ(x0 ,y0 ),r (t) := (x0 + r cos t, y0 + r sin t) . 4. Curve in coordinate cartesiane Se f : I → R è una funzione continua, si può considerare in maniera naturale una curva φf : I → R2 ad essa associata definita ponendo, per ogni t ∈ I, φf (t) := (t, f (t)) . 14.1 Curve regolari e lunghezza 403 La curva φf è sempre semplice e non chiusa e fornisce le coordinate parametriche della funzione f . 5. Curve in coordinate polari Se ρ : I → R è una funzione continua e positiva, si può considerare in maniera naturale una curva γρ : I → R2 ad essa associata definita ponendo, per ogni θ ∈ I, γρ (θ) := (ρ(θ) cos θ, ρ(θ) sin θ) . La curva γρ fornisce le coordinate parametriche polari della funzione ρ. ◃ Assegnate due curve φ : [a, c] → Rn e ψ : [c, b] → Rn tali che φ(c) = ψ(c), si può considerare la curva unione φ∪ψ : [a, b] → Rn definita ponendo, per ogni t ∈ [a, b], { φ(t) , t ∈ [a, c] , (φ ∪ ψ)(t) := (14.1.1) ψ(t) , t ∈]c, b] . La denominazione adottata è giustificata dal fatto che il supporto della curva unione φ ∪ ψ è l’unione dei supporti delle curve φ e ψ, cioè (φ ∪ ψ)∗ = (φ∗ ) ∪ (ψ ∗ ). ◃ Una curva φ : I → Rn si dice regolare se è derivabile con derivata φ′ continua e, per ogni t ∈ I, si ha φ′ (t) ̸= 0. Quindi φ è regolare se e solo se le sue componenti φ1 , . . . φn : I → R sono derivabili in I e le loro derivate sono continue e non si annullano contemporaneamente in alcun punto di I (infatti, per ogni t ∈ I, deve ∑n essere i=1 φ′n (t)2 > 0). Inoltre, una curva φ : I → Rn si dice regolare a tratti se è unione di un numero finito di curve regolari e quindi se e solo se esistono t0 , . . . , tm ∈ R tali che inf I = t0 < t1 < · · · < tm−1 < tm = sup I (se I non è limitato inferiormente si pone t0 = −∞ e se I non è limitato superiormente si pone tm = +∞) e inoltre, per ogni i = 0, . . . , m−1, la curva φ|I∩[ti ,ti+1 ] è regolare. Pertanto, una curva φ : I → Rn è regolare se e solo se φ è derivabile con derivata non nulla tranne al più che in un numero finito di punti nei quali tuttavia esistono le derivate sinistre e destre e sono entrambe non nulle. ◃ La condizione di regolarità è utile per definire la tangente ad una curva in un punto, come di seguito precisato. Si supponga che φ : I → Rn sia una curva regolare e sia t0 ∈ I. Per ogni t1 ∈ I r {t0 } la retta secante il grafico di φ nei punti (t0 , φ(t0 )) ∈ Rn+1 e (t1 , φ(t1 )) ∈ Rn+1 ha equazione y = φ(t0 ) + (t − t0 ) φ(t1 ) − φ(t0 ) , t1 − t0 (t, y) ∈ R × Rn , Capitolo 14: Curve, campi vettoriali e superfici 404 e considerando il limite per t1 → t0 si ottiene l’equazione della retta tangente al sostegno di φ nel punto (t0 , φ(t0 )) y = φ(t0 ) + (t − t0 ) φ′ (t0 ) , (t, y) ∈ R × Rn . (14.1.2) ◃ Nel caso delle curve regolari a tratti, si possono definire in ogni punto le equazioni delle rette tangenti a sinistra e a destra. Si verifica facilmente che le curve considerate negli Esempi 14.1.1 precedenti sono regolari a tratti. Ad esempio, nel caso dell’Esempio 14.1.1, 1., per ogni t0 ∈ [0, 1] si ha φ′ (t) = b − a e quindi la retta tangente al sostegno di φ nel punto (t0 , φ(t0 )) ha equazione y = φ(t0 ) + (t − t0 ) (b − a) = a + t0 (b − a) + (t − t0 ) (b − a) = a + t(b − a) , (t, y) ∈ R × Rn . Si considerino ora i punti distinti a0 , a1 , . . . , am ∈ Rn e sia p[a0 , . . . , am ] : [0, 1] → Rn la poligonale congiungente i punti a0 , a1 , . . . , am definita nell’Esempio 14.1.1, 2.; allora p[a0 , . . . , am ] è una curva regolare a tratti e, per ogni i = 0, . . . , m − 1 e t ∈]i/m, (i + 1)/m[ si ha p[a0 , . . . , am ]′ (t) = ai+1 − ai . Per ogni i = 0, . . . , m − 1 e t0 ∈]i/m, (i + 1)/m[, la retta tangente al sostegno di p[a0 , . . . , am ] in (t0 , φ(t0 )) ha equazione y = ai + t(ai+1 − ai ), t ∈ R; tale equazione rappresenta anche la retta tangente a destra in (ai , p[a0 , . . . , am ](ai )) ed a sinistra in (ai+1 , p[a0 , . . . , am ](ai+1 )). Si consideri infine la curva γ(x0 ,y0 ),r : [0, 2π] → R2 definita nell’Esempio 14.1.1, 3. Essa è regolare e, per ogni t0 ∈ [0, 1], ′ γ(x (t0 ) := (−r sin t, r cos t) . 0 ,y0 ),r L’equazione della retta tangente in (t0 , γ(x0 ,y0 ),r (t0 )) ha equazione (x, y) ′ = γ(x0 ,y0 ),r (t0 ) + (t − t0 ) γ(x (t0 ) 0 ,y0 ),r = (x0 + r cos t, y0 + r sin t) + (t − t0 ) (−r sin t, r cos t) = (x0 + r cos t − r (t − t0 ) sin t, y0 + r sin t + r (t − t0 ) cos t) , t ∈ R. In forma parametrica la retta tangente ha quindi le seguenti equazioni { x = x0 + r cos t − r (t − t0 ) sin t , t∈R. y = y0 + r sin t + r (t − t0 ) cos t , ◃ Sia f : I → R una funzione continua e si consideri la curva φf : I → R2 ad essa associata definita ponendo, per ogni t ∈ I, φf (t) := (t, f (t)) . 14.1 Curve regolari e lunghezza 405 Se f è derivabile e con derivata continua allora la curva φf è regolare e si ha, per ogni t ∈ I, φ′f (t) = (1, f ′ (t)) (̸= (0, 0)) . Se t0 ∈ I, l’equazione della retta tangente in (t0 , φf (t0 )) ha equazione (x, y) = φf (t0 ) + (t − t0 ) φ′f (t0 ) = (t0 , f (t0 )) + (t − t0 ) (1, f ′ (t0 )) = (t, f (t0 ) + f ′ (t0 )(t − t0 )) , t ∈ R. In forma parametrica la retta tangente ha quindi le seguenti equazioni { x=t, t∈R, y = f (t0 ) + f ′ (t0 )(t − t0 ) , ed eliminando il parametro t tra le due equazioni, si ottiene y = f (t0 ) + f ′ (t0 )(x − t0 ) , cioè l’equazione della retta tangente al grafico di f nel punto (t0 , f (t0 )) (vedasi la (9.1.4)). ◃ Sia ρ : I → R una funzione continua e positiva e si consideri la curva γρ : I → R2 definita ponendo, per ogni θ ∈ I, γρ (θ) := (ρ(θ) cos θ, ρ(θ) sin θ) . Se ρ è derivabile con derivata continua e se ρ e ρ′ non si annullano mai contemporaneamente, allora γρ è regolare. Infatti, per ogni θ ∈ I, γρ′ (θ) = (ρ′ (θ) cos θ − ρ(θ) sin θ, ρ′ (θ) sin θ + ρ(θ) cos θ) √ e poiché ∥γρ′ (θ)∥ = ρ(θ)2 + ρ′ (θ)2 ̸= 0, la curva γρ è regolare. Per ogni θ0 ∈ I, l’equazione della retta tangente in (θ0 , γρ (θ0 )) ha equazione (x, y) = γρ (θ0 ) + (θ − θ0 ) γρ′ (θ0 ) = (ρ(θ0 ) cos θ0 , ρ(θ0 ) sin θ0 ) +(θ − θ0 ) (ρ′ (θ) cos θ − ρ(θ) sin θ, ρ′ (θ) sin θ + ρ(θ) cos θ) = (ρ(θ0 ) cos θ0 + (θ − θ0 ) (ρ′ (θ) cos θ − ρ(θ) sin θ), ρ(θ0 ) sin θ0 + (θ − θ0 ) (ρ′ (θ) sin θ + ρ(θ) cos θ)) , 406 Capitolo 14: Curve, campi vettoriali e superfici θ ∈ R. In forma parametrica la retta tangente ha quindi le seguenti equazioni { x = ρ(θ0 ) cos θ0 + (θ − θ0 ) (ρ′ (θ) cos θ − ρ(θ) sin θ) , θ∈R. y = ρ(θ0 ) sin θ0 + (θ − θ0 ) (ρ′ (θ) sin θ + ρ(θ) cos θ) , ◃ Si osservi che l’intervallo base di una curva può essere modificato a seconda delle necessità considerando una opportuna trasformazione lineare. Ad esempio, se φ : [a, b] → Rn è una curva definita in un intervallo chiuso e limitato con a < b e se [c, d] è un ulteriore intervallo di R con c < d si può considerare la funzione j : [c, d] → [a, b] definita ponendo, per ogni s ∈ [c, d], j(s) := b−a ad − bc s+ . d−c d−c Allora, la curva ψ := φ ◦ j : [c, d] → Rn ha lo stesso sostegno di φ e inoltre, poiché j e j −1 sono derivabili e le loro derivate sono sempre diverse da zero, la curva ψ è regolare (rispettivamente, regolare a tratti) se e solo se φ è regolare (rispettivamente, regolare a tratti). Sia ora t0 ∈ [a, b] tale che φ sia derivabile in t0 con φ′ (t0 ) ̸= 0. Considerato s0 := j −1 (t0 ), si ha che ψ è derivabile in s0 e la sua derivata è ψ ′ (s0 ) = (d − c)/(b − a). Conseguentemente, la retta tangente al supporto di ψ in (s0 , ψ(s0 )) ha equazione y = ψ(s0 )+(s−s0 ) ψ ′ (s0 ) = φ(t0 )+(s−s0 ) d−c ′ φ (t0 ) = φ(t0 )+(t−t0 ) φ′ (t0 ) , b−a (t, y) ∈ R × Rn , e quindi l’equazione della retta tangente non dipende dalla scelta dell’intervallo base. ◃ Più in generale, le proprietà precedenti possono essere verificate per le curve equivalenti, nel senso di seguito specificato. Si dice che due curve φ : I → Rn e ψ : J → Rn sono equivalenti se esiste una funzione j : J → I invertibile e di classe C 1 insieme alla sua inversa (cioè sia j che j −1 sono derivabili e con derivata continua) tale che, per ogni s ∈ J, si abbia j ′ (s) ̸= 0 ed inoltre ψ = φ ◦ j. Si verifica facilmente che se due curve sono equivalenti, esse hanno lo stesso sostegno (e quindi se una è chiusa o rispettivamente semplice anche l’altra lo è) ed inoltre la regolarità (rispettivamente, la regolarità a tratti) dell’una comporta quella dell’altra; in tal caso, le rette tangenti dipendono solamente dal punto del sostegno e non dalla curva equivalente considerata. Assegnate due curve equivalenti φ : I → Rn e ψ : J → Rn con ψ = φ ◦ j, si dice che φ e ψ hanno lo stesso verso di percorrenza (rispettivamente, che 14.1 Curve regolari e lunghezza 407 hanno versi di percorrenza opposti ) se, per ogni s0 ∈ J, posto t0 := j(s0 ) ∈ I, si ha ψ(J ∩ [s0 , +∞[) = φ(I ∩ [t0 , +∞[) rispettivamente, ψ(J ∩ [s0 , +∞[) = φ(I∩] − ∞, t0 ]) ). Il primo caso si verifica quando j ha derivata strettamente positiva, mentre il secondo quando j ha derivata strettamente negativa. ◃ Assegnata una curva φ : [a, b] → Rn , si può considerare la curva opposta φo : [a, b] → Rn definita ponendo, per ogni t ∈ [a, b], φo (t) := φ(a + b − t) . (14.1.3) La curva opposta φo è equivalente a φ ma ha verso di percorrenza opposto. ◃ Un’altra proprietà invariante delle curve equivalenti viene messa in evidenza dal concetto di lunghezza di una curva, di cui ci si vuole ora occupare. Innanzitutto, si osserva che la definizione di lunghezza si può dare in maniera immediata per il segmento p[a, b] congiungente due punti a, b ∈ Rn . Infatti, si può porre ℓ(p[a, b]) := ∥b − a∥ . Conseguentemente, la lunghezza di una poligonale p[a, . . . , am ] di vertici a0 , . . . , am può essere definita come segue ℓ(p[a0 , . . . , am ]) := m−1 ∑ ∥ai+1 − ai ∥ . i=0 Si consideri una curva arbitraria φ : I → Rn . Una poligonale p[a0 , . . . , am ] si dice inscritta alla curva φ se esistono t0 , . . . , tm ∈ I tali che t0 < t1 < · · · < tm e inoltre, per ogni i = 0, . . . , m, φ(ti ) = ai . Si denoti ora con Pφ l’insieme di tutte le poligonali inscritte alla curva φ. Per ogni poligonale p ∈ Pφ , ha senso per quanto già visto considerare la lunghezza ℓ(p) di p e ciò giustifica la seguente definizione. Si dice che la curva φ : I → Rn è rettificabile se sup ℓ(p) < +∞ . p∈Pφ In tal caso, la lunghezza di φ è definita ponendo ℓ(φ) := sup ℓ(p) . p∈Pφ Per le curve regolari a tratti, vale il seguente risultato. 408 Capitolo 14: Curve, campi vettoriali e superfici Teorema 14.1.2 Sia φ : [a, b] → Rn una curva regolare a tratti definita in un intervallo chiuso e limitato [a, b]. Allora, φ è rettificabile e si ha1 ∫ b ℓ(φ) = ∥φ′ (t)∥ dt . (14.1.4) a ◃ Ad esempio, si consideri la curva γ(x0 ,y0 ),r : [0, 2π] → R2 definita nell’Esempio 14.1.1, 3. Dal Teorema 14.1.2, essa è rettificabile e la sua lunghezza è data da ∫ 2π √ ℓ(γ(x0 ,y0 ),r ) = r2 (cos2 t + sin2 t) dt = 2π r . 0 ◃ Sia f : [a, b] → R una funzione derivabile e con derivata continua e si consideri la curva φf : [a, b] → R2 ad essa associata definita ponendo, per ogni t ∈ [a, b], φf (t) := (t, f (t)) . Allora, dal Teorema 14.1.2, φf è rettificabile e ∫ b ℓ(φ) = ∥φ′f (t)∥ dt ∫ a ∫ a b = b = ∥(1, f ′ (t))∥ dt √ 1 + f ′ (t)2 dt . a ◃ Sia ρ : [θ1 , θ2 ] → R una funzione positiva derivabile con derivata continua e tale che ρ e ρ′ non si annullino mai contemporaneamente. Si consideri la curva γρ : [θ1 , θ2 ] → R2 definita ponendo, per ogni θ ∈ [θ1 , θ2 ], γρ (θ) := (ρ(θ) cos θ, ρ(θ) sin θ) . Dal Teorema 14.1.2, γρ è rettificabile e si ha ∫ θ2 √ ρ(θ)2 + ρ′ (θ)2 dθ . ℓ(γρ ) = θ1 ◃ Tra le proprietà della lunghezza di una curva, conviene segnalare le seguenti, di immediata verifica 1 Si osservi che la funzione φ′ è continua tranne che in un numero finito di punti di discontinuità di prima specie; pertanto φ′ è integrabile in [a, b] e conseguentemente lo è anche ∥φ′ ∥. 14.2 Integrali curvilinei e campi vettoriali conservativi 409 1. Siano φ : [a, c] → Rn e ψ : [c, b] → Rn due curve tali che φ(c) = ψ(c) e si consideri la curva unione φ ∪ ψ : [a, b] → Rn definita dalla (14.1.1). Se φ e ψ sono entrambe regolari a tratti, allora anche φ ∪ ψ è regolare a tratti e la sua lunghezza è data da ℓ(φ ∪ ψ) = ℓ(φ) + ℓ(ψ) . 2. Sia φ : [a, b] → Rn una curva regolare a tratti. Allora ℓ(φ) ≤ (b − a) max ∥φ′ (t)∥ . t∈[a,b] 14.2 Integrali curvilinei e campi vettoriali conservativi 14.2.1 Integrali curvilinei Sia φ : [a, b] → Rn una curva regolare a tratti e si consideri una funzione reale continua f : A → R in un sottoinsieme aperto A di Rn contenente il supporto della curva φ (cioè φ∗ ⊂ A). Si osservi che la funzione (f ◦ φ) ∥φ′ ∥ è integrabile in [a, b] in quanto prodotto di una funzione continua con una funzione continua a tratti. Si definisce integrale curvilineo di f lungo la curva φ il seguente numero reale ∫ ∫ b f ds := φ f (φ(t)) ∥φ′ (t)∥ dt . (14.2.1) a Si osservi che l’integrale curvilineo della funzione costante di costante valore 1 è uguale alla lunghezza della curva. L’integrale curvilineo dipende dai valori della funzione f sul supporto della curva φ, ma non dal suo orientamento, come si evince dalle proprietà di seguito enunciate. Proposizione 14.2.1 Valgono le seguenti proprietà degli integrali curvilinei: 1. Proprietà di linearità Siano f, g : A → R funzioni continue in un sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A. Allora, per ogni λ ∈ R, ∫ ∫ ∫ ∫ ∫ (f + g) ds = f ds + g ds , (λ f ) ds = λ f ds . φ φ φ φ φ Capitolo 14: Curve, campi vettoriali e superfici 410 2. Proprietà di monotonia Siano f, g : A → R funzioni continue in un sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A. Se f ≤ g (cioè, per ogni x ∈ A, f (x) ≤ g(x)), allora si ha anche ∫ ∫ f ds ≤ g ds . φ φ 3. Siano f : A → R una funzione continua in un sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A. Allora ∫ f ds ≤ sup |f (x)| ℓ(φ) . x∈φ∗ φ 4. Siano f : A → R una funzione continua in un sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A. Considerata la curva opposta φo : [a, b] → Rn definita dalla (14.1.3), si ha che φo è anch’essa regolare a tratti ed inoltre ∫ ∫ f ds = f ds . φo φ 5. Siano f : A → R una funzione continua in un sottoinsieme aperto A di Rn e φ : [a, c] → Rn e ψ : [c, b] → Rn due curve regolari a tratti tali che φ(c) = ψ(c) e φ∗ ⊂ A, ψ ∗ ⊂ A. Si consideri la curva unione φ∪ψ : [a, b] → Rn definita dalla (14.1.1); allora anche φ∪ψ è regolare a tratti, (φ ∪ ψ)∗ ⊂ A ed inoltre ∫ ∫ ∫ f ds = f ds + f ds . φ∪ψ φ ψ Dimostrazione. Le proprietà 1. e 2. sono immediata conseguenza della definizione di integrale curvilineo. Per quanto riguarda la proprietà 3. basta osservare che ∫ b ∫ b ∫ |f (φ(t))| ∥φ′ (t)∥ dt f (φ(t)) ∥φ′ (t)∥ dt ≤ = f ds a φ ≤ sup |f (x)| x∈φ∗ ∫ a b ′ ∥φ (t)∥ dt ≤ sup |f (x)| ℓ(φ) . x∈φ∗ a Nelle ipotesi della proprietà 4. si ha ∫ ∫ b ∫ f (φo (t)) ∥(φo )′ (t)∥ dt = f ds = φo ∫ a = b b f (φ(a + b − t)) ∥ − φ′ (a + b − t)∥ dt a a f (φ(u)) ∥φ′ (u)∥ (−du) = ∫ b a f (φ(u)) ∥φ′ (u)∥ du = ∫ f ds . φ Infine, la proprietà 5. segue direttamente dalle definizioni di integrale curvilineo e di curva unione. 14.2 Integrali curvilinei e campi vettoriali conservativi 14.2.2 411 Integrali curvilinei di un campo vettoriale Una funzione continua vettoriale F : A → Rn definita in un sottoinsieme aperto A ⊂ Rn viene denominata campo vettoriale. Se φ : [a, b] → Rn è una curva regolare a tratti tale che φ∗ ⊂ A, si può definire l’integrale curvilineo del campo vettoriale F ponendo ∫ ∫ b F · dℓ := φ (F (φ(t)) | φ′ (t)) dt = a ∫ n b∑ Fi (φ(t)) φ′i (t) dt (14.2.2) a i=1 (nell’ultima uguaglianza si sono denotate con φ1 , . . . , φn le componenti di φ). Per evidenziare il fatto che l’integrale curvilineo dipende dal verso di percorrenza della curva, spesso si precisa che l’integrale curvilineo deve essere inteso nel verso da φ(a) a φ(b). Nonostante l’analogia delle notazioni usate per l’integrale curvilineo di una funzione e di un campo vettoriale nel caso n = 1, sarà comunque chiaro dal contesto l’integrale curvilineo da considerare. Inoltre l’integrale curvilineo di un campo vettoriale F viene spesso denotato anche con il simbolo ∫ (F |dℓ) , φ intendendo dℓ come il differenziale vettoriale (dx1 , . . . , dxn ). Alcune proprietà degli integrali curvilinei di campi vettoriali sono enunciate nella seguente proposizione. Proposizione 14.2.2 Valgono le seguenti proprietà degli integrali curvilinei di un campo vettoriale: 1. Proprietà di linearità Siano F, G : A → Rn campi vettoriali in un sottoinsieme aperto A di Rn e sia φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A. Allora, per ogni λ ∈ R, ∫ ∫ ∫ ∫ ∫ (F +G)·dℓ = F ·dℓ+ G·dℓ , (λ F +G)·dℓ = λ F ·dℓ . φ φ φ φ φ 2. Siano F : A → Rn un campo vettoriale in un sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A. Allora ∫ F · dℓ ≤ sup ∥F (x)∥ ℓ(φ) . φ x∈φ∗ Capitolo 14: Curve, campi vettoriali e superfici 412 3. Siano F : A → Rn un campo vettoriale in un sottoinsieme aperto A di Rn e φ : [a, b] → Rn una curva regolare a tratti tale che φ∗ ⊂ A. Considerata la curva opposta φo : [a, b] → Rn definita dalla (14.1.3), si ha ∫ ∫ F · dℓ = − F · dℓ . φo φ 4. Siano F : A → Rn un campo vettoriale in un sottoinsieme aperto A di Rn e φ : [a, c] → Rn e ψ : [c, b] → Rn due curve regolari a tratti tali che φ(c) = ψ(c) e φ∗ ⊂ A, ψ ∗ ⊂ A. Si consideri la curva unione φ ∪ ψ : [a, b] → Rn definita dalla (14.1.1); allora ∫ ∫ ∫ F · dℓ = F · dℓ + F · dℓ . φ∪ψ φ ψ Dimostrazione. La proprietà 1. è ovvia in base alla definizione di integrale curvilineo. Per quanto riguarda la proprietà 2. basta osservare che, dalla diseguaglianza (12.1.1) di Cauchy-Schwarz ∫ b ∫ b ∫ (F (φ(t)) | φ′ (t)) dt = (F (φ(t)) | φ′ (t)) dt ≤ F · dℓ φ ∫ ≤ a a b ∥(F (φ(t))∥ ∥φ (t))∥ dt ≤ sup ∥F (x)∥ x∈φ∗ a = ∫ φo = b ∫ = − ∥φ′ (t))∥ dt a sup ∥F (x)∥ ℓ(φ) . n b∑ a i=1 Fi (φ(u)) (−φ′i (u)) (−du) = i=1 n b∑ a i=1 Fi (φ(u)) φ′i (u) du = − ∫ ∫ b Fi (φ(a + b − t)) (−φ′i (a + b − t)) dt n a∑ Fi (φ(u)) φ′i (u) du i=1 F · dℓ . φ Infine, la proprietà 4. segue direttamente dalle definizioni. 14.2.3 b x∈φ∗ Nelle ipotesi della proprietà 3. si ha ∫ ∫ b∑ n Fi (φo (t)) (φoi )′ (t) dt = F · dℓ = a i=1 ∫ a∑ n ∫ ′ Campi vettoriali conservativi Un campo vettoriale F : A → Rn su un insieme aperto connesso A ⊂ Rn si dice conservativo se esiste una funzione f : A → R derivabile parzialmente in A e con derivate parziali continue tale che, per ogni i = 1, . . . , n, denotata con Fi la componente i-esima di F , si abbia ∂f = Fi ∂xi (14.2.3) 14.2 Integrali curvilinei e campi vettoriali conservativi 413 (cioè ∇f = F ). Ogni funzione f : A → R verificante la (14.2.3) viene denominata potenziale oppure primitiva del campo vettoriale F . ◃ Nel seguito, per ogni k ∈ N, si denoterà per brevità con C k (A) l’insieme di tutte le funzioni dotate di tutte le derivate parziali continue fino all’ordine k in A, con la convenzione C 0 (A) = C(A). Una funzione appartenente a C k (A) verrà più brevemente denominata di classe C k (A). Tali notazioni si applicano ovviamente anche alle funzioni vettoriali intendendole vere per ogni componente (quindi F ∈ C k (A) significa che tutte le componenti di F sono dotate di tutte le derivate parziali continue fino all’ordine k in A). ◃ Poiché F è continua, affinché valga la (14.2.3), un potenziale deve necessariamente avere tutte le derivate parziali continue e quindi, in base alle notazioni assunte, f ∈ C 1 (A). ◃ I potenziali di un campo vettoriale su un insieme aperto connesso sono determinati a meno di una costante, nel senso che aggiungendo una funzione costante ad un potenziale si ottiene ancora un potenziale e viceversa due potenziali differiscono sempre per una costante. I campi vettoriali conservativi sono caratterizzati mediante proprietà degli integrali curvilinei. Teorema 14.2.3 Siano A un sottoinsieme aperto connesso di Rn ed F : A → Rn un campo vettoriale. Allora le seguenti proposizioni sono equivalenti: a) F è conservativo; b) Se φ : [a, b] → Rn e ψ : [c, d] → Rn sono curve regolari a tratti tali che φ∗ ⊂ A, ψ ∗ ⊂ A e φ(a) = ψ(c), φ(b) = ψ(d), allora ∫ ∫ F · dℓ = F · dℓ ; φ ψ c) Se φ : [a, b] → Rn è una curva chiusa tale che φ∗ ⊂ A, si ha ∫ F · dℓ = 0 . φ ◃ Dal risultato precedente segue che l’integrale curvilineo di un campo vettoriale conservativo dipende solo dai punti estremi del supporto della curva e non dal percorso che li congiunge. Capitolo 14: Curve, campi vettoriali e superfici 414 Se F : A → Rn è un campo vettoriale conservativo su un sottoinsieme aperto connesso A e se f : A → R è un potenziale di F allora, per ogni curva regolare a tratti φ : [a, b] → Rn tale che φ∗ ⊂ A, si ha ∫ F · dℓ = f (φ(b)) − f (φ(a)) . φ Infatti ∫ F · dℓ ∫ b = φ (F (φ(t)) | φ′ (t)) dt = a ∫ = n b∑ a i=1 ∫ n b∑ a i=1 ∂f (φ(t)) φ′i (t) dt = ∂xi ∫ b Fi (φ(t)) φ′i (t) dt (f ◦ φ)′ (t) dt = f (φ(b)) − f (φ(a)) . a ◃ Il risultato precedente tuttavia viene solitamente applicato per riconoscere che un campo vettoriale non è conservativo. Data l’arbitrarietà delle curve regolari a tratti previste nelle condizioni b) e c), non risulta infatti percorribile la verifica di tali condizioni, mentre trovarne una per cui la b) o la c) non vale significa dimostrare che il campo vettoriale non è conservativo. ◃ Per riconoscere che un campo vettoriale è conservativo bisogna quindi ricorrere ad ulteriori strumenti che ora ci cercherà di approfondire. Si supponga che A sia un sottoinsieme aperto di Rn e che F : A → Rn sia un campo vettoriale di classe C 1 (A). Se f : A → R è un potenziale di F allora, dalla (14.2.3), si ricava che f ∈ C 2 (A) e inoltre, per ogni i, j = 1, . . . , n, dal Teorema 12.3.8 sull’invertibilità dell’ordine di derivazione segue ( ) ( ) ∂Fi ∂ ∂f ∂2f ∂2f ∂ ∂f ∂Fj = = = = = . ∂xj ∂xj ∂xi ∂xj ∂xi ∂xi ∂xj ∂xi ∂xj ∂xi Un campo vettoriale F : A → Rn di classe C 1 (A) viene denominato irrotazionale se verifica la seguente condizione ∂Fi ∂Fj = . ∂xj ∂xi (14.2.4) Quindi ogni campo vettoriale conservativo F : A → Rn di classe C 1 (A) è irrotazionale. Il viceversa non è sempre vero e bisogna aggiungere delle condizioni sulla struttura dell’insieme A per poter assicurare che un campo irrotazionale sia conservativo. ◃ Siano A ⊂ Rn ed x0 ∈ A. Si dice che A è un insieme stellato rispetto ad x0 se, per ogni x ∈ A, il segmento congiungente x0 ed x è contenuto in A, cioè ∀ x ∈ A ∀ t ∈ [0, 1] : x0 + t(x − x0 ) ∈ A . (14.2.5) 14.2 Integrali curvilinei e campi vettoriali conservativi 415 Inoltre, un insieme A ⊂ Rn si dice stellato se esiste x0 ∈ A rispetto al quale A è stellato. ◃ Si osservi che ogni insieme convesso è stellato; più precisamente, un insieme è convesso se e solo se esso è stellato rispetto ad ogni suo punto. Teorema 14.2.4 Se F : A → Rn è un campo vettoriale irrotazionale di classe C 1 (A) su un insieme aperto stellato, allora F è conservativo. Il risultato precedente consente di affermare che un campo vettoriale di classe C 1 (A) su un insieme aperto stellato è conservativo se e solo se esso è irrotazionale. La condizione (14.2.4) è di immediata verifica e fornisce un metodo elementare per riconoscere che un campo vettoriale è conservativo. Tuttavia, una volta stabilito che un campo vettoriale è conservativo, rimane aperto il problema di determinarne un potenziale. A tal fine, i metodi utilizzati più frequentemente sono i seguenti: 1. Si supponga che A sia un sottoinsieme aperto stellato di Rn rispetto al punto x0 ∈ A e sia F : A → Rn un campo vettoriale conservativo. Allora la funzione f : A → R definita ponendo, per ogni x ∈ A, ∫ f (x) := F · dℓ , φ dove φ : [a, b] → Rn è una qualsiasi curva regolare a tratti con supporto contenuto in A e congiungente i punti x0 ed x (cioè φ(a) = x0 e φ(b) = x),2 è un potenziale di F ; precisamente, è il potenziale di F che si annulla in x0 . 2. Si supponga che F : A → Rn sia un campo vettoriale conservativo su un sottoinsieme aperto connesso A di Rn . Si consideri la prima componente F1 : A → R e, per ogni (x1 , . . . , xn ) ∈ A, una sua primitiva f1 : A → R rispetto alla variabile x1 ; tale primitiva dipende ovviamente da x2 , . . . , xn al pari quindi della costante arbitraria. Si ha pertanto ∫ F (x1 , x2 , . . . , xn ) dx1 = f (x1 , x2 , . . . , xn ) + g(x2 , . . . , xn ) , dove g è una funzione arbitraria delle variabili x2 , . . . , xn . Per determinare la funzione g si impongono le ulteriori condizioni previste nella (14.2.4) ∂f1 ∂g + = Fi , i = 2, . . . , n . ∂xi ∂xi 2 Si osservi che la funzione f è ben definita in quanto, dal Teorema 14.2.3, l’integrale curvilineo non dipende dalla curva ma solamente dai punti x0 ed x. Capitolo 14: Curve, campi vettoriali e superfici 416 Una volta risolte le equazioni precedenti la funzione f : A → R definita ponendo, per ogni x = (x1 , . . . , xn ) ∈ A, f (x1 , . . . , xn ) := f1 (x1 , . . . , xn ) + g(x2 , . . . , xn ) , è un potenziale di F . 14.3 Superfici ed integrali superficiali Sia A un sottoinsieme aperto connesso di R2 . Si dice che una funzione φ : A → R3 è una superfice regolare se essa verifica le seguenti condizioni 1. φ è iniettiva; 2. φ ∈ C 1 (A), cioè le componenti di φ sono derivabili parzialmente rispetto a tutte le variabili in A e le derivate parziali sono continue; 3. Per ogni (u, v) ∈ A, la matrice jacobiana ∂φ1 ∂u (u, v) ∂φ2 J(φ, (u, v)) = ∂u (u, v) ∂φ 3 (u, v) ∂u ∂φ1 (u, v) ∂v ∂φ2 (u, v) ∂v ∂φ3 (u, v) ∂v di φ ha rango 2. Si supponga che K ⊂ R2 sia chiuso, limitato e connesso e coincida con ◦ la chiusura del proprio interno (K = K); una funzione φ : K → R3 si dice superfice regolare compatta se la sua restrizione all’interno di K è una superfice regolare. Inoltre, una superfice regolare compatta si dice chiusa se esiste un sottoinsieme di R3 la cui frontiera coincide con φ(K), cioè ∃ B ⊂ R3 t.c. ∂B = φ(K) . ◃ Un esempio molto importante di superfice regolare viene fornito dalle superfici regolari cartesiane. Sia K ⊂ R2 chiuso, limitato e connesso e tale ◦ ◦ che K = K). Se f : K → R è una funzione di classe C 1 (K), allora la funzione φf : K → R3 definita ponendo, per ogni (x, y) ∈ K, φf (x, y) := (x, y, f (x, y)) , (14.3.1) 14.3 Superfici ed integrali superficiali 417 è una superfice regolare compatta. Infatti essa è ovviamente iniettiva e ◦ inoltre, per ogni (x, y) ∈ K, la matrice jacobiana di φf 1 0 J(φf , (x, y)) = ∂f (x, y) ∂x 0 1 ∂f (x, y) ∂y ha rango 2 in quanto la matrice da essa estratta e costituita dalle prime due righe ha determinante sempre uguale ad 1. ◃ Assegnata ora una superfice regolare compatta φ : K → R3 , se ne vuole definire l’area. ◦ Innanzitutto, per ogni (u, v) ∈ K, si pone ( ) ∂φ ∂φ1 ∂φ2 ∂φ3 (u, v) := (u, v), (u, v), (u, v) , ∂u ∂u ∂u ∂u ( ) ∂φ ∂φ1 ∂φ2 ∂φ3 (u, v) := (u, v), (u, v), (u, v) ; . ∂v ∂v ∂v ∂v A questo punto, l’area della superfice compatta φ viene definita come segue3 ∫∫ A(φ) := K ∂φ ∂φ (u, v) ∧ (u, v) du dv . ∂u ∂v (14.3.2) ◦ ◃ Sia f : K → R una funzione di classe C 1 (K) e si consideri la funzione φf : K → R3 definita dalla (14.3.1). Utilizzando la (14.3.2), l’area della superfice φf , cioè del grafico di f , è data da √ ( )2 ( )2 ∫∫ ∂f ∂f A(φf ) = 1+ (x, y) + (x, y) dx dy . ∂x ∂y K 3 Si ricorda che il prodotto vettoriale x ∧ y di due elementi x = (x , x , x ) ∈ R3 e 1 2 3 y = (y1 , y2 , y3 ) ∈ R3 è definito come segue x ∧ y := (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ) ; nel caso in esame ( ) ∂φ2 ∂φ3 ∂φ ∂φ ∂φ3 ∂φ2 ∂φ3 ∂φ1 ∂φ1 ∂φ3 ∂φ1 ∂φ2 ∂φ2 ∂φ1 ∧ = − , − , − . ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v Capitolo 14: Curve, campi vettoriali e superfici 418 ◃ Si consideri ora una superfice regolare compatta φ : K → R3 e sia A un sottoinsieme aperto di R3 tale che φ(K) ⊂ A. Se f : A → R è una funzione continua, si può definire l’integrale superficiale di f come segue ∫ ∫∫ ∂φ ∂φ (u, v) ∧ (u, v) du dv . (14.3.3) f dσ := f (φ(u, v)) ∂u ∂v φ K Analogamente, se F : K → R3 è un campo vettoriale, si può definire il flusso di F ponendo ) ∫ ∫∫ ( ∂φ ∂φ F · ν dσ := F (φ(u, v)) (u, v) ∧ (u, v) du dv . (14.3.4) ∂u ∂v φ K Le proprietà generali dell’integrale superficiale e del flusso possono essere ottenute in maniera simile a quanto già svolto per gli integrali curvilinei di una funzione e di un campo vettoriale e per brevità vengono omesse. 14.4 Il teorema della divergenza e la formula di Stokes ◦ Sia D un sottoinsieme di R2 chiuso, limitato e connesso e tale che (D) = D. Si dice che D è regolare se la sua frontiera è localmente il grafico di una curva regolare; ciò significa che, per ogni x0 ∈ ∂D, esistono δ > 0 ed una curva regolare φ : I → R2 tale che φ∗ = ∂D ∩ Bδ (x0 ). Teorema 14.4.1 (Teorema della divergenza in R2 ) Sia D un dominio regolare di R2 e sia F : D → R2 un campo vettoriale di ◦ classe C 1 (D). Denotato con ν il versore normale esterno al dominio D, si ha4 ∫∫ ∫ div F (x, y) dx dy = (F |ν) ds . D ∂D Teorema 14.4.2 (Formula di Stokes in R2 ) Sia D un dominio regolare di R2 e sia F : D → R2 un campo vettoriale di ◦ classe C 1 (D). Denotato con ν il versore normale esterno al dominio D, si ha ) ∫ ∫∫ ( ∂F2 ∂F1 F · dℓ = (x, y) − (x, y) dx dy . ∂x ∂y +∂D D In R3 valgono i seguenti risultati analoghi. 4 Si ricorda che div F (x, y) := ∂F2 ∂F1 (x, y) + (x, y) . ∂x ∂y Capitolo 15 Equazioni differenziali ordinarie 15.1 Introduzione e problema di Cauchy Un’equazione differenziale ordinaria si presenta nella forma F (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 con F : Ω → R definita in un sottoinsieme Ω di Rm+2 ed esprime una relazione tra la variabile indipendente x ed il valore in x di una funzione incognita e di quello delle sue derivate fino ad un certo ordine. L’ordine più grande m delle derivate coinvolte nell’equazione differenziale viene denominato ordine dell’equazione differenziale. Lo studio di innumerevoli problemi in tutti i settori scientifici conduce ad equazioni differenziali e l’obiettivo è quello di determinarne le possibili soluzioni , cioè le funzioni u : I → R definite in un intervallo I di R che verificano le seguenti condizioni 1. u è derivabile m volte in I; 2. per ogni x ∈ I, si ha (x, u(x), u′ (x), . . . , u(m) (x)) ∈ Ω; 3. per ogni x ∈ I, si ha F (x, u(x), u′ (x), . . . , u(m) (x)) = 0. In diverse circostanze, viene richiesto che più equazioni differenziali siano soddisfatte simultaneamente ed in questi casi la soluzione può essere una funzione vettoriale in cui ogni componente soddisfa un’assegnata equazione 420 Capitolo 15: Equazioni differenziali ordinarie differenziale. Un’equazione differenziale vettoriale si presenta quindi nella forma F (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 con F : Ω → Rn definita in un sottoinsieme Ω di R(m+1)n+1 in quanto le funzioni incognite y = (y1 , . . . , yn ) sono a valori in Rn . Quindi la funzione F è a valori in Rn e, denotate con F1 , . . . , Fn : Ω → R le sue componenti, l’equazione differenziale può essere scritta nella seguente forma di un sistema di n equazioni differenziali F1 (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 , F2 (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 , .. . Fn (x, y(x), y ′ (x), . . . , y (m) (x)) = 0 . In questo caso una soluzione è una funzione u : I → Rn definita in un intervallo I di R (quindi u = (u1 , . . . , un ) con u1 , . . . , un : I → R) che verifica le seguenti condizioni 1. u è derivabile m volte in I (cioè, u1 , . . . , un sono derivabili m volte in I); 2. per ogni x ∈ I, si ha (x, u(x), u′ (x), . . . , u(m) (x)) ∈ Ω (cioè (x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , u(m) n (x)) ∈ Ω ); (m) 3. per ogni x ∈ I, si ha F (x, u(x), u′ (x), . . . , u(m) (x)) = 0 (cioè F (x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , u(m) n (x)) = 0 ). (m) L’ultima equazione può essere espressa in maniera equivalente sotto forma di un sistema di equazioni differenziali (m) (m) F1 (x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , un (x)) = 0 , (m) (m) F2 (x, u1 (x), . . . , un (x), u′ (x), . . . , u′ (x), . . . , u (x), . . . , un (x)) = 0 , n 1 1 .. . (m) (m) Fn (x, u1 (x), . . . , un (x), u′1 (x), . . . , u′n (x), . . . , u1 (x), . . . , un (x)) = 0 . Nel seguito si cercherà di tenere conto di tali esigenze e pertanto verranno prese in considerazione equazioni differenziali in cui le funzioni incognite sono funzioni vettoriali. Più in generale, un’equazione differenziale potrebbe esprimere una relazione in cui sono coinvolte le derivate parziali di una funzione di più variabili; 15.1 Introduzione e problema di Cauchy 421 queste equazioni differenziali vengono denominate a derivate parziali ed il loro studio richiede degli strumenti specifici che esulano da una trattazione introduttiva. Ci si limiterà pertanto a considerare equazioni differenziali ordinarie in cui la funzione incognita dipende da una sola variabile. ◃ Per applicare diversi risultati riguardanti l’esistenza e l’unicità della soluzione, è opportuno riuscire ad esplicitare le derivate di ordine massimo e scrivere l’equazione differenziale in forma normale y (m) = f (x, y, y ′ , . . . , y m−1 ) (15.1.1) con f : A → Rn definita in un sottoinsieme A di Rm·n+1 . La funzione f viene denominata secondo membro dell’equazione differenziale (15.1.1). Nella relazione precedente si è usata la convenzione universalmente adottata di denotare con y, . . . y (m) i valori incogniti y(x), . . . y (m) (x) in x. Denotate con f1 . . . , fn : A → R le componenti di f si ha quindi il seguente sistema di n equazioni differenziali (m) m−1 ′ ′ m−1 y1(m) = f1 (x, y1 , . . . , yn , y1 , . . . , yn , . . . , y1m−1 , . . . , yn ) , ′ ′ y = f2 (x, y1 , . . . , yn , y1 , . . . , yn , . . . , y1 , . . . , ynm−1 ) , 2 (15.1.2) ... (m) yn = fn (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) . ◃ Assegnato un punto (x0 , y0 , y0′ . . . , y0 (m−1) y0 ∈ Rn , y0′ ∈ Rn , ..., ) ∈ A (si osservi che (m−1) y0 ∈ Rn ) il problema di Cauchy per l’equazione differenziale (15.1.1) (m) y = f (x, y, y ′ , . . . , y m−1 ) , 0 ) = y0 , y(x y ′ (x0 ) = y0′ , .. . (m−1) (m−1) y (x0 ) = y0 , consiste nel determinare una soluzione u : I → Rn dell’equazione differenziale (15.1.1) tale che 1. x0 ∈ I; 2. u(x0 ) = y0 , u′ (x0 ) = y0′ , . . . , u(m−1) (x0 ) = y0 (m−1) . Capitolo 15: Equazioni differenziali ordinarie 422 Con riferimento al sistema di equazioni differenziali (15.1.2), il problema di Cauchy si scrive come segue y1 = f1 (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) , (m) y2 = f2 (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) , .. . (m) yn = fn (x, y1 , . . . , yn , y1′ , . . . , yn′ , . . . , y1m−1 , . . . , ynm−1 ) , (y1 (x0 ), . . . , yn (x0 )) = y0 , .. . (m) (m−1) (y1 (m−1) (x0 ), . . . , yn (m−1) (x0 )) = y0 , e consiste nel determinare una soluzione u := (u1 , . . . , un ) : I → Rn del sistema di equazioni differenziali (15.1.2) tale che 1. x0 ∈ I; 2. (u1 (x0 ), . . . , un (x0 )) = y0 ; (u′1 (x0 ), . . . , u′n (x0 )) = y0′ ; .. . (m−1) (u1 (m−1) (x0 ), . . . , un (m−1) (x0 )) = y0 . ◃ Si riconosce ora che un’equazione differenziale di ordine m può essere ricondotta ad un sistema di m equazioni differenziali del primo ordine. Proposizione 15.1.1 Sia f : A → Rn una funzione definita in un sottoinsieme A di Rm·n+1 e si consideri l’equazione differenziale in forma normale y (m) = f (x, y, y ′ , . . . , y m−1 ) . (15.1.3) Si considerino ora le funzioni g1 , . . . , gm : A → Rn definite ponendo, per ogni (x, z1 , z2 , . . . , zm ) ∈ A (quindi zi ∈ Rn per ogni i = 1, . . . , m), g1 (x, z1 , z2 , . . . , zm ) g2 (x, z1 , z2 , . . . , zm ) := := .. . gm−1 (x, z1 , z2 , . . . , zm ) := gm (x, z1 , z2 , . . . , zm ) := z2 , z3 , zm , f (x, z1 , z2 , . . . , zm ) , 15.1 Introduzione e problema di Cauchy 423 ed il sistema di m equazioni differenziali del primo ordine ′ z1 = g1 (x, z1 , z2 , . . . , zm ) , z2′ = g2 (x, z1 , z2 , . . . , zm ) , .. . ′ zm = gm (x, z1 , z2 , . . . , zm ) . (15.1.4) Se u : I → Rn è una soluzione dell’equazione differenziale (15.1.3) allora, posto z1 := u , z2 := u′ , ..., zm := u(m−1) , si ha che z := (z1 , . . . , zm ) è soluzione del sistema di equazioni differenziali (15.1.4). Viceversa, se z := (z1 , . . . , zm ) è soluzione del sistema del sistema di equazioni differenziali (15.1.4), allora u := z1 è soluzione dell’equazione differenziale (15.1.3). ) ∈ A, la soluzione u dell’equazione difInfine, se (x0 , y0 , y0′ , . . . , y0 ferenziale (15.1.3) soddisfa le condizioni iniziali (m−1) u(x0 ) = y0 , u′ (x0 ) = y0′ , ..., (m−1) u(m−1) (x0 ) = y0 , se e solo se la corrispondente soluzione z = (z1 , . . . , zm ) del sistema di equazioni differenziali (15.1.4) soddisfa la condizione iniziale z ′ (x0 ) = z0 (m−1) ). con z0 := (y0 , y0′ , . . . , y0 Dimostrazione. La dimostrazione è immediata tenendo presente che, dalla definizione di g1 , . . . , gm , le equazioni del sistema di equazioni differenziali considerato si ottengono imponendo che le m variabili z1 = y, y ′ = z2 , . . . , y (m−1) = zm siano ognuna la derivata ′ = (y (m−1) )′ = y (m) coincida con della precedente e inoltre che la derivata di zm (cioè zm f (x, y, y ′ , . . . , y m−1 ) = gm (x, z1 , z2 , . . . , zm ). Anche la verifica delle condizioni iniziali segue direttamente dalle definizioni adottate. A questo punto si può anche riconoscere che un sistema di equazioni differenziali composto da n equazioni del primo ordine si può ricondurre ad un’unica equazione differenziale del primo ordine vettoriale a valori in Rn . Proposizione 15.1.2 Siano f1 , . . . , fn : A → R definite in un sottoinsieme A di Rn+1 e si consideri la funzione f := (f1 , . . . , fn ) : A → Rn di componenti f1 , . . . , fn . 424 Capitolo 15: Equazioni differenziali ordinarie Allora, una funzione u := (u1 , . . . , un ) : I → Rn è una soluzione del sistema di n equazioni differenziali del primo ordine ′ y = f1 (x, y1 , . . . , yn ) , 1′ y2 = f2 (x, y1 , . . . , yn ) , (15.1.5) .. . ′ yn = fn (x, y1 , . . . , yn ) , se e solo se essa è una soluzione dell’equazione differenziale vettoriale y ′ = f (x, y) , y := (y1 , . . . , yn ) . (15.1.6) Inoltre, se (x0 , y0,1 , . . . , y0,n ) ∈ A, la funzione u considerata come soluzione del sistema di equazioni differenziali (15.1.3) soddisfa le condizioni iniziali u1 (x0 ) = y0,1 , , . . . , un (x0 ) = y0,n , se e solo se soddisfa la condizione iniziale u(x0 ) = y0 come soluzione dell’equazione differenziale (15.1.6) (si è posto per comodità y0 := (y0,1 , . . . , y0,n )). Dimostrazione. Anche in questo caso la dimostrazione è immediata in base alle definizioni adottate. ◃ Pertanto, in base alle proposizioni precedenti, non sarà restrittivo considerare nel seguito equazioni differenziali del primo ordine (vettoriali) in forma normale del tipo y ′ = f (x, y) (15.1.7) con f : A → Rn definita in un sottoinsieme A ⊂ R × Rn (la scrittura R × Rn al posto di Rn+1 mette in evidenza il fatto che la variabile x è un numero reale mentre y è una variabile vettoriale in Rn ). In base alle definizioni adottate, una soluzione dell’equazione differenziale (15.1.7) è una funzione u : I → Rn definita in un intervallo I di R che soddisfa le seguenti condizioni 1. u è derivabile in I; 2. per ogni x ∈ I si ha (x, u(x)) ∈ A; 3. per ogni x ∈ I si ha u′ (x) = f (x, u(x)). Assegnato (x0 , y0 ) ∈ A, il problema di Cauchy per l’equazione differenziale (15.1.7) { ′ y = f (x, y) , (15.1.8) y(x0 ) = y0 , consiste nel determinare una soluzione u : I → Rn dell’equazione differenziale (15.1.7) che verifica le ulteriori condizioni 15.1 Introduzione e problema di Cauchy 425 1. x0 ∈ I; 2. u(x0 ) = y0 . ◃ La proposizione successiva mette in relazione le soluzioni del problema di Cauchy con quelle di un’opportuna equazione integrale. Si precisa che, se u : I → Rn è una funzione vettoriale continua, cioè le sue componenti u1 , . . . , un : I → R sono funzioni reali continue e se a, b ∈ I, si pone (∫ ) ∫ b ∫ b b u(x) dx := u1 (x) dx, . . . , un (x) dx . a a a Proposizione 15.1.3 Siano A ⊂ R × R , f : A → Rn una funzione continua ed (x0 , y0 ) ∈ A. Se u : I → Rn è una funzione continua in un intervallo I e tale che, per ogni x ∈ I, si abbia (x, u(x)) ∈ A, allora le seguenti proposizioni sono equivalenti n a) u è soluzione del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 ; b) u soddisfa la seguente equazione integrale, per ogni x ∈ I, ∫ x u(x) = y0 + f (t, u(t)) dt . (15.1.9) x0 Dimostrazione. Si supponga che u sia soluzione del problema di Cauchy. Allora u è derivabile ed inoltre, poiché per ogni x ∈ I, u′ (x) = f (x, u(x)) e sia u che f sono continue, si ha che u′ è continua. Conseguentemente, per ogni x ∈ I, ∫ x ∫ x u(x) = u(x0 ) + u′ (t) dt = y0 + f (t, u(t)) dt . x0 x0 Viceversa, si supponga che u soddisfi l’equazione integrale (15.1.9). Poichè u è continua, la funzione g : I → R definita ponendo, per ogni x ∈ I, g(x) := f (x, u(x)), è anch’essa continua e conseguentemente la sua funzione integrale di punto iniziale x0 (cioè la funzione ∫ x 7→ xx g(t) dt) è una primitiva di g per cui è derivabile; dalla (15.1.9) si deduce che 0 ∫ anche u deve essere derivabile (infatti, per ogni x ∈ I, risulta u(x) = y0 + xx g(t) dt) e inoltre u′ (x) = g(x) = f (x, u(x)) da cui la tesi. 0 L’equazione integrale (15.1.9) viene denominata equazione integrale di Volterra ed il problema di determinarne una soluzione viene spesso indicato come problema di Liouville. Al fine di utilizzare la Proposizione 15.1.3 precedente per ottenere l’esistenza di soluzioni dell’equazione differenziale y ′ = f (x, y), l’ipotesi di continuità del secondo membro f dell’equazione differenziale verrà usualmente richiesta in tutti i risultati successivi. Capitolo 15: Equazioni differenziali ordinarie 426 15.2 Unicità della soluzione del problema di Cauchy Lo studio dell’unicità delle soluzioni del problema di Cauchy è basato sul seguente risultato, noto come lemma di Gronwall . Proposizione 15.2.1 (Lemma di Gronwall) Sia w : I → R una funzione reale continua e positiva in un intervallo I e si supponga che esistano x0 ∈ I ed L > 0 tali che, per ogni x ∈ I, ∫ x w(t) dt . w(x) ≤ L x0 Allora w = 0. Dimostrazione. Sia ε > 0 e si consideri la funzione vε : I ∩ [x0 , +∞[→ R definita ponendo, per ogni x ∈ I ∩ [x0 , +∞[ ∫ x vε (x) := ε + L w(t) dt . x0 Allora vε è derivabile in quanto w è continua ed inoltre, per ogni x ∈ I ∩ [x0 , +∞[, si ha vε (x) > 0 e, dalle ipotesi assunte, ∫ L xx w(t) dt w(x) vε′ (x) ∫ ∫0 =L ≤L ≤L. vε (x) ε + L xx w(t) dt ε + L xx w(t) dt 0 0 Dalla proprietà di monotonia dell’integrale segue, per ogni x ∈ I, ∫ x ∫ x ′ vε (t) dt ≤ L dt = L(x − x0 ) , x0 x0 vε (t) e quindi, poiché ∫ x x0 vε′ (t) vε (x) dt = log , vε (t) vε (x0 ) si ha vε (x) ≤ vε (x0 ) eL(x−x0 ) = ε eL(x−x0 ) . Essendo, per ipotesi, w(x) ≤ vε (x), risulta anche w(x) ≤ ε eL(x−x0 ) e dall’arbitrarietà di ε > 0, si ottiene w(x) = 0. Nell’intervallo I∩] − ∞, x0 ] si procede in maniera analoga oppure applicando quanto già dimostrato alla funzione w̃(x) := w(x0 − x). ◃ Al fine di applicare il lemma di Gronwall per l’unicità della soluzione del problema di Cauchy, si definiscono ulteriori proprietà del secondo membro di un’equazione differenziale. Si considerino un sottoinsieme A ⊂ R × Rn ed una funzione f : A → Rn . Si dice che f è lipschitziana rispetto alla seconda variabile se esiste una costante L > 0 tale che ∀ (x, y) ∈ A ∀ (x, z) ∈ A : ∥f (x, y) − f (x, z)∥ ≤ L ∥y − z∥ . (15.2.1) 15.2 Unicità della soluzione del problema di Cauchy 427 La costante L > 0 viene anche denominata costante di Lipschitz rispetto alla seconda variabile di f e per evidenziare ciò si dice anche che f è Llipschitziana rispetto alla seconda variabile.1 ◃ Si può stabilire a questo il seguente risultato di unicità della soluzione del problema di Cauchy. Teorema 15.2.2 (Teorema di unicità) Siano A ⊂ R × Rn , f : A → Rn una funzione continua ed L-lipschitziana rispetto alla seconda variabile ed (x0 , y0 ) ∈ A. Se u1 : I1 → Rn e u2 : I2 → Rn sono soluzioni del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 , allora, per ogni x ∈ I1 ∩ I2 , risulta u1 (x) = u2 (x). Dimostrazione. Si ponga I := I1 ∩ I2 e si consideri la funzione w : I → R definita ponendo, per ogni x ∈ I, w(x) = ∥u1 (x) − u2 (x)∥ . Allora w è continua e positiva e inoltre dalla continuità di f si ottiene, per ogni x ∈ I, ∫ x ∫ x ∥u′1 (t) − u′2 (t)∥ dt (u′1 (t) − u′2 (t)) dt ≤ w(x) = ∥u1 (x) − u2 (x)∥ = ∫ x0 x ∥f (t, u1 (t)) − f (t, u2 (t))∥ dt ≤ L = ∫ x0 x ∥u1 (t) − u2 (t)∥ dt x0 x0 = ∫ x w(t) dt . L x0 Dal lemma di Gronwall (Proposizione 15.2.1) segue allora w = 0 e conseguentemente u1 = u2 in I. Osservazione 15.2.3 Le ipotesi del risultato precedente assicurano la validità dell’unicità in grande cioè l’uguaglianza di due soluzioni dello stesso problema di Cauchy in tutti i punti in cui esse sono entrambe definite. 1 La definizione adottata è basata sulla definizione generale di funzione lipschitziana. Se E ed F sono spazi normati ed f : A → F è una funzione definita in un sottoinsieme A di E, si dice che f è lipschitziana se esiste una costante L > 0 tale che, per ogni x, y ∈ A, risulti ∥f (x) − f (y)∥ ≤ L ∥x − y∥ . Il numero L viene denominato costante di Lipschitz di f ed f viene anche denominata funzione L-lipschitziana. Pertanto, f è lipschitziana se tutti i rapporti incrementali ∥f (x) − f (y)∥ , ∥x − y∥ x, y ∈ A , x ̸= y , sono limitati ed in questo caso l’estremo superiore di tali rapporti incrementali risulta essere una costante di Lipschitz per f . 428 Capitolo 15: Equazioni differenziali ordinarie Si supponga ora che valga la proprietà di unicità in piccolo, cioè che f : A → R sia una funzione continua definita in A ⊂ R × Rn e che, per ogni (x0 , y0 ) ∈ A e per ogni u1 : I1 → Rn e u2 : I2 → Rn soluzioni del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 , esista un intorno J di x0 tale che, per ogni x ∈ J ∩ I1 ∩ I2 , risulti u1 (x) = u2 (x). Si riconosce allora che vale anche la proprietà di unicità in grande. Infatti, siano u1 : I1 → Rn e u2 : I2 → Rn soluzioni dello stesso problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 , e si consideri l’insieme U := {x ∈ I1 ∩ I2 | u1 (x) = u2 (x)}. Allora U ̸= ∅ in quanto x0 ∈ I; inoltre U è chiuso in I1 ∩ I2 in quanto u1 e u2 sono funzioni continue. Infine si riconosce che U è anche aperto in I1 ∩ I2 ; infatti, se x1 ∈ U , posto y1 := u1 (x1 ) = u2 (x1 ), si può considerare il problema di Cauchy { ′ y = f (x, y) , y(x1 ) = y1 , ed u1 ed u2 sono due sue soluzioni; dalla proprietà di unicità locale segue allora che u1 = u2 in un intorno J ∩ I1 ∩ I2 di x1 in I1 ∩ I2 . Poiché I1 ∩ I2 è un intervallo ed U è un suo sottoinsieme non vuoto contemporaneamente chiuso ed aperto in I1 ∩ I2 , deve essere U = I1 ∩ I2 , da cui u1 = u2 in I1 ∩ I2 . ◃ Dall’Osservazione 15.2.3 precedente segue che il teorema di unicità può essere ottenuto anche assicurando l’unicità locale della soluzione con ipotesi quindi locali sulla funzione f . Si introduce quindi la seguente definizione di funzione localmente lipschitziana rispetto alla seconda variabile. Si considerino un sottoinsieme A ⊂ R × Rn ed una funzione f : A → Rn . Si dice che f è localmente lipschitziana rispetto alla seconda variabile se, per ogni (x0 , y0 ) ∈ A, esistono δ > 0, r > 0 ed una costante L > 0 tali che, per ogni (x, y) ∈ A ∩ (]x0 − δ, x0 + δ[×Br (y0 )) e (x, z) ∈ A ∩ (]x0 − δ, x0 + δ[×Br (y0 )), si abbia ∥f (x, y) − f (x, z)∥ ≤ L ∥y − z∥ . (15.2.2) Da quanto osservato si ottiene allora il seguente ulteriore teorema di unicità. Teorema 15.2.4 (Teorema di unicità nel caso localmente lipschitziano rispetto alla seconda variabile) 15.2 Unicità della soluzione del problema di Cauchy 429 Siano A ⊂ R × Rn , f : A → Rn una funzione continua e localmente lipschitziana rispetto alla seconda variabile ed (x0 , y0 ) ∈ A. Se u1 : I1 → Rn e u2 : I2 → Rn sono soluzioni del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 , allora, per ogni x ∈ I1 ∩ I2 , risulta u1 (x) = u2 (x). ◃ Per verificare la condizione di locale lipschitzianeità rispetto alla seconda variabile, si può usare il fatto che tale condizione equivale alla limitatezza locale dei rapporti incrementali relativi alla seconda variabile di f ; pertanto, se f è derivabile parzialmente rispetto alla seconda variabile y (cioè rispetto alle variabili y1 , . . . , yn se n > 1) e se derivate parziali rispetto a tali variabili sono continue in A, allora i rapporti incrementali relativi alla seconda variabile risultano localmente limitati e quindi la funzione risulta essere localmente lipschitziana rispetto alla seconda variabile. ◃ Un’altra questione legata all’unicità della soluzione del problema di Cauchy è la possibilità di prolungare le soluzioni ottenendo soluzioni massimali, che non possono essere cioè ulteriormente prolungate. Siano A ⊂ R×Rn ed f : A → Rn una funzione continua. Se u1 : I1 → Rn e u2 : I2 → Rn sono soluzioni dell’equazione differenziale y ′ = f (x, y), si dice che u2 è un prolungamento di u1 se I1 ⊂ I2 e, per ogni x ∈ I1 , risulta u2 (x) = u1 (x) (in effetti, la nozione di prolungamento può essere fornita anche nel caso in cui u1 ed u2 non siano necessariamente soluzioni di un’equazione differenziale). Inoltre, si dice che una soluzione u : I → Rn di y ′ = f (x, y) è massimale se essa non ammette alcun prolungamento u : I → Rn che sia ancora una soluzione di y ′ = f (x, y) e definito in un intervallo I contenente propriamente I. Si osserva che se u1 : I1 → Rn e u2 : I2 → Rn sono soluzioni dell’equazione differenziale y ′ = f (x, y) che coincidono in I1 ∩ I2 , allora, posto I := I1 ∪ I2 , si può definire la funzione u : I → Rn ponendo, per ogni x ∈ I, { u1 (x) , x ∈ I1 , u(x) := u2 (x) , x ∈ I2 . Osservato che la funzione u è derivabile in I in quanto, se x ∈ I1 ∩ I2 , risulta u′1 (x) = f (x, u1 (x)) = f (x, u2 (x)) = u′2 (x), si ottiene che u è ancora una soluzione dell’equazione differenziale. Pertanto, nelle ipotesi in cui valga l’unicità della soluzione, si può affermare che ogni soluzione u : I → Rn di y ′ = f (x, y) ammette un prolungamento massimale, cioè esiste un prolungamento u : I → Rn di u che è 430 Capitolo 15: Equazioni differenziali ordinarie soluzione massimale di y ′ = f (x, y) (si osservi che tale risultato non assicura l’esistenza di soluzioni, ma solamente il fatto che, assegnata una soluzione, essa possa essere prolungata ad una soluzione massimale). Infatti, è sufficiente considerare l’insieme P(u) := {v : Iv → Rn | v è un prolungamento di u ed è soluzione di y ′ = f (x, y)} e, posto ∪ I˜ := Iv , v∈P(u) definire la funzione ũ : I → Rn ponendo, per ogni x ∈ I, ũ(x) := v(x) dove v ∈ P(u) e x ∈ Iv . Allora si verifica direttamente che ũ è un prolungamento di u ed è una soluzione massimale di y ′ = f (x, y). ◃ Dalla discussione precedente segue che, se A ⊂ R × Rn ed f : A → Rn è continua e localmente lipschitziana rispetto alla seconda variabile, allora ogni soluzione di y ′ = f (x, y) ammette un prolungamento massimale. In particolare, tale proprietà è verificata se si suppone che f sia derivabile parzialmente e con derivate parziali continue rispetto alle variabili y1 , . . . , yn . ◃ Si osservi infine che le soluzioni massimali non devono essere confuse con le soluzioni in grande che sono le soluzioni definite in tutto l’intervallo I := {x ∈ R | ∃ y ∈ Rn t.c. (x, y) ∈ A}. 15.3 Esistenza della soluzione del problema di Cauchy Per quanto riguarda l’esistenza di soluzioni del problema di Cauchy, i risultati più importanti sono i seguenti teoremi di esistenza in piccolo ed in grande. Teorema 15.3.1 (Teorema di Peano di esistenza di soluzioni in piccolo) ◦ Siano A ⊂ R × Rn , f : A → Rn una funzione continua ed (x0 , y0 ) ∈ A. Al◦ lora esiste un intervallo I tale che x0 ∈ I ed esiste una soluzione u : I → Rn del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 . Nel teorema precedente non è possibile specificare l’ampiezza dell’intervallo in cui esiste una soluzione del problema di Cauchy né si può affermare che tale soluzione sia unica. Con l’aggiunta di ulteriori ipotesi sulla funzione f si può invece ottenere il seguente risultato. 15.3 Esistenza della soluzione del problema di Cauchy 431 Teorema 15.3.2 Siano A := [a, b] × Br′ (y0 ) ed f : A → Rn una funzione continua ed L-lipschitziana rispetto alla seconda variabile e si ponga2 M := supx∈[a,b] ∥f (x, y0 )∥. Allora, per ogni x0 ∈]a, b[, posto δ1 := min{x0 − a, r/M } e δ2 := min{b − x0 , r/M }, esiste una ed sola soluzione u : [x0 − δ1 , x0 + δ2 ] → Rn del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 . La dimostrazione del risultato precedente è basata sul metodo delle approssimazioni successive di Peano-Picard. Dal risultato precedente si deduce il seguente teorema di esistenza in grande. Teorema 15.3.3 (Teorema di Cauchy-Lipschitz di esistenza di soluzioni in grande) Siano A := [a, b] × Rn ed f : A → Rn una funzione continua, limitata ed L-lipschitziana rispetto alla seconda variabile. Allora, per ogni (x0 , y0 ) ∈]a, b[×Rn , esiste una ed sola soluzione u : [a, b] → Rn del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 . Dimostrazione. Si ponga M := supx∈[a,b] ∥f (x, y0 )∥ e si consideri r > 0 tale che r > M (b − a). A questo punto il Teorema 15.3.2 precedente fornisce un’unica soluzione nell’intervallo [a, b] in quanto risulta δ1 := min{x0 − a, r/M } = x0 − a e δ2 := min{b − x0 , r/M } = b − x0 . Conviene osservare che l’ipotesi che l’intervallo [a, b] sia chiuso e limitato può essere rimossa considerando un intervallo I arbitrario. Teorema 15.3.4 Siano I un intervallo di R, A := I × Rn ed f : A → Rn una funzione continua e tale che, per ogni intervallo [a, b] ⊂ I, la sua restrizione ad [a, b] × Rn sia lipschitziana rispetto alla seconda variabile. ◦ Allora, per ogni (x0 , y0 ) ∈ I × Rn , esiste una ed sola soluzione u : I → Rn del problema di Cauchy { ′ y = f (x, y) , y(x0 ) = y0 . Dimostrazione. Infatti, dal Teorema 15.3.3, per ogni [a, b] ⊂ I tale che x0 ∈]a, b[, esiste una ed una sola soluzione u : [a, b] → Rn del problema di Cauchy assegnato. Si consideri ora una successione crescente (Jn )n∈N di intervalli chiusi e limitati tali che x0 sia interno 2 La funzione f è limitata per il teorema di Weierstrass, essendo continua in un insieme chiuso e limitato. Capitolo 15: Equazioni differenziali ordinarie 432 a ciascuno di essi e tale che l’unione sia coincida con I. Per ogni n ∈ N, si denoti con un : Jn → Rn l’unica soluzione nell’intervallo Jn del problema di Cauchy assegnato. Si riconosce allora facilmente che la funzione u : I → Rn definita ponendo, per ogni x ∈ I, u(x) := un (x) dove n ∈ N è tale che x ∈ Jn è ben definita ed è l’unica soluzione del problema di Cauchy assegnato definita in I. 15.4 Equazioni differenziali lineari Sia I un intervallo di R e si considerino n+1 funzioni a0 , . . . , an : I → R con an (x) ̸= 0 per ogni x ∈ I ed un’ulteriore funzione f : I → R. Si consideri l’equazione differenziale di ordine n an (x) y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = f (x) . (15.4.1) essa viene denominata equazione differenziale lineare di ordine n con coefficienti a0 , . . . , an e termine noto f . Se f = 0, l’equazione (15.4.1) viene denominata omogenea, mentre se f ̸= 0, essa viene denominata completa. Poiché an assume valori sempre diversi da 0, si può dividere primo e secondo membro per an (x) ed ottenere la (15.4.1) in forma normale. Non è pertanto restrittivo supporre an (x) = 1 e considerare l’equazione differenziale lineare in forma normale y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = f (x) . (15.4.2) Una soluzione u : J → Rn dell’equazione differenziale (15.4.2) è pertanto una funzione derivabile n volte in un intervallo J ⊂ I e tale che, per ogni x ∈ J, si abbia u(n) (x) + an−1 (x) u(n−1) (x) + · · · + a1 (x) u′ (x) + a0 (x) u(x) = f (x) . Il problema di Cauchy per l’equazione differenziale lineare (15.4.2) si (n−1) ) ∈ Rn e le ottiene considerando x0 ∈ I ed una n-pla (y0 , y0′ , . . . , y0 condizioni (n) y + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = f (x) , 0 ) = y0 , y(x y ′ (x0 ) = y0′ , (15.4.3) ... (n−1) (n−1) y (x0 ) = y0 . In questo caso una soluzione u : J → Rn del problema di Cauchy (15.4.3) è una soluzione dell’equazione differenziale (15.4.2) tale che x0 ∈ J ed inoltre u(x0 ) = y0 , u′ (x0 ) = y0′ , ... , (n−1) u(n−1) (x0 ) = y0 . 15.4 Equazioni differenziali lineari 433 Per studiare l’esistenza e l’unicità della soluzione del problema di Cauchy, nel seguito si supporrà che le funzioni an−1 , . . . , a1 , a0 ed f siano continue in I. Si è visto in precedenza che le equazioni differenziali di ordine n possono essere ricondotte ad un sistema di n equazioni differenziali del primo ordine che nel caso dell’equazione differenziale (15.4.2) è il seguente ′ y = y2 , 1′ y 2 = y3 , .. . y′ = yn , n−1 yn′ = −an−1 (x) yn − · · · − a1 (x) y2 − a0 (x) y1 + f (x) , Inoltre, il problema di Cauchy (15.4.3) si ottiene imponendo le ulteriori condizioni y1 (x0 ) = y0 , y2 (x0 ) = y0′ , ... , (n−1) yn (x0 ) = y0 . Infine, il sistema precedente può essere espresso come un’unica equazione differenziale del primo ordine (vettoriale) y ′ = g(x, y) dove il secondo membro è la funzione g : I × Rn → Rn definita ponendo, per ogni (x, y1 , . . . , yn ) ∈ I × Rn , g(x, y1 , . . . , yn ) := (y2 , y3 , . . . , yn , −an−1 (x)yn −· · ·−a1 (x)y2 −a0 (x)y1 +f (x)) . Quindi le componenti di g sono date dalle funzioni g1 , . . . , gn : I × Rn → R definite ponendo, per ogni (x, y1 , . . . , yn ) ∈ I × Rn , g1 (x, y1 , . . . , yn ) := y2 , g2 (x, y1 , . . . , yn ) := y3 , .. . gn−1 (x, y1 , . . . , yn ) := yn , gn (x, y1 , . . . , yn ) := −an−1 (x) yn − · · · − a1 (x) y2 − a0 (x) y1 + f (x) . Si dimostra ora che la funzione g verifica le ipotesi del Teorema 15.3.4. Infatti, g è ovviamente continua ed inoltre, considerato un intervallo chiuso e limitato [a, b] ⊂ I e posto M := max max{|a0 (x)|, . . . , |an−1 (x)|} , x∈[a,b] (tale massimo esiste per il teorema di Weierstrass, essendo i coefficienti ed il termine noto continui nell’intervallo chiuso e limitato [a, b]), si ha, per ogni Capitolo 15: Equazioni differenziali ordinarie 434 x ∈ [a, b], y = (y1 , . . . , yn ) ∈ Rn e z = (z1 , . . . , zn ) ∈ Rn , ∥g(x, y) − g(x, z)∥2 = |g1 (x, y) − g1 (x, z)|2 + . . . +|gn−1 (x, y) − gn−1 (x, z)|2 + |gn (x, y) − gn (x, z)|2 = (y2 − z2 )2 + · · · + (yn − zn )2 + an−1 (x) (yn − zn ) + . . . +a1 (x) (y2 − z2 ) + a0 (x) (y1 − z1 ) ( ≤ ∥y − z∥2 + M 2 |yn − zn | + . . . )2 +|y2 − z2 | + |y1 − z1 | 2 ≤ ∥y − z∥2 + n2 M 2 ∥y − z∥2 = (1 + n2 M 2 ) ∥y − z∥2 , √ da cui ∥g(x, y) − g(x, z)∥ ≤ 1 + n2 M 2 ∥y − z∥. Quindi g è lipschitziana rispetto alla seconda variabile in [a, b] × Rn . Conseguentemente, tenendo conto delle Proposizioni 15.1.2 e 15.1.1, esiste sempre una ed una sola soluzione del problema di Cauchy (15.4.3) e tale soluzione è definita in tutto l’intervallo I. ◃ Si studia ora come determinare le soluzioni dell’equazione differenziale lineare (15.4.2). Si considera innanzitutto l’equazione omogenea y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = 0 , (15.4.4) ottenuta dalla (15.4.2) e si osserva che l’insieme S delle sue soluzioni è un sottospazio vettoriale di C(I) di dimensione n. ◦ Infatti S è ovviamente un sottospazio vettoriale di C(I). Sia ora x0 ∈ I e, per ogni i = 1, . . . , n, si denoti con ui l’unica soluzione del problema di Cauchy { (n) y + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = 0 , (y(x0 ), y ′ (x0 ), . . . , y (n−1) (x0 )) = ei . Si riconosce ora che le soluzioni u 1 , . . . , un sono linearmente indipendenti. ∑ n Infatti, se c1 , . . . , cn ∈ R e i=1 ci ui = 0, anche per le combinazioni lineari delle derivate si ha ( n ) n ∑ ∑ (j−1) j−1 ci u i =D ci ui = 0 , j = 1, . . . , n , i=1 i=1 e calcolandole in x0 si ottiene, per ogni j = 1, . . . , n, n ∑ i=1 da cui cj = 0. (j−1) ci ui (x0 ) = cj 15.4 Equazioni differenziali lineari 435 Infine, considerata u ∈ S e posto c1 := u(x0 ) , c2 := u′ (x0 ) , ... , cn := u(n−1) (x0 ) , dall’unicità della soluzione del problema di Cauchy segue u = ∑n i=1 ci ui (infatti le due soluzioni verificano le stesse condizioni iniziali in x0 ). Quindi le funzioni u1 , . . . , un costituiscono una base di S e ciò completa la dimostrazione. ◃ Per determinare tutte le soluzioni dell’equazione differenziale omogenea (15.4.4), è quindi sufficiente trovare n soluzioni linearmente indipendenti u1 , . . . , un . La soluzione generale della (15.4.4) sarà data da y = c1 u1 + · · · + cn un , c1 , . . . , cn ∈ R . Assegnate n soluzioni u1 , . . . , un della (15.4.4), si considera il Wronskiano W : I → R definito ponendo, per ogni x ∈ I, W (x) := det u1 (x) u′1 (x) .. . (n−1) u1 (x) u2 (x) u′2 (x) .. . (n−1) u2 ... ... .. . (x) . . . un (x) u′n (x) .. . (n−1) un ( ) = det ui−1 . j i,j=1,...,n (x) (15.4.5) Il seguente risultato riassume le proprietà più importanti del wronskiano. Proposizione 15.4.1 (Teorema del Wronskiano) Siano I un intervallo di R ed a0 , . . . , an−1 : I → R funzioni continue e si consideri l’equazione differenziale lineare omogenea di ordine n y (n) + an−1 (x) y (n−1) + · · · + a1 (x) y ′ + a0 (x) y = 0 . Se u1 , . . . , un : I → R sono sue soluzioni, allora le seguenti proposizioni sono equivalenti a) u1 , . . . , un sono linearmente indipendenti; b) esiste x0 ∈ I tale che W (x0 ) ̸= 0; c) per ogni x ∈ I si ha W (x) ̸= 0. ◃ Una volta determinate le soluzioni dell’equazione omogenea (15.4.4), cioè n sue soluzioni indipendenti u1 , . . . , un , per risolvere l’equazione completa (15.4.2) è sufficiente trovare una sua soluzione particolare u. Infatti, in tal caso, tutte le soluzioni della (15.4.2) sono date da y = c1 u1 + · · · + cn un + u , c1 , . . . , c n ∈ R . 436 Capitolo 15: Equazioni differenziali ordinarie ◃ Tuttavia il metodo descritto risulta in generale di difficile applicazione in quanto anche per le equazioni differenziali del secondo ordine non è immediato determinare due soluzioni linearmente indipendenti dell’equazione omogenea. Nel seguito si considerano alcuni casi in cui si può determinare facilmente la soluzione generale. 15.4.1 Equazioni differenziali lineari del primo ordine Siano I un intervallo di R, a, b : I → R funzioni continue e si consideri l’equazione differenziale lineare del primo ordine y ′ = a(x) y + b(x) . (15.4.6) Si verifica direttamente che, denotata con A : I → R una primitiva di a, la funzione w : I → R definita ponendo, per ogni x ∈ I, w(x) = eA(x) è una soluzione dell’equazione omogenea y ′ = a(x) y (infatti w è derivabile in I e per ogni x ∈ I si ha w′ (x) = A′ (x) eA(x) = a(x) w(x)). Quindi tutte le soluzioni dell’omogenea sono date da c∈R. y = cw , Inoltre, una soluzione particolare dell’equazione completa (15.4.6) è la funzione u : I → R definita ponendo, per ogni x ∈ I, u(x) = w(x) B(x) , dove B : I → R è una primitiva della funzione b(x) · e−A(x) (infatti, u è derivabile in I e, per ogni x ∈ I, u′ (x) = w′ (x) B(x) + w(x) B ′ (x) = a(x) w(x) B(x) + b(x) w(x) e−A(x) = a(x) u(x) + b(x) eA(x) e−A(x) = a(x) u(x) + b(x) ). Pertanto, la soluzione generale della (15.4.6) è data data y = cw + u = w · (c + B) , c∈R. Se x0 ∈ I e y0 ∈ R, si riconosce inoltre direttamente che l’unica soluzione del problema di Cauchy { ′ y = a(x) y + b(x) , y(x0 ) = y0 , è la funzione u : I → R definita ponendo, per ogni x ∈ I, ( ) ∫ x ∫ ∫x − t a(s) ds a(t) dt u(x) := e x0 y0 + b(t) e x0 dt . x0 15.4 Equazioni differenziali lineari 15.4.2 437 Equazioni differenziali lineari di ordine n a coefficienti costanti Siano a0 , . . . , an−1 , an ∈ R con an ̸= 0, f : I → R una funzione continua in un intervallo I di R e si consideri l’equazione differenziale lineare di ordine n a coefficienti costanti an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = f (x) . (15.4.7) Anche in questo caso per determinarne le soluzioni conviene dapprima considerare l’equazione omogenea an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = 0 . (15.4.8) L’equazione precedente viene discussa considerando il polinomio caratteristico p : R → R ad essa associato che è definito ponendo, per ogni λ ∈ R, n ∑ p(λ) := an λn + an−1 λn−1 + · · · + a1 λ + a0 = ai λ i . i=0 Poiché p è un polinomio di grado n, esso ammette esattamente n zeri contati ognuno con la propria molteplicità e poiché i coefficienti di p sono reali, gli zeri saranno reali oppure complessi coniugati con la stessa molteplicità. Ad ogni zero del polinomio caratteristico di molteplicità h ≥ 1 vengono fatte corrispondere esattamente h soluzioni linearmente indipendenti dell’equazione omogenea (15.4.8) come precisato di seguito: i) se λ0 ∈ R è uno zero reale di molteplicità h ≥ 1 di p, allora le funzioni u1 , . . . , uh : R → R definite ponendo, per ogni x ∈ R, u1 (x) := eλ0 x , u2 (x) := x eλ0 x , ... , uh (x) := xh−1 eλ0 x (se h = 1 si considera ovviamente solamente la funzione u1 ) sono soluzioni linearmente indipendenti dell’equazione omogenea (15.4.8); ii) se λ = α + iβ ∈ C con β ̸= 0 è uno zero complesso di molteplicità h ≥ 1 di p, allora anche λ = α − iβ è uno zero di molteplicità h di p e ai due zeri α ± iβ di molteplicità h si fanno corrispondere le 2h soluzioni linearmente indipendenti u1 , . . . , uh , v1 , . . . , vh : R → R della (15.4.8) definite ponendo, per ogni x ∈ R, u1 (x) u2 (x) := := .. . uh (x) := eα x cos(β x) , x eα x cos(β x) , v1 (x) v2 (x) := eα x sin(β x) , := x eα x sin(β x) , .. . xh−1 eα x cos(β x) , vh (x) := xh−1 eα x sin(β x) (se h = 1 si considerano ovviamente solamente le funzioni u1 e v1 ). 438 Capitolo 15: Equazioni differenziali ordinarie Applicando il metodo sopra indicato ad ogni zero del polinomio caratteristico, si ottengono esattamente n soluzioni indipendenti u1 , . . . , un dell’equazione omogenea ed a questo punto la soluzione generale della (15.4.8) è data da y = c1 u1 + · · · + cn un , c1 , . . . , cn ∈ R . ◃ Si discute infine la determinazione di una soluzione particolare dell’equazione completa (15.4.7). A tale proposito si può cercare di applicare uno dei due metodi discussi di seguito. Termine noto particolare Si supponga che P1 e P2 siano polinomi di grado r e rispettivamente s e siano inoltre α ∈ R e β ∈ R. Si consideri la funzione f : R → R definita ponendo, per ogni x ∈ R, f (x) := P1 (x) eα x cos(β x) + P2 (x) eα x sin(β x) . Allora, una soluzione particolare dell’equazione differenziale completa an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = f (x) , può essere cercata nella forma u(x) := xh (Q1 (x) eα x cos(β x) + Q2 (x) eα x sin(β x)) , x∈R, dove h è la molteplicità di α±iβ come soluzione del polinomio caratteristico associato all’equazione omogenea (se α ± iβ non è soluzione del polinomio caratteristico si pone per convenzione h = 0) e Q1 e Q2 sono entrambi polinomi di grado uguale ad m := max{r, s} con coefficienti da determinare. Per determinare i coefficienti di Q1 e Q2 e quindi la soluzione particolare, si procede come segue 1. Si calcolano le derivate u′ , . . . , u(n) fino all’ordine n di u; 2. Si sostituiscono u e le sue derivate nell’equazione completa e si impone che u sia una soluzione dell’equazione completa; 3. Si semplifica primo e secondo membro per eα x ; 4. Se β = 0, si ottiene l’uguaglianza di due polinomi di grado m e dal principio di uguaglianza dei polinomi, imponendo che i coefficienti dei termini dello stesso grado di entrambi i membri siano uguali, si ottiene un sistema lineare di m equazioni nelle m incognite costituite dai coefficienti di Q1 (in questo caso Q2 = 0); risolvendo tale sistema, si ottengono i coefficienti di Q1 e quindi la soluzione particolare u; 15.4 Equazioni differenziali lineari 439 5. Se β ̸= 0, si scrivono due equazioni ottenute considerando nella prima solamente i termini con cos(β x) e nella seconda quelli con sin(β x); si ottengono due equazioni che prevedono ciascuna l’uguaglianza di due polinomi di grado m (dopo aver semplificato la prima per cos(β x) e la seconda per sin(β x)); ancora dal principio di uguaglianza dei polinomi, imponendo che i coefficienti dei termini dello stesso grado di entrambi i membri siano uguali, si ottiene un sistema lineare di 2m equazioni nelle 2m incognite costituite dai coefficienti di Q1 e Q2 = 0; risolvendo tale sistema, si ottengono i coefficienti di Q1 e Q2 e quindi la soluzione particolare u. Il presente metodo si può applicare anche nel caso in cui il termine noto sia somma di due funzioni f1 ed f2 del tipo sopra considerato. In questo caso si considerano una soluzione particolare u1 relativa ad f1 ed una soluzione particolare u2 relativa ad f2 e la soluzione particolare relativa alla somma f = f1 + f2 viene data da u = u1 + u2 . Infatti, risulta an u(n) + an−1 u(n−1) + · · · + a1 u′ + a0 u (n) = an u1 + (n−1) + an−1 u1 (n) an u2 + + · · · + a1 u′1 + a0 u1 (n−1) an−1 u2 + · · · + a1 u′2 + a0 u2 = f1 (x) + f2 (x) = f (x) . Metodo della variazione delle costanti arbitrarie di Lagrange Si supponga ora che il termine noto f : I → R dell’equazione differenziale completa an y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = f (x) sia una funzione continua che non rientra tra quelle considerate nel caso precedente. Si può allora ricorrere al metodo della variazione delle costanti arbitrarie di Lagrange. Una volta determinate le n soluzioni linearmente indipendenti u1 , . . . , un dell’equazione omogenea, tale metodo consiste nel cercare una soluzione particolare della forma u(x) := c1 (x) u1 (x) + · · · + cn (x) un (x) , (15.4.9) dove c1 , . . . , cn : I → R sono funzioni da determinare (da qui deriva la denominazione del metodo). Capitolo 15: Equazioni differenziali ordinarie 440 Imponendo le condizioni previste nel seguente sistema di n equazioni nelle incognite c′1 (x), . . . , c′n (x) ′ c1 (x) u1 (x) + · · · + c′n (x) un (x) = 0 , c′ (x) u′1 (x) + · · · + c′n (x) u′n (x) = 0 , .1 .. (15.4.10) (n−2) (n−2) ′ ′ c (x) u1 (x) + · · · + cn (x) un (x) = 0 , 1′ (n−1) (n−1) ′ c1 (x) u1 (x) + · · · + cn (x) un (x) = f (x) , si riconosce che la corrispondente funzione u è una soluzione dell’equazione completa. u= Infatti, utilizzando le relazioni previste in (15.4.10), per le derivate della funzione ∑n i=1 ci ui , si ha u′ = u′′ = n ∑ i=1 n ∑ c′i ui + c′i u′i + i=1 n ∑ i=1 n ∑ ci u′i = ci u′′ i = i=1 n ∑ ci u′i , i=1 n ∑ ci u′′ i , i=1 . .. u(n−1) u(n) = = n ∑ i=1 n ∑ c′i ui (n−2) c′i ui (n−1) i=1 + + n ∑ i=1 n ∑ (n−1) ci ui (n) ci ui =f i=1 n ∑ (n−1) ci u i , i=1 n ∑ (n) + ci ui , i=1 = (il calcolo di ogni derivata utilizza l’espressione ottenuta nel passaggio precedente). A questo punto si osserva che u(n) + an−1 u(n−1) + · · · + a1 u′ + a0 u (n−1) + · · · + a1 u′1 + a0 u1 ) (n−1) + · · · + a1 u′2 + a0 u2 ) (n−1) + · · · + a1 u′n + a0 un ) (n) + an−1 u1 (n) + an−1 u2 (n) + an−1 un = f + c1 (u1 +c2 (u2 +... +cn (un e tenendo conto del fatto che u1 , . . . , un sono soluzioni dell’equazione omogenea, si ha u(n) + an−1 u(n−1) + · · · + a1 u′ + a0 u = f , e quindi u è soluzione dell’equazione completa. Il determinante dei coefficienti del sistema lineare (15.4.10) è proprio il determinante della matrice Wronskiana W (x) e poiché le soluzioni u1 , . . . , un sono linearmente indipendenti, esso è diverso da 0. Segue che il sistema (15.4.10) ammette un’unica soluzione c′1 (x), . . . , c′n (x) e considerandone una loro primitiva, da quanto osservato si ottiene la soluzione particolare (15.4.9). Ulteriori riferimenti L’elenco seguente può essere utile per un approndimento degli argomenti trattati e per ulteriori esempi ed esercizi. [1] T. M. Apostol, Calcolo, Vol. I e II, Boringhieri, Torino, 1977. [2] A. Avantaggiati, Analisi Matematica I, Editrice Ambrosiana, Milano, 1994. [3] G. C. Barozzi, S. Matarasso, Analisi Matematica I, Zanichelli, Bologna, 1986. [4] P. Boieri, G. Chiti, Precorso di Matematica, Zanichelli, Bologna, 1994. [5] V. E. Bononcini, G. Fanti, Esercizi di Analisi Matematica, Vol. I, Cedam, Padova, 1970. [6] N. Bourbaki, Elementi di storia della matematica, Feltrinelli, Milano, 1963. [7] R. Caccioppoli, Lezioni di Analisi Matematica, Vol. I, Treves, Napoli, 1959. [8] F. Cafiero, A. Zitarosa, Lezioni di Analisi Matematica, Liguori Editore, Napoli, 1970. [9] S. Campanato, Lezioni di Analisi Matematica, prima parte, Libreria Scientifica G. Pellegrini, Pisa, 1977. [10] S. Campanato, Esercizi e complementi di Analisi Matematica, prima parte, Libreria Scientifica G. Pellegrini, Pisa, 1975. [11] M. Campiti, Analisi Matematica I, Teoria ed Esercizi, Liguori Editore, Napoli, 1995. 442 Ulteriori riferimenti [12] E. Casari, Questioni di filosofia della matematica, Feltrinelli, Milano, 1964. [13] J. P. Cecconi, G. Stampacchia, Analisi Matematica, I: Funzioni di una variabile, Liguori Editore, Napoli, 1974. [14] J. P. Cecconi, G. Stampacchia, Esercizi e problemi di Analisi Matematica, I: Funzioni di una variabile, Liguori Editore, Napoli, 1979. [15] P. O. Cohen, La teoria degli insiemi e l’ipotesi del continuo, Feltrinelli, Milano, 1973. [16] F. Conti, Calcolo, Mc Graw-Hill, Milano, 1993. [17] R. Courant, H. Robbins, Che cos’è la matematica?, Boringhieri, Torino, 1971. [18] P. De Lucia, R. Fiorenza, Esercizi di Analisi Matematica, Liguori Editore, Napoli. [19] N. Fedele, Corso di Analisi Matematica, Vol. I, Liguori Editore, Napoli, 1988. [20] R. Fiorenza, D. Greco, Lezioni di Analisi Matematica, Vol. I, Liguori Editore, Napoli, 1985. [21] P. R. Halmos, Teoria elementare degli insiemi, Feltrinelli, Milano, 1970. [22] G. Geymonat, Lezioni di Analisi Matematica I, Editrice Levrotto & Bella, Torino, 1981. [23] A. Ghizzetti, Complementi ed esercizi di Analisi Matematica, Vol. I, Libreria Veschi, Roma, 1956. [24] A. Giannone, V. Conserva, Esercitazioni di Matematica, Adriatica Editrice Salentina, Lecce, 1985. [25] G. Gilardi, Analisi Uno, Mc Graw-Hill, Milano, 1991. [26] E. Giusti, Analisi Matematica I, Boringhieri, Torino, 1983. [27] D. Greco, G. Stampacchia, Esercitazioni di Matematica, Liguori Editore, Napoli, 1966. [28] H. J. Keisler, Elementi di Analisi Matematica, Vol. I, Piccin Editore, Padova, 1982. Ulteriori riferimenti 443 [29] E. Marcante, M. Montagnana, Lezioni di Analisi Matematica I, Vol. I e II, Celid, Torino. [30] P. Marcellini, C. Sbordone, Esercitazioni di Matematica, Vol. I, Liguori Editore, Napoli, 1988. [31] E. Mendelson, Introduzione alla logica matematica, Boringhieri, Torino, 1972. [32] C. Miranda, Lezioni di Analisi Matematica, Parte prima, Liguori Editore, Napoli, 1966. [33] C. D. Pagani, S. Salsa, Analisi Matematica I, Masson, Milano, 1994. [34] E. R. Pegna, Studio analitico e grafico delle funzioni, Editrice Giorgio, Torino. [35] G. Pellacani, G. Pettini, C. Vettori, Istituzioni di Matematica, Editrice Clueb, Bologna, 1977. [36] M. Picone, G. Fichera, Corso di Analisi Matematica, Vol. I, Libreria Veschi, Roma, 1975. [37] G. Prodi, Analisi Matematica, Boringhieri, Torino, 1970. [38] A. Schiaffino, Analisi Matematica I, Unitor, Roma, 1990. [39] G. Scorza Dragoni, Elementi di Analisi Matematica, Cedam, Padova, 1966. [40] V. I. Smirnov, Corso di Matematica Superiore I, Vol. I, Editori Riuniti, Roma, 1977. [41] F. Speranza, Relazioni e strutture, Zanichelli, Bologna, 1970. [42] M. Stoka, Esercizi e problemi di Analisi Matematica I, Editrice Levrotto & Bella, Torino, 1989. [43] M. Stoka, V. Pipitone, Esercizi e problemi di Matematica, Cedam, Padova, 1988. [44] M. Stoka, G. Santoro, Esercizi e complementi di Matematica (per i precorsi universitari), Cedam, Padova, 1988. [45] M. Troisi, Analisi Matematica I, Liguori Editore, Napoli, 1985. 444 Ulteriori riferimenti [46] The Open University, Introduzione all’analisi e all’algebra, Analisi, Mondadori, Milano, 1974. [47] F. G. Tricomi, Esercizi e complementi di Analisi Matematica, Cedam, Padova, 1965. [48] T. Viola, Introduzione alla teoria degli insiemi, Boringhieri, Torino, 1975. [49] F. Waismann, Introduzione al pensiero matematico, Boringhieri, Torino, 1971. [50] M. Zamansky, Introduzione all’algebra e all’analisi moderna, Feltrinelli, Milano, 1966. [51] G. Zwirner, Esercizi e complementi di Analisi Matematica, parte prima, Cedam, Padova. Michele Campiti Dipartimento di Matematica “E. De Giorgi” Università del Salento P.O.Box 193 73100 Lecce E-Mail: michele.campiti@unisalento.it