Uploaded by Carl Ehlers

Analysis I II

advertisement
U. Stammbach
Prof. em. ETH
Analysis I/II
Maschinenbau und Verfahrenstechnik / Mechanical and Process Engineering
Materialwissenschaft / Materials Science
2014
Nachdruck Juni 2014
c by U. Stammbach 1995
http://www.math.ethz.ch/∼stammb
stammb@math.ethz.ch
Vorwort
Diese Notizen gehören zu einer einführenden Vorlesung über Differential- und Integralrechnung
für Ingenieure (Maschinen- und Werkstoffingenieure), wie sie an der ETH-Zürich im ersten Studienjahr vorgesehen ist. Die Aufgabe dieser Lehrveranstaltung ist es, den Studenten in die
Sprache der Mathematik einzuführen und ihn mit der entsprechenden, für sein Gebiet notwendigen Mathematik bekannt zu machen. Die Anwendungen der Differential- und Integralrechnung
in den für den Ingenieur interessanten Gebieten Mechanik, Physik u.a. sind im grossen und
ganzen über die Jahre hinweg die gleichen geblieben. So wird man von diesem Text im Vergleich
zu anderen nichts grundlegend Neues erwarten; die Stoffauswahl bewegt sich im Rahmen des
Üblichen.
Allerdings ist nicht zu verkennen, dass sich für den Ingenieur, was die mathematischen Anwendungen betrifft, in letzter Zeit doch auch vieles geändert hat: Die Art und Weise etwa, wie
der Ingenieur Mathematik einsetzt, hat sich mit den Möglichkeiten des Computers rasant entwickelt. Man denke etwa an numerische Methoden (die Numerische Mathematik hat allerdings
im gültigen Studienplan ihren eigenen Platz), an die Möglichkeiten des symbolischen Rechnens
und an den Einsatz von Graphiken und schliesslich auch an die vielen ganz neuartigen Anwendungen der Mathematik in den Ingenieurwissenschaften. Stellvertretend für andere sei etwa die
Methode der Finiten Elemente genannt. Es ist ganz klar, dass sich damit auch die Anforderungen
an die vorliegende Vorlesung geändert haben. Insbesondere ist der Wunsch nach mehr Stoff und
nach “tieferer” Mathematik zu verspüren. Hier gilt es, die richtigen Konsequenzen zu ziehen:
Nicht Vollständigkeit darf im Vordergrund stehen, sondern das Bemühen, den Studenten in die
Lage zu versetzen, die Mathematik, die er im Laufe seines Studiums und seines Berufslebens
braucht, zu erarbeiten und zu verstehen. Tragfähige Grundlagen sind also gefragt und nicht
Rechenfertigkeit, das Wissen um Zusammenhänge und nicht vereinzelte Details!
Das eben Gesagte ist einer der Gründe, weshalb ich eine radikale Umgestaltung der traditionellen
Analysis-Vorlesung, etwa in Richtung einer Anleitung für den Einsatz von Computern im Ingenieurwesen, der Sache nicht für dienlich halte. Das folgende Beispiel möge diesen Punkt etwas
näher erläutern. In einer Zeit, wo Computerprogramme (Mathematica, Macsyma, etc.) die
Techniken des symbolischen Differenzierens und Integrierens bestens beherrschen, ist es sicherlich
nicht sehr sinnvoll, zum Erlernen dieser Rechenfertigkeiten noch viel Vorlesungszeit einzusetzen.
Viel wichtiger, als die Rechen-Technik in allen Feinheiten zu beherrschen, scheint mir heute für
den angehenden Ingenieur zu sein, dass er die mathematische Idee in ihrem Wesen und ihren Konsequenzen versteht und sie anzuwenden weiss. Dies gilt bekanntlich auch dann, wenn Computer
zur Verfügung stehen; denn: “Wer für seine Probleme den Computer einsetzen will, muss mehr
Mathematik wissen und sie besser verstanden haben”. Dies führt nun allerdings in ein gewisses
Dilemma, denn es ist klar, dass die Konzentration auf die mathematische Idee es dem Studenten
nicht einfacher sondern schwerer macht. Nach wie vor besteht nämlich der einzige Weg zum
Verständnis der mathematischen Idee darin, die zugehörige Technik eigenhändig anzuwenden;
denn: “Mathematics is not a spectator sport; mathematics is learned by doing, not by watching!”
Der Student (und auch der Lehrer!) tut gut daran, sich dies immer wieder in Erinnerung zu
rufen und sich dem Rechnen, das an sich der Computer ja so viel besser beherrschen würde,
nicht zu verschliessen. Zwei offensichtliche, aber wichtige Konsequenzen dieser Tatsache sind in
der Lehrveranstaltung, zu der dieser Text gehört, berücksichtigt worden. Der Text enthält eine
grosse Anzahl von vollständig durchgerechneten Beispielen, und zur Lehrveranstaltung gehören
umfangreiche Übungen. Ein intensiver Einsatz des Computers würde theoretisch vielleicht vieles
davon redundant machen; ich glaube aber nicht an die praktische Weisheit eines solchen radikalen
Schrittes. Der Computer ist ein ausserordentlich wichtiges Hilfsmittel, und wir ziehen ihn auf
selbstverständliche Art, insbesondere bei der Stoffvermittlung herbei; nur eben: Das Verstehen
der mathematischen Idee nimmt dem Studenten kein Computer ab.
Meine Erfahrung, die ich im Laufe der Jahre mit der Betreuung von mathematischen Lehrveranstaltungen für Ingenieure immer und immer wieder gemacht habe, ist die, dass den Studenten allzu oft die Motivation1 fehlt, sich mit den abstrakten mathematischen Werkzeugen zu
beschäftigen. Zwar gibt es den mathematisch interessierten Studenten an den Ingenieurabteilungen auch, aber er ist doch eher die Ausnahme als die Regel. Diese Notizen versuchen, dieser
Tatsache Rechnung zu tragen: nicht nur werden mathematische Begriffsbildungen aus der Anschauung heraus motiviert, sei es geometrisch oder mit Hilfe einer praktischen Fragestellung,
sondern es werden auch die mathematischen Techniken und Resultate regelmässig durch zahlreiche Beispiele aus der Mechanik, Physik und aus den Ingenieurwissenschaften illustriert.
Ein Weiteres: die mathematische Vorbildung der an die ETH eintretenden Studenten ist ausserordentlich heterogen. Was einzelne Studenten bestens beherrschen, ist für andere völlig neu.
Eine nicht geringe Zahl der neueintretenden Studenten kennt z.B. die Differentialrechnung nur
für ganz einfache Funktionen und die Integralrechnung praktisch nur dem Namen nach. Ausserdem sind bei vielen Studenten gewisse grundlegende Begriffe, wie etwa der Begriff der Funktion,
nur in einer völlig ungenügenden Form vorhanden. So ist es schliesslich auch Aufgabe dieser
Vorlesung, den Wissensstand der Studenten zuerst auf ein vergleichbares Niveau zu bringen,
und dafür zu sorgen, dass die “Sprache”, d.h. die Notation und die verwendeten Begriffe, in
genügender Schärfe und genügender Allgemeinheit vorhanden sind. Zu diesem Zweck beginnt
die Vorlesung auf einem relativ tiefen Niveau, schreitet dann aber rasch vorwärts. Für einen Teil
der Studenten ist am Anfang vieles Wiederholung. Ich habe mich allerdings bemüht, diesem
Stoff Blickwinkel abzugewinnen, die auch für den gut vorbereiteten Studenten neu sein dürften.
Nicht vergessen sollte man also, dass dieser erste Teil die wichtige Funktion hat, eine genügend
flexible und starke Sprache zu vermitteln, wie sie für die späteren Kapitel benötigt wird. Würde
man diesen ersten Teil noch kürzer fassen, könnte später vieles nur umständlicher und mit
wesentlich mehr Zeitaufwand gesagt werden.
1
Sehr oft fehlt den Studenten “dank” den gültigen Studienplänen auch ganz einfach die Zeit; denn die
Erarbeitung mathematischer Gedankengänge braucht Zeit, ruhige ungestörte Zeit. Es handelt sich eben
nicht einfach darum, Fakten zu lernen, sondern darum, sich Denkprozesse anzueignen. Dies setzt eine
Reifung voraus, die wie überall in der Natur ihre Zeit braucht. Post festum allerdings erscheint dann
alles klar und leicht!
Die hier beschriebene Situation bedingt, dass dieser erste Teil für die Studenten, die sich als
ungenügend vorbereitet empfinden, wohl etwas zu konzentriert ist. Empfehlenswert ist in diesem
Fall die zusätzliche Erarbeitung eines weiteren Textes (siehe unten).
Es ist nicht zu verkennen, dass der vorliegende von anderen Texten vieles übernommen hat.
Hier ist einmal die frühere Autographie von Huber-Henrici zu nennen; ich hoffe, dass die ihr
zugrundeliegenden didaktischen Erfahrungen in diesen Text hinüber gerettet werden konnten.
Aus der hervorragenden Autographie von Blatter2 stammen eine ganze Anzahl von Beispielen,
und oft liess ich mich auch durch Blatters Darstellung beeinflussen. Dem etwas mathematisch
interessierteren Studenten ist diese Autographie bestens zu empfehlen. Noch etwas mathematischer ist das ebenfalls hervorragende Werk von Burg, Haf und Wille3 , dessen erster Band sich
auch gut als Begleitlektüre für die Studenten eignet, die sich als nicht genügend vorbereitet
einschätzen.
Der Text wurde mit Hilfe des Schreibsystems LATEX produziert. Danken für die Hilfe bei der
Tipparbeit möchte ich Frau Meuli, und den Herren Harpes, Hoffmann und Schünemann. Die
Graphiken wurden mit dem System Mathematica erstellt, das im Rahmen der Lehrveranstaltung
auch für umfangreiche Computerdemonstrationen verwendet wurde. Hier bin ich den Herren
Collart, Küchlin und Mall zu Dank verpflichtet. Danken möchte ich auch den Studenten, die in
einer früheren Fassung viele Fehler und Unklarheiten entdeckt haben. - Schliesslich noch eine
Bemerkung an die Leserinnen: ich konnte mich nicht dazu durchringen, das schwerfällige “Leser
und Leserin” oder das schreckliche “LeserIn” zu verwenden und bin beim alten “Leser” geblieben;
man bzw. frau möge mir verzeihen. Ich gebrauche die deutsche Sprache so, wie sie im Laufe der
Zeit gewachsen ist: definitionsgemäss und ganz selbstverständlich sind mit den Worten “Leser”
und “Student” immer auch die weiblichen Entsprechungen gemeint. Genau gleich übrigens, wie
“Geisel” und “Person” definitionsgemäss und selbstverständlich auch Männliches bezeichnet.
Zürich, im September 1991
Auf Grund einer Anregung aus Studentenkreisen erscheint der Text im Studienjahr 1995/96
erstmals als Serie von drei kleinen Bändchen, Teil A, B und C. Ein Dank geht an die vielen Studenten, die mitgeholfen haben, Druckfehler und Unklarheiten früherer Fassungen auszumerzen.
Zürich, im September 1995
In den sukzessiven Neudrucken wurden jeweils die bekannt gewordenen Druckfehler korrigiert.
Zürich, im Juni 2014
2
3
Ch. Blatter: Ingenieuranalysis I/II, Verlag der Fachvereine Zürich
Burg,Haf,Wille: Höhere Mathematik für Ingenieure I/II/III/IV, B.G.Teubner Stuttgart
Inhaltsverzeichnis, Teil A
Kapitel I. Funktionen
1
Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
3
Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . .
25
4
Der Zwischenwertsatz für stetige Funktionen
. . . . . . . . . . . . . . . . . . . .
34
5
Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
6
Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
7
Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
Kapitel II. Differentialrechnung
1
Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
3
Mittelwertsatz der Differentialrechnung
. . . . . . . . . . . . . . . . . . . . . . .
23
4
Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5
Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . .
35
6
Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . .
49
7
Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . .
57
8
Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
Kapitel III. Integralrechnung
1
Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . .
7
3
Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
4
Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . .
15
5
Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
6
Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
7
Flächenberechnung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
8
Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
9
Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
10
Oberflächenberechnung
49
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
Schwerpunkt, Flächenmittelpunkt
. . . . . . . . . . . . . . . . . . . . . . . . . .
54
12
Trägheitsmoment
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
13
Uneigentliche Integrale
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
Inhaltsverzeichnis, Teil B
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
1
Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3
Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . .
18
4
Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
5
Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
6
Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
7
Funktionen von drei Variablen
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
8
Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
Kapitel V. Funktionen von mehreren Variablen, Integralrechnung
1
Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . .
12
3
Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
4
Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . .
30
5
Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
Kapitel VI. Vektoranalysis
1
Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Differentialoperatoren der Vektoranalysis
. . . . . . . . . . . . . . . . . . . . . .
11
3
Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
4
Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
5
Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
6
Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . .
40
7
Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
8
Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
9
Eine Anwendung des Satzes von Stokes
. . . . . . . . . . . . . . . . . . . . . . .
65
10
Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
Inhaltsverzeichnis, Teil C
Kapitel VII. Gewöhnliche Differentialgleichungen
1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
3
Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . .
17
4
Separierbare Differentialgleichungen
. . . . . . . . . . . . . . . . . . . . . . . . .
25
5
Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
6
Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . .
48
7
Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . .
57
8
Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . .
64
9
Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . .
72
10
Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . .
83
11
Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
12
Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102
13
Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107
14
Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Kapitel VIII. Potenzreihen
1
Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . .
3
2
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
3
Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
4
Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
5
Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Anhang. Komplexe Zahlen
1
Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . .
11
3
Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
Sachverzeichnis
Teil A
Kapitel I. Funktionen
Kapitel II. Differentialrechnung
Kapitel III. Integralrechnung
Wenn [das] Fundament fehlt, so schwebt das Spezialwissen haltlos im Raum, es beschränkt sich auf
das Auswendiglernen von Fakten, es kann nicht in
einen Zusammenhang gestellt und sinnvoll verwertet
werden. Fehlendes Grundwissen lässt sich aber nicht
nachholen.
Prof. Dr. A.P. Speiser, ehemaliger Chef der Konzernforschung BBC/ABB
Inhaltsverzeichnis, Teil A
Kapitel I. Funktionen
1
Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
3
Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . .
25
4
Der Zwischenwertsatz für stetige Funktionen
. . . . . . . . . . . . . . . . . . . .
34
5
Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
6
Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
7
Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
Kapitel II. Differentialrechnung
1
Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
3
Mittelwertsatz der Differentialrechnung
. . . . . . . . . . . . . . . . . . . . . . .
23
4
Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5
Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . .
35
6
Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . .
49
7
Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . .
57
8
Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
Kapitel III. Integralrechnung
1
Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . .
7
3
Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
4
Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . .
15
5
Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
6
Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
7
Flächenberechnung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
8
Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
9
Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
10
Oberflächenberechnung
49
11
Schwerpunkt, Flächenmittelpunkt
12
Trägheitsmoment
13
Uneigentliche Integrale
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
54
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel I. Funktionen
Dem Ingeniör ist nichts zu schwör
Aus einem Inserat der SAIA AG, Murten
15
10
5
-4
-2
2
4
-5
-10
Inhaltsverzeichnis
1
Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
3
Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . .
25
4
Der Zwischenwertsatz für stetige Funktionen
. . . . . . . . . . . . . . . . . . . .
34
5
Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
6
Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
7
Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
3
Kapitel I. Funktionen
1
Folgen, Konvergenz
Eine Folge von reellen Zahlen ist eine Abbildung der natürlichen Zahlen 1, 2, . . . (oder auch
0, 1, 2, . . .) in die reellen Zahlen. Für jede natürliche Zahl n ist somit eine reelle Zahl an festgelegt:
1 → a1
2 → a2
3 → a3
..
.
n → an
..
.
Die Folge wird oft kurz durch ihre Werte a1 , a2 , . . . beschrieben. Das Bildungsgesetz der
Folge kann verschiedene Gestalt besitzen. In manchen Fällen ist das n-te Glied an durch eine
geschlossene Formel gegeben.
Beispiel
an = −5 + 3n , n ≥ 1 .
Sehr oft ist dies allerdings nicht der Fall. Für die Anwendung sehr wichtig sind die Folgen,
wo die Glieder rekursiv bestimmt werden: a1 ist gegeben; an+1 lässt sich nach einer gegebenen
Vorschrift aus a1 , a2 , . . . , an berechnen.
Beispiel
Es sei c > 0 eine reelle Zahl. Die Folge
a1 = 1, an+1
1
c
=
an +
2
an
, n≥1,
ist rekursiv gegeben.
Der mathematische Begriff der Folge ist sowohl für die Theorie wie für die Anwendungen ganz
fundamental. So bestehen Computerberechnungen zum Beispiel oft darin, rekursiv definierte
√
Folgen zu erzeugen. Berechnet man mit Hilfe eines Taschenrechners die Quadratwurzel c, so
geschieht dies dadurch, dass die ersten Glieder einer Folge a1 , a2 , . . . bestimmt werden, deren
Bildungsgesetz im Taschenrechner fest programmiert ist. Diese Folge hat die Eigenschaft, dass
von einem bestimmten Index m an alle Glieder am+k , k ≥ 0 in allen angezeigten Dezimalstellen
√
mit dem Dezimalbruch von c übereinstimmen, wobei die letzte angezeigte Stelle natürlich
gerundet ist. Es werden dann mindestens die ersten m Glieder der Folge ausgerechnet. Dass die
√
verwendete Folge diese Eigenschaft hat, folgt aus der Tatsache, dass sie “gegen c konvergiert”.
Den Begriff der Konvergenz werden wir in diesem Abschnitt genau definieren.
4
U. Stammbach:
Analysis, Teil A
Zur Diskussion von Folgen ist es oft nützlich, die Glieder als Punkte in einem kartesischen
Koordinatensystem aufzufassen; das Glied an wird als Punkt (n, an ) dargestellt (siehe Figur 1).
Definitionen Eine Folge a1 , a2 , . . . heisst beschränkt, wenn ihr Bild ganz in einem endlich
breiten, waagerechten Parallelstreifen enthalten ist.
7
6
5
Fig. 1 :
Zur Darstellung von Folgen
4
3
2
1
2
4
6
8
10
(n)
Eine Folge heisst (strikt) monoton wachsend, wenn für alle n gilt
an+1 ≥ an (bzw. an+1 > an ) .
Die Folge a1 , a2 , . . . heisst Nullfolge, falls es zu jeder noch so kleinen Zahl > 0 ein m gibt, so
dass für alle Glieder am+k , k ≥ 0 gilt
|am+k | < .
Man sagt in diesem Fall, die Folge konvergiere gegen Null oder strebe gegen Null. In Zeichen
drückt man dies durch
5
Kapitel I. Funktionen
lim an = 0
n→∞
oder durch
an → 0 für n → ∞
aus. Das geometrische Bild einer Nullfolge hat die Eigenschaft, dass in jedem noch so schmalen
Parallelstreifen mit der x-Achse als Mittellinie alle Glieder der Folge mit Ausnahme von endlich
vielen liegen.
Beispiel
Figur 2).
Die Folge gegeben durch an = 1/n, n ≥ 1 ist offensichtlich eine Nullfolge (siehe
1.5
1
Fig. 2 :
Die Folge 1/n
0.5
5
10
15
20
(n)
-0.5
Beispiel
Die Folge gegeben durch
an =
1
1
+ (−1)n 2
2
n
ist offenbar beschränkt (siehe Figur 3). Sie hat zusätzlich die Eigenschaft, dass in jedem Parallelstreifen mit Mittellinie auf dem Niveau 1/2 alle Glieder der Folge bis auf endlich viele liegen.
6
U. Stammbach:
Analysis, Teil A
0.8
0.6
0.4
Fig. 3 :
0.2
5
10
15
20
1
1
+ (−1)n 2
2
n
(n)
-0.2
-0.4
-0.6
In einem solchen Fall sagen wir, die Folge konvergiere gegen den Grenzwert a = 1/2. Die genaue
Definition dieses wichtigen Begriffes ist wie folgt.
Man sagt, die Folge a1 , a2 , . . . konvergiere gegen den Grenzwert oder Limes a, falls die Folge
bn = an − a eine Nullfolge ist, d.h. wenn es zu jeder noch so kleinen Zahl > 0 ein m gibt, so
dass für alle Glieder am+k , k ≥ 0 gilt
|am+k − a| < .
In Zeichen drückt man dies aus durch
lim an = a
n→∞
oder durch
an → a für n → ∞
aus.
Eine Folge, die konvergiert, heisst konvergent, eine Folge die nicht konvergiert, heisst divergent.
7
Kapitel I. Funktionen
Aus unserer Definition folgt sofort, dass eine konvergente Folge beschränkt ist. Wir können
diesen logischen Sachverhalt auch so ausdrücken: Eine nicht beschränkte Folge ist nicht konvergent. Ferner lässt sich leicht zeigen, dass eine konvergente Folge nicht gegen mehr als einen
Grenzwert konvergieren kann: ist die Folge konvergent, so ist ihr Limes eindeutig bestimmt.
Sehr wichtig ist nun die Tatsache, dass in manchen Fällen gezeigt werden kann, dass eine Folge
konvergiert, ohne dass über deren Limes a priori etwas bekannt ist. Dies ist z.B. auf Grund des
folgenden Satzes möglich, welcher eine fundamentale Eigenschaft der reellen Zahlen beschreibt.
Wir führen ihn hier ohne Beweis auf.
Satz Ist eine Folge monoton wachsend (oder fallend) und beschränkt, so ist sie konvergent.
Beispiel Ein ganz einfaches Beispiel ist das folgende. Jeder unendliche Dezimalbruch definiert
eine monoton wachsende, beschränkte Folge (von rationalen Zahlen), indem man als Glieder der
Folge einfach die endlichen Dezimalbrüche nimmt. Die Zahl π zum Beispiel definiert die Folge
3, 3.1, 3.14, 3.141, 3.1415, 3.14159, 3.141592, 3.1415926, . . .
Nach obigem Satz konvergiert die so erhaltene Folge; ihr Limes ist die durch den unendlichen
Dezimalbruch dargestellte reelle Zahl.
Beispiel
(siehe Figur 4)
an = 1 +
1
1
1
1
+ + + ··· +
, n ≥ 1.
1! 2! 3!
n!
Diese Folge ist (strikt) monoton wachsend und - wie wir unten zeigen - beschränkt. Deshalb ist
sie nach dem obigen Satz auch konvergent. Ihr Limes, der a priori nicht bekannt ist und erst
mit Hilfe dieser Folge berechnet werden kann, ist die Euler’sche Zahl e. Es ist bekannt, dass die
Zahl e irrational ist, d.h. durch einen unendlichen nichtperiodischen Dezimalbruch dargestellt
wird. Näherungsweise gilt e = 2.7182818284590 · · ·. Die Zahl e spielt als Basis der natürlichen
Logarithmen in der Mathematik eine grosse Rolle.
Um zu zeigen, dass die Folge beschränkt ist,
1
2!
1
3!
1
4!
benützen wir die offensichtlichen Abschätzungen
1
≤
2
1
≤
22
1
≤
23
..
.
1
1
≤
n−1
n!
2
..
.
8
U. Stammbach:
Analysis, Teil A
3.5
3
2.5
Fig. 4 :
2
an = 1 +
1.5
1
1
1
1
+ + + ··· +
1! 2! 3!
n!
1
0.5
2
4
6
8
10
12
(n)
-0.5
Es ist dann
an = 1 +
1
1
1
1
1
1
1
+ + + ··· +
≤ 1 + 1 + 1 + 2 + · · · + n−1 = x .
1! 2! 3!
n!
2
2
2
Damit gilt
1
1
3
1
x = x − x = − n,
2
2
2 2
also
x=3−
1
2n−1
< 3.
Die Folge ist also beschränkt, es gilt 0 < an < 3.
Beispiel
Die harmonische Folge (siehe Figur 5) ist definiert durch
an = 1 +
1 1
1
+ + ··· + .
2 3
n
9
Kapitel I. Funktionen
Diese Folge ist offensichtlich ebenfalls (strikt) monoton wachsend. Um über die Konvergenz
zu entscheiden, muss man nur untersuchen, ob sie beschränkt ist. Ist sie beschränkt, so ist
sie nach unserem Satz auch konvergent. Ist sie nicht beschränkt, so kann sie nach unseren
früheren Aussagen auch nicht konvergent sein. Wir zeigen anschliessend, dass die Glieder der
Folge beliebig gross werden, wenn nur ihr Index genügend gross ist. Die Folge ist somit in der
Tat nicht beschränkt. Die harmonische Folge ist nicht konvergent.
8
6
Fig. 5 :
4
1+
1 1
1
+ + ··· +
2 3
n
2
(n)
50
100
150
200
250
Um zu zeigen, dass unsere Folge nicht beschränkt ist, benützen wir die Beziehung
a2n − an =
1
1
1
n
1
+
+ ··· +
≥
= ,
n+1 n+2
n+n
2n
2
die unmittelbar aus der Definition folgt. Daraus ergibt sich
a2
a22
a23
= a1 + (a2 − a1 )
= a2 + (a22 − a2 )
= a22 + (a23 − a22 )
..
.
a2r
= a2r−1 + (a2r − a2r−1 ) ≥ 1 + r/2 .
≥ 1 + 1/2 ,
≥ 1 + 2/2 ,
≥ 1 + 3/2 ,
Die Glieder der Folge werden also beliebig gross, die Folge ist nicht beschränkt.
10
U. Stammbach:
Beispiel
Analysis, Teil A
Wir kehren zurück zur Folge des ersten Beispiels, nämlich zu
a1 = 1, an+1
1
c
=
an +
2
an
, n≥1,
wobei c > 0 eine feste reelle Zahl bezeichnet (siehe Figur 6). Wir behaupten, dass diese Folge
√
konvergiert, und zwar gegen c. Um dies zu beweisen, müssen wir nachweisen, dass die Folge
√
b1 , b2 , b3 , . . . mit bn = an − c eine Nullfolge ist. Aus der Definition von an+1 erhalten wir
3
2.5
2
Fig. 6 :
1.5
a1 = 1, an+1 =
1
0.5
(n)
2
4
6
8
-0.5
bn+1 = an+1 −
√
c =
=
=
√
1
c
− 2 c)
(an +
2
an
√
1
(a2n + c − 2an c)
2an
√
1
(an − c)2 .
2an
Wegen an ≥ 0 ergibt sich daraus bn ≥ 0 für n = 2, 3, . . .. Ferner erhalten wir
bn+1 =
√
an − c
· bn
2an
1
3
an +
2
an
11
Kapitel I. Funktionen
=
√ !
1
c
· bn .
−
2 2an
Nun gilt für n ≥ 2 wegen bn+1 ≥ 0 und bn ≥ 0 auch
√
1
c
≥ 0.
−
2 2an
Da auch
√
c/2an positiv ist, folgt
0≤
√
1
c
1
< .
−
2 2an
2
Damit erhalten wir
1
|bn+1 | < |bn | ,
2
d.h. die Folge b1 , b2 , b3 , . . . ist in der Tat eine Nullfolge.
Für das Rechnen mit konvergenten Folgen gelten einfache Rechenregeln, die wir kurz zusammenstellen. Es seien a1 , a2 , . . . und b1 , b2 , . . . zwei konvergente Folgen mit limn→∞ an = a und
limn→∞ bn = b. Dann gilt
lim (an + bn ) = a + b ,
n→∞
lim (an − bn ) = a − b ,
n→∞
lim (an · bn ) = a · b ,
n→∞
lim (an /bn ) = a/b ,
n→∞
wobei für Letzteres natürlich vorausgesetzt werden muss, dass b und alle bn verschieden von Null
sind.
Wir verzichten in dieser Vorlesung auf einen Beweis dieser Regeln, möchten aber die beiden folgenden Bemerkungen anfügen. Sind die beiden Folgen a1 , a2 , . . . und b1 , b2 , . . . durch unendliche
Dezimalbrüche gegeben, so besagen diese Rechenregeln nichts anderes, als dass man approximativ mit den endlichen Teilbrüchen rechnen darf. Eine Tatsache, die man natürlich etwa beim
Rechnen mit π immer schon benützt hat. Zum zweiten muss der Leser gewarnt werden, diese
Regeln in Fällen anzuwenden, wo die Folgen a1 , a2 , . . . und b1 , b2 , . . . nicht konvergieren. In
diesem Fall gelten die Regeln nicht, und deren Anwendung liefert leicht falsche Resultate.
Beispiel
n+3
1 + 3/n
1
= lim
=
n→∞ 2n + 5
n→∞ 2 + 5/n
2
lim
12
Beispiel
U. Stammbach:
Analysis, Teil A
n3 + n2 + 1
1 + 1/n + 1/n3
1
=−
=
lim
n→∞ −3n3 + 13
n→∞ −3 + 13/n3
3
lim
Beispiel
17n2
existiert nicht
n→∞ 18n + 1
lim
Beispiel
lim
n→∞
2n2
n2 + 3
!4
= lim
n→∞
2
1 + 3/n2
4
= 24
Zum Schluss dieses Abschnittes gehen wir noch kurz auf die geometrische Folge und die geometrische Reihe ein.
Beispiel
Eine Folge der Form
a0 = a, a1 = aq, · · · , an = aq n , · · ·
heisst geometrische Folge. Die Zahl a heisst Anfangsglied, die Zahl q heisst Faktor der Folge.
Für |q| > 1 gilt
|an+1 | = |an q| = |an ||q| > |an |.
Die Absolutbeträge der Glieder der Folge werden mit wachsendem n beliebig gross; die Folge ist
in diesem Fall nicht beschränkt, also auch nicht konvergent. Für |q| < 1 hingegen gilt
|an+1 | = |an q| = |an ||q| < |an |.
Die Absolutbeträge der Glieder werden mit wachsendem n beliebig klein. Ist nämlich > 0
irgendeine positive reelle Zahl, so gilt |am | < , wenn nur m gross genug ist. Die Bedingung
|aq m | < liefert nämlich
log |a| + m log |q| < log ,
woraus sich wegen log |q| < 0 sofort
m>
log − log|a|
log |q|
ergibt. Diese Überlegung zeigt, dass für |q| < 1 die geometrische Folge eine Nullfolge ist.
Beispiel
Schliesslich wenden wir uns noch der sogenannten geometrischen Reihe zu.
Darunter versteht man die Folge, die durch
13
Kapitel I. Funktionen
s0
s1
= 1,
= 1 + x,
..
.
sn
= 1 + x + x2 + · · · + xn ,
sn+1 = 1 + x + x2 + · · · + xn + xn+1 ,
gegeben ist. Dabei bezeichnet x eine reelle Zahl. (Der Leser mache sich den Unterschied zwischen
den Begriffen “Folge” und “Reihe” klar!) Rekursiv kann man die Folge s0 , s1 , s2 , . . . beschreiben
durch
s0 = 1; sn+1 = sn + xn+1 , n ≥ 0.
Man erhält leicht xsn − sn = xn+1 − 1, woraus sich sofort
sn =
1 − xn+1
1
xn+1
=
−
1−x
1−x 1−x
ergibt. Ist |x| < 1, so strebt der zweite Summand für n → ∞ offensichtlich gegen Null. Deshalb
konvergiert in diesem Fall die Folge s0 , s1 , s2 , . . ., und es gilt
lim (1 + x + x2 + · · · + xn ) =
n→∞
1
, |x| < 1.
1−x
Für |x| > 1 ist die Folge s0 , s1 , s2 , . . . offenbar nicht beschränkt, so dass sie in diesem Fall auch
nicht konvergent ist. Man sagt etwas kürzer, die geometrische Reihe
1 + x + x2 + · · · + xn + · · ·
konvergiere für |x| < 1 gegen 1/(1 − x) und divergiere für |x| > 1, indem man die Konvergenz
bzw. Divergenz der Reihe durch die Konvergenz bzw. Divergenz der zugehörigen Folge definiert
(siehe Figuren 7,8,9). Konsequenterweise schreibt man dann
1 + x + x 2 + · · · + xn + · · · =
1
, für |x| < 1.
1−x
Die linke Seite dieser Formel kann man als “alternative” Definition der Funktion
f :x→
1
, D(f ) = (−1, +1)
1−x
auffassen (siehe Figur 10). (Der Leser beachte die Einschränkung des Definitionsbereiches!) Insbesondere kann der Funktionswert f (x) für |x| < 1 als Limes unserer Folge s0 , s1 , s2 , . . . berechnet werden. Für die einfache Funktion f scheint dies fast eine Spielerei zu sein; für kompliziertere
Funktionen bildet eine Reihe aber oft die natürlichste Art, die Funktion darzustellen und den
Funktionswert zu bestimmen. Wir werden auf dieses Thema unter dem Stichwort Potenzreihen
später wieder zu sprechen kommen und uns etwas eingehender damit beschäftigen.
14
U. Stammbach:
Analysis, Teil A
2
1.5
Fig. 7 :
Geometrische Reihe
mit x = 0.3
1
0.5
2
4
6
8
10
12
(n)
-0.5
12
10
8
Fig. 8 :
Geometrische Reihe
mit x = 0.9
6
4
2
(n)
10
20
30
40
15
Kapitel I. Funktionen
1.2
1
0.8
Fig. 9 :
Geometrische Reihe
mit x = −0.9
0.6
0.4
0.2
(n)
10
20
30
40
-0.2
20
15
Fig. 10 :
Die Funktion
10
x→
5
(x)
-1
-0.5
0.5
1
1
1−x
16
2
U. Stammbach:
Analysis, Teil A
Funktionen
Eine Funktion oder Abbildung von der Menge A in die Menge B, f : A → B, ist eine
Vorschrift, die für jedes Element x ∈ A ein Element f (x) ∈ B festlegt, f : x → f (x).
f (x) heisst Funktionswert von f an der Stelle x oder Bild von x unter f .
A heisst Definitionsbereich D(f ) von f (englisch: domain), B heisst Zielbereich von f (englisch:
range), W (f ) = {f (x)|x ∈ D(f )} heisst Wertebereich von f .
Es handelt sich beim Begriff der Funktion um einen der ganz zentralen Begriffe der Mathematik.
Er hat eine lange historische Entwicklung durchgemacht; erst in neuester Zeit hat er den obigen sehr genau bestimmten Inhalt erhalten. Der Leser tut gut daran, sich mit diesem Begriff
eingehend auseinanderzusetzen. Eine etwas anschaulichere Beschreibung des Funktionsbegriffs
ist die folgende.
Eine Funktion f : A → B ist ein “schwarzer Kasten”, der als Input nur Elemente von A annimmt,
und für jedes x ∈ A den Output f (x) ∈ B liefert. Konkret (aber wegen der beschränkten
Rechengenauigkeit nur annäherungsweise) kann man etwa einen Taschenrechner mit der Taste
log als Funktion f : x → log x ansehen.
Der Begriff der Funktion ist sehr allgemein, über die Natur der Elemente von A und B zum
Beispiel wird überhaupt nichts vorausgesetzt. Zuerst betrachten wir nun Beispiele von Funktionen, welche auf einem Teilbereich der reellen Zahlen definiert sind und welche reelle Zahlen als
Werte annehmen, also reellwertige Funktionen einer reellen Variablen. Zu jeder solchen Funktion
f gehört ihr Graph Γ(f ), nämlich die Menge der Punkte (x, y) ∈ R × R mit x ∈ D(f ), y = f (x)
Γ(f ) = {(x, y) ∈ R × R| x ∈ D(f ), y = f (x)}.
Beispiel
Die Sinusfunktion
f : x → sin x; f : R → R; D(f ) = R, W (f ) = [−1, +1].
Man beachte W (f ) 6= B; im allgemeinen können Zielbereich und Wertebereich verschieden sein.
Beispiel
f :x→
√
x − 1 ; f : [1, ∞) → R, D(f ) = [1, ∞); W (f ) = [0, ∞).
Bei Funktionen, wie sie in Anwendungsbeispielen auftreten, ist der Graph üblicherweise eine
Kurve; es lassen sich aber durchaus kompliziertere Funktionen denken, deren Graph in keinem
vernünftigen Sinn als Kurve aufgefasst werden kann.
Beispiel
Die Funktion f : R → R sei durch die folgende Vorschrift gegeben:
17
Kapitel I. Funktionen
(
f (x) =
1, falls x rational ist,
0, falls x irrational ist .
√
Es gilt also insbesondere f (1/2) = 1 und f ( 2) = 0. Der Graph dieser Funktion ist keine Kurve
im anschaulichen Sinn.
Funktionen lassen sich auf sehr viele verschiedene Arten definieren, beschreiben und anschaulich
machen. Auf einige der wichtigsten Arten gehen wir im Folgenden ein.
(i) Wertetabelle
Ist D(f ) eine endliche Menge, so kann f durch eine Wertetabelle beschrieben werden; ist z.B.
D(f ) = {x0 , x1 , ...., xN }, so genügt es f (x0 ), f (x1 ), ...., f (xN ) aufzuführen:
x
x0
x1
x2
···
xN
f (x) f (x0 ) f (x1 ) f (x2 ) · · · f (xN )
Wenn D(f ) eine unendliche Menge ist, so ist f natürlich durch die Angabe von endlich vielen
Werten noch nicht bestimmt. Jede reelle Zahlfolge kann als eine auf der Menge der natürlichen
Zahlen definierte Funktion f : N → R
x
1
2
3
···
4
f (x) a1 a2 a3 a4 · · ·
angesehen werden. Sie wird durch das Bildungsgesetz der Folge bestimmt, z.B.
a1 = 1, an+1 =
1
c
an +
, n≥1.
2
an
(ii) Explizite Darstellung, Formel
Eine Funktion f kann durch eine Rechenvorschrift beschrieben werden, welche es erlaubt, zu
gegebenem x den Wert f (x) zu bestimmen
f :x→
x2 + 5x + 4
x4 − 16
In einem solchen Fall wird, falls nichts anderes angegeben ist, für D(f ) immer der grösstmögliche
Bereich genommen, für den die angegebene Formel sinnvoll ist. Die Rechenvorschrift kann
beliebig kompliziert sein. Als Beispiele erwähnen wir eine “Sprungfunktion” (siehe Figur 1)
f : x → f (x) =


 −1, für x < 0


0, für x = 0
1, für x > 0
18
U. Stammbach:
Analysis, Teil A
2
1.5
1
Fig. 1 :
Sprungfunktion
0.5
-4
-2
2
4
(x)
-0.5
-1
-1.5
-2
1
0.5
Fig. 2 :
Gauss’sche Fehlerfunktion
-2
-1
1
2
(x)
-0.5
-1
19
Kapitel I. Funktionen
und die Gauss’sche Fehlerfunktion (siehe Figur 2)
f : x → f (x) =
Z
x
0
2
e−t dt .
Der Leser mache sich an dieser Stelle den Unterschied zwischen den Begriffen “Formel” und
“Funktion” klar: nicht jede Funktion ist durch eine Formel gegeben!
(iii) Differentialgleichung
In den Naturwissenschaften werden Funktionen sehr oft durch Differentialgleichungen bestimmt.
Als Beispiel sei der freie Fall eines Massenpunktes erwähnt. Die Differentialgleichung lautet
bekanntlich
ÿ(t) = −g,
wo g die Erdbeschleunigung bezeichnet. Daraus erhält man
1
y(t) = − gt2 + At + B,
2
wo A und B Konstanten sind. Die Differentialgleichung hat unendlich viele Lösungen. Die
(Integrations-)Konstanten werden durch weitere Angaben, üblicherweise durch die sogenannten
Anfangsbedingungen (Ort und Geschwindigkeit des Massenpunktes zur Zeit 0) bestimmt.
Im Rest dieses Abschnittes wollen wir noch einige Beispiele von Funktionen kennen lernen,
welche etwas allgemeinerer Art sind, und dabei gleich Situationen beschreiben, in denen solche
Funktionen auf natürliche Weise auftreten.
Beispiel f : A → R × R, A ein Teilbereich der reellen Zahlen. Solche Funktionen treten z.B.
bei Parameterdarstellungen ebener Kurven auf.
(1) t → (a cos t, a sin t), A = R
Diese Funktion beschreibt einen Kreis mit Radius a, der mit Startpunkt (a, 0) gleichförmig im
Gegenuhrzeigersinn durchlaufen wird.
(2) t → (a cos t, b sin t), A = R
Es gilt x(t)2 /a2 + y(t)2 /b2 = 1. Die Funktion beschreibt folglich eine Ellipse mit Halbachsen a
und b und Mittelpunkt (0, 0).
Beispiel
f : A → R × R × R, A ein Teilbereich der reellen Zahlen,
f : t → (x(t), y(t), z(t)).
Eine solche Funktion beschreibt eine Kurve im 3-dimensionalen Raum.
20
U. Stammbach:
(1)
Analysis, Teil A


 x(t) =
a1 + tn1
y(t) = a2 + tn2 , D(f ) = R
f :t→

 z(t) = a + tn
3
3
stellt eine Gerade durch den Punkt P , P = (a1 , a2 , a3 ) in Richtung ~n, ~n = (n1 , n2 , n3 ) dar.
(2)
f : t → (cos t, sin t,
h
t), D(f ) = R .
2π
Diese Funktion beschreibt eine Rechts-Schraubenlinie mit Ganghöhe h auf einem Zylinder mit
Radius 1 um die z-Achse.
Beispiel f : A → R, A Teil der Ebene R × R.
Der Funktionswert an der Stelle (x, y) ist eine reelle Zahl. Die Temperaturverteilung auf einem
Blechstück der Form A wird zum Beispiel durch eine Funktion dieser Art beschrieben.
Beispiel Betrachten wir jetzt ein ganz konkretes Beispiel. Bei einer Eisenbahnlinie, welche
einen Kreisbogen beschreibt, ist die Grösse a vorgegeben. Man bestimme den Kurvenradius r
in Abhängigkeit von x (siehe Figur 3).
x
a
Fig. 3 :
Kreisbogen mit Grössen r, a, x
r
Es gilt offensichtlich
a2 + (r − x)2 = r 2 .
21
Kapitel I. Funktionen
Daraus ergibt sich leicht
!
a2
+x .
x
1
r=
2
Damit ist der Radius r in Abhängigkeit der Grösse x bestimmt. Mathematisch definiert dies
eine Funktion
!
1 a2
r : x → r(x) =
+x .
2
x
Für die Anwendung, die man im Auge hat, ist nur der Definitionsbereich D(r) = (0, a] von
Interesse, obschon mathematisch die gefundene Formel auch für andere Werte von x sinnvoll ist,
und deshalb der Definitionsbereich ausgedehnt werden kann.
Das Beispiel etwas variierend kann man den Radius r auch in Abhängigkeit der Grössen x und
a betrachten. Dann beschreibt die obige Formel eine Funktion
1
r̄ : (a, x) → r̄(a, x) =
2
!
a2
+x ,
x
welche auf einem Teilbereich A der Ebene R × R definiert ist und Werte in R annimmt. Man
hat also hier eine Funktion r̄ : A → R vor sich, wie wir sie auch in einem der früheren Beispiele
studiert haben, und dies in einem ganz anderen Zusammenhang.
(y)
R
ϕ
ψ
r
Fig. 4 :
Roboterarm
P
(x)
22
U. Stammbach:
Analysis, Teil A
Beispiel f : A → R × R, A eine Teilmenge von R × R. Eine Situation, wo eine Funktion dieser
Art auf natürliche Art auftritt, ist wie folgt. Gegeben ist ein Roboterarm (siehe Figur 4), bei
dem die Winkel ϕ und ψ unabhängig voneinander zwischen 0 und π variieren können. Jedes
Paar (ϕ, ψ) legt einen Punkt P im Arbeitsbereich des Armes fest, nämlich
P = (R cos ϕ + r cos(ϕ − ψ), R sin ϕ + r sin(ϕ − ψ)).
Dadurch wird offenbar eine Funktion (=Abbildung!)
f : (ϕ, ψ) → (R cos ϕ + r cos(ϕ − ψ), R sin ϕ + r sin(ϕ − ψ))
von einem Teilbereich A der (ϕ, ψ)-Ebene in die (x, y)-Ebene definiert. Der Teilbereich A ist
dabei durch
A = {(ϕ, ψ)|0 ≤ ϕ ≤ π, 0 ≤ ψ ≤ π}
gegeben.
Zum Schluss dieses Abschnittes wollen wir uns mit einigen grundlegenden Funktionen beschäftigen; wir verstehen darunter Funktionen der Art
x → xn , x → sin x, x → ex , etc.
Diese Funktionen sind aus der Schule bereits bekannt, und wir können uns deshalb kurz fassen.
Da sie aber die Bausteine für kompliziertere Funktionen bilden, ist es notwendig, ihre Eigenschaften gut zu kennen; insbesondere muss für jede dieser Funktionen über den Definitionsbereich, das globale Verhalten, die Symmetrieeigenschaften etc. Klarheit herrschen.
Es sei f : x → f (x) eine Funktion. Sie heisst gerade, wenn D(f ) symmetrisch zum Nullpunkt
der x-Achse ist und wenn für alle x ∈ D(f ) gilt
f (−x) = f (x).
Die Funktion f : x → f (x) heisst ungerade, wenn D(f ) symmetrisch zum Nullpunkt der x-Achse
ist und wenn für alle x ∈ D(f ) gilt
f (−x) = −f (x).
Die Funktion f : x → f (x) heisst (strikt) monoton wachsend, wenn aus x1 < x2 mit x1 , x2 ∈
D(f ) stets folgt
f (x1 ) ≤ f (x2 ) (bzw. f (x1 ) < f (x2 )).
Die Funktion f : x → f (x) heisst (strikt) monoton fallend, wenn aus x1 < x2 mit x1 , x2 ∈ D(f )
stets folgt
f (x1 ) ≥ f (x2 ) (bzw. f (x1 ) > f (x2 )).
Die elementaren Funktionen sind die folgenden:
23
Kapitel I. Funktionen
(i) Potenzfunktion
x → xn .
Man mache sich in den folgenden Fällen den Verlauf des Graphen klar: n ganz positiv, n ganz
negativ, n rational (z.B. 12 , 23 , ...), n beliebig reell. In welchen Fällen ist die Potenzfunktion
gerade, ungerade, monoton wachsend oder fallend, etc?
(ii) Polynome
x → a0 + a1 x + a2 x2 + · · · + an xn .
Die reellen Grössen a0 , a1 , ..., an heissen die Koeffizienten des Polynoms, die ganze Zahl n heisst
Grad des Polynoms, falls an 6= 0. Man studiere den typischen Verlauf solcher Funktionen,
insbesondere untersuche man für kleine n, n = 1, 2, 3 den Einfluss der Koeffizienten.
(iii) rationale Funktionen
x →
a0 + a1 x + · · · + an xn
.
b0 + b 1 x + · · · + b m x m
Man werde sich klar über den Definitionsbereich solcher Funktionen und studiere den Verlauf
an einigen ausgewählten Beispielen.
(iv) trigonometrische Funktionen sin, cos, tan, cot.
Man präge sich für jede dieser Funktionen die grundlegenden Eigenschaften (Symmetrie, Nullstellen, Periodizität, etc.) gut ein.
(v) Exponentialfunktion
(vi) Logarithmusfunktion
x → ax , a > 1.
x →a log x, a > 1.
Auf Exponential- und Logarithmusfunktion werden wir später noch zurückkommen. Hier soll der
typische Verlauf der Graphen kennengelernt und insbesondere der Einfluss der Grösse a studiert
werden. Es soll auch klar werden, dass zwischen Exponentialfunktion und Potenzfunktion ein
wesentlicher Unterschied besteht.
Anhang: Intervallbezeichnungen. Es seien a, b ∈ R mit a < b gegeben. Dann definieren wir
(a,b) = {x ∈ R | a < x < b} ,
[a,b) = {x ∈ R | a ≤ x < b} ,
24
U. Stammbach:
Analysis, Teil A
(a,b] = {x ∈ R | a < x ≤ b} ,
[a,b] = {x ∈ R | a ≤ x ≤ b} .
An Stelle von a, b ∈ R lassen wir auch die Symbole +∞, −∞ zu, so dass zum Beispiel gilt
[a, ∞) = {x ∈ R | a ≤ x < ∞},
(−∞, +∞) = {x ∈ R} = R.
Natürlich dürfen die Symbole +∞, −∞ nur zusammen mit einer runden Klammer vorkommen.
25
Kapitel I. Funktionen
3
Grenzwerte von Funktionen, Stetigkeit
Wir beginnen diesen Abschnitt mit einem numerischen Experiment. Es sei die Funktion
x2 + x + 1
f : x → sin
x2 − x − 2
!
gegeben. Wir stellen uns vor, dass innerhalb einer längeren Rechnung der Funktionswert von f
bestimmt werden soll, und zwar für Werte von x, die ihrerseits aus Messungen errechnet worden
sind und deshalb nur näherungsweise bekannt sind. Immerhin wollen wir annehmen, dass der
Wert von x mit zusätzlichem Aufwand beliebig genau gemacht werden kann. Zur Demonstration
wollen wir die Funktion f zuerst an den Stellen
3.9, 3.99, 3.999, 3.9999, 3.99999, . . .
auswerten, also auf einer Folge von Zahlen, die sehr rasch gegen den als genau angesehenen
Wert 4 konvergiert. Diese Folge von Zahlen deutet also die sukzessiv immer besser werdende
Genauigkeit für die Grösse x an.
Ferner führen wir die gleiche Rechnung für die Folge von Zahlen
1.9, 1.99, 1.999, 1.9999, 1.99999, . . .
durch, welche gegen den Wert 2 konvergiert. Die Berechnung liefert folgende Werte:
x
3.9
3.99
3.999
3.9999
3.99999
3.999999
3.9999999
3.99999999
3.999999999
f (x)
0.8313595846
0.8603029298
0.8629213180
0.8631805876
0.8632064890
0.8632090789
0.8632093379
0.8632093638
0.8632093664
x
1.9
1.99
1.999
1.9999
1.99999
1.999999
1.9999999
1.99999999
1.999999999
f (x)
0.4413721770
0.0330343010
−0.9823680634
−0.1634533406
−0.0748074451
−0.6256837105
−0.9457588989
−0.9997768755
0.9978731823
Wir entnehmen dieser Tabelle, dass das Verhalten der Funktion f in der Nähe der beiden durch
x = 2 und x = 4 gegebenen Punkte völlig verschieden ist. Während für x = 4 die Werte f (x)
sich - wie eine weitere Rechnung bestätigt - sukzessive der Zahl 0.8632093666 · · · nähern, streuen
sie für x = 2 “chaotisch” über einen weiten Bereich.
Wir wollen im Laufe dieses Abschnittes die Gründe für diesen Sachverhalt näher untersuchen.
Zu diesem Zwecke führen wir als erstes den Begriff des Grenzwertes von Funktionen ein.
26
U. Stammbach:
Analysis, Teil A
Wir betrachten eine Funktion f , deren Definitionsbereich das Intervall (c, ξ), c < ξ umfasst, und
ausserdem Folgen x1 , x2 , . . . von reellen Zahlen xi mit c < xi < ξ, welche gegen ξ konvergieren,
limi→∞ xi = ξ. Offensichtlich gibt es unendlich viele solcher Folgen; eine davon ist immer durch
die unendliche Dezimalbruchentwicklung von ξ gegeben. Zu jeder solchen Folge bilden wir die
zugehörige Folge der Funktionswerte
f (x1 ), f (x2 ), . . . .
Diese kann - je nach Sachlage - konvergieren oder divergieren. Am interessantesten ist natürlich
der Fall, wo sie nicht nur konvergiert, sondern auch für jede der oben beschriebenen Zahlfolgen
x1 , x2 , . . . denselben Grenzwert a liefert. Dieser Wert a heisst dann definitionsgemäss der linke
Grenzwert der Funktion f an der Stelle ξ; in Zeichen drücken wir dies durch
a = lim f (x) oder f (x) → a für x → ξ −
x→ξ −
aus. Dabei deutet das Minuszeichen beim Buchstaben ξ an, von welcher Seite die Folge x1 , x2 , . . .
gegen ξ konvergieren soll.
Anzumerken sind hier die folgenden Dinge.
(1) Für gewisse Funktionen und für gewisse Werte von ξ kann es durchaus vorkommen, dass für
die eine Zahlenfolge x1 , x2 , ... der Grenzwert limn→∞ f (xn ) existiert, während für eine andere
Zahlenfolge x01 , x02 , ... der Grenzwert limn→∞ f (x0n ) nicht existiert, oder es kann vorkommen, dass
diese Grenzwerte zwar beide existieren, dass sie aber voneinander verschieden sind. Gemäss
unserer Definition besitzt in diesem Fall die Funktion f in ξ keinen linken Grenzwert.
(2) Bei der Definition des linken Grenzwertes einer Funktion f an der Stelle ξ wurde nirgends
vorausgesetzt, dass die Funktion an der Stelle ξ definiert ist. In der Tat hat der Funktionswert
in ξ - falls er existiert - a priori nichts mit dem linken Grenzwert von f in ξ zu tun. Es kann
allerdings vorkommen, dass die beiden Werte übereinstimmen; aber dann sagt dies etwas ganz
Wesentliches über die Funktion an der Stelle ξ aus. Darauf kommen wir in Kürze zu sprechen.
Vorerst aber noch einmal zurück zu unserem Beispiel. Für x = 4 scheinen unsere Zahlen zu
zeigen, dass für die gegen 4 konvergierende Folge
x1 = 3.9; x2 = 3.99, . . .
die Folge der Funktionswerte
f (x1 ), f (x2 ), . . .
gegen den Wert 0.8632093666 · · · strebt. Dies wird uns vom Computerexperiment suggeriert. In
der Tat lässt sich mathematisch exakt beweisen, dass für jede von links gegen 4 konvergierende
Folge die zugehörige Folge der Funktionswerte gegen einen festen Wert strebt. Der linke Grenzwert
!
x2 + x + 1
lim sin
x2 − x − 2
x→4−
existiert also, und er beträgt näherungsweise 0.8632093666 · · ·. Deutlich muss an dieser Stelle
gesagt werden, dass das Computerexperiment diese Tatsache nur suggeriert, zum Beweis der
27
Kapitel I. Funktionen
Tatsache aber nichts beiträgt, und auch nichts beitragen kann, denn mit Hilfe des Computers
lassen sich immer nur eine endliche Anzahl der unendlich vielen Folgen x1 , x2 , . . . untersuchen,
von denen beim Begriff des linken Grenzwertes die Rede ist.
Vollkommen anders als im Punkte x = 4 verhält sich unsere Funktion im Punkte x = 2. Hier
scheinen unsere Zahlen zu sagen, dass für die gewählte, gegen 2 konvergierende Folge
x1 = 1.9, x2 = 1, 99, . . .
die zugehörige Folge der Funktionswerte
f (x1 ), f (x2 ), . . .
divergiert, dass also der linke Grenzwert von f an der Stelle ξ = 2 nicht existiert. Dies suggeriert
der Computer. In der Tat kann man mathematisch exakt nachweisen, dass
lim sin
x→2−
x2 + x + 1
x2 − x − 2
!
nicht existiert. Auch hier muss gesagt werden, das das Computerexperiment diese Tatsache zwar
suggeriert, dass es aber nichts zum mathematischen Beweis beitragen kann, denn die Divergenz
einer Folge lässt sich mit endlich vielen Computerwerten nicht beweisen.
Wir haben bis anhin immer vom linken Grenzwert gesprochen. Es ist aber klar, dass auf analoge
Weise ein rechter Grenzwert definiert werden kann. Wir betrachten eine Funktion f , deren
Definitionsbereich das Intervall (ξ, d) einschliesst, ξ < d. Wenn nun für jede von rechts gegen
ξ konvergierende Folge x1 , x2 , ... die Folge der Funktionswerte f (x1 ), f (x2 ), ... gegen den Wert b
konvergiert, so heisst b der rechte Grenzwert von f an der Stelle ξ,
b = lim f (x) oder f (x) → b für x → ξ + .
x→ξ +
Beispiel Gegeben ist die Funktion x → 2−1/x (siehe Figur 1). Diese Funktion ist für x = 0
nicht definiert. Wir wollen die Grenzwerte
lim 2−1/x , lim 2−1/x
x→0+
x→0−
berechnen. Für den rechten Grenzwert betrachten wir eine beliebige Folge x1 , x2 , . . . von positiven Zahlen, die gegen 0 konvergiert. Die reziproken Werte 1/x1 , 1/x2 , . . . werden mit wachsendem Index beliebig gross. Betrachtet man also die Folge 2−1/x1 , 2−1/x2 , . . . , so konvergiert diese
offensichtlich gegen 0. Damit gilt
lim+ 2−1/x = 0.
x→0
Um den linken Grenzwert zu diskutieren, betrachten wir eine beliebige Folge x1 , x2 , . . ., von
negativen Zahlen, die gegen 0 konvergiert. Die reziproken Werte 1/x1 , 1/x2 , . . . werden mit
28
U. Stammbach:
Analysis, Teil A
5
4
3
Fig. 1 :
Die Funktion x → 2−1/x
2
1
-2
-1.5
-1
-0.5
0.5
1
1.5
2
(x)
-1
wachsendem Index immer kleiner (“sie streben gegen −∞”). Die Folge −1/x1 , −1/x2 , . . . “strebt
gegen +∞”, und somit ebenfalls die Folge
2−1/x1 , 2−1/x2 , . . .
In unserer Terminologie bedeutet dies, dass die Folge nicht konvergiert; der linke Grenzwert
lim 2−1/x
x→0−
existiert nicht.
Beispiel Ein berühmter und für die Ableitung der trigonometrischen Funktionen wichtiger
Grenzwert ist
sin x
lim
.
+
x
x→0
Diesen wollen wir als nächstes berechnen. Wir stellen zuerst fest, dass die Funktion
x→
sin x
x
für x = 0 nicht definiert ist und dass die Funktion gerade ist, denn es gilt
sin(−x)
sin x
=
.
−x
x
Kapitel I. Funktionen
29
Wenn also der rechte Grenzwert dieser Funktion an der Stelle x = 0 existiert, so wird auch der
linke Grenzwert an dieser Stelle existieren und mit jenem übereinstimmen. Unter der Voraussetzung, dass einer dieser Grenzwerte existiert, wird also gelten
lim+
x→0
sin x
sin x
= lim−
.
x
x
x→0
Wir beschränken uns auf die Berechnung des rechten Grenzwertes und entnehmen der Figur 2,
dass für 0 < x < π/2 die Ungleichung
tan x
Fig. 2 :
Zur Berechnung des
Grenzwertes
lim
1
x→0+
sin x
sin x
x
x
x
cos x
x
tan x
1 sin x
sin x · cos x
<
<
=
2
2
2
2 cos x
gilt. Daraus erhält man weiter
cos x <
1
x
<
,
sin x
cos x
cos x <
1
sin x
<
.
x
cos x
Lässt man nun die Grösse x eine Folge von positiven Zahlen x1 , x2 , .. durchlaufen, welche gegen
0 konvergiert, so konvergieren die Folgen
30
U. Stammbach:
Analysis, Teil A
cos x1 , cos x2 , ...
1
1
,
, ...
cos x1 cos x2
offensichtlich beide gegen 1. Damit muss gezwungenermassen auch die Folge
sin x1 sin x2
,
, ...
x1
x2
gegen 1 konvergieren. Es gilt also
lim
x→0+
sin x
sin x
= lim−
= 1.
x
x
x→0
Die Rechenregeln, welche wir für den Umgang mit Grenzwerten von Folgen kennen gelernt haben,
liefern auf offensichtliche Weise analoge Rechenregeln für Grenzwerte von Funktionen. Wir
formulieren diese Regeln für rechte Grenzwerte:
Aus
lim f (x) = a, lim+ g(x) = b
x→ξ +
x→ξ
folgt
lim (f (x) ± g(x)) = a ± b,
x→ξ +
lim (f (x) · g(x)) = a · b,
x→ξ +
lim f (x)/g(x) = a/b.
x→ξ+
Letzteres natürlich nur, falls im betrachteten Intervall b 6= 0 und g(x) 6= 0.
Beispiel
lim
x→0+
tan x
1
1
sin x
sin x
= lim
·
= lim
· lim
= 1 · 1 = 1.
+
+
+
x
x
x
x→0 cos x
x→0 cos x x→0
Ausserdem gilt
lim
x→0+
tan x
tan x
= lim
,
−
x
x
x→0
da x → (tan x)/x eine gerade Funktion ist.
31
Kapitel I. Funktionen
Beispiel
lim
x→0+
sin2 x
sin x
sin x
1
1
= lim
· lim
· lim
=1·1· .
+
+
x2 (1 + cos x) x→0+ x
x
1
+
cos
x
2
x→0
x→0
Ausserdem gilt
lim+
x→0
sin2 x
sin2 x
=
lim
,
x2 (1 + cos x) x→0− x2 (1 + cos x)
denn die Funktion
x→
sin2 x
x2 (1 + cos x)
ist gerade.
Beispiel
lim
x→0+
sin x3
sin t
sin x3
= lim x2 · lim
= lim x2 ·
=0·1=0
3
+
+
+
x
x
t
x→0
x→0
t→0
In allen Beispielen, die wir bis anhin betrachtet haben, ist die Funktion im Punkte ξ, in dem
der Grenzwert berechnet werden soll, nicht definiert. Ist er aber definiert, so stellt sich die oben
schon erwähnte Frage, was die Beziehung dieses Wertes f (ξ) zu den beiden Grenzwerten
lim f (x) und
x→ξ −
lim f (x)
x→ξ +
ist. Es ist leicht zu sehen, dass im allgemeinen zwischen diesen drei Werten keine Beziehung
besteht. Betrachten wir zur Illustration ausgehend vom weiter oben betrachteten Beispiel die
auf ganz R definierte Funktion
(
g:x→
2−1/x , x 6= 0 ,
1,
x=0.
An der durch ξ = 0 gegebenen Stelle gilt dann
g(0) = 1, lim g(x) = +∞, lim g(x) = 0.
x→ξ −
x→ξ +
Keine irgendwie geartete Beziehung zwischen diesen Werten ist auszumachen; sie sind offenbar
im allgemeinen völlig unabhängig voneinander. Andrerseits zeigt sich, dass die drei Werte in
vielen Fällen – man könnte sogar sagen “üblicherweise” – übereinstimmen. Betrachten wir etwa
die oben definierte Funktion an der Stelle ξ = 1, so gilt offensichtlich
32
U. Stammbach:
Analysis, Teil A
1
1
1
g(1) = , lim g(x) = , lim g(x) = .
−
+
2 x→1
2 x→1
2
Die Tatsache, dass die drei Werte “üblicherweise” übereinstimmen, wird in vielen Fällen implizit
benützt. Wertet man etwa die Funktion h : x → x2 an der Stelle ξ = π aus, so geschieht dies
ja dadurch, dass man in der Rechnung die durch einen unendlichen Dezimalbruch beschriebene
Irrationalzahl π durch einen endlichen Dezimalbruch approximiert und dabei je nach verlangter
Genauigkeit mehr oder weniger Stellen berücksichtigt. In der hier eingeführten Sprache berechnet man die Funktion h : x → x2 auf der durch die endlichen Dezimalbrüche gegebenen und
gegen π konvergierenden Folge
3, 3.1, 3.14, 3.141, 3.1415, 3.14159, . . .
und nimmt stillschweigend an, dass der Wert h(π) = π 2 durch den Grenzwert der Folge
h(3), h(3.1), h(3.14), h(3.141), h(3.1415), h(3.14159), . . .
gegeben ist. Man macht hier offenbar implizit Gebrauch von der Beziehung
lim h(x) = h(π).
x→π −
Dieses Vorgehen ist gestattet, weil die Funktion h : x → x2 an der Stelle ξ = π, ja sogar überall
eine Eigenschaft besitzt, die im vorhergehenden Beispiel für die Funktion g an der Stelle ξ = 0
nicht gegeben war. Diese Eigenschaft nennt der Mathematiker Stetigkeit. Er definiert sie wie
folgt.
Definition Die Funktion f : x → f (x) sei auf dem Intervall (c, d) mit c < ξ < d definiert. Gilt
lim f (x) = f (ξ) = lim+ f (x),
x→ξ −
x→ξ
so heisst die Funktion f stetig im Punkte ξ. Eine Funktion heisst stetig schlechthin, falls sie in
allen Punkten ihres Definitionsbereiches stetig ist.
Der Nachweis, dass eine gegebene Funktion stetig ist, ist eine auch für einen Mathematiker
mühevolle Arbeit, wenn wirklich alle Einzelheiten nachgeprüft werden sollen. Glücklicherweise
lässt sich aber das wesentliche Resultat dieser Bemühungen auf konzise Art ausdrücken.
Satz Sämtliche elementare Funktionen und die aus ihnen durch Addition, Subtraktion, Multiplikation, Division und Zusammensetzung gebildeten Funktionen sind in ihrem Definitionsbereich
stetig.
Beispiel Die Funktion f : x → x/(x − 2) ist stetig, d.h. f ist stetig in allen Punkten des
Definitionsbereiches. (Der Leser beachte die Sprachregelung: im Punkte x = 2 ist f nicht
definiert!)
Kapitel I. Funktionen
33
Zur Notation machen wir noch folgende Bemerkung: Wenn an der Stelle ξ der linke und der
rechte Grenzwert einer Funktion f : x → f (x) übereinstimmen, wenn also
lim f (x) = lim+ f (x)
x→ξ −
x→ξ
gilt, so erlaubt man sich oft, kurz vom Grenzwert der Funktion f an der Stelle ξ zu sprechen.
Man verwendet dann konsequenterweise das Symbol
lim f (x) .
x→ξ
Dadurch drückt man aus, dass die Approximation des Wertes ξ von links und von rechts das
gleiche Resultat liefert. Man beachte, dass dies bei stetigen Funktionen immer der Fall ist.
Die in diesem Abschnitt besprochenen Beispiele machen klar, dass die Berechnung eines Funktionswertes an einer nur approximativ bekannten Stelle ξ nur dann zu einem sinnvollen Resultat
führen kann, wenn die Funktion an der Stelle ξ stetig ist. Damit man überhaupt mit einer
Funktion in der Praxis rechnen kann, ist die Stetigkeit sozusagen eine Minimalvoraussetzung.
Anschaulich ausgedrückt besagt sie, dass f (ξ) sich beliebig genau berechnen lässt, wenn nur ξ
genügend gut approximiert wird. Diese nur qualitative Aussage genügt in Anwendungen allerdings oft nicht. Wenn man etwa die folgende naheliegende Frage beantworten will, so braucht
man zusätzliche Informationen quantitativer Art.
Wie genau muss ξ bekannt sein, damit f (ξ) mit vorgeschriebener Genauigkeit, z.B. auf 5 Stellen
nach dem Komma berechnet werden kann?
Um diese Frage zu beantworten zu können, müssen neben der Stetigkeit weitere und stärkere
Eigenschaften der Funktion f bekannt sein; Stetigkeit allein genügt nicht. Wir werden später sehen, wie zum Beispiel die Differenzierbarkeit von f zur Beantwortung dieser Frage herangezogen
werden kann.
34
4
U. Stammbach:
Analysis, Teil A
Der Zwischenwertsatz für stetige Funktionen
Satz Es sei f : x → f (x) eine auf [a, b] stetige Funktion. Es sei m irgendein Wert zwischen
f (a) und f (b). Dann gibt es (mindestens) ein ξ mit f (ξ) = m.
Bevor wir diesen Satz beweisen, wollen wir noch folgende Bemerkungen einfügen. Wenn der
Graph von f eine “Kurve” im anschaulichen Sinn ist, so ist die Aussage des Satzes insofern klar,
als diese Kurve ja die Horizontale y = m mindestens einmal kreuzen muss. Gelingt es uns, diese
Tatsache auf analytische Weise zu beweisen, indem wir von der Funktion f weiter nichts als
die Stetigkeit voraussetzen, so bedeutet dies, dass der Graph einer stetigen Funktion unserem
intuitiven Bild einer “Kurve” weitgehend entspricht.
Beweis Wir nehmen an, dass f (a) ≤ m und f (b) ≥ m gilt. Der Beweis im andern Fall verläuft
ganz analog. Wir konstruieren ein ξ mit der verlangten Eigenschaft als Grenzwert von zwei
Folgen von Zahlen in [a, b]. Wir definieren Folgen x1 , x2 , ... und y1 , y2 , ... rekursiv wie folgt. Wir
setzen x1 = a, y1 = b. Sind x1 , x2 , ..., xi und y1 , y2 , ..., yi bereits definiert, so definieren wir xi+1
und yi+1 durch

1
1

 2 (xi + yi ), falls f ( 2 (xi + yi )) < m,
xi+1 =

 x,
falls f ( 12 (xi + yi )) ≥ m,
i
yi+1 =



1
2 (xi

 y,
i
+ yi ), falls f ( 12 (xi + yi )) ≥ m,
falls f ( 12 (xi + yi )) < m.
Man sieht sofort, dass die Folge x1 , x2 , .... monoton wachsend und die Folge y1 , y2 , .... monoton
fallend ist. Da beide Folgen beschränkt sind, müssen sie konvergieren. Wir behaupten, dass ihre
Grenzwerte übereinstimmen. Es ist
yn+1 − xn+1 =
y n − xn
b−a
yn−1 − xn−1
y 1 − x1
= n .
=
= ··· =
n
2
4
2
2
Daraus folgt
0 = lim (yn − xn ) = lim yn − lim xn .
n→∞
n→∞
n→∞
Wir setzen
lim yn = ξ = lim xn .
Laut Definition der beiden Folgen gilt f (xn ) ≤ m für alle n = 1, 2, ... und f (yn ) ≥ m für alle
n = 1, 2, .... Schliesslich verwenden wir die Stetigkeit der Funktion f an der Stelle ξ, um die
Ungleichungen
f (ξ) = f (lim xn ) = lim f (xn ) ≤ m,
35
Kapitel I. Funktionen
m ≤ lim f (yn ) = f (lim yn ) = f (ξ)
zu erhalten. Daraus ergibt sich sofort f (ξ) = m. Dies war zu beweisen.
Das in diesem Beweis angegebene explizite Verfahren kann verwendet werden, um Gleichungen,
insbesondere transzendente Gleichungen zu lösen.
Beispiel
Um die Lösung der Gleichung x = e−x zu finden, betrachte man die Funktion
f : x → x − e−x . Diese ist sicherlich stetig. Ferner ist f (0) = −1 und f (1) = 1 − e−1 ∼ 2/3. Um
den (offenbar einzigen) Wert ξ mit f (ξ) = 0 zu bestimmen, wendet man das obige Verfahren
auf das Intervall [0, 1] und den Wert m = 0 an. Die folgende Tabelle zeigt die Werte der Glieder
der beiden Folgen.
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
xi
0.
0.5
0.5
0.5
0.5625
0.5625
0.5625
0.5625
0.56640625
0.56640625
0.56640625
0.5668945313
0.5671386719
0.5671386719
0.5671386719
0.5671386719
0.5671386719
0.5671386719
0.5671424866
0.5671424866
yi
1.
1.
0.75
0.625
0.625
0.59375
0.578125
0.5703125
0.5703125
0.568359375
0.5673828125
0.5673828125
0.5673828125
0.5672607422
0.567199707
0.5671691895
0.5671539307
0.5671463013
0.5671463013
0.5671443939
36
U. Stammbach:
Analysis, Teil A
4
2
Fig. 1 :
Die Funktion x → x − e−x
-2
-1
1
2
3
4
(x)
-2
-4
0.8
0.75
0.7
Fig. 2 :
Die Folgen xn und yn
yn
0.65
0.6
0.55
xn
0.5
0.45
(n)
2
4
6
8
10
12
14
37
Kapitel I. Funktionen
5
Koordinatentransformationen
In diesem Abschnitt studieren wir, wie sich einfache Koordinatentransformationen auf den
Graphen einer Funktion f auswirken. Wir illustrieren dies durch Beispiele. Dabei gehen wir aus
von der Funktion (siehe Figur 1)
f : x → 2x3 − 3x2 − 6x + 6.
30
20
y = 2x3 − 3x2 − 6x + 6
-4
10
-2
Fig. 1 :
2
(x)
f : x → 2x3 − 3x2 − 6x + 6
-10
-20
-30
(1) Die Funktion f1 : x → f (x + a)
Wir setzen zur Illustration a = 2, dann gilt
f1 : x → 2(x + 2)3 − 3(x + 2)2 − 6(x + 2) + 6 = 2x3 + 9x2 + 6x − 2.
Der Graph von f1 entsteht aus den Graphen von f durch Verschiebung um a Einheiten in
Richtung der negativen x-Achse (siehe Figur 2).
(2) Die Funktion f2 : x → f (x) + b
Wir setzen zur Illustration b = 4; dann erhalten wir
f : x → 2x3 − 3x2 − 6x + 10.
38
U. Stammbach:
Analysis, Teil A
Man erhält den Graphen von f2 , indem man den Graphen von f und b Einheiten in Richtung
der positiven y-Achse verschiebt (siehe Figur 3).
(3) Die Funktion f3 : x → f (cx), c > 0
Wir setzen zur Illustration c = 2, dann gilt
f3 (x) = 16x3 − 12x2 − 12x + 6.
Man erhält den Graphen von f3 , indem man den Graphen von f in Richtung der x-Achse um
den Faktor c “staucht” (siehe Figur 4).
Ist 0 < c < 1, so resultiert eine “Dehnung” in Richtung der x-Achse. Setzen wir c = 1/2, so gilt
1
3
f¯3 (x) = x3 − x2 − 3x + 6.
4
4
(4) Die Funktion f4 (x) = df (x), d > 0
Wieder setzen wir d = 2; es gilt
f4 (x) = 4x3 − 6x2 − 12x + 12.
Man erhält den Graphen von f4 , indem man den Graphen von f in Richtung der y-Achse um
den Faktor d “streckt” (siehe Figur 5).
(5) Die Funktion f5 (x) = 1/f (x)
Man erhält
f5 (x) = 1/(2x3 − 3x2 − 6x + 6).
Wo die Funktion f Nullstellen hat, besitzt f5 Pole. Ferner gilt natürlich (siehe Figur 6)
| f (x0 ) |< 1 ⇒| f5 (x0 ) |> 1 ,
| f (x0 ) |> 1 ⇒| f5 (x0 ) |< 1 .
(6) Die Funktion f6 (x) = f (1/x)
Ist | x |< 1, so folgt | 1/x |> 1 und zwar ist | 1/x | umso grösser, je kleiner | x | ist. Ist umgekehrt
| x |> 1, so folgt | 1/x |< 1 und zwar ist | 1/x | umso kleiner, je grösser | x | ist (siehe Figur
7). Das Verhalten der Funktion f6 im Intervall −1 < x < +1 “spiegelt” also das Verhalten der
Funktion f für | x |> 1. Umgekehrt “spiegelt” das Verhalten von f6 für grosse Werte von | x |,
wie sich f im Einheitsintervall verhält, z.B. gilt
lim f6 (x) = lim f
x→∞
x→∞
1
x
= lim f (ξ) = 6.
ξ→0+
Kennt man den Einfluss dieser sechs einfachen Koordinatentransformationen gut, so kann man
Graphen von einfacheren Funktionen oft sehr leicht skizzieren. Wir zeigen dies anhand der
folgenden Beispiele.
39
Kapitel I. Funktionen
30
20
10
-4
-2
Fig. 2 :
2
(x)
f1 (x) = f (x + 2)
-10
-20
-30
30
20
10
-4
-2
Fig. 3 :
2
(x)
-10
-20
-30
f2 (x) = f (x) + 4
40
U. Stammbach:
Analysis, Teil A
30
20
10
-4
-2
Fig. 4 :
2
(x)
f3 (x) = f (2x)
-10
-20
-30
30
20
10
-4
-2
Fig. 5 :
2
(x)
-10
-20
-30
f4 (x) = 2f (x)
41
Kapitel I. Funktionen
3
2
1
-4
Fig. 6 :
-2
2
(x)
f5 (x) = 1/f (x)
-1
-2
-3
30
20
10
-5
-4
-3
-2
-1
Fig. 7 :
1
2
3
(x)
-10
-20
-30
f6 (x) = f (1/x)
42
U. Stammbach:
Analysis, Teil A
Beispiel
x → f (x) =
3
(x + 5)(x − 2)
Die Nennerfunktion x → (x+ 5)(x− 2) = (x2 + 3x− 10) ist quadratisch mit Nullstellen −5, 2. Ihr
Graph ist folglich eine Parabel, die die x-Achse in −5 und 2 schneidet und nach oben geöffnet
ist (der Koeffizient von x2 ist positiv). Aus Symmetriegründen ist der Scheitel bei x = −3/2 zu
finden. Die Transformation (5) liefert sofort den Graphen der Funktion
x→
1
.
(x + 5)(x − 2)
Schliesslich liefert die Transformation (3) den Graphen von f durch “Streckung” in Richtung
der y-Achse um den Faktor 3. Fragen, etwa nach der Lage der Extremalstellen von f , lassen
sich nun ohne Rechnung sofort beantworten.
Beispiel
In einem weiteren Beispiel betrachten wir die Funktion
1
g : x → 2 cos 3x +
2
.
Ausgehend vom Graph der Cosinus-Funktion x → cos x (siehe Figur 8) erhalten wir den Graphen
von x → cos(3x) durch “Stauchung” in Richtung der x-Achse (siehe Figur 9). Der Graph von
x → cos(3x + 12 ) = cos(3(x + 16 )) geht aus dem Graphen von x → cos(3x) durch Verschiebung
um 16 in Richtung der negativen x-Achse hervor (siehe Figur 10). Schliesslich erhält man den
Graphen von g durch Streckung um den Faktor 2 in Richtung der y-Achse (siehe Figur 11).
Die betrachtete Funktion g ist von der Form
t → A cos(ωt + ϕ),
welche bei Schwingungsproblemen auftritt, wobei t natürlich die Zeit bedeutet. Von dieser Anwendung her erhalten die einzelnen Konstanten die folgenden Namen:
Die Grösse A, A > 0 heisst Amplitude. Sie gibt den Wert des grössten Schwingungsausschlages
an. Die Grösse ω > 0 heisst Kreisfrequenz. Eine volle Schwingung wird in 2π/ω = T absolviert; T heisst die Schwingungsdauer. Pro Zeiteinheit werden 1/T = ω/2π =: ν Schwingungen durchgeführt; ν heisst die Frequenz der Schwingung. Die Konstante ϕ, −π < ϕ < π heisst
(Null-)Phasenwinkel.
43
Kapitel I. Funktionen
3
2
1
Fig. 8 :
(x)
-1
1
2
3
4
x → cos x
-1
-2
-3
3
2
1
Fig. 9 :
(x)
-1
1
-1
-2
-3
2
3
4
x → cos(3x)
44
U. Stammbach:
Analysis, Teil A
3
2
1
Fig. 10 :
(x)
-1
1
2
3
4
x → cos 3x +
1
2
-1
-2
-3
3
2
1
Fig. 11 :
(x)
-1
1
-1
-2
-3
2
3
4
1
x → 2 cos 3x +
2
45
Kapitel I. Funktionen
6
Die inverse Funktion
Bekanntlich kann es vorkommen, dass eine Funktion f : x → f (x) für verschiedene Werte
x1 , x2 ∈ D(f ) denselben Funktionswert y0 annimmt; z.B. gilt für f : x → x2 natürlich f (−2) =
4 = f (2). Graphisch äussert sich dies darin, dass die Parallele zur x-Achse auf dem Niveau y0
den Graphen von f in mehreren Punkten schneidet. Funktionen, bei denen dieses Phänomen
nicht auftritt, heissen injektiv.
Eine Funktion f : x → f (x), D(f ) heisst injektiv, wenn gilt:
- Aus x1 6= x2 , x1 , x2 ∈ D(f ) folgt stets f (x1 ) 6= f (x2 ).
Gleichbedeutend mit dieser Forderung ist offenbar jede der folgenden beiden Bedingungen
- Falls f (x1 ) = f (x2 ), so folgt x1 = x2 .
- Jede Parallele zur x-Achse schneidet den Graphen von f in höchstens einem Punkt.
Ist f : x → f (x), D(f ) eine injektive Funktion, so gibt es zu jedem y ∈ W (f ) genau ein x ∈ D(f )
mit f (x) = y. Somit können wir eine Umkehrfunktion f −1 definieren:
- f −1 : y → f −1 (y) = dasjenige eindeutig bestimmte x mit f (x) = y.
Offenbar gilt D(f −1 ) = W (f ) und W (f −1 ) = D(f ). Die so definierte Funktion f −1 heisst die
zu f inverse Funktion.
Dem Leser muss sich an dieser Stelle gut klar machen, dass die inverse Funktion f −1 nur dann
definiert werden kann, wenn f injektiv ist.
Laut Definition gilt x ∈ D(f ) die Gleichung
f −1 (f (x)) = x
und für alle x ∈ D(f −1 )
f (f −1 (x)) = x.
Die Funktion f −1 ist automatisch injektiv (warum?). Deshalb kann zu f −1 wiederum die inverse
Funktion (f −1 )−1 gebildet werden. Offenbar gilt (f −1 )−1 = f .
46
U. Stammbach:
Analysis, Teil A
Die Beziehung zwischen f und f −1 lässt sich graphisch leicht veranschaulichen. Ist nämlich
(a, b) ein Punkt des Graphen von f , so hat man f (a) = b. Laut Definition von f −1 gilt dann
a = f −1 (b). Daraus folgt, dass (b, a) ein Punkt des Graphen von f −1 ist. Die Punkte (a, b) und
(b, a) liegen im kartesische Koordinatensystem spiegelbildlich zur ersten Winkelhalbierenden
y = x. Wir schliessen daraus, dass die Graphen von f und f −1 durch Spieglung an der ersten
Winkelhalbierenden auseinander hervorgehen.
Beispiel
Es sei die lineare Funktion
f : x → ax + b, a, b ∈ R, a 6= 0, D(f ) = R
gegeben. Wir behaupten zuerst, dass f injektiv ist. Aus
f (x1 ) = ax1 + b = ax2 + b = f (x2 )
folgt ax1 = ax2 und daraus wegen a 6= 0 sofort x1 = x2 . Damit ist f in der Tat injektiv und die
inverse Funktion f −1 existiert. Aus y = ax + b folgt x = (y − b)/a. Somit gilt
f −1 : y →
y−b
a
oder besser
f −1 : x →
x−b
, D(f −1 ) = R,
a
da ja als Name des Argumentes üblicherweise x verwendet wird (siehe Figur 1).
Beispiel Die Exponentialfunktion f : x → ax , a > 1 ist auf ihrem ganzen Definitionsbereich
strikt monoton wachsend. Wegen ah > 1 für h > 0 ergibt sich nämlich ax+h = ax · ah > ax .
Die Exponentialfunktion ist also injektiv und die dazu inverse Funktion f −1 existiert. Diese ist
durch die Vorschrift
f −1 : y → Zahl, mit der a potenziert werden muss, um y zu erhalten
definiert. Wir nennen die so definierte Zahl den Logarithmus von y zur Basis a, und wir schreiben
x = f −1 (y) = a log y. Laut Definition gilt
D(a log x) = W (ax ) = (0, ∞),
W (a log x) = D(ax ) = (−∞, ∞).
Der Graph der Logarithmusfunktion
a
log : x → a log x, D(a log x) = (0, ∞)
47
Kapitel I. Funktionen
4
(y)
3
y=x
y = 2x + 3
2
Fig. 1 :
1
-4
-3
-2
-1
1
2
3
4
x → 2x + 3
(x)
x→
-1
y=
-2
x 3
−
2 2
x 3
−
2 2
-3
-4
6
(y)
5
y = 2x
y=x
4
Fig. 2 :
3
x → 2x
2
y =2 log x
x →2 log x
1
-2
-1
1
2
3
4
5
6
(x)
-1
-2
48
U. Stammbach:
Analysis, Teil A
ergibt sich durch Spiegelung des Graphen der Exponentialfunktion x → ax an der ersten Winkelhalbierenden (siehe Figur 2).
Beispiel
Wie wir bereits festgestellt haben, ist die Quadratfunktion
f : x → x2 , D(f ) = R
nicht injektiv. Es gibt also zu f keine inverse Funktion. Hingegen kann man durch Einschränken
des Definitionsbereiches zu einer verwandten Funktion f1 übergehen, die injektiv ist und zu der
folglich eine inverse Funktion existiert. Für diese Einschränkung gibt es mehrere Möglichkeiten,
von denen wir zwei genauer ansehen. Wir betrachten zuerst die Funktion
f1 : x → x2 , D(f1 ) = [0, ∞).
Wegen f10 (x) > 0 für 0 < x ist f1 strikt monoton wachsend und deshalb injektiv. Die dazu
inverse Funktion f1−1 ist definiert durch
f1−1 : x →
√
x, D(f1−1 ) = [0, ∞) .
Die Graphen von f und f1−1 gehen durch Spiegelung an der Geraden y = x auseinander hervor
(siehe Figur 3).
Als zweites betrachten wir die Funktion
f2 : x → x2 , D(f2 ) = (−∞, 0].
Diese ist wegen f20 (x) < 0 für x < 0 strikt monoton fallend und deshalb injektiv. Die dazu
inverse Funktion ist gegeben durch
√
f2−1 : x → − x, D(f2−1 ) = [0, ∞).
Wiederum liegen die Graphen der beiden Funktionen f2 und f2−1 spiegelbildlich zur Geraden
y = x (siehe Figur 4).
Beispiel
Die Funktion
f :x→
p
x2 − 1, D(f ) = (−∞, −1] ∪ [1, ∞)
ist offensichtlich eine gerade Funktion. Sie ist also sicher nicht injektiv. Die Einschränkung des
Definitionsbereiches auf [1, ∞) liefert aber die injektive Funktion
f1 : x →
Aus f1 (x1 ) =
q
x21 − 1 =
q
p
x2 − 1, D(f ) = [1, ∞).
x22 − 1 = f1 (x2 ) folgt nämlich der Reihe nach
49
Kapitel I. Funktionen
3
(y)
y = x2
2.5
y=x
2
Fig. 3 :
f1 : x → x2 , D(f1 ) = [0, ∞)
√
f1−1 : x → x
1.5
y=
√
x
1
0.5
(x)
0.5
1
1.5
2
2.5
3
3
(y)
y = x2
2
y=x
1
Fig. 4 :
(x)
-3
-2
-1
1
2
-1
-2
-3
√
y=− x
3
f2 : x → x2 , D(f2 ) = (−∞, 0]
√
f2−1 : x → − x
50
U. Stammbach:
3
Analysis, Teil A
(y)
2.5
y=
√
x2 + 1
2
Fig. 5 :
1.5
f1 : x →
√
y = x2 − 1
x2 − 1, D(f ) = [1, ∞)
f1−1 : x →
1
0.5
p
p
x2 + 1
y=x
(x)
0.5
1
1.5
2
2.5
3
x21 − 1 = x22 − 1 ,
x21 = x22 ,
x1 = x2 .
Letzteres folgt, weil x1 und x2 im Intervall [1, ∞) liegen! Damit ist f1 injektiv und die dazu
inverse Funktion existiert. Man berechnet
y =
p
x2 − 1 ,
y 2 = x2 − 1 ,
y 2 + 1 = x2 ,
q
y2 + 1 = x .
Letzteres folgt, weil x im Intervall [1, ∞) liegt. Die inverse Funktion (siehe Figur 5) f1−1 ist
somit gegeben durch die Vorschrift
f1−1 : x →
p
x2 + 1, D(f1−1 ) = W (f1 ) = [0, ∞).
51
Kapitel I. Funktionen
Ähnlich wie in den letzten beiden Beispielen geht man bei den trigonometrischen Funktionen vor.
Man schränkt den Definitionsbereich geeignet ein, um eine injektive Funktion zu erhalten und
geht dann zur inversen Funktion über. Auf diese Art und Weise gelangt man zu den sogenannten
zyklometrischen Funktionen.
Arcus sinus
Wir betrachten zuerst die Funktion
f : x → sin x, D(f ) = [−π/2, +π/2] .
Man beachte den eingeschränkten Definitionsbereich! Mit Hilfe der Ableitung sieht man sofort,
dass die Funktion f strikt monoton wachsend ist, also ist sie injektiv. Die zu f inverse Funktion
f −1 heisst definitionsgemäss arcsin (“arcus sinus”). Sie ist durch die Vorschrift
arcsin : x → f −1 (x) = y = derjenige Winkel, zwischen −π/2 und +π/2, dessen Sinus x ist
gegeben. Es gilt D(f −1 ) = W (f ) = [−1, +1] und W (f −1 ) = D(f ) = [−π/2, +π/2]. Den
Graphen von arcsin erhält man durch Spiegelung an der Geraden y = x (siehe Figuren 6,7).
Arcus cosinus Die zu
f : x → cos x, D(f ) = [0, π]
inverse Funktion heisst arccos (“arcus cosinus”). Dabei gilt für Definitions- und Wertebereich
D(arccos) = [−1, +1] und W (arccos) = [0, π] (siehe Figuren 8,9). Der Funktionswert arccos x
ist derjenige Winkel zwischen 0 und π, dessen Cosinus x ist. Man hat also beispielsweise
arccos 1 = 0, arccos 0 = π/2, arccos(−1) = π,
p
√
arccos( 2/2) = π/4, sin(arccos x) = 1 − x2 ,
wie der Leser leicht einsieht.
Arcus tangens
Die zu
f : x → tan x, D(f ) = (−π/2, +π/2)
inverse Funktion heisst arctan (“arcus tangens”). Dabei gilt D(arctan) = (−∞, +∞) und
W (arctan) = (−π/2, +π/2) (siehe Figuren 10,11).
Als Beispiel einer Eigenschaft dieser Funktion
√
erwähnen wir Beziehung cos(arctan x) = 1/ 1 + x2 , die man leicht aus der Definition herleitet.
Arcus cotangens
Die zu
f : x → cot x, D(f ) = (0, π)
52
U. Stammbach:
1.5
(y)
1
y = sin x
0.5
-1.5
-1
Analysis, Teil A
Fig. 6 :
-0.5
0.5
1
1.5
(x)
x → sin x, D(f ) = [−π/2, +π/2]
-0.5
-1
-1.5
1.5
(y)
1
y = arcsin x
0.5
-1.5
-1
-0.5
0.5
1
Fig. 7 :
1.5
(x)
-0.5
-1
-1.5
x → arcsin x
53
Kapitel I. Funktionen
3
(y)
2
Fig. 8 :
x → cos x, D(f ) = [0, π]
1
y = cos x
(x)
-1
1
2
3
-1
3
(y)
2
Fig. 9 :
1
x → arccos x
y = arccos x
(x)
-1
1
-1
2
3
54
U. Stammbach:
3
Analysis, Teil A
(y)
2
y = tan x
1
-3
-2
Fig. 10 :
-1
1
2
3
(x)
x → tan x,
D(f ) = (−π/2, +π/2)
-1
-2
-3
3
(y)
2
y = arctan x
1
-3
-2
-1
Fig. 11 :
1
2
3
(x)
-1
-2
-3
x → arctan x
55
Kapitel I. Funktionen
(y)
3
2
y = cot x
1
-3
-2
Fig. 12 :
-1
1
2
3
(x)
x → cot x, D(f ) = (0, π)
-1
-2
-3
3
(y)
2
y = arccot x
1
-3
-2
-1
Fig. 13 :
1
2
3
(x)
-1
-2
-3
x → arccot x
56
U. Stammbach:
Analysis, Teil A
inverse Funktion heisst arccot (“arcus cotangens”). Dabei gilt D(arccot) = (−∞, +∞) und
W (arccot) = (0, π) (siehe Figuren 12,13).
Dass die Einschränkungen bei den trigonometrischen Funktionen gerade auf die hier angegebene
Art erfolgen, ist natürlich willkürlich; sie haben sich aber in der Literatur weitgehend durchgesetzt. Andere sind selbstverständlich ebenfalls denkbar.
Wir beschliessen den Abschnitt, mit dem folgenden Anwendungsbeispiel, welches zeigt, dass die
arcus-Funktionen auf natürliche Weise auftreten.
Beispiel Man berechne die Länge l des Kreisbogens aus den Grössen x und a (siehe Figur 14).
x
Fig. 14 :
Kreisbogen
a
r
α
Ist r der Radius des Kreisbogens, so liefert die Figur 14 sofort die folgende Beziehung
(r − x)2 + a2 = r 2 .
Daraus ergibt sich
r=
Ferner gilt
a2 + x2
.
2x
57
Kapitel I. Funktionen
sin α =
a
,
r
woraus man
α = arcsin
2ax
2
a + x2
und schliesslich
l =2·
erhält.
a2 + x2
2x
!
· arcsin
2ax
2
a + x2
58
7
U. Stammbach:
Analysis, Teil A
Asymptoten
In diesem letzten kurzen Abschnitt betrachten wir das Verhalten von Funktionen für grosse
Werte von x. Gegeben sei eine Funktion f : x → f (x), welche mindestens auf dem Intervall
(c, ∞) definiert ist. Wir nennen eine Funktion g : x → g(x) eine Asymptote von f für x → ∞,
wenn gilt
lim (f (x) − g(x)) = 0 .
x→∞
In diesem Fall schmiegen sich die Graphen der beiden Funktionen f und g für x → ∞ einander
an. Am einfachsten ist die Situation, wenn g eine lineare Funktion ist, dann schmiegt sich
der Graph von f einer Geraden an. Ist man für grosse x nur an einer Approximation von f
interessiert, so kann für solche Werte von x die (kompliziertere) Funktion f durch die (einfachere)
Funktion g ersetzt werden. Es ist klar, dass eine analoge Definition für x → −∞ gemacht werden
kann. Wir betrachten anschliessend einige Beispiele.
(y)
8
6
y=
2x + 1
x−1
Fig. 1 :
4
x→
2
-4
-2
2
4
6
8
(x)
-2
Beispiel
Es sei f : x → (2x + 1)/(x − 1). Wegen
2x + 1
x−1
59
Kapitel I. Funktionen
2x + 1
2x − 2 + 3
3
=
=2+
x−1
x−1
x−1
ist offensichtlich g : x → 2 eine Asymptote von f für x → ∞ (und auch für x → −∞) (siehe
Figur 1).
35
(y)
30
25
y=
x2 + 2x − 8
x−3
Fig. 2 :
20
15
x→
x2 + 2x − 8
x−3
10
5
(x)
-2
2
4
6
8
-5
Beispiel
Es sei
f :x→
x2 + 2x − 8
7
=x+5+
.
x−3
x−3
Offenbar ist g : x → x + 5 eine Asymptote von f für x → ±∞ (siehe Figur 2). (Die Funktion f
besitzt in x = 3 einen Pol. Man sagt in dieser Situation dann auch etwa, die vertikale Gerade
x = 3 sei eine Asymptote von f für x → ±3. Streng genommen ist dies von unserer Definition
einer Asymptote nicht abgedeckt.)
Beispiel
Es sei
f : x → −1 +
p
x2 + 1 .
Wir behaupten, dass g : x → x−1 eine Asymptote von f für x → ∞ ist, und dass h : x → −x−1
eine Asymptote von f für x → −∞ ist (siehe Figur 3). Da die Funktion f gerade ist, ist nur
eine der Behauptungen zu beweisen. Es gilt in der Tat
60
U. Stammbach:
Analysis, Teil A
6
(y)
4
Fig. 3 :
2
x → −1 +
-4
-2
2
4
p
x2 + 1
(x)
-2
-4
15
(y)
10
Fig. 4 :
5
y = x2 + x − 2
-4
-2
2
4
(x)
y=
x3 − 3x + 5
x−1
-5
-10
x→
x3 − 3x + 5
x−1
61
Kapitel I. Funktionen
lim
x→∞
Beispiel
(−1 +
p
x2
+ 1) − (x − 1) = lim
x→∞
Es sei
f :x→
p
x2
+ 1 − x = lim
x→∞
(x2 + 1) − x2
√
x2 + 1 + x
!
=0.
x3 − 3x + 5
3
= x2 + x − 2 +
.
x−1
x−1
Es ist folglich die quadratische Funktion g : x → x2 + x − 2 sowohl für x → ∞ wie für x → −∞
eine Asymptote von f (siehe Figur 4).
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel II. Differentialrechnung
Nature and nature’s law lay hid in night;
God said, “Let Newton be”, and all was light.
Alexander Pope 1688-1744
Inhaltsverzeichnis
1
Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
3
Mittelwertsatz der Differentialrechnung
. . . . . . . . . . . . . . . . . . . . . . .
23
4
Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5
Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . .
35
6
Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . .
49
7
Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . .
57
8
Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
3
Kapitel II. Differentialrechnung
1
Begriff des Differentialquotienten
Wir betrachten hier das folgende naheliegende geometrische Problem. Gegeben sei eine Funktion
f : x → f (x) und ein Punkt P = (x0 , f (x0 )) ihres Graphen Γ(f ) in der (x, y)-Ebene. Gesucht
ist die Tangente im Punkt P an dem Graphen Γ(f ).
Als Gerade durch den Punkt P wird die Tangente durch eine Gleichung der Form
y − f (x0 ) = m(x − x0 )
beschrieben. Dabei bezeichnet m die Steigung der Tangente, also die Steigung des Graphen
im Punkt P . Diese gilt es zu berechnen. Zu diesem Zweck betrachten wir die Gerade durch
P und Q, wobei Q der Punkt des Graphen von f ist, welcher zum x-Wert x0 + ∆x gehört. Es
gilt folglich Q = (x0 + ∆x, f (x0 + ∆x)). Die Steigung dieser Sekante ist gegeben durch den
Quotienten (Differenzenquotienten, siehe Figur 1)
mP Q =
f (x0 + ∆x) − f (x0 )
.
∆x
Lassen wir nun ∆x gegen Null streben, d.h. betrachten wir den Grenzwert
lim
∆x→0
f (x0 + ∆x) − f (x0 )
∆x
so wird dieser – falls er existiert – die Steigung der Tangente beschreiben.
Definition
( I. Newton 1642-1727, G. W. Leibniz 1646-1716) Der Grenzwert
df
f (x0 + ∆x) − f (x0 )
(x0 ) = lim
∆x→0
dx
∆x
heisst Differentialquotient von f an der Stelle x0 .
Existiert der Differentialquotient von f an der Stelle x0 , so heisst f differenzierbar in x0 .
Existiert der Differentialquotient von f für jedes x im Definitionsbereich D(f ) von f , so heisst
f differenzierbar schlechthin. In diesem Fall definiert die Zuordnung
4
U. Stammbach:
Analysis, Teil A
(y)
Fig. 1 :
Differenzenquotient,
Differentialquotient
Q
∆y
P
∆x
(x)
x → f 0 (x) =
df
(x)
dx
eine Funktion f 0 mit D(f 0 ) = D(f ), welche Ableitung oder Derivierte von f heisst.
Ist f differenzierbar in x0 , so ist f auch stetig in x0 . Existiert nämlich
f (x0 + ∆x) − f (x0 )
,
∆x→0
∆x
lim
so muss notwendigerweise mit ∆x auch f (x0 + ∆x) − f (x0 ) gegen Null streben. Es gilt folglich
f (x0 ) = lim f (x0 + ∆x) = lim f (x) .
∆x→0
Damit ist die Funktion stetig in x0 .
x→x0
5
Kapitel II. Differentialrechnung
(y)
Fig. 2 :
Zur Existenz des
Differentialquotienten
|x|
(x)
In der Definition der Differenzierbarkeit fordert man die Existenz des Grenzwertes
lim
∆x→0
f (x0 + ∆x) − f (x0 )
,
∆x
d.h. der linke und der rechte Grenzwert (∆x → 0− bzw. ∆x → 0+ ) müssen existieren und
miteinander übereinstimmen. Natürlich gibt es Beispiele, wo diese Grenzwerte zwar existieren,
aber nicht übereinstimmen. In diesem Fall spricht man vom linksseitigen, bzw. rechtsseitigen
Differentialquotienten von f in x0 . Als konkretes Beispiel betrachten wir die Funktion f : x → |x|
an der Stelle x0 = 0 (siehe Figur 2). Offensichtlich gilt hier
lim
f (x) − f (0)
∆x
=
lim
f (x) − f (0)
∆x
=
∆x→0−
∆x→0+
lim
|∆x|
= −1 ,
∆x
lim
|∆x|
= +1 .
∆x
∆x→0−
∆x→0+
Im ersten Fall ist nämlich ∆x negativ, während es im zweiten Fall positiv ist.
Für einfache Funktionen lassen sich die Ableitungen direkt berechnen. Klar ist zum Beispiel,
dass für die Ableitung der konstanten Funktion f : x → C gilt: f 0 (x) = 0. Für g : x → x
6
U. Stammbach:
Analysis, Teil A
erhält man auf ähnliche Weise wie oben g0 (x) = 1. Etwas komplizierter ist die Berechnung in
den folgenden Beispielen.
Beispiel
Es sei f : x → x2 . Dann gilt
f 0 (x) =
f (x + ∆x) − f (x)
∆x→0
∆x
lim
=
(x + ∆x)2 − (x)2
∆x→0
∆x
=
x2 + 2x ∆x + (∆x)2 − x2
∆x→0
∆x
=
lim
lim
lim (2x + ∆x)
∆x→0
= 2x .
Beispiel
Es sei f : x → sin x. Dann gilt
d sin
(x) =
dx
=
sin(x + ∆x) − sin x
∆x→0
∆x
lim
sin x cos ∆x + sin ∆x cos x − sin x
∆x→0
∆x
lim
=
=
1 − cos ∆x
∆x
1 + cos ∆x
sin x
1 + cos ∆x
lim
sin ∆x
cos x
−
∆x
lim
∆x
sin ∆x sin2 (∆x)
cos x
−
sin x
∆x
(∆x)2 1 + cos ∆x
∆x→0
∆x→0
sin ∆x
= cos x lim
−
∆x→0 ∆x
sin ∆x
lim
∆x→0 ∆x
= cos x .
Analog erhält man
d cos
(x) = − sin x .
dx
2 !
∆x
lim
sin x
∆x→0 1 + cos ∆x
7
Kapitel II. Differentialrechnung
Diese Beispiele zeigen, dass die Berechnung der Ableitung schon für recht einfache Funktionen
aufwendig ist, wenn man von der Definition des Differentialquotienten ausgeht. Dieser Aufwand
kann wesentlich reduziert werden, wenn “das Ableiten” zu einem Kalkül ausgebaut wird: Der
Übergang von der Funktion f zur Ableitungsfunktion f 0 genügt einigen einfachen Rechenregeln,
die erlauben, die Ableitung einer Funktion auf weitgehend mechanische Weise zu berechnen. Es
sind dies einmal die folgenden vier Regeln und die etwas weiter unten zu behandelnde Kettenregel.
Es seien f : x → f (x) und g : x → g(x) zwei in x differenzierbare Funktionen. Dann gilt
(f + g)0 (x) = f 0 (x) + g0 (x) ,
(Cf )0 (x) = C · f 0 (x) ,
C∈R ,
(f g)0 (x) = f 0 (x)g(x) + f (x)g0 (x)
0
f
g
(x) =
f 0 (x)g(x) − f (x)g0 (x)
g2 (x)
(Produktregel) ,
(Quotientenregel).
Bei der Quotientenregel muss natürlich g(x) 6= 0 vorausgesetzt werden.
Diese Rechenregeln sind aus der Mittelschule bekannt und werden aus diesem Grund hier nicht
bewiesen. Statt dessen wenden wir sie in einzelnen Beispielen an.
Beispiel
Es sei h : x → x3 = x2 · x. Für f : x → x2 und g : x → x ergibt die Produktregel
d 3
x = h0 (x) = f 0 (x) · g(x) + f (x) · g0 (x)
dx
= 2x · x + x2 · 1
= 3x2 .
Ist m eine positive ganze Zahl, so ergibt sich auf analoge Weise durch vollständige Induktion
d m
x = m · xm−1 .
dx
8
U. Stammbach:
Analysis, Teil A
Beispiel Es sei h : x → 1/xm = x−m , m positiv ganz. Für f : x → 1 und g : x → xm ergibt
die Quotientenregel
d −m
−1 · mxm−1
1
= h0 (x) =
= −m m+1 = −mx−m−1 .
x
dx
x2m
x
Beispiel
Es sei h : x → tan x. Für f : x → sin x und g : x → cos x ergibt die Quotientenregel
d tan
d sin x
cos x · cos x + sin x · sin x
1
(x) =
=
=
.
2
dx
dx cos x
cos x
cos2 x
Analog erhält man
d cot
1
(x) = − 2 .
dx
sin x
Eine weitere wichtige Ableitungsregel ist die sogenannte Kettenregel. Sie lautet wie folgt:
Kettenregel
Es seien f : x → f (x) und g : x → g(x) zwei differenzierbare Funktionen und
h : x → f ◦ g (x) = f (g(x)) sei die zusammengesetzte Funktion. Dann gilt
d(f ◦ g)
(x) = h0 (x) = f 0 (g(x)) · g0 (x) .
dx
Der erste Faktor heisst “äussere”, der zweite Faktor “innere” Ableitung.
Beweis
Laut Definition der Ableitung haben wir
d(f ◦ g)
(x) = F 0 (x) =
dx
=
f ◦ g (x + ∆x) − f ◦ g (x)
∆x→0
∆x
lim
f (g(x + ∆x)) − f (g(x))
∆x→0
∆x
lim
9
Kapitel II. Differentialrechnung
Wir setzen g(x + ∆x) − g(x) = d und beachten, dass mit ∆x auch d gegen Null strebt, denn da
g in x differenzierbar ist, ist es auch stetig in x. Damit erhalten wir
0
F (x) =
=
lim
∆x→0
f (g(x) + d) − f (g(x)) g(x + ∆x) − g(x)
·
d
∆x
f (g(x) + d) − f (g(x))
g(x + ∆x) − g(x)
· lim
∆x→0
d→0
d
∆x
lim
= f 0 (g(x)) · g0 (x) .
Dies war zu beweisen.
Beispiel
Es sei F : x → tan (x2 ). Für f : x → tan x, g : x → x2 liefert die Kettenregel für
die zusammengesetzte Funktion F : x → f ◦ g (x) = f (g(x)).
d
1
tan (x2 ) = F 0 (x) =
· 2x .
dx
cos2 (x2 )
Beispiel
Es sei F : x → (g(x))m . Für f : x → xm ist F = f ◦ g. Die Kettenregel liefert
d
(g(x))m = F 0 (x) = m · (g(x))m−1 · g0 (x) .
dx
Beispiel Es sei G : x → g(xm ). Für f : x → xm ist G = g ◦ f (Man beachte die Reihenfolge!).
Die Kettenregel liefert
d
g(xm ) = G0 (x) = g0 (xm ) · mxm−1 .
dx
7
Beispiel
Es sei H : x → 1 + (1 + x2 )4 . Die Kettenregel liefert, zweimal hintereinander
angewandt,
6
dH
(x) = H 0 (x) = 7 1 + (1 + x2 )4 · 4(1 + x2 )3 · 2x .
dx
10
U. Stammbach:
Analysis, Teil A
Eine weitere Anwendung der Kettenregel betrifft die Ableitung der inversen Funktion. Es
sei f : x → f (x) eine injektive Funktion. Ihre Ableitung f 0 : x → f 0 (x) sei bekannt. Gesucht ist
(f −1 )0 (x), die Ableitung der zu f inversen Funktion. Laut Definition der inversen Funktion gilt
f ◦ f −1 (x) ≡ x .
Setzen wir f −1 = g und wenden wir die Kettenregel an, so folgt
f 0 f −1 (x) · (f −1 )0 (x) ≡ 1 .
Auflösen nach (f −1 )0 (x) liefert
(f −1 )0 (x) =
1
f 0 (f −1 (x))
.
Als Zusatz bemerken wir noch folgendes. Ist y der Funktionswert der Funktion f an der Stelle
x, so sagt man in einer etwas altertümlichen Sprechweise manchmal, dass ”y eine Funktion von
x” sei. Ist f injektiv, so stellt die inverse Funktion f −1 “x als Funktion von y” dar. Die obige
Beziehung zwischen den Ableitungen drückt sich dann in der einprägsamen Formel
dx
1
(y) =
dy (x)
dy
dx
aus. Dabei ist das Argument y auf der linken Seite der Gleichung gleich dem Funktionswert von
f an der Stelle x. (Man beachte, dass man heutzutage die Variable der inversen Funktion f −1
wenigstens in formalen Darstellungen durchwegs gleich benennt wie die Variable der Funktion
f .)
Beispiel
Es sei g : x → x1/m , m positiv ganz, D(g) = [0, ∞). Definitionsgemäss ist g die
Umkehrfunktion der Funktion f : x → xm . Die obige Formel liefert
d 1
1
1 1 −1
=
x m = g0 (x) =
xm .
1
dx
m
m · (x m )m−1
11
Kapitel II. Differentialrechnung
Beispiel Es sei g : x → arcsin x. Laut Definition ist g die Umkehrfunktion von f : x → sin x,
D(f ) = [−π/2, +π/2]. Die obige Formel liefert
d arcsin
1
1
.
(x) = g0 (x) =
= √
dx
cos(arcsin x)
1 − x2
Beispiel Es sei h : x → arctan x. Laut Definition ist h die Umkehrfunktion von f : x → tan x,
D(f ) = (−π/2, +π/2). Die obige Formel liefert
d arctan
(x) = h0 (x) =
dx
1
1
.
= cos2 (arctan x) =
1
1 + x2
cos2 (arctan x)
Wir beschliessen den Abschnitt mit zwei konkreten geometrischen Problemen.
Beispiel
Wir stellen uns die folgende Aufgabe. Es sei die Parabel y = x2 gegeben. Es sei
P0 ein von Ursprung verschiedener, aber sonst beliebiger Punkt dieser Parabel und t0 sei die
zugehörige Tangente. Man finde den Punkt P1 auf der Parabel, dessen zugehörige Tangente t1
senkrecht zu t0 verläuft und bestimme den Schnittpunkt S von t0 und t1 (siehe Figur 3).
Wir fassen die Parabel y = x2 als Graph der Funktion f : x → x2 auf. Der beliebige Punkt P0
gehöre zum x-Wert x0 , x0 6= 0. Dann gilt P0 = (x0 , x20 ). Da die Ableitung durch f 0 (x) = 2x
gegeben ist, hat t0 die Steigung 2x0 . Die Geradengleichung von t0 lautet somit
(1.1)
y − x20 = 2x0 (x − x0 ) .
Die Gerade t1 steht senkrecht zu t0 , sie hat also die Steigung −1/(2x0 ). Für den gesuchten
Punkt P1 = (x1 , x21 ) der Parabel muss deshalb die Gleichung
2x1 = −
1
2x0
erfüllt sein. Daraus ergibt sich
x1 = −
1
,
4x0
12
U. Stammbach:
Analysis, Teil A
(y)
P0
Fig. 3 :
Senkrecht stehende Tangenten
an die Parabel y = x2
y = x2
t1
t0
P1
(x)
S
y=−
1
4
und die Geradengleichung von t1 lautet somit
(1.2)
1
1
1
y−
= −
x+
2
16x0
2x0
4x0
.
Wir erhalten den Schnittpunkt S der beiden Geraden t0 , t1 , indem wir das aus den Gleichungen
(1.1) und (1.2) gebildete System nach x und y auflösen. Für die Koordinaten von S ergibt sich
x =
1
1
x0 −
2
8x0
y = −
1
.
4
Der Schnittpunkt von t0 und t1 liegt also unabhängig vom Ausgangspunkt P0 auf der Parallelen
y = −1/4 zur x-Achse. Ein überraschendes Resultat!
Beispiel
Es sei wiederum P0 ein vom Ursprung des Koordinatensystems verschiedener,
beliebiger Punkt der Parabel y = x2 . Die zugehörige Tangente sei t0 , die zugehörige Normale
13
Kapitel II. Differentialrechnung
n0 . Der Punkt P2 sei der Schnittpunkt von n0 mit der Parabel und t2 die zugehörige Tangente.
Man bestimme den Schnittpunkt von t0 und t2 (siehe Figur 4).
Wie oben ist die Tangente t0 im Punkt P0 , P0 = (x0 , x20 ) durch die Gleichung
y − x20 = 2x0 (x − x0 )
(1.3)
gegeben, die Normale n0 durch P0 demzufolge durch
y − x20 = −
1
(x − x0 ) .
2x0
(y)
y = x2
P2
n0
t0
Fig. 4 :
Schnittpunkt der Tangenten t0
und t2 an die Parabel y = x2
P0
t2
(x)
T
1
1
y=− −
2 16x2
Um P2 zu erhalten, löst man das Gleichungssystem
y − x20 = −
1
(x − x0 )
2x0
y = x2
14
U. Stammbach:
Analysis, Teil A
nach x und y auf. Die eine Lösung ist natürlich x = x0 , y = x20 ; die andere ergibt sich zu
1
1
x = −x0 −
, y = x0 +
2x0
2x0
2
.
Daraus erhält man P2 = (−x0 − 1/(2x0 ), (x0 + 1/(2x0 ))2 ) und die Tangente t2 ist durch die
Gleichung
(1.4)
y − x0 +
1
2x0
2
= −2 x0 +
1
2x0
x + (x0 +
1
)
2x0
gegeben. Löst man das durch die Gleichungen (1.3) und (1.4) gebildete System nach x und y
auf, so erhält man die Koordinaten des gesuchten Schnittpunktes T , nämlich
x = −
1
4x0
1
y = − − x20
2
Eliminieren wir schliesslich x0 , so ergibt sich die Gleichung der durch den Schnittpunkt gebildeten Kurve K. Sie lautet
1
1
y = − −
.
2 16x2
15
Kapitel II. Differentialrechnung
2
Linearisieren, Fehlerrechnung
Es sei f : x → f (x) eine differenzierbare Funktion, x0 ∈ D(f ). Unter der linearen Ersatzfunktion von f in x0 versteht man die lineare Funktion
x → f 0 (x0 )(x − x0 ) + f (x0 ) .
Der Graph der linearen Ersatzfunktion von f in x0 ist somit gerade die Tangente an den Graphen
von f im Punkt (x0 , f (x0 )). Der Vorgang, welcher die Funktion f durch die lineare Ersatzfunktion von f in x0 ersetzt, heisst Linearisieren in x0 .
Beispiel
Die lineare Ersatzfunktion von f : x → sin x in x0 = 0 ist
x → f 0 (x0 )(x − x0 ) + f (x0 ) = x ,
denn es gilt sin0 (0) = cos(0) = 1, sin(0) = 0. Die lineare Ersatzfunktion von f : x → sin x in
x0 = π/3 ist (siehe Figur 1)
1
π
x→
x−
2
3
√
3
1
+
= x+
2
2
√
3 π
−
2
6
!
,
denn es gilt
0
sin
π
3
π
= cos
3
√
π
1
= , sin
2
3
=
3
.
2
Die Figur lässt vermuten, dass die lineare Ersatzfunktion von f : x → f (x) in x0 , in der
Umgebung des Wertes x0 eine gute Approximation für die Funktion f ist. Dies ist in der Tat
der Fall und lässt sich mathematisch wie folgt ausdrücken. Wir setzen
ϕ(x) = f (x) − (f 0 (x0 )(x − x0 ) + f (x0 )) ,
16
U. Stammbach:
Analysis, Teil A
3
(y)
2
1
y = x+
2
√
3 π
−
2
6
!
y = sin x
1
-1
Fig. 1 :
Die lineare Ersatfunktion von
f : x → sin x in x0 = π/3
1
2
3
(x)
-1
so dass ϕ die Differenz zwischen der Funktion f und deren linearen Ersatzfunktion in x0 beschreibt. Je kleiner |ϕ(x)| ist, umso besser wird f (x) durch den Wert der linearen Ersatzfunktion
approximiert. Natürlich gilt ϕ(x0 ) = 0. Setzen wir wie üblich ∆x = x − x0 , so erhalten wir
ϕ(x)
f (x) − f (x0 )
ϕ(x)
=
=
− f 0 (x0 ) .
∆x
x − x0
∆x
Betrachten wir jetzt den Grenzübergang x → x0 (oder ∆x → 0), so folgt
ϕ(x)
= 0.
∆x→0 ∆x
lim
Dies bedeutet anschaulich, dass für x → x0 nicht nur ϕ(x) gegen Null geht (was nach obigem
klar ist), sondern dass ϕ(x) stärker gegen Null geht als ∆x. Es geht nämlich sogar der Quotient
ϕ(x)/∆x gegen Null. In der Tat ist also die lineare Ersatzfunktion von f in x0 in der Umgebung
von x0 eine gute Approximation für f ; eine umso bessere, je näher x bei x0 liegt.
Die Tatsache, dass der Quotient ϕ(x)/∆x für ∆x → 0 gegen Null strebt, werden wir später
dadurch ausdrücken, dass wir sagen “ϕ(x) ist für x → x0 von kleinerer Grössenordnung als
∆x = x − x0 ”. Wir werden dies durch das Symbol
17
Kapitel II. Differentialrechnung
ϕ(x) = o(x − x0 ) für x → x0
beschreiben.
Beim Arbeiten mit der linearen Ersatzfunktion hat es sich eingebürgert, ein neues, aus dem
alten durch Parallelverschiebung gewonnenes Koordinatensystem mit dem neuen Ursprung im
Punkte (x0 , f (x0 )) einzuführen. Man benennt die Achsen des neuen Koordinatensystems mit
dx und df . Die lineare Ersatzfunktion von f in x0 , die wir jetzt df nennen, stellt sich in diesem
neuen Koordinatensystem auf sehr einfache Weise dar
df : dx → f 0 (x0 ) · dx .
Die Approximationseigenschaft lässt sich dann durch
∆f = f (x) − f (x0 ) ∼ df .
ausdrücken. In diesem Zusammenhang heisst die lineare Ersatzfunktion auch Differential der
Funktion f in x0 .
Beispiel
Die lineare Ersatzfunktion von
f : x → (1 + x)α
in x0 = 0 ist
x → α(1 + x0 )α−1 (x − x0 ) + (1 + x0 )α = 1 + αx .
Unser Resultat besagt, dass 1 + αx für x nahe bei x0 = 0 eine gute Approximation für (1 + x)α
ist, und zwar ist der Fehler |ϕ(x)| im Vergleich mit |x| “verschwindend klein”, wenn nur |x|
genügend klein ist.
Insbesondere gelten für |x| << 1 die Beziehungen (siehe Figuren 2,3,4)
√
1
1+x ∼ 1+ x ,
2
1
1
√
∼ 1− x ,
2
1+x
1
∼ 1−x .
1+x
18
U. Stammbach:
Analysis, Teil A
3
(y)
y = 1 + 12 x
2
y=
Fig. 2 :
Die lineare Ersatzfunktion von
√
f : x→ 1+x
√
1+x
1
im Punkte x0 = 0
(x)
-1
1
2
3
-1
3
(y)
2
1
Fig. 3 :
Die lineare Ersatzfunktion von
1
y= √
1+x
f :x→ √
im Punkte x0 = 0
y = 1 − 12 x
-1
1
-1
1
1+x
(x)
2
3
19
Kapitel II. Differentialrechnung
2
(y)
1.5
Fig. 4 :
Die lineare Ersatzfunktion von
1
y=
1
1+x
0.5
f :x→
1
1+x
im Punkte x0 = 0
-1
-0.5
0.5
1
1.5
2
(x)
-0.5
y =1−x
-1
Von letzterer Approximation macht man im täglichen Leben oft Gebrauch: Eine Ware, die A
Franken kostet, kostet nach einem Preisaufschlag von 2% B, B = A(1 + 2/100) Franken. Geht
man vom neuen Preis aus, so gilt A = B/(1 + 2/100). Folglich ist es falsch zu sagen, dass die
Ware vor dem Aufschlag um 2% billiger war, aber jedermann weiss, dass dies annähernd richtig
ist. In der Tat gilt
2
A = B/ 1 +
100
2
∼B 1−
100
.
Jedermann ist sich auch bewusst, dass für grössere Prozentzahlen die analoge Approximation
nicht mehr genügend gut ist.
Die Technik des Linearisierens wird bei der mathematischen Behandlung von Problemen der
Natur- und Ingenieurwissenschaften sehr häufig angewendet. Die in solchen Problemen auftretenden Grössen werden nämlich in der Regel durch komplizierte und vielfach gar nicht genau
bekannte Funktionen beschrieben. Man denke etwa an die Reibungskräfte auf einer rauhen
Oberfläche oder an die Spannungskräfte, die in einem Balken auftreten, wenn dieser bis zum
Bruch belastet wird. In der mathematischen Behandlung ersetzt man deshalb die komplizierten
Funktionen sehr oft durch einfachere Approximationen; als erste grobe Näherung bietet sich
20
U. Stammbach:
Analysis, Teil A
dabei die lineare Ersatzfunktion an. Man linearisiert das Problem und betrachtet die linearisierte Theorie. Dadurch wird das Problem mathematisch nicht nur einfacher zu fassen, sondern
in vielen Fällen ist erst die linearisierte Theorie einer vollständigen mathematischen Behandlung überhaupt zugänglich. Diese liefert zwar nur eine erste Näherung, aber diese reicht für
praktische Zwecke oft aus.
Beispiel
ist durch
Die Rückstellkraft K eines mathematischen Pendels der Länge l und der Masse m
K = mg sin ϕ
gegeben, wobei g die Erdbeschleunigung bezeichnet. Wie wir später sehen werden, bereitet die
mathematische Behandlung des mathematischen Pendels erhebliche Schwierigkeiten, wenn man
für die Rückstellkraft diese Formel verwendet. Man betrachtet deshalb die linearisierte Theorie,
die man dadurch erhält, dass man die Funktion
ϕ → K = mg sin ϕ
durch ihre lineare Ersatzfunktion in ϕ0 = 0 ersetzt,
ϕ → mgϕ .
Der Wert ϕ0 = 0 entspricht der Ruhelage des Pendels. Anschaulich gesagt, beschränkt man
sich auf kleine Auslenkungen des Pendels, ϕ << 1, und benützt, dass für kleine Werte von ϕ
die komplizierte Funktion ϕ → mg sin ϕ gut durch ihre lineare Ersatzfunktion in ϕ0 = 0, d.h.
durch ϕ → mgϕ approximiert wird. Die linearisierte Theorie des mathematischen Pendels lässt
sich auf eine einfache Weise mathematisch darstellen und durchrechnen (siehe später). Es zeigt
sich darüber hinaus, dass die so erhaltene Näherung für die meisten praktischen Zwecke völlig
genügt.
Eine weitere wichtige Anwendung der Technik des Linearisierens ist die sogenannte Fehlerrechnung. Dabei geht es um das Problem, dass in der Praxis die Werte der Ausgangsgrössen einer
Rechnung im allgemeinen nicht genau bekannt sind. Oft handelt es sich ja um Messwerte, die
naturgemäss nur bis auf eine gewisse Genauigkeit bestimmt werden können, und deshalb mit
(Mess-)Fehlern behaftet sind. Im Laufe einer Rechnung pflanzen sich diese Fehler fort und beeinflussen das Schlussresultat. Der Leser wird sich erinnern, dass wir eine ähnliche Fragestellung
diskutiert haben, als wir den Begriff der Stetigkeit von Funktionen eingeführt haben. Während
wir aber damals qualitative Aussagen in den Vordergrund stellten, sind wir jetzt an quantitativen Aussagen interessiert, nämlich an einer Abschätzung des Fehlers im Schlussresultat. Die
21
Kapitel II. Differentialrechnung
Fehlerrechnung leistet gerade dies, und zwar indem die lineare Ersatzfunktion herangezogen
wird.
Beispiel In einem Dreieck seien die Seite a und der Winkel α genau bekannt. Der Winkel β
wird gemessen, wobei der Messfehler kleiner als ∆β ist. Wie wirkt sich dieser Messfehler bei der
Berechnung der Länge der Seite b aus?
Nach dem Sinus-Satz gilt
b=
a
sin β .
sin α
Betrachten wir b als Funktion von β, b = f (β), und vergleichen wir die Funktionswerte f (β+∆β)
und f (β), so gilt nach obigem
∆f = f (β + ∆β) − f (β) ∼ df = f 0 (β)dβ ,
wobei wir rechts statt ∆β konsequenterweise dβ geschrieben haben. Für das Differential df
erhalten wir
df =
a
cos β dβ ,
sin α
was eine Abschätzung des absoluten Fehlers |∆f | erlaubt. In den Anwendungen interessanter
ist allerdings gewöhnlich der relative Fehler. Darunter versteht man den Quotienten df /f . In
unserem Fall erhalten wir
df
= cot β dβ .
f
Für kleine β’s wird der relative Fehler also gross.
Beispiel Man möchte die Oberfläche O und das Volumen V einer Kugel aus der einzigen
wirklich messbaren Grösse, nämlich dem Durchmesser x der Kugel bestimmen. Wie wirken sich
Messfehler aus?
Es gelten bekanntlich die Formeln
V =
4π
3
O = 4π
Daraus folgt für die absoluten Fehler
3
x
2
2
x
2
,
.
22
U. Stammbach:
dV =
4π 3
3 2
2
x
2
dO = 4π
dx = 2π
2
x
2
Analysis, Teil A
dx ,
x
dx = 2πx dx
2
und für die relativen Fehler
dV
dx
=3
,
V
x
dO
dx
=2
.
O
x
Wir überlassen es dem Leser, für die Berechnung des relativen Fehlers, etwa bei Potenzfunktionen, Rechenregeln zu finden.
23
Kapitel II. Differentialrechnung
3
Mittelwertsatz der Differentialrechnung
Wir führen zuerst den Begriff des lokalen Extremums ein. Eine Funktion f : x → f (x) mit
Definitionsbereich D(f ) besitzt in ξ ∈ D(f ) eine lokale Maximalstelle, wenn es ein Intervall (c, d)
gibt mit c < ξ < d, so dass für alle x aus D(f ) mit c < x < d gilt f (x) ≤ f (ξ). Der Wert f (ξ)
heisst dann ein lokales Maximum von f . Analog ist eine lokale Minimalstelle und ein lokales
Minimum definiert. Unter einer lokalen Extremalstelle versteht man eine lokale Maximalstelle
oder eine lokale Minimalstelle, und man spricht in analoger Weise von einem lokalen Extremum.
Es zeigt sich, dass lokale Extremalstellen von differenzierbaren Funktionen, falls sie im Innern
des Definitionsbereiches liegen, mit Hilfe der Differentialrechnung entdeckt werden können.
Satz Es sei f : x → f (x) eine auf dem Intervall (a, b) definierte differenzierbare Funktion, die
in ξ, a < ξ < b ein lokales Extremum besitzt. Dann gilt f 0 (ξ) = 0.
Beweis Wir zeigen, dass die Annahme f 0 (ξ) > 0 zu einem Widerspruch führt (in analoger
Weise führt auch f 0 (ξ) < 0 zu einem Widerspruch). Definitionsgemäss gilt
f 0 (ξ) = lim
x→ξ
f (x) − f (ξ)
.
x−ξ
Es sei nun f 0 (ξ) > 0. Dann folgt nach der Definition des Limes, dass für alle genügend nahe bei
ξ liegenden x gilt
f (x) − f (ξ)
>0.
x−ξ
Für diese Werte x hat also f (x) − f (ξ) dasselbe Vorzeichen wie x − ξ. Für x-Werte mit x − ξ > 0
gilt somit f (x) > f (ξ) und für x-Werte mit x−ξ < 0 gilt f (x) < f (ξ). Damit besitzt f in ξ weder
ein lokales Maximum noch ein lokales Minimum. Dies steht im Widerspruch zur Voraussetzung.
Aus dieser Aussage ergibt sich leicht der sogenannte Satz von Rolle (M. Rolle 1652 - 1719)
(siehe Figur 1):
Satz Es sei f : x → f (x) eine differenzierbare Funktion mit f (x1 ) = 0 = f (x2 ), x1 < x2 . Dann
gibt es mindestens ein ξ, x1 < ξ < x2 mit f 0 (ξ) = 0.
24
U. Stammbach:
Analysis, Teil A
(y)
Fig. 1 :
Zum Satz von Rolle
(x)
x1
ξ
x2
Beweis Ist f (x) ≡ 0 für x1 ≤ x ≤ x2 , so ist nichts zu beweisen, denn dann gilt f 0 (x) = 0 für
alle x, x1 ≤ x ≤ x2 . Wir dürfen also annehmen, dass f im Intervall [x1 , x2 ] von Null verschiedene
Werte annimmt. Aber dann nimmt f in einem inneren Punkt ξ, x1 < ξ < x2 ein Extremum
an. Nach obigem folgt dann f 0 (ξ) = 0. (Die Aussage, dass f in einem Punkt des Intervalles
[x1 , x2 ] ein Extremum annimmt, ist zwar sehr plausibel, sie müsste aber natürlich mathematisch
bewiesen werden. Ein solcher Beweis würde etwas mehr mathematisches Grundlagenwissen
benötigen, als wir in dieser Vorlesung zur Verfügung haben. Die Aussage folgt aus der Stetigkeit
der Funktion f . Wir erwähnen schliesslich, dass man leicht Funktionen konstruieren kann, die
zwar in allen Punkten des Intervalles [x1 , x2 ] definiert sind, die aber in diesem Intervall kein
Extremum annehmen; diese Funktionen sind dann natürlich notwendigerweise nicht stetig.)
Bemerkung Ist f auch nur in einem Punkt des Intervalles [x1 , x2 ] nicht differenzierbar, so
braucht kein ξ der verlangten Art zu existieren.
Der folgende Satz, der Mittelwertsatz der Differentialrechnung ist eine Verallgemeinerung
des Satzes von Rolle (siehe Figur 2).
Satz Es sei f : x → f (x) eine im Intervall [x1 , x2 ] definierte differenzierbare Funktion. Dann
gibt es (mindestens) ein ξ, x1 < ξ < x2 mit
f 0 (ξ) · (x2 − x1 ) = f (x2 ) − f (x1 )
25
Kapitel II. Differentialrechnung
(y)
f (x2 )
Fig. 2 :
Zum Mittelwertsatz der
Differentialrechnung
f (ξ)
f (x1 )
(x)
ξ
x1
Beweis
x2
Wir betrachten die Funktionen
g : x → g(x) = f (x) −
f (x2 ) − f (x1 )
(x − x1 ) + f (x1 )
x2 − x 1
.
Offensichtlich gilt g(x1 ) = 0 = g(x2 ), und g ist differenzierbar. Nach dem Satz von Rolle gibt es
dann ein ξ, x1 < ξ < x2 mit g0 (ξ) = 0; aber
g0 (x) = f 0 (x) −
f (x2 ) − f (x1 )
,
x2 − x 1
so dass folgt
f 0 (ξ) =
Dies war zu beweisen.
f (x2 ) − f (x1 )
.
x2 − x 1
26
U. Stammbach:
Analysis, Teil A
Wir werden den Mittelwertsatz der Differentialrechnung an verschiedenen Stellen in der Vorlesung brauchen können. Gleich hier schliessen wir noch zwei instruktive Anwendungen an.
Folgerung Es sei f : x → f (x) eine im Intervall [a, b] definierte differenzierbare Funktion
mit f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für alle a ≤ x ≤ b. Dann ist f im Intervall (strikt) monoton
wachsend.
Beweis Es seien x1 , x2 zwei beliebige Stellen des Definitionsintervalles. Dann gibt es nach
dem Mittelwertsatz der Differentialrechnung ein ξ zwischen x1 und x2 mit
f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) .
Aus f 0 (ξ) ≥ 0 (bzw. f 0 (x) > 0) folgt dann f (x2 ) ≥ f (x1 ) (bzw. f (x2 ) > f (x1 )).
Regel von Bernoulli-Hôpital (Johann Bernoulli 1667-1748, G. F. A. de l’Hôpital 1661-1704)
Es seien f : x → f (x) und g : x → g(x) zwei auf dem Intervall [a, b] definierte differenzierbare
Funktionen mit f (a) = 0 = g(a). Ferner sei g0 (x) 6= 0 für a < x < b. Dann gilt
lim
x→a+
Beweis
f (x)
f 0 (x)
= lim 0
.
g(x)
x→a+ g (x)
Wir wählen X mit a < X < b und betrachten die Funktion
h : x → h(x) = f (x)g(X) − f (X)g(x) .
Natürlich gilt h(a) = 0 = h(X). Nach dem Satz von Rolle existiert dann ξ, a < ξ < X mit
h0 (ξ) = 0. Es folgt
0 = h0 (ξ) = f 0 (ξ)g(X) − f (X)g0 (ξ)
und damit
f 0 (ξ)
f (X)
=
, a<ξ<X .
0
g (ξ)
g(X)
Lässt man schliesslich in dieser Beziehung X gegen a streben, so erhält man die Behauptung.
27
Kapitel II. Differentialrechnung
Beispiel
x2
2x
2
= lim
= lim
=2.
x→0 1 − cos x
x→0 sin x
x→0 cos x
lim
Beispiel
ex − e
ex
= lim
=e.
x→1 log x
x→1 1/x
lim
Beispiel
lim
x→0
1
1
−
sin x x
= lim
x→0
x − sin x
x sin x
= lim
x→0
1 − cos x
sin x + x cos x
= lim
x→0
sin x
2 cos x − x sin x
=0.
28
4
U. Stammbach:
Analysis, Teil A
Extremalaufgaben
Extremalaufgaben sind von der Schule her wohlbekannt. Wir begnügen uns deshalb hier mit
einigen Präzisierungen und Beispielen. Zuerst zur Definition eines Extremums.
Es sei g : x → g(x) eine auf dem Intervall [a, b] definierte Funktion. Man sagt, x0 ∈ [a, b] sei
eine globale Maximalstelle, wenn für alle x ∈ [a, b] gilt
g(x0 ) ≥ g(x).
Der Wert g(x0 ) heisst dann globales Maximum der Funktion g in [a, b]. Der Punkt x0 ∈ [a, b]
heisst eine lokale Maximalstelle, wenn ein x0 enthaltendes Intervall (c, d) existiert, so dass für
alle x aus [a, b], die auch in (c, d) liegen, gilt
g(x0 ) ≥ g(x).
Der Wert g(x0 ) heisst in diesem Fall ein lokales Maximum der Funktion g. Analog werden
die Begriffe globale Minimalstellen, globales Minimum, lokale Minimalstelle, lokales Minimum
definiert. Maximum und Minimum fasst man unter dem Begriff Extremum zusammen.
Es ist ein wesentlicher Erfolg der Differentialrechnung, dass sie eine effiziente Behandlung von
Extremalaufgaben erlaubt. Es gilt das folgende Resultat, das sich leicht aus dem ersten Satz
des Abschnittes 3 ergibt:
Es sei g : x → g(x), D(g) = [a, b] gegeben. Ist x0 eine lokale Extremalstelle der Funktion g, so
ist
- x0 ein Randpunkt des Definitionsintervalls,
oder
- die Ableitung von g in x0 ist nicht definiert,
oder
- die Ableitung von g ist definiert, und es gilt g0 (x0 ) = 0.
Um die globale Extremalstelle einer Funktion zu finden, kann man demzufolge wie folgt vorgehen: Man macht sich eine Liste von Kandidaten für die lokalen Extremalstellen, d.h. eine Liste
bestehend aus
29
Kapitel II. Differentialrechnung
- den Randpunkten des Definitionsintervalls,
- den Punkten x0 , in denen die Ableitung g0 nicht definiert ist,
- den Punkten x0 , in denen g0 (x0 ) = 0 gilt.
Man berechne dann die Funktionswerte von g in diesen (üblicherweise endlich vielen) Punkten
und finde die Extremalstelle durch Vergleich der Funktionswerte.
Zur Präzisierung mögen noch die folgenden Bemerkungen angeführt werden:
Nicht jeder Punkt x0 mit g0 (x0 ) = 0 ist Extremalstelle (Beispiel: g : x → x3 , x0 = 0 ).
Die zweite Ableitung kann oft herangezogen werden, um zu entscheiden, ob in x0 mit g0 (x0 ) = 0
ein Maximum (g00 (x0 ) < 0) oder ein Minimum (g00 (x0 ) > 0) vorliegt. In den meisten Fällen führt
aber eine Diskussion des Funktionsverhaltens mit einfacheren Mitteln ebenfalls zum Ziel.
Im übrigen gibt es Fälle, wo auch die zweite Ableitung über die Natur des Extremums keine
Auskunft gibt. (Beispiel: g : x → x4 hat in x0 = 0 eine (sogar globale) Minimalstelle, aber es
gilt g00 (x0 ) = 0.)
Beispiel Ein kreisförmiger Querschnitt der Spule eines Transformators soll durch einen kreuzförmigen Querschnitt eines aus Blechen geschichteten Eisenkerns möglichst ausgefüllt werden
(siehe Figur 1).
Wir entnehmen der Figur 1, dass die Fläche des Eisenkerns durch
A = 4yx + 2 · 2(x − y)y
gegeben ist. Setzen wir x = r cos α, y = r sin α, so erhalten wir den Flächeninhalt A in Funktion
von α, 0 ≤ α ≤ π/4
A(α) = 4r 2 cos α sin α + 4r 2 (cos α − sin α) sin α
= 4r 2 (2 cos α sin α − sin2 α).
Nullsetzen der Ableitung liefert
A0 (α) = 4r 2 (−2 sin2 α + 2 cos2 α − 2 sin α cos α) = 0
2 cos(2α) − sin(2α) = 0
tan(2α) = 2 .
Daraus ergibt sich α = 31.7◦ , wobei es sich natürlich um das globale Maximum handelt, da
die Randpunkten des Definitionsbereiches offensichtlich kleinere Werte liefern. Eine weitere
30
U. Stammbach:
Analysis, Teil A
r
α
y
α
Fig. 1 :
Querschnitt der Spule des
Transformators
x
Rechnung zeigt xmax = 0.851 r, ymax = 0.526 r, also Amax = 2.47 r 2 . Der Füllfaktor beträgt
dann
q =
2.47r 2
= 78.7%
πr 2
Beispiel Gegeben ist die Funktion
√
3
f : x → (x − 1) x2 , D(f ) = R.
Gesucht sind die lokalen und globalen Extrema von f (soweit sie existieren).
Wie stellen eine Liste der x-Werte zusammen, die als Kandidaten für eine lokale Extremalstelle
auftreten.
- Es gibt keine Randpunkte, da D(f ) = R.
31
Kapitel II. Differentialrechnung
Die Ableitung von f ist gegeben durch
f 0 (x) =
5x − 2
√ .
33x
Sie ist mit Ausnahme des Nullpunktes überall definiert und Null für x = 2/5. Die weiteren
Kandidaten sind also
- x=0
(Ableitung nicht definiert),
- x = 2/5 (Ableitung gleich Null).
2
(y)
1.5
√
3
(x − 1) x2
1
Fig. 2 :
Die Extrema der Funktion
√
3
f : x → (x − 1) x2
0.5
(x)
-1
-0.5
0.5
1
1.5
2
-0.5
-1
An der Ableitung f 0 (x) lesen wir ferner die folgenden Eigenschaften von f ab.
- Für x < 0 ist die Ableitung positiv, die Funktion f also strikt monoton wachsend.
- Für 0 < x < 2/5 ist die Ableitung negativ, die Funktion f also strikt monoton fallend.
- Für 2/5 < x < ∞ ist die Ableitung positiv, die Funktion f also strikt monoton wachsend.
32
U. Stammbach:
Analysis, Teil A
√
3
Für sehr grosse |x| verhält sich die Funktion f wie x x2 = x5/3 . Damit ist x = 0 eine lokale
Maximalstelle von f und f (0) = 0 ein lokales Maximum; ferner ist x = 2/5 eine lokale Minimalstelle und
r
2
33 4
f
=−
5
5 25
ein lokales Minimum.
Beispiel Gegeben ist die Strecke AB, A = (−1, 1), B = (0, 2). Ferner bezeichnet P = (p, 0)
einen Punkt auf der x-Achse. Gesucht ist derjenige Punkt Q auf der Strecke AB, welcher von
P einen minimalen Abstand hat (siehe Figur 3).
(y)
B = (0, 2)
Fig. 3 :
Punkt P und Strecke AB
A = (−1, 1)
P = (p, 0)
(x)
Der Leser bemerkt natürlich sofort, dass die Lösung von der Lage des Punktes P abhängig ist.
Wir beschreiben die Strecke AB durch
y = x + 2, −1 ≤ x ≤ 0
und definieren die Funktion f als das Quadrat des Abstandes |QP |,
f (x) = d2 = (p − x)2 + (x + 2)2 , D(f ) = [−1, 0] .
33
Kapitel II. Differentialrechnung
10
p2 + 2p + 2
8
Fig. 4 :
Quadrat des minimalen
Abstandes zwischen P und der
Strecke AB
in Funktion von p
6
p2 + 4
(p + 2)2
2
4
2
(p)
0.5
1
1.5
2
Als Kandidaten für die globale Minimalstelle von f treten einmal die beiden Randpunkte des
Definitionsintervalles D(f ) = [−1, 0] auf. Wir erhalten
f (−1) = p2 + 2p + 2,
f (0) = p2 + 4.
Da die Funktion f offensichtlich im ganzen Definitionsintervall differenzierbar ist, erhalten wir
die weiteren Kandidaten durch Nullsetzen der Ableitung
f 0 (x) = −2(p − x) + 2(x + 2) = −2p + 4x + 4 = 0 .
Daraus ergibt sich x = p/2 − 1. Dieser Punkt liegt nur für 0 ≤ p ≤ 2 im Definitionsintervall der
Funktion f ; nur in diesem Fall tritt dieser Kandidat überhaupt auf. Aus f 00 (x) = 4 > 0 folgt
ferner, dass in diesem Punkt eine lokale Minimalstelle vorliegt. Die globale Minimalstelle von f
ist folglich
xmin =



−1
für
p≤0
p/2 − 1 für 0 ≤ p ≤ 2


0
für
2≤p
,
34
U. Stammbach:
Analysis, Teil A
und das Quadrat des Minimalabstandes |QP | ist gegeben durch (siehe Figur 4)
f (xmin ) =

2

 p + 2p + 2
(p + 2)2 /2


p2 + 4
für
p≤0
für 0 ≤ p ≤ 2
für
2≤p
.
35
Kapitel II. Differentialrechnung
5
Zu Exponential- und Logarithmusfunktion
Die Funktion f : x → ex hat, wie man aus der Mittelschule weiss, die Eigenschaft, dass ihre
Ableitung wiederum f ist, f 0 (x) ≡ f (x). Wir wollen hier als erstes zeigen, dass diese Eigenschaft zusammen mit der Forderung f (0) = 1 die Funktion x → ex eindeutig bestimmt. Etwas
allgemeiner zeigen wir
Satz Es sei A eine reelle Zahl, und es seien f : x → f (x) und g : x → g(x) zwei differenzierbare
Funktionen mit der Eigenschaft
f 0 (x) = A f (x)
(5.1)
beziehungsweise
g0 (x) = A g(x)
(5.2)
für alle x. Dann gilt
f (x) = C g(x) ,
wobei C eine reelle Konstante bezeichnet.
Beweis
Wir betrachten die Funktion
h:x→
f (x)
.
g(x)
Dann gilt wegen (5.1) und (5.2)
h0 (x) =
f 0 (x) · g(x) − f (x) · g0 (x)
Af (x)g(x) − f (x)Ag(x)
=
=0.
2
(g(x))
(g(x))2
Aus h0 (x) ≡ 0 folgt h(x) ≡ C und damit
f (x) ≡ C g(x).
Dies war zu beweisen.
36
U. Stammbach:
Analysis, Teil A
Eine Gleichung zwischen einer Funktion f und ihrer Ableitung f 0 (oder ihren Ableitungen
f 0 , f 00 , · · ·) heisst bekanntlich eine Differentialgleichung. Eine Funktion f , für welche die
Differentialgleichung identisch in x erfüllt ist, heisst Lösung der Differentialgleichung. Unsere
Beziehung (5.1) ist ein Beispiel einer solchen Gleichung. Unser Satz besagt, dass die Lösung
der Differentialgleichung (5.1) bis auf eine multiplikative Konstante festgelegt ist, insbesondere
folgt, dass (5.1) zusammen mit der (Anfangs-)Bedingung f (0) = 1 die Lösung eindeutig festlegt.
Wir werden im 2. Semester sehen, dass Ähnliches ganz allgemein für Differentialgleichungen und
ihre (Anfangs-)Bedingungen gilt. Es handelt sich hier um ein ganz fundamentales Prinzip.
Die Differentialgleichung
f 0 (x) = Af (x)
zusammen mit der Bedingung f (0) = 1, beschreibt also auf eindeutige Art und Weise eine Funktion f : x → f (x), nämlich x → eAx . Setzen wir A = 1, so folgt, dass die Differentialgleichung
f 0 (x) = f (x)
(5.3)
zusammen mit f (0) = 1 die Exponentialfunktion x → ex charakterisiert (siehe Figur 1).
6
(y)
5
ex
4
Fig. 1 :
Die Exponentialfunktion x → ex
3
2
1
(x)
-2
-1.5
-1
-0.5
0.5
1
1.5
2
-1
Um das noch etwas zu illustrieren, zeigen wir, wie wichtige Eigenschaften der Exponentialfunktion f direkt aus der Differentialgleichung hergeleitet werden können. Wir wählen als erstes die
37
Kapitel II. Differentialrechnung
fundamentale Eigenschaft der Exponentialfunktion
f (a + b) = f (a) · f (b)
also ea+b = ea · eb .
Zu diesem Zweck betrachten wir die Funktion g, welche durch
g : x → g(x) = f (a + x)
definiert wird. Dann folgt
g0 (x) = f 0 (a + x) = f (a + x) = g(x) ,
d.h. g : x → g(x) ist wie f ebenfalls Lösung der Differentialgleichung (5.3). Aus unserem Satz
folgt dann, dass eine Konstante C existiert mit
g(x) = C · f (x) .
Insbesondere gilt
f (a) = g(0) = C · f (0) = C,
da ja laut Voraussetzung f (0) = 1 gilt. Also erhalten wir die für alle x gültige Gleichung
g(x) = f (a) · f (x).
Setzen wir darin x = b, so folgt
(5.4)
g(b) = f (a + b) = f (a) · f (b).
Dies wollten wir direkt aus der Differentialgleichung herleiten.
Auch konkrete Informationen über die Zahl e lassen sich aus (5.3) und (5.4) erhalten. Nach
(5.4) gilt für jede natürliche Zahl
38
U. Stammbach:
e = e1 = f
1
1
1
+ + ··· +
n n
n
n
1
n
= f
Analysis, Teil A
.
Betrachten wir den Punkt x = 0, so gilt wegen f 00 (x) = (f 0 )0 (x) = f 0 (x) = f (x) natürlich
f 00 (0) = 1.
Insbesondere ist der Graph von f an der Stelle x = 0 nach links gekrümmt (konvex). Dann folgt
aber sofort (siehe Figur 2)
f (x) > 1 + x
für alle x die genügend nahe bei x0 = 0 liegen. Mit obiger Formel erhalten wir nun
3
(y)
ex
2.5
2
1+x
Fig. 2 :
Die Exponentialfunktion x → ex
und die lineare Funktion
x→ 1+x
1.5
1
0.5
(x)
-2
-1.5
-1
-0.5
0.5
1
1.5
2
-0.5
-1
n
e = f (1) = f
1
n
>
1+
1
n
n
39
Kapitel II. Differentialrechnung
und analog
1
1
= f (−1) = f −
e
n
n
>
1−
1
n
n
=
n−1
n
n
.
Diese beiden Beziehungen liefern die Ungleichungen
1
1+
n
n
<e<
n
n−1
n
1
= 1+
n−1
n
1
= 1+
n−1
n−1 1
1+
n−1
.
Lässt man n auf beiden Seiten gegen ∞ streben, so erhält man links und rechts denselben
Grenzwert. Daraus folgt (siehe Figur 3)
3
2.5
n
1
an = 1 +
n
Fig. 3 :
Die gegen e konvergierende
n
Folge an = 1 + n1
2
1.5
1
0.5
5
10
15
20
lim
n→∞
1+
1
n
n
= e.
Schliesslich versuchen wir noch, unsere Funktion f in Form eines “unendlichen Polynoms”, d.h.
durch eine Potenzreihe darzustellen. Wir werden diese Art, Funktionen zu beschreiben, später
genauer kennenlernen. Hier wollen wir das Thema nur kurz antippen. Wir machen den Ansatz
40
U. Stammbach:
Analysis, Teil A
f (x) = a0 + a1 x + a2 x2 + · · · .
Die Bedingung f (0) = 1 liefert sofort a0 = 1. Die reellen Zahlen a1 , a2 , . . . versuchen wir mit
Hilfe der Differentialgleichung (5.3) zu bestimmen. (Gliedweises) Ableiten und Einsetzen in
(5.3) ergibt
a1 + 2a2 x + 3a3 x2 + · · · = a0 + a1 x + a2 x2 + · · · .
Daraus folgt zuerst
a1
2a2
3a3
4a4
=
=
=
=
..
.
a0 = 1
a1
a2
a3
und damit
a1 = 1 , a2 =
1
1
1
, a3 =
, . . . , an = , . . . .
2
3!
n!
Es ergibt sich daraus der folgende Ausdruck für f (x) in Form einer unendlichen Summe
f (x) = 1 +
1
1
1
x + x2 + x3 + · · · .
1!
2!
3!
Man nennt dies eine Potenzreihe (mit Mittelpunkt 0). Natürlich müsste man an dieser Stelle
beweisen, dass diese unendliche Summe konvergiert und dass die durch sie dargestellte Funktion
die Gleichung (5.3) erfüllt. Wir werden später sehen, wenn wir uns eingehender mit Potenzreihen
beschäftigen werden, dass dies tatsächlich der Fall ist. Hier wollen wir den oben erhaltenen
Reihenausdruck als gültig annehmen und darin x = 1 setzen. Wir erhalten für den Funktionswert
f (1), also für e die Reihe
e = f (1) = 1 +
1
1
1
+ + + ··· .
1! 2! 3!
Dies ist die uns bereits bekannte Beschreibung der Euler’schen Zahl e durch eine Reihe (siehe
Kap. I, Abschnitt 1).
Schliesslich beschäftigen wir uns noch kurz mit der Logarithmusfunktion. Wegen f 0 (x) =
f (x) > 0 ist f strikt monoton wachsend und deshalb injektiv. Es existiert also die zu f inverse
Funktion; diese heisst - definitionsgemäss - der (natürliche) Logarithmus log : x → log(x) (siehe
Figur 4). Es gilt
41
Kapitel II. Differentialrechnung
d log
1
1
1
(x) = 0
=
= .
dx
f (log(x))
f (log(x))
x
2
(y)
1.5
1
log x
Fig. 4 :
Die Logarithmusfunktion
x → log x
0.5
-1
1
2
3
4
5
6
(x)
-0.5
-1
-1.5
-2
Da der Wertebereich der Exponentialfunktion aus allen positiven Zahlen besteht, ist der Definitionsbereich der Logarithmusfunktion durch D(log) = (0, ∞) gegeben. In diesem Bereich ist
log0 (x) positiv, so dass log strikt monoton wachsend ist. Ausserdem folgt aus der Definition von
log als inverse Funktion der Exponentialfunktion log(1) = 0.
Um die Funktionalgleichung des Logarithmus, d.h. die grundlegende Beziehung
log(a · b) = log a + log b , a, b > 0
aus der Definition herzuleiten, betrachten wir die Funktion x → log(ax) und berechnen deren
Ableitung,
d
a
1
log(ax) = a log0 (ax) =
= .
dx
ax
x
Die Funktionen x → log x und x → log(ax) besitzen die gleiche Ableitung, sie unterscheiden
sich deshalb nur um eine additive Konstante,
42
U. Stammbach:
Analysis, Teil A
log(ax) − log x ≡ C .
Um C zu bestimmen setzt man x = 1; man erhält C = log a. Damit folgt, wie gewünscht
log(a · b) = log a + log b .
Wenn man in dieser Beziehung a = 1/b setzt und log 1 = 0 berücksichtigt, so erhält man
log(1/b) = − log b, so dass folgt
log
a
b
= log a − log b .
Es war Ziel des ersten Teils dieses Abschnittes, zu zeigen, wie eine Differentialgleichung die
Eigenschaften ihrer Lösungen festlegt. Wir haben dies am Beispiel der einfachen Differentialgleichung der Exponentialfunktion zu erklären versucht. Im Rest des Abschnittes wollen wir uns
noch mit der Exponentialfunktion zu beliebiger Basis a, a > 1 beschäftigen und die sogenannten
hyperbolischen Funktionen einführen.
Es sei a > 1 eine reelle Zahl. Es lässt sich offensichtlich ax mit Hilfe der Exponentialfunktion
zur Basis e wie folgt schreiben
ax = e(log a)x .
Daraus erhält man sofort die Ableitung der Funktion x → ax
d x
a = (log a)ax .
dx
Da diese Ableitung offenbar für alle x-Werte positiv ist, ist die Funktion x → ax strikt monoton
wachsend. Wir können deshalb die zu ihr inverse Funktion definieren; wir nennen sie a log. Es
gilt
a
log : x →a log x =
a log x
Dies ergibt sich leicht aus elog x = x = a
log e = 1
a
Deshalb gelten die Beziehungen
log e =
1
log x .
log a
= e(log a)
1
.
log a
a log x
. Für x = e erhält man wegen
43
Kapitel II. Differentialrechnung
a log x
=
d x
dx a
=
a log e ·
log x
,
ax
,
1
a log e
d a log x =
dx
1 1
log a x
=
a log e
1
x.
Zum Schluss wollen wir uns noch den sogenannten hyperbolischen Funktionen zuwenden,
die mit Hilfe der Exponentialfunktionen definiert sind (siehe Figur 5).
Definition Der Sinus hyperbolicus ist definiert durch
sinh x =
1 x
e − e−x ,
2
der Cosinus hyperbolicus ist definiert durch
cosh x =
1 x
e + e−x .
2
4
(y)
3
cosh x
2
Fig. 5 :
Die hyperbolischen Funktionen
sinh x
1
1 x
2e
-2
-1.5
-1
1 −x
2e
-0.5
0.5
1
1.5
2
(x)
-1
-2
44
U. Stammbach:
Analysis, Teil A
Für diese Funktionen gelten die folgenden Identitäten, die sich auf einfache Weise aus den
Definitionen ergeben:
(1) cosh2 x − sinh2 x ≡ 1;
(2) sinh(x + y) = sinh x cosh y + cosh x sinh y;
(3) cosh(x + y) = cosh x cosh y + sinh x sinh y;
(4)
d sinh (x) = cosh x;
dx
(5)
d cosh (x) = sinh x.
dx
Die Formeln erinnern den Leser an die entsprechenden Formeln für die Sinus- und Cosinusfunktionen; sie liefern eine Rechtfertigung für die (historisch gewählten) Bezeichnungen der
hyperbolischen Funktionen. Um auch das Auftreten des Wortes “hyperbolisch” zu erklären,
betrachten wir die durch die Parameterdarstellung
t → (cosh t, sinh t), t ∈ R
gegebene Kurve. Es gilt dann nach der ersten der obigen Identitäten (x(t))2 − (y(t))2 = 1, d.h.
die Punkte der Kurve liegen auf der Hyperbel x2 − y 2 = 1, genauer auf dem rechten Ast dieser
Hyperbel.
Die Graphen der hyperbolischen Funktionen ergeben sich sehr leicht aus den Definitionen. Insbesondere ist der Sinus hyperbolicus eine ungerade, der Cosinus hyperbolicus eine gerade Funktion. Der Graph der Cosinus hyperbolicus Funktion heisst auch etwa Kettenlinie, weil eine an
den zwei Enden aufgehängte frei bewegliche Kette die Form des Graphen von x → a cosh(x/a)
annimmt.
Wegen sinh0 x = cosh x ist der Sinus hyperbolicus strikt monoton wachsend, also insbesondere
injektiv. Es gibt deshalb eine zum Sinus hyperbolicus inverse Funktion; diese heisst in der
Literatur Arsinh (“Area sinus hyperbolicus”, siehe Figuren 6,7). Sie lässt sich wie folgt auf
elementare Weise ausdrücken. Laut Definition ist die Gleichung
y=
1 x
e − e−x
2
nach x aufzulösen. Man erhält der Reihe nach
e2x − 1 = 2yex
(ex )2 − 2yex − 1 = 0
ex = y ±
q
y2 + 1 .
45
Kapitel II. Differentialrechnung
4
(y)
3
sinh x
2
Fig. 6 :
Sinus hyperbolicus x → sinh x
1
-4
-3
-2
-1
1
2
3
4
(x)
-1
-2
-3
-4
4
(y)
3
Arsinh x
2
Fig. 7 :
Area sinus hyperbolicus
x → Arsinh x
1
-4
-3
-2
-1
1
2
3
4
(x)
-1
-2
-3
-4
46
U. Stammbach:
Analysis, Teil A
4
(y)
3
cosh x
Fig. 8 :
Cosinus hyperbolicus
x → cosh x , x ∈ [0, ∞]
2
1
(x)
-1
1
2
3
4
-1
4
(y)
3
2
Fig. 9 :
Area cosinus hyperbolicus
x → Arcosh x
Arcosh x
1
(x)
-1
1
-1
2
3
4
47
Kapitel II. Differentialrechnung
1.2
(y)
1
0.8
1
√
2
x +1
Fig. 10 :
Die Funktion
0.6
√
0.4
1
x2
+1
;
Ableitung von x → Arsinh x
0.2
(x)
-4
-3
-2
-1
1
2
3
4
-0.2
8
(y)
6
Fig. 11 :
Die Funktion
4
√
1
√
x2 − 1
1
2
−1
;
Ableitung von x → Arcosh x
2
-1
1
x2
3
4
5
6
(x)
48
U. Stammbach:
Analysis, Teil A
Das negative Vorzeichen kann wegen ex > 0 ausgeschlossen werden, so dass schliesslich folgt
x = log y +
q
y2 + 1
.
Die inverse Funktion des Sinus hyperbolicus wird durch die Formel
Arsinh : x → log x +
p
x2 + 1
beschrieben.
Schränkt man den Definitionsbereich des Cosinus hyperbolicus auf die nicht negativen Zahlen
[0, ∞) ein, so erhält man eine injektive Funktion. Die dazu inverse Funktion heisst Arcosh
(“Area cosinus hyperbolicus”, siehe Figuren 8,9). Auf analoge Art wie beim Sinus hyperbolicus
erhält man eine elementare Beschreibung, nämlich
Arcosh : x → log x +
p
x2 − 1 .
Definitionsbereich dieser Funktion ist natürlich das Intervall [1, ∞).
Interessant sind die Funktionen Arsinh und Arcosh besonders wegen ihrer Ableitungen. Für
deren Berechnung kann man entweder von der elementaren Beschreibung ausgehen oder direkt
von der Definition als inverse Funktionen. Eine kurze Rechnung liefert (siehe Figuren 10,11)
d
1
Arsinh x = √
,
dx
x2 + 1
d
1
Arcosh x = √
.
dx
x2 − 1
Die überraschende Tatsache, dass die Ableitungen einfache Wurzelfunktionen sind, wird beim
Integrieren eine grosse Rolle spielen.
49
Kapitel II. Differentialrechnung
6
Grössenordnungen von Funktionen
Es sei f : x → f (x) eine Funktion, die auf dem Intervall (c, ∞) definiert ist. Die Untersuchung
von limx→∞ f (x) gibt eine erste Information über das Verhalten von f (x) für grosse x. Gilt z.B.
lim f (x) = a,
x→∞
so bedeutet dies bekanntlich, dass der Graph von f für x → ∞ die Gerade y = a als horizontale
Asymptote besitzt. In diesem Abschnitt wollen wir unter anderem den Fall limx→∞ f (x) = ∞
etwas näher untersuchen. Die Funktionswerte einer solchen Funktion werden mit wachsenden x
beliebig gross, d.h. der Graph von f strebt für x → ∞ gegen ∞. Dies kann aber auf sehr viele
verschiedene Arten geschehen, wie man etwa an den Beispielen
x → x2 ,
x→
x2 + 3x + 3
,
x+2
x → log x .
unmittelbar sehen kann (siehe Figur 1). Um dieses unterschiedliche Verhalten etwas in den Griff
zu bekommen, führen wir die folgende Sprechweise ein. Es seien f und g zwei Funktionen, die
auf dem Intervall (c, ∞) definiert sind. Dann sagen wir, die Funktion f sei für x → ∞ von
kleinerer Grössenordnung als g, wenn gilt
f (x)
=0.
x→∞ g(x)
lim
In Zeichen drücken wir dies durch das sogenannte Landau-Symbol “o” aus:
f (x) = o(g(x)) für x → ∞ .
Beispiel Es gilt x2 = o(x3 ) für x → ∞ (siehe Figur 2), denn
x2
=0.
x→∞ x3
lim
50
U. Stammbach:
Analysis, Teil A
14
(y)
12
x3/2
10
x2 + 3x + 3
x+2
8
Fig. 1 :
Es gibt verschiedene Arten, wie
f (x) für x → ∞ gegen ∞
streben kann
6
4
log x
2
(x)
2
4
6
8
10
-2
60
(y)
50
x3
40
Fig. 2 :
x → x2 ist von kleinerer
Grössenordnung als x → x3
30
x2
20
10
(x)
2
4
6
8
51
Kapitel II. Differentialrechnung
8
(y)
x1/2
6
Fig. 3 :
x → x1/3 ist von kleinerer
Grössenordnung als x → x1/2
4
x1/3
2
(x)
10
20
30
40
50
60
Beispiel Die Funktionen x → x, x → 2x, x → x + c sind von “gleicher” Grössenordnung; keine
der Funktionen ist von kleinerer Grössenordnung als eine der anderen.
Beispiel Es gilt x1/3 = o(x1/2 ) für x → ∞ (siehe Figur 3), denn
x1/3
=0.
x→∞ x1/2
lim
Die oben eingeführte Sprechweise kann laut Definition auf beliebigen Funktionen angewandt
werden; es ist dafür nicht notwendig, dass die Funktionswerte für x → ∞ gegen ∞ streben.
Auch dazu einige Beispiele.
Beispiel Es gilt 1/x3 = o(1/x2 ) für x → ∞, denn
1/x3
=0
x→∞ 1/x2
lim
Beispiel Für k > 0, gilt 1/xk = o(1).
Von besonderem Interesse sind in diesem Zusammenhang die Exponential- und Logarithmusfunktionen. Hier gilt der wichtige Satz (siehe Figur 4):
52
U. Stammbach:
Analysis, Teil A
Satz Es gilt xk = o(ex ) für x → ∞.
Man kann den Inhalt dieses Satzes auch so ausdrücken: die Exponentialfunktion x → ex strebt
für x → ∞ “stärker” gegen ∞ als jede Potenzfunktion x → xk . (Dies ist natürlich nur für k > 0
von wirklichem Interesse; für k < 0 strebt ja x → xk für x → ∞ gegen 0, so dass die Aussage
des Satzes für k < 0 trivialerweise richtig ist.)
(y)
10
ex
x10
8
Fig. 4 :
Der Eindruck trügt: sowohl
x → x3 wie auch x → x10 sind
von kleinerer Grössenordnung
als x → ex !
(siehe Figuren 5,6)
6
4
x3
2
(x)
0.5
1
1.5
2
2.5
Beweis Zum Beweis bestimmen wir zuerst die Ableitung von x → xk /ex . Es gilt
d
dx
xk
ex
!
=
kxk−1 ex − xk ex
xk−1 (k − x)
=
.
e2x
ex
Für x > k ist die Ableitung negativ, so dass die Funktion x → xk /ex in diesem Bereich monoton
fallend ist. Andererseits ist xk /ex für x > 0 stets positiv. Daraus folgt, dass der Grenzwert
xk
x→∞ ex
lim
existieren muss. Es bleibt also zu zeigen, dass sein Wert 0 ist. Dabei dürfen wir uns auf
ganzzahlige Werte von k beschränken. Ist nämlich n ≤ k < n + 1 für ganzzahliges n, so gilt für
x>1
53
Kapitel II. Differentialrechnung
100
(y)
80
Fig. 5 :
Die Graphen von x → x3 und
x → ex schneiden sich im
Intervall 4 < x < 5 noch einmal.
60
x3
ex
40
20
(x)
1
2
3
5
4
15
5. 10
(y)
15
4. 10
Fig. 6 :
Die Graphen von x → x10 und
x → ex schneiden sich im
Intervall 30 < x < 40 noch
einmal.
15
3. 10
15
2. 10
x10
ex
15
1. 10
(x)
10
20
30
40
54
U. Stammbach:
Analysis, Teil A
xn
xk
xn+1
≤
<
ex
ex
ex
und damit
xn
xk
xn+1
≤
lim
≤
lim
.
x→∞ ex
x→∞ ex
x→∞ ex
lim
Die Tatsache, dass für ganzzahliges n
xn
=0
x→∞ ex
lim
gilt, beweisen wir mit Induktion nach n. Für n = 0 ist die Aussage trivialerweise richtig:
x0
1
= lim x = 0 .
x→∞ ex
x→∞ e
lim
Es sei also n ≥ 1. Da für jede reelle Zahl c mit x auch x + c gegen ∞ strebt, haben wir
xn
x→∞ ex
lim
(x + c)n
x→∞ ex+c
xn + ncxn−1 + · · · + cn
= lim
x→∞
ex · ec
!
n
x
xn−1
1
1
n
= c lim x + nc lim
+ · · · + c lim x
x→∞ ex
x→∞ e
e x→∞ e
n
x
1
= c lim x ,
e x→∞ e
=
lim
denn nach Induktion gilt
xm
=0
x→∞ ex
lim
für m < n. Aus der obigen Gleichung ergibt sich
xn
1
1− c
x→∞ ex
e
lim
=0,
woraus folgt, da die Klammer nicht verschwindet,
xn
=0.
x→∞ ex
lim
Damit ist der Satz bewiesen.
55
Kapitel II. Differentialrechnung
3
(y)
x1/2
2.5
log x
2
Fig. 7 :
Die Logarithmusfunktion
x → log x ist von kleinerer
Grössenordnung als x → x1/2
und x → x1/10 .
1.5
x1/10
1
0.5
(x)
2
4
6
8
10
-0.5
-1
Vergleicht man Potenz- und Logarithmusfunktionen, so gilt (siehe Figur 7)
Satz
Für k > 0 gilt
log x = o(xk )
für x → ∞.
Beweis
log x
t
t1/k
lim
=
lim
=
lim
x→∞ xk
t→∞ (et )k
t→∞
et
!k
=0.
Letzteres nach dem obigen Satz.
Ebenfalls aus dem ersten Satz folgt das nächste Resultat, welches sich mit Funktionen beschäftigt, die für x → ∞ gegen 0 streben.
Satz
Für k > 0 gilt e−x = o(x−k ) für x → ∞.
Beweis
e−x
xk
=
lim
=0.
x→∞ x−k
x→∞ ex
lim
Schliesslich bemerken wir, dass sich die Landau-Symbolik nicht nur für x → ∞ verwenden lässt,
sondern auch für x → a+ , wo a ein endlicher Wert ist. Sind f und g zwei auf dem Intervall (a, b)
56
U. Stammbach:
Analysis, Teil A
definierte Funktionen, so heisst f für x → a+ von kleinerer Grössenordnung als g, wenn
gilt
lim+
x→a
f (x)
=0.
g(x)
In Zeichen drücken wir diesen Sachverhalt wiederum durch das Landau-Symbol aus
f (x) = o(g(x)) für x → a+ .
Als Beispiel betrachten wir die Funktionen x → log x und x → −x−k , k > 0, welche für x → 0+
gegen −∞ streben. Es gilt
Satz Für k > 0 gilt log x = o(−x−k ) für x → 0+ .
Beweis Wiederum folgt dies auf einfache Weise aus unserem ersten Satz:
log x
log(e−t )
−t
t1/k
lim+
= lim
= lim
= lim
−k
−t
−k
−t
−k
t→∞ −(e )
t→∞ −(e )
t→∞
et
x→0 −x
!k
=0.
Man kann sich diese Resultate leicht merken: In all diesen Sätzen verhält sich die Exponentialfunktion extremer als die Potenzfunktion und diese extremer als die Logarithmusfunktion.
Analoge Resultate gelten auch für die Funktion x → ax , a > 0 anstelle von x → ex und
x →a log x anstelle von x → log x. Sie lassen sich leicht aus den obigen Sätzen herleiten, indem
man die wohlbekannten Beziehungen
ax = elog a·x
log x
a
log x =
log a
benützt. Wir überlassen die Details dem Leser.
57
Kapitel II. Differentialrechnung
7
Die zweite und höhere Ableitungen
Ausgehend von einer Funktion f : x → f (x) haben wir die Ableitung f 0 (x) definiert. Ihr Wert
an der Stelle x gibt die Tangentensteigung des Graphen von f im Punkt (x, f (x)) an. Es ist
klar, dass die Zuordnung
f 0 : x → f 0 (x)
wiederum eine Funktion definiert, wobei der Definitionsbereich von f 0 aus allen Punkten x
besteht, in denen die Ableitung von f existiert. Folglich kann für f 0 wiederum die Ableitung
(f 0 )0 gebildet werden. Man schreibt
(f 0 )0 (x) = f 00 (x) =
d2 f
(x)
dx2
und nennt f 00 die zweite Ableitung von f nach x.
Beispiel Ist s : t → s(t) die Wegfunktion einer Bewegung eines Massenpunktes (auf der
s-Achse), so ist
ds
(t) = ṡ(t) = v(t)
dt
die Geschwindigkeit (Schnelligkeit) und
d2 s
(t) = s̈(t) = a(t)
dt2
die Beschleunigung des Massenpunktes. (Bei Funktionen der Zeit t braucht man gern Punkte
zur Bezeichnung der Ableitung nach t.)
Natürlich kann zu f 00 wiederum die Ableitung (f 00 )0 definiert werden. Man spricht dann von der
dritten Ableitung f 000 von f nach x, usw.
Beispiel Es sei f : x → xn , n ganz. Dann ist
f 0 (x) = n · xn−1
f 00 (x) = n(n − 1)xn−2
..
.
f (n) (x) = n · (n − 1) · · · 2 · 1
58
U. Stammbach:
Analysis, Teil A
und alle höheren Ableitungen sind Null.
Die zweite Ableitung einer Funktion f : x → f (x) hat eine wichtige Bedeutung für den Graphen
von f . Ist nämlich f 00 (x0 ) > 0, so ist an dieser Stelle die erste Ableitung f 0 , also die Steigung
des Graphen von f zunehmend. Durchläuft man den Graphen von f in Richtung zunehmenden
x, so ist an der Stelle x0 die Kurve deshalb nach links gekrümmt (konvex). Ist f 00 (x0 ) < 0, so
ist die erste Ableitung f 0 , also die Steigung des Graphen von f 0 abnehmend. Durchläuft man
den Graphen von f in Richtung zunehmenden x, so ist an der Stelle x0 die Kurve deshalb nach
rechts gekrümmt (konkav). Ändert f 00 das Vorzeichen in x0 , so weist der Graph von f an dieser
Stelle einen Wendepunkt auf.
Beispiel Für die Funktion
7
177 2
f : x → x5 − x4 − 32x3 +
x + 126x − 270
2
2
tragen wir in ein und dasselbe Koordinatensystem die Graphen der Funktion f und der Ableitungen f 0 , f 00 , f 000 , . . . ein. Auf diese Weise lassen sich nicht nur die uns schon gut bekannten
Beziehungen leicht verfolgen, die zwischen lokalen Extremalstellen von f und den Nullstellen
von f 0 bestehen, sondern auch diejenigen, die zwischen den Wendepunkten des Graphen von f
und den Nullstellen von f 00 bestehen (siehe Figur 1).
Die geometrische Bedeutung der 2. Ableitung ist nützlich, wenn es darum geht, den groben
Verlauf des Graphen einer Funktion herauszufinden.
Beispiel Es sei f : x → (x − 1)1/3 (siehe Figur 2). Der Definitionsbereich von f besteht
offensichtlich aus allen rellen Zahlen. Bei x = 1 hat die Funktion eine Nullstelle; für x < 1 ist
der Funktionswert negativ, für x > 1 ist der Funktionswert positiv. Die Ableitung von f ergibt
sich zu
f 0 : x → f 0 (x) =
1
(x − 1)−2/3 .
3
Offensichtlich ist f 0 an der Stelle x = 1 nicht definiert. Überall sonst ist die Ableitung positiv,
die Funktion f ist also strikt monoton wachsend. Die Tatsache, dass f 0 (x) für x → 1± gegen
∞ strebt, zeigt, dass der Graph von f bei x = 1 eine vertikale Tangente besitzt. Die zweite
Ableitung von f ist
1 2
f 00 : x → f 00 (x) = − · (x − 1)−5/3 .
3 3
Die zweite Ableitung von f ist für x < 1 positiv, der Graph von f in diesem Bereich also nach
links gekrümmt (konvex). Für x > 1 ist die zweite Ableitung negativ, der Graph in diesem
Bereich also nach rechts gekrümmt (konkav).
59
Kapitel II. Differentialrechnung
(y)
f
Fig. 1 :
Die Graphen der ersten drei
Ableitungen von f
f 00
f0
f 000
(x)
2
(y)
1
(x − 1)1/3
Fig. 2 :
Der Graph der Funktion
(x)
-2
-1
1
-1
-2
2
3
4
f : x → (x − 1)1/3
60
U. Stammbach:
Analysis, Teil A
2
Beispiel Es sei f : x → e−x /2 . Der Graph dieser Funktion heisst Gauss’sche Fehlerkurve
(siehe Figur 3). Diese spielt in der Wahrscheinlichkeitsrechnung und Statistik im Zusammenhang
mit der sogenannten Normalverteilung eine grosse Rolle. Offenbar ist die Funktion f auf der
ganzen reellen Zahlgeraden definiert. Da der Exponent von e für alle von Null verschiedenen
x negativ ist, ist der Wertebereich der Funktion f das Intervall (0, 1]. Klar ist auch, dass die
Funktion gerade ist, da x nur im Quadrat vorkommt. Wir dürfen uns deshalb bei der Diskussion
auf den Bereich x ≥ 0 beschränken. Für x → ∞ strebt f (x) gegen 0, so dass die x-Achse eine
Asymptote für x → ∞ ist. Die Ableitung von f ist die Funktion
f 0 : x → −x · e−x
2 /2
.
(y)
1
0.8
e−
x2
2
Fig. 3 :
Die Gauss’sche Fehlerkurve
0.6
0.4
0.2
-2
-1
1
2
(x)
-0.2
Man liest daran ab, dass für x > 0 der Graph von f monoton fallend ist und dass er an der
Stelle x = 0 eine horizontale Tangente aufweist. Die zweite Ableitung ist
f 00 : x → (x2 − 1) · e−x
2 /2
.
Im Bereich 0 ≤ x < 1 ist diese negativ, der Graph von f also nach rechts gekrümmt; im Bereich
1 < x < ∞ ist sie positiv, der Graph also nach links gekrümmt. An der Stelle x = 1 wechselt die
61
Kapitel II. Differentialrechnung
(y)
1
f : x → e−
x2
2
0.5
Fig. 4 :
Die ersten zwei Ableitungen von
-2
-1
1
2
(x)
f : x → e−x
2 /2
-0.5
f 0 : x → −xe−
f 00 : x → (x2 − 1)e−
x2
2
x2
2
-1
zweite Ableitung ihr Vorzeichen, der Graph von f weist demzufolge im Punkt (1, e−1/2 ) einen
Wendepunkt auf (siehe Figur 4).
Das Newton’sche Gesetz der Mechanik
Kraft = Masse × Beschleunigung
verknüpft die Beschleunigung eines Massenpunktes m mit der auf diesen wirkenden Kraft K.
Da die Beschleunigung die zweite Ableitung der Wegfunktion ist, ist das zweite Newton’sche
Gesetz vom mathematischen Standpunkt aus nichts anderes als eine Differentialgleichung für
die Wegfunktion t → s(t), in welcher die zweite Ableitung s̈(t) vorkommt
m · s̈(t) = K.
Dabei hängt die Kraft möglicherweise von s und t ab. Wir werden uns im 2. Semester eingehend mit solchen Differentialgleichungen beschäftigen, wollen aber an dieser Stelle über eine
spezielle Differentialgleichung dieser Art schon einige Bemerkungen einfügen, nämlich über die
Differentialgleichung der harmonischen Schwingung.
62
U. Stammbach:
Analysis, Teil A
Der Massenpunkt m sei an einer (idealen) Feder aufgehängt, so dass auf m eine zur Auslenkung
s(t) aus der Ruhelage proportionale Rückstellkraft wirkt. Aus dem Newton’schen Gesetz ergibt
sich dann die Differentialgleichung
ms̈(t) = −k s(t) , k > 0
oder anders geschrieben
(7.1)
s̈(t) + ω 2 s(t) = 0 ,
wobei wir ω 2 = k/m gesetzt haben. Das ist die Differentialgleichung der harmonischen
Schwingung. Durch Einsetzen verifiziert man ohne Schwierigkeit, dass jede Funktion der Form
(7.2)
s(t) = B cos(ωt) + C sin(ωt), B, C ∈ R
die Differentialgleichung (7.1) erfüllt und deshalb eine Lösung dieser Gleichung ist. Ebenso leicht
verifiziert man, dass jede Funktion der Form
(7.3)
s(t) = A cos(ωt + ϕ), A, ϕ ∈ R
die Differentialgleichung (7.1) erfüllt. Wir behaupten, dass es sich bei (7.2) und (7.3) um zwei
verschiedene Schreibweisen für dieselben Funktionen handelt. (Dass wir damit wirklich alle
Lösungen der Differentialgleichung (7.1) beschreiben, werden wir im 2. Semester sehen.)
Wenden wir auf (7.3) die bekannte Summenformel für den Cosinus an, so erhalten wir
s(t) = A cos ϕ cos(ωt) − A sin ϕ sin(ωt) .
Setzt man also B = A cos ϕ, C = −A sin ϕ, so erhält man eine Funktion der Form (7.2). Geht
man umgekehrt von der Funktion
s(t) = B cos(ωt) + C sin(ωt)
√
aus und definiert man A = B 2 + C 2 und tan ϕ = −C/B, so erhält man eine Funktion der Form
(7.3). Man nennt (7.2) die zweiteilige und (7.3) die einteilige Schreibweise der harmonischen
Schwingung.
In der Praxis spielen sogenannte gedämpfte harmonische Schwingungen eine grosse Rolle. Etwas
ungenau, aber einprägsam, kann man diese als harmonische Schwingung beschreiben, deren
63
Kapitel II. Differentialrechnung
Amplitude exponentiell abklingt (siehe Figur 5). Eine gedämpfte harmonische Schwingung ist
von der Form
t → e−at cos(ωt + ϕ), a > 0.
Wie wir später sehen werden, führt ein an einer Feder aufgehängter Massenpunkt eine gedämpfte
Schwingung aus, wenn auf ihn neben der Rückstellkraft eine Dämpfungskraft wirkt, die zur Geschwindigkeit proportional ist.
t
e− 3
Fig. 5 :
Zum Verlauf der gedämpften
harmonischen Schwingung
(t)
t
t → e− 3 cos(t +
π
)
4
t
−e− 3
Beispiel Um uns (qualitativ) über den Verlauf einer gedämpften harmonischen Schwingung
ein Bild zu machen, betrachten wir die Funktion
f : t → e−t sin t
etwas näher, d.h. wir setzen a = 1, ω = 1, ϕ = −π/2 (siehe Figur 6). Die erste und zweite
Ableitung von f ergibt sich nach kurzer Rechnung zu
f 0 : t → e−t · (− sin t + cos t) ,
f 00 : t → 2e−t · (− cos t) .
64
U. Stammbach:
Analysis, Teil A
Fig. 6 :
Der Graph der Funktion
f : t → e−t sin t
e−t sin t
e−t
(t)
−e−t
Die Lösung der Gleichung f (t) = 0 liefert die Nullstellen: t = kπ, k = 0, ±1, ±2, . . .. Die Lösung
der Gleichung f 0 (t) = 0 liefert die Stellen, wo der Graph horizontale Tangenten aufweist. Man
erhält
cos t = sin t
tan t = 1
t = π/4 + kπ, k = 0, ±1, ±2, . . . .
Und schliesslich liefert die Gleichung f 00 (t) = 0 die Wendestellen des Graphen von f . Man erhält
t = π/2 + kπ, k = 0, ±1, ±2, . . .. Wegen | sin t| ≤ 1 oszilliert der Graph von f zwischen den
beiden Kurven y = e−t und y = −e−t . Ist sin t = 1, so berührt der Graph von f die erste
dieser Kurven, ist sin t = −1 so berührt der Graph die zweite der beiden Kurven. Die t-Werte,
die zu diesen Berührstellen gehören, sind t = π/2 + kπ, k = 0, ±1, ±2, . . .. Man liest daran
die etwas überraschende Tatsache ab, dass die Berührstellen gerade mit den Wendepunkten
übereinstimmen.
Kapitel II. Differentialrechnung
8
65
Ebene Kurven
Ebene Kurven können auf viele verschiedene Arten beschrieben werden. Wir arbeiten in dieser
Vorlesung vor allem mit den folgenden.
I. Parameterdarstellung
Eine Parameterdarstellung der Kurve K besteht darin, dass für jeden Wert des Parameters t
ein zugehöriger Punkt (x(t), y(t)) der Kurve K festgelegt wird. Es ist also eine Funktion
t → ~r(t) = (x(t), y(t)), t ∈ [b1 , b2 ]
gegeben, wobei ~r(t) als Ortsvektor aufzufassen ist. Man kann diese Funktion als Abbildung des
Parameterintervalles [b1 , b2 ] in die Ebene auffassen.
Beispiel
Kreis mit Radius a um den Punkt P = (x0 , y0 )
t → (x0 + a cos t, y0 + a sin t), 0 ≤ t < 2π .
Eine ebene Bewegung eines Massenpunktes wird auf natürlichste Art mit Hilfe einer Parameterdarstellung mit der Zeit als Parameter beschrieben.
Eliminiert man aus der Parameterdarstellung einer Kurve den Parameter t, so gelangt man zur
impliziten Darstellung.
II. Implizite Darstellung
Die Kurve K ist beschrieben als Menge der Punkte (x, y), deren Koordinaten die Gleichung
F (x, y) = 0 erfüllen.
Beispiel Kreis mit Radius a um P
(x − x0 )2 + (y − y0 )2 − a2 = 0 .
Löst man die Gleichung F (x, y) = 0 nach y auf, so erhält man eine explizite Darstellung der
Kurve K.
III. Explizite Darstellung
Die Kurve K ist als Graph einer Funktion x → y(x) gegeben.
Beispiel Kreis mit Radius a um P
66
U. Stammbach:
Analysis, Teil A
q
f1 : x → y = + a2 − (x − x0 )2 + y0 , D(f1 ) = [x0 − a, x0 + a] ,
q
f2 : x → y = − a2 − (x − x0 )2 + y0 , D(f2 ) = [x0 − a, x0 + a] .
Man beachte, dass in diesem Beispiel zwei(!) Funktionen notwendig sind, um den vollen Kreis
zu beschreiben (siehe Figur 1).
5
(y)
4
Fig. 1 :
Kreis
3
a
2
P = (x0 , y0 )
t
1
(x)
1
2
3
5
4
6
-1
Beispiel Ellipse mit Halbachsen a und b und Mittelpunkt im Ursprung (siehe Figur 2).
Parameterdarstellung:
t → ~r(t) = (a cos t, b sin t), 0 ≤ t < 2π .
Implizite Darstellung:
x2 y 2
+ 2 =1.
a2
b
Explizite Darstellung:
s
f1 : x → y = +b 1 −
s
f2 : x → y = −b 1 −
x2
, D(f1 ) = [−a, +a] ,
a2
x2
, D(f2 ) = [−a, +a] .
a2
67
Kapitel II. Differentialrechnung
(y)
a
b
Fig. 2 :
Ellipse
(x)
t
x2 y 2
+ 2 =1
a2
b
(y)
y=
b
x
a
Fig. 3 :
Hyperbel
a
(x)
x2 y 2
− 2 =1
a2
b
68
U. Stammbach:
Analysis, Teil A
Beispiel Hyperbel mit Mittelpunkt im Ursprung (siehe Figur 3).
Parameterdarstellung (rechter Ast):
t → ~r(t) = (a cosh t, b sinh t), −∞ < t < ∞ .
Implizite Darstellung (beide(!) Äste):
x2 y 2
− 2 =1.
a2
b
Explizite Darstellung:
s
f1 : x → y = +b
s
f2 : x → y = −b
x2
− 1,
a2
D(f1 ) = (−∞, −a] ∪ [a, ∞) ,
x2
− 1,
a2
D(f2 ) = (−∞, −a] ∪ [a, ∞) .
Aus der expliziten Darstellung kann man unmittelbar ablesen, dass die beiden Geraden
b
y=± x
a
für x → ±∞ Asymptoten der Hyperbel sind.
Bemerkungen Eine Kurve lässt unendlich viele verschiedene Parameterdarstellungen zu; sie
kann nämlich mit “verschiedenen Geschwindigkeiten” durchlaufen werden. Eine Parameterdarstellung einer Kurve enthält neben der Information über die geometrische Gestalt der Kurve
noch weitere Informationen.
Die Elimination des Parameters aus der Parameterdarstellung ist nicht in jedem Fall möglich,
d.h. der Übergang zur impliziten Form lässt sich nicht immer durchführen.
Die Auflösung nach y der Gleichung der impliziten Darstellung ist nicht immer möglich; ferner
werden in vielen Fällen mehrere Funktionen benötigt, um eine Kurve darzustellen. (Von mathematischer Seite ist hier anzumerken, dass sich eine Kurve wenigstens lokal fast immer in expliziter
Form darstellen lässt. Es gilt nämlich der Satz über implizite Funktionen: Es sei (x0 , y0 ) ein
Punkt der durch F (x, y) = 0 gegebenen Kurve K. Ist die Ableitung von F (x, y) nach y in
(x0 , y0 ) nicht trivial, so gibt es ein Intervall I mit Mittelpunkt x0 und eine Funktion f : x →
f (x), D(f ) = I mit F (x, f (x)) = 0 für alle x ∈ I, d.h. x → f (x) stellt die Kurve in der
Umgebung von (x0 , y0 ) dar. Selbstverständlich gehen wir in dieser Vorlesung nicht auf den
Beweis dieses Satzes ein; anschaulich ist das Resultat “klar”, wie ein Blick auf eine entsprechende
Figur zeigt.)
69
Kapitel II. Differentialrechnung
Eine explizite Darstellung kann immer auch als Parameterdarstellung aufgefasst werden, indem
man t = x als Parameter wählt:
t → ~r(t) = (t, f (t)), t ∈ D(f ) .
Damit ist der Kreis I → II → III → I geschlossen.
Wir werden in der Folge bei Kurven im allgemeinen von einer Parameterdarstellung ausgehen,
so dass sich jetzt die Frage stellt, wie man an der Parameterdarstellung direkt Eigenschaften
der Kurven ablesen kann. Dabei werden für uns die Begriffe Tangente, Normale, Krümmung,
Krümmungskreis im Vordergrund stehen. Kraft der letzten der obigen Bemerkungen ist in den
hergeleiteten Formeln immer auch der Spezialfall der expliziten Darstellung der Kurve enthalten.
Die Kurve K sei durch die Parameterdarstellung ~r(t) = (x(t), y(t)) gegeben. Um die Tangentenrichtung im Punkte P zu erhalten, betrachten wir den Vektor
P~Q
~r(t + ∆t) − ~r(t)
=
∆t
∆t
und lassen Q gegen P , d.h. ∆t gegen 0 streben. Definitionsgemäss erhalten wir im Limes
~r(t + ∆t) − ~r(t)
∆→0
∆t
x(t + ∆t) − x(t)
y(t + ∆t) − y(t)
=
lim
, lim
∆→0
∆→0
∆t
∆t
~r˙ =
lim
= (ẋ(t), ẏ(t)),
wobei wir, wie üblich, die Ableitung nach t mit einem Punkt bezeichnet haben. Wir halten
fest: Der Vektor ~r˙ = (ẋ(t), ẏ(t)) ist ein Tangentialvektor an die Kurve im Punkte P . Die
Tangentensteigung im Punkt P ist somit gegeben durch ẏ(t)/ẋ(t).
Beschreibt ~r(t) = (x(t), y(t)) die Bewegung eines Massenpunktes, wobei t die Zeit bedeutet, so
ist ~r˙ , dessen (vektorielle) Geschwindigkeit zur Zeit t.
Die Tangente an die Kurve im Punkt P hat offenbar die Parameterdarstellung
~ = ~r(t) + s ~r˙ (t), −∞ < s < +∞ .
OR
Der Vektor ~n(t) = (−ẏ(t), ẋ(t)) entsteht aus ~r˙ = (ẋ(t), ẏ(t)) durch Drehung um π/2 im Gegenuhrzeigersinn. Die Normale zur Kurve in P hat deshalb die Parameterdarstellung
~ = ~r(t) + s ~n(t), −∞ < s < +∞ .
OS
70
U. Stammbach:
Analysis, Teil A
Beispiel Zykloide (siehe Figur 4). Ein Kreis mit Radius a rolle auf der x-Achse. Der Punkt
der Kreisperipherie, welcher sich zu Anfang im Ursprung des Koordinatensystems befindet,
beschreibt bei der Rollbewegung eine Zykloide. Wählen wir als Parameter den Drehwinkel t des
Kreises, so liest man aus der Figur leicht die Parameterdarstellung
t → (at − a sin t, a − a cos t), −∞ < t < +∞
(y)
Fig. 4 :
Zykloide
t
a
(x)
2πa
für die Zykloide ab. Ein fest mit der Kreisscheibe verbundener Punkt im Abstand b vom Mittelpunkt des Kreises beschreibt für b < a eine sogenannte verkürzte Zykloide bzw. für b > a eine
verlängerte Zykloide (siehe Figur 5). Die Parameterdarstellung lautet
t → (at − b sin t, a − b cos t), −∞ < t < +∞ .
Beispiel
Die Kurve K sei gegeben durch die Parameterdarstellung
t → (cos t, sin 2t), 0 ≤ t < 2π .
Für die Steigung der Kurve erhält man ẏ/ẋ = −2 cos 2t/ sin t. Die Kurve
besitzt also für
√
die Parameterwerte t = π/4, 3π/4, 5π/4, 7π/4, d.h. in den Punkten (± 2/2, ±1) horizontale
71
Kapitel II. Differentialrechnung
(y)
Fig. 5 :
Verkürzte und verlängerte
Zykloide
(x)
2πa
Tangenten, und für die Parameterwerte t = 0, π, d.h. in den Punkten (±1, 0) vertikale Tangenten.
Schliesslich geht die Kurve für t = π/2, 3π/2 durch den Nullpunkt des Koordinatensystems. Die
Steigung beträgt 2 für t = π/2 und −2 für t = 3π/2. Wegen ihrer Form heisst die Kurve auch
etwa Zwiebelkurve (siehe Figur 6).
Als nächstes wenden wir uns der Krümmung und dem Krümmungskreis einer Kurve zu.
Die Krümmung k einer Kurve K ist die Schnelligkeit, mit der sich die Richtung der Tangente
an die Kurve ändert, wenn diese mit Geschwindigkeit 1 durchlaufen wird.
Um dies zu präzisieren, müssen wir auf der Kurve Längen messen können, d.h. wir müssen den
Begriff der Bogenlänge kennen. Dieser dürfte aus der Schule bereits bekannt sein, ausserdem
werden wir bei der Integralrechnung noch einmal darauf zurückkommen. Was wir hier benötigen
ist die Formel für das sogenannte Bogenelement: wie man aus einer entsprechenden Figur abliest,
ist das Differential der Bogenlänge gegeben durch
ds =
q
(dx)2 + (dy)2 =
q
ẋ2 (t) + ẏ 2 (t) dt .
Bezeichnet s(t) die von einem festen Punkt bis zu (x(t), y(t)) gemessene Bogenlänge, so gilt also
ds q 2
= ẋ (t) + ẏ 2 (t) .
dt
72
U. Stammbach:
1
Analysis, Teil A
(y)
0.5
Fig. 6 :
Zwiebelkurve
(x)
-1
-0.5
0.5
1
-0.5
-1
Nach obigem ist die Krümmung k definiert als Ableitung des Steigungswinkels α nach der
Bogenlänge s
k=
dα
.
ds
Nach der Kettenregel und nach der Formel für die Ableitung der inversen Funktion gilt nun
dα
dα dt
dα/dt
=
=
.
ds
dt ds
ds/dt
Damit genügt es, dα/dt zu bestimmen. Da tan α gerade die Steigung der Kurve ist, gilt
(
α=
arctan(ẏ/ẋ),
für
arctan(ẏ/ẋ) + π, für
−π/2 < α < π/2 ,
π/2 < α < 3π/2 .
Daraus folgt
dα
ÿ ẋ − ẏẍ
ÿẋ − ẏẍ
1
·
= 2
.
=
2
2
dt
1 + (ẏ/ẋ)
ẋ
ẋ + ẏ 2
Für die Krümmung k der Kurve K ergibt sich daraus die Formel
73
Kapitel II. Differentialrechnung
k = k(t) =
ÿ ẋ − ẏẍ
.
(ẋ2 + ẏ 2 )3/2
Zusätzlich halten wir fest:
k > 0 ⇔ α nimmt zu
⇔ die Kurve ist nach links gekrümmt ,
k < 0 ⇔ α nimmt ab
⇔ die Kurve ist nach rechts gekrümmt .
In Punkten, wo k das Vorzeichen ändert, liegt ein Wendepunkt der Kurve vor.
Beispiel Gegeben ist die Ellipse
t → (a cos t, b sin t) , 0 ≤ t < 2π .
Wir erhalten
ẋ = −a sin t, ẍ = −a cos t,
ẏ = +b cos t,
ÿ = −b sin t,
und damit
k(t) =
(a2 sin2 t
ab
.
+ b2 cos2 t)3/2
Insbesondere gilt für den Kreis (a = b = r)
k(t) = 1/r .
Kehren wir zur Ellipse zurück und betrachten wir die beiden Scheitel t = 0, t = π/2, so liefert
die Formel für die Krümmung in diesen beiden Punkten
k(0) =
a
b
, k(π/2) = 2 .
b2
a
Zeichnen wir Kreise mit Radien 1/k(0) bzw. 1/k(π/2), welche die Ellipse in den entsprechenden
Scheitelpunkten berühren, so haben diese im Berührpunkt mit der Ellipse sowohl die Tangente
wie die Krümmung gemeinsam. Es sind dies die Krümmungskreise der Ellipse in den Scheitelpunkten (siehe Figur 7).
Der Krümmungskreis einer Kurve K im Punkte P ist definitionsgemäss derjenige Kreis, der
in P die gleiche Tangentensteigung und die gleiche Krümmung wie die Kurve K hat. Es ist also
der Kreis, welcher die Kurve im Punkte P am besten approximiert.
74
U. Stammbach:
Analysis, Teil A
Fig. 7 :
Die Krümmungskreise an den
Scheitelpunkten der Ellipse
Nach obigem ist der Radius des Krümmungskreises |1/k|. Sein Mittelpunkt liegt auf der Normalen zur Kurve K im Punkte P und zwar links der Kurve, falls k positiv und rechts der Kurve,
falls k negativ ist. Der nach links zeigende Normaleneinheitsvektor m(t)
~
zu K in P ist
(−ẏ(t), ẋ(t))
m(t)
~
=p 2
.
ẋ (t) + ẏ 2 (t)
Der Mittelpunkt M0 des Krümmungskreises, der Kümmungsmittelpunkt ist somit gegeben durch
~ 0 = ~r(t) + 1 m(t)
OM
~
.
k(t)
Durchläuft man die Kurve K, so beschreibt der Krümmungsmittelpunkt M0 eine Kurve K 0 .
Diese heisst Evolute von K.
Beispiel
Die Zykloide
t → ~r(t) = (at − a sin t, a − a cos t)
besitzt nach unserer Formel die Krümmung
75
Kapitel II. Differentialrechnung
k(t) =
−1
.
2a 2(1 − cos t)
p
Für den Normaleneinheitsvektor m
~ erhält man
m(t)
~
=
− sin t
1 − cos t
p
,p
2(1 − cos t)
2(1 − cos t)
!
.
Einsetzen in die Parameterdarstellung der Evolute liefert
~ 0 = (at + a sin t, −a + a cos t) .
OM
Setzt man t = t0 − π, so erhält man
~ 0 = (at0 − aπ − a sin t0 , −a − a cos t0 )
OM
= (−aπ + (at0 − a sin t0 ), −2a + (a − a cos t0 )) .
Führt man nun neue Koordinaten ξ = x + aπ, η = y + 2a ein, so beschreibt diese Formel eine
Zykloide im (ξ, η)-Koordinatensystem.
Beispiel Gegeben sei die Parabel y = x2 . Wir fassen die explizite Darstellung als Parameterdarstellung
t → ~r(t) = (t, t2 ), t ∈ R
auf. Die Krümmung k ergibt sich daraus zu
k(t) =
2
(1 + 4t2 )3/2
und für den Normaleneinheitsvektor m
~ erhält man
m(t)
~
=
1
· (−2t, 1) ,
(1 + 4t2 )1/2
so dass die Parameterdarstellung der Evolute
~ 0 = (−4t3 , 1/2 + 3t2 ), t ∈ R ,
OM
lautet. In diesem Fall lässt sich sogar der Parameter leicht eliminieren und man kann zur
expliziten Darstellung übergehen. Die Evolute der Parabel ist der Graph der Funktion
76
U. Stammbach:
x→
2/3
x
1
+3
2
4
Analysis, Teil A
.
Daraus ergibt sich ohne weiteres auch das geometrische Bild (siehe Figur 8).
(y)
2
x 2/3
1
+3
2
4
1.5
Fig. 8 :
Evolute der Parabel
1
x2
0.5
(x)
-1.5
-1
-0.5
0.5
1
1.5
Schliesslich beschäftigen wir uns noch kurz mit Kurven, die durch Gleichungen in Polarkoordinaten gegeben sind. Ist ρ = f (ϕ) eine solche Gleichung, so gehört ein Punkt zur Kurve
K, wenn seine Polarkoordinaten (ρ, ϕ) die Gleichung erfüllen. Eine solche Darstellung gibt in
offensichtlicher Weise Anlass zu einer Parameterdarstellung von K mit Parameter ϕ
ϕ → ~r(ϕ) = (f (ϕ) cos ϕ, f (ϕ) sin ϕ) ,
so dass man auf dem Umweg über diese Parameterdarstellung Informationen über die Kurve
erhalten kann.
Beispiel Die logarithmische oder Bernoulli’sche Spirale (Jakob Bernoulli 1654 - 1705) ist
gegeben durch die Gleichung
ρ = C · ekϕ , C, k > 0
77
Kapitel II. Differentialrechnung
in Polarkoordinaten (siehe Figur 9). Wir gehen über zur Parameterdarstellung
ϕ → ~r(ϕ) = (C · ekϕ cos ϕ, C · ekϕ sin ϕ) .
Die Tangentenrichtung der Kurve ergibt sich durch Ableitung nach ϕ
~r˙ (ϕ) = (Ckekϕ cos ϕ − C · ekϕ sin ϕ, Ckekϕ sin ϕ + C · ekϕ cos ϕ) .
Die Kurve hat also vertikale Tangenten für k cos ϕ − sin ϕ = 0, d.h. für tan ϕ = k, und horizontale Tangenten für k sin ϕ + cos ϕ = 0 d.h. für tan ϕ = −1/k. Man stellt die überraschende Tatsache fest, dass die beiden Richtungen, in denen vertikale bzw. horizontale Tangenten auftreten,
senkrecht aufeinander stehen (siehe Figur 10).
(y)
3
Fig. 9 :
Bernoullispirale
2
1
(x)
-2
-1
1
2
3
-1
~ und dem
Ist P ein Punkt der Kurve K, so wollen wir den Winkel ω zwischen dem Vektor OP
~ hat offenbar
Tangentialvektor an die Kurve in P bestimmen (siehe Figur 11). Der Vektor OP
die Richtung ~e = (cos ϕ, sin ϕ), so dass wir erhalten
cos ω =
~r˙ · ~e
k
.
= 2
˙
(k + 1)1/2
|~r|
78
U. Stammbach:
Analysis, Teil A
(y)
Fig. 10 :
Tangenten an Bernoullispirale
(x)
(y)
Fig. 11 :
Winkel zwischen Fahrstrahl und
Tangente
~r˙
ω
~e
(x)
79
Kapitel II. Differentialrechnung
3
(y)
2.5
2
Fig. 12 :
Evolute der Bernoullispirale
1.5
1
0.5
(x)
-1
-0.5
0.5
1
1.5
2
2.5
3
-0.5
-1
Insbesondere zeigt es sich, dass ω von ϕ unabhängig ist! Diese – wie wir später sehen werden
– charakteristische Eigenschaft der logarithmischen Spirale findet in der Technik häufig Anwendung: die Formgebung von Radialturbinenschaufeln, damit der Dampf- oder Wasserstrahl
überall im selben Winkel auftritt; die Formgebung eines Fräsers, damit der Schnittwinkel beim
Nachschleifen konstant bleibt. Auch in ganz anderem Zusammenhang tritt sie wegen dieser
Eigenschaft auf: in der Bodenphysik spielt sie bei gewissen Modellvorstellungen für Stabilitätsbetrachtungen von Erdlinsen eine Rolle; für viele Motten, die in ihrem Flug einen festen
Winkel zum Lichtschimmer einer Kerze einhalten, ist die logarithmische Spirale zum Verderben
geworden.
Zum Schluss dieses Abschnittes wenden wir uns noch der Evolute der logarithmischen Spiralen
zu, wobei wir der Einfachheit halber den Spezialfall C = 1 = k betrachten. Wir gehen aus von
der Parameterdarstellung
ϕ → ~r(ϕ) = (eϕ cos ϕ, eϕ sin ϕ), ϕ ∈ R ,
und erhalten den zu ϕ gehörigen Evolutenpunkt M0 durch Einsetzen in die entsprechende Formel:
~ 0 = (ξ(ϕ), η(ϕ)) = (−eϕ sin ϕ, eϕ cos ϕ) .
OM
Wiederum stellen wir eine überraschende Tatsache fest: Die Evolute ist nichts anderes als die
um π/2 um den Ursprung des Koordinatensystems gedrehte Ausgangskurve (siehe Figur 12).
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel III. Integralrechnung
Mathematics is not a spectator sport!
Mathematics is learned by doing, not by watching!
Eleanor G. Palais
Inhaltsverzeichnis
1
Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . .
7
3
Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
4
Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . .
15
5
Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
6
Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
7
Flächenberechnung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
8
Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
9
Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
10
Oberflächenberechnung
49
11
Schwerpunkt, Flächenmittelpunkt
12
Trägheitsmoment
13
Uneigentliche Integrale
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
54
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
3
Kapitel III. Integralrechnung
1
Das bestimmte Integral
Obwohl die folgenden Begriffsbildungen auch in einem allgemeineren Rahmen möglich sind,
setzen wir im ganzen Kapitel voraus, dass alle betrachteten Funktionen stetig sind. Dies macht
die Darstellung besonders einfach.
Definition (B. Riemann 1826-1866) Gegeben sei eine Funktion f : x → f (x) und ein im
Definitionsbereich von f liegendes Intervall [a, b].
y = f (x)
Fig. 1 :
Riemann’sches Integral
f (ξ1 )
x0 = a
ξ1
f (ξ2 )
x1
ξ2
f (ξ3 )
x2
ξ3
f (ξ4 )
x3
ξ4
x4 = b
(a) Wähle eine Einteilung von [a, b] durch endlich viele Punkte
a = x0 < x1 < · · · < xn−1 < xn = b
in Teilintervalle.
(b) Wähle für k = 1, 2, . . . , n Zwischenpunkte ξk mit xk−1 ≤ ξk ≤ xk . Die Feinheit der
Einteilung ist definiert durch maxk=1,2,...,n |xk − xk−1 |.
4
U. Stammbach:
Analysis, Teil A
(c) Der gewählten Einteilung von [a, b] mit Zwischenpunkten ξk wird die Riemann’sche Summe
f (ξ1 )∆x1 + f (ξ2 )∆x2 + · · · + f (ξn )∆xn =
n
X
f (ξk )∆xk
k=1
zugeordnet, wobei wir ∆xk = xk − xk−1 gesetzt haben.
(d) Definiere das Riemann’sche Integral durch
Z
b
a
f (x)dx = lim
n
X
f (ξk )∆xk .
k=1
Dabei ist für den Grenzübergang eine Folge von Einteilungen zugrunde zu legen, deren
Feinheit gegen Null strebt.
In diesem Symbol heisst f (x) der Integrand, die Grösse a die untere und b die obere (Integrations-)
Grenze.
Es gilt nun das folgende grundlegende Resultat, welches wir ohne Beweis angeben:
Für eine stetige Funktion f existiert der Limes in (d) immer, und sein Wert ist unabhängig von
der Wahl der Folge der Einteilungen und der Zwischenpunkte.
Es ist nach dieser Definition anschaulich klar, dass das Riemann’sche Integral den Inhalt der
Fläche zwischen dem Graphen der Funktion und der x-Achse beschreibt, und zwar werden die
Flächenanteile oberhalb der x-Achse positiv, die Anteile unterhalb der x-Achse negativ gezählt.
Beispiel Es sei f (x) = C > 0. Dann folgt
Z
b
a
Cdx = C(b − a) .
In diesem Fall ist das Integral gerade die Fläche des Rechtecks.
Beispiel Es sei f : x −→ x2 . Dann ist
Z
0
b
x2 dx
der Inhalt der Fläche unter der Parabel y = x2 zwischen den x-Werten 0 und b. Lange vor
Erfindung der Integralrechnung wurde dieser Flächeninhalt mit anderen Methoden von Archimedes (287-212 v.Chr.) bestimmt. Hier benützen wir natürlich die oben gegebene Definition des
bestimmten Integrals. Da der Wert des Riemann’schen Integrales von der gewählten Einteilung
und den gewählten Zwischenpunkten unabhängig ist, dürfen wir
x0 = 0, x1 =
1
2
n
b, x2 = b, . . . , xn = b = b
n
n
n
5
Kapitel III. Integralrechnung
ξk = xk , k = 1, . . . , n
setzen (siehe Figur 2). Wir erhalten dann
Z
0
b
x2 dx =
=
=
lim (f (x1 )∆x1 + f (x2 )∆x2 + · · · + f (xn )∆xn )
n→∞
lim
n→∞
1
b
n
2
+
2
b
n
2
+ ··· +
lim (12 + 22 + · · · + n2 )
n→∞
n
b
n
2 !
·
b
n
b3
.
n3
y = x2
Fig. 2 :
Parabelfläche
x0
x1
x2
x3
x4
x5 = b
Nun gilt 12 + 22 + · · · + n2 = 16 n(n + 1)(2n + 1), wie man leicht mit vollständiger Induktion nach
n beweisen kann, und damit folgt
Z
0
b
x2 dx =
n (n + 1) (2n + 1)
b3
b3
lim
=
.
6 n→∞ n n
n
3
Laut Definition des Riemann’schen Integrals gelten gewisse offensichtliche Rechenregeln, von
denen wir die folgenden explizit erwähnen:
6
U. Stammbach:
Analysis, Teil A
• Das bestimmte Integral ist eine lineare Operation. Es gilt
Z
b
a
(f (x) + g(x))dx =
Z
b
a
Cf (x)dx = C
Z
b
a
Z
b
a
f (x)dx +
Z
b
a
g(x)dx
f (x)dx , C ∈ R .
• Ist a > b, so kehren sich die Vorzeichen der ∆xk um. Damit folgt
Z
b
a
f (x)dx = −
Z
b
a
f (x)dx
und daraus ergibt sich insbesondere
Z
a
f (x)dx = 0 .
a
• Hat man die zwei Intervalle [a, b] und [b, c] vor sich, so liefern Einteilungen davon zusammen
genommen eine Einteilung des Intervalles [a, c]. Folglich gilt
Z
b
a
f (x)dx +
Z
b
c
f (x)dx =
Z
c
a
f (x)dx .
• Der Wert des bestimmten Integrales ist unabhängig vom Namen der Integrationsvariablen; es
gilt
Z
b
a
f (x)dx =
Z
b
a
f (t)dt = . . .
Die Integrationsvariable übernimmt nur die Rolle einer Hilfsgrösse für die Rechnung.
7
Kapitel III. Integralrechnung
2
Der Hauptsatz der Infinitesimalrechnung
Unser nächstes Ziel ist es, den sogenannten Hauptsatz der Infinitesimalrechnung herzuleiten,
welcher auf völlig überraschende Weise das bestimmte Integral mit der Differentialrechnung
verbindet. Dazu brauchen wir einige Vorbereitungen.
Es sei m das globale Minimum und M das globale Maximum der Funktion f auf dem Intervall
[a, b]. Dann gilt auf den Intervall [a, b]
m ≤ f (x) ≤ M ,
M
Fig. 1 :
Mittelwertsatz der
Integralrechnung
m
f (ξ)
a
ξ
b
und man erhält
m(b − a) =
Z
b
a
m dx ≤
Z
b
a
f (x) dx ≤
Z
b
a
M dx = M (b − a)
8
U. Stammbach:
Rb
a
m≤
Analysis, Teil A
f (x) dx
≤M .
b−a
Da eine stetige Funktion nach dem Zwischenwertsatz (siehe Kapitel I, Abschnitt 4) jeden Wert
zwischen m und M mindestens einmal annimmt, folgt aus dieser Überlegung das folgende Resultat.
Mittelwertsatz der Integralrechnung Es existiert ξ in [a, b] mit
(b − a)f (ξ) =
Beispiel
Z
b
a
f (x) dx .
In konkreten Fällen lässt sich ein solches ξ explizit angeben. Aus
Z
0
b
x2 dx =
b3
3
folgt zum Beispiel
f (ξ) = ξ 2 =
b3
b2
=
,
3b
3
√
so dass sich ξ = b 3/3 ergibt.
Mit Hilfe des Mittelwertsatzes der Integralrechnung leiten wir jetzt den Hauptsatz der Infinitesimalrechnung her. Zu diesem Zweck betrachten wir eine auf dem Intervall [a, b] stetige Funktion
f : x → f (x) und definieren eine Funktion Fa durch die Vorschrift
Fa : x →
Dann gilt (siehe Figur 2)
Z
x
a
f (t) dt, D(Fa ) = [a, b].
9
Kapitel III. Integralrechnung
Fig. 2 :
Hauptsatz der
Infinitesimalrechnung
a
x
dFa
(x) =
dx
ξ
x+h
Fa (x + h) − Fa (x)
h→0
h
!
Z x
Z x+h
1
= lim
f (t) dt −
f (t) dt
h→0 h
a
a
lim
1
= lim
h→0 h
Z
x+h
x
f (t) dt .
Nach dem Mittelwertsatz der Integralrechnung existiert nun ein ξ zwischen x und x + h mit der
Eigenschaft
1
h
Z
x+h
x
f (t) dt = f (ξ) .
Damit erhalten wir
dFa
(x) = lim f (ξ) = lim f (ξ) = f (x) ,
h→0
ξ→x
dx
10
U. Stammbach:
Analysis, Teil A
weil mit h → 0 die Grösse ξ gegen x strebt und weil f stetig ist. Damit haben wir die folgende
Aussage erhalten.
Hauptsatz der Infinitesimalrechnung (I. Newton 1642 - 1727, G.F. Leibniz 1646-1716)
Die Ableitung eines bestimmten Integrals über eine stetige Funktion f nach der oberen Integrationsgrenze ist gleich dem Wert des Integranden an dieser Grenze:
d
dx
Z
x
a
f (t)dt = f (x) .
Eine Funktion F : x → F (x) mit F 0 (x) = f (x) heisst eine Stammfunktion von f : x → f (x).
Laut dem Hauptsatz der Infinitesimalrechnung existiert zu einer stetigen Funktion f : x → f (x)
immer (mindestens) eine Stammfunktion nämlich
Fa : x →
Z
x
a
f (t) dt .
• Ist F : x → F (x) eine Stammfunktion von f : x → f (x), so ist auch F + C : x → F (x) + C
eine Stammfunktion von f : x → f (x).
• Sind F : x → F (x) und G : x → G(x) Stammfunktionen von f : x → f (x), so gibt es eine
reelle Konstante C mit G(x) ≡ F (x) + C.
Beispiel Die Funktionen F : x → sin2 x und G : x → − 12 cos 2x haben beide die Ableitung
F 0 (x) = G0 (x) = 2 sin x cos x .
Es sind also sowohl F wie G Stammfunktionen von f : x → 2 sin x cos x. Sie unterscheiden sich
deshalb nur um eine additive Konstante C:
1
G(x) ≡ − cos 2x ≡ sin2 x + C ≡ F (x) + C .
2
Setzt man x = 0, so erhält man C = −1/2. Damit haben wir die (bekannte) Identität
1
sin2 x ≡ (1 − cos 2x)
2
bewiesen.
11
Kapitel III. Integralrechnung
Der Hauptsatz der Infinitesimalrechnung zusammen mit den obigen Bemerkungen liefert die
Möglichkeit, bestimmte Integrale auf sehr einfache Weise zu berechnen. Mit unseren Bezeichnungen ist
Z
b
a
f (t) dt = Fa (b) .
Ist nun F : x → F (x) irgendeine Stammfunktion von f : x → f (x), so gilt nach obigem
Fa (x) ≡ F (x) + C .
In dieser Gleichung kann
man die Konstante C bestimmen, indem man x = a setzt; dann
R
gilt nämlich Fa (a) = aa f (t) dt = 0, und es folgt C = −F (a). Man erhält für den Wert des
bestimmten Integrals die Formel
Fa (b) =
Z
b
a
f (t) dt = F (b) − F (a).
Damit haben wir die folgende zentrale Aussage der Infinitesimalrechnung bewiesen, welche die
Berechnung bestimmter Integrale auf die Berechnung einer Stammfunktion des Integranden
reduziert.
Satz Ist f : x → f (x) eine auf [a, b] stetige Funktion und ist F : x → F (x) eine Stammfunktion
von f , so gilt
Z
b
a
f (t) dt = F (b) − F (a) .
Für die Differenz F (b) − F (a) schreiben wir im folgenden oft kurz [F (x)]ba oder F (x)|ba .
Beispiel
Z
b
a
"
x3
x dx =
3
2
#b
=
a
b3 a3
−
.
3
3
Beispiel
Z
0
π/2
π/2
sin x dx = [− cos x]0
= − cos(π/2) − (− cos 0) = 0 + 1 = 1 .
12
3
U. Stammbach:
Analysis, Teil A
Das Integrieren
Es sei f : x → f (x) eine auf [a, b] stetige Funktion. Die Menge ihrer Stammfunktionen bezeichnen
wir mit dem Symbol
Z
f (x) dx .
Sie heisst oft in etwas unglücklicher Weise das unbestimmte Integral von f : x → f (x). Der
Übergang von f zu seinem Integral heisst Integrieren.
Da das Integrieren die Umkehroperation des Differenzierens ist, liefert jede Ableitungsregel eine
Regel für das Integrieren. Wir halten die folgenden explizit fest:
Z
xn dx =
Z
xn+1
+ C , falls n 6= −1
n+1
1
dx = log |x| + C
Z x
ex dx = ex + C
Z
Z
sin x dx = − cos x + C
cos x dx = sin x + C
Z
1
dx
sin2 x
Z
1
dx
cos2 x
Z
dx
√
1 − x2
Z
1
dx
2
Z1+x
= −cot x + C
= tan x + C
= arcsin x + C
= arctan x + C
sinh x dx = cosh x + C
Z
Z
cosh x dx = sinh x + C
√
dx
x2 + 1
= Arsinh x + C = log(x +
p
x2 + 1) + C
13
Kapitel III. Integralrechnung
Z
Z
Z
√
dx
x2 − 1
= Arcosh x + C = log(x +
p
x2 − 1) + C
tan x dx = − log | cos x| + C
cot x dx = log | sin x| + C
In vielen Fällen lassen sich Integrale von komplizierten Funktionen finden, indem man versucht,
das Problem auf diese oben angeführte Standardintegrale zurückzuführen. Dabei benützt man
unter anderem die (offensichtlichen) Rechenregeln:
Z
(f (x) + g(x)) dx =
Z
Z
Z
c f (x) dx = c
f (x) dx +
Z
Z
g(x) dx
f (x) dx , c ∈ R
g0 (f (x)) · f 0 (x) dx = g(f (x)) + C
Beispiel
Z
sin3 x dx =
Z
Z
=
sin x(1 − cos2 x)dx
sin x dx +
= − cos x +
Z
(− sin x) cos2 x dx
cos3 x
+C
3
Beispiel
Z √
ax + b dx =
2
(ax + b)3/2 + C
3a
Beispiel
Z
√
x
dx = (x2 + 1)1/2 + C .
+1
x2
In konkreten Fällen ist es manchmal recht schwierig, die Stammfunktion zu finden. Dies liegt
einmal daran, dass es keine einfache Methode gibt, welche in allen vernünftigen Fällen eine
14
U. Stammbach:
Analysis, Teil A
Stammfunktion liefert. Ferner gibt es verhältnismässig einfache Funktionen, deren Stammfunktion sich nicht auf elementare Weise ausdrücken lassen. Als Beispiel erwähnen wir die Funktion
2
x → e−x . Diese ist natürlich stetig, besitzt also sicherlich eine Stammfunktion. Mit starken
mathematischen Mittel kann man beweisen, dass sich diese Stammfunktion nicht durch eine
gewöhnliche Formel beschreiben lässt, in der nur Potenzfunktionen, trigonometrische Funktionen, Exponentialfunktionen und zu diesen inverse Funktionen vorkommen: sie ist nicht elementar ausdrückbar. Es ist zwar klar, dass es neben den elementar ausdrückbaren Funktionen
noch andere Funktionen geben muss, dass aber darunter sogar Funktionen zu finden sind, die
als Stammfunktionen von elementar ausdrückbaren Funktionen auftreten, ist doch eine recht
überraschende Tatsache.
Trotz all dieser Schwierigkeiten kennt man eine Anzahl Techniken, die beim Integrieren nützlich
sind; wir besprechen in den folgenden zwei Abschnitten zwei davon, nämlich die Methode der
partiellen Integration und die Methode der Substitution.
15
Kapitel III. Integralrechnung
4
Die Methode der partiellen Integration
Die Methode der partiellen Integration ist die Umkehrung der Ableitungsregel für ein
Produkt von Funktionen. Sind u : x → u(x) und v : x → v(x) zwei Funktionen, so gilt
(u · v)0 = u0 · v + u · v 0 .
Es folgt daraus
uv + C =
Z
(u · v)0 dx =
Z
u0 v dx +
Z
uv 0 dx
und damit
Z
u0 v dx = uv −
Z
uv 0 dx .
Wir sehen die Nützlichkeit dieser Formel in den folgenden Beispielen.
Beispiel
Im Integral
Z
xex dx
setzten wir
u0 (x) = ex , u(x) = ex ,
v(x) = x , v 0 (x) = 1 .
Dann liefert die Formel für die partielle Integration
Z
xex dx = xex −
Z
1 · ex dx
= xex − ex + C
= (x − 1)ex + C .
16
U. Stammbach:
Analysis, Teil A
Wählen wir die Funktionen u, v anders, setzen wir
u0 (x) = x , u(x) = x2 /2 ,
v(x) = ex , v 0 (x) = ex ,
so erhalten wir
Z
x
xe dx =
Z
x2 x
e −
2
x2 x
e dx .
2
Hier ist das Integral auf der rechten Seite der Gleichung offenbar komplizierter als das Ausgangsintegral; die partielle Integration läuft in der verkehrten Richtung und hilft anscheinend
nicht weiter. Immerhin können wir an der letzten Gleichung ablesen
Z
2 x
2 x
x e dx = x e − 2
Z
xex dx
= x2 ex − 2xex + 2ex + C
= (x2 − 2x + 2)ex + C ,
so dass unsere Arbeit doch nicht ganz nutzlos war.
Beispiel
Im Integral
Z
sin2 x dx
setzen wir
u0 (x) = sin x , u(x) = − cos x ,
v(x) = sin x , v 0 (x) = cos x ,
und erhalten
Z
sin2 x dx = − sin x cos x +
= − sin x cos x +
Z
Z
cos2 x dx
(1 − sin2 x) dx
= − sin x cos x + x −
Z
sin2 x dx .
17
Kapitel III. Integralrechnung
Wiederum scheint die partielle Integration nicht zum Ziele geführt zu haben, tritt doch auf
der rechten Seite das Ausgangsintegral noch einmal auf. Schaut
man allerdings näher hin, so
R
2
sieht man, dass eine Gleichung für die unbekannte Grösse sin x dx vorliegt, die sich ohne
Schwierigkeiten auflösen lässt:
Z
sin2 x dx =
1
(x − sin x cos x) + C.
2
Auf analoge Weise erhält man
Z
cos2 x dx =
1
(x + sin x cos x) + C,
2
ein Resultat, das sich aus obigem auch mit cos2 x = 1 − sin2 x herleiten lässt.
Beispiel
Im Integral
Z
eax cos bx dx
mit a, b ∈ R setzen wir
u0 (x) = eax
, u(x) =
eax /a ,
v(x) = cos bx , v 0 (x) = −b sin bx .
Dies liefert
Z
ax
e
1
b
cos bx dx = eax cos bx +
a
a
Z
eax sin bx dx .
Setzt man im verbleibenden Intregral
u0 (x) = eax , u(x) = eax /a ,
v(x) = sin bx , v 0 (x) = b cos bx ,
so erhält man im zweiten Schritt
Z
eax cos bx dx =
1 ax
b
e cos bx +
a
a
1 ax
b
e sin bx −
a
a
Z
eax cos bx dx
.
18
U. Stammbach:
Analysis, Teil A
Wie im letzten Beispiel hat man eine Gleichung für die unbekannte Grösse vor sich, die sich
leicht auflösen lässt:
Z
eax cos bx dx =
a2
1
eax (a cos bx + b sin bx) + C .
+ b2
Beispiel
Z
log x dx =
Z
1 · log x dx = x log x −
Z
1
x dx = x (log x − 1) + C.
x
Dabei haben wir
u0 (x) =
1
, u(x) = x ,
v(x) = log x , v 0 (x) = 1/x
gesetzt.
Beispiel
Z
arctan x dx = x · arctan x −
1
2
Z
2x
1
dx = x · arctan x − log(1 + x2 ) + C .
2
1+x
2
Dabei haben wir, ähnlich wie im letzen Beispiel,
u0 (x) =
1
, u(x) =
x,
0
v(x) = arctan x , v (x) = 1/(1 + x2 )
gesetzt. Ausserden haben wir im verbleibenden Integral den Bruch mit 2 erweitert, um zu
erreichen, dass im Zähler gerade die Ableitung des Nenners steht.
19
Kapitel III. Integralrechnung
5
Die Methode der Substitution
Die effiziente Handhabung der partiellen Integration lernt man durch intensives Üben. Gleiches
gilt in noch vermehrtem Masse für die Methode der Substitution. Wir beschränken uns in
dieser kurzen Darstellung im wesentlichen auf Beispiele (das Üben überlassen wir wie üblich dem
Leser!) und verzichten auch auf eine vollständige Begründung der Methode. (Dies ist übrigens
trotz der Einfachheit der zugrunde liegenden Idee recht umständlich.) Immerhin wollen wir
festhalten und auch begreiflich machen, dass die Methode der Substitution für die Integration
das Pendant der Kettenregel der Differentiation ist, wie die Methode der partiellen Integration
dasjenige der Produktregel.
Beispiel
Im Integral
I=
Z
sinn x cos x dx
substituieren wir als neue Funktion u(x) = sin x. Dann ist u0 (x) = cos x, so dass sich das Integral
I in der Form
I=
Z
(u(x))n u0 (x) dx
schreiben lässt. Die Funktion
x → U (x) =
1
(u(x))n+1
n+1
ist dann eine Stammfunktion von ((u(x))n u0 (x), wie man durch Ableiten mit Hilfe der Kettenregel sofort bestätigt. Wir erhalten demzufolge
I=
Z
sinn x cos x dx =
1
sinn+1 x + C .
n+1
Man liest an diesem Beispiel ab, dass sich eine Substitution einer Funktion u(x) besonders dann
aufdrängt, wenn der Integrand u0 (x) als Faktor enthält.
Mit der – man kann nicht anders sagen – raffinierten Notation, die von Leibniz eingeführt worden
ist, lässt sich im übrigen der Gang der Rechnung in abgekürzter Weise einfach darstellen. Man
fasst dabei – rein formal – du = u0 (x) dx als das “Differential” der Funktion u auf.
20
Es sei I =
U. Stammbach:
R
Analysis, Teil A
sinn x cos x dx. Mit u(x) = sin x, du = u0 (x) dx = cos x dx, wird daraus
Z
I=
un du =
1
un+1 + C .
n+1
Die “Rücksubstitution” liefert dann
I=
1
sinn+1 x + C .
n+1
R
Beispiel Für das Integral I = x sin(x2 ) dx wählt man die Substitution u = x2 . Daraus folgt
du = 2x dx, d.h. x dx = du/2 und man erhält
1
I=
2
Z
1
sin u du = − cos u + C .
2
Die “Rücksubstitution” liefert dann
1
I = − cos(x2 ) + C .
2
Neben dieser direkten Art, eine Substitution zu verwenden, gibt es auch eine, die in der “umgekehrten Richtung” verläuft. Auch dazu einige Beispiele:
Beispiel
Im Integral
I=
Z p
1 − u2 du
substituieren wir u = sin x, du = cos x dx. Dann erhalten wir wegen 1 − u2 = 1 − sin2 x = cos2 x
Z
cos x cos x dx =
Z
1
cos2 x dx = (x + sin x cos x) + C .
2
Die ”Rücksubstitution” liefert
I=
p
1
arcsin u + u 1 − u2 + C .
2
21
Kapitel III. Integralrechnung
Den Leser mag einwenden – und dies mit vollem Recht –, dass wir in diesem Beispiel an zwei
Stellen nicht ganz “sauber” gerechnet haben: wir haben ohne Rücksicht auf das Vorzeichen von
cos x
cos x =
q
1 − sin2 x
gesetzt, und wir haben ohne Rücksicht auf den Wertebereich von arcsin
x = arcsin (sin x)
gesetzt. Beide Gleichungen gelten ja nur unter zusätzlichen Bedingungen, etwa 0 ≤ x ≤ π/2.
Unsere forsche Art zu rechnen entspricht an dieser Stelle guter Praxis: es ist bei der Methode
der Substitution in der Regel einfacher, Gleichungen wie die obige ohne Rücksicht auf den
eingeschränkten Gültigkeitsbereich zu benützen, und dann am Schluss zu verifizieren, dass das
erhaltene Resultat allgemein, d.h. für alle x gültig ist. Letzteres (also die Kontrolle) sollte man
allerdings immer durchführen:
p
d 1
1
( arcsin u + u 1 − u2 ) =
du 2
2
p
1
u2
√
+ 1 − u2 − √
1 − u2
1 − u2
!
=
p
1 − u2 .
R√
Beispiel Im Integral I =
x2 + 1 dx setzt man x = sinh t, dx = cosh t dt und erhält wegen
2
2
sinh t + 1 = cosh t das Integral
I =
Z
cosh t · cosh t dt ,
welches man mit partieller Integration weiter behandeln kann. Setzt man
u0 (t) = cosh t , u(t) = sinh t ,
v(t) = cosh t , v 0 (t) = sinh t ,
so folgt
I = sinh t · cosh t −
Z
sinh2 t dt .
Wegen sinh2 t = cosh2 t − 1 erhält man dann eine Gleichung für I, die sich leicht auflösen lässt:
22
U. Stammbach:
I =
1
(t + sinh t cosh t) + C .
2
p
sinh2 t + 1
Die Rücksubstitution liefert wegen cosh t =
I =
Analysis, Teil A
p
1
( Arsinh x + x x2 + 1) + C ;
2
ein Resultat, welches man leicht durch Ableiten bestätigt.
Auf analoge Weise wie in den obigen Beispielen erhält man das folgende Integral
Z p
x2 − 1 dx =
Beispiel
p
1
(− Arcosh x + x x2 − 1) + C .
2
Man berechne den Flächeninhalt F der Ellipse mit Halbachsen a, b.
Die obere Hälfte der Ellipsenperipherie ist als Graph der Funktion
q
f : x → b 1 − x2 /a2 , D(f ) = [−a, +a]
gegeben. Um die ganze Ellipsenfläche F zu bestimmen, genügt es offenbar, die Fläche F/4 des
Ellipsenviertels im ersten Quadranten auszurechnen
F
=
4
Z
a
0
b
q
1 − x2 /a2 dx .
Für das unbestimmte Integral
I=
Z
b
q
1 − x2 /a2 dx
bietet sich die Substitution x = a sin t, dx = a cos t dt an. Man erhält damit nach einem der
obigen Resultate
Z
ab cos2 t dt =
ab
(t + sin t cos t) + C
2
23
Kapitel III. Integralrechnung
und nach der Rücksubstitution
ab
x
I=
arcsin
2
a
xq
+
1 − x2 /a2 + C .
a
Einsetzen der Grenzen liefert dann
F
ab
x
= 4·
arcsin
2
a
ab π
= 4·
·
2 2
= πab .
xq
+
1 − x2 /a2
a
a
0
Neben diesem etwas umständlichen Weg gibt es auch die Möglichkeit, die Substitution direkt
im bestimmten Integral durchzuführen, d.h. die Substitution auch auf die Integrationsgrenzen
wirken zu lassen.
Für die untere Grenze x = 0 erhält man t = 0, für die obere x = a erhält man t = π/2. Man
hat somit
F
=
4
Z
0
a
b
q
1−
x2 /a2
dx =
Z
π/2
0
ab cos2 t dt =
π
ab ,
4
F = πab .
Bei der Berechnung der Wirkung der Substitution auf die Integrationsgrenzen müssen den Integrationsgrenzen in x in eindeutiger Weise Integrationsgrenzen in t zugeordnet werden können.
Dies ist nur dann gewährleistet, wenn man bei der Substitution für die ursprüngliche Integrationsvariable eine injektive Funktionen verwendet. Möglicherweise muss man dabei den (sonst
üblichen) Definitionsbereich der Substitutionsfunktion einschränken. In unserem Fall müssen
wir dies in der Tat tun: der Definitionsbereich der Funktion
t → x = a sin t
wird auf das Intervall [0, π/2] eingeschränkt, dort ist die Funktion injektiv und den Integrationsgrenzen in x können eindeutig Integrationsgrenzen in t zugeordnet werden.
Die Wirkung der Substitution auf die Integrationsgrenzen wird vom Anfänger gerne vergessen;
man achte also besonders auf diesen Punkt.
24
6
U. Stammbach:
Analysis, Teil A
Einige weitere Beispiele
In diesem Abschnitt beschäftigen wir uns im wesentlichen mit den Integralen über Potenzen
der Sinus- bzw. der Cosinus-Funktion und mit Integralen über rationale Funktionen. In beiden
Gebieten begnügen wir uns mit Beispielen.
In Anwendungen treten oft die bestimmten Integrale
In =
Z
π/2
0
sinn x dx , Jn =
Z
π/2
0
cosn x dx
für n = 0, 1, 2, . . . auf. Diese Integrale wollen wir im ersten Teil dieses Abschnittes berechnen.
Wir beschäftigen uns zuerst mit dem unbestimmten Integral
Z
sinn x dx .
Für kleine Werte von n ist uns das Resultat natürlich bekannt; wir haben
n=0 :
n=1 :
n=2 :
Z
1 dx = x + C
Z
sin x dx = − cos x + C
Z
sin2 x dx =
1
(x − sin x cos x) + C
2
Eine Stammfunktion für x → sinn x in geschlossener Form anzugeben ist – wie man ohne grosse
Mühe einsieht – nicht einfach. Hingegen lässt sich sehr leicht eine Rekursionsformel angeben.
Dazu behandeln wir das Integral
Z
n
sin x dx =
Z
sinn−1 x sin x dx
mit partieller Integration; wir setzen
u0 (x) =
sin x
, u(x) =
− cos x ,
n−1
0
v(x) = sin
x , v (x) = (n − 1) sinn−2 x cos x .
25
Kapitel III. Integralrechnung
Dann erhalten wir
Z
sinn x dx = − cos x sinn−1 x + (n − 1)
n−1
= − cos x sin
Z
sinn−2 x cos2 x dx
Z
x + (n − 1)
sin
n−2
x dx −
Z
n
sin x dx
.
Die Gleichung lässt sich natürlich auflösen:
Z
1
n−1
sin x dx = − cos x sinn−1 x +
n
n
n
Z
sinn−2 x dx .
Fig. 1 :
Potenzen von sin x
sin2 x
sin5 x
Man kann diese Formel verwenden, um rekursiv die Folge der Stammfunktionen von x → sinn x
zu berechnen. Wir überlassen dies dem Leser und wollen hier zum ursprünglich gestellten
Problem zurückkehren, nämlich zum Problem, die bestimmten Integrale (siehe Figur 1)
In =
Z
0
π/2
sinn x dx und Jn =
Z
0
π/2
cosn x dx
26
U. Stammbach:
Analysis, Teil A
zu berechnen. Wie bemerken als erstes, dass der Graph von x → sinn x durch Spiegelung an der
Senkrechten x = π/4 in den Graphen von x → cosn x übergeht (siehe Figur 2). Daraus folgt
sofort In = Jn . Es genügt also In auszurechnen. Nach obigem gilt
I0 =
π
, I1 = 1 ,
2
und aus der Rekursionsformel erhalten wir
In =
Z
0
π/2
Fig. 2 :
Symmetrie
y = sin2 x
y = cos2 x
1
sinn x dx = − cos x sinn−1 x
n
π/2
0
+
n−1
n
Z
0
π/2
sinn−2 x dx =
n−1
· In−2 .
n
Mit Hilfe dieser Formel lassen sich die Werte In sogar in geschlossener Form angeben. Offenbar
haben wir zwischen geraden und ungeraden Indizes n zu unterscheiden:
I0 =
π
1 π
3 1 π
5 3 1 π
, I2 = · , I4 = · · , I6 = · · · , . . .
2
2 2
4 2 2
6 4 2 2
27
Kapitel III. Integralrechnung
I2k =
I1 = 1 , I3 =
1 · 3 · 5 · 7 · · · (2k − 1) π
·
2 · 4 · 6 · 8 · · · 2k
2
2
4 2
6 4 2
, I5 = · , I7 = · · , . . .
3
5 3
7 5 3
I2k+1 =
2 · 4 · 6 · 8 · · · 2k
3 · 5 · 7 · · · (2k + 1)
Aus diesen Resultaten lässt sich eine überraschende und historisch interessante Formel herleiten,
nämlich die Formel von Wallis (J. Wallis 1616-1703).
Im Intervall [0, π/2] gilt natürlich die Ungleichung 0 ≤ sin x ≤ 1 . Daraus folgt für k = 1, 2, 3, . . .
sin2k−1 x ≥ sin2k x ≥ sin2k+1 x
und durch Integration I2k−1 ≥ I2k ≥ I2k+1 . Division durch den (positiven) Wert I2k+1 liefert
I2k−1
I2k
≥
≥1.
I2k+1
I2k+1
Nun gilt nach unserer Rekursionsformel
I2k+1 =
2k
I2k−1 ,
2k + 1
so dass
I2k−1
2k + 1
= lim
= 1.
k→∞ I2k+1
k→∞
2k
lim
Daraus folgt
28
U. Stammbach:
I2k
lim
k→∞ I2k+1
Analysis, Teil A
= 1,
d.h.
lim
k→∞
1·3·3·5·5·7·7 · · · (2k − 1)(2k − 1)(2k + 1) π
= 1.
2·2·4·4·6·6·8·8 · · · (2k)(2k)
2
Dies liefert unmittelbar die überraschende Formel von Wallis
2·2·4·4·6·6·8·8 · · · (2k)(2k)
π
=
,
k→∞ 1·3·3·5·5·7·7 · · · (2k − 1)(2k − 1)(2k + 1)
2
lim
welche auf merkwürdige Weise die geraden und die ungeraden ganzen Zahlen mit der irrationalen
Zahl π in Verbindung bringt.
Beispiel
Das Integral
Z
I=
a
0
p
x2 a2 − x2 dx
tritt bei der Berechnung des Flächenträgheitsmomentes einer Kreisscheibe um ihren Durchmesser
auf. Die Substitution x = a sin t, dx = a cos t dt mit gleichzeitiger Transformation der Integrationsgrenzen liefert
I
Z
=
π/2
0
4
= a
4
= a
=
Z
a2 sin2 t a2 cos2 t dt
π/2
0
(sin2 t − sin4 t) dt
1 π 1 3 π
· − · ·
2 2 2 4 2
π 4
a .
16
Im Rest dieses Abschnittes beschäftigen wir uns noch mit der Integration von rationalen Funktionen. Für dieses Gebiet gibt es eine ausgebaute Theorie. Wir wollen uns in dieser Vorlesung
aber mit einigen Beispielen begnügen.
29
Kapitel III. Integralrechnung
Beispiel
Es ist das Integral
Z
dx
x2 − 6x + 5
zu berechnen.
Man sieht leicht, dass die quadratische Nennerfunktion die Nullstellen 5 und 1 hat. Die hier
nicht behandelte Theorie der Partialbrüche besagt, dass sich die rationale Funktion
x2
1
− 6x + 5
in der Form
A
B
+
x−5 x−1
mit reellen Zahlen A und B schreiben lässt. Diese Zahlen lassen sich aus der Identität
1
A
B
≡
+
x2 − 6x + 5
x−5 x−1
leicht bestimmen. Bringt man nämlich die rechte Seite auf einen einzigen Bruchstrich, so erhält
man
x2
1
A(x − 1) + B(x − 5)
≡
.
− 6x + 5
(x − 5)(x − 1)
Die Tatsache, dass die Zählerfunktionen links und rechts übereinstimmen müssen, liefert für A
und B die Gleichungen
A + B = 0
−A − 5B = 1
Daraus ergibt sich sofort A = 1/4, B = −1/4. Es folgt
.
30
U. Stammbach:
Z
Beispiel
Z 1
dx =
2
x − 6x + 5
Analysis, Teil A
1
1
1
dx
−
4
x−5 x−1
1
=
(log |x − 5| − log |x − 1|) + C
4
x − 5 1/4
= log
+C .
x−1
Es ist das Integral
Z
3x − 1
dx
x2 − x + 1
zu berechnen.
In einem ersten Schritt versucht man das Problem auf eine rationale Funktion zu reduzieren,
deren Zähler eine Konstante ist. Wegen (x2 − x + 1)0 = 2x − 1 erhält man
Z
3x − 1
dx =
2
x −x+1
=
=
Z
3 2x − 23 − 13 + 13
dx
2
x2 − x + 1
!
Z
1
3
2x − 1
3
dx
+
2
x2 − x + 1 x2 − x + 1
Z
3
1
1
log |x2 − x + 1| +
dx .
2
2 x2 − x + 1
Für die Behandlung des verbleibenden Integrals stellt man fest, dass die Nennerfunktion keine
reellen Nullstellen
hat. Man versucht deshalb dieses Integral auf den Standardtyp dieser Art,
R
nämlich auf 1/(u2 + 1) du zurückzuführen. Dies geschieht mit Hilfe der sogenannten quadratischen Ergänzung:
x2 − x + 1 = x −
1
2

2
+
1
2
2
3
3 x−

=  q  + 1 .
3
4
4
4
Macht man im Integral
Z

1
4
dx =
2
x −x+1
3
Z
1
x− 21
p3
4
dx
2
+1
31
Kapitel III. Integralrechnung
die Substitution
2
1
2
u= √ x−
, du = √ dx ,
2
3
3
so erhält man
√ Z
4 3
1
2
du = √ arctan u + C .
2
3 2
u +1
3
Die Rücksubstitution liefert schliesslich
Z
1
2
dx = √ arctan
2
x −x+1
3
was man leicht durch Ableiten bestätigt.
2
1
√ x−
2
3
+C ,
32
7
U. Stammbach:
Analysis, Teil A
Flächenberechnung
Der Ursprung des Begriffs des bestimmten Integrals ist zweifellos die Frage nach dem Flächeninhalt eines durch Kurven begrenzten Gebietes. Darüber hinaus haben sich im Laufe der Zeit
viele weitere Anwendungen ergeben, die nichts mehr mit dem ursprünglichen Problem zu tun
haben. Über solche Anwendungen werden die folgenden 6 Abschnitte handeln. In jedem Fall ist
es die Riemann’sche Form der Definition des bestimmten Integrals, durch welche die Verbindung
hergestellt wird. Im vorliegenden Abschnitt kehren wir zuerst noch einmal zum Problem der
Flächenberechnung zurück.
Ist eine Kurve K im (x, y)-Koordinatensystem gegeben so stellen wir die Frage nach dem
Flächeninhalt I der Fläche unter der Kurve (siehe Figur 1). Ist K als Graph einer (stetigen)
Funktion f gegeben, so ist I einfach der Wert des bestimmten Integrals
I=
Z
b
a
f (x) dx .
Es sei nun K durch eine Parameterdarstellung
~r : t → (x(t), y(t)) , tA ≤ t ≤ tB
gegeben, wobei wir annehmen, dass die Funktionen t → x(t) , t → y(t) stetig differenzierbar sind,
und dass im ganzen Intervall ẋ(t) > 0 gilt. Letztere Voraussetzung besagt, dass der Kurvenpunkt
sich mit wachsendem t nach rechts bewegt, denn die Funktion t → x(t) ist monoton wachsend.
Um den Flächeninhalt I zu bestimmen, approximieren wir die Fläche durch Rechtecke, welche
zu einer Einteilung
a = x 0 < x1 < · · · < x n = b
des Intervalles [a, b] mit Zwischenpunkten ξk gehören, wobei wir die Zwischenpunkte ξk für unsere
Zwecke geschickt wählen. Es sei tk für k = 0, 1, . . . , n der (eindeutig bestimmte) Parameterwert
mit xk = x(tk ). Die Parameterwerte tk liefern wegen der Monotonität von t → x(t) eine
Einteilung des Intervalles [tA , tB ]
tA = t0 < t1 < · · · < tn = tB .
In jedem Intervall [tk−1 , tk ] wählen wir mit Hilfe des Mittelwertsatzes der Differentialrechnung
ein τk mit
x(tk ) − x(tk−1 ) = ẋ(τk ) · (tk − tk−1 ) .
33
Kapitel III. Integralrechnung
(x(t), y(t))
A
B
y(τ1 )
x(t0 )
x(τ1 )
y(τ2 )
x(t1 )
x(τ2 )
y(τ3 )
x(t2 )
Fig. 1 :
Fläche unter der Kurve
y(τ4 )
x(t3 )
x(t4 )
x(τ3 )
x(τ4 )
Natürlich gilt
xk−1 = x(tk−1 ) ≤ x(τk ) ≤ x(tk ) = xk
wiederum wegen der Monotonität der Funktion t → x(t). Die Werte ξk , ξk = x(τk ), k =
1, 2, . . . , n wählen wir als Zwischenpunkte für unsere Einteilung des Intervalles [a, b]. Für die
Summe der Inhalte der zugehörigen Rechtecke erhalten wir dann
y(τ1 )(x1 − x0 ) + y(τ2 )(x2 − x1 ) + · · · + y(τn )(xn − xn−1 ) =
= y(τ1 )ẋ(τ1 )(t1 − t0 ) + y(τ2 )ẋ(τ2 )(t2 − t1 ) + · · · + y(τn )ẋ(τn )(tn − tn−1 ) .
Letzteres ist aber gerade die Riemann’sche Summe für die Funktion t → y(t)ẋ(t), welche zur
Einteilung
tA = t0 < t1 < · · · < tn = tB
des Intervalles [tA , tB ] mit Zwischenpunkten τk , k = 1, 2, . . . , n gehört. Laut Definition des
bestimmten Integrals gilt somit für den gesuchten Flächeninhalt
34
U. Stammbach:
I=
Z
tB
tA
Analysis, Teil A
y(t) ẋ(t) dt .
Diese mathematisch exakte, aber etwas langatmige Herleitung zeigt eindringlich die Nützlichkeit
der Riemann’schen Definition des bestimmten Integrals. Mit etwas Erfahrung erlaubt sich der
Anwender diese Formel auf heuristische Art wie folgt “herzuleiten”. Es gilt (siehe Figur 2)
(x(t), y(t))
A
B
Fig. 2 :
Fläche unter der Kurve
dI
y(t)
x(tA )
x(t) ẋ(t)dt
x(tB )
dI = y(t) dx .
Mit dx = ẋ(t) dt erhält man
dI = y(t) ẋ(t) dt
und damit
I=
Z
dI =
Z
tB
tA
y(t) ẋ(t) dt .
Diese Art der Herleitung ist zwar kurz und einprägsam, der Unerfahrene macht aber bei solchen
und ähnlichen Überlegungen gerne Fehler. Erst mit der Zeit entwickelt man ein intuitives Gefühl
dafür, was für Manipulationen dieser Art erlaubt sind.
35
Kapitel III. Integralrechnung
2a
Fig. 3 :
Zykloide
2πa
Beispiel Gesucht ist der Inhalt der Fläche unter einem Zykloidenbogen (siehe Figur 3). Die
Zykloide ist gegeben durch die Parameterdarstellung
t → (x(t), y(t)) = (at − a sin t, a − a cos t) , 0 ≤ t ≤ 2π .
Der gesuchte Flächeninhalt I ist somit
I =
Z
2π
0
= a2
(a − a cos t)(a − a cos t) dt
Z
2π
0
(1 − 2 cos t + cos2 t) dt
= a2 (2π − 0 + π)
= 3πa2 .
Der Flächeninhalt ist also gerade dreimal so gross wie derjenige des Kreises, der die Zykloide
erzeugt.
Wird in der ursprünglichen Aufgabe die Kurve K mit wachsendem t von rechts nach links
durchlaufen, d.h. gilt ẋ(t) < 0 für tA ≤ t ≤ tB , so liefert das Integral
36
U. Stammbach:
I=
Z
tB
tA
Analysis, Teil A
y(t) ẋ(t) dt
offensichtlich den negativen Inhalt der Fläche unter der Kurve. Von dieser Bemerkung machen
wir in der folgenden Anwendung Gebrauch.
Oft ist man nicht am Inhalt der Fläche unter der Kurve sondern am Inhalt der Sektorfläche
interessiert. In der Figur 4 liest man unmittelbar ab
B
Fig. 4 :
Sektorfläche
y(tB )
A
y(tA )
x(tA )
IS =
x(tB )
1
1
x(tB ) y(tB ) − x(tA ) y(tA ) −
2
2
Z
tB
tA
y(t) ẋ(t) dt .
Nun gilt
d
x(t) y(t) = ẋ(t) y(t) + x(t) ẏ(t) ,
dt
so dass wir schreiben können
x(tB ) y(tB ) − x(tA ) y(tA ) =
Z
tB
tA
(ẋ(t) y(t) + x(t) ẏ(t)) dt .
37
Kapitel III. Integralrechnung
Damit ergibt sich die folgende Formel für die Sektorfläche
IS =
1
2
Z
tB
tA
(x(t) ẏ(t) − ẋ(t) y(t)) dt .
Eine genaue Analyse zeigt, dass dieses Integral einen positiven Wert liefert, wenn die Sektorfläche
links von der Kurve liegt (wie in der Figur 4) und einen negativen Wert, wenn die Sektorfläche
rechts von der Kurve liegt.
Beispiel Gesucht ist die Ellipsenfläche F . Die Ellipse mit Halbachsen a und b und Mittelpunkt
O ist durch die Parameterdarstellung
t → (x(t), y(t)) = (a cos t, b sin t) , 0 ≤ t ≤ 2π
gegeben. Die Ellipsenfläche kann als Sektorfläche angesehen werden, wenn t von 0 bis 2π variiert.
Wir erhalten
F =
1
2
Z
2π
0
1
(ab cos2 t + ab sin2 t) dt = ab2π = abπ .
2
Beispiel Die Parameterdarstellung
t → (x(t), y(t)) = (cosh t, sinh t)
beschreibt bekanntlich den rechten Ast einer Hyperbel. Gesucht ist die Sektorfläche H, die zu
den Punkten mit t = 0 und t = T gehört. Wir erhalten
1
H=
2
Z
0
T
1
(cosh t − sinh t) dt =
2
2
2
Z
0
T
1 dt =
1
T .
2
Dieses Resultat ist natürlich der Grund für die Tatsache, dass die Umkehrfunktionen Arcosh
und Arsinh von cosh und sinh “Area”-Funktionen genannt werden (Area = Flächeninhalt).
Ist schliesslich die Kurve K durch Polarkoordinaten ρ, ϕ gegeben, so lässt sich die entsprechende
Formel für den Inhalt der Sektorfläche zwischen ϕA und ϕB sehr leicht herleiten. Man geht von
der Darstellung durch Polarkoordinaten einfach zur zugehörigen Parameterdarstellung über. Es
sei K durch die Gleichung ρ = ρ(ϕ) gegeben. Dann ist
ϕ → (x(ϕ), y(ϕ)) = (ρ(ϕ) cos ϕ, ρ(ϕ) sin ϕ)
die zugehörige Parameterdarstellung mit Parameter ϕ, und man erhält für den Inhalt der Sektorfläche
38
U. Stammbach:
√
− 2c
√
2c
IS
Analysis, Teil A
Fig. 5 :
Lemniskate
Z
=
=
=
1 ϕB
(xẏ − ẋy) dϕ
2 ϕA
Z
1 ϕB
(ρ cos ϕ(ρ̇ sin ϕ + ρ cos ϕ) − (ρ̇ cos ϕ − ρ sin ϕ)ρ sin ϕ) dϕ
2 ϕA
Z ϕB
1
ρ2 dϕ .
2 ϕA
√ √
Beispiel Die Gleichung ρ = 2 c cos 2ϕ in Polarkoordinaten stellt eine sogenannte Lemniskate
(siehe Figur 5) dar. Der Inhalt des durch die zu −π/4 ≤ ϕ ≤ π/4 gehörigen Kurve eingeschlossenen Flächenstücks ergibt sich nach obigem zu
IS =
1
2
Z
+π/4
−π/4
2c2 cos 2ϕ dϕ = c2 .
39
Kapitel III. Integralrechnung
8
Bogenlänge
Eine Kurve K im Raum lässt sich mit Hilfe einer Parameterdarstellung
~r : t → ~r(t) = (x(t), y(t), z(t)), tA ≤ t ≤ tB
beschreiben. In natürlicher Weise tritt eine solche Parameterdarstellung etwa auf, wenn die
~ = ~r(t) den Ort,
Bewegung eines Massenpunktes beschrieben werden soll; dann bezeichnet OP
˙
an dem sich der Massenpunkt zur Zeit t befindet. Bekanntlich ist dann ~r(t) die (vektorielle)
Geschwindigkeit des Massenpunktes zur Zeit t. Ist die Bahn des Massenpunktes bekannt, so ist
es naheliegend, nach der Länge des zurückgelegten Weges zu fragen, d.h. nach der Bogenlänge
der Kurve K. Damit wollen wir uns in diesem Abschnitt befassen.
Wir definieren die Bogenlänge der Kurve K durch das Integral
sB
A =
Z
tB
tA
q
(ẋ(t))2 + (ẏ(t))2 + (ż(t))2 dt =
Z
tB
tA
|~r˙ (t)| dt .
Dass diese Definition vernünftig ist, zeigt die folgende heuristische Überlegung. “Im Kleinen”
kann die Kurve K als Teil einer Geraden aufgefasst werden, dessen Länge sich als Diagonale in
einem Quader mit den Seitenlängen dx, dy, dz leicht zu
ds =
q
dx2 + dy 2 + dz 2
berechnet. Setzt man die Koordinatendifferenzen dx, dy, dz wie üblich den Differentialen gleich
dx = ẋ(t)dt ,
dy = ẏ(t)dt ,
dz = ż(t)dt ,
so erhält man
ds =
q
(ẋ(t))2 + (ẏ(t))2 + (ż(t))2 dt .
Die Länge eines “endlichen” Kurvenstücks ergibt sich dann durch Integration, d.h. durch Summierung der “infinitesimalen” Anteile. Dies liefert das oben angegeben Integral.
Bemerkung Wir haben hier mit Absicht nicht von einer Herleitung gesprochen. Eine genauere
Analyse zeigt nämlich, dass dem Begriff der Bogenlänge einer Kurve erst mit der angegebenen
40
U. Stammbach:
Analysis, Teil A
Formel überhaupt einen Inhalt erhält. Um der logischen Korrektheit Genüge zu tun, muss
der Mathematiker an dieser Stelle zeigen, dass die heuristisch gefundene Formel sinnvoll ist.
Dazu gehört zum Beispiel die Tatsache, dass die durch diese Formel gelieferte Bogenlänge unter
vernünftigen Bedingungen nicht von der gewählten Parametrisierung der Kurve abhängig ist.
Auf diese Probleme wollen wir hier natürlich nicht eingehen; wir überlassen sie gerne den Mathematikern.
Beispiel
Gesucht ist die Länge eines Zykloidenbogens.
Der Zykloidenbogen ist durch
t → (x(t), y(t)) = (at − a sin t, a − a cos t) , 0 ≤ t ≤ 2π
gegeben, mit tA = 0, tB = 2π. Wir erhalten ẋ(t) = a − a cos t, ẏ(t) = a sin t und damit
sB
A
Z
=
2π
0
= a
= a
Z
0
Z
(a2 − 2a2 cos t + a2 cos2 t + a2 sin2 t)1/2 dt
2π
2π
0
Z
= 2a
Z
= 2a
(2(1 − cos t))1/2 dt
q
2π
0
0
2π
4 sin2 (t/2) dt
| sin(t/2)| dt
sin(t/2) dt
= 2a [−2 cos(t/2)]2π
0
= 2a(2 + 2)
= 8a .
Man stellt die überraschende Tatsache fest, dass beim Rollen eines Kreises auf einer Geraden der
von einem Punkt der Kreisperipherie zurückgelegte Weg ein ganzzahliges Vielfaches des Radius
des Kreises ist.
Beispiel
Die Astroide (siehe Figur 1) ist gegeben durch die Parameterdarstellung
t → (x(t), y(t)) = (a cos3 t, a sin3 t) , 0 ≤ t ≤ 2π .
Gesucht ist die Bogenlänge der Kurve.
Wegen ẋ(t) = −3a cos2 t sin t, ẏ(t) = 3a sin2 t cos t und wegen der offensichtlichen Symmetrie der
Kurve erhält man für die Bogenlänge
41
Kapitel III. Integralrechnung
a
Fig. 1 :
Astroide
a
−a
−a
L = 4
Z
π/2
0
= 4·3·a
=
q
3a cos4 t · sin2 t + sin4 t · cos2 t dt
Z
π/2
0
2 π/2
6a [sin t]0
q
cos t sin t cos2 t + sin2 t dt
= 6a .
Wiederum ist überraschenderweise die Länge der Kurve ein ganzzahliges Vielfaches der in der
Parameterdarstellung vorkommenden Grösse a.
Ist die Kurve K in expliziter Form y = f (x) gegeben, so gehen wir wie üblich im ersten Schritt
zur zugehörigen Parameterdarstellung x → (x, f (x)) über. Wir erhalten dann für die Bogenlänge
zwischen den Punkten A und B
sB
A =
Z
xB
xA
q
1 + (f 0 (x))2 dx ,
wobei xA die x-Koordinate des Punktes A und xB diejenige des Punktes B bezeichnet.
42
U. Stammbach:
Analysis, Teil A
Beispiel Man bestimme die Länge der Kurve y = x2 zwischen den Punkten A = (−1, 1) und
B = (1, 1).
Nach obigem gilt
sB
A =
Z
p
1
1 + 4x2 dx = 2
−1
Z
1p
1 + 4x2 dx .
0
Für das Integral machen wir die Substitution 2x = u, 2dx = du und erhalten
sB
A =
=
=
Z
2p
1 + u2 du
0
i2
p
1h
Arsinh u + u u2 + 1
0
2
√ 1
Arsinh 2 + 2 5 .
2
Schliesslich behandeln wir noch den Fall, wo die Kurve K durch eine Gleichung in Polarkoordinaten gegeben ist. Ähnlich wie oben gehen wir in einem ersten Schritt zur zugehörigen
Parameterdarstellung mit Parameter ϕ über. Wir erhalten nach kurzer Rechnung
~r˙ (ϕ) = (ρ̇(ϕ) cos ϕ − ρ(ϕ) sin ϕ, ρ̇(ϕ) sin ϕ + ρ(ϕ) cos ϕ)
|~r˙ (ϕ)| = (ρ̇2 cos2 ϕ − 2ρ̇ρ cos ϕ sin ϕ + ρ2 sin2 ϕ + ρ̇2 sin2 ϕ + 2ρ̇ρ sin ϕ cos ϕ + ρ2 cos2 ϕ)1/2
= (ρ2 + ρ̇2 )1/2 .
Damit ergibt sich
Z
sB
A =
q
ϕB
ρ2 + ρ̇2 dϕ .
ϕA
Beispiel Man berechne die Bogenlänge der logarithmischen Spirale ρ = ekϕ zwischen den
Punkten A und B (siehe Figur 2).
Aus der obigen Überlegung erhalten wir mit ρ̇(ϕ) = k · ekϕ
sB
A =
=
=
Z
ϕB
p
ϕA
e2kϕ + k2 e2kϕ dϕ
p
Z
p
1 + k2
1+
k2
ϕB
ϕA
ekϕ dϕ
1 kϕ
e
k
ϕB
ϕA
43
Kapitel III. Integralrechnung
q
=
1 + 1/k2
q
ekϕB − ekϕA
1 + 1/k2 (ρB − ρA ) .
=
B
Fig. 2 :
Logarithmische Spirale
ϕB
ϕA
1
A
Wiederum hat die logarithmische Spirale eine Überraschung für uns bereit: Das Resultat besagt,
dass sich in Kreisringen gleicher Breite b = ρB −ρA gleichlange Kurvenstücke der logarithmischen
Spirale befinden.
Beispiel Wir betrachten zum Schluss dieses Abschnittes die sogenannte Klotoide; sie wird
durch die Parameterdarstellung t → (x(t), y(t)), beschrieben, wobei x(t) und y(t) durch die
(komplizierten) Formeln
Z
t
a 2
x(t) =
cos
u du ,
2
0
Z t
a 2
y(t) =
sin
u du .
2
0
gegeben sind. (Man beachte, dass u eine Integrationsvariable ist, der Kurvenparameter heisst
wie üblich t.) Wie man zeigen kann, sind die hier vorkommenden Integrale nicht elementar
ausdrückbar. Wir berechnen die Bogenlänge dieser Kurve zwischen den Punkten A und B der
44
U. Stammbach:
Analysis, Teil A
Kurve, wobei wir für A den zum Parameterwert t = 0 gehörigen Punkt, also den Nullpunkt des
Koordinatensystems wählen, und für B den zum Parameterwert T gehörigen Punkt. Wegen
a 2
t
2
a 2
ẏ(t) = sin
t
2
ẋ(t) = cos
erhalten wir
sB
A =
Z
0
Z
=
T
0
Z
=
T
T
0
q
ẋ2 + ẏ 2 dt
s
cos2
a 2
a 2
t + sin2
t dt
2
2
1 dt
= T .
Unser Parameter t ist also gleichzeitig die vom Ursprung des Koordinatensystems aus gemessene
Bogenlänge der Kurve. Berechnen wir die Krümmung der Klotoide, so erhalten wir wegen
a 2
t
2
a 2
at cos
t
2
ẍ(t) = −at sin
ÿ(t) =
mit der Krümmungsformel
at cos2
ẋÿ − ẍẏ
k(t) = 2
=
(ẋ + ẏ 2 )3/2
a
2
t2 + sin2
1
a
2
t2
= at .
Unsere Klotoide hat die interessante Eigenschaft, dass die Krümmung proportional zur Bogenlänge ist. Durchläuft man die Klotoide mit konstanter Schnelligkeit, so nimmt die Krümmung, also der Steuereinschlag bei der Fahrt, proportional zur Zeit zu (oder ab): Für ein angenehmes Befahren müssten Strassenkurven aus diesem Grunde eigentlich aus Klotoidenstücken
(und Kreisstücken) zusammengesetzt sein.
Wir haben in diesem letzten Beispiel eine Kurve vor uns, welche durch eine Parameterdarstellung mit der Bogenlänge als Parameter gegeben ist. Für viele theoretische Überlegungen ist es
am einfachsten, von einer solchen Kurvendarstellung auszugehen. Interpretiert man die Parameterdarstellung als Bewegung eines Massenpunktes, so bedeutet dies, dass die Kurve mit konstanter Schnelligkeit 1 durchlaufen wird; konsequenterweise ist dann |~r˙ (t)| ≡ 1.
45
Kapitel III. Integralrechnung
9
Volumenberechnung
In diesem Abschnitt wollen wir uns mit der Volumenberechnung beschäftigen. Wir nehmen an,
dass uns eine Beschreibung des Körpers im (x, y, z)-Koordinatensystem vorliegt. Ferner nehmen
wir an, dass der Flächeninhalt der Schnittfigur mit einer zur (y, z)-Ebene parallelen Ebene durch
die stetige Funktion x → F (x) gegeben sei. Um das Volumen des Körpers zu berechnen, wählen
wir auf der x-Achse eine Einteilung
a = x0 < x1 < · · · < xn−1 < xn = b
mit Zwischenpunkten ξk ∈ [xk−1 , xk ] und zerlegen den Körper durch Schnitte parallel zur (y, z)Ebene an den Stellen xk , k = 0, 1, . . . , n in Scheiben. Das Volumen V des zwischen der xKoordinate a und der x-Koordinate b liegenden Teils ist dann näherungsweise durch die Riemann’sche Summe (siehe Figur 1)
n
X
F (ξk )(xk − xk−1 )
k=1
gegeben. Der Grenzübergang über eine Folge von Einteilungen, deren Feinheit gegen Null strebt,
liefert das Integral
V =
Z
b
a
F (x) dx
das Volumen des zwischen den x-Koordinaten a und b liegenden Teils des Körpers.
Beispiel
Das Volumen des Ellipsoides
x2 y 2 z 2
+ 2 + 2 =1
a2
b
c
ist gesucht.
Wir schneiden den Körper mit der Ebene x = x0 . Als Schnittfigur erhalten wir
y2 z2
x20
+
=
1
−
,
b2
c2
a2
b2
y2
z2
=1.
+
1 − x20 /a2
c2 1 − x20 /a2
Dies ist für −a ≤ x0 ≤ a eine Ellipse mit Halbachsen
46
U. Stammbach:
Analysis, Teil A
(z)
Fig. 1 :
Volumen
F (x)
ξk
a
xk−1
xk
b
q
(x)
q
b 1 − x20 /a2 , c 1 − x20 /a2
in Richtung der y- bzw. z-Achse. Der Flächeninhalt der ellipsenförmigen Schnittfigur ist nach
einem früheren Resultat
F (x0 ) = πbc 1 − x20 /a2 .
Das Volumen des Ellipsoides berechnet sich dann wie folgt:
V =2
Z
a
0
x2
πbc 1 − 2
a
!
"
x3
dx = 2πbc x − 2
3a
#a
0
4
= πabc .
3
Bemerkung Wie man sich erinnert, wurde der Flächeninhalt einer Ellipse seinerzeit ebenfalls
mit Hilfe der Integralrechnung hergeleitet. Dies ist typisch für die Volumenberechnung: der
Flächeninhalt der Schnittfigur ist im allgemeinen wiederum durch ein Integral gegeben; man
hat eigentlich ein mehrfaches Integral vor sich.
Beispiel Gegeben ist ein auf der (x, y)-Ebene stehender gerader Kreiszylinder mit Grundkreis
x2 + y 2 = r 2 . Er werde durch die Ebene
47
Kapitel III. Integralrechnung
z=
h
(x + b) , 0 ≤ b ≤ r
r+b
abgeschnitten (siehe Figur 2). Was ist das Volumen des zwischen der (x, y)-Ebene und der
Schnittebene liegenden Stückes (Zylinderhuf)?
(z)
Fig. 2 :
Zylinderhuf
h
G(x)
b
r
(x)
Wir schneiden den Körper durch eine zur (y, z)-Ebene parallelen Ebene. Die Schnittfigur ist ein
Rechteck, es hat den Flächeninhalt
p
G(x) = 2
r2
−
x2
h
r+b
(x + b)
.
Das Volumen ergibt sich dann wie folgt
V
Z
=
=
=
r
−b
G(x) dx
Z
r
p
2h
(x + b) r 2 − x2 dx
r + b −b
Z r
Z r p
p
h
2hb
2x r 2 − x2 dx +
r 2 − x2 dx .
r + b −b
r + b −b
48
U. Stammbach:
Analysis, Teil A
Da der Integrand im ersten Integral ungerade ist, darf man die untere Grenze −b durch +b
ersetzen. Die Substitutionen r 2 − x2 = u, −2xdx = du im ersten und x = ru, dx = rdu im
zweiten Integral liefern dann
V
= −
=
h
r+b
Z
0
r 2 −b2
u1/2 du +
2hb 2
r
r+b

Z
1
p
1 − u2 du
−b/r
2 h
−b
hbr 2  π
(r 2 − b2 )3/2 +
− arcsin
3r+b
r+b 2
r
b
+
r
α
s

b2
1 − 2 .
r
Fig. 3 :
Zum Winkel α
r
b
Der durch α = π/2 − arcsin(−b/r) = π/2 + arcsin(b/r) gegebene Winkel hat eine offensichtliche
geometrische Bedeutung (siehe Figur 3). Mit dieser Bezeichnung erhalten wir
V =
p
r2
−
b2
h
r+b
2 2 1 2
hbr 2
r + b +
α.
3
3
r+b
49
Kapitel III. Integralrechnung
10
Oberflächenberechnung
Wir beschäftigen uns in diesem Abschnitt mit der Berechnung des Oberflächeninhaltes eines
Körpers, wobei wir uns auf den Fall eines Rotationskörpers beschränken. Der allgemeine Fall
führt auf sogenannte mehrfache Integrale; darauf werden wir im Laufe des zweiten Semesters
zurückkommen.
Gegeben ist also ein Rotationskörper; er entstehe durch Rotation des Kurvenstücks
t → (x(t), y(t)) , tA ≤ t ≤ tB
um die x-Achse; dabei setzen wir die Funktionen t → x(t) und t → y(t) stetig differenzierbar
voraus (siehe Figur 1). Wir stellen die Frage nach dem Inhalt der von der Kurve K bei der
Rotation überstrichenen Fläche. Wir nennen dies kurz den Oberflächeinhalt (eigentlich Mantelflächeninhalt) des Rotationskörpers. Dabei gehen wir das Problem naiv an und führen die
folgenden Plausibilitätsbetrachtungen durch. Wie bei der Volumenberechnung zerschneiden wir
den Körper in “dünne” Scheiben. Jede dieser Scheiben ist (approximativ) ein Kreiskegelstumpf.
Um dessen Mantelfläche zu bestimmen, rollen wir den Kegel in die Ebene ab. Die Mantelfläche
des Kegelstumpfs entspricht dann einem Kreisringsektor der (“schmalen”) Breite (siehe Figur
2)
ds =
q
ẋ(t)2 + ẏ(t)2 dt .
Sein Flächeninhalt ist (wiederum approximativ) gegeben durch
q
dO = 2πy(t) ẋ(t)2 + ẏ(t)2 dt .
Nach diesen Plausibilitätsbetrachtungen “muss” der Oberflächeninhalt des Rotationskörpers
durch
O = 2π
Z
tB
tA
y(t)
q
ẋ(t)2 + ẏ(t)2 dt
gegeben sein.
Wie schon bei unserer Behandlung der Bogenlänge einer Kurve haben wir uns hier bei der
Oberflächenberechnung mit heuristischen Argumenten begnügt. Vom mathematischen Standpunkt aus ist die Sachlage einiges komplizierter, als wir dies hier erscheinen lassen. Eigentlich
muss nämlich der neue Begriff, also der Begriff des Oberflächeninhaltes eines Körpers an dieser
50
U. Stammbach:
Analysis, Teil A
B
ds
Fig. 1 :
Oberfläche
y(t)
A
x(t)
dx
a
b
ds
Fig. 2 :
Mantelfläche des Kegelstumpfes
2πy(t)
51
Kapitel III. Integralrechnung
Stelle definiert werden. Dies kann für Rotationskörper durch die obige Formel geschehen. Allerdings muss der Mathematiker dann eine ganze Anzahl wichtiger Punkte abklären; z.B. muss er
zeigen, dass der durch die Formel für die Oberfläche gegebene Wert nicht von der gewählten
Parameterisierung der Kurve K abhängig ist. Wir gehen in dieser Vorlesung natürlich auf diese
Dinge nicht näher ein. Statt dessen betrachten wir die folgenden konkreten Beispiele.
Beispiel Gesucht ist der Oberflächeninhalt eines Torus. Wir stellen uns den Torus als Rotationskörper vor, indem wir den Kreis K mit Radius r und Mittelpunkt M = (0, R) um die
x-Achse rotieren lassen (siehe Figur 3). Der Kreis K ist offenbar gegeben durch
t → (x(t), y(t)) = (r cos t, R + r sin t) , 0 ≤ t ≤ 2π .
(y)
r
(0, R)
t
(x)
Fig. 3 :
Torus
Wegen
ẋ(t) = −r sin t ,
ẏ(t) = r cos t
erhalten wir für den Oberflächeninhalt des Torus
O = 2π
Z
0
2π
(R + r sin t)
q
r 2 sin2 t + r 2 cos2 t dt = 2π2πRr = 4π 2 Rr .
52
U. Stammbach:
Analysis, Teil A
Beispiel Wir betrachten den Kreis K mit Radius r um den Ursprung und fragen nach
dem Oberflächeninhalt der Kugelzone, die durch Rotation um die x-Achse des zwischen den
x-Koordinaten a und b befindlichen Teils K 0 des Kreises K entsteht.
(y)
K0
Fig. 4 :
Kugelzone
(x)
a
b
Der Kreis K wird durch die Gleichung x2 + y 2 = r 2 beschrieben. Daraus erhalten wir leicht eine
Parameterdarstellung des Kurvenstücks K 0 (mit Parameter t = x)
t → (x(t), y(t)) = (t,
p
r 2 − t2 ) , a ≤ t ≤ b .
Der Oberflächeninhalt des zugehörigen Rotationskörpers, also der Kugelzone ergibt sich dann
wegen
ẋ(t) = 1 ,
p
ẏ(t) = −t/ r 2 − t2
zu
O = 2π
Z
bp
a
r 2 − t2
q
1 + t2 /(r 2 − t2 ) dt = 2π
Z
b
a
r dt = 2πr(b − a) .
Kapitel III. Integralrechnung
53
Das Resultat verdient Beachtung: Der Oberflächeninhalt der Kugelzone zwischen den x-Koordinaten a und b ist gleich der Mantelfäche des die Kugel umschreibenden Zylinders zwischen
den x-Koordinaten a und b. Projiziert man folglich die (Erd-)Kugel von einem Durchmesser aus
auf den umschreibenden Zylinder und rollt man anschliessend den Zylinder in die Ebene ab, so
erhält man ein flächentreues (Karten-)Bild der (Erd-)Kugeloberfläche. Diese Tatsache wurde
1772 von J. H. Lambert (1728 - 1777) angegeben.
54
11
U. Stammbach:
Analysis, Teil A
Schwerpunkt, Flächenmittelpunkt
In diesem Abschnitt beschäftigen wir uns mit der Berechnung des Schwerpunktes eines mechanischen Systems. Wir fassen dabei den Schwerpunkt als Kraftmittelpunkt auf.
Zuerst betrachten wir in Richtung der y-Achse wirkende Kräfte K1 , K2 , . . . , Kn , die in den
Punkten x1 , x2 , . . . , xn der x-Achse angreifen. Der Kraftmittelpunkt xs dieses Systems genügt
dann der Gleichung
(x1 − xs )K1 + (x2 − xs )K2 + · · · + (xn − xs )Kn = 0 ,
so dass sich für xs die Formel
xs =
1
(x1 K1 + x2 K2 + · · · + xn Kn )
K1 + K2 + · · · + Kn
ergibt.
Wenn die Kräfte nicht diskret, sondern kontinuierlich verteilt sind, wenn also die Kraftdichte an
der Stelle x durch die Funktion x → G(x), x ∈ [a, b] gegeben ist, so genügt der Kraftmittelpunkt
xs in analoger Weise der Gleichung
xs
Z
b
a
G(x)dx =
Z
b
a
x G(x) dx .
Man beachte, dass
Z
b
a
G(x) dx
nichts anderes als die Totalkraft ist.
Wir wenden diese Überlegungen zuerst auf die Berechnung des Flächenmittelpunktes eines
Bereiches B der (x, y)-Ebene an. Darunter verstehen wir den Kraftmittelpunkt der Gravitationskräfte, die auf den homogen mit Masse der Dichte 1 belegten Bereich B wirken (Schwerpunkt).
Wirkt die Gravitationskraft in Richtung der y-Achse, so ist deren Kraftdichte G(x) an der Stelle
x natürlich einfach die Ausdehnung in y-Richtung des Bereiches B an der Stelle x. Wirkt
die Gravitationskraft in Richtung der x-Achse, so ist die Kraftdichte H(y) an der Stelle y die
Ausdehnung in x-Richtung des Bereiches B an der Stelle y (siehe Figur 1). Der Punkt (xs , ys )
mit
55
Kapitel III. Integralrechnung
(y)
d
G(x)
y
Fig. 1 :
Zur Berechnung des
Schwerpunktes
B
H(y)
c
(x)
a
x
b
xs
ys
Z
Z
b
a
d
c
Z
G(x) dx =
b
a
d
Z
H(y) dy =
c
x G(x) dx
y H(y) dy
ist dann der Flächenmittelpunkt des Bereiches B.
Beispiel Gesucht ist der Flächenmittelpunkt des Viertelkreises im ersten Quadranten mit
Radius R (siehe Figur 2).
Aus Symmetriegründen gilt natürlich xs = ys . Für xs erhalten wird die Gleichung
xs · r
2π
4
Z
=
0
r
x
Z
p
r 2 − x2 dx
p
1 r
(−2x) r 2 − x2 dx
2 0
ir
12h 2
= −
(r − x2 )3/2
0
23
1 3
=
r .
3
= −
56
U. Stammbach:
Analysis, Teil A
(y)
Fig. 2 :
Schwerpunkt des Viertelkreises
r
S
√
r2 − x2
(x)
x
Daraus ergibt sich
xs =
4
r.
3π
Der Schwerpunkt eines räumlichen Bereiches berechnet sich auf ganz analoge Weise. Auch dazu
ein Beispiel.
Beispiel Gesucht ist der Schwerpunkt einer homogenen Halbkugel (siehe Figur 3).
Offenbar dürfen wir voraussetzen, dass die Dichte 1 ist. Wir betrachten die Halbkugel als Rotationskörper, der durch Rotation eines Viertelkreises um die x-Achse entsteht. Der Schwerpunkt
(xs , ys , zs ) liegt aus Symmetriegründen natürlich auf der x-Achse; damit gilt ys = zs = 0. Für
xs haben wir die Gleichung
xs
Z
0
r
G(x)dx =
Z
0
r
x G(x) dx ,
wobei G(x) die Kraftdichte der Gravitation in Richtung der z-Achse bezeichnet. Offensichtlich
gilt
57
Kapitel III. Integralrechnung
Fig. 3 :
Schwerpunkt einer Halbkugel
G(x) = π(r 2 − x2 ) .
Ferner lässt sich die totale Kraft, das Gewicht der Halbkugel direkt angeben:
Z
r
0
2
G(x)dx = πr 3 .
3
Damit erhält man
2
xs · πr 3 = π
3
Z
0
r
"
x2 r 2 x 4
x(r − x ) dx = π
−
2
4
2
2
#r
=π
0
r4 r4
−
2
4
!
,
und es ergibt sich
xs =
3
r.
8
Formal das gleiche Integral wie bei der Schwerpunktberechnung tritt auch in ganz anderem
Zusammenhang auf, z.B. in der Wahrscheinlichkeitsrechnung beim Mittelwert einer Wahrscheinlichkeitsverteilung.
58
12
U. Stammbach:
Analysis, Teil A
Trägheitsmoment
Eine weitere physikalisch-mechanische Anwendung des Integrals betrifft das sogenannte Trägheitsmoment. Es tritt etwa bei der Berechnung der kinetischen Energie eines rotierenden
starren Systems auf. Derselben mathematischen Bildung begegnet man aber in vielen anderen Zusammenhängen ebenfalls, in der Mechanik bei der Behandlung von Torsions- und
Biegungsproblemen, in der Wahrscheinlichkeitsrechnung beim Begriff der Varianz, etc.
Wie im Abschnitt über die Schwerpunktsberechnung betrachten wir zuerst ein diskretes System. Es bestehe aus Massenpunkten der Masse m1 , m2 , . . . , mn , die sich in den Punkten
(x1 , y1 , z1 ), (x2 , y2 , z2 ), . . . , (xn , yn , zn ) befinden. Wir lassen dieses System mit der Winkelgeschwindigkeit ω um die z-Achse rotieren, und fragen nach der kinetischen Energie T . Da die
Masse mi bei dieser Rotation die Geschwindigkeit
(x2i + yi2 )1/2 ω
besitzt, ist T gegeben durch
T =
1
m1 (x21 + y12 ) + m2 (x22 + y22 ) + · · · + mn (x2n + yn2 ) ω 2 .
2
Definitionsgemäss heisst die hier auf natürliche Art auftretende Grösse
Θz = m1 (x21 + y12 ) + m2 (x22 + y22 ) + · · · + mn (x2n + yn2 )
das Trägheitsmoment des Systems um die z-Achse. Auf analoge Weise sind das Trägheitsmoment
Θx um die x-Achse
Θx = m1 (y12 + z12 ) + m2 (y22 + z22 ) + · · · + mn (yn2 + zn2 )
und das Trägheitsmoment Θy um die y-Achse
Θy = m1 (x21 + z12 ) + m2 (x22 + z22 ) + · · · + mn (x2n + zn2 )
definiert.
Wir entnehmen diesen Überlegungen die Tatsache, dass das Trägheitsmoment eines mechanischen Systems um die Achse a definiert ist als Summe der Produkte d2 · md , wo md die Masse
des Systems bezeichnet, welches sich im Abstand d von der Achse a befindet. Diese Aussage
59
Kapitel III. Integralrechnung
überträgt sich vom diskreten auf den kontinuierlichen Fall. Wir betrachten dazu wie üblich
einige konkrete Beispiele.
Beispiel
Es sei ein zwischen den x-Werten a und b, a ≤ b liegender Bereich B in der
(x, y)-Ebene gegeben, der homogen mit Masse der Dichte ρ belegt ist. Wir fragen nach dem
Trägheitsmoment Θy dieses Systems bezüglich der y-Achse. (Vergleiche Figur 1, p. 55.)
Der Abstand von der y-Achse ist gegeben durch d = x, und die in diesem Abstand konzentrierte
Masse ist ρG(x) dx, wo G(x) die Ausdehnung in y-Richtung des Bereichs an der Stelle x ist.
Das Trägheitsmoment Θy ist folglich gegeben durch das Integral
Θy = ρ
Z
b
a
x2 G(x) dx ,
und die kinetische Energie bei der Rotation mit Winkelgeschwindigkeit ω um die y-Achse ist
Ty =
1
Θy ω 2 .
2
Auf ganz analoge Weise erhält man das Trägheitsmoment Θx des Bereichs B bezüglich der xAchse. Es liege B zwischen den y-Werten c und d, c ≤ d, und es bezeichne H(y) die Ausdehnung
in x-Richtung des Bereichs B an der Stelle y. Dann gilt
Θx = ρ
Z
d
c
y 2 H(y) dy .
(Für ρ = 1 spricht man auch von den Flächenträgheitsmomenten des Bereichs B bezüglich
der x- und der y-Achse und bezeichnet sie mit Jx und Jy .)
Beispiel Gesucht ist das (Flächen-)Trägheitsmoment eines Kreises mit Radius r um einen
Durchmesser (siehe Figur 1).
Offensichtlich ist
G(x) = 2
p
r 2 − x2 ,
so dass sich für das Flächenträgheitsmoment Jy um die y-Achse
Z
Jy = 2
r
0
p
2x2 r 2 − x2 dx
ergibt. Die Substitution x = r sin t, dx = r cos t dt liefert dann
Jy = 4
Z
π/2
0
= 4r 4
Z
0
r 2 sin2 t r cos t r cos t dt
π/2
(sin2 t − sin4 t) dt
60
U. Stammbach:
Analysis, Teil A
(y)
r
√
r2 − x2
(x)
Fig. 1 :
Trägheitsmoment eines
Kreises um einen Durchmesser
x
= 4r
=
4
π1 π13
−
22 224
π 4
r .
4
Beispiel Gesucht ist das Trägheitsmoment eines homogenen Vollzylinders (Dichte ρ) um seine
Achse.
Wir betrachten den auf der (x, y)-Ebene stehenden Kreiszylinder mit Radius r und Höhe h.
Seine Achse falle mit der z-Achse zusammen. Im Abstand x von der z-Achse befindet sich die
Masse
dm = ρ (2πx) h dx .
Damit erhalten wir für das Trägheitsmoment Θz
Θz = ρ
Z
0
r
x2 (2πx) h dx
"
x4
= 2πρh
4
1
=
πρhr 4 .
2
#r
0
61
Kapitel III. Integralrechnung
Aus diesem Resultat ergibt sich ohne Schwierigkeit auch das Trägheitsmoment Θ einer Kreisscheibe um eine senkrecht dazu stehende Achse durch den Mittelpunkt. Ist die (Flächen-)Dichte
gleich 1, so erhält man dafür
1
Θ = πr 4 .
2
Man nennt dies auch das polare Flächenträgheitmoment J0 der Kreisscheibe. Man vergleiche an
dieser Stelle die Werte der Flächenträgheitsmomente Jx , Jy , J0 der Kreisscheibe.
Beispiel Gesucht ist das Trägheitsmoment Θx des von dem Graphen von x → f (x), x ∈ [a, b]
bei der Rotation um die x-Achse erzeugten (homogenen) Rotationskörpers bezüglich seiner Achse
(siehe Figur 2).
y = f (x)
f (x)
dx
a
x
b
Fig. 2 :
Trägheitsmoment eines
Rotationskörpers um
seine Achse
Wir gehen hier ähnlich vor wie bei der Volumen- und Oberflächenberechnung von derartigen Rotationskörpern und zerschneiden diesen in “dünne” Scheiben der Dicke dx. Jede solche Scheibe
kann dann (approximativ) als Vollzylinder mit Radius f (x) und Höhe dx angesehen werden, so
dass ihr Trägheitsmoment dΘx nach dem vorhergehenden Beispiel durch
1
dΘx = πρ dx (f (x))4
2
gegeben ist. Das Trägheitsmoment des ganzen Körpers ergibt sich daraus durch Integration
62
U. Stammbach:
Θx =
1
πρ
2
Z
b
a
Analysis, Teil A
(f (x))4 dx .
Beispiel Gesucht ist das Trägheitsmoment einer homogenen Vollkugel mit Radius R um einen
Durchmesser (siehe Figur 3).
Fig. 3 :
Vollkugel
Wir berechnen das Trägheitsmoment Θx der homogenen Vollkugel mit Mittelpunkt im Ursprung
und Radius R, wobei wir diese als Rotationskörper bezüglich der x-Achse ansehen, der zur
Funktion
x → f (x) =
p
R2 − x2 , x ∈ [−R, +R]
gehört. Wir erhalten nach dem obigen Beispiel
Θx =
1
πρ
2
= πρ
Z
Z
0
+R
−R
R
(R2 − x2 )2 dx
(R4 − 2R2 x2 + x4 ) dx
2
1
= πρ R4 x − R2 x3 + x5
3
5
R
0
63
Kapitel III. Integralrechnung
= πρR5 1 −
=
2 1
+
3 5
8
πρR5 .
15
Beispiel Gesucht ist das Trägheitsmoment eines homogenen Torus (Dichte ρ) um seine Achse
(siehe Figur 4).
Fig. 4 :
Torus
Wir betrachten den Torus als Rotationskörper, der von einem Kreis mit Radius r und Mittelpunkt (R, 0, 0) bei der Rotation um die z-Achse erzeugt wird und gehen ähnlich vor wie bei
der Berechnung des Trägheitsmomentes des Kreiszylinders. Die Masse, die den Abstand x von
der Rotationsachse besitzt, ist offenbar gegeben durch (siehe Figur 5)
q
dm = 2πρx 2 r 2 − (x − R)2 dx ,
so dass der davon resultierende Anteil dΘz an das Trägheitsmoment sich zu
q
dΘz = 2πρx3 2 r 2 − (x − R)2 dx
ergibt. Integration liefert dann Θz
64
U. Stammbach:
Analysis, Teil A
(z)
r
(R, 0, 0)
Fig. 5 :
Trägheitsmoment eines
Torus um seine Achse
(x)
x
Z
Θz = 4πρ
R+r
R−r
q
x3 r 2 − (x − R)2 dx .
Wir lösen dieses Integral mit Hilfe der Substitution x − R = r sin t, dx = r cos t dt und erhalten
Z
Θz = 4πρ
= 4πρr
π/2
(R + r sin t)3 r cos t r cos t dt
−π/2
Z π/2
2
= 4πρr 2
−π/2
Z π/2
−π/2
(R3 + 3R2 r sin t + 3Rr 2 sin2 t + r 3 sin3 t)(1 − sin2 t) dt
(R3 + 3Rr 2 sin2 t − R3 sin2 t − 3Rr 2 sin4 t) dt .
Dabei haben wir im letzten Schritt benützt, dass das Integral über eine ungerade Funktion Null
ist, wenn das Integrationsintervall symmetrisch zum Nullpunkt liegt. Die Integration liefert nun
mit den in Abschnitt 6 hergeleiteten Formeln
Θz = 4πρr
2
2π
3π
2π
3
R π + 3Rr
− R − 3Rr
2
2
24
3
2
= 2π ρr
2
3
R − Rr 2
4
3
.
Das Trägheitsmoment oder die kinetische Energie eines rotierenden starren Körpers, wie auch
schon die Integrale, die bei der Schwerpunktberechnung aufgetreten sind, sind eigentlich Beispiele
65
Kapitel III. Integralrechnung
für einen allgemeineren Begriff des Integrals. Wir erklären dies an dieser Stelle kurz am Beispiel
der kinetischen Energie, werden aber gegen Ende des Semesters auf diesen Punkt in voller
Allgemeinheit eingehend zurückkommen. Der Einfachheit halber betrachten wir einen (dreidimensionalen) starren Körper B mit homogener Massenverteilung (Dichte ρ konstant). Rotiert
dieser Körper um die Achse a mit der Winkelgeschwindigkeit ω, so trägt das “Volumenelement
dV ” zur kinetischen Energie die Grösse
1
1
dT = ρdV (lω)2 = ρω 2 l2 dV
2
2
bei, wobei l den Abstand des Volumenelementes dV von der Rotationsachse bezeichnet. “Summation” über alle Volumenelemente von B und Grenzübergang über eine Folge von immer feiner
werdenden Unterteilungen des Bereiches B liefert dann das sogenannte Volumenintegral
T =
ZZZ
B
1
1
ρ ω 2 l2 dV = ρ ω 2
2
2
ZZZ
B
l2 dV .
Konsequenterweise ist das Trägheitsmoment als Volumenintegral
Θ=ρ
ZZZ
B
l2 dV
gegeben. Zur Definition des Volumenintegrals geht man also ganz ähnlich vor wie bei der
Definition des gewöhnlichen Riemann’schen Integrals (siehe Abschnitt 1). Es sei ein räumlicher
Bereich B und eine darauf definierte reellwertige Funktion
f : (x, y, z) → f (x, y, z) , D(f ) = B
gegeben. Um zum Integral
ZZZ
B
f (x, y, z) dV
zu gelangen führt man die folgenden Schritte durch:
(a) Teile B in n kleine Teile ∆Bi mit Volumen ∆Vi ein , i = 1, 2, . . . , n.
(b) Wähle in jedem ∆Bi einen Punkt (xi , yi , zi ). Die Feinheit der Einteilung ist definiert als
Durchmesser der kleinsten Kugel, in der jedes einzelne der ∆Bi Platz hat.
(c) Bilde die Riemann’sche Summe
f (x1 , y1 , z1 )∆V1 + f (x2 , y2 , z2 )∆V2 + · · · + f (xn , yn , zn )∆Vn .
66
U. Stammbach:
Analysis, Teil A
(d) Definiere das Integral
ZZZ
B
f (x, y, z) dV = lim (f (x1 , y1 , z1 )∆V1 + f (x2 , y2 , z2 )∆V2 + · · · + f (xn , yn , zn )∆Vn )
als Limes der Riemann’schen Summe, wobei für den Grenzübergang eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null strebt.
Wie beim ursprünglichen Riemann’schen Integral zeigt man, dass der Grenzwert im Schritt (d)
nicht von der Wahl der Punkte (xi , yi , zi ) und auch nicht von der Wahl der Folge der Einteilungen
abhängt, falls der Integrand f eine stetige Funktion ist. - Im Beispiel des Trägheitsmomentes
ZZZ
B
l2 dV
ist die Funktion f durch l2 gegeben, d.h. der Funktionswert f (x, y, z) ist das Quadrat des
Abstandes des Punktes (x, y, z) von der Achse a.
67
Kapitel III. Integralrechnung
13
Uneigentliche Integrale
Das Symbol
Z
b
a
f (x)dx
haben wir im Abschnitt 1 unter zwei Voraussetzungen definiert, nämlich:
(a) das Intervall [a, b] ist endlich;
(b) der Integrand x → f (x) ist in [a, b] stetig.
Beispiele zeigen, dass das übliche Vorgehen bei der Berechnung bestimmter Integrale auf falsche
Resultate führen kann, wenn man etwa von der zweiten Voraussetzung abgeht. Hier wollen wir
versuchen, die Voraussetzungen abzuschwächen, indem wir den Begriff des bestimmten Integrals
sorgfältig erweitern.
Wir wenden uns zuerst den sogenannten uneigentlichen Integralen 2. Gattung zu (die
Terminologie ist historisch bedingt und leider wiederum recht unglücklich). In solchen Integralen
ist zwar der Integrand stetig, aber das Integrationsintervall unendlich, etwa [a, ∞). Für ein
Integral dieser Art definieren wir
Z
∞
a
f (x)dx = lim
Z
ξ
ξ→∞ a
f (x)dx .
Das uneigentliche Integral existiert (konvergiert), wenn der Limes auf der rechten Seite existiert;
der Wert des Integrals ist in diesem Fall gleich dem Wert des Limes. Analog geht man vor, wenn
das Integrationsintervall von der Form (∞, b] ist.
Beispiel (siehe Figur 1)
Z
0
∞
1
dx = lim
ξ→∞
1 + x2
Beispiel
Z
ξ
0
1
dx = lim [arctan x]ξ0 = lim (arctan ξ − arctan 0) = π/2
2
ξ→∞
ξ→∞
1+x
(siehe Figur 2)
Z
0
∞
e−x dx = lim
Z
ξ→∞ 0
ξ
e−x dx = lim −e−ξ + e−0 = 1
ξ→∞
68
U. Stammbach:
y=
Analysis, Teil A
1
1 + x2
Fig. 1 :
Die Funktion
x→
y = e−x
1
1 + x2
Fig. 2 :
Die Funktion
x → e−x
Kapitel III. Integralrechnung
69
Beispiel
∞
ξ
sin x dx = lim
ξ→∞ 0
0
sin x dx = lim (− cos ξ + cos 0) existiert nicht!
ξ→∞
Beispiel Uneigentliche Integrale 2. Gattung treten in Anwendung öfter auf. Wir berechnen die
Fluchtgeschwindigkeit aus dem Gravitationsfeld einer homogenen Kugel. Die Gravitationskraft
einer homogenen Kugel der Masse M auf einen Massenpunkt der Masse m im Abstand r vom
Mittelpunkt (und ausserhalb) der Kugel ist gegeben durch
M ·m
,
r2
K(r) = −k
wo k die Gravitationskonstante ist. Für die Fluchtgeschwindigkeit v eines Massenpunktes im
Abstand R vom Mittelpunkt der Kugel muss die Gleichung
1
mv 2 =
2
∞
k
R
mM
dr
r2
(Gleichsetzung der kinetischen und der potentiellen Energie) erfüllt sein. Daraus folgt
1 2
v = kM
2
∞
1
R
r2
dr = kM lim −
ξ→∞
1
r
ξ
= kM
R
1
,
R
also
v=
2kM
R
1/2
.
Im Folgenden wollen wir die Diskussion ganz auf den Fall von positiven, monoton fallenden
Funktionen beschränken. Ist f eine solche Funktion, so ergibt sich aus der Definition sofort,
dass das uneigentlichen Integral
∞
f (x)dx
a
nur existieren kann, wenn f (x) für x → ∞ gegen Null strebt. Diese Bedingung ist aber nicht
hinreichend, wie das folgende Beispiel zeigt!
Beispiel (siehe Figur 3)
∞
1
1
x
dx = lim
ξ
1
ξ→∞ 1
x
dx = lim (log ξ − log 1) = lim log ξ existiert nicht!
ξ→∞
ξ→∞
70
U. Stammbach:
Analysis, Teil A
4
3
Fig. 3 :
Die Funktion
2
x → 1/x
1
-1
1
2
3
4
-1
4
3
Fig. 4 :
Die Funktion
2
x → 1/x2
1
-1
1
-1
2
3
4
71
Kapitel III. Integralrechnung
Beispiel
(siehe Figur 4) Es sei 0 < k < ∞, k 6= 1.
Z
1
∞
1
dx = lim
ξ→∞
xk
Z
ξ
1
1
dx = lim
k
ξ→∞
x
1−k
1
1
ξ k−1
−1
.
Dieser Limes existiert für k > 1, er existiert nicht für 0 < k < 1.
Begegnet man im Laufe einer Rechnung einem uneigentlichen Integral, so muss man sich als erstes über dessen Existenz Klarheit verschaffen. Existiert das Integral nämlich nicht, so handelt
es sich um ein leeres Symbol, und ein Weiterrechnen kann zu falschen Resultaten führen. Der
Mathematiker kennt eine ganze Anzahl von sogenannten Vergleichskriterien, die einem die Untersuchung von uneigentlichen Integralen erleichtern. Wir wollen auf diese Kriterien hier nicht
eingehen, aber an einem Beispiel illustrieren, wie Vergleiche des Integranden mit gut bekannten
Funktionen in diesem Zusammenhang nützlich sind.
Beispiel Wir fragen nach der Existenz bzw. Nichtexistenz des uneigentlichen Integrals (siehe
Figur 5)
Z
∞
1
2
e−x dx .
Ausgehend nur von der Definition des uneigentlichen Integrals kann dieses nicht auf Existenz
2
untersucht werden, weil die Stammfunktion von x → e−x nicht elementar ausdrückbar ist. Wir
müssen also auf andere Weise vorgehen. Die Frage - geometrisch interpretiert - lautet, ob die
2
Fläche zwischen 1 und ∞ unter dem Graphen von x → e−x endlich oder unendlich ist. Zu
diesem Zweck vergleichen wir diese Funktion mit x → e−x . Offensichtlich gilt für x ≥ 1 die
Ungleichung
2
0 < e−x ≤ e−x .
Daraus folgt für jedes ξ ≥ 1
0≤
Z
ξ
1
2
e−x dx ≤
Z
ξ
1
e−x dx = −e−ξ + e−1 < e−1 .
Nun ist aber
Z
1
ξ
2
e−x dx
in ξ monoton wachsend. Da es durch 1/e beschränkt ist, muss der Limes
Z
lim
ξ→∞ 1
ξ
2
e−x dx
72
U. Stammbach:
y = e−x
Analysis, Teil A
2
Fig. 5 :
Die Funktionen
x → e−x
2
x → e−x
y = e−x
existieren. Unser uneigentliches Integral existiert deshalb. Dank dem Vergleich des Integranden
mit einer einfacheren Funktion ist es uns gelungen, dies nachzuweisen, obschon die Stammfunktion nicht elementar ausdrückbar ist. Wir bemerken noch, dass wegen
Z
0
∞
2
e−x dx =
Z
1
0
2
e−x dx +
Z
1
∞
2
e−x dx
auch das Integral
Z
0
∞
2
e−x dx
existiert. Dessen Wert werden wir später explizit berechnen. Dieses Integral spielt in der Wahrscheinlichkeitstheorie eine zentrale Rolle.
Wir wenden uns jetzt den uneigentlichen Integralen 1. Gattung zu. Bei diesen ist das
Integrationsintervall [a, b] endlich, aber der Integrand ist nur auf dem einseitig offenen Intervall
(a, b] (oder [a, b)) stetig. Wir definieren, ganz analog zum Vorgehen im obigen Fall,
Z
b
a
f (x)dx = lim
Z
ξ→a+ ξ
b
f (x)dx .
73
Kapitel III. Integralrechnung
Beispiel
Z
1
0
Beispiel
1
dx = lim
x
ξ→0+
Z
ξ
1
1
dx = lim (log 1 − log ξ) existiert nicht!
x
ξ→0+
Es sei 0 < k, k 6= 1 und a < b.
Fig. 6 :
Die Funktion
y=
1
(x − 1)1/2
b
a
1
(x − 1)1/2
b
1
Z
x→
1
dx = lim
(x − a)k
ξ−a+
Z
b
ξ
1
1
1
1
dx =
−
lim
k
k−1
+
(x − a)
1 − k ξ−a
(b − a)
(ξ − a)k−1
.
Dieser Limes, und demzufolge das Integral, existiert für 0 < k < 1; er existiert nicht für 1 < k.
Beispiel
Z
0
1
log x dx = lim+
ξ→0
Z
ξ
1
log x dx = lim+ [x(log x − 1)]1ξ = lim+ (−1 − ξ log ξ + ξ) = −1 .
ξ→0
ξ→0
Teil B
Kapitel IV. Funktionen von mehreren Variablen
Differentialrechnung
Kapitel V. Funktionen von mehreren Variablen
Integralrechnung
Kapitel VI. Vektoranalysis
Ich behaupte sogar, dass in jeder besonderen Naturlehre nur soviel eigentliche Wissenschaft angetroffen werden könne, als darin Mathematik anzutreffen
ist.
Immanuel Kant (1724 – 1804)
Inhaltsverzeichnis, Teil B
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
1
Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3
Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . .
18
4
Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
5
Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
6
Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
7
Funktionen von drei Variablen
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
8
Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
Kapitel V. Funktionen von mehreren Variablen, Integralrechnung
1
Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . .
12
3
Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
4
Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . .
30
5
Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
Kapitel VI. Vektoranalysis
1
Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Differentialoperatoren der Vektoranalysis
. . . . . . . . . . . . . . . . . . . . . .
11
3
Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
4
Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
5
Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
6
Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . .
40
7
Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
8
Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
9
Eine Anwendung des Satzes von Stokes
. . . . . . . . . . . . . . . . . . . . . . .
65
10
Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel IV.
Funktionen von mehreren Variablen
Differentialrechnung
Calculation is the way to the truth.
J. Frank Adams (1930-1989), Professor in Cambridge,
berühmter Mathematiker im Gebiet der algebraischen Topologie
1
0.5
2
0
1
-0.5
-1
-2
0
-1
0
-1
1
2 -2
Inhaltsverzeichnis
1
Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3
Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . .
18
4
Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
5
Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
6
Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
7
Funktionen von drei Variablen
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
8
Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
1
3
Funktionen von zwei Variablen
Wir betrachten in diesem Abschnitt Funktionen f , die auf einem Teilbereich A der Ebene R × R
definiert sind und Werte in R annehmen
f : (x, y) → f (x, y), D(f ) = A ∈ R × R .
Man nennt dann f eine Funktion der zwei Variablen x und y (siehe Figur 1). Wir erinnern
daran, dass A Definitionsbereich D(f ) von f und dass die Menge der reellen Zahlen, die unter
f als Werte auftreten, Wertebereich W (f ) von f heisst.
f (x, y)
0
(y)
R
Fig. 1 :
Funktion von zwei Variablen
R ×R
f
A
(x, y)
(x)
Bereits früher haben wir gesehen, wo Funktionen mehrerer Variablen auf natürliche Weise
auftreten. Im vorliegenden Kapitel geht es im wesentlichen darum, die Methoden der Differentialrechnung auf solche Funktionen anzuwenden.
Beispiel
Sind reelle Zahlen a, b, c gegeben, so heisst die Funktion
4
U. Stammbach: Analysis, Teil B
f : (x, y) → f (x, y) = ax + by + c, D(f ) = R × R
linear. Für (a, b) 6= (0, 0) besteht der Wertebereich W (f ) offenbar aus allen reellen Zahlen.
Beispiel
Die Funktion
g : (x, y) → g(x, y) =
q
1 − (x2 + y 2 )
besitzt als (grösstmöglichen) Definitionsbereich den Einheitskreis
D(g) = {(x, y)|x2 + y 2 ≤ 1} .
Der Wertebereich W (g) ist offenbar das Intervall [0, 1].
Zur Veranschaulichung einer Funktion f : (x, y) → f (x, y) von zwei Variablen ist der Graph
Γ(f ) von f nützlich; es ist dies die Teilmenge des dreidimensionalen Raumes, welche durch
Γ(f ) = {(x, y, z)|(x, y) ∈ D(f ), z = f (x, y)}
gegeben ist.
Beispiel Der Graph der linearen Funktion f : (x, y) → ax + by + c ist die durch die Gleichung
zp = ax + by + c beschriebene Ebene (siehe Figur 2). Der Graph der Funktion g : (x, y) →
1 − (x2 + y 2 ) ist die über dem Einheitskreis liegende Halbkugeloberfläche x2 + y 2 + z 2 = 1
(siehe Figur 3).
Der Graph einer Funktion von zwei Variablen ist definitionsgemäss eine (i.a. gekrümmte) Fläche
im dreidimensionalen Raum. Er lässt sich mit den üblichen Darstellungsmitteln veranschaulichen, die für die Abbildung von Objekten im dreidimensionalen Raum entwickelt worden sind.
Sehr nützlich sind in diesem Zusammenhang Darstellungsmittel der Kartographie, welche die
über (bzw. unter) der (x, y)-Ebene liegende Fläche Γ(f ) durch Niveaulinien (Höhenlinien, Isobaren, etc.) beschreiben.
Die Niveaulinie von f zum Niveau C ist diejenige Kurve in der (x, y)-Ebene, auf der die
Funktion f überall den Wert C annimmt. Als Kurve in der (x, y)-Ebene ist sie gegeben durch
die Gleichung f (x, y) = C.
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
Fig. 2 :
Graph einer linearen Funktion
10
7.5
3
5
2.5
2
0
0
1
1
2
3 0
Fig. 3 :
Graph der
p Funktion
g(x, y) = 1 − (x2 + y 2 )
5
6
Beispiel
U. Stammbach: Analysis, Teil B
Die Niveaulinie zum Niveau C der Funktion
f : (x, y) → f (x, y) = x2 − y 2
ist gegeben durch die Gleichung
x2 − y 2 = C .
Für C = 0 ist dies das Geradenpaar der Winkelhalbierenden des Koordinatensystems der (x, y)Ebene. Für C > 0 besteht die Kurve aus zwei Hyperbelästen, welche die x-Achse schneiden.
Für C < 0 besteht die Kurve aus zwei Hyperbelästen, welche die y-Achse schneiden. Jeder
Kartenleser erkennt am Bild dieser Niveaulinien das Aussehen des Geländes, d.h. des Graphen
von f : es ist ein “Passübergang” mit dem Nullpunkt des Koordinatensystems als “Passhöhe”;
die y-Achse beschreibt eine über den “Pass” führende “Strasse” (siehe Figuren 4, 5).
Beispiel Der Graph der Funktion f : (x, y) → x2 + y 2 ist ein über der (x, y)-Ebene liegendes
Paraboloid (siehe Figur 6). Die Niveaulinien sind Kreise um den Ursprung der (x, y)-Koordinatenebene (siehe Figur 7).
Beispiel Die Zustandsgleichung eines idealen Gases liefert die absolute Temperatur T als
Funktion des Druckes p und des Volumens V
T : (p, V ) → T (p, V ) =
1
pV, 0 ≤ p, V < ∞ .
R
Die Niveaulinien zum Niveau C dieser Funktion ist durch die Gleichung
1
pV = C
R
gegeben. Offenbar ist jede Niveaulinie ein Hyperbelast im ersten Quadranten der (p, V )-Ebene.
Da auf diesen Niveaulinien die Temperatur konstant ist, nennt man sie in der Physik Isothermen.
Beispiel
Funktion
Auch kompliziertere Funktionen, wie etwa die auf der ganzen (x, y)-Ebene definierte
h : (x, y) → h(x, y) = sin x sin y
lassen sich mit Hilfe der Niveaulinien gut veranschaulichen (siehe Figuren 8, 9).
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
Fig. 4 :
Graph der Funktion
f : (x, y) → f (x, y) = x2 − y 2
5
0
2
-5
0
-2
0
-2
2
3
2
1
Fig. 5 :
Niveaulinien der Funktion
f : (x, y) → f (x, y) = x2 − y 2
0
-1
-2
-3
-3
-2
-1
0
1
2
3
7
8
U. Stammbach: Analysis, Teil B
Fig. 6 :
Graph der Funktion
f : (x, y) → x2 + y 2
8
6
2
4
1
2
0
-2
0
-1
0
-1
1
2 -2
2
1.5
1
Fig. 7 :
Niveaulinien der Funktion
f : (x, y) → x2 + y 2
0.5
0
-0.5
-1
-1.5
-2
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
Fig. 8 :
Graph der Funktion
h : (x, y) → h(x, y) = sin x sin y
1
0.5
2
0
1
-0.5
-1
-2
0
-1
0
-1
1
2 -2
2
1.5
1
Fig. 9 :
Niveaulinien der Funktion
h : (x, y) → h(x, y) = sin x sin y
0.5
0
-0.5
-1
-1.5
-2
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
9
10
2
U. Stammbach: Analysis, Teil B
Partielle Ableitungen
Man stelle sich den Graphen Γ(f ) der Funktion f : (x, y) → f (x, y) als “Gelände” über der
(x, y)-Ebene vor (beschrieben etwa durch die Niveaulinien). Ferner stelle man sich vor, dass ein
Wanderer in diesem Gelände einem Weg folgt, der in der (x, y)-Ebene durch die Parallele y = y0
zur x-Achse beschrieben wird. Von eminenter Wichtigkeit für unseren Wanderer ist die Frage
nach der Steigung des Weges.
Wir erhalten diese Steigung, indem wir uns ein “Profil” des Weges in einem (x, z)-Koordinatensystem zeichnen. Es ist dies offenbar der Graph der Funktion (der einzigen Variablen x)
ϕ : x → z = f (x, y0 ) .
Die gesuchte Steigung (an der Stelle (x0 , y0 )) ist dann die Ableitung von ϕ nach x (an der Stelle
x0 ). Diese Grösse heisst partielle Ableitung von f : (x, y) → f (x, y) nach x an der Stelle
(x0 , y0 ). Man bezeichnet sie durch das Symbol
fx (x0 , y0 ) oder
∂f
(x0 , y0 ) .
∂x
Formal ist sie als Grenzwert
fx (x0 , y0 ) = lim
∆x→0
f (x0 + ∆x, y0 ) − f (x0 , y0 )
∆x
definiert. In analoger Weise erhält man die partielle Ableitung fy von f nach y.
Sowohl die partielle Ableitung fx von f nach x, wie die partielle Ableitung fy von f nach y sind
offensichtlich wieder Funktionen der zwei Variablen x und y. Sie können also ihrerseits partiell
abgeleitet werden. Man erhält so die zweiten partiellen Ableitungen
fxx , fxy , fyx , fyy ,
wobei wir, wie allgemein üblich, fxx = (fx )x , fxy = (fx )y , fyx = (fy )x , fyy = (fy )y gesetzt
haben. Diese sind, falls sie existieren, wiederum Funktionen von zwei Variablen. Ihre nochmalige
partielle Ableitung liefert die dritten partiellen Ableitungen
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
Fig. 1 :
Graph der Funktion f
0 ≤ x ≤ 2.5, −1 ≤ y ≤ 1.5
10
1.5
7.5
5
1
2.5
0.5
0
0
0.5
0
1
-0.5
1.5
2
2.5 -1
2
1.5
1
Fig. 2 :
Niveaulinien der Funktion f
−0.5 ≤ x ≤ 3, −1.5 ≤ y ≤ 2
0.5
0
-0.5
-1
-1.5
-0.5
0
0.5
1
1.5
2
2.5
3
11
12
U. Stammbach: Analysis, Teil B
fxxx , fxxy , fxyx , fyxx , fxyy , fyxy , fyyx , fyyy ,
und auf analoge Weise erhält man die partiellen Ableitungen beliebiger Ordnung.
Beispiel
Es sei die Funktion
f : (x, y) → x −
5
4
3 y−
1
2
2
− x + 3y +
15
2
gegeben (siehe Figuren 1, 2). Für y = −1 erhält man die Funktion einer Variablen (siehe Figur 3)
5
ϕ:x→ x−
4
3 3
−
2
2
9
5
9
−x+ =
x−
2
4
4
3
−x+
9
.
2
7
6
5
Fig. 3 :
Verhalten von f auf y = −1
4
3
2
1
0.5
1
1.5
2
2.5
Deren Ableitung in x = 1 ist definitionsgemäss die partielle Ableitung fx (1, −1); man erhält
fx (1, −1) = −0.578....
Beispiel
Es sei die Funktion
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
f : (x, y) → f (x, y) = ex
2 +2y
gegeben (siehe Figuren 4, 5). Die partiellen Ableitungen sind (siehe Figuren 6, 7, 8, 9)
fx (x, y) = 2x ex
2 +2y
x2 +2y
fy (x, y) = 2 e
,
,
fxx (x, y) = (2 + (2x)2 ) ex
x2 +2y
,
x2 +2y
,
fxy (x, y) = 4x e
fyx (x, y) = 4x e
x2 +2y
fyy (x, y) = 4 e
Beispiel
2 +2y
,
.
Es sei die Funktion
f : (x, y) → f (x, y) = arctan
y
x
gegeben. Die partiellen Ableitungen fx , fy ergeben sich zu
1
y
y
=− 2
,
1 + (y 2 /x2 ) x2
x + y2
1
1
x
.
= 2
2
2
1 + (y /x ) x
x + y2
fx (x, y) = −
fy (x, y) =
Daraus erhalten wir die zweiten partielle Ableitungen
2xy
,
(x2 + y 2 )2
(x2 + y 2 ) − y · 2y
y 2 − x2
fxy (x, y) = (fx )y (x, y) = −
=
,
(x2 + y 2 )2
(x2 + y 2 )2
(x2 + y 2 ) − x · 2x
y 2 − x2
fyx (x, y) = (fy )x (x, y) =
=
,
(x2 + y 2 )2
(x2 + y 2 )2
−2xy
fyy (x, y) = (fy )y (x, y) =
.
2
(x + y 2 )2
fxx (x, y) = (fx )x (x, y) =
13
14
U. Stammbach: Analysis, Teil B
Fig. 4 :
Graph der Funktion
2
f (x, y) = ex +2y
10
1
5
0.5
0
-1
0
-0.5
0
-0.5
0.5
1 -1
1
0.75
0.5
Fig. 5 :
Niveaulinien der Funktion
2
f (x, y) = ex +2y
0.25
0
-0.25
-0.5
-0.75
-1
-1
-0.75
-0.5
-0.25
0
0.25
0.5
0.75
1
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
Fig. 6 :
Graph der Funktion
2
fx (x, y) = 2x ex +2y
10
5
1
0
0.5
-5
-10
-1
0
-0.5
0
-0.5
0.5
1 -1
1
0.75
0.5
Fig. 7 :
Niveaulinien der Funktion
2
fx (x, y) = 2x ex +2y
0.25
0
-0.25
-0.5
-0.75
-1
-1
-0.75
-0.5
-0.25
0
0.25
0.5
0.75
1
15
16
U. Stammbach: Analysis, Teil B
Fig. 8 :
Graph der Funktion
2
fxx (x, y) = (2 + (2x)2 ) ex +2y
40
1
30
20
0.5
10
0
-1
0
-0.5
0
-0.5
0.5
1 -1
1
0.75
0.5
Fig. 9 :
Niveaulinien der Funktion
2
fxx (x, y) = (2 + (2x)2 ) ex +2y
0.25
0
-0.25
-0.5
-0.75
-1
-1
-0.75
-0.5
-0.25
0
0.25
0.5
0.75
1
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
Beispiel
Man bestimme alle Funktionen f von zwei Variablen mit fx (x, y) ≡ 0.
Für die partielle Differentiation nach x ist die Funktion f eine Konstante; es gilt also
f (x, y) = v(y) ,
wobei v : y → v(y) eine beliebige Funktion von y ist.
Beispiel
Man bestimme alle Funktionen f mit
fx (x, y) ≡ fy (x, y) ≡ 0 .
Wegen fx (x, y) ≡ 0 gilt nach obigem f (x, y) ≡ v(y). Daraus folgt
0 ≡ fy (x, y) ≡ v 0 (y) ,
also v(y) ≡ C. Damit ist f (x, y) ≡ C.
Beispiel
Gesucht sind alle Funktionen f mit
fy (x, y) ≡ x2 sinh(xy) .
Offensichtlich ist
f (x, y) = x cosh(xy) + u(x) ,
wo x → u(x) eine beliebige Funktion von x ist.
Beispiel
Gesucht sind alle Funktionen f mit
fxy (x, y) ≡ 0.
Es folgt sofort fx (x, y) ≡ u(x), wo u : x → u(x) eine Funktion von x ist. Dann ist aber
f (x, y) = U (x) + V (y)
mit U 0 (x) = u(x) und V : y → V (y) eine beliebige Funktion von y.
17
18
3
U. Stammbach: Analysis, Teil B
Der Satz von Schwarz, die Integrabilitätsbedingung
Wenn man die expliziten Beispiele des vorigen Abschnittes noch einmal durchsieht, so stellt man
fest, dass die “gemischten Ableitungen” fxy (x, y) und fyx (x, y) in allen Fällen übereinstimmen.
Dies gilt in der Tat unter ganz allgemeinen Bedingungen, wie der Satz von Schwarz besagt
(H. A. Schwarz 1843-1921).
Satz Es sei f : (x, y) → f (x, y) eine Funktion von zwei Variablen und (x0 , y0 ) ein Punkt des
Definitionsbereiches D(f ). Ferner seien fxy , fyx in der ganzen Umgebung von (x0 , y0 ) stetig.
Dann gilt
fxy (x0 , y0 ) = fyx (x0 , y0 ) .
Bevor wir diesen Satz beweisen, machen wir die folgenden Bemerkungen.
Zuerst zu den Voraussetzungen des Satzes. Wir nennen die Funktion f : (x, y) → f (x, y) stetig
in (x0 , y0 ), wenn sie die folgende Eigenschaft besitzt: Für jede Folge von Punkten
(x1 , y1 ), (x2 , y2 ), . . .
in der (x, y)-Ebene mit
lim xn = x0 , lim yn = y0
n→∞
n→∞
gilt
lim f (xn , yn ) = f (x0 , y0 ) .
n→∞
Ist die Funktion f stetig in allen Punkten ihres Definitionsbereiches, so heisst f stetig schlechthin.
Diese Definition ist offensichtlich ganz analog zur Definition der Stetigkeit bei Funktionen
einer Variablen (siehe Kapitel I, Abschnitt 3). Der Leser tut gut daran, sich die damaligen
Ausführungen wieder in Erinnerung zu rufen.
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
19
Ohne näher auf diesen Punkt einzugehen, fügen wir noch Folgendes an. Ist f stetig in (x0 , y0 ),
so ist selbstverständlich die Funktion einer Variablen x → f (x, y0 ) stetig in x0 und die Funktion
y → f (x0 , y) stetig in y0 . Die Umkehrung gilt allerdings nicht: Es gibt Beispiele von Funktionen
f von zwei Variablen, für welche die zugehörigen Funktionen einer Variablen stetig sind, die
Funktion f selbst aber nicht stetig ist.
Im Satz von Schwarz kann auf die Voraussetzung über Stetigkeit der partiellen Ableitungen
fxy , fyx nicht verzichtet werden. Bei Funktionen f , welche diese Voraussetzungen nicht erfüllen,
können die “gemischten Ableitungen” fxy und fyx durchaus verschieden sein.
Aus dem Satz von Schwarz folgt sofort, dass es (unter geeigneten Voraussetzungen über die
Stetigkeit) bei höheren Ableitungen nicht auf die Reihenfolge der Ableitung ankommt. Es gilt
zum Beispiel
fxyyxyx ≡ fxxxyyy , fxxy ≡ fxyx ≡ fyxx , fxyy ≡ fyxy ≡ fyyx .
Es gibt also bei weitem nicht so viele verschiedene höhere Ableitungen einer Funktion f , wie es
auf den ersten Blick den Anschein macht.
Beweis des Satzes
Wir betrachten das Quadrat in D(f ) mit den Eckpunkten
(x0 , y0 ), (x0 + h, y0 ), (x0 , y0 + h), (x0 + h, y0 + h)
(siehe Figur 1) und bilden die Hilfsgrösse
A(h) = f (x0 + h, y0 + h) − f (x0 + h, y0 ) − [f (x0 , y0 + h) − f (x0 , y0 )].
Für die Funktion (einer Variablen)
ϕ : x → f (x, y0 + h) − f (x, y0 )
gilt dann
A(h) = ϕ(x0 + h) − ϕ(x0 ) .
Mit Hilfe des Mittelwertsatzes der Differentialrechnung (siehe Kapitel II, Abschnitt 3) können
wir diese Differenz anders schreiben: es existiert ein ξ1 zwischen x0 und x0 + h mit
A(h) = ϕ(x0 + h) − ϕ(x0 ) = h ϕ0 (ξ1 ) = h(fx (ξ1 , y0 + h) − fx (ξ1 , y0 )) .
20
U. Stammbach: Analysis, Teil B
(y)
(x0 , y0 + h)
(x0 + h, y0 + h)
Fig. 1 :
Zum Beweis des Satzes
von Schwarz
(x0 , y0 )
(x0 + h, y0 )
(x)
Wiederum nach dem Mittelwertsatz der Differentialrechnung existiert ein η1 zwischen y0 und
y0 + h mit der Eigenschaft
fx (ξ1 , y0 + h) − fx (ξ1 , y0 ) = h fxy (ξ1 , η1 ) .
Damit folgt
A(h) = h2 fxy (ξ1 , η1 ) ,
wo (ξ1 , η1 ) ein Punkt im betrachteten Quadrat ist. Schreibt man
A(h) = f (x0 + h, y0 + h) − f (x0 , y0 + h) − [f (x0 + h, y0 ) − f (x0 , y0 )] ,
so liefert eine analoge Überlegung einen Punkt (ξ2 , η2 ) im betrachteten Quadrat mit
A(h) = h2 fyx (ξ2 , η2 ) .
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
21
Lässt man jetzt h gegen Null gehen, so müssen die Punkte (ξ1 , η1 ) und (ξ2 , η2 ) gegen den Punkt
(x0 , y0 ) streben. Wegen der Stetigkeit von fxy bzw. fyx in (x0 , y0 ) folgt dann
A(h)
= fxy (x0 , y0 ) = fyx (x0 , y0 ) .
h→0 h2
lim
Diese letztere Gleichung war zu beweisen.
Zum Schluss dieses Abschnittes gehen wir noch auf das Umkehrproblem ein: Gegeben seien zwei
stetig differenzierbare Funktionen
ϕ : (x, y) → ϕ(x, y) und ψ : (x, y) → ψ(x, y)
mit gemeinsamem Definitionsbereich D(ϕ) = D(ψ). Gesucht ist eine Funktion f : (x, y) →
f (x, y) mit
fx (x, y) ≡ ϕ(x, y); fy (x, y) ≡ ψ(x, y).
Für Funktionen einer Variablen lautet das analoge Problem wie folgt: Gegeben ist eine Funktion
ϕ : x → ϕ(x). Gesucht ist eine Funktion f : x → f (x) mit f 0 (x) ≡ ϕ(x). Wir wissen, dass
dieses letztere Problem für beliebige stetige Funktionen eine Lösung hat: f ist einfach eine
Stammfunktion von ϕ.
Im Problem für Funktionen von zwei Variablen gibt es nicht immer eine Lösung! Nach dem Satz
von Schwarz folgt nämlich aus der Existenz von f sofort die Beziehung
(3.1)
ϕy (x, y) ≡ fxy (x, y) ≡ fyx (x, y) ≡ ψx (x, y).
Für Funktionen ϕ und ψ, welche diese Beziehung nicht erfüllen, kann es somit kein f der
verlangten Art geben.
Der folgende Satz, den wir ohne Beweis zitieren, besagt, dass die Bedingung (3.1) für die Existenz
von f hinreichend ist, wenigstens dann, wenn der gemeinsame Definitionsbereich ein achsenparalleles Rechteck ist. Wir nennen die Bedingung (3.1) deshalb Integrabilitätsbedingung.
Satz Es seien ϕ und ψ zwei stetige differenzierbare Funktionen zweier Variablen mit einem
achsenparallelen Rechteck als Definitionsbereich. Gilt ϕy (x, y) ≡ ψx (x, y), so existiert eine Funktion f : (x, y) → f (x, y) mit fx (x, y) ≡ ϕ(x, y) und fy (x, y) ≡ ψ(x, y).
22
U. Stammbach: Analysis, Teil B
Die Funktion f ist bis auf eine additive Konstante eindeutig bestimmt; ist nämlich f ∗ eine zweite
Funktion der verlangten Art, so gilt für die Differenz g(x, y) = f ∗ (x, y) − f (x, y) natürlich
gx (x, y) = fx∗ (x, y) − fx (x, y) = ϕ(x, y) − ϕ(x, y) = 0 ,
gy (x, y) = fy∗ (x, y) − fy (x, y) = ψ(x, y) − ψ(x, y) = 0 .
Wie wir aber gesehen haben, ist eine Funktion mit trivialen partiellen Ableitungen eine Konstante, d.h. g(x, y) ≡ C. Daraus folgt
f ∗ (x, y) ≡ f (x, y) + C.
Dies war zu beweisen.
Wir schliessen diesen Abschnitt mit einigen Beispielen, die zeigen, wie man die Funktion f aus
ϕ und ψ berechnen kann, falls die Intergrabilitätsbedingung erfüllt ist.
Beispiel Es seien ϕ und ψ durch ϕ(x, y) = x3 + xy 2 und ψ(x, y) = x2 y + y 3 gegeben. Die
Integrabilitätsbedingung ist wegen
ϕy (x, y) = 2xy = ψx (x, y)
erfüllt. Ausserdem sind ϕ und ψ auf der ganzen (x, y)-Ebene definiert, also auf einem achsenparallelen “Rechteck”. Nach unserem Satz existiert eine (bis auf eine additive Konstante eindeutig
bestimmte) Funktion f mit fx = ϕ, fy = ψ. Aus
fx (x, y) = x3 + xy 2
folgt
f (x, y) =
1 4 x2 y 2
x +
+ v(y) ,
4
2
wo v : y → v(y) eine noch näher zu bestimmende Funktion von y ist. Aus der Bedingung
fy (x, y) = x2 y + y 3
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
folgt die Beziehung
!
x2 y + v 0 (y) = x2 y + y 3 ,
so dass
v 0 (y) ≡ y 3 ,
y4
v(y) ≡
+C .
4
Die Funktion f (x, y) hat somit die folgende Form:
f (x, y) =
Beispiel
1 4 x2 y 2 1 4
x +
+ y + C.
4
2
4
Es seien ϕ und ψ gegeben durch
ϕ(x, y) = x sin y , ψ(x, y) =
x2
cos y + y 2 ,
2
welche auf der ganzen Ebene definiert sind. Wegen
ϕy (x, y) = x cos y = ψx (x, y)
ist die Integrabilitätsbedingung erfüllt. Die Gleichung fx (x, y) = x sin y liefert
f (x, y) =
x2
sin y + v(y),
2
wobei gelten muss
fy (x, y) =
Daraus folgt
2
x2
! x
cos y + v 0 (y) ≡
cos y + y 2 = ψ(x, y).
2
2
23
24
U. Stammbach: Analysis, Teil B
v 0 (y) = y 2 ,
y3
v(y) =
+ C.
3
Die gesuchte Funktion f ist somit von der Form
f (x, y) =
x2
y3
sin y +
+ C.
2
3
Wir werden später mehrmals wieder auf dieses Umkehrproblem der partiellen Ableitung geführt
werden: es tritt in vielen verschiedenen Zusammenhängen auf ganz natürliche Art auf.
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
4
25
Linearisieren, Fehlerrechnung
Das Linearisieren bei Funktionen zweier Variablen ist vollkommen analog zum Linearisieren
bei Funktionen einer Variablen. Ist f : x → f (x) eine Funktion einer Variablen, so linearisiert
man diese an der Stelle x0 , indem man sie durch diejenige lineare Funktion x → ax + b ersetzt,
deren Graph gerade die Tangente an den Graphen Γ(f ) im Punkt (x0 , f (x0 )) ist. Ist f : (x, y) →
f (x, y) eine Funktion zweier Variablen, so linearisiert man diese an der Stelle (x0 , y0 ), indem
man sie durch diejenige lineare Funktion (x, y) → ax + by + c ersetzt, deren Graph gerade
die Tangentialebene an den Graphen Γ(f ) im Punkte (x0 , y0 , f (x0 , y0 )) ist. Die so bestimmte
lineare Funktion nennen wir lineare Ersatzfunktion von f im Punkte (x0 , y0 ). Im hier zu
behandelnden Fall von zwei Variablen besitzt die lineare Ersatzfunktion laut dieser Definition
die folgenden Eigenschaften:
- ihr Wert in (x0 , y0 ) ist f (x0 , y0 ),
- ihre partielle Ableitung nach x ist fx (x0 , y0 ),
- ihre partielle Ableitung nach y ist fy (x0 , y0 ).
Diese drei Eigenschaften bestimmen offensichtlich die lineare Ersatzfunktion von f in (x0 , y0 )
vollständig. Sie ist gegeben durch
(x0 , y0 ) → f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) .
Ihr Graph ist definitionsgemäss die Tangentialebene an den Graphen Γ(f ) von f im Punkt
(x0 , y0 , f (x0 , y0 )); diese hat die Gleichung
z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) .
Beispiel Gegeben sei die Funktion f : (x, y) → x2 − y 2 . Gesucht ist die lineare Ersatzfunktion
von f in (x0 , y0 ) = (1, −2) (siehe Figuren 1, 2).
Es gilt
fx (x, y) = 2x , fy (x, y) = −2y ,
also
26
U. Stammbach: Analysis, Teil B
Fig. 1 :
Die Funktion
f : (x, y) → x2 − y 2
20
10
2
0
-10
0
-2
0
-2
2
Fig. 2 :
Lineare Ersatzfunktion von
20
f : (x, y) → x2 − y 2
10
2
0
-10
0
-2
0
-2
2
im Punkte (1, −2)
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
27
fx (1, −2) = 2 , fy (1, −2) = 4 .
Ausserdem gilt f (1, −2) = −3. Die lineare Ersatzfunktion von f im Punkt (1, −2) ist somit
(x, y) → −3 + 2(x − 1) + 4(y + 2) = 3 + 2x + 4y .
Im Falle von Funktionen einer Variablen ist die lineare Ersatzfunktion eine gute Approximation
in der Nähe des betrachteten Punktes. Dies gilt auch für Funktionen zweier Variablen. Um
das zu präzisieren, betrachten wir die Differenz ϕ(∆x, ∆y) zwischen dem Funktionswert von f
an der Stelle (x0 + ∆x, y0 + ∆y) und dem Funktionswert der linearen Ersatzfunktion von f in
(x0 , y0 ) an dieser Stelle (x0 + ∆x, y0 + ∆y), also
ϕ(∆x, ∆y) = f (x0 + ∆x, y0 + ∆y) − (f (x0 , y0 ) + fx (x0 , y0 )∆x + fy (x0 , y0 )∆y) .
Dann gilt der folgende Satz
Satz Es sei f : (x, y) → f (x, y) eine stetig differenzierbare Funktion von zwei Variablen und
es sei (x0 , y0 ) ein Punkt des Definitionsbereiches D(f ) von f . Dann gilt
lim
∆x,∆y→0
ϕ(∆x, ∆y)
=0.
∆x2 + ∆y 2
p
Wir können diesen Sachverhalt auch mit Hilfe des Landausymbols beschreiben: Die Differenz
der Funktionswerte in (x0 + ∆x, y0 + ∆y) der Funktion
f und der linearen Ersatzfunktion von
p
f in (x0 , y0 ) ist von kleinerer Grössenordnung als ∆x2 + ∆y 2 :
ϕ(∆x, ∆y) = o
Beweis
q
∆x2 + ∆y 2
.
Wir schreiben
ϕ(∆x, ∆y) = (f (x0 + ∆x, y0 + ∆y) − f (x0 + ∆x, y0 )) +
+ (f (x0 + ∆x, y0 ) − f (x0 , y0 )) − fx (x0 , y0 )∆x − fy (x0 , y0 )∆y .
28
U. Stammbach: Analysis, Teil B
Nach dem Mittelwertsatz der Differentialrechnung existiert ein ξ zwischen x0 und x0 + ∆x und
ein η zwischen y0 und y0 + ∆y mit der Eigenschaft
ϕ(∆x, ∆y) = fy (x0 + ∆x, η)∆y + fx (ξ, y0 )∆x − fx (x0 , y0 )∆x − fy (x0 , y0 )∆y .
Daraus folgt
ϕ(∆x, ∆y)
=
∆x2 + ∆y 2
p
∆x
∆y
= (fx (ξ, y0 ) − fx (x0 , y0 )) p 2
+ (fy (x0 + ∆x, η) − fy (x0 , y0 )) p 2
.
2
∆x + ∆y
∆x + ∆y 2
Wenn nun ∆x und ∆y gegen Null streben, so streben wegen der Stetigkeit von fx und fy an der
Stelle (x0 , y0 ) beide Summanden auf der rechten Seite gegen Null. Es folgt also
lim
∆x,∆y→0
ϕ(∆x, ∆y)
=0.
∆x2 + ∆y 2
p
Dies war zu beweisen.
Führt man, wiederum analog zum Fall einer Funktion einer Variablen, ein parallel verschobenes
Koordinatensystem mit Achsen dx, dy, df ein, dessen Ursprung mit dem Punkt (x0 , y0 , f (x0 , y0 ))
zusammenfällt, so stellt sich die lineare Ersatzfunktion von f in (x0 , y0 ) durch die einfache
Formel
df = fx (x0 , y0 )dx + fy (x0 , y0 )dy
dar. In dieser Form heisst sie üblicherweise totales Differential von f in (x0 , y0 ). Das obige
Resultat besagt dann, dass die Änderung der Funktion f , also
∆f = f (x0 + ∆x, y0 + ∆y) − f (x0 , y0 )
gut durch das Differential von f in (x0 , y0 ), also durch
df = fx (x0 , y0 )dx + fy (x0 , y0 )dy
approximiert wird (dx = ∆x, dy = ∆y), und zwar umso besser je kleiner
die Differenz gilt nämlich
p
∆x2 + ∆y 2 ist; für
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
∆f − df = o
q
∆x2 + ∆y 2
29
.
Wie schon bei Funktionen einer Variablen, so ist auch hier eine der Anwendungen der linearen
Ersatzfunktion die Fehlerrechnung.
Beispiel Bekanntlich ist das Trägheitsmoment Θ eines homogenen Vollzylinders mit Radius
R, Höhe h und Dichte ρ um seine Achse gegeben durch
π
Θ = ρ R4 h .
2
Die (gemessenen) Grössen R und h seien mit einer Genauigkeit von 1% bekannt. Man gebe eine
Fehlerabschätzung für Θ an.
Das totale Differential dΘ ist eine Abschätzung für den (absoluten) Fehler ∆Θ:
π
π
∆Θ ∼ dΘ = ρ 4R3 h dR + ρ R4 dh .
2
2
Der relative Fehler ∆Θ/Θ lässt sich deshalb nach oben abschätzen durch
∆Θ
dR
dh
∼4
+
= 5% .
Θ
R
h
Man beachte, dass der Fehler in R viermal stärker ins Gewicht fällt als der Fehler in h.
Beispiel Mit Hilfe des Archimedischen Prinzips lässt sich das (mittlere) spezifische Gewicht γ
eines unregelmässig geformten Körpers bestimmen, indem man dessen Gewicht in Luft (γLuft ∼
0) und in Wasser (γWasser ∼ 1) feststellt. Es sei x das Gewicht in Luft und y das Gewicht im
Wasser. Bezeichnet V das Volumen des Körpers, so gilt x = γV und wegen des Archimedischen
Prinzips
y = x−V .
Daraus ergibt sich
30
U. Stammbach: Analysis, Teil B
γ =
x
.
x−y
Mit welchem (relativen) Fehler ist γ höchstens behaftet, wenn x und y auf 1% genau gemessen
werden. Wiederum schätzen wie den Fehler ∆γ durch das totale Differential dγ ab:
∆γ ∼ dγ = γx dx + γy dy = −
y
x
dx +
dy .
2
(x − y)
(x − y)2
Daraus folgt
∆γ
y
≤
γ
x−y
Wegen
dx
y
+
x
x−y
dy
y
1
=2
.
y
x − y 100
y
y−x+x
=
=γ−1
x−y
x−y
erhalten wir deshalb die Abschätzung
∆γ
1
≤ 2|γ − 1|
.
γ
100
Die hier beschriebene Methode der Bestimmung des spezifischen Gewichtes ist also für grosse
spezifische Gewichte γ nicht zu empfehlen.
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
5
31
Extrema
Bei Funktionen einer Variablen hat die Differentialrechnung ein effizientes Verfahren geliefert,
um globale Extremalstellen aufzufinden. Ähnliches gilt auch für Funktionen von zwei (oder
mehr) Variablen.
Es sei f : (x, y) → f (x, y) eine auf D(f ) definierte Funktion. Ein Punkt (x0 , y0 ) heisst globale
Maximalstelle von f , wenn für alle (x, y) ∈ D(f ) die Ungleichung
f (x, y) ≤ f (x0 , y0 )
(y)
D(f )
Fig. 1 :
Zur Definition eines lokalen
Extremums
(x0 , y0 )
D
(x)
erfüllt ist. Der Funktionswert f (x0 , y0 ) heisst globales Maximum von f . Der Punkt (x0 , y0 ) ∈
D(f ) heisst lokale Maximalstelle, wenn es eine Kreisscheibe D mit Mittelpunkt (x0 , y0 ) gibt,
so dass für alle (x, y), die zugleich in D(f ) und in D liegen, die Ungleichung
f (x, y) ≤ f (x0 , y0 )
32
U. Stammbach: Analysis, Teil B
erfüllt ist (siehe Figur 1). Der Funktionswert f (x0 , y0 ) heisst in diesem Fall ein lokales Maximum von f . Analog ist eine globale bzw. lokale Minimalstelle und ein globales bzw.
lokales Minimum definiert. Unter einer Extremalstelle versteht man eine Maximal- oder
Minimalstelle und eine Extremum ist ein Maximum oder Minimum.
Beispiel
Für die Funktion
f : (x, y) → f (x, y) = x2 + y 2 , D(f ) = R × R
ist der Punkt (0, 0) eine globale Minimalstelle. Es gibt hingegen keine Maximalstelle, weder eine
lokale noch eine globale.
Es gibt also Beispiele, wo Extremalstellen der einen oder anderen Art nicht existieren. Der
folgende mathematische Satz garantiert allerdings in vielen Fällen die Existenz von Extremalstellen. Ist f : (x, y) → f (x, y) eine stetige Funktion, deren Definitionsbereich D(f ) ein endliches
abgeschlossenes (d.h. inklusive Rand) Gebiet der (x, y)-Ebene ist, so existiert für f in D(f ) (mindestens) eine globale Maximalstelle und (mindestens) eine globale Minimalstelle.
Die Bestimmung der globalen Extremalstellen einer Funktion wird in erheblichem Mass durch
das nachfolgende Resultat erleichtert. Es erlaubt, eine Liste von Punkten der (x, y)-Ebene
aufzustellen, in der alle lokalen Extremalstellen (möglicherweise aber noch weitere Punkte)
vorkommen.
Satz Es sei f : (x, y) → f (x, y) eine in D(f ) definierte Funktion. Ist (x0 , y0 ) eine lokale
Extremalstelle von f , so ist
- (x0 , y0 ) ein Punkt des Randes von D(f ), oder
- mindestens eine der partiellen Ableitungen fx oder fy ist in (x0 , y0 ) nicht definiert, oder
- die partiellen Ableitungen fx und fy sind in (x0 , y0 ) definiert, und es gilt
fx (x0 , y0 ) = 0 = fy (x0 , y0 ) .
Wir rufen in Erinnerung (siehe Abschnitt 4), dass der Graph von f in Punkten (x0 , y0 ) mit
fx (x0 , y0 ) = 0 = fy (x0 , y0 ) eine horizontale Tangentialebene besitzt.
Man beachte ferner (und vergleiche mit der Situation bei Funktionen von einer Variablen):
- nicht jede Extremalstelle von f ist eine gemeinsame Nullstelle von fx und fy ;
- nicht jede gemeinsame Nullstelle von fx und fy ist Extremalstelle von f .
Der Beweis des Satzes folgt direkt aus dem eindimensionalen Fall. Ist nämlich (x0 , y0 ) ∈ D(f )
eine lokale Extremalstelle von f , so besitzt offensichtlich auch die Funktion (einer Variablen)
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
33
(y)
D(f )
Fig. 2 :
Zum Beweis des Satzes
(x0 , y0 )
y = y0
(x)
ϕ : x → ϕ(x) = f (x, y0 ) , (x0 , y0 ) ∈ D(f )
in x0 eine Extremalstelle (siehe Figur 2). Daraus folgt nach Kapitel II, Abschnitt 4,
- dass x0 und damit (x0 , y0 ) ein Randpunkt ist, oder,
- dass ϕ0 (x0 ) = fx (x0 , y0 ) nicht definiert ist, oder
- dass gilt ϕ0 (x0 ) = fx (x0 , y0 ) = 0.
Da Analoges auch für die Funktion ψ : y → ψ(y) = f (x0 , y) gilt, ist der Beweis vollständig.
Beispiel Es sei eine reelle Zahl a > 0 gegeben. Man bestimme denjenigen Punkt P in der
(x, y)-Ebene, für welchen die Summe der Abstände von der x-Achse, von der y-Achse und von
der Geraden x + y = a am kleinsten ist (siehe Figur 3).
Man sieht leicht, dass der Punkt P nicht ausserhalb des Dreiecks D mit den Eckpunkten
(0, 0), (a, 0), (0, a) liegen kann, denn zu jedem ausserhalb von D liegenden Punkt P 0 lässt
sich sofort ein anderer Punkt angeben, für den die Summe der Abstände kleiner wird. Für
Punkte im Dreieck D ist die Summe der Abstände f (x, y) gegeben durch
34
U. Stammbach: Analysis, Teil B
(y)
(0, a)
x+y =a
Fig. 3 :
Zur Berechnung der Summe der
Abstände
D
P
(x)
(0, 0)
(a, 0)
1
f (x, y) = x + y + √ (a − x − y) .
2
Somit haben wir für die Funktion f : (x, y) → f (x, y) , D(f ) = D die globale Minimalstelle
zu suchen. Zu diesem Zweck untersuchen wir einerseits die Randpunkte des Dreiecks D und
andererseits die partiellen Ableitungen von f . Für letztere gilt
1
1
fx (x, y) = 1 − √ , fy (x, y) = 1 − √ .
2
2
Die partiellen Ableitungen existieren also im ganzen Definitionsbereich und besitzen dort keine
gemeinsamen Nullstellen. Nach unserem Satz muss die globale Minimalstelle (müssen die globalen Minimalstellen) von f folglich auf dem Rand von D zu finden sein. Für die Werte von f
auf den Punkten des Randes von D erhalten wir (siehe Figur 4):
x=0,
f (0, y) = y +
y=0,
f (x, 0) = x +
√1
2
√1
2
(a − y) , 0 ≤ y ≤ a ,
(a − x) , 0 ≤ x ≤ a .
Für x + y − a = 0 ist f ≡ a. Die globale Minimalstelle der√Funktion f in D ist deshalb im
Punkte (0, 0) zu finden; das globale Minimum ist f (0, 0) = a/ 2.
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
35
a
x+
√1
2
(a − x)
Fig. 4 :
Verhalten von f auf der x-Achse
(x)
a
Beispiel Es sei a < 0 eine reelle Zahl. Man bestimme denjenigen Punkt Q in der (x, y)-Ebene,
für den die Summe der Quadrate der Abstände von der x-Achse, von der y-Achse und von der
Geraden x + y − a = 0 minimal wird.
Für den Punkt (x, y) der (x, y)-Ebene ist die Summe der Quadrate der Abstände gegeben durch
g(x, y) = x2 + y 2 +
1
(x + y − a)2 .
2
Es ist folglich die globale Minimalstelle der Funktion
g : (x, y) → g(x, y) , D(g) = R × R
zu suchen. Da es keine Randpunkte gibt und die Funktion g überall differenzierbar ist, kommt
für die sicherlich existierende globale Minimalstelle nur eine gemeinsame Nullstelle der partiellen
Ableitungen gx und gy in Frage. Dies führt auf das Gleichungssystem
gx (x, y) = 2x + x + y − a = 0
gy (x, y) = 2y + x + y − a = 0 .
Die (einzige) Lösung ist x = y = a/4. Der Punkt Q = (a/4, a/4) ist somit die globale Minimalstelle von g. Das globale Minimum ist a2 /4.
36
U. Stammbach: Analysis, Teil B
Beispiel Gegeben ist die Funktion
f : (x, y) → f (x, y) = 2x2 + 4xy + 3y 2 − 8x − 10y + 2
(siehe Figur 5). Man bestimme die globale Maximalstelle von f auf dem Quadrat mit den
Eckpunkten
A = (0, 0), B = (2, 0), C = (0, 2), D = (2, 2).
2
1.75
1.5
Fig. 5 :
Niveaulinien der Funktion
f : (x, y) → f (x, y) =
2
= 2x + 4xy + 3y 2 − 8x − 10y + 2
1.25
1
0.75
0.5
0.25
0
0
0.25
0.5
0.75
1
1.25
1.5
1.75
2
Da die Funktion f überall differenzierbar ist, sind die Randpunkte und die gemeinsamen Nullpunkte der ersten partiellen Ableitungen näher zu untersuchen. Für letztere erhalten wir das
Gleichungssystem
fx (x, y) =
4x + 4y − 8
=0
fy (x, y) = 4x + 6y − 10 = 0
Die einzige Lösung ist x = y = 1. Damit ist der Punkt (1, 1) ein Kandidat für die globale
Maximalstelle. Wir wenden uns jetzt den Randpunkten des Quadrates zu. Auf der Quadratseite
AB, also für y = 0 erhält man
f (x, 0) = 2x2 − 8x + 2 ;
auf AC, also für x = 0 erhält man
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
37
f (0, y) = 3y 2 − 10y + 2 ;
auf CD, also für y = 2 erhält man
f (x, 2) = 2x2 + 8x + 12 − 8x − 18 = 2x2 − 6
und auf BD, also für x = 2 erhält man
f (2, y) = 8 + 8y + 3y 2 − 16 − 10y + 2 = 3y 2 − 2y − 6 .
In jedem Fall erhält man eine quadratische Funktion, deren Graph eine nach oben geöffnete
Parabel ist. Die grössten Funktionswerte werden also notwendigerweise in den Endpunkten
der Definitionsintervalle, d.h. in den Eckpunkten A, B, C, D des Quadrates angenommen. Ein
Vergleich der Werte von f auf diesen Punkten und auf dem Punkt (1, 1) liefert dann das Resultat.
Wir erhalten
f (0, 0) = 2, f (2, 0) = −6, f (0, 2) = −6, f (2, 2) = 2, f (1, 1) = −7 .
Die Punkte A = (0, 0) und D = (2, 2) sind also die beiden globalen Maximalstellen der Funktion
f im Quadrat ABCD.
38
U. Stammbach: Analysis, Teil B
6
Verallgemeinerte Kettenregel
Es sei eine Funktion f : (x, y) → f (x, y) gegeben und eine in ihrem Definitionsbereich D(f )
verlaufende Kurve K durch die Parameterdarstellung t → (x(t), y(t)) . Wir betrachten die
zusammengesetzte Funktion
t → F (t) = f (x(t), y(t)) ,
welche t den Wert von f an der zu t gehörenden Stelle der Kurve K zuordnet (siehe Figuren 1,
2). Wir fragen nach der Ableitung von F nach t. Laut Definition gilt
dF
(t) =
dt
F (t + ∆t) − F (t)
∆t→0
∆t
f (x(t + ∆t), y(t + ∆t)) − f (x(t), y(t))
= lim
∆t→0
∆t
f (x(t) + ∆x, y(t) + ∆y) − f (x(t), y(t))
= lim
,
∆t→0
∆t
lim
wobei wir
∆x = x(t + ∆t) − x(t) ,
∆y = y(t + ∆t) − y(t)
gesetzt haben. Mit den Bezeichnungen von Abschnitt 4 erhalten wir nun
dF
(t) =
dt
∆x
∆y
ϕ(∆x, ∆y)
·
lim fx (x(t), y(t))
+ fy (x(t), y(t))
+p 2
∆t→0
∆t
∆t
∆x + ∆y 2
= fx (x(t), y(t)) ẋ(t) + fy (x(t), y(t)) ẏ(t) ,
denn es gilt nach Abschnitt 4
ϕ(∆x, ∆y)
lim p
=0,
∆t→0
∆x2 + ∆y 2
aber
p
∆x2 + ∆y 2
∆t
!
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
39
(y)
K
(x)
Fig. 1 :
Kurve K gegeben durch
x : t → 5 − 32 t cos t
y : t → 1 + t sin t
für 1 ≤ t ≤ 7.5
100
75
50
25
(t)
2
4
6
Fig. 2 :
Graph der zusammengesetzten Funktion
8
t → F (t) = f (x(t), y(t)) ,
-25
mit f : (x, y) → f (x, y) = xy 2
-50
-75
-100
40
U. Stammbach: Analysis, Teil B
p
lim
∆t→0
∆x2 + ∆y 2
= lim
∆t→0
∆t
s
∆x
∆t
2
+
∆y
∆t
2
q
=
(ẋ(t))2 + (ẏ(t))2 .
Damit haben wir die sogenannte verallgemeinerte Kettenregel bewiesen:
Satz
dF
df
(t) = (x(t), y(t)) = fx (x(t), y(t)) ẋ(t) + fy (x(t), y(t)) ẏ(t) .
dt
dt
Während die gewöhnliche Kettenregel vor allem beim Ableiten von komplizierten Funktionen
nützlich ist, liegen die Anwendungen der verallgemeinerten Kettenregel in einer etwas anderen
Richtung. Wir illustrieren dies mit den folgenden Beispielen.
Beispiel
Die Kurve K sei in impliziter Darstellung, d.h. durch eine Gleichung der Form
f (x, y) = 0 gegeben. Es sei (x0 , y0 ) ein Punkt der Kurve, also f (x0 , y0 ) = 0. Wir fragen nach
der Steigung der Kurve in (x0 , y0 ).
Um die Steigung zu berechnen, denken wir uns die Kurve in einer kleinen Umgebung von (x0 , y0 )
in expliziter Form gegeben: sie sei dort der Graph der Funktion (einer Variablen)
ϕ : x → ϕ(x) , x0 − ∆x ≤ x ≤ x0 + ∆x .
Es gilt dann also
f (x, ϕ(x)) ≡ 0
für x0 − ∆x ≤ x ≤ x0 + ∆x und die Steigung von K in (x0 , y0 ) ist ϕ0 (x0 ). Fassen wir x als
Parameter auf, so erhalten wir durch Ableiten nach x mit Hilfe der verallgemeinerten Kettenregel
die Beziehung
fx (x, ϕ(x)) · 1 + fy (x, ϕ(x)) · ϕ0 (x) = 0 .
Daraus ergibt sich für die Steigung ϕ0 (x0 ) der Kurve in (x0 , y0 )
ϕ0 (x0 ) = −
Beispiel
fx (x0 , y0 )
.
fy (x0 , y0 )
Wir betrachten noch kurz den Spezialfall, wo die Kurve K die Ellipse
x2 y 2
+ 2 =1
a2
b
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
4
2
(x0 , y0 )
-4
-2
2
Fig. 3 :
Tangente an Ellipse
4
-2
-4
ist, und fragen nach der Gleichung der Tangente im Ellipsenpunkt (x0 , y0 ) (siehe Figur 3).
Zu diesem Zweck betrachten wir die Ellipse als Kurve gegeben durch
x2 y 2
+ 2 −1=0
a2
b
und bestimmen zuerst die Steigung m in (x0 , y0 ). Nach obigem gilt
m=−
fx (x0 , y0 )
b 2 x0
.
=− 2
fy (x0 , y0 )
a y0
Die Tangente an die Ellipse im Punkt (x0 , y0 ) ist somit durch die Gleichung
y − y0 = −
b 2 x0
(x − x0 )
a2 y0
gegeben. Diese lässt sich vereinfachen zu
x0 (x − x0 ) y0 (y − y0 )
+
=0.
a2
b2
41
42
U. Stammbach: Analysis, Teil B
Berücksichtigt man noch, dass (x0 , y0 ) ein Punkt der Ellipse ist, und deshalb die Gleichung
x2 y 2
+ 2 =1
a2
b
erfüllt, so erhält man für die Tangente die einfache Gleichung
x0
y0
x+ 2 y =1 .
2
a
b
Beispiel Der Zustand eines Gases wird durch die Grössen Druck p, Volumen V und (absolute)
Temperatur T beschrieben, welche untereinander durch die sogenannte Zustandsgleichung des
Gases verbunden sind. (Die einfachste solche Zustandsgleichung ist die des idealen Gases
pV = RT .
Dabei ist R die sogenannte Gaskonstante. Etwas komplizierter ist die van der Waal’sche Zustandsgleichung, welche das Verhalten realer Gase genauer beschreibt; sie lautet
a
p + 2 (V − b) = RT .
V
Dabei sind die Grössen a, b vom betrachteten Gas abhängige Konstanten.) Die Zustandsgleichung sagt, dass für eine feste Menge Gas je zwei der drei Grössen p, V, T die dritte festlegen.
Man hat folglich (wenigstens lokal!) Funktionen
p : (V, T ) → p(V, T )
V : (p, T ) → V (p, T )
T : (p, V ) → T (p, V ) ,
welche aus der Gaszustandsgleichung folgen.
dehnungskoeffizienten α des Gases durch
α=
1
V
In der Physik definiert man dann den Aus
∂V
∂T
p
,
den Spannungskoeffizienten β durch
1
β=
p
und die Kompressibilität κ durch
∂p
∂T
V
,
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
1
κ=−
V
∂V
∂p
43
.
T
(Es ist in diesem Zusammenhang in der Physik üblich, die bei der partiellen Ableitung festgehaltenen Grössen als Index hinzuschreiben; aus mathematischen Gründen wäre dies natürlich nicht
notwendig!) Zwischen den Koeffizienten α, β, κ, die im allgemeinen Funktionen der Grössen
p, V, T sind, besteht kraft der Zustandsgleichung eine einfache Beziehung. Diese wollen wir
nun herleiten. Zu diesem Zweck gehen wir von der Funktion
V : (p, T ) → V (p, T )
aus. Halten wir V konstant, V = C, so ist der Druck p nur von T abhängig; es sei p̃ : T → p̃(T )
die entsprechende Funktion. Dann gilt
V (p̃(T ), T ) ≡ C .
(6.2)
Mathematisch ausgedrückt betrachtet man eine explizite Darstellung der Niveaulinie der Funktion V : (p, T ) → V (p, T ) zum Niveau C. Nun ist aber offenbar
dp̃
=
dT
∂p
∂T
V
,
so dass die Ableitung der Beziehung (6.2) nach T die Gleichung
0=
∂V
∂p
T
∂p
∂T
V
+
∂V
∂T
p
liefert. Daraus erhalten wir laut Definition von α, β, κ unmittelbar
α = pκβ .
Dies ist die gewünschte Beziehung. Man beachte, dass sie bereits aus der Existenz einer Zustandsgleichung hergeleitet wurde, die spezielle Form der Zustandsgleichung spielte dabei überhaupt
keine Rolle.
44
7
U. Stammbach: Analysis, Teil B
Funktionen von drei Variablen
In diesem Abschnitt geht es darum, in verhältnismässig konzentrierter Weise reellwertige Funktionen von drei Variablen zu behandeln. Dabei wenden wir uns vor allem denjenigen Punkten
zu, bei denen im Schritt von zwei auf drei Variablen neue Aspekte zur Geltung kommen.
Durch eine reellwertige Funktion von drei Variablen
f : (x, y, z) → f (x, y, z)
wird jedem Tripel (x, y, z) eine reelle Zahl f (x, y, z) zugeordnet (siehe Figur 1). Der Definitionsbereich D(f ) kann als eine Untermenge des dreidimensionalen Raumes angesehen werden.
f (x, y, z)
0
R
Fig. 1 :
Funktion von drei Variablen
(z)
f
(y)
D(f )
(x, y, z)
R ×R ×R
(x)
In Anwendungen ist der Funktionswert f (x, y, z) oft eine skalare physikalische Grösse, die den
Zustand in Punkte (x, y, z) beschreibt. Man denke in diesem Zusammenhang etwa an die (im
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
45
Körper D(f ) herrschende, von Punkt zu Punkt variierende) Temperatur T oder an die (vom
Ort abhängige) Dichte ρ.
Beispiel Die Funktion
f : (x, y, z) → f (x, y, z) = ax + by + cz + d , D(f ) = R × R × R
heisst linear. Der Wertebereich W (f ) besteht aus allen reellen Zahlen, falls (a, b, c) 6= (0, 0, 0).
Beispiel Die Funktion
1
f : (x, y, z) → f (x, y, z) = p 2
x + y2 + z2
ist auf dem ganzen dreidimensionalen Raum mit Ausnahme des Nullpunktes definiert. Der
Wertebereich besteht aus allen positiven Zahlen.
Zur Veranschaulichung solcher Funktionen stehen wiederum verschiedene Möglichkeiten zur
Verfügung. Allerdings scheidet die Betrachtung des Graphen der Funktion weitgehend aus, da
für diesen bei einer Funktion von drei Variablen ein vierdimensionaler Raum benötigt würde, der
sich natürlich zur Veranschaulichung kaum eignet. Die wohl einfachste Art sich über das Verhalten einer Funktion von drei Variablen klar zu werden, dürfte darin bestehen, deren Niveauflächen
zu betrachten.
Die Niveaufläche von f zum Niveau C ist die Fläche im dreidimensionalen Raum, die durch
die Gleichung f (x, y, z) = C gegeben ist. Sie besteht aus allen Punkten im dreidimensionalen
Raum, auf denen f den Wert C annimmt.
Beispiel Die Niveaufläche von f : (x, y, z) → f (x, y, z) = ax + by + cz + d zum Niveau C ist
die Ebene mit der Gleichung ax + by + cz = C − d .
Die Niveaufläche von
1
f : (x, y, z) → f (x, y, z) = p 2
x + y2 + z2
zum Niveau C ist gegeben durch
p
x2
1
=C ;
+ y2 + z2
dies ist die Oberfläche einer Kugel mit Radius 1/C und Mittelpunkt 0,
x2 + y 2 + z 2 = 1/C 2 .
46
U. Stammbach: Analysis, Teil B
Die partiellen Ableitungen
fx (x, y, z), fy (x, y, z), fz (x, y, z) ;
bezeichnen wir auch durch
∂f
∂f
∂f
(x, y, z) ,
(x, y, z) ,
(x, y, z) .
∂x
∂y
∂z
Sie sind auf offensichtliche Weise definiert. Ein Beispiel mag hier genügen.
Beispiel Es sei f : (x, y, z) → f (x, y, z) = sin(xyz) . Dann sind die partiellen Ableitungen
gegeben durch
fx (x, y, z) = yz cos(xyz) ,
fy (x, y, z) = xz cos(xyz) ,
fz (x, y, z) = xy cos(xyz) .
Wegen des Satzes von Schwarz kommt es (unter geeigneten Stetigkeitsvoraussetzungen) nicht
auf die Reihenfolge der partiellen Ableitungen an; z.B. gilt
fxz (x, y, z) = fzx (x, y, z) , fxzxy (x, y, z) ≡ fxxyz (x, y, z) , etc. .
Wie im Falle von zwei Variablen gibt der Satz von Schwarz Anlass zu Integrabilitätsbedingungen. Es seien drei Funktionen
ϕ : (x, y, z) → ϕ(x, y, z) ,
ψ : (x, y, z) → ψ(x, y, z) ,
χ : (x, y, z) → χ(x, y, z)
von drei Variablen mit dem gemeinsamen Definitionsbereich D gegeben, und man suche eine
Funktion
f : (x, y, z) → f (x, y, z)
von drei Variablen mit
fx ≡ ϕ , fy ≡ ψ , fz ≡ χ .
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
47
Existiert die Funktion f , so müssen wegen dem Satz von Schwarz für die partiellen Ableitungen
die folgenden Gleichungen gelten
ϕy ≡ fxy ≡ fyx ≡ ψx ,
ϕz ≡ fxz ≡ fzx ≡ χx ,
ψz ≡ fyz ≡ fzy ≡ χy .
Es gilt dann das zum Fall von zwei Variablen analoge Resultat: Wenn diese Integrabilitätsbedingungen erfüllt sind, und der gemeinsame Definitionsbereich von ϕ, ψ , χ ein achsenparalleler
Quader ist, so existiert die Funktion f , und sie ist bis auf eine additive Konstante eindeutig
bestimmt.
Beispiel Es seien ϕ, ψ , χ gegeben durch
ϕ(x, y, z) = 3x2 + 3y − 1 ,
ψ(x, y, z) = z 2 + 3x ,
χ(x, y, z) = 2yz + 1 .
Der gemeinsame Definitionsbereich ist der ganze dreidimensionale Raum. Wegen
ϕy (x, y, z) = 3 = ψx (x, y, z) , ϕz (x, y, z) = 0 = χx (x, y, z) , ψz (x, y, z) = 2z = χy (x, y, z)
sind die Integrabilitätsbedingungen erfüllt. Daraus folgt, dass die Funktion f existiert.
!
Aus fx = ϕ folgt
f (x, y, z) = x3 + 3xy − x + u(y, z) .
Die Bedingung
!
z 2 + 3x = ψ(x, y, z) = fy (x, y, z) = 3x + uy (y, z)
liefert dann
z 2 = uy (y, z)
und daraus folgt
u(y, z) = yz 2 + v(z) .
48
U. Stammbach: Analysis, Teil B
Damit ist f von der Form
f (x, y, z) = x3 + 3xy − x + yz 2 + v(z) .
Schliesslich liefert die dritte Bedingung
!
2yz + 1 = χ(x, y, z) = fz (x, y, z) = 2yz + v 0 (z)
die noch fehlende Information. Es gilt v 0 (z) = 1 und damit
v(z) = z + C .
Die gesuchte Funktion f ist also durch
f (x, y, z) = x3 + 3xy − x + yz 2 + z + C
gegeben.
Analog wie bei Funktionen von zwei Variablen lautet die verallgemeinerte Kettenregel. Es
sei f : (x, y, z) → f (x, y, z) eine Funktion von drei Variablen und t → (x(t), y(t), z(t)) die Parameterdarstellung einer Kurve im Definitionsbereich von f . Dann gilt für die zusammengesetzte
Funktion F : t → F (t) = f (x(t), y(t), z(t))
dF
(t) = fx (x(t), y(t), z(t)) ẋ(t) + fy (x(t), y(t), z(t)) ẏ(t) + fz (x(t), y(t), z(t)) ż(t) .
dt
An dieser Stelle wollen wir nun einen Schritt weitergehen als bei der Behandlung von Funktion
von zwei Variablen. Wir bemerken, dass die in dieser Ableitung vorkommende Bildung als
Skalarprodukt von zwei Vektoren aufgefasst werden kann, nämlich als Skalarprodukt des Vektors
(fx (x(t), y(t), z(t)), fy (x(t), y(t), z(t)), fz (x(t), y(t), z(t)))
mit dem Vektor
(ẋ(t), ẏ(t), ż(t)) .
Der letztere Vektor ist bekanntlich ein Tangentialvektor (der Geschwindigkeitsvektor) an die
Kurve K. Wir machen die folgende Definition. Unter dem Gradienten grad f (x0 , y0 , z0 ) von
f im Punkt (x0 , y0 , z0 ) verstehen wir den Vektor
grad f (x0 , y0 , z0 ) = (fx (x0 , y0 , z0 ), fy (x0 , y0 , z0 ), fz (x0 , y0 , z0 )) .
49
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
Mit dieser Bildung wird der Funktion f in jedem Punkt (x0 , y0 , z0 ) ihres Definitionsbereiches
ein Vektor grad f (x0 , y0 , z0 ) zugeordnet, den man sich natürlich in diesem Punkte angebracht
denken kann. Der Gradient ordnet also jeder Funktion f ein Vektorfeld, das sogenannte Gradientenfeld von f , zu. Auf den wichtigen Begriff des Vektorfeldes kommen wir im Kapitel VI
eingehend zu sprechen. Mit Hilfe des Gradienten schreibt sich die verallgemeinerte Kettenregel
in der folgenden einfachen Form,
dF
(t) = ~r˙ (t) · grad f (x(t), y(t), z(t)) ,
dt
wo ~r˙ (t) der zur Kurve gehörige Geschwindigkeitsvektor ist.
Beispiel Für die Funktion f : (x, y, z) → ax + by + cz + d gilt
grad f (x, y, z) = (a, b, c) .
Der Gradient der linearen Funktion ist ein konstanter Vektor.
Beispiel Für die Funktion
f : (x, y, z) →
x2
1
+ y2 + z2
erhält man
grad f (x, y, z) =
−2x
−2y
−2z
,
,
2
2
2
2
2
2
2
2
2
(x + y + z ) (x + y + z ) (x + y 2 + z 2 )2
.
Der Gradient von f zeigt in jedem Punkt gegen den Ursprung. Seine Länge ist gegeben durch
2/(x2 + y 2 + z 2 )3/2 . Sie ist umso grösser, je näher der Punkt (x, y, z) dem Ursprung ist.
Als nächstes betrachten wir den Spezialfall der verallgemeinerten Kettenregel, wo die Kurve K
eine Gerade ist. Diese sei durch die Parameterdarstellung
t → (x0 + e1 t, y0 + e2 t, z0 + e3 t)
gegeben, wobei wir annehmen, dass ~e ein Einheitsvektor ist und wir für den ausgezeichneten
Punkt der Geraden gerade den Punkt (x0 , y0 , z0 ) genommen haben. Dann gilt wegen
dF
(t) = ~r˙ (t) · grad f (x(t), y(t), z(t))
dt
natürlich
dF
(0) = ~e · grad f (x0 , y0 , z0 ) .
dt
50
U. Stammbach: Analysis, Teil B
Diesen Wert nennen wir die Richtungsableitung von f in (x0 , y0 , z0 ) in Richtung ~e,
D~e f (x0 , y0 , z0 ) =
dF
(0) = ~e · grad f (x0 , y0 , z0 ) .
dt
Sie beschreibt die momentane Änderung des Funktionswertes an der Stelle (x0 , y0 , z0 ) in Richtung ~e. Man beachte, dass in dieser Definition ~e ein Einheitsvektor ist.
Beispiel Für die Funktion f : (x, y, z) → sin(xyz) bestimme man die Richtungsableitung in
(1, 0, 1) in Richtung des Einheitsvektors √13 (−1, 1, 1). Es gilt
1
1
D~e f (1, 0, 1) = √ (−1, 1, 1) · (0, 1, 0) = √ .
3
3
Beispiel Für ~e = (1, 0, 0) erhält man für die Richtungsableitung in (x, y, z) in Richtung ~e
D~e f (x, y, z) = ~e · grad f (x, y, z) = fx (x, y, z) .
Analoges gilt für ~e = (0, 1, 0) und ~e = (0, 0, 1). Die partiellen Ableitungen von f sind also die
Richtungsableitungen in Richtung der Koordinatenachsen.
Wie die Formel für die Richtungsableitung zeigt, ist diese an der Stelle (x0 , y0 , z0 ) für jede
beliebige Richtung ~e bestimmt, wenn der Gradient von f in (x0 , y0 , z0 ) bekannt ist: Der Vektor grad f (x0 , y0 , z0 ) beschreibt, wie sich die Funktion f in der unmittelbaren Umgebung von
(x0 , y0 , z0 ) ändert. Diesem Zusammenhang wollen wir hier noch etwas genauer nachgehen, indem wir die Abhängigkeit der Richtungsableitung von der Richtung ~e studieren. Es gilt
D~e f (x0 , y0 , z0 ) = ~e · grad f (x0 , y0 , z0 ) = |~e| · |grad f (x0 , y0 , z0 )| · cos ω ,
wobei ω den von ~e und dem Vektor grad f (x0 , y0 , z0 ) eingeschlossenen Winkel bezeichnet (siehe
Figur 2). Wir lesen daran das Folgende ab:
Für ω = 0, d.h. wenn ~e die gleiche Richtung wie grad f (x0 , y0 , z0 ) besitzt, so gilt
D~e f (x0 , y0 , z0 ) = |grad f (x0 , y0 , z0 )| .
Die Richtungsableitung ist in diesem Fall gerade gleich der Länge des Gradienten. Dies ist
offensichtlich der grösstmögliche Wert der Richtungsableitung im Punkte (x0 , y0 , z0 ). Er wird
gerade in der Richtung erreicht, in welche der Gradient zeigt; in Richtung des Gradienten ist
folglich der grösste Anstieg der Funktionswerte von f festzustellen.
Satz
Die Richtung des Gradienten grad f (x0 , y0 , z0 ) gibt die Richtung der grössten Richtungsableitung von f in (x0 , y0 , z0 ) an; die Länge des Gradienten ist gleich der grössten Richtungsableitung von f in (x0 , y0 , z0 ).
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
51
~e
grad f (x0 , y0 , z0 )
ω
(z)
(y)
Fig. 2 :
Richtungsableitung von f
im Punkte (x0 , y0 , z0 )
und grad f (x0 , y0 , z0 )
(x0 , y0 , z0 )
(x)
Für ω = π/2, d.h. für ~e ⊥ grad f (x0 , y0 , z0 ) ist die Richtungsableitung D~e f (x0 , y0 , z0 ) Null,
d.h. für die Richtung ~e ist die momentane Änderung des Funktionswertes von f Null. Daraus
schliessen wir, dass ~e tangential zur Niveaufläche von f durch den Punkt (x0 , y0 , z0 ) ist. Dies
bedeutet aber, dass der Vektor grad f (x0 , y0 , z0 ) senkrecht auf der Niveaufläche steht.
Satz Der Gradient von f in (x0 , y0 , z0 ) steht senkrecht auf der Niveaufläche von f , welche
durch den Punkt (x0 , y0 , z0 ) geht.
Beispiel Der Gradient der Funktion
1
f : (x, y, z) → p 2
x + y2 + z2
ist gegeben durch
grad f (x, y, z) =
wobei wir wie üblich r =
−x −y −z
,
,
r3 r3 r3
p
,
x2 + y 2 + z 2 gesetzt haben. Die Länge des Gradienten ist folglich
|grad f (x, y, z)| =
1
.
r2
52
U. Stammbach: Analysis, Teil B
Dies ist der Wert der grössten Richtungsableitung in (x, y, z). Da der Gradient gegen den
Nullpunkt zu gerichtet ist, wird die grösste Richtungsableitung (grösster Anstieg der Funktionswerte) in dieser Richtung erreicht.
Die in den beiden Sätzen beschriebenen Eigenschaften des Gradienten sind in Anwendungen
äusserst nützlich. Wir geben dazu einige Beispiele.
Beispiel Gegeben seien die Flächenscharen
x2 + 2y 2 + 2z 2 = C1 ,
q
x2 / y 2 − z 2 = C2 .
Man zeige, dass jede Fläche der einen Schar jede Fläche der andern Schar orthogonal schneidet.
Wir fassen die beiden Flächenscharen als Niveauflächen der Funktionen
f1 (x, y, z) = x2 + 2y 2 + 2z 2 ,
q
f2 (x, y, z) = x2 / y 2 − z 2
auf. Es ist dann zu zeigen, dass in (x, y, z) die Gradienten von f1 und f2 senkrecht aufeinanderstehen, d.h. dass das Skalarprodukt grad f1 · grad f2 Null ist. Wir erhalten
grad f1 (x, y, z) = (2x, 4y, 4z),
grad f2 (x, y, z) =
2x
−x2 y
x2 z
,
,
(y 2 − z 2 )1/2 (y 2 − z 2 )3/2 (y 2 − z 2 )3/2
!
.
Daraus ergibt sich für das Skalarprodukt sofort
grad f1 · grad f2 =
1
2 2
2
2 2
2 2
4x
(y
−
z
)
−
4x
y
+
4x
z
=0.
(y 2 − z 2 )3/2
Beispiel Wir betrachten in diesem Beispiel die Niveaufläche durch den Punkt (x0 , y0 , z0 ) der
Funktion f und fragen nach der Gleichung der Tangentialebene im Punkt (x0 , y0 , z0 ).
Wir wissen, dass der Gradient grad f (x0 , y0 , z0 ) senkrecht auf der Niveaufläche durch (x0 , y0 , z0 )
steht. Damit ist dieser Vektor auch senkrecht zur Tangentialebene. Die Tangentialebene geht
ausserdem durch den Punkt (x0 , y0 , z0 ). Ihre Gleichung lautet damit offenbar
fx (x0 , y0 , z0 ) x + fy (x0 , y0 , z0 ) y + fz (x0 , y0 , z0 ) z =
= fx (x0 , y0 , z0 ) x0 + fy (x0 , y0 , z0 ) y0 + fz (x0 , y0 , z0 ) z0
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
53
Beispiel Es sei (x0 , y0 , z0 ) ein Punkt des Ellipsoides
x2 y 2 z 2
+ 2 + 2 =1.
a2
b
c
Gesucht ist die Tangentialebene in (x0 , y0 , z0 ) an das Ellipsoid (siehe Figur 3).
Fig. 3 :
Ellipsoid
Wir fassen das Ellipsoid als die durch den Punkt (x0 , y0 , z0 ) gehende Niveaufläche der Funktion
f : (x, y, z) →
x2 y 2 z 2
+ 2 + 2 −1
a2
b
c
auf. Die Tangentialebene wird dann durch die Gleichung
fx (x0 , y0 , z0 )(x − x0 ) + fy (x0 , y0 , z0 )(y − y0 ) + fz (x0 , y0 , z0 )(z − z0 ) = 0,
also durch
2x0
2y0
2z0
(x − x0 ) + 2 (y − y0 ) + 2 (z − z0 ) = 0
2
a
b
c
54
U. Stammbach: Analysis, Teil B
beschrieben. Berücksichtigt man, dass der Punkt (x0 , y0 , z0 ) die Gleichung
x20 y02 z02
+ 2 + 2 =1
a2
b
c
erfüllt, so ergibt sich daraus die folgende einfache Form der Gleichung der Tangentialebene im
Punkte (x0 , y0 , z0 ) an das Ellipsoid
x0
y0
z0
x+ 2 y+ 2 z =1 .
a2
b
c
Beispiel Die lineare Ersatzfunktion einer Funktion f von drei Variablen ist analog definiert
wie im Falle von zwei Variablen. Sie ist diejenige lineare Funktion, die in (x0 , y0 , z0 ) denselben
Funktionswert und auch dieselben ersten partiellen Ableitungen wie die Funktion f besitzt. Die
lineare Ersatzfunktion von f : (x, y, z) → f (x, y, z) in (x0 , y0 , z0 ) wird deshalb durch die Formel
(x, y, z) → f (x0 , y0 , z0 ) + fx (x0 , y0 , z0 )(x − x0 ) + fy (x0 , y0 , z0 )(y − y0 ) + fz (x0 , y0 , z0 )(z − z0 )
beschrieben. Schliesslich gilt auch hier, analog zum Fall von zwei Variablen, dass die Differenz zwischen dem Funktionswert und dem Wert der linearen Ersatzfunktion von kleinerer
Grössenordnung ist als der Abstand des Punktes (x, y, z) vom Punkt (x0 , y0 , z0 ), d.h. es gilt
lim
∆x,∆y,∆z→0
ϕ(∆x, ∆y, ∆z)
=0.
∆x2 + ∆y 2 + ∆z 2
p
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
8
55
Koordinatentransformationen
Zur leichten mathematischen Formulierung und zur Lösung eines in der Praxis anfallenden Problems trägt oft wesentlich die richtige Wahl des Koordinatensystems bei. So wird zum Beispiel
bei einem achsensymmetrischen Problem mit Vorteil ein Zylinderkoordinatensystem verwendet,
bei einem kugelsymmetrischen Problem ein Kugelkoordinatensystem, etc. Da die physikalischen
Gesetze in der Regel in Form von Differentialgleichungen vorliegen, in denen unter anderem auch
die partiellen Ableitungen der relevanten Grössen nach den kartesischen Koordinaten vorkommen, müssen bei einem Wechsel des Koordinatensystems auch diese Ableitungen umgerechnet,
d.h. in den neuen Koordinaten ausgedrückt werden. Mit diesem Problem beschäftigt sich der
vorliegenden Abschnitt. - Wir beginnen mit einem einfachen Beispiel in Polarkoordinaten und
gehen anschliessend das Problem allgemein an.
In der (x, y)-Ebene sei die Funktion
F : (x, y) → F (x, y) = x2 − y 2
gegeben. Jedem Punkt der (x, y)-Ebene wird durch F eine reelle Zahl zugeordnet. Führen wir
in der Ebene Polarkoordinaten ein, so ist der Funktionswert im Punkt mit Polarkoordinaten
(ρ, ϕ) durch
F̃ (ρ, ϕ) = F (x(ρ, ϕ)), y(ρ, ϕ))
gegeben. Dabei gilt (siehe Figur 1)
x(ρ, ϕ) = ρ cos ϕ ,
y(ρ, ϕ) = ρ sin ϕ ,
also
F̃ (ρ, ϕ) = F (ρ cos ϕ, ρ sin ϕ) = ρ2 (cos2 ϕ − sin2 ϕ) .
Die Funktionen F und F̃ nehmen auf ein und demselben Punkt in der Ebene denselben Wert an;
die eine drückt die Zuordnung in kartesischen die andere in Polarkoordinaten aus. Wir sagen,
dass F und F̃ ein und dieselbe Punktfunktion beschreibe.
Umgekehrt können wir die Polarkoordinaten (ρ, ϕ) in den kartesischen Koordinaten (x, y) ausdrücken. Es gilt bekanntlich
56
U. Stammbach: Analysis, Teil B
ϕ = ϕ0
(y)
ρ = ρ0
Fig. 1 :
Polarkoordinatensystem
(x)
ρ(x, y) =
(8.3)
q
x2 + y 2
(
ϕ(x, y) =
arctan (y/x)
, x>0
arctan (y/x) + π , x < 0
(Für x = 0 ist die Formel für ϕ sinnvoll zu ergänzen!) Man hat dann
x2
y2
F (x, y) = F̃ (ρ(x, y), ϕ(x, y)) = (x + y )
−
x2 + y 2 x2 + y 2
2
2
!
= x2 − y 2 .
Wir wenden uns jetzt dem Problem in voller Allgemeinheit zu und betrachten neben dem kartesischen (x, y)-Koordinatensystem in der Ebene ein zweites Koordinatensystem mit Koordinaten
(u, v) (siehe Figur 2). Dabei seien die x- und die y-Koordinaten des durch das Paar (u, v)
beschriebenen Punktes durch die Funktionen
x = x(u, v) , y = y(u, v)
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
57
(y)
v = v0
u = u0
Fig. 2 :
Allgemeines Koordinatensystem
(x)
gegeben. Eine in (x, y)-Koordinaten beschriebene Punktfunktion F : (x, y) → F (x, y) wird
folglich in (u, v)-Koordinaten durch
(8.4)
F̃ (u, v) = F (x(u, v), y(u, v))
ausgedrückt. Umgekehrt seien die (u, v)-Koordinaten in den kartesischen Koordinaten (x, y)
durch
u = u(x, y) , v = v(x, y)
gegeben. Dann gilt analog zu (8.4)
(8.5)
F (x, y) = F̃ (u(x, y), v(x, y)) .
Für die partiellen Ableitungen nach x und y ergibt sich aus der Formel (8.5) mit Hilfe der
verallgemeinerten Kettenregel
Fx (x, y) = F̃u (u(x, y), v(x, y)) ux (x, y) + F̃v (u(x, y), v(x, y)) vx (x, y) ,
58
U. Stammbach: Analysis, Teil B
Fy (x, y) = F̃u (u(x, y), v(x, y)) uy (x, y) + F̃v (u(x, y), v(x, y)) vy (x, y) .
Die zweiten partiellen Ableitungen lauten dann (in abgekürzter Schreibweise, d.h. ohne die
Argumente der Funktionen explizit hinzuschreiben)
Fxx = (F̃u ux + F̃v vx )x
= F̃uu u2x + F̃uv ux vx + F̃u uxx + F̃vu vx ux + F̃vv vx2 + F̃v vxx
(8.6)
Fxy = (F̃u ux + F̃v vx )y
= F̃uu ux uy + F̃uv ux vy + F̃u uxy + F̃vu vx uy + F̃vv vx vy + F̃v vxy
Fyy = (F̃u uy + F̃v vy )y
= F̃uu u2y + F̃uv uy vy + F̃u uyy + F̃vu vy uy + F̃vv vy2 + F̃v vyy
Auf analoge Weise lassen sich weitere partielle Ableitungen berechnen. Dabei werden die Ausdrücke mit wachsender Ordnung der Ableitung offensichtlich rasch sehr kompliziert. Statt weiter
im allgemeinen Fall zu bleiben, betrachten wir nun zwei ganz konkrete Probleme.
Beispiel In zahlreichen Anwendungen (Diffusion, Wärmeleitung, Wellenausbreitung, Torsion
von Stäben, elektrisches Potential, etc.) spielt der sogenannte Laplace-Operator ∆ eine wichtige
Rolle (P.S. Laplace 1749-1827); dieser ist für Funktionen f : (x, y) → f (x, y) durch
∆f = fxx + fyy
definiert. Wie stellt sich dieser Operator in Polarkoordinaten dar?
Nach unseren Überlegungen wird die Funktion f in Polarkoordinaten durch
f˜(ρ, ϕ) = f (x(ρ, ϕ)), y(ρ, ϕ))
beschrieben. Umgekehrt gilt
f (x, y) = f˜(ρ(x, y), ϕ(x, y)) ,
wobei ρ(x, y) und ϕ(x, y) durch (8.3) gegeben sind. Nun liefert die Formel (8.6)
(8.7)
fxx + fyy = f˜ρρ (ρ2x + ρ2y ) + f˜ρϕ (ρx ϕx + ρy ϕy )+
+f˜ρ (ρxx + ρyy ) + f˜ρϕ (ρx ϕx + ρy ϕy ) + f˜ϕϕ (ϕ2x + ϕ2y ) + f˜ϕ (ϕxx + ϕyy ) .
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
59
Aus (8.3) folgt
ρx =
ρy =
ϕx =
ϕy =
∂ 2
x
= cos ϕ
(x + y 2 )1/2 = p 2
∂x
x + y2
∂ 2
y
= sin ϕ
(x + y 2 )1/2 = p 2
∂y
x + y2
∂
− sin ϕ
−y
=
arctan (y/x) = 2
2
∂x
x +y
ρ
∂
cos ϕ
x
=
arctan (y/x) = 2
∂y
x + y2
ρ
sin2 ϕ
ρ
2
cos ϕ
= (ρy )y = cos ϕ ϕy =
ρ
ρxx = (ρx )x = − sin ϕ ϕx =
ρyy
−(cos ϕ ϕx ρ − sin ϕ ρx )
2 sin ϕ cos ϕ
=
2
ρ
ρ2
− sin ϕ ϕy ρ − cos ϕ ρy
−2 sin ϕ cos ϕ
= (ϕy )y =
=
.
2
ρ
ρ2
ϕxx = (ϕx )x =
ϕyy
Daraus ergibt sich
ρ2x + ρ2y = 1
ρx ϕx + ρy ϕy = 0
ρxx + ρyy = 1/ρ
ϕ2x + ϕ2y = 1/ρ2
ϕxx + ϕyy = 0 .
Einsetzen in (8.6) liefert die Form des Laplace-Operators in Polarkoordinaten, indem für die
durch f bzw. f˜ gegebene Punktfunktion die Identität
∆f ≡ fxx + fyy ≡ f˜ρρ + ρ1 f˜ρ +
1 ˜
ρ2 fϕϕ
gilt.
In konkreten Fällen sind neben den üblichen Koordinatensystemen oft auch ganz andere von
grossem Nutzen. Wir betrachten dazu das folgende Beispiel.
60
U. Stammbach: Analysis, Teil B
Beispiel Die Funktion f : (x, t) → f (x, t) beschreibe eine vom der x-Koordinate und der Zeit
t abhängige physikalische Grösse. Sie erfülle die (partielle) Differentialgleichung
ftt = c2 fxx ,
(8.8)
wobei c > 0 eine reelle Zahl bezeichnet. Die Differentialgleichung (8.8) heisst (eindimensionale)
Wellengleichung. Sie heisst so, weil sie bei der mathematischen Behandlung von jeder Art von
Wellen (Wasserwellen, Schallwellen, elektromagnetische Wellen (also Licht!), etc.) auftritt. Ihre
Lösungen beschreiben einen Ausbreitungsvorgang. Dies weisen wir wie folgt nach: Wir führen
in der (x, t)-Ebene neue Koordinaten (u, v) ein, indem wir
u = x + ct , v = x − ct
setzen, oder äquivalent
x=
(siehe Figur 3).
u+v
u−v
, t=
2
2c
Beschreiben f und f˜ dieselbe Punktfunktion, so gelten die Beziehungen
u+v u−v
,
2
2c
f (x, t) = f˜(x + ct, x − ct) .
f˜(u, v) = f
Berechnet man die nach unserer Formel (8.6) relevanten Ausdrücke, so erhält man wegen
ux = 1 , ut = c , vx = 1 , vt = −c
sofort
fx = f˜u ux + f˜v vx
= f˜u + f˜v
fxx = f˜uu ux + f˜uv vx + f˜vu ux + f˜vv vx
= f˜uu + 2f˜uv + f˜vv
ft = f˜u ut + f˜v vt
= c (f˜u − f˜v )
Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung
(t)
61
v = v0
u = u0
Fig. 3 :
Neues Koordinatensystem für
die Wellengleichung
(x)
ftt = c (f˜uu ut + f˜uv vt − f˜vu ut − f˜vv vt )
= c2 (f˜uu − 2f˜uv + f˜vv ) .
Die Wellengleichung stellt sich deshalb in den neuen Koordinaten durch
c2 (f˜uu − 2f˜uv + f˜vv ) = c2 (f˜uu + 2f˜uv + f˜vv )
dar, also durch die sehr einfache partielle Differentialgleichung
(8.9)
f˜uv = 0 .
Die Lösungen der Differentialgleichung (8.9) lassen sich nach Abschnitt 2 sofort angeben. Es
gilt
f˜(u, v) = F (u) + G(v) ,
62
U. Stammbach: Analysis, Teil B
G(x)
G(x − 1c)
G(x − 2c)
Fig. 4 :
Nach rechts fortschreitende
Störung für t = 0, 1, 2, 3, 4
G(x − 3c)
G(x − 4c)
wobei F : u → F (u) und G : v → G(v) zwei beliebige differenzierbare Funktionen sind. Geht
man wieder zu den ursprünglichen Koordinaten (x, t) zurück, so erhält man
f (x, t) = F (x + ct) + G(x − ct) .
Der erste der hier auftretenden Summanden kann als eine mit Schnelligkeit c nach links fortschreitende Störung der durch f beschriebenen Grösse interpretiert werden und der zweite als
eine mit der gleichen Schnelligkeit nach rechts fortschreitende Störung (siehe Figur 4). Was wir
hier beschrieben haben, ist die sogenannte d’Alembert’sche Methode zur Lösung der Wellengleichung (J.B. d’Alembert 1717-1783).
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel V.
Funktionen von mehreren Variablen
Integralrechnung
Die Mathematik ist die Wissenschaft, bei
der sich alles von selbst versteht.
C. G. J. Jacobi 1804 - 1851
Inhaltsverzeichnis
1
Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . .
12
3
Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
4
Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . .
30
5
Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
1
3
Das Gebietsintegral
Wir führen in diesem Abschnitt Gebietsintegrale, d.h. Integrale über eine Funktion von zwei
Variablen in Analogie zu gewöhnlichen Integralen ein. Die Interpretation solcher Integrale in
einem Spezialfall führt uns dann dazu, diese mit Hilfe von zwei aufeinanderfolgenden Integrationen über die beiden Variablen zu berechnen.
Zuerst zur Definition. Wie schon beim bestimmten Integral über eine Funktion einer Variablen
werden wir uns auch hier mit einer Definition begnügen, die nicht den allgemeinsten Fall abdeckt,
die aber für die Anwendungen, die wir im Auge haben, durchaus genügt. Zum einen werden
wir nur stetige Funktionen f : (x, y) → f (x, y) als Integrand zulassen; zum andern wollen
wir voraussetzen, dass der Integrationsbereich B endlich und durch eine differenzierbare Kurve
(ohne Doppelpunkte) begrenzt wird. Die folgenden Schritte führen dann zur Definition des
Gebietsintegrals (siehe Figur 1).
(y)
Fig. 1 :
Zur Definition des
Gebietsintegrals
∆Bi
(xi , yi )
(x)
(a) Teile B (durch differenzierbare Kurven) in Teilbereiche ∆Bi mit Flächeninhalt ∆Fi ein,
i = 1, 2, . . . , n.
4
U. Stammbach: Analysis, Teil B
(b) Wähle in jedem Teilbereich ∆Bi , i = 1, 2, . . . , n einen Punkt (xi , yi ). Unter der Feinheit
der Einteilung verstehen wir den Durchmesser der kleinsten Kreisscheibe, welche in der
Lage ist, jeden einzelnen der Teilbereiche ∆Bi zu überdecken.
(c) Bilde die Riemann’sche Summe
n
X
f (xi , yi ) ∆Fi .
i=1
(d) Definiere das Gebietsintegral als Grenzwert
ZZ
B
f (x, y) dF = lim
n
X
!
f (xi , yi ) ∆Fi ,
i=1
wobei für den Grenzübergang eine Folge von Einteilungen von B zugrunde zu legen ist,
deren Feinheit gegen Null strebt.
Es gilt das Resultat - sonst wäre die Definition nicht sinnvoll -, dass unter den getroffenen
Voraussetzungen der Wert des Limes unabhängig von der gewählten Einteilungsfolge ist.
Ein Gebietsintegral tritt auf natürliche Art im folgenden Beispiel auf.
Beispiel Es sei f : (x, y) → f (x, y) eine auf B definierte stetige Funktion. Wie gross ist das
Volumen V des über dem Bereich B liegenden Körpers, welcher gegen oben durch den Graphen
von f begrenzt wird?
Die zu einer Einteilung von B gehörige Riemann’sche Summe liefert offensichtlich eine Approximation für V . Das Volumen selbst wird als Limes erhalten, wenn die Feinheit der Einteilung
gegen Null geht; es gilt also
ZZ
V =
f (x, y) dF .
B
Dieses Beispiel legt uns unmittelbar auch eine Berechnungsart für das Integral nahe. Wir zerschneiden den Körper wie in Kapitel III, Abschnitt 9 durch Schnitte parallel zur (y, z)-Ebene in
dünne Scheiben (siehe Figur 2). Ist F (x) der Flächeninhalt der Schnittfigur an der Stelle x, so
ist das gesuchte Volumen V durch
V =
Z
β
α
F (x) dx
gegeben. Um den Flächeninhalt F (x) zu bestimmen, zeichnen wir den entsprechenden Schnitt
auf (siehe Figur 3). Offensichtlich gilt
F (x) =
Z
δ(x)
γ(x)
f (x, y) dy .
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
(y)
δ(x)
Fig. 2 :
Erste Berechnungsart
B
γ(x)
(x)
α
x
β
(z)
Fig. 3 :
Erste Berechnungsart; Schnitt
bei x
z = f (x, y)
F (x)
(y)
γ(x)
δ(x)
5
6
U. Stammbach: Analysis, Teil B
(Wir nehmen hier stillschweigend an, dass für jedes α ≤ x ≤ β der Schnitt an der Stelle x den
Rand des Bereiches B in höchstens zwei Punkten schneidet. Sollte das nicht von Anfang an
der Fall sein, so müsste der Bereich entsprechend unterteilt werden.) Das Volumen des Körpers
drückt sich dann durch
V =
ZZ
B
f (x, y) dF =
Z
β
α
F (x) dx =
Z
β
α
dx
Z
δ(x)
γ(x)
f (x, y) dy
aus. Die letztere Formel ist ein sogenanntes Doppelintegral. Sie liefert eine Berechnungsart für
das Gebietsintegral: in einem ersten Schritt wird das “innere” und in einem zweiten Schritt das
“äussere” Integral ausgewertet.
Beispiel Es sei f : (x, y) → f (x, y) = x gegeben und als Integrationsbereich B der zu x ≥ 0
gehörige Teil der Ellipsenfläche
x2 y 2
+ 2 =1.
a2
b
(y)
(x, +b
b
p
1 − x2 /a2 )
(x)
0
x
(x, −b
a
p
1 − x2 /a2 )
Es sei 0 ≤ x ≤ a (siehe Figur 4). Dann sind γ(x) und δ(x) durch
Fig. 4 :
Erste Berechnungsart;
Beispiel
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
q
7
q
γ(x) = −b 1 − x2 /a2 ,
δ(x) = +b 1 − x2 /a2
gegeben. Ferner gilt α = 0, β = +a. Man erhält dann der Reihe nach
V
ZZ
=
Z
=
a
Z
Z
= 2
√
−b
1−x2 /a2
1−x2 /a2
x dy
+b
a
0
−b
dx xb
q
1−x /a
1 − x2 /a2
ia
1h
(1 − x2 /a2 )3/2
0
3
= −2ba2
=
√
+b
√ 2 2
1−x /a
dx [xy] √ 2 2
a
0
Z
dx
0
=
x dF
B
2 2
ba .
3
Es ist natürlich klar, dass die Rolle der Variablen x und y vertauscht werden kann (siehe Figur 5):
Zerschneiden wir den Körper durch Ebenen parallel zur (x, z)-Ebene, so wird der Flächeninhalt
der zu y gehörigen Schnittfigur durch
F̃ (y) =
Z
β(y)
α(y)
f (x, y) dx
gegeben, so dass wir
V =
ZZ
B
f (x, y) dF =
Z
γ
δ
F̃ (y) dy =
Z
γ
δ
dy
Z
β(y)
α(y)
erhalten.
Beispiel Für das oben bereits betrachtete Beispiel
ZZ
B
x dF
erhalten wir für die Grössen α(y), β(y)
q
α(y) = 0 , β(y) = a 1 − y 2 /b2 .
(siehe Figur 6). Ausserdem gilt γ = −b, δ = b. Daraus ergibt sich
f (x, y) dx
8
U. Stammbach: Analysis, Teil B
(y)
δ
Fig. 5 :
Zweite Berechnungsart
B
y
γ
(x)
α(y)
β(y)
(y)
b
(a
p
1 − y 2 /b2 , y)
y
(x)
a
−b
Fig. 6 :
Zweite Berechnungsart;
Beispiel
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
V
ZZ
=
=
+b
=
=
=
=
dy
−b
Z
=
x dF
B
Z
a2
0
x2
2
dy
−b
2
Z a√1−y2 /b2
"
+b
a2
Z
+b
−b
y3
y− 2
3b
a2
x dx
#a√1−y2 /b2
0
dy(1 − y 2 /b2 )
"
2
9
#+b
1
2 b− b
2
3
2 2
a b.
3
−b
Es ist an dieser Stelle wichtig zu erkennen, dass die Berechnung eines Gebietsintegrals durch
eine zweifache Integration natürlich nicht davon abhängig ist, dass das Gebietsintegral
ZZ
B
f (x, y) dF
ein Volumen ausdrückt. In der Tat ist die Interpretation des Gebietsintegrals als Volumen nur
eine von vielen möglichen Interpretationen, wie ja auch die Interpretation des gewöhnlichen
bestimmten Integrals als Flächeninhalt nur eine von vielen möglichen Interpretationen ist.
Beispiel Wir betrachten den zu x ≥ 0 gehörigen Teil B der Ellipse
x2 y 2
+ 2 =1.
a2
b
Man berechne den Schwerpunkt S des Flächenstücks, wenn es homogen mit Masse belegt ist.
Ist S = (xS , yS ), so gilt aus Symmetriegründen natürlich yS = 0. Um xS zu berechnen, liefert
die Momentbedingung die Beziehung
xS · F =
ZZ
B
x dF ,
wo F den Flächeninhalt der Halbellipse bezeichnet. Das hier auftretende Gebietsintegral drückt
ein Moment aus; sein Wert wurde aber bereits im vorhergehenden Beispiel bestimmt, als es
um die Berechnung eines Volumens ging. Auch hier würde man seinen Wert durch die gleiche
Technik, d.h. durch doppelte Integration bestimmen. Verwenden wir das oben hergeleitete
Resultat, so erhalten wir
10
U. Stammbach: Analysis, Teil B
xS =
2 2 2
4
a b=
a.
πab 3
3π
Gebietsintegrale treten in vielen Anwendungen auf; als Beispiele erwähnen wir
- Berechnung der Gesamtmasse bei gegebener Flächendichte auf B,
- Berechnung der Gesamtladung bei gegebener Flächenladungsdichte auf B,
- Berechnung des hydrostatischen Drucks auf eine senkrechte Wand der Form B,
- Berechnung des Schwerpunktes eines ebenen Bereiches B,
- Berechnung des Flächenträgheitsmomentes eines ebenen Bereiches B.
Zur letzten Anwendung betrachten wir das folgende konkrete Beispiel.
Beispiel Gesucht ist das polare Trägheitsmoment J0 eines gleichseitigen Dreiecks mit Seite a
bezüglich seines Schwerpunktes (siehe Figur 7).
(y)
B
D
S
(x)
D0
C
M
A=
√
a − 3
2, 6
a
Fig. 7 :
Polares Trägheitsmoment eines
gleichseitigen Dreiecks bezüglich
seines Schwerpunktes
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
11
Wir wählen das Koordinatensystem so, dass sein Nullpunkt mit dem Schwerpunkt S zusammenfällt und eine Ecke des Dreiecks auf der positiven y-Achse liegt. Nach der Definition des
polaren Flächenträgheitsmomentes (siehe Mechanik) gilt
ZZ
J0 =
D
(x2 + y 2 ) dF ,
wo D das gleichseitige Dreieck bezeichnet. Es gilt
√ !
a − 3
A=
,
a ,
2 6
und die durch SA bestimmte Gerade hat die Gleichung
1
y = −√ x .
3
Aus Symmetriegründen erhalten wir
J0 = 6 ·
ZZ
D0
(x2 + y 2 ) dF ,
wo D0 das Dreieck ASM bezeichnet. Wir erhalten
J0 = 6 ·
= 6·
= 6·
Z
0
−
Z
3
a
6
0
−
Z
√
√
3
a
6
0
−
√
3
a
6
= −2 · 6 ·
dy
√
− 3 y
Z
0
dx(x2 + y 2 )
#−√3y
"
x3
dy
+ xy 2
3
0
√ 3 √ 3
dy(− 3y − 3y )
√ Z
3
0
−
"
√
3
a
6
√ y4
= −2 · 6 · 3
4
√ 9a4
= 3· 3 4 4
2 ·3
√
3 4
=
a .
3 · 16
y 3 dy
#0
−
√
3
a
6
Wir überlassen es dem Leser, das Resultat zu kontrollieren, indem die zweifache Integration in
der umgekehrten Reihenfolge durchgeführt wird.
12
2
U. Stammbach: Analysis, Teil B
Koordinatentransformationen bei Gebietsintegralen
Wir beginnen hier mit einem Beispiel, das zeigt, wie die geschickte Wahl eines dem Problem
angepassten neuen Koordinatensystems die Berechnung eines Gebietsintegrals erleichtern kann.
Beispiel Aus einer Kugel mit Radius a wird ein Loch in der Form eines geraden Kreiszylinders
mit Grundkreisradius a/2 herausgebohrt und zwar so, dass die Achse des Kreiszylinders den
Kugelmittelpunkt enthält. Wie gross ist das Volumen des herausgebohrten Teils der Kugel?
Wir geben uns die Kugel durch x2 + y 2 + z 2 = a2 und wählen die z-Achse als Zylinderachse
(siehe Figur 1). Der Grundkreis des Zylinders wird durch
(y)
a
B
a/2
(x)
2
Fig. 1 :
Zentrale zylindrische
Ausbohrung der Kugel
a
2
beschrieben. Das gesuchte Volumen V ist dann durch das Gebietsintegral
2
2
x +y =
ZZ q
2
B
a2 − x2 − y 2 dF
12
2
U. Stammbach: Analysis, Teil B
Koordinatentransformationen bei Gebietsintegralen
Wir beginnen hier mit einem Beispiel, das zeigt, wie die geschickte Wahl eines dem Problem
angepassten neuen Koordinatensystems die Berechnung eines Gebietsintegrals erleichtern kann.
Beispiel Aus einer Kugel mit Radius a wird ein Loch in der Form eines geraden Kreiszylinders
mit Grundkreisradius a/2 herausgebohrt und zwar so, dass die Achse des Kreiszylinders den
Kugelmittelpunkt enthält. Wie gross ist das Volumen des herausgebohrten Teils der Kugel?
Wir geben uns die Kugel durch x2 + y 2 + z 2 = a2 und wählen die z-Achse als Zylinderachse
(siehe Figur 1). Der Grundkreis des Zylinders wird durch
(y)
a
B
a/2
(x)
2
Fig. 1 :
Zentrale zylindrische
Ausbohrung der Kugel
a
2
beschrieben. Das gesuchte Volumen V ist dann durch das Gebietsintegral
2
2
x +y =
ZZ q
2
B
a2 − x2 − y 2 dF
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
13
gegeben, wo B die Grundfläche des Zylinders bezeichnet. Dieses Gebietsintegral kann in ein
Doppelintegral umgewandelt werden:
V =2
Z
+a/2
−a/2
dx
q
Z
+
q
−
a2
−x2
4
q
a2
−x2
4
a2 − x2 − y 2 dy .
Im Prinzip lassen sich die hier auftretenden zwei Integrationen durchführen, allerdings sind wie man leicht sieht - die dazu notwendigen Rechnungen sehr umständlich.
Eine bessere, weil einfachere Art, das Problem anzugehen, besteht darin, zuerst ein angepasstes
Koordinatensystem einzuführen. Wegen der Rotationssymmetrie bezüglich der z-Achse bietet
sich dafür natürlich ein Zylinderkoordinatensystem an mit Polarkoordinaten in der (x, y)-Ebene.
Wegen x2 + y 2 = ρ2 darf man schreiben
V =2
ZZ q
B
a2 − ρ2 dF .
Für die Berechnung denkt man sich das Gebiet B durch die Koordinatenlinien der Polarkoordinaten eingeteilt. Eine heuristische Überlegung zeigt, dass der Flächeninhalt des “Flächenelementes” in Polarkoordinaten durch (siehe Figur 2)
dF = ρ dρ dϕ
gegeben ist. Für die Berechnung des Gebietsintegrales halte man nun zuerst ϕ fest, integriere
über ρ und anschliessend über ϕ. Man erhält auf diese Weise für V ein Doppelintegral, das sich
auf die übliche Art und Weise berechnen lässt:
V
Z
= 2
Z
= 2
Z
2π
0
2π
0
2π
dϕ
Z
a/2
0
q
ρ a2 − ρ2 dρ
1
dϕ − (a2 − ρ2 )3/2
3
1 3 2
= 2
dϕ −
a
3 4
0
√ !
3 3
3 4π
= a
1−
3
8
√
8−3 3
=
π a3 .
6
3/2
a/2
0
1
+ (a2 )3/2
3
!
Beispiel Es sei die Kugel x2 + y 2 + z 2 = a2 gegeben. Es werde ein Loch in der Form eines
geraden Kreiszylinders mit Radius a/2 und Achse parallel zur z-Achse herausgebohrt, wobei die
Zylinderachse die (x, y)-Ebene im Punkt (a/2, 0) trifft (siehe Figur 3).
14
U. Stammbach: Analysis, Teil B
(y)
Fig. 2 :
Flächenelement in
Polarkoordinaten
dF
ρdϕ
dϕ
dρ
ρ
(x)
(y)
a cos ϕ
ϕ
(a/2, 0)
B
(x)
Fig. 3 :
Tangentiale zylindrische
Ausbohrung der Kugel
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
15
Wiederum rechnen wir in Polarkoordinaten (obschon das Problem nicht achsensymmetrisch ist):
V
ZZ q
= 2
Z
ZB
Z
B0
π/2
= 4
= 4
Z
=
=
=
=
=
=
Beispiel
telpunkt.
0
a2 − ρ2 dF
q
a2 − ρ2 dF
dϕ
Z
a cos ϕ q
a2 − ρ2 ρ dρ
0
a cos ϕ
1
4
dϕ − (a2 − ρ2 )3/2
3
0
0
Z π/2 1 3
1
4
− a (1 − cos2 ϕ)3/2 + a3 dϕ
3
3
0
Z π/2
4 3
(1 − sin3 ϕ) dϕ
a
3
0
Z
4 3 π/2
(1 − sin ϕ + cos2 ϕ sin ϕ)dϕ
a
3
0
4 3 π
1
a
−1+
3
2
3
6π − 8 3
a .
9
π/2
Gesucht ist das polare Flächenträgheitsmoment eines Kreisringes um den Mit-
Wir wählen das Koordinatensystem mit dem Ursprung im Mittelpunkt des Kreisringes und
verwenden Polarkoordinaten.
J0 =
ZZ
B
2
ρ dF =
Z
0
2π
dϕ
Z
Beispiel Das sogenannte Fehlerintegral
J=
"
a
ρ4
ρ ρ dρ = 2π
4
Z
∞
b
2
−∞
#b
=
a
π 4
(b − a4 ) .
2
2
e−x dx
spielt in der Statistik und Wahrscheinlichkeitsrechnung eine wichtige Rolle. Wir haben in Kapitel
III, Abschnitt 13 die Existenz dieses Integrals nachgewiesen. Die Berechnung scheiterte aber
daran, dass die Stammfunktion von
x → e−x
2
nicht durch elementare Funktionen ausdrückbar ist. Die folgende Überlegung liefert diesen Wert
auf dem Umweg über ein Gebietsintegral. (Wegen der auftretenden uneigentlichen Integralen ist
16
U. Stammbach: Analysis, Teil B
vom mathematischen Standpunkt aus unser Vorgehen etwas forsch; dafür kommt die zugrunde
liegende Idee aber besser zur Geltung. Zur Beruhigung des Lesers können wir anfügen, dass der
Mathematiker unser Vorgehen mit geringem zusätzlichen Aufwand rechtfertigen kann.)
Wir beginnen damit, dass wir nicht J selbst, sondern J 2 zu berechnen versuchen.
J
2
Z
=
∞
−∞
∞
Z
=
Z−∞
Z
=
ZZ
=
=
−x2
e
dx
Z
dx ·
∞
=
−∞
=
2
−∞
e
ganze Ebene
e−y dy
2
· e−y dy
e−(x
2 +y 2 )
dF
2
2π
0
Z
∞
−x2
ganze Ebene
Z
Z
2π
0
dϕ
Z
∞
0
e−ρ dF
2
e−ρ ρ dρ
"
2
e−ρ
dϕ −
2
#∞
0
= π.
Wir erhalten also
Z
∞
−∞
2
e−x dx =
√
π.
Dieses Beispiel zeigt sehr schön, wie ein Koordinatenwechsel einem Problem mit einem Schlag
ein anderes Gesicht geben kann.
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
3
17
Das Volumenintegral
Das Volumenintegral ist analog zum Gebietsintegral definiert. Ein wesentlicher Unterschied
besteht allerdings darin, dass der Graph des Integranden für eine anschauliche Interpretation
nicht mehr herangezogen werden kann.
Definition Es sei eine stetige Funktion f : (x, y, z) → f (x, y, z) gegeben und ein endlicher
räumlicher Bereich B. Das Volumenintegral
ZZZ
B
f (x, y, z) dV
ist dann wie folgt definiert (siehe Figur 1):
(z)
Fig. 1 :
Zur Definition des
Volumenintegrals
B
∆Bi
(xi , yi , zi )
(y)
(x)
(a) Teile B (durch Flächen, die durch differenzierbare Funktionen gegeben sind) in Teilbereiche ∆Bi mit Volumen ∆Vi ein, i = 1, 2, . . . , n.
18
U. Stammbach: Analysis, Teil B
(b) Wähle in jedem ∆Bi , i = 1, 2, . . . , n einen Punkt (xi , yi , zi ). Die Feinheit der Einteilung
ist der Durchmesser der kleinsten Kugel, welche in der Lage ist, jeden einzelnen der Teilbereiche ∆Bi zu überdecken.
(c) Bilde die Riemann’sche Summe
n
X
f (xi , yi , zi ) ∆Vi .
i=1
(d) Das Volumenintegral ist definiert als Grenzwert
ZZZ
B
f (x, y, z) dV = lim
n
X
!
f (xi , yi , zi ) ∆Vi ,
i=1
wobei eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null
strebt.
Es gilt auch hier das mathematische Resultat, dass der Wert des Limes nicht von der gewählten
Einteilungsfolge abhängig ist.
Da uns anschaulich der Graph der Funktion f : (x, y, z) → f (x, y, z) nicht zur Verfügung steht,
suchen wir nach einer anderen einfachen Interpretation für das Volumenintegral. Eine von vielen
Möglichkeiten ist die folgende. Es sei B ein dreidimensionaler Körper; dessen Dichte im Punkte
(x, y, z) werde durch die Funktion ρ(x, y, z) beschrieben. Dann ist ρ(xi , yi , zi )·∆Vi approximativ
die in ∆Bi vorhandene Masse, und die Riemann’sche Summe
n
X
ρ(xi , yi , zi ) ∆Vi
i=1
liefert eine Approximation für die Masse des Körpers. Die Approximation ist offensichtlich umso
besser, je feiner die Einteilung von B ist. Die Gesamtmasse ist somit durch den Grenzübergang
gegeben, d.h. sie ist gleich:
M=
ZZZ
B
ρ(x, y, z) dV .
Volumenintegrale treten in vielen weiteren Zusammenhängen auf, einige davon werden wir in
den folgenden Beispielen oder auch später in dieser Vorlesung kennenlernen.
Beispiel Es ist das Trägheitsmoment Θ eines homogenen (Dichte ρ) Würfels mit Kantenlänge
a gesucht und zwar um eine durch den Mittelpunkt des Würfels und den Mittelpunkt einer
Seitenfläche gehenden Achse.
Wählen wir das Koordinatensystem wie in der Figur 2, so gilt für das Trägheitsmoment um die
z-Achse laut Definition
ZZZ
Θ=ρ
(x2 + y 2 ) dV .
W
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
19
(z)
Fig. 2 :
Trägheitsmoment eines Würfels
W0
(y)
(a/2, 0, 0)
(x)
W
Aus Symmetriegründen ist der Beitrag an Θ von jedem der acht Teilwürfel in den Oktanten des
Koordinatensystems gleich gross, so dass gilt
Θ=8ρ
ZZZ
W0
(x2 + y 2 ) dV ,
wo W 0 der Teilwürfel im 1. Oktanten ist. Analog wie beim Gebietsintegral berechnen wir
das Volumenintegral durch Zurückführung auf gewöhnliche Integrationen: Wir wandeln das
Volumenintegral in ein dreifaches Integral um. Schrittweise erhalten wir (siehe Figur 3):
- Anteil einer “dünnen” Säule an das Trägheitsmoment des Würfels W 0
ρ dx dy
Z
a/2
0
(x2 + y 2 ) dz ,
- Anteil einer “dünnen Scheibe” an das Trägheitsmoment als “Summe” der Anteile der
Säulen
Z a/2
Z a/2
ρ dx
dy
(x2 + y 2 ) dz ,
0
- Trägheitsmoment des Würfels
ρ
Z
0
W0
a/2
0
als “Summe” der Anteile der Scheiben
dx
Z
0
a/2
dy
Z
0
a/2
(x2 + y 2 ) dz .
20
U. Stammbach: Analysis, Teil B
(z)
a/2
Fig. 3 :
Berechnung des
Integrals über W 0
dz
(y)
a/2
dx
a/2
dy
(x)
Damit erhalten wir das Trägheitsmoment Θ als ein dreifaches Integral, welches sich ohne weiteres
berechnen lässt:
Θ = 8ρ
= 8ρ
= 8ρ
Z
Z
a/2
0
0
a
2
a
= 8ρ
2
a
= 8ρ
2
a/2
Z
dx
dx
a/2
0
Z
a/2
0
Z
0
a/2
Z
0
Z
0
dx
a/2
a/2
Z
Z
dy
h
0
dx
"
a/2
0
ia/2
dy (x2 + y 2 )
y3
x2 y +
3
#a/2
0
x2 a
a3
+
2
3·8
a ax3
a3 x
= 8ρ
+
2 2·3 3·8
a a4
= 8ρ ·
2 3·8
(x2 + y 2 ) dz
dy x2 z + y 2 z
"
dx
a/2
#a/2
0
!
0
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
= ρ
21
a5
.
6
Beispiel Gesucht ist das Trägheitsmoment Θ um die x-Achse des homogenen Tetraeders T mit
Eckpunkten (0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1).
Es gilt laut Definition
Θ=ρ
ZZZ
T
(y 2 + z 2 ) dV .
Die mathematische Aufgabe besteht darin, dieses Volumenintegral in ein dreifaches Integral
umzuwandeln. Wir gehen dabei ähnlich vor wie im obigen Beispiel (siehe Figur 4).
(z)
(0, 0, 1)
y+z =1
Fig. 4 :
Trägheitsmoment eines
Tetraeders
(0, y, z)
(y)
(0, 1, 0)
x+y+z =1
(1, 0, 0)
(x)
- Für festes (y, z) betrachten wir die “Säule” in Richtung der x-Achse. Ihr Anteil an das
Trägheitsmoment ist
ρ dz dy
Z
0
1−y−z
(y 2 + z 2 ) dx .
Die Grenzen für die Integration sind x = 0 (Punkt in der (y, z)-Ebene) und der x-Wert
des zu y und z gehörigen Punktes auf der Ebene x + y + z = 1, also x = 1 − y − z.
22
U. Stammbach: Analysis, Teil B
- Für festes z betrachten wir die “Scheibe” parallel zur (x, y)-Ebene. Ihr Anteil an das
Trägheitsmoment Θ ist die “Summe” der Anteile aller “Säulen” für festgehaltenes z, also
ρ dz
Z
1−z
dy
0
Z
1−y−z
0
(y 2 + z 2 ) dx .
Die Grenzen für die y-Integration sind: y = 0 und der y-Wert, des zu z gehörigen Punktes
auf der Geraden y + z = 1, also y = 1 − z.
- Das ganze Trägheitsmoment Θ ist die ”Summe” der Anteile aller dieser “Scheiben”:
Θ=ρ
Z
0
1
dz
Z
1−z
dy
0
Z
1−y−z
0
(y 2 + z 2 ) dx .
Wir erhalten nun der Reihe nach
Θ = ρ
= ρ
= ρ
Z
0
Z
=
=
=
1
0
Z
0
Z
=
1
1
dz
dz
Z
0
Z
0
"
dz
1−z
1−z
h
dy y 2 x + z 2 x
i1−y−z
0
dy (y 2 − y 3 − y 2 z + z 2 − z 2 y − z 3 )
y3 y4 y3z
z2 y2
−
−
+ z2y −
− z3y
3
4
3
2
#1−z
0
i1−z
ρ 1 h 3
dz 4y − 3y 4 − 4y 3 z + 12z 2 y − 6z 2 y 2 − 12z 3 y
0
12 0
Z
ρ 1 4
(7z − 16z 3 + 12z 2 − 4z + 1) dz
12 0
ρ 7
−4+4−2+1
12 5
ρ
.
30
Auch bei Volumenintegralen lohnt es sich manchmal, ein neues Koordinatensystem einzuführen.
Wir betrachten hier zuerst den Fall von Kugelkoordinaten.
Beispiel Es ist das Volumen einer Kugel K mit Radius R zu berechnen.
Wir führen ein Kugelkoordinatensystem ein, dessen Ursprung mit dem Mittelpunkt der Kugel
zusammenfällt (siehe Figur 5). Dann gilt offenbar
V =
ZZZ
K
1 dV .
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
(z)
Fig. 5 :
Volumen einer Kugel
R
(y)
(x)
(z)
dϕ
Fig. 6 :
Das Volumenelement bei
Kugelkoordinaten
r sin θ
θ
dV
rdθ
dθ
r
dr
23
24
U. Stammbach: Analysis, Teil B
Wie man aus der Figur 6 entnimmt, drückt sich das Volumenelement in Kugelkoordinaten
(r, ϕ, θ) durch
dV
= dr (r dθ) (r sin θ) dϕ
= r 2 sin θ dr dϕ dθ
aus. Wandeln wir das Volumenintegral in ein dreifaches Integral über r, θ, ϕ (in dieser Reihenfolge) um, so erhalten wir
V
Z
=
0
Z
=
0
Z
=
=
0
2π
2π
2π
dϕ
dϕ
Z
Z
π
0
π
0
dθ
dθ
Z
0
R
dr r 2 sin θ
R3
sin θ
3
R3
dϕ
2
3
4 3
πR .
3
Damit wird ein altes, allen wohlbekanntes Resultat bestätigt.
Beispiel Es ist die Gravitationskraft einer homogenen Kugel mit Radius a, Dichte ρ auf einen
Massenpunkt m im Abstand h (h ≥ a) vom Mittelpunkt der Kugel zu berechnen.
Wir wählen ein Kugelkoordinatensystem mit Ursprung im Mittelpunkt der Kugel und den
Massenpunkt m im Punkt mit den kartesischen Koordinaten (0, 0, h) (siehe Figur 7). Die von
~ ist auf dV zugerichtet.
der Teilmasse ρ · dV der Kugel herrührende, auf m wirkende Teilkraft dK
~
Für den Betrag von dK gilt nach Newton
~ = γ m ρ dV .
|dK|
R2
~ ist die “Summe” dieser Teilkräfte über alle Volumenelemente dV
Die resultierende Totalkraft K
~ parallel zur
der Kugel, also das Volumenintegral über die Kugel. Aus Symmetriegründen wird K
z-Achse (gegen den Mittelpunkt der Kugel zu gerichtet) sein, so dass für die “Summen”bildung
~ eine Rolle spielt.
nur die dritte Komponente von dK
Man liest aus der Figur 8 die folgenden Beziehungen ab
R =
cos α =
(h − r cos θ)2 + (r sin θ)2
1/2
= (r 2 + h2 − 2rh cos θ)1/2 ,
h − r cos θ
.
R
Damit lässt sich dK3 vollständig in Kugelkoordinaten ausdrücken; man erhält
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
25
(z)
(0, 0, h)
m
Fig. 7 :
Gravitationskraft einer Kugel
a
(y)
(x)
m
~
dK
dK3
α
h − r cos θ
R
Fig. 8 :
Zur Berechnung der
Gravitationskraft einer Kugel
h
r sin θ
r cos θ
θ
0
r
26
U. Stammbach: Analysis, Teil B
dK3 = −γmρ
h − r cos θ
r 2 sin θ dr dϕ dθ .
+ h2 − 2rh cos θ)3/2
(r 2
Damit folgt durch Integration über die Kugel und gleichzeitiger Umwandlung in ein dreifaches
Integral in Kugelkoordinaten
K = −γmρ
Z
2π
0
dϕ
Z
a
0
dr
Z
π
0
(r 2
h − r cos θ
r 2 sin θ dθ .
+ h2 − 2rh cos θ)3/2
Wir berechnen zuerst die beiden Summanden I1 und I2 des inneren Integrals. Es gilt
I1 = hr 2
Z
π
0
sin θ
dθ
(r 2 + h2 − 2rh cos θ)3/2
iπ
2hr 2 h 2
= −
(r + h2 − 2rh cos θ)−1/2
0
2rh
2
2
−1/2
2
= −r (r + h + 2rh)
− (r + h2 − 2rh)−1/2
= −r
=
1
1
−
h+r h−r
, da h ≥ r ,
2r 2
.
h2 − r 2
Der zweite Summand lautet
I2 = −r
3
Z
0
π
(r 2
sin θ cos θ
dθ .
+ h2 − 2rh cos θ)3/2
Wir wenden in einem ersten Schritt partielle Integration an. Wir setzen
u0 =
sin θ
,
(r 2 + h2 − 2rh cos θ)3/2
v = cos θ
und erhalten
u=−
1
(r 2 + h2 − 2rh cos θ)−1/2 ,
rh
v 0 = − sin θ .
Damit folgt
I2 = −r
3
1
− (r 2 + h2 − 2rh cos θ)−1/2 cos θ
rh
π
0
+
r3
rh
Z
0
π
(r 2
+ h2
sin θ
dθ
− 2rh cos θ)1/2
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
r2
1
=
−
h
r+h
r 2 2h
= −
h h2 − r 2
2r 2
= − 2
+
h − r2
27
iπ
2r 2 h 2
1
2
1/2
+
(r
+
h
−
2rh
cos
θ)
)
−
0
h−r
2rh2
r
+ 2 (r + h − (h − r))
h
2
2r
.
h2
Nach der Integration über θ erhält man demzufolge
K = −γmρ
Z
2π
0
Z
dϕ
Z
a
0
dr
2r 2
h2
!
2 a3
3 h2
0
4π 3 1
= −γmρ
a
3
h2
1
= −γmM 2 ,
h
= −γmρ
2π
dϕ
wobei wir mit M die Gesamtmasse der homogenen Kugel bezeichnet haben.
Dies ist ein beachtenswertes Resultat: die auf den Massenpunkt m wirkende Gravitationskraft
einer homogenen Kugel lässt sich berechnen, indem man sich die Gesamtmasse der Kugel in
deren Zentrum konzentriert denkt.
In einem weitern Beispiel betrachten wir schliesslich noch Zylinderkoordinaten.
Beispiel Gesucht ist das Trägheitsmoment eines homogenen (Dichte 1) Kreiszylinders der
Höhe h und dem Radius a um einen Durchmesser seines Grundkreises.
Wir wählen das Koordinatensystem so, dass der Kreiszylinder auf der (x, y)-Ebene steht und dass
seine Achse mit der z-Achse zusammenfällt (siehe Figur 9). Es ist dann das Trägheitsmoment
Θ um die x-Achse zu bestimmen. Laut Definition gilt
ZZZ
Θ=
Z
(y 2 + z 2 ) dV .
Dem Problem angepasst wählen wir jetzt Zylinderkoordinaten (ρ, ϕ, z). Wie wir wissen, gilt
x = ρ cos ϕ
y = ρ sin ϕ
z = z.
Ausserdem entnimmt man der Figur 10, dass das Volumenelement sich durch
28
U. Stammbach: Analysis, Teil B
(z)
Fig. 9 :
Trägheitsmoment eines
Kreiszylinders um einen
Durchmesser des Grundkreises
h
(y)
a
(x)
(z)
dρ
Fig. 10 :
Volumenelement bei
Zylinderkoordinaten
ρ dϕ
ρ
dϕ
(y)
(x)
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
29
dV = ρ dρ dϕ dz
ausdrückt. Wandelt man nun das Volumenintegral in ein dreifaches Integral über die Zylinderkoordinaten z, ρ, ϕ (in dieser Reihenfolge) um, so erhält man der Reihe nach
ZZZ
Θ =
Z
=
0
Z
=
=
2π
0
Z
=
2π
0
Z
=
2π
0
Z
=
2π
2π
Z
(z 2 + ρ2 sin2 ϕ) dV
dϕ
dϕ
dϕ
Z
Z
Z
a
0
a
0
a
0
dρ
Z
h
0
dz ρ(z 2 + ρ2 sin2 ϕ)
"
#h
z3
dρ ρ
+ ρ2 z sin2 ϕ
3
dρ ρ
"
#a
h3 ρ2 hρ4
dϕ
+
sin2 ϕ
2·3
4
h3 a2
0
!
h3
+ ρ2 h sin2 ϕ
3
ha4
!0
+
sin2 ϕ
2
·
3
4
0
1 3 2 1
πh a + πha4 .
3
4
dϕ
Wir werden im nächsten Abschnitt noch einmal auf Koordinatentransformationen bei Gebietsund Volumenintegralen zurückkommen und sie dort in einer etwas formaleren Weise behandeln.
30
4
U. Stammbach: Analysis, Teil B
Zur Transformation von Gebiets- und Volumenintegralen
Unsere Überlegungen zur Transformation von Gebiets- und Volumenintegralen in neue Koordinatensysteme geben uns Gelegenheit, noch etwas näher auf Koordinatentransformationen im
allgemeinen einzugehen. Zu diesem Zweck betrachten wir zuerst den zweidimensionalen Fall
noch etwas genauer. Neben dem kartesischen (x, y)-Koordinatensystem stellen wir uns in der
Ebene ein (u, v)-Koordinatensystem vor. Der durch das Paar (u, v) im neuen Koordinatensystem
beschriebene Punkt habe die durch die Funktionen
x = x(u, v) , y = y(u, v)
(4.1)
bestimmten kartesischen Koordinaten (x, y) (siehe Kapitel IV, Abschnitt 8).
(y)
(x(u, v), y(u, v))
(v)
(x)
Fig. 1 :
Koordinatentransformation in
der Ebene als Abbildung
(u, v)
(u)
Wir können nun - und dies ist eine wichtige, hier zum erstenmal auftretende Idee - eine künstliche
(u, v)-Ebene betrachten und die Funktionen (4.1) als eine Abbildung der (u, v)-Ebene in die
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
31
(x, y)-Ebene ansehen (siehe Figur 1): Dem Punkt (u, v) in der (u, v)-Ebene wird der Punkt
(x, y) mit
x = x(u, v) , y = y(u, v)
in der (x, y)-Ebene zugeordnet. (Statt ‘Abbildung’ könnte man natürlich ebenso gut auch ‘Funktion’ sagen; wir haben eine Funktion vor uns, die auf den Punkten der (u, v)-Ebene definiert ist
und die als Werte Punkte in der (x, y)-Ebene annimmt).
Beispiel Im Falle von Polarkoordinaten (ρ, ϕ) gilt bekanntlich
x = x(ρ, ϕ) = ρ cos ϕ , y = y(ρ, ϕ) = ρ sin ϕ .
Dem Punkt (ρ, ϕ) in der (ρ, ϕ)-Ebene wird der Punkt (x, y) = (ρ cos ϕ, ρ sin ϕ) zugeordnet
(siehe Figuren 2,3). Durch die Koordinatentransformation wird der Streifen 0 ≤ ϕ < 2π auf die
ganze (x, y)-Ebene abgebildet. Das Bild der Rechtecks 0 ≤ ρ ≤ a, 0 ≤ ϕ < 2π ist der Kreis um
den Ursprung mit Radius a. (Man beachte, dass alle Punkte der ϕ-Achse auf den Nullpunkt
der (x, y)-Ebene abgebildet werden. In diesen Punkten ist die Koordinatentransformation - wie
man sagt - singulär.)
Die Abbildung von der (u, v)-Ebene in die (x, y)-Ebene lässt sich gut veranschaulichen, indem
man die Bilder der Parallelen zur u- bzw. v-Achse betrachtet. Die (horizontale) Gerade v = v0
geht in die durch die Parameterdarstellung
u → (x(u, v0 ), y(u, v0 )) = ~r(u, v0 )
gegebene Kurve in der (x, y)-Ebene über, und die (vertikale) Gerade u = u0 in die Kurve
v → (x(u0 , v), y(u0 , v)) = ~r(u0 , v) .
Diese Kurven heissen Koordinatenlinien des neuen Koordinatensystems (siehe Figuren 4,5).
Beispiel Im Falle von Polarkoordinaten sind die Koordinatenlinien einerseits vom Nullpunkt
ausgehende Strahlen ( ϕ konstant), andererseits Kreise um den Ursprung ( ρ konstant) (siehe
Figuren 2,3).
Wir stellen uns nun vor, dass uns in der (x, y)-Ebene ein Bereich B gegeben ist, der als Integrationsbereich eines Gebietsintegrals auftritt. Verwendet man zur Berechnung des Integrals das
(u, v)-Koordinatensystem, so ist für die Riemann’sche Summe der Bereich B durch die u- bzw.
v-Koordinatenlinien einzuteilen. Es ist dann der Flächeninhalt dF des “Flächenelementes” dB
zu bestimmen, welches dadurch entsteht, dass u um du und v um dv wächst. Approximativ ist
~ und AC
~ aufgespannt wird (siehe Figur
dB ein Parallelogramm, welches durch die Vektoren AB
6). Nun gilt wegen des Mittelwertsatzes der Differentialrechnung
32
U. Stammbach: Analysis, Teil B
(ϕ)
2π
Fig. 2 :
Polarkoordinaten, (ρ, ϕ)-Linien
(ρ, ϕ)
(ρ)
a
(y)
(ρ cos ϕ, ρ sin ϕ)
(x)
Fig. 3 :
Polarkoordinaten,
Koordinatenlinien
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
(v)
u = u0
Fig. 4 :
Koordinatentransformation,
(u, v)-Ebene
(u0 , v0 )
v = v0
(u)
(y)
u = u0
Fig. 5 :
Koordinatenlinien
(x(u0 , v0 ), y(u0 , v0 ))
v = v0
(x)
33
34
U. Stammbach: Analysis, Teil B
~ = ~r(u + du, v) − ~r(u, v) ∼ ~ru (u, v) du = (xu (u, v), yu (u, v)) du
AB
~ = ~r(u, v + dv) − ~r(u, v) ∼ ~rv (u, v) dv = (xv (u, v), yv (u, v)) dv .
AC
(y)
u
u + du
C
D
v + dv
Fig. 6 :
Flächenelement bei
Koordinatentransformationen
dB
~r(u, v + dv)
A
B
~r(u, v)
v
~r(u + du, v)
(x)
Damit kann der Flächeninhalt dF des “Parallelogrammes” dB mit Hilfe des Vektorproduktes
bestimmt werden:
dF = |~ru (u, v) × ~rv (u, v)| du dv .
In Komponenten drückt sich der Betrag des Vektorproduktes durch den Absolutbetrag der
Determinante der zweireihigen Matrix
"
aus. Damit erhält man
xu xv
yu yv
"
dF = det
#
xu xv
yu yv
.
#
du dv .
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
35
Dies ist das Flächenelement (besser wäre Element des Flächeninhaltes) im (u, v)-Koordinatensystem.
Beispiel Im Falle von Polarkoordinaten (ρ, ϕ) ergibt sich
xρ = cos ϕ ,
xϕ = −ρ sin ϕ
yρ = sin ϕ ,
yϕ = ρ cos ϕ .
Daraus folgt
"
det
xρ xϕ
yρ yϕ
#
= ρ cos2 ϕ + ρ sin2 ϕ = ρ
und damit
dF = ρ dρ dϕ
in Übereinstimmung mit der in Abschnitt 2 auf heuristische Weise hergeleiteten Formel.
Beispiel Es ist das polare Flächenträgheitsmoment einer Ellipse mit Halbachsen a und b um
ihren Mittelpunkt zu bestimmen.
Wir geben uns die Ellipse im kartesischen Koordinatensystem durch die Gleichung
x2 y 2
+ 2 =1.
a2
b
Das polare Flächenträgheitsmoment ist definiert durch
J0 =
ZZ
B
(x2 + y 2 ) dF ,
wo B den Bereich der Ellipse angibt. Wir führen nun ein dem gestellten Problem besonders
angepasstes Koordinatensystem (s, t) ein, indem wir direkt die Transformationsformeln angeben.
Sie lauten:
x = as cos t
y = bs sin t .
Die Koordinatenlinien sind einerseits vom Nullpunkt ausgehende Strahlen (t konstant), andererseits Ellipsen mit Mittelpunkt im Ursprung (s konstant) (siehe Figur 7). Um das Flächenelement
in den neuen Koordinaten zu bestimmen, berechnen wir die partiellen Ableitungen
36
U. Stammbach: Analysis, Teil B
(y)
b
Fig. 7 :
Der Ellipse angepasstes
Koordinatensystem
(x)
a
xs = a cos t ,
xt = −as sin t
ys = b sin t ,
yt = bs cos t
und bilden daraus die Matrix
"
a cos t −as sin t
b sin t bs cos t
#
.
Deren Determinante hat den Wert
abs cos2 t + abs sin2 t = abs ,
so dass wir erhalten
dF = abs ds dt .
Das Gebietsintegral lässt sich damit vollständig in den neuen Koordinaten (s, t) ausdrücken.
Offenbar wird die Ellipse B ausgeschöpft, wenn s und t über das Rechteck 0 ≤ s ≤ 1, 0 ≤ t < 2π
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
37
variiert. (Eine Gebietsintegration über ein Rechteck ist besonders einfach; aus diesem Grund
haben wir natürlich gerade das (s, t)-Koordinatensystem gewählt.) Wir erhalten der Reihe nach
J0 =
ZZ
B
1
Z
=
0
Z
=
0
= π
(x2 + y 2 ) dF
ds
1
Z
2π
0
dt (a2 s2 cos2 t + b2 s2 sin2 t) abs
ds (πs2 (a2 + b2 )abs)
ab 2
(a + b2 ) .
4
Als Spezialfall erhalten wir das uns bereits bekannte polare Flächenträgheitsmoment des Kreises
J0 = π
r4
.
2
Es lohnt sich, noch eine Weile bei diesen Koordinatentransformationen zu verweilen. Betrachten
wir noch einmal die Abbildung des aus du und dv gebildeten (“kleinen”) Rechtecks in der (u, v)Ebene in das Flächenstück dB. Approximativ geht dabei der Vektor (du, dv) in den Vektor
(dx, dy) = ~ru du + ~rv dv = (xu du + xv dv, yu du + yv dv)
über. Mit der Notation der linearen Algebra schreiben wir dies in der Form
"
dx
dy
#
"
=
xu xv
yu yv
#"
du
dv
#
.
Wir lesen daraus ab, dass die zur (komplizierten) Koordinatentransformation im Punkt (u, v)
gehörige Abbildung durch die (einfache) lineare Abbildung approximiert wird, welche durch die
Matrix
"
xu xv
yu yv
#
beschrieben wird. Diese Matrix heisst Funktionalmatrix oder Jacobimatrix (C. G. J. Jacobi
1804 -1851); wir bezeichnen sie durch das Symbol
∂(x, y)
.
∂(u, v)
Die Approximation geschieht hier offensichtlich in einem ähnlichen Sinn wie früher bei der linearen Ersatzfunktion: eine komplizierte Funktion wird durch eine lineare Funktion approximiert. Die durch die Funktionalmatrix im Punkte (u, v) gegebene lineare Abbildung ist die
38
U. Stammbach: Analysis, Teil B
“lineare Ersatzfunktion an der Stelle (u, v)” der durch die Koordinatentransformation definierten
Abbildung von der (u, v)-Ebene in die (x, y)-Ebene.
Beispiel Wir kehren kurz - sicher zur Überraschung des Lesers - zum Roboterarm zurück, den
wir in Kapitel I, Abschnitt 2 eingeführt haben (siehe Figur 8). Die Lage des Arbeitskopfes im
(x, y)-Koordinatensystem wurde damals in Abhängigkeit der Winkel (ϕ, ψ) durch die Funktionen
x = R cos ϕ + r cos(ϕ − ψ)
y = R sin ϕ + r sin(ϕ − ψ)
beschrieben. Wir können deshalb im Arbeitsbereich B des Roboters die Winkel ϕ und ψ als neue
Koordinaten betrachten. Die obigen Formeln beschreiben dann eine Koordinatentransformation
im Arbeitsbereich des Roboters und damit eine Abbildung eines Teils der (ϕ, ψ)-Ebene (siehe
Figur 9) in die (x, y)-Ebene. Offenbar wird das Rechteck 0 ≤ ϕ, ψ ≤ π in den Bereich B abgebildet. Die Funktionalmatrix beschreibt in jedem Punkt des Rechtecks eine lineare Abbildung,
welche die zur Koordinatentransformation gehörige Abbildung in diesem Punkt approximiert.
Die Funktionalmatrix lautet
∂(x, y)
=
∂(ϕ, ψ)
"
xϕ xψ
yϕ yψ
#
"
=
−R sin ϕ − r sin(ϕ − ψ) r sin(ϕ − ψ)
R cos ϕ + r cos(ϕ − ψ) −r cos(ϕ − ψ)
#
.
Werden nun die Winkel ϕ und ψ gemäss den Funktionen t → ϕ(t) und t → ψ(t) zeitlich
verändert, so beschreibt der Arbeitskopf des Roboters im Arbeitsbereich einen Weg, der durch
t → (x(ϕ(t), ψ(t)), y(ϕ(t), ψ(t)))
gegeben ist. Die Geschwindigkeit ~v (t) des Arbeitskopfes ergibt sich durch Ableitung nach t mit
Hilfe der verallgemeinerten Kettenregel. Man erhält
~v (t) = (xϕ ϕ̇ + xψ ψ̇, yϕ ϕ̇ + yψ ψ̇) .
Ohne Schwierigkeiten stellt man fest, dass sich der Geschwindigkeitsvektor ~v (t) = (ẋ(t), ẏ(t))
durch eine Matrixmultiplikation ergibt:
"
ẋ
ẏ
#
"
=
xϕ xψ
yϕ yψ
#"
ϕ̇
ψ̇
#
.
Wir ersehen daraus, dass die Funktionalmatrix beschreibt, wie sich der “Geschwindigkeitsvektor”
(ϕ̇, ψ̇) in der (ϕ, ψ)-Ebene in den Geschwindigkeitsvektor (ẋ, ẏ) des Arbeitskopfes in der (x, y)Ebene abbildet.
39
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
(y)
R
ψ
Fig. 8 :
Roboterarm
r
(x)
ϕ
(ψ)
π
Fig. 9 :
(ϕ, ψ)-Ebene
(ϕ)
π
40
U. Stammbach: Analysis, Teil B
Wie man aus der linearen Algebra weiss, beschreibt die Determinante einer Matrix die Volumenbzw. Flächenverzerrung bei der zugehörigen Abbildung. Wir entnehmen daraus, dass die Determinante (Funktionaldeterminante)
"
det
xu xv
yu yv
#
im Punkte (u, v) die Flächenverzerrung bei der Abbildung der (u, v)-Ebene in die (x, y)-Ebene
beschreibt. Aus diesem Grund muss - wie wir bereits gesehen haben - bei Gebietsintegralen das
Flächenelement
det
∂(x, y)
du dv
∂(u, v)
benützt werden.
Spezielle Aufmerksamkeit verdienen bei Koordinatentransformationen diejenigen Punkte in denen die Funktionaldeterminante Null ist. In solchen Punkten ist die durch die Funktionalmatrix
beschriebene lineare Abbildung singulär, und die Koordinatentransformation ist ausgeartet. Ein
Beispiel wird durch das Polarkoordinatensystem im Nullpunkt geliefert. Hier ist die Koordinatentransformation bekanntlich nicht in beiden Richtungen eindeutig. In gewissen Rechnungen
muss auf diese Ausnahmepunkte besonders Rücksicht genommen werden.
Beispiel Auch im Zusammenhang mit Robotern spielen diese Punkte eine grosse Rolle. Berechnen wir für den oben betrachteten Roboter die Funktionaldeterminante, so ergibt sich
"
det
−R sin ϕ − r sin(ϕ − ψ) r sin(ϕ − ψ)
R cos ϕ + r cos(ϕ − ψ) −r cos(ϕ − ψ)
#
= Rr sin ψ .
Diese Determinante ist Null für ψ = 0 oder ψ = π. Dies entspricht dem vollständig gestreckten bzw. ganz zusammengefalteten Roboterarm. In diesen Punkten ist die Funktionalmatrix
also singulär. Die lineare Algebra sagt nun, dass die zu einer solchen Matrix gehörige lineare
Abbildung nicht alle Vektoren als Bilder liefert. Wir haben aber gesehen, dass die Bilder
gerade die möglichen Geschwindigkeitsvektoren des Arbeitskopfes sind. Wir folgern daraus,
dass in den Punkten mit ψ = 0 bzw. ψ = π der Arbeitskopf unseres Roboters nicht beliebige
Geschwindigkeitsvektoren zulässt. Punkte dieser Art sind Ausnahmepunkte und verdienen bei
Roboteranwendungen immer besondere Aufmerksamkeit.
Wir gehen zum Schluss noch auf den dreidimensionalen Fall ein und betrachten neben dem
kartesischen (x, y, z)-Koordinatensystem ein neues (u, v, w)-Koordinatensystem. Die Koordinatentransformation wird durch die Gleichungen
x = x(u, v, w), y = y(u, v, w), z = z(u, v, w)
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
41
beschrieben. Hält man eine der neuen Koordinaten fest, so beschreiben diese Funktionen die
sogenannten Koordinatenflächen.
Beispiel Im Falle von Kugelkoordinaten r, ϕ, θ lauten die Gleichungen bekanntlich
x = r sin θ cos ϕ
y = r sin θ sin ϕ
z = r cos θ .
Die Koordinatenflächen sind für r = r0 Kugeloberflächen, für ϕ = ϕ0 Halbebenen, welche die
z-Achse enthalten, und für θ = θ0 Halbkegel mit der z-Achse als Achse.
Lässt man im (u, v, w)-Koordinatensystem u um du, v um dv und w um dw wachsen, so wird
der Quader mit Kanten du, dv, dw im (u, v, w)-Raum auf einen (“krummkantigen”) Quader im
(x, y, z)-Raum abgebildet (siehe Figur 10). Dessen Volumen können wir approximativ berechnen,
indem wir analog wie im zweidimensionalen Fall vorgehen. Setzen wir wie üblich
~r(u, v, w) = (x(u, v, w), y(u, v, w), z(u, v, w)) ,
(z)
Fig. 10 :
Volumenelement bei
Koordinatentransformationen
dV
(y)
(x)
42
U. Stammbach: Analysis, Teil B
so gilt
~r(u + du, v, w) − ~r(u, v, w) ∼ ~ru (u, v, w) du ,
~r(u, v + dv, w) − ~r(u, v, w) ∼ ~rv (u, v, w) dv ,
~r(u, v, w + dw) − ~r(u, v, w) ∼ ~rw (u, v, w) dw .
Das Volumen des von ~ru du, ~rv dv, ~rw dw aufgespannten Quaders ist dann als Absolutbetrag
des gemischten Produktes
(~ru du × ~rv dv) · ~rw dw = (~ru × ~rv ) · ~rw du dv dw
gegeben. Wie wir gesehen haben, entspricht dieses gemischte Produkt der Determinante der aus
den Komponenten der drei Vektoren gebildeten Matrix


xu xv xw


(~ru × ~rv ) · ~rw = det  yu yv yw  .
zu zv zw
Damit ist das Volumenelement genau wie das Flächenelement durch die Funktionaldeterminante
ausgedrückt. Es gilt


xu xv xw


dV = det  yu yv yw  du dv dw .
zu zv zw
Beispiel Im Falle von Kugelkoordinaten rechnet man ohne Schwierigkeit nach


sin θ cos ϕ −r sin θ sin ϕ r cos θ cos ϕ


det  sin θ sin ϕ r sin θ cos ϕ r cos θ sin ϕ  = −r 2 sin θ ,
cos θ
0
−r sin θ
so dass das Volumenelement der Kugelkoordinaten durch
dV = r 2 sin θ dr dϕ dθ
gegeben ist, in Übereinstimmung mit unserem früheren Resultat.
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
5
43
Integrale mit Parameter
In diesem Abschnitt geht es um die Ableitung von Integralen die von einem Parameter abhängig
sind. Wir beginnen gleich mit einem einfachen Beispiel.
√
Beispiel Gegeben ist die Funktion t → t. Wir vergleichen im Intervall [0, 1] diese Funktion
mit linearen Funktionen der Form t → xt , 0 ≤ x < ∞. Für welchen Wert von x ist die Grösse
Z
Φ(x) =
0
1
√
( t − xt)2 dt
minimal (siehe Figur 1)?
(y)
1
y=
√
t
Fig. 1 :
Approximation der
Wurzelfunktion durch eine
lineare Funktion
y = xt
(t)
1
Zur Lösung suchen wir die Minimalstelle der Funktion
x → Φ(x) =
Z
0
1
√
( t − xt)2 dt
44
U. Stammbach: Analysis, Teil B
im Intervall [0, ∞). Wir erhalten
Z
Φ(x) =
=
=
0
1
√
( t − xt)2 dt
1 2 4
t −
2
5
1 4
− x+
2 5
xt
5/2
1
+ x2 t 3
3
1
0
1 2
x .
3
Die Ableitung beträgt
d
d
Φ(x) =
dx
dx
Z
0
1
√
d 1 4
4 2
1
( t − xt)2 dt =
− x + x2 = − + x .
dx 2 5
3
5 3
Nullsetzen liefert
x=
6
.
5
Man zeigt leicht, dass es sich dabei um die globale Minimalstelle handelt.
In diesem Beispiel tritt auf natürliche Weise die Ableitung eines bestimmten Integrals nach
einem Parameter auf. In dieser Situation erlaubt der folgende Satz oft eine Vereinfachung.
Satz Gegeben sei eine stetige Funktion von zwei Variablen
f : (t, x) → f (t, x) .
Ferner sei die partielle Ableitung fx ebenfalls stetig. Dann gilt
d
dx
Z
b
a
f (t, x) dt =
Z
b
a
fx (t, x) dt .
Wenden wir die Aussage des Satzes auf unser Beispiel an, so lässt sich die Rechnung, die zur
Ableitung der Funktion Φ führt, etwas vereinfachen
d
dx
Z
0
1
Z
√
( t − xt)2 dt =
0
1
1
Z 1
√
2
4
2
4
2( t − xt)(−t) dt =
(2xt2 − 2t3/2 ) dt = xt3 − t5/2 = x − .
3
5
3
5
0
0
Beweis des Satzes: Für den Differenzenquotienten der Funktion Φ erhalten wir
45
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
Φ(x + h) − Φ(x)
h
=
1
h
=
1
h
Z
b
f (t, x + h) dt −
a
Z
b
a
Z
b
a
!
f (t, x) dt
(f (t, x + h) − f (t, x)) dt .
Daraus folgt
Φ(x + h) − Φ(x)
−
h
Z
b
a
fx (t, x) dt =
Z
b f (t, x
a
+ h) − f (t, x)
− fx (t, x)
h
dt .
Für h → 0 strebt der Integrand des letzten Integrals und damit auch das Integral selbst gegen
Null. Damit folgt
Φ(x + h) − Φ(x)
=
h→0
h
Φ0 (x) = lim
Z
b
a
fx (t, x) dt .
Dies ist die Aussage des Satzes.
Beispiel
Wir behaupten, dass die Funktion
Φ:x→
Z
π
0
cos(x sin t) dt
Lösung der Differentialgleichung
Φ00 +
1 0
Φ +Φ=0
x
ist.
Wir bemerken zuerst, dass das Integral nicht elementar auswertbar ist. Deshalb muss in diesem
Fall die Ableitung mit Hilfe unseres Satzes unter dem Integral erfolgen. Wir erhalten
0
Φ (x) = −
Φ00 (x) = −
Z
π
0
Z π
0
sin(x sin t) sin t dt ,
cos(x sin t) sin2 t dt .
Wir wenden nun auf Φ0 (x) partielle Integration an, wobei wir
u(t) = sin(x sin t) ,
v̇(t) = sin t ,
setzen, und erhalten
u̇(t) = x cos(x sin t) cos t ,
v(t) = − cos t
46
U. Stammbach: Analysis, Teil B
0
Φ (x) =
[cos t sin(x sin t)]π0
= −x
Z
π
0
−
Z
π
0
x cos(x sin t) cos2 t dt
cos(x sin t) cos2 t dt .
Damit folgt
Φ00 +
1 0
Φ +Φ=
x
Z
0
π
− cos(x sin t) sin2 t −
x
cos(x sin t) cos2 t + cos(x sin t)
x
dt = 0 ,
und Φ ist in der Tat Lösung der Differentialgleichung.
Beispiel
Das Integral
Z
1 tx
−1
dt =: Φ(x) , x ≥ 0
log t
0
hat die Eigenschaft, dass die Stammfunktion des Integranden nicht elementar ausdrückbar ist.
Trotzdem lässt sich sein Wert für alle x berechnen. Dabei machen wir von unserem Satz Gebrauch. Statt den Wert Φ(x) direkt zu bestimmen, wenden wir uns zuerst der Ableitungsfunktion
Φ0 (x) zu. Mit Hilfe unseres Satzes erhalten wir
Z
0
Φ (x) =
0
Z
=
=
=
0
1
1
∂ tx − 1
dt
∂x log t
log t · tx
dt
log t
1 h x+1 i1
t
0
x+1
1
.
x+1
Daraus folgt Φ(x) = log(x + 1) + C , und wegen Φ(0) = 0 gilt schliesslich
Φ(x) = log(x + 1) .
Im zweiten Teil dieses Abschnittes beschäftigen wir uns noch mit dem etwas komplizierteren
Fall, wo der Parameter nicht nur im Integranden sondern auch in den Grenzen des Integrals
vorkommt. Wir betrachten also für die Funktionen
x → u(x) , x → v(x)
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
47
die durch die Integralformel
Ψ : x → Ψ(x) =
Z
v(x)
u(x)
f (t, x) dt
definierte Funktion. Dann gilt der
Satz
0
0
0
Ψ (x) = f (v(x), x) v (x) − f (u(x), x) u (x) +
Z
v(x)
u(x)
fx (t, x) dt
Bevor wir ihn beweisen, betrachten wir die folgenden Spezialfälle.
Sind die Funktionen u und v konstant, so erhält man die Aussage des früheren Satzes.
Ist u = a konstant, v(x) = x und ist der Integrand nicht von x abhängig, so folgt
d
dx
Z
x
a
f (t) dt = f (x) .
Dies ist nichts anderes als der wohlbekannte Hauptsatz der Infinitesimalrechnung: “Die Ableitung eines bestimmten Integrals nach der oberen Grenze ist der Wert des Integranden an der
oberen Grenze” (siehe Kapitel III, Abschnitt 2).
Beweis Wir betrachten zuerst die Funktion von drei Variablen
(u, v, w) → ψ(u, v, w) =
Z
v
u
f (t, w) dt
und definieren die zusammengesetzte Funktion Ψ durch
Ψ(x) = ψ(u(x), v(x), w(x)) .
Die verallgemeinerte Kettenregel liefert dann
d
Ψ(x) = ψu u0 + ψv v 0 + ψw w0 .
dx
Schliesslich betrachten wir den Spezialfall w(x) = x und wenden auf die ersten beiden Ausdrücke
den Hauptsatz der Infinitesimalrechnung an (siehe oben). Dann erhalten wir
48
U. Stammbach: Analysis, Teil B
d
Ψ(x) = −f (u(x), x) u0 (x) + f (v(x), x) v 0 (x) +
dx
Z
v(x)
u(x)
fx (t, x) dt .
Dies war zu beweisen.
Beispiel Wir betrachten hier ein Anwendungsbeispiel aus der Mechanik, welches eine Beziehung zwischen der Querkraft und dem Biegemoment eines belasteten Balkens betrifft. Ein
an beiden Enden frei aufgestützter waagrechter Balken trage die durch die Funktion
x → p(x)
Fig. 2 :
Querkraft und Biegemoment
eines belasteten Balkens
~
B
p(x)
~
A
(x)
x
~ diejenige im rechten
beschriebene Last (siehe Figur 2). Die Reaktionskraft im linken Lager sei A,
~
Lager B. Im Schnitt an der Stelle x ergibt sich die Querkraft
Q(x) = A −
und das Biegemoment
Z
0
x
p(t) dt
Kapitel V. Funktionen von mehreren Variablen. Integralrechnung
M (x) = −Ax +
Z
0
x
49
(x − t)p(t) dt .
Es wird nun in der Mechanik behauptet, dass die Beziehung
d
M (x) = −Q(x)
dx
gilt. Der von uns oben ausgesprochene Satz liefert diese Aussage nach kurzer Rechnung. Es gilt
nämlich
d
M (x) = −A + 1 · (x − x)p(x) +
dx
Z
0
x
1 p(t) dt = −Q(x) .
Man vergleiche zu diesem Thema M.B. Sayir: Mechanik 1, p. 201 ff.
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel VI.
Vektoranalysis
Ordnung ist nur für Dumme,
Genies beherrschen das Chaos.
Anonymus
Inhaltsverzeichnis
1
Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Differentialoperatoren der Vektoranalysis
. . . . . . . . . . . . . . . . . . . . . .
11
3
Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
4
Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
5
Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
6
Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . .
40
7
Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
8
Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
9
Eine Anwendung des Satzes von Stokes
. . . . . . . . . . . . . . . . . . . . . . .
65
10
Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
3
Kapitel VI. Vektoranalysis
1
Skalarfelder und Vektorfelder
Unter einem Skalarfeld verstehen wir eine reellwertige, auf einem räumlichen Bereich B definierte Funktion
f : (x, y, z) → f (x, y, z) .
Jedem Punkt des Definitionsbereiches D(f ) wird eine reelle Zahl zugeordnet (siehe Figur 1).
Eine im Bereich B variable skalare physikalische Grösse wird durch ein in B definiertes Skalarfeld
beschrieben; Beispiele solcher Grössen sind etwa die Temperatur, der Luftdruck, das elektrische
Potential, etc.
f (x, y, z)
0
R
Fig. 1 :
Skalarfeld
(z)
f
(y)
B
(x, y, z)
R ×R ×R
(x)
Durch ein im Bereich B definiertes Vektorfeld
~v : (x, y, z) → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z))
4
U. Stammbach: Analysis, Teil B
wird jedem Punkt in B ein Vektor ~v (x, y, z) zugeordnet.
Es ist oft instruktiv, sich den Vektor ~v (x, y, z) im Punkte (x, y, z) angebracht zu denken (siehe
Figur 2). Eine im Bereich B variable vektorielle Grösse wird durch ein in B definiertes Vektorfeld
beschrieben. Als Beispiele von Vektorfeldern erwähnen wir die folgenden.
~v
B
Fig. 2 :
Vektorfeld
(z)
(y)
(x)
Beispiel In einem mit Gas oder Flüssigkeit gefüllten Bereich B ordne man jedem Punkt (x, y, z)
die Geschwindigkeit ~v (x, y, z) des Gas- bzw. Flüssigkeitsteilchens zu, das sich im Punkte (x, y, z)
befindet. Man nennt dann das Vektorfeld
~v : (x, y, z) → ~v (x, y, z)
das Strömungsfeld des Gases bzw. der Flüssigkeit. Es beschreibt den Bewegungszustand des
Mediums.
~
Beispiel Man ordne jedem Punkt (x, y, z) des Bereiches B die Gravitationskraft K(x,
y, z)
zu, die auf eine Probemasse m in diesem Punkt wirkt. Dieses Vektorfeld
~ : (x, y, z) → K(x,
~
K
y, z)
5
Kapitel VI. Vektoranalysis
beschreibt den Zustand des räumlichen Bereiches B bezüglich der Gravitation. Es ist ein Beispiel
eines Kraftfeldes.
Beispiel
Ordnet man jedem Punkt (x, y, z) des Bereiches B die elektrische (Anziehungs~
oder Abstossungs-)Kraft E(x,
y, z) zu, die auf eine Probeladung e in diesem Punkte wirkt, so
beschreibt das Vektorfeld
~ : (x, y, z) → E(x,
~
E
y, z)
den Zustand des räumlichen Bereiches B bezüglich des elektrischen Feldes.
Wir nennen ein Skalar- oder Vektorfeld stationär, wenn es zeitunabhängig ist, wir nennen es
instationär, wenn es zeitabhängig ist. Mit einigen wenigen Ausnahmen werden wir nur stationäre Felder betrachten. Die Ausnahmen betreffen elektrodynamische und hydrodynamische
Felder, wo die Zeitabhängigkeit gerade das Wesentliche ist; z.B. hängt nach Maxwell die elektrische Feldstärke mit der zeitlichen Änderung der magnetischen Feldstärke zusammen (siehe
Abschnitt 9).
(y)
Fig. 3 :
Feldlinien
(x)
Ist im Bereich B ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) gegeben, so heisst eine in B verlaufende
Kurve K eine Feldlinie von ~v , wenn in jedem ihrer Punkte der zu diesem Punkt gehörige
6
U. Stammbach: Analysis, Teil B
Feldvektor tangential zu K ist (siehe Figur 3).
Beispiel Ist ~v : (x, y, z) → ~v (x, y, z) das stationäre Strömungsfeld eines Gases oder einer
Flüssigkeit, so sind die Feldlinien gerade die Bahnen der Teilchen des Mediums.
Beispiel Das einfachste Vektorfeld ist das homogene. Es besteht darin, dass jedem Punkt
des Bereiches B der konstante Vektor ~v (x, y, z) = ~a zugeordnet wird (siehe Figur 4). Das
Geschwindigkeitsfeld eines translatorisch bewegten Körpers ist homogen. Das Strömungsfeld
einer Parallelströmung ist homogen. Das elektrische Feld zwischen zwei parallelen Kondensatorplatten ist homogen. Die Feldlinien eines homogenen Vektorfeldes sind parallele Geraden.
(y)
Fig. 4 :
Homogenes Vektorfeld
~a
(x)
Beispiel Es sei ~v : (x, y, z) → ~v (x, y, z) das Geschwindigkeitsfeld eines mit der Winkelgeschwindigkeit ~ω = (ω1 , ω2 , ω3 ) rotierenden starren Körpers. Die Rotationsachse gehe durch den
Ursprung. Wie üblich bezeichnen wir mit ~r(x, y, z) den Ortsvektor des Punktes (x, y, z). Dann
gilt offensichtlich (siehe Figur 5)
~v (x, y, z) = ~ω × ~r(x, y, z) = (ω2 z − ω3 y, ω3 x − ω1 z, ω1 y − ω2 x) .
Die Feldlinien dieses Feldes sind offenbar Kreise in Normalebenen zu ω
~ , deren Mittelpunkte auf
7
Kapitel VI. Vektoranalysis
der Rotationsachse liegen.
.
(x, y, z)
Fig. 5 :
Vektorfeld eines rotierenden
starren Körpers
ω
~
~r
O
Beispiel Das Coulomb’sche Feld (C. A. Coulomb 1736 -1806) ist das elektrische Feld einer
sich im Nullpunkt des Koordinatensystems befindlichen Punktladung e. Der Feldvektor ~v in
(x, y, z) ist die Kraft auf eine in (x, y, z) angebrachte positive Einheitsladung. Setzen wir wie
üblich ~r(x, y, z) = (x, y, z), r = |~r| = (x2 + y 2 + z 2 )1/2 , so gilt (siehe Physik)
|~v | = γ
|e|
|e|
=γ 2 ,
2
|~r(x, y, z)|
r
wobei γ eine positive Konstante ist. Für positives e ist ~v von O weggerichtet (Abstossung, siehe
Figur 6), und für negatives e ist ~v auf O zugerichtet (Anziehung). Man erhält also
~v (x, y, z) = γ
e
e
~r(x, y, z) = γ 2
(x, y, z) .
|~r(x, y, z)|3
(x + y 2 + z 2 )3/2
Das Newton’sche Gravitationsfeld eines in O befindlichen Massenpunktes stimmt formal, d.h.
bis auf eine Konstante mit dem Feld einer negativen elektrischen Ladung in O überein; es ist
~v (x, y, z) in diesem Fall die auf eine in (x, y, z) angebrachte Einheitsmasse wirkende Gravitationskraft. Die Feldlinien des Coulombfeldes sind die von O ausgehenden Strahlen. Man beachte,
dass das Coulombfeld in O nicht definiert ist.
8
U. Stammbach: Analysis, Teil B
Fig. 6 :
Coulomb’sches Feld
e
O
Beispiel Das Magnetfeld eines unendlich langen geradlinigen stromdurchflossenen Leiters. In
der z-Achse fliesse ein Strom konstanter Stärke J. Ein Strom erzeugt nach dem Gesetz von
Biot-Savart (J. B. Biot 1774 - 1862, F. Savart 1791 - 1841) ein Magnetfeld; in der Physik lernt
man, dass dieses im Punkt (x, y, z) durch
~v (x, y, z) = 2J
−y
x
, 2
, 0
2
2
x + y x + y2
beschrieben wird (siehe Figur 7). Wir entnehmen dieser Formel, dass ~v nur für x2 + y 2 > 0
definiert ist. Der Definitionsbereich von ~v ist der dreidimensionale Raum ohne die z-Achse. Die
Länge des Feldvektors |~v | ist unabhängig von der z-Koordinate. Der Feldvektor ist parallel zur
(x, y)-Ebene und steht senkrecht auf dem Lot zum Leiter. Es gilt
|~v (x, y, z)| = 2J
(x2
1
,
+ y 2 )1/2
d.h. |~v (x, y, z)| ist umso grösser, je näher (x, y, z) an der z-Achse liegt. Die Feldlinien von ~v sind
Kreise parallel zur (x, y)-Ebene mit Mittelpunkt auf der z-Achse.
Beispiel Strömungsfeld einer zähen Flüssigkeit durch ein zylindrisches Rohr. Es sei die z-Achse
gerade die Achse des zylinderförmigen Rohres, welches den Radius a besitze. Der Ansatz von
9
Kapitel VI. Vektoranalysis
Fig. 7 :
Magnetfeld eines
stromdurchflossenen Leiters
z
(z)
Fig. 8 :
Hagen-Poiseuille-Strömung
a
10
U. Stammbach: Analysis, Teil B
Hagen-Poiseuille sagt dann, dass für Punkte (x, y, z) im Innern des Rohres die Geschwindigkeit
der Strömung durch
~v : (x, y, z) → ~v (x, y, z) = 0, 0, C (a2 − x2 − y 2 )
gegeben ist (siehe Figur 8). Das Geschwindigkeitsprofil der Hagen-Poiseuille-Strömung ist eine
Parabel.
Beispiel Das Gravitationsfeld einer homogenen Kugel mit Radius a ist für r = (x2 +y 2 +z 2 )1/2 ≥
a gegeben durch
~v : (x, y, z) → ~v (x, y, z) = −C 0
1
C0
~
r
=
−
(x, y, z)
r3
(x2 + y 2 + z 2 )3/2
(siehe Kapitel V, Abschnitt 3). Für r < a (im Innern der Kugel) liefert eine ähnliche Rechnung
wie in Kapitel V, Abschnitt 3
~v : (x, y, z) → ~v (x, y, z) = −C 00~r = −C 00 (x, y, z) .
Natürlich sind die Konstanten C 0 und C 00 positiv.
11
Kapitel VI. Vektoranalysis
2
Differentialoperatoren der Vektoranalysis
Wir stellen hier eine Anzahl von Rechenvorschriften zusammen. Es wird sich im Laufe dieses
Kapitels zeigen, dass alle diese auf den ersten Blick willkürlichen Bildungen eine anschauliche
und wichtige Bedeutung haben.
Der erste hier zu besprechende Differentialoperator ist uns bereits bekannt. Es ist der Gradient
(siehe Kapitel IV, Abschnitt 7). Ist f : (x, y, z) → f (x, y, z) eine Funktion von drei Variablen,
also ein Skalarfeld, so ist der Gradient von f definiert durch
grad f (x, y, z) =
∂f
∂f
∂f
(x, y, z),
(x, y, z),
(x, y, z)
∂x
∂y
∂z
.
Der Gradient ordnet einem Skalarfeld ein Vektorfeld zu. In Kapitel IV, Abschnitt 7 haben wir
eine geometrische Beschreibung von grad f (x, y, z) kennengelernt:
(a) Die Länge von grad f (x, y, z) ist der Betrag der grössten Richtungsableitung von f in
(x, y, z). Die Richtung von grad f (x, y, z) ist die Richtung, in der die grösste Richtungsableitung von f in (x, y, z) erhalten wird.
(b) Der Vektor grad f (x, y, z) steht senkrecht zur Niveaufläche von f , die durch den Punkt
(x, y, z) geht.
Das Vektorfeld grad f (x, y, z) wird auch Gradientenfeld von f genannt. Die Eigenschaft (b)
des Gradienten liefert sofort das Resultat, dass die Feldlinien von grad f senkrecht zu den
Niveauflächen von f verlaufen. Kennt man also die Niveauflächen von f , so kennt man auch
den Verlauf der Feldlinien von grad f und umgekehrt.
Der zweite der Differentialoperatoren ist die sogenannte Divergenz. Die Divergenz ordnet
einem Vektorfeld ein Skalarfeld zu. Sie ist wie folgt definiert
div ~v (x, y, z) =
∂v1
∂v2
∂v3
(x, y, z) +
(x, y, z) +
(x, y, z) .
∂x
∂y
∂z
Beispiel Ist das Vektorfeld ~v homogen, ~v = ~a, so ist div ~v ≡ 0 .
12
U. Stammbach: Analysis, Teil B
Beispiel Für das Coulombfeld
~v (x, y, z) = C
x y z
,
,
r3 r3 r3
, r = (x2 + y 2 + z 2 )1/2
erhält man
∂v1
∂
(x, y, z) = C
∂x
∂x
x
r3
=C
r 2 − 3x2
.
r5
Aus Symmetriegründen folgt dann
∂v2
r 2 − 3y 2
,
(x, y, z) = C
∂y
r5
∂v3
r 2 − 3z 2
.
(x, y, z) = C
∂z
r5
Daraus ergibt sich für die Divergenz
div ~v (x, y, z) ≡ 0 .
Beispiel Für das Magnetfeld des stromdurchflossenen Leiters
~v (x, y, z) = 2J
−y
x
,
, 0
x2 + y 2 x2 + y 2
erhält man
∂
∂x
−y
x
∂
+
2
2
2
x +y
∂y x + y 2
y2x
−y2x
= 2J
+
(x2 + y 2 )2 (x2 + y 2 )2
= 0
div ~v (x, y, z) = 2J
Beispiel Für das Strömungsfeld nach Hagen-Poiseuille ergibt sich
div ~v (x, y, z) = 0 .
13
Kapitel VI. Vektoranalysis
Beispiel Für das Gravitationsfeld innerhalb einer homogenen Kugel
~v (x, y, z) = −C 00~r , ~r = (x, y, z) ,
erhalten wir
div ~v (x, y, z) = −3C 00 .
Ausserhalb der homogenen Kugel ist das Gravitationsfeld ein Coulombfeld, und seine Divergenz
ist deshalb Null (siehe oben).
Der dritte der Differentialoperatoren ist die sogenannte Rotation. Die Rotation ordnet einem
Vektorfeld wiederum ein Vektorfeld zu. Sie ist definiert durch
rot ~v (x, y, z) =
Beispiel
∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1
−
,
−
,
−
∂y
∂z ∂z
∂x ∂x
∂y
.
Ist das Vektorfeld homogen, ~v = ~a, so ist
rot ~v = (0, 0, 0) .
Beispiel Für das Geschwindigkeitsfeld eines rotierenden starren Körpers ~v = ~ω × ~r erhalten
wir
rot ~v = 2 (ω1 , ω2 , ω3 ) .
Die Rotation dieses Vektorfeldes ~v ist also ein Mass für die Winkelgeschwindigkeit der Rotation.
Beispiel Für das Coulombfeld
~v (x, y, z) = C
x y z
,
,
r3 r3 r3
, r = (x2 + y 2 + z 2 )1/2
erhält man
∂v3 ∂v2
−
=C
∂y
∂z
∂ z
∂ y
−
∂y r 3 ∂z r 3
=C
−z3r 2 y/r + y3r 2 z/r
r6
!
=0.
14
U. Stammbach: Analysis, Teil B
Aus Symmetriegründen sind auch die übrigen zwei Komponenten des Vektors rot ~v Null.
Beispiel Für das Magnetfeld des stromdurchflossenen Leiters
~v (x, y, z) = 2J
−y
x
, 2
, 0
2
2
x + y x + y2
erhalten wir
rot ~v (x, y, z) =
∂v2 ∂v1
−
∂x
∂y
!
2
x + y 2 − 2x2 x2 + y 2 − 2y 2
0, 0,
+
(x2 + y 2 )2
(x2 + y 2 )2
0, 0,
= 2J
= (0, 0, 0)
Beispiel
Für das Strömungsfeld nach Hagen-Poiseuille erhält man
rot ~v (x, y, z) = (−2Cy, 2Cx, 0) .
Beispiel Für das Gravitationsfeld innerhalb einer homogenen Kugel
~v (x, y, z) = −C 00~r , ~r = (x, y, z) ,
erhält man
rot ~v (x, y, z) ≡ (0, 0, 0) .
Neben diesen drei Differentialoperatoren grad , div , rot der Vektoranalysis treten natürlich
auch deren Zusammensetzungen auf. (Achtung, nicht jede Zusammensetzung ist sinnvoll!) Für
diese gelten die folgenden Identitäten.
Der zusammengesetzte Operator div grad ordnet einem Skalarfeld wiederum ein Skalarfeld zu.
Es gilt
div grad f = fxx + fyy + fzz .
In Anwendungen tritt dieser Operator häufig auf (siehe z.B. Kapitel IV, Abschnitt 8). Er heisst
auch Laplace-Operator und wird mit ∆ bezeichnet.
15
Kapitel VI. Vektoranalysis
Für die Zusammensetzung von grad und rot folgt
rot grad f ≡ (0, 0, 0) .
Satz
Die Rotation eines Gradientenfeldes ist Null.
Für die Zusammensetzung von rot und div folgt
div rot ~v ≡ 0 .
Satz
Die Divergenz eines Rotationsfeldes ist Null.
Die beiden anderen sinnvollen Zusammensetzungen rot rot und grad div sind untereinander
durch die Formel
rot rot ~v = grad div ~v − (∆v1 , ∆v2 , ∆v3 ) .
verbunden.
Alle diese Identitäten lassen sich einfach beweisen, indem man auf die Definitionen der Differentialoperatoren zurückgeht. Wir überlassen dies dem Leser.
16
3
U. Stammbach: Analysis, Teil B
Flächen in Parameterdarstellung
Ein Flächenstück S, auch kurz eine Fläche genannt, im dreidimensionalen Raum lässt sich wie
folgt beschreiben
(a) Als Graph einer Funktion von zwei Variablen f : (x, y) → f (x, y), oder
(b) durch eine Gleichung g(x, y, z) = 0 , oder
(c) durch eine Parameterdarstellung
(u, v) → ~r(u, v) = (x(u, v), y(u, v), z(u, v)) .
Eine Parameterdarstellung ist nichts anderes als eine Abbildung eines Bereiches B der (u, v)Ebene (Parameterebene) in den dreidimensionalen Raum (siehe Figur 1).
(z)
(x(u, v), y(u, v), z(u, v))
(y)
(x)
(v)
~r
Fig. 1 :
Parameterdarstellung einer
Fläche als Abbildung eines
Bereichs B der (u, v)-Ebene in
den dreidimensionalen Raum
B
(u, v)
(u)
Beispiel Die Ebene durch den Punkt P0 = (x0 , y0 , z0 ), aufgespannt durch die Vektoren ~a und
~b mit ~c := ~a × ~b 6= (0, 0, 0) wird beschrieben durch die Parameterdarstellung
17
Kapitel VI. Vektoranalysis
~r : (u, v) → ~r(u, v) = (x0 + a1 u + b1 v, y0 + a2 u + b2 v, z0 + a3 u + b3 v)
bzw. durch die Gleichung
c1 (x − x0 ) + c2 (y − y0 ) + c3 (z − z0 ) = 0 .
Hält man in der Parameterdarstellung eines Flächenstücks S den Parameter v fest, v = v0 , so
ist
u → ~r(u, v0 )
die Parameterdarstellung einer Kurve (u-Linie) auf der Fläche. Hält man den Parameter u fest,
u = u0 , so ist
v → ~r(u0 , v)
(v)
B
Fig. 2 :
Zur Definition der
Parameterlinien
v0
u0
(u)
die Parameterdarstellung einer Kurve (v-Linie) auf der Fläche (siehe Figuren 2,3). Diese Kurven
auf dem dargestellten Flächenstück S heissen Parameterlinien. Man vergleiche dazu Kapitel
18
U. Stammbach: Analysis, Teil B
u = u0
v-Linie
Fig. 3 :
Parameterlinien auf einer Fläche
(z)
v = v0
u-Linie
(y)
(x)
V, Abschnitt 4 über Koordinantentransformationen, wo die Koordinatenlinien auf ganz analoge
Weise definiert worden sind.
Beispiel Die Oberfläche der Kugel mit Radius R und Mittelpunkt im Ursprung lässt sich durch
die Gleichung
x2 + y 2 + z 2 − R 2 = 0
beschreiben. Eine Parameterdarstellung ergibt sich unmittelbar mit Hilfe der Kugelkoordinaten.
Setzen wir u = ϕ und v = θ dann stellt
(u, v) → (R sin v cos u, R sin v sin u, R cos v)
mit 0 ≤ u ≤ 2π und 0 ≤ v ≤ π die Kugeloberfläche dar (siehe Figur 4). Die Parameterlinien
sind die von der Geographie auf der Erdkugel her bekannten Breitenkreise (v konstant) und
Meridiane (u konstant).
Beispiel Die Mantelfläche des geraden Kreiskegels mit halbem Öffnungswinkel α, Spitze im
Ursprung und z-Achse als Achse lässt sich durch die folgende Parameterdarstellung beschreiben.
Mit Hilfe der Kugelkoordinaten (θ = α) erhält man eine Parameterdarstellung dieser Fläche,
19
Kapitel VI. Vektoranalysis
Fig. 4 :
Parameterdarstellung
einer Kugel
Fig. 5 :
Parameterdarstellung
eines Kegels
20
U. Stammbach: Analysis, Teil B
indem man u = r und v = ϕ setzt, nämlich
(u, v) → ~r(u, v) = (u sin α cos v, u sin α sin v, u cos α) .
Der zur Mantelfläche gehörige Parameterbereich ist durch 0 ≤ u < ∞ und 0 ≤ v ≤ 2π gegeben
(siehe Figur 5). Die u-Linien sind die Mantellinien des Kegels, die v-Linien sind die zur (x, y)Ebene parallelen Kreise mit Mittelpunkt auf der z-Achse.
Beispiel Es sei eine Kurve K durch die Parameterdarstellung
u → ~s(u) = (x(u), y(u), z(u))
gegeben. Die Fläche, die beim Durchlaufen der Kurve K von der Tangente an die Kurve überstrichen wird, heisst Tangentenfläche S der Kurve. Wir setzen ~t(u) = ~s˙ (u) und erhalten damit
die folgende Parameterdarstellung von S
(u, v) → ~r(u, v) = ~s(u) + v ~t(u) .
Die v-Linien sind gerade die Tangenten an die Kurve K, die u-Linie, die zu v = 0 gehört, ist die
Kurve K.
Die Fläche S sei durch die Parameterdarstellung (u, v) → ~r(u, v) gegeben. Auf S halten wir den
Punkt P fest. Er gehöre zu den Parametern (u0 , v0 ). Wir wollen die Tangentialebene an S
im Punkte P studieren, insbesondere den zugehörigen Normaleneinheitsvektor ~n(u0 , v0 ). Zu
diesem Zweck betrachten wir die durch P gehende u-Linie
u → ~r(u, v0 )
und die durch P gehende v-Linie
v → ~r(u0 , v) .
Die Tangentialvektoren dieser beiden Kurven im Punkte P , d.h. die Vektoren ~ru (u0 , v0 ) und
~rv (u0 , v0 ) spannen offenbar die Tangentialebene auf. Damit ist ihr Vektorprodukt ein zur Fläche
S in P senkrecht stehender Vektor. Der normale Einheitsvektor zur Fläche S in P wird also
durch
~n(u0 , v0 ) = ±
~ru (u0 , v0 ) × ~rv (u0 , v0 )
|~ru (u0 , v0 ) × ~rv (u0 , v0 )|
beschrieben (siehe Figur 6). Natürlich sind für ~n zwei Richtungen möglich.
Beispiel Gesucht ist der Normaleneinheitsvektor der Tangentenfläche
21
Kapitel VI. Vektoranalysis
~n(u0 , v0 )
~rv (u0 , v0 )
Fig. 6 :
Normalenvektor zu einer durch
eine Parameterdarstellung
gegebenen Fläche
(z)
(y)
~ru (u0 , v0 )
(x)
(u, v) → ~s(u) + v~s˙ (u) .
Es gilt
~ru (u, v) = ~s˙ (u) + v~¨s(u) ,
~rv (u, v) = ~s˙ (u) .
Damit erhalten wir
~ru (u, v) × ~rv (u, v) = (~s˙ (u) + v~¨s(u)) × ~s˙ (u) = v (~¨s(u) × ~s˙ (u)) ,
also
~n(u, v) = ±
~¨s(u) × ~s˙ (u)
.
|~¨s(u) × ~s˙ (u)|
Wir stellen fest, dass ~n(u, v) in diesem Beispiel vom Parameter v unabhängig ist. Dies bedeutet,
dass der Normaleneinheitsvektor auf einer v-Linie konstant ist. Da die v-Linien die Tangenten
an die ursprünglich gegebene Kurve K sind, folgt daraus, dass die Tangentialebene an die Fläche
im Punkte P diese längs der durch P gehenden Tangente an die Kurve K berührt.
22
U. Stammbach: Analysis, Teil B
Fig. 7 :
Tangentenfläche an die
Schraubenlinie. Der gezeichnete
Teil gehört zu negativen Werten
des Parameters v.
Beispiel Wir betrachten den Spezialfall des vorhergehenden Beispiels, wo die Kurve K die
Schraubenlinie
u → ~s(u) = (cos u, sin u, hu)
ist. Die Tangentenfläche (siehe Figur 7)
(u, v) → ~r(u, v) = ~s(u) + v~s˙ (u)
besitzt den Normaleneinheitsvektor
~n(u, v) = √
1
h2 + 1
(−h sin u, h cos u, −1) ,
wobei wir eine der beiden möglichen Richtungen des Normaleneinheitsvektors ausgezeichnet
haben. Berechnet man den Winkel ω zwischen ~n(u, v) und dem Einheitsvektor in z-Richtung,
so erhält man
cos ω = (0, 0, 1) · ~n(u, v) = √
−1
.
h2 + 1
23
Kapitel VI. Vektoranalysis
Wir entnehmen diesem Resultat, dass ω unabhängig ist von u und v, d.h. dass ω auf der
ganzen Fläche konstant ist: die Tangentenfläche an die Schraubenlinie hat gegenüber der (x, y)Ebene überall dieselbe Neigung. Flächen mit dieser Eigenschaft treten etwa als Oberflächen von
Aufschüttungen von losem Material in Erscheinung; in der Mathematik heissen sie deshalb auch
Böschungsflächen.
Bemerkung Der Leser überlege sich an dieser Stelle, wie der Normaleneinheitsvektor einer
durch eine Gleichung g(x, y, z) = 0 gegebenen Fläche auf ganz andere Art, nämlich mit Hilfe
des Gradienten dargestellt werden kann.
Als nächstes interessieren wir uns für den Oberflächeninhalt eines durch eine Parameterdarstellung gegebenen Flächenstücks S. Es sei S durch die Parameterdarstellung
(u, v) → ~r(u, v)
~r(u, v + dv)
dS
Fig. 8 :
Zur Berechnung der Oberfläche
eines Flächenstücks
~r(u, v)
(z)
~r(u + du, v)
(y)
(x)
gegeben, wo (u, v) über den Bereich B in der (u, v)-Ebene variiert. Wir denken uns S durch
das Netz der Parameterlinien in kleine Teilstücke eingeteilt. Lassen wir u um du und v um
dv wachsen, so erhalten wir auf der Fläche S ein differentielles Flächenstück dS. Dieses kann
24
U. Stammbach: Analysis, Teil B
näherungsweise als ebenes Parallelogramm angesehen werden, welches durch die Vektoren
~r(u + du, v) − ~r(u, v) ∼ ~ru (u, v) du
~r(u, v + dv) − ~r(u, v) ∼ ~rv (u, v) dv
aufgespannt wird. Sein Flächeninhalt dO lässt sich approximativ durch den Absolutbetrag des
Vektorproduktes ausdrücken (siehe Figur 8). Es ist also
dO = |~ru (u, v) × ~rv (u, v)| du dv.
Der Flächeninhalt O des Flächenstücks S ist die “Summe” all dieser Anteile dO, also
O=
ZZ
B
|~ru (u, v) × ~rv (u, v)| du dv .
Man beachte, dass in der Formel über den Parameterbereich B in der (u, v)-Ebene zu integrieren
ist, der zum Flächenstück S gehört.
Bemerkung Es handelt sich bei den obigen Überlegungen nicht um eine mathematische Herleitung, vielmehr müsste an dieser Stelle der Begriff des Flächeninhaltes einer gekrümmten
Fläche definiert und dann gezeigt werden, dass die obige Formel unter vernünftigen Voraussetzungen an die Funktion (u, v) → ~r(u, v) diesen Flächeninhalt liefert. Hier haben wir uns mit
einigen mehr heuristischen Überlegungen begnügt. Der Mathematiker kann allerdings zeigen,
dass sie für “vernünftige” Parameterdarstellungen zum richtigen Resultat führen. Insbesondere
bedeutet dies, dass der Wert des Integrals nicht von der Parameterdarstellung abhängig ist,
die man für ein geometrisch gegebenes Flächenstück gewählt hat: das Integral liefert für verschiedene “vernünftige” Parameterdarstellungen desselben Flächenstücks das gleiche Resultat.
Beispiel
Wir betrachten die Oberfläche der Kugel vom Radius R und Mittelpunkt O;
(u, v) → (R sin v cos u, R sin v sin u, R cos v)
mit 0 ≤ u ≤ 2π, 0 ≤ v ≤ π. Es gilt
~ru (u, v) = (−R sin v sin u, R sin v cos u, 0)
~rv (u, v) = (R cos v cos u, R cos v sin u, −R sin v)
~ru (u, v) × ~rv (u, v) = (−R2 sin2 v cos u, −R2 sin2 v sin u, −R2 sin v cos v) .
Das Vektorprodukt ~ru × ~rv ist ins Innere der Kugel gerichtet. Es ergibt sich
dO = |~ru (u, v) × ~rv (u, v)| du dv = R2 sin v du dv
(eine Formel, die sich übrigens auch direkt aus der Figur 9 ablesen lässt) und damit
Kapitel VI. Vektoranalysis
25
(z)
du
Fig. 9 :
Zur Berechnung der
Oberfläche einer Kugel
R sin v
R sin v du
R dv
v
dv
R
2π
O=
π
du
0
R2 sin v dv = R2
0
2π
0
du [− cos v]π0 = 4πR2 ,
ein uns wohlbekanntes Resultat.
Beispiel Gesucht ist der Flächeninhalt der Tangentenfläche an die Schraubenlinie
(u, v) → r(u, v) = (cos u − v sin u, sin u + v cos u, h(u + v))
für 0 ≤ u ≤ π/2, −u ≤ v ≤ 0 (siehe Figur 10). Dies beschreibt den Teil der Schraubenfläche,
der zum Stück der Schraubenlinie im ersten Oktanten gehört und der sich zwischen diesem
Kurvenstück und der (x, y)-Ebene befindet.
Es gilt
ru (u, v) = (− sin u − v cos u, cos u − v sin u, h)
rv (u, v) = (− sin u, cos u, h)
ru (u, v) × rv (u, v) = (−hv sin u, hv cos u, −v) .
Daraus ergibt sich das Oberflächenelement
dO = |ru (u, v) × rv (u, v)| du dv = |v| h2 + 1 du dv ,
26
U. Stammbach: Analysis, Teil B
0.5
(v)
(u)
-0.5
0.5
-0.5
1
1.5
2
Fig. 10 :
Der Bereich B der (u, v)-Ebene
B
-1
-1.5
-2
und der Flächeninhalt berechnet sich zu
O =
=
=
=
=
=
ZZ
p
p
p
p
p
B
|~ru (u, v) × ~rv (u, v)| du dv
h2 + 1
h2 + 1
h2 + 1
Z
0
Z
h2 + 1
π/2
du
"
0
Z
π/2
0
"
h2 + 1
π/2
u3
6
π3
48
Z
0
−u
v2
−
2
dv |v|
#0
u2
du
2
du
−u
#π/2
0
.
Beispiel Wir betrachten den Bereich A der (x, y)-Ebene, welcher durch die positive x-Achse
und die Kurve ρ = cos(ϕ/4) begrenzt wird (siehe Figur 11). Wie gross ist der Flächeninhalt des
27
Kapitel VI. Vektoranalysis
(y)
1
0.5
ρ = cos(ϕ/4)
-1
-0.5
A
Fig. 11 :
Der Bereich A der (x, y)-Ebene
0.5
1
(x)
-0.5
-1
über dem Bereich A liegenden Teils S der Oberfläche der Einheitskugel.
Wir wählen zur Beschreibung des Flächenstücks S als Parameter Polarkoordinaten in der (x, y)Ebene. S wird dann durch die Parameterdarstellung
(ρ, ϕ) → ~r(ρ, ϕ) = (ρ cos ϕ, ρ sin ϕ,
q
1 − ρ2 )
beschrieben. Der Definitionsbereich A ist durch 0 ≤ ϕ ≤ 2π , 0 ≤ ρ ≤ cos(ϕ/4) gegeben. Dann
ist
ρ
~rρ (ρ, ϕ) =
cos ϕ, sin ϕ, − p
1 − ρ2
~rϕ (ρ, ϕ) = (−ρ sin ϕ, ρ cos ϕ, 0)
~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ) =
|~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ)| =
!
ρ2
ρ2
p
p
cos
ϕ,
sin ϕ, ρ
1 − ρ2
1 − ρ2
!
ρ4
ρ4
2
cos
ϕ
+
sin2 ϕ + ρ2
1 − ρ2
1 − ρ2
Daraus ergibt sich der gesuchte Flächeninhalt
ZZ
ρ
p
O =
dρ dϕ
1 − ρ2
B
!1/2
ρ
= p
.
1 − ρ2
28
U. Stammbach: Analysis, Teil B
Z
=
2π
0
Z
=
0
Z
=
0
Z
=
2π
2π
2π
0
dϕ
Z
cos(ϕ/4)
0
q
dϕ − 1 −
ρ
dρ
1 − ρ2
p
ρ2
q
cos(ϕ/4)
0
dϕ (− 1 − cos2 (ϕ/4) + 1)
dϕ (1 − sin(ϕ/4))
= [ϕ + 4 cos(ϕ/4)] 2π
0
= 2π − 4 .
Man beachte, dass der Oberflächeninhalt der halben Einheitskugel gerade 2π beträgt.
Wir betrachten zum Schluss noch kurz den Fall, wo das Flächenstück S auf einfache Weise als
Graph einer Funktion f von zwei Variablen (x, y) gegeben ist. Setzen wir u = x und v = y, so
erhalten wir aus dieser expliziten Darstellung sofort eine Parameterdarstellung von S
(u, v) → ~r(u, v) = (u, v, f (u, v)) .
Das übliche Vorgehen liefert dann mit
~ru (u, v) = (1, 0, fu (u, v))
und
~rv (u, v) = (0, 1, fv (u, v))
sofort
~ru (u, v) × ~rv (u, v) = (−fu (u, v), −fv (u, v), 1) ,
so dass man
dO =
q
fu2 + fv2 + 1 du dv
erhält. Der Oberflächeninhalt eines über dem Bereich B liegenden Graphen einer Funktion
f : (x, y) → f (x, y) von zwei Variablen berechnet sich also mit Hilfe der Formel
O=
ZZ q
B
(fx (x, y))2 + (fy (x, y))2 + 1 dx dy ,
wobei wir natürlich wieder zur ursprünglichen Variablenbezeichnung zurückgekehrt sind.
29
Kapitel VI. Vektoranalysis
4
Der Fluss
Es sei ein Vektorfeld ~v gegeben, das im Bereich D(~v ) definiert ist. Wir betrachten ein vollständig
in D(~v ) liegendes Flächenstück S, das durch eine Parameterdarstellung gegeben ist und auf dem
die eine der beiden Normalenrichtungen ~n ausgezeichnet ist. Ist ~v das Geschwindigkeitsfeld einer
Flüssigkeitsströmung, so können wir fragen, wieviel Flüssigkeit pro Zeiteinheit in Richtung ~n
durch das Flächenstück S hindurchfliesst. Diese Grösse nennt man den Fluss Φ des Vektorfeldes
~v in Richtung ~n durch S.
Am einfachsten ist diese Frage natürlich zu beantworten, wenn S ein ebenes Flächenstück und
~v ein homogenes Vektorfeld ist. Das pro Zeiteinheit durch S in Richtung ~n fliessende Volumen ist dann das Volumen des (schiefen) Zylinders mit Grundfläche S und durch ~v gegebenen
Mantellinien. Dieses Volumen ist offensichtlich
Φ = (~v · ~n) O ,
wo O der Flächeninhalt von S ist (siehe Figur 1).
S
~v
~n
Fig. 1 :
Fluss eines homogenen
Vektorfeldes durch ein
ebenes Rechteck
30
U. Stammbach: Analysis, Teil B
Im allgemeinen Fall zerlegen wir S in “kleine” Teilbereiche dS; natürlich tun wir dies mit Vorteil
längs der durch die Parameterdarstellung von S gegebenen Parameterlinien. Diese kleinen Teilbereiche dS können approximativ als eben und das Vektorfeld in jedem dieser Teilbereiche
approximativ als homogen angesehen werden (siehe Figur 2). Der von dS herrührende Anteil
dΦ des Flusses ist dann offenbar
dΦ = ~v · ~n dO ,
wo dO der Flächeninhalt von dS bezeichnet. Die “Summe” all dieser Anteile, also das Integral,
ist dann der Fluss des Vektorfeldes ~v durch S in Richtung ~n:
ZZ
Φ=
S
~v · ~n dO .
~v
~n
Fig. 2 :
Fluss eines Vektorfeldes
durch ein Flächenstück
(z)
(y)
(x)
Beispiel Gegeben ist eine elektrische Ladung e im Ursprung des Koordinatensystems. Gesucht
ist der Fluss des zugehörigen Coulombfeldes durch eine Kugeloberfläche mit Mittelpunkt in O
und Radius R von innen nach aussen. Es gilt
31
Kapitel VI. Vektoranalysis
~v = C
e
~r .
|~r|3
Damit ist
ZZ
Φ=
S
C
e
~r · ~n dO ,
R3
wo ~n den äusseren Normaleneinheitsvektor der Kugeloberfläche bezeichnet. Da ~r und ~n parallel
sind, gilt ~r · ~n = R. Damit folgt
e
Φ=C 2
R
ZZ
S
dO = C
e
4πR2 = 4πCe .
R2
Der Fluss des Coulombfeldes zur Ladung e durch die Oberfläche einer Kugel mit Radius R, deren
Mittelpunkt mit e zusammenfällt, ist proportional zur Grösse der Ladung e und unabhängig vom
Radius R.
Nicht immer ist die Berechnung des Flusses so einfach. Es sei das Flächenstück S durch die
Parameterdarstellung
(u, v) → ~r(u, v) = (x(u, v), y(u, v), z(u, v)) , (u, v) ∈ B
gegeben. Daraus folgt für den Normaleneinheitsvektor ~n(u, v)
~n(u, v) = ±
~ru (u, v) × ~rv (u, v)
.
|~ru (u, v) × ~rv (u, v)|
Das Vorzeichen hängt davon ab, welche der beiden Normalenrichtungen auf S wir auszeichnen.
Da nach Abschnitt 3 das Flächenelement dO durch
dO = |~ru (u, v) × ~rv (u, v)| du dv
gegeben ist, folgt für den Fluss
Φ=±
ZZ
B
~v (x(u, v), y(u, v), z(u, v)) · (~ru (u, v) × ~rv (u, v)) du dv .
Dabei ist B der zu S gehörige Parameterbereich in der (u, v)-Ebene. Wie nicht anders zu
erwarten war, führt die Umkehrung der Flussrichtung, d.h. die Wahl des anderen Normaleneinheitsvektors zu einem Vorzeichenwechsel.
32
U. Stammbach: Analysis, Teil B
Beispiel Es sei das Vektorfeld
v : (x, y, z) → v (x, y, z) = (xz, z, y)
gegeben. Gesucht ist der Fluss Φ von innen nach aussen von v durch die Oberfläche S der
Einheitskugel mit Mittelpunkt in O. Die Fläche S kann durch die Parameterdarstellung
(u, v) → r(u, v) = (sin v cos u, sin v sin u, cos v)
mit 0 ≤ u ≤ 2π, 0 ≤ v ≤ π beschrieben werden. Dann gilt (siehe Abschnitt 3)
ru (u, v) × rv (u, v) = (− sin2 v cos u, − sin2 v sin u, − sin v cos v) .
Dieser Normalenvektor (kein Einheitsvektor) ist nach innen gerichtet. Damit erhalten wir für
den Fluss von innen nach aussen, also in der zu ru × rv entgegengesetzten Richtung
Φ = −
B
=
B
v (x(u, v), y(u, v), z(u, v)) · (ru (u, v) × rv (u, v)) du dv
(sin v cos u cos v, cos v, sin v sin u) · (sin2 v cos u, sin2 v sin u, sin v cos v) du dv
(sin3 v cos v cos2 u + sin2 v cos v sin u + sin2 v cos v sin u) du dv
=
B
π
2π
dv
=
0
π
= π
sin3 v cos v cos2 u du
0
sin3 v cos v dv
0
= π
1
sin4 v
4
π
0
= 0.
Beispiel Gesucht ist der Fluss (in Richtung der äusseren Normalen) des Vektorfeldes
v : (x, y, z) → v (x, y, z) = (2x − yz, xz + 3y, xy − z)
durch den Kegelmantel des Kegels mit Spitze in O, der Achse gleich der z-Achse, dem halben
Öffnungswinkel π/4 und der Höhe 1. Der Kegelmantel lässt sich durch die Parameterdarstellung
(ρ, ϕ) → (ρ cos ϕ, ρ sin ϕ, ρ)
33
Kapitel VI. Vektoranalysis
Fig. 3 :
Kegelmantel mit
Normalenvektor ~rρ × ~rϕ
beschreiben, wobei ρ und ϕ Polarkoordinaten in der (x, y)-Ebene bezeichnen und der Bereich B
durch 0 ≤ ρ ≤ 1 und 0 ≤ ϕ ≤ 2π gegeben ist. Es gilt dann
~rρ (ρ, ϕ) = (cos ϕ, sin ϕ, 1)
~rϕ (ρ, ϕ) = (−ρ sin ϕ, ρ cos ϕ, 0)
~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ) = (−ρ cos ϕ, −ρ sin ϕ, ρ(cos2 ϕ + sin2 ϕ)) = (−ρ cos ϕ, −ρ sin ϕ, ρ) .
Dieser Normalenvektor ist nach innen gerichtet (siehe Figur 3). Deshalb gilt für den gesuchten
Fluss Φ
ZZ
Φ =
Z
ZB
Z
B
1
=
=
0
(2ρ cos ϕ − ρ2 sin ϕ, ρ2 cos ϕ + 3ρ sin ϕ, ρ2 sin ϕ cos ϕ − ρ) · (ρ cos ϕ, ρ sin ϕ, −ρ) dρ dϕ
(2ρ2 cos2 ϕ − ρ3 sin ϕ cos ϕ + ρ3 sin ϕ cos ϕ + 3ρ2 sin2 ϕ − ρ3 sin ϕ cos ϕ + ρ2 ) dρ dϕ
dρ
Z
2π
0
dϕ (2ρ2 cos2 ϕ − ρ3 sin ϕ cos ϕ + 3ρ2 sin2 ϕ + ρ2 ) .
Wegen
Z
0
und
2π
cos2 ϕ dϕ =
Z
0
2π
sin2 ϕ dϕ = π
34
U. Stammbach: Analysis, Teil B
Z
0
2π
cos ϕ sin ϕ dϕ = 0
folgt schliesslich
Z
Φ=
0
1
(2ρ2 π + 3ρ2 π + ρ2 2π) dρ = 7π
Z
0
1
ρ2 dρ = 7π/3 .
35
Kapitel VI. Vektoranalysis
5
Der Divergenzsatz
Gegeben sei ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) und ein endlicher räumlicher Bereich B
(Kugel, Torus, etc) mit berandender Fläche ∂B. (Um der mathematischen Strenge Genüge
zu tun, setzen wir voraus, dass sich ∂B aus endlich vielen Flächenstücken zusammensetzt, die
sich durch stetig differenzierbare Parameterdarstellungen beschreiben lassen.) Auf ∂B sei der
äussere Normaleneinheitsvektor ausgezeichnet (siehe Figur 1).
Wir setzen voraus, dass ~v in ganz B definiert und dort “regulär” ist, d.h. dass ~v einmal stetig
differenzierbar ist. Dann gilt der überraschende und wichtige Divergenzsatz, Satz von Gauss
(C. F. Gauss 1777 - 1855):
Satz Unter den obigen Voraussetzungen gilt:
ZZ
Φ=
∂B
~v · ~n dO =
ZZZ
B
div ~v dV .
Der Fluss des Vektorfeldes ~v von innen nach aussen durch die berandende Fläche ∂B von B ist
gleich dem Volumenintegral der Divergenz von ~v über den Bereich B.
Beispiel
Wir betrachten das Vektorfeld
~v : (x, y, z) → ~v (x, y, z) = (xz, z, y)
und die Einheitskugel B mit Mittelpunkt in O. Wir haben in einem Beispiel in Abschnitt 4
bereits gesehen, dass der Fluss Φ (von innen nach aussen) von ~v durch die Kugeloberfläche Null
ist. Nach dem Satz von Gauss gilt
ZZZ
Φ=
B
div ~v dV ,
so dass sich der Fluss Φ auch als Volumenintegral berechnen lässt. Wir erhalten div ~v (x, y, z) =
z. Für das Integral
ZZZ
B
z dV
erhält man aber Null, da der von der oberen Halbkugel herrührende Anteil den Anteil der untern
Halbkugel kompensiert. (Natürlich kann man mit Hilfe von Kugelkoordinaten dieses Integral
auch leicht direkt berechnen: Es gilt z = r cos θ , dV = r 2 sin θ dr dϕ dθ . Also
36
U. Stammbach: Analysis, Teil B
~n
Fig. 1 :
Zum Satz von Gauss
~v
ZZZ
B
z dV =
Z
0
1
dr
Z
0
2π
dϕ
Z
π
0
dθ r cos θ r 2 sin θ = 0 . )
Wir beweisen den Satz von Gauss hier nicht. Immerhin wollen wir ihn in einem Spezialfall
verifizieren, im Spezialfall nämlich, wo der Bereich B ein achsenparalleler Quader ist. Es sei B
beschrieben durch die Ungleichungen (siehe Figur 2)
a ≤ x ≤ b, c ≤ y ≤ d, e ≤ z ≤ f .
Für das Vektorfeld
~v → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z))
ist dann das Volumenintegral
ZZZ
B
div ~v dV =
ZZZ
B
∂v1
(x, y, z) dV +
∂x
ZZZ
B
∂v2
(x, y, z) dV +
∂y
ZZZ
B
∂v3
(x, y, z) dV
∂z
37
Kapitel VI. Vektoranalysis
z=f
y=d
x=a
(−1, 0, 0)
Fig. 2 :
Spezialfall des Satzes von Gauss
x=b
S10
S1
(z)
y=c
(1, 0, 0)
z=e
(y)
(x)
auszurechnen. Für dessen ersten Summanden gilt nun
ZZZ
B
∂v1
(x, y, z) dV
∂x
Z
=
f
e
Z
=
e
Z
=
=
f
f
ZeZ
Z
dz
c
Z
dz
c
Z
dz
S10
d
c
d
d
dy
Z
b
a
∂v1
dx
∂x
dy (v1 (b, y, z) − v1 (a, y, z))
dy ~v (b, y, z) · (1, 0, 0) +
~v · ~n dO +
ZZ
S1
Z
f
e
dz
Z
c
d
dy ~v (a, y, z) · (−1, 0, 0)
~v · ~n dO ,
wo S10 die rechte und S1 die linke Seitenfläche des Quaders B bezeichnet. Der erste der obigen
Summanden ist also gleich dem Fluss (von innen nach aussen) des Vektorfeldes ~v durch die
Seitenflächen S1 und S10 . Analog verfährt man mit den übrigen beiden Summanden. Damit
erhält man im Falle des Quaders tatsächlich
ZZZ
B
div ~v dV =
ZZ
∂B
~v · ~n dO .
Im Rest dieses Abschnittes zeigen wir noch, wie der Satz von Gauss eine koordinatenfreie Definition der Divergenz liefert. Diese ermöglicht dann ihrerseits eine anschauliche Interpretation
38
U. Stammbach: Analysis, Teil B
der Divergenz eines Vektorfeldes.
Zur Einleitung betrachten wir neben dem (x, y, z)-Koordinatensystem ein zweites kartesisches
Koordinatensystem (ξ, η, ζ). Ist uns im (x, y, z)-Koordinatensystem ein Vektorfeld
~v : (x, y, z) → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z))
gegeben, so stellt sich dieses im neuen (ξ, η, ζ)-Koordinatensystem natürlich durch andere Komponenten dar:
~ṽ : (ξ, η, ζ) → ~ṽ(ξ, η, ζ) = (ṽ1 (ξ, η, ζ), ṽ2 (ξ, η, ζ), ṽ3 (ξ, η, ζ)) .
Es ist auch zu erwarten, dass die partielle Ableitungen der Komponenten ṽ1 , ṽ2 , ṽ3 nach den
neuen Koordinaten ξ, η, ζ mit den partiellen Ableitungen von v1 , v2 , v3 nach x, y, z wenig mehr zu
tun haben werden. Umso überraschender ist deshalb das Resultat, dass die Summe der partiellen
Ableitungen der Komponenten des Vektorfeldes ~v nach den drei entsprechenden Koordinaten vom
Koordinatensystem unabhängig ist:
∂v1
∂v2
∂v3
∂ṽ1
∂ṽ2
∂ṽ3
(x, y, z) +
(x, y, z) +
(x, y, z) =
(ξ, η, ζ) +
(ξ, η, ζ) +
(ξ, η, ζ) .
∂x
∂y
∂z
∂ξ
∂η
∂ζ
Die Divergenz des Vektorfeldes, wie wir sie formal definiert haben, ist vom gewählten (kartesischen) Koordinatensystem unabhängig.
Wir beweisen dies, indem wir mit Hilfe des Satzes von Gauss eine koordinatenfreie Definition
von div ~v angeben. Wir betrachten zu diesem Zweck einen festen Punkt P0 = (x0 , y0 , z0 ) und
eine Kugel Kr um P0 mit Radius r und Oberfläche Sr . Dann gilt nach dem Satz von Gauss
ZZZ
Kr
div ~v dV =
ZZ
Sr
~v · ~n dO ,
wo ~n den äusseren Normaleneinheitsvektor bezeichnet (siehe Figur 3). Der Mittelwertsatz der
Integralrechnung für Volumenintegrale besagt, dass ein Punkt Pr = (xr , yr , zr ) in Kr existiert
mit
ZZZ
4
div ~v dV = πr 3 div ~v (xr , yr , zr ) .
3
Kr
Lässt man nun r gegen Null gehen, so ergibt sich
1
div ~v (x0 , y0 , z0 ) = lim 4 3
r→0 πr
3
ZZ
Sr
~v · ~n dO .
39
Kapitel VI. Vektoranalysis
~n
r
Fig. 3 :
Der Fluss durch die Oberfläche
einer (kleinen) Kugel um P0
Pr
P0 = (x0 , y0 , z0 )
Kr
Sr
Da der Fluss des Vektorfeldes ~v durch Sr definitionsgemäss nicht vom gewählten Koordinatensystem abhängig ist, ist auch die linke Seite der Gleichung vom gewählten Koordinatensystem
unabhängig. Dies war zu beweisen.
Wir sehen aus diesen Überlegungen, dass die Divergenz div ~v eines Vektorfeldes ~v in P0 =
(x0 , y0 , z0 ) ein Mass für den aus der Volumeneinheit um P0 heraustretenden Fluss des Vektorfeldes ist.
Die Aussage div ~v (x0 , y0 , z0 ) > 0, bedeutet, dass in P0 pro Volumeneinheit ein positiver Fluss
erhalten wird. Anschaulich lässt sich dies dadurch deuten, dass in P0 fortlaufend “Flüssigkeit
erzeugt wird”. Man nennt deshalb eine solche Stelle eine Quelle des Vektorfeldes ~v .
Die Aussage div ~v (x0 , y0 , z0 ) < 0, lässt sich dadurch interpretieren, dass in P0 fortlaufend
“Flüssigkeit verschwindet”; man spricht dann von einer Senke oder von einer negativen Quelle
des Vektorfeldes.
Ein Vektorfeld ~v , dessen Divergenz im ganzen Definitionsbereich verschwindet, div ~v ≡ 0 heisst
quellenfrei. Anschaulich ist nach dem eben Gesagten klar, dass Strömungsfelder inkompressibler Medien quellenfrei sind; dies lässt sich, wie wir in Abschnitt 6 sehen werden, auch theoretisch
bestätigen. Durch direkte Rechnung haben wir ausserdem bereits im Abschnitt 2 gezeigt, dass
das Coulombfeld quellenfrei ist.
40
6
U. Stammbach: Analysis, Teil B
Anwendungen des Divergenzsatzes
Es gibt sehr viele Anwendungen des Divergenzsatzes. Wir besprechen hier einige davon, und
zwar solche, die sich auch ohne detaillierte Kenntnisse der Anwendungsgebiete darstellen lassen.
Dabei verläuft die Überlegung in allen Fällen formal gleich: Wir gehen von einem allgemeinen
physikalischen Gesetz aus, wenden darauf den Divergenzsatz an und erhalten ein neues physikalisches Gesetz, das vom mathematischen Standpunkt aus wesentlich durchsichtiger und einfacher
zu handhaben ist.
Kontinuitätsgleichung der Hydrodynamik
In unserm ersten Beispiel leiten wir aus dem sehr allgemeinen physikalischen Gesetz der Erhaltung der Materie die sogenannte Kontinuitätsgleichung der Hydrodynamik her. Wir betrachten
ein (instationäres) Strömungsfeld eines Mediums (Gas oder Flüssigkeit)
~v : (x, y, z, t) → ~v (x, y, z, t) .
Die Dichte des Mediums im Punkte (x, y, z) zur Zeit t sei durch das Skalarfeld
ρ : (x, y, z, t) → ρ(x, y, z, t)
beschrieben. Es sei nun B ein beliebiger endlicher Bereich, der ganz im Strömungsfeld liegt
(siehe Figur 1). Zur Zeit t befindet sich dann im Innern von B die Masse
m(t) =
ZZZ
B
ρ(x, y, z, t) dV .
Die zeitliche Änderung dieser Masse ist folglich gegeben durch
dm
d
=
dt
dt
ZZZ
B
ρ(x, y, z, t) dV =
ZZZ
B
ρt (x, y, z, t) dV ,
wobei wir im letzten Schritt unser Wissen über die Ableitung eines Integrals nach einem Parameter benützt haben (siehe Kapitel V, Abschnitt 5). Pro Zeiteinheit tritt durch das Oberflächenelement dS die Masse
ρ (~v · ~n) dO
41
Kapitel VI. Vektoranalysis
~n
Fig. 1 :
Zur Kontinuitätsgleichung
B
~v
aus, wobei ~n den äusseren Normaleneinheitsvektor bezeichnet. Durch die Gesamtoberfläche ∂B
von B geht also die Masse
ZZ
∂B
(ρ~v ) · ~n dO
verloren. Die Materiebilanz (“Gesetz der Erhaltung der Materie”) liefert nun die Gleichung
ZZZ
B
ρt dV +
ZZ
∂B
(ρ~v ) · ~n dO = 0 .
Die gesamte in B vorhandene Masse nimmt um genau so viel zu, wie durch die Oberfläche
∂B in den Bereich B hineinfliesst. An dieser Stelle wendet man nun auf das in der Gleichung
auftretende Flussintegral
ZZ
∂B
(ρ~v ) · ~n dO
den Divergenzsatz an, und zwar für das Vektorfeld
w
~ : (x, y, z, t) → w(x,
~
y, z, t) = ρ(x, y, z, t) ~v (x, y, z, t) .
42
U. Stammbach: Analysis, Teil B
Man erhält
ZZ
∂B
(ρ~v ) · ~n dO =
ZZZ
B
div (ρ~v ) dV .
Daraus ergibt sich die Integralbeziehung
ZZZ
B
(ρt + div (ρ~v )) dV = 0 .
Da diese Gleichung für jeden beliebigen Bereich B im Strömungsfeld erfüllt sein muss, schliessen
wir, dass mit dem Integral auch der Integrand verschwindet:
ρt + div (ρ~v ) = 0 .
Dies ist die wichtige Kontinuitätsgleichung der Hydrodynamik. Wir betrachten davon
noch einige Spezialfälle
(a) Im Falle einer stationären Strömung ist ρt ≡ 0. Dann folgt
div (ρ~v ) ≡ 0 .
Dabei gilt natürlich
div (ρ~v ) = ~v · grad ρ + ρ div ~v .
(b) Im Falle einer Strömung eines inkompressiblen Mediums ist ρ zeitlich und örtlich konstant.
Dann gilt
div (ρ~v ) = ρ div ~v ,
so dass sich die Kontinuitätsgleichung in diesem Fall auf die Aussage
div ~v ≡ 0
reduziert. Wir haben damit formal bewiesen, dass Strömungsfelder inkompressibler Medien (z.B. von Flüssigkeiten) quellenfrei sind (vergleiche Abschnitt 5).
43
Kapitel VI. Vektoranalysis
Wärmeleitungsgleichung
Unser zweites Beispiel geht aus vom grundlegenden physikalischen Erhaltungssatz der Energie.
Wir werden daraus die sogenannte Wärmeleitungsgleichung herleiten. Es sei ein homogener
Körper K gegeben. Die Temperatur an der Stelle (x, y, z) zur Zeit t sei durch das instationäre
Skalarfeld
u : (x, y, z, t) → u(x, y, z, t)
beschrieben. Wir betrachten nun einen beliebigen ganz in K liegenden Bereich B mit Oberfläche
∂B (siehe Figur 2). Die zur Zeit t in B befindliche Wärmemenge W (t) ist gegeben durch
W (t) =
ZZZ
B
c ρ u(x, y, z, t) dV ,
~n
K
Fig. 2 :
Zur Wärmeleitungsgleichung
B
(z)
(y)
(x)
wobei c die spezifische Wärme und ρ die Dichte des Materials ist. (Beide Grössen sind konstant,
da wir K als homogen vorausgesetzt haben.) Die Änderung der Wärmemenge W (t) ist somit
gegeben durch
dW
(t) =
dt
ZZZ
B
c ρ ut (x, y, z, t) dV .
44
U. Stammbach: Analysis, Teil B
dS
grad u
~n
Fig. 3 :
Zum Ansatz von Newton
für die Wärmeleitung
(z)
(y)
(x)
Da in B weder Wärme erzeugt noch vernichtet wird, kann die Änderung der Wärmemenge
W (t) nur durch einen Wärmefluss durch die Oberfläche ∂B von B verursacht werden. In dieser
Form benützen wir den Erhaltungssatz der Energie. Um den Wärmefluss durch die Oberfläche
mathematisch ausdrücken zu können, greifen wir auf das von Newton beschriebene Erfahrungsgesetz zurück (siehe Figur 3): Die pro Zeiteinheit durch das differentielle Flächenstück dS in
Richtung des Normaleneinheitsvektors ~n hindurchfliessende Wärmemenge ist proportional zum
Temperaturgefälle in Richtung ~n, also zur Richtungsableitung D~n u von u in Richtung ~n und
natürlich proportional zum Flächeninhalt dO des Flächenstücks dS. Wegen D~n u = ~n · grad u
(siehe Kapitel IV, Abschnitt 7) folgt für die durch dS hinaus tretende Wärmemenge
dW = −k ~n · grad u dO.
Dabei ist k eine positive Konstante. Wir erhalten damit die Gleichung
ZZZ
B
c ρ ut dV =
ZZ
∂B
k (~n · grad u) dO ,
wenn wir mit ~n den äusseren Normaleneinheitsvektor von B bezeichnen. An dieser Stelle wenden
wir nun den Divergenzsatz auf das auf der rechten Seite stehende Flussintegral an. Wir erhalten
45
Kapitel VI. Vektoranalysis
ZZ
∂B
k (~n · grad u) dO =
ZZZ
B
k div grad u dV .
Daraus folgt
ZZZ
B
(cρut − kdiv (grad u)) dV = 0 .
Da dies für beliebige in K liegende Bereiche B gelten muss, folgern wir, dass mit dem Integral
auch der Integrand Null ist. Verwenden wir wie üblich die Bezeichnung div grad u = ∆u und
setzen wir
a2 :=
k
,
cρ
so gilt
ut − a2 ∆u = 0 .
Dies ist die sogenannte Wärmeleitungsgleichung. Diese lineare partielle Differentialgleichung
zweiter Ordnung tritt in vielen anderen Anwendungen, nämlich ganz allgemein bei Diffusionsproblemen auf. In der Analysis III wird einiges über die Lösungen dieser Gleichungen gesagt
werden.
Wir erwähnen zum Schluss noch den Spezialfall einer stationären Temperaturverteilung, also
z.B. einer Temperaturverteilung, wie sie sich in einem isolierten Körper K nach langer Zeit
automatisch einstellt. Dann gilt ut ≡ 0, so dass u Lösung der partiellen Differentialgleichung
∆u = 0
sein muss. Die stationäre Temperaturverteilung u genügt der sogenannten Laplace’schen Differentialgleichung ∆u = 0; die Lösungen der Laplace’schen Differentialgleichungen heissen
definitionsgemäss harmonische Funktionen.
Grundgleichung der Elektrostatik
In unserm dritten Beispiel leiten wir die Grundgleichung der Elektrostatik, also eine der vier
Maxwell’schen Gleichungen (siehe Physik) aus dem Coulomb’schen Gesetz her.
46
U. Stammbach: Analysis, Teil B
~ einer elektrischen Ladung e im
Das Coulomb’sche Gesetz besagt, dass das elektrische Feld E
Punkte P0 = (x0 , y0 , z0 ) durch
~r − ~r0
~
E(x,
y, z) = e
|~r − ~r0 |3
beschrieben wird, wobei wir zur Abkürzung ~r = (x, y, z) und ~r0 = (x0 , y0 , z0 ) gesetzt haben.
Man vergleiche dazu das entsprechende Beispiel in Abschnitt 1, wo das Coulombfeld für P0 = O
beschrieben wurde. (Der Einfachheit halber setzen wir jetzt die dort auftretende Konstante
gleich 1; dies entspricht einer geschickten Wahl der Masseinheiten.)
~ ≡ 0. Es
Wir haben bereits gesehen, dass das Coulombfeld quellenfrei ist; d.h. es gilt div E
sei nun B ein Bereich, der P0 enthält, sein Rand sei ∂B. Der Fluss Φ von innen nach aussen
durch ∂B lässt sich mit Hilfe des Divergenzsatzes berechnen. Zu diesem Zweck sparen wir aus
B eine kleine Kugel K mit Mittelpunkt P0 aus (siehe Figur 4). Für den durchlöcherten Bereich
~ ist in ganz B̄ regulär.
B̄ ist die Voraussetzung des Divergenzsatzes erfüllt: Das Vektorfeld E
~ ist in P0 nicht definiert!) Der Divergenzsatz
(Man beachte, dass dies für B nicht der Fall ist: E
~
angewandt auf B̄ und E liefert nun
ZZZ
0=
B̄
~ dV =
div E
ZZ
∂ B̄
~ · ~n dO =
E
ZZ
∂B
~ · ~n dO +
E
ZZ
∂K
~ · ~n dO .
E
Dabei ist im zweiten Flussintegral die für B̄ äussere, also die für die Kugel K innere Normalenrichtung zu wählen. Das letztere Flussintegral wurde in Abschnitt 4 für die äussere Normalenrichtung bereits berechnet. Jenes Resultat liefert
ZZ
∂K
~ · ~n dO = −4πe .
E
~ durch die Oberfläche
Wir erhalten damit die Aussage: Für den Fluss Φ des Coulombfeldes E
∂B eines Bereiches B gilt
ZZ
∂B
(
~ · ~n dO =
E
+4πe falls e in B enthalten ist,
0
sonst .
Wir betrachten nun endlich viele Punktladungen e1 , e2 , . . . , em in den Punkten P1 , P2 , . . . , Pm .
~ i , so folgt für das totale elektrische Feld E
~
Erzeugt ei das Coulombfeld E
~ =E
~1 + E
~2 + · · · + E
~m .
E
Ferner sei B ein beliebiger Bereich (siehe Figur 5). Wir erhalten dann für den Fluss des Vek~ aus B heraus
torfeldes E
47
Kapitel VI. Vektoranalysis
∂B
∂K
~n
e
Fig. 4 :
Der Fluss eines Coulombfeldes
P0
~n
(z)
(y)
(x)
∂B
B
Fig. 5 :
Der Fluss einer Summe
von Coulombfeldern
e2
e1
~n
(z)
e3
(y)
(x)
48
U. Stammbach: Analysis, Teil B
ZZ
∂B
ZZ
~1 + E
~2 + · · · + E
~ m ) · ~n dO =
(E
∂B
= 4π
~ 1 · ~n dO +
E
X
ZZ
∂B
~ 2 · ~n dO + · · · +
E
ZZ
∂B
~ m · ~n dO
E
ei ,
wobei die Summe über diejenigen Ladungen zu erstrecken ist, die in B enthalten sind.
Im Falle einer kontinuierlichen Ladungsverteilung gehen wir wie folgt vor. Es sei die Ladungsdichte gegeben durch das Skalarfeld
ρ : (x, y, z) → ρ(x, y, z) .
Dann folgt für das Flussintegral durch die Oberfläche ∂B des Bereiches B
ZZ
∂B
~ · ~n dO = 4π
E
ZZZ
B
ρ dV ,
denn das rechts stehende Integral liefert gerade die in B enthaltene Ladung (entsprechend der
Summe der Einzelladungen ei bei der diskreten Ladungsverteilung). Wenden wir nun den Divergenzsatz auf das links stehende Integral an, so folgt
ZZZ
B
~ − 4πρ) dV = 0 .
(div E
Da B beliebig gewählt werden kann, folgern wir aus dem Verschwinden des Integrals das Verschwinden des Integranden. Es gilt also
~ = 4πρ .
div E
Dies ist die Grundgleichung der Elektrostatik, eine der vier Maxwell’schen Gleichungen
(J. C. Maxwell 1831 - 1879).
Als triviale Folgerung erhalten wir, dass im ladungsfreien Raum (ρ ≡ 0) die elektrische Feldstärke
quellenfrei ist.
Hydrostatischer Auftrieb
Gegeben sei ein Körper K, der vollständig in eine Flüssigkeit mit dem spezifischen Gewicht γ
eingetaucht werde. Man weiss mit Archimedes (Heureka!), dass dann eine Auftriebskraft auf
49
Kapitel VI. Vektoranalysis
den Körper wirkt. Hier wollen wir die Grösse dieser Kraft mit Hilfe des Satzes von Gauss aus
dem Druckverlauf in der Flüssigkeit ermitteln.
Wir nehmen an, dass der Flüssigkeitsspiegel horizontal sei. Bezeichnen wir mit p(z) den in
der Tiefe z herrschenden Druck, so gilt natürlich p(z) = p0 + γz , wobei p0 der Druck an der
Flüssigkeitsoberfläche ist (siehe Figur 6). Ist B der vom Körper K eingenommene Bereich, so
bezeichne ~n den äusseren Normaleneinheitsvektor. Auf das differentielle Flächenstück dS von
B wirkt dann die Kraft
Fig. 6 :
Zum hydrostatischen Auftrieb
B
~
dA
~n
(z)
~ = −(p0 + γz) ~n dO ,
dA
~ also
und auf den ganzen Körper K somit die “Summe” aller dA,
~=
A
ZZ
∂B
~= −
dA
ZZ
∂B
(p0 + γz) n1 dO, −
ZZ
∂B
(p0 + γz) n2 dO, −
ZZ
∂B
(p0 + γz) n3 , dO
.
Mit Hilfe des Divergenzsatzes lassen sich diese Oberflächenintegrale uminterpretieren. Zu diesem
Zweck führen wir (Hilfs-)Vektorfelder ein, die erlauben, die Integrale als Flussintegrale aufzufassen. Wählen wir als erstes das Vektorfeld ~v = (p0 + γz, 0, 0), dann liefert der Divergenzsatz
angewandt auf B
50
U. Stammbach: Analysis, Teil B
ZZ
∂B
(p0 + γz) n1 dO =
ZZ
∂B
~v · ~n dO =
ZZZ
B
div ~v dV = 0 .
Tun wir dasselbe für das Vektorfeld ~v = (0, p0 + γz, 0) so erhalten wir
ZZ
∂B
(p0 + γz) n2 dO =
ZZ
∂B
~v · ~n dO =
ZZZ
B
div ~v dV = 0 .
Wählen wir schliesslich ~v = (0, 0, p0 + γz), so folgt auf gleiche Weise
ZZ
∂B
(p0 + γz) n3 dO =
ZZ
∂B
~v · ~n dO =
ZZZ
B
div ~v dV =
ZZZ
γ dV = γ V ,
wo V das Volumen des Körpers K bezeichnet. Das Produkt γ V ist nichts anderes als das
Gewicht der verdrängten Flüssigkeit. Es gilt für die Auftriebskraft
~ = (0, 0, −γ V ) ,
A
und wir haben das wohlbekannte Archimedische Prinzip hergeleitet.
51
Kapitel VI. Vektoranalysis
7
Die Arbeit
In Abschnitt 4 haben wir den Begriff des Flusses eines Vektorfeldes eingeführt. Hier nun geht es
um einen weiteren mit einem Vektorfeld verbundenen Begriff, nämlich um die Arbeit eines Vektorfeldes. Wie so oft kommt auch hier der Name des mathematischen Begriffs aus einer speziellen
Anwendung: Bei der Berechnung der Arbeit, die eine Kraft im physikalisch-mechanischen Sinn
leistet, tritt diese mathematische Bildung auf.
Gegeben sei ein reguläres d.h. stetig differenzierbares Vektorfeld ~v : (x, y, z) → ~v (x, y, z) und ein
ganz im Definitionsbereich D(~v ) von ~v verlaufender Weg W mit Anfangspunkt P und Endpunkt
Q. Unter einem Weg verstehen wir eine mit einem Durchlaufsinn versehene Kurve, die sich aus
endlich vielen stetig differenzierbaren Kurvenstücken zusammensetzt. Um zum mathematischen
Begriff Arbeit zu gelangen, fassen wir das Vektorfeld ~v als Kraftfeld auf und fragen nach der
mechanischen Arbeit, die ~v leistet, wenn sich ein Punkt längs des Weges W von P nach Q
bewegt.
Fig. 1 :
Die Arbeit; Spezialfall.
~v
ω
P
l
Q
Im einfachen Spezialfall eines geradlinig verlaufenden Weges W von P nach Q und eines homogenen Vektorfeldes ~v , ist diese Arbeit gegeben durch (siehe Figur 1)
52
U. Stammbach: Analysis, Teil B
A = |~v | l cos ω = ~v · P~Q .
Dabei bezeichnet l die Länge von W und ω den Winkel zwischen den Vektoren ~v und P~Q.
Q
Fig. 2 :
Die Arbeit; allgemeiner Fall.
W
(z)
P
(y)
(x)
Im allgemeinen Fall unterteilen wir den Weg in “kurze” Teilstücke. Diese können als geradlinig
und das Vektorfeld in ihrem Bereich als homogen angesehen werden. Der Anteil dA an die
Arbeit, der von einem solchen Teilstück d~r herrührt, ist offenbar gegeben durch
dA = ~v · d~r .
Die gesamte Arbeit auf dem Weg W von P bis Q ist dann die “Summe” all dieser Anteile, also
das Integral (siehe Figur 2)
A=
Z
W
~v · d~r .
Im konkreten Fall ist der Weg W durch eine Parameterdarstellung gegeben,
~ , ~r(tQ ) = OQ,
~ .
t → ~r(t) = (x(t), y(t), z(t)), ~r(tP ) = OP
53
Kapitel VI. Vektoranalysis
Dann gilt ~v · d~r = ~v · ~r˙ (t) dt und damit
A =
=
Z
tQ
tP
Z tQ
tP
~v (x(t), y(t), z(t)) · ~r˙ (t) dt
(v1 (x(t), y(t), z(t)), v2 (x(t), y(t), z(t)), v3 (x(t), y(t), z(t))) · (ẋ(t), ẏ(t), ż(t)) dt .
Der Wert dieses Wegintegrals ist definitionsgemäss die Arbeit, die das Vektorfeld ~v längs des
Weges W leistet.
Wie schon erwähnt, tritt die formale Bildung des Arbeitsintegrals auch in vielen Anwendungen
auf, wo das Vektorfeld kein Kraftfeld ist; das Integral trägt dann oft einen anderen Namen. Im
Falle eines Strömungsfeldes heisst es Zirkulation; im Fall des elektrischen Feldes beschreibt das
Integral nichts anderes als die (elektrische) Spannung.
Beispiel Es sei ~v das Gravitationsfeld eines Massenpunktes, der sich in O befindet,
~v (x, y, z) = −C
~r
.
|~r|3
Wir fragen nach der Arbeit A, die ~v längs eines Kreises K mit Mittelpunkt in O leistet.
Ist W der durch den Kreis K gegebene Weg (der Durchlaufsinn spielt in diesem Beispiel keine
Rolle), dann ist
A=
Z
W
~v · d~r = 0 ,
denn ~v ist gegen den Ursprung O gerichtet und d~r verläuft senkrecht zu ~r, es ist also ~v · d~r = 0.
Es sei ein Weg W mit Startpunkt P und Endpunkt Q gegeben. Wir bezeichnen mit −W den
Weg mit dem umgekehrten Durchlaufsinn. Offensichtlich gilt dann
Z
−W
~v · d~r =
Z
W
Z
~v · (−d~r) = −
W
~v · d~r .
Ist W1 ein Weg mit Anfangspunkt P und Endpunkt Q und W2 ein Weg mit Anfangspunkt Q und
Endpunkt R, so lassen sich W1 und W2 zu einem Weg zusammensetzen, den wir mit W1 + W2
bezeichnen (siehe Figur 3). Es gilt dann
Z
W1 +W2
Beispiel
~v · d~r =
Z
W1
~v · d~r +
Z
W2
~v · d~r .
Es sei das Vektorfeld des stromdurchflossenen Leiters gegeben,
54
U. Stammbach: Analysis, Teil B
Q
W1
Fig. 3 :
Zusammensetzung von Wegen
W2
P
R
~v : (x, y, z) → ~v (x, y, z) = 2J
y
x
− 2
,
,0
x + y 2 x2 + y 2
,
und es sei W der durch
t → (a cos t, a sin t, 0) , 0 ≤ t ≤ 2π
beschriebene (geschlossene) Weg. Die Arbeit von ~v längs des Weges W berechnet sich dann
durch
A =
=
Z
~v · d~r
W
Z 2π
0
= 2J
~v (a cos t, a sin t, 0) · ~r˙ (t) dt
Z
0
Z
= 2J
2π
0
2π
!
a sin t
a cos t
− 2
, 0 · (−a sin t, a cos t, 0) dt
2 , 2
2
a (cos t + sin t) a (cos2 t + sin2 t)
1 dt
= 2J 2π .
Wir werden später auf dieses interessante Beispiel zurückkommen.
55
Kapitel VI. Vektoranalysis
Beispiel Es sei das Vektorfeld
~v : (x, y, z) → ~v (x, y, z) = (2xy, x2 + y 2 , 0)
gegeben. Gesucht ist die Arbeit, die ~v längs der im Gegenuhrzeigersinn durchlaufenen Ellipse
E : t → ~r(t) = (a cos t, b sin t, 0) , 0 ≤ t ≤ 2π ,
leistet (siehe Figur 4).
Es gilt
(y)
E
b
Fig. 4 :
Arbeit des Vektorfeldes
a
(x)
~v (x, y, z) = (2xy, x2 + y 2 , 0)
längs der Ellipse E
A =
Z
~v · d~r
E
2π
Z
=
0
Z
=
0
Z
=
2π
2π
0
= 0.
(2ab sin t cos t, a2 cos2 t + b2 sin2 t, 0) · (−a sin t, b cos t, 0) dt
(−2a2 b sin2 t cos t + a2 b cos3 t + b3 sin2 t cos t) dt
(−2a2 b + b3 ) sin2 t cos t dt +
Z
0
2π
a2 b cos3 t dt
56
8
U. Stammbach: Analysis, Teil B
Der Satz von Stokes
Der Satz von Stokes steht in einem gleichen Verhältnis zum Satz von Gauss wie die Arbeit eines
Vektorfeldes zum Fluss eines Vektorfeldes, oder wie der Operator rot zum Operator div .
Es sei v : (x, y, z) → ~v (x, y, z) ein reguläres, d.h. stetig differenzierbares Vektorfeld mit Definitionsbereich D(~v ). Ferner sei S ein ganz in D(~v ) enthaltenes orientiertes Flächenstück mit Rand
∂S. Orientiert heisst ein Flächenstück, wenn darauf einer der beiden Normaleneinheitsvektoren
~n ausgezeichnet ist, und zwar auf eine auf der ganzen Fläche konsistenten, d.h. stetigen Weise.
(Man beachte, dass sich nicht jedes Flächenstück orientieren lässt: ein Möbiusband kann nicht
orientiert werden!) Der Einfachheit halber und um der mathematischen Strenge Genüge zu tun,
nehmen wir an, dass sich S und ∂S aus endlich vielen stetig differenzierbaren Flächenstücken
bzw. Kurvenstücken zusammensetzt. Wir machen nun die geschlossene Randkurve ∂S zu einem
Weg C, indem wir einen Durchlaufsinn wählen, der mit der Orientierung von S verträglich
ist: Wir durchlaufen ∂S so, dass mit dem auf S ausgezeichneten Normalenvektor eine Rechtsschraube gebildet wird (siehe Figur 1). Dann gilt der Satz von Stokes (G. G. Stokes 1819-1903):
Satz von Stokes Unter den obigen Voraussetzungen gilt
Z
C
~v · d~r =
ZZ
S
rot ~v · ~n dO .
Die Arbeit des Vektorfeldes ~v längs des Randweges C ist gleich dem Fluss von rot ~v in Richtung
~n durch die Fläche S.
Beispiel
Wir betrachten das Vektorfeld
~v : (x, y, z) → ~v (x, y, z) = (2xy, x2 + y 2 , 0) .
Es sei S die Ellipsenfläche
x2 y 2
+ 2 ≤1
a2
b
in der (x, y)-Ebene, ~n der in Richtung der z-Achse zeigende Normaleneinheitsvektor. Der Rand
∂S ist dann die Ellipsenperipherie, die wir zu einem (geschlossenen) Weg C machen, indem wir
ihn verträglich mit ~n, also im Gegenuhrzeigersinn durchlaufen. Nach dem Satz von Stokes gilt
dann
57
Kapitel VI. Vektoranalysis
~n
Fig. 1 :
Zum Satz von Stokes
S
C
(z)
(y)
(x)
Z
C
~v · d~r =
ZZ
S
rot ~v · ~n dO =
ZZ
S
(0, 0, 0) · (0, 0, 1) dO = 0 ,
in Übereinstimmung mit dem Resultat in Abschnitt 7, wo wir die Arbeit des Vektorfeldes ~v
längs des Weges C direkt berechnet haben.
Wir entnehmen diesem Beispiel, dass wir aus dem Satz von Stokes die nachstehende Folgerung
ziehen können:
Es sei ~v : (x, y, z) → ~v (x, y, z) ein reguläres Vektorfeld mit rot ~v = (0, 0, 0) und es sei C ein
Weg, der den Rand eines ganz in D(~v ) liegenden orientierten Flächenstücks S bildet. Dann ist
die Arbeit A des Vektorfeldes ~v längs C Null.
Beispiel
Es sei das offensichtlich überall reguläre Vektorfeld
~v : (x, y, z) → ~v (x, y, z) = (x2 − y 2 , −xy, 0)
gegeben. Gesucht ist die Arbeit von ~v längs des geschlossenen Weges C in der (x, y)-Ebene,
wobei C von P = (1, 0) längs der Geraden y = 1 − x nach Q = (0, 1) und von dort längs des
58
U. Stammbach: Analysis, Teil B
(y)
Fig. 2 :
Arbeit längs des
geschlossenen Weges C
C
S
(x)
Einheitskreises t → (cos t, sin t) zurück nach P verläuft (siehe Figur 2). Nach dem Satz von
Stokes gilt
Z
C
~v · d~r =
ZZ
S
rot ~v · ~n dO .
p
Dabei bezeichnen wir mit S das durch 0 ≤ y ≤ 1 und 1 − y ≤ x ≤ 1 − y 2 gegebene
Flächenstück der (x, y)-Ebene. Der vorgeschriebene Durchlaufsinn der Randkurve beschreibt
mit dem Einheitsvektor in der negativen z-Richtung eine Rechtsschraube; konsequenterweise ist
~n = (0, 0, −1). Mit rot ~v = (0, 0, y) erhalten wir
ZZ
Z
Z √
S
1
rot ~v · ~n dO = −
= −
0
Z
0
1
= −
2
=
1
dy
1−y 2
1−y
y dx
q
dy y 1 − y 2 − y(1 − y)
Z
0
1
q
2y 1 − y 2 dy −
1 2
(1 − y 2 )3/2
2 3
1
= − −
3
1 1
−
3 2
1
0
"
−
Z
y3
0
1
(y 2 − y) dy
y2
−
3
2
#1
0
59
Kapitel VI. Vektoranalysis
= −
Beispiel
1
.
6
Wir betrachten das Stück S der durch
z = x2 − y 2
gegebenen Sattelfläche, das zu x2 + y 2 ≤ a2 gehört (siehe Figur 3). Die Randkurve C dieses
Flächenstücks ist gegeben durch die Parameterdarstellung
Fig. 3 :
Sattelfläche S mit
Randkurve C
C
t → (a cos t, a sin t, a2 (cos2 t − sin2 t)) , 0 ≤ t ≤ 2π .
Ferner betrachten wir das Vektorfeld
~v : (x, y, z) → ~v (x, y, z) = (z, x, y) .
Gesucht ist die Arbeit des Vektorfeldes ~v längs der Kurve C. Laut Satz von Stokes können wir
diese Arbeit auf zwei verschiedene Arten berechnen, nämlich erstens als Arbeit längs des Weges
60
U. Stammbach: Analysis, Teil B
C und zweitens als Fluss des Vektorfeldes rot ~v durch die Fläche S und zwar in der Richtung,
mit welcher der Durchlaufsinn der Randkurve eine Rechtsschraube bildet.
Die direkte Berechnung liefert
Z
C
~v · d~r =
Z
0
Z
=
0
Z
=
0
2π
(a2 (cos2 t − sin2 t), a cos t, a sin t) · (−a sin t, a cos t, a2 (−4 cos t sin t)) dt
2π
2π
(−a3 cos2 t sin t + a3 sin2 t sin t + a2 cos2 t − 4a3 sin2 t cos t) dt
(−2a3 cos2 t sin t + a3 sin t + a2 cos2 t − 4a3 sin2 t cos t) dt
= πa2 ,
denn nur der zweitletzte Summand liefert einen von Null verschiedenen Beitrag.
Wir wenden uns jetzt der Berechnung des Flusses zu und wählen als Parameterdarstellung des
Flächenstücks S:
(u, v) → ~r(u, v) = (u, v, u2 − v 2 ) , u2 + v 2 ≤ a2 .
Wir erhalten dann
~ru (u, v) = (1, 0, 2u) ,
~rv (u, v) = (0, 1, −2v)
und damit den Normalenvektor
~ru (u, v) × ~rv (u, v) = (−2u, 2v, 1) .
Dieser bildet mit dem gegebenen Durchlaufsinn der Randkurve C eine Rechtsschraube. Für die
Rotation des Vektorfeldes erhalten wir
rot ~v = (1, 1, 1) .
Damit liefert die Flussberechnung
ZZ
Φ =
=
=
Z ZS
Z ZB
B
rot ~v · ~n dO
(1, 1, 1) · (−2u, 2v, 1) du dv
(−2u + 2v + 1) du dv ,
61
Kapitel VI. Vektoranalysis
wobei B der durch u2 + v 2 ≤ a2 gegebene Kreis in der (u, v)-Ebene ist. Für dieses B liefert aus
Symmetriegründen nur der letzte der drei Summanden einen Beitrag. Damit gilt
Φ = πa2 .
Wir beweisen in dieser Vorlesung den Satz von Stokes natürlich nicht. Immerhin wollen wir in
einem Spezialfall plausibel machen, weshalb der Satz von Stokes richtig ist. Zu diesem Zweck
betrachten wir den Fall, wo S ein achsenparalleles Rechteck ist, welches durch
a≤x≤b, c≤y≤d, z=e
~n
y=d
x=a
S
x=b
Fig. 4 :
Spezialfall des
Satzes von Stokes
y=c
(z)
(y)
(x)
gegeben ist (siehe Figur 4). Wir durchlaufen dieses Rechteck im Gegenuhrzeigersinn und nennen
den entsprechenden Weg C. Es muss dann auf S der Normaleneinheitsvektor ~n = (0, 0, 1)
gewählt werden. Nun gilt mit
rot ~v =
∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1
−
,
−
,
−
∂y
∂z ∂z
∂x ∂x
∂y
62
U. Stammbach: Analysis, Teil B
für die Berechnung des Flusses von rot ~v durch S in Richtung ~n
ZZ ZZ
∂v2 ∂v1
rot ~v · ~n dO =
dx dy
−
∂x
∂y
S
S
Z d
Z b
Z b
Z d
∂v2
∂v1
=
dy
dx
dx
dy
−
∂x
∂y
c
a
a
c
Z
=
c
Z
=
=
d
d
Zc
C
(v2 (b, y, e) − v2 (a, y, e)) dy −
v2 (b, y, e) dy +
Z
a
b
Z
b
a
(v1 (x, d, e) − v1 (x, c, e)) dx
v1 (x, d, e) dx +
Z
c
d
v2 (a, y, e) dy +
Z
b
a
v1 (x, c, e) dx
~v · d~r ,
so dass in diesem Fall der Satz von Stokes verifiziert ist.
Auf ähnliche Weise wie der Divergenzsatz eine koordinatenfreie Definition von div liefert, so
liefert der Satz von Stokes eine koordinatenfreie Definition der Rotation und damit eine anschauliche Bedeutung für rot ~v .
Wir bemerken zuerst, dass rot ~v mit Hilfe eines festgewählten Koordinatensystems definiert ist,
rot ~v (x, y, z) =
∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1
−
,
−
,
−
∂y
∂z ∂z
∂x ∂x
∂y
.
Es ist von vornherein nicht klar, dass sich der Vektor rot ~v nicht ändert, wenn ein anderes
kartesisches Koordinatensystem gewählt wird und in diesem auf formal dieselbe Art ein Vektor
gebildet wird. Der Satz von Stokes erlaubt nun, eine koordinatenfreie Definition anzugeben und
auf diese Art zu zeigen, dass das Vektorfeld
rot ~v : (x, y, z) → rot ~v (x, y, z)
unabhängig vom gewählten kartesischen Koordinatensystem ist. Ausserdem liefert dieselbe
Überlegung auch eine anschauliche Bedeutung für rot ~v (x0 , y0 , z0 ). Es sei ein Vektorfeld ~v
gegeben und P0 = (x0 , y0 , z0 ) ein Punkt in seinem Definitionsbereich D(~v ). Ferner sei ~n ein
beliebiger Einheitsvektor. Mit Sr bezeichnen wir die auf ~n senkrecht stehende Kreisscheibe
mit Radius r und Mittelpunkt P0 . Schliesslich sei Cr der Sr berandende Weg, der mit ~n eine
Rechtsschraube bildet (siehe Figur 5). Der Satz von Stokes liefert in dieser Situation
Z
Cr
~v · d~r =
ZZ
Sr
rot ~v · ~n dO .
Nach dem Mittelwertsatz für Flächenintegrale gibt es auf Sr einen Punkt Pr = (xr , yr , zr ) mit
Kapitel VI. Vektoranalysis
63
v
n
Fig. 5 :
Arbeit längs eines
(kleinen) Kreises
Sr
P0 = (x0 , y0 , z0 )
Cr
Sr
rot v · n dO = πr 2 rot v (xr , yr , zr ) · n .
Für r → 0 erhalten wir wegen der Stetigkeit des Feldes rot v somit
1
r→0 πr 2
n · rot v (x0 , y0 , z0 ) = lim
1
r→0 πr 2
rot v · n dO = lim
Sr
Cr
v · dr .
Nun gilt bekanntlich für das Skalarprodukt das Folgende: n · rot v (x0 , y0 , z0 ) nimmt den maximalen Wert genau dann an, wenn der Vektor n parallel zum Vektor rot v (x0 , y0 , z0 ) ist. Dieser
maximale Wert ist |rot v (x0 , y0 , z0 )|. Wir haben damit den Vektor rot v (x0 , y0 , z0 ) in Richtung
und Länge beschreiben können:
Der Vektor n zeigt genau dann in Richtung rot v (x0 , y0 , z0 ), wenn
1
r→0 πr 2
lim
Cr
v · dr
den maximalen Wert annimmt. Dieser Wert ist gleich |rot v (x0 , y0 , z0 )|.
Für die Anschauung entnehmen wir dieser Überlegung, dass rot v (x0 , y0 , z0 ) Richtung und
64
U. Stammbach: Analysis, Teil B
Stärke der “Wirbelung” des Vektorfeldes ~v im Punkte (x0 , y0 , z0 ) angibt. Wählen wir eine
zu rot ~v (x0 , y0 , z0 ) senkrecht stehende Kreisscheibe Sr mit Radius r, Mittelpunkt (x0 , y0 , z0 )
und Rand Cr , so gibt die Länge von rot ~v (x0 , y0 , z0 ) die Arbeit des Vektorfeldes ~v längs Cr pro
Flächeneinheit von Sr an. Anschaulich heisst dies, dass das Vektorfeld ~v in (x0 , y0 , z0 ) einen
Wirbel aufweist, der senkrecht zu rot ~v (x0 , y0 , z0 ) verläuft. Aus diesem Grund heisst rot ~v
auch etwa die Wirbelstärke von ~v . Gilt für ein Vektorfeld rot ~v (x, y, z) ≡ (0, 0, 0), so heisst
dieses wirbelfrei.
Zum Schluss merken wir noch an, dass gemäss den Resultaten des Abschnittes 2 jedes Gradientenfeld wirbelfrei ist; insbesondere ist auch das Coulombfeld wirbelfrei.
65
Kapitel VI. Vektoranalysis
9
Eine Anwendung des Satzes von Stokes
Wie die Anwendungen des Divergenzsatzes so sind auch die Anwendungen des Satzes von Stokes
sehr zahlreich. Zur Illustration stellen wir hier ein Beispiel aus der Elektrodynamik dar.
Wir betrachten ein (instationäres) Magnetfeld
~ : (x, y, z, t) → H(x,
~
H
y, z, t) .
Im Definitionsbereich dieses Magnetfeldes sei eine geschlossene Kurve C gegeben; diese betrachten wir als Weg, indem wir C mit einem Durchlaufsinn versehen. Konkret können wir
uns C als Draht vorstellen, an dem wir die elektrische Spannung messen werden, und zwar in
der durch den Durchlaufsinn gegebenen Richtung. Ferner sei S irgend eine Fläche mit Rand
∂S = C. Schliesslich zeichnen wir auf S denjenigen Normaleneinheitsvektor aus, der mit dem
Durchlaufsinn auf C eine Rechtsschraube bildet (siehe Figur 1). Wir bezeichnen nun mit Z den
~ durch S in Richtung ~n,
Fluss von H
Z=
ZZ
S
~ · ~n dO .
H
Das physikalische Experiment zeigt dann Folgendes: Falls Z zeitlich variiert, so fliesst in C ein
elektrischer Strom, und zwar besagt das von Faraday (M. Faraday 1791 - 1867) stammende
Erfahrungsgesetz, dass für die induzierte Spannung die Gleichung
Vind = −µ0
dZ
dt
gilt, d.h. die induzierte Spannung ist proportional zur Änderung des Flusses Z. Setzt man die
Definition von Z ein, so erhält man
Vind
dZ
d
= −µ0
= −µ0
dt
dt
ZZ
S
~ · ~n dO = −µ0
H
ZZ
S
~ t · ~n dO .
H
~ in Verbindung und wenden auf
Wir bringen nun die Spannung Vind mit dem elektrischen Feld E
das entsprechende (Arbeits-)Integral den Satz von Stokes an:
Vind =
Z
C
~ · d~r =
E
ZZ
S
~ · ~n dO .
rot E
Da diese Beziehung für sämtliche mögliche Flächen S gelten muss, können wir wie früher vom
Verschwinden des Integrals auf das Verschwinden des Integranden schliessen. Es gilt somit
66
U. Stammbach: Analysis, Teil B
~n
S
Fig. 1 :
Zum Gesetz von Faraday
C
~
H
~ t = ~0 .
~ + µ0 H
rot E
Dies ist eine weitere der berühmten vier Maxwell’schen Gleichungen, welche die Grundlage der
Elektrodynamik bilden.
Kapitel VI. Vektoranalysis
10
67
Potentialfelder
Konservative Vektorfelder treten in Anwendungen häufig auf; sie werden, wie in diesem Abschnitt gezeigt wird, durch Potentialfelder (Gradientenfelder) beschrieben.
Ein Vektorfeld v : (x, y, z) → v (x, y, z) heisst konservativ, wenn für alle P, Q ∈ D(v ) gilt, dass
die Arbeit von v längs allen Wegen von P nach Q gleich gross ist.
In einem konservativen Vektorfeld hängt also die Arbeit nicht vom Weg, sondern nur von dessen
Anfangs- und Endpunkt ab. Insbesondere ist die Arbeit, welche ein konservatives Vektorfeld
längs eines geschlossenen Weges leistet, immer Null. Diese Eigenschaft charakterisiert konservative Vektorfelder sogar, wie der folgende Satz besagt.
Satz 1 Ein Vektorfeld v ist genau dann konservativ, wenn für alle geschlossenen Wege W die
Arbeit von v längs W verschwindet.
Q
−W2
Fig. 1 :
Geschlossene Wege und
konservative Vektorfelder
W1
W2
P
Beweis Es ist zu zeigen, dass für beliebige zwei Punkte P und Q und zwei beliebige Wege W1
68
U. Stammbach: Analysis, Teil B
und W2 von P nach Q gilt (siehe Figur 1):
Z
W1
~v · d~r =
Z
W2
~v · d~r .
Nun ist aber der Weg W1 + (−W2 ) ein geschlossener von P ausgehender und nach P zurückkehrender Weg. Deshalb gilt
Z
0=
W1 +(−W2 )
~v · d~r =
Z
W1
~v · d~r +
Z
−(W2 )
~v · d~r =
Z
W1
~v · d~r −
Z
W2
~v · d~r ,
woraus sich die Behauptung unmittelbar ergibt.
Zusammenhang mit grad
Wir betrachten hier ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z), welches sich als Gradientenfeld
schreiben lässt, d.h. es gibt eine Funktion f : (x, y, z) → f (x, y, z) mit
~v = grad f .
Die Funktion f heisst in diesem Zusammenhang oft Potential und das Vektorfeld ~v ein Potentialfeld. Wir behaupten als erstes, dass ein solches Feld automatisch konservativ ist. Um
dies einzusehen, betrachten wir einen von P nach Q führenden Weg W . Dieser werde durch die
~ = (xP , yP , zP ) und ~r(tQ ) = OQ
~ = (xQ , yQ , zQ )
Parameterdarstellung t → ~r(t) mit ~r(tP ) = OP
beschrieben. Die Arbeit von ~v längs W ist dann gegeben durch
Z
W
~v · d~r =
=
=
=
Z
grad f · d~r
W
Z tQ
tP
Z tQ
tP
Z tQ
tP
(fx , fy , fz ) · ~r˙ (t) dt
(fx ẋ(t) + fy ẏ(t) + fz ż(t)) dt
d
f (x(t), y(t), z(t)) dt
dt
t
= [f (x(t), y(t), z(t))] tQ
P
= f (xQ , yQ , zQ ) − f (xP , yP , zP ) .
Also ist die Arbeit nur von Anfangs- und Endpunkt des Weges (und nicht vom Verlauf des Weges
selbst) abhängig. Folglich ist das Vektorfeld ~v konservativ.
Von dieser Tatsache gilt nun auch die Umkehrung, so dass wir den folgenden Satz aussprechen
können.
69
Kapitel VI. Vektoranalysis
Satz 2 Genau dann ist das Vektorfeld ~v konservativ, wenn es ein Potentialfeld ist, d.h. wenn
es eine Skalarfunktion f gibt mit ~v = grad f .
Beweis Wir haben bereits gesehen, dass ein Potentialfeld konservativ ist. Wir müssen also
nur noch die Umkehrung zeigen. Es sei also ~v ein konservatives Vektorfeld. Wir suchen eine
Funktion f mit ~v = grad f . Dazu wählen wir als erstes einen festen Punkt P0 in D(~v ). Um den
Funktionswert f (x, y, z) zu definieren, wählen wir einen von P0 nach Q = (x, y, z) führenden
Weg W und setzen
f (x, y, z) =
Z
W
~v · d~r .
Da ~v konservativ ist, hängt der Wert des Integrals nur von Q ab und nicht von der Wahl
des Weges W . Um ~v = grad f zu zeigen, betrachten wir einen von Q = (x, y, z) nach Q0 =
(x+h, y, z) führenden Weg L (siehe Figur 2) und beschreiben ihn durch die Parameterdarstellung
t → (t, y, z) , x ≤ t ≤ x + h .
Q0 = (x + h, y, z)
(z)
Q = (x, y, z)
(y)
(x)
L
Fig. 2 :
Der Weg L
70
U. Stammbach: Analysis, Teil B
Dann gilt
f (x + h, y, z) − f (x, y, z)
h
Z
1
= lim
~v · d~r
h→0 h L
Z
1 x+h
= lim
v1 (t, y, z) dt .
h→0 h x
fx (x, y, z) =
lim
h→0
Nach dem Mittelwertsatz der Integralrechnung gibt es nun ein t∗ zwischen x und x + h mit
Z
x+h
x
v1 (t, y, z) dt = h · v1 (t∗ , y, z) .
Daraus ergibt sich
fx (x, y, z) = lim v1 (t∗ , y, z) = v1 (x, y, z) .
h→0
Analog zeigt man fy = v2 und fz = v3 . Damit ist der Satz 2 bewiesen.
Wir entnehmen unseren Überlegungen die folgende wichtige Tatsache, die die Berechnung der
Arbeit eines Potentialfeldes sehr einfach macht:
Ist ~v ein Gradientenfeld, ~v = grad f , so ist die Arbeit des Vektorfeldes ~v längs eines von P nach
Q führenden Weges gerade gleich der Potentialdifferenz f (xQ , yQ , zQ ) − f (xP , yP , zP ).
Wir merken zu diesem Thema noch Folgendes an: Das Potential f eines Potentialfeldes ~v ist
bis auf eine additive Konstante eindeutig bestimmt. Einerseits ist mit f auch g = f + C ein
Potential von ~v , denn grad f = grad g. Andererseits folgt aus grad f = grad h, dass die
partiellen Ableitungen der Differenz f − h alle verschwinden, d.h. dass f − h eine Konstante ist.
Schliesslich fügen wir an, dass die Niveauflächen der Potentialfunktion f in Anwendungen häufig
Potentialflächen genannt werden; laut Definition sind dies Flächen, zu denen das Vektorfeld
grad f senkrecht verläuft.
Zusammenhang mit rot
Es sei ~v ein Potentialfeld mit Potential f , ~v = grad f . Dann gilt nach den Resultaten in
Abschnitt 2 rot ~v = rot grad f = (0, 0, 0). Es gilt also der Satz
Satz 3 Ist ~v ein Potentialfeld, so ist ~v wirbelfrei, d.h. es gilt rot ~v = (0, 0, 0).
Dieser Satz besagt auch: Ist rot ~v 6= (0, 0, 0), so ist ~v kein Potentialfeld.
71
Kapitel VI. Vektoranalysis
Wir stellen uns auch hier die Frage, ob die Umkehrung von Satz 3 gilt. Dafür haben wir bereits
etwas Vorarbeit geleistet: Vom Vektorfeld ~v des stromdurchflossenen Leiters haben wir einerseits
gezeigt, dass es wirbelfrei ist (Abschnitt 2). Andererseits haben wir in Abschnitt 7 die Arbeit
von ~v längs eines speziellen geschlossenen Weges berechnet und einen von Null verschiedenen
Wert erhalten. Die Aussage unseres Satzes lässt sich also nicht ohne weiteres umkehren; es muss
eine Zusatzvoraussetzung hinzutreten.
Satz 4 Es sei ~v ein Vektorfeld mit rot ~v ≡ (0, 0, 0), dessen Definitionsbereich D(~v ) einfach
zusammenhängend ist. Dann ist ~v ein Potentialfeld.
Wir wollen zuerst die hier neu hinzukommende Voraussetzung erklären. Ein Bereich D, unabhängig davon, was seine Dimension ist, heisst einfach zusammenhängend, wenn sich jeder
geschlossene Weg W in D stetig auf einen Punkt zusammenziehen lässt. Man sieht sehr rasch
an Beispielen, was dieser Begriff intuitiv beschreibt.
Beispiele Die ganze Ebene ist einfach zusammenhängend.
Die Ebene, aus der man einen Punkt P entfernt hat, ist nicht einfach zusammenhängend, denn
eine geschlossene Kurve, die um P herumführt, lässt sich nicht auf einen Punkt zusammenziehen.
Der ganze Raum ist einfach zusammenhängend.
Der ganze Raum, aus dem man einen Punkt entfernt hat, ist einfach zusammenhängend. Beim
Zusammenziehen einer geschlossenen Kurve lässt sich dieser eine Punkt immer vermeiden.
Der ganze Raum, aus dem man eine Gerade entfernt hat, ist nicht einfach zusammenhängend,
denn eine geschlossene Kurve, die um diese Gerade herumführt, lässt sich nicht auf einen Punkt
zusammenziehen.
Dieses letzte Beispiel zeigt, dass der Definitionsbereich des Vektorfeldes des stromdurchflossenen
Leiters nicht einfach zusammenhängend ist: in den Punkten des Leiters ist dieses Vektorfeld
nämlich nicht definiert.
Beweis Wir zeigen, dass für jeden geschlossenen Weg W in D(~v ), die Arbeit von ~v längs W
verschwindet. Da D(~v ) einfach zusammenhängend ist, lässt sich unser Weg W auf einen Punkt
zusammenziehen. Dabei überstreicht der Weg ein Flächenstück S, auf das wir jetzt den Satz
von Stokes anwenden. Es ergibt sich
Z
W
~v d~r =
ZZ
S
rot ~v · ~n dO = 0 .
Da dies für alle geschlossenen Wege gilt, folgt, dass ~v konservativ und deshalb ein Potentialfeld
ist.
Beispiel
Ist ~v ein Coulombfeld,
~v = −C
~r
,
r3
72
U. Stammbach: Analysis, Teil B
so ist rot ~v = (0, 0, 0) und der Definitionsbereich D(~v ) einfach zusammenhängend. Nach Satz
4 ist
v = grad f , wobei f das durch f (x, y, z) =
p also ~v ein Potentialfeld. In der Tat ist ~
2
2
2
C/ x + y + z gegebene Potential ist.
Wir wollen zum Schluss dieses Abschnittes noch auf eine Beziehung zu den sogenannten Integrabilitätsbedingungen (Kapitel IV, Abschnitt 7) hinweisen. Diese Integrabilitätsbedingungen
sind bei der Frage aufgetaucht, wann es zu gegebenen Funktionen
ϕ : (x, y, z) → ϕ(x, y, z) , ψ : (x, y, z) → ψ(x, y, z) , χ : (x, y, z) → χ(x, y, z)
eine Funktion f : (x, y, z) → f (x, y, z) gibt mit
fx ≡ ϕ , fy ≡ ψ , fz ≡ χ .
Diese Frage lässt sich offenbar auch so formulieren: Es sei das Vektorfeld ~v = (ϕ, ψ, χ) gegeben.
Wann gibt es eine (Potential-)Funktion f mit grad f = ~v = (ϕ, ψ, χ)? Auf diese Formulierung
können wir jetzt unseren Satz 3 anwenden: Ist der (gemeinsame) Definitionsbereich D von
ϕ, ψ, χ einfach zusammenhängend und ist ~v wirbelfrei, so exisiert die Funktion f . Nun gilt
rot ~v = (χy − ψz , ϕz − χx , ψx − ϕy ) .
Soll also ~v wirbelfrei sein, so ergeben sich die Bedingungen
χy ≡ ψz , ϕz ≡ χx , ψx ≡ ϕy .
Dies sind gerade die damals besprochenen Integrabilitätsbedingungen.
Teil C
Kapitel VII. Gewöhnliche Differentialgleichungen
Kapitel VIII. Potenzreihen
Anhang.
Komplexe Zahlen
Die Zeiten sind vorbei, wo die relative Stabilität der
Lebensform, die Langsamkeit der Verwandlung es
möglich machten, mit dem so viel gerühmten gutgefüllten “Schulsack” die Zeit der Ausbildung hinter
sich zu lassen. Die Zeit ist vorüber, wo in den vielen
Berufen das einmal Erlernte ein Leben lang genügte
und wo sich leicht das wenige Neue im Laufe der
Jahre eingliederte.
Adolf Portmann
Inhaltsverzeichnis, Teil C
Kapitel VII. Gewöhnliche Differentialgleichungen
1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
3
Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . .
17
4
Separierbare Differentialgleichungen
. . . . . . . . . . . . . . . . . . . . . . . . .
25
5
Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
6
Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . .
48
7
Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . .
57
8
Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . .
64
9
Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . .
72
10
Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . .
83
11
Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
12
Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102
13
Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107
14
Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Kapitel VIII. Potenzreihen
1
Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . .
3
2
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
3
Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
4
Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
5
Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Anhang. Komplexe Zahlen
1
Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . .
11
3
Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
Sachverzeichnis
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel VII.
Gewöhnliche Differentialgleichungen
Something big is coming up!
James Bond 007
(zitiert in H. Heuser: Gewöhnliche Differentialgleichungen, Teubner Verlag)
Inhaltsverzeichnis
1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
(a)
Ungestörtes Wachstum . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
(b)
Abklingvorgänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
(c)
Einschalten eines elektrischen Stromes . . . . . . . . . . . . . . . . . . . .
11
(d)
Freier Fall mit Reibung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3
Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . .
17
4
Separierbare Differentialgleichungen
. . . . . . . . . . . . . . . . . . . . . . . . .
25
5
Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
6
Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . .
48
7
Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . .
57
8
Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . .
64
9
Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . .
72
(a)
Homogene lineare Differentialgleichungen . . . . . . . . . . . . . . . . . .
72
(b)
Inhomogene lineare Differentialgleichungen . . . . . . . . . . . . . . . . .
76
Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . .
83
(a)
Homogene lineare Differentialgleichungen mit konstanten Koeffizienten . .
83
(b)
Homogene Eulersche Differentialgleichungen . . . . . . . . . . . . . . . . .
86
11
Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
12
Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102
13
Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107
14
Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
10
3
Kapitel VII. Differentialgleichungen
1
Einleitung
Der Zustand eines physikalischen (chemischen etc.) Systems wird durch eine Anzahl von Zustandsgrössen beschrieben (Druck, Lage, Geschwindigkeit, Stromstärke etc.), seine zeitliche Entwicklung durch entsprechende Funktionen der Zeit. Zwischen diesen Zustandsgrössen gibt es
i.a. Beziehungen. Zum Beispiel sind Druck, Volumen und Temperatur einer festen Menge Gases
durch die Zustandsgleichung des Gases miteinander verbunden. Die wissenschaftliche Erfahrung
zeigt nun, dass es oft leichter ist, die zeitliche Änderung einer Zustandsgrösse, das heisst also
deren Ableitung nach der Zeit durch die übrigen Grössen und deren zeitlichen Ableitungen zu
beschreiben, als diese Zustandsgrössen selbst. Ein konkretes Beispiel zu diesem Sachverhalt
liefert das Newton’sche Gesetz (siehe Figur 1). Zwar sind für einen Massenpunkt der Ort x(t),
und die Geschwindigkeit v(t) zur Zeit t nicht auf einfache Weise mit den relevanten weiteren
Zustandsgrössen ‘Kraft’, ‘Masse’ verbunden. Wohl aber ist bekanntlich die Beschleunigung,
Fig. 1 :
Zum Newton’schen Gesetz
K
0
m
(x)
d.h. die zeitliche Ableitung v̇(t) der Geschwindigkeit, bzw. die zweite zeitliche Ableitung ẍ(t)
des Ortes eine einfache Funktion der auf den Massenpunkt wirkenden Kraft. Dieser Sachverhalt
wird nach Newton durch die Differentialgleichung
4
(1.1)
U. Stammbach: Analysis, Teil C
mẍ = K
oder durch das Differentialgleichungssystem
(1.2)
ẋ = v
mv̇ = K
beschrieben.
Mathematisch ist an dieser Stelle wichtig, dass die Differentialgleichung (2.1) bzw. das Differentialgleichungssystem (2.2) die Funktion t → x(t) im wesentlichen beschreibt.
In der Tat haben wir bereits in der Analysis I oft darauf hingewiesen, dass Funktionen durch
Differentialgleichungen beschrieben werden können. Im Kapitel II, Abschnitt 5 haben wir zum
Beispiel die einfache Differentialgleichung
(1.3)
y 0 = ay, a ∈ R
untersucht und gefragt, welche Funktionen y : x → y(x) Lösungen dieser Differentialgleichung
sind. Wir haben damals gesehen, dass notwendigerweise
(1.4)
y(x) = C · eax
gelten muss, wobei C eine beliebige Konstante ist. Die Differentialgleichung (2.3) beschreibt
also nicht nur eine Funktion sondern eine ganze Klasse oder – wie man sagt – eine ganze Schar
von Funktionen, die durch die Formel (2.4) mit C als Scharparameter gegeben wird. Diese Schar
heisst die allgemeine Lösung der Differentialgleichung.
Auf ähnliche Art liefert die Differentialgleichung (2.1) nicht nur eine mögliche Lösung für die
Funktion t → x(t), sondern sie beschreibt sämtliche Bewegungen des Massenpunktes, die unter
den betrachteten physikalischen Bedingungen überhaupt möglich sind. Offensichtlich unterscheiden sich die verschiedenen Lösungen dadurch, dass sie zu verschiedenen Anfangsbedingungen
x(0), ẋ(0) gehören. Auch die Differentialgleichung (2.1) beschreibt somit eine ganze Schar von
Funktionen, wobei hier offenbar zwei Scharparameter auftreten.
5
Kapitel VII. Differentialgleichungen
Das Thema des vorliegenden Kapitels ist es, den Zusammenhang zwischen einer Differentialgleichung und ihrer allgemeinen Lösung näher zu untersuchen.
In konkreten Anwendungsbeispielen interessiert bei Differentialgleichungen zumeist eine spezielle Lösung, nämlich diejenige, die zusätzlich gegebene (Anfangs-)Bedingungen erfüllt. Im
Falle der Differentialgleichung (2.3) kann diese zusätzliche Bedingung darin bestehen, dass der
Funktionswert y(0) festgelegt ist:
(1.5)
y(0) = A .
Damit ist die Lösungsfunktion der Differentialgleichung (2.3) eindeutig bestimmt; es gilt
(1.6)
y(x) = A · eax .
Wie wir oben gesehen haben, wird im Falle der Differentialgleichung (2.1) die zusätzliche Bedingung am natürlichsten in der Angabe von Ort und Geschwindigkeit des Massenpunktes zur
Zeit 0 bestehen:
(1.7)
x(0) = x0 ; ẋ(0) = v(0) = v0 .
Die physikalische Anschauung zeigt, dass durch die Vorgabe der Grössen x0 und v0 die Funktion
t → x(t) eindeutig bestimmt sein muss.
Wir merken hier bereits an, dass die Grössen A in (2.5) und die Grössen x0 , v0 in (2.7) offenbar
beliebige reelle Zahlen sein dürfen. Dies illustriert einen ganz allgemeinen mathematischen Satz
über die Lösungen von Differentialgleichungen (siehe Abschnitt 3).
Als nächstes wollen wir hier die Terminologie genau festlegen.
Unter einer gewöhnlichen Differentialgleichung für die Funktion y : x → y(x) verstehen wir
einen Ausdruck der Form
(1.8)
F (x, y, y 0 , y 00 , . . . , y (n) ) = 0 .
6
U. Stammbach: Analysis, Teil C
Die Funktion y : x → y(x) heisst Lösung der Differentialgleichung (2.8), wenn für alle x ∈ D(y)
gilt
F x, y(x), y 0 (x), . . . , y (n) (x)
≡ 0,
d.h. wenn beim Einsetzen die Gleichung identisch in x erfüllt ist. Die Ordnung der höchsten in
(2.8) vorkommenden Ableitung heisst Ordnung der Differentialgleichung.
Beispiel
(1.9)
Ist ω eine fest vorgegebene reelle Zahl, so ist
y 00 + ω 2 y = 0
eine Differentialgleichung zweiter Ordnung. Die Funktion
x → A cos(ωx) + B sin(ωx)
ist für jede Wahl der reellen Grössen A, B eine Lösung der Differentialgleichung (2.9).
Wir merken abschliessend noch an, dass wir hier nur sogenannte gewöhnliche Differentialgleichungen betrachten. Diese unglückliche, aber üblich gewordene Ausdrucksweise besagt, dass nur
von Funktionen einer einzigen Variablen die Rede ist. Es sind daneben natürlich auch Differentialgleichungen für Funktionen von mehreren Variablen denkbar, welche partielle Ableitungen
enthalten. Solche Differentialgleichungen heissen partiell. Ein Beispiel dafür ist die früher schon
betrachtete Wellengleichung. Dabei werden Funktionen u : (x, t) → u(x, t) gesucht, welche die
(partielle) Differentialgleichung
utt = c2 uxx
erfüllen (siehe Kapitel IV, Abschnitt 8). Mit solchen partiellen Differentialgleichungen, deren
mathematische Behandlung sehr viel schwieriger ist als die der gewöhnlichen Differentialgleichungen, beschäftigt sich die Lehrveranstaltung Analysis III.
7
Kapitel VII. Differentialgleichungen
2
Einige Beispiele
Wir wollen in diesem Abschnitt in einigen konkreten Situationen die dazugehörigen Differentialgleichungen herleiten und versuchen, bereits an dieser Stelle etwas über deren Lösung
auszusagen.
(a)
Ungestörtes Wachstum
Man stelle sich eine Bakterienkultur oder ganz allgemein eine Population vor, welche im gleichen Zeitraum stets um den gleichen Prozentsatz wächst; man nennt dies ungestörtes, ideales
Wachstum. Im Zeitintervall 4t nimmt die Masse m(t) (als Mass der Grösse der Population) um
4m = p(4t) · m
zu. Daraus folgt
4m
p(4t)
=
m
4t
4t
und durch Grenzübergang für 4t → 0 erhält man
(2.1)
dm
= a·m ,
dt
wobei wir
a =
p(4t)
4 t→0 4t
lim
8
U. Stammbach: Analysis, Teil C
gesetzt haben. Da die Population mit der Zeit zunimmt, ist a eine positive Zahl. Wie bereits in
der Einleitung erwähnt, wissen wir aus der Analysis I, dass jede Funktion m : t → m(t), welche
die Differentialgleichung (3.1) erfüllt, von der Form
m(t) = C · eat
(2.2)
ist. In diesem Beispiel ist die natürliche Anfangsbedingung die, dass die Anfangsmasse m0 ,
m(0) = m0 ,
gegeben ist. Die gesuchte Funktion ist somit (siehe Figur 1)
m(t) = m0 eat .
(2.3)
(y)
Fig. 1 :
Ungestörtes Wachstum
m0 eax
x → y(x) = m0 eax
m0
(x)
9
Kapitel VII. Differentialgleichungen
Andere Beispiele, die durch dieses Modell, d.h. durch die Differentialgleichung (3.1) mit a > 0
beschrieben werden, sind: Wirtschaftswachstum, Zunahme des Energieverbrauches, Geldanlage,
jeweils mit konstantem Prozent- bzw. Zins-Satz.
(b)
Abklingvorgänge
In diesem Beispiel sei y(t) eine Grösse, welche im gleichen Zeitraum stets um denselben Prozentsatz abnimmt. Man erhält dann mit der analogen Überlegung wie unter (a) offenbar
(2.4)
dy
= −ky
dt
mit k > 0. Der Proportionalitätsfaktor −k ist negativ. Wie oben gilt
(2.5)
y(t) = C · e−kt .
Lautet die Anfangsbedingung
y(t0 ) = y0 ,
(zur Zeit t0 sei die Grösse y gerade y0 ), so erhält man als Lösung (siehe Figur 2)
(2.6)
y(t) = y0 · e−k(t−t0 ) .
Dieses Modell beschreibt zum Beispiel die Abkühlung eines Gegenstandes in einem Wärmereservoir von konstanter Temperatur. Die Grösse y(t) ist in diesem Fall die Temperaturdifferenz
zwischen Gegenstand und Wärmereservoir.
Ebenso tritt die Differentialgleichung (3.4) beim radioaktiven Zerfall auf. In diesem Fall ist die
Grösse y(t) die zur Zeit t vorhandene aktive Masse. In diesem letzten Beispiel, aber häufig auch
in den anderen spricht man von der Halbwertszeit; dies ist die Zeit τ , in der die Grösse y auf
die Hälfte abnimmt (siehe Figur 3). Es gilt also
10
U. Stammbach: Analysis, Teil C
(y)
Fig. 2 :
Abklingvorgang
t → y(t) = y0 e−k(t−t0 )
(t0 , y0 )
t0
(t)
(y)
y0
Fig. 3 :
Halbwertszeit
1
2 y0
τ
11
Kapitel VII. Differentialgleichungen
y(τ ) =
(2.7)
1
y(0) .
2
Da laut Voraussetzung die Grösse y(t) im selben Zeitraum immer um denselben Prozentsatz
abnimmt, muss τ von der Lage des (Zeit-)Nullpunktes unabhängig sein. Einsetzen von (3.7)
liefert
1
y0 = y0 e−kτ ,
2
woraus man erhält
τ =
(c)
log 2
.
k
Einschalten eines elektrischen Stromes
Es sei ein Schaltkreis mit einem Ohm’schen Widerstand R und einer Selbstinduktion L gegeben.
Gesucht ist die Stromstärke I(t) zur Zeit t, wenn zur Zeit t = 0 an den Schaltkreis eine konstante
Spannung U angelegt wird (siehe Figur 4). Die Physik sagt, dass die Funktionen I : t → I(t)
der Differentialgleichung
(2.8)
L
dI
= −R I + U
dt
genügt. Setzen wir f (t) = I(t) − U/R, so folgt aus (3.8)
(2.9)
df
R
= − f .
dt
L
Wir sehen, dass f einer Differentialgleichung genügt, die der Differentialgleichung (3.4) entspricht. Danach erhalten wir
(2.10)
I(t) − U/R = f (t) = C · e−(R/L) t .
12
U. Stammbach: Analysis, Teil C
R
Fig. 4 :
Einschaltvorgang in einem
elektrischen Schaltkreis
L
U (t)
Fig. 5 :
Einschaltvorgang; verschiedene
Anfangsbedingungen
I(t)
U/R
t→
(t)
R
U
+ Ce− L t
R
13
Kapitel VII. Differentialgleichungen
U/R
Fig. 6 :
Einschaltvorgang; verschiedene
Werte des Parameters L
t→
I(t)
R
U
1 − e− L t
R
(t)
Setzt man die Anfangsbedingung I(0) = 0 ein, so erhält man (siehe Figuren 5,6)
(2.11)
R
U
I(t) =
1 − e− L t
R
.
Es ist klar, dass beim Ausschalten ein entsprechender Vorgang abläuft.
(d)
Freier Fall mit Reibung
Ein Massenpunkt der Masse m falle unter dem Einfluss der Schwerkraft; sein Fall werde gebremst durch eine zur Geschwindigkeit proportionalen Kraft (siehe Figur 7). Zur Zeit t = 0 sei
x(0) = 0, ẋ(0) = 0 . Nach Newton gilt für die Ortsfunktion t → x(t) des Massenpunktes die
Differentialgleichung
14
U. Stammbach: Analysis, Teil C
0
Fig. 7 :
Freier Fall mit Reibung
−aẋ
m
mg
(x)
(2.12)
m ẍ = m g − a ẋ .
Dies ist, im Unterschied zu den oben behandelten Beispielen, eine Differentialgleichung zweiter
Ordnung. Setzen wir ẋ(t) = v(t) , so erhalten wir
(2.13)
m v̇ = m g − a v .
Diese Differentialgleichung erster Ordnung für t → v(t) entspricht offenbar genau der Differentialgleichung (3.8), wenn v(t) durch I(t), g durch U/L und a/m durch R/L ersetzt wird. Wir
können deshalb die Lösung von (3.13) dem vorhergehenden Problem entnehmen; (3.10) liefert
v(t) =
a
mg
+ C · e− m t .
a
Die Anfangsbedingung v(0) = 0 bestimmt C; wir erhalten (siehe Figur 8)
15
Kapitel VII. Differentialgleichungen
(v)
mg
a
v(t)
Fig. 8 :
Freier Fall mit Reibung; die
Geschwindigkeitfunktion
(t)
(x)
Fig. 9 :
Freier Fall mit Reibung; die
Ortsfunktion mit Asymptote
x(t)
mg
m
x(t) =
t−
a
a
(t)
16
(2.14)
U. Stammbach: Analysis, Teil C
a mg 1 − e− m t .
a
v(t) =
Die Ortsfunktion x(t) berechnet man aus
ẋ(t) = v(t)
durch einfache Integration. Es ergibt sich
(2.15)
x(t) =
mg
m2 g − a t
e m + D.
t +
a
a2
Die Anfangsbedingung x(0) = 0 liefert schliesslich (siehe Figur 9)
D = −
m2 g
.
a2
Die oben beschriebenen Beispiele zeigen, dass die Mathematik mit den Differentialgleichungen
ein sehr effizientes Werkzeug bereitstellt, um Modellvorstellungen mathematisch zu beschreiben.
Es ist dabei interessant festzustellen, dass ein- und dasselbe Modell, d.h. also ein- und dieselbe
Differentialgleichung in ganz verschiedenen Fachgebieten auf natürliche Weise auftaucht. Weiss
man über die Lösungsfunktionen der entsprechenden Differentialgleichung Bescheid, so kann
die Modellvorstellung im Experiment geprüft werden, und es kann entschieden werden, ob sie
“richtig” oder “falsch” ist. Im Zusammenhang mit diesen Wörtern ist es vielleicht angebracht
anzumerken, dass mit “richtig” und “falsch” hier keine absolute Wertung vorgenommen wird.
Vielmehr stellt das Experiment ja nur fest, in welchen Grenzen eine Modellvorstellung zu brauchbaren, d.h. für den verfolgten Zweck genügend genauen Resultaten führt.
17
Kapitel VII. Differentialgleichungen
3
Die allgemeine Lösung einer Differentialgleichung 1. Ordnung
Im letzten Abschnitt haben wir gesehen, dass in Anwendungen oft Funktionen der Zeit gesucht
sind, welche durch Differentialgleichungen beschrieben werden. In der Mathematik ist es üblich
geworden, nicht t, sondern x als Name für die Variable zu benutzen und die gesuchte Funktion
durch y : x → y(x) zu beschreiben. Wir wollen uns hier in der allgemeinen Theorie an diese
historisch bedingte Konvention halten. Wir gehen aus von einer Differentialgleichung erster
Ordnung für y : x → y(x) , von welcher wir annehmen, dass sie in der Form
y 0 = f (x, y)
(3.1)
(y)
(x)
Fig. 1 :
Richtungsfeld der
Differentialgleichung
y 0 = x2 + y 2
vorliegt. Anschaulich besteht eine solche Differentialgleichung darin, dass in jedem Punkt des
Definitionsbereiches D(f ) die Steigung der durch diesen Punkt gehenden Lösungskurve festgelegt
wird. (Unter einer Lösungskurve verstehen wir natürlich den Graphen einer Lösungsfunktion).
18
U. Stammbach: Analysis, Teil C
Trägt man diese Richtungen in ein (x, y)-Koordinatensystem ein, so erhält man das Richtungsfeld der Differentialgleichung.
Beispiel Es sei y 0 = x2 + y 2 (siehe Figur 1).
Es wird mit diesem Beispiel klar, dass der Verlauf der Lösungskurven einer Differentialgleichung in grober Näherung aus dem Richtungsfeld abgelesen werden kann. Dies ist im Grunde
genommen die Basis von vielen numerischen Verfahren zur Lösung von Differentialgleichungen.
Plausibel wird damit auch der allgemeine mathematische Satz, welcher über die Existenz und
Eindeutigkeit der Lösung einer Differentialgleichung der Form (4.1) Auskunft gibt.
(y)
(x0 , y0 )
Fig. 2 :
Existenz und Eindeutigkeit
der Lösung einer Differentialgleichung erster Ordnung
y(x)
D(f )
x0
(x)
Satz 3.1 Es sei f : (x, y) → f (x, y) in D(f ) stetig und nach y stetig partiell differenzierbar.
Dann gibt es durch jeden Punkt (x0 , y0 ) im Innern von D(f ) genau eine Lösungskurve für die
Differentialgleichung y 0 = f (x, y) . D.h. es gibt eine eindeutig bestimmte, in einem Intervall
mit Mittelpunkt x0 definierte Funktion x → y(x), welche Lösung der Differentialgleichung y 0 =
f (x, y) ist und die Anfangsbedingung y(x0 ) = y0 erfüllt.
Natürlich verzichten wir in dieser Vorlesung auf den Beweis dieses allgemeinen Satzes. Wir
weisen aber darauf hin, dass seine Aussage für alles Folgende grundlegend ist.
19
Kapitel VII. Differentialgleichungen
Beispiel Im Falle der einfachen Differentialgleichung
y0 = a y
(3.2)
ergibt sich die Aussage des Satzes aus der Tatsache (die in der Analysis I bewiesen worden ist),
dass jede Lösung der Differentialgleichung (4.2) von der Form
(y)
Fig. 3 :
Richtungsfeld und
Lösungskurven der
Differentialgleichung
y 0 = ay
(x)
x → y(x) = C · eax
ist. Die Anfangsbedingung y(x0 ) = y0 bestimmt dann eindeutig die Konstante C, so dass
y(x) =
y0 · e−ax0 · eax
die durch den Punkt (x0 , y0 ) verlaufende Lösungskurve beschreibt (siehe Figur 3).
Natürlich kennt der Mathematiker Verschärfungen des Satzes 3.1; inbesondere kann er über die
Grösse des Definitionsintervalles der gesuchten Funktion weitere Aussagen machen. Dies soll
20
U. Stammbach: Analysis, Teil C
uns hier nicht weiter interessieren. Hinweisen möchten wir aber speziell auf den Teil des Satzes,
welcher von der Eindeutigkeit der Lösung handelt. Das untenstehende Beispiel zeigt, dass erst
die etwas aus dem Rahmen fallende Voraussetzung über die partielle Ableitung von f nach y
die Eindeutigkeit der Lösung erzwingt. Nun hat aber gerade diese Eindeutigkeit viele wichtige
Konsequenzen, welche der Anfänger gerne übersieht. Zum Beispiel ist es ja erst aufgrund dieser
Tatsache überhaupt möglich, die Lösungskurven durch den vorgegebenen Punkt (x0 , y0 ) etwa
mit Hilfe numerischer Verfahren zu berechnen; wäre die Lösungskurve nicht eindeutig bestimmt,
so müssten numerische Lösungsverfahren naturgemäss versagen (oder wesentlich komplizierter
konzipiert sein). Auch für den Praktiker ist also die volle Schärfe des Satzes 3.1 von Interesse.
Beispiel Es sei die Differentialgleichung
y0 =
(3.3)
q
3
y2
(y)
Fig. 4 :
Nichteindeutigkeit der Lösungen
der Differentialgleichung
(x)
gegeben. Die Funktion f (x, y) =
nach y,
p
3
y0 =
q
3
y2
y 2 ist in der ganzen Ebene definiert. Die partielle Ableitung
fy (x, y) =
2 −1/3
y
3
21
Kapitel VII. Differentialgleichungen
existiert aber für Punkte der x-Achse nicht. Damit ist die Voraussetzung des Satzes in diesen
Punkten verletzt und in der Tat gilt die Aussage des Satzes für Anfangsbedingungen der Form
y(x0 ) = 0 nicht. Um dies einzusehen, stellt man fest, dass offenbar jede Funktion der Form
(3.4)
x → y(x) =
x−C
3
3
,
C∈R
die Differentialgleichung erfüllt. Ferner erfüllt auch die Nullfunktion y ≡ 0 die Differentialgleichung. Durch jeden Punkt der x-Achse gibt es somit unendlich viele Lösungskurven. (Weshalb
“unendlich viele” und nicht nur “zwei”?) Natürlich gilt die Aussage des Satzes, wenn man die
Differentialgleichung (4.3) in einem Gebiet betrachtet, welches die x-Achse ausschliesst (siehe
Figur 4).
Als Anwendung unseres Satzes betrachten wir zuerst die folgende allgemeine Situation. Es sei
~v : (x, y) → ~v (x, y)
ein ebenes Vektorfeld.
Es sei P = (x0 , y0 ) ein Punkt des Definitionsbereiches D(~v ) von ~v . Wir stellen die durch P
gehenden Feldlinien des Vektorfeldes ~v als Graph einer Funktion y : x → y(x) dar. Es gilt
also y(x0 ) = y0 , und der Zeichnung (siehe Figur 5) entnehmen wir, dass in jedem Punkte der
Feldlinien gilt
y 0 (x) =
v2 (x, y(x))
.
v1 (x, y(x))
Dies besagt, dass die Funktion y : x → y(x) Lösung der Differentialgleichung
(3.5)
y0 =
v2 (x, y)
v1 (x, y)
ist. Unser allgemeiner Satz liefert die Aussage, dass durch jeden Punkt (x0 , y0 ) genau eine
Feldlinie des Vektorfeldes ~v verläuft, falls die auf der rechten Seite der Gleichung (4.5) stehende
Funktion von x und y stetig ist und nach y stetig partiell differenzierbar ist. Insbesondere muss
natürlich gelten v1 (x, y) 6= 0 .
Beispiel Das Vektorfeld ~v sei gegeben durch ~v (x, y) = (y, x) . Die Differentialgleichung der
Feldlinien lautet somit
22
U. Stammbach: Analysis, Teil C
(y)
v2
Fig. 5 :
Feldlinien eines Vektorfeldes
v1
(x)
y0 =
x
.
y
Schreiben wir diese Gleichung für x → y(x) in der Form
y(x) y 0 (x) = x ,
so erhalten wir durch Integration nach x
1 2
1
y = x2 + C ,
2
2
wobei C eine Integrationskonstante ist. Es gilt also die Beziehung
y 2 − x2 = 2 C .
23
Kapitel VII. Differentialgleichungen
Die Feldlinie durch den Punkt (x0 , y0 ) erfüllt zusätzlich die Bedingung y02 − x20 = 2C , so dass
wir dafür die Gleichung
y 2 − x2 = y02 − x20
erhalten. Für jeden Punkt (x0 , y0 ) mit Ausnahme der Punkte der x-Achse sind die Voraussetzungen unseres Satzes erfüllt, und unser Satz liefert genau eine Feldlinie, welche durch (x0 , y0 )
geht.
Die Menge aller Lösungen einer Differentialgleichung
(3.6)
y 0 = f (x, y)
heisst deren allgemeine Lösung. Wiederum ist Terminologie historisch bedingt, sie ist aus heutiger Sicht ziemlich unglücklich. – Nach unserem Satz 3.1 gibt es unter den dort angegebenen
Voraussetzungen zu jeder Anfangsbedingung y(x0 ) = y0 eine eindeutig bestimmte Lösung. Geometrisch bedeutet dies, dass es zu jedem Punkt (x0 , y0 ) eine eindeutig bestimmte Lösung der
Differentialgleichung (3.6) gibt, deren Graph durch diesen Punkt geht. Der allgemeinen Lösung
der Differentialgleichung entspricht folglich eine Schar von Kurven. Halten wir x0 fest, so sind
die einzelnen Kurven dieser Schar durch den einzigen Parameter C = y0 festgelegt; durch jeden
Punkt geht genau eine Kurve der Schar. Eine einparametrige Kurvenschar mit dieser Eigenschaft heisst auch etwa regulär . Unter den Bedingungen unseres Satzes ist somit die Schar der
Lösungskurven der Differentialgleichung y 0 = f (x, y) eine einparametrige reguläre Kurvenschar.
Umgekehrt kann man fragen, ob zu einer gegebenen einparametrigen Kurvenschar eine Differentialgleichung 1. Ordnung existiert, die diese Schar als Lösungskurven besitzt. Unter sehr
allgemeinen Voraussetzungen, auf die wir hier nicht eingehen, ist dies in der Tat der Fall. Wir
illustrieren den Sachverhalt an einem Beispiel.
Beispiel Gegeben sei die Schar der Kreise, welche die x-Achse in 0 berühren (siehe Figur 6).
Wählen wir den Radius C als Parameter, so stellt sich diese Schar durch die Gleichung
(3.7)
dar. Daraus erhält man sofort
x2 + (y − C)2 = C 2
24
U. Stammbach: Analysis, Teil C
(y)
Fig. 6 :
Die Schar der Kreise, welche die
x-Achse im Ursprung berühren
(x)
(3.8)
x2 + y 2 − 2 C y = 0 .
In der Umgebung eines Punktes (x0 , y0 ) werde der durch diesen Punkt gehende Kreis als Graph
der Funktion y : x → y(x) beschrieben. Dann folgt mit Ableitung nach x
(3.9)
2x + 2yy 0 − 2Cy 0 = 0 .
Elimination von C aus (4.8) und (4.9) liefert die von C unabhängige, d.h. für alle Kurven der
Schar gültige Beziehung
(3.10)
y0 =
2xy
.
− y2
x2
Dies ist die Differentialgleichung, welche die Kurvenschar (4.7) als allgemeine Lösung besitzt;
man sagt kurz, es ist die Differentialgleichung der Kurvenschar (4.7). Dies kann man entweder
durch Auflösen von (4.7) nach y und Einsetzen in (4.10) verifizieren oder durch direktes Lösen
der Differentialgleichung (4.10). Für letzteres liefert der nächste Abschnitt die Grundlagen.
25
Kapitel VII. Differentialgleichungen
4
Separierbare Differentialgleichungen
Es sollte aus der bisherigen Diskussion über konkrete Beispiele bereits klar geworden sein, dass
beim Lösen von Differentialgleichungen nicht fest vorgeschriebene Methoden im Vordergrund
stehen. Vielmehr kommt dem geschickten Vorgehen eine grosse Bedeutung zu. Man vergleiche dazu etwa den Lösungsgang im Beispiel (c) Abschnitt 2, wo durch eine Substitution die
gegebene Differentialgleichung auf eine einfachere zurückgeführt wird. Ferner muss hier betont
werden, dass viele, auch einfach aussehende Differentialgleichungen nicht elementar lösbar sind;
dies bedeutet (wie bei den unbestimmten Integralen), dass die Lösungsfunktion, obschon sie
natürlich nach unserem Satz 3.1 existiert, nicht durch elementare Funktionen ausdrückbar ist.
Als Beispiel erwähnen wir die Differentialgleichung y 0 = x2 + y 2 , deren Richtungsfeld wir in
Abschnitt 3 aufgezeichnet haben; sie ist – wie man zeigen kann – nicht elementar lösbar. Man ist
in diesen Fällen auf andere Verfahren, zum Beispiel auf Verfahren der numerischen Mathematik
angewiesen. – Im vorliegenden Abschnitt wollen wir die Klasse der separierbaren Differentialgleichungen besprechen. Deren Behandlung ist insofern leicht, als sich die Lösungsfunktionen ohne
viel Mühe durch gewöhnliche Integrale beschreiben lassen. Ferner betrachten wir Differentialgleichungen, welche durch eine einfache Operation auf separierbare zurückgeführt werden können.
Hat die Differentialgleichung die Form
y0 =
(4.1)
g(x)
h(y)
so heisst sie separierbar. Diese Terminologie orientiert sich an der einfachen Tatsache, dass
(5.1) in der Form
h(y) · y 0 = g(x)
(4.2)
geschrieben werden kann, in welcher die “Variablen x, y separiert” sind. Ist y : x → y(x) eine
Lösungsfunktion von (5.2) so gilt, identisch in x
h (y(x)) · y 0 (x) = g(x) .
Integration nach x liefert
Z
0
h (y(x)) y (x) dx =
Z
g(x) dx + C
26
U. Stammbach: Analysis, Teil C
und die Substitution y(x) = y, y 0 dx = dy schliesslich
Z
h(y) dy =
Z
g(x) dx + C .
Löst man die so entstehende (gewöhnliche) Gleichung nach y auf, so erhält man die allgemeine
Lösung der Differentialgleichung (5.1) mit C als Parameter.
Der Leser mache sich an dieser Stelle klar, dass die Differentialgleichungen (2.1) und (2.4)
separierbar sind und führe auf Grund dieser Tatsache die Lösung explizit durch.
Als weiteres Beispiel einer separierbaren Differentialgleichung betrachten wir das sogenannte
“logistische Modell für Populationen”. Es handelt sich darum, ein mathematisches Modell für
die Populationen in einem vorgegebenen Gebiet zu liefern, etwa für die Bevölkerungszahl eines
Landes (oder die Rattenpopulation eines Biotops etc.). Wir bezeichnen die Bevölkerungszahl
zur Zeit t mit y(t) . Im Zeitabschnitt 4t lässt sich diese Änderung beschreiben durch
(4.3)
y(t + 4t) − y(t) = (G − T + E − A) 4t ,
wobei die Grössen G, T, E, A der Reihe nach für die Anzahl Geburten, Todesfälle, Einwanderer,
Auswanderer pro Zeiteinheit stehen. Natürlich können diese positiven Grössen im allgemeinen
von t und y abhängig sein. Wir wollen im Folgenden der Einfachheit annehmen, dass E = A, so
dass sich der Effekt der Einwanderung und der Auswanderung auf die Bevölkerungszahl aufhebt.
Für die Grössen G und T wollen wir einfache Modellannahmen treffen. Wenden wir uns zunächst
der Grösse T zu. Die einfachste Annahme besteht natürlich darin, dass die Anzahl Todesfälle T
pro Zeiteinheit proportional zur Bevölkerungszahl y(t) ist
(4.4)
T = a y(t) ,
a>0.
Nun wird aber mit zunehmender Bevölkerungszahl etwa die Nahrungsbeschaffung immer schwieriger, der Stress des Individuums wird grösser, etc. , so dass die Annahme (5.4) in einem verfeinerten Modell durch einen entsprechenden Term korrigiert werden muss. Wir setzen
(4.5)
T = a y(t) + b y 2 (t) ,
a, b > 0 .
Dieser Ansatz erscheint vernünftig, da y 2 (t) ein Mass für die Anzahl der Zusammenstösse von
Individuen pro Zeiteinheit ist. Analog macht man für G die Modellannahme
(4.6)
G = c y(t) − d y 2 (t) ,
c, d > 0 .
27
Kapitel VII. Differentialgleichungen
Die Geburtenzahl pro Zeiteinheit nimmt wegen der oben erwähnten Schwierigkeiten mit wachsendem y(t) unter proportional zu.
Mit diesen Modellannahmen (5.5) und (5.6) erhalten wir die folgende Differentialgleichung für
t → y(t)
y 0 (t) = (c − a) y(t) − (b + d) y 2 (t) .
Setzen wir c − a = α , b + d = β , so folgt (siehe Figur 1)
y0 = α y − β y2.
(4.7)
(y)
Fig. 1 :
Richtungsfeld der logistischen
Differentialgleichung
y 0 = αy − βy 2
(t)
Die Gleichung ist offensichtlich separierbar. Wir erhalten
Z
dy
=
(α − βy)y
Z
dt ,
28
U. Stammbach: Analysis, Teil C
Z
1
dy +
y
Z
β
dy = α
α − βy
Z
dt ,
log |y| − log |α − βy| = αt + C ,
α − βy
= A · e−αt .
y
Dabei haben wir A = ±e−C gesetzt. Auflösen nach y liefert nun die allgemeine Lösung der
Differentialgleichung (5.7)
y(t) =
(4.8)
α
β + A · e−αt
(y)
α/β
Fig. 2 :
Lösungen der
Differentialgleichung
y 0 = αy − βy 2
(t)
Für die Anfangsbevölkerungszahl y(0) = y0 erhält man für den Parameterwert A
A =
α
− β,
y0
29
Kapitel VII. Differentialgleichungen
so dass die zugehörige spezielle Lösung lautet
(4.9)
y(t) =
β+
α
.
α
−αt
−β e
y0
Die Figur 2 zeigt die Lösungskurven für verschiedene Werte von y0 .
Man entnimmt der Formel (5.9) leicht die Tatsache, dass für grosse t der Wert von y(t) gegen
α/β strebt. Es gibt in diesem Modell eine stabile Bevölkerungszahl.
In vielen Fällen lassen sich Differentialgleichungen durch eine Substitution auf einfachere zurückführen. Wir lernen hier einige Typen von Differentialgleichungen kennen, die auf diese Weise
auf separierbare zurückgeführt werden können.
In der Differentialgleichung y 0 = f (x, y) sei die Funktion f (x, y) von der Form g(u), wo u eine
lineare Funktion in x und y ist, u = ax + by + c , a, b, c ∈ R . Setzt man dann u(x) =
ax + b y(x) + c , so erhält man eine separierbare Differentialgleichung für x → u(x) . Wir
verfolgen den Lösungsweg an einem konkreten Beispiel.
(4.10)
y 0 = (2x + 3y)2 .
Setze u(x) = 2x + 3y(x) , d.h. y(x) =
1
3
(u(x) − 2x) . Dann ergibt sich
y 0 (x) =
1 0
u (x) − 2 ,
3
und damit wird (5.10) zu
1 0
(u − 2) = u2 ,
3
u0 = 3u2 + 2 .
Diese Differentialgleichung ist offensichtlich separierbar:
Z
du
=
2 + 3u2
Z
dx ,
30
U. Stammbach: Analysis, Teil C
1
√ arctan
6
r
3
u
2
!
= x + C .
Auflösung nach u liefert
r
√
2
6(x + C) ,
tan
3
und wegen u(x) = 2x + 3y(x) erhält man schliesslich
u =
(y)
(x)
Fig. 3 :
Lösungen der
Differentialgleichung
y 0 = (2x + 3y)2
1
y = y(x) =
3
r
√
2
6(x + C) − 2x
tan
3
!
.
Dies ist die allgemeine Lösung der Differentialgleichung (5.10) (siehe Figur 3).
Ähnliches gilt für Differentialgleichungen y 0 = f (x, y) , wo f (x, y) geschrieben werden kann als
g(u) mit u = y/x . Analog wie oben macht man die Substitution u(x) = y(x)/x und erhält
so eine separierbare Differentialgleichung für die Funktion x → u(x) . Wieder erklären wir den
Lösungsweg an einem konkreten Beispiel:
31
Kapitel VII. Differentialgleichungen
√
x y 0 = y − 2 xy
(4.11)
Diese Differentialgleichung lässt sich in der Form
r
y
y =
−2
x
0
y
x
schreiben. Die rechte Seite ist eine Funktion von u = y/x . Die Substitution u(x) = y(x)/x
liefert y(x) = x · u(x) und damit
y 0 (x) = u(x) + x u0 (x) .
Einsetzen in (5.11) ergibt
√
u + x u0 = u − 2 u ,
√
x u0 = −2 u .
Letztere Differentialgleichung ist separierbar, so dass unser erstes Teilziel erreicht ist. Wir
erhalten weiter
−
Z
1
√ du =
2 u
Z
1
dx ,
x
√
− u = log |x| + C ,
wobei, wie immer, der positive Wert der Wurzel zu nehmen ist, d.h. es ist log |x| + C ≤ 0. Mit
u = y/x folgt nach Quadrieren
y
= (log |x| + C)2 ,
x
y = x (log |x| + C)2 ,
32
U. Stammbach: Analysis, Teil C
(y)
Fig. 4 :
Lösungen der
Differentialgleichung
(x)
√
x y 0 = y − 2 xy
mit log |x| + C ≤ 0. Dies ist die allgemeine Lösung von (5.11) (siehe Figur 4).
Wir betrachten schliesslich in diesem Abschnitt noch das folgende Anwendungsbeispiel. Wir
stellen die Frage, wie ein zur y-Achse rotationssymmetrischer Spiegel geformt sein muss, damit
alle parallel zur y-Achse einfallenden Strahlen in den Nullpunkt des Koordinatensystems reflektiert werden (siehe Figur 5).
Wegen der Rotationssymmetrie genügt es natürlich, die Schnittkurve des Spiegels mit der (x, y)Ebene zu bestimmen, wobei wir uns sogar auf den Teil x ≥ 0 beschränken können. Wir stellen
diese Kurve als Graph einer Funktion x → y(x) , x ≥ 0 dar, und entnehmen der Figur die
Beziehungen
cot α(x) = tan β(x) = y 0 ,
cot (2α(x)) =
y(x)
.
x
33
Kapitel VII. Differentialgleichungen
(y)
α
Fig. 5 :
Reflexion in den Nullpunkt
(x, y(x))
α
2α
β
(x)
Die bekannte trigonometrische Formel
cot(2α) =
cot2 α − 1
2 cot α
liefert dann
y
y02 − 1
,
=
x
2y 0
(4.12)
2
x y 0 − 2y y 0 − x = 0 ,
(4.13)
0
y =
+
y (−)
p
y 2 + x2
.
x
Da y 0 > 0 für x > 0 , kann hier das negative Vorzeichen ausgeschlossen werden. Schreiben wir
(5.13) in der Form
34
U. Stammbach: Analysis, Teil C
y
y0 =
+
x
(4.14)
s 2
y
x
+1 ,
so ist offensichtlich, dass die rechte Seite eine Funktion von y/x ist. Die Substitution u(x) =
y(x)/x wird also eine separierbare Differentialgleichung für x → u(x) liefern. Wir erhalten wegen
y 0 (x) = u(x) + x u0 (x)
(y)
Fig. 6 :
Parabolspiegel
(x)
die einfache Differentialgleichung
u + x u0 = u +
Z
√
du
=
u2 + 1
p
u2 + 1 ,
Z
dx
,
x
35
Kapitel VII. Differentialgleichungen
log u +
p
u2 + 1
= log |x| + C .
Setzen wir A = ±eC , so folgt
y
+
x
s
y2
+ 1 = Ax ,
x2
y2
y2
2 2
+
1
=
A
x
−
2Ay
+
,
x2
x2
y =
1 2 2
A x −1 .
2A
Die “Anfangsbedingung” y0 = y(x0 ) bestimmt den Parameter A und damit die Öffnung des
Spiegels (siehe Figur 6).
36
5
U. Stammbach: Analysis, Teil C
Lineare Differentialgleichungen
Die bei weitem wichtigste Klasse von Differentialgleichungen bilden die linearen Differentialgleichungen, sowohl was die Anwendungen wie auch was die Theorie betrifft, letzteres vor allem
im Hinblick auf Differentialgleichungen höherer Ordnung.
Eine Differentialgleichung 1. Ordnung heisst linear, wenn sie von der Form
(5.1)
y 0 = p(x) · y + q(x)
ist, wobei x → p(x) und x → q(x) beliebige Funktionen von x sind. Die rechte Seite der
Differentialgleichung ist also eine lineare Funktion in y; man beachte, dass über die Funktionen
p und q von x keine Voraussetzungen getroffen werden.
In (6.1) heisst der Term q(x) inhomogenes Glied oder Störglied. Ist q(x) ≡ 0, so heisst (6.1)
homogen, andernfalls inhomogen. Die Differentialgleichung
(5.2)
y 0 = p(x) · y
heisst die zu (6.1) gehörige homogene Differentialgleichung.
Die homogene lineare Differentialgleichung (6.2) lässt sich in der Form
y0
= p(x)
y
schreiben. Damit haben wir die folgende wichtige Tatsache festgestellt:
Homogene lineare Differentialgleichungen sind separierbar.
37
Kapitel VII. Differentialgleichungen
Beispiel Die Differentialgleichung (siehe Figur 1)
y0 =
(5.3)
1
y + 4x2
x
1
ist offensichtlich linear mit p(x) = , q(x) = 4x2 . Die zugehörige homogene Differentialgleix
chung lautet
y0 =
(5.4)
1
y.
x
(y)
Fig. 1 :
Richtungsfeld der linearen
Differentialgleichung
(x)
Separieren liefert
Z
1
dy =
y
Z
1
dx ,
x
log |y| = log |x| + C .
y0 =
1
y + 4x2
x
38
U. Stammbach: Analysis, Teil C
Setzt man A = ±eC , so erhält man die allgemeine Lösung von (6.4) zu
y(x) = A · x .
(5.5)
Als nächstes wenden wir uns der inhomogenen Differentialgleichung (6.1) zu. Wir nehmen
zuerst an, dass wir aus irgend einem Grunde eine partikuläre Lösung dieser Differentialgleichung
kennen. Es sei also
y0 : x → y0 (x)
eine Funktion, welche (6.1) erfüllt:
(5.6)
y00 (x) = p(x) y0 (x) + q(x) .
Wir behaupten nun:
Behauptung A Ist yh : x → yh (x) eine Lösung der homogenen Differentialgleichung (6.2),
d.h. gilt
(5.7)
yh0 (x) ≡ p(x) yh (x) ,
so ist die “Superposition” der Funktionen y0 und yh , d.h. die Funktion
x → y0 (x) + yh (x)
wieder eine Lösung der inhomogenen Differentialgleichung (6.1).
39
Kapitel VII. Differentialgleichungen
Beweis Wir beweisen dies durch Einsetzen. Wegen (6.6) und (6.7) gilt
(y0 (x) + yh (x))0
=
y00 (x) + yh0 (x)
=
(p(x) y0 (x) + q(x)) + p(x) yh (x)
=
p(x) (y0 (x) + yh (x)) + q(x)
d.h. x → y0 (x) + yh (x) erfüllt die Differentialgleichung (6.1).
Als zweites behaupten wir:
Behauptung B Ist die Funktion
y1 : x → y1 (x)
eine weitere Lösung der inhomogenen Differentialgleichung (6.1), so ist die Differenz
x → y1 (x) − y0 (x)
eine Lösung der homogenen Differentialgleichung (6.2).
Beweis In der Tat gilt
(y1 (x) − y0 (x))0
=
y10 (x) − y00 (x)
=
(p(x) y1 (x) + q(x)) − (p(x) y0 (x) + q(x))
=
p(x) · (y1 (x) − y0 (x))
d.h. x → y1 (x) − y0 (x) erfüllt die Differentialgleichung (6.2). Damit ist die Behauptung B
bewiesen.
Aus der Behauptung B folgt, dass sich jede Lösung x → y1 (x) der inhomogenen Differentialgleichung (6.1) darstellen lässt als
(5.8)
y1 (x) = y0 (x) + ỹ(x) ,
40
U. Stammbach: Analysis, Teil C
wo ỹ(x) eine Lösung der homogenen Differentialgleichung (6.2) ist. Die Behauptung A sagt,
dass jede Funktion der Form (6.8) eine Lösung der inhomogenen Differentialgleichung (6.1) ist.
Wir erhalten damit das folgende allgemeine Verfahren zur Lösung der inhomogenen Differentialgleichung (6.1).
Man erhält die allgemeine Lösung der Differentialgleichung
y 0 = p(x) y + q(x) ,
indem man eine partikuläre Lösung y0 : x → y0 (x) nimmt und zu ihr
die allgemeine Lösung der zugehörigen homogenen Differentialgleichung
y 0 = p(x) y
addiert.
Dieses Superpositionsprinzip ist charakterisch für lineare Differentialgleichungen. Wir wissen
bereits, dass es einfach ist, die allgemeine Lösung der homogenen Differentialgleichung zu finden.
Das Problem ist also auf die Aufgabe reduziert, eine partikuläre Lösung der inhomogenen Differentialgleichung zu finden.
Oft lassen sich solche partikuläre Lösungen durch einen geschickt gewählten Ansatz auf einfache Art und Weise finden. In anderen Fällen ist es notwendig, ein umständlicheres Verfahren
anzuwenden, das aber den Vorteil hat, dass es immer zum Ziel führt (Verfahren von Lagrange,
J. L. Lagrange 1736 - 1813). Wir betrachten zuerst das Beispiel (6.3), wo ein einfacher Ansatz
für y0 genügt.
Beispiel Als Lösungsansatz für die Differentialgleichung (6.3)
y0 =
1
y + 4x2
x
versuchen wir
(5.9)
y0 (x) = a x3
41
Kapitel VII. Differentialgleichungen
wo a eine noch zu bestimmende Konstante ist. Einsetzen liefert
3ax2
≡
2ax2
≡
a x3
+ 4x2 ,
x
4x2 ,
a
=
2.
Wir haben damit eine partikuläre Lösung von (6.3) erhalten
y0 (x) = 2x3 .
Nach unserem Verfahren liefert dies zusammen mit der allgemeinen Lösung (6.5) der zugehörigen
homogenen Differentialgleichung die allgemeine Lösung von (6.3) (siehe Figur 2)
(5.10)
y(x) = Ax + 2x3 .
Als Faustregel kann man sich merken, dass man immer einen Ansatz für y0 versuchen soll, der
die Form des Störgliedes q(x) hat. Ist also q(x) ein Polynom, so soll man einen Polynomansatz
versuchen, ist q(x) eine Sinus- oder Cosinusfunktion, so soll man als Ansatz eine Summe einer
Sinus- und Cosinusfunktion der gleichen Kreisfrequenz versuchen, usw. Nicht immer führt dies
allerdings zum Ziel. Dann muss das Verfahren von Lagrange angewandt werden.
Wir betrachten wiederum die inhomogene Differentialgleichung (6.1) und nehmen an, dass wir
eine Lösung x → yh (x) , yh 6≡ 0 der zugehörigen homogenen Differentialgleichung (6.2) bereits
kennen. Es gilt also
(5.11)
yh0 (x) ≡ p(x) · yh (x) .
Wir machen nun den Ansatz von Lagrange
(5.12)
y0 (x) = γ(x) · yh (x) ,
42
U. Stammbach: Analysis, Teil C
(y)
Fig. 2 :
Lösungen der linearen
Differentialgleichung
(x)
y0 =
1
y + 4x2
x
wobei x → γ(x) eine noch zu bestimmende Funktion von x ist. (Man beachte, dass sich jede
Funktion in der Form (6.12) darstellen lässt!) Einsetzen in (6.1) liefert
y00 (x) = γ 0 (x) yh (x) + γ(x) yh0 (x) ≡ p(x) γ(x) yh (x) + q(x) .
Wegen (6.11) ergibt sich daraus
γ 0 (x) =
q(x)
,
yh (x)
woraus sich durch Integration γ(x) und damit y0 (x) ergibt. Wir verfolgen den Lösungsweg an
einem konkreten einfachen Beispiel.
43
Kapitel VII. Differentialgleichungen
Beispiel Es sei die Differentialgleichung
(5.13)
y0 =
y
+ 1
x
gegeben. Die zugehörige homogene Differentialgleichung
y0 =
y
x
hat die allgemeine Lösung yh = Ax . Als Ansatz von Lagrange setzt man
y0 (x) = γ(x) · x
und erhält durch Einsetzen
γ 0 (x) · x + γ(x)
≡
γ 0 (x)
=
γ(x)
=
γ(x) · x
+ 1,
x
1
,
x
log |x| .
Da wir nur an einer partikulären Lösung interessiert sind, können wir hier auf die Integrationskonstante verzichten. Wir erhalten
y0 = x log |x|
und als allgemeine Lösung von (6.13) (siehe Figur 3)
(5.14)
y(x) = Ax + x log |x| .
Im verbleibenden Teil dieses Abschnittes diskutieren wir ein wichtiges Beispiel aus der Elektrodynamik. Es sei ein Schaltkreis mit einem Ohm’schen Widerstand R und einer Selbstinduktion
L gegeben. Es interessiert der zur Zeit t im Schaltkreis fliessende Strom I(t), wenn zur Zeit
t=0
44
U. Stammbach: Analysis, Teil C
(y)
Fig. 3 :
Lösungen der linearen
Differentialgleichung
(x)
y0 =
y
+1
x
(a) eine konstante Spannung U = U0 ,
(b) eine Wechselspannung U = U0 · cos(ωt)
angelegt wird (Das Beispiel (a) wurde bereits im Abschnitt 2 behandelt; wir erhalten die Lösung
hier aber auf eine etwas andere Art). In der Physik lernt man, dass die Funktion t → I(t) der
Differentialgleichung
(5.15)
dI
R
U
= − I +
dt
L
L
genügt. Gesucht ist die Lösung von (6.15) in den Fällen (a), (b) zur Anfangsbedingung I(0) = 0.
Offensichtlich handelt es sich bei (6.15) um eine inhomogene lineare Differentialgleichung. Die
zugehörige homogene Differentialgleichung lautet
dI
R
= − I ;
dt
L
sie hat als allgemeine Lösung
45
Kapitel VII. Differentialgleichungen
R
Ih (t) = C · e− L t .
(5.16)
Die beiden Fälle (a), (b) unterscheiden sich durch die partikuläre Lösung der inhomogenen
Differentialgleichung (6.15). Im Fall (a) hat man U = U0 und eine Partikulärlösung lässt sich
sofort erraten
I0 (t) =
U0
.
R
Die allgemeine Lösung von (6.15) im Fall (a) ist also
I(t) =
R
U0
+ C · e− L t
R
und die Anfangsbedingung I(0) = 0 liefert C = −
(5.17)
U0
I(t) =
R
U0
, so dass die gesuchte Lösung lautet
R
R
1 − e− L t
.
Man vergleiche dazu Beispiel (c) im Abschnitt 2, wo dieses Resultat auf etwas anderem Weg
erhalten worden ist.
Im Fall (b) hat man die Differentialgleichung
(5.18)
dI
R
1
= − I +
U0 · cos(ωt)
dt
L
L
zu diskutieren. Wir machen unserer Faustregel folgend für die partikuläre Lösung t → I0 (t) den
Ansatz
I0 (t) = a cos(ωt) + b sin(ωt)
wo a, b zwei noch zu bestimmende reelle Konstanten sind. Einsetzen in (6.18) liefert
−aω sin(ωt) + bω cos(ωt) ≡ −
Daraus ergeben sich die Gleichungen
R
U0
(a cos(ωt) + b sin(ωt)) +
cos(ωt) .
L
L
46
U. Stammbach: Analysis, Teil C
aω
=
bω
=
R
b,
L
R
U0
− a +
,
L
L
und es folgt
a =
R2
U0 R
+ ω 2 L2
,
b =
U0 ω L
.
+ ω 2 L2
R2
Zusammen mit (6.16) ergibt sich die allgemeine Lösung von (6.18)
(5.19)
R
I(t) = C · e− L t +
R2
U0 R
U0 ω L
cos(ωt) + 2
sin(ωt) .
2
2
+ω L
R + ω 2 L2
Die Anfangsbedingung I0 = 0 schliesslich liefert
C = −
R2
U0 R
.
+ ω 2 L2
Man entnimmt der Formel (5.19), dass für grosse t die Funktion I(t) gegen die partikuläre Lösung
strebt. Man spricht deshalb auch etwa von der “stationären Lösung”, der Lösung nämlich, die
sich nach langer Zeit einstellt (siehe Figur 4). Dass diese in unserem Beispiel eine Schwingung
mit Kreisfrequenz ω sein wird, ist natürlich zu erwarten und wird durch die Rechnung auch
bestätigt. Man beachte aber, dass die Phase der Lösung mit der Phase der angelegten Spannung
nicht übereinstimmt (siehe Figur 4)
Eine zweite Bemerkung betrifft die Grössen
√
R2
R
ωL
, √
.
2
2
2
+ω L
R + ω 2 L2
Diese lassen sich wegen
√
R
2
R + ω 2 L2
2
+
√
ωL
2
R + ω 2 L2
als Cosinus bzw. Sinus eines Winkels α deuten, welcher durch
2
=1
47
Kapitel VII. Differentialgleichungen
I(t)
U (t)
(t)
tan α =
Fig. 4 :
Stromstärke in einem
Stromkreis unter einer
Klemmenspannung, die durch
t → cos(ωt) gegeben ist
ωL
R
gegeben ist. Die Lösung (5.19) schreibt sich dann als
I(t)
=
R
C · e− L t + √
=
R
C · e− L t + √
R2
U0
(cos α cos(ωt) + sin α sin(ωt))
+ ω 2 L2
U0
cos(ωt − α) .
R 2 + ω 2 L2
Die “stationäre Lösung” ist somit eine Schwingung mit der Kreisfrequenz ω der angelegten
Spannung und einer Phasenverschiebung, die durch α gegeben ist.
48
6
U. Stammbach: Analysis, Teil C
Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien
In diesem und dem nächsten Abschnitt wollen wir uns mit einigen geometrischen Problemen
auseinandersetzen, welche mit Kurvenscharen zu tun haben.
Wir betrachten zunächst eine Funktion g : (x, y) → g(x, y) von zwei Variablen. Den Verlauf
dieser Funktion veranschaulichen wir uns durch ihre Niveaulinien, welche durch die Gleichung
(6.1)
g(x, y) = C ,
C∈R
gegeben sind. Wir fragen jetzt nach der Differentialgleichung, welche die Kurvenschar (7.1)
beschreibt. Totale Ableitung von (7.1) nach x liefert
(6.2)
gx (x, y) + gy (x, y) y 0 = 0 .
Da der Scharparameter C automatisch eliminiert worden ist, ist (7.2) bereits die Differentialgleichung der Schar. Die Lösungskurven von (7.2) sind die Niveaulinien der Funktion g.
Wir schliessen daran einige Bemerkungen an. Schreiben wir (7.2) in der Form
(6.3)
y0 = −
gx (x, y)
=: f (x, y)
gy (x, y)
und wenden wir darauf unseren Satz (3.1) über die Existenz und Eindeutigkeit von Lösungen
von Differentialgleichungen an, so erhalten wir folgendes. Durch einen Punkt (x0 , y0 ) geht
genau eine Lösungskurve von (7.3), also eine Niveaulinie von g, wenn f in einer Umgebung von
(x0 , y0 ) stetig partiell differenzierbar ist. Für die Funktion g selbst bedeutet letzteres, neben der
offensichtlichen Bedingung gy (x, y) 6= 0 , dass g in einer Umgebung von (x0 , y0 ) zweimal stetig
partiell differenzierbar ist.
Beispiel Betrachte die Funktion g : (x, y) → x2 − y 2 und ihre Niveaulinien (siehe Figur 1).
Satz 3.1 liefert uns genau eine Niveaulinie durch jeden Punkt der (x, y)-Ebene mit Ausnahme
der Punkte auf der x-Achse; denn dort verschwindet die partielle Ableitung von g nach y. (Die
49
Kapitel VII. Differentialgleichungen
(y)
Fig. 1 :
Niveaulinien der Funktion
(x)
(x, y) → g(x, y) = x2 − y 2
Zeichnung lässt allerdings vermuten, dass sich die Niveaulinien in diese Punkte stetig fortsetzen
lassen. Dies kann man in der Tat mathematisch einwandfrei nachweisen, indem man ein um π/2
gedrehtes Koordinatensystem einführt. Der Nullpunkt bildet dabei eine Ausnahme!)
Umgekehrt gehen wir von einer Differentialgleichung der Form
(6.4)
ϕ(x, y) + ψ(x, y) y 0 = 0
aus und fragen, unter welchen Bedingungen sie als eine Differentialgleichung der Form (7.2)
interpretiert werden kann. Wann gibt es eine Funktion g : (x, y) → g(x, y) mit
ϕ(x, y) ≡ gx (x, y) , ψ(x, y) ≡ gy (x, y) ?
Wir haben dieses Problem bereits früher, nämlich in Kapitel IV, Abschnitt 7 studiert und gesehen, dass g : (x, y) → g(x, y) jedenfalls nur dann existieren kann, wenn die Integrabilitätsbedingung
(6.5)
ϕy (x, y) ≡ ψx (x, y)
50
U. Stammbach: Analysis, Teil C
erfüllt ist. Ferner haben wir festgestellt, dass in diesem Fall g auch tatsächlich existiert, wenn
man sich auf ein achsenparalleles Rechteck als Definitionsbereich beschränkt. Da wir unter
diesen Vorgaben g berechnen können, ist damit auch die Differentialgleichung (7.4) gelöst: die
Lösungskurven sind die Niveaulinien von g.
Eine Differentialgleichung (7.4), welche die Bedingung (7.5) erfüllt, heisst exakt. Ihre Lösungskurven sind die Niveaulinien der Funktion g : (x, y) → g(x, y) .
Beispiel Bestimme die durch den Punkt (1, 2) gehende Lösungskurve von
(2x2 − y 2 + y) − (2xy − x + 4y) y 0 = 0 .
(6.6)
Ein Vergleich mit (7.4) zeigt, dass wir
ϕ(x, y) = 2x2 − y 2 + y , ψ(x, y) = −2xy + x − 4y
(6.7)
setzen müssen. Dann gilt
ϕy (x, y) = −2y + 1 = ψx (x, y) .
Die Differentialgleichung (7.6) ist folglich exakt. Die Funktion g(x, y) ergibt sich schrittweise.
Wegen
gx (x, y) = ϕ(x, y) = 2x2 − y 2 + y
erhalten wir
g(x, y) =
2 3
x − xy 2 + xy + u(y)
3
für eine noch zu bestimmende Funktion y → u(y) . Ableitung nach y liefert
!
−2xy + x − 4y = ψ(x, y) = gy (x, y) = −2xy + x + u0 (y) .
Daraus ergibt sich
51
Kapitel VII. Differentialgleichungen
u0 (y)
=
−4y ,
u(y)
=
−2y 2 .
Die Funktion g : (x, y) → g(x, y) ist also gegeben durch
g(x, y) =
(6.8)
2 3
x − xy 2 + xy − 2y 2 .
3
(Natürlich ist g nur bis auf eine additive Konstante bestimmt.) Die allgemeine Lösung der
Differentialgleichung (7.6) ist die Schar der Niveaulinien von g (siehe Figur 2):
4
2
Fig. 2 :
Niveaulinien der Funktion
0
(x, y) →
2 3
x − xy 2 + xy − 2y 2
3
-2
-4
-4
(6.9)
-2
0
2
4
2 3
x − xy 2 + xy − 2y 2 = C .
3
Den zur gesuchten speziellen Lösung gehörigen Wert von C erhalten wir durch Einsetzen des
Punktes (1,2) in (7.9). Es ergibt sich C = −28/3 , so dass die Lösung gegeben ist durch
52
(6.10)
U. Stammbach: Analysis, Teil C
2 3
x − xy 2 + xy − 2y 2 = −28/3 .
3
Wir gehen zurück zur Gleichung (7.1), welche die Niveaulinien der Funktion g : (x, y) → g(x, y)
beschreibt. Betrachten wir g als (ebenes) Potential, so hat bekanntlich das zugehörige Gradientenfeld die Eigenschaft, dass der Vektor des Feldes im Punkt P senkrecht auf der Niveaulinie
durch P steht.
Die Feldlinien des Gradientenfeldes verlaufen somit in jedem Punkt senkrecht zu den Niveaulinien von g. Die Feldlinien bilden die Orthogonaltrajektorien zur Schar der Niveaulinien.
Etwas allgemeiner kann man nach den Orthogonaltrajektorien einer (regulären) Schar von Kurven fragen. Jede solche reguläre Schar ist Lösungsschar einer Differentialgleichung
y 0 = f (x, y) .
(6.11)
Die Steigung in (x, y) der durch (x, y) gehenden Orthogonaltrajektorie ist dann offensichtlich
m = −
1
.
f (x, y)
Beschreiben wir die Orthogonaltrajektorie wieder als Graph einer Funktion y : x → y(x) , so
muss dafür die Differentialgleichung
(6.12)
y0 = −
1
f (x, y)
erfüllt sein. Die Orthogonaltrajektorien sind somit gerade die Lösungskurven der Differentialgleichung (7.12), wenn die ursprüngliche Schar durch die Differentialgleichung (7.11) beschrieben
wird.
Beispiel Es sei die Schar der Parabeln
(6.13)
y = C x2
gegeben, und es seien die Orthogonaltrajektorien dieser Schar gesucht. Die Differentialgleichung
der Schar (7.13) erhalten wir durch Ableiten nach x und Elimination des Parameters. Wir
erhalten
53
Kapitel VII. Differentialgleichungen
y 0 = 2Cx .
(6.14)
Aus (7.13) ergibt sich
C =
y
.
x2
Einsetzen in (7.14) liefert
y0 = 2
y
=: f (x, y) .
x
Die Differentialgleichung der Orthogonaltrajektorien lautet nach (7.12)
y0 = −
(6.15)
x
.
2y
Diese ist separierbar. Wir erhalten
Z
y dy
=
−
y2
2
=
−
Z
1
x dx ,
2
x2
+ C .
4
Die Orthogonaltrajektorien der Schar (7.13) sind somit gegeben durch
(6.16)
x2
y2
+
= C .
4
2
Es sind Ellipsen mit Mittelpunkt im Ursprung des Koordinatensystems (siehe Figur 3).
Natürlich bilden umgekehrt die durch (7.13) gegebenen Kurven die Orthogonaltrajektorien zur
Schar (7.16).
Beispiel In einem zweiten Beispiel sei die Schar der Kreise gegeben, welche die x-Achse im
Ursprung berühren. Gesucht ist die Schar der Orthogonaltrajektorien.
54
U. Stammbach: Analysis, Teil C
(y)
Fig. 3 :
Die Orthogonaltrajektorien
der Schar der Parabeln
y = Cx2 sind Ellipsen
(x)
Die Schargleichung der Kreise lautet offensichtlich
(6.17)
x2 + y 2 − C y = 0 .
Die Differentialgleichung ergibt sich durch totale Ableitung nach x und Elimination von C. Wir
erhalten
2xy
.
− y2
y0 =
x2
Die Differentialgleichung der Orthogonaltrajektorien lautet nach (7.12)
y0
y
0
=
−
=
1
2
x2 − y 2
2xy
y
1
− y
x
x
!
.
55
Kapitel VII. Differentialgleichungen
Wie üblich machen wir die Substitution u(x) =
y(x)
, d.h.
x
u0 x + u = y 0 .
Einsetzen liefert
0
xu
Z
=
u2 + 1
u
1
−
2
Z
!
,
2u
du
2
u +1
=
−
1
dx ,
x
log |u2 + 1|
=
− log |x| + C .
(y)
Fig. 4 :
Die Orthogonaltrajektorien
der Schar der Kreise
(x)
x2 + y 2 − Cy = 0
sind die Kreise
x2 − Ax + y 2 = 0
Setzen wir A = ±eC , so folgt nach Rücksubstitution
y2
+ 1
x2
=
A
,
x
56
(6.18)
U. Stammbach: Analysis, Teil C
x2 − Ax + y 2
=
0.
Die Orthogonaltrajektorien sind also wiederum Kreise, nämlich solche, welche die y-Achse im
Ursprung berühren (siehe Figur 4).
57
Kapitel VII. Differentialgleichungen
7
Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen
Es sei eine Schar von Kurven gegeben. Unter einer Enveloppe (Umhüllenden) der Schar
verstehen wir eine Kurve K, welche in jedem ihrer Punkte eine Kurve der Schar berührt.
Wie man am Beispiel der Schar der Kreise mit Mittelpunkt im Ursprung feststellen kann, besitzt nicht jede Kurvenschar eine Enveloppe. Gibt es aber eine, so spielt sie gewöhnlich eine
ausgezeichnete Rolle. Wird zum Beispiel die Kurvenschar durch die Differentialgleichung
(7.1)
y 0 = f (x, y)
beschrieben, so erfüllen offensichtlich nicht nur die Kurven der Schar diese Differentialgleichung,
sondern auch ihre Enveloppe; in jedem ihrer Punkte stimmt ja ihre Steigung mit der Steigung der Scharkurve durch diesen Punkt überein. Neben den offensichtlichen Lösungen der
Differentialgleichung (8.1), die durch die Kurven der Schar gegeben sind, gibt es also noch eine
“versteckte”, eine singuläre Lösung, die der Enveloppe der Schar entspricht.
Man entnimmt leicht der Figur 1, dass die Differentialgleichung (8.1) in den Punkten der Enveloppe die Voraussetzungen des Satzes 3.1 nicht erfüllen kann, denn durch diese Punkte gibt
es mehrere Lösungen der Differentialgleichung (8.1).
Wie bestimmt man die Enveloppe einer Kurvenschar? Die Schar sei gegeben durch die Gleichung
(7.2)
F (x, y, C) = 0 .
Dem Parameterwert C ordnen wir (abstrakt) den Punkt (x(C), y(C)) der Enveloppe K zu, in
dem K die zu C gehörige Scharkurve berührt (siehe Figur 1). Dann kann
(7.3)
C → (x(C), y(C))
als Parameterdarstellung der Enveloppe aufgefasst werden. Nun gilt, da (x(C), y(C)) auf der
zu C gehörigen Scharkurve liegt,
(7.4)
F (x(C), y(C), C) = 0 .
58
U. Stammbach: Analysis, Teil C
Fig. 1 :
Enveloppe einer Kurvenschar
(x(C), y(C))
F (x, y, C) = 0
Ferner berühren sich in (x(C), y(C)) Scharkurve und Enveloppe, ihre Steigungen stimmen in
diesem Punkte überein:
(7.5)
ẏ(C)
Fx (x(C), y(C), C)
= −
.
ẋ(C)
Fy (x(C), y(C), C)
Links steht die Steigung der Enveloppe (8.3) und rechts steht die Steigung der implizit gegebenen
Scharkurve. Wir schreiben (7.5) in der Form
(7.6)
Fx (x(C), y(C), C) ẋ(C) + Fy (x(C), y(C), C) ẏ(C) = 0 .
Ausserdem liefert die totale Ableitung nach C von (8.4) die Gleichung
(7.7)
Fx (x(C), y(C), C) ẋ(C) + Fy (x(C), y(C), C) ẏ(C) + FC (x(C), y(C), C) = 0 .
Zusammen mit (8.6) folgt daraus
(7.8)
FC (x(C), y(C), C) = 0 .
59
Kapitel VII. Differentialgleichungen
Wir fassen zusammen: Die Enveloppe der durch (8.2) gegebenen Kurvenschar erhält man durch
Elimination des Scharparameters C aus den Gleichungen
F (x, y, C) = 0
FC (x, y, C) = 0
(7.9)
.
Beispiel Wir betrachten die Kurvenschar der Flugbahnen eines mit der Anfangsgeschwindigkeit
v0 aus dem Ursprung schräg nach oben “geschossenen” Massenpunktes im Erdanziehungsfeld.
Ist α der Abschusswinkel, so ist die Bahn des Massenpunktes gegeben durch
(
t →
x(t) = v0 cos α · t
y(t) = v0 sin α · t −
1
2
gt2
.
(y)
Fig. 2 :
Die Enveloppe der Wurfparabeln
(x)
Setzen wir h = g/2v02 , so liefert die Elimination von t die “Flugparabel”
(7.10)
F (x, y, α) := y − x tan α +
h
x2 = 0 .
cos2 α
60
U. Stammbach: Analysis, Teil C
Dies ist die Schar von Kurven, die wir in diesem Beispiel betrachten wollen; Scharparameter ist
α. Für die Bestimmung der Enveloppen benötigen wir die Gleichung Fα (x, y, α) = 0 . Es gilt
(7.11)
Fα (x, y, α) = −
x
2h
+
(sin α) x2 = 0 .
2
cos α
cos3 α
Aus (8.11) folgt
tan α =
1
2hx
q
und Einsetzen in (8.10) liefert wegen cos α = 2hx/ 1 + (2hx)2
y =
(7.12)
1
− h x2 .
4h
Wir stellen die interessante Tatsache fest, dass die Enveloppe der Flugparabeln wieder eine
Parabel ist (siehe Figur 2). Sie umgrenzt den Bereich, der mit der Anfangsgeschwindigkeit v0
überhaupt erreichbar ist.
Schliesslich spezialisieren wir unsere Betrachtungen auf Kurvenscharen, welche aus Geraden
bestehen. Wählt man als Parameter C der Schar gerade die Steigung der Geraden, so stellt sich
eine solche Schar durch eine Gleichung der Form
y = C · x + g(C)
(7.13)
dar, wo g : C → g(C) eine Funktion von C ist. Berechnet man die Enveloppe einer solchen
Schar, so erhält man
F (x, y, C) := −y + Cx + g(C) = 0
FC (x, y, C) =
x + g0 (C)
= 0
und damit die folgende Parameterdarstellung der Enveloppe
(
(7.14)
x = −g0 (C)
y = −Cg0 (C) + g(C) .
61
Kapitel VII. Differentialgleichungen
Um die Differentialgleichung der Schar (8.13) zu erhalten, berechnet man zunächst die totale
Ableitung der Gleichung (8.13) nach x,
y0 = C ,
(7.15)
und eliminiert dann C aus (8.13) und (8.15). Man erhält
y = y 0 x + g(y 0 ) .
(7.16)
Eine Differentialgleichung der Form (8.16) heisst Clairaut’sche Differentialgleichung. Zahlreiche geometrische Probleme, in denen Tangenten eine Rolle spielen, führen auf Differentialgleichungen von diesem Typ. Wir halten noch explizit fest: Die Lösungen von (8.16) sind die
Geraden (8.13), – sie bilden die allgemeine Lösung der Differentialgleichung – und die Enveloppe
(8.14) dieser Geradenschar – sie ist die singuläre Lösung der Differentialgleichung.
Beispiel Gesucht sind die Kurven, die die Eigenschaft haben, dass ihre Tangenten zusammen
mit den Koordinatenachsen im 1. Quadranten ein Dreieck mit Flächeninhalt F bilden (siehe
Figur 3).
Die Kurve sei als Graph der Funktion x → y(x) gegeben. Die Tangente im Punkte (x, y) stellt
sich dann durch
(η − y) = y 0 (x)(ξ − x)
dar. Die Abschnitte auf den Koordinatenachsen sind
−
y
+ x
y0
− y0x + y .
und
Für die Fläche F des Dreiecks erhält man also
2F =
x−
y
(y − y 0 x) ,
y0
und damit ergibt sich, da beim Wurzelziehen gemäss Aufgabenstellung nur das positive Vorzeichen zu berücksichtigen ist,
(7.17)
y = y0x +
p
−2F y 0 .
62
U. Stammbach: Analysis, Teil C
(y)
Fig. 3 :
Dreieck, das von der Tangenten
an die Kurve und den
Koordinatenachsen gebildet
wird
F
(x)
(y)
Fig. 4 :
Die Geradenschar
√
y = Cx + −2F C
(Die Enveloppe ist sichtbar,
obschon sie nicht
eingezeichnet ist!)
(x)
63
Kapitel VII. Differentialgleichungen
Dies ist eine Clairaut’sche Differentialgleichung. Ihre allgemeine Lösung besteht aus der Schar
der Geraden
(7.18)
√
y = Cx +
−2F C .
Daneben besitzt sie eine – interessantere – singuläre Lösung, die durch die Enveloppe der Geradenschar gegeben ist. Sie wird erhalten, indem man aus (8.18) und der partiellen Ableitung
von (8.18) nach C
(7.19)
0 = x +
1
1
√
(−2F )
2 −2F C
den Parameter C eliminiert. Aus (8.19) erhält man
√
F
,
x
F
C = − 2 .
2x
−2F C =
Einsetzen in (8.18) liefert dann
(7.20)
y =
1F
.
2x
Es stellt sich heraus, dass neben der Geraden (8.18) auch die Hyperbel (8.20), genauer deren
positiver Ast, die verlangten geometrischen Eigenschaften hat (siehe Figur 4).
64
8
U. Stammbach: Analysis, Teil C
Differentialgleichungen höherer Ordnung, allgemeines
Eine Differentialgleichung n-ter Ordnung für die Funktion y : x → y(x) ist eine Gleichung
(8.1)
F (x, y, y 0 , y 00 , . . . , y (n) ) = 0.
Analog wie bei Differentialgleichungen 1. Ordnung nehmen wir an (vgl. (3.1) ), dass sich (9.1)
nach y (n) auflösen lässt:
(8.2)
y (n) = f (x, y, y 0 , . . . , y (n−1) ) .
In dieser Form wollen wir Differentialgleichungen n-ter Ordnung diskutieren. Betrachten wir
zuerst ein ganz einfaches Beispiel.
Beispiel Es sei die Differentialgleichung 2. Ordnung
y 00 = a
(8.3)
für die Funktion x → y(x) gegeben; a ∈ R sei eine Konstante. Offensichtlich sind die Lösungsfunktionen von (9.3) von der Form
x → y(x) =
a 2
x + C1 x + C 2 ,
2
wo C1 , C2 beliebige reelle Konstanten sind. Die Lösungskurven sind Parabeln, welche von den
zwei Parametern C1 , C2 abhängen. Die allgemeine Lösung von (9.3) ist eine 2-parametrige
Kurvenschar.
Ist zusätzlich zu (9.3) noch die Anfangsbedingung
(8.4)
y(x0 ) = y0 .
65
Kapitel VII. Differentialgleichungen
gegeben, so führt dies auf die Gleichung
a 2
x + C 1 x0 + C 2 = y 0 .
2 0
(8.5)
Natürlich genügt diese einzige Gleichung nicht zur Festlegung der speziellen Lösung, d.h. zur
Bestimmung von C1 und C2 . Dafür muss eine zweite Anfangsbedingung hinzutreten. In vielen
Fällen, aber durchaus nicht immer, ist sie von der Form
(1)
y 0 (x0 ) = y0
(8.6)
.
d.h. es wird an der Stelle x0 zusätzlich noch die Steigung der Kurve vorgeschrieben. Diese
Anfangsbedingung führt auf die Gleichung
(1)
ax0 + C1 = y0 .
(8.7)
Die Gleichungen (9.5) , (9.7) lassen sich nun leicht nach C1 und C2 auflösen; zusammen bestimmen sie offenbar beide Parameter und damit die spezielle Lösung der Differentialgleichung (9.3)
eindeutig.
(1)
Wir fassen zusammen: Zu jeder Wahl von y0 , y0 gibt es eine eindeutig bestimmte Funktion x → y(x), welche die Differentialgleichung (9.3) und die zwei Anfangsbedingungen (9.4)
und (9.6) erfüllt. Damit haben wir den folgenden allgemeinen Satz illustriert, der eine direkte
Verallgemeinerung unseres Satzes 3.1 über die allgemeine Lösung von Differentialgleichungen
1. Ordnung ist.
Satz 8.1 Es sei die Differentialgleichung n-ter Ordnung
(8.8)
y (n) = f (x, y, y 0 , . . . , y (n−1) )
gegeben. Die Funktion f (von n + 1 Variablen) sei stetig in x und nach y, y 0 , . . . , y (n−1) stetig
(0)
(1)
(n−1)
partiell differenzierbar. Dann gibt es zu vorgegebenen x0 , y0 , y0 ,. . . , y0
eine eindeutig
bestimmte, in einem Intervall mit Mittelpunkt x0 definierte Funktion y : x → y(x), welche
Lösung der Differentialgleichung (9.8) ist und die (Anfangs-)Bedingungen
(8.9)
erfüllt.
(0)
(1)
(n−1)
y(x0 ) = y0 , y 0 (x0 ) = y0 , . . . , y (n−1) (x0 ) = y0
66
U. Stammbach: Analysis, Teil C
Natürlich verzichten wir in dieser Vorlesung auf den Beweis dieses Satzes. Wie der Satz 3.1 für
Differentialgleichungen 1. Ordnung, so bildet Satz 8.1 die Grundlage für das, was im Folgenden
über die Lösungen von Differentialgleichungen höherer (n-ter) Ordnung gesagt wird.
Betrachten wir zuerst die allgemeine Lösung von (9.8), d.h. die Schar aller Lösungskurven.
Geben wir uns x0 vor, so besagt unser Satz, dass es zu jeder Wahl der Grössen
(0)
(1)
(n−1)
y0 , y0 , . . . , y0
genau eine Lösungskurve von (9.8) gibt, welche die n Gleichungen (9.9) befriedigt. Die erste
(0)
(1)
dieser Gleichungen, y(x0 ) = y0 legt einen Punkt (x0 , y0 ) der Kurve fest, die zweite y 0 (x0 ) = y0
(2)
die Steigung der Kurve in diesem Punkt, die dritte y 00 (x0 ) = y0 die 2. Ableitung der Funktion,
also im wesentlichen die Krümmung der Kurve in diesem Punkt, usw. Die allgemeine Lösung
der Differentialgleichung (9.8) n-ter Ordnung ist also eine (wie man sagt reguläre) n-parametrige
Kurvenschar. Analog wie im Fall der Differentialgleichungen 1. Ordnung heisst regulär hier, dass
(0)
(1)
(n−1)
die Gleichungen (9.9) bei jeder Wahl der Grössen x0 , y0 , y0 , . . . ,y0
von genau einer Kurve
der Schar erfüllt werden.
Umgekehrt kann man natürlich fragen, ob es zu einer gegebenen (regulären) n-parametrigen Kurvenschar eine Differentialgleichung n-ter Ordnung gibt, welche gerade diese Schar als allgemeine
Lösung besitzt. Unter sehr allgemeinen Bedingungen, auf die wir hier nicht weiter eingehen
wollen, ist dies tatsächlich der Fall. Wir illustrieren den Sachverhalt an zwei Beispielen.
Beispiel
(8.10)
Wir betrachten die 2-parametrige Schar
y(x) = C1 cos(ωx) + C2 sin(ωx) , ω 6= 0
mit den Parametern C1 , C2 . Wir wollen zuerst zeigen, dass diese Schar regulär ist. Dazu müssen
(0)
(1)
wir nachweisen, dass zu beliebig vorgegebenen Zahlen x0 , y0 , y0 genau eine Wahl von C1 und
(0)
(1)
C2 existiert, so dass die Gleichungen y(x0 ) = y0 , y 0 (x0 ) = y0 erfüllt sind. Dieses führt auf
das folgende Gleichungssystem für C1 und C2
(0)
(8.11)
C1 cos(ωx0 ) +
C2 sin(ωx0 ) = y0
(1)
−C1 ω sin(ωx0 ) + C2 ω cos(ωx0 ) = y0
.
Nach der Theorie der linearen Gleichungssysteme (siehe “Lineare Algebra”) hat das System
(0)
(1)
(9.11) für beliebige Wahl der Grössen y0 , y0 eine eindeutig bestimmte Lösung (für C1 , C2 ),
wenn die Determinante der Matrix des Systems nicht Null ist. In unserem Fall gilt
67
Kapitel VII. Differentialgleichungen
"
det
cos(ωx0 )
sin(ωx0 )
−ω sin(ωx0 ) ω cos(ωx0 )
#
= ω 6= 0 .
Damit ist nachgewiesen, dass die Schar (9.10) regulär ist. (Man beachte, dass lineare Gleichungssysteme mit nicht verschwindender Determinante gewöhnlich “regulär” genannt werden.
Das steht in Übereinstimmung mit unserer Wahl des Wortes “regulär” für die Kurvenscharen,
mit denen wir es hier zu tun haben.)
Nach unserer Aussage sollte somit die 2-parametrige Schar (9.10) allgemeine Lösung einer
Differentialgleichung 2. Ordnung sein. Diese erhalten wir wie folgt. Wir leiten die Schargleichung 2-mal nach x ab
(8.12)
y 0 (x) = −ωC1 sin(ωx) + ωC2 cos(ωx) ,
(8.13)
y 00 (x) = −ω 2 C1 cos(ωx) − ω 2 C2 sin(ωx)
und eliminieren die Scharparameter C1 , C2 aus den 3 Gleichungen (9.10), (9.12), (9.13). Im
vorliegenden Fall ist das einfach dadurch zu bewerkstelligen, dass (9.10) mit ω 2 multipliziert
und zu (9.13) addiert wird. Wir erhalten
(8.14)
y 00 + ω 2 y = 0 .
Dies ist offensichtlich die Differentialgleichung der Kurvenschar (9.10).
Beispiel
(8.15)
In unserem zweiten Beispiel sei die 3-parametrige Kurvenschar
y(x) = C1 cos(C3 x) + C2 sin(C3 x)
gegeben. Wir betrachten also nicht nur harmonische Schwingungen zu einer festen Frequenz
ω wie im obigen Beispiel, sondern zu beliebigen Kreisfrequenzen. Da wir hier drei Parameter
haben, wird die zugehörige Differentialgleichung von 3. Ordnung sein. Durch Ableitung nach x
erhalten wir
(8.16)
y 0 = −C3 C1 sin(C3 x) + C3 C2 cos(C3 x) ,
(8.17)
y 00 = −C32 C1 cos(C3 x) − C32 C2 sin(C3 x) ,
68
(8.18)
U. Stammbach: Analysis, Teil C
y 000 = C33 C1 sin(C3 x) − C33 C2 cos(C3 x) .
Aus den Gleichungen (9.15), (9.16), (9.17) und (9.18) sind nun die Parameter C1 , C2 , C3 zu
eliminieren. Division von (9.18) durch (9.16) liefert
y 000
= −C32 .
y0
Ferner ergibt sich, wie oben, aus (9.15) und (9.17) die Gleichung
y 00 + C32 y = 0 .
Als Differentialgleichung der Schar (9.15) erhalten wir somit
(8.19)
y 0 y 00 − y 000 y = 0 ;
natürlich ist sie 3. Ordnung, wie wir vorausgesehen haben.
Wir haben hier bereits eine ganze Reihe von allgemeinen Aussagen über das Lösungsverhalten
von Differentialgleichungen höherer Ordnung kennengelernt. Versucht man in konkreten Fällen
die allgemeine Lösung zu beschreiben, so merkt man bald, dass dies ein schwieriges Unterfangen
ist. In der Tat ist es nur selten überhaupt möglich, die allgemeine Lösung in geschlossener Form
hinzuschreiben. Man ist hier in noch grösseren Massen als bei Differentialgleichungen 1. Ordnung
auf numerische Methoden angewiesen, wobei gleichzeitig darauf hingewiesen werden muss, dass
erst die allgemeine Aussage über das Lösungsverhalten diese numerischen Verfahren überhaupt
ermöglichen. Glücklicherweise zeigt sich ausserdem, dass viele der in einfachen Anwendungen
auftretenden Differentialgleichungen höherer Ordnung zu den “seltenen Ausnahmen” gehören
und explizit in geschlossener Form lösbar sind. Mit diesen wollen wir uns in den nächsten
Abschnitten vornehmlich befassen. Hier fügen wir noch ein einfaches Anwendungsbeispiel an.
Beispiel Wir betrachten einen prismatischen Balken der Länge l welcher links eingespannt
und rechts frei ist (siehe Figur 1). Die Lage des Balkens, die sogenannte Biegelinie, sei durch die
Funktion x → y(x) beschrieben. Man lernt in der Mechanik, dass zwischen dem Biegemoment
M (x) im Balkenquerschnitt an der Stelle x und der Krümmung k(x) der Biegelinie an der Stelle
x die folgende Beziehung besteht
(8.20)
M (x) = EJk(x) .
Kapitel VII. Differentialgleichungen
69
(y)
P
Fig. 1 :
Biegelinie eines horizontal
eingespannten Balkens
(x)
l
Dabei ist E der Elastizitätsmodul des Balkens und J das axiale Trägheitsmoment eines Querschnittes des Balkens bezüglich einer horizontalen Achse durch den Schwerpunkt des Querschnittes. Die Krümmung ist gegeben durch
(8.21)
k(x) =
y ′′
3
(1 + y ′2 ) 2
.
Daraus folgt
(8.22)
y ′′
(1 + y ′2 )
3
2
=
M (x)
.
EJ
Dies ist bei gegebener Beanspruchung, d.h. wenn M (x) bekannt ist, eine Differentialgleichung
für die Biegelinie des Balkens. Die “Anfangs”-Bedingungen sind offensichtlich
(8.23)
y(0) = 0 , y ′ (0) = 0 ,
sie sind also von der Art, wie wir sie in Satz 8.1 betrachtet haben. Die Differentialgleichung
(8.22) ist wegen des Auftretens einer Wurzel mit y ′ im Radikanden kompliziert. Man sieht aber
70
U. Stammbach: Analysis, Teil C
sofort, dass für die betrachtete Anwendung die Steigung der Biegelinie des Balkens immer sehr
klein sein wird. Es gilt deshalb näherungsweise
1 + y 02 ∼ 1 .
(8.24)
Es ergibt sich dann die Differentialgleichung der Biegelinie eines Balkens (siehe M.B. Sayir:
Mechanik 2, p. 107)
M (x)
.
EJ
y 00 =
(8.25)
Betrachten wir noch die spezielle Situation, wo der Balken an der Stelle l durch eine Einzellast P belastet wird. Ist P gegenüber dem Eigengewicht des Balkens gross, so darf letzteres
vernachlässigt werden. Wir erhalten dann
M (x) = −(l − x)P
und damit die Differentialgleichung
y 00 = −
(8.26)
(l − x)P
.
EJ
Diese einfache Differentialgleichung lässt sich durch zweimalige Integration direkt lösen. Man
hat
y 0 (x) =
y(x) =
P
1
(−lx + x2 + C1 ) ,
EJ
2
P
1
l
(− x2 + x3 + C1 x + C2 ) .
EJ 2
6
Einsetzen der Anfangsbedingungen (9.23) liefert C1 = 0, C2 = 0, so dass die Biegelinie des
Balkens durch
y(x) =
P
EJ
l
1
− x2 + x3
2
6
gegeben ist; insbesondere ist die Auslenkung an der Stelle x = l gegeben durch
71
Kapitel VII. Differentialgleichungen
y(l) = −
P l3
.
EJ 3
Wir haben in unserem Beispiel eine komplizierte Differentialgleichung (9.22) vereinfacht, indem
wir die Näherung (9.24) verwendet haben. Dies ist eine vielgeübte Praxis, die uns bereits bekannt
ist und darin besteht, dass man eine komplizierte Funktion durch ihre lineare Ersatzfunktion
ersetzt. In der Tat haben wir die Funktion
3
y 0 → (1 + y 02 ) 2 = g(y 0 )
in der Nähe des Punktes y 0 = 0 durch ihre lineare Ersatzfunktion ersetzt:
3
(1 + y 02 ) 2 ∼ g(0) + g0 (0)y 0 = 1 + 0 ,
denn g0 (0) = 0. Wir werden weiter unten noch mehrere ähnliche Beispiele kennenlernen. Die
Frage, “ob man das darf”, d.h. ob die Lösungen der vereinfachten Differentialgleichungen dann
auch Näherungen für die Lösungen der ursprünglichen Differentialgleichung sind, haben wir
mit gutem Grund hier nicht diskutiert. Sie führt auf heikle und schwierig zu behandelnde
mathematische Fragen (vgl. Burg, Haf, Wille III, S.72 ff.).
Betrachtet man an Stelle des links eingespannten Balkens den beidseitig aufgelegten Balken, so
nehmen die zusätzlichen Bedingungen eine andere Form an. Sie lauten dann nämlich
(8.27)
y(0) = 0 = y(l) ,
es sind somit “Randbedingungen” vorgegeben. Die Existenz und die Eindeutigkeit der Lösung
von (9.25), welche (9.27) erfüllt, folgen in dieser Situation nicht mehr aus unserem allgemeinen
Satz 8.1; sie müssen gesondert diskutiert werden.
Zum Abschluss dieses Abschnittes weisen wir noch darauf hin, dass ein enger Zusammenhang
zwischen Differentialgleichungen höherer Ordnung und Systemen von Differentialgleichungen
1. Ordnung besteht. Dazu werden wir weiter unten noch einiges zu sagen haben.
72
9
U. Stammbach: Analysis, Teil C
Lineare Differentialgleichungen höherer Ordnung
Die bei weitem wichtigste Klasse von Differentialgleichungen höherer Ordnung wird von den
linearen gebildet. Mit diesen werden wir uns in den Abschnitten 9, 10, 11 beschäftigen.
Die Differentialgleichung n-ter Ordnung
(9.1)
y (n) = f (x, y, y 0 , y 00 , . . . , y (n−1) )
heisst linear, wenn die Funktion f bezüglich der Variablen y,y 0 ,. . . ,y (n−1) linear ist. Die Gleichung (10.1) lässt sich in diesem Fall in der Form
(9.2)
y (n) + pn−1 (x) y (n−1) + · · · + p0 (x) y = q(x)
schreiben. Man beachte, dass über die hier auftretenden Funktionen pn−1 , pn−2 ,. . . , p0 , q keine
zusätzlichen Voraussetzungen getroffen werden; es sind beliebige stetige Funktionen. Für n = 1
ist (10.2) eine lineare Differentialgleichung 1. Ordnung. Ähnlich wie in Abschnitt 5 führen wir die
folgende Ausdrucksweise ein. Die Differentialgleichung (10.2) heisst homogen, wenn q(x) ≡ 0
gilt, andernfalls heisst sie inhomogen. In diesem Fall heisst q(x) das inhomogene Glied oder
Störglied. Die Differentialgleichung
(9.3)
y (n) + pn−1 (x) y (n−1) + · · · + p0 (x) y = 0
heisst die zu (10.2) gehörige homogene Differentialgleichung.
Im Folgenden wollen wir uns mit den Lösungen der homogenen Differentialgleichung (10.3)
beschäftigen und mit dem Zusammenhang zwischen den Lösungen der inhomogenen Differentialgleichung (10.2) und denjenigen der zugehörigen homogenen Differentialgleichung. Die Resultate
sind analog zu den Resultaten für lineare Differentialgleichungen 1. Ordnung, die wir in Abschnitt
5 behandelt haben.
(a)
Homogene lineare Differentialgleichungen
Wir beginnen mit dem folgenden
73
Kapitel VII. Differentialgleichungen
Satz 9.1 Es seien x → y1 (x), x → y2 (x), . . . , x → yk (x) Lösungen der homogenen linearen
Differentialgleichung (10.3). Dann ist für jede Wahl von C1 , C2 , . . . , Ck ∈ R die Funktion
x → y(x) = C1 y1 (x) + C2 y2 (x) + · · · + Ck yk (x)
(9.4)
eine Lösung der Differentialgleichung (10.3).
Der Beweis ergibt sich sofort durch Einsetzen. Man mache sich klar, dass die im Satz ausgesprochene Eigenschaft der Lösungen für nicht lineare und auch für inhomogene lineare Differentialgleichungen nicht erfüllt ist. In der Tat ist sie für homogene lineare Differentialgleichungen
charakteristisch.
In der linearen Algebra nennt man die durch (10.4) gegebene Funktion x → y(x) eine (reelle)
Linearkombination der Funktionen y1 , y2 , . . . , yk . Der Satz 9.1 lässt sich also in Kurzform wie
folgt aussprechen:
Für eine homogene lineare Differentialgleichung ist jede Linearkombination von Lösungen wiederum eine Lösung.
Beispiel
Es sei die offensichtlich lineare homogene Differentialgleichung
(9.5)
y 00 + 2y 0 + y = 0
gegeben. Man verifiziert leicht, dass die durch y1 (x) = e−x , y2 (x) = xe−x gegebene Funktionen
Lösungen sind. Nach Satz 9.1 ist dann jede Funktion der Form
(9.6)
x → y(x) = C1 e−x + C2 xe−x , C1 , C2 ∈ R
wiederum eine Lösung. Sucht man die spezielle Lösung, welche zu den Anfangsbedingungen
y(0) = 1, y 0 (0) = 2 gehört, so erhält man wegen
y 0 (x) = −C1 e−x + C2 e−x − C2 xe−x
das Gleichungssystem
74
U. Stammbach: Analysis, Teil C
C1
= 1
−C1 + C2 = 2
.
Die gesuchte spezielle Lösung ergibt sich also zu
(y)
e−x + 3xe−x
Fig. 1 :
Die spezielle Lösung x → y(x)
der Differentialgleichung
y 00 + 2y 0 + y = 0 mit y(0) = 1
und y 0 (0) = 2 als
Linearkombination der
Funktionen y1 (x) = e−x und
y2 (x) = xe−x
e−x
xe−x
(x)
y(x) = e−x + 3xe−x .
(siehe Figur 1). Man überzeugt sich leicht, dass sich durch (10.6) jede Anfangsbedingung der
(0)
(1)
Form y(x0 ) = y0 , y 0 (x0 ) = y0 auf eindeutige Art befriedigen lässt. Es handelt sich also bei
(10.6) um die allgemeine Lösung der Differentialgleichung (10.5). Dies illustriert unseren Satz
9.2. Um ihn zu formulieren erinnern wir an die folgende, aus der linearen Algebra stammende
Sprechweise. Die Funktionen x → y1 (x), x → y2 (x),. . . , x → yk (x) heissen linear unabhängig,
wenn aus
(9.7)
k
X
i=1
Ci yi (x) ≡ 0 , Ci ∈ R
75
Kapitel VII. Differentialgleichungen
stets folgt Ci = 0 für i = 1, 2, . . . , k, d.h. wenn sich die Nullfunktion nur in trivialer Weise als
Linearkombination darstellen lässt.
Satz 9.2 Es seien x → y1 (x), x → y2 (x),. . . , x → yn (x) linear unabhängige Lösungen der
Differentialgleichung (10.3). Dann ist die n-parametrige Schar
y(x) = C1 y1 (x) + C2 y2 (x) + · · · + Cn yn (x) , Ci ∈ R
(9.8)
die allgemeine Lösung der Differentialgleichung (10.3).
Beweis
Es ist zu zeigen, dass durch geeignete Wahl der Konstanten C1 , C2 , . . . , Cn jede
Anfangsbedingung der Form
(0)
(1)
(n−1)
y(x0 ) = y0 , y 0 (x0 ) = y0 , . . . , y (n−1) (x0 ) = y0
(9.9)
erfüllt werden kann. Dazu benötigen wir etwas lineare Algebra, sowie unseren Satz 8.1. Die
Bedingung (10.9) liefert für C1 , C2 , . . . , Cn das Gleichungssystem
(9.10)
C1 y1 (x0 )
C1 y10 (x0 )
..
.
(n−1)
C1 y1
+
+
C2 y2 (x0 )
C2 y20 (x0 )
..
.
(n−1)
(x0 ) + C2 y2
+···+
+···+
Cn yn (x0 )
Cn yn0 (x0 )
..
.
(n−1)
(x0 ) + · · · + Cn yn
=
=
(0)
y0
(1)
y0
..
.
.
(n−1)
(x0 ) = y0
Aus der linearen Algebra weiss man, dass das inhomogene Gleichungssystem (10.10) genau
(0) (1)
(n−1)
dann für beliebige y0 , y0 , . . . , y0
eine Lösung besitzt, wenn das zugehörige homogene
Gleichungssystem nur die triviale Lösung C1 = C2 = · · · = Cn = 0 zulässt. Das zu (10.10)
gehörige homogene Gleichungssystem wird offensichtlich einfach dadurch erhalten, dass man die
Anfangsbedingung
(9.11)
y(x0 ) = y 0 (x0 ) = · · · = y (n−1) (x0 ) = 0
studiert. Wir müssen also zeigen, dass diese Anfangsbedingung nur durch die triviale Wahl
C1 = C2 = · · · = Cn = 0 erfüllt wird.
Da nach der Eindeutigkeitsaussage in unserem Satz 8.1 die Lösung durch die Anfangsbedingung
eindeutig bestimmt wird, sehen wir, dass die Nullfunktion y(x) ≡ 0, die Lösung von (10.3) ist,
U. Stammbach: Analysis, Teil C
76
welche die Anfangsbedingung (9.11) erfüllt. Die Konstanten C1 , C2 , . . . , Cn müssen somit so
gewählt werden, dass
C1 y1 (x) + C2 y2 (x) + · · · + Cn yn (x) ≡ 0
gilt. Wegen der linearen Unabhängigkeit der Funktionen y1 , y2 , . . . , yn folgt dann mit (9.7) in
der Tat C1 = C2 = · · · = Cn = 0. Dies war zu beweisen.
Beispiel
Es sei die Differentialgleichung
y ′′ +
x
1
y′ −
y = 0
1−x
1−x
gegeben. Diese ist linear mit p1 (x) = x/(1 − x) und p0 (x) = −1/(1 − x) und ausserdem homogen. Man verifiziert leicht, dass die Funktionen x → y1 (x) = x, x → y2 (x) = ex Lösungen
sind. Nach Satz 9.1 ist somit jede Linearkombination
(9.12)
x → y(x) = C1 x + C2 ex , C1 , C2 ∈ R
wiederum eine Lösung. Da y1 und y2 linear unabhängig sind (warum?), folgt aus Satz 9.2, dass
die durch (9.12) gegebene Kurvenschar die allgemeine Lösung ist.
Zum Abschluss dieses Textabschnittes muss hier noch folgendes gesagt werden. Im Fall von
homogenen linearen Differentialgleichung 1. Ordnung lässt sich die allgemeine Lösung bekanntlich auf einfache Art durch Separieren erhalten (siehe Abschnitt 5). Dies ist bei homogenen
linearen Differentialgleichungen höherer Ordnung anders. Auch wenn unser Satz 9.2 die Form
der allgemeinen Lösung angibt, so lassen sich doch die linear unabhängigen Lösungsfunktionen
in vielen konkreten Fällen nicht elementar beschreiben. Es lässt sich zum Beispiel zeigen, dass
die allgemeine Lösung der einfachen Differentialgleichung y ′′ +xy = 0 nicht in elementarer Form
dargestellt werden kann. Hier, wie an so vielen Stellen der Theorie der Differentialgleichungen ist
man auf andere Verfahren angewiesen, insbesondere auf solche numerischer Art. Im Abschnitt
10 werden wir allerdings zwei wichtige Klassen von höheren linearen Differentialgleichungen
kennen lernen, bei denen sich die allgemeine Lösung explizit hinschreiben lässt. Unser Satz 9.2
wird dabei eine wichtige Rolle spielen. Hier, im Rest dieses vorliegenden Abschnittes wollen wir
uns noch mit dem Fall der inhomogenene linearen Differentialgleichungen auseinandersetzen.
(b) Inhomogene lineare Differentialgleichungen
Im Abschnitt 5 haben wir gesehen, dass sich die allgemeine Lösung einer inhomogenen linearen
Differentialgleichung 1. Ordnung als Superposition einer partikulären Lösung der inhomogenen
77
Kapitel VII. Differentialgleichungen
Differentialgleichung und der allgemeinen Lösung der zugehörigen homogenen Differentialgleichung darstellen lässt. Die zu diesem Resultat führenden Behauptungen A und B im Abschnitt
5 gelten offensichtlich auch für inhomogene lineare Differentialgleichungen höherer Ordnung.
Dies stellt man sofort fest, indem man den Beweis der Behauptungen A und B auf diesen Fall
überträgt. Damit gilt auch hier:
Man erhält die allgemeine Lösung der linearen Differentialgleichung
(10.2) indem man eine partikuläre Lösung y0 : x → y0 (x) nimmt und zu
ihr die allgemeine Lösung der zugehörigen homogenen Differentialgleichung (10.3) addiert.
Ist die allgemeine Lösung der homogenen Differentialgleichung (10.3) bekannt, so ist die Aufgabe
auf das Problem reduziert, eine partikuläre Lösung der inhomogenen Differentialgleichung (10.2)
zu bestimmen. Oft lässt sich diese partikuläre Lösung auf einfache Weise durch einen geschickt
gewählten Ansatz finden. Wie im Falle von linearen Differentialgleichungen 1. Ordnung versuche
man zuerst immer einen Ansatz in der Form des Störgliedes.
Beispiel
(9.13)
Die Differentialgleichung
y 00 + 2y 0 + y = sin(3x)
sei gegeben. Gesucht ist die Lösung, welche die Anfangsbedingung y(0) = y 0 (0) = 0 befriedigt.
Nach (10.6) hat die zugehörige homogene Differentialgleichung die allgemeine Lösung
x → C1 e−x + C2 xe−x , C1 , C2 ∈ R.
Um eine partikuläre Lösung von (10.13) zu erhalten, machen wir den Ansatz
y0 : x → A cos(3x) + B sin(3x) ,
also eine harmonische Schwingung derselben Kreisfrequenz wie das Störglied. Einsetzen in
(10.13) liefert für die Grössen A, B das Gleichungssystem
−8A + 6B = 0
−6A − 8B = 1
.
78
U. Stammbach: Analysis, Teil C
3
2
Daraus erhält man A = − 50
, B = − 25
. Die Funktion
y0 : x → −
3
2
cos(3x) −
sin(3x)
50
25
ist somit Lösung der inhomogenen Differentialgleichung (10.13). Die allgemeine Lösung lautet
demzufolge
(y)
y(x)
Fig. 2 :
Die partikuläre Lösung
y0 (x) = −
(x)
3
2
cos(3x)− sin(3x)
50
25
der Differentialgleichung
y 00 + 2y 0 + y = sin(3x) und die
spezielle Lösung x → y(x) mit
y(0) = 0 und y 0 (0) = 0
y0 (x)
y : x → C1 e−x + C2 xe−x −
3
2
cos(3x) −
sin(3x) , C1 , C2 ∈ R .
50
25
Die Anfangsbedingungen – diese kommt erst jetzt zum Zug – bestimmen schliesslich die Kon3
3
stanten C1 , C2 ; man erhält C1 = 50
, C2 = 10
. Die gesuchte spezielle Lösung lautet somit (siehe
Figur 2)
(9.14)
y: x→
3 −x
3
3
2
e + xe−x −
cos(3x) −
sin(3x) .
50
10
50
25
Kapitel VII. Differentialgleichungen
79
Nicht immer lässt sich allerdings eine partikuläre Lösung der inhomogenen Differentialgleichung
(10.2) durch einen einfachen Ansatz gewinnen. Zum Beispiel führt unsere Faustregel bei der
einfachen Differentialgleichung
y 00 + ω 2 y = P cos(ωx)
(9.15)
nicht zum Ziel, denn jede harmonische Schwingung der Kreisfrequenz ω ist ja eine Lösung
der zugehörigen homogenen Differentialgleichung. In solchen Fällen muss das kompliziertere
Verfahren von Lagrange (J. L. Lagrange 1736 - 1813) angewendet werden. Wir erklären
dieses im Falle von inhomogenen linearen Differentialgleichungen 2. Ordnung. Analoges gilt für
lineare Differentialgleichungen höherer Ordnung.
Es sei die Differentialgleichung
(9.16)
y 00 + p1 (x)y 0 + p0 (x)y = q(x)
gegeben. Die allgemeine Lösung der zugehörigen homogenen Differentialgleichung sei
x → C1 y1 (x) + C2 y2 (x) , C1 , C2 ∈ R .
Um eine partikuläre Lösung der Differentialgleichung (10.16) zu erhalten, macht man im Verfahren von Lagrange den Ansatz
(9.17)
y0 (x) = γ1 (x) y1 (x) + γ2 (x) y2 (x)
mit noch zu bestimmenden Funktionen γ1 , γ2 . Man beachte, dass sich jede beliebige Funktion in
der Form (10.17) schreiben lässt. Der Ansatz in dieser Form ist deshalb günstig, weil er erlaubt,
die Funktionen γ1 , γ2 , zu bestimmen, und zwar sogar dann – und das ist der Witz des Ansatzes
– wenn wir die zusätzliche Annahme
(9.18)
γ10 (x) y1 (x) + γ20 (x) y2 (x) ≡ 0
treffen. Diese Annahme macht, dass sich die Ableitung von y0 besonders einfach darstellen lässt.
Es gilt mit (10.18)
y00 = γ10 y1 + γ1 y10 + γ20 y2 + γ2 y20 = γ1 y10 + γ2 y20
y000 = γ10 y10 + γ1 y100 + γ20 y20 + γ2 y200
80
U. Stammbach: Analysis, Teil C
Einsetzen in (10.16) liefert dann
(9.19)
γ10 y10 + γ1 y100 + γ20 y20 + γ2 y200 + p1 (x) γ1 y10 + γ2 y20 + p0 (x) (γ1 y1 + γ2 y2 ) = q(x) .
Da y1 und y2 Lösungen der zu (10.16) gehörigen homogenen Differentialgleichung sind, reduziert
sich (10.19) auf
(9.20)
γ10 (x)y10 (x) + γ20 (x)y20 (x) = q(x) .
Aus den Gleichungen (10.18) und (10.20) lassen sich die unbekannten Funktionen γ10 , γ20 gewinnen; einfache Integration liefert dann γ1 , γ2 . Als explizites Beispiel für die Lagrange’schen
Methode behandeln wir das folgende Beispiel.
Beispiel
Die inhomogene lineare Differentialgleichung 2. Ordnung
y 00 + ω 2 y = P cos(ωx)
(9.21)
sei gegeben. Die zugehörige homogene lineare Differentialgleichung y 00 + ω 2 y = 0 hat als allgemeine Lösung
(9.22)
x → C1 cos(ωx) + C2 sin(ωx) , C1 , C2 ∈ R .
Für die partikuläre Lösung der inhomogenen Differentialgleichung (10.21) machen wir nach
Lagrange den Ansatz
(9.23)
y0 (x) = γ1 (x) cos(ωx) + γ2 (x) sin(ωx) ,
wobei wir als zusätzliche Annahme
(9.24)
γ10 (x) cos(ωx) + γ20 (x) sin(ωx) = 0
verwenden. Einsetzen von (10.23) in (10.21) liefert nach einigen Rechnungen
(9.25)
−γ10 (x) ω sin(ωx) + γ20 (x) ω cos(ωx) = P cos(ωx) .
81
Kapitel VII. Differentialgleichungen
Aus den Gleichungen (10.24) und (10.25) ergibt sich
γ10 (x)
=
γ20 (x)
=
−
P
cos(ωx) sin(ωx)
ω
P
cos2 (ωx) .
ω
Integration liefert dann
P
sin2 (ωx)
2ω 2
γ1 (x)
=
−
γ2 (x)
=
P
(sin(ωx) cos(ωx) + ωx) .
2ω 2
(Auf die Integrationskonstanten kann verzichtet werden, da wir nur eine partikuläre Lösung im
(y)
Fig. 3 :
Die partikuläre Lösung
(x)
x→
P
x sin(ωx)
2ω
der Differentialgleichung
y 00 + ω 2 y = P cos(ωx)
Auge haben.) Es ergibt sich aus (10.23)
y0 (x) = −
=
P
P
sin2 (ωx) cos(ωx) + 2 (sin2 (ωx) cos(ωx) + ωx sin(ωx))
2
2ω
2ω
P
x sin(ωx) .
2ω
82
U. Stammbach: Analysis, Teil C
Damit lässt sich die allgemeine Lösung von (10.21) in der Form
(9.26)
y(x) = (C1 cos(ωx) + C2 sin(ωx)) +
P
x sin (ωx) , C1 , C2 ∈ R
2ω
schreiben. Neben der harmonischen Schwingung mit Kreisfrequenz ω enthält sie einen Term mit
einer linear zunehmenden Amplitude (siehe Figur 3).
83
Kapitel VII. Differentialgleichungen
10
Zwei Klassen von leicht lösbaren linearen Differentialgleichungen
In diesem Abschnitt beschäftigen wir uns mit zwei Klassen von homogenen linearen Differentialgleichungen, welche in Anwendungenen häufig auftreten und deren allgemeine Lösung leicht
mit Hilfe eines Ansatzes gewonnen werden kann.
(a)
Homogene lineare Differentialgleichungen mit konstanten Koeffizienten
Es sei die Differentialgleichung
y (n) + an−1 y (n−1) + · · · + a0 y = 0
(10.1)
gegeben, wo a0 , a1 ,. . . , an−1 reelle Zahlen sind. Offensichtlich ist (11.1) eine lineare Differentialgleichung, in der die Koeffizienten von y, y 0 ,. . . , y (n−1) Konstanten sind; man nennt deshalb
(11.1) eine (homogene) lineare Differentialgleichung mit konstanten Koeffizienten.
Um die allgemeine Lösung von (11.1) zu finden, brauchen wir nach Satz 9.2 n linear unabhängige
Funktionen, welche (11.1) erfüllen. Zu diesem Zweck machen wir den Ansatz
x → y(x) = eαx
(10.2)
und versuchen, α durch Einsetzen in (11.1) zu bestimmen. Das liefert
eαx αn + an−1 αn−1 + · · · + a1 α + a0
= 0.
Daraus folgt, dass (11.2) genau dann eine Lösung von (11.1) ist, wenn α eine Nullstelle des
sogenannten charakteristischen Polynoms
(10.3)
ist.
α → αn + an−1 αn−1 + · · · + a1 α + a0
84
Beispiel
U. Stammbach: Analysis, Teil C
Es sei die Differentialgleichung
y 000 − 2y 00 − 3y 0 = 0
(10.4)
gegeben. Das charakteristische Polynom ist
α → α3 − 2α2 − 3α = α(α + 1)(α − 3) .
Es hat die Nullstellen α1 = 0, α2 = −1, α3 = 3. Daraus schliesst man, dass die Funktionen
x → e0x = 1 , x → e−x , x → e3x
Lösungen von (11.4) sind. Da sie linear unabhängig sind (warum?), ist nach unserem Satz 9.2
x → C1 + C2 e−x + C3 e3x , C1 , C2 , C3 ∈ R .
die allgemeine Lösung von (11.4).
Dieses Verfahren führt dann problemlos zu n linear unabhängigen Funktionen, wenn das charakteristische Polynom n verschiedene reelle Nullstellen besitzt. Dies braucht aber nicht der Fall
zu sein: es können mehrfache Nullstellen und es können komplexe Nullstellen auftreten. Da
letztere bei reellen Polynomen immer in konjugiert komplexen Paaren auftreten und die Summe
der Vielfachheiten der Nullstellen eines Polynoms n-ten Grades stets n ist, müssen wir zu jeder
k-fachen reellen Nullstelle k linear unabhängige Funktionen und zu jedem Paar konjugiert komplexer k-facher Nullstellen 2k linear unabhängige Funktionen finden. Diese erhalten wir nach
der folgenden Regel:
Ist α eine k-fache reelle Nullstelle des charakteristischen Polynoms (11.3), so sind die Funktionen
x → eαx , x → xeαx , . . . , x → xk−1 eαx
k linear unabhängige Lösungen der Differentialgleichung (11.1)
Ist α = a + ib, α = a − ib, b 6= 0 ein Paar konjugiert komplexer k-facher Nullstellen des
charakteristischen Polynoms (11.3), so sind die Funktionen
85
Kapitel VII. Differentialgleichungen
x → eax cos bx
x → xeax cos bx
..
.
x → xk−1 eax cos bx
x → eax sin bx
x → xeax sin bx
..
.
x → xk−1 eax sin bx
2k linear unabhängige Lösungen der Differentialgleichung (11.1).
Wir verzichten hier auf einen Beweis für diese beiden Regeln. Zur zweiten merken wir aber noch
Folgendes an. Ist a + ib eine komplexe Nullstelle des charakteristischen Polynoms, so ist die
komplexwertige Funktion
y1 : x → e(a+ib)x = eax (cos bx + i sin bx)
eine “Lösung” der Differentialgleichung. Da auch a − ib eine Nullstelle des charakteristischen
Polynoms ist, gilt dasselbe für
y2 : x → e(a−ib)x = eax (cos bx − i sin bx) .
Wegen der Linearität (bezüglich komplexer Zahlen) der Differentialgleichung müssen dann auch
die reellwertigen Funktionen
1
(y1 (x) + y2 (x))
2
=
eax cos bx
1
(y1 (x) − y2 (x))
2i
=
eax sin bx
Lösungen der Differentialgleichung (11.1) sein.
Beispiel
Gegeben sei die Differentialgleichung
(10.5)
y (4) + 2y 00 + y = 0 .
Das charakteristische Polynom lautet
α4 + 2α2 + 1 .
86
U. Stammbach: Analysis, Teil C
Es lässt sich schreiben als (α2 + 1)2 ; die Nullstellen sind α = ±i, beide mit Vielfachheit 2. Mit
Hilfe unserer Regel erhalten wir vier linear unabhängige Funktionen; deren reelle Linearkombinationen
y(x) = C1 cos x + C2 x cos x + C3 sin x + C4 x sin x ,
bilden die allgemeine Lösung der Differentialgleichung (11.5).
(b)
Homogene Eulersche Differentialgleichungen
Eine weitere Klasse von linearen Differentialgleichungen lässt sich ähnlich behandeln wie die
linearen Differentialgleichungen mit konstanten Koeffizienten, nämlich die Eulerschen Differentialgleichungen.
Eine Differentialgleichung n-ter Ordnung heisst Euler’sch, wenn sie sich in der Form
(10.6)
y (n) +
an−1 (n−1) an−2 (n−2)
a0
+ 2 y
+ ··· + ny = 0
y
x
x
x
mit a0 , a1 , . . . , an−1 ∈ R schreiben lässt.
Nach unserem Satz 9.2 besteht unsere Aufgabe darin, n linear unabhängige Funktionen zu
finden, welche (11.6) erfüllen. Ähnlich wie für lineare Differentialgleichungen mit konstanten
Koeffizienten gewinnen wir diese mit Hilfe eines Ansatzes. Wir setzen
(10.7)
y(x) = xα
und versuchen α durch Einsetzen in (11.6) zu bestimmen. Wir erhalten
α(α − 1) · · · (α − n + 1) xα−n + an−1 α(α − 1) · · · (α − n + 2) xα−n + · · · + a0 xα−n = 0 .
Es folgt, dass (11.7) genau dann eine Lösung der Differentialgleichung (11.6) liefert, wenn α eine
Nullstelle des sogenannten Indexpolynoms
(10.8)
α(α − 1) · · · (α − n + 1) + an−1 α(α − 1) · · · (α − n + 2) + · · · + a0
ist. Hat das Indexpolynom n verschiedene reelle Nullstellen, so liefert dieses Verfahren n linear
unabhängige Funktionen, welche (11.6) erfüllen. Wie bei linearen Differentialgleichungen mit
87
Kapitel VII. Differentialgleichungen
konstanten Koeffizienten müssen die Fälle von mehrfachen Nullstellen und komplexen Nullstellen
zusätzlich behandelt werden. Wir merken ohne Beweis die folgende Regel an:
Ist α eine k-fache reelle Nullstelle des Indexpolynoms (11.8), so sind die Funktionen
x → xα , x → (log x)xα , . . . , x → (log x)k−1 xα
k linear unabhängige Lösungen der Differentialgleichung (11.6).
Ist α = a + ib, α = a − ib, b 6= 0 ein Paar konjugiert komplexer k-facher Nullstellen des
Indexpolynoms (11.8), so sind die Funktionen
x → xa cos(b log x)
x → (log x)xa cos(b log x)
..
.
x → xa sin(b log x)
x → (log x)xa sin(b log x)
..
.
x → (log x)k−1 xa cos(b log x) x → (log x)k−1 xa sin(b log x)
2k linear unabhängige Lösungen der Differentialgleichung (11.6)
Beispiel Untersucht man die stationäre Temperaturverteilung auf einer homogenen Kreisscheibe oder auf einem homogenen Kreisring, so tritt (siehe Analysis III) auf natürliche Weise
die folgende Differentialgleichung für r → y(r)
(10.9)
1
m2
y 00 + y 0 − 2 y = 0
r
r
auf. Dabei bezeichnet r den Abstand vom Mittelpunkt der Kreisscheibe, und m ist eine beliebige
natürliche Zahl. Die homogene lineare Differentialgleichung (11.9) ist offensichtlich Euler’sch.
Das Indexpolynom lautet
α(α − 1) + α − m2 = α2 − m2 .
Ist m > 0, so sind α = ±m die beiden Nullstellen des Indexpolynoms. Die allgemeine Lösung
der Differentialgleichung (11.9) lautet in diesem Fall
y(r) = C1 r m + C2 r −m , C1 , C2 ∈ R .
88
U. Stammbach: Analysis, Teil C
Ist m = 0, so ist α = 0 eine doppelte Nullstelle des Indexpolynoms. Nach unserer Regel ist in
diesem Fall die allgemeine Lösung von (11.9) durch
y(r) = C1 + C2 log r , C1 , C2 ∈ R
gegeben.
Wir schliessen diesen Abschnitt mit der folgenden Bemerkung. Die allgemeine Lösung der Eulerschen Differentialgleichungen ergibt sich formal ganz analog zur Lösung einer linearen Differentialgleichung mit konstanten Koeffizienten. In der Tat lässt sich eine Eulersche Differentialgleichung für die Funktion x → y(x) durch die einfache Substitution x = et auf eine Differentialgleichung mit konstanten Koeffizienten für die Funktion t → y(et ) zurückführen. Das Indexpolynom
geht dann ins charakteristische Polynom über. Wir überlassen es dem Leser, die Details dieser
Substitution durchzuführen.
89
Kapitel VII. Differentialgleichungen
11
Schwingungsprobleme
In diesem Abschnitt betrachten wir eine wichtige Anwendung der bis hierher entwickelten Theorie. Wir gehen dabei von zwei ganz verschiedenen konkreten Problemen aus und stellen fest,
dass deren Verhalten durch ein und dieselbe lineare Differentialgleichung 2. Ordnung beschrieben
wird. Diese Differentialgleichung diskutieren wir schliesslich im Detail.
Das erste der beiden Probleme ist die gedämpfte Federschwingung. Ein Massenpunkt der Masse
m sei an einer idealen Feder aufgehängt (siehe Figur 1). Die Auslenkung zur Zeit t aus der
Ruhelage werde durch x(t) beschrieben.
Fig. 1 :
Gedämpfte Federschwingung
x
−kx
−wẋ
S(t)
Auf den Massenpunkt wirke die Federkraft F = −kx, wobei k > 0 eine Proportionalitätskonstante ist, und eine Dämpfungskraft W . Für W benützen wir die Modellvorstellung, dass W proportional zur Geschwindigkeit ẋ(t) sei,
W = −wẋ , w > 0 .
90
U. Stammbach: Analysis, Teil C
Ferner wirke auf m eine von t abhängige äussere Kraft S(t). Das Newton’sche Gesetz liefert
dann die Bewegungsdifferentialgleichung
mẍ = −kx − wẋ + S(t) .
Führen wir die Grössen
s
ω=
k
w
S(t)
, λ=
, s(t) =
m
2m
m
ein, so lautet die Differentialgleichung
ẍ + 2λẋ + ω 2 x = s(t) .
(11.1)
Es handelt sich somit um eine inhomogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten.
Als zweites konkretes Problem betrachten wir einen elektrischen Stromkreis, welcher eine Kapazität C, eine Induktivität L und einen Ohm’schen Widerstand R enthält (siehe Figur 2).
Ausserdem werde an den Klemmen eine von t abhängige Spannung u(t) angelegt.
Gesucht ist der zur Zeit t im Stromkreis fliessende Strom I(t). Aus der Physik weiss man,
dass der Spannungsabfall am Ohm’schen Widerstand R durch uR = RI gegeben ist, derjenige
an der Induktivität durch uL = L dI
dt und derjenige am Kondensator mit Kapazität C durch
uC = q/C, wo q die zur Zeit t auf C sitzende Ladung bezeichnet. Natürlich gilt I(t) = q̇(t). Das
Kirchhoff’sche Gesetz liefert
uR + uL + uC = u(t) .
Setzt man die obigen Werte ein, so erhält man
L
dI
q(t)
+ RI +
= u(t)
dt
C
und nach Ableitung nach t
(11.2)
L
d2 I
dI
1
d
+R
+
I =
u(t) .
2
dt
dt
C
dt
91
Kapitel VII. Differentialgleichungen
C
Fig. 2 :
Elektrischer Schwingkreis
R
L
u(t)
Führt man die Grössen
ω2 =
1
R
1 d
, λ=
, s(t) =
u(t), I(t) = x(t) ,
CL
2L
L dt
ein, so geht (11.2) in die Differentialgleichung (11.1) über. Vom mathematischen Standpunkt
aus genügt es deshalb, sich mit (11.1) zu befassen. Wir haben hier wiederum ein Beispiel vor
uns, wo zwei ganz verschiedene konkrete Probleme auf ein und dasselbe mathematische Modell
führen.
Im Folgenden diskutieren wir (11.1) und betrachten zu diesem Zweck zuerst die zugehörige
homogene Differentialgleichung
(11.3)
ẍ + 2λẋ + ω 2 x = 0 .
Dies ist eine homogene lineare Differentialgleichung mit konstanten Koeffizienten. Das charakteristische Polynom lautet
92
U. Stammbach: Analysis, Teil C
α → α2 + 2λα + ω 2 ,
hat also die Nullstellen
(11.4)
α1,2 = −λ ±
p
λ2 − ω 2 .
Je nach der Lage dieser Nullstellen sind verschiedene Fälle zu unterscheiden.
(a) λ > ω, sogenannte starke Dämpfung
In diesem Fall hat man zwei verschiedene reelle Nullstellen des charakteristischen Polynoms.
Die allgemeine Lösung von (11.3) lautet
(11.5)
xh (t) = C1 eα1 t + C2 eα2 t .
Man beachte, dass beide Nullstellen negativ sind, so dass xh (t) für jede Wahl von C1 , C2 exponentiell abklingt.
(b) λ = ω, sogenannte kritische Dämpfung
Hier hat das charakteristische Polynom eine doppelte Nullstelle α1 = α2 = −λ. Die allgemeine
Lösung von (11.3) lautet
(11.6)
xh (t) = C1 e−λt + C2 t e−λt .
Auch hier klingt xh (t) für jede Wahl von C1 , C2 exponentiell ab.
(c) λ < ω, sogenannte schwache Dämpfung
In diesem √
Fall hat das charakteristische Polynom zwei konjugiert komplexe Nullstellen. Setzt
man ω ∗ = ω 2 − λ2 , so gilt α1,2 = −λ ± iω ∗ . Die allgemeine Lösung von (11.3) lautet dann
(11.7)
xh (t) = e−λt (C1 cos(ω ∗ t) + C2 sin(ω ∗ t)) .
Jede spezielle Lösung von (11.3) ist in diesem Fall eine “exponentiell abklingende harmonische
Schwingung” der Kreisfrequenz ω ∗ (siehe Figur 3). Man beachte ferner, dass ω ∗ kleiner ist als
die Kreisfrequenz ω der ungedämpften Schwingung (λ = 0).
93
Kapitel VII. Differentialgleichungen
(x)
(t)
Fig. 3 :
Die Lösung t → x(t) mit
x(0) = 1 und ẋ(0) = 0 der
Schwingungsgleichung
ẍ + 2λẋ + ω 2 x = 0
zu verschiedenen Werten von λ.
Die gestrichelte Kurve entspricht
der kritischen Dämpfung λ = ω
Als nächstes diskutieren wir die inhomogene Differentialgleichung (11.1), und zwar wollen wir
den Fall betrachten, wo s(t) durch
s(t) = P cos(σt)
gegeben ist. Wir haben also die Differentialgleichung
(11.8)
ẍ + 2λẋ + ω 2 x = P cos(σt)
vor uns. Nach der Theorie setzt sich die allgemeine Lösung von (11.8) additiv aus einer partikulären Lösung x0 (t) von (11.8) und der allgemeine Lösung xh (t) der zugehörigen homogenen
Differentialgleichung (11.3) zusammen:
x(t) = x0 (t) + xh (t) .
Wir haben oben gesehen, dass in jedem Fall die Funktion xh exponentiell abklingt; somit wird
für grosse t
94
U. Stammbach: Analysis, Teil C
x(t) ∼ x0 (t)
gelten. Für x0 (t) können wir deshalb die sogenannte stationäre Lösung einsetzen, nämlich
diejenige, die sich “nach langer Zeit” einstellt. Die Erfahrung (des Physikers mit Stromkreisen,
etc.) zeigt, dass dies eine harmonische Schwingung mit der Kreisfrequenz σ der Anregung
sein wird. Wir machen deshalb für x0 den Ansatz (übrigens in Übereinstimmung mit unserer
Faustregel)
x0 (t) = A cos(σt + α) .
(11.9)
Die noch unbekannte Amplitude A und die Phasenverschiebung α werden durch Einsetzen in
(11.8) gewonnen. Wir erhalten (nach längerer Rechnung)
Fig. 4 :
Das Verhalten der Funktion
σ → A2 (σ) für verschiedene
Werte von λ
P 2 /ω 4
(σ)



tan α








A2
=
2λσ
,
σ2 − ω2
=
P2
.
4λ2 σ 2 + (σ 2 − ω 2 )2
95
Kapitel VII. Differentialgleichungen
schwache
Dämpfung
starke
Dämpfung
ω
Resonanz
möglich
(λ)
Fig. 5 :
Dämpfung und Resonanz
keine Resonanz
√1 ω
2
ω
(λ)
Wir diskutieren hier die (zwar ebenfalls interessante und wichtige) Abhängigkeit der Phasenverschiebung α von σ, ω, λ nicht weiter, sondern konzentrieren uns auf die Amplitude A, und
untersuchen zu diesem Zweck den Graphen der Funktion σ → A2 (σ) (siehe Figur 4).
Um die Stellen mit horizontaler Tangente zu berechnen, setzen wir
d 2
8λ2 σ + 2(σ 2 − ω 2 )2σ
= 0.
A (σ) = −P 2
dσ
(4λ2 σ 2 + (σ 2 − ω 2 )2 )2
Dies führt auf σ1 = 0 und wegen 2λ2 + (σ22 − ω 2 ) = 0 auf
(11.10)
σ22 = ω 2 − 2λ2 .
Das Verhalten von A2 (σ) ist somit stark abhängig von den Grössen ω, λ. Wir erhalten die
folgenden, qualitativ unterschiedlichen Fälle (siehe Figur 5).
(a) Starke Dämpfung und kritische Dämpfung, ω ≤ λ
In diesem Fall hat man nur eine horizontale Tangente; die Funktion σ → A2 (σ) nimmt mit
zunehmendem σ monoton ab.
96
U. Stammbach: Analysis, Teil C
(y)
(t)
Fig. 6 :
Die Funktionen t → P cos(σt)
(gestrichelt) und die
zugehörigen stationären
Lösungen (ausgezogen) der
Differentialgleichung
ẍ + 2λẋ + ω 2 x = P cos(σt)
mit schwacher Dämpfung zu
verschiedenen Werten
von σ mit σ ≤ σ2 .
(y)
(t)
Fig. 7 :
Die Funktionen t → P cos(σt)
(gestrichelt) und die
zugehörigen stationären
Lösungen (ausgezogen) der
Differentialgleichung
ẍ + 2λẋ + ω 2 x = P cos(σt)
mit schwacher Dämpfung zu
verschiedenen Werten
von σ mit σ ≥ σ2 .
97
Kapitel VII. Differentialgleichungen
(b) Schwache Dämpfung, λ < ω
Hier sind wiederum zwei Fälle zu unterscheiden
(ba)
√1 ω
2
≤λ<ω
In diesem Fall ist ω 2 − 2λ2 ≤ 0. Man erhält für σ = 0 eine horizontale Tangente. Für σ > 0 ist
die Funktion σ → A2 (σ) strikt monoton fallend.
(bb) 0 < λ <
√1 ω
2
In diesem Fall√ist ω 2 − 2λ2 > 0 und man hat zwei horizontale Tangenten, nämlich bei σ1 = 0
und bei σ2 = ω 2 − 2λ2 . In σ2 nimmt A2 (σ) offenbar das Maximum an. Die Frequenz σ2 heisst
Resonanzfrequenz. Sie ist kleiner als die Eigenfrequenz ω. Jenseits der Resonanzfrequenz nimmt
A2 (σ) monoton ab (siehe Figuren 6,7).
Bemerkung Für λ = 0 (keine Dämpfung) hat man ein ähnliches Verhalten. Alle Herleitungen
bleiben für σ 6= ω gültig. Der Fall σ = ω muss genauer untersucht werden, denn an dieser Stelle
hat die Funktion σ → A2 (σ) einen Pol. Die Differentialgleichung
ẍ + ω 2 x = P cos(ωt)
hat auch eine etwas anders geartete partikuläre Lösung. Es gilt (siehe (9.26))
x(t) = C1 cos(ωt) + C2 sin(ωt) +
P
t sin(ωt) .
2ω
Die Schwingungsgleichung, wie wir sie in (11.1) vor uns haben, gibt uns noch zu einigen allgemeinen Bemerkungen Anlass. Wir haben bereits gesehen, dass der homogene Anteil der
Differentialgleichung (11.1) das System an sich beschreibt und das inhomogene Glied die “äussere
Anregung” (es heisst deshalb ja auch treffend “Störglied”). In unserem Modell wird das System durch eine homogene lineare Differentialgleichung mit konstanten Koeffizienten beschrieben.
Der Leser hat sich vielleicht bereits gefragt, ob damit die reale Situation nicht allzu vereinfacht
dargestellt wird. Zu dieser Frage wollen wir hier noch einige Worte sagen. Gehen wir zurück zur
konkreten Situation eines Massenpunktes, welcher sich längs einer Gerade bewegt und auf den
Kräfte wirken, welche von der Lage x(t) und von der Geschwingigkeit ẋ(t) des Massenpunktes
abhängen. Die Totalkraft K ist dann also durch eine Funktion von x und ẋ gegeben. Das
Newton’sche Gesetz liefert
(11.11)
mẍ = K(x, ẋ) .
98
U. Stammbach: Analysis, Teil C
Wir denken uns ferner ein Koordinatensystem so eingeführt, dass x = 0 der Ruhelage des
Massenpunktes entspricht. Dies hat die Konsequenz, dass K(0, 0) = 0. Im allgemeinen ist K
eine schwer zu beschreibende, komplizierte Funktion, und man wird sich in konkreten Fällen
immer mit Approximationen zufrieden geben müssen. Als einfachste solche Approximation
drängt sich die lineare Ersatzfunktion auf:
(11.12)
K(x, ẋ) ∼ K(0, 0) + xKx (0, 0) + ẋKẋ (0, 0) .
Diese ist bekanntlich in der Umgebung des Nullpunktes eine “gute” Approximation. Ersetzt man
in der Differentialgleichung (11.11) die komplizierte Funktion K durch die lineare Ersatzfunktion
(11.12) und beachtet man zusätzlich K(0, 0) = 0, so erhält man mit a = Kx (0, 0), b = Kẋ (0, 0)
die Differentialgleichung
(11.13)
mẍ = ax + bẋ .
Dies entspricht gerade unserer homogenen Schwingungsdifferentialgleichung. Jetzt ist es nicht
mehr überraschend, dass die Differentialgleichung linear ist und dass a, b Konstanten sind: wir
haben uns eben mit Absicht auf diesen einfachen Fall beschränkt. Es bleibt natürlich die Frage
offen, wie gut die Lösungen der vereinfachten Differentialgleichung (11.13) die Lösungen der
“richtigen” Differentialgleichung (11.11) wiedergeben. Diese Frage führt auf diffizile und sehr interessante mathematische Probleme, auf die wir hier nicht eingehen. Immerhin wollen wir folgendes festhalten. Wir wissen bereits, dass die Approximation von K durch die lineare Ersatzfunktion umso besser ist, je kleiner x und ẋ sind. Es ist deshalb plausibel und es kann auch mathematisch bewiesen werden, dass die Lösungen der vereinfachten Differentialgleichung (11.13) die
Lösungen der ursprünglichen Differentialgleichung (11.11) umso besser wiedergeben, je kleiner x
und ẋ sind. Die Folgerung, die der Anwender daraus ziehen muss, ist diese: Die Differentialgleichung (11.1) beschreibt zwar eine ideale gedämpfte Federschwingung eines Massenpunktes; die
Differentialgleichung “gilt” aber für in einer Dimension schwingende Massenpunkte ganz allgemein, wenn nur die Auslenkung aus der Ruhelage und die Geschwindigkeit des Massenpunktes
klein bleiben.
Beispiel
Um das eben Gesagte an einer bekannten Situation zu illustrieren, betrachten wir
noch kurz das mathematische Pendel. Ein Massenpunkt der Masse m sei an einer gewichtslosen
Faden der Länge l aufgehängt.
Wir beschreiben die Lage des Massenpunktes mit Hilfe des Winkels ϕ. Dann gilt in der (einzig
interessanten) Tangentialrichtung nach dem Newton’schen Gesetz
mlϕ̈ = −mg sin ϕ .
99
Kapitel VII. Differentialgleichungen
Für die Funktion t → ϕ(t) erhalten wir die Differentialgleichung
g
ϕ̈ = − sin ϕ .
l
(11.14)
Wir vereinfachen nun gemäss dem oben Gesagtem die rechte Seite dieser Gleichung, indem wir
ϕ → f (ϕ) = sin ϕ ersetzen durch die lineare Ersatzfunktion bezüglich ϕ = 0. (Man beachte,
dass ϕ = 0 die Ruhelage beschreibt). Die lineare Ersatzfunktion ist gegeben durch
ϕ → f (0) + f 0 (0)ϕ = sin(0) + cos(0)ϕ = ϕ .
Damit erhalten wir statt der “komplizierten” Differentialgleichung (11.14) die “einfache” lineare
Differentialgleichung
(11.15)
g
ϕ̈ = − ϕ ,
l
die üblicherweise als Differentialgleichung des mathematischen Pendels bekannt ist.
Wir schliessen diesen Abschnitt über Schwingungsprobleme mit einigen Beispielen, die alle aus
dem Tätigkeitsbereich von Ingenieuren stammen.
Empfang von Radiowellen
Im ersten Beispiel geht es um eine positive Anwendung des Resonanzphänomens und zwar um
den Empfang von Radiowellen. Die verschiedenen Übertragungsfrequenzen der Sender führen
am Empfangsort zu einem wirren Gemisch von Radiowellen, welches einer Überlagerung von harmonischen Schwingungen der elektrischen Feldstärke mit verschiedenen Frequenzen entspricht.
Das Empfangsgerät hat die Aufgabe, aus diesem ganzen Spektrum, nur das Signal in der Frequenz des gewünschten Senders aufzunehmen und es anschliessend zu verstärken. Dieses Aussortieren geschieht mit Hilfe von Resonanz. Im wesentlichen benützt man dafür einen Stromkreis
der oben betrachteten Art, der in Serie eine Kapazität, einen Ohm’schen Widerstand und eine Induktivität enthält. An die Klemmen wird die Antennenspannung angelegt. Diese variiert gemäss
der Überlagerung aller einstrahlender Radiowellen. Man sorgt nun dafür, dass der Stromkreis
schwach gedämpft ist – mit schmaler Resonanzkurve – und dass die Resonanzfrequenz gerade mit
der Frequenz des gewünschten Senders übereinstimmt. Jeder Frequenzanteil des empfangenene
Totalsignals erzeugt im Stromkreis einen entsprechenden Anteil des Gesamtstromes. Gemäss
unseren Resultaten wird dabei die Resonanzfrequenz “bevorzugt” behandelt. Dies führt bei
schmaler Resonanzkurve dazu, dass der Anteil des Stromes, der auf das Signal dieser Frequenz zurückzuführen ist, weit grösser ist als die von den anderen Frequenzen herrührenden
100
U. Stammbach: Analysis, Teil C
Anteile. Das zur Resonanzfrequenz gehörende Signal ist damit gegenüber den Signalen der anderen Sender hervorgehoben worden. Es wird anschliessend mit Hilfe von Radioröhren oder
Transistoren verstärkt.
Turnhalle
Das zweite Beispiel zeigt, dass Resonanzphänomene auch bei Bauwerken eine grosse Rolle spielen
können. Dies ist deshalb etwas überraschend, weil Bauwerke im Normalfall nur auf die statische
Beanspruchung ausgelegt werden. Möglicherweise auftretende dynamischen Effekte werden oft
gar nicht berücksichtigt. – Es handelt sich um eine Turnhalle, die vor nicht vor nicht allzu langer
Zeit in der Umgebung von Zürich gebaut worden ist. Der folgende Abschnitt stammt aus dem
Sanierungsbericht von Professor H. Bachmann von der Abteilung für Bauingenieurwesen an der
ETH-Zürich.
“Bei einer doppelstöckigen Turnhalle traten bald nach der Inbetriebnahme starke Bauwerksschwingungen auf. Diese wurden dann beobachtet, wenn in der oberen Halle zu rhythmischer
Musik moderne Konditionstrainigs, das heisst Lauf-, Hüpf- und Sprungübungen durchgeführt
wurden. Die Schwingungen äusserten sich insbesondere in der unteren Halle durch sichtbare
Durchbiegungen der Zwischendecke, durch horizontale Fassadenbewegungen und durch einen
erheblichen Lärm. Dieser wurde hervorgerufen durch das Mitschwingen und Klappern der Eingangstüre und des Tores zum Geräteraum, sowie von an Decke, Fassaden und Wänden befestigten Ausstattungsteilen und Turngeräten. Ferner konnte bei geöffneter Eingangstüre ein
starker rhythmischer Luftzug in Folge Kompression und Dekompression des Hallenvolumens
verspürt werden. Dies Wirkungen führten dazu, dass immer wieder Personen die untere Halle
verliessen, sobald in der oberen Halle Konditionstrainings durchgeführt wurden.”
Zum Zwecke der Sanierung wurden an der Turnhalle Messungen durchgeführt, die zeigten,
dass bei der Schwingung der Zwischendecke Beschleunigungen bis zur Hälfte der Erdbeschleunigung auftraten. Man hat ferner auch eine Rissaufnahme an den Trägern der Zwischendecke
durchgeführt, und Risse festgestellt, die mehr als einen halben Millimeter Breite aufweisen.
Der Grund für die Schwingungen ist ein Resonanzphänomen. Berechnungen zeigten, dass
die Zwischendecke ein schwach gedämpftes, schwingungsfähiges System bildete, das durch das
Hüpfen, Laufen und Springen der Turnenden in periodischer Weise angeregt wurde. Es ist nach
unserer Theorie klar, dass in diesem System Resonanz auftreten wird, wenn die Hüpffrequenz
mit der Resonanzfrequenz übereinstimmt. Das wusste natürlich auch der Bauingenieur, der
diese Turnhalle gebaut hatte. Die Sachlage war hier aber etwas komplizierter. Es zeigte sich,
dass die Resonanzfrequenz der Zwischendecke bei ungefähr 4.8 Hz lag, während bei Lauf- oder
Hüpfübungen Frequenzen von 2.4 bis 2.5 Hz auftreten. Der Bauingenieur hatte gelernt, dass
bei Anregungsfrequenzen unterhalb der Resonanzfrequenz keine Resonanz auftreten kann und er
fühlte sich deshalb sicher. Die Sache ist nun aber die, dass diese Aussage nur für rein harmonische Anregungskräfte gilt. Die durch das Hüpfen oder Laufen von Turnenden auf den Zwischenboden ausgeübte Kraft ist aber nicht rein harmonisch, sondern besteht annäherungsweise aus
periodisch auftretenden rechteckförmigen Stössen. Um Aussagen über das Resonanzverhalten
zu machen, muss man diese Anregungskraft in eine Überlagerung von harmonischen Anteilen
Kapitel VII. Differentialgleichungen
101
zerlegen. Das geschieht mit Hilfe der Fourier-Zerlegung. In dieser Zerlegung treten automatisch
auch harmonische Anteile der doppelten Anregungsfrequenz, der dreifachen, usw. auf. Es ist
natürlich die doppelte Anregungsfrequenz, die hier mit der Resonanzfrequenz der Zwischendecke
übereinstimmte und zu den unangenehmen Erscheinungen führte.
Die Turnhalle wurde saniert, indem die Zwischendecke versteift wurde. Damit erreichte man
eine höhere Eigenfrequenz (zirka 8 Hz). Resonanzschwingungen waren damit zwar nicht völlig
ausgeschlossen, aber ihre Auswirkungenen lagen innerhalb der zulässigen Grenzen.
Webereigebäude
Resonanzerscheinungen spielen bei Maschinen mit rotierenden und oszillierenden Teilen oft eine
wichtige und unangenehme Rolle. Wir erwähnen hier den Fall eines Webereigebäudes1 .
“Im unterkellerten Maschinensaal eines rund 20 Jahre alten Webereigebäudes traten nach einer
Umrüstung auf moderne, schneller laufende Maschinen starke Schwingungen auf. Bei eingehenden Messungen wurden an der die Maschinen tragenden Decke vertikale Schwinggeschwindigkeiten von bis zu 24mm/s festgestellt [als Normwert gilt 10 mm/s!]. Auch die Maschinenschwingungen waren mit einer Schwingbreite (zweifache Amplitude) in horizontaler Richtung von
1.2 mm beträchtlich. Als zulässig wurde im vorliegenden Fall rund 1 mm erachtet. Höhere Werte
wären zwar für die Maschinen gefahrlos gewesen, hingegen konnten sich bei feinen Geweben textiltechnische Probleme ergeben, da der Schusseintrag beeinträchtigt wurde.”
Der Grund für die Bauwerksschwingungen war eine Resonanzerscheinung. Messungen ergaben
als Grundfrequenz der Betondecke rund 21 Hz. “Die vor der Umrüstung vorhandenen Webmaschinen hatten Drehzahlen von rund 200 U/min, d.h. sie liefen mit rund 3.3 Hz. Die neuen
Maschinen liefen, je nach zu fabrizierendem Gewebe, mit 240 bis 290 U/min, d.h. mit bis
zu rund 4.8 Hz. Es war somit offensichtlich, dass die Deckenschwingungen vor allem durch
obere Harmonische (4.,5.) des nicht näher bekannten zeitlichen Verlaufs der Last hervorgerufen
wurden” [d.h. durch diejenigen harmonischen Anteile in der Fourier-Zerlegung der anregenden
Schwingung, welche die vier bzw. fünffache Frequenz der Grundfrequenz aufweisen].
“Eine [sogenannte] Tiefabstimmung, d.h. eine Lagerung der Maschinen auf weichen Feder(Dämpfer-)Elementen, kam nicht in Frage. Wohl wären dadurch die Deckenschwingungen vermindert worden, doch hätten sich noch stärkere Maschinenschwingungen ergeben, was aus textiltechnischen Gründen nicht zulässig war. Deshalb wurde eine Deckenverstärkung [...] vorgenommen.” Das Ziel dieser Massnahme war, die Grundfrequenz der Decke soweit zu erhöhen, dass
Resonanzerscheinungen in nur noch geringem Masse auftreten konnten.
“Die Sanierungsmassnahmen waren erfolgreich. Wie erneute Messungen zeigten, wurde [...] der
Richtwert der Schwinggeschwindigkeit von 10 mm/s praktisch nicht mehr überschritten. Die
Maschinenschwingungen waren ebenfalls erheblich kleiner als vor der Sanierung, und es traten
somit keine produktionstechnischen Probleme mehr auf.”
1
siehe H. Bachmann, W. Ammann: Schwingungsprobleme bei Bauwerken, 1987
102
12
U. Stammbach: Analysis, Teil C
Systeme von Differentialgleichungen
Wir wollen in den drei letzten Abschnitten dieses Kapitels Systeme von Differentialgleichungen
1. Ordnung betrachten. Dabei beschränken wir uns, vor allem um die Darstellung möglichst anschaulich zu halten, auf Systeme von zwei Differentialgleichungen. Die Übertragung auf grössere
Systeme wird dem Leser keine Schwierigkeiten machen. Im vorliegenden Abschnitt stellen wir
einige einfache Tatsachen zusammen, im nächsten Abschnitt beschäftigen wir uns eingehender
mit linearen autonomen Systemen, und im übernächsten Abschnitt sprechen wir kurz über das
Stabilitätsverhalten der Lösungen.
Unter einem System von Differentialgleichungen 1. Ordnung für die Funktionen x → y1 (x), x →
y2 (x) versteht man zwei Differentialgleichungen der Form
(12.1)
y10 = f1 (x, y1 , y2 )
y20 = f2 (x, y1 , y2 )
,
wobei f1 , f2 Funktionen der drei Variabeln x, y1 , y2 sind. Eine Lösung des Systems (12.1) ist ein
Paar von Funktionen
x → y1 (x) , x → y2 (x),
welche die beiden Gleichungen des Systems simultan erfüllen.
Beispiel Es sei die Differentialgleichung zweiter Ordnung
(12.2)
y 00 = F (x, y, y 0 )
gegeben. Führen wir die neuen Funktionen x → y1 (x) = y(x) und x → y2 (x) = y 0 (x) ein, so
erhalten wir ein System von Differentialgleichungen 1. Ordnung
(12.3)
y10 =
y2
0
y2 = F (x, y1 , y2 )
.
Es ist klar, dass jede Lösung der Differentialgleichung (12.2) Anlass gibt zu einer Lösung des
Systems (12.3) und umgekehrt. Daraus folgt, dass man statt Differentialgleichungen höherer
Ordnung auch Systeme von Differentialgleichungen 1. Ordnung betrachten kann.
Wie für Differentialgleichungen höherer Ordnung gilt für Systeme ein Existenz- und Eindeutigkeitssatz:
103
Kapitel VII. Differentialgleichungen
Satz 12.1 Es sei das System (12.1) von zwei Differentialgleichungen 1. Ordnung gegeben. Die
Funktionen f1 , f2 seien stetig in x und stetig partiell nach y1 , y2 differenzierbar. Dann gibt es zu
vorgegebenen x0 , y1,0 , y2,0 genau ein Paar von Funktionen x → y1 (x), x → y2 (x), welches Lösung
des Systems (12.1) ist und den Anfangsbedingungen
y1 (x0 ) = y1,0 ,
y2 (x0 ) = y2,0
genügt.
Der Leser mache sich an dieser Stelle klar, dass aus Satz 12.1 der Satz 8.1 über Differentialgleichungen höherer Ordnung folgt. Das Differentialgleichungssystem (12.1) heisst autonom, falls
die zu den gesuchten Funktionen y1 , y2 gehörige Variable x nicht explizit auftritt.
Beispiel
Die Differentialgleichung für die Ortsfunktion t → x(t) eines eindimensionalen
gedämpften Oszillators lautet (siehe Abschnitt 11)
ẍ + 2λẋ + ω 2 x = 0 .
Dieser Differentialgleichung 2. Ordnung entspricht das folgende System von zwei Differentialgleichungen 1. Ordnung für die Funktionen t → x(t), t → v(t) = ẋ(t)
(12.4)
ẋ =
v
v̇ = −2λv − ω 2 x
.
Die zu den gesuchten Funktionen x und v gehörige Variable ist hier die Zeit und heisst dementsprechend t. Sie kommt im Differentialgleichungssystem (12.4) nicht explizit vor; das System
(12.4) ist autonom.
Im Folgenden wollen wir nur autonome Systeme betrachten. Aus Gründen der Anschaulichkeit,
die gleich deutlicher werden, ist es dann angebracht, dem obigen Beispiel folgend die Variable
der gesuchten Funktion mit t zu bezeichnen. Ausserdem wollen wir in diesem Abschnitt die
beiden gesuchten Funktionen t → x(t) und t → y(t) nennen. Unser autonomes System lässt sich
somit in der folgenden Form schreiben:
(12.5)
ẋ = f1 (x, y)
ẏ = f2 (x, y)
.
Es liegt nahe, die in der (x, y)-Ebene definierten Funktionen f1 : (x, y) → f1 (x, y), f2 : (x, y) →
f2 (x, y) als Komponenten eines zweidimensionalen Vektorfeldes ~v : (x, y) → ~v (x, y) zu interpretieren:
~v (x, y) = (f1 (x, y), f2 (x, y)) .
104
U. Stammbach: Analysis, Teil C
Eine Lösung des Differentialgleichungssystems (12.5) kann dann als Parameterdarstellung t →
(x(t), y(t)) einer Feldlinie des Vektorfeldes ~v aufgefasst werden. In der Tat besagt ja (12.5), dass
der Tangentialvektor (ẋ(t), ẏ(t)) der Kurve t → (x(t), y(t)) gerade mit dem Feldvektor in (x, y)
übereinstimmt. Fasst man – etwas konkreter – t als Zeit und das Vektorfeld ~v als (stationäres!)
Strömungsfeld in der Ebene auf, so beschreibt t → (x(t), y(t)) die Bewegung eines Teilchens im
Strömungsfeld, und der Vektor (ẋ(t), ẏ(t)) ist der Geschwindigkeitsvektor dieses Teilchens.
Aus unserem Existenz- und Eindeutigkeitssatz (Satz 12.1) folgt, dass durch jeden Punkt (x0 , y0 )
eine eindeutig bestimmte Kurve K geht, die durch die Lösung des Systems (12.5) mit den Anfangsbedingungen x(t0 ) = x0 , y(t0 ) = y0 beschrieben wird. Diese Kurve, versehen mit ihrer
Durchlaufrichtung(!), heisst die durch (x0 , y0 ) verlaufende Trajektorie; die Schar der Trajektorien nennt man das Phasenporträt des Systems.
Die Eindeutigkeitsaussage liefert unmittelbar, dass sich zwei Trajektorien nicht schneiden können, es sei denn, sie fallen in ihrem ganzen Verlauf zusammen.
Das Phasenporträt eines autonomen Differentialgleichungssystems enthält wichtige Informationen über die Lösungen; insbesondere kann an ihm das Stabilitätsverhalten der Lösungen abgelesen werden (siehe Abschnitt 14). Dies ist deshalb eine wichtige Bemerkung, weil es im allgemeinen sehr viel leichter ist, das Phasenporträt eines System zu berechnen, als das System
selbst vollständig zu lösen. Wir versuchen dies am folgenden Beispiel zu illustrieren.
Beispiel Wir betrachten das Räuber-Beute-Modell von Lotka-Volterra (A.J. Lotka 1880-1949;
V. Volterra 1860-1940). Hier beschreibt t → x(t) die Grösse einer Räuberpopulation, die sich
von einer einzigen Beuteart ernährt, und t → y(t) die Grösse der Beutepopulation. Das LotkaVolterra-Modell besagt, dass die beiden Populationsgrössen dem Differentialgleichungssystem
(12.6)
ẋ = −a1 x + b1 xy
ẏ =
a2 y − b2 xy
genügen. Dabei sind a1 , a2 , b1 , b2 positive reelle Zahlen. (Wir verzichten hier auf eine Begründung für die Form dieser Differentialgleichungen, denn wir sind ja vor allem an der Mathematik
interessiert.) Man kann zeigen, dass sich die Lösungen dieses Systems nicht durch elementare
Funktionen ausdrücken lassen. Hingegen ist das Phasenporträt relativ leicht zu berechnen.
Dieses besteht aus den Feldlinien des Vektorfeldes
~v : (x, y) → ~v (x, y) = (−a1 x + b1 xy, a2 y − b2 xy)
(versehen mit dem entsprechenden Durchlaufsinn). Beschreibt man die Feldlinien als Graphen
der Funktion x → y(x), so lassen sie sich als Lösungen der Differentialgleichung
(12.7)
y0 =
a2 y − b2 xy
−a1 x + b1 xy
bestimmen. Diese Differentialgleichung ist separierbar und ist deshalb leicht lösbar. Wir erhalten
der Reihe nach
105
Kapitel VII. Differentialgleichungen
dy
dx
y (a2 − b2 x)
x (b1 y − a1 )
b1 y − a1
a2 − b2 x
dy =
dx
y
x
b1 y − a1 log |y| = a2 log |x| − b2 x + C
a2
eb1 y
C |x|
=
e
|y|a1
eb2 x
|x|a2 |y|a1
·
= A,
eb2 x eb1 y
=
wobei wir A = 1/eC gesetzt haben. Das Phasenporträt des Systems (12.6) besteht folglich aus
den Niveaulinien der Funktion
(x, y) →
xa2 y a1
·
eb2 x eb1 y
Fig. 1 :
Das Phasenporträt der
Lotka-Volterra-Gleichungen
(versehen mit dem einfach zu bestimmenden Durchlaufsinn). Mit etwas Mühe lassen sich die
Niveaulinien diskutieren. Das wollen wir im einzelnen hier nicht durchführen, sondern uns
106
U. Stammbach: Analysis, Teil C
einfach das Bild ansehen. Wir lesen daraus sofort eine ganze Menge über die Lösungen des
Systems (12.6) ab. Ist die Beutepopulation y(t) gross, so wird die Räuberpopulation x(t) gute
Bedingungen vorfinden und sich vergrösseren. Damit wächst der Druck auf die Beutepopulation,
so dass diese schliesslich abnimmt. Mit der Zeit wird die Beutepopulation zu klein, um die
Räuberpopulation zu erhalten, so dass diese ihrerseits unter Druck gerät und abnimmt. Dies
gibt aber der Beutepopulation eine Überlebenschance, so dass diese wieder zunimmt, und nach
einiger Zeit auch zu einer Vergrösserung der Räuberpopulation führt, etc. Offenbar ergibt sich
aus diesem Modell ein periodisches wechselweises Anwachsen und Abnehmen der Räuber- bzw.
Beutepopulation.
Mehr als die Frage, ob dieses Modell die Wirklichkeit in vernünftiger Weise beschreibt, interessiert uns hier die Tatsache, dass wir aus dem Phasenporträt eine Menge von qualitativen
Informationen über die Lösungen des Systems herleiten konnten. Die Lösungen des Differentialgleichungssystems selbst haben wir dazu gar nicht benötigt.
Schliesslich wollen wir noch auf Folgendes aufmerksam machen. In unserem Beispiel ist die
Trajektorie durch den Punkt (x0 , y0 ) = (a2 /b2 , a1 /b1 ) ausgeartet: sie besteht nur aus diesem
einen Punkt. In der Tat bilden die konstanten Funktionen
t → x(t) = a2 /b2 ,
t → y(t) = a1 /b1
eine Lösung des Systems. In diesem Fall sind Räuber- und Beutepopulation im Gleichgewicht.
Dies legt die folgende allgemeine Definition nahe.
Ein Punkt (x0 , y0 ) der (x, y)-Ebene mit der Eigenschaft, dass t → x(t) = x0 und t → y(t) =
y0 eine Lösung des Systems bilden, heisst Gleichgewichtspunkt. Die Kenntnis der Gleichgewichtspunkte eines autonomen Systems, sowie das Phasenporträt in der Umgebung dieser
Punkte erlauben sehr oft, weitgehende Aussagen über das Verhalten der Lösungen des Systems.
Darauf gehen wir in Abschnitt 14 noch etwas näher ein.
107
Kapitel VII. Differentialgleichungen
13
Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten
In diesem Abschnitt betrachten wir lineare autonome Differentialgleichungssysteme 1. Ordnung
mit konstanten Koeffizienten. Im hier einzig zu behandelnden Fall von zwei Gleichungen sind
dies Systeme, die sich in der Form
ẋ1 = a11 x1 + a12 x2 + b1
ẋ2 = a21 x1 + a22 x2 + b2
(13.1)
schreiben lassen. Dabei sind die Koeffizienten aik , bi ; i = 1, 2, k = 1, 2 reelle Zahlen, also
insbesondere unabhängig von t. Wir haben hier eine Bezeichnungsweise gewählt, die von der
linearen Algebra her nahegelegt wird. Setzen wir
"
~x(t) =
x1 (t)
x2 (t)
#
"
, ~x˙ (t) =
ẋ1 (t)
ẋ2 (t)
#
"
, A=
a11
a21
a12
a22
#
"
, ~b =
b1
b2
#
,
so schreibt sich das System (13.1) in der einfachen Form
~x˙ = A~x + ~b .
Man beachte, dass aus einem System der Form (12.5) ein System der Form (13.1) entsteht,
wenn man die auf der rechten Seite stehenden Funktionen linearisiert. Diese Tatsache allein
liefert sicherlich genügend Motivation, sich mit linearen Systemen mit konstanten Koeffizienten
eingehender zu beschäftigen.
Es gibt im wesentlichen zwei Techniken, Systeme der Form (13.1) zu behandeln. Die eine Art
verwendet Methoden der linearen Algebra, um die Matrix A in einem ersten Schritt auf eine
einfache Form zu bringen, wenn möglich auf Diagonalform. Die zweite Art führt das System
(13.1) auf eine Differentialgleichung 2. Ordnung zurück. Beide Lösungsarten wollen wir an Hand
von Beispielen kurz kennenlernen, wobei wir der Einfachheit halber Beispiele wählen, bei denen
~b trivial ist (“homogener Fall”).
Beispiel Es sei das System
ẋ1 = x1 + 2x2
ẋ2 = 2x1 + x2
gegeben. Wir stellen als erstes fest, dass die Matrix A des Systems
108
U. Stammbach: Analysis, Teil C
"
A=
1 2
2 1
#
symmetrisch ist. Von der linearen Algebra her wissen wir, dass sich symmetrische Matrizen leicht
auf Diagonalgestalt bringen lassen, indem man ihre Eigenwerte und Eigenvektoren berechnet.
Für die Matrix A erhält man die Eigenwerte α1 = −1 und α2 = 3 sowie die zugehörigen
(orthonormierten und deshalb linear unabhängigen) Eigenvektoren
#
√ "
√ " #
2
2 1
1
,
.
−1
1
2
2
(Im Falle einer symmetrischen Matrix gibt es bekanntlich immer eine Basis von orthonormierten
Eigenvektoren!) Wir führen nun, entsprechend den Eigenvektoren die neuen Funktionen
√
2
(x1 (t) − x2 (t))
2
√
2
t → y2 (t) =
(x1 (t) + x2 (t))
2
t → y1 (t) =
(13.2)
ein. (Im Fall einer symmetrischen Matrix A tritt hier einfach die Matrix auf, deren Zeilen
aus den normierten Eigenvektoren gebildet werden; im Fall einer nichtsymmetrischen Matrix
A müssen die Funktionen y1 , y2 auf etwas kompliziertere Weise gebildet werden.) Eine kleine
Rechnung zeigt, dass die Funktionen y1 , y2 dem Differentialgleichungssystem
(13.3)
ẏ1 = −y1
ẏ2 =
3y2
genügen, dessen Matrix Diagonalform hat; in der Diagonalen stehen daher die Eigenwerte α1 , α2
der Matrix A. Die Gleichungen des Differentialgleichungssystems (13.3) sind “entkoppelt”; ihre
Lösungen lassen sich sofort hinschreiben
t → y1 (t) = C1 e−t ,
t → y2 (t) = C2 e3t .
Mit Hilfe von (13.2) lassen sich dann die ursprünglich gesuchten Funktionen x1 , x2 angeben:
t → x1 (t) = D1 e−t + D2 e3t ,
t → x2 (t) = −D1 e−t + D2 e3t ,
109
Kapitel VII. Differentialgleichungen
√
2
2 C1 , D2
wobei hier der Einfachheit halber D1 =
=
√
2
2 C2
gesetzt haben.
Fassen wir zusammen: Man benützt in dieser Lösungsart Methoden der linearen Algebra, um
das ursprüngliche System auf eine möglichst einfache Form zu bringen. Das geschieht, indem
man Eigenwerte und Eigenvektoren der Matrix A berechnet und entsprechend neue Funktionen
einführt. Das vereinfachte, neue System lässt sich dann leichter lösen. Im letzten Schritt geht
man zu den ursprünglich gesuchten Funktionen zurück.
Die zweite Lösungsart illustrieren wir mit dem folgenden Beispiel.
Beispiel Es sei das System
(13.4)
ẋ1 =
5x1 + x2
ẋ2 = −4x1 + x2
gegeben. (Wir bemerken, dass für dieses System die erste Methode nicht ohne weiteres zum Ziel
führt, da die Matrix A,
"
A=
5 1
−4 1
#
keine zwei linear unabhängige Eigenvektoren besitzt.) Wir führen das System (13.4) auf eine
Differentialgleichung 2. Ordnung zurück, indem wir eine der unbekannten Funktionen eliminieren. Aus der ersten Gleichung erhalten wir
(13.5)
x2 = ẋ1 − 5x1 .
Einsetzen in die zweite Gleichung liefert
(13.6)
ẋ2 = −4x1 + ẋ1 − 5x1 .
Andererseits ergibt die Ableitung von (13.5)
(13.7)
ẋ2 = ẍ1 − 5ẋ1 .
Aus (13.6) und (13.7) erhalten wir dann
(13.8)
ẍ1 − 6ẋ1 + 9x1 = 0 .
Dies ist eine lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten. Ihr charakteristisches Polynom lautet
α → α2 − 6α + 9 = (α − 3)(α − 3) ,
110
U. Stammbach: Analysis, Teil C
so dass die allgemeine Lösung von (13.8) durch
t → x1 (t) = C1 e3t + C2 te3t
gegeben ist. Aus (13.5) ergibt sich dann
t → x2 (t) = (−2C1 + C2 )e3t − 2C2 te3t .
Die allgemeine Lösung des Systems (13.4) lässt sich somit in Vektorform
"
x1 (t)
x2 (t)
#
"
= C1
1
−2
#
"
3t
e + C2
t
1 − 2t
#
e3t
schreiben.
Wir beschliessen diesen Abschnitt mit dem folgenden Beispiel aus der Physik, das ein Differentialgleichungssystem mit mehr als zwei Differentialgleichungen 1. Ordnung involviert.
Beispiel Es seien zwei identische mathematische Pendel der Masse m und der Länge l gegeben.
Sie sollen durch eine in der Ruhelage nicht beanspruchten Feder mit Federkonstante k verbunden
sein.
l
Fig. 1 :
Gekoppelte Pendel
l
m
m
x
y
111
Kapitel VII. Differentialgleichungen
Wir beschreiben durch t → x(t) die Auslenkung aus der Ruhelage des linken und durch t →
y(t) die Auslenkung aus der Ruhelage des rechten Pendels. Von Anfang an beschränken wir
uns ausserdem auf die linearisierte Theorie. Das Newton’sche Gesetz liefert sofort die beiden
Differentialgleichungen
mg
x − k(x − y)
l
mg
mÿ = −
y − k(y − x) .
l
mẍ = −
Dabei bezeichnet g wie üblich die Erdbeschleunigung. Setzen wir – um die Rechnung zu vereinfachen –
(13.9)
a =
g
k
, b =
,
l
m
so erhalten wir das lineare Differentialgleichungssystem
(13.10)
ẍ = −(a + b)x + by
ÿ =
bx − (a + b)y
.
Zwar handelt es sich hier um ein Differentialgleichungssystem, in dem zweite Ableitungen
auftreten. Führt man aber als neue unbekannte Funktionen die ersten Ableitungen ẋ, ẏ ein,
so erhält man unmittelbar ein lineares autonomes System von vier Differentialgleichungen für
vier unbekannte Funktionen. Zu dessen Lösung stehen uns die beiden oben beschriebenen Wege
zur Verfügung. Wir beschreiten hier den zweiten, der darin besteht, dass wir durch Elimination der einen Funktion eine Differentialgleichung 4. Ordnung für die andere Funktion gewinnen.
Dabei können wir natürlich direkt vom System (13.10) ausgehen und brauchen nicht zuerst zu
einem System erster Ordnung überzugehen. Wir lösen zuerst die erste Gleichung nach y auf
(13.11)
y =
ẍ a + b
+
x.
b
b
Ableiten nach t liefert
....
(13.12)
ÿ =
x
a+b
+
ẍ .
b
b
Andererseits liefert die zweite Gleichung des Systems mit (13.11)
112
(13.13)
U. Stammbach: Analysis, Teil C
ÿ = bx −
a+b
(a + b)2
ẍ −
x.
b
b
Aus (13.12) und (13.13) erhalten wir
(13.14)
....
x +2(a + b)ẍ + (a2 + 2ab)x = 0 .
Dies ist eine lineare homogene Differentialgleichung mit konstanten Koeffizienten. Das zugehörige charakteristische Polynom lautet
α → α4 + 2(a + b)α2 + (a2 + 2ab) .
Es hat vier verschiedene, rein imaginäre Nullstellen
α1,2 =
(13.15)
√
± −a
q
=: ±iω ,
α3,4 = ± −(a + 2b) =: ±iσ .
Daraus ergibt sich für die allgemeine Lösung von (13.14),
x(t) = C1 cos(ωt) + C2 sin(ωt) + C3 cos(σt) + C4 sin(σt) .
Die Gleichung (13.11) liefert die zugehörige Funktion t → y(t)
y(t) = C1 cos(ωt) + C2 sin(ωt) − C3 cos(σt) − C4 sin(σt) .
Betrachten wir zum Schluss noch die Anfangsbedingung
x(0) = x0 , ẋ(0) = 0, y(0) = 0, ẏ(0) = 0 ,
so erhalten wir für die Konstanten C1 , C2 , C3 , C4 das Gleichungssystem
C1 + C 3
ωC2 + σC4
C1 − C3
ωC2 − σC4
= x0
= 0
= 0
= 0
.
113
Kapitel VII. Differentialgleichungen
Dieses liefert sofort C1 = C3 = x0 /2, C2 = C4 = 0. Die zugehörige Lösung des Systems (13.10)
lautet also
x(t) =
x0
(cos(ωt) + cos(σt)) ,
2
y(t) =
x0
(cos(ωt) − cos(σt)) .
2
(13.16)
Dabei sind die Kreisfrequenzen ω und σ nach (13.15) und (13.9) gegeben durch
g
l
g
k
σ 2 = a + 2b = + 2
l
m
ω2 =
(13.17)
a
=
,
.
Schliesslich können wir die Formeln von (13.16) mit Hilfe goniometrischer Identitäten in der
folgenden Form schreiben
σ−ω
x(t) = x0 cos
t
2
σ−ω
y(t) = x0 sin
t
2
σ+ω
cos
t
2
σ+ω
sin
t
2
.
Ist nun k/m verglichen mit g/l klein (“schwache Kopplung”), so ist wegen (13.17) die Differenz
σ−ω
σ −ω ebenfalls klein. Dies bedeutet, dass sich der Faktor cos( σ−ω
2 t) bzw. sin( 2 t) nur langsam
ändert. Die Funktionen t → x(t), t → y(t) können deshalb als Schwingungen mit Kreisfrequenz
(σ + ω)/2 und variabler Amplitude angesehen werden. Die Amplituden sind durch
x0 cos
σ−ω
t
2
bzw. x0 sin
σ−ω
t
2
gegeben. Dies beschreibt den “Schwebungscharakter” der Lösung (13.16): die Energie geht
periodisch von einem Pendel auf das andere Pendel über.
114
U. Stammbach: Analysis, Teil C
(x)
Fig. 2 :
Die Auslenkung des
linken Pendels
(t)
(y)
Fig. 3 :
Die Auslenkung des
rechten Pendels
(t)
115
Kapitel VII. Differentialgleichungen
14
Stabilitätsverhalten
In diesem Abschnitt diskutieren wir das Stabilitätsverhalten der Lösungen eines autonomen
Differentialgleichungssystems. Dabei beschränken wir uns auf lineare Differentialgleichungssysteme mit konstanten Koeffizienten, weil in diesem Fall die Behandlung recht einfach ist,
andererseits aber doch die wesentlichen Punkte illustriert werden können.
Es sei
~x˙ = A~x
(14.1)
ein lineares autonomes Differentialgleichungssystem mit konstanten Koeffizienten mit
"
~x(t) =
x1 (t)
x2 (t)
#
"
, ~x˙ (t) =
ẋ1 (t)
ẋ2 (t)
#
"
, A=
a11 a12
a21 a22
#
.
Ein solches System (14.1) besitzt offensichtlich den Gleichgewichtspunkt (0, 0). Es geht in diesem
Abschnitt um die “Stabilität” dieses Gleichgewichtspunktes, d.h. um das Verhalten der Lösungen
in der Nähe dieses Punktes. Zu diesem Zweck lösen wir das System (14.1), in dem wir es auf
eine Differentialgleichung zweiter Ordnung zurückführen. Wir erhalten durch Elimination von
x2 leicht
(14.2)
ẍ1 − (a11 + a22 )ẋ1 + (a11 a22 − a12 a21 )x1 = 0 .
Auf analoge Weise erhält man durch Elimination von x1 eine Differentialgleichung für x2 . Die
allgemeine Lösung von (14.2) hängt von den Nullstellen α1 , α2 des zugehörigen charakteristischen
Polynoms, d.h. von den Lösungen der Gleichung
(14.3)
α2 − (a11 + a22 )α + (a11 a22 − a12 a21 ) = 0
ab. Der Leser stellt natürlich sofort fest, dass das charakteristische Polynom der Differentialgleichung (14.2) nichts anderes ist als das charakteristische Polynom der Matrix A im Sinne
der linearen Algebra. Daraus folgt unter anderem, dass die aus dem System (14.1) gewonnenen
Differentialgleichungen zweiter Ordnung für x1 und x2 beide zum gleichen charakteristischen
Polynom und deshalb im wesentlichen auch zu denselben Lösungsfunktionen führen. Diese sind
nur abhängig von den Eigenwerten der Matrix A. Insbesondere wird das Stabilitätsverhalten des
Gleichgewichtspunktes (0, 0) von diesen Eigenwerten bestimmt. Es gilt nun, die verschiedenen
Fälle zu diskutieren.
116
U. Stammbach: Analysis, Teil C
1. α1 ≤ α2 < 0 .
In diesem Fall sind die Funktionen x1 und x2 beide von der Form
C1 eα1 t + C2 eα2 t bzw. C1 eα1 t + C2 teα2 t .
Sie nehmen deshalb mit zunehmendem t exponentiell ab. Sämtliche Trajektorien laufen mit
wachsendem t asymptotisch in den Nullpunkt hinein. Der Gleichgewichtspunkt heisst in diesem
Fall asymptotisch stabil.
Beispiel
Das zum gedämpften harmonischen Oszillator gehörige System
ẋ1 =
x2
ẋ2 = −ω 2 x1 − 2λx2
liefert im Fall starker Dämpfung λ ≥ ω ein Beispiel für diesem Fall. Die Eigenwerte sind beide
negativ. Das Phasenporträt lässt sich leicht berechnen (siehe Figur 1).
2. α1 < 0 < α2 .
Die Funktionen x1 und x2 setzen sich in diesem Fall aus einem exponentiell zunehmenden und
einem exponentiell abnehmenden Anteil zusammen. Jede Trajektorie “flieht” den Nullpunkt
und läuft mit zunehmendem t ins Unendliche. Der Gleichgewichtspunkt ist instabil.
Beispiel
Das Differentialgleichungssystem
ẋ1 =
x2
ẋ2 = 2x1
,
(das zwei Populationen beschreibt, die in Symbiose leben) ist von dieser Art. Die Eigenwerte
sind reell und haben verschiedenes Vorzeichen. Das Phasenporträt zeigt im Nullpunkt einen
“Sattel” (siehe Figur 3).
3. 0 < α1 ≤ α2 .
Die Funktionen x1 und x2 nehmen mit wachsendem t exponentiell zu; die Trajektorien “fliehen”
deshalb den Nullpunkt. Dieser ist instabil.
Beispiel
ẋ1 = x1
ẋ2 = x1 + x2
.
Hier hat man einen zweifachen positiven Eigenwert. Das Phasenporträt zeigt aus dem Nullpunkt
herauslaufende Trajektorien (siehe Figur 2).
117
Kapitel VII. Differentialgleichungen
(y)
(x)
Fig. 1 :
Phasenporträt für zwei
verschiedene Eigenwerte mit
gleichem Vorzeichen. Für
positives Vorzeichen laufen die
Trajektorien vom Nullpunkt
weg, für negatives Vorzeichen
laufen sie in den Nullpunkt
hinein.
(y)
(x)
Fig. 2 :
Phasenporträt für einen
doppelten Eigenwert (Beispiel
unter Punkt 3). Für positives
Vorzeichen laufen die
Trajektorien vom Nullpunkt
weg, für negatives Vorzeichen
laufen sie in den Nullpunkt
hinein.
118
U. Stammbach: Analysis, Teil C
(y)
Fig. 3 :
Phasenporträt für Eigenwerte
mit verschiedenen Vorzeichen
(Beispiel unter Punkt 2).
(x)
4. α1 , α2 konjugiert komplex.
Dieser Fall spaltet in drei Unterfälle auf.
4.1. α1 , α2 konjugiert komplex, rein imaginär, α1 = ib, α2 = −ib .
Die Funktionen x1 und x2 sind in diesem Fall harmonische Schwingungen mit Kreisfrequenz b
C1 cos(bt) + C2 sin(bt) .
Dies führt im Phasenporträt zu periodisch durchlaufenen Trajektorien “um den Gleichgewichtspunkt herum”. Insbesondere sind die Trajektorien beschränkt. Der Gleichgewichtspunkt ist
stabil (aber nicht asymptotisch stabil).
Beispiel
Der ungedämpfte harmonische Oszillator liefert ein Beispiel für diesen Fall:
ẋ1 =
ẋ2 = −ω 2 x1
x2
.
Das Phasenporträt zeigt Ellipsen um den Ursprung herum, die im Uhrzeigersinn durchlaufen
werden (siehe Figur 4).
4.2. α1 , α2 konjugiert komplex mit positivem Realteil, α1 = a + ib , α2 = a − ib , a > 0 .
Die Funktionen x1 und x2 haben die Form
119
Kapitel VII. Differentialgleichungen
(y)
(x)
Fig. 4 :
Phasenporträt für rein
imaginäre Eigenwerte
(Beispiel unter Punkt 4.1).
(y)
(x)
Fig. 5 :
Phasenporträt für komplexe
Eigenwerte mit nichttrivialem
Realteil. Ist der Realteil positiv
(siehe Punkt 4.2) so laufen die
Trajektorien vom Nullpunkt
weg, ist der Realteil negativ
(siehe Punkt 4.3) so laufen die
Trajektorien in den Nullpunkt
hinein.
120
U. Stammbach: Analysis, Teil C
eat (C1 cos(bt) + C2 sin(bt)) , a > 0.
Dies führt zu Exponentialspiralen als Trajektorien, die wegen a > 0 nach aussen, vom Nullpunkt
weg durchlaufen werden. Der Gleichgewichtspunkt ist instabil (“instabiler Strudelpunkt”).
Beispiel
ẋ1 = x1 − x2
ẋ2 = x1 + x2
.
Die Eigenwerte sind α1 = 1 + i , α2 = 1 − i .
4.3. α1 , α2 konjugiert komplex mit negativem Realteil, α1 = a+ib , α2 = a−ib , a < 0 .
Die Funktionen x1 und x2 haben die Form
eat (C1 cos(bt) + C2 sin(bt)) , a < 0 .
Dies führt im Phasenporträt zu Exponentialspiralen, die nach innen durchlaufen werden. Der
Gleichgewichtspunkt ist asymptotisch stabil (“stabiler Strudelpunkt”).
Beispiel
Der schwach gedämpfte harmonische Oszillator, λ < ω
ẋ1 =
x2
ẋ2 = −ω 2 x1 − 2λx2
liefert ein Beispiel für diesen Fall. Das Phasenporträt zeigt im Ursprung einen stabilen Strudelpunkt.
Die Fälle, wo einer oder beide der Eigenwerte α1 , α2 Null sind, heissen ausgeartet und spielen
eine kleinere Rolle. Natürlich können sie aber in diesem Zusammenhang ebenfalls diskutiert
werden. Wir überlassen die Details dem Leser.
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Kapitel VIII.
Potenzreihen
lue wo schteisch
und wo geisch
süsch weisch
wenn gheisch
nid wo ligsch
Ernst Burren
Inhaltsverzeichnis
1
Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . .
3
2
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
3
Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
4
Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
5
Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3
Kapitel IX. Potenzreihen
1
Zu Konvergenz und Divergenz von Reihen
Die (unendliche) Reihe
(1.1)
∞
X
ak = a0 + a1 + a2 + · · · ,
a0 , a1 , a2 , . . . ∈ R ,
k=0
besitzt die Glieder a0 , a1 , a2 , . . . und die Partialsummen s0 , s1 , s2 , . . .,
s0 = a0
s1 = a0 + a1
s2 = a0 + a1 + a2
..
.
sn = a0 + a1 + a2 + · · · + an .
Konvergiert die Folge s0 , s1 , s2 , . . . der Partialsummen gegen s, so heisst die Reihe (1.1) konvergent, und s heisst deren Summe. Dann schreiben wir
∞
X
ak = s .
k=0
Divergiert die Folge der Partialsummen, so heisst die Reihe (1.1) divergent.
Beispiel
Die geometrische Reihe mit Faktor x,
1 + x + x 2 + x3 + · · · ,
besitzt die Glieder ak = xk , k = 0, 1, 2, . . . . Sie konvergiert für |x| < 1 (siehe Kapitel I, Abschnitt
1). In diesem Fall ist ihre Summe gegeben durch
1 + x + x 2 + x3 + · · · =
1
.
1−x
Für |x| ≥ 1 divergiert die geometrische Reihe. Im Bereich der Konvergenz, d.h. im Intervall
(−1, +1) definiert die geometrische Reihe eine Funktion, nämlich x → 1/(1 − x) (siehe Kapitel
I, Abschnitt 1).
4
U. Stammbach: Analysis, Teil C
Beispiel Für |x| < 1 gilt offenbar
1
1
=
= 1 − x + x 2 − x3 + · · · .
1+x
1 − (−x)
Beispiel Für |x| < 1 gilt offenbar
1
1
=
= 1 − x 2 + x4 − x6 + · · · .
1 + x2
1 − (−x2 )
Beispiel Die sogenannte harmonische Reihe
1+
1 1 1
+ + + ···
2 3 4
divergiert (siehe Kapitel I, Abschnitt 1).
0.9
0.8
Fig. 1 :
Die Partialsummen
der alternierenden
harmonischen Reihe
0.7
0.6
0.5
10
20
30
40
50
Beispiel Die sogenannte alternierende harmonische Reihe (siehe Figur 1)
1−
1 1 1
+ − + ···
2 3 4
5
Kapitel IX. Potenzreihen
konvergiert. Um dies einzusehen, bemerken wir zuerst das Folgende. Wegen
sn = 1 −
1
1
1 1
+ − · · · + (−1)n
= sn−1 + (−1)n
2 3
n+1
n+1
gilt
sn − sn−1 = (−1)n
1
.
n+1
Tragen wir die Werte der Partialsummen als Punkte auf der Zahlgeraden ab, so ist der Schritt
von sn−1 zu sn wegen dem Vorzeichen alternierend einmal nach links und dann nach rechts
zu tun. Ausserdem strebt die Schrittlänge mit zunehmendem n gegen Null. Die Folge der
Partialsummen der alternierenden harmonischen Reihen konvergiert deshalb, und zwar liegt
offenbar der Limes s für jedes n zwischen sn−1 und sn . Wie gross dieses s ist, lässt sich numerisch
angenähert bestimmen; allerdings konvergiert die alternierende harmonische Reihe sehr langsam.
Wir werden weiter unten diese Summe auf überraschende Weise, d.h. nicht “nur” numerisch
beschreiben können.
Wir entnehmen diesen wenigen Beispielen sofort die zwei folgenden allgemeinen Erkenntnisse.
Satz Konvergiert die Reihe
P∞
k=0 ak
= a0 + a1 + a2 + · · · (gegen s ), so gilt limk→∞ ak = 0 .
In der Tat gilt ja sn − sn−1 = an und ein Grenzübergang n → ∞ liefert
lim an = lim sn − lim sn−1 = s − s = 0 .
n→∞
n→∞
n→∞
Die harmonische Reihe zeigt, dass aus |an | < |an−1 | für alle n und
lim an = 0
n→∞
nicht notwendigerweise folgt, dass die Reihe konvergiert. Die Überlegung, die wir im Falle der
alternierenden harmonischen Reihe angestellt haben, liefert aber das folgende nützliche Resultat.
P
Satz Die Reihe ∞
k=0 ak = a0 + a1 + a2 + · · · sei alternierend (die Vorzeichen wechseln ab).
Gilt ausserdem |an | < |an−1 | für alle n ≥ 1 und limn→∞ an = 0 , so konvergiert die Reihe.
6
2
U. Stammbach: Analysis, Teil C
Potenzreihen
Unter einer Potenzreihe verstehen wir eine Reihe der Form
(2.1)
∞
X
ak xk = a0 + a1 x + a2 x2 + · · · ,
k=0
wobei wir nur den Fall betrachten, wo die Koeffizienten a0 , a1 , a2 , . . . reelle Zahlen sind. Die
Menge der x-Werte, für die die Potenzreihe (2.1) konvergiert, heisst ihr Konvergenzbereich. Im
Konvergenzbereich definiert eine Potenzreihe eine Funktion, deren Werte sich mit beliebiger
Genauigkeit numerisch bestimmen lassen.
Beispiel Die geometrische Reihe
1 + x + x 2 + x3 + · · ·
ist eine Potenzreihe mit ak = 1 für k = 0, 1, 2, . . .. Ihr Konvergenzbereich ist das Intervall
(−1, +1). In diesem Intervall liefert die geometrische Reihe eine andere Beschreibung für die
Funktion x → 1/(1 − x).
Nicht immer lässt sich die Summe einer Potenzreihe auf so einfache Weise angeben. Dazu trägt
nicht nur die uns schon bekannte allgemeine Schwierigkeit bei, die Summe einer Reihe zu bestimmen, sondern es ist oft so, dass konvergierende Potenzreihen Funktionen beschreiben, die
sich mit den sonst üblichen, elementaren Funktionszeichen nicht ausdrücken lassen. Beispiele
dazu werden wir weiter unten explizit kennenlernen.
Über den Konvergenzbereich einer Potenzreihe kennt der Mathematiker einen einfachen schönen
Satz, den wir hier ohne Beweis aufführen (siehe Figur 1).
Satz Der Konvergenzbereich einer Potenzreihe
∞
X
ak xk = a0 + a1 x + a2 x2 + · · ·
k=0
ist ein offenes, halboffenes oder abgeschlossenes Intervall mit 0 als Mittelpunkt.
Man nennt die halbe Länge des Konvergenzintervalles auch etwa Konvergenzradius. Über das
Konvergenz- bzw. Divergenzverhalten in den Endpunkten des Konvergenzintervalles lassen sich
keine allgemeinen Aussagen machen: Alle überhaupt möglichen Fälle treten bei konkreten
Potenzreihen auch wirklich auf.
7
Kapitel IX. Potenzreihen
Konvergenz
oder
Divergenz
Divergenz
Konvergenz
oder
Divergenz
Konvergenz
Fig. 1 :
Der Konvergenzbereich einer
Potenzreihe ist ein offenes,
halboffenes oder abgeschlossenes Intervall.
Divergenz
(x)
Konvergenzbereich
Wichtig ist nun, dass sich Potenzreihen im Innern ihres Konvergenzintervalles harmlos verhalten.
Es gilt der folgende zentrale und bequeme(!) Satz, den wir hier ebenfalls ohne Beweis aufführen.
Satz Im Innern des Konvergenzintervalles darf man mit Potenzreihen wie mit Polynomen rechnen. Inbesondere darf man gliedweise addieren, subtrahieren, multiplizieren, differenzieren und
integrieren.
Beispiel Für |x| < 1, d.h. im Konvergenzintervall der geometrischen Reihe gilt
1
1
1
=
= (1 − x + x2 − · · ·)(1 + x + x2 + · · ·) = 1 + x2 + x4 + · · · .
2
1−x
1+x 1−x
Beispiel Für |x| < 1, d.h. im Konvergenzintervall der geometrischen Reihe gilt
(2.2)
log(1 + x) =
Z
0
x
1
dt =
1+t
Z
0
x
(1 − t + t2 − · · ·) dt = x −
x 2 x3
+
− ··· .
2
3
In den Randpunkten stellte man hier fest: Für x = −1 erhält man die harmonische Reihe, man
hat also Divergenz. Für x = +1 erhält man die alternierende harmonische Reihe, man hat also
8
U. Stammbach: Analysis, Teil C
Konvergenz. Man kann ferner zeigen, dass die Gleichung (2.2) auch für den Randpunkt x = 1
gilt. Daraus ergibt sich als Summe der alternierenden harmonischen Reihe log 2.
Beispiel Gehen wir aus von der für |t| < 1 konvergenten Reihe
1
= 1 − t2 + t4 − · · · ,
1 + t2
so liefert die Integration für |x| < 1
arctan x =
Z
0
x
1
x 3 x5
dt
=
x
−
+
− ··· .
1 + t2
3
5
Zum Schluss dieses Abschnittes merken wir noch an, dass man auch Potenzreihen mit Mittelpunkt x0 , x0 6= 0 betrachten kann. Setzt man nämlich in der Potenzreihe
∞
X
ak tk
k=0
für t die Differenz x − x0 ein, so erhält man die Reihe
∞
X
ak (x − x0 )k ,
k=0
eine Potenzreihe mit Mittelpunkt x0 . Natürlich ist der Konvergenzbereich einer solchen Reihe
ein offenes, halboffenes oder abgeschlossenes Intervall mit Mittelpunkt x0 .
Beispiel Die Funktion x → 1/(x + 2) soll, wenn möglich, in eine Potenzreihe mit Mittelpunkt
x0 = 1 entwickelt werden. Wir erreichen dieses Ziel wie folgt
1
1
1
=
=
x+2
3 + (x − 1)
3
"
1
x−1
=
1−
+
3
3
x−1
3
2
#
+ ··· =
1
=
x−1
1+
3
1
1
1
− (x − 1) + 3 (x − 1)2 + · · ·
3 32
3
Diese Reihe konvergiert für |(x − 1)/3| < 1 d.h. im Intervall (−2, 4).
9
Kapitel IX. Potenzreihen
3
Das Taylorsche Polynom
Als Vorbereitung betrachten wir hier zuerst das folgende einfache Problem. Für ein Polynom
n-ten Grades x → P (x), schreiben wir den Wert P (x0 ) in x0 und die Werte der ersten n
Ableitungen
P 0 (x0 ), P 00 (x0 ), . . . , P (n) (x0 )
vor. Gesucht sind die n + 1 Koeffizienten von P . Der Ansatz
P (x) = b0 + b1 x + b2 x2 + · · · + bn xn
liefert offenbar das lineare Gleichungssystem
b0 + b1 x0 + b2 x20 + b3 x30 + · · · + bn xn0 = P (x0 )
b1 + 2b2 x0 + 3b3 x20 + · · · + nbn xn−1
= P 0 (x0 )
0
..
.
n(n − 1)(n − 2) · · · 2 · 1bn = P (n) (x0 ) .
Dieses lässt sich leicht lösen, indem man mit der letzten Gleichung beginnt. Wir verzichten
hier auf die explizite Angabe der Lösungen und verfolgen statt dessen noch einen weiteren
Lösungsweg, der von einem andern Ansatz für P (x) ausgeht. Wir setzen
P (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n .
Da die Ableitungen von x → P (x) durch
P 0 (x) = a1 + 2a2 (x − x0 ) + 3a3 (x − x0 )2 + · · · + nan (x − x0 )n−1
P 00 (x) = 2a2 + 3 · 2a3 (x − x0 ) + · · · + n(n − 1)an (x − x0 )n−2
..
.
P (n) (x) = n(n − 1)(n − 2) · · · 2 · 1an
gegeben sind, erhalten wir für die Koeffizienten a0 , a1 , a2 , . . . , an ohne Schwierigkeit
10
U. Stammbach: Analysis, Teil C
a0 = P (x0 ), a1 = P 0 (x0 ), a2 =
1 00
1
P (x0 ), . . . , an = P (n) (x0 ) .
2
n!
Beispiel Gesucht ist das Polynom dritten Grades mit P (1) = P 0 (1) = P 00 (1) = P 000 (1) = 6 .
Nach obigem erhalten wir
P (x) = 6 +
6
6
6
(x − 1) + (x − 1)2 + (x − 1)3 = x3 + 3x + 2 .
1!
2!
3!
Gegeben sei nun eine Funktion x → f (x), und es sei x0 ein (innerer) Punkt des Definitionsbereiches von f . Als eine der ersten Anwendungen der Differentialrechnung haben wir gelernt (siehe
Kapitel II, Abschnitt 2), die Funktion f in x0 zu “linearisieren”, d.h. die Funktion f durch
diejenige lineare Funktion P zu ersetzen, die in x0 denselben Wert annimmt wie f , P (x0 ) =
f (x0 ), und dort auch die gleiche erste Ableitung besitzt, P 0 (x0 ) = f 0 (x0 ). Dies ist für das
Polynom P ersten Grades gerade das oben diskutierte Problem. Wir erhalten für P
(3.1)
x → P (x) = f (x0 ) + f 0 (x0 )(x − x0 ) ,
in Übereinstimmung mit der uns schon bekannten Formel für die lineare Ersatzfunktion. Wir
erinnern auch daran, dass die lineare Ersatzfunktion (3.1) in der Umgebung von x0 die Funktion
f gut approximiert.
Allgemeiner können wir nun natürlich auch nach dem Polynom n-ten Grades x → Pn (x) fragen,
welches in x0 denselben Wert annimmt wie f , Pn (x0 ) = f (x0 ) und dort auch die gleichen n
ersten Ableitungen besitzt
Pn0 (x0 ) = f 0 (x0 ), Pn00 (x0 ) = f 00 (x0 ), . . . , Pn(n) (x0 ) = f (n) (x0 ) .
Offenbar ist Pn gegeben durch
Pn (x) = f (x0 ) +
f 0 (x0 )
f 00 (x0 )
f 000 (x0 )
f (n) (x0 )
(x − x0 ) +
(x − x0 )2 +
(x − x0 )3 + · · · +
(x − x0 )n .
1!
2!
3!
n!
Das Polynom Pn heisst das Taylorpolynom n-ten Grades von f in x0 . Das Taylorpolynom
ersten Grades ist die lineare Ersatzfunktion. Man könnte deshalb statt vom Taylorpolynom n-ten
Grades auch vom Ersatzpolynom n-ten Grades sprechen. Neben der linearen Approximation hat
man somit auch eine quadratische Approximation (n = 2), und allgemeiner eine Approximation
n-ten Grades.
Beispiel Für die Sinusfunktion x → sin x bestimme man das Taylorpolynom P2 zweiten Grades
in x0 = π/6. Wir erhalten (siehe Figur 1)
11
Kapitel IX. Potenzreihen
f 0 (x0 )
f 00 (x0 )
P2 (x) = f (x0 ) +
(x − x0 ) +
(x − x0 )2
1!
2!
√ 3
1
π
1
π 2
=
x−
−
x−
.
+
2
2
6
4
6
1
Fig. 1 :
Das lineare und quadratische
Taylorpolynom für
x → sin x in x0 = π/6
sin x
π/6
(x)
Man vermutet natürlich, dass das Taylorpolynom n-ten Grades von f in x0 die Funktion f in
der Umgebung von x0 “gut” approximieren, und zwar “umso besser”, je höher der Grad n des
Taylorpolynoms ist. Für sehr viele Funktionen ist das tatsächlich der Fall. Wir illustrieren den
Sachverhalt an den folgenden beiden Beispielen.
Beispiel Gegeben sei die Funktion f : x → ex . Wegen f 0 (x) = f 00 (x) = . . . = f (n) (x) = ex
erhalten wir für das Taylorpolynom n-ten Grades Pn in x0 = 0
Pn (x) = 1 + x +
1 2
1
1
x + x3 + · · · + xn .
2!
3!
n!
Unsere Vermutung bestätigend stellen wir fest, dass Pn für f eine “gute” Approximation ist und
zwar eine “umso bessere” (d.h. insbesondere in einem umso grösseren Intervall mit Mittelpunkt
12
U. Stammbach: Analysis, Teil C
x0 = 0) je grösser der Grad n des Taylorpolynoms Pn ist. Die Figuren 2,3,4 machen diesen
Sachverhalt auch optisch klar.
1.1
-0.1
0.1
(0, 1)
Fig. 2 :
Die lineare Ersatzfunktion
von x → ex in x0 = 0 ist im
Intervall [−0.1, 0.1] eine
gute Approximation
0.9
Beispiel Gegeben sei die Funktion f : x → cos x und x0 = 0. Wegen
f 0 (x) = − sin x, f 00 (x) = − cos x, f 000 (x) = sin x, f 0000 (x) = cos x, . . .
ist das Taylorpolynom (2n)-ten Grades von f in x0 gegeben durch
P2n (x) = 1 −
1
1 2
1
1
x + x4 − x6 + · · · + (−1)n
x2n .
2!
4!
6!
(2n)!
Auch hier stellt man fest, dass P2n für f eine “gute” Approximation ist: Das zu x0 = 0 symmetrisch liegende Intervall, in dem die Approximation von cos x durch P2n (x) “gut” ist, wird
dabei mit wachsendem Grad des Polynoms immer grösser und grösser (siehe Figur 2 in Abschnitt
4).
Wie für die lineare Ersatzfunktion, so kann die Mathematik auch für die höheren Taylorpolynome
Aussagen über die “Güte” der Approximation d.h. über den “Fehler” f (x) − Pn (x) machen. Auf
diese sogenannten Restgliedabschätzungen gehen wir hier aber nicht ein.
13
Kapitel IX. Potenzreihen
1.5
-0.5
0.5
(0, 1)
Fig. 3 :
Im Intervall [−0.5, 0.5] ist die
Approximation durch die lineare
Ersatzfunktion von x → ex in
x0 = 0 nicht mehr genügend
gut, hingegen ist die
Approximation durch die
quadratische Ersatzfunktion
noch befriedigend
0.5
3
2
-1.2
1.2
(0, 1)
0
Fig. 4 :
Im Intervall [−1.2, 1.2] genügt
auch die quadratische Ersatzfunktion von x → ex in x0 = 0
nicht mehr, erst die kubische
liefert ein befriedigende
Approximation
14
4
U. Stammbach: Analysis, Teil C
Die Taylorreihe
Es sei wiederum f : x → f (x) eine beliebig oft differenzierbare Funktion und x0 ein innerer
Punkt des Definitionsbereiches. Die Formel für das Taylorpolynom n-ten Grades Pn von f in
x0 zeigt, dass diese Polynome als Partialsummen der Reihe
(4.1)
f (x0 ) +
f 0 (x0 )
f 00 (x0 )
f (n) (x0 )
(x − x0 ) +
(x − x0 )2 + · · · +
(x − x0 )n + · · ·
1!
2!
n!
aufgefasst werden können. Die Reihe (4.1) heisst die Taylorreihe von f mit Mittelpunkt x0 .
Man beachte, dass man die Reihe (4.1) hinschreiben kann, ohne über deren Konvergenz oder
Divergenz eine Aussage zu machen. Da sie eine Potenzreihe mit Mittelpunkt x0 ist, wissen
wir aber immerhin, dass ihr Konvergenzbereich ein offenes, halboffenes oder abgeschlossenes
Intervall mit Mittelpunkt x0 ist. Es kann vorkommen, dass die Reihe nirgends, ausser natürlich
in x0 konvergiert. Dies ist aber eher der Ausnahmefall. Der Normalfall sieht anders aus: Für
viele Funktionen konvergiert die Taylorreihe in einer echten Umgebung von x0 und ihre Summe
stimmt im Konvergenzbereich sogar mit der Funktion f überein. Dieses Verhalten wird u.a. in
den Beispielen des letzten Abschnitts über das Approximationsverhalten der Taylorpolynome
von x → ex und x → cos x deutlich. Konvergiert die Taylorreihe für f mit Mittelpunkt x0 in
einem nichttrivialen Intervall, so spricht man auch etwa von der Taylorentwicklung von f in x0 .
Beispiel Die Taylorreihe von x → ex mit Mittelpunkt x0 = 0 lautet
1+x+
1 2
1
1
x + x3 + · · · + xn + · · · .
2!
3!
n!
Sie heisst auch Exponentialreihe (siehe Figur 1). Man kann zeigen, dass diese Reihe für alle x
konvergiert und die Funktion x → ex darstellt. Wir dürfen deshalb schreiben
ex = 1 + x +
1 2
1
1
x + x3 + · · · + xn + · · · .
2!
3!
n!
Beispiel Die Taylorreihe von x → cos x mit Mittelpunkt x0 = 0 lautet
1−
1 2
1
1
1
x + x4 − x6 + · · · + (−1)n
x2n + · · · .
2!
4!
6!
(2n)!
Sie heisst auch etwa Cosinus-Reihe (siehe Figur 2). Auch hier kann man zeigen, dass die Reihe
für alle x konvergiert und für alle x die Gleichung
15
Kapitel IX. Potenzreihen
(y)
Fig. 1 :
Die ersten Partialsummen
der Exponentialreihe; die Kurve
y = ex ist gestrichelt
eingezeichnet
(x)
(y)
(x)
Fig. 2 :
Die ersten Partialsummen
der Cosinus-Reihe; die Kurve
y = cos x ist gestrichelt
eingezeichnet
16
U. Stammbach: Analysis, Teil C
cos x = 1 −
1
1 2
1
1
x + x4 − x6 + · · · + (−1)n
x2n + · · ·
2!
4!
6!
(2n)!
gilt.
Beispiel
Die Taylorreihe von x → sin x mit Mittelpunkt x0 = 0 lautet
x−
1 3
1
1
1
x + x5 − x7 + · · · + (−1)n+1
x2n−1 + · · · .
3!
5!
7!
(2n − 1)!
Sie heisst Sinus-Reihe. Die Sinus-Reihe konvergiert ebenfalls für alle x, und es gilt die Gleichung
sin x = x −
1 3
1
1
1
x + x5 − x7 + · · · + (−1)n+1
x2n−1 + · · · .
3!
5!
7!
(2n − 1)!
Die Beschäftigung der Mathematik mit Potenzreihen hat gezeigt, dass es Vorteile bietet, wenn
man an Stelle der reellen Zahlen komplexe Zahlen zulässt. Es zeigt sich dann, dass der Konvergenzbereich einer Potenzreihe
∞
X
ck (z − z0 )k ,
z, z0 , ck ∈ C
k=0
in der komplexen Zahlebene ein Kreis mit Mittelpunkt z0 ist, wobei über das Konvergenzverhalten in den Punkten der Peripherie des Kreises keine einfachen allgemeinen Aussagen möglich
sind. Man spricht dann natürlich vom Konvergenzkreis der Potenzreihe (siehe Figur 3). In
diesem Zusammenhang klärt sich auch die Wahl des oben erwähnten Begriffes des Konvergenzradius zwanglos auf. Um die Nützlichkeit von komplexen Zahlen in diesem Zusammenhang
zu illustrieren, betrachten wir noch das folgende Beispiel.
Beispiel Wir berechnen mit Hilfe der Taylorreihen mit Mittelpunkt x0 = 0 die Grösse
1
1
1
1
1
1
cos x + i sin x =
1 − x2 + x4 − x6 + · · · + i x − x3 + x5 − x7 + · · ·
2!
4!
6!
3!
5!
7!
1
1
= 1 + ix + (ix)2 + (ix)3 + · · ·
2!
3!
= eix .
Es ist also hier die Euler’sche Formel,
eix = cos x + i sin x
mit Hilfe der entsprechenden Taylorreihen plausibel gemacht worden.
17
Kapitel IX. Potenzreihen
Im
z0
Fig. 3 :
Konvergenzkreis in der
komplexen Zahlebene
r
Re
Wichtig für das Folgende ist nun der mathematische Satz, welcher besagt, dass eine Funktion f
um den Punkt x0 höchstens eine Potenzreihenentwicklung zulässt.
Satz Stellen zwei Potenzreihen mit Mittelpunkt x0 die gleiche Funktion dar, so stimmen sie in
allen ihren Koeffizienten überein.
Es gilt also: Konvergiert eine Potenzreihe mit Mittelpunkt x0 gegen eine Funktion f , so ist diese
Potenzreihe automatisch die Taylorreihe von f mit Mittelpunkt x0 .
Beispiel Wir haben in einem früheren Abschnitt nachgewiesen, dass im Intervall (−1, +1) die
Gleichung
log(1 + x) =
Z
x
0
1
dt =
1+t
Z
x
0
(1 − t + t2 − · · ·) dt = x −
x 2 x3
+
− ···
2
3
gilt. Mit dem obigen Satz schliessen wir nun, dass diese Reihe die Taylorreihe von x → log(1+x)
mit Mittelpunkt x0 = 0 ist.
18
U. Stammbach: Analysis, Teil C
Beispiel Die früher hergeleitete, im Intervall (−1, +1) gültige Potenzreihenentwicklung
arctan x =
Z
x
0
1
x 3 x5
dt
=
x
−
+
− ···
1 + t2
3
5
ist automatisch die Taylorentwicklung der Funktion x → arctan x um x0 = 0.
Beispiel Gegeben sei die Funktion f : x → (1 + x)α , wo α eine reelle Zahl ist. Gesucht ist die
Taylorentwicklung von f um x0 = 0. Für die Ableitungen von f erhalten wir
f (x) = (1 + x)α
f 0 (x) = α(1 + x)α−1
f 00 (x) = α(α − 1)(1 + x)α−2
..
.
f (n) (x) = α(α − 1) · · · (α − n + 1)(1 + x)α−n .
Definieren wir, als Verallgemeinerung des wohlbekannten Binomialkoeffizienten,
α
0
!
α
n
=1,
!
α(α − 1) · · · (α − n + 1)
, n = 1, 2, 3, . . . ,
n!
=
so lautet die Taylorreihe von f mit Mittelpunkt x0 = 0
α
1
1+
(4.2)
!
α
2
x+
!
α
3
2
x +
!
α
4
3
x +
!
x4 + · · · .
Man nennt (4.2) die Binomialreihe zum Exponenten α. Für α = −1 erhält man die uns gut
bekannte geometrische Reihe mit Faktor −x (siehe Figur 4). Man kann zeigen, dass die Binomialreihe für jedes α wenigstens im Intervall (−1, +1) konvergiert und dass in diesem Intervall
die Gleichung
α
(1 + x) = 1 +
α
1
!
x+
α
2
!
2
x +
α
3
!
3
x +
α
4
!
4
x + ··· =
∞
X
n=0
α
n
!
xn
gilt. Man beachte, dass der Konvergenzbereich auch grösser sein kann. Ist nämlich α eine
positive ganze Zahl, so bricht die Reihe (4.2) nach endlich vielen Gliedern ab (man erhält ein
Polynom!), und dementsprechend besteht in diesem Fall der Konvergenzbereich aus allen reellen
Zahlen.
19
Kapitel IX. Potenzreihen
(y)
2
Fig. 4 :
Die ersten Partialsummen der
geometrischen Reihe mit
Faktor −x; die Kurve
y = 1/(1 − x) ist gestrichelt
eingezeichnet
1
(x)
-1
1
Beispiel Die Funktion
p
x → 1/ 1 − x2 = (1 − x2 )−1/2
hat die für |x| < 1 gültige Taylorentwicklung
1+
− 12
1
(−x2 ) +
− 12
− 32
− 12
− 32
− 52
(−x2 )2 +
1·2
1·2·3
1
1·3 4 1·3·5 6
= 1 + x2 +
x +
x + ··· .
2
2·4
2·4·6
(−x2 )3 + · · · =
Integration liefert daraus die für denselben Bereich gültige Potenzreihenentwicklung
arcsin x =
Z
x
0
√
1
1 x3 1 · 3 x 5 1 · 3 · 5 x 7
dt = x +
+
+
+ ··· .
2 3
2·4 5
2·4·6 7
1 − t2
Die Bestimmung der Koeffizienten der Taylorentwicklung einer Funktion f kann sehr aufwendig
sein, weil man dafür ja die Ableitungen beliebig hoher Ordnung von f kennen muss. In vielen
Fällen ist es deshalb einfacher, die Koeffizienten auf andere Weise zu bestimmen. Beispiele
20
U. Stammbach: Analysis, Teil C
dafür haben wir bereits bei der geometrischen Reihe kennengelernt und bei den vielen aus der
geometrischen Reihe hergeleiteten Reihentwicklungen. Als weiteres Beispiel wollen wir hier die
Tangens-Reihe bestimmen und zwar mit Hilfe der Methode des Koeffizientenvergleichs.
Beispiel Bekanntlich gilt
tan x =
sin x
cos x
also
cos x · tan x = sin x .
Machen wir den Ansatz
tan x = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · ·
und benützen wir die uns bekannten Sinus- und Cosinus-Reihen, so erhalten wir
1−
1 2
1
1
x + x4 − x6 + · · · · c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · =
2!
4!
6!
=x−
c0 + c1 x + c2 −
1 3
1
1
x + x5 − x7 + · · ·
3!
5!
7!
c0
c1
c2 c0
c3 c1
x2 + c3 −
x3 + c4 −
x4 + c5 −
x5 + · · · =
+
+
2!
2!
2!
4!
2!
4!
=x−
1 3
1
1
x + x5 − x7 + · · · .
3!
5!
7!
Da links und rechts dieselbe Funktion beschrieben wird, also nach unserem Satz die beiden
Reihen in allen ihren Koeffizienten übereinstimmen müssen, erhalten wir das folgende Gleichungssystem für die (unendlich vielen) Koeffizienten ci
c0
c1
=
=
0
1
0
c2 −
c0
2!
=
c3 −
c1
2!
= −
c4 −
c2 c0
+
2!
4!
c5 −
c3 c1
+
2!
4!
=
=
..
.
1
3!
0
1
5!
21
Kapitel IX. Potenzreihen
Dieses System ist – wie man sagt – rekursiv auflösbar; man erhält
1
2
c0 = 0, c1 = 1, c2 = 0, c3 = , c4 = 0, c5 = , . . .
3
15
Der Beginn der Potenzreihenentwicklung von x → tan x lautet also
1
2
x + x3 + x 5 + · · ·
3
15
Man kann zeigen, dass die so erhaltene Reihe für |x| < π/2 konvergiert.
Die Koeffizienten der Tangensreihe gehorchen interessanten, aber komplizierten Bildungsgesetzen, auf die wir hier nicht eingehen. Leicht lässt sich allerdings aus dem Gleichungssystem
herleiten, dass die Koeffizienten mit geradem Index alle verschwinden. Ganz ähnlich liegt die
Sache bei der Sinus-Reihe, wo ebenfalls nur die Koeffizienten mit ungeradem Index auftreten,
während bei der Cosinus-Reihe nur Koeffizienten mit geradem Index von Null verschieden sind.
In der Tat gilt ganz allgemein der folgende Satz.
Satz Die Taylorentwicklung um x0 = 0 einer ungeraden Funktion enthält nur Terme mit ungeradem Index; die Taylorentwicklung um x0 = 0 einer geraden Funktion enthält nur Terme mit
geradem Index.
Beweis Wir beweisen nur die Aussage über ungerade Funktionen. Das entsprechende Resultat
über gerade Funktionen wird analog erhalten. Ist f eine ungerade Funktion, so gilt definitionsgemäss
(4.3)
f (−x) = −f (x) .
Insbesondere ist f (0) = 0. Leitet man die Beziehung (4.3) ab, so erhält man
(4.4)
−f 0 (−x) = −f 0 (x) .
d.h. f 0 ist eine gerade Funktion. Eine zweite Ableitung liefert dann aus (4.4) sofort
(4.5)
−f 00 (−x) = f 00 (x)
d.h. f 00 ist wiederum eine ungerade Funktion, insbesondere gilt f 00 (0) = 0. Es folgt also, dass
alle Ableitungen gerader Ordnung von f ungerade Funktionen sind, und dass diese deshalb in
x0 = 0 den Wert Null annehmen. In der Taylorentwicklung der ungeraden Funktion f um x0 = 0
können deshalb nur Terme mit ungeradem Index vorkommen.
22
5
U. Stammbach: Analysis, Teil C
Anwendungen
In diesem letzten Abschnitt besprechen wir eine Reihe von Situationen, in denen die Idee der
Potenzreihenentwicklung einer Funktion die Bearbeitung eines Problems jeweils einen Schritt
weiterbringt.
Beispiel Es ist der Ellipsenumfang zu berechnen. Die Ellipse, a ≥ b (siehe Figur 1), sei gegeben
durch die Parameterdarstellung
x = a cos t
y = b sin t
(y)
Fig. 1 :
Zum Umfang der Ellipse
b
a
(x)
Der Umfang ergibt sich dann mit der Formel für die Bogenlänge (Kapitel III, Abschnitt 8) zu
U=
Z
0
2π
q
ẋ2
+
ẏ 2
dt = 4a
Z
π/2
0
s
1−
a2 − b2
cos2 t dt = 4a
a2
Z
π/2 p
0
1 − k2 cos2 t dt .
23
Kapitel IX. Potenzreihen
Dabei haben wir
k2 =
a2 − b2
a2
gesetzt. Es ist also 0 ≤ k2 < 1. Das hier auftretende Integral ist (für k 6= 0) nicht elementar
lösbar. Es ist ein sogenanntes elliptisches Integral zweiter Art. Mit Hilfe einer Reihenentwicklung
des Integranden kann man aber den Wert des Integrals als Reihe darstellen. Wir benützen dazu
die für |x| < 1 gültige Reihenentwicklung
√
1
1·3 3
1 2
1−x=1− x−
x −
x − ··· .
2
2·4
2·4·6
Setzen wir x = k2 cos2 t, so erhalten wir
U = 4a
π/2 Z
0
1
1 4
1·3 6
1 − k2 cos2 t −
k cos4 t −
k cos6 t − · · ·
2
2·4
2·4·6
dt .
(U )
2πa
Fig. 2 :
Der Umfang der Ellipse
dargestellt als Reihe in k
(k)
1
Die gliedweise Integration liefert dann wegen
24
U. Stammbach: Analysis, Teil C
Z
π/2
0
cos2n t dt =
1 · 3 · 5 · · · (2n − 3) · (2n − 1) π
2 · 4 · · · · (2n − 2) · (2n) 2
(Kapitel III, Abschnitt 6) eine Darstellung von U in Reihenform (siehe Figur 2)
"
U = 2πa 1 −
2
1
2
k2
−
1
1·3
2·4
2
k4
−
3
1·3·5
2·4·6
2
k6
− ···
5
#
.
Die Reihe konvergiert für kleine k, d.h. für Ellipsen, die “kreisähnlich” sind, recht schnell und
kann für die Berechnung des Umfanges ohne weiteres verwendet werden.
Beispiel Es ist die Schwingungsdauer des mathematischen Pendels (ohne Linearisieren) zu
berechnen. Wir haben bereits früher gesehen, dass im linearisierten Problem die Schwingungsdauer überraschenderweise unabhängig ist vom Maximalausschlag. Dies gilt – wie wir hier zeigen
werden – für die nicht linearisierte Schwingung des mathematischen Pendels nicht mehr.
ϕ
α
l cos α
l cos ϕ
l
Fig. 3 :
Zur Anwendung des
Energiesatzes auf das
mathematische Pendel
m
Statt mit der in Kapitel VII, p. 98 hergeleiteten Differentialgleichung zweiter Ordnung zu arbeiten, wenden wir den Energiesatz an. Ist α der maximale Ausschlag des Pendels (siehe Figur
3), so ergibt sich die Beziehung
25
Kapitel IX. Potenzreihen
1
m(lϕ̇)2 = mgl(cos ϕ − cos α) .
2
(Die frühere Differentialgleichung zweiter Ordnung wird daraus durch Ableitung nach t zurückerhalten!) Es folgt daraus die Differentialgleichung (erster Ordung)
r
ϕ̇ =
2g √
cos ϕ − cos α
l
für die Funktion t → ϕ(t). Sie lässt sich separieren. Man erhält
s
dt =
l
dϕ
√
,
2g cos ϕ − cos α
und die Schwingungsdauer T des mathematischen Pendels lässt sich als Integral hinschreiben
T =4
Z
T /4
0
s
dt = 4
l
2g
Z
α
0
dϕ
√
.
cos ϕ − cos α
In diesem Integral machen wir die Substitution
sin
ϕ
2
= sin
α
2
· sin u
und setzen
k = sin
α
2
.
Wir erhalten
α
= 1 − 2k2
2
2 ϕ
cos ϕ = 1 − 2 sin
= 1 − 2k2 sin2 u
2
cos α = 1 − 2 sin
2
1
ϕ
cos
2
2
dϕ = k cos u du
ϕ
cos
2
und daraus
=
1 − sin
2
1/2
ϕ
2
= (1 − k2 sin2 u)1/2
26
U. Stammbach: Analysis, Teil C
Z
0
α
Z
dϕ
√
cos ϕ − cos α
=
π/2
(1
0
√ Z
=
2
2k cos u du
− 2k2 sin2 u − 1 + 2k2 )1/2
− k2 sin2 u)1/2 (1
π/2
du
(1 −
0
k2 sin2 u)1/2
.
Von diesem letzteren Integral ist bekannt, dass es nicht elementar lösbar ist; es handelt sich um
ein sogenanntes elliptisches Integral erster Art. Ähnlich wie im ersten Beispiel benützen wir die
für |x| < 1 gültige Reihenentwicklung
1
1
1·3 2 1·3·5 3
=1+ x+
x +
x + ··· ,
1/2
2
2·4
2·4·6
(1 − x)
um den Integranden in Reihenform darzustellen. Setzen wir x = k2 sin2 u, so folgt
s Z
T =4
l
g
π/2 0
1
1·3 4 4
1 + k2 sin2 u +
k sin u + · · ·
2
2·4
du .
Mit dem bekannten Resultat
Z
0
π/2
sin2n u du =
1 · 3 · 5 · · · (2n − 3) · (2n − 1) π
2 · 4 · · · · (2n − 2) · (2n) 2
erhalten wir die Schwingungsdauer in Reihenform
s "
T = 2π
l
1+
g
2
1
2
2
k +
1·3
2·4
2
4
k +
1·3·5
2·4·6
2
#
6
k + ···
mit k = sin(α/2). Für kleine α (kleiner Maximalausschlag) ist also der aus der linearisierten
Theorie bekannte Wert
s
T = 2π
l
g
eine gute Nährung.
Beispiel Gesucht sind die Funktionswerte der Gauss’schen Fehlerfunktion. Die Gauss’sche
Fehlerfunktion ist gegeben durch
2
Φ : x → Φ(x) = √
π
Z
0
x
2
e−t dt .
27
Kapitel IX. Potenzreihen
(y)
1
(x)
-1
1
Fig. 4 :
Die Berechnung der Gauss’schen
Fehlerfunktion mit Hilfe einer
Reihenentwicklung; die Kurve
y = Φ(x) ist gestrichelt
eingezeichnet
-1
Das Integral ist bekanntlich nicht elementar lösbar (Kapitel III, Abschnitt 2). Eine Reihenentwicklung des Integranden und anschliessendes gliedweises Integrieren liefert den Funktionswert
von Φ in Reihenform. Aus
ex = 1 + x +
1 2
1
1
x + x3 + · · · + xn + · · ·
2!
3!
n!
erhalten wir
2
e−t = 1 − t2 +
1 4
1
t − t6 + · · · .
2!
3!
Daraus folgt (siehe Figur 4)
2
Φ(x) = √
π
Z
0
x
1
1
1 − t + t4 − t6 + · · ·
2!
3!
2
2
1
1 5
1 7
dt = √
x − x3 +
x −
x + ···
π
3
5 · 2!
7 · 3!
.
Beispiel Als Kurve, deren Krümmung proportional zur Bogenlänge zunimmt, haben wir die
Klotoide kennengelernt (Kapitel III, Abschnitt 8). Sie ist gegeben durch die Parameterdarstellung
28
U. Stammbach: Analysis, Teil C
Z
!
t2
x(l) =
cos
dt
2!
0
Z l
t2
y(l) =
sin
dt
2
0
l
Die beiden Integrale (Fresnel’sche Integrale) lassen sich nicht elementar ausdrücken. Ähnlich wie
oben erhalten wir mit einer Reihendarstellung des Integranden wenigstens eine Reihendarstellung
für x und y.
Die Cosinus- und Sinus-Reihen liefern unmittelbar
cos
t2
2
sin
t2
2
!
= 1−
!
=
t4
t8
t12
+
−
+ ··· ,
22 · 2! 24 · 4! 26 · 6!
t2
t6
t10
− 3
+ 5
− ··· ,
2
2 · 3! 2 · 5!
so dass man erhält (siehe Figur 5)
x = l−
y =
l5
l9
l13
+
−
+ ··· ,
5 · 22 · 2! 9 · 24 · 4! 13 · 26 · 6!
l3
l7
l11
−
+
− ··· .
3 · 2 7 · 23 · 3! 11 · 25 · 5!
Die Reihen konvergieren für kleine l sehr rasch, so dass sie ohne weiteres für die Berechnung von
x und y verwendet werden können.
Beispiel Misst man mit einem freihängenden Messband eine horizontale Distanz, so ist der
abgelesene Wert mit einem Fehler behaftet, weil das Messband durchhängt (siehe Figur 6).
Gesucht ist eine Abschätzung dieses Fehlers.
Die Lage des Messbandes sei durch die Funktion x → f (x) beschrieben. Für die Länge des
Messbandes (Bogenlänge) gilt dann die differentielle Beziehung
ds =
q
1 + (f 0 (x))2 dx .
Die Differenz ds − dx liefert das Differential du des Fehlers u. Wir erhalten
q
du = ds − dx = ( 1 + (f 0 (x))2 − 1) dx .
29
Kapitel IX. Potenzreihen
(y)
1
-1
1
(x)
Fig. 5 :
Die Klotoide; für die Zeichnung
sind die ersten 13 nichttrivialen
Glieder der Reihenentwicklung
verwendet worden
-1
−s/2
Fig. 6 :
Zur Behandlung des
freihängenden Messbandes
s/2
(x)
U. Stammbach: Analysis, Teil C
30
Da |f ′ (x)| klein ist, approximieren wir die Wurzel durch die ersten beiden Terme der Taylorentwicklung
1
1 + (f ′ (x))2 ∼ 1 + (f ′ (x))2 .
2
q
Damit folgt
1
du = (f ′ (x))2 dx .
2
Für den Fehler u auf der ganzen Länge des Messbandes gilt somit
u=
Z
s/2
(f ′ (x))2 dx .
0
Laut Mechanik hat man f (x) = a1 cosh(ax) − b . Dabei ist die Grösse a durch die Erdbeschleunigung g, die Längendichte ρ und durch die Seilspannung σ gegeben, nämlich
a=
gρ
.
σ
Damit folgt f ′ (x) = sinh(ax) . Da wir nur an einer Approximation interessiert sind, entwickeln
wir den Integranden von
Z
s/2
(f ′ (x))2 dx
0
in eine Potenzreihe und begnügen uns mit dem ersten nichttrivialen Term. Wegen
f ′ (x) = sinh(ax) = ax +
(ax)3
+ ···
3!
erhalten wir
(f ′ (x))2 = a2 x2 +
2 4 4
a x + ··· .
3!
Daraus folgt als Approximation für den Fehler u
u=
Z
0
s/2
′
2
(f (x)) dx ∼
Z
s/2
a2 x2 dx =
0
1 2 3
a s .
24
Der Messfehler ist insbesondere proportional zu ρ2 , 1/σ 2 und s3 .
31
Kapitel IX. Potenzreihen
Beispiel Die Differentialgleichung
(5.1)
y 0 = ay
hat bekanntlich
x → y(x) = Ceax
als Lösung. Wir wollen hier zeigen, dass man eine Potenzreihenentwicklung dieser Funktion
erhält, indem man direkt in der Differentialgleichung einen Potenzreihenansatz benützt. Dieses
Vorgehen kann natürlich nur dann Erfolg haben, wenn die Lösungsfunktionen der Differentialgleichung überhaupt eine Potenzreihendarstellung zulassen. Wir wissen bereits, dass dies im
Beispiel (5.1) der Fall ist. Für viele andere Differentialgleichungen können die Mathematiker
diese Eigenschaft der Lösungsfunktionen mit Hilfe von allgemeinen Sätzen nachweisen (siehe
dazu weiter unten). Unser einfaches Beispiel dient nur dazu, das Verfahren zu illustrieren. Wir
machen den Ansatz
y(x) = c0 + c1 x + c2 x2 + · · ·
und setzen diesen in die Differentialgleichung (5.1) ein. Wir erhalten
c1 + 2c2 x + 3c3 x2 + · · · = ac0 + ac1 x + ac2 x2 + · · · .
Ein Koeffizientenvergleich liefert das Gleichungssystem
c1 = ac0
2c2 = ac1
3c3 = ac2
..
.
Suchen wir die durch die Anfangsbedingung y(0) = 1 eindeutig bestimmte Lösung, so gilt c0 = 1
und damit der Reihe nach
c1 = a
a2
c2 =
2!
a3
c3 =
3!
a4
c4 =
4!
..
.
32
U. Stammbach: Analysis, Teil C
Die Reihendarstellung der Lösung lautet also, keineswegs überraschend,
y(x) = 1 + ax +
1
1
(ax)2 + (ax)3 + · · · .
2!
3!
Von dieser wissen wir aus andern Gründen bereits, dass sie für alle x konvergiert.
Beispiel Gegeben ist die Differentialgleichung
y 00 + x2 y = 0
Gesucht ist die durch die Anfangsbedingungen y(0) = 0 und y 0 (0) = 1 eindeutig bestimmte
Lösung.
(y)
1
1
2
3
4
(x)
Fig. 7 :
Die Lösungskurve der
Differentialgleichung
y 00 + x2 y = 0 mit y(0) = 0 und
y 0 (0) = 1; für die Zeichnung
sind die ersten 20 nichtverschwindenden Terme der
Taylorentwicklung verwendet
worden.
-1
Man kann zeigen, dass die Lösungsfunktionen der (linearen, homogenen(!)) Differentialgleichung
nicht elementar darstellbar sind. Deshalb besteht erhebliches Interesse an einer anderen Darstellung, z.B. an einer Potenzreihenentwicklung. Eine solche ist in der Tat möglich. Es gilt nämlich
der mathematische Satz, dass sich die Lösungen einer linearen Differentialgleichung zweiter
Ordnung immer in eine Potenzreihe mit Mittelpunkt x0 entwickeln lassen, wenn die Koeffizientenfunktionen der Differentialgleichung ebenfalls Potenzreihenentwicklungen mit Mittelpunkt x0
zulassen. Dies ist in unserem Beispiel trivialerweise der Fall.
33
Kapitel IX. Potenzreihen
Wir machen also den Ansatz
y(x) = c0 + c1 x + c2 x2 + · · · .
Dann gilt
y 0 (x) = c1 + 2c2 x + 3c3 x2 + 4c4 x3 + · · · ,
y 00 (x) = 2c2 + 3 · 2c3 x + 4 · 3c4 x2 + · · · .
Einsetzen liefert
(2c2 + 3 · 2c3 x + 4 · 3c4 x2 + · · ·) + x2 (c0 + c1 x + c2 x2 + · · ·) = 0
und ein Koeffizientenvergleich führt zum Gleichungssystem
2c2 = 0
2 · 3c3 = 0
3 · 4c4 + c0 = 0
4 · 5c5 + c1 = 0
5 · 6c6 + c2 = 0
..
.
Mit Hilfe der Anfangsbedingungen erhalten wir dann die Koeffizienten c0 , c1 , c2 , · · · rekursiv
c0
c4
c8
c12
= 0 c1 = 1
c2
= 0 c5 = −1/4 · 5
c6
= 0 c9 = 1/4 · 5 · 8 · 9
c10
= 0 c13 = −1/4 · 5 · 8 · 9 · 12 · 13 c14
= 0 c3
= 0 c7
= 0 c11
= 0 c15
=0
=0
=0
=0
Die Reihendarstellung der gesuchten Funktion lautet also (siehe Figur 7)
y(x) = x −
x5
x9
x13
+
−
+ ···
4 · 5 4 · 5 · 8 · 9 4 · 5 · 8 · 9 · 12 · 13
Der oben zitierte allgemeine Satz besagt, dass diese Reihe wenigstens für kleine x konvergiert;
in der Tat konvergiert sie sogar für alle x und zwar sehr rasch.
Analysis I/II
U. Stammbach
Professor an der ETH-Zürich
Anhang.
Komplexe Zahlen
Es gibt täglich mehr zu wissen.
Aus der NZZ-Werbung
Inhaltsverzeichnis
1
Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2
Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . .
11
3
Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
3
Anhang: Komplexe Zahlen
1
Komplexe Zahlen
Eine komplexe Zahl z lässt sich in eindeutiger Weise in der Form
a + ib, a, b ∈ R
schreiben, wobei das Symbol i die imaginäre Einheit , i2 = −1 bezeichnet. Die reelle Zahl a
heisst Realteil und die reelle Zahl b heisst Imaginärteil von z. Die reellen Zahlen R denkt man
sich in den komplexen Zahlen C eingebettet, indem man der reellen Zahl a die komplexe Zahl
a + i0 zuordnet.
Die Rechenoperationen mit komplexen Zahlen genügen den fundamentalen Rechengesetzen, die
man von den reellen Zahlen her kennt: Die Addition ist kommutativ und assoziativ, die Multiplikation ist kommutativ und assoziativ und verhält sich gegenüber der Addition distributiv.
Für
z = a + ib, a, b ∈ R
z 0 = a0 + ib0 , a0 , b0 ∈ R
ist die Summe definiert durch
z + z 0 = (a + ib) + (a0 + ib0 ) = (a + a0 ) + i(b + b0 )
(1.1)
und das Produkt wegen i2 = −1 durch
z · z 0 = (aa0 − bb0 ) + i(ab0 + a0 b) .
(1.2)
Zu jeder von Null verschiedenen komplexen Zahl z 6= 0 = 0 + i0 gibt es ein Inverses 1/z. Es gilt
für 0 6= z = a + ib
1
b
1
1 a − ib
a
−i 2
.
=
=
= 2
2
z
a + ib
a + ib a − ib
a +b
a + b2
Aus diesem Grund kann man in C durch von Null verschiedene komplexe Zahlen dividieren.
Beispiel
8−i
5+i
2
=
(8 − i)(5 − i)
(5 + i)(5 − i)
2
=
39 − 13i
26
2
=
1
1
1
(3 − i)2 = (9 − 6i − 1) = (4 − 3i).
4
4
2
4
U. Stammbach: Analysis, Teil C
Im
z
Fig. 1 :
Die komplexe Zahlebene
ρ
b
ϕ
Re
a
Komplexe Zahlen lassen sich in einfacher Weise in der sogenannten komplexen (oder Gaussschen) Zahlebene (siehe Figur 1) veranschaulichen: Man fasst die komplexe Zahl
z = a+ib als Punkt mit den (kartesischen) Koordinaten (a, b) in der Ebene auf. Die waagerechte
Koordinatenachse bezeichnet man als reelle Achse, die senkrechte als imaginäre Achse.
In der komplexen Zahlebene entspricht der Addition von komplexen Zahlen offenbar die Addition
von Vektoren. Auch die Multiplikation einer komplexen Zahl z mit einer reellen Zahl r lässt sich
unmittelbar als Multiplikation des “Vektors” z mit dem “Skalar” r deuten. Die Multiplikation
von zwei komplexen Zahlen lässt sich geometrisch in einfacher Weise beschreiben, wenn man in
der komplexen Zahlebene Polarkoordinaten (ρ, ϕ) einführt. Offenbar gilt für z = a + ib
ρ =
ϕ =
p
(
a2 + b2 ,
arctan(b/a)
für a > 0
arctan(b/a) + π für a < 0 ,
wobei wie üblich die Formel für ϕ im Fall a = 0 sinnvoll zu ergänzen ist. Ausserdem ist ϕ nur
bis auf ein Vielfaches von 2π bestimmt. Es heisst ρ der (absolute) Betrag |z| von z, und ϕ das
Argument arg z von z.
Die komplexe Zahl cos ϕ + i sin ϕ besitzt den absoluten Betrag 1; sie liegt auf dem Einheitskreis
mit Mittelpunkt 0 in der komplexen Zahlebene. Wir führen für eine solche komplexe Zahl die
5
Anhang: Komplexe Zahlen
folgende, von Euler stammende Schreibweise ein:
cos ϕ + i sin ϕ = eiϕ
(1.3)
(siehe dazu Kapitel VIII, Abschnitt 4). Es bezeichnet also eiϕ die komplexe Zahl mit Betrage
1 und Argument ϕ. Diese etwas willkürlich erscheinende Festsetzung rechtfertigen wir hier
dadurch, dass wir zeigen, dass für eiϕ die für die Exponentialfunktion übliche Rechenregel gilt,
nämlich
eiα · eiβ = eiα+iβ = ei(α+β) .
Der Beweis besteht in der folgenden einfachen Rechnung, welche die Additionstheoreme für cos
und sin verwendet:
eiα · eiβ
= (cos α + i sin α) · (cos β + i sin β)
= (cos α cos β − sin α sin β) + i(sin α cos β + cos α sin β)
= cos(α + β) + i sin(α + β)
= ei(α+β) .
Ist z eine beliebige, von Null verschiedene komplexe Zahl mit Betrag |z| und Argument ϕ, so
lässt sich z schreiben als
(1.4)
z = |z| · (cos ϕ + i sin ϕ) = |z| · eiϕ .
Wir nennen dies die Polardarstellung der komplexen Zahl z. Mit ihrer Hilfe beschreibt sich die
Multiplikation von komplexen Zahlen in der komplexen Zahlebene wie folgt: Für z = |z| · eiϕ
0
und z 0 = |z 0 | · eiϕ erhalten wir
0
0
z · z 0 = |z| · eiϕ · |z 0 | · eiϕ = |z| · |z 0 | · ei(ϕ+ϕ ) .
Bei der Multiplikation von komplexen Zahlen werden die absoluten Beträge multipliziert und die
Argumente addiert:
|z · z 0 | = |z| · |z 0 |,
arg(z · z 0 ) = arg z + arg z 0 .
Neben den Rechenoperationen Addition und Multiplikation spielt bei komplexen Zahlen auch
die Konjugation eine grosse Rolle. Die zu z, z = a + ib konjugierte komplexe Zahl ist gegeben
durch z = a − ib (siehe Figur 2). Es gilt offenbar:
6
U. Stammbach: Analysis, Teil C
1
a = (z + z) ,
2
(1.5)
b=
1
(z − z) .
2i
Damit sind Real- und Imaginärteil einer komplexen Zahl durch z und z ausgedrückt. Ferner
gelten, wie man leicht bestätigt, die folgenden Beziehungen
Im
z
z = a + ib
ρ
ϕ
Re
−ϕ
ρ
z̄ = a − ib
z = z
z + z0 = z + z0
z · z0 = z · z0
1
z
=
1
z
|z|2 = z · z .
Für z = eiϕ = cos ϕ + i sin ϕ gilt
Fig. 2 :
Konjugieren
komplexer Zahlen
7
Anhang: Komplexe Zahlen
z = cos ϕ − i sin ϕ = cos(−ϕ) + i sin(−ϕ) = e−iϕ .
Damit erhalten wir mit Hilfe der Formeln (1.3) und (1.5)
cos ϕ =
(1.6)
1 iϕ
(e + e−iϕ ) ,
2
sin ϕ =
1 iϕ
(e − e−iϕ ) .
2i
Dies sind die berühmten Euler’schen Formeln (L. Euler 1707-1783).
Beispiel Man drücke cos(nϕ), sin(nϕ), n = 2, 3, . . . durch die Werte der Winkelfunktionen cos
und sin des einfachen Winkels ϕ aus.
Ausgehend von den bekannten Formeln für n = 2 lässt sich die Aufgabe mit etwas Mühe direkt
lösen. Einfacher und sicherlich eleganter ist aber das folgende Vorgehen. Wir betrachten die
komplexe Zahl z = cos(nϕ) + i sin(nϕ) . Dann gilt
z = einϕ = (eiϕ )n = (cos ϕ + i sin ϕ)n .
Also
!
!
n
n
z = cos ϕ + i
cosn−1 ϕ sin ϕ + i2
cosn−2 ϕ sin2 ϕ + · · · + in sinn ϕ .
1
2
n
Indem wir Real- und Imaginärteil dieses Ausdruckes betrachten, erhalten wir
!
(1.7)
n
cos(nϕ) = cosn ϕ −
cosn−2 ϕ sin2 ϕ + · · · ,
2
!
(1.8)
sin(nϕ) =
!
n
n
cosn−1 ϕ sin ϕ −
cosn−3 ϕ sin3 ϕ + · · · .
1
3
Diese sogenannten Formeln von Moivre (Moivre 1667-1754) verallgemeinern die wohlbekannten
Formeln für cos(2ϕ) und sin(2ϕ).
Wir haben in diesem Abschnitt gesehen, dass das Potenzieren einer komplexen Zahl sehr einfach
wird, wenn man die Polardarstellung verwendet. In der Tat gilt ja
z n = (|z| · eiϕ )n = |z|n · einϕ .
√
√
Beispiel Es sei z = − 3 + i 3. Man berechne z 10 .
8
U. Stammbach: Analysis, Teil C
Es gilt
z=
√
6 · eiϕ ,
ϕ = 3π/4.
Damit erhalten wir
√
3π
15π
3π
z 10 = ( 6)10 · ei 4 10 = 65 · ei 2 = 65 · ei 2 = −65 i .
Offenbar ist die Polardarstellung auch geeignet, Licht in das folgende Problem zu bringen.
Im
3 · eiα
z
z1
α
α/2
Re
Fig. 3 :
Die Quadratwurzel komplexer
Zahlen
z2
Beispiel Gegeben ist die komplexe Zahl c. Gesucht sind die (alle!) Lösungen der Gleichung
z n = c.
Wir betrachten zuerst den Fall n = 2 für c = 3eiα (siehe Figur 3). Wir machen den Ansatz
z = ρ · eiϕ . Dann folgt
!
z 2 = ρ2 · ei2ϕ = 3eiα .
9
Anhang: Komplexe Zahlen
√
Daraus lesen wir als erstes ρ = 3 ab. (Beachte, dass ρ als Betrag einer von Null verschiedenen
komplexen Zahl positiv sein muss.) Ferner entnehmen wir der Gleichung die Bedingung 2ϕ = α,
wobei diese “modulo 2π” zu erfüllen ist. Wir erhalten die beiden Lösungen
ϕ1 =
α
,
2
α 2π
+
.
2
2
ϕ2 =
Damit folgt
z1 =
√
α
3 · ei 2 ,
z2 =
√
α
2π
3 · ei( 2 + 2 ) .
Wir entnehmen diesem Beispiel, dass die einzige Schwierigkeit zur Lösung von z n = c offenbar
in der Bestimmung des Argumentes der Lösungen liegt. Wir betrachten dazu noch das folgende
Beispiel.
Im
z2
eiα
z
z3
α
z1
α/5
Re
z4
z5
Beispiel Es sei
(1.9)
z n = eiα .
Dann gilt natürlich |z| = 1 (siehe Figur 4). Mit dem Ansatz
Fig. 4 :
Die 5. Wurzel aus einer
komplexen Zahl vom Betrage 1
10
U. Stammbach: Analysis, Teil C
z = eiϕ
erhalten wir
!
z n = einϕ = eiα .
Damit ist nϕ = α “modulo 2π” zu erfüllen, so dass sich für die Argumente ϕ1 , ϕ2 , . . . , ϕn der n
Lösungen
ϕ1 =
ϕ2 =
ϕ3 =
..
.
ϕn =
α
,
n
α
1
+ 2π ,
n n
α
2
+ 2π ,
n n
α n−1
+
2π
n
n
ergibt. In der komplexen Zahlebene bilden die n Lösungen der Gleichung (1.9) die Ecken eines
regelmässigen n-Eckes, das dem Einheitskreis einbeschrieben ist.
11
Anhang: Komplexe Zahlen
2
Komplexe Zahlen und Funktionen
In einem ersten Teil betrachten wir hier Funktionen, die auf reellen Zahlen definiert sind und
als Werte komplexe Zahlen annehmen.
Beispiel Die Funktion
ϕ : t → ϕ(t) = cos t + i sin t,
−∞ < t < +∞
ordnet der reellen Zahl t die komplexe Zahl cos t + i sin t zu.
Im
z
Fig. 1 :
Komplexwertige Funktion
einer rellen Variablen
Re
ϕ(t) = g(t) + ih(t)
Wir können eine solche Funktion als Abbildung (eines Teils) der reellen Zahlgerade in die komplexe Zahlebene auffassen. Durch die oben definierte Funktion ϕ zum Beispiel wird der reellen
Zahl t der Punkt des Einheitskreises in der komplexen Zahlebene mit dem Argument arg w = t
zugeordnet. Natürlich können wir eine solche komplexwertige Funktion einer reellen Variablen
immer in der Form
12
U. Stammbach: Analysis, Teil C
ϕ : t → ϕ(t) = g(t) + ih(t)
schreiben, wobei g : t → g(t) und h : t → h(t) “gewöhnliche”, d.h. reellwertige Funktionen der
reellen Variablen t sind (siehe Figur 1).
Die Ableitung ϕ0 der Funktion ϕ der reellen Variablen t wird man definieren durch
ϕ0 (t) = g0 (t) + ih0 (t);
die Ableitungsfunktion ϕ0 ist also wiederum eine komplexwertige Funktion der gleichen reellen
Variablen t.
Beispiel Es sei ϕ : t → ϕ(t) = eit . Dann gilt
ϕ0 (t) = (cos t + i sin t)0 = − sin t + i cos t = i(cos t + i sin t) = ieit .
Für die Ableitung der Funktion t → eit gilt folglich die von der reellen Exponentialfunktion her
bekannte Ableitungsregel.
Beispiel Es sei ψ : t → ψ(t) = eiωt , wo ω eine feste reelle Zahl ist. Dann folgt
ψ 0 (t) = iωeiωt ,
ψ 00 (t) = −ω 2 eiωt
und damit identisch in t
ψ 00 (t) + ω 2 ψ(t) = 0 .
Damit ist ψ : t → eiωt eine (komplexwertige) Lösung der (reellen) Differentialgleichung
ψ 00 + ω 2 ψ = 0 .
Das bedeutet, dass sowohl der Realteil von ψ, also t → cos(ωt), wie auch der Imaginärteil von
ψ, also t → sin(ωt), Lösungen der Differentialgleichung sind.
Analoges wie für die Ableitung einer komplexwertigen Funktion einer reellen Variablen gilt auch
für das Integral.
Beispiel Es sei k eine ganze Zahl. Dann gilt
Z
0
2π
ikx
e
dx =
Z
0
2π
(cos(kx) + i sin(kx)) dx =
Z
0
2π
cos(kx) dx + i
Z
0
2π
sin(kx) dx .
13
Anhang: Komplexe Zahlen
Da k ganz ist, folgt
Z
2π
0
(
ikx
e
dx =
0 für k 6= 0
.
2π für k = 0
Beispiel Es seien m, n zwei nicht negative ganze Zahlen. Wir berechnen das Integral
Z
2π
0
cos(mx) sin(nx) dx
mit Hilfe komplexer Zahlen. Es gilt
Z
0
2π
cos(mx) sin(nx) dx =
Z
=
0
2π
Z
eimx + e−imx einx − e−inx
·
dx
2
2i
1 2π i(m+n)x
=
(e
− ei(m−n)x + ei(n−m)x − e−i(n+m)x ) dx
4i 0
Z 2π
Z 2π
Z 2π
Z 2π
1
=
ei(m+n)x dx −
ei(m−n)x dx +
ei(n−m)x dx −
e−i(m+n)x dx .
4i 0
0
0
0
Daraus erhält man mit einer Fallunterscheidung m 6= n, m = n 6= 0, m = n = 0 mit Hilfe des
voherigen Beispiels das Resultat
Z
0
2π
cos(mx) sin(nx) dx = 0 .
Auf gleiche Art berechnet man ohne Mühe auch
Z
2π
0
Z
2π
0
cos(mx) cos(nx) dx =
sin(mx) sin(nx) dx =



0 für m 6= n
π für m = n 6= 0 ,

 2π für m = n = 0


 0 für m 6= n
π für m = n 6= 0 .

 0 für m = n = 0
Diese Resultate spielen in der Theorie der Fourrierreihen eine grosse Rolle (siehe Analysis III); sie heissen Orthogonalitätsrelationen und drücken aus, dass die Funktionen x →
cos(mx) , m = 0, 1, . . . , x → sin(nx) , n = 1, 2, . . . ein “orthogonales Funktionensystem” in
einem entsprechenden “Funktionenraum” bilden.
14
U. Stammbach: Analysis, Teil C
w
Im
w
z
Re
Im
Fig. 2 :
Komplexwertige Funktion
einer komplexen Variablen
z
Re
Im ersten Teil dieses Abschnitts haben wir komplexwertige Funktionen einer reellen Variablen
betrachtet. Jetzt wollen wir uns Funktionen zuwenden, bei denen sowohl der Definitionsbereich
wie auch der Wertebereich in der komplexen Zahlebene liegen (siehe Figur 2).
Beispiel Die Funktion
f : z → w = f (z) = iz
ordnet der komplexen Zahl z die komplexe Zahl w, w = iz zu. Um sich diese Funktion zu
veranschaulichen fassen wir sie als Abbildung von der komplexen z-Ebene in die komplexe wEbene auf. Wegen |w| = |iz| = |z| und arg w = arg(iz) = arg z + π/2 folgt, dass der Funktion
eine Drehung der komplexen Zahlebene um den Winkel π/2 entspricht.
Beispiel Der Funktion
f : z → w = f (z) = z · eiα
entspricht einer Drehung der komplexen Zahlebene um den Winkel α (siehe Figur 3).
15
Anhang: Komplexe Zahlen
Im
z
w
w = z · eiα
Fig. 3 :
Der Multiplikation mit einer
komplexen Zahl vom Betrage 1
entspricht eine Drehung der
komplexen Zahlebene
z
α
Re
Im
z
w
Fig. 4 :
Der Multiplikation mit einer
reellen Zahl r entspricht eine
Streckung der komplexen
Zahlebene
w=r·z
z
Re
16
U. Stammbach: Analysis, Teil C
Beispiel Der Funktion
g : z → w = g(z) = r · z,
r∈R
entspricht einer Streckung der komplexen Zahlebene um den Faktor r (siehe Figur 4).
Im
w =z+c
c
z
w
Fig. 5 :
Der Addition einer komplexen
Zahl entspricht eine Translation
der komplexen Zahlebene
z
Re
Beispiel Der Funktion
h : z → z + c,
c∈C
entspricht einer Translation der komplexen Zahlebene um den “Vektor” c (siehe Figur 5).
Beispiel Wir betrachten als nächstes die etwas kompliziertere Funktion
z → w = ez ,
wobei wir z = a + ib a, b ∈ R setzen
ez = ea+ib = ea · eib = ea (cos b + i sin b) .
17
Anhang: Komplexe Zahlen
Im
z = a + iy z
z = x + ib
Fig. 6 :
Das Netz der Parallelgeraden
zur reellen bzw. imaginären
Achse in der komplexen
Zahlebene
Re
Im
w
w = ex+ib
w = ea+iy
Re
Fig. 7 :
Das Bild unter der
Exponentialfunktion z → ez des
Netzes der Parallelgeraden zur
reellen bzw. imaginären Achse
in der komplexen Zahlebene
18
U. Stammbach: Analysis, Teil C
Um uns einen Überblick über das Verhalten dieser Funktion zu verschaffen, betrachten wir das
Koordinatennetz in der z-Ebene und untersuchen sein Bild in der w-Ebene (siehe Figuren 6,7).
Eine Parallelgerade zur reellen Achse in der z-Ebene wird durch die Gleichung z = x + ib, −∞ <
x < +∞ beschrieben. Ihr Bild in der w-Ebene ist
w = ex · eib = ex (cos b + i sin b) ,
ein von 0 ausgehender Strahl mit arg w = b. Eine Parallelgerade zur imaginären Achse in der
z-Ebene wird durch die Gleichung z = a + iy, −∞ < y < +∞ beschrieben. Ihr Bild in der
w-Ebene ist
w = ea · eiy = ea (cos y + i sin y) ,
ein Kreis um 0 mit Radius ea . Das Bild des Koordinatennetzes in der z-Ebene besteht also
aus den von 0 ausgehenden Strahlen und den Kreisen um 0. Man beachte ferner, dass jeder
Parallelstreifen zur reellen Achse in der z-Ebene der Breite 2π auf die ganze w-Ebene abgebildet
wird.
Speziell hinweisen möchten wir auf das Phänomen, dass das Bild des Koordinatennetzes in der
z-Ebene in ein Netz von Kurven abgebildet wird, welche sich orthogonal schneiden.
Letzteres ist nicht nur für die durch die Funktion z → ez vermittelte Abbildung der Fall, sondern ganz allgemein für Abbildungen, die zu sogenannten analytischen Funktionen gehören.
(Auf die Definition des Begriffes “analytisch” gehen wir hier nicht ein.) Man kann zeigen, dass
solche Funktionen sogar Abbildungen liefern, die winkeltreu sind; man nennt Abbildungen mit
dieser Eigenschaft auch etwa konform. In der mathematischen Behandlung der Strömungslehre
(Hydro- und Aerodynamik) spielen konforme Abbildungen der Ebene eine grosse Rolle; deshalb
hat der Zweig der Mathematik, welcher sich mit analytischen Funktionen beschäftigt, die sogenannte komplexe Funktionentheorie, im Gebiet der Strömungslehre viele wichtige Anwendungen
gefunden.
Beispiel Gegeben sei die Funktion z → w = f (z) = z 2 .
Wiederum studieren wir die Funktion, indem wir das Bild des z-Koordinatennetzes in der wEbene untersuchen (siehe Figur 8). Für z = a + ib erhalten wir
f (z) = (a2 − b2 ) + i2ab .
Die Bildkurve der Parallelgeraden z = t + ib, −∞ < t < +∞ zur reellen Achse ist also durch die
Parameterdarstellung (w = ξ(t) + iη(t))
t → ξ(t) = t2 − b2 ,
t → η(t) = 2tb
19
Anhang: Komplexe Zahlen
Im
z
w = (a + iy)2
Re
Fig. 8 :
Das Bild unter der Funktion
z → z 2 des Netzes der
Parallelgeraden zur reellen bzw.
imaginären Achse in der
komplexen Zahlebene
w = (x + ib)2
gegeben. Eliminieren wir t, so erhalten wir als Gleichung der Bildkurve
ξ=
η2
− b2 .
4b2
Die Bildkurve der Parallelgeraden z = t + ib zur reellen Achse der z–Ebene ist eine nach rechts
geöffnete Parabel, deren Scheitel bei (−b2 , 0) liegt. Analog zeigt man, dass das Bild der Parallelgeraden z = a + it, −∞ < t < +∞ zur imaginären Achse der z-Ebene eine Parabel ist, die
nach links geöffnet ist und deren Scheitel bei (a2 , 0) liegt.
Man stellt fest, dass sich die so erhaltenen Kurven in der w-Ebene orthogonal schneiden; die
Funktion z → z 2 ist eben auch “analytisch” wie die im obigen Beispiel betrachtete Funktion
z → ez .
20
3
U. Stammbach: Analysis, Teil C
Polynome
In diesem Abschnitt wollen wir die einfachsten komplexwertigen Funktionen einer komplexen
Variable etwas näher betrachten, nämlich die Polynome.
Ein (komplexes) Polynom p ist eine Funktion der Form
z → p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n
p:
mit c0 , c1 , . . . , cn ∈ C . Diese komplexen Zahlen heissen die Koeffizienten von p. Die natürliche
Zahl n heisst Grad von p, Grad p = n (falls cn 6= 0). Offenbar kann man Polynome in der
üblichen Art und Weise addieren und multiplizieren. Für die Grade gilt
Grad(p + q) ≤ max(Grad p, Grad q) ,
Grad(p · q) = Grad p + Grad q .
Eine komplexe Zahl z0 heisst Nullstelle des Polynoms p, wenn gilt p(z0 ) = 0.
Beispiel Das Polynom
p:
z → p(z) = c0 + z n
hat wegen cn = 1 6= 0 den Grad n. Seine Nullstellen sind die Lösungen der Gleichung z n =
w, w = −c0 . Im Abschnitt 1 haben wir die komplexen Lösungen angegeben und gesehen, dass
es davon n verschiedene gibt.
Beispiel Das Polynom
p:
z → p(z) = z 2 + (2i)z + (−4 + 4i)
hat als Nullstellen die komplexen Zahlen z1 = 2 − 2i, z2 = −2 .
Ist p eine beliebiges Polynom, so ist a priori nicht klar, ob p überhaupt Nullstellen besitzt.
Die Aussage, dass dies tatsächlich der Fall ist, ist ein tiefliegender mathematischer Satz, der
sogenannte “Fundamentalsatz der Algebra”, der erstmals von Gauss bewiesen worden ist. Wir
erwähnen ihn hier ohne Beweis.
Satz
Es sei p ein Polynom mit Grad p ≥ 1. Dann gibt es (mindestens) eine Nullstelle von p.
21
Anhang: Komplexe Zahlen
Wir machen dazu die folgende Bemerkung: Für Grad p = 1, 2 (und mit etwas mehr Mühe für
Grad p = 3, 4) lassen sich für die Nullstellen von p Wurzelformeln angeben. Man kann beweisen,
dass für Polynome vom Grad grösser gleich 5 solche allgemeinen Lösungsformeln mit Wurzeln
nicht existieren können. Der Satz von Gauss sagt nur über die Existenz von Nullstellen etwas aus,
und nichts über die Art und Weise, wie die Nullstellen gefunden werden können. Da das Problem,
Nullstellen von Polynomen zu bestimmen, in Anwendungen häufig auftritt, besteht ein grosses
Bedürfnis, Methoden dafür zu entwickeln. In der Tat stellt uns die numerische Mathematik eine
ganze Anzahl von solchen Verfahren zur Verfügung; in dieser Vorlesung können wir aber darauf
natürlich nicht eingehen.
Die Folgerungen aus dem Satz von Gauss sind vielfältig; einige davon werden wir im Folgenden zur Sprache bringen. Zuerst aber beschäftigen wir uns kurz mit einem (wohlbekannten)
rechnerischen Hilfsmittel.
• Es seien p und q Polynome mit Grad p = n und Grad q = m ≤ n. Dann gibt es Polynome r
und s mit p(z) = r(z) · q(z) + s(z) und Grad s < m.
Wir beweisen auch diese Aussage hier nicht, sondern geben nur an, dass r und s auf einfache
Weise durch den üblichen Divisionsalgorithmus bestimmt werden können.
Es sei nun z1 eine Nullstelle von p, p(z1 ) = 0. Indem man q(z) = z − z1 setzt, folgt aus der
obigen Aussage, dass sich p(z) in der Form
(3.1)
p(z) = r(z)(z − z1 ) + s(z)
schreiben lässt mit Grad s < 1. Wegen Grad s < 1 folgt, dass s eine Konstante ist. Setzt man
z = z1 , so erhält man aus (3.1)
0 = p(z1 ) = r(z1 )(z1 − z1 ) + s(z1 ) = s(z1 ) .
Damit ist das folgende Resultat bewiesen.
• Ist z1 eine Nullstelle von p, so lässt sich z − z1 “abspalten”; d.h. es gibt ein Polynom r mit
Grad r = n − 1 und p(z) = (z − z1 ) r(z) .
Das Vorgehen lässt sich offenbar mit dem Polynom r an Stelle von p wiederholen, solange dieses
Polynom einen Grad ≥ 1 besitzt. Damit erhält man schliesslich eine Zerlegung von p in “Linearfaktoren”.
• Das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n lässt sich in der Form
(3.2)
schreiben.
p(z) = cn · (z − z1 )(z − z2 ) · · · (z − zn )
22
U. Stammbach: Analysis, Teil C
Die komplexen Zahlen z1 , z2 , . . . , zn sind Nullstellen von p. Diese sind durch p eindeutig bestimmt. Ist nämlich w eine komplexe Zahl, die von z1 , z2 , . . . , zn verschieden ist, so folgt aus der
Zerlegung (3.2) p(w) 6= 0. Wir schliessen daraus:
• Ein Polynom p vom Grad n hat höchstens n Nullstellen.
Das Wort “höchstens” tritt hier deshalb auf, weil unter den Zahlen z1 , z2 , . . . , zn , die in (3.2)
auftreten, einzelne mehrfach vorkommen können.
Beispiel Das Polynom p : z → p(z) = z 2 + 2iz − 1 lässt sich in der Form
p(z) = (z + i)(z + i)
schreiben. Man sagt p besitze −i als “doppelte Nullstelle”.
Wir definieren die Vielfachheit k0 der Nullstelle z0 von p als grösste ganze Zahl mit der Eigenschaft, dass sich p in der Form
p(z) = (z − z0 )k0 · t(z)
schreiben lässt. (Es ist dann natürlich t(z0 ) 6= 0! )
• Das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n lässt sich in der Form
p(z) = cn · (z − z1 )k1 · · · (z − zl )kl
schreiben. Dabei bezeichnen z1 , z2 , . . . , zl die verschiedenen Nullstellen von p und k1 , k2 , . . . , kl
deren Vielfachheiten. Es gilt k1 + k2 + · · · + kl = n, d.h. die Summe der Vielfachheiten der
Nullstellen eines Polynoms ist gleich dem Grad des Polynoms.
Wir nennen das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n reell, wenn alle seine Koeffizienten
c0 , c1 , . . . , cn reell sind. Wir behaupten
• Ist z0 eine Nullstelle des reellen Polynoms p, so ist auch die konjugiert komplexe Zahl z0
eine Nullstelle von p.
Es folgt nämlich aus 0 = p(z0 ) = c0 + c1 z0 + · · · + cn z0n sofort
0 = 0 = p(z0 ) = c0 + c1 z0 + · · · + cn z0n = c0 + c1 z0 + · · · + cn z0 n = p(z0 ) .
Die komplexen Nullstellen eines reellen Polynoms treten somit in konjugiert komplexen Paaren
auf.
Beispiel
Das Polynom p : z → z 6 − 1 ist reell; es besitzt die komplexen Zahlen
23
Anhang: Komplexe Zahlen
zk = ei
2π
k
6
,
k = 1, 2, . . . , 6
als Nullstellen. Offenbar sind z3 und z6 reell; ferner sind z1 und z5 , sowie z2 und z4 konjugiert
komplexe Paare.
Betrachten wir in der Zerlegung eines reellen Polynoms in Linearfaktoren die beiden zur komplexen Nullstelle z0 gehörigen Faktoren (z − z0 ), (z − z0 ), so stellen wir fest, dass
(z − z0 )(z − z0 ) = z 2 − (z0 + z0 )z + z0 z0
ein quadratisches reelles Polynom ist (mit konjugiert komplexen Nullstellen). Damit folgt:
• Ist p : z → p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n ein reelles Polynom, so lässt sich dieses in der
Form
p(z) = cn (z − z1 )(z − z2 ) · · · (z − zl ) · (q1 (z) · · · qm (z))
schreiben, wobei z1 , . . . , zl die reellen Nullstellen sind, und q1 , . . . , qm die quadratischen reellen
Polynome bezeichnen, die zu den konjugiert komplexen Paaren von komplexen Nullstellen gehören (natürlich jeweils mit ihren Vielfachheiten).
Sachverzeichnis
Abbildung I.16
Abklingvorgänge VII.9
Ableitung II.4
Ableitung, partiell IV.10
allgemeine Lösung VII.4, VII.17, VII.40, VII.77
alternierende Reihe VIII.5
Amplitude I.42, VII.94
analytische Funktion Anh.18
Anfangsbedingung II.36
Approximation II.15
Arbeit VI.51
Arbeit im wirbellosen Feld VI.57
Archimedisches Prinzip VI.48
Area-Funktionen II.44
Arcus-Funktionen I.51
Argument einer komplexen Zahl Anh.4
Astroide, Länge von III.41
Asymptote I.58
asymptotisch stabil VII.116, VII.120
Auftrieb, hydrostatischer VI.48
autonome Systeme VII.103, VII.107
Balken V.48
Balken, aufgelegt VII.71
Balken, eingespannt VII.68
Bernoulli-Hôpital II.26
Bernoullispirale II.77
Bernoullispirale, Länge der III.43
Beschleunigung II.57
Betrag einer komplexen Zahl Anh.4
Binomialreihe VIII.18
Biot-Savart VI.9
Bogenlänge III.39
Böschungsflächen VI.23
charakteristisches Polynom VII.83
Clairaut’sche Differentialgleichung VII.61
Coulomb-Feld VI.7
Dämpfung VII.92
Derivierte II.4
Differential II.17
Differential, totales IV.28
Differentialgleichung I.19, II.36
Differentialgleichung höherer Ordnung VII.64
Differentialgleichung, gewöhnliche VII.5
Differentialgleichung, homogene Eulersche VII.86
Differentialgleichung, lineare VII.36, VII.72
Differentialgleichung, lineare homogene mit
konstanten Koeffizienten VII.83
Differentialgleichung, Laplace’sche VI.45
Differentialgleichung, partielle IV.60, VI.42,
VI.45, VI.48, VI.66
Differentialgleichungssysteme VII.102, VII.107
Differentialoperator VI.11
Differentialquotient II.3
Differentialrechnung II.23
differenzierbar II.3
divergent VIII.3
Divergenz VI.11, VI.39
Divergenzsatz VI.35
divergieren I.6
Doppelintegral V.6
ebene Kurve II.65
Eigenfrequenz VII.97
einfach zusammenhängend VI.71
Elektrostatik, Grundgleichung VI.45
Ellipse II.67
Ellipse, Fläche der III.22, III.37
Ellipsenkoordinatensystem V.35
Ellipsenumfang VIII.22
Ellipsoid IV.53
Ellipsoid, Volumen von III.45
Enveloppe VII.57
Eulersche Differentialgleichung VII.86
Eulersche Formeln Anh.7
Eulersche Zahl I.7, II.40
Evolute II.74
exakte Differentialgleichung VII.48
Exponentialfunktion I.23, II.35, II.36
Exponentialreihe VIII.14
Extremum II.28
Extremum, zwei Variablen IV.32
Faraday, Gesetz von VI.65
Federschwingung, gedämpfte VII.89
Fehlerrechnung II.20, IV.29
Feldlinie VI.5
Flächen in Parameterdarstellung VI.16
Flächenelement bei Koord.transform. V.34
Flächenelement in Polarkoordinaten V.14
Flächeninhalt unter einer Kurve
in Parameterdarstellung III.34
Flächeninhalt bei Kurven in Polarkoord. III.36
Flächennormale IV.52, VI.20
Flächenscharen IV.52
Flächenträgheitsmoment III.59
Flächenträgheitsmoment einer Ellipse V.37
Flächenträgheitsmoment eines Kreisringes V.15
Flächenträgheitsmoment, polares V.10
Flächenverzerrung V.40
Fluchtgeschwindigkeit III.69
Fluss VI.30
Folge I.3
Folge, beschränkte I.4
Folge, geometrische I.12
Folge, harmonische I.8
Fourrierreihe Anh.13
freier Fall mit Reibung VII.13
Fundamentalsatz der Algebra Anh.20
Funktion I.16
Funktion von zwei Variablen IV.3
Funktion von drei Variablen IV.44
Funktion, komplexe Anh.11
Funktion, gerade I.12
Funktion, rational I.23
Funktion, ungerade I.12
Funktionaldeterminante V.40
Funktionalmatrix V.37, V.42
Gauss’sche Fehlerkurve II.60
Gauss’sche Zahlebene Anh.4
Gauss, Satz von VI.35
Gebietsintegral V.3
Gebietsintegral, Koord.transform. V.12
gekoppelte Pendel VII.110
geometrische Reihe VIII.3
Geschwindigkeit II.57
gewöhnliche Differentialgleichung VII.5
Gleichgewichtspunkt VII.106, VII.115
globales Extremum II.28
Gradient IV.48, VI.11
Gradientenfeld IV.49, VI.68
Gravitation der homogenen Kugel V.25
Grenzwert I.6, I.25
Grössenordnung II.49
Hagen-Poiseuille VI.9
Halbwertszeit VII.9
harmonische Funktion VI.45
harmonische Reihe VIII.4
harmonische Schwingung I.42, II.62
harmonische Schwingung, gedämpfte II.63
Hauptsatz der Infinitesimalrechnung III.10
höhere Ableitung II.57
homogene lineare Differentialgleichung VII.36, VII.72
homogenes Vektorfeld VI.6
Hydrodynamik VI.40
hydrostatischer Auftrieb VI.48
hyperbolische Funktionen II.43
Hyperbel II.67
Hyperbel, Fläche der III.37
ideales Gas IV.6, IV.42
Indexpolynom VII.86
Induktivität VII.90
inhomogen lineare Differentialgleichung VII.40, VII.76
injektiv I.45
instabil VII.116
instationär VI.5
Integrabilitätsbedingung IV.21, IV.47, VI.72
Integral mit Parameter V.43
Integral, bestimmtes III.3
Integral, elliptisches VIII.23, VIII.26
Integral, unbestimmtes III.12
Integral, uneigentliches III.67
Integration, partiell III.15
Intervalle I.24
inverse Funktion I.45
Jacobi-Matrix V.37, V.42
Kapazität VII.90
Kettenregel II.8
Kettenregel, verallgemeinerte IV.38, IV.48
Kirchhoff’sches Gesetz VII.90
Klotoide III.43
Koeffizientenvergleich VIII.20
komplexe Funktion Anh.18
komplexe Polynome Anh.20
komplexe Zahl Anh.3
komplexe Zahlebene Anh.4
konform Anh.18
Konjugation Anh.5
konkav II.58
konservatives Vektorfeld VI.67
Kontinuitätsgleichung VI.40
konvergent VIII.3
Konvergenzbereich VIII.6
Konvergenzkreis VIII.16
Konvergenzradius VIII.6, 16
konvergieren I.4
konvex II.58
Koordinatenlinien V.32
Koordinatentransformation I.3, IV.55
Koord.transform. bei Flächenelement V.34
Koord.transform. bei Gebietsintegral V.12, V.30
Koord.transform. bei Volumenintegral V.41
Kopplung VII.113
Kreis II.66
Krümmung II.71
Krümmungskreis II.73
Kugelkoordinaten, Volumenelement V.23
Kugeloberfläche VI.24
Kugelvolumen V.22
Kurven in expliziter Darstellung I.17, II.65
Kurven in impliziter Darstellung II.65
Kurven in Parameterdarstellung II.65
Kurven in Polarkoordinaten II.76
Kurvenschar VII.23, VII.64, VII.66
Lagrange, Verfahren von VII.41, VII.79
Landau-Symbol II.49
Laplace-Operator IV.58, VI.14
Laplace-Operator, Polarkoordinaten IV.59
Laplace’sche Differentialgleichung VI.45
Lemniskate III.38
Limes I.6, I.25
lineare Ersatzfunktion II.15, IV.25
linearisieren II.15, IV.25
Logarithmus-Funktion I.23, II.35
logistisches Modell VII.26
Lösungsfunktion VII.17
Lösungskurve VII.17
Lotka-Volterra, Modell von VII.104
mathematisches Pendel II.20
Maximalstelle II.28, IV.31
Maxwellsche Gleichungen VI.48, VI.66
Minimalstelle II.28, IV.32
Mittelwertsatz der Differentialrechnung II.23
Mittelwertsatz der Integralrechnung III.8
Moivre, Formeln von Anh.7
monoton I.22 I.7
Newton II.61, VII.4, VII.90
Niveaufläche IV.45
Niveaulinie IV.6, VII.48
Normale II.69
Normale zur Fläche IV.52, VI.20
Nullstellen komplexer Polynome Anh.20
Oberflächenberechnung III.49, VI.23
Ohm’scher Widerstand VII.90
Ordnung einer Differentialgleichung VII.6
Orthogonalitätsrelationen Anh.13
Orthogonaltrajektorien VII.52
Oszillator, gedämpft VII.116
Oszillator, ungedämpft VII.118
Parabolspiegel VII.32
Parameterlinie VI.17
Partialsumme VIII.3
partielle Ableitung IV.10
partielle Differentialgleichung VII.6
partielle Integration III.15
partikuläre Lösung VII.38
Pendel, gekoppelt VII.110
Pendel, mathematisches VIII.24
Phasenporträt VII.104
Phasenverschiebung VII.47, VII.94
Polardarstellung einer komplexen Zahl Anh.5
Polarkoordinaten, Flächenelement V.14
Polynom I.23
Polynome, komplexe Anh.20
Polynomzerlegung Anh.21
Potential VI.68
Potentialfeld VI.68, VI.70
Potentialflächen VI.68, VI.70
Potenzfunktion I.23
Potenzreihen VIII.6
Punktfunktion IV.55
Quelle VI.39
quellenfrei VI.39
radioaktiver Zerfall VII.9
Räuber-Beute-Modell VII.104
Rechenregeln der Differentialrechnung II.7
Rechenregeln der Integralrechnung III.5
Rechenregeln für Folgen I.11
Rechenregeln für Grenzwerte I.30
reguläre Kurvenschar VII.23, VII.64, VII.66
Reihe VIII.3
Reihe, geometrische I.12
Resonanzfrequenz VII.97
Richtungsableitung IV.50
Richtungsfeld VII.17
Riemann’sches Integral III.4
Roboter I.21, V.38
Rotation VI.13, VI.63
Sattel IV.26
Scharparameter VII.4, VII.23, VII.64
Schraube VI.22
Schwarz, Satz von IV.18
Schwebung VII.114
Schwerpunkt III.54
Schwingungsprobleme VII.89
Sektorfläche III.36
Senke VI.39
separierbare Differentialgleichung VII.25
separieren VII.25
singuläre Lösung VII.57
Skalarfeld VI.3
Spirale, logarithmische II.77
stabil VII.118
Stabilitätsverhalten VII.115
stationär VI.5
stationäre Lösung VII.47, VII.94,
Steigung des Graphen II.3
Steigung von Kurven in Parameterdarst. II.69
Steigung von Kurven in Polarkoord. II.76
stetig I.32
Stetigkeit I.25
Stokes, Satz von VI.56, VI.65
Störglied VII.36, VII.77, VII.97
Strömungslehre Anh.18
Strudelpunkt VII.120
Substitution, Methode der III.19
Symbiose VII.116
Systeme von Differentialgleichungen VII.102
Systeme von Differentialgleichungen,
autonome VII.103
Tangente II.3, II.69
Tangentenfläche VI.20
Tangentialebene IV.25, VI.20
Taylorpolynom VIII.10
Taylorreihe VIII.14
totales Differential IV.28
Trägheitsmoment III.58
Trägheitsmoment einer Kugel III.62
Trägheitsmoment eines Rotationskörpers III.61
Trägheitsmoment eines Tetraeders V.21
Trägheitsmoment eines Torus III.63
Trägheitsmoment eines Vollzylinders III.60
Trajektorie VII.48, VII.104
Translation Anh.16
trigonometrische Funktionen I.23
uneigentliche Integrale III.67
ungerade Funktion I.22
Vektorfeld IV.49, VI.3
Vektorfeld, homogenes VI.6
Vektorfeld, konservatives VI.67
Volumen III.45
Volumen eines Ellipsoids III.45
Volumen eines Zylinderhufs III.47
Volumenelement bei Koord.transform. V.41
Volumenelement bei Kugelkoordinaten V.23
Volumenelement bei Zylinderkoordinaten V.29
Volumenintegral V.17
Wachstum, ungestörtes VII.7
Wallis, Formel von III.27
Wärmeleitungsgleichung VI.43
Weg VI.51
Wellengleichung IV.60
Wertetabelle I.17
winkeltreu Anh.18
wirbelfrei VI.13, VI.64
Wirbelstärke VI.64
Wurf VII.59
zweite Ableitung II.57
Zwischenwertsatz I.34
Zykoide II.70
Zykloide, Länge der III.40
zyklometrische Funktionen I.51
Zylinderhufs, Volumen eines III.47
Zylinderkoordinaten, Volumenelement V.29
Download