U. Stammbach Prof. em. ETH Analysis I/II Maschinenbau und Verfahrenstechnik / Mechanical and Process Engineering Materialwissenschaft / Materials Science 2014 Nachdruck Juni 2014 c by U. Stammbach 1995 http://www.math.ethz.ch/∼stammb stammb@math.ethz.ch Vorwort Diese Notizen gehören zu einer einführenden Vorlesung über Differential- und Integralrechnung für Ingenieure (Maschinen- und Werkstoffingenieure), wie sie an der ETH-Zürich im ersten Studienjahr vorgesehen ist. Die Aufgabe dieser Lehrveranstaltung ist es, den Studenten in die Sprache der Mathematik einzuführen und ihn mit der entsprechenden, für sein Gebiet notwendigen Mathematik bekannt zu machen. Die Anwendungen der Differential- und Integralrechnung in den für den Ingenieur interessanten Gebieten Mechanik, Physik u.a. sind im grossen und ganzen über die Jahre hinweg die gleichen geblieben. So wird man von diesem Text im Vergleich zu anderen nichts grundlegend Neues erwarten; die Stoffauswahl bewegt sich im Rahmen des Üblichen. Allerdings ist nicht zu verkennen, dass sich für den Ingenieur, was die mathematischen Anwendungen betrifft, in letzter Zeit doch auch vieles geändert hat: Die Art und Weise etwa, wie der Ingenieur Mathematik einsetzt, hat sich mit den Möglichkeiten des Computers rasant entwickelt. Man denke etwa an numerische Methoden (die Numerische Mathematik hat allerdings im gültigen Studienplan ihren eigenen Platz), an die Möglichkeiten des symbolischen Rechnens und an den Einsatz von Graphiken und schliesslich auch an die vielen ganz neuartigen Anwendungen der Mathematik in den Ingenieurwissenschaften. Stellvertretend für andere sei etwa die Methode der Finiten Elemente genannt. Es ist ganz klar, dass sich damit auch die Anforderungen an die vorliegende Vorlesung geändert haben. Insbesondere ist der Wunsch nach mehr Stoff und nach “tieferer” Mathematik zu verspüren. Hier gilt es, die richtigen Konsequenzen zu ziehen: Nicht Vollständigkeit darf im Vordergrund stehen, sondern das Bemühen, den Studenten in die Lage zu versetzen, die Mathematik, die er im Laufe seines Studiums und seines Berufslebens braucht, zu erarbeiten und zu verstehen. Tragfähige Grundlagen sind also gefragt und nicht Rechenfertigkeit, das Wissen um Zusammenhänge und nicht vereinzelte Details! Das eben Gesagte ist einer der Gründe, weshalb ich eine radikale Umgestaltung der traditionellen Analysis-Vorlesung, etwa in Richtung einer Anleitung für den Einsatz von Computern im Ingenieurwesen, der Sache nicht für dienlich halte. Das folgende Beispiel möge diesen Punkt etwas näher erläutern. In einer Zeit, wo Computerprogramme (Mathematica, Macsyma, etc.) die Techniken des symbolischen Differenzierens und Integrierens bestens beherrschen, ist es sicherlich nicht sehr sinnvoll, zum Erlernen dieser Rechenfertigkeiten noch viel Vorlesungszeit einzusetzen. Viel wichtiger, als die Rechen-Technik in allen Feinheiten zu beherrschen, scheint mir heute für den angehenden Ingenieur zu sein, dass er die mathematische Idee in ihrem Wesen und ihren Konsequenzen versteht und sie anzuwenden weiss. Dies gilt bekanntlich auch dann, wenn Computer zur Verfügung stehen; denn: “Wer für seine Probleme den Computer einsetzen will, muss mehr Mathematik wissen und sie besser verstanden haben”. Dies führt nun allerdings in ein gewisses Dilemma, denn es ist klar, dass die Konzentration auf die mathematische Idee es dem Studenten nicht einfacher sondern schwerer macht. Nach wie vor besteht nämlich der einzige Weg zum Verständnis der mathematischen Idee darin, die zugehörige Technik eigenhändig anzuwenden; denn: “Mathematics is not a spectator sport; mathematics is learned by doing, not by watching!” Der Student (und auch der Lehrer!) tut gut daran, sich dies immer wieder in Erinnerung zu rufen und sich dem Rechnen, das an sich der Computer ja so viel besser beherrschen würde, nicht zu verschliessen. Zwei offensichtliche, aber wichtige Konsequenzen dieser Tatsache sind in der Lehrveranstaltung, zu der dieser Text gehört, berücksichtigt worden. Der Text enthält eine grosse Anzahl von vollständig durchgerechneten Beispielen, und zur Lehrveranstaltung gehören umfangreiche Übungen. Ein intensiver Einsatz des Computers würde theoretisch vielleicht vieles davon redundant machen; ich glaube aber nicht an die praktische Weisheit eines solchen radikalen Schrittes. Der Computer ist ein ausserordentlich wichtiges Hilfsmittel, und wir ziehen ihn auf selbstverständliche Art, insbesondere bei der Stoffvermittlung herbei; nur eben: Das Verstehen der mathematischen Idee nimmt dem Studenten kein Computer ab. Meine Erfahrung, die ich im Laufe der Jahre mit der Betreuung von mathematischen Lehrveranstaltungen für Ingenieure immer und immer wieder gemacht habe, ist die, dass den Studenten allzu oft die Motivation1 fehlt, sich mit den abstrakten mathematischen Werkzeugen zu beschäftigen. Zwar gibt es den mathematisch interessierten Studenten an den Ingenieurabteilungen auch, aber er ist doch eher die Ausnahme als die Regel. Diese Notizen versuchen, dieser Tatsache Rechnung zu tragen: nicht nur werden mathematische Begriffsbildungen aus der Anschauung heraus motiviert, sei es geometrisch oder mit Hilfe einer praktischen Fragestellung, sondern es werden auch die mathematischen Techniken und Resultate regelmässig durch zahlreiche Beispiele aus der Mechanik, Physik und aus den Ingenieurwissenschaften illustriert. Ein Weiteres: die mathematische Vorbildung der an die ETH eintretenden Studenten ist ausserordentlich heterogen. Was einzelne Studenten bestens beherrschen, ist für andere völlig neu. Eine nicht geringe Zahl der neueintretenden Studenten kennt z.B. die Differentialrechnung nur für ganz einfache Funktionen und die Integralrechnung praktisch nur dem Namen nach. Ausserdem sind bei vielen Studenten gewisse grundlegende Begriffe, wie etwa der Begriff der Funktion, nur in einer völlig ungenügenden Form vorhanden. So ist es schliesslich auch Aufgabe dieser Vorlesung, den Wissensstand der Studenten zuerst auf ein vergleichbares Niveau zu bringen, und dafür zu sorgen, dass die “Sprache”, d.h. die Notation und die verwendeten Begriffe, in genügender Schärfe und genügender Allgemeinheit vorhanden sind. Zu diesem Zweck beginnt die Vorlesung auf einem relativ tiefen Niveau, schreitet dann aber rasch vorwärts. Für einen Teil der Studenten ist am Anfang vieles Wiederholung. Ich habe mich allerdings bemüht, diesem Stoff Blickwinkel abzugewinnen, die auch für den gut vorbereiteten Studenten neu sein dürften. Nicht vergessen sollte man also, dass dieser erste Teil die wichtige Funktion hat, eine genügend flexible und starke Sprache zu vermitteln, wie sie für die späteren Kapitel benötigt wird. Würde man diesen ersten Teil noch kürzer fassen, könnte später vieles nur umständlicher und mit wesentlich mehr Zeitaufwand gesagt werden. 1 Sehr oft fehlt den Studenten “dank” den gültigen Studienplänen auch ganz einfach die Zeit; denn die Erarbeitung mathematischer Gedankengänge braucht Zeit, ruhige ungestörte Zeit. Es handelt sich eben nicht einfach darum, Fakten zu lernen, sondern darum, sich Denkprozesse anzueignen. Dies setzt eine Reifung voraus, die wie überall in der Natur ihre Zeit braucht. Post festum allerdings erscheint dann alles klar und leicht! Die hier beschriebene Situation bedingt, dass dieser erste Teil für die Studenten, die sich als ungenügend vorbereitet empfinden, wohl etwas zu konzentriert ist. Empfehlenswert ist in diesem Fall die zusätzliche Erarbeitung eines weiteren Textes (siehe unten). Es ist nicht zu verkennen, dass der vorliegende von anderen Texten vieles übernommen hat. Hier ist einmal die frühere Autographie von Huber-Henrici zu nennen; ich hoffe, dass die ihr zugrundeliegenden didaktischen Erfahrungen in diesen Text hinüber gerettet werden konnten. Aus der hervorragenden Autographie von Blatter2 stammen eine ganze Anzahl von Beispielen, und oft liess ich mich auch durch Blatters Darstellung beeinflussen. Dem etwas mathematisch interessierteren Studenten ist diese Autographie bestens zu empfehlen. Noch etwas mathematischer ist das ebenfalls hervorragende Werk von Burg, Haf und Wille3 , dessen erster Band sich auch gut als Begleitlektüre für die Studenten eignet, die sich als nicht genügend vorbereitet einschätzen. Der Text wurde mit Hilfe des Schreibsystems LATEX produziert. Danken für die Hilfe bei der Tipparbeit möchte ich Frau Meuli, und den Herren Harpes, Hoffmann und Schünemann. Die Graphiken wurden mit dem System Mathematica erstellt, das im Rahmen der Lehrveranstaltung auch für umfangreiche Computerdemonstrationen verwendet wurde. Hier bin ich den Herren Collart, Küchlin und Mall zu Dank verpflichtet. Danken möchte ich auch den Studenten, die in einer früheren Fassung viele Fehler und Unklarheiten entdeckt haben. - Schliesslich noch eine Bemerkung an die Leserinnen: ich konnte mich nicht dazu durchringen, das schwerfällige “Leser und Leserin” oder das schreckliche “LeserIn” zu verwenden und bin beim alten “Leser” geblieben; man bzw. frau möge mir verzeihen. Ich gebrauche die deutsche Sprache so, wie sie im Laufe der Zeit gewachsen ist: definitionsgemäss und ganz selbstverständlich sind mit den Worten “Leser” und “Student” immer auch die weiblichen Entsprechungen gemeint. Genau gleich übrigens, wie “Geisel” und “Person” definitionsgemäss und selbstverständlich auch Männliches bezeichnet. Zürich, im September 1991 Auf Grund einer Anregung aus Studentenkreisen erscheint der Text im Studienjahr 1995/96 erstmals als Serie von drei kleinen Bändchen, Teil A, B und C. Ein Dank geht an die vielen Studenten, die mitgeholfen haben, Druckfehler und Unklarheiten früherer Fassungen auszumerzen. Zürich, im September 1995 In den sukzessiven Neudrucken wurden jeweils die bekannt gewordenen Druckfehler korrigiert. Zürich, im Juni 2014 2 3 Ch. Blatter: Ingenieuranalysis I/II, Verlag der Fachvereine Zürich Burg,Haf,Wille: Höhere Mathematik für Ingenieure I/II/III/IV, B.G.Teubner Stuttgart Inhaltsverzeichnis, Teil A Kapitel I. Funktionen 1 Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3 Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . 25 4 Der Zwischenwertsatz für stetige Funktionen . . . . . . . . . . . . . . . . . . . . 34 5 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6 Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 7 Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Kapitel II. Differentialrechnung 1 Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3 Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . 23 4 Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . . 35 6 Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 49 7 Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 57 8 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Kapitel III. Integralrechnung 1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . . 7 3 Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . . 15 5 Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6 Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 7 Flächenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 8 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 9 Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 10 Oberflächenberechnung 49 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Schwerpunkt, Flächenmittelpunkt . . . . . . . . . . . . . . . . . . . . . . . . . . 54 12 Trägheitsmoment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 13 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Inhaltsverzeichnis, Teil B Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3 Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . . 18 4 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6 Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 7 Funktionen von drei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 8 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Kapitel V. Funktionen von mehreren Variablen, Integralrechnung 1 Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . . 12 3 Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . . 30 5 Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Kapitel VI. Vektoranalysis 1 Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Differentialoperatoren der Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . 11 3 Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4 Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5 Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6 Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 9 Eine Anwendung des Satzes von Stokes . . . . . . . . . . . . . . . . . . . . . . . 65 10 Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Inhaltsverzeichnis, Teil C Kapitel VII. Gewöhnliche Differentialgleichungen 1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . . 17 4 Separierbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6 Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . . 48 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . . 57 8 Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . . 64 9 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . 72 10 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . . 83 11 Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 12 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107 14 Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Kapitel VIII. Potenzreihen 1 Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . 3 2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Anhang. Komplexe Zahlen 1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Sachverzeichnis Teil A Kapitel I. Funktionen Kapitel II. Differentialrechnung Kapitel III. Integralrechnung Wenn [das] Fundament fehlt, so schwebt das Spezialwissen haltlos im Raum, es beschränkt sich auf das Auswendiglernen von Fakten, es kann nicht in einen Zusammenhang gestellt und sinnvoll verwertet werden. Fehlendes Grundwissen lässt sich aber nicht nachholen. Prof. Dr. A.P. Speiser, ehemaliger Chef der Konzernforschung BBC/ABB Inhaltsverzeichnis, Teil A Kapitel I. Funktionen 1 Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3 Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . 25 4 Der Zwischenwertsatz für stetige Funktionen . . . . . . . . . . . . . . . . . . . . 34 5 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6 Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 7 Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Kapitel II. Differentialrechnung 1 Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3 Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . 23 4 Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . . 35 6 Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 49 7 Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 57 8 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Kapitel III. Integralrechnung 1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . . 7 3 Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . . 15 5 Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6 Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 7 Flächenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 8 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 9 Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 10 Oberflächenberechnung 49 11 Schwerpunkt, Flächenmittelpunkt 12 Trägheitsmoment 13 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel I. Funktionen Dem Ingeniör ist nichts zu schwör Aus einem Inserat der SAIA AG, Murten 15 10 5 -4 -2 2 4 -5 -10 Inhaltsverzeichnis 1 Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3 Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . 25 4 Der Zwischenwertsatz für stetige Funktionen . . . . . . . . . . . . . . . . . . . . 34 5 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6 Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 7 Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3 Kapitel I. Funktionen 1 Folgen, Konvergenz Eine Folge von reellen Zahlen ist eine Abbildung der natürlichen Zahlen 1, 2, . . . (oder auch 0, 1, 2, . . .) in die reellen Zahlen. Für jede natürliche Zahl n ist somit eine reelle Zahl an festgelegt: 1 → a1 2 → a2 3 → a3 .. . n → an .. . Die Folge wird oft kurz durch ihre Werte a1 , a2 , . . . beschrieben. Das Bildungsgesetz der Folge kann verschiedene Gestalt besitzen. In manchen Fällen ist das n-te Glied an durch eine geschlossene Formel gegeben. Beispiel an = −5 + 3n , n ≥ 1 . Sehr oft ist dies allerdings nicht der Fall. Für die Anwendung sehr wichtig sind die Folgen, wo die Glieder rekursiv bestimmt werden: a1 ist gegeben; an+1 lässt sich nach einer gegebenen Vorschrift aus a1 , a2 , . . . , an berechnen. Beispiel Es sei c > 0 eine reelle Zahl. Die Folge a1 = 1, an+1 1 c = an + 2 an , n≥1, ist rekursiv gegeben. Der mathematische Begriff der Folge ist sowohl für die Theorie wie für die Anwendungen ganz fundamental. So bestehen Computerberechnungen zum Beispiel oft darin, rekursiv definierte √ Folgen zu erzeugen. Berechnet man mit Hilfe eines Taschenrechners die Quadratwurzel c, so geschieht dies dadurch, dass die ersten Glieder einer Folge a1 , a2 , . . . bestimmt werden, deren Bildungsgesetz im Taschenrechner fest programmiert ist. Diese Folge hat die Eigenschaft, dass von einem bestimmten Index m an alle Glieder am+k , k ≥ 0 in allen angezeigten Dezimalstellen √ mit dem Dezimalbruch von c übereinstimmen, wobei die letzte angezeigte Stelle natürlich gerundet ist. Es werden dann mindestens die ersten m Glieder der Folge ausgerechnet. Dass die √ verwendete Folge diese Eigenschaft hat, folgt aus der Tatsache, dass sie “gegen c konvergiert”. Den Begriff der Konvergenz werden wir in diesem Abschnitt genau definieren. 4 U. Stammbach: Analysis, Teil A Zur Diskussion von Folgen ist es oft nützlich, die Glieder als Punkte in einem kartesischen Koordinatensystem aufzufassen; das Glied an wird als Punkt (n, an ) dargestellt (siehe Figur 1). Definitionen Eine Folge a1 , a2 , . . . heisst beschränkt, wenn ihr Bild ganz in einem endlich breiten, waagerechten Parallelstreifen enthalten ist. 7 6 5 Fig. 1 : Zur Darstellung von Folgen 4 3 2 1 2 4 6 8 10 (n) Eine Folge heisst (strikt) monoton wachsend, wenn für alle n gilt an+1 ≥ an (bzw. an+1 > an ) . Die Folge a1 , a2 , . . . heisst Nullfolge, falls es zu jeder noch so kleinen Zahl > 0 ein m gibt, so dass für alle Glieder am+k , k ≥ 0 gilt |am+k | < . Man sagt in diesem Fall, die Folge konvergiere gegen Null oder strebe gegen Null. In Zeichen drückt man dies durch 5 Kapitel I. Funktionen lim an = 0 n→∞ oder durch an → 0 für n → ∞ aus. Das geometrische Bild einer Nullfolge hat die Eigenschaft, dass in jedem noch so schmalen Parallelstreifen mit der x-Achse als Mittellinie alle Glieder der Folge mit Ausnahme von endlich vielen liegen. Beispiel Figur 2). Die Folge gegeben durch an = 1/n, n ≥ 1 ist offensichtlich eine Nullfolge (siehe 1.5 1 Fig. 2 : Die Folge 1/n 0.5 5 10 15 20 (n) -0.5 Beispiel Die Folge gegeben durch an = 1 1 + (−1)n 2 2 n ist offenbar beschränkt (siehe Figur 3). Sie hat zusätzlich die Eigenschaft, dass in jedem Parallelstreifen mit Mittellinie auf dem Niveau 1/2 alle Glieder der Folge bis auf endlich viele liegen. 6 U. Stammbach: Analysis, Teil A 0.8 0.6 0.4 Fig. 3 : 0.2 5 10 15 20 1 1 + (−1)n 2 2 n (n) -0.2 -0.4 -0.6 In einem solchen Fall sagen wir, die Folge konvergiere gegen den Grenzwert a = 1/2. Die genaue Definition dieses wichtigen Begriffes ist wie folgt. Man sagt, die Folge a1 , a2 , . . . konvergiere gegen den Grenzwert oder Limes a, falls die Folge bn = an − a eine Nullfolge ist, d.h. wenn es zu jeder noch so kleinen Zahl > 0 ein m gibt, so dass für alle Glieder am+k , k ≥ 0 gilt |am+k − a| < . In Zeichen drückt man dies aus durch lim an = a n→∞ oder durch an → a für n → ∞ aus. Eine Folge, die konvergiert, heisst konvergent, eine Folge die nicht konvergiert, heisst divergent. 7 Kapitel I. Funktionen Aus unserer Definition folgt sofort, dass eine konvergente Folge beschränkt ist. Wir können diesen logischen Sachverhalt auch so ausdrücken: Eine nicht beschränkte Folge ist nicht konvergent. Ferner lässt sich leicht zeigen, dass eine konvergente Folge nicht gegen mehr als einen Grenzwert konvergieren kann: ist die Folge konvergent, so ist ihr Limes eindeutig bestimmt. Sehr wichtig ist nun die Tatsache, dass in manchen Fällen gezeigt werden kann, dass eine Folge konvergiert, ohne dass über deren Limes a priori etwas bekannt ist. Dies ist z.B. auf Grund des folgenden Satzes möglich, welcher eine fundamentale Eigenschaft der reellen Zahlen beschreibt. Wir führen ihn hier ohne Beweis auf. Satz Ist eine Folge monoton wachsend (oder fallend) und beschränkt, so ist sie konvergent. Beispiel Ein ganz einfaches Beispiel ist das folgende. Jeder unendliche Dezimalbruch definiert eine monoton wachsende, beschränkte Folge (von rationalen Zahlen), indem man als Glieder der Folge einfach die endlichen Dezimalbrüche nimmt. Die Zahl π zum Beispiel definiert die Folge 3, 3.1, 3.14, 3.141, 3.1415, 3.14159, 3.141592, 3.1415926, . . . Nach obigem Satz konvergiert die so erhaltene Folge; ihr Limes ist die durch den unendlichen Dezimalbruch dargestellte reelle Zahl. Beispiel (siehe Figur 4) an = 1 + 1 1 1 1 + + + ··· + , n ≥ 1. 1! 2! 3! n! Diese Folge ist (strikt) monoton wachsend und - wie wir unten zeigen - beschränkt. Deshalb ist sie nach dem obigen Satz auch konvergent. Ihr Limes, der a priori nicht bekannt ist und erst mit Hilfe dieser Folge berechnet werden kann, ist die Euler’sche Zahl e. Es ist bekannt, dass die Zahl e irrational ist, d.h. durch einen unendlichen nichtperiodischen Dezimalbruch dargestellt wird. Näherungsweise gilt e = 2.7182818284590 · · ·. Die Zahl e spielt als Basis der natürlichen Logarithmen in der Mathematik eine grosse Rolle. Um zu zeigen, dass die Folge beschränkt ist, 1 2! 1 3! 1 4! benützen wir die offensichtlichen Abschätzungen 1 ≤ 2 1 ≤ 22 1 ≤ 23 .. . 1 1 ≤ n−1 n! 2 .. . 8 U. Stammbach: Analysis, Teil A 3.5 3 2.5 Fig. 4 : 2 an = 1 + 1.5 1 1 1 1 + + + ··· + 1! 2! 3! n! 1 0.5 2 4 6 8 10 12 (n) -0.5 Es ist dann an = 1 + 1 1 1 1 1 1 1 + + + ··· + ≤ 1 + 1 + 1 + 2 + · · · + n−1 = x . 1! 2! 3! n! 2 2 2 Damit gilt 1 1 3 1 x = x − x = − n, 2 2 2 2 also x=3− 1 2n−1 < 3. Die Folge ist also beschränkt, es gilt 0 < an < 3. Beispiel Die harmonische Folge (siehe Figur 5) ist definiert durch an = 1 + 1 1 1 + + ··· + . 2 3 n 9 Kapitel I. Funktionen Diese Folge ist offensichtlich ebenfalls (strikt) monoton wachsend. Um über die Konvergenz zu entscheiden, muss man nur untersuchen, ob sie beschränkt ist. Ist sie beschränkt, so ist sie nach unserem Satz auch konvergent. Ist sie nicht beschränkt, so kann sie nach unseren früheren Aussagen auch nicht konvergent sein. Wir zeigen anschliessend, dass die Glieder der Folge beliebig gross werden, wenn nur ihr Index genügend gross ist. Die Folge ist somit in der Tat nicht beschränkt. Die harmonische Folge ist nicht konvergent. 8 6 Fig. 5 : 4 1+ 1 1 1 + + ··· + 2 3 n 2 (n) 50 100 150 200 250 Um zu zeigen, dass unsere Folge nicht beschränkt ist, benützen wir die Beziehung a2n − an = 1 1 1 n 1 + + ··· + ≥ = , n+1 n+2 n+n 2n 2 die unmittelbar aus der Definition folgt. Daraus ergibt sich a2 a22 a23 = a1 + (a2 − a1 ) = a2 + (a22 − a2 ) = a22 + (a23 − a22 ) .. . a2r = a2r−1 + (a2r − a2r−1 ) ≥ 1 + r/2 . ≥ 1 + 1/2 , ≥ 1 + 2/2 , ≥ 1 + 3/2 , Die Glieder der Folge werden also beliebig gross, die Folge ist nicht beschränkt. 10 U. Stammbach: Beispiel Analysis, Teil A Wir kehren zurück zur Folge des ersten Beispiels, nämlich zu a1 = 1, an+1 1 c = an + 2 an , n≥1, wobei c > 0 eine feste reelle Zahl bezeichnet (siehe Figur 6). Wir behaupten, dass diese Folge √ konvergiert, und zwar gegen c. Um dies zu beweisen, müssen wir nachweisen, dass die Folge √ b1 , b2 , b3 , . . . mit bn = an − c eine Nullfolge ist. Aus der Definition von an+1 erhalten wir 3 2.5 2 Fig. 6 : 1.5 a1 = 1, an+1 = 1 0.5 (n) 2 4 6 8 -0.5 bn+1 = an+1 − √ c = = = √ 1 c − 2 c) (an + 2 an √ 1 (a2n + c − 2an c) 2an √ 1 (an − c)2 . 2an Wegen an ≥ 0 ergibt sich daraus bn ≥ 0 für n = 2, 3, . . .. Ferner erhalten wir bn+1 = √ an − c · bn 2an 1 3 an + 2 an 11 Kapitel I. Funktionen = √ ! 1 c · bn . − 2 2an Nun gilt für n ≥ 2 wegen bn+1 ≥ 0 und bn ≥ 0 auch √ 1 c ≥ 0. − 2 2an Da auch √ c/2an positiv ist, folgt 0≤ √ 1 c 1 < . − 2 2an 2 Damit erhalten wir 1 |bn+1 | < |bn | , 2 d.h. die Folge b1 , b2 , b3 , . . . ist in der Tat eine Nullfolge. Für das Rechnen mit konvergenten Folgen gelten einfache Rechenregeln, die wir kurz zusammenstellen. Es seien a1 , a2 , . . . und b1 , b2 , . . . zwei konvergente Folgen mit limn→∞ an = a und limn→∞ bn = b. Dann gilt lim (an + bn ) = a + b , n→∞ lim (an − bn ) = a − b , n→∞ lim (an · bn ) = a · b , n→∞ lim (an /bn ) = a/b , n→∞ wobei für Letzteres natürlich vorausgesetzt werden muss, dass b und alle bn verschieden von Null sind. Wir verzichten in dieser Vorlesung auf einen Beweis dieser Regeln, möchten aber die beiden folgenden Bemerkungen anfügen. Sind die beiden Folgen a1 , a2 , . . . und b1 , b2 , . . . durch unendliche Dezimalbrüche gegeben, so besagen diese Rechenregeln nichts anderes, als dass man approximativ mit den endlichen Teilbrüchen rechnen darf. Eine Tatsache, die man natürlich etwa beim Rechnen mit π immer schon benützt hat. Zum zweiten muss der Leser gewarnt werden, diese Regeln in Fällen anzuwenden, wo die Folgen a1 , a2 , . . . und b1 , b2 , . . . nicht konvergieren. In diesem Fall gelten die Regeln nicht, und deren Anwendung liefert leicht falsche Resultate. Beispiel n+3 1 + 3/n 1 = lim = n→∞ 2n + 5 n→∞ 2 + 5/n 2 lim 12 Beispiel U. Stammbach: Analysis, Teil A n3 + n2 + 1 1 + 1/n + 1/n3 1 =− = lim n→∞ −3n3 + 13 n→∞ −3 + 13/n3 3 lim Beispiel 17n2 existiert nicht n→∞ 18n + 1 lim Beispiel lim n→∞ 2n2 n2 + 3 !4 = lim n→∞ 2 1 + 3/n2 4 = 24 Zum Schluss dieses Abschnittes gehen wir noch kurz auf die geometrische Folge und die geometrische Reihe ein. Beispiel Eine Folge der Form a0 = a, a1 = aq, · · · , an = aq n , · · · heisst geometrische Folge. Die Zahl a heisst Anfangsglied, die Zahl q heisst Faktor der Folge. Für |q| > 1 gilt |an+1 | = |an q| = |an ||q| > |an |. Die Absolutbeträge der Glieder der Folge werden mit wachsendem n beliebig gross; die Folge ist in diesem Fall nicht beschränkt, also auch nicht konvergent. Für |q| < 1 hingegen gilt |an+1 | = |an q| = |an ||q| < |an |. Die Absolutbeträge der Glieder werden mit wachsendem n beliebig klein. Ist nämlich > 0 irgendeine positive reelle Zahl, so gilt |am | < , wenn nur m gross genug ist. Die Bedingung |aq m | < liefert nämlich log |a| + m log |q| < log , woraus sich wegen log |q| < 0 sofort m> log − log|a| log |q| ergibt. Diese Überlegung zeigt, dass für |q| < 1 die geometrische Folge eine Nullfolge ist. Beispiel Schliesslich wenden wir uns noch der sogenannten geometrischen Reihe zu. Darunter versteht man die Folge, die durch 13 Kapitel I. Funktionen s0 s1 = 1, = 1 + x, .. . sn = 1 + x + x2 + · · · + xn , sn+1 = 1 + x + x2 + · · · + xn + xn+1 , gegeben ist. Dabei bezeichnet x eine reelle Zahl. (Der Leser mache sich den Unterschied zwischen den Begriffen “Folge” und “Reihe” klar!) Rekursiv kann man die Folge s0 , s1 , s2 , . . . beschreiben durch s0 = 1; sn+1 = sn + xn+1 , n ≥ 0. Man erhält leicht xsn − sn = xn+1 − 1, woraus sich sofort sn = 1 − xn+1 1 xn+1 = − 1−x 1−x 1−x ergibt. Ist |x| < 1, so strebt der zweite Summand für n → ∞ offensichtlich gegen Null. Deshalb konvergiert in diesem Fall die Folge s0 , s1 , s2 , . . ., und es gilt lim (1 + x + x2 + · · · + xn ) = n→∞ 1 , |x| < 1. 1−x Für |x| > 1 ist die Folge s0 , s1 , s2 , . . . offenbar nicht beschränkt, so dass sie in diesem Fall auch nicht konvergent ist. Man sagt etwas kürzer, die geometrische Reihe 1 + x + x2 + · · · + xn + · · · konvergiere für |x| < 1 gegen 1/(1 − x) und divergiere für |x| > 1, indem man die Konvergenz bzw. Divergenz der Reihe durch die Konvergenz bzw. Divergenz der zugehörigen Folge definiert (siehe Figuren 7,8,9). Konsequenterweise schreibt man dann 1 + x + x 2 + · · · + xn + · · · = 1 , für |x| < 1. 1−x Die linke Seite dieser Formel kann man als “alternative” Definition der Funktion f :x→ 1 , D(f ) = (−1, +1) 1−x auffassen (siehe Figur 10). (Der Leser beachte die Einschränkung des Definitionsbereiches!) Insbesondere kann der Funktionswert f (x) für |x| < 1 als Limes unserer Folge s0 , s1 , s2 , . . . berechnet werden. Für die einfache Funktion f scheint dies fast eine Spielerei zu sein; für kompliziertere Funktionen bildet eine Reihe aber oft die natürlichste Art, die Funktion darzustellen und den Funktionswert zu bestimmen. Wir werden auf dieses Thema unter dem Stichwort Potenzreihen später wieder zu sprechen kommen und uns etwas eingehender damit beschäftigen. 14 U. Stammbach: Analysis, Teil A 2 1.5 Fig. 7 : Geometrische Reihe mit x = 0.3 1 0.5 2 4 6 8 10 12 (n) -0.5 12 10 8 Fig. 8 : Geometrische Reihe mit x = 0.9 6 4 2 (n) 10 20 30 40 15 Kapitel I. Funktionen 1.2 1 0.8 Fig. 9 : Geometrische Reihe mit x = −0.9 0.6 0.4 0.2 (n) 10 20 30 40 -0.2 20 15 Fig. 10 : Die Funktion 10 x→ 5 (x) -1 -0.5 0.5 1 1 1−x 16 2 U. Stammbach: Analysis, Teil A Funktionen Eine Funktion oder Abbildung von der Menge A in die Menge B, f : A → B, ist eine Vorschrift, die für jedes Element x ∈ A ein Element f (x) ∈ B festlegt, f : x → f (x). f (x) heisst Funktionswert von f an der Stelle x oder Bild von x unter f . A heisst Definitionsbereich D(f ) von f (englisch: domain), B heisst Zielbereich von f (englisch: range), W (f ) = {f (x)|x ∈ D(f )} heisst Wertebereich von f . Es handelt sich beim Begriff der Funktion um einen der ganz zentralen Begriffe der Mathematik. Er hat eine lange historische Entwicklung durchgemacht; erst in neuester Zeit hat er den obigen sehr genau bestimmten Inhalt erhalten. Der Leser tut gut daran, sich mit diesem Begriff eingehend auseinanderzusetzen. Eine etwas anschaulichere Beschreibung des Funktionsbegriffs ist die folgende. Eine Funktion f : A → B ist ein “schwarzer Kasten”, der als Input nur Elemente von A annimmt, und für jedes x ∈ A den Output f (x) ∈ B liefert. Konkret (aber wegen der beschränkten Rechengenauigkeit nur annäherungsweise) kann man etwa einen Taschenrechner mit der Taste log als Funktion f : x → log x ansehen. Der Begriff der Funktion ist sehr allgemein, über die Natur der Elemente von A und B zum Beispiel wird überhaupt nichts vorausgesetzt. Zuerst betrachten wir nun Beispiele von Funktionen, welche auf einem Teilbereich der reellen Zahlen definiert sind und welche reelle Zahlen als Werte annehmen, also reellwertige Funktionen einer reellen Variablen. Zu jeder solchen Funktion f gehört ihr Graph Γ(f ), nämlich die Menge der Punkte (x, y) ∈ R × R mit x ∈ D(f ), y = f (x) Γ(f ) = {(x, y) ∈ R × R| x ∈ D(f ), y = f (x)}. Beispiel Die Sinusfunktion f : x → sin x; f : R → R; D(f ) = R, W (f ) = [−1, +1]. Man beachte W (f ) 6= B; im allgemeinen können Zielbereich und Wertebereich verschieden sein. Beispiel f :x→ √ x − 1 ; f : [1, ∞) → R, D(f ) = [1, ∞); W (f ) = [0, ∞). Bei Funktionen, wie sie in Anwendungsbeispielen auftreten, ist der Graph üblicherweise eine Kurve; es lassen sich aber durchaus kompliziertere Funktionen denken, deren Graph in keinem vernünftigen Sinn als Kurve aufgefasst werden kann. Beispiel Die Funktion f : R → R sei durch die folgende Vorschrift gegeben: 17 Kapitel I. Funktionen ( f (x) = 1, falls x rational ist, 0, falls x irrational ist . √ Es gilt also insbesondere f (1/2) = 1 und f ( 2) = 0. Der Graph dieser Funktion ist keine Kurve im anschaulichen Sinn. Funktionen lassen sich auf sehr viele verschiedene Arten definieren, beschreiben und anschaulich machen. Auf einige der wichtigsten Arten gehen wir im Folgenden ein. (i) Wertetabelle Ist D(f ) eine endliche Menge, so kann f durch eine Wertetabelle beschrieben werden; ist z.B. D(f ) = {x0 , x1 , ...., xN }, so genügt es f (x0 ), f (x1 ), ...., f (xN ) aufzuführen: x x0 x1 x2 ··· xN f (x) f (x0 ) f (x1 ) f (x2 ) · · · f (xN ) Wenn D(f ) eine unendliche Menge ist, so ist f natürlich durch die Angabe von endlich vielen Werten noch nicht bestimmt. Jede reelle Zahlfolge kann als eine auf der Menge der natürlichen Zahlen definierte Funktion f : N → R x 1 2 3 ··· 4 f (x) a1 a2 a3 a4 · · · angesehen werden. Sie wird durch das Bildungsgesetz der Folge bestimmt, z.B. a1 = 1, an+1 = 1 c an + , n≥1. 2 an (ii) Explizite Darstellung, Formel Eine Funktion f kann durch eine Rechenvorschrift beschrieben werden, welche es erlaubt, zu gegebenem x den Wert f (x) zu bestimmen f :x→ x2 + 5x + 4 x4 − 16 In einem solchen Fall wird, falls nichts anderes angegeben ist, für D(f ) immer der grösstmögliche Bereich genommen, für den die angegebene Formel sinnvoll ist. Die Rechenvorschrift kann beliebig kompliziert sein. Als Beispiele erwähnen wir eine “Sprungfunktion” (siehe Figur 1) f : x → f (x) = −1, für x < 0 0, für x = 0 1, für x > 0 18 U. Stammbach: Analysis, Teil A 2 1.5 1 Fig. 1 : Sprungfunktion 0.5 -4 -2 2 4 (x) -0.5 -1 -1.5 -2 1 0.5 Fig. 2 : Gauss’sche Fehlerfunktion -2 -1 1 2 (x) -0.5 -1 19 Kapitel I. Funktionen und die Gauss’sche Fehlerfunktion (siehe Figur 2) f : x → f (x) = Z x 0 2 e−t dt . Der Leser mache sich an dieser Stelle den Unterschied zwischen den Begriffen “Formel” und “Funktion” klar: nicht jede Funktion ist durch eine Formel gegeben! (iii) Differentialgleichung In den Naturwissenschaften werden Funktionen sehr oft durch Differentialgleichungen bestimmt. Als Beispiel sei der freie Fall eines Massenpunktes erwähnt. Die Differentialgleichung lautet bekanntlich ÿ(t) = −g, wo g die Erdbeschleunigung bezeichnet. Daraus erhält man 1 y(t) = − gt2 + At + B, 2 wo A und B Konstanten sind. Die Differentialgleichung hat unendlich viele Lösungen. Die (Integrations-)Konstanten werden durch weitere Angaben, üblicherweise durch die sogenannten Anfangsbedingungen (Ort und Geschwindigkeit des Massenpunktes zur Zeit 0) bestimmt. Im Rest dieses Abschnittes wollen wir noch einige Beispiele von Funktionen kennen lernen, welche etwas allgemeinerer Art sind, und dabei gleich Situationen beschreiben, in denen solche Funktionen auf natürliche Weise auftreten. Beispiel f : A → R × R, A ein Teilbereich der reellen Zahlen. Solche Funktionen treten z.B. bei Parameterdarstellungen ebener Kurven auf. (1) t → (a cos t, a sin t), A = R Diese Funktion beschreibt einen Kreis mit Radius a, der mit Startpunkt (a, 0) gleichförmig im Gegenuhrzeigersinn durchlaufen wird. (2) t → (a cos t, b sin t), A = R Es gilt x(t)2 /a2 + y(t)2 /b2 = 1. Die Funktion beschreibt folglich eine Ellipse mit Halbachsen a und b und Mittelpunkt (0, 0). Beispiel f : A → R × R × R, A ein Teilbereich der reellen Zahlen, f : t → (x(t), y(t), z(t)). Eine solche Funktion beschreibt eine Kurve im 3-dimensionalen Raum. 20 U. Stammbach: (1) Analysis, Teil A x(t) = a1 + tn1 y(t) = a2 + tn2 , D(f ) = R f :t→ z(t) = a + tn 3 3 stellt eine Gerade durch den Punkt P , P = (a1 , a2 , a3 ) in Richtung ~n, ~n = (n1 , n2 , n3 ) dar. (2) f : t → (cos t, sin t, h t), D(f ) = R . 2π Diese Funktion beschreibt eine Rechts-Schraubenlinie mit Ganghöhe h auf einem Zylinder mit Radius 1 um die z-Achse. Beispiel f : A → R, A Teil der Ebene R × R. Der Funktionswert an der Stelle (x, y) ist eine reelle Zahl. Die Temperaturverteilung auf einem Blechstück der Form A wird zum Beispiel durch eine Funktion dieser Art beschrieben. Beispiel Betrachten wir jetzt ein ganz konkretes Beispiel. Bei einer Eisenbahnlinie, welche einen Kreisbogen beschreibt, ist die Grösse a vorgegeben. Man bestimme den Kurvenradius r in Abhängigkeit von x (siehe Figur 3). x a Fig. 3 : Kreisbogen mit Grössen r, a, x r Es gilt offensichtlich a2 + (r − x)2 = r 2 . 21 Kapitel I. Funktionen Daraus ergibt sich leicht ! a2 +x . x 1 r= 2 Damit ist der Radius r in Abhängigkeit der Grösse x bestimmt. Mathematisch definiert dies eine Funktion ! 1 a2 r : x → r(x) = +x . 2 x Für die Anwendung, die man im Auge hat, ist nur der Definitionsbereich D(r) = (0, a] von Interesse, obschon mathematisch die gefundene Formel auch für andere Werte von x sinnvoll ist, und deshalb der Definitionsbereich ausgedehnt werden kann. Das Beispiel etwas variierend kann man den Radius r auch in Abhängigkeit der Grössen x und a betrachten. Dann beschreibt die obige Formel eine Funktion 1 r̄ : (a, x) → r̄(a, x) = 2 ! a2 +x , x welche auf einem Teilbereich A der Ebene R × R definiert ist und Werte in R annimmt. Man hat also hier eine Funktion r̄ : A → R vor sich, wie wir sie auch in einem der früheren Beispiele studiert haben, und dies in einem ganz anderen Zusammenhang. (y) R ϕ ψ r Fig. 4 : Roboterarm P (x) 22 U. Stammbach: Analysis, Teil A Beispiel f : A → R × R, A eine Teilmenge von R × R. Eine Situation, wo eine Funktion dieser Art auf natürliche Art auftritt, ist wie folgt. Gegeben ist ein Roboterarm (siehe Figur 4), bei dem die Winkel ϕ und ψ unabhängig voneinander zwischen 0 und π variieren können. Jedes Paar (ϕ, ψ) legt einen Punkt P im Arbeitsbereich des Armes fest, nämlich P = (R cos ϕ + r cos(ϕ − ψ), R sin ϕ + r sin(ϕ − ψ)). Dadurch wird offenbar eine Funktion (=Abbildung!) f : (ϕ, ψ) → (R cos ϕ + r cos(ϕ − ψ), R sin ϕ + r sin(ϕ − ψ)) von einem Teilbereich A der (ϕ, ψ)-Ebene in die (x, y)-Ebene definiert. Der Teilbereich A ist dabei durch A = {(ϕ, ψ)|0 ≤ ϕ ≤ π, 0 ≤ ψ ≤ π} gegeben. Zum Schluss dieses Abschnittes wollen wir uns mit einigen grundlegenden Funktionen beschäftigen; wir verstehen darunter Funktionen der Art x → xn , x → sin x, x → ex , etc. Diese Funktionen sind aus der Schule bereits bekannt, und wir können uns deshalb kurz fassen. Da sie aber die Bausteine für kompliziertere Funktionen bilden, ist es notwendig, ihre Eigenschaften gut zu kennen; insbesondere muss für jede dieser Funktionen über den Definitionsbereich, das globale Verhalten, die Symmetrieeigenschaften etc. Klarheit herrschen. Es sei f : x → f (x) eine Funktion. Sie heisst gerade, wenn D(f ) symmetrisch zum Nullpunkt der x-Achse ist und wenn für alle x ∈ D(f ) gilt f (−x) = f (x). Die Funktion f : x → f (x) heisst ungerade, wenn D(f ) symmetrisch zum Nullpunkt der x-Achse ist und wenn für alle x ∈ D(f ) gilt f (−x) = −f (x). Die Funktion f : x → f (x) heisst (strikt) monoton wachsend, wenn aus x1 < x2 mit x1 , x2 ∈ D(f ) stets folgt f (x1 ) ≤ f (x2 ) (bzw. f (x1 ) < f (x2 )). Die Funktion f : x → f (x) heisst (strikt) monoton fallend, wenn aus x1 < x2 mit x1 , x2 ∈ D(f ) stets folgt f (x1 ) ≥ f (x2 ) (bzw. f (x1 ) > f (x2 )). Die elementaren Funktionen sind die folgenden: 23 Kapitel I. Funktionen (i) Potenzfunktion x → xn . Man mache sich in den folgenden Fällen den Verlauf des Graphen klar: n ganz positiv, n ganz negativ, n rational (z.B. 12 , 23 , ...), n beliebig reell. In welchen Fällen ist die Potenzfunktion gerade, ungerade, monoton wachsend oder fallend, etc? (ii) Polynome x → a0 + a1 x + a2 x2 + · · · + an xn . Die reellen Grössen a0 , a1 , ..., an heissen die Koeffizienten des Polynoms, die ganze Zahl n heisst Grad des Polynoms, falls an 6= 0. Man studiere den typischen Verlauf solcher Funktionen, insbesondere untersuche man für kleine n, n = 1, 2, 3 den Einfluss der Koeffizienten. (iii) rationale Funktionen x → a0 + a1 x + · · · + an xn . b0 + b 1 x + · · · + b m x m Man werde sich klar über den Definitionsbereich solcher Funktionen und studiere den Verlauf an einigen ausgewählten Beispielen. (iv) trigonometrische Funktionen sin, cos, tan, cot. Man präge sich für jede dieser Funktionen die grundlegenden Eigenschaften (Symmetrie, Nullstellen, Periodizität, etc.) gut ein. (v) Exponentialfunktion (vi) Logarithmusfunktion x → ax , a > 1. x →a log x, a > 1. Auf Exponential- und Logarithmusfunktion werden wir später noch zurückkommen. Hier soll der typische Verlauf der Graphen kennengelernt und insbesondere der Einfluss der Grösse a studiert werden. Es soll auch klar werden, dass zwischen Exponentialfunktion und Potenzfunktion ein wesentlicher Unterschied besteht. Anhang: Intervallbezeichnungen. Es seien a, b ∈ R mit a < b gegeben. Dann definieren wir (a,b) = {x ∈ R | a < x < b} , [a,b) = {x ∈ R | a ≤ x < b} , 24 U. Stammbach: Analysis, Teil A (a,b] = {x ∈ R | a < x ≤ b} , [a,b] = {x ∈ R | a ≤ x ≤ b} . An Stelle von a, b ∈ R lassen wir auch die Symbole +∞, −∞ zu, so dass zum Beispiel gilt [a, ∞) = {x ∈ R | a ≤ x < ∞}, (−∞, +∞) = {x ∈ R} = R. Natürlich dürfen die Symbole +∞, −∞ nur zusammen mit einer runden Klammer vorkommen. 25 Kapitel I. Funktionen 3 Grenzwerte von Funktionen, Stetigkeit Wir beginnen diesen Abschnitt mit einem numerischen Experiment. Es sei die Funktion x2 + x + 1 f : x → sin x2 − x − 2 ! gegeben. Wir stellen uns vor, dass innerhalb einer längeren Rechnung der Funktionswert von f bestimmt werden soll, und zwar für Werte von x, die ihrerseits aus Messungen errechnet worden sind und deshalb nur näherungsweise bekannt sind. Immerhin wollen wir annehmen, dass der Wert von x mit zusätzlichem Aufwand beliebig genau gemacht werden kann. Zur Demonstration wollen wir die Funktion f zuerst an den Stellen 3.9, 3.99, 3.999, 3.9999, 3.99999, . . . auswerten, also auf einer Folge von Zahlen, die sehr rasch gegen den als genau angesehenen Wert 4 konvergiert. Diese Folge von Zahlen deutet also die sukzessiv immer besser werdende Genauigkeit für die Grösse x an. Ferner führen wir die gleiche Rechnung für die Folge von Zahlen 1.9, 1.99, 1.999, 1.9999, 1.99999, . . . durch, welche gegen den Wert 2 konvergiert. Die Berechnung liefert folgende Werte: x 3.9 3.99 3.999 3.9999 3.99999 3.999999 3.9999999 3.99999999 3.999999999 f (x) 0.8313595846 0.8603029298 0.8629213180 0.8631805876 0.8632064890 0.8632090789 0.8632093379 0.8632093638 0.8632093664 x 1.9 1.99 1.999 1.9999 1.99999 1.999999 1.9999999 1.99999999 1.999999999 f (x) 0.4413721770 0.0330343010 −0.9823680634 −0.1634533406 −0.0748074451 −0.6256837105 −0.9457588989 −0.9997768755 0.9978731823 Wir entnehmen dieser Tabelle, dass das Verhalten der Funktion f in der Nähe der beiden durch x = 2 und x = 4 gegebenen Punkte völlig verschieden ist. Während für x = 4 die Werte f (x) sich - wie eine weitere Rechnung bestätigt - sukzessive der Zahl 0.8632093666 · · · nähern, streuen sie für x = 2 “chaotisch” über einen weiten Bereich. Wir wollen im Laufe dieses Abschnittes die Gründe für diesen Sachverhalt näher untersuchen. Zu diesem Zwecke führen wir als erstes den Begriff des Grenzwertes von Funktionen ein. 26 U. Stammbach: Analysis, Teil A Wir betrachten eine Funktion f , deren Definitionsbereich das Intervall (c, ξ), c < ξ umfasst, und ausserdem Folgen x1 , x2 , . . . von reellen Zahlen xi mit c < xi < ξ, welche gegen ξ konvergieren, limi→∞ xi = ξ. Offensichtlich gibt es unendlich viele solcher Folgen; eine davon ist immer durch die unendliche Dezimalbruchentwicklung von ξ gegeben. Zu jeder solchen Folge bilden wir die zugehörige Folge der Funktionswerte f (x1 ), f (x2 ), . . . . Diese kann - je nach Sachlage - konvergieren oder divergieren. Am interessantesten ist natürlich der Fall, wo sie nicht nur konvergiert, sondern auch für jede der oben beschriebenen Zahlfolgen x1 , x2 , . . . denselben Grenzwert a liefert. Dieser Wert a heisst dann definitionsgemäss der linke Grenzwert der Funktion f an der Stelle ξ; in Zeichen drücken wir dies durch a = lim f (x) oder f (x) → a für x → ξ − x→ξ − aus. Dabei deutet das Minuszeichen beim Buchstaben ξ an, von welcher Seite die Folge x1 , x2 , . . . gegen ξ konvergieren soll. Anzumerken sind hier die folgenden Dinge. (1) Für gewisse Funktionen und für gewisse Werte von ξ kann es durchaus vorkommen, dass für die eine Zahlenfolge x1 , x2 , ... der Grenzwert limn→∞ f (xn ) existiert, während für eine andere Zahlenfolge x01 , x02 , ... der Grenzwert limn→∞ f (x0n ) nicht existiert, oder es kann vorkommen, dass diese Grenzwerte zwar beide existieren, dass sie aber voneinander verschieden sind. Gemäss unserer Definition besitzt in diesem Fall die Funktion f in ξ keinen linken Grenzwert. (2) Bei der Definition des linken Grenzwertes einer Funktion f an der Stelle ξ wurde nirgends vorausgesetzt, dass die Funktion an der Stelle ξ definiert ist. In der Tat hat der Funktionswert in ξ - falls er existiert - a priori nichts mit dem linken Grenzwert von f in ξ zu tun. Es kann allerdings vorkommen, dass die beiden Werte übereinstimmen; aber dann sagt dies etwas ganz Wesentliches über die Funktion an der Stelle ξ aus. Darauf kommen wir in Kürze zu sprechen. Vorerst aber noch einmal zurück zu unserem Beispiel. Für x = 4 scheinen unsere Zahlen zu zeigen, dass für die gegen 4 konvergierende Folge x1 = 3.9; x2 = 3.99, . . . die Folge der Funktionswerte f (x1 ), f (x2 ), . . . gegen den Wert 0.8632093666 · · · strebt. Dies wird uns vom Computerexperiment suggeriert. In der Tat lässt sich mathematisch exakt beweisen, dass für jede von links gegen 4 konvergierende Folge die zugehörige Folge der Funktionswerte gegen einen festen Wert strebt. Der linke Grenzwert ! x2 + x + 1 lim sin x2 − x − 2 x→4− existiert also, und er beträgt näherungsweise 0.8632093666 · · ·. Deutlich muss an dieser Stelle gesagt werden, dass das Computerexperiment diese Tatsache nur suggeriert, zum Beweis der 27 Kapitel I. Funktionen Tatsache aber nichts beiträgt, und auch nichts beitragen kann, denn mit Hilfe des Computers lassen sich immer nur eine endliche Anzahl der unendlich vielen Folgen x1 , x2 , . . . untersuchen, von denen beim Begriff des linken Grenzwertes die Rede ist. Vollkommen anders als im Punkte x = 4 verhält sich unsere Funktion im Punkte x = 2. Hier scheinen unsere Zahlen zu sagen, dass für die gewählte, gegen 2 konvergierende Folge x1 = 1.9, x2 = 1, 99, . . . die zugehörige Folge der Funktionswerte f (x1 ), f (x2 ), . . . divergiert, dass also der linke Grenzwert von f an der Stelle ξ = 2 nicht existiert. Dies suggeriert der Computer. In der Tat kann man mathematisch exakt nachweisen, dass lim sin x→2− x2 + x + 1 x2 − x − 2 ! nicht existiert. Auch hier muss gesagt werden, das das Computerexperiment diese Tatsache zwar suggeriert, dass es aber nichts zum mathematischen Beweis beitragen kann, denn die Divergenz einer Folge lässt sich mit endlich vielen Computerwerten nicht beweisen. Wir haben bis anhin immer vom linken Grenzwert gesprochen. Es ist aber klar, dass auf analoge Weise ein rechter Grenzwert definiert werden kann. Wir betrachten eine Funktion f , deren Definitionsbereich das Intervall (ξ, d) einschliesst, ξ < d. Wenn nun für jede von rechts gegen ξ konvergierende Folge x1 , x2 , ... die Folge der Funktionswerte f (x1 ), f (x2 ), ... gegen den Wert b konvergiert, so heisst b der rechte Grenzwert von f an der Stelle ξ, b = lim f (x) oder f (x) → b für x → ξ + . x→ξ + Beispiel Gegeben ist die Funktion x → 2−1/x (siehe Figur 1). Diese Funktion ist für x = 0 nicht definiert. Wir wollen die Grenzwerte lim 2−1/x , lim 2−1/x x→0+ x→0− berechnen. Für den rechten Grenzwert betrachten wir eine beliebige Folge x1 , x2 , . . . von positiven Zahlen, die gegen 0 konvergiert. Die reziproken Werte 1/x1 , 1/x2 , . . . werden mit wachsendem Index beliebig gross. Betrachtet man also die Folge 2−1/x1 , 2−1/x2 , . . . , so konvergiert diese offensichtlich gegen 0. Damit gilt lim+ 2−1/x = 0. x→0 Um den linken Grenzwert zu diskutieren, betrachten wir eine beliebige Folge x1 , x2 , . . ., von negativen Zahlen, die gegen 0 konvergiert. Die reziproken Werte 1/x1 , 1/x2 , . . . werden mit 28 U. Stammbach: Analysis, Teil A 5 4 3 Fig. 1 : Die Funktion x → 2−1/x 2 1 -2 -1.5 -1 -0.5 0.5 1 1.5 2 (x) -1 wachsendem Index immer kleiner (“sie streben gegen −∞”). Die Folge −1/x1 , −1/x2 , . . . “strebt gegen +∞”, und somit ebenfalls die Folge 2−1/x1 , 2−1/x2 , . . . In unserer Terminologie bedeutet dies, dass die Folge nicht konvergiert; der linke Grenzwert lim 2−1/x x→0− existiert nicht. Beispiel Ein berühmter und für die Ableitung der trigonometrischen Funktionen wichtiger Grenzwert ist sin x lim . + x x→0 Diesen wollen wir als nächstes berechnen. Wir stellen zuerst fest, dass die Funktion x→ sin x x für x = 0 nicht definiert ist und dass die Funktion gerade ist, denn es gilt sin(−x) sin x = . −x x Kapitel I. Funktionen 29 Wenn also der rechte Grenzwert dieser Funktion an der Stelle x = 0 existiert, so wird auch der linke Grenzwert an dieser Stelle existieren und mit jenem übereinstimmen. Unter der Voraussetzung, dass einer dieser Grenzwerte existiert, wird also gelten lim+ x→0 sin x sin x = lim− . x x x→0 Wir beschränken uns auf die Berechnung des rechten Grenzwertes und entnehmen der Figur 2, dass für 0 < x < π/2 die Ungleichung tan x Fig. 2 : Zur Berechnung des Grenzwertes lim 1 x→0+ sin x sin x x x x cos x x tan x 1 sin x sin x · cos x < < = 2 2 2 2 cos x gilt. Daraus erhält man weiter cos x < 1 x < , sin x cos x cos x < 1 sin x < . x cos x Lässt man nun die Grösse x eine Folge von positiven Zahlen x1 , x2 , .. durchlaufen, welche gegen 0 konvergiert, so konvergieren die Folgen 30 U. Stammbach: Analysis, Teil A cos x1 , cos x2 , ... 1 1 , , ... cos x1 cos x2 offensichtlich beide gegen 1. Damit muss gezwungenermassen auch die Folge sin x1 sin x2 , , ... x1 x2 gegen 1 konvergieren. Es gilt also lim x→0+ sin x sin x = lim− = 1. x x x→0 Die Rechenregeln, welche wir für den Umgang mit Grenzwerten von Folgen kennen gelernt haben, liefern auf offensichtliche Weise analoge Rechenregeln für Grenzwerte von Funktionen. Wir formulieren diese Regeln für rechte Grenzwerte: Aus lim f (x) = a, lim+ g(x) = b x→ξ + x→ξ folgt lim (f (x) ± g(x)) = a ± b, x→ξ + lim (f (x) · g(x)) = a · b, x→ξ + lim f (x)/g(x) = a/b. x→ξ+ Letzteres natürlich nur, falls im betrachteten Intervall b 6= 0 und g(x) 6= 0. Beispiel lim x→0+ tan x 1 1 sin x sin x = lim · = lim · lim = 1 · 1 = 1. + + + x x x x→0 cos x x→0 cos x x→0 Ausserdem gilt lim x→0+ tan x tan x = lim , − x x x→0 da x → (tan x)/x eine gerade Funktion ist. 31 Kapitel I. Funktionen Beispiel lim x→0+ sin2 x sin x sin x 1 1 = lim · lim · lim =1·1· . + + x2 (1 + cos x) x→0+ x x 1 + cos x 2 x→0 x→0 Ausserdem gilt lim+ x→0 sin2 x sin2 x = lim , x2 (1 + cos x) x→0− x2 (1 + cos x) denn die Funktion x→ sin2 x x2 (1 + cos x) ist gerade. Beispiel lim x→0+ sin x3 sin t sin x3 = lim x2 · lim = lim x2 · =0·1=0 3 + + + x x t x→0 x→0 t→0 In allen Beispielen, die wir bis anhin betrachtet haben, ist die Funktion im Punkte ξ, in dem der Grenzwert berechnet werden soll, nicht definiert. Ist er aber definiert, so stellt sich die oben schon erwähnte Frage, was die Beziehung dieses Wertes f (ξ) zu den beiden Grenzwerten lim f (x) und x→ξ − lim f (x) x→ξ + ist. Es ist leicht zu sehen, dass im allgemeinen zwischen diesen drei Werten keine Beziehung besteht. Betrachten wir zur Illustration ausgehend vom weiter oben betrachteten Beispiel die auf ganz R definierte Funktion ( g:x→ 2−1/x , x 6= 0 , 1, x=0. An der durch ξ = 0 gegebenen Stelle gilt dann g(0) = 1, lim g(x) = +∞, lim g(x) = 0. x→ξ − x→ξ + Keine irgendwie geartete Beziehung zwischen diesen Werten ist auszumachen; sie sind offenbar im allgemeinen völlig unabhängig voneinander. Andrerseits zeigt sich, dass die drei Werte in vielen Fällen – man könnte sogar sagen “üblicherweise” – übereinstimmen. Betrachten wir etwa die oben definierte Funktion an der Stelle ξ = 1, so gilt offensichtlich 32 U. Stammbach: Analysis, Teil A 1 1 1 g(1) = , lim g(x) = , lim g(x) = . − + 2 x→1 2 x→1 2 Die Tatsache, dass die drei Werte “üblicherweise” übereinstimmen, wird in vielen Fällen implizit benützt. Wertet man etwa die Funktion h : x → x2 an der Stelle ξ = π aus, so geschieht dies ja dadurch, dass man in der Rechnung die durch einen unendlichen Dezimalbruch beschriebene Irrationalzahl π durch einen endlichen Dezimalbruch approximiert und dabei je nach verlangter Genauigkeit mehr oder weniger Stellen berücksichtigt. In der hier eingeführten Sprache berechnet man die Funktion h : x → x2 auf der durch die endlichen Dezimalbrüche gegebenen und gegen π konvergierenden Folge 3, 3.1, 3.14, 3.141, 3.1415, 3.14159, . . . und nimmt stillschweigend an, dass der Wert h(π) = π 2 durch den Grenzwert der Folge h(3), h(3.1), h(3.14), h(3.141), h(3.1415), h(3.14159), . . . gegeben ist. Man macht hier offenbar implizit Gebrauch von der Beziehung lim h(x) = h(π). x→π − Dieses Vorgehen ist gestattet, weil die Funktion h : x → x2 an der Stelle ξ = π, ja sogar überall eine Eigenschaft besitzt, die im vorhergehenden Beispiel für die Funktion g an der Stelle ξ = 0 nicht gegeben war. Diese Eigenschaft nennt der Mathematiker Stetigkeit. Er definiert sie wie folgt. Definition Die Funktion f : x → f (x) sei auf dem Intervall (c, d) mit c < ξ < d definiert. Gilt lim f (x) = f (ξ) = lim+ f (x), x→ξ − x→ξ so heisst die Funktion f stetig im Punkte ξ. Eine Funktion heisst stetig schlechthin, falls sie in allen Punkten ihres Definitionsbereiches stetig ist. Der Nachweis, dass eine gegebene Funktion stetig ist, ist eine auch für einen Mathematiker mühevolle Arbeit, wenn wirklich alle Einzelheiten nachgeprüft werden sollen. Glücklicherweise lässt sich aber das wesentliche Resultat dieser Bemühungen auf konzise Art ausdrücken. Satz Sämtliche elementare Funktionen und die aus ihnen durch Addition, Subtraktion, Multiplikation, Division und Zusammensetzung gebildeten Funktionen sind in ihrem Definitionsbereich stetig. Beispiel Die Funktion f : x → x/(x − 2) ist stetig, d.h. f ist stetig in allen Punkten des Definitionsbereiches. (Der Leser beachte die Sprachregelung: im Punkte x = 2 ist f nicht definiert!) Kapitel I. Funktionen 33 Zur Notation machen wir noch folgende Bemerkung: Wenn an der Stelle ξ der linke und der rechte Grenzwert einer Funktion f : x → f (x) übereinstimmen, wenn also lim f (x) = lim+ f (x) x→ξ − x→ξ gilt, so erlaubt man sich oft, kurz vom Grenzwert der Funktion f an der Stelle ξ zu sprechen. Man verwendet dann konsequenterweise das Symbol lim f (x) . x→ξ Dadurch drückt man aus, dass die Approximation des Wertes ξ von links und von rechts das gleiche Resultat liefert. Man beachte, dass dies bei stetigen Funktionen immer der Fall ist. Die in diesem Abschnitt besprochenen Beispiele machen klar, dass die Berechnung eines Funktionswertes an einer nur approximativ bekannten Stelle ξ nur dann zu einem sinnvollen Resultat führen kann, wenn die Funktion an der Stelle ξ stetig ist. Damit man überhaupt mit einer Funktion in der Praxis rechnen kann, ist die Stetigkeit sozusagen eine Minimalvoraussetzung. Anschaulich ausgedrückt besagt sie, dass f (ξ) sich beliebig genau berechnen lässt, wenn nur ξ genügend gut approximiert wird. Diese nur qualitative Aussage genügt in Anwendungen allerdings oft nicht. Wenn man etwa die folgende naheliegende Frage beantworten will, so braucht man zusätzliche Informationen quantitativer Art. Wie genau muss ξ bekannt sein, damit f (ξ) mit vorgeschriebener Genauigkeit, z.B. auf 5 Stellen nach dem Komma berechnet werden kann? Um diese Frage zu beantworten zu können, müssen neben der Stetigkeit weitere und stärkere Eigenschaften der Funktion f bekannt sein; Stetigkeit allein genügt nicht. Wir werden später sehen, wie zum Beispiel die Differenzierbarkeit von f zur Beantwortung dieser Frage herangezogen werden kann. 34 4 U. Stammbach: Analysis, Teil A Der Zwischenwertsatz für stetige Funktionen Satz Es sei f : x → f (x) eine auf [a, b] stetige Funktion. Es sei m irgendein Wert zwischen f (a) und f (b). Dann gibt es (mindestens) ein ξ mit f (ξ) = m. Bevor wir diesen Satz beweisen, wollen wir noch folgende Bemerkungen einfügen. Wenn der Graph von f eine “Kurve” im anschaulichen Sinn ist, so ist die Aussage des Satzes insofern klar, als diese Kurve ja die Horizontale y = m mindestens einmal kreuzen muss. Gelingt es uns, diese Tatsache auf analytische Weise zu beweisen, indem wir von der Funktion f weiter nichts als die Stetigkeit voraussetzen, so bedeutet dies, dass der Graph einer stetigen Funktion unserem intuitiven Bild einer “Kurve” weitgehend entspricht. Beweis Wir nehmen an, dass f (a) ≤ m und f (b) ≥ m gilt. Der Beweis im andern Fall verläuft ganz analog. Wir konstruieren ein ξ mit der verlangten Eigenschaft als Grenzwert von zwei Folgen von Zahlen in [a, b]. Wir definieren Folgen x1 , x2 , ... und y1 , y2 , ... rekursiv wie folgt. Wir setzen x1 = a, y1 = b. Sind x1 , x2 , ..., xi und y1 , y2 , ..., yi bereits definiert, so definieren wir xi+1 und yi+1 durch 1 1 2 (xi + yi ), falls f ( 2 (xi + yi )) < m, xi+1 = x, falls f ( 12 (xi + yi )) ≥ m, i yi+1 = 1 2 (xi y, i + yi ), falls f ( 12 (xi + yi )) ≥ m, falls f ( 12 (xi + yi )) < m. Man sieht sofort, dass die Folge x1 , x2 , .... monoton wachsend und die Folge y1 , y2 , .... monoton fallend ist. Da beide Folgen beschränkt sind, müssen sie konvergieren. Wir behaupten, dass ihre Grenzwerte übereinstimmen. Es ist yn+1 − xn+1 = y n − xn b−a yn−1 − xn−1 y 1 − x1 = n . = = ··· = n 2 4 2 2 Daraus folgt 0 = lim (yn − xn ) = lim yn − lim xn . n→∞ n→∞ n→∞ Wir setzen lim yn = ξ = lim xn . Laut Definition der beiden Folgen gilt f (xn ) ≤ m für alle n = 1, 2, ... und f (yn ) ≥ m für alle n = 1, 2, .... Schliesslich verwenden wir die Stetigkeit der Funktion f an der Stelle ξ, um die Ungleichungen f (ξ) = f (lim xn ) = lim f (xn ) ≤ m, 35 Kapitel I. Funktionen m ≤ lim f (yn ) = f (lim yn ) = f (ξ) zu erhalten. Daraus ergibt sich sofort f (ξ) = m. Dies war zu beweisen. Das in diesem Beweis angegebene explizite Verfahren kann verwendet werden, um Gleichungen, insbesondere transzendente Gleichungen zu lösen. Beispiel Um die Lösung der Gleichung x = e−x zu finden, betrachte man die Funktion f : x → x − e−x . Diese ist sicherlich stetig. Ferner ist f (0) = −1 und f (1) = 1 − e−1 ∼ 2/3. Um den (offenbar einzigen) Wert ξ mit f (ξ) = 0 zu bestimmen, wendet man das obige Verfahren auf das Intervall [0, 1] und den Wert m = 0 an. Die folgende Tabelle zeigt die Werte der Glieder der beiden Folgen. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 xi 0. 0.5 0.5 0.5 0.5625 0.5625 0.5625 0.5625 0.56640625 0.56640625 0.56640625 0.5668945313 0.5671386719 0.5671386719 0.5671386719 0.5671386719 0.5671386719 0.5671386719 0.5671424866 0.5671424866 yi 1. 1. 0.75 0.625 0.625 0.59375 0.578125 0.5703125 0.5703125 0.568359375 0.5673828125 0.5673828125 0.5673828125 0.5672607422 0.567199707 0.5671691895 0.5671539307 0.5671463013 0.5671463013 0.5671443939 36 U. Stammbach: Analysis, Teil A 4 2 Fig. 1 : Die Funktion x → x − e−x -2 -1 1 2 3 4 (x) -2 -4 0.8 0.75 0.7 Fig. 2 : Die Folgen xn und yn yn 0.65 0.6 0.55 xn 0.5 0.45 (n) 2 4 6 8 10 12 14 37 Kapitel I. Funktionen 5 Koordinatentransformationen In diesem Abschnitt studieren wir, wie sich einfache Koordinatentransformationen auf den Graphen einer Funktion f auswirken. Wir illustrieren dies durch Beispiele. Dabei gehen wir aus von der Funktion (siehe Figur 1) f : x → 2x3 − 3x2 − 6x + 6. 30 20 y = 2x3 − 3x2 − 6x + 6 -4 10 -2 Fig. 1 : 2 (x) f : x → 2x3 − 3x2 − 6x + 6 -10 -20 -30 (1) Die Funktion f1 : x → f (x + a) Wir setzen zur Illustration a = 2, dann gilt f1 : x → 2(x + 2)3 − 3(x + 2)2 − 6(x + 2) + 6 = 2x3 + 9x2 + 6x − 2. Der Graph von f1 entsteht aus den Graphen von f durch Verschiebung um a Einheiten in Richtung der negativen x-Achse (siehe Figur 2). (2) Die Funktion f2 : x → f (x) + b Wir setzen zur Illustration b = 4; dann erhalten wir f : x → 2x3 − 3x2 − 6x + 10. 38 U. Stammbach: Analysis, Teil A Man erhält den Graphen von f2 , indem man den Graphen von f und b Einheiten in Richtung der positiven y-Achse verschiebt (siehe Figur 3). (3) Die Funktion f3 : x → f (cx), c > 0 Wir setzen zur Illustration c = 2, dann gilt f3 (x) = 16x3 − 12x2 − 12x + 6. Man erhält den Graphen von f3 , indem man den Graphen von f in Richtung der x-Achse um den Faktor c “staucht” (siehe Figur 4). Ist 0 < c < 1, so resultiert eine “Dehnung” in Richtung der x-Achse. Setzen wir c = 1/2, so gilt 1 3 f¯3 (x) = x3 − x2 − 3x + 6. 4 4 (4) Die Funktion f4 (x) = df (x), d > 0 Wieder setzen wir d = 2; es gilt f4 (x) = 4x3 − 6x2 − 12x + 12. Man erhält den Graphen von f4 , indem man den Graphen von f in Richtung der y-Achse um den Faktor d “streckt” (siehe Figur 5). (5) Die Funktion f5 (x) = 1/f (x) Man erhält f5 (x) = 1/(2x3 − 3x2 − 6x + 6). Wo die Funktion f Nullstellen hat, besitzt f5 Pole. Ferner gilt natürlich (siehe Figur 6) | f (x0 ) |< 1 ⇒| f5 (x0 ) |> 1 , | f (x0 ) |> 1 ⇒| f5 (x0 ) |< 1 . (6) Die Funktion f6 (x) = f (1/x) Ist | x |< 1, so folgt | 1/x |> 1 und zwar ist | 1/x | umso grösser, je kleiner | x | ist. Ist umgekehrt | x |> 1, so folgt | 1/x |< 1 und zwar ist | 1/x | umso kleiner, je grösser | x | ist (siehe Figur 7). Das Verhalten der Funktion f6 im Intervall −1 < x < +1 “spiegelt” also das Verhalten der Funktion f für | x |> 1. Umgekehrt “spiegelt” das Verhalten von f6 für grosse Werte von | x |, wie sich f im Einheitsintervall verhält, z.B. gilt lim f6 (x) = lim f x→∞ x→∞ 1 x = lim f (ξ) = 6. ξ→0+ Kennt man den Einfluss dieser sechs einfachen Koordinatentransformationen gut, so kann man Graphen von einfacheren Funktionen oft sehr leicht skizzieren. Wir zeigen dies anhand der folgenden Beispiele. 39 Kapitel I. Funktionen 30 20 10 -4 -2 Fig. 2 : 2 (x) f1 (x) = f (x + 2) -10 -20 -30 30 20 10 -4 -2 Fig. 3 : 2 (x) -10 -20 -30 f2 (x) = f (x) + 4 40 U. Stammbach: Analysis, Teil A 30 20 10 -4 -2 Fig. 4 : 2 (x) f3 (x) = f (2x) -10 -20 -30 30 20 10 -4 -2 Fig. 5 : 2 (x) -10 -20 -30 f4 (x) = 2f (x) 41 Kapitel I. Funktionen 3 2 1 -4 Fig. 6 : -2 2 (x) f5 (x) = 1/f (x) -1 -2 -3 30 20 10 -5 -4 -3 -2 -1 Fig. 7 : 1 2 3 (x) -10 -20 -30 f6 (x) = f (1/x) 42 U. Stammbach: Analysis, Teil A Beispiel x → f (x) = 3 (x + 5)(x − 2) Die Nennerfunktion x → (x+ 5)(x− 2) = (x2 + 3x− 10) ist quadratisch mit Nullstellen −5, 2. Ihr Graph ist folglich eine Parabel, die die x-Achse in −5 und 2 schneidet und nach oben geöffnet ist (der Koeffizient von x2 ist positiv). Aus Symmetriegründen ist der Scheitel bei x = −3/2 zu finden. Die Transformation (5) liefert sofort den Graphen der Funktion x→ 1 . (x + 5)(x − 2) Schliesslich liefert die Transformation (3) den Graphen von f durch “Streckung” in Richtung der y-Achse um den Faktor 3. Fragen, etwa nach der Lage der Extremalstellen von f , lassen sich nun ohne Rechnung sofort beantworten. Beispiel In einem weiteren Beispiel betrachten wir die Funktion 1 g : x → 2 cos 3x + 2 . Ausgehend vom Graph der Cosinus-Funktion x → cos x (siehe Figur 8) erhalten wir den Graphen von x → cos(3x) durch “Stauchung” in Richtung der x-Achse (siehe Figur 9). Der Graph von x → cos(3x + 12 ) = cos(3(x + 16 )) geht aus dem Graphen von x → cos(3x) durch Verschiebung um 16 in Richtung der negativen x-Achse hervor (siehe Figur 10). Schliesslich erhält man den Graphen von g durch Streckung um den Faktor 2 in Richtung der y-Achse (siehe Figur 11). Die betrachtete Funktion g ist von der Form t → A cos(ωt + ϕ), welche bei Schwingungsproblemen auftritt, wobei t natürlich die Zeit bedeutet. Von dieser Anwendung her erhalten die einzelnen Konstanten die folgenden Namen: Die Grösse A, A > 0 heisst Amplitude. Sie gibt den Wert des grössten Schwingungsausschlages an. Die Grösse ω > 0 heisst Kreisfrequenz. Eine volle Schwingung wird in 2π/ω = T absolviert; T heisst die Schwingungsdauer. Pro Zeiteinheit werden 1/T = ω/2π =: ν Schwingungen durchgeführt; ν heisst die Frequenz der Schwingung. Die Konstante ϕ, −π < ϕ < π heisst (Null-)Phasenwinkel. 43 Kapitel I. Funktionen 3 2 1 Fig. 8 : (x) -1 1 2 3 4 x → cos x -1 -2 -3 3 2 1 Fig. 9 : (x) -1 1 -1 -2 -3 2 3 4 x → cos(3x) 44 U. Stammbach: Analysis, Teil A 3 2 1 Fig. 10 : (x) -1 1 2 3 4 x → cos 3x + 1 2 -1 -2 -3 3 2 1 Fig. 11 : (x) -1 1 -1 -2 -3 2 3 4 1 x → 2 cos 3x + 2 45 Kapitel I. Funktionen 6 Die inverse Funktion Bekanntlich kann es vorkommen, dass eine Funktion f : x → f (x) für verschiedene Werte x1 , x2 ∈ D(f ) denselben Funktionswert y0 annimmt; z.B. gilt für f : x → x2 natürlich f (−2) = 4 = f (2). Graphisch äussert sich dies darin, dass die Parallele zur x-Achse auf dem Niveau y0 den Graphen von f in mehreren Punkten schneidet. Funktionen, bei denen dieses Phänomen nicht auftritt, heissen injektiv. Eine Funktion f : x → f (x), D(f ) heisst injektiv, wenn gilt: - Aus x1 6= x2 , x1 , x2 ∈ D(f ) folgt stets f (x1 ) 6= f (x2 ). Gleichbedeutend mit dieser Forderung ist offenbar jede der folgenden beiden Bedingungen - Falls f (x1 ) = f (x2 ), so folgt x1 = x2 . - Jede Parallele zur x-Achse schneidet den Graphen von f in höchstens einem Punkt. Ist f : x → f (x), D(f ) eine injektive Funktion, so gibt es zu jedem y ∈ W (f ) genau ein x ∈ D(f ) mit f (x) = y. Somit können wir eine Umkehrfunktion f −1 definieren: - f −1 : y → f −1 (y) = dasjenige eindeutig bestimmte x mit f (x) = y. Offenbar gilt D(f −1 ) = W (f ) und W (f −1 ) = D(f ). Die so definierte Funktion f −1 heisst die zu f inverse Funktion. Dem Leser muss sich an dieser Stelle gut klar machen, dass die inverse Funktion f −1 nur dann definiert werden kann, wenn f injektiv ist. Laut Definition gilt x ∈ D(f ) die Gleichung f −1 (f (x)) = x und für alle x ∈ D(f −1 ) f (f −1 (x)) = x. Die Funktion f −1 ist automatisch injektiv (warum?). Deshalb kann zu f −1 wiederum die inverse Funktion (f −1 )−1 gebildet werden. Offenbar gilt (f −1 )−1 = f . 46 U. Stammbach: Analysis, Teil A Die Beziehung zwischen f und f −1 lässt sich graphisch leicht veranschaulichen. Ist nämlich (a, b) ein Punkt des Graphen von f , so hat man f (a) = b. Laut Definition von f −1 gilt dann a = f −1 (b). Daraus folgt, dass (b, a) ein Punkt des Graphen von f −1 ist. Die Punkte (a, b) und (b, a) liegen im kartesische Koordinatensystem spiegelbildlich zur ersten Winkelhalbierenden y = x. Wir schliessen daraus, dass die Graphen von f und f −1 durch Spieglung an der ersten Winkelhalbierenden auseinander hervorgehen. Beispiel Es sei die lineare Funktion f : x → ax + b, a, b ∈ R, a 6= 0, D(f ) = R gegeben. Wir behaupten zuerst, dass f injektiv ist. Aus f (x1 ) = ax1 + b = ax2 + b = f (x2 ) folgt ax1 = ax2 und daraus wegen a 6= 0 sofort x1 = x2 . Damit ist f in der Tat injektiv und die inverse Funktion f −1 existiert. Aus y = ax + b folgt x = (y − b)/a. Somit gilt f −1 : y → y−b a oder besser f −1 : x → x−b , D(f −1 ) = R, a da ja als Name des Argumentes üblicherweise x verwendet wird (siehe Figur 1). Beispiel Die Exponentialfunktion f : x → ax , a > 1 ist auf ihrem ganzen Definitionsbereich strikt monoton wachsend. Wegen ah > 1 für h > 0 ergibt sich nämlich ax+h = ax · ah > ax . Die Exponentialfunktion ist also injektiv und die dazu inverse Funktion f −1 existiert. Diese ist durch die Vorschrift f −1 : y → Zahl, mit der a potenziert werden muss, um y zu erhalten definiert. Wir nennen die so definierte Zahl den Logarithmus von y zur Basis a, und wir schreiben x = f −1 (y) = a log y. Laut Definition gilt D(a log x) = W (ax ) = (0, ∞), W (a log x) = D(ax ) = (−∞, ∞). Der Graph der Logarithmusfunktion a log : x → a log x, D(a log x) = (0, ∞) 47 Kapitel I. Funktionen 4 (y) 3 y=x y = 2x + 3 2 Fig. 1 : 1 -4 -3 -2 -1 1 2 3 4 x → 2x + 3 (x) x→ -1 y= -2 x 3 − 2 2 x 3 − 2 2 -3 -4 6 (y) 5 y = 2x y=x 4 Fig. 2 : 3 x → 2x 2 y =2 log x x →2 log x 1 -2 -1 1 2 3 4 5 6 (x) -1 -2 48 U. Stammbach: Analysis, Teil A ergibt sich durch Spiegelung des Graphen der Exponentialfunktion x → ax an der ersten Winkelhalbierenden (siehe Figur 2). Beispiel Wie wir bereits festgestellt haben, ist die Quadratfunktion f : x → x2 , D(f ) = R nicht injektiv. Es gibt also zu f keine inverse Funktion. Hingegen kann man durch Einschränken des Definitionsbereiches zu einer verwandten Funktion f1 übergehen, die injektiv ist und zu der folglich eine inverse Funktion existiert. Für diese Einschränkung gibt es mehrere Möglichkeiten, von denen wir zwei genauer ansehen. Wir betrachten zuerst die Funktion f1 : x → x2 , D(f1 ) = [0, ∞). Wegen f10 (x) > 0 für 0 < x ist f1 strikt monoton wachsend und deshalb injektiv. Die dazu inverse Funktion f1−1 ist definiert durch f1−1 : x → √ x, D(f1−1 ) = [0, ∞) . Die Graphen von f und f1−1 gehen durch Spiegelung an der Geraden y = x auseinander hervor (siehe Figur 3). Als zweites betrachten wir die Funktion f2 : x → x2 , D(f2 ) = (−∞, 0]. Diese ist wegen f20 (x) < 0 für x < 0 strikt monoton fallend und deshalb injektiv. Die dazu inverse Funktion ist gegeben durch √ f2−1 : x → − x, D(f2−1 ) = [0, ∞). Wiederum liegen die Graphen der beiden Funktionen f2 und f2−1 spiegelbildlich zur Geraden y = x (siehe Figur 4). Beispiel Die Funktion f :x→ p x2 − 1, D(f ) = (−∞, −1] ∪ [1, ∞) ist offensichtlich eine gerade Funktion. Sie ist also sicher nicht injektiv. Die Einschränkung des Definitionsbereiches auf [1, ∞) liefert aber die injektive Funktion f1 : x → Aus f1 (x1 ) = q x21 − 1 = q p x2 − 1, D(f ) = [1, ∞). x22 − 1 = f1 (x2 ) folgt nämlich der Reihe nach 49 Kapitel I. Funktionen 3 (y) y = x2 2.5 y=x 2 Fig. 3 : f1 : x → x2 , D(f1 ) = [0, ∞) √ f1−1 : x → x 1.5 y= √ x 1 0.5 (x) 0.5 1 1.5 2 2.5 3 3 (y) y = x2 2 y=x 1 Fig. 4 : (x) -3 -2 -1 1 2 -1 -2 -3 √ y=− x 3 f2 : x → x2 , D(f2 ) = (−∞, 0] √ f2−1 : x → − x 50 U. Stammbach: 3 Analysis, Teil A (y) 2.5 y= √ x2 + 1 2 Fig. 5 : 1.5 f1 : x → √ y = x2 − 1 x2 − 1, D(f ) = [1, ∞) f1−1 : x → 1 0.5 p p x2 + 1 y=x (x) 0.5 1 1.5 2 2.5 3 x21 − 1 = x22 − 1 , x21 = x22 , x1 = x2 . Letzteres folgt, weil x1 und x2 im Intervall [1, ∞) liegen! Damit ist f1 injektiv und die dazu inverse Funktion existiert. Man berechnet y = p x2 − 1 , y 2 = x2 − 1 , y 2 + 1 = x2 , q y2 + 1 = x . Letzteres folgt, weil x im Intervall [1, ∞) liegt. Die inverse Funktion (siehe Figur 5) f1−1 ist somit gegeben durch die Vorschrift f1−1 : x → p x2 + 1, D(f1−1 ) = W (f1 ) = [0, ∞). 51 Kapitel I. Funktionen Ähnlich wie in den letzten beiden Beispielen geht man bei den trigonometrischen Funktionen vor. Man schränkt den Definitionsbereich geeignet ein, um eine injektive Funktion zu erhalten und geht dann zur inversen Funktion über. Auf diese Art und Weise gelangt man zu den sogenannten zyklometrischen Funktionen. Arcus sinus Wir betrachten zuerst die Funktion f : x → sin x, D(f ) = [−π/2, +π/2] . Man beachte den eingeschränkten Definitionsbereich! Mit Hilfe der Ableitung sieht man sofort, dass die Funktion f strikt monoton wachsend ist, also ist sie injektiv. Die zu f inverse Funktion f −1 heisst definitionsgemäss arcsin (“arcus sinus”). Sie ist durch die Vorschrift arcsin : x → f −1 (x) = y = derjenige Winkel, zwischen −π/2 und +π/2, dessen Sinus x ist gegeben. Es gilt D(f −1 ) = W (f ) = [−1, +1] und W (f −1 ) = D(f ) = [−π/2, +π/2]. Den Graphen von arcsin erhält man durch Spiegelung an der Geraden y = x (siehe Figuren 6,7). Arcus cosinus Die zu f : x → cos x, D(f ) = [0, π] inverse Funktion heisst arccos (“arcus cosinus”). Dabei gilt für Definitions- und Wertebereich D(arccos) = [−1, +1] und W (arccos) = [0, π] (siehe Figuren 8,9). Der Funktionswert arccos x ist derjenige Winkel zwischen 0 und π, dessen Cosinus x ist. Man hat also beispielsweise arccos 1 = 0, arccos 0 = π/2, arccos(−1) = π, p √ arccos( 2/2) = π/4, sin(arccos x) = 1 − x2 , wie der Leser leicht einsieht. Arcus tangens Die zu f : x → tan x, D(f ) = (−π/2, +π/2) inverse Funktion heisst arctan (“arcus tangens”). Dabei gilt D(arctan) = (−∞, +∞) und W (arctan) = (−π/2, +π/2) (siehe Figuren 10,11). Als Beispiel einer Eigenschaft dieser Funktion √ erwähnen wir Beziehung cos(arctan x) = 1/ 1 + x2 , die man leicht aus der Definition herleitet. Arcus cotangens Die zu f : x → cot x, D(f ) = (0, π) 52 U. Stammbach: 1.5 (y) 1 y = sin x 0.5 -1.5 -1 Analysis, Teil A Fig. 6 : -0.5 0.5 1 1.5 (x) x → sin x, D(f ) = [−π/2, +π/2] -0.5 -1 -1.5 1.5 (y) 1 y = arcsin x 0.5 -1.5 -1 -0.5 0.5 1 Fig. 7 : 1.5 (x) -0.5 -1 -1.5 x → arcsin x 53 Kapitel I. Funktionen 3 (y) 2 Fig. 8 : x → cos x, D(f ) = [0, π] 1 y = cos x (x) -1 1 2 3 -1 3 (y) 2 Fig. 9 : 1 x → arccos x y = arccos x (x) -1 1 -1 2 3 54 U. Stammbach: 3 Analysis, Teil A (y) 2 y = tan x 1 -3 -2 Fig. 10 : -1 1 2 3 (x) x → tan x, D(f ) = (−π/2, +π/2) -1 -2 -3 3 (y) 2 y = arctan x 1 -3 -2 -1 Fig. 11 : 1 2 3 (x) -1 -2 -3 x → arctan x 55 Kapitel I. Funktionen (y) 3 2 y = cot x 1 -3 -2 Fig. 12 : -1 1 2 3 (x) x → cot x, D(f ) = (0, π) -1 -2 -3 3 (y) 2 y = arccot x 1 -3 -2 -1 Fig. 13 : 1 2 3 (x) -1 -2 -3 x → arccot x 56 U. Stammbach: Analysis, Teil A inverse Funktion heisst arccot (“arcus cotangens”). Dabei gilt D(arccot) = (−∞, +∞) und W (arccot) = (0, π) (siehe Figuren 12,13). Dass die Einschränkungen bei den trigonometrischen Funktionen gerade auf die hier angegebene Art erfolgen, ist natürlich willkürlich; sie haben sich aber in der Literatur weitgehend durchgesetzt. Andere sind selbstverständlich ebenfalls denkbar. Wir beschliessen den Abschnitt, mit dem folgenden Anwendungsbeispiel, welches zeigt, dass die arcus-Funktionen auf natürliche Weise auftreten. Beispiel Man berechne die Länge l des Kreisbogens aus den Grössen x und a (siehe Figur 14). x Fig. 14 : Kreisbogen a r α Ist r der Radius des Kreisbogens, so liefert die Figur 14 sofort die folgende Beziehung (r − x)2 + a2 = r 2 . Daraus ergibt sich r= Ferner gilt a2 + x2 . 2x 57 Kapitel I. Funktionen sin α = a , r woraus man α = arcsin 2ax 2 a + x2 und schliesslich l =2· erhält. a2 + x2 2x ! · arcsin 2ax 2 a + x2 58 7 U. Stammbach: Analysis, Teil A Asymptoten In diesem letzten kurzen Abschnitt betrachten wir das Verhalten von Funktionen für grosse Werte von x. Gegeben sei eine Funktion f : x → f (x), welche mindestens auf dem Intervall (c, ∞) definiert ist. Wir nennen eine Funktion g : x → g(x) eine Asymptote von f für x → ∞, wenn gilt lim (f (x) − g(x)) = 0 . x→∞ In diesem Fall schmiegen sich die Graphen der beiden Funktionen f und g für x → ∞ einander an. Am einfachsten ist die Situation, wenn g eine lineare Funktion ist, dann schmiegt sich der Graph von f einer Geraden an. Ist man für grosse x nur an einer Approximation von f interessiert, so kann für solche Werte von x die (kompliziertere) Funktion f durch die (einfachere) Funktion g ersetzt werden. Es ist klar, dass eine analoge Definition für x → −∞ gemacht werden kann. Wir betrachten anschliessend einige Beispiele. (y) 8 6 y= 2x + 1 x−1 Fig. 1 : 4 x→ 2 -4 -2 2 4 6 8 (x) -2 Beispiel Es sei f : x → (2x + 1)/(x − 1). Wegen 2x + 1 x−1 59 Kapitel I. Funktionen 2x + 1 2x − 2 + 3 3 = =2+ x−1 x−1 x−1 ist offensichtlich g : x → 2 eine Asymptote von f für x → ∞ (und auch für x → −∞) (siehe Figur 1). 35 (y) 30 25 y= x2 + 2x − 8 x−3 Fig. 2 : 20 15 x→ x2 + 2x − 8 x−3 10 5 (x) -2 2 4 6 8 -5 Beispiel Es sei f :x→ x2 + 2x − 8 7 =x+5+ . x−3 x−3 Offenbar ist g : x → x + 5 eine Asymptote von f für x → ±∞ (siehe Figur 2). (Die Funktion f besitzt in x = 3 einen Pol. Man sagt in dieser Situation dann auch etwa, die vertikale Gerade x = 3 sei eine Asymptote von f für x → ±3. Streng genommen ist dies von unserer Definition einer Asymptote nicht abgedeckt.) Beispiel Es sei f : x → −1 + p x2 + 1 . Wir behaupten, dass g : x → x−1 eine Asymptote von f für x → ∞ ist, und dass h : x → −x−1 eine Asymptote von f für x → −∞ ist (siehe Figur 3). Da die Funktion f gerade ist, ist nur eine der Behauptungen zu beweisen. Es gilt in der Tat 60 U. Stammbach: Analysis, Teil A 6 (y) 4 Fig. 3 : 2 x → −1 + -4 -2 2 4 p x2 + 1 (x) -2 -4 15 (y) 10 Fig. 4 : 5 y = x2 + x − 2 -4 -2 2 4 (x) y= x3 − 3x + 5 x−1 -5 -10 x→ x3 − 3x + 5 x−1 61 Kapitel I. Funktionen lim x→∞ Beispiel (−1 + p x2 + 1) − (x − 1) = lim x→∞ Es sei f :x→ p x2 + 1 − x = lim x→∞ (x2 + 1) − x2 √ x2 + 1 + x ! =0. x3 − 3x + 5 3 = x2 + x − 2 + . x−1 x−1 Es ist folglich die quadratische Funktion g : x → x2 + x − 2 sowohl für x → ∞ wie für x → −∞ eine Asymptote von f (siehe Figur 4). Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel II. Differentialrechnung Nature and nature’s law lay hid in night; God said, “Let Newton be”, and all was light. Alexander Pope 1688-1744 Inhaltsverzeichnis 1 Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3 Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . 23 4 Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . . 35 6 Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 49 7 Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 57 8 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3 Kapitel II. Differentialrechnung 1 Begriff des Differentialquotienten Wir betrachten hier das folgende naheliegende geometrische Problem. Gegeben sei eine Funktion f : x → f (x) und ein Punkt P = (x0 , f (x0 )) ihres Graphen Γ(f ) in der (x, y)-Ebene. Gesucht ist die Tangente im Punkt P an dem Graphen Γ(f ). Als Gerade durch den Punkt P wird die Tangente durch eine Gleichung der Form y − f (x0 ) = m(x − x0 ) beschrieben. Dabei bezeichnet m die Steigung der Tangente, also die Steigung des Graphen im Punkt P . Diese gilt es zu berechnen. Zu diesem Zweck betrachten wir die Gerade durch P und Q, wobei Q der Punkt des Graphen von f ist, welcher zum x-Wert x0 + ∆x gehört. Es gilt folglich Q = (x0 + ∆x, f (x0 + ∆x)). Die Steigung dieser Sekante ist gegeben durch den Quotienten (Differenzenquotienten, siehe Figur 1) mP Q = f (x0 + ∆x) − f (x0 ) . ∆x Lassen wir nun ∆x gegen Null streben, d.h. betrachten wir den Grenzwert lim ∆x→0 f (x0 + ∆x) − f (x0 ) ∆x so wird dieser – falls er existiert – die Steigung der Tangente beschreiben. Definition ( I. Newton 1642-1727, G. W. Leibniz 1646-1716) Der Grenzwert df f (x0 + ∆x) − f (x0 ) (x0 ) = lim ∆x→0 dx ∆x heisst Differentialquotient von f an der Stelle x0 . Existiert der Differentialquotient von f an der Stelle x0 , so heisst f differenzierbar in x0 . Existiert der Differentialquotient von f für jedes x im Definitionsbereich D(f ) von f , so heisst f differenzierbar schlechthin. In diesem Fall definiert die Zuordnung 4 U. Stammbach: Analysis, Teil A (y) Fig. 1 : Differenzenquotient, Differentialquotient Q ∆y P ∆x (x) x → f 0 (x) = df (x) dx eine Funktion f 0 mit D(f 0 ) = D(f ), welche Ableitung oder Derivierte von f heisst. Ist f differenzierbar in x0 , so ist f auch stetig in x0 . Existiert nämlich f (x0 + ∆x) − f (x0 ) , ∆x→0 ∆x lim so muss notwendigerweise mit ∆x auch f (x0 + ∆x) − f (x0 ) gegen Null streben. Es gilt folglich f (x0 ) = lim f (x0 + ∆x) = lim f (x) . ∆x→0 Damit ist die Funktion stetig in x0 . x→x0 5 Kapitel II. Differentialrechnung (y) Fig. 2 : Zur Existenz des Differentialquotienten |x| (x) In der Definition der Differenzierbarkeit fordert man die Existenz des Grenzwertes lim ∆x→0 f (x0 + ∆x) − f (x0 ) , ∆x d.h. der linke und der rechte Grenzwert (∆x → 0− bzw. ∆x → 0+ ) müssen existieren und miteinander übereinstimmen. Natürlich gibt es Beispiele, wo diese Grenzwerte zwar existieren, aber nicht übereinstimmen. In diesem Fall spricht man vom linksseitigen, bzw. rechtsseitigen Differentialquotienten von f in x0 . Als konkretes Beispiel betrachten wir die Funktion f : x → |x| an der Stelle x0 = 0 (siehe Figur 2). Offensichtlich gilt hier lim f (x) − f (0) ∆x = lim f (x) − f (0) ∆x = ∆x→0− ∆x→0+ lim |∆x| = −1 , ∆x lim |∆x| = +1 . ∆x ∆x→0− ∆x→0+ Im ersten Fall ist nämlich ∆x negativ, während es im zweiten Fall positiv ist. Für einfache Funktionen lassen sich die Ableitungen direkt berechnen. Klar ist zum Beispiel, dass für die Ableitung der konstanten Funktion f : x → C gilt: f 0 (x) = 0. Für g : x → x 6 U. Stammbach: Analysis, Teil A erhält man auf ähnliche Weise wie oben g0 (x) = 1. Etwas komplizierter ist die Berechnung in den folgenden Beispielen. Beispiel Es sei f : x → x2 . Dann gilt f 0 (x) = f (x + ∆x) − f (x) ∆x→0 ∆x lim = (x + ∆x)2 − (x)2 ∆x→0 ∆x = x2 + 2x ∆x + (∆x)2 − x2 ∆x→0 ∆x = lim lim lim (2x + ∆x) ∆x→0 = 2x . Beispiel Es sei f : x → sin x. Dann gilt d sin (x) = dx = sin(x + ∆x) − sin x ∆x→0 ∆x lim sin x cos ∆x + sin ∆x cos x − sin x ∆x→0 ∆x lim = = 1 − cos ∆x ∆x 1 + cos ∆x sin x 1 + cos ∆x lim sin ∆x cos x − ∆x lim ∆x sin ∆x sin2 (∆x) cos x − sin x ∆x (∆x)2 1 + cos ∆x ∆x→0 ∆x→0 sin ∆x = cos x lim − ∆x→0 ∆x sin ∆x lim ∆x→0 ∆x = cos x . Analog erhält man d cos (x) = − sin x . dx 2 ! ∆x lim sin x ∆x→0 1 + cos ∆x 7 Kapitel II. Differentialrechnung Diese Beispiele zeigen, dass die Berechnung der Ableitung schon für recht einfache Funktionen aufwendig ist, wenn man von der Definition des Differentialquotienten ausgeht. Dieser Aufwand kann wesentlich reduziert werden, wenn “das Ableiten” zu einem Kalkül ausgebaut wird: Der Übergang von der Funktion f zur Ableitungsfunktion f 0 genügt einigen einfachen Rechenregeln, die erlauben, die Ableitung einer Funktion auf weitgehend mechanische Weise zu berechnen. Es sind dies einmal die folgenden vier Regeln und die etwas weiter unten zu behandelnde Kettenregel. Es seien f : x → f (x) und g : x → g(x) zwei in x differenzierbare Funktionen. Dann gilt (f + g)0 (x) = f 0 (x) + g0 (x) , (Cf )0 (x) = C · f 0 (x) , C∈R , (f g)0 (x) = f 0 (x)g(x) + f (x)g0 (x) 0 f g (x) = f 0 (x)g(x) − f (x)g0 (x) g2 (x) (Produktregel) , (Quotientenregel). Bei der Quotientenregel muss natürlich g(x) 6= 0 vorausgesetzt werden. Diese Rechenregeln sind aus der Mittelschule bekannt und werden aus diesem Grund hier nicht bewiesen. Statt dessen wenden wir sie in einzelnen Beispielen an. Beispiel Es sei h : x → x3 = x2 · x. Für f : x → x2 und g : x → x ergibt die Produktregel d 3 x = h0 (x) = f 0 (x) · g(x) + f (x) · g0 (x) dx = 2x · x + x2 · 1 = 3x2 . Ist m eine positive ganze Zahl, so ergibt sich auf analoge Weise durch vollständige Induktion d m x = m · xm−1 . dx 8 U. Stammbach: Analysis, Teil A Beispiel Es sei h : x → 1/xm = x−m , m positiv ganz. Für f : x → 1 und g : x → xm ergibt die Quotientenregel d −m −1 · mxm−1 1 = h0 (x) = = −m m+1 = −mx−m−1 . x dx x2m x Beispiel Es sei h : x → tan x. Für f : x → sin x und g : x → cos x ergibt die Quotientenregel d tan d sin x cos x · cos x + sin x · sin x 1 (x) = = = . 2 dx dx cos x cos x cos2 x Analog erhält man d cot 1 (x) = − 2 . dx sin x Eine weitere wichtige Ableitungsregel ist die sogenannte Kettenregel. Sie lautet wie folgt: Kettenregel Es seien f : x → f (x) und g : x → g(x) zwei differenzierbare Funktionen und h : x → f ◦ g (x) = f (g(x)) sei die zusammengesetzte Funktion. Dann gilt d(f ◦ g) (x) = h0 (x) = f 0 (g(x)) · g0 (x) . dx Der erste Faktor heisst “äussere”, der zweite Faktor “innere” Ableitung. Beweis Laut Definition der Ableitung haben wir d(f ◦ g) (x) = F 0 (x) = dx = f ◦ g (x + ∆x) − f ◦ g (x) ∆x→0 ∆x lim f (g(x + ∆x)) − f (g(x)) ∆x→0 ∆x lim 9 Kapitel II. Differentialrechnung Wir setzen g(x + ∆x) − g(x) = d und beachten, dass mit ∆x auch d gegen Null strebt, denn da g in x differenzierbar ist, ist es auch stetig in x. Damit erhalten wir 0 F (x) = = lim ∆x→0 f (g(x) + d) − f (g(x)) g(x + ∆x) − g(x) · d ∆x f (g(x) + d) − f (g(x)) g(x + ∆x) − g(x) · lim ∆x→0 d→0 d ∆x lim = f 0 (g(x)) · g0 (x) . Dies war zu beweisen. Beispiel Es sei F : x → tan (x2 ). Für f : x → tan x, g : x → x2 liefert die Kettenregel für die zusammengesetzte Funktion F : x → f ◦ g (x) = f (g(x)). d 1 tan (x2 ) = F 0 (x) = · 2x . dx cos2 (x2 ) Beispiel Es sei F : x → (g(x))m . Für f : x → xm ist F = f ◦ g. Die Kettenregel liefert d (g(x))m = F 0 (x) = m · (g(x))m−1 · g0 (x) . dx Beispiel Es sei G : x → g(xm ). Für f : x → xm ist G = g ◦ f (Man beachte die Reihenfolge!). Die Kettenregel liefert d g(xm ) = G0 (x) = g0 (xm ) · mxm−1 . dx 7 Beispiel Es sei H : x → 1 + (1 + x2 )4 . Die Kettenregel liefert, zweimal hintereinander angewandt, 6 dH (x) = H 0 (x) = 7 1 + (1 + x2 )4 · 4(1 + x2 )3 · 2x . dx 10 U. Stammbach: Analysis, Teil A Eine weitere Anwendung der Kettenregel betrifft die Ableitung der inversen Funktion. Es sei f : x → f (x) eine injektive Funktion. Ihre Ableitung f 0 : x → f 0 (x) sei bekannt. Gesucht ist (f −1 )0 (x), die Ableitung der zu f inversen Funktion. Laut Definition der inversen Funktion gilt f ◦ f −1 (x) ≡ x . Setzen wir f −1 = g und wenden wir die Kettenregel an, so folgt f 0 f −1 (x) · (f −1 )0 (x) ≡ 1 . Auflösen nach (f −1 )0 (x) liefert (f −1 )0 (x) = 1 f 0 (f −1 (x)) . Als Zusatz bemerken wir noch folgendes. Ist y der Funktionswert der Funktion f an der Stelle x, so sagt man in einer etwas altertümlichen Sprechweise manchmal, dass ”y eine Funktion von x” sei. Ist f injektiv, so stellt die inverse Funktion f −1 “x als Funktion von y” dar. Die obige Beziehung zwischen den Ableitungen drückt sich dann in der einprägsamen Formel dx 1 (y) = dy (x) dy dx aus. Dabei ist das Argument y auf der linken Seite der Gleichung gleich dem Funktionswert von f an der Stelle x. (Man beachte, dass man heutzutage die Variable der inversen Funktion f −1 wenigstens in formalen Darstellungen durchwegs gleich benennt wie die Variable der Funktion f .) Beispiel Es sei g : x → x1/m , m positiv ganz, D(g) = [0, ∞). Definitionsgemäss ist g die Umkehrfunktion der Funktion f : x → xm . Die obige Formel liefert d 1 1 1 1 −1 = x m = g0 (x) = xm . 1 dx m m · (x m )m−1 11 Kapitel II. Differentialrechnung Beispiel Es sei g : x → arcsin x. Laut Definition ist g die Umkehrfunktion von f : x → sin x, D(f ) = [−π/2, +π/2]. Die obige Formel liefert d arcsin 1 1 . (x) = g0 (x) = = √ dx cos(arcsin x) 1 − x2 Beispiel Es sei h : x → arctan x. Laut Definition ist h die Umkehrfunktion von f : x → tan x, D(f ) = (−π/2, +π/2). Die obige Formel liefert d arctan (x) = h0 (x) = dx 1 1 . = cos2 (arctan x) = 1 1 + x2 cos2 (arctan x) Wir beschliessen den Abschnitt mit zwei konkreten geometrischen Problemen. Beispiel Wir stellen uns die folgende Aufgabe. Es sei die Parabel y = x2 gegeben. Es sei P0 ein von Ursprung verschiedener, aber sonst beliebiger Punkt dieser Parabel und t0 sei die zugehörige Tangente. Man finde den Punkt P1 auf der Parabel, dessen zugehörige Tangente t1 senkrecht zu t0 verläuft und bestimme den Schnittpunkt S von t0 und t1 (siehe Figur 3). Wir fassen die Parabel y = x2 als Graph der Funktion f : x → x2 auf. Der beliebige Punkt P0 gehöre zum x-Wert x0 , x0 6= 0. Dann gilt P0 = (x0 , x20 ). Da die Ableitung durch f 0 (x) = 2x gegeben ist, hat t0 die Steigung 2x0 . Die Geradengleichung von t0 lautet somit (1.1) y − x20 = 2x0 (x − x0 ) . Die Gerade t1 steht senkrecht zu t0 , sie hat also die Steigung −1/(2x0 ). Für den gesuchten Punkt P1 = (x1 , x21 ) der Parabel muss deshalb die Gleichung 2x1 = − 1 2x0 erfüllt sein. Daraus ergibt sich x1 = − 1 , 4x0 12 U. Stammbach: Analysis, Teil A (y) P0 Fig. 3 : Senkrecht stehende Tangenten an die Parabel y = x2 y = x2 t1 t0 P1 (x) S y=− 1 4 und die Geradengleichung von t1 lautet somit (1.2) 1 1 1 y− = − x+ 2 16x0 2x0 4x0 . Wir erhalten den Schnittpunkt S der beiden Geraden t0 , t1 , indem wir das aus den Gleichungen (1.1) und (1.2) gebildete System nach x und y auflösen. Für die Koordinaten von S ergibt sich x = 1 1 x0 − 2 8x0 y = − 1 . 4 Der Schnittpunkt von t0 und t1 liegt also unabhängig vom Ausgangspunkt P0 auf der Parallelen y = −1/4 zur x-Achse. Ein überraschendes Resultat! Beispiel Es sei wiederum P0 ein vom Ursprung des Koordinatensystems verschiedener, beliebiger Punkt der Parabel y = x2 . Die zugehörige Tangente sei t0 , die zugehörige Normale 13 Kapitel II. Differentialrechnung n0 . Der Punkt P2 sei der Schnittpunkt von n0 mit der Parabel und t2 die zugehörige Tangente. Man bestimme den Schnittpunkt von t0 und t2 (siehe Figur 4). Wie oben ist die Tangente t0 im Punkt P0 , P0 = (x0 , x20 ) durch die Gleichung y − x20 = 2x0 (x − x0 ) (1.3) gegeben, die Normale n0 durch P0 demzufolge durch y − x20 = − 1 (x − x0 ) . 2x0 (y) y = x2 P2 n0 t0 Fig. 4 : Schnittpunkt der Tangenten t0 und t2 an die Parabel y = x2 P0 t2 (x) T 1 1 y=− − 2 16x2 Um P2 zu erhalten, löst man das Gleichungssystem y − x20 = − 1 (x − x0 ) 2x0 y = x2 14 U. Stammbach: Analysis, Teil A nach x und y auf. Die eine Lösung ist natürlich x = x0 , y = x20 ; die andere ergibt sich zu 1 1 x = −x0 − , y = x0 + 2x0 2x0 2 . Daraus erhält man P2 = (−x0 − 1/(2x0 ), (x0 + 1/(2x0 ))2 ) und die Tangente t2 ist durch die Gleichung (1.4) y − x0 + 1 2x0 2 = −2 x0 + 1 2x0 x + (x0 + 1 ) 2x0 gegeben. Löst man das durch die Gleichungen (1.3) und (1.4) gebildete System nach x und y auf, so erhält man die Koordinaten des gesuchten Schnittpunktes T , nämlich x = − 1 4x0 1 y = − − x20 2 Eliminieren wir schliesslich x0 , so ergibt sich die Gleichung der durch den Schnittpunkt gebildeten Kurve K. Sie lautet 1 1 y = − − . 2 16x2 15 Kapitel II. Differentialrechnung 2 Linearisieren, Fehlerrechnung Es sei f : x → f (x) eine differenzierbare Funktion, x0 ∈ D(f ). Unter der linearen Ersatzfunktion von f in x0 versteht man die lineare Funktion x → f 0 (x0 )(x − x0 ) + f (x0 ) . Der Graph der linearen Ersatzfunktion von f in x0 ist somit gerade die Tangente an den Graphen von f im Punkt (x0 , f (x0 )). Der Vorgang, welcher die Funktion f durch die lineare Ersatzfunktion von f in x0 ersetzt, heisst Linearisieren in x0 . Beispiel Die lineare Ersatzfunktion von f : x → sin x in x0 = 0 ist x → f 0 (x0 )(x − x0 ) + f (x0 ) = x , denn es gilt sin0 (0) = cos(0) = 1, sin(0) = 0. Die lineare Ersatzfunktion von f : x → sin x in x0 = π/3 ist (siehe Figur 1) 1 π x→ x− 2 3 √ 3 1 + = x+ 2 2 √ 3 π − 2 6 ! , denn es gilt 0 sin π 3 π = cos 3 √ π 1 = , sin 2 3 = 3 . 2 Die Figur lässt vermuten, dass die lineare Ersatzfunktion von f : x → f (x) in x0 , in der Umgebung des Wertes x0 eine gute Approximation für die Funktion f ist. Dies ist in der Tat der Fall und lässt sich mathematisch wie folgt ausdrücken. Wir setzen ϕ(x) = f (x) − (f 0 (x0 )(x − x0 ) + f (x0 )) , 16 U. Stammbach: Analysis, Teil A 3 (y) 2 1 y = x+ 2 √ 3 π − 2 6 ! y = sin x 1 -1 Fig. 1 : Die lineare Ersatfunktion von f : x → sin x in x0 = π/3 1 2 3 (x) -1 so dass ϕ die Differenz zwischen der Funktion f und deren linearen Ersatzfunktion in x0 beschreibt. Je kleiner |ϕ(x)| ist, umso besser wird f (x) durch den Wert der linearen Ersatzfunktion approximiert. Natürlich gilt ϕ(x0 ) = 0. Setzen wir wie üblich ∆x = x − x0 , so erhalten wir ϕ(x) f (x) − f (x0 ) ϕ(x) = = − f 0 (x0 ) . ∆x x − x0 ∆x Betrachten wir jetzt den Grenzübergang x → x0 (oder ∆x → 0), so folgt ϕ(x) = 0. ∆x→0 ∆x lim Dies bedeutet anschaulich, dass für x → x0 nicht nur ϕ(x) gegen Null geht (was nach obigem klar ist), sondern dass ϕ(x) stärker gegen Null geht als ∆x. Es geht nämlich sogar der Quotient ϕ(x)/∆x gegen Null. In der Tat ist also die lineare Ersatzfunktion von f in x0 in der Umgebung von x0 eine gute Approximation für f ; eine umso bessere, je näher x bei x0 liegt. Die Tatsache, dass der Quotient ϕ(x)/∆x für ∆x → 0 gegen Null strebt, werden wir später dadurch ausdrücken, dass wir sagen “ϕ(x) ist für x → x0 von kleinerer Grössenordnung als ∆x = x − x0 ”. Wir werden dies durch das Symbol 17 Kapitel II. Differentialrechnung ϕ(x) = o(x − x0 ) für x → x0 beschreiben. Beim Arbeiten mit der linearen Ersatzfunktion hat es sich eingebürgert, ein neues, aus dem alten durch Parallelverschiebung gewonnenes Koordinatensystem mit dem neuen Ursprung im Punkte (x0 , f (x0 )) einzuführen. Man benennt die Achsen des neuen Koordinatensystems mit dx und df . Die lineare Ersatzfunktion von f in x0 , die wir jetzt df nennen, stellt sich in diesem neuen Koordinatensystem auf sehr einfache Weise dar df : dx → f 0 (x0 ) · dx . Die Approximationseigenschaft lässt sich dann durch ∆f = f (x) − f (x0 ) ∼ df . ausdrücken. In diesem Zusammenhang heisst die lineare Ersatzfunktion auch Differential der Funktion f in x0 . Beispiel Die lineare Ersatzfunktion von f : x → (1 + x)α in x0 = 0 ist x → α(1 + x0 )α−1 (x − x0 ) + (1 + x0 )α = 1 + αx . Unser Resultat besagt, dass 1 + αx für x nahe bei x0 = 0 eine gute Approximation für (1 + x)α ist, und zwar ist der Fehler |ϕ(x)| im Vergleich mit |x| “verschwindend klein”, wenn nur |x| genügend klein ist. Insbesondere gelten für |x| << 1 die Beziehungen (siehe Figuren 2,3,4) √ 1 1+x ∼ 1+ x , 2 1 1 √ ∼ 1− x , 2 1+x 1 ∼ 1−x . 1+x 18 U. Stammbach: Analysis, Teil A 3 (y) y = 1 + 12 x 2 y= Fig. 2 : Die lineare Ersatzfunktion von √ f : x→ 1+x √ 1+x 1 im Punkte x0 = 0 (x) -1 1 2 3 -1 3 (y) 2 1 Fig. 3 : Die lineare Ersatzfunktion von 1 y= √ 1+x f :x→ √ im Punkte x0 = 0 y = 1 − 12 x -1 1 -1 1 1+x (x) 2 3 19 Kapitel II. Differentialrechnung 2 (y) 1.5 Fig. 4 : Die lineare Ersatzfunktion von 1 y= 1 1+x 0.5 f :x→ 1 1+x im Punkte x0 = 0 -1 -0.5 0.5 1 1.5 2 (x) -0.5 y =1−x -1 Von letzterer Approximation macht man im täglichen Leben oft Gebrauch: Eine Ware, die A Franken kostet, kostet nach einem Preisaufschlag von 2% B, B = A(1 + 2/100) Franken. Geht man vom neuen Preis aus, so gilt A = B/(1 + 2/100). Folglich ist es falsch zu sagen, dass die Ware vor dem Aufschlag um 2% billiger war, aber jedermann weiss, dass dies annähernd richtig ist. In der Tat gilt 2 A = B/ 1 + 100 2 ∼B 1− 100 . Jedermann ist sich auch bewusst, dass für grössere Prozentzahlen die analoge Approximation nicht mehr genügend gut ist. Die Technik des Linearisierens wird bei der mathematischen Behandlung von Problemen der Natur- und Ingenieurwissenschaften sehr häufig angewendet. Die in solchen Problemen auftretenden Grössen werden nämlich in der Regel durch komplizierte und vielfach gar nicht genau bekannte Funktionen beschrieben. Man denke etwa an die Reibungskräfte auf einer rauhen Oberfläche oder an die Spannungskräfte, die in einem Balken auftreten, wenn dieser bis zum Bruch belastet wird. In der mathematischen Behandlung ersetzt man deshalb die komplizierten Funktionen sehr oft durch einfachere Approximationen; als erste grobe Näherung bietet sich 20 U. Stammbach: Analysis, Teil A dabei die lineare Ersatzfunktion an. Man linearisiert das Problem und betrachtet die linearisierte Theorie. Dadurch wird das Problem mathematisch nicht nur einfacher zu fassen, sondern in vielen Fällen ist erst die linearisierte Theorie einer vollständigen mathematischen Behandlung überhaupt zugänglich. Diese liefert zwar nur eine erste Näherung, aber diese reicht für praktische Zwecke oft aus. Beispiel ist durch Die Rückstellkraft K eines mathematischen Pendels der Länge l und der Masse m K = mg sin ϕ gegeben, wobei g die Erdbeschleunigung bezeichnet. Wie wir später sehen werden, bereitet die mathematische Behandlung des mathematischen Pendels erhebliche Schwierigkeiten, wenn man für die Rückstellkraft diese Formel verwendet. Man betrachtet deshalb die linearisierte Theorie, die man dadurch erhält, dass man die Funktion ϕ → K = mg sin ϕ durch ihre lineare Ersatzfunktion in ϕ0 = 0 ersetzt, ϕ → mgϕ . Der Wert ϕ0 = 0 entspricht der Ruhelage des Pendels. Anschaulich gesagt, beschränkt man sich auf kleine Auslenkungen des Pendels, ϕ << 1, und benützt, dass für kleine Werte von ϕ die komplizierte Funktion ϕ → mg sin ϕ gut durch ihre lineare Ersatzfunktion in ϕ0 = 0, d.h. durch ϕ → mgϕ approximiert wird. Die linearisierte Theorie des mathematischen Pendels lässt sich auf eine einfache Weise mathematisch darstellen und durchrechnen (siehe später). Es zeigt sich darüber hinaus, dass die so erhaltene Näherung für die meisten praktischen Zwecke völlig genügt. Eine weitere wichtige Anwendung der Technik des Linearisierens ist die sogenannte Fehlerrechnung. Dabei geht es um das Problem, dass in der Praxis die Werte der Ausgangsgrössen einer Rechnung im allgemeinen nicht genau bekannt sind. Oft handelt es sich ja um Messwerte, die naturgemäss nur bis auf eine gewisse Genauigkeit bestimmt werden können, und deshalb mit (Mess-)Fehlern behaftet sind. Im Laufe einer Rechnung pflanzen sich diese Fehler fort und beeinflussen das Schlussresultat. Der Leser wird sich erinnern, dass wir eine ähnliche Fragestellung diskutiert haben, als wir den Begriff der Stetigkeit von Funktionen eingeführt haben. Während wir aber damals qualitative Aussagen in den Vordergrund stellten, sind wir jetzt an quantitativen Aussagen interessiert, nämlich an einer Abschätzung des Fehlers im Schlussresultat. Die 21 Kapitel II. Differentialrechnung Fehlerrechnung leistet gerade dies, und zwar indem die lineare Ersatzfunktion herangezogen wird. Beispiel In einem Dreieck seien die Seite a und der Winkel α genau bekannt. Der Winkel β wird gemessen, wobei der Messfehler kleiner als ∆β ist. Wie wirkt sich dieser Messfehler bei der Berechnung der Länge der Seite b aus? Nach dem Sinus-Satz gilt b= a sin β . sin α Betrachten wir b als Funktion von β, b = f (β), und vergleichen wir die Funktionswerte f (β+∆β) und f (β), so gilt nach obigem ∆f = f (β + ∆β) − f (β) ∼ df = f 0 (β)dβ , wobei wir rechts statt ∆β konsequenterweise dβ geschrieben haben. Für das Differential df erhalten wir df = a cos β dβ , sin α was eine Abschätzung des absoluten Fehlers |∆f | erlaubt. In den Anwendungen interessanter ist allerdings gewöhnlich der relative Fehler. Darunter versteht man den Quotienten df /f . In unserem Fall erhalten wir df = cot β dβ . f Für kleine β’s wird der relative Fehler also gross. Beispiel Man möchte die Oberfläche O und das Volumen V einer Kugel aus der einzigen wirklich messbaren Grösse, nämlich dem Durchmesser x der Kugel bestimmen. Wie wirken sich Messfehler aus? Es gelten bekanntlich die Formeln V = 4π 3 O = 4π Daraus folgt für die absoluten Fehler 3 x 2 2 x 2 , . 22 U. Stammbach: dV = 4π 3 3 2 2 x 2 dO = 4π dx = 2π 2 x 2 Analysis, Teil A dx , x dx = 2πx dx 2 und für die relativen Fehler dV dx =3 , V x dO dx =2 . O x Wir überlassen es dem Leser, für die Berechnung des relativen Fehlers, etwa bei Potenzfunktionen, Rechenregeln zu finden. 23 Kapitel II. Differentialrechnung 3 Mittelwertsatz der Differentialrechnung Wir führen zuerst den Begriff des lokalen Extremums ein. Eine Funktion f : x → f (x) mit Definitionsbereich D(f ) besitzt in ξ ∈ D(f ) eine lokale Maximalstelle, wenn es ein Intervall (c, d) gibt mit c < ξ < d, so dass für alle x aus D(f ) mit c < x < d gilt f (x) ≤ f (ξ). Der Wert f (ξ) heisst dann ein lokales Maximum von f . Analog ist eine lokale Minimalstelle und ein lokales Minimum definiert. Unter einer lokalen Extremalstelle versteht man eine lokale Maximalstelle oder eine lokale Minimalstelle, und man spricht in analoger Weise von einem lokalen Extremum. Es zeigt sich, dass lokale Extremalstellen von differenzierbaren Funktionen, falls sie im Innern des Definitionsbereiches liegen, mit Hilfe der Differentialrechnung entdeckt werden können. Satz Es sei f : x → f (x) eine auf dem Intervall (a, b) definierte differenzierbare Funktion, die in ξ, a < ξ < b ein lokales Extremum besitzt. Dann gilt f 0 (ξ) = 0. Beweis Wir zeigen, dass die Annahme f 0 (ξ) > 0 zu einem Widerspruch führt (in analoger Weise führt auch f 0 (ξ) < 0 zu einem Widerspruch). Definitionsgemäss gilt f 0 (ξ) = lim x→ξ f (x) − f (ξ) . x−ξ Es sei nun f 0 (ξ) > 0. Dann folgt nach der Definition des Limes, dass für alle genügend nahe bei ξ liegenden x gilt f (x) − f (ξ) >0. x−ξ Für diese Werte x hat also f (x) − f (ξ) dasselbe Vorzeichen wie x − ξ. Für x-Werte mit x − ξ > 0 gilt somit f (x) > f (ξ) und für x-Werte mit x−ξ < 0 gilt f (x) < f (ξ). Damit besitzt f in ξ weder ein lokales Maximum noch ein lokales Minimum. Dies steht im Widerspruch zur Voraussetzung. Aus dieser Aussage ergibt sich leicht der sogenannte Satz von Rolle (M. Rolle 1652 - 1719) (siehe Figur 1): Satz Es sei f : x → f (x) eine differenzierbare Funktion mit f (x1 ) = 0 = f (x2 ), x1 < x2 . Dann gibt es mindestens ein ξ, x1 < ξ < x2 mit f 0 (ξ) = 0. 24 U. Stammbach: Analysis, Teil A (y) Fig. 1 : Zum Satz von Rolle (x) x1 ξ x2 Beweis Ist f (x) ≡ 0 für x1 ≤ x ≤ x2 , so ist nichts zu beweisen, denn dann gilt f 0 (x) = 0 für alle x, x1 ≤ x ≤ x2 . Wir dürfen also annehmen, dass f im Intervall [x1 , x2 ] von Null verschiedene Werte annimmt. Aber dann nimmt f in einem inneren Punkt ξ, x1 < ξ < x2 ein Extremum an. Nach obigem folgt dann f 0 (ξ) = 0. (Die Aussage, dass f in einem Punkt des Intervalles [x1 , x2 ] ein Extremum annimmt, ist zwar sehr plausibel, sie müsste aber natürlich mathematisch bewiesen werden. Ein solcher Beweis würde etwas mehr mathematisches Grundlagenwissen benötigen, als wir in dieser Vorlesung zur Verfügung haben. Die Aussage folgt aus der Stetigkeit der Funktion f . Wir erwähnen schliesslich, dass man leicht Funktionen konstruieren kann, die zwar in allen Punkten des Intervalles [x1 , x2 ] definiert sind, die aber in diesem Intervall kein Extremum annehmen; diese Funktionen sind dann natürlich notwendigerweise nicht stetig.) Bemerkung Ist f auch nur in einem Punkt des Intervalles [x1 , x2 ] nicht differenzierbar, so braucht kein ξ der verlangten Art zu existieren. Der folgende Satz, der Mittelwertsatz der Differentialrechnung ist eine Verallgemeinerung des Satzes von Rolle (siehe Figur 2). Satz Es sei f : x → f (x) eine im Intervall [x1 , x2 ] definierte differenzierbare Funktion. Dann gibt es (mindestens) ein ξ, x1 < ξ < x2 mit f 0 (ξ) · (x2 − x1 ) = f (x2 ) − f (x1 ) 25 Kapitel II. Differentialrechnung (y) f (x2 ) Fig. 2 : Zum Mittelwertsatz der Differentialrechnung f (ξ) f (x1 ) (x) ξ x1 Beweis x2 Wir betrachten die Funktionen g : x → g(x) = f (x) − f (x2 ) − f (x1 ) (x − x1 ) + f (x1 ) x2 − x 1 . Offensichtlich gilt g(x1 ) = 0 = g(x2 ), und g ist differenzierbar. Nach dem Satz von Rolle gibt es dann ein ξ, x1 < ξ < x2 mit g0 (ξ) = 0; aber g0 (x) = f 0 (x) − f (x2 ) − f (x1 ) , x2 − x 1 so dass folgt f 0 (ξ) = Dies war zu beweisen. f (x2 ) − f (x1 ) . x2 − x 1 26 U. Stammbach: Analysis, Teil A Wir werden den Mittelwertsatz der Differentialrechnung an verschiedenen Stellen in der Vorlesung brauchen können. Gleich hier schliessen wir noch zwei instruktive Anwendungen an. Folgerung Es sei f : x → f (x) eine im Intervall [a, b] definierte differenzierbare Funktion mit f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für alle a ≤ x ≤ b. Dann ist f im Intervall (strikt) monoton wachsend. Beweis Es seien x1 , x2 zwei beliebige Stellen des Definitionsintervalles. Dann gibt es nach dem Mittelwertsatz der Differentialrechnung ein ξ zwischen x1 und x2 mit f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) . Aus f 0 (ξ) ≥ 0 (bzw. f 0 (x) > 0) folgt dann f (x2 ) ≥ f (x1 ) (bzw. f (x2 ) > f (x1 )). Regel von Bernoulli-Hôpital (Johann Bernoulli 1667-1748, G. F. A. de l’Hôpital 1661-1704) Es seien f : x → f (x) und g : x → g(x) zwei auf dem Intervall [a, b] definierte differenzierbare Funktionen mit f (a) = 0 = g(a). Ferner sei g0 (x) 6= 0 für a < x < b. Dann gilt lim x→a+ Beweis f (x) f 0 (x) = lim 0 . g(x) x→a+ g (x) Wir wählen X mit a < X < b und betrachten die Funktion h : x → h(x) = f (x)g(X) − f (X)g(x) . Natürlich gilt h(a) = 0 = h(X). Nach dem Satz von Rolle existiert dann ξ, a < ξ < X mit h0 (ξ) = 0. Es folgt 0 = h0 (ξ) = f 0 (ξ)g(X) − f (X)g0 (ξ) und damit f 0 (ξ) f (X) = , a<ξ<X . 0 g (ξ) g(X) Lässt man schliesslich in dieser Beziehung X gegen a streben, so erhält man die Behauptung. 27 Kapitel II. Differentialrechnung Beispiel x2 2x 2 = lim = lim =2. x→0 1 − cos x x→0 sin x x→0 cos x lim Beispiel ex − e ex = lim =e. x→1 log x x→1 1/x lim Beispiel lim x→0 1 1 − sin x x = lim x→0 x − sin x x sin x = lim x→0 1 − cos x sin x + x cos x = lim x→0 sin x 2 cos x − x sin x =0. 28 4 U. Stammbach: Analysis, Teil A Extremalaufgaben Extremalaufgaben sind von der Schule her wohlbekannt. Wir begnügen uns deshalb hier mit einigen Präzisierungen und Beispielen. Zuerst zur Definition eines Extremums. Es sei g : x → g(x) eine auf dem Intervall [a, b] definierte Funktion. Man sagt, x0 ∈ [a, b] sei eine globale Maximalstelle, wenn für alle x ∈ [a, b] gilt g(x0 ) ≥ g(x). Der Wert g(x0 ) heisst dann globales Maximum der Funktion g in [a, b]. Der Punkt x0 ∈ [a, b] heisst eine lokale Maximalstelle, wenn ein x0 enthaltendes Intervall (c, d) existiert, so dass für alle x aus [a, b], die auch in (c, d) liegen, gilt g(x0 ) ≥ g(x). Der Wert g(x0 ) heisst in diesem Fall ein lokales Maximum der Funktion g. Analog werden die Begriffe globale Minimalstellen, globales Minimum, lokale Minimalstelle, lokales Minimum definiert. Maximum und Minimum fasst man unter dem Begriff Extremum zusammen. Es ist ein wesentlicher Erfolg der Differentialrechnung, dass sie eine effiziente Behandlung von Extremalaufgaben erlaubt. Es gilt das folgende Resultat, das sich leicht aus dem ersten Satz des Abschnittes 3 ergibt: Es sei g : x → g(x), D(g) = [a, b] gegeben. Ist x0 eine lokale Extremalstelle der Funktion g, so ist - x0 ein Randpunkt des Definitionsintervalls, oder - die Ableitung von g in x0 ist nicht definiert, oder - die Ableitung von g ist definiert, und es gilt g0 (x0 ) = 0. Um die globale Extremalstelle einer Funktion zu finden, kann man demzufolge wie folgt vorgehen: Man macht sich eine Liste von Kandidaten für die lokalen Extremalstellen, d.h. eine Liste bestehend aus 29 Kapitel II. Differentialrechnung - den Randpunkten des Definitionsintervalls, - den Punkten x0 , in denen die Ableitung g0 nicht definiert ist, - den Punkten x0 , in denen g0 (x0 ) = 0 gilt. Man berechne dann die Funktionswerte von g in diesen (üblicherweise endlich vielen) Punkten und finde die Extremalstelle durch Vergleich der Funktionswerte. Zur Präzisierung mögen noch die folgenden Bemerkungen angeführt werden: Nicht jeder Punkt x0 mit g0 (x0 ) = 0 ist Extremalstelle (Beispiel: g : x → x3 , x0 = 0 ). Die zweite Ableitung kann oft herangezogen werden, um zu entscheiden, ob in x0 mit g0 (x0 ) = 0 ein Maximum (g00 (x0 ) < 0) oder ein Minimum (g00 (x0 ) > 0) vorliegt. In den meisten Fällen führt aber eine Diskussion des Funktionsverhaltens mit einfacheren Mitteln ebenfalls zum Ziel. Im übrigen gibt es Fälle, wo auch die zweite Ableitung über die Natur des Extremums keine Auskunft gibt. (Beispiel: g : x → x4 hat in x0 = 0 eine (sogar globale) Minimalstelle, aber es gilt g00 (x0 ) = 0.) Beispiel Ein kreisförmiger Querschnitt der Spule eines Transformators soll durch einen kreuzförmigen Querschnitt eines aus Blechen geschichteten Eisenkerns möglichst ausgefüllt werden (siehe Figur 1). Wir entnehmen der Figur 1, dass die Fläche des Eisenkerns durch A = 4yx + 2 · 2(x − y)y gegeben ist. Setzen wir x = r cos α, y = r sin α, so erhalten wir den Flächeninhalt A in Funktion von α, 0 ≤ α ≤ π/4 A(α) = 4r 2 cos α sin α + 4r 2 (cos α − sin α) sin α = 4r 2 (2 cos α sin α − sin2 α). Nullsetzen der Ableitung liefert A0 (α) = 4r 2 (−2 sin2 α + 2 cos2 α − 2 sin α cos α) = 0 2 cos(2α) − sin(2α) = 0 tan(2α) = 2 . Daraus ergibt sich α = 31.7◦ , wobei es sich natürlich um das globale Maximum handelt, da die Randpunkten des Definitionsbereiches offensichtlich kleinere Werte liefern. Eine weitere 30 U. Stammbach: Analysis, Teil A r α y α Fig. 1 : Querschnitt der Spule des Transformators x Rechnung zeigt xmax = 0.851 r, ymax = 0.526 r, also Amax = 2.47 r 2 . Der Füllfaktor beträgt dann q = 2.47r 2 = 78.7% πr 2 Beispiel Gegeben ist die Funktion √ 3 f : x → (x − 1) x2 , D(f ) = R. Gesucht sind die lokalen und globalen Extrema von f (soweit sie existieren). Wie stellen eine Liste der x-Werte zusammen, die als Kandidaten für eine lokale Extremalstelle auftreten. - Es gibt keine Randpunkte, da D(f ) = R. 31 Kapitel II. Differentialrechnung Die Ableitung von f ist gegeben durch f 0 (x) = 5x − 2 √ . 33x Sie ist mit Ausnahme des Nullpunktes überall definiert und Null für x = 2/5. Die weiteren Kandidaten sind also - x=0 (Ableitung nicht definiert), - x = 2/5 (Ableitung gleich Null). 2 (y) 1.5 √ 3 (x − 1) x2 1 Fig. 2 : Die Extrema der Funktion √ 3 f : x → (x − 1) x2 0.5 (x) -1 -0.5 0.5 1 1.5 2 -0.5 -1 An der Ableitung f 0 (x) lesen wir ferner die folgenden Eigenschaften von f ab. - Für x < 0 ist die Ableitung positiv, die Funktion f also strikt monoton wachsend. - Für 0 < x < 2/5 ist die Ableitung negativ, die Funktion f also strikt monoton fallend. - Für 2/5 < x < ∞ ist die Ableitung positiv, die Funktion f also strikt monoton wachsend. 32 U. Stammbach: Analysis, Teil A √ 3 Für sehr grosse |x| verhält sich die Funktion f wie x x2 = x5/3 . Damit ist x = 0 eine lokale Maximalstelle von f und f (0) = 0 ein lokales Maximum; ferner ist x = 2/5 eine lokale Minimalstelle und r 2 33 4 f =− 5 5 25 ein lokales Minimum. Beispiel Gegeben ist die Strecke AB, A = (−1, 1), B = (0, 2). Ferner bezeichnet P = (p, 0) einen Punkt auf der x-Achse. Gesucht ist derjenige Punkt Q auf der Strecke AB, welcher von P einen minimalen Abstand hat (siehe Figur 3). (y) B = (0, 2) Fig. 3 : Punkt P und Strecke AB A = (−1, 1) P = (p, 0) (x) Der Leser bemerkt natürlich sofort, dass die Lösung von der Lage des Punktes P abhängig ist. Wir beschreiben die Strecke AB durch y = x + 2, −1 ≤ x ≤ 0 und definieren die Funktion f als das Quadrat des Abstandes |QP |, f (x) = d2 = (p − x)2 + (x + 2)2 , D(f ) = [−1, 0] . 33 Kapitel II. Differentialrechnung 10 p2 + 2p + 2 8 Fig. 4 : Quadrat des minimalen Abstandes zwischen P und der Strecke AB in Funktion von p 6 p2 + 4 (p + 2)2 2 4 2 (p) 0.5 1 1.5 2 Als Kandidaten für die globale Minimalstelle von f treten einmal die beiden Randpunkte des Definitionsintervalles D(f ) = [−1, 0] auf. Wir erhalten f (−1) = p2 + 2p + 2, f (0) = p2 + 4. Da die Funktion f offensichtlich im ganzen Definitionsintervall differenzierbar ist, erhalten wir die weiteren Kandidaten durch Nullsetzen der Ableitung f 0 (x) = −2(p − x) + 2(x + 2) = −2p + 4x + 4 = 0 . Daraus ergibt sich x = p/2 − 1. Dieser Punkt liegt nur für 0 ≤ p ≤ 2 im Definitionsintervall der Funktion f ; nur in diesem Fall tritt dieser Kandidat überhaupt auf. Aus f 00 (x) = 4 > 0 folgt ferner, dass in diesem Punkt eine lokale Minimalstelle vorliegt. Die globale Minimalstelle von f ist folglich xmin = −1 für p≤0 p/2 − 1 für 0 ≤ p ≤ 2 0 für 2≤p , 34 U. Stammbach: Analysis, Teil A und das Quadrat des Minimalabstandes |QP | ist gegeben durch (siehe Figur 4) f (xmin ) = 2 p + 2p + 2 (p + 2)2 /2 p2 + 4 für p≤0 für 0 ≤ p ≤ 2 für 2≤p . 35 Kapitel II. Differentialrechnung 5 Zu Exponential- und Logarithmusfunktion Die Funktion f : x → ex hat, wie man aus der Mittelschule weiss, die Eigenschaft, dass ihre Ableitung wiederum f ist, f 0 (x) ≡ f (x). Wir wollen hier als erstes zeigen, dass diese Eigenschaft zusammen mit der Forderung f (0) = 1 die Funktion x → ex eindeutig bestimmt. Etwas allgemeiner zeigen wir Satz Es sei A eine reelle Zahl, und es seien f : x → f (x) und g : x → g(x) zwei differenzierbare Funktionen mit der Eigenschaft f 0 (x) = A f (x) (5.1) beziehungsweise g0 (x) = A g(x) (5.2) für alle x. Dann gilt f (x) = C g(x) , wobei C eine reelle Konstante bezeichnet. Beweis Wir betrachten die Funktion h:x→ f (x) . g(x) Dann gilt wegen (5.1) und (5.2) h0 (x) = f 0 (x) · g(x) − f (x) · g0 (x) Af (x)g(x) − f (x)Ag(x) = =0. 2 (g(x)) (g(x))2 Aus h0 (x) ≡ 0 folgt h(x) ≡ C und damit f (x) ≡ C g(x). Dies war zu beweisen. 36 U. Stammbach: Analysis, Teil A Eine Gleichung zwischen einer Funktion f und ihrer Ableitung f 0 (oder ihren Ableitungen f 0 , f 00 , · · ·) heisst bekanntlich eine Differentialgleichung. Eine Funktion f , für welche die Differentialgleichung identisch in x erfüllt ist, heisst Lösung der Differentialgleichung. Unsere Beziehung (5.1) ist ein Beispiel einer solchen Gleichung. Unser Satz besagt, dass die Lösung der Differentialgleichung (5.1) bis auf eine multiplikative Konstante festgelegt ist, insbesondere folgt, dass (5.1) zusammen mit der (Anfangs-)Bedingung f (0) = 1 die Lösung eindeutig festlegt. Wir werden im 2. Semester sehen, dass Ähnliches ganz allgemein für Differentialgleichungen und ihre (Anfangs-)Bedingungen gilt. Es handelt sich hier um ein ganz fundamentales Prinzip. Die Differentialgleichung f 0 (x) = Af (x) zusammen mit der Bedingung f (0) = 1, beschreibt also auf eindeutige Art und Weise eine Funktion f : x → f (x), nämlich x → eAx . Setzen wir A = 1, so folgt, dass die Differentialgleichung f 0 (x) = f (x) (5.3) zusammen mit f (0) = 1 die Exponentialfunktion x → ex charakterisiert (siehe Figur 1). 6 (y) 5 ex 4 Fig. 1 : Die Exponentialfunktion x → ex 3 2 1 (x) -2 -1.5 -1 -0.5 0.5 1 1.5 2 -1 Um das noch etwas zu illustrieren, zeigen wir, wie wichtige Eigenschaften der Exponentialfunktion f direkt aus der Differentialgleichung hergeleitet werden können. Wir wählen als erstes die 37 Kapitel II. Differentialrechnung fundamentale Eigenschaft der Exponentialfunktion f (a + b) = f (a) · f (b) also ea+b = ea · eb . Zu diesem Zweck betrachten wir die Funktion g, welche durch g : x → g(x) = f (a + x) definiert wird. Dann folgt g0 (x) = f 0 (a + x) = f (a + x) = g(x) , d.h. g : x → g(x) ist wie f ebenfalls Lösung der Differentialgleichung (5.3). Aus unserem Satz folgt dann, dass eine Konstante C existiert mit g(x) = C · f (x) . Insbesondere gilt f (a) = g(0) = C · f (0) = C, da ja laut Voraussetzung f (0) = 1 gilt. Also erhalten wir die für alle x gültige Gleichung g(x) = f (a) · f (x). Setzen wir darin x = b, so folgt (5.4) g(b) = f (a + b) = f (a) · f (b). Dies wollten wir direkt aus der Differentialgleichung herleiten. Auch konkrete Informationen über die Zahl e lassen sich aus (5.3) und (5.4) erhalten. Nach (5.4) gilt für jede natürliche Zahl 38 U. Stammbach: e = e1 = f 1 1 1 + + ··· + n n n n 1 n = f Analysis, Teil A . Betrachten wir den Punkt x = 0, so gilt wegen f 00 (x) = (f 0 )0 (x) = f 0 (x) = f (x) natürlich f 00 (0) = 1. Insbesondere ist der Graph von f an der Stelle x = 0 nach links gekrümmt (konvex). Dann folgt aber sofort (siehe Figur 2) f (x) > 1 + x für alle x die genügend nahe bei x0 = 0 liegen. Mit obiger Formel erhalten wir nun 3 (y) ex 2.5 2 1+x Fig. 2 : Die Exponentialfunktion x → ex und die lineare Funktion x→ 1+x 1.5 1 0.5 (x) -2 -1.5 -1 -0.5 0.5 1 1.5 2 -0.5 -1 n e = f (1) = f 1 n > 1+ 1 n n 39 Kapitel II. Differentialrechnung und analog 1 1 = f (−1) = f − e n n > 1− 1 n n = n−1 n n . Diese beiden Beziehungen liefern die Ungleichungen 1 1+ n n <e< n n−1 n 1 = 1+ n−1 n 1 = 1+ n−1 n−1 1 1+ n−1 . Lässt man n auf beiden Seiten gegen ∞ streben, so erhält man links und rechts denselben Grenzwert. Daraus folgt (siehe Figur 3) 3 2.5 n 1 an = 1 + n Fig. 3 : Die gegen e konvergierende n Folge an = 1 + n1 2 1.5 1 0.5 5 10 15 20 lim n→∞ 1+ 1 n n = e. Schliesslich versuchen wir noch, unsere Funktion f in Form eines “unendlichen Polynoms”, d.h. durch eine Potenzreihe darzustellen. Wir werden diese Art, Funktionen zu beschreiben, später genauer kennenlernen. Hier wollen wir das Thema nur kurz antippen. Wir machen den Ansatz 40 U. Stammbach: Analysis, Teil A f (x) = a0 + a1 x + a2 x2 + · · · . Die Bedingung f (0) = 1 liefert sofort a0 = 1. Die reellen Zahlen a1 , a2 , . . . versuchen wir mit Hilfe der Differentialgleichung (5.3) zu bestimmen. (Gliedweises) Ableiten und Einsetzen in (5.3) ergibt a1 + 2a2 x + 3a3 x2 + · · · = a0 + a1 x + a2 x2 + · · · . Daraus folgt zuerst a1 2a2 3a3 4a4 = = = = .. . a0 = 1 a1 a2 a3 und damit a1 = 1 , a2 = 1 1 1 , a3 = , . . . , an = , . . . . 2 3! n! Es ergibt sich daraus der folgende Ausdruck für f (x) in Form einer unendlichen Summe f (x) = 1 + 1 1 1 x + x2 + x3 + · · · . 1! 2! 3! Man nennt dies eine Potenzreihe (mit Mittelpunkt 0). Natürlich müsste man an dieser Stelle beweisen, dass diese unendliche Summe konvergiert und dass die durch sie dargestellte Funktion die Gleichung (5.3) erfüllt. Wir werden später sehen, wenn wir uns eingehender mit Potenzreihen beschäftigen werden, dass dies tatsächlich der Fall ist. Hier wollen wir den oben erhaltenen Reihenausdruck als gültig annehmen und darin x = 1 setzen. Wir erhalten für den Funktionswert f (1), also für e die Reihe e = f (1) = 1 + 1 1 1 + + + ··· . 1! 2! 3! Dies ist die uns bereits bekannte Beschreibung der Euler’schen Zahl e durch eine Reihe (siehe Kap. I, Abschnitt 1). Schliesslich beschäftigen wir uns noch kurz mit der Logarithmusfunktion. Wegen f 0 (x) = f (x) > 0 ist f strikt monoton wachsend und deshalb injektiv. Es existiert also die zu f inverse Funktion; diese heisst - definitionsgemäss - der (natürliche) Logarithmus log : x → log(x) (siehe Figur 4). Es gilt 41 Kapitel II. Differentialrechnung d log 1 1 1 (x) = 0 = = . dx f (log(x)) f (log(x)) x 2 (y) 1.5 1 log x Fig. 4 : Die Logarithmusfunktion x → log x 0.5 -1 1 2 3 4 5 6 (x) -0.5 -1 -1.5 -2 Da der Wertebereich der Exponentialfunktion aus allen positiven Zahlen besteht, ist der Definitionsbereich der Logarithmusfunktion durch D(log) = (0, ∞) gegeben. In diesem Bereich ist log0 (x) positiv, so dass log strikt monoton wachsend ist. Ausserdem folgt aus der Definition von log als inverse Funktion der Exponentialfunktion log(1) = 0. Um die Funktionalgleichung des Logarithmus, d.h. die grundlegende Beziehung log(a · b) = log a + log b , a, b > 0 aus der Definition herzuleiten, betrachten wir die Funktion x → log(ax) und berechnen deren Ableitung, d a 1 log(ax) = a log0 (ax) = = . dx ax x Die Funktionen x → log x und x → log(ax) besitzen die gleiche Ableitung, sie unterscheiden sich deshalb nur um eine additive Konstante, 42 U. Stammbach: Analysis, Teil A log(ax) − log x ≡ C . Um C zu bestimmen setzt man x = 1; man erhält C = log a. Damit folgt, wie gewünscht log(a · b) = log a + log b . Wenn man in dieser Beziehung a = 1/b setzt und log 1 = 0 berücksichtigt, so erhält man log(1/b) = − log b, so dass folgt log a b = log a − log b . Es war Ziel des ersten Teils dieses Abschnittes, zu zeigen, wie eine Differentialgleichung die Eigenschaften ihrer Lösungen festlegt. Wir haben dies am Beispiel der einfachen Differentialgleichung der Exponentialfunktion zu erklären versucht. Im Rest des Abschnittes wollen wir uns noch mit der Exponentialfunktion zu beliebiger Basis a, a > 1 beschäftigen und die sogenannten hyperbolischen Funktionen einführen. Es sei a > 1 eine reelle Zahl. Es lässt sich offensichtlich ax mit Hilfe der Exponentialfunktion zur Basis e wie folgt schreiben ax = e(log a)x . Daraus erhält man sofort die Ableitung der Funktion x → ax d x a = (log a)ax . dx Da diese Ableitung offenbar für alle x-Werte positiv ist, ist die Funktion x → ax strikt monoton wachsend. Wir können deshalb die zu ihr inverse Funktion definieren; wir nennen sie a log. Es gilt a log : x →a log x = a log x Dies ergibt sich leicht aus elog x = x = a log e = 1 a Deshalb gelten die Beziehungen log e = 1 log x . log a = e(log a) 1 . log a a log x . Für x = e erhält man wegen 43 Kapitel II. Differentialrechnung a log x = d x dx a = a log e · log x , ax , 1 a log e d a log x = dx 1 1 log a x = a log e 1 x. Zum Schluss wollen wir uns noch den sogenannten hyperbolischen Funktionen zuwenden, die mit Hilfe der Exponentialfunktionen definiert sind (siehe Figur 5). Definition Der Sinus hyperbolicus ist definiert durch sinh x = 1 x e − e−x , 2 der Cosinus hyperbolicus ist definiert durch cosh x = 1 x e + e−x . 2 4 (y) 3 cosh x 2 Fig. 5 : Die hyperbolischen Funktionen sinh x 1 1 x 2e -2 -1.5 -1 1 −x 2e -0.5 0.5 1 1.5 2 (x) -1 -2 44 U. Stammbach: Analysis, Teil A Für diese Funktionen gelten die folgenden Identitäten, die sich auf einfache Weise aus den Definitionen ergeben: (1) cosh2 x − sinh2 x ≡ 1; (2) sinh(x + y) = sinh x cosh y + cosh x sinh y; (3) cosh(x + y) = cosh x cosh y + sinh x sinh y; (4) d sinh (x) = cosh x; dx (5) d cosh (x) = sinh x. dx Die Formeln erinnern den Leser an die entsprechenden Formeln für die Sinus- und Cosinusfunktionen; sie liefern eine Rechtfertigung für die (historisch gewählten) Bezeichnungen der hyperbolischen Funktionen. Um auch das Auftreten des Wortes “hyperbolisch” zu erklären, betrachten wir die durch die Parameterdarstellung t → (cosh t, sinh t), t ∈ R gegebene Kurve. Es gilt dann nach der ersten der obigen Identitäten (x(t))2 − (y(t))2 = 1, d.h. die Punkte der Kurve liegen auf der Hyperbel x2 − y 2 = 1, genauer auf dem rechten Ast dieser Hyperbel. Die Graphen der hyperbolischen Funktionen ergeben sich sehr leicht aus den Definitionen. Insbesondere ist der Sinus hyperbolicus eine ungerade, der Cosinus hyperbolicus eine gerade Funktion. Der Graph der Cosinus hyperbolicus Funktion heisst auch etwa Kettenlinie, weil eine an den zwei Enden aufgehängte frei bewegliche Kette die Form des Graphen von x → a cosh(x/a) annimmt. Wegen sinh0 x = cosh x ist der Sinus hyperbolicus strikt monoton wachsend, also insbesondere injektiv. Es gibt deshalb eine zum Sinus hyperbolicus inverse Funktion; diese heisst in der Literatur Arsinh (“Area sinus hyperbolicus”, siehe Figuren 6,7). Sie lässt sich wie folgt auf elementare Weise ausdrücken. Laut Definition ist die Gleichung y= 1 x e − e−x 2 nach x aufzulösen. Man erhält der Reihe nach e2x − 1 = 2yex (ex )2 − 2yex − 1 = 0 ex = y ± q y2 + 1 . 45 Kapitel II. Differentialrechnung 4 (y) 3 sinh x 2 Fig. 6 : Sinus hyperbolicus x → sinh x 1 -4 -3 -2 -1 1 2 3 4 (x) -1 -2 -3 -4 4 (y) 3 Arsinh x 2 Fig. 7 : Area sinus hyperbolicus x → Arsinh x 1 -4 -3 -2 -1 1 2 3 4 (x) -1 -2 -3 -4 46 U. Stammbach: Analysis, Teil A 4 (y) 3 cosh x Fig. 8 : Cosinus hyperbolicus x → cosh x , x ∈ [0, ∞] 2 1 (x) -1 1 2 3 4 -1 4 (y) 3 2 Fig. 9 : Area cosinus hyperbolicus x → Arcosh x Arcosh x 1 (x) -1 1 -1 2 3 4 47 Kapitel II. Differentialrechnung 1.2 (y) 1 0.8 1 √ 2 x +1 Fig. 10 : Die Funktion 0.6 √ 0.4 1 x2 +1 ; Ableitung von x → Arsinh x 0.2 (x) -4 -3 -2 -1 1 2 3 4 -0.2 8 (y) 6 Fig. 11 : Die Funktion 4 √ 1 √ x2 − 1 1 2 −1 ; Ableitung von x → Arcosh x 2 -1 1 x2 3 4 5 6 (x) 48 U. Stammbach: Analysis, Teil A Das negative Vorzeichen kann wegen ex > 0 ausgeschlossen werden, so dass schliesslich folgt x = log y + q y2 + 1 . Die inverse Funktion des Sinus hyperbolicus wird durch die Formel Arsinh : x → log x + p x2 + 1 beschrieben. Schränkt man den Definitionsbereich des Cosinus hyperbolicus auf die nicht negativen Zahlen [0, ∞) ein, so erhält man eine injektive Funktion. Die dazu inverse Funktion heisst Arcosh (“Area cosinus hyperbolicus”, siehe Figuren 8,9). Auf analoge Art wie beim Sinus hyperbolicus erhält man eine elementare Beschreibung, nämlich Arcosh : x → log x + p x2 − 1 . Definitionsbereich dieser Funktion ist natürlich das Intervall [1, ∞). Interessant sind die Funktionen Arsinh und Arcosh besonders wegen ihrer Ableitungen. Für deren Berechnung kann man entweder von der elementaren Beschreibung ausgehen oder direkt von der Definition als inverse Funktionen. Eine kurze Rechnung liefert (siehe Figuren 10,11) d 1 Arsinh x = √ , dx x2 + 1 d 1 Arcosh x = √ . dx x2 − 1 Die überraschende Tatsache, dass die Ableitungen einfache Wurzelfunktionen sind, wird beim Integrieren eine grosse Rolle spielen. 49 Kapitel II. Differentialrechnung 6 Grössenordnungen von Funktionen Es sei f : x → f (x) eine Funktion, die auf dem Intervall (c, ∞) definiert ist. Die Untersuchung von limx→∞ f (x) gibt eine erste Information über das Verhalten von f (x) für grosse x. Gilt z.B. lim f (x) = a, x→∞ so bedeutet dies bekanntlich, dass der Graph von f für x → ∞ die Gerade y = a als horizontale Asymptote besitzt. In diesem Abschnitt wollen wir unter anderem den Fall limx→∞ f (x) = ∞ etwas näher untersuchen. Die Funktionswerte einer solchen Funktion werden mit wachsenden x beliebig gross, d.h. der Graph von f strebt für x → ∞ gegen ∞. Dies kann aber auf sehr viele verschiedene Arten geschehen, wie man etwa an den Beispielen x → x2 , x→ x2 + 3x + 3 , x+2 x → log x . unmittelbar sehen kann (siehe Figur 1). Um dieses unterschiedliche Verhalten etwas in den Griff zu bekommen, führen wir die folgende Sprechweise ein. Es seien f und g zwei Funktionen, die auf dem Intervall (c, ∞) definiert sind. Dann sagen wir, die Funktion f sei für x → ∞ von kleinerer Grössenordnung als g, wenn gilt f (x) =0. x→∞ g(x) lim In Zeichen drücken wir dies durch das sogenannte Landau-Symbol “o” aus: f (x) = o(g(x)) für x → ∞ . Beispiel Es gilt x2 = o(x3 ) für x → ∞ (siehe Figur 2), denn x2 =0. x→∞ x3 lim 50 U. Stammbach: Analysis, Teil A 14 (y) 12 x3/2 10 x2 + 3x + 3 x+2 8 Fig. 1 : Es gibt verschiedene Arten, wie f (x) für x → ∞ gegen ∞ streben kann 6 4 log x 2 (x) 2 4 6 8 10 -2 60 (y) 50 x3 40 Fig. 2 : x → x2 ist von kleinerer Grössenordnung als x → x3 30 x2 20 10 (x) 2 4 6 8 51 Kapitel II. Differentialrechnung 8 (y) x1/2 6 Fig. 3 : x → x1/3 ist von kleinerer Grössenordnung als x → x1/2 4 x1/3 2 (x) 10 20 30 40 50 60 Beispiel Die Funktionen x → x, x → 2x, x → x + c sind von “gleicher” Grössenordnung; keine der Funktionen ist von kleinerer Grössenordnung als eine der anderen. Beispiel Es gilt x1/3 = o(x1/2 ) für x → ∞ (siehe Figur 3), denn x1/3 =0. x→∞ x1/2 lim Die oben eingeführte Sprechweise kann laut Definition auf beliebigen Funktionen angewandt werden; es ist dafür nicht notwendig, dass die Funktionswerte für x → ∞ gegen ∞ streben. Auch dazu einige Beispiele. Beispiel Es gilt 1/x3 = o(1/x2 ) für x → ∞, denn 1/x3 =0 x→∞ 1/x2 lim Beispiel Für k > 0, gilt 1/xk = o(1). Von besonderem Interesse sind in diesem Zusammenhang die Exponential- und Logarithmusfunktionen. Hier gilt der wichtige Satz (siehe Figur 4): 52 U. Stammbach: Analysis, Teil A Satz Es gilt xk = o(ex ) für x → ∞. Man kann den Inhalt dieses Satzes auch so ausdrücken: die Exponentialfunktion x → ex strebt für x → ∞ “stärker” gegen ∞ als jede Potenzfunktion x → xk . (Dies ist natürlich nur für k > 0 von wirklichem Interesse; für k < 0 strebt ja x → xk für x → ∞ gegen 0, so dass die Aussage des Satzes für k < 0 trivialerweise richtig ist.) (y) 10 ex x10 8 Fig. 4 : Der Eindruck trügt: sowohl x → x3 wie auch x → x10 sind von kleinerer Grössenordnung als x → ex ! (siehe Figuren 5,6) 6 4 x3 2 (x) 0.5 1 1.5 2 2.5 Beweis Zum Beweis bestimmen wir zuerst die Ableitung von x → xk /ex . Es gilt d dx xk ex ! = kxk−1 ex − xk ex xk−1 (k − x) = . e2x ex Für x > k ist die Ableitung negativ, so dass die Funktion x → xk /ex in diesem Bereich monoton fallend ist. Andererseits ist xk /ex für x > 0 stets positiv. Daraus folgt, dass der Grenzwert xk x→∞ ex lim existieren muss. Es bleibt also zu zeigen, dass sein Wert 0 ist. Dabei dürfen wir uns auf ganzzahlige Werte von k beschränken. Ist nämlich n ≤ k < n + 1 für ganzzahliges n, so gilt für x>1 53 Kapitel II. Differentialrechnung 100 (y) 80 Fig. 5 : Die Graphen von x → x3 und x → ex schneiden sich im Intervall 4 < x < 5 noch einmal. 60 x3 ex 40 20 (x) 1 2 3 5 4 15 5. 10 (y) 15 4. 10 Fig. 6 : Die Graphen von x → x10 und x → ex schneiden sich im Intervall 30 < x < 40 noch einmal. 15 3. 10 15 2. 10 x10 ex 15 1. 10 (x) 10 20 30 40 54 U. Stammbach: Analysis, Teil A xn xk xn+1 ≤ < ex ex ex und damit xn xk xn+1 ≤ lim ≤ lim . x→∞ ex x→∞ ex x→∞ ex lim Die Tatsache, dass für ganzzahliges n xn =0 x→∞ ex lim gilt, beweisen wir mit Induktion nach n. Für n = 0 ist die Aussage trivialerweise richtig: x0 1 = lim x = 0 . x→∞ ex x→∞ e lim Es sei also n ≥ 1. Da für jede reelle Zahl c mit x auch x + c gegen ∞ strebt, haben wir xn x→∞ ex lim (x + c)n x→∞ ex+c xn + ncxn−1 + · · · + cn = lim x→∞ ex · ec ! n x xn−1 1 1 n = c lim x + nc lim + · · · + c lim x x→∞ ex x→∞ e e x→∞ e n x 1 = c lim x , e x→∞ e = lim denn nach Induktion gilt xm =0 x→∞ ex lim für m < n. Aus der obigen Gleichung ergibt sich xn 1 1− c x→∞ ex e lim =0, woraus folgt, da die Klammer nicht verschwindet, xn =0. x→∞ ex lim Damit ist der Satz bewiesen. 55 Kapitel II. Differentialrechnung 3 (y) x1/2 2.5 log x 2 Fig. 7 : Die Logarithmusfunktion x → log x ist von kleinerer Grössenordnung als x → x1/2 und x → x1/10 . 1.5 x1/10 1 0.5 (x) 2 4 6 8 10 -0.5 -1 Vergleicht man Potenz- und Logarithmusfunktionen, so gilt (siehe Figur 7) Satz Für k > 0 gilt log x = o(xk ) für x → ∞. Beweis log x t t1/k lim = lim = lim x→∞ xk t→∞ (et )k t→∞ et !k =0. Letzteres nach dem obigen Satz. Ebenfalls aus dem ersten Satz folgt das nächste Resultat, welches sich mit Funktionen beschäftigt, die für x → ∞ gegen 0 streben. Satz Für k > 0 gilt e−x = o(x−k ) für x → ∞. Beweis e−x xk = lim =0. x→∞ x−k x→∞ ex lim Schliesslich bemerken wir, dass sich die Landau-Symbolik nicht nur für x → ∞ verwenden lässt, sondern auch für x → a+ , wo a ein endlicher Wert ist. Sind f und g zwei auf dem Intervall (a, b) 56 U. Stammbach: Analysis, Teil A definierte Funktionen, so heisst f für x → a+ von kleinerer Grössenordnung als g, wenn gilt lim+ x→a f (x) =0. g(x) In Zeichen drücken wir diesen Sachverhalt wiederum durch das Landau-Symbol aus f (x) = o(g(x)) für x → a+ . Als Beispiel betrachten wir die Funktionen x → log x und x → −x−k , k > 0, welche für x → 0+ gegen −∞ streben. Es gilt Satz Für k > 0 gilt log x = o(−x−k ) für x → 0+ . Beweis Wiederum folgt dies auf einfache Weise aus unserem ersten Satz: log x log(e−t ) −t t1/k lim+ = lim = lim = lim −k −t −k −t −k t→∞ −(e ) t→∞ −(e ) t→∞ et x→0 −x !k =0. Man kann sich diese Resultate leicht merken: In all diesen Sätzen verhält sich die Exponentialfunktion extremer als die Potenzfunktion und diese extremer als die Logarithmusfunktion. Analoge Resultate gelten auch für die Funktion x → ax , a > 0 anstelle von x → ex und x →a log x anstelle von x → log x. Sie lassen sich leicht aus den obigen Sätzen herleiten, indem man die wohlbekannten Beziehungen ax = elog a·x log x a log x = log a benützt. Wir überlassen die Details dem Leser. 57 Kapitel II. Differentialrechnung 7 Die zweite und höhere Ableitungen Ausgehend von einer Funktion f : x → f (x) haben wir die Ableitung f 0 (x) definiert. Ihr Wert an der Stelle x gibt die Tangentensteigung des Graphen von f im Punkt (x, f (x)) an. Es ist klar, dass die Zuordnung f 0 : x → f 0 (x) wiederum eine Funktion definiert, wobei der Definitionsbereich von f 0 aus allen Punkten x besteht, in denen die Ableitung von f existiert. Folglich kann für f 0 wiederum die Ableitung (f 0 )0 gebildet werden. Man schreibt (f 0 )0 (x) = f 00 (x) = d2 f (x) dx2 und nennt f 00 die zweite Ableitung von f nach x. Beispiel Ist s : t → s(t) die Wegfunktion einer Bewegung eines Massenpunktes (auf der s-Achse), so ist ds (t) = ṡ(t) = v(t) dt die Geschwindigkeit (Schnelligkeit) und d2 s (t) = s̈(t) = a(t) dt2 die Beschleunigung des Massenpunktes. (Bei Funktionen der Zeit t braucht man gern Punkte zur Bezeichnung der Ableitung nach t.) Natürlich kann zu f 00 wiederum die Ableitung (f 00 )0 definiert werden. Man spricht dann von der dritten Ableitung f 000 von f nach x, usw. Beispiel Es sei f : x → xn , n ganz. Dann ist f 0 (x) = n · xn−1 f 00 (x) = n(n − 1)xn−2 .. . f (n) (x) = n · (n − 1) · · · 2 · 1 58 U. Stammbach: Analysis, Teil A und alle höheren Ableitungen sind Null. Die zweite Ableitung einer Funktion f : x → f (x) hat eine wichtige Bedeutung für den Graphen von f . Ist nämlich f 00 (x0 ) > 0, so ist an dieser Stelle die erste Ableitung f 0 , also die Steigung des Graphen von f zunehmend. Durchläuft man den Graphen von f in Richtung zunehmenden x, so ist an der Stelle x0 die Kurve deshalb nach links gekrümmt (konvex). Ist f 00 (x0 ) < 0, so ist die erste Ableitung f 0 , also die Steigung des Graphen von f 0 abnehmend. Durchläuft man den Graphen von f in Richtung zunehmenden x, so ist an der Stelle x0 die Kurve deshalb nach rechts gekrümmt (konkav). Ändert f 00 das Vorzeichen in x0 , so weist der Graph von f an dieser Stelle einen Wendepunkt auf. Beispiel Für die Funktion 7 177 2 f : x → x5 − x4 − 32x3 + x + 126x − 270 2 2 tragen wir in ein und dasselbe Koordinatensystem die Graphen der Funktion f und der Ableitungen f 0 , f 00 , f 000 , . . . ein. Auf diese Weise lassen sich nicht nur die uns schon gut bekannten Beziehungen leicht verfolgen, die zwischen lokalen Extremalstellen von f und den Nullstellen von f 0 bestehen, sondern auch diejenigen, die zwischen den Wendepunkten des Graphen von f und den Nullstellen von f 00 bestehen (siehe Figur 1). Die geometrische Bedeutung der 2. Ableitung ist nützlich, wenn es darum geht, den groben Verlauf des Graphen einer Funktion herauszufinden. Beispiel Es sei f : x → (x − 1)1/3 (siehe Figur 2). Der Definitionsbereich von f besteht offensichtlich aus allen rellen Zahlen. Bei x = 1 hat die Funktion eine Nullstelle; für x < 1 ist der Funktionswert negativ, für x > 1 ist der Funktionswert positiv. Die Ableitung von f ergibt sich zu f 0 : x → f 0 (x) = 1 (x − 1)−2/3 . 3 Offensichtlich ist f 0 an der Stelle x = 1 nicht definiert. Überall sonst ist die Ableitung positiv, die Funktion f ist also strikt monoton wachsend. Die Tatsache, dass f 0 (x) für x → 1± gegen ∞ strebt, zeigt, dass der Graph von f bei x = 1 eine vertikale Tangente besitzt. Die zweite Ableitung von f ist 1 2 f 00 : x → f 00 (x) = − · (x − 1)−5/3 . 3 3 Die zweite Ableitung von f ist für x < 1 positiv, der Graph von f in diesem Bereich also nach links gekrümmt (konvex). Für x > 1 ist die zweite Ableitung negativ, der Graph in diesem Bereich also nach rechts gekrümmt (konkav). 59 Kapitel II. Differentialrechnung (y) f Fig. 1 : Die Graphen der ersten drei Ableitungen von f f 00 f0 f 000 (x) 2 (y) 1 (x − 1)1/3 Fig. 2 : Der Graph der Funktion (x) -2 -1 1 -1 -2 2 3 4 f : x → (x − 1)1/3 60 U. Stammbach: Analysis, Teil A 2 Beispiel Es sei f : x → e−x /2 . Der Graph dieser Funktion heisst Gauss’sche Fehlerkurve (siehe Figur 3). Diese spielt in der Wahrscheinlichkeitsrechnung und Statistik im Zusammenhang mit der sogenannten Normalverteilung eine grosse Rolle. Offenbar ist die Funktion f auf der ganzen reellen Zahlgeraden definiert. Da der Exponent von e für alle von Null verschiedenen x negativ ist, ist der Wertebereich der Funktion f das Intervall (0, 1]. Klar ist auch, dass die Funktion gerade ist, da x nur im Quadrat vorkommt. Wir dürfen uns deshalb bei der Diskussion auf den Bereich x ≥ 0 beschränken. Für x → ∞ strebt f (x) gegen 0, so dass die x-Achse eine Asymptote für x → ∞ ist. Die Ableitung von f ist die Funktion f 0 : x → −x · e−x 2 /2 . (y) 1 0.8 e− x2 2 Fig. 3 : Die Gauss’sche Fehlerkurve 0.6 0.4 0.2 -2 -1 1 2 (x) -0.2 Man liest daran ab, dass für x > 0 der Graph von f monoton fallend ist und dass er an der Stelle x = 0 eine horizontale Tangente aufweist. Die zweite Ableitung ist f 00 : x → (x2 − 1) · e−x 2 /2 . Im Bereich 0 ≤ x < 1 ist diese negativ, der Graph von f also nach rechts gekrümmt; im Bereich 1 < x < ∞ ist sie positiv, der Graph also nach links gekrümmt. An der Stelle x = 1 wechselt die 61 Kapitel II. Differentialrechnung (y) 1 f : x → e− x2 2 0.5 Fig. 4 : Die ersten zwei Ableitungen von -2 -1 1 2 (x) f : x → e−x 2 /2 -0.5 f 0 : x → −xe− f 00 : x → (x2 − 1)e− x2 2 x2 2 -1 zweite Ableitung ihr Vorzeichen, der Graph von f weist demzufolge im Punkt (1, e−1/2 ) einen Wendepunkt auf (siehe Figur 4). Das Newton’sche Gesetz der Mechanik Kraft = Masse × Beschleunigung verknüpft die Beschleunigung eines Massenpunktes m mit der auf diesen wirkenden Kraft K. Da die Beschleunigung die zweite Ableitung der Wegfunktion ist, ist das zweite Newton’sche Gesetz vom mathematischen Standpunkt aus nichts anderes als eine Differentialgleichung für die Wegfunktion t → s(t), in welcher die zweite Ableitung s̈(t) vorkommt m · s̈(t) = K. Dabei hängt die Kraft möglicherweise von s und t ab. Wir werden uns im 2. Semester eingehend mit solchen Differentialgleichungen beschäftigen, wollen aber an dieser Stelle über eine spezielle Differentialgleichung dieser Art schon einige Bemerkungen einfügen, nämlich über die Differentialgleichung der harmonischen Schwingung. 62 U. Stammbach: Analysis, Teil A Der Massenpunkt m sei an einer (idealen) Feder aufgehängt, so dass auf m eine zur Auslenkung s(t) aus der Ruhelage proportionale Rückstellkraft wirkt. Aus dem Newton’schen Gesetz ergibt sich dann die Differentialgleichung ms̈(t) = −k s(t) , k > 0 oder anders geschrieben (7.1) s̈(t) + ω 2 s(t) = 0 , wobei wir ω 2 = k/m gesetzt haben. Das ist die Differentialgleichung der harmonischen Schwingung. Durch Einsetzen verifiziert man ohne Schwierigkeit, dass jede Funktion der Form (7.2) s(t) = B cos(ωt) + C sin(ωt), B, C ∈ R die Differentialgleichung (7.1) erfüllt und deshalb eine Lösung dieser Gleichung ist. Ebenso leicht verifiziert man, dass jede Funktion der Form (7.3) s(t) = A cos(ωt + ϕ), A, ϕ ∈ R die Differentialgleichung (7.1) erfüllt. Wir behaupten, dass es sich bei (7.2) und (7.3) um zwei verschiedene Schreibweisen für dieselben Funktionen handelt. (Dass wir damit wirklich alle Lösungen der Differentialgleichung (7.1) beschreiben, werden wir im 2. Semester sehen.) Wenden wir auf (7.3) die bekannte Summenformel für den Cosinus an, so erhalten wir s(t) = A cos ϕ cos(ωt) − A sin ϕ sin(ωt) . Setzt man also B = A cos ϕ, C = −A sin ϕ, so erhält man eine Funktion der Form (7.2). Geht man umgekehrt von der Funktion s(t) = B cos(ωt) + C sin(ωt) √ aus und definiert man A = B 2 + C 2 und tan ϕ = −C/B, so erhält man eine Funktion der Form (7.3). Man nennt (7.2) die zweiteilige und (7.3) die einteilige Schreibweise der harmonischen Schwingung. In der Praxis spielen sogenannte gedämpfte harmonische Schwingungen eine grosse Rolle. Etwas ungenau, aber einprägsam, kann man diese als harmonische Schwingung beschreiben, deren 63 Kapitel II. Differentialrechnung Amplitude exponentiell abklingt (siehe Figur 5). Eine gedämpfte harmonische Schwingung ist von der Form t → e−at cos(ωt + ϕ), a > 0. Wie wir später sehen werden, führt ein an einer Feder aufgehängter Massenpunkt eine gedämpfte Schwingung aus, wenn auf ihn neben der Rückstellkraft eine Dämpfungskraft wirkt, die zur Geschwindigkeit proportional ist. t e− 3 Fig. 5 : Zum Verlauf der gedämpften harmonischen Schwingung (t) t t → e− 3 cos(t + π ) 4 t −e− 3 Beispiel Um uns (qualitativ) über den Verlauf einer gedämpften harmonischen Schwingung ein Bild zu machen, betrachten wir die Funktion f : t → e−t sin t etwas näher, d.h. wir setzen a = 1, ω = 1, ϕ = −π/2 (siehe Figur 6). Die erste und zweite Ableitung von f ergibt sich nach kurzer Rechnung zu f 0 : t → e−t · (− sin t + cos t) , f 00 : t → 2e−t · (− cos t) . 64 U. Stammbach: Analysis, Teil A Fig. 6 : Der Graph der Funktion f : t → e−t sin t e−t sin t e−t (t) −e−t Die Lösung der Gleichung f (t) = 0 liefert die Nullstellen: t = kπ, k = 0, ±1, ±2, . . .. Die Lösung der Gleichung f 0 (t) = 0 liefert die Stellen, wo der Graph horizontale Tangenten aufweist. Man erhält cos t = sin t tan t = 1 t = π/4 + kπ, k = 0, ±1, ±2, . . . . Und schliesslich liefert die Gleichung f 00 (t) = 0 die Wendestellen des Graphen von f . Man erhält t = π/2 + kπ, k = 0, ±1, ±2, . . .. Wegen | sin t| ≤ 1 oszilliert der Graph von f zwischen den beiden Kurven y = e−t und y = −e−t . Ist sin t = 1, so berührt der Graph von f die erste dieser Kurven, ist sin t = −1 so berührt der Graph die zweite der beiden Kurven. Die t-Werte, die zu diesen Berührstellen gehören, sind t = π/2 + kπ, k = 0, ±1, ±2, . . .. Man liest daran die etwas überraschende Tatsache ab, dass die Berührstellen gerade mit den Wendepunkten übereinstimmen. Kapitel II. Differentialrechnung 8 65 Ebene Kurven Ebene Kurven können auf viele verschiedene Arten beschrieben werden. Wir arbeiten in dieser Vorlesung vor allem mit den folgenden. I. Parameterdarstellung Eine Parameterdarstellung der Kurve K besteht darin, dass für jeden Wert des Parameters t ein zugehöriger Punkt (x(t), y(t)) der Kurve K festgelegt wird. Es ist also eine Funktion t → ~r(t) = (x(t), y(t)), t ∈ [b1 , b2 ] gegeben, wobei ~r(t) als Ortsvektor aufzufassen ist. Man kann diese Funktion als Abbildung des Parameterintervalles [b1 , b2 ] in die Ebene auffassen. Beispiel Kreis mit Radius a um den Punkt P = (x0 , y0 ) t → (x0 + a cos t, y0 + a sin t), 0 ≤ t < 2π . Eine ebene Bewegung eines Massenpunktes wird auf natürlichste Art mit Hilfe einer Parameterdarstellung mit der Zeit als Parameter beschrieben. Eliminiert man aus der Parameterdarstellung einer Kurve den Parameter t, so gelangt man zur impliziten Darstellung. II. Implizite Darstellung Die Kurve K ist beschrieben als Menge der Punkte (x, y), deren Koordinaten die Gleichung F (x, y) = 0 erfüllen. Beispiel Kreis mit Radius a um P (x − x0 )2 + (y − y0 )2 − a2 = 0 . Löst man die Gleichung F (x, y) = 0 nach y auf, so erhält man eine explizite Darstellung der Kurve K. III. Explizite Darstellung Die Kurve K ist als Graph einer Funktion x → y(x) gegeben. Beispiel Kreis mit Radius a um P 66 U. Stammbach: Analysis, Teil A q f1 : x → y = + a2 − (x − x0 )2 + y0 , D(f1 ) = [x0 − a, x0 + a] , q f2 : x → y = − a2 − (x − x0 )2 + y0 , D(f2 ) = [x0 − a, x0 + a] . Man beachte, dass in diesem Beispiel zwei(!) Funktionen notwendig sind, um den vollen Kreis zu beschreiben (siehe Figur 1). 5 (y) 4 Fig. 1 : Kreis 3 a 2 P = (x0 , y0 ) t 1 (x) 1 2 3 5 4 6 -1 Beispiel Ellipse mit Halbachsen a und b und Mittelpunkt im Ursprung (siehe Figur 2). Parameterdarstellung: t → ~r(t) = (a cos t, b sin t), 0 ≤ t < 2π . Implizite Darstellung: x2 y 2 + 2 =1. a2 b Explizite Darstellung: s f1 : x → y = +b 1 − s f2 : x → y = −b 1 − x2 , D(f1 ) = [−a, +a] , a2 x2 , D(f2 ) = [−a, +a] . a2 67 Kapitel II. Differentialrechnung (y) a b Fig. 2 : Ellipse (x) t x2 y 2 + 2 =1 a2 b (y) y= b x a Fig. 3 : Hyperbel a (x) x2 y 2 − 2 =1 a2 b 68 U. Stammbach: Analysis, Teil A Beispiel Hyperbel mit Mittelpunkt im Ursprung (siehe Figur 3). Parameterdarstellung (rechter Ast): t → ~r(t) = (a cosh t, b sinh t), −∞ < t < ∞ . Implizite Darstellung (beide(!) Äste): x2 y 2 − 2 =1. a2 b Explizite Darstellung: s f1 : x → y = +b s f2 : x → y = −b x2 − 1, a2 D(f1 ) = (−∞, −a] ∪ [a, ∞) , x2 − 1, a2 D(f2 ) = (−∞, −a] ∪ [a, ∞) . Aus der expliziten Darstellung kann man unmittelbar ablesen, dass die beiden Geraden b y=± x a für x → ±∞ Asymptoten der Hyperbel sind. Bemerkungen Eine Kurve lässt unendlich viele verschiedene Parameterdarstellungen zu; sie kann nämlich mit “verschiedenen Geschwindigkeiten” durchlaufen werden. Eine Parameterdarstellung einer Kurve enthält neben der Information über die geometrische Gestalt der Kurve noch weitere Informationen. Die Elimination des Parameters aus der Parameterdarstellung ist nicht in jedem Fall möglich, d.h. der Übergang zur impliziten Form lässt sich nicht immer durchführen. Die Auflösung nach y der Gleichung der impliziten Darstellung ist nicht immer möglich; ferner werden in vielen Fällen mehrere Funktionen benötigt, um eine Kurve darzustellen. (Von mathematischer Seite ist hier anzumerken, dass sich eine Kurve wenigstens lokal fast immer in expliziter Form darstellen lässt. Es gilt nämlich der Satz über implizite Funktionen: Es sei (x0 , y0 ) ein Punkt der durch F (x, y) = 0 gegebenen Kurve K. Ist die Ableitung von F (x, y) nach y in (x0 , y0 ) nicht trivial, so gibt es ein Intervall I mit Mittelpunkt x0 und eine Funktion f : x → f (x), D(f ) = I mit F (x, f (x)) = 0 für alle x ∈ I, d.h. x → f (x) stellt die Kurve in der Umgebung von (x0 , y0 ) dar. Selbstverständlich gehen wir in dieser Vorlesung nicht auf den Beweis dieses Satzes ein; anschaulich ist das Resultat “klar”, wie ein Blick auf eine entsprechende Figur zeigt.) 69 Kapitel II. Differentialrechnung Eine explizite Darstellung kann immer auch als Parameterdarstellung aufgefasst werden, indem man t = x als Parameter wählt: t → ~r(t) = (t, f (t)), t ∈ D(f ) . Damit ist der Kreis I → II → III → I geschlossen. Wir werden in der Folge bei Kurven im allgemeinen von einer Parameterdarstellung ausgehen, so dass sich jetzt die Frage stellt, wie man an der Parameterdarstellung direkt Eigenschaften der Kurven ablesen kann. Dabei werden für uns die Begriffe Tangente, Normale, Krümmung, Krümmungskreis im Vordergrund stehen. Kraft der letzten der obigen Bemerkungen ist in den hergeleiteten Formeln immer auch der Spezialfall der expliziten Darstellung der Kurve enthalten. Die Kurve K sei durch die Parameterdarstellung ~r(t) = (x(t), y(t)) gegeben. Um die Tangentenrichtung im Punkte P zu erhalten, betrachten wir den Vektor P~Q ~r(t + ∆t) − ~r(t) = ∆t ∆t und lassen Q gegen P , d.h. ∆t gegen 0 streben. Definitionsgemäss erhalten wir im Limes ~r(t + ∆t) − ~r(t) ∆→0 ∆t x(t + ∆t) − x(t) y(t + ∆t) − y(t) = lim , lim ∆→0 ∆→0 ∆t ∆t ~r˙ = lim = (ẋ(t), ẏ(t)), wobei wir, wie üblich, die Ableitung nach t mit einem Punkt bezeichnet haben. Wir halten fest: Der Vektor ~r˙ = (ẋ(t), ẏ(t)) ist ein Tangentialvektor an die Kurve im Punkte P . Die Tangentensteigung im Punkt P ist somit gegeben durch ẏ(t)/ẋ(t). Beschreibt ~r(t) = (x(t), y(t)) die Bewegung eines Massenpunktes, wobei t die Zeit bedeutet, so ist ~r˙ , dessen (vektorielle) Geschwindigkeit zur Zeit t. Die Tangente an die Kurve im Punkt P hat offenbar die Parameterdarstellung ~ = ~r(t) + s ~r˙ (t), −∞ < s < +∞ . OR Der Vektor ~n(t) = (−ẏ(t), ẋ(t)) entsteht aus ~r˙ = (ẋ(t), ẏ(t)) durch Drehung um π/2 im Gegenuhrzeigersinn. Die Normale zur Kurve in P hat deshalb die Parameterdarstellung ~ = ~r(t) + s ~n(t), −∞ < s < +∞ . OS 70 U. Stammbach: Analysis, Teil A Beispiel Zykloide (siehe Figur 4). Ein Kreis mit Radius a rolle auf der x-Achse. Der Punkt der Kreisperipherie, welcher sich zu Anfang im Ursprung des Koordinatensystems befindet, beschreibt bei der Rollbewegung eine Zykloide. Wählen wir als Parameter den Drehwinkel t des Kreises, so liest man aus der Figur leicht die Parameterdarstellung t → (at − a sin t, a − a cos t), −∞ < t < +∞ (y) Fig. 4 : Zykloide t a (x) 2πa für die Zykloide ab. Ein fest mit der Kreisscheibe verbundener Punkt im Abstand b vom Mittelpunkt des Kreises beschreibt für b < a eine sogenannte verkürzte Zykloide bzw. für b > a eine verlängerte Zykloide (siehe Figur 5). Die Parameterdarstellung lautet t → (at − b sin t, a − b cos t), −∞ < t < +∞ . Beispiel Die Kurve K sei gegeben durch die Parameterdarstellung t → (cos t, sin 2t), 0 ≤ t < 2π . Für die Steigung der Kurve erhält man ẏ/ẋ = −2 cos 2t/ sin t. Die Kurve besitzt also für √ die Parameterwerte t = π/4, 3π/4, 5π/4, 7π/4, d.h. in den Punkten (± 2/2, ±1) horizontale 71 Kapitel II. Differentialrechnung (y) Fig. 5 : Verkürzte und verlängerte Zykloide (x) 2πa Tangenten, und für die Parameterwerte t = 0, π, d.h. in den Punkten (±1, 0) vertikale Tangenten. Schliesslich geht die Kurve für t = π/2, 3π/2 durch den Nullpunkt des Koordinatensystems. Die Steigung beträgt 2 für t = π/2 und −2 für t = 3π/2. Wegen ihrer Form heisst die Kurve auch etwa Zwiebelkurve (siehe Figur 6). Als nächstes wenden wir uns der Krümmung und dem Krümmungskreis einer Kurve zu. Die Krümmung k einer Kurve K ist die Schnelligkeit, mit der sich die Richtung der Tangente an die Kurve ändert, wenn diese mit Geschwindigkeit 1 durchlaufen wird. Um dies zu präzisieren, müssen wir auf der Kurve Längen messen können, d.h. wir müssen den Begriff der Bogenlänge kennen. Dieser dürfte aus der Schule bereits bekannt sein, ausserdem werden wir bei der Integralrechnung noch einmal darauf zurückkommen. Was wir hier benötigen ist die Formel für das sogenannte Bogenelement: wie man aus einer entsprechenden Figur abliest, ist das Differential der Bogenlänge gegeben durch ds = q (dx)2 + (dy)2 = q ẋ2 (t) + ẏ 2 (t) dt . Bezeichnet s(t) die von einem festen Punkt bis zu (x(t), y(t)) gemessene Bogenlänge, so gilt also ds q 2 = ẋ (t) + ẏ 2 (t) . dt 72 U. Stammbach: 1 Analysis, Teil A (y) 0.5 Fig. 6 : Zwiebelkurve (x) -1 -0.5 0.5 1 -0.5 -1 Nach obigem ist die Krümmung k definiert als Ableitung des Steigungswinkels α nach der Bogenlänge s k= dα . ds Nach der Kettenregel und nach der Formel für die Ableitung der inversen Funktion gilt nun dα dα dt dα/dt = = . ds dt ds ds/dt Damit genügt es, dα/dt zu bestimmen. Da tan α gerade die Steigung der Kurve ist, gilt ( α= arctan(ẏ/ẋ), für arctan(ẏ/ẋ) + π, für −π/2 < α < π/2 , π/2 < α < 3π/2 . Daraus folgt dα ÿ ẋ − ẏẍ ÿẋ − ẏẍ 1 · = 2 . = 2 2 dt 1 + (ẏ/ẋ) ẋ ẋ + ẏ 2 Für die Krümmung k der Kurve K ergibt sich daraus die Formel 73 Kapitel II. Differentialrechnung k = k(t) = ÿ ẋ − ẏẍ . (ẋ2 + ẏ 2 )3/2 Zusätzlich halten wir fest: k > 0 ⇔ α nimmt zu ⇔ die Kurve ist nach links gekrümmt , k < 0 ⇔ α nimmt ab ⇔ die Kurve ist nach rechts gekrümmt . In Punkten, wo k das Vorzeichen ändert, liegt ein Wendepunkt der Kurve vor. Beispiel Gegeben ist die Ellipse t → (a cos t, b sin t) , 0 ≤ t < 2π . Wir erhalten ẋ = −a sin t, ẍ = −a cos t, ẏ = +b cos t, ÿ = −b sin t, und damit k(t) = (a2 sin2 t ab . + b2 cos2 t)3/2 Insbesondere gilt für den Kreis (a = b = r) k(t) = 1/r . Kehren wir zur Ellipse zurück und betrachten wir die beiden Scheitel t = 0, t = π/2, so liefert die Formel für die Krümmung in diesen beiden Punkten k(0) = a b , k(π/2) = 2 . b2 a Zeichnen wir Kreise mit Radien 1/k(0) bzw. 1/k(π/2), welche die Ellipse in den entsprechenden Scheitelpunkten berühren, so haben diese im Berührpunkt mit der Ellipse sowohl die Tangente wie die Krümmung gemeinsam. Es sind dies die Krümmungskreise der Ellipse in den Scheitelpunkten (siehe Figur 7). Der Krümmungskreis einer Kurve K im Punkte P ist definitionsgemäss derjenige Kreis, der in P die gleiche Tangentensteigung und die gleiche Krümmung wie die Kurve K hat. Es ist also der Kreis, welcher die Kurve im Punkte P am besten approximiert. 74 U. Stammbach: Analysis, Teil A Fig. 7 : Die Krümmungskreise an den Scheitelpunkten der Ellipse Nach obigem ist der Radius des Krümmungskreises |1/k|. Sein Mittelpunkt liegt auf der Normalen zur Kurve K im Punkte P und zwar links der Kurve, falls k positiv und rechts der Kurve, falls k negativ ist. Der nach links zeigende Normaleneinheitsvektor m(t) ~ zu K in P ist (−ẏ(t), ẋ(t)) m(t) ~ =p 2 . ẋ (t) + ẏ 2 (t) Der Mittelpunkt M0 des Krümmungskreises, der Kümmungsmittelpunkt ist somit gegeben durch ~ 0 = ~r(t) + 1 m(t) OM ~ . k(t) Durchläuft man die Kurve K, so beschreibt der Krümmungsmittelpunkt M0 eine Kurve K 0 . Diese heisst Evolute von K. Beispiel Die Zykloide t → ~r(t) = (at − a sin t, a − a cos t) besitzt nach unserer Formel die Krümmung 75 Kapitel II. Differentialrechnung k(t) = −1 . 2a 2(1 − cos t) p Für den Normaleneinheitsvektor m ~ erhält man m(t) ~ = − sin t 1 − cos t p ,p 2(1 − cos t) 2(1 − cos t) ! . Einsetzen in die Parameterdarstellung der Evolute liefert ~ 0 = (at + a sin t, −a + a cos t) . OM Setzt man t = t0 − π, so erhält man ~ 0 = (at0 − aπ − a sin t0 , −a − a cos t0 ) OM = (−aπ + (at0 − a sin t0 ), −2a + (a − a cos t0 )) . Führt man nun neue Koordinaten ξ = x + aπ, η = y + 2a ein, so beschreibt diese Formel eine Zykloide im (ξ, η)-Koordinatensystem. Beispiel Gegeben sei die Parabel y = x2 . Wir fassen die explizite Darstellung als Parameterdarstellung t → ~r(t) = (t, t2 ), t ∈ R auf. Die Krümmung k ergibt sich daraus zu k(t) = 2 (1 + 4t2 )3/2 und für den Normaleneinheitsvektor m ~ erhält man m(t) ~ = 1 · (−2t, 1) , (1 + 4t2 )1/2 so dass die Parameterdarstellung der Evolute ~ 0 = (−4t3 , 1/2 + 3t2 ), t ∈ R , OM lautet. In diesem Fall lässt sich sogar der Parameter leicht eliminieren und man kann zur expliziten Darstellung übergehen. Die Evolute der Parabel ist der Graph der Funktion 76 U. Stammbach: x→ 2/3 x 1 +3 2 4 Analysis, Teil A . Daraus ergibt sich ohne weiteres auch das geometrische Bild (siehe Figur 8). (y) 2 x 2/3 1 +3 2 4 1.5 Fig. 8 : Evolute der Parabel 1 x2 0.5 (x) -1.5 -1 -0.5 0.5 1 1.5 Schliesslich beschäftigen wir uns noch kurz mit Kurven, die durch Gleichungen in Polarkoordinaten gegeben sind. Ist ρ = f (ϕ) eine solche Gleichung, so gehört ein Punkt zur Kurve K, wenn seine Polarkoordinaten (ρ, ϕ) die Gleichung erfüllen. Eine solche Darstellung gibt in offensichtlicher Weise Anlass zu einer Parameterdarstellung von K mit Parameter ϕ ϕ → ~r(ϕ) = (f (ϕ) cos ϕ, f (ϕ) sin ϕ) , so dass man auf dem Umweg über diese Parameterdarstellung Informationen über die Kurve erhalten kann. Beispiel Die logarithmische oder Bernoulli’sche Spirale (Jakob Bernoulli 1654 - 1705) ist gegeben durch die Gleichung ρ = C · ekϕ , C, k > 0 77 Kapitel II. Differentialrechnung in Polarkoordinaten (siehe Figur 9). Wir gehen über zur Parameterdarstellung ϕ → ~r(ϕ) = (C · ekϕ cos ϕ, C · ekϕ sin ϕ) . Die Tangentenrichtung der Kurve ergibt sich durch Ableitung nach ϕ ~r˙ (ϕ) = (Ckekϕ cos ϕ − C · ekϕ sin ϕ, Ckekϕ sin ϕ + C · ekϕ cos ϕ) . Die Kurve hat also vertikale Tangenten für k cos ϕ − sin ϕ = 0, d.h. für tan ϕ = k, und horizontale Tangenten für k sin ϕ + cos ϕ = 0 d.h. für tan ϕ = −1/k. Man stellt die überraschende Tatsache fest, dass die beiden Richtungen, in denen vertikale bzw. horizontale Tangenten auftreten, senkrecht aufeinander stehen (siehe Figur 10). (y) 3 Fig. 9 : Bernoullispirale 2 1 (x) -2 -1 1 2 3 -1 ~ und dem Ist P ein Punkt der Kurve K, so wollen wir den Winkel ω zwischen dem Vektor OP ~ hat offenbar Tangentialvektor an die Kurve in P bestimmen (siehe Figur 11). Der Vektor OP die Richtung ~e = (cos ϕ, sin ϕ), so dass wir erhalten cos ω = ~r˙ · ~e k . = 2 ˙ (k + 1)1/2 |~r| 78 U. Stammbach: Analysis, Teil A (y) Fig. 10 : Tangenten an Bernoullispirale (x) (y) Fig. 11 : Winkel zwischen Fahrstrahl und Tangente ~r˙ ω ~e (x) 79 Kapitel II. Differentialrechnung 3 (y) 2.5 2 Fig. 12 : Evolute der Bernoullispirale 1.5 1 0.5 (x) -1 -0.5 0.5 1 1.5 2 2.5 3 -0.5 -1 Insbesondere zeigt es sich, dass ω von ϕ unabhängig ist! Diese – wie wir später sehen werden – charakteristische Eigenschaft der logarithmischen Spirale findet in der Technik häufig Anwendung: die Formgebung von Radialturbinenschaufeln, damit der Dampf- oder Wasserstrahl überall im selben Winkel auftritt; die Formgebung eines Fräsers, damit der Schnittwinkel beim Nachschleifen konstant bleibt. Auch in ganz anderem Zusammenhang tritt sie wegen dieser Eigenschaft auf: in der Bodenphysik spielt sie bei gewissen Modellvorstellungen für Stabilitätsbetrachtungen von Erdlinsen eine Rolle; für viele Motten, die in ihrem Flug einen festen Winkel zum Lichtschimmer einer Kerze einhalten, ist die logarithmische Spirale zum Verderben geworden. Zum Schluss dieses Abschnittes wenden wir uns noch der Evolute der logarithmischen Spiralen zu, wobei wir der Einfachheit halber den Spezialfall C = 1 = k betrachten. Wir gehen aus von der Parameterdarstellung ϕ → ~r(ϕ) = (eϕ cos ϕ, eϕ sin ϕ), ϕ ∈ R , und erhalten den zu ϕ gehörigen Evolutenpunkt M0 durch Einsetzen in die entsprechende Formel: ~ 0 = (ξ(ϕ), η(ϕ)) = (−eϕ sin ϕ, eϕ cos ϕ) . OM Wiederum stellen wir eine überraschende Tatsache fest: Die Evolute ist nichts anderes als die um π/2 um den Ursprung des Koordinatensystems gedrehte Ausgangskurve (siehe Figur 12). Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel III. Integralrechnung Mathematics is not a spectator sport! Mathematics is learned by doing, not by watching! Eleanor G. Palais Inhaltsverzeichnis 1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . . 7 3 Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . . 15 5 Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6 Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 7 Flächenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 8 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 9 Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 10 Oberflächenberechnung 49 11 Schwerpunkt, Flächenmittelpunkt 12 Trägheitsmoment 13 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3 Kapitel III. Integralrechnung 1 Das bestimmte Integral Obwohl die folgenden Begriffsbildungen auch in einem allgemeineren Rahmen möglich sind, setzen wir im ganzen Kapitel voraus, dass alle betrachteten Funktionen stetig sind. Dies macht die Darstellung besonders einfach. Definition (B. Riemann 1826-1866) Gegeben sei eine Funktion f : x → f (x) und ein im Definitionsbereich von f liegendes Intervall [a, b]. y = f (x) Fig. 1 : Riemann’sches Integral f (ξ1 ) x0 = a ξ1 f (ξ2 ) x1 ξ2 f (ξ3 ) x2 ξ3 f (ξ4 ) x3 ξ4 x4 = b (a) Wähle eine Einteilung von [a, b] durch endlich viele Punkte a = x0 < x1 < · · · < xn−1 < xn = b in Teilintervalle. (b) Wähle für k = 1, 2, . . . , n Zwischenpunkte ξk mit xk−1 ≤ ξk ≤ xk . Die Feinheit der Einteilung ist definiert durch maxk=1,2,...,n |xk − xk−1 |. 4 U. Stammbach: Analysis, Teil A (c) Der gewählten Einteilung von [a, b] mit Zwischenpunkten ξk wird die Riemann’sche Summe f (ξ1 )∆x1 + f (ξ2 )∆x2 + · · · + f (ξn )∆xn = n X f (ξk )∆xk k=1 zugeordnet, wobei wir ∆xk = xk − xk−1 gesetzt haben. (d) Definiere das Riemann’sche Integral durch Z b a f (x)dx = lim n X f (ξk )∆xk . k=1 Dabei ist für den Grenzübergang eine Folge von Einteilungen zugrunde zu legen, deren Feinheit gegen Null strebt. In diesem Symbol heisst f (x) der Integrand, die Grösse a die untere und b die obere (Integrations-) Grenze. Es gilt nun das folgende grundlegende Resultat, welches wir ohne Beweis angeben: Für eine stetige Funktion f existiert der Limes in (d) immer, und sein Wert ist unabhängig von der Wahl der Folge der Einteilungen und der Zwischenpunkte. Es ist nach dieser Definition anschaulich klar, dass das Riemann’sche Integral den Inhalt der Fläche zwischen dem Graphen der Funktion und der x-Achse beschreibt, und zwar werden die Flächenanteile oberhalb der x-Achse positiv, die Anteile unterhalb der x-Achse negativ gezählt. Beispiel Es sei f (x) = C > 0. Dann folgt Z b a Cdx = C(b − a) . In diesem Fall ist das Integral gerade die Fläche des Rechtecks. Beispiel Es sei f : x −→ x2 . Dann ist Z 0 b x2 dx der Inhalt der Fläche unter der Parabel y = x2 zwischen den x-Werten 0 und b. Lange vor Erfindung der Integralrechnung wurde dieser Flächeninhalt mit anderen Methoden von Archimedes (287-212 v.Chr.) bestimmt. Hier benützen wir natürlich die oben gegebene Definition des bestimmten Integrals. Da der Wert des Riemann’schen Integrales von der gewählten Einteilung und den gewählten Zwischenpunkten unabhängig ist, dürfen wir x0 = 0, x1 = 1 2 n b, x2 = b, . . . , xn = b = b n n n 5 Kapitel III. Integralrechnung ξk = xk , k = 1, . . . , n setzen (siehe Figur 2). Wir erhalten dann Z 0 b x2 dx = = = lim (f (x1 )∆x1 + f (x2 )∆x2 + · · · + f (xn )∆xn ) n→∞ lim n→∞ 1 b n 2 + 2 b n 2 + ··· + lim (12 + 22 + · · · + n2 ) n→∞ n b n 2 ! · b n b3 . n3 y = x2 Fig. 2 : Parabelfläche x0 x1 x2 x3 x4 x5 = b Nun gilt 12 + 22 + · · · + n2 = 16 n(n + 1)(2n + 1), wie man leicht mit vollständiger Induktion nach n beweisen kann, und damit folgt Z 0 b x2 dx = n (n + 1) (2n + 1) b3 b3 lim = . 6 n→∞ n n n 3 Laut Definition des Riemann’schen Integrals gelten gewisse offensichtliche Rechenregeln, von denen wir die folgenden explizit erwähnen: 6 U. Stammbach: Analysis, Teil A • Das bestimmte Integral ist eine lineare Operation. Es gilt Z b a (f (x) + g(x))dx = Z b a Cf (x)dx = C Z b a Z b a f (x)dx + Z b a g(x)dx f (x)dx , C ∈ R . • Ist a > b, so kehren sich die Vorzeichen der ∆xk um. Damit folgt Z b a f (x)dx = − Z b a f (x)dx und daraus ergibt sich insbesondere Z a f (x)dx = 0 . a • Hat man die zwei Intervalle [a, b] und [b, c] vor sich, so liefern Einteilungen davon zusammen genommen eine Einteilung des Intervalles [a, c]. Folglich gilt Z b a f (x)dx + Z b c f (x)dx = Z c a f (x)dx . • Der Wert des bestimmten Integrales ist unabhängig vom Namen der Integrationsvariablen; es gilt Z b a f (x)dx = Z b a f (t)dt = . . . Die Integrationsvariable übernimmt nur die Rolle einer Hilfsgrösse für die Rechnung. 7 Kapitel III. Integralrechnung 2 Der Hauptsatz der Infinitesimalrechnung Unser nächstes Ziel ist es, den sogenannten Hauptsatz der Infinitesimalrechnung herzuleiten, welcher auf völlig überraschende Weise das bestimmte Integral mit der Differentialrechnung verbindet. Dazu brauchen wir einige Vorbereitungen. Es sei m das globale Minimum und M das globale Maximum der Funktion f auf dem Intervall [a, b]. Dann gilt auf den Intervall [a, b] m ≤ f (x) ≤ M , M Fig. 1 : Mittelwertsatz der Integralrechnung m f (ξ) a ξ b und man erhält m(b − a) = Z b a m dx ≤ Z b a f (x) dx ≤ Z b a M dx = M (b − a) 8 U. Stammbach: Rb a m≤ Analysis, Teil A f (x) dx ≤M . b−a Da eine stetige Funktion nach dem Zwischenwertsatz (siehe Kapitel I, Abschnitt 4) jeden Wert zwischen m und M mindestens einmal annimmt, folgt aus dieser Überlegung das folgende Resultat. Mittelwertsatz der Integralrechnung Es existiert ξ in [a, b] mit (b − a)f (ξ) = Beispiel Z b a f (x) dx . In konkreten Fällen lässt sich ein solches ξ explizit angeben. Aus Z 0 b x2 dx = b3 3 folgt zum Beispiel f (ξ) = ξ 2 = b3 b2 = , 3b 3 √ so dass sich ξ = b 3/3 ergibt. Mit Hilfe des Mittelwertsatzes der Integralrechnung leiten wir jetzt den Hauptsatz der Infinitesimalrechnung her. Zu diesem Zweck betrachten wir eine auf dem Intervall [a, b] stetige Funktion f : x → f (x) und definieren eine Funktion Fa durch die Vorschrift Fa : x → Dann gilt (siehe Figur 2) Z x a f (t) dt, D(Fa ) = [a, b]. 9 Kapitel III. Integralrechnung Fig. 2 : Hauptsatz der Infinitesimalrechnung a x dFa (x) = dx ξ x+h Fa (x + h) − Fa (x) h→0 h ! Z x Z x+h 1 = lim f (t) dt − f (t) dt h→0 h a a lim 1 = lim h→0 h Z x+h x f (t) dt . Nach dem Mittelwertsatz der Integralrechnung existiert nun ein ξ zwischen x und x + h mit der Eigenschaft 1 h Z x+h x f (t) dt = f (ξ) . Damit erhalten wir dFa (x) = lim f (ξ) = lim f (ξ) = f (x) , h→0 ξ→x dx 10 U. Stammbach: Analysis, Teil A weil mit h → 0 die Grösse ξ gegen x strebt und weil f stetig ist. Damit haben wir die folgende Aussage erhalten. Hauptsatz der Infinitesimalrechnung (I. Newton 1642 - 1727, G.F. Leibniz 1646-1716) Die Ableitung eines bestimmten Integrals über eine stetige Funktion f nach der oberen Integrationsgrenze ist gleich dem Wert des Integranden an dieser Grenze: d dx Z x a f (t)dt = f (x) . Eine Funktion F : x → F (x) mit F 0 (x) = f (x) heisst eine Stammfunktion von f : x → f (x). Laut dem Hauptsatz der Infinitesimalrechnung existiert zu einer stetigen Funktion f : x → f (x) immer (mindestens) eine Stammfunktion nämlich Fa : x → Z x a f (t) dt . • Ist F : x → F (x) eine Stammfunktion von f : x → f (x), so ist auch F + C : x → F (x) + C eine Stammfunktion von f : x → f (x). • Sind F : x → F (x) und G : x → G(x) Stammfunktionen von f : x → f (x), so gibt es eine reelle Konstante C mit G(x) ≡ F (x) + C. Beispiel Die Funktionen F : x → sin2 x und G : x → − 12 cos 2x haben beide die Ableitung F 0 (x) = G0 (x) = 2 sin x cos x . Es sind also sowohl F wie G Stammfunktionen von f : x → 2 sin x cos x. Sie unterscheiden sich deshalb nur um eine additive Konstante C: 1 G(x) ≡ − cos 2x ≡ sin2 x + C ≡ F (x) + C . 2 Setzt man x = 0, so erhält man C = −1/2. Damit haben wir die (bekannte) Identität 1 sin2 x ≡ (1 − cos 2x) 2 bewiesen. 11 Kapitel III. Integralrechnung Der Hauptsatz der Infinitesimalrechnung zusammen mit den obigen Bemerkungen liefert die Möglichkeit, bestimmte Integrale auf sehr einfache Weise zu berechnen. Mit unseren Bezeichnungen ist Z b a f (t) dt = Fa (b) . Ist nun F : x → F (x) irgendeine Stammfunktion von f : x → f (x), so gilt nach obigem Fa (x) ≡ F (x) + C . In dieser Gleichung kann man die Konstante C bestimmen, indem man x = a setzt; dann R gilt nämlich Fa (a) = aa f (t) dt = 0, und es folgt C = −F (a). Man erhält für den Wert des bestimmten Integrals die Formel Fa (b) = Z b a f (t) dt = F (b) − F (a). Damit haben wir die folgende zentrale Aussage der Infinitesimalrechnung bewiesen, welche die Berechnung bestimmter Integrale auf die Berechnung einer Stammfunktion des Integranden reduziert. Satz Ist f : x → f (x) eine auf [a, b] stetige Funktion und ist F : x → F (x) eine Stammfunktion von f , so gilt Z b a f (t) dt = F (b) − F (a) . Für die Differenz F (b) − F (a) schreiben wir im folgenden oft kurz [F (x)]ba oder F (x)|ba . Beispiel Z b a " x3 x dx = 3 2 #b = a b3 a3 − . 3 3 Beispiel Z 0 π/2 π/2 sin x dx = [− cos x]0 = − cos(π/2) − (− cos 0) = 0 + 1 = 1 . 12 3 U. Stammbach: Analysis, Teil A Das Integrieren Es sei f : x → f (x) eine auf [a, b] stetige Funktion. Die Menge ihrer Stammfunktionen bezeichnen wir mit dem Symbol Z f (x) dx . Sie heisst oft in etwas unglücklicher Weise das unbestimmte Integral von f : x → f (x). Der Übergang von f zu seinem Integral heisst Integrieren. Da das Integrieren die Umkehroperation des Differenzierens ist, liefert jede Ableitungsregel eine Regel für das Integrieren. Wir halten die folgenden explizit fest: Z xn dx = Z xn+1 + C , falls n 6= −1 n+1 1 dx = log |x| + C Z x ex dx = ex + C Z Z sin x dx = − cos x + C cos x dx = sin x + C Z 1 dx sin2 x Z 1 dx cos2 x Z dx √ 1 − x2 Z 1 dx 2 Z1+x = −cot x + C = tan x + C = arcsin x + C = arctan x + C sinh x dx = cosh x + C Z Z cosh x dx = sinh x + C √ dx x2 + 1 = Arsinh x + C = log(x + p x2 + 1) + C 13 Kapitel III. Integralrechnung Z Z Z √ dx x2 − 1 = Arcosh x + C = log(x + p x2 − 1) + C tan x dx = − log | cos x| + C cot x dx = log | sin x| + C In vielen Fällen lassen sich Integrale von komplizierten Funktionen finden, indem man versucht, das Problem auf diese oben angeführte Standardintegrale zurückzuführen. Dabei benützt man unter anderem die (offensichtlichen) Rechenregeln: Z (f (x) + g(x)) dx = Z Z Z c f (x) dx = c f (x) dx + Z Z g(x) dx f (x) dx , c ∈ R g0 (f (x)) · f 0 (x) dx = g(f (x)) + C Beispiel Z sin3 x dx = Z Z = sin x(1 − cos2 x)dx sin x dx + = − cos x + Z (− sin x) cos2 x dx cos3 x +C 3 Beispiel Z √ ax + b dx = 2 (ax + b)3/2 + C 3a Beispiel Z √ x dx = (x2 + 1)1/2 + C . +1 x2 In konkreten Fällen ist es manchmal recht schwierig, die Stammfunktion zu finden. Dies liegt einmal daran, dass es keine einfache Methode gibt, welche in allen vernünftigen Fällen eine 14 U. Stammbach: Analysis, Teil A Stammfunktion liefert. Ferner gibt es verhältnismässig einfache Funktionen, deren Stammfunktion sich nicht auf elementare Weise ausdrücken lassen. Als Beispiel erwähnen wir die Funktion 2 x → e−x . Diese ist natürlich stetig, besitzt also sicherlich eine Stammfunktion. Mit starken mathematischen Mittel kann man beweisen, dass sich diese Stammfunktion nicht durch eine gewöhnliche Formel beschreiben lässt, in der nur Potenzfunktionen, trigonometrische Funktionen, Exponentialfunktionen und zu diesen inverse Funktionen vorkommen: sie ist nicht elementar ausdrückbar. Es ist zwar klar, dass es neben den elementar ausdrückbaren Funktionen noch andere Funktionen geben muss, dass aber darunter sogar Funktionen zu finden sind, die als Stammfunktionen von elementar ausdrückbaren Funktionen auftreten, ist doch eine recht überraschende Tatsache. Trotz all dieser Schwierigkeiten kennt man eine Anzahl Techniken, die beim Integrieren nützlich sind; wir besprechen in den folgenden zwei Abschnitten zwei davon, nämlich die Methode der partiellen Integration und die Methode der Substitution. 15 Kapitel III. Integralrechnung 4 Die Methode der partiellen Integration Die Methode der partiellen Integration ist die Umkehrung der Ableitungsregel für ein Produkt von Funktionen. Sind u : x → u(x) und v : x → v(x) zwei Funktionen, so gilt (u · v)0 = u0 · v + u · v 0 . Es folgt daraus uv + C = Z (u · v)0 dx = Z u0 v dx + Z uv 0 dx und damit Z u0 v dx = uv − Z uv 0 dx . Wir sehen die Nützlichkeit dieser Formel in den folgenden Beispielen. Beispiel Im Integral Z xex dx setzten wir u0 (x) = ex , u(x) = ex , v(x) = x , v 0 (x) = 1 . Dann liefert die Formel für die partielle Integration Z xex dx = xex − Z 1 · ex dx = xex − ex + C = (x − 1)ex + C . 16 U. Stammbach: Analysis, Teil A Wählen wir die Funktionen u, v anders, setzen wir u0 (x) = x , u(x) = x2 /2 , v(x) = ex , v 0 (x) = ex , so erhalten wir Z x xe dx = Z x2 x e − 2 x2 x e dx . 2 Hier ist das Integral auf der rechten Seite der Gleichung offenbar komplizierter als das Ausgangsintegral; die partielle Integration läuft in der verkehrten Richtung und hilft anscheinend nicht weiter. Immerhin können wir an der letzten Gleichung ablesen Z 2 x 2 x x e dx = x e − 2 Z xex dx = x2 ex − 2xex + 2ex + C = (x2 − 2x + 2)ex + C , so dass unsere Arbeit doch nicht ganz nutzlos war. Beispiel Im Integral Z sin2 x dx setzen wir u0 (x) = sin x , u(x) = − cos x , v(x) = sin x , v 0 (x) = cos x , und erhalten Z sin2 x dx = − sin x cos x + = − sin x cos x + Z Z cos2 x dx (1 − sin2 x) dx = − sin x cos x + x − Z sin2 x dx . 17 Kapitel III. Integralrechnung Wiederum scheint die partielle Integration nicht zum Ziele geführt zu haben, tritt doch auf der rechten Seite das Ausgangsintegral noch einmal auf. Schaut man allerdings näher hin, so R 2 sieht man, dass eine Gleichung für die unbekannte Grösse sin x dx vorliegt, die sich ohne Schwierigkeiten auflösen lässt: Z sin2 x dx = 1 (x − sin x cos x) + C. 2 Auf analoge Weise erhält man Z cos2 x dx = 1 (x + sin x cos x) + C, 2 ein Resultat, das sich aus obigem auch mit cos2 x = 1 − sin2 x herleiten lässt. Beispiel Im Integral Z eax cos bx dx mit a, b ∈ R setzen wir u0 (x) = eax , u(x) = eax /a , v(x) = cos bx , v 0 (x) = −b sin bx . Dies liefert Z ax e 1 b cos bx dx = eax cos bx + a a Z eax sin bx dx . Setzt man im verbleibenden Intregral u0 (x) = eax , u(x) = eax /a , v(x) = sin bx , v 0 (x) = b cos bx , so erhält man im zweiten Schritt Z eax cos bx dx = 1 ax b e cos bx + a a 1 ax b e sin bx − a a Z eax cos bx dx . 18 U. Stammbach: Analysis, Teil A Wie im letzten Beispiel hat man eine Gleichung für die unbekannte Grösse vor sich, die sich leicht auflösen lässt: Z eax cos bx dx = a2 1 eax (a cos bx + b sin bx) + C . + b2 Beispiel Z log x dx = Z 1 · log x dx = x log x − Z 1 x dx = x (log x − 1) + C. x Dabei haben wir u0 (x) = 1 , u(x) = x , v(x) = log x , v 0 (x) = 1/x gesetzt. Beispiel Z arctan x dx = x · arctan x − 1 2 Z 2x 1 dx = x · arctan x − log(1 + x2 ) + C . 2 1+x 2 Dabei haben wir, ähnlich wie im letzen Beispiel, u0 (x) = 1 , u(x) = x, 0 v(x) = arctan x , v (x) = 1/(1 + x2 ) gesetzt. Ausserden haben wir im verbleibenden Integral den Bruch mit 2 erweitert, um zu erreichen, dass im Zähler gerade die Ableitung des Nenners steht. 19 Kapitel III. Integralrechnung 5 Die Methode der Substitution Die effiziente Handhabung der partiellen Integration lernt man durch intensives Üben. Gleiches gilt in noch vermehrtem Masse für die Methode der Substitution. Wir beschränken uns in dieser kurzen Darstellung im wesentlichen auf Beispiele (das Üben überlassen wir wie üblich dem Leser!) und verzichten auch auf eine vollständige Begründung der Methode. (Dies ist übrigens trotz der Einfachheit der zugrunde liegenden Idee recht umständlich.) Immerhin wollen wir festhalten und auch begreiflich machen, dass die Methode der Substitution für die Integration das Pendant der Kettenregel der Differentiation ist, wie die Methode der partiellen Integration dasjenige der Produktregel. Beispiel Im Integral I= Z sinn x cos x dx substituieren wir als neue Funktion u(x) = sin x. Dann ist u0 (x) = cos x, so dass sich das Integral I in der Form I= Z (u(x))n u0 (x) dx schreiben lässt. Die Funktion x → U (x) = 1 (u(x))n+1 n+1 ist dann eine Stammfunktion von ((u(x))n u0 (x), wie man durch Ableiten mit Hilfe der Kettenregel sofort bestätigt. Wir erhalten demzufolge I= Z sinn x cos x dx = 1 sinn+1 x + C . n+1 Man liest an diesem Beispiel ab, dass sich eine Substitution einer Funktion u(x) besonders dann aufdrängt, wenn der Integrand u0 (x) als Faktor enthält. Mit der – man kann nicht anders sagen – raffinierten Notation, die von Leibniz eingeführt worden ist, lässt sich im übrigen der Gang der Rechnung in abgekürzter Weise einfach darstellen. Man fasst dabei – rein formal – du = u0 (x) dx als das “Differential” der Funktion u auf. 20 Es sei I = U. Stammbach: R Analysis, Teil A sinn x cos x dx. Mit u(x) = sin x, du = u0 (x) dx = cos x dx, wird daraus Z I= un du = 1 un+1 + C . n+1 Die “Rücksubstitution” liefert dann I= 1 sinn+1 x + C . n+1 R Beispiel Für das Integral I = x sin(x2 ) dx wählt man die Substitution u = x2 . Daraus folgt du = 2x dx, d.h. x dx = du/2 und man erhält 1 I= 2 Z 1 sin u du = − cos u + C . 2 Die “Rücksubstitution” liefert dann 1 I = − cos(x2 ) + C . 2 Neben dieser direkten Art, eine Substitution zu verwenden, gibt es auch eine, die in der “umgekehrten Richtung” verläuft. Auch dazu einige Beispiele: Beispiel Im Integral I= Z p 1 − u2 du substituieren wir u = sin x, du = cos x dx. Dann erhalten wir wegen 1 − u2 = 1 − sin2 x = cos2 x Z cos x cos x dx = Z 1 cos2 x dx = (x + sin x cos x) + C . 2 Die ”Rücksubstitution” liefert I= p 1 arcsin u + u 1 − u2 + C . 2 21 Kapitel III. Integralrechnung Den Leser mag einwenden – und dies mit vollem Recht –, dass wir in diesem Beispiel an zwei Stellen nicht ganz “sauber” gerechnet haben: wir haben ohne Rücksicht auf das Vorzeichen von cos x cos x = q 1 − sin2 x gesetzt, und wir haben ohne Rücksicht auf den Wertebereich von arcsin x = arcsin (sin x) gesetzt. Beide Gleichungen gelten ja nur unter zusätzlichen Bedingungen, etwa 0 ≤ x ≤ π/2. Unsere forsche Art zu rechnen entspricht an dieser Stelle guter Praxis: es ist bei der Methode der Substitution in der Regel einfacher, Gleichungen wie die obige ohne Rücksicht auf den eingeschränkten Gültigkeitsbereich zu benützen, und dann am Schluss zu verifizieren, dass das erhaltene Resultat allgemein, d.h. für alle x gültig ist. Letzteres (also die Kontrolle) sollte man allerdings immer durchführen: p d 1 1 ( arcsin u + u 1 − u2 ) = du 2 2 p 1 u2 √ + 1 − u2 − √ 1 − u2 1 − u2 ! = p 1 − u2 . R√ Beispiel Im Integral I = x2 + 1 dx setzt man x = sinh t, dx = cosh t dt und erhält wegen 2 2 sinh t + 1 = cosh t das Integral I = Z cosh t · cosh t dt , welches man mit partieller Integration weiter behandeln kann. Setzt man u0 (t) = cosh t , u(t) = sinh t , v(t) = cosh t , v 0 (t) = sinh t , so folgt I = sinh t · cosh t − Z sinh2 t dt . Wegen sinh2 t = cosh2 t − 1 erhält man dann eine Gleichung für I, die sich leicht auflösen lässt: 22 U. Stammbach: I = 1 (t + sinh t cosh t) + C . 2 p sinh2 t + 1 Die Rücksubstitution liefert wegen cosh t = I = Analysis, Teil A p 1 ( Arsinh x + x x2 + 1) + C ; 2 ein Resultat, welches man leicht durch Ableiten bestätigt. Auf analoge Weise wie in den obigen Beispielen erhält man das folgende Integral Z p x2 − 1 dx = Beispiel p 1 (− Arcosh x + x x2 − 1) + C . 2 Man berechne den Flächeninhalt F der Ellipse mit Halbachsen a, b. Die obere Hälfte der Ellipsenperipherie ist als Graph der Funktion q f : x → b 1 − x2 /a2 , D(f ) = [−a, +a] gegeben. Um die ganze Ellipsenfläche F zu bestimmen, genügt es offenbar, die Fläche F/4 des Ellipsenviertels im ersten Quadranten auszurechnen F = 4 Z a 0 b q 1 − x2 /a2 dx . Für das unbestimmte Integral I= Z b q 1 − x2 /a2 dx bietet sich die Substitution x = a sin t, dx = a cos t dt an. Man erhält damit nach einem der obigen Resultate Z ab cos2 t dt = ab (t + sin t cos t) + C 2 23 Kapitel III. Integralrechnung und nach der Rücksubstitution ab x I= arcsin 2 a xq + 1 − x2 /a2 + C . a Einsetzen der Grenzen liefert dann F ab x = 4· arcsin 2 a ab π = 4· · 2 2 = πab . xq + 1 − x2 /a2 a a 0 Neben diesem etwas umständlichen Weg gibt es auch die Möglichkeit, die Substitution direkt im bestimmten Integral durchzuführen, d.h. die Substitution auch auf die Integrationsgrenzen wirken zu lassen. Für die untere Grenze x = 0 erhält man t = 0, für die obere x = a erhält man t = π/2. Man hat somit F = 4 Z 0 a b q 1− x2 /a2 dx = Z π/2 0 ab cos2 t dt = π ab , 4 F = πab . Bei der Berechnung der Wirkung der Substitution auf die Integrationsgrenzen müssen den Integrationsgrenzen in x in eindeutiger Weise Integrationsgrenzen in t zugeordnet werden können. Dies ist nur dann gewährleistet, wenn man bei der Substitution für die ursprüngliche Integrationsvariable eine injektive Funktionen verwendet. Möglicherweise muss man dabei den (sonst üblichen) Definitionsbereich der Substitutionsfunktion einschränken. In unserem Fall müssen wir dies in der Tat tun: der Definitionsbereich der Funktion t → x = a sin t wird auf das Intervall [0, π/2] eingeschränkt, dort ist die Funktion injektiv und den Integrationsgrenzen in x können eindeutig Integrationsgrenzen in t zugeordnet werden. Die Wirkung der Substitution auf die Integrationsgrenzen wird vom Anfänger gerne vergessen; man achte also besonders auf diesen Punkt. 24 6 U. Stammbach: Analysis, Teil A Einige weitere Beispiele In diesem Abschnitt beschäftigen wir uns im wesentlichen mit den Integralen über Potenzen der Sinus- bzw. der Cosinus-Funktion und mit Integralen über rationale Funktionen. In beiden Gebieten begnügen wir uns mit Beispielen. In Anwendungen treten oft die bestimmten Integrale In = Z π/2 0 sinn x dx , Jn = Z π/2 0 cosn x dx für n = 0, 1, 2, . . . auf. Diese Integrale wollen wir im ersten Teil dieses Abschnittes berechnen. Wir beschäftigen uns zuerst mit dem unbestimmten Integral Z sinn x dx . Für kleine Werte von n ist uns das Resultat natürlich bekannt; wir haben n=0 : n=1 : n=2 : Z 1 dx = x + C Z sin x dx = − cos x + C Z sin2 x dx = 1 (x − sin x cos x) + C 2 Eine Stammfunktion für x → sinn x in geschlossener Form anzugeben ist – wie man ohne grosse Mühe einsieht – nicht einfach. Hingegen lässt sich sehr leicht eine Rekursionsformel angeben. Dazu behandeln wir das Integral Z n sin x dx = Z sinn−1 x sin x dx mit partieller Integration; wir setzen u0 (x) = sin x , u(x) = − cos x , n−1 0 v(x) = sin x , v (x) = (n − 1) sinn−2 x cos x . 25 Kapitel III. Integralrechnung Dann erhalten wir Z sinn x dx = − cos x sinn−1 x + (n − 1) n−1 = − cos x sin Z sinn−2 x cos2 x dx Z x + (n − 1) sin n−2 x dx − Z n sin x dx . Die Gleichung lässt sich natürlich auflösen: Z 1 n−1 sin x dx = − cos x sinn−1 x + n n n Z sinn−2 x dx . Fig. 1 : Potenzen von sin x sin2 x sin5 x Man kann diese Formel verwenden, um rekursiv die Folge der Stammfunktionen von x → sinn x zu berechnen. Wir überlassen dies dem Leser und wollen hier zum ursprünglich gestellten Problem zurückkehren, nämlich zum Problem, die bestimmten Integrale (siehe Figur 1) In = Z 0 π/2 sinn x dx und Jn = Z 0 π/2 cosn x dx 26 U. Stammbach: Analysis, Teil A zu berechnen. Wie bemerken als erstes, dass der Graph von x → sinn x durch Spiegelung an der Senkrechten x = π/4 in den Graphen von x → cosn x übergeht (siehe Figur 2). Daraus folgt sofort In = Jn . Es genügt also In auszurechnen. Nach obigem gilt I0 = π , I1 = 1 , 2 und aus der Rekursionsformel erhalten wir In = Z 0 π/2 Fig. 2 : Symmetrie y = sin2 x y = cos2 x 1 sinn x dx = − cos x sinn−1 x n π/2 0 + n−1 n Z 0 π/2 sinn−2 x dx = n−1 · In−2 . n Mit Hilfe dieser Formel lassen sich die Werte In sogar in geschlossener Form angeben. Offenbar haben wir zwischen geraden und ungeraden Indizes n zu unterscheiden: I0 = π 1 π 3 1 π 5 3 1 π , I2 = · , I4 = · · , I6 = · · · , . . . 2 2 2 4 2 2 6 4 2 2 27 Kapitel III. Integralrechnung I2k = I1 = 1 , I3 = 1 · 3 · 5 · 7 · · · (2k − 1) π · 2 · 4 · 6 · 8 · · · 2k 2 2 4 2 6 4 2 , I5 = · , I7 = · · , . . . 3 5 3 7 5 3 I2k+1 = 2 · 4 · 6 · 8 · · · 2k 3 · 5 · 7 · · · (2k + 1) Aus diesen Resultaten lässt sich eine überraschende und historisch interessante Formel herleiten, nämlich die Formel von Wallis (J. Wallis 1616-1703). Im Intervall [0, π/2] gilt natürlich die Ungleichung 0 ≤ sin x ≤ 1 . Daraus folgt für k = 1, 2, 3, . . . sin2k−1 x ≥ sin2k x ≥ sin2k+1 x und durch Integration I2k−1 ≥ I2k ≥ I2k+1 . Division durch den (positiven) Wert I2k+1 liefert I2k−1 I2k ≥ ≥1. I2k+1 I2k+1 Nun gilt nach unserer Rekursionsformel I2k+1 = 2k I2k−1 , 2k + 1 so dass I2k−1 2k + 1 = lim = 1. k→∞ I2k+1 k→∞ 2k lim Daraus folgt 28 U. Stammbach: I2k lim k→∞ I2k+1 Analysis, Teil A = 1, d.h. lim k→∞ 1·3·3·5·5·7·7 · · · (2k − 1)(2k − 1)(2k + 1) π = 1. 2·2·4·4·6·6·8·8 · · · (2k)(2k) 2 Dies liefert unmittelbar die überraschende Formel von Wallis 2·2·4·4·6·6·8·8 · · · (2k)(2k) π = , k→∞ 1·3·3·5·5·7·7 · · · (2k − 1)(2k − 1)(2k + 1) 2 lim welche auf merkwürdige Weise die geraden und die ungeraden ganzen Zahlen mit der irrationalen Zahl π in Verbindung bringt. Beispiel Das Integral Z I= a 0 p x2 a2 − x2 dx tritt bei der Berechnung des Flächenträgheitsmomentes einer Kreisscheibe um ihren Durchmesser auf. Die Substitution x = a sin t, dx = a cos t dt mit gleichzeitiger Transformation der Integrationsgrenzen liefert I Z = π/2 0 4 = a 4 = a = Z a2 sin2 t a2 cos2 t dt π/2 0 (sin2 t − sin4 t) dt 1 π 1 3 π · − · · 2 2 2 4 2 π 4 a . 16 Im Rest dieses Abschnittes beschäftigen wir uns noch mit der Integration von rationalen Funktionen. Für dieses Gebiet gibt es eine ausgebaute Theorie. Wir wollen uns in dieser Vorlesung aber mit einigen Beispielen begnügen. 29 Kapitel III. Integralrechnung Beispiel Es ist das Integral Z dx x2 − 6x + 5 zu berechnen. Man sieht leicht, dass die quadratische Nennerfunktion die Nullstellen 5 und 1 hat. Die hier nicht behandelte Theorie der Partialbrüche besagt, dass sich die rationale Funktion x2 1 − 6x + 5 in der Form A B + x−5 x−1 mit reellen Zahlen A und B schreiben lässt. Diese Zahlen lassen sich aus der Identität 1 A B ≡ + x2 − 6x + 5 x−5 x−1 leicht bestimmen. Bringt man nämlich die rechte Seite auf einen einzigen Bruchstrich, so erhält man x2 1 A(x − 1) + B(x − 5) ≡ . − 6x + 5 (x − 5)(x − 1) Die Tatsache, dass die Zählerfunktionen links und rechts übereinstimmen müssen, liefert für A und B die Gleichungen A + B = 0 −A − 5B = 1 Daraus ergibt sich sofort A = 1/4, B = −1/4. Es folgt . 30 U. Stammbach: Z Beispiel Z 1 dx = 2 x − 6x + 5 Analysis, Teil A 1 1 1 dx − 4 x−5 x−1 1 = (log |x − 5| − log |x − 1|) + C 4 x − 5 1/4 = log +C . x−1 Es ist das Integral Z 3x − 1 dx x2 − x + 1 zu berechnen. In einem ersten Schritt versucht man das Problem auf eine rationale Funktion zu reduzieren, deren Zähler eine Konstante ist. Wegen (x2 − x + 1)0 = 2x − 1 erhält man Z 3x − 1 dx = 2 x −x+1 = = Z 3 2x − 23 − 13 + 13 dx 2 x2 − x + 1 ! Z 1 3 2x − 1 3 dx + 2 x2 − x + 1 x2 − x + 1 Z 3 1 1 log |x2 − x + 1| + dx . 2 2 x2 − x + 1 Für die Behandlung des verbleibenden Integrals stellt man fest, dass die Nennerfunktion keine reellen Nullstellen hat. Man versucht deshalb dieses Integral auf den Standardtyp dieser Art, R nämlich auf 1/(u2 + 1) du zurückzuführen. Dies geschieht mit Hilfe der sogenannten quadratischen Ergänzung: x2 − x + 1 = x − 1 2 2 + 1 2 2 3 3 x− = q + 1 . 3 4 4 4 Macht man im Integral Z 1 4 dx = 2 x −x+1 3 Z 1 x− 21 p3 4 dx 2 +1 31 Kapitel III. Integralrechnung die Substitution 2 1 2 u= √ x− , du = √ dx , 2 3 3 so erhält man √ Z 4 3 1 2 du = √ arctan u + C . 2 3 2 u +1 3 Die Rücksubstitution liefert schliesslich Z 1 2 dx = √ arctan 2 x −x+1 3 was man leicht durch Ableiten bestätigt. 2 1 √ x− 2 3 +C , 32 7 U. Stammbach: Analysis, Teil A Flächenberechnung Der Ursprung des Begriffs des bestimmten Integrals ist zweifellos die Frage nach dem Flächeninhalt eines durch Kurven begrenzten Gebietes. Darüber hinaus haben sich im Laufe der Zeit viele weitere Anwendungen ergeben, die nichts mehr mit dem ursprünglichen Problem zu tun haben. Über solche Anwendungen werden die folgenden 6 Abschnitte handeln. In jedem Fall ist es die Riemann’sche Form der Definition des bestimmten Integrals, durch welche die Verbindung hergestellt wird. Im vorliegenden Abschnitt kehren wir zuerst noch einmal zum Problem der Flächenberechnung zurück. Ist eine Kurve K im (x, y)-Koordinatensystem gegeben so stellen wir die Frage nach dem Flächeninhalt I der Fläche unter der Kurve (siehe Figur 1). Ist K als Graph einer (stetigen) Funktion f gegeben, so ist I einfach der Wert des bestimmten Integrals I= Z b a f (x) dx . Es sei nun K durch eine Parameterdarstellung ~r : t → (x(t), y(t)) , tA ≤ t ≤ tB gegeben, wobei wir annehmen, dass die Funktionen t → x(t) , t → y(t) stetig differenzierbar sind, und dass im ganzen Intervall ẋ(t) > 0 gilt. Letztere Voraussetzung besagt, dass der Kurvenpunkt sich mit wachsendem t nach rechts bewegt, denn die Funktion t → x(t) ist monoton wachsend. Um den Flächeninhalt I zu bestimmen, approximieren wir die Fläche durch Rechtecke, welche zu einer Einteilung a = x 0 < x1 < · · · < x n = b des Intervalles [a, b] mit Zwischenpunkten ξk gehören, wobei wir die Zwischenpunkte ξk für unsere Zwecke geschickt wählen. Es sei tk für k = 0, 1, . . . , n der (eindeutig bestimmte) Parameterwert mit xk = x(tk ). Die Parameterwerte tk liefern wegen der Monotonität von t → x(t) eine Einteilung des Intervalles [tA , tB ] tA = t0 < t1 < · · · < tn = tB . In jedem Intervall [tk−1 , tk ] wählen wir mit Hilfe des Mittelwertsatzes der Differentialrechnung ein τk mit x(tk ) − x(tk−1 ) = ẋ(τk ) · (tk − tk−1 ) . 33 Kapitel III. Integralrechnung (x(t), y(t)) A B y(τ1 ) x(t0 ) x(τ1 ) y(τ2 ) x(t1 ) x(τ2 ) y(τ3 ) x(t2 ) Fig. 1 : Fläche unter der Kurve y(τ4 ) x(t3 ) x(t4 ) x(τ3 ) x(τ4 ) Natürlich gilt xk−1 = x(tk−1 ) ≤ x(τk ) ≤ x(tk ) = xk wiederum wegen der Monotonität der Funktion t → x(t). Die Werte ξk , ξk = x(τk ), k = 1, 2, . . . , n wählen wir als Zwischenpunkte für unsere Einteilung des Intervalles [a, b]. Für die Summe der Inhalte der zugehörigen Rechtecke erhalten wir dann y(τ1 )(x1 − x0 ) + y(τ2 )(x2 − x1 ) + · · · + y(τn )(xn − xn−1 ) = = y(τ1 )ẋ(τ1 )(t1 − t0 ) + y(τ2 )ẋ(τ2 )(t2 − t1 ) + · · · + y(τn )ẋ(τn )(tn − tn−1 ) . Letzteres ist aber gerade die Riemann’sche Summe für die Funktion t → y(t)ẋ(t), welche zur Einteilung tA = t0 < t1 < · · · < tn = tB des Intervalles [tA , tB ] mit Zwischenpunkten τk , k = 1, 2, . . . , n gehört. Laut Definition des bestimmten Integrals gilt somit für den gesuchten Flächeninhalt 34 U. Stammbach: I= Z tB tA Analysis, Teil A y(t) ẋ(t) dt . Diese mathematisch exakte, aber etwas langatmige Herleitung zeigt eindringlich die Nützlichkeit der Riemann’schen Definition des bestimmten Integrals. Mit etwas Erfahrung erlaubt sich der Anwender diese Formel auf heuristische Art wie folgt “herzuleiten”. Es gilt (siehe Figur 2) (x(t), y(t)) A B Fig. 2 : Fläche unter der Kurve dI y(t) x(tA ) x(t) ẋ(t)dt x(tB ) dI = y(t) dx . Mit dx = ẋ(t) dt erhält man dI = y(t) ẋ(t) dt und damit I= Z dI = Z tB tA y(t) ẋ(t) dt . Diese Art der Herleitung ist zwar kurz und einprägsam, der Unerfahrene macht aber bei solchen und ähnlichen Überlegungen gerne Fehler. Erst mit der Zeit entwickelt man ein intuitives Gefühl dafür, was für Manipulationen dieser Art erlaubt sind. 35 Kapitel III. Integralrechnung 2a Fig. 3 : Zykloide 2πa Beispiel Gesucht ist der Inhalt der Fläche unter einem Zykloidenbogen (siehe Figur 3). Die Zykloide ist gegeben durch die Parameterdarstellung t → (x(t), y(t)) = (at − a sin t, a − a cos t) , 0 ≤ t ≤ 2π . Der gesuchte Flächeninhalt I ist somit I = Z 2π 0 = a2 (a − a cos t)(a − a cos t) dt Z 2π 0 (1 − 2 cos t + cos2 t) dt = a2 (2π − 0 + π) = 3πa2 . Der Flächeninhalt ist also gerade dreimal so gross wie derjenige des Kreises, der die Zykloide erzeugt. Wird in der ursprünglichen Aufgabe die Kurve K mit wachsendem t von rechts nach links durchlaufen, d.h. gilt ẋ(t) < 0 für tA ≤ t ≤ tB , so liefert das Integral 36 U. Stammbach: I= Z tB tA Analysis, Teil A y(t) ẋ(t) dt offensichtlich den negativen Inhalt der Fläche unter der Kurve. Von dieser Bemerkung machen wir in der folgenden Anwendung Gebrauch. Oft ist man nicht am Inhalt der Fläche unter der Kurve sondern am Inhalt der Sektorfläche interessiert. In der Figur 4 liest man unmittelbar ab B Fig. 4 : Sektorfläche y(tB ) A y(tA ) x(tA ) IS = x(tB ) 1 1 x(tB ) y(tB ) − x(tA ) y(tA ) − 2 2 Z tB tA y(t) ẋ(t) dt . Nun gilt d x(t) y(t) = ẋ(t) y(t) + x(t) ẏ(t) , dt so dass wir schreiben können x(tB ) y(tB ) − x(tA ) y(tA ) = Z tB tA (ẋ(t) y(t) + x(t) ẏ(t)) dt . 37 Kapitel III. Integralrechnung Damit ergibt sich die folgende Formel für die Sektorfläche IS = 1 2 Z tB tA (x(t) ẏ(t) − ẋ(t) y(t)) dt . Eine genaue Analyse zeigt, dass dieses Integral einen positiven Wert liefert, wenn die Sektorfläche links von der Kurve liegt (wie in der Figur 4) und einen negativen Wert, wenn die Sektorfläche rechts von der Kurve liegt. Beispiel Gesucht ist die Ellipsenfläche F . Die Ellipse mit Halbachsen a und b und Mittelpunkt O ist durch die Parameterdarstellung t → (x(t), y(t)) = (a cos t, b sin t) , 0 ≤ t ≤ 2π gegeben. Die Ellipsenfläche kann als Sektorfläche angesehen werden, wenn t von 0 bis 2π variiert. Wir erhalten F = 1 2 Z 2π 0 1 (ab cos2 t + ab sin2 t) dt = ab2π = abπ . 2 Beispiel Die Parameterdarstellung t → (x(t), y(t)) = (cosh t, sinh t) beschreibt bekanntlich den rechten Ast einer Hyperbel. Gesucht ist die Sektorfläche H, die zu den Punkten mit t = 0 und t = T gehört. Wir erhalten 1 H= 2 Z 0 T 1 (cosh t − sinh t) dt = 2 2 2 Z 0 T 1 dt = 1 T . 2 Dieses Resultat ist natürlich der Grund für die Tatsache, dass die Umkehrfunktionen Arcosh und Arsinh von cosh und sinh “Area”-Funktionen genannt werden (Area = Flächeninhalt). Ist schliesslich die Kurve K durch Polarkoordinaten ρ, ϕ gegeben, so lässt sich die entsprechende Formel für den Inhalt der Sektorfläche zwischen ϕA und ϕB sehr leicht herleiten. Man geht von der Darstellung durch Polarkoordinaten einfach zur zugehörigen Parameterdarstellung über. Es sei K durch die Gleichung ρ = ρ(ϕ) gegeben. Dann ist ϕ → (x(ϕ), y(ϕ)) = (ρ(ϕ) cos ϕ, ρ(ϕ) sin ϕ) die zugehörige Parameterdarstellung mit Parameter ϕ, und man erhält für den Inhalt der Sektorfläche 38 U. Stammbach: √ − 2c √ 2c IS Analysis, Teil A Fig. 5 : Lemniskate Z = = = 1 ϕB (xẏ − ẋy) dϕ 2 ϕA Z 1 ϕB (ρ cos ϕ(ρ̇ sin ϕ + ρ cos ϕ) − (ρ̇ cos ϕ − ρ sin ϕ)ρ sin ϕ) dϕ 2 ϕA Z ϕB 1 ρ2 dϕ . 2 ϕA √ √ Beispiel Die Gleichung ρ = 2 c cos 2ϕ in Polarkoordinaten stellt eine sogenannte Lemniskate (siehe Figur 5) dar. Der Inhalt des durch die zu −π/4 ≤ ϕ ≤ π/4 gehörigen Kurve eingeschlossenen Flächenstücks ergibt sich nach obigem zu IS = 1 2 Z +π/4 −π/4 2c2 cos 2ϕ dϕ = c2 . 39 Kapitel III. Integralrechnung 8 Bogenlänge Eine Kurve K im Raum lässt sich mit Hilfe einer Parameterdarstellung ~r : t → ~r(t) = (x(t), y(t), z(t)), tA ≤ t ≤ tB beschreiben. In natürlicher Weise tritt eine solche Parameterdarstellung etwa auf, wenn die ~ = ~r(t) den Ort, Bewegung eines Massenpunktes beschrieben werden soll; dann bezeichnet OP ˙ an dem sich der Massenpunkt zur Zeit t befindet. Bekanntlich ist dann ~r(t) die (vektorielle) Geschwindigkeit des Massenpunktes zur Zeit t. Ist die Bahn des Massenpunktes bekannt, so ist es naheliegend, nach der Länge des zurückgelegten Weges zu fragen, d.h. nach der Bogenlänge der Kurve K. Damit wollen wir uns in diesem Abschnitt befassen. Wir definieren die Bogenlänge der Kurve K durch das Integral sB A = Z tB tA q (ẋ(t))2 + (ẏ(t))2 + (ż(t))2 dt = Z tB tA |~r˙ (t)| dt . Dass diese Definition vernünftig ist, zeigt die folgende heuristische Überlegung. “Im Kleinen” kann die Kurve K als Teil einer Geraden aufgefasst werden, dessen Länge sich als Diagonale in einem Quader mit den Seitenlängen dx, dy, dz leicht zu ds = q dx2 + dy 2 + dz 2 berechnet. Setzt man die Koordinatendifferenzen dx, dy, dz wie üblich den Differentialen gleich dx = ẋ(t)dt , dy = ẏ(t)dt , dz = ż(t)dt , so erhält man ds = q (ẋ(t))2 + (ẏ(t))2 + (ż(t))2 dt . Die Länge eines “endlichen” Kurvenstücks ergibt sich dann durch Integration, d.h. durch Summierung der “infinitesimalen” Anteile. Dies liefert das oben angegeben Integral. Bemerkung Wir haben hier mit Absicht nicht von einer Herleitung gesprochen. Eine genauere Analyse zeigt nämlich, dass dem Begriff der Bogenlänge einer Kurve erst mit der angegebenen 40 U. Stammbach: Analysis, Teil A Formel überhaupt einen Inhalt erhält. Um der logischen Korrektheit Genüge zu tun, muss der Mathematiker an dieser Stelle zeigen, dass die heuristisch gefundene Formel sinnvoll ist. Dazu gehört zum Beispiel die Tatsache, dass die durch diese Formel gelieferte Bogenlänge unter vernünftigen Bedingungen nicht von der gewählten Parametrisierung der Kurve abhängig ist. Auf diese Probleme wollen wir hier natürlich nicht eingehen; wir überlassen sie gerne den Mathematikern. Beispiel Gesucht ist die Länge eines Zykloidenbogens. Der Zykloidenbogen ist durch t → (x(t), y(t)) = (at − a sin t, a − a cos t) , 0 ≤ t ≤ 2π gegeben, mit tA = 0, tB = 2π. Wir erhalten ẋ(t) = a − a cos t, ẏ(t) = a sin t und damit sB A Z = 2π 0 = a = a Z 0 Z (a2 − 2a2 cos t + a2 cos2 t + a2 sin2 t)1/2 dt 2π 2π 0 Z = 2a Z = 2a (2(1 − cos t))1/2 dt q 2π 0 0 2π 4 sin2 (t/2) dt | sin(t/2)| dt sin(t/2) dt = 2a [−2 cos(t/2)]2π 0 = 2a(2 + 2) = 8a . Man stellt die überraschende Tatsache fest, dass beim Rollen eines Kreises auf einer Geraden der von einem Punkt der Kreisperipherie zurückgelegte Weg ein ganzzahliges Vielfaches des Radius des Kreises ist. Beispiel Die Astroide (siehe Figur 1) ist gegeben durch die Parameterdarstellung t → (x(t), y(t)) = (a cos3 t, a sin3 t) , 0 ≤ t ≤ 2π . Gesucht ist die Bogenlänge der Kurve. Wegen ẋ(t) = −3a cos2 t sin t, ẏ(t) = 3a sin2 t cos t und wegen der offensichtlichen Symmetrie der Kurve erhält man für die Bogenlänge 41 Kapitel III. Integralrechnung a Fig. 1 : Astroide a −a −a L = 4 Z π/2 0 = 4·3·a = q 3a cos4 t · sin2 t + sin4 t · cos2 t dt Z π/2 0 2 π/2 6a [sin t]0 q cos t sin t cos2 t + sin2 t dt = 6a . Wiederum ist überraschenderweise die Länge der Kurve ein ganzzahliges Vielfaches der in der Parameterdarstellung vorkommenden Grösse a. Ist die Kurve K in expliziter Form y = f (x) gegeben, so gehen wir wie üblich im ersten Schritt zur zugehörigen Parameterdarstellung x → (x, f (x)) über. Wir erhalten dann für die Bogenlänge zwischen den Punkten A und B sB A = Z xB xA q 1 + (f 0 (x))2 dx , wobei xA die x-Koordinate des Punktes A und xB diejenige des Punktes B bezeichnet. 42 U. Stammbach: Analysis, Teil A Beispiel Man bestimme die Länge der Kurve y = x2 zwischen den Punkten A = (−1, 1) und B = (1, 1). Nach obigem gilt sB A = Z p 1 1 + 4x2 dx = 2 −1 Z 1p 1 + 4x2 dx . 0 Für das Integral machen wir die Substitution 2x = u, 2dx = du und erhalten sB A = = = Z 2p 1 + u2 du 0 i2 p 1h Arsinh u + u u2 + 1 0 2 √ 1 Arsinh 2 + 2 5 . 2 Schliesslich behandeln wir noch den Fall, wo die Kurve K durch eine Gleichung in Polarkoordinaten gegeben ist. Ähnlich wie oben gehen wir in einem ersten Schritt zur zugehörigen Parameterdarstellung mit Parameter ϕ über. Wir erhalten nach kurzer Rechnung ~r˙ (ϕ) = (ρ̇(ϕ) cos ϕ − ρ(ϕ) sin ϕ, ρ̇(ϕ) sin ϕ + ρ(ϕ) cos ϕ) |~r˙ (ϕ)| = (ρ̇2 cos2 ϕ − 2ρ̇ρ cos ϕ sin ϕ + ρ2 sin2 ϕ + ρ̇2 sin2 ϕ + 2ρ̇ρ sin ϕ cos ϕ + ρ2 cos2 ϕ)1/2 = (ρ2 + ρ̇2 )1/2 . Damit ergibt sich Z sB A = q ϕB ρ2 + ρ̇2 dϕ . ϕA Beispiel Man berechne die Bogenlänge der logarithmischen Spirale ρ = ekϕ zwischen den Punkten A und B (siehe Figur 2). Aus der obigen Überlegung erhalten wir mit ρ̇(ϕ) = k · ekϕ sB A = = = Z ϕB p ϕA e2kϕ + k2 e2kϕ dϕ p Z p 1 + k2 1+ k2 ϕB ϕA ekϕ dϕ 1 kϕ e k ϕB ϕA 43 Kapitel III. Integralrechnung q = 1 + 1/k2 q ekϕB − ekϕA 1 + 1/k2 (ρB − ρA ) . = B Fig. 2 : Logarithmische Spirale ϕB ϕA 1 A Wiederum hat die logarithmische Spirale eine Überraschung für uns bereit: Das Resultat besagt, dass sich in Kreisringen gleicher Breite b = ρB −ρA gleichlange Kurvenstücke der logarithmischen Spirale befinden. Beispiel Wir betrachten zum Schluss dieses Abschnittes die sogenannte Klotoide; sie wird durch die Parameterdarstellung t → (x(t), y(t)), beschrieben, wobei x(t) und y(t) durch die (komplizierten) Formeln Z t a 2 x(t) = cos u du , 2 0 Z t a 2 y(t) = sin u du . 2 0 gegeben sind. (Man beachte, dass u eine Integrationsvariable ist, der Kurvenparameter heisst wie üblich t.) Wie man zeigen kann, sind die hier vorkommenden Integrale nicht elementar ausdrückbar. Wir berechnen die Bogenlänge dieser Kurve zwischen den Punkten A und B der 44 U. Stammbach: Analysis, Teil A Kurve, wobei wir für A den zum Parameterwert t = 0 gehörigen Punkt, also den Nullpunkt des Koordinatensystems wählen, und für B den zum Parameterwert T gehörigen Punkt. Wegen a 2 t 2 a 2 ẏ(t) = sin t 2 ẋ(t) = cos erhalten wir sB A = Z 0 Z = T 0 Z = T T 0 q ẋ2 + ẏ 2 dt s cos2 a 2 a 2 t + sin2 t dt 2 2 1 dt = T . Unser Parameter t ist also gleichzeitig die vom Ursprung des Koordinatensystems aus gemessene Bogenlänge der Kurve. Berechnen wir die Krümmung der Klotoide, so erhalten wir wegen a 2 t 2 a 2 at cos t 2 ẍ(t) = −at sin ÿ(t) = mit der Krümmungsformel at cos2 ẋÿ − ẍẏ k(t) = 2 = (ẋ + ẏ 2 )3/2 a 2 t2 + sin2 1 a 2 t2 = at . Unsere Klotoide hat die interessante Eigenschaft, dass die Krümmung proportional zur Bogenlänge ist. Durchläuft man die Klotoide mit konstanter Schnelligkeit, so nimmt die Krümmung, also der Steuereinschlag bei der Fahrt, proportional zur Zeit zu (oder ab): Für ein angenehmes Befahren müssten Strassenkurven aus diesem Grunde eigentlich aus Klotoidenstücken (und Kreisstücken) zusammengesetzt sein. Wir haben in diesem letzten Beispiel eine Kurve vor uns, welche durch eine Parameterdarstellung mit der Bogenlänge als Parameter gegeben ist. Für viele theoretische Überlegungen ist es am einfachsten, von einer solchen Kurvendarstellung auszugehen. Interpretiert man die Parameterdarstellung als Bewegung eines Massenpunktes, so bedeutet dies, dass die Kurve mit konstanter Schnelligkeit 1 durchlaufen wird; konsequenterweise ist dann |~r˙ (t)| ≡ 1. 45 Kapitel III. Integralrechnung 9 Volumenberechnung In diesem Abschnitt wollen wir uns mit der Volumenberechnung beschäftigen. Wir nehmen an, dass uns eine Beschreibung des Körpers im (x, y, z)-Koordinatensystem vorliegt. Ferner nehmen wir an, dass der Flächeninhalt der Schnittfigur mit einer zur (y, z)-Ebene parallelen Ebene durch die stetige Funktion x → F (x) gegeben sei. Um das Volumen des Körpers zu berechnen, wählen wir auf der x-Achse eine Einteilung a = x0 < x1 < · · · < xn−1 < xn = b mit Zwischenpunkten ξk ∈ [xk−1 , xk ] und zerlegen den Körper durch Schnitte parallel zur (y, z)Ebene an den Stellen xk , k = 0, 1, . . . , n in Scheiben. Das Volumen V des zwischen der xKoordinate a und der x-Koordinate b liegenden Teils ist dann näherungsweise durch die Riemann’sche Summe (siehe Figur 1) n X F (ξk )(xk − xk−1 ) k=1 gegeben. Der Grenzübergang über eine Folge von Einteilungen, deren Feinheit gegen Null strebt, liefert das Integral V = Z b a F (x) dx das Volumen des zwischen den x-Koordinaten a und b liegenden Teils des Körpers. Beispiel Das Volumen des Ellipsoides x2 y 2 z 2 + 2 + 2 =1 a2 b c ist gesucht. Wir schneiden den Körper mit der Ebene x = x0 . Als Schnittfigur erhalten wir y2 z2 x20 + = 1 − , b2 c2 a2 b2 y2 z2 =1. + 1 − x20 /a2 c2 1 − x20 /a2 Dies ist für −a ≤ x0 ≤ a eine Ellipse mit Halbachsen 46 U. Stammbach: Analysis, Teil A (z) Fig. 1 : Volumen F (x) ξk a xk−1 xk b q (x) q b 1 − x20 /a2 , c 1 − x20 /a2 in Richtung der y- bzw. z-Achse. Der Flächeninhalt der ellipsenförmigen Schnittfigur ist nach einem früheren Resultat F (x0 ) = πbc 1 − x20 /a2 . Das Volumen des Ellipsoides berechnet sich dann wie folgt: V =2 Z a 0 x2 πbc 1 − 2 a ! " x3 dx = 2πbc x − 2 3a #a 0 4 = πabc . 3 Bemerkung Wie man sich erinnert, wurde der Flächeninhalt einer Ellipse seinerzeit ebenfalls mit Hilfe der Integralrechnung hergeleitet. Dies ist typisch für die Volumenberechnung: der Flächeninhalt der Schnittfigur ist im allgemeinen wiederum durch ein Integral gegeben; man hat eigentlich ein mehrfaches Integral vor sich. Beispiel Gegeben ist ein auf der (x, y)-Ebene stehender gerader Kreiszylinder mit Grundkreis x2 + y 2 = r 2 . Er werde durch die Ebene 47 Kapitel III. Integralrechnung z= h (x + b) , 0 ≤ b ≤ r r+b abgeschnitten (siehe Figur 2). Was ist das Volumen des zwischen der (x, y)-Ebene und der Schnittebene liegenden Stückes (Zylinderhuf)? (z) Fig. 2 : Zylinderhuf h G(x) b r (x) Wir schneiden den Körper durch eine zur (y, z)-Ebene parallelen Ebene. Die Schnittfigur ist ein Rechteck, es hat den Flächeninhalt p G(x) = 2 r2 − x2 h r+b (x + b) . Das Volumen ergibt sich dann wie folgt V Z = = = r −b G(x) dx Z r p 2h (x + b) r 2 − x2 dx r + b −b Z r Z r p p h 2hb 2x r 2 − x2 dx + r 2 − x2 dx . r + b −b r + b −b 48 U. Stammbach: Analysis, Teil A Da der Integrand im ersten Integral ungerade ist, darf man die untere Grenze −b durch +b ersetzen. Die Substitutionen r 2 − x2 = u, −2xdx = du im ersten und x = ru, dx = rdu im zweiten Integral liefern dann V = − = h r+b Z 0 r 2 −b2 u1/2 du + 2hb 2 r r+b Z 1 p 1 − u2 du −b/r 2 h −b hbr 2 π (r 2 − b2 )3/2 + − arcsin 3r+b r+b 2 r b + r α s b2 1 − 2 . r Fig. 3 : Zum Winkel α r b Der durch α = π/2 − arcsin(−b/r) = π/2 + arcsin(b/r) gegebene Winkel hat eine offensichtliche geometrische Bedeutung (siehe Figur 3). Mit dieser Bezeichnung erhalten wir V = p r2 − b2 h r+b 2 2 1 2 hbr 2 r + b + α. 3 3 r+b 49 Kapitel III. Integralrechnung 10 Oberflächenberechnung Wir beschäftigen uns in diesem Abschnitt mit der Berechnung des Oberflächeninhaltes eines Körpers, wobei wir uns auf den Fall eines Rotationskörpers beschränken. Der allgemeine Fall führt auf sogenannte mehrfache Integrale; darauf werden wir im Laufe des zweiten Semesters zurückkommen. Gegeben ist also ein Rotationskörper; er entstehe durch Rotation des Kurvenstücks t → (x(t), y(t)) , tA ≤ t ≤ tB um die x-Achse; dabei setzen wir die Funktionen t → x(t) und t → y(t) stetig differenzierbar voraus (siehe Figur 1). Wir stellen die Frage nach dem Inhalt der von der Kurve K bei der Rotation überstrichenen Fläche. Wir nennen dies kurz den Oberflächeinhalt (eigentlich Mantelflächeninhalt) des Rotationskörpers. Dabei gehen wir das Problem naiv an und führen die folgenden Plausibilitätsbetrachtungen durch. Wie bei der Volumenberechnung zerschneiden wir den Körper in “dünne” Scheiben. Jede dieser Scheiben ist (approximativ) ein Kreiskegelstumpf. Um dessen Mantelfläche zu bestimmen, rollen wir den Kegel in die Ebene ab. Die Mantelfläche des Kegelstumpfs entspricht dann einem Kreisringsektor der (“schmalen”) Breite (siehe Figur 2) ds = q ẋ(t)2 + ẏ(t)2 dt . Sein Flächeninhalt ist (wiederum approximativ) gegeben durch q dO = 2πy(t) ẋ(t)2 + ẏ(t)2 dt . Nach diesen Plausibilitätsbetrachtungen “muss” der Oberflächeninhalt des Rotationskörpers durch O = 2π Z tB tA y(t) q ẋ(t)2 + ẏ(t)2 dt gegeben sein. Wie schon bei unserer Behandlung der Bogenlänge einer Kurve haben wir uns hier bei der Oberflächenberechnung mit heuristischen Argumenten begnügt. Vom mathematischen Standpunkt aus ist die Sachlage einiges komplizierter, als wir dies hier erscheinen lassen. Eigentlich muss nämlich der neue Begriff, also der Begriff des Oberflächeninhaltes eines Körpers an dieser 50 U. Stammbach: Analysis, Teil A B ds Fig. 1 : Oberfläche y(t) A x(t) dx a b ds Fig. 2 : Mantelfläche des Kegelstumpfes 2πy(t) 51 Kapitel III. Integralrechnung Stelle definiert werden. Dies kann für Rotationskörper durch die obige Formel geschehen. Allerdings muss der Mathematiker dann eine ganze Anzahl wichtiger Punkte abklären; z.B. muss er zeigen, dass der durch die Formel für die Oberfläche gegebene Wert nicht von der gewählten Parameterisierung der Kurve K abhängig ist. Wir gehen in dieser Vorlesung natürlich auf diese Dinge nicht näher ein. Statt dessen betrachten wir die folgenden konkreten Beispiele. Beispiel Gesucht ist der Oberflächeninhalt eines Torus. Wir stellen uns den Torus als Rotationskörper vor, indem wir den Kreis K mit Radius r und Mittelpunkt M = (0, R) um die x-Achse rotieren lassen (siehe Figur 3). Der Kreis K ist offenbar gegeben durch t → (x(t), y(t)) = (r cos t, R + r sin t) , 0 ≤ t ≤ 2π . (y) r (0, R) t (x) Fig. 3 : Torus Wegen ẋ(t) = −r sin t , ẏ(t) = r cos t erhalten wir für den Oberflächeninhalt des Torus O = 2π Z 0 2π (R + r sin t) q r 2 sin2 t + r 2 cos2 t dt = 2π2πRr = 4π 2 Rr . 52 U. Stammbach: Analysis, Teil A Beispiel Wir betrachten den Kreis K mit Radius r um den Ursprung und fragen nach dem Oberflächeninhalt der Kugelzone, die durch Rotation um die x-Achse des zwischen den x-Koordinaten a und b befindlichen Teils K 0 des Kreises K entsteht. (y) K0 Fig. 4 : Kugelzone (x) a b Der Kreis K wird durch die Gleichung x2 + y 2 = r 2 beschrieben. Daraus erhalten wir leicht eine Parameterdarstellung des Kurvenstücks K 0 (mit Parameter t = x) t → (x(t), y(t)) = (t, p r 2 − t2 ) , a ≤ t ≤ b . Der Oberflächeninhalt des zugehörigen Rotationskörpers, also der Kugelzone ergibt sich dann wegen ẋ(t) = 1 , p ẏ(t) = −t/ r 2 − t2 zu O = 2π Z bp a r 2 − t2 q 1 + t2 /(r 2 − t2 ) dt = 2π Z b a r dt = 2πr(b − a) . Kapitel III. Integralrechnung 53 Das Resultat verdient Beachtung: Der Oberflächeninhalt der Kugelzone zwischen den x-Koordinaten a und b ist gleich der Mantelfäche des die Kugel umschreibenden Zylinders zwischen den x-Koordinaten a und b. Projiziert man folglich die (Erd-)Kugel von einem Durchmesser aus auf den umschreibenden Zylinder und rollt man anschliessend den Zylinder in die Ebene ab, so erhält man ein flächentreues (Karten-)Bild der (Erd-)Kugeloberfläche. Diese Tatsache wurde 1772 von J. H. Lambert (1728 - 1777) angegeben. 54 11 U. Stammbach: Analysis, Teil A Schwerpunkt, Flächenmittelpunkt In diesem Abschnitt beschäftigen wir uns mit der Berechnung des Schwerpunktes eines mechanischen Systems. Wir fassen dabei den Schwerpunkt als Kraftmittelpunkt auf. Zuerst betrachten wir in Richtung der y-Achse wirkende Kräfte K1 , K2 , . . . , Kn , die in den Punkten x1 , x2 , . . . , xn der x-Achse angreifen. Der Kraftmittelpunkt xs dieses Systems genügt dann der Gleichung (x1 − xs )K1 + (x2 − xs )K2 + · · · + (xn − xs )Kn = 0 , so dass sich für xs die Formel xs = 1 (x1 K1 + x2 K2 + · · · + xn Kn ) K1 + K2 + · · · + Kn ergibt. Wenn die Kräfte nicht diskret, sondern kontinuierlich verteilt sind, wenn also die Kraftdichte an der Stelle x durch die Funktion x → G(x), x ∈ [a, b] gegeben ist, so genügt der Kraftmittelpunkt xs in analoger Weise der Gleichung xs Z b a G(x)dx = Z b a x G(x) dx . Man beachte, dass Z b a G(x) dx nichts anderes als die Totalkraft ist. Wir wenden diese Überlegungen zuerst auf die Berechnung des Flächenmittelpunktes eines Bereiches B der (x, y)-Ebene an. Darunter verstehen wir den Kraftmittelpunkt der Gravitationskräfte, die auf den homogen mit Masse der Dichte 1 belegten Bereich B wirken (Schwerpunkt). Wirkt die Gravitationskraft in Richtung der y-Achse, so ist deren Kraftdichte G(x) an der Stelle x natürlich einfach die Ausdehnung in y-Richtung des Bereiches B an der Stelle x. Wirkt die Gravitationskraft in Richtung der x-Achse, so ist die Kraftdichte H(y) an der Stelle y die Ausdehnung in x-Richtung des Bereiches B an der Stelle y (siehe Figur 1). Der Punkt (xs , ys ) mit 55 Kapitel III. Integralrechnung (y) d G(x) y Fig. 1 : Zur Berechnung des Schwerpunktes B H(y) c (x) a x b xs ys Z Z b a d c Z G(x) dx = b a d Z H(y) dy = c x G(x) dx y H(y) dy ist dann der Flächenmittelpunkt des Bereiches B. Beispiel Gesucht ist der Flächenmittelpunkt des Viertelkreises im ersten Quadranten mit Radius R (siehe Figur 2). Aus Symmetriegründen gilt natürlich xs = ys . Für xs erhalten wird die Gleichung xs · r 2π 4 Z = 0 r x Z p r 2 − x2 dx p 1 r (−2x) r 2 − x2 dx 2 0 ir 12h 2 = − (r − x2 )3/2 0 23 1 3 = r . 3 = − 56 U. Stammbach: Analysis, Teil A (y) Fig. 2 : Schwerpunkt des Viertelkreises r S √ r2 − x2 (x) x Daraus ergibt sich xs = 4 r. 3π Der Schwerpunkt eines räumlichen Bereiches berechnet sich auf ganz analoge Weise. Auch dazu ein Beispiel. Beispiel Gesucht ist der Schwerpunkt einer homogenen Halbkugel (siehe Figur 3). Offenbar dürfen wir voraussetzen, dass die Dichte 1 ist. Wir betrachten die Halbkugel als Rotationskörper, der durch Rotation eines Viertelkreises um die x-Achse entsteht. Der Schwerpunkt (xs , ys , zs ) liegt aus Symmetriegründen natürlich auf der x-Achse; damit gilt ys = zs = 0. Für xs haben wir die Gleichung xs Z 0 r G(x)dx = Z 0 r x G(x) dx , wobei G(x) die Kraftdichte der Gravitation in Richtung der z-Achse bezeichnet. Offensichtlich gilt 57 Kapitel III. Integralrechnung Fig. 3 : Schwerpunkt einer Halbkugel G(x) = π(r 2 − x2 ) . Ferner lässt sich die totale Kraft, das Gewicht der Halbkugel direkt angeben: Z r 0 2 G(x)dx = πr 3 . 3 Damit erhält man 2 xs · πr 3 = π 3 Z 0 r " x2 r 2 x 4 x(r − x ) dx = π − 2 4 2 2 #r =π 0 r4 r4 − 2 4 ! , und es ergibt sich xs = 3 r. 8 Formal das gleiche Integral wie bei der Schwerpunktberechnung tritt auch in ganz anderem Zusammenhang auf, z.B. in der Wahrscheinlichkeitsrechnung beim Mittelwert einer Wahrscheinlichkeitsverteilung. 58 12 U. Stammbach: Analysis, Teil A Trägheitsmoment Eine weitere physikalisch-mechanische Anwendung des Integrals betrifft das sogenannte Trägheitsmoment. Es tritt etwa bei der Berechnung der kinetischen Energie eines rotierenden starren Systems auf. Derselben mathematischen Bildung begegnet man aber in vielen anderen Zusammenhängen ebenfalls, in der Mechanik bei der Behandlung von Torsions- und Biegungsproblemen, in der Wahrscheinlichkeitsrechnung beim Begriff der Varianz, etc. Wie im Abschnitt über die Schwerpunktsberechnung betrachten wir zuerst ein diskretes System. Es bestehe aus Massenpunkten der Masse m1 , m2 , . . . , mn , die sich in den Punkten (x1 , y1 , z1 ), (x2 , y2 , z2 ), . . . , (xn , yn , zn ) befinden. Wir lassen dieses System mit der Winkelgeschwindigkeit ω um die z-Achse rotieren, und fragen nach der kinetischen Energie T . Da die Masse mi bei dieser Rotation die Geschwindigkeit (x2i + yi2 )1/2 ω besitzt, ist T gegeben durch T = 1 m1 (x21 + y12 ) + m2 (x22 + y22 ) + · · · + mn (x2n + yn2 ) ω 2 . 2 Definitionsgemäss heisst die hier auf natürliche Art auftretende Grösse Θz = m1 (x21 + y12 ) + m2 (x22 + y22 ) + · · · + mn (x2n + yn2 ) das Trägheitsmoment des Systems um die z-Achse. Auf analoge Weise sind das Trägheitsmoment Θx um die x-Achse Θx = m1 (y12 + z12 ) + m2 (y22 + z22 ) + · · · + mn (yn2 + zn2 ) und das Trägheitsmoment Θy um die y-Achse Θy = m1 (x21 + z12 ) + m2 (x22 + z22 ) + · · · + mn (x2n + zn2 ) definiert. Wir entnehmen diesen Überlegungen die Tatsache, dass das Trägheitsmoment eines mechanischen Systems um die Achse a definiert ist als Summe der Produkte d2 · md , wo md die Masse des Systems bezeichnet, welches sich im Abstand d von der Achse a befindet. Diese Aussage 59 Kapitel III. Integralrechnung überträgt sich vom diskreten auf den kontinuierlichen Fall. Wir betrachten dazu wie üblich einige konkrete Beispiele. Beispiel Es sei ein zwischen den x-Werten a und b, a ≤ b liegender Bereich B in der (x, y)-Ebene gegeben, der homogen mit Masse der Dichte ρ belegt ist. Wir fragen nach dem Trägheitsmoment Θy dieses Systems bezüglich der y-Achse. (Vergleiche Figur 1, p. 55.) Der Abstand von der y-Achse ist gegeben durch d = x, und die in diesem Abstand konzentrierte Masse ist ρG(x) dx, wo G(x) die Ausdehnung in y-Richtung des Bereichs an der Stelle x ist. Das Trägheitsmoment Θy ist folglich gegeben durch das Integral Θy = ρ Z b a x2 G(x) dx , und die kinetische Energie bei der Rotation mit Winkelgeschwindigkeit ω um die y-Achse ist Ty = 1 Θy ω 2 . 2 Auf ganz analoge Weise erhält man das Trägheitsmoment Θx des Bereichs B bezüglich der xAchse. Es liege B zwischen den y-Werten c und d, c ≤ d, und es bezeichne H(y) die Ausdehnung in x-Richtung des Bereichs B an der Stelle y. Dann gilt Θx = ρ Z d c y 2 H(y) dy . (Für ρ = 1 spricht man auch von den Flächenträgheitsmomenten des Bereichs B bezüglich der x- und der y-Achse und bezeichnet sie mit Jx und Jy .) Beispiel Gesucht ist das (Flächen-)Trägheitsmoment eines Kreises mit Radius r um einen Durchmesser (siehe Figur 1). Offensichtlich ist G(x) = 2 p r 2 − x2 , so dass sich für das Flächenträgheitsmoment Jy um die y-Achse Z Jy = 2 r 0 p 2x2 r 2 − x2 dx ergibt. Die Substitution x = r sin t, dx = r cos t dt liefert dann Jy = 4 Z π/2 0 = 4r 4 Z 0 r 2 sin2 t r cos t r cos t dt π/2 (sin2 t − sin4 t) dt 60 U. Stammbach: Analysis, Teil A (y) r √ r2 − x2 (x) Fig. 1 : Trägheitsmoment eines Kreises um einen Durchmesser x = 4r = 4 π1 π13 − 22 224 π 4 r . 4 Beispiel Gesucht ist das Trägheitsmoment eines homogenen Vollzylinders (Dichte ρ) um seine Achse. Wir betrachten den auf der (x, y)-Ebene stehenden Kreiszylinder mit Radius r und Höhe h. Seine Achse falle mit der z-Achse zusammen. Im Abstand x von der z-Achse befindet sich die Masse dm = ρ (2πx) h dx . Damit erhalten wir für das Trägheitsmoment Θz Θz = ρ Z 0 r x2 (2πx) h dx " x4 = 2πρh 4 1 = πρhr 4 . 2 #r 0 61 Kapitel III. Integralrechnung Aus diesem Resultat ergibt sich ohne Schwierigkeit auch das Trägheitsmoment Θ einer Kreisscheibe um eine senkrecht dazu stehende Achse durch den Mittelpunkt. Ist die (Flächen-)Dichte gleich 1, so erhält man dafür 1 Θ = πr 4 . 2 Man nennt dies auch das polare Flächenträgheitmoment J0 der Kreisscheibe. Man vergleiche an dieser Stelle die Werte der Flächenträgheitsmomente Jx , Jy , J0 der Kreisscheibe. Beispiel Gesucht ist das Trägheitsmoment Θx des von dem Graphen von x → f (x), x ∈ [a, b] bei der Rotation um die x-Achse erzeugten (homogenen) Rotationskörpers bezüglich seiner Achse (siehe Figur 2). y = f (x) f (x) dx a x b Fig. 2 : Trägheitsmoment eines Rotationskörpers um seine Achse Wir gehen hier ähnlich vor wie bei der Volumen- und Oberflächenberechnung von derartigen Rotationskörpern und zerschneiden diesen in “dünne” Scheiben der Dicke dx. Jede solche Scheibe kann dann (approximativ) als Vollzylinder mit Radius f (x) und Höhe dx angesehen werden, so dass ihr Trägheitsmoment dΘx nach dem vorhergehenden Beispiel durch 1 dΘx = πρ dx (f (x))4 2 gegeben ist. Das Trägheitsmoment des ganzen Körpers ergibt sich daraus durch Integration 62 U. Stammbach: Θx = 1 πρ 2 Z b a Analysis, Teil A (f (x))4 dx . Beispiel Gesucht ist das Trägheitsmoment einer homogenen Vollkugel mit Radius R um einen Durchmesser (siehe Figur 3). Fig. 3 : Vollkugel Wir berechnen das Trägheitsmoment Θx der homogenen Vollkugel mit Mittelpunkt im Ursprung und Radius R, wobei wir diese als Rotationskörper bezüglich der x-Achse ansehen, der zur Funktion x → f (x) = p R2 − x2 , x ∈ [−R, +R] gehört. Wir erhalten nach dem obigen Beispiel Θx = 1 πρ 2 = πρ Z Z 0 +R −R R (R2 − x2 )2 dx (R4 − 2R2 x2 + x4 ) dx 2 1 = πρ R4 x − R2 x3 + x5 3 5 R 0 63 Kapitel III. Integralrechnung = πρR5 1 − = 2 1 + 3 5 8 πρR5 . 15 Beispiel Gesucht ist das Trägheitsmoment eines homogenen Torus (Dichte ρ) um seine Achse (siehe Figur 4). Fig. 4 : Torus Wir betrachten den Torus als Rotationskörper, der von einem Kreis mit Radius r und Mittelpunkt (R, 0, 0) bei der Rotation um die z-Achse erzeugt wird und gehen ähnlich vor wie bei der Berechnung des Trägheitsmomentes des Kreiszylinders. Die Masse, die den Abstand x von der Rotationsachse besitzt, ist offenbar gegeben durch (siehe Figur 5) q dm = 2πρx 2 r 2 − (x − R)2 dx , so dass der davon resultierende Anteil dΘz an das Trägheitsmoment sich zu q dΘz = 2πρx3 2 r 2 − (x − R)2 dx ergibt. Integration liefert dann Θz 64 U. Stammbach: Analysis, Teil A (z) r (R, 0, 0) Fig. 5 : Trägheitsmoment eines Torus um seine Achse (x) x Z Θz = 4πρ R+r R−r q x3 r 2 − (x − R)2 dx . Wir lösen dieses Integral mit Hilfe der Substitution x − R = r sin t, dx = r cos t dt und erhalten Z Θz = 4πρ = 4πρr π/2 (R + r sin t)3 r cos t r cos t dt −π/2 Z π/2 2 = 4πρr 2 −π/2 Z π/2 −π/2 (R3 + 3R2 r sin t + 3Rr 2 sin2 t + r 3 sin3 t)(1 − sin2 t) dt (R3 + 3Rr 2 sin2 t − R3 sin2 t − 3Rr 2 sin4 t) dt . Dabei haben wir im letzten Schritt benützt, dass das Integral über eine ungerade Funktion Null ist, wenn das Integrationsintervall symmetrisch zum Nullpunkt liegt. Die Integration liefert nun mit den in Abschnitt 6 hergeleiteten Formeln Θz = 4πρr 2 2π 3π 2π 3 R π + 3Rr − R − 3Rr 2 2 24 3 2 = 2π ρr 2 3 R − Rr 2 4 3 . Das Trägheitsmoment oder die kinetische Energie eines rotierenden starren Körpers, wie auch schon die Integrale, die bei der Schwerpunktberechnung aufgetreten sind, sind eigentlich Beispiele 65 Kapitel III. Integralrechnung für einen allgemeineren Begriff des Integrals. Wir erklären dies an dieser Stelle kurz am Beispiel der kinetischen Energie, werden aber gegen Ende des Semesters auf diesen Punkt in voller Allgemeinheit eingehend zurückkommen. Der Einfachheit halber betrachten wir einen (dreidimensionalen) starren Körper B mit homogener Massenverteilung (Dichte ρ konstant). Rotiert dieser Körper um die Achse a mit der Winkelgeschwindigkeit ω, so trägt das “Volumenelement dV ” zur kinetischen Energie die Grösse 1 1 dT = ρdV (lω)2 = ρω 2 l2 dV 2 2 bei, wobei l den Abstand des Volumenelementes dV von der Rotationsachse bezeichnet. “Summation” über alle Volumenelemente von B und Grenzübergang über eine Folge von immer feiner werdenden Unterteilungen des Bereiches B liefert dann das sogenannte Volumenintegral T = ZZZ B 1 1 ρ ω 2 l2 dV = ρ ω 2 2 2 ZZZ B l2 dV . Konsequenterweise ist das Trägheitsmoment als Volumenintegral Θ=ρ ZZZ B l2 dV gegeben. Zur Definition des Volumenintegrals geht man also ganz ähnlich vor wie bei der Definition des gewöhnlichen Riemann’schen Integrals (siehe Abschnitt 1). Es sei ein räumlicher Bereich B und eine darauf definierte reellwertige Funktion f : (x, y, z) → f (x, y, z) , D(f ) = B gegeben. Um zum Integral ZZZ B f (x, y, z) dV zu gelangen führt man die folgenden Schritte durch: (a) Teile B in n kleine Teile ∆Bi mit Volumen ∆Vi ein , i = 1, 2, . . . , n. (b) Wähle in jedem ∆Bi einen Punkt (xi , yi , zi ). Die Feinheit der Einteilung ist definiert als Durchmesser der kleinsten Kugel, in der jedes einzelne der ∆Bi Platz hat. (c) Bilde die Riemann’sche Summe f (x1 , y1 , z1 )∆V1 + f (x2 , y2 , z2 )∆V2 + · · · + f (xn , yn , zn )∆Vn . 66 U. Stammbach: Analysis, Teil A (d) Definiere das Integral ZZZ B f (x, y, z) dV = lim (f (x1 , y1 , z1 )∆V1 + f (x2 , y2 , z2 )∆V2 + · · · + f (xn , yn , zn )∆Vn ) als Limes der Riemann’schen Summe, wobei für den Grenzübergang eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null strebt. Wie beim ursprünglichen Riemann’schen Integral zeigt man, dass der Grenzwert im Schritt (d) nicht von der Wahl der Punkte (xi , yi , zi ) und auch nicht von der Wahl der Folge der Einteilungen abhängt, falls der Integrand f eine stetige Funktion ist. - Im Beispiel des Trägheitsmomentes ZZZ B l2 dV ist die Funktion f durch l2 gegeben, d.h. der Funktionswert f (x, y, z) ist das Quadrat des Abstandes des Punktes (x, y, z) von der Achse a. 67 Kapitel III. Integralrechnung 13 Uneigentliche Integrale Das Symbol Z b a f (x)dx haben wir im Abschnitt 1 unter zwei Voraussetzungen definiert, nämlich: (a) das Intervall [a, b] ist endlich; (b) der Integrand x → f (x) ist in [a, b] stetig. Beispiele zeigen, dass das übliche Vorgehen bei der Berechnung bestimmter Integrale auf falsche Resultate führen kann, wenn man etwa von der zweiten Voraussetzung abgeht. Hier wollen wir versuchen, die Voraussetzungen abzuschwächen, indem wir den Begriff des bestimmten Integrals sorgfältig erweitern. Wir wenden uns zuerst den sogenannten uneigentlichen Integralen 2. Gattung zu (die Terminologie ist historisch bedingt und leider wiederum recht unglücklich). In solchen Integralen ist zwar der Integrand stetig, aber das Integrationsintervall unendlich, etwa [a, ∞). Für ein Integral dieser Art definieren wir Z ∞ a f (x)dx = lim Z ξ ξ→∞ a f (x)dx . Das uneigentliche Integral existiert (konvergiert), wenn der Limes auf der rechten Seite existiert; der Wert des Integrals ist in diesem Fall gleich dem Wert des Limes. Analog geht man vor, wenn das Integrationsintervall von der Form (∞, b] ist. Beispiel (siehe Figur 1) Z 0 ∞ 1 dx = lim ξ→∞ 1 + x2 Beispiel Z ξ 0 1 dx = lim [arctan x]ξ0 = lim (arctan ξ − arctan 0) = π/2 2 ξ→∞ ξ→∞ 1+x (siehe Figur 2) Z 0 ∞ e−x dx = lim Z ξ→∞ 0 ξ e−x dx = lim −e−ξ + e−0 = 1 ξ→∞ 68 U. Stammbach: y= Analysis, Teil A 1 1 + x2 Fig. 1 : Die Funktion x→ y = e−x 1 1 + x2 Fig. 2 : Die Funktion x → e−x Kapitel III. Integralrechnung 69 Beispiel ∞ ξ sin x dx = lim ξ→∞ 0 0 sin x dx = lim (− cos ξ + cos 0) existiert nicht! ξ→∞ Beispiel Uneigentliche Integrale 2. Gattung treten in Anwendung öfter auf. Wir berechnen die Fluchtgeschwindigkeit aus dem Gravitationsfeld einer homogenen Kugel. Die Gravitationskraft einer homogenen Kugel der Masse M auf einen Massenpunkt der Masse m im Abstand r vom Mittelpunkt (und ausserhalb) der Kugel ist gegeben durch M ·m , r2 K(r) = −k wo k die Gravitationskonstante ist. Für die Fluchtgeschwindigkeit v eines Massenpunktes im Abstand R vom Mittelpunkt der Kugel muss die Gleichung 1 mv 2 = 2 ∞ k R mM dr r2 (Gleichsetzung der kinetischen und der potentiellen Energie) erfüllt sein. Daraus folgt 1 2 v = kM 2 ∞ 1 R r2 dr = kM lim − ξ→∞ 1 r ξ = kM R 1 , R also v= 2kM R 1/2 . Im Folgenden wollen wir die Diskussion ganz auf den Fall von positiven, monoton fallenden Funktionen beschränken. Ist f eine solche Funktion, so ergibt sich aus der Definition sofort, dass das uneigentlichen Integral ∞ f (x)dx a nur existieren kann, wenn f (x) für x → ∞ gegen Null strebt. Diese Bedingung ist aber nicht hinreichend, wie das folgende Beispiel zeigt! Beispiel (siehe Figur 3) ∞ 1 1 x dx = lim ξ 1 ξ→∞ 1 x dx = lim (log ξ − log 1) = lim log ξ existiert nicht! ξ→∞ ξ→∞ 70 U. Stammbach: Analysis, Teil A 4 3 Fig. 3 : Die Funktion 2 x → 1/x 1 -1 1 2 3 4 -1 4 3 Fig. 4 : Die Funktion 2 x → 1/x2 1 -1 1 -1 2 3 4 71 Kapitel III. Integralrechnung Beispiel (siehe Figur 4) Es sei 0 < k < ∞, k 6= 1. Z 1 ∞ 1 dx = lim ξ→∞ xk Z ξ 1 1 dx = lim k ξ→∞ x 1−k 1 1 ξ k−1 −1 . Dieser Limes existiert für k > 1, er existiert nicht für 0 < k < 1. Begegnet man im Laufe einer Rechnung einem uneigentlichen Integral, so muss man sich als erstes über dessen Existenz Klarheit verschaffen. Existiert das Integral nämlich nicht, so handelt es sich um ein leeres Symbol, und ein Weiterrechnen kann zu falschen Resultaten führen. Der Mathematiker kennt eine ganze Anzahl von sogenannten Vergleichskriterien, die einem die Untersuchung von uneigentlichen Integralen erleichtern. Wir wollen auf diese Kriterien hier nicht eingehen, aber an einem Beispiel illustrieren, wie Vergleiche des Integranden mit gut bekannten Funktionen in diesem Zusammenhang nützlich sind. Beispiel Wir fragen nach der Existenz bzw. Nichtexistenz des uneigentlichen Integrals (siehe Figur 5) Z ∞ 1 2 e−x dx . Ausgehend nur von der Definition des uneigentlichen Integrals kann dieses nicht auf Existenz 2 untersucht werden, weil die Stammfunktion von x → e−x nicht elementar ausdrückbar ist. Wir müssen also auf andere Weise vorgehen. Die Frage - geometrisch interpretiert - lautet, ob die 2 Fläche zwischen 1 und ∞ unter dem Graphen von x → e−x endlich oder unendlich ist. Zu diesem Zweck vergleichen wir diese Funktion mit x → e−x . Offensichtlich gilt für x ≥ 1 die Ungleichung 2 0 < e−x ≤ e−x . Daraus folgt für jedes ξ ≥ 1 0≤ Z ξ 1 2 e−x dx ≤ Z ξ 1 e−x dx = −e−ξ + e−1 < e−1 . Nun ist aber Z 1 ξ 2 e−x dx in ξ monoton wachsend. Da es durch 1/e beschränkt ist, muss der Limes Z lim ξ→∞ 1 ξ 2 e−x dx 72 U. Stammbach: y = e−x Analysis, Teil A 2 Fig. 5 : Die Funktionen x → e−x 2 x → e−x y = e−x existieren. Unser uneigentliches Integral existiert deshalb. Dank dem Vergleich des Integranden mit einer einfacheren Funktion ist es uns gelungen, dies nachzuweisen, obschon die Stammfunktion nicht elementar ausdrückbar ist. Wir bemerken noch, dass wegen Z 0 ∞ 2 e−x dx = Z 1 0 2 e−x dx + Z 1 ∞ 2 e−x dx auch das Integral Z 0 ∞ 2 e−x dx existiert. Dessen Wert werden wir später explizit berechnen. Dieses Integral spielt in der Wahrscheinlichkeitstheorie eine zentrale Rolle. Wir wenden uns jetzt den uneigentlichen Integralen 1. Gattung zu. Bei diesen ist das Integrationsintervall [a, b] endlich, aber der Integrand ist nur auf dem einseitig offenen Intervall (a, b] (oder [a, b)) stetig. Wir definieren, ganz analog zum Vorgehen im obigen Fall, Z b a f (x)dx = lim Z ξ→a+ ξ b f (x)dx . 73 Kapitel III. Integralrechnung Beispiel Z 1 0 Beispiel 1 dx = lim x ξ→0+ Z ξ 1 1 dx = lim (log 1 − log ξ) existiert nicht! x ξ→0+ Es sei 0 < k, k 6= 1 und a < b. Fig. 6 : Die Funktion y= 1 (x − 1)1/2 b a 1 (x − 1)1/2 b 1 Z x→ 1 dx = lim (x − a)k ξ−a+ Z b ξ 1 1 1 1 dx = − lim k k−1 + (x − a) 1 − k ξ−a (b − a) (ξ − a)k−1 . Dieser Limes, und demzufolge das Integral, existiert für 0 < k < 1; er existiert nicht für 1 < k. Beispiel Z 0 1 log x dx = lim+ ξ→0 Z ξ 1 log x dx = lim+ [x(log x − 1)]1ξ = lim+ (−1 − ξ log ξ + ξ) = −1 . ξ→0 ξ→0 Teil B Kapitel IV. Funktionen von mehreren Variablen Differentialrechnung Kapitel V. Funktionen von mehreren Variablen Integralrechnung Kapitel VI. Vektoranalysis Ich behaupte sogar, dass in jeder besonderen Naturlehre nur soviel eigentliche Wissenschaft angetroffen werden könne, als darin Mathematik anzutreffen ist. Immanuel Kant (1724 – 1804) Inhaltsverzeichnis, Teil B Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3 Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . . 18 4 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6 Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 7 Funktionen von drei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 8 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Kapitel V. Funktionen von mehreren Variablen, Integralrechnung 1 Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . . 12 3 Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . . 30 5 Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Kapitel VI. Vektoranalysis 1 Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Differentialoperatoren der Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . 11 3 Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4 Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5 Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6 Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 9 Eine Anwendung des Satzes von Stokes . . . . . . . . . . . . . . . . . . . . . . . 65 10 Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel IV. Funktionen von mehreren Variablen Differentialrechnung Calculation is the way to the truth. J. Frank Adams (1930-1989), Professor in Cambridge, berühmter Mathematiker im Gebiet der algebraischen Topologie 1 0.5 2 0 1 -0.5 -1 -2 0 -1 0 -1 1 2 -2 Inhaltsverzeichnis 1 Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3 Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . . 18 4 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6 Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 7 Funktionen von drei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 8 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 3 Funktionen von zwei Variablen Wir betrachten in diesem Abschnitt Funktionen f , die auf einem Teilbereich A der Ebene R × R definiert sind und Werte in R annehmen f : (x, y) → f (x, y), D(f ) = A ∈ R × R . Man nennt dann f eine Funktion der zwei Variablen x und y (siehe Figur 1). Wir erinnern daran, dass A Definitionsbereich D(f ) von f und dass die Menge der reellen Zahlen, die unter f als Werte auftreten, Wertebereich W (f ) von f heisst. f (x, y) 0 (y) R Fig. 1 : Funktion von zwei Variablen R ×R f A (x, y) (x) Bereits früher haben wir gesehen, wo Funktionen mehrerer Variablen auf natürliche Weise auftreten. Im vorliegenden Kapitel geht es im wesentlichen darum, die Methoden der Differentialrechnung auf solche Funktionen anzuwenden. Beispiel Sind reelle Zahlen a, b, c gegeben, so heisst die Funktion 4 U. Stammbach: Analysis, Teil B f : (x, y) → f (x, y) = ax + by + c, D(f ) = R × R linear. Für (a, b) 6= (0, 0) besteht der Wertebereich W (f ) offenbar aus allen reellen Zahlen. Beispiel Die Funktion g : (x, y) → g(x, y) = q 1 − (x2 + y 2 ) besitzt als (grösstmöglichen) Definitionsbereich den Einheitskreis D(g) = {(x, y)|x2 + y 2 ≤ 1} . Der Wertebereich W (g) ist offenbar das Intervall [0, 1]. Zur Veranschaulichung einer Funktion f : (x, y) → f (x, y) von zwei Variablen ist der Graph Γ(f ) von f nützlich; es ist dies die Teilmenge des dreidimensionalen Raumes, welche durch Γ(f ) = {(x, y, z)|(x, y) ∈ D(f ), z = f (x, y)} gegeben ist. Beispiel Der Graph der linearen Funktion f : (x, y) → ax + by + c ist die durch die Gleichung zp = ax + by + c beschriebene Ebene (siehe Figur 2). Der Graph der Funktion g : (x, y) → 1 − (x2 + y 2 ) ist die über dem Einheitskreis liegende Halbkugeloberfläche x2 + y 2 + z 2 = 1 (siehe Figur 3). Der Graph einer Funktion von zwei Variablen ist definitionsgemäss eine (i.a. gekrümmte) Fläche im dreidimensionalen Raum. Er lässt sich mit den üblichen Darstellungsmitteln veranschaulichen, die für die Abbildung von Objekten im dreidimensionalen Raum entwickelt worden sind. Sehr nützlich sind in diesem Zusammenhang Darstellungsmittel der Kartographie, welche die über (bzw. unter) der (x, y)-Ebene liegende Fläche Γ(f ) durch Niveaulinien (Höhenlinien, Isobaren, etc.) beschreiben. Die Niveaulinie von f zum Niveau C ist diejenige Kurve in der (x, y)-Ebene, auf der die Funktion f überall den Wert C annimmt. Als Kurve in der (x, y)-Ebene ist sie gegeben durch die Gleichung f (x, y) = C. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 2 : Graph einer linearen Funktion 10 7.5 3 5 2.5 2 0 0 1 1 2 3 0 Fig. 3 : Graph der p Funktion g(x, y) = 1 − (x2 + y 2 ) 5 6 Beispiel U. Stammbach: Analysis, Teil B Die Niveaulinie zum Niveau C der Funktion f : (x, y) → f (x, y) = x2 − y 2 ist gegeben durch die Gleichung x2 − y 2 = C . Für C = 0 ist dies das Geradenpaar der Winkelhalbierenden des Koordinatensystems der (x, y)Ebene. Für C > 0 besteht die Kurve aus zwei Hyperbelästen, welche die x-Achse schneiden. Für C < 0 besteht die Kurve aus zwei Hyperbelästen, welche die y-Achse schneiden. Jeder Kartenleser erkennt am Bild dieser Niveaulinien das Aussehen des Geländes, d.h. des Graphen von f : es ist ein “Passübergang” mit dem Nullpunkt des Koordinatensystems als “Passhöhe”; die y-Achse beschreibt eine über den “Pass” führende “Strasse” (siehe Figuren 4, 5). Beispiel Der Graph der Funktion f : (x, y) → x2 + y 2 ist ein über der (x, y)-Ebene liegendes Paraboloid (siehe Figur 6). Die Niveaulinien sind Kreise um den Ursprung der (x, y)-Koordinatenebene (siehe Figur 7). Beispiel Die Zustandsgleichung eines idealen Gases liefert die absolute Temperatur T als Funktion des Druckes p und des Volumens V T : (p, V ) → T (p, V ) = 1 pV, 0 ≤ p, V < ∞ . R Die Niveaulinien zum Niveau C dieser Funktion ist durch die Gleichung 1 pV = C R gegeben. Offenbar ist jede Niveaulinie ein Hyperbelast im ersten Quadranten der (p, V )-Ebene. Da auf diesen Niveaulinien die Temperatur konstant ist, nennt man sie in der Physik Isothermen. Beispiel Funktion Auch kompliziertere Funktionen, wie etwa die auf der ganzen (x, y)-Ebene definierte h : (x, y) → h(x, y) = sin x sin y lassen sich mit Hilfe der Niveaulinien gut veranschaulichen (siehe Figuren 8, 9). Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 4 : Graph der Funktion f : (x, y) → f (x, y) = x2 − y 2 5 0 2 -5 0 -2 0 -2 2 3 2 1 Fig. 5 : Niveaulinien der Funktion f : (x, y) → f (x, y) = x2 − y 2 0 -1 -2 -3 -3 -2 -1 0 1 2 3 7 8 U. Stammbach: Analysis, Teil B Fig. 6 : Graph der Funktion f : (x, y) → x2 + y 2 8 6 2 4 1 2 0 -2 0 -1 0 -1 1 2 -2 2 1.5 1 Fig. 7 : Niveaulinien der Funktion f : (x, y) → x2 + y 2 0.5 0 -0.5 -1 -1.5 -2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 8 : Graph der Funktion h : (x, y) → h(x, y) = sin x sin y 1 0.5 2 0 1 -0.5 -1 -2 0 -1 0 -1 1 2 -2 2 1.5 1 Fig. 9 : Niveaulinien der Funktion h : (x, y) → h(x, y) = sin x sin y 0.5 0 -0.5 -1 -1.5 -2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 9 10 2 U. Stammbach: Analysis, Teil B Partielle Ableitungen Man stelle sich den Graphen Γ(f ) der Funktion f : (x, y) → f (x, y) als “Gelände” über der (x, y)-Ebene vor (beschrieben etwa durch die Niveaulinien). Ferner stelle man sich vor, dass ein Wanderer in diesem Gelände einem Weg folgt, der in der (x, y)-Ebene durch die Parallele y = y0 zur x-Achse beschrieben wird. Von eminenter Wichtigkeit für unseren Wanderer ist die Frage nach der Steigung des Weges. Wir erhalten diese Steigung, indem wir uns ein “Profil” des Weges in einem (x, z)-Koordinatensystem zeichnen. Es ist dies offenbar der Graph der Funktion (der einzigen Variablen x) ϕ : x → z = f (x, y0 ) . Die gesuchte Steigung (an der Stelle (x0 , y0 )) ist dann die Ableitung von ϕ nach x (an der Stelle x0 ). Diese Grösse heisst partielle Ableitung von f : (x, y) → f (x, y) nach x an der Stelle (x0 , y0 ). Man bezeichnet sie durch das Symbol fx (x0 , y0 ) oder ∂f (x0 , y0 ) . ∂x Formal ist sie als Grenzwert fx (x0 , y0 ) = lim ∆x→0 f (x0 + ∆x, y0 ) − f (x0 , y0 ) ∆x definiert. In analoger Weise erhält man die partielle Ableitung fy von f nach y. Sowohl die partielle Ableitung fx von f nach x, wie die partielle Ableitung fy von f nach y sind offensichtlich wieder Funktionen der zwei Variablen x und y. Sie können also ihrerseits partiell abgeleitet werden. Man erhält so die zweiten partiellen Ableitungen fxx , fxy , fyx , fyy , wobei wir, wie allgemein üblich, fxx = (fx )x , fxy = (fx )y , fyx = (fy )x , fyy = (fy )y gesetzt haben. Diese sind, falls sie existieren, wiederum Funktionen von zwei Variablen. Ihre nochmalige partielle Ableitung liefert die dritten partiellen Ableitungen Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 1 : Graph der Funktion f 0 ≤ x ≤ 2.5, −1 ≤ y ≤ 1.5 10 1.5 7.5 5 1 2.5 0.5 0 0 0.5 0 1 -0.5 1.5 2 2.5 -1 2 1.5 1 Fig. 2 : Niveaulinien der Funktion f −0.5 ≤ x ≤ 3, −1.5 ≤ y ≤ 2 0.5 0 -0.5 -1 -1.5 -0.5 0 0.5 1 1.5 2 2.5 3 11 12 U. Stammbach: Analysis, Teil B fxxx , fxxy , fxyx , fyxx , fxyy , fyxy , fyyx , fyyy , und auf analoge Weise erhält man die partiellen Ableitungen beliebiger Ordnung. Beispiel Es sei die Funktion f : (x, y) → x − 5 4 3 y− 1 2 2 − x + 3y + 15 2 gegeben (siehe Figuren 1, 2). Für y = −1 erhält man die Funktion einer Variablen (siehe Figur 3) 5 ϕ:x→ x− 4 3 3 − 2 2 9 5 9 −x+ = x− 2 4 4 3 −x+ 9 . 2 7 6 5 Fig. 3 : Verhalten von f auf y = −1 4 3 2 1 0.5 1 1.5 2 2.5 Deren Ableitung in x = 1 ist definitionsgemäss die partielle Ableitung fx (1, −1); man erhält fx (1, −1) = −0.578.... Beispiel Es sei die Funktion Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung f : (x, y) → f (x, y) = ex 2 +2y gegeben (siehe Figuren 4, 5). Die partiellen Ableitungen sind (siehe Figuren 6, 7, 8, 9) fx (x, y) = 2x ex 2 +2y x2 +2y fy (x, y) = 2 e , , fxx (x, y) = (2 + (2x)2 ) ex x2 +2y , x2 +2y , fxy (x, y) = 4x e fyx (x, y) = 4x e x2 +2y fyy (x, y) = 4 e Beispiel 2 +2y , . Es sei die Funktion f : (x, y) → f (x, y) = arctan y x gegeben. Die partiellen Ableitungen fx , fy ergeben sich zu 1 y y =− 2 , 1 + (y 2 /x2 ) x2 x + y2 1 1 x . = 2 2 2 1 + (y /x ) x x + y2 fx (x, y) = − fy (x, y) = Daraus erhalten wir die zweiten partielle Ableitungen 2xy , (x2 + y 2 )2 (x2 + y 2 ) − y · 2y y 2 − x2 fxy (x, y) = (fx )y (x, y) = − = , (x2 + y 2 )2 (x2 + y 2 )2 (x2 + y 2 ) − x · 2x y 2 − x2 fyx (x, y) = (fy )x (x, y) = = , (x2 + y 2 )2 (x2 + y 2 )2 −2xy fyy (x, y) = (fy )y (x, y) = . 2 (x + y 2 )2 fxx (x, y) = (fx )x (x, y) = 13 14 U. Stammbach: Analysis, Teil B Fig. 4 : Graph der Funktion 2 f (x, y) = ex +2y 10 1 5 0.5 0 -1 0 -0.5 0 -0.5 0.5 1 -1 1 0.75 0.5 Fig. 5 : Niveaulinien der Funktion 2 f (x, y) = ex +2y 0.25 0 -0.25 -0.5 -0.75 -1 -1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 6 : Graph der Funktion 2 fx (x, y) = 2x ex +2y 10 5 1 0 0.5 -5 -10 -1 0 -0.5 0 -0.5 0.5 1 -1 1 0.75 0.5 Fig. 7 : Niveaulinien der Funktion 2 fx (x, y) = 2x ex +2y 0.25 0 -0.25 -0.5 -0.75 -1 -1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1 15 16 U. Stammbach: Analysis, Teil B Fig. 8 : Graph der Funktion 2 fxx (x, y) = (2 + (2x)2 ) ex +2y 40 1 30 20 0.5 10 0 -1 0 -0.5 0 -0.5 0.5 1 -1 1 0.75 0.5 Fig. 9 : Niveaulinien der Funktion 2 fxx (x, y) = (2 + (2x)2 ) ex +2y 0.25 0 -0.25 -0.5 -0.75 -1 -1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Beispiel Man bestimme alle Funktionen f von zwei Variablen mit fx (x, y) ≡ 0. Für die partielle Differentiation nach x ist die Funktion f eine Konstante; es gilt also f (x, y) = v(y) , wobei v : y → v(y) eine beliebige Funktion von y ist. Beispiel Man bestimme alle Funktionen f mit fx (x, y) ≡ fy (x, y) ≡ 0 . Wegen fx (x, y) ≡ 0 gilt nach obigem f (x, y) ≡ v(y). Daraus folgt 0 ≡ fy (x, y) ≡ v 0 (y) , also v(y) ≡ C. Damit ist f (x, y) ≡ C. Beispiel Gesucht sind alle Funktionen f mit fy (x, y) ≡ x2 sinh(xy) . Offensichtlich ist f (x, y) = x cosh(xy) + u(x) , wo x → u(x) eine beliebige Funktion von x ist. Beispiel Gesucht sind alle Funktionen f mit fxy (x, y) ≡ 0. Es folgt sofort fx (x, y) ≡ u(x), wo u : x → u(x) eine Funktion von x ist. Dann ist aber f (x, y) = U (x) + V (y) mit U 0 (x) = u(x) und V : y → V (y) eine beliebige Funktion von y. 17 18 3 U. Stammbach: Analysis, Teil B Der Satz von Schwarz, die Integrabilitätsbedingung Wenn man die expliziten Beispiele des vorigen Abschnittes noch einmal durchsieht, so stellt man fest, dass die “gemischten Ableitungen” fxy (x, y) und fyx (x, y) in allen Fällen übereinstimmen. Dies gilt in der Tat unter ganz allgemeinen Bedingungen, wie der Satz von Schwarz besagt (H. A. Schwarz 1843-1921). Satz Es sei f : (x, y) → f (x, y) eine Funktion von zwei Variablen und (x0 , y0 ) ein Punkt des Definitionsbereiches D(f ). Ferner seien fxy , fyx in der ganzen Umgebung von (x0 , y0 ) stetig. Dann gilt fxy (x0 , y0 ) = fyx (x0 , y0 ) . Bevor wir diesen Satz beweisen, machen wir die folgenden Bemerkungen. Zuerst zu den Voraussetzungen des Satzes. Wir nennen die Funktion f : (x, y) → f (x, y) stetig in (x0 , y0 ), wenn sie die folgende Eigenschaft besitzt: Für jede Folge von Punkten (x1 , y1 ), (x2 , y2 ), . . . in der (x, y)-Ebene mit lim xn = x0 , lim yn = y0 n→∞ n→∞ gilt lim f (xn , yn ) = f (x0 , y0 ) . n→∞ Ist die Funktion f stetig in allen Punkten ihres Definitionsbereiches, so heisst f stetig schlechthin. Diese Definition ist offensichtlich ganz analog zur Definition der Stetigkeit bei Funktionen einer Variablen (siehe Kapitel I, Abschnitt 3). Der Leser tut gut daran, sich die damaligen Ausführungen wieder in Erinnerung zu rufen. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 19 Ohne näher auf diesen Punkt einzugehen, fügen wir noch Folgendes an. Ist f stetig in (x0 , y0 ), so ist selbstverständlich die Funktion einer Variablen x → f (x, y0 ) stetig in x0 und die Funktion y → f (x0 , y) stetig in y0 . Die Umkehrung gilt allerdings nicht: Es gibt Beispiele von Funktionen f von zwei Variablen, für welche die zugehörigen Funktionen einer Variablen stetig sind, die Funktion f selbst aber nicht stetig ist. Im Satz von Schwarz kann auf die Voraussetzung über Stetigkeit der partiellen Ableitungen fxy , fyx nicht verzichtet werden. Bei Funktionen f , welche diese Voraussetzungen nicht erfüllen, können die “gemischten Ableitungen” fxy und fyx durchaus verschieden sein. Aus dem Satz von Schwarz folgt sofort, dass es (unter geeigneten Voraussetzungen über die Stetigkeit) bei höheren Ableitungen nicht auf die Reihenfolge der Ableitung ankommt. Es gilt zum Beispiel fxyyxyx ≡ fxxxyyy , fxxy ≡ fxyx ≡ fyxx , fxyy ≡ fyxy ≡ fyyx . Es gibt also bei weitem nicht so viele verschiedene höhere Ableitungen einer Funktion f , wie es auf den ersten Blick den Anschein macht. Beweis des Satzes Wir betrachten das Quadrat in D(f ) mit den Eckpunkten (x0 , y0 ), (x0 + h, y0 ), (x0 , y0 + h), (x0 + h, y0 + h) (siehe Figur 1) und bilden die Hilfsgrösse A(h) = f (x0 + h, y0 + h) − f (x0 + h, y0 ) − [f (x0 , y0 + h) − f (x0 , y0 )]. Für die Funktion (einer Variablen) ϕ : x → f (x, y0 + h) − f (x, y0 ) gilt dann A(h) = ϕ(x0 + h) − ϕ(x0 ) . Mit Hilfe des Mittelwertsatzes der Differentialrechnung (siehe Kapitel II, Abschnitt 3) können wir diese Differenz anders schreiben: es existiert ein ξ1 zwischen x0 und x0 + h mit A(h) = ϕ(x0 + h) − ϕ(x0 ) = h ϕ0 (ξ1 ) = h(fx (ξ1 , y0 + h) − fx (ξ1 , y0 )) . 20 U. Stammbach: Analysis, Teil B (y) (x0 , y0 + h) (x0 + h, y0 + h) Fig. 1 : Zum Beweis des Satzes von Schwarz (x0 , y0 ) (x0 + h, y0 ) (x) Wiederum nach dem Mittelwertsatz der Differentialrechnung existiert ein η1 zwischen y0 und y0 + h mit der Eigenschaft fx (ξ1 , y0 + h) − fx (ξ1 , y0 ) = h fxy (ξ1 , η1 ) . Damit folgt A(h) = h2 fxy (ξ1 , η1 ) , wo (ξ1 , η1 ) ein Punkt im betrachteten Quadrat ist. Schreibt man A(h) = f (x0 + h, y0 + h) − f (x0 , y0 + h) − [f (x0 + h, y0 ) − f (x0 , y0 )] , so liefert eine analoge Überlegung einen Punkt (ξ2 , η2 ) im betrachteten Quadrat mit A(h) = h2 fyx (ξ2 , η2 ) . Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 21 Lässt man jetzt h gegen Null gehen, so müssen die Punkte (ξ1 , η1 ) und (ξ2 , η2 ) gegen den Punkt (x0 , y0 ) streben. Wegen der Stetigkeit von fxy bzw. fyx in (x0 , y0 ) folgt dann A(h) = fxy (x0 , y0 ) = fyx (x0 , y0 ) . h→0 h2 lim Diese letztere Gleichung war zu beweisen. Zum Schluss dieses Abschnittes gehen wir noch auf das Umkehrproblem ein: Gegeben seien zwei stetig differenzierbare Funktionen ϕ : (x, y) → ϕ(x, y) und ψ : (x, y) → ψ(x, y) mit gemeinsamem Definitionsbereich D(ϕ) = D(ψ). Gesucht ist eine Funktion f : (x, y) → f (x, y) mit fx (x, y) ≡ ϕ(x, y); fy (x, y) ≡ ψ(x, y). Für Funktionen einer Variablen lautet das analoge Problem wie folgt: Gegeben ist eine Funktion ϕ : x → ϕ(x). Gesucht ist eine Funktion f : x → f (x) mit f 0 (x) ≡ ϕ(x). Wir wissen, dass dieses letztere Problem für beliebige stetige Funktionen eine Lösung hat: f ist einfach eine Stammfunktion von ϕ. Im Problem für Funktionen von zwei Variablen gibt es nicht immer eine Lösung! Nach dem Satz von Schwarz folgt nämlich aus der Existenz von f sofort die Beziehung (3.1) ϕy (x, y) ≡ fxy (x, y) ≡ fyx (x, y) ≡ ψx (x, y). Für Funktionen ϕ und ψ, welche diese Beziehung nicht erfüllen, kann es somit kein f der verlangten Art geben. Der folgende Satz, den wir ohne Beweis zitieren, besagt, dass die Bedingung (3.1) für die Existenz von f hinreichend ist, wenigstens dann, wenn der gemeinsame Definitionsbereich ein achsenparalleles Rechteck ist. Wir nennen die Bedingung (3.1) deshalb Integrabilitätsbedingung. Satz Es seien ϕ und ψ zwei stetige differenzierbare Funktionen zweier Variablen mit einem achsenparallelen Rechteck als Definitionsbereich. Gilt ϕy (x, y) ≡ ψx (x, y), so existiert eine Funktion f : (x, y) → f (x, y) mit fx (x, y) ≡ ϕ(x, y) und fy (x, y) ≡ ψ(x, y). 22 U. Stammbach: Analysis, Teil B Die Funktion f ist bis auf eine additive Konstante eindeutig bestimmt; ist nämlich f ∗ eine zweite Funktion der verlangten Art, so gilt für die Differenz g(x, y) = f ∗ (x, y) − f (x, y) natürlich gx (x, y) = fx∗ (x, y) − fx (x, y) = ϕ(x, y) − ϕ(x, y) = 0 , gy (x, y) = fy∗ (x, y) − fy (x, y) = ψ(x, y) − ψ(x, y) = 0 . Wie wir aber gesehen haben, ist eine Funktion mit trivialen partiellen Ableitungen eine Konstante, d.h. g(x, y) ≡ C. Daraus folgt f ∗ (x, y) ≡ f (x, y) + C. Dies war zu beweisen. Wir schliessen diesen Abschnitt mit einigen Beispielen, die zeigen, wie man die Funktion f aus ϕ und ψ berechnen kann, falls die Intergrabilitätsbedingung erfüllt ist. Beispiel Es seien ϕ und ψ durch ϕ(x, y) = x3 + xy 2 und ψ(x, y) = x2 y + y 3 gegeben. Die Integrabilitätsbedingung ist wegen ϕy (x, y) = 2xy = ψx (x, y) erfüllt. Ausserdem sind ϕ und ψ auf der ganzen (x, y)-Ebene definiert, also auf einem achsenparallelen “Rechteck”. Nach unserem Satz existiert eine (bis auf eine additive Konstante eindeutig bestimmte) Funktion f mit fx = ϕ, fy = ψ. Aus fx (x, y) = x3 + xy 2 folgt f (x, y) = 1 4 x2 y 2 x + + v(y) , 4 2 wo v : y → v(y) eine noch näher zu bestimmende Funktion von y ist. Aus der Bedingung fy (x, y) = x2 y + y 3 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung folgt die Beziehung ! x2 y + v 0 (y) = x2 y + y 3 , so dass v 0 (y) ≡ y 3 , y4 v(y) ≡ +C . 4 Die Funktion f (x, y) hat somit die folgende Form: f (x, y) = Beispiel 1 4 x2 y 2 1 4 x + + y + C. 4 2 4 Es seien ϕ und ψ gegeben durch ϕ(x, y) = x sin y , ψ(x, y) = x2 cos y + y 2 , 2 welche auf der ganzen Ebene definiert sind. Wegen ϕy (x, y) = x cos y = ψx (x, y) ist die Integrabilitätsbedingung erfüllt. Die Gleichung fx (x, y) = x sin y liefert f (x, y) = x2 sin y + v(y), 2 wobei gelten muss fy (x, y) = Daraus folgt 2 x2 ! x cos y + v 0 (y) ≡ cos y + y 2 = ψ(x, y). 2 2 23 24 U. Stammbach: Analysis, Teil B v 0 (y) = y 2 , y3 v(y) = + C. 3 Die gesuchte Funktion f ist somit von der Form f (x, y) = x2 y3 sin y + + C. 2 3 Wir werden später mehrmals wieder auf dieses Umkehrproblem der partiellen Ableitung geführt werden: es tritt in vielen verschiedenen Zusammenhängen auf ganz natürliche Art auf. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 4 25 Linearisieren, Fehlerrechnung Das Linearisieren bei Funktionen zweier Variablen ist vollkommen analog zum Linearisieren bei Funktionen einer Variablen. Ist f : x → f (x) eine Funktion einer Variablen, so linearisiert man diese an der Stelle x0 , indem man sie durch diejenige lineare Funktion x → ax + b ersetzt, deren Graph gerade die Tangente an den Graphen Γ(f ) im Punkt (x0 , f (x0 )) ist. Ist f : (x, y) → f (x, y) eine Funktion zweier Variablen, so linearisiert man diese an der Stelle (x0 , y0 ), indem man sie durch diejenige lineare Funktion (x, y) → ax + by + c ersetzt, deren Graph gerade die Tangentialebene an den Graphen Γ(f ) im Punkte (x0 , y0 , f (x0 , y0 )) ist. Die so bestimmte lineare Funktion nennen wir lineare Ersatzfunktion von f im Punkte (x0 , y0 ). Im hier zu behandelnden Fall von zwei Variablen besitzt die lineare Ersatzfunktion laut dieser Definition die folgenden Eigenschaften: - ihr Wert in (x0 , y0 ) ist f (x0 , y0 ), - ihre partielle Ableitung nach x ist fx (x0 , y0 ), - ihre partielle Ableitung nach y ist fy (x0 , y0 ). Diese drei Eigenschaften bestimmen offensichtlich die lineare Ersatzfunktion von f in (x0 , y0 ) vollständig. Sie ist gegeben durch (x0 , y0 ) → f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) . Ihr Graph ist definitionsgemäss die Tangentialebene an den Graphen Γ(f ) von f im Punkt (x0 , y0 , f (x0 , y0 )); diese hat die Gleichung z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) . Beispiel Gegeben sei die Funktion f : (x, y) → x2 − y 2 . Gesucht ist die lineare Ersatzfunktion von f in (x0 , y0 ) = (1, −2) (siehe Figuren 1, 2). Es gilt fx (x, y) = 2x , fy (x, y) = −2y , also 26 U. Stammbach: Analysis, Teil B Fig. 1 : Die Funktion f : (x, y) → x2 − y 2 20 10 2 0 -10 0 -2 0 -2 2 Fig. 2 : Lineare Ersatzfunktion von 20 f : (x, y) → x2 − y 2 10 2 0 -10 0 -2 0 -2 2 im Punkte (1, −2) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 27 fx (1, −2) = 2 , fy (1, −2) = 4 . Ausserdem gilt f (1, −2) = −3. Die lineare Ersatzfunktion von f im Punkt (1, −2) ist somit (x, y) → −3 + 2(x − 1) + 4(y + 2) = 3 + 2x + 4y . Im Falle von Funktionen einer Variablen ist die lineare Ersatzfunktion eine gute Approximation in der Nähe des betrachteten Punktes. Dies gilt auch für Funktionen zweier Variablen. Um das zu präzisieren, betrachten wir die Differenz ϕ(∆x, ∆y) zwischen dem Funktionswert von f an der Stelle (x0 + ∆x, y0 + ∆y) und dem Funktionswert der linearen Ersatzfunktion von f in (x0 , y0 ) an dieser Stelle (x0 + ∆x, y0 + ∆y), also ϕ(∆x, ∆y) = f (x0 + ∆x, y0 + ∆y) − (f (x0 , y0 ) + fx (x0 , y0 )∆x + fy (x0 , y0 )∆y) . Dann gilt der folgende Satz Satz Es sei f : (x, y) → f (x, y) eine stetig differenzierbare Funktion von zwei Variablen und es sei (x0 , y0 ) ein Punkt des Definitionsbereiches D(f ) von f . Dann gilt lim ∆x,∆y→0 ϕ(∆x, ∆y) =0. ∆x2 + ∆y 2 p Wir können diesen Sachverhalt auch mit Hilfe des Landausymbols beschreiben: Die Differenz der Funktionswerte in (x0 + ∆x, y0 + ∆y) der Funktion f und der linearen Ersatzfunktion von p f in (x0 , y0 ) ist von kleinerer Grössenordnung als ∆x2 + ∆y 2 : ϕ(∆x, ∆y) = o Beweis q ∆x2 + ∆y 2 . Wir schreiben ϕ(∆x, ∆y) = (f (x0 + ∆x, y0 + ∆y) − f (x0 + ∆x, y0 )) + + (f (x0 + ∆x, y0 ) − f (x0 , y0 )) − fx (x0 , y0 )∆x − fy (x0 , y0 )∆y . 28 U. Stammbach: Analysis, Teil B Nach dem Mittelwertsatz der Differentialrechnung existiert ein ξ zwischen x0 und x0 + ∆x und ein η zwischen y0 und y0 + ∆y mit der Eigenschaft ϕ(∆x, ∆y) = fy (x0 + ∆x, η)∆y + fx (ξ, y0 )∆x − fx (x0 , y0 )∆x − fy (x0 , y0 )∆y . Daraus folgt ϕ(∆x, ∆y) = ∆x2 + ∆y 2 p ∆x ∆y = (fx (ξ, y0 ) − fx (x0 , y0 )) p 2 + (fy (x0 + ∆x, η) − fy (x0 , y0 )) p 2 . 2 ∆x + ∆y ∆x + ∆y 2 Wenn nun ∆x und ∆y gegen Null streben, so streben wegen der Stetigkeit von fx und fy an der Stelle (x0 , y0 ) beide Summanden auf der rechten Seite gegen Null. Es folgt also lim ∆x,∆y→0 ϕ(∆x, ∆y) =0. ∆x2 + ∆y 2 p Dies war zu beweisen. Führt man, wiederum analog zum Fall einer Funktion einer Variablen, ein parallel verschobenes Koordinatensystem mit Achsen dx, dy, df ein, dessen Ursprung mit dem Punkt (x0 , y0 , f (x0 , y0 )) zusammenfällt, so stellt sich die lineare Ersatzfunktion von f in (x0 , y0 ) durch die einfache Formel df = fx (x0 , y0 )dx + fy (x0 , y0 )dy dar. In dieser Form heisst sie üblicherweise totales Differential von f in (x0 , y0 ). Das obige Resultat besagt dann, dass die Änderung der Funktion f , also ∆f = f (x0 + ∆x, y0 + ∆y) − f (x0 , y0 ) gut durch das Differential von f in (x0 , y0 ), also durch df = fx (x0 , y0 )dx + fy (x0 , y0 )dy approximiert wird (dx = ∆x, dy = ∆y), und zwar umso besser je kleiner die Differenz gilt nämlich p ∆x2 + ∆y 2 ist; für Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung ∆f − df = o q ∆x2 + ∆y 2 29 . Wie schon bei Funktionen einer Variablen, so ist auch hier eine der Anwendungen der linearen Ersatzfunktion die Fehlerrechnung. Beispiel Bekanntlich ist das Trägheitsmoment Θ eines homogenen Vollzylinders mit Radius R, Höhe h und Dichte ρ um seine Achse gegeben durch π Θ = ρ R4 h . 2 Die (gemessenen) Grössen R und h seien mit einer Genauigkeit von 1% bekannt. Man gebe eine Fehlerabschätzung für Θ an. Das totale Differential dΘ ist eine Abschätzung für den (absoluten) Fehler ∆Θ: π π ∆Θ ∼ dΘ = ρ 4R3 h dR + ρ R4 dh . 2 2 Der relative Fehler ∆Θ/Θ lässt sich deshalb nach oben abschätzen durch ∆Θ dR dh ∼4 + = 5% . Θ R h Man beachte, dass der Fehler in R viermal stärker ins Gewicht fällt als der Fehler in h. Beispiel Mit Hilfe des Archimedischen Prinzips lässt sich das (mittlere) spezifische Gewicht γ eines unregelmässig geformten Körpers bestimmen, indem man dessen Gewicht in Luft (γLuft ∼ 0) und in Wasser (γWasser ∼ 1) feststellt. Es sei x das Gewicht in Luft und y das Gewicht im Wasser. Bezeichnet V das Volumen des Körpers, so gilt x = γV und wegen des Archimedischen Prinzips y = x−V . Daraus ergibt sich 30 U. Stammbach: Analysis, Teil B γ = x . x−y Mit welchem (relativen) Fehler ist γ höchstens behaftet, wenn x und y auf 1% genau gemessen werden. Wiederum schätzen wie den Fehler ∆γ durch das totale Differential dγ ab: ∆γ ∼ dγ = γx dx + γy dy = − y x dx + dy . 2 (x − y) (x − y)2 Daraus folgt ∆γ y ≤ γ x−y Wegen dx y + x x−y dy y 1 =2 . y x − y 100 y y−x+x = =γ−1 x−y x−y erhalten wir deshalb die Abschätzung ∆γ 1 ≤ 2|γ − 1| . γ 100 Die hier beschriebene Methode der Bestimmung des spezifischen Gewichtes ist also für grosse spezifische Gewichte γ nicht zu empfehlen. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 5 31 Extrema Bei Funktionen einer Variablen hat die Differentialrechnung ein effizientes Verfahren geliefert, um globale Extremalstellen aufzufinden. Ähnliches gilt auch für Funktionen von zwei (oder mehr) Variablen. Es sei f : (x, y) → f (x, y) eine auf D(f ) definierte Funktion. Ein Punkt (x0 , y0 ) heisst globale Maximalstelle von f , wenn für alle (x, y) ∈ D(f ) die Ungleichung f (x, y) ≤ f (x0 , y0 ) (y) D(f ) Fig. 1 : Zur Definition eines lokalen Extremums (x0 , y0 ) D (x) erfüllt ist. Der Funktionswert f (x0 , y0 ) heisst globales Maximum von f . Der Punkt (x0 , y0 ) ∈ D(f ) heisst lokale Maximalstelle, wenn es eine Kreisscheibe D mit Mittelpunkt (x0 , y0 ) gibt, so dass für alle (x, y), die zugleich in D(f ) und in D liegen, die Ungleichung f (x, y) ≤ f (x0 , y0 ) 32 U. Stammbach: Analysis, Teil B erfüllt ist (siehe Figur 1). Der Funktionswert f (x0 , y0 ) heisst in diesem Fall ein lokales Maximum von f . Analog ist eine globale bzw. lokale Minimalstelle und ein globales bzw. lokales Minimum definiert. Unter einer Extremalstelle versteht man eine Maximal- oder Minimalstelle und eine Extremum ist ein Maximum oder Minimum. Beispiel Für die Funktion f : (x, y) → f (x, y) = x2 + y 2 , D(f ) = R × R ist der Punkt (0, 0) eine globale Minimalstelle. Es gibt hingegen keine Maximalstelle, weder eine lokale noch eine globale. Es gibt also Beispiele, wo Extremalstellen der einen oder anderen Art nicht existieren. Der folgende mathematische Satz garantiert allerdings in vielen Fällen die Existenz von Extremalstellen. Ist f : (x, y) → f (x, y) eine stetige Funktion, deren Definitionsbereich D(f ) ein endliches abgeschlossenes (d.h. inklusive Rand) Gebiet der (x, y)-Ebene ist, so existiert für f in D(f ) (mindestens) eine globale Maximalstelle und (mindestens) eine globale Minimalstelle. Die Bestimmung der globalen Extremalstellen einer Funktion wird in erheblichem Mass durch das nachfolgende Resultat erleichtert. Es erlaubt, eine Liste von Punkten der (x, y)-Ebene aufzustellen, in der alle lokalen Extremalstellen (möglicherweise aber noch weitere Punkte) vorkommen. Satz Es sei f : (x, y) → f (x, y) eine in D(f ) definierte Funktion. Ist (x0 , y0 ) eine lokale Extremalstelle von f , so ist - (x0 , y0 ) ein Punkt des Randes von D(f ), oder - mindestens eine der partiellen Ableitungen fx oder fy ist in (x0 , y0 ) nicht definiert, oder - die partiellen Ableitungen fx und fy sind in (x0 , y0 ) definiert, und es gilt fx (x0 , y0 ) = 0 = fy (x0 , y0 ) . Wir rufen in Erinnerung (siehe Abschnitt 4), dass der Graph von f in Punkten (x0 , y0 ) mit fx (x0 , y0 ) = 0 = fy (x0 , y0 ) eine horizontale Tangentialebene besitzt. Man beachte ferner (und vergleiche mit der Situation bei Funktionen von einer Variablen): - nicht jede Extremalstelle von f ist eine gemeinsame Nullstelle von fx und fy ; - nicht jede gemeinsame Nullstelle von fx und fy ist Extremalstelle von f . Der Beweis des Satzes folgt direkt aus dem eindimensionalen Fall. Ist nämlich (x0 , y0 ) ∈ D(f ) eine lokale Extremalstelle von f , so besitzt offensichtlich auch die Funktion (einer Variablen) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 33 (y) D(f ) Fig. 2 : Zum Beweis des Satzes (x0 , y0 ) y = y0 (x) ϕ : x → ϕ(x) = f (x, y0 ) , (x0 , y0 ) ∈ D(f ) in x0 eine Extremalstelle (siehe Figur 2). Daraus folgt nach Kapitel II, Abschnitt 4, - dass x0 und damit (x0 , y0 ) ein Randpunkt ist, oder, - dass ϕ0 (x0 ) = fx (x0 , y0 ) nicht definiert ist, oder - dass gilt ϕ0 (x0 ) = fx (x0 , y0 ) = 0. Da Analoges auch für die Funktion ψ : y → ψ(y) = f (x0 , y) gilt, ist der Beweis vollständig. Beispiel Es sei eine reelle Zahl a > 0 gegeben. Man bestimme denjenigen Punkt P in der (x, y)-Ebene, für welchen die Summe der Abstände von der x-Achse, von der y-Achse und von der Geraden x + y = a am kleinsten ist (siehe Figur 3). Man sieht leicht, dass der Punkt P nicht ausserhalb des Dreiecks D mit den Eckpunkten (0, 0), (a, 0), (0, a) liegen kann, denn zu jedem ausserhalb von D liegenden Punkt P 0 lässt sich sofort ein anderer Punkt angeben, für den die Summe der Abstände kleiner wird. Für Punkte im Dreieck D ist die Summe der Abstände f (x, y) gegeben durch 34 U. Stammbach: Analysis, Teil B (y) (0, a) x+y =a Fig. 3 : Zur Berechnung der Summe der Abstände D P (x) (0, 0) (a, 0) 1 f (x, y) = x + y + √ (a − x − y) . 2 Somit haben wir für die Funktion f : (x, y) → f (x, y) , D(f ) = D die globale Minimalstelle zu suchen. Zu diesem Zweck untersuchen wir einerseits die Randpunkte des Dreiecks D und andererseits die partiellen Ableitungen von f . Für letztere gilt 1 1 fx (x, y) = 1 − √ , fy (x, y) = 1 − √ . 2 2 Die partiellen Ableitungen existieren also im ganzen Definitionsbereich und besitzen dort keine gemeinsamen Nullstellen. Nach unserem Satz muss die globale Minimalstelle (müssen die globalen Minimalstellen) von f folglich auf dem Rand von D zu finden sein. Für die Werte von f auf den Punkten des Randes von D erhalten wir (siehe Figur 4): x=0, f (0, y) = y + y=0, f (x, 0) = x + √1 2 √1 2 (a − y) , 0 ≤ y ≤ a , (a − x) , 0 ≤ x ≤ a . Für x + y − a = 0 ist f ≡ a. Die globale Minimalstelle der√Funktion f in D ist deshalb im Punkte (0, 0) zu finden; das globale Minimum ist f (0, 0) = a/ 2. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 35 a x+ √1 2 (a − x) Fig. 4 : Verhalten von f auf der x-Achse (x) a Beispiel Es sei a < 0 eine reelle Zahl. Man bestimme denjenigen Punkt Q in der (x, y)-Ebene, für den die Summe der Quadrate der Abstände von der x-Achse, von der y-Achse und von der Geraden x + y − a = 0 minimal wird. Für den Punkt (x, y) der (x, y)-Ebene ist die Summe der Quadrate der Abstände gegeben durch g(x, y) = x2 + y 2 + 1 (x + y − a)2 . 2 Es ist folglich die globale Minimalstelle der Funktion g : (x, y) → g(x, y) , D(g) = R × R zu suchen. Da es keine Randpunkte gibt und die Funktion g überall differenzierbar ist, kommt für die sicherlich existierende globale Minimalstelle nur eine gemeinsame Nullstelle der partiellen Ableitungen gx und gy in Frage. Dies führt auf das Gleichungssystem gx (x, y) = 2x + x + y − a = 0 gy (x, y) = 2y + x + y − a = 0 . Die (einzige) Lösung ist x = y = a/4. Der Punkt Q = (a/4, a/4) ist somit die globale Minimalstelle von g. Das globale Minimum ist a2 /4. 36 U. Stammbach: Analysis, Teil B Beispiel Gegeben ist die Funktion f : (x, y) → f (x, y) = 2x2 + 4xy + 3y 2 − 8x − 10y + 2 (siehe Figur 5). Man bestimme die globale Maximalstelle von f auf dem Quadrat mit den Eckpunkten A = (0, 0), B = (2, 0), C = (0, 2), D = (2, 2). 2 1.75 1.5 Fig. 5 : Niveaulinien der Funktion f : (x, y) → f (x, y) = 2 = 2x + 4xy + 3y 2 − 8x − 10y + 2 1.25 1 0.75 0.5 0.25 0 0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 Da die Funktion f überall differenzierbar ist, sind die Randpunkte und die gemeinsamen Nullpunkte der ersten partiellen Ableitungen näher zu untersuchen. Für letztere erhalten wir das Gleichungssystem fx (x, y) = 4x + 4y − 8 =0 fy (x, y) = 4x + 6y − 10 = 0 Die einzige Lösung ist x = y = 1. Damit ist der Punkt (1, 1) ein Kandidat für die globale Maximalstelle. Wir wenden uns jetzt den Randpunkten des Quadrates zu. Auf der Quadratseite AB, also für y = 0 erhält man f (x, 0) = 2x2 − 8x + 2 ; auf AC, also für x = 0 erhält man Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 37 f (0, y) = 3y 2 − 10y + 2 ; auf CD, also für y = 2 erhält man f (x, 2) = 2x2 + 8x + 12 − 8x − 18 = 2x2 − 6 und auf BD, also für x = 2 erhält man f (2, y) = 8 + 8y + 3y 2 − 16 − 10y + 2 = 3y 2 − 2y − 6 . In jedem Fall erhält man eine quadratische Funktion, deren Graph eine nach oben geöffnete Parabel ist. Die grössten Funktionswerte werden also notwendigerweise in den Endpunkten der Definitionsintervalle, d.h. in den Eckpunkten A, B, C, D des Quadrates angenommen. Ein Vergleich der Werte von f auf diesen Punkten und auf dem Punkt (1, 1) liefert dann das Resultat. Wir erhalten f (0, 0) = 2, f (2, 0) = −6, f (0, 2) = −6, f (2, 2) = 2, f (1, 1) = −7 . Die Punkte A = (0, 0) und D = (2, 2) sind also die beiden globalen Maximalstellen der Funktion f im Quadrat ABCD. 38 U. Stammbach: Analysis, Teil B 6 Verallgemeinerte Kettenregel Es sei eine Funktion f : (x, y) → f (x, y) gegeben und eine in ihrem Definitionsbereich D(f ) verlaufende Kurve K durch die Parameterdarstellung t → (x(t), y(t)) . Wir betrachten die zusammengesetzte Funktion t → F (t) = f (x(t), y(t)) , welche t den Wert von f an der zu t gehörenden Stelle der Kurve K zuordnet (siehe Figuren 1, 2). Wir fragen nach der Ableitung von F nach t. Laut Definition gilt dF (t) = dt F (t + ∆t) − F (t) ∆t→0 ∆t f (x(t + ∆t), y(t + ∆t)) − f (x(t), y(t)) = lim ∆t→0 ∆t f (x(t) + ∆x, y(t) + ∆y) − f (x(t), y(t)) = lim , ∆t→0 ∆t lim wobei wir ∆x = x(t + ∆t) − x(t) , ∆y = y(t + ∆t) − y(t) gesetzt haben. Mit den Bezeichnungen von Abschnitt 4 erhalten wir nun dF (t) = dt ∆x ∆y ϕ(∆x, ∆y) · lim fx (x(t), y(t)) + fy (x(t), y(t)) +p 2 ∆t→0 ∆t ∆t ∆x + ∆y 2 = fx (x(t), y(t)) ẋ(t) + fy (x(t), y(t)) ẏ(t) , denn es gilt nach Abschnitt 4 ϕ(∆x, ∆y) lim p =0, ∆t→0 ∆x2 + ∆y 2 aber p ∆x2 + ∆y 2 ∆t ! Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 39 (y) K (x) Fig. 1 : Kurve K gegeben durch x : t → 5 − 32 t cos t y : t → 1 + t sin t für 1 ≤ t ≤ 7.5 100 75 50 25 (t) 2 4 6 Fig. 2 : Graph der zusammengesetzten Funktion 8 t → F (t) = f (x(t), y(t)) , -25 mit f : (x, y) → f (x, y) = xy 2 -50 -75 -100 40 U. Stammbach: Analysis, Teil B p lim ∆t→0 ∆x2 + ∆y 2 = lim ∆t→0 ∆t s ∆x ∆t 2 + ∆y ∆t 2 q = (ẋ(t))2 + (ẏ(t))2 . Damit haben wir die sogenannte verallgemeinerte Kettenregel bewiesen: Satz dF df (t) = (x(t), y(t)) = fx (x(t), y(t)) ẋ(t) + fy (x(t), y(t)) ẏ(t) . dt dt Während die gewöhnliche Kettenregel vor allem beim Ableiten von komplizierten Funktionen nützlich ist, liegen die Anwendungen der verallgemeinerten Kettenregel in einer etwas anderen Richtung. Wir illustrieren dies mit den folgenden Beispielen. Beispiel Die Kurve K sei in impliziter Darstellung, d.h. durch eine Gleichung der Form f (x, y) = 0 gegeben. Es sei (x0 , y0 ) ein Punkt der Kurve, also f (x0 , y0 ) = 0. Wir fragen nach der Steigung der Kurve in (x0 , y0 ). Um die Steigung zu berechnen, denken wir uns die Kurve in einer kleinen Umgebung von (x0 , y0 ) in expliziter Form gegeben: sie sei dort der Graph der Funktion (einer Variablen) ϕ : x → ϕ(x) , x0 − ∆x ≤ x ≤ x0 + ∆x . Es gilt dann also f (x, ϕ(x)) ≡ 0 für x0 − ∆x ≤ x ≤ x0 + ∆x und die Steigung von K in (x0 , y0 ) ist ϕ0 (x0 ). Fassen wir x als Parameter auf, so erhalten wir durch Ableiten nach x mit Hilfe der verallgemeinerten Kettenregel die Beziehung fx (x, ϕ(x)) · 1 + fy (x, ϕ(x)) · ϕ0 (x) = 0 . Daraus ergibt sich für die Steigung ϕ0 (x0 ) der Kurve in (x0 , y0 ) ϕ0 (x0 ) = − Beispiel fx (x0 , y0 ) . fy (x0 , y0 ) Wir betrachten noch kurz den Spezialfall, wo die Kurve K die Ellipse x2 y 2 + 2 =1 a2 b Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 4 2 (x0 , y0 ) -4 -2 2 Fig. 3 : Tangente an Ellipse 4 -2 -4 ist, und fragen nach der Gleichung der Tangente im Ellipsenpunkt (x0 , y0 ) (siehe Figur 3). Zu diesem Zweck betrachten wir die Ellipse als Kurve gegeben durch x2 y 2 + 2 −1=0 a2 b und bestimmen zuerst die Steigung m in (x0 , y0 ). Nach obigem gilt m=− fx (x0 , y0 ) b 2 x0 . =− 2 fy (x0 , y0 ) a y0 Die Tangente an die Ellipse im Punkt (x0 , y0 ) ist somit durch die Gleichung y − y0 = − b 2 x0 (x − x0 ) a2 y0 gegeben. Diese lässt sich vereinfachen zu x0 (x − x0 ) y0 (y − y0 ) + =0. a2 b2 41 42 U. Stammbach: Analysis, Teil B Berücksichtigt man noch, dass (x0 , y0 ) ein Punkt der Ellipse ist, und deshalb die Gleichung x2 y 2 + 2 =1 a2 b erfüllt, so erhält man für die Tangente die einfache Gleichung x0 y0 x+ 2 y =1 . 2 a b Beispiel Der Zustand eines Gases wird durch die Grössen Druck p, Volumen V und (absolute) Temperatur T beschrieben, welche untereinander durch die sogenannte Zustandsgleichung des Gases verbunden sind. (Die einfachste solche Zustandsgleichung ist die des idealen Gases pV = RT . Dabei ist R die sogenannte Gaskonstante. Etwas komplizierter ist die van der Waal’sche Zustandsgleichung, welche das Verhalten realer Gase genauer beschreibt; sie lautet a p + 2 (V − b) = RT . V Dabei sind die Grössen a, b vom betrachteten Gas abhängige Konstanten.) Die Zustandsgleichung sagt, dass für eine feste Menge Gas je zwei der drei Grössen p, V, T die dritte festlegen. Man hat folglich (wenigstens lokal!) Funktionen p : (V, T ) → p(V, T ) V : (p, T ) → V (p, T ) T : (p, V ) → T (p, V ) , welche aus der Gaszustandsgleichung folgen. dehnungskoeffizienten α des Gases durch α= 1 V In der Physik definiert man dann den Aus ∂V ∂T p , den Spannungskoeffizienten β durch 1 β= p und die Kompressibilität κ durch ∂p ∂T V , Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 κ=− V ∂V ∂p 43 . T (Es ist in diesem Zusammenhang in der Physik üblich, die bei der partiellen Ableitung festgehaltenen Grössen als Index hinzuschreiben; aus mathematischen Gründen wäre dies natürlich nicht notwendig!) Zwischen den Koeffizienten α, β, κ, die im allgemeinen Funktionen der Grössen p, V, T sind, besteht kraft der Zustandsgleichung eine einfache Beziehung. Diese wollen wir nun herleiten. Zu diesem Zweck gehen wir von der Funktion V : (p, T ) → V (p, T ) aus. Halten wir V konstant, V = C, so ist der Druck p nur von T abhängig; es sei p̃ : T → p̃(T ) die entsprechende Funktion. Dann gilt V (p̃(T ), T ) ≡ C . (6.2) Mathematisch ausgedrückt betrachtet man eine explizite Darstellung der Niveaulinie der Funktion V : (p, T ) → V (p, T ) zum Niveau C. Nun ist aber offenbar dp̃ = dT ∂p ∂T V , so dass die Ableitung der Beziehung (6.2) nach T die Gleichung 0= ∂V ∂p T ∂p ∂T V + ∂V ∂T p liefert. Daraus erhalten wir laut Definition von α, β, κ unmittelbar α = pκβ . Dies ist die gewünschte Beziehung. Man beachte, dass sie bereits aus der Existenz einer Zustandsgleichung hergeleitet wurde, die spezielle Form der Zustandsgleichung spielte dabei überhaupt keine Rolle. 44 7 U. Stammbach: Analysis, Teil B Funktionen von drei Variablen In diesem Abschnitt geht es darum, in verhältnismässig konzentrierter Weise reellwertige Funktionen von drei Variablen zu behandeln. Dabei wenden wir uns vor allem denjenigen Punkten zu, bei denen im Schritt von zwei auf drei Variablen neue Aspekte zur Geltung kommen. Durch eine reellwertige Funktion von drei Variablen f : (x, y, z) → f (x, y, z) wird jedem Tripel (x, y, z) eine reelle Zahl f (x, y, z) zugeordnet (siehe Figur 1). Der Definitionsbereich D(f ) kann als eine Untermenge des dreidimensionalen Raumes angesehen werden. f (x, y, z) 0 R Fig. 1 : Funktion von drei Variablen (z) f (y) D(f ) (x, y, z) R ×R ×R (x) In Anwendungen ist der Funktionswert f (x, y, z) oft eine skalare physikalische Grösse, die den Zustand in Punkte (x, y, z) beschreibt. Man denke in diesem Zusammenhang etwa an die (im Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 45 Körper D(f ) herrschende, von Punkt zu Punkt variierende) Temperatur T oder an die (vom Ort abhängige) Dichte ρ. Beispiel Die Funktion f : (x, y, z) → f (x, y, z) = ax + by + cz + d , D(f ) = R × R × R heisst linear. Der Wertebereich W (f ) besteht aus allen reellen Zahlen, falls (a, b, c) 6= (0, 0, 0). Beispiel Die Funktion 1 f : (x, y, z) → f (x, y, z) = p 2 x + y2 + z2 ist auf dem ganzen dreidimensionalen Raum mit Ausnahme des Nullpunktes definiert. Der Wertebereich besteht aus allen positiven Zahlen. Zur Veranschaulichung solcher Funktionen stehen wiederum verschiedene Möglichkeiten zur Verfügung. Allerdings scheidet die Betrachtung des Graphen der Funktion weitgehend aus, da für diesen bei einer Funktion von drei Variablen ein vierdimensionaler Raum benötigt würde, der sich natürlich zur Veranschaulichung kaum eignet. Die wohl einfachste Art sich über das Verhalten einer Funktion von drei Variablen klar zu werden, dürfte darin bestehen, deren Niveauflächen zu betrachten. Die Niveaufläche von f zum Niveau C ist die Fläche im dreidimensionalen Raum, die durch die Gleichung f (x, y, z) = C gegeben ist. Sie besteht aus allen Punkten im dreidimensionalen Raum, auf denen f den Wert C annimmt. Beispiel Die Niveaufläche von f : (x, y, z) → f (x, y, z) = ax + by + cz + d zum Niveau C ist die Ebene mit der Gleichung ax + by + cz = C − d . Die Niveaufläche von 1 f : (x, y, z) → f (x, y, z) = p 2 x + y2 + z2 zum Niveau C ist gegeben durch p x2 1 =C ; + y2 + z2 dies ist die Oberfläche einer Kugel mit Radius 1/C und Mittelpunkt 0, x2 + y 2 + z 2 = 1/C 2 . 46 U. Stammbach: Analysis, Teil B Die partiellen Ableitungen fx (x, y, z), fy (x, y, z), fz (x, y, z) ; bezeichnen wir auch durch ∂f ∂f ∂f (x, y, z) , (x, y, z) , (x, y, z) . ∂x ∂y ∂z Sie sind auf offensichtliche Weise definiert. Ein Beispiel mag hier genügen. Beispiel Es sei f : (x, y, z) → f (x, y, z) = sin(xyz) . Dann sind die partiellen Ableitungen gegeben durch fx (x, y, z) = yz cos(xyz) , fy (x, y, z) = xz cos(xyz) , fz (x, y, z) = xy cos(xyz) . Wegen des Satzes von Schwarz kommt es (unter geeigneten Stetigkeitsvoraussetzungen) nicht auf die Reihenfolge der partiellen Ableitungen an; z.B. gilt fxz (x, y, z) = fzx (x, y, z) , fxzxy (x, y, z) ≡ fxxyz (x, y, z) , etc. . Wie im Falle von zwei Variablen gibt der Satz von Schwarz Anlass zu Integrabilitätsbedingungen. Es seien drei Funktionen ϕ : (x, y, z) → ϕ(x, y, z) , ψ : (x, y, z) → ψ(x, y, z) , χ : (x, y, z) → χ(x, y, z) von drei Variablen mit dem gemeinsamen Definitionsbereich D gegeben, und man suche eine Funktion f : (x, y, z) → f (x, y, z) von drei Variablen mit fx ≡ ϕ , fy ≡ ψ , fz ≡ χ . Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 47 Existiert die Funktion f , so müssen wegen dem Satz von Schwarz für die partiellen Ableitungen die folgenden Gleichungen gelten ϕy ≡ fxy ≡ fyx ≡ ψx , ϕz ≡ fxz ≡ fzx ≡ χx , ψz ≡ fyz ≡ fzy ≡ χy . Es gilt dann das zum Fall von zwei Variablen analoge Resultat: Wenn diese Integrabilitätsbedingungen erfüllt sind, und der gemeinsame Definitionsbereich von ϕ, ψ , χ ein achsenparalleler Quader ist, so existiert die Funktion f , und sie ist bis auf eine additive Konstante eindeutig bestimmt. Beispiel Es seien ϕ, ψ , χ gegeben durch ϕ(x, y, z) = 3x2 + 3y − 1 , ψ(x, y, z) = z 2 + 3x , χ(x, y, z) = 2yz + 1 . Der gemeinsame Definitionsbereich ist der ganze dreidimensionale Raum. Wegen ϕy (x, y, z) = 3 = ψx (x, y, z) , ϕz (x, y, z) = 0 = χx (x, y, z) , ψz (x, y, z) = 2z = χy (x, y, z) sind die Integrabilitätsbedingungen erfüllt. Daraus folgt, dass die Funktion f existiert. ! Aus fx = ϕ folgt f (x, y, z) = x3 + 3xy − x + u(y, z) . Die Bedingung ! z 2 + 3x = ψ(x, y, z) = fy (x, y, z) = 3x + uy (y, z) liefert dann z 2 = uy (y, z) und daraus folgt u(y, z) = yz 2 + v(z) . 48 U. Stammbach: Analysis, Teil B Damit ist f von der Form f (x, y, z) = x3 + 3xy − x + yz 2 + v(z) . Schliesslich liefert die dritte Bedingung ! 2yz + 1 = χ(x, y, z) = fz (x, y, z) = 2yz + v 0 (z) die noch fehlende Information. Es gilt v 0 (z) = 1 und damit v(z) = z + C . Die gesuchte Funktion f ist also durch f (x, y, z) = x3 + 3xy − x + yz 2 + z + C gegeben. Analog wie bei Funktionen von zwei Variablen lautet die verallgemeinerte Kettenregel. Es sei f : (x, y, z) → f (x, y, z) eine Funktion von drei Variablen und t → (x(t), y(t), z(t)) die Parameterdarstellung einer Kurve im Definitionsbereich von f . Dann gilt für die zusammengesetzte Funktion F : t → F (t) = f (x(t), y(t), z(t)) dF (t) = fx (x(t), y(t), z(t)) ẋ(t) + fy (x(t), y(t), z(t)) ẏ(t) + fz (x(t), y(t), z(t)) ż(t) . dt An dieser Stelle wollen wir nun einen Schritt weitergehen als bei der Behandlung von Funktion von zwei Variablen. Wir bemerken, dass die in dieser Ableitung vorkommende Bildung als Skalarprodukt von zwei Vektoren aufgefasst werden kann, nämlich als Skalarprodukt des Vektors (fx (x(t), y(t), z(t)), fy (x(t), y(t), z(t)), fz (x(t), y(t), z(t))) mit dem Vektor (ẋ(t), ẏ(t), ż(t)) . Der letztere Vektor ist bekanntlich ein Tangentialvektor (der Geschwindigkeitsvektor) an die Kurve K. Wir machen die folgende Definition. Unter dem Gradienten grad f (x0 , y0 , z0 ) von f im Punkt (x0 , y0 , z0 ) verstehen wir den Vektor grad f (x0 , y0 , z0 ) = (fx (x0 , y0 , z0 ), fy (x0 , y0 , z0 ), fz (x0 , y0 , z0 )) . 49 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Mit dieser Bildung wird der Funktion f in jedem Punkt (x0 , y0 , z0 ) ihres Definitionsbereiches ein Vektor grad f (x0 , y0 , z0 ) zugeordnet, den man sich natürlich in diesem Punkte angebracht denken kann. Der Gradient ordnet also jeder Funktion f ein Vektorfeld, das sogenannte Gradientenfeld von f , zu. Auf den wichtigen Begriff des Vektorfeldes kommen wir im Kapitel VI eingehend zu sprechen. Mit Hilfe des Gradienten schreibt sich die verallgemeinerte Kettenregel in der folgenden einfachen Form, dF (t) = ~r˙ (t) · grad f (x(t), y(t), z(t)) , dt wo ~r˙ (t) der zur Kurve gehörige Geschwindigkeitsvektor ist. Beispiel Für die Funktion f : (x, y, z) → ax + by + cz + d gilt grad f (x, y, z) = (a, b, c) . Der Gradient der linearen Funktion ist ein konstanter Vektor. Beispiel Für die Funktion f : (x, y, z) → x2 1 + y2 + z2 erhält man grad f (x, y, z) = −2x −2y −2z , , 2 2 2 2 2 2 2 2 2 (x + y + z ) (x + y + z ) (x + y 2 + z 2 )2 . Der Gradient von f zeigt in jedem Punkt gegen den Ursprung. Seine Länge ist gegeben durch 2/(x2 + y 2 + z 2 )3/2 . Sie ist umso grösser, je näher der Punkt (x, y, z) dem Ursprung ist. Als nächstes betrachten wir den Spezialfall der verallgemeinerten Kettenregel, wo die Kurve K eine Gerade ist. Diese sei durch die Parameterdarstellung t → (x0 + e1 t, y0 + e2 t, z0 + e3 t) gegeben, wobei wir annehmen, dass ~e ein Einheitsvektor ist und wir für den ausgezeichneten Punkt der Geraden gerade den Punkt (x0 , y0 , z0 ) genommen haben. Dann gilt wegen dF (t) = ~r˙ (t) · grad f (x(t), y(t), z(t)) dt natürlich dF (0) = ~e · grad f (x0 , y0 , z0 ) . dt 50 U. Stammbach: Analysis, Teil B Diesen Wert nennen wir die Richtungsableitung von f in (x0 , y0 , z0 ) in Richtung ~e, D~e f (x0 , y0 , z0 ) = dF (0) = ~e · grad f (x0 , y0 , z0 ) . dt Sie beschreibt die momentane Änderung des Funktionswertes an der Stelle (x0 , y0 , z0 ) in Richtung ~e. Man beachte, dass in dieser Definition ~e ein Einheitsvektor ist. Beispiel Für die Funktion f : (x, y, z) → sin(xyz) bestimme man die Richtungsableitung in (1, 0, 1) in Richtung des Einheitsvektors √13 (−1, 1, 1). Es gilt 1 1 D~e f (1, 0, 1) = √ (−1, 1, 1) · (0, 1, 0) = √ . 3 3 Beispiel Für ~e = (1, 0, 0) erhält man für die Richtungsableitung in (x, y, z) in Richtung ~e D~e f (x, y, z) = ~e · grad f (x, y, z) = fx (x, y, z) . Analoges gilt für ~e = (0, 1, 0) und ~e = (0, 0, 1). Die partiellen Ableitungen von f sind also die Richtungsableitungen in Richtung der Koordinatenachsen. Wie die Formel für die Richtungsableitung zeigt, ist diese an der Stelle (x0 , y0 , z0 ) für jede beliebige Richtung ~e bestimmt, wenn der Gradient von f in (x0 , y0 , z0 ) bekannt ist: Der Vektor grad f (x0 , y0 , z0 ) beschreibt, wie sich die Funktion f in der unmittelbaren Umgebung von (x0 , y0 , z0 ) ändert. Diesem Zusammenhang wollen wir hier noch etwas genauer nachgehen, indem wir die Abhängigkeit der Richtungsableitung von der Richtung ~e studieren. Es gilt D~e f (x0 , y0 , z0 ) = ~e · grad f (x0 , y0 , z0 ) = |~e| · |grad f (x0 , y0 , z0 )| · cos ω , wobei ω den von ~e und dem Vektor grad f (x0 , y0 , z0 ) eingeschlossenen Winkel bezeichnet (siehe Figur 2). Wir lesen daran das Folgende ab: Für ω = 0, d.h. wenn ~e die gleiche Richtung wie grad f (x0 , y0 , z0 ) besitzt, so gilt D~e f (x0 , y0 , z0 ) = |grad f (x0 , y0 , z0 )| . Die Richtungsableitung ist in diesem Fall gerade gleich der Länge des Gradienten. Dies ist offensichtlich der grösstmögliche Wert der Richtungsableitung im Punkte (x0 , y0 , z0 ). Er wird gerade in der Richtung erreicht, in welche der Gradient zeigt; in Richtung des Gradienten ist folglich der grösste Anstieg der Funktionswerte von f festzustellen. Satz Die Richtung des Gradienten grad f (x0 , y0 , z0 ) gibt die Richtung der grössten Richtungsableitung von f in (x0 , y0 , z0 ) an; die Länge des Gradienten ist gleich der grössten Richtungsableitung von f in (x0 , y0 , z0 ). Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 51 ~e grad f (x0 , y0 , z0 ) ω (z) (y) Fig. 2 : Richtungsableitung von f im Punkte (x0 , y0 , z0 ) und grad f (x0 , y0 , z0 ) (x0 , y0 , z0 ) (x) Für ω = π/2, d.h. für ~e ⊥ grad f (x0 , y0 , z0 ) ist die Richtungsableitung D~e f (x0 , y0 , z0 ) Null, d.h. für die Richtung ~e ist die momentane Änderung des Funktionswertes von f Null. Daraus schliessen wir, dass ~e tangential zur Niveaufläche von f durch den Punkt (x0 , y0 , z0 ) ist. Dies bedeutet aber, dass der Vektor grad f (x0 , y0 , z0 ) senkrecht auf der Niveaufläche steht. Satz Der Gradient von f in (x0 , y0 , z0 ) steht senkrecht auf der Niveaufläche von f , welche durch den Punkt (x0 , y0 , z0 ) geht. Beispiel Der Gradient der Funktion 1 f : (x, y, z) → p 2 x + y2 + z2 ist gegeben durch grad f (x, y, z) = wobei wir wie üblich r = −x −y −z , , r3 r3 r3 p , x2 + y 2 + z 2 gesetzt haben. Die Länge des Gradienten ist folglich |grad f (x, y, z)| = 1 . r2 52 U. Stammbach: Analysis, Teil B Dies ist der Wert der grössten Richtungsableitung in (x, y, z). Da der Gradient gegen den Nullpunkt zu gerichtet ist, wird die grösste Richtungsableitung (grösster Anstieg der Funktionswerte) in dieser Richtung erreicht. Die in den beiden Sätzen beschriebenen Eigenschaften des Gradienten sind in Anwendungen äusserst nützlich. Wir geben dazu einige Beispiele. Beispiel Gegeben seien die Flächenscharen x2 + 2y 2 + 2z 2 = C1 , q x2 / y 2 − z 2 = C2 . Man zeige, dass jede Fläche der einen Schar jede Fläche der andern Schar orthogonal schneidet. Wir fassen die beiden Flächenscharen als Niveauflächen der Funktionen f1 (x, y, z) = x2 + 2y 2 + 2z 2 , q f2 (x, y, z) = x2 / y 2 − z 2 auf. Es ist dann zu zeigen, dass in (x, y, z) die Gradienten von f1 und f2 senkrecht aufeinanderstehen, d.h. dass das Skalarprodukt grad f1 · grad f2 Null ist. Wir erhalten grad f1 (x, y, z) = (2x, 4y, 4z), grad f2 (x, y, z) = 2x −x2 y x2 z , , (y 2 − z 2 )1/2 (y 2 − z 2 )3/2 (y 2 − z 2 )3/2 ! . Daraus ergibt sich für das Skalarprodukt sofort grad f1 · grad f2 = 1 2 2 2 2 2 2 2 4x (y − z ) − 4x y + 4x z =0. (y 2 − z 2 )3/2 Beispiel Wir betrachten in diesem Beispiel die Niveaufläche durch den Punkt (x0 , y0 , z0 ) der Funktion f und fragen nach der Gleichung der Tangentialebene im Punkt (x0 , y0 , z0 ). Wir wissen, dass der Gradient grad f (x0 , y0 , z0 ) senkrecht auf der Niveaufläche durch (x0 , y0 , z0 ) steht. Damit ist dieser Vektor auch senkrecht zur Tangentialebene. Die Tangentialebene geht ausserdem durch den Punkt (x0 , y0 , z0 ). Ihre Gleichung lautet damit offenbar fx (x0 , y0 , z0 ) x + fy (x0 , y0 , z0 ) y + fz (x0 , y0 , z0 ) z = = fx (x0 , y0 , z0 ) x0 + fy (x0 , y0 , z0 ) y0 + fz (x0 , y0 , z0 ) z0 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 53 Beispiel Es sei (x0 , y0 , z0 ) ein Punkt des Ellipsoides x2 y 2 z 2 + 2 + 2 =1. a2 b c Gesucht ist die Tangentialebene in (x0 , y0 , z0 ) an das Ellipsoid (siehe Figur 3). Fig. 3 : Ellipsoid Wir fassen das Ellipsoid als die durch den Punkt (x0 , y0 , z0 ) gehende Niveaufläche der Funktion f : (x, y, z) → x2 y 2 z 2 + 2 + 2 −1 a2 b c auf. Die Tangentialebene wird dann durch die Gleichung fx (x0 , y0 , z0 )(x − x0 ) + fy (x0 , y0 , z0 )(y − y0 ) + fz (x0 , y0 , z0 )(z − z0 ) = 0, also durch 2x0 2y0 2z0 (x − x0 ) + 2 (y − y0 ) + 2 (z − z0 ) = 0 2 a b c 54 U. Stammbach: Analysis, Teil B beschrieben. Berücksichtigt man, dass der Punkt (x0 , y0 , z0 ) die Gleichung x20 y02 z02 + 2 + 2 =1 a2 b c erfüllt, so ergibt sich daraus die folgende einfache Form der Gleichung der Tangentialebene im Punkte (x0 , y0 , z0 ) an das Ellipsoid x0 y0 z0 x+ 2 y+ 2 z =1 . a2 b c Beispiel Die lineare Ersatzfunktion einer Funktion f von drei Variablen ist analog definiert wie im Falle von zwei Variablen. Sie ist diejenige lineare Funktion, die in (x0 , y0 , z0 ) denselben Funktionswert und auch dieselben ersten partiellen Ableitungen wie die Funktion f besitzt. Die lineare Ersatzfunktion von f : (x, y, z) → f (x, y, z) in (x0 , y0 , z0 ) wird deshalb durch die Formel (x, y, z) → f (x0 , y0 , z0 ) + fx (x0 , y0 , z0 )(x − x0 ) + fy (x0 , y0 , z0 )(y − y0 ) + fz (x0 , y0 , z0 )(z − z0 ) beschrieben. Schliesslich gilt auch hier, analog zum Fall von zwei Variablen, dass die Differenz zwischen dem Funktionswert und dem Wert der linearen Ersatzfunktion von kleinerer Grössenordnung ist als der Abstand des Punktes (x, y, z) vom Punkt (x0 , y0 , z0 ), d.h. es gilt lim ∆x,∆y,∆z→0 ϕ(∆x, ∆y, ∆z) =0. ∆x2 + ∆y 2 + ∆z 2 p Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 8 55 Koordinatentransformationen Zur leichten mathematischen Formulierung und zur Lösung eines in der Praxis anfallenden Problems trägt oft wesentlich die richtige Wahl des Koordinatensystems bei. So wird zum Beispiel bei einem achsensymmetrischen Problem mit Vorteil ein Zylinderkoordinatensystem verwendet, bei einem kugelsymmetrischen Problem ein Kugelkoordinatensystem, etc. Da die physikalischen Gesetze in der Regel in Form von Differentialgleichungen vorliegen, in denen unter anderem auch die partiellen Ableitungen der relevanten Grössen nach den kartesischen Koordinaten vorkommen, müssen bei einem Wechsel des Koordinatensystems auch diese Ableitungen umgerechnet, d.h. in den neuen Koordinaten ausgedrückt werden. Mit diesem Problem beschäftigt sich der vorliegenden Abschnitt. - Wir beginnen mit einem einfachen Beispiel in Polarkoordinaten und gehen anschliessend das Problem allgemein an. In der (x, y)-Ebene sei die Funktion F : (x, y) → F (x, y) = x2 − y 2 gegeben. Jedem Punkt der (x, y)-Ebene wird durch F eine reelle Zahl zugeordnet. Führen wir in der Ebene Polarkoordinaten ein, so ist der Funktionswert im Punkt mit Polarkoordinaten (ρ, ϕ) durch F̃ (ρ, ϕ) = F (x(ρ, ϕ)), y(ρ, ϕ)) gegeben. Dabei gilt (siehe Figur 1) x(ρ, ϕ) = ρ cos ϕ , y(ρ, ϕ) = ρ sin ϕ , also F̃ (ρ, ϕ) = F (ρ cos ϕ, ρ sin ϕ) = ρ2 (cos2 ϕ − sin2 ϕ) . Die Funktionen F und F̃ nehmen auf ein und demselben Punkt in der Ebene denselben Wert an; die eine drückt die Zuordnung in kartesischen die andere in Polarkoordinaten aus. Wir sagen, dass F und F̃ ein und dieselbe Punktfunktion beschreibe. Umgekehrt können wir die Polarkoordinaten (ρ, ϕ) in den kartesischen Koordinaten (x, y) ausdrücken. Es gilt bekanntlich 56 U. Stammbach: Analysis, Teil B ϕ = ϕ0 (y) ρ = ρ0 Fig. 1 : Polarkoordinatensystem (x) ρ(x, y) = (8.3) q x2 + y 2 ( ϕ(x, y) = arctan (y/x) , x>0 arctan (y/x) + π , x < 0 (Für x = 0 ist die Formel für ϕ sinnvoll zu ergänzen!) Man hat dann x2 y2 F (x, y) = F̃ (ρ(x, y), ϕ(x, y)) = (x + y ) − x2 + y 2 x2 + y 2 2 2 ! = x2 − y 2 . Wir wenden uns jetzt dem Problem in voller Allgemeinheit zu und betrachten neben dem kartesischen (x, y)-Koordinatensystem in der Ebene ein zweites Koordinatensystem mit Koordinaten (u, v) (siehe Figur 2). Dabei seien die x- und die y-Koordinaten des durch das Paar (u, v) beschriebenen Punktes durch die Funktionen x = x(u, v) , y = y(u, v) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 57 (y) v = v0 u = u0 Fig. 2 : Allgemeines Koordinatensystem (x) gegeben. Eine in (x, y)-Koordinaten beschriebene Punktfunktion F : (x, y) → F (x, y) wird folglich in (u, v)-Koordinaten durch (8.4) F̃ (u, v) = F (x(u, v), y(u, v)) ausgedrückt. Umgekehrt seien die (u, v)-Koordinaten in den kartesischen Koordinaten (x, y) durch u = u(x, y) , v = v(x, y) gegeben. Dann gilt analog zu (8.4) (8.5) F (x, y) = F̃ (u(x, y), v(x, y)) . Für die partiellen Ableitungen nach x und y ergibt sich aus der Formel (8.5) mit Hilfe der verallgemeinerten Kettenregel Fx (x, y) = F̃u (u(x, y), v(x, y)) ux (x, y) + F̃v (u(x, y), v(x, y)) vx (x, y) , 58 U. Stammbach: Analysis, Teil B Fy (x, y) = F̃u (u(x, y), v(x, y)) uy (x, y) + F̃v (u(x, y), v(x, y)) vy (x, y) . Die zweiten partiellen Ableitungen lauten dann (in abgekürzter Schreibweise, d.h. ohne die Argumente der Funktionen explizit hinzuschreiben) Fxx = (F̃u ux + F̃v vx )x = F̃uu u2x + F̃uv ux vx + F̃u uxx + F̃vu vx ux + F̃vv vx2 + F̃v vxx (8.6) Fxy = (F̃u ux + F̃v vx )y = F̃uu ux uy + F̃uv ux vy + F̃u uxy + F̃vu vx uy + F̃vv vx vy + F̃v vxy Fyy = (F̃u uy + F̃v vy )y = F̃uu u2y + F̃uv uy vy + F̃u uyy + F̃vu vy uy + F̃vv vy2 + F̃v vyy Auf analoge Weise lassen sich weitere partielle Ableitungen berechnen. Dabei werden die Ausdrücke mit wachsender Ordnung der Ableitung offensichtlich rasch sehr kompliziert. Statt weiter im allgemeinen Fall zu bleiben, betrachten wir nun zwei ganz konkrete Probleme. Beispiel In zahlreichen Anwendungen (Diffusion, Wärmeleitung, Wellenausbreitung, Torsion von Stäben, elektrisches Potential, etc.) spielt der sogenannte Laplace-Operator ∆ eine wichtige Rolle (P.S. Laplace 1749-1827); dieser ist für Funktionen f : (x, y) → f (x, y) durch ∆f = fxx + fyy definiert. Wie stellt sich dieser Operator in Polarkoordinaten dar? Nach unseren Überlegungen wird die Funktion f in Polarkoordinaten durch f˜(ρ, ϕ) = f (x(ρ, ϕ)), y(ρ, ϕ)) beschrieben. Umgekehrt gilt f (x, y) = f˜(ρ(x, y), ϕ(x, y)) , wobei ρ(x, y) und ϕ(x, y) durch (8.3) gegeben sind. Nun liefert die Formel (8.6) (8.7) fxx + fyy = f˜ρρ (ρ2x + ρ2y ) + f˜ρϕ (ρx ϕx + ρy ϕy )+ +f˜ρ (ρxx + ρyy ) + f˜ρϕ (ρx ϕx + ρy ϕy ) + f˜ϕϕ (ϕ2x + ϕ2y ) + f˜ϕ (ϕxx + ϕyy ) . Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 59 Aus (8.3) folgt ρx = ρy = ϕx = ϕy = ∂ 2 x = cos ϕ (x + y 2 )1/2 = p 2 ∂x x + y2 ∂ 2 y = sin ϕ (x + y 2 )1/2 = p 2 ∂y x + y2 ∂ − sin ϕ −y = arctan (y/x) = 2 2 ∂x x +y ρ ∂ cos ϕ x = arctan (y/x) = 2 ∂y x + y2 ρ sin2 ϕ ρ 2 cos ϕ = (ρy )y = cos ϕ ϕy = ρ ρxx = (ρx )x = − sin ϕ ϕx = ρyy −(cos ϕ ϕx ρ − sin ϕ ρx ) 2 sin ϕ cos ϕ = 2 ρ ρ2 − sin ϕ ϕy ρ − cos ϕ ρy −2 sin ϕ cos ϕ = (ϕy )y = = . 2 ρ ρ2 ϕxx = (ϕx )x = ϕyy Daraus ergibt sich ρ2x + ρ2y = 1 ρx ϕx + ρy ϕy = 0 ρxx + ρyy = 1/ρ ϕ2x + ϕ2y = 1/ρ2 ϕxx + ϕyy = 0 . Einsetzen in (8.6) liefert die Form des Laplace-Operators in Polarkoordinaten, indem für die durch f bzw. f˜ gegebene Punktfunktion die Identität ∆f ≡ fxx + fyy ≡ f˜ρρ + ρ1 f˜ρ + 1 ˜ ρ2 fϕϕ gilt. In konkreten Fällen sind neben den üblichen Koordinatensystemen oft auch ganz andere von grossem Nutzen. Wir betrachten dazu das folgende Beispiel. 60 U. Stammbach: Analysis, Teil B Beispiel Die Funktion f : (x, t) → f (x, t) beschreibe eine vom der x-Koordinate und der Zeit t abhängige physikalische Grösse. Sie erfülle die (partielle) Differentialgleichung ftt = c2 fxx , (8.8) wobei c > 0 eine reelle Zahl bezeichnet. Die Differentialgleichung (8.8) heisst (eindimensionale) Wellengleichung. Sie heisst so, weil sie bei der mathematischen Behandlung von jeder Art von Wellen (Wasserwellen, Schallwellen, elektromagnetische Wellen (also Licht!), etc.) auftritt. Ihre Lösungen beschreiben einen Ausbreitungsvorgang. Dies weisen wir wie folgt nach: Wir führen in der (x, t)-Ebene neue Koordinaten (u, v) ein, indem wir u = x + ct , v = x − ct setzen, oder äquivalent x= (siehe Figur 3). u+v u−v , t= 2 2c Beschreiben f und f˜ dieselbe Punktfunktion, so gelten die Beziehungen u+v u−v , 2 2c f (x, t) = f˜(x + ct, x − ct) . f˜(u, v) = f Berechnet man die nach unserer Formel (8.6) relevanten Ausdrücke, so erhält man wegen ux = 1 , ut = c , vx = 1 , vt = −c sofort fx = f˜u ux + f˜v vx = f˜u + f˜v fxx = f˜uu ux + f˜uv vx + f˜vu ux + f˜vv vx = f˜uu + 2f˜uv + f˜vv ft = f˜u ut + f˜v vt = c (f˜u − f˜v ) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung (t) 61 v = v0 u = u0 Fig. 3 : Neues Koordinatensystem für die Wellengleichung (x) ftt = c (f˜uu ut + f˜uv vt − f˜vu ut − f˜vv vt ) = c2 (f˜uu − 2f˜uv + f˜vv ) . Die Wellengleichung stellt sich deshalb in den neuen Koordinaten durch c2 (f˜uu − 2f˜uv + f˜vv ) = c2 (f˜uu + 2f˜uv + f˜vv ) dar, also durch die sehr einfache partielle Differentialgleichung (8.9) f˜uv = 0 . Die Lösungen der Differentialgleichung (8.9) lassen sich nach Abschnitt 2 sofort angeben. Es gilt f˜(u, v) = F (u) + G(v) , 62 U. Stammbach: Analysis, Teil B G(x) G(x − 1c) G(x − 2c) Fig. 4 : Nach rechts fortschreitende Störung für t = 0, 1, 2, 3, 4 G(x − 3c) G(x − 4c) wobei F : u → F (u) und G : v → G(v) zwei beliebige differenzierbare Funktionen sind. Geht man wieder zu den ursprünglichen Koordinaten (x, t) zurück, so erhält man f (x, t) = F (x + ct) + G(x − ct) . Der erste der hier auftretenden Summanden kann als eine mit Schnelligkeit c nach links fortschreitende Störung der durch f beschriebenen Grösse interpretiert werden und der zweite als eine mit der gleichen Schnelligkeit nach rechts fortschreitende Störung (siehe Figur 4). Was wir hier beschrieben haben, ist die sogenannte d’Alembert’sche Methode zur Lösung der Wellengleichung (J.B. d’Alembert 1717-1783). Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel V. Funktionen von mehreren Variablen Integralrechnung Die Mathematik ist die Wissenschaft, bei der sich alles von selbst versteht. C. G. J. Jacobi 1804 - 1851 Inhaltsverzeichnis 1 Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . . 12 3 Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . . 30 5 Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 1 3 Das Gebietsintegral Wir führen in diesem Abschnitt Gebietsintegrale, d.h. Integrale über eine Funktion von zwei Variablen in Analogie zu gewöhnlichen Integralen ein. Die Interpretation solcher Integrale in einem Spezialfall führt uns dann dazu, diese mit Hilfe von zwei aufeinanderfolgenden Integrationen über die beiden Variablen zu berechnen. Zuerst zur Definition. Wie schon beim bestimmten Integral über eine Funktion einer Variablen werden wir uns auch hier mit einer Definition begnügen, die nicht den allgemeinsten Fall abdeckt, die aber für die Anwendungen, die wir im Auge haben, durchaus genügt. Zum einen werden wir nur stetige Funktionen f : (x, y) → f (x, y) als Integrand zulassen; zum andern wollen wir voraussetzen, dass der Integrationsbereich B endlich und durch eine differenzierbare Kurve (ohne Doppelpunkte) begrenzt wird. Die folgenden Schritte führen dann zur Definition des Gebietsintegrals (siehe Figur 1). (y) Fig. 1 : Zur Definition des Gebietsintegrals ∆Bi (xi , yi ) (x) (a) Teile B (durch differenzierbare Kurven) in Teilbereiche ∆Bi mit Flächeninhalt ∆Fi ein, i = 1, 2, . . . , n. 4 U. Stammbach: Analysis, Teil B (b) Wähle in jedem Teilbereich ∆Bi , i = 1, 2, . . . , n einen Punkt (xi , yi ). Unter der Feinheit der Einteilung verstehen wir den Durchmesser der kleinsten Kreisscheibe, welche in der Lage ist, jeden einzelnen der Teilbereiche ∆Bi zu überdecken. (c) Bilde die Riemann’sche Summe n X f (xi , yi ) ∆Fi . i=1 (d) Definiere das Gebietsintegral als Grenzwert ZZ B f (x, y) dF = lim n X ! f (xi , yi ) ∆Fi , i=1 wobei für den Grenzübergang eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null strebt. Es gilt das Resultat - sonst wäre die Definition nicht sinnvoll -, dass unter den getroffenen Voraussetzungen der Wert des Limes unabhängig von der gewählten Einteilungsfolge ist. Ein Gebietsintegral tritt auf natürliche Art im folgenden Beispiel auf. Beispiel Es sei f : (x, y) → f (x, y) eine auf B definierte stetige Funktion. Wie gross ist das Volumen V des über dem Bereich B liegenden Körpers, welcher gegen oben durch den Graphen von f begrenzt wird? Die zu einer Einteilung von B gehörige Riemann’sche Summe liefert offensichtlich eine Approximation für V . Das Volumen selbst wird als Limes erhalten, wenn die Feinheit der Einteilung gegen Null geht; es gilt also ZZ V = f (x, y) dF . B Dieses Beispiel legt uns unmittelbar auch eine Berechnungsart für das Integral nahe. Wir zerschneiden den Körper wie in Kapitel III, Abschnitt 9 durch Schnitte parallel zur (y, z)-Ebene in dünne Scheiben (siehe Figur 2). Ist F (x) der Flächeninhalt der Schnittfigur an der Stelle x, so ist das gesuchte Volumen V durch V = Z β α F (x) dx gegeben. Um den Flächeninhalt F (x) zu bestimmen, zeichnen wir den entsprechenden Schnitt auf (siehe Figur 3). Offensichtlich gilt F (x) = Z δ(x) γ(x) f (x, y) dy . Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (y) δ(x) Fig. 2 : Erste Berechnungsart B γ(x) (x) α x β (z) Fig. 3 : Erste Berechnungsart; Schnitt bei x z = f (x, y) F (x) (y) γ(x) δ(x) 5 6 U. Stammbach: Analysis, Teil B (Wir nehmen hier stillschweigend an, dass für jedes α ≤ x ≤ β der Schnitt an der Stelle x den Rand des Bereiches B in höchstens zwei Punkten schneidet. Sollte das nicht von Anfang an der Fall sein, so müsste der Bereich entsprechend unterteilt werden.) Das Volumen des Körpers drückt sich dann durch V = ZZ B f (x, y) dF = Z β α F (x) dx = Z β α dx Z δ(x) γ(x) f (x, y) dy aus. Die letztere Formel ist ein sogenanntes Doppelintegral. Sie liefert eine Berechnungsart für das Gebietsintegral: in einem ersten Schritt wird das “innere” und in einem zweiten Schritt das “äussere” Integral ausgewertet. Beispiel Es sei f : (x, y) → f (x, y) = x gegeben und als Integrationsbereich B der zu x ≥ 0 gehörige Teil der Ellipsenfläche x2 y 2 + 2 =1. a2 b (y) (x, +b b p 1 − x2 /a2 ) (x) 0 x (x, −b a p 1 − x2 /a2 ) Es sei 0 ≤ x ≤ a (siehe Figur 4). Dann sind γ(x) und δ(x) durch Fig. 4 : Erste Berechnungsart; Beispiel Kapitel V. Funktionen von mehreren Variablen. Integralrechnung q 7 q γ(x) = −b 1 − x2 /a2 , δ(x) = +b 1 − x2 /a2 gegeben. Ferner gilt α = 0, β = +a. Man erhält dann der Reihe nach V ZZ = Z = a Z Z = 2 √ −b 1−x2 /a2 1−x2 /a2 x dy +b a 0 −b dx xb q 1−x /a 1 − x2 /a2 ia 1h (1 − x2 /a2 )3/2 0 3 = −2ba2 = √ +b √ 2 2 1−x /a dx [xy] √ 2 2 a 0 Z dx 0 = x dF B 2 2 ba . 3 Es ist natürlich klar, dass die Rolle der Variablen x und y vertauscht werden kann (siehe Figur 5): Zerschneiden wir den Körper durch Ebenen parallel zur (x, z)-Ebene, so wird der Flächeninhalt der zu y gehörigen Schnittfigur durch F̃ (y) = Z β(y) α(y) f (x, y) dx gegeben, so dass wir V = ZZ B f (x, y) dF = Z γ δ F̃ (y) dy = Z γ δ dy Z β(y) α(y) erhalten. Beispiel Für das oben bereits betrachtete Beispiel ZZ B x dF erhalten wir für die Grössen α(y), β(y) q α(y) = 0 , β(y) = a 1 − y 2 /b2 . (siehe Figur 6). Ausserdem gilt γ = −b, δ = b. Daraus ergibt sich f (x, y) dx 8 U. Stammbach: Analysis, Teil B (y) δ Fig. 5 : Zweite Berechnungsart B y γ (x) α(y) β(y) (y) b (a p 1 − y 2 /b2 , y) y (x) a −b Fig. 6 : Zweite Berechnungsart; Beispiel Kapitel V. Funktionen von mehreren Variablen. Integralrechnung V ZZ = = +b = = = = dy −b Z = x dF B Z a2 0 x2 2 dy −b 2 Z a√1−y2 /b2 " +b a2 Z +b −b y3 y− 2 3b a2 x dx #a√1−y2 /b2 0 dy(1 − y 2 /b2 ) " 2 9 #+b 1 2 b− b 2 3 2 2 a b. 3 −b Es ist an dieser Stelle wichtig zu erkennen, dass die Berechnung eines Gebietsintegrals durch eine zweifache Integration natürlich nicht davon abhängig ist, dass das Gebietsintegral ZZ B f (x, y) dF ein Volumen ausdrückt. In der Tat ist die Interpretation des Gebietsintegrals als Volumen nur eine von vielen möglichen Interpretationen, wie ja auch die Interpretation des gewöhnlichen bestimmten Integrals als Flächeninhalt nur eine von vielen möglichen Interpretationen ist. Beispiel Wir betrachten den zu x ≥ 0 gehörigen Teil B der Ellipse x2 y 2 + 2 =1. a2 b Man berechne den Schwerpunkt S des Flächenstücks, wenn es homogen mit Masse belegt ist. Ist S = (xS , yS ), so gilt aus Symmetriegründen natürlich yS = 0. Um xS zu berechnen, liefert die Momentbedingung die Beziehung xS · F = ZZ B x dF , wo F den Flächeninhalt der Halbellipse bezeichnet. Das hier auftretende Gebietsintegral drückt ein Moment aus; sein Wert wurde aber bereits im vorhergehenden Beispiel bestimmt, als es um die Berechnung eines Volumens ging. Auch hier würde man seinen Wert durch die gleiche Technik, d.h. durch doppelte Integration bestimmen. Verwenden wir das oben hergeleitete Resultat, so erhalten wir 10 U. Stammbach: Analysis, Teil B xS = 2 2 2 4 a b= a. πab 3 3π Gebietsintegrale treten in vielen Anwendungen auf; als Beispiele erwähnen wir - Berechnung der Gesamtmasse bei gegebener Flächendichte auf B, - Berechnung der Gesamtladung bei gegebener Flächenladungsdichte auf B, - Berechnung des hydrostatischen Drucks auf eine senkrechte Wand der Form B, - Berechnung des Schwerpunktes eines ebenen Bereiches B, - Berechnung des Flächenträgheitsmomentes eines ebenen Bereiches B. Zur letzten Anwendung betrachten wir das folgende konkrete Beispiel. Beispiel Gesucht ist das polare Trägheitsmoment J0 eines gleichseitigen Dreiecks mit Seite a bezüglich seines Schwerpunktes (siehe Figur 7). (y) B D S (x) D0 C M A= √ a − 3 2, 6 a Fig. 7 : Polares Trägheitsmoment eines gleichseitigen Dreiecks bezüglich seines Schwerpunktes Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 11 Wir wählen das Koordinatensystem so, dass sein Nullpunkt mit dem Schwerpunkt S zusammenfällt und eine Ecke des Dreiecks auf der positiven y-Achse liegt. Nach der Definition des polaren Flächenträgheitsmomentes (siehe Mechanik) gilt ZZ J0 = D (x2 + y 2 ) dF , wo D das gleichseitige Dreieck bezeichnet. Es gilt √ ! a − 3 A= , a , 2 6 und die durch SA bestimmte Gerade hat die Gleichung 1 y = −√ x . 3 Aus Symmetriegründen erhalten wir J0 = 6 · ZZ D0 (x2 + y 2 ) dF , wo D0 das Dreieck ASM bezeichnet. Wir erhalten J0 = 6 · = 6· = 6· Z 0 − Z 3 a 6 0 − Z √ √ 3 a 6 0 − √ 3 a 6 = −2 · 6 · dy √ − 3 y Z 0 dx(x2 + y 2 ) #−√3y " x3 dy + xy 2 3 0 √ 3 √ 3 dy(− 3y − 3y ) √ Z 3 0 − " √ 3 a 6 √ y4 = −2 · 6 · 3 4 √ 9a4 = 3· 3 4 4 2 ·3 √ 3 4 = a . 3 · 16 y 3 dy #0 − √ 3 a 6 Wir überlassen es dem Leser, das Resultat zu kontrollieren, indem die zweifache Integration in der umgekehrten Reihenfolge durchgeführt wird. 12 2 U. Stammbach: Analysis, Teil B Koordinatentransformationen bei Gebietsintegralen Wir beginnen hier mit einem Beispiel, das zeigt, wie die geschickte Wahl eines dem Problem angepassten neuen Koordinatensystems die Berechnung eines Gebietsintegrals erleichtern kann. Beispiel Aus einer Kugel mit Radius a wird ein Loch in der Form eines geraden Kreiszylinders mit Grundkreisradius a/2 herausgebohrt und zwar so, dass die Achse des Kreiszylinders den Kugelmittelpunkt enthält. Wie gross ist das Volumen des herausgebohrten Teils der Kugel? Wir geben uns die Kugel durch x2 + y 2 + z 2 = a2 und wählen die z-Achse als Zylinderachse (siehe Figur 1). Der Grundkreis des Zylinders wird durch (y) a B a/2 (x) 2 Fig. 1 : Zentrale zylindrische Ausbohrung der Kugel a 2 beschrieben. Das gesuchte Volumen V ist dann durch das Gebietsintegral 2 2 x +y = ZZ q 2 B a2 − x2 − y 2 dF 12 2 U. Stammbach: Analysis, Teil B Koordinatentransformationen bei Gebietsintegralen Wir beginnen hier mit einem Beispiel, das zeigt, wie die geschickte Wahl eines dem Problem angepassten neuen Koordinatensystems die Berechnung eines Gebietsintegrals erleichtern kann. Beispiel Aus einer Kugel mit Radius a wird ein Loch in der Form eines geraden Kreiszylinders mit Grundkreisradius a/2 herausgebohrt und zwar so, dass die Achse des Kreiszylinders den Kugelmittelpunkt enthält. Wie gross ist das Volumen des herausgebohrten Teils der Kugel? Wir geben uns die Kugel durch x2 + y 2 + z 2 = a2 und wählen die z-Achse als Zylinderachse (siehe Figur 1). Der Grundkreis des Zylinders wird durch (y) a B a/2 (x) 2 Fig. 1 : Zentrale zylindrische Ausbohrung der Kugel a 2 beschrieben. Das gesuchte Volumen V ist dann durch das Gebietsintegral 2 2 x +y = ZZ q 2 B a2 − x2 − y 2 dF Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 13 gegeben, wo B die Grundfläche des Zylinders bezeichnet. Dieses Gebietsintegral kann in ein Doppelintegral umgewandelt werden: V =2 Z +a/2 −a/2 dx q Z + q − a2 −x2 4 q a2 −x2 4 a2 − x2 − y 2 dy . Im Prinzip lassen sich die hier auftretenden zwei Integrationen durchführen, allerdings sind wie man leicht sieht - die dazu notwendigen Rechnungen sehr umständlich. Eine bessere, weil einfachere Art, das Problem anzugehen, besteht darin, zuerst ein angepasstes Koordinatensystem einzuführen. Wegen der Rotationssymmetrie bezüglich der z-Achse bietet sich dafür natürlich ein Zylinderkoordinatensystem an mit Polarkoordinaten in der (x, y)-Ebene. Wegen x2 + y 2 = ρ2 darf man schreiben V =2 ZZ q B a2 − ρ2 dF . Für die Berechnung denkt man sich das Gebiet B durch die Koordinatenlinien der Polarkoordinaten eingeteilt. Eine heuristische Überlegung zeigt, dass der Flächeninhalt des “Flächenelementes” in Polarkoordinaten durch (siehe Figur 2) dF = ρ dρ dϕ gegeben ist. Für die Berechnung des Gebietsintegrales halte man nun zuerst ϕ fest, integriere über ρ und anschliessend über ϕ. Man erhält auf diese Weise für V ein Doppelintegral, das sich auf die übliche Art und Weise berechnen lässt: V Z = 2 Z = 2 Z 2π 0 2π 0 2π dϕ Z a/2 0 q ρ a2 − ρ2 dρ 1 dϕ − (a2 − ρ2 )3/2 3 1 3 2 = 2 dϕ − a 3 4 0 √ ! 3 3 3 4π = a 1− 3 8 √ 8−3 3 = π a3 . 6 3/2 a/2 0 1 + (a2 )3/2 3 ! Beispiel Es sei die Kugel x2 + y 2 + z 2 = a2 gegeben. Es werde ein Loch in der Form eines geraden Kreiszylinders mit Radius a/2 und Achse parallel zur z-Achse herausgebohrt, wobei die Zylinderachse die (x, y)-Ebene im Punkt (a/2, 0) trifft (siehe Figur 3). 14 U. Stammbach: Analysis, Teil B (y) Fig. 2 : Flächenelement in Polarkoordinaten dF ρdϕ dϕ dρ ρ (x) (y) a cos ϕ ϕ (a/2, 0) B (x) Fig. 3 : Tangentiale zylindrische Ausbohrung der Kugel Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 15 Wiederum rechnen wir in Polarkoordinaten (obschon das Problem nicht achsensymmetrisch ist): V ZZ q = 2 Z ZB Z B0 π/2 = 4 = 4 Z = = = = = = Beispiel telpunkt. 0 a2 − ρ2 dF q a2 − ρ2 dF dϕ Z a cos ϕ q a2 − ρ2 ρ dρ 0 a cos ϕ 1 4 dϕ − (a2 − ρ2 )3/2 3 0 0 Z π/2 1 3 1 4 − a (1 − cos2 ϕ)3/2 + a3 dϕ 3 3 0 Z π/2 4 3 (1 − sin3 ϕ) dϕ a 3 0 Z 4 3 π/2 (1 − sin ϕ + cos2 ϕ sin ϕ)dϕ a 3 0 4 3 π 1 a −1+ 3 2 3 6π − 8 3 a . 9 π/2 Gesucht ist das polare Flächenträgheitsmoment eines Kreisringes um den Mit- Wir wählen das Koordinatensystem mit dem Ursprung im Mittelpunkt des Kreisringes und verwenden Polarkoordinaten. J0 = ZZ B 2 ρ dF = Z 0 2π dϕ Z Beispiel Das sogenannte Fehlerintegral J= " a ρ4 ρ ρ dρ = 2π 4 Z ∞ b 2 −∞ #b = a π 4 (b − a4 ) . 2 2 e−x dx spielt in der Statistik und Wahrscheinlichkeitsrechnung eine wichtige Rolle. Wir haben in Kapitel III, Abschnitt 13 die Existenz dieses Integrals nachgewiesen. Die Berechnung scheiterte aber daran, dass die Stammfunktion von x → e−x 2 nicht durch elementare Funktionen ausdrückbar ist. Die folgende Überlegung liefert diesen Wert auf dem Umweg über ein Gebietsintegral. (Wegen der auftretenden uneigentlichen Integralen ist 16 U. Stammbach: Analysis, Teil B vom mathematischen Standpunkt aus unser Vorgehen etwas forsch; dafür kommt die zugrunde liegende Idee aber besser zur Geltung. Zur Beruhigung des Lesers können wir anfügen, dass der Mathematiker unser Vorgehen mit geringem zusätzlichen Aufwand rechtfertigen kann.) Wir beginnen damit, dass wir nicht J selbst, sondern J 2 zu berechnen versuchen. J 2 Z = ∞ −∞ ∞ Z = Z−∞ Z = ZZ = = −x2 e dx Z dx · ∞ = −∞ = 2 −∞ e ganze Ebene e−y dy 2 · e−y dy e−(x 2 +y 2 ) dF 2 2π 0 Z ∞ −x2 ganze Ebene Z Z 2π 0 dϕ Z ∞ 0 e−ρ dF 2 e−ρ ρ dρ " 2 e−ρ dϕ − 2 #∞ 0 = π. Wir erhalten also Z ∞ −∞ 2 e−x dx = √ π. Dieses Beispiel zeigt sehr schön, wie ein Koordinatenwechsel einem Problem mit einem Schlag ein anderes Gesicht geben kann. Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 3 17 Das Volumenintegral Das Volumenintegral ist analog zum Gebietsintegral definiert. Ein wesentlicher Unterschied besteht allerdings darin, dass der Graph des Integranden für eine anschauliche Interpretation nicht mehr herangezogen werden kann. Definition Es sei eine stetige Funktion f : (x, y, z) → f (x, y, z) gegeben und ein endlicher räumlicher Bereich B. Das Volumenintegral ZZZ B f (x, y, z) dV ist dann wie folgt definiert (siehe Figur 1): (z) Fig. 1 : Zur Definition des Volumenintegrals B ∆Bi (xi , yi , zi ) (y) (x) (a) Teile B (durch Flächen, die durch differenzierbare Funktionen gegeben sind) in Teilbereiche ∆Bi mit Volumen ∆Vi ein, i = 1, 2, . . . , n. 18 U. Stammbach: Analysis, Teil B (b) Wähle in jedem ∆Bi , i = 1, 2, . . . , n einen Punkt (xi , yi , zi ). Die Feinheit der Einteilung ist der Durchmesser der kleinsten Kugel, welche in der Lage ist, jeden einzelnen der Teilbereiche ∆Bi zu überdecken. (c) Bilde die Riemann’sche Summe n X f (xi , yi , zi ) ∆Vi . i=1 (d) Das Volumenintegral ist definiert als Grenzwert ZZZ B f (x, y, z) dV = lim n X ! f (xi , yi , zi ) ∆Vi , i=1 wobei eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null strebt. Es gilt auch hier das mathematische Resultat, dass der Wert des Limes nicht von der gewählten Einteilungsfolge abhängig ist. Da uns anschaulich der Graph der Funktion f : (x, y, z) → f (x, y, z) nicht zur Verfügung steht, suchen wir nach einer anderen einfachen Interpretation für das Volumenintegral. Eine von vielen Möglichkeiten ist die folgende. Es sei B ein dreidimensionaler Körper; dessen Dichte im Punkte (x, y, z) werde durch die Funktion ρ(x, y, z) beschrieben. Dann ist ρ(xi , yi , zi )·∆Vi approximativ die in ∆Bi vorhandene Masse, und die Riemann’sche Summe n X ρ(xi , yi , zi ) ∆Vi i=1 liefert eine Approximation für die Masse des Körpers. Die Approximation ist offensichtlich umso besser, je feiner die Einteilung von B ist. Die Gesamtmasse ist somit durch den Grenzübergang gegeben, d.h. sie ist gleich: M= ZZZ B ρ(x, y, z) dV . Volumenintegrale treten in vielen weiteren Zusammenhängen auf, einige davon werden wir in den folgenden Beispielen oder auch später in dieser Vorlesung kennenlernen. Beispiel Es ist das Trägheitsmoment Θ eines homogenen (Dichte ρ) Würfels mit Kantenlänge a gesucht und zwar um eine durch den Mittelpunkt des Würfels und den Mittelpunkt einer Seitenfläche gehenden Achse. Wählen wir das Koordinatensystem wie in der Figur 2, so gilt für das Trägheitsmoment um die z-Achse laut Definition ZZZ Θ=ρ (x2 + y 2 ) dV . W Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 19 (z) Fig. 2 : Trägheitsmoment eines Würfels W0 (y) (a/2, 0, 0) (x) W Aus Symmetriegründen ist der Beitrag an Θ von jedem der acht Teilwürfel in den Oktanten des Koordinatensystems gleich gross, so dass gilt Θ=8ρ ZZZ W0 (x2 + y 2 ) dV , wo W 0 der Teilwürfel im 1. Oktanten ist. Analog wie beim Gebietsintegral berechnen wir das Volumenintegral durch Zurückführung auf gewöhnliche Integrationen: Wir wandeln das Volumenintegral in ein dreifaches Integral um. Schrittweise erhalten wir (siehe Figur 3): - Anteil einer “dünnen” Säule an das Trägheitsmoment des Würfels W 0 ρ dx dy Z a/2 0 (x2 + y 2 ) dz , - Anteil einer “dünnen Scheibe” an das Trägheitsmoment als “Summe” der Anteile der Säulen Z a/2 Z a/2 ρ dx dy (x2 + y 2 ) dz , 0 - Trägheitsmoment des Würfels ρ Z 0 W0 a/2 0 als “Summe” der Anteile der Scheiben dx Z 0 a/2 dy Z 0 a/2 (x2 + y 2 ) dz . 20 U. Stammbach: Analysis, Teil B (z) a/2 Fig. 3 : Berechnung des Integrals über W 0 dz (y) a/2 dx a/2 dy (x) Damit erhalten wir das Trägheitsmoment Θ als ein dreifaches Integral, welches sich ohne weiteres berechnen lässt: Θ = 8ρ = 8ρ = 8ρ Z Z a/2 0 0 a 2 a = 8ρ 2 a = 8ρ 2 a/2 Z dx dx a/2 0 Z a/2 0 Z 0 a/2 Z 0 Z 0 dx a/2 a/2 Z Z dy h 0 dx " a/2 0 ia/2 dy (x2 + y 2 ) y3 x2 y + 3 #a/2 0 x2 a a3 + 2 3·8 a ax3 a3 x = 8ρ + 2 2·3 3·8 a a4 = 8ρ · 2 3·8 (x2 + y 2 ) dz dy x2 z + y 2 z " dx a/2 #a/2 0 ! 0 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung = ρ 21 a5 . 6 Beispiel Gesucht ist das Trägheitsmoment Θ um die x-Achse des homogenen Tetraeders T mit Eckpunkten (0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1). Es gilt laut Definition Θ=ρ ZZZ T (y 2 + z 2 ) dV . Die mathematische Aufgabe besteht darin, dieses Volumenintegral in ein dreifaches Integral umzuwandeln. Wir gehen dabei ähnlich vor wie im obigen Beispiel (siehe Figur 4). (z) (0, 0, 1) y+z =1 Fig. 4 : Trägheitsmoment eines Tetraeders (0, y, z) (y) (0, 1, 0) x+y+z =1 (1, 0, 0) (x) - Für festes (y, z) betrachten wir die “Säule” in Richtung der x-Achse. Ihr Anteil an das Trägheitsmoment ist ρ dz dy Z 0 1−y−z (y 2 + z 2 ) dx . Die Grenzen für die Integration sind x = 0 (Punkt in der (y, z)-Ebene) und der x-Wert des zu y und z gehörigen Punktes auf der Ebene x + y + z = 1, also x = 1 − y − z. 22 U. Stammbach: Analysis, Teil B - Für festes z betrachten wir die “Scheibe” parallel zur (x, y)-Ebene. Ihr Anteil an das Trägheitsmoment Θ ist die “Summe” der Anteile aller “Säulen” für festgehaltenes z, also ρ dz Z 1−z dy 0 Z 1−y−z 0 (y 2 + z 2 ) dx . Die Grenzen für die y-Integration sind: y = 0 und der y-Wert, des zu z gehörigen Punktes auf der Geraden y + z = 1, also y = 1 − z. - Das ganze Trägheitsmoment Θ ist die ”Summe” der Anteile aller dieser “Scheiben”: Θ=ρ Z 0 1 dz Z 1−z dy 0 Z 1−y−z 0 (y 2 + z 2 ) dx . Wir erhalten nun der Reihe nach Θ = ρ = ρ = ρ Z 0 Z = = = 1 0 Z 0 Z = 1 1 dz dz Z 0 Z 0 " dz 1−z 1−z h dy y 2 x + z 2 x i1−y−z 0 dy (y 2 − y 3 − y 2 z + z 2 − z 2 y − z 3 ) y3 y4 y3z z2 y2 − − + z2y − − z3y 3 4 3 2 #1−z 0 i1−z ρ 1 h 3 dz 4y − 3y 4 − 4y 3 z + 12z 2 y − 6z 2 y 2 − 12z 3 y 0 12 0 Z ρ 1 4 (7z − 16z 3 + 12z 2 − 4z + 1) dz 12 0 ρ 7 −4+4−2+1 12 5 ρ . 30 Auch bei Volumenintegralen lohnt es sich manchmal, ein neues Koordinatensystem einzuführen. Wir betrachten hier zuerst den Fall von Kugelkoordinaten. Beispiel Es ist das Volumen einer Kugel K mit Radius R zu berechnen. Wir führen ein Kugelkoordinatensystem ein, dessen Ursprung mit dem Mittelpunkt der Kugel zusammenfällt (siehe Figur 5). Dann gilt offenbar V = ZZZ K 1 dV . Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (z) Fig. 5 : Volumen einer Kugel R (y) (x) (z) dϕ Fig. 6 : Das Volumenelement bei Kugelkoordinaten r sin θ θ dV rdθ dθ r dr 23 24 U. Stammbach: Analysis, Teil B Wie man aus der Figur 6 entnimmt, drückt sich das Volumenelement in Kugelkoordinaten (r, ϕ, θ) durch dV = dr (r dθ) (r sin θ) dϕ = r 2 sin θ dr dϕ dθ aus. Wandeln wir das Volumenintegral in ein dreifaches Integral über r, θ, ϕ (in dieser Reihenfolge) um, so erhalten wir V Z = 0 Z = 0 Z = = 0 2π 2π 2π dϕ dϕ Z Z π 0 π 0 dθ dθ Z 0 R dr r 2 sin θ R3 sin θ 3 R3 dϕ 2 3 4 3 πR . 3 Damit wird ein altes, allen wohlbekanntes Resultat bestätigt. Beispiel Es ist die Gravitationskraft einer homogenen Kugel mit Radius a, Dichte ρ auf einen Massenpunkt m im Abstand h (h ≥ a) vom Mittelpunkt der Kugel zu berechnen. Wir wählen ein Kugelkoordinatensystem mit Ursprung im Mittelpunkt der Kugel und den Massenpunkt m im Punkt mit den kartesischen Koordinaten (0, 0, h) (siehe Figur 7). Die von ~ ist auf dV zugerichtet. der Teilmasse ρ · dV der Kugel herrührende, auf m wirkende Teilkraft dK ~ Für den Betrag von dK gilt nach Newton ~ = γ m ρ dV . |dK| R2 ~ ist die “Summe” dieser Teilkräfte über alle Volumenelemente dV Die resultierende Totalkraft K ~ parallel zur der Kugel, also das Volumenintegral über die Kugel. Aus Symmetriegründen wird K z-Achse (gegen den Mittelpunkt der Kugel zu gerichtet) sein, so dass für die “Summen”bildung ~ eine Rolle spielt. nur die dritte Komponente von dK Man liest aus der Figur 8 die folgenden Beziehungen ab R = cos α = (h − r cos θ)2 + (r sin θ)2 1/2 = (r 2 + h2 − 2rh cos θ)1/2 , h − r cos θ . R Damit lässt sich dK3 vollständig in Kugelkoordinaten ausdrücken; man erhält Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 25 (z) (0, 0, h) m Fig. 7 : Gravitationskraft einer Kugel a (y) (x) m ~ dK dK3 α h − r cos θ R Fig. 8 : Zur Berechnung der Gravitationskraft einer Kugel h r sin θ r cos θ θ 0 r 26 U. Stammbach: Analysis, Teil B dK3 = −γmρ h − r cos θ r 2 sin θ dr dϕ dθ . + h2 − 2rh cos θ)3/2 (r 2 Damit folgt durch Integration über die Kugel und gleichzeitiger Umwandlung in ein dreifaches Integral in Kugelkoordinaten K = −γmρ Z 2π 0 dϕ Z a 0 dr Z π 0 (r 2 h − r cos θ r 2 sin θ dθ . + h2 − 2rh cos θ)3/2 Wir berechnen zuerst die beiden Summanden I1 und I2 des inneren Integrals. Es gilt I1 = hr 2 Z π 0 sin θ dθ (r 2 + h2 − 2rh cos θ)3/2 iπ 2hr 2 h 2 = − (r + h2 − 2rh cos θ)−1/2 0 2rh 2 2 −1/2 2 = −r (r + h + 2rh) − (r + h2 − 2rh)−1/2 = −r = 1 1 − h+r h−r , da h ≥ r , 2r 2 . h2 − r 2 Der zweite Summand lautet I2 = −r 3 Z 0 π (r 2 sin θ cos θ dθ . + h2 − 2rh cos θ)3/2 Wir wenden in einem ersten Schritt partielle Integration an. Wir setzen u0 = sin θ , (r 2 + h2 − 2rh cos θ)3/2 v = cos θ und erhalten u=− 1 (r 2 + h2 − 2rh cos θ)−1/2 , rh v 0 = − sin θ . Damit folgt I2 = −r 3 1 − (r 2 + h2 − 2rh cos θ)−1/2 cos θ rh π 0 + r3 rh Z 0 π (r 2 + h2 sin θ dθ − 2rh cos θ)1/2 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung r2 1 = − h r+h r 2 2h = − h h2 − r 2 2r 2 = − 2 + h − r2 27 iπ 2r 2 h 2 1 2 1/2 + (r + h − 2rh cos θ) ) − 0 h−r 2rh2 r + 2 (r + h − (h − r)) h 2 2r . h2 Nach der Integration über θ erhält man demzufolge K = −γmρ Z 2π 0 Z dϕ Z a 0 dr 2r 2 h2 ! 2 a3 3 h2 0 4π 3 1 = −γmρ a 3 h2 1 = −γmM 2 , h = −γmρ 2π dϕ wobei wir mit M die Gesamtmasse der homogenen Kugel bezeichnet haben. Dies ist ein beachtenswertes Resultat: die auf den Massenpunkt m wirkende Gravitationskraft einer homogenen Kugel lässt sich berechnen, indem man sich die Gesamtmasse der Kugel in deren Zentrum konzentriert denkt. In einem weitern Beispiel betrachten wir schliesslich noch Zylinderkoordinaten. Beispiel Gesucht ist das Trägheitsmoment eines homogenen (Dichte 1) Kreiszylinders der Höhe h und dem Radius a um einen Durchmesser seines Grundkreises. Wir wählen das Koordinatensystem so, dass der Kreiszylinder auf der (x, y)-Ebene steht und dass seine Achse mit der z-Achse zusammenfällt (siehe Figur 9). Es ist dann das Trägheitsmoment Θ um die x-Achse zu bestimmen. Laut Definition gilt ZZZ Θ= Z (y 2 + z 2 ) dV . Dem Problem angepasst wählen wir jetzt Zylinderkoordinaten (ρ, ϕ, z). Wie wir wissen, gilt x = ρ cos ϕ y = ρ sin ϕ z = z. Ausserdem entnimmt man der Figur 10, dass das Volumenelement sich durch 28 U. Stammbach: Analysis, Teil B (z) Fig. 9 : Trägheitsmoment eines Kreiszylinders um einen Durchmesser des Grundkreises h (y) a (x) (z) dρ Fig. 10 : Volumenelement bei Zylinderkoordinaten ρ dϕ ρ dϕ (y) (x) Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 29 dV = ρ dρ dϕ dz ausdrückt. Wandelt man nun das Volumenintegral in ein dreifaches Integral über die Zylinderkoordinaten z, ρ, ϕ (in dieser Reihenfolge) um, so erhält man der Reihe nach ZZZ Θ = Z = 0 Z = = 2π 0 Z = 2π 0 Z = 2π 0 Z = 2π 2π Z (z 2 + ρ2 sin2 ϕ) dV dϕ dϕ dϕ Z Z Z a 0 a 0 a 0 dρ Z h 0 dz ρ(z 2 + ρ2 sin2 ϕ) " #h z3 dρ ρ + ρ2 z sin2 ϕ 3 dρ ρ " #a h3 ρ2 hρ4 dϕ + sin2 ϕ 2·3 4 h3 a2 0 ! h3 + ρ2 h sin2 ϕ 3 ha4 !0 + sin2 ϕ 2 · 3 4 0 1 3 2 1 πh a + πha4 . 3 4 dϕ Wir werden im nächsten Abschnitt noch einmal auf Koordinatentransformationen bei Gebietsund Volumenintegralen zurückkommen und sie dort in einer etwas formaleren Weise behandeln. 30 4 U. Stammbach: Analysis, Teil B Zur Transformation von Gebiets- und Volumenintegralen Unsere Überlegungen zur Transformation von Gebiets- und Volumenintegralen in neue Koordinatensysteme geben uns Gelegenheit, noch etwas näher auf Koordinatentransformationen im allgemeinen einzugehen. Zu diesem Zweck betrachten wir zuerst den zweidimensionalen Fall noch etwas genauer. Neben dem kartesischen (x, y)-Koordinatensystem stellen wir uns in der Ebene ein (u, v)-Koordinatensystem vor. Der durch das Paar (u, v) im neuen Koordinatensystem beschriebene Punkt habe die durch die Funktionen x = x(u, v) , y = y(u, v) (4.1) bestimmten kartesischen Koordinaten (x, y) (siehe Kapitel IV, Abschnitt 8). (y) (x(u, v), y(u, v)) (v) (x) Fig. 1 : Koordinatentransformation in der Ebene als Abbildung (u, v) (u) Wir können nun - und dies ist eine wichtige, hier zum erstenmal auftretende Idee - eine künstliche (u, v)-Ebene betrachten und die Funktionen (4.1) als eine Abbildung der (u, v)-Ebene in die Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 31 (x, y)-Ebene ansehen (siehe Figur 1): Dem Punkt (u, v) in der (u, v)-Ebene wird der Punkt (x, y) mit x = x(u, v) , y = y(u, v) in der (x, y)-Ebene zugeordnet. (Statt ‘Abbildung’ könnte man natürlich ebenso gut auch ‘Funktion’ sagen; wir haben eine Funktion vor uns, die auf den Punkten der (u, v)-Ebene definiert ist und die als Werte Punkte in der (x, y)-Ebene annimmt). Beispiel Im Falle von Polarkoordinaten (ρ, ϕ) gilt bekanntlich x = x(ρ, ϕ) = ρ cos ϕ , y = y(ρ, ϕ) = ρ sin ϕ . Dem Punkt (ρ, ϕ) in der (ρ, ϕ)-Ebene wird der Punkt (x, y) = (ρ cos ϕ, ρ sin ϕ) zugeordnet (siehe Figuren 2,3). Durch die Koordinatentransformation wird der Streifen 0 ≤ ϕ < 2π auf die ganze (x, y)-Ebene abgebildet. Das Bild der Rechtecks 0 ≤ ρ ≤ a, 0 ≤ ϕ < 2π ist der Kreis um den Ursprung mit Radius a. (Man beachte, dass alle Punkte der ϕ-Achse auf den Nullpunkt der (x, y)-Ebene abgebildet werden. In diesen Punkten ist die Koordinatentransformation - wie man sagt - singulär.) Die Abbildung von der (u, v)-Ebene in die (x, y)-Ebene lässt sich gut veranschaulichen, indem man die Bilder der Parallelen zur u- bzw. v-Achse betrachtet. Die (horizontale) Gerade v = v0 geht in die durch die Parameterdarstellung u → (x(u, v0 ), y(u, v0 )) = ~r(u, v0 ) gegebene Kurve in der (x, y)-Ebene über, und die (vertikale) Gerade u = u0 in die Kurve v → (x(u0 , v), y(u0 , v)) = ~r(u0 , v) . Diese Kurven heissen Koordinatenlinien des neuen Koordinatensystems (siehe Figuren 4,5). Beispiel Im Falle von Polarkoordinaten sind die Koordinatenlinien einerseits vom Nullpunkt ausgehende Strahlen ( ϕ konstant), andererseits Kreise um den Ursprung ( ρ konstant) (siehe Figuren 2,3). Wir stellen uns nun vor, dass uns in der (x, y)-Ebene ein Bereich B gegeben ist, der als Integrationsbereich eines Gebietsintegrals auftritt. Verwendet man zur Berechnung des Integrals das (u, v)-Koordinatensystem, so ist für die Riemann’sche Summe der Bereich B durch die u- bzw. v-Koordinatenlinien einzuteilen. Es ist dann der Flächeninhalt dF des “Flächenelementes” dB zu bestimmen, welches dadurch entsteht, dass u um du und v um dv wächst. Approximativ ist ~ und AC ~ aufgespannt wird (siehe Figur dB ein Parallelogramm, welches durch die Vektoren AB 6). Nun gilt wegen des Mittelwertsatzes der Differentialrechnung 32 U. Stammbach: Analysis, Teil B (ϕ) 2π Fig. 2 : Polarkoordinaten, (ρ, ϕ)-Linien (ρ, ϕ) (ρ) a (y) (ρ cos ϕ, ρ sin ϕ) (x) Fig. 3 : Polarkoordinaten, Koordinatenlinien Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (v) u = u0 Fig. 4 : Koordinatentransformation, (u, v)-Ebene (u0 , v0 ) v = v0 (u) (y) u = u0 Fig. 5 : Koordinatenlinien (x(u0 , v0 ), y(u0 , v0 )) v = v0 (x) 33 34 U. Stammbach: Analysis, Teil B ~ = ~r(u + du, v) − ~r(u, v) ∼ ~ru (u, v) du = (xu (u, v), yu (u, v)) du AB ~ = ~r(u, v + dv) − ~r(u, v) ∼ ~rv (u, v) dv = (xv (u, v), yv (u, v)) dv . AC (y) u u + du C D v + dv Fig. 6 : Flächenelement bei Koordinatentransformationen dB ~r(u, v + dv) A B ~r(u, v) v ~r(u + du, v) (x) Damit kann der Flächeninhalt dF des “Parallelogrammes” dB mit Hilfe des Vektorproduktes bestimmt werden: dF = |~ru (u, v) × ~rv (u, v)| du dv . In Komponenten drückt sich der Betrag des Vektorproduktes durch den Absolutbetrag der Determinante der zweireihigen Matrix " aus. Damit erhält man xu xv yu yv " dF = det # xu xv yu yv . # du dv . Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 35 Dies ist das Flächenelement (besser wäre Element des Flächeninhaltes) im (u, v)-Koordinatensystem. Beispiel Im Falle von Polarkoordinaten (ρ, ϕ) ergibt sich xρ = cos ϕ , xϕ = −ρ sin ϕ yρ = sin ϕ , yϕ = ρ cos ϕ . Daraus folgt " det xρ xϕ yρ yϕ # = ρ cos2 ϕ + ρ sin2 ϕ = ρ und damit dF = ρ dρ dϕ in Übereinstimmung mit der in Abschnitt 2 auf heuristische Weise hergeleiteten Formel. Beispiel Es ist das polare Flächenträgheitsmoment einer Ellipse mit Halbachsen a und b um ihren Mittelpunkt zu bestimmen. Wir geben uns die Ellipse im kartesischen Koordinatensystem durch die Gleichung x2 y 2 + 2 =1. a2 b Das polare Flächenträgheitsmoment ist definiert durch J0 = ZZ B (x2 + y 2 ) dF , wo B den Bereich der Ellipse angibt. Wir führen nun ein dem gestellten Problem besonders angepasstes Koordinatensystem (s, t) ein, indem wir direkt die Transformationsformeln angeben. Sie lauten: x = as cos t y = bs sin t . Die Koordinatenlinien sind einerseits vom Nullpunkt ausgehende Strahlen (t konstant), andererseits Ellipsen mit Mittelpunkt im Ursprung (s konstant) (siehe Figur 7). Um das Flächenelement in den neuen Koordinaten zu bestimmen, berechnen wir die partiellen Ableitungen 36 U. Stammbach: Analysis, Teil B (y) b Fig. 7 : Der Ellipse angepasstes Koordinatensystem (x) a xs = a cos t , xt = −as sin t ys = b sin t , yt = bs cos t und bilden daraus die Matrix " a cos t −as sin t b sin t bs cos t # . Deren Determinante hat den Wert abs cos2 t + abs sin2 t = abs , so dass wir erhalten dF = abs ds dt . Das Gebietsintegral lässt sich damit vollständig in den neuen Koordinaten (s, t) ausdrücken. Offenbar wird die Ellipse B ausgeschöpft, wenn s und t über das Rechteck 0 ≤ s ≤ 1, 0 ≤ t < 2π Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 37 variiert. (Eine Gebietsintegration über ein Rechteck ist besonders einfach; aus diesem Grund haben wir natürlich gerade das (s, t)-Koordinatensystem gewählt.) Wir erhalten der Reihe nach J0 = ZZ B 1 Z = 0 Z = 0 = π (x2 + y 2 ) dF ds 1 Z 2π 0 dt (a2 s2 cos2 t + b2 s2 sin2 t) abs ds (πs2 (a2 + b2 )abs) ab 2 (a + b2 ) . 4 Als Spezialfall erhalten wir das uns bereits bekannte polare Flächenträgheitsmoment des Kreises J0 = π r4 . 2 Es lohnt sich, noch eine Weile bei diesen Koordinatentransformationen zu verweilen. Betrachten wir noch einmal die Abbildung des aus du und dv gebildeten (“kleinen”) Rechtecks in der (u, v)Ebene in das Flächenstück dB. Approximativ geht dabei der Vektor (du, dv) in den Vektor (dx, dy) = ~ru du + ~rv dv = (xu du + xv dv, yu du + yv dv) über. Mit der Notation der linearen Algebra schreiben wir dies in der Form " dx dy # " = xu xv yu yv #" du dv # . Wir lesen daraus ab, dass die zur (komplizierten) Koordinatentransformation im Punkt (u, v) gehörige Abbildung durch die (einfache) lineare Abbildung approximiert wird, welche durch die Matrix " xu xv yu yv # beschrieben wird. Diese Matrix heisst Funktionalmatrix oder Jacobimatrix (C. G. J. Jacobi 1804 -1851); wir bezeichnen sie durch das Symbol ∂(x, y) . ∂(u, v) Die Approximation geschieht hier offensichtlich in einem ähnlichen Sinn wie früher bei der linearen Ersatzfunktion: eine komplizierte Funktion wird durch eine lineare Funktion approximiert. Die durch die Funktionalmatrix im Punkte (u, v) gegebene lineare Abbildung ist die 38 U. Stammbach: Analysis, Teil B “lineare Ersatzfunktion an der Stelle (u, v)” der durch die Koordinatentransformation definierten Abbildung von der (u, v)-Ebene in die (x, y)-Ebene. Beispiel Wir kehren kurz - sicher zur Überraschung des Lesers - zum Roboterarm zurück, den wir in Kapitel I, Abschnitt 2 eingeführt haben (siehe Figur 8). Die Lage des Arbeitskopfes im (x, y)-Koordinatensystem wurde damals in Abhängigkeit der Winkel (ϕ, ψ) durch die Funktionen x = R cos ϕ + r cos(ϕ − ψ) y = R sin ϕ + r sin(ϕ − ψ) beschrieben. Wir können deshalb im Arbeitsbereich B des Roboters die Winkel ϕ und ψ als neue Koordinaten betrachten. Die obigen Formeln beschreiben dann eine Koordinatentransformation im Arbeitsbereich des Roboters und damit eine Abbildung eines Teils der (ϕ, ψ)-Ebene (siehe Figur 9) in die (x, y)-Ebene. Offenbar wird das Rechteck 0 ≤ ϕ, ψ ≤ π in den Bereich B abgebildet. Die Funktionalmatrix beschreibt in jedem Punkt des Rechtecks eine lineare Abbildung, welche die zur Koordinatentransformation gehörige Abbildung in diesem Punkt approximiert. Die Funktionalmatrix lautet ∂(x, y) = ∂(ϕ, ψ) " xϕ xψ yϕ yψ # " = −R sin ϕ − r sin(ϕ − ψ) r sin(ϕ − ψ) R cos ϕ + r cos(ϕ − ψ) −r cos(ϕ − ψ) # . Werden nun die Winkel ϕ und ψ gemäss den Funktionen t → ϕ(t) und t → ψ(t) zeitlich verändert, so beschreibt der Arbeitskopf des Roboters im Arbeitsbereich einen Weg, der durch t → (x(ϕ(t), ψ(t)), y(ϕ(t), ψ(t))) gegeben ist. Die Geschwindigkeit ~v (t) des Arbeitskopfes ergibt sich durch Ableitung nach t mit Hilfe der verallgemeinerten Kettenregel. Man erhält ~v (t) = (xϕ ϕ̇ + xψ ψ̇, yϕ ϕ̇ + yψ ψ̇) . Ohne Schwierigkeiten stellt man fest, dass sich der Geschwindigkeitsvektor ~v (t) = (ẋ(t), ẏ(t)) durch eine Matrixmultiplikation ergibt: " ẋ ẏ # " = xϕ xψ yϕ yψ #" ϕ̇ ψ̇ # . Wir ersehen daraus, dass die Funktionalmatrix beschreibt, wie sich der “Geschwindigkeitsvektor” (ϕ̇, ψ̇) in der (ϕ, ψ)-Ebene in den Geschwindigkeitsvektor (ẋ, ẏ) des Arbeitskopfes in der (x, y)Ebene abbildet. 39 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (y) R ψ Fig. 8 : Roboterarm r (x) ϕ (ψ) π Fig. 9 : (ϕ, ψ)-Ebene (ϕ) π 40 U. Stammbach: Analysis, Teil B Wie man aus der linearen Algebra weiss, beschreibt die Determinante einer Matrix die Volumenbzw. Flächenverzerrung bei der zugehörigen Abbildung. Wir entnehmen daraus, dass die Determinante (Funktionaldeterminante) " det xu xv yu yv # im Punkte (u, v) die Flächenverzerrung bei der Abbildung der (u, v)-Ebene in die (x, y)-Ebene beschreibt. Aus diesem Grund muss - wie wir bereits gesehen haben - bei Gebietsintegralen das Flächenelement det ∂(x, y) du dv ∂(u, v) benützt werden. Spezielle Aufmerksamkeit verdienen bei Koordinatentransformationen diejenigen Punkte in denen die Funktionaldeterminante Null ist. In solchen Punkten ist die durch die Funktionalmatrix beschriebene lineare Abbildung singulär, und die Koordinatentransformation ist ausgeartet. Ein Beispiel wird durch das Polarkoordinatensystem im Nullpunkt geliefert. Hier ist die Koordinatentransformation bekanntlich nicht in beiden Richtungen eindeutig. In gewissen Rechnungen muss auf diese Ausnahmepunkte besonders Rücksicht genommen werden. Beispiel Auch im Zusammenhang mit Robotern spielen diese Punkte eine grosse Rolle. Berechnen wir für den oben betrachteten Roboter die Funktionaldeterminante, so ergibt sich " det −R sin ϕ − r sin(ϕ − ψ) r sin(ϕ − ψ) R cos ϕ + r cos(ϕ − ψ) −r cos(ϕ − ψ) # = Rr sin ψ . Diese Determinante ist Null für ψ = 0 oder ψ = π. Dies entspricht dem vollständig gestreckten bzw. ganz zusammengefalteten Roboterarm. In diesen Punkten ist die Funktionalmatrix also singulär. Die lineare Algebra sagt nun, dass die zu einer solchen Matrix gehörige lineare Abbildung nicht alle Vektoren als Bilder liefert. Wir haben aber gesehen, dass die Bilder gerade die möglichen Geschwindigkeitsvektoren des Arbeitskopfes sind. Wir folgern daraus, dass in den Punkten mit ψ = 0 bzw. ψ = π der Arbeitskopf unseres Roboters nicht beliebige Geschwindigkeitsvektoren zulässt. Punkte dieser Art sind Ausnahmepunkte und verdienen bei Roboteranwendungen immer besondere Aufmerksamkeit. Wir gehen zum Schluss noch auf den dreidimensionalen Fall ein und betrachten neben dem kartesischen (x, y, z)-Koordinatensystem ein neues (u, v, w)-Koordinatensystem. Die Koordinatentransformation wird durch die Gleichungen x = x(u, v, w), y = y(u, v, w), z = z(u, v, w) Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 41 beschrieben. Hält man eine der neuen Koordinaten fest, so beschreiben diese Funktionen die sogenannten Koordinatenflächen. Beispiel Im Falle von Kugelkoordinaten r, ϕ, θ lauten die Gleichungen bekanntlich x = r sin θ cos ϕ y = r sin θ sin ϕ z = r cos θ . Die Koordinatenflächen sind für r = r0 Kugeloberflächen, für ϕ = ϕ0 Halbebenen, welche die z-Achse enthalten, und für θ = θ0 Halbkegel mit der z-Achse als Achse. Lässt man im (u, v, w)-Koordinatensystem u um du, v um dv und w um dw wachsen, so wird der Quader mit Kanten du, dv, dw im (u, v, w)-Raum auf einen (“krummkantigen”) Quader im (x, y, z)-Raum abgebildet (siehe Figur 10). Dessen Volumen können wir approximativ berechnen, indem wir analog wie im zweidimensionalen Fall vorgehen. Setzen wir wie üblich ~r(u, v, w) = (x(u, v, w), y(u, v, w), z(u, v, w)) , (z) Fig. 10 : Volumenelement bei Koordinatentransformationen dV (y) (x) 42 U. Stammbach: Analysis, Teil B so gilt ~r(u + du, v, w) − ~r(u, v, w) ∼ ~ru (u, v, w) du , ~r(u, v + dv, w) − ~r(u, v, w) ∼ ~rv (u, v, w) dv , ~r(u, v, w + dw) − ~r(u, v, w) ∼ ~rw (u, v, w) dw . Das Volumen des von ~ru du, ~rv dv, ~rw dw aufgespannten Quaders ist dann als Absolutbetrag des gemischten Produktes (~ru du × ~rv dv) · ~rw dw = (~ru × ~rv ) · ~rw du dv dw gegeben. Wie wir gesehen haben, entspricht dieses gemischte Produkt der Determinante der aus den Komponenten der drei Vektoren gebildeten Matrix xu xv xw (~ru × ~rv ) · ~rw = det yu yv yw . zu zv zw Damit ist das Volumenelement genau wie das Flächenelement durch die Funktionaldeterminante ausgedrückt. Es gilt xu xv xw dV = det yu yv yw du dv dw . zu zv zw Beispiel Im Falle von Kugelkoordinaten rechnet man ohne Schwierigkeit nach sin θ cos ϕ −r sin θ sin ϕ r cos θ cos ϕ det sin θ sin ϕ r sin θ cos ϕ r cos θ sin ϕ = −r 2 sin θ , cos θ 0 −r sin θ so dass das Volumenelement der Kugelkoordinaten durch dV = r 2 sin θ dr dϕ dθ gegeben ist, in Übereinstimmung mit unserem früheren Resultat. Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 5 43 Integrale mit Parameter In diesem Abschnitt geht es um die Ableitung von Integralen die von einem Parameter abhängig sind. Wir beginnen gleich mit einem einfachen Beispiel. √ Beispiel Gegeben ist die Funktion t → t. Wir vergleichen im Intervall [0, 1] diese Funktion mit linearen Funktionen der Form t → xt , 0 ≤ x < ∞. Für welchen Wert von x ist die Grösse Z Φ(x) = 0 1 √ ( t − xt)2 dt minimal (siehe Figur 1)? (y) 1 y= √ t Fig. 1 : Approximation der Wurzelfunktion durch eine lineare Funktion y = xt (t) 1 Zur Lösung suchen wir die Minimalstelle der Funktion x → Φ(x) = Z 0 1 √ ( t − xt)2 dt 44 U. Stammbach: Analysis, Teil B im Intervall [0, ∞). Wir erhalten Z Φ(x) = = = 0 1 √ ( t − xt)2 dt 1 2 4 t − 2 5 1 4 − x+ 2 5 xt 5/2 1 + x2 t 3 3 1 0 1 2 x . 3 Die Ableitung beträgt d d Φ(x) = dx dx Z 0 1 √ d 1 4 4 2 1 ( t − xt)2 dt = − x + x2 = − + x . dx 2 5 3 5 3 Nullsetzen liefert x= 6 . 5 Man zeigt leicht, dass es sich dabei um die globale Minimalstelle handelt. In diesem Beispiel tritt auf natürliche Weise die Ableitung eines bestimmten Integrals nach einem Parameter auf. In dieser Situation erlaubt der folgende Satz oft eine Vereinfachung. Satz Gegeben sei eine stetige Funktion von zwei Variablen f : (t, x) → f (t, x) . Ferner sei die partielle Ableitung fx ebenfalls stetig. Dann gilt d dx Z b a f (t, x) dt = Z b a fx (t, x) dt . Wenden wir die Aussage des Satzes auf unser Beispiel an, so lässt sich die Rechnung, die zur Ableitung der Funktion Φ führt, etwas vereinfachen d dx Z 0 1 Z √ ( t − xt)2 dt = 0 1 1 Z 1 √ 2 4 2 4 2( t − xt)(−t) dt = (2xt2 − 2t3/2 ) dt = xt3 − t5/2 = x − . 3 5 3 5 0 0 Beweis des Satzes: Für den Differenzenquotienten der Funktion Φ erhalten wir 45 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung Φ(x + h) − Φ(x) h = 1 h = 1 h Z b f (t, x + h) dt − a Z b a Z b a ! f (t, x) dt (f (t, x + h) − f (t, x)) dt . Daraus folgt Φ(x + h) − Φ(x) − h Z b a fx (t, x) dt = Z b f (t, x a + h) − f (t, x) − fx (t, x) h dt . Für h → 0 strebt der Integrand des letzten Integrals und damit auch das Integral selbst gegen Null. Damit folgt Φ(x + h) − Φ(x) = h→0 h Φ0 (x) = lim Z b a fx (t, x) dt . Dies ist die Aussage des Satzes. Beispiel Wir behaupten, dass die Funktion Φ:x→ Z π 0 cos(x sin t) dt Lösung der Differentialgleichung Φ00 + 1 0 Φ +Φ=0 x ist. Wir bemerken zuerst, dass das Integral nicht elementar auswertbar ist. Deshalb muss in diesem Fall die Ableitung mit Hilfe unseres Satzes unter dem Integral erfolgen. Wir erhalten 0 Φ (x) = − Φ00 (x) = − Z π 0 Z π 0 sin(x sin t) sin t dt , cos(x sin t) sin2 t dt . Wir wenden nun auf Φ0 (x) partielle Integration an, wobei wir u(t) = sin(x sin t) , v̇(t) = sin t , setzen, und erhalten u̇(t) = x cos(x sin t) cos t , v(t) = − cos t 46 U. Stammbach: Analysis, Teil B 0 Φ (x) = [cos t sin(x sin t)]π0 = −x Z π 0 − Z π 0 x cos(x sin t) cos2 t dt cos(x sin t) cos2 t dt . Damit folgt Φ00 + 1 0 Φ +Φ= x Z 0 π − cos(x sin t) sin2 t − x cos(x sin t) cos2 t + cos(x sin t) x dt = 0 , und Φ ist in der Tat Lösung der Differentialgleichung. Beispiel Das Integral Z 1 tx −1 dt =: Φ(x) , x ≥ 0 log t 0 hat die Eigenschaft, dass die Stammfunktion des Integranden nicht elementar ausdrückbar ist. Trotzdem lässt sich sein Wert für alle x berechnen. Dabei machen wir von unserem Satz Gebrauch. Statt den Wert Φ(x) direkt zu bestimmen, wenden wir uns zuerst der Ableitungsfunktion Φ0 (x) zu. Mit Hilfe unseres Satzes erhalten wir Z 0 Φ (x) = 0 Z = = = 0 1 1 ∂ tx − 1 dt ∂x log t log t · tx dt log t 1 h x+1 i1 t 0 x+1 1 . x+1 Daraus folgt Φ(x) = log(x + 1) + C , und wegen Φ(0) = 0 gilt schliesslich Φ(x) = log(x + 1) . Im zweiten Teil dieses Abschnittes beschäftigen wir uns noch mit dem etwas komplizierteren Fall, wo der Parameter nicht nur im Integranden sondern auch in den Grenzen des Integrals vorkommt. Wir betrachten also für die Funktionen x → u(x) , x → v(x) Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 47 die durch die Integralformel Ψ : x → Ψ(x) = Z v(x) u(x) f (t, x) dt definierte Funktion. Dann gilt der Satz 0 0 0 Ψ (x) = f (v(x), x) v (x) − f (u(x), x) u (x) + Z v(x) u(x) fx (t, x) dt Bevor wir ihn beweisen, betrachten wir die folgenden Spezialfälle. Sind die Funktionen u und v konstant, so erhält man die Aussage des früheren Satzes. Ist u = a konstant, v(x) = x und ist der Integrand nicht von x abhängig, so folgt d dx Z x a f (t) dt = f (x) . Dies ist nichts anderes als der wohlbekannte Hauptsatz der Infinitesimalrechnung: “Die Ableitung eines bestimmten Integrals nach der oberen Grenze ist der Wert des Integranden an der oberen Grenze” (siehe Kapitel III, Abschnitt 2). Beweis Wir betrachten zuerst die Funktion von drei Variablen (u, v, w) → ψ(u, v, w) = Z v u f (t, w) dt und definieren die zusammengesetzte Funktion Ψ durch Ψ(x) = ψ(u(x), v(x), w(x)) . Die verallgemeinerte Kettenregel liefert dann d Ψ(x) = ψu u0 + ψv v 0 + ψw w0 . dx Schliesslich betrachten wir den Spezialfall w(x) = x und wenden auf die ersten beiden Ausdrücke den Hauptsatz der Infinitesimalrechnung an (siehe oben). Dann erhalten wir 48 U. Stammbach: Analysis, Teil B d Ψ(x) = −f (u(x), x) u0 (x) + f (v(x), x) v 0 (x) + dx Z v(x) u(x) fx (t, x) dt . Dies war zu beweisen. Beispiel Wir betrachten hier ein Anwendungsbeispiel aus der Mechanik, welches eine Beziehung zwischen der Querkraft und dem Biegemoment eines belasteten Balkens betrifft. Ein an beiden Enden frei aufgestützter waagrechter Balken trage die durch die Funktion x → p(x) Fig. 2 : Querkraft und Biegemoment eines belasteten Balkens ~ B p(x) ~ A (x) x ~ diejenige im rechten beschriebene Last (siehe Figur 2). Die Reaktionskraft im linken Lager sei A, ~ Lager B. Im Schnitt an der Stelle x ergibt sich die Querkraft Q(x) = A − und das Biegemoment Z 0 x p(t) dt Kapitel V. Funktionen von mehreren Variablen. Integralrechnung M (x) = −Ax + Z 0 x 49 (x − t)p(t) dt . Es wird nun in der Mechanik behauptet, dass die Beziehung d M (x) = −Q(x) dx gilt. Der von uns oben ausgesprochene Satz liefert diese Aussage nach kurzer Rechnung. Es gilt nämlich d M (x) = −A + 1 · (x − x)p(x) + dx Z 0 x 1 p(t) dt = −Q(x) . Man vergleiche zu diesem Thema M.B. Sayir: Mechanik 1, p. 201 ff. Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel VI. Vektoranalysis Ordnung ist nur für Dumme, Genies beherrschen das Chaos. Anonymus Inhaltsverzeichnis 1 Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Differentialoperatoren der Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . 11 3 Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4 Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5 Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6 Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 9 Eine Anwendung des Satzes von Stokes . . . . . . . . . . . . . . . . . . . . . . . 65 10 Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3 Kapitel VI. Vektoranalysis 1 Skalarfelder und Vektorfelder Unter einem Skalarfeld verstehen wir eine reellwertige, auf einem räumlichen Bereich B definierte Funktion f : (x, y, z) → f (x, y, z) . Jedem Punkt des Definitionsbereiches D(f ) wird eine reelle Zahl zugeordnet (siehe Figur 1). Eine im Bereich B variable skalare physikalische Grösse wird durch ein in B definiertes Skalarfeld beschrieben; Beispiele solcher Grössen sind etwa die Temperatur, der Luftdruck, das elektrische Potential, etc. f (x, y, z) 0 R Fig. 1 : Skalarfeld (z) f (y) B (x, y, z) R ×R ×R (x) Durch ein im Bereich B definiertes Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z)) 4 U. Stammbach: Analysis, Teil B wird jedem Punkt in B ein Vektor ~v (x, y, z) zugeordnet. Es ist oft instruktiv, sich den Vektor ~v (x, y, z) im Punkte (x, y, z) angebracht zu denken (siehe Figur 2). Eine im Bereich B variable vektorielle Grösse wird durch ein in B definiertes Vektorfeld beschrieben. Als Beispiele von Vektorfeldern erwähnen wir die folgenden. ~v B Fig. 2 : Vektorfeld (z) (y) (x) Beispiel In einem mit Gas oder Flüssigkeit gefüllten Bereich B ordne man jedem Punkt (x, y, z) die Geschwindigkeit ~v (x, y, z) des Gas- bzw. Flüssigkeitsteilchens zu, das sich im Punkte (x, y, z) befindet. Man nennt dann das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) das Strömungsfeld des Gases bzw. der Flüssigkeit. Es beschreibt den Bewegungszustand des Mediums. ~ Beispiel Man ordne jedem Punkt (x, y, z) des Bereiches B die Gravitationskraft K(x, y, z) zu, die auf eine Probemasse m in diesem Punkt wirkt. Dieses Vektorfeld ~ : (x, y, z) → K(x, ~ K y, z) 5 Kapitel VI. Vektoranalysis beschreibt den Zustand des räumlichen Bereiches B bezüglich der Gravitation. Es ist ein Beispiel eines Kraftfeldes. Beispiel Ordnet man jedem Punkt (x, y, z) des Bereiches B die elektrische (Anziehungs~ oder Abstossungs-)Kraft E(x, y, z) zu, die auf eine Probeladung e in diesem Punkte wirkt, so beschreibt das Vektorfeld ~ : (x, y, z) → E(x, ~ E y, z) den Zustand des räumlichen Bereiches B bezüglich des elektrischen Feldes. Wir nennen ein Skalar- oder Vektorfeld stationär, wenn es zeitunabhängig ist, wir nennen es instationär, wenn es zeitabhängig ist. Mit einigen wenigen Ausnahmen werden wir nur stationäre Felder betrachten. Die Ausnahmen betreffen elektrodynamische und hydrodynamische Felder, wo die Zeitabhängigkeit gerade das Wesentliche ist; z.B. hängt nach Maxwell die elektrische Feldstärke mit der zeitlichen Änderung der magnetischen Feldstärke zusammen (siehe Abschnitt 9). (y) Fig. 3 : Feldlinien (x) Ist im Bereich B ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) gegeben, so heisst eine in B verlaufende Kurve K eine Feldlinie von ~v , wenn in jedem ihrer Punkte der zu diesem Punkt gehörige 6 U. Stammbach: Analysis, Teil B Feldvektor tangential zu K ist (siehe Figur 3). Beispiel Ist ~v : (x, y, z) → ~v (x, y, z) das stationäre Strömungsfeld eines Gases oder einer Flüssigkeit, so sind die Feldlinien gerade die Bahnen der Teilchen des Mediums. Beispiel Das einfachste Vektorfeld ist das homogene. Es besteht darin, dass jedem Punkt des Bereiches B der konstante Vektor ~v (x, y, z) = ~a zugeordnet wird (siehe Figur 4). Das Geschwindigkeitsfeld eines translatorisch bewegten Körpers ist homogen. Das Strömungsfeld einer Parallelströmung ist homogen. Das elektrische Feld zwischen zwei parallelen Kondensatorplatten ist homogen. Die Feldlinien eines homogenen Vektorfeldes sind parallele Geraden. (y) Fig. 4 : Homogenes Vektorfeld ~a (x) Beispiel Es sei ~v : (x, y, z) → ~v (x, y, z) das Geschwindigkeitsfeld eines mit der Winkelgeschwindigkeit ~ω = (ω1 , ω2 , ω3 ) rotierenden starren Körpers. Die Rotationsachse gehe durch den Ursprung. Wie üblich bezeichnen wir mit ~r(x, y, z) den Ortsvektor des Punktes (x, y, z). Dann gilt offensichtlich (siehe Figur 5) ~v (x, y, z) = ~ω × ~r(x, y, z) = (ω2 z − ω3 y, ω3 x − ω1 z, ω1 y − ω2 x) . Die Feldlinien dieses Feldes sind offenbar Kreise in Normalebenen zu ω ~ , deren Mittelpunkte auf 7 Kapitel VI. Vektoranalysis der Rotationsachse liegen. . (x, y, z) Fig. 5 : Vektorfeld eines rotierenden starren Körpers ω ~ ~r O Beispiel Das Coulomb’sche Feld (C. A. Coulomb 1736 -1806) ist das elektrische Feld einer sich im Nullpunkt des Koordinatensystems befindlichen Punktladung e. Der Feldvektor ~v in (x, y, z) ist die Kraft auf eine in (x, y, z) angebrachte positive Einheitsladung. Setzen wir wie üblich ~r(x, y, z) = (x, y, z), r = |~r| = (x2 + y 2 + z 2 )1/2 , so gilt (siehe Physik) |~v | = γ |e| |e| =γ 2 , 2 |~r(x, y, z)| r wobei γ eine positive Konstante ist. Für positives e ist ~v von O weggerichtet (Abstossung, siehe Figur 6), und für negatives e ist ~v auf O zugerichtet (Anziehung). Man erhält also ~v (x, y, z) = γ e e ~r(x, y, z) = γ 2 (x, y, z) . |~r(x, y, z)|3 (x + y 2 + z 2 )3/2 Das Newton’sche Gravitationsfeld eines in O befindlichen Massenpunktes stimmt formal, d.h. bis auf eine Konstante mit dem Feld einer negativen elektrischen Ladung in O überein; es ist ~v (x, y, z) in diesem Fall die auf eine in (x, y, z) angebrachte Einheitsmasse wirkende Gravitationskraft. Die Feldlinien des Coulombfeldes sind die von O ausgehenden Strahlen. Man beachte, dass das Coulombfeld in O nicht definiert ist. 8 U. Stammbach: Analysis, Teil B Fig. 6 : Coulomb’sches Feld e O Beispiel Das Magnetfeld eines unendlich langen geradlinigen stromdurchflossenen Leiters. In der z-Achse fliesse ein Strom konstanter Stärke J. Ein Strom erzeugt nach dem Gesetz von Biot-Savart (J. B. Biot 1774 - 1862, F. Savart 1791 - 1841) ein Magnetfeld; in der Physik lernt man, dass dieses im Punkt (x, y, z) durch ~v (x, y, z) = 2J −y x , 2 , 0 2 2 x + y x + y2 beschrieben wird (siehe Figur 7). Wir entnehmen dieser Formel, dass ~v nur für x2 + y 2 > 0 definiert ist. Der Definitionsbereich von ~v ist der dreidimensionale Raum ohne die z-Achse. Die Länge des Feldvektors |~v | ist unabhängig von der z-Koordinate. Der Feldvektor ist parallel zur (x, y)-Ebene und steht senkrecht auf dem Lot zum Leiter. Es gilt |~v (x, y, z)| = 2J (x2 1 , + y 2 )1/2 d.h. |~v (x, y, z)| ist umso grösser, je näher (x, y, z) an der z-Achse liegt. Die Feldlinien von ~v sind Kreise parallel zur (x, y)-Ebene mit Mittelpunkt auf der z-Achse. Beispiel Strömungsfeld einer zähen Flüssigkeit durch ein zylindrisches Rohr. Es sei die z-Achse gerade die Achse des zylinderförmigen Rohres, welches den Radius a besitze. Der Ansatz von 9 Kapitel VI. Vektoranalysis Fig. 7 : Magnetfeld eines stromdurchflossenen Leiters z (z) Fig. 8 : Hagen-Poiseuille-Strömung a 10 U. Stammbach: Analysis, Teil B Hagen-Poiseuille sagt dann, dass für Punkte (x, y, z) im Innern des Rohres die Geschwindigkeit der Strömung durch ~v : (x, y, z) → ~v (x, y, z) = 0, 0, C (a2 − x2 − y 2 ) gegeben ist (siehe Figur 8). Das Geschwindigkeitsprofil der Hagen-Poiseuille-Strömung ist eine Parabel. Beispiel Das Gravitationsfeld einer homogenen Kugel mit Radius a ist für r = (x2 +y 2 +z 2 )1/2 ≥ a gegeben durch ~v : (x, y, z) → ~v (x, y, z) = −C 0 1 C0 ~ r = − (x, y, z) r3 (x2 + y 2 + z 2 )3/2 (siehe Kapitel V, Abschnitt 3). Für r < a (im Innern der Kugel) liefert eine ähnliche Rechnung wie in Kapitel V, Abschnitt 3 ~v : (x, y, z) → ~v (x, y, z) = −C 00~r = −C 00 (x, y, z) . Natürlich sind die Konstanten C 0 und C 00 positiv. 11 Kapitel VI. Vektoranalysis 2 Differentialoperatoren der Vektoranalysis Wir stellen hier eine Anzahl von Rechenvorschriften zusammen. Es wird sich im Laufe dieses Kapitels zeigen, dass alle diese auf den ersten Blick willkürlichen Bildungen eine anschauliche und wichtige Bedeutung haben. Der erste hier zu besprechende Differentialoperator ist uns bereits bekannt. Es ist der Gradient (siehe Kapitel IV, Abschnitt 7). Ist f : (x, y, z) → f (x, y, z) eine Funktion von drei Variablen, also ein Skalarfeld, so ist der Gradient von f definiert durch grad f (x, y, z) = ∂f ∂f ∂f (x, y, z), (x, y, z), (x, y, z) ∂x ∂y ∂z . Der Gradient ordnet einem Skalarfeld ein Vektorfeld zu. In Kapitel IV, Abschnitt 7 haben wir eine geometrische Beschreibung von grad f (x, y, z) kennengelernt: (a) Die Länge von grad f (x, y, z) ist der Betrag der grössten Richtungsableitung von f in (x, y, z). Die Richtung von grad f (x, y, z) ist die Richtung, in der die grösste Richtungsableitung von f in (x, y, z) erhalten wird. (b) Der Vektor grad f (x, y, z) steht senkrecht zur Niveaufläche von f , die durch den Punkt (x, y, z) geht. Das Vektorfeld grad f (x, y, z) wird auch Gradientenfeld von f genannt. Die Eigenschaft (b) des Gradienten liefert sofort das Resultat, dass die Feldlinien von grad f senkrecht zu den Niveauflächen von f verlaufen. Kennt man also die Niveauflächen von f , so kennt man auch den Verlauf der Feldlinien von grad f und umgekehrt. Der zweite der Differentialoperatoren ist die sogenannte Divergenz. Die Divergenz ordnet einem Vektorfeld ein Skalarfeld zu. Sie ist wie folgt definiert div ~v (x, y, z) = ∂v1 ∂v2 ∂v3 (x, y, z) + (x, y, z) + (x, y, z) . ∂x ∂y ∂z Beispiel Ist das Vektorfeld ~v homogen, ~v = ~a, so ist div ~v ≡ 0 . 12 U. Stammbach: Analysis, Teil B Beispiel Für das Coulombfeld ~v (x, y, z) = C x y z , , r3 r3 r3 , r = (x2 + y 2 + z 2 )1/2 erhält man ∂v1 ∂ (x, y, z) = C ∂x ∂x x r3 =C r 2 − 3x2 . r5 Aus Symmetriegründen folgt dann ∂v2 r 2 − 3y 2 , (x, y, z) = C ∂y r5 ∂v3 r 2 − 3z 2 . (x, y, z) = C ∂z r5 Daraus ergibt sich für die Divergenz div ~v (x, y, z) ≡ 0 . Beispiel Für das Magnetfeld des stromdurchflossenen Leiters ~v (x, y, z) = 2J −y x , , 0 x2 + y 2 x2 + y 2 erhält man ∂ ∂x −y x ∂ + 2 2 2 x +y ∂y x + y 2 y2x −y2x = 2J + (x2 + y 2 )2 (x2 + y 2 )2 = 0 div ~v (x, y, z) = 2J Beispiel Für das Strömungsfeld nach Hagen-Poiseuille ergibt sich div ~v (x, y, z) = 0 . 13 Kapitel VI. Vektoranalysis Beispiel Für das Gravitationsfeld innerhalb einer homogenen Kugel ~v (x, y, z) = −C 00~r , ~r = (x, y, z) , erhalten wir div ~v (x, y, z) = −3C 00 . Ausserhalb der homogenen Kugel ist das Gravitationsfeld ein Coulombfeld, und seine Divergenz ist deshalb Null (siehe oben). Der dritte der Differentialoperatoren ist die sogenannte Rotation. Die Rotation ordnet einem Vektorfeld wiederum ein Vektorfeld zu. Sie ist definiert durch rot ~v (x, y, z) = Beispiel ∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1 − , − , − ∂y ∂z ∂z ∂x ∂x ∂y . Ist das Vektorfeld homogen, ~v = ~a, so ist rot ~v = (0, 0, 0) . Beispiel Für das Geschwindigkeitsfeld eines rotierenden starren Körpers ~v = ~ω × ~r erhalten wir rot ~v = 2 (ω1 , ω2 , ω3 ) . Die Rotation dieses Vektorfeldes ~v ist also ein Mass für die Winkelgeschwindigkeit der Rotation. Beispiel Für das Coulombfeld ~v (x, y, z) = C x y z , , r3 r3 r3 , r = (x2 + y 2 + z 2 )1/2 erhält man ∂v3 ∂v2 − =C ∂y ∂z ∂ z ∂ y − ∂y r 3 ∂z r 3 =C −z3r 2 y/r + y3r 2 z/r r6 ! =0. 14 U. Stammbach: Analysis, Teil B Aus Symmetriegründen sind auch die übrigen zwei Komponenten des Vektors rot ~v Null. Beispiel Für das Magnetfeld des stromdurchflossenen Leiters ~v (x, y, z) = 2J −y x , 2 , 0 2 2 x + y x + y2 erhalten wir rot ~v (x, y, z) = ∂v2 ∂v1 − ∂x ∂y ! 2 x + y 2 − 2x2 x2 + y 2 − 2y 2 0, 0, + (x2 + y 2 )2 (x2 + y 2 )2 0, 0, = 2J = (0, 0, 0) Beispiel Für das Strömungsfeld nach Hagen-Poiseuille erhält man rot ~v (x, y, z) = (−2Cy, 2Cx, 0) . Beispiel Für das Gravitationsfeld innerhalb einer homogenen Kugel ~v (x, y, z) = −C 00~r , ~r = (x, y, z) , erhält man rot ~v (x, y, z) ≡ (0, 0, 0) . Neben diesen drei Differentialoperatoren grad , div , rot der Vektoranalysis treten natürlich auch deren Zusammensetzungen auf. (Achtung, nicht jede Zusammensetzung ist sinnvoll!) Für diese gelten die folgenden Identitäten. Der zusammengesetzte Operator div grad ordnet einem Skalarfeld wiederum ein Skalarfeld zu. Es gilt div grad f = fxx + fyy + fzz . In Anwendungen tritt dieser Operator häufig auf (siehe z.B. Kapitel IV, Abschnitt 8). Er heisst auch Laplace-Operator und wird mit ∆ bezeichnet. 15 Kapitel VI. Vektoranalysis Für die Zusammensetzung von grad und rot folgt rot grad f ≡ (0, 0, 0) . Satz Die Rotation eines Gradientenfeldes ist Null. Für die Zusammensetzung von rot und div folgt div rot ~v ≡ 0 . Satz Die Divergenz eines Rotationsfeldes ist Null. Die beiden anderen sinnvollen Zusammensetzungen rot rot und grad div sind untereinander durch die Formel rot rot ~v = grad div ~v − (∆v1 , ∆v2 , ∆v3 ) . verbunden. Alle diese Identitäten lassen sich einfach beweisen, indem man auf die Definitionen der Differentialoperatoren zurückgeht. Wir überlassen dies dem Leser. 16 3 U. Stammbach: Analysis, Teil B Flächen in Parameterdarstellung Ein Flächenstück S, auch kurz eine Fläche genannt, im dreidimensionalen Raum lässt sich wie folgt beschreiben (a) Als Graph einer Funktion von zwei Variablen f : (x, y) → f (x, y), oder (b) durch eine Gleichung g(x, y, z) = 0 , oder (c) durch eine Parameterdarstellung (u, v) → ~r(u, v) = (x(u, v), y(u, v), z(u, v)) . Eine Parameterdarstellung ist nichts anderes als eine Abbildung eines Bereiches B der (u, v)Ebene (Parameterebene) in den dreidimensionalen Raum (siehe Figur 1). (z) (x(u, v), y(u, v), z(u, v)) (y) (x) (v) ~r Fig. 1 : Parameterdarstellung einer Fläche als Abbildung eines Bereichs B der (u, v)-Ebene in den dreidimensionalen Raum B (u, v) (u) Beispiel Die Ebene durch den Punkt P0 = (x0 , y0 , z0 ), aufgespannt durch die Vektoren ~a und ~b mit ~c := ~a × ~b 6= (0, 0, 0) wird beschrieben durch die Parameterdarstellung 17 Kapitel VI. Vektoranalysis ~r : (u, v) → ~r(u, v) = (x0 + a1 u + b1 v, y0 + a2 u + b2 v, z0 + a3 u + b3 v) bzw. durch die Gleichung c1 (x − x0 ) + c2 (y − y0 ) + c3 (z − z0 ) = 0 . Hält man in der Parameterdarstellung eines Flächenstücks S den Parameter v fest, v = v0 , so ist u → ~r(u, v0 ) die Parameterdarstellung einer Kurve (u-Linie) auf der Fläche. Hält man den Parameter u fest, u = u0 , so ist v → ~r(u0 , v) (v) B Fig. 2 : Zur Definition der Parameterlinien v0 u0 (u) die Parameterdarstellung einer Kurve (v-Linie) auf der Fläche (siehe Figuren 2,3). Diese Kurven auf dem dargestellten Flächenstück S heissen Parameterlinien. Man vergleiche dazu Kapitel 18 U. Stammbach: Analysis, Teil B u = u0 v-Linie Fig. 3 : Parameterlinien auf einer Fläche (z) v = v0 u-Linie (y) (x) V, Abschnitt 4 über Koordinantentransformationen, wo die Koordinatenlinien auf ganz analoge Weise definiert worden sind. Beispiel Die Oberfläche der Kugel mit Radius R und Mittelpunkt im Ursprung lässt sich durch die Gleichung x2 + y 2 + z 2 − R 2 = 0 beschreiben. Eine Parameterdarstellung ergibt sich unmittelbar mit Hilfe der Kugelkoordinaten. Setzen wir u = ϕ und v = θ dann stellt (u, v) → (R sin v cos u, R sin v sin u, R cos v) mit 0 ≤ u ≤ 2π und 0 ≤ v ≤ π die Kugeloberfläche dar (siehe Figur 4). Die Parameterlinien sind die von der Geographie auf der Erdkugel her bekannten Breitenkreise (v konstant) und Meridiane (u konstant). Beispiel Die Mantelfläche des geraden Kreiskegels mit halbem Öffnungswinkel α, Spitze im Ursprung und z-Achse als Achse lässt sich durch die folgende Parameterdarstellung beschreiben. Mit Hilfe der Kugelkoordinaten (θ = α) erhält man eine Parameterdarstellung dieser Fläche, 19 Kapitel VI. Vektoranalysis Fig. 4 : Parameterdarstellung einer Kugel Fig. 5 : Parameterdarstellung eines Kegels 20 U. Stammbach: Analysis, Teil B indem man u = r und v = ϕ setzt, nämlich (u, v) → ~r(u, v) = (u sin α cos v, u sin α sin v, u cos α) . Der zur Mantelfläche gehörige Parameterbereich ist durch 0 ≤ u < ∞ und 0 ≤ v ≤ 2π gegeben (siehe Figur 5). Die u-Linien sind die Mantellinien des Kegels, die v-Linien sind die zur (x, y)Ebene parallelen Kreise mit Mittelpunkt auf der z-Achse. Beispiel Es sei eine Kurve K durch die Parameterdarstellung u → ~s(u) = (x(u), y(u), z(u)) gegeben. Die Fläche, die beim Durchlaufen der Kurve K von der Tangente an die Kurve überstrichen wird, heisst Tangentenfläche S der Kurve. Wir setzen ~t(u) = ~s˙ (u) und erhalten damit die folgende Parameterdarstellung von S (u, v) → ~r(u, v) = ~s(u) + v ~t(u) . Die v-Linien sind gerade die Tangenten an die Kurve K, die u-Linie, die zu v = 0 gehört, ist die Kurve K. Die Fläche S sei durch die Parameterdarstellung (u, v) → ~r(u, v) gegeben. Auf S halten wir den Punkt P fest. Er gehöre zu den Parametern (u0 , v0 ). Wir wollen die Tangentialebene an S im Punkte P studieren, insbesondere den zugehörigen Normaleneinheitsvektor ~n(u0 , v0 ). Zu diesem Zweck betrachten wir die durch P gehende u-Linie u → ~r(u, v0 ) und die durch P gehende v-Linie v → ~r(u0 , v) . Die Tangentialvektoren dieser beiden Kurven im Punkte P , d.h. die Vektoren ~ru (u0 , v0 ) und ~rv (u0 , v0 ) spannen offenbar die Tangentialebene auf. Damit ist ihr Vektorprodukt ein zur Fläche S in P senkrecht stehender Vektor. Der normale Einheitsvektor zur Fläche S in P wird also durch ~n(u0 , v0 ) = ± ~ru (u0 , v0 ) × ~rv (u0 , v0 ) |~ru (u0 , v0 ) × ~rv (u0 , v0 )| beschrieben (siehe Figur 6). Natürlich sind für ~n zwei Richtungen möglich. Beispiel Gesucht ist der Normaleneinheitsvektor der Tangentenfläche 21 Kapitel VI. Vektoranalysis ~n(u0 , v0 ) ~rv (u0 , v0 ) Fig. 6 : Normalenvektor zu einer durch eine Parameterdarstellung gegebenen Fläche (z) (y) ~ru (u0 , v0 ) (x) (u, v) → ~s(u) + v~s˙ (u) . Es gilt ~ru (u, v) = ~s˙ (u) + v~¨s(u) , ~rv (u, v) = ~s˙ (u) . Damit erhalten wir ~ru (u, v) × ~rv (u, v) = (~s˙ (u) + v~¨s(u)) × ~s˙ (u) = v (~¨s(u) × ~s˙ (u)) , also ~n(u, v) = ± ~¨s(u) × ~s˙ (u) . |~¨s(u) × ~s˙ (u)| Wir stellen fest, dass ~n(u, v) in diesem Beispiel vom Parameter v unabhängig ist. Dies bedeutet, dass der Normaleneinheitsvektor auf einer v-Linie konstant ist. Da die v-Linien die Tangenten an die ursprünglich gegebene Kurve K sind, folgt daraus, dass die Tangentialebene an die Fläche im Punkte P diese längs der durch P gehenden Tangente an die Kurve K berührt. 22 U. Stammbach: Analysis, Teil B Fig. 7 : Tangentenfläche an die Schraubenlinie. Der gezeichnete Teil gehört zu negativen Werten des Parameters v. Beispiel Wir betrachten den Spezialfall des vorhergehenden Beispiels, wo die Kurve K die Schraubenlinie u → ~s(u) = (cos u, sin u, hu) ist. Die Tangentenfläche (siehe Figur 7) (u, v) → ~r(u, v) = ~s(u) + v~s˙ (u) besitzt den Normaleneinheitsvektor ~n(u, v) = √ 1 h2 + 1 (−h sin u, h cos u, −1) , wobei wir eine der beiden möglichen Richtungen des Normaleneinheitsvektors ausgezeichnet haben. Berechnet man den Winkel ω zwischen ~n(u, v) und dem Einheitsvektor in z-Richtung, so erhält man cos ω = (0, 0, 1) · ~n(u, v) = √ −1 . h2 + 1 23 Kapitel VI. Vektoranalysis Wir entnehmen diesem Resultat, dass ω unabhängig ist von u und v, d.h. dass ω auf der ganzen Fläche konstant ist: die Tangentenfläche an die Schraubenlinie hat gegenüber der (x, y)Ebene überall dieselbe Neigung. Flächen mit dieser Eigenschaft treten etwa als Oberflächen von Aufschüttungen von losem Material in Erscheinung; in der Mathematik heissen sie deshalb auch Böschungsflächen. Bemerkung Der Leser überlege sich an dieser Stelle, wie der Normaleneinheitsvektor einer durch eine Gleichung g(x, y, z) = 0 gegebenen Fläche auf ganz andere Art, nämlich mit Hilfe des Gradienten dargestellt werden kann. Als nächstes interessieren wir uns für den Oberflächeninhalt eines durch eine Parameterdarstellung gegebenen Flächenstücks S. Es sei S durch die Parameterdarstellung (u, v) → ~r(u, v) ~r(u, v + dv) dS Fig. 8 : Zur Berechnung der Oberfläche eines Flächenstücks ~r(u, v) (z) ~r(u + du, v) (y) (x) gegeben, wo (u, v) über den Bereich B in der (u, v)-Ebene variiert. Wir denken uns S durch das Netz der Parameterlinien in kleine Teilstücke eingeteilt. Lassen wir u um du und v um dv wachsen, so erhalten wir auf der Fläche S ein differentielles Flächenstück dS. Dieses kann 24 U. Stammbach: Analysis, Teil B näherungsweise als ebenes Parallelogramm angesehen werden, welches durch die Vektoren ~r(u + du, v) − ~r(u, v) ∼ ~ru (u, v) du ~r(u, v + dv) − ~r(u, v) ∼ ~rv (u, v) dv aufgespannt wird. Sein Flächeninhalt dO lässt sich approximativ durch den Absolutbetrag des Vektorproduktes ausdrücken (siehe Figur 8). Es ist also dO = |~ru (u, v) × ~rv (u, v)| du dv. Der Flächeninhalt O des Flächenstücks S ist die “Summe” all dieser Anteile dO, also O= ZZ B |~ru (u, v) × ~rv (u, v)| du dv . Man beachte, dass in der Formel über den Parameterbereich B in der (u, v)-Ebene zu integrieren ist, der zum Flächenstück S gehört. Bemerkung Es handelt sich bei den obigen Überlegungen nicht um eine mathematische Herleitung, vielmehr müsste an dieser Stelle der Begriff des Flächeninhaltes einer gekrümmten Fläche definiert und dann gezeigt werden, dass die obige Formel unter vernünftigen Voraussetzungen an die Funktion (u, v) → ~r(u, v) diesen Flächeninhalt liefert. Hier haben wir uns mit einigen mehr heuristischen Überlegungen begnügt. Der Mathematiker kann allerdings zeigen, dass sie für “vernünftige” Parameterdarstellungen zum richtigen Resultat führen. Insbesondere bedeutet dies, dass der Wert des Integrals nicht von der Parameterdarstellung abhängig ist, die man für ein geometrisch gegebenes Flächenstück gewählt hat: das Integral liefert für verschiedene “vernünftige” Parameterdarstellungen desselben Flächenstücks das gleiche Resultat. Beispiel Wir betrachten die Oberfläche der Kugel vom Radius R und Mittelpunkt O; (u, v) → (R sin v cos u, R sin v sin u, R cos v) mit 0 ≤ u ≤ 2π, 0 ≤ v ≤ π. Es gilt ~ru (u, v) = (−R sin v sin u, R sin v cos u, 0) ~rv (u, v) = (R cos v cos u, R cos v sin u, −R sin v) ~ru (u, v) × ~rv (u, v) = (−R2 sin2 v cos u, −R2 sin2 v sin u, −R2 sin v cos v) . Das Vektorprodukt ~ru × ~rv ist ins Innere der Kugel gerichtet. Es ergibt sich dO = |~ru (u, v) × ~rv (u, v)| du dv = R2 sin v du dv (eine Formel, die sich übrigens auch direkt aus der Figur 9 ablesen lässt) und damit Kapitel VI. Vektoranalysis 25 (z) du Fig. 9 : Zur Berechnung der Oberfläche einer Kugel R sin v R sin v du R dv v dv R 2π O= π du 0 R2 sin v dv = R2 0 2π 0 du [− cos v]π0 = 4πR2 , ein uns wohlbekanntes Resultat. Beispiel Gesucht ist der Flächeninhalt der Tangentenfläche an die Schraubenlinie (u, v) → r(u, v) = (cos u − v sin u, sin u + v cos u, h(u + v)) für 0 ≤ u ≤ π/2, −u ≤ v ≤ 0 (siehe Figur 10). Dies beschreibt den Teil der Schraubenfläche, der zum Stück der Schraubenlinie im ersten Oktanten gehört und der sich zwischen diesem Kurvenstück und der (x, y)-Ebene befindet. Es gilt ru (u, v) = (− sin u − v cos u, cos u − v sin u, h) rv (u, v) = (− sin u, cos u, h) ru (u, v) × rv (u, v) = (−hv sin u, hv cos u, −v) . Daraus ergibt sich das Oberflächenelement dO = |ru (u, v) × rv (u, v)| du dv = |v| h2 + 1 du dv , 26 U. Stammbach: Analysis, Teil B 0.5 (v) (u) -0.5 0.5 -0.5 1 1.5 2 Fig. 10 : Der Bereich B der (u, v)-Ebene B -1 -1.5 -2 und der Flächeninhalt berechnet sich zu O = = = = = = ZZ p p p p p B |~ru (u, v) × ~rv (u, v)| du dv h2 + 1 h2 + 1 h2 + 1 Z 0 Z h2 + 1 π/2 du " 0 Z π/2 0 " h2 + 1 π/2 u3 6 π3 48 Z 0 −u v2 − 2 dv |v| #0 u2 du 2 du −u #π/2 0 . Beispiel Wir betrachten den Bereich A der (x, y)-Ebene, welcher durch die positive x-Achse und die Kurve ρ = cos(ϕ/4) begrenzt wird (siehe Figur 11). Wie gross ist der Flächeninhalt des 27 Kapitel VI. Vektoranalysis (y) 1 0.5 ρ = cos(ϕ/4) -1 -0.5 A Fig. 11 : Der Bereich A der (x, y)-Ebene 0.5 1 (x) -0.5 -1 über dem Bereich A liegenden Teils S der Oberfläche der Einheitskugel. Wir wählen zur Beschreibung des Flächenstücks S als Parameter Polarkoordinaten in der (x, y)Ebene. S wird dann durch die Parameterdarstellung (ρ, ϕ) → ~r(ρ, ϕ) = (ρ cos ϕ, ρ sin ϕ, q 1 − ρ2 ) beschrieben. Der Definitionsbereich A ist durch 0 ≤ ϕ ≤ 2π , 0 ≤ ρ ≤ cos(ϕ/4) gegeben. Dann ist ρ ~rρ (ρ, ϕ) = cos ϕ, sin ϕ, − p 1 − ρ2 ~rϕ (ρ, ϕ) = (−ρ sin ϕ, ρ cos ϕ, 0) ~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ) = |~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ)| = ! ρ2 ρ2 p p cos ϕ, sin ϕ, ρ 1 − ρ2 1 − ρ2 ! ρ4 ρ4 2 cos ϕ + sin2 ϕ + ρ2 1 − ρ2 1 − ρ2 Daraus ergibt sich der gesuchte Flächeninhalt ZZ ρ p O = dρ dϕ 1 − ρ2 B !1/2 ρ = p . 1 − ρ2 28 U. Stammbach: Analysis, Teil B Z = 2π 0 Z = 0 Z = 0 Z = 2π 2π 2π 0 dϕ Z cos(ϕ/4) 0 q dϕ − 1 − ρ dρ 1 − ρ2 p ρ2 q cos(ϕ/4) 0 dϕ (− 1 − cos2 (ϕ/4) + 1) dϕ (1 − sin(ϕ/4)) = [ϕ + 4 cos(ϕ/4)] 2π 0 = 2π − 4 . Man beachte, dass der Oberflächeninhalt der halben Einheitskugel gerade 2π beträgt. Wir betrachten zum Schluss noch kurz den Fall, wo das Flächenstück S auf einfache Weise als Graph einer Funktion f von zwei Variablen (x, y) gegeben ist. Setzen wir u = x und v = y, so erhalten wir aus dieser expliziten Darstellung sofort eine Parameterdarstellung von S (u, v) → ~r(u, v) = (u, v, f (u, v)) . Das übliche Vorgehen liefert dann mit ~ru (u, v) = (1, 0, fu (u, v)) und ~rv (u, v) = (0, 1, fv (u, v)) sofort ~ru (u, v) × ~rv (u, v) = (−fu (u, v), −fv (u, v), 1) , so dass man dO = q fu2 + fv2 + 1 du dv erhält. Der Oberflächeninhalt eines über dem Bereich B liegenden Graphen einer Funktion f : (x, y) → f (x, y) von zwei Variablen berechnet sich also mit Hilfe der Formel O= ZZ q B (fx (x, y))2 + (fy (x, y))2 + 1 dx dy , wobei wir natürlich wieder zur ursprünglichen Variablenbezeichnung zurückgekehrt sind. 29 Kapitel VI. Vektoranalysis 4 Der Fluss Es sei ein Vektorfeld ~v gegeben, das im Bereich D(~v ) definiert ist. Wir betrachten ein vollständig in D(~v ) liegendes Flächenstück S, das durch eine Parameterdarstellung gegeben ist und auf dem die eine der beiden Normalenrichtungen ~n ausgezeichnet ist. Ist ~v das Geschwindigkeitsfeld einer Flüssigkeitsströmung, so können wir fragen, wieviel Flüssigkeit pro Zeiteinheit in Richtung ~n durch das Flächenstück S hindurchfliesst. Diese Grösse nennt man den Fluss Φ des Vektorfeldes ~v in Richtung ~n durch S. Am einfachsten ist diese Frage natürlich zu beantworten, wenn S ein ebenes Flächenstück und ~v ein homogenes Vektorfeld ist. Das pro Zeiteinheit durch S in Richtung ~n fliessende Volumen ist dann das Volumen des (schiefen) Zylinders mit Grundfläche S und durch ~v gegebenen Mantellinien. Dieses Volumen ist offensichtlich Φ = (~v · ~n) O , wo O der Flächeninhalt von S ist (siehe Figur 1). S ~v ~n Fig. 1 : Fluss eines homogenen Vektorfeldes durch ein ebenes Rechteck 30 U. Stammbach: Analysis, Teil B Im allgemeinen Fall zerlegen wir S in “kleine” Teilbereiche dS; natürlich tun wir dies mit Vorteil längs der durch die Parameterdarstellung von S gegebenen Parameterlinien. Diese kleinen Teilbereiche dS können approximativ als eben und das Vektorfeld in jedem dieser Teilbereiche approximativ als homogen angesehen werden (siehe Figur 2). Der von dS herrührende Anteil dΦ des Flusses ist dann offenbar dΦ = ~v · ~n dO , wo dO der Flächeninhalt von dS bezeichnet. Die “Summe” all dieser Anteile, also das Integral, ist dann der Fluss des Vektorfeldes ~v durch S in Richtung ~n: ZZ Φ= S ~v · ~n dO . ~v ~n Fig. 2 : Fluss eines Vektorfeldes durch ein Flächenstück (z) (y) (x) Beispiel Gegeben ist eine elektrische Ladung e im Ursprung des Koordinatensystems. Gesucht ist der Fluss des zugehörigen Coulombfeldes durch eine Kugeloberfläche mit Mittelpunkt in O und Radius R von innen nach aussen. Es gilt 31 Kapitel VI. Vektoranalysis ~v = C e ~r . |~r|3 Damit ist ZZ Φ= S C e ~r · ~n dO , R3 wo ~n den äusseren Normaleneinheitsvektor der Kugeloberfläche bezeichnet. Da ~r und ~n parallel sind, gilt ~r · ~n = R. Damit folgt e Φ=C 2 R ZZ S dO = C e 4πR2 = 4πCe . R2 Der Fluss des Coulombfeldes zur Ladung e durch die Oberfläche einer Kugel mit Radius R, deren Mittelpunkt mit e zusammenfällt, ist proportional zur Grösse der Ladung e und unabhängig vom Radius R. Nicht immer ist die Berechnung des Flusses so einfach. Es sei das Flächenstück S durch die Parameterdarstellung (u, v) → ~r(u, v) = (x(u, v), y(u, v), z(u, v)) , (u, v) ∈ B gegeben. Daraus folgt für den Normaleneinheitsvektor ~n(u, v) ~n(u, v) = ± ~ru (u, v) × ~rv (u, v) . |~ru (u, v) × ~rv (u, v)| Das Vorzeichen hängt davon ab, welche der beiden Normalenrichtungen auf S wir auszeichnen. Da nach Abschnitt 3 das Flächenelement dO durch dO = |~ru (u, v) × ~rv (u, v)| du dv gegeben ist, folgt für den Fluss Φ=± ZZ B ~v (x(u, v), y(u, v), z(u, v)) · (~ru (u, v) × ~rv (u, v)) du dv . Dabei ist B der zu S gehörige Parameterbereich in der (u, v)-Ebene. Wie nicht anders zu erwarten war, führt die Umkehrung der Flussrichtung, d.h. die Wahl des anderen Normaleneinheitsvektors zu einem Vorzeichenwechsel. 32 U. Stammbach: Analysis, Teil B Beispiel Es sei das Vektorfeld v : (x, y, z) → v (x, y, z) = (xz, z, y) gegeben. Gesucht ist der Fluss Φ von innen nach aussen von v durch die Oberfläche S der Einheitskugel mit Mittelpunkt in O. Die Fläche S kann durch die Parameterdarstellung (u, v) → r(u, v) = (sin v cos u, sin v sin u, cos v) mit 0 ≤ u ≤ 2π, 0 ≤ v ≤ π beschrieben werden. Dann gilt (siehe Abschnitt 3) ru (u, v) × rv (u, v) = (− sin2 v cos u, − sin2 v sin u, − sin v cos v) . Dieser Normalenvektor (kein Einheitsvektor) ist nach innen gerichtet. Damit erhalten wir für den Fluss von innen nach aussen, also in der zu ru × rv entgegengesetzten Richtung Φ = − B = B v (x(u, v), y(u, v), z(u, v)) · (ru (u, v) × rv (u, v)) du dv (sin v cos u cos v, cos v, sin v sin u) · (sin2 v cos u, sin2 v sin u, sin v cos v) du dv (sin3 v cos v cos2 u + sin2 v cos v sin u + sin2 v cos v sin u) du dv = B π 2π dv = 0 π = π sin3 v cos v cos2 u du 0 sin3 v cos v dv 0 = π 1 sin4 v 4 π 0 = 0. Beispiel Gesucht ist der Fluss (in Richtung der äusseren Normalen) des Vektorfeldes v : (x, y, z) → v (x, y, z) = (2x − yz, xz + 3y, xy − z) durch den Kegelmantel des Kegels mit Spitze in O, der Achse gleich der z-Achse, dem halben Öffnungswinkel π/4 und der Höhe 1. Der Kegelmantel lässt sich durch die Parameterdarstellung (ρ, ϕ) → (ρ cos ϕ, ρ sin ϕ, ρ) 33 Kapitel VI. Vektoranalysis Fig. 3 : Kegelmantel mit Normalenvektor ~rρ × ~rϕ beschreiben, wobei ρ und ϕ Polarkoordinaten in der (x, y)-Ebene bezeichnen und der Bereich B durch 0 ≤ ρ ≤ 1 und 0 ≤ ϕ ≤ 2π gegeben ist. Es gilt dann ~rρ (ρ, ϕ) = (cos ϕ, sin ϕ, 1) ~rϕ (ρ, ϕ) = (−ρ sin ϕ, ρ cos ϕ, 0) ~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ) = (−ρ cos ϕ, −ρ sin ϕ, ρ(cos2 ϕ + sin2 ϕ)) = (−ρ cos ϕ, −ρ sin ϕ, ρ) . Dieser Normalenvektor ist nach innen gerichtet (siehe Figur 3). Deshalb gilt für den gesuchten Fluss Φ ZZ Φ = Z ZB Z B 1 = = 0 (2ρ cos ϕ − ρ2 sin ϕ, ρ2 cos ϕ + 3ρ sin ϕ, ρ2 sin ϕ cos ϕ − ρ) · (ρ cos ϕ, ρ sin ϕ, −ρ) dρ dϕ (2ρ2 cos2 ϕ − ρ3 sin ϕ cos ϕ + ρ3 sin ϕ cos ϕ + 3ρ2 sin2 ϕ − ρ3 sin ϕ cos ϕ + ρ2 ) dρ dϕ dρ Z 2π 0 dϕ (2ρ2 cos2 ϕ − ρ3 sin ϕ cos ϕ + 3ρ2 sin2 ϕ + ρ2 ) . Wegen Z 0 und 2π cos2 ϕ dϕ = Z 0 2π sin2 ϕ dϕ = π 34 U. Stammbach: Analysis, Teil B Z 0 2π cos ϕ sin ϕ dϕ = 0 folgt schliesslich Z Φ= 0 1 (2ρ2 π + 3ρ2 π + ρ2 2π) dρ = 7π Z 0 1 ρ2 dρ = 7π/3 . 35 Kapitel VI. Vektoranalysis 5 Der Divergenzsatz Gegeben sei ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) und ein endlicher räumlicher Bereich B (Kugel, Torus, etc) mit berandender Fläche ∂B. (Um der mathematischen Strenge Genüge zu tun, setzen wir voraus, dass sich ∂B aus endlich vielen Flächenstücken zusammensetzt, die sich durch stetig differenzierbare Parameterdarstellungen beschreiben lassen.) Auf ∂B sei der äussere Normaleneinheitsvektor ausgezeichnet (siehe Figur 1). Wir setzen voraus, dass ~v in ganz B definiert und dort “regulär” ist, d.h. dass ~v einmal stetig differenzierbar ist. Dann gilt der überraschende und wichtige Divergenzsatz, Satz von Gauss (C. F. Gauss 1777 - 1855): Satz Unter den obigen Voraussetzungen gilt: ZZ Φ= ∂B ~v · ~n dO = ZZZ B div ~v dV . Der Fluss des Vektorfeldes ~v von innen nach aussen durch die berandende Fläche ∂B von B ist gleich dem Volumenintegral der Divergenz von ~v über den Bereich B. Beispiel Wir betrachten das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (xz, z, y) und die Einheitskugel B mit Mittelpunkt in O. Wir haben in einem Beispiel in Abschnitt 4 bereits gesehen, dass der Fluss Φ (von innen nach aussen) von ~v durch die Kugeloberfläche Null ist. Nach dem Satz von Gauss gilt ZZZ Φ= B div ~v dV , so dass sich der Fluss Φ auch als Volumenintegral berechnen lässt. Wir erhalten div ~v (x, y, z) = z. Für das Integral ZZZ B z dV erhält man aber Null, da der von der oberen Halbkugel herrührende Anteil den Anteil der untern Halbkugel kompensiert. (Natürlich kann man mit Hilfe von Kugelkoordinaten dieses Integral auch leicht direkt berechnen: Es gilt z = r cos θ , dV = r 2 sin θ dr dϕ dθ . Also 36 U. Stammbach: Analysis, Teil B ~n Fig. 1 : Zum Satz von Gauss ~v ZZZ B z dV = Z 0 1 dr Z 0 2π dϕ Z π 0 dθ r cos θ r 2 sin θ = 0 . ) Wir beweisen den Satz von Gauss hier nicht. Immerhin wollen wir ihn in einem Spezialfall verifizieren, im Spezialfall nämlich, wo der Bereich B ein achsenparalleler Quader ist. Es sei B beschrieben durch die Ungleichungen (siehe Figur 2) a ≤ x ≤ b, c ≤ y ≤ d, e ≤ z ≤ f . Für das Vektorfeld ~v → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z)) ist dann das Volumenintegral ZZZ B div ~v dV = ZZZ B ∂v1 (x, y, z) dV + ∂x ZZZ B ∂v2 (x, y, z) dV + ∂y ZZZ B ∂v3 (x, y, z) dV ∂z 37 Kapitel VI. Vektoranalysis z=f y=d x=a (−1, 0, 0) Fig. 2 : Spezialfall des Satzes von Gauss x=b S10 S1 (z) y=c (1, 0, 0) z=e (y) (x) auszurechnen. Für dessen ersten Summanden gilt nun ZZZ B ∂v1 (x, y, z) dV ∂x Z = f e Z = e Z = = f f ZeZ Z dz c Z dz c Z dz S10 d c d d dy Z b a ∂v1 dx ∂x dy (v1 (b, y, z) − v1 (a, y, z)) dy ~v (b, y, z) · (1, 0, 0) + ~v · ~n dO + ZZ S1 Z f e dz Z c d dy ~v (a, y, z) · (−1, 0, 0) ~v · ~n dO , wo S10 die rechte und S1 die linke Seitenfläche des Quaders B bezeichnet. Der erste der obigen Summanden ist also gleich dem Fluss (von innen nach aussen) des Vektorfeldes ~v durch die Seitenflächen S1 und S10 . Analog verfährt man mit den übrigen beiden Summanden. Damit erhält man im Falle des Quaders tatsächlich ZZZ B div ~v dV = ZZ ∂B ~v · ~n dO . Im Rest dieses Abschnittes zeigen wir noch, wie der Satz von Gauss eine koordinatenfreie Definition der Divergenz liefert. Diese ermöglicht dann ihrerseits eine anschauliche Interpretation 38 U. Stammbach: Analysis, Teil B der Divergenz eines Vektorfeldes. Zur Einleitung betrachten wir neben dem (x, y, z)-Koordinatensystem ein zweites kartesisches Koordinatensystem (ξ, η, ζ). Ist uns im (x, y, z)-Koordinatensystem ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z)) gegeben, so stellt sich dieses im neuen (ξ, η, ζ)-Koordinatensystem natürlich durch andere Komponenten dar: ~ṽ : (ξ, η, ζ) → ~ṽ(ξ, η, ζ) = (ṽ1 (ξ, η, ζ), ṽ2 (ξ, η, ζ), ṽ3 (ξ, η, ζ)) . Es ist auch zu erwarten, dass die partielle Ableitungen der Komponenten ṽ1 , ṽ2 , ṽ3 nach den neuen Koordinaten ξ, η, ζ mit den partiellen Ableitungen von v1 , v2 , v3 nach x, y, z wenig mehr zu tun haben werden. Umso überraschender ist deshalb das Resultat, dass die Summe der partiellen Ableitungen der Komponenten des Vektorfeldes ~v nach den drei entsprechenden Koordinaten vom Koordinatensystem unabhängig ist: ∂v1 ∂v2 ∂v3 ∂ṽ1 ∂ṽ2 ∂ṽ3 (x, y, z) + (x, y, z) + (x, y, z) = (ξ, η, ζ) + (ξ, η, ζ) + (ξ, η, ζ) . ∂x ∂y ∂z ∂ξ ∂η ∂ζ Die Divergenz des Vektorfeldes, wie wir sie formal definiert haben, ist vom gewählten (kartesischen) Koordinatensystem unabhängig. Wir beweisen dies, indem wir mit Hilfe des Satzes von Gauss eine koordinatenfreie Definition von div ~v angeben. Wir betrachten zu diesem Zweck einen festen Punkt P0 = (x0 , y0 , z0 ) und eine Kugel Kr um P0 mit Radius r und Oberfläche Sr . Dann gilt nach dem Satz von Gauss ZZZ Kr div ~v dV = ZZ Sr ~v · ~n dO , wo ~n den äusseren Normaleneinheitsvektor bezeichnet (siehe Figur 3). Der Mittelwertsatz der Integralrechnung für Volumenintegrale besagt, dass ein Punkt Pr = (xr , yr , zr ) in Kr existiert mit ZZZ 4 div ~v dV = πr 3 div ~v (xr , yr , zr ) . 3 Kr Lässt man nun r gegen Null gehen, so ergibt sich 1 div ~v (x0 , y0 , z0 ) = lim 4 3 r→0 πr 3 ZZ Sr ~v · ~n dO . 39 Kapitel VI. Vektoranalysis ~n r Fig. 3 : Der Fluss durch die Oberfläche einer (kleinen) Kugel um P0 Pr P0 = (x0 , y0 , z0 ) Kr Sr Da der Fluss des Vektorfeldes ~v durch Sr definitionsgemäss nicht vom gewählten Koordinatensystem abhängig ist, ist auch die linke Seite der Gleichung vom gewählten Koordinatensystem unabhängig. Dies war zu beweisen. Wir sehen aus diesen Überlegungen, dass die Divergenz div ~v eines Vektorfeldes ~v in P0 = (x0 , y0 , z0 ) ein Mass für den aus der Volumeneinheit um P0 heraustretenden Fluss des Vektorfeldes ist. Die Aussage div ~v (x0 , y0 , z0 ) > 0, bedeutet, dass in P0 pro Volumeneinheit ein positiver Fluss erhalten wird. Anschaulich lässt sich dies dadurch deuten, dass in P0 fortlaufend “Flüssigkeit erzeugt wird”. Man nennt deshalb eine solche Stelle eine Quelle des Vektorfeldes ~v . Die Aussage div ~v (x0 , y0 , z0 ) < 0, lässt sich dadurch interpretieren, dass in P0 fortlaufend “Flüssigkeit verschwindet”; man spricht dann von einer Senke oder von einer negativen Quelle des Vektorfeldes. Ein Vektorfeld ~v , dessen Divergenz im ganzen Definitionsbereich verschwindet, div ~v ≡ 0 heisst quellenfrei. Anschaulich ist nach dem eben Gesagten klar, dass Strömungsfelder inkompressibler Medien quellenfrei sind; dies lässt sich, wie wir in Abschnitt 6 sehen werden, auch theoretisch bestätigen. Durch direkte Rechnung haben wir ausserdem bereits im Abschnitt 2 gezeigt, dass das Coulombfeld quellenfrei ist. 40 6 U. Stammbach: Analysis, Teil B Anwendungen des Divergenzsatzes Es gibt sehr viele Anwendungen des Divergenzsatzes. Wir besprechen hier einige davon, und zwar solche, die sich auch ohne detaillierte Kenntnisse der Anwendungsgebiete darstellen lassen. Dabei verläuft die Überlegung in allen Fällen formal gleich: Wir gehen von einem allgemeinen physikalischen Gesetz aus, wenden darauf den Divergenzsatz an und erhalten ein neues physikalisches Gesetz, das vom mathematischen Standpunkt aus wesentlich durchsichtiger und einfacher zu handhaben ist. Kontinuitätsgleichung der Hydrodynamik In unserm ersten Beispiel leiten wir aus dem sehr allgemeinen physikalischen Gesetz der Erhaltung der Materie die sogenannte Kontinuitätsgleichung der Hydrodynamik her. Wir betrachten ein (instationäres) Strömungsfeld eines Mediums (Gas oder Flüssigkeit) ~v : (x, y, z, t) → ~v (x, y, z, t) . Die Dichte des Mediums im Punkte (x, y, z) zur Zeit t sei durch das Skalarfeld ρ : (x, y, z, t) → ρ(x, y, z, t) beschrieben. Es sei nun B ein beliebiger endlicher Bereich, der ganz im Strömungsfeld liegt (siehe Figur 1). Zur Zeit t befindet sich dann im Innern von B die Masse m(t) = ZZZ B ρ(x, y, z, t) dV . Die zeitliche Änderung dieser Masse ist folglich gegeben durch dm d = dt dt ZZZ B ρ(x, y, z, t) dV = ZZZ B ρt (x, y, z, t) dV , wobei wir im letzten Schritt unser Wissen über die Ableitung eines Integrals nach einem Parameter benützt haben (siehe Kapitel V, Abschnitt 5). Pro Zeiteinheit tritt durch das Oberflächenelement dS die Masse ρ (~v · ~n) dO 41 Kapitel VI. Vektoranalysis ~n Fig. 1 : Zur Kontinuitätsgleichung B ~v aus, wobei ~n den äusseren Normaleneinheitsvektor bezeichnet. Durch die Gesamtoberfläche ∂B von B geht also die Masse ZZ ∂B (ρ~v ) · ~n dO verloren. Die Materiebilanz (“Gesetz der Erhaltung der Materie”) liefert nun die Gleichung ZZZ B ρt dV + ZZ ∂B (ρ~v ) · ~n dO = 0 . Die gesamte in B vorhandene Masse nimmt um genau so viel zu, wie durch die Oberfläche ∂B in den Bereich B hineinfliesst. An dieser Stelle wendet man nun auf das in der Gleichung auftretende Flussintegral ZZ ∂B (ρ~v ) · ~n dO den Divergenzsatz an, und zwar für das Vektorfeld w ~ : (x, y, z, t) → w(x, ~ y, z, t) = ρ(x, y, z, t) ~v (x, y, z, t) . 42 U. Stammbach: Analysis, Teil B Man erhält ZZ ∂B (ρ~v ) · ~n dO = ZZZ B div (ρ~v ) dV . Daraus ergibt sich die Integralbeziehung ZZZ B (ρt + div (ρ~v )) dV = 0 . Da diese Gleichung für jeden beliebigen Bereich B im Strömungsfeld erfüllt sein muss, schliessen wir, dass mit dem Integral auch der Integrand verschwindet: ρt + div (ρ~v ) = 0 . Dies ist die wichtige Kontinuitätsgleichung der Hydrodynamik. Wir betrachten davon noch einige Spezialfälle (a) Im Falle einer stationären Strömung ist ρt ≡ 0. Dann folgt div (ρ~v ) ≡ 0 . Dabei gilt natürlich div (ρ~v ) = ~v · grad ρ + ρ div ~v . (b) Im Falle einer Strömung eines inkompressiblen Mediums ist ρ zeitlich und örtlich konstant. Dann gilt div (ρ~v ) = ρ div ~v , so dass sich die Kontinuitätsgleichung in diesem Fall auf die Aussage div ~v ≡ 0 reduziert. Wir haben damit formal bewiesen, dass Strömungsfelder inkompressibler Medien (z.B. von Flüssigkeiten) quellenfrei sind (vergleiche Abschnitt 5). 43 Kapitel VI. Vektoranalysis Wärmeleitungsgleichung Unser zweites Beispiel geht aus vom grundlegenden physikalischen Erhaltungssatz der Energie. Wir werden daraus die sogenannte Wärmeleitungsgleichung herleiten. Es sei ein homogener Körper K gegeben. Die Temperatur an der Stelle (x, y, z) zur Zeit t sei durch das instationäre Skalarfeld u : (x, y, z, t) → u(x, y, z, t) beschrieben. Wir betrachten nun einen beliebigen ganz in K liegenden Bereich B mit Oberfläche ∂B (siehe Figur 2). Die zur Zeit t in B befindliche Wärmemenge W (t) ist gegeben durch W (t) = ZZZ B c ρ u(x, y, z, t) dV , ~n K Fig. 2 : Zur Wärmeleitungsgleichung B (z) (y) (x) wobei c die spezifische Wärme und ρ die Dichte des Materials ist. (Beide Grössen sind konstant, da wir K als homogen vorausgesetzt haben.) Die Änderung der Wärmemenge W (t) ist somit gegeben durch dW (t) = dt ZZZ B c ρ ut (x, y, z, t) dV . 44 U. Stammbach: Analysis, Teil B dS grad u ~n Fig. 3 : Zum Ansatz von Newton für die Wärmeleitung (z) (y) (x) Da in B weder Wärme erzeugt noch vernichtet wird, kann die Änderung der Wärmemenge W (t) nur durch einen Wärmefluss durch die Oberfläche ∂B von B verursacht werden. In dieser Form benützen wir den Erhaltungssatz der Energie. Um den Wärmefluss durch die Oberfläche mathematisch ausdrücken zu können, greifen wir auf das von Newton beschriebene Erfahrungsgesetz zurück (siehe Figur 3): Die pro Zeiteinheit durch das differentielle Flächenstück dS in Richtung des Normaleneinheitsvektors ~n hindurchfliessende Wärmemenge ist proportional zum Temperaturgefälle in Richtung ~n, also zur Richtungsableitung D~n u von u in Richtung ~n und natürlich proportional zum Flächeninhalt dO des Flächenstücks dS. Wegen D~n u = ~n · grad u (siehe Kapitel IV, Abschnitt 7) folgt für die durch dS hinaus tretende Wärmemenge dW = −k ~n · grad u dO. Dabei ist k eine positive Konstante. Wir erhalten damit die Gleichung ZZZ B c ρ ut dV = ZZ ∂B k (~n · grad u) dO , wenn wir mit ~n den äusseren Normaleneinheitsvektor von B bezeichnen. An dieser Stelle wenden wir nun den Divergenzsatz auf das auf der rechten Seite stehende Flussintegral an. Wir erhalten 45 Kapitel VI. Vektoranalysis ZZ ∂B k (~n · grad u) dO = ZZZ B k div grad u dV . Daraus folgt ZZZ B (cρut − kdiv (grad u)) dV = 0 . Da dies für beliebige in K liegende Bereiche B gelten muss, folgern wir, dass mit dem Integral auch der Integrand Null ist. Verwenden wir wie üblich die Bezeichnung div grad u = ∆u und setzen wir a2 := k , cρ so gilt ut − a2 ∆u = 0 . Dies ist die sogenannte Wärmeleitungsgleichung. Diese lineare partielle Differentialgleichung zweiter Ordnung tritt in vielen anderen Anwendungen, nämlich ganz allgemein bei Diffusionsproblemen auf. In der Analysis III wird einiges über die Lösungen dieser Gleichungen gesagt werden. Wir erwähnen zum Schluss noch den Spezialfall einer stationären Temperaturverteilung, also z.B. einer Temperaturverteilung, wie sie sich in einem isolierten Körper K nach langer Zeit automatisch einstellt. Dann gilt ut ≡ 0, so dass u Lösung der partiellen Differentialgleichung ∆u = 0 sein muss. Die stationäre Temperaturverteilung u genügt der sogenannten Laplace’schen Differentialgleichung ∆u = 0; die Lösungen der Laplace’schen Differentialgleichungen heissen definitionsgemäss harmonische Funktionen. Grundgleichung der Elektrostatik In unserm dritten Beispiel leiten wir die Grundgleichung der Elektrostatik, also eine der vier Maxwell’schen Gleichungen (siehe Physik) aus dem Coulomb’schen Gesetz her. 46 U. Stammbach: Analysis, Teil B ~ einer elektrischen Ladung e im Das Coulomb’sche Gesetz besagt, dass das elektrische Feld E Punkte P0 = (x0 , y0 , z0 ) durch ~r − ~r0 ~ E(x, y, z) = e |~r − ~r0 |3 beschrieben wird, wobei wir zur Abkürzung ~r = (x, y, z) und ~r0 = (x0 , y0 , z0 ) gesetzt haben. Man vergleiche dazu das entsprechende Beispiel in Abschnitt 1, wo das Coulombfeld für P0 = O beschrieben wurde. (Der Einfachheit halber setzen wir jetzt die dort auftretende Konstante gleich 1; dies entspricht einer geschickten Wahl der Masseinheiten.) ~ ≡ 0. Es Wir haben bereits gesehen, dass das Coulombfeld quellenfrei ist; d.h. es gilt div E sei nun B ein Bereich, der P0 enthält, sein Rand sei ∂B. Der Fluss Φ von innen nach aussen durch ∂B lässt sich mit Hilfe des Divergenzsatzes berechnen. Zu diesem Zweck sparen wir aus B eine kleine Kugel K mit Mittelpunkt P0 aus (siehe Figur 4). Für den durchlöcherten Bereich ~ ist in ganz B̄ regulär. B̄ ist die Voraussetzung des Divergenzsatzes erfüllt: Das Vektorfeld E ~ ist in P0 nicht definiert!) Der Divergenzsatz (Man beachte, dass dies für B nicht der Fall ist: E ~ angewandt auf B̄ und E liefert nun ZZZ 0= B̄ ~ dV = div E ZZ ∂ B̄ ~ · ~n dO = E ZZ ∂B ~ · ~n dO + E ZZ ∂K ~ · ~n dO . E Dabei ist im zweiten Flussintegral die für B̄ äussere, also die für die Kugel K innere Normalenrichtung zu wählen. Das letztere Flussintegral wurde in Abschnitt 4 für die äussere Normalenrichtung bereits berechnet. Jenes Resultat liefert ZZ ∂K ~ · ~n dO = −4πe . E ~ durch die Oberfläche Wir erhalten damit die Aussage: Für den Fluss Φ des Coulombfeldes E ∂B eines Bereiches B gilt ZZ ∂B ( ~ · ~n dO = E +4πe falls e in B enthalten ist, 0 sonst . Wir betrachten nun endlich viele Punktladungen e1 , e2 , . . . , em in den Punkten P1 , P2 , . . . , Pm . ~ i , so folgt für das totale elektrische Feld E ~ Erzeugt ei das Coulombfeld E ~ =E ~1 + E ~2 + · · · + E ~m . E Ferner sei B ein beliebiger Bereich (siehe Figur 5). Wir erhalten dann für den Fluss des Vek~ aus B heraus torfeldes E 47 Kapitel VI. Vektoranalysis ∂B ∂K ~n e Fig. 4 : Der Fluss eines Coulombfeldes P0 ~n (z) (y) (x) ∂B B Fig. 5 : Der Fluss einer Summe von Coulombfeldern e2 e1 ~n (z) e3 (y) (x) 48 U. Stammbach: Analysis, Teil B ZZ ∂B ZZ ~1 + E ~2 + · · · + E ~ m ) · ~n dO = (E ∂B = 4π ~ 1 · ~n dO + E X ZZ ∂B ~ 2 · ~n dO + · · · + E ZZ ∂B ~ m · ~n dO E ei , wobei die Summe über diejenigen Ladungen zu erstrecken ist, die in B enthalten sind. Im Falle einer kontinuierlichen Ladungsverteilung gehen wir wie folgt vor. Es sei die Ladungsdichte gegeben durch das Skalarfeld ρ : (x, y, z) → ρ(x, y, z) . Dann folgt für das Flussintegral durch die Oberfläche ∂B des Bereiches B ZZ ∂B ~ · ~n dO = 4π E ZZZ B ρ dV , denn das rechts stehende Integral liefert gerade die in B enthaltene Ladung (entsprechend der Summe der Einzelladungen ei bei der diskreten Ladungsverteilung). Wenden wir nun den Divergenzsatz auf das links stehende Integral an, so folgt ZZZ B ~ − 4πρ) dV = 0 . (div E Da B beliebig gewählt werden kann, folgern wir aus dem Verschwinden des Integrals das Verschwinden des Integranden. Es gilt also ~ = 4πρ . div E Dies ist die Grundgleichung der Elektrostatik, eine der vier Maxwell’schen Gleichungen (J. C. Maxwell 1831 - 1879). Als triviale Folgerung erhalten wir, dass im ladungsfreien Raum (ρ ≡ 0) die elektrische Feldstärke quellenfrei ist. Hydrostatischer Auftrieb Gegeben sei ein Körper K, der vollständig in eine Flüssigkeit mit dem spezifischen Gewicht γ eingetaucht werde. Man weiss mit Archimedes (Heureka!), dass dann eine Auftriebskraft auf 49 Kapitel VI. Vektoranalysis den Körper wirkt. Hier wollen wir die Grösse dieser Kraft mit Hilfe des Satzes von Gauss aus dem Druckverlauf in der Flüssigkeit ermitteln. Wir nehmen an, dass der Flüssigkeitsspiegel horizontal sei. Bezeichnen wir mit p(z) den in der Tiefe z herrschenden Druck, so gilt natürlich p(z) = p0 + γz , wobei p0 der Druck an der Flüssigkeitsoberfläche ist (siehe Figur 6). Ist B der vom Körper K eingenommene Bereich, so bezeichne ~n den äusseren Normaleneinheitsvektor. Auf das differentielle Flächenstück dS von B wirkt dann die Kraft Fig. 6 : Zum hydrostatischen Auftrieb B ~ dA ~n (z) ~ = −(p0 + γz) ~n dO , dA ~ also und auf den ganzen Körper K somit die “Summe” aller dA, ~= A ZZ ∂B ~= − dA ZZ ∂B (p0 + γz) n1 dO, − ZZ ∂B (p0 + γz) n2 dO, − ZZ ∂B (p0 + γz) n3 , dO . Mit Hilfe des Divergenzsatzes lassen sich diese Oberflächenintegrale uminterpretieren. Zu diesem Zweck führen wir (Hilfs-)Vektorfelder ein, die erlauben, die Integrale als Flussintegrale aufzufassen. Wählen wir als erstes das Vektorfeld ~v = (p0 + γz, 0, 0), dann liefert der Divergenzsatz angewandt auf B 50 U. Stammbach: Analysis, Teil B ZZ ∂B (p0 + γz) n1 dO = ZZ ∂B ~v · ~n dO = ZZZ B div ~v dV = 0 . Tun wir dasselbe für das Vektorfeld ~v = (0, p0 + γz, 0) so erhalten wir ZZ ∂B (p0 + γz) n2 dO = ZZ ∂B ~v · ~n dO = ZZZ B div ~v dV = 0 . Wählen wir schliesslich ~v = (0, 0, p0 + γz), so folgt auf gleiche Weise ZZ ∂B (p0 + γz) n3 dO = ZZ ∂B ~v · ~n dO = ZZZ B div ~v dV = ZZZ γ dV = γ V , wo V das Volumen des Körpers K bezeichnet. Das Produkt γ V ist nichts anderes als das Gewicht der verdrängten Flüssigkeit. Es gilt für die Auftriebskraft ~ = (0, 0, −γ V ) , A und wir haben das wohlbekannte Archimedische Prinzip hergeleitet. 51 Kapitel VI. Vektoranalysis 7 Die Arbeit In Abschnitt 4 haben wir den Begriff des Flusses eines Vektorfeldes eingeführt. Hier nun geht es um einen weiteren mit einem Vektorfeld verbundenen Begriff, nämlich um die Arbeit eines Vektorfeldes. Wie so oft kommt auch hier der Name des mathematischen Begriffs aus einer speziellen Anwendung: Bei der Berechnung der Arbeit, die eine Kraft im physikalisch-mechanischen Sinn leistet, tritt diese mathematische Bildung auf. Gegeben sei ein reguläres d.h. stetig differenzierbares Vektorfeld ~v : (x, y, z) → ~v (x, y, z) und ein ganz im Definitionsbereich D(~v ) von ~v verlaufender Weg W mit Anfangspunkt P und Endpunkt Q. Unter einem Weg verstehen wir eine mit einem Durchlaufsinn versehene Kurve, die sich aus endlich vielen stetig differenzierbaren Kurvenstücken zusammensetzt. Um zum mathematischen Begriff Arbeit zu gelangen, fassen wir das Vektorfeld ~v als Kraftfeld auf und fragen nach der mechanischen Arbeit, die ~v leistet, wenn sich ein Punkt längs des Weges W von P nach Q bewegt. Fig. 1 : Die Arbeit; Spezialfall. ~v ω P l Q Im einfachen Spezialfall eines geradlinig verlaufenden Weges W von P nach Q und eines homogenen Vektorfeldes ~v , ist diese Arbeit gegeben durch (siehe Figur 1) 52 U. Stammbach: Analysis, Teil B A = |~v | l cos ω = ~v · P~Q . Dabei bezeichnet l die Länge von W und ω den Winkel zwischen den Vektoren ~v und P~Q. Q Fig. 2 : Die Arbeit; allgemeiner Fall. W (z) P (y) (x) Im allgemeinen Fall unterteilen wir den Weg in “kurze” Teilstücke. Diese können als geradlinig und das Vektorfeld in ihrem Bereich als homogen angesehen werden. Der Anteil dA an die Arbeit, der von einem solchen Teilstück d~r herrührt, ist offenbar gegeben durch dA = ~v · d~r . Die gesamte Arbeit auf dem Weg W von P bis Q ist dann die “Summe” all dieser Anteile, also das Integral (siehe Figur 2) A= Z W ~v · d~r . Im konkreten Fall ist der Weg W durch eine Parameterdarstellung gegeben, ~ , ~r(tQ ) = OQ, ~ . t → ~r(t) = (x(t), y(t), z(t)), ~r(tP ) = OP 53 Kapitel VI. Vektoranalysis Dann gilt ~v · d~r = ~v · ~r˙ (t) dt und damit A = = Z tQ tP Z tQ tP ~v (x(t), y(t), z(t)) · ~r˙ (t) dt (v1 (x(t), y(t), z(t)), v2 (x(t), y(t), z(t)), v3 (x(t), y(t), z(t))) · (ẋ(t), ẏ(t), ż(t)) dt . Der Wert dieses Wegintegrals ist definitionsgemäss die Arbeit, die das Vektorfeld ~v längs des Weges W leistet. Wie schon erwähnt, tritt die formale Bildung des Arbeitsintegrals auch in vielen Anwendungen auf, wo das Vektorfeld kein Kraftfeld ist; das Integral trägt dann oft einen anderen Namen. Im Falle eines Strömungsfeldes heisst es Zirkulation; im Fall des elektrischen Feldes beschreibt das Integral nichts anderes als die (elektrische) Spannung. Beispiel Es sei ~v das Gravitationsfeld eines Massenpunktes, der sich in O befindet, ~v (x, y, z) = −C ~r . |~r|3 Wir fragen nach der Arbeit A, die ~v längs eines Kreises K mit Mittelpunkt in O leistet. Ist W der durch den Kreis K gegebene Weg (der Durchlaufsinn spielt in diesem Beispiel keine Rolle), dann ist A= Z W ~v · d~r = 0 , denn ~v ist gegen den Ursprung O gerichtet und d~r verläuft senkrecht zu ~r, es ist also ~v · d~r = 0. Es sei ein Weg W mit Startpunkt P und Endpunkt Q gegeben. Wir bezeichnen mit −W den Weg mit dem umgekehrten Durchlaufsinn. Offensichtlich gilt dann Z −W ~v · d~r = Z W Z ~v · (−d~r) = − W ~v · d~r . Ist W1 ein Weg mit Anfangspunkt P und Endpunkt Q und W2 ein Weg mit Anfangspunkt Q und Endpunkt R, so lassen sich W1 und W2 zu einem Weg zusammensetzen, den wir mit W1 + W2 bezeichnen (siehe Figur 3). Es gilt dann Z W1 +W2 Beispiel ~v · d~r = Z W1 ~v · d~r + Z W2 ~v · d~r . Es sei das Vektorfeld des stromdurchflossenen Leiters gegeben, 54 U. Stammbach: Analysis, Teil B Q W1 Fig. 3 : Zusammensetzung von Wegen W2 P R ~v : (x, y, z) → ~v (x, y, z) = 2J y x − 2 , ,0 x + y 2 x2 + y 2 , und es sei W der durch t → (a cos t, a sin t, 0) , 0 ≤ t ≤ 2π beschriebene (geschlossene) Weg. Die Arbeit von ~v längs des Weges W berechnet sich dann durch A = = Z ~v · d~r W Z 2π 0 = 2J ~v (a cos t, a sin t, 0) · ~r˙ (t) dt Z 0 Z = 2J 2π 0 2π ! a sin t a cos t − 2 , 0 · (−a sin t, a cos t, 0) dt 2 , 2 2 a (cos t + sin t) a (cos2 t + sin2 t) 1 dt = 2J 2π . Wir werden später auf dieses interessante Beispiel zurückkommen. 55 Kapitel VI. Vektoranalysis Beispiel Es sei das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (2xy, x2 + y 2 , 0) gegeben. Gesucht ist die Arbeit, die ~v längs der im Gegenuhrzeigersinn durchlaufenen Ellipse E : t → ~r(t) = (a cos t, b sin t, 0) , 0 ≤ t ≤ 2π , leistet (siehe Figur 4). Es gilt (y) E b Fig. 4 : Arbeit des Vektorfeldes a (x) ~v (x, y, z) = (2xy, x2 + y 2 , 0) längs der Ellipse E A = Z ~v · d~r E 2π Z = 0 Z = 0 Z = 2π 2π 0 = 0. (2ab sin t cos t, a2 cos2 t + b2 sin2 t, 0) · (−a sin t, b cos t, 0) dt (−2a2 b sin2 t cos t + a2 b cos3 t + b3 sin2 t cos t) dt (−2a2 b + b3 ) sin2 t cos t dt + Z 0 2π a2 b cos3 t dt 56 8 U. Stammbach: Analysis, Teil B Der Satz von Stokes Der Satz von Stokes steht in einem gleichen Verhältnis zum Satz von Gauss wie die Arbeit eines Vektorfeldes zum Fluss eines Vektorfeldes, oder wie der Operator rot zum Operator div . Es sei v : (x, y, z) → ~v (x, y, z) ein reguläres, d.h. stetig differenzierbares Vektorfeld mit Definitionsbereich D(~v ). Ferner sei S ein ganz in D(~v ) enthaltenes orientiertes Flächenstück mit Rand ∂S. Orientiert heisst ein Flächenstück, wenn darauf einer der beiden Normaleneinheitsvektoren ~n ausgezeichnet ist, und zwar auf eine auf der ganzen Fläche konsistenten, d.h. stetigen Weise. (Man beachte, dass sich nicht jedes Flächenstück orientieren lässt: ein Möbiusband kann nicht orientiert werden!) Der Einfachheit halber und um der mathematischen Strenge Genüge zu tun, nehmen wir an, dass sich S und ∂S aus endlich vielen stetig differenzierbaren Flächenstücken bzw. Kurvenstücken zusammensetzt. Wir machen nun die geschlossene Randkurve ∂S zu einem Weg C, indem wir einen Durchlaufsinn wählen, der mit der Orientierung von S verträglich ist: Wir durchlaufen ∂S so, dass mit dem auf S ausgezeichneten Normalenvektor eine Rechtsschraube gebildet wird (siehe Figur 1). Dann gilt der Satz von Stokes (G. G. Stokes 1819-1903): Satz von Stokes Unter den obigen Voraussetzungen gilt Z C ~v · d~r = ZZ S rot ~v · ~n dO . Die Arbeit des Vektorfeldes ~v längs des Randweges C ist gleich dem Fluss von rot ~v in Richtung ~n durch die Fläche S. Beispiel Wir betrachten das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (2xy, x2 + y 2 , 0) . Es sei S die Ellipsenfläche x2 y 2 + 2 ≤1 a2 b in der (x, y)-Ebene, ~n der in Richtung der z-Achse zeigende Normaleneinheitsvektor. Der Rand ∂S ist dann die Ellipsenperipherie, die wir zu einem (geschlossenen) Weg C machen, indem wir ihn verträglich mit ~n, also im Gegenuhrzeigersinn durchlaufen. Nach dem Satz von Stokes gilt dann 57 Kapitel VI. Vektoranalysis ~n Fig. 1 : Zum Satz von Stokes S C (z) (y) (x) Z C ~v · d~r = ZZ S rot ~v · ~n dO = ZZ S (0, 0, 0) · (0, 0, 1) dO = 0 , in Übereinstimmung mit dem Resultat in Abschnitt 7, wo wir die Arbeit des Vektorfeldes ~v längs des Weges C direkt berechnet haben. Wir entnehmen diesem Beispiel, dass wir aus dem Satz von Stokes die nachstehende Folgerung ziehen können: Es sei ~v : (x, y, z) → ~v (x, y, z) ein reguläres Vektorfeld mit rot ~v = (0, 0, 0) und es sei C ein Weg, der den Rand eines ganz in D(~v ) liegenden orientierten Flächenstücks S bildet. Dann ist die Arbeit A des Vektorfeldes ~v längs C Null. Beispiel Es sei das offensichtlich überall reguläre Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (x2 − y 2 , −xy, 0) gegeben. Gesucht ist die Arbeit von ~v längs des geschlossenen Weges C in der (x, y)-Ebene, wobei C von P = (1, 0) längs der Geraden y = 1 − x nach Q = (0, 1) und von dort längs des 58 U. Stammbach: Analysis, Teil B (y) Fig. 2 : Arbeit längs des geschlossenen Weges C C S (x) Einheitskreises t → (cos t, sin t) zurück nach P verläuft (siehe Figur 2). Nach dem Satz von Stokes gilt Z C ~v · d~r = ZZ S rot ~v · ~n dO . p Dabei bezeichnen wir mit S das durch 0 ≤ y ≤ 1 und 1 − y ≤ x ≤ 1 − y 2 gegebene Flächenstück der (x, y)-Ebene. Der vorgeschriebene Durchlaufsinn der Randkurve beschreibt mit dem Einheitsvektor in der negativen z-Richtung eine Rechtsschraube; konsequenterweise ist ~n = (0, 0, −1). Mit rot ~v = (0, 0, y) erhalten wir ZZ Z Z √ S 1 rot ~v · ~n dO = − = − 0 Z 0 1 = − 2 = 1 dy 1−y 2 1−y y dx q dy y 1 − y 2 − y(1 − y) Z 0 1 q 2y 1 − y 2 dy − 1 2 (1 − y 2 )3/2 2 3 1 = − − 3 1 1 − 3 2 1 0 " − Z y3 0 1 (y 2 − y) dy y2 − 3 2 #1 0 59 Kapitel VI. Vektoranalysis = − Beispiel 1 . 6 Wir betrachten das Stück S der durch z = x2 − y 2 gegebenen Sattelfläche, das zu x2 + y 2 ≤ a2 gehört (siehe Figur 3). Die Randkurve C dieses Flächenstücks ist gegeben durch die Parameterdarstellung Fig. 3 : Sattelfläche S mit Randkurve C C t → (a cos t, a sin t, a2 (cos2 t − sin2 t)) , 0 ≤ t ≤ 2π . Ferner betrachten wir das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (z, x, y) . Gesucht ist die Arbeit des Vektorfeldes ~v längs der Kurve C. Laut Satz von Stokes können wir diese Arbeit auf zwei verschiedene Arten berechnen, nämlich erstens als Arbeit längs des Weges 60 U. Stammbach: Analysis, Teil B C und zweitens als Fluss des Vektorfeldes rot ~v durch die Fläche S und zwar in der Richtung, mit welcher der Durchlaufsinn der Randkurve eine Rechtsschraube bildet. Die direkte Berechnung liefert Z C ~v · d~r = Z 0 Z = 0 Z = 0 2π (a2 (cos2 t − sin2 t), a cos t, a sin t) · (−a sin t, a cos t, a2 (−4 cos t sin t)) dt 2π 2π (−a3 cos2 t sin t + a3 sin2 t sin t + a2 cos2 t − 4a3 sin2 t cos t) dt (−2a3 cos2 t sin t + a3 sin t + a2 cos2 t − 4a3 sin2 t cos t) dt = πa2 , denn nur der zweitletzte Summand liefert einen von Null verschiedenen Beitrag. Wir wenden uns jetzt der Berechnung des Flusses zu und wählen als Parameterdarstellung des Flächenstücks S: (u, v) → ~r(u, v) = (u, v, u2 − v 2 ) , u2 + v 2 ≤ a2 . Wir erhalten dann ~ru (u, v) = (1, 0, 2u) , ~rv (u, v) = (0, 1, −2v) und damit den Normalenvektor ~ru (u, v) × ~rv (u, v) = (−2u, 2v, 1) . Dieser bildet mit dem gegebenen Durchlaufsinn der Randkurve C eine Rechtsschraube. Für die Rotation des Vektorfeldes erhalten wir rot ~v = (1, 1, 1) . Damit liefert die Flussberechnung ZZ Φ = = = Z ZS Z ZB B rot ~v · ~n dO (1, 1, 1) · (−2u, 2v, 1) du dv (−2u + 2v + 1) du dv , 61 Kapitel VI. Vektoranalysis wobei B der durch u2 + v 2 ≤ a2 gegebene Kreis in der (u, v)-Ebene ist. Für dieses B liefert aus Symmetriegründen nur der letzte der drei Summanden einen Beitrag. Damit gilt Φ = πa2 . Wir beweisen in dieser Vorlesung den Satz von Stokes natürlich nicht. Immerhin wollen wir in einem Spezialfall plausibel machen, weshalb der Satz von Stokes richtig ist. Zu diesem Zweck betrachten wir den Fall, wo S ein achsenparalleles Rechteck ist, welches durch a≤x≤b, c≤y≤d, z=e ~n y=d x=a S x=b Fig. 4 : Spezialfall des Satzes von Stokes y=c (z) (y) (x) gegeben ist (siehe Figur 4). Wir durchlaufen dieses Rechteck im Gegenuhrzeigersinn und nennen den entsprechenden Weg C. Es muss dann auf S der Normaleneinheitsvektor ~n = (0, 0, 1) gewählt werden. Nun gilt mit rot ~v = ∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1 − , − , − ∂y ∂z ∂z ∂x ∂x ∂y 62 U. Stammbach: Analysis, Teil B für die Berechnung des Flusses von rot ~v durch S in Richtung ~n ZZ ZZ ∂v2 ∂v1 rot ~v · ~n dO = dx dy − ∂x ∂y S S Z d Z b Z b Z d ∂v2 ∂v1 = dy dx dx dy − ∂x ∂y c a a c Z = c Z = = d d Zc C (v2 (b, y, e) − v2 (a, y, e)) dy − v2 (b, y, e) dy + Z a b Z b a (v1 (x, d, e) − v1 (x, c, e)) dx v1 (x, d, e) dx + Z c d v2 (a, y, e) dy + Z b a v1 (x, c, e) dx ~v · d~r , so dass in diesem Fall der Satz von Stokes verifiziert ist. Auf ähnliche Weise wie der Divergenzsatz eine koordinatenfreie Definition von div liefert, so liefert der Satz von Stokes eine koordinatenfreie Definition der Rotation und damit eine anschauliche Bedeutung für rot ~v . Wir bemerken zuerst, dass rot ~v mit Hilfe eines festgewählten Koordinatensystems definiert ist, rot ~v (x, y, z) = ∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1 − , − , − ∂y ∂z ∂z ∂x ∂x ∂y . Es ist von vornherein nicht klar, dass sich der Vektor rot ~v nicht ändert, wenn ein anderes kartesisches Koordinatensystem gewählt wird und in diesem auf formal dieselbe Art ein Vektor gebildet wird. Der Satz von Stokes erlaubt nun, eine koordinatenfreie Definition anzugeben und auf diese Art zu zeigen, dass das Vektorfeld rot ~v : (x, y, z) → rot ~v (x, y, z) unabhängig vom gewählten kartesischen Koordinatensystem ist. Ausserdem liefert dieselbe Überlegung auch eine anschauliche Bedeutung für rot ~v (x0 , y0 , z0 ). Es sei ein Vektorfeld ~v gegeben und P0 = (x0 , y0 , z0 ) ein Punkt in seinem Definitionsbereich D(~v ). Ferner sei ~n ein beliebiger Einheitsvektor. Mit Sr bezeichnen wir die auf ~n senkrecht stehende Kreisscheibe mit Radius r und Mittelpunkt P0 . Schliesslich sei Cr der Sr berandende Weg, der mit ~n eine Rechtsschraube bildet (siehe Figur 5). Der Satz von Stokes liefert in dieser Situation Z Cr ~v · d~r = ZZ Sr rot ~v · ~n dO . Nach dem Mittelwertsatz für Flächenintegrale gibt es auf Sr einen Punkt Pr = (xr , yr , zr ) mit Kapitel VI. Vektoranalysis 63 v n Fig. 5 : Arbeit längs eines (kleinen) Kreises Sr P0 = (x0 , y0 , z0 ) Cr Sr rot v · n dO = πr 2 rot v (xr , yr , zr ) · n . Für r → 0 erhalten wir wegen der Stetigkeit des Feldes rot v somit 1 r→0 πr 2 n · rot v (x0 , y0 , z0 ) = lim 1 r→0 πr 2 rot v · n dO = lim Sr Cr v · dr . Nun gilt bekanntlich für das Skalarprodukt das Folgende: n · rot v (x0 , y0 , z0 ) nimmt den maximalen Wert genau dann an, wenn der Vektor n parallel zum Vektor rot v (x0 , y0 , z0 ) ist. Dieser maximale Wert ist |rot v (x0 , y0 , z0 )|. Wir haben damit den Vektor rot v (x0 , y0 , z0 ) in Richtung und Länge beschreiben können: Der Vektor n zeigt genau dann in Richtung rot v (x0 , y0 , z0 ), wenn 1 r→0 πr 2 lim Cr v · dr den maximalen Wert annimmt. Dieser Wert ist gleich |rot v (x0 , y0 , z0 )|. Für die Anschauung entnehmen wir dieser Überlegung, dass rot v (x0 , y0 , z0 ) Richtung und 64 U. Stammbach: Analysis, Teil B Stärke der “Wirbelung” des Vektorfeldes ~v im Punkte (x0 , y0 , z0 ) angibt. Wählen wir eine zu rot ~v (x0 , y0 , z0 ) senkrecht stehende Kreisscheibe Sr mit Radius r, Mittelpunkt (x0 , y0 , z0 ) und Rand Cr , so gibt die Länge von rot ~v (x0 , y0 , z0 ) die Arbeit des Vektorfeldes ~v längs Cr pro Flächeneinheit von Sr an. Anschaulich heisst dies, dass das Vektorfeld ~v in (x0 , y0 , z0 ) einen Wirbel aufweist, der senkrecht zu rot ~v (x0 , y0 , z0 ) verläuft. Aus diesem Grund heisst rot ~v auch etwa die Wirbelstärke von ~v . Gilt für ein Vektorfeld rot ~v (x, y, z) ≡ (0, 0, 0), so heisst dieses wirbelfrei. Zum Schluss merken wir noch an, dass gemäss den Resultaten des Abschnittes 2 jedes Gradientenfeld wirbelfrei ist; insbesondere ist auch das Coulombfeld wirbelfrei. 65 Kapitel VI. Vektoranalysis 9 Eine Anwendung des Satzes von Stokes Wie die Anwendungen des Divergenzsatzes so sind auch die Anwendungen des Satzes von Stokes sehr zahlreich. Zur Illustration stellen wir hier ein Beispiel aus der Elektrodynamik dar. Wir betrachten ein (instationäres) Magnetfeld ~ : (x, y, z, t) → H(x, ~ H y, z, t) . Im Definitionsbereich dieses Magnetfeldes sei eine geschlossene Kurve C gegeben; diese betrachten wir als Weg, indem wir C mit einem Durchlaufsinn versehen. Konkret können wir uns C als Draht vorstellen, an dem wir die elektrische Spannung messen werden, und zwar in der durch den Durchlaufsinn gegebenen Richtung. Ferner sei S irgend eine Fläche mit Rand ∂S = C. Schliesslich zeichnen wir auf S denjenigen Normaleneinheitsvektor aus, der mit dem Durchlaufsinn auf C eine Rechtsschraube bildet (siehe Figur 1). Wir bezeichnen nun mit Z den ~ durch S in Richtung ~n, Fluss von H Z= ZZ S ~ · ~n dO . H Das physikalische Experiment zeigt dann Folgendes: Falls Z zeitlich variiert, so fliesst in C ein elektrischer Strom, und zwar besagt das von Faraday (M. Faraday 1791 - 1867) stammende Erfahrungsgesetz, dass für die induzierte Spannung die Gleichung Vind = −µ0 dZ dt gilt, d.h. die induzierte Spannung ist proportional zur Änderung des Flusses Z. Setzt man die Definition von Z ein, so erhält man Vind dZ d = −µ0 = −µ0 dt dt ZZ S ~ · ~n dO = −µ0 H ZZ S ~ t · ~n dO . H ~ in Verbindung und wenden auf Wir bringen nun die Spannung Vind mit dem elektrischen Feld E das entsprechende (Arbeits-)Integral den Satz von Stokes an: Vind = Z C ~ · d~r = E ZZ S ~ · ~n dO . rot E Da diese Beziehung für sämtliche mögliche Flächen S gelten muss, können wir wie früher vom Verschwinden des Integrals auf das Verschwinden des Integranden schliessen. Es gilt somit 66 U. Stammbach: Analysis, Teil B ~n S Fig. 1 : Zum Gesetz von Faraday C ~ H ~ t = ~0 . ~ + µ0 H rot E Dies ist eine weitere der berühmten vier Maxwell’schen Gleichungen, welche die Grundlage der Elektrodynamik bilden. Kapitel VI. Vektoranalysis 10 67 Potentialfelder Konservative Vektorfelder treten in Anwendungen häufig auf; sie werden, wie in diesem Abschnitt gezeigt wird, durch Potentialfelder (Gradientenfelder) beschrieben. Ein Vektorfeld v : (x, y, z) → v (x, y, z) heisst konservativ, wenn für alle P, Q ∈ D(v ) gilt, dass die Arbeit von v längs allen Wegen von P nach Q gleich gross ist. In einem konservativen Vektorfeld hängt also die Arbeit nicht vom Weg, sondern nur von dessen Anfangs- und Endpunkt ab. Insbesondere ist die Arbeit, welche ein konservatives Vektorfeld längs eines geschlossenen Weges leistet, immer Null. Diese Eigenschaft charakterisiert konservative Vektorfelder sogar, wie der folgende Satz besagt. Satz 1 Ein Vektorfeld v ist genau dann konservativ, wenn für alle geschlossenen Wege W die Arbeit von v längs W verschwindet. Q −W2 Fig. 1 : Geschlossene Wege und konservative Vektorfelder W1 W2 P Beweis Es ist zu zeigen, dass für beliebige zwei Punkte P und Q und zwei beliebige Wege W1 68 U. Stammbach: Analysis, Teil B und W2 von P nach Q gilt (siehe Figur 1): Z W1 ~v · d~r = Z W2 ~v · d~r . Nun ist aber der Weg W1 + (−W2 ) ein geschlossener von P ausgehender und nach P zurückkehrender Weg. Deshalb gilt Z 0= W1 +(−W2 ) ~v · d~r = Z W1 ~v · d~r + Z −(W2 ) ~v · d~r = Z W1 ~v · d~r − Z W2 ~v · d~r , woraus sich die Behauptung unmittelbar ergibt. Zusammenhang mit grad Wir betrachten hier ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z), welches sich als Gradientenfeld schreiben lässt, d.h. es gibt eine Funktion f : (x, y, z) → f (x, y, z) mit ~v = grad f . Die Funktion f heisst in diesem Zusammenhang oft Potential und das Vektorfeld ~v ein Potentialfeld. Wir behaupten als erstes, dass ein solches Feld automatisch konservativ ist. Um dies einzusehen, betrachten wir einen von P nach Q führenden Weg W . Dieser werde durch die ~ = (xP , yP , zP ) und ~r(tQ ) = OQ ~ = (xQ , yQ , zQ ) Parameterdarstellung t → ~r(t) mit ~r(tP ) = OP beschrieben. Die Arbeit von ~v längs W ist dann gegeben durch Z W ~v · d~r = = = = Z grad f · d~r W Z tQ tP Z tQ tP Z tQ tP (fx , fy , fz ) · ~r˙ (t) dt (fx ẋ(t) + fy ẏ(t) + fz ż(t)) dt d f (x(t), y(t), z(t)) dt dt t = [f (x(t), y(t), z(t))] tQ P = f (xQ , yQ , zQ ) − f (xP , yP , zP ) . Also ist die Arbeit nur von Anfangs- und Endpunkt des Weges (und nicht vom Verlauf des Weges selbst) abhängig. Folglich ist das Vektorfeld ~v konservativ. Von dieser Tatsache gilt nun auch die Umkehrung, so dass wir den folgenden Satz aussprechen können. 69 Kapitel VI. Vektoranalysis Satz 2 Genau dann ist das Vektorfeld ~v konservativ, wenn es ein Potentialfeld ist, d.h. wenn es eine Skalarfunktion f gibt mit ~v = grad f . Beweis Wir haben bereits gesehen, dass ein Potentialfeld konservativ ist. Wir müssen also nur noch die Umkehrung zeigen. Es sei also ~v ein konservatives Vektorfeld. Wir suchen eine Funktion f mit ~v = grad f . Dazu wählen wir als erstes einen festen Punkt P0 in D(~v ). Um den Funktionswert f (x, y, z) zu definieren, wählen wir einen von P0 nach Q = (x, y, z) führenden Weg W und setzen f (x, y, z) = Z W ~v · d~r . Da ~v konservativ ist, hängt der Wert des Integrals nur von Q ab und nicht von der Wahl des Weges W . Um ~v = grad f zu zeigen, betrachten wir einen von Q = (x, y, z) nach Q0 = (x+h, y, z) führenden Weg L (siehe Figur 2) und beschreiben ihn durch die Parameterdarstellung t → (t, y, z) , x ≤ t ≤ x + h . Q0 = (x + h, y, z) (z) Q = (x, y, z) (y) (x) L Fig. 2 : Der Weg L 70 U. Stammbach: Analysis, Teil B Dann gilt f (x + h, y, z) − f (x, y, z) h Z 1 = lim ~v · d~r h→0 h L Z 1 x+h = lim v1 (t, y, z) dt . h→0 h x fx (x, y, z) = lim h→0 Nach dem Mittelwertsatz der Integralrechnung gibt es nun ein t∗ zwischen x und x + h mit Z x+h x v1 (t, y, z) dt = h · v1 (t∗ , y, z) . Daraus ergibt sich fx (x, y, z) = lim v1 (t∗ , y, z) = v1 (x, y, z) . h→0 Analog zeigt man fy = v2 und fz = v3 . Damit ist der Satz 2 bewiesen. Wir entnehmen unseren Überlegungen die folgende wichtige Tatsache, die die Berechnung der Arbeit eines Potentialfeldes sehr einfach macht: Ist ~v ein Gradientenfeld, ~v = grad f , so ist die Arbeit des Vektorfeldes ~v längs eines von P nach Q führenden Weges gerade gleich der Potentialdifferenz f (xQ , yQ , zQ ) − f (xP , yP , zP ). Wir merken zu diesem Thema noch Folgendes an: Das Potential f eines Potentialfeldes ~v ist bis auf eine additive Konstante eindeutig bestimmt. Einerseits ist mit f auch g = f + C ein Potential von ~v , denn grad f = grad g. Andererseits folgt aus grad f = grad h, dass die partiellen Ableitungen der Differenz f − h alle verschwinden, d.h. dass f − h eine Konstante ist. Schliesslich fügen wir an, dass die Niveauflächen der Potentialfunktion f in Anwendungen häufig Potentialflächen genannt werden; laut Definition sind dies Flächen, zu denen das Vektorfeld grad f senkrecht verläuft. Zusammenhang mit rot Es sei ~v ein Potentialfeld mit Potential f , ~v = grad f . Dann gilt nach den Resultaten in Abschnitt 2 rot ~v = rot grad f = (0, 0, 0). Es gilt also der Satz Satz 3 Ist ~v ein Potentialfeld, so ist ~v wirbelfrei, d.h. es gilt rot ~v = (0, 0, 0). Dieser Satz besagt auch: Ist rot ~v 6= (0, 0, 0), so ist ~v kein Potentialfeld. 71 Kapitel VI. Vektoranalysis Wir stellen uns auch hier die Frage, ob die Umkehrung von Satz 3 gilt. Dafür haben wir bereits etwas Vorarbeit geleistet: Vom Vektorfeld ~v des stromdurchflossenen Leiters haben wir einerseits gezeigt, dass es wirbelfrei ist (Abschnitt 2). Andererseits haben wir in Abschnitt 7 die Arbeit von ~v längs eines speziellen geschlossenen Weges berechnet und einen von Null verschiedenen Wert erhalten. Die Aussage unseres Satzes lässt sich also nicht ohne weiteres umkehren; es muss eine Zusatzvoraussetzung hinzutreten. Satz 4 Es sei ~v ein Vektorfeld mit rot ~v ≡ (0, 0, 0), dessen Definitionsbereich D(~v ) einfach zusammenhängend ist. Dann ist ~v ein Potentialfeld. Wir wollen zuerst die hier neu hinzukommende Voraussetzung erklären. Ein Bereich D, unabhängig davon, was seine Dimension ist, heisst einfach zusammenhängend, wenn sich jeder geschlossene Weg W in D stetig auf einen Punkt zusammenziehen lässt. Man sieht sehr rasch an Beispielen, was dieser Begriff intuitiv beschreibt. Beispiele Die ganze Ebene ist einfach zusammenhängend. Die Ebene, aus der man einen Punkt P entfernt hat, ist nicht einfach zusammenhängend, denn eine geschlossene Kurve, die um P herumführt, lässt sich nicht auf einen Punkt zusammenziehen. Der ganze Raum ist einfach zusammenhängend. Der ganze Raum, aus dem man einen Punkt entfernt hat, ist einfach zusammenhängend. Beim Zusammenziehen einer geschlossenen Kurve lässt sich dieser eine Punkt immer vermeiden. Der ganze Raum, aus dem man eine Gerade entfernt hat, ist nicht einfach zusammenhängend, denn eine geschlossene Kurve, die um diese Gerade herumführt, lässt sich nicht auf einen Punkt zusammenziehen. Dieses letzte Beispiel zeigt, dass der Definitionsbereich des Vektorfeldes des stromdurchflossenen Leiters nicht einfach zusammenhängend ist: in den Punkten des Leiters ist dieses Vektorfeld nämlich nicht definiert. Beweis Wir zeigen, dass für jeden geschlossenen Weg W in D(~v ), die Arbeit von ~v längs W verschwindet. Da D(~v ) einfach zusammenhängend ist, lässt sich unser Weg W auf einen Punkt zusammenziehen. Dabei überstreicht der Weg ein Flächenstück S, auf das wir jetzt den Satz von Stokes anwenden. Es ergibt sich Z W ~v d~r = ZZ S rot ~v · ~n dO = 0 . Da dies für alle geschlossenen Wege gilt, folgt, dass ~v konservativ und deshalb ein Potentialfeld ist. Beispiel Ist ~v ein Coulombfeld, ~v = −C ~r , r3 72 U. Stammbach: Analysis, Teil B so ist rot ~v = (0, 0, 0) und der Definitionsbereich D(~v ) einfach zusammenhängend. Nach Satz 4 ist v = grad f , wobei f das durch f (x, y, z) = p also ~v ein Potentialfeld. In der Tat ist ~ 2 2 2 C/ x + y + z gegebene Potential ist. Wir wollen zum Schluss dieses Abschnittes noch auf eine Beziehung zu den sogenannten Integrabilitätsbedingungen (Kapitel IV, Abschnitt 7) hinweisen. Diese Integrabilitätsbedingungen sind bei der Frage aufgetaucht, wann es zu gegebenen Funktionen ϕ : (x, y, z) → ϕ(x, y, z) , ψ : (x, y, z) → ψ(x, y, z) , χ : (x, y, z) → χ(x, y, z) eine Funktion f : (x, y, z) → f (x, y, z) gibt mit fx ≡ ϕ , fy ≡ ψ , fz ≡ χ . Diese Frage lässt sich offenbar auch so formulieren: Es sei das Vektorfeld ~v = (ϕ, ψ, χ) gegeben. Wann gibt es eine (Potential-)Funktion f mit grad f = ~v = (ϕ, ψ, χ)? Auf diese Formulierung können wir jetzt unseren Satz 3 anwenden: Ist der (gemeinsame) Definitionsbereich D von ϕ, ψ, χ einfach zusammenhängend und ist ~v wirbelfrei, so exisiert die Funktion f . Nun gilt rot ~v = (χy − ψz , ϕz − χx , ψx − ϕy ) . Soll also ~v wirbelfrei sein, so ergeben sich die Bedingungen χy ≡ ψz , ϕz ≡ χx , ψx ≡ ϕy . Dies sind gerade die damals besprochenen Integrabilitätsbedingungen. Teil C Kapitel VII. Gewöhnliche Differentialgleichungen Kapitel VIII. Potenzreihen Anhang. Komplexe Zahlen Die Zeiten sind vorbei, wo die relative Stabilität der Lebensform, die Langsamkeit der Verwandlung es möglich machten, mit dem so viel gerühmten gutgefüllten “Schulsack” die Zeit der Ausbildung hinter sich zu lassen. Die Zeit ist vorüber, wo in den vielen Berufen das einmal Erlernte ein Leben lang genügte und wo sich leicht das wenige Neue im Laufe der Jahre eingliederte. Adolf Portmann Inhaltsverzeichnis, Teil C Kapitel VII. Gewöhnliche Differentialgleichungen 1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . . 17 4 Separierbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6 Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . . 48 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . . 57 8 Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . . 64 9 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . 72 10 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . . 83 11 Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 12 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107 14 Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Kapitel VIII. Potenzreihen 1 Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . 3 2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Anhang. Komplexe Zahlen 1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Sachverzeichnis Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel VII. Gewöhnliche Differentialgleichungen Something big is coming up! James Bond 007 (zitiert in H. Heuser: Gewöhnliche Differentialgleichungen, Teubner Verlag) Inhaltsverzeichnis 1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 (a) Ungestörtes Wachstum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 (b) Abklingvorgänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 (c) Einschalten eines elektrischen Stromes . . . . . . . . . . . . . . . . . . . . 11 (d) Freier Fall mit Reibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . . 17 4 Separierbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6 Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . . 48 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . . 57 8 Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . . 64 9 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . 72 (a) Homogene lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . 72 (b) Inhomogene lineare Differentialgleichungen . . . . . . . . . . . . . . . . . 76 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . . 83 (a) Homogene lineare Differentialgleichungen mit konstanten Koeffizienten . . 83 (b) Homogene Eulersche Differentialgleichungen . . . . . . . . . . . . . . . . . 86 11 Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 12 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107 14 Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 10 3 Kapitel VII. Differentialgleichungen 1 Einleitung Der Zustand eines physikalischen (chemischen etc.) Systems wird durch eine Anzahl von Zustandsgrössen beschrieben (Druck, Lage, Geschwindigkeit, Stromstärke etc.), seine zeitliche Entwicklung durch entsprechende Funktionen der Zeit. Zwischen diesen Zustandsgrössen gibt es i.a. Beziehungen. Zum Beispiel sind Druck, Volumen und Temperatur einer festen Menge Gases durch die Zustandsgleichung des Gases miteinander verbunden. Die wissenschaftliche Erfahrung zeigt nun, dass es oft leichter ist, die zeitliche Änderung einer Zustandsgrösse, das heisst also deren Ableitung nach der Zeit durch die übrigen Grössen und deren zeitlichen Ableitungen zu beschreiben, als diese Zustandsgrössen selbst. Ein konkretes Beispiel zu diesem Sachverhalt liefert das Newton’sche Gesetz (siehe Figur 1). Zwar sind für einen Massenpunkt der Ort x(t), und die Geschwindigkeit v(t) zur Zeit t nicht auf einfache Weise mit den relevanten weiteren Zustandsgrössen ‘Kraft’, ‘Masse’ verbunden. Wohl aber ist bekanntlich die Beschleunigung, Fig. 1 : Zum Newton’schen Gesetz K 0 m (x) d.h. die zeitliche Ableitung v̇(t) der Geschwindigkeit, bzw. die zweite zeitliche Ableitung ẍ(t) des Ortes eine einfache Funktion der auf den Massenpunkt wirkenden Kraft. Dieser Sachverhalt wird nach Newton durch die Differentialgleichung 4 (1.1) U. Stammbach: Analysis, Teil C mẍ = K oder durch das Differentialgleichungssystem (1.2) ẋ = v mv̇ = K beschrieben. Mathematisch ist an dieser Stelle wichtig, dass die Differentialgleichung (2.1) bzw. das Differentialgleichungssystem (2.2) die Funktion t → x(t) im wesentlichen beschreibt. In der Tat haben wir bereits in der Analysis I oft darauf hingewiesen, dass Funktionen durch Differentialgleichungen beschrieben werden können. Im Kapitel II, Abschnitt 5 haben wir zum Beispiel die einfache Differentialgleichung (1.3) y 0 = ay, a ∈ R untersucht und gefragt, welche Funktionen y : x → y(x) Lösungen dieser Differentialgleichung sind. Wir haben damals gesehen, dass notwendigerweise (1.4) y(x) = C · eax gelten muss, wobei C eine beliebige Konstante ist. Die Differentialgleichung (2.3) beschreibt also nicht nur eine Funktion sondern eine ganze Klasse oder – wie man sagt – eine ganze Schar von Funktionen, die durch die Formel (2.4) mit C als Scharparameter gegeben wird. Diese Schar heisst die allgemeine Lösung der Differentialgleichung. Auf ähnliche Art liefert die Differentialgleichung (2.1) nicht nur eine mögliche Lösung für die Funktion t → x(t), sondern sie beschreibt sämtliche Bewegungen des Massenpunktes, die unter den betrachteten physikalischen Bedingungen überhaupt möglich sind. Offensichtlich unterscheiden sich die verschiedenen Lösungen dadurch, dass sie zu verschiedenen Anfangsbedingungen x(0), ẋ(0) gehören. Auch die Differentialgleichung (2.1) beschreibt somit eine ganze Schar von Funktionen, wobei hier offenbar zwei Scharparameter auftreten. 5 Kapitel VII. Differentialgleichungen Das Thema des vorliegenden Kapitels ist es, den Zusammenhang zwischen einer Differentialgleichung und ihrer allgemeinen Lösung näher zu untersuchen. In konkreten Anwendungsbeispielen interessiert bei Differentialgleichungen zumeist eine spezielle Lösung, nämlich diejenige, die zusätzlich gegebene (Anfangs-)Bedingungen erfüllt. Im Falle der Differentialgleichung (2.3) kann diese zusätzliche Bedingung darin bestehen, dass der Funktionswert y(0) festgelegt ist: (1.5) y(0) = A . Damit ist die Lösungsfunktion der Differentialgleichung (2.3) eindeutig bestimmt; es gilt (1.6) y(x) = A · eax . Wie wir oben gesehen haben, wird im Falle der Differentialgleichung (2.1) die zusätzliche Bedingung am natürlichsten in der Angabe von Ort und Geschwindigkeit des Massenpunktes zur Zeit 0 bestehen: (1.7) x(0) = x0 ; ẋ(0) = v(0) = v0 . Die physikalische Anschauung zeigt, dass durch die Vorgabe der Grössen x0 und v0 die Funktion t → x(t) eindeutig bestimmt sein muss. Wir merken hier bereits an, dass die Grössen A in (2.5) und die Grössen x0 , v0 in (2.7) offenbar beliebige reelle Zahlen sein dürfen. Dies illustriert einen ganz allgemeinen mathematischen Satz über die Lösungen von Differentialgleichungen (siehe Abschnitt 3). Als nächstes wollen wir hier die Terminologie genau festlegen. Unter einer gewöhnlichen Differentialgleichung für die Funktion y : x → y(x) verstehen wir einen Ausdruck der Form (1.8) F (x, y, y 0 , y 00 , . . . , y (n) ) = 0 . 6 U. Stammbach: Analysis, Teil C Die Funktion y : x → y(x) heisst Lösung der Differentialgleichung (2.8), wenn für alle x ∈ D(y) gilt F x, y(x), y 0 (x), . . . , y (n) (x) ≡ 0, d.h. wenn beim Einsetzen die Gleichung identisch in x erfüllt ist. Die Ordnung der höchsten in (2.8) vorkommenden Ableitung heisst Ordnung der Differentialgleichung. Beispiel (1.9) Ist ω eine fest vorgegebene reelle Zahl, so ist y 00 + ω 2 y = 0 eine Differentialgleichung zweiter Ordnung. Die Funktion x → A cos(ωx) + B sin(ωx) ist für jede Wahl der reellen Grössen A, B eine Lösung der Differentialgleichung (2.9). Wir merken abschliessend noch an, dass wir hier nur sogenannte gewöhnliche Differentialgleichungen betrachten. Diese unglückliche, aber üblich gewordene Ausdrucksweise besagt, dass nur von Funktionen einer einzigen Variablen die Rede ist. Es sind daneben natürlich auch Differentialgleichungen für Funktionen von mehreren Variablen denkbar, welche partielle Ableitungen enthalten. Solche Differentialgleichungen heissen partiell. Ein Beispiel dafür ist die früher schon betrachtete Wellengleichung. Dabei werden Funktionen u : (x, t) → u(x, t) gesucht, welche die (partielle) Differentialgleichung utt = c2 uxx erfüllen (siehe Kapitel IV, Abschnitt 8). Mit solchen partiellen Differentialgleichungen, deren mathematische Behandlung sehr viel schwieriger ist als die der gewöhnlichen Differentialgleichungen, beschäftigt sich die Lehrveranstaltung Analysis III. 7 Kapitel VII. Differentialgleichungen 2 Einige Beispiele Wir wollen in diesem Abschnitt in einigen konkreten Situationen die dazugehörigen Differentialgleichungen herleiten und versuchen, bereits an dieser Stelle etwas über deren Lösung auszusagen. (a) Ungestörtes Wachstum Man stelle sich eine Bakterienkultur oder ganz allgemein eine Population vor, welche im gleichen Zeitraum stets um den gleichen Prozentsatz wächst; man nennt dies ungestörtes, ideales Wachstum. Im Zeitintervall 4t nimmt die Masse m(t) (als Mass der Grösse der Population) um 4m = p(4t) · m zu. Daraus folgt 4m p(4t) = m 4t 4t und durch Grenzübergang für 4t → 0 erhält man (2.1) dm = a·m , dt wobei wir a = p(4t) 4 t→0 4t lim 8 U. Stammbach: Analysis, Teil C gesetzt haben. Da die Population mit der Zeit zunimmt, ist a eine positive Zahl. Wie bereits in der Einleitung erwähnt, wissen wir aus der Analysis I, dass jede Funktion m : t → m(t), welche die Differentialgleichung (3.1) erfüllt, von der Form m(t) = C · eat (2.2) ist. In diesem Beispiel ist die natürliche Anfangsbedingung die, dass die Anfangsmasse m0 , m(0) = m0 , gegeben ist. Die gesuchte Funktion ist somit (siehe Figur 1) m(t) = m0 eat . (2.3) (y) Fig. 1 : Ungestörtes Wachstum m0 eax x → y(x) = m0 eax m0 (x) 9 Kapitel VII. Differentialgleichungen Andere Beispiele, die durch dieses Modell, d.h. durch die Differentialgleichung (3.1) mit a > 0 beschrieben werden, sind: Wirtschaftswachstum, Zunahme des Energieverbrauches, Geldanlage, jeweils mit konstantem Prozent- bzw. Zins-Satz. (b) Abklingvorgänge In diesem Beispiel sei y(t) eine Grösse, welche im gleichen Zeitraum stets um denselben Prozentsatz abnimmt. Man erhält dann mit der analogen Überlegung wie unter (a) offenbar (2.4) dy = −ky dt mit k > 0. Der Proportionalitätsfaktor −k ist negativ. Wie oben gilt (2.5) y(t) = C · e−kt . Lautet die Anfangsbedingung y(t0 ) = y0 , (zur Zeit t0 sei die Grösse y gerade y0 ), so erhält man als Lösung (siehe Figur 2) (2.6) y(t) = y0 · e−k(t−t0 ) . Dieses Modell beschreibt zum Beispiel die Abkühlung eines Gegenstandes in einem Wärmereservoir von konstanter Temperatur. Die Grösse y(t) ist in diesem Fall die Temperaturdifferenz zwischen Gegenstand und Wärmereservoir. Ebenso tritt die Differentialgleichung (3.4) beim radioaktiven Zerfall auf. In diesem Fall ist die Grösse y(t) die zur Zeit t vorhandene aktive Masse. In diesem letzten Beispiel, aber häufig auch in den anderen spricht man von der Halbwertszeit; dies ist die Zeit τ , in der die Grösse y auf die Hälfte abnimmt (siehe Figur 3). Es gilt also 10 U. Stammbach: Analysis, Teil C (y) Fig. 2 : Abklingvorgang t → y(t) = y0 e−k(t−t0 ) (t0 , y0 ) t0 (t) (y) y0 Fig. 3 : Halbwertszeit 1 2 y0 τ 11 Kapitel VII. Differentialgleichungen y(τ ) = (2.7) 1 y(0) . 2 Da laut Voraussetzung die Grösse y(t) im selben Zeitraum immer um denselben Prozentsatz abnimmt, muss τ von der Lage des (Zeit-)Nullpunktes unabhängig sein. Einsetzen von (3.7) liefert 1 y0 = y0 e−kτ , 2 woraus man erhält τ = (c) log 2 . k Einschalten eines elektrischen Stromes Es sei ein Schaltkreis mit einem Ohm’schen Widerstand R und einer Selbstinduktion L gegeben. Gesucht ist die Stromstärke I(t) zur Zeit t, wenn zur Zeit t = 0 an den Schaltkreis eine konstante Spannung U angelegt wird (siehe Figur 4). Die Physik sagt, dass die Funktionen I : t → I(t) der Differentialgleichung (2.8) L dI = −R I + U dt genügt. Setzen wir f (t) = I(t) − U/R, so folgt aus (3.8) (2.9) df R = − f . dt L Wir sehen, dass f einer Differentialgleichung genügt, die der Differentialgleichung (3.4) entspricht. Danach erhalten wir (2.10) I(t) − U/R = f (t) = C · e−(R/L) t . 12 U. Stammbach: Analysis, Teil C R Fig. 4 : Einschaltvorgang in einem elektrischen Schaltkreis L U (t) Fig. 5 : Einschaltvorgang; verschiedene Anfangsbedingungen I(t) U/R t→ (t) R U + Ce− L t R 13 Kapitel VII. Differentialgleichungen U/R Fig. 6 : Einschaltvorgang; verschiedene Werte des Parameters L t→ I(t) R U 1 − e− L t R (t) Setzt man die Anfangsbedingung I(0) = 0 ein, so erhält man (siehe Figuren 5,6) (2.11) R U I(t) = 1 − e− L t R . Es ist klar, dass beim Ausschalten ein entsprechender Vorgang abläuft. (d) Freier Fall mit Reibung Ein Massenpunkt der Masse m falle unter dem Einfluss der Schwerkraft; sein Fall werde gebremst durch eine zur Geschwindigkeit proportionalen Kraft (siehe Figur 7). Zur Zeit t = 0 sei x(0) = 0, ẋ(0) = 0 . Nach Newton gilt für die Ortsfunktion t → x(t) des Massenpunktes die Differentialgleichung 14 U. Stammbach: Analysis, Teil C 0 Fig. 7 : Freier Fall mit Reibung −aẋ m mg (x) (2.12) m ẍ = m g − a ẋ . Dies ist, im Unterschied zu den oben behandelten Beispielen, eine Differentialgleichung zweiter Ordnung. Setzen wir ẋ(t) = v(t) , so erhalten wir (2.13) m v̇ = m g − a v . Diese Differentialgleichung erster Ordnung für t → v(t) entspricht offenbar genau der Differentialgleichung (3.8), wenn v(t) durch I(t), g durch U/L und a/m durch R/L ersetzt wird. Wir können deshalb die Lösung von (3.13) dem vorhergehenden Problem entnehmen; (3.10) liefert v(t) = a mg + C · e− m t . a Die Anfangsbedingung v(0) = 0 bestimmt C; wir erhalten (siehe Figur 8) 15 Kapitel VII. Differentialgleichungen (v) mg a v(t) Fig. 8 : Freier Fall mit Reibung; die Geschwindigkeitfunktion (t) (x) Fig. 9 : Freier Fall mit Reibung; die Ortsfunktion mit Asymptote x(t) mg m x(t) = t− a a (t) 16 (2.14) U. Stammbach: Analysis, Teil C a mg 1 − e− m t . a v(t) = Die Ortsfunktion x(t) berechnet man aus ẋ(t) = v(t) durch einfache Integration. Es ergibt sich (2.15) x(t) = mg m2 g − a t e m + D. t + a a2 Die Anfangsbedingung x(0) = 0 liefert schliesslich (siehe Figur 9) D = − m2 g . a2 Die oben beschriebenen Beispiele zeigen, dass die Mathematik mit den Differentialgleichungen ein sehr effizientes Werkzeug bereitstellt, um Modellvorstellungen mathematisch zu beschreiben. Es ist dabei interessant festzustellen, dass ein- und dasselbe Modell, d.h. also ein- und dieselbe Differentialgleichung in ganz verschiedenen Fachgebieten auf natürliche Weise auftaucht. Weiss man über die Lösungsfunktionen der entsprechenden Differentialgleichung Bescheid, so kann die Modellvorstellung im Experiment geprüft werden, und es kann entschieden werden, ob sie “richtig” oder “falsch” ist. Im Zusammenhang mit diesen Wörtern ist es vielleicht angebracht anzumerken, dass mit “richtig” und “falsch” hier keine absolute Wertung vorgenommen wird. Vielmehr stellt das Experiment ja nur fest, in welchen Grenzen eine Modellvorstellung zu brauchbaren, d.h. für den verfolgten Zweck genügend genauen Resultaten führt. 17 Kapitel VII. Differentialgleichungen 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung Im letzten Abschnitt haben wir gesehen, dass in Anwendungen oft Funktionen der Zeit gesucht sind, welche durch Differentialgleichungen beschrieben werden. In der Mathematik ist es üblich geworden, nicht t, sondern x als Name für die Variable zu benutzen und die gesuchte Funktion durch y : x → y(x) zu beschreiben. Wir wollen uns hier in der allgemeinen Theorie an diese historisch bedingte Konvention halten. Wir gehen aus von einer Differentialgleichung erster Ordnung für y : x → y(x) , von welcher wir annehmen, dass sie in der Form y 0 = f (x, y) (3.1) (y) (x) Fig. 1 : Richtungsfeld der Differentialgleichung y 0 = x2 + y 2 vorliegt. Anschaulich besteht eine solche Differentialgleichung darin, dass in jedem Punkt des Definitionsbereiches D(f ) die Steigung der durch diesen Punkt gehenden Lösungskurve festgelegt wird. (Unter einer Lösungskurve verstehen wir natürlich den Graphen einer Lösungsfunktion). 18 U. Stammbach: Analysis, Teil C Trägt man diese Richtungen in ein (x, y)-Koordinatensystem ein, so erhält man das Richtungsfeld der Differentialgleichung. Beispiel Es sei y 0 = x2 + y 2 (siehe Figur 1). Es wird mit diesem Beispiel klar, dass der Verlauf der Lösungskurven einer Differentialgleichung in grober Näherung aus dem Richtungsfeld abgelesen werden kann. Dies ist im Grunde genommen die Basis von vielen numerischen Verfahren zur Lösung von Differentialgleichungen. Plausibel wird damit auch der allgemeine mathematische Satz, welcher über die Existenz und Eindeutigkeit der Lösung einer Differentialgleichung der Form (4.1) Auskunft gibt. (y) (x0 , y0 ) Fig. 2 : Existenz und Eindeutigkeit der Lösung einer Differentialgleichung erster Ordnung y(x) D(f ) x0 (x) Satz 3.1 Es sei f : (x, y) → f (x, y) in D(f ) stetig und nach y stetig partiell differenzierbar. Dann gibt es durch jeden Punkt (x0 , y0 ) im Innern von D(f ) genau eine Lösungskurve für die Differentialgleichung y 0 = f (x, y) . D.h. es gibt eine eindeutig bestimmte, in einem Intervall mit Mittelpunkt x0 definierte Funktion x → y(x), welche Lösung der Differentialgleichung y 0 = f (x, y) ist und die Anfangsbedingung y(x0 ) = y0 erfüllt. Natürlich verzichten wir in dieser Vorlesung auf den Beweis dieses allgemeinen Satzes. Wir weisen aber darauf hin, dass seine Aussage für alles Folgende grundlegend ist. 19 Kapitel VII. Differentialgleichungen Beispiel Im Falle der einfachen Differentialgleichung y0 = a y (3.2) ergibt sich die Aussage des Satzes aus der Tatsache (die in der Analysis I bewiesen worden ist), dass jede Lösung der Differentialgleichung (4.2) von der Form (y) Fig. 3 : Richtungsfeld und Lösungskurven der Differentialgleichung y 0 = ay (x) x → y(x) = C · eax ist. Die Anfangsbedingung y(x0 ) = y0 bestimmt dann eindeutig die Konstante C, so dass y(x) = y0 · e−ax0 · eax die durch den Punkt (x0 , y0 ) verlaufende Lösungskurve beschreibt (siehe Figur 3). Natürlich kennt der Mathematiker Verschärfungen des Satzes 3.1; inbesondere kann er über die Grösse des Definitionsintervalles der gesuchten Funktion weitere Aussagen machen. Dies soll 20 U. Stammbach: Analysis, Teil C uns hier nicht weiter interessieren. Hinweisen möchten wir aber speziell auf den Teil des Satzes, welcher von der Eindeutigkeit der Lösung handelt. Das untenstehende Beispiel zeigt, dass erst die etwas aus dem Rahmen fallende Voraussetzung über die partielle Ableitung von f nach y die Eindeutigkeit der Lösung erzwingt. Nun hat aber gerade diese Eindeutigkeit viele wichtige Konsequenzen, welche der Anfänger gerne übersieht. Zum Beispiel ist es ja erst aufgrund dieser Tatsache überhaupt möglich, die Lösungskurven durch den vorgegebenen Punkt (x0 , y0 ) etwa mit Hilfe numerischer Verfahren zu berechnen; wäre die Lösungskurve nicht eindeutig bestimmt, so müssten numerische Lösungsverfahren naturgemäss versagen (oder wesentlich komplizierter konzipiert sein). Auch für den Praktiker ist also die volle Schärfe des Satzes 3.1 von Interesse. Beispiel Es sei die Differentialgleichung y0 = (3.3) q 3 y2 (y) Fig. 4 : Nichteindeutigkeit der Lösungen der Differentialgleichung (x) gegeben. Die Funktion f (x, y) = nach y, p 3 y0 = q 3 y2 y 2 ist in der ganzen Ebene definiert. Die partielle Ableitung fy (x, y) = 2 −1/3 y 3 21 Kapitel VII. Differentialgleichungen existiert aber für Punkte der x-Achse nicht. Damit ist die Voraussetzung des Satzes in diesen Punkten verletzt und in der Tat gilt die Aussage des Satzes für Anfangsbedingungen der Form y(x0 ) = 0 nicht. Um dies einzusehen, stellt man fest, dass offenbar jede Funktion der Form (3.4) x → y(x) = x−C 3 3 , C∈R die Differentialgleichung erfüllt. Ferner erfüllt auch die Nullfunktion y ≡ 0 die Differentialgleichung. Durch jeden Punkt der x-Achse gibt es somit unendlich viele Lösungskurven. (Weshalb “unendlich viele” und nicht nur “zwei”?) Natürlich gilt die Aussage des Satzes, wenn man die Differentialgleichung (4.3) in einem Gebiet betrachtet, welches die x-Achse ausschliesst (siehe Figur 4). Als Anwendung unseres Satzes betrachten wir zuerst die folgende allgemeine Situation. Es sei ~v : (x, y) → ~v (x, y) ein ebenes Vektorfeld. Es sei P = (x0 , y0 ) ein Punkt des Definitionsbereiches D(~v ) von ~v . Wir stellen die durch P gehenden Feldlinien des Vektorfeldes ~v als Graph einer Funktion y : x → y(x) dar. Es gilt also y(x0 ) = y0 , und der Zeichnung (siehe Figur 5) entnehmen wir, dass in jedem Punkte der Feldlinien gilt y 0 (x) = v2 (x, y(x)) . v1 (x, y(x)) Dies besagt, dass die Funktion y : x → y(x) Lösung der Differentialgleichung (3.5) y0 = v2 (x, y) v1 (x, y) ist. Unser allgemeiner Satz liefert die Aussage, dass durch jeden Punkt (x0 , y0 ) genau eine Feldlinie des Vektorfeldes ~v verläuft, falls die auf der rechten Seite der Gleichung (4.5) stehende Funktion von x und y stetig ist und nach y stetig partiell differenzierbar ist. Insbesondere muss natürlich gelten v1 (x, y) 6= 0 . Beispiel Das Vektorfeld ~v sei gegeben durch ~v (x, y) = (y, x) . Die Differentialgleichung der Feldlinien lautet somit 22 U. Stammbach: Analysis, Teil C (y) v2 Fig. 5 : Feldlinien eines Vektorfeldes v1 (x) y0 = x . y Schreiben wir diese Gleichung für x → y(x) in der Form y(x) y 0 (x) = x , so erhalten wir durch Integration nach x 1 2 1 y = x2 + C , 2 2 wobei C eine Integrationskonstante ist. Es gilt also die Beziehung y 2 − x2 = 2 C . 23 Kapitel VII. Differentialgleichungen Die Feldlinie durch den Punkt (x0 , y0 ) erfüllt zusätzlich die Bedingung y02 − x20 = 2C , so dass wir dafür die Gleichung y 2 − x2 = y02 − x20 erhalten. Für jeden Punkt (x0 , y0 ) mit Ausnahme der Punkte der x-Achse sind die Voraussetzungen unseres Satzes erfüllt, und unser Satz liefert genau eine Feldlinie, welche durch (x0 , y0 ) geht. Die Menge aller Lösungen einer Differentialgleichung (3.6) y 0 = f (x, y) heisst deren allgemeine Lösung. Wiederum ist Terminologie historisch bedingt, sie ist aus heutiger Sicht ziemlich unglücklich. – Nach unserem Satz 3.1 gibt es unter den dort angegebenen Voraussetzungen zu jeder Anfangsbedingung y(x0 ) = y0 eine eindeutig bestimmte Lösung. Geometrisch bedeutet dies, dass es zu jedem Punkt (x0 , y0 ) eine eindeutig bestimmte Lösung der Differentialgleichung (3.6) gibt, deren Graph durch diesen Punkt geht. Der allgemeinen Lösung der Differentialgleichung entspricht folglich eine Schar von Kurven. Halten wir x0 fest, so sind die einzelnen Kurven dieser Schar durch den einzigen Parameter C = y0 festgelegt; durch jeden Punkt geht genau eine Kurve der Schar. Eine einparametrige Kurvenschar mit dieser Eigenschaft heisst auch etwa regulär . Unter den Bedingungen unseres Satzes ist somit die Schar der Lösungskurven der Differentialgleichung y 0 = f (x, y) eine einparametrige reguläre Kurvenschar. Umgekehrt kann man fragen, ob zu einer gegebenen einparametrigen Kurvenschar eine Differentialgleichung 1. Ordnung existiert, die diese Schar als Lösungskurven besitzt. Unter sehr allgemeinen Voraussetzungen, auf die wir hier nicht eingehen, ist dies in der Tat der Fall. Wir illustrieren den Sachverhalt an einem Beispiel. Beispiel Gegeben sei die Schar der Kreise, welche die x-Achse in 0 berühren (siehe Figur 6). Wählen wir den Radius C als Parameter, so stellt sich diese Schar durch die Gleichung (3.7) dar. Daraus erhält man sofort x2 + (y − C)2 = C 2 24 U. Stammbach: Analysis, Teil C (y) Fig. 6 : Die Schar der Kreise, welche die x-Achse im Ursprung berühren (x) (3.8) x2 + y 2 − 2 C y = 0 . In der Umgebung eines Punktes (x0 , y0 ) werde der durch diesen Punkt gehende Kreis als Graph der Funktion y : x → y(x) beschrieben. Dann folgt mit Ableitung nach x (3.9) 2x + 2yy 0 − 2Cy 0 = 0 . Elimination von C aus (4.8) und (4.9) liefert die von C unabhängige, d.h. für alle Kurven der Schar gültige Beziehung (3.10) y0 = 2xy . − y2 x2 Dies ist die Differentialgleichung, welche die Kurvenschar (4.7) als allgemeine Lösung besitzt; man sagt kurz, es ist die Differentialgleichung der Kurvenschar (4.7). Dies kann man entweder durch Auflösen von (4.7) nach y und Einsetzen in (4.10) verifizieren oder durch direktes Lösen der Differentialgleichung (4.10). Für letzteres liefert der nächste Abschnitt die Grundlagen. 25 Kapitel VII. Differentialgleichungen 4 Separierbare Differentialgleichungen Es sollte aus der bisherigen Diskussion über konkrete Beispiele bereits klar geworden sein, dass beim Lösen von Differentialgleichungen nicht fest vorgeschriebene Methoden im Vordergrund stehen. Vielmehr kommt dem geschickten Vorgehen eine grosse Bedeutung zu. Man vergleiche dazu etwa den Lösungsgang im Beispiel (c) Abschnitt 2, wo durch eine Substitution die gegebene Differentialgleichung auf eine einfachere zurückgeführt wird. Ferner muss hier betont werden, dass viele, auch einfach aussehende Differentialgleichungen nicht elementar lösbar sind; dies bedeutet (wie bei den unbestimmten Integralen), dass die Lösungsfunktion, obschon sie natürlich nach unserem Satz 3.1 existiert, nicht durch elementare Funktionen ausdrückbar ist. Als Beispiel erwähnen wir die Differentialgleichung y 0 = x2 + y 2 , deren Richtungsfeld wir in Abschnitt 3 aufgezeichnet haben; sie ist – wie man zeigen kann – nicht elementar lösbar. Man ist in diesen Fällen auf andere Verfahren, zum Beispiel auf Verfahren der numerischen Mathematik angewiesen. – Im vorliegenden Abschnitt wollen wir die Klasse der separierbaren Differentialgleichungen besprechen. Deren Behandlung ist insofern leicht, als sich die Lösungsfunktionen ohne viel Mühe durch gewöhnliche Integrale beschreiben lassen. Ferner betrachten wir Differentialgleichungen, welche durch eine einfache Operation auf separierbare zurückgeführt werden können. Hat die Differentialgleichung die Form y0 = (4.1) g(x) h(y) so heisst sie separierbar. Diese Terminologie orientiert sich an der einfachen Tatsache, dass (5.1) in der Form h(y) · y 0 = g(x) (4.2) geschrieben werden kann, in welcher die “Variablen x, y separiert” sind. Ist y : x → y(x) eine Lösungsfunktion von (5.2) so gilt, identisch in x h (y(x)) · y 0 (x) = g(x) . Integration nach x liefert Z 0 h (y(x)) y (x) dx = Z g(x) dx + C 26 U. Stammbach: Analysis, Teil C und die Substitution y(x) = y, y 0 dx = dy schliesslich Z h(y) dy = Z g(x) dx + C . Löst man die so entstehende (gewöhnliche) Gleichung nach y auf, so erhält man die allgemeine Lösung der Differentialgleichung (5.1) mit C als Parameter. Der Leser mache sich an dieser Stelle klar, dass die Differentialgleichungen (2.1) und (2.4) separierbar sind und führe auf Grund dieser Tatsache die Lösung explizit durch. Als weiteres Beispiel einer separierbaren Differentialgleichung betrachten wir das sogenannte “logistische Modell für Populationen”. Es handelt sich darum, ein mathematisches Modell für die Populationen in einem vorgegebenen Gebiet zu liefern, etwa für die Bevölkerungszahl eines Landes (oder die Rattenpopulation eines Biotops etc.). Wir bezeichnen die Bevölkerungszahl zur Zeit t mit y(t) . Im Zeitabschnitt 4t lässt sich diese Änderung beschreiben durch (4.3) y(t + 4t) − y(t) = (G − T + E − A) 4t , wobei die Grössen G, T, E, A der Reihe nach für die Anzahl Geburten, Todesfälle, Einwanderer, Auswanderer pro Zeiteinheit stehen. Natürlich können diese positiven Grössen im allgemeinen von t und y abhängig sein. Wir wollen im Folgenden der Einfachheit annehmen, dass E = A, so dass sich der Effekt der Einwanderung und der Auswanderung auf die Bevölkerungszahl aufhebt. Für die Grössen G und T wollen wir einfache Modellannahmen treffen. Wenden wir uns zunächst der Grösse T zu. Die einfachste Annahme besteht natürlich darin, dass die Anzahl Todesfälle T pro Zeiteinheit proportional zur Bevölkerungszahl y(t) ist (4.4) T = a y(t) , a>0. Nun wird aber mit zunehmender Bevölkerungszahl etwa die Nahrungsbeschaffung immer schwieriger, der Stress des Individuums wird grösser, etc. , so dass die Annahme (5.4) in einem verfeinerten Modell durch einen entsprechenden Term korrigiert werden muss. Wir setzen (4.5) T = a y(t) + b y 2 (t) , a, b > 0 . Dieser Ansatz erscheint vernünftig, da y 2 (t) ein Mass für die Anzahl der Zusammenstösse von Individuen pro Zeiteinheit ist. Analog macht man für G die Modellannahme (4.6) G = c y(t) − d y 2 (t) , c, d > 0 . 27 Kapitel VII. Differentialgleichungen Die Geburtenzahl pro Zeiteinheit nimmt wegen der oben erwähnten Schwierigkeiten mit wachsendem y(t) unter proportional zu. Mit diesen Modellannahmen (5.5) und (5.6) erhalten wir die folgende Differentialgleichung für t → y(t) y 0 (t) = (c − a) y(t) − (b + d) y 2 (t) . Setzen wir c − a = α , b + d = β , so folgt (siehe Figur 1) y0 = α y − β y2. (4.7) (y) Fig. 1 : Richtungsfeld der logistischen Differentialgleichung y 0 = αy − βy 2 (t) Die Gleichung ist offensichtlich separierbar. Wir erhalten Z dy = (α − βy)y Z dt , 28 U. Stammbach: Analysis, Teil C Z 1 dy + y Z β dy = α α − βy Z dt , log |y| − log |α − βy| = αt + C , α − βy = A · e−αt . y Dabei haben wir A = ±e−C gesetzt. Auflösen nach y liefert nun die allgemeine Lösung der Differentialgleichung (5.7) y(t) = (4.8) α β + A · e−αt (y) α/β Fig. 2 : Lösungen der Differentialgleichung y 0 = αy − βy 2 (t) Für die Anfangsbevölkerungszahl y(0) = y0 erhält man für den Parameterwert A A = α − β, y0 29 Kapitel VII. Differentialgleichungen so dass die zugehörige spezielle Lösung lautet (4.9) y(t) = β+ α . α −αt −β e y0 Die Figur 2 zeigt die Lösungskurven für verschiedene Werte von y0 . Man entnimmt der Formel (5.9) leicht die Tatsache, dass für grosse t der Wert von y(t) gegen α/β strebt. Es gibt in diesem Modell eine stabile Bevölkerungszahl. In vielen Fällen lassen sich Differentialgleichungen durch eine Substitution auf einfachere zurückführen. Wir lernen hier einige Typen von Differentialgleichungen kennen, die auf diese Weise auf separierbare zurückgeführt werden können. In der Differentialgleichung y 0 = f (x, y) sei die Funktion f (x, y) von der Form g(u), wo u eine lineare Funktion in x und y ist, u = ax + by + c , a, b, c ∈ R . Setzt man dann u(x) = ax + b y(x) + c , so erhält man eine separierbare Differentialgleichung für x → u(x) . Wir verfolgen den Lösungsweg an einem konkreten Beispiel. (4.10) y 0 = (2x + 3y)2 . Setze u(x) = 2x + 3y(x) , d.h. y(x) = 1 3 (u(x) − 2x) . Dann ergibt sich y 0 (x) = 1 0 u (x) − 2 , 3 und damit wird (5.10) zu 1 0 (u − 2) = u2 , 3 u0 = 3u2 + 2 . Diese Differentialgleichung ist offensichtlich separierbar: Z du = 2 + 3u2 Z dx , 30 U. Stammbach: Analysis, Teil C 1 √ arctan 6 r 3 u 2 ! = x + C . Auflösung nach u liefert r √ 2 6(x + C) , tan 3 und wegen u(x) = 2x + 3y(x) erhält man schliesslich u = (y) (x) Fig. 3 : Lösungen der Differentialgleichung y 0 = (2x + 3y)2 1 y = y(x) = 3 r √ 2 6(x + C) − 2x tan 3 ! . Dies ist die allgemeine Lösung der Differentialgleichung (5.10) (siehe Figur 3). Ähnliches gilt für Differentialgleichungen y 0 = f (x, y) , wo f (x, y) geschrieben werden kann als g(u) mit u = y/x . Analog wie oben macht man die Substitution u(x) = y(x)/x und erhält so eine separierbare Differentialgleichung für die Funktion x → u(x) . Wieder erklären wir den Lösungsweg an einem konkreten Beispiel: 31 Kapitel VII. Differentialgleichungen √ x y 0 = y − 2 xy (4.11) Diese Differentialgleichung lässt sich in der Form r y y = −2 x 0 y x schreiben. Die rechte Seite ist eine Funktion von u = y/x . Die Substitution u(x) = y(x)/x liefert y(x) = x · u(x) und damit y 0 (x) = u(x) + x u0 (x) . Einsetzen in (5.11) ergibt √ u + x u0 = u − 2 u , √ x u0 = −2 u . Letztere Differentialgleichung ist separierbar, so dass unser erstes Teilziel erreicht ist. Wir erhalten weiter − Z 1 √ du = 2 u Z 1 dx , x √ − u = log |x| + C , wobei, wie immer, der positive Wert der Wurzel zu nehmen ist, d.h. es ist log |x| + C ≤ 0. Mit u = y/x folgt nach Quadrieren y = (log |x| + C)2 , x y = x (log |x| + C)2 , 32 U. Stammbach: Analysis, Teil C (y) Fig. 4 : Lösungen der Differentialgleichung (x) √ x y 0 = y − 2 xy mit log |x| + C ≤ 0. Dies ist die allgemeine Lösung von (5.11) (siehe Figur 4). Wir betrachten schliesslich in diesem Abschnitt noch das folgende Anwendungsbeispiel. Wir stellen die Frage, wie ein zur y-Achse rotationssymmetrischer Spiegel geformt sein muss, damit alle parallel zur y-Achse einfallenden Strahlen in den Nullpunkt des Koordinatensystems reflektiert werden (siehe Figur 5). Wegen der Rotationssymmetrie genügt es natürlich, die Schnittkurve des Spiegels mit der (x, y)Ebene zu bestimmen, wobei wir uns sogar auf den Teil x ≥ 0 beschränken können. Wir stellen diese Kurve als Graph einer Funktion x → y(x) , x ≥ 0 dar, und entnehmen der Figur die Beziehungen cot α(x) = tan β(x) = y 0 , cot (2α(x)) = y(x) . x 33 Kapitel VII. Differentialgleichungen (y) α Fig. 5 : Reflexion in den Nullpunkt (x, y(x)) α 2α β (x) Die bekannte trigonometrische Formel cot(2α) = cot2 α − 1 2 cot α liefert dann y y02 − 1 , = x 2y 0 (4.12) 2 x y 0 − 2y y 0 − x = 0 , (4.13) 0 y = + y (−) p y 2 + x2 . x Da y 0 > 0 für x > 0 , kann hier das negative Vorzeichen ausgeschlossen werden. Schreiben wir (5.13) in der Form 34 U. Stammbach: Analysis, Teil C y y0 = + x (4.14) s 2 y x +1 , so ist offensichtlich, dass die rechte Seite eine Funktion von y/x ist. Die Substitution u(x) = y(x)/x wird also eine separierbare Differentialgleichung für x → u(x) liefern. Wir erhalten wegen y 0 (x) = u(x) + x u0 (x) (y) Fig. 6 : Parabolspiegel (x) die einfache Differentialgleichung u + x u0 = u + Z √ du = u2 + 1 p u2 + 1 , Z dx , x 35 Kapitel VII. Differentialgleichungen log u + p u2 + 1 = log |x| + C . Setzen wir A = ±eC , so folgt y + x s y2 + 1 = Ax , x2 y2 y2 2 2 + 1 = A x − 2Ay + , x2 x2 y = 1 2 2 A x −1 . 2A Die “Anfangsbedingung” y0 = y(x0 ) bestimmt den Parameter A und damit die Öffnung des Spiegels (siehe Figur 6). 36 5 U. Stammbach: Analysis, Teil C Lineare Differentialgleichungen Die bei weitem wichtigste Klasse von Differentialgleichungen bilden die linearen Differentialgleichungen, sowohl was die Anwendungen wie auch was die Theorie betrifft, letzteres vor allem im Hinblick auf Differentialgleichungen höherer Ordnung. Eine Differentialgleichung 1. Ordnung heisst linear, wenn sie von der Form (5.1) y 0 = p(x) · y + q(x) ist, wobei x → p(x) und x → q(x) beliebige Funktionen von x sind. Die rechte Seite der Differentialgleichung ist also eine lineare Funktion in y; man beachte, dass über die Funktionen p und q von x keine Voraussetzungen getroffen werden. In (6.1) heisst der Term q(x) inhomogenes Glied oder Störglied. Ist q(x) ≡ 0, so heisst (6.1) homogen, andernfalls inhomogen. Die Differentialgleichung (5.2) y 0 = p(x) · y heisst die zu (6.1) gehörige homogene Differentialgleichung. Die homogene lineare Differentialgleichung (6.2) lässt sich in der Form y0 = p(x) y schreiben. Damit haben wir die folgende wichtige Tatsache festgestellt: Homogene lineare Differentialgleichungen sind separierbar. 37 Kapitel VII. Differentialgleichungen Beispiel Die Differentialgleichung (siehe Figur 1) y0 = (5.3) 1 y + 4x2 x 1 ist offensichtlich linear mit p(x) = , q(x) = 4x2 . Die zugehörige homogene Differentialgleix chung lautet y0 = (5.4) 1 y. x (y) Fig. 1 : Richtungsfeld der linearen Differentialgleichung (x) Separieren liefert Z 1 dy = y Z 1 dx , x log |y| = log |x| + C . y0 = 1 y + 4x2 x 38 U. Stammbach: Analysis, Teil C Setzt man A = ±eC , so erhält man die allgemeine Lösung von (6.4) zu y(x) = A · x . (5.5) Als nächstes wenden wir uns der inhomogenen Differentialgleichung (6.1) zu. Wir nehmen zuerst an, dass wir aus irgend einem Grunde eine partikuläre Lösung dieser Differentialgleichung kennen. Es sei also y0 : x → y0 (x) eine Funktion, welche (6.1) erfüllt: (5.6) y00 (x) = p(x) y0 (x) + q(x) . Wir behaupten nun: Behauptung A Ist yh : x → yh (x) eine Lösung der homogenen Differentialgleichung (6.2), d.h. gilt (5.7) yh0 (x) ≡ p(x) yh (x) , so ist die “Superposition” der Funktionen y0 und yh , d.h. die Funktion x → y0 (x) + yh (x) wieder eine Lösung der inhomogenen Differentialgleichung (6.1). 39 Kapitel VII. Differentialgleichungen Beweis Wir beweisen dies durch Einsetzen. Wegen (6.6) und (6.7) gilt (y0 (x) + yh (x))0 = y00 (x) + yh0 (x) = (p(x) y0 (x) + q(x)) + p(x) yh (x) = p(x) (y0 (x) + yh (x)) + q(x) d.h. x → y0 (x) + yh (x) erfüllt die Differentialgleichung (6.1). Als zweites behaupten wir: Behauptung B Ist die Funktion y1 : x → y1 (x) eine weitere Lösung der inhomogenen Differentialgleichung (6.1), so ist die Differenz x → y1 (x) − y0 (x) eine Lösung der homogenen Differentialgleichung (6.2). Beweis In der Tat gilt (y1 (x) − y0 (x))0 = y10 (x) − y00 (x) = (p(x) y1 (x) + q(x)) − (p(x) y0 (x) + q(x)) = p(x) · (y1 (x) − y0 (x)) d.h. x → y1 (x) − y0 (x) erfüllt die Differentialgleichung (6.2). Damit ist die Behauptung B bewiesen. Aus der Behauptung B folgt, dass sich jede Lösung x → y1 (x) der inhomogenen Differentialgleichung (6.1) darstellen lässt als (5.8) y1 (x) = y0 (x) + ỹ(x) , 40 U. Stammbach: Analysis, Teil C wo ỹ(x) eine Lösung der homogenen Differentialgleichung (6.2) ist. Die Behauptung A sagt, dass jede Funktion der Form (6.8) eine Lösung der inhomogenen Differentialgleichung (6.1) ist. Wir erhalten damit das folgende allgemeine Verfahren zur Lösung der inhomogenen Differentialgleichung (6.1). Man erhält die allgemeine Lösung der Differentialgleichung y 0 = p(x) y + q(x) , indem man eine partikuläre Lösung y0 : x → y0 (x) nimmt und zu ihr die allgemeine Lösung der zugehörigen homogenen Differentialgleichung y 0 = p(x) y addiert. Dieses Superpositionsprinzip ist charakterisch für lineare Differentialgleichungen. Wir wissen bereits, dass es einfach ist, die allgemeine Lösung der homogenen Differentialgleichung zu finden. Das Problem ist also auf die Aufgabe reduziert, eine partikuläre Lösung der inhomogenen Differentialgleichung zu finden. Oft lassen sich solche partikuläre Lösungen durch einen geschickt gewählten Ansatz auf einfache Art und Weise finden. In anderen Fällen ist es notwendig, ein umständlicheres Verfahren anzuwenden, das aber den Vorteil hat, dass es immer zum Ziel führt (Verfahren von Lagrange, J. L. Lagrange 1736 - 1813). Wir betrachten zuerst das Beispiel (6.3), wo ein einfacher Ansatz für y0 genügt. Beispiel Als Lösungsansatz für die Differentialgleichung (6.3) y0 = 1 y + 4x2 x versuchen wir (5.9) y0 (x) = a x3 41 Kapitel VII. Differentialgleichungen wo a eine noch zu bestimmende Konstante ist. Einsetzen liefert 3ax2 ≡ 2ax2 ≡ a x3 + 4x2 , x 4x2 , a = 2. Wir haben damit eine partikuläre Lösung von (6.3) erhalten y0 (x) = 2x3 . Nach unserem Verfahren liefert dies zusammen mit der allgemeinen Lösung (6.5) der zugehörigen homogenen Differentialgleichung die allgemeine Lösung von (6.3) (siehe Figur 2) (5.10) y(x) = Ax + 2x3 . Als Faustregel kann man sich merken, dass man immer einen Ansatz für y0 versuchen soll, der die Form des Störgliedes q(x) hat. Ist also q(x) ein Polynom, so soll man einen Polynomansatz versuchen, ist q(x) eine Sinus- oder Cosinusfunktion, so soll man als Ansatz eine Summe einer Sinus- und Cosinusfunktion der gleichen Kreisfrequenz versuchen, usw. Nicht immer führt dies allerdings zum Ziel. Dann muss das Verfahren von Lagrange angewandt werden. Wir betrachten wiederum die inhomogene Differentialgleichung (6.1) und nehmen an, dass wir eine Lösung x → yh (x) , yh 6≡ 0 der zugehörigen homogenen Differentialgleichung (6.2) bereits kennen. Es gilt also (5.11) yh0 (x) ≡ p(x) · yh (x) . Wir machen nun den Ansatz von Lagrange (5.12) y0 (x) = γ(x) · yh (x) , 42 U. Stammbach: Analysis, Teil C (y) Fig. 2 : Lösungen der linearen Differentialgleichung (x) y0 = 1 y + 4x2 x wobei x → γ(x) eine noch zu bestimmende Funktion von x ist. (Man beachte, dass sich jede Funktion in der Form (6.12) darstellen lässt!) Einsetzen in (6.1) liefert y00 (x) = γ 0 (x) yh (x) + γ(x) yh0 (x) ≡ p(x) γ(x) yh (x) + q(x) . Wegen (6.11) ergibt sich daraus γ 0 (x) = q(x) , yh (x) woraus sich durch Integration γ(x) und damit y0 (x) ergibt. Wir verfolgen den Lösungsweg an einem konkreten einfachen Beispiel. 43 Kapitel VII. Differentialgleichungen Beispiel Es sei die Differentialgleichung (5.13) y0 = y + 1 x gegeben. Die zugehörige homogene Differentialgleichung y0 = y x hat die allgemeine Lösung yh = Ax . Als Ansatz von Lagrange setzt man y0 (x) = γ(x) · x und erhält durch Einsetzen γ 0 (x) · x + γ(x) ≡ γ 0 (x) = γ(x) = γ(x) · x + 1, x 1 , x log |x| . Da wir nur an einer partikulären Lösung interessiert sind, können wir hier auf die Integrationskonstante verzichten. Wir erhalten y0 = x log |x| und als allgemeine Lösung von (6.13) (siehe Figur 3) (5.14) y(x) = Ax + x log |x| . Im verbleibenden Teil dieses Abschnittes diskutieren wir ein wichtiges Beispiel aus der Elektrodynamik. Es sei ein Schaltkreis mit einem Ohm’schen Widerstand R und einer Selbstinduktion L gegeben. Es interessiert der zur Zeit t im Schaltkreis fliessende Strom I(t), wenn zur Zeit t=0 44 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Lösungen der linearen Differentialgleichung (x) y0 = y +1 x (a) eine konstante Spannung U = U0 , (b) eine Wechselspannung U = U0 · cos(ωt) angelegt wird (Das Beispiel (a) wurde bereits im Abschnitt 2 behandelt; wir erhalten die Lösung hier aber auf eine etwas andere Art). In der Physik lernt man, dass die Funktion t → I(t) der Differentialgleichung (5.15) dI R U = − I + dt L L genügt. Gesucht ist die Lösung von (6.15) in den Fällen (a), (b) zur Anfangsbedingung I(0) = 0. Offensichtlich handelt es sich bei (6.15) um eine inhomogene lineare Differentialgleichung. Die zugehörige homogene Differentialgleichung lautet dI R = − I ; dt L sie hat als allgemeine Lösung 45 Kapitel VII. Differentialgleichungen R Ih (t) = C · e− L t . (5.16) Die beiden Fälle (a), (b) unterscheiden sich durch die partikuläre Lösung der inhomogenen Differentialgleichung (6.15). Im Fall (a) hat man U = U0 und eine Partikulärlösung lässt sich sofort erraten I0 (t) = U0 . R Die allgemeine Lösung von (6.15) im Fall (a) ist also I(t) = R U0 + C · e− L t R und die Anfangsbedingung I(0) = 0 liefert C = − (5.17) U0 I(t) = R U0 , so dass die gesuchte Lösung lautet R R 1 − e− L t . Man vergleiche dazu Beispiel (c) im Abschnitt 2, wo dieses Resultat auf etwas anderem Weg erhalten worden ist. Im Fall (b) hat man die Differentialgleichung (5.18) dI R 1 = − I + U0 · cos(ωt) dt L L zu diskutieren. Wir machen unserer Faustregel folgend für die partikuläre Lösung t → I0 (t) den Ansatz I0 (t) = a cos(ωt) + b sin(ωt) wo a, b zwei noch zu bestimmende reelle Konstanten sind. Einsetzen in (6.18) liefert −aω sin(ωt) + bω cos(ωt) ≡ − Daraus ergeben sich die Gleichungen R U0 (a cos(ωt) + b sin(ωt)) + cos(ωt) . L L 46 U. Stammbach: Analysis, Teil C aω = bω = R b, L R U0 − a + , L L und es folgt a = R2 U0 R + ω 2 L2 , b = U0 ω L . + ω 2 L2 R2 Zusammen mit (6.16) ergibt sich die allgemeine Lösung von (6.18) (5.19) R I(t) = C · e− L t + R2 U0 R U0 ω L cos(ωt) + 2 sin(ωt) . 2 2 +ω L R + ω 2 L2 Die Anfangsbedingung I0 = 0 schliesslich liefert C = − R2 U0 R . + ω 2 L2 Man entnimmt der Formel (5.19), dass für grosse t die Funktion I(t) gegen die partikuläre Lösung strebt. Man spricht deshalb auch etwa von der “stationären Lösung”, der Lösung nämlich, die sich nach langer Zeit einstellt (siehe Figur 4). Dass diese in unserem Beispiel eine Schwingung mit Kreisfrequenz ω sein wird, ist natürlich zu erwarten und wird durch die Rechnung auch bestätigt. Man beachte aber, dass die Phase der Lösung mit der Phase der angelegten Spannung nicht übereinstimmt (siehe Figur 4) Eine zweite Bemerkung betrifft die Grössen √ R2 R ωL , √ . 2 2 2 +ω L R + ω 2 L2 Diese lassen sich wegen √ R 2 R + ω 2 L2 2 + √ ωL 2 R + ω 2 L2 als Cosinus bzw. Sinus eines Winkels α deuten, welcher durch 2 =1 47 Kapitel VII. Differentialgleichungen I(t) U (t) (t) tan α = Fig. 4 : Stromstärke in einem Stromkreis unter einer Klemmenspannung, die durch t → cos(ωt) gegeben ist ωL R gegeben ist. Die Lösung (5.19) schreibt sich dann als I(t) = R C · e− L t + √ = R C · e− L t + √ R2 U0 (cos α cos(ωt) + sin α sin(ωt)) + ω 2 L2 U0 cos(ωt − α) . R 2 + ω 2 L2 Die “stationäre Lösung” ist somit eine Schwingung mit der Kreisfrequenz ω der angelegten Spannung und einer Phasenverschiebung, die durch α gegeben ist. 48 6 U. Stammbach: Analysis, Teil C Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien In diesem und dem nächsten Abschnitt wollen wir uns mit einigen geometrischen Problemen auseinandersetzen, welche mit Kurvenscharen zu tun haben. Wir betrachten zunächst eine Funktion g : (x, y) → g(x, y) von zwei Variablen. Den Verlauf dieser Funktion veranschaulichen wir uns durch ihre Niveaulinien, welche durch die Gleichung (6.1) g(x, y) = C , C∈R gegeben sind. Wir fragen jetzt nach der Differentialgleichung, welche die Kurvenschar (7.1) beschreibt. Totale Ableitung von (7.1) nach x liefert (6.2) gx (x, y) + gy (x, y) y 0 = 0 . Da der Scharparameter C automatisch eliminiert worden ist, ist (7.2) bereits die Differentialgleichung der Schar. Die Lösungskurven von (7.2) sind die Niveaulinien der Funktion g. Wir schliessen daran einige Bemerkungen an. Schreiben wir (7.2) in der Form (6.3) y0 = − gx (x, y) =: f (x, y) gy (x, y) und wenden wir darauf unseren Satz (3.1) über die Existenz und Eindeutigkeit von Lösungen von Differentialgleichungen an, so erhalten wir folgendes. Durch einen Punkt (x0 , y0 ) geht genau eine Lösungskurve von (7.3), also eine Niveaulinie von g, wenn f in einer Umgebung von (x0 , y0 ) stetig partiell differenzierbar ist. Für die Funktion g selbst bedeutet letzteres, neben der offensichtlichen Bedingung gy (x, y) 6= 0 , dass g in einer Umgebung von (x0 , y0 ) zweimal stetig partiell differenzierbar ist. Beispiel Betrachte die Funktion g : (x, y) → x2 − y 2 und ihre Niveaulinien (siehe Figur 1). Satz 3.1 liefert uns genau eine Niveaulinie durch jeden Punkt der (x, y)-Ebene mit Ausnahme der Punkte auf der x-Achse; denn dort verschwindet die partielle Ableitung von g nach y. (Die 49 Kapitel VII. Differentialgleichungen (y) Fig. 1 : Niveaulinien der Funktion (x) (x, y) → g(x, y) = x2 − y 2 Zeichnung lässt allerdings vermuten, dass sich die Niveaulinien in diese Punkte stetig fortsetzen lassen. Dies kann man in der Tat mathematisch einwandfrei nachweisen, indem man ein um π/2 gedrehtes Koordinatensystem einführt. Der Nullpunkt bildet dabei eine Ausnahme!) Umgekehrt gehen wir von einer Differentialgleichung der Form (6.4) ϕ(x, y) + ψ(x, y) y 0 = 0 aus und fragen, unter welchen Bedingungen sie als eine Differentialgleichung der Form (7.2) interpretiert werden kann. Wann gibt es eine Funktion g : (x, y) → g(x, y) mit ϕ(x, y) ≡ gx (x, y) , ψ(x, y) ≡ gy (x, y) ? Wir haben dieses Problem bereits früher, nämlich in Kapitel IV, Abschnitt 7 studiert und gesehen, dass g : (x, y) → g(x, y) jedenfalls nur dann existieren kann, wenn die Integrabilitätsbedingung (6.5) ϕy (x, y) ≡ ψx (x, y) 50 U. Stammbach: Analysis, Teil C erfüllt ist. Ferner haben wir festgestellt, dass in diesem Fall g auch tatsächlich existiert, wenn man sich auf ein achsenparalleles Rechteck als Definitionsbereich beschränkt. Da wir unter diesen Vorgaben g berechnen können, ist damit auch die Differentialgleichung (7.4) gelöst: die Lösungskurven sind die Niveaulinien von g. Eine Differentialgleichung (7.4), welche die Bedingung (7.5) erfüllt, heisst exakt. Ihre Lösungskurven sind die Niveaulinien der Funktion g : (x, y) → g(x, y) . Beispiel Bestimme die durch den Punkt (1, 2) gehende Lösungskurve von (2x2 − y 2 + y) − (2xy − x + 4y) y 0 = 0 . (6.6) Ein Vergleich mit (7.4) zeigt, dass wir ϕ(x, y) = 2x2 − y 2 + y , ψ(x, y) = −2xy + x − 4y (6.7) setzen müssen. Dann gilt ϕy (x, y) = −2y + 1 = ψx (x, y) . Die Differentialgleichung (7.6) ist folglich exakt. Die Funktion g(x, y) ergibt sich schrittweise. Wegen gx (x, y) = ϕ(x, y) = 2x2 − y 2 + y erhalten wir g(x, y) = 2 3 x − xy 2 + xy + u(y) 3 für eine noch zu bestimmende Funktion y → u(y) . Ableitung nach y liefert ! −2xy + x − 4y = ψ(x, y) = gy (x, y) = −2xy + x + u0 (y) . Daraus ergibt sich 51 Kapitel VII. Differentialgleichungen u0 (y) = −4y , u(y) = −2y 2 . Die Funktion g : (x, y) → g(x, y) ist also gegeben durch g(x, y) = (6.8) 2 3 x − xy 2 + xy − 2y 2 . 3 (Natürlich ist g nur bis auf eine additive Konstante bestimmt.) Die allgemeine Lösung der Differentialgleichung (7.6) ist die Schar der Niveaulinien von g (siehe Figur 2): 4 2 Fig. 2 : Niveaulinien der Funktion 0 (x, y) → 2 3 x − xy 2 + xy − 2y 2 3 -2 -4 -4 (6.9) -2 0 2 4 2 3 x − xy 2 + xy − 2y 2 = C . 3 Den zur gesuchten speziellen Lösung gehörigen Wert von C erhalten wir durch Einsetzen des Punktes (1,2) in (7.9). Es ergibt sich C = −28/3 , so dass die Lösung gegeben ist durch 52 (6.10) U. Stammbach: Analysis, Teil C 2 3 x − xy 2 + xy − 2y 2 = −28/3 . 3 Wir gehen zurück zur Gleichung (7.1), welche die Niveaulinien der Funktion g : (x, y) → g(x, y) beschreibt. Betrachten wir g als (ebenes) Potential, so hat bekanntlich das zugehörige Gradientenfeld die Eigenschaft, dass der Vektor des Feldes im Punkt P senkrecht auf der Niveaulinie durch P steht. Die Feldlinien des Gradientenfeldes verlaufen somit in jedem Punkt senkrecht zu den Niveaulinien von g. Die Feldlinien bilden die Orthogonaltrajektorien zur Schar der Niveaulinien. Etwas allgemeiner kann man nach den Orthogonaltrajektorien einer (regulären) Schar von Kurven fragen. Jede solche reguläre Schar ist Lösungsschar einer Differentialgleichung y 0 = f (x, y) . (6.11) Die Steigung in (x, y) der durch (x, y) gehenden Orthogonaltrajektorie ist dann offensichtlich m = − 1 . f (x, y) Beschreiben wir die Orthogonaltrajektorie wieder als Graph einer Funktion y : x → y(x) , so muss dafür die Differentialgleichung (6.12) y0 = − 1 f (x, y) erfüllt sein. Die Orthogonaltrajektorien sind somit gerade die Lösungskurven der Differentialgleichung (7.12), wenn die ursprüngliche Schar durch die Differentialgleichung (7.11) beschrieben wird. Beispiel Es sei die Schar der Parabeln (6.13) y = C x2 gegeben, und es seien die Orthogonaltrajektorien dieser Schar gesucht. Die Differentialgleichung der Schar (7.13) erhalten wir durch Ableiten nach x und Elimination des Parameters. Wir erhalten 53 Kapitel VII. Differentialgleichungen y 0 = 2Cx . (6.14) Aus (7.13) ergibt sich C = y . x2 Einsetzen in (7.14) liefert y0 = 2 y =: f (x, y) . x Die Differentialgleichung der Orthogonaltrajektorien lautet nach (7.12) y0 = − (6.15) x . 2y Diese ist separierbar. Wir erhalten Z y dy = − y2 2 = − Z 1 x dx , 2 x2 + C . 4 Die Orthogonaltrajektorien der Schar (7.13) sind somit gegeben durch (6.16) x2 y2 + = C . 4 2 Es sind Ellipsen mit Mittelpunkt im Ursprung des Koordinatensystems (siehe Figur 3). Natürlich bilden umgekehrt die durch (7.13) gegebenen Kurven die Orthogonaltrajektorien zur Schar (7.16). Beispiel In einem zweiten Beispiel sei die Schar der Kreise gegeben, welche die x-Achse im Ursprung berühren. Gesucht ist die Schar der Orthogonaltrajektorien. 54 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Die Orthogonaltrajektorien der Schar der Parabeln y = Cx2 sind Ellipsen (x) Die Schargleichung der Kreise lautet offensichtlich (6.17) x2 + y 2 − C y = 0 . Die Differentialgleichung ergibt sich durch totale Ableitung nach x und Elimination von C. Wir erhalten 2xy . − y2 y0 = x2 Die Differentialgleichung der Orthogonaltrajektorien lautet nach (7.12) y0 y 0 = − = 1 2 x2 − y 2 2xy y 1 − y x x ! . 55 Kapitel VII. Differentialgleichungen Wie üblich machen wir die Substitution u(x) = y(x) , d.h. x u0 x + u = y 0 . Einsetzen liefert 0 xu Z = u2 + 1 u 1 − 2 Z ! , 2u du 2 u +1 = − 1 dx , x log |u2 + 1| = − log |x| + C . (y) Fig. 4 : Die Orthogonaltrajektorien der Schar der Kreise (x) x2 + y 2 − Cy = 0 sind die Kreise x2 − Ax + y 2 = 0 Setzen wir A = ±eC , so folgt nach Rücksubstitution y2 + 1 x2 = A , x 56 (6.18) U. Stammbach: Analysis, Teil C x2 − Ax + y 2 = 0. Die Orthogonaltrajektorien sind also wiederum Kreise, nämlich solche, welche die y-Achse im Ursprung berühren (siehe Figur 4). 57 Kapitel VII. Differentialgleichungen 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen Es sei eine Schar von Kurven gegeben. Unter einer Enveloppe (Umhüllenden) der Schar verstehen wir eine Kurve K, welche in jedem ihrer Punkte eine Kurve der Schar berührt. Wie man am Beispiel der Schar der Kreise mit Mittelpunkt im Ursprung feststellen kann, besitzt nicht jede Kurvenschar eine Enveloppe. Gibt es aber eine, so spielt sie gewöhnlich eine ausgezeichnete Rolle. Wird zum Beispiel die Kurvenschar durch die Differentialgleichung (7.1) y 0 = f (x, y) beschrieben, so erfüllen offensichtlich nicht nur die Kurven der Schar diese Differentialgleichung, sondern auch ihre Enveloppe; in jedem ihrer Punkte stimmt ja ihre Steigung mit der Steigung der Scharkurve durch diesen Punkt überein. Neben den offensichtlichen Lösungen der Differentialgleichung (8.1), die durch die Kurven der Schar gegeben sind, gibt es also noch eine “versteckte”, eine singuläre Lösung, die der Enveloppe der Schar entspricht. Man entnimmt leicht der Figur 1, dass die Differentialgleichung (8.1) in den Punkten der Enveloppe die Voraussetzungen des Satzes 3.1 nicht erfüllen kann, denn durch diese Punkte gibt es mehrere Lösungen der Differentialgleichung (8.1). Wie bestimmt man die Enveloppe einer Kurvenschar? Die Schar sei gegeben durch die Gleichung (7.2) F (x, y, C) = 0 . Dem Parameterwert C ordnen wir (abstrakt) den Punkt (x(C), y(C)) der Enveloppe K zu, in dem K die zu C gehörige Scharkurve berührt (siehe Figur 1). Dann kann (7.3) C → (x(C), y(C)) als Parameterdarstellung der Enveloppe aufgefasst werden. Nun gilt, da (x(C), y(C)) auf der zu C gehörigen Scharkurve liegt, (7.4) F (x(C), y(C), C) = 0 . 58 U. Stammbach: Analysis, Teil C Fig. 1 : Enveloppe einer Kurvenschar (x(C), y(C)) F (x, y, C) = 0 Ferner berühren sich in (x(C), y(C)) Scharkurve und Enveloppe, ihre Steigungen stimmen in diesem Punkte überein: (7.5) ẏ(C) Fx (x(C), y(C), C) = − . ẋ(C) Fy (x(C), y(C), C) Links steht die Steigung der Enveloppe (8.3) und rechts steht die Steigung der implizit gegebenen Scharkurve. Wir schreiben (7.5) in der Form (7.6) Fx (x(C), y(C), C) ẋ(C) + Fy (x(C), y(C), C) ẏ(C) = 0 . Ausserdem liefert die totale Ableitung nach C von (8.4) die Gleichung (7.7) Fx (x(C), y(C), C) ẋ(C) + Fy (x(C), y(C), C) ẏ(C) + FC (x(C), y(C), C) = 0 . Zusammen mit (8.6) folgt daraus (7.8) FC (x(C), y(C), C) = 0 . 59 Kapitel VII. Differentialgleichungen Wir fassen zusammen: Die Enveloppe der durch (8.2) gegebenen Kurvenschar erhält man durch Elimination des Scharparameters C aus den Gleichungen F (x, y, C) = 0 FC (x, y, C) = 0 (7.9) . Beispiel Wir betrachten die Kurvenschar der Flugbahnen eines mit der Anfangsgeschwindigkeit v0 aus dem Ursprung schräg nach oben “geschossenen” Massenpunktes im Erdanziehungsfeld. Ist α der Abschusswinkel, so ist die Bahn des Massenpunktes gegeben durch ( t → x(t) = v0 cos α · t y(t) = v0 sin α · t − 1 2 gt2 . (y) Fig. 2 : Die Enveloppe der Wurfparabeln (x) Setzen wir h = g/2v02 , so liefert die Elimination von t die “Flugparabel” (7.10) F (x, y, α) := y − x tan α + h x2 = 0 . cos2 α 60 U. Stammbach: Analysis, Teil C Dies ist die Schar von Kurven, die wir in diesem Beispiel betrachten wollen; Scharparameter ist α. Für die Bestimmung der Enveloppen benötigen wir die Gleichung Fα (x, y, α) = 0 . Es gilt (7.11) Fα (x, y, α) = − x 2h + (sin α) x2 = 0 . 2 cos α cos3 α Aus (8.11) folgt tan α = 1 2hx q und Einsetzen in (8.10) liefert wegen cos α = 2hx/ 1 + (2hx)2 y = (7.12) 1 − h x2 . 4h Wir stellen die interessante Tatsache fest, dass die Enveloppe der Flugparabeln wieder eine Parabel ist (siehe Figur 2). Sie umgrenzt den Bereich, der mit der Anfangsgeschwindigkeit v0 überhaupt erreichbar ist. Schliesslich spezialisieren wir unsere Betrachtungen auf Kurvenscharen, welche aus Geraden bestehen. Wählt man als Parameter C der Schar gerade die Steigung der Geraden, so stellt sich eine solche Schar durch eine Gleichung der Form y = C · x + g(C) (7.13) dar, wo g : C → g(C) eine Funktion von C ist. Berechnet man die Enveloppe einer solchen Schar, so erhält man F (x, y, C) := −y + Cx + g(C) = 0 FC (x, y, C) = x + g0 (C) = 0 und damit die folgende Parameterdarstellung der Enveloppe ( (7.14) x = −g0 (C) y = −Cg0 (C) + g(C) . 61 Kapitel VII. Differentialgleichungen Um die Differentialgleichung der Schar (8.13) zu erhalten, berechnet man zunächst die totale Ableitung der Gleichung (8.13) nach x, y0 = C , (7.15) und eliminiert dann C aus (8.13) und (8.15). Man erhält y = y 0 x + g(y 0 ) . (7.16) Eine Differentialgleichung der Form (8.16) heisst Clairaut’sche Differentialgleichung. Zahlreiche geometrische Probleme, in denen Tangenten eine Rolle spielen, führen auf Differentialgleichungen von diesem Typ. Wir halten noch explizit fest: Die Lösungen von (8.16) sind die Geraden (8.13), – sie bilden die allgemeine Lösung der Differentialgleichung – und die Enveloppe (8.14) dieser Geradenschar – sie ist die singuläre Lösung der Differentialgleichung. Beispiel Gesucht sind die Kurven, die die Eigenschaft haben, dass ihre Tangenten zusammen mit den Koordinatenachsen im 1. Quadranten ein Dreieck mit Flächeninhalt F bilden (siehe Figur 3). Die Kurve sei als Graph der Funktion x → y(x) gegeben. Die Tangente im Punkte (x, y) stellt sich dann durch (η − y) = y 0 (x)(ξ − x) dar. Die Abschnitte auf den Koordinatenachsen sind − y + x y0 − y0x + y . und Für die Fläche F des Dreiecks erhält man also 2F = x− y (y − y 0 x) , y0 und damit ergibt sich, da beim Wurzelziehen gemäss Aufgabenstellung nur das positive Vorzeichen zu berücksichtigen ist, (7.17) y = y0x + p −2F y 0 . 62 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Dreieck, das von der Tangenten an die Kurve und den Koordinatenachsen gebildet wird F (x) (y) Fig. 4 : Die Geradenschar √ y = Cx + −2F C (Die Enveloppe ist sichtbar, obschon sie nicht eingezeichnet ist!) (x) 63 Kapitel VII. Differentialgleichungen Dies ist eine Clairaut’sche Differentialgleichung. Ihre allgemeine Lösung besteht aus der Schar der Geraden (7.18) √ y = Cx + −2F C . Daneben besitzt sie eine – interessantere – singuläre Lösung, die durch die Enveloppe der Geradenschar gegeben ist. Sie wird erhalten, indem man aus (8.18) und der partiellen Ableitung von (8.18) nach C (7.19) 0 = x + 1 1 √ (−2F ) 2 −2F C den Parameter C eliminiert. Aus (8.19) erhält man √ F , x F C = − 2 . 2x −2F C = Einsetzen in (8.18) liefert dann (7.20) y = 1F . 2x Es stellt sich heraus, dass neben der Geraden (8.18) auch die Hyperbel (8.20), genauer deren positiver Ast, die verlangten geometrischen Eigenschaften hat (siehe Figur 4). 64 8 U. Stammbach: Analysis, Teil C Differentialgleichungen höherer Ordnung, allgemeines Eine Differentialgleichung n-ter Ordnung für die Funktion y : x → y(x) ist eine Gleichung (8.1) F (x, y, y 0 , y 00 , . . . , y (n) ) = 0. Analog wie bei Differentialgleichungen 1. Ordnung nehmen wir an (vgl. (3.1) ), dass sich (9.1) nach y (n) auflösen lässt: (8.2) y (n) = f (x, y, y 0 , . . . , y (n−1) ) . In dieser Form wollen wir Differentialgleichungen n-ter Ordnung diskutieren. Betrachten wir zuerst ein ganz einfaches Beispiel. Beispiel Es sei die Differentialgleichung 2. Ordnung y 00 = a (8.3) für die Funktion x → y(x) gegeben; a ∈ R sei eine Konstante. Offensichtlich sind die Lösungsfunktionen von (9.3) von der Form x → y(x) = a 2 x + C1 x + C 2 , 2 wo C1 , C2 beliebige reelle Konstanten sind. Die Lösungskurven sind Parabeln, welche von den zwei Parametern C1 , C2 abhängen. Die allgemeine Lösung von (9.3) ist eine 2-parametrige Kurvenschar. Ist zusätzlich zu (9.3) noch die Anfangsbedingung (8.4) y(x0 ) = y0 . 65 Kapitel VII. Differentialgleichungen gegeben, so führt dies auf die Gleichung a 2 x + C 1 x0 + C 2 = y 0 . 2 0 (8.5) Natürlich genügt diese einzige Gleichung nicht zur Festlegung der speziellen Lösung, d.h. zur Bestimmung von C1 und C2 . Dafür muss eine zweite Anfangsbedingung hinzutreten. In vielen Fällen, aber durchaus nicht immer, ist sie von der Form (1) y 0 (x0 ) = y0 (8.6) . d.h. es wird an der Stelle x0 zusätzlich noch die Steigung der Kurve vorgeschrieben. Diese Anfangsbedingung führt auf die Gleichung (1) ax0 + C1 = y0 . (8.7) Die Gleichungen (9.5) , (9.7) lassen sich nun leicht nach C1 und C2 auflösen; zusammen bestimmen sie offenbar beide Parameter und damit die spezielle Lösung der Differentialgleichung (9.3) eindeutig. (1) Wir fassen zusammen: Zu jeder Wahl von y0 , y0 gibt es eine eindeutig bestimmte Funktion x → y(x), welche die Differentialgleichung (9.3) und die zwei Anfangsbedingungen (9.4) und (9.6) erfüllt. Damit haben wir den folgenden allgemeinen Satz illustriert, der eine direkte Verallgemeinerung unseres Satzes 3.1 über die allgemeine Lösung von Differentialgleichungen 1. Ordnung ist. Satz 8.1 Es sei die Differentialgleichung n-ter Ordnung (8.8) y (n) = f (x, y, y 0 , . . . , y (n−1) ) gegeben. Die Funktion f (von n + 1 Variablen) sei stetig in x und nach y, y 0 , . . . , y (n−1) stetig (0) (1) (n−1) partiell differenzierbar. Dann gibt es zu vorgegebenen x0 , y0 , y0 ,. . . , y0 eine eindeutig bestimmte, in einem Intervall mit Mittelpunkt x0 definierte Funktion y : x → y(x), welche Lösung der Differentialgleichung (9.8) ist und die (Anfangs-)Bedingungen (8.9) erfüllt. (0) (1) (n−1) y(x0 ) = y0 , y 0 (x0 ) = y0 , . . . , y (n−1) (x0 ) = y0 66 U. Stammbach: Analysis, Teil C Natürlich verzichten wir in dieser Vorlesung auf den Beweis dieses Satzes. Wie der Satz 3.1 für Differentialgleichungen 1. Ordnung, so bildet Satz 8.1 die Grundlage für das, was im Folgenden über die Lösungen von Differentialgleichungen höherer (n-ter) Ordnung gesagt wird. Betrachten wir zuerst die allgemeine Lösung von (9.8), d.h. die Schar aller Lösungskurven. Geben wir uns x0 vor, so besagt unser Satz, dass es zu jeder Wahl der Grössen (0) (1) (n−1) y0 , y0 , . . . , y0 genau eine Lösungskurve von (9.8) gibt, welche die n Gleichungen (9.9) befriedigt. Die erste (0) (1) dieser Gleichungen, y(x0 ) = y0 legt einen Punkt (x0 , y0 ) der Kurve fest, die zweite y 0 (x0 ) = y0 (2) die Steigung der Kurve in diesem Punkt, die dritte y 00 (x0 ) = y0 die 2. Ableitung der Funktion, also im wesentlichen die Krümmung der Kurve in diesem Punkt, usw. Die allgemeine Lösung der Differentialgleichung (9.8) n-ter Ordnung ist also eine (wie man sagt reguläre) n-parametrige Kurvenschar. Analog wie im Fall der Differentialgleichungen 1. Ordnung heisst regulär hier, dass (0) (1) (n−1) die Gleichungen (9.9) bei jeder Wahl der Grössen x0 , y0 , y0 , . . . ,y0 von genau einer Kurve der Schar erfüllt werden. Umgekehrt kann man natürlich fragen, ob es zu einer gegebenen (regulären) n-parametrigen Kurvenschar eine Differentialgleichung n-ter Ordnung gibt, welche gerade diese Schar als allgemeine Lösung besitzt. Unter sehr allgemeinen Bedingungen, auf die wir hier nicht weiter eingehen wollen, ist dies tatsächlich der Fall. Wir illustrieren den Sachverhalt an zwei Beispielen. Beispiel (8.10) Wir betrachten die 2-parametrige Schar y(x) = C1 cos(ωx) + C2 sin(ωx) , ω 6= 0 mit den Parametern C1 , C2 . Wir wollen zuerst zeigen, dass diese Schar regulär ist. Dazu müssen (0) (1) wir nachweisen, dass zu beliebig vorgegebenen Zahlen x0 , y0 , y0 genau eine Wahl von C1 und (0) (1) C2 existiert, so dass die Gleichungen y(x0 ) = y0 , y 0 (x0 ) = y0 erfüllt sind. Dieses führt auf das folgende Gleichungssystem für C1 und C2 (0) (8.11) C1 cos(ωx0 ) + C2 sin(ωx0 ) = y0 (1) −C1 ω sin(ωx0 ) + C2 ω cos(ωx0 ) = y0 . Nach der Theorie der linearen Gleichungssysteme (siehe “Lineare Algebra”) hat das System (0) (1) (9.11) für beliebige Wahl der Grössen y0 , y0 eine eindeutig bestimmte Lösung (für C1 , C2 ), wenn die Determinante der Matrix des Systems nicht Null ist. In unserem Fall gilt 67 Kapitel VII. Differentialgleichungen " det cos(ωx0 ) sin(ωx0 ) −ω sin(ωx0 ) ω cos(ωx0 ) # = ω 6= 0 . Damit ist nachgewiesen, dass die Schar (9.10) regulär ist. (Man beachte, dass lineare Gleichungssysteme mit nicht verschwindender Determinante gewöhnlich “regulär” genannt werden. Das steht in Übereinstimmung mit unserer Wahl des Wortes “regulär” für die Kurvenscharen, mit denen wir es hier zu tun haben.) Nach unserer Aussage sollte somit die 2-parametrige Schar (9.10) allgemeine Lösung einer Differentialgleichung 2. Ordnung sein. Diese erhalten wir wie folgt. Wir leiten die Schargleichung 2-mal nach x ab (8.12) y 0 (x) = −ωC1 sin(ωx) + ωC2 cos(ωx) , (8.13) y 00 (x) = −ω 2 C1 cos(ωx) − ω 2 C2 sin(ωx) und eliminieren die Scharparameter C1 , C2 aus den 3 Gleichungen (9.10), (9.12), (9.13). Im vorliegenden Fall ist das einfach dadurch zu bewerkstelligen, dass (9.10) mit ω 2 multipliziert und zu (9.13) addiert wird. Wir erhalten (8.14) y 00 + ω 2 y = 0 . Dies ist offensichtlich die Differentialgleichung der Kurvenschar (9.10). Beispiel (8.15) In unserem zweiten Beispiel sei die 3-parametrige Kurvenschar y(x) = C1 cos(C3 x) + C2 sin(C3 x) gegeben. Wir betrachten also nicht nur harmonische Schwingungen zu einer festen Frequenz ω wie im obigen Beispiel, sondern zu beliebigen Kreisfrequenzen. Da wir hier drei Parameter haben, wird die zugehörige Differentialgleichung von 3. Ordnung sein. Durch Ableitung nach x erhalten wir (8.16) y 0 = −C3 C1 sin(C3 x) + C3 C2 cos(C3 x) , (8.17) y 00 = −C32 C1 cos(C3 x) − C32 C2 sin(C3 x) , 68 (8.18) U. Stammbach: Analysis, Teil C y 000 = C33 C1 sin(C3 x) − C33 C2 cos(C3 x) . Aus den Gleichungen (9.15), (9.16), (9.17) und (9.18) sind nun die Parameter C1 , C2 , C3 zu eliminieren. Division von (9.18) durch (9.16) liefert y 000 = −C32 . y0 Ferner ergibt sich, wie oben, aus (9.15) und (9.17) die Gleichung y 00 + C32 y = 0 . Als Differentialgleichung der Schar (9.15) erhalten wir somit (8.19) y 0 y 00 − y 000 y = 0 ; natürlich ist sie 3. Ordnung, wie wir vorausgesehen haben. Wir haben hier bereits eine ganze Reihe von allgemeinen Aussagen über das Lösungsverhalten von Differentialgleichungen höherer Ordnung kennengelernt. Versucht man in konkreten Fällen die allgemeine Lösung zu beschreiben, so merkt man bald, dass dies ein schwieriges Unterfangen ist. In der Tat ist es nur selten überhaupt möglich, die allgemeine Lösung in geschlossener Form hinzuschreiben. Man ist hier in noch grösseren Massen als bei Differentialgleichungen 1. Ordnung auf numerische Methoden angewiesen, wobei gleichzeitig darauf hingewiesen werden muss, dass erst die allgemeine Aussage über das Lösungsverhalten diese numerischen Verfahren überhaupt ermöglichen. Glücklicherweise zeigt sich ausserdem, dass viele der in einfachen Anwendungen auftretenden Differentialgleichungen höherer Ordnung zu den “seltenen Ausnahmen” gehören und explizit in geschlossener Form lösbar sind. Mit diesen wollen wir uns in den nächsten Abschnitten vornehmlich befassen. Hier fügen wir noch ein einfaches Anwendungsbeispiel an. Beispiel Wir betrachten einen prismatischen Balken der Länge l welcher links eingespannt und rechts frei ist (siehe Figur 1). Die Lage des Balkens, die sogenannte Biegelinie, sei durch die Funktion x → y(x) beschrieben. Man lernt in der Mechanik, dass zwischen dem Biegemoment M (x) im Balkenquerschnitt an der Stelle x und der Krümmung k(x) der Biegelinie an der Stelle x die folgende Beziehung besteht (8.20) M (x) = EJk(x) . Kapitel VII. Differentialgleichungen 69 (y) P Fig. 1 : Biegelinie eines horizontal eingespannten Balkens (x) l Dabei ist E der Elastizitätsmodul des Balkens und J das axiale Trägheitsmoment eines Querschnittes des Balkens bezüglich einer horizontalen Achse durch den Schwerpunkt des Querschnittes. Die Krümmung ist gegeben durch (8.21) k(x) = y ′′ 3 (1 + y ′2 ) 2 . Daraus folgt (8.22) y ′′ (1 + y ′2 ) 3 2 = M (x) . EJ Dies ist bei gegebener Beanspruchung, d.h. wenn M (x) bekannt ist, eine Differentialgleichung für die Biegelinie des Balkens. Die “Anfangs”-Bedingungen sind offensichtlich (8.23) y(0) = 0 , y ′ (0) = 0 , sie sind also von der Art, wie wir sie in Satz 8.1 betrachtet haben. Die Differentialgleichung (8.22) ist wegen des Auftretens einer Wurzel mit y ′ im Radikanden kompliziert. Man sieht aber 70 U. Stammbach: Analysis, Teil C sofort, dass für die betrachtete Anwendung die Steigung der Biegelinie des Balkens immer sehr klein sein wird. Es gilt deshalb näherungsweise 1 + y 02 ∼ 1 . (8.24) Es ergibt sich dann die Differentialgleichung der Biegelinie eines Balkens (siehe M.B. Sayir: Mechanik 2, p. 107) M (x) . EJ y 00 = (8.25) Betrachten wir noch die spezielle Situation, wo der Balken an der Stelle l durch eine Einzellast P belastet wird. Ist P gegenüber dem Eigengewicht des Balkens gross, so darf letzteres vernachlässigt werden. Wir erhalten dann M (x) = −(l − x)P und damit die Differentialgleichung y 00 = − (8.26) (l − x)P . EJ Diese einfache Differentialgleichung lässt sich durch zweimalige Integration direkt lösen. Man hat y 0 (x) = y(x) = P 1 (−lx + x2 + C1 ) , EJ 2 P 1 l (− x2 + x3 + C1 x + C2 ) . EJ 2 6 Einsetzen der Anfangsbedingungen (9.23) liefert C1 = 0, C2 = 0, so dass die Biegelinie des Balkens durch y(x) = P EJ l 1 − x2 + x3 2 6 gegeben ist; insbesondere ist die Auslenkung an der Stelle x = l gegeben durch 71 Kapitel VII. Differentialgleichungen y(l) = − P l3 . EJ 3 Wir haben in unserem Beispiel eine komplizierte Differentialgleichung (9.22) vereinfacht, indem wir die Näherung (9.24) verwendet haben. Dies ist eine vielgeübte Praxis, die uns bereits bekannt ist und darin besteht, dass man eine komplizierte Funktion durch ihre lineare Ersatzfunktion ersetzt. In der Tat haben wir die Funktion 3 y 0 → (1 + y 02 ) 2 = g(y 0 ) in der Nähe des Punktes y 0 = 0 durch ihre lineare Ersatzfunktion ersetzt: 3 (1 + y 02 ) 2 ∼ g(0) + g0 (0)y 0 = 1 + 0 , denn g0 (0) = 0. Wir werden weiter unten noch mehrere ähnliche Beispiele kennenlernen. Die Frage, “ob man das darf”, d.h. ob die Lösungen der vereinfachten Differentialgleichungen dann auch Näherungen für die Lösungen der ursprünglichen Differentialgleichung sind, haben wir mit gutem Grund hier nicht diskutiert. Sie führt auf heikle und schwierig zu behandelnde mathematische Fragen (vgl. Burg, Haf, Wille III, S.72 ff.). Betrachtet man an Stelle des links eingespannten Balkens den beidseitig aufgelegten Balken, so nehmen die zusätzlichen Bedingungen eine andere Form an. Sie lauten dann nämlich (8.27) y(0) = 0 = y(l) , es sind somit “Randbedingungen” vorgegeben. Die Existenz und die Eindeutigkeit der Lösung von (9.25), welche (9.27) erfüllt, folgen in dieser Situation nicht mehr aus unserem allgemeinen Satz 8.1; sie müssen gesondert diskutiert werden. Zum Abschluss dieses Abschnittes weisen wir noch darauf hin, dass ein enger Zusammenhang zwischen Differentialgleichungen höherer Ordnung und Systemen von Differentialgleichungen 1. Ordnung besteht. Dazu werden wir weiter unten noch einiges zu sagen haben. 72 9 U. Stammbach: Analysis, Teil C Lineare Differentialgleichungen höherer Ordnung Die bei weitem wichtigste Klasse von Differentialgleichungen höherer Ordnung wird von den linearen gebildet. Mit diesen werden wir uns in den Abschnitten 9, 10, 11 beschäftigen. Die Differentialgleichung n-ter Ordnung (9.1) y (n) = f (x, y, y 0 , y 00 , . . . , y (n−1) ) heisst linear, wenn die Funktion f bezüglich der Variablen y,y 0 ,. . . ,y (n−1) linear ist. Die Gleichung (10.1) lässt sich in diesem Fall in der Form (9.2) y (n) + pn−1 (x) y (n−1) + · · · + p0 (x) y = q(x) schreiben. Man beachte, dass über die hier auftretenden Funktionen pn−1 , pn−2 ,. . . , p0 , q keine zusätzlichen Voraussetzungen getroffen werden; es sind beliebige stetige Funktionen. Für n = 1 ist (10.2) eine lineare Differentialgleichung 1. Ordnung. Ähnlich wie in Abschnitt 5 führen wir die folgende Ausdrucksweise ein. Die Differentialgleichung (10.2) heisst homogen, wenn q(x) ≡ 0 gilt, andernfalls heisst sie inhomogen. In diesem Fall heisst q(x) das inhomogene Glied oder Störglied. Die Differentialgleichung (9.3) y (n) + pn−1 (x) y (n−1) + · · · + p0 (x) y = 0 heisst die zu (10.2) gehörige homogene Differentialgleichung. Im Folgenden wollen wir uns mit den Lösungen der homogenen Differentialgleichung (10.3) beschäftigen und mit dem Zusammenhang zwischen den Lösungen der inhomogenen Differentialgleichung (10.2) und denjenigen der zugehörigen homogenen Differentialgleichung. Die Resultate sind analog zu den Resultaten für lineare Differentialgleichungen 1. Ordnung, die wir in Abschnitt 5 behandelt haben. (a) Homogene lineare Differentialgleichungen Wir beginnen mit dem folgenden 73 Kapitel VII. Differentialgleichungen Satz 9.1 Es seien x → y1 (x), x → y2 (x), . . . , x → yk (x) Lösungen der homogenen linearen Differentialgleichung (10.3). Dann ist für jede Wahl von C1 , C2 , . . . , Ck ∈ R die Funktion x → y(x) = C1 y1 (x) + C2 y2 (x) + · · · + Ck yk (x) (9.4) eine Lösung der Differentialgleichung (10.3). Der Beweis ergibt sich sofort durch Einsetzen. Man mache sich klar, dass die im Satz ausgesprochene Eigenschaft der Lösungen für nicht lineare und auch für inhomogene lineare Differentialgleichungen nicht erfüllt ist. In der Tat ist sie für homogene lineare Differentialgleichungen charakteristisch. In der linearen Algebra nennt man die durch (10.4) gegebene Funktion x → y(x) eine (reelle) Linearkombination der Funktionen y1 , y2 , . . . , yk . Der Satz 9.1 lässt sich also in Kurzform wie folgt aussprechen: Für eine homogene lineare Differentialgleichung ist jede Linearkombination von Lösungen wiederum eine Lösung. Beispiel Es sei die offensichtlich lineare homogene Differentialgleichung (9.5) y 00 + 2y 0 + y = 0 gegeben. Man verifiziert leicht, dass die durch y1 (x) = e−x , y2 (x) = xe−x gegebene Funktionen Lösungen sind. Nach Satz 9.1 ist dann jede Funktion der Form (9.6) x → y(x) = C1 e−x + C2 xe−x , C1 , C2 ∈ R wiederum eine Lösung. Sucht man die spezielle Lösung, welche zu den Anfangsbedingungen y(0) = 1, y 0 (0) = 2 gehört, so erhält man wegen y 0 (x) = −C1 e−x + C2 e−x − C2 xe−x das Gleichungssystem 74 U. Stammbach: Analysis, Teil C C1 = 1 −C1 + C2 = 2 . Die gesuchte spezielle Lösung ergibt sich also zu (y) e−x + 3xe−x Fig. 1 : Die spezielle Lösung x → y(x) der Differentialgleichung y 00 + 2y 0 + y = 0 mit y(0) = 1 und y 0 (0) = 2 als Linearkombination der Funktionen y1 (x) = e−x und y2 (x) = xe−x e−x xe−x (x) y(x) = e−x + 3xe−x . (siehe Figur 1). Man überzeugt sich leicht, dass sich durch (10.6) jede Anfangsbedingung der (0) (1) Form y(x0 ) = y0 , y 0 (x0 ) = y0 auf eindeutige Art befriedigen lässt. Es handelt sich also bei (10.6) um die allgemeine Lösung der Differentialgleichung (10.5). Dies illustriert unseren Satz 9.2. Um ihn zu formulieren erinnern wir an die folgende, aus der linearen Algebra stammende Sprechweise. Die Funktionen x → y1 (x), x → y2 (x),. . . , x → yk (x) heissen linear unabhängig, wenn aus (9.7) k X i=1 Ci yi (x) ≡ 0 , Ci ∈ R 75 Kapitel VII. Differentialgleichungen stets folgt Ci = 0 für i = 1, 2, . . . , k, d.h. wenn sich die Nullfunktion nur in trivialer Weise als Linearkombination darstellen lässt. Satz 9.2 Es seien x → y1 (x), x → y2 (x),. . . , x → yn (x) linear unabhängige Lösungen der Differentialgleichung (10.3). Dann ist die n-parametrige Schar y(x) = C1 y1 (x) + C2 y2 (x) + · · · + Cn yn (x) , Ci ∈ R (9.8) die allgemeine Lösung der Differentialgleichung (10.3). Beweis Es ist zu zeigen, dass durch geeignete Wahl der Konstanten C1 , C2 , . . . , Cn jede Anfangsbedingung der Form (0) (1) (n−1) y(x0 ) = y0 , y 0 (x0 ) = y0 , . . . , y (n−1) (x0 ) = y0 (9.9) erfüllt werden kann. Dazu benötigen wir etwas lineare Algebra, sowie unseren Satz 8.1. Die Bedingung (10.9) liefert für C1 , C2 , . . . , Cn das Gleichungssystem (9.10) C1 y1 (x0 ) C1 y10 (x0 ) .. . (n−1) C1 y1 + + C2 y2 (x0 ) C2 y20 (x0 ) .. . (n−1) (x0 ) + C2 y2 +···+ +···+ Cn yn (x0 ) Cn yn0 (x0 ) .. . (n−1) (x0 ) + · · · + Cn yn = = (0) y0 (1) y0 .. . . (n−1) (x0 ) = y0 Aus der linearen Algebra weiss man, dass das inhomogene Gleichungssystem (10.10) genau (0) (1) (n−1) dann für beliebige y0 , y0 , . . . , y0 eine Lösung besitzt, wenn das zugehörige homogene Gleichungssystem nur die triviale Lösung C1 = C2 = · · · = Cn = 0 zulässt. Das zu (10.10) gehörige homogene Gleichungssystem wird offensichtlich einfach dadurch erhalten, dass man die Anfangsbedingung (9.11) y(x0 ) = y 0 (x0 ) = · · · = y (n−1) (x0 ) = 0 studiert. Wir müssen also zeigen, dass diese Anfangsbedingung nur durch die triviale Wahl C1 = C2 = · · · = Cn = 0 erfüllt wird. Da nach der Eindeutigkeitsaussage in unserem Satz 8.1 die Lösung durch die Anfangsbedingung eindeutig bestimmt wird, sehen wir, dass die Nullfunktion y(x) ≡ 0, die Lösung von (10.3) ist, U. Stammbach: Analysis, Teil C 76 welche die Anfangsbedingung (9.11) erfüllt. Die Konstanten C1 , C2 , . . . , Cn müssen somit so gewählt werden, dass C1 y1 (x) + C2 y2 (x) + · · · + Cn yn (x) ≡ 0 gilt. Wegen der linearen Unabhängigkeit der Funktionen y1 , y2 , . . . , yn folgt dann mit (9.7) in der Tat C1 = C2 = · · · = Cn = 0. Dies war zu beweisen. Beispiel Es sei die Differentialgleichung y ′′ + x 1 y′ − y = 0 1−x 1−x gegeben. Diese ist linear mit p1 (x) = x/(1 − x) und p0 (x) = −1/(1 − x) und ausserdem homogen. Man verifiziert leicht, dass die Funktionen x → y1 (x) = x, x → y2 (x) = ex Lösungen sind. Nach Satz 9.1 ist somit jede Linearkombination (9.12) x → y(x) = C1 x + C2 ex , C1 , C2 ∈ R wiederum eine Lösung. Da y1 und y2 linear unabhängig sind (warum?), folgt aus Satz 9.2, dass die durch (9.12) gegebene Kurvenschar die allgemeine Lösung ist. Zum Abschluss dieses Textabschnittes muss hier noch folgendes gesagt werden. Im Fall von homogenen linearen Differentialgleichung 1. Ordnung lässt sich die allgemeine Lösung bekanntlich auf einfache Art durch Separieren erhalten (siehe Abschnitt 5). Dies ist bei homogenen linearen Differentialgleichungen höherer Ordnung anders. Auch wenn unser Satz 9.2 die Form der allgemeinen Lösung angibt, so lassen sich doch die linear unabhängigen Lösungsfunktionen in vielen konkreten Fällen nicht elementar beschreiben. Es lässt sich zum Beispiel zeigen, dass die allgemeine Lösung der einfachen Differentialgleichung y ′′ +xy = 0 nicht in elementarer Form dargestellt werden kann. Hier, wie an so vielen Stellen der Theorie der Differentialgleichungen ist man auf andere Verfahren angewiesen, insbesondere auf solche numerischer Art. Im Abschnitt 10 werden wir allerdings zwei wichtige Klassen von höheren linearen Differentialgleichungen kennen lernen, bei denen sich die allgemeine Lösung explizit hinschreiben lässt. Unser Satz 9.2 wird dabei eine wichtige Rolle spielen. Hier, im Rest dieses vorliegenden Abschnittes wollen wir uns noch mit dem Fall der inhomogenene linearen Differentialgleichungen auseinandersetzen. (b) Inhomogene lineare Differentialgleichungen Im Abschnitt 5 haben wir gesehen, dass sich die allgemeine Lösung einer inhomogenen linearen Differentialgleichung 1. Ordnung als Superposition einer partikulären Lösung der inhomogenen 77 Kapitel VII. Differentialgleichungen Differentialgleichung und der allgemeinen Lösung der zugehörigen homogenen Differentialgleichung darstellen lässt. Die zu diesem Resultat führenden Behauptungen A und B im Abschnitt 5 gelten offensichtlich auch für inhomogene lineare Differentialgleichungen höherer Ordnung. Dies stellt man sofort fest, indem man den Beweis der Behauptungen A und B auf diesen Fall überträgt. Damit gilt auch hier: Man erhält die allgemeine Lösung der linearen Differentialgleichung (10.2) indem man eine partikuläre Lösung y0 : x → y0 (x) nimmt und zu ihr die allgemeine Lösung der zugehörigen homogenen Differentialgleichung (10.3) addiert. Ist die allgemeine Lösung der homogenen Differentialgleichung (10.3) bekannt, so ist die Aufgabe auf das Problem reduziert, eine partikuläre Lösung der inhomogenen Differentialgleichung (10.2) zu bestimmen. Oft lässt sich diese partikuläre Lösung auf einfache Weise durch einen geschickt gewählten Ansatz finden. Wie im Falle von linearen Differentialgleichungen 1. Ordnung versuche man zuerst immer einen Ansatz in der Form des Störgliedes. Beispiel (9.13) Die Differentialgleichung y 00 + 2y 0 + y = sin(3x) sei gegeben. Gesucht ist die Lösung, welche die Anfangsbedingung y(0) = y 0 (0) = 0 befriedigt. Nach (10.6) hat die zugehörige homogene Differentialgleichung die allgemeine Lösung x → C1 e−x + C2 xe−x , C1 , C2 ∈ R. Um eine partikuläre Lösung von (10.13) zu erhalten, machen wir den Ansatz y0 : x → A cos(3x) + B sin(3x) , also eine harmonische Schwingung derselben Kreisfrequenz wie das Störglied. Einsetzen in (10.13) liefert für die Grössen A, B das Gleichungssystem −8A + 6B = 0 −6A − 8B = 1 . 78 U. Stammbach: Analysis, Teil C 3 2 Daraus erhält man A = − 50 , B = − 25 . Die Funktion y0 : x → − 3 2 cos(3x) − sin(3x) 50 25 ist somit Lösung der inhomogenen Differentialgleichung (10.13). Die allgemeine Lösung lautet demzufolge (y) y(x) Fig. 2 : Die partikuläre Lösung y0 (x) = − (x) 3 2 cos(3x)− sin(3x) 50 25 der Differentialgleichung y 00 + 2y 0 + y = sin(3x) und die spezielle Lösung x → y(x) mit y(0) = 0 und y 0 (0) = 0 y0 (x) y : x → C1 e−x + C2 xe−x − 3 2 cos(3x) − sin(3x) , C1 , C2 ∈ R . 50 25 Die Anfangsbedingungen – diese kommt erst jetzt zum Zug – bestimmen schliesslich die Kon3 3 stanten C1 , C2 ; man erhält C1 = 50 , C2 = 10 . Die gesuchte spezielle Lösung lautet somit (siehe Figur 2) (9.14) y: x→ 3 −x 3 3 2 e + xe−x − cos(3x) − sin(3x) . 50 10 50 25 Kapitel VII. Differentialgleichungen 79 Nicht immer lässt sich allerdings eine partikuläre Lösung der inhomogenen Differentialgleichung (10.2) durch einen einfachen Ansatz gewinnen. Zum Beispiel führt unsere Faustregel bei der einfachen Differentialgleichung y 00 + ω 2 y = P cos(ωx) (9.15) nicht zum Ziel, denn jede harmonische Schwingung der Kreisfrequenz ω ist ja eine Lösung der zugehörigen homogenen Differentialgleichung. In solchen Fällen muss das kompliziertere Verfahren von Lagrange (J. L. Lagrange 1736 - 1813) angewendet werden. Wir erklären dieses im Falle von inhomogenen linearen Differentialgleichungen 2. Ordnung. Analoges gilt für lineare Differentialgleichungen höherer Ordnung. Es sei die Differentialgleichung (9.16) y 00 + p1 (x)y 0 + p0 (x)y = q(x) gegeben. Die allgemeine Lösung der zugehörigen homogenen Differentialgleichung sei x → C1 y1 (x) + C2 y2 (x) , C1 , C2 ∈ R . Um eine partikuläre Lösung der Differentialgleichung (10.16) zu erhalten, macht man im Verfahren von Lagrange den Ansatz (9.17) y0 (x) = γ1 (x) y1 (x) + γ2 (x) y2 (x) mit noch zu bestimmenden Funktionen γ1 , γ2 . Man beachte, dass sich jede beliebige Funktion in der Form (10.17) schreiben lässt. Der Ansatz in dieser Form ist deshalb günstig, weil er erlaubt, die Funktionen γ1 , γ2 , zu bestimmen, und zwar sogar dann – und das ist der Witz des Ansatzes – wenn wir die zusätzliche Annahme (9.18) γ10 (x) y1 (x) + γ20 (x) y2 (x) ≡ 0 treffen. Diese Annahme macht, dass sich die Ableitung von y0 besonders einfach darstellen lässt. Es gilt mit (10.18) y00 = γ10 y1 + γ1 y10 + γ20 y2 + γ2 y20 = γ1 y10 + γ2 y20 y000 = γ10 y10 + γ1 y100 + γ20 y20 + γ2 y200 80 U. Stammbach: Analysis, Teil C Einsetzen in (10.16) liefert dann (9.19) γ10 y10 + γ1 y100 + γ20 y20 + γ2 y200 + p1 (x) γ1 y10 + γ2 y20 + p0 (x) (γ1 y1 + γ2 y2 ) = q(x) . Da y1 und y2 Lösungen der zu (10.16) gehörigen homogenen Differentialgleichung sind, reduziert sich (10.19) auf (9.20) γ10 (x)y10 (x) + γ20 (x)y20 (x) = q(x) . Aus den Gleichungen (10.18) und (10.20) lassen sich die unbekannten Funktionen γ10 , γ20 gewinnen; einfache Integration liefert dann γ1 , γ2 . Als explizites Beispiel für die Lagrange’schen Methode behandeln wir das folgende Beispiel. Beispiel Die inhomogene lineare Differentialgleichung 2. Ordnung y 00 + ω 2 y = P cos(ωx) (9.21) sei gegeben. Die zugehörige homogene lineare Differentialgleichung y 00 + ω 2 y = 0 hat als allgemeine Lösung (9.22) x → C1 cos(ωx) + C2 sin(ωx) , C1 , C2 ∈ R . Für die partikuläre Lösung der inhomogenen Differentialgleichung (10.21) machen wir nach Lagrange den Ansatz (9.23) y0 (x) = γ1 (x) cos(ωx) + γ2 (x) sin(ωx) , wobei wir als zusätzliche Annahme (9.24) γ10 (x) cos(ωx) + γ20 (x) sin(ωx) = 0 verwenden. Einsetzen von (10.23) in (10.21) liefert nach einigen Rechnungen (9.25) −γ10 (x) ω sin(ωx) + γ20 (x) ω cos(ωx) = P cos(ωx) . 81 Kapitel VII. Differentialgleichungen Aus den Gleichungen (10.24) und (10.25) ergibt sich γ10 (x) = γ20 (x) = − P cos(ωx) sin(ωx) ω P cos2 (ωx) . ω Integration liefert dann P sin2 (ωx) 2ω 2 γ1 (x) = − γ2 (x) = P (sin(ωx) cos(ωx) + ωx) . 2ω 2 (Auf die Integrationskonstanten kann verzichtet werden, da wir nur eine partikuläre Lösung im (y) Fig. 3 : Die partikuläre Lösung (x) x→ P x sin(ωx) 2ω der Differentialgleichung y 00 + ω 2 y = P cos(ωx) Auge haben.) Es ergibt sich aus (10.23) y0 (x) = − = P P sin2 (ωx) cos(ωx) + 2 (sin2 (ωx) cos(ωx) + ωx sin(ωx)) 2 2ω 2ω P x sin(ωx) . 2ω 82 U. Stammbach: Analysis, Teil C Damit lässt sich die allgemeine Lösung von (10.21) in der Form (9.26) y(x) = (C1 cos(ωx) + C2 sin(ωx)) + P x sin (ωx) , C1 , C2 ∈ R 2ω schreiben. Neben der harmonischen Schwingung mit Kreisfrequenz ω enthält sie einen Term mit einer linear zunehmenden Amplitude (siehe Figur 3). 83 Kapitel VII. Differentialgleichungen 10 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen In diesem Abschnitt beschäftigen wir uns mit zwei Klassen von homogenen linearen Differentialgleichungen, welche in Anwendungenen häufig auftreten und deren allgemeine Lösung leicht mit Hilfe eines Ansatzes gewonnen werden kann. (a) Homogene lineare Differentialgleichungen mit konstanten Koeffizienten Es sei die Differentialgleichung y (n) + an−1 y (n−1) + · · · + a0 y = 0 (10.1) gegeben, wo a0 , a1 ,. . . , an−1 reelle Zahlen sind. Offensichtlich ist (11.1) eine lineare Differentialgleichung, in der die Koeffizienten von y, y 0 ,. . . , y (n−1) Konstanten sind; man nennt deshalb (11.1) eine (homogene) lineare Differentialgleichung mit konstanten Koeffizienten. Um die allgemeine Lösung von (11.1) zu finden, brauchen wir nach Satz 9.2 n linear unabhängige Funktionen, welche (11.1) erfüllen. Zu diesem Zweck machen wir den Ansatz x → y(x) = eαx (10.2) und versuchen, α durch Einsetzen in (11.1) zu bestimmen. Das liefert eαx αn + an−1 αn−1 + · · · + a1 α + a0 = 0. Daraus folgt, dass (11.2) genau dann eine Lösung von (11.1) ist, wenn α eine Nullstelle des sogenannten charakteristischen Polynoms (10.3) ist. α → αn + an−1 αn−1 + · · · + a1 α + a0 84 Beispiel U. Stammbach: Analysis, Teil C Es sei die Differentialgleichung y 000 − 2y 00 − 3y 0 = 0 (10.4) gegeben. Das charakteristische Polynom ist α → α3 − 2α2 − 3α = α(α + 1)(α − 3) . Es hat die Nullstellen α1 = 0, α2 = −1, α3 = 3. Daraus schliesst man, dass die Funktionen x → e0x = 1 , x → e−x , x → e3x Lösungen von (11.4) sind. Da sie linear unabhängig sind (warum?), ist nach unserem Satz 9.2 x → C1 + C2 e−x + C3 e3x , C1 , C2 , C3 ∈ R . die allgemeine Lösung von (11.4). Dieses Verfahren führt dann problemlos zu n linear unabhängigen Funktionen, wenn das charakteristische Polynom n verschiedene reelle Nullstellen besitzt. Dies braucht aber nicht der Fall zu sein: es können mehrfache Nullstellen und es können komplexe Nullstellen auftreten. Da letztere bei reellen Polynomen immer in konjugiert komplexen Paaren auftreten und die Summe der Vielfachheiten der Nullstellen eines Polynoms n-ten Grades stets n ist, müssen wir zu jeder k-fachen reellen Nullstelle k linear unabhängige Funktionen und zu jedem Paar konjugiert komplexer k-facher Nullstellen 2k linear unabhängige Funktionen finden. Diese erhalten wir nach der folgenden Regel: Ist α eine k-fache reelle Nullstelle des charakteristischen Polynoms (11.3), so sind die Funktionen x → eαx , x → xeαx , . . . , x → xk−1 eαx k linear unabhängige Lösungen der Differentialgleichung (11.1) Ist α = a + ib, α = a − ib, b 6= 0 ein Paar konjugiert komplexer k-facher Nullstellen des charakteristischen Polynoms (11.3), so sind die Funktionen 85 Kapitel VII. Differentialgleichungen x → eax cos bx x → xeax cos bx .. . x → xk−1 eax cos bx x → eax sin bx x → xeax sin bx .. . x → xk−1 eax sin bx 2k linear unabhängige Lösungen der Differentialgleichung (11.1). Wir verzichten hier auf einen Beweis für diese beiden Regeln. Zur zweiten merken wir aber noch Folgendes an. Ist a + ib eine komplexe Nullstelle des charakteristischen Polynoms, so ist die komplexwertige Funktion y1 : x → e(a+ib)x = eax (cos bx + i sin bx) eine “Lösung” der Differentialgleichung. Da auch a − ib eine Nullstelle des charakteristischen Polynoms ist, gilt dasselbe für y2 : x → e(a−ib)x = eax (cos bx − i sin bx) . Wegen der Linearität (bezüglich komplexer Zahlen) der Differentialgleichung müssen dann auch die reellwertigen Funktionen 1 (y1 (x) + y2 (x)) 2 = eax cos bx 1 (y1 (x) − y2 (x)) 2i = eax sin bx Lösungen der Differentialgleichung (11.1) sein. Beispiel Gegeben sei die Differentialgleichung (10.5) y (4) + 2y 00 + y = 0 . Das charakteristische Polynom lautet α4 + 2α2 + 1 . 86 U. Stammbach: Analysis, Teil C Es lässt sich schreiben als (α2 + 1)2 ; die Nullstellen sind α = ±i, beide mit Vielfachheit 2. Mit Hilfe unserer Regel erhalten wir vier linear unabhängige Funktionen; deren reelle Linearkombinationen y(x) = C1 cos x + C2 x cos x + C3 sin x + C4 x sin x , bilden die allgemeine Lösung der Differentialgleichung (11.5). (b) Homogene Eulersche Differentialgleichungen Eine weitere Klasse von linearen Differentialgleichungen lässt sich ähnlich behandeln wie die linearen Differentialgleichungen mit konstanten Koeffizienten, nämlich die Eulerschen Differentialgleichungen. Eine Differentialgleichung n-ter Ordnung heisst Euler’sch, wenn sie sich in der Form (10.6) y (n) + an−1 (n−1) an−2 (n−2) a0 + 2 y + ··· + ny = 0 y x x x mit a0 , a1 , . . . , an−1 ∈ R schreiben lässt. Nach unserem Satz 9.2 besteht unsere Aufgabe darin, n linear unabhängige Funktionen zu finden, welche (11.6) erfüllen. Ähnlich wie für lineare Differentialgleichungen mit konstanten Koeffizienten gewinnen wir diese mit Hilfe eines Ansatzes. Wir setzen (10.7) y(x) = xα und versuchen α durch Einsetzen in (11.6) zu bestimmen. Wir erhalten α(α − 1) · · · (α − n + 1) xα−n + an−1 α(α − 1) · · · (α − n + 2) xα−n + · · · + a0 xα−n = 0 . Es folgt, dass (11.7) genau dann eine Lösung der Differentialgleichung (11.6) liefert, wenn α eine Nullstelle des sogenannten Indexpolynoms (10.8) α(α − 1) · · · (α − n + 1) + an−1 α(α − 1) · · · (α − n + 2) + · · · + a0 ist. Hat das Indexpolynom n verschiedene reelle Nullstellen, so liefert dieses Verfahren n linear unabhängige Funktionen, welche (11.6) erfüllen. Wie bei linearen Differentialgleichungen mit 87 Kapitel VII. Differentialgleichungen konstanten Koeffizienten müssen die Fälle von mehrfachen Nullstellen und komplexen Nullstellen zusätzlich behandelt werden. Wir merken ohne Beweis die folgende Regel an: Ist α eine k-fache reelle Nullstelle des Indexpolynoms (11.8), so sind die Funktionen x → xα , x → (log x)xα , . . . , x → (log x)k−1 xα k linear unabhängige Lösungen der Differentialgleichung (11.6). Ist α = a + ib, α = a − ib, b 6= 0 ein Paar konjugiert komplexer k-facher Nullstellen des Indexpolynoms (11.8), so sind die Funktionen x → xa cos(b log x) x → (log x)xa cos(b log x) .. . x → xa sin(b log x) x → (log x)xa sin(b log x) .. . x → (log x)k−1 xa cos(b log x) x → (log x)k−1 xa sin(b log x) 2k linear unabhängige Lösungen der Differentialgleichung (11.6) Beispiel Untersucht man die stationäre Temperaturverteilung auf einer homogenen Kreisscheibe oder auf einem homogenen Kreisring, so tritt (siehe Analysis III) auf natürliche Weise die folgende Differentialgleichung für r → y(r) (10.9) 1 m2 y 00 + y 0 − 2 y = 0 r r auf. Dabei bezeichnet r den Abstand vom Mittelpunkt der Kreisscheibe, und m ist eine beliebige natürliche Zahl. Die homogene lineare Differentialgleichung (11.9) ist offensichtlich Euler’sch. Das Indexpolynom lautet α(α − 1) + α − m2 = α2 − m2 . Ist m > 0, so sind α = ±m die beiden Nullstellen des Indexpolynoms. Die allgemeine Lösung der Differentialgleichung (11.9) lautet in diesem Fall y(r) = C1 r m + C2 r −m , C1 , C2 ∈ R . 88 U. Stammbach: Analysis, Teil C Ist m = 0, so ist α = 0 eine doppelte Nullstelle des Indexpolynoms. Nach unserer Regel ist in diesem Fall die allgemeine Lösung von (11.9) durch y(r) = C1 + C2 log r , C1 , C2 ∈ R gegeben. Wir schliessen diesen Abschnitt mit der folgenden Bemerkung. Die allgemeine Lösung der Eulerschen Differentialgleichungen ergibt sich formal ganz analog zur Lösung einer linearen Differentialgleichung mit konstanten Koeffizienten. In der Tat lässt sich eine Eulersche Differentialgleichung für die Funktion x → y(x) durch die einfache Substitution x = et auf eine Differentialgleichung mit konstanten Koeffizienten für die Funktion t → y(et ) zurückführen. Das Indexpolynom geht dann ins charakteristische Polynom über. Wir überlassen es dem Leser, die Details dieser Substitution durchzuführen. 89 Kapitel VII. Differentialgleichungen 11 Schwingungsprobleme In diesem Abschnitt betrachten wir eine wichtige Anwendung der bis hierher entwickelten Theorie. Wir gehen dabei von zwei ganz verschiedenen konkreten Problemen aus und stellen fest, dass deren Verhalten durch ein und dieselbe lineare Differentialgleichung 2. Ordnung beschrieben wird. Diese Differentialgleichung diskutieren wir schliesslich im Detail. Das erste der beiden Probleme ist die gedämpfte Federschwingung. Ein Massenpunkt der Masse m sei an einer idealen Feder aufgehängt (siehe Figur 1). Die Auslenkung zur Zeit t aus der Ruhelage werde durch x(t) beschrieben. Fig. 1 : Gedämpfte Federschwingung x −kx −wẋ S(t) Auf den Massenpunkt wirke die Federkraft F = −kx, wobei k > 0 eine Proportionalitätskonstante ist, und eine Dämpfungskraft W . Für W benützen wir die Modellvorstellung, dass W proportional zur Geschwindigkeit ẋ(t) sei, W = −wẋ , w > 0 . 90 U. Stammbach: Analysis, Teil C Ferner wirke auf m eine von t abhängige äussere Kraft S(t). Das Newton’sche Gesetz liefert dann die Bewegungsdifferentialgleichung mẍ = −kx − wẋ + S(t) . Führen wir die Grössen s ω= k w S(t) , λ= , s(t) = m 2m m ein, so lautet die Differentialgleichung ẍ + 2λẋ + ω 2 x = s(t) . (11.1) Es handelt sich somit um eine inhomogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten. Als zweites konkretes Problem betrachten wir einen elektrischen Stromkreis, welcher eine Kapazität C, eine Induktivität L und einen Ohm’schen Widerstand R enthält (siehe Figur 2). Ausserdem werde an den Klemmen eine von t abhängige Spannung u(t) angelegt. Gesucht ist der zur Zeit t im Stromkreis fliessende Strom I(t). Aus der Physik weiss man, dass der Spannungsabfall am Ohm’schen Widerstand R durch uR = RI gegeben ist, derjenige an der Induktivität durch uL = L dI dt und derjenige am Kondensator mit Kapazität C durch uC = q/C, wo q die zur Zeit t auf C sitzende Ladung bezeichnet. Natürlich gilt I(t) = q̇(t). Das Kirchhoff’sche Gesetz liefert uR + uL + uC = u(t) . Setzt man die obigen Werte ein, so erhält man L dI q(t) + RI + = u(t) dt C und nach Ableitung nach t (11.2) L d2 I dI 1 d +R + I = u(t) . 2 dt dt C dt 91 Kapitel VII. Differentialgleichungen C Fig. 2 : Elektrischer Schwingkreis R L u(t) Führt man die Grössen ω2 = 1 R 1 d , λ= , s(t) = u(t), I(t) = x(t) , CL 2L L dt ein, so geht (11.2) in die Differentialgleichung (11.1) über. Vom mathematischen Standpunkt aus genügt es deshalb, sich mit (11.1) zu befassen. Wir haben hier wiederum ein Beispiel vor uns, wo zwei ganz verschiedene konkrete Probleme auf ein und dasselbe mathematische Modell führen. Im Folgenden diskutieren wir (11.1) und betrachten zu diesem Zweck zuerst die zugehörige homogene Differentialgleichung (11.3) ẍ + 2λẋ + ω 2 x = 0 . Dies ist eine homogene lineare Differentialgleichung mit konstanten Koeffizienten. Das charakteristische Polynom lautet 92 U. Stammbach: Analysis, Teil C α → α2 + 2λα + ω 2 , hat also die Nullstellen (11.4) α1,2 = −λ ± p λ2 − ω 2 . Je nach der Lage dieser Nullstellen sind verschiedene Fälle zu unterscheiden. (a) λ > ω, sogenannte starke Dämpfung In diesem Fall hat man zwei verschiedene reelle Nullstellen des charakteristischen Polynoms. Die allgemeine Lösung von (11.3) lautet (11.5) xh (t) = C1 eα1 t + C2 eα2 t . Man beachte, dass beide Nullstellen negativ sind, so dass xh (t) für jede Wahl von C1 , C2 exponentiell abklingt. (b) λ = ω, sogenannte kritische Dämpfung Hier hat das charakteristische Polynom eine doppelte Nullstelle α1 = α2 = −λ. Die allgemeine Lösung von (11.3) lautet (11.6) xh (t) = C1 e−λt + C2 t e−λt . Auch hier klingt xh (t) für jede Wahl von C1 , C2 exponentiell ab. (c) λ < ω, sogenannte schwache Dämpfung In diesem √ Fall hat das charakteristische Polynom zwei konjugiert komplexe Nullstellen. Setzt man ω ∗ = ω 2 − λ2 , so gilt α1,2 = −λ ± iω ∗ . Die allgemeine Lösung von (11.3) lautet dann (11.7) xh (t) = e−λt (C1 cos(ω ∗ t) + C2 sin(ω ∗ t)) . Jede spezielle Lösung von (11.3) ist in diesem Fall eine “exponentiell abklingende harmonische Schwingung” der Kreisfrequenz ω ∗ (siehe Figur 3). Man beachte ferner, dass ω ∗ kleiner ist als die Kreisfrequenz ω der ungedämpften Schwingung (λ = 0). 93 Kapitel VII. Differentialgleichungen (x) (t) Fig. 3 : Die Lösung t → x(t) mit x(0) = 1 und ẋ(0) = 0 der Schwingungsgleichung ẍ + 2λẋ + ω 2 x = 0 zu verschiedenen Werten von λ. Die gestrichelte Kurve entspricht der kritischen Dämpfung λ = ω Als nächstes diskutieren wir die inhomogene Differentialgleichung (11.1), und zwar wollen wir den Fall betrachten, wo s(t) durch s(t) = P cos(σt) gegeben ist. Wir haben also die Differentialgleichung (11.8) ẍ + 2λẋ + ω 2 x = P cos(σt) vor uns. Nach der Theorie setzt sich die allgemeine Lösung von (11.8) additiv aus einer partikulären Lösung x0 (t) von (11.8) und der allgemeine Lösung xh (t) der zugehörigen homogenen Differentialgleichung (11.3) zusammen: x(t) = x0 (t) + xh (t) . Wir haben oben gesehen, dass in jedem Fall die Funktion xh exponentiell abklingt; somit wird für grosse t 94 U. Stammbach: Analysis, Teil C x(t) ∼ x0 (t) gelten. Für x0 (t) können wir deshalb die sogenannte stationäre Lösung einsetzen, nämlich diejenige, die sich “nach langer Zeit” einstellt. Die Erfahrung (des Physikers mit Stromkreisen, etc.) zeigt, dass dies eine harmonische Schwingung mit der Kreisfrequenz σ der Anregung sein wird. Wir machen deshalb für x0 den Ansatz (übrigens in Übereinstimmung mit unserer Faustregel) x0 (t) = A cos(σt + α) . (11.9) Die noch unbekannte Amplitude A und die Phasenverschiebung α werden durch Einsetzen in (11.8) gewonnen. Wir erhalten (nach längerer Rechnung) Fig. 4 : Das Verhalten der Funktion σ → A2 (σ) für verschiedene Werte von λ P 2 /ω 4 (σ) tan α A2 = 2λσ , σ2 − ω2 = P2 . 4λ2 σ 2 + (σ 2 − ω 2 )2 95 Kapitel VII. Differentialgleichungen schwache Dämpfung starke Dämpfung ω Resonanz möglich (λ) Fig. 5 : Dämpfung und Resonanz keine Resonanz √1 ω 2 ω (λ) Wir diskutieren hier die (zwar ebenfalls interessante und wichtige) Abhängigkeit der Phasenverschiebung α von σ, ω, λ nicht weiter, sondern konzentrieren uns auf die Amplitude A, und untersuchen zu diesem Zweck den Graphen der Funktion σ → A2 (σ) (siehe Figur 4). Um die Stellen mit horizontaler Tangente zu berechnen, setzen wir d 2 8λ2 σ + 2(σ 2 − ω 2 )2σ = 0. A (σ) = −P 2 dσ (4λ2 σ 2 + (σ 2 − ω 2 )2 )2 Dies führt auf σ1 = 0 und wegen 2λ2 + (σ22 − ω 2 ) = 0 auf (11.10) σ22 = ω 2 − 2λ2 . Das Verhalten von A2 (σ) ist somit stark abhängig von den Grössen ω, λ. Wir erhalten die folgenden, qualitativ unterschiedlichen Fälle (siehe Figur 5). (a) Starke Dämpfung und kritische Dämpfung, ω ≤ λ In diesem Fall hat man nur eine horizontale Tangente; die Funktion σ → A2 (σ) nimmt mit zunehmendem σ monoton ab. 96 U. Stammbach: Analysis, Teil C (y) (t) Fig. 6 : Die Funktionen t → P cos(σt) (gestrichelt) und die zugehörigen stationären Lösungen (ausgezogen) der Differentialgleichung ẍ + 2λẋ + ω 2 x = P cos(σt) mit schwacher Dämpfung zu verschiedenen Werten von σ mit σ ≤ σ2 . (y) (t) Fig. 7 : Die Funktionen t → P cos(σt) (gestrichelt) und die zugehörigen stationären Lösungen (ausgezogen) der Differentialgleichung ẍ + 2λẋ + ω 2 x = P cos(σt) mit schwacher Dämpfung zu verschiedenen Werten von σ mit σ ≥ σ2 . 97 Kapitel VII. Differentialgleichungen (b) Schwache Dämpfung, λ < ω Hier sind wiederum zwei Fälle zu unterscheiden (ba) √1 ω 2 ≤λ<ω In diesem Fall ist ω 2 − 2λ2 ≤ 0. Man erhält für σ = 0 eine horizontale Tangente. Für σ > 0 ist die Funktion σ → A2 (σ) strikt monoton fallend. (bb) 0 < λ < √1 ω 2 In diesem Fall√ist ω 2 − 2λ2 > 0 und man hat zwei horizontale Tangenten, nämlich bei σ1 = 0 und bei σ2 = ω 2 − 2λ2 . In σ2 nimmt A2 (σ) offenbar das Maximum an. Die Frequenz σ2 heisst Resonanzfrequenz. Sie ist kleiner als die Eigenfrequenz ω. Jenseits der Resonanzfrequenz nimmt A2 (σ) monoton ab (siehe Figuren 6,7). Bemerkung Für λ = 0 (keine Dämpfung) hat man ein ähnliches Verhalten. Alle Herleitungen bleiben für σ 6= ω gültig. Der Fall σ = ω muss genauer untersucht werden, denn an dieser Stelle hat die Funktion σ → A2 (σ) einen Pol. Die Differentialgleichung ẍ + ω 2 x = P cos(ωt) hat auch eine etwas anders geartete partikuläre Lösung. Es gilt (siehe (9.26)) x(t) = C1 cos(ωt) + C2 sin(ωt) + P t sin(ωt) . 2ω Die Schwingungsgleichung, wie wir sie in (11.1) vor uns haben, gibt uns noch zu einigen allgemeinen Bemerkungen Anlass. Wir haben bereits gesehen, dass der homogene Anteil der Differentialgleichung (11.1) das System an sich beschreibt und das inhomogene Glied die “äussere Anregung” (es heisst deshalb ja auch treffend “Störglied”). In unserem Modell wird das System durch eine homogene lineare Differentialgleichung mit konstanten Koeffizienten beschrieben. Der Leser hat sich vielleicht bereits gefragt, ob damit die reale Situation nicht allzu vereinfacht dargestellt wird. Zu dieser Frage wollen wir hier noch einige Worte sagen. Gehen wir zurück zur konkreten Situation eines Massenpunktes, welcher sich längs einer Gerade bewegt und auf den Kräfte wirken, welche von der Lage x(t) und von der Geschwingigkeit ẋ(t) des Massenpunktes abhängen. Die Totalkraft K ist dann also durch eine Funktion von x und ẋ gegeben. Das Newton’sche Gesetz liefert (11.11) mẍ = K(x, ẋ) . 98 U. Stammbach: Analysis, Teil C Wir denken uns ferner ein Koordinatensystem so eingeführt, dass x = 0 der Ruhelage des Massenpunktes entspricht. Dies hat die Konsequenz, dass K(0, 0) = 0. Im allgemeinen ist K eine schwer zu beschreibende, komplizierte Funktion, und man wird sich in konkreten Fällen immer mit Approximationen zufrieden geben müssen. Als einfachste solche Approximation drängt sich die lineare Ersatzfunktion auf: (11.12) K(x, ẋ) ∼ K(0, 0) + xKx (0, 0) + ẋKẋ (0, 0) . Diese ist bekanntlich in der Umgebung des Nullpunktes eine “gute” Approximation. Ersetzt man in der Differentialgleichung (11.11) die komplizierte Funktion K durch die lineare Ersatzfunktion (11.12) und beachtet man zusätzlich K(0, 0) = 0, so erhält man mit a = Kx (0, 0), b = Kẋ (0, 0) die Differentialgleichung (11.13) mẍ = ax + bẋ . Dies entspricht gerade unserer homogenen Schwingungsdifferentialgleichung. Jetzt ist es nicht mehr überraschend, dass die Differentialgleichung linear ist und dass a, b Konstanten sind: wir haben uns eben mit Absicht auf diesen einfachen Fall beschränkt. Es bleibt natürlich die Frage offen, wie gut die Lösungen der vereinfachten Differentialgleichung (11.13) die Lösungen der “richtigen” Differentialgleichung (11.11) wiedergeben. Diese Frage führt auf diffizile und sehr interessante mathematische Probleme, auf die wir hier nicht eingehen. Immerhin wollen wir folgendes festhalten. Wir wissen bereits, dass die Approximation von K durch die lineare Ersatzfunktion umso besser ist, je kleiner x und ẋ sind. Es ist deshalb plausibel und es kann auch mathematisch bewiesen werden, dass die Lösungen der vereinfachten Differentialgleichung (11.13) die Lösungen der ursprünglichen Differentialgleichung (11.11) umso besser wiedergeben, je kleiner x und ẋ sind. Die Folgerung, die der Anwender daraus ziehen muss, ist diese: Die Differentialgleichung (11.1) beschreibt zwar eine ideale gedämpfte Federschwingung eines Massenpunktes; die Differentialgleichung “gilt” aber für in einer Dimension schwingende Massenpunkte ganz allgemein, wenn nur die Auslenkung aus der Ruhelage und die Geschwindigkeit des Massenpunktes klein bleiben. Beispiel Um das eben Gesagte an einer bekannten Situation zu illustrieren, betrachten wir noch kurz das mathematische Pendel. Ein Massenpunkt der Masse m sei an einer gewichtslosen Faden der Länge l aufgehängt. Wir beschreiben die Lage des Massenpunktes mit Hilfe des Winkels ϕ. Dann gilt in der (einzig interessanten) Tangentialrichtung nach dem Newton’schen Gesetz mlϕ̈ = −mg sin ϕ . 99 Kapitel VII. Differentialgleichungen Für die Funktion t → ϕ(t) erhalten wir die Differentialgleichung g ϕ̈ = − sin ϕ . l (11.14) Wir vereinfachen nun gemäss dem oben Gesagtem die rechte Seite dieser Gleichung, indem wir ϕ → f (ϕ) = sin ϕ ersetzen durch die lineare Ersatzfunktion bezüglich ϕ = 0. (Man beachte, dass ϕ = 0 die Ruhelage beschreibt). Die lineare Ersatzfunktion ist gegeben durch ϕ → f (0) + f 0 (0)ϕ = sin(0) + cos(0)ϕ = ϕ . Damit erhalten wir statt der “komplizierten” Differentialgleichung (11.14) die “einfache” lineare Differentialgleichung (11.15) g ϕ̈ = − ϕ , l die üblicherweise als Differentialgleichung des mathematischen Pendels bekannt ist. Wir schliessen diesen Abschnitt über Schwingungsprobleme mit einigen Beispielen, die alle aus dem Tätigkeitsbereich von Ingenieuren stammen. Empfang von Radiowellen Im ersten Beispiel geht es um eine positive Anwendung des Resonanzphänomens und zwar um den Empfang von Radiowellen. Die verschiedenen Übertragungsfrequenzen der Sender führen am Empfangsort zu einem wirren Gemisch von Radiowellen, welches einer Überlagerung von harmonischen Schwingungen der elektrischen Feldstärke mit verschiedenen Frequenzen entspricht. Das Empfangsgerät hat die Aufgabe, aus diesem ganzen Spektrum, nur das Signal in der Frequenz des gewünschten Senders aufzunehmen und es anschliessend zu verstärken. Dieses Aussortieren geschieht mit Hilfe von Resonanz. Im wesentlichen benützt man dafür einen Stromkreis der oben betrachteten Art, der in Serie eine Kapazität, einen Ohm’schen Widerstand und eine Induktivität enthält. An die Klemmen wird die Antennenspannung angelegt. Diese variiert gemäss der Überlagerung aller einstrahlender Radiowellen. Man sorgt nun dafür, dass der Stromkreis schwach gedämpft ist – mit schmaler Resonanzkurve – und dass die Resonanzfrequenz gerade mit der Frequenz des gewünschten Senders übereinstimmt. Jeder Frequenzanteil des empfangenene Totalsignals erzeugt im Stromkreis einen entsprechenden Anteil des Gesamtstromes. Gemäss unseren Resultaten wird dabei die Resonanzfrequenz “bevorzugt” behandelt. Dies führt bei schmaler Resonanzkurve dazu, dass der Anteil des Stromes, der auf das Signal dieser Frequenz zurückzuführen ist, weit grösser ist als die von den anderen Frequenzen herrührenden 100 U. Stammbach: Analysis, Teil C Anteile. Das zur Resonanzfrequenz gehörende Signal ist damit gegenüber den Signalen der anderen Sender hervorgehoben worden. Es wird anschliessend mit Hilfe von Radioröhren oder Transistoren verstärkt. Turnhalle Das zweite Beispiel zeigt, dass Resonanzphänomene auch bei Bauwerken eine grosse Rolle spielen können. Dies ist deshalb etwas überraschend, weil Bauwerke im Normalfall nur auf die statische Beanspruchung ausgelegt werden. Möglicherweise auftretende dynamischen Effekte werden oft gar nicht berücksichtigt. – Es handelt sich um eine Turnhalle, die vor nicht vor nicht allzu langer Zeit in der Umgebung von Zürich gebaut worden ist. Der folgende Abschnitt stammt aus dem Sanierungsbericht von Professor H. Bachmann von der Abteilung für Bauingenieurwesen an der ETH-Zürich. “Bei einer doppelstöckigen Turnhalle traten bald nach der Inbetriebnahme starke Bauwerksschwingungen auf. Diese wurden dann beobachtet, wenn in der oberen Halle zu rhythmischer Musik moderne Konditionstrainigs, das heisst Lauf-, Hüpf- und Sprungübungen durchgeführt wurden. Die Schwingungen äusserten sich insbesondere in der unteren Halle durch sichtbare Durchbiegungen der Zwischendecke, durch horizontale Fassadenbewegungen und durch einen erheblichen Lärm. Dieser wurde hervorgerufen durch das Mitschwingen und Klappern der Eingangstüre und des Tores zum Geräteraum, sowie von an Decke, Fassaden und Wänden befestigten Ausstattungsteilen und Turngeräten. Ferner konnte bei geöffneter Eingangstüre ein starker rhythmischer Luftzug in Folge Kompression und Dekompression des Hallenvolumens verspürt werden. Dies Wirkungen führten dazu, dass immer wieder Personen die untere Halle verliessen, sobald in der oberen Halle Konditionstrainings durchgeführt wurden.” Zum Zwecke der Sanierung wurden an der Turnhalle Messungen durchgeführt, die zeigten, dass bei der Schwingung der Zwischendecke Beschleunigungen bis zur Hälfte der Erdbeschleunigung auftraten. Man hat ferner auch eine Rissaufnahme an den Trägern der Zwischendecke durchgeführt, und Risse festgestellt, die mehr als einen halben Millimeter Breite aufweisen. Der Grund für die Schwingungen ist ein Resonanzphänomen. Berechnungen zeigten, dass die Zwischendecke ein schwach gedämpftes, schwingungsfähiges System bildete, das durch das Hüpfen, Laufen und Springen der Turnenden in periodischer Weise angeregt wurde. Es ist nach unserer Theorie klar, dass in diesem System Resonanz auftreten wird, wenn die Hüpffrequenz mit der Resonanzfrequenz übereinstimmt. Das wusste natürlich auch der Bauingenieur, der diese Turnhalle gebaut hatte. Die Sachlage war hier aber etwas komplizierter. Es zeigte sich, dass die Resonanzfrequenz der Zwischendecke bei ungefähr 4.8 Hz lag, während bei Lauf- oder Hüpfübungen Frequenzen von 2.4 bis 2.5 Hz auftreten. Der Bauingenieur hatte gelernt, dass bei Anregungsfrequenzen unterhalb der Resonanzfrequenz keine Resonanz auftreten kann und er fühlte sich deshalb sicher. Die Sache ist nun aber die, dass diese Aussage nur für rein harmonische Anregungskräfte gilt. Die durch das Hüpfen oder Laufen von Turnenden auf den Zwischenboden ausgeübte Kraft ist aber nicht rein harmonisch, sondern besteht annäherungsweise aus periodisch auftretenden rechteckförmigen Stössen. Um Aussagen über das Resonanzverhalten zu machen, muss man diese Anregungskraft in eine Überlagerung von harmonischen Anteilen Kapitel VII. Differentialgleichungen 101 zerlegen. Das geschieht mit Hilfe der Fourier-Zerlegung. In dieser Zerlegung treten automatisch auch harmonische Anteile der doppelten Anregungsfrequenz, der dreifachen, usw. auf. Es ist natürlich die doppelte Anregungsfrequenz, die hier mit der Resonanzfrequenz der Zwischendecke übereinstimmte und zu den unangenehmen Erscheinungen führte. Die Turnhalle wurde saniert, indem die Zwischendecke versteift wurde. Damit erreichte man eine höhere Eigenfrequenz (zirka 8 Hz). Resonanzschwingungen waren damit zwar nicht völlig ausgeschlossen, aber ihre Auswirkungenen lagen innerhalb der zulässigen Grenzen. Webereigebäude Resonanzerscheinungen spielen bei Maschinen mit rotierenden und oszillierenden Teilen oft eine wichtige und unangenehme Rolle. Wir erwähnen hier den Fall eines Webereigebäudes1 . “Im unterkellerten Maschinensaal eines rund 20 Jahre alten Webereigebäudes traten nach einer Umrüstung auf moderne, schneller laufende Maschinen starke Schwingungen auf. Bei eingehenden Messungen wurden an der die Maschinen tragenden Decke vertikale Schwinggeschwindigkeiten von bis zu 24mm/s festgestellt [als Normwert gilt 10 mm/s!]. Auch die Maschinenschwingungen waren mit einer Schwingbreite (zweifache Amplitude) in horizontaler Richtung von 1.2 mm beträchtlich. Als zulässig wurde im vorliegenden Fall rund 1 mm erachtet. Höhere Werte wären zwar für die Maschinen gefahrlos gewesen, hingegen konnten sich bei feinen Geweben textiltechnische Probleme ergeben, da der Schusseintrag beeinträchtigt wurde.” Der Grund für die Bauwerksschwingungen war eine Resonanzerscheinung. Messungen ergaben als Grundfrequenz der Betondecke rund 21 Hz. “Die vor der Umrüstung vorhandenen Webmaschinen hatten Drehzahlen von rund 200 U/min, d.h. sie liefen mit rund 3.3 Hz. Die neuen Maschinen liefen, je nach zu fabrizierendem Gewebe, mit 240 bis 290 U/min, d.h. mit bis zu rund 4.8 Hz. Es war somit offensichtlich, dass die Deckenschwingungen vor allem durch obere Harmonische (4.,5.) des nicht näher bekannten zeitlichen Verlaufs der Last hervorgerufen wurden” [d.h. durch diejenigen harmonischen Anteile in der Fourier-Zerlegung der anregenden Schwingung, welche die vier bzw. fünffache Frequenz der Grundfrequenz aufweisen]. “Eine [sogenannte] Tiefabstimmung, d.h. eine Lagerung der Maschinen auf weichen Feder(Dämpfer-)Elementen, kam nicht in Frage. Wohl wären dadurch die Deckenschwingungen vermindert worden, doch hätten sich noch stärkere Maschinenschwingungen ergeben, was aus textiltechnischen Gründen nicht zulässig war. Deshalb wurde eine Deckenverstärkung [...] vorgenommen.” Das Ziel dieser Massnahme war, die Grundfrequenz der Decke soweit zu erhöhen, dass Resonanzerscheinungen in nur noch geringem Masse auftreten konnten. “Die Sanierungsmassnahmen waren erfolgreich. Wie erneute Messungen zeigten, wurde [...] der Richtwert der Schwinggeschwindigkeit von 10 mm/s praktisch nicht mehr überschritten. Die Maschinenschwingungen waren ebenfalls erheblich kleiner als vor der Sanierung, und es traten somit keine produktionstechnischen Probleme mehr auf.” 1 siehe H. Bachmann, W. Ammann: Schwingungsprobleme bei Bauwerken, 1987 102 12 U. Stammbach: Analysis, Teil C Systeme von Differentialgleichungen Wir wollen in den drei letzten Abschnitten dieses Kapitels Systeme von Differentialgleichungen 1. Ordnung betrachten. Dabei beschränken wir uns, vor allem um die Darstellung möglichst anschaulich zu halten, auf Systeme von zwei Differentialgleichungen. Die Übertragung auf grössere Systeme wird dem Leser keine Schwierigkeiten machen. Im vorliegenden Abschnitt stellen wir einige einfache Tatsachen zusammen, im nächsten Abschnitt beschäftigen wir uns eingehender mit linearen autonomen Systemen, und im übernächsten Abschnitt sprechen wir kurz über das Stabilitätsverhalten der Lösungen. Unter einem System von Differentialgleichungen 1. Ordnung für die Funktionen x → y1 (x), x → y2 (x) versteht man zwei Differentialgleichungen der Form (12.1) y10 = f1 (x, y1 , y2 ) y20 = f2 (x, y1 , y2 ) , wobei f1 , f2 Funktionen der drei Variabeln x, y1 , y2 sind. Eine Lösung des Systems (12.1) ist ein Paar von Funktionen x → y1 (x) , x → y2 (x), welche die beiden Gleichungen des Systems simultan erfüllen. Beispiel Es sei die Differentialgleichung zweiter Ordnung (12.2) y 00 = F (x, y, y 0 ) gegeben. Führen wir die neuen Funktionen x → y1 (x) = y(x) und x → y2 (x) = y 0 (x) ein, so erhalten wir ein System von Differentialgleichungen 1. Ordnung (12.3) y10 = y2 0 y2 = F (x, y1 , y2 ) . Es ist klar, dass jede Lösung der Differentialgleichung (12.2) Anlass gibt zu einer Lösung des Systems (12.3) und umgekehrt. Daraus folgt, dass man statt Differentialgleichungen höherer Ordnung auch Systeme von Differentialgleichungen 1. Ordnung betrachten kann. Wie für Differentialgleichungen höherer Ordnung gilt für Systeme ein Existenz- und Eindeutigkeitssatz: 103 Kapitel VII. Differentialgleichungen Satz 12.1 Es sei das System (12.1) von zwei Differentialgleichungen 1. Ordnung gegeben. Die Funktionen f1 , f2 seien stetig in x und stetig partiell nach y1 , y2 differenzierbar. Dann gibt es zu vorgegebenen x0 , y1,0 , y2,0 genau ein Paar von Funktionen x → y1 (x), x → y2 (x), welches Lösung des Systems (12.1) ist und den Anfangsbedingungen y1 (x0 ) = y1,0 , y2 (x0 ) = y2,0 genügt. Der Leser mache sich an dieser Stelle klar, dass aus Satz 12.1 der Satz 8.1 über Differentialgleichungen höherer Ordnung folgt. Das Differentialgleichungssystem (12.1) heisst autonom, falls die zu den gesuchten Funktionen y1 , y2 gehörige Variable x nicht explizit auftritt. Beispiel Die Differentialgleichung für die Ortsfunktion t → x(t) eines eindimensionalen gedämpften Oszillators lautet (siehe Abschnitt 11) ẍ + 2λẋ + ω 2 x = 0 . Dieser Differentialgleichung 2. Ordnung entspricht das folgende System von zwei Differentialgleichungen 1. Ordnung für die Funktionen t → x(t), t → v(t) = ẋ(t) (12.4) ẋ = v v̇ = −2λv − ω 2 x . Die zu den gesuchten Funktionen x und v gehörige Variable ist hier die Zeit und heisst dementsprechend t. Sie kommt im Differentialgleichungssystem (12.4) nicht explizit vor; das System (12.4) ist autonom. Im Folgenden wollen wir nur autonome Systeme betrachten. Aus Gründen der Anschaulichkeit, die gleich deutlicher werden, ist es dann angebracht, dem obigen Beispiel folgend die Variable der gesuchten Funktion mit t zu bezeichnen. Ausserdem wollen wir in diesem Abschnitt die beiden gesuchten Funktionen t → x(t) und t → y(t) nennen. Unser autonomes System lässt sich somit in der folgenden Form schreiben: (12.5) ẋ = f1 (x, y) ẏ = f2 (x, y) . Es liegt nahe, die in der (x, y)-Ebene definierten Funktionen f1 : (x, y) → f1 (x, y), f2 : (x, y) → f2 (x, y) als Komponenten eines zweidimensionalen Vektorfeldes ~v : (x, y) → ~v (x, y) zu interpretieren: ~v (x, y) = (f1 (x, y), f2 (x, y)) . 104 U. Stammbach: Analysis, Teil C Eine Lösung des Differentialgleichungssystems (12.5) kann dann als Parameterdarstellung t → (x(t), y(t)) einer Feldlinie des Vektorfeldes ~v aufgefasst werden. In der Tat besagt ja (12.5), dass der Tangentialvektor (ẋ(t), ẏ(t)) der Kurve t → (x(t), y(t)) gerade mit dem Feldvektor in (x, y) übereinstimmt. Fasst man – etwas konkreter – t als Zeit und das Vektorfeld ~v als (stationäres!) Strömungsfeld in der Ebene auf, so beschreibt t → (x(t), y(t)) die Bewegung eines Teilchens im Strömungsfeld, und der Vektor (ẋ(t), ẏ(t)) ist der Geschwindigkeitsvektor dieses Teilchens. Aus unserem Existenz- und Eindeutigkeitssatz (Satz 12.1) folgt, dass durch jeden Punkt (x0 , y0 ) eine eindeutig bestimmte Kurve K geht, die durch die Lösung des Systems (12.5) mit den Anfangsbedingungen x(t0 ) = x0 , y(t0 ) = y0 beschrieben wird. Diese Kurve, versehen mit ihrer Durchlaufrichtung(!), heisst die durch (x0 , y0 ) verlaufende Trajektorie; die Schar der Trajektorien nennt man das Phasenporträt des Systems. Die Eindeutigkeitsaussage liefert unmittelbar, dass sich zwei Trajektorien nicht schneiden können, es sei denn, sie fallen in ihrem ganzen Verlauf zusammen. Das Phasenporträt eines autonomen Differentialgleichungssystems enthält wichtige Informationen über die Lösungen; insbesondere kann an ihm das Stabilitätsverhalten der Lösungen abgelesen werden (siehe Abschnitt 14). Dies ist deshalb eine wichtige Bemerkung, weil es im allgemeinen sehr viel leichter ist, das Phasenporträt eines System zu berechnen, als das System selbst vollständig zu lösen. Wir versuchen dies am folgenden Beispiel zu illustrieren. Beispiel Wir betrachten das Räuber-Beute-Modell von Lotka-Volterra (A.J. Lotka 1880-1949; V. Volterra 1860-1940). Hier beschreibt t → x(t) die Grösse einer Räuberpopulation, die sich von einer einzigen Beuteart ernährt, und t → y(t) die Grösse der Beutepopulation. Das LotkaVolterra-Modell besagt, dass die beiden Populationsgrössen dem Differentialgleichungssystem (12.6) ẋ = −a1 x + b1 xy ẏ = a2 y − b2 xy genügen. Dabei sind a1 , a2 , b1 , b2 positive reelle Zahlen. (Wir verzichten hier auf eine Begründung für die Form dieser Differentialgleichungen, denn wir sind ja vor allem an der Mathematik interessiert.) Man kann zeigen, dass sich die Lösungen dieses Systems nicht durch elementare Funktionen ausdrücken lassen. Hingegen ist das Phasenporträt relativ leicht zu berechnen. Dieses besteht aus den Feldlinien des Vektorfeldes ~v : (x, y) → ~v (x, y) = (−a1 x + b1 xy, a2 y − b2 xy) (versehen mit dem entsprechenden Durchlaufsinn). Beschreibt man die Feldlinien als Graphen der Funktion x → y(x), so lassen sie sich als Lösungen der Differentialgleichung (12.7) y0 = a2 y − b2 xy −a1 x + b1 xy bestimmen. Diese Differentialgleichung ist separierbar und ist deshalb leicht lösbar. Wir erhalten der Reihe nach 105 Kapitel VII. Differentialgleichungen dy dx y (a2 − b2 x) x (b1 y − a1 ) b1 y − a1 a2 − b2 x dy = dx y x b1 y − a1 log |y| = a2 log |x| − b2 x + C a2 eb1 y C |x| = e |y|a1 eb2 x |x|a2 |y|a1 · = A, eb2 x eb1 y = wobei wir A = 1/eC gesetzt haben. Das Phasenporträt des Systems (12.6) besteht folglich aus den Niveaulinien der Funktion (x, y) → xa2 y a1 · eb2 x eb1 y Fig. 1 : Das Phasenporträt der Lotka-Volterra-Gleichungen (versehen mit dem einfach zu bestimmenden Durchlaufsinn). Mit etwas Mühe lassen sich die Niveaulinien diskutieren. Das wollen wir im einzelnen hier nicht durchführen, sondern uns 106 U. Stammbach: Analysis, Teil C einfach das Bild ansehen. Wir lesen daraus sofort eine ganze Menge über die Lösungen des Systems (12.6) ab. Ist die Beutepopulation y(t) gross, so wird die Räuberpopulation x(t) gute Bedingungen vorfinden und sich vergrösseren. Damit wächst der Druck auf die Beutepopulation, so dass diese schliesslich abnimmt. Mit der Zeit wird die Beutepopulation zu klein, um die Räuberpopulation zu erhalten, so dass diese ihrerseits unter Druck gerät und abnimmt. Dies gibt aber der Beutepopulation eine Überlebenschance, so dass diese wieder zunimmt, und nach einiger Zeit auch zu einer Vergrösserung der Räuberpopulation führt, etc. Offenbar ergibt sich aus diesem Modell ein periodisches wechselweises Anwachsen und Abnehmen der Räuber- bzw. Beutepopulation. Mehr als die Frage, ob dieses Modell die Wirklichkeit in vernünftiger Weise beschreibt, interessiert uns hier die Tatsache, dass wir aus dem Phasenporträt eine Menge von qualitativen Informationen über die Lösungen des Systems herleiten konnten. Die Lösungen des Differentialgleichungssystems selbst haben wir dazu gar nicht benötigt. Schliesslich wollen wir noch auf Folgendes aufmerksam machen. In unserem Beispiel ist die Trajektorie durch den Punkt (x0 , y0 ) = (a2 /b2 , a1 /b1 ) ausgeartet: sie besteht nur aus diesem einen Punkt. In der Tat bilden die konstanten Funktionen t → x(t) = a2 /b2 , t → y(t) = a1 /b1 eine Lösung des Systems. In diesem Fall sind Räuber- und Beutepopulation im Gleichgewicht. Dies legt die folgende allgemeine Definition nahe. Ein Punkt (x0 , y0 ) der (x, y)-Ebene mit der Eigenschaft, dass t → x(t) = x0 und t → y(t) = y0 eine Lösung des Systems bilden, heisst Gleichgewichtspunkt. Die Kenntnis der Gleichgewichtspunkte eines autonomen Systems, sowie das Phasenporträt in der Umgebung dieser Punkte erlauben sehr oft, weitgehende Aussagen über das Verhalten der Lösungen des Systems. Darauf gehen wir in Abschnitt 14 noch etwas näher ein. 107 Kapitel VII. Differentialgleichungen 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten In diesem Abschnitt betrachten wir lineare autonome Differentialgleichungssysteme 1. Ordnung mit konstanten Koeffizienten. Im hier einzig zu behandelnden Fall von zwei Gleichungen sind dies Systeme, die sich in der Form ẋ1 = a11 x1 + a12 x2 + b1 ẋ2 = a21 x1 + a22 x2 + b2 (13.1) schreiben lassen. Dabei sind die Koeffizienten aik , bi ; i = 1, 2, k = 1, 2 reelle Zahlen, also insbesondere unabhängig von t. Wir haben hier eine Bezeichnungsweise gewählt, die von der linearen Algebra her nahegelegt wird. Setzen wir " ~x(t) = x1 (t) x2 (t) # " , ~x˙ (t) = ẋ1 (t) ẋ2 (t) # " , A= a11 a21 a12 a22 # " , ~b = b1 b2 # , so schreibt sich das System (13.1) in der einfachen Form ~x˙ = A~x + ~b . Man beachte, dass aus einem System der Form (12.5) ein System der Form (13.1) entsteht, wenn man die auf der rechten Seite stehenden Funktionen linearisiert. Diese Tatsache allein liefert sicherlich genügend Motivation, sich mit linearen Systemen mit konstanten Koeffizienten eingehender zu beschäftigen. Es gibt im wesentlichen zwei Techniken, Systeme der Form (13.1) zu behandeln. Die eine Art verwendet Methoden der linearen Algebra, um die Matrix A in einem ersten Schritt auf eine einfache Form zu bringen, wenn möglich auf Diagonalform. Die zweite Art führt das System (13.1) auf eine Differentialgleichung 2. Ordnung zurück. Beide Lösungsarten wollen wir an Hand von Beispielen kurz kennenlernen, wobei wir der Einfachheit halber Beispiele wählen, bei denen ~b trivial ist (“homogener Fall”). Beispiel Es sei das System ẋ1 = x1 + 2x2 ẋ2 = 2x1 + x2 gegeben. Wir stellen als erstes fest, dass die Matrix A des Systems 108 U. Stammbach: Analysis, Teil C " A= 1 2 2 1 # symmetrisch ist. Von der linearen Algebra her wissen wir, dass sich symmetrische Matrizen leicht auf Diagonalgestalt bringen lassen, indem man ihre Eigenwerte und Eigenvektoren berechnet. Für die Matrix A erhält man die Eigenwerte α1 = −1 und α2 = 3 sowie die zugehörigen (orthonormierten und deshalb linear unabhängigen) Eigenvektoren # √ " √ " # 2 2 1 1 , . −1 1 2 2 (Im Falle einer symmetrischen Matrix gibt es bekanntlich immer eine Basis von orthonormierten Eigenvektoren!) Wir führen nun, entsprechend den Eigenvektoren die neuen Funktionen √ 2 (x1 (t) − x2 (t)) 2 √ 2 t → y2 (t) = (x1 (t) + x2 (t)) 2 t → y1 (t) = (13.2) ein. (Im Fall einer symmetrischen Matrix A tritt hier einfach die Matrix auf, deren Zeilen aus den normierten Eigenvektoren gebildet werden; im Fall einer nichtsymmetrischen Matrix A müssen die Funktionen y1 , y2 auf etwas kompliziertere Weise gebildet werden.) Eine kleine Rechnung zeigt, dass die Funktionen y1 , y2 dem Differentialgleichungssystem (13.3) ẏ1 = −y1 ẏ2 = 3y2 genügen, dessen Matrix Diagonalform hat; in der Diagonalen stehen daher die Eigenwerte α1 , α2 der Matrix A. Die Gleichungen des Differentialgleichungssystems (13.3) sind “entkoppelt”; ihre Lösungen lassen sich sofort hinschreiben t → y1 (t) = C1 e−t , t → y2 (t) = C2 e3t . Mit Hilfe von (13.2) lassen sich dann die ursprünglich gesuchten Funktionen x1 , x2 angeben: t → x1 (t) = D1 e−t + D2 e3t , t → x2 (t) = −D1 e−t + D2 e3t , 109 Kapitel VII. Differentialgleichungen √ 2 2 C1 , D2 wobei hier der Einfachheit halber D1 = = √ 2 2 C2 gesetzt haben. Fassen wir zusammen: Man benützt in dieser Lösungsart Methoden der linearen Algebra, um das ursprüngliche System auf eine möglichst einfache Form zu bringen. Das geschieht, indem man Eigenwerte und Eigenvektoren der Matrix A berechnet und entsprechend neue Funktionen einführt. Das vereinfachte, neue System lässt sich dann leichter lösen. Im letzten Schritt geht man zu den ursprünglich gesuchten Funktionen zurück. Die zweite Lösungsart illustrieren wir mit dem folgenden Beispiel. Beispiel Es sei das System (13.4) ẋ1 = 5x1 + x2 ẋ2 = −4x1 + x2 gegeben. (Wir bemerken, dass für dieses System die erste Methode nicht ohne weiteres zum Ziel führt, da die Matrix A, " A= 5 1 −4 1 # keine zwei linear unabhängige Eigenvektoren besitzt.) Wir führen das System (13.4) auf eine Differentialgleichung 2. Ordnung zurück, indem wir eine der unbekannten Funktionen eliminieren. Aus der ersten Gleichung erhalten wir (13.5) x2 = ẋ1 − 5x1 . Einsetzen in die zweite Gleichung liefert (13.6) ẋ2 = −4x1 + ẋ1 − 5x1 . Andererseits ergibt die Ableitung von (13.5) (13.7) ẋ2 = ẍ1 − 5ẋ1 . Aus (13.6) und (13.7) erhalten wir dann (13.8) ẍ1 − 6ẋ1 + 9x1 = 0 . Dies ist eine lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten. Ihr charakteristisches Polynom lautet α → α2 − 6α + 9 = (α − 3)(α − 3) , 110 U. Stammbach: Analysis, Teil C so dass die allgemeine Lösung von (13.8) durch t → x1 (t) = C1 e3t + C2 te3t gegeben ist. Aus (13.5) ergibt sich dann t → x2 (t) = (−2C1 + C2 )e3t − 2C2 te3t . Die allgemeine Lösung des Systems (13.4) lässt sich somit in Vektorform " x1 (t) x2 (t) # " = C1 1 −2 # " 3t e + C2 t 1 − 2t # e3t schreiben. Wir beschliessen diesen Abschnitt mit dem folgenden Beispiel aus der Physik, das ein Differentialgleichungssystem mit mehr als zwei Differentialgleichungen 1. Ordnung involviert. Beispiel Es seien zwei identische mathematische Pendel der Masse m und der Länge l gegeben. Sie sollen durch eine in der Ruhelage nicht beanspruchten Feder mit Federkonstante k verbunden sein. l Fig. 1 : Gekoppelte Pendel l m m x y 111 Kapitel VII. Differentialgleichungen Wir beschreiben durch t → x(t) die Auslenkung aus der Ruhelage des linken und durch t → y(t) die Auslenkung aus der Ruhelage des rechten Pendels. Von Anfang an beschränken wir uns ausserdem auf die linearisierte Theorie. Das Newton’sche Gesetz liefert sofort die beiden Differentialgleichungen mg x − k(x − y) l mg mÿ = − y − k(y − x) . l mẍ = − Dabei bezeichnet g wie üblich die Erdbeschleunigung. Setzen wir – um die Rechnung zu vereinfachen – (13.9) a = g k , b = , l m so erhalten wir das lineare Differentialgleichungssystem (13.10) ẍ = −(a + b)x + by ÿ = bx − (a + b)y . Zwar handelt es sich hier um ein Differentialgleichungssystem, in dem zweite Ableitungen auftreten. Führt man aber als neue unbekannte Funktionen die ersten Ableitungen ẋ, ẏ ein, so erhält man unmittelbar ein lineares autonomes System von vier Differentialgleichungen für vier unbekannte Funktionen. Zu dessen Lösung stehen uns die beiden oben beschriebenen Wege zur Verfügung. Wir beschreiten hier den zweiten, der darin besteht, dass wir durch Elimination der einen Funktion eine Differentialgleichung 4. Ordnung für die andere Funktion gewinnen. Dabei können wir natürlich direkt vom System (13.10) ausgehen und brauchen nicht zuerst zu einem System erster Ordnung überzugehen. Wir lösen zuerst die erste Gleichung nach y auf (13.11) y = ẍ a + b + x. b b Ableiten nach t liefert .... (13.12) ÿ = x a+b + ẍ . b b Andererseits liefert die zweite Gleichung des Systems mit (13.11) 112 (13.13) U. Stammbach: Analysis, Teil C ÿ = bx − a+b (a + b)2 ẍ − x. b b Aus (13.12) und (13.13) erhalten wir (13.14) .... x +2(a + b)ẍ + (a2 + 2ab)x = 0 . Dies ist eine lineare homogene Differentialgleichung mit konstanten Koeffizienten. Das zugehörige charakteristische Polynom lautet α → α4 + 2(a + b)α2 + (a2 + 2ab) . Es hat vier verschiedene, rein imaginäre Nullstellen α1,2 = (13.15) √ ± −a q =: ±iω , α3,4 = ± −(a + 2b) =: ±iσ . Daraus ergibt sich für die allgemeine Lösung von (13.14), x(t) = C1 cos(ωt) + C2 sin(ωt) + C3 cos(σt) + C4 sin(σt) . Die Gleichung (13.11) liefert die zugehörige Funktion t → y(t) y(t) = C1 cos(ωt) + C2 sin(ωt) − C3 cos(σt) − C4 sin(σt) . Betrachten wir zum Schluss noch die Anfangsbedingung x(0) = x0 , ẋ(0) = 0, y(0) = 0, ẏ(0) = 0 , so erhalten wir für die Konstanten C1 , C2 , C3 , C4 das Gleichungssystem C1 + C 3 ωC2 + σC4 C1 − C3 ωC2 − σC4 = x0 = 0 = 0 = 0 . 113 Kapitel VII. Differentialgleichungen Dieses liefert sofort C1 = C3 = x0 /2, C2 = C4 = 0. Die zugehörige Lösung des Systems (13.10) lautet also x(t) = x0 (cos(ωt) + cos(σt)) , 2 y(t) = x0 (cos(ωt) − cos(σt)) . 2 (13.16) Dabei sind die Kreisfrequenzen ω und σ nach (13.15) und (13.9) gegeben durch g l g k σ 2 = a + 2b = + 2 l m ω2 = (13.17) a = , . Schliesslich können wir die Formeln von (13.16) mit Hilfe goniometrischer Identitäten in der folgenden Form schreiben σ−ω x(t) = x0 cos t 2 σ−ω y(t) = x0 sin t 2 σ+ω cos t 2 σ+ω sin t 2 . Ist nun k/m verglichen mit g/l klein (“schwache Kopplung”), so ist wegen (13.17) die Differenz σ−ω σ −ω ebenfalls klein. Dies bedeutet, dass sich der Faktor cos( σ−ω 2 t) bzw. sin( 2 t) nur langsam ändert. Die Funktionen t → x(t), t → y(t) können deshalb als Schwingungen mit Kreisfrequenz (σ + ω)/2 und variabler Amplitude angesehen werden. Die Amplituden sind durch x0 cos σ−ω t 2 bzw. x0 sin σ−ω t 2 gegeben. Dies beschreibt den “Schwebungscharakter” der Lösung (13.16): die Energie geht periodisch von einem Pendel auf das andere Pendel über. 114 U. Stammbach: Analysis, Teil C (x) Fig. 2 : Die Auslenkung des linken Pendels (t) (y) Fig. 3 : Die Auslenkung des rechten Pendels (t) 115 Kapitel VII. Differentialgleichungen 14 Stabilitätsverhalten In diesem Abschnitt diskutieren wir das Stabilitätsverhalten der Lösungen eines autonomen Differentialgleichungssystems. Dabei beschränken wir uns auf lineare Differentialgleichungssysteme mit konstanten Koeffizienten, weil in diesem Fall die Behandlung recht einfach ist, andererseits aber doch die wesentlichen Punkte illustriert werden können. Es sei ~x˙ = A~x (14.1) ein lineares autonomes Differentialgleichungssystem mit konstanten Koeffizienten mit " ~x(t) = x1 (t) x2 (t) # " , ~x˙ (t) = ẋ1 (t) ẋ2 (t) # " , A= a11 a12 a21 a22 # . Ein solches System (14.1) besitzt offensichtlich den Gleichgewichtspunkt (0, 0). Es geht in diesem Abschnitt um die “Stabilität” dieses Gleichgewichtspunktes, d.h. um das Verhalten der Lösungen in der Nähe dieses Punktes. Zu diesem Zweck lösen wir das System (14.1), in dem wir es auf eine Differentialgleichung zweiter Ordnung zurückführen. Wir erhalten durch Elimination von x2 leicht (14.2) ẍ1 − (a11 + a22 )ẋ1 + (a11 a22 − a12 a21 )x1 = 0 . Auf analoge Weise erhält man durch Elimination von x1 eine Differentialgleichung für x2 . Die allgemeine Lösung von (14.2) hängt von den Nullstellen α1 , α2 des zugehörigen charakteristischen Polynoms, d.h. von den Lösungen der Gleichung (14.3) α2 − (a11 + a22 )α + (a11 a22 − a12 a21 ) = 0 ab. Der Leser stellt natürlich sofort fest, dass das charakteristische Polynom der Differentialgleichung (14.2) nichts anderes ist als das charakteristische Polynom der Matrix A im Sinne der linearen Algebra. Daraus folgt unter anderem, dass die aus dem System (14.1) gewonnenen Differentialgleichungen zweiter Ordnung für x1 und x2 beide zum gleichen charakteristischen Polynom und deshalb im wesentlichen auch zu denselben Lösungsfunktionen führen. Diese sind nur abhängig von den Eigenwerten der Matrix A. Insbesondere wird das Stabilitätsverhalten des Gleichgewichtspunktes (0, 0) von diesen Eigenwerten bestimmt. Es gilt nun, die verschiedenen Fälle zu diskutieren. 116 U. Stammbach: Analysis, Teil C 1. α1 ≤ α2 < 0 . In diesem Fall sind die Funktionen x1 und x2 beide von der Form C1 eα1 t + C2 eα2 t bzw. C1 eα1 t + C2 teα2 t . Sie nehmen deshalb mit zunehmendem t exponentiell ab. Sämtliche Trajektorien laufen mit wachsendem t asymptotisch in den Nullpunkt hinein. Der Gleichgewichtspunkt heisst in diesem Fall asymptotisch stabil. Beispiel Das zum gedämpften harmonischen Oszillator gehörige System ẋ1 = x2 ẋ2 = −ω 2 x1 − 2λx2 liefert im Fall starker Dämpfung λ ≥ ω ein Beispiel für diesem Fall. Die Eigenwerte sind beide negativ. Das Phasenporträt lässt sich leicht berechnen (siehe Figur 1). 2. α1 < 0 < α2 . Die Funktionen x1 und x2 setzen sich in diesem Fall aus einem exponentiell zunehmenden und einem exponentiell abnehmenden Anteil zusammen. Jede Trajektorie “flieht” den Nullpunkt und läuft mit zunehmendem t ins Unendliche. Der Gleichgewichtspunkt ist instabil. Beispiel Das Differentialgleichungssystem ẋ1 = x2 ẋ2 = 2x1 , (das zwei Populationen beschreibt, die in Symbiose leben) ist von dieser Art. Die Eigenwerte sind reell und haben verschiedenes Vorzeichen. Das Phasenporträt zeigt im Nullpunkt einen “Sattel” (siehe Figur 3). 3. 0 < α1 ≤ α2 . Die Funktionen x1 und x2 nehmen mit wachsendem t exponentiell zu; die Trajektorien “fliehen” deshalb den Nullpunkt. Dieser ist instabil. Beispiel ẋ1 = x1 ẋ2 = x1 + x2 . Hier hat man einen zweifachen positiven Eigenwert. Das Phasenporträt zeigt aus dem Nullpunkt herauslaufende Trajektorien (siehe Figur 2). 117 Kapitel VII. Differentialgleichungen (y) (x) Fig. 1 : Phasenporträt für zwei verschiedene Eigenwerte mit gleichem Vorzeichen. Für positives Vorzeichen laufen die Trajektorien vom Nullpunkt weg, für negatives Vorzeichen laufen sie in den Nullpunkt hinein. (y) (x) Fig. 2 : Phasenporträt für einen doppelten Eigenwert (Beispiel unter Punkt 3). Für positives Vorzeichen laufen die Trajektorien vom Nullpunkt weg, für negatives Vorzeichen laufen sie in den Nullpunkt hinein. 118 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Phasenporträt für Eigenwerte mit verschiedenen Vorzeichen (Beispiel unter Punkt 2). (x) 4. α1 , α2 konjugiert komplex. Dieser Fall spaltet in drei Unterfälle auf. 4.1. α1 , α2 konjugiert komplex, rein imaginär, α1 = ib, α2 = −ib . Die Funktionen x1 und x2 sind in diesem Fall harmonische Schwingungen mit Kreisfrequenz b C1 cos(bt) + C2 sin(bt) . Dies führt im Phasenporträt zu periodisch durchlaufenen Trajektorien “um den Gleichgewichtspunkt herum”. Insbesondere sind die Trajektorien beschränkt. Der Gleichgewichtspunkt ist stabil (aber nicht asymptotisch stabil). Beispiel Der ungedämpfte harmonische Oszillator liefert ein Beispiel für diesen Fall: ẋ1 = ẋ2 = −ω 2 x1 x2 . Das Phasenporträt zeigt Ellipsen um den Ursprung herum, die im Uhrzeigersinn durchlaufen werden (siehe Figur 4). 4.2. α1 , α2 konjugiert komplex mit positivem Realteil, α1 = a + ib , α2 = a − ib , a > 0 . Die Funktionen x1 und x2 haben die Form 119 Kapitel VII. Differentialgleichungen (y) (x) Fig. 4 : Phasenporträt für rein imaginäre Eigenwerte (Beispiel unter Punkt 4.1). (y) (x) Fig. 5 : Phasenporträt für komplexe Eigenwerte mit nichttrivialem Realteil. Ist der Realteil positiv (siehe Punkt 4.2) so laufen die Trajektorien vom Nullpunkt weg, ist der Realteil negativ (siehe Punkt 4.3) so laufen die Trajektorien in den Nullpunkt hinein. 120 U. Stammbach: Analysis, Teil C eat (C1 cos(bt) + C2 sin(bt)) , a > 0. Dies führt zu Exponentialspiralen als Trajektorien, die wegen a > 0 nach aussen, vom Nullpunkt weg durchlaufen werden. Der Gleichgewichtspunkt ist instabil (“instabiler Strudelpunkt”). Beispiel ẋ1 = x1 − x2 ẋ2 = x1 + x2 . Die Eigenwerte sind α1 = 1 + i , α2 = 1 − i . 4.3. α1 , α2 konjugiert komplex mit negativem Realteil, α1 = a+ib , α2 = a−ib , a < 0 . Die Funktionen x1 und x2 haben die Form eat (C1 cos(bt) + C2 sin(bt)) , a < 0 . Dies führt im Phasenporträt zu Exponentialspiralen, die nach innen durchlaufen werden. Der Gleichgewichtspunkt ist asymptotisch stabil (“stabiler Strudelpunkt”). Beispiel Der schwach gedämpfte harmonische Oszillator, λ < ω ẋ1 = x2 ẋ2 = −ω 2 x1 − 2λx2 liefert ein Beispiel für diesen Fall. Das Phasenporträt zeigt im Ursprung einen stabilen Strudelpunkt. Die Fälle, wo einer oder beide der Eigenwerte α1 , α2 Null sind, heissen ausgeartet und spielen eine kleinere Rolle. Natürlich können sie aber in diesem Zusammenhang ebenfalls diskutiert werden. Wir überlassen die Details dem Leser. Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel VIII. Potenzreihen lue wo schteisch und wo geisch süsch weisch wenn gheisch nid wo ligsch Ernst Burren Inhaltsverzeichnis 1 Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . 3 2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3 Kapitel IX. Potenzreihen 1 Zu Konvergenz und Divergenz von Reihen Die (unendliche) Reihe (1.1) ∞ X ak = a0 + a1 + a2 + · · · , a0 , a1 , a2 , . . . ∈ R , k=0 besitzt die Glieder a0 , a1 , a2 , . . . und die Partialsummen s0 , s1 , s2 , . . ., s0 = a0 s1 = a0 + a1 s2 = a0 + a1 + a2 .. . sn = a0 + a1 + a2 + · · · + an . Konvergiert die Folge s0 , s1 , s2 , . . . der Partialsummen gegen s, so heisst die Reihe (1.1) konvergent, und s heisst deren Summe. Dann schreiben wir ∞ X ak = s . k=0 Divergiert die Folge der Partialsummen, so heisst die Reihe (1.1) divergent. Beispiel Die geometrische Reihe mit Faktor x, 1 + x + x 2 + x3 + · · · , besitzt die Glieder ak = xk , k = 0, 1, 2, . . . . Sie konvergiert für |x| < 1 (siehe Kapitel I, Abschnitt 1). In diesem Fall ist ihre Summe gegeben durch 1 + x + x 2 + x3 + · · · = 1 . 1−x Für |x| ≥ 1 divergiert die geometrische Reihe. Im Bereich der Konvergenz, d.h. im Intervall (−1, +1) definiert die geometrische Reihe eine Funktion, nämlich x → 1/(1 − x) (siehe Kapitel I, Abschnitt 1). 4 U. Stammbach: Analysis, Teil C Beispiel Für |x| < 1 gilt offenbar 1 1 = = 1 − x + x 2 − x3 + · · · . 1+x 1 − (−x) Beispiel Für |x| < 1 gilt offenbar 1 1 = = 1 − x 2 + x4 − x6 + · · · . 1 + x2 1 − (−x2 ) Beispiel Die sogenannte harmonische Reihe 1+ 1 1 1 + + + ··· 2 3 4 divergiert (siehe Kapitel I, Abschnitt 1). 0.9 0.8 Fig. 1 : Die Partialsummen der alternierenden harmonischen Reihe 0.7 0.6 0.5 10 20 30 40 50 Beispiel Die sogenannte alternierende harmonische Reihe (siehe Figur 1) 1− 1 1 1 + − + ··· 2 3 4 5 Kapitel IX. Potenzreihen konvergiert. Um dies einzusehen, bemerken wir zuerst das Folgende. Wegen sn = 1 − 1 1 1 1 + − · · · + (−1)n = sn−1 + (−1)n 2 3 n+1 n+1 gilt sn − sn−1 = (−1)n 1 . n+1 Tragen wir die Werte der Partialsummen als Punkte auf der Zahlgeraden ab, so ist der Schritt von sn−1 zu sn wegen dem Vorzeichen alternierend einmal nach links und dann nach rechts zu tun. Ausserdem strebt die Schrittlänge mit zunehmendem n gegen Null. Die Folge der Partialsummen der alternierenden harmonischen Reihen konvergiert deshalb, und zwar liegt offenbar der Limes s für jedes n zwischen sn−1 und sn . Wie gross dieses s ist, lässt sich numerisch angenähert bestimmen; allerdings konvergiert die alternierende harmonische Reihe sehr langsam. Wir werden weiter unten diese Summe auf überraschende Weise, d.h. nicht “nur” numerisch beschreiben können. Wir entnehmen diesen wenigen Beispielen sofort die zwei folgenden allgemeinen Erkenntnisse. Satz Konvergiert die Reihe P∞ k=0 ak = a0 + a1 + a2 + · · · (gegen s ), so gilt limk→∞ ak = 0 . In der Tat gilt ja sn − sn−1 = an und ein Grenzübergang n → ∞ liefert lim an = lim sn − lim sn−1 = s − s = 0 . n→∞ n→∞ n→∞ Die harmonische Reihe zeigt, dass aus |an | < |an−1 | für alle n und lim an = 0 n→∞ nicht notwendigerweise folgt, dass die Reihe konvergiert. Die Überlegung, die wir im Falle der alternierenden harmonischen Reihe angestellt haben, liefert aber das folgende nützliche Resultat. P Satz Die Reihe ∞ k=0 ak = a0 + a1 + a2 + · · · sei alternierend (die Vorzeichen wechseln ab). Gilt ausserdem |an | < |an−1 | für alle n ≥ 1 und limn→∞ an = 0 , so konvergiert die Reihe. 6 2 U. Stammbach: Analysis, Teil C Potenzreihen Unter einer Potenzreihe verstehen wir eine Reihe der Form (2.1) ∞ X ak xk = a0 + a1 x + a2 x2 + · · · , k=0 wobei wir nur den Fall betrachten, wo die Koeffizienten a0 , a1 , a2 , . . . reelle Zahlen sind. Die Menge der x-Werte, für die die Potenzreihe (2.1) konvergiert, heisst ihr Konvergenzbereich. Im Konvergenzbereich definiert eine Potenzreihe eine Funktion, deren Werte sich mit beliebiger Genauigkeit numerisch bestimmen lassen. Beispiel Die geometrische Reihe 1 + x + x 2 + x3 + · · · ist eine Potenzreihe mit ak = 1 für k = 0, 1, 2, . . .. Ihr Konvergenzbereich ist das Intervall (−1, +1). In diesem Intervall liefert die geometrische Reihe eine andere Beschreibung für die Funktion x → 1/(1 − x). Nicht immer lässt sich die Summe einer Potenzreihe auf so einfache Weise angeben. Dazu trägt nicht nur die uns schon bekannte allgemeine Schwierigkeit bei, die Summe einer Reihe zu bestimmen, sondern es ist oft so, dass konvergierende Potenzreihen Funktionen beschreiben, die sich mit den sonst üblichen, elementaren Funktionszeichen nicht ausdrücken lassen. Beispiele dazu werden wir weiter unten explizit kennenlernen. Über den Konvergenzbereich einer Potenzreihe kennt der Mathematiker einen einfachen schönen Satz, den wir hier ohne Beweis aufführen (siehe Figur 1). Satz Der Konvergenzbereich einer Potenzreihe ∞ X ak xk = a0 + a1 x + a2 x2 + · · · k=0 ist ein offenes, halboffenes oder abgeschlossenes Intervall mit 0 als Mittelpunkt. Man nennt die halbe Länge des Konvergenzintervalles auch etwa Konvergenzradius. Über das Konvergenz- bzw. Divergenzverhalten in den Endpunkten des Konvergenzintervalles lassen sich keine allgemeinen Aussagen machen: Alle überhaupt möglichen Fälle treten bei konkreten Potenzreihen auch wirklich auf. 7 Kapitel IX. Potenzreihen Konvergenz oder Divergenz Divergenz Konvergenz oder Divergenz Konvergenz Fig. 1 : Der Konvergenzbereich einer Potenzreihe ist ein offenes, halboffenes oder abgeschlossenes Intervall. Divergenz (x) Konvergenzbereich Wichtig ist nun, dass sich Potenzreihen im Innern ihres Konvergenzintervalles harmlos verhalten. Es gilt der folgende zentrale und bequeme(!) Satz, den wir hier ebenfalls ohne Beweis aufführen. Satz Im Innern des Konvergenzintervalles darf man mit Potenzreihen wie mit Polynomen rechnen. Inbesondere darf man gliedweise addieren, subtrahieren, multiplizieren, differenzieren und integrieren. Beispiel Für |x| < 1, d.h. im Konvergenzintervall der geometrischen Reihe gilt 1 1 1 = = (1 − x + x2 − · · ·)(1 + x + x2 + · · ·) = 1 + x2 + x4 + · · · . 2 1−x 1+x 1−x Beispiel Für |x| < 1, d.h. im Konvergenzintervall der geometrischen Reihe gilt (2.2) log(1 + x) = Z 0 x 1 dt = 1+t Z 0 x (1 − t + t2 − · · ·) dt = x − x 2 x3 + − ··· . 2 3 In den Randpunkten stellte man hier fest: Für x = −1 erhält man die harmonische Reihe, man hat also Divergenz. Für x = +1 erhält man die alternierende harmonische Reihe, man hat also 8 U. Stammbach: Analysis, Teil C Konvergenz. Man kann ferner zeigen, dass die Gleichung (2.2) auch für den Randpunkt x = 1 gilt. Daraus ergibt sich als Summe der alternierenden harmonischen Reihe log 2. Beispiel Gehen wir aus von der für |t| < 1 konvergenten Reihe 1 = 1 − t2 + t4 − · · · , 1 + t2 so liefert die Integration für |x| < 1 arctan x = Z 0 x 1 x 3 x5 dt = x − + − ··· . 1 + t2 3 5 Zum Schluss dieses Abschnittes merken wir noch an, dass man auch Potenzreihen mit Mittelpunkt x0 , x0 6= 0 betrachten kann. Setzt man nämlich in der Potenzreihe ∞ X ak tk k=0 für t die Differenz x − x0 ein, so erhält man die Reihe ∞ X ak (x − x0 )k , k=0 eine Potenzreihe mit Mittelpunkt x0 . Natürlich ist der Konvergenzbereich einer solchen Reihe ein offenes, halboffenes oder abgeschlossenes Intervall mit Mittelpunkt x0 . Beispiel Die Funktion x → 1/(x + 2) soll, wenn möglich, in eine Potenzreihe mit Mittelpunkt x0 = 1 entwickelt werden. Wir erreichen dieses Ziel wie folgt 1 1 1 = = x+2 3 + (x − 1) 3 " 1 x−1 = 1− + 3 3 x−1 3 2 # + ··· = 1 = x−1 1+ 3 1 1 1 − (x − 1) + 3 (x − 1)2 + · · · 3 32 3 Diese Reihe konvergiert für |(x − 1)/3| < 1 d.h. im Intervall (−2, 4). 9 Kapitel IX. Potenzreihen 3 Das Taylorsche Polynom Als Vorbereitung betrachten wir hier zuerst das folgende einfache Problem. Für ein Polynom n-ten Grades x → P (x), schreiben wir den Wert P (x0 ) in x0 und die Werte der ersten n Ableitungen P 0 (x0 ), P 00 (x0 ), . . . , P (n) (x0 ) vor. Gesucht sind die n + 1 Koeffizienten von P . Der Ansatz P (x) = b0 + b1 x + b2 x2 + · · · + bn xn liefert offenbar das lineare Gleichungssystem b0 + b1 x0 + b2 x20 + b3 x30 + · · · + bn xn0 = P (x0 ) b1 + 2b2 x0 + 3b3 x20 + · · · + nbn xn−1 = P 0 (x0 ) 0 .. . n(n − 1)(n − 2) · · · 2 · 1bn = P (n) (x0 ) . Dieses lässt sich leicht lösen, indem man mit der letzten Gleichung beginnt. Wir verzichten hier auf die explizite Angabe der Lösungen und verfolgen statt dessen noch einen weiteren Lösungsweg, der von einem andern Ansatz für P (x) ausgeht. Wir setzen P (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n . Da die Ableitungen von x → P (x) durch P 0 (x) = a1 + 2a2 (x − x0 ) + 3a3 (x − x0 )2 + · · · + nan (x − x0 )n−1 P 00 (x) = 2a2 + 3 · 2a3 (x − x0 ) + · · · + n(n − 1)an (x − x0 )n−2 .. . P (n) (x) = n(n − 1)(n − 2) · · · 2 · 1an gegeben sind, erhalten wir für die Koeffizienten a0 , a1 , a2 , . . . , an ohne Schwierigkeit 10 U. Stammbach: Analysis, Teil C a0 = P (x0 ), a1 = P 0 (x0 ), a2 = 1 00 1 P (x0 ), . . . , an = P (n) (x0 ) . 2 n! Beispiel Gesucht ist das Polynom dritten Grades mit P (1) = P 0 (1) = P 00 (1) = P 000 (1) = 6 . Nach obigem erhalten wir P (x) = 6 + 6 6 6 (x − 1) + (x − 1)2 + (x − 1)3 = x3 + 3x + 2 . 1! 2! 3! Gegeben sei nun eine Funktion x → f (x), und es sei x0 ein (innerer) Punkt des Definitionsbereiches von f . Als eine der ersten Anwendungen der Differentialrechnung haben wir gelernt (siehe Kapitel II, Abschnitt 2), die Funktion f in x0 zu “linearisieren”, d.h. die Funktion f durch diejenige lineare Funktion P zu ersetzen, die in x0 denselben Wert annimmt wie f , P (x0 ) = f (x0 ), und dort auch die gleiche erste Ableitung besitzt, P 0 (x0 ) = f 0 (x0 ). Dies ist für das Polynom P ersten Grades gerade das oben diskutierte Problem. Wir erhalten für P (3.1) x → P (x) = f (x0 ) + f 0 (x0 )(x − x0 ) , in Übereinstimmung mit der uns schon bekannten Formel für die lineare Ersatzfunktion. Wir erinnern auch daran, dass die lineare Ersatzfunktion (3.1) in der Umgebung von x0 die Funktion f gut approximiert. Allgemeiner können wir nun natürlich auch nach dem Polynom n-ten Grades x → Pn (x) fragen, welches in x0 denselben Wert annimmt wie f , Pn (x0 ) = f (x0 ) und dort auch die gleichen n ersten Ableitungen besitzt Pn0 (x0 ) = f 0 (x0 ), Pn00 (x0 ) = f 00 (x0 ), . . . , Pn(n) (x0 ) = f (n) (x0 ) . Offenbar ist Pn gegeben durch Pn (x) = f (x0 ) + f 0 (x0 ) f 00 (x0 ) f 000 (x0 ) f (n) (x0 ) (x − x0 ) + (x − x0 )2 + (x − x0 )3 + · · · + (x − x0 )n . 1! 2! 3! n! Das Polynom Pn heisst das Taylorpolynom n-ten Grades von f in x0 . Das Taylorpolynom ersten Grades ist die lineare Ersatzfunktion. Man könnte deshalb statt vom Taylorpolynom n-ten Grades auch vom Ersatzpolynom n-ten Grades sprechen. Neben der linearen Approximation hat man somit auch eine quadratische Approximation (n = 2), und allgemeiner eine Approximation n-ten Grades. Beispiel Für die Sinusfunktion x → sin x bestimme man das Taylorpolynom P2 zweiten Grades in x0 = π/6. Wir erhalten (siehe Figur 1) 11 Kapitel IX. Potenzreihen f 0 (x0 ) f 00 (x0 ) P2 (x) = f (x0 ) + (x − x0 ) + (x − x0 )2 1! 2! √ 3 1 π 1 π 2 = x− − x− . + 2 2 6 4 6 1 Fig. 1 : Das lineare und quadratische Taylorpolynom für x → sin x in x0 = π/6 sin x π/6 (x) Man vermutet natürlich, dass das Taylorpolynom n-ten Grades von f in x0 die Funktion f in der Umgebung von x0 “gut” approximieren, und zwar “umso besser”, je höher der Grad n des Taylorpolynoms ist. Für sehr viele Funktionen ist das tatsächlich der Fall. Wir illustrieren den Sachverhalt an den folgenden beiden Beispielen. Beispiel Gegeben sei die Funktion f : x → ex . Wegen f 0 (x) = f 00 (x) = . . . = f (n) (x) = ex erhalten wir für das Taylorpolynom n-ten Grades Pn in x0 = 0 Pn (x) = 1 + x + 1 2 1 1 x + x3 + · · · + xn . 2! 3! n! Unsere Vermutung bestätigend stellen wir fest, dass Pn für f eine “gute” Approximation ist und zwar eine “umso bessere” (d.h. insbesondere in einem umso grösseren Intervall mit Mittelpunkt 12 U. Stammbach: Analysis, Teil C x0 = 0) je grösser der Grad n des Taylorpolynoms Pn ist. Die Figuren 2,3,4 machen diesen Sachverhalt auch optisch klar. 1.1 -0.1 0.1 (0, 1) Fig. 2 : Die lineare Ersatzfunktion von x → ex in x0 = 0 ist im Intervall [−0.1, 0.1] eine gute Approximation 0.9 Beispiel Gegeben sei die Funktion f : x → cos x und x0 = 0. Wegen f 0 (x) = − sin x, f 00 (x) = − cos x, f 000 (x) = sin x, f 0000 (x) = cos x, . . . ist das Taylorpolynom (2n)-ten Grades von f in x0 gegeben durch P2n (x) = 1 − 1 1 2 1 1 x + x4 − x6 + · · · + (−1)n x2n . 2! 4! 6! (2n)! Auch hier stellt man fest, dass P2n für f eine “gute” Approximation ist: Das zu x0 = 0 symmetrisch liegende Intervall, in dem die Approximation von cos x durch P2n (x) “gut” ist, wird dabei mit wachsendem Grad des Polynoms immer grösser und grösser (siehe Figur 2 in Abschnitt 4). Wie für die lineare Ersatzfunktion, so kann die Mathematik auch für die höheren Taylorpolynome Aussagen über die “Güte” der Approximation d.h. über den “Fehler” f (x) − Pn (x) machen. Auf diese sogenannten Restgliedabschätzungen gehen wir hier aber nicht ein. 13 Kapitel IX. Potenzreihen 1.5 -0.5 0.5 (0, 1) Fig. 3 : Im Intervall [−0.5, 0.5] ist die Approximation durch die lineare Ersatzfunktion von x → ex in x0 = 0 nicht mehr genügend gut, hingegen ist die Approximation durch die quadratische Ersatzfunktion noch befriedigend 0.5 3 2 -1.2 1.2 (0, 1) 0 Fig. 4 : Im Intervall [−1.2, 1.2] genügt auch die quadratische Ersatzfunktion von x → ex in x0 = 0 nicht mehr, erst die kubische liefert ein befriedigende Approximation 14 4 U. Stammbach: Analysis, Teil C Die Taylorreihe Es sei wiederum f : x → f (x) eine beliebig oft differenzierbare Funktion und x0 ein innerer Punkt des Definitionsbereiches. Die Formel für das Taylorpolynom n-ten Grades Pn von f in x0 zeigt, dass diese Polynome als Partialsummen der Reihe (4.1) f (x0 ) + f 0 (x0 ) f 00 (x0 ) f (n) (x0 ) (x − x0 ) + (x − x0 )2 + · · · + (x − x0 )n + · · · 1! 2! n! aufgefasst werden können. Die Reihe (4.1) heisst die Taylorreihe von f mit Mittelpunkt x0 . Man beachte, dass man die Reihe (4.1) hinschreiben kann, ohne über deren Konvergenz oder Divergenz eine Aussage zu machen. Da sie eine Potenzreihe mit Mittelpunkt x0 ist, wissen wir aber immerhin, dass ihr Konvergenzbereich ein offenes, halboffenes oder abgeschlossenes Intervall mit Mittelpunkt x0 ist. Es kann vorkommen, dass die Reihe nirgends, ausser natürlich in x0 konvergiert. Dies ist aber eher der Ausnahmefall. Der Normalfall sieht anders aus: Für viele Funktionen konvergiert die Taylorreihe in einer echten Umgebung von x0 und ihre Summe stimmt im Konvergenzbereich sogar mit der Funktion f überein. Dieses Verhalten wird u.a. in den Beispielen des letzten Abschnitts über das Approximationsverhalten der Taylorpolynome von x → ex und x → cos x deutlich. Konvergiert die Taylorreihe für f mit Mittelpunkt x0 in einem nichttrivialen Intervall, so spricht man auch etwa von der Taylorentwicklung von f in x0 . Beispiel Die Taylorreihe von x → ex mit Mittelpunkt x0 = 0 lautet 1+x+ 1 2 1 1 x + x3 + · · · + xn + · · · . 2! 3! n! Sie heisst auch Exponentialreihe (siehe Figur 1). Man kann zeigen, dass diese Reihe für alle x konvergiert und die Funktion x → ex darstellt. Wir dürfen deshalb schreiben ex = 1 + x + 1 2 1 1 x + x3 + · · · + xn + · · · . 2! 3! n! Beispiel Die Taylorreihe von x → cos x mit Mittelpunkt x0 = 0 lautet 1− 1 2 1 1 1 x + x4 − x6 + · · · + (−1)n x2n + · · · . 2! 4! 6! (2n)! Sie heisst auch etwa Cosinus-Reihe (siehe Figur 2). Auch hier kann man zeigen, dass die Reihe für alle x konvergiert und für alle x die Gleichung 15 Kapitel IX. Potenzreihen (y) Fig. 1 : Die ersten Partialsummen der Exponentialreihe; die Kurve y = ex ist gestrichelt eingezeichnet (x) (y) (x) Fig. 2 : Die ersten Partialsummen der Cosinus-Reihe; die Kurve y = cos x ist gestrichelt eingezeichnet 16 U. Stammbach: Analysis, Teil C cos x = 1 − 1 1 2 1 1 x + x4 − x6 + · · · + (−1)n x2n + · · · 2! 4! 6! (2n)! gilt. Beispiel Die Taylorreihe von x → sin x mit Mittelpunkt x0 = 0 lautet x− 1 3 1 1 1 x + x5 − x7 + · · · + (−1)n+1 x2n−1 + · · · . 3! 5! 7! (2n − 1)! Sie heisst Sinus-Reihe. Die Sinus-Reihe konvergiert ebenfalls für alle x, und es gilt die Gleichung sin x = x − 1 3 1 1 1 x + x5 − x7 + · · · + (−1)n+1 x2n−1 + · · · . 3! 5! 7! (2n − 1)! Die Beschäftigung der Mathematik mit Potenzreihen hat gezeigt, dass es Vorteile bietet, wenn man an Stelle der reellen Zahlen komplexe Zahlen zulässt. Es zeigt sich dann, dass der Konvergenzbereich einer Potenzreihe ∞ X ck (z − z0 )k , z, z0 , ck ∈ C k=0 in der komplexen Zahlebene ein Kreis mit Mittelpunkt z0 ist, wobei über das Konvergenzverhalten in den Punkten der Peripherie des Kreises keine einfachen allgemeinen Aussagen möglich sind. Man spricht dann natürlich vom Konvergenzkreis der Potenzreihe (siehe Figur 3). In diesem Zusammenhang klärt sich auch die Wahl des oben erwähnten Begriffes des Konvergenzradius zwanglos auf. Um die Nützlichkeit von komplexen Zahlen in diesem Zusammenhang zu illustrieren, betrachten wir noch das folgende Beispiel. Beispiel Wir berechnen mit Hilfe der Taylorreihen mit Mittelpunkt x0 = 0 die Grösse 1 1 1 1 1 1 cos x + i sin x = 1 − x2 + x4 − x6 + · · · + i x − x3 + x5 − x7 + · · · 2! 4! 6! 3! 5! 7! 1 1 = 1 + ix + (ix)2 + (ix)3 + · · · 2! 3! = eix . Es ist also hier die Euler’sche Formel, eix = cos x + i sin x mit Hilfe der entsprechenden Taylorreihen plausibel gemacht worden. 17 Kapitel IX. Potenzreihen Im z0 Fig. 3 : Konvergenzkreis in der komplexen Zahlebene r Re Wichtig für das Folgende ist nun der mathematische Satz, welcher besagt, dass eine Funktion f um den Punkt x0 höchstens eine Potenzreihenentwicklung zulässt. Satz Stellen zwei Potenzreihen mit Mittelpunkt x0 die gleiche Funktion dar, so stimmen sie in allen ihren Koeffizienten überein. Es gilt also: Konvergiert eine Potenzreihe mit Mittelpunkt x0 gegen eine Funktion f , so ist diese Potenzreihe automatisch die Taylorreihe von f mit Mittelpunkt x0 . Beispiel Wir haben in einem früheren Abschnitt nachgewiesen, dass im Intervall (−1, +1) die Gleichung log(1 + x) = Z x 0 1 dt = 1+t Z x 0 (1 − t + t2 − · · ·) dt = x − x 2 x3 + − ··· 2 3 gilt. Mit dem obigen Satz schliessen wir nun, dass diese Reihe die Taylorreihe von x → log(1+x) mit Mittelpunkt x0 = 0 ist. 18 U. Stammbach: Analysis, Teil C Beispiel Die früher hergeleitete, im Intervall (−1, +1) gültige Potenzreihenentwicklung arctan x = Z x 0 1 x 3 x5 dt = x − + − ··· 1 + t2 3 5 ist automatisch die Taylorentwicklung der Funktion x → arctan x um x0 = 0. Beispiel Gegeben sei die Funktion f : x → (1 + x)α , wo α eine reelle Zahl ist. Gesucht ist die Taylorentwicklung von f um x0 = 0. Für die Ableitungen von f erhalten wir f (x) = (1 + x)α f 0 (x) = α(1 + x)α−1 f 00 (x) = α(α − 1)(1 + x)α−2 .. . f (n) (x) = α(α − 1) · · · (α − n + 1)(1 + x)α−n . Definieren wir, als Verallgemeinerung des wohlbekannten Binomialkoeffizienten, α 0 ! α n =1, ! α(α − 1) · · · (α − n + 1) , n = 1, 2, 3, . . . , n! = so lautet die Taylorreihe von f mit Mittelpunkt x0 = 0 α 1 1+ (4.2) ! α 2 x+ ! α 3 2 x + ! α 4 3 x + ! x4 + · · · . Man nennt (4.2) die Binomialreihe zum Exponenten α. Für α = −1 erhält man die uns gut bekannte geometrische Reihe mit Faktor −x (siehe Figur 4). Man kann zeigen, dass die Binomialreihe für jedes α wenigstens im Intervall (−1, +1) konvergiert und dass in diesem Intervall die Gleichung α (1 + x) = 1 + α 1 ! x+ α 2 ! 2 x + α 3 ! 3 x + α 4 ! 4 x + ··· = ∞ X n=0 α n ! xn gilt. Man beachte, dass der Konvergenzbereich auch grösser sein kann. Ist nämlich α eine positive ganze Zahl, so bricht die Reihe (4.2) nach endlich vielen Gliedern ab (man erhält ein Polynom!), und dementsprechend besteht in diesem Fall der Konvergenzbereich aus allen reellen Zahlen. 19 Kapitel IX. Potenzreihen (y) 2 Fig. 4 : Die ersten Partialsummen der geometrischen Reihe mit Faktor −x; die Kurve y = 1/(1 − x) ist gestrichelt eingezeichnet 1 (x) -1 1 Beispiel Die Funktion p x → 1/ 1 − x2 = (1 − x2 )−1/2 hat die für |x| < 1 gültige Taylorentwicklung 1+ − 12 1 (−x2 ) + − 12 − 32 − 12 − 32 − 52 (−x2 )2 + 1·2 1·2·3 1 1·3 4 1·3·5 6 = 1 + x2 + x + x + ··· . 2 2·4 2·4·6 (−x2 )3 + · · · = Integration liefert daraus die für denselben Bereich gültige Potenzreihenentwicklung arcsin x = Z x 0 √ 1 1 x3 1 · 3 x 5 1 · 3 · 5 x 7 dt = x + + + + ··· . 2 3 2·4 5 2·4·6 7 1 − t2 Die Bestimmung der Koeffizienten der Taylorentwicklung einer Funktion f kann sehr aufwendig sein, weil man dafür ja die Ableitungen beliebig hoher Ordnung von f kennen muss. In vielen Fällen ist es deshalb einfacher, die Koeffizienten auf andere Weise zu bestimmen. Beispiele 20 U. Stammbach: Analysis, Teil C dafür haben wir bereits bei der geometrischen Reihe kennengelernt und bei den vielen aus der geometrischen Reihe hergeleiteten Reihentwicklungen. Als weiteres Beispiel wollen wir hier die Tangens-Reihe bestimmen und zwar mit Hilfe der Methode des Koeffizientenvergleichs. Beispiel Bekanntlich gilt tan x = sin x cos x also cos x · tan x = sin x . Machen wir den Ansatz tan x = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · und benützen wir die uns bekannten Sinus- und Cosinus-Reihen, so erhalten wir 1− 1 2 1 1 x + x4 − x6 + · · · · c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · = 2! 4! 6! =x− c0 + c1 x + c2 − 1 3 1 1 x + x5 − x7 + · · · 3! 5! 7! c0 c1 c2 c0 c3 c1 x2 + c3 − x3 + c4 − x4 + c5 − x5 + · · · = + + 2! 2! 2! 4! 2! 4! =x− 1 3 1 1 x + x5 − x7 + · · · . 3! 5! 7! Da links und rechts dieselbe Funktion beschrieben wird, also nach unserem Satz die beiden Reihen in allen ihren Koeffizienten übereinstimmen müssen, erhalten wir das folgende Gleichungssystem für die (unendlich vielen) Koeffizienten ci c0 c1 = = 0 1 0 c2 − c0 2! = c3 − c1 2! = − c4 − c2 c0 + 2! 4! c5 − c3 c1 + 2! 4! = = .. . 1 3! 0 1 5! 21 Kapitel IX. Potenzreihen Dieses System ist – wie man sagt – rekursiv auflösbar; man erhält 1 2 c0 = 0, c1 = 1, c2 = 0, c3 = , c4 = 0, c5 = , . . . 3 15 Der Beginn der Potenzreihenentwicklung von x → tan x lautet also 1 2 x + x3 + x 5 + · · · 3 15 Man kann zeigen, dass die so erhaltene Reihe für |x| < π/2 konvergiert. Die Koeffizienten der Tangensreihe gehorchen interessanten, aber komplizierten Bildungsgesetzen, auf die wir hier nicht eingehen. Leicht lässt sich allerdings aus dem Gleichungssystem herleiten, dass die Koeffizienten mit geradem Index alle verschwinden. Ganz ähnlich liegt die Sache bei der Sinus-Reihe, wo ebenfalls nur die Koeffizienten mit ungeradem Index auftreten, während bei der Cosinus-Reihe nur Koeffizienten mit geradem Index von Null verschieden sind. In der Tat gilt ganz allgemein der folgende Satz. Satz Die Taylorentwicklung um x0 = 0 einer ungeraden Funktion enthält nur Terme mit ungeradem Index; die Taylorentwicklung um x0 = 0 einer geraden Funktion enthält nur Terme mit geradem Index. Beweis Wir beweisen nur die Aussage über ungerade Funktionen. Das entsprechende Resultat über gerade Funktionen wird analog erhalten. Ist f eine ungerade Funktion, so gilt definitionsgemäss (4.3) f (−x) = −f (x) . Insbesondere ist f (0) = 0. Leitet man die Beziehung (4.3) ab, so erhält man (4.4) −f 0 (−x) = −f 0 (x) . d.h. f 0 ist eine gerade Funktion. Eine zweite Ableitung liefert dann aus (4.4) sofort (4.5) −f 00 (−x) = f 00 (x) d.h. f 00 ist wiederum eine ungerade Funktion, insbesondere gilt f 00 (0) = 0. Es folgt also, dass alle Ableitungen gerader Ordnung von f ungerade Funktionen sind, und dass diese deshalb in x0 = 0 den Wert Null annehmen. In der Taylorentwicklung der ungeraden Funktion f um x0 = 0 können deshalb nur Terme mit ungeradem Index vorkommen. 22 5 U. Stammbach: Analysis, Teil C Anwendungen In diesem letzten Abschnitt besprechen wir eine Reihe von Situationen, in denen die Idee der Potenzreihenentwicklung einer Funktion die Bearbeitung eines Problems jeweils einen Schritt weiterbringt. Beispiel Es ist der Ellipsenumfang zu berechnen. Die Ellipse, a ≥ b (siehe Figur 1), sei gegeben durch die Parameterdarstellung x = a cos t y = b sin t (y) Fig. 1 : Zum Umfang der Ellipse b a (x) Der Umfang ergibt sich dann mit der Formel für die Bogenlänge (Kapitel III, Abschnitt 8) zu U= Z 0 2π q ẋ2 + ẏ 2 dt = 4a Z π/2 0 s 1− a2 − b2 cos2 t dt = 4a a2 Z π/2 p 0 1 − k2 cos2 t dt . 23 Kapitel IX. Potenzreihen Dabei haben wir k2 = a2 − b2 a2 gesetzt. Es ist also 0 ≤ k2 < 1. Das hier auftretende Integral ist (für k 6= 0) nicht elementar lösbar. Es ist ein sogenanntes elliptisches Integral zweiter Art. Mit Hilfe einer Reihenentwicklung des Integranden kann man aber den Wert des Integrals als Reihe darstellen. Wir benützen dazu die für |x| < 1 gültige Reihenentwicklung √ 1 1·3 3 1 2 1−x=1− x− x − x − ··· . 2 2·4 2·4·6 Setzen wir x = k2 cos2 t, so erhalten wir U = 4a π/2 Z 0 1 1 4 1·3 6 1 − k2 cos2 t − k cos4 t − k cos6 t − · · · 2 2·4 2·4·6 dt . (U ) 2πa Fig. 2 : Der Umfang der Ellipse dargestellt als Reihe in k (k) 1 Die gliedweise Integration liefert dann wegen 24 U. Stammbach: Analysis, Teil C Z π/2 0 cos2n t dt = 1 · 3 · 5 · · · (2n − 3) · (2n − 1) π 2 · 4 · · · · (2n − 2) · (2n) 2 (Kapitel III, Abschnitt 6) eine Darstellung von U in Reihenform (siehe Figur 2) " U = 2πa 1 − 2 1 2 k2 − 1 1·3 2·4 2 k4 − 3 1·3·5 2·4·6 2 k6 − ··· 5 # . Die Reihe konvergiert für kleine k, d.h. für Ellipsen, die “kreisähnlich” sind, recht schnell und kann für die Berechnung des Umfanges ohne weiteres verwendet werden. Beispiel Es ist die Schwingungsdauer des mathematischen Pendels (ohne Linearisieren) zu berechnen. Wir haben bereits früher gesehen, dass im linearisierten Problem die Schwingungsdauer überraschenderweise unabhängig ist vom Maximalausschlag. Dies gilt – wie wir hier zeigen werden – für die nicht linearisierte Schwingung des mathematischen Pendels nicht mehr. ϕ α l cos α l cos ϕ l Fig. 3 : Zur Anwendung des Energiesatzes auf das mathematische Pendel m Statt mit der in Kapitel VII, p. 98 hergeleiteten Differentialgleichung zweiter Ordnung zu arbeiten, wenden wir den Energiesatz an. Ist α der maximale Ausschlag des Pendels (siehe Figur 3), so ergibt sich die Beziehung 25 Kapitel IX. Potenzreihen 1 m(lϕ̇)2 = mgl(cos ϕ − cos α) . 2 (Die frühere Differentialgleichung zweiter Ordnung wird daraus durch Ableitung nach t zurückerhalten!) Es folgt daraus die Differentialgleichung (erster Ordung) r ϕ̇ = 2g √ cos ϕ − cos α l für die Funktion t → ϕ(t). Sie lässt sich separieren. Man erhält s dt = l dϕ √ , 2g cos ϕ − cos α und die Schwingungsdauer T des mathematischen Pendels lässt sich als Integral hinschreiben T =4 Z T /4 0 s dt = 4 l 2g Z α 0 dϕ √ . cos ϕ − cos α In diesem Integral machen wir die Substitution sin ϕ 2 = sin α 2 · sin u und setzen k = sin α 2 . Wir erhalten α = 1 − 2k2 2 2 ϕ cos ϕ = 1 − 2 sin = 1 − 2k2 sin2 u 2 cos α = 1 − 2 sin 2 1 ϕ cos 2 2 dϕ = k cos u du ϕ cos 2 und daraus = 1 − sin 2 1/2 ϕ 2 = (1 − k2 sin2 u)1/2 26 U. Stammbach: Analysis, Teil C Z 0 α Z dϕ √ cos ϕ − cos α = π/2 (1 0 √ Z = 2 2k cos u du − 2k2 sin2 u − 1 + 2k2 )1/2 − k2 sin2 u)1/2 (1 π/2 du (1 − 0 k2 sin2 u)1/2 . Von diesem letzteren Integral ist bekannt, dass es nicht elementar lösbar ist; es handelt sich um ein sogenanntes elliptisches Integral erster Art. Ähnlich wie im ersten Beispiel benützen wir die für |x| < 1 gültige Reihenentwicklung 1 1 1·3 2 1·3·5 3 =1+ x+ x + x + ··· , 1/2 2 2·4 2·4·6 (1 − x) um den Integranden in Reihenform darzustellen. Setzen wir x = k2 sin2 u, so folgt s Z T =4 l g π/2 0 1 1·3 4 4 1 + k2 sin2 u + k sin u + · · · 2 2·4 du . Mit dem bekannten Resultat Z 0 π/2 sin2n u du = 1 · 3 · 5 · · · (2n − 3) · (2n − 1) π 2 · 4 · · · · (2n − 2) · (2n) 2 erhalten wir die Schwingungsdauer in Reihenform s " T = 2π l 1+ g 2 1 2 2 k + 1·3 2·4 2 4 k + 1·3·5 2·4·6 2 # 6 k + ··· mit k = sin(α/2). Für kleine α (kleiner Maximalausschlag) ist also der aus der linearisierten Theorie bekannte Wert s T = 2π l g eine gute Nährung. Beispiel Gesucht sind die Funktionswerte der Gauss’schen Fehlerfunktion. Die Gauss’sche Fehlerfunktion ist gegeben durch 2 Φ : x → Φ(x) = √ π Z 0 x 2 e−t dt . 27 Kapitel IX. Potenzreihen (y) 1 (x) -1 1 Fig. 4 : Die Berechnung der Gauss’schen Fehlerfunktion mit Hilfe einer Reihenentwicklung; die Kurve y = Φ(x) ist gestrichelt eingezeichnet -1 Das Integral ist bekanntlich nicht elementar lösbar (Kapitel III, Abschnitt 2). Eine Reihenentwicklung des Integranden und anschliessendes gliedweises Integrieren liefert den Funktionswert von Φ in Reihenform. Aus ex = 1 + x + 1 2 1 1 x + x3 + · · · + xn + · · · 2! 3! n! erhalten wir 2 e−t = 1 − t2 + 1 4 1 t − t6 + · · · . 2! 3! Daraus folgt (siehe Figur 4) 2 Φ(x) = √ π Z 0 x 1 1 1 − t + t4 − t6 + · · · 2! 3! 2 2 1 1 5 1 7 dt = √ x − x3 + x − x + ··· π 3 5 · 2! 7 · 3! . Beispiel Als Kurve, deren Krümmung proportional zur Bogenlänge zunimmt, haben wir die Klotoide kennengelernt (Kapitel III, Abschnitt 8). Sie ist gegeben durch die Parameterdarstellung 28 U. Stammbach: Analysis, Teil C Z ! t2 x(l) = cos dt 2! 0 Z l t2 y(l) = sin dt 2 0 l Die beiden Integrale (Fresnel’sche Integrale) lassen sich nicht elementar ausdrücken. Ähnlich wie oben erhalten wir mit einer Reihendarstellung des Integranden wenigstens eine Reihendarstellung für x und y. Die Cosinus- und Sinus-Reihen liefern unmittelbar cos t2 2 sin t2 2 ! = 1− ! = t4 t8 t12 + − + ··· , 22 · 2! 24 · 4! 26 · 6! t2 t6 t10 − 3 + 5 − ··· , 2 2 · 3! 2 · 5! so dass man erhält (siehe Figur 5) x = l− y = l5 l9 l13 + − + ··· , 5 · 22 · 2! 9 · 24 · 4! 13 · 26 · 6! l3 l7 l11 − + − ··· . 3 · 2 7 · 23 · 3! 11 · 25 · 5! Die Reihen konvergieren für kleine l sehr rasch, so dass sie ohne weiteres für die Berechnung von x und y verwendet werden können. Beispiel Misst man mit einem freihängenden Messband eine horizontale Distanz, so ist der abgelesene Wert mit einem Fehler behaftet, weil das Messband durchhängt (siehe Figur 6). Gesucht ist eine Abschätzung dieses Fehlers. Die Lage des Messbandes sei durch die Funktion x → f (x) beschrieben. Für die Länge des Messbandes (Bogenlänge) gilt dann die differentielle Beziehung ds = q 1 + (f 0 (x))2 dx . Die Differenz ds − dx liefert das Differential du des Fehlers u. Wir erhalten q du = ds − dx = ( 1 + (f 0 (x))2 − 1) dx . 29 Kapitel IX. Potenzreihen (y) 1 -1 1 (x) Fig. 5 : Die Klotoide; für die Zeichnung sind die ersten 13 nichttrivialen Glieder der Reihenentwicklung verwendet worden -1 −s/2 Fig. 6 : Zur Behandlung des freihängenden Messbandes s/2 (x) U. Stammbach: Analysis, Teil C 30 Da |f ′ (x)| klein ist, approximieren wir die Wurzel durch die ersten beiden Terme der Taylorentwicklung 1 1 + (f ′ (x))2 ∼ 1 + (f ′ (x))2 . 2 q Damit folgt 1 du = (f ′ (x))2 dx . 2 Für den Fehler u auf der ganzen Länge des Messbandes gilt somit u= Z s/2 (f ′ (x))2 dx . 0 Laut Mechanik hat man f (x) = a1 cosh(ax) − b . Dabei ist die Grösse a durch die Erdbeschleunigung g, die Längendichte ρ und durch die Seilspannung σ gegeben, nämlich a= gρ . σ Damit folgt f ′ (x) = sinh(ax) . Da wir nur an einer Approximation interessiert sind, entwickeln wir den Integranden von Z s/2 (f ′ (x))2 dx 0 in eine Potenzreihe und begnügen uns mit dem ersten nichttrivialen Term. Wegen f ′ (x) = sinh(ax) = ax + (ax)3 + ··· 3! erhalten wir (f ′ (x))2 = a2 x2 + 2 4 4 a x + ··· . 3! Daraus folgt als Approximation für den Fehler u u= Z 0 s/2 ′ 2 (f (x)) dx ∼ Z s/2 a2 x2 dx = 0 1 2 3 a s . 24 Der Messfehler ist insbesondere proportional zu ρ2 , 1/σ 2 und s3 . 31 Kapitel IX. Potenzreihen Beispiel Die Differentialgleichung (5.1) y 0 = ay hat bekanntlich x → y(x) = Ceax als Lösung. Wir wollen hier zeigen, dass man eine Potenzreihenentwicklung dieser Funktion erhält, indem man direkt in der Differentialgleichung einen Potenzreihenansatz benützt. Dieses Vorgehen kann natürlich nur dann Erfolg haben, wenn die Lösungsfunktionen der Differentialgleichung überhaupt eine Potenzreihendarstellung zulassen. Wir wissen bereits, dass dies im Beispiel (5.1) der Fall ist. Für viele andere Differentialgleichungen können die Mathematiker diese Eigenschaft der Lösungsfunktionen mit Hilfe von allgemeinen Sätzen nachweisen (siehe dazu weiter unten). Unser einfaches Beispiel dient nur dazu, das Verfahren zu illustrieren. Wir machen den Ansatz y(x) = c0 + c1 x + c2 x2 + · · · und setzen diesen in die Differentialgleichung (5.1) ein. Wir erhalten c1 + 2c2 x + 3c3 x2 + · · · = ac0 + ac1 x + ac2 x2 + · · · . Ein Koeffizientenvergleich liefert das Gleichungssystem c1 = ac0 2c2 = ac1 3c3 = ac2 .. . Suchen wir die durch die Anfangsbedingung y(0) = 1 eindeutig bestimmte Lösung, so gilt c0 = 1 und damit der Reihe nach c1 = a a2 c2 = 2! a3 c3 = 3! a4 c4 = 4! .. . 32 U. Stammbach: Analysis, Teil C Die Reihendarstellung der Lösung lautet also, keineswegs überraschend, y(x) = 1 + ax + 1 1 (ax)2 + (ax)3 + · · · . 2! 3! Von dieser wissen wir aus andern Gründen bereits, dass sie für alle x konvergiert. Beispiel Gegeben ist die Differentialgleichung y 00 + x2 y = 0 Gesucht ist die durch die Anfangsbedingungen y(0) = 0 und y 0 (0) = 1 eindeutig bestimmte Lösung. (y) 1 1 2 3 4 (x) Fig. 7 : Die Lösungskurve der Differentialgleichung y 00 + x2 y = 0 mit y(0) = 0 und y 0 (0) = 1; für die Zeichnung sind die ersten 20 nichtverschwindenden Terme der Taylorentwicklung verwendet worden. -1 Man kann zeigen, dass die Lösungsfunktionen der (linearen, homogenen(!)) Differentialgleichung nicht elementar darstellbar sind. Deshalb besteht erhebliches Interesse an einer anderen Darstellung, z.B. an einer Potenzreihenentwicklung. Eine solche ist in der Tat möglich. Es gilt nämlich der mathematische Satz, dass sich die Lösungen einer linearen Differentialgleichung zweiter Ordnung immer in eine Potenzreihe mit Mittelpunkt x0 entwickeln lassen, wenn die Koeffizientenfunktionen der Differentialgleichung ebenfalls Potenzreihenentwicklungen mit Mittelpunkt x0 zulassen. Dies ist in unserem Beispiel trivialerweise der Fall. 33 Kapitel IX. Potenzreihen Wir machen also den Ansatz y(x) = c0 + c1 x + c2 x2 + · · · . Dann gilt y 0 (x) = c1 + 2c2 x + 3c3 x2 + 4c4 x3 + · · · , y 00 (x) = 2c2 + 3 · 2c3 x + 4 · 3c4 x2 + · · · . Einsetzen liefert (2c2 + 3 · 2c3 x + 4 · 3c4 x2 + · · ·) + x2 (c0 + c1 x + c2 x2 + · · ·) = 0 und ein Koeffizientenvergleich führt zum Gleichungssystem 2c2 = 0 2 · 3c3 = 0 3 · 4c4 + c0 = 0 4 · 5c5 + c1 = 0 5 · 6c6 + c2 = 0 .. . Mit Hilfe der Anfangsbedingungen erhalten wir dann die Koeffizienten c0 , c1 , c2 , · · · rekursiv c0 c4 c8 c12 = 0 c1 = 1 c2 = 0 c5 = −1/4 · 5 c6 = 0 c9 = 1/4 · 5 · 8 · 9 c10 = 0 c13 = −1/4 · 5 · 8 · 9 · 12 · 13 c14 = 0 c3 = 0 c7 = 0 c11 = 0 c15 =0 =0 =0 =0 Die Reihendarstellung der gesuchten Funktion lautet also (siehe Figur 7) y(x) = x − x5 x9 x13 + − + ··· 4 · 5 4 · 5 · 8 · 9 4 · 5 · 8 · 9 · 12 · 13 Der oben zitierte allgemeine Satz besagt, dass diese Reihe wenigstens für kleine x konvergiert; in der Tat konvergiert sie sogar für alle x und zwar sehr rasch. Analysis I/II U. Stammbach Professor an der ETH-Zürich Anhang. Komplexe Zahlen Es gibt täglich mehr zu wissen. Aus der NZZ-Werbung Inhaltsverzeichnis 1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3 Anhang: Komplexe Zahlen 1 Komplexe Zahlen Eine komplexe Zahl z lässt sich in eindeutiger Weise in der Form a + ib, a, b ∈ R schreiben, wobei das Symbol i die imaginäre Einheit , i2 = −1 bezeichnet. Die reelle Zahl a heisst Realteil und die reelle Zahl b heisst Imaginärteil von z. Die reellen Zahlen R denkt man sich in den komplexen Zahlen C eingebettet, indem man der reellen Zahl a die komplexe Zahl a + i0 zuordnet. Die Rechenoperationen mit komplexen Zahlen genügen den fundamentalen Rechengesetzen, die man von den reellen Zahlen her kennt: Die Addition ist kommutativ und assoziativ, die Multiplikation ist kommutativ und assoziativ und verhält sich gegenüber der Addition distributiv. Für z = a + ib, a, b ∈ R z 0 = a0 + ib0 , a0 , b0 ∈ R ist die Summe definiert durch z + z 0 = (a + ib) + (a0 + ib0 ) = (a + a0 ) + i(b + b0 ) (1.1) und das Produkt wegen i2 = −1 durch z · z 0 = (aa0 − bb0 ) + i(ab0 + a0 b) . (1.2) Zu jeder von Null verschiedenen komplexen Zahl z 6= 0 = 0 + i0 gibt es ein Inverses 1/z. Es gilt für 0 6= z = a + ib 1 b 1 1 a − ib a −i 2 . = = = 2 2 z a + ib a + ib a − ib a +b a + b2 Aus diesem Grund kann man in C durch von Null verschiedene komplexe Zahlen dividieren. Beispiel 8−i 5+i 2 = (8 − i)(5 − i) (5 + i)(5 − i) 2 = 39 − 13i 26 2 = 1 1 1 (3 − i)2 = (9 − 6i − 1) = (4 − 3i). 4 4 2 4 U. Stammbach: Analysis, Teil C Im z Fig. 1 : Die komplexe Zahlebene ρ b ϕ Re a Komplexe Zahlen lassen sich in einfacher Weise in der sogenannten komplexen (oder Gaussschen) Zahlebene (siehe Figur 1) veranschaulichen: Man fasst die komplexe Zahl z = a+ib als Punkt mit den (kartesischen) Koordinaten (a, b) in der Ebene auf. Die waagerechte Koordinatenachse bezeichnet man als reelle Achse, die senkrechte als imaginäre Achse. In der komplexen Zahlebene entspricht der Addition von komplexen Zahlen offenbar die Addition von Vektoren. Auch die Multiplikation einer komplexen Zahl z mit einer reellen Zahl r lässt sich unmittelbar als Multiplikation des “Vektors” z mit dem “Skalar” r deuten. Die Multiplikation von zwei komplexen Zahlen lässt sich geometrisch in einfacher Weise beschreiben, wenn man in der komplexen Zahlebene Polarkoordinaten (ρ, ϕ) einführt. Offenbar gilt für z = a + ib ρ = ϕ = p ( a2 + b2 , arctan(b/a) für a > 0 arctan(b/a) + π für a < 0 , wobei wie üblich die Formel für ϕ im Fall a = 0 sinnvoll zu ergänzen ist. Ausserdem ist ϕ nur bis auf ein Vielfaches von 2π bestimmt. Es heisst ρ der (absolute) Betrag |z| von z, und ϕ das Argument arg z von z. Die komplexe Zahl cos ϕ + i sin ϕ besitzt den absoluten Betrag 1; sie liegt auf dem Einheitskreis mit Mittelpunkt 0 in der komplexen Zahlebene. Wir führen für eine solche komplexe Zahl die 5 Anhang: Komplexe Zahlen folgende, von Euler stammende Schreibweise ein: cos ϕ + i sin ϕ = eiϕ (1.3) (siehe dazu Kapitel VIII, Abschnitt 4). Es bezeichnet also eiϕ die komplexe Zahl mit Betrage 1 und Argument ϕ. Diese etwas willkürlich erscheinende Festsetzung rechtfertigen wir hier dadurch, dass wir zeigen, dass für eiϕ die für die Exponentialfunktion übliche Rechenregel gilt, nämlich eiα · eiβ = eiα+iβ = ei(α+β) . Der Beweis besteht in der folgenden einfachen Rechnung, welche die Additionstheoreme für cos und sin verwendet: eiα · eiβ = (cos α + i sin α) · (cos β + i sin β) = (cos α cos β − sin α sin β) + i(sin α cos β + cos α sin β) = cos(α + β) + i sin(α + β) = ei(α+β) . Ist z eine beliebige, von Null verschiedene komplexe Zahl mit Betrag |z| und Argument ϕ, so lässt sich z schreiben als (1.4) z = |z| · (cos ϕ + i sin ϕ) = |z| · eiϕ . Wir nennen dies die Polardarstellung der komplexen Zahl z. Mit ihrer Hilfe beschreibt sich die Multiplikation von komplexen Zahlen in der komplexen Zahlebene wie folgt: Für z = |z| · eiϕ 0 und z 0 = |z 0 | · eiϕ erhalten wir 0 0 z · z 0 = |z| · eiϕ · |z 0 | · eiϕ = |z| · |z 0 | · ei(ϕ+ϕ ) . Bei der Multiplikation von komplexen Zahlen werden die absoluten Beträge multipliziert und die Argumente addiert: |z · z 0 | = |z| · |z 0 |, arg(z · z 0 ) = arg z + arg z 0 . Neben den Rechenoperationen Addition und Multiplikation spielt bei komplexen Zahlen auch die Konjugation eine grosse Rolle. Die zu z, z = a + ib konjugierte komplexe Zahl ist gegeben durch z = a − ib (siehe Figur 2). Es gilt offenbar: 6 U. Stammbach: Analysis, Teil C 1 a = (z + z) , 2 (1.5) b= 1 (z − z) . 2i Damit sind Real- und Imaginärteil einer komplexen Zahl durch z und z ausgedrückt. Ferner gelten, wie man leicht bestätigt, die folgenden Beziehungen Im z z = a + ib ρ ϕ Re −ϕ ρ z̄ = a − ib z = z z + z0 = z + z0 z · z0 = z · z0 1 z = 1 z |z|2 = z · z . Für z = eiϕ = cos ϕ + i sin ϕ gilt Fig. 2 : Konjugieren komplexer Zahlen 7 Anhang: Komplexe Zahlen z = cos ϕ − i sin ϕ = cos(−ϕ) + i sin(−ϕ) = e−iϕ . Damit erhalten wir mit Hilfe der Formeln (1.3) und (1.5) cos ϕ = (1.6) 1 iϕ (e + e−iϕ ) , 2 sin ϕ = 1 iϕ (e − e−iϕ ) . 2i Dies sind die berühmten Euler’schen Formeln (L. Euler 1707-1783). Beispiel Man drücke cos(nϕ), sin(nϕ), n = 2, 3, . . . durch die Werte der Winkelfunktionen cos und sin des einfachen Winkels ϕ aus. Ausgehend von den bekannten Formeln für n = 2 lässt sich die Aufgabe mit etwas Mühe direkt lösen. Einfacher und sicherlich eleganter ist aber das folgende Vorgehen. Wir betrachten die komplexe Zahl z = cos(nϕ) + i sin(nϕ) . Dann gilt z = einϕ = (eiϕ )n = (cos ϕ + i sin ϕ)n . Also ! ! n n z = cos ϕ + i cosn−1 ϕ sin ϕ + i2 cosn−2 ϕ sin2 ϕ + · · · + in sinn ϕ . 1 2 n Indem wir Real- und Imaginärteil dieses Ausdruckes betrachten, erhalten wir ! (1.7) n cos(nϕ) = cosn ϕ − cosn−2 ϕ sin2 ϕ + · · · , 2 ! (1.8) sin(nϕ) = ! n n cosn−1 ϕ sin ϕ − cosn−3 ϕ sin3 ϕ + · · · . 1 3 Diese sogenannten Formeln von Moivre (Moivre 1667-1754) verallgemeinern die wohlbekannten Formeln für cos(2ϕ) und sin(2ϕ). Wir haben in diesem Abschnitt gesehen, dass das Potenzieren einer komplexen Zahl sehr einfach wird, wenn man die Polardarstellung verwendet. In der Tat gilt ja z n = (|z| · eiϕ )n = |z|n · einϕ . √ √ Beispiel Es sei z = − 3 + i 3. Man berechne z 10 . 8 U. Stammbach: Analysis, Teil C Es gilt z= √ 6 · eiϕ , ϕ = 3π/4. Damit erhalten wir √ 3π 15π 3π z 10 = ( 6)10 · ei 4 10 = 65 · ei 2 = 65 · ei 2 = −65 i . Offenbar ist die Polardarstellung auch geeignet, Licht in das folgende Problem zu bringen. Im 3 · eiα z z1 α α/2 Re Fig. 3 : Die Quadratwurzel komplexer Zahlen z2 Beispiel Gegeben ist die komplexe Zahl c. Gesucht sind die (alle!) Lösungen der Gleichung z n = c. Wir betrachten zuerst den Fall n = 2 für c = 3eiα (siehe Figur 3). Wir machen den Ansatz z = ρ · eiϕ . Dann folgt ! z 2 = ρ2 · ei2ϕ = 3eiα . 9 Anhang: Komplexe Zahlen √ Daraus lesen wir als erstes ρ = 3 ab. (Beachte, dass ρ als Betrag einer von Null verschiedenen komplexen Zahl positiv sein muss.) Ferner entnehmen wir der Gleichung die Bedingung 2ϕ = α, wobei diese “modulo 2π” zu erfüllen ist. Wir erhalten die beiden Lösungen ϕ1 = α , 2 α 2π + . 2 2 ϕ2 = Damit folgt z1 = √ α 3 · ei 2 , z2 = √ α 2π 3 · ei( 2 + 2 ) . Wir entnehmen diesem Beispiel, dass die einzige Schwierigkeit zur Lösung von z n = c offenbar in der Bestimmung des Argumentes der Lösungen liegt. Wir betrachten dazu noch das folgende Beispiel. Im z2 eiα z z3 α z1 α/5 Re z4 z5 Beispiel Es sei (1.9) z n = eiα . Dann gilt natürlich |z| = 1 (siehe Figur 4). Mit dem Ansatz Fig. 4 : Die 5. Wurzel aus einer komplexen Zahl vom Betrage 1 10 U. Stammbach: Analysis, Teil C z = eiϕ erhalten wir ! z n = einϕ = eiα . Damit ist nϕ = α “modulo 2π” zu erfüllen, so dass sich für die Argumente ϕ1 , ϕ2 , . . . , ϕn der n Lösungen ϕ1 = ϕ2 = ϕ3 = .. . ϕn = α , n α 1 + 2π , n n α 2 + 2π , n n α n−1 + 2π n n ergibt. In der komplexen Zahlebene bilden die n Lösungen der Gleichung (1.9) die Ecken eines regelmässigen n-Eckes, das dem Einheitskreis einbeschrieben ist. 11 Anhang: Komplexe Zahlen 2 Komplexe Zahlen und Funktionen In einem ersten Teil betrachten wir hier Funktionen, die auf reellen Zahlen definiert sind und als Werte komplexe Zahlen annehmen. Beispiel Die Funktion ϕ : t → ϕ(t) = cos t + i sin t, −∞ < t < +∞ ordnet der reellen Zahl t die komplexe Zahl cos t + i sin t zu. Im z Fig. 1 : Komplexwertige Funktion einer rellen Variablen Re ϕ(t) = g(t) + ih(t) Wir können eine solche Funktion als Abbildung (eines Teils) der reellen Zahlgerade in die komplexe Zahlebene auffassen. Durch die oben definierte Funktion ϕ zum Beispiel wird der reellen Zahl t der Punkt des Einheitskreises in der komplexen Zahlebene mit dem Argument arg w = t zugeordnet. Natürlich können wir eine solche komplexwertige Funktion einer reellen Variablen immer in der Form 12 U. Stammbach: Analysis, Teil C ϕ : t → ϕ(t) = g(t) + ih(t) schreiben, wobei g : t → g(t) und h : t → h(t) “gewöhnliche”, d.h. reellwertige Funktionen der reellen Variablen t sind (siehe Figur 1). Die Ableitung ϕ0 der Funktion ϕ der reellen Variablen t wird man definieren durch ϕ0 (t) = g0 (t) + ih0 (t); die Ableitungsfunktion ϕ0 ist also wiederum eine komplexwertige Funktion der gleichen reellen Variablen t. Beispiel Es sei ϕ : t → ϕ(t) = eit . Dann gilt ϕ0 (t) = (cos t + i sin t)0 = − sin t + i cos t = i(cos t + i sin t) = ieit . Für die Ableitung der Funktion t → eit gilt folglich die von der reellen Exponentialfunktion her bekannte Ableitungsregel. Beispiel Es sei ψ : t → ψ(t) = eiωt , wo ω eine feste reelle Zahl ist. Dann folgt ψ 0 (t) = iωeiωt , ψ 00 (t) = −ω 2 eiωt und damit identisch in t ψ 00 (t) + ω 2 ψ(t) = 0 . Damit ist ψ : t → eiωt eine (komplexwertige) Lösung der (reellen) Differentialgleichung ψ 00 + ω 2 ψ = 0 . Das bedeutet, dass sowohl der Realteil von ψ, also t → cos(ωt), wie auch der Imaginärteil von ψ, also t → sin(ωt), Lösungen der Differentialgleichung sind. Analoges wie für die Ableitung einer komplexwertigen Funktion einer reellen Variablen gilt auch für das Integral. Beispiel Es sei k eine ganze Zahl. Dann gilt Z 0 2π ikx e dx = Z 0 2π (cos(kx) + i sin(kx)) dx = Z 0 2π cos(kx) dx + i Z 0 2π sin(kx) dx . 13 Anhang: Komplexe Zahlen Da k ganz ist, folgt Z 2π 0 ( ikx e dx = 0 für k 6= 0 . 2π für k = 0 Beispiel Es seien m, n zwei nicht negative ganze Zahlen. Wir berechnen das Integral Z 2π 0 cos(mx) sin(nx) dx mit Hilfe komplexer Zahlen. Es gilt Z 0 2π cos(mx) sin(nx) dx = Z = 0 2π Z eimx + e−imx einx − e−inx · dx 2 2i 1 2π i(m+n)x = (e − ei(m−n)x + ei(n−m)x − e−i(n+m)x ) dx 4i 0 Z 2π Z 2π Z 2π Z 2π 1 = ei(m+n)x dx − ei(m−n)x dx + ei(n−m)x dx − e−i(m+n)x dx . 4i 0 0 0 0 Daraus erhält man mit einer Fallunterscheidung m 6= n, m = n 6= 0, m = n = 0 mit Hilfe des voherigen Beispiels das Resultat Z 0 2π cos(mx) sin(nx) dx = 0 . Auf gleiche Art berechnet man ohne Mühe auch Z 2π 0 Z 2π 0 cos(mx) cos(nx) dx = sin(mx) sin(nx) dx = 0 für m 6= n π für m = n 6= 0 , 2π für m = n = 0 0 für m 6= n π für m = n 6= 0 . 0 für m = n = 0 Diese Resultate spielen in der Theorie der Fourrierreihen eine grosse Rolle (siehe Analysis III); sie heissen Orthogonalitätsrelationen und drücken aus, dass die Funktionen x → cos(mx) , m = 0, 1, . . . , x → sin(nx) , n = 1, 2, . . . ein “orthogonales Funktionensystem” in einem entsprechenden “Funktionenraum” bilden. 14 U. Stammbach: Analysis, Teil C w Im w z Re Im Fig. 2 : Komplexwertige Funktion einer komplexen Variablen z Re Im ersten Teil dieses Abschnitts haben wir komplexwertige Funktionen einer reellen Variablen betrachtet. Jetzt wollen wir uns Funktionen zuwenden, bei denen sowohl der Definitionsbereich wie auch der Wertebereich in der komplexen Zahlebene liegen (siehe Figur 2). Beispiel Die Funktion f : z → w = f (z) = iz ordnet der komplexen Zahl z die komplexe Zahl w, w = iz zu. Um sich diese Funktion zu veranschaulichen fassen wir sie als Abbildung von der komplexen z-Ebene in die komplexe wEbene auf. Wegen |w| = |iz| = |z| und arg w = arg(iz) = arg z + π/2 folgt, dass der Funktion eine Drehung der komplexen Zahlebene um den Winkel π/2 entspricht. Beispiel Der Funktion f : z → w = f (z) = z · eiα entspricht einer Drehung der komplexen Zahlebene um den Winkel α (siehe Figur 3). 15 Anhang: Komplexe Zahlen Im z w w = z · eiα Fig. 3 : Der Multiplikation mit einer komplexen Zahl vom Betrage 1 entspricht eine Drehung der komplexen Zahlebene z α Re Im z w Fig. 4 : Der Multiplikation mit einer reellen Zahl r entspricht eine Streckung der komplexen Zahlebene w=r·z z Re 16 U. Stammbach: Analysis, Teil C Beispiel Der Funktion g : z → w = g(z) = r · z, r∈R entspricht einer Streckung der komplexen Zahlebene um den Faktor r (siehe Figur 4). Im w =z+c c z w Fig. 5 : Der Addition einer komplexen Zahl entspricht eine Translation der komplexen Zahlebene z Re Beispiel Der Funktion h : z → z + c, c∈C entspricht einer Translation der komplexen Zahlebene um den “Vektor” c (siehe Figur 5). Beispiel Wir betrachten als nächstes die etwas kompliziertere Funktion z → w = ez , wobei wir z = a + ib a, b ∈ R setzen ez = ea+ib = ea · eib = ea (cos b + i sin b) . 17 Anhang: Komplexe Zahlen Im z = a + iy z z = x + ib Fig. 6 : Das Netz der Parallelgeraden zur reellen bzw. imaginären Achse in der komplexen Zahlebene Re Im w w = ex+ib w = ea+iy Re Fig. 7 : Das Bild unter der Exponentialfunktion z → ez des Netzes der Parallelgeraden zur reellen bzw. imaginären Achse in der komplexen Zahlebene 18 U. Stammbach: Analysis, Teil C Um uns einen Überblick über das Verhalten dieser Funktion zu verschaffen, betrachten wir das Koordinatennetz in der z-Ebene und untersuchen sein Bild in der w-Ebene (siehe Figuren 6,7). Eine Parallelgerade zur reellen Achse in der z-Ebene wird durch die Gleichung z = x + ib, −∞ < x < +∞ beschrieben. Ihr Bild in der w-Ebene ist w = ex · eib = ex (cos b + i sin b) , ein von 0 ausgehender Strahl mit arg w = b. Eine Parallelgerade zur imaginären Achse in der z-Ebene wird durch die Gleichung z = a + iy, −∞ < y < +∞ beschrieben. Ihr Bild in der w-Ebene ist w = ea · eiy = ea (cos y + i sin y) , ein Kreis um 0 mit Radius ea . Das Bild des Koordinatennetzes in der z-Ebene besteht also aus den von 0 ausgehenden Strahlen und den Kreisen um 0. Man beachte ferner, dass jeder Parallelstreifen zur reellen Achse in der z-Ebene der Breite 2π auf die ganze w-Ebene abgebildet wird. Speziell hinweisen möchten wir auf das Phänomen, dass das Bild des Koordinatennetzes in der z-Ebene in ein Netz von Kurven abgebildet wird, welche sich orthogonal schneiden. Letzteres ist nicht nur für die durch die Funktion z → ez vermittelte Abbildung der Fall, sondern ganz allgemein für Abbildungen, die zu sogenannten analytischen Funktionen gehören. (Auf die Definition des Begriffes “analytisch” gehen wir hier nicht ein.) Man kann zeigen, dass solche Funktionen sogar Abbildungen liefern, die winkeltreu sind; man nennt Abbildungen mit dieser Eigenschaft auch etwa konform. In der mathematischen Behandlung der Strömungslehre (Hydro- und Aerodynamik) spielen konforme Abbildungen der Ebene eine grosse Rolle; deshalb hat der Zweig der Mathematik, welcher sich mit analytischen Funktionen beschäftigt, die sogenannte komplexe Funktionentheorie, im Gebiet der Strömungslehre viele wichtige Anwendungen gefunden. Beispiel Gegeben sei die Funktion z → w = f (z) = z 2 . Wiederum studieren wir die Funktion, indem wir das Bild des z-Koordinatennetzes in der wEbene untersuchen (siehe Figur 8). Für z = a + ib erhalten wir f (z) = (a2 − b2 ) + i2ab . Die Bildkurve der Parallelgeraden z = t + ib, −∞ < t < +∞ zur reellen Achse ist also durch die Parameterdarstellung (w = ξ(t) + iη(t)) t → ξ(t) = t2 − b2 , t → η(t) = 2tb 19 Anhang: Komplexe Zahlen Im z w = (a + iy)2 Re Fig. 8 : Das Bild unter der Funktion z → z 2 des Netzes der Parallelgeraden zur reellen bzw. imaginären Achse in der komplexen Zahlebene w = (x + ib)2 gegeben. Eliminieren wir t, so erhalten wir als Gleichung der Bildkurve ξ= η2 − b2 . 4b2 Die Bildkurve der Parallelgeraden z = t + ib zur reellen Achse der z–Ebene ist eine nach rechts geöffnete Parabel, deren Scheitel bei (−b2 , 0) liegt. Analog zeigt man, dass das Bild der Parallelgeraden z = a + it, −∞ < t < +∞ zur imaginären Achse der z-Ebene eine Parabel ist, die nach links geöffnet ist und deren Scheitel bei (a2 , 0) liegt. Man stellt fest, dass sich die so erhaltenen Kurven in der w-Ebene orthogonal schneiden; die Funktion z → z 2 ist eben auch “analytisch” wie die im obigen Beispiel betrachtete Funktion z → ez . 20 3 U. Stammbach: Analysis, Teil C Polynome In diesem Abschnitt wollen wir die einfachsten komplexwertigen Funktionen einer komplexen Variable etwas näher betrachten, nämlich die Polynome. Ein (komplexes) Polynom p ist eine Funktion der Form z → p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n p: mit c0 , c1 , . . . , cn ∈ C . Diese komplexen Zahlen heissen die Koeffizienten von p. Die natürliche Zahl n heisst Grad von p, Grad p = n (falls cn 6= 0). Offenbar kann man Polynome in der üblichen Art und Weise addieren und multiplizieren. Für die Grade gilt Grad(p + q) ≤ max(Grad p, Grad q) , Grad(p · q) = Grad p + Grad q . Eine komplexe Zahl z0 heisst Nullstelle des Polynoms p, wenn gilt p(z0 ) = 0. Beispiel Das Polynom p: z → p(z) = c0 + z n hat wegen cn = 1 6= 0 den Grad n. Seine Nullstellen sind die Lösungen der Gleichung z n = w, w = −c0 . Im Abschnitt 1 haben wir die komplexen Lösungen angegeben und gesehen, dass es davon n verschiedene gibt. Beispiel Das Polynom p: z → p(z) = z 2 + (2i)z + (−4 + 4i) hat als Nullstellen die komplexen Zahlen z1 = 2 − 2i, z2 = −2 . Ist p eine beliebiges Polynom, so ist a priori nicht klar, ob p überhaupt Nullstellen besitzt. Die Aussage, dass dies tatsächlich der Fall ist, ist ein tiefliegender mathematischer Satz, der sogenannte “Fundamentalsatz der Algebra”, der erstmals von Gauss bewiesen worden ist. Wir erwähnen ihn hier ohne Beweis. Satz Es sei p ein Polynom mit Grad p ≥ 1. Dann gibt es (mindestens) eine Nullstelle von p. 21 Anhang: Komplexe Zahlen Wir machen dazu die folgende Bemerkung: Für Grad p = 1, 2 (und mit etwas mehr Mühe für Grad p = 3, 4) lassen sich für die Nullstellen von p Wurzelformeln angeben. Man kann beweisen, dass für Polynome vom Grad grösser gleich 5 solche allgemeinen Lösungsformeln mit Wurzeln nicht existieren können. Der Satz von Gauss sagt nur über die Existenz von Nullstellen etwas aus, und nichts über die Art und Weise, wie die Nullstellen gefunden werden können. Da das Problem, Nullstellen von Polynomen zu bestimmen, in Anwendungen häufig auftritt, besteht ein grosses Bedürfnis, Methoden dafür zu entwickeln. In der Tat stellt uns die numerische Mathematik eine ganze Anzahl von solchen Verfahren zur Verfügung; in dieser Vorlesung können wir aber darauf natürlich nicht eingehen. Die Folgerungen aus dem Satz von Gauss sind vielfältig; einige davon werden wir im Folgenden zur Sprache bringen. Zuerst aber beschäftigen wir uns kurz mit einem (wohlbekannten) rechnerischen Hilfsmittel. • Es seien p und q Polynome mit Grad p = n und Grad q = m ≤ n. Dann gibt es Polynome r und s mit p(z) = r(z) · q(z) + s(z) und Grad s < m. Wir beweisen auch diese Aussage hier nicht, sondern geben nur an, dass r und s auf einfache Weise durch den üblichen Divisionsalgorithmus bestimmt werden können. Es sei nun z1 eine Nullstelle von p, p(z1 ) = 0. Indem man q(z) = z − z1 setzt, folgt aus der obigen Aussage, dass sich p(z) in der Form (3.1) p(z) = r(z)(z − z1 ) + s(z) schreiben lässt mit Grad s < 1. Wegen Grad s < 1 folgt, dass s eine Konstante ist. Setzt man z = z1 , so erhält man aus (3.1) 0 = p(z1 ) = r(z1 )(z1 − z1 ) + s(z1 ) = s(z1 ) . Damit ist das folgende Resultat bewiesen. • Ist z1 eine Nullstelle von p, so lässt sich z − z1 “abspalten”; d.h. es gibt ein Polynom r mit Grad r = n − 1 und p(z) = (z − z1 ) r(z) . Das Vorgehen lässt sich offenbar mit dem Polynom r an Stelle von p wiederholen, solange dieses Polynom einen Grad ≥ 1 besitzt. Damit erhält man schliesslich eine Zerlegung von p in “Linearfaktoren”. • Das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n lässt sich in der Form (3.2) schreiben. p(z) = cn · (z − z1 )(z − z2 ) · · · (z − zn ) 22 U. Stammbach: Analysis, Teil C Die komplexen Zahlen z1 , z2 , . . . , zn sind Nullstellen von p. Diese sind durch p eindeutig bestimmt. Ist nämlich w eine komplexe Zahl, die von z1 , z2 , . . . , zn verschieden ist, so folgt aus der Zerlegung (3.2) p(w) 6= 0. Wir schliessen daraus: • Ein Polynom p vom Grad n hat höchstens n Nullstellen. Das Wort “höchstens” tritt hier deshalb auf, weil unter den Zahlen z1 , z2 , . . . , zn , die in (3.2) auftreten, einzelne mehrfach vorkommen können. Beispiel Das Polynom p : z → p(z) = z 2 + 2iz − 1 lässt sich in der Form p(z) = (z + i)(z + i) schreiben. Man sagt p besitze −i als “doppelte Nullstelle”. Wir definieren die Vielfachheit k0 der Nullstelle z0 von p als grösste ganze Zahl mit der Eigenschaft, dass sich p in der Form p(z) = (z − z0 )k0 · t(z) schreiben lässt. (Es ist dann natürlich t(z0 ) 6= 0! ) • Das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n lässt sich in der Form p(z) = cn · (z − z1 )k1 · · · (z − zl )kl schreiben. Dabei bezeichnen z1 , z2 , . . . , zl die verschiedenen Nullstellen von p und k1 , k2 , . . . , kl deren Vielfachheiten. Es gilt k1 + k2 + · · · + kl = n, d.h. die Summe der Vielfachheiten der Nullstellen eines Polynoms ist gleich dem Grad des Polynoms. Wir nennen das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n reell, wenn alle seine Koeffizienten c0 , c1 , . . . , cn reell sind. Wir behaupten • Ist z0 eine Nullstelle des reellen Polynoms p, so ist auch die konjugiert komplexe Zahl z0 eine Nullstelle von p. Es folgt nämlich aus 0 = p(z0 ) = c0 + c1 z0 + · · · + cn z0n sofort 0 = 0 = p(z0 ) = c0 + c1 z0 + · · · + cn z0n = c0 + c1 z0 + · · · + cn z0 n = p(z0 ) . Die komplexen Nullstellen eines reellen Polynoms treten somit in konjugiert komplexen Paaren auf. Beispiel Das Polynom p : z → z 6 − 1 ist reell; es besitzt die komplexen Zahlen 23 Anhang: Komplexe Zahlen zk = ei 2π k 6 , k = 1, 2, . . . , 6 als Nullstellen. Offenbar sind z3 und z6 reell; ferner sind z1 und z5 , sowie z2 und z4 konjugiert komplexe Paare. Betrachten wir in der Zerlegung eines reellen Polynoms in Linearfaktoren die beiden zur komplexen Nullstelle z0 gehörigen Faktoren (z − z0 ), (z − z0 ), so stellen wir fest, dass (z − z0 )(z − z0 ) = z 2 − (z0 + z0 )z + z0 z0 ein quadratisches reelles Polynom ist (mit konjugiert komplexen Nullstellen). Damit folgt: • Ist p : z → p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n ein reelles Polynom, so lässt sich dieses in der Form p(z) = cn (z − z1 )(z − z2 ) · · · (z − zl ) · (q1 (z) · · · qm (z)) schreiben, wobei z1 , . . . , zl die reellen Nullstellen sind, und q1 , . . . , qm die quadratischen reellen Polynome bezeichnen, die zu den konjugiert komplexen Paaren von komplexen Nullstellen gehören (natürlich jeweils mit ihren Vielfachheiten). Sachverzeichnis Abbildung I.16 Abklingvorgänge VII.9 Ableitung II.4 Ableitung, partiell IV.10 allgemeine Lösung VII.4, VII.17, VII.40, VII.77 alternierende Reihe VIII.5 Amplitude I.42, VII.94 analytische Funktion Anh.18 Anfangsbedingung II.36 Approximation II.15 Arbeit VI.51 Arbeit im wirbellosen Feld VI.57 Archimedisches Prinzip VI.48 Area-Funktionen II.44 Arcus-Funktionen I.51 Argument einer komplexen Zahl Anh.4 Astroide, Länge von III.41 Asymptote I.58 asymptotisch stabil VII.116, VII.120 Auftrieb, hydrostatischer VI.48 autonome Systeme VII.103, VII.107 Balken V.48 Balken, aufgelegt VII.71 Balken, eingespannt VII.68 Bernoulli-Hôpital II.26 Bernoullispirale II.77 Bernoullispirale, Länge der III.43 Beschleunigung II.57 Betrag einer komplexen Zahl Anh.4 Binomialreihe VIII.18 Biot-Savart VI.9 Bogenlänge III.39 Böschungsflächen VI.23 charakteristisches Polynom VII.83 Clairaut’sche Differentialgleichung VII.61 Coulomb-Feld VI.7 Dämpfung VII.92 Derivierte II.4 Differential II.17 Differential, totales IV.28 Differentialgleichung I.19, II.36 Differentialgleichung höherer Ordnung VII.64 Differentialgleichung, gewöhnliche VII.5 Differentialgleichung, homogene Eulersche VII.86 Differentialgleichung, lineare VII.36, VII.72 Differentialgleichung, lineare homogene mit konstanten Koeffizienten VII.83 Differentialgleichung, Laplace’sche VI.45 Differentialgleichung, partielle IV.60, VI.42, VI.45, VI.48, VI.66 Differentialgleichungssysteme VII.102, VII.107 Differentialoperator VI.11 Differentialquotient II.3 Differentialrechnung II.23 differenzierbar II.3 divergent VIII.3 Divergenz VI.11, VI.39 Divergenzsatz VI.35 divergieren I.6 Doppelintegral V.6 ebene Kurve II.65 Eigenfrequenz VII.97 einfach zusammenhängend VI.71 Elektrostatik, Grundgleichung VI.45 Ellipse II.67 Ellipse, Fläche der III.22, III.37 Ellipsenkoordinatensystem V.35 Ellipsenumfang VIII.22 Ellipsoid IV.53 Ellipsoid, Volumen von III.45 Enveloppe VII.57 Eulersche Differentialgleichung VII.86 Eulersche Formeln Anh.7 Eulersche Zahl I.7, II.40 Evolute II.74 exakte Differentialgleichung VII.48 Exponentialfunktion I.23, II.35, II.36 Exponentialreihe VIII.14 Extremum II.28 Extremum, zwei Variablen IV.32 Faraday, Gesetz von VI.65 Federschwingung, gedämpfte VII.89 Fehlerrechnung II.20, IV.29 Feldlinie VI.5 Flächen in Parameterdarstellung VI.16 Flächenelement bei Koord.transform. V.34 Flächenelement in Polarkoordinaten V.14 Flächeninhalt unter einer Kurve in Parameterdarstellung III.34 Flächeninhalt bei Kurven in Polarkoord. III.36 Flächennormale IV.52, VI.20 Flächenscharen IV.52 Flächenträgheitsmoment III.59 Flächenträgheitsmoment einer Ellipse V.37 Flächenträgheitsmoment eines Kreisringes V.15 Flächenträgheitsmoment, polares V.10 Flächenverzerrung V.40 Fluchtgeschwindigkeit III.69 Fluss VI.30 Folge I.3 Folge, beschränkte I.4 Folge, geometrische I.12 Folge, harmonische I.8 Fourrierreihe Anh.13 freier Fall mit Reibung VII.13 Fundamentalsatz der Algebra Anh.20 Funktion I.16 Funktion von zwei Variablen IV.3 Funktion von drei Variablen IV.44 Funktion, komplexe Anh.11 Funktion, gerade I.12 Funktion, rational I.23 Funktion, ungerade I.12 Funktionaldeterminante V.40 Funktionalmatrix V.37, V.42 Gauss’sche Fehlerkurve II.60 Gauss’sche Zahlebene Anh.4 Gauss, Satz von VI.35 Gebietsintegral V.3 Gebietsintegral, Koord.transform. V.12 gekoppelte Pendel VII.110 geometrische Reihe VIII.3 Geschwindigkeit II.57 gewöhnliche Differentialgleichung VII.5 Gleichgewichtspunkt VII.106, VII.115 globales Extremum II.28 Gradient IV.48, VI.11 Gradientenfeld IV.49, VI.68 Gravitation der homogenen Kugel V.25 Grenzwert I.6, I.25 Grössenordnung II.49 Hagen-Poiseuille VI.9 Halbwertszeit VII.9 harmonische Funktion VI.45 harmonische Reihe VIII.4 harmonische Schwingung I.42, II.62 harmonische Schwingung, gedämpfte II.63 Hauptsatz der Infinitesimalrechnung III.10 höhere Ableitung II.57 homogene lineare Differentialgleichung VII.36, VII.72 homogenes Vektorfeld VI.6 Hydrodynamik VI.40 hydrostatischer Auftrieb VI.48 hyperbolische Funktionen II.43 Hyperbel II.67 Hyperbel, Fläche der III.37 ideales Gas IV.6, IV.42 Indexpolynom VII.86 Induktivität VII.90 inhomogen lineare Differentialgleichung VII.40, VII.76 injektiv I.45 instabil VII.116 instationär VI.5 Integrabilitätsbedingung IV.21, IV.47, VI.72 Integral mit Parameter V.43 Integral, bestimmtes III.3 Integral, elliptisches VIII.23, VIII.26 Integral, unbestimmtes III.12 Integral, uneigentliches III.67 Integration, partiell III.15 Intervalle I.24 inverse Funktion I.45 Jacobi-Matrix V.37, V.42 Kapazität VII.90 Kettenregel II.8 Kettenregel, verallgemeinerte IV.38, IV.48 Kirchhoff’sches Gesetz VII.90 Klotoide III.43 Koeffizientenvergleich VIII.20 komplexe Funktion Anh.18 komplexe Polynome Anh.20 komplexe Zahl Anh.3 komplexe Zahlebene Anh.4 konform Anh.18 Konjugation Anh.5 konkav II.58 konservatives Vektorfeld VI.67 Kontinuitätsgleichung VI.40 konvergent VIII.3 Konvergenzbereich VIII.6 Konvergenzkreis VIII.16 Konvergenzradius VIII.6, 16 konvergieren I.4 konvex II.58 Koordinatenlinien V.32 Koordinatentransformation I.3, IV.55 Koord.transform. bei Flächenelement V.34 Koord.transform. bei Gebietsintegral V.12, V.30 Koord.transform. bei Volumenintegral V.41 Kopplung VII.113 Kreis II.66 Krümmung II.71 Krümmungskreis II.73 Kugelkoordinaten, Volumenelement V.23 Kugeloberfläche VI.24 Kugelvolumen V.22 Kurven in expliziter Darstellung I.17, II.65 Kurven in impliziter Darstellung II.65 Kurven in Parameterdarstellung II.65 Kurven in Polarkoordinaten II.76 Kurvenschar VII.23, VII.64, VII.66 Lagrange, Verfahren von VII.41, VII.79 Landau-Symbol II.49 Laplace-Operator IV.58, VI.14 Laplace-Operator, Polarkoordinaten IV.59 Laplace’sche Differentialgleichung VI.45 Lemniskate III.38 Limes I.6, I.25 lineare Ersatzfunktion II.15, IV.25 linearisieren II.15, IV.25 Logarithmus-Funktion I.23, II.35 logistisches Modell VII.26 Lösungsfunktion VII.17 Lösungskurve VII.17 Lotka-Volterra, Modell von VII.104 mathematisches Pendel II.20 Maximalstelle II.28, IV.31 Maxwellsche Gleichungen VI.48, VI.66 Minimalstelle II.28, IV.32 Mittelwertsatz der Differentialrechnung II.23 Mittelwertsatz der Integralrechnung III.8 Moivre, Formeln von Anh.7 monoton I.22 I.7 Newton II.61, VII.4, VII.90 Niveaufläche IV.45 Niveaulinie IV.6, VII.48 Normale II.69 Normale zur Fläche IV.52, VI.20 Nullstellen komplexer Polynome Anh.20 Oberflächenberechnung III.49, VI.23 Ohm’scher Widerstand VII.90 Ordnung einer Differentialgleichung VII.6 Orthogonalitätsrelationen Anh.13 Orthogonaltrajektorien VII.52 Oszillator, gedämpft VII.116 Oszillator, ungedämpft VII.118 Parabolspiegel VII.32 Parameterlinie VI.17 Partialsumme VIII.3 partielle Ableitung IV.10 partielle Differentialgleichung VII.6 partielle Integration III.15 partikuläre Lösung VII.38 Pendel, gekoppelt VII.110 Pendel, mathematisches VIII.24 Phasenporträt VII.104 Phasenverschiebung VII.47, VII.94 Polardarstellung einer komplexen Zahl Anh.5 Polarkoordinaten, Flächenelement V.14 Polynom I.23 Polynome, komplexe Anh.20 Polynomzerlegung Anh.21 Potential VI.68 Potentialfeld VI.68, VI.70 Potentialflächen VI.68, VI.70 Potenzfunktion I.23 Potenzreihen VIII.6 Punktfunktion IV.55 Quelle VI.39 quellenfrei VI.39 radioaktiver Zerfall VII.9 Räuber-Beute-Modell VII.104 Rechenregeln der Differentialrechnung II.7 Rechenregeln der Integralrechnung III.5 Rechenregeln für Folgen I.11 Rechenregeln für Grenzwerte I.30 reguläre Kurvenschar VII.23, VII.64, VII.66 Reihe VIII.3 Reihe, geometrische I.12 Resonanzfrequenz VII.97 Richtungsableitung IV.50 Richtungsfeld VII.17 Riemann’sches Integral III.4 Roboter I.21, V.38 Rotation VI.13, VI.63 Sattel IV.26 Scharparameter VII.4, VII.23, VII.64 Schraube VI.22 Schwarz, Satz von IV.18 Schwebung VII.114 Schwerpunkt III.54 Schwingungsprobleme VII.89 Sektorfläche III.36 Senke VI.39 separierbare Differentialgleichung VII.25 separieren VII.25 singuläre Lösung VII.57 Skalarfeld VI.3 Spirale, logarithmische II.77 stabil VII.118 Stabilitätsverhalten VII.115 stationär VI.5 stationäre Lösung VII.47, VII.94, Steigung des Graphen II.3 Steigung von Kurven in Parameterdarst. II.69 Steigung von Kurven in Polarkoord. II.76 stetig I.32 Stetigkeit I.25 Stokes, Satz von VI.56, VI.65 Störglied VII.36, VII.77, VII.97 Strömungslehre Anh.18 Strudelpunkt VII.120 Substitution, Methode der III.19 Symbiose VII.116 Systeme von Differentialgleichungen VII.102 Systeme von Differentialgleichungen, autonome VII.103 Tangente II.3, II.69 Tangentenfläche VI.20 Tangentialebene IV.25, VI.20 Taylorpolynom VIII.10 Taylorreihe VIII.14 totales Differential IV.28 Trägheitsmoment III.58 Trägheitsmoment einer Kugel III.62 Trägheitsmoment eines Rotationskörpers III.61 Trägheitsmoment eines Tetraeders V.21 Trägheitsmoment eines Torus III.63 Trägheitsmoment eines Vollzylinders III.60 Trajektorie VII.48, VII.104 Translation Anh.16 trigonometrische Funktionen I.23 uneigentliche Integrale III.67 ungerade Funktion I.22 Vektorfeld IV.49, VI.3 Vektorfeld, homogenes VI.6 Vektorfeld, konservatives VI.67 Volumen III.45 Volumen eines Ellipsoids III.45 Volumen eines Zylinderhufs III.47 Volumenelement bei Koord.transform. V.41 Volumenelement bei Kugelkoordinaten V.23 Volumenelement bei Zylinderkoordinaten V.29 Volumenintegral V.17 Wachstum, ungestörtes VII.7 Wallis, Formel von III.27 Wärmeleitungsgleichung VI.43 Weg VI.51 Wellengleichung IV.60 Wertetabelle I.17 winkeltreu Anh.18 wirbelfrei VI.13, VI.64 Wirbelstärke VI.64 Wurf VII.59 zweite Ableitung II.57 Zwischenwertsatz I.34 Zykoide II.70 Zykloide, Länge der III.40 zyklometrische Funktionen I.51 Zylinderhufs, Volumen eines III.47 Zylinderkoordinaten, Volumenelement V.29