Analysis I/II: Differential- und Integralrechnung für Ingenieure

U. Stammbach Prof. em. ETH Analysis I/II Maschinenbau und Verfahrenstechnik / Mechanical and Process Engineering Materialwissenschaft / Materials Science 2014 Nachdruck Juni 2014 c by U. Stammbach 1995 http://www.math.ethz.ch/∼stammb stammb@math.ethz.ch Vorwort Diese Notizen gehören zu einer einführenden Vorlesung über Differential- und Integralrechnung für Ingenieure (Maschinen- und Werkstoffingenieure), wie sie an der ETH-Zürich im ersten Studienjahr vorgesehen ist. Die Aufgabe dieser Lehrveranstaltung ist es, den Studenten in die Sprache der Mathematik einzuführen und ihn mit der entsprechenden, für sein Gebiet notwendigen Mathematik bekannt zu machen. Die Anwendungen der Differential- und Integralrechnung in den für den Ingenieur interessanten Gebieten Mechanik, Physik u.a. sind im grossen und ganzen über die Jahre hinweg die gleichen geblieben. So wird man von diesem Text im Vergleich zu anderen nichts grundlegend Neues erwarten; die Stoffauswahl bewegt sich im Rahmen des Üblichen. Allerdings ist nicht zu verkennen, dass sich für den Ingenieur, was die mathematischen Anwendungen betrifft, in letzter Zeit doch auch vieles geändert hat: Die Art und Weise etwa, wie der Ingenieur Mathematik einsetzt, hat sich mit den Möglichkeiten des Computers rasant entwickelt. Man denke etwa an numerische Methoden (die Numerische Mathematik hat allerdings im gültigen Studienplan ihren eigenen Platz), an die Möglichkeiten des symbolischen Rechnens und an den Einsatz von Graphiken und schliesslich auch an die vielen ganz neuartigen Anwendungen der Mathematik in den Ingenieurwissenschaften. Stellvertretend für andere sei etwa die Methode der Finiten Elemente genannt. Es ist ganz klar, dass sich damit auch die Anforderungen an die vorliegende Vorlesung geändert haben. Insbesondere ist der Wunsch nach mehr Stoff und nach “tieferer” Mathematik zu verspüren. Hier gilt es, die richtigen Konsequenzen zu ziehen: Nicht Vollständigkeit darf im Vordergrund stehen, sondern das Bemühen, den Studenten in die Lage zu versetzen, die Mathematik, die er im Laufe seines Studiums und seines Berufslebens braucht, zu erarbeiten und zu verstehen. Tragfähige Grundlagen sind also gefragt und nicht Rechenfertigkeit, das Wissen um Zusammenhänge und nicht vereinzelte Details! Das eben Gesagte ist einer der Gründe, weshalb ich eine radikale Umgestaltung der traditionellen Analysis-Vorlesung, etwa in Richtung einer Anleitung für den Einsatz von Computern im Ingenieurwesen, der Sache nicht für dienlich halte. Das folgende Beispiel möge diesen Punkt etwas näher erläutern. In einer Zeit, wo Computerprogramme (Mathematica, Macsyma, etc.) die Techniken des symbolischen Differenzierens und Integrierens bestens beherrschen, ist es sicherlich nicht sehr sinnvoll, zum Erlernen dieser Rechenfertigkeiten noch viel Vorlesungszeit einzusetzen. Viel wichtiger, als die Rechen-Technik in allen Feinheiten zu beherrschen, scheint mir heute für den angehenden Ingenieur zu sein, dass er die mathematische Idee in ihrem Wesen und ihren Konsequenzen versteht und sie anzuwenden weiss. Dies gilt bekanntlich auch dann, wenn Computer zur Verfügung stehen; denn: “Wer für seine Probleme den Computer einsetzen will, muss mehr Mathematik wissen und sie besser verstanden haben”. Dies führt nun allerdings in ein gewisses Dilemma, denn es ist klar, dass die Konzentration auf die mathematische Idee es dem Studenten nicht einfacher sondern schwerer macht. Nach wie vor besteht nämlich der einzige Weg zum Verständnis der mathematischen Idee darin, die zugehörige Technik eigenhändig anzuwenden; denn: “Mathematics is not a spectator sport; mathematics is learned by doing, not by watching!” Der Student (und auch der Lehrer!) tut gut daran, sich dies immer wieder in Erinnerung zu rufen und sich dem Rechnen, das an sich der Computer ja so viel besser beherrschen würde, nicht zu verschliessen. Zwei offensichtliche, aber wichtige Konsequenzen dieser Tatsache sind in der Lehrveranstaltung, zu der dieser Text gehört, berücksichtigt worden. Der Text enthält eine grosse Anzahl von vollständig durchgerechneten Beispielen, und zur Lehrveranstaltung gehören umfangreiche Übungen. Ein intensiver Einsatz des Computers würde theoretisch vielleicht vieles davon redundant machen; ich glaube aber nicht an die praktische Weisheit eines solchen radikalen Schrittes. Der Computer ist ein ausserordentlich wichtiges Hilfsmittel, und wir ziehen ihn auf selbstverständliche Art, insbesondere bei der Stoffvermittlung herbei; nur eben: Das Verstehen der mathematischen Idee nimmt dem Studenten kein Computer ab. Meine Erfahrung, die ich im Laufe der Jahre mit der Betreuung von mathematischen Lehrveranstaltungen für Ingenieure immer und immer wieder gemacht habe, ist die, dass den Studenten allzu oft die Motivation1 fehlt, sich mit den abstrakten mathematischen Werkzeugen zu beschäftigen. Zwar gibt es den mathematisch interessierten Studenten an den Ingenieurabteilungen auch, aber er ist doch eher die Ausnahme als die Regel. Diese Notizen versuchen, dieser Tatsache Rechnung zu tragen: nicht nur werden mathematische Begriffsbildungen aus der Anschauung heraus motiviert, sei es geometrisch oder mit Hilfe einer praktischen Fragestellung, sondern es werden auch die mathematischen Techniken und Resultate regelmässig durch zahlreiche Beispiele aus der Mechanik, Physik und aus den Ingenieurwissenschaften illustriert. Ein Weiteres: die mathematische Vorbildung der an die ETH eintretenden Studenten ist ausserordentlich heterogen. Was einzelne Studenten bestens beherrschen, ist für andere völlig neu. Eine nicht geringe Zahl der neueintretenden Studenten kennt z.B. die Differentialrechnung nur für ganz einfache Funktionen und die Integralrechnung praktisch nur dem Namen nach. Ausserdem sind bei vielen Studenten gewisse grundlegende Begriffe, wie etwa der Begriff der Funktion, nur in einer völlig ungenügenden Form vorhanden. So ist es schliesslich auch Aufgabe dieser Vorlesung, den Wissensstand der Studenten zuerst auf ein vergleichbares Niveau zu bringen, und dafür zu sorgen, dass die “Sprache”, d.h. die Notation und die verwendeten Begriffe, in genügender Schärfe und genügender Allgemeinheit vorhanden sind. Zu diesem Zweck beginnt die Vorlesung auf einem relativ tiefen Niveau, schreitet dann aber rasch vorwärts. Für einen Teil der Studenten ist am Anfang vieles Wiederholung. Ich habe mich allerdings bemüht, diesem Stoff Blickwinkel abzugewinnen, die auch für den gut vorbereiteten Studenten neu sein dürften. Nicht vergessen sollte man also, dass dieser erste Teil die wichtige Funktion hat, eine genügend flexible und starke Sprache zu vermitteln, wie sie für die späteren Kapitel benötigt wird. Würde man diesen ersten Teil noch kürzer fassen, könnte später vieles nur umständlicher und mit wesentlich mehr Zeitaufwand gesagt werden. 1 Sehr oft fehlt den Studenten “dank” den gültigen Studienplänen auch ganz einfach die Zeit; denn die Erarbeitung mathematischer Gedankengänge braucht Zeit, ruhige ungestörte Zeit. Es handelt sich eben nicht einfach darum, Fakten zu lernen, sondern darum, sich Denkprozesse anzueignen. Dies setzt eine Reifung voraus, die wie überall in der Natur ihre Zeit braucht. Post festum allerdings erscheint dann alles klar und leicht! Die hier beschriebene Situation bedingt, dass dieser erste Teil für die Studenten, die sich als ungenügend vorbereitet empfinden, wohl etwas zu konzentriert ist. Empfehlenswert ist in diesem Fall die zusätzliche Erarbeitung eines weiteren Textes (siehe unten). Es ist nicht zu verkennen, dass der vorliegende von anderen Texten vieles übernommen hat. Hier ist einmal die frühere Autographie von Huber-Henrici zu nennen; ich hoffe, dass die ihr zugrundeliegenden didaktischen Erfahrungen in diesen Text hinüber gerettet werden konnten. Aus der hervorragenden Autographie von Blatter2 stammen eine ganze Anzahl von Beispielen, und oft liess ich mich auch durch Blatters Darstellung beeinflussen. Dem etwas mathematisch interessierteren Studenten ist diese Autographie bestens zu empfehlen. Noch etwas mathematischer ist das ebenfalls hervorragende Werk von Burg, Haf und Wille3 , dessen erster Band sich auch gut als Begleitlektüre für die Studenten eignet, die sich als nicht genügend vorbereitet einschätzen. Der Text wurde mit Hilfe des Schreibsystems LATEX produziert. Danken für die Hilfe bei der Tipparbeit möchte ich Frau Meuli, und den Herren Harpes, Hoffmann und Schünemann. Die Graphiken wurden mit dem System Mathematica erstellt, das im Rahmen der Lehrveranstaltung auch für umfangreiche Computerdemonstrationen verwendet wurde. Hier bin ich den Herren Collart, Küchlin und Mall zu Dank verpflichtet. Danken möchte ich auch den Studenten, die in einer früheren Fassung viele Fehler und Unklarheiten entdeckt haben. - Schliesslich noch eine Bemerkung an die Leserinnen: ich konnte mich nicht dazu durchringen, das schwerfällige “Leser und Leserin” oder das schreckliche “LeserIn” zu verwenden und bin beim alten “Leser” geblieben; man bzw. frau möge mir verzeihen. Ich gebrauche die deutsche Sprache so, wie sie im Laufe der Zeit gewachsen ist: definitionsgemäss und ganz selbstverständlich sind mit den Worten “Leser” und “Student” immer auch die weiblichen Entsprechungen gemeint. Genau gleich übrigens, wie “Geisel” und “Person” definitionsgemäss und selbstverständlich auch Männliches bezeichnet. Zürich, im September 1991 Auf Grund einer Anregung aus Studentenkreisen erscheint der Text im Studienjahr 1995/96 erstmals als Serie von drei kleinen Bändchen, Teil A, B und C. Ein Dank geht an die vielen Studenten, die mitgeholfen haben, Druckfehler und Unklarheiten früherer Fassungen auszumerzen. Zürich, im September 1995 In den sukzessiven Neudrucken wurden jeweils die bekannt gewordenen Druckfehler korrigiert. Zürich, im Juni 2014 2 3 Ch. Blatter: Ingenieuranalysis I/II, Verlag der Fachvereine Zürich Burg,Haf,Wille: Höhere Mathematik für Ingenieure I/II/III/IV, B.G.Teubner Stuttgart Inhaltsverzeichnis, Teil A Kapitel I. Funktionen 1 Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3 Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . 25 4 Der Zwischenwertsatz für stetige Funktionen . . . . . . . . . . . . . . . . . . . . 34 5 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6 Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 7 Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Kapitel II. Differentialrechnung 1 Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3 Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . 23 4 Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . . 35 6 Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 49 7 Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 57 8 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Kapitel III. Integralrechnung 1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . . 7 3 Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . . 15 5 Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6 Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 7 Flächenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 8 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 9 Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 10 Oberflächenberechnung 49 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Schwerpunkt, Flächenmittelpunkt . . . . . . . . . . . . . . . . . . . . . . . . . . 54 12 Trägheitsmoment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 13 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Inhaltsverzeichnis, Teil B Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3 Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . . 18 4 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6 Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 7 Funktionen von drei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 8 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Kapitel V. Funktionen von mehreren Variablen, Integralrechnung 1 Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . . 12 3 Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . . 30 5 Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Kapitel VI. Vektoranalysis 1 Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Differentialoperatoren der Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . 11 3 Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4 Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5 Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6 Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 9 Eine Anwendung des Satzes von Stokes . . . . . . . . . . . . . . . . . . . . . . . 65 10 Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Inhaltsverzeichnis, Teil C Kapitel VII. Gewöhnliche Differentialgleichungen 1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . . 17 4 Separierbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6 Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . . 48 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . . 57 8 Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . . 64 9 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . 72 10 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . . 83 11 Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 12 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107 14 Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Kapitel VIII. Potenzreihen 1 Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . 3 2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Anhang. Komplexe Zahlen 1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Sachverzeichnis Teil A Kapitel I. Funktionen Kapitel II. Differentialrechnung Kapitel III. Integralrechnung Wenn [das] Fundament fehlt, so schwebt das Spezialwissen haltlos im Raum, es beschränkt sich auf das Auswendiglernen von Fakten, es kann nicht in einen Zusammenhang gestellt und sinnvoll verwertet werden. Fehlendes Grundwissen lässt sich aber nicht nachholen. Prof. Dr. A.P. Speiser, ehemaliger Chef der Konzernforschung BBC/ABB Inhaltsverzeichnis, Teil A Kapitel I. Funktionen 1 Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3 Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . 25 4 Der Zwischenwertsatz für stetige Funktionen . . . . . . . . . . . . . . . . . . . . 34 5 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6 Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 7 Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Kapitel II. Differentialrechnung 1 Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3 Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . 23 4 Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . . 35 6 Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 49 7 Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 57 8 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Kapitel III. Integralrechnung 1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . . 7 3 Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . . 15 5 Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6 Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 7 Flächenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 8 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 9 Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 10 Oberflächenberechnung 49 11 Schwerpunkt, Flächenmittelpunkt 12 Trägheitsmoment 13 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel I. Funktionen Dem Ingeniör ist nichts zu schwör Aus einem Inserat der SAIA AG, Murten 15 10 5 -4 -2 2 4 -5 -10 Inhaltsverzeichnis 1 Folgen, Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3 Grenzwerte von Funktionen, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . 25 4 Der Zwischenwertsatz für stetige Funktionen . . . . . . . . . . . . . . . . . . . . 34 5 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6 Die inverse Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 7 Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3 Kapitel I. Funktionen 1 Folgen, Konvergenz Eine Folge von reellen Zahlen ist eine Abbildung der natürlichen Zahlen 1, 2, . . . (oder auch 0, 1, 2, . . .) in die reellen Zahlen. Für jede natürliche Zahl n ist somit eine reelle Zahl an festgelegt: 1 → a1 2 → a2 3 → a3 .. . n → an .. . Die Folge wird oft kurz durch ihre Werte a1 , a2 , . . . beschrieben. Das Bildungsgesetz der Folge kann verschiedene Gestalt besitzen. In manchen Fällen ist das n-te Glied an durch eine geschlossene Formel gegeben. Beispiel an = −5 + 3n , n ≥ 1 . Sehr oft ist dies allerdings nicht der Fall. Für die Anwendung sehr wichtig sind die Folgen, wo die Glieder rekursiv bestimmt werden: a1 ist gegeben; an+1 lässt sich nach einer gegebenen Vorschrift aus a1 , a2 , . . . , an berechnen. Beispiel Es sei c > 0 eine reelle Zahl. Die Folge a1 = 1, an+1 1 c = an + 2 an , n≥1, ist rekursiv gegeben. Der mathematische Begriff der Folge ist sowohl für die Theorie wie für die Anwendungen ganz fundamental. So bestehen Computerberechnungen zum Beispiel oft darin, rekursiv definierte √ Folgen zu erzeugen. Berechnet man mit Hilfe eines Taschenrechners die Quadratwurzel c, so geschieht dies dadurch, dass die ersten Glieder einer Folge a1 , a2 , . . . bestimmt werden, deren Bildungsgesetz im Taschenrechner fest programmiert ist. Diese Folge hat die Eigenschaft, dass von einem bestimmten Index m an alle Glieder am+k , k ≥ 0 in allen angezeigten Dezimalstellen √ mit dem Dezimalbruch von c übereinstimmen, wobei die letzte angezeigte Stelle natürlich gerundet ist. Es werden dann mindestens die ersten m Glieder der Folge ausgerechnet. Dass die √ verwendete Folge diese Eigenschaft hat, folgt aus der Tatsache, dass sie “gegen c konvergiert”. Den Begriff der Konvergenz werden wir in diesem Abschnitt genau definieren. 4 U. Stammbach: Analysis, Teil A Zur Diskussion von Folgen ist es oft nützlich, die Glieder als Punkte in einem kartesischen Koordinatensystem aufzufassen; das Glied an wird als Punkt (n, an ) dargestellt (siehe Figur 1). Definitionen Eine Folge a1 , a2 , . . . heisst beschränkt, wenn ihr Bild ganz in einem endlich breiten, waagerechten Parallelstreifen enthalten ist. 7 6 5 Fig. 1 : Zur Darstellung von Folgen 4 3 2 1 2 4 6 8 10 (n) Eine Folge heisst (strikt) monoton wachsend, wenn für alle n gilt an+1 ≥ an (bzw. an+1 > an ) . Die Folge a1 , a2 , . . . heisst Nullfolge, falls es zu jeder noch so kleinen Zahl > 0 ein m gibt, so dass für alle Glieder am+k , k ≥ 0 gilt |am+k | < . Man sagt in diesem Fall, die Folge konvergiere gegen Null oder strebe gegen Null. In Zeichen drückt man dies durch 5 Kapitel I. Funktionen lim an = 0 n→∞ oder durch an → 0 für n → ∞ aus. Das geometrische Bild einer Nullfolge hat die Eigenschaft, dass in jedem noch so schmalen Parallelstreifen mit der x-Achse als Mittellinie alle Glieder der Folge mit Ausnahme von endlich vielen liegen. Beispiel Figur 2). Die Folge gegeben durch an = 1/n, n ≥ 1 ist offensichtlich eine Nullfolge (siehe 1.5 1 Fig. 2 : Die Folge 1/n 0.5 5 10 15 20 (n) -0.5 Beispiel Die Folge gegeben durch an = 1 1 + (−1)n 2 2 n ist offenbar beschränkt (siehe Figur 3). Sie hat zusätzlich die Eigenschaft, dass in jedem Parallelstreifen mit Mittellinie auf dem Niveau 1/2 alle Glieder der Folge bis auf endlich viele liegen. 6 U. Stammbach: Analysis, Teil A 0.8 0.6 0.4 Fig. 3 : 0.2 5 10 15 20 1 1 + (−1)n 2 2 n (n) -0.2 -0.4 -0.6 In einem solchen Fall sagen wir, die Folge konvergiere gegen den Grenzwert a = 1/2. Die genaue Definition dieses wichtigen Begriffes ist wie folgt. Man sagt, die Folge a1 , a2 , . . . konvergiere gegen den Grenzwert oder Limes a, falls die Folge bn = an − a eine Nullfolge ist, d.h. wenn es zu jeder noch so kleinen Zahl > 0 ein m gibt, so dass für alle Glieder am+k , k ≥ 0 gilt |am+k − a| < . In Zeichen drückt man dies aus durch lim an = a n→∞ oder durch an → a für n → ∞ aus. Eine Folge, die konvergiert, heisst konvergent, eine Folge die nicht konvergiert, heisst divergent. 7 Kapitel I. Funktionen Aus unserer Definition folgt sofort, dass eine konvergente Folge beschränkt ist. Wir können diesen logischen Sachverhalt auch so ausdrücken: Eine nicht beschränkte Folge ist nicht konvergent. Ferner lässt sich leicht zeigen, dass eine konvergente Folge nicht gegen mehr als einen Grenzwert konvergieren kann: ist die Folge konvergent, so ist ihr Limes eindeutig bestimmt. Sehr wichtig ist nun die Tatsache, dass in manchen Fällen gezeigt werden kann, dass eine Folge konvergiert, ohne dass über deren Limes a priori etwas bekannt ist. Dies ist z.B. auf Grund des folgenden Satzes möglich, welcher eine fundamentale Eigenschaft der reellen Zahlen beschreibt. Wir führen ihn hier ohne Beweis auf. Satz Ist eine Folge monoton wachsend (oder fallend) und beschränkt, so ist sie konvergent. Beispiel Ein ganz einfaches Beispiel ist das folgende. Jeder unendliche Dezimalbruch definiert eine monoton wachsende, beschränkte Folge (von rationalen Zahlen), indem man als Glieder der Folge einfach die endlichen Dezimalbrüche nimmt. Die Zahl π zum Beispiel definiert die Folge 3, 3.1, 3.14, 3.141, 3.1415, 3.14159, 3.141592, 3.1415926, . . . Nach obigem Satz konvergiert die so erhaltene Folge; ihr Limes ist die durch den unendlichen Dezimalbruch dargestellte reelle Zahl. Beispiel (siehe Figur 4) an = 1 + 1 1 1 1 + + + ··· + , n ≥ 1. 1! 2! 3! n! Diese Folge ist (strikt) monoton wachsend und - wie wir unten zeigen - beschränkt. Deshalb ist sie nach dem obigen Satz auch konvergent. Ihr Limes, der a priori nicht bekannt ist und erst mit Hilfe dieser Folge berechnet werden kann, ist die Euler’sche Zahl e. Es ist bekannt, dass die Zahl e irrational ist, d.h. durch einen unendlichen nichtperiodischen Dezimalbruch dargestellt wird. Näherungsweise gilt e = 2.7182818284590 · · ·. Die Zahl e spielt als Basis der natürlichen Logarithmen in der Mathematik eine grosse Rolle. Um zu zeigen, dass die Folge beschränkt ist, 1 2! 1 3! 1 4! benützen wir die offensichtlichen Abschätzungen 1 ≤ 2 1 ≤ 22 1 ≤ 23 .. . 1 1 ≤ n−1 n! 2 .. . 8 U. Stammbach: Analysis, Teil A 3.5 3 2.5 Fig. 4 : 2 an = 1 + 1.5 1 1 1 1 + + + ··· + 1! 2! 3! n! 1 0.5 2 4 6 8 10 12 (n) -0.5 Es ist dann an = 1 + 1 1 1 1 1 1 1 + + + ··· + ≤ 1 + 1 + 1 + 2 + · · · + n−1 = x . 1! 2! 3! n! 2 2 2 Damit gilt 1 1 3 1 x = x − x = − n, 2 2 2 2 also x=3− 1 2n−1 < 3. Die Folge ist also beschränkt, es gilt 0 < an < 3. Beispiel Die harmonische Folge (siehe Figur 5) ist definiert durch an = 1 + 1 1 1 + + ··· + . 2 3 n 9 Kapitel I. Funktionen Diese Folge ist offensichtlich ebenfalls (strikt) monoton wachsend. Um über die Konvergenz zu entscheiden, muss man nur untersuchen, ob sie beschränkt ist. Ist sie beschränkt, so ist sie nach unserem Satz auch konvergent. Ist sie nicht beschränkt, so kann sie nach unseren früheren Aussagen auch nicht konvergent sein. Wir zeigen anschliessend, dass die Glieder der Folge beliebig gross werden, wenn nur ihr Index genügend gross ist. Die Folge ist somit in der Tat nicht beschränkt. Die harmonische Folge ist nicht konvergent. 8 6 Fig. 5 : 4 1+ 1 1 1 + + ··· + 2 3 n 2 (n) 50 100 150 200 250 Um zu zeigen, dass unsere Folge nicht beschränkt ist, benützen wir die Beziehung a2n − an = 1 1 1 n 1 + + ··· + ≥ = , n+1 n+2 n+n 2n 2 die unmittelbar aus der Definition folgt. Daraus ergibt sich a2 a22 a23 = a1 + (a2 − a1 ) = a2 + (a22 − a2 ) = a22 + (a23 − a22 ) .. . a2r = a2r−1 + (a2r − a2r−1 ) ≥ 1 + r/2 . ≥ 1 + 1/2 , ≥ 1 + 2/2 , ≥ 1 + 3/2 , Die Glieder der Folge werden also beliebig gross, die Folge ist nicht beschränkt. 10 U. Stammbach: Beispiel Analysis, Teil A Wir kehren zurück zur Folge des ersten Beispiels, nämlich zu a1 = 1, an+1 1 c = an + 2 an , n≥1, wobei c > 0 eine feste reelle Zahl bezeichnet (siehe Figur 6). Wir behaupten, dass diese Folge √ konvergiert, und zwar gegen c. Um dies zu beweisen, müssen wir nachweisen, dass die Folge √ b1 , b2 , b3 , . . . mit bn = an − c eine Nullfolge ist. Aus der Definition von an+1 erhalten wir 3 2.5 2 Fig. 6 : 1.5 a1 = 1, an+1 = 1 0.5 (n) 2 4 6 8 -0.5 bn+1 = an+1 − √ c = = = √ 1 c − 2 c) (an + 2 an √ 1 (a2n + c − 2an c) 2an √ 1 (an − c)2 . 2an Wegen an ≥ 0 ergibt sich daraus bn ≥ 0 für n = 2, 3, . . .. Ferner erhalten wir bn+1 = √ an − c · bn 2an 1 3 an + 2 an 11 Kapitel I. Funktionen = √ ! 1 c · bn . − 2 2an Nun gilt für n ≥ 2 wegen bn+1 ≥ 0 und bn ≥ 0 auch √ 1 c ≥ 0. − 2 2an Da auch √ c/2an positiv ist, folgt 0≤ √ 1 c 1 < . − 2 2an 2 Damit erhalten wir 1 |bn+1 | < |bn | , 2 d.h. die Folge b1 , b2 , b3 , . . . ist in der Tat eine Nullfolge. Für das Rechnen mit konvergenten Folgen gelten einfache Rechenregeln, die wir kurz zusammenstellen. Es seien a1 , a2 , . . . und b1 , b2 , . . . zwei konvergente Folgen mit limn→∞ an = a und limn→∞ bn = b. Dann gilt lim (an + bn ) = a + b , n→∞ lim (an − bn ) = a − b , n→∞ lim (an · bn ) = a · b , n→∞ lim (an /bn ) = a/b , n→∞ wobei für Letzteres natürlich vorausgesetzt werden muss, dass b und alle bn verschieden von Null sind. Wir verzichten in dieser Vorlesung auf einen Beweis dieser Regeln, möchten aber die beiden folgenden Bemerkungen anfügen. Sind die beiden Folgen a1 , a2 , . . . und b1 , b2 , . . . durch unendliche Dezimalbrüche gegeben, so besagen diese Rechenregeln nichts anderes, als dass man approximativ mit den endlichen Teilbrüchen rechnen darf. Eine Tatsache, die man natürlich etwa beim Rechnen mit π immer schon benützt hat. Zum zweiten muss der Leser gewarnt werden, diese Regeln in Fällen anzuwenden, wo die Folgen a1 , a2 , . . . und b1 , b2 , . . . nicht konvergieren. In diesem Fall gelten die Regeln nicht, und deren Anwendung liefert leicht falsche Resultate. Beispiel n+3 1 + 3/n 1 = lim = n→∞ 2n + 5 n→∞ 2 + 5/n 2 lim 12 Beispiel U. Stammbach: Analysis, Teil A n3 + n2 + 1 1 + 1/n + 1/n3 1 =− = lim n→∞ −3n3 + 13 n→∞ −3 + 13/n3 3 lim Beispiel 17n2 existiert nicht n→∞ 18n + 1 lim Beispiel lim n→∞ 2n2 n2 + 3 !4 = lim n→∞ 2 1 + 3/n2 4 = 24 Zum Schluss dieses Abschnittes gehen wir noch kurz auf die geometrische Folge und die geometrische Reihe ein. Beispiel Eine Folge der Form a0 = a, a1 = aq, · · · , an = aq n , · · · heisst geometrische Folge. Die Zahl a heisst Anfangsglied, die Zahl q heisst Faktor der Folge. Für |q| > 1 gilt |an+1 | = |an q| = |an ||q| > |an |. Die Absolutbeträge der Glieder der Folge werden mit wachsendem n beliebig gross; die Folge ist in diesem Fall nicht beschränkt, also auch nicht konvergent. Für |q| < 1 hingegen gilt |an+1 | = |an q| = |an ||q| < |an |. Die Absolutbeträge der Glieder werden mit wachsendem n beliebig klein. Ist nämlich > 0 irgendeine positive reelle Zahl, so gilt |am | < , wenn nur m gross genug ist. Die Bedingung |aq m | < liefert nämlich log |a| + m log |q| < log , woraus sich wegen log |q| < 0 sofort m> log − log|a| log |q| ergibt. Diese Überlegung zeigt, dass für |q| < 1 die geometrische Folge eine Nullfolge ist. Beispiel Schliesslich wenden wir uns noch der sogenannten geometrischen Reihe zu. Darunter versteht man die Folge, die durch 13 Kapitel I. Funktionen s0 s1 = 1, = 1 + x, .. . sn = 1 + x + x2 + · · · + xn , sn+1 = 1 + x + x2 + · · · + xn + xn+1 , gegeben ist. Dabei bezeichnet x eine reelle Zahl. (Der Leser mache sich den Unterschied zwischen den Begriffen “Folge” und “Reihe” klar!) Rekursiv kann man die Folge s0 , s1 , s2 , . . . beschreiben durch s0 = 1; sn+1 = sn + xn+1 , n ≥ 0. Man erhält leicht xsn − sn = xn+1 − 1, woraus sich sofort sn = 1 − xn+1 1 xn+1 = − 1−x 1−x 1−x ergibt. Ist |x| < 1, so strebt der zweite Summand für n → ∞ offensichtlich gegen Null. Deshalb konvergiert in diesem Fall die Folge s0 , s1 , s2 , . . ., und es gilt lim (1 + x + x2 + · · · + xn ) = n→∞ 1 , |x| < 1. 1−x Für |x| > 1 ist die Folge s0 , s1 , s2 , . . . offenbar nicht beschränkt, so dass sie in diesem Fall auch nicht konvergent ist. Man sagt etwas kürzer, die geometrische Reihe 1 + x + x2 + · · · + xn + · · · konvergiere für |x| < 1 gegen 1/(1 − x) und divergiere für |x| > 1, indem man die Konvergenz bzw. Divergenz der Reihe durch die Konvergenz bzw. Divergenz der zugehörigen Folge definiert (siehe Figuren 7,8,9). Konsequenterweise schreibt man dann 1 + x + x 2 + · · · + xn + · · · = 1 , für |x| < 1. 1−x Die linke Seite dieser Formel kann man als “alternative” Definition der Funktion f :x→ 1 , D(f ) = (−1, +1) 1−x auffassen (siehe Figur 10). (Der Leser beachte die Einschränkung des Definitionsbereiches!) Insbesondere kann der Funktionswert f (x) für |x| < 1 als Limes unserer Folge s0 , s1 , s2 , . . . berechnet werden. Für die einfache Funktion f scheint dies fast eine Spielerei zu sein; für kompliziertere Funktionen bildet eine Reihe aber oft die natürlichste Art, die Funktion darzustellen und den Funktionswert zu bestimmen. Wir werden auf dieses Thema unter dem Stichwort Potenzreihen später wieder zu sprechen kommen und uns etwas eingehender damit beschäftigen. 14 U. Stammbach: Analysis, Teil A 2 1.5 Fig. 7 : Geometrische Reihe mit x = 0.3 1 0.5 2 4 6 8 10 12 (n) -0.5 12 10 8 Fig. 8 : Geometrische Reihe mit x = 0.9 6 4 2 (n) 10 20 30 40 15 Kapitel I. Funktionen 1.2 1 0.8 Fig. 9 : Geometrische Reihe mit x = −0.9 0.6 0.4 0.2 (n) 10 20 30 40 -0.2 20 15 Fig. 10 : Die Funktion 10 x→ 5 (x) -1 -0.5 0.5 1 1 1−x 16 2 U. Stammbach: Analysis, Teil A Funktionen Eine Funktion oder Abbildung von der Menge A in die Menge B, f : A → B, ist eine Vorschrift, die für jedes Element x ∈ A ein Element f (x) ∈ B festlegt, f : x → f (x). f (x) heisst Funktionswert von f an der Stelle x oder Bild von x unter f . A heisst Definitionsbereich D(f ) von f (englisch: domain), B heisst Zielbereich von f (englisch: range), W (f ) = {f (x)|x ∈ D(f )} heisst Wertebereich von f . Es handelt sich beim Begriff der Funktion um einen der ganz zentralen Begriffe der Mathematik. Er hat eine lange historische Entwicklung durchgemacht; erst in neuester Zeit hat er den obigen sehr genau bestimmten Inhalt erhalten. Der Leser tut gut daran, sich mit diesem Begriff eingehend auseinanderzusetzen. Eine etwas anschaulichere Beschreibung des Funktionsbegriffs ist die folgende. Eine Funktion f : A → B ist ein “schwarzer Kasten”, der als Input nur Elemente von A annimmt, und für jedes x ∈ A den Output f (x) ∈ B liefert. Konkret (aber wegen der beschränkten Rechengenauigkeit nur annäherungsweise) kann man etwa einen Taschenrechner mit der Taste log als Funktion f : x → log x ansehen. Der Begriff der Funktion ist sehr allgemein, über die Natur der Elemente von A und B zum Beispiel wird überhaupt nichts vorausgesetzt. Zuerst betrachten wir nun Beispiele von Funktionen, welche auf einem Teilbereich der reellen Zahlen definiert sind und welche reelle Zahlen als Werte annehmen, also reellwertige Funktionen einer reellen Variablen. Zu jeder solchen Funktion f gehört ihr Graph Γ(f ), nämlich die Menge der Punkte (x, y) ∈ R × R mit x ∈ D(f ), y = f (x) Γ(f ) = {(x, y) ∈ R × R| x ∈ D(f ), y = f (x)}. Beispiel Die Sinusfunktion f : x → sin x; f : R → R; D(f ) = R, W (f ) = [−1, +1]. Man beachte W (f ) 6= B; im allgemeinen können Zielbereich und Wertebereich verschieden sein. Beispiel f :x→ √ x − 1 ; f : [1, ∞) → R, D(f ) = [1, ∞); W (f ) = [0, ∞). Bei Funktionen, wie sie in Anwendungsbeispielen auftreten, ist der Graph üblicherweise eine Kurve; es lassen sich aber durchaus kompliziertere Funktionen denken, deren Graph in keinem vernünftigen Sinn als Kurve aufgefasst werden kann. Beispiel Die Funktion f : R → R sei durch die folgende Vorschrift gegeben: 17 Kapitel I. Funktionen ( f (x) = 1, falls x rational ist, 0, falls x irrational ist . √ Es gilt also insbesondere f (1/2) = 1 und f ( 2) = 0. Der Graph dieser Funktion ist keine Kurve im anschaulichen Sinn. Funktionen lassen sich auf sehr viele verschiedene Arten definieren, beschreiben und anschaulich machen. Auf einige der wichtigsten Arten gehen wir im Folgenden ein. (i) Wertetabelle Ist D(f ) eine endliche Menge, so kann f durch eine Wertetabelle beschrieben werden; ist z.B. D(f ) = {x0 , x1 , ...., xN }, so genügt es f (x0 ), f (x1 ), ...., f (xN ) aufzuführen: x x0 x1 x2 ··· xN f (x) f (x0 ) f (x1 ) f (x2 ) · · · f (xN ) Wenn D(f ) eine unendliche Menge ist, so ist f natürlich durch die Angabe von endlich vielen Werten noch nicht bestimmt. Jede reelle Zahlfolge kann als eine auf der Menge der natürlichen Zahlen definierte Funktion f : N → R x 1 2 3 ··· 4 f (x) a1 a2 a3 a4 · · · angesehen werden. Sie wird durch das Bildungsgesetz der Folge bestimmt, z.B. a1 = 1, an+1 = 1 c an + , n≥1. 2 an (ii) Explizite Darstellung, Formel Eine Funktion f kann durch eine Rechenvorschrift beschrieben werden, welche es erlaubt, zu gegebenem x den Wert f (x) zu bestimmen f :x→ x2 + 5x + 4 x4 − 16 In einem solchen Fall wird, falls nichts anderes angegeben ist, für D(f ) immer der grösstmögliche Bereich genommen, für den die angegebene Formel sinnvoll ist. Die Rechenvorschrift kann beliebig kompliziert sein. Als Beispiele erwähnen wir eine “Sprungfunktion” (siehe Figur 1) f : x → f (x) =    −1, für x < 0   0, für x = 0 1, für x > 0 18 U. Stammbach: Analysis, Teil A 2 1.5 1 Fig. 1 : Sprungfunktion 0.5 -4 -2 2 4 (x) -0.5 -1 -1.5 -2 1 0.5 Fig. 2 : Gauss’sche Fehlerfunktion -2 -1 1 2 (x) -0.5 -1 19 Kapitel I. Funktionen und die Gauss’sche Fehlerfunktion (siehe Figur 2) f : x → f (x) = Z x 0 2 e−t dt . Der Leser mache sich an dieser Stelle den Unterschied zwischen den Begriffen “Formel” und “Funktion” klar: nicht jede Funktion ist durch eine Formel gegeben! (iii) Differentialgleichung In den Naturwissenschaften werden Funktionen sehr oft durch Differentialgleichungen bestimmt. Als Beispiel sei der freie Fall eines Massenpunktes erwähnt. Die Differentialgleichung lautet bekanntlich ÿ(t) = −g, wo g die Erdbeschleunigung bezeichnet. Daraus erhält man 1 y(t) = − gt2 + At + B, 2 wo A und B Konstanten sind. Die Differentialgleichung hat unendlich viele Lösungen. Die (Integrations-)Konstanten werden durch weitere Angaben, üblicherweise durch die sogenannten Anfangsbedingungen (Ort und Geschwindigkeit des Massenpunktes zur Zeit 0) bestimmt. Im Rest dieses Abschnittes wollen wir noch einige Beispiele von Funktionen kennen lernen, welche etwas allgemeinerer Art sind, und dabei gleich Situationen beschreiben, in denen solche Funktionen auf natürliche Weise auftreten. Beispiel f : A → R × R, A ein Teilbereich der reellen Zahlen. Solche Funktionen treten z.B. bei Parameterdarstellungen ebener Kurven auf. (1) t → (a cos t, a sin t), A = R Diese Funktion beschreibt einen Kreis mit Radius a, der mit Startpunkt (a, 0) gleichförmig im Gegenuhrzeigersinn durchlaufen wird. (2) t → (a cos t, b sin t), A = R Es gilt x(t)2 /a2 + y(t)2 /b2 = 1. Die Funktion beschreibt folglich eine Ellipse mit Halbachsen a und b und Mittelpunkt (0, 0). Beispiel f : A → R × R × R, A ein Teilbereich der reellen Zahlen, f : t → (x(t), y(t), z(t)). Eine solche Funktion beschreibt eine Kurve im 3-dimensionalen Raum. 20 U. Stammbach: (1) Analysis, Teil A    x(t) = a1 + tn1 y(t) = a2 + tn2 , D(f ) = R f :t→   z(t) = a + tn 3 3 stellt eine Gerade durch den Punkt P , P = (a1 , a2 , a3 ) in Richtung ~n, ~n = (n1 , n2 , n3 ) dar. (2) f : t → (cos t, sin t, h t), D(f ) = R . 2π Diese Funktion beschreibt eine Rechts-Schraubenlinie mit Ganghöhe h auf einem Zylinder mit Radius 1 um die z-Achse. Beispiel f : A → R, A Teil der Ebene R × R. Der Funktionswert an der Stelle (x, y) ist eine reelle Zahl. Die Temperaturverteilung auf einem Blechstück der Form A wird zum Beispiel durch eine Funktion dieser Art beschrieben. Beispiel Betrachten wir jetzt ein ganz konkretes Beispiel. Bei einer Eisenbahnlinie, welche einen Kreisbogen beschreibt, ist die Grösse a vorgegeben. Man bestimme den Kurvenradius r in Abhängigkeit von x (siehe Figur 3). x a Fig. 3 : Kreisbogen mit Grössen r, a, x r Es gilt offensichtlich a2 + (r − x)2 = r 2 . 21 Kapitel I. Funktionen Daraus ergibt sich leicht ! a2 +x . x 1 r= 2 Damit ist der Radius r in Abhängigkeit der Grösse x bestimmt. Mathematisch definiert dies eine Funktion ! 1 a2 r : x → r(x) = +x . 2 x Für die Anwendung, die man im Auge hat, ist nur der Definitionsbereich D(r) = (0, a] von Interesse, obschon mathematisch die gefundene Formel auch für andere Werte von x sinnvoll ist, und deshalb der Definitionsbereich ausgedehnt werden kann. Das Beispiel etwas variierend kann man den Radius r auch in Abhängigkeit der Grössen x und a betrachten. Dann beschreibt die obige Formel eine Funktion 1 r̄ : (a, x) → r̄(a, x) = 2 ! a2 +x , x welche auf einem Teilbereich A der Ebene R × R definiert ist und Werte in R annimmt. Man hat also hier eine Funktion r̄ : A → R vor sich, wie wir sie auch in einem der früheren Beispiele studiert haben, und dies in einem ganz anderen Zusammenhang. (y) R ϕ ψ r Fig. 4 : Roboterarm P (x) 22 U. Stammbach: Analysis, Teil A Beispiel f : A → R × R, A eine Teilmenge von R × R. Eine Situation, wo eine Funktion dieser Art auf natürliche Art auftritt, ist wie folgt. Gegeben ist ein Roboterarm (siehe Figur 4), bei dem die Winkel ϕ und ψ unabhängig voneinander zwischen 0 und π variieren können. Jedes Paar (ϕ, ψ) legt einen Punkt P im Arbeitsbereich des Armes fest, nämlich P = (R cos ϕ + r cos(ϕ − ψ), R sin ϕ + r sin(ϕ − ψ)). Dadurch wird offenbar eine Funktion (=Abbildung!) f : (ϕ, ψ) → (R cos ϕ + r cos(ϕ − ψ), R sin ϕ + r sin(ϕ − ψ)) von einem Teilbereich A der (ϕ, ψ)-Ebene in die (x, y)-Ebene definiert. Der Teilbereich A ist dabei durch A = {(ϕ, ψ)|0 ≤ ϕ ≤ π, 0 ≤ ψ ≤ π} gegeben. Zum Schluss dieses Abschnittes wollen wir uns mit einigen grundlegenden Funktionen beschäftigen; wir verstehen darunter Funktionen der Art x → xn , x → sin x, x → ex , etc. Diese Funktionen sind aus der Schule bereits bekannt, und wir können uns deshalb kurz fassen. Da sie aber die Bausteine für kompliziertere Funktionen bilden, ist es notwendig, ihre Eigenschaften gut zu kennen; insbesondere muss für jede dieser Funktionen über den Definitionsbereich, das globale Verhalten, die Symmetrieeigenschaften etc. Klarheit herrschen. Es sei f : x → f (x) eine Funktion. Sie heisst gerade, wenn D(f ) symmetrisch zum Nullpunkt der x-Achse ist und wenn für alle x ∈ D(f ) gilt f (−x) = f (x). Die Funktion f : x → f (x) heisst ungerade, wenn D(f ) symmetrisch zum Nullpunkt der x-Achse ist und wenn für alle x ∈ D(f ) gilt f (−x) = −f (x). Die Funktion f : x → f (x) heisst (strikt) monoton wachsend, wenn aus x1 < x2 mit x1 , x2 ∈ D(f ) stets folgt f (x1 ) ≤ f (x2 ) (bzw. f (x1 ) < f (x2 )). Die Funktion f : x → f (x) heisst (strikt) monoton fallend, wenn aus x1 < x2 mit x1 , x2 ∈ D(f ) stets folgt f (x1 ) ≥ f (x2 ) (bzw. f (x1 ) > f (x2 )). Die elementaren Funktionen sind die folgenden: 23 Kapitel I. Funktionen (i) Potenzfunktion x → xn . Man mache sich in den folgenden Fällen den Verlauf des Graphen klar: n ganz positiv, n ganz negativ, n rational (z.B. 12 , 23 , ...), n beliebig reell. In welchen Fällen ist die Potenzfunktion gerade, ungerade, monoton wachsend oder fallend, etc? (ii) Polynome x → a0 + a1 x + a2 x2 + · · · + an xn . Die reellen Grössen a0 , a1 , ..., an heissen die Koeffizienten des Polynoms, die ganze Zahl n heisst Grad des Polynoms, falls an 6= 0. Man studiere den typischen Verlauf solcher Funktionen, insbesondere untersuche man für kleine n, n = 1, 2, 3 den Einfluss der Koeffizienten. (iii) rationale Funktionen x → a0 + a1 x + · · · + an xn . b0 + b 1 x + · · · + b m x m Man werde sich klar über den Definitionsbereich solcher Funktionen und studiere den Verlauf an einigen ausgewählten Beispielen. (iv) trigonometrische Funktionen sin, cos, tan, cot. Man präge sich für jede dieser Funktionen die grundlegenden Eigenschaften (Symmetrie, Nullstellen, Periodizität, etc.) gut ein. (v) Exponentialfunktion (vi) Logarithmusfunktion x → ax , a > 1. x →a log x, a > 1. Auf Exponential- und Logarithmusfunktion werden wir später noch zurückkommen. Hier soll der typische Verlauf der Graphen kennengelernt und insbesondere der Einfluss der Grösse a studiert werden. Es soll auch klar werden, dass zwischen Exponentialfunktion und Potenzfunktion ein wesentlicher Unterschied besteht. Anhang: Intervallbezeichnungen. Es seien a, b ∈ R mit a < b gegeben. Dann definieren wir (a,b) = {x ∈ R | a < x < b} , [a,b) = {x ∈ R | a ≤ x < b} , 24 U. Stammbach: Analysis, Teil A (a,b] = {x ∈ R | a < x ≤ b} , [a,b] = {x ∈ R | a ≤ x ≤ b} . An Stelle von a, b ∈ R lassen wir auch die Symbole +∞, −∞ zu, so dass zum Beispiel gilt [a, ∞) = {x ∈ R | a ≤ x < ∞}, (−∞, +∞) = {x ∈ R} = R. Natürlich dürfen die Symbole +∞, −∞ nur zusammen mit einer runden Klammer vorkommen. 25 Kapitel I. Funktionen 3 Grenzwerte von Funktionen, Stetigkeit Wir beginnen diesen Abschnitt mit einem numerischen Experiment. Es sei die Funktion x2 + x + 1 f : x → sin x2 − x − 2 ! gegeben. Wir stellen uns vor, dass innerhalb einer längeren Rechnung der Funktionswert von f bestimmt werden soll, und zwar für Werte von x, die ihrerseits aus Messungen errechnet worden sind und deshalb nur näherungsweise bekannt sind. Immerhin wollen wir annehmen, dass der Wert von x mit zusätzlichem Aufwand beliebig genau gemacht werden kann. Zur Demonstration wollen wir die Funktion f zuerst an den Stellen 3.9, 3.99, 3.999, 3.9999, 3.99999, . . . auswerten, also auf einer Folge von Zahlen, die sehr rasch gegen den als genau angesehenen Wert 4 konvergiert. Diese Folge von Zahlen deutet also die sukzessiv immer besser werdende Genauigkeit für die Grösse x an. Ferner führen wir die gleiche Rechnung für die Folge von Zahlen 1.9, 1.99, 1.999, 1.9999, 1.99999, . . . durch, welche gegen den Wert 2 konvergiert. Die Berechnung liefert folgende Werte: x 3.9 3.99 3.999 3.9999 3.99999 3.999999 3.9999999 3.99999999 3.999999999 f (x) 0.8313595846 0.8603029298 0.8629213180 0.8631805876 0.8632064890 0.8632090789 0.8632093379 0.8632093638 0.8632093664 x 1.9 1.99 1.999 1.9999 1.99999 1.999999 1.9999999 1.99999999 1.999999999 f (x) 0.4413721770 0.0330343010 −0.9823680634 −0.1634533406 −0.0748074451 −0.6256837105 −0.9457588989 −0.9997768755 0.9978731823 Wir entnehmen dieser Tabelle, dass das Verhalten der Funktion f in der Nähe der beiden durch x = 2 und x = 4 gegebenen Punkte völlig verschieden ist. Während für x = 4 die Werte f (x) sich - wie eine weitere Rechnung bestätigt - sukzessive der Zahl 0.8632093666 · · · nähern, streuen sie für x = 2 “chaotisch” über einen weiten Bereich. Wir wollen im Laufe dieses Abschnittes die Gründe für diesen Sachverhalt näher untersuchen. Zu diesem Zwecke führen wir als erstes den Begriff des Grenzwertes von Funktionen ein. 26 U. Stammbach: Analysis, Teil A Wir betrachten eine Funktion f , deren Definitionsbereich das Intervall (c, ξ), c < ξ umfasst, und ausserdem Folgen x1 , x2 , . . . von reellen Zahlen xi mit c < xi < ξ, welche gegen ξ konvergieren, limi→∞ xi = ξ. Offensichtlich gibt es unendlich viele solcher Folgen; eine davon ist immer durch die unendliche Dezimalbruchentwicklung von ξ gegeben. Zu jeder solchen Folge bilden wir die zugehörige Folge der Funktionswerte f (x1 ), f (x2 ), . . . . Diese kann - je nach Sachlage - konvergieren oder divergieren. Am interessantesten ist natürlich der Fall, wo sie nicht nur konvergiert, sondern auch für jede der oben beschriebenen Zahlfolgen x1 , x2 , . . . denselben Grenzwert a liefert. Dieser Wert a heisst dann definitionsgemäss der linke Grenzwert der Funktion f an der Stelle ξ; in Zeichen drücken wir dies durch a = lim f (x) oder f (x) → a für x → ξ − x→ξ − aus. Dabei deutet das Minuszeichen beim Buchstaben ξ an, von welcher Seite die Folge x1 , x2 , . . . gegen ξ konvergieren soll. Anzumerken sind hier die folgenden Dinge. (1) Für gewisse Funktionen und für gewisse Werte von ξ kann es durchaus vorkommen, dass für die eine Zahlenfolge x1 , x2 , ... der Grenzwert limn→∞ f (xn ) existiert, während für eine andere Zahlenfolge x01 , x02 , ... der Grenzwert limn→∞ f (x0n ) nicht existiert, oder es kann vorkommen, dass diese Grenzwerte zwar beide existieren, dass sie aber voneinander verschieden sind. Gemäss unserer Definition besitzt in diesem Fall die Funktion f in ξ keinen linken Grenzwert. (2) Bei der Definition des linken Grenzwertes einer Funktion f an der Stelle ξ wurde nirgends vorausgesetzt, dass die Funktion an der Stelle ξ definiert ist. In der Tat hat der Funktionswert in ξ - falls er existiert - a priori nichts mit dem linken Grenzwert von f in ξ zu tun. Es kann allerdings vorkommen, dass die beiden Werte übereinstimmen; aber dann sagt dies etwas ganz Wesentliches über die Funktion an der Stelle ξ aus. Darauf kommen wir in Kürze zu sprechen. Vorerst aber noch einmal zurück zu unserem Beispiel. Für x = 4 scheinen unsere Zahlen zu zeigen, dass für die gegen 4 konvergierende Folge x1 = 3.9; x2 = 3.99, . . . die Folge der Funktionswerte f (x1 ), f (x2 ), . . . gegen den Wert 0.8632093666 · · · strebt. Dies wird uns vom Computerexperiment suggeriert. In der Tat lässt sich mathematisch exakt beweisen, dass für jede von links gegen 4 konvergierende Folge die zugehörige Folge der Funktionswerte gegen einen festen Wert strebt. Der linke Grenzwert ! x2 + x + 1 lim sin x2 − x − 2 x→4− existiert also, und er beträgt näherungsweise 0.8632093666 · · ·. Deutlich muss an dieser Stelle gesagt werden, dass das Computerexperiment diese Tatsache nur suggeriert, zum Beweis der 27 Kapitel I. Funktionen Tatsache aber nichts beiträgt, und auch nichts beitragen kann, denn mit Hilfe des Computers lassen sich immer nur eine endliche Anzahl der unendlich vielen Folgen x1 , x2 , . . . untersuchen, von denen beim Begriff des linken Grenzwertes die Rede ist. Vollkommen anders als im Punkte x = 4 verhält sich unsere Funktion im Punkte x = 2. Hier scheinen unsere Zahlen zu sagen, dass für die gewählte, gegen 2 konvergierende Folge x1 = 1.9, x2 = 1, 99, . . . die zugehörige Folge der Funktionswerte f (x1 ), f (x2 ), . . . divergiert, dass also der linke Grenzwert von f an der Stelle ξ = 2 nicht existiert. Dies suggeriert der Computer. In der Tat kann man mathematisch exakt nachweisen, dass lim sin x→2− x2 + x + 1 x2 − x − 2 ! nicht existiert. Auch hier muss gesagt werden, das das Computerexperiment diese Tatsache zwar suggeriert, dass es aber nichts zum mathematischen Beweis beitragen kann, denn die Divergenz einer Folge lässt sich mit endlich vielen Computerwerten nicht beweisen. Wir haben bis anhin immer vom linken Grenzwert gesprochen. Es ist aber klar, dass auf analoge Weise ein rechter Grenzwert definiert werden kann. Wir betrachten eine Funktion f , deren Definitionsbereich das Intervall (ξ, d) einschliesst, ξ < d. Wenn nun für jede von rechts gegen ξ konvergierende Folge x1 , x2 , ... die Folge der Funktionswerte f (x1 ), f (x2 ), ... gegen den Wert b konvergiert, so heisst b der rechte Grenzwert von f an der Stelle ξ, b = lim f (x) oder f (x) → b für x → ξ + . x→ξ + Beispiel Gegeben ist die Funktion x → 2−1/x (siehe Figur 1). Diese Funktion ist für x = 0 nicht definiert. Wir wollen die Grenzwerte lim 2−1/x , lim 2−1/x x→0+ x→0− berechnen. Für den rechten Grenzwert betrachten wir eine beliebige Folge x1 , x2 , . . . von positiven Zahlen, die gegen 0 konvergiert. Die reziproken Werte 1/x1 , 1/x2 , . . . werden mit wachsendem Index beliebig gross. Betrachtet man also die Folge 2−1/x1 , 2−1/x2 , . . . , so konvergiert diese offensichtlich gegen 0. Damit gilt lim+ 2−1/x = 0. x→0 Um den linken Grenzwert zu diskutieren, betrachten wir eine beliebige Folge x1 , x2 , . . ., von negativen Zahlen, die gegen 0 konvergiert. Die reziproken Werte 1/x1 , 1/x2 , . . . werden mit 28 U. Stammbach: Analysis, Teil A 5 4 3 Fig. 1 : Die Funktion x → 2−1/x 2 1 -2 -1.5 -1 -0.5 0.5 1 1.5 2 (x) -1 wachsendem Index immer kleiner (“sie streben gegen −∞”). Die Folge −1/x1 , −1/x2 , . . . “strebt gegen +∞”, und somit ebenfalls die Folge 2−1/x1 , 2−1/x2 , . . . In unserer Terminologie bedeutet dies, dass die Folge nicht konvergiert; der linke Grenzwert lim 2−1/x x→0− existiert nicht. Beispiel Ein berühmter und für die Ableitung der trigonometrischen Funktionen wichtiger Grenzwert ist sin x lim . + x x→0 Diesen wollen wir als nächstes berechnen. Wir stellen zuerst fest, dass die Funktion x→ sin x x für x = 0 nicht definiert ist und dass die Funktion gerade ist, denn es gilt sin(−x) sin x = . −x x Kapitel I. Funktionen 29 Wenn also der rechte Grenzwert dieser Funktion an der Stelle x = 0 existiert, so wird auch der linke Grenzwert an dieser Stelle existieren und mit jenem übereinstimmen. Unter der Voraussetzung, dass einer dieser Grenzwerte existiert, wird also gelten lim+ x→0 sin x sin x = lim− . x x x→0 Wir beschränken uns auf die Berechnung des rechten Grenzwertes und entnehmen der Figur 2, dass für 0 < x < π/2 die Ungleichung tan x Fig. 2 : Zur Berechnung des Grenzwertes lim 1 x→0+ sin x sin x x x x cos x x tan x 1 sin x sin x · cos x < < = 2 2 2 2 cos x gilt. Daraus erhält man weiter cos x < 1 x < , sin x cos x cos x < 1 sin x < . x cos x Lässt man nun die Grösse x eine Folge von positiven Zahlen x1 , x2 , .. durchlaufen, welche gegen 0 konvergiert, so konvergieren die Folgen 30 U. Stammbach: Analysis, Teil A cos x1 , cos x2 , ... 1 1 , , ... cos x1 cos x2 offensichtlich beide gegen 1. Damit muss gezwungenermassen auch die Folge sin x1 sin x2 , , ... x1 x2 gegen 1 konvergieren. Es gilt also lim x→0+ sin x sin x = lim− = 1. x x x→0 Die Rechenregeln, welche wir für den Umgang mit Grenzwerten von Folgen kennen gelernt haben, liefern auf offensichtliche Weise analoge Rechenregeln für Grenzwerte von Funktionen. Wir formulieren diese Regeln für rechte Grenzwerte: Aus lim f (x) = a, lim+ g(x) = b x→ξ + x→ξ folgt lim (f (x) ± g(x)) = a ± b, x→ξ + lim (f (x) · g(x)) = a · b, x→ξ + lim f (x)/g(x) = a/b. x→ξ+ Letzteres natürlich nur, falls im betrachteten Intervall b 6= 0 und g(x) 6= 0. Beispiel lim x→0+ tan x 1 1 sin x sin x = lim · = lim · lim = 1 · 1 = 1. + + + x x x x→0 cos x x→0 cos x x→0 Ausserdem gilt lim x→0+ tan x tan x = lim , − x x x→0 da x → (tan x)/x eine gerade Funktion ist. 31 Kapitel I. Funktionen Beispiel lim x→0+ sin2 x sin x sin x 1 1 = lim · lim · lim =1·1· . + + x2 (1 + cos x) x→0+ x x 1 + cos x 2 x→0 x→0 Ausserdem gilt lim+ x→0 sin2 x sin2 x = lim , x2 (1 + cos x) x→0− x2 (1 + cos x) denn die Funktion x→ sin2 x x2 (1 + cos x) ist gerade. Beispiel lim x→0+ sin x3 sin t sin x3 = lim x2 · lim = lim x2 · =0·1=0 3 + + + x x t x→0 x→0 t→0 In allen Beispielen, die wir bis anhin betrachtet haben, ist die Funktion im Punkte ξ, in dem der Grenzwert berechnet werden soll, nicht definiert. Ist er aber definiert, so stellt sich die oben schon erwähnte Frage, was die Beziehung dieses Wertes f (ξ) zu den beiden Grenzwerten lim f (x) und x→ξ − lim f (x) x→ξ + ist. Es ist leicht zu sehen, dass im allgemeinen zwischen diesen drei Werten keine Beziehung besteht. Betrachten wir zur Illustration ausgehend vom weiter oben betrachteten Beispiel die auf ganz R definierte Funktion ( g:x→ 2−1/x , x 6= 0 , 1, x=0. An der durch ξ = 0 gegebenen Stelle gilt dann g(0) = 1, lim g(x) = +∞, lim g(x) = 0. x→ξ − x→ξ + Keine irgendwie geartete Beziehung zwischen diesen Werten ist auszumachen; sie sind offenbar im allgemeinen völlig unabhängig voneinander. Andrerseits zeigt sich, dass die drei Werte in vielen Fällen – man könnte sogar sagen “üblicherweise” – übereinstimmen. Betrachten wir etwa die oben definierte Funktion an der Stelle ξ = 1, so gilt offensichtlich 32 U. Stammbach: Analysis, Teil A 1 1 1 g(1) = , lim g(x) = , lim g(x) = . − + 2 x→1 2 x→1 2 Die Tatsache, dass die drei Werte “üblicherweise” übereinstimmen, wird in vielen Fällen implizit benützt. Wertet man etwa die Funktion h : x → x2 an der Stelle ξ = π aus, so geschieht dies ja dadurch, dass man in der Rechnung die durch einen unendlichen Dezimalbruch beschriebene Irrationalzahl π durch einen endlichen Dezimalbruch approximiert und dabei je nach verlangter Genauigkeit mehr oder weniger Stellen berücksichtigt. In der hier eingeführten Sprache berechnet man die Funktion h : x → x2 auf der durch die endlichen Dezimalbrüche gegebenen und gegen π konvergierenden Folge 3, 3.1, 3.14, 3.141, 3.1415, 3.14159, . . . und nimmt stillschweigend an, dass der Wert h(π) = π 2 durch den Grenzwert der Folge h(3), h(3.1), h(3.14), h(3.141), h(3.1415), h(3.14159), . . . gegeben ist. Man macht hier offenbar implizit Gebrauch von der Beziehung lim h(x) = h(π). x→π − Dieses Vorgehen ist gestattet, weil die Funktion h : x → x2 an der Stelle ξ = π, ja sogar überall eine Eigenschaft besitzt, die im vorhergehenden Beispiel für die Funktion g an der Stelle ξ = 0 nicht gegeben war. Diese Eigenschaft nennt der Mathematiker Stetigkeit. Er definiert sie wie folgt. Definition Die Funktion f : x → f (x) sei auf dem Intervall (c, d) mit c < ξ < d definiert. Gilt lim f (x) = f (ξ) = lim+ f (x), x→ξ − x→ξ so heisst die Funktion f stetig im Punkte ξ. Eine Funktion heisst stetig schlechthin, falls sie in allen Punkten ihres Definitionsbereiches stetig ist. Der Nachweis, dass eine gegebene Funktion stetig ist, ist eine auch für einen Mathematiker mühevolle Arbeit, wenn wirklich alle Einzelheiten nachgeprüft werden sollen. Glücklicherweise lässt sich aber das wesentliche Resultat dieser Bemühungen auf konzise Art ausdrücken. Satz Sämtliche elementare Funktionen und die aus ihnen durch Addition, Subtraktion, Multiplikation, Division und Zusammensetzung gebildeten Funktionen sind in ihrem Definitionsbereich stetig. Beispiel Die Funktion f : x → x/(x − 2) ist stetig, d.h. f ist stetig in allen Punkten des Definitionsbereiches. (Der Leser beachte die Sprachregelung: im Punkte x = 2 ist f nicht definiert!) Kapitel I. Funktionen 33 Zur Notation machen wir noch folgende Bemerkung: Wenn an der Stelle ξ der linke und der rechte Grenzwert einer Funktion f : x → f (x) übereinstimmen, wenn also lim f (x) = lim+ f (x) x→ξ − x→ξ gilt, so erlaubt man sich oft, kurz vom Grenzwert der Funktion f an der Stelle ξ zu sprechen. Man verwendet dann konsequenterweise das Symbol lim f (x) . x→ξ Dadurch drückt man aus, dass die Approximation des Wertes ξ von links und von rechts das gleiche Resultat liefert. Man beachte, dass dies bei stetigen Funktionen immer der Fall ist. Die in diesem Abschnitt besprochenen Beispiele machen klar, dass die Berechnung eines Funktionswertes an einer nur approximativ bekannten Stelle ξ nur dann zu einem sinnvollen Resultat führen kann, wenn die Funktion an der Stelle ξ stetig ist. Damit man überhaupt mit einer Funktion in der Praxis rechnen kann, ist die Stetigkeit sozusagen eine Minimalvoraussetzung. Anschaulich ausgedrückt besagt sie, dass f (ξ) sich beliebig genau berechnen lässt, wenn nur ξ genügend gut approximiert wird. Diese nur qualitative Aussage genügt in Anwendungen allerdings oft nicht. Wenn man etwa die folgende naheliegende Frage beantworten will, so braucht man zusätzliche Informationen quantitativer Art. Wie genau muss ξ bekannt sein, damit f (ξ) mit vorgeschriebener Genauigkeit, z.B. auf 5 Stellen nach dem Komma berechnet werden kann? Um diese Frage zu beantworten zu können, müssen neben der Stetigkeit weitere und stärkere Eigenschaften der Funktion f bekannt sein; Stetigkeit allein genügt nicht. Wir werden später sehen, wie zum Beispiel die Differenzierbarkeit von f zur Beantwortung dieser Frage herangezogen werden kann. 34 4 U. Stammbach: Analysis, Teil A Der Zwischenwertsatz für stetige Funktionen Satz Es sei f : x → f (x) eine auf [a, b] stetige Funktion. Es sei m irgendein Wert zwischen f (a) und f (b). Dann gibt es (mindestens) ein ξ mit f (ξ) = m. Bevor wir diesen Satz beweisen, wollen wir noch folgende Bemerkungen einfügen. Wenn der Graph von f eine “Kurve” im anschaulichen Sinn ist, so ist die Aussage des Satzes insofern klar, als diese Kurve ja die Horizontale y = m mindestens einmal kreuzen muss. Gelingt es uns, diese Tatsache auf analytische Weise zu beweisen, indem wir von der Funktion f weiter nichts als die Stetigkeit voraussetzen, so bedeutet dies, dass der Graph einer stetigen Funktion unserem intuitiven Bild einer “Kurve” weitgehend entspricht. Beweis Wir nehmen an, dass f (a) ≤ m und f (b) ≥ m gilt. Der Beweis im andern Fall verläuft ganz analog. Wir konstruieren ein ξ mit der verlangten Eigenschaft als Grenzwert von zwei Folgen von Zahlen in [a, b]. Wir definieren Folgen x1 , x2 , ... und y1 , y2 , ... rekursiv wie folgt. Wir setzen x1 = a, y1 = b. Sind x1 , x2 , ..., xi und y1 , y2 , ..., yi bereits definiert, so definieren wir xi+1 und yi+1 durch  1 1   2 (xi + yi ), falls f ( 2 (xi + yi )) < m, xi+1 =   x, falls f ( 12 (xi + yi )) ≥ m, i yi+1 =    1 2 (xi   y, i + yi ), falls f ( 12 (xi + yi )) ≥ m, falls f ( 12 (xi + yi )) < m. Man sieht sofort, dass die Folge x1 , x2 , .... monoton wachsend und die Folge y1 , y2 , .... monoton fallend ist. Da beide Folgen beschränkt sind, müssen sie konvergieren. Wir behaupten, dass ihre Grenzwerte übereinstimmen. Es ist yn+1 − xn+1 = y n − xn b−a yn−1 − xn−1 y 1 − x1 = n . = = ··· = n 2 4 2 2 Daraus folgt 0 = lim (yn − xn ) = lim yn − lim xn . n→∞ n→∞ n→∞ Wir setzen lim yn = ξ = lim xn . Laut Definition der beiden Folgen gilt f (xn ) ≤ m für alle n = 1, 2, ... und f (yn ) ≥ m für alle n = 1, 2, .... Schliesslich verwenden wir die Stetigkeit der Funktion f an der Stelle ξ, um die Ungleichungen f (ξ) = f (lim xn ) = lim f (xn ) ≤ m, 35 Kapitel I. Funktionen m ≤ lim f (yn ) = f (lim yn ) = f (ξ) zu erhalten. Daraus ergibt sich sofort f (ξ) = m. Dies war zu beweisen. Das in diesem Beweis angegebene explizite Verfahren kann verwendet werden, um Gleichungen, insbesondere transzendente Gleichungen zu lösen. Beispiel Um die Lösung der Gleichung x = e−x zu finden, betrachte man die Funktion f : x → x − e−x . Diese ist sicherlich stetig. Ferner ist f (0) = −1 und f (1) = 1 − e−1 ∼ 2/3. Um den (offenbar einzigen) Wert ξ mit f (ξ) = 0 zu bestimmen, wendet man das obige Verfahren auf das Intervall [0, 1] und den Wert m = 0 an. Die folgende Tabelle zeigt die Werte der Glieder der beiden Folgen. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 xi 0. 0.5 0.5 0.5 0.5625 0.5625 0.5625 0.5625 0.56640625 0.56640625 0.56640625 0.5668945313 0.5671386719 0.5671386719 0.5671386719 0.5671386719 0.5671386719 0.5671386719 0.5671424866 0.5671424866 yi 1. 1. 0.75 0.625 0.625 0.59375 0.578125 0.5703125 0.5703125 0.568359375 0.5673828125 0.5673828125 0.5673828125 0.5672607422 0.567199707 0.5671691895 0.5671539307 0.5671463013 0.5671463013 0.5671443939 36 U. Stammbach: Analysis, Teil A 4 2 Fig. 1 : Die Funktion x → x − e−x -2 -1 1 2 3 4 (x) -2 -4 0.8 0.75 0.7 Fig. 2 : Die Folgen xn und yn yn 0.65 0.6 0.55 xn 0.5 0.45 (n) 2 4 6 8 10 12 14 37 Kapitel I. Funktionen 5 Koordinatentransformationen In diesem Abschnitt studieren wir, wie sich einfache Koordinatentransformationen auf den Graphen einer Funktion f auswirken. Wir illustrieren dies durch Beispiele. Dabei gehen wir aus von der Funktion (siehe Figur 1) f : x → 2x3 − 3x2 − 6x + 6. 30 20 y = 2x3 − 3x2 − 6x + 6 -4 10 -2 Fig. 1 : 2 (x) f : x → 2x3 − 3x2 − 6x + 6 -10 -20 -30 (1) Die Funktion f1 : x → f (x + a) Wir setzen zur Illustration a = 2, dann gilt f1 : x → 2(x + 2)3 − 3(x + 2)2 − 6(x + 2) + 6 = 2x3 + 9x2 + 6x − 2. Der Graph von f1 entsteht aus den Graphen von f durch Verschiebung um a Einheiten in Richtung der negativen x-Achse (siehe Figur 2). (2) Die Funktion f2 : x → f (x) + b Wir setzen zur Illustration b = 4; dann erhalten wir f : x → 2x3 − 3x2 − 6x + 10. 38 U. Stammbach: Analysis, Teil A Man erhält den Graphen von f2 , indem man den Graphen von f und b Einheiten in Richtung der positiven y-Achse verschiebt (siehe Figur 3). (3) Die Funktion f3 : x → f (cx), c > 0 Wir setzen zur Illustration c = 2, dann gilt f3 (x) = 16x3 − 12x2 − 12x + 6. Man erhält den Graphen von f3 , indem man den Graphen von f in Richtung der x-Achse um den Faktor c “staucht” (siehe Figur 4). Ist 0 < c < 1, so resultiert eine “Dehnung” in Richtung der x-Achse. Setzen wir c = 1/2, so gilt 1 3 f¯3 (x) = x3 − x2 − 3x + 6. 4 4 (4) Die Funktion f4 (x) = df (x), d > 0 Wieder setzen wir d = 2; es gilt f4 (x) = 4x3 − 6x2 − 12x + 12. Man erhält den Graphen von f4 , indem man den Graphen von f in Richtung der y-Achse um den Faktor d “streckt” (siehe Figur 5). (5) Die Funktion f5 (x) = 1/f (x) Man erhält f5 (x) = 1/(2x3 − 3x2 − 6x + 6). Wo die Funktion f Nullstellen hat, besitzt f5 Pole. Ferner gilt natürlich (siehe Figur 6) | f (x0 ) |< 1 ⇒| f5 (x0 ) |> 1 , | f (x0 ) |> 1 ⇒| f5 (x0 ) |< 1 . (6) Die Funktion f6 (x) = f (1/x) Ist | x |< 1, so folgt | 1/x |> 1 und zwar ist | 1/x | umso grösser, je kleiner | x | ist. Ist umgekehrt | x |> 1, so folgt | 1/x |< 1 und zwar ist | 1/x | umso kleiner, je grösser | x | ist (siehe Figur 7). Das Verhalten der Funktion f6 im Intervall −1 < x < +1 “spiegelt” also das Verhalten der Funktion f für | x |> 1. Umgekehrt “spiegelt” das Verhalten von f6 für grosse Werte von | x |, wie sich f im Einheitsintervall verhält, z.B. gilt lim f6 (x) = lim f x→∞ x→∞ 1 x = lim f (ξ) = 6. ξ→0+ Kennt man den Einfluss dieser sechs einfachen Koordinatentransformationen gut, so kann man Graphen von einfacheren Funktionen oft sehr leicht skizzieren. Wir zeigen dies anhand der folgenden Beispiele. 39 Kapitel I. Funktionen 30 20 10 -4 -2 Fig. 2 : 2 (x) f1 (x) = f (x + 2) -10 -20 -30 30 20 10 -4 -2 Fig. 3 : 2 (x) -10 -20 -30 f2 (x) = f (x) + 4 40 U. Stammbach: Analysis, Teil A 30 20 10 -4 -2 Fig. 4 : 2 (x) f3 (x) = f (2x) -10 -20 -30 30 20 10 -4 -2 Fig. 5 : 2 (x) -10 -20 -30 f4 (x) = 2f (x) 41 Kapitel I. Funktionen 3 2 1 -4 Fig. 6 : -2 2 (x) f5 (x) = 1/f (x) -1 -2 -3 30 20 10 -5 -4 -3 -2 -1 Fig. 7 : 1 2 3 (x) -10 -20 -30 f6 (x) = f (1/x) 42 U. Stammbach: Analysis, Teil A Beispiel x → f (x) = 3 (x + 5)(x − 2) Die Nennerfunktion x → (x+ 5)(x− 2) = (x2 + 3x− 10) ist quadratisch mit Nullstellen −5, 2. Ihr Graph ist folglich eine Parabel, die die x-Achse in −5 und 2 schneidet und nach oben geöffnet ist (der Koeffizient von x2 ist positiv). Aus Symmetriegründen ist der Scheitel bei x = −3/2 zu finden. Die Transformation (5) liefert sofort den Graphen der Funktion x→ 1 . (x + 5)(x − 2) Schliesslich liefert die Transformation (3) den Graphen von f durch “Streckung” in Richtung der y-Achse um den Faktor 3. Fragen, etwa nach der Lage der Extremalstellen von f , lassen sich nun ohne Rechnung sofort beantworten. Beispiel In einem weiteren Beispiel betrachten wir die Funktion 1 g : x → 2 cos 3x + 2 . Ausgehend vom Graph der Cosinus-Funktion x → cos x (siehe Figur 8) erhalten wir den Graphen von x → cos(3x) durch “Stauchung” in Richtung der x-Achse (siehe Figur 9). Der Graph von x → cos(3x + 12 ) = cos(3(x + 16 )) geht aus dem Graphen von x → cos(3x) durch Verschiebung um 16 in Richtung der negativen x-Achse hervor (siehe Figur 10). Schliesslich erhält man den Graphen von g durch Streckung um den Faktor 2 in Richtung der y-Achse (siehe Figur 11). Die betrachtete Funktion g ist von der Form t → A cos(ωt + ϕ), welche bei Schwingungsproblemen auftritt, wobei t natürlich die Zeit bedeutet. Von dieser Anwendung her erhalten die einzelnen Konstanten die folgenden Namen: Die Grösse A, A > 0 heisst Amplitude. Sie gibt den Wert des grössten Schwingungsausschlages an. Die Grösse ω > 0 heisst Kreisfrequenz. Eine volle Schwingung wird in 2π/ω = T absolviert; T heisst die Schwingungsdauer. Pro Zeiteinheit werden 1/T = ω/2π =: ν Schwingungen durchgeführt; ν heisst die Frequenz der Schwingung. Die Konstante ϕ, −π < ϕ < π heisst (Null-)Phasenwinkel. 43 Kapitel I. Funktionen 3 2 1 Fig. 8 : (x) -1 1 2 3 4 x → cos x -1 -2 -3 3 2 1 Fig. 9 : (x) -1 1 -1 -2 -3 2 3 4 x → cos(3x) 44 U. Stammbach: Analysis, Teil A 3 2 1 Fig. 10 : (x) -1 1 2 3 4 x → cos 3x + 1 2 -1 -2 -3 3 2 1 Fig. 11 : (x) -1 1 -1 -2 -3 2 3 4 1 x → 2 cos 3x + 2 45 Kapitel I. Funktionen 6 Die inverse Funktion Bekanntlich kann es vorkommen, dass eine Funktion f : x → f (x) für verschiedene Werte x1 , x2 ∈ D(f ) denselben Funktionswert y0 annimmt; z.B. gilt für f : x → x2 natürlich f (−2) = 4 = f (2). Graphisch äussert sich dies darin, dass die Parallele zur x-Achse auf dem Niveau y0 den Graphen von f in mehreren Punkten schneidet. Funktionen, bei denen dieses Phänomen nicht auftritt, heissen injektiv. Eine Funktion f : x → f (x), D(f ) heisst injektiv, wenn gilt: - Aus x1 6= x2 , x1 , x2 ∈ D(f ) folgt stets f (x1 ) 6= f (x2 ). Gleichbedeutend mit dieser Forderung ist offenbar jede der folgenden beiden Bedingungen - Falls f (x1 ) = f (x2 ), so folgt x1 = x2 . - Jede Parallele zur x-Achse schneidet den Graphen von f in höchstens einem Punkt. Ist f : x → f (x), D(f ) eine injektive Funktion, so gibt es zu jedem y ∈ W (f ) genau ein x ∈ D(f ) mit f (x) = y. Somit können wir eine Umkehrfunktion f −1 definieren: - f −1 : y → f −1 (y) = dasjenige eindeutig bestimmte x mit f (x) = y. Offenbar gilt D(f −1 ) = W (f ) und W (f −1 ) = D(f ). Die so definierte Funktion f −1 heisst die zu f inverse Funktion. Dem Leser muss sich an dieser Stelle gut klar machen, dass die inverse Funktion f −1 nur dann definiert werden kann, wenn f injektiv ist. Laut Definition gilt x ∈ D(f ) die Gleichung f −1 (f (x)) = x und für alle x ∈ D(f −1 ) f (f −1 (x)) = x. Die Funktion f −1 ist automatisch injektiv (warum?). Deshalb kann zu f −1 wiederum die inverse Funktion (f −1 )−1 gebildet werden. Offenbar gilt (f −1 )−1 = f . 46 U. Stammbach: Analysis, Teil A Die Beziehung zwischen f und f −1 lässt sich graphisch leicht veranschaulichen. Ist nämlich (a, b) ein Punkt des Graphen von f , so hat man f (a) = b. Laut Definition von f −1 gilt dann a = f −1 (b). Daraus folgt, dass (b, a) ein Punkt des Graphen von f −1 ist. Die Punkte (a, b) und (b, a) liegen im kartesische Koordinatensystem spiegelbildlich zur ersten Winkelhalbierenden y = x. Wir schliessen daraus, dass die Graphen von f und f −1 durch Spieglung an der ersten Winkelhalbierenden auseinander hervorgehen. Beispiel Es sei die lineare Funktion f : x → ax + b, a, b ∈ R, a 6= 0, D(f ) = R gegeben. Wir behaupten zuerst, dass f injektiv ist. Aus f (x1 ) = ax1 + b = ax2 + b = f (x2 ) folgt ax1 = ax2 und daraus wegen a 6= 0 sofort x1 = x2 . Damit ist f in der Tat injektiv und die inverse Funktion f −1 existiert. Aus y = ax + b folgt x = (y − b)/a. Somit gilt f −1 : y → y−b a oder besser f −1 : x → x−b , D(f −1 ) = R, a da ja als Name des Argumentes üblicherweise x verwendet wird (siehe Figur 1). Beispiel Die Exponentialfunktion f : x → ax , a > 1 ist auf ihrem ganzen Definitionsbereich strikt monoton wachsend. Wegen ah > 1 für h > 0 ergibt sich nämlich ax+h = ax · ah > ax . Die Exponentialfunktion ist also injektiv und die dazu inverse Funktion f −1 existiert. Diese ist durch die Vorschrift f −1 : y → Zahl, mit der a potenziert werden muss, um y zu erhalten definiert. Wir nennen die so definierte Zahl den Logarithmus von y zur Basis a, und wir schreiben x = f −1 (y) = a log y. Laut Definition gilt D(a log x) = W (ax ) = (0, ∞), W (a log x) = D(ax ) = (−∞, ∞). Der Graph der Logarithmusfunktion a log : x → a log x, D(a log x) = (0, ∞) 47 Kapitel I. Funktionen 4 (y) 3 y=x y = 2x + 3 2 Fig. 1 : 1 -4 -3 -2 -1 1 2 3 4 x → 2x + 3 (x) x→ -1 y= -2 x 3 − 2 2 x 3 − 2 2 -3 -4 6 (y) 5 y = 2x y=x 4 Fig. 2 : 3 x → 2x 2 y =2 log x x →2 log x 1 -2 -1 1 2 3 4 5 6 (x) -1 -2 48 U. Stammbach: Analysis, Teil A ergibt sich durch Spiegelung des Graphen der Exponentialfunktion x → ax an der ersten Winkelhalbierenden (siehe Figur 2). Beispiel Wie wir bereits festgestellt haben, ist die Quadratfunktion f : x → x2 , D(f ) = R nicht injektiv. Es gibt also zu f keine inverse Funktion. Hingegen kann man durch Einschränken des Definitionsbereiches zu einer verwandten Funktion f1 übergehen, die injektiv ist und zu der folglich eine inverse Funktion existiert. Für diese Einschränkung gibt es mehrere Möglichkeiten, von denen wir zwei genauer ansehen. Wir betrachten zuerst die Funktion f1 : x → x2 , D(f1 ) = [0, ∞). Wegen f10 (x) > 0 für 0 < x ist f1 strikt monoton wachsend und deshalb injektiv. Die dazu inverse Funktion f1−1 ist definiert durch f1−1 : x → √ x, D(f1−1 ) = [0, ∞) . Die Graphen von f und f1−1 gehen durch Spiegelung an der Geraden y = x auseinander hervor (siehe Figur 3). Als zweites betrachten wir die Funktion f2 : x → x2 , D(f2 ) = (−∞, 0]. Diese ist wegen f20 (x) < 0 für x < 0 strikt monoton fallend und deshalb injektiv. Die dazu inverse Funktion ist gegeben durch √ f2−1 : x → − x, D(f2−1 ) = [0, ∞). Wiederum liegen die Graphen der beiden Funktionen f2 und f2−1 spiegelbildlich zur Geraden y = x (siehe Figur 4). Beispiel Die Funktion f :x→ p x2 − 1, D(f ) = (−∞, −1] ∪ [1, ∞) ist offensichtlich eine gerade Funktion. Sie ist also sicher nicht injektiv. Die Einschränkung des Definitionsbereiches auf [1, ∞) liefert aber die injektive Funktion f1 : x → Aus f1 (x1 ) = q x21 − 1 = q p x2 − 1, D(f ) = [1, ∞). x22 − 1 = f1 (x2 ) folgt nämlich der Reihe nach 49 Kapitel I. Funktionen 3 (y) y = x2 2.5 y=x 2 Fig. 3 : f1 : x → x2 , D(f1 ) = [0, ∞) √ f1−1 : x → x 1.5 y= √ x 1 0.5 (x) 0.5 1 1.5 2 2.5 3 3 (y) y = x2 2 y=x 1 Fig. 4 : (x) -3 -2 -1 1 2 -1 -2 -3 √ y=− x 3 f2 : x → x2 , D(f2 ) = (−∞, 0] √ f2−1 : x → − x 50 U. Stammbach: 3 Analysis, Teil A (y) 2.5 y= √ x2 + 1 2 Fig. 5 : 1.5 f1 : x → √ y = x2 − 1 x2 − 1, D(f ) = [1, ∞) f1−1 : x → 1 0.5 p p x2 + 1 y=x (x) 0.5 1 1.5 2 2.5 3 x21 − 1 = x22 − 1 , x21 = x22 , x1 = x2 . Letzteres folgt, weil x1 und x2 im Intervall [1, ∞) liegen! Damit ist f1 injektiv und die dazu inverse Funktion existiert. Man berechnet y = p x2 − 1 , y 2 = x2 − 1 , y 2 + 1 = x2 , q y2 + 1 = x . Letzteres folgt, weil x im Intervall [1, ∞) liegt. Die inverse Funktion (siehe Figur 5) f1−1 ist somit gegeben durch die Vorschrift f1−1 : x → p x2 + 1, D(f1−1 ) = W (f1 ) = [0, ∞). 51 Kapitel I. Funktionen Ähnlich wie in den letzten beiden Beispielen geht man bei den trigonometrischen Funktionen vor. Man schränkt den Definitionsbereich geeignet ein, um eine injektive Funktion zu erhalten und geht dann zur inversen Funktion über. Auf diese Art und Weise gelangt man zu den sogenannten zyklometrischen Funktionen. Arcus sinus Wir betrachten zuerst die Funktion f : x → sin x, D(f ) = [−π/2, +π/2] . Man beachte den eingeschränkten Definitionsbereich! Mit Hilfe der Ableitung sieht man sofort, dass die Funktion f strikt monoton wachsend ist, also ist sie injektiv. Die zu f inverse Funktion f −1 heisst definitionsgemäss arcsin (“arcus sinus”). Sie ist durch die Vorschrift arcsin : x → f −1 (x) = y = derjenige Winkel, zwischen −π/2 und +π/2, dessen Sinus x ist gegeben. Es gilt D(f −1 ) = W (f ) = [−1, +1] und W (f −1 ) = D(f ) = [−π/2, +π/2]. Den Graphen von arcsin erhält man durch Spiegelung an der Geraden y = x (siehe Figuren 6,7). Arcus cosinus Die zu f : x → cos x, D(f ) = [0, π] inverse Funktion heisst arccos (“arcus cosinus”). Dabei gilt für Definitions- und Wertebereich D(arccos) = [−1, +1] und W (arccos) = [0, π] (siehe Figuren 8,9). Der Funktionswert arccos x ist derjenige Winkel zwischen 0 und π, dessen Cosinus x ist. Man hat also beispielsweise arccos 1 = 0, arccos 0 = π/2, arccos(−1) = π, p √ arccos( 2/2) = π/4, sin(arccos x) = 1 − x2 , wie der Leser leicht einsieht. Arcus tangens Die zu f : x → tan x, D(f ) = (−π/2, +π/2) inverse Funktion heisst arctan (“arcus tangens”). Dabei gilt D(arctan) = (−∞, +∞) und W (arctan) = (−π/2, +π/2) (siehe Figuren 10,11). Als Beispiel einer Eigenschaft dieser Funktion √ erwähnen wir Beziehung cos(arctan x) = 1/ 1 + x2 , die man leicht aus der Definition herleitet. Arcus cotangens Die zu f : x → cot x, D(f ) = (0, π) 52 U. Stammbach: 1.5 (y) 1 y = sin x 0.5 -1.5 -1 Analysis, Teil A Fig. 6 : -0.5 0.5 1 1.5 (x) x → sin x, D(f ) = [−π/2, +π/2] -0.5 -1 -1.5 1.5 (y) 1 y = arcsin x 0.5 -1.5 -1 -0.5 0.5 1 Fig. 7 : 1.5 (x) -0.5 -1 -1.5 x → arcsin x 53 Kapitel I. Funktionen 3 (y) 2 Fig. 8 : x → cos x, D(f ) = [0, π] 1 y = cos x (x) -1 1 2 3 -1 3 (y) 2 Fig. 9 : 1 x → arccos x y = arccos x (x) -1 1 -1 2 3 54 U. Stammbach: 3 Analysis, Teil A (y) 2 y = tan x 1 -3 -2 Fig. 10 : -1 1 2 3 (x) x → tan x, D(f ) = (−π/2, +π/2) -1 -2 -3 3 (y) 2 y = arctan x 1 -3 -2 -1 Fig. 11 : 1 2 3 (x) -1 -2 -3 x → arctan x 55 Kapitel I. Funktionen (y) 3 2 y = cot x 1 -3 -2 Fig. 12 : -1 1 2 3 (x) x → cot x, D(f ) = (0, π) -1 -2 -3 3 (y) 2 y = arccot x 1 -3 -2 -1 Fig. 13 : 1 2 3 (x) -1 -2 -3 x → arccot x 56 U. Stammbach: Analysis, Teil A inverse Funktion heisst arccot (“arcus cotangens”). Dabei gilt D(arccot) = (−∞, +∞) und W (arccot) = (0, π) (siehe Figuren 12,13). Dass die Einschränkungen bei den trigonometrischen Funktionen gerade auf die hier angegebene Art erfolgen, ist natürlich willkürlich; sie haben sich aber in der Literatur weitgehend durchgesetzt. Andere sind selbstverständlich ebenfalls denkbar. Wir beschliessen den Abschnitt, mit dem folgenden Anwendungsbeispiel, welches zeigt, dass die arcus-Funktionen auf natürliche Weise auftreten. Beispiel Man berechne die Länge l des Kreisbogens aus den Grössen x und a (siehe Figur 14). x Fig. 14 : Kreisbogen a r α Ist r der Radius des Kreisbogens, so liefert die Figur 14 sofort die folgende Beziehung (r − x)2 + a2 = r 2 . Daraus ergibt sich r= Ferner gilt a2 + x2 . 2x 57 Kapitel I. Funktionen sin α = a , r woraus man α = arcsin 2ax 2 a + x2 und schliesslich l =2· erhält. a2 + x2 2x ! · arcsin 2ax 2 a + x2 58 7 U. Stammbach: Analysis, Teil A Asymptoten In diesem letzten kurzen Abschnitt betrachten wir das Verhalten von Funktionen für grosse Werte von x. Gegeben sei eine Funktion f : x → f (x), welche mindestens auf dem Intervall (c, ∞) definiert ist. Wir nennen eine Funktion g : x → g(x) eine Asymptote von f für x → ∞, wenn gilt lim (f (x) − g(x)) = 0 . x→∞ In diesem Fall schmiegen sich die Graphen der beiden Funktionen f und g für x → ∞ einander an. Am einfachsten ist die Situation, wenn g eine lineare Funktion ist, dann schmiegt sich der Graph von f einer Geraden an. Ist man für grosse x nur an einer Approximation von f interessiert, so kann für solche Werte von x die (kompliziertere) Funktion f durch die (einfachere) Funktion g ersetzt werden. Es ist klar, dass eine analoge Definition für x → −∞ gemacht werden kann. Wir betrachten anschliessend einige Beispiele. (y) 8 6 y= 2x + 1 x−1 Fig. 1 : 4 x→ 2 -4 -2 2 4 6 8 (x) -2 Beispiel Es sei f : x → (2x + 1)/(x − 1). Wegen 2x + 1 x−1 59 Kapitel I. Funktionen 2x + 1 2x − 2 + 3 3 = =2+ x−1 x−1 x−1 ist offensichtlich g : x → 2 eine Asymptote von f für x → ∞ (und auch für x → −∞) (siehe Figur 1). 35 (y) 30 25 y= x2 + 2x − 8 x−3 Fig. 2 : 20 15 x→ x2 + 2x − 8 x−3 10 5 (x) -2 2 4 6 8 -5 Beispiel Es sei f :x→ x2 + 2x − 8 7 =x+5+ . x−3 x−3 Offenbar ist g : x → x + 5 eine Asymptote von f für x → ±∞ (siehe Figur 2). (Die Funktion f besitzt in x = 3 einen Pol. Man sagt in dieser Situation dann auch etwa, die vertikale Gerade x = 3 sei eine Asymptote von f für x → ±3. Streng genommen ist dies von unserer Definition einer Asymptote nicht abgedeckt.) Beispiel Es sei f : x → −1 + p x2 + 1 . Wir behaupten, dass g : x → x−1 eine Asymptote von f für x → ∞ ist, und dass h : x → −x−1 eine Asymptote von f für x → −∞ ist (siehe Figur 3). Da die Funktion f gerade ist, ist nur eine der Behauptungen zu beweisen. Es gilt in der Tat 60 U. Stammbach: Analysis, Teil A 6 (y) 4 Fig. 3 : 2 x → −1 + -4 -2 2 4 p x2 + 1 (x) -2 -4 15 (y) 10 Fig. 4 : 5 y = x2 + x − 2 -4 -2 2 4 (x) y= x3 − 3x + 5 x−1 -5 -10 x→ x3 − 3x + 5 x−1 61 Kapitel I. Funktionen lim x→∞ Beispiel (−1 + p x2 + 1) − (x − 1) = lim x→∞ Es sei f :x→ p x2 + 1 − x = lim x→∞ (x2 + 1) − x2 √ x2 + 1 + x ! =0. x3 − 3x + 5 3 = x2 + x − 2 + . x−1 x−1 Es ist folglich die quadratische Funktion g : x → x2 + x − 2 sowohl für x → ∞ wie für x → −∞ eine Asymptote von f (siehe Figur 4). Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel II. Differentialrechnung Nature and nature’s law lay hid in night; God said, “Let Newton be”, and all was light. Alexander Pope 1688-1744 Inhaltsverzeichnis 1 Begriff des Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3 Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . 23 4 Extremalaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Zu Exponential- und Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . . 35 6 Grössenordnungen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 49 7 Die zweite und höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 57 8 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3 Kapitel II. Differentialrechnung 1 Begriff des Differentialquotienten Wir betrachten hier das folgende naheliegende geometrische Problem. Gegeben sei eine Funktion f : x → f (x) und ein Punkt P = (x0 , f (x0 )) ihres Graphen Γ(f ) in der (x, y)-Ebene. Gesucht ist die Tangente im Punkt P an dem Graphen Γ(f ). Als Gerade durch den Punkt P wird die Tangente durch eine Gleichung der Form y − f (x0 ) = m(x − x0 ) beschrieben. Dabei bezeichnet m die Steigung der Tangente, also die Steigung des Graphen im Punkt P . Diese gilt es zu berechnen. Zu diesem Zweck betrachten wir die Gerade durch P und Q, wobei Q der Punkt des Graphen von f ist, welcher zum x-Wert x0 + ∆x gehört. Es gilt folglich Q = (x0 + ∆x, f (x0 + ∆x)). Die Steigung dieser Sekante ist gegeben durch den Quotienten (Differenzenquotienten, siehe Figur 1) mP Q = f (x0 + ∆x) − f (x0 ) . ∆x Lassen wir nun ∆x gegen Null streben, d.h. betrachten wir den Grenzwert lim ∆x→0 f (x0 + ∆x) − f (x0 ) ∆x so wird dieser – falls er existiert – die Steigung der Tangente beschreiben. Definition ( I. Newton 1642-1727, G. W. Leibniz 1646-1716) Der Grenzwert df f (x0 + ∆x) − f (x0 ) (x0 ) = lim ∆x→0 dx ∆x heisst Differentialquotient von f an der Stelle x0 . Existiert der Differentialquotient von f an der Stelle x0 , so heisst f differenzierbar in x0 . Existiert der Differentialquotient von f für jedes x im Definitionsbereich D(f ) von f , so heisst f differenzierbar schlechthin. In diesem Fall definiert die Zuordnung 4 U. Stammbach: Analysis, Teil A (y) Fig. 1 : Differenzenquotient, Differentialquotient Q ∆y P ∆x (x) x → f 0 (x) = df (x) dx eine Funktion f 0 mit D(f 0 ) = D(f ), welche Ableitung oder Derivierte von f heisst. Ist f differenzierbar in x0 , so ist f auch stetig in x0 . Existiert nämlich f (x0 + ∆x) − f (x0 ) , ∆x→0 ∆x lim so muss notwendigerweise mit ∆x auch f (x0 + ∆x) − f (x0 ) gegen Null streben. Es gilt folglich f (x0 ) = lim f (x0 + ∆x) = lim f (x) . ∆x→0 Damit ist die Funktion stetig in x0 . x→x0 5 Kapitel II. Differentialrechnung (y) Fig. 2 : Zur Existenz des Differentialquotienten |x| (x) In der Definition der Differenzierbarkeit fordert man die Existenz des Grenzwertes lim ∆x→0 f (x0 + ∆x) − f (x0 ) , ∆x d.h. der linke und der rechte Grenzwert (∆x → 0− bzw. ∆x → 0+ ) müssen existieren und miteinander übereinstimmen. Natürlich gibt es Beispiele, wo diese Grenzwerte zwar existieren, aber nicht übereinstimmen. In diesem Fall spricht man vom linksseitigen, bzw. rechtsseitigen Differentialquotienten von f in x0 . Als konkretes Beispiel betrachten wir die Funktion f : x → |x| an der Stelle x0 = 0 (siehe Figur 2). Offensichtlich gilt hier lim f (x) − f (0) ∆x = lim f (x) − f (0) ∆x = ∆x→0− ∆x→0+ lim |∆x| = −1 , ∆x lim |∆x| = +1 . ∆x ∆x→0− ∆x→0+ Im ersten Fall ist nämlich ∆x negativ, während es im zweiten Fall positiv ist. Für einfache Funktionen lassen sich die Ableitungen direkt berechnen. Klar ist zum Beispiel, dass für die Ableitung der konstanten Funktion f : x → C gilt: f 0 (x) = 0. Für g : x → x 6 U. Stammbach: Analysis, Teil A erhält man auf ähnliche Weise wie oben g0 (x) = 1. Etwas komplizierter ist die Berechnung in den folgenden Beispielen. Beispiel Es sei f : x → x2 . Dann gilt f 0 (x) = f (x + ∆x) − f (x) ∆x→0 ∆x lim = (x + ∆x)2 − (x)2 ∆x→0 ∆x = x2 + 2x ∆x + (∆x)2 − x2 ∆x→0 ∆x = lim lim lim (2x + ∆x) ∆x→0 = 2x . Beispiel Es sei f : x → sin x. Dann gilt d sin (x) = dx = sin(x + ∆x) − sin x ∆x→0 ∆x lim sin x cos ∆x + sin ∆x cos x − sin x ∆x→0 ∆x lim = = 1 − cos ∆x ∆x 1 + cos ∆x sin x 1 + cos ∆x lim sin ∆x cos x − ∆x lim ∆x sin ∆x sin2 (∆x) cos x − sin x ∆x (∆x)2 1 + cos ∆x ∆x→0 ∆x→0 sin ∆x = cos x lim − ∆x→0 ∆x sin ∆x lim ∆x→0 ∆x = cos x . Analog erhält man d cos (x) = − sin x . dx 2 ! ∆x lim sin x ∆x→0 1 + cos ∆x 7 Kapitel II. Differentialrechnung Diese Beispiele zeigen, dass die Berechnung der Ableitung schon für recht einfache Funktionen aufwendig ist, wenn man von der Definition des Differentialquotienten ausgeht. Dieser Aufwand kann wesentlich reduziert werden, wenn “das Ableiten” zu einem Kalkül ausgebaut wird: Der Übergang von der Funktion f zur Ableitungsfunktion f 0 genügt einigen einfachen Rechenregeln, die erlauben, die Ableitung einer Funktion auf weitgehend mechanische Weise zu berechnen. Es sind dies einmal die folgenden vier Regeln und die etwas weiter unten zu behandelnde Kettenregel. Es seien f : x → f (x) und g : x → g(x) zwei in x differenzierbare Funktionen. Dann gilt (f + g)0 (x) = f 0 (x) + g0 (x) , (Cf )0 (x) = C · f 0 (x) , C∈R , (f g)0 (x) = f 0 (x)g(x) + f (x)g0 (x) 0 f g (x) = f 0 (x)g(x) − f (x)g0 (x) g2 (x) (Produktregel) , (Quotientenregel). Bei der Quotientenregel muss natürlich g(x) 6= 0 vorausgesetzt werden. Diese Rechenregeln sind aus der Mittelschule bekannt und werden aus diesem Grund hier nicht bewiesen. Statt dessen wenden wir sie in einzelnen Beispielen an. Beispiel Es sei h : x → x3 = x2 · x. Für f : x → x2 und g : x → x ergibt die Produktregel d 3 x = h0 (x) = f 0 (x) · g(x) + f (x) · g0 (x) dx = 2x · x + x2 · 1 = 3x2 . Ist m eine positive ganze Zahl, so ergibt sich auf analoge Weise durch vollständige Induktion d m x = m · xm−1 . dx 8 U. Stammbach: Analysis, Teil A Beispiel Es sei h : x → 1/xm = x−m , m positiv ganz. Für f : x → 1 und g : x → xm ergibt die Quotientenregel d −m −1 · mxm−1 1 = h0 (x) = = −m m+1 = −mx−m−1 . x dx x2m x Beispiel Es sei h : x → tan x. Für f : x → sin x und g : x → cos x ergibt die Quotientenregel d tan d sin x cos x · cos x + sin x · sin x 1 (x) = = = . 2 dx dx cos x cos x cos2 x Analog erhält man d cot 1 (x) = − 2 . dx sin x Eine weitere wichtige Ableitungsregel ist die sogenannte Kettenregel. Sie lautet wie folgt: Kettenregel Es seien f : x → f (x) und g : x → g(x) zwei differenzierbare Funktionen und h : x → f ◦ g (x) = f (g(x)) sei die zusammengesetzte Funktion. Dann gilt d(f ◦ g) (x) = h0 (x) = f 0 (g(x)) · g0 (x) . dx Der erste Faktor heisst “äussere”, der zweite Faktor “innere” Ableitung. Beweis Laut Definition der Ableitung haben wir d(f ◦ g) (x) = F 0 (x) = dx = f ◦ g (x + ∆x) − f ◦ g (x) ∆x→0 ∆x lim f (g(x + ∆x)) − f (g(x)) ∆x→0 ∆x lim 9 Kapitel II. Differentialrechnung Wir setzen g(x + ∆x) − g(x) = d und beachten, dass mit ∆x auch d gegen Null strebt, denn da g in x differenzierbar ist, ist es auch stetig in x. Damit erhalten wir 0 F (x) = = lim ∆x→0 f (g(x) + d) − f (g(x)) g(x + ∆x) − g(x) · d ∆x f (g(x) + d) − f (g(x)) g(x + ∆x) − g(x) · lim ∆x→0 d→0 d ∆x lim = f 0 (g(x)) · g0 (x) . Dies war zu beweisen. Beispiel Es sei F : x → tan (x2 ). Für f : x → tan x, g : x → x2 liefert die Kettenregel für die zusammengesetzte Funktion F : x → f ◦ g (x) = f (g(x)). d 1 tan (x2 ) = F 0 (x) = · 2x . dx cos2 (x2 ) Beispiel Es sei F : x → (g(x))m . Für f : x → xm ist F = f ◦ g. Die Kettenregel liefert d (g(x))m = F 0 (x) = m · (g(x))m−1 · g0 (x) . dx Beispiel Es sei G : x → g(xm ). Für f : x → xm ist G = g ◦ f (Man beachte die Reihenfolge!). Die Kettenregel liefert d g(xm ) = G0 (x) = g0 (xm ) · mxm−1 . dx 7 Beispiel Es sei H : x → 1 + (1 + x2 )4 . Die Kettenregel liefert, zweimal hintereinander angewandt, 6 dH (x) = H 0 (x) = 7 1 + (1 + x2 )4 · 4(1 + x2 )3 · 2x . dx 10 U. Stammbach: Analysis, Teil A Eine weitere Anwendung der Kettenregel betrifft die Ableitung der inversen Funktion. Es sei f : x → f (x) eine injektive Funktion. Ihre Ableitung f 0 : x → f 0 (x) sei bekannt. Gesucht ist (f −1 )0 (x), die Ableitung der zu f inversen Funktion. Laut Definition der inversen Funktion gilt f ◦ f −1 (x) ≡ x . Setzen wir f −1 = g und wenden wir die Kettenregel an, so folgt f 0 f −1 (x) · (f −1 )0 (x) ≡ 1 . Auflösen nach (f −1 )0 (x) liefert (f −1 )0 (x) = 1 f 0 (f −1 (x)) . Als Zusatz bemerken wir noch folgendes. Ist y der Funktionswert der Funktion f an der Stelle x, so sagt man in einer etwas altertümlichen Sprechweise manchmal, dass ”y eine Funktion von x” sei. Ist f injektiv, so stellt die inverse Funktion f −1 “x als Funktion von y” dar. Die obige Beziehung zwischen den Ableitungen drückt sich dann in der einprägsamen Formel dx 1 (y) = dy (x) dy dx aus. Dabei ist das Argument y auf der linken Seite der Gleichung gleich dem Funktionswert von f an der Stelle x. (Man beachte, dass man heutzutage die Variable der inversen Funktion f −1 wenigstens in formalen Darstellungen durchwegs gleich benennt wie die Variable der Funktion f .) Beispiel Es sei g : x → x1/m , m positiv ganz, D(g) = [0, ∞). Definitionsgemäss ist g die Umkehrfunktion der Funktion f : x → xm . Die obige Formel liefert d 1 1 1 1 −1 = x m = g0 (x) = xm . 1 dx m m · (x m )m−1 11 Kapitel II. Differentialrechnung Beispiel Es sei g : x → arcsin x. Laut Definition ist g die Umkehrfunktion von f : x → sin x, D(f ) = [−π/2, +π/2]. Die obige Formel liefert d arcsin 1 1 . (x) = g0 (x) = = √ dx cos(arcsin x) 1 − x2 Beispiel Es sei h : x → arctan x. Laut Definition ist h die Umkehrfunktion von f : x → tan x, D(f ) = (−π/2, +π/2). Die obige Formel liefert d arctan (x) = h0 (x) = dx 1 1 . = cos2 (arctan x) = 1 1 + x2 cos2 (arctan x) Wir beschliessen den Abschnitt mit zwei konkreten geometrischen Problemen. Beispiel Wir stellen uns die folgende Aufgabe. Es sei die Parabel y = x2 gegeben. Es sei P0 ein von Ursprung verschiedener, aber sonst beliebiger Punkt dieser Parabel und t0 sei die zugehörige Tangente. Man finde den Punkt P1 auf der Parabel, dessen zugehörige Tangente t1 senkrecht zu t0 verläuft und bestimme den Schnittpunkt S von t0 und t1 (siehe Figur 3). Wir fassen die Parabel y = x2 als Graph der Funktion f : x → x2 auf. Der beliebige Punkt P0 gehöre zum x-Wert x0 , x0 6= 0. Dann gilt P0 = (x0 , x20 ). Da die Ableitung durch f 0 (x) = 2x gegeben ist, hat t0 die Steigung 2x0 . Die Geradengleichung von t0 lautet somit (1.1) y − x20 = 2x0 (x − x0 ) . Die Gerade t1 steht senkrecht zu t0 , sie hat also die Steigung −1/(2x0 ). Für den gesuchten Punkt P1 = (x1 , x21 ) der Parabel muss deshalb die Gleichung 2x1 = − 1 2x0 erfüllt sein. Daraus ergibt sich x1 = − 1 , 4x0 12 U. Stammbach: Analysis, Teil A (y) P0 Fig. 3 : Senkrecht stehende Tangenten an die Parabel y = x2 y = x2 t1 t0 P1 (x) S y=− 1 4 und die Geradengleichung von t1 lautet somit (1.2) 1 1 1 y− = − x+ 2 16x0 2x0 4x0 . Wir erhalten den Schnittpunkt S der beiden Geraden t0 , t1 , indem wir das aus den Gleichungen (1.1) und (1.2) gebildete System nach x und y auflösen. Für die Koordinaten von S ergibt sich x = 1 1 x0 − 2 8x0 y = − 1 . 4 Der Schnittpunkt von t0 und t1 liegt also unabhängig vom Ausgangspunkt P0 auf der Parallelen y = −1/4 zur x-Achse. Ein überraschendes Resultat! Beispiel Es sei wiederum P0 ein vom Ursprung des Koordinatensystems verschiedener, beliebiger Punkt der Parabel y = x2 . Die zugehörige Tangente sei t0 , die zugehörige Normale 13 Kapitel II. Differentialrechnung n0 . Der Punkt P2 sei der Schnittpunkt von n0 mit der Parabel und t2 die zugehörige Tangente. Man bestimme den Schnittpunkt von t0 und t2 (siehe Figur 4). Wie oben ist die Tangente t0 im Punkt P0 , P0 = (x0 , x20 ) durch die Gleichung y − x20 = 2x0 (x − x0 ) (1.3) gegeben, die Normale n0 durch P0 demzufolge durch y − x20 = − 1 (x − x0 ) . 2x0 (y) y = x2 P2 n0 t0 Fig. 4 : Schnittpunkt der Tangenten t0 und t2 an die Parabel y = x2 P0 t2 (x) T 1 1 y=− − 2 16x2 Um P2 zu erhalten, löst man das Gleichungssystem y − x20 = − 1 (x − x0 ) 2x0 y = x2 14 U. Stammbach: Analysis, Teil A nach x und y auf. Die eine Lösung ist natürlich x = x0 , y = x20 ; die andere ergibt sich zu 1 1 x = −x0 − , y = x0 + 2x0 2x0 2 . Daraus erhält man P2 = (−x0 − 1/(2x0 ), (x0 + 1/(2x0 ))2 ) und die Tangente t2 ist durch die Gleichung (1.4) y − x0 + 1 2x0 2 = −2 x0 + 1 2x0 x + (x0 + 1 ) 2x0 gegeben. Löst man das durch die Gleichungen (1.3) und (1.4) gebildete System nach x und y auf, so erhält man die Koordinaten des gesuchten Schnittpunktes T , nämlich x = − 1 4x0 1 y = − − x20 2 Eliminieren wir schliesslich x0 , so ergibt sich die Gleichung der durch den Schnittpunkt gebildeten Kurve K. Sie lautet 1 1 y = − − . 2 16x2 15 Kapitel II. Differentialrechnung 2 Linearisieren, Fehlerrechnung Es sei f : x → f (x) eine differenzierbare Funktion, x0 ∈ D(f ). Unter der linearen Ersatzfunktion von f in x0 versteht man die lineare Funktion x → f 0 (x0 )(x − x0 ) + f (x0 ) . Der Graph der linearen Ersatzfunktion von f in x0 ist somit gerade die Tangente an den Graphen von f im Punkt (x0 , f (x0 )). Der Vorgang, welcher die Funktion f durch die lineare Ersatzfunktion von f in x0 ersetzt, heisst Linearisieren in x0 . Beispiel Die lineare Ersatzfunktion von f : x → sin x in x0 = 0 ist x → f 0 (x0 )(x − x0 ) + f (x0 ) = x , denn es gilt sin0 (0) = cos(0) = 1, sin(0) = 0. Die lineare Ersatzfunktion von f : x → sin x in x0 = π/3 ist (siehe Figur 1) 1 π x→ x− 2 3 √ 3 1 + = x+ 2 2 √ 3 π − 2 6 ! , denn es gilt 0 sin π 3 π = cos 3 √ π 1 = , sin 2 3 = 3 . 2 Die Figur lässt vermuten, dass die lineare Ersatzfunktion von f : x → f (x) in x0 , in der Umgebung des Wertes x0 eine gute Approximation für die Funktion f ist. Dies ist in der Tat der Fall und lässt sich mathematisch wie folgt ausdrücken. Wir setzen ϕ(x) = f (x) − (f 0 (x0 )(x − x0 ) + f (x0 )) , 16 U. Stammbach: Analysis, Teil A 3 (y) 2 1 y = x+ 2 √ 3 π − 2 6 ! y = sin x 1 -1 Fig. 1 : Die lineare Ersatfunktion von f : x → sin x in x0 = π/3 1 2 3 (x) -1 so dass ϕ die Differenz zwischen der Funktion f und deren linearen Ersatzfunktion in x0 beschreibt. Je kleiner |ϕ(x)| ist, umso besser wird f (x) durch den Wert der linearen Ersatzfunktion approximiert. Natürlich gilt ϕ(x0 ) = 0. Setzen wir wie üblich ∆x = x − x0 , so erhalten wir ϕ(x) f (x) − f (x0 ) ϕ(x) = = − f 0 (x0 ) . ∆x x − x0 ∆x Betrachten wir jetzt den Grenzübergang x → x0 (oder ∆x → 0), so folgt ϕ(x) = 0. ∆x→0 ∆x lim Dies bedeutet anschaulich, dass für x → x0 nicht nur ϕ(x) gegen Null geht (was nach obigem klar ist), sondern dass ϕ(x) stärker gegen Null geht als ∆x. Es geht nämlich sogar der Quotient ϕ(x)/∆x gegen Null. In der Tat ist also die lineare Ersatzfunktion von f in x0 in der Umgebung von x0 eine gute Approximation für f ; eine umso bessere, je näher x bei x0 liegt. Die Tatsache, dass der Quotient ϕ(x)/∆x für ∆x → 0 gegen Null strebt, werden wir später dadurch ausdrücken, dass wir sagen “ϕ(x) ist für x → x0 von kleinerer Grössenordnung als ∆x = x − x0 ”. Wir werden dies durch das Symbol 17 Kapitel II. Differentialrechnung ϕ(x) = o(x − x0 ) für x → x0 beschreiben. Beim Arbeiten mit der linearen Ersatzfunktion hat es sich eingebürgert, ein neues, aus dem alten durch Parallelverschiebung gewonnenes Koordinatensystem mit dem neuen Ursprung im Punkte (x0 , f (x0 )) einzuführen. Man benennt die Achsen des neuen Koordinatensystems mit dx und df . Die lineare Ersatzfunktion von f in x0 , die wir jetzt df nennen, stellt sich in diesem neuen Koordinatensystem auf sehr einfache Weise dar df : dx → f 0 (x0 ) · dx . Die Approximationseigenschaft lässt sich dann durch ∆f = f (x) − f (x0 ) ∼ df . ausdrücken. In diesem Zusammenhang heisst die lineare Ersatzfunktion auch Differential der Funktion f in x0 . Beispiel Die lineare Ersatzfunktion von f : x → (1 + x)α in x0 = 0 ist x → α(1 + x0 )α−1 (x − x0 ) + (1 + x0 )α = 1 + αx . Unser Resultat besagt, dass 1 + αx für x nahe bei x0 = 0 eine gute Approximation für (1 + x)α ist, und zwar ist der Fehler |ϕ(x)| im Vergleich mit |x| “verschwindend klein”, wenn nur |x| genügend klein ist. Insbesondere gelten für |x| << 1 die Beziehungen (siehe Figuren 2,3,4) √ 1 1+x ∼ 1+ x , 2 1 1 √ ∼ 1− x , 2 1+x 1 ∼ 1−x . 1+x 18 U. Stammbach: Analysis, Teil A 3 (y) y = 1 + 12 x 2 y= Fig. 2 : Die lineare Ersatzfunktion von √ f : x→ 1+x √ 1+x 1 im Punkte x0 = 0 (x) -1 1 2 3 -1 3 (y) 2 1 Fig. 3 : Die lineare Ersatzfunktion von 1 y= √ 1+x f :x→ √ im Punkte x0 = 0 y = 1 − 12 x -1 1 -1 1 1+x (x) 2 3 19 Kapitel II. Differentialrechnung 2 (y) 1.5 Fig. 4 : Die lineare Ersatzfunktion von 1 y= 1 1+x 0.5 f :x→ 1 1+x im Punkte x0 = 0 -1 -0.5 0.5 1 1.5 2 (x) -0.5 y =1−x -1 Von letzterer Approximation macht man im täglichen Leben oft Gebrauch: Eine Ware, die A Franken kostet, kostet nach einem Preisaufschlag von 2% B, B = A(1 + 2/100) Franken. Geht man vom neuen Preis aus, so gilt A = B/(1 + 2/100). Folglich ist es falsch zu sagen, dass die Ware vor dem Aufschlag um 2% billiger war, aber jedermann weiss, dass dies annähernd richtig ist. In der Tat gilt 2 A = B/ 1 + 100 2 ∼B 1− 100 . Jedermann ist sich auch bewusst, dass für grössere Prozentzahlen die analoge Approximation nicht mehr genügend gut ist. Die Technik des Linearisierens wird bei der mathematischen Behandlung von Problemen der Natur- und Ingenieurwissenschaften sehr häufig angewendet. Die in solchen Problemen auftretenden Grössen werden nämlich in der Regel durch komplizierte und vielfach gar nicht genau bekannte Funktionen beschrieben. Man denke etwa an die Reibungskräfte auf einer rauhen Oberfläche oder an die Spannungskräfte, die in einem Balken auftreten, wenn dieser bis zum Bruch belastet wird. In der mathematischen Behandlung ersetzt man deshalb die komplizierten Funktionen sehr oft durch einfachere Approximationen; als erste grobe Näherung bietet sich 20 U. Stammbach: Analysis, Teil A dabei die lineare Ersatzfunktion an. Man linearisiert das Problem und betrachtet die linearisierte Theorie. Dadurch wird das Problem mathematisch nicht nur einfacher zu fassen, sondern in vielen Fällen ist erst die linearisierte Theorie einer vollständigen mathematischen Behandlung überhaupt zugänglich. Diese liefert zwar nur eine erste Näherung, aber diese reicht für praktische Zwecke oft aus. Beispiel ist durch Die Rückstellkraft K eines mathematischen Pendels der Länge l und der Masse m K = mg sin ϕ gegeben, wobei g die Erdbeschleunigung bezeichnet. Wie wir später sehen werden, bereitet die mathematische Behandlung des mathematischen Pendels erhebliche Schwierigkeiten, wenn man für die Rückstellkraft diese Formel verwendet. Man betrachtet deshalb die linearisierte Theorie, die man dadurch erhält, dass man die Funktion ϕ → K = mg sin ϕ durch ihre lineare Ersatzfunktion in ϕ0 = 0 ersetzt, ϕ → mgϕ . Der Wert ϕ0 = 0 entspricht der Ruhelage des Pendels. Anschaulich gesagt, beschränkt man sich auf kleine Auslenkungen des Pendels, ϕ << 1, und benützt, dass für kleine Werte von ϕ die komplizierte Funktion ϕ → mg sin ϕ gut durch ihre lineare Ersatzfunktion in ϕ0 = 0, d.h. durch ϕ → mgϕ approximiert wird. Die linearisierte Theorie des mathematischen Pendels lässt sich auf eine einfache Weise mathematisch darstellen und durchrechnen (siehe später). Es zeigt sich darüber hinaus, dass die so erhaltene Näherung für die meisten praktischen Zwecke völlig genügt. Eine weitere wichtige Anwendung der Technik des Linearisierens ist die sogenannte Fehlerrechnung. Dabei geht es um das Problem, dass in der Praxis die Werte der Ausgangsgrössen einer Rechnung im allgemeinen nicht genau bekannt sind. Oft handelt es sich ja um Messwerte, die naturgemäss nur bis auf eine gewisse Genauigkeit bestimmt werden können, und deshalb mit (Mess-)Fehlern behaftet sind. Im Laufe einer Rechnung pflanzen sich diese Fehler fort und beeinflussen das Schlussresultat. Der Leser wird sich erinnern, dass wir eine ähnliche Fragestellung diskutiert haben, als wir den Begriff der Stetigkeit von Funktionen eingeführt haben. Während wir aber damals qualitative Aussagen in den Vordergrund stellten, sind wir jetzt an quantitativen Aussagen interessiert, nämlich an einer Abschätzung des Fehlers im Schlussresultat. Die 21 Kapitel II. Differentialrechnung Fehlerrechnung leistet gerade dies, und zwar indem die lineare Ersatzfunktion herangezogen wird. Beispiel In einem Dreieck seien die Seite a und der Winkel α genau bekannt. Der Winkel β wird gemessen, wobei der Messfehler kleiner als ∆β ist. Wie wirkt sich dieser Messfehler bei der Berechnung der Länge der Seite b aus? Nach dem Sinus-Satz gilt b= a sin β . sin α Betrachten wir b als Funktion von β, b = f (β), und vergleichen wir die Funktionswerte f (β+∆β) und f (β), so gilt nach obigem ∆f = f (β + ∆β) − f (β) ∼ df = f 0 (β)dβ , wobei wir rechts statt ∆β konsequenterweise dβ geschrieben haben. Für das Differential df erhalten wir df = a cos β dβ , sin α was eine Abschätzung des absoluten Fehlers |∆f | erlaubt. In den Anwendungen interessanter ist allerdings gewöhnlich der relative Fehler. Darunter versteht man den Quotienten df /f . In unserem Fall erhalten wir df = cot β dβ . f Für kleine β’s wird der relative Fehler also gross. Beispiel Man möchte die Oberfläche O und das Volumen V einer Kugel aus der einzigen wirklich messbaren Grösse, nämlich dem Durchmesser x der Kugel bestimmen. Wie wirken sich Messfehler aus? Es gelten bekanntlich die Formeln V = 4π 3 O = 4π Daraus folgt für die absoluten Fehler 3 x 2 2 x 2 , . 22 U. Stammbach: dV = 4π 3 3 2 2 x 2 dO = 4π dx = 2π 2 x 2 Analysis, Teil A dx , x dx = 2πx dx 2 und für die relativen Fehler dV dx =3 , V x dO dx =2 . O x Wir überlassen es dem Leser, für die Berechnung des relativen Fehlers, etwa bei Potenzfunktionen, Rechenregeln zu finden. 23 Kapitel II. Differentialrechnung 3 Mittelwertsatz der Differentialrechnung Wir führen zuerst den Begriff des lokalen Extremums ein. Eine Funktion f : x → f (x) mit Definitionsbereich D(f ) besitzt in ξ ∈ D(f ) eine lokale Maximalstelle, wenn es ein Intervall (c, d) gibt mit c < ξ < d, so dass für alle x aus D(f ) mit c < x < d gilt f (x) ≤ f (ξ). Der Wert f (ξ) heisst dann ein lokales Maximum von f . Analog ist eine lokale Minimalstelle und ein lokales Minimum definiert. Unter einer lokalen Extremalstelle versteht man eine lokale Maximalstelle oder eine lokale Minimalstelle, und man spricht in analoger Weise von einem lokalen Extremum. Es zeigt sich, dass lokale Extremalstellen von differenzierbaren Funktionen, falls sie im Innern des Definitionsbereiches liegen, mit Hilfe der Differentialrechnung entdeckt werden können. Satz Es sei f : x → f (x) eine auf dem Intervall (a, b) definierte differenzierbare Funktion, die in ξ, a < ξ < b ein lokales Extremum besitzt. Dann gilt f 0 (ξ) = 0. Beweis Wir zeigen, dass die Annahme f 0 (ξ) > 0 zu einem Widerspruch führt (in analoger Weise führt auch f 0 (ξ) < 0 zu einem Widerspruch). Definitionsgemäss gilt f 0 (ξ) = lim x→ξ f (x) − f (ξ) . x−ξ Es sei nun f 0 (ξ) > 0. Dann folgt nach der Definition des Limes, dass für alle genügend nahe bei ξ liegenden x gilt f (x) − f (ξ) >0. x−ξ Für diese Werte x hat also f (x) − f (ξ) dasselbe Vorzeichen wie x − ξ. Für x-Werte mit x − ξ > 0 gilt somit f (x) > f (ξ) und für x-Werte mit x−ξ < 0 gilt f (x) < f (ξ). Damit besitzt f in ξ weder ein lokales Maximum noch ein lokales Minimum. Dies steht im Widerspruch zur Voraussetzung. Aus dieser Aussage ergibt sich leicht der sogenannte Satz von Rolle (M. Rolle 1652 - 1719) (siehe Figur 1): Satz Es sei f : x → f (x) eine differenzierbare Funktion mit f (x1 ) = 0 = f (x2 ), x1 < x2 . Dann gibt es mindestens ein ξ, x1 < ξ < x2 mit f 0 (ξ) = 0. 24 U. Stammbach: Analysis, Teil A (y) Fig. 1 : Zum Satz von Rolle (x) x1 ξ x2 Beweis Ist f (x) ≡ 0 für x1 ≤ x ≤ x2 , so ist nichts zu beweisen, denn dann gilt f 0 (x) = 0 für alle x, x1 ≤ x ≤ x2 . Wir dürfen also annehmen, dass f im Intervall [x1 , x2 ] von Null verschiedene Werte annimmt. Aber dann nimmt f in einem inneren Punkt ξ, x1 < ξ < x2 ein Extremum an. Nach obigem folgt dann f 0 (ξ) = 0. (Die Aussage, dass f in einem Punkt des Intervalles [x1 , x2 ] ein Extremum annimmt, ist zwar sehr plausibel, sie müsste aber natürlich mathematisch bewiesen werden. Ein solcher Beweis würde etwas mehr mathematisches Grundlagenwissen benötigen, als wir in dieser Vorlesung zur Verfügung haben. Die Aussage folgt aus der Stetigkeit der Funktion f . Wir erwähnen schliesslich, dass man leicht Funktionen konstruieren kann, die zwar in allen Punkten des Intervalles [x1 , x2 ] definiert sind, die aber in diesem Intervall kein Extremum annehmen; diese Funktionen sind dann natürlich notwendigerweise nicht stetig.) Bemerkung Ist f auch nur in einem Punkt des Intervalles [x1 , x2 ] nicht differenzierbar, so braucht kein ξ der verlangten Art zu existieren. Der folgende Satz, der Mittelwertsatz der Differentialrechnung ist eine Verallgemeinerung des Satzes von Rolle (siehe Figur 2). Satz Es sei f : x → f (x) eine im Intervall [x1 , x2 ] definierte differenzierbare Funktion. Dann gibt es (mindestens) ein ξ, x1 < ξ < x2 mit f 0 (ξ) · (x2 − x1 ) = f (x2 ) − f (x1 ) 25 Kapitel II. Differentialrechnung (y) f (x2 ) Fig. 2 : Zum Mittelwertsatz der Differentialrechnung f (ξ) f (x1 ) (x) ξ x1 Beweis x2 Wir betrachten die Funktionen g : x → g(x) = f (x) − f (x2 ) − f (x1 ) (x − x1 ) + f (x1 ) x2 − x 1 . Offensichtlich gilt g(x1 ) = 0 = g(x2 ), und g ist differenzierbar. Nach dem Satz von Rolle gibt es dann ein ξ, x1 < ξ < x2 mit g0 (ξ) = 0; aber g0 (x) = f 0 (x) − f (x2 ) − f (x1 ) , x2 − x 1 so dass folgt f 0 (ξ) = Dies war zu beweisen. f (x2 ) − f (x1 ) . x2 − x 1 26 U. Stammbach: Analysis, Teil A Wir werden den Mittelwertsatz der Differentialrechnung an verschiedenen Stellen in der Vorlesung brauchen können. Gleich hier schliessen wir noch zwei instruktive Anwendungen an. Folgerung Es sei f : x → f (x) eine im Intervall [a, b] definierte differenzierbare Funktion mit f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für alle a ≤ x ≤ b. Dann ist f im Intervall (strikt) monoton wachsend. Beweis Es seien x1 , x2 zwei beliebige Stellen des Definitionsintervalles. Dann gibt es nach dem Mittelwertsatz der Differentialrechnung ein ξ zwischen x1 und x2 mit f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) . Aus f 0 (ξ) ≥ 0 (bzw. f 0 (x) > 0) folgt dann f (x2 ) ≥ f (x1 ) (bzw. f (x2 ) > f (x1 )). Regel von Bernoulli-Hôpital (Johann Bernoulli 1667-1748, G. F. A. de l’Hôpital 1661-1704) Es seien f : x → f (x) und g : x → g(x) zwei auf dem Intervall [a, b] definierte differenzierbare Funktionen mit f (a) = 0 = g(a). Ferner sei g0 (x) 6= 0 für a < x < b. Dann gilt lim x→a+ Beweis f (x) f 0 (x) = lim 0 . g(x) x→a+ g (x) Wir wählen X mit a < X < b und betrachten die Funktion h : x → h(x) = f (x)g(X) − f (X)g(x) . Natürlich gilt h(a) = 0 = h(X). Nach dem Satz von Rolle existiert dann ξ, a < ξ < X mit h0 (ξ) = 0. Es folgt 0 = h0 (ξ) = f 0 (ξ)g(X) − f (X)g0 (ξ) und damit f 0 (ξ) f (X) = , a<ξ<X . 0 g (ξ) g(X) Lässt man schliesslich in dieser Beziehung X gegen a streben, so erhält man die Behauptung. 27 Kapitel II. Differentialrechnung Beispiel x2 2x 2 = lim = lim =2. x→0 1 − cos x x→0 sin x x→0 cos x lim Beispiel ex − e ex = lim =e. x→1 log x x→1 1/x lim Beispiel lim x→0 1 1 − sin x x = lim x→0 x − sin x x sin x = lim x→0 1 − cos x sin x + x cos x = lim x→0 sin x 2 cos x − x sin x =0. 28 4 U. Stammbach: Analysis, Teil A Extremalaufgaben Extremalaufgaben sind von der Schule her wohlbekannt. Wir begnügen uns deshalb hier mit einigen Präzisierungen und Beispielen. Zuerst zur Definition eines Extremums. Es sei g : x → g(x) eine auf dem Intervall [a, b] definierte Funktion. Man sagt, x0 ∈ [a, b] sei eine globale Maximalstelle, wenn für alle x ∈ [a, b] gilt g(x0 ) ≥ g(x). Der Wert g(x0 ) heisst dann globales Maximum der Funktion g in [a, b]. Der Punkt x0 ∈ [a, b] heisst eine lokale Maximalstelle, wenn ein x0 enthaltendes Intervall (c, d) existiert, so dass für alle x aus [a, b], die auch in (c, d) liegen, gilt g(x0 ) ≥ g(x). Der Wert g(x0 ) heisst in diesem Fall ein lokales Maximum der Funktion g. Analog werden die Begriffe globale Minimalstellen, globales Minimum, lokale Minimalstelle, lokales Minimum definiert. Maximum und Minimum fasst man unter dem Begriff Extremum zusammen. Es ist ein wesentlicher Erfolg der Differentialrechnung, dass sie eine effiziente Behandlung von Extremalaufgaben erlaubt. Es gilt das folgende Resultat, das sich leicht aus dem ersten Satz des Abschnittes 3 ergibt: Es sei g : x → g(x), D(g) = [a, b] gegeben. Ist x0 eine lokale Extremalstelle der Funktion g, so ist - x0 ein Randpunkt des Definitionsintervalls, oder - die Ableitung von g in x0 ist nicht definiert, oder - die Ableitung von g ist definiert, und es gilt g0 (x0 ) = 0. Um die globale Extremalstelle einer Funktion zu finden, kann man demzufolge wie folgt vorgehen: Man macht sich eine Liste von Kandidaten für die lokalen Extremalstellen, d.h. eine Liste bestehend aus 29 Kapitel II. Differentialrechnung - den Randpunkten des Definitionsintervalls, - den Punkten x0 , in denen die Ableitung g0 nicht definiert ist, - den Punkten x0 , in denen g0 (x0 ) = 0 gilt. Man berechne dann die Funktionswerte von g in diesen (üblicherweise endlich vielen) Punkten und finde die Extremalstelle durch Vergleich der Funktionswerte. Zur Präzisierung mögen noch die folgenden Bemerkungen angeführt werden: Nicht jeder Punkt x0 mit g0 (x0 ) = 0 ist Extremalstelle (Beispiel: g : x → x3 , x0 = 0 ). Die zweite Ableitung kann oft herangezogen werden, um zu entscheiden, ob in x0 mit g0 (x0 ) = 0 ein Maximum (g00 (x0 ) < 0) oder ein Minimum (g00 (x0 ) > 0) vorliegt. In den meisten Fällen führt aber eine Diskussion des Funktionsverhaltens mit einfacheren Mitteln ebenfalls zum Ziel. Im übrigen gibt es Fälle, wo auch die zweite Ableitung über die Natur des Extremums keine Auskunft gibt. (Beispiel: g : x → x4 hat in x0 = 0 eine (sogar globale) Minimalstelle, aber es gilt g00 (x0 ) = 0.) Beispiel Ein kreisförmiger Querschnitt der Spule eines Transformators soll durch einen kreuzförmigen Querschnitt eines aus Blechen geschichteten Eisenkerns möglichst ausgefüllt werden (siehe Figur 1). Wir entnehmen der Figur 1, dass die Fläche des Eisenkerns durch A = 4yx + 2 · 2(x − y)y gegeben ist. Setzen wir x = r cos α, y = r sin α, so erhalten wir den Flächeninhalt A in Funktion von α, 0 ≤ α ≤ π/4 A(α) = 4r 2 cos α sin α + 4r 2 (cos α − sin α) sin α = 4r 2 (2 cos α sin α − sin2 α). Nullsetzen der Ableitung liefert A0 (α) = 4r 2 (−2 sin2 α + 2 cos2 α − 2 sin α cos α) = 0 2 cos(2α) − sin(2α) = 0 tan(2α) = 2 . Daraus ergibt sich α = 31.7◦ , wobei es sich natürlich um das globale Maximum handelt, da die Randpunkten des Definitionsbereiches offensichtlich kleinere Werte liefern. Eine weitere 30 U. Stammbach: Analysis, Teil A r α y α Fig. 1 : Querschnitt der Spule des Transformators x Rechnung zeigt xmax = 0.851 r, ymax = 0.526 r, also Amax = 2.47 r 2 . Der Füllfaktor beträgt dann q = 2.47r 2 = 78.7% πr 2 Beispiel Gegeben ist die Funktion √ 3 f : x → (x − 1) x2 , D(f ) = R. Gesucht sind die lokalen und globalen Extrema von f (soweit sie existieren). Wie stellen eine Liste der x-Werte zusammen, die als Kandidaten für eine lokale Extremalstelle auftreten. - Es gibt keine Randpunkte, da D(f ) = R. 31 Kapitel II. Differentialrechnung Die Ableitung von f ist gegeben durch f 0 (x) = 5x − 2 √ . 33x Sie ist mit Ausnahme des Nullpunktes überall definiert und Null für x = 2/5. Die weiteren Kandidaten sind also - x=0 (Ableitung nicht definiert), - x = 2/5 (Ableitung gleich Null). 2 (y) 1.5 √ 3 (x − 1) x2 1 Fig. 2 : Die Extrema der Funktion √ 3 f : x → (x − 1) x2 0.5 (x) -1 -0.5 0.5 1 1.5 2 -0.5 -1 An der Ableitung f 0 (x) lesen wir ferner die folgenden Eigenschaften von f ab. - Für x < 0 ist die Ableitung positiv, die Funktion f also strikt monoton wachsend. - Für 0 < x < 2/5 ist die Ableitung negativ, die Funktion f also strikt monoton fallend. - Für 2/5 < x < ∞ ist die Ableitung positiv, die Funktion f also strikt monoton wachsend. 32 U. Stammbach: Analysis, Teil A √ 3 Für sehr grosse |x| verhält sich die Funktion f wie x x2 = x5/3 . Damit ist x = 0 eine lokale Maximalstelle von f und f (0) = 0 ein lokales Maximum; ferner ist x = 2/5 eine lokale Minimalstelle und r 2 33 4 f =− 5 5 25 ein lokales Minimum. Beispiel Gegeben ist die Strecke AB, A = (−1, 1), B = (0, 2). Ferner bezeichnet P = (p, 0) einen Punkt auf der x-Achse. Gesucht ist derjenige Punkt Q auf der Strecke AB, welcher von P einen minimalen Abstand hat (siehe Figur 3). (y) B = (0, 2) Fig. 3 : Punkt P und Strecke AB A = (−1, 1) P = (p, 0) (x) Der Leser bemerkt natürlich sofort, dass die Lösung von der Lage des Punktes P abhängig ist. Wir beschreiben die Strecke AB durch y = x + 2, −1 ≤ x ≤ 0 und definieren die Funktion f als das Quadrat des Abstandes |QP |, f (x) = d2 = (p − x)2 + (x + 2)2 , D(f ) = [−1, 0] . 33 Kapitel II. Differentialrechnung 10 p2 + 2p + 2 8 Fig. 4 : Quadrat des minimalen Abstandes zwischen P und der Strecke AB in Funktion von p 6 p2 + 4 (p + 2)2 2 4 2 (p) 0.5 1 1.5 2 Als Kandidaten für die globale Minimalstelle von f treten einmal die beiden Randpunkte des Definitionsintervalles D(f ) = [−1, 0] auf. Wir erhalten f (−1) = p2 + 2p + 2, f (0) = p2 + 4. Da die Funktion f offensichtlich im ganzen Definitionsintervall differenzierbar ist, erhalten wir die weiteren Kandidaten durch Nullsetzen der Ableitung f 0 (x) = −2(p − x) + 2(x + 2) = −2p + 4x + 4 = 0 . Daraus ergibt sich x = p/2 − 1. Dieser Punkt liegt nur für 0 ≤ p ≤ 2 im Definitionsintervall der Funktion f ; nur in diesem Fall tritt dieser Kandidat überhaupt auf. Aus f 00 (x) = 4 > 0 folgt ferner, dass in diesem Punkt eine lokale Minimalstelle vorliegt. Die globale Minimalstelle von f ist folglich xmin =    −1 für p≤0 p/2 − 1 für 0 ≤ p ≤ 2   0 für 2≤p , 34 U. Stammbach: Analysis, Teil A und das Quadrat des Minimalabstandes |QP | ist gegeben durch (siehe Figur 4) f (xmin ) =  2   p + 2p + 2 (p + 2)2 /2   p2 + 4 für p≤0 für 0 ≤ p ≤ 2 für 2≤p . 35 Kapitel II. Differentialrechnung 5 Zu Exponential- und Logarithmusfunktion Die Funktion f : x → ex hat, wie man aus der Mittelschule weiss, die Eigenschaft, dass ihre Ableitung wiederum f ist, f 0 (x) ≡ f (x). Wir wollen hier als erstes zeigen, dass diese Eigenschaft zusammen mit der Forderung f (0) = 1 die Funktion x → ex eindeutig bestimmt. Etwas allgemeiner zeigen wir Satz Es sei A eine reelle Zahl, und es seien f : x → f (x) und g : x → g(x) zwei differenzierbare Funktionen mit der Eigenschaft f 0 (x) = A f (x) (5.1) beziehungsweise g0 (x) = A g(x) (5.2) für alle x. Dann gilt f (x) = C g(x) , wobei C eine reelle Konstante bezeichnet. Beweis Wir betrachten die Funktion h:x→ f (x) . g(x) Dann gilt wegen (5.1) und (5.2) h0 (x) = f 0 (x) · g(x) − f (x) · g0 (x) Af (x)g(x) − f (x)Ag(x) = =0. 2 (g(x)) (g(x))2 Aus h0 (x) ≡ 0 folgt h(x) ≡ C und damit f (x) ≡ C g(x). Dies war zu beweisen. 36 U. Stammbach: Analysis, Teil A Eine Gleichung zwischen einer Funktion f und ihrer Ableitung f 0 (oder ihren Ableitungen f 0 , f 00 , · · ·) heisst bekanntlich eine Differentialgleichung. Eine Funktion f , für welche die Differentialgleichung identisch in x erfüllt ist, heisst Lösung der Differentialgleichung. Unsere Beziehung (5.1) ist ein Beispiel einer solchen Gleichung. Unser Satz besagt, dass die Lösung der Differentialgleichung (5.1) bis auf eine multiplikative Konstante festgelegt ist, insbesondere folgt, dass (5.1) zusammen mit der (Anfangs-)Bedingung f (0) = 1 die Lösung eindeutig festlegt. Wir werden im 2. Semester sehen, dass Ähnliches ganz allgemein für Differentialgleichungen und ihre (Anfangs-)Bedingungen gilt. Es handelt sich hier um ein ganz fundamentales Prinzip. Die Differentialgleichung f 0 (x) = Af (x) zusammen mit der Bedingung f (0) = 1, beschreibt also auf eindeutige Art und Weise eine Funktion f : x → f (x), nämlich x → eAx . Setzen wir A = 1, so folgt, dass die Differentialgleichung f 0 (x) = f (x) (5.3) zusammen mit f (0) = 1 die Exponentialfunktion x → ex charakterisiert (siehe Figur 1). 6 (y) 5 ex 4 Fig. 1 : Die Exponentialfunktion x → ex 3 2 1 (x) -2 -1.5 -1 -0.5 0.5 1 1.5 2 -1 Um das noch etwas zu illustrieren, zeigen wir, wie wichtige Eigenschaften der Exponentialfunktion f direkt aus der Differentialgleichung hergeleitet werden können. Wir wählen als erstes die 37 Kapitel II. Differentialrechnung fundamentale Eigenschaft der Exponentialfunktion f (a + b) = f (a) · f (b) also ea+b = ea · eb . Zu diesem Zweck betrachten wir die Funktion g, welche durch g : x → g(x) = f (a + x) definiert wird. Dann folgt g0 (x) = f 0 (a + x) = f (a + x) = g(x) , d.h. g : x → g(x) ist wie f ebenfalls Lösung der Differentialgleichung (5.3). Aus unserem Satz folgt dann, dass eine Konstante C existiert mit g(x) = C · f (x) . Insbesondere gilt f (a) = g(0) = C · f (0) = C, da ja laut Voraussetzung f (0) = 1 gilt. Also erhalten wir die für alle x gültige Gleichung g(x) = f (a) · f (x). Setzen wir darin x = b, so folgt (5.4) g(b) = f (a + b) = f (a) · f (b). Dies wollten wir direkt aus der Differentialgleichung herleiten. Auch konkrete Informationen über die Zahl e lassen sich aus (5.3) und (5.4) erhalten. Nach (5.4) gilt für jede natürliche Zahl 38 U. Stammbach: e = e1 = f 1 1 1 + + ··· + n n n n 1 n = f Analysis, Teil A . Betrachten wir den Punkt x = 0, so gilt wegen f 00 (x) = (f 0 )0 (x) = f 0 (x) = f (x) natürlich f 00 (0) = 1. Insbesondere ist der Graph von f an der Stelle x = 0 nach links gekrümmt (konvex). Dann folgt aber sofort (siehe Figur 2) f (x) > 1 + x für alle x die genügend nahe bei x0 = 0 liegen. Mit obiger Formel erhalten wir nun 3 (y) ex 2.5 2 1+x Fig. 2 : Die Exponentialfunktion x → ex und die lineare Funktion x→ 1+x 1.5 1 0.5 (x) -2 -1.5 -1 -0.5 0.5 1 1.5 2 -0.5 -1 n e = f (1) = f 1 n > 1+ 1 n n 39 Kapitel II. Differentialrechnung und analog 1 1 = f (−1) = f − e n n > 1− 1 n n = n−1 n n . Diese beiden Beziehungen liefern die Ungleichungen 1 1+ n n <e< n n−1 n 1 = 1+ n−1 n 1 = 1+ n−1 n−1 1 1+ n−1 . Lässt man n auf beiden Seiten gegen ∞ streben, so erhält man links und rechts denselben Grenzwert. Daraus folgt (siehe Figur 3) 3 2.5 n 1 an = 1 + n Fig. 3 : Die gegen e konvergierende n Folge an = 1 + n1 2 1.5 1 0.5 5 10 15 20 lim n→∞ 1+ 1 n n = e. Schliesslich versuchen wir noch, unsere Funktion f in Form eines “unendlichen Polynoms”, d.h. durch eine Potenzreihe darzustellen. Wir werden diese Art, Funktionen zu beschreiben, später genauer kennenlernen. Hier wollen wir das Thema nur kurz antippen. Wir machen den Ansatz 40 U. Stammbach: Analysis, Teil A f (x) = a0 + a1 x + a2 x2 + · · · . Die Bedingung f (0) = 1 liefert sofort a0 = 1. Die reellen Zahlen a1 , a2 , . . . versuchen wir mit Hilfe der Differentialgleichung (5.3) zu bestimmen. (Gliedweises) Ableiten und Einsetzen in (5.3) ergibt a1 + 2a2 x + 3a3 x2 + · · · = a0 + a1 x + a2 x2 + · · · . Daraus folgt zuerst a1 2a2 3a3 4a4 = = = = .. . a0 = 1 a1 a2 a3 und damit a1 = 1 , a2 = 1 1 1 , a3 = , . . . , an = , . . . . 2 3! n! Es ergibt sich daraus der folgende Ausdruck für f (x) in Form einer unendlichen Summe f (x) = 1 + 1 1 1 x + x2 + x3 + · · · . 1! 2! 3! Man nennt dies eine Potenzreihe (mit Mittelpunkt 0). Natürlich müsste man an dieser Stelle beweisen, dass diese unendliche Summe konvergiert und dass die durch sie dargestellte Funktion die Gleichung (5.3) erfüllt. Wir werden später sehen, wenn wir uns eingehender mit Potenzreihen beschäftigen werden, dass dies tatsächlich der Fall ist. Hier wollen wir den oben erhaltenen Reihenausdruck als gültig annehmen und darin x = 1 setzen. Wir erhalten für den Funktionswert f (1), also für e die Reihe e = f (1) = 1 + 1 1 1 + + + ··· . 1! 2! 3! Dies ist die uns bereits bekannte Beschreibung der Euler’schen Zahl e durch eine Reihe (siehe Kap. I, Abschnitt 1). Schliesslich beschäftigen wir uns noch kurz mit der Logarithmusfunktion. Wegen f 0 (x) = f (x) > 0 ist f strikt monoton wachsend und deshalb injektiv. Es existiert also die zu f inverse Funktion; diese heisst - definitionsgemäss - der (natürliche) Logarithmus log : x → log(x) (siehe Figur 4). Es gilt 41 Kapitel II. Differentialrechnung d log 1 1 1 (x) = 0 = = . dx f (log(x)) f (log(x)) x 2 (y) 1.5 1 log x Fig. 4 : Die Logarithmusfunktion x → log x 0.5 -1 1 2 3 4 5 6 (x) -0.5 -1 -1.5 -2 Da der Wertebereich der Exponentialfunktion aus allen positiven Zahlen besteht, ist der Definitionsbereich der Logarithmusfunktion durch D(log) = (0, ∞) gegeben. In diesem Bereich ist log0 (x) positiv, so dass log strikt monoton wachsend ist. Ausserdem folgt aus der Definition von log als inverse Funktion der Exponentialfunktion log(1) = 0. Um die Funktionalgleichung des Logarithmus, d.h. die grundlegende Beziehung log(a · b) = log a + log b , a, b > 0 aus der Definition herzuleiten, betrachten wir die Funktion x → log(ax) und berechnen deren Ableitung, d a 1 log(ax) = a log0 (ax) = = . dx ax x Die Funktionen x → log x und x → log(ax) besitzen die gleiche Ableitung, sie unterscheiden sich deshalb nur um eine additive Konstante, 42 U. Stammbach: Analysis, Teil A log(ax) − log x ≡ C . Um C zu bestimmen setzt man x = 1; man erhält C = log a. Damit folgt, wie gewünscht log(a · b) = log a + log b . Wenn man in dieser Beziehung a = 1/b setzt und log 1 = 0 berücksichtigt, so erhält man log(1/b) = − log b, so dass folgt log a b = log a − log b . Es war Ziel des ersten Teils dieses Abschnittes, zu zeigen, wie eine Differentialgleichung die Eigenschaften ihrer Lösungen festlegt. Wir haben dies am Beispiel der einfachen Differentialgleichung der Exponentialfunktion zu erklären versucht. Im Rest des Abschnittes wollen wir uns noch mit der Exponentialfunktion zu beliebiger Basis a, a > 1 beschäftigen und die sogenannten hyperbolischen Funktionen einführen. Es sei a > 1 eine reelle Zahl. Es lässt sich offensichtlich ax mit Hilfe der Exponentialfunktion zur Basis e wie folgt schreiben ax = e(log a)x . Daraus erhält man sofort die Ableitung der Funktion x → ax d x a = (log a)ax . dx Da diese Ableitung offenbar für alle x-Werte positiv ist, ist die Funktion x → ax strikt monoton wachsend. Wir können deshalb die zu ihr inverse Funktion definieren; wir nennen sie a log. Es gilt a log : x →a log x = a log x Dies ergibt sich leicht aus elog x = x = a log e = 1 a Deshalb gelten die Beziehungen log e = 1 log x . log a = e(log a) 1 . log a a log x . Für x = e erhält man wegen 43 Kapitel II. Differentialrechnung a log x = d x dx a = a log e · log x , ax , 1 a log e d a log x = dx 1 1 log a x = a log e 1 x. Zum Schluss wollen wir uns noch den sogenannten hyperbolischen Funktionen zuwenden, die mit Hilfe der Exponentialfunktionen definiert sind (siehe Figur 5). Definition Der Sinus hyperbolicus ist definiert durch sinh x = 1 x e − e−x , 2 der Cosinus hyperbolicus ist definiert durch cosh x = 1 x e + e−x . 2 4 (y) 3 cosh x 2 Fig. 5 : Die hyperbolischen Funktionen sinh x 1 1 x 2e -2 -1.5 -1 1 −x 2e -0.5 0.5 1 1.5 2 (x) -1 -2 44 U. Stammbach: Analysis, Teil A Für diese Funktionen gelten die folgenden Identitäten, die sich auf einfache Weise aus den Definitionen ergeben: (1) cosh2 x − sinh2 x ≡ 1; (2) sinh(x + y) = sinh x cosh y + cosh x sinh y; (3) cosh(x + y) = cosh x cosh y + sinh x sinh y; (4) d sinh (x) = cosh x; dx (5) d cosh (x) = sinh x. dx Die Formeln erinnern den Leser an die entsprechenden Formeln für die Sinus- und Cosinusfunktionen; sie liefern eine Rechtfertigung für die (historisch gewählten) Bezeichnungen der hyperbolischen Funktionen. Um auch das Auftreten des Wortes “hyperbolisch” zu erklären, betrachten wir die durch die Parameterdarstellung t → (cosh t, sinh t), t ∈ R gegebene Kurve. Es gilt dann nach der ersten der obigen Identitäten (x(t))2 − (y(t))2 = 1, d.h. die Punkte der Kurve liegen auf der Hyperbel x2 − y 2 = 1, genauer auf dem rechten Ast dieser Hyperbel. Die Graphen der hyperbolischen Funktionen ergeben sich sehr leicht aus den Definitionen. Insbesondere ist der Sinus hyperbolicus eine ungerade, der Cosinus hyperbolicus eine gerade Funktion. Der Graph der Cosinus hyperbolicus Funktion heisst auch etwa Kettenlinie, weil eine an den zwei Enden aufgehängte frei bewegliche Kette die Form des Graphen von x → a cosh(x/a) annimmt. Wegen sinh0 x = cosh x ist der Sinus hyperbolicus strikt monoton wachsend, also insbesondere injektiv. Es gibt deshalb eine zum Sinus hyperbolicus inverse Funktion; diese heisst in der Literatur Arsinh (“Area sinus hyperbolicus”, siehe Figuren 6,7). Sie lässt sich wie folgt auf elementare Weise ausdrücken. Laut Definition ist die Gleichung y= 1 x e − e−x 2 nach x aufzulösen. Man erhält der Reihe nach e2x − 1 = 2yex (ex )2 − 2yex − 1 = 0 ex = y ± q y2 + 1 . 45 Kapitel II. Differentialrechnung 4 (y) 3 sinh x 2 Fig. 6 : Sinus hyperbolicus x → sinh x 1 -4 -3 -2 -1 1 2 3 4 (x) -1 -2 -3 -4 4 (y) 3 Arsinh x 2 Fig. 7 : Area sinus hyperbolicus x → Arsinh x 1 -4 -3 -2 -1 1 2 3 4 (x) -1 -2 -3 -4 46 U. Stammbach: Analysis, Teil A 4 (y) 3 cosh x Fig. 8 : Cosinus hyperbolicus x → cosh x , x ∈ [0, ∞] 2 1 (x) -1 1 2 3 4 -1 4 (y) 3 2 Fig. 9 : Area cosinus hyperbolicus x → Arcosh x Arcosh x 1 (x) -1 1 -1 2 3 4 47 Kapitel II. Differentialrechnung 1.2 (y) 1 0.8 1 √ 2 x +1 Fig. 10 : Die Funktion 0.6 √ 0.4 1 x2 +1 ; Ableitung von x → Arsinh x 0.2 (x) -4 -3 -2 -1 1 2 3 4 -0.2 8 (y) 6 Fig. 11 : Die Funktion 4 √ 1 √ x2 − 1 1 2 −1 ; Ableitung von x → Arcosh x 2 -1 1 x2 3 4 5 6 (x) 48 U. Stammbach: Analysis, Teil A Das negative Vorzeichen kann wegen ex > 0 ausgeschlossen werden, so dass schliesslich folgt x = log y + q y2 + 1 . Die inverse Funktion des Sinus hyperbolicus wird durch die Formel Arsinh : x → log x + p x2 + 1 beschrieben. Schränkt man den Definitionsbereich des Cosinus hyperbolicus auf die nicht negativen Zahlen [0, ∞) ein, so erhält man eine injektive Funktion. Die dazu inverse Funktion heisst Arcosh (“Area cosinus hyperbolicus”, siehe Figuren 8,9). Auf analoge Art wie beim Sinus hyperbolicus erhält man eine elementare Beschreibung, nämlich Arcosh : x → log x + p x2 − 1 . Definitionsbereich dieser Funktion ist natürlich das Intervall [1, ∞). Interessant sind die Funktionen Arsinh und Arcosh besonders wegen ihrer Ableitungen. Für deren Berechnung kann man entweder von der elementaren Beschreibung ausgehen oder direkt von der Definition als inverse Funktionen. Eine kurze Rechnung liefert (siehe Figuren 10,11) d 1 Arsinh x = √ , dx x2 + 1 d 1 Arcosh x = √ . dx x2 − 1 Die überraschende Tatsache, dass die Ableitungen einfache Wurzelfunktionen sind, wird beim Integrieren eine grosse Rolle spielen. 49 Kapitel II. Differentialrechnung 6 Grössenordnungen von Funktionen Es sei f : x → f (x) eine Funktion, die auf dem Intervall (c, ∞) definiert ist. Die Untersuchung von limx→∞ f (x) gibt eine erste Information über das Verhalten von f (x) für grosse x. Gilt z.B. lim f (x) = a, x→∞ so bedeutet dies bekanntlich, dass der Graph von f für x → ∞ die Gerade y = a als horizontale Asymptote besitzt. In diesem Abschnitt wollen wir unter anderem den Fall limx→∞ f (x) = ∞ etwas näher untersuchen. Die Funktionswerte einer solchen Funktion werden mit wachsenden x beliebig gross, d.h. der Graph von f strebt für x → ∞ gegen ∞. Dies kann aber auf sehr viele verschiedene Arten geschehen, wie man etwa an den Beispielen x → x2 , x→ x2 + 3x + 3 , x+2 x → log x . unmittelbar sehen kann (siehe Figur 1). Um dieses unterschiedliche Verhalten etwas in den Griff zu bekommen, führen wir die folgende Sprechweise ein. Es seien f und g zwei Funktionen, die auf dem Intervall (c, ∞) definiert sind. Dann sagen wir, die Funktion f sei für x → ∞ von kleinerer Grössenordnung als g, wenn gilt f (x) =0. x→∞ g(x) lim In Zeichen drücken wir dies durch das sogenannte Landau-Symbol “o” aus: f (x) = o(g(x)) für x → ∞ . Beispiel Es gilt x2 = o(x3 ) für x → ∞ (siehe Figur 2), denn x2 =0. x→∞ x3 lim 50 U. Stammbach: Analysis, Teil A 14 (y) 12 x3/2 10 x2 + 3x + 3 x+2 8 Fig. 1 : Es gibt verschiedene Arten, wie f (x) für x → ∞ gegen ∞ streben kann 6 4 log x 2 (x) 2 4 6 8 10 -2 60 (y) 50 x3 40 Fig. 2 : x → x2 ist von kleinerer Grössenordnung als x → x3 30 x2 20 10 (x) 2 4 6 8 51 Kapitel II. Differentialrechnung 8 (y) x1/2 6 Fig. 3 : x → x1/3 ist von kleinerer Grössenordnung als x → x1/2 4 x1/3 2 (x) 10 20 30 40 50 60 Beispiel Die Funktionen x → x, x → 2x, x → x + c sind von “gleicher” Grössenordnung; keine der Funktionen ist von kleinerer Grössenordnung als eine der anderen. Beispiel Es gilt x1/3 = o(x1/2 ) für x → ∞ (siehe Figur 3), denn x1/3 =0. x→∞ x1/2 lim Die oben eingeführte Sprechweise kann laut Definition auf beliebigen Funktionen angewandt werden; es ist dafür nicht notwendig, dass die Funktionswerte für x → ∞ gegen ∞ streben. Auch dazu einige Beispiele. Beispiel Es gilt 1/x3 = o(1/x2 ) für x → ∞, denn 1/x3 =0 x→∞ 1/x2 lim Beispiel Für k > 0, gilt 1/xk = o(1). Von besonderem Interesse sind in diesem Zusammenhang die Exponential- und Logarithmusfunktionen. Hier gilt der wichtige Satz (siehe Figur 4): 52 U. Stammbach: Analysis, Teil A Satz Es gilt xk = o(ex ) für x → ∞. Man kann den Inhalt dieses Satzes auch so ausdrücken: die Exponentialfunktion x → ex strebt für x → ∞ “stärker” gegen ∞ als jede Potenzfunktion x → xk . (Dies ist natürlich nur für k > 0 von wirklichem Interesse; für k < 0 strebt ja x → xk für x → ∞ gegen 0, so dass die Aussage des Satzes für k < 0 trivialerweise richtig ist.) (y) 10 ex x10 8 Fig. 4 : Der Eindruck trügt: sowohl x → x3 wie auch x → x10 sind von kleinerer Grössenordnung als x → ex ! (siehe Figuren 5,6) 6 4 x3 2 (x) 0.5 1 1.5 2 2.5 Beweis Zum Beweis bestimmen wir zuerst die Ableitung von x → xk /ex . Es gilt d dx xk ex ! = kxk−1 ex − xk ex xk−1 (k − x) = . e2x ex Für x > k ist die Ableitung negativ, so dass die Funktion x → xk /ex in diesem Bereich monoton fallend ist. Andererseits ist xk /ex für x > 0 stets positiv. Daraus folgt, dass der Grenzwert xk x→∞ ex lim existieren muss. Es bleibt also zu zeigen, dass sein Wert 0 ist. Dabei dürfen wir uns auf ganzzahlige Werte von k beschränken. Ist nämlich n ≤ k < n + 1 für ganzzahliges n, so gilt für x>1 53 Kapitel II. Differentialrechnung 100 (y) 80 Fig. 5 : Die Graphen von x → x3 und x → ex schneiden sich im Intervall 4 < x < 5 noch einmal. 60 x3 ex 40 20 (x) 1 2 3 5 4 15 5. 10 (y) 15 4. 10 Fig. 6 : Die Graphen von x → x10 und x → ex schneiden sich im Intervall 30 < x < 40 noch einmal. 15 3. 10 15 2. 10 x10 ex 15 1. 10 (x) 10 20 30 40 54 U. Stammbach: Analysis, Teil A xn xk xn+1 ≤ < ex ex ex und damit xn xk xn+1 ≤ lim ≤ lim . x→∞ ex x→∞ ex x→∞ ex lim Die Tatsache, dass für ganzzahliges n xn =0 x→∞ ex lim gilt, beweisen wir mit Induktion nach n. Für n = 0 ist die Aussage trivialerweise richtig: x0 1 = lim x = 0 . x→∞ ex x→∞ e lim Es sei also n ≥ 1. Da für jede reelle Zahl c mit x auch x + c gegen ∞ strebt, haben wir xn x→∞ ex lim (x + c)n x→∞ ex+c xn + ncxn−1 + · · · + cn = lim x→∞ ex · ec ! n x xn−1 1 1 n = c lim x + nc lim + · · · + c lim x x→∞ ex x→∞ e e x→∞ e n x 1 = c lim x , e x→∞ e = lim denn nach Induktion gilt xm =0 x→∞ ex lim für m < n. Aus der obigen Gleichung ergibt sich xn 1 1− c x→∞ ex e lim =0, woraus folgt, da die Klammer nicht verschwindet, xn =0. x→∞ ex lim Damit ist der Satz bewiesen. 55 Kapitel II. Differentialrechnung 3 (y) x1/2 2.5 log x 2 Fig. 7 : Die Logarithmusfunktion x → log x ist von kleinerer Grössenordnung als x → x1/2 und x → x1/10 . 1.5 x1/10 1 0.5 (x) 2 4 6 8 10 -0.5 -1 Vergleicht man Potenz- und Logarithmusfunktionen, so gilt (siehe Figur 7) Satz Für k > 0 gilt log x = o(xk ) für x → ∞. Beweis log x t t1/k lim = lim = lim x→∞ xk t→∞ (et )k t→∞ et !k =0. Letzteres nach dem obigen Satz. Ebenfalls aus dem ersten Satz folgt das nächste Resultat, welches sich mit Funktionen beschäftigt, die für x → ∞ gegen 0 streben. Satz Für k > 0 gilt e−x = o(x−k ) für x → ∞. Beweis e−x xk = lim =0. x→∞ x−k x→∞ ex lim Schliesslich bemerken wir, dass sich die Landau-Symbolik nicht nur für x → ∞ verwenden lässt, sondern auch für x → a+ , wo a ein endlicher Wert ist. Sind f und g zwei auf dem Intervall (a, b) 56 U. Stammbach: Analysis, Teil A definierte Funktionen, so heisst f für x → a+ von kleinerer Grössenordnung als g, wenn gilt lim+ x→a f (x) =0. g(x) In Zeichen drücken wir diesen Sachverhalt wiederum durch das Landau-Symbol aus f (x) = o(g(x)) für x → a+ . Als Beispiel betrachten wir die Funktionen x → log x und x → −x−k , k > 0, welche für x → 0+ gegen −∞ streben. Es gilt Satz Für k > 0 gilt log x = o(−x−k ) für x → 0+ . Beweis Wiederum folgt dies auf einfache Weise aus unserem ersten Satz: log x log(e−t ) −t t1/k lim+ = lim = lim = lim −k −t −k −t −k t→∞ −(e ) t→∞ −(e ) t→∞ et x→0 −x !k =0. Man kann sich diese Resultate leicht merken: In all diesen Sätzen verhält sich die Exponentialfunktion extremer als die Potenzfunktion und diese extremer als die Logarithmusfunktion. Analoge Resultate gelten auch für die Funktion x → ax , a > 0 anstelle von x → ex und x →a log x anstelle von x → log x. Sie lassen sich leicht aus den obigen Sätzen herleiten, indem man die wohlbekannten Beziehungen ax = elog a·x log x a log x = log a benützt. Wir überlassen die Details dem Leser. 57 Kapitel II. Differentialrechnung 7 Die zweite und höhere Ableitungen Ausgehend von einer Funktion f : x → f (x) haben wir die Ableitung f 0 (x) definiert. Ihr Wert an der Stelle x gibt die Tangentensteigung des Graphen von f im Punkt (x, f (x)) an. Es ist klar, dass die Zuordnung f 0 : x → f 0 (x) wiederum eine Funktion definiert, wobei der Definitionsbereich von f 0 aus allen Punkten x besteht, in denen die Ableitung von f existiert. Folglich kann für f 0 wiederum die Ableitung (f 0 )0 gebildet werden. Man schreibt (f 0 )0 (x) = f 00 (x) = d2 f (x) dx2 und nennt f 00 die zweite Ableitung von f nach x. Beispiel Ist s : t → s(t) die Wegfunktion einer Bewegung eines Massenpunktes (auf der s-Achse), so ist ds (t) = ṡ(t) = v(t) dt die Geschwindigkeit (Schnelligkeit) und d2 s (t) = s̈(t) = a(t) dt2 die Beschleunigung des Massenpunktes. (Bei Funktionen der Zeit t braucht man gern Punkte zur Bezeichnung der Ableitung nach t.) Natürlich kann zu f 00 wiederum die Ableitung (f 00 )0 definiert werden. Man spricht dann von der dritten Ableitung f 000 von f nach x, usw. Beispiel Es sei f : x → xn , n ganz. Dann ist f 0 (x) = n · xn−1 f 00 (x) = n(n − 1)xn−2 .. . f (n) (x) = n · (n − 1) · · · 2 · 1 58 U. Stammbach: Analysis, Teil A und alle höheren Ableitungen sind Null. Die zweite Ableitung einer Funktion f : x → f (x) hat eine wichtige Bedeutung für den Graphen von f . Ist nämlich f 00 (x0 ) > 0, so ist an dieser Stelle die erste Ableitung f 0 , also die Steigung des Graphen von f zunehmend. Durchläuft man den Graphen von f in Richtung zunehmenden x, so ist an der Stelle x0 die Kurve deshalb nach links gekrümmt (konvex). Ist f 00 (x0 ) < 0, so ist die erste Ableitung f 0 , also die Steigung des Graphen von f 0 abnehmend. Durchläuft man den Graphen von f in Richtung zunehmenden x, so ist an der Stelle x0 die Kurve deshalb nach rechts gekrümmt (konkav). Ändert f 00 das Vorzeichen in x0 , so weist der Graph von f an dieser Stelle einen Wendepunkt auf. Beispiel Für die Funktion 7 177 2 f : x → x5 − x4 − 32x3 + x + 126x − 270 2 2 tragen wir in ein und dasselbe Koordinatensystem die Graphen der Funktion f und der Ableitungen f 0 , f 00 , f 000 , . . . ein. Auf diese Weise lassen sich nicht nur die uns schon gut bekannten Beziehungen leicht verfolgen, die zwischen lokalen Extremalstellen von f und den Nullstellen von f 0 bestehen, sondern auch diejenigen, die zwischen den Wendepunkten des Graphen von f und den Nullstellen von f 00 bestehen (siehe Figur 1). Die geometrische Bedeutung der 2. Ableitung ist nützlich, wenn es darum geht, den groben Verlauf des Graphen einer Funktion herauszufinden. Beispiel Es sei f : x → (x − 1)1/3 (siehe Figur 2). Der Definitionsbereich von f besteht offensichtlich aus allen rellen Zahlen. Bei x = 1 hat die Funktion eine Nullstelle; für x < 1 ist der Funktionswert negativ, für x > 1 ist der Funktionswert positiv. Die Ableitung von f ergibt sich zu f 0 : x → f 0 (x) = 1 (x − 1)−2/3 . 3 Offensichtlich ist f 0 an der Stelle x = 1 nicht definiert. Überall sonst ist die Ableitung positiv, die Funktion f ist also strikt monoton wachsend. Die Tatsache, dass f 0 (x) für x → 1± gegen ∞ strebt, zeigt, dass der Graph von f bei x = 1 eine vertikale Tangente besitzt. Die zweite Ableitung von f ist 1 2 f 00 : x → f 00 (x) = − · (x − 1)−5/3 . 3 3 Die zweite Ableitung von f ist für x < 1 positiv, der Graph von f in diesem Bereich also nach links gekrümmt (konvex). Für x > 1 ist die zweite Ableitung negativ, der Graph in diesem Bereich also nach rechts gekrümmt (konkav). 59 Kapitel II. Differentialrechnung (y) f Fig. 1 : Die Graphen der ersten drei Ableitungen von f f 00 f0 f 000 (x) 2 (y) 1 (x − 1)1/3 Fig. 2 : Der Graph der Funktion (x) -2 -1 1 -1 -2 2 3 4 f : x → (x − 1)1/3 60 U. Stammbach: Analysis, Teil A 2 Beispiel Es sei f : x → e−x /2 . Der Graph dieser Funktion heisst Gauss’sche Fehlerkurve (siehe Figur 3). Diese spielt in der Wahrscheinlichkeitsrechnung und Statistik im Zusammenhang mit der sogenannten Normalverteilung eine grosse Rolle. Offenbar ist die Funktion f auf der ganzen reellen Zahlgeraden definiert. Da der Exponent von e für alle von Null verschiedenen x negativ ist, ist der Wertebereich der Funktion f das Intervall (0, 1]. Klar ist auch, dass die Funktion gerade ist, da x nur im Quadrat vorkommt. Wir dürfen uns deshalb bei der Diskussion auf den Bereich x ≥ 0 beschränken. Für x → ∞ strebt f (x) gegen 0, so dass die x-Achse eine Asymptote für x → ∞ ist. Die Ableitung von f ist die Funktion f 0 : x → −x · e−x 2 /2 . (y) 1 0.8 e− x2 2 Fig. 3 : Die Gauss’sche Fehlerkurve 0.6 0.4 0.2 -2 -1 1 2 (x) -0.2 Man liest daran ab, dass für x > 0 der Graph von f monoton fallend ist und dass er an der Stelle x = 0 eine horizontale Tangente aufweist. Die zweite Ableitung ist f 00 : x → (x2 − 1) · e−x 2 /2 . Im Bereich 0 ≤ x < 1 ist diese negativ, der Graph von f also nach rechts gekrümmt; im Bereich 1 < x < ∞ ist sie positiv, der Graph also nach links gekrümmt. An der Stelle x = 1 wechselt die 61 Kapitel II. Differentialrechnung (y) 1 f : x → e− x2 2 0.5 Fig. 4 : Die ersten zwei Ableitungen von -2 -1 1 2 (x) f : x → e−x 2 /2 -0.5 f 0 : x → −xe− f 00 : x → (x2 − 1)e− x2 2 x2 2 -1 zweite Ableitung ihr Vorzeichen, der Graph von f weist demzufolge im Punkt (1, e−1/2 ) einen Wendepunkt auf (siehe Figur 4). Das Newton’sche Gesetz der Mechanik Kraft = Masse × Beschleunigung verknüpft die Beschleunigung eines Massenpunktes m mit der auf diesen wirkenden Kraft K. Da die Beschleunigung die zweite Ableitung der Wegfunktion ist, ist das zweite Newton’sche Gesetz vom mathematischen Standpunkt aus nichts anderes als eine Differentialgleichung für die Wegfunktion t → s(t), in welcher die zweite Ableitung s̈(t) vorkommt m · s̈(t) = K. Dabei hängt die Kraft möglicherweise von s und t ab. Wir werden uns im 2. Semester eingehend mit solchen Differentialgleichungen beschäftigen, wollen aber an dieser Stelle über eine spezielle Differentialgleichung dieser Art schon einige Bemerkungen einfügen, nämlich über die Differentialgleichung der harmonischen Schwingung. 62 U. Stammbach: Analysis, Teil A Der Massenpunkt m sei an einer (idealen) Feder aufgehängt, so dass auf m eine zur Auslenkung s(t) aus der Ruhelage proportionale Rückstellkraft wirkt. Aus dem Newton’schen Gesetz ergibt sich dann die Differentialgleichung ms̈(t) = −k s(t) , k > 0 oder anders geschrieben (7.1) s̈(t) + ω 2 s(t) = 0 , wobei wir ω 2 = k/m gesetzt haben. Das ist die Differentialgleichung der harmonischen Schwingung. Durch Einsetzen verifiziert man ohne Schwierigkeit, dass jede Funktion der Form (7.2) s(t) = B cos(ωt) + C sin(ωt), B, C ∈ R die Differentialgleichung (7.1) erfüllt und deshalb eine Lösung dieser Gleichung ist. Ebenso leicht verifiziert man, dass jede Funktion der Form (7.3) s(t) = A cos(ωt + ϕ), A, ϕ ∈ R die Differentialgleichung (7.1) erfüllt. Wir behaupten, dass es sich bei (7.2) und (7.3) um zwei verschiedene Schreibweisen für dieselben Funktionen handelt. (Dass wir damit wirklich alle Lösungen der Differentialgleichung (7.1) beschreiben, werden wir im 2. Semester sehen.) Wenden wir auf (7.3) die bekannte Summenformel für den Cosinus an, so erhalten wir s(t) = A cos ϕ cos(ωt) − A sin ϕ sin(ωt) . Setzt man also B = A cos ϕ, C = −A sin ϕ, so erhält man eine Funktion der Form (7.2). Geht man umgekehrt von der Funktion s(t) = B cos(ωt) + C sin(ωt) √ aus und definiert man A = B 2 + C 2 und tan ϕ = −C/B, so erhält man eine Funktion der Form (7.3). Man nennt (7.2) die zweiteilige und (7.3) die einteilige Schreibweise der harmonischen Schwingung. In der Praxis spielen sogenannte gedämpfte harmonische Schwingungen eine grosse Rolle. Etwas ungenau, aber einprägsam, kann man diese als harmonische Schwingung beschreiben, deren 63 Kapitel II. Differentialrechnung Amplitude exponentiell abklingt (siehe Figur 5). Eine gedämpfte harmonische Schwingung ist von der Form t → e−at cos(ωt + ϕ), a > 0. Wie wir später sehen werden, führt ein an einer Feder aufgehängter Massenpunkt eine gedämpfte Schwingung aus, wenn auf ihn neben der Rückstellkraft eine Dämpfungskraft wirkt, die zur Geschwindigkeit proportional ist. t e− 3 Fig. 5 : Zum Verlauf der gedämpften harmonischen Schwingung (t) t t → e− 3 cos(t + π ) 4 t −e− 3 Beispiel Um uns (qualitativ) über den Verlauf einer gedämpften harmonischen Schwingung ein Bild zu machen, betrachten wir die Funktion f : t → e−t sin t etwas näher, d.h. wir setzen a = 1, ω = 1, ϕ = −π/2 (siehe Figur 6). Die erste und zweite Ableitung von f ergibt sich nach kurzer Rechnung zu f 0 : t → e−t · (− sin t + cos t) , f 00 : t → 2e−t · (− cos t) . 64 U. Stammbach: Analysis, Teil A Fig. 6 : Der Graph der Funktion f : t → e−t sin t e−t sin t e−t (t) −e−t Die Lösung der Gleichung f (t) = 0 liefert die Nullstellen: t = kπ, k = 0, ±1, ±2, . . .. Die Lösung der Gleichung f 0 (t) = 0 liefert die Stellen, wo der Graph horizontale Tangenten aufweist. Man erhält cos t = sin t tan t = 1 t = π/4 + kπ, k = 0, ±1, ±2, . . . . Und schliesslich liefert die Gleichung f 00 (t) = 0 die Wendestellen des Graphen von f . Man erhält t = π/2 + kπ, k = 0, ±1, ±2, . . .. Wegen | sin t| ≤ 1 oszilliert der Graph von f zwischen den beiden Kurven y = e−t und y = −e−t . Ist sin t = 1, so berührt der Graph von f die erste dieser Kurven, ist sin t = −1 so berührt der Graph die zweite der beiden Kurven. Die t-Werte, die zu diesen Berührstellen gehören, sind t = π/2 + kπ, k = 0, ±1, ±2, . . .. Man liest daran die etwas überraschende Tatsache ab, dass die Berührstellen gerade mit den Wendepunkten übereinstimmen. Kapitel II. Differentialrechnung 8 65 Ebene Kurven Ebene Kurven können auf viele verschiedene Arten beschrieben werden. Wir arbeiten in dieser Vorlesung vor allem mit den folgenden. I. Parameterdarstellung Eine Parameterdarstellung der Kurve K besteht darin, dass für jeden Wert des Parameters t ein zugehöriger Punkt (x(t), y(t)) der Kurve K festgelegt wird. Es ist also eine Funktion t → ~r(t) = (x(t), y(t)), t ∈ [b1 , b2 ] gegeben, wobei ~r(t) als Ortsvektor aufzufassen ist. Man kann diese Funktion als Abbildung des Parameterintervalles [b1 , b2 ] in die Ebene auffassen. Beispiel Kreis mit Radius a um den Punkt P = (x0 , y0 ) t → (x0 + a cos t, y0 + a sin t), 0 ≤ t < 2π . Eine ebene Bewegung eines Massenpunktes wird auf natürlichste Art mit Hilfe einer Parameterdarstellung mit der Zeit als Parameter beschrieben. Eliminiert man aus der Parameterdarstellung einer Kurve den Parameter t, so gelangt man zur impliziten Darstellung. II. Implizite Darstellung Die Kurve K ist beschrieben als Menge der Punkte (x, y), deren Koordinaten die Gleichung F (x, y) = 0 erfüllen. Beispiel Kreis mit Radius a um P (x − x0 )2 + (y − y0 )2 − a2 = 0 . Löst man die Gleichung F (x, y) = 0 nach y auf, so erhält man eine explizite Darstellung der Kurve K. III. Explizite Darstellung Die Kurve K ist als Graph einer Funktion x → y(x) gegeben. Beispiel Kreis mit Radius a um P 66 U. Stammbach: Analysis, Teil A q f1 : x → y = + a2 − (x − x0 )2 + y0 , D(f1 ) = [x0 − a, x0 + a] , q f2 : x → y = − a2 − (x − x0 )2 + y0 , D(f2 ) = [x0 − a, x0 + a] . Man beachte, dass in diesem Beispiel zwei(!) Funktionen notwendig sind, um den vollen Kreis zu beschreiben (siehe Figur 1). 5 (y) 4 Fig. 1 : Kreis 3 a 2 P = (x0 , y0 ) t 1 (x) 1 2 3 5 4 6 -1 Beispiel Ellipse mit Halbachsen a und b und Mittelpunkt im Ursprung (siehe Figur 2). Parameterdarstellung: t → ~r(t) = (a cos t, b sin t), 0 ≤ t < 2π . Implizite Darstellung: x2 y 2 + 2 =1. a2 b Explizite Darstellung: s f1 : x → y = +b 1 − s f2 : x → y = −b 1 − x2 , D(f1 ) = [−a, +a] , a2 x2 , D(f2 ) = [−a, +a] . a2 67 Kapitel II. Differentialrechnung (y) a b Fig. 2 : Ellipse (x) t x2 y 2 + 2 =1 a2 b (y) y= b x a Fig. 3 : Hyperbel a (x) x2 y 2 − 2 =1 a2 b 68 U. Stammbach: Analysis, Teil A Beispiel Hyperbel mit Mittelpunkt im Ursprung (siehe Figur 3). Parameterdarstellung (rechter Ast): t → ~r(t) = (a cosh t, b sinh t), −∞ < t < ∞ . Implizite Darstellung (beide(!) Äste): x2 y 2 − 2 =1. a2 b Explizite Darstellung: s f1 : x → y = +b s f2 : x → y = −b x2 − 1, a2 D(f1 ) = (−∞, −a] ∪ [a, ∞) , x2 − 1, a2 D(f2 ) = (−∞, −a] ∪ [a, ∞) . Aus der expliziten Darstellung kann man unmittelbar ablesen, dass die beiden Geraden b y=± x a für x → ±∞ Asymptoten der Hyperbel sind. Bemerkungen Eine Kurve lässt unendlich viele verschiedene Parameterdarstellungen zu; sie kann nämlich mit “verschiedenen Geschwindigkeiten” durchlaufen werden. Eine Parameterdarstellung einer Kurve enthält neben der Information über die geometrische Gestalt der Kurve noch weitere Informationen. Die Elimination des Parameters aus der Parameterdarstellung ist nicht in jedem Fall möglich, d.h. der Übergang zur impliziten Form lässt sich nicht immer durchführen. Die Auflösung nach y der Gleichung der impliziten Darstellung ist nicht immer möglich; ferner werden in vielen Fällen mehrere Funktionen benötigt, um eine Kurve darzustellen. (Von mathematischer Seite ist hier anzumerken, dass sich eine Kurve wenigstens lokal fast immer in expliziter Form darstellen lässt. Es gilt nämlich der Satz über implizite Funktionen: Es sei (x0 , y0 ) ein Punkt der durch F (x, y) = 0 gegebenen Kurve K. Ist die Ableitung von F (x, y) nach y in (x0 , y0 ) nicht trivial, so gibt es ein Intervall I mit Mittelpunkt x0 und eine Funktion f : x → f (x), D(f ) = I mit F (x, f (x)) = 0 für alle x ∈ I, d.h. x → f (x) stellt die Kurve in der Umgebung von (x0 , y0 ) dar. Selbstverständlich gehen wir in dieser Vorlesung nicht auf den Beweis dieses Satzes ein; anschaulich ist das Resultat “klar”, wie ein Blick auf eine entsprechende Figur zeigt.) 69 Kapitel II. Differentialrechnung Eine explizite Darstellung kann immer auch als Parameterdarstellung aufgefasst werden, indem man t = x als Parameter wählt: t → ~r(t) = (t, f (t)), t ∈ D(f ) . Damit ist der Kreis I → II → III → I geschlossen. Wir werden in der Folge bei Kurven im allgemeinen von einer Parameterdarstellung ausgehen, so dass sich jetzt die Frage stellt, wie man an der Parameterdarstellung direkt Eigenschaften der Kurven ablesen kann. Dabei werden für uns die Begriffe Tangente, Normale, Krümmung, Krümmungskreis im Vordergrund stehen. Kraft der letzten der obigen Bemerkungen ist in den hergeleiteten Formeln immer auch der Spezialfall der expliziten Darstellung der Kurve enthalten. Die Kurve K sei durch die Parameterdarstellung ~r(t) = (x(t), y(t)) gegeben. Um die Tangentenrichtung im Punkte P zu erhalten, betrachten wir den Vektor P~Q ~r(t + ∆t) − ~r(t) = ∆t ∆t und lassen Q gegen P , d.h. ∆t gegen 0 streben. Definitionsgemäss erhalten wir im Limes ~r(t + ∆t) − ~r(t) ∆→0 ∆t x(t + ∆t) − x(t) y(t + ∆t) − y(t) = lim , lim ∆→0 ∆→0 ∆t ∆t ~r˙ = lim = (ẋ(t), ẏ(t)), wobei wir, wie üblich, die Ableitung nach t mit einem Punkt bezeichnet haben. Wir halten fest: Der Vektor ~r˙ = (ẋ(t), ẏ(t)) ist ein Tangentialvektor an die Kurve im Punkte P . Die Tangentensteigung im Punkt P ist somit gegeben durch ẏ(t)/ẋ(t). Beschreibt ~r(t) = (x(t), y(t)) die Bewegung eines Massenpunktes, wobei t die Zeit bedeutet, so ist ~r˙ , dessen (vektorielle) Geschwindigkeit zur Zeit t. Die Tangente an die Kurve im Punkt P hat offenbar die Parameterdarstellung ~ = ~r(t) + s ~r˙ (t), −∞ < s < +∞ . OR Der Vektor ~n(t) = (−ẏ(t), ẋ(t)) entsteht aus ~r˙ = (ẋ(t), ẏ(t)) durch Drehung um π/2 im Gegenuhrzeigersinn. Die Normale zur Kurve in P hat deshalb die Parameterdarstellung ~ = ~r(t) + s ~n(t), −∞ < s < +∞ . OS 70 U. Stammbach: Analysis, Teil A Beispiel Zykloide (siehe Figur 4). Ein Kreis mit Radius a rolle auf der x-Achse. Der Punkt der Kreisperipherie, welcher sich zu Anfang im Ursprung des Koordinatensystems befindet, beschreibt bei der Rollbewegung eine Zykloide. Wählen wir als Parameter den Drehwinkel t des Kreises, so liest man aus der Figur leicht die Parameterdarstellung t → (at − a sin t, a − a cos t), −∞ < t < +∞ (y) Fig. 4 : Zykloide t a (x) 2πa für die Zykloide ab. Ein fest mit der Kreisscheibe verbundener Punkt im Abstand b vom Mittelpunkt des Kreises beschreibt für b < a eine sogenannte verkürzte Zykloide bzw. für b > a eine verlängerte Zykloide (siehe Figur 5). Die Parameterdarstellung lautet t → (at − b sin t, a − b cos t), −∞ < t < +∞ . Beispiel Die Kurve K sei gegeben durch die Parameterdarstellung t → (cos t, sin 2t), 0 ≤ t < 2π . Für die Steigung der Kurve erhält man ẏ/ẋ = −2 cos 2t/ sin t. Die Kurve besitzt also für √ die Parameterwerte t = π/4, 3π/4, 5π/4, 7π/4, d.h. in den Punkten (± 2/2, ±1) horizontale 71 Kapitel II. Differentialrechnung (y) Fig. 5 : Verkürzte und verlängerte Zykloide (x) 2πa Tangenten, und für die Parameterwerte t = 0, π, d.h. in den Punkten (±1, 0) vertikale Tangenten. Schliesslich geht die Kurve für t = π/2, 3π/2 durch den Nullpunkt des Koordinatensystems. Die Steigung beträgt 2 für t = π/2 und −2 für t = 3π/2. Wegen ihrer Form heisst die Kurve auch etwa Zwiebelkurve (siehe Figur 6). Als nächstes wenden wir uns der Krümmung und dem Krümmungskreis einer Kurve zu. Die Krümmung k einer Kurve K ist die Schnelligkeit, mit der sich die Richtung der Tangente an die Kurve ändert, wenn diese mit Geschwindigkeit 1 durchlaufen wird. Um dies zu präzisieren, müssen wir auf der Kurve Längen messen können, d.h. wir müssen den Begriff der Bogenlänge kennen. Dieser dürfte aus der Schule bereits bekannt sein, ausserdem werden wir bei der Integralrechnung noch einmal darauf zurückkommen. Was wir hier benötigen ist die Formel für das sogenannte Bogenelement: wie man aus einer entsprechenden Figur abliest, ist das Differential der Bogenlänge gegeben durch ds = q (dx)2 + (dy)2 = q ẋ2 (t) + ẏ 2 (t) dt . Bezeichnet s(t) die von einem festen Punkt bis zu (x(t), y(t)) gemessene Bogenlänge, so gilt also ds q 2 = ẋ (t) + ẏ 2 (t) . dt 72 U. Stammbach: 1 Analysis, Teil A (y) 0.5 Fig. 6 : Zwiebelkurve (x) -1 -0.5 0.5 1 -0.5 -1 Nach obigem ist die Krümmung k definiert als Ableitung des Steigungswinkels α nach der Bogenlänge s k= dα . ds Nach der Kettenregel und nach der Formel für die Ableitung der inversen Funktion gilt nun dα dα dt dα/dt = = . ds dt ds ds/dt Damit genügt es, dα/dt zu bestimmen. Da tan α gerade die Steigung der Kurve ist, gilt ( α= arctan(ẏ/ẋ), für arctan(ẏ/ẋ) + π, für −π/2 < α < π/2 , π/2 < α < 3π/2 . Daraus folgt dα ÿ ẋ − ẏẍ ÿẋ − ẏẍ 1 · = 2 . = 2 2 dt 1 + (ẏ/ẋ) ẋ ẋ + ẏ 2 Für die Krümmung k der Kurve K ergibt sich daraus die Formel 73 Kapitel II. Differentialrechnung k = k(t) = ÿ ẋ − ẏẍ . (ẋ2 + ẏ 2 )3/2 Zusätzlich halten wir fest: k > 0 ⇔ α nimmt zu ⇔ die Kurve ist nach links gekrümmt , k < 0 ⇔ α nimmt ab ⇔ die Kurve ist nach rechts gekrümmt . In Punkten, wo k das Vorzeichen ändert, liegt ein Wendepunkt der Kurve vor. Beispiel Gegeben ist die Ellipse t → (a cos t, b sin t) , 0 ≤ t < 2π . Wir erhalten ẋ = −a sin t, ẍ = −a cos t, ẏ = +b cos t, ÿ = −b sin t, und damit k(t) = (a2 sin2 t ab . + b2 cos2 t)3/2 Insbesondere gilt für den Kreis (a = b = r) k(t) = 1/r . Kehren wir zur Ellipse zurück und betrachten wir die beiden Scheitel t = 0, t = π/2, so liefert die Formel für die Krümmung in diesen beiden Punkten k(0) = a b , k(π/2) = 2 . b2 a Zeichnen wir Kreise mit Radien 1/k(0) bzw. 1/k(π/2), welche die Ellipse in den entsprechenden Scheitelpunkten berühren, so haben diese im Berührpunkt mit der Ellipse sowohl die Tangente wie die Krümmung gemeinsam. Es sind dies die Krümmungskreise der Ellipse in den Scheitelpunkten (siehe Figur 7). Der Krümmungskreis einer Kurve K im Punkte P ist definitionsgemäss derjenige Kreis, der in P die gleiche Tangentensteigung und die gleiche Krümmung wie die Kurve K hat. Es ist also der Kreis, welcher die Kurve im Punkte P am besten approximiert. 74 U. Stammbach: Analysis, Teil A Fig. 7 : Die Krümmungskreise an den Scheitelpunkten der Ellipse Nach obigem ist der Radius des Krümmungskreises |1/k|. Sein Mittelpunkt liegt auf der Normalen zur Kurve K im Punkte P und zwar links der Kurve, falls k positiv und rechts der Kurve, falls k negativ ist. Der nach links zeigende Normaleneinheitsvektor m(t) ~ zu K in P ist (−ẏ(t), ẋ(t)) m(t) ~ =p 2 . ẋ (t) + ẏ 2 (t) Der Mittelpunkt M0 des Krümmungskreises, der Kümmungsmittelpunkt ist somit gegeben durch ~ 0 = ~r(t) + 1 m(t) OM ~ . k(t) Durchläuft man die Kurve K, so beschreibt der Krümmungsmittelpunkt M0 eine Kurve K 0 . Diese heisst Evolute von K. Beispiel Die Zykloide t → ~r(t) = (at − a sin t, a − a cos t) besitzt nach unserer Formel die Krümmung 75 Kapitel II. Differentialrechnung k(t) = −1 . 2a 2(1 − cos t) p Für den Normaleneinheitsvektor m ~ erhält man m(t) ~ = − sin t 1 − cos t p ,p 2(1 − cos t) 2(1 − cos t) ! . Einsetzen in die Parameterdarstellung der Evolute liefert ~ 0 = (at + a sin t, −a + a cos t) . OM Setzt man t = t0 − π, so erhält man ~ 0 = (at0 − aπ − a sin t0 , −a − a cos t0 ) OM = (−aπ + (at0 − a sin t0 ), −2a + (a − a cos t0 )) . Führt man nun neue Koordinaten ξ = x + aπ, η = y + 2a ein, so beschreibt diese Formel eine Zykloide im (ξ, η)-Koordinatensystem. Beispiel Gegeben sei die Parabel y = x2 . Wir fassen die explizite Darstellung als Parameterdarstellung t → ~r(t) = (t, t2 ), t ∈ R auf. Die Krümmung k ergibt sich daraus zu k(t) = 2 (1 + 4t2 )3/2 und für den Normaleneinheitsvektor m ~ erhält man m(t) ~ = 1 · (−2t, 1) , (1 + 4t2 )1/2 so dass die Parameterdarstellung der Evolute ~ 0 = (−4t3 , 1/2 + 3t2 ), t ∈ R , OM lautet. In diesem Fall lässt sich sogar der Parameter leicht eliminieren und man kann zur expliziten Darstellung übergehen. Die Evolute der Parabel ist der Graph der Funktion 76 U. Stammbach: x→ 2/3 x 1 +3 2 4 Analysis, Teil A . Daraus ergibt sich ohne weiteres auch das geometrische Bild (siehe Figur 8). (y) 2 x 2/3 1 +3 2 4 1.5 Fig. 8 : Evolute der Parabel 1 x2 0.5 (x) -1.5 -1 -0.5 0.5 1 1.5 Schliesslich beschäftigen wir uns noch kurz mit Kurven, die durch Gleichungen in Polarkoordinaten gegeben sind. Ist ρ = f (ϕ) eine solche Gleichung, so gehört ein Punkt zur Kurve K, wenn seine Polarkoordinaten (ρ, ϕ) die Gleichung erfüllen. Eine solche Darstellung gibt in offensichtlicher Weise Anlass zu einer Parameterdarstellung von K mit Parameter ϕ ϕ → ~r(ϕ) = (f (ϕ) cos ϕ, f (ϕ) sin ϕ) , so dass man auf dem Umweg über diese Parameterdarstellung Informationen über die Kurve erhalten kann. Beispiel Die logarithmische oder Bernoulli’sche Spirale (Jakob Bernoulli 1654 - 1705) ist gegeben durch die Gleichung ρ = C · ekϕ , C, k > 0 77 Kapitel II. Differentialrechnung in Polarkoordinaten (siehe Figur 9). Wir gehen über zur Parameterdarstellung ϕ → ~r(ϕ) = (C · ekϕ cos ϕ, C · ekϕ sin ϕ) . Die Tangentenrichtung der Kurve ergibt sich durch Ableitung nach ϕ ~r˙ (ϕ) = (Ckekϕ cos ϕ − C · ekϕ sin ϕ, Ckekϕ sin ϕ + C · ekϕ cos ϕ) . Die Kurve hat also vertikale Tangenten für k cos ϕ − sin ϕ = 0, d.h. für tan ϕ = k, und horizontale Tangenten für k sin ϕ + cos ϕ = 0 d.h. für tan ϕ = −1/k. Man stellt die überraschende Tatsache fest, dass die beiden Richtungen, in denen vertikale bzw. horizontale Tangenten auftreten, senkrecht aufeinander stehen (siehe Figur 10). (y) 3 Fig. 9 : Bernoullispirale 2 1 (x) -2 -1 1 2 3 -1 ~ und dem Ist P ein Punkt der Kurve K, so wollen wir den Winkel ω zwischen dem Vektor OP ~ hat offenbar Tangentialvektor an die Kurve in P bestimmen (siehe Figur 11). Der Vektor OP die Richtung ~e = (cos ϕ, sin ϕ), so dass wir erhalten cos ω = ~r˙ · ~e k . = 2 ˙ (k + 1)1/2 |~r| 78 U. Stammbach: Analysis, Teil A (y) Fig. 10 : Tangenten an Bernoullispirale (x) (y) Fig. 11 : Winkel zwischen Fahrstrahl und Tangente ~r˙ ω ~e (x) 79 Kapitel II. Differentialrechnung 3 (y) 2.5 2 Fig. 12 : Evolute der Bernoullispirale 1.5 1 0.5 (x) -1 -0.5 0.5 1 1.5 2 2.5 3 -0.5 -1 Insbesondere zeigt es sich, dass ω von ϕ unabhängig ist! Diese – wie wir später sehen werden – charakteristische Eigenschaft der logarithmischen Spirale findet in der Technik häufig Anwendung: die Formgebung von Radialturbinenschaufeln, damit der Dampf- oder Wasserstrahl überall im selben Winkel auftritt; die Formgebung eines Fräsers, damit der Schnittwinkel beim Nachschleifen konstant bleibt. Auch in ganz anderem Zusammenhang tritt sie wegen dieser Eigenschaft auf: in der Bodenphysik spielt sie bei gewissen Modellvorstellungen für Stabilitätsbetrachtungen von Erdlinsen eine Rolle; für viele Motten, die in ihrem Flug einen festen Winkel zum Lichtschimmer einer Kerze einhalten, ist die logarithmische Spirale zum Verderben geworden. Zum Schluss dieses Abschnittes wenden wir uns noch der Evolute der logarithmischen Spiralen zu, wobei wir der Einfachheit halber den Spezialfall C = 1 = k betrachten. Wir gehen aus von der Parameterdarstellung ϕ → ~r(ϕ) = (eϕ cos ϕ, eϕ sin ϕ), ϕ ∈ R , und erhalten den zu ϕ gehörigen Evolutenpunkt M0 durch Einsetzen in die entsprechende Formel: ~ 0 = (ξ(ϕ), η(ϕ)) = (−eϕ sin ϕ, eϕ cos ϕ) . OM Wiederum stellen wir eine überraschende Tatsache fest: Die Evolute ist nichts anderes als die um π/2 um den Ursprung des Koordinatensystems gedrehte Ausgangskurve (siehe Figur 12). Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel III. Integralrechnung Mathematics is not a spectator sport! Mathematics is learned by doing, not by watching! Eleanor G. Palais Inhaltsverzeichnis 1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Der Hauptsatz der Infinitesimalrechnung . . . . . . . . . . . . . . . . . . . . . . . 7 3 Das Integrieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Die Methode der partiellen Integration . . . . . . . . . . . . . . . . . . . . . . . . 15 5 Die Methode der Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6 Einige weitere Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 7 Flächenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 8 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 9 Volumenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 10 Oberflächenberechnung 49 11 Schwerpunkt, Flächenmittelpunkt 12 Trägheitsmoment 13 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3 Kapitel III. Integralrechnung 1 Das bestimmte Integral Obwohl die folgenden Begriffsbildungen auch in einem allgemeineren Rahmen möglich sind, setzen wir im ganzen Kapitel voraus, dass alle betrachteten Funktionen stetig sind. Dies macht die Darstellung besonders einfach. Definition (B. Riemann 1826-1866) Gegeben sei eine Funktion f : x → f (x) und ein im Definitionsbereich von f liegendes Intervall [a, b]. y = f (x) Fig. 1 : Riemann’sches Integral f (ξ1 ) x0 = a ξ1 f (ξ2 ) x1 ξ2 f (ξ3 ) x2 ξ3 f (ξ4 ) x3 ξ4 x4 = b (a) Wähle eine Einteilung von [a, b] durch endlich viele Punkte a = x0 < x1 < · · · < xn−1 < xn = b in Teilintervalle. (b) Wähle für k = 1, 2, . . . , n Zwischenpunkte ξk mit xk−1 ≤ ξk ≤ xk . Die Feinheit der Einteilung ist definiert durch maxk=1,2,...,n |xk − xk−1 |. 4 U. Stammbach: Analysis, Teil A (c) Der gewählten Einteilung von [a, b] mit Zwischenpunkten ξk wird die Riemann’sche Summe f (ξ1 )∆x1 + f (ξ2 )∆x2 + · · · + f (ξn )∆xn = n X f (ξk )∆xk k=1 zugeordnet, wobei wir ∆xk = xk − xk−1 gesetzt haben. (d) Definiere das Riemann’sche Integral durch Z b a f (x)dx = lim n X f (ξk )∆xk . k=1 Dabei ist für den Grenzübergang eine Folge von Einteilungen zugrunde zu legen, deren Feinheit gegen Null strebt. In diesem Symbol heisst f (x) der Integrand, die Grösse a die untere und b die obere (Integrations-) Grenze. Es gilt nun das folgende grundlegende Resultat, welches wir ohne Beweis angeben: Für eine stetige Funktion f existiert der Limes in (d) immer, und sein Wert ist unabhängig von der Wahl der Folge der Einteilungen und der Zwischenpunkte. Es ist nach dieser Definition anschaulich klar, dass das Riemann’sche Integral den Inhalt der Fläche zwischen dem Graphen der Funktion und der x-Achse beschreibt, und zwar werden die Flächenanteile oberhalb der x-Achse positiv, die Anteile unterhalb der x-Achse negativ gezählt. Beispiel Es sei f (x) = C > 0. Dann folgt Z b a Cdx = C(b − a) . In diesem Fall ist das Integral gerade die Fläche des Rechtecks. Beispiel Es sei f : x −→ x2 . Dann ist Z 0 b x2 dx der Inhalt der Fläche unter der Parabel y = x2 zwischen den x-Werten 0 und b. Lange vor Erfindung der Integralrechnung wurde dieser Flächeninhalt mit anderen Methoden von Archimedes (287-212 v.Chr.) bestimmt. Hier benützen wir natürlich die oben gegebene Definition des bestimmten Integrals. Da der Wert des Riemann’schen Integrales von der gewählten Einteilung und den gewählten Zwischenpunkten unabhängig ist, dürfen wir x0 = 0, x1 = 1 2 n b, x2 = b, . . . , xn = b = b n n n 5 Kapitel III. Integralrechnung ξk = xk , k = 1, . . . , n setzen (siehe Figur 2). Wir erhalten dann Z 0 b x2 dx = = = lim (f (x1 )∆x1 + f (x2 )∆x2 + · · · + f (xn )∆xn ) n→∞ lim n→∞ 1 b n 2 + 2 b n 2 + ··· + lim (12 + 22 + · · · + n2 ) n→∞ n b n 2 ! · b n b3 . n3 y = x2 Fig. 2 : Parabelfläche x0 x1 x2 x3 x4 x5 = b Nun gilt 12 + 22 + · · · + n2 = 16 n(n + 1)(2n + 1), wie man leicht mit vollständiger Induktion nach n beweisen kann, und damit folgt Z 0 b x2 dx = n (n + 1) (2n + 1) b3 b3 lim = . 6 n→∞ n n n 3 Laut Definition des Riemann’schen Integrals gelten gewisse offensichtliche Rechenregeln, von denen wir die folgenden explizit erwähnen: 6 U. Stammbach: Analysis, Teil A • Das bestimmte Integral ist eine lineare Operation. Es gilt Z b a (f (x) + g(x))dx = Z b a Cf (x)dx = C Z b a Z b a f (x)dx + Z b a g(x)dx f (x)dx , C ∈ R . • Ist a > b, so kehren sich die Vorzeichen der ∆xk um. Damit folgt Z b a f (x)dx = − Z b a f (x)dx und daraus ergibt sich insbesondere Z a f (x)dx = 0 . a • Hat man die zwei Intervalle [a, b] und [b, c] vor sich, so liefern Einteilungen davon zusammen genommen eine Einteilung des Intervalles [a, c]. Folglich gilt Z b a f (x)dx + Z b c f (x)dx = Z c a f (x)dx . • Der Wert des bestimmten Integrales ist unabhängig vom Namen der Integrationsvariablen; es gilt Z b a f (x)dx = Z b a f (t)dt = . . . Die Integrationsvariable übernimmt nur die Rolle einer Hilfsgrösse für die Rechnung. 7 Kapitel III. Integralrechnung 2 Der Hauptsatz der Infinitesimalrechnung Unser nächstes Ziel ist es, den sogenannten Hauptsatz der Infinitesimalrechnung herzuleiten, welcher auf völlig überraschende Weise das bestimmte Integral mit der Differentialrechnung verbindet. Dazu brauchen wir einige Vorbereitungen. Es sei m das globale Minimum und M das globale Maximum der Funktion f auf dem Intervall [a, b]. Dann gilt auf den Intervall [a, b] m ≤ f (x) ≤ M , M Fig. 1 : Mittelwertsatz der Integralrechnung m f (ξ) a ξ b und man erhält m(b − a) = Z b a m dx ≤ Z b a f (x) dx ≤ Z b a M dx = M (b − a) 8 U. Stammbach: Rb a m≤ Analysis, Teil A f (x) dx ≤M . b−a Da eine stetige Funktion nach dem Zwischenwertsatz (siehe Kapitel I, Abschnitt 4) jeden Wert zwischen m und M mindestens einmal annimmt, folgt aus dieser Überlegung das folgende Resultat. Mittelwertsatz der Integralrechnung Es existiert ξ in [a, b] mit (b − a)f (ξ) = Beispiel Z b a f (x) dx . In konkreten Fällen lässt sich ein solches ξ explizit angeben. Aus Z 0 b x2 dx = b3 3 folgt zum Beispiel f (ξ) = ξ 2 = b3 b2 = , 3b 3 √ so dass sich ξ = b 3/3 ergibt. Mit Hilfe des Mittelwertsatzes der Integralrechnung leiten wir jetzt den Hauptsatz der Infinitesimalrechnung her. Zu diesem Zweck betrachten wir eine auf dem Intervall [a, b] stetige Funktion f : x → f (x) und definieren eine Funktion Fa durch die Vorschrift Fa : x → Dann gilt (siehe Figur 2) Z x a f (t) dt, D(Fa ) = [a, b]. 9 Kapitel III. Integralrechnung Fig. 2 : Hauptsatz der Infinitesimalrechnung a x dFa (x) = dx ξ x+h Fa (x + h) − Fa (x) h→0 h ! Z x Z x+h 1 = lim f (t) dt − f (t) dt h→0 h a a lim 1 = lim h→0 h Z x+h x f (t) dt . Nach dem Mittelwertsatz der Integralrechnung existiert nun ein ξ zwischen x und x + h mit der Eigenschaft 1 h Z x+h x f (t) dt = f (ξ) . Damit erhalten wir dFa (x) = lim f (ξ) = lim f (ξ) = f (x) , h→0 ξ→x dx 10 U. Stammbach: Analysis, Teil A weil mit h → 0 die Grösse ξ gegen x strebt und weil f stetig ist. Damit haben wir die folgende Aussage erhalten. Hauptsatz der Infinitesimalrechnung (I. Newton 1642 - 1727, G.F. Leibniz 1646-1716) Die Ableitung eines bestimmten Integrals über eine stetige Funktion f nach der oberen Integrationsgrenze ist gleich dem Wert des Integranden an dieser Grenze: d dx Z x a f (t)dt = f (x) . Eine Funktion F : x → F (x) mit F 0 (x) = f (x) heisst eine Stammfunktion von f : x → f (x). Laut dem Hauptsatz der Infinitesimalrechnung existiert zu einer stetigen Funktion f : x → f (x) immer (mindestens) eine Stammfunktion nämlich Fa : x → Z x a f (t) dt . • Ist F : x → F (x) eine Stammfunktion von f : x → f (x), so ist auch F + C : x → F (x) + C eine Stammfunktion von f : x → f (x). • Sind F : x → F (x) und G : x → G(x) Stammfunktionen von f : x → f (x), so gibt es eine reelle Konstante C mit G(x) ≡ F (x) + C. Beispiel Die Funktionen F : x → sin2 x und G : x → − 12 cos 2x haben beide die Ableitung F 0 (x) = G0 (x) = 2 sin x cos x . Es sind also sowohl F wie G Stammfunktionen von f : x → 2 sin x cos x. Sie unterscheiden sich deshalb nur um eine additive Konstante C: 1 G(x) ≡ − cos 2x ≡ sin2 x + C ≡ F (x) + C . 2 Setzt man x = 0, so erhält man C = −1/2. Damit haben wir die (bekannte) Identität 1 sin2 x ≡ (1 − cos 2x) 2 bewiesen. 11 Kapitel III. Integralrechnung Der Hauptsatz der Infinitesimalrechnung zusammen mit den obigen Bemerkungen liefert die Möglichkeit, bestimmte Integrale auf sehr einfache Weise zu berechnen. Mit unseren Bezeichnungen ist Z b a f (t) dt = Fa (b) . Ist nun F : x → F (x) irgendeine Stammfunktion von f : x → f (x), so gilt nach obigem Fa (x) ≡ F (x) + C . In dieser Gleichung kann man die Konstante C bestimmen, indem man x = a setzt; dann R gilt nämlich Fa (a) = aa f (t) dt = 0, und es folgt C = −F (a). Man erhält für den Wert des bestimmten Integrals die Formel Fa (b) = Z b a f (t) dt = F (b) − F (a). Damit haben wir die folgende zentrale Aussage der Infinitesimalrechnung bewiesen, welche die Berechnung bestimmter Integrale auf die Berechnung einer Stammfunktion des Integranden reduziert. Satz Ist f : x → f (x) eine auf [a, b] stetige Funktion und ist F : x → F (x) eine Stammfunktion von f , so gilt Z b a f (t) dt = F (b) − F (a) . Für die Differenz F (b) − F (a) schreiben wir im folgenden oft kurz [F (x)]ba oder F (x)|ba . Beispiel Z b a " x3 x dx = 3 2 #b = a b3 a3 − . 3 3 Beispiel Z 0 π/2 π/2 sin x dx = [− cos x]0 = − cos(π/2) − (− cos 0) = 0 + 1 = 1 . 12 3 U. Stammbach: Analysis, Teil A Das Integrieren Es sei f : x → f (x) eine auf [a, b] stetige Funktion. Die Menge ihrer Stammfunktionen bezeichnen wir mit dem Symbol Z f (x) dx . Sie heisst oft in etwas unglücklicher Weise das unbestimmte Integral von f : x → f (x). Der Übergang von f zu seinem Integral heisst Integrieren. Da das Integrieren die Umkehroperation des Differenzierens ist, liefert jede Ableitungsregel eine Regel für das Integrieren. Wir halten die folgenden explizit fest: Z xn dx = Z xn+1 + C , falls n 6= −1 n+1 1 dx = log |x| + C Z x ex dx = ex + C Z Z sin x dx = − cos x + C cos x dx = sin x + C Z 1 dx sin2 x Z 1 dx cos2 x Z dx √ 1 − x2 Z 1 dx 2 Z1+x = −cot x + C = tan x + C = arcsin x + C = arctan x + C sinh x dx = cosh x + C Z Z cosh x dx = sinh x + C √ dx x2 + 1 = Arsinh x + C = log(x + p x2 + 1) + C 13 Kapitel III. Integralrechnung Z Z Z √ dx x2 − 1 = Arcosh x + C = log(x + p x2 − 1) + C tan x dx = − log | cos x| + C cot x dx = log | sin x| + C In vielen Fällen lassen sich Integrale von komplizierten Funktionen finden, indem man versucht, das Problem auf diese oben angeführte Standardintegrale zurückzuführen. Dabei benützt man unter anderem die (offensichtlichen) Rechenregeln: Z (f (x) + g(x)) dx = Z Z Z c f (x) dx = c f (x) dx + Z Z g(x) dx f (x) dx , c ∈ R g0 (f (x)) · f 0 (x) dx = g(f (x)) + C Beispiel Z sin3 x dx = Z Z = sin x(1 − cos2 x)dx sin x dx + = − cos x + Z (− sin x) cos2 x dx cos3 x +C 3 Beispiel Z √ ax + b dx = 2 (ax + b)3/2 + C 3a Beispiel Z √ x dx = (x2 + 1)1/2 + C . +1 x2 In konkreten Fällen ist es manchmal recht schwierig, die Stammfunktion zu finden. Dies liegt einmal daran, dass es keine einfache Methode gibt, welche in allen vernünftigen Fällen eine 14 U. Stammbach: Analysis, Teil A Stammfunktion liefert. Ferner gibt es verhältnismässig einfache Funktionen, deren Stammfunktion sich nicht auf elementare Weise ausdrücken lassen. Als Beispiel erwähnen wir die Funktion 2 x → e−x . Diese ist natürlich stetig, besitzt also sicherlich eine Stammfunktion. Mit starken mathematischen Mittel kann man beweisen, dass sich diese Stammfunktion nicht durch eine gewöhnliche Formel beschreiben lässt, in der nur Potenzfunktionen, trigonometrische Funktionen, Exponentialfunktionen und zu diesen inverse Funktionen vorkommen: sie ist nicht elementar ausdrückbar. Es ist zwar klar, dass es neben den elementar ausdrückbaren Funktionen noch andere Funktionen geben muss, dass aber darunter sogar Funktionen zu finden sind, die als Stammfunktionen von elementar ausdrückbaren Funktionen auftreten, ist doch eine recht überraschende Tatsache. Trotz all dieser Schwierigkeiten kennt man eine Anzahl Techniken, die beim Integrieren nützlich sind; wir besprechen in den folgenden zwei Abschnitten zwei davon, nämlich die Methode der partiellen Integration und die Methode der Substitution. 15 Kapitel III. Integralrechnung 4 Die Methode der partiellen Integration Die Methode der partiellen Integration ist die Umkehrung der Ableitungsregel für ein Produkt von Funktionen. Sind u : x → u(x) und v : x → v(x) zwei Funktionen, so gilt (u · v)0 = u0 · v + u · v 0 . Es folgt daraus uv + C = Z (u · v)0 dx = Z u0 v dx + Z uv 0 dx und damit Z u0 v dx = uv − Z uv 0 dx . Wir sehen die Nützlichkeit dieser Formel in den folgenden Beispielen. Beispiel Im Integral Z xex dx setzten wir u0 (x) = ex , u(x) = ex , v(x) = x , v 0 (x) = 1 . Dann liefert die Formel für die partielle Integration Z xex dx = xex − Z 1 · ex dx = xex − ex + C = (x − 1)ex + C . 16 U. Stammbach: Analysis, Teil A Wählen wir die Funktionen u, v anders, setzen wir u0 (x) = x , u(x) = x2 /2 , v(x) = ex , v 0 (x) = ex , so erhalten wir Z x xe dx = Z x2 x e − 2 x2 x e dx . 2 Hier ist das Integral auf der rechten Seite der Gleichung offenbar komplizierter als das Ausgangsintegral; die partielle Integration läuft in der verkehrten Richtung und hilft anscheinend nicht weiter. Immerhin können wir an der letzten Gleichung ablesen Z 2 x 2 x x e dx = x e − 2 Z xex dx = x2 ex − 2xex + 2ex + C = (x2 − 2x + 2)ex + C , so dass unsere Arbeit doch nicht ganz nutzlos war. Beispiel Im Integral Z sin2 x dx setzen wir u0 (x) = sin x , u(x) = − cos x , v(x) = sin x , v 0 (x) = cos x , und erhalten Z sin2 x dx = − sin x cos x + = − sin x cos x + Z Z cos2 x dx (1 − sin2 x) dx = − sin x cos x + x − Z sin2 x dx . 17 Kapitel III. Integralrechnung Wiederum scheint die partielle Integration nicht zum Ziele geführt zu haben, tritt doch auf der rechten Seite das Ausgangsintegral noch einmal auf. Schaut man allerdings näher hin, so R 2 sieht man, dass eine Gleichung für die unbekannte Grösse sin x dx vorliegt, die sich ohne Schwierigkeiten auflösen lässt: Z sin2 x dx = 1 (x − sin x cos x) + C. 2 Auf analoge Weise erhält man Z cos2 x dx = 1 (x + sin x cos x) + C, 2 ein Resultat, das sich aus obigem auch mit cos2 x = 1 − sin2 x herleiten lässt. Beispiel Im Integral Z eax cos bx dx mit a, b ∈ R setzen wir u0 (x) = eax , u(x) = eax /a , v(x) = cos bx , v 0 (x) = −b sin bx . Dies liefert Z ax e 1 b cos bx dx = eax cos bx + a a Z eax sin bx dx . Setzt man im verbleibenden Intregral u0 (x) = eax , u(x) = eax /a , v(x) = sin bx , v 0 (x) = b cos bx , so erhält man im zweiten Schritt Z eax cos bx dx = 1 ax b e cos bx + a a 1 ax b e sin bx − a a Z eax cos bx dx . 18 U. Stammbach: Analysis, Teil A Wie im letzten Beispiel hat man eine Gleichung für die unbekannte Grösse vor sich, die sich leicht auflösen lässt: Z eax cos bx dx = a2 1 eax (a cos bx + b sin bx) + C . + b2 Beispiel Z log x dx = Z 1 · log x dx = x log x − Z 1 x dx = x (log x − 1) + C. x Dabei haben wir u0 (x) = 1 , u(x) = x , v(x) = log x , v 0 (x) = 1/x gesetzt. Beispiel Z arctan x dx = x · arctan x − 1 2 Z 2x 1 dx = x · arctan x − log(1 + x2 ) + C . 2 1+x 2 Dabei haben wir, ähnlich wie im letzen Beispiel, u0 (x) = 1 , u(x) = x, 0 v(x) = arctan x , v (x) = 1/(1 + x2 ) gesetzt. Ausserden haben wir im verbleibenden Integral den Bruch mit 2 erweitert, um zu erreichen, dass im Zähler gerade die Ableitung des Nenners steht. 19 Kapitel III. Integralrechnung 5 Die Methode der Substitution Die effiziente Handhabung der partiellen Integration lernt man durch intensives Üben. Gleiches gilt in noch vermehrtem Masse für die Methode der Substitution. Wir beschränken uns in dieser kurzen Darstellung im wesentlichen auf Beispiele (das Üben überlassen wir wie üblich dem Leser!) und verzichten auch auf eine vollständige Begründung der Methode. (Dies ist übrigens trotz der Einfachheit der zugrunde liegenden Idee recht umständlich.) Immerhin wollen wir festhalten und auch begreiflich machen, dass die Methode der Substitution für die Integration das Pendant der Kettenregel der Differentiation ist, wie die Methode der partiellen Integration dasjenige der Produktregel. Beispiel Im Integral I= Z sinn x cos x dx substituieren wir als neue Funktion u(x) = sin x. Dann ist u0 (x) = cos x, so dass sich das Integral I in der Form I= Z (u(x))n u0 (x) dx schreiben lässt. Die Funktion x → U (x) = 1 (u(x))n+1 n+1 ist dann eine Stammfunktion von ((u(x))n u0 (x), wie man durch Ableiten mit Hilfe der Kettenregel sofort bestätigt. Wir erhalten demzufolge I= Z sinn x cos x dx = 1 sinn+1 x + C . n+1 Man liest an diesem Beispiel ab, dass sich eine Substitution einer Funktion u(x) besonders dann aufdrängt, wenn der Integrand u0 (x) als Faktor enthält. Mit der – man kann nicht anders sagen – raffinierten Notation, die von Leibniz eingeführt worden ist, lässt sich im übrigen der Gang der Rechnung in abgekürzter Weise einfach darstellen. Man fasst dabei – rein formal – du = u0 (x) dx als das “Differential” der Funktion u auf. 20 Es sei I = U. Stammbach: R Analysis, Teil A sinn x cos x dx. Mit u(x) = sin x, du = u0 (x) dx = cos x dx, wird daraus Z I= un du = 1 un+1 + C . n+1 Die “Rücksubstitution” liefert dann I= 1 sinn+1 x + C . n+1 R Beispiel Für das Integral I = x sin(x2 ) dx wählt man die Substitution u = x2 . Daraus folgt du = 2x dx, d.h. x dx = du/2 und man erhält 1 I= 2 Z 1 sin u du = − cos u + C . 2 Die “Rücksubstitution” liefert dann 1 I = − cos(x2 ) + C . 2 Neben dieser direkten Art, eine Substitution zu verwenden, gibt es auch eine, die in der “umgekehrten Richtung” verläuft. Auch dazu einige Beispiele: Beispiel Im Integral I= Z p 1 − u2 du substituieren wir u = sin x, du = cos x dx. Dann erhalten wir wegen 1 − u2 = 1 − sin2 x = cos2 x Z cos x cos x dx = Z 1 cos2 x dx = (x + sin x cos x) + C . 2 Die ”Rücksubstitution” liefert I= p 1 arcsin u + u 1 − u2 + C . 2 21 Kapitel III. Integralrechnung Den Leser mag einwenden – und dies mit vollem Recht –, dass wir in diesem Beispiel an zwei Stellen nicht ganz “sauber” gerechnet haben: wir haben ohne Rücksicht auf das Vorzeichen von cos x cos x = q 1 − sin2 x gesetzt, und wir haben ohne Rücksicht auf den Wertebereich von arcsin x = arcsin (sin x) gesetzt. Beide Gleichungen gelten ja nur unter zusätzlichen Bedingungen, etwa 0 ≤ x ≤ π/2. Unsere forsche Art zu rechnen entspricht an dieser Stelle guter Praxis: es ist bei der Methode der Substitution in der Regel einfacher, Gleichungen wie die obige ohne Rücksicht auf den eingeschränkten Gültigkeitsbereich zu benützen, und dann am Schluss zu verifizieren, dass das erhaltene Resultat allgemein, d.h. für alle x gültig ist. Letzteres (also die Kontrolle) sollte man allerdings immer durchführen: p d 1 1 ( arcsin u + u 1 − u2 ) = du 2 2 p 1 u2 √ + 1 − u2 − √ 1 − u2 1 − u2 ! = p 1 − u2 . R√ Beispiel Im Integral I = x2 + 1 dx setzt man x = sinh t, dx = cosh t dt und erhält wegen 2 2 sinh t + 1 = cosh t das Integral I = Z cosh t · cosh t dt , welches man mit partieller Integration weiter behandeln kann. Setzt man u0 (t) = cosh t , u(t) = sinh t , v(t) = cosh t , v 0 (t) = sinh t , so folgt I = sinh t · cosh t − Z sinh2 t dt . Wegen sinh2 t = cosh2 t − 1 erhält man dann eine Gleichung für I, die sich leicht auflösen lässt: 22 U. Stammbach: I = 1 (t + sinh t cosh t) + C . 2 p sinh2 t + 1 Die Rücksubstitution liefert wegen cosh t = I = Analysis, Teil A p 1 ( Arsinh x + x x2 + 1) + C ; 2 ein Resultat, welches man leicht durch Ableiten bestätigt. Auf analoge Weise wie in den obigen Beispielen erhält man das folgende Integral Z p x2 − 1 dx = Beispiel p 1 (− Arcosh x + x x2 − 1) + C . 2 Man berechne den Flächeninhalt F der Ellipse mit Halbachsen a, b. Die obere Hälfte der Ellipsenperipherie ist als Graph der Funktion q f : x → b 1 − x2 /a2 , D(f ) = [−a, +a] gegeben. Um die ganze Ellipsenfläche F zu bestimmen, genügt es offenbar, die Fläche F/4 des Ellipsenviertels im ersten Quadranten auszurechnen F = 4 Z a 0 b q 1 − x2 /a2 dx . Für das unbestimmte Integral I= Z b q 1 − x2 /a2 dx bietet sich die Substitution x = a sin t, dx = a cos t dt an. Man erhält damit nach einem der obigen Resultate Z ab cos2 t dt = ab (t + sin t cos t) + C 2 23 Kapitel III. Integralrechnung und nach der Rücksubstitution ab x I= arcsin 2 a xq + 1 − x2 /a2 + C . a Einsetzen der Grenzen liefert dann F ab x = 4· arcsin 2 a ab π = 4· · 2 2 = πab . xq + 1 − x2 /a2 a a 0 Neben diesem etwas umständlichen Weg gibt es auch die Möglichkeit, die Substitution direkt im bestimmten Integral durchzuführen, d.h. die Substitution auch auf die Integrationsgrenzen wirken zu lassen. Für die untere Grenze x = 0 erhält man t = 0, für die obere x = a erhält man t = π/2. Man hat somit F = 4 Z 0 a b q 1− x2 /a2 dx = Z π/2 0 ab cos2 t dt = π ab , 4 F = πab . Bei der Berechnung der Wirkung der Substitution auf die Integrationsgrenzen müssen den Integrationsgrenzen in x in eindeutiger Weise Integrationsgrenzen in t zugeordnet werden können. Dies ist nur dann gewährleistet, wenn man bei der Substitution für die ursprüngliche Integrationsvariable eine injektive Funktionen verwendet. Möglicherweise muss man dabei den (sonst üblichen) Definitionsbereich der Substitutionsfunktion einschränken. In unserem Fall müssen wir dies in der Tat tun: der Definitionsbereich der Funktion t → x = a sin t wird auf das Intervall [0, π/2] eingeschränkt, dort ist die Funktion injektiv und den Integrationsgrenzen in x können eindeutig Integrationsgrenzen in t zugeordnet werden. Die Wirkung der Substitution auf die Integrationsgrenzen wird vom Anfänger gerne vergessen; man achte also besonders auf diesen Punkt. 24 6 U. Stammbach: Analysis, Teil A Einige weitere Beispiele In diesem Abschnitt beschäftigen wir uns im wesentlichen mit den Integralen über Potenzen der Sinus- bzw. der Cosinus-Funktion und mit Integralen über rationale Funktionen. In beiden Gebieten begnügen wir uns mit Beispielen. In Anwendungen treten oft die bestimmten Integrale In = Z π/2 0 sinn x dx , Jn = Z π/2 0 cosn x dx für n = 0, 1, 2, . . . auf. Diese Integrale wollen wir im ersten Teil dieses Abschnittes berechnen. Wir beschäftigen uns zuerst mit dem unbestimmten Integral Z sinn x dx . Für kleine Werte von n ist uns das Resultat natürlich bekannt; wir haben n=0 : n=1 : n=2 : Z 1 dx = x + C Z sin x dx = − cos x + C Z sin2 x dx = 1 (x − sin x cos x) + C 2 Eine Stammfunktion für x → sinn x in geschlossener Form anzugeben ist – wie man ohne grosse Mühe einsieht – nicht einfach. Hingegen lässt sich sehr leicht eine Rekursionsformel angeben. Dazu behandeln wir das Integral Z n sin x dx = Z sinn−1 x sin x dx mit partieller Integration; wir setzen u0 (x) = sin x , u(x) = − cos x , n−1 0 v(x) = sin x , v (x) = (n − 1) sinn−2 x cos x . 25 Kapitel III. Integralrechnung Dann erhalten wir Z sinn x dx = − cos x sinn−1 x + (n − 1) n−1 = − cos x sin Z sinn−2 x cos2 x dx Z x + (n − 1) sin n−2 x dx − Z n sin x dx . Die Gleichung lässt sich natürlich auflösen: Z 1 n−1 sin x dx = − cos x sinn−1 x + n n n Z sinn−2 x dx . Fig. 1 : Potenzen von sin x sin2 x sin5 x Man kann diese Formel verwenden, um rekursiv die Folge der Stammfunktionen von x → sinn x zu berechnen. Wir überlassen dies dem Leser und wollen hier zum ursprünglich gestellten Problem zurückkehren, nämlich zum Problem, die bestimmten Integrale (siehe Figur 1) In = Z 0 π/2 sinn x dx und Jn = Z 0 π/2 cosn x dx 26 U. Stammbach: Analysis, Teil A zu berechnen. Wie bemerken als erstes, dass der Graph von x → sinn x durch Spiegelung an der Senkrechten x = π/4 in den Graphen von x → cosn x übergeht (siehe Figur 2). Daraus folgt sofort In = Jn . Es genügt also In auszurechnen. Nach obigem gilt I0 = π , I1 = 1 , 2 und aus der Rekursionsformel erhalten wir In = Z 0 π/2 Fig. 2 : Symmetrie y = sin2 x y = cos2 x 1 sinn x dx = − cos x sinn−1 x n π/2 0 + n−1 n Z 0 π/2 sinn−2 x dx = n−1 · In−2 . n Mit Hilfe dieser Formel lassen sich die Werte In sogar in geschlossener Form angeben. Offenbar haben wir zwischen geraden und ungeraden Indizes n zu unterscheiden: I0 = π 1 π 3 1 π 5 3 1 π , I2 = · , I4 = · · , I6 = · · · , . . . 2 2 2 4 2 2 6 4 2 2 27 Kapitel III. Integralrechnung I2k = I1 = 1 , I3 = 1 · 3 · 5 · 7 · · · (2k − 1) π · 2 · 4 · 6 · 8 · · · 2k 2 2 4 2 6 4 2 , I5 = · , I7 = · · , . . . 3 5 3 7 5 3 I2k+1 = 2 · 4 · 6 · 8 · · · 2k 3 · 5 · 7 · · · (2k + 1) Aus diesen Resultaten lässt sich eine überraschende und historisch interessante Formel herleiten, nämlich die Formel von Wallis (J. Wallis 1616-1703). Im Intervall [0, π/2] gilt natürlich die Ungleichung 0 ≤ sin x ≤ 1 . Daraus folgt für k = 1, 2, 3, . . . sin2k−1 x ≥ sin2k x ≥ sin2k+1 x und durch Integration I2k−1 ≥ I2k ≥ I2k+1 . Division durch den (positiven) Wert I2k+1 liefert I2k−1 I2k ≥ ≥1. I2k+1 I2k+1 Nun gilt nach unserer Rekursionsformel I2k+1 = 2k I2k−1 , 2k + 1 so dass I2k−1 2k + 1 = lim = 1. k→∞ I2k+1 k→∞ 2k lim Daraus folgt 28 U. Stammbach: I2k lim k→∞ I2k+1 Analysis, Teil A = 1, d.h. lim k→∞ 1·3·3·5·5·7·7 · · · (2k − 1)(2k − 1)(2k + 1) π = 1. 2·2·4·4·6·6·8·8 · · · (2k)(2k) 2 Dies liefert unmittelbar die überraschende Formel von Wallis 2·2·4·4·6·6·8·8 · · · (2k)(2k) π = , k→∞ 1·3·3·5·5·7·7 · · · (2k − 1)(2k − 1)(2k + 1) 2 lim welche auf merkwürdige Weise die geraden und die ungeraden ganzen Zahlen mit der irrationalen Zahl π in Verbindung bringt. Beispiel Das Integral Z I= a 0 p x2 a2 − x2 dx tritt bei der Berechnung des Flächenträgheitsmomentes einer Kreisscheibe um ihren Durchmesser auf. Die Substitution x = a sin t, dx = a cos t dt mit gleichzeitiger Transformation der Integrationsgrenzen liefert I Z = π/2 0 4 = a 4 = a = Z a2 sin2 t a2 cos2 t dt π/2 0 (sin2 t − sin4 t) dt 1 π 1 3 π · − · · 2 2 2 4 2 π 4 a . 16 Im Rest dieses Abschnittes beschäftigen wir uns noch mit der Integration von rationalen Funktionen. Für dieses Gebiet gibt es eine ausgebaute Theorie. Wir wollen uns in dieser Vorlesung aber mit einigen Beispielen begnügen. 29 Kapitel III. Integralrechnung Beispiel Es ist das Integral Z dx x2 − 6x + 5 zu berechnen. Man sieht leicht, dass die quadratische Nennerfunktion die Nullstellen 5 und 1 hat. Die hier nicht behandelte Theorie der Partialbrüche besagt, dass sich die rationale Funktion x2 1 − 6x + 5 in der Form A B + x−5 x−1 mit reellen Zahlen A und B schreiben lässt. Diese Zahlen lassen sich aus der Identität 1 A B ≡ + x2 − 6x + 5 x−5 x−1 leicht bestimmen. Bringt man nämlich die rechte Seite auf einen einzigen Bruchstrich, so erhält man x2 1 A(x − 1) + B(x − 5) ≡ . − 6x + 5 (x − 5)(x − 1) Die Tatsache, dass die Zählerfunktionen links und rechts übereinstimmen müssen, liefert für A und B die Gleichungen A + B = 0 −A − 5B = 1 Daraus ergibt sich sofort A = 1/4, B = −1/4. Es folgt . 30 U. Stammbach: Z Beispiel Z 1 dx = 2 x − 6x + 5 Analysis, Teil A 1 1 1 dx − 4 x−5 x−1 1 = (log |x − 5| − log |x − 1|) + C 4 x − 5 1/4 = log +C . x−1 Es ist das Integral Z 3x − 1 dx x2 − x + 1 zu berechnen. In einem ersten Schritt versucht man das Problem auf eine rationale Funktion zu reduzieren, deren Zähler eine Konstante ist. Wegen (x2 − x + 1)0 = 2x − 1 erhält man Z 3x − 1 dx = 2 x −x+1 = = Z 3 2x − 23 − 13 + 13 dx 2 x2 − x + 1 ! Z 1 3 2x − 1 3 dx + 2 x2 − x + 1 x2 − x + 1 Z 3 1 1 log |x2 − x + 1| + dx . 2 2 x2 − x + 1 Für die Behandlung des verbleibenden Integrals stellt man fest, dass die Nennerfunktion keine reellen Nullstellen hat. Man versucht deshalb dieses Integral auf den Standardtyp dieser Art, R nämlich auf 1/(u2 + 1) du zurückzuführen. Dies geschieht mit Hilfe der sogenannten quadratischen Ergänzung: x2 − x + 1 = x − 1 2  2 + 1 2 2 3 3 x−  =  q  + 1 . 3 4 4 4 Macht man im Integral Z  1 4 dx = 2 x −x+1 3 Z 1 x− 21 p3 4 dx 2 +1 31 Kapitel III. Integralrechnung die Substitution 2 1 2 u= √ x− , du = √ dx , 2 3 3 so erhält man √ Z 4 3 1 2 du = √ arctan u + C . 2 3 2 u +1 3 Die Rücksubstitution liefert schliesslich Z 1 2 dx = √ arctan 2 x −x+1 3 was man leicht durch Ableiten bestätigt. 2 1 √ x− 2 3 +C , 32 7 U. Stammbach: Analysis, Teil A Flächenberechnung Der Ursprung des Begriffs des bestimmten Integrals ist zweifellos die Frage nach dem Flächeninhalt eines durch Kurven begrenzten Gebietes. Darüber hinaus haben sich im Laufe der Zeit viele weitere Anwendungen ergeben, die nichts mehr mit dem ursprünglichen Problem zu tun haben. Über solche Anwendungen werden die folgenden 6 Abschnitte handeln. In jedem Fall ist es die Riemann’sche Form der Definition des bestimmten Integrals, durch welche die Verbindung hergestellt wird. Im vorliegenden Abschnitt kehren wir zuerst noch einmal zum Problem der Flächenberechnung zurück. Ist eine Kurve K im (x, y)-Koordinatensystem gegeben so stellen wir die Frage nach dem Flächeninhalt I der Fläche unter der Kurve (siehe Figur 1). Ist K als Graph einer (stetigen) Funktion f gegeben, so ist I einfach der Wert des bestimmten Integrals I= Z b a f (x) dx . Es sei nun K durch eine Parameterdarstellung ~r : t → (x(t), y(t)) , tA ≤ t ≤ tB gegeben, wobei wir annehmen, dass die Funktionen t → x(t) , t → y(t) stetig differenzierbar sind, und dass im ganzen Intervall ẋ(t) > 0 gilt. Letztere Voraussetzung besagt, dass der Kurvenpunkt sich mit wachsendem t nach rechts bewegt, denn die Funktion t → x(t) ist monoton wachsend. Um den Flächeninhalt I zu bestimmen, approximieren wir die Fläche durch Rechtecke, welche zu einer Einteilung a = x 0 < x1 < · · · < x n = b des Intervalles [a, b] mit Zwischenpunkten ξk gehören, wobei wir die Zwischenpunkte ξk für unsere Zwecke geschickt wählen. Es sei tk für k = 0, 1, . . . , n der (eindeutig bestimmte) Parameterwert mit xk = x(tk ). Die Parameterwerte tk liefern wegen der Monotonität von t → x(t) eine Einteilung des Intervalles [tA , tB ] tA = t0 < t1 < · · · < tn = tB . In jedem Intervall [tk−1 , tk ] wählen wir mit Hilfe des Mittelwertsatzes der Differentialrechnung ein τk mit x(tk ) − x(tk−1 ) = ẋ(τk ) · (tk − tk−1 ) . 33 Kapitel III. Integralrechnung (x(t), y(t)) A B y(τ1 ) x(t0 ) x(τ1 ) y(τ2 ) x(t1 ) x(τ2 ) y(τ3 ) x(t2 ) Fig. 1 : Fläche unter der Kurve y(τ4 ) x(t3 ) x(t4 ) x(τ3 ) x(τ4 ) Natürlich gilt xk−1 = x(tk−1 ) ≤ x(τk ) ≤ x(tk ) = xk wiederum wegen der Monotonität der Funktion t → x(t). Die Werte ξk , ξk = x(τk ), k = 1, 2, . . . , n wählen wir als Zwischenpunkte für unsere Einteilung des Intervalles [a, b]. Für die Summe der Inhalte der zugehörigen Rechtecke erhalten wir dann y(τ1 )(x1 − x0 ) + y(τ2 )(x2 − x1 ) + · · · + y(τn )(xn − xn−1 ) = = y(τ1 )ẋ(τ1 )(t1 − t0 ) + y(τ2 )ẋ(τ2 )(t2 − t1 ) + · · · + y(τn )ẋ(τn )(tn − tn−1 ) . Letzteres ist aber gerade die Riemann’sche Summe für die Funktion t → y(t)ẋ(t), welche zur Einteilung tA = t0 < t1 < · · · < tn = tB des Intervalles [tA , tB ] mit Zwischenpunkten τk , k = 1, 2, . . . , n gehört. Laut Definition des bestimmten Integrals gilt somit für den gesuchten Flächeninhalt 34 U. Stammbach: I= Z tB tA Analysis, Teil A y(t) ẋ(t) dt . Diese mathematisch exakte, aber etwas langatmige Herleitung zeigt eindringlich die Nützlichkeit der Riemann’schen Definition des bestimmten Integrals. Mit etwas Erfahrung erlaubt sich der Anwender diese Formel auf heuristische Art wie folgt “herzuleiten”. Es gilt (siehe Figur 2) (x(t), y(t)) A B Fig. 2 : Fläche unter der Kurve dI y(t) x(tA ) x(t) ẋ(t)dt x(tB ) dI = y(t) dx . Mit dx = ẋ(t) dt erhält man dI = y(t) ẋ(t) dt und damit I= Z dI = Z tB tA y(t) ẋ(t) dt . Diese Art der Herleitung ist zwar kurz und einprägsam, der Unerfahrene macht aber bei solchen und ähnlichen Überlegungen gerne Fehler. Erst mit der Zeit entwickelt man ein intuitives Gefühl dafür, was für Manipulationen dieser Art erlaubt sind. 35 Kapitel III. Integralrechnung 2a Fig. 3 : Zykloide 2πa Beispiel Gesucht ist der Inhalt der Fläche unter einem Zykloidenbogen (siehe Figur 3). Die Zykloide ist gegeben durch die Parameterdarstellung t → (x(t), y(t)) = (at − a sin t, a − a cos t) , 0 ≤ t ≤ 2π . Der gesuchte Flächeninhalt I ist somit I = Z 2π 0 = a2 (a − a cos t)(a − a cos t) dt Z 2π 0 (1 − 2 cos t + cos2 t) dt = a2 (2π − 0 + π) = 3πa2 . Der Flächeninhalt ist also gerade dreimal so gross wie derjenige des Kreises, der die Zykloide erzeugt. Wird in der ursprünglichen Aufgabe die Kurve K mit wachsendem t von rechts nach links durchlaufen, d.h. gilt ẋ(t) < 0 für tA ≤ t ≤ tB , so liefert das Integral 36 U. Stammbach: I= Z tB tA Analysis, Teil A y(t) ẋ(t) dt offensichtlich den negativen Inhalt der Fläche unter der Kurve. Von dieser Bemerkung machen wir in der folgenden Anwendung Gebrauch. Oft ist man nicht am Inhalt der Fläche unter der Kurve sondern am Inhalt der Sektorfläche interessiert. In der Figur 4 liest man unmittelbar ab B Fig. 4 : Sektorfläche y(tB ) A y(tA ) x(tA ) IS = x(tB ) 1 1 x(tB ) y(tB ) − x(tA ) y(tA ) − 2 2 Z tB tA y(t) ẋ(t) dt . Nun gilt d x(t) y(t) = ẋ(t) y(t) + x(t) ẏ(t) , dt so dass wir schreiben können x(tB ) y(tB ) − x(tA ) y(tA ) = Z tB tA (ẋ(t) y(t) + x(t) ẏ(t)) dt . 37 Kapitel III. Integralrechnung Damit ergibt sich die folgende Formel für die Sektorfläche IS = 1 2 Z tB tA (x(t) ẏ(t) − ẋ(t) y(t)) dt . Eine genaue Analyse zeigt, dass dieses Integral einen positiven Wert liefert, wenn die Sektorfläche links von der Kurve liegt (wie in der Figur 4) und einen negativen Wert, wenn die Sektorfläche rechts von der Kurve liegt. Beispiel Gesucht ist die Ellipsenfläche F . Die Ellipse mit Halbachsen a und b und Mittelpunkt O ist durch die Parameterdarstellung t → (x(t), y(t)) = (a cos t, b sin t) , 0 ≤ t ≤ 2π gegeben. Die Ellipsenfläche kann als Sektorfläche angesehen werden, wenn t von 0 bis 2π variiert. Wir erhalten F = 1 2 Z 2π 0 1 (ab cos2 t + ab sin2 t) dt = ab2π = abπ . 2 Beispiel Die Parameterdarstellung t → (x(t), y(t)) = (cosh t, sinh t) beschreibt bekanntlich den rechten Ast einer Hyperbel. Gesucht ist die Sektorfläche H, die zu den Punkten mit t = 0 und t = T gehört. Wir erhalten 1 H= 2 Z 0 T 1 (cosh t − sinh t) dt = 2 2 2 Z 0 T 1 dt = 1 T . 2 Dieses Resultat ist natürlich der Grund für die Tatsache, dass die Umkehrfunktionen Arcosh und Arsinh von cosh und sinh “Area”-Funktionen genannt werden (Area = Flächeninhalt). Ist schliesslich die Kurve K durch Polarkoordinaten ρ, ϕ gegeben, so lässt sich die entsprechende Formel für den Inhalt der Sektorfläche zwischen ϕA und ϕB sehr leicht herleiten. Man geht von der Darstellung durch Polarkoordinaten einfach zur zugehörigen Parameterdarstellung über. Es sei K durch die Gleichung ρ = ρ(ϕ) gegeben. Dann ist ϕ → (x(ϕ), y(ϕ)) = (ρ(ϕ) cos ϕ, ρ(ϕ) sin ϕ) die zugehörige Parameterdarstellung mit Parameter ϕ, und man erhält für den Inhalt der Sektorfläche 38 U. Stammbach: √ − 2c √ 2c IS Analysis, Teil A Fig. 5 : Lemniskate Z = = = 1 ϕB (xẏ − ẋy) dϕ 2 ϕA Z 1 ϕB (ρ cos ϕ(ρ̇ sin ϕ + ρ cos ϕ) − (ρ̇ cos ϕ − ρ sin ϕ)ρ sin ϕ) dϕ 2 ϕA Z ϕB 1 ρ2 dϕ . 2 ϕA √ √ Beispiel Die Gleichung ρ = 2 c cos 2ϕ in Polarkoordinaten stellt eine sogenannte Lemniskate (siehe Figur 5) dar. Der Inhalt des durch die zu −π/4 ≤ ϕ ≤ π/4 gehörigen Kurve eingeschlossenen Flächenstücks ergibt sich nach obigem zu IS = 1 2 Z +π/4 −π/4 2c2 cos 2ϕ dϕ = c2 . 39 Kapitel III. Integralrechnung 8 Bogenlänge Eine Kurve K im Raum lässt sich mit Hilfe einer Parameterdarstellung ~r : t → ~r(t) = (x(t), y(t), z(t)), tA ≤ t ≤ tB beschreiben. In natürlicher Weise tritt eine solche Parameterdarstellung etwa auf, wenn die ~ = ~r(t) den Ort, Bewegung eines Massenpunktes beschrieben werden soll; dann bezeichnet OP ˙ an dem sich der Massenpunkt zur Zeit t befindet. Bekanntlich ist dann ~r(t) die (vektorielle) Geschwindigkeit des Massenpunktes zur Zeit t. Ist die Bahn des Massenpunktes bekannt, so ist es naheliegend, nach der Länge des zurückgelegten Weges zu fragen, d.h. nach der Bogenlänge der Kurve K. Damit wollen wir uns in diesem Abschnitt befassen. Wir definieren die Bogenlänge der Kurve K durch das Integral sB A = Z tB tA q (ẋ(t))2 + (ẏ(t))2 + (ż(t))2 dt = Z tB tA |~r˙ (t)| dt . Dass diese Definition vernünftig ist, zeigt die folgende heuristische Überlegung. “Im Kleinen” kann die Kurve K als Teil einer Geraden aufgefasst werden, dessen Länge sich als Diagonale in einem Quader mit den Seitenlängen dx, dy, dz leicht zu ds = q dx2 + dy 2 + dz 2 berechnet. Setzt man die Koordinatendifferenzen dx, dy, dz wie üblich den Differentialen gleich dx = ẋ(t)dt , dy = ẏ(t)dt , dz = ż(t)dt , so erhält man ds = q (ẋ(t))2 + (ẏ(t))2 + (ż(t))2 dt . Die Länge eines “endlichen” Kurvenstücks ergibt sich dann durch Integration, d.h. durch Summierung der “infinitesimalen” Anteile. Dies liefert das oben angegeben Integral. Bemerkung Wir haben hier mit Absicht nicht von einer Herleitung gesprochen. Eine genauere Analyse zeigt nämlich, dass dem Begriff der Bogenlänge einer Kurve erst mit der angegebenen 40 U. Stammbach: Analysis, Teil A Formel überhaupt einen Inhalt erhält. Um der logischen Korrektheit Genüge zu tun, muss der Mathematiker an dieser Stelle zeigen, dass die heuristisch gefundene Formel sinnvoll ist. Dazu gehört zum Beispiel die Tatsache, dass die durch diese Formel gelieferte Bogenlänge unter vernünftigen Bedingungen nicht von der gewählten Parametrisierung der Kurve abhängig ist. Auf diese Probleme wollen wir hier natürlich nicht eingehen; wir überlassen sie gerne den Mathematikern. Beispiel Gesucht ist die Länge eines Zykloidenbogens. Der Zykloidenbogen ist durch t → (x(t), y(t)) = (at − a sin t, a − a cos t) , 0 ≤ t ≤ 2π gegeben, mit tA = 0, tB = 2π. Wir erhalten ẋ(t) = a − a cos t, ẏ(t) = a sin t und damit sB A Z = 2π 0 = a = a Z 0 Z (a2 − 2a2 cos t + a2 cos2 t + a2 sin2 t)1/2 dt 2π 2π 0 Z = 2a Z = 2a (2(1 − cos t))1/2 dt q 2π 0 0 2π 4 sin2 (t/2) dt | sin(t/2)| dt sin(t/2) dt = 2a [−2 cos(t/2)]2π 0 = 2a(2 + 2) = 8a . Man stellt die überraschende Tatsache fest, dass beim Rollen eines Kreises auf einer Geraden der von einem Punkt der Kreisperipherie zurückgelegte Weg ein ganzzahliges Vielfaches des Radius des Kreises ist. Beispiel Die Astroide (siehe Figur 1) ist gegeben durch die Parameterdarstellung t → (x(t), y(t)) = (a cos3 t, a sin3 t) , 0 ≤ t ≤ 2π . Gesucht ist die Bogenlänge der Kurve. Wegen ẋ(t) = −3a cos2 t sin t, ẏ(t) = 3a sin2 t cos t und wegen der offensichtlichen Symmetrie der Kurve erhält man für die Bogenlänge 41 Kapitel III. Integralrechnung a Fig. 1 : Astroide a −a −a L = 4 Z π/2 0 = 4·3·a = q 3a cos4 t · sin2 t + sin4 t · cos2 t dt Z π/2 0 2 π/2 6a [sin t]0 q cos t sin t cos2 t + sin2 t dt = 6a . Wiederum ist überraschenderweise die Länge der Kurve ein ganzzahliges Vielfaches der in der Parameterdarstellung vorkommenden Grösse a. Ist die Kurve K in expliziter Form y = f (x) gegeben, so gehen wir wie üblich im ersten Schritt zur zugehörigen Parameterdarstellung x → (x, f (x)) über. Wir erhalten dann für die Bogenlänge zwischen den Punkten A und B sB A = Z xB xA q 1 + (f 0 (x))2 dx , wobei xA die x-Koordinate des Punktes A und xB diejenige des Punktes B bezeichnet. 42 U. Stammbach: Analysis, Teil A Beispiel Man bestimme die Länge der Kurve y = x2 zwischen den Punkten A = (−1, 1) und B = (1, 1). Nach obigem gilt sB A = Z p 1 1 + 4x2 dx = 2 −1 Z 1p 1 + 4x2 dx . 0 Für das Integral machen wir die Substitution 2x = u, 2dx = du und erhalten sB A = = = Z 2p 1 + u2 du 0 i2 p 1h Arsinh u + u u2 + 1 0 2 √ 1 Arsinh 2 + 2 5 . 2 Schliesslich behandeln wir noch den Fall, wo die Kurve K durch eine Gleichung in Polarkoordinaten gegeben ist. Ähnlich wie oben gehen wir in einem ersten Schritt zur zugehörigen Parameterdarstellung mit Parameter ϕ über. Wir erhalten nach kurzer Rechnung ~r˙ (ϕ) = (ρ̇(ϕ) cos ϕ − ρ(ϕ) sin ϕ, ρ̇(ϕ) sin ϕ + ρ(ϕ) cos ϕ) |~r˙ (ϕ)| = (ρ̇2 cos2 ϕ − 2ρ̇ρ cos ϕ sin ϕ + ρ2 sin2 ϕ + ρ̇2 sin2 ϕ + 2ρ̇ρ sin ϕ cos ϕ + ρ2 cos2 ϕ)1/2 = (ρ2 + ρ̇2 )1/2 . Damit ergibt sich Z sB A = q ϕB ρ2 + ρ̇2 dϕ . ϕA Beispiel Man berechne die Bogenlänge der logarithmischen Spirale ρ = ekϕ zwischen den Punkten A und B (siehe Figur 2). Aus der obigen Überlegung erhalten wir mit ρ̇(ϕ) = k · ekϕ sB A = = = Z ϕB p ϕA e2kϕ + k2 e2kϕ dϕ p Z p 1 + k2 1+ k2 ϕB ϕA ekϕ dϕ 1 kϕ e k ϕB ϕA 43 Kapitel III. Integralrechnung q = 1 + 1/k2 q ekϕB − ekϕA 1 + 1/k2 (ρB − ρA ) . = B Fig. 2 : Logarithmische Spirale ϕB ϕA 1 A Wiederum hat die logarithmische Spirale eine Überraschung für uns bereit: Das Resultat besagt, dass sich in Kreisringen gleicher Breite b = ρB −ρA gleichlange Kurvenstücke der logarithmischen Spirale befinden. Beispiel Wir betrachten zum Schluss dieses Abschnittes die sogenannte Klotoide; sie wird durch die Parameterdarstellung t → (x(t), y(t)), beschrieben, wobei x(t) und y(t) durch die (komplizierten) Formeln Z t a 2 x(t) = cos u du , 2 0 Z t a 2 y(t) = sin u du . 2 0 gegeben sind. (Man beachte, dass u eine Integrationsvariable ist, der Kurvenparameter heisst wie üblich t.) Wie man zeigen kann, sind die hier vorkommenden Integrale nicht elementar ausdrückbar. Wir berechnen die Bogenlänge dieser Kurve zwischen den Punkten A und B der 44 U. Stammbach: Analysis, Teil A Kurve, wobei wir für A den zum Parameterwert t = 0 gehörigen Punkt, also den Nullpunkt des Koordinatensystems wählen, und für B den zum Parameterwert T gehörigen Punkt. Wegen a 2 t 2 a 2 ẏ(t) = sin t 2 ẋ(t) = cos erhalten wir sB A = Z 0 Z = T 0 Z = T T 0 q ẋ2 + ẏ 2 dt s cos2 a 2 a 2 t + sin2 t dt 2 2 1 dt = T . Unser Parameter t ist also gleichzeitig die vom Ursprung des Koordinatensystems aus gemessene Bogenlänge der Kurve. Berechnen wir die Krümmung der Klotoide, so erhalten wir wegen a 2 t 2 a 2 at cos t 2 ẍ(t) = −at sin ÿ(t) = mit der Krümmungsformel at cos2 ẋÿ − ẍẏ k(t) = 2 = (ẋ + ẏ 2 )3/2 a 2 t2 + sin2 1 a 2 t2 = at . Unsere Klotoide hat die interessante Eigenschaft, dass die Krümmung proportional zur Bogenlänge ist. Durchläuft man die Klotoide mit konstanter Schnelligkeit, so nimmt die Krümmung, also der Steuereinschlag bei der Fahrt, proportional zur Zeit zu (oder ab): Für ein angenehmes Befahren müssten Strassenkurven aus diesem Grunde eigentlich aus Klotoidenstücken (und Kreisstücken) zusammengesetzt sein. Wir haben in diesem letzten Beispiel eine Kurve vor uns, welche durch eine Parameterdarstellung mit der Bogenlänge als Parameter gegeben ist. Für viele theoretische Überlegungen ist es am einfachsten, von einer solchen Kurvendarstellung auszugehen. Interpretiert man die Parameterdarstellung als Bewegung eines Massenpunktes, so bedeutet dies, dass die Kurve mit konstanter Schnelligkeit 1 durchlaufen wird; konsequenterweise ist dann |~r˙ (t)| ≡ 1. 45 Kapitel III. Integralrechnung 9 Volumenberechnung In diesem Abschnitt wollen wir uns mit der Volumenberechnung beschäftigen. Wir nehmen an, dass uns eine Beschreibung des Körpers im (x, y, z)-Koordinatensystem vorliegt. Ferner nehmen wir an, dass der Flächeninhalt der Schnittfigur mit einer zur (y, z)-Ebene parallelen Ebene durch die stetige Funktion x → F (x) gegeben sei. Um das Volumen des Körpers zu berechnen, wählen wir auf der x-Achse eine Einteilung a = x0 < x1 < · · · < xn−1 < xn = b mit Zwischenpunkten ξk ∈ [xk−1 , xk ] und zerlegen den Körper durch Schnitte parallel zur (y, z)Ebene an den Stellen xk , k = 0, 1, . . . , n in Scheiben. Das Volumen V des zwischen der xKoordinate a und der x-Koordinate b liegenden Teils ist dann näherungsweise durch die Riemann’sche Summe (siehe Figur 1) n X F (ξk )(xk − xk−1 ) k=1 gegeben. Der Grenzübergang über eine Folge von Einteilungen, deren Feinheit gegen Null strebt, liefert das Integral V = Z b a F (x) dx das Volumen des zwischen den x-Koordinaten a und b liegenden Teils des Körpers. Beispiel Das Volumen des Ellipsoides x2 y 2 z 2 + 2 + 2 =1 a2 b c ist gesucht. Wir schneiden den Körper mit der Ebene x = x0 . Als Schnittfigur erhalten wir y2 z2 x20 + = 1 − , b2 c2 a2 b2 y2 z2 =1. + 1 − x20 /a2 c2 1 − x20 /a2 Dies ist für −a ≤ x0 ≤ a eine Ellipse mit Halbachsen 46 U. Stammbach: Analysis, Teil A (z) Fig. 1 : Volumen F (x) ξk a xk−1 xk b q (x) q b 1 − x20 /a2 , c 1 − x20 /a2 in Richtung der y- bzw. z-Achse. Der Flächeninhalt der ellipsenförmigen Schnittfigur ist nach einem früheren Resultat F (x0 ) = πbc 1 − x20 /a2 . Das Volumen des Ellipsoides berechnet sich dann wie folgt: V =2 Z a 0 x2 πbc 1 − 2 a ! " x3 dx = 2πbc x − 2 3a #a 0 4 = πabc . 3 Bemerkung Wie man sich erinnert, wurde der Flächeninhalt einer Ellipse seinerzeit ebenfalls mit Hilfe der Integralrechnung hergeleitet. Dies ist typisch für die Volumenberechnung: der Flächeninhalt der Schnittfigur ist im allgemeinen wiederum durch ein Integral gegeben; man hat eigentlich ein mehrfaches Integral vor sich. Beispiel Gegeben ist ein auf der (x, y)-Ebene stehender gerader Kreiszylinder mit Grundkreis x2 + y 2 = r 2 . Er werde durch die Ebene 47 Kapitel III. Integralrechnung z= h (x + b) , 0 ≤ b ≤ r r+b abgeschnitten (siehe Figur 2). Was ist das Volumen des zwischen der (x, y)-Ebene und der Schnittebene liegenden Stückes (Zylinderhuf)? (z) Fig. 2 : Zylinderhuf h G(x) b r (x) Wir schneiden den Körper durch eine zur (y, z)-Ebene parallelen Ebene. Die Schnittfigur ist ein Rechteck, es hat den Flächeninhalt p G(x) = 2 r2 − x2 h r+b (x + b) . Das Volumen ergibt sich dann wie folgt V Z = = = r −b G(x) dx Z r p 2h (x + b) r 2 − x2 dx r + b −b Z r Z r p p h 2hb 2x r 2 − x2 dx + r 2 − x2 dx . r + b −b r + b −b 48 U. Stammbach: Analysis, Teil A Da der Integrand im ersten Integral ungerade ist, darf man die untere Grenze −b durch +b ersetzen. Die Substitutionen r 2 − x2 = u, −2xdx = du im ersten und x = ru, dx = rdu im zweiten Integral liefern dann V = − = h r+b Z 0 r 2 −b2 u1/2 du + 2hb 2 r r+b  Z 1 p 1 − u2 du −b/r 2 h −b hbr 2  π (r 2 − b2 )3/2 + − arcsin 3r+b r+b 2 r b + r α s  b2 1 − 2 . r Fig. 3 : Zum Winkel α r b Der durch α = π/2 − arcsin(−b/r) = π/2 + arcsin(b/r) gegebene Winkel hat eine offensichtliche geometrische Bedeutung (siehe Figur 3). Mit dieser Bezeichnung erhalten wir V = p r2 − b2 h r+b 2 2 1 2 hbr 2 r + b + α. 3 3 r+b 49 Kapitel III. Integralrechnung 10 Oberflächenberechnung Wir beschäftigen uns in diesem Abschnitt mit der Berechnung des Oberflächeninhaltes eines Körpers, wobei wir uns auf den Fall eines Rotationskörpers beschränken. Der allgemeine Fall führt auf sogenannte mehrfache Integrale; darauf werden wir im Laufe des zweiten Semesters zurückkommen. Gegeben ist also ein Rotationskörper; er entstehe durch Rotation des Kurvenstücks t → (x(t), y(t)) , tA ≤ t ≤ tB um die x-Achse; dabei setzen wir die Funktionen t → x(t) und t → y(t) stetig differenzierbar voraus (siehe Figur 1). Wir stellen die Frage nach dem Inhalt der von der Kurve K bei der Rotation überstrichenen Fläche. Wir nennen dies kurz den Oberflächeinhalt (eigentlich Mantelflächeninhalt) des Rotationskörpers. Dabei gehen wir das Problem naiv an und führen die folgenden Plausibilitätsbetrachtungen durch. Wie bei der Volumenberechnung zerschneiden wir den Körper in “dünne” Scheiben. Jede dieser Scheiben ist (approximativ) ein Kreiskegelstumpf. Um dessen Mantelfläche zu bestimmen, rollen wir den Kegel in die Ebene ab. Die Mantelfläche des Kegelstumpfs entspricht dann einem Kreisringsektor der (“schmalen”) Breite (siehe Figur 2) ds = q ẋ(t)2 + ẏ(t)2 dt . Sein Flächeninhalt ist (wiederum approximativ) gegeben durch q dO = 2πy(t) ẋ(t)2 + ẏ(t)2 dt . Nach diesen Plausibilitätsbetrachtungen “muss” der Oberflächeninhalt des Rotationskörpers durch O = 2π Z tB tA y(t) q ẋ(t)2 + ẏ(t)2 dt gegeben sein. Wie schon bei unserer Behandlung der Bogenlänge einer Kurve haben wir uns hier bei der Oberflächenberechnung mit heuristischen Argumenten begnügt. Vom mathematischen Standpunkt aus ist die Sachlage einiges komplizierter, als wir dies hier erscheinen lassen. Eigentlich muss nämlich der neue Begriff, also der Begriff des Oberflächeninhaltes eines Körpers an dieser 50 U. Stammbach: Analysis, Teil A B ds Fig. 1 : Oberfläche y(t) A x(t) dx a b ds Fig. 2 : Mantelfläche des Kegelstumpfes 2πy(t) 51 Kapitel III. Integralrechnung Stelle definiert werden. Dies kann für Rotationskörper durch die obige Formel geschehen. Allerdings muss der Mathematiker dann eine ganze Anzahl wichtiger Punkte abklären; z.B. muss er zeigen, dass der durch die Formel für die Oberfläche gegebene Wert nicht von der gewählten Parameterisierung der Kurve K abhängig ist. Wir gehen in dieser Vorlesung natürlich auf diese Dinge nicht näher ein. Statt dessen betrachten wir die folgenden konkreten Beispiele. Beispiel Gesucht ist der Oberflächeninhalt eines Torus. Wir stellen uns den Torus als Rotationskörper vor, indem wir den Kreis K mit Radius r und Mittelpunkt M = (0, R) um die x-Achse rotieren lassen (siehe Figur 3). Der Kreis K ist offenbar gegeben durch t → (x(t), y(t)) = (r cos t, R + r sin t) , 0 ≤ t ≤ 2π . (y) r (0, R) t (x) Fig. 3 : Torus Wegen ẋ(t) = −r sin t , ẏ(t) = r cos t erhalten wir für den Oberflächeninhalt des Torus O = 2π Z 0 2π (R + r sin t) q r 2 sin2 t + r 2 cos2 t dt = 2π2πRr = 4π 2 Rr . 52 U. Stammbach: Analysis, Teil A Beispiel Wir betrachten den Kreis K mit Radius r um den Ursprung und fragen nach dem Oberflächeninhalt der Kugelzone, die durch Rotation um die x-Achse des zwischen den x-Koordinaten a und b befindlichen Teils K 0 des Kreises K entsteht. (y) K0 Fig. 4 : Kugelzone (x) a b Der Kreis K wird durch die Gleichung x2 + y 2 = r 2 beschrieben. Daraus erhalten wir leicht eine Parameterdarstellung des Kurvenstücks K 0 (mit Parameter t = x) t → (x(t), y(t)) = (t, p r 2 − t2 ) , a ≤ t ≤ b . Der Oberflächeninhalt des zugehörigen Rotationskörpers, also der Kugelzone ergibt sich dann wegen ẋ(t) = 1 , p ẏ(t) = −t/ r 2 − t2 zu O = 2π Z bp a r 2 − t2 q 1 + t2 /(r 2 − t2 ) dt = 2π Z b a r dt = 2πr(b − a) . Kapitel III. Integralrechnung 53 Das Resultat verdient Beachtung: Der Oberflächeninhalt der Kugelzone zwischen den x-Koordinaten a und b ist gleich der Mantelfäche des die Kugel umschreibenden Zylinders zwischen den x-Koordinaten a und b. Projiziert man folglich die (Erd-)Kugel von einem Durchmesser aus auf den umschreibenden Zylinder und rollt man anschliessend den Zylinder in die Ebene ab, so erhält man ein flächentreues (Karten-)Bild der (Erd-)Kugeloberfläche. Diese Tatsache wurde 1772 von J. H. Lambert (1728 - 1777) angegeben. 54 11 U. Stammbach: Analysis, Teil A Schwerpunkt, Flächenmittelpunkt In diesem Abschnitt beschäftigen wir uns mit der Berechnung des Schwerpunktes eines mechanischen Systems. Wir fassen dabei den Schwerpunkt als Kraftmittelpunkt auf. Zuerst betrachten wir in Richtung der y-Achse wirkende Kräfte K1 , K2 , . . . , Kn , die in den Punkten x1 , x2 , . . . , xn der x-Achse angreifen. Der Kraftmittelpunkt xs dieses Systems genügt dann der Gleichung (x1 − xs )K1 + (x2 − xs )K2 + · · · + (xn − xs )Kn = 0 , so dass sich für xs die Formel xs = 1 (x1 K1 + x2 K2 + · · · + xn Kn ) K1 + K2 + · · · + Kn ergibt. Wenn die Kräfte nicht diskret, sondern kontinuierlich verteilt sind, wenn also die Kraftdichte an der Stelle x durch die Funktion x → G(x), x ∈ [a, b] gegeben ist, so genügt der Kraftmittelpunkt xs in analoger Weise der Gleichung xs Z b a G(x)dx = Z b a x G(x) dx . Man beachte, dass Z b a G(x) dx nichts anderes als die Totalkraft ist. Wir wenden diese Überlegungen zuerst auf die Berechnung des Flächenmittelpunktes eines Bereiches B der (x, y)-Ebene an. Darunter verstehen wir den Kraftmittelpunkt der Gravitationskräfte, die auf den homogen mit Masse der Dichte 1 belegten Bereich B wirken (Schwerpunkt). Wirkt die Gravitationskraft in Richtung der y-Achse, so ist deren Kraftdichte G(x) an der Stelle x natürlich einfach die Ausdehnung in y-Richtung des Bereiches B an der Stelle x. Wirkt die Gravitationskraft in Richtung der x-Achse, so ist die Kraftdichte H(y) an der Stelle y die Ausdehnung in x-Richtung des Bereiches B an der Stelle y (siehe Figur 1). Der Punkt (xs , ys ) mit 55 Kapitel III. Integralrechnung (y) d G(x) y Fig. 1 : Zur Berechnung des Schwerpunktes B H(y) c (x) a x b xs ys Z Z b a d c Z G(x) dx = b a d Z H(y) dy = c x G(x) dx y H(y) dy ist dann der Flächenmittelpunkt des Bereiches B. Beispiel Gesucht ist der Flächenmittelpunkt des Viertelkreises im ersten Quadranten mit Radius R (siehe Figur 2). Aus Symmetriegründen gilt natürlich xs = ys . Für xs erhalten wird die Gleichung xs · r 2π 4 Z = 0 r x Z p r 2 − x2 dx p 1 r (−2x) r 2 − x2 dx 2 0 ir 12h 2 = − (r − x2 )3/2 0 23 1 3 = r . 3 = − 56 U. Stammbach: Analysis, Teil A (y) Fig. 2 : Schwerpunkt des Viertelkreises r S √ r2 − x2 (x) x Daraus ergibt sich xs = 4 r. 3π Der Schwerpunkt eines räumlichen Bereiches berechnet sich auf ganz analoge Weise. Auch dazu ein Beispiel. Beispiel Gesucht ist der Schwerpunkt einer homogenen Halbkugel (siehe Figur 3). Offenbar dürfen wir voraussetzen, dass die Dichte 1 ist. Wir betrachten die Halbkugel als Rotationskörper, der durch Rotation eines Viertelkreises um die x-Achse entsteht. Der Schwerpunkt (xs , ys , zs ) liegt aus Symmetriegründen natürlich auf der x-Achse; damit gilt ys = zs = 0. Für xs haben wir die Gleichung xs Z 0 r G(x)dx = Z 0 r x G(x) dx , wobei G(x) die Kraftdichte der Gravitation in Richtung der z-Achse bezeichnet. Offensichtlich gilt 57 Kapitel III. Integralrechnung Fig. 3 : Schwerpunkt einer Halbkugel G(x) = π(r 2 − x2 ) . Ferner lässt sich die totale Kraft, das Gewicht der Halbkugel direkt angeben: Z r 0 2 G(x)dx = πr 3 . 3 Damit erhält man 2 xs · πr 3 = π 3 Z 0 r " x2 r 2 x 4 x(r − x ) dx = π − 2 4 2 2 #r =π 0 r4 r4 − 2 4 ! , und es ergibt sich xs = 3 r. 8 Formal das gleiche Integral wie bei der Schwerpunktberechnung tritt auch in ganz anderem Zusammenhang auf, z.B. in der Wahrscheinlichkeitsrechnung beim Mittelwert einer Wahrscheinlichkeitsverteilung. 58 12 U. Stammbach: Analysis, Teil A Trägheitsmoment Eine weitere physikalisch-mechanische Anwendung des Integrals betrifft das sogenannte Trägheitsmoment. Es tritt etwa bei der Berechnung der kinetischen Energie eines rotierenden starren Systems auf. Derselben mathematischen Bildung begegnet man aber in vielen anderen Zusammenhängen ebenfalls, in der Mechanik bei der Behandlung von Torsions- und Biegungsproblemen, in der Wahrscheinlichkeitsrechnung beim Begriff der Varianz, etc. Wie im Abschnitt über die Schwerpunktsberechnung betrachten wir zuerst ein diskretes System. Es bestehe aus Massenpunkten der Masse m1 , m2 , . . . , mn , die sich in den Punkten (x1 , y1 , z1 ), (x2 , y2 , z2 ), . . . , (xn , yn , zn ) befinden. Wir lassen dieses System mit der Winkelgeschwindigkeit ω um die z-Achse rotieren, und fragen nach der kinetischen Energie T . Da die Masse mi bei dieser Rotation die Geschwindigkeit (x2i + yi2 )1/2 ω besitzt, ist T gegeben durch T = 1 m1 (x21 + y12 ) + m2 (x22 + y22 ) + · · · + mn (x2n + yn2 ) ω 2 . 2 Definitionsgemäss heisst die hier auf natürliche Art auftretende Grösse Θz = m1 (x21 + y12 ) + m2 (x22 + y22 ) + · · · + mn (x2n + yn2 ) das Trägheitsmoment des Systems um die z-Achse. Auf analoge Weise sind das Trägheitsmoment Θx um die x-Achse Θx = m1 (y12 + z12 ) + m2 (y22 + z22 ) + · · · + mn (yn2 + zn2 ) und das Trägheitsmoment Θy um die y-Achse Θy = m1 (x21 + z12 ) + m2 (x22 + z22 ) + · · · + mn (x2n + zn2 ) definiert. Wir entnehmen diesen Überlegungen die Tatsache, dass das Trägheitsmoment eines mechanischen Systems um die Achse a definiert ist als Summe der Produkte d2 · md , wo md die Masse des Systems bezeichnet, welches sich im Abstand d von der Achse a befindet. Diese Aussage 59 Kapitel III. Integralrechnung überträgt sich vom diskreten auf den kontinuierlichen Fall. Wir betrachten dazu wie üblich einige konkrete Beispiele. Beispiel Es sei ein zwischen den x-Werten a und b, a ≤ b liegender Bereich B in der (x, y)-Ebene gegeben, der homogen mit Masse der Dichte ρ belegt ist. Wir fragen nach dem Trägheitsmoment Θy dieses Systems bezüglich der y-Achse. (Vergleiche Figur 1, p. 55.) Der Abstand von der y-Achse ist gegeben durch d = x, und die in diesem Abstand konzentrierte Masse ist ρG(x) dx, wo G(x) die Ausdehnung in y-Richtung des Bereichs an der Stelle x ist. Das Trägheitsmoment Θy ist folglich gegeben durch das Integral Θy = ρ Z b a x2 G(x) dx , und die kinetische Energie bei der Rotation mit Winkelgeschwindigkeit ω um die y-Achse ist Ty = 1 Θy ω 2 . 2 Auf ganz analoge Weise erhält man das Trägheitsmoment Θx des Bereichs B bezüglich der xAchse. Es liege B zwischen den y-Werten c und d, c ≤ d, und es bezeichne H(y) die Ausdehnung in x-Richtung des Bereichs B an der Stelle y. Dann gilt Θx = ρ Z d c y 2 H(y) dy . (Für ρ = 1 spricht man auch von den Flächenträgheitsmomenten des Bereichs B bezüglich der x- und der y-Achse und bezeichnet sie mit Jx und Jy .) Beispiel Gesucht ist das (Flächen-)Trägheitsmoment eines Kreises mit Radius r um einen Durchmesser (siehe Figur 1). Offensichtlich ist G(x) = 2 p r 2 − x2 , so dass sich für das Flächenträgheitsmoment Jy um die y-Achse Z Jy = 2 r 0 p 2x2 r 2 − x2 dx ergibt. Die Substitution x = r sin t, dx = r cos t dt liefert dann Jy = 4 Z π/2 0 = 4r 4 Z 0 r 2 sin2 t r cos t r cos t dt π/2 (sin2 t − sin4 t) dt 60 U. Stammbach: Analysis, Teil A (y) r √ r2 − x2 (x) Fig. 1 : Trägheitsmoment eines Kreises um einen Durchmesser x = 4r = 4 π1 π13 − 22 224 π 4 r . 4 Beispiel Gesucht ist das Trägheitsmoment eines homogenen Vollzylinders (Dichte ρ) um seine Achse. Wir betrachten den auf der (x, y)-Ebene stehenden Kreiszylinder mit Radius r und Höhe h. Seine Achse falle mit der z-Achse zusammen. Im Abstand x von der z-Achse befindet sich die Masse dm = ρ (2πx) h dx . Damit erhalten wir für das Trägheitsmoment Θz Θz = ρ Z 0 r x2 (2πx) h dx " x4 = 2πρh 4 1 = πρhr 4 . 2 #r 0 61 Kapitel III. Integralrechnung Aus diesem Resultat ergibt sich ohne Schwierigkeit auch das Trägheitsmoment Θ einer Kreisscheibe um eine senkrecht dazu stehende Achse durch den Mittelpunkt. Ist die (Flächen-)Dichte gleich 1, so erhält man dafür 1 Θ = πr 4 . 2 Man nennt dies auch das polare Flächenträgheitmoment J0 der Kreisscheibe. Man vergleiche an dieser Stelle die Werte der Flächenträgheitsmomente Jx , Jy , J0 der Kreisscheibe. Beispiel Gesucht ist das Trägheitsmoment Θx des von dem Graphen von x → f (x), x ∈ [a, b] bei der Rotation um die x-Achse erzeugten (homogenen) Rotationskörpers bezüglich seiner Achse (siehe Figur 2). y = f (x) f (x) dx a x b Fig. 2 : Trägheitsmoment eines Rotationskörpers um seine Achse Wir gehen hier ähnlich vor wie bei der Volumen- und Oberflächenberechnung von derartigen Rotationskörpern und zerschneiden diesen in “dünne” Scheiben der Dicke dx. Jede solche Scheibe kann dann (approximativ) als Vollzylinder mit Radius f (x) und Höhe dx angesehen werden, so dass ihr Trägheitsmoment dΘx nach dem vorhergehenden Beispiel durch 1 dΘx = πρ dx (f (x))4 2 gegeben ist. Das Trägheitsmoment des ganzen Körpers ergibt sich daraus durch Integration 62 U. Stammbach: Θx = 1 πρ 2 Z b a Analysis, Teil A (f (x))4 dx . Beispiel Gesucht ist das Trägheitsmoment einer homogenen Vollkugel mit Radius R um einen Durchmesser (siehe Figur 3). Fig. 3 : Vollkugel Wir berechnen das Trägheitsmoment Θx der homogenen Vollkugel mit Mittelpunkt im Ursprung und Radius R, wobei wir diese als Rotationskörper bezüglich der x-Achse ansehen, der zur Funktion x → f (x) = p R2 − x2 , x ∈ [−R, +R] gehört. Wir erhalten nach dem obigen Beispiel Θx = 1 πρ 2 = πρ Z Z 0 +R −R R (R2 − x2 )2 dx (R4 − 2R2 x2 + x4 ) dx 2 1 = πρ R4 x − R2 x3 + x5 3 5 R 0 63 Kapitel III. Integralrechnung = πρR5 1 − = 2 1 + 3 5 8 πρR5 . 15 Beispiel Gesucht ist das Trägheitsmoment eines homogenen Torus (Dichte ρ) um seine Achse (siehe Figur 4). Fig. 4 : Torus Wir betrachten den Torus als Rotationskörper, der von einem Kreis mit Radius r und Mittelpunkt (R, 0, 0) bei der Rotation um die z-Achse erzeugt wird und gehen ähnlich vor wie bei der Berechnung des Trägheitsmomentes des Kreiszylinders. Die Masse, die den Abstand x von der Rotationsachse besitzt, ist offenbar gegeben durch (siehe Figur 5) q dm = 2πρx 2 r 2 − (x − R)2 dx , so dass der davon resultierende Anteil dΘz an das Trägheitsmoment sich zu q dΘz = 2πρx3 2 r 2 − (x − R)2 dx ergibt. Integration liefert dann Θz 64 U. Stammbach: Analysis, Teil A (z) r (R, 0, 0) Fig. 5 : Trägheitsmoment eines Torus um seine Achse (x) x Z Θz = 4πρ R+r R−r q x3 r 2 − (x − R)2 dx . Wir lösen dieses Integral mit Hilfe der Substitution x − R = r sin t, dx = r cos t dt und erhalten Z Θz = 4πρ = 4πρr π/2 (R + r sin t)3 r cos t r cos t dt −π/2 Z π/2 2 = 4πρr 2 −π/2 Z π/2 −π/2 (R3 + 3R2 r sin t + 3Rr 2 sin2 t + r 3 sin3 t)(1 − sin2 t) dt (R3 + 3Rr 2 sin2 t − R3 sin2 t − 3Rr 2 sin4 t) dt . Dabei haben wir im letzten Schritt benützt, dass das Integral über eine ungerade Funktion Null ist, wenn das Integrationsintervall symmetrisch zum Nullpunkt liegt. Die Integration liefert nun mit den in Abschnitt 6 hergeleiteten Formeln Θz = 4πρr 2 2π 3π 2π 3 R π + 3Rr − R − 3Rr 2 2 24 3 2 = 2π ρr 2 3 R − Rr 2 4 3 . Das Trägheitsmoment oder die kinetische Energie eines rotierenden starren Körpers, wie auch schon die Integrale, die bei der Schwerpunktberechnung aufgetreten sind, sind eigentlich Beispiele 65 Kapitel III. Integralrechnung für einen allgemeineren Begriff des Integrals. Wir erklären dies an dieser Stelle kurz am Beispiel der kinetischen Energie, werden aber gegen Ende des Semesters auf diesen Punkt in voller Allgemeinheit eingehend zurückkommen. Der Einfachheit halber betrachten wir einen (dreidimensionalen) starren Körper B mit homogener Massenverteilung (Dichte ρ konstant). Rotiert dieser Körper um die Achse a mit der Winkelgeschwindigkeit ω, so trägt das “Volumenelement dV ” zur kinetischen Energie die Grösse 1 1 dT = ρdV (lω)2 = ρω 2 l2 dV 2 2 bei, wobei l den Abstand des Volumenelementes dV von der Rotationsachse bezeichnet. “Summation” über alle Volumenelemente von B und Grenzübergang über eine Folge von immer feiner werdenden Unterteilungen des Bereiches B liefert dann das sogenannte Volumenintegral T = ZZZ B 1 1 ρ ω 2 l2 dV = ρ ω 2 2 2 ZZZ B l2 dV . Konsequenterweise ist das Trägheitsmoment als Volumenintegral Θ=ρ ZZZ B l2 dV gegeben. Zur Definition des Volumenintegrals geht man also ganz ähnlich vor wie bei der Definition des gewöhnlichen Riemann’schen Integrals (siehe Abschnitt 1). Es sei ein räumlicher Bereich B und eine darauf definierte reellwertige Funktion f : (x, y, z) → f (x, y, z) , D(f ) = B gegeben. Um zum Integral ZZZ B f (x, y, z) dV zu gelangen führt man die folgenden Schritte durch: (a) Teile B in n kleine Teile ∆Bi mit Volumen ∆Vi ein , i = 1, 2, . . . , n. (b) Wähle in jedem ∆Bi einen Punkt (xi , yi , zi ). Die Feinheit der Einteilung ist definiert als Durchmesser der kleinsten Kugel, in der jedes einzelne der ∆Bi Platz hat. (c) Bilde die Riemann’sche Summe f (x1 , y1 , z1 )∆V1 + f (x2 , y2 , z2 )∆V2 + · · · + f (xn , yn , zn )∆Vn . 66 U. Stammbach: Analysis, Teil A (d) Definiere das Integral ZZZ B f (x, y, z) dV = lim (f (x1 , y1 , z1 )∆V1 + f (x2 , y2 , z2 )∆V2 + · · · + f (xn , yn , zn )∆Vn ) als Limes der Riemann’schen Summe, wobei für den Grenzübergang eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null strebt. Wie beim ursprünglichen Riemann’schen Integral zeigt man, dass der Grenzwert im Schritt (d) nicht von der Wahl der Punkte (xi , yi , zi ) und auch nicht von der Wahl der Folge der Einteilungen abhängt, falls der Integrand f eine stetige Funktion ist. - Im Beispiel des Trägheitsmomentes ZZZ B l2 dV ist die Funktion f durch l2 gegeben, d.h. der Funktionswert f (x, y, z) ist das Quadrat des Abstandes des Punktes (x, y, z) von der Achse a. 67 Kapitel III. Integralrechnung 13 Uneigentliche Integrale Das Symbol Z b a f (x)dx haben wir im Abschnitt 1 unter zwei Voraussetzungen definiert, nämlich: (a) das Intervall [a, b] ist endlich; (b) der Integrand x → f (x) ist in [a, b] stetig. Beispiele zeigen, dass das übliche Vorgehen bei der Berechnung bestimmter Integrale auf falsche Resultate führen kann, wenn man etwa von der zweiten Voraussetzung abgeht. Hier wollen wir versuchen, die Voraussetzungen abzuschwächen, indem wir den Begriff des bestimmten Integrals sorgfältig erweitern. Wir wenden uns zuerst den sogenannten uneigentlichen Integralen 2. Gattung zu (die Terminologie ist historisch bedingt und leider wiederum recht unglücklich). In solchen Integralen ist zwar der Integrand stetig, aber das Integrationsintervall unendlich, etwa [a, ∞). Für ein Integral dieser Art definieren wir Z ∞ a f (x)dx = lim Z ξ ξ→∞ a f (x)dx . Das uneigentliche Integral existiert (konvergiert), wenn der Limes auf der rechten Seite existiert; der Wert des Integrals ist in diesem Fall gleich dem Wert des Limes. Analog geht man vor, wenn das Integrationsintervall von der Form (∞, b] ist. Beispiel (siehe Figur 1) Z 0 ∞ 1 dx = lim ξ→∞ 1 + x2 Beispiel Z ξ 0 1 dx = lim [arctan x]ξ0 = lim (arctan ξ − arctan 0) = π/2 2 ξ→∞ ξ→∞ 1+x (siehe Figur 2) Z 0 ∞ e−x dx = lim Z ξ→∞ 0 ξ e−x dx = lim −e−ξ + e−0 = 1 ξ→∞ 68 U. Stammbach: y= Analysis, Teil A 1 1 + x2 Fig. 1 : Die Funktion x→ y = e−x 1 1 + x2 Fig. 2 : Die Funktion x → e−x Kapitel III. Integralrechnung 69 Beispiel ∞ ξ sin x dx = lim ξ→∞ 0 0 sin x dx = lim (− cos ξ + cos 0) existiert nicht! ξ→∞ Beispiel Uneigentliche Integrale 2. Gattung treten in Anwendung öfter auf. Wir berechnen die Fluchtgeschwindigkeit aus dem Gravitationsfeld einer homogenen Kugel. Die Gravitationskraft einer homogenen Kugel der Masse M auf einen Massenpunkt der Masse m im Abstand r vom Mittelpunkt (und ausserhalb) der Kugel ist gegeben durch M ·m , r2 K(r) = −k wo k die Gravitationskonstante ist. Für die Fluchtgeschwindigkeit v eines Massenpunktes im Abstand R vom Mittelpunkt der Kugel muss die Gleichung 1 mv 2 = 2 ∞ k R mM dr r2 (Gleichsetzung der kinetischen und der potentiellen Energie) erfüllt sein. Daraus folgt 1 2 v = kM 2 ∞ 1 R r2 dr = kM lim − ξ→∞ 1 r ξ = kM R 1 , R also v= 2kM R 1/2 . Im Folgenden wollen wir die Diskussion ganz auf den Fall von positiven, monoton fallenden Funktionen beschränken. Ist f eine solche Funktion, so ergibt sich aus der Definition sofort, dass das uneigentlichen Integral ∞ f (x)dx a nur existieren kann, wenn f (x) für x → ∞ gegen Null strebt. Diese Bedingung ist aber nicht hinreichend, wie das folgende Beispiel zeigt! Beispiel (siehe Figur 3) ∞ 1 1 x dx = lim ξ 1 ξ→∞ 1 x dx = lim (log ξ − log 1) = lim log ξ existiert nicht! ξ→∞ ξ→∞ 70 U. Stammbach: Analysis, Teil A 4 3 Fig. 3 : Die Funktion 2 x → 1/x 1 -1 1 2 3 4 -1 4 3 Fig. 4 : Die Funktion 2 x → 1/x2 1 -1 1 -1 2 3 4 71 Kapitel III. Integralrechnung Beispiel (siehe Figur 4) Es sei 0 < k < ∞, k 6= 1. Z 1 ∞ 1 dx = lim ξ→∞ xk Z ξ 1 1 dx = lim k ξ→∞ x 1−k 1 1 ξ k−1 −1 . Dieser Limes existiert für k > 1, er existiert nicht für 0 < k < 1. Begegnet man im Laufe einer Rechnung einem uneigentlichen Integral, so muss man sich als erstes über dessen Existenz Klarheit verschaffen. Existiert das Integral nämlich nicht, so handelt es sich um ein leeres Symbol, und ein Weiterrechnen kann zu falschen Resultaten führen. Der Mathematiker kennt eine ganze Anzahl von sogenannten Vergleichskriterien, die einem die Untersuchung von uneigentlichen Integralen erleichtern. Wir wollen auf diese Kriterien hier nicht eingehen, aber an einem Beispiel illustrieren, wie Vergleiche des Integranden mit gut bekannten Funktionen in diesem Zusammenhang nützlich sind. Beispiel Wir fragen nach der Existenz bzw. Nichtexistenz des uneigentlichen Integrals (siehe Figur 5) Z ∞ 1 2 e−x dx . Ausgehend nur von der Definition des uneigentlichen Integrals kann dieses nicht auf Existenz 2 untersucht werden, weil die Stammfunktion von x → e−x nicht elementar ausdrückbar ist. Wir müssen also auf andere Weise vorgehen. Die Frage - geometrisch interpretiert - lautet, ob die 2 Fläche zwischen 1 und ∞ unter dem Graphen von x → e−x endlich oder unendlich ist. Zu diesem Zweck vergleichen wir diese Funktion mit x → e−x . Offensichtlich gilt für x ≥ 1 die Ungleichung 2 0 < e−x ≤ e−x . Daraus folgt für jedes ξ ≥ 1 0≤ Z ξ 1 2 e−x dx ≤ Z ξ 1 e−x dx = −e−ξ + e−1 < e−1 . Nun ist aber Z 1 ξ 2 e−x dx in ξ monoton wachsend. Da es durch 1/e beschränkt ist, muss der Limes Z lim ξ→∞ 1 ξ 2 e−x dx 72 U. Stammbach: y = e−x Analysis, Teil A 2 Fig. 5 : Die Funktionen x → e−x 2 x → e−x y = e−x existieren. Unser uneigentliches Integral existiert deshalb. Dank dem Vergleich des Integranden mit einer einfacheren Funktion ist es uns gelungen, dies nachzuweisen, obschon die Stammfunktion nicht elementar ausdrückbar ist. Wir bemerken noch, dass wegen Z 0 ∞ 2 e−x dx = Z 1 0 2 e−x dx + Z 1 ∞ 2 e−x dx auch das Integral Z 0 ∞ 2 e−x dx existiert. Dessen Wert werden wir später explizit berechnen. Dieses Integral spielt in der Wahrscheinlichkeitstheorie eine zentrale Rolle. Wir wenden uns jetzt den uneigentlichen Integralen 1. Gattung zu. Bei diesen ist das Integrationsintervall [a, b] endlich, aber der Integrand ist nur auf dem einseitig offenen Intervall (a, b] (oder [a, b)) stetig. Wir definieren, ganz analog zum Vorgehen im obigen Fall, Z b a f (x)dx = lim Z ξ→a+ ξ b f (x)dx . 73 Kapitel III. Integralrechnung Beispiel Z 1 0 Beispiel 1 dx = lim x ξ→0+ Z ξ 1 1 dx = lim (log 1 − log ξ) existiert nicht! x ξ→0+ Es sei 0 < k, k 6= 1 und a < b. Fig. 6 : Die Funktion y= 1 (x − 1)1/2 b a 1 (x − 1)1/2 b 1 Z x→ 1 dx = lim (x − a)k ξ−a+ Z b ξ 1 1 1 1 dx = − lim k k−1 + (x − a) 1 − k ξ−a (b − a) (ξ − a)k−1 . Dieser Limes, und demzufolge das Integral, existiert für 0 < k < 1; er existiert nicht für 1 < k. Beispiel Z 0 1 log x dx = lim+ ξ→0 Z ξ 1 log x dx = lim+ [x(log x − 1)]1ξ = lim+ (−1 − ξ log ξ + ξ) = −1 . ξ→0 ξ→0 Teil B Kapitel IV. Funktionen von mehreren Variablen Differentialrechnung Kapitel V. Funktionen von mehreren Variablen Integralrechnung Kapitel VI. Vektoranalysis Ich behaupte sogar, dass in jeder besonderen Naturlehre nur soviel eigentliche Wissenschaft angetroffen werden könne, als darin Mathematik anzutreffen ist. Immanuel Kant (1724 – 1804) Inhaltsverzeichnis, Teil B Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3 Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . . 18 4 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6 Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 7 Funktionen von drei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 8 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Kapitel V. Funktionen von mehreren Variablen, Integralrechnung 1 Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . . 12 3 Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . . 30 5 Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Kapitel VI. Vektoranalysis 1 Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Differentialoperatoren der Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . 11 3 Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4 Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5 Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6 Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 9 Eine Anwendung des Satzes von Stokes . . . . . . . . . . . . . . . . . . . . . . . 65 10 Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel IV. Funktionen von mehreren Variablen Differentialrechnung Calculation is the way to the truth. J. Frank Adams (1930-1989), Professor in Cambridge, berühmter Mathematiker im Gebiet der algebraischen Topologie 1 0.5 2 0 1 -0.5 -1 -2 0 -1 0 -1 1 2 -2 Inhaltsverzeichnis 1 Funktionen von zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3 Der Satz von Schwarz, die Integrabilitätsbedingung . . . . . . . . . . . . . . . . . 18 4 Linearisieren, Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6 Verallgemeinerte Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 7 Funktionen von drei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 8 Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 3 Funktionen von zwei Variablen Wir betrachten in diesem Abschnitt Funktionen f , die auf einem Teilbereich A der Ebene R × R definiert sind und Werte in R annehmen f : (x, y) → f (x, y), D(f ) = A ∈ R × R . Man nennt dann f eine Funktion der zwei Variablen x und y (siehe Figur 1). Wir erinnern daran, dass A Definitionsbereich D(f ) von f und dass die Menge der reellen Zahlen, die unter f als Werte auftreten, Wertebereich W (f ) von f heisst. f (x, y) 0 (y) R Fig. 1 : Funktion von zwei Variablen R ×R f A (x, y) (x) Bereits früher haben wir gesehen, wo Funktionen mehrerer Variablen auf natürliche Weise auftreten. Im vorliegenden Kapitel geht es im wesentlichen darum, die Methoden der Differentialrechnung auf solche Funktionen anzuwenden. Beispiel Sind reelle Zahlen a, b, c gegeben, so heisst die Funktion 4 U. Stammbach: Analysis, Teil B f : (x, y) → f (x, y) = ax + by + c, D(f ) = R × R linear. Für (a, b) 6= (0, 0) besteht der Wertebereich W (f ) offenbar aus allen reellen Zahlen. Beispiel Die Funktion g : (x, y) → g(x, y) = q 1 − (x2 + y 2 ) besitzt als (grösstmöglichen) Definitionsbereich den Einheitskreis D(g) = {(x, y)|x2 + y 2 ≤ 1} . Der Wertebereich W (g) ist offenbar das Intervall [0, 1]. Zur Veranschaulichung einer Funktion f : (x, y) → f (x, y) von zwei Variablen ist der Graph Γ(f ) von f nützlich; es ist dies die Teilmenge des dreidimensionalen Raumes, welche durch Γ(f ) = {(x, y, z)|(x, y) ∈ D(f ), z = f (x, y)} gegeben ist. Beispiel Der Graph der linearen Funktion f : (x, y) → ax + by + c ist die durch die Gleichung zp = ax + by + c beschriebene Ebene (siehe Figur 2). Der Graph der Funktion g : (x, y) → 1 − (x2 + y 2 ) ist die über dem Einheitskreis liegende Halbkugeloberfläche x2 + y 2 + z 2 = 1 (siehe Figur 3). Der Graph einer Funktion von zwei Variablen ist definitionsgemäss eine (i.a. gekrümmte) Fläche im dreidimensionalen Raum. Er lässt sich mit den üblichen Darstellungsmitteln veranschaulichen, die für die Abbildung von Objekten im dreidimensionalen Raum entwickelt worden sind. Sehr nützlich sind in diesem Zusammenhang Darstellungsmittel der Kartographie, welche die über (bzw. unter) der (x, y)-Ebene liegende Fläche Γ(f ) durch Niveaulinien (Höhenlinien, Isobaren, etc.) beschreiben. Die Niveaulinie von f zum Niveau C ist diejenige Kurve in der (x, y)-Ebene, auf der die Funktion f überall den Wert C annimmt. Als Kurve in der (x, y)-Ebene ist sie gegeben durch die Gleichung f (x, y) = C. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 2 : Graph einer linearen Funktion 10 7.5 3 5 2.5 2 0 0 1 1 2 3 0 Fig. 3 : Graph der p Funktion g(x, y) = 1 − (x2 + y 2 ) 5 6 Beispiel U. Stammbach: Analysis, Teil B Die Niveaulinie zum Niveau C der Funktion f : (x, y) → f (x, y) = x2 − y 2 ist gegeben durch die Gleichung x2 − y 2 = C . Für C = 0 ist dies das Geradenpaar der Winkelhalbierenden des Koordinatensystems der (x, y)Ebene. Für C > 0 besteht die Kurve aus zwei Hyperbelästen, welche die x-Achse schneiden. Für C < 0 besteht die Kurve aus zwei Hyperbelästen, welche die y-Achse schneiden. Jeder Kartenleser erkennt am Bild dieser Niveaulinien das Aussehen des Geländes, d.h. des Graphen von f : es ist ein “Passübergang” mit dem Nullpunkt des Koordinatensystems als “Passhöhe”; die y-Achse beschreibt eine über den “Pass” führende “Strasse” (siehe Figuren 4, 5). Beispiel Der Graph der Funktion f : (x, y) → x2 + y 2 ist ein über der (x, y)-Ebene liegendes Paraboloid (siehe Figur 6). Die Niveaulinien sind Kreise um den Ursprung der (x, y)-Koordinatenebene (siehe Figur 7). Beispiel Die Zustandsgleichung eines idealen Gases liefert die absolute Temperatur T als Funktion des Druckes p und des Volumens V T : (p, V ) → T (p, V ) = 1 pV, 0 ≤ p, V < ∞ . R Die Niveaulinien zum Niveau C dieser Funktion ist durch die Gleichung 1 pV = C R gegeben. Offenbar ist jede Niveaulinie ein Hyperbelast im ersten Quadranten der (p, V )-Ebene. Da auf diesen Niveaulinien die Temperatur konstant ist, nennt man sie in der Physik Isothermen. Beispiel Funktion Auch kompliziertere Funktionen, wie etwa die auf der ganzen (x, y)-Ebene definierte h : (x, y) → h(x, y) = sin x sin y lassen sich mit Hilfe der Niveaulinien gut veranschaulichen (siehe Figuren 8, 9). Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 4 : Graph der Funktion f : (x, y) → f (x, y) = x2 − y 2 5 0 2 -5 0 -2 0 -2 2 3 2 1 Fig. 5 : Niveaulinien der Funktion f : (x, y) → f (x, y) = x2 − y 2 0 -1 -2 -3 -3 -2 -1 0 1 2 3 7 8 U. Stammbach: Analysis, Teil B Fig. 6 : Graph der Funktion f : (x, y) → x2 + y 2 8 6 2 4 1 2 0 -2 0 -1 0 -1 1 2 -2 2 1.5 1 Fig. 7 : Niveaulinien der Funktion f : (x, y) → x2 + y 2 0.5 0 -0.5 -1 -1.5 -2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 8 : Graph der Funktion h : (x, y) → h(x, y) = sin x sin y 1 0.5 2 0 1 -0.5 -1 -2 0 -1 0 -1 1 2 -2 2 1.5 1 Fig. 9 : Niveaulinien der Funktion h : (x, y) → h(x, y) = sin x sin y 0.5 0 -0.5 -1 -1.5 -2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 9 10 2 U. Stammbach: Analysis, Teil B Partielle Ableitungen Man stelle sich den Graphen Γ(f ) der Funktion f : (x, y) → f (x, y) als “Gelände” über der (x, y)-Ebene vor (beschrieben etwa durch die Niveaulinien). Ferner stelle man sich vor, dass ein Wanderer in diesem Gelände einem Weg folgt, der in der (x, y)-Ebene durch die Parallele y = y0 zur x-Achse beschrieben wird. Von eminenter Wichtigkeit für unseren Wanderer ist die Frage nach der Steigung des Weges. Wir erhalten diese Steigung, indem wir uns ein “Profil” des Weges in einem (x, z)-Koordinatensystem zeichnen. Es ist dies offenbar der Graph der Funktion (der einzigen Variablen x) ϕ : x → z = f (x, y0 ) . Die gesuchte Steigung (an der Stelle (x0 , y0 )) ist dann die Ableitung von ϕ nach x (an der Stelle x0 ). Diese Grösse heisst partielle Ableitung von f : (x, y) → f (x, y) nach x an der Stelle (x0 , y0 ). Man bezeichnet sie durch das Symbol fx (x0 , y0 ) oder ∂f (x0 , y0 ) . ∂x Formal ist sie als Grenzwert fx (x0 , y0 ) = lim ∆x→0 f (x0 + ∆x, y0 ) − f (x0 , y0 ) ∆x definiert. In analoger Weise erhält man die partielle Ableitung fy von f nach y. Sowohl die partielle Ableitung fx von f nach x, wie die partielle Ableitung fy von f nach y sind offensichtlich wieder Funktionen der zwei Variablen x und y. Sie können also ihrerseits partiell abgeleitet werden. Man erhält so die zweiten partiellen Ableitungen fxx , fxy , fyx , fyy , wobei wir, wie allgemein üblich, fxx = (fx )x , fxy = (fx )y , fyx = (fy )x , fyy = (fy )y gesetzt haben. Diese sind, falls sie existieren, wiederum Funktionen von zwei Variablen. Ihre nochmalige partielle Ableitung liefert die dritten partiellen Ableitungen Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 1 : Graph der Funktion f 0 ≤ x ≤ 2.5, −1 ≤ y ≤ 1.5 10 1.5 7.5 5 1 2.5 0.5 0 0 0.5 0 1 -0.5 1.5 2 2.5 -1 2 1.5 1 Fig. 2 : Niveaulinien der Funktion f −0.5 ≤ x ≤ 3, −1.5 ≤ y ≤ 2 0.5 0 -0.5 -1 -1.5 -0.5 0 0.5 1 1.5 2 2.5 3 11 12 U. Stammbach: Analysis, Teil B fxxx , fxxy , fxyx , fyxx , fxyy , fyxy , fyyx , fyyy , und auf analoge Weise erhält man die partiellen Ableitungen beliebiger Ordnung. Beispiel Es sei die Funktion f : (x, y) → x − 5 4 3 y− 1 2 2 − x + 3y + 15 2 gegeben (siehe Figuren 1, 2). Für y = −1 erhält man die Funktion einer Variablen (siehe Figur 3) 5 ϕ:x→ x− 4 3 3 − 2 2 9 5 9 −x+ = x− 2 4 4 3 −x+ 9 . 2 7 6 5 Fig. 3 : Verhalten von f auf y = −1 4 3 2 1 0.5 1 1.5 2 2.5 Deren Ableitung in x = 1 ist definitionsgemäss die partielle Ableitung fx (1, −1); man erhält fx (1, −1) = −0.578.... Beispiel Es sei die Funktion Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung f : (x, y) → f (x, y) = ex 2 +2y gegeben (siehe Figuren 4, 5). Die partiellen Ableitungen sind (siehe Figuren 6, 7, 8, 9) fx (x, y) = 2x ex 2 +2y x2 +2y fy (x, y) = 2 e , , fxx (x, y) = (2 + (2x)2 ) ex x2 +2y , x2 +2y , fxy (x, y) = 4x e fyx (x, y) = 4x e x2 +2y fyy (x, y) = 4 e Beispiel 2 +2y , . Es sei die Funktion f : (x, y) → f (x, y) = arctan y x gegeben. Die partiellen Ableitungen fx , fy ergeben sich zu 1 y y =− 2 , 1 + (y 2 /x2 ) x2 x + y2 1 1 x . = 2 2 2 1 + (y /x ) x x + y2 fx (x, y) = − fy (x, y) = Daraus erhalten wir die zweiten partielle Ableitungen 2xy , (x2 + y 2 )2 (x2 + y 2 ) − y · 2y y 2 − x2 fxy (x, y) = (fx )y (x, y) = − = , (x2 + y 2 )2 (x2 + y 2 )2 (x2 + y 2 ) − x · 2x y 2 − x2 fyx (x, y) = (fy )x (x, y) = = , (x2 + y 2 )2 (x2 + y 2 )2 −2xy fyy (x, y) = (fy )y (x, y) = . 2 (x + y 2 )2 fxx (x, y) = (fx )x (x, y) = 13 14 U. Stammbach: Analysis, Teil B Fig. 4 : Graph der Funktion 2 f (x, y) = ex +2y 10 1 5 0.5 0 -1 0 -0.5 0 -0.5 0.5 1 -1 1 0.75 0.5 Fig. 5 : Niveaulinien der Funktion 2 f (x, y) = ex +2y 0.25 0 -0.25 -0.5 -0.75 -1 -1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Fig. 6 : Graph der Funktion 2 fx (x, y) = 2x ex +2y 10 5 1 0 0.5 -5 -10 -1 0 -0.5 0 -0.5 0.5 1 -1 1 0.75 0.5 Fig. 7 : Niveaulinien der Funktion 2 fx (x, y) = 2x ex +2y 0.25 0 -0.25 -0.5 -0.75 -1 -1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1 15 16 U. Stammbach: Analysis, Teil B Fig. 8 : Graph der Funktion 2 fxx (x, y) = (2 + (2x)2 ) ex +2y 40 1 30 20 0.5 10 0 -1 0 -0.5 0 -0.5 0.5 1 -1 1 0.75 0.5 Fig. 9 : Niveaulinien der Funktion 2 fxx (x, y) = (2 + (2x)2 ) ex +2y 0.25 0 -0.25 -0.5 -0.75 -1 -1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Beispiel Man bestimme alle Funktionen f von zwei Variablen mit fx (x, y) ≡ 0. Für die partielle Differentiation nach x ist die Funktion f eine Konstante; es gilt also f (x, y) = v(y) , wobei v : y → v(y) eine beliebige Funktion von y ist. Beispiel Man bestimme alle Funktionen f mit fx (x, y) ≡ fy (x, y) ≡ 0 . Wegen fx (x, y) ≡ 0 gilt nach obigem f (x, y) ≡ v(y). Daraus folgt 0 ≡ fy (x, y) ≡ v 0 (y) , also v(y) ≡ C. Damit ist f (x, y) ≡ C. Beispiel Gesucht sind alle Funktionen f mit fy (x, y) ≡ x2 sinh(xy) . Offensichtlich ist f (x, y) = x cosh(xy) + u(x) , wo x → u(x) eine beliebige Funktion von x ist. Beispiel Gesucht sind alle Funktionen f mit fxy (x, y) ≡ 0. Es folgt sofort fx (x, y) ≡ u(x), wo u : x → u(x) eine Funktion von x ist. Dann ist aber f (x, y) = U (x) + V (y) mit U 0 (x) = u(x) und V : y → V (y) eine beliebige Funktion von y. 17 18 3 U. Stammbach: Analysis, Teil B Der Satz von Schwarz, die Integrabilitätsbedingung Wenn man die expliziten Beispiele des vorigen Abschnittes noch einmal durchsieht, so stellt man fest, dass die “gemischten Ableitungen” fxy (x, y) und fyx (x, y) in allen Fällen übereinstimmen. Dies gilt in der Tat unter ganz allgemeinen Bedingungen, wie der Satz von Schwarz besagt (H. A. Schwarz 1843-1921). Satz Es sei f : (x, y) → f (x, y) eine Funktion von zwei Variablen und (x0 , y0 ) ein Punkt des Definitionsbereiches D(f ). Ferner seien fxy , fyx in der ganzen Umgebung von (x0 , y0 ) stetig. Dann gilt fxy (x0 , y0 ) = fyx (x0 , y0 ) . Bevor wir diesen Satz beweisen, machen wir die folgenden Bemerkungen. Zuerst zu den Voraussetzungen des Satzes. Wir nennen die Funktion f : (x, y) → f (x, y) stetig in (x0 , y0 ), wenn sie die folgende Eigenschaft besitzt: Für jede Folge von Punkten (x1 , y1 ), (x2 , y2 ), . . . in der (x, y)-Ebene mit lim xn = x0 , lim yn = y0 n→∞ n→∞ gilt lim f (xn , yn ) = f (x0 , y0 ) . n→∞ Ist die Funktion f stetig in allen Punkten ihres Definitionsbereiches, so heisst f stetig schlechthin. Diese Definition ist offensichtlich ganz analog zur Definition der Stetigkeit bei Funktionen einer Variablen (siehe Kapitel I, Abschnitt 3). Der Leser tut gut daran, sich die damaligen Ausführungen wieder in Erinnerung zu rufen. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 19 Ohne näher auf diesen Punkt einzugehen, fügen wir noch Folgendes an. Ist f stetig in (x0 , y0 ), so ist selbstverständlich die Funktion einer Variablen x → f (x, y0 ) stetig in x0 und die Funktion y → f (x0 , y) stetig in y0 . Die Umkehrung gilt allerdings nicht: Es gibt Beispiele von Funktionen f von zwei Variablen, für welche die zugehörigen Funktionen einer Variablen stetig sind, die Funktion f selbst aber nicht stetig ist. Im Satz von Schwarz kann auf die Voraussetzung über Stetigkeit der partiellen Ableitungen fxy , fyx nicht verzichtet werden. Bei Funktionen f , welche diese Voraussetzungen nicht erfüllen, können die “gemischten Ableitungen” fxy und fyx durchaus verschieden sein. Aus dem Satz von Schwarz folgt sofort, dass es (unter geeigneten Voraussetzungen über die Stetigkeit) bei höheren Ableitungen nicht auf die Reihenfolge der Ableitung ankommt. Es gilt zum Beispiel fxyyxyx ≡ fxxxyyy , fxxy ≡ fxyx ≡ fyxx , fxyy ≡ fyxy ≡ fyyx . Es gibt also bei weitem nicht so viele verschiedene höhere Ableitungen einer Funktion f , wie es auf den ersten Blick den Anschein macht. Beweis des Satzes Wir betrachten das Quadrat in D(f ) mit den Eckpunkten (x0 , y0 ), (x0 + h, y0 ), (x0 , y0 + h), (x0 + h, y0 + h) (siehe Figur 1) und bilden die Hilfsgrösse A(h) = f (x0 + h, y0 + h) − f (x0 + h, y0 ) − [f (x0 , y0 + h) − f (x0 , y0 )]. Für die Funktion (einer Variablen) ϕ : x → f (x, y0 + h) − f (x, y0 ) gilt dann A(h) = ϕ(x0 + h) − ϕ(x0 ) . Mit Hilfe des Mittelwertsatzes der Differentialrechnung (siehe Kapitel II, Abschnitt 3) können wir diese Differenz anders schreiben: es existiert ein ξ1 zwischen x0 und x0 + h mit A(h) = ϕ(x0 + h) − ϕ(x0 ) = h ϕ0 (ξ1 ) = h(fx (ξ1 , y0 + h) − fx (ξ1 , y0 )) . 20 U. Stammbach: Analysis, Teil B (y) (x0 , y0 + h) (x0 + h, y0 + h) Fig. 1 : Zum Beweis des Satzes von Schwarz (x0 , y0 ) (x0 + h, y0 ) (x) Wiederum nach dem Mittelwertsatz der Differentialrechnung existiert ein η1 zwischen y0 und y0 + h mit der Eigenschaft fx (ξ1 , y0 + h) − fx (ξ1 , y0 ) = h fxy (ξ1 , η1 ) . Damit folgt A(h) = h2 fxy (ξ1 , η1 ) , wo (ξ1 , η1 ) ein Punkt im betrachteten Quadrat ist. Schreibt man A(h) = f (x0 + h, y0 + h) − f (x0 , y0 + h) − [f (x0 + h, y0 ) − f (x0 , y0 )] , so liefert eine analoge Überlegung einen Punkt (ξ2 , η2 ) im betrachteten Quadrat mit A(h) = h2 fyx (ξ2 , η2 ) . Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 21 Lässt man jetzt h gegen Null gehen, so müssen die Punkte (ξ1 , η1 ) und (ξ2 , η2 ) gegen den Punkt (x0 , y0 ) streben. Wegen der Stetigkeit von fxy bzw. fyx in (x0 , y0 ) folgt dann A(h) = fxy (x0 , y0 ) = fyx (x0 , y0 ) . h→0 h2 lim Diese letztere Gleichung war zu beweisen. Zum Schluss dieses Abschnittes gehen wir noch auf das Umkehrproblem ein: Gegeben seien zwei stetig differenzierbare Funktionen ϕ : (x, y) → ϕ(x, y) und ψ : (x, y) → ψ(x, y) mit gemeinsamem Definitionsbereich D(ϕ) = D(ψ). Gesucht ist eine Funktion f : (x, y) → f (x, y) mit fx (x, y) ≡ ϕ(x, y); fy (x, y) ≡ ψ(x, y). Für Funktionen einer Variablen lautet das analoge Problem wie folgt: Gegeben ist eine Funktion ϕ : x → ϕ(x). Gesucht ist eine Funktion f : x → f (x) mit f 0 (x) ≡ ϕ(x). Wir wissen, dass dieses letztere Problem für beliebige stetige Funktionen eine Lösung hat: f ist einfach eine Stammfunktion von ϕ. Im Problem für Funktionen von zwei Variablen gibt es nicht immer eine Lösung! Nach dem Satz von Schwarz folgt nämlich aus der Existenz von f sofort die Beziehung (3.1) ϕy (x, y) ≡ fxy (x, y) ≡ fyx (x, y) ≡ ψx (x, y). Für Funktionen ϕ und ψ, welche diese Beziehung nicht erfüllen, kann es somit kein f der verlangten Art geben. Der folgende Satz, den wir ohne Beweis zitieren, besagt, dass die Bedingung (3.1) für die Existenz von f hinreichend ist, wenigstens dann, wenn der gemeinsame Definitionsbereich ein achsenparalleles Rechteck ist. Wir nennen die Bedingung (3.1) deshalb Integrabilitätsbedingung. Satz Es seien ϕ und ψ zwei stetige differenzierbare Funktionen zweier Variablen mit einem achsenparallelen Rechteck als Definitionsbereich. Gilt ϕy (x, y) ≡ ψx (x, y), so existiert eine Funktion f : (x, y) → f (x, y) mit fx (x, y) ≡ ϕ(x, y) und fy (x, y) ≡ ψ(x, y). 22 U. Stammbach: Analysis, Teil B Die Funktion f ist bis auf eine additive Konstante eindeutig bestimmt; ist nämlich f ∗ eine zweite Funktion der verlangten Art, so gilt für die Differenz g(x, y) = f ∗ (x, y) − f (x, y) natürlich gx (x, y) = fx∗ (x, y) − fx (x, y) = ϕ(x, y) − ϕ(x, y) = 0 , gy (x, y) = fy∗ (x, y) − fy (x, y) = ψ(x, y) − ψ(x, y) = 0 . Wie wir aber gesehen haben, ist eine Funktion mit trivialen partiellen Ableitungen eine Konstante, d.h. g(x, y) ≡ C. Daraus folgt f ∗ (x, y) ≡ f (x, y) + C. Dies war zu beweisen. Wir schliessen diesen Abschnitt mit einigen Beispielen, die zeigen, wie man die Funktion f aus ϕ und ψ berechnen kann, falls die Intergrabilitätsbedingung erfüllt ist. Beispiel Es seien ϕ und ψ durch ϕ(x, y) = x3 + xy 2 und ψ(x, y) = x2 y + y 3 gegeben. Die Integrabilitätsbedingung ist wegen ϕy (x, y) = 2xy = ψx (x, y) erfüllt. Ausserdem sind ϕ und ψ auf der ganzen (x, y)-Ebene definiert, also auf einem achsenparallelen “Rechteck”. Nach unserem Satz existiert eine (bis auf eine additive Konstante eindeutig bestimmte) Funktion f mit fx = ϕ, fy = ψ. Aus fx (x, y) = x3 + xy 2 folgt f (x, y) = 1 4 x2 y 2 x + + v(y) , 4 2 wo v : y → v(y) eine noch näher zu bestimmende Funktion von y ist. Aus der Bedingung fy (x, y) = x2 y + y 3 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung folgt die Beziehung ! x2 y + v 0 (y) = x2 y + y 3 , so dass v 0 (y) ≡ y 3 , y4 v(y) ≡ +C . 4 Die Funktion f (x, y) hat somit die folgende Form: f (x, y) = Beispiel 1 4 x2 y 2 1 4 x + + y + C. 4 2 4 Es seien ϕ und ψ gegeben durch ϕ(x, y) = x sin y , ψ(x, y) = x2 cos y + y 2 , 2 welche auf der ganzen Ebene definiert sind. Wegen ϕy (x, y) = x cos y = ψx (x, y) ist die Integrabilitätsbedingung erfüllt. Die Gleichung fx (x, y) = x sin y liefert f (x, y) = x2 sin y + v(y), 2 wobei gelten muss fy (x, y) = Daraus folgt 2 x2 ! x cos y + v 0 (y) ≡ cos y + y 2 = ψ(x, y). 2 2 23 24 U. Stammbach: Analysis, Teil B v 0 (y) = y 2 , y3 v(y) = + C. 3 Die gesuchte Funktion f ist somit von der Form f (x, y) = x2 y3 sin y + + C. 2 3 Wir werden später mehrmals wieder auf dieses Umkehrproblem der partiellen Ableitung geführt werden: es tritt in vielen verschiedenen Zusammenhängen auf ganz natürliche Art auf. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 4 25 Linearisieren, Fehlerrechnung Das Linearisieren bei Funktionen zweier Variablen ist vollkommen analog zum Linearisieren bei Funktionen einer Variablen. Ist f : x → f (x) eine Funktion einer Variablen, so linearisiert man diese an der Stelle x0 , indem man sie durch diejenige lineare Funktion x → ax + b ersetzt, deren Graph gerade die Tangente an den Graphen Γ(f ) im Punkt (x0 , f (x0 )) ist. Ist f : (x, y) → f (x, y) eine Funktion zweier Variablen, so linearisiert man diese an der Stelle (x0 , y0 ), indem man sie durch diejenige lineare Funktion (x, y) → ax + by + c ersetzt, deren Graph gerade die Tangentialebene an den Graphen Γ(f ) im Punkte (x0 , y0 , f (x0 , y0 )) ist. Die so bestimmte lineare Funktion nennen wir lineare Ersatzfunktion von f im Punkte (x0 , y0 ). Im hier zu behandelnden Fall von zwei Variablen besitzt die lineare Ersatzfunktion laut dieser Definition die folgenden Eigenschaften: - ihr Wert in (x0 , y0 ) ist f (x0 , y0 ), - ihre partielle Ableitung nach x ist fx (x0 , y0 ), - ihre partielle Ableitung nach y ist fy (x0 , y0 ). Diese drei Eigenschaften bestimmen offensichtlich die lineare Ersatzfunktion von f in (x0 , y0 ) vollständig. Sie ist gegeben durch (x0 , y0 ) → f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) . Ihr Graph ist definitionsgemäss die Tangentialebene an den Graphen Γ(f ) von f im Punkt (x0 , y0 , f (x0 , y0 )); diese hat die Gleichung z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) . Beispiel Gegeben sei die Funktion f : (x, y) → x2 − y 2 . Gesucht ist die lineare Ersatzfunktion von f in (x0 , y0 ) = (1, −2) (siehe Figuren 1, 2). Es gilt fx (x, y) = 2x , fy (x, y) = −2y , also 26 U. Stammbach: Analysis, Teil B Fig. 1 : Die Funktion f : (x, y) → x2 − y 2 20 10 2 0 -10 0 -2 0 -2 2 Fig. 2 : Lineare Ersatzfunktion von 20 f : (x, y) → x2 − y 2 10 2 0 -10 0 -2 0 -2 2 im Punkte (1, −2) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 27 fx (1, −2) = 2 , fy (1, −2) = 4 . Ausserdem gilt f (1, −2) = −3. Die lineare Ersatzfunktion von f im Punkt (1, −2) ist somit (x, y) → −3 + 2(x − 1) + 4(y + 2) = 3 + 2x + 4y . Im Falle von Funktionen einer Variablen ist die lineare Ersatzfunktion eine gute Approximation in der Nähe des betrachteten Punktes. Dies gilt auch für Funktionen zweier Variablen. Um das zu präzisieren, betrachten wir die Differenz ϕ(∆x, ∆y) zwischen dem Funktionswert von f an der Stelle (x0 + ∆x, y0 + ∆y) und dem Funktionswert der linearen Ersatzfunktion von f in (x0 , y0 ) an dieser Stelle (x0 + ∆x, y0 + ∆y), also ϕ(∆x, ∆y) = f (x0 + ∆x, y0 + ∆y) − (f (x0 , y0 ) + fx (x0 , y0 )∆x + fy (x0 , y0 )∆y) . Dann gilt der folgende Satz Satz Es sei f : (x, y) → f (x, y) eine stetig differenzierbare Funktion von zwei Variablen und es sei (x0 , y0 ) ein Punkt des Definitionsbereiches D(f ) von f . Dann gilt lim ∆x,∆y→0 ϕ(∆x, ∆y) =0. ∆x2 + ∆y 2 p Wir können diesen Sachverhalt auch mit Hilfe des Landausymbols beschreiben: Die Differenz der Funktionswerte in (x0 + ∆x, y0 + ∆y) der Funktion f und der linearen Ersatzfunktion von p f in (x0 , y0 ) ist von kleinerer Grössenordnung als ∆x2 + ∆y 2 : ϕ(∆x, ∆y) = o Beweis q ∆x2 + ∆y 2 . Wir schreiben ϕ(∆x, ∆y) = (f (x0 + ∆x, y0 + ∆y) − f (x0 + ∆x, y0 )) + + (f (x0 + ∆x, y0 ) − f (x0 , y0 )) − fx (x0 , y0 )∆x − fy (x0 , y0 )∆y . 28 U. Stammbach: Analysis, Teil B Nach dem Mittelwertsatz der Differentialrechnung existiert ein ξ zwischen x0 und x0 + ∆x und ein η zwischen y0 und y0 + ∆y mit der Eigenschaft ϕ(∆x, ∆y) = fy (x0 + ∆x, η)∆y + fx (ξ, y0 )∆x − fx (x0 , y0 )∆x − fy (x0 , y0 )∆y . Daraus folgt ϕ(∆x, ∆y) = ∆x2 + ∆y 2 p ∆x ∆y = (fx (ξ, y0 ) − fx (x0 , y0 )) p 2 + (fy (x0 + ∆x, η) − fy (x0 , y0 )) p 2 . 2 ∆x + ∆y ∆x + ∆y 2 Wenn nun ∆x und ∆y gegen Null streben, so streben wegen der Stetigkeit von fx und fy an der Stelle (x0 , y0 ) beide Summanden auf der rechten Seite gegen Null. Es folgt also lim ∆x,∆y→0 ϕ(∆x, ∆y) =0. ∆x2 + ∆y 2 p Dies war zu beweisen. Führt man, wiederum analog zum Fall einer Funktion einer Variablen, ein parallel verschobenes Koordinatensystem mit Achsen dx, dy, df ein, dessen Ursprung mit dem Punkt (x0 , y0 , f (x0 , y0 )) zusammenfällt, so stellt sich die lineare Ersatzfunktion von f in (x0 , y0 ) durch die einfache Formel df = fx (x0 , y0 )dx + fy (x0 , y0 )dy dar. In dieser Form heisst sie üblicherweise totales Differential von f in (x0 , y0 ). Das obige Resultat besagt dann, dass die Änderung der Funktion f , also ∆f = f (x0 + ∆x, y0 + ∆y) − f (x0 , y0 ) gut durch das Differential von f in (x0 , y0 ), also durch df = fx (x0 , y0 )dx + fy (x0 , y0 )dy approximiert wird (dx = ∆x, dy = ∆y), und zwar umso besser je kleiner die Differenz gilt nämlich p ∆x2 + ∆y 2 ist; für Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung ∆f − df = o q ∆x2 + ∆y 2 29 . Wie schon bei Funktionen einer Variablen, so ist auch hier eine der Anwendungen der linearen Ersatzfunktion die Fehlerrechnung. Beispiel Bekanntlich ist das Trägheitsmoment Θ eines homogenen Vollzylinders mit Radius R, Höhe h und Dichte ρ um seine Achse gegeben durch π Θ = ρ R4 h . 2 Die (gemessenen) Grössen R und h seien mit einer Genauigkeit von 1% bekannt. Man gebe eine Fehlerabschätzung für Θ an. Das totale Differential dΘ ist eine Abschätzung für den (absoluten) Fehler ∆Θ: π π ∆Θ ∼ dΘ = ρ 4R3 h dR + ρ R4 dh . 2 2 Der relative Fehler ∆Θ/Θ lässt sich deshalb nach oben abschätzen durch ∆Θ dR dh ∼4 + = 5% . Θ R h Man beachte, dass der Fehler in R viermal stärker ins Gewicht fällt als der Fehler in h. Beispiel Mit Hilfe des Archimedischen Prinzips lässt sich das (mittlere) spezifische Gewicht γ eines unregelmässig geformten Körpers bestimmen, indem man dessen Gewicht in Luft (γLuft ∼ 0) und in Wasser (γWasser ∼ 1) feststellt. Es sei x das Gewicht in Luft und y das Gewicht im Wasser. Bezeichnet V das Volumen des Körpers, so gilt x = γV und wegen des Archimedischen Prinzips y = x−V . Daraus ergibt sich 30 U. Stammbach: Analysis, Teil B γ = x . x−y Mit welchem (relativen) Fehler ist γ höchstens behaftet, wenn x und y auf 1% genau gemessen werden. Wiederum schätzen wie den Fehler ∆γ durch das totale Differential dγ ab: ∆γ ∼ dγ = γx dx + γy dy = − y x dx + dy . 2 (x − y) (x − y)2 Daraus folgt ∆γ y ≤ γ x−y Wegen dx y + x x−y dy y 1 =2 . y x − y 100 y y−x+x = =γ−1 x−y x−y erhalten wir deshalb die Abschätzung ∆γ 1 ≤ 2|γ − 1| . γ 100 Die hier beschriebene Methode der Bestimmung des spezifischen Gewichtes ist also für grosse spezifische Gewichte γ nicht zu empfehlen. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 5 31 Extrema Bei Funktionen einer Variablen hat die Differentialrechnung ein effizientes Verfahren geliefert, um globale Extremalstellen aufzufinden. Ähnliches gilt auch für Funktionen von zwei (oder mehr) Variablen. Es sei f : (x, y) → f (x, y) eine auf D(f ) definierte Funktion. Ein Punkt (x0 , y0 ) heisst globale Maximalstelle von f , wenn für alle (x, y) ∈ D(f ) die Ungleichung f (x, y) ≤ f (x0 , y0 ) (y) D(f ) Fig. 1 : Zur Definition eines lokalen Extremums (x0 , y0 ) D (x) erfüllt ist. Der Funktionswert f (x0 , y0 ) heisst globales Maximum von f . Der Punkt (x0 , y0 ) ∈ D(f ) heisst lokale Maximalstelle, wenn es eine Kreisscheibe D mit Mittelpunkt (x0 , y0 ) gibt, so dass für alle (x, y), die zugleich in D(f ) und in D liegen, die Ungleichung f (x, y) ≤ f (x0 , y0 ) 32 U. Stammbach: Analysis, Teil B erfüllt ist (siehe Figur 1). Der Funktionswert f (x0 , y0 ) heisst in diesem Fall ein lokales Maximum von f . Analog ist eine globale bzw. lokale Minimalstelle und ein globales bzw. lokales Minimum definiert. Unter einer Extremalstelle versteht man eine Maximal- oder Minimalstelle und eine Extremum ist ein Maximum oder Minimum. Beispiel Für die Funktion f : (x, y) → f (x, y) = x2 + y 2 , D(f ) = R × R ist der Punkt (0, 0) eine globale Minimalstelle. Es gibt hingegen keine Maximalstelle, weder eine lokale noch eine globale. Es gibt also Beispiele, wo Extremalstellen der einen oder anderen Art nicht existieren. Der folgende mathematische Satz garantiert allerdings in vielen Fällen die Existenz von Extremalstellen. Ist f : (x, y) → f (x, y) eine stetige Funktion, deren Definitionsbereich D(f ) ein endliches abgeschlossenes (d.h. inklusive Rand) Gebiet der (x, y)-Ebene ist, so existiert für f in D(f ) (mindestens) eine globale Maximalstelle und (mindestens) eine globale Minimalstelle. Die Bestimmung der globalen Extremalstellen einer Funktion wird in erheblichem Mass durch das nachfolgende Resultat erleichtert. Es erlaubt, eine Liste von Punkten der (x, y)-Ebene aufzustellen, in der alle lokalen Extremalstellen (möglicherweise aber noch weitere Punkte) vorkommen. Satz Es sei f : (x, y) → f (x, y) eine in D(f ) definierte Funktion. Ist (x0 , y0 ) eine lokale Extremalstelle von f , so ist - (x0 , y0 ) ein Punkt des Randes von D(f ), oder - mindestens eine der partiellen Ableitungen fx oder fy ist in (x0 , y0 ) nicht definiert, oder - die partiellen Ableitungen fx und fy sind in (x0 , y0 ) definiert, und es gilt fx (x0 , y0 ) = 0 = fy (x0 , y0 ) . Wir rufen in Erinnerung (siehe Abschnitt 4), dass der Graph von f in Punkten (x0 , y0 ) mit fx (x0 , y0 ) = 0 = fy (x0 , y0 ) eine horizontale Tangentialebene besitzt. Man beachte ferner (und vergleiche mit der Situation bei Funktionen von einer Variablen): - nicht jede Extremalstelle von f ist eine gemeinsame Nullstelle von fx und fy ; - nicht jede gemeinsame Nullstelle von fx und fy ist Extremalstelle von f . Der Beweis des Satzes folgt direkt aus dem eindimensionalen Fall. Ist nämlich (x0 , y0 ) ∈ D(f ) eine lokale Extremalstelle von f , so besitzt offensichtlich auch die Funktion (einer Variablen) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 33 (y) D(f ) Fig. 2 : Zum Beweis des Satzes (x0 , y0 ) y = y0 (x) ϕ : x → ϕ(x) = f (x, y0 ) , (x0 , y0 ) ∈ D(f ) in x0 eine Extremalstelle (siehe Figur 2). Daraus folgt nach Kapitel II, Abschnitt 4, - dass x0 und damit (x0 , y0 ) ein Randpunkt ist, oder, - dass ϕ0 (x0 ) = fx (x0 , y0 ) nicht definiert ist, oder - dass gilt ϕ0 (x0 ) = fx (x0 , y0 ) = 0. Da Analoges auch für die Funktion ψ : y → ψ(y) = f (x0 , y) gilt, ist der Beweis vollständig. Beispiel Es sei eine reelle Zahl a > 0 gegeben. Man bestimme denjenigen Punkt P in der (x, y)-Ebene, für welchen die Summe der Abstände von der x-Achse, von der y-Achse und von der Geraden x + y = a am kleinsten ist (siehe Figur 3). Man sieht leicht, dass der Punkt P nicht ausserhalb des Dreiecks D mit den Eckpunkten (0, 0), (a, 0), (0, a) liegen kann, denn zu jedem ausserhalb von D liegenden Punkt P 0 lässt sich sofort ein anderer Punkt angeben, für den die Summe der Abstände kleiner wird. Für Punkte im Dreieck D ist die Summe der Abstände f (x, y) gegeben durch 34 U. Stammbach: Analysis, Teil B (y) (0, a) x+y =a Fig. 3 : Zur Berechnung der Summe der Abstände D P (x) (0, 0) (a, 0) 1 f (x, y) = x + y + √ (a − x − y) . 2 Somit haben wir für die Funktion f : (x, y) → f (x, y) , D(f ) = D die globale Minimalstelle zu suchen. Zu diesem Zweck untersuchen wir einerseits die Randpunkte des Dreiecks D und andererseits die partiellen Ableitungen von f . Für letztere gilt 1 1 fx (x, y) = 1 − √ , fy (x, y) = 1 − √ . 2 2 Die partiellen Ableitungen existieren also im ganzen Definitionsbereich und besitzen dort keine gemeinsamen Nullstellen. Nach unserem Satz muss die globale Minimalstelle (müssen die globalen Minimalstellen) von f folglich auf dem Rand von D zu finden sein. Für die Werte von f auf den Punkten des Randes von D erhalten wir (siehe Figur 4): x=0, f (0, y) = y + y=0, f (x, 0) = x + √1 2 √1 2 (a − y) , 0 ≤ y ≤ a , (a − x) , 0 ≤ x ≤ a . Für x + y − a = 0 ist f ≡ a. Die globale Minimalstelle der√Funktion f in D ist deshalb im Punkte (0, 0) zu finden; das globale Minimum ist f (0, 0) = a/ 2. Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 35 a x+ √1 2 (a − x) Fig. 4 : Verhalten von f auf der x-Achse (x) a Beispiel Es sei a < 0 eine reelle Zahl. Man bestimme denjenigen Punkt Q in der (x, y)-Ebene, für den die Summe der Quadrate der Abstände von der x-Achse, von der y-Achse und von der Geraden x + y − a = 0 minimal wird. Für den Punkt (x, y) der (x, y)-Ebene ist die Summe der Quadrate der Abstände gegeben durch g(x, y) = x2 + y 2 + 1 (x + y − a)2 . 2 Es ist folglich die globale Minimalstelle der Funktion g : (x, y) → g(x, y) , D(g) = R × R zu suchen. Da es keine Randpunkte gibt und die Funktion g überall differenzierbar ist, kommt für die sicherlich existierende globale Minimalstelle nur eine gemeinsame Nullstelle der partiellen Ableitungen gx und gy in Frage. Dies führt auf das Gleichungssystem gx (x, y) = 2x + x + y − a = 0 gy (x, y) = 2y + x + y − a = 0 . Die (einzige) Lösung ist x = y = a/4. Der Punkt Q = (a/4, a/4) ist somit die globale Minimalstelle von g. Das globale Minimum ist a2 /4. 36 U. Stammbach: Analysis, Teil B Beispiel Gegeben ist die Funktion f : (x, y) → f (x, y) = 2x2 + 4xy + 3y 2 − 8x − 10y + 2 (siehe Figur 5). Man bestimme die globale Maximalstelle von f auf dem Quadrat mit den Eckpunkten A = (0, 0), B = (2, 0), C = (0, 2), D = (2, 2). 2 1.75 1.5 Fig. 5 : Niveaulinien der Funktion f : (x, y) → f (x, y) = 2 = 2x + 4xy + 3y 2 − 8x − 10y + 2 1.25 1 0.75 0.5 0.25 0 0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 Da die Funktion f überall differenzierbar ist, sind die Randpunkte und die gemeinsamen Nullpunkte der ersten partiellen Ableitungen näher zu untersuchen. Für letztere erhalten wir das Gleichungssystem fx (x, y) = 4x + 4y − 8 =0 fy (x, y) = 4x + 6y − 10 = 0 Die einzige Lösung ist x = y = 1. Damit ist der Punkt (1, 1) ein Kandidat für die globale Maximalstelle. Wir wenden uns jetzt den Randpunkten des Quadrates zu. Auf der Quadratseite AB, also für y = 0 erhält man f (x, 0) = 2x2 − 8x + 2 ; auf AC, also für x = 0 erhält man Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 37 f (0, y) = 3y 2 − 10y + 2 ; auf CD, also für y = 2 erhält man f (x, 2) = 2x2 + 8x + 12 − 8x − 18 = 2x2 − 6 und auf BD, also für x = 2 erhält man f (2, y) = 8 + 8y + 3y 2 − 16 − 10y + 2 = 3y 2 − 2y − 6 . In jedem Fall erhält man eine quadratische Funktion, deren Graph eine nach oben geöffnete Parabel ist. Die grössten Funktionswerte werden also notwendigerweise in den Endpunkten der Definitionsintervalle, d.h. in den Eckpunkten A, B, C, D des Quadrates angenommen. Ein Vergleich der Werte von f auf diesen Punkten und auf dem Punkt (1, 1) liefert dann das Resultat. Wir erhalten f (0, 0) = 2, f (2, 0) = −6, f (0, 2) = −6, f (2, 2) = 2, f (1, 1) = −7 . Die Punkte A = (0, 0) und D = (2, 2) sind also die beiden globalen Maximalstellen der Funktion f im Quadrat ABCD. 38 U. Stammbach: Analysis, Teil B 6 Verallgemeinerte Kettenregel Es sei eine Funktion f : (x, y) → f (x, y) gegeben und eine in ihrem Definitionsbereich D(f ) verlaufende Kurve K durch die Parameterdarstellung t → (x(t), y(t)) . Wir betrachten die zusammengesetzte Funktion t → F (t) = f (x(t), y(t)) , welche t den Wert von f an der zu t gehörenden Stelle der Kurve K zuordnet (siehe Figuren 1, 2). Wir fragen nach der Ableitung von F nach t. Laut Definition gilt dF (t) = dt F (t + ∆t) − F (t) ∆t→0 ∆t f (x(t + ∆t), y(t + ∆t)) − f (x(t), y(t)) = lim ∆t→0 ∆t f (x(t) + ∆x, y(t) + ∆y) − f (x(t), y(t)) = lim , ∆t→0 ∆t lim wobei wir ∆x = x(t + ∆t) − x(t) , ∆y = y(t + ∆t) − y(t) gesetzt haben. Mit den Bezeichnungen von Abschnitt 4 erhalten wir nun dF (t) = dt ∆x ∆y ϕ(∆x, ∆y) · lim fx (x(t), y(t)) + fy (x(t), y(t)) +p 2 ∆t→0 ∆t ∆t ∆x + ∆y 2 = fx (x(t), y(t)) ẋ(t) + fy (x(t), y(t)) ẏ(t) , denn es gilt nach Abschnitt 4 ϕ(∆x, ∆y) lim p =0, ∆t→0 ∆x2 + ∆y 2 aber p ∆x2 + ∆y 2 ∆t ! Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 39 (y) K (x) Fig. 1 : Kurve K gegeben durch x : t → 5 − 32 t cos t y : t → 1 + t sin t für 1 ≤ t ≤ 7.5 100 75 50 25 (t) 2 4 6 Fig. 2 : Graph der zusammengesetzten Funktion 8 t → F (t) = f (x(t), y(t)) , -25 mit f : (x, y) → f (x, y) = xy 2 -50 -75 -100 40 U. Stammbach: Analysis, Teil B p lim ∆t→0 ∆x2 + ∆y 2 = lim ∆t→0 ∆t s ∆x ∆t 2 + ∆y ∆t 2 q = (ẋ(t))2 + (ẏ(t))2 . Damit haben wir die sogenannte verallgemeinerte Kettenregel bewiesen: Satz dF df (t) = (x(t), y(t)) = fx (x(t), y(t)) ẋ(t) + fy (x(t), y(t)) ẏ(t) . dt dt Während die gewöhnliche Kettenregel vor allem beim Ableiten von komplizierten Funktionen nützlich ist, liegen die Anwendungen der verallgemeinerten Kettenregel in einer etwas anderen Richtung. Wir illustrieren dies mit den folgenden Beispielen. Beispiel Die Kurve K sei in impliziter Darstellung, d.h. durch eine Gleichung der Form f (x, y) = 0 gegeben. Es sei (x0 , y0 ) ein Punkt der Kurve, also f (x0 , y0 ) = 0. Wir fragen nach der Steigung der Kurve in (x0 , y0 ). Um die Steigung zu berechnen, denken wir uns die Kurve in einer kleinen Umgebung von (x0 , y0 ) in expliziter Form gegeben: sie sei dort der Graph der Funktion (einer Variablen) ϕ : x → ϕ(x) , x0 − ∆x ≤ x ≤ x0 + ∆x . Es gilt dann also f (x, ϕ(x)) ≡ 0 für x0 − ∆x ≤ x ≤ x0 + ∆x und die Steigung von K in (x0 , y0 ) ist ϕ0 (x0 ). Fassen wir x als Parameter auf, so erhalten wir durch Ableiten nach x mit Hilfe der verallgemeinerten Kettenregel die Beziehung fx (x, ϕ(x)) · 1 + fy (x, ϕ(x)) · ϕ0 (x) = 0 . Daraus ergibt sich für die Steigung ϕ0 (x0 ) der Kurve in (x0 , y0 ) ϕ0 (x0 ) = − Beispiel fx (x0 , y0 ) . fy (x0 , y0 ) Wir betrachten noch kurz den Spezialfall, wo die Kurve K die Ellipse x2 y 2 + 2 =1 a2 b Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 4 2 (x0 , y0 ) -4 -2 2 Fig. 3 : Tangente an Ellipse 4 -2 -4 ist, und fragen nach der Gleichung der Tangente im Ellipsenpunkt (x0 , y0 ) (siehe Figur 3). Zu diesem Zweck betrachten wir die Ellipse als Kurve gegeben durch x2 y 2 + 2 −1=0 a2 b und bestimmen zuerst die Steigung m in (x0 , y0 ). Nach obigem gilt m=− fx (x0 , y0 ) b 2 x0 . =− 2 fy (x0 , y0 ) a y0 Die Tangente an die Ellipse im Punkt (x0 , y0 ) ist somit durch die Gleichung y − y0 = − b 2 x0 (x − x0 ) a2 y0 gegeben. Diese lässt sich vereinfachen zu x0 (x − x0 ) y0 (y − y0 ) + =0. a2 b2 41 42 U. Stammbach: Analysis, Teil B Berücksichtigt man noch, dass (x0 , y0 ) ein Punkt der Ellipse ist, und deshalb die Gleichung x2 y 2 + 2 =1 a2 b erfüllt, so erhält man für die Tangente die einfache Gleichung x0 y0 x+ 2 y =1 . 2 a b Beispiel Der Zustand eines Gases wird durch die Grössen Druck p, Volumen V und (absolute) Temperatur T beschrieben, welche untereinander durch die sogenannte Zustandsgleichung des Gases verbunden sind. (Die einfachste solche Zustandsgleichung ist die des idealen Gases pV = RT . Dabei ist R die sogenannte Gaskonstante. Etwas komplizierter ist die van der Waal’sche Zustandsgleichung, welche das Verhalten realer Gase genauer beschreibt; sie lautet a p + 2 (V − b) = RT . V Dabei sind die Grössen a, b vom betrachteten Gas abhängige Konstanten.) Die Zustandsgleichung sagt, dass für eine feste Menge Gas je zwei der drei Grössen p, V, T die dritte festlegen. Man hat folglich (wenigstens lokal!) Funktionen p : (V, T ) → p(V, T ) V : (p, T ) → V (p, T ) T : (p, V ) → T (p, V ) , welche aus der Gaszustandsgleichung folgen. dehnungskoeffizienten α des Gases durch α= 1 V In der Physik definiert man dann den Aus ∂V ∂T p , den Spannungskoeffizienten β durch 1 β= p und die Kompressibilität κ durch ∂p ∂T V , Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 1 κ=− V ∂V ∂p 43 . T (Es ist in diesem Zusammenhang in der Physik üblich, die bei der partiellen Ableitung festgehaltenen Grössen als Index hinzuschreiben; aus mathematischen Gründen wäre dies natürlich nicht notwendig!) Zwischen den Koeffizienten α, β, κ, die im allgemeinen Funktionen der Grössen p, V, T sind, besteht kraft der Zustandsgleichung eine einfache Beziehung. Diese wollen wir nun herleiten. Zu diesem Zweck gehen wir von der Funktion V : (p, T ) → V (p, T ) aus. Halten wir V konstant, V = C, so ist der Druck p nur von T abhängig; es sei p̃ : T → p̃(T ) die entsprechende Funktion. Dann gilt V (p̃(T ), T ) ≡ C . (6.2) Mathematisch ausgedrückt betrachtet man eine explizite Darstellung der Niveaulinie der Funktion V : (p, T ) → V (p, T ) zum Niveau C. Nun ist aber offenbar dp̃ = dT ∂p ∂T V , so dass die Ableitung der Beziehung (6.2) nach T die Gleichung 0= ∂V ∂p T ∂p ∂T V + ∂V ∂T p liefert. Daraus erhalten wir laut Definition von α, β, κ unmittelbar α = pκβ . Dies ist die gewünschte Beziehung. Man beachte, dass sie bereits aus der Existenz einer Zustandsgleichung hergeleitet wurde, die spezielle Form der Zustandsgleichung spielte dabei überhaupt keine Rolle. 44 7 U. Stammbach: Analysis, Teil B Funktionen von drei Variablen In diesem Abschnitt geht es darum, in verhältnismässig konzentrierter Weise reellwertige Funktionen von drei Variablen zu behandeln. Dabei wenden wir uns vor allem denjenigen Punkten zu, bei denen im Schritt von zwei auf drei Variablen neue Aspekte zur Geltung kommen. Durch eine reellwertige Funktion von drei Variablen f : (x, y, z) → f (x, y, z) wird jedem Tripel (x, y, z) eine reelle Zahl f (x, y, z) zugeordnet (siehe Figur 1). Der Definitionsbereich D(f ) kann als eine Untermenge des dreidimensionalen Raumes angesehen werden. f (x, y, z) 0 R Fig. 1 : Funktion von drei Variablen (z) f (y) D(f ) (x, y, z) R ×R ×R (x) In Anwendungen ist der Funktionswert f (x, y, z) oft eine skalare physikalische Grösse, die den Zustand in Punkte (x, y, z) beschreibt. Man denke in diesem Zusammenhang etwa an die (im Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 45 Körper D(f ) herrschende, von Punkt zu Punkt variierende) Temperatur T oder an die (vom Ort abhängige) Dichte ρ. Beispiel Die Funktion f : (x, y, z) → f (x, y, z) = ax + by + cz + d , D(f ) = R × R × R heisst linear. Der Wertebereich W (f ) besteht aus allen reellen Zahlen, falls (a, b, c) 6= (0, 0, 0). Beispiel Die Funktion 1 f : (x, y, z) → f (x, y, z) = p 2 x + y2 + z2 ist auf dem ganzen dreidimensionalen Raum mit Ausnahme des Nullpunktes definiert. Der Wertebereich besteht aus allen positiven Zahlen. Zur Veranschaulichung solcher Funktionen stehen wiederum verschiedene Möglichkeiten zur Verfügung. Allerdings scheidet die Betrachtung des Graphen der Funktion weitgehend aus, da für diesen bei einer Funktion von drei Variablen ein vierdimensionaler Raum benötigt würde, der sich natürlich zur Veranschaulichung kaum eignet. Die wohl einfachste Art sich über das Verhalten einer Funktion von drei Variablen klar zu werden, dürfte darin bestehen, deren Niveauflächen zu betrachten. Die Niveaufläche von f zum Niveau C ist die Fläche im dreidimensionalen Raum, die durch die Gleichung f (x, y, z) = C gegeben ist. Sie besteht aus allen Punkten im dreidimensionalen Raum, auf denen f den Wert C annimmt. Beispiel Die Niveaufläche von f : (x, y, z) → f (x, y, z) = ax + by + cz + d zum Niveau C ist die Ebene mit der Gleichung ax + by + cz = C − d . Die Niveaufläche von 1 f : (x, y, z) → f (x, y, z) = p 2 x + y2 + z2 zum Niveau C ist gegeben durch p x2 1 =C ; + y2 + z2 dies ist die Oberfläche einer Kugel mit Radius 1/C und Mittelpunkt 0, x2 + y 2 + z 2 = 1/C 2 . 46 U. Stammbach: Analysis, Teil B Die partiellen Ableitungen fx (x, y, z), fy (x, y, z), fz (x, y, z) ; bezeichnen wir auch durch ∂f ∂f ∂f (x, y, z) , (x, y, z) , (x, y, z) . ∂x ∂y ∂z Sie sind auf offensichtliche Weise definiert. Ein Beispiel mag hier genügen. Beispiel Es sei f : (x, y, z) → f (x, y, z) = sin(xyz) . Dann sind die partiellen Ableitungen gegeben durch fx (x, y, z) = yz cos(xyz) , fy (x, y, z) = xz cos(xyz) , fz (x, y, z) = xy cos(xyz) . Wegen des Satzes von Schwarz kommt es (unter geeigneten Stetigkeitsvoraussetzungen) nicht auf die Reihenfolge der partiellen Ableitungen an; z.B. gilt fxz (x, y, z) = fzx (x, y, z) , fxzxy (x, y, z) ≡ fxxyz (x, y, z) , etc. . Wie im Falle von zwei Variablen gibt der Satz von Schwarz Anlass zu Integrabilitätsbedingungen. Es seien drei Funktionen ϕ : (x, y, z) → ϕ(x, y, z) , ψ : (x, y, z) → ψ(x, y, z) , χ : (x, y, z) → χ(x, y, z) von drei Variablen mit dem gemeinsamen Definitionsbereich D gegeben, und man suche eine Funktion f : (x, y, z) → f (x, y, z) von drei Variablen mit fx ≡ ϕ , fy ≡ ψ , fz ≡ χ . Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 47 Existiert die Funktion f , so müssen wegen dem Satz von Schwarz für die partiellen Ableitungen die folgenden Gleichungen gelten ϕy ≡ fxy ≡ fyx ≡ ψx , ϕz ≡ fxz ≡ fzx ≡ χx , ψz ≡ fyz ≡ fzy ≡ χy . Es gilt dann das zum Fall von zwei Variablen analoge Resultat: Wenn diese Integrabilitätsbedingungen erfüllt sind, und der gemeinsame Definitionsbereich von ϕ, ψ , χ ein achsenparalleler Quader ist, so existiert die Funktion f , und sie ist bis auf eine additive Konstante eindeutig bestimmt. Beispiel Es seien ϕ, ψ , χ gegeben durch ϕ(x, y, z) = 3x2 + 3y − 1 , ψ(x, y, z) = z 2 + 3x , χ(x, y, z) = 2yz + 1 . Der gemeinsame Definitionsbereich ist der ganze dreidimensionale Raum. Wegen ϕy (x, y, z) = 3 = ψx (x, y, z) , ϕz (x, y, z) = 0 = χx (x, y, z) , ψz (x, y, z) = 2z = χy (x, y, z) sind die Integrabilitätsbedingungen erfüllt. Daraus folgt, dass die Funktion f existiert. ! Aus fx = ϕ folgt f (x, y, z) = x3 + 3xy − x + u(y, z) . Die Bedingung ! z 2 + 3x = ψ(x, y, z) = fy (x, y, z) = 3x + uy (y, z) liefert dann z 2 = uy (y, z) und daraus folgt u(y, z) = yz 2 + v(z) . 48 U. Stammbach: Analysis, Teil B Damit ist f von der Form f (x, y, z) = x3 + 3xy − x + yz 2 + v(z) . Schliesslich liefert die dritte Bedingung ! 2yz + 1 = χ(x, y, z) = fz (x, y, z) = 2yz + v 0 (z) die noch fehlende Information. Es gilt v 0 (z) = 1 und damit v(z) = z + C . Die gesuchte Funktion f ist also durch f (x, y, z) = x3 + 3xy − x + yz 2 + z + C gegeben. Analog wie bei Funktionen von zwei Variablen lautet die verallgemeinerte Kettenregel. Es sei f : (x, y, z) → f (x, y, z) eine Funktion von drei Variablen und t → (x(t), y(t), z(t)) die Parameterdarstellung einer Kurve im Definitionsbereich von f . Dann gilt für die zusammengesetzte Funktion F : t → F (t) = f (x(t), y(t), z(t)) dF (t) = fx (x(t), y(t), z(t)) ẋ(t) + fy (x(t), y(t), z(t)) ẏ(t) + fz (x(t), y(t), z(t)) ż(t) . dt An dieser Stelle wollen wir nun einen Schritt weitergehen als bei der Behandlung von Funktion von zwei Variablen. Wir bemerken, dass die in dieser Ableitung vorkommende Bildung als Skalarprodukt von zwei Vektoren aufgefasst werden kann, nämlich als Skalarprodukt des Vektors (fx (x(t), y(t), z(t)), fy (x(t), y(t), z(t)), fz (x(t), y(t), z(t))) mit dem Vektor (ẋ(t), ẏ(t), ż(t)) . Der letztere Vektor ist bekanntlich ein Tangentialvektor (der Geschwindigkeitsvektor) an die Kurve K. Wir machen die folgende Definition. Unter dem Gradienten grad f (x0 , y0 , z0 ) von f im Punkt (x0 , y0 , z0 ) verstehen wir den Vektor grad f (x0 , y0 , z0 ) = (fx (x0 , y0 , z0 ), fy (x0 , y0 , z0 ), fz (x0 , y0 , z0 )) . 49 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung Mit dieser Bildung wird der Funktion f in jedem Punkt (x0 , y0 , z0 ) ihres Definitionsbereiches ein Vektor grad f (x0 , y0 , z0 ) zugeordnet, den man sich natürlich in diesem Punkte angebracht denken kann. Der Gradient ordnet also jeder Funktion f ein Vektorfeld, das sogenannte Gradientenfeld von f , zu. Auf den wichtigen Begriff des Vektorfeldes kommen wir im Kapitel VI eingehend zu sprechen. Mit Hilfe des Gradienten schreibt sich die verallgemeinerte Kettenregel in der folgenden einfachen Form, dF (t) = ~r˙ (t) · grad f (x(t), y(t), z(t)) , dt wo ~r˙ (t) der zur Kurve gehörige Geschwindigkeitsvektor ist. Beispiel Für die Funktion f : (x, y, z) → ax + by + cz + d gilt grad f (x, y, z) = (a, b, c) . Der Gradient der linearen Funktion ist ein konstanter Vektor. Beispiel Für die Funktion f : (x, y, z) → x2 1 + y2 + z2 erhält man grad f (x, y, z) = −2x −2y −2z , , 2 2 2 2 2 2 2 2 2 (x + y + z ) (x + y + z ) (x + y 2 + z 2 )2 . Der Gradient von f zeigt in jedem Punkt gegen den Ursprung. Seine Länge ist gegeben durch 2/(x2 + y 2 + z 2 )3/2 . Sie ist umso grösser, je näher der Punkt (x, y, z) dem Ursprung ist. Als nächstes betrachten wir den Spezialfall der verallgemeinerten Kettenregel, wo die Kurve K eine Gerade ist. Diese sei durch die Parameterdarstellung t → (x0 + e1 t, y0 + e2 t, z0 + e3 t) gegeben, wobei wir annehmen, dass ~e ein Einheitsvektor ist und wir für den ausgezeichneten Punkt der Geraden gerade den Punkt (x0 , y0 , z0 ) genommen haben. Dann gilt wegen dF (t) = ~r˙ (t) · grad f (x(t), y(t), z(t)) dt natürlich dF (0) = ~e · grad f (x0 , y0 , z0 ) . dt 50 U. Stammbach: Analysis, Teil B Diesen Wert nennen wir die Richtungsableitung von f in (x0 , y0 , z0 ) in Richtung ~e, D~e f (x0 , y0 , z0 ) = dF (0) = ~e · grad f (x0 , y0 , z0 ) . dt Sie beschreibt die momentane Änderung des Funktionswertes an der Stelle (x0 , y0 , z0 ) in Richtung ~e. Man beachte, dass in dieser Definition ~e ein Einheitsvektor ist. Beispiel Für die Funktion f : (x, y, z) → sin(xyz) bestimme man die Richtungsableitung in (1, 0, 1) in Richtung des Einheitsvektors √13 (−1, 1, 1). Es gilt 1 1 D~e f (1, 0, 1) = √ (−1, 1, 1) · (0, 1, 0) = √ . 3 3 Beispiel Für ~e = (1, 0, 0) erhält man für die Richtungsableitung in (x, y, z) in Richtung ~e D~e f (x, y, z) = ~e · grad f (x, y, z) = fx (x, y, z) . Analoges gilt für ~e = (0, 1, 0) und ~e = (0, 0, 1). Die partiellen Ableitungen von f sind also die Richtungsableitungen in Richtung der Koordinatenachsen. Wie die Formel für die Richtungsableitung zeigt, ist diese an der Stelle (x0 , y0 , z0 ) für jede beliebige Richtung ~e bestimmt, wenn der Gradient von f in (x0 , y0 , z0 ) bekannt ist: Der Vektor grad f (x0 , y0 , z0 ) beschreibt, wie sich die Funktion f in der unmittelbaren Umgebung von (x0 , y0 , z0 ) ändert. Diesem Zusammenhang wollen wir hier noch etwas genauer nachgehen, indem wir die Abhängigkeit der Richtungsableitung von der Richtung ~e studieren. Es gilt D~e f (x0 , y0 , z0 ) = ~e · grad f (x0 , y0 , z0 ) = |~e| · |grad f (x0 , y0 , z0 )| · cos ω , wobei ω den von ~e und dem Vektor grad f (x0 , y0 , z0 ) eingeschlossenen Winkel bezeichnet (siehe Figur 2). Wir lesen daran das Folgende ab: Für ω = 0, d.h. wenn ~e die gleiche Richtung wie grad f (x0 , y0 , z0 ) besitzt, so gilt D~e f (x0 , y0 , z0 ) = |grad f (x0 , y0 , z0 )| . Die Richtungsableitung ist in diesem Fall gerade gleich der Länge des Gradienten. Dies ist offensichtlich der grösstmögliche Wert der Richtungsableitung im Punkte (x0 , y0 , z0 ). Er wird gerade in der Richtung erreicht, in welche der Gradient zeigt; in Richtung des Gradienten ist folglich der grösste Anstieg der Funktionswerte von f festzustellen. Satz Die Richtung des Gradienten grad f (x0 , y0 , z0 ) gibt die Richtung der grössten Richtungsableitung von f in (x0 , y0 , z0 ) an; die Länge des Gradienten ist gleich der grössten Richtungsableitung von f in (x0 , y0 , z0 ). Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 51 ~e grad f (x0 , y0 , z0 ) ω (z) (y) Fig. 2 : Richtungsableitung von f im Punkte (x0 , y0 , z0 ) und grad f (x0 , y0 , z0 ) (x0 , y0 , z0 ) (x) Für ω = π/2, d.h. für ~e ⊥ grad f (x0 , y0 , z0 ) ist die Richtungsableitung D~e f (x0 , y0 , z0 ) Null, d.h. für die Richtung ~e ist die momentane Änderung des Funktionswertes von f Null. Daraus schliessen wir, dass ~e tangential zur Niveaufläche von f durch den Punkt (x0 , y0 , z0 ) ist. Dies bedeutet aber, dass der Vektor grad f (x0 , y0 , z0 ) senkrecht auf der Niveaufläche steht. Satz Der Gradient von f in (x0 , y0 , z0 ) steht senkrecht auf der Niveaufläche von f , welche durch den Punkt (x0 , y0 , z0 ) geht. Beispiel Der Gradient der Funktion 1 f : (x, y, z) → p 2 x + y2 + z2 ist gegeben durch grad f (x, y, z) = wobei wir wie üblich r = −x −y −z , , r3 r3 r3 p , x2 + y 2 + z 2 gesetzt haben. Die Länge des Gradienten ist folglich |grad f (x, y, z)| = 1 . r2 52 U. Stammbach: Analysis, Teil B Dies ist der Wert der grössten Richtungsableitung in (x, y, z). Da der Gradient gegen den Nullpunkt zu gerichtet ist, wird die grösste Richtungsableitung (grösster Anstieg der Funktionswerte) in dieser Richtung erreicht. Die in den beiden Sätzen beschriebenen Eigenschaften des Gradienten sind in Anwendungen äusserst nützlich. Wir geben dazu einige Beispiele. Beispiel Gegeben seien die Flächenscharen x2 + 2y 2 + 2z 2 = C1 , q x2 / y 2 − z 2 = C2 . Man zeige, dass jede Fläche der einen Schar jede Fläche der andern Schar orthogonal schneidet. Wir fassen die beiden Flächenscharen als Niveauflächen der Funktionen f1 (x, y, z) = x2 + 2y 2 + 2z 2 , q f2 (x, y, z) = x2 / y 2 − z 2 auf. Es ist dann zu zeigen, dass in (x, y, z) die Gradienten von f1 und f2 senkrecht aufeinanderstehen, d.h. dass das Skalarprodukt grad f1 · grad f2 Null ist. Wir erhalten grad f1 (x, y, z) = (2x, 4y, 4z), grad f2 (x, y, z) = 2x −x2 y x2 z , , (y 2 − z 2 )1/2 (y 2 − z 2 )3/2 (y 2 − z 2 )3/2 ! . Daraus ergibt sich für das Skalarprodukt sofort grad f1 · grad f2 = 1 2 2 2 2 2 2 2 4x (y − z ) − 4x y + 4x z =0. (y 2 − z 2 )3/2 Beispiel Wir betrachten in diesem Beispiel die Niveaufläche durch den Punkt (x0 , y0 , z0 ) der Funktion f und fragen nach der Gleichung der Tangentialebene im Punkt (x0 , y0 , z0 ). Wir wissen, dass der Gradient grad f (x0 , y0 , z0 ) senkrecht auf der Niveaufläche durch (x0 , y0 , z0 ) steht. Damit ist dieser Vektor auch senkrecht zur Tangentialebene. Die Tangentialebene geht ausserdem durch den Punkt (x0 , y0 , z0 ). Ihre Gleichung lautet damit offenbar fx (x0 , y0 , z0 ) x + fy (x0 , y0 , z0 ) y + fz (x0 , y0 , z0 ) z = = fx (x0 , y0 , z0 ) x0 + fy (x0 , y0 , z0 ) y0 + fz (x0 , y0 , z0 ) z0 Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 53 Beispiel Es sei (x0 , y0 , z0 ) ein Punkt des Ellipsoides x2 y 2 z 2 + 2 + 2 =1. a2 b c Gesucht ist die Tangentialebene in (x0 , y0 , z0 ) an das Ellipsoid (siehe Figur 3). Fig. 3 : Ellipsoid Wir fassen das Ellipsoid als die durch den Punkt (x0 , y0 , z0 ) gehende Niveaufläche der Funktion f : (x, y, z) → x2 y 2 z 2 + 2 + 2 −1 a2 b c auf. Die Tangentialebene wird dann durch die Gleichung fx (x0 , y0 , z0 )(x − x0 ) + fy (x0 , y0 , z0 )(y − y0 ) + fz (x0 , y0 , z0 )(z − z0 ) = 0, also durch 2x0 2y0 2z0 (x − x0 ) + 2 (y − y0 ) + 2 (z − z0 ) = 0 2 a b c 54 U. Stammbach: Analysis, Teil B beschrieben. Berücksichtigt man, dass der Punkt (x0 , y0 , z0 ) die Gleichung x20 y02 z02 + 2 + 2 =1 a2 b c erfüllt, so ergibt sich daraus die folgende einfache Form der Gleichung der Tangentialebene im Punkte (x0 , y0 , z0 ) an das Ellipsoid x0 y0 z0 x+ 2 y+ 2 z =1 . a2 b c Beispiel Die lineare Ersatzfunktion einer Funktion f von drei Variablen ist analog definiert wie im Falle von zwei Variablen. Sie ist diejenige lineare Funktion, die in (x0 , y0 , z0 ) denselben Funktionswert und auch dieselben ersten partiellen Ableitungen wie die Funktion f besitzt. Die lineare Ersatzfunktion von f : (x, y, z) → f (x, y, z) in (x0 , y0 , z0 ) wird deshalb durch die Formel (x, y, z) → f (x0 , y0 , z0 ) + fx (x0 , y0 , z0 )(x − x0 ) + fy (x0 , y0 , z0 )(y − y0 ) + fz (x0 , y0 , z0 )(z − z0 ) beschrieben. Schliesslich gilt auch hier, analog zum Fall von zwei Variablen, dass die Differenz zwischen dem Funktionswert und dem Wert der linearen Ersatzfunktion von kleinerer Grössenordnung ist als der Abstand des Punktes (x, y, z) vom Punkt (x0 , y0 , z0 ), d.h. es gilt lim ∆x,∆y,∆z→0 ϕ(∆x, ∆y, ∆z) =0. ∆x2 + ∆y 2 + ∆z 2 p Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 8 55 Koordinatentransformationen Zur leichten mathematischen Formulierung und zur Lösung eines in der Praxis anfallenden Problems trägt oft wesentlich die richtige Wahl des Koordinatensystems bei. So wird zum Beispiel bei einem achsensymmetrischen Problem mit Vorteil ein Zylinderkoordinatensystem verwendet, bei einem kugelsymmetrischen Problem ein Kugelkoordinatensystem, etc. Da die physikalischen Gesetze in der Regel in Form von Differentialgleichungen vorliegen, in denen unter anderem auch die partiellen Ableitungen der relevanten Grössen nach den kartesischen Koordinaten vorkommen, müssen bei einem Wechsel des Koordinatensystems auch diese Ableitungen umgerechnet, d.h. in den neuen Koordinaten ausgedrückt werden. Mit diesem Problem beschäftigt sich der vorliegenden Abschnitt. - Wir beginnen mit einem einfachen Beispiel in Polarkoordinaten und gehen anschliessend das Problem allgemein an. In der (x, y)-Ebene sei die Funktion F : (x, y) → F (x, y) = x2 − y 2 gegeben. Jedem Punkt der (x, y)-Ebene wird durch F eine reelle Zahl zugeordnet. Führen wir in der Ebene Polarkoordinaten ein, so ist der Funktionswert im Punkt mit Polarkoordinaten (ρ, ϕ) durch F̃ (ρ, ϕ) = F (x(ρ, ϕ)), y(ρ, ϕ)) gegeben. Dabei gilt (siehe Figur 1) x(ρ, ϕ) = ρ cos ϕ , y(ρ, ϕ) = ρ sin ϕ , also F̃ (ρ, ϕ) = F (ρ cos ϕ, ρ sin ϕ) = ρ2 (cos2 ϕ − sin2 ϕ) . Die Funktionen F und F̃ nehmen auf ein und demselben Punkt in der Ebene denselben Wert an; die eine drückt die Zuordnung in kartesischen die andere in Polarkoordinaten aus. Wir sagen, dass F und F̃ ein und dieselbe Punktfunktion beschreibe. Umgekehrt können wir die Polarkoordinaten (ρ, ϕ) in den kartesischen Koordinaten (x, y) ausdrücken. Es gilt bekanntlich 56 U. Stammbach: Analysis, Teil B ϕ = ϕ0 (y) ρ = ρ0 Fig. 1 : Polarkoordinatensystem (x) ρ(x, y) = (8.3) q x2 + y 2 ( ϕ(x, y) = arctan (y/x) , x>0 arctan (y/x) + π , x < 0 (Für x = 0 ist die Formel für ϕ sinnvoll zu ergänzen!) Man hat dann x2 y2 F (x, y) = F̃ (ρ(x, y), ϕ(x, y)) = (x + y ) − x2 + y 2 x2 + y 2 2 2 ! = x2 − y 2 . Wir wenden uns jetzt dem Problem in voller Allgemeinheit zu und betrachten neben dem kartesischen (x, y)-Koordinatensystem in der Ebene ein zweites Koordinatensystem mit Koordinaten (u, v) (siehe Figur 2). Dabei seien die x- und die y-Koordinaten des durch das Paar (u, v) beschriebenen Punktes durch die Funktionen x = x(u, v) , y = y(u, v) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 57 (y) v = v0 u = u0 Fig. 2 : Allgemeines Koordinatensystem (x) gegeben. Eine in (x, y)-Koordinaten beschriebene Punktfunktion F : (x, y) → F (x, y) wird folglich in (u, v)-Koordinaten durch (8.4) F̃ (u, v) = F (x(u, v), y(u, v)) ausgedrückt. Umgekehrt seien die (u, v)-Koordinaten in den kartesischen Koordinaten (x, y) durch u = u(x, y) , v = v(x, y) gegeben. Dann gilt analog zu (8.4) (8.5) F (x, y) = F̃ (u(x, y), v(x, y)) . Für die partiellen Ableitungen nach x und y ergibt sich aus der Formel (8.5) mit Hilfe der verallgemeinerten Kettenregel Fx (x, y) = F̃u (u(x, y), v(x, y)) ux (x, y) + F̃v (u(x, y), v(x, y)) vx (x, y) , 58 U. Stammbach: Analysis, Teil B Fy (x, y) = F̃u (u(x, y), v(x, y)) uy (x, y) + F̃v (u(x, y), v(x, y)) vy (x, y) . Die zweiten partiellen Ableitungen lauten dann (in abgekürzter Schreibweise, d.h. ohne die Argumente der Funktionen explizit hinzuschreiben) Fxx = (F̃u ux + F̃v vx )x = F̃uu u2x + F̃uv ux vx + F̃u uxx + F̃vu vx ux + F̃vv vx2 + F̃v vxx (8.6) Fxy = (F̃u ux + F̃v vx )y = F̃uu ux uy + F̃uv ux vy + F̃u uxy + F̃vu vx uy + F̃vv vx vy + F̃v vxy Fyy = (F̃u uy + F̃v vy )y = F̃uu u2y + F̃uv uy vy + F̃u uyy + F̃vu vy uy + F̃vv vy2 + F̃v vyy Auf analoge Weise lassen sich weitere partielle Ableitungen berechnen. Dabei werden die Ausdrücke mit wachsender Ordnung der Ableitung offensichtlich rasch sehr kompliziert. Statt weiter im allgemeinen Fall zu bleiben, betrachten wir nun zwei ganz konkrete Probleme. Beispiel In zahlreichen Anwendungen (Diffusion, Wärmeleitung, Wellenausbreitung, Torsion von Stäben, elektrisches Potential, etc.) spielt der sogenannte Laplace-Operator ∆ eine wichtige Rolle (P.S. Laplace 1749-1827); dieser ist für Funktionen f : (x, y) → f (x, y) durch ∆f = fxx + fyy definiert. Wie stellt sich dieser Operator in Polarkoordinaten dar? Nach unseren Überlegungen wird die Funktion f in Polarkoordinaten durch f˜(ρ, ϕ) = f (x(ρ, ϕ)), y(ρ, ϕ)) beschrieben. Umgekehrt gilt f (x, y) = f˜(ρ(x, y), ϕ(x, y)) , wobei ρ(x, y) und ϕ(x, y) durch (8.3) gegeben sind. Nun liefert die Formel (8.6) (8.7) fxx + fyy = f˜ρρ (ρ2x + ρ2y ) + f˜ρϕ (ρx ϕx + ρy ϕy )+ +f˜ρ (ρxx + ρyy ) + f˜ρϕ (ρx ϕx + ρy ϕy ) + f˜ϕϕ (ϕ2x + ϕ2y ) + f˜ϕ (ϕxx + ϕyy ) . Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung 59 Aus (8.3) folgt ρx = ρy = ϕx = ϕy = ∂ 2 x = cos ϕ (x + y 2 )1/2 = p 2 ∂x x + y2 ∂ 2 y = sin ϕ (x + y 2 )1/2 = p 2 ∂y x + y2 ∂ − sin ϕ −y = arctan (y/x) = 2 2 ∂x x +y ρ ∂ cos ϕ x = arctan (y/x) = 2 ∂y x + y2 ρ sin2 ϕ ρ 2 cos ϕ = (ρy )y = cos ϕ ϕy = ρ ρxx = (ρx )x = − sin ϕ ϕx = ρyy −(cos ϕ ϕx ρ − sin ϕ ρx ) 2 sin ϕ cos ϕ = 2 ρ ρ2 − sin ϕ ϕy ρ − cos ϕ ρy −2 sin ϕ cos ϕ = (ϕy )y = = . 2 ρ ρ2 ϕxx = (ϕx )x = ϕyy Daraus ergibt sich ρ2x + ρ2y = 1 ρx ϕx + ρy ϕy = 0 ρxx + ρyy = 1/ρ ϕ2x + ϕ2y = 1/ρ2 ϕxx + ϕyy = 0 . Einsetzen in (8.6) liefert die Form des Laplace-Operators in Polarkoordinaten, indem für die durch f bzw. f˜ gegebene Punktfunktion die Identität ∆f ≡ fxx + fyy ≡ f˜ρρ + ρ1 f˜ρ + 1 ˜ ρ2 fϕϕ gilt. In konkreten Fällen sind neben den üblichen Koordinatensystemen oft auch ganz andere von grossem Nutzen. Wir betrachten dazu das folgende Beispiel. 60 U. Stammbach: Analysis, Teil B Beispiel Die Funktion f : (x, t) → f (x, t) beschreibe eine vom der x-Koordinate und der Zeit t abhängige physikalische Grösse. Sie erfülle die (partielle) Differentialgleichung ftt = c2 fxx , (8.8) wobei c > 0 eine reelle Zahl bezeichnet. Die Differentialgleichung (8.8) heisst (eindimensionale) Wellengleichung. Sie heisst so, weil sie bei der mathematischen Behandlung von jeder Art von Wellen (Wasserwellen, Schallwellen, elektromagnetische Wellen (also Licht!), etc.) auftritt. Ihre Lösungen beschreiben einen Ausbreitungsvorgang. Dies weisen wir wie folgt nach: Wir führen in der (x, t)-Ebene neue Koordinaten (u, v) ein, indem wir u = x + ct , v = x − ct setzen, oder äquivalent x= (siehe Figur 3). u+v u−v , t= 2 2c Beschreiben f und f˜ dieselbe Punktfunktion, so gelten die Beziehungen u+v u−v , 2 2c f (x, t) = f˜(x + ct, x − ct) . f˜(u, v) = f Berechnet man die nach unserer Formel (8.6) relevanten Ausdrücke, so erhält man wegen ux = 1 , ut = c , vx = 1 , vt = −c sofort fx = f˜u ux + f˜v vx = f˜u + f˜v fxx = f˜uu ux + f˜uv vx + f˜vu ux + f˜vv vx = f˜uu + 2f˜uv + f˜vv ft = f˜u ut + f˜v vt = c (f˜u − f˜v ) Kapitel IV. Funktionen von mehreren Variablen, Differentialrechnung (t) 61 v = v0 u = u0 Fig. 3 : Neues Koordinatensystem für die Wellengleichung (x) ftt = c (f˜uu ut + f˜uv vt − f˜vu ut − f˜vv vt ) = c2 (f˜uu − 2f˜uv + f˜vv ) . Die Wellengleichung stellt sich deshalb in den neuen Koordinaten durch c2 (f˜uu − 2f˜uv + f˜vv ) = c2 (f˜uu + 2f˜uv + f˜vv ) dar, also durch die sehr einfache partielle Differentialgleichung (8.9) f˜uv = 0 . Die Lösungen der Differentialgleichung (8.9) lassen sich nach Abschnitt 2 sofort angeben. Es gilt f˜(u, v) = F (u) + G(v) , 62 U. Stammbach: Analysis, Teil B G(x) G(x − 1c) G(x − 2c) Fig. 4 : Nach rechts fortschreitende Störung für t = 0, 1, 2, 3, 4 G(x − 3c) G(x − 4c) wobei F : u → F (u) und G : v → G(v) zwei beliebige differenzierbare Funktionen sind. Geht man wieder zu den ursprünglichen Koordinaten (x, t) zurück, so erhält man f (x, t) = F (x + ct) + G(x − ct) . Der erste der hier auftretenden Summanden kann als eine mit Schnelligkeit c nach links fortschreitende Störung der durch f beschriebenen Grösse interpretiert werden und der zweite als eine mit der gleichen Schnelligkeit nach rechts fortschreitende Störung (siehe Figur 4). Was wir hier beschrieben haben, ist die sogenannte d’Alembert’sche Methode zur Lösung der Wellengleichung (J.B. d’Alembert 1717-1783). Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel V. Funktionen von mehreren Variablen Integralrechnung Die Mathematik ist die Wissenschaft, bei der sich alles von selbst versteht. C. G. J. Jacobi 1804 - 1851 Inhaltsverzeichnis 1 Das Gebietsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Koordinatentransformationen bei Gebietsintegralen . . . . . . . . . . . . . . . . . 12 3 Das Volumenintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 Zur Transformation von Gebiets- und Volumenintegralen . . . . . . . . . . . . . . 30 5 Integrale mit Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 1 3 Das Gebietsintegral Wir führen in diesem Abschnitt Gebietsintegrale, d.h. Integrale über eine Funktion von zwei Variablen in Analogie zu gewöhnlichen Integralen ein. Die Interpretation solcher Integrale in einem Spezialfall führt uns dann dazu, diese mit Hilfe von zwei aufeinanderfolgenden Integrationen über die beiden Variablen zu berechnen. Zuerst zur Definition. Wie schon beim bestimmten Integral über eine Funktion einer Variablen werden wir uns auch hier mit einer Definition begnügen, die nicht den allgemeinsten Fall abdeckt, die aber für die Anwendungen, die wir im Auge haben, durchaus genügt. Zum einen werden wir nur stetige Funktionen f : (x, y) → f (x, y) als Integrand zulassen; zum andern wollen wir voraussetzen, dass der Integrationsbereich B endlich und durch eine differenzierbare Kurve (ohne Doppelpunkte) begrenzt wird. Die folgenden Schritte führen dann zur Definition des Gebietsintegrals (siehe Figur 1). (y) Fig. 1 : Zur Definition des Gebietsintegrals ∆Bi (xi , yi ) (x) (a) Teile B (durch differenzierbare Kurven) in Teilbereiche ∆Bi mit Flächeninhalt ∆Fi ein, i = 1, 2, . . . , n. 4 U. Stammbach: Analysis, Teil B (b) Wähle in jedem Teilbereich ∆Bi , i = 1, 2, . . . , n einen Punkt (xi , yi ). Unter der Feinheit der Einteilung verstehen wir den Durchmesser der kleinsten Kreisscheibe, welche in der Lage ist, jeden einzelnen der Teilbereiche ∆Bi zu überdecken. (c) Bilde die Riemann’sche Summe n X f (xi , yi ) ∆Fi . i=1 (d) Definiere das Gebietsintegral als Grenzwert ZZ B f (x, y) dF = lim n X ! f (xi , yi ) ∆Fi , i=1 wobei für den Grenzübergang eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null strebt. Es gilt das Resultat - sonst wäre die Definition nicht sinnvoll -, dass unter den getroffenen Voraussetzungen der Wert des Limes unabhängig von der gewählten Einteilungsfolge ist. Ein Gebietsintegral tritt auf natürliche Art im folgenden Beispiel auf. Beispiel Es sei f : (x, y) → f (x, y) eine auf B definierte stetige Funktion. Wie gross ist das Volumen V des über dem Bereich B liegenden Körpers, welcher gegen oben durch den Graphen von f begrenzt wird? Die zu einer Einteilung von B gehörige Riemann’sche Summe liefert offensichtlich eine Approximation für V . Das Volumen selbst wird als Limes erhalten, wenn die Feinheit der Einteilung gegen Null geht; es gilt also ZZ V = f (x, y) dF . B Dieses Beispiel legt uns unmittelbar auch eine Berechnungsart für das Integral nahe. Wir zerschneiden den Körper wie in Kapitel III, Abschnitt 9 durch Schnitte parallel zur (y, z)-Ebene in dünne Scheiben (siehe Figur 2). Ist F (x) der Flächeninhalt der Schnittfigur an der Stelle x, so ist das gesuchte Volumen V durch V = Z β α F (x) dx gegeben. Um den Flächeninhalt F (x) zu bestimmen, zeichnen wir den entsprechenden Schnitt auf (siehe Figur 3). Offensichtlich gilt F (x) = Z δ(x) γ(x) f (x, y) dy . Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (y) δ(x) Fig. 2 : Erste Berechnungsart B γ(x) (x) α x β (z) Fig. 3 : Erste Berechnungsart; Schnitt bei x z = f (x, y) F (x) (y) γ(x) δ(x) 5 6 U. Stammbach: Analysis, Teil B (Wir nehmen hier stillschweigend an, dass für jedes α ≤ x ≤ β der Schnitt an der Stelle x den Rand des Bereiches B in höchstens zwei Punkten schneidet. Sollte das nicht von Anfang an der Fall sein, so müsste der Bereich entsprechend unterteilt werden.) Das Volumen des Körpers drückt sich dann durch V = ZZ B f (x, y) dF = Z β α F (x) dx = Z β α dx Z δ(x) γ(x) f (x, y) dy aus. Die letztere Formel ist ein sogenanntes Doppelintegral. Sie liefert eine Berechnungsart für das Gebietsintegral: in einem ersten Schritt wird das “innere” und in einem zweiten Schritt das “äussere” Integral ausgewertet. Beispiel Es sei f : (x, y) → f (x, y) = x gegeben und als Integrationsbereich B der zu x ≥ 0 gehörige Teil der Ellipsenfläche x2 y 2 + 2 =1. a2 b (y) (x, +b b p 1 − x2 /a2 ) (x) 0 x (x, −b a p 1 − x2 /a2 ) Es sei 0 ≤ x ≤ a (siehe Figur 4). Dann sind γ(x) und δ(x) durch Fig. 4 : Erste Berechnungsart; Beispiel Kapitel V. Funktionen von mehreren Variablen. Integralrechnung q 7 q γ(x) = −b 1 − x2 /a2 , δ(x) = +b 1 − x2 /a2 gegeben. Ferner gilt α = 0, β = +a. Man erhält dann der Reihe nach V ZZ = Z = a Z Z = 2 √ −b 1−x2 /a2 1−x2 /a2 x dy +b a 0 −b dx xb q 1−x /a 1 − x2 /a2 ia 1h (1 − x2 /a2 )3/2 0 3 = −2ba2 = √ +b √ 2 2 1−x /a dx [xy] √ 2 2 a 0 Z dx 0 = x dF B 2 2 ba . 3 Es ist natürlich klar, dass die Rolle der Variablen x und y vertauscht werden kann (siehe Figur 5): Zerschneiden wir den Körper durch Ebenen parallel zur (x, z)-Ebene, so wird der Flächeninhalt der zu y gehörigen Schnittfigur durch F̃ (y) = Z β(y) α(y) f (x, y) dx gegeben, so dass wir V = ZZ B f (x, y) dF = Z γ δ F̃ (y) dy = Z γ δ dy Z β(y) α(y) erhalten. Beispiel Für das oben bereits betrachtete Beispiel ZZ B x dF erhalten wir für die Grössen α(y), β(y) q α(y) = 0 , β(y) = a 1 − y 2 /b2 . (siehe Figur 6). Ausserdem gilt γ = −b, δ = b. Daraus ergibt sich f (x, y) dx 8 U. Stammbach: Analysis, Teil B (y) δ Fig. 5 : Zweite Berechnungsart B y γ (x) α(y) β(y) (y) b (a p 1 − y 2 /b2 , y) y (x) a −b Fig. 6 : Zweite Berechnungsart; Beispiel Kapitel V. Funktionen von mehreren Variablen. Integralrechnung V ZZ = = +b = = = = dy −b Z = x dF B Z a2 0 x2 2 dy −b 2 Z a√1−y2 /b2 " +b a2 Z +b −b y3 y− 2 3b a2 x dx #a√1−y2 /b2 0 dy(1 − y 2 /b2 ) " 2 9 #+b 1 2 b− b 2 3 2 2 a b. 3 −b Es ist an dieser Stelle wichtig zu erkennen, dass die Berechnung eines Gebietsintegrals durch eine zweifache Integration natürlich nicht davon abhängig ist, dass das Gebietsintegral ZZ B f (x, y) dF ein Volumen ausdrückt. In der Tat ist die Interpretation des Gebietsintegrals als Volumen nur eine von vielen möglichen Interpretationen, wie ja auch die Interpretation des gewöhnlichen bestimmten Integrals als Flächeninhalt nur eine von vielen möglichen Interpretationen ist. Beispiel Wir betrachten den zu x ≥ 0 gehörigen Teil B der Ellipse x2 y 2 + 2 =1. a2 b Man berechne den Schwerpunkt S des Flächenstücks, wenn es homogen mit Masse belegt ist. Ist S = (xS , yS ), so gilt aus Symmetriegründen natürlich yS = 0. Um xS zu berechnen, liefert die Momentbedingung die Beziehung xS · F = ZZ B x dF , wo F den Flächeninhalt der Halbellipse bezeichnet. Das hier auftretende Gebietsintegral drückt ein Moment aus; sein Wert wurde aber bereits im vorhergehenden Beispiel bestimmt, als es um die Berechnung eines Volumens ging. Auch hier würde man seinen Wert durch die gleiche Technik, d.h. durch doppelte Integration bestimmen. Verwenden wir das oben hergeleitete Resultat, so erhalten wir 10 U. Stammbach: Analysis, Teil B xS = 2 2 2 4 a b= a. πab 3 3π Gebietsintegrale treten in vielen Anwendungen auf; als Beispiele erwähnen wir - Berechnung der Gesamtmasse bei gegebener Flächendichte auf B, - Berechnung der Gesamtladung bei gegebener Flächenladungsdichte auf B, - Berechnung des hydrostatischen Drucks auf eine senkrechte Wand der Form B, - Berechnung des Schwerpunktes eines ebenen Bereiches B, - Berechnung des Flächenträgheitsmomentes eines ebenen Bereiches B. Zur letzten Anwendung betrachten wir das folgende konkrete Beispiel. Beispiel Gesucht ist das polare Trägheitsmoment J0 eines gleichseitigen Dreiecks mit Seite a bezüglich seines Schwerpunktes (siehe Figur 7). (y) B D S (x) D0 C M A= √ a − 3 2, 6 a Fig. 7 : Polares Trägheitsmoment eines gleichseitigen Dreiecks bezüglich seines Schwerpunktes Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 11 Wir wählen das Koordinatensystem so, dass sein Nullpunkt mit dem Schwerpunkt S zusammenfällt und eine Ecke des Dreiecks auf der positiven y-Achse liegt. Nach der Definition des polaren Flächenträgheitsmomentes (siehe Mechanik) gilt ZZ J0 = D (x2 + y 2 ) dF , wo D das gleichseitige Dreieck bezeichnet. Es gilt √ ! a − 3 A= , a , 2 6 und die durch SA bestimmte Gerade hat die Gleichung 1 y = −√ x . 3 Aus Symmetriegründen erhalten wir J0 = 6 · ZZ D0 (x2 + y 2 ) dF , wo D0 das Dreieck ASM bezeichnet. Wir erhalten J0 = 6 · = 6· = 6· Z 0 − Z 3 a 6 0 − Z √ √ 3 a 6 0 − √ 3 a 6 = −2 · 6 · dy √ − 3 y Z 0 dx(x2 + y 2 ) #−√3y " x3 dy + xy 2 3 0 √ 3 √ 3 dy(− 3y − 3y ) √ Z 3 0 − " √ 3 a 6 √ y4 = −2 · 6 · 3 4 √ 9a4 = 3· 3 4 4 2 ·3 √ 3 4 = a . 3 · 16 y 3 dy #0 − √ 3 a 6 Wir überlassen es dem Leser, das Resultat zu kontrollieren, indem die zweifache Integration in der umgekehrten Reihenfolge durchgeführt wird. 12 2 U. Stammbach: Analysis, Teil B Koordinatentransformationen bei Gebietsintegralen Wir beginnen hier mit einem Beispiel, das zeigt, wie die geschickte Wahl eines dem Problem angepassten neuen Koordinatensystems die Berechnung eines Gebietsintegrals erleichtern kann. Beispiel Aus einer Kugel mit Radius a wird ein Loch in der Form eines geraden Kreiszylinders mit Grundkreisradius a/2 herausgebohrt und zwar so, dass die Achse des Kreiszylinders den Kugelmittelpunkt enthält. Wie gross ist das Volumen des herausgebohrten Teils der Kugel? Wir geben uns die Kugel durch x2 + y 2 + z 2 = a2 und wählen die z-Achse als Zylinderachse (siehe Figur 1). Der Grundkreis des Zylinders wird durch (y) a B a/2 (x) 2 Fig. 1 : Zentrale zylindrische Ausbohrung der Kugel a 2 beschrieben. Das gesuchte Volumen V ist dann durch das Gebietsintegral 2 2 x +y = ZZ q 2 B a2 − x2 − y 2 dF 12 2 U. Stammbach: Analysis, Teil B Koordinatentransformationen bei Gebietsintegralen Wir beginnen hier mit einem Beispiel, das zeigt, wie die geschickte Wahl eines dem Problem angepassten neuen Koordinatensystems die Berechnung eines Gebietsintegrals erleichtern kann. Beispiel Aus einer Kugel mit Radius a wird ein Loch in der Form eines geraden Kreiszylinders mit Grundkreisradius a/2 herausgebohrt und zwar so, dass die Achse des Kreiszylinders den Kugelmittelpunkt enthält. Wie gross ist das Volumen des herausgebohrten Teils der Kugel? Wir geben uns die Kugel durch x2 + y 2 + z 2 = a2 und wählen die z-Achse als Zylinderachse (siehe Figur 1). Der Grundkreis des Zylinders wird durch (y) a B a/2 (x) 2 Fig. 1 : Zentrale zylindrische Ausbohrung der Kugel a 2 beschrieben. Das gesuchte Volumen V ist dann durch das Gebietsintegral 2 2 x +y = ZZ q 2 B a2 − x2 − y 2 dF Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 13 gegeben, wo B die Grundfläche des Zylinders bezeichnet. Dieses Gebietsintegral kann in ein Doppelintegral umgewandelt werden: V =2 Z +a/2 −a/2 dx q Z + q − a2 −x2 4 q a2 −x2 4 a2 − x2 − y 2 dy . Im Prinzip lassen sich die hier auftretenden zwei Integrationen durchführen, allerdings sind wie man leicht sieht - die dazu notwendigen Rechnungen sehr umständlich. Eine bessere, weil einfachere Art, das Problem anzugehen, besteht darin, zuerst ein angepasstes Koordinatensystem einzuführen. Wegen der Rotationssymmetrie bezüglich der z-Achse bietet sich dafür natürlich ein Zylinderkoordinatensystem an mit Polarkoordinaten in der (x, y)-Ebene. Wegen x2 + y 2 = ρ2 darf man schreiben V =2 ZZ q B a2 − ρ2 dF . Für die Berechnung denkt man sich das Gebiet B durch die Koordinatenlinien der Polarkoordinaten eingeteilt. Eine heuristische Überlegung zeigt, dass der Flächeninhalt des “Flächenelementes” in Polarkoordinaten durch (siehe Figur 2) dF = ρ dρ dϕ gegeben ist. Für die Berechnung des Gebietsintegrales halte man nun zuerst ϕ fest, integriere über ρ und anschliessend über ϕ. Man erhält auf diese Weise für V ein Doppelintegral, das sich auf die übliche Art und Weise berechnen lässt: V Z = 2 Z = 2 Z 2π 0 2π 0 2π dϕ Z a/2 0 q ρ a2 − ρ2 dρ 1 dϕ − (a2 − ρ2 )3/2 3 1 3 2 = 2 dϕ − a 3 4 0 √ ! 3 3 3 4π = a 1− 3 8 √ 8−3 3 = π a3 . 6 3/2 a/2 0 1 + (a2 )3/2 3 ! Beispiel Es sei die Kugel x2 + y 2 + z 2 = a2 gegeben. Es werde ein Loch in der Form eines geraden Kreiszylinders mit Radius a/2 und Achse parallel zur z-Achse herausgebohrt, wobei die Zylinderachse die (x, y)-Ebene im Punkt (a/2, 0) trifft (siehe Figur 3). 14 U. Stammbach: Analysis, Teil B (y) Fig. 2 : Flächenelement in Polarkoordinaten dF ρdϕ dϕ dρ ρ (x) (y) a cos ϕ ϕ (a/2, 0) B (x) Fig. 3 : Tangentiale zylindrische Ausbohrung der Kugel Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 15 Wiederum rechnen wir in Polarkoordinaten (obschon das Problem nicht achsensymmetrisch ist): V ZZ q = 2 Z ZB Z B0 π/2 = 4 = 4 Z = = = = = = Beispiel telpunkt. 0 a2 − ρ2 dF q a2 − ρ2 dF dϕ Z a cos ϕ q a2 − ρ2 ρ dρ 0 a cos ϕ 1 4 dϕ − (a2 − ρ2 )3/2 3 0 0 Z π/2 1 3 1 4 − a (1 − cos2 ϕ)3/2 + a3 dϕ 3 3 0 Z π/2 4 3 (1 − sin3 ϕ) dϕ a 3 0 Z 4 3 π/2 (1 − sin ϕ + cos2 ϕ sin ϕ)dϕ a 3 0 4 3 π 1 a −1+ 3 2 3 6π − 8 3 a . 9 π/2 Gesucht ist das polare Flächenträgheitsmoment eines Kreisringes um den Mit- Wir wählen das Koordinatensystem mit dem Ursprung im Mittelpunkt des Kreisringes und verwenden Polarkoordinaten. J0 = ZZ B 2 ρ dF = Z 0 2π dϕ Z Beispiel Das sogenannte Fehlerintegral J= " a ρ4 ρ ρ dρ = 2π 4 Z ∞ b 2 −∞ #b = a π 4 (b − a4 ) . 2 2 e−x dx spielt in der Statistik und Wahrscheinlichkeitsrechnung eine wichtige Rolle. Wir haben in Kapitel III, Abschnitt 13 die Existenz dieses Integrals nachgewiesen. Die Berechnung scheiterte aber daran, dass die Stammfunktion von x → e−x 2 nicht durch elementare Funktionen ausdrückbar ist. Die folgende Überlegung liefert diesen Wert auf dem Umweg über ein Gebietsintegral. (Wegen der auftretenden uneigentlichen Integralen ist 16 U. Stammbach: Analysis, Teil B vom mathematischen Standpunkt aus unser Vorgehen etwas forsch; dafür kommt die zugrunde liegende Idee aber besser zur Geltung. Zur Beruhigung des Lesers können wir anfügen, dass der Mathematiker unser Vorgehen mit geringem zusätzlichen Aufwand rechtfertigen kann.) Wir beginnen damit, dass wir nicht J selbst, sondern J 2 zu berechnen versuchen. J 2 Z = ∞ −∞ ∞ Z = Z−∞ Z = ZZ = = −x2 e dx Z dx · ∞ = −∞ = 2 −∞ e ganze Ebene e−y dy 2 · e−y dy e−(x 2 +y 2 ) dF 2 2π 0 Z ∞ −x2 ganze Ebene Z Z 2π 0 dϕ Z ∞ 0 e−ρ dF 2 e−ρ ρ dρ " 2 e−ρ dϕ − 2 #∞ 0 = π. Wir erhalten also Z ∞ −∞ 2 e−x dx = √ π. Dieses Beispiel zeigt sehr schön, wie ein Koordinatenwechsel einem Problem mit einem Schlag ein anderes Gesicht geben kann. Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 3 17 Das Volumenintegral Das Volumenintegral ist analog zum Gebietsintegral definiert. Ein wesentlicher Unterschied besteht allerdings darin, dass der Graph des Integranden für eine anschauliche Interpretation nicht mehr herangezogen werden kann. Definition Es sei eine stetige Funktion f : (x, y, z) → f (x, y, z) gegeben und ein endlicher räumlicher Bereich B. Das Volumenintegral ZZZ B f (x, y, z) dV ist dann wie folgt definiert (siehe Figur 1): (z) Fig. 1 : Zur Definition des Volumenintegrals B ∆Bi (xi , yi , zi ) (y) (x) (a) Teile B (durch Flächen, die durch differenzierbare Funktionen gegeben sind) in Teilbereiche ∆Bi mit Volumen ∆Vi ein, i = 1, 2, . . . , n. 18 U. Stammbach: Analysis, Teil B (b) Wähle in jedem ∆Bi , i = 1, 2, . . . , n einen Punkt (xi , yi , zi ). Die Feinheit der Einteilung ist der Durchmesser der kleinsten Kugel, welche in der Lage ist, jeden einzelnen der Teilbereiche ∆Bi zu überdecken. (c) Bilde die Riemann’sche Summe n X f (xi , yi , zi ) ∆Vi . i=1 (d) Das Volumenintegral ist definiert als Grenzwert ZZZ B f (x, y, z) dV = lim n X ! f (xi , yi , zi ) ∆Vi , i=1 wobei eine Folge von Einteilungen von B zugrunde zu legen ist, deren Feinheit gegen Null strebt. Es gilt auch hier das mathematische Resultat, dass der Wert des Limes nicht von der gewählten Einteilungsfolge abhängig ist. Da uns anschaulich der Graph der Funktion f : (x, y, z) → f (x, y, z) nicht zur Verfügung steht, suchen wir nach einer anderen einfachen Interpretation für das Volumenintegral. Eine von vielen Möglichkeiten ist die folgende. Es sei B ein dreidimensionaler Körper; dessen Dichte im Punkte (x, y, z) werde durch die Funktion ρ(x, y, z) beschrieben. Dann ist ρ(xi , yi , zi )·∆Vi approximativ die in ∆Bi vorhandene Masse, und die Riemann’sche Summe n X ρ(xi , yi , zi ) ∆Vi i=1 liefert eine Approximation für die Masse des Körpers. Die Approximation ist offensichtlich umso besser, je feiner die Einteilung von B ist. Die Gesamtmasse ist somit durch den Grenzübergang gegeben, d.h. sie ist gleich: M= ZZZ B ρ(x, y, z) dV . Volumenintegrale treten in vielen weiteren Zusammenhängen auf, einige davon werden wir in den folgenden Beispielen oder auch später in dieser Vorlesung kennenlernen. Beispiel Es ist das Trägheitsmoment Θ eines homogenen (Dichte ρ) Würfels mit Kantenlänge a gesucht und zwar um eine durch den Mittelpunkt des Würfels und den Mittelpunkt einer Seitenfläche gehenden Achse. Wählen wir das Koordinatensystem wie in der Figur 2, so gilt für das Trägheitsmoment um die z-Achse laut Definition ZZZ Θ=ρ (x2 + y 2 ) dV . W Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 19 (z) Fig. 2 : Trägheitsmoment eines Würfels W0 (y) (a/2, 0, 0) (x) W Aus Symmetriegründen ist der Beitrag an Θ von jedem der acht Teilwürfel in den Oktanten des Koordinatensystems gleich gross, so dass gilt Θ=8ρ ZZZ W0 (x2 + y 2 ) dV , wo W 0 der Teilwürfel im 1. Oktanten ist. Analog wie beim Gebietsintegral berechnen wir das Volumenintegral durch Zurückführung auf gewöhnliche Integrationen: Wir wandeln das Volumenintegral in ein dreifaches Integral um. Schrittweise erhalten wir (siehe Figur 3): - Anteil einer “dünnen” Säule an das Trägheitsmoment des Würfels W 0 ρ dx dy Z a/2 0 (x2 + y 2 ) dz , - Anteil einer “dünnen Scheibe” an das Trägheitsmoment als “Summe” der Anteile der Säulen Z a/2 Z a/2 ρ dx dy (x2 + y 2 ) dz , 0 - Trägheitsmoment des Würfels ρ Z 0 W0 a/2 0 als “Summe” der Anteile der Scheiben dx Z 0 a/2 dy Z 0 a/2 (x2 + y 2 ) dz . 20 U. Stammbach: Analysis, Teil B (z) a/2 Fig. 3 : Berechnung des Integrals über W 0 dz (y) a/2 dx a/2 dy (x) Damit erhalten wir das Trägheitsmoment Θ als ein dreifaches Integral, welches sich ohne weiteres berechnen lässt: Θ = 8ρ = 8ρ = 8ρ Z Z a/2 0 0 a 2 a = 8ρ 2 a = 8ρ 2 a/2 Z dx dx a/2 0 Z a/2 0 Z 0 a/2 Z 0 Z 0 dx a/2 a/2 Z Z dy h 0 dx " a/2 0 ia/2 dy (x2 + y 2 ) y3 x2 y + 3 #a/2 0 x2 a a3 + 2 3·8 a ax3 a3 x = 8ρ + 2 2·3 3·8 a a4 = 8ρ · 2 3·8 (x2 + y 2 ) dz dy x2 z + y 2 z " dx a/2 #a/2 0 ! 0 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung = ρ 21 a5 . 6 Beispiel Gesucht ist das Trägheitsmoment Θ um die x-Achse des homogenen Tetraeders T mit Eckpunkten (0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1). Es gilt laut Definition Θ=ρ ZZZ T (y 2 + z 2 ) dV . Die mathematische Aufgabe besteht darin, dieses Volumenintegral in ein dreifaches Integral umzuwandeln. Wir gehen dabei ähnlich vor wie im obigen Beispiel (siehe Figur 4). (z) (0, 0, 1) y+z =1 Fig. 4 : Trägheitsmoment eines Tetraeders (0, y, z) (y) (0, 1, 0) x+y+z =1 (1, 0, 0) (x) - Für festes (y, z) betrachten wir die “Säule” in Richtung der x-Achse. Ihr Anteil an das Trägheitsmoment ist ρ dz dy Z 0 1−y−z (y 2 + z 2 ) dx . Die Grenzen für die Integration sind x = 0 (Punkt in der (y, z)-Ebene) und der x-Wert des zu y und z gehörigen Punktes auf der Ebene x + y + z = 1, also x = 1 − y − z. 22 U. Stammbach: Analysis, Teil B - Für festes z betrachten wir die “Scheibe” parallel zur (x, y)-Ebene. Ihr Anteil an das Trägheitsmoment Θ ist die “Summe” der Anteile aller “Säulen” für festgehaltenes z, also ρ dz Z 1−z dy 0 Z 1−y−z 0 (y 2 + z 2 ) dx . Die Grenzen für die y-Integration sind: y = 0 und der y-Wert, des zu z gehörigen Punktes auf der Geraden y + z = 1, also y = 1 − z. - Das ganze Trägheitsmoment Θ ist die ”Summe” der Anteile aller dieser “Scheiben”: Θ=ρ Z 0 1 dz Z 1−z dy 0 Z 1−y−z 0 (y 2 + z 2 ) dx . Wir erhalten nun der Reihe nach Θ = ρ = ρ = ρ Z 0 Z = = = 1 0 Z 0 Z = 1 1 dz dz Z 0 Z 0 " dz 1−z 1−z h dy y 2 x + z 2 x i1−y−z 0 dy (y 2 − y 3 − y 2 z + z 2 − z 2 y − z 3 ) y3 y4 y3z z2 y2 − − + z2y − − z3y 3 4 3 2 #1−z 0 i1−z ρ 1 h 3 dz 4y − 3y 4 − 4y 3 z + 12z 2 y − 6z 2 y 2 − 12z 3 y 0 12 0 Z ρ 1 4 (7z − 16z 3 + 12z 2 − 4z + 1) dz 12 0 ρ 7 −4+4−2+1 12 5 ρ . 30 Auch bei Volumenintegralen lohnt es sich manchmal, ein neues Koordinatensystem einzuführen. Wir betrachten hier zuerst den Fall von Kugelkoordinaten. Beispiel Es ist das Volumen einer Kugel K mit Radius R zu berechnen. Wir führen ein Kugelkoordinatensystem ein, dessen Ursprung mit dem Mittelpunkt der Kugel zusammenfällt (siehe Figur 5). Dann gilt offenbar V = ZZZ K 1 dV . Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (z) Fig. 5 : Volumen einer Kugel R (y) (x) (z) dϕ Fig. 6 : Das Volumenelement bei Kugelkoordinaten r sin θ θ dV rdθ dθ r dr 23 24 U. Stammbach: Analysis, Teil B Wie man aus der Figur 6 entnimmt, drückt sich das Volumenelement in Kugelkoordinaten (r, ϕ, θ) durch dV = dr (r dθ) (r sin θ) dϕ = r 2 sin θ dr dϕ dθ aus. Wandeln wir das Volumenintegral in ein dreifaches Integral über r, θ, ϕ (in dieser Reihenfolge) um, so erhalten wir V Z = 0 Z = 0 Z = = 0 2π 2π 2π dϕ dϕ Z Z π 0 π 0 dθ dθ Z 0 R dr r 2 sin θ R3 sin θ 3 R3 dϕ 2 3 4 3 πR . 3 Damit wird ein altes, allen wohlbekanntes Resultat bestätigt. Beispiel Es ist die Gravitationskraft einer homogenen Kugel mit Radius a, Dichte ρ auf einen Massenpunkt m im Abstand h (h ≥ a) vom Mittelpunkt der Kugel zu berechnen. Wir wählen ein Kugelkoordinatensystem mit Ursprung im Mittelpunkt der Kugel und den Massenpunkt m im Punkt mit den kartesischen Koordinaten (0, 0, h) (siehe Figur 7). Die von ~ ist auf dV zugerichtet. der Teilmasse ρ · dV der Kugel herrührende, auf m wirkende Teilkraft dK ~ Für den Betrag von dK gilt nach Newton ~ = γ m ρ dV . |dK| R2 ~ ist die “Summe” dieser Teilkräfte über alle Volumenelemente dV Die resultierende Totalkraft K ~ parallel zur der Kugel, also das Volumenintegral über die Kugel. Aus Symmetriegründen wird K z-Achse (gegen den Mittelpunkt der Kugel zu gerichtet) sein, so dass für die “Summen”bildung ~ eine Rolle spielt. nur die dritte Komponente von dK Man liest aus der Figur 8 die folgenden Beziehungen ab R = cos α = (h − r cos θ)2 + (r sin θ)2 1/2 = (r 2 + h2 − 2rh cos θ)1/2 , h − r cos θ . R Damit lässt sich dK3 vollständig in Kugelkoordinaten ausdrücken; man erhält Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 25 (z) (0, 0, h) m Fig. 7 : Gravitationskraft einer Kugel a (y) (x) m ~ dK dK3 α h − r cos θ R Fig. 8 : Zur Berechnung der Gravitationskraft einer Kugel h r sin θ r cos θ θ 0 r 26 U. Stammbach: Analysis, Teil B dK3 = −γmρ h − r cos θ r 2 sin θ dr dϕ dθ . + h2 − 2rh cos θ)3/2 (r 2 Damit folgt durch Integration über die Kugel und gleichzeitiger Umwandlung in ein dreifaches Integral in Kugelkoordinaten K = −γmρ Z 2π 0 dϕ Z a 0 dr Z π 0 (r 2 h − r cos θ r 2 sin θ dθ . + h2 − 2rh cos θ)3/2 Wir berechnen zuerst die beiden Summanden I1 und I2 des inneren Integrals. Es gilt I1 = hr 2 Z π 0 sin θ dθ (r 2 + h2 − 2rh cos θ)3/2 iπ 2hr 2 h 2 = − (r + h2 − 2rh cos θ)−1/2 0 2rh 2 2 −1/2 2 = −r (r + h + 2rh) − (r + h2 − 2rh)−1/2 = −r = 1 1 − h+r h−r , da h ≥ r , 2r 2 . h2 − r 2 Der zweite Summand lautet I2 = −r 3 Z 0 π (r 2 sin θ cos θ dθ . + h2 − 2rh cos θ)3/2 Wir wenden in einem ersten Schritt partielle Integration an. Wir setzen u0 = sin θ , (r 2 + h2 − 2rh cos θ)3/2 v = cos θ und erhalten u=− 1 (r 2 + h2 − 2rh cos θ)−1/2 , rh v 0 = − sin θ . Damit folgt I2 = −r 3 1 − (r 2 + h2 − 2rh cos θ)−1/2 cos θ rh π 0 + r3 rh Z 0 π (r 2 + h2 sin θ dθ − 2rh cos θ)1/2 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung r2 1 = − h r+h r 2 2h = − h h2 − r 2 2r 2 = − 2 + h − r2 27 iπ 2r 2 h 2 1 2 1/2 + (r + h − 2rh cos θ) ) − 0 h−r 2rh2 r + 2 (r + h − (h − r)) h 2 2r . h2 Nach der Integration über θ erhält man demzufolge K = −γmρ Z 2π 0 Z dϕ Z a 0 dr 2r 2 h2 ! 2 a3 3 h2 0 4π 3 1 = −γmρ a 3 h2 1 = −γmM 2 , h = −γmρ 2π dϕ wobei wir mit M die Gesamtmasse der homogenen Kugel bezeichnet haben. Dies ist ein beachtenswertes Resultat: die auf den Massenpunkt m wirkende Gravitationskraft einer homogenen Kugel lässt sich berechnen, indem man sich die Gesamtmasse der Kugel in deren Zentrum konzentriert denkt. In einem weitern Beispiel betrachten wir schliesslich noch Zylinderkoordinaten. Beispiel Gesucht ist das Trägheitsmoment eines homogenen (Dichte 1) Kreiszylinders der Höhe h und dem Radius a um einen Durchmesser seines Grundkreises. Wir wählen das Koordinatensystem so, dass der Kreiszylinder auf der (x, y)-Ebene steht und dass seine Achse mit der z-Achse zusammenfällt (siehe Figur 9). Es ist dann das Trägheitsmoment Θ um die x-Achse zu bestimmen. Laut Definition gilt ZZZ Θ= Z (y 2 + z 2 ) dV . Dem Problem angepasst wählen wir jetzt Zylinderkoordinaten (ρ, ϕ, z). Wie wir wissen, gilt x = ρ cos ϕ y = ρ sin ϕ z = z. Ausserdem entnimmt man der Figur 10, dass das Volumenelement sich durch 28 U. Stammbach: Analysis, Teil B (z) Fig. 9 : Trägheitsmoment eines Kreiszylinders um einen Durchmesser des Grundkreises h (y) a (x) (z) dρ Fig. 10 : Volumenelement bei Zylinderkoordinaten ρ dϕ ρ dϕ (y) (x) Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 29 dV = ρ dρ dϕ dz ausdrückt. Wandelt man nun das Volumenintegral in ein dreifaches Integral über die Zylinderkoordinaten z, ρ, ϕ (in dieser Reihenfolge) um, so erhält man der Reihe nach ZZZ Θ = Z = 0 Z = = 2π 0 Z = 2π 0 Z = 2π 0 Z = 2π 2π Z (z 2 + ρ2 sin2 ϕ) dV dϕ dϕ dϕ Z Z Z a 0 a 0 a 0 dρ Z h 0 dz ρ(z 2 + ρ2 sin2 ϕ) " #h z3 dρ ρ + ρ2 z sin2 ϕ 3 dρ ρ " #a h3 ρ2 hρ4 dϕ + sin2 ϕ 2·3 4 h3 a2 0 ! h3 + ρ2 h sin2 ϕ 3 ha4 !0 + sin2 ϕ 2 · 3 4 0 1 3 2 1 πh a + πha4 . 3 4 dϕ Wir werden im nächsten Abschnitt noch einmal auf Koordinatentransformationen bei Gebietsund Volumenintegralen zurückkommen und sie dort in einer etwas formaleren Weise behandeln. 30 4 U. Stammbach: Analysis, Teil B Zur Transformation von Gebiets- und Volumenintegralen Unsere Überlegungen zur Transformation von Gebiets- und Volumenintegralen in neue Koordinatensysteme geben uns Gelegenheit, noch etwas näher auf Koordinatentransformationen im allgemeinen einzugehen. Zu diesem Zweck betrachten wir zuerst den zweidimensionalen Fall noch etwas genauer. Neben dem kartesischen (x, y)-Koordinatensystem stellen wir uns in der Ebene ein (u, v)-Koordinatensystem vor. Der durch das Paar (u, v) im neuen Koordinatensystem beschriebene Punkt habe die durch die Funktionen x = x(u, v) , y = y(u, v) (4.1) bestimmten kartesischen Koordinaten (x, y) (siehe Kapitel IV, Abschnitt 8). (y) (x(u, v), y(u, v)) (v) (x) Fig. 1 : Koordinatentransformation in der Ebene als Abbildung (u, v) (u) Wir können nun - und dies ist eine wichtige, hier zum erstenmal auftretende Idee - eine künstliche (u, v)-Ebene betrachten und die Funktionen (4.1) als eine Abbildung der (u, v)-Ebene in die Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 31 (x, y)-Ebene ansehen (siehe Figur 1): Dem Punkt (u, v) in der (u, v)-Ebene wird der Punkt (x, y) mit x = x(u, v) , y = y(u, v) in der (x, y)-Ebene zugeordnet. (Statt ‘Abbildung’ könnte man natürlich ebenso gut auch ‘Funktion’ sagen; wir haben eine Funktion vor uns, die auf den Punkten der (u, v)-Ebene definiert ist und die als Werte Punkte in der (x, y)-Ebene annimmt). Beispiel Im Falle von Polarkoordinaten (ρ, ϕ) gilt bekanntlich x = x(ρ, ϕ) = ρ cos ϕ , y = y(ρ, ϕ) = ρ sin ϕ . Dem Punkt (ρ, ϕ) in der (ρ, ϕ)-Ebene wird der Punkt (x, y) = (ρ cos ϕ, ρ sin ϕ) zugeordnet (siehe Figuren 2,3). Durch die Koordinatentransformation wird der Streifen 0 ≤ ϕ < 2π auf die ganze (x, y)-Ebene abgebildet. Das Bild der Rechtecks 0 ≤ ρ ≤ a, 0 ≤ ϕ < 2π ist der Kreis um den Ursprung mit Radius a. (Man beachte, dass alle Punkte der ϕ-Achse auf den Nullpunkt der (x, y)-Ebene abgebildet werden. In diesen Punkten ist die Koordinatentransformation - wie man sagt - singulär.) Die Abbildung von der (u, v)-Ebene in die (x, y)-Ebene lässt sich gut veranschaulichen, indem man die Bilder der Parallelen zur u- bzw. v-Achse betrachtet. Die (horizontale) Gerade v = v0 geht in die durch die Parameterdarstellung u → (x(u, v0 ), y(u, v0 )) = ~r(u, v0 ) gegebene Kurve in der (x, y)-Ebene über, und die (vertikale) Gerade u = u0 in die Kurve v → (x(u0 , v), y(u0 , v)) = ~r(u0 , v) . Diese Kurven heissen Koordinatenlinien des neuen Koordinatensystems (siehe Figuren 4,5). Beispiel Im Falle von Polarkoordinaten sind die Koordinatenlinien einerseits vom Nullpunkt ausgehende Strahlen ( ϕ konstant), andererseits Kreise um den Ursprung ( ρ konstant) (siehe Figuren 2,3). Wir stellen uns nun vor, dass uns in der (x, y)-Ebene ein Bereich B gegeben ist, der als Integrationsbereich eines Gebietsintegrals auftritt. Verwendet man zur Berechnung des Integrals das (u, v)-Koordinatensystem, so ist für die Riemann’sche Summe der Bereich B durch die u- bzw. v-Koordinatenlinien einzuteilen. Es ist dann der Flächeninhalt dF des “Flächenelementes” dB zu bestimmen, welches dadurch entsteht, dass u um du und v um dv wächst. Approximativ ist ~ und AC ~ aufgespannt wird (siehe Figur dB ein Parallelogramm, welches durch die Vektoren AB 6). Nun gilt wegen des Mittelwertsatzes der Differentialrechnung 32 U. Stammbach: Analysis, Teil B (ϕ) 2π Fig. 2 : Polarkoordinaten, (ρ, ϕ)-Linien (ρ, ϕ) (ρ) a (y) (ρ cos ϕ, ρ sin ϕ) (x) Fig. 3 : Polarkoordinaten, Koordinatenlinien Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (v) u = u0 Fig. 4 : Koordinatentransformation, (u, v)-Ebene (u0 , v0 ) v = v0 (u) (y) u = u0 Fig. 5 : Koordinatenlinien (x(u0 , v0 ), y(u0 , v0 )) v = v0 (x) 33 34 U. Stammbach: Analysis, Teil B ~ = ~r(u + du, v) − ~r(u, v) ∼ ~ru (u, v) du = (xu (u, v), yu (u, v)) du AB ~ = ~r(u, v + dv) − ~r(u, v) ∼ ~rv (u, v) dv = (xv (u, v), yv (u, v)) dv . AC (y) u u + du C D v + dv Fig. 6 : Flächenelement bei Koordinatentransformationen dB ~r(u, v + dv) A B ~r(u, v) v ~r(u + du, v) (x) Damit kann der Flächeninhalt dF des “Parallelogrammes” dB mit Hilfe des Vektorproduktes bestimmt werden: dF = |~ru (u, v) × ~rv (u, v)| du dv . In Komponenten drückt sich der Betrag des Vektorproduktes durch den Absolutbetrag der Determinante der zweireihigen Matrix " aus. Damit erhält man xu xv yu yv " dF = det # xu xv yu yv . # du dv . Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 35 Dies ist das Flächenelement (besser wäre Element des Flächeninhaltes) im (u, v)-Koordinatensystem. Beispiel Im Falle von Polarkoordinaten (ρ, ϕ) ergibt sich xρ = cos ϕ , xϕ = −ρ sin ϕ yρ = sin ϕ , yϕ = ρ cos ϕ . Daraus folgt " det xρ xϕ yρ yϕ # = ρ cos2 ϕ + ρ sin2 ϕ = ρ und damit dF = ρ dρ dϕ in Übereinstimmung mit der in Abschnitt 2 auf heuristische Weise hergeleiteten Formel. Beispiel Es ist das polare Flächenträgheitsmoment einer Ellipse mit Halbachsen a und b um ihren Mittelpunkt zu bestimmen. Wir geben uns die Ellipse im kartesischen Koordinatensystem durch die Gleichung x2 y 2 + 2 =1. a2 b Das polare Flächenträgheitsmoment ist definiert durch J0 = ZZ B (x2 + y 2 ) dF , wo B den Bereich der Ellipse angibt. Wir führen nun ein dem gestellten Problem besonders angepasstes Koordinatensystem (s, t) ein, indem wir direkt die Transformationsformeln angeben. Sie lauten: x = as cos t y = bs sin t . Die Koordinatenlinien sind einerseits vom Nullpunkt ausgehende Strahlen (t konstant), andererseits Ellipsen mit Mittelpunkt im Ursprung (s konstant) (siehe Figur 7). Um das Flächenelement in den neuen Koordinaten zu bestimmen, berechnen wir die partiellen Ableitungen 36 U. Stammbach: Analysis, Teil B (y) b Fig. 7 : Der Ellipse angepasstes Koordinatensystem (x) a xs = a cos t , xt = −as sin t ys = b sin t , yt = bs cos t und bilden daraus die Matrix " a cos t −as sin t b sin t bs cos t # . Deren Determinante hat den Wert abs cos2 t + abs sin2 t = abs , so dass wir erhalten dF = abs ds dt . Das Gebietsintegral lässt sich damit vollständig in den neuen Koordinaten (s, t) ausdrücken. Offenbar wird die Ellipse B ausgeschöpft, wenn s und t über das Rechteck 0 ≤ s ≤ 1, 0 ≤ t < 2π Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 37 variiert. (Eine Gebietsintegration über ein Rechteck ist besonders einfach; aus diesem Grund haben wir natürlich gerade das (s, t)-Koordinatensystem gewählt.) Wir erhalten der Reihe nach J0 = ZZ B 1 Z = 0 Z = 0 = π (x2 + y 2 ) dF ds 1 Z 2π 0 dt (a2 s2 cos2 t + b2 s2 sin2 t) abs ds (πs2 (a2 + b2 )abs) ab 2 (a + b2 ) . 4 Als Spezialfall erhalten wir das uns bereits bekannte polare Flächenträgheitsmoment des Kreises J0 = π r4 . 2 Es lohnt sich, noch eine Weile bei diesen Koordinatentransformationen zu verweilen. Betrachten wir noch einmal die Abbildung des aus du und dv gebildeten (“kleinen”) Rechtecks in der (u, v)Ebene in das Flächenstück dB. Approximativ geht dabei der Vektor (du, dv) in den Vektor (dx, dy) = ~ru du + ~rv dv = (xu du + xv dv, yu du + yv dv) über. Mit der Notation der linearen Algebra schreiben wir dies in der Form " dx dy # " = xu xv yu yv #" du dv # . Wir lesen daraus ab, dass die zur (komplizierten) Koordinatentransformation im Punkt (u, v) gehörige Abbildung durch die (einfache) lineare Abbildung approximiert wird, welche durch die Matrix " xu xv yu yv # beschrieben wird. Diese Matrix heisst Funktionalmatrix oder Jacobimatrix (C. G. J. Jacobi 1804 -1851); wir bezeichnen sie durch das Symbol ∂(x, y) . ∂(u, v) Die Approximation geschieht hier offensichtlich in einem ähnlichen Sinn wie früher bei der linearen Ersatzfunktion: eine komplizierte Funktion wird durch eine lineare Funktion approximiert. Die durch die Funktionalmatrix im Punkte (u, v) gegebene lineare Abbildung ist die 38 U. Stammbach: Analysis, Teil B “lineare Ersatzfunktion an der Stelle (u, v)” der durch die Koordinatentransformation definierten Abbildung von der (u, v)-Ebene in die (x, y)-Ebene. Beispiel Wir kehren kurz - sicher zur Überraschung des Lesers - zum Roboterarm zurück, den wir in Kapitel I, Abschnitt 2 eingeführt haben (siehe Figur 8). Die Lage des Arbeitskopfes im (x, y)-Koordinatensystem wurde damals in Abhängigkeit der Winkel (ϕ, ψ) durch die Funktionen x = R cos ϕ + r cos(ϕ − ψ) y = R sin ϕ + r sin(ϕ − ψ) beschrieben. Wir können deshalb im Arbeitsbereich B des Roboters die Winkel ϕ und ψ als neue Koordinaten betrachten. Die obigen Formeln beschreiben dann eine Koordinatentransformation im Arbeitsbereich des Roboters und damit eine Abbildung eines Teils der (ϕ, ψ)-Ebene (siehe Figur 9) in die (x, y)-Ebene. Offenbar wird das Rechteck 0 ≤ ϕ, ψ ≤ π in den Bereich B abgebildet. Die Funktionalmatrix beschreibt in jedem Punkt des Rechtecks eine lineare Abbildung, welche die zur Koordinatentransformation gehörige Abbildung in diesem Punkt approximiert. Die Funktionalmatrix lautet ∂(x, y) = ∂(ϕ, ψ) " xϕ xψ yϕ yψ # " = −R sin ϕ − r sin(ϕ − ψ) r sin(ϕ − ψ) R cos ϕ + r cos(ϕ − ψ) −r cos(ϕ − ψ) # . Werden nun die Winkel ϕ und ψ gemäss den Funktionen t → ϕ(t) und t → ψ(t) zeitlich verändert, so beschreibt der Arbeitskopf des Roboters im Arbeitsbereich einen Weg, der durch t → (x(ϕ(t), ψ(t)), y(ϕ(t), ψ(t))) gegeben ist. Die Geschwindigkeit ~v (t) des Arbeitskopfes ergibt sich durch Ableitung nach t mit Hilfe der verallgemeinerten Kettenregel. Man erhält ~v (t) = (xϕ ϕ̇ + xψ ψ̇, yϕ ϕ̇ + yψ ψ̇) . Ohne Schwierigkeiten stellt man fest, dass sich der Geschwindigkeitsvektor ~v (t) = (ẋ(t), ẏ(t)) durch eine Matrixmultiplikation ergibt: " ẋ ẏ # " = xϕ xψ yϕ yψ #" ϕ̇ ψ̇ # . Wir ersehen daraus, dass die Funktionalmatrix beschreibt, wie sich der “Geschwindigkeitsvektor” (ϕ̇, ψ̇) in der (ϕ, ψ)-Ebene in den Geschwindigkeitsvektor (ẋ, ẏ) des Arbeitskopfes in der (x, y)Ebene abbildet. 39 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung (y) R ψ Fig. 8 : Roboterarm r (x) ϕ (ψ) π Fig. 9 : (ϕ, ψ)-Ebene (ϕ) π 40 U. Stammbach: Analysis, Teil B Wie man aus der linearen Algebra weiss, beschreibt die Determinante einer Matrix die Volumenbzw. Flächenverzerrung bei der zugehörigen Abbildung. Wir entnehmen daraus, dass die Determinante (Funktionaldeterminante) " det xu xv yu yv # im Punkte (u, v) die Flächenverzerrung bei der Abbildung der (u, v)-Ebene in die (x, y)-Ebene beschreibt. Aus diesem Grund muss - wie wir bereits gesehen haben - bei Gebietsintegralen das Flächenelement det ∂(x, y) du dv ∂(u, v) benützt werden. Spezielle Aufmerksamkeit verdienen bei Koordinatentransformationen diejenigen Punkte in denen die Funktionaldeterminante Null ist. In solchen Punkten ist die durch die Funktionalmatrix beschriebene lineare Abbildung singulär, und die Koordinatentransformation ist ausgeartet. Ein Beispiel wird durch das Polarkoordinatensystem im Nullpunkt geliefert. Hier ist die Koordinatentransformation bekanntlich nicht in beiden Richtungen eindeutig. In gewissen Rechnungen muss auf diese Ausnahmepunkte besonders Rücksicht genommen werden. Beispiel Auch im Zusammenhang mit Robotern spielen diese Punkte eine grosse Rolle. Berechnen wir für den oben betrachteten Roboter die Funktionaldeterminante, so ergibt sich " det −R sin ϕ − r sin(ϕ − ψ) r sin(ϕ − ψ) R cos ϕ + r cos(ϕ − ψ) −r cos(ϕ − ψ) # = Rr sin ψ . Diese Determinante ist Null für ψ = 0 oder ψ = π. Dies entspricht dem vollständig gestreckten bzw. ganz zusammengefalteten Roboterarm. In diesen Punkten ist die Funktionalmatrix also singulär. Die lineare Algebra sagt nun, dass die zu einer solchen Matrix gehörige lineare Abbildung nicht alle Vektoren als Bilder liefert. Wir haben aber gesehen, dass die Bilder gerade die möglichen Geschwindigkeitsvektoren des Arbeitskopfes sind. Wir folgern daraus, dass in den Punkten mit ψ = 0 bzw. ψ = π der Arbeitskopf unseres Roboters nicht beliebige Geschwindigkeitsvektoren zulässt. Punkte dieser Art sind Ausnahmepunkte und verdienen bei Roboteranwendungen immer besondere Aufmerksamkeit. Wir gehen zum Schluss noch auf den dreidimensionalen Fall ein und betrachten neben dem kartesischen (x, y, z)-Koordinatensystem ein neues (u, v, w)-Koordinatensystem. Die Koordinatentransformation wird durch die Gleichungen x = x(u, v, w), y = y(u, v, w), z = z(u, v, w) Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 41 beschrieben. Hält man eine der neuen Koordinaten fest, so beschreiben diese Funktionen die sogenannten Koordinatenflächen. Beispiel Im Falle von Kugelkoordinaten r, ϕ, θ lauten die Gleichungen bekanntlich x = r sin θ cos ϕ y = r sin θ sin ϕ z = r cos θ . Die Koordinatenflächen sind für r = r0 Kugeloberflächen, für ϕ = ϕ0 Halbebenen, welche die z-Achse enthalten, und für θ = θ0 Halbkegel mit der z-Achse als Achse. Lässt man im (u, v, w)-Koordinatensystem u um du, v um dv und w um dw wachsen, so wird der Quader mit Kanten du, dv, dw im (u, v, w)-Raum auf einen (“krummkantigen”) Quader im (x, y, z)-Raum abgebildet (siehe Figur 10). Dessen Volumen können wir approximativ berechnen, indem wir analog wie im zweidimensionalen Fall vorgehen. Setzen wir wie üblich ~r(u, v, w) = (x(u, v, w), y(u, v, w), z(u, v, w)) , (z) Fig. 10 : Volumenelement bei Koordinatentransformationen dV (y) (x) 42 U. Stammbach: Analysis, Teil B so gilt ~r(u + du, v, w) − ~r(u, v, w) ∼ ~ru (u, v, w) du , ~r(u, v + dv, w) − ~r(u, v, w) ∼ ~rv (u, v, w) dv , ~r(u, v, w + dw) − ~r(u, v, w) ∼ ~rw (u, v, w) dw . Das Volumen des von ~ru du, ~rv dv, ~rw dw aufgespannten Quaders ist dann als Absolutbetrag des gemischten Produktes (~ru du × ~rv dv) · ~rw dw = (~ru × ~rv ) · ~rw du dv dw gegeben. Wie wir gesehen haben, entspricht dieses gemischte Produkt der Determinante der aus den Komponenten der drei Vektoren gebildeten Matrix   xu xv xw   (~ru × ~rv ) · ~rw = det  yu yv yw  . zu zv zw Damit ist das Volumenelement genau wie das Flächenelement durch die Funktionaldeterminante ausgedrückt. Es gilt   xu xv xw   dV = det  yu yv yw  du dv dw . zu zv zw Beispiel Im Falle von Kugelkoordinaten rechnet man ohne Schwierigkeit nach   sin θ cos ϕ −r sin θ sin ϕ r cos θ cos ϕ   det  sin θ sin ϕ r sin θ cos ϕ r cos θ sin ϕ  = −r 2 sin θ , cos θ 0 −r sin θ so dass das Volumenelement der Kugelkoordinaten durch dV = r 2 sin θ dr dϕ dθ gegeben ist, in Übereinstimmung mit unserem früheren Resultat. Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 5 43 Integrale mit Parameter In diesem Abschnitt geht es um die Ableitung von Integralen die von einem Parameter abhängig sind. Wir beginnen gleich mit einem einfachen Beispiel. √ Beispiel Gegeben ist die Funktion t → t. Wir vergleichen im Intervall [0, 1] diese Funktion mit linearen Funktionen der Form t → xt , 0 ≤ x < ∞. Für welchen Wert von x ist die Grösse Z Φ(x) = 0 1 √ ( t − xt)2 dt minimal (siehe Figur 1)? (y) 1 y= √ t Fig. 1 : Approximation der Wurzelfunktion durch eine lineare Funktion y = xt (t) 1 Zur Lösung suchen wir die Minimalstelle der Funktion x → Φ(x) = Z 0 1 √ ( t − xt)2 dt 44 U. Stammbach: Analysis, Teil B im Intervall [0, ∞). Wir erhalten Z Φ(x) = = = 0 1 √ ( t − xt)2 dt 1 2 4 t − 2 5 1 4 − x+ 2 5 xt 5/2 1 + x2 t 3 3 1 0 1 2 x . 3 Die Ableitung beträgt d d Φ(x) = dx dx Z 0 1 √ d 1 4 4 2 1 ( t − xt)2 dt = − x + x2 = − + x . dx 2 5 3 5 3 Nullsetzen liefert x= 6 . 5 Man zeigt leicht, dass es sich dabei um die globale Minimalstelle handelt. In diesem Beispiel tritt auf natürliche Weise die Ableitung eines bestimmten Integrals nach einem Parameter auf. In dieser Situation erlaubt der folgende Satz oft eine Vereinfachung. Satz Gegeben sei eine stetige Funktion von zwei Variablen f : (t, x) → f (t, x) . Ferner sei die partielle Ableitung fx ebenfalls stetig. Dann gilt d dx Z b a f (t, x) dt = Z b a fx (t, x) dt . Wenden wir die Aussage des Satzes auf unser Beispiel an, so lässt sich die Rechnung, die zur Ableitung der Funktion Φ führt, etwas vereinfachen d dx Z 0 1 Z √ ( t − xt)2 dt = 0 1 1 Z 1 √ 2 4 2 4 2( t − xt)(−t) dt = (2xt2 − 2t3/2 ) dt = xt3 − t5/2 = x − . 3 5 3 5 0 0 Beweis des Satzes: Für den Differenzenquotienten der Funktion Φ erhalten wir 45 Kapitel V. Funktionen von mehreren Variablen. Integralrechnung Φ(x + h) − Φ(x) h = 1 h = 1 h Z b f (t, x + h) dt − a Z b a Z b a ! f (t, x) dt (f (t, x + h) − f (t, x)) dt . Daraus folgt Φ(x + h) − Φ(x) − h Z b a fx (t, x) dt = Z b f (t, x a + h) − f (t, x) − fx (t, x) h dt . Für h → 0 strebt der Integrand des letzten Integrals und damit auch das Integral selbst gegen Null. Damit folgt Φ(x + h) − Φ(x) = h→0 h Φ0 (x) = lim Z b a fx (t, x) dt . Dies ist die Aussage des Satzes. Beispiel Wir behaupten, dass die Funktion Φ:x→ Z π 0 cos(x sin t) dt Lösung der Differentialgleichung Φ00 + 1 0 Φ +Φ=0 x ist. Wir bemerken zuerst, dass das Integral nicht elementar auswertbar ist. Deshalb muss in diesem Fall die Ableitung mit Hilfe unseres Satzes unter dem Integral erfolgen. Wir erhalten 0 Φ (x) = − Φ00 (x) = − Z π 0 Z π 0 sin(x sin t) sin t dt , cos(x sin t) sin2 t dt . Wir wenden nun auf Φ0 (x) partielle Integration an, wobei wir u(t) = sin(x sin t) , v̇(t) = sin t , setzen, und erhalten u̇(t) = x cos(x sin t) cos t , v(t) = − cos t 46 U. Stammbach: Analysis, Teil B 0 Φ (x) = [cos t sin(x sin t)]π0 = −x Z π 0 − Z π 0 x cos(x sin t) cos2 t dt cos(x sin t) cos2 t dt . Damit folgt Φ00 + 1 0 Φ +Φ= x Z 0 π − cos(x sin t) sin2 t − x cos(x sin t) cos2 t + cos(x sin t) x dt = 0 , und Φ ist in der Tat Lösung der Differentialgleichung. Beispiel Das Integral Z 1 tx −1 dt =: Φ(x) , x ≥ 0 log t 0 hat die Eigenschaft, dass die Stammfunktion des Integranden nicht elementar ausdrückbar ist. Trotzdem lässt sich sein Wert für alle x berechnen. Dabei machen wir von unserem Satz Gebrauch. Statt den Wert Φ(x) direkt zu bestimmen, wenden wir uns zuerst der Ableitungsfunktion Φ0 (x) zu. Mit Hilfe unseres Satzes erhalten wir Z 0 Φ (x) = 0 Z = = = 0 1 1 ∂ tx − 1 dt ∂x log t log t · tx dt log t 1 h x+1 i1 t 0 x+1 1 . x+1 Daraus folgt Φ(x) = log(x + 1) + C , und wegen Φ(0) = 0 gilt schliesslich Φ(x) = log(x + 1) . Im zweiten Teil dieses Abschnittes beschäftigen wir uns noch mit dem etwas komplizierteren Fall, wo der Parameter nicht nur im Integranden sondern auch in den Grenzen des Integrals vorkommt. Wir betrachten also für die Funktionen x → u(x) , x → v(x) Kapitel V. Funktionen von mehreren Variablen. Integralrechnung 47 die durch die Integralformel Ψ : x → Ψ(x) = Z v(x) u(x) f (t, x) dt definierte Funktion. Dann gilt der Satz 0 0 0 Ψ (x) = f (v(x), x) v (x) − f (u(x), x) u (x) + Z v(x) u(x) fx (t, x) dt Bevor wir ihn beweisen, betrachten wir die folgenden Spezialfälle. Sind die Funktionen u und v konstant, so erhält man die Aussage des früheren Satzes. Ist u = a konstant, v(x) = x und ist der Integrand nicht von x abhängig, so folgt d dx Z x a f (t) dt = f (x) . Dies ist nichts anderes als der wohlbekannte Hauptsatz der Infinitesimalrechnung: “Die Ableitung eines bestimmten Integrals nach der oberen Grenze ist der Wert des Integranden an der oberen Grenze” (siehe Kapitel III, Abschnitt 2). Beweis Wir betrachten zuerst die Funktion von drei Variablen (u, v, w) → ψ(u, v, w) = Z v u f (t, w) dt und definieren die zusammengesetzte Funktion Ψ durch Ψ(x) = ψ(u(x), v(x), w(x)) . Die verallgemeinerte Kettenregel liefert dann d Ψ(x) = ψu u0 + ψv v 0 + ψw w0 . dx Schliesslich betrachten wir den Spezialfall w(x) = x und wenden auf die ersten beiden Ausdrücke den Hauptsatz der Infinitesimalrechnung an (siehe oben). Dann erhalten wir 48 U. Stammbach: Analysis, Teil B d Ψ(x) = −f (u(x), x) u0 (x) + f (v(x), x) v 0 (x) + dx Z v(x) u(x) fx (t, x) dt . Dies war zu beweisen. Beispiel Wir betrachten hier ein Anwendungsbeispiel aus der Mechanik, welches eine Beziehung zwischen der Querkraft und dem Biegemoment eines belasteten Balkens betrifft. Ein an beiden Enden frei aufgestützter waagrechter Balken trage die durch die Funktion x → p(x) Fig. 2 : Querkraft und Biegemoment eines belasteten Balkens ~ B p(x) ~ A (x) x ~ diejenige im rechten beschriebene Last (siehe Figur 2). Die Reaktionskraft im linken Lager sei A, ~ Lager B. Im Schnitt an der Stelle x ergibt sich die Querkraft Q(x) = A − und das Biegemoment Z 0 x p(t) dt Kapitel V. Funktionen von mehreren Variablen. Integralrechnung M (x) = −Ax + Z 0 x 49 (x − t)p(t) dt . Es wird nun in der Mechanik behauptet, dass die Beziehung d M (x) = −Q(x) dx gilt. Der von uns oben ausgesprochene Satz liefert diese Aussage nach kurzer Rechnung. Es gilt nämlich d M (x) = −A + 1 · (x − x)p(x) + dx Z 0 x 1 p(t) dt = −Q(x) . Man vergleiche zu diesem Thema M.B. Sayir: Mechanik 1, p. 201 ff. Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel VI. Vektoranalysis Ordnung ist nur für Dumme, Genies beherrschen das Chaos. Anonymus Inhaltsverzeichnis 1 Skalarfelder und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Differentialoperatoren der Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . 11 3 Flächen in Parameterdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4 Der Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5 Der Divergenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6 Anwendungen des Divergenzsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Die Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 9 Eine Anwendung des Satzes von Stokes . . . . . . . . . . . . . . . . . . . . . . . 65 10 Potentialfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3 Kapitel VI. Vektoranalysis 1 Skalarfelder und Vektorfelder Unter einem Skalarfeld verstehen wir eine reellwertige, auf einem räumlichen Bereich B definierte Funktion f : (x, y, z) → f (x, y, z) . Jedem Punkt des Definitionsbereiches D(f ) wird eine reelle Zahl zugeordnet (siehe Figur 1). Eine im Bereich B variable skalare physikalische Grösse wird durch ein in B definiertes Skalarfeld beschrieben; Beispiele solcher Grössen sind etwa die Temperatur, der Luftdruck, das elektrische Potential, etc. f (x, y, z) 0 R Fig. 1 : Skalarfeld (z) f (y) B (x, y, z) R ×R ×R (x) Durch ein im Bereich B definiertes Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z)) 4 U. Stammbach: Analysis, Teil B wird jedem Punkt in B ein Vektor ~v (x, y, z) zugeordnet. Es ist oft instruktiv, sich den Vektor ~v (x, y, z) im Punkte (x, y, z) angebracht zu denken (siehe Figur 2). Eine im Bereich B variable vektorielle Grösse wird durch ein in B definiertes Vektorfeld beschrieben. Als Beispiele von Vektorfeldern erwähnen wir die folgenden. ~v B Fig. 2 : Vektorfeld (z) (y) (x) Beispiel In einem mit Gas oder Flüssigkeit gefüllten Bereich B ordne man jedem Punkt (x, y, z) die Geschwindigkeit ~v (x, y, z) des Gas- bzw. Flüssigkeitsteilchens zu, das sich im Punkte (x, y, z) befindet. Man nennt dann das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) das Strömungsfeld des Gases bzw. der Flüssigkeit. Es beschreibt den Bewegungszustand des Mediums. ~ Beispiel Man ordne jedem Punkt (x, y, z) des Bereiches B die Gravitationskraft K(x, y, z) zu, die auf eine Probemasse m in diesem Punkt wirkt. Dieses Vektorfeld ~ : (x, y, z) → K(x, ~ K y, z) 5 Kapitel VI. Vektoranalysis beschreibt den Zustand des räumlichen Bereiches B bezüglich der Gravitation. Es ist ein Beispiel eines Kraftfeldes. Beispiel Ordnet man jedem Punkt (x, y, z) des Bereiches B die elektrische (Anziehungs~ oder Abstossungs-)Kraft E(x, y, z) zu, die auf eine Probeladung e in diesem Punkte wirkt, so beschreibt das Vektorfeld ~ : (x, y, z) → E(x, ~ E y, z) den Zustand des räumlichen Bereiches B bezüglich des elektrischen Feldes. Wir nennen ein Skalar- oder Vektorfeld stationär, wenn es zeitunabhängig ist, wir nennen es instationär, wenn es zeitabhängig ist. Mit einigen wenigen Ausnahmen werden wir nur stationäre Felder betrachten. Die Ausnahmen betreffen elektrodynamische und hydrodynamische Felder, wo die Zeitabhängigkeit gerade das Wesentliche ist; z.B. hängt nach Maxwell die elektrische Feldstärke mit der zeitlichen Änderung der magnetischen Feldstärke zusammen (siehe Abschnitt 9). (y) Fig. 3 : Feldlinien (x) Ist im Bereich B ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) gegeben, so heisst eine in B verlaufende Kurve K eine Feldlinie von ~v , wenn in jedem ihrer Punkte der zu diesem Punkt gehörige 6 U. Stammbach: Analysis, Teil B Feldvektor tangential zu K ist (siehe Figur 3). Beispiel Ist ~v : (x, y, z) → ~v (x, y, z) das stationäre Strömungsfeld eines Gases oder einer Flüssigkeit, so sind die Feldlinien gerade die Bahnen der Teilchen des Mediums. Beispiel Das einfachste Vektorfeld ist das homogene. Es besteht darin, dass jedem Punkt des Bereiches B der konstante Vektor ~v (x, y, z) = ~a zugeordnet wird (siehe Figur 4). Das Geschwindigkeitsfeld eines translatorisch bewegten Körpers ist homogen. Das Strömungsfeld einer Parallelströmung ist homogen. Das elektrische Feld zwischen zwei parallelen Kondensatorplatten ist homogen. Die Feldlinien eines homogenen Vektorfeldes sind parallele Geraden. (y) Fig. 4 : Homogenes Vektorfeld ~a (x) Beispiel Es sei ~v : (x, y, z) → ~v (x, y, z) das Geschwindigkeitsfeld eines mit der Winkelgeschwindigkeit ~ω = (ω1 , ω2 , ω3 ) rotierenden starren Körpers. Die Rotationsachse gehe durch den Ursprung. Wie üblich bezeichnen wir mit ~r(x, y, z) den Ortsvektor des Punktes (x, y, z). Dann gilt offensichtlich (siehe Figur 5) ~v (x, y, z) = ~ω × ~r(x, y, z) = (ω2 z − ω3 y, ω3 x − ω1 z, ω1 y − ω2 x) . Die Feldlinien dieses Feldes sind offenbar Kreise in Normalebenen zu ω ~ , deren Mittelpunkte auf 7 Kapitel VI. Vektoranalysis der Rotationsachse liegen. . (x, y, z) Fig. 5 : Vektorfeld eines rotierenden starren Körpers ω ~ ~r O Beispiel Das Coulomb’sche Feld (C. A. Coulomb 1736 -1806) ist das elektrische Feld einer sich im Nullpunkt des Koordinatensystems befindlichen Punktladung e. Der Feldvektor ~v in (x, y, z) ist die Kraft auf eine in (x, y, z) angebrachte positive Einheitsladung. Setzen wir wie üblich ~r(x, y, z) = (x, y, z), r = |~r| = (x2 + y 2 + z 2 )1/2 , so gilt (siehe Physik) |~v | = γ |e| |e| =γ 2 , 2 |~r(x, y, z)| r wobei γ eine positive Konstante ist. Für positives e ist ~v von O weggerichtet (Abstossung, siehe Figur 6), und für negatives e ist ~v auf O zugerichtet (Anziehung). Man erhält also ~v (x, y, z) = γ e e ~r(x, y, z) = γ 2 (x, y, z) . |~r(x, y, z)|3 (x + y 2 + z 2 )3/2 Das Newton’sche Gravitationsfeld eines in O befindlichen Massenpunktes stimmt formal, d.h. bis auf eine Konstante mit dem Feld einer negativen elektrischen Ladung in O überein; es ist ~v (x, y, z) in diesem Fall die auf eine in (x, y, z) angebrachte Einheitsmasse wirkende Gravitationskraft. Die Feldlinien des Coulombfeldes sind die von O ausgehenden Strahlen. Man beachte, dass das Coulombfeld in O nicht definiert ist. 8 U. Stammbach: Analysis, Teil B Fig. 6 : Coulomb’sches Feld e O Beispiel Das Magnetfeld eines unendlich langen geradlinigen stromdurchflossenen Leiters. In der z-Achse fliesse ein Strom konstanter Stärke J. Ein Strom erzeugt nach dem Gesetz von Biot-Savart (J. B. Biot 1774 - 1862, F. Savart 1791 - 1841) ein Magnetfeld; in der Physik lernt man, dass dieses im Punkt (x, y, z) durch ~v (x, y, z) = 2J −y x , 2 , 0 2 2 x + y x + y2 beschrieben wird (siehe Figur 7). Wir entnehmen dieser Formel, dass ~v nur für x2 + y 2 > 0 definiert ist. Der Definitionsbereich von ~v ist der dreidimensionale Raum ohne die z-Achse. Die Länge des Feldvektors |~v | ist unabhängig von der z-Koordinate. Der Feldvektor ist parallel zur (x, y)-Ebene und steht senkrecht auf dem Lot zum Leiter. Es gilt |~v (x, y, z)| = 2J (x2 1 , + y 2 )1/2 d.h. |~v (x, y, z)| ist umso grösser, je näher (x, y, z) an der z-Achse liegt. Die Feldlinien von ~v sind Kreise parallel zur (x, y)-Ebene mit Mittelpunkt auf der z-Achse. Beispiel Strömungsfeld einer zähen Flüssigkeit durch ein zylindrisches Rohr. Es sei die z-Achse gerade die Achse des zylinderförmigen Rohres, welches den Radius a besitze. Der Ansatz von 9 Kapitel VI. Vektoranalysis Fig. 7 : Magnetfeld eines stromdurchflossenen Leiters z (z) Fig. 8 : Hagen-Poiseuille-Strömung a 10 U. Stammbach: Analysis, Teil B Hagen-Poiseuille sagt dann, dass für Punkte (x, y, z) im Innern des Rohres die Geschwindigkeit der Strömung durch ~v : (x, y, z) → ~v (x, y, z) = 0, 0, C (a2 − x2 − y 2 ) gegeben ist (siehe Figur 8). Das Geschwindigkeitsprofil der Hagen-Poiseuille-Strömung ist eine Parabel. Beispiel Das Gravitationsfeld einer homogenen Kugel mit Radius a ist für r = (x2 +y 2 +z 2 )1/2 ≥ a gegeben durch ~v : (x, y, z) → ~v (x, y, z) = −C 0 1 C0 ~ r = − (x, y, z) r3 (x2 + y 2 + z 2 )3/2 (siehe Kapitel V, Abschnitt 3). Für r < a (im Innern der Kugel) liefert eine ähnliche Rechnung wie in Kapitel V, Abschnitt 3 ~v : (x, y, z) → ~v (x, y, z) = −C 00~r = −C 00 (x, y, z) . Natürlich sind die Konstanten C 0 und C 00 positiv. 11 Kapitel VI. Vektoranalysis 2 Differentialoperatoren der Vektoranalysis Wir stellen hier eine Anzahl von Rechenvorschriften zusammen. Es wird sich im Laufe dieses Kapitels zeigen, dass alle diese auf den ersten Blick willkürlichen Bildungen eine anschauliche und wichtige Bedeutung haben. Der erste hier zu besprechende Differentialoperator ist uns bereits bekannt. Es ist der Gradient (siehe Kapitel IV, Abschnitt 7). Ist f : (x, y, z) → f (x, y, z) eine Funktion von drei Variablen, also ein Skalarfeld, so ist der Gradient von f definiert durch grad f (x, y, z) = ∂f ∂f ∂f (x, y, z), (x, y, z), (x, y, z) ∂x ∂y ∂z . Der Gradient ordnet einem Skalarfeld ein Vektorfeld zu. In Kapitel IV, Abschnitt 7 haben wir eine geometrische Beschreibung von grad f (x, y, z) kennengelernt: (a) Die Länge von grad f (x, y, z) ist der Betrag der grössten Richtungsableitung von f in (x, y, z). Die Richtung von grad f (x, y, z) ist die Richtung, in der die grösste Richtungsableitung von f in (x, y, z) erhalten wird. (b) Der Vektor grad f (x, y, z) steht senkrecht zur Niveaufläche von f , die durch den Punkt (x, y, z) geht. Das Vektorfeld grad f (x, y, z) wird auch Gradientenfeld von f genannt. Die Eigenschaft (b) des Gradienten liefert sofort das Resultat, dass die Feldlinien von grad f senkrecht zu den Niveauflächen von f verlaufen. Kennt man also die Niveauflächen von f , so kennt man auch den Verlauf der Feldlinien von grad f und umgekehrt. Der zweite der Differentialoperatoren ist die sogenannte Divergenz. Die Divergenz ordnet einem Vektorfeld ein Skalarfeld zu. Sie ist wie folgt definiert div ~v (x, y, z) = ∂v1 ∂v2 ∂v3 (x, y, z) + (x, y, z) + (x, y, z) . ∂x ∂y ∂z Beispiel Ist das Vektorfeld ~v homogen, ~v = ~a, so ist div ~v ≡ 0 . 12 U. Stammbach: Analysis, Teil B Beispiel Für das Coulombfeld ~v (x, y, z) = C x y z , , r3 r3 r3 , r = (x2 + y 2 + z 2 )1/2 erhält man ∂v1 ∂ (x, y, z) = C ∂x ∂x x r3 =C r 2 − 3x2 . r5 Aus Symmetriegründen folgt dann ∂v2 r 2 − 3y 2 , (x, y, z) = C ∂y r5 ∂v3 r 2 − 3z 2 . (x, y, z) = C ∂z r5 Daraus ergibt sich für die Divergenz div ~v (x, y, z) ≡ 0 . Beispiel Für das Magnetfeld des stromdurchflossenen Leiters ~v (x, y, z) = 2J −y x , , 0 x2 + y 2 x2 + y 2 erhält man ∂ ∂x −y x ∂ + 2 2 2 x +y ∂y x + y 2 y2x −y2x = 2J + (x2 + y 2 )2 (x2 + y 2 )2 = 0 div ~v (x, y, z) = 2J Beispiel Für das Strömungsfeld nach Hagen-Poiseuille ergibt sich div ~v (x, y, z) = 0 . 13 Kapitel VI. Vektoranalysis Beispiel Für das Gravitationsfeld innerhalb einer homogenen Kugel ~v (x, y, z) = −C 00~r , ~r = (x, y, z) , erhalten wir div ~v (x, y, z) = −3C 00 . Ausserhalb der homogenen Kugel ist das Gravitationsfeld ein Coulombfeld, und seine Divergenz ist deshalb Null (siehe oben). Der dritte der Differentialoperatoren ist die sogenannte Rotation. Die Rotation ordnet einem Vektorfeld wiederum ein Vektorfeld zu. Sie ist definiert durch rot ~v (x, y, z) = Beispiel ∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1 − , − , − ∂y ∂z ∂z ∂x ∂x ∂y . Ist das Vektorfeld homogen, ~v = ~a, so ist rot ~v = (0, 0, 0) . Beispiel Für das Geschwindigkeitsfeld eines rotierenden starren Körpers ~v = ~ω × ~r erhalten wir rot ~v = 2 (ω1 , ω2 , ω3 ) . Die Rotation dieses Vektorfeldes ~v ist also ein Mass für die Winkelgeschwindigkeit der Rotation. Beispiel Für das Coulombfeld ~v (x, y, z) = C x y z , , r3 r3 r3 , r = (x2 + y 2 + z 2 )1/2 erhält man ∂v3 ∂v2 − =C ∂y ∂z ∂ z ∂ y − ∂y r 3 ∂z r 3 =C −z3r 2 y/r + y3r 2 z/r r6 ! =0. 14 U. Stammbach: Analysis, Teil B Aus Symmetriegründen sind auch die übrigen zwei Komponenten des Vektors rot ~v Null. Beispiel Für das Magnetfeld des stromdurchflossenen Leiters ~v (x, y, z) = 2J −y x , 2 , 0 2 2 x + y x + y2 erhalten wir rot ~v (x, y, z) = ∂v2 ∂v1 − ∂x ∂y ! 2 x + y 2 − 2x2 x2 + y 2 − 2y 2 0, 0, + (x2 + y 2 )2 (x2 + y 2 )2 0, 0, = 2J = (0, 0, 0) Beispiel Für das Strömungsfeld nach Hagen-Poiseuille erhält man rot ~v (x, y, z) = (−2Cy, 2Cx, 0) . Beispiel Für das Gravitationsfeld innerhalb einer homogenen Kugel ~v (x, y, z) = −C 00~r , ~r = (x, y, z) , erhält man rot ~v (x, y, z) ≡ (0, 0, 0) . Neben diesen drei Differentialoperatoren grad , div , rot der Vektoranalysis treten natürlich auch deren Zusammensetzungen auf. (Achtung, nicht jede Zusammensetzung ist sinnvoll!) Für diese gelten die folgenden Identitäten. Der zusammengesetzte Operator div grad ordnet einem Skalarfeld wiederum ein Skalarfeld zu. Es gilt div grad f = fxx + fyy + fzz . In Anwendungen tritt dieser Operator häufig auf (siehe z.B. Kapitel IV, Abschnitt 8). Er heisst auch Laplace-Operator und wird mit ∆ bezeichnet. 15 Kapitel VI. Vektoranalysis Für die Zusammensetzung von grad und rot folgt rot grad f ≡ (0, 0, 0) . Satz Die Rotation eines Gradientenfeldes ist Null. Für die Zusammensetzung von rot und div folgt div rot ~v ≡ 0 . Satz Die Divergenz eines Rotationsfeldes ist Null. Die beiden anderen sinnvollen Zusammensetzungen rot rot und grad div sind untereinander durch die Formel rot rot ~v = grad div ~v − (∆v1 , ∆v2 , ∆v3 ) . verbunden. Alle diese Identitäten lassen sich einfach beweisen, indem man auf die Definitionen der Differentialoperatoren zurückgeht. Wir überlassen dies dem Leser. 16 3 U. Stammbach: Analysis, Teil B Flächen in Parameterdarstellung Ein Flächenstück S, auch kurz eine Fläche genannt, im dreidimensionalen Raum lässt sich wie folgt beschreiben (a) Als Graph einer Funktion von zwei Variablen f : (x, y) → f (x, y), oder (b) durch eine Gleichung g(x, y, z) = 0 , oder (c) durch eine Parameterdarstellung (u, v) → ~r(u, v) = (x(u, v), y(u, v), z(u, v)) . Eine Parameterdarstellung ist nichts anderes als eine Abbildung eines Bereiches B der (u, v)Ebene (Parameterebene) in den dreidimensionalen Raum (siehe Figur 1). (z) (x(u, v), y(u, v), z(u, v)) (y) (x) (v) ~r Fig. 1 : Parameterdarstellung einer Fläche als Abbildung eines Bereichs B der (u, v)-Ebene in den dreidimensionalen Raum B (u, v) (u) Beispiel Die Ebene durch den Punkt P0 = (x0 , y0 , z0 ), aufgespannt durch die Vektoren ~a und ~b mit ~c := ~a × ~b 6= (0, 0, 0) wird beschrieben durch die Parameterdarstellung 17 Kapitel VI. Vektoranalysis ~r : (u, v) → ~r(u, v) = (x0 + a1 u + b1 v, y0 + a2 u + b2 v, z0 + a3 u + b3 v) bzw. durch die Gleichung c1 (x − x0 ) + c2 (y − y0 ) + c3 (z − z0 ) = 0 . Hält man in der Parameterdarstellung eines Flächenstücks S den Parameter v fest, v = v0 , so ist u → ~r(u, v0 ) die Parameterdarstellung einer Kurve (u-Linie) auf der Fläche. Hält man den Parameter u fest, u = u0 , so ist v → ~r(u0 , v) (v) B Fig. 2 : Zur Definition der Parameterlinien v0 u0 (u) die Parameterdarstellung einer Kurve (v-Linie) auf der Fläche (siehe Figuren 2,3). Diese Kurven auf dem dargestellten Flächenstück S heissen Parameterlinien. Man vergleiche dazu Kapitel 18 U. Stammbach: Analysis, Teil B u = u0 v-Linie Fig. 3 : Parameterlinien auf einer Fläche (z) v = v0 u-Linie (y) (x) V, Abschnitt 4 über Koordinantentransformationen, wo die Koordinatenlinien auf ganz analoge Weise definiert worden sind. Beispiel Die Oberfläche der Kugel mit Radius R und Mittelpunkt im Ursprung lässt sich durch die Gleichung x2 + y 2 + z 2 − R 2 = 0 beschreiben. Eine Parameterdarstellung ergibt sich unmittelbar mit Hilfe der Kugelkoordinaten. Setzen wir u = ϕ und v = θ dann stellt (u, v) → (R sin v cos u, R sin v sin u, R cos v) mit 0 ≤ u ≤ 2π und 0 ≤ v ≤ π die Kugeloberfläche dar (siehe Figur 4). Die Parameterlinien sind die von der Geographie auf der Erdkugel her bekannten Breitenkreise (v konstant) und Meridiane (u konstant). Beispiel Die Mantelfläche des geraden Kreiskegels mit halbem Öffnungswinkel α, Spitze im Ursprung und z-Achse als Achse lässt sich durch die folgende Parameterdarstellung beschreiben. Mit Hilfe der Kugelkoordinaten (θ = α) erhält man eine Parameterdarstellung dieser Fläche, 19 Kapitel VI. Vektoranalysis Fig. 4 : Parameterdarstellung einer Kugel Fig. 5 : Parameterdarstellung eines Kegels 20 U. Stammbach: Analysis, Teil B indem man u = r und v = ϕ setzt, nämlich (u, v) → ~r(u, v) = (u sin α cos v, u sin α sin v, u cos α) . Der zur Mantelfläche gehörige Parameterbereich ist durch 0 ≤ u < ∞ und 0 ≤ v ≤ 2π gegeben (siehe Figur 5). Die u-Linien sind die Mantellinien des Kegels, die v-Linien sind die zur (x, y)Ebene parallelen Kreise mit Mittelpunkt auf der z-Achse. Beispiel Es sei eine Kurve K durch die Parameterdarstellung u → ~s(u) = (x(u), y(u), z(u)) gegeben. Die Fläche, die beim Durchlaufen der Kurve K von der Tangente an die Kurve überstrichen wird, heisst Tangentenfläche S der Kurve. Wir setzen ~t(u) = ~s˙ (u) und erhalten damit die folgende Parameterdarstellung von S (u, v) → ~r(u, v) = ~s(u) + v ~t(u) . Die v-Linien sind gerade die Tangenten an die Kurve K, die u-Linie, die zu v = 0 gehört, ist die Kurve K. Die Fläche S sei durch die Parameterdarstellung (u, v) → ~r(u, v) gegeben. Auf S halten wir den Punkt P fest. Er gehöre zu den Parametern (u0 , v0 ). Wir wollen die Tangentialebene an S im Punkte P studieren, insbesondere den zugehörigen Normaleneinheitsvektor ~n(u0 , v0 ). Zu diesem Zweck betrachten wir die durch P gehende u-Linie u → ~r(u, v0 ) und die durch P gehende v-Linie v → ~r(u0 , v) . Die Tangentialvektoren dieser beiden Kurven im Punkte P , d.h. die Vektoren ~ru (u0 , v0 ) und ~rv (u0 , v0 ) spannen offenbar die Tangentialebene auf. Damit ist ihr Vektorprodukt ein zur Fläche S in P senkrecht stehender Vektor. Der normale Einheitsvektor zur Fläche S in P wird also durch ~n(u0 , v0 ) = ± ~ru (u0 , v0 ) × ~rv (u0 , v0 ) |~ru (u0 , v0 ) × ~rv (u0 , v0 )| beschrieben (siehe Figur 6). Natürlich sind für ~n zwei Richtungen möglich. Beispiel Gesucht ist der Normaleneinheitsvektor der Tangentenfläche 21 Kapitel VI. Vektoranalysis ~n(u0 , v0 ) ~rv (u0 , v0 ) Fig. 6 : Normalenvektor zu einer durch eine Parameterdarstellung gegebenen Fläche (z) (y) ~ru (u0 , v0 ) (x) (u, v) → ~s(u) + v~s˙ (u) . Es gilt ~ru (u, v) = ~s˙ (u) + v~¨s(u) , ~rv (u, v) = ~s˙ (u) . Damit erhalten wir ~ru (u, v) × ~rv (u, v) = (~s˙ (u) + v~¨s(u)) × ~s˙ (u) = v (~¨s(u) × ~s˙ (u)) , also ~n(u, v) = ± ~¨s(u) × ~s˙ (u) . |~¨s(u) × ~s˙ (u)| Wir stellen fest, dass ~n(u, v) in diesem Beispiel vom Parameter v unabhängig ist. Dies bedeutet, dass der Normaleneinheitsvektor auf einer v-Linie konstant ist. Da die v-Linien die Tangenten an die ursprünglich gegebene Kurve K sind, folgt daraus, dass die Tangentialebene an die Fläche im Punkte P diese längs der durch P gehenden Tangente an die Kurve K berührt. 22 U. Stammbach: Analysis, Teil B Fig. 7 : Tangentenfläche an die Schraubenlinie. Der gezeichnete Teil gehört zu negativen Werten des Parameters v. Beispiel Wir betrachten den Spezialfall des vorhergehenden Beispiels, wo die Kurve K die Schraubenlinie u → ~s(u) = (cos u, sin u, hu) ist. Die Tangentenfläche (siehe Figur 7) (u, v) → ~r(u, v) = ~s(u) + v~s˙ (u) besitzt den Normaleneinheitsvektor ~n(u, v) = √ 1 h2 + 1 (−h sin u, h cos u, −1) , wobei wir eine der beiden möglichen Richtungen des Normaleneinheitsvektors ausgezeichnet haben. Berechnet man den Winkel ω zwischen ~n(u, v) und dem Einheitsvektor in z-Richtung, so erhält man cos ω = (0, 0, 1) · ~n(u, v) = √ −1 . h2 + 1 23 Kapitel VI. Vektoranalysis Wir entnehmen diesem Resultat, dass ω unabhängig ist von u und v, d.h. dass ω auf der ganzen Fläche konstant ist: die Tangentenfläche an die Schraubenlinie hat gegenüber der (x, y)Ebene überall dieselbe Neigung. Flächen mit dieser Eigenschaft treten etwa als Oberflächen von Aufschüttungen von losem Material in Erscheinung; in der Mathematik heissen sie deshalb auch Böschungsflächen. Bemerkung Der Leser überlege sich an dieser Stelle, wie der Normaleneinheitsvektor einer durch eine Gleichung g(x, y, z) = 0 gegebenen Fläche auf ganz andere Art, nämlich mit Hilfe des Gradienten dargestellt werden kann. Als nächstes interessieren wir uns für den Oberflächeninhalt eines durch eine Parameterdarstellung gegebenen Flächenstücks S. Es sei S durch die Parameterdarstellung (u, v) → ~r(u, v) ~r(u, v + dv) dS Fig. 8 : Zur Berechnung der Oberfläche eines Flächenstücks ~r(u, v) (z) ~r(u + du, v) (y) (x) gegeben, wo (u, v) über den Bereich B in der (u, v)-Ebene variiert. Wir denken uns S durch das Netz der Parameterlinien in kleine Teilstücke eingeteilt. Lassen wir u um du und v um dv wachsen, so erhalten wir auf der Fläche S ein differentielles Flächenstück dS. Dieses kann 24 U. Stammbach: Analysis, Teil B näherungsweise als ebenes Parallelogramm angesehen werden, welches durch die Vektoren ~r(u + du, v) − ~r(u, v) ∼ ~ru (u, v) du ~r(u, v + dv) − ~r(u, v) ∼ ~rv (u, v) dv aufgespannt wird. Sein Flächeninhalt dO lässt sich approximativ durch den Absolutbetrag des Vektorproduktes ausdrücken (siehe Figur 8). Es ist also dO = |~ru (u, v) × ~rv (u, v)| du dv. Der Flächeninhalt O des Flächenstücks S ist die “Summe” all dieser Anteile dO, also O= ZZ B |~ru (u, v) × ~rv (u, v)| du dv . Man beachte, dass in der Formel über den Parameterbereich B in der (u, v)-Ebene zu integrieren ist, der zum Flächenstück S gehört. Bemerkung Es handelt sich bei den obigen Überlegungen nicht um eine mathematische Herleitung, vielmehr müsste an dieser Stelle der Begriff des Flächeninhaltes einer gekrümmten Fläche definiert und dann gezeigt werden, dass die obige Formel unter vernünftigen Voraussetzungen an die Funktion (u, v) → ~r(u, v) diesen Flächeninhalt liefert. Hier haben wir uns mit einigen mehr heuristischen Überlegungen begnügt. Der Mathematiker kann allerdings zeigen, dass sie für “vernünftige” Parameterdarstellungen zum richtigen Resultat führen. Insbesondere bedeutet dies, dass der Wert des Integrals nicht von der Parameterdarstellung abhängig ist, die man für ein geometrisch gegebenes Flächenstück gewählt hat: das Integral liefert für verschiedene “vernünftige” Parameterdarstellungen desselben Flächenstücks das gleiche Resultat. Beispiel Wir betrachten die Oberfläche der Kugel vom Radius R und Mittelpunkt O; (u, v) → (R sin v cos u, R sin v sin u, R cos v) mit 0 ≤ u ≤ 2π, 0 ≤ v ≤ π. Es gilt ~ru (u, v) = (−R sin v sin u, R sin v cos u, 0) ~rv (u, v) = (R cos v cos u, R cos v sin u, −R sin v) ~ru (u, v) × ~rv (u, v) = (−R2 sin2 v cos u, −R2 sin2 v sin u, −R2 sin v cos v) . Das Vektorprodukt ~ru × ~rv ist ins Innere der Kugel gerichtet. Es ergibt sich dO = |~ru (u, v) × ~rv (u, v)| du dv = R2 sin v du dv (eine Formel, die sich übrigens auch direkt aus der Figur 9 ablesen lässt) und damit Kapitel VI. Vektoranalysis 25 (z) du Fig. 9 : Zur Berechnung der Oberfläche einer Kugel R sin v R sin v du R dv v dv R 2π O= π du 0 R2 sin v dv = R2 0 2π 0 du [− cos v]π0 = 4πR2 , ein uns wohlbekanntes Resultat. Beispiel Gesucht ist der Flächeninhalt der Tangentenfläche an die Schraubenlinie (u, v) → r(u, v) = (cos u − v sin u, sin u + v cos u, h(u + v)) für 0 ≤ u ≤ π/2, −u ≤ v ≤ 0 (siehe Figur 10). Dies beschreibt den Teil der Schraubenfläche, der zum Stück der Schraubenlinie im ersten Oktanten gehört und der sich zwischen diesem Kurvenstück und der (x, y)-Ebene befindet. Es gilt ru (u, v) = (− sin u − v cos u, cos u − v sin u, h) rv (u, v) = (− sin u, cos u, h) ru (u, v) × rv (u, v) = (−hv sin u, hv cos u, −v) . Daraus ergibt sich das Oberflächenelement dO = |ru (u, v) × rv (u, v)| du dv = |v| h2 + 1 du dv , 26 U. Stammbach: Analysis, Teil B 0.5 (v) (u) -0.5 0.5 -0.5 1 1.5 2 Fig. 10 : Der Bereich B der (u, v)-Ebene B -1 -1.5 -2 und der Flächeninhalt berechnet sich zu O = = = = = = ZZ p p p p p B |~ru (u, v) × ~rv (u, v)| du dv h2 + 1 h2 + 1 h2 + 1 Z 0 Z h2 + 1 π/2 du " 0 Z π/2 0 " h2 + 1 π/2 u3 6 π3 48 Z 0 −u v2 − 2 dv |v| #0 u2 du 2 du −u #π/2 0 . Beispiel Wir betrachten den Bereich A der (x, y)-Ebene, welcher durch die positive x-Achse und die Kurve ρ = cos(ϕ/4) begrenzt wird (siehe Figur 11). Wie gross ist der Flächeninhalt des 27 Kapitel VI. Vektoranalysis (y) 1 0.5 ρ = cos(ϕ/4) -1 -0.5 A Fig. 11 : Der Bereich A der (x, y)-Ebene 0.5 1 (x) -0.5 -1 über dem Bereich A liegenden Teils S der Oberfläche der Einheitskugel. Wir wählen zur Beschreibung des Flächenstücks S als Parameter Polarkoordinaten in der (x, y)Ebene. S wird dann durch die Parameterdarstellung (ρ, ϕ) → ~r(ρ, ϕ) = (ρ cos ϕ, ρ sin ϕ, q 1 − ρ2 ) beschrieben. Der Definitionsbereich A ist durch 0 ≤ ϕ ≤ 2π , 0 ≤ ρ ≤ cos(ϕ/4) gegeben. Dann ist ρ ~rρ (ρ, ϕ) = cos ϕ, sin ϕ, − p 1 − ρ2 ~rϕ (ρ, ϕ) = (−ρ sin ϕ, ρ cos ϕ, 0) ~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ) = |~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ)| = ! ρ2 ρ2 p p cos ϕ, sin ϕ, ρ 1 − ρ2 1 − ρ2 ! ρ4 ρ4 2 cos ϕ + sin2 ϕ + ρ2 1 − ρ2 1 − ρ2 Daraus ergibt sich der gesuchte Flächeninhalt ZZ ρ p O = dρ dϕ 1 − ρ2 B !1/2 ρ = p . 1 − ρ2 28 U. Stammbach: Analysis, Teil B Z = 2π 0 Z = 0 Z = 0 Z = 2π 2π 2π 0 dϕ Z cos(ϕ/4) 0 q dϕ − 1 − ρ dρ 1 − ρ2 p ρ2 q cos(ϕ/4) 0 dϕ (− 1 − cos2 (ϕ/4) + 1) dϕ (1 − sin(ϕ/4)) = [ϕ + 4 cos(ϕ/4)] 2π 0 = 2π − 4 . Man beachte, dass der Oberflächeninhalt der halben Einheitskugel gerade 2π beträgt. Wir betrachten zum Schluss noch kurz den Fall, wo das Flächenstück S auf einfache Weise als Graph einer Funktion f von zwei Variablen (x, y) gegeben ist. Setzen wir u = x und v = y, so erhalten wir aus dieser expliziten Darstellung sofort eine Parameterdarstellung von S (u, v) → ~r(u, v) = (u, v, f (u, v)) . Das übliche Vorgehen liefert dann mit ~ru (u, v) = (1, 0, fu (u, v)) und ~rv (u, v) = (0, 1, fv (u, v)) sofort ~ru (u, v) × ~rv (u, v) = (−fu (u, v), −fv (u, v), 1) , so dass man dO = q fu2 + fv2 + 1 du dv erhält. Der Oberflächeninhalt eines über dem Bereich B liegenden Graphen einer Funktion f : (x, y) → f (x, y) von zwei Variablen berechnet sich also mit Hilfe der Formel O= ZZ q B (fx (x, y))2 + (fy (x, y))2 + 1 dx dy , wobei wir natürlich wieder zur ursprünglichen Variablenbezeichnung zurückgekehrt sind. 29 Kapitel VI. Vektoranalysis 4 Der Fluss Es sei ein Vektorfeld ~v gegeben, das im Bereich D(~v ) definiert ist. Wir betrachten ein vollständig in D(~v ) liegendes Flächenstück S, das durch eine Parameterdarstellung gegeben ist und auf dem die eine der beiden Normalenrichtungen ~n ausgezeichnet ist. Ist ~v das Geschwindigkeitsfeld einer Flüssigkeitsströmung, so können wir fragen, wieviel Flüssigkeit pro Zeiteinheit in Richtung ~n durch das Flächenstück S hindurchfliesst. Diese Grösse nennt man den Fluss Φ des Vektorfeldes ~v in Richtung ~n durch S. Am einfachsten ist diese Frage natürlich zu beantworten, wenn S ein ebenes Flächenstück und ~v ein homogenes Vektorfeld ist. Das pro Zeiteinheit durch S in Richtung ~n fliessende Volumen ist dann das Volumen des (schiefen) Zylinders mit Grundfläche S und durch ~v gegebenen Mantellinien. Dieses Volumen ist offensichtlich Φ = (~v · ~n) O , wo O der Flächeninhalt von S ist (siehe Figur 1). S ~v ~n Fig. 1 : Fluss eines homogenen Vektorfeldes durch ein ebenes Rechteck 30 U. Stammbach: Analysis, Teil B Im allgemeinen Fall zerlegen wir S in “kleine” Teilbereiche dS; natürlich tun wir dies mit Vorteil längs der durch die Parameterdarstellung von S gegebenen Parameterlinien. Diese kleinen Teilbereiche dS können approximativ als eben und das Vektorfeld in jedem dieser Teilbereiche approximativ als homogen angesehen werden (siehe Figur 2). Der von dS herrührende Anteil dΦ des Flusses ist dann offenbar dΦ = ~v · ~n dO , wo dO der Flächeninhalt von dS bezeichnet. Die “Summe” all dieser Anteile, also das Integral, ist dann der Fluss des Vektorfeldes ~v durch S in Richtung ~n: ZZ Φ= S ~v · ~n dO . ~v ~n Fig. 2 : Fluss eines Vektorfeldes durch ein Flächenstück (z) (y) (x) Beispiel Gegeben ist eine elektrische Ladung e im Ursprung des Koordinatensystems. Gesucht ist der Fluss des zugehörigen Coulombfeldes durch eine Kugeloberfläche mit Mittelpunkt in O und Radius R von innen nach aussen. Es gilt 31 Kapitel VI. Vektoranalysis ~v = C e ~r . |~r|3 Damit ist ZZ Φ= S C e ~r · ~n dO , R3 wo ~n den äusseren Normaleneinheitsvektor der Kugeloberfläche bezeichnet. Da ~r und ~n parallel sind, gilt ~r · ~n = R. Damit folgt e Φ=C 2 R ZZ S dO = C e 4πR2 = 4πCe . R2 Der Fluss des Coulombfeldes zur Ladung e durch die Oberfläche einer Kugel mit Radius R, deren Mittelpunkt mit e zusammenfällt, ist proportional zur Grösse der Ladung e und unabhängig vom Radius R. Nicht immer ist die Berechnung des Flusses so einfach. Es sei das Flächenstück S durch die Parameterdarstellung (u, v) → ~r(u, v) = (x(u, v), y(u, v), z(u, v)) , (u, v) ∈ B gegeben. Daraus folgt für den Normaleneinheitsvektor ~n(u, v) ~n(u, v) = ± ~ru (u, v) × ~rv (u, v) . |~ru (u, v) × ~rv (u, v)| Das Vorzeichen hängt davon ab, welche der beiden Normalenrichtungen auf S wir auszeichnen. Da nach Abschnitt 3 das Flächenelement dO durch dO = |~ru (u, v) × ~rv (u, v)| du dv gegeben ist, folgt für den Fluss Φ=± ZZ B ~v (x(u, v), y(u, v), z(u, v)) · (~ru (u, v) × ~rv (u, v)) du dv . Dabei ist B der zu S gehörige Parameterbereich in der (u, v)-Ebene. Wie nicht anders zu erwarten war, führt die Umkehrung der Flussrichtung, d.h. die Wahl des anderen Normaleneinheitsvektors zu einem Vorzeichenwechsel. 32 U. Stammbach: Analysis, Teil B Beispiel Es sei das Vektorfeld v : (x, y, z) → v (x, y, z) = (xz, z, y) gegeben. Gesucht ist der Fluss Φ von innen nach aussen von v durch die Oberfläche S der Einheitskugel mit Mittelpunkt in O. Die Fläche S kann durch die Parameterdarstellung (u, v) → r(u, v) = (sin v cos u, sin v sin u, cos v) mit 0 ≤ u ≤ 2π, 0 ≤ v ≤ π beschrieben werden. Dann gilt (siehe Abschnitt 3) ru (u, v) × rv (u, v) = (− sin2 v cos u, − sin2 v sin u, − sin v cos v) . Dieser Normalenvektor (kein Einheitsvektor) ist nach innen gerichtet. Damit erhalten wir für den Fluss von innen nach aussen, also in der zu ru × rv entgegengesetzten Richtung Φ = − B = B v (x(u, v), y(u, v), z(u, v)) · (ru (u, v) × rv (u, v)) du dv (sin v cos u cos v, cos v, sin v sin u) · (sin2 v cos u, sin2 v sin u, sin v cos v) du dv (sin3 v cos v cos2 u + sin2 v cos v sin u + sin2 v cos v sin u) du dv = B π 2π dv = 0 π = π sin3 v cos v cos2 u du 0 sin3 v cos v dv 0 = π 1 sin4 v 4 π 0 = 0. Beispiel Gesucht ist der Fluss (in Richtung der äusseren Normalen) des Vektorfeldes v : (x, y, z) → v (x, y, z) = (2x − yz, xz + 3y, xy − z) durch den Kegelmantel des Kegels mit Spitze in O, der Achse gleich der z-Achse, dem halben Öffnungswinkel π/4 und der Höhe 1. Der Kegelmantel lässt sich durch die Parameterdarstellung (ρ, ϕ) → (ρ cos ϕ, ρ sin ϕ, ρ) 33 Kapitel VI. Vektoranalysis Fig. 3 : Kegelmantel mit Normalenvektor ~rρ × ~rϕ beschreiben, wobei ρ und ϕ Polarkoordinaten in der (x, y)-Ebene bezeichnen und der Bereich B durch 0 ≤ ρ ≤ 1 und 0 ≤ ϕ ≤ 2π gegeben ist. Es gilt dann ~rρ (ρ, ϕ) = (cos ϕ, sin ϕ, 1) ~rϕ (ρ, ϕ) = (−ρ sin ϕ, ρ cos ϕ, 0) ~rρ (ρ, ϕ) × ~rϕ (ρ, ϕ) = (−ρ cos ϕ, −ρ sin ϕ, ρ(cos2 ϕ + sin2 ϕ)) = (−ρ cos ϕ, −ρ sin ϕ, ρ) . Dieser Normalenvektor ist nach innen gerichtet (siehe Figur 3). Deshalb gilt für den gesuchten Fluss Φ ZZ Φ = Z ZB Z B 1 = = 0 (2ρ cos ϕ − ρ2 sin ϕ, ρ2 cos ϕ + 3ρ sin ϕ, ρ2 sin ϕ cos ϕ − ρ) · (ρ cos ϕ, ρ sin ϕ, −ρ) dρ dϕ (2ρ2 cos2 ϕ − ρ3 sin ϕ cos ϕ + ρ3 sin ϕ cos ϕ + 3ρ2 sin2 ϕ − ρ3 sin ϕ cos ϕ + ρ2 ) dρ dϕ dρ Z 2π 0 dϕ (2ρ2 cos2 ϕ − ρ3 sin ϕ cos ϕ + 3ρ2 sin2 ϕ + ρ2 ) . Wegen Z 0 und 2π cos2 ϕ dϕ = Z 0 2π sin2 ϕ dϕ = π 34 U. Stammbach: Analysis, Teil B Z 0 2π cos ϕ sin ϕ dϕ = 0 folgt schliesslich Z Φ= 0 1 (2ρ2 π + 3ρ2 π + ρ2 2π) dρ = 7π Z 0 1 ρ2 dρ = 7π/3 . 35 Kapitel VI. Vektoranalysis 5 Der Divergenzsatz Gegeben sei ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) und ein endlicher räumlicher Bereich B (Kugel, Torus, etc) mit berandender Fläche ∂B. (Um der mathematischen Strenge Genüge zu tun, setzen wir voraus, dass sich ∂B aus endlich vielen Flächenstücken zusammensetzt, die sich durch stetig differenzierbare Parameterdarstellungen beschreiben lassen.) Auf ∂B sei der äussere Normaleneinheitsvektor ausgezeichnet (siehe Figur 1). Wir setzen voraus, dass ~v in ganz B definiert und dort “regulär” ist, d.h. dass ~v einmal stetig differenzierbar ist. Dann gilt der überraschende und wichtige Divergenzsatz, Satz von Gauss (C. F. Gauss 1777 - 1855): Satz Unter den obigen Voraussetzungen gilt: ZZ Φ= ∂B ~v · ~n dO = ZZZ B div ~v dV . Der Fluss des Vektorfeldes ~v von innen nach aussen durch die berandende Fläche ∂B von B ist gleich dem Volumenintegral der Divergenz von ~v über den Bereich B. Beispiel Wir betrachten das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (xz, z, y) und die Einheitskugel B mit Mittelpunkt in O. Wir haben in einem Beispiel in Abschnitt 4 bereits gesehen, dass der Fluss Φ (von innen nach aussen) von ~v durch die Kugeloberfläche Null ist. Nach dem Satz von Gauss gilt ZZZ Φ= B div ~v dV , so dass sich der Fluss Φ auch als Volumenintegral berechnen lässt. Wir erhalten div ~v (x, y, z) = z. Für das Integral ZZZ B z dV erhält man aber Null, da der von der oberen Halbkugel herrührende Anteil den Anteil der untern Halbkugel kompensiert. (Natürlich kann man mit Hilfe von Kugelkoordinaten dieses Integral auch leicht direkt berechnen: Es gilt z = r cos θ , dV = r 2 sin θ dr dϕ dθ . Also 36 U. Stammbach: Analysis, Teil B ~n Fig. 1 : Zum Satz von Gauss ~v ZZZ B z dV = Z 0 1 dr Z 0 2π dϕ Z π 0 dθ r cos θ r 2 sin θ = 0 . ) Wir beweisen den Satz von Gauss hier nicht. Immerhin wollen wir ihn in einem Spezialfall verifizieren, im Spezialfall nämlich, wo der Bereich B ein achsenparalleler Quader ist. Es sei B beschrieben durch die Ungleichungen (siehe Figur 2) a ≤ x ≤ b, c ≤ y ≤ d, e ≤ z ≤ f . Für das Vektorfeld ~v → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z)) ist dann das Volumenintegral ZZZ B div ~v dV = ZZZ B ∂v1 (x, y, z) dV + ∂x ZZZ B ∂v2 (x, y, z) dV + ∂y ZZZ B ∂v3 (x, y, z) dV ∂z 37 Kapitel VI. Vektoranalysis z=f y=d x=a (−1, 0, 0) Fig. 2 : Spezialfall des Satzes von Gauss x=b S10 S1 (z) y=c (1, 0, 0) z=e (y) (x) auszurechnen. Für dessen ersten Summanden gilt nun ZZZ B ∂v1 (x, y, z) dV ∂x Z = f e Z = e Z = = f f ZeZ Z dz c Z dz c Z dz S10 d c d d dy Z b a ∂v1 dx ∂x dy (v1 (b, y, z) − v1 (a, y, z)) dy ~v (b, y, z) · (1, 0, 0) + ~v · ~n dO + ZZ S1 Z f e dz Z c d dy ~v (a, y, z) · (−1, 0, 0) ~v · ~n dO , wo S10 die rechte und S1 die linke Seitenfläche des Quaders B bezeichnet. Der erste der obigen Summanden ist also gleich dem Fluss (von innen nach aussen) des Vektorfeldes ~v durch die Seitenflächen S1 und S10 . Analog verfährt man mit den übrigen beiden Summanden. Damit erhält man im Falle des Quaders tatsächlich ZZZ B div ~v dV = ZZ ∂B ~v · ~n dO . Im Rest dieses Abschnittes zeigen wir noch, wie der Satz von Gauss eine koordinatenfreie Definition der Divergenz liefert. Diese ermöglicht dann ihrerseits eine anschauliche Interpretation 38 U. Stammbach: Analysis, Teil B der Divergenz eines Vektorfeldes. Zur Einleitung betrachten wir neben dem (x, y, z)-Koordinatensystem ein zweites kartesisches Koordinatensystem (ξ, η, ζ). Ist uns im (x, y, z)-Koordinatensystem ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z)) gegeben, so stellt sich dieses im neuen (ξ, η, ζ)-Koordinatensystem natürlich durch andere Komponenten dar: ~ṽ : (ξ, η, ζ) → ~ṽ(ξ, η, ζ) = (ṽ1 (ξ, η, ζ), ṽ2 (ξ, η, ζ), ṽ3 (ξ, η, ζ)) . Es ist auch zu erwarten, dass die partielle Ableitungen der Komponenten ṽ1 , ṽ2 , ṽ3 nach den neuen Koordinaten ξ, η, ζ mit den partiellen Ableitungen von v1 , v2 , v3 nach x, y, z wenig mehr zu tun haben werden. Umso überraschender ist deshalb das Resultat, dass die Summe der partiellen Ableitungen der Komponenten des Vektorfeldes ~v nach den drei entsprechenden Koordinaten vom Koordinatensystem unabhängig ist: ∂v1 ∂v2 ∂v3 ∂ṽ1 ∂ṽ2 ∂ṽ3 (x, y, z) + (x, y, z) + (x, y, z) = (ξ, η, ζ) + (ξ, η, ζ) + (ξ, η, ζ) . ∂x ∂y ∂z ∂ξ ∂η ∂ζ Die Divergenz des Vektorfeldes, wie wir sie formal definiert haben, ist vom gewählten (kartesischen) Koordinatensystem unabhängig. Wir beweisen dies, indem wir mit Hilfe des Satzes von Gauss eine koordinatenfreie Definition von div ~v angeben. Wir betrachten zu diesem Zweck einen festen Punkt P0 = (x0 , y0 , z0 ) und eine Kugel Kr um P0 mit Radius r und Oberfläche Sr . Dann gilt nach dem Satz von Gauss ZZZ Kr div ~v dV = ZZ Sr ~v · ~n dO , wo ~n den äusseren Normaleneinheitsvektor bezeichnet (siehe Figur 3). Der Mittelwertsatz der Integralrechnung für Volumenintegrale besagt, dass ein Punkt Pr = (xr , yr , zr ) in Kr existiert mit ZZZ 4 div ~v dV = πr 3 div ~v (xr , yr , zr ) . 3 Kr Lässt man nun r gegen Null gehen, so ergibt sich 1 div ~v (x0 , y0 , z0 ) = lim 4 3 r→0 πr 3 ZZ Sr ~v · ~n dO . 39 Kapitel VI. Vektoranalysis ~n r Fig. 3 : Der Fluss durch die Oberfläche einer (kleinen) Kugel um P0 Pr P0 = (x0 , y0 , z0 ) Kr Sr Da der Fluss des Vektorfeldes ~v durch Sr definitionsgemäss nicht vom gewählten Koordinatensystem abhängig ist, ist auch die linke Seite der Gleichung vom gewählten Koordinatensystem unabhängig. Dies war zu beweisen. Wir sehen aus diesen Überlegungen, dass die Divergenz div ~v eines Vektorfeldes ~v in P0 = (x0 , y0 , z0 ) ein Mass für den aus der Volumeneinheit um P0 heraustretenden Fluss des Vektorfeldes ist. Die Aussage div ~v (x0 , y0 , z0 ) > 0, bedeutet, dass in P0 pro Volumeneinheit ein positiver Fluss erhalten wird. Anschaulich lässt sich dies dadurch deuten, dass in P0 fortlaufend “Flüssigkeit erzeugt wird”. Man nennt deshalb eine solche Stelle eine Quelle des Vektorfeldes ~v . Die Aussage div ~v (x0 , y0 , z0 ) < 0, lässt sich dadurch interpretieren, dass in P0 fortlaufend “Flüssigkeit verschwindet”; man spricht dann von einer Senke oder von einer negativen Quelle des Vektorfeldes. Ein Vektorfeld ~v , dessen Divergenz im ganzen Definitionsbereich verschwindet, div ~v ≡ 0 heisst quellenfrei. Anschaulich ist nach dem eben Gesagten klar, dass Strömungsfelder inkompressibler Medien quellenfrei sind; dies lässt sich, wie wir in Abschnitt 6 sehen werden, auch theoretisch bestätigen. Durch direkte Rechnung haben wir ausserdem bereits im Abschnitt 2 gezeigt, dass das Coulombfeld quellenfrei ist. 40 6 U. Stammbach: Analysis, Teil B Anwendungen des Divergenzsatzes Es gibt sehr viele Anwendungen des Divergenzsatzes. Wir besprechen hier einige davon, und zwar solche, die sich auch ohne detaillierte Kenntnisse der Anwendungsgebiete darstellen lassen. Dabei verläuft die Überlegung in allen Fällen formal gleich: Wir gehen von einem allgemeinen physikalischen Gesetz aus, wenden darauf den Divergenzsatz an und erhalten ein neues physikalisches Gesetz, das vom mathematischen Standpunkt aus wesentlich durchsichtiger und einfacher zu handhaben ist. Kontinuitätsgleichung der Hydrodynamik In unserm ersten Beispiel leiten wir aus dem sehr allgemeinen physikalischen Gesetz der Erhaltung der Materie die sogenannte Kontinuitätsgleichung der Hydrodynamik her. Wir betrachten ein (instationäres) Strömungsfeld eines Mediums (Gas oder Flüssigkeit) ~v : (x, y, z, t) → ~v (x, y, z, t) . Die Dichte des Mediums im Punkte (x, y, z) zur Zeit t sei durch das Skalarfeld ρ : (x, y, z, t) → ρ(x, y, z, t) beschrieben. Es sei nun B ein beliebiger endlicher Bereich, der ganz im Strömungsfeld liegt (siehe Figur 1). Zur Zeit t befindet sich dann im Innern von B die Masse m(t) = ZZZ B ρ(x, y, z, t) dV . Die zeitliche Änderung dieser Masse ist folglich gegeben durch dm d = dt dt ZZZ B ρ(x, y, z, t) dV = ZZZ B ρt (x, y, z, t) dV , wobei wir im letzten Schritt unser Wissen über die Ableitung eines Integrals nach einem Parameter benützt haben (siehe Kapitel V, Abschnitt 5). Pro Zeiteinheit tritt durch das Oberflächenelement dS die Masse ρ (~v · ~n) dO 41 Kapitel VI. Vektoranalysis ~n Fig. 1 : Zur Kontinuitätsgleichung B ~v aus, wobei ~n den äusseren Normaleneinheitsvektor bezeichnet. Durch die Gesamtoberfläche ∂B von B geht also die Masse ZZ ∂B (ρ~v ) · ~n dO verloren. Die Materiebilanz (“Gesetz der Erhaltung der Materie”) liefert nun die Gleichung ZZZ B ρt dV + ZZ ∂B (ρ~v ) · ~n dO = 0 . Die gesamte in B vorhandene Masse nimmt um genau so viel zu, wie durch die Oberfläche ∂B in den Bereich B hineinfliesst. An dieser Stelle wendet man nun auf das in der Gleichung auftretende Flussintegral ZZ ∂B (ρ~v ) · ~n dO den Divergenzsatz an, und zwar für das Vektorfeld w ~ : (x, y, z, t) → w(x, ~ y, z, t) = ρ(x, y, z, t) ~v (x, y, z, t) . 42 U. Stammbach: Analysis, Teil B Man erhält ZZ ∂B (ρ~v ) · ~n dO = ZZZ B div (ρ~v ) dV . Daraus ergibt sich die Integralbeziehung ZZZ B (ρt + div (ρ~v )) dV = 0 . Da diese Gleichung für jeden beliebigen Bereich B im Strömungsfeld erfüllt sein muss, schliessen wir, dass mit dem Integral auch der Integrand verschwindet: ρt + div (ρ~v ) = 0 . Dies ist die wichtige Kontinuitätsgleichung der Hydrodynamik. Wir betrachten davon noch einige Spezialfälle (a) Im Falle einer stationären Strömung ist ρt ≡ 0. Dann folgt div (ρ~v ) ≡ 0 . Dabei gilt natürlich div (ρ~v ) = ~v · grad ρ + ρ div ~v . (b) Im Falle einer Strömung eines inkompressiblen Mediums ist ρ zeitlich und örtlich konstant. Dann gilt div (ρ~v ) = ρ div ~v , so dass sich die Kontinuitätsgleichung in diesem Fall auf die Aussage div ~v ≡ 0 reduziert. Wir haben damit formal bewiesen, dass Strömungsfelder inkompressibler Medien (z.B. von Flüssigkeiten) quellenfrei sind (vergleiche Abschnitt 5). 43 Kapitel VI. Vektoranalysis Wärmeleitungsgleichung Unser zweites Beispiel geht aus vom grundlegenden physikalischen Erhaltungssatz der Energie. Wir werden daraus die sogenannte Wärmeleitungsgleichung herleiten. Es sei ein homogener Körper K gegeben. Die Temperatur an der Stelle (x, y, z) zur Zeit t sei durch das instationäre Skalarfeld u : (x, y, z, t) → u(x, y, z, t) beschrieben. Wir betrachten nun einen beliebigen ganz in K liegenden Bereich B mit Oberfläche ∂B (siehe Figur 2). Die zur Zeit t in B befindliche Wärmemenge W (t) ist gegeben durch W (t) = ZZZ B c ρ u(x, y, z, t) dV , ~n K Fig. 2 : Zur Wärmeleitungsgleichung B (z) (y) (x) wobei c die spezifische Wärme und ρ die Dichte des Materials ist. (Beide Grössen sind konstant, da wir K als homogen vorausgesetzt haben.) Die Änderung der Wärmemenge W (t) ist somit gegeben durch dW (t) = dt ZZZ B c ρ ut (x, y, z, t) dV . 44 U. Stammbach: Analysis, Teil B dS grad u ~n Fig. 3 : Zum Ansatz von Newton für die Wärmeleitung (z) (y) (x) Da in B weder Wärme erzeugt noch vernichtet wird, kann die Änderung der Wärmemenge W (t) nur durch einen Wärmefluss durch die Oberfläche ∂B von B verursacht werden. In dieser Form benützen wir den Erhaltungssatz der Energie. Um den Wärmefluss durch die Oberfläche mathematisch ausdrücken zu können, greifen wir auf das von Newton beschriebene Erfahrungsgesetz zurück (siehe Figur 3): Die pro Zeiteinheit durch das differentielle Flächenstück dS in Richtung des Normaleneinheitsvektors ~n hindurchfliessende Wärmemenge ist proportional zum Temperaturgefälle in Richtung ~n, also zur Richtungsableitung D~n u von u in Richtung ~n und natürlich proportional zum Flächeninhalt dO des Flächenstücks dS. Wegen D~n u = ~n · grad u (siehe Kapitel IV, Abschnitt 7) folgt für die durch dS hinaus tretende Wärmemenge dW = −k ~n · grad u dO. Dabei ist k eine positive Konstante. Wir erhalten damit die Gleichung ZZZ B c ρ ut dV = ZZ ∂B k (~n · grad u) dO , wenn wir mit ~n den äusseren Normaleneinheitsvektor von B bezeichnen. An dieser Stelle wenden wir nun den Divergenzsatz auf das auf der rechten Seite stehende Flussintegral an. Wir erhalten 45 Kapitel VI. Vektoranalysis ZZ ∂B k (~n · grad u) dO = ZZZ B k div grad u dV . Daraus folgt ZZZ B (cρut − kdiv (grad u)) dV = 0 . Da dies für beliebige in K liegende Bereiche B gelten muss, folgern wir, dass mit dem Integral auch der Integrand Null ist. Verwenden wir wie üblich die Bezeichnung div grad u = ∆u und setzen wir a2 := k , cρ so gilt ut − a2 ∆u = 0 . Dies ist die sogenannte Wärmeleitungsgleichung. Diese lineare partielle Differentialgleichung zweiter Ordnung tritt in vielen anderen Anwendungen, nämlich ganz allgemein bei Diffusionsproblemen auf. In der Analysis III wird einiges über die Lösungen dieser Gleichungen gesagt werden. Wir erwähnen zum Schluss noch den Spezialfall einer stationären Temperaturverteilung, also z.B. einer Temperaturverteilung, wie sie sich in einem isolierten Körper K nach langer Zeit automatisch einstellt. Dann gilt ut ≡ 0, so dass u Lösung der partiellen Differentialgleichung ∆u = 0 sein muss. Die stationäre Temperaturverteilung u genügt der sogenannten Laplace’schen Differentialgleichung ∆u = 0; die Lösungen der Laplace’schen Differentialgleichungen heissen definitionsgemäss harmonische Funktionen. Grundgleichung der Elektrostatik In unserm dritten Beispiel leiten wir die Grundgleichung der Elektrostatik, also eine der vier Maxwell’schen Gleichungen (siehe Physik) aus dem Coulomb’schen Gesetz her. 46 U. Stammbach: Analysis, Teil B ~ einer elektrischen Ladung e im Das Coulomb’sche Gesetz besagt, dass das elektrische Feld E Punkte P0 = (x0 , y0 , z0 ) durch ~r − ~r0 ~ E(x, y, z) = e |~r − ~r0 |3 beschrieben wird, wobei wir zur Abkürzung ~r = (x, y, z) und ~r0 = (x0 , y0 , z0 ) gesetzt haben. Man vergleiche dazu das entsprechende Beispiel in Abschnitt 1, wo das Coulombfeld für P0 = O beschrieben wurde. (Der Einfachheit halber setzen wir jetzt die dort auftretende Konstante gleich 1; dies entspricht einer geschickten Wahl der Masseinheiten.) ~ ≡ 0. Es Wir haben bereits gesehen, dass das Coulombfeld quellenfrei ist; d.h. es gilt div E sei nun B ein Bereich, der P0 enthält, sein Rand sei ∂B. Der Fluss Φ von innen nach aussen durch ∂B lässt sich mit Hilfe des Divergenzsatzes berechnen. Zu diesem Zweck sparen wir aus B eine kleine Kugel K mit Mittelpunkt P0 aus (siehe Figur 4). Für den durchlöcherten Bereich ~ ist in ganz B̄ regulär. B̄ ist die Voraussetzung des Divergenzsatzes erfüllt: Das Vektorfeld E ~ ist in P0 nicht definiert!) Der Divergenzsatz (Man beachte, dass dies für B nicht der Fall ist: E ~ angewandt auf B̄ und E liefert nun ZZZ 0= B̄ ~ dV = div E ZZ ∂ B̄ ~ · ~n dO = E ZZ ∂B ~ · ~n dO + E ZZ ∂K ~ · ~n dO . E Dabei ist im zweiten Flussintegral die für B̄ äussere, also die für die Kugel K innere Normalenrichtung zu wählen. Das letztere Flussintegral wurde in Abschnitt 4 für die äussere Normalenrichtung bereits berechnet. Jenes Resultat liefert ZZ ∂K ~ · ~n dO = −4πe . E ~ durch die Oberfläche Wir erhalten damit die Aussage: Für den Fluss Φ des Coulombfeldes E ∂B eines Bereiches B gilt ZZ ∂B ( ~ · ~n dO = E +4πe falls e in B enthalten ist, 0 sonst . Wir betrachten nun endlich viele Punktladungen e1 , e2 , . . . , em in den Punkten P1 , P2 , . . . , Pm . ~ i , so folgt für das totale elektrische Feld E ~ Erzeugt ei das Coulombfeld E ~ =E ~1 + E ~2 + · · · + E ~m . E Ferner sei B ein beliebiger Bereich (siehe Figur 5). Wir erhalten dann für den Fluss des Vek~ aus B heraus torfeldes E 47 Kapitel VI. Vektoranalysis ∂B ∂K ~n e Fig. 4 : Der Fluss eines Coulombfeldes P0 ~n (z) (y) (x) ∂B B Fig. 5 : Der Fluss einer Summe von Coulombfeldern e2 e1 ~n (z) e3 (y) (x) 48 U. Stammbach: Analysis, Teil B ZZ ∂B ZZ ~1 + E ~2 + · · · + E ~ m ) · ~n dO = (E ∂B = 4π ~ 1 · ~n dO + E X ZZ ∂B ~ 2 · ~n dO + · · · + E ZZ ∂B ~ m · ~n dO E ei , wobei die Summe über diejenigen Ladungen zu erstrecken ist, die in B enthalten sind. Im Falle einer kontinuierlichen Ladungsverteilung gehen wir wie folgt vor. Es sei die Ladungsdichte gegeben durch das Skalarfeld ρ : (x, y, z) → ρ(x, y, z) . Dann folgt für das Flussintegral durch die Oberfläche ∂B des Bereiches B ZZ ∂B ~ · ~n dO = 4π E ZZZ B ρ dV , denn das rechts stehende Integral liefert gerade die in B enthaltene Ladung (entsprechend der Summe der Einzelladungen ei bei der diskreten Ladungsverteilung). Wenden wir nun den Divergenzsatz auf das links stehende Integral an, so folgt ZZZ B ~ − 4πρ) dV = 0 . (div E Da B beliebig gewählt werden kann, folgern wir aus dem Verschwinden des Integrals das Verschwinden des Integranden. Es gilt also ~ = 4πρ . div E Dies ist die Grundgleichung der Elektrostatik, eine der vier Maxwell’schen Gleichungen (J. C. Maxwell 1831 - 1879). Als triviale Folgerung erhalten wir, dass im ladungsfreien Raum (ρ ≡ 0) die elektrische Feldstärke quellenfrei ist. Hydrostatischer Auftrieb Gegeben sei ein Körper K, der vollständig in eine Flüssigkeit mit dem spezifischen Gewicht γ eingetaucht werde. Man weiss mit Archimedes (Heureka!), dass dann eine Auftriebskraft auf 49 Kapitel VI. Vektoranalysis den Körper wirkt. Hier wollen wir die Grösse dieser Kraft mit Hilfe des Satzes von Gauss aus dem Druckverlauf in der Flüssigkeit ermitteln. Wir nehmen an, dass der Flüssigkeitsspiegel horizontal sei. Bezeichnen wir mit p(z) den in der Tiefe z herrschenden Druck, so gilt natürlich p(z) = p0 + γz , wobei p0 der Druck an der Flüssigkeitsoberfläche ist (siehe Figur 6). Ist B der vom Körper K eingenommene Bereich, so bezeichne ~n den äusseren Normaleneinheitsvektor. Auf das differentielle Flächenstück dS von B wirkt dann die Kraft Fig. 6 : Zum hydrostatischen Auftrieb B ~ dA ~n (z) ~ = −(p0 + γz) ~n dO , dA ~ also und auf den ganzen Körper K somit die “Summe” aller dA, ~= A ZZ ∂B ~= − dA ZZ ∂B (p0 + γz) n1 dO, − ZZ ∂B (p0 + γz) n2 dO, − ZZ ∂B (p0 + γz) n3 , dO . Mit Hilfe des Divergenzsatzes lassen sich diese Oberflächenintegrale uminterpretieren. Zu diesem Zweck führen wir (Hilfs-)Vektorfelder ein, die erlauben, die Integrale als Flussintegrale aufzufassen. Wählen wir als erstes das Vektorfeld ~v = (p0 + γz, 0, 0), dann liefert der Divergenzsatz angewandt auf B 50 U. Stammbach: Analysis, Teil B ZZ ∂B (p0 + γz) n1 dO = ZZ ∂B ~v · ~n dO = ZZZ B div ~v dV = 0 . Tun wir dasselbe für das Vektorfeld ~v = (0, p0 + γz, 0) so erhalten wir ZZ ∂B (p0 + γz) n2 dO = ZZ ∂B ~v · ~n dO = ZZZ B div ~v dV = 0 . Wählen wir schliesslich ~v = (0, 0, p0 + γz), so folgt auf gleiche Weise ZZ ∂B (p0 + γz) n3 dO = ZZ ∂B ~v · ~n dO = ZZZ B div ~v dV = ZZZ γ dV = γ V , wo V das Volumen des Körpers K bezeichnet. Das Produkt γ V ist nichts anderes als das Gewicht der verdrängten Flüssigkeit. Es gilt für die Auftriebskraft ~ = (0, 0, −γ V ) , A und wir haben das wohlbekannte Archimedische Prinzip hergeleitet. 51 Kapitel VI. Vektoranalysis 7 Die Arbeit In Abschnitt 4 haben wir den Begriff des Flusses eines Vektorfeldes eingeführt. Hier nun geht es um einen weiteren mit einem Vektorfeld verbundenen Begriff, nämlich um die Arbeit eines Vektorfeldes. Wie so oft kommt auch hier der Name des mathematischen Begriffs aus einer speziellen Anwendung: Bei der Berechnung der Arbeit, die eine Kraft im physikalisch-mechanischen Sinn leistet, tritt diese mathematische Bildung auf. Gegeben sei ein reguläres d.h. stetig differenzierbares Vektorfeld ~v : (x, y, z) → ~v (x, y, z) und ein ganz im Definitionsbereich D(~v ) von ~v verlaufender Weg W mit Anfangspunkt P und Endpunkt Q. Unter einem Weg verstehen wir eine mit einem Durchlaufsinn versehene Kurve, die sich aus endlich vielen stetig differenzierbaren Kurvenstücken zusammensetzt. Um zum mathematischen Begriff Arbeit zu gelangen, fassen wir das Vektorfeld ~v als Kraftfeld auf und fragen nach der mechanischen Arbeit, die ~v leistet, wenn sich ein Punkt längs des Weges W von P nach Q bewegt. Fig. 1 : Die Arbeit; Spezialfall. ~v ω P l Q Im einfachen Spezialfall eines geradlinig verlaufenden Weges W von P nach Q und eines homogenen Vektorfeldes ~v , ist diese Arbeit gegeben durch (siehe Figur 1) 52 U. Stammbach: Analysis, Teil B A = |~v | l cos ω = ~v · P~Q . Dabei bezeichnet l die Länge von W und ω den Winkel zwischen den Vektoren ~v und P~Q. Q Fig. 2 : Die Arbeit; allgemeiner Fall. W (z) P (y) (x) Im allgemeinen Fall unterteilen wir den Weg in “kurze” Teilstücke. Diese können als geradlinig und das Vektorfeld in ihrem Bereich als homogen angesehen werden. Der Anteil dA an die Arbeit, der von einem solchen Teilstück d~r herrührt, ist offenbar gegeben durch dA = ~v · d~r . Die gesamte Arbeit auf dem Weg W von P bis Q ist dann die “Summe” all dieser Anteile, also das Integral (siehe Figur 2) A= Z W ~v · d~r . Im konkreten Fall ist der Weg W durch eine Parameterdarstellung gegeben, ~ , ~r(tQ ) = OQ, ~ . t → ~r(t) = (x(t), y(t), z(t)), ~r(tP ) = OP 53 Kapitel VI. Vektoranalysis Dann gilt ~v · d~r = ~v · ~r˙ (t) dt und damit A = = Z tQ tP Z tQ tP ~v (x(t), y(t), z(t)) · ~r˙ (t) dt (v1 (x(t), y(t), z(t)), v2 (x(t), y(t), z(t)), v3 (x(t), y(t), z(t))) · (ẋ(t), ẏ(t), ż(t)) dt . Der Wert dieses Wegintegrals ist definitionsgemäss die Arbeit, die das Vektorfeld ~v längs des Weges W leistet. Wie schon erwähnt, tritt die formale Bildung des Arbeitsintegrals auch in vielen Anwendungen auf, wo das Vektorfeld kein Kraftfeld ist; das Integral trägt dann oft einen anderen Namen. Im Falle eines Strömungsfeldes heisst es Zirkulation; im Fall des elektrischen Feldes beschreibt das Integral nichts anderes als die (elektrische) Spannung. Beispiel Es sei ~v das Gravitationsfeld eines Massenpunktes, der sich in O befindet, ~v (x, y, z) = −C ~r . |~r|3 Wir fragen nach der Arbeit A, die ~v längs eines Kreises K mit Mittelpunkt in O leistet. Ist W der durch den Kreis K gegebene Weg (der Durchlaufsinn spielt in diesem Beispiel keine Rolle), dann ist A= Z W ~v · d~r = 0 , denn ~v ist gegen den Ursprung O gerichtet und d~r verläuft senkrecht zu ~r, es ist also ~v · d~r = 0. Es sei ein Weg W mit Startpunkt P und Endpunkt Q gegeben. Wir bezeichnen mit −W den Weg mit dem umgekehrten Durchlaufsinn. Offensichtlich gilt dann Z −W ~v · d~r = Z W Z ~v · (−d~r) = − W ~v · d~r . Ist W1 ein Weg mit Anfangspunkt P und Endpunkt Q und W2 ein Weg mit Anfangspunkt Q und Endpunkt R, so lassen sich W1 und W2 zu einem Weg zusammensetzen, den wir mit W1 + W2 bezeichnen (siehe Figur 3). Es gilt dann Z W1 +W2 Beispiel ~v · d~r = Z W1 ~v · d~r + Z W2 ~v · d~r . Es sei das Vektorfeld des stromdurchflossenen Leiters gegeben, 54 U. Stammbach: Analysis, Teil B Q W1 Fig. 3 : Zusammensetzung von Wegen W2 P R ~v : (x, y, z) → ~v (x, y, z) = 2J y x − 2 , ,0 x + y 2 x2 + y 2 , und es sei W der durch t → (a cos t, a sin t, 0) , 0 ≤ t ≤ 2π beschriebene (geschlossene) Weg. Die Arbeit von ~v längs des Weges W berechnet sich dann durch A = = Z ~v · d~r W Z 2π 0 = 2J ~v (a cos t, a sin t, 0) · ~r˙ (t) dt Z 0 Z = 2J 2π 0 2π ! a sin t a cos t − 2 , 0 · (−a sin t, a cos t, 0) dt 2 , 2 2 a (cos t + sin t) a (cos2 t + sin2 t) 1 dt = 2J 2π . Wir werden später auf dieses interessante Beispiel zurückkommen. 55 Kapitel VI. Vektoranalysis Beispiel Es sei das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (2xy, x2 + y 2 , 0) gegeben. Gesucht ist die Arbeit, die ~v längs der im Gegenuhrzeigersinn durchlaufenen Ellipse E : t → ~r(t) = (a cos t, b sin t, 0) , 0 ≤ t ≤ 2π , leistet (siehe Figur 4). Es gilt (y) E b Fig. 4 : Arbeit des Vektorfeldes a (x) ~v (x, y, z) = (2xy, x2 + y 2 , 0) längs der Ellipse E A = Z ~v · d~r E 2π Z = 0 Z = 0 Z = 2π 2π 0 = 0. (2ab sin t cos t, a2 cos2 t + b2 sin2 t, 0) · (−a sin t, b cos t, 0) dt (−2a2 b sin2 t cos t + a2 b cos3 t + b3 sin2 t cos t) dt (−2a2 b + b3 ) sin2 t cos t dt + Z 0 2π a2 b cos3 t dt 56 8 U. Stammbach: Analysis, Teil B Der Satz von Stokes Der Satz von Stokes steht in einem gleichen Verhältnis zum Satz von Gauss wie die Arbeit eines Vektorfeldes zum Fluss eines Vektorfeldes, oder wie der Operator rot zum Operator div . Es sei v : (x, y, z) → ~v (x, y, z) ein reguläres, d.h. stetig differenzierbares Vektorfeld mit Definitionsbereich D(~v ). Ferner sei S ein ganz in D(~v ) enthaltenes orientiertes Flächenstück mit Rand ∂S. Orientiert heisst ein Flächenstück, wenn darauf einer der beiden Normaleneinheitsvektoren ~n ausgezeichnet ist, und zwar auf eine auf der ganzen Fläche konsistenten, d.h. stetigen Weise. (Man beachte, dass sich nicht jedes Flächenstück orientieren lässt: ein Möbiusband kann nicht orientiert werden!) Der Einfachheit halber und um der mathematischen Strenge Genüge zu tun, nehmen wir an, dass sich S und ∂S aus endlich vielen stetig differenzierbaren Flächenstücken bzw. Kurvenstücken zusammensetzt. Wir machen nun die geschlossene Randkurve ∂S zu einem Weg C, indem wir einen Durchlaufsinn wählen, der mit der Orientierung von S verträglich ist: Wir durchlaufen ∂S so, dass mit dem auf S ausgezeichneten Normalenvektor eine Rechtsschraube gebildet wird (siehe Figur 1). Dann gilt der Satz von Stokes (G. G. Stokes 1819-1903): Satz von Stokes Unter den obigen Voraussetzungen gilt Z C ~v · d~r = ZZ S rot ~v · ~n dO . Die Arbeit des Vektorfeldes ~v längs des Randweges C ist gleich dem Fluss von rot ~v in Richtung ~n durch die Fläche S. Beispiel Wir betrachten das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (2xy, x2 + y 2 , 0) . Es sei S die Ellipsenfläche x2 y 2 + 2 ≤1 a2 b in der (x, y)-Ebene, ~n der in Richtung der z-Achse zeigende Normaleneinheitsvektor. Der Rand ∂S ist dann die Ellipsenperipherie, die wir zu einem (geschlossenen) Weg C machen, indem wir ihn verträglich mit ~n, also im Gegenuhrzeigersinn durchlaufen. Nach dem Satz von Stokes gilt dann 57 Kapitel VI. Vektoranalysis ~n Fig. 1 : Zum Satz von Stokes S C (z) (y) (x) Z C ~v · d~r = ZZ S rot ~v · ~n dO = ZZ S (0, 0, 0) · (0, 0, 1) dO = 0 , in Übereinstimmung mit dem Resultat in Abschnitt 7, wo wir die Arbeit des Vektorfeldes ~v längs des Weges C direkt berechnet haben. Wir entnehmen diesem Beispiel, dass wir aus dem Satz von Stokes die nachstehende Folgerung ziehen können: Es sei ~v : (x, y, z) → ~v (x, y, z) ein reguläres Vektorfeld mit rot ~v = (0, 0, 0) und es sei C ein Weg, der den Rand eines ganz in D(~v ) liegenden orientierten Flächenstücks S bildet. Dann ist die Arbeit A des Vektorfeldes ~v längs C Null. Beispiel Es sei das offensichtlich überall reguläre Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (x2 − y 2 , −xy, 0) gegeben. Gesucht ist die Arbeit von ~v längs des geschlossenen Weges C in der (x, y)-Ebene, wobei C von P = (1, 0) längs der Geraden y = 1 − x nach Q = (0, 1) und von dort längs des 58 U. Stammbach: Analysis, Teil B (y) Fig. 2 : Arbeit längs des geschlossenen Weges C C S (x) Einheitskreises t → (cos t, sin t) zurück nach P verläuft (siehe Figur 2). Nach dem Satz von Stokes gilt Z C ~v · d~r = ZZ S rot ~v · ~n dO . p Dabei bezeichnen wir mit S das durch 0 ≤ y ≤ 1 und 1 − y ≤ x ≤ 1 − y 2 gegebene Flächenstück der (x, y)-Ebene. Der vorgeschriebene Durchlaufsinn der Randkurve beschreibt mit dem Einheitsvektor in der negativen z-Richtung eine Rechtsschraube; konsequenterweise ist ~n = (0, 0, −1). Mit rot ~v = (0, 0, y) erhalten wir ZZ Z Z √ S 1 rot ~v · ~n dO = − = − 0 Z 0 1 = − 2 = 1 dy 1−y 2 1−y y dx q dy y 1 − y 2 − y(1 − y) Z 0 1 q 2y 1 − y 2 dy − 1 2 (1 − y 2 )3/2 2 3 1 = − − 3 1 1 − 3 2 1 0 " − Z y3 0 1 (y 2 − y) dy y2 − 3 2 #1 0 59 Kapitel VI. Vektoranalysis = − Beispiel 1 . 6 Wir betrachten das Stück S der durch z = x2 − y 2 gegebenen Sattelfläche, das zu x2 + y 2 ≤ a2 gehört (siehe Figur 3). Die Randkurve C dieses Flächenstücks ist gegeben durch die Parameterdarstellung Fig. 3 : Sattelfläche S mit Randkurve C C t → (a cos t, a sin t, a2 (cos2 t − sin2 t)) , 0 ≤ t ≤ 2π . Ferner betrachten wir das Vektorfeld ~v : (x, y, z) → ~v (x, y, z) = (z, x, y) . Gesucht ist die Arbeit des Vektorfeldes ~v längs der Kurve C. Laut Satz von Stokes können wir diese Arbeit auf zwei verschiedene Arten berechnen, nämlich erstens als Arbeit längs des Weges 60 U. Stammbach: Analysis, Teil B C und zweitens als Fluss des Vektorfeldes rot ~v durch die Fläche S und zwar in der Richtung, mit welcher der Durchlaufsinn der Randkurve eine Rechtsschraube bildet. Die direkte Berechnung liefert Z C ~v · d~r = Z 0 Z = 0 Z = 0 2π (a2 (cos2 t − sin2 t), a cos t, a sin t) · (−a sin t, a cos t, a2 (−4 cos t sin t)) dt 2π 2π (−a3 cos2 t sin t + a3 sin2 t sin t + a2 cos2 t − 4a3 sin2 t cos t) dt (−2a3 cos2 t sin t + a3 sin t + a2 cos2 t − 4a3 sin2 t cos t) dt = πa2 , denn nur der zweitletzte Summand liefert einen von Null verschiedenen Beitrag. Wir wenden uns jetzt der Berechnung des Flusses zu und wählen als Parameterdarstellung des Flächenstücks S: (u, v) → ~r(u, v) = (u, v, u2 − v 2 ) , u2 + v 2 ≤ a2 . Wir erhalten dann ~ru (u, v) = (1, 0, 2u) , ~rv (u, v) = (0, 1, −2v) und damit den Normalenvektor ~ru (u, v) × ~rv (u, v) = (−2u, 2v, 1) . Dieser bildet mit dem gegebenen Durchlaufsinn der Randkurve C eine Rechtsschraube. Für die Rotation des Vektorfeldes erhalten wir rot ~v = (1, 1, 1) . Damit liefert die Flussberechnung ZZ Φ = = = Z ZS Z ZB B rot ~v · ~n dO (1, 1, 1) · (−2u, 2v, 1) du dv (−2u + 2v + 1) du dv , 61 Kapitel VI. Vektoranalysis wobei B der durch u2 + v 2 ≤ a2 gegebene Kreis in der (u, v)-Ebene ist. Für dieses B liefert aus Symmetriegründen nur der letzte der drei Summanden einen Beitrag. Damit gilt Φ = πa2 . Wir beweisen in dieser Vorlesung den Satz von Stokes natürlich nicht. Immerhin wollen wir in einem Spezialfall plausibel machen, weshalb der Satz von Stokes richtig ist. Zu diesem Zweck betrachten wir den Fall, wo S ein achsenparalleles Rechteck ist, welches durch a≤x≤b, c≤y≤d, z=e ~n y=d x=a S x=b Fig. 4 : Spezialfall des Satzes von Stokes y=c (z) (y) (x) gegeben ist (siehe Figur 4). Wir durchlaufen dieses Rechteck im Gegenuhrzeigersinn und nennen den entsprechenden Weg C. Es muss dann auf S der Normaleneinheitsvektor ~n = (0, 0, 1) gewählt werden. Nun gilt mit rot ~v = ∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1 − , − , − ∂y ∂z ∂z ∂x ∂x ∂y 62 U. Stammbach: Analysis, Teil B für die Berechnung des Flusses von rot ~v durch S in Richtung ~n ZZ ZZ ∂v2 ∂v1 rot ~v · ~n dO = dx dy − ∂x ∂y S S Z d Z b Z b Z d ∂v2 ∂v1 = dy dx dx dy − ∂x ∂y c a a c Z = c Z = = d d Zc C (v2 (b, y, e) − v2 (a, y, e)) dy − v2 (b, y, e) dy + Z a b Z b a (v1 (x, d, e) − v1 (x, c, e)) dx v1 (x, d, e) dx + Z c d v2 (a, y, e) dy + Z b a v1 (x, c, e) dx ~v · d~r , so dass in diesem Fall der Satz von Stokes verifiziert ist. Auf ähnliche Weise wie der Divergenzsatz eine koordinatenfreie Definition von div liefert, so liefert der Satz von Stokes eine koordinatenfreie Definition der Rotation und damit eine anschauliche Bedeutung für rot ~v . Wir bemerken zuerst, dass rot ~v mit Hilfe eines festgewählten Koordinatensystems definiert ist, rot ~v (x, y, z) = ∂v3 ∂v2 ∂v1 ∂v3 ∂v2 ∂v1 − , − , − ∂y ∂z ∂z ∂x ∂x ∂y . Es ist von vornherein nicht klar, dass sich der Vektor rot ~v nicht ändert, wenn ein anderes kartesisches Koordinatensystem gewählt wird und in diesem auf formal dieselbe Art ein Vektor gebildet wird. Der Satz von Stokes erlaubt nun, eine koordinatenfreie Definition anzugeben und auf diese Art zu zeigen, dass das Vektorfeld rot ~v : (x, y, z) → rot ~v (x, y, z) unabhängig vom gewählten kartesischen Koordinatensystem ist. Ausserdem liefert dieselbe Überlegung auch eine anschauliche Bedeutung für rot ~v (x0 , y0 , z0 ). Es sei ein Vektorfeld ~v gegeben und P0 = (x0 , y0 , z0 ) ein Punkt in seinem Definitionsbereich D(~v ). Ferner sei ~n ein beliebiger Einheitsvektor. Mit Sr bezeichnen wir die auf ~n senkrecht stehende Kreisscheibe mit Radius r und Mittelpunkt P0 . Schliesslich sei Cr der Sr berandende Weg, der mit ~n eine Rechtsschraube bildet (siehe Figur 5). Der Satz von Stokes liefert in dieser Situation Z Cr ~v · d~r = ZZ Sr rot ~v · ~n dO . Nach dem Mittelwertsatz für Flächenintegrale gibt es auf Sr einen Punkt Pr = (xr , yr , zr ) mit Kapitel VI. Vektoranalysis 63 v n Fig. 5 : Arbeit längs eines (kleinen) Kreises Sr P0 = (x0 , y0 , z0 ) Cr Sr rot v · n dO = πr 2 rot v (xr , yr , zr ) · n . Für r → 0 erhalten wir wegen der Stetigkeit des Feldes rot v somit 1 r→0 πr 2 n · rot v (x0 , y0 , z0 ) = lim 1 r→0 πr 2 rot v · n dO = lim Sr Cr v · dr . Nun gilt bekanntlich für das Skalarprodukt das Folgende: n · rot v (x0 , y0 , z0 ) nimmt den maximalen Wert genau dann an, wenn der Vektor n parallel zum Vektor rot v (x0 , y0 , z0 ) ist. Dieser maximale Wert ist |rot v (x0 , y0 , z0 )|. Wir haben damit den Vektor rot v (x0 , y0 , z0 ) in Richtung und Länge beschreiben können: Der Vektor n zeigt genau dann in Richtung rot v (x0 , y0 , z0 ), wenn 1 r→0 πr 2 lim Cr v · dr den maximalen Wert annimmt. Dieser Wert ist gleich |rot v (x0 , y0 , z0 )|. Für die Anschauung entnehmen wir dieser Überlegung, dass rot v (x0 , y0 , z0 ) Richtung und 64 U. Stammbach: Analysis, Teil B Stärke der “Wirbelung” des Vektorfeldes ~v im Punkte (x0 , y0 , z0 ) angibt. Wählen wir eine zu rot ~v (x0 , y0 , z0 ) senkrecht stehende Kreisscheibe Sr mit Radius r, Mittelpunkt (x0 , y0 , z0 ) und Rand Cr , so gibt die Länge von rot ~v (x0 , y0 , z0 ) die Arbeit des Vektorfeldes ~v längs Cr pro Flächeneinheit von Sr an. Anschaulich heisst dies, dass das Vektorfeld ~v in (x0 , y0 , z0 ) einen Wirbel aufweist, der senkrecht zu rot ~v (x0 , y0 , z0 ) verläuft. Aus diesem Grund heisst rot ~v auch etwa die Wirbelstärke von ~v . Gilt für ein Vektorfeld rot ~v (x, y, z) ≡ (0, 0, 0), so heisst dieses wirbelfrei. Zum Schluss merken wir noch an, dass gemäss den Resultaten des Abschnittes 2 jedes Gradientenfeld wirbelfrei ist; insbesondere ist auch das Coulombfeld wirbelfrei. 65 Kapitel VI. Vektoranalysis 9 Eine Anwendung des Satzes von Stokes Wie die Anwendungen des Divergenzsatzes so sind auch die Anwendungen des Satzes von Stokes sehr zahlreich. Zur Illustration stellen wir hier ein Beispiel aus der Elektrodynamik dar. Wir betrachten ein (instationäres) Magnetfeld ~ : (x, y, z, t) → H(x, ~ H y, z, t) . Im Definitionsbereich dieses Magnetfeldes sei eine geschlossene Kurve C gegeben; diese betrachten wir als Weg, indem wir C mit einem Durchlaufsinn versehen. Konkret können wir uns C als Draht vorstellen, an dem wir die elektrische Spannung messen werden, und zwar in der durch den Durchlaufsinn gegebenen Richtung. Ferner sei S irgend eine Fläche mit Rand ∂S = C. Schliesslich zeichnen wir auf S denjenigen Normaleneinheitsvektor aus, der mit dem Durchlaufsinn auf C eine Rechtsschraube bildet (siehe Figur 1). Wir bezeichnen nun mit Z den ~ durch S in Richtung ~n, Fluss von H Z= ZZ S ~ · ~n dO . H Das physikalische Experiment zeigt dann Folgendes: Falls Z zeitlich variiert, so fliesst in C ein elektrischer Strom, und zwar besagt das von Faraday (M. Faraday 1791 - 1867) stammende Erfahrungsgesetz, dass für die induzierte Spannung die Gleichung Vind = −µ0 dZ dt gilt, d.h. die induzierte Spannung ist proportional zur Änderung des Flusses Z. Setzt man die Definition von Z ein, so erhält man Vind dZ d = −µ0 = −µ0 dt dt ZZ S ~ · ~n dO = −µ0 H ZZ S ~ t · ~n dO . H ~ in Verbindung und wenden auf Wir bringen nun die Spannung Vind mit dem elektrischen Feld E das entsprechende (Arbeits-)Integral den Satz von Stokes an: Vind = Z C ~ · d~r = E ZZ S ~ · ~n dO . rot E Da diese Beziehung für sämtliche mögliche Flächen S gelten muss, können wir wie früher vom Verschwinden des Integrals auf das Verschwinden des Integranden schliessen. Es gilt somit 66 U. Stammbach: Analysis, Teil B ~n S Fig. 1 : Zum Gesetz von Faraday C ~ H ~ t = ~0 . ~ + µ0 H rot E Dies ist eine weitere der berühmten vier Maxwell’schen Gleichungen, welche die Grundlage der Elektrodynamik bilden. Kapitel VI. Vektoranalysis 10 67 Potentialfelder Konservative Vektorfelder treten in Anwendungen häufig auf; sie werden, wie in diesem Abschnitt gezeigt wird, durch Potentialfelder (Gradientenfelder) beschrieben. Ein Vektorfeld v : (x, y, z) → v (x, y, z) heisst konservativ, wenn für alle P, Q ∈ D(v ) gilt, dass die Arbeit von v längs allen Wegen von P nach Q gleich gross ist. In einem konservativen Vektorfeld hängt also die Arbeit nicht vom Weg, sondern nur von dessen Anfangs- und Endpunkt ab. Insbesondere ist die Arbeit, welche ein konservatives Vektorfeld längs eines geschlossenen Weges leistet, immer Null. Diese Eigenschaft charakterisiert konservative Vektorfelder sogar, wie der folgende Satz besagt. Satz 1 Ein Vektorfeld v ist genau dann konservativ, wenn für alle geschlossenen Wege W die Arbeit von v längs W verschwindet. Q −W2 Fig. 1 : Geschlossene Wege und konservative Vektorfelder W1 W2 P Beweis Es ist zu zeigen, dass für beliebige zwei Punkte P und Q und zwei beliebige Wege W1 68 U. Stammbach: Analysis, Teil B und W2 von P nach Q gilt (siehe Figur 1): Z W1 ~v · d~r = Z W2 ~v · d~r . Nun ist aber der Weg W1 + (−W2 ) ein geschlossener von P ausgehender und nach P zurückkehrender Weg. Deshalb gilt Z 0= W1 +(−W2 ) ~v · d~r = Z W1 ~v · d~r + Z −(W2 ) ~v · d~r = Z W1 ~v · d~r − Z W2 ~v · d~r , woraus sich die Behauptung unmittelbar ergibt. Zusammenhang mit grad Wir betrachten hier ein Vektorfeld ~v : (x, y, z) → ~v (x, y, z), welches sich als Gradientenfeld schreiben lässt, d.h. es gibt eine Funktion f : (x, y, z) → f (x, y, z) mit ~v = grad f . Die Funktion f heisst in diesem Zusammenhang oft Potential und das Vektorfeld ~v ein Potentialfeld. Wir behaupten als erstes, dass ein solches Feld automatisch konservativ ist. Um dies einzusehen, betrachten wir einen von P nach Q führenden Weg W . Dieser werde durch die ~ = (xP , yP , zP ) und ~r(tQ ) = OQ ~ = (xQ , yQ , zQ ) Parameterdarstellung t → ~r(t) mit ~r(tP ) = OP beschrieben. Die Arbeit von ~v längs W ist dann gegeben durch Z W ~v · d~r = = = = Z grad f · d~r W Z tQ tP Z tQ tP Z tQ tP (fx , fy , fz ) · ~r˙ (t) dt (fx ẋ(t) + fy ẏ(t) + fz ż(t)) dt d f (x(t), y(t), z(t)) dt dt t = [f (x(t), y(t), z(t))] tQ P = f (xQ , yQ , zQ ) − f (xP , yP , zP ) . Also ist die Arbeit nur von Anfangs- und Endpunkt des Weges (und nicht vom Verlauf des Weges selbst) abhängig. Folglich ist das Vektorfeld ~v konservativ. Von dieser Tatsache gilt nun auch die Umkehrung, so dass wir den folgenden Satz aussprechen können. 69 Kapitel VI. Vektoranalysis Satz 2 Genau dann ist das Vektorfeld ~v konservativ, wenn es ein Potentialfeld ist, d.h. wenn es eine Skalarfunktion f gibt mit ~v = grad f . Beweis Wir haben bereits gesehen, dass ein Potentialfeld konservativ ist. Wir müssen also nur noch die Umkehrung zeigen. Es sei also ~v ein konservatives Vektorfeld. Wir suchen eine Funktion f mit ~v = grad f . Dazu wählen wir als erstes einen festen Punkt P0 in D(~v ). Um den Funktionswert f (x, y, z) zu definieren, wählen wir einen von P0 nach Q = (x, y, z) führenden Weg W und setzen f (x, y, z) = Z W ~v · d~r . Da ~v konservativ ist, hängt der Wert des Integrals nur von Q ab und nicht von der Wahl des Weges W . Um ~v = grad f zu zeigen, betrachten wir einen von Q = (x, y, z) nach Q0 = (x+h, y, z) führenden Weg L (siehe Figur 2) und beschreiben ihn durch die Parameterdarstellung t → (t, y, z) , x ≤ t ≤ x + h . Q0 = (x + h, y, z) (z) Q = (x, y, z) (y) (x) L Fig. 2 : Der Weg L 70 U. Stammbach: Analysis, Teil B Dann gilt f (x + h, y, z) − f (x, y, z) h Z 1 = lim ~v · d~r h→0 h L Z 1 x+h = lim v1 (t, y, z) dt . h→0 h x fx (x, y, z) = lim h→0 Nach dem Mittelwertsatz der Integralrechnung gibt es nun ein t∗ zwischen x und x + h mit Z x+h x v1 (t, y, z) dt = h · v1 (t∗ , y, z) . Daraus ergibt sich fx (x, y, z) = lim v1 (t∗ , y, z) = v1 (x, y, z) . h→0 Analog zeigt man fy = v2 und fz = v3 . Damit ist der Satz 2 bewiesen. Wir entnehmen unseren Überlegungen die folgende wichtige Tatsache, die die Berechnung der Arbeit eines Potentialfeldes sehr einfach macht: Ist ~v ein Gradientenfeld, ~v = grad f , so ist die Arbeit des Vektorfeldes ~v längs eines von P nach Q führenden Weges gerade gleich der Potentialdifferenz f (xQ , yQ , zQ ) − f (xP , yP , zP ). Wir merken zu diesem Thema noch Folgendes an: Das Potential f eines Potentialfeldes ~v ist bis auf eine additive Konstante eindeutig bestimmt. Einerseits ist mit f auch g = f + C ein Potential von ~v , denn grad f = grad g. Andererseits folgt aus grad f = grad h, dass die partiellen Ableitungen der Differenz f − h alle verschwinden, d.h. dass f − h eine Konstante ist. Schliesslich fügen wir an, dass die Niveauflächen der Potentialfunktion f in Anwendungen häufig Potentialflächen genannt werden; laut Definition sind dies Flächen, zu denen das Vektorfeld grad f senkrecht verläuft. Zusammenhang mit rot Es sei ~v ein Potentialfeld mit Potential f , ~v = grad f . Dann gilt nach den Resultaten in Abschnitt 2 rot ~v = rot grad f = (0, 0, 0). Es gilt also der Satz Satz 3 Ist ~v ein Potentialfeld, so ist ~v wirbelfrei, d.h. es gilt rot ~v = (0, 0, 0). Dieser Satz besagt auch: Ist rot ~v 6= (0, 0, 0), so ist ~v kein Potentialfeld. 71 Kapitel VI. Vektoranalysis Wir stellen uns auch hier die Frage, ob die Umkehrung von Satz 3 gilt. Dafür haben wir bereits etwas Vorarbeit geleistet: Vom Vektorfeld ~v des stromdurchflossenen Leiters haben wir einerseits gezeigt, dass es wirbelfrei ist (Abschnitt 2). Andererseits haben wir in Abschnitt 7 die Arbeit von ~v längs eines speziellen geschlossenen Weges berechnet und einen von Null verschiedenen Wert erhalten. Die Aussage unseres Satzes lässt sich also nicht ohne weiteres umkehren; es muss eine Zusatzvoraussetzung hinzutreten. Satz 4 Es sei ~v ein Vektorfeld mit rot ~v ≡ (0, 0, 0), dessen Definitionsbereich D(~v ) einfach zusammenhängend ist. Dann ist ~v ein Potentialfeld. Wir wollen zuerst die hier neu hinzukommende Voraussetzung erklären. Ein Bereich D, unabhängig davon, was seine Dimension ist, heisst einfach zusammenhängend, wenn sich jeder geschlossene Weg W in D stetig auf einen Punkt zusammenziehen lässt. Man sieht sehr rasch an Beispielen, was dieser Begriff intuitiv beschreibt. Beispiele Die ganze Ebene ist einfach zusammenhängend. Die Ebene, aus der man einen Punkt P entfernt hat, ist nicht einfach zusammenhängend, denn eine geschlossene Kurve, die um P herumführt, lässt sich nicht auf einen Punkt zusammenziehen. Der ganze Raum ist einfach zusammenhängend. Der ganze Raum, aus dem man einen Punkt entfernt hat, ist einfach zusammenhängend. Beim Zusammenziehen einer geschlossenen Kurve lässt sich dieser eine Punkt immer vermeiden. Der ganze Raum, aus dem man eine Gerade entfernt hat, ist nicht einfach zusammenhängend, denn eine geschlossene Kurve, die um diese Gerade herumführt, lässt sich nicht auf einen Punkt zusammenziehen. Dieses letzte Beispiel zeigt, dass der Definitionsbereich des Vektorfeldes des stromdurchflossenen Leiters nicht einfach zusammenhängend ist: in den Punkten des Leiters ist dieses Vektorfeld nämlich nicht definiert. Beweis Wir zeigen, dass für jeden geschlossenen Weg W in D(~v ), die Arbeit von ~v längs W verschwindet. Da D(~v ) einfach zusammenhängend ist, lässt sich unser Weg W auf einen Punkt zusammenziehen. Dabei überstreicht der Weg ein Flächenstück S, auf das wir jetzt den Satz von Stokes anwenden. Es ergibt sich Z W ~v d~r = ZZ S rot ~v · ~n dO = 0 . Da dies für alle geschlossenen Wege gilt, folgt, dass ~v konservativ und deshalb ein Potentialfeld ist. Beispiel Ist ~v ein Coulombfeld, ~v = −C ~r , r3 72 U. Stammbach: Analysis, Teil B so ist rot ~v = (0, 0, 0) und der Definitionsbereich D(~v ) einfach zusammenhängend. Nach Satz 4 ist v = grad f , wobei f das durch f (x, y, z) = p also ~v ein Potentialfeld. In der Tat ist ~ 2 2 2 C/ x + y + z gegebene Potential ist. Wir wollen zum Schluss dieses Abschnittes noch auf eine Beziehung zu den sogenannten Integrabilitätsbedingungen (Kapitel IV, Abschnitt 7) hinweisen. Diese Integrabilitätsbedingungen sind bei der Frage aufgetaucht, wann es zu gegebenen Funktionen ϕ : (x, y, z) → ϕ(x, y, z) , ψ : (x, y, z) → ψ(x, y, z) , χ : (x, y, z) → χ(x, y, z) eine Funktion f : (x, y, z) → f (x, y, z) gibt mit fx ≡ ϕ , fy ≡ ψ , fz ≡ χ . Diese Frage lässt sich offenbar auch so formulieren: Es sei das Vektorfeld ~v = (ϕ, ψ, χ) gegeben. Wann gibt es eine (Potential-)Funktion f mit grad f = ~v = (ϕ, ψ, χ)? Auf diese Formulierung können wir jetzt unseren Satz 3 anwenden: Ist der (gemeinsame) Definitionsbereich D von ϕ, ψ, χ einfach zusammenhängend und ist ~v wirbelfrei, so exisiert die Funktion f . Nun gilt rot ~v = (χy − ψz , ϕz − χx , ψx − ϕy ) . Soll also ~v wirbelfrei sein, so ergeben sich die Bedingungen χy ≡ ψz , ϕz ≡ χx , ψx ≡ ϕy . Dies sind gerade die damals besprochenen Integrabilitätsbedingungen. Teil C Kapitel VII. Gewöhnliche Differentialgleichungen Kapitel VIII. Potenzreihen Anhang. Komplexe Zahlen Die Zeiten sind vorbei, wo die relative Stabilität der Lebensform, die Langsamkeit der Verwandlung es möglich machten, mit dem so viel gerühmten gutgefüllten “Schulsack” die Zeit der Ausbildung hinter sich zu lassen. Die Zeit ist vorüber, wo in den vielen Berufen das einmal Erlernte ein Leben lang genügte und wo sich leicht das wenige Neue im Laufe der Jahre eingliederte. Adolf Portmann Inhaltsverzeichnis, Teil C Kapitel VII. Gewöhnliche Differentialgleichungen 1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . . 17 4 Separierbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6 Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . . 48 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . . 57 8 Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . . 64 9 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . 72 10 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . . 83 11 Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 12 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107 14 Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Kapitel VIII. Potenzreihen 1 Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . 3 2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Anhang. Komplexe Zahlen 1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Sachverzeichnis Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel VII. Gewöhnliche Differentialgleichungen Something big is coming up! James Bond 007 (zitiert in H. Heuser: Gewöhnliche Differentialgleichungen, Teubner Verlag) Inhaltsverzeichnis 1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Einige Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 (a) Ungestörtes Wachstum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 (b) Abklingvorgänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 (c) Einschalten eines elektrischen Stromes . . . . . . . . . . . . . . . . . . . . 11 (d) Freier Fall mit Reibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung . . . . . . . . . . . 17 4 Separierbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6 Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien . . . . . . . 48 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen . . . . . . 57 8 Differentialgleichungen höherer Ordnung, allgemeines . . . . . . . . . . . . . . . . 64 9 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . 72 (a) Homogene lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . 72 (b) Inhomogene lineare Differentialgleichungen . . . . . . . . . . . . . . . . . 76 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen . . . . . . . . . 83 (a) Homogene lineare Differentialgleichungen mit konstanten Koeffizienten . . 83 (b) Homogene Eulersche Differentialgleichungen . . . . . . . . . . . . . . . . . 86 11 Schwingungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 12 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 102 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten . . 107 14 Stabilitätsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 10 3 Kapitel VII. Differentialgleichungen 1 Einleitung Der Zustand eines physikalischen (chemischen etc.) Systems wird durch eine Anzahl von Zustandsgrössen beschrieben (Druck, Lage, Geschwindigkeit, Stromstärke etc.), seine zeitliche Entwicklung durch entsprechende Funktionen der Zeit. Zwischen diesen Zustandsgrössen gibt es i.a. Beziehungen. Zum Beispiel sind Druck, Volumen und Temperatur einer festen Menge Gases durch die Zustandsgleichung des Gases miteinander verbunden. Die wissenschaftliche Erfahrung zeigt nun, dass es oft leichter ist, die zeitliche Änderung einer Zustandsgrösse, das heisst also deren Ableitung nach der Zeit durch die übrigen Grössen und deren zeitlichen Ableitungen zu beschreiben, als diese Zustandsgrössen selbst. Ein konkretes Beispiel zu diesem Sachverhalt liefert das Newton’sche Gesetz (siehe Figur 1). Zwar sind für einen Massenpunkt der Ort x(t), und die Geschwindigkeit v(t) zur Zeit t nicht auf einfache Weise mit den relevanten weiteren Zustandsgrössen ‘Kraft’, ‘Masse’ verbunden. Wohl aber ist bekanntlich die Beschleunigung, Fig. 1 : Zum Newton’schen Gesetz K 0 m (x) d.h. die zeitliche Ableitung v̇(t) der Geschwindigkeit, bzw. die zweite zeitliche Ableitung ẍ(t) des Ortes eine einfache Funktion der auf den Massenpunkt wirkenden Kraft. Dieser Sachverhalt wird nach Newton durch die Differentialgleichung 4 (1.1) U. Stammbach: Analysis, Teil C mẍ = K oder durch das Differentialgleichungssystem (1.2) ẋ = v mv̇ = K beschrieben. Mathematisch ist an dieser Stelle wichtig, dass die Differentialgleichung (2.1) bzw. das Differentialgleichungssystem (2.2) die Funktion t → x(t) im wesentlichen beschreibt. In der Tat haben wir bereits in der Analysis I oft darauf hingewiesen, dass Funktionen durch Differentialgleichungen beschrieben werden können. Im Kapitel II, Abschnitt 5 haben wir zum Beispiel die einfache Differentialgleichung (1.3) y 0 = ay, a ∈ R untersucht und gefragt, welche Funktionen y : x → y(x) Lösungen dieser Differentialgleichung sind. Wir haben damals gesehen, dass notwendigerweise (1.4) y(x) = C · eax gelten muss, wobei C eine beliebige Konstante ist. Die Differentialgleichung (2.3) beschreibt also nicht nur eine Funktion sondern eine ganze Klasse oder – wie man sagt – eine ganze Schar von Funktionen, die durch die Formel (2.4) mit C als Scharparameter gegeben wird. Diese Schar heisst die allgemeine Lösung der Differentialgleichung. Auf ähnliche Art liefert die Differentialgleichung (2.1) nicht nur eine mögliche Lösung für die Funktion t → x(t), sondern sie beschreibt sämtliche Bewegungen des Massenpunktes, die unter den betrachteten physikalischen Bedingungen überhaupt möglich sind. Offensichtlich unterscheiden sich die verschiedenen Lösungen dadurch, dass sie zu verschiedenen Anfangsbedingungen x(0), ẋ(0) gehören. Auch die Differentialgleichung (2.1) beschreibt somit eine ganze Schar von Funktionen, wobei hier offenbar zwei Scharparameter auftreten. 5 Kapitel VII. Differentialgleichungen Das Thema des vorliegenden Kapitels ist es, den Zusammenhang zwischen einer Differentialgleichung und ihrer allgemeinen Lösung näher zu untersuchen. In konkreten Anwendungsbeispielen interessiert bei Differentialgleichungen zumeist eine spezielle Lösung, nämlich diejenige, die zusätzlich gegebene (Anfangs-)Bedingungen erfüllt. Im Falle der Differentialgleichung (2.3) kann diese zusätzliche Bedingung darin bestehen, dass der Funktionswert y(0) festgelegt ist: (1.5) y(0) = A . Damit ist die Lösungsfunktion der Differentialgleichung (2.3) eindeutig bestimmt; es gilt (1.6) y(x) = A · eax . Wie wir oben gesehen haben, wird im Falle der Differentialgleichung (2.1) die zusätzliche Bedingung am natürlichsten in der Angabe von Ort und Geschwindigkeit des Massenpunktes zur Zeit 0 bestehen: (1.7) x(0) = x0 ; ẋ(0) = v(0) = v0 . Die physikalische Anschauung zeigt, dass durch die Vorgabe der Grössen x0 und v0 die Funktion t → x(t) eindeutig bestimmt sein muss. Wir merken hier bereits an, dass die Grössen A in (2.5) und die Grössen x0 , v0 in (2.7) offenbar beliebige reelle Zahlen sein dürfen. Dies illustriert einen ganz allgemeinen mathematischen Satz über die Lösungen von Differentialgleichungen (siehe Abschnitt 3). Als nächstes wollen wir hier die Terminologie genau festlegen. Unter einer gewöhnlichen Differentialgleichung für die Funktion y : x → y(x) verstehen wir einen Ausdruck der Form (1.8) F (x, y, y 0 , y 00 , . . . , y (n) ) = 0 . 6 U. Stammbach: Analysis, Teil C Die Funktion y : x → y(x) heisst Lösung der Differentialgleichung (2.8), wenn für alle x ∈ D(y) gilt F x, y(x), y 0 (x), . . . , y (n) (x) ≡ 0, d.h. wenn beim Einsetzen die Gleichung identisch in x erfüllt ist. Die Ordnung der höchsten in (2.8) vorkommenden Ableitung heisst Ordnung der Differentialgleichung. Beispiel (1.9) Ist ω eine fest vorgegebene reelle Zahl, so ist y 00 + ω 2 y = 0 eine Differentialgleichung zweiter Ordnung. Die Funktion x → A cos(ωx) + B sin(ωx) ist für jede Wahl der reellen Grössen A, B eine Lösung der Differentialgleichung (2.9). Wir merken abschliessend noch an, dass wir hier nur sogenannte gewöhnliche Differentialgleichungen betrachten. Diese unglückliche, aber üblich gewordene Ausdrucksweise besagt, dass nur von Funktionen einer einzigen Variablen die Rede ist. Es sind daneben natürlich auch Differentialgleichungen für Funktionen von mehreren Variablen denkbar, welche partielle Ableitungen enthalten. Solche Differentialgleichungen heissen partiell. Ein Beispiel dafür ist die früher schon betrachtete Wellengleichung. Dabei werden Funktionen u : (x, t) → u(x, t) gesucht, welche die (partielle) Differentialgleichung utt = c2 uxx erfüllen (siehe Kapitel IV, Abschnitt 8). Mit solchen partiellen Differentialgleichungen, deren mathematische Behandlung sehr viel schwieriger ist als die der gewöhnlichen Differentialgleichungen, beschäftigt sich die Lehrveranstaltung Analysis III. 7 Kapitel VII. Differentialgleichungen 2 Einige Beispiele Wir wollen in diesem Abschnitt in einigen konkreten Situationen die dazugehörigen Differentialgleichungen herleiten und versuchen, bereits an dieser Stelle etwas über deren Lösung auszusagen. (a) Ungestörtes Wachstum Man stelle sich eine Bakterienkultur oder ganz allgemein eine Population vor, welche im gleichen Zeitraum stets um den gleichen Prozentsatz wächst; man nennt dies ungestörtes, ideales Wachstum. Im Zeitintervall 4t nimmt die Masse m(t) (als Mass der Grösse der Population) um 4m = p(4t) · m zu. Daraus folgt 4m p(4t) = m 4t 4t und durch Grenzübergang für 4t → 0 erhält man (2.1) dm = a·m , dt wobei wir a = p(4t) 4 t→0 4t lim 8 U. Stammbach: Analysis, Teil C gesetzt haben. Da die Population mit der Zeit zunimmt, ist a eine positive Zahl. Wie bereits in der Einleitung erwähnt, wissen wir aus der Analysis I, dass jede Funktion m : t → m(t), welche die Differentialgleichung (3.1) erfüllt, von der Form m(t) = C · eat (2.2) ist. In diesem Beispiel ist die natürliche Anfangsbedingung die, dass die Anfangsmasse m0 , m(0) = m0 , gegeben ist. Die gesuchte Funktion ist somit (siehe Figur 1) m(t) = m0 eat . (2.3) (y) Fig. 1 : Ungestörtes Wachstum m0 eax x → y(x) = m0 eax m0 (x) 9 Kapitel VII. Differentialgleichungen Andere Beispiele, die durch dieses Modell, d.h. durch die Differentialgleichung (3.1) mit a > 0 beschrieben werden, sind: Wirtschaftswachstum, Zunahme des Energieverbrauches, Geldanlage, jeweils mit konstantem Prozent- bzw. Zins-Satz. (b) Abklingvorgänge In diesem Beispiel sei y(t) eine Grösse, welche im gleichen Zeitraum stets um denselben Prozentsatz abnimmt. Man erhält dann mit der analogen Überlegung wie unter (a) offenbar (2.4) dy = −ky dt mit k > 0. Der Proportionalitätsfaktor −k ist negativ. Wie oben gilt (2.5) y(t) = C · e−kt . Lautet die Anfangsbedingung y(t0 ) = y0 , (zur Zeit t0 sei die Grösse y gerade y0 ), so erhält man als Lösung (siehe Figur 2) (2.6) y(t) = y0 · e−k(t−t0 ) . Dieses Modell beschreibt zum Beispiel die Abkühlung eines Gegenstandes in einem Wärmereservoir von konstanter Temperatur. Die Grösse y(t) ist in diesem Fall die Temperaturdifferenz zwischen Gegenstand und Wärmereservoir. Ebenso tritt die Differentialgleichung (3.4) beim radioaktiven Zerfall auf. In diesem Fall ist die Grösse y(t) die zur Zeit t vorhandene aktive Masse. In diesem letzten Beispiel, aber häufig auch in den anderen spricht man von der Halbwertszeit; dies ist die Zeit τ , in der die Grösse y auf die Hälfte abnimmt (siehe Figur 3). Es gilt also 10 U. Stammbach: Analysis, Teil C (y) Fig. 2 : Abklingvorgang t → y(t) = y0 e−k(t−t0 ) (t0 , y0 ) t0 (t) (y) y0 Fig. 3 : Halbwertszeit 1 2 y0 τ 11 Kapitel VII. Differentialgleichungen y(τ ) = (2.7) 1 y(0) . 2 Da laut Voraussetzung die Grösse y(t) im selben Zeitraum immer um denselben Prozentsatz abnimmt, muss τ von der Lage des (Zeit-)Nullpunktes unabhängig sein. Einsetzen von (3.7) liefert 1 y0 = y0 e−kτ , 2 woraus man erhält τ = (c) log 2 . k Einschalten eines elektrischen Stromes Es sei ein Schaltkreis mit einem Ohm’schen Widerstand R und einer Selbstinduktion L gegeben. Gesucht ist die Stromstärke I(t) zur Zeit t, wenn zur Zeit t = 0 an den Schaltkreis eine konstante Spannung U angelegt wird (siehe Figur 4). Die Physik sagt, dass die Funktionen I : t → I(t) der Differentialgleichung (2.8) L dI = −R I + U dt genügt. Setzen wir f (t) = I(t) − U/R, so folgt aus (3.8) (2.9) df R = − f . dt L Wir sehen, dass f einer Differentialgleichung genügt, die der Differentialgleichung (3.4) entspricht. Danach erhalten wir (2.10) I(t) − U/R = f (t) = C · e−(R/L) t . 12 U. Stammbach: Analysis, Teil C R Fig. 4 : Einschaltvorgang in einem elektrischen Schaltkreis L U (t) Fig. 5 : Einschaltvorgang; verschiedene Anfangsbedingungen I(t) U/R t→ (t) R U + Ce− L t R 13 Kapitel VII. Differentialgleichungen U/R Fig. 6 : Einschaltvorgang; verschiedene Werte des Parameters L t→ I(t) R U 1 − e− L t R (t) Setzt man die Anfangsbedingung I(0) = 0 ein, so erhält man (siehe Figuren 5,6) (2.11) R U I(t) = 1 − e− L t R . Es ist klar, dass beim Ausschalten ein entsprechender Vorgang abläuft. (d) Freier Fall mit Reibung Ein Massenpunkt der Masse m falle unter dem Einfluss der Schwerkraft; sein Fall werde gebremst durch eine zur Geschwindigkeit proportionalen Kraft (siehe Figur 7). Zur Zeit t = 0 sei x(0) = 0, ẋ(0) = 0 . Nach Newton gilt für die Ortsfunktion t → x(t) des Massenpunktes die Differentialgleichung 14 U. Stammbach: Analysis, Teil C 0 Fig. 7 : Freier Fall mit Reibung −aẋ m mg (x) (2.12) m ẍ = m g − a ẋ . Dies ist, im Unterschied zu den oben behandelten Beispielen, eine Differentialgleichung zweiter Ordnung. Setzen wir ẋ(t) = v(t) , so erhalten wir (2.13) m v̇ = m g − a v . Diese Differentialgleichung erster Ordnung für t → v(t) entspricht offenbar genau der Differentialgleichung (3.8), wenn v(t) durch I(t), g durch U/L und a/m durch R/L ersetzt wird. Wir können deshalb die Lösung von (3.13) dem vorhergehenden Problem entnehmen; (3.10) liefert v(t) = a mg + C · e− m t . a Die Anfangsbedingung v(0) = 0 bestimmt C; wir erhalten (siehe Figur 8) 15 Kapitel VII. Differentialgleichungen (v) mg a v(t) Fig. 8 : Freier Fall mit Reibung; die Geschwindigkeitfunktion (t) (x) Fig. 9 : Freier Fall mit Reibung; die Ortsfunktion mit Asymptote x(t) mg m x(t) = t− a a (t) 16 (2.14) U. Stammbach: Analysis, Teil C a mg 1 − e− m t . a v(t) = Die Ortsfunktion x(t) berechnet man aus ẋ(t) = v(t) durch einfache Integration. Es ergibt sich (2.15) x(t) = mg m2 g − a t e m + D. t + a a2 Die Anfangsbedingung x(0) = 0 liefert schliesslich (siehe Figur 9) D = − m2 g . a2 Die oben beschriebenen Beispiele zeigen, dass die Mathematik mit den Differentialgleichungen ein sehr effizientes Werkzeug bereitstellt, um Modellvorstellungen mathematisch zu beschreiben. Es ist dabei interessant festzustellen, dass ein- und dasselbe Modell, d.h. also ein- und dieselbe Differentialgleichung in ganz verschiedenen Fachgebieten auf natürliche Weise auftaucht. Weiss man über die Lösungsfunktionen der entsprechenden Differentialgleichung Bescheid, so kann die Modellvorstellung im Experiment geprüft werden, und es kann entschieden werden, ob sie “richtig” oder “falsch” ist. Im Zusammenhang mit diesen Wörtern ist es vielleicht angebracht anzumerken, dass mit “richtig” und “falsch” hier keine absolute Wertung vorgenommen wird. Vielmehr stellt das Experiment ja nur fest, in welchen Grenzen eine Modellvorstellung zu brauchbaren, d.h. für den verfolgten Zweck genügend genauen Resultaten führt. 17 Kapitel VII. Differentialgleichungen 3 Die allgemeine Lösung einer Differentialgleichung 1. Ordnung Im letzten Abschnitt haben wir gesehen, dass in Anwendungen oft Funktionen der Zeit gesucht sind, welche durch Differentialgleichungen beschrieben werden. In der Mathematik ist es üblich geworden, nicht t, sondern x als Name für die Variable zu benutzen und die gesuchte Funktion durch y : x → y(x) zu beschreiben. Wir wollen uns hier in der allgemeinen Theorie an diese historisch bedingte Konvention halten. Wir gehen aus von einer Differentialgleichung erster Ordnung für y : x → y(x) , von welcher wir annehmen, dass sie in der Form y 0 = f (x, y) (3.1) (y) (x) Fig. 1 : Richtungsfeld der Differentialgleichung y 0 = x2 + y 2 vorliegt. Anschaulich besteht eine solche Differentialgleichung darin, dass in jedem Punkt des Definitionsbereiches D(f ) die Steigung der durch diesen Punkt gehenden Lösungskurve festgelegt wird. (Unter einer Lösungskurve verstehen wir natürlich den Graphen einer Lösungsfunktion). 18 U. Stammbach: Analysis, Teil C Trägt man diese Richtungen in ein (x, y)-Koordinatensystem ein, so erhält man das Richtungsfeld der Differentialgleichung. Beispiel Es sei y 0 = x2 + y 2 (siehe Figur 1). Es wird mit diesem Beispiel klar, dass der Verlauf der Lösungskurven einer Differentialgleichung in grober Näherung aus dem Richtungsfeld abgelesen werden kann. Dies ist im Grunde genommen die Basis von vielen numerischen Verfahren zur Lösung von Differentialgleichungen. Plausibel wird damit auch der allgemeine mathematische Satz, welcher über die Existenz und Eindeutigkeit der Lösung einer Differentialgleichung der Form (4.1) Auskunft gibt. (y) (x0 , y0 ) Fig. 2 : Existenz und Eindeutigkeit der Lösung einer Differentialgleichung erster Ordnung y(x) D(f ) x0 (x) Satz 3.1 Es sei f : (x, y) → f (x, y) in D(f ) stetig und nach y stetig partiell differenzierbar. Dann gibt es durch jeden Punkt (x0 , y0 ) im Innern von D(f ) genau eine Lösungskurve für die Differentialgleichung y 0 = f (x, y) . D.h. es gibt eine eindeutig bestimmte, in einem Intervall mit Mittelpunkt x0 definierte Funktion x → y(x), welche Lösung der Differentialgleichung y 0 = f (x, y) ist und die Anfangsbedingung y(x0 ) = y0 erfüllt. Natürlich verzichten wir in dieser Vorlesung auf den Beweis dieses allgemeinen Satzes. Wir weisen aber darauf hin, dass seine Aussage für alles Folgende grundlegend ist. 19 Kapitel VII. Differentialgleichungen Beispiel Im Falle der einfachen Differentialgleichung y0 = a y (3.2) ergibt sich die Aussage des Satzes aus der Tatsache (die in der Analysis I bewiesen worden ist), dass jede Lösung der Differentialgleichung (4.2) von der Form (y) Fig. 3 : Richtungsfeld und Lösungskurven der Differentialgleichung y 0 = ay (x) x → y(x) = C · eax ist. Die Anfangsbedingung y(x0 ) = y0 bestimmt dann eindeutig die Konstante C, so dass y(x) = y0 · e−ax0 · eax die durch den Punkt (x0 , y0 ) verlaufende Lösungskurve beschreibt (siehe Figur 3). Natürlich kennt der Mathematiker Verschärfungen des Satzes 3.1; inbesondere kann er über die Grösse des Definitionsintervalles der gesuchten Funktion weitere Aussagen machen. Dies soll 20 U. Stammbach: Analysis, Teil C uns hier nicht weiter interessieren. Hinweisen möchten wir aber speziell auf den Teil des Satzes, welcher von der Eindeutigkeit der Lösung handelt. Das untenstehende Beispiel zeigt, dass erst die etwas aus dem Rahmen fallende Voraussetzung über die partielle Ableitung von f nach y die Eindeutigkeit der Lösung erzwingt. Nun hat aber gerade diese Eindeutigkeit viele wichtige Konsequenzen, welche der Anfänger gerne übersieht. Zum Beispiel ist es ja erst aufgrund dieser Tatsache überhaupt möglich, die Lösungskurven durch den vorgegebenen Punkt (x0 , y0 ) etwa mit Hilfe numerischer Verfahren zu berechnen; wäre die Lösungskurve nicht eindeutig bestimmt, so müssten numerische Lösungsverfahren naturgemäss versagen (oder wesentlich komplizierter konzipiert sein). Auch für den Praktiker ist also die volle Schärfe des Satzes 3.1 von Interesse. Beispiel Es sei die Differentialgleichung y0 = (3.3) q 3 y2 (y) Fig. 4 : Nichteindeutigkeit der Lösungen der Differentialgleichung (x) gegeben. Die Funktion f (x, y) = nach y, p 3 y0 = q 3 y2 y 2 ist in der ganzen Ebene definiert. Die partielle Ableitung fy (x, y) = 2 −1/3 y 3 21 Kapitel VII. Differentialgleichungen existiert aber für Punkte der x-Achse nicht. Damit ist die Voraussetzung des Satzes in diesen Punkten verletzt und in der Tat gilt die Aussage des Satzes für Anfangsbedingungen der Form y(x0 ) = 0 nicht. Um dies einzusehen, stellt man fest, dass offenbar jede Funktion der Form (3.4) x → y(x) = x−C 3 3 , C∈R die Differentialgleichung erfüllt. Ferner erfüllt auch die Nullfunktion y ≡ 0 die Differentialgleichung. Durch jeden Punkt der x-Achse gibt es somit unendlich viele Lösungskurven. (Weshalb “unendlich viele” und nicht nur “zwei”?) Natürlich gilt die Aussage des Satzes, wenn man die Differentialgleichung (4.3) in einem Gebiet betrachtet, welches die x-Achse ausschliesst (siehe Figur 4). Als Anwendung unseres Satzes betrachten wir zuerst die folgende allgemeine Situation. Es sei ~v : (x, y) → ~v (x, y) ein ebenes Vektorfeld. Es sei P = (x0 , y0 ) ein Punkt des Definitionsbereiches D(~v ) von ~v . Wir stellen die durch P gehenden Feldlinien des Vektorfeldes ~v als Graph einer Funktion y : x → y(x) dar. Es gilt also y(x0 ) = y0 , und der Zeichnung (siehe Figur 5) entnehmen wir, dass in jedem Punkte der Feldlinien gilt y 0 (x) = v2 (x, y(x)) . v1 (x, y(x)) Dies besagt, dass die Funktion y : x → y(x) Lösung der Differentialgleichung (3.5) y0 = v2 (x, y) v1 (x, y) ist. Unser allgemeiner Satz liefert die Aussage, dass durch jeden Punkt (x0 , y0 ) genau eine Feldlinie des Vektorfeldes ~v verläuft, falls die auf der rechten Seite der Gleichung (4.5) stehende Funktion von x und y stetig ist und nach y stetig partiell differenzierbar ist. Insbesondere muss natürlich gelten v1 (x, y) 6= 0 . Beispiel Das Vektorfeld ~v sei gegeben durch ~v (x, y) = (y, x) . Die Differentialgleichung der Feldlinien lautet somit 22 U. Stammbach: Analysis, Teil C (y) v2 Fig. 5 : Feldlinien eines Vektorfeldes v1 (x) y0 = x . y Schreiben wir diese Gleichung für x → y(x) in der Form y(x) y 0 (x) = x , so erhalten wir durch Integration nach x 1 2 1 y = x2 + C , 2 2 wobei C eine Integrationskonstante ist. Es gilt also die Beziehung y 2 − x2 = 2 C . 23 Kapitel VII. Differentialgleichungen Die Feldlinie durch den Punkt (x0 , y0 ) erfüllt zusätzlich die Bedingung y02 − x20 = 2C , so dass wir dafür die Gleichung y 2 − x2 = y02 − x20 erhalten. Für jeden Punkt (x0 , y0 ) mit Ausnahme der Punkte der x-Achse sind die Voraussetzungen unseres Satzes erfüllt, und unser Satz liefert genau eine Feldlinie, welche durch (x0 , y0 ) geht. Die Menge aller Lösungen einer Differentialgleichung (3.6) y 0 = f (x, y) heisst deren allgemeine Lösung. Wiederum ist Terminologie historisch bedingt, sie ist aus heutiger Sicht ziemlich unglücklich. – Nach unserem Satz 3.1 gibt es unter den dort angegebenen Voraussetzungen zu jeder Anfangsbedingung y(x0 ) = y0 eine eindeutig bestimmte Lösung. Geometrisch bedeutet dies, dass es zu jedem Punkt (x0 , y0 ) eine eindeutig bestimmte Lösung der Differentialgleichung (3.6) gibt, deren Graph durch diesen Punkt geht. Der allgemeinen Lösung der Differentialgleichung entspricht folglich eine Schar von Kurven. Halten wir x0 fest, so sind die einzelnen Kurven dieser Schar durch den einzigen Parameter C = y0 festgelegt; durch jeden Punkt geht genau eine Kurve der Schar. Eine einparametrige Kurvenschar mit dieser Eigenschaft heisst auch etwa regulär . Unter den Bedingungen unseres Satzes ist somit die Schar der Lösungskurven der Differentialgleichung y 0 = f (x, y) eine einparametrige reguläre Kurvenschar. Umgekehrt kann man fragen, ob zu einer gegebenen einparametrigen Kurvenschar eine Differentialgleichung 1. Ordnung existiert, die diese Schar als Lösungskurven besitzt. Unter sehr allgemeinen Voraussetzungen, auf die wir hier nicht eingehen, ist dies in der Tat der Fall. Wir illustrieren den Sachverhalt an einem Beispiel. Beispiel Gegeben sei die Schar der Kreise, welche die x-Achse in 0 berühren (siehe Figur 6). Wählen wir den Radius C als Parameter, so stellt sich diese Schar durch die Gleichung (3.7) dar. Daraus erhält man sofort x2 + (y − C)2 = C 2 24 U. Stammbach: Analysis, Teil C (y) Fig. 6 : Die Schar der Kreise, welche die x-Achse im Ursprung berühren (x) (3.8) x2 + y 2 − 2 C y = 0 . In der Umgebung eines Punktes (x0 , y0 ) werde der durch diesen Punkt gehende Kreis als Graph der Funktion y : x → y(x) beschrieben. Dann folgt mit Ableitung nach x (3.9) 2x + 2yy 0 − 2Cy 0 = 0 . Elimination von C aus (4.8) und (4.9) liefert die von C unabhängige, d.h. für alle Kurven der Schar gültige Beziehung (3.10) y0 = 2xy . − y2 x2 Dies ist die Differentialgleichung, welche die Kurvenschar (4.7) als allgemeine Lösung besitzt; man sagt kurz, es ist die Differentialgleichung der Kurvenschar (4.7). Dies kann man entweder durch Auflösen von (4.7) nach y und Einsetzen in (4.10) verifizieren oder durch direktes Lösen der Differentialgleichung (4.10). Für letzteres liefert der nächste Abschnitt die Grundlagen. 25 Kapitel VII. Differentialgleichungen 4 Separierbare Differentialgleichungen Es sollte aus der bisherigen Diskussion über konkrete Beispiele bereits klar geworden sein, dass beim Lösen von Differentialgleichungen nicht fest vorgeschriebene Methoden im Vordergrund stehen. Vielmehr kommt dem geschickten Vorgehen eine grosse Bedeutung zu. Man vergleiche dazu etwa den Lösungsgang im Beispiel (c) Abschnitt 2, wo durch eine Substitution die gegebene Differentialgleichung auf eine einfachere zurückgeführt wird. Ferner muss hier betont werden, dass viele, auch einfach aussehende Differentialgleichungen nicht elementar lösbar sind; dies bedeutet (wie bei den unbestimmten Integralen), dass die Lösungsfunktion, obschon sie natürlich nach unserem Satz 3.1 existiert, nicht durch elementare Funktionen ausdrückbar ist. Als Beispiel erwähnen wir die Differentialgleichung y 0 = x2 + y 2 , deren Richtungsfeld wir in Abschnitt 3 aufgezeichnet haben; sie ist – wie man zeigen kann – nicht elementar lösbar. Man ist in diesen Fällen auf andere Verfahren, zum Beispiel auf Verfahren der numerischen Mathematik angewiesen. – Im vorliegenden Abschnitt wollen wir die Klasse der separierbaren Differentialgleichungen besprechen. Deren Behandlung ist insofern leicht, als sich die Lösungsfunktionen ohne viel Mühe durch gewöhnliche Integrale beschreiben lassen. Ferner betrachten wir Differentialgleichungen, welche durch eine einfache Operation auf separierbare zurückgeführt werden können. Hat die Differentialgleichung die Form y0 = (4.1) g(x) h(y) so heisst sie separierbar. Diese Terminologie orientiert sich an der einfachen Tatsache, dass (5.1) in der Form h(y) · y 0 = g(x) (4.2) geschrieben werden kann, in welcher die “Variablen x, y separiert” sind. Ist y : x → y(x) eine Lösungsfunktion von (5.2) so gilt, identisch in x h (y(x)) · y 0 (x) = g(x) . Integration nach x liefert Z 0 h (y(x)) y (x) dx = Z g(x) dx + C 26 U. Stammbach: Analysis, Teil C und die Substitution y(x) = y, y 0 dx = dy schliesslich Z h(y) dy = Z g(x) dx + C . Löst man die so entstehende (gewöhnliche) Gleichung nach y auf, so erhält man die allgemeine Lösung der Differentialgleichung (5.1) mit C als Parameter. Der Leser mache sich an dieser Stelle klar, dass die Differentialgleichungen (2.1) und (2.4) separierbar sind und führe auf Grund dieser Tatsache die Lösung explizit durch. Als weiteres Beispiel einer separierbaren Differentialgleichung betrachten wir das sogenannte “logistische Modell für Populationen”. Es handelt sich darum, ein mathematisches Modell für die Populationen in einem vorgegebenen Gebiet zu liefern, etwa für die Bevölkerungszahl eines Landes (oder die Rattenpopulation eines Biotops etc.). Wir bezeichnen die Bevölkerungszahl zur Zeit t mit y(t) . Im Zeitabschnitt 4t lässt sich diese Änderung beschreiben durch (4.3) y(t + 4t) − y(t) = (G − T + E − A) 4t , wobei die Grössen G, T, E, A der Reihe nach für die Anzahl Geburten, Todesfälle, Einwanderer, Auswanderer pro Zeiteinheit stehen. Natürlich können diese positiven Grössen im allgemeinen von t und y abhängig sein. Wir wollen im Folgenden der Einfachheit annehmen, dass E = A, so dass sich der Effekt der Einwanderung und der Auswanderung auf die Bevölkerungszahl aufhebt. Für die Grössen G und T wollen wir einfache Modellannahmen treffen. Wenden wir uns zunächst der Grösse T zu. Die einfachste Annahme besteht natürlich darin, dass die Anzahl Todesfälle T pro Zeiteinheit proportional zur Bevölkerungszahl y(t) ist (4.4) T = a y(t) , a>0. Nun wird aber mit zunehmender Bevölkerungszahl etwa die Nahrungsbeschaffung immer schwieriger, der Stress des Individuums wird grösser, etc. , so dass die Annahme (5.4) in einem verfeinerten Modell durch einen entsprechenden Term korrigiert werden muss. Wir setzen (4.5) T = a y(t) + b y 2 (t) , a, b > 0 . Dieser Ansatz erscheint vernünftig, da y 2 (t) ein Mass für die Anzahl der Zusammenstösse von Individuen pro Zeiteinheit ist. Analog macht man für G die Modellannahme (4.6) G = c y(t) − d y 2 (t) , c, d > 0 . 27 Kapitel VII. Differentialgleichungen Die Geburtenzahl pro Zeiteinheit nimmt wegen der oben erwähnten Schwierigkeiten mit wachsendem y(t) unter proportional zu. Mit diesen Modellannahmen (5.5) und (5.6) erhalten wir die folgende Differentialgleichung für t → y(t) y 0 (t) = (c − a) y(t) − (b + d) y 2 (t) . Setzen wir c − a = α , b + d = β , so folgt (siehe Figur 1) y0 = α y − β y2. (4.7) (y) Fig. 1 : Richtungsfeld der logistischen Differentialgleichung y 0 = αy − βy 2 (t) Die Gleichung ist offensichtlich separierbar. Wir erhalten Z dy = (α − βy)y Z dt , 28 U. Stammbach: Analysis, Teil C Z 1 dy + y Z β dy = α α − βy Z dt , log |y| − log |α − βy| = αt + C , α − βy = A · e−αt . y Dabei haben wir A = ±e−C gesetzt. Auflösen nach y liefert nun die allgemeine Lösung der Differentialgleichung (5.7) y(t) = (4.8) α β + A · e−αt (y) α/β Fig. 2 : Lösungen der Differentialgleichung y 0 = αy − βy 2 (t) Für die Anfangsbevölkerungszahl y(0) = y0 erhält man für den Parameterwert A A = α − β, y0 29 Kapitel VII. Differentialgleichungen so dass die zugehörige spezielle Lösung lautet (4.9) y(t) = β+ α . α −αt −β e y0 Die Figur 2 zeigt die Lösungskurven für verschiedene Werte von y0 . Man entnimmt der Formel (5.9) leicht die Tatsache, dass für grosse t der Wert von y(t) gegen α/β strebt. Es gibt in diesem Modell eine stabile Bevölkerungszahl. In vielen Fällen lassen sich Differentialgleichungen durch eine Substitution auf einfachere zurückführen. Wir lernen hier einige Typen von Differentialgleichungen kennen, die auf diese Weise auf separierbare zurückgeführt werden können. In der Differentialgleichung y 0 = f (x, y) sei die Funktion f (x, y) von der Form g(u), wo u eine lineare Funktion in x und y ist, u = ax + by + c , a, b, c ∈ R . Setzt man dann u(x) = ax + b y(x) + c , so erhält man eine separierbare Differentialgleichung für x → u(x) . Wir verfolgen den Lösungsweg an einem konkreten Beispiel. (4.10) y 0 = (2x + 3y)2 . Setze u(x) = 2x + 3y(x) , d.h. y(x) = 1 3 (u(x) − 2x) . Dann ergibt sich y 0 (x) = 1 0 u (x) − 2 , 3 und damit wird (5.10) zu 1 0 (u − 2) = u2 , 3 u0 = 3u2 + 2 . Diese Differentialgleichung ist offensichtlich separierbar: Z du = 2 + 3u2 Z dx , 30 U. Stammbach: Analysis, Teil C 1 √ arctan 6 r 3 u 2 ! = x + C . Auflösung nach u liefert r √ 2 6(x + C) , tan 3 und wegen u(x) = 2x + 3y(x) erhält man schliesslich u = (y) (x) Fig. 3 : Lösungen der Differentialgleichung y 0 = (2x + 3y)2 1 y = y(x) = 3 r √ 2 6(x + C) − 2x tan 3 ! . Dies ist die allgemeine Lösung der Differentialgleichung (5.10) (siehe Figur 3). Ähnliches gilt für Differentialgleichungen y 0 = f (x, y) , wo f (x, y) geschrieben werden kann als g(u) mit u = y/x . Analog wie oben macht man die Substitution u(x) = y(x)/x und erhält so eine separierbare Differentialgleichung für die Funktion x → u(x) . Wieder erklären wir den Lösungsweg an einem konkreten Beispiel: 31 Kapitel VII. Differentialgleichungen √ x y 0 = y − 2 xy (4.11) Diese Differentialgleichung lässt sich in der Form r y y = −2 x 0 y x schreiben. Die rechte Seite ist eine Funktion von u = y/x . Die Substitution u(x) = y(x)/x liefert y(x) = x · u(x) und damit y 0 (x) = u(x) + x u0 (x) . Einsetzen in (5.11) ergibt √ u + x u0 = u − 2 u , √ x u0 = −2 u . Letztere Differentialgleichung ist separierbar, so dass unser erstes Teilziel erreicht ist. Wir erhalten weiter − Z 1 √ du = 2 u Z 1 dx , x √ − u = log |x| + C , wobei, wie immer, der positive Wert der Wurzel zu nehmen ist, d.h. es ist log |x| + C ≤ 0. Mit u = y/x folgt nach Quadrieren y = (log |x| + C)2 , x y = x (log |x| + C)2 , 32 U. Stammbach: Analysis, Teil C (y) Fig. 4 : Lösungen der Differentialgleichung (x) √ x y 0 = y − 2 xy mit log |x| + C ≤ 0. Dies ist die allgemeine Lösung von (5.11) (siehe Figur 4). Wir betrachten schliesslich in diesem Abschnitt noch das folgende Anwendungsbeispiel. Wir stellen die Frage, wie ein zur y-Achse rotationssymmetrischer Spiegel geformt sein muss, damit alle parallel zur y-Achse einfallenden Strahlen in den Nullpunkt des Koordinatensystems reflektiert werden (siehe Figur 5). Wegen der Rotationssymmetrie genügt es natürlich, die Schnittkurve des Spiegels mit der (x, y)Ebene zu bestimmen, wobei wir uns sogar auf den Teil x ≥ 0 beschränken können. Wir stellen diese Kurve als Graph einer Funktion x → y(x) , x ≥ 0 dar, und entnehmen der Figur die Beziehungen cot α(x) = tan β(x) = y 0 , cot (2α(x)) = y(x) . x 33 Kapitel VII. Differentialgleichungen (y) α Fig. 5 : Reflexion in den Nullpunkt (x, y(x)) α 2α β (x) Die bekannte trigonometrische Formel cot(2α) = cot2 α − 1 2 cot α liefert dann y y02 − 1 , = x 2y 0 (4.12) 2 x y 0 − 2y y 0 − x = 0 , (4.13) 0 y = + y (−) p y 2 + x2 . x Da y 0 > 0 für x > 0 , kann hier das negative Vorzeichen ausgeschlossen werden. Schreiben wir (5.13) in der Form 34 U. Stammbach: Analysis, Teil C y y0 = + x (4.14) s 2 y x +1 , so ist offensichtlich, dass die rechte Seite eine Funktion von y/x ist. Die Substitution u(x) = y(x)/x wird also eine separierbare Differentialgleichung für x → u(x) liefern. Wir erhalten wegen y 0 (x) = u(x) + x u0 (x) (y) Fig. 6 : Parabolspiegel (x) die einfache Differentialgleichung u + x u0 = u + Z √ du = u2 + 1 p u2 + 1 , Z dx , x 35 Kapitel VII. Differentialgleichungen log u + p u2 + 1 = log |x| + C . Setzen wir A = ±eC , so folgt y + x s y2 + 1 = Ax , x2 y2 y2 2 2 + 1 = A x − 2Ay + , x2 x2 y = 1 2 2 A x −1 . 2A Die “Anfangsbedingung” y0 = y(x0 ) bestimmt den Parameter A und damit die Öffnung des Spiegels (siehe Figur 6). 36 5 U. Stammbach: Analysis, Teil C Lineare Differentialgleichungen Die bei weitem wichtigste Klasse von Differentialgleichungen bilden die linearen Differentialgleichungen, sowohl was die Anwendungen wie auch was die Theorie betrifft, letzteres vor allem im Hinblick auf Differentialgleichungen höherer Ordnung. Eine Differentialgleichung 1. Ordnung heisst linear, wenn sie von der Form (5.1) y 0 = p(x) · y + q(x) ist, wobei x → p(x) und x → q(x) beliebige Funktionen von x sind. Die rechte Seite der Differentialgleichung ist also eine lineare Funktion in y; man beachte, dass über die Funktionen p und q von x keine Voraussetzungen getroffen werden. In (6.1) heisst der Term q(x) inhomogenes Glied oder Störglied. Ist q(x) ≡ 0, so heisst (6.1) homogen, andernfalls inhomogen. Die Differentialgleichung (5.2) y 0 = p(x) · y heisst die zu (6.1) gehörige homogene Differentialgleichung. Die homogene lineare Differentialgleichung (6.2) lässt sich in der Form y0 = p(x) y schreiben. Damit haben wir die folgende wichtige Tatsache festgestellt: Homogene lineare Differentialgleichungen sind separierbar. 37 Kapitel VII. Differentialgleichungen Beispiel Die Differentialgleichung (siehe Figur 1) y0 = (5.3) 1 y + 4x2 x 1 ist offensichtlich linear mit p(x) = , q(x) = 4x2 . Die zugehörige homogene Differentialgleix chung lautet y0 = (5.4) 1 y. x (y) Fig. 1 : Richtungsfeld der linearen Differentialgleichung (x) Separieren liefert Z 1 dy = y Z 1 dx , x log |y| = log |x| + C . y0 = 1 y + 4x2 x 38 U. Stammbach: Analysis, Teil C Setzt man A = ±eC , so erhält man die allgemeine Lösung von (6.4) zu y(x) = A · x . (5.5) Als nächstes wenden wir uns der inhomogenen Differentialgleichung (6.1) zu. Wir nehmen zuerst an, dass wir aus irgend einem Grunde eine partikuläre Lösung dieser Differentialgleichung kennen. Es sei also y0 : x → y0 (x) eine Funktion, welche (6.1) erfüllt: (5.6) y00 (x) = p(x) y0 (x) + q(x) . Wir behaupten nun: Behauptung A Ist yh : x → yh (x) eine Lösung der homogenen Differentialgleichung (6.2), d.h. gilt (5.7) yh0 (x) ≡ p(x) yh (x) , so ist die “Superposition” der Funktionen y0 und yh , d.h. die Funktion x → y0 (x) + yh (x) wieder eine Lösung der inhomogenen Differentialgleichung (6.1). 39 Kapitel VII. Differentialgleichungen Beweis Wir beweisen dies durch Einsetzen. Wegen (6.6) und (6.7) gilt (y0 (x) + yh (x))0 = y00 (x) + yh0 (x) = (p(x) y0 (x) + q(x)) + p(x) yh (x) = p(x) (y0 (x) + yh (x)) + q(x) d.h. x → y0 (x) + yh (x) erfüllt die Differentialgleichung (6.1). Als zweites behaupten wir: Behauptung B Ist die Funktion y1 : x → y1 (x) eine weitere Lösung der inhomogenen Differentialgleichung (6.1), so ist die Differenz x → y1 (x) − y0 (x) eine Lösung der homogenen Differentialgleichung (6.2). Beweis In der Tat gilt (y1 (x) − y0 (x))0 = y10 (x) − y00 (x) = (p(x) y1 (x) + q(x)) − (p(x) y0 (x) + q(x)) = p(x) · (y1 (x) − y0 (x)) d.h. x → y1 (x) − y0 (x) erfüllt die Differentialgleichung (6.2). Damit ist die Behauptung B bewiesen. Aus der Behauptung B folgt, dass sich jede Lösung x → y1 (x) der inhomogenen Differentialgleichung (6.1) darstellen lässt als (5.8) y1 (x) = y0 (x) + ỹ(x) , 40 U. Stammbach: Analysis, Teil C wo ỹ(x) eine Lösung der homogenen Differentialgleichung (6.2) ist. Die Behauptung A sagt, dass jede Funktion der Form (6.8) eine Lösung der inhomogenen Differentialgleichung (6.1) ist. Wir erhalten damit das folgende allgemeine Verfahren zur Lösung der inhomogenen Differentialgleichung (6.1). Man erhält die allgemeine Lösung der Differentialgleichung y 0 = p(x) y + q(x) , indem man eine partikuläre Lösung y0 : x → y0 (x) nimmt und zu ihr die allgemeine Lösung der zugehörigen homogenen Differentialgleichung y 0 = p(x) y addiert. Dieses Superpositionsprinzip ist charakterisch für lineare Differentialgleichungen. Wir wissen bereits, dass es einfach ist, die allgemeine Lösung der homogenen Differentialgleichung zu finden. Das Problem ist also auf die Aufgabe reduziert, eine partikuläre Lösung der inhomogenen Differentialgleichung zu finden. Oft lassen sich solche partikuläre Lösungen durch einen geschickt gewählten Ansatz auf einfache Art und Weise finden. In anderen Fällen ist es notwendig, ein umständlicheres Verfahren anzuwenden, das aber den Vorteil hat, dass es immer zum Ziel führt (Verfahren von Lagrange, J. L. Lagrange 1736 - 1813). Wir betrachten zuerst das Beispiel (6.3), wo ein einfacher Ansatz für y0 genügt. Beispiel Als Lösungsansatz für die Differentialgleichung (6.3) y0 = 1 y + 4x2 x versuchen wir (5.9) y0 (x) = a x3 41 Kapitel VII. Differentialgleichungen wo a eine noch zu bestimmende Konstante ist. Einsetzen liefert 3ax2 ≡ 2ax2 ≡ a x3 + 4x2 , x 4x2 , a = 2. Wir haben damit eine partikuläre Lösung von (6.3) erhalten y0 (x) = 2x3 . Nach unserem Verfahren liefert dies zusammen mit der allgemeinen Lösung (6.5) der zugehörigen homogenen Differentialgleichung die allgemeine Lösung von (6.3) (siehe Figur 2) (5.10) y(x) = Ax + 2x3 . Als Faustregel kann man sich merken, dass man immer einen Ansatz für y0 versuchen soll, der die Form des Störgliedes q(x) hat. Ist also q(x) ein Polynom, so soll man einen Polynomansatz versuchen, ist q(x) eine Sinus- oder Cosinusfunktion, so soll man als Ansatz eine Summe einer Sinus- und Cosinusfunktion der gleichen Kreisfrequenz versuchen, usw. Nicht immer führt dies allerdings zum Ziel. Dann muss das Verfahren von Lagrange angewandt werden. Wir betrachten wiederum die inhomogene Differentialgleichung (6.1) und nehmen an, dass wir eine Lösung x → yh (x) , yh 6≡ 0 der zugehörigen homogenen Differentialgleichung (6.2) bereits kennen. Es gilt also (5.11) yh0 (x) ≡ p(x) · yh (x) . Wir machen nun den Ansatz von Lagrange (5.12) y0 (x) = γ(x) · yh (x) , 42 U. Stammbach: Analysis, Teil C (y) Fig. 2 : Lösungen der linearen Differentialgleichung (x) y0 = 1 y + 4x2 x wobei x → γ(x) eine noch zu bestimmende Funktion von x ist. (Man beachte, dass sich jede Funktion in der Form (6.12) darstellen lässt!) Einsetzen in (6.1) liefert y00 (x) = γ 0 (x) yh (x) + γ(x) yh0 (x) ≡ p(x) γ(x) yh (x) + q(x) . Wegen (6.11) ergibt sich daraus γ 0 (x) = q(x) , yh (x) woraus sich durch Integration γ(x) und damit y0 (x) ergibt. Wir verfolgen den Lösungsweg an einem konkreten einfachen Beispiel. 43 Kapitel VII. Differentialgleichungen Beispiel Es sei die Differentialgleichung (5.13) y0 = y + 1 x gegeben. Die zugehörige homogene Differentialgleichung y0 = y x hat die allgemeine Lösung yh = Ax . Als Ansatz von Lagrange setzt man y0 (x) = γ(x) · x und erhält durch Einsetzen γ 0 (x) · x + γ(x) ≡ γ 0 (x) = γ(x) = γ(x) · x + 1, x 1 , x log |x| . Da wir nur an einer partikulären Lösung interessiert sind, können wir hier auf die Integrationskonstante verzichten. Wir erhalten y0 = x log |x| und als allgemeine Lösung von (6.13) (siehe Figur 3) (5.14) y(x) = Ax + x log |x| . Im verbleibenden Teil dieses Abschnittes diskutieren wir ein wichtiges Beispiel aus der Elektrodynamik. Es sei ein Schaltkreis mit einem Ohm’schen Widerstand R und einer Selbstinduktion L gegeben. Es interessiert der zur Zeit t im Schaltkreis fliessende Strom I(t), wenn zur Zeit t=0 44 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Lösungen der linearen Differentialgleichung (x) y0 = y +1 x (a) eine konstante Spannung U = U0 , (b) eine Wechselspannung U = U0 · cos(ωt) angelegt wird (Das Beispiel (a) wurde bereits im Abschnitt 2 behandelt; wir erhalten die Lösung hier aber auf eine etwas andere Art). In der Physik lernt man, dass die Funktion t → I(t) der Differentialgleichung (5.15) dI R U = − I + dt L L genügt. Gesucht ist die Lösung von (6.15) in den Fällen (a), (b) zur Anfangsbedingung I(0) = 0. Offensichtlich handelt es sich bei (6.15) um eine inhomogene lineare Differentialgleichung. Die zugehörige homogene Differentialgleichung lautet dI R = − I ; dt L sie hat als allgemeine Lösung 45 Kapitel VII. Differentialgleichungen R Ih (t) = C · e− L t . (5.16) Die beiden Fälle (a), (b) unterscheiden sich durch die partikuläre Lösung der inhomogenen Differentialgleichung (6.15). Im Fall (a) hat man U = U0 und eine Partikulärlösung lässt sich sofort erraten I0 (t) = U0 . R Die allgemeine Lösung von (6.15) im Fall (a) ist also I(t) = R U0 + C · e− L t R und die Anfangsbedingung I(0) = 0 liefert C = − (5.17) U0 I(t) = R U0 , so dass die gesuchte Lösung lautet R R 1 − e− L t . Man vergleiche dazu Beispiel (c) im Abschnitt 2, wo dieses Resultat auf etwas anderem Weg erhalten worden ist. Im Fall (b) hat man die Differentialgleichung (5.18) dI R 1 = − I + U0 · cos(ωt) dt L L zu diskutieren. Wir machen unserer Faustregel folgend für die partikuläre Lösung t → I0 (t) den Ansatz I0 (t) = a cos(ωt) + b sin(ωt) wo a, b zwei noch zu bestimmende reelle Konstanten sind. Einsetzen in (6.18) liefert −aω sin(ωt) + bω cos(ωt) ≡ − Daraus ergeben sich die Gleichungen R U0 (a cos(ωt) + b sin(ωt)) + cos(ωt) . L L 46 U. Stammbach: Analysis, Teil C aω = bω = R b, L R U0 − a + , L L und es folgt a = R2 U0 R + ω 2 L2 , b = U0 ω L . + ω 2 L2 R2 Zusammen mit (6.16) ergibt sich die allgemeine Lösung von (6.18) (5.19) R I(t) = C · e− L t + R2 U0 R U0 ω L cos(ωt) + 2 sin(ωt) . 2 2 +ω L R + ω 2 L2 Die Anfangsbedingung I0 = 0 schliesslich liefert C = − R2 U0 R . + ω 2 L2 Man entnimmt der Formel (5.19), dass für grosse t die Funktion I(t) gegen die partikuläre Lösung strebt. Man spricht deshalb auch etwa von der “stationären Lösung”, der Lösung nämlich, die sich nach langer Zeit einstellt (siehe Figur 4). Dass diese in unserem Beispiel eine Schwingung mit Kreisfrequenz ω sein wird, ist natürlich zu erwarten und wird durch die Rechnung auch bestätigt. Man beachte aber, dass die Phase der Lösung mit der Phase der angelegten Spannung nicht übereinstimmt (siehe Figur 4) Eine zweite Bemerkung betrifft die Grössen √ R2 R ωL , √ . 2 2 2 +ω L R + ω 2 L2 Diese lassen sich wegen √ R 2 R + ω 2 L2 2 + √ ωL 2 R + ω 2 L2 als Cosinus bzw. Sinus eines Winkels α deuten, welcher durch 2 =1 47 Kapitel VII. Differentialgleichungen I(t) U (t) (t) tan α = Fig. 4 : Stromstärke in einem Stromkreis unter einer Klemmenspannung, die durch t → cos(ωt) gegeben ist ωL R gegeben ist. Die Lösung (5.19) schreibt sich dann als I(t) = R C · e− L t + √ = R C · e− L t + √ R2 U0 (cos α cos(ωt) + sin α sin(ωt)) + ω 2 L2 U0 cos(ωt − α) . R 2 + ω 2 L2 Die “stationäre Lösung” ist somit eine Schwingung mit der Kreisfrequenz ω der angelegten Spannung und einer Phasenverschiebung, die durch α gegeben ist. 48 6 U. Stammbach: Analysis, Teil C Niveaulinien, exakte Differentialgleichungen, Orthogonaltrajektorien In diesem und dem nächsten Abschnitt wollen wir uns mit einigen geometrischen Problemen auseinandersetzen, welche mit Kurvenscharen zu tun haben. Wir betrachten zunächst eine Funktion g : (x, y) → g(x, y) von zwei Variablen. Den Verlauf dieser Funktion veranschaulichen wir uns durch ihre Niveaulinien, welche durch die Gleichung (6.1) g(x, y) = C , C∈R gegeben sind. Wir fragen jetzt nach der Differentialgleichung, welche die Kurvenschar (7.1) beschreibt. Totale Ableitung von (7.1) nach x liefert (6.2) gx (x, y) + gy (x, y) y 0 = 0 . Da der Scharparameter C automatisch eliminiert worden ist, ist (7.2) bereits die Differentialgleichung der Schar. Die Lösungskurven von (7.2) sind die Niveaulinien der Funktion g. Wir schliessen daran einige Bemerkungen an. Schreiben wir (7.2) in der Form (6.3) y0 = − gx (x, y) =: f (x, y) gy (x, y) und wenden wir darauf unseren Satz (3.1) über die Existenz und Eindeutigkeit von Lösungen von Differentialgleichungen an, so erhalten wir folgendes. Durch einen Punkt (x0 , y0 ) geht genau eine Lösungskurve von (7.3), also eine Niveaulinie von g, wenn f in einer Umgebung von (x0 , y0 ) stetig partiell differenzierbar ist. Für die Funktion g selbst bedeutet letzteres, neben der offensichtlichen Bedingung gy (x, y) 6= 0 , dass g in einer Umgebung von (x0 , y0 ) zweimal stetig partiell differenzierbar ist. Beispiel Betrachte die Funktion g : (x, y) → x2 − y 2 und ihre Niveaulinien (siehe Figur 1). Satz 3.1 liefert uns genau eine Niveaulinie durch jeden Punkt der (x, y)-Ebene mit Ausnahme der Punkte auf der x-Achse; denn dort verschwindet die partielle Ableitung von g nach y. (Die 49 Kapitel VII. Differentialgleichungen (y) Fig. 1 : Niveaulinien der Funktion (x) (x, y) → g(x, y) = x2 − y 2 Zeichnung lässt allerdings vermuten, dass sich die Niveaulinien in diese Punkte stetig fortsetzen lassen. Dies kann man in der Tat mathematisch einwandfrei nachweisen, indem man ein um π/2 gedrehtes Koordinatensystem einführt. Der Nullpunkt bildet dabei eine Ausnahme!) Umgekehrt gehen wir von einer Differentialgleichung der Form (6.4) ϕ(x, y) + ψ(x, y) y 0 = 0 aus und fragen, unter welchen Bedingungen sie als eine Differentialgleichung der Form (7.2) interpretiert werden kann. Wann gibt es eine Funktion g : (x, y) → g(x, y) mit ϕ(x, y) ≡ gx (x, y) , ψ(x, y) ≡ gy (x, y) ? Wir haben dieses Problem bereits früher, nämlich in Kapitel IV, Abschnitt 7 studiert und gesehen, dass g : (x, y) → g(x, y) jedenfalls nur dann existieren kann, wenn die Integrabilitätsbedingung (6.5) ϕy (x, y) ≡ ψx (x, y) 50 U. Stammbach: Analysis, Teil C erfüllt ist. Ferner haben wir festgestellt, dass in diesem Fall g auch tatsächlich existiert, wenn man sich auf ein achsenparalleles Rechteck als Definitionsbereich beschränkt. Da wir unter diesen Vorgaben g berechnen können, ist damit auch die Differentialgleichung (7.4) gelöst: die Lösungskurven sind die Niveaulinien von g. Eine Differentialgleichung (7.4), welche die Bedingung (7.5) erfüllt, heisst exakt. Ihre Lösungskurven sind die Niveaulinien der Funktion g : (x, y) → g(x, y) . Beispiel Bestimme die durch den Punkt (1, 2) gehende Lösungskurve von (2x2 − y 2 + y) − (2xy − x + 4y) y 0 = 0 . (6.6) Ein Vergleich mit (7.4) zeigt, dass wir ϕ(x, y) = 2x2 − y 2 + y , ψ(x, y) = −2xy + x − 4y (6.7) setzen müssen. Dann gilt ϕy (x, y) = −2y + 1 = ψx (x, y) . Die Differentialgleichung (7.6) ist folglich exakt. Die Funktion g(x, y) ergibt sich schrittweise. Wegen gx (x, y) = ϕ(x, y) = 2x2 − y 2 + y erhalten wir g(x, y) = 2 3 x − xy 2 + xy + u(y) 3 für eine noch zu bestimmende Funktion y → u(y) . Ableitung nach y liefert ! −2xy + x − 4y = ψ(x, y) = gy (x, y) = −2xy + x + u0 (y) . Daraus ergibt sich 51 Kapitel VII. Differentialgleichungen u0 (y) = −4y , u(y) = −2y 2 . Die Funktion g : (x, y) → g(x, y) ist also gegeben durch g(x, y) = (6.8) 2 3 x − xy 2 + xy − 2y 2 . 3 (Natürlich ist g nur bis auf eine additive Konstante bestimmt.) Die allgemeine Lösung der Differentialgleichung (7.6) ist die Schar der Niveaulinien von g (siehe Figur 2): 4 2 Fig. 2 : Niveaulinien der Funktion 0 (x, y) → 2 3 x − xy 2 + xy − 2y 2 3 -2 -4 -4 (6.9) -2 0 2 4 2 3 x − xy 2 + xy − 2y 2 = C . 3 Den zur gesuchten speziellen Lösung gehörigen Wert von C erhalten wir durch Einsetzen des Punktes (1,2) in (7.9). Es ergibt sich C = −28/3 , so dass die Lösung gegeben ist durch 52 (6.10) U. Stammbach: Analysis, Teil C 2 3 x − xy 2 + xy − 2y 2 = −28/3 . 3 Wir gehen zurück zur Gleichung (7.1), welche die Niveaulinien der Funktion g : (x, y) → g(x, y) beschreibt. Betrachten wir g als (ebenes) Potential, so hat bekanntlich das zugehörige Gradientenfeld die Eigenschaft, dass der Vektor des Feldes im Punkt P senkrecht auf der Niveaulinie durch P steht. Die Feldlinien des Gradientenfeldes verlaufen somit in jedem Punkt senkrecht zu den Niveaulinien von g. Die Feldlinien bilden die Orthogonaltrajektorien zur Schar der Niveaulinien. Etwas allgemeiner kann man nach den Orthogonaltrajektorien einer (regulären) Schar von Kurven fragen. Jede solche reguläre Schar ist Lösungsschar einer Differentialgleichung y 0 = f (x, y) . (6.11) Die Steigung in (x, y) der durch (x, y) gehenden Orthogonaltrajektorie ist dann offensichtlich m = − 1 . f (x, y) Beschreiben wir die Orthogonaltrajektorie wieder als Graph einer Funktion y : x → y(x) , so muss dafür die Differentialgleichung (6.12) y0 = − 1 f (x, y) erfüllt sein. Die Orthogonaltrajektorien sind somit gerade die Lösungskurven der Differentialgleichung (7.12), wenn die ursprüngliche Schar durch die Differentialgleichung (7.11) beschrieben wird. Beispiel Es sei die Schar der Parabeln (6.13) y = C x2 gegeben, und es seien die Orthogonaltrajektorien dieser Schar gesucht. Die Differentialgleichung der Schar (7.13) erhalten wir durch Ableiten nach x und Elimination des Parameters. Wir erhalten 53 Kapitel VII. Differentialgleichungen y 0 = 2Cx . (6.14) Aus (7.13) ergibt sich C = y . x2 Einsetzen in (7.14) liefert y0 = 2 y =: f (x, y) . x Die Differentialgleichung der Orthogonaltrajektorien lautet nach (7.12) y0 = − (6.15) x . 2y Diese ist separierbar. Wir erhalten Z y dy = − y2 2 = − Z 1 x dx , 2 x2 + C . 4 Die Orthogonaltrajektorien der Schar (7.13) sind somit gegeben durch (6.16) x2 y2 + = C . 4 2 Es sind Ellipsen mit Mittelpunkt im Ursprung des Koordinatensystems (siehe Figur 3). Natürlich bilden umgekehrt die durch (7.13) gegebenen Kurven die Orthogonaltrajektorien zur Schar (7.16). Beispiel In einem zweiten Beispiel sei die Schar der Kreise gegeben, welche die x-Achse im Ursprung berühren. Gesucht ist die Schar der Orthogonaltrajektorien. 54 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Die Orthogonaltrajektorien der Schar der Parabeln y = Cx2 sind Ellipsen (x) Die Schargleichung der Kreise lautet offensichtlich (6.17) x2 + y 2 − C y = 0 . Die Differentialgleichung ergibt sich durch totale Ableitung nach x und Elimination von C. Wir erhalten 2xy . − y2 y0 = x2 Die Differentialgleichung der Orthogonaltrajektorien lautet nach (7.12) y0 y 0 = − = 1 2 x2 − y 2 2xy y 1 − y x x ! . 55 Kapitel VII. Differentialgleichungen Wie üblich machen wir die Substitution u(x) = y(x) , d.h. x u0 x + u = y 0 . Einsetzen liefert 0 xu Z = u2 + 1 u 1 − 2 Z ! , 2u du 2 u +1 = − 1 dx , x log |u2 + 1| = − log |x| + C . (y) Fig. 4 : Die Orthogonaltrajektorien der Schar der Kreise (x) x2 + y 2 − Cy = 0 sind die Kreise x2 − Ax + y 2 = 0 Setzen wir A = ±eC , so folgt nach Rücksubstitution y2 + 1 x2 = A , x 56 (6.18) U. Stammbach: Analysis, Teil C x2 − Ax + y 2 = 0. Die Orthogonaltrajektorien sind also wiederum Kreise, nämlich solche, welche die y-Achse im Ursprung berühren (siehe Figur 4). 57 Kapitel VII. Differentialgleichungen 7 Enveloppen, Singuläre Lösungen, Clairaut’sche Differentialgleichungen Es sei eine Schar von Kurven gegeben. Unter einer Enveloppe (Umhüllenden) der Schar verstehen wir eine Kurve K, welche in jedem ihrer Punkte eine Kurve der Schar berührt. Wie man am Beispiel der Schar der Kreise mit Mittelpunkt im Ursprung feststellen kann, besitzt nicht jede Kurvenschar eine Enveloppe. Gibt es aber eine, so spielt sie gewöhnlich eine ausgezeichnete Rolle. Wird zum Beispiel die Kurvenschar durch die Differentialgleichung (7.1) y 0 = f (x, y) beschrieben, so erfüllen offensichtlich nicht nur die Kurven der Schar diese Differentialgleichung, sondern auch ihre Enveloppe; in jedem ihrer Punkte stimmt ja ihre Steigung mit der Steigung der Scharkurve durch diesen Punkt überein. Neben den offensichtlichen Lösungen der Differentialgleichung (8.1), die durch die Kurven der Schar gegeben sind, gibt es also noch eine “versteckte”, eine singuläre Lösung, die der Enveloppe der Schar entspricht. Man entnimmt leicht der Figur 1, dass die Differentialgleichung (8.1) in den Punkten der Enveloppe die Voraussetzungen des Satzes 3.1 nicht erfüllen kann, denn durch diese Punkte gibt es mehrere Lösungen der Differentialgleichung (8.1). Wie bestimmt man die Enveloppe einer Kurvenschar? Die Schar sei gegeben durch die Gleichung (7.2) F (x, y, C) = 0 . Dem Parameterwert C ordnen wir (abstrakt) den Punkt (x(C), y(C)) der Enveloppe K zu, in dem K die zu C gehörige Scharkurve berührt (siehe Figur 1). Dann kann (7.3) C → (x(C), y(C)) als Parameterdarstellung der Enveloppe aufgefasst werden. Nun gilt, da (x(C), y(C)) auf der zu C gehörigen Scharkurve liegt, (7.4) F (x(C), y(C), C) = 0 . 58 U. Stammbach: Analysis, Teil C Fig. 1 : Enveloppe einer Kurvenschar (x(C), y(C)) F (x, y, C) = 0 Ferner berühren sich in (x(C), y(C)) Scharkurve und Enveloppe, ihre Steigungen stimmen in diesem Punkte überein: (7.5) ẏ(C) Fx (x(C), y(C), C) = − . ẋ(C) Fy (x(C), y(C), C) Links steht die Steigung der Enveloppe (8.3) und rechts steht die Steigung der implizit gegebenen Scharkurve. Wir schreiben (7.5) in der Form (7.6) Fx (x(C), y(C), C) ẋ(C) + Fy (x(C), y(C), C) ẏ(C) = 0 . Ausserdem liefert die totale Ableitung nach C von (8.4) die Gleichung (7.7) Fx (x(C), y(C), C) ẋ(C) + Fy (x(C), y(C), C) ẏ(C) + FC (x(C), y(C), C) = 0 . Zusammen mit (8.6) folgt daraus (7.8) FC (x(C), y(C), C) = 0 . 59 Kapitel VII. Differentialgleichungen Wir fassen zusammen: Die Enveloppe der durch (8.2) gegebenen Kurvenschar erhält man durch Elimination des Scharparameters C aus den Gleichungen F (x, y, C) = 0 FC (x, y, C) = 0 (7.9) . Beispiel Wir betrachten die Kurvenschar der Flugbahnen eines mit der Anfangsgeschwindigkeit v0 aus dem Ursprung schräg nach oben “geschossenen” Massenpunktes im Erdanziehungsfeld. Ist α der Abschusswinkel, so ist die Bahn des Massenpunktes gegeben durch ( t → x(t) = v0 cos α · t y(t) = v0 sin α · t − 1 2 gt2 . (y) Fig. 2 : Die Enveloppe der Wurfparabeln (x) Setzen wir h = g/2v02 , so liefert die Elimination von t die “Flugparabel” (7.10) F (x, y, α) := y − x tan α + h x2 = 0 . cos2 α 60 U. Stammbach: Analysis, Teil C Dies ist die Schar von Kurven, die wir in diesem Beispiel betrachten wollen; Scharparameter ist α. Für die Bestimmung der Enveloppen benötigen wir die Gleichung Fα (x, y, α) = 0 . Es gilt (7.11) Fα (x, y, α) = − x 2h + (sin α) x2 = 0 . 2 cos α cos3 α Aus (8.11) folgt tan α = 1 2hx q und Einsetzen in (8.10) liefert wegen cos α = 2hx/ 1 + (2hx)2 y = (7.12) 1 − h x2 . 4h Wir stellen die interessante Tatsache fest, dass die Enveloppe der Flugparabeln wieder eine Parabel ist (siehe Figur 2). Sie umgrenzt den Bereich, der mit der Anfangsgeschwindigkeit v0 überhaupt erreichbar ist. Schliesslich spezialisieren wir unsere Betrachtungen auf Kurvenscharen, welche aus Geraden bestehen. Wählt man als Parameter C der Schar gerade die Steigung der Geraden, so stellt sich eine solche Schar durch eine Gleichung der Form y = C · x + g(C) (7.13) dar, wo g : C → g(C) eine Funktion von C ist. Berechnet man die Enveloppe einer solchen Schar, so erhält man F (x, y, C) := −y + Cx + g(C) = 0 FC (x, y, C) = x + g0 (C) = 0 und damit die folgende Parameterdarstellung der Enveloppe ( (7.14) x = −g0 (C) y = −Cg0 (C) + g(C) . 61 Kapitel VII. Differentialgleichungen Um die Differentialgleichung der Schar (8.13) zu erhalten, berechnet man zunächst die totale Ableitung der Gleichung (8.13) nach x, y0 = C , (7.15) und eliminiert dann C aus (8.13) und (8.15). Man erhält y = y 0 x + g(y 0 ) . (7.16) Eine Differentialgleichung der Form (8.16) heisst Clairaut’sche Differentialgleichung. Zahlreiche geometrische Probleme, in denen Tangenten eine Rolle spielen, führen auf Differentialgleichungen von diesem Typ. Wir halten noch explizit fest: Die Lösungen von (8.16) sind die Geraden (8.13), – sie bilden die allgemeine Lösung der Differentialgleichung – und die Enveloppe (8.14) dieser Geradenschar – sie ist die singuläre Lösung der Differentialgleichung. Beispiel Gesucht sind die Kurven, die die Eigenschaft haben, dass ihre Tangenten zusammen mit den Koordinatenachsen im 1. Quadranten ein Dreieck mit Flächeninhalt F bilden (siehe Figur 3). Die Kurve sei als Graph der Funktion x → y(x) gegeben. Die Tangente im Punkte (x, y) stellt sich dann durch (η − y) = y 0 (x)(ξ − x) dar. Die Abschnitte auf den Koordinatenachsen sind − y + x y0 − y0x + y . und Für die Fläche F des Dreiecks erhält man also 2F = x− y (y − y 0 x) , y0 und damit ergibt sich, da beim Wurzelziehen gemäss Aufgabenstellung nur das positive Vorzeichen zu berücksichtigen ist, (7.17) y = y0x + p −2F y 0 . 62 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Dreieck, das von der Tangenten an die Kurve und den Koordinatenachsen gebildet wird F (x) (y) Fig. 4 : Die Geradenschar √ y = Cx + −2F C (Die Enveloppe ist sichtbar, obschon sie nicht eingezeichnet ist!) (x) 63 Kapitel VII. Differentialgleichungen Dies ist eine Clairaut’sche Differentialgleichung. Ihre allgemeine Lösung besteht aus der Schar der Geraden (7.18) √ y = Cx + −2F C . Daneben besitzt sie eine – interessantere – singuläre Lösung, die durch die Enveloppe der Geradenschar gegeben ist. Sie wird erhalten, indem man aus (8.18) und der partiellen Ableitung von (8.18) nach C (7.19) 0 = x + 1 1 √ (−2F ) 2 −2F C den Parameter C eliminiert. Aus (8.19) erhält man √ F , x F C = − 2 . 2x −2F C = Einsetzen in (8.18) liefert dann (7.20) y = 1F . 2x Es stellt sich heraus, dass neben der Geraden (8.18) auch die Hyperbel (8.20), genauer deren positiver Ast, die verlangten geometrischen Eigenschaften hat (siehe Figur 4). 64 8 U. Stammbach: Analysis, Teil C Differentialgleichungen höherer Ordnung, allgemeines Eine Differentialgleichung n-ter Ordnung für die Funktion y : x → y(x) ist eine Gleichung (8.1) F (x, y, y 0 , y 00 , . . . , y (n) ) = 0. Analog wie bei Differentialgleichungen 1. Ordnung nehmen wir an (vgl. (3.1) ), dass sich (9.1) nach y (n) auflösen lässt: (8.2) y (n) = f (x, y, y 0 , . . . , y (n−1) ) . In dieser Form wollen wir Differentialgleichungen n-ter Ordnung diskutieren. Betrachten wir zuerst ein ganz einfaches Beispiel. Beispiel Es sei die Differentialgleichung 2. Ordnung y 00 = a (8.3) für die Funktion x → y(x) gegeben; a ∈ R sei eine Konstante. Offensichtlich sind die Lösungsfunktionen von (9.3) von der Form x → y(x) = a 2 x + C1 x + C 2 , 2 wo C1 , C2 beliebige reelle Konstanten sind. Die Lösungskurven sind Parabeln, welche von den zwei Parametern C1 , C2 abhängen. Die allgemeine Lösung von (9.3) ist eine 2-parametrige Kurvenschar. Ist zusätzlich zu (9.3) noch die Anfangsbedingung (8.4) y(x0 ) = y0 . 65 Kapitel VII. Differentialgleichungen gegeben, so führt dies auf die Gleichung a 2 x + C 1 x0 + C 2 = y 0 . 2 0 (8.5) Natürlich genügt diese einzige Gleichung nicht zur Festlegung der speziellen Lösung, d.h. zur Bestimmung von C1 und C2 . Dafür muss eine zweite Anfangsbedingung hinzutreten. In vielen Fällen, aber durchaus nicht immer, ist sie von der Form (1) y 0 (x0 ) = y0 (8.6) . d.h. es wird an der Stelle x0 zusätzlich noch die Steigung der Kurve vorgeschrieben. Diese Anfangsbedingung führt auf die Gleichung (1) ax0 + C1 = y0 . (8.7) Die Gleichungen (9.5) , (9.7) lassen sich nun leicht nach C1 und C2 auflösen; zusammen bestimmen sie offenbar beide Parameter und damit die spezielle Lösung der Differentialgleichung (9.3) eindeutig. (1) Wir fassen zusammen: Zu jeder Wahl von y0 , y0 gibt es eine eindeutig bestimmte Funktion x → y(x), welche die Differentialgleichung (9.3) und die zwei Anfangsbedingungen (9.4) und (9.6) erfüllt. Damit haben wir den folgenden allgemeinen Satz illustriert, der eine direkte Verallgemeinerung unseres Satzes 3.1 über die allgemeine Lösung von Differentialgleichungen 1. Ordnung ist. Satz 8.1 Es sei die Differentialgleichung n-ter Ordnung (8.8) y (n) = f (x, y, y 0 , . . . , y (n−1) ) gegeben. Die Funktion f (von n + 1 Variablen) sei stetig in x und nach y, y 0 , . . . , y (n−1) stetig (0) (1) (n−1) partiell differenzierbar. Dann gibt es zu vorgegebenen x0 , y0 , y0 ,. . . , y0 eine eindeutig bestimmte, in einem Intervall mit Mittelpunkt x0 definierte Funktion y : x → y(x), welche Lösung der Differentialgleichung (9.8) ist und die (Anfangs-)Bedingungen (8.9) erfüllt. (0) (1) (n−1) y(x0 ) = y0 , y 0 (x0 ) = y0 , . . . , y (n−1) (x0 ) = y0 66 U. Stammbach: Analysis, Teil C Natürlich verzichten wir in dieser Vorlesung auf den Beweis dieses Satzes. Wie der Satz 3.1 für Differentialgleichungen 1. Ordnung, so bildet Satz 8.1 die Grundlage für das, was im Folgenden über die Lösungen von Differentialgleichungen höherer (n-ter) Ordnung gesagt wird. Betrachten wir zuerst die allgemeine Lösung von (9.8), d.h. die Schar aller Lösungskurven. Geben wir uns x0 vor, so besagt unser Satz, dass es zu jeder Wahl der Grössen (0) (1) (n−1) y0 , y0 , . . . , y0 genau eine Lösungskurve von (9.8) gibt, welche die n Gleichungen (9.9) befriedigt. Die erste (0) (1) dieser Gleichungen, y(x0 ) = y0 legt einen Punkt (x0 , y0 ) der Kurve fest, die zweite y 0 (x0 ) = y0 (2) die Steigung der Kurve in diesem Punkt, die dritte y 00 (x0 ) = y0 die 2. Ableitung der Funktion, also im wesentlichen die Krümmung der Kurve in diesem Punkt, usw. Die allgemeine Lösung der Differentialgleichung (9.8) n-ter Ordnung ist also eine (wie man sagt reguläre) n-parametrige Kurvenschar. Analog wie im Fall der Differentialgleichungen 1. Ordnung heisst regulär hier, dass (0) (1) (n−1) die Gleichungen (9.9) bei jeder Wahl der Grössen x0 , y0 , y0 , . . . ,y0 von genau einer Kurve der Schar erfüllt werden. Umgekehrt kann man natürlich fragen, ob es zu einer gegebenen (regulären) n-parametrigen Kurvenschar eine Differentialgleichung n-ter Ordnung gibt, welche gerade diese Schar als allgemeine Lösung besitzt. Unter sehr allgemeinen Bedingungen, auf die wir hier nicht weiter eingehen wollen, ist dies tatsächlich der Fall. Wir illustrieren den Sachverhalt an zwei Beispielen. Beispiel (8.10) Wir betrachten die 2-parametrige Schar y(x) = C1 cos(ωx) + C2 sin(ωx) , ω 6= 0 mit den Parametern C1 , C2 . Wir wollen zuerst zeigen, dass diese Schar regulär ist. Dazu müssen (0) (1) wir nachweisen, dass zu beliebig vorgegebenen Zahlen x0 , y0 , y0 genau eine Wahl von C1 und (0) (1) C2 existiert, so dass die Gleichungen y(x0 ) = y0 , y 0 (x0 ) = y0 erfüllt sind. Dieses führt auf das folgende Gleichungssystem für C1 und C2 (0) (8.11) C1 cos(ωx0 ) + C2 sin(ωx0 ) = y0 (1) −C1 ω sin(ωx0 ) + C2 ω cos(ωx0 ) = y0 . Nach der Theorie der linearen Gleichungssysteme (siehe “Lineare Algebra”) hat das System (0) (1) (9.11) für beliebige Wahl der Grössen y0 , y0 eine eindeutig bestimmte Lösung (für C1 , C2 ), wenn die Determinante der Matrix des Systems nicht Null ist. In unserem Fall gilt 67 Kapitel VII. Differentialgleichungen " det cos(ωx0 ) sin(ωx0 ) −ω sin(ωx0 ) ω cos(ωx0 ) # = ω 6= 0 . Damit ist nachgewiesen, dass die Schar (9.10) regulär ist. (Man beachte, dass lineare Gleichungssysteme mit nicht verschwindender Determinante gewöhnlich “regulär” genannt werden. Das steht in Übereinstimmung mit unserer Wahl des Wortes “regulär” für die Kurvenscharen, mit denen wir es hier zu tun haben.) Nach unserer Aussage sollte somit die 2-parametrige Schar (9.10) allgemeine Lösung einer Differentialgleichung 2. Ordnung sein. Diese erhalten wir wie folgt. Wir leiten die Schargleichung 2-mal nach x ab (8.12) y 0 (x) = −ωC1 sin(ωx) + ωC2 cos(ωx) , (8.13) y 00 (x) = −ω 2 C1 cos(ωx) − ω 2 C2 sin(ωx) und eliminieren die Scharparameter C1 , C2 aus den 3 Gleichungen (9.10), (9.12), (9.13). Im vorliegenden Fall ist das einfach dadurch zu bewerkstelligen, dass (9.10) mit ω 2 multipliziert und zu (9.13) addiert wird. Wir erhalten (8.14) y 00 + ω 2 y = 0 . Dies ist offensichtlich die Differentialgleichung der Kurvenschar (9.10). Beispiel (8.15) In unserem zweiten Beispiel sei die 3-parametrige Kurvenschar y(x) = C1 cos(C3 x) + C2 sin(C3 x) gegeben. Wir betrachten also nicht nur harmonische Schwingungen zu einer festen Frequenz ω wie im obigen Beispiel, sondern zu beliebigen Kreisfrequenzen. Da wir hier drei Parameter haben, wird die zugehörige Differentialgleichung von 3. Ordnung sein. Durch Ableitung nach x erhalten wir (8.16) y 0 = −C3 C1 sin(C3 x) + C3 C2 cos(C3 x) , (8.17) y 00 = −C32 C1 cos(C3 x) − C32 C2 sin(C3 x) , 68 (8.18) U. Stammbach: Analysis, Teil C y 000 = C33 C1 sin(C3 x) − C33 C2 cos(C3 x) . Aus den Gleichungen (9.15), (9.16), (9.17) und (9.18) sind nun die Parameter C1 , C2 , C3 zu eliminieren. Division von (9.18) durch (9.16) liefert y 000 = −C32 . y0 Ferner ergibt sich, wie oben, aus (9.15) und (9.17) die Gleichung y 00 + C32 y = 0 . Als Differentialgleichung der Schar (9.15) erhalten wir somit (8.19) y 0 y 00 − y 000 y = 0 ; natürlich ist sie 3. Ordnung, wie wir vorausgesehen haben. Wir haben hier bereits eine ganze Reihe von allgemeinen Aussagen über das Lösungsverhalten von Differentialgleichungen höherer Ordnung kennengelernt. Versucht man in konkreten Fällen die allgemeine Lösung zu beschreiben, so merkt man bald, dass dies ein schwieriges Unterfangen ist. In der Tat ist es nur selten überhaupt möglich, die allgemeine Lösung in geschlossener Form hinzuschreiben. Man ist hier in noch grösseren Massen als bei Differentialgleichungen 1. Ordnung auf numerische Methoden angewiesen, wobei gleichzeitig darauf hingewiesen werden muss, dass erst die allgemeine Aussage über das Lösungsverhalten diese numerischen Verfahren überhaupt ermöglichen. Glücklicherweise zeigt sich ausserdem, dass viele der in einfachen Anwendungen auftretenden Differentialgleichungen höherer Ordnung zu den “seltenen Ausnahmen” gehören und explizit in geschlossener Form lösbar sind. Mit diesen wollen wir uns in den nächsten Abschnitten vornehmlich befassen. Hier fügen wir noch ein einfaches Anwendungsbeispiel an. Beispiel Wir betrachten einen prismatischen Balken der Länge l welcher links eingespannt und rechts frei ist (siehe Figur 1). Die Lage des Balkens, die sogenannte Biegelinie, sei durch die Funktion x → y(x) beschrieben. Man lernt in der Mechanik, dass zwischen dem Biegemoment M (x) im Balkenquerschnitt an der Stelle x und der Krümmung k(x) der Biegelinie an der Stelle x die folgende Beziehung besteht (8.20) M (x) = EJk(x) . Kapitel VII. Differentialgleichungen 69 (y) P Fig. 1 : Biegelinie eines horizontal eingespannten Balkens (x) l Dabei ist E der Elastizitätsmodul des Balkens und J das axiale Trägheitsmoment eines Querschnittes des Balkens bezüglich einer horizontalen Achse durch den Schwerpunkt des Querschnittes. Die Krümmung ist gegeben durch (8.21) k(x) = y ′′ 3 (1 + y ′2 ) 2 . Daraus folgt (8.22) y ′′ (1 + y ′2 ) 3 2 = M (x) . EJ Dies ist bei gegebener Beanspruchung, d.h. wenn M (x) bekannt ist, eine Differentialgleichung für die Biegelinie des Balkens. Die “Anfangs”-Bedingungen sind offensichtlich (8.23) y(0) = 0 , y ′ (0) = 0 , sie sind also von der Art, wie wir sie in Satz 8.1 betrachtet haben. Die Differentialgleichung (8.22) ist wegen des Auftretens einer Wurzel mit y ′ im Radikanden kompliziert. Man sieht aber 70 U. Stammbach: Analysis, Teil C sofort, dass für die betrachtete Anwendung die Steigung der Biegelinie des Balkens immer sehr klein sein wird. Es gilt deshalb näherungsweise 1 + y 02 ∼ 1 . (8.24) Es ergibt sich dann die Differentialgleichung der Biegelinie eines Balkens (siehe M.B. Sayir: Mechanik 2, p. 107) M (x) . EJ y 00 = (8.25) Betrachten wir noch die spezielle Situation, wo der Balken an der Stelle l durch eine Einzellast P belastet wird. Ist P gegenüber dem Eigengewicht des Balkens gross, so darf letzteres vernachlässigt werden. Wir erhalten dann M (x) = −(l − x)P und damit die Differentialgleichung y 00 = − (8.26) (l − x)P . EJ Diese einfache Differentialgleichung lässt sich durch zweimalige Integration direkt lösen. Man hat y 0 (x) = y(x) = P 1 (−lx + x2 + C1 ) , EJ 2 P 1 l (− x2 + x3 + C1 x + C2 ) . EJ 2 6 Einsetzen der Anfangsbedingungen (9.23) liefert C1 = 0, C2 = 0, so dass die Biegelinie des Balkens durch y(x) = P EJ l 1 − x2 + x3 2 6 gegeben ist; insbesondere ist die Auslenkung an der Stelle x = l gegeben durch 71 Kapitel VII. Differentialgleichungen y(l) = − P l3 . EJ 3 Wir haben in unserem Beispiel eine komplizierte Differentialgleichung (9.22) vereinfacht, indem wir die Näherung (9.24) verwendet haben. Dies ist eine vielgeübte Praxis, die uns bereits bekannt ist und darin besteht, dass man eine komplizierte Funktion durch ihre lineare Ersatzfunktion ersetzt. In der Tat haben wir die Funktion 3 y 0 → (1 + y 02 ) 2 = g(y 0 ) in der Nähe des Punktes y 0 = 0 durch ihre lineare Ersatzfunktion ersetzt: 3 (1 + y 02 ) 2 ∼ g(0) + g0 (0)y 0 = 1 + 0 , denn g0 (0) = 0. Wir werden weiter unten noch mehrere ähnliche Beispiele kennenlernen. Die Frage, “ob man das darf”, d.h. ob die Lösungen der vereinfachten Differentialgleichungen dann auch Näherungen für die Lösungen der ursprünglichen Differentialgleichung sind, haben wir mit gutem Grund hier nicht diskutiert. Sie führt auf heikle und schwierig zu behandelnde mathematische Fragen (vgl. Burg, Haf, Wille III, S.72 ff.). Betrachtet man an Stelle des links eingespannten Balkens den beidseitig aufgelegten Balken, so nehmen die zusätzlichen Bedingungen eine andere Form an. Sie lauten dann nämlich (8.27) y(0) = 0 = y(l) , es sind somit “Randbedingungen” vorgegeben. Die Existenz und die Eindeutigkeit der Lösung von (9.25), welche (9.27) erfüllt, folgen in dieser Situation nicht mehr aus unserem allgemeinen Satz 8.1; sie müssen gesondert diskutiert werden. Zum Abschluss dieses Abschnittes weisen wir noch darauf hin, dass ein enger Zusammenhang zwischen Differentialgleichungen höherer Ordnung und Systemen von Differentialgleichungen 1. Ordnung besteht. Dazu werden wir weiter unten noch einiges zu sagen haben. 72 9 U. Stammbach: Analysis, Teil C Lineare Differentialgleichungen höherer Ordnung Die bei weitem wichtigste Klasse von Differentialgleichungen höherer Ordnung wird von den linearen gebildet. Mit diesen werden wir uns in den Abschnitten 9, 10, 11 beschäftigen. Die Differentialgleichung n-ter Ordnung (9.1) y (n) = f (x, y, y 0 , y 00 , . . . , y (n−1) ) heisst linear, wenn die Funktion f bezüglich der Variablen y,y 0 ,. . . ,y (n−1) linear ist. Die Gleichung (10.1) lässt sich in diesem Fall in der Form (9.2) y (n) + pn−1 (x) y (n−1) + · · · + p0 (x) y = q(x) schreiben. Man beachte, dass über die hier auftretenden Funktionen pn−1 , pn−2 ,. . . , p0 , q keine zusätzlichen Voraussetzungen getroffen werden; es sind beliebige stetige Funktionen. Für n = 1 ist (10.2) eine lineare Differentialgleichung 1. Ordnung. Ähnlich wie in Abschnitt 5 führen wir die folgende Ausdrucksweise ein. Die Differentialgleichung (10.2) heisst homogen, wenn q(x) ≡ 0 gilt, andernfalls heisst sie inhomogen. In diesem Fall heisst q(x) das inhomogene Glied oder Störglied. Die Differentialgleichung (9.3) y (n) + pn−1 (x) y (n−1) + · · · + p0 (x) y = 0 heisst die zu (10.2) gehörige homogene Differentialgleichung. Im Folgenden wollen wir uns mit den Lösungen der homogenen Differentialgleichung (10.3) beschäftigen und mit dem Zusammenhang zwischen den Lösungen der inhomogenen Differentialgleichung (10.2) und denjenigen der zugehörigen homogenen Differentialgleichung. Die Resultate sind analog zu den Resultaten für lineare Differentialgleichungen 1. Ordnung, die wir in Abschnitt 5 behandelt haben. (a) Homogene lineare Differentialgleichungen Wir beginnen mit dem folgenden 73 Kapitel VII. Differentialgleichungen Satz 9.1 Es seien x → y1 (x), x → y2 (x), . . . , x → yk (x) Lösungen der homogenen linearen Differentialgleichung (10.3). Dann ist für jede Wahl von C1 , C2 , . . . , Ck ∈ R die Funktion x → y(x) = C1 y1 (x) + C2 y2 (x) + · · · + Ck yk (x) (9.4) eine Lösung der Differentialgleichung (10.3). Der Beweis ergibt sich sofort durch Einsetzen. Man mache sich klar, dass die im Satz ausgesprochene Eigenschaft der Lösungen für nicht lineare und auch für inhomogene lineare Differentialgleichungen nicht erfüllt ist. In der Tat ist sie für homogene lineare Differentialgleichungen charakteristisch. In der linearen Algebra nennt man die durch (10.4) gegebene Funktion x → y(x) eine (reelle) Linearkombination der Funktionen y1 , y2 , . . . , yk . Der Satz 9.1 lässt sich also in Kurzform wie folgt aussprechen: Für eine homogene lineare Differentialgleichung ist jede Linearkombination von Lösungen wiederum eine Lösung. Beispiel Es sei die offensichtlich lineare homogene Differentialgleichung (9.5) y 00 + 2y 0 + y = 0 gegeben. Man verifiziert leicht, dass die durch y1 (x) = e−x , y2 (x) = xe−x gegebene Funktionen Lösungen sind. Nach Satz 9.1 ist dann jede Funktion der Form (9.6) x → y(x) = C1 e−x + C2 xe−x , C1 , C2 ∈ R wiederum eine Lösung. Sucht man die spezielle Lösung, welche zu den Anfangsbedingungen y(0) = 1, y 0 (0) = 2 gehört, so erhält man wegen y 0 (x) = −C1 e−x + C2 e−x − C2 xe−x das Gleichungssystem 74 U. Stammbach: Analysis, Teil C C1 = 1 −C1 + C2 = 2 . Die gesuchte spezielle Lösung ergibt sich also zu (y) e−x + 3xe−x Fig. 1 : Die spezielle Lösung x → y(x) der Differentialgleichung y 00 + 2y 0 + y = 0 mit y(0) = 1 und y 0 (0) = 2 als Linearkombination der Funktionen y1 (x) = e−x und y2 (x) = xe−x e−x xe−x (x) y(x) = e−x + 3xe−x . (siehe Figur 1). Man überzeugt sich leicht, dass sich durch (10.6) jede Anfangsbedingung der (0) (1) Form y(x0 ) = y0 , y 0 (x0 ) = y0 auf eindeutige Art befriedigen lässt. Es handelt sich also bei (10.6) um die allgemeine Lösung der Differentialgleichung (10.5). Dies illustriert unseren Satz 9.2. Um ihn zu formulieren erinnern wir an die folgende, aus der linearen Algebra stammende Sprechweise. Die Funktionen x → y1 (x), x → y2 (x),. . . , x → yk (x) heissen linear unabhängig, wenn aus (9.7) k X i=1 Ci yi (x) ≡ 0 , Ci ∈ R 75 Kapitel VII. Differentialgleichungen stets folgt Ci = 0 für i = 1, 2, . . . , k, d.h. wenn sich die Nullfunktion nur in trivialer Weise als Linearkombination darstellen lässt. Satz 9.2 Es seien x → y1 (x), x → y2 (x),. . . , x → yn (x) linear unabhängige Lösungen der Differentialgleichung (10.3). Dann ist die n-parametrige Schar y(x) = C1 y1 (x) + C2 y2 (x) + · · · + Cn yn (x) , Ci ∈ R (9.8) die allgemeine Lösung der Differentialgleichung (10.3). Beweis Es ist zu zeigen, dass durch geeignete Wahl der Konstanten C1 , C2 , . . . , Cn jede Anfangsbedingung der Form (0) (1) (n−1) y(x0 ) = y0 , y 0 (x0 ) = y0 , . . . , y (n−1) (x0 ) = y0 (9.9) erfüllt werden kann. Dazu benötigen wir etwas lineare Algebra, sowie unseren Satz 8.1. Die Bedingung (10.9) liefert für C1 , C2 , . . . , Cn das Gleichungssystem (9.10) C1 y1 (x0 ) C1 y10 (x0 ) .. . (n−1) C1 y1 + + C2 y2 (x0 ) C2 y20 (x0 ) .. . (n−1) (x0 ) + C2 y2 +···+ +···+ Cn yn (x0 ) Cn yn0 (x0 ) .. . (n−1) (x0 ) + · · · + Cn yn = = (0) y0 (1) y0 .. . . (n−1) (x0 ) = y0 Aus der linearen Algebra weiss man, dass das inhomogene Gleichungssystem (10.10) genau (0) (1) (n−1) dann für beliebige y0 , y0 , . . . , y0 eine Lösung besitzt, wenn das zugehörige homogene Gleichungssystem nur die triviale Lösung C1 = C2 = · · · = Cn = 0 zulässt. Das zu (10.10) gehörige homogene Gleichungssystem wird offensichtlich einfach dadurch erhalten, dass man die Anfangsbedingung (9.11) y(x0 ) = y 0 (x0 ) = · · · = y (n−1) (x0 ) = 0 studiert. Wir müssen also zeigen, dass diese Anfangsbedingung nur durch die triviale Wahl C1 = C2 = · · · = Cn = 0 erfüllt wird. Da nach der Eindeutigkeitsaussage in unserem Satz 8.1 die Lösung durch die Anfangsbedingung eindeutig bestimmt wird, sehen wir, dass die Nullfunktion y(x) ≡ 0, die Lösung von (10.3) ist, U. Stammbach: Analysis, Teil C 76 welche die Anfangsbedingung (9.11) erfüllt. Die Konstanten C1 , C2 , . . . , Cn müssen somit so gewählt werden, dass C1 y1 (x) + C2 y2 (x) + · · · + Cn yn (x) ≡ 0 gilt. Wegen der linearen Unabhängigkeit der Funktionen y1 , y2 , . . . , yn folgt dann mit (9.7) in der Tat C1 = C2 = · · · = Cn = 0. Dies war zu beweisen. Beispiel Es sei die Differentialgleichung y ′′ + x 1 y′ − y = 0 1−x 1−x gegeben. Diese ist linear mit p1 (x) = x/(1 − x) und p0 (x) = −1/(1 − x) und ausserdem homogen. Man verifiziert leicht, dass die Funktionen x → y1 (x) = x, x → y2 (x) = ex Lösungen sind. Nach Satz 9.1 ist somit jede Linearkombination (9.12) x → y(x) = C1 x + C2 ex , C1 , C2 ∈ R wiederum eine Lösung. Da y1 und y2 linear unabhängig sind (warum?), folgt aus Satz 9.2, dass die durch (9.12) gegebene Kurvenschar die allgemeine Lösung ist. Zum Abschluss dieses Textabschnittes muss hier noch folgendes gesagt werden. Im Fall von homogenen linearen Differentialgleichung 1. Ordnung lässt sich die allgemeine Lösung bekanntlich auf einfache Art durch Separieren erhalten (siehe Abschnitt 5). Dies ist bei homogenen linearen Differentialgleichungen höherer Ordnung anders. Auch wenn unser Satz 9.2 die Form der allgemeinen Lösung angibt, so lassen sich doch die linear unabhängigen Lösungsfunktionen in vielen konkreten Fällen nicht elementar beschreiben. Es lässt sich zum Beispiel zeigen, dass die allgemeine Lösung der einfachen Differentialgleichung y ′′ +xy = 0 nicht in elementarer Form dargestellt werden kann. Hier, wie an so vielen Stellen der Theorie der Differentialgleichungen ist man auf andere Verfahren angewiesen, insbesondere auf solche numerischer Art. Im Abschnitt 10 werden wir allerdings zwei wichtige Klassen von höheren linearen Differentialgleichungen kennen lernen, bei denen sich die allgemeine Lösung explizit hinschreiben lässt. Unser Satz 9.2 wird dabei eine wichtige Rolle spielen. Hier, im Rest dieses vorliegenden Abschnittes wollen wir uns noch mit dem Fall der inhomogenene linearen Differentialgleichungen auseinandersetzen. (b) Inhomogene lineare Differentialgleichungen Im Abschnitt 5 haben wir gesehen, dass sich die allgemeine Lösung einer inhomogenen linearen Differentialgleichung 1. Ordnung als Superposition einer partikulären Lösung der inhomogenen 77 Kapitel VII. Differentialgleichungen Differentialgleichung und der allgemeinen Lösung der zugehörigen homogenen Differentialgleichung darstellen lässt. Die zu diesem Resultat führenden Behauptungen A und B im Abschnitt 5 gelten offensichtlich auch für inhomogene lineare Differentialgleichungen höherer Ordnung. Dies stellt man sofort fest, indem man den Beweis der Behauptungen A und B auf diesen Fall überträgt. Damit gilt auch hier: Man erhält die allgemeine Lösung der linearen Differentialgleichung (10.2) indem man eine partikuläre Lösung y0 : x → y0 (x) nimmt und zu ihr die allgemeine Lösung der zugehörigen homogenen Differentialgleichung (10.3) addiert. Ist die allgemeine Lösung der homogenen Differentialgleichung (10.3) bekannt, so ist die Aufgabe auf das Problem reduziert, eine partikuläre Lösung der inhomogenen Differentialgleichung (10.2) zu bestimmen. Oft lässt sich diese partikuläre Lösung auf einfache Weise durch einen geschickt gewählten Ansatz finden. Wie im Falle von linearen Differentialgleichungen 1. Ordnung versuche man zuerst immer einen Ansatz in der Form des Störgliedes. Beispiel (9.13) Die Differentialgleichung y 00 + 2y 0 + y = sin(3x) sei gegeben. Gesucht ist die Lösung, welche die Anfangsbedingung y(0) = y 0 (0) = 0 befriedigt. Nach (10.6) hat die zugehörige homogene Differentialgleichung die allgemeine Lösung x → C1 e−x + C2 xe−x , C1 , C2 ∈ R. Um eine partikuläre Lösung von (10.13) zu erhalten, machen wir den Ansatz y0 : x → A cos(3x) + B sin(3x) , also eine harmonische Schwingung derselben Kreisfrequenz wie das Störglied. Einsetzen in (10.13) liefert für die Grössen A, B das Gleichungssystem −8A + 6B = 0 −6A − 8B = 1 . 78 U. Stammbach: Analysis, Teil C 3 2 Daraus erhält man A = − 50 , B = − 25 . Die Funktion y0 : x → − 3 2 cos(3x) − sin(3x) 50 25 ist somit Lösung der inhomogenen Differentialgleichung (10.13). Die allgemeine Lösung lautet demzufolge (y) y(x) Fig. 2 : Die partikuläre Lösung y0 (x) = − (x) 3 2 cos(3x)− sin(3x) 50 25 der Differentialgleichung y 00 + 2y 0 + y = sin(3x) und die spezielle Lösung x → y(x) mit y(0) = 0 und y 0 (0) = 0 y0 (x) y : x → C1 e−x + C2 xe−x − 3 2 cos(3x) − sin(3x) , C1 , C2 ∈ R . 50 25 Die Anfangsbedingungen – diese kommt erst jetzt zum Zug – bestimmen schliesslich die Kon3 3 stanten C1 , C2 ; man erhält C1 = 50 , C2 = 10 . Die gesuchte spezielle Lösung lautet somit (siehe Figur 2) (9.14) y: x→ 3 −x 3 3 2 e + xe−x − cos(3x) − sin(3x) . 50 10 50 25 Kapitel VII. Differentialgleichungen 79 Nicht immer lässt sich allerdings eine partikuläre Lösung der inhomogenen Differentialgleichung (10.2) durch einen einfachen Ansatz gewinnen. Zum Beispiel führt unsere Faustregel bei der einfachen Differentialgleichung y 00 + ω 2 y = P cos(ωx) (9.15) nicht zum Ziel, denn jede harmonische Schwingung der Kreisfrequenz ω ist ja eine Lösung der zugehörigen homogenen Differentialgleichung. In solchen Fällen muss das kompliziertere Verfahren von Lagrange (J. L. Lagrange 1736 - 1813) angewendet werden. Wir erklären dieses im Falle von inhomogenen linearen Differentialgleichungen 2. Ordnung. Analoges gilt für lineare Differentialgleichungen höherer Ordnung. Es sei die Differentialgleichung (9.16) y 00 + p1 (x)y 0 + p0 (x)y = q(x) gegeben. Die allgemeine Lösung der zugehörigen homogenen Differentialgleichung sei x → C1 y1 (x) + C2 y2 (x) , C1 , C2 ∈ R . Um eine partikuläre Lösung der Differentialgleichung (10.16) zu erhalten, macht man im Verfahren von Lagrange den Ansatz (9.17) y0 (x) = γ1 (x) y1 (x) + γ2 (x) y2 (x) mit noch zu bestimmenden Funktionen γ1 , γ2 . Man beachte, dass sich jede beliebige Funktion in der Form (10.17) schreiben lässt. Der Ansatz in dieser Form ist deshalb günstig, weil er erlaubt, die Funktionen γ1 , γ2 , zu bestimmen, und zwar sogar dann – und das ist der Witz des Ansatzes – wenn wir die zusätzliche Annahme (9.18) γ10 (x) y1 (x) + γ20 (x) y2 (x) ≡ 0 treffen. Diese Annahme macht, dass sich die Ableitung von y0 besonders einfach darstellen lässt. Es gilt mit (10.18) y00 = γ10 y1 + γ1 y10 + γ20 y2 + γ2 y20 = γ1 y10 + γ2 y20 y000 = γ10 y10 + γ1 y100 + γ20 y20 + γ2 y200 80 U. Stammbach: Analysis, Teil C Einsetzen in (10.16) liefert dann (9.19) γ10 y10 + γ1 y100 + γ20 y20 + γ2 y200 + p1 (x) γ1 y10 + γ2 y20 + p0 (x) (γ1 y1 + γ2 y2 ) = q(x) . Da y1 und y2 Lösungen der zu (10.16) gehörigen homogenen Differentialgleichung sind, reduziert sich (10.19) auf (9.20) γ10 (x)y10 (x) + γ20 (x)y20 (x) = q(x) . Aus den Gleichungen (10.18) und (10.20) lassen sich die unbekannten Funktionen γ10 , γ20 gewinnen; einfache Integration liefert dann γ1 , γ2 . Als explizites Beispiel für die Lagrange’schen Methode behandeln wir das folgende Beispiel. Beispiel Die inhomogene lineare Differentialgleichung 2. Ordnung y 00 + ω 2 y = P cos(ωx) (9.21) sei gegeben. Die zugehörige homogene lineare Differentialgleichung y 00 + ω 2 y = 0 hat als allgemeine Lösung (9.22) x → C1 cos(ωx) + C2 sin(ωx) , C1 , C2 ∈ R . Für die partikuläre Lösung der inhomogenen Differentialgleichung (10.21) machen wir nach Lagrange den Ansatz (9.23) y0 (x) = γ1 (x) cos(ωx) + γ2 (x) sin(ωx) , wobei wir als zusätzliche Annahme (9.24) γ10 (x) cos(ωx) + γ20 (x) sin(ωx) = 0 verwenden. Einsetzen von (10.23) in (10.21) liefert nach einigen Rechnungen (9.25) −γ10 (x) ω sin(ωx) + γ20 (x) ω cos(ωx) = P cos(ωx) . 81 Kapitel VII. Differentialgleichungen Aus den Gleichungen (10.24) und (10.25) ergibt sich γ10 (x) = γ20 (x) = − P cos(ωx) sin(ωx) ω P cos2 (ωx) . ω Integration liefert dann P sin2 (ωx) 2ω 2 γ1 (x) = − γ2 (x) = P (sin(ωx) cos(ωx) + ωx) . 2ω 2 (Auf die Integrationskonstanten kann verzichtet werden, da wir nur eine partikuläre Lösung im (y) Fig. 3 : Die partikuläre Lösung (x) x→ P x sin(ωx) 2ω der Differentialgleichung y 00 + ω 2 y = P cos(ωx) Auge haben.) Es ergibt sich aus (10.23) y0 (x) = − = P P sin2 (ωx) cos(ωx) + 2 (sin2 (ωx) cos(ωx) + ωx sin(ωx)) 2 2ω 2ω P x sin(ωx) . 2ω 82 U. Stammbach: Analysis, Teil C Damit lässt sich die allgemeine Lösung von (10.21) in der Form (9.26) y(x) = (C1 cos(ωx) + C2 sin(ωx)) + P x sin (ωx) , C1 , C2 ∈ R 2ω schreiben. Neben der harmonischen Schwingung mit Kreisfrequenz ω enthält sie einen Term mit einer linear zunehmenden Amplitude (siehe Figur 3). 83 Kapitel VII. Differentialgleichungen 10 Zwei Klassen von leicht lösbaren linearen Differentialgleichungen In diesem Abschnitt beschäftigen wir uns mit zwei Klassen von homogenen linearen Differentialgleichungen, welche in Anwendungenen häufig auftreten und deren allgemeine Lösung leicht mit Hilfe eines Ansatzes gewonnen werden kann. (a) Homogene lineare Differentialgleichungen mit konstanten Koeffizienten Es sei die Differentialgleichung y (n) + an−1 y (n−1) + · · · + a0 y = 0 (10.1) gegeben, wo a0 , a1 ,. . . , an−1 reelle Zahlen sind. Offensichtlich ist (11.1) eine lineare Differentialgleichung, in der die Koeffizienten von y, y 0 ,. . . , y (n−1) Konstanten sind; man nennt deshalb (11.1) eine (homogene) lineare Differentialgleichung mit konstanten Koeffizienten. Um die allgemeine Lösung von (11.1) zu finden, brauchen wir nach Satz 9.2 n linear unabhängige Funktionen, welche (11.1) erfüllen. Zu diesem Zweck machen wir den Ansatz x → y(x) = eαx (10.2) und versuchen, α durch Einsetzen in (11.1) zu bestimmen. Das liefert eαx αn + an−1 αn−1 + · · · + a1 α + a0 = 0. Daraus folgt, dass (11.2) genau dann eine Lösung von (11.1) ist, wenn α eine Nullstelle des sogenannten charakteristischen Polynoms (10.3) ist. α → αn + an−1 αn−1 + · · · + a1 α + a0 84 Beispiel U. Stammbach: Analysis, Teil C Es sei die Differentialgleichung y 000 − 2y 00 − 3y 0 = 0 (10.4) gegeben. Das charakteristische Polynom ist α → α3 − 2α2 − 3α = α(α + 1)(α − 3) . Es hat die Nullstellen α1 = 0, α2 = −1, α3 = 3. Daraus schliesst man, dass die Funktionen x → e0x = 1 , x → e−x , x → e3x Lösungen von (11.4) sind. Da sie linear unabhängig sind (warum?), ist nach unserem Satz 9.2 x → C1 + C2 e−x + C3 e3x , C1 , C2 , C3 ∈ R . die allgemeine Lösung von (11.4). Dieses Verfahren führt dann problemlos zu n linear unabhängigen Funktionen, wenn das charakteristische Polynom n verschiedene reelle Nullstellen besitzt. Dies braucht aber nicht der Fall zu sein: es können mehrfache Nullstellen und es können komplexe Nullstellen auftreten. Da letztere bei reellen Polynomen immer in konjugiert komplexen Paaren auftreten und die Summe der Vielfachheiten der Nullstellen eines Polynoms n-ten Grades stets n ist, müssen wir zu jeder k-fachen reellen Nullstelle k linear unabhängige Funktionen und zu jedem Paar konjugiert komplexer k-facher Nullstellen 2k linear unabhängige Funktionen finden. Diese erhalten wir nach der folgenden Regel: Ist α eine k-fache reelle Nullstelle des charakteristischen Polynoms (11.3), so sind die Funktionen x → eαx , x → xeαx , . . . , x → xk−1 eαx k linear unabhängige Lösungen der Differentialgleichung (11.1) Ist α = a + ib, α = a − ib, b 6= 0 ein Paar konjugiert komplexer k-facher Nullstellen des charakteristischen Polynoms (11.3), so sind die Funktionen 85 Kapitel VII. Differentialgleichungen x → eax cos bx x → xeax cos bx .. . x → xk−1 eax cos bx x → eax sin bx x → xeax sin bx .. . x → xk−1 eax sin bx 2k linear unabhängige Lösungen der Differentialgleichung (11.1). Wir verzichten hier auf einen Beweis für diese beiden Regeln. Zur zweiten merken wir aber noch Folgendes an. Ist a + ib eine komplexe Nullstelle des charakteristischen Polynoms, so ist die komplexwertige Funktion y1 : x → e(a+ib)x = eax (cos bx + i sin bx) eine “Lösung” der Differentialgleichung. Da auch a − ib eine Nullstelle des charakteristischen Polynoms ist, gilt dasselbe für y2 : x → e(a−ib)x = eax (cos bx − i sin bx) . Wegen der Linearität (bezüglich komplexer Zahlen) der Differentialgleichung müssen dann auch die reellwertigen Funktionen 1 (y1 (x) + y2 (x)) 2 = eax cos bx 1 (y1 (x) − y2 (x)) 2i = eax sin bx Lösungen der Differentialgleichung (11.1) sein. Beispiel Gegeben sei die Differentialgleichung (10.5) y (4) + 2y 00 + y = 0 . Das charakteristische Polynom lautet α4 + 2α2 + 1 . 86 U. Stammbach: Analysis, Teil C Es lässt sich schreiben als (α2 + 1)2 ; die Nullstellen sind α = ±i, beide mit Vielfachheit 2. Mit Hilfe unserer Regel erhalten wir vier linear unabhängige Funktionen; deren reelle Linearkombinationen y(x) = C1 cos x + C2 x cos x + C3 sin x + C4 x sin x , bilden die allgemeine Lösung der Differentialgleichung (11.5). (b) Homogene Eulersche Differentialgleichungen Eine weitere Klasse von linearen Differentialgleichungen lässt sich ähnlich behandeln wie die linearen Differentialgleichungen mit konstanten Koeffizienten, nämlich die Eulerschen Differentialgleichungen. Eine Differentialgleichung n-ter Ordnung heisst Euler’sch, wenn sie sich in der Form (10.6) y (n) + an−1 (n−1) an−2 (n−2) a0 + 2 y + ··· + ny = 0 y x x x mit a0 , a1 , . . . , an−1 ∈ R schreiben lässt. Nach unserem Satz 9.2 besteht unsere Aufgabe darin, n linear unabhängige Funktionen zu finden, welche (11.6) erfüllen. Ähnlich wie für lineare Differentialgleichungen mit konstanten Koeffizienten gewinnen wir diese mit Hilfe eines Ansatzes. Wir setzen (10.7) y(x) = xα und versuchen α durch Einsetzen in (11.6) zu bestimmen. Wir erhalten α(α − 1) · · · (α − n + 1) xα−n + an−1 α(α − 1) · · · (α − n + 2) xα−n + · · · + a0 xα−n = 0 . Es folgt, dass (11.7) genau dann eine Lösung der Differentialgleichung (11.6) liefert, wenn α eine Nullstelle des sogenannten Indexpolynoms (10.8) α(α − 1) · · · (α − n + 1) + an−1 α(α − 1) · · · (α − n + 2) + · · · + a0 ist. Hat das Indexpolynom n verschiedene reelle Nullstellen, so liefert dieses Verfahren n linear unabhängige Funktionen, welche (11.6) erfüllen. Wie bei linearen Differentialgleichungen mit 87 Kapitel VII. Differentialgleichungen konstanten Koeffizienten müssen die Fälle von mehrfachen Nullstellen und komplexen Nullstellen zusätzlich behandelt werden. Wir merken ohne Beweis die folgende Regel an: Ist α eine k-fache reelle Nullstelle des Indexpolynoms (11.8), so sind die Funktionen x → xα , x → (log x)xα , . . . , x → (log x)k−1 xα k linear unabhängige Lösungen der Differentialgleichung (11.6). Ist α = a + ib, α = a − ib, b 6= 0 ein Paar konjugiert komplexer k-facher Nullstellen des Indexpolynoms (11.8), so sind die Funktionen x → xa cos(b log x) x → (log x)xa cos(b log x) .. . x → xa sin(b log x) x → (log x)xa sin(b log x) .. . x → (log x)k−1 xa cos(b log x) x → (log x)k−1 xa sin(b log x) 2k linear unabhängige Lösungen der Differentialgleichung (11.6) Beispiel Untersucht man die stationäre Temperaturverteilung auf einer homogenen Kreisscheibe oder auf einem homogenen Kreisring, so tritt (siehe Analysis III) auf natürliche Weise die folgende Differentialgleichung für r → y(r) (10.9) 1 m2 y 00 + y 0 − 2 y = 0 r r auf. Dabei bezeichnet r den Abstand vom Mittelpunkt der Kreisscheibe, und m ist eine beliebige natürliche Zahl. Die homogene lineare Differentialgleichung (11.9) ist offensichtlich Euler’sch. Das Indexpolynom lautet α(α − 1) + α − m2 = α2 − m2 . Ist m > 0, so sind α = ±m die beiden Nullstellen des Indexpolynoms. Die allgemeine Lösung der Differentialgleichung (11.9) lautet in diesem Fall y(r) = C1 r m + C2 r −m , C1 , C2 ∈ R . 88 U. Stammbach: Analysis, Teil C Ist m = 0, so ist α = 0 eine doppelte Nullstelle des Indexpolynoms. Nach unserer Regel ist in diesem Fall die allgemeine Lösung von (11.9) durch y(r) = C1 + C2 log r , C1 , C2 ∈ R gegeben. Wir schliessen diesen Abschnitt mit der folgenden Bemerkung. Die allgemeine Lösung der Eulerschen Differentialgleichungen ergibt sich formal ganz analog zur Lösung einer linearen Differentialgleichung mit konstanten Koeffizienten. In der Tat lässt sich eine Eulersche Differentialgleichung für die Funktion x → y(x) durch die einfache Substitution x = et auf eine Differentialgleichung mit konstanten Koeffizienten für die Funktion t → y(et ) zurückführen. Das Indexpolynom geht dann ins charakteristische Polynom über. Wir überlassen es dem Leser, die Details dieser Substitution durchzuführen. 89 Kapitel VII. Differentialgleichungen 11 Schwingungsprobleme In diesem Abschnitt betrachten wir eine wichtige Anwendung der bis hierher entwickelten Theorie. Wir gehen dabei von zwei ganz verschiedenen konkreten Problemen aus und stellen fest, dass deren Verhalten durch ein und dieselbe lineare Differentialgleichung 2. Ordnung beschrieben wird. Diese Differentialgleichung diskutieren wir schliesslich im Detail. Das erste der beiden Probleme ist die gedämpfte Federschwingung. Ein Massenpunkt der Masse m sei an einer idealen Feder aufgehängt (siehe Figur 1). Die Auslenkung zur Zeit t aus der Ruhelage werde durch x(t) beschrieben. Fig. 1 : Gedämpfte Federschwingung x −kx −wẋ S(t) Auf den Massenpunkt wirke die Federkraft F = −kx, wobei k > 0 eine Proportionalitätskonstante ist, und eine Dämpfungskraft W . Für W benützen wir die Modellvorstellung, dass W proportional zur Geschwindigkeit ẋ(t) sei, W = −wẋ , w > 0 . 90 U. Stammbach: Analysis, Teil C Ferner wirke auf m eine von t abhängige äussere Kraft S(t). Das Newton’sche Gesetz liefert dann die Bewegungsdifferentialgleichung mẍ = −kx − wẋ + S(t) . Führen wir die Grössen s ω= k w S(t) , λ= , s(t) = m 2m m ein, so lautet die Differentialgleichung ẍ + 2λẋ + ω 2 x = s(t) . (11.1) Es handelt sich somit um eine inhomogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten. Als zweites konkretes Problem betrachten wir einen elektrischen Stromkreis, welcher eine Kapazität C, eine Induktivität L und einen Ohm’schen Widerstand R enthält (siehe Figur 2). Ausserdem werde an den Klemmen eine von t abhängige Spannung u(t) angelegt. Gesucht ist der zur Zeit t im Stromkreis fliessende Strom I(t). Aus der Physik weiss man, dass der Spannungsabfall am Ohm’schen Widerstand R durch uR = RI gegeben ist, derjenige an der Induktivität durch uL = L dI dt und derjenige am Kondensator mit Kapazität C durch uC = q/C, wo q die zur Zeit t auf C sitzende Ladung bezeichnet. Natürlich gilt I(t) = q̇(t). Das Kirchhoff’sche Gesetz liefert uR + uL + uC = u(t) . Setzt man die obigen Werte ein, so erhält man L dI q(t) + RI + = u(t) dt C und nach Ableitung nach t (11.2) L d2 I dI 1 d +R + I = u(t) . 2 dt dt C dt 91 Kapitel VII. Differentialgleichungen C Fig. 2 : Elektrischer Schwingkreis R L u(t) Führt man die Grössen ω2 = 1 R 1 d , λ= , s(t) = u(t), I(t) = x(t) , CL 2L L dt ein, so geht (11.2) in die Differentialgleichung (11.1) über. Vom mathematischen Standpunkt aus genügt es deshalb, sich mit (11.1) zu befassen. Wir haben hier wiederum ein Beispiel vor uns, wo zwei ganz verschiedene konkrete Probleme auf ein und dasselbe mathematische Modell führen. Im Folgenden diskutieren wir (11.1) und betrachten zu diesem Zweck zuerst die zugehörige homogene Differentialgleichung (11.3) ẍ + 2λẋ + ω 2 x = 0 . Dies ist eine homogene lineare Differentialgleichung mit konstanten Koeffizienten. Das charakteristische Polynom lautet 92 U. Stammbach: Analysis, Teil C α → α2 + 2λα + ω 2 , hat also die Nullstellen (11.4) α1,2 = −λ ± p λ2 − ω 2 . Je nach der Lage dieser Nullstellen sind verschiedene Fälle zu unterscheiden. (a) λ > ω, sogenannte starke Dämpfung In diesem Fall hat man zwei verschiedene reelle Nullstellen des charakteristischen Polynoms. Die allgemeine Lösung von (11.3) lautet (11.5) xh (t) = C1 eα1 t + C2 eα2 t . Man beachte, dass beide Nullstellen negativ sind, so dass xh (t) für jede Wahl von C1 , C2 exponentiell abklingt. (b) λ = ω, sogenannte kritische Dämpfung Hier hat das charakteristische Polynom eine doppelte Nullstelle α1 = α2 = −λ. Die allgemeine Lösung von (11.3) lautet (11.6) xh (t) = C1 e−λt + C2 t e−λt . Auch hier klingt xh (t) für jede Wahl von C1 , C2 exponentiell ab. (c) λ < ω, sogenannte schwache Dämpfung In diesem √ Fall hat das charakteristische Polynom zwei konjugiert komplexe Nullstellen. Setzt man ω ∗ = ω 2 − λ2 , so gilt α1,2 = −λ ± iω ∗ . Die allgemeine Lösung von (11.3) lautet dann (11.7) xh (t) = e−λt (C1 cos(ω ∗ t) + C2 sin(ω ∗ t)) . Jede spezielle Lösung von (11.3) ist in diesem Fall eine “exponentiell abklingende harmonische Schwingung” der Kreisfrequenz ω ∗ (siehe Figur 3). Man beachte ferner, dass ω ∗ kleiner ist als die Kreisfrequenz ω der ungedämpften Schwingung (λ = 0). 93 Kapitel VII. Differentialgleichungen (x) (t) Fig. 3 : Die Lösung t → x(t) mit x(0) = 1 und ẋ(0) = 0 der Schwingungsgleichung ẍ + 2λẋ + ω 2 x = 0 zu verschiedenen Werten von λ. Die gestrichelte Kurve entspricht der kritischen Dämpfung λ = ω Als nächstes diskutieren wir die inhomogene Differentialgleichung (11.1), und zwar wollen wir den Fall betrachten, wo s(t) durch s(t) = P cos(σt) gegeben ist. Wir haben also die Differentialgleichung (11.8) ẍ + 2λẋ + ω 2 x = P cos(σt) vor uns. Nach der Theorie setzt sich die allgemeine Lösung von (11.8) additiv aus einer partikulären Lösung x0 (t) von (11.8) und der allgemeine Lösung xh (t) der zugehörigen homogenen Differentialgleichung (11.3) zusammen: x(t) = x0 (t) + xh (t) . Wir haben oben gesehen, dass in jedem Fall die Funktion xh exponentiell abklingt; somit wird für grosse t 94 U. Stammbach: Analysis, Teil C x(t) ∼ x0 (t) gelten. Für x0 (t) können wir deshalb die sogenannte stationäre Lösung einsetzen, nämlich diejenige, die sich “nach langer Zeit” einstellt. Die Erfahrung (des Physikers mit Stromkreisen, etc.) zeigt, dass dies eine harmonische Schwingung mit der Kreisfrequenz σ der Anregung sein wird. Wir machen deshalb für x0 den Ansatz (übrigens in Übereinstimmung mit unserer Faustregel) x0 (t) = A cos(σt + α) . (11.9) Die noch unbekannte Amplitude A und die Phasenverschiebung α werden durch Einsetzen in (11.8) gewonnen. Wir erhalten (nach längerer Rechnung) Fig. 4 : Das Verhalten der Funktion σ → A2 (σ) für verschiedene Werte von λ P 2 /ω 4 (σ)    tan α         A2 = 2λσ , σ2 − ω2 = P2 . 4λ2 σ 2 + (σ 2 − ω 2 )2 95 Kapitel VII. Differentialgleichungen schwache Dämpfung starke Dämpfung ω Resonanz möglich (λ) Fig. 5 : Dämpfung und Resonanz keine Resonanz √1 ω 2 ω (λ) Wir diskutieren hier die (zwar ebenfalls interessante und wichtige) Abhängigkeit der Phasenverschiebung α von σ, ω, λ nicht weiter, sondern konzentrieren uns auf die Amplitude A, und untersuchen zu diesem Zweck den Graphen der Funktion σ → A2 (σ) (siehe Figur 4). Um die Stellen mit horizontaler Tangente zu berechnen, setzen wir d 2 8λ2 σ + 2(σ 2 − ω 2 )2σ = 0. A (σ) = −P 2 dσ (4λ2 σ 2 + (σ 2 − ω 2 )2 )2 Dies führt auf σ1 = 0 und wegen 2λ2 + (σ22 − ω 2 ) = 0 auf (11.10) σ22 = ω 2 − 2λ2 . Das Verhalten von A2 (σ) ist somit stark abhängig von den Grössen ω, λ. Wir erhalten die folgenden, qualitativ unterschiedlichen Fälle (siehe Figur 5). (a) Starke Dämpfung und kritische Dämpfung, ω ≤ λ In diesem Fall hat man nur eine horizontale Tangente; die Funktion σ → A2 (σ) nimmt mit zunehmendem σ monoton ab. 96 U. Stammbach: Analysis, Teil C (y) (t) Fig. 6 : Die Funktionen t → P cos(σt) (gestrichelt) und die zugehörigen stationären Lösungen (ausgezogen) der Differentialgleichung ẍ + 2λẋ + ω 2 x = P cos(σt) mit schwacher Dämpfung zu verschiedenen Werten von σ mit σ ≤ σ2 . (y) (t) Fig. 7 : Die Funktionen t → P cos(σt) (gestrichelt) und die zugehörigen stationären Lösungen (ausgezogen) der Differentialgleichung ẍ + 2λẋ + ω 2 x = P cos(σt) mit schwacher Dämpfung zu verschiedenen Werten von σ mit σ ≥ σ2 . 97 Kapitel VII. Differentialgleichungen (b) Schwache Dämpfung, λ < ω Hier sind wiederum zwei Fälle zu unterscheiden (ba) √1 ω 2 ≤λ<ω In diesem Fall ist ω 2 − 2λ2 ≤ 0. Man erhält für σ = 0 eine horizontale Tangente. Für σ > 0 ist die Funktion σ → A2 (σ) strikt monoton fallend. (bb) 0 < λ < √1 ω 2 In diesem Fall√ist ω 2 − 2λ2 > 0 und man hat zwei horizontale Tangenten, nämlich bei σ1 = 0 und bei σ2 = ω 2 − 2λ2 . In σ2 nimmt A2 (σ) offenbar das Maximum an. Die Frequenz σ2 heisst Resonanzfrequenz. Sie ist kleiner als die Eigenfrequenz ω. Jenseits der Resonanzfrequenz nimmt A2 (σ) monoton ab (siehe Figuren 6,7). Bemerkung Für λ = 0 (keine Dämpfung) hat man ein ähnliches Verhalten. Alle Herleitungen bleiben für σ 6= ω gültig. Der Fall σ = ω muss genauer untersucht werden, denn an dieser Stelle hat die Funktion σ → A2 (σ) einen Pol. Die Differentialgleichung ẍ + ω 2 x = P cos(ωt) hat auch eine etwas anders geartete partikuläre Lösung. Es gilt (siehe (9.26)) x(t) = C1 cos(ωt) + C2 sin(ωt) + P t sin(ωt) . 2ω Die Schwingungsgleichung, wie wir sie in (11.1) vor uns haben, gibt uns noch zu einigen allgemeinen Bemerkungen Anlass. Wir haben bereits gesehen, dass der homogene Anteil der Differentialgleichung (11.1) das System an sich beschreibt und das inhomogene Glied die “äussere Anregung” (es heisst deshalb ja auch treffend “Störglied”). In unserem Modell wird das System durch eine homogene lineare Differentialgleichung mit konstanten Koeffizienten beschrieben. Der Leser hat sich vielleicht bereits gefragt, ob damit die reale Situation nicht allzu vereinfacht dargestellt wird. Zu dieser Frage wollen wir hier noch einige Worte sagen. Gehen wir zurück zur konkreten Situation eines Massenpunktes, welcher sich längs einer Gerade bewegt und auf den Kräfte wirken, welche von der Lage x(t) und von der Geschwingigkeit ẋ(t) des Massenpunktes abhängen. Die Totalkraft K ist dann also durch eine Funktion von x und ẋ gegeben. Das Newton’sche Gesetz liefert (11.11) mẍ = K(x, ẋ) . 98 U. Stammbach: Analysis, Teil C Wir denken uns ferner ein Koordinatensystem so eingeführt, dass x = 0 der Ruhelage des Massenpunktes entspricht. Dies hat die Konsequenz, dass K(0, 0) = 0. Im allgemeinen ist K eine schwer zu beschreibende, komplizierte Funktion, und man wird sich in konkreten Fällen immer mit Approximationen zufrieden geben müssen. Als einfachste solche Approximation drängt sich die lineare Ersatzfunktion auf: (11.12) K(x, ẋ) ∼ K(0, 0) + xKx (0, 0) + ẋKẋ (0, 0) . Diese ist bekanntlich in der Umgebung des Nullpunktes eine “gute” Approximation. Ersetzt man in der Differentialgleichung (11.11) die komplizierte Funktion K durch die lineare Ersatzfunktion (11.12) und beachtet man zusätzlich K(0, 0) = 0, so erhält man mit a = Kx (0, 0), b = Kẋ (0, 0) die Differentialgleichung (11.13) mẍ = ax + bẋ . Dies entspricht gerade unserer homogenen Schwingungsdifferentialgleichung. Jetzt ist es nicht mehr überraschend, dass die Differentialgleichung linear ist und dass a, b Konstanten sind: wir haben uns eben mit Absicht auf diesen einfachen Fall beschränkt. Es bleibt natürlich die Frage offen, wie gut die Lösungen der vereinfachten Differentialgleichung (11.13) die Lösungen der “richtigen” Differentialgleichung (11.11) wiedergeben. Diese Frage führt auf diffizile und sehr interessante mathematische Probleme, auf die wir hier nicht eingehen. Immerhin wollen wir folgendes festhalten. Wir wissen bereits, dass die Approximation von K durch die lineare Ersatzfunktion umso besser ist, je kleiner x und ẋ sind. Es ist deshalb plausibel und es kann auch mathematisch bewiesen werden, dass die Lösungen der vereinfachten Differentialgleichung (11.13) die Lösungen der ursprünglichen Differentialgleichung (11.11) umso besser wiedergeben, je kleiner x und ẋ sind. Die Folgerung, die der Anwender daraus ziehen muss, ist diese: Die Differentialgleichung (11.1) beschreibt zwar eine ideale gedämpfte Federschwingung eines Massenpunktes; die Differentialgleichung “gilt” aber für in einer Dimension schwingende Massenpunkte ganz allgemein, wenn nur die Auslenkung aus der Ruhelage und die Geschwindigkeit des Massenpunktes klein bleiben. Beispiel Um das eben Gesagte an einer bekannten Situation zu illustrieren, betrachten wir noch kurz das mathematische Pendel. Ein Massenpunkt der Masse m sei an einer gewichtslosen Faden der Länge l aufgehängt. Wir beschreiben die Lage des Massenpunktes mit Hilfe des Winkels ϕ. Dann gilt in der (einzig interessanten) Tangentialrichtung nach dem Newton’schen Gesetz mlϕ̈ = −mg sin ϕ . 99 Kapitel VII. Differentialgleichungen Für die Funktion t → ϕ(t) erhalten wir die Differentialgleichung g ϕ̈ = − sin ϕ . l (11.14) Wir vereinfachen nun gemäss dem oben Gesagtem die rechte Seite dieser Gleichung, indem wir ϕ → f (ϕ) = sin ϕ ersetzen durch die lineare Ersatzfunktion bezüglich ϕ = 0. (Man beachte, dass ϕ = 0 die Ruhelage beschreibt). Die lineare Ersatzfunktion ist gegeben durch ϕ → f (0) + f 0 (0)ϕ = sin(0) + cos(0)ϕ = ϕ . Damit erhalten wir statt der “komplizierten” Differentialgleichung (11.14) die “einfache” lineare Differentialgleichung (11.15) g ϕ̈ = − ϕ , l die üblicherweise als Differentialgleichung des mathematischen Pendels bekannt ist. Wir schliessen diesen Abschnitt über Schwingungsprobleme mit einigen Beispielen, die alle aus dem Tätigkeitsbereich von Ingenieuren stammen. Empfang von Radiowellen Im ersten Beispiel geht es um eine positive Anwendung des Resonanzphänomens und zwar um den Empfang von Radiowellen. Die verschiedenen Übertragungsfrequenzen der Sender führen am Empfangsort zu einem wirren Gemisch von Radiowellen, welches einer Überlagerung von harmonischen Schwingungen der elektrischen Feldstärke mit verschiedenen Frequenzen entspricht. Das Empfangsgerät hat die Aufgabe, aus diesem ganzen Spektrum, nur das Signal in der Frequenz des gewünschten Senders aufzunehmen und es anschliessend zu verstärken. Dieses Aussortieren geschieht mit Hilfe von Resonanz. Im wesentlichen benützt man dafür einen Stromkreis der oben betrachteten Art, der in Serie eine Kapazität, einen Ohm’schen Widerstand und eine Induktivität enthält. An die Klemmen wird die Antennenspannung angelegt. Diese variiert gemäss der Überlagerung aller einstrahlender Radiowellen. Man sorgt nun dafür, dass der Stromkreis schwach gedämpft ist – mit schmaler Resonanzkurve – und dass die Resonanzfrequenz gerade mit der Frequenz des gewünschten Senders übereinstimmt. Jeder Frequenzanteil des empfangenene Totalsignals erzeugt im Stromkreis einen entsprechenden Anteil des Gesamtstromes. Gemäss unseren Resultaten wird dabei die Resonanzfrequenz “bevorzugt” behandelt. Dies führt bei schmaler Resonanzkurve dazu, dass der Anteil des Stromes, der auf das Signal dieser Frequenz zurückzuführen ist, weit grösser ist als die von den anderen Frequenzen herrührenden 100 U. Stammbach: Analysis, Teil C Anteile. Das zur Resonanzfrequenz gehörende Signal ist damit gegenüber den Signalen der anderen Sender hervorgehoben worden. Es wird anschliessend mit Hilfe von Radioröhren oder Transistoren verstärkt. Turnhalle Das zweite Beispiel zeigt, dass Resonanzphänomene auch bei Bauwerken eine grosse Rolle spielen können. Dies ist deshalb etwas überraschend, weil Bauwerke im Normalfall nur auf die statische Beanspruchung ausgelegt werden. Möglicherweise auftretende dynamischen Effekte werden oft gar nicht berücksichtigt. – Es handelt sich um eine Turnhalle, die vor nicht vor nicht allzu langer Zeit in der Umgebung von Zürich gebaut worden ist. Der folgende Abschnitt stammt aus dem Sanierungsbericht von Professor H. Bachmann von der Abteilung für Bauingenieurwesen an der ETH-Zürich. “Bei einer doppelstöckigen Turnhalle traten bald nach der Inbetriebnahme starke Bauwerksschwingungen auf. Diese wurden dann beobachtet, wenn in der oberen Halle zu rhythmischer Musik moderne Konditionstrainigs, das heisst Lauf-, Hüpf- und Sprungübungen durchgeführt wurden. Die Schwingungen äusserten sich insbesondere in der unteren Halle durch sichtbare Durchbiegungen der Zwischendecke, durch horizontale Fassadenbewegungen und durch einen erheblichen Lärm. Dieser wurde hervorgerufen durch das Mitschwingen und Klappern der Eingangstüre und des Tores zum Geräteraum, sowie von an Decke, Fassaden und Wänden befestigten Ausstattungsteilen und Turngeräten. Ferner konnte bei geöffneter Eingangstüre ein starker rhythmischer Luftzug in Folge Kompression und Dekompression des Hallenvolumens verspürt werden. Dies Wirkungen führten dazu, dass immer wieder Personen die untere Halle verliessen, sobald in der oberen Halle Konditionstrainings durchgeführt wurden.” Zum Zwecke der Sanierung wurden an der Turnhalle Messungen durchgeführt, die zeigten, dass bei der Schwingung der Zwischendecke Beschleunigungen bis zur Hälfte der Erdbeschleunigung auftraten. Man hat ferner auch eine Rissaufnahme an den Trägern der Zwischendecke durchgeführt, und Risse festgestellt, die mehr als einen halben Millimeter Breite aufweisen. Der Grund für die Schwingungen ist ein Resonanzphänomen. Berechnungen zeigten, dass die Zwischendecke ein schwach gedämpftes, schwingungsfähiges System bildete, das durch das Hüpfen, Laufen und Springen der Turnenden in periodischer Weise angeregt wurde. Es ist nach unserer Theorie klar, dass in diesem System Resonanz auftreten wird, wenn die Hüpffrequenz mit der Resonanzfrequenz übereinstimmt. Das wusste natürlich auch der Bauingenieur, der diese Turnhalle gebaut hatte. Die Sachlage war hier aber etwas komplizierter. Es zeigte sich, dass die Resonanzfrequenz der Zwischendecke bei ungefähr 4.8 Hz lag, während bei Lauf- oder Hüpfübungen Frequenzen von 2.4 bis 2.5 Hz auftreten. Der Bauingenieur hatte gelernt, dass bei Anregungsfrequenzen unterhalb der Resonanzfrequenz keine Resonanz auftreten kann und er fühlte sich deshalb sicher. Die Sache ist nun aber die, dass diese Aussage nur für rein harmonische Anregungskräfte gilt. Die durch das Hüpfen oder Laufen von Turnenden auf den Zwischenboden ausgeübte Kraft ist aber nicht rein harmonisch, sondern besteht annäherungsweise aus periodisch auftretenden rechteckförmigen Stössen. Um Aussagen über das Resonanzverhalten zu machen, muss man diese Anregungskraft in eine Überlagerung von harmonischen Anteilen Kapitel VII. Differentialgleichungen 101 zerlegen. Das geschieht mit Hilfe der Fourier-Zerlegung. In dieser Zerlegung treten automatisch auch harmonische Anteile der doppelten Anregungsfrequenz, der dreifachen, usw. auf. Es ist natürlich die doppelte Anregungsfrequenz, die hier mit der Resonanzfrequenz der Zwischendecke übereinstimmte und zu den unangenehmen Erscheinungen führte. Die Turnhalle wurde saniert, indem die Zwischendecke versteift wurde. Damit erreichte man eine höhere Eigenfrequenz (zirka 8 Hz). Resonanzschwingungen waren damit zwar nicht völlig ausgeschlossen, aber ihre Auswirkungenen lagen innerhalb der zulässigen Grenzen. Webereigebäude Resonanzerscheinungen spielen bei Maschinen mit rotierenden und oszillierenden Teilen oft eine wichtige und unangenehme Rolle. Wir erwähnen hier den Fall eines Webereigebäudes1 . “Im unterkellerten Maschinensaal eines rund 20 Jahre alten Webereigebäudes traten nach einer Umrüstung auf moderne, schneller laufende Maschinen starke Schwingungen auf. Bei eingehenden Messungen wurden an der die Maschinen tragenden Decke vertikale Schwinggeschwindigkeiten von bis zu 24mm/s festgestellt [als Normwert gilt 10 mm/s!]. Auch die Maschinenschwingungen waren mit einer Schwingbreite (zweifache Amplitude) in horizontaler Richtung von 1.2 mm beträchtlich. Als zulässig wurde im vorliegenden Fall rund 1 mm erachtet. Höhere Werte wären zwar für die Maschinen gefahrlos gewesen, hingegen konnten sich bei feinen Geweben textiltechnische Probleme ergeben, da der Schusseintrag beeinträchtigt wurde.” Der Grund für die Bauwerksschwingungen war eine Resonanzerscheinung. Messungen ergaben als Grundfrequenz der Betondecke rund 21 Hz. “Die vor der Umrüstung vorhandenen Webmaschinen hatten Drehzahlen von rund 200 U/min, d.h. sie liefen mit rund 3.3 Hz. Die neuen Maschinen liefen, je nach zu fabrizierendem Gewebe, mit 240 bis 290 U/min, d.h. mit bis zu rund 4.8 Hz. Es war somit offensichtlich, dass die Deckenschwingungen vor allem durch obere Harmonische (4.,5.) des nicht näher bekannten zeitlichen Verlaufs der Last hervorgerufen wurden” [d.h. durch diejenigen harmonischen Anteile in der Fourier-Zerlegung der anregenden Schwingung, welche die vier bzw. fünffache Frequenz der Grundfrequenz aufweisen]. “Eine [sogenannte] Tiefabstimmung, d.h. eine Lagerung der Maschinen auf weichen Feder(Dämpfer-)Elementen, kam nicht in Frage. Wohl wären dadurch die Deckenschwingungen vermindert worden, doch hätten sich noch stärkere Maschinenschwingungen ergeben, was aus textiltechnischen Gründen nicht zulässig war. Deshalb wurde eine Deckenverstärkung [...] vorgenommen.” Das Ziel dieser Massnahme war, die Grundfrequenz der Decke soweit zu erhöhen, dass Resonanzerscheinungen in nur noch geringem Masse auftreten konnten. “Die Sanierungsmassnahmen waren erfolgreich. Wie erneute Messungen zeigten, wurde [...] der Richtwert der Schwinggeschwindigkeit von 10 mm/s praktisch nicht mehr überschritten. Die Maschinenschwingungen waren ebenfalls erheblich kleiner als vor der Sanierung, und es traten somit keine produktionstechnischen Probleme mehr auf.” 1 siehe H. Bachmann, W. Ammann: Schwingungsprobleme bei Bauwerken, 1987 102 12 U. Stammbach: Analysis, Teil C Systeme von Differentialgleichungen Wir wollen in den drei letzten Abschnitten dieses Kapitels Systeme von Differentialgleichungen 1. Ordnung betrachten. Dabei beschränken wir uns, vor allem um die Darstellung möglichst anschaulich zu halten, auf Systeme von zwei Differentialgleichungen. Die Übertragung auf grössere Systeme wird dem Leser keine Schwierigkeiten machen. Im vorliegenden Abschnitt stellen wir einige einfache Tatsachen zusammen, im nächsten Abschnitt beschäftigen wir uns eingehender mit linearen autonomen Systemen, und im übernächsten Abschnitt sprechen wir kurz über das Stabilitätsverhalten der Lösungen. Unter einem System von Differentialgleichungen 1. Ordnung für die Funktionen x → y1 (x), x → y2 (x) versteht man zwei Differentialgleichungen der Form (12.1) y10 = f1 (x, y1 , y2 ) y20 = f2 (x, y1 , y2 ) , wobei f1 , f2 Funktionen der drei Variabeln x, y1 , y2 sind. Eine Lösung des Systems (12.1) ist ein Paar von Funktionen x → y1 (x) , x → y2 (x), welche die beiden Gleichungen des Systems simultan erfüllen. Beispiel Es sei die Differentialgleichung zweiter Ordnung (12.2) y 00 = F (x, y, y 0 ) gegeben. Führen wir die neuen Funktionen x → y1 (x) = y(x) und x → y2 (x) = y 0 (x) ein, so erhalten wir ein System von Differentialgleichungen 1. Ordnung (12.3) y10 = y2 0 y2 = F (x, y1 , y2 ) . Es ist klar, dass jede Lösung der Differentialgleichung (12.2) Anlass gibt zu einer Lösung des Systems (12.3) und umgekehrt. Daraus folgt, dass man statt Differentialgleichungen höherer Ordnung auch Systeme von Differentialgleichungen 1. Ordnung betrachten kann. Wie für Differentialgleichungen höherer Ordnung gilt für Systeme ein Existenz- und Eindeutigkeitssatz: 103 Kapitel VII. Differentialgleichungen Satz 12.1 Es sei das System (12.1) von zwei Differentialgleichungen 1. Ordnung gegeben. Die Funktionen f1 , f2 seien stetig in x und stetig partiell nach y1 , y2 differenzierbar. Dann gibt es zu vorgegebenen x0 , y1,0 , y2,0 genau ein Paar von Funktionen x → y1 (x), x → y2 (x), welches Lösung des Systems (12.1) ist und den Anfangsbedingungen y1 (x0 ) = y1,0 , y2 (x0 ) = y2,0 genügt. Der Leser mache sich an dieser Stelle klar, dass aus Satz 12.1 der Satz 8.1 über Differentialgleichungen höherer Ordnung folgt. Das Differentialgleichungssystem (12.1) heisst autonom, falls die zu den gesuchten Funktionen y1 , y2 gehörige Variable x nicht explizit auftritt. Beispiel Die Differentialgleichung für die Ortsfunktion t → x(t) eines eindimensionalen gedämpften Oszillators lautet (siehe Abschnitt 11) ẍ + 2λẋ + ω 2 x = 0 . Dieser Differentialgleichung 2. Ordnung entspricht das folgende System von zwei Differentialgleichungen 1. Ordnung für die Funktionen t → x(t), t → v(t) = ẋ(t) (12.4) ẋ = v v̇ = −2λv − ω 2 x . Die zu den gesuchten Funktionen x und v gehörige Variable ist hier die Zeit und heisst dementsprechend t. Sie kommt im Differentialgleichungssystem (12.4) nicht explizit vor; das System (12.4) ist autonom. Im Folgenden wollen wir nur autonome Systeme betrachten. Aus Gründen der Anschaulichkeit, die gleich deutlicher werden, ist es dann angebracht, dem obigen Beispiel folgend die Variable der gesuchten Funktion mit t zu bezeichnen. Ausserdem wollen wir in diesem Abschnitt die beiden gesuchten Funktionen t → x(t) und t → y(t) nennen. Unser autonomes System lässt sich somit in der folgenden Form schreiben: (12.5) ẋ = f1 (x, y) ẏ = f2 (x, y) . Es liegt nahe, die in der (x, y)-Ebene definierten Funktionen f1 : (x, y) → f1 (x, y), f2 : (x, y) → f2 (x, y) als Komponenten eines zweidimensionalen Vektorfeldes ~v : (x, y) → ~v (x, y) zu interpretieren: ~v (x, y) = (f1 (x, y), f2 (x, y)) . 104 U. Stammbach: Analysis, Teil C Eine Lösung des Differentialgleichungssystems (12.5) kann dann als Parameterdarstellung t → (x(t), y(t)) einer Feldlinie des Vektorfeldes ~v aufgefasst werden. In der Tat besagt ja (12.5), dass der Tangentialvektor (ẋ(t), ẏ(t)) der Kurve t → (x(t), y(t)) gerade mit dem Feldvektor in (x, y) übereinstimmt. Fasst man – etwas konkreter – t als Zeit und das Vektorfeld ~v als (stationäres!) Strömungsfeld in der Ebene auf, so beschreibt t → (x(t), y(t)) die Bewegung eines Teilchens im Strömungsfeld, und der Vektor (ẋ(t), ẏ(t)) ist der Geschwindigkeitsvektor dieses Teilchens. Aus unserem Existenz- und Eindeutigkeitssatz (Satz 12.1) folgt, dass durch jeden Punkt (x0 , y0 ) eine eindeutig bestimmte Kurve K geht, die durch die Lösung des Systems (12.5) mit den Anfangsbedingungen x(t0 ) = x0 , y(t0 ) = y0 beschrieben wird. Diese Kurve, versehen mit ihrer Durchlaufrichtung(!), heisst die durch (x0 , y0 ) verlaufende Trajektorie; die Schar der Trajektorien nennt man das Phasenporträt des Systems. Die Eindeutigkeitsaussage liefert unmittelbar, dass sich zwei Trajektorien nicht schneiden können, es sei denn, sie fallen in ihrem ganzen Verlauf zusammen. Das Phasenporträt eines autonomen Differentialgleichungssystems enthält wichtige Informationen über die Lösungen; insbesondere kann an ihm das Stabilitätsverhalten der Lösungen abgelesen werden (siehe Abschnitt 14). Dies ist deshalb eine wichtige Bemerkung, weil es im allgemeinen sehr viel leichter ist, das Phasenporträt eines System zu berechnen, als das System selbst vollständig zu lösen. Wir versuchen dies am folgenden Beispiel zu illustrieren. Beispiel Wir betrachten das Räuber-Beute-Modell von Lotka-Volterra (A.J. Lotka 1880-1949; V. Volterra 1860-1940). Hier beschreibt t → x(t) die Grösse einer Räuberpopulation, die sich von einer einzigen Beuteart ernährt, und t → y(t) die Grösse der Beutepopulation. Das LotkaVolterra-Modell besagt, dass die beiden Populationsgrössen dem Differentialgleichungssystem (12.6) ẋ = −a1 x + b1 xy ẏ = a2 y − b2 xy genügen. Dabei sind a1 , a2 , b1 , b2 positive reelle Zahlen. (Wir verzichten hier auf eine Begründung für die Form dieser Differentialgleichungen, denn wir sind ja vor allem an der Mathematik interessiert.) Man kann zeigen, dass sich die Lösungen dieses Systems nicht durch elementare Funktionen ausdrücken lassen. Hingegen ist das Phasenporträt relativ leicht zu berechnen. Dieses besteht aus den Feldlinien des Vektorfeldes ~v : (x, y) → ~v (x, y) = (−a1 x + b1 xy, a2 y − b2 xy) (versehen mit dem entsprechenden Durchlaufsinn). Beschreibt man die Feldlinien als Graphen der Funktion x → y(x), so lassen sie sich als Lösungen der Differentialgleichung (12.7) y0 = a2 y − b2 xy −a1 x + b1 xy bestimmen. Diese Differentialgleichung ist separierbar und ist deshalb leicht lösbar. Wir erhalten der Reihe nach 105 Kapitel VII. Differentialgleichungen dy dx y (a2 − b2 x) x (b1 y − a1 ) b1 y − a1 a2 − b2 x dy = dx y x b1 y − a1 log |y| = a2 log |x| − b2 x + C a2 eb1 y C |x| = e |y|a1 eb2 x |x|a2 |y|a1 · = A, eb2 x eb1 y = wobei wir A = 1/eC gesetzt haben. Das Phasenporträt des Systems (12.6) besteht folglich aus den Niveaulinien der Funktion (x, y) → xa2 y a1 · eb2 x eb1 y Fig. 1 : Das Phasenporträt der Lotka-Volterra-Gleichungen (versehen mit dem einfach zu bestimmenden Durchlaufsinn). Mit etwas Mühe lassen sich die Niveaulinien diskutieren. Das wollen wir im einzelnen hier nicht durchführen, sondern uns 106 U. Stammbach: Analysis, Teil C einfach das Bild ansehen. Wir lesen daraus sofort eine ganze Menge über die Lösungen des Systems (12.6) ab. Ist die Beutepopulation y(t) gross, so wird die Räuberpopulation x(t) gute Bedingungen vorfinden und sich vergrösseren. Damit wächst der Druck auf die Beutepopulation, so dass diese schliesslich abnimmt. Mit der Zeit wird die Beutepopulation zu klein, um die Räuberpopulation zu erhalten, so dass diese ihrerseits unter Druck gerät und abnimmt. Dies gibt aber der Beutepopulation eine Überlebenschance, so dass diese wieder zunimmt, und nach einiger Zeit auch zu einer Vergrösserung der Räuberpopulation führt, etc. Offenbar ergibt sich aus diesem Modell ein periodisches wechselweises Anwachsen und Abnehmen der Räuber- bzw. Beutepopulation. Mehr als die Frage, ob dieses Modell die Wirklichkeit in vernünftiger Weise beschreibt, interessiert uns hier die Tatsache, dass wir aus dem Phasenporträt eine Menge von qualitativen Informationen über die Lösungen des Systems herleiten konnten. Die Lösungen des Differentialgleichungssystems selbst haben wir dazu gar nicht benötigt. Schliesslich wollen wir noch auf Folgendes aufmerksam machen. In unserem Beispiel ist die Trajektorie durch den Punkt (x0 , y0 ) = (a2 /b2 , a1 /b1 ) ausgeartet: sie besteht nur aus diesem einen Punkt. In der Tat bilden die konstanten Funktionen t → x(t) = a2 /b2 , t → y(t) = a1 /b1 eine Lösung des Systems. In diesem Fall sind Räuber- und Beutepopulation im Gleichgewicht. Dies legt die folgende allgemeine Definition nahe. Ein Punkt (x0 , y0 ) der (x, y)-Ebene mit der Eigenschaft, dass t → x(t) = x0 und t → y(t) = y0 eine Lösung des Systems bilden, heisst Gleichgewichtspunkt. Die Kenntnis der Gleichgewichtspunkte eines autonomen Systems, sowie das Phasenporträt in der Umgebung dieser Punkte erlauben sehr oft, weitgehende Aussagen über das Verhalten der Lösungen des Systems. Darauf gehen wir in Abschnitt 14 noch etwas näher ein. 107 Kapitel VII. Differentialgleichungen 13 Lineare autonome Differentialgleichungssysteme mit konstanten Koeffizienten In diesem Abschnitt betrachten wir lineare autonome Differentialgleichungssysteme 1. Ordnung mit konstanten Koeffizienten. Im hier einzig zu behandelnden Fall von zwei Gleichungen sind dies Systeme, die sich in der Form ẋ1 = a11 x1 + a12 x2 + b1 ẋ2 = a21 x1 + a22 x2 + b2 (13.1) schreiben lassen. Dabei sind die Koeffizienten aik , bi ; i = 1, 2, k = 1, 2 reelle Zahlen, also insbesondere unabhängig von t. Wir haben hier eine Bezeichnungsweise gewählt, die von der linearen Algebra her nahegelegt wird. Setzen wir " ~x(t) = x1 (t) x2 (t) # " , ~x˙ (t) = ẋ1 (t) ẋ2 (t) # " , A= a11 a21 a12 a22 # " , ~b = b1 b2 # , so schreibt sich das System (13.1) in der einfachen Form ~x˙ = A~x + ~b . Man beachte, dass aus einem System der Form (12.5) ein System der Form (13.1) entsteht, wenn man die auf der rechten Seite stehenden Funktionen linearisiert. Diese Tatsache allein liefert sicherlich genügend Motivation, sich mit linearen Systemen mit konstanten Koeffizienten eingehender zu beschäftigen. Es gibt im wesentlichen zwei Techniken, Systeme der Form (13.1) zu behandeln. Die eine Art verwendet Methoden der linearen Algebra, um die Matrix A in einem ersten Schritt auf eine einfache Form zu bringen, wenn möglich auf Diagonalform. Die zweite Art führt das System (13.1) auf eine Differentialgleichung 2. Ordnung zurück. Beide Lösungsarten wollen wir an Hand von Beispielen kurz kennenlernen, wobei wir der Einfachheit halber Beispiele wählen, bei denen ~b trivial ist (“homogener Fall”). Beispiel Es sei das System ẋ1 = x1 + 2x2 ẋ2 = 2x1 + x2 gegeben. Wir stellen als erstes fest, dass die Matrix A des Systems 108 U. Stammbach: Analysis, Teil C " A= 1 2 2 1 # symmetrisch ist. Von der linearen Algebra her wissen wir, dass sich symmetrische Matrizen leicht auf Diagonalgestalt bringen lassen, indem man ihre Eigenwerte und Eigenvektoren berechnet. Für die Matrix A erhält man die Eigenwerte α1 = −1 und α2 = 3 sowie die zugehörigen (orthonormierten und deshalb linear unabhängigen) Eigenvektoren # √ " √ " # 2 2 1 1 , . −1 1 2 2 (Im Falle einer symmetrischen Matrix gibt es bekanntlich immer eine Basis von orthonormierten Eigenvektoren!) Wir führen nun, entsprechend den Eigenvektoren die neuen Funktionen √ 2 (x1 (t) − x2 (t)) 2 √ 2 t → y2 (t) = (x1 (t) + x2 (t)) 2 t → y1 (t) = (13.2) ein. (Im Fall einer symmetrischen Matrix A tritt hier einfach die Matrix auf, deren Zeilen aus den normierten Eigenvektoren gebildet werden; im Fall einer nichtsymmetrischen Matrix A müssen die Funktionen y1 , y2 auf etwas kompliziertere Weise gebildet werden.) Eine kleine Rechnung zeigt, dass die Funktionen y1 , y2 dem Differentialgleichungssystem (13.3) ẏ1 = −y1 ẏ2 = 3y2 genügen, dessen Matrix Diagonalform hat; in der Diagonalen stehen daher die Eigenwerte α1 , α2 der Matrix A. Die Gleichungen des Differentialgleichungssystems (13.3) sind “entkoppelt”; ihre Lösungen lassen sich sofort hinschreiben t → y1 (t) = C1 e−t , t → y2 (t) = C2 e3t . Mit Hilfe von (13.2) lassen sich dann die ursprünglich gesuchten Funktionen x1 , x2 angeben: t → x1 (t) = D1 e−t + D2 e3t , t → x2 (t) = −D1 e−t + D2 e3t , 109 Kapitel VII. Differentialgleichungen √ 2 2 C1 , D2 wobei hier der Einfachheit halber D1 = = √ 2 2 C2 gesetzt haben. Fassen wir zusammen: Man benützt in dieser Lösungsart Methoden der linearen Algebra, um das ursprüngliche System auf eine möglichst einfache Form zu bringen. Das geschieht, indem man Eigenwerte und Eigenvektoren der Matrix A berechnet und entsprechend neue Funktionen einführt. Das vereinfachte, neue System lässt sich dann leichter lösen. Im letzten Schritt geht man zu den ursprünglich gesuchten Funktionen zurück. Die zweite Lösungsart illustrieren wir mit dem folgenden Beispiel. Beispiel Es sei das System (13.4) ẋ1 = 5x1 + x2 ẋ2 = −4x1 + x2 gegeben. (Wir bemerken, dass für dieses System die erste Methode nicht ohne weiteres zum Ziel führt, da die Matrix A, " A= 5 1 −4 1 # keine zwei linear unabhängige Eigenvektoren besitzt.) Wir führen das System (13.4) auf eine Differentialgleichung 2. Ordnung zurück, indem wir eine der unbekannten Funktionen eliminieren. Aus der ersten Gleichung erhalten wir (13.5) x2 = ẋ1 − 5x1 . Einsetzen in die zweite Gleichung liefert (13.6) ẋ2 = −4x1 + ẋ1 − 5x1 . Andererseits ergibt die Ableitung von (13.5) (13.7) ẋ2 = ẍ1 − 5ẋ1 . Aus (13.6) und (13.7) erhalten wir dann (13.8) ẍ1 − 6ẋ1 + 9x1 = 0 . Dies ist eine lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten. Ihr charakteristisches Polynom lautet α → α2 − 6α + 9 = (α − 3)(α − 3) , 110 U. Stammbach: Analysis, Teil C so dass die allgemeine Lösung von (13.8) durch t → x1 (t) = C1 e3t + C2 te3t gegeben ist. Aus (13.5) ergibt sich dann t → x2 (t) = (−2C1 + C2 )e3t − 2C2 te3t . Die allgemeine Lösung des Systems (13.4) lässt sich somit in Vektorform " x1 (t) x2 (t) # " = C1 1 −2 # " 3t e + C2 t 1 − 2t # e3t schreiben. Wir beschliessen diesen Abschnitt mit dem folgenden Beispiel aus der Physik, das ein Differentialgleichungssystem mit mehr als zwei Differentialgleichungen 1. Ordnung involviert. Beispiel Es seien zwei identische mathematische Pendel der Masse m und der Länge l gegeben. Sie sollen durch eine in der Ruhelage nicht beanspruchten Feder mit Federkonstante k verbunden sein. l Fig. 1 : Gekoppelte Pendel l m m x y 111 Kapitel VII. Differentialgleichungen Wir beschreiben durch t → x(t) die Auslenkung aus der Ruhelage des linken und durch t → y(t) die Auslenkung aus der Ruhelage des rechten Pendels. Von Anfang an beschränken wir uns ausserdem auf die linearisierte Theorie. Das Newton’sche Gesetz liefert sofort die beiden Differentialgleichungen mg x − k(x − y) l mg mÿ = − y − k(y − x) . l mẍ = − Dabei bezeichnet g wie üblich die Erdbeschleunigung. Setzen wir – um die Rechnung zu vereinfachen – (13.9) a = g k , b = , l m so erhalten wir das lineare Differentialgleichungssystem (13.10) ẍ = −(a + b)x + by ÿ = bx − (a + b)y . Zwar handelt es sich hier um ein Differentialgleichungssystem, in dem zweite Ableitungen auftreten. Führt man aber als neue unbekannte Funktionen die ersten Ableitungen ẋ, ẏ ein, so erhält man unmittelbar ein lineares autonomes System von vier Differentialgleichungen für vier unbekannte Funktionen. Zu dessen Lösung stehen uns die beiden oben beschriebenen Wege zur Verfügung. Wir beschreiten hier den zweiten, der darin besteht, dass wir durch Elimination der einen Funktion eine Differentialgleichung 4. Ordnung für die andere Funktion gewinnen. Dabei können wir natürlich direkt vom System (13.10) ausgehen und brauchen nicht zuerst zu einem System erster Ordnung überzugehen. Wir lösen zuerst die erste Gleichung nach y auf (13.11) y = ẍ a + b + x. b b Ableiten nach t liefert .... (13.12) ÿ = x a+b + ẍ . b b Andererseits liefert die zweite Gleichung des Systems mit (13.11) 112 (13.13) U. Stammbach: Analysis, Teil C ÿ = bx − a+b (a + b)2 ẍ − x. b b Aus (13.12) und (13.13) erhalten wir (13.14) .... x +2(a + b)ẍ + (a2 + 2ab)x = 0 . Dies ist eine lineare homogene Differentialgleichung mit konstanten Koeffizienten. Das zugehörige charakteristische Polynom lautet α → α4 + 2(a + b)α2 + (a2 + 2ab) . Es hat vier verschiedene, rein imaginäre Nullstellen α1,2 = (13.15) √ ± −a q =: ±iω , α3,4 = ± −(a + 2b) =: ±iσ . Daraus ergibt sich für die allgemeine Lösung von (13.14), x(t) = C1 cos(ωt) + C2 sin(ωt) + C3 cos(σt) + C4 sin(σt) . Die Gleichung (13.11) liefert die zugehörige Funktion t → y(t) y(t) = C1 cos(ωt) + C2 sin(ωt) − C3 cos(σt) − C4 sin(σt) . Betrachten wir zum Schluss noch die Anfangsbedingung x(0) = x0 , ẋ(0) = 0, y(0) = 0, ẏ(0) = 0 , so erhalten wir für die Konstanten C1 , C2 , C3 , C4 das Gleichungssystem C1 + C 3 ωC2 + σC4 C1 − C3 ωC2 − σC4 = x0 = 0 = 0 = 0 . 113 Kapitel VII. Differentialgleichungen Dieses liefert sofort C1 = C3 = x0 /2, C2 = C4 = 0. Die zugehörige Lösung des Systems (13.10) lautet also x(t) = x0 (cos(ωt) + cos(σt)) , 2 y(t) = x0 (cos(ωt) − cos(σt)) . 2 (13.16) Dabei sind die Kreisfrequenzen ω und σ nach (13.15) und (13.9) gegeben durch g l g k σ 2 = a + 2b = + 2 l m ω2 = (13.17) a = , . Schliesslich können wir die Formeln von (13.16) mit Hilfe goniometrischer Identitäten in der folgenden Form schreiben σ−ω x(t) = x0 cos t 2 σ−ω y(t) = x0 sin t 2 σ+ω cos t 2 σ+ω sin t 2 . Ist nun k/m verglichen mit g/l klein (“schwache Kopplung”), so ist wegen (13.17) die Differenz σ−ω σ −ω ebenfalls klein. Dies bedeutet, dass sich der Faktor cos( σ−ω 2 t) bzw. sin( 2 t) nur langsam ändert. Die Funktionen t → x(t), t → y(t) können deshalb als Schwingungen mit Kreisfrequenz (σ + ω)/2 und variabler Amplitude angesehen werden. Die Amplituden sind durch x0 cos σ−ω t 2 bzw. x0 sin σ−ω t 2 gegeben. Dies beschreibt den “Schwebungscharakter” der Lösung (13.16): die Energie geht periodisch von einem Pendel auf das andere Pendel über. 114 U. Stammbach: Analysis, Teil C (x) Fig. 2 : Die Auslenkung des linken Pendels (t) (y) Fig. 3 : Die Auslenkung des rechten Pendels (t) 115 Kapitel VII. Differentialgleichungen 14 Stabilitätsverhalten In diesem Abschnitt diskutieren wir das Stabilitätsverhalten der Lösungen eines autonomen Differentialgleichungssystems. Dabei beschränken wir uns auf lineare Differentialgleichungssysteme mit konstanten Koeffizienten, weil in diesem Fall die Behandlung recht einfach ist, andererseits aber doch die wesentlichen Punkte illustriert werden können. Es sei ~x˙ = A~x (14.1) ein lineares autonomes Differentialgleichungssystem mit konstanten Koeffizienten mit " ~x(t) = x1 (t) x2 (t) # " , ~x˙ (t) = ẋ1 (t) ẋ2 (t) # " , A= a11 a12 a21 a22 # . Ein solches System (14.1) besitzt offensichtlich den Gleichgewichtspunkt (0, 0). Es geht in diesem Abschnitt um die “Stabilität” dieses Gleichgewichtspunktes, d.h. um das Verhalten der Lösungen in der Nähe dieses Punktes. Zu diesem Zweck lösen wir das System (14.1), in dem wir es auf eine Differentialgleichung zweiter Ordnung zurückführen. Wir erhalten durch Elimination von x2 leicht (14.2) ẍ1 − (a11 + a22 )ẋ1 + (a11 a22 − a12 a21 )x1 = 0 . Auf analoge Weise erhält man durch Elimination von x1 eine Differentialgleichung für x2 . Die allgemeine Lösung von (14.2) hängt von den Nullstellen α1 , α2 des zugehörigen charakteristischen Polynoms, d.h. von den Lösungen der Gleichung (14.3) α2 − (a11 + a22 )α + (a11 a22 − a12 a21 ) = 0 ab. Der Leser stellt natürlich sofort fest, dass das charakteristische Polynom der Differentialgleichung (14.2) nichts anderes ist als das charakteristische Polynom der Matrix A im Sinne der linearen Algebra. Daraus folgt unter anderem, dass die aus dem System (14.1) gewonnenen Differentialgleichungen zweiter Ordnung für x1 und x2 beide zum gleichen charakteristischen Polynom und deshalb im wesentlichen auch zu denselben Lösungsfunktionen führen. Diese sind nur abhängig von den Eigenwerten der Matrix A. Insbesondere wird das Stabilitätsverhalten des Gleichgewichtspunktes (0, 0) von diesen Eigenwerten bestimmt. Es gilt nun, die verschiedenen Fälle zu diskutieren. 116 U. Stammbach: Analysis, Teil C 1. α1 ≤ α2 < 0 . In diesem Fall sind die Funktionen x1 und x2 beide von der Form C1 eα1 t + C2 eα2 t bzw. C1 eα1 t + C2 teα2 t . Sie nehmen deshalb mit zunehmendem t exponentiell ab. Sämtliche Trajektorien laufen mit wachsendem t asymptotisch in den Nullpunkt hinein. Der Gleichgewichtspunkt heisst in diesem Fall asymptotisch stabil. Beispiel Das zum gedämpften harmonischen Oszillator gehörige System ẋ1 = x2 ẋ2 = −ω 2 x1 − 2λx2 liefert im Fall starker Dämpfung λ ≥ ω ein Beispiel für diesem Fall. Die Eigenwerte sind beide negativ. Das Phasenporträt lässt sich leicht berechnen (siehe Figur 1). 2. α1 < 0 < α2 . Die Funktionen x1 und x2 setzen sich in diesem Fall aus einem exponentiell zunehmenden und einem exponentiell abnehmenden Anteil zusammen. Jede Trajektorie “flieht” den Nullpunkt und läuft mit zunehmendem t ins Unendliche. Der Gleichgewichtspunkt ist instabil. Beispiel Das Differentialgleichungssystem ẋ1 = x2 ẋ2 = 2x1 , (das zwei Populationen beschreibt, die in Symbiose leben) ist von dieser Art. Die Eigenwerte sind reell und haben verschiedenes Vorzeichen. Das Phasenporträt zeigt im Nullpunkt einen “Sattel” (siehe Figur 3). 3. 0 < α1 ≤ α2 . Die Funktionen x1 und x2 nehmen mit wachsendem t exponentiell zu; die Trajektorien “fliehen” deshalb den Nullpunkt. Dieser ist instabil. Beispiel ẋ1 = x1 ẋ2 = x1 + x2 . Hier hat man einen zweifachen positiven Eigenwert. Das Phasenporträt zeigt aus dem Nullpunkt herauslaufende Trajektorien (siehe Figur 2). 117 Kapitel VII. Differentialgleichungen (y) (x) Fig. 1 : Phasenporträt für zwei verschiedene Eigenwerte mit gleichem Vorzeichen. Für positives Vorzeichen laufen die Trajektorien vom Nullpunkt weg, für negatives Vorzeichen laufen sie in den Nullpunkt hinein. (y) (x) Fig. 2 : Phasenporträt für einen doppelten Eigenwert (Beispiel unter Punkt 3). Für positives Vorzeichen laufen die Trajektorien vom Nullpunkt weg, für negatives Vorzeichen laufen sie in den Nullpunkt hinein. 118 U. Stammbach: Analysis, Teil C (y) Fig. 3 : Phasenporträt für Eigenwerte mit verschiedenen Vorzeichen (Beispiel unter Punkt 2). (x) 4. α1 , α2 konjugiert komplex. Dieser Fall spaltet in drei Unterfälle auf. 4.1. α1 , α2 konjugiert komplex, rein imaginär, α1 = ib, α2 = −ib . Die Funktionen x1 und x2 sind in diesem Fall harmonische Schwingungen mit Kreisfrequenz b C1 cos(bt) + C2 sin(bt) . Dies führt im Phasenporträt zu periodisch durchlaufenen Trajektorien “um den Gleichgewichtspunkt herum”. Insbesondere sind die Trajektorien beschränkt. Der Gleichgewichtspunkt ist stabil (aber nicht asymptotisch stabil). Beispiel Der ungedämpfte harmonische Oszillator liefert ein Beispiel für diesen Fall: ẋ1 = ẋ2 = −ω 2 x1 x2 . Das Phasenporträt zeigt Ellipsen um den Ursprung herum, die im Uhrzeigersinn durchlaufen werden (siehe Figur 4). 4.2. α1 , α2 konjugiert komplex mit positivem Realteil, α1 = a + ib , α2 = a − ib , a > 0 . Die Funktionen x1 und x2 haben die Form 119 Kapitel VII. Differentialgleichungen (y) (x) Fig. 4 : Phasenporträt für rein imaginäre Eigenwerte (Beispiel unter Punkt 4.1). (y) (x) Fig. 5 : Phasenporträt für komplexe Eigenwerte mit nichttrivialem Realteil. Ist der Realteil positiv (siehe Punkt 4.2) so laufen die Trajektorien vom Nullpunkt weg, ist der Realteil negativ (siehe Punkt 4.3) so laufen die Trajektorien in den Nullpunkt hinein. 120 U. Stammbach: Analysis, Teil C eat (C1 cos(bt) + C2 sin(bt)) , a > 0. Dies führt zu Exponentialspiralen als Trajektorien, die wegen a > 0 nach aussen, vom Nullpunkt weg durchlaufen werden. Der Gleichgewichtspunkt ist instabil (“instabiler Strudelpunkt”). Beispiel ẋ1 = x1 − x2 ẋ2 = x1 + x2 . Die Eigenwerte sind α1 = 1 + i , α2 = 1 − i . 4.3. α1 , α2 konjugiert komplex mit negativem Realteil, α1 = a+ib , α2 = a−ib , a < 0 . Die Funktionen x1 und x2 haben die Form eat (C1 cos(bt) + C2 sin(bt)) , a < 0 . Dies führt im Phasenporträt zu Exponentialspiralen, die nach innen durchlaufen werden. Der Gleichgewichtspunkt ist asymptotisch stabil (“stabiler Strudelpunkt”). Beispiel Der schwach gedämpfte harmonische Oszillator, λ < ω ẋ1 = x2 ẋ2 = −ω 2 x1 − 2λx2 liefert ein Beispiel für diesen Fall. Das Phasenporträt zeigt im Ursprung einen stabilen Strudelpunkt. Die Fälle, wo einer oder beide der Eigenwerte α1 , α2 Null sind, heissen ausgeartet und spielen eine kleinere Rolle. Natürlich können sie aber in diesem Zusammenhang ebenfalls diskutiert werden. Wir überlassen die Details dem Leser. Analysis I/II U. Stammbach Professor an der ETH-Zürich Kapitel VIII. Potenzreihen lue wo schteisch und wo geisch süsch weisch wenn gheisch nid wo ligsch Ernst Burren Inhaltsverzeichnis 1 Zu Konvergenz und Divergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . 3 2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Das Taylorsche Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3 Kapitel IX. Potenzreihen 1 Zu Konvergenz und Divergenz von Reihen Die (unendliche) Reihe (1.1) ∞ X ak = a0 + a1 + a2 + · · · , a0 , a1 , a2 , . . . ∈ R , k=0 besitzt die Glieder a0 , a1 , a2 , . . . und die Partialsummen s0 , s1 , s2 , . . ., s0 = a0 s1 = a0 + a1 s2 = a0 + a1 + a2 .. . sn = a0 + a1 + a2 + · · · + an . Konvergiert die Folge s0 , s1 , s2 , . . . der Partialsummen gegen s, so heisst die Reihe (1.1) konvergent, und s heisst deren Summe. Dann schreiben wir ∞ X ak = s . k=0 Divergiert die Folge der Partialsummen, so heisst die Reihe (1.1) divergent. Beispiel Die geometrische Reihe mit Faktor x, 1 + x + x 2 + x3 + · · · , besitzt die Glieder ak = xk , k = 0, 1, 2, . . . . Sie konvergiert für |x| < 1 (siehe Kapitel I, Abschnitt 1). In diesem Fall ist ihre Summe gegeben durch 1 + x + x 2 + x3 + · · · = 1 . 1−x Für |x| ≥ 1 divergiert die geometrische Reihe. Im Bereich der Konvergenz, d.h. im Intervall (−1, +1) definiert die geometrische Reihe eine Funktion, nämlich x → 1/(1 − x) (siehe Kapitel I, Abschnitt 1). 4 U. Stammbach: Analysis, Teil C Beispiel Für |x| < 1 gilt offenbar 1 1 = = 1 − x + x 2 − x3 + · · · . 1+x 1 − (−x) Beispiel Für |x| < 1 gilt offenbar 1 1 = = 1 − x 2 + x4 − x6 + · · · . 1 + x2 1 − (−x2 ) Beispiel Die sogenannte harmonische Reihe 1+ 1 1 1 + + + ··· 2 3 4 divergiert (siehe Kapitel I, Abschnitt 1). 0.9 0.8 Fig. 1 : Die Partialsummen der alternierenden harmonischen Reihe 0.7 0.6 0.5 10 20 30 40 50 Beispiel Die sogenannte alternierende harmonische Reihe (siehe Figur 1) 1− 1 1 1 + − + ··· 2 3 4 5 Kapitel IX. Potenzreihen konvergiert. Um dies einzusehen, bemerken wir zuerst das Folgende. Wegen sn = 1 − 1 1 1 1 + − · · · + (−1)n = sn−1 + (−1)n 2 3 n+1 n+1 gilt sn − sn−1 = (−1)n 1 . n+1 Tragen wir die Werte der Partialsummen als Punkte auf der Zahlgeraden ab, so ist der Schritt von sn−1 zu sn wegen dem Vorzeichen alternierend einmal nach links und dann nach rechts zu tun. Ausserdem strebt die Schrittlänge mit zunehmendem n gegen Null. Die Folge der Partialsummen der alternierenden harmonischen Reihen konvergiert deshalb, und zwar liegt offenbar der Limes s für jedes n zwischen sn−1 und sn . Wie gross dieses s ist, lässt sich numerisch angenähert bestimmen; allerdings konvergiert die alternierende harmonische Reihe sehr langsam. Wir werden weiter unten diese Summe auf überraschende Weise, d.h. nicht “nur” numerisch beschreiben können. Wir entnehmen diesen wenigen Beispielen sofort die zwei folgenden allgemeinen Erkenntnisse. Satz Konvergiert die Reihe P∞ k=0 ak = a0 + a1 + a2 + · · · (gegen s ), so gilt limk→∞ ak = 0 . In der Tat gilt ja sn − sn−1 = an und ein Grenzübergang n → ∞ liefert lim an = lim sn − lim sn−1 = s − s = 0 . n→∞ n→∞ n→∞ Die harmonische Reihe zeigt, dass aus |an | < |an−1 | für alle n und lim an = 0 n→∞ nicht notwendigerweise folgt, dass die Reihe konvergiert. Die Überlegung, die wir im Falle der alternierenden harmonischen Reihe angestellt haben, liefert aber das folgende nützliche Resultat. P Satz Die Reihe ∞ k=0 ak = a0 + a1 + a2 + · · · sei alternierend (die Vorzeichen wechseln ab). Gilt ausserdem |an | < |an−1 | für alle n ≥ 1 und limn→∞ an = 0 , so konvergiert die Reihe. 6 2 U. Stammbach: Analysis, Teil C Potenzreihen Unter einer Potenzreihe verstehen wir eine Reihe der Form (2.1) ∞ X ak xk = a0 + a1 x + a2 x2 + · · · , k=0 wobei wir nur den Fall betrachten, wo die Koeffizienten a0 , a1 , a2 , . . . reelle Zahlen sind. Die Menge der x-Werte, für die die Potenzreihe (2.1) konvergiert, heisst ihr Konvergenzbereich. Im Konvergenzbereich definiert eine Potenzreihe eine Funktion, deren Werte sich mit beliebiger Genauigkeit numerisch bestimmen lassen. Beispiel Die geometrische Reihe 1 + x + x 2 + x3 + · · · ist eine Potenzreihe mit ak = 1 für k = 0, 1, 2, . . .. Ihr Konvergenzbereich ist das Intervall (−1, +1). In diesem Intervall liefert die geometrische Reihe eine andere Beschreibung für die Funktion x → 1/(1 − x). Nicht immer lässt sich die Summe einer Potenzreihe auf so einfache Weise angeben. Dazu trägt nicht nur die uns schon bekannte allgemeine Schwierigkeit bei, die Summe einer Reihe zu bestimmen, sondern es ist oft so, dass konvergierende Potenzreihen Funktionen beschreiben, die sich mit den sonst üblichen, elementaren Funktionszeichen nicht ausdrücken lassen. Beispiele dazu werden wir weiter unten explizit kennenlernen. Über den Konvergenzbereich einer Potenzreihe kennt der Mathematiker einen einfachen schönen Satz, den wir hier ohne Beweis aufführen (siehe Figur 1). Satz Der Konvergenzbereich einer Potenzreihe ∞ X ak xk = a0 + a1 x + a2 x2 + · · · k=0 ist ein offenes, halboffenes oder abgeschlossenes Intervall mit 0 als Mittelpunkt. Man nennt die halbe Länge des Konvergenzintervalles auch etwa Konvergenzradius. Über das Konvergenz- bzw. Divergenzverhalten in den Endpunkten des Konvergenzintervalles lassen sich keine allgemeinen Aussagen machen: Alle überhaupt möglichen Fälle treten bei konkreten Potenzreihen auch wirklich auf. 7 Kapitel IX. Potenzreihen Konvergenz oder Divergenz Divergenz Konvergenz oder Divergenz Konvergenz Fig. 1 : Der Konvergenzbereich einer Potenzreihe ist ein offenes, halboffenes oder abgeschlossenes Intervall. Divergenz (x) Konvergenzbereich Wichtig ist nun, dass sich Potenzreihen im Innern ihres Konvergenzintervalles harmlos verhalten. Es gilt der folgende zentrale und bequeme(!) Satz, den wir hier ebenfalls ohne Beweis aufführen. Satz Im Innern des Konvergenzintervalles darf man mit Potenzreihen wie mit Polynomen rechnen. Inbesondere darf man gliedweise addieren, subtrahieren, multiplizieren, differenzieren und integrieren. Beispiel Für |x| < 1, d.h. im Konvergenzintervall der geometrischen Reihe gilt 1 1 1 = = (1 − x + x2 − · · ·)(1 + x + x2 + · · ·) = 1 + x2 + x4 + · · · . 2 1−x 1+x 1−x Beispiel Für |x| < 1, d.h. im Konvergenzintervall der geometrischen Reihe gilt (2.2) log(1 + x) = Z 0 x 1 dt = 1+t Z 0 x (1 − t + t2 − · · ·) dt = x − x 2 x3 + − ··· . 2 3 In den Randpunkten stellte man hier fest: Für x = −1 erhält man die harmonische Reihe, man hat also Divergenz. Für x = +1 erhält man die alternierende harmonische Reihe, man hat also 8 U. Stammbach: Analysis, Teil C Konvergenz. Man kann ferner zeigen, dass die Gleichung (2.2) auch für den Randpunkt x = 1 gilt. Daraus ergibt sich als Summe der alternierenden harmonischen Reihe log 2. Beispiel Gehen wir aus von der für |t| < 1 konvergenten Reihe 1 = 1 − t2 + t4 − · · · , 1 + t2 so liefert die Integration für |x| < 1 arctan x = Z 0 x 1 x 3 x5 dt = x − + − ··· . 1 + t2 3 5 Zum Schluss dieses Abschnittes merken wir noch an, dass man auch Potenzreihen mit Mittelpunkt x0 , x0 6= 0 betrachten kann. Setzt man nämlich in der Potenzreihe ∞ X ak tk k=0 für t die Differenz x − x0 ein, so erhält man die Reihe ∞ X ak (x − x0 )k , k=0 eine Potenzreihe mit Mittelpunkt x0 . Natürlich ist der Konvergenzbereich einer solchen Reihe ein offenes, halboffenes oder abgeschlossenes Intervall mit Mittelpunkt x0 . Beispiel Die Funktion x → 1/(x + 2) soll, wenn möglich, in eine Potenzreihe mit Mittelpunkt x0 = 1 entwickelt werden. Wir erreichen dieses Ziel wie folgt 1 1 1 = = x+2 3 + (x − 1) 3 " 1 x−1 = 1− + 3 3 x−1 3 2 # + ··· = 1 = x−1 1+ 3 1 1 1 − (x − 1) + 3 (x − 1)2 + · · · 3 32 3 Diese Reihe konvergiert für |(x − 1)/3| < 1 d.h. im Intervall (−2, 4). 9 Kapitel IX. Potenzreihen 3 Das Taylorsche Polynom Als Vorbereitung betrachten wir hier zuerst das folgende einfache Problem. Für ein Polynom n-ten Grades x → P (x), schreiben wir den Wert P (x0 ) in x0 und die Werte der ersten n Ableitungen P 0 (x0 ), P 00 (x0 ), . . . , P (n) (x0 ) vor. Gesucht sind die n + 1 Koeffizienten von P . Der Ansatz P (x) = b0 + b1 x + b2 x2 + · · · + bn xn liefert offenbar das lineare Gleichungssystem b0 + b1 x0 + b2 x20 + b3 x30 + · · · + bn xn0 = P (x0 ) b1 + 2b2 x0 + 3b3 x20 + · · · + nbn xn−1 = P 0 (x0 ) 0 .. . n(n − 1)(n − 2) · · · 2 · 1bn = P (n) (x0 ) . Dieses lässt sich leicht lösen, indem man mit der letzten Gleichung beginnt. Wir verzichten hier auf die explizite Angabe der Lösungen und verfolgen statt dessen noch einen weiteren Lösungsweg, der von einem andern Ansatz für P (x) ausgeht. Wir setzen P (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n . Da die Ableitungen von x → P (x) durch P 0 (x) = a1 + 2a2 (x − x0 ) + 3a3 (x − x0 )2 + · · · + nan (x − x0 )n−1 P 00 (x) = 2a2 + 3 · 2a3 (x − x0 ) + · · · + n(n − 1)an (x − x0 )n−2 .. . P (n) (x) = n(n − 1)(n − 2) · · · 2 · 1an gegeben sind, erhalten wir für die Koeffizienten a0 , a1 , a2 , . . . , an ohne Schwierigkeit 10 U. Stammbach: Analysis, Teil C a0 = P (x0 ), a1 = P 0 (x0 ), a2 = 1 00 1 P (x0 ), . . . , an = P (n) (x0 ) . 2 n! Beispiel Gesucht ist das Polynom dritten Grades mit P (1) = P 0 (1) = P 00 (1) = P 000 (1) = 6 . Nach obigem erhalten wir P (x) = 6 + 6 6 6 (x − 1) + (x − 1)2 + (x − 1)3 = x3 + 3x + 2 . 1! 2! 3! Gegeben sei nun eine Funktion x → f (x), und es sei x0 ein (innerer) Punkt des Definitionsbereiches von f . Als eine der ersten Anwendungen der Differentialrechnung haben wir gelernt (siehe Kapitel II, Abschnitt 2), die Funktion f in x0 zu “linearisieren”, d.h. die Funktion f durch diejenige lineare Funktion P zu ersetzen, die in x0 denselben Wert annimmt wie f , P (x0 ) = f (x0 ), und dort auch die gleiche erste Ableitung besitzt, P 0 (x0 ) = f 0 (x0 ). Dies ist für das Polynom P ersten Grades gerade das oben diskutierte Problem. Wir erhalten für P (3.1) x → P (x) = f (x0 ) + f 0 (x0 )(x − x0 ) , in Übereinstimmung mit der uns schon bekannten Formel für die lineare Ersatzfunktion. Wir erinnern auch daran, dass die lineare Ersatzfunktion (3.1) in der Umgebung von x0 die Funktion f gut approximiert. Allgemeiner können wir nun natürlich auch nach dem Polynom n-ten Grades x → Pn (x) fragen, welches in x0 denselben Wert annimmt wie f , Pn (x0 ) = f (x0 ) und dort auch die gleichen n ersten Ableitungen besitzt Pn0 (x0 ) = f 0 (x0 ), Pn00 (x0 ) = f 00 (x0 ), . . . , Pn(n) (x0 ) = f (n) (x0 ) . Offenbar ist Pn gegeben durch Pn (x) = f (x0 ) + f 0 (x0 ) f 00 (x0 ) f 000 (x0 ) f (n) (x0 ) (x − x0 ) + (x − x0 )2 + (x − x0 )3 + · · · + (x − x0 )n . 1! 2! 3! n! Das Polynom Pn heisst das Taylorpolynom n-ten Grades von f in x0 . Das Taylorpolynom ersten Grades ist die lineare Ersatzfunktion. Man könnte deshalb statt vom Taylorpolynom n-ten Grades auch vom Ersatzpolynom n-ten Grades sprechen. Neben der linearen Approximation hat man somit auch eine quadratische Approximation (n = 2), und allgemeiner eine Approximation n-ten Grades. Beispiel Für die Sinusfunktion x → sin x bestimme man das Taylorpolynom P2 zweiten Grades in x0 = π/6. Wir erhalten (siehe Figur 1) 11 Kapitel IX. Potenzreihen f 0 (x0 ) f 00 (x0 ) P2 (x) = f (x0 ) + (x − x0 ) + (x − x0 )2 1! 2! √ 3 1 π 1 π 2 = x− − x− . + 2 2 6 4 6 1 Fig. 1 : Das lineare und quadratische Taylorpolynom für x → sin x in x0 = π/6 sin x π/6 (x) Man vermutet natürlich, dass das Taylorpolynom n-ten Grades von f in x0 die Funktion f in der Umgebung von x0 “gut” approximieren, und zwar “umso besser”, je höher der Grad n des Taylorpolynoms ist. Für sehr viele Funktionen ist das tatsächlich der Fall. Wir illustrieren den Sachverhalt an den folgenden beiden Beispielen. Beispiel Gegeben sei die Funktion f : x → ex . Wegen f 0 (x) = f 00 (x) = . . . = f (n) (x) = ex erhalten wir für das Taylorpolynom n-ten Grades Pn in x0 = 0 Pn (x) = 1 + x + 1 2 1 1 x + x3 + · · · + xn . 2! 3! n! Unsere Vermutung bestätigend stellen wir fest, dass Pn für f eine “gute” Approximation ist und zwar eine “umso bessere” (d.h. insbesondere in einem umso grösseren Intervall mit Mittelpunkt 12 U. Stammbach: Analysis, Teil C x0 = 0) je grösser der Grad n des Taylorpolynoms Pn ist. Die Figuren 2,3,4 machen diesen Sachverhalt auch optisch klar. 1.1 -0.1 0.1 (0, 1) Fig. 2 : Die lineare Ersatzfunktion von x → ex in x0 = 0 ist im Intervall [−0.1, 0.1] eine gute Approximation 0.9 Beispiel Gegeben sei die Funktion f : x → cos x und x0 = 0. Wegen f 0 (x) = − sin x, f 00 (x) = − cos x, f 000 (x) = sin x, f 0000 (x) = cos x, . . . ist das Taylorpolynom (2n)-ten Grades von f in x0 gegeben durch P2n (x) = 1 − 1 1 2 1 1 x + x4 − x6 + · · · + (−1)n x2n . 2! 4! 6! (2n)! Auch hier stellt man fest, dass P2n für f eine “gute” Approximation ist: Das zu x0 = 0 symmetrisch liegende Intervall, in dem die Approximation von cos x durch P2n (x) “gut” ist, wird dabei mit wachsendem Grad des Polynoms immer grösser und grösser (siehe Figur 2 in Abschnitt 4). Wie für die lineare Ersatzfunktion, so kann die Mathematik auch für die höheren Taylorpolynome Aussagen über die “Güte” der Approximation d.h. über den “Fehler” f (x) − Pn (x) machen. Auf diese sogenannten Restgliedabschätzungen gehen wir hier aber nicht ein. 13 Kapitel IX. Potenzreihen 1.5 -0.5 0.5 (0, 1) Fig. 3 : Im Intervall [−0.5, 0.5] ist die Approximation durch die lineare Ersatzfunktion von x → ex in x0 = 0 nicht mehr genügend gut, hingegen ist die Approximation durch die quadratische Ersatzfunktion noch befriedigend 0.5 3 2 -1.2 1.2 (0, 1) 0 Fig. 4 : Im Intervall [−1.2, 1.2] genügt auch die quadratische Ersatzfunktion von x → ex in x0 = 0 nicht mehr, erst die kubische liefert ein befriedigende Approximation 14 4 U. Stammbach: Analysis, Teil C Die Taylorreihe Es sei wiederum f : x → f (x) eine beliebig oft differenzierbare Funktion und x0 ein innerer Punkt des Definitionsbereiches. Die Formel für das Taylorpolynom n-ten Grades Pn von f in x0 zeigt, dass diese Polynome als Partialsummen der Reihe (4.1) f (x0 ) + f 0 (x0 ) f 00 (x0 ) f (n) (x0 ) (x − x0 ) + (x − x0 )2 + · · · + (x − x0 )n + · · · 1! 2! n! aufgefasst werden können. Die Reihe (4.1) heisst die Taylorreihe von f mit Mittelpunkt x0 . Man beachte, dass man die Reihe (4.1) hinschreiben kann, ohne über deren Konvergenz oder Divergenz eine Aussage zu machen. Da sie eine Potenzreihe mit Mittelpunkt x0 ist, wissen wir aber immerhin, dass ihr Konvergenzbereich ein offenes, halboffenes oder abgeschlossenes Intervall mit Mittelpunkt x0 ist. Es kann vorkommen, dass die Reihe nirgends, ausser natürlich in x0 konvergiert. Dies ist aber eher der Ausnahmefall. Der Normalfall sieht anders aus: Für viele Funktionen konvergiert die Taylorreihe in einer echten Umgebung von x0 und ihre Summe stimmt im Konvergenzbereich sogar mit der Funktion f überein. Dieses Verhalten wird u.a. in den Beispielen des letzten Abschnitts über das Approximationsverhalten der Taylorpolynome von x → ex und x → cos x deutlich. Konvergiert die Taylorreihe für f mit Mittelpunkt x0 in einem nichttrivialen Intervall, so spricht man auch etwa von der Taylorentwicklung von f in x0 . Beispiel Die Taylorreihe von x → ex mit Mittelpunkt x0 = 0 lautet 1+x+ 1 2 1 1 x + x3 + · · · + xn + · · · . 2! 3! n! Sie heisst auch Exponentialreihe (siehe Figur 1). Man kann zeigen, dass diese Reihe für alle x konvergiert und die Funktion x → ex darstellt. Wir dürfen deshalb schreiben ex = 1 + x + 1 2 1 1 x + x3 + · · · + xn + · · · . 2! 3! n! Beispiel Die Taylorreihe von x → cos x mit Mittelpunkt x0 = 0 lautet 1− 1 2 1 1 1 x + x4 − x6 + · · · + (−1)n x2n + · · · . 2! 4! 6! (2n)! Sie heisst auch etwa Cosinus-Reihe (siehe Figur 2). Auch hier kann man zeigen, dass die Reihe für alle x konvergiert und für alle x die Gleichung 15 Kapitel IX. Potenzreihen (y) Fig. 1 : Die ersten Partialsummen der Exponentialreihe; die Kurve y = ex ist gestrichelt eingezeichnet (x) (y) (x) Fig. 2 : Die ersten Partialsummen der Cosinus-Reihe; die Kurve y = cos x ist gestrichelt eingezeichnet 16 U. Stammbach: Analysis, Teil C cos x = 1 − 1 1 2 1 1 x + x4 − x6 + · · · + (−1)n x2n + · · · 2! 4! 6! (2n)! gilt. Beispiel Die Taylorreihe von x → sin x mit Mittelpunkt x0 = 0 lautet x− 1 3 1 1 1 x + x5 − x7 + · · · + (−1)n+1 x2n−1 + · · · . 3! 5! 7! (2n − 1)! Sie heisst Sinus-Reihe. Die Sinus-Reihe konvergiert ebenfalls für alle x, und es gilt die Gleichung sin x = x − 1 3 1 1 1 x + x5 − x7 + · · · + (−1)n+1 x2n−1 + · · · . 3! 5! 7! (2n − 1)! Die Beschäftigung der Mathematik mit Potenzreihen hat gezeigt, dass es Vorteile bietet, wenn man an Stelle der reellen Zahlen komplexe Zahlen zulässt. Es zeigt sich dann, dass der Konvergenzbereich einer Potenzreihe ∞ X ck (z − z0 )k , z, z0 , ck ∈ C k=0 in der komplexen Zahlebene ein Kreis mit Mittelpunkt z0 ist, wobei über das Konvergenzverhalten in den Punkten der Peripherie des Kreises keine einfachen allgemeinen Aussagen möglich sind. Man spricht dann natürlich vom Konvergenzkreis der Potenzreihe (siehe Figur 3). In diesem Zusammenhang klärt sich auch die Wahl des oben erwähnten Begriffes des Konvergenzradius zwanglos auf. Um die Nützlichkeit von komplexen Zahlen in diesem Zusammenhang zu illustrieren, betrachten wir noch das folgende Beispiel. Beispiel Wir berechnen mit Hilfe der Taylorreihen mit Mittelpunkt x0 = 0 die Grösse 1 1 1 1 1 1 cos x + i sin x = 1 − x2 + x4 − x6 + · · · + i x − x3 + x5 − x7 + · · · 2! 4! 6! 3! 5! 7! 1 1 = 1 + ix + (ix)2 + (ix)3 + · · · 2! 3! = eix . Es ist also hier die Euler’sche Formel, eix = cos x + i sin x mit Hilfe der entsprechenden Taylorreihen plausibel gemacht worden. 17 Kapitel IX. Potenzreihen Im z0 Fig. 3 : Konvergenzkreis in der komplexen Zahlebene r Re Wichtig für das Folgende ist nun der mathematische Satz, welcher besagt, dass eine Funktion f um den Punkt x0 höchstens eine Potenzreihenentwicklung zulässt. Satz Stellen zwei Potenzreihen mit Mittelpunkt x0 die gleiche Funktion dar, so stimmen sie in allen ihren Koeffizienten überein. Es gilt also: Konvergiert eine Potenzreihe mit Mittelpunkt x0 gegen eine Funktion f , so ist diese Potenzreihe automatisch die Taylorreihe von f mit Mittelpunkt x0 . Beispiel Wir haben in einem früheren Abschnitt nachgewiesen, dass im Intervall (−1, +1) die Gleichung log(1 + x) = Z x 0 1 dt = 1+t Z x 0 (1 − t + t2 − · · ·) dt = x − x 2 x3 + − ··· 2 3 gilt. Mit dem obigen Satz schliessen wir nun, dass diese Reihe die Taylorreihe von x → log(1+x) mit Mittelpunkt x0 = 0 ist. 18 U. Stammbach: Analysis, Teil C Beispiel Die früher hergeleitete, im Intervall (−1, +1) gültige Potenzreihenentwicklung arctan x = Z x 0 1 x 3 x5 dt = x − + − ··· 1 + t2 3 5 ist automatisch die Taylorentwicklung der Funktion x → arctan x um x0 = 0. Beispiel Gegeben sei die Funktion f : x → (1 + x)α , wo α eine reelle Zahl ist. Gesucht ist die Taylorentwicklung von f um x0 = 0. Für die Ableitungen von f erhalten wir f (x) = (1 + x)α f 0 (x) = α(1 + x)α−1 f 00 (x) = α(α − 1)(1 + x)α−2 .. . f (n) (x) = α(α − 1) · · · (α − n + 1)(1 + x)α−n . Definieren wir, als Verallgemeinerung des wohlbekannten Binomialkoeffizienten, α 0 ! α n =1, ! α(α − 1) · · · (α − n + 1) , n = 1, 2, 3, . . . , n! = so lautet die Taylorreihe von f mit Mittelpunkt x0 = 0 α 1 1+ (4.2) ! α 2 x+ ! α 3 2 x + ! α 4 3 x + ! x4 + · · · . Man nennt (4.2) die Binomialreihe zum Exponenten α. Für α = −1 erhält man die uns gut bekannte geometrische Reihe mit Faktor −x (siehe Figur 4). Man kann zeigen, dass die Binomialreihe für jedes α wenigstens im Intervall (−1, +1) konvergiert und dass in diesem Intervall die Gleichung α (1 + x) = 1 + α 1 ! x+ α 2 ! 2 x + α 3 ! 3 x + α 4 ! 4 x + ··· = ∞ X n=0 α n ! xn gilt. Man beachte, dass der Konvergenzbereich auch grösser sein kann. Ist nämlich α eine positive ganze Zahl, so bricht die Reihe (4.2) nach endlich vielen Gliedern ab (man erhält ein Polynom!), und dementsprechend besteht in diesem Fall der Konvergenzbereich aus allen reellen Zahlen. 19 Kapitel IX. Potenzreihen (y) 2 Fig. 4 : Die ersten Partialsummen der geometrischen Reihe mit Faktor −x; die Kurve y = 1/(1 − x) ist gestrichelt eingezeichnet 1 (x) -1 1 Beispiel Die Funktion p x → 1/ 1 − x2 = (1 − x2 )−1/2 hat die für |x| < 1 gültige Taylorentwicklung 1+ − 12 1 (−x2 ) + − 12 − 32 − 12 − 32 − 52 (−x2 )2 + 1·2 1·2·3 1 1·3 4 1·3·5 6 = 1 + x2 + x + x + ··· . 2 2·4 2·4·6 (−x2 )3 + · · · = Integration liefert daraus die für denselben Bereich gültige Potenzreihenentwicklung arcsin x = Z x 0 √ 1 1 x3 1 · 3 x 5 1 · 3 · 5 x 7 dt = x + + + + ··· . 2 3 2·4 5 2·4·6 7 1 − t2 Die Bestimmung der Koeffizienten der Taylorentwicklung einer Funktion f kann sehr aufwendig sein, weil man dafür ja die Ableitungen beliebig hoher Ordnung von f kennen muss. In vielen Fällen ist es deshalb einfacher, die Koeffizienten auf andere Weise zu bestimmen. Beispiele 20 U. Stammbach: Analysis, Teil C dafür haben wir bereits bei der geometrischen Reihe kennengelernt und bei den vielen aus der geometrischen Reihe hergeleiteten Reihentwicklungen. Als weiteres Beispiel wollen wir hier die Tangens-Reihe bestimmen und zwar mit Hilfe der Methode des Koeffizientenvergleichs. Beispiel Bekanntlich gilt tan x = sin x cos x also cos x · tan x = sin x . Machen wir den Ansatz tan x = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · und benützen wir die uns bekannten Sinus- und Cosinus-Reihen, so erhalten wir 1− 1 2 1 1 x + x4 − x6 + · · · · c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · = 2! 4! 6! =x− c0 + c1 x + c2 − 1 3 1 1 x + x5 − x7 + · · · 3! 5! 7! c0 c1 c2 c0 c3 c1 x2 + c3 − x3 + c4 − x4 + c5 − x5 + · · · = + + 2! 2! 2! 4! 2! 4! =x− 1 3 1 1 x + x5 − x7 + · · · . 3! 5! 7! Da links und rechts dieselbe Funktion beschrieben wird, also nach unserem Satz die beiden Reihen in allen ihren Koeffizienten übereinstimmen müssen, erhalten wir das folgende Gleichungssystem für die (unendlich vielen) Koeffizienten ci c0 c1 = = 0 1 0 c2 − c0 2! = c3 − c1 2! = − c4 − c2 c0 + 2! 4! c5 − c3 c1 + 2! 4! = = .. . 1 3! 0 1 5! 21 Kapitel IX. Potenzreihen Dieses System ist – wie man sagt – rekursiv auflösbar; man erhält 1 2 c0 = 0, c1 = 1, c2 = 0, c3 = , c4 = 0, c5 = , . . . 3 15 Der Beginn der Potenzreihenentwicklung von x → tan x lautet also 1 2 x + x3 + x 5 + · · · 3 15 Man kann zeigen, dass die so erhaltene Reihe für |x| < π/2 konvergiert. Die Koeffizienten der Tangensreihe gehorchen interessanten, aber komplizierten Bildungsgesetzen, auf die wir hier nicht eingehen. Leicht lässt sich allerdings aus dem Gleichungssystem herleiten, dass die Koeffizienten mit geradem Index alle verschwinden. Ganz ähnlich liegt die Sache bei der Sinus-Reihe, wo ebenfalls nur die Koeffizienten mit ungeradem Index auftreten, während bei der Cosinus-Reihe nur Koeffizienten mit geradem Index von Null verschieden sind. In der Tat gilt ganz allgemein der folgende Satz. Satz Die Taylorentwicklung um x0 = 0 einer ungeraden Funktion enthält nur Terme mit ungeradem Index; die Taylorentwicklung um x0 = 0 einer geraden Funktion enthält nur Terme mit geradem Index. Beweis Wir beweisen nur die Aussage über ungerade Funktionen. Das entsprechende Resultat über gerade Funktionen wird analog erhalten. Ist f eine ungerade Funktion, so gilt definitionsgemäss (4.3) f (−x) = −f (x) . Insbesondere ist f (0) = 0. Leitet man die Beziehung (4.3) ab, so erhält man (4.4) −f 0 (−x) = −f 0 (x) . d.h. f 0 ist eine gerade Funktion. Eine zweite Ableitung liefert dann aus (4.4) sofort (4.5) −f 00 (−x) = f 00 (x) d.h. f 00 ist wiederum eine ungerade Funktion, insbesondere gilt f 00 (0) = 0. Es folgt also, dass alle Ableitungen gerader Ordnung von f ungerade Funktionen sind, und dass diese deshalb in x0 = 0 den Wert Null annehmen. In der Taylorentwicklung der ungeraden Funktion f um x0 = 0 können deshalb nur Terme mit ungeradem Index vorkommen. 22 5 U. Stammbach: Analysis, Teil C Anwendungen In diesem letzten Abschnitt besprechen wir eine Reihe von Situationen, in denen die Idee der Potenzreihenentwicklung einer Funktion die Bearbeitung eines Problems jeweils einen Schritt weiterbringt. Beispiel Es ist der Ellipsenumfang zu berechnen. Die Ellipse, a ≥ b (siehe Figur 1), sei gegeben durch die Parameterdarstellung x = a cos t y = b sin t (y) Fig. 1 : Zum Umfang der Ellipse b a (x) Der Umfang ergibt sich dann mit der Formel für die Bogenlänge (Kapitel III, Abschnitt 8) zu U= Z 0 2π q ẋ2 + ẏ 2 dt = 4a Z π/2 0 s 1− a2 − b2 cos2 t dt = 4a a2 Z π/2 p 0 1 − k2 cos2 t dt . 23 Kapitel IX. Potenzreihen Dabei haben wir k2 = a2 − b2 a2 gesetzt. Es ist also 0 ≤ k2 < 1. Das hier auftretende Integral ist (für k 6= 0) nicht elementar lösbar. Es ist ein sogenanntes elliptisches Integral zweiter Art. Mit Hilfe einer Reihenentwicklung des Integranden kann man aber den Wert des Integrals als Reihe darstellen. Wir benützen dazu die für |x| < 1 gültige Reihenentwicklung √ 1 1·3 3 1 2 1−x=1− x− x − x − ··· . 2 2·4 2·4·6 Setzen wir x = k2 cos2 t, so erhalten wir U = 4a π/2 Z 0 1 1 4 1·3 6 1 − k2 cos2 t − k cos4 t − k cos6 t − · · · 2 2·4 2·4·6 dt . (U ) 2πa Fig. 2 : Der Umfang der Ellipse dargestellt als Reihe in k (k) 1 Die gliedweise Integration liefert dann wegen 24 U. Stammbach: Analysis, Teil C Z π/2 0 cos2n t dt = 1 · 3 · 5 · · · (2n − 3) · (2n − 1) π 2 · 4 · · · · (2n − 2) · (2n) 2 (Kapitel III, Abschnitt 6) eine Darstellung von U in Reihenform (siehe Figur 2) " U = 2πa 1 − 2 1 2 k2 − 1 1·3 2·4 2 k4 − 3 1·3·5 2·4·6 2 k6 − ··· 5 # . Die Reihe konvergiert für kleine k, d.h. für Ellipsen, die “kreisähnlich” sind, recht schnell und kann für die Berechnung des Umfanges ohne weiteres verwendet werden. Beispiel Es ist die Schwingungsdauer des mathematischen Pendels (ohne Linearisieren) zu berechnen. Wir haben bereits früher gesehen, dass im linearisierten Problem die Schwingungsdauer überraschenderweise unabhängig ist vom Maximalausschlag. Dies gilt – wie wir hier zeigen werden – für die nicht linearisierte Schwingung des mathematischen Pendels nicht mehr. ϕ α l cos α l cos ϕ l Fig. 3 : Zur Anwendung des Energiesatzes auf das mathematische Pendel m Statt mit der in Kapitel VII, p. 98 hergeleiteten Differentialgleichung zweiter Ordnung zu arbeiten, wenden wir den Energiesatz an. Ist α der maximale Ausschlag des Pendels (siehe Figur 3), so ergibt sich die Beziehung 25 Kapitel IX. Potenzreihen 1 m(lϕ̇)2 = mgl(cos ϕ − cos α) . 2 (Die frühere Differentialgleichung zweiter Ordnung wird daraus durch Ableitung nach t zurückerhalten!) Es folgt daraus die Differentialgleichung (erster Ordung) r ϕ̇ = 2g √ cos ϕ − cos α l für die Funktion t → ϕ(t). Sie lässt sich separieren. Man erhält s dt = l dϕ √ , 2g cos ϕ − cos α und die Schwingungsdauer T des mathematischen Pendels lässt sich als Integral hinschreiben T =4 Z T /4 0 s dt = 4 l 2g Z α 0 dϕ √ . cos ϕ − cos α In diesem Integral machen wir die Substitution sin ϕ 2 = sin α 2 · sin u und setzen k = sin α 2 . Wir erhalten α = 1 − 2k2 2 2 ϕ cos ϕ = 1 − 2 sin = 1 − 2k2 sin2 u 2 cos α = 1 − 2 sin 2 1 ϕ cos 2 2 dϕ = k cos u du ϕ cos 2 und daraus = 1 − sin 2 1/2 ϕ 2 = (1 − k2 sin2 u)1/2 26 U. Stammbach: Analysis, Teil C Z 0 α Z dϕ √ cos ϕ − cos α = π/2 (1 0 √ Z = 2 2k cos u du − 2k2 sin2 u − 1 + 2k2 )1/2 − k2 sin2 u)1/2 (1 π/2 du (1 − 0 k2 sin2 u)1/2 . Von diesem letzteren Integral ist bekannt, dass es nicht elementar lösbar ist; es handelt sich um ein sogenanntes elliptisches Integral erster Art. Ähnlich wie im ersten Beispiel benützen wir die für |x| < 1 gültige Reihenentwicklung 1 1 1·3 2 1·3·5 3 =1+ x+ x + x + ··· , 1/2 2 2·4 2·4·6 (1 − x) um den Integranden in Reihenform darzustellen. Setzen wir x = k2 sin2 u, so folgt s Z T =4 l g π/2 0 1 1·3 4 4 1 + k2 sin2 u + k sin u + · · · 2 2·4 du . Mit dem bekannten Resultat Z 0 π/2 sin2n u du = 1 · 3 · 5 · · · (2n − 3) · (2n − 1) π 2 · 4 · · · · (2n − 2) · (2n) 2 erhalten wir die Schwingungsdauer in Reihenform s " T = 2π l 1+ g 2 1 2 2 k + 1·3 2·4 2 4 k + 1·3·5 2·4·6 2 # 6 k + ··· mit k = sin(α/2). Für kleine α (kleiner Maximalausschlag) ist also der aus der linearisierten Theorie bekannte Wert s T = 2π l g eine gute Nährung. Beispiel Gesucht sind die Funktionswerte der Gauss’schen Fehlerfunktion. Die Gauss’sche Fehlerfunktion ist gegeben durch 2 Φ : x → Φ(x) = √ π Z 0 x 2 e−t dt . 27 Kapitel IX. Potenzreihen (y) 1 (x) -1 1 Fig. 4 : Die Berechnung der Gauss’schen Fehlerfunktion mit Hilfe einer Reihenentwicklung; die Kurve y = Φ(x) ist gestrichelt eingezeichnet -1 Das Integral ist bekanntlich nicht elementar lösbar (Kapitel III, Abschnitt 2). Eine Reihenentwicklung des Integranden und anschliessendes gliedweises Integrieren liefert den Funktionswert von Φ in Reihenform. Aus ex = 1 + x + 1 2 1 1 x + x3 + · · · + xn + · · · 2! 3! n! erhalten wir 2 e−t = 1 − t2 + 1 4 1 t − t6 + · · · . 2! 3! Daraus folgt (siehe Figur 4) 2 Φ(x) = √ π Z 0 x 1 1 1 − t + t4 − t6 + · · · 2! 3! 2 2 1 1 5 1 7 dt = √ x − x3 + x − x + ··· π 3 5 · 2! 7 · 3! . Beispiel Als Kurve, deren Krümmung proportional zur Bogenlänge zunimmt, haben wir die Klotoide kennengelernt (Kapitel III, Abschnitt 8). Sie ist gegeben durch die Parameterdarstellung 28 U. Stammbach: Analysis, Teil C Z ! t2 x(l) = cos dt 2! 0 Z l t2 y(l) = sin dt 2 0 l Die beiden Integrale (Fresnel’sche Integrale) lassen sich nicht elementar ausdrücken. Ähnlich wie oben erhalten wir mit einer Reihendarstellung des Integranden wenigstens eine Reihendarstellung für x und y. Die Cosinus- und Sinus-Reihen liefern unmittelbar cos t2 2 sin t2 2 ! = 1− ! = t4 t8 t12 + − + ··· , 22 · 2! 24 · 4! 26 · 6! t2 t6 t10 − 3 + 5 − ··· , 2 2 · 3! 2 · 5! so dass man erhält (siehe Figur 5) x = l− y = l5 l9 l13 + − + ··· , 5 · 22 · 2! 9 · 24 · 4! 13 · 26 · 6! l3 l7 l11 − + − ··· . 3 · 2 7 · 23 · 3! 11 · 25 · 5! Die Reihen konvergieren für kleine l sehr rasch, so dass sie ohne weiteres für die Berechnung von x und y verwendet werden können. Beispiel Misst man mit einem freihängenden Messband eine horizontale Distanz, so ist der abgelesene Wert mit einem Fehler behaftet, weil das Messband durchhängt (siehe Figur 6). Gesucht ist eine Abschätzung dieses Fehlers. Die Lage des Messbandes sei durch die Funktion x → f (x) beschrieben. Für die Länge des Messbandes (Bogenlänge) gilt dann die differentielle Beziehung ds = q 1 + (f 0 (x))2 dx . Die Differenz ds − dx liefert das Differential du des Fehlers u. Wir erhalten q du = ds − dx = ( 1 + (f 0 (x))2 − 1) dx . 29 Kapitel IX. Potenzreihen (y) 1 -1 1 (x) Fig. 5 : Die Klotoide; für die Zeichnung sind die ersten 13 nichttrivialen Glieder der Reihenentwicklung verwendet worden -1 −s/2 Fig. 6 : Zur Behandlung des freihängenden Messbandes s/2 (x) U. Stammbach: Analysis, Teil C 30 Da |f ′ (x)| klein ist, approximieren wir die Wurzel durch die ersten beiden Terme der Taylorentwicklung 1 1 + (f ′ (x))2 ∼ 1 + (f ′ (x))2 . 2 q Damit folgt 1 du = (f ′ (x))2 dx . 2 Für den Fehler u auf der ganzen Länge des Messbandes gilt somit u= Z s/2 (f ′ (x))2 dx . 0 Laut Mechanik hat man f (x) = a1 cosh(ax) − b . Dabei ist die Grösse a durch die Erdbeschleunigung g, die Längendichte ρ und durch die Seilspannung σ gegeben, nämlich a= gρ . σ Damit folgt f ′ (x) = sinh(ax) . Da wir nur an einer Approximation interessiert sind, entwickeln wir den Integranden von Z s/2 (f ′ (x))2 dx 0 in eine Potenzreihe und begnügen uns mit dem ersten nichttrivialen Term. Wegen f ′ (x) = sinh(ax) = ax + (ax)3 + ··· 3! erhalten wir (f ′ (x))2 = a2 x2 + 2 4 4 a x + ··· . 3! Daraus folgt als Approximation für den Fehler u u= Z 0 s/2 ′ 2 (f (x)) dx ∼ Z s/2 a2 x2 dx = 0 1 2 3 a s . 24 Der Messfehler ist insbesondere proportional zu ρ2 , 1/σ 2 und s3 . 31 Kapitel IX. Potenzreihen Beispiel Die Differentialgleichung (5.1) y 0 = ay hat bekanntlich x → y(x) = Ceax als Lösung. Wir wollen hier zeigen, dass man eine Potenzreihenentwicklung dieser Funktion erhält, indem man direkt in der Differentialgleichung einen Potenzreihenansatz benützt. Dieses Vorgehen kann natürlich nur dann Erfolg haben, wenn die Lösungsfunktionen der Differentialgleichung überhaupt eine Potenzreihendarstellung zulassen. Wir wissen bereits, dass dies im Beispiel (5.1) der Fall ist. Für viele andere Differentialgleichungen können die Mathematiker diese Eigenschaft der Lösungsfunktionen mit Hilfe von allgemeinen Sätzen nachweisen (siehe dazu weiter unten). Unser einfaches Beispiel dient nur dazu, das Verfahren zu illustrieren. Wir machen den Ansatz y(x) = c0 + c1 x + c2 x2 + · · · und setzen diesen in die Differentialgleichung (5.1) ein. Wir erhalten c1 + 2c2 x + 3c3 x2 + · · · = ac0 + ac1 x + ac2 x2 + · · · . Ein Koeffizientenvergleich liefert das Gleichungssystem c1 = ac0 2c2 = ac1 3c3 = ac2 .. . Suchen wir die durch die Anfangsbedingung y(0) = 1 eindeutig bestimmte Lösung, so gilt c0 = 1 und damit der Reihe nach c1 = a a2 c2 = 2! a3 c3 = 3! a4 c4 = 4! .. . 32 U. Stammbach: Analysis, Teil C Die Reihendarstellung der Lösung lautet also, keineswegs überraschend, y(x) = 1 + ax + 1 1 (ax)2 + (ax)3 + · · · . 2! 3! Von dieser wissen wir aus andern Gründen bereits, dass sie für alle x konvergiert. Beispiel Gegeben ist die Differentialgleichung y 00 + x2 y = 0 Gesucht ist die durch die Anfangsbedingungen y(0) = 0 und y 0 (0) = 1 eindeutig bestimmte Lösung. (y) 1 1 2 3 4 (x) Fig. 7 : Die Lösungskurve der Differentialgleichung y 00 + x2 y = 0 mit y(0) = 0 und y 0 (0) = 1; für die Zeichnung sind die ersten 20 nichtverschwindenden Terme der Taylorentwicklung verwendet worden. -1 Man kann zeigen, dass die Lösungsfunktionen der (linearen, homogenen(!)) Differentialgleichung nicht elementar darstellbar sind. Deshalb besteht erhebliches Interesse an einer anderen Darstellung, z.B. an einer Potenzreihenentwicklung. Eine solche ist in der Tat möglich. Es gilt nämlich der mathematische Satz, dass sich die Lösungen einer linearen Differentialgleichung zweiter Ordnung immer in eine Potenzreihe mit Mittelpunkt x0 entwickeln lassen, wenn die Koeffizientenfunktionen der Differentialgleichung ebenfalls Potenzreihenentwicklungen mit Mittelpunkt x0 zulassen. Dies ist in unserem Beispiel trivialerweise der Fall. 33 Kapitel IX. Potenzreihen Wir machen also den Ansatz y(x) = c0 + c1 x + c2 x2 + · · · . Dann gilt y 0 (x) = c1 + 2c2 x + 3c3 x2 + 4c4 x3 + · · · , y 00 (x) = 2c2 + 3 · 2c3 x + 4 · 3c4 x2 + · · · . Einsetzen liefert (2c2 + 3 · 2c3 x + 4 · 3c4 x2 + · · ·) + x2 (c0 + c1 x + c2 x2 + · · ·) = 0 und ein Koeffizientenvergleich führt zum Gleichungssystem 2c2 = 0 2 · 3c3 = 0 3 · 4c4 + c0 = 0 4 · 5c5 + c1 = 0 5 · 6c6 + c2 = 0 .. . Mit Hilfe der Anfangsbedingungen erhalten wir dann die Koeffizienten c0 , c1 , c2 , · · · rekursiv c0 c4 c8 c12 = 0 c1 = 1 c2 = 0 c5 = −1/4 · 5 c6 = 0 c9 = 1/4 · 5 · 8 · 9 c10 = 0 c13 = −1/4 · 5 · 8 · 9 · 12 · 13 c14 = 0 c3 = 0 c7 = 0 c11 = 0 c15 =0 =0 =0 =0 Die Reihendarstellung der gesuchten Funktion lautet also (siehe Figur 7) y(x) = x − x5 x9 x13 + − + ··· 4 · 5 4 · 5 · 8 · 9 4 · 5 · 8 · 9 · 12 · 13 Der oben zitierte allgemeine Satz besagt, dass diese Reihe wenigstens für kleine x konvergiert; in der Tat konvergiert sie sogar für alle x und zwar sehr rasch. Analysis I/II U. Stammbach Professor an der ETH-Zürich Anhang. Komplexe Zahlen Es gibt täglich mehr zu wissen. Aus der NZZ-Werbung Inhaltsverzeichnis 1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3 Anhang: Komplexe Zahlen 1 Komplexe Zahlen Eine komplexe Zahl z lässt sich in eindeutiger Weise in der Form a + ib, a, b ∈ R schreiben, wobei das Symbol i die imaginäre Einheit , i2 = −1 bezeichnet. Die reelle Zahl a heisst Realteil und die reelle Zahl b heisst Imaginärteil von z. Die reellen Zahlen R denkt man sich in den komplexen Zahlen C eingebettet, indem man der reellen Zahl a die komplexe Zahl a + i0 zuordnet. Die Rechenoperationen mit komplexen Zahlen genügen den fundamentalen Rechengesetzen, die man von den reellen Zahlen her kennt: Die Addition ist kommutativ und assoziativ, die Multiplikation ist kommutativ und assoziativ und verhält sich gegenüber der Addition distributiv. Für z = a + ib, a, b ∈ R z 0 = a0 + ib0 , a0 , b0 ∈ R ist die Summe definiert durch z + z 0 = (a + ib) + (a0 + ib0 ) = (a + a0 ) + i(b + b0 ) (1.1) und das Produkt wegen i2 = −1 durch z · z 0 = (aa0 − bb0 ) + i(ab0 + a0 b) . (1.2) Zu jeder von Null verschiedenen komplexen Zahl z 6= 0 = 0 + i0 gibt es ein Inverses 1/z. Es gilt für 0 6= z = a + ib 1 b 1 1 a − ib a −i 2 . = = = 2 2 z a + ib a + ib a − ib a +b a + b2 Aus diesem Grund kann man in C durch von Null verschiedene komplexe Zahlen dividieren. Beispiel 8−i 5+i 2 = (8 − i)(5 − i) (5 + i)(5 − i) 2 = 39 − 13i 26 2 = 1 1 1 (3 − i)2 = (9 − 6i − 1) = (4 − 3i). 4 4 2 4 U. Stammbach: Analysis, Teil C Im z Fig. 1 : Die komplexe Zahlebene ρ b ϕ Re a Komplexe Zahlen lassen sich in einfacher Weise in der sogenannten komplexen (oder Gaussschen) Zahlebene (siehe Figur 1) veranschaulichen: Man fasst die komplexe Zahl z = a+ib als Punkt mit den (kartesischen) Koordinaten (a, b) in der Ebene auf. Die waagerechte Koordinatenachse bezeichnet man als reelle Achse, die senkrechte als imaginäre Achse. In der komplexen Zahlebene entspricht der Addition von komplexen Zahlen offenbar die Addition von Vektoren. Auch die Multiplikation einer komplexen Zahl z mit einer reellen Zahl r lässt sich unmittelbar als Multiplikation des “Vektors” z mit dem “Skalar” r deuten. Die Multiplikation von zwei komplexen Zahlen lässt sich geometrisch in einfacher Weise beschreiben, wenn man in der komplexen Zahlebene Polarkoordinaten (ρ, ϕ) einführt. Offenbar gilt für z = a + ib ρ = ϕ = p ( a2 + b2 , arctan(b/a) für a > 0 arctan(b/a) + π für a < 0 , wobei wie üblich die Formel für ϕ im Fall a = 0 sinnvoll zu ergänzen ist. Ausserdem ist ϕ nur bis auf ein Vielfaches von 2π bestimmt. Es heisst ρ der (absolute) Betrag |z| von z, und ϕ das Argument arg z von z. Die komplexe Zahl cos ϕ + i sin ϕ besitzt den absoluten Betrag 1; sie liegt auf dem Einheitskreis mit Mittelpunkt 0 in der komplexen Zahlebene. Wir führen für eine solche komplexe Zahl die 5 Anhang: Komplexe Zahlen folgende, von Euler stammende Schreibweise ein: cos ϕ + i sin ϕ = eiϕ (1.3) (siehe dazu Kapitel VIII, Abschnitt 4). Es bezeichnet also eiϕ die komplexe Zahl mit Betrage 1 und Argument ϕ. Diese etwas willkürlich erscheinende Festsetzung rechtfertigen wir hier dadurch, dass wir zeigen, dass für eiϕ die für die Exponentialfunktion übliche Rechenregel gilt, nämlich eiα · eiβ = eiα+iβ = ei(α+β) . Der Beweis besteht in der folgenden einfachen Rechnung, welche die Additionstheoreme für cos und sin verwendet: eiα · eiβ = (cos α + i sin α) · (cos β + i sin β) = (cos α cos β − sin α sin β) + i(sin α cos β + cos α sin β) = cos(α + β) + i sin(α + β) = ei(α+β) . Ist z eine beliebige, von Null verschiedene komplexe Zahl mit Betrag |z| und Argument ϕ, so lässt sich z schreiben als (1.4) z = |z| · (cos ϕ + i sin ϕ) = |z| · eiϕ . Wir nennen dies die Polardarstellung der komplexen Zahl z. Mit ihrer Hilfe beschreibt sich die Multiplikation von komplexen Zahlen in der komplexen Zahlebene wie folgt: Für z = |z| · eiϕ 0 und z 0 = |z 0 | · eiϕ erhalten wir 0 0 z · z 0 = |z| · eiϕ · |z 0 | · eiϕ = |z| · |z 0 | · ei(ϕ+ϕ ) . Bei der Multiplikation von komplexen Zahlen werden die absoluten Beträge multipliziert und die Argumente addiert: |z · z 0 | = |z| · |z 0 |, arg(z · z 0 ) = arg z + arg z 0 . Neben den Rechenoperationen Addition und Multiplikation spielt bei komplexen Zahlen auch die Konjugation eine grosse Rolle. Die zu z, z = a + ib konjugierte komplexe Zahl ist gegeben durch z = a − ib (siehe Figur 2). Es gilt offenbar: 6 U. Stammbach: Analysis, Teil C 1 a = (z + z) , 2 (1.5) b= 1 (z − z) . 2i Damit sind Real- und Imaginärteil einer komplexen Zahl durch z und z ausgedrückt. Ferner gelten, wie man leicht bestätigt, die folgenden Beziehungen Im z z = a + ib ρ ϕ Re −ϕ ρ z̄ = a − ib z = z z + z0 = z + z0 z · z0 = z · z0 1 z = 1 z |z|2 = z · z . Für z = eiϕ = cos ϕ + i sin ϕ gilt Fig. 2 : Konjugieren komplexer Zahlen 7 Anhang: Komplexe Zahlen z = cos ϕ − i sin ϕ = cos(−ϕ) + i sin(−ϕ) = e−iϕ . Damit erhalten wir mit Hilfe der Formeln (1.3) und (1.5) cos ϕ = (1.6) 1 iϕ (e + e−iϕ ) , 2 sin ϕ = 1 iϕ (e − e−iϕ ) . 2i Dies sind die berühmten Euler’schen Formeln (L. Euler 1707-1783). Beispiel Man drücke cos(nϕ), sin(nϕ), n = 2, 3, . . . durch die Werte der Winkelfunktionen cos und sin des einfachen Winkels ϕ aus. Ausgehend von den bekannten Formeln für n = 2 lässt sich die Aufgabe mit etwas Mühe direkt lösen. Einfacher und sicherlich eleganter ist aber das folgende Vorgehen. Wir betrachten die komplexe Zahl z = cos(nϕ) + i sin(nϕ) . Dann gilt z = einϕ = (eiϕ )n = (cos ϕ + i sin ϕ)n . Also ! ! n n z = cos ϕ + i cosn−1 ϕ sin ϕ + i2 cosn−2 ϕ sin2 ϕ + · · · + in sinn ϕ . 1 2 n Indem wir Real- und Imaginärteil dieses Ausdruckes betrachten, erhalten wir ! (1.7) n cos(nϕ) = cosn ϕ − cosn−2 ϕ sin2 ϕ + · · · , 2 ! (1.8) sin(nϕ) = ! n n cosn−1 ϕ sin ϕ − cosn−3 ϕ sin3 ϕ + · · · . 1 3 Diese sogenannten Formeln von Moivre (Moivre 1667-1754) verallgemeinern die wohlbekannten Formeln für cos(2ϕ) und sin(2ϕ). Wir haben in diesem Abschnitt gesehen, dass das Potenzieren einer komplexen Zahl sehr einfach wird, wenn man die Polardarstellung verwendet. In der Tat gilt ja z n = (|z| · eiϕ )n = |z|n · einϕ . √ √ Beispiel Es sei z = − 3 + i 3. Man berechne z 10 . 8 U. Stammbach: Analysis, Teil C Es gilt z= √ 6 · eiϕ , ϕ = 3π/4. Damit erhalten wir √ 3π 15π 3π z 10 = ( 6)10 · ei 4 10 = 65 · ei 2 = 65 · ei 2 = −65 i . Offenbar ist die Polardarstellung auch geeignet, Licht in das folgende Problem zu bringen. Im 3 · eiα z z1 α α/2 Re Fig. 3 : Die Quadratwurzel komplexer Zahlen z2 Beispiel Gegeben ist die komplexe Zahl c. Gesucht sind die (alle!) Lösungen der Gleichung z n = c. Wir betrachten zuerst den Fall n = 2 für c = 3eiα (siehe Figur 3). Wir machen den Ansatz z = ρ · eiϕ . Dann folgt ! z 2 = ρ2 · ei2ϕ = 3eiα . 9 Anhang: Komplexe Zahlen √ Daraus lesen wir als erstes ρ = 3 ab. (Beachte, dass ρ als Betrag einer von Null verschiedenen komplexen Zahl positiv sein muss.) Ferner entnehmen wir der Gleichung die Bedingung 2ϕ = α, wobei diese “modulo 2π” zu erfüllen ist. Wir erhalten die beiden Lösungen ϕ1 = α , 2 α 2π + . 2 2 ϕ2 = Damit folgt z1 = √ α 3 · ei 2 , z2 = √ α 2π 3 · ei( 2 + 2 ) . Wir entnehmen diesem Beispiel, dass die einzige Schwierigkeit zur Lösung von z n = c offenbar in der Bestimmung des Argumentes der Lösungen liegt. Wir betrachten dazu noch das folgende Beispiel. Im z2 eiα z z3 α z1 α/5 Re z4 z5 Beispiel Es sei (1.9) z n = eiα . Dann gilt natürlich |z| = 1 (siehe Figur 4). Mit dem Ansatz Fig. 4 : Die 5. Wurzel aus einer komplexen Zahl vom Betrage 1 10 U. Stammbach: Analysis, Teil C z = eiϕ erhalten wir ! z n = einϕ = eiα . Damit ist nϕ = α “modulo 2π” zu erfüllen, so dass sich für die Argumente ϕ1 , ϕ2 , . . . , ϕn der n Lösungen ϕ1 = ϕ2 = ϕ3 = .. . ϕn = α , n α 1 + 2π , n n α 2 + 2π , n n α n−1 + 2π n n ergibt. In der komplexen Zahlebene bilden die n Lösungen der Gleichung (1.9) die Ecken eines regelmässigen n-Eckes, das dem Einheitskreis einbeschrieben ist. 11 Anhang: Komplexe Zahlen 2 Komplexe Zahlen und Funktionen In einem ersten Teil betrachten wir hier Funktionen, die auf reellen Zahlen definiert sind und als Werte komplexe Zahlen annehmen. Beispiel Die Funktion ϕ : t → ϕ(t) = cos t + i sin t, −∞ < t < +∞ ordnet der reellen Zahl t die komplexe Zahl cos t + i sin t zu. Im z Fig. 1 : Komplexwertige Funktion einer rellen Variablen Re ϕ(t) = g(t) + ih(t) Wir können eine solche Funktion als Abbildung (eines Teils) der reellen Zahlgerade in die komplexe Zahlebene auffassen. Durch die oben definierte Funktion ϕ zum Beispiel wird der reellen Zahl t der Punkt des Einheitskreises in der komplexen Zahlebene mit dem Argument arg w = t zugeordnet. Natürlich können wir eine solche komplexwertige Funktion einer reellen Variablen immer in der Form 12 U. Stammbach: Analysis, Teil C ϕ : t → ϕ(t) = g(t) + ih(t) schreiben, wobei g : t → g(t) und h : t → h(t) “gewöhnliche”, d.h. reellwertige Funktionen der reellen Variablen t sind (siehe Figur 1). Die Ableitung ϕ0 der Funktion ϕ der reellen Variablen t wird man definieren durch ϕ0 (t) = g0 (t) + ih0 (t); die Ableitungsfunktion ϕ0 ist also wiederum eine komplexwertige Funktion der gleichen reellen Variablen t. Beispiel Es sei ϕ : t → ϕ(t) = eit . Dann gilt ϕ0 (t) = (cos t + i sin t)0 = − sin t + i cos t = i(cos t + i sin t) = ieit . Für die Ableitung der Funktion t → eit gilt folglich die von der reellen Exponentialfunktion her bekannte Ableitungsregel. Beispiel Es sei ψ : t → ψ(t) = eiωt , wo ω eine feste reelle Zahl ist. Dann folgt ψ 0 (t) = iωeiωt , ψ 00 (t) = −ω 2 eiωt und damit identisch in t ψ 00 (t) + ω 2 ψ(t) = 0 . Damit ist ψ : t → eiωt eine (komplexwertige) Lösung der (reellen) Differentialgleichung ψ 00 + ω 2 ψ = 0 . Das bedeutet, dass sowohl der Realteil von ψ, also t → cos(ωt), wie auch der Imaginärteil von ψ, also t → sin(ωt), Lösungen der Differentialgleichung sind. Analoges wie für die Ableitung einer komplexwertigen Funktion einer reellen Variablen gilt auch für das Integral. Beispiel Es sei k eine ganze Zahl. Dann gilt Z 0 2π ikx e dx = Z 0 2π (cos(kx) + i sin(kx)) dx = Z 0 2π cos(kx) dx + i Z 0 2π sin(kx) dx . 13 Anhang: Komplexe Zahlen Da k ganz ist, folgt Z 2π 0 ( ikx e dx = 0 für k 6= 0 . 2π für k = 0 Beispiel Es seien m, n zwei nicht negative ganze Zahlen. Wir berechnen das Integral Z 2π 0 cos(mx) sin(nx) dx mit Hilfe komplexer Zahlen. Es gilt Z 0 2π cos(mx) sin(nx) dx = Z = 0 2π Z eimx + e−imx einx − e−inx · dx 2 2i 1 2π i(m+n)x = (e − ei(m−n)x + ei(n−m)x − e−i(n+m)x ) dx 4i 0 Z 2π Z 2π Z 2π Z 2π 1 = ei(m+n)x dx − ei(m−n)x dx + ei(n−m)x dx − e−i(m+n)x dx . 4i 0 0 0 0 Daraus erhält man mit einer Fallunterscheidung m 6= n, m = n 6= 0, m = n = 0 mit Hilfe des voherigen Beispiels das Resultat Z 0 2π cos(mx) sin(nx) dx = 0 . Auf gleiche Art berechnet man ohne Mühe auch Z 2π 0 Z 2π 0 cos(mx) cos(nx) dx = sin(mx) sin(nx) dx =    0 für m 6= n π für m = n 6= 0 ,   2π für m = n = 0    0 für m 6= n π für m = n 6= 0 .   0 für m = n = 0 Diese Resultate spielen in der Theorie der Fourrierreihen eine grosse Rolle (siehe Analysis III); sie heissen Orthogonalitätsrelationen und drücken aus, dass die Funktionen x → cos(mx) , m = 0, 1, . . . , x → sin(nx) , n = 1, 2, . . . ein “orthogonales Funktionensystem” in einem entsprechenden “Funktionenraum” bilden. 14 U. Stammbach: Analysis, Teil C w Im w z Re Im Fig. 2 : Komplexwertige Funktion einer komplexen Variablen z Re Im ersten Teil dieses Abschnitts haben wir komplexwertige Funktionen einer reellen Variablen betrachtet. Jetzt wollen wir uns Funktionen zuwenden, bei denen sowohl der Definitionsbereich wie auch der Wertebereich in der komplexen Zahlebene liegen (siehe Figur 2). Beispiel Die Funktion f : z → w = f (z) = iz ordnet der komplexen Zahl z die komplexe Zahl w, w = iz zu. Um sich diese Funktion zu veranschaulichen fassen wir sie als Abbildung von der komplexen z-Ebene in die komplexe wEbene auf. Wegen |w| = |iz| = |z| und arg w = arg(iz) = arg z + π/2 folgt, dass der Funktion eine Drehung der komplexen Zahlebene um den Winkel π/2 entspricht. Beispiel Der Funktion f : z → w = f (z) = z · eiα entspricht einer Drehung der komplexen Zahlebene um den Winkel α (siehe Figur 3). 15 Anhang: Komplexe Zahlen Im z w w = z · eiα Fig. 3 : Der Multiplikation mit einer komplexen Zahl vom Betrage 1 entspricht eine Drehung der komplexen Zahlebene z α Re Im z w Fig. 4 : Der Multiplikation mit einer reellen Zahl r entspricht eine Streckung der komplexen Zahlebene w=r·z z Re 16 U. Stammbach: Analysis, Teil C Beispiel Der Funktion g : z → w = g(z) = r · z, r∈R entspricht einer Streckung der komplexen Zahlebene um den Faktor r (siehe Figur 4). Im w =z+c c z w Fig. 5 : Der Addition einer komplexen Zahl entspricht eine Translation der komplexen Zahlebene z Re Beispiel Der Funktion h : z → z + c, c∈C entspricht einer Translation der komplexen Zahlebene um den “Vektor” c (siehe Figur 5). Beispiel Wir betrachten als nächstes die etwas kompliziertere Funktion z → w = ez , wobei wir z = a + ib a, b ∈ R setzen ez = ea+ib = ea · eib = ea (cos b + i sin b) . 17 Anhang: Komplexe Zahlen Im z = a + iy z z = x + ib Fig. 6 : Das Netz der Parallelgeraden zur reellen bzw. imaginären Achse in der komplexen Zahlebene Re Im w w = ex+ib w = ea+iy Re Fig. 7 : Das Bild unter der Exponentialfunktion z → ez des Netzes der Parallelgeraden zur reellen bzw. imaginären Achse in der komplexen Zahlebene 18 U. Stammbach: Analysis, Teil C Um uns einen Überblick über das Verhalten dieser Funktion zu verschaffen, betrachten wir das Koordinatennetz in der z-Ebene und untersuchen sein Bild in der w-Ebene (siehe Figuren 6,7). Eine Parallelgerade zur reellen Achse in der z-Ebene wird durch die Gleichung z = x + ib, −∞ < x < +∞ beschrieben. Ihr Bild in der w-Ebene ist w = ex · eib = ex (cos b + i sin b) , ein von 0 ausgehender Strahl mit arg w = b. Eine Parallelgerade zur imaginären Achse in der z-Ebene wird durch die Gleichung z = a + iy, −∞ < y < +∞ beschrieben. Ihr Bild in der w-Ebene ist w = ea · eiy = ea (cos y + i sin y) , ein Kreis um 0 mit Radius ea . Das Bild des Koordinatennetzes in der z-Ebene besteht also aus den von 0 ausgehenden Strahlen und den Kreisen um 0. Man beachte ferner, dass jeder Parallelstreifen zur reellen Achse in der z-Ebene der Breite 2π auf die ganze w-Ebene abgebildet wird. Speziell hinweisen möchten wir auf das Phänomen, dass das Bild des Koordinatennetzes in der z-Ebene in ein Netz von Kurven abgebildet wird, welche sich orthogonal schneiden. Letzteres ist nicht nur für die durch die Funktion z → ez vermittelte Abbildung der Fall, sondern ganz allgemein für Abbildungen, die zu sogenannten analytischen Funktionen gehören. (Auf die Definition des Begriffes “analytisch” gehen wir hier nicht ein.) Man kann zeigen, dass solche Funktionen sogar Abbildungen liefern, die winkeltreu sind; man nennt Abbildungen mit dieser Eigenschaft auch etwa konform. In der mathematischen Behandlung der Strömungslehre (Hydro- und Aerodynamik) spielen konforme Abbildungen der Ebene eine grosse Rolle; deshalb hat der Zweig der Mathematik, welcher sich mit analytischen Funktionen beschäftigt, die sogenannte komplexe Funktionentheorie, im Gebiet der Strömungslehre viele wichtige Anwendungen gefunden. Beispiel Gegeben sei die Funktion z → w = f (z) = z 2 . Wiederum studieren wir die Funktion, indem wir das Bild des z-Koordinatennetzes in der wEbene untersuchen (siehe Figur 8). Für z = a + ib erhalten wir f (z) = (a2 − b2 ) + i2ab . Die Bildkurve der Parallelgeraden z = t + ib, −∞ < t < +∞ zur reellen Achse ist also durch die Parameterdarstellung (w = ξ(t) + iη(t)) t → ξ(t) = t2 − b2 , t → η(t) = 2tb 19 Anhang: Komplexe Zahlen Im z w = (a + iy)2 Re Fig. 8 : Das Bild unter der Funktion z → z 2 des Netzes der Parallelgeraden zur reellen bzw. imaginären Achse in der komplexen Zahlebene w = (x + ib)2 gegeben. Eliminieren wir t, so erhalten wir als Gleichung der Bildkurve ξ= η2 − b2 . 4b2 Die Bildkurve der Parallelgeraden z = t + ib zur reellen Achse der z–Ebene ist eine nach rechts geöffnete Parabel, deren Scheitel bei (−b2 , 0) liegt. Analog zeigt man, dass das Bild der Parallelgeraden z = a + it, −∞ < t < +∞ zur imaginären Achse der z-Ebene eine Parabel ist, die nach links geöffnet ist und deren Scheitel bei (a2 , 0) liegt. Man stellt fest, dass sich die so erhaltenen Kurven in der w-Ebene orthogonal schneiden; die Funktion z → z 2 ist eben auch “analytisch” wie die im obigen Beispiel betrachtete Funktion z → ez . 20 3 U. Stammbach: Analysis, Teil C Polynome In diesem Abschnitt wollen wir die einfachsten komplexwertigen Funktionen einer komplexen Variable etwas näher betrachten, nämlich die Polynome. Ein (komplexes) Polynom p ist eine Funktion der Form z → p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n p: mit c0 , c1 , . . . , cn ∈ C . Diese komplexen Zahlen heissen die Koeffizienten von p. Die natürliche Zahl n heisst Grad von p, Grad p = n (falls cn 6= 0). Offenbar kann man Polynome in der üblichen Art und Weise addieren und multiplizieren. Für die Grade gilt Grad(p + q) ≤ max(Grad p, Grad q) , Grad(p · q) = Grad p + Grad q . Eine komplexe Zahl z0 heisst Nullstelle des Polynoms p, wenn gilt p(z0 ) = 0. Beispiel Das Polynom p: z → p(z) = c0 + z n hat wegen cn = 1 6= 0 den Grad n. Seine Nullstellen sind die Lösungen der Gleichung z n = w, w = −c0 . Im Abschnitt 1 haben wir die komplexen Lösungen angegeben und gesehen, dass es davon n verschiedene gibt. Beispiel Das Polynom p: z → p(z) = z 2 + (2i)z + (−4 + 4i) hat als Nullstellen die komplexen Zahlen z1 = 2 − 2i, z2 = −2 . Ist p eine beliebiges Polynom, so ist a priori nicht klar, ob p überhaupt Nullstellen besitzt. Die Aussage, dass dies tatsächlich der Fall ist, ist ein tiefliegender mathematischer Satz, der sogenannte “Fundamentalsatz der Algebra”, der erstmals von Gauss bewiesen worden ist. Wir erwähnen ihn hier ohne Beweis. Satz Es sei p ein Polynom mit Grad p ≥ 1. Dann gibt es (mindestens) eine Nullstelle von p. 21 Anhang: Komplexe Zahlen Wir machen dazu die folgende Bemerkung: Für Grad p = 1, 2 (und mit etwas mehr Mühe für Grad p = 3, 4) lassen sich für die Nullstellen von p Wurzelformeln angeben. Man kann beweisen, dass für Polynome vom Grad grösser gleich 5 solche allgemeinen Lösungsformeln mit Wurzeln nicht existieren können. Der Satz von Gauss sagt nur über die Existenz von Nullstellen etwas aus, und nichts über die Art und Weise, wie die Nullstellen gefunden werden können. Da das Problem, Nullstellen von Polynomen zu bestimmen, in Anwendungen häufig auftritt, besteht ein grosses Bedürfnis, Methoden dafür zu entwickeln. In der Tat stellt uns die numerische Mathematik eine ganze Anzahl von solchen Verfahren zur Verfügung; in dieser Vorlesung können wir aber darauf natürlich nicht eingehen. Die Folgerungen aus dem Satz von Gauss sind vielfältig; einige davon werden wir im Folgenden zur Sprache bringen. Zuerst aber beschäftigen wir uns kurz mit einem (wohlbekannten) rechnerischen Hilfsmittel. • Es seien p und q Polynome mit Grad p = n und Grad q = m ≤ n. Dann gibt es Polynome r und s mit p(z) = r(z) · q(z) + s(z) und Grad s < m. Wir beweisen auch diese Aussage hier nicht, sondern geben nur an, dass r und s auf einfache Weise durch den üblichen Divisionsalgorithmus bestimmt werden können. Es sei nun z1 eine Nullstelle von p, p(z1 ) = 0. Indem man q(z) = z − z1 setzt, folgt aus der obigen Aussage, dass sich p(z) in der Form (3.1) p(z) = r(z)(z − z1 ) + s(z) schreiben lässt mit Grad s < 1. Wegen Grad s < 1 folgt, dass s eine Konstante ist. Setzt man z = z1 , so erhält man aus (3.1) 0 = p(z1 ) = r(z1 )(z1 − z1 ) + s(z1 ) = s(z1 ) . Damit ist das folgende Resultat bewiesen. • Ist z1 eine Nullstelle von p, so lässt sich z − z1 “abspalten”; d.h. es gibt ein Polynom r mit Grad r = n − 1 und p(z) = (z − z1 ) r(z) . Das Vorgehen lässt sich offenbar mit dem Polynom r an Stelle von p wiederholen, solange dieses Polynom einen Grad ≥ 1 besitzt. Damit erhält man schliesslich eine Zerlegung von p in “Linearfaktoren”. • Das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n lässt sich in der Form (3.2) schreiben. p(z) = cn · (z − z1 )(z − z2 ) · · · (z − zn ) 22 U. Stammbach: Analysis, Teil C Die komplexen Zahlen z1 , z2 , . . . , zn sind Nullstellen von p. Diese sind durch p eindeutig bestimmt. Ist nämlich w eine komplexe Zahl, die von z1 , z2 , . . . , zn verschieden ist, so folgt aus der Zerlegung (3.2) p(w) 6= 0. Wir schliessen daraus: • Ein Polynom p vom Grad n hat höchstens n Nullstellen. Das Wort “höchstens” tritt hier deshalb auf, weil unter den Zahlen z1 , z2 , . . . , zn , die in (3.2) auftreten, einzelne mehrfach vorkommen können. Beispiel Das Polynom p : z → p(z) = z 2 + 2iz − 1 lässt sich in der Form p(z) = (z + i)(z + i) schreiben. Man sagt p besitze −i als “doppelte Nullstelle”. Wir definieren die Vielfachheit k0 der Nullstelle z0 von p als grösste ganze Zahl mit der Eigenschaft, dass sich p in der Form p(z) = (z − z0 )k0 · t(z) schreiben lässt. (Es ist dann natürlich t(z0 ) 6= 0! ) • Das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n lässt sich in der Form p(z) = cn · (z − z1 )k1 · · · (z − zl )kl schreiben. Dabei bezeichnen z1 , z2 , . . . , zl die verschiedenen Nullstellen von p und k1 , k2 , . . . , kl deren Vielfachheiten. Es gilt k1 + k2 + · · · + kl = n, d.h. die Summe der Vielfachheiten der Nullstellen eines Polynoms ist gleich dem Grad des Polynoms. Wir nennen das Polynom p : z → p(z) = c0 + c1 z + · · · + cn z n reell, wenn alle seine Koeffizienten c0 , c1 , . . . , cn reell sind. Wir behaupten • Ist z0 eine Nullstelle des reellen Polynoms p, so ist auch die konjugiert komplexe Zahl z0 eine Nullstelle von p. Es folgt nämlich aus 0 = p(z0 ) = c0 + c1 z0 + · · · + cn z0n sofort 0 = 0 = p(z0 ) = c0 + c1 z0 + · · · + cn z0n = c0 + c1 z0 + · · · + cn z0 n = p(z0 ) . Die komplexen Nullstellen eines reellen Polynoms treten somit in konjugiert komplexen Paaren auf. Beispiel Das Polynom p : z → z 6 − 1 ist reell; es besitzt die komplexen Zahlen 23 Anhang: Komplexe Zahlen zk = ei 2π k 6 , k = 1, 2, . . . , 6 als Nullstellen. Offenbar sind z3 und z6 reell; ferner sind z1 und z5 , sowie z2 und z4 konjugiert komplexe Paare. Betrachten wir in der Zerlegung eines reellen Polynoms in Linearfaktoren die beiden zur komplexen Nullstelle z0 gehörigen Faktoren (z − z0 ), (z − z0 ), so stellen wir fest, dass (z − z0 )(z − z0 ) = z 2 − (z0 + z0 )z + z0 z0 ein quadratisches reelles Polynom ist (mit konjugiert komplexen Nullstellen). Damit folgt: • Ist p : z → p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n ein reelles Polynom, so lässt sich dieses in der Form p(z) = cn (z − z1 )(z − z2 ) · · · (z − zl ) · (q1 (z) · · · qm (z)) schreiben, wobei z1 , . . . , zl die reellen Nullstellen sind, und q1 , . . . , qm die quadratischen reellen Polynome bezeichnen, die zu den konjugiert komplexen Paaren von komplexen Nullstellen gehören (natürlich jeweils mit ihren Vielfachheiten). Sachverzeichnis Abbildung I.16 Abklingvorgänge VII.9 Ableitung II.4 Ableitung, partiell IV.10 allgemeine Lösung VII.4, VII.17, VII.40, VII.77 alternierende Reihe VIII.5 Amplitude I.42, VII.94 analytische Funktion Anh.18 Anfangsbedingung II.36 Approximation II.15 Arbeit VI.51 Arbeit im wirbellosen Feld VI.57 Archimedisches Prinzip VI.48 Area-Funktionen II.44 Arcus-Funktionen I.51 Argument einer komplexen Zahl Anh.4 Astroide, Länge von III.41 Asymptote I.58 asymptotisch stabil VII.116, VII.120 Auftrieb, hydrostatischer VI.48 autonome Systeme VII.103, VII.107 Balken V.48 Balken, aufgelegt VII.71 Balken, eingespannt VII.68 Bernoulli-Hôpital II.26 Bernoullispirale II.77 Bernoullispirale, Länge der III.43 Beschleunigung II.57 Betrag einer komplexen Zahl Anh.4 Binomialreihe VIII.18 Biot-Savart VI.9 Bogenlänge III.39 Böschungsflächen VI.23 charakteristisches Polynom VII.83 Clairaut’sche Differentialgleichung VII.61 Coulomb-Feld VI.7 Dämpfung VII.92 Derivierte II.4 Differential II.17 Differential, totales IV.28 Differentialgleichung I.19, II.36 Differentialgleichung höherer Ordnung VII.64 Differentialgleichung, gewöhnliche VII.5 Differentialgleichung, homogene Eulersche VII.86 Differentialgleichung, lineare VII.36, VII.72 Differentialgleichung, lineare homogene mit konstanten Koeffizienten VII.83 Differentialgleichung, Laplace’sche VI.45 Differentialgleichung, partielle IV.60, VI.42, VI.45, VI.48, VI.66 Differentialgleichungssysteme VII.102, VII.107 Differentialoperator VI.11 Differentialquotient II.3 Differentialrechnung II.23 differenzierbar II.3 divergent VIII.3 Divergenz VI.11, VI.39 Divergenzsatz VI.35 divergieren I.6 Doppelintegral V.6 ebene Kurve II.65 Eigenfrequenz VII.97 einfach zusammenhängend VI.71 Elektrostatik, Grundgleichung VI.45 Ellipse II.67 Ellipse, Fläche der III.22, III.37 Ellipsenkoordinatensystem V.35 Ellipsenumfang VIII.22 Ellipsoid IV.53 Ellipsoid, Volumen von III.45 Enveloppe VII.57 Eulersche Differentialgleichung VII.86 Eulersche Formeln Anh.7 Eulersche Zahl I.7, II.40 Evolute II.74 exakte Differentialgleichung VII.48 Exponentialfunktion I.23, II.35, II.36 Exponentialreihe VIII.14 Extremum II.28 Extremum, zwei Variablen IV.32 Faraday, Gesetz von VI.65 Federschwingung, gedämpfte VII.89 Fehlerrechnung II.20, IV.29 Feldlinie VI.5 Flächen in Parameterdarstellung VI.16 Flächenelement bei Koord.transform. V.34 Flächenelement in Polarkoordinaten V.14 Flächeninhalt unter einer Kurve in Parameterdarstellung III.34 Flächeninhalt bei Kurven in Polarkoord. III.36 Flächennormale IV.52, VI.20 Flächenscharen IV.52 Flächenträgheitsmoment III.59 Flächenträgheitsmoment einer Ellipse V.37 Flächenträgheitsmoment eines Kreisringes V.15 Flächenträgheitsmoment, polares V.10 Flächenverzerrung V.40 Fluchtgeschwindigkeit III.69 Fluss VI.30 Folge I.3 Folge, beschränkte I.4 Folge, geometrische I.12 Folge, harmonische I.8 Fourrierreihe Anh.13 freier Fall mit Reibung VII.13 Fundamentalsatz der Algebra Anh.20 Funktion I.16 Funktion von zwei Variablen IV.3 Funktion von drei Variablen IV.44 Funktion, komplexe Anh.11 Funktion, gerade I.12 Funktion, rational I.23 Funktion, ungerade I.12 Funktionaldeterminante V.40 Funktionalmatrix V.37, V.42 Gauss’sche Fehlerkurve II.60 Gauss’sche Zahlebene Anh.4 Gauss, Satz von VI.35 Gebietsintegral V.3 Gebietsintegral, Koord.transform. V.12 gekoppelte Pendel VII.110 geometrische Reihe VIII.3 Geschwindigkeit II.57 gewöhnliche Differentialgleichung VII.5 Gleichgewichtspunkt VII.106, VII.115 globales Extremum II.28 Gradient IV.48, VI.11 Gradientenfeld IV.49, VI.68 Gravitation der homogenen Kugel V.25 Grenzwert I.6, I.25 Grössenordnung II.49 Hagen-Poiseuille VI.9 Halbwertszeit VII.9 harmonische Funktion VI.45 harmonische Reihe VIII.4 harmonische Schwingung I.42, II.62 harmonische Schwingung, gedämpfte II.63 Hauptsatz der Infinitesimalrechnung III.10 höhere Ableitung II.57 homogene lineare Differentialgleichung VII.36, VII.72 homogenes Vektorfeld VI.6 Hydrodynamik VI.40 hydrostatischer Auftrieb VI.48 hyperbolische Funktionen II.43 Hyperbel II.67 Hyperbel, Fläche der III.37 ideales Gas IV.6, IV.42 Indexpolynom VII.86 Induktivität VII.90 inhomogen lineare Differentialgleichung VII.40, VII.76 injektiv I.45 instabil VII.116 instationär VI.5 Integrabilitätsbedingung IV.21, IV.47, VI.72 Integral mit Parameter V.43 Integral, bestimmtes III.3 Integral, elliptisches VIII.23, VIII.26 Integral, unbestimmtes III.12 Integral, uneigentliches III.67 Integration, partiell III.15 Intervalle I.24 inverse Funktion I.45 Jacobi-Matrix V.37, V.42 Kapazität VII.90 Kettenregel II.8 Kettenregel, verallgemeinerte IV.38, IV.48 Kirchhoff’sches Gesetz VII.90 Klotoide III.43 Koeffizientenvergleich VIII.20 komplexe Funktion Anh.18 komplexe Polynome Anh.20 komplexe Zahl Anh.3 komplexe Zahlebene Anh.4 konform Anh.18 Konjugation Anh.5 konkav II.58 konservatives Vektorfeld VI.67 Kontinuitätsgleichung VI.40 konvergent VIII.3 Konvergenzbereich VIII.6 Konvergenzkreis VIII.16 Konvergenzradius VIII.6, 16 konvergieren I.4 konvex II.58 Koordinatenlinien V.32 Koordinatentransformation I.3, IV.55 Koord.transform. bei Flächenelement V.34 Koord.transform. bei Gebietsintegral V.12, V.30 Koord.transform. bei Volumenintegral V.41 Kopplung VII.113 Kreis II.66 Krümmung II.71 Krümmungskreis II.73 Kugelkoordinaten, Volumenelement V.23 Kugeloberfläche VI.24 Kugelvolumen V.22 Kurven in expliziter Darstellung I.17, II.65 Kurven in impliziter Darstellung II.65 Kurven in Parameterdarstellung II.65 Kurven in Polarkoordinaten II.76 Kurvenschar VII.23, VII.64, VII.66 Lagrange, Verfahren von VII.41, VII.79 Landau-Symbol II.49 Laplace-Operator IV.58, VI.14 Laplace-Operator, Polarkoordinaten IV.59 Laplace’sche Differentialgleichung VI.45 Lemniskate III.38 Limes I.6, I.25 lineare Ersatzfunktion II.15, IV.25 linearisieren II.15, IV.25 Logarithmus-Funktion I.23, II.35 logistisches Modell VII.26 Lösungsfunktion VII.17 Lösungskurve VII.17 Lotka-Volterra, Modell von VII.104 mathematisches Pendel II.20 Maximalstelle II.28, IV.31 Maxwellsche Gleichungen VI.48, VI.66 Minimalstelle II.28, IV.32 Mittelwertsatz der Differentialrechnung II.23 Mittelwertsatz der Integralrechnung III.8 Moivre, Formeln von Anh.7 monoton I.22 I.7 Newton II.61, VII.4, VII.90 Niveaufläche IV.45 Niveaulinie IV.6, VII.48 Normale II.69 Normale zur Fläche IV.52, VI.20 Nullstellen komplexer Polynome Anh.20 Oberflächenberechnung III.49, VI.23 Ohm’scher Widerstand VII.90 Ordnung einer Differentialgleichung VII.6 Orthogonalitätsrelationen Anh.13 Orthogonaltrajektorien VII.52 Oszillator, gedämpft VII.116 Oszillator, ungedämpft VII.118 Parabolspiegel VII.32 Parameterlinie VI.17 Partialsumme VIII.3 partielle Ableitung IV.10 partielle Differentialgleichung VII.6 partielle Integration III.15 partikuläre Lösung VII.38 Pendel, gekoppelt VII.110 Pendel, mathematisches VIII.24 Phasenporträt VII.104 Phasenverschiebung VII.47, VII.94 Polardarstellung einer komplexen Zahl Anh.5 Polarkoordinaten, Flächenelement V.14 Polynom I.23 Polynome, komplexe Anh.20 Polynomzerlegung Anh.21 Potential VI.68 Potentialfeld VI.68, VI.70 Potentialflächen VI.68, VI.70 Potenzfunktion I.23 Potenzreihen VIII.6 Punktfunktion IV.55 Quelle VI.39 quellenfrei VI.39 radioaktiver Zerfall VII.9 Räuber-Beute-Modell VII.104 Rechenregeln der Differentialrechnung II.7 Rechenregeln der Integralrechnung III.5 Rechenregeln für Folgen I.11 Rechenregeln für Grenzwerte I.30 reguläre Kurvenschar VII.23, VII.64, VII.66 Reihe VIII.3 Reihe, geometrische I.12 Resonanzfrequenz VII.97 Richtungsableitung IV.50 Richtungsfeld VII.17 Riemann’sches Integral III.4 Roboter I.21, V.38 Rotation VI.13, VI.63 Sattel IV.26 Scharparameter VII.4, VII.23, VII.64 Schraube VI.22 Schwarz, Satz von IV.18 Schwebung VII.114 Schwerpunkt III.54 Schwingungsprobleme VII.89 Sektorfläche III.36 Senke VI.39 separierbare Differentialgleichung VII.25 separieren VII.25 singuläre Lösung VII.57 Skalarfeld VI.3 Spirale, logarithmische II.77 stabil VII.118 Stabilitätsverhalten VII.115 stationär VI.5 stationäre Lösung VII.47, VII.94, Steigung des Graphen II.3 Steigung von Kurven in Parameterdarst. II.69 Steigung von Kurven in Polarkoord. II.76 stetig I.32 Stetigkeit I.25 Stokes, Satz von VI.56, VI.65 Störglied VII.36, VII.77, VII.97 Strömungslehre Anh.18 Strudelpunkt VII.120 Substitution, Methode der III.19 Symbiose VII.116 Systeme von Differentialgleichungen VII.102 Systeme von Differentialgleichungen, autonome VII.103 Tangente II.3, II.69 Tangentenfläche VI.20 Tangentialebene IV.25, VI.20 Taylorpolynom VIII.10 Taylorreihe VIII.14 totales Differential IV.28 Trägheitsmoment III.58 Trägheitsmoment einer Kugel III.62 Trägheitsmoment eines Rotationskörpers III.61 Trägheitsmoment eines Tetraeders V.21 Trägheitsmoment eines Torus III.63 Trägheitsmoment eines Vollzylinders III.60 Trajektorie VII.48, VII.104 Translation Anh.16 trigonometrische Funktionen I.23 uneigentliche Integrale III.67 ungerade Funktion I.22 Vektorfeld IV.49, VI.3 Vektorfeld, homogenes VI.6 Vektorfeld, konservatives VI.67 Volumen III.45 Volumen eines Ellipsoids III.45 Volumen eines Zylinderhufs III.47 Volumenelement bei Koord.transform. V.41 Volumenelement bei Kugelkoordinaten V.23 Volumenelement bei Zylinderkoordinaten V.29 Volumenintegral V.17 Wachstum, ungestörtes VII.7 Wallis, Formel von III.27 Wärmeleitungsgleichung VI.43 Weg VI.51 Wellengleichung IV.60 Wertetabelle I.17 winkeltreu Anh.18 wirbelfrei VI.13, VI.64 Wirbelstärke VI.64 Wurf VII.59 zweite Ableitung II.57 Zwischenwertsatz I.34 Zykoide II.70 Zykloide, Länge der III.40 zyklometrische Funktionen I.51 Zylinderhufs, Volumen eines III.47 Zylinderkoordinaten, Volumenelement V.29

Analysis I/II: Differential- und Integralrechnung für Ingenieure

Related documents

Products

Support

Analysis I/II: Differential- und Integralrechnung für Ingenieure

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib