8.2 Zentrale Sätze der Differentialrechnung
8.2.1 Der Mittelwertsatz
Wir wenden uns nun allgemeinen Sätzen der Differentialrechnung und deren Konsequenzen zu. Unsere erste Frage wird sein, ob die Ableitung einer differenzierbaren Funktion die Steigung gewisser Sekanten annimmt, wobei folgender Satz unser Ausgangspunkt sein wird.
Satz 8.28 (Rolle).
Sei ein kompaktes Intervall mit und eine stetige Funktion, die auf dem offenen Intervall differenzierbar ist. Falls gilt, so existiert ein mit .
In Worten besagt der Satz von Rolle also, dass wenn eine „schöne“ Funktion auf einem Intervall an den Endpunkten den selben Wert annimmt, die Steigung irgendwo (strikt) zwischen den Endpunkten Null sein muss. Wir veranschaulichen dies in folgendem Bild, das bereits einen Hinweis enthält, wie wir im Beweis vorgehen wollen.
Beweis.
Nach dem Extremwertsatz (Korollar 3.71) werden Minimum und Maximum von auf angenommen. Das heisst, es existieren mit
Nach Proposition 8.17 muss die Ableitung von bei allen Punkten in , wo ein Extremum angenommen wird, Null sein. Falls also oder gilt, dann haben wir bereits ein gefunden mit (wobei oder ist). Falls aber und Endpunkte des Intervalles sind, dann muss wegen auch gelten, womit die Funktion konstant und für alle ist.
Der Satz von Rolle führt unmittelbar zu folgendem fundamentalen Satz.
Theorem 8.29 (Mittelwertsatz).
Sei ein kompaktes Intervall mit und eine stetige Funktion, die auf dem offenen Intervall differenzierbar ist. Dann gibt es ein mit
Somit gibt es also mindestens einen Punkt , an dem die Steigung der durchschnittlichen Steigung , also der Steigung der Sekante durch und entspricht. Wir stellen dies in einem Bild dar.
Der Beweis des Mittelwertsatzes adaptiert die Werte von auf eine (affin) lineare Weise, um danach den Satz von Rolle (Satz 8.28) anwenden zu können. In der Tat behandelt der Satz von Rolle genau den Spezialfall . Wenn wir in obigem Bild die Funktion rechts „nach unten ziehen“, können wir genau diesen Spezialfall verwenden.
Übung 8.30 (Intervall als Voraussetzung).
Zeigen Sie anhand eines Beispiels die Notwendigkeit der Voraussetzung im Mittelwertsatz (Theorem 8.29), dass der Definitionsbereich der Funktion ein Intervall ist.
Übung 8.31 (Lipschitz-Stetigkeit differenzierbarer Funktionen).
Sei ein kompaktes Intervall mit Endpunkten und sei stetig differenzierbar. Zeigen Sie, dass Lipschitz-stetig ist. Was geschieht, wenn man Kompaktheit fallen lässt, das heisst, wenn man oder zulässt?
Der Mittelwertsatz (Theorem 8.29) wird zu einem zentralen Tool für die folgenden Diskussionen werden. Da wir die Ableitung auch für komplexwertige Funktionen definiert haben und in Beispiel 8.3(iii) auch schon für eine spezielle Funktion berechnet haben, wollen wir in folgendem Beispiel zeigen, dass der Mittelwertsatz nur für reellwertige Funktionen und nicht für komplexwertige Funktionen zutrifft.
Beispiel 8.32 (Kreisparametrisierung).
Sei die Abbildung (besser: die Kurve) gegeben durch
Nach Beispiel 8.3(iii) ist die Ableitung gegeben durch . An den Endpunkten des Intervalles gilt . Die Ableitung von nimmt jedoch nie den Wert Null an, denn es gilt für alle . Somit können die Aussagen des Satzes von Rolle (Satz 8.28) und des Mittelwertsatzes (Theorem 8.29) für komplexwertige Funktionen in dieser Allgemeinheit nicht zutreffen.
8.2.2 Korollare des Mittelwertsatzes und Kurvendiskussion
Der Mittelwertsatzes erlaubt es uns nun, uns bekannte Eigenschaften von Funktionen mittels der Ableitung zu charakterisieren.
Korollar 8.33 (Kriterium für Konstanz).
Sei ein Intervall mit Endpunkten und eine Funktion. Dann ist genau dann konstant, wenn differenzierbar ist und für alle gilt.
Beweis.
Wir wissen bereits, dass die Ableitung einer konstanten Funktion die Nullfunktion ist. Also angenommen es gilt für alle . Seien in . Dann folgt aus dem Mittelwertsatz (Theorem 8.29) angewendet auf , dass es ein gibt mit . Es gilt aber und damit . Die Punkte waren jedoch beliebig, also folgt die Aussage.
Übung 8.34 (Charakterisierung von Polynomen).
Sei ein Intervall mit Endpunkten und eine Funktion. Zeigen Sie, dass genau dann ein Polynom ist, wenn glatt ist und es ein gibt mit .
Hinweis.
Verwenden Sie Korollar 8.33 und eine geeignete Induktion für die Rückrichtung.
Im Folgenden werden wir den Mittelwertsatz, wie schon im obigen Beweis von Korollar 8.33, oft auf zwei verschiedene Punkte in einem Intervall anwenden, was jeweils zu einem neuen Punkt strikt zwischen und mit führt.
Korollar 8.35 (Kriterium für Monotonie).
Sei ein nicht-leeres Intervall und eine differenzierbare Funktion. Dann gilt
Beweis.
Dies folgt unmittelbar aus dem Mittelwertsatz (Theorem 8.29), da für zwei Punkte in gilt für ein .
Zwei (aber nur zwei) dieser Implikationen sind sogar Äquivalenzen, wie folgende Übung zeigt.
Wichtige Übung 8.36 (Exakte Charakterisierung von Monotonie).
Sei ein nicht-leeres Intervall und eine differenzierbare Funktion. Zeigen Sie, dass
Untersuchen Sie weiter das Beispiel .
Hinweis.
Wir haben die nötige Argumentation für die Umkehrung bereits in Proposition 8.17 verwendet.
Korollar 8.37 (Hinreichende Kriterien für lokale Extrema).
Sei ein Intervall mit Endpunkten und kein Endpunkt von . Sei stetig und zumindest auf stetig differenzierbar.
Auf Grund der Vielzahl obiger Kriterien möchten wir hier erwähnen, dass man sich dieses Korollar viel eher merken kann, wenn man es (anhand eines Bildes und des Beweises) verstanden hat, als wenn man es auswendig lernen möchte.
Beweis.
Die Beweise dieser Aussagen sind alle sehr ähnlich und beruhen in sämtlichen Fällen auf dem Mittelwertsatz. Sei der linke Endpunkt und angenommen . Dann existiert wegen der Stetigkeit von ein , so dass für alle ebenso gilt. Für jedes existiert nun nach dem Mittelwertsatz (Theorem 8.29) ein mit
Dies zeigt, dass in ein lokales Minimum annimmt. Der Fall ergibt sich analog. Ebenfalls analog ist das Argument für die Aussagen beim rechten Endpunkt.
Für gilt auf Grund des gleichen Arguments für jedes
Durch Kombination dieser Aussagen ergeben sich das erste, zweite und dritte Kriterium für .
Angenommen ist auf ganz zweimal stetig differenzierbar und sowie sind erfüllt. Dann existiert ein so dass für alle . Nach Korollar 8.35 ist streng monoton fallend und somit nimmt nach dem zweiten Kriterium für in ein isoliertes lokales Maximum an. Das fünfte Kriterium für folgt wiederum analog.
8.2.3 Konvexität
Definition 8.38 (Konvexität und Konkavität).
Sei ein Intervall und eine Funktion. Dann heisst konvex, falls
für alle und für alle . Wir sagen, dass streng konvex ist, falls in (8.6) eine strikte Ungleichung gilt, wenn immer und (in diesem Falls ist echt zwischen und ). Eine Funktion heisst (streng) konkav, wenn (streng) konvex ist.
Konvexe Funktionen sind unter anderem nützlich, weil sie bei verschiedenen Ungleichungen zum Vorschein treten. Wir bemerken, dass auf Grund der Definition von Konkavität die Resultate dieses Unterabschnitts für konvexe Funktionen auf ähnlichen Weise auf konkave Funktionen zutreffen. Nun beginnen wir damit Konvexität auf eine andere Art zu charakterisieren.
Lemma 8.39 (Konvexität via Steigung von Sekanten).
Sei ein Intervall und eine Funktion. Die Funktion ist genau dann konvex, wenn für alle gilt
Des Weiteren ist genau dann streng konvex, wenn
gilt.
In Worten ausgedrückt besagt das Lemma insbesondere, dass für eine konvexe Funktion die Steigung der Sekanten zwischen Punkten kleiner (gleich) ist als die Steigung der Sekanten zwischen . Veranschaulichen Sie sich dies an Figur 8.3.
Beweis.
Für Punkte in hat die Umkehrabbildung . Mit dieser Notation gilt (8.6) für alle genau dann, wenn
für alle gilt. Letzteres ist wiederum äquivalent zu
für alle , was genau dann gilt, wenn
für alle . Dies ist aber zu äquivalent, wie gewünscht.
Im Falle der strengen Konvexität können wir alle „“ in obigem Beweis durch „ “ ersetzen.
Für differenzierbare Funktion existiert folgende, sehr direkte Charakterisierung der Konvexität, welche erklärt, warum (differenzierbare) konvexe Funktionen aufwärts gekrümmte Graphen besitzen.
Proposition 8.40 (Kriterium für Konvexität).
Sei ein Intervall mit Endpunkten und eine differenzierbare Funktion. Dann ist genau dann (streng) konvex, wenn (streng) monoton wachsend ist.
Beweis.
Der Beweis beruht auf dem Mittelwertsatz (Theorem 8.29) und der Charakterisierung von konvexen Funktionen in Lemma 8.39. Denn für drei Punkte in existieren und mit
Falls nun (streng) monoton wachsend ist, dann ist (respektive ) und wir erhalten die (strenge) Konvexität von aus Lemma 8.39.
Angenommen ist konvex und sind zwei Punkte in . Dann folgt aus Lemma 8.39, dass für alle gilt
woraus mit
folgt. Wir verweisen auf Übung 8.41 für den letzten Beweisschritt (der weniger häufig für Anwendungen von Bedeutung ist).
Übung 8.41 (Strenge Konvexität).
Seien wie in Proposition 8.40. Angenommen ist streng konvex. Zeigen Sie, dass streng monoton wachsend ist.
Hinweis.
Betrachten Sie zusätzlich zu für noch drei Punkte nämlich und die entsprechende echte Ungleichung der Differenzenquotienten in Lemma 8.39.
Aus Proposition 8.40 und Korollar 8.35 ergibt sich folgendes Korollar.
Korollar 8.42 (Konvexität und die zweite Ableitung).
Sei ein Intervall mit Endpunkten und eine zweimal differenzierbare Funktion. Falls für alle , dann ist konvex. Falls für alle , dann ist streng konvex.
Beispiel 8.43.
Die Funktion ist streng konvex. Dies ergibt sich aus Korollar 8.42, da glatt ist und
für alle . Des Weiteren wissen wir bereits aus Beispiel 6.44, dass . Zuletzt bemerken wir, dass , was alles im Graphen von ersichtlich ist.
Lemma 8.44 (Jensensche Ungleichung).
Sei ein Intervall und eine konvexe Funktion. Seien , und mit . Dann gilt
Beweis.
Wir verwenden Induktion über . Für haben wir , und (8.7) ist trivialerweise erfüllt. Für ist (8.7) gerade (8.6) (mit und ). Angenommen die Aussage ist für erfüllt. Seien und . Falls folgt (8.7) direkt aus der Annahme für . Also angenommen . Dann gilt
per Induktionsannahme angewendet auf und Konvexität von .
Die Jensenschen Ungleichung hat zahlreiche Anwendungen und kann abhängig von der konvexen Funktion verschiedene Formen annehmen. Ein Beispiel dafür ist in der nächsten Übung enthalten.
Übung 8.45 (Harmonisches, geometrisches und arithmetisches Mittel).
Zeigen Sie die Ungleichung
für das harmonische, das arithmetische und das geometrische Mittel von .
Hinweis.
Verifizieren Sie zuerst, dass konvex ist.
Auch für das Riemann-Integral gilt eine Version der Jensenschen Ungleichung.
Übung 8.46 (Integralform der Jensenschen Ungleichung).
Sei stetig und sei eine stetige, konvexe Funktion. Dann gilt
Hinweis.
Verwenden Sie Riemann-Summen.
Wir schliessen die Diskussion von Konvexität mit folgender Übung.
Übung 8.47 (Minima von konvexen Funktionen).
Sei ein Intervall und eine konvexe Funktion. Zeigen Sie, dass jedes lokale Minimum von ein (globales) Minimum ist.
8.2.4 Mittelwertsatz nach Cauchy
Wir möchten nun den Mittelwertsatz etwas verallgemeinern.
Satz 8.48 (Erweiterter Mittelwertsatz).
Seien und stetige Funktionen auf einem Intervall mit , so dass und auf differenzierbar sind. Dann existiert ein mit
Falls zusätzlich für alle gilt, dann gilt und
Man beachte, dass der Mittelwertsatz (Theorem 8.29) gerade der Spezialfall des obigen Satzes ist und man somit in der Tat von einem erweiteren Mittelwertsatz sprechen darf.
Bemerkung.
Genau wie der Mittelwertsatz hat der Mittelwertsatz von Cauchy eine geometrische Interpretation, nur muss man dieses Mal in der zweidimensionalen Ebene suchen. Dort besagt der Mittelwertsatz von Cauchy unter den getroffenen Annahmen, dass die Kurve eine Tangente besitzt, die parallel zur Gerade durch die Punkte , ist.
Beweis von Satz 8.48.
Wir definieren eine Funktion durch
für alle . Dann gilt
Nach dem Satz von Rolle (Satz 8.28) existiert somit ein mit
Dies beweist die erste Behauptung (8.8) des Satzes.
Falls zusätzlich für alle , dann folgt aus dem Satz von Rolle (Satz 8.28), dass (wieso?). Nach Division von (8.8) mit ergibt sich die zweite Behauptung des Satzes.
8.2.5 Regel von de l’Hôpital
Die folgende Regel stellt eine einfache Anwendung des obigen erweiterten Mittelwertsatzes dar und macht die Berechnung von vielen konkreten Grenzwerten deutlich einfacher.
Satz 8.49 (Regel von de l’Hôpital).
Seien in und seien zwei differenzierbare Funktionen mit und für alle . Angenommen der Grenzwert existiert in und eine der beiden folgenden Bedingungen ist erfüllt:
Dann existiert auch der Grenzwert und es gilt
Analoge Aussagen gelten für die Bewegungen oder . Im letzten Fall erlauben wir oder auch , solange und für alle .
Wir nennen „“ und „ “ unbestimmte Formen, da wir bisher keine allgemeinen Werkzeuge hatten, um den Grenzwert von zu berechnen für den Fall, dass sowohl als auch beide gegen oder beide gegen streben. Obige Regel ist in diesen Fällen sehr oft nützlich und viel einfacher anwendbar als unsere bisherigen Berechnungen (siehe unter anderem Beispiel 6.44). Wie bereits erwähnt ist die Regel ein Korollar des erweiterten Mittelwertsatzes.
Beweis.
Wir betrachten zuerst die Bewegung für ein und setzen
Die unbestimmte Form „“: Angenommen es gilt . In diesem Fall können wir also und stetig auf fortsetzen, in dem wir setzen. Da ist, können wir für eine beliebige Umgebung von ein wählen mit für alle . Für ein beliebiges wenden wir nun den erweiterten Mittelwertsatz (Satz 8.48) auf an und erhalten
für ein . Da die Umgebung von beliebig war, existiert der Grenzwert und ist gleich . Dies beweist den ersten Fall.
Die unbestimmte Form „“ mit reellem Grenzwert: Wir nehmen an, dass der Nenner die Aussage (oder ) erfüllt sowie der Grenzwert reell ist.† Man beachte, dass diese Annahme auch gemeinsam mit keinerlei Information über das asymptotische Verhalten von für enthält.
Sei nun . Nach Definition von und der Annahme dieses Falles gibt es ein mit für alle . Für ein beliebiges gibt es nach dem erweiterten Mittelwertsatz (Satz 8.48) jeweils ein mit
wobei auf Grund der zweiten Aussage in Satz 8.48 und unserer Annahmen an . Anders ausgedrückt erhalten wir also
Intuitiv ausgedrückt ist hier die linke Seite etwa für sehr nahe an , denn ist fest gewählt während beliebig gross wird. Des Weiteren ist die rechte Seite nahe an , da gegen Null geht für .
Formaler geht man wie folgt vor. Wir bemerken zuerst, dass (8.10) zu
für alle umgeformt werden kann. Da gilt, existiert weiter ein , so dass
für alle . Zusammenfassend gilt für ein und eine Wahl wie in (8.9) die Abschätzung
und damit die Ungleichung
was zu beweisen war.
Die unbestimmte Form „“ mit uneigentlichem Grenzwert: Wir nehmen nun an, dass . Dann lässt sich die Aussage nach kleinen Anpassungen analog wie oben beweisen. In der Tat existiert nach Annahme zu jedem ein , so dass für alle . Für dieses fest gewählte wählen wir nun ein mit und für alle . Dann ist nach (8.10)
Daraus folgt die Aussage, da beliebig war. Der Fall lässt sich analog beweisen oder durch Vorzeichenwechsel von auf obigen Fall zurückführen.
Restliche Fälle: Wir beschäftigen uns nun mit den übrig bleibenden Fällen im Satz, die wir jeweils auf einen der obigen Fälle reduzieren können, in dem wir die unabhängige Variable im Definitionsbereich geeignet ersetzen.
Betrachtet man die Bewegung für , so lässt sich dieser Fall auf die vorherigen Fälle zurückführen. In der Tat können wir durch Einschränkung der Funktionen ohne Beschränkung der Allgemeinheit annehmen und die Funktionen
definieren und nun stattdessen den Grenzwert betrachten. Die weiteren Schritte überlassen wir hierbei den Leserinnen und Lesern – siehe Übung 8.50. Die Bewegungen , und lassen sich ebenso auf die bereits betrachteten Fälle zurückführen.
Wichtige Übung 8.50.
Vervollständigen Sie den obigen Beweis, indem Sie die Reduktionen in allen verbleibenden Fällen komplett ausführen.
Übung 8.52.
Sei ein abgeschlossenes Intervall mit und sei stetig. Angenommen ist ein Punkt, so dass auf differenzierbar ist und angenommen der Grenzwert existiert. Zeigen Sie, dass bei differenzierbar ist und dass bei stetig ist.
Hinweis.
Sie können entweder den Mittelwertsatz oder die Regel von de l’Hôpital verwenden.
Wir möchten kurz anmerken, dass sich höhere Ableitungen mitunter zwar als einen direkten Grenzwert ausdrücken lassen, doch die Existenz dieses Grenzwertes nicht zur mehrmaligen Differenzierbarkeit äquivalent sein muss.
Übung 8.53 (Zweite Ableitung als Grenzwert).
Sei ein Intervall mit und sei zweimal differenzierbar. Zeigen Sie die Formel
für alle . Verifizieren Sie anhand der Vorzeichenfunktion , dass die Existenz des obigen Grenzwerts nicht zweimalige Differenzierbarkeit impliziert.