="http://www.w3.org/2000/svg" viewBox="0 0 512 512">

8.1 Die Ableitung

8.1.1 Definition und geometrische Interpretation

Eine (nicht-vertikale) Gerade im 2 ist eine Teilmenge der Form {(x,y)y = mx + q} für Parameter m,q oder alternativ ausgedrückt der Graph der (affinen) Abbildung x mx + q . Meist nennt man Funktionen dieser Form ebenfalls Geraden. Der Parameter m der Geraden y = mx + q wird auch die Steigung der Geraden genannt. Wir möchten uns nun mit Funktionen beschäftigen, die sich um einen Punkt im Definitionsbereich durch Geraden approximieren lassen.

Definition 8.1 (Differenzierbarkeit).

Sei D eine Teilmenge, f : D eine Funktion und a D ein Häufungspunkt von D. Wir sagen, dass f bei a differenzierbar ist, falls der Grenzwert

f (a) = lim xaf(x) f(a) x a = lim h0f(a + h) f(a) h (8.1)

existiert. In diesem Fall nennen wir f(a) die Ableitung von f bei a. Falls f bei jedem Häufungspunkt von D in D differenzierbar ist, dann sagen wir auch, dass f (auf D) differenzierbar ist und nennen die Funktion af(a) definiert auf den Häufungspunkten von D in D die Ableitung von f.

Falls a D ein rechtseitiger Häufungspunkt von D ist, dann ist f bei a rechtsseitig differenzierbar, wenn die rechtsseitige Ableitung

f+ (a) = lim xaf(x) f(a) x a = lim h0f(a + h) f(a) h

existiert. Linksseitige Differenzierbarkeit und die linksseitige Ableitung f(a) werden analog über die Bewegung x a definiert.

Wir nennen x = x a = h im Zusammenhang mit der Definition in (8.1) auch das Inkrement des Arguments oder der unabhängigen Variablen x, f = f(x) f(a) = f(a + h) f(a) das Inkrement der Funktion und f x den Differenzenquotienten. Die Ableitung von f bei a, welche in dieser Formulierung der Grenzwert des Differenzenquotienten f x für x 0 ist, schreibt man auch als d f d x (a) = f (a) und nennt dies den Differentialquotienten (in der Leibniz-Notation). Weiters nennt man f = d f d x auch die Ableitung nach x, was vor allem dann nützlich ist, wenn f auch von weiteren Parametern abhängen darf.

Wir möchten aber betonen, dass d f d x (a) nicht als Quotient, sondern nur als Grenzwert von Quotienten definiert wurde. Falls die unabhängige Variable t (für Zeit) und nicht x ist, dann verwendet man manchmal auch die Notation , für die Ableitung von Funktionen x : D , y : D .

Eine weitere Schreibweise der Definition in (8.1) ist in der Landau-Notation (siehe Abschnitt 6.6)

f(x) f(a) x a = f (a) + o (1)

für x a oder äquivalenterweise

f(x) = f(a) + f(a)(x a) + o(x a) (8.2)

für x a. Hierbei wird die Funktion xf(a)(x a) das Differential von f bei a genannt und die Gerade x f(a) + f (a)(x a) die affine oder lineare Approximation von f bei a oder die Tangente von f bei a, siehe auch Figur 8.1. Wir erinnern daran, dass wir in (8.2) o(x a) als Platzhalter einer Funktion (welcher?) interpretieren, die für x a schneller abfällt als x a. Insbesondere ist wegen (8.2)

lim xaf (x) = f (a) + lim xa (f (a) (x a) + o (x a)) = f (a)

und f ist bei a stetig, wenn f bei a differenzierbar ist.

Applet 8.2 (Bewegung der Sekante).

Wir sehen den Graphen einer Funktion und wie die Sekante zwischen x0 und x0 + h sich bei den meisten Fusspunkten x0 der Tangente bei x0 nähert falls h 0.

PIC

     Figur 8.1: Die geometrische Interpretation der Ableitung einer reellwertigen Funktion f bei a ist die Steigung der Tangenten des Graphen bei a. Denn wenn x gegen a strebt, wird die Sekante, die durch (a,f(a)) und (x,f(x)) geht und den Differenzenquotienten als Steigung besitzt, immer mehr zur Tangente des Graphen bei a.     

Häufig wird in diesem Kapitel (und dem nächsten) der Definitionsbereich D der betrachteten Funktion f : D ein Intervall D = I mit Endpunkten a < b sein. Dies hat den Vorteil, dass jeder Punkt in I ein Häufungspunkt ist (wieso?) und es somit für jeden Punkt in I Sinn macht, nach der Differenzierbarkeit von f bei diesem Punkt zu fragen. Wir wollen dies aber weder in der Definition noch in den zu besprechenden Ableitungsregeln voraussetzen, damit wir beispielsweise auch von der Ableitung der Funktion x {0 } 1 x sprechen können.

Meist werden wir reellwertige Funktionen betrachten. Doch wird es teilweise nützlich sein, den Begriff der Ableitung und manche der Gesetze auch für komplexwertige Funktionen verwenden zu können. Wir bemerken also, dass Definition 8.1 analog auch für komplexwertige Funktionen verwendet werden kann. Wie in Abschnitt 5.3.4 läuft dies darauf hinaus, dass sowohl Real- als auch Imaginärteil differenzierbar sein sollten.

Schlussendlich wollen wir noch anmerken, dass die Ableitung eine rein lokale Operation darstellt. Genauer gesagt, angenommen a D ist ein Häufungspunkt von D und f, g : D sind bei a differenzierbare Funktionen, so dass es ein δ > 0 gibt mit f(x) = g(x) für alle x D (a δ,a + δ). Dann gilt f(a) = g(a). Dies ergibt sich unmittelbar aus der Definition der Grenzwerte, die f (a) und g (a) definieren (wieso?). Wir werden dies im Folgenden teils implizit verwenden.

8.1.2 Beispiele und Ableitungsregeln

Wir wollen nun zeigen, dass viele der uns geläufigen Funktionen differenzierbar sind und dass wir die Ableitung (meistens) mittels einigen konkreten Gesetzen bestimmen können. Wir beginnen aber zuerst mit elementaren Beispielen.

Beispiel 8.3 (Erste Beispiele differenzierbarer Funktionen).

(i)
Konstante Funktionen sind überall differenzierbar und haben die Nullfunktion als Ableitung (wieso?).
(ii)
Die Identitätsfunktion f : x x ist differenzierbar und ihre Ableitung ist die konstante 1-Funktion, denn f (a) = lim xax a x a = 1

für alle a .

(iii)
Die Exponentialfunktion exp : >0 ist differenzierbar und ihre Ableitung ist die Exponentialfunktion. Allgemeiner behaupten wir, dass für ein festes α (oder α ) die Ableitung von f : x exp (αx) durch f (a) = αexp (αa) für alle a gegeben ist. In der Tat gilt für a , dass f (a) = lim h0f(a + h) f(a) h = lim h0 exp (αa)exp (αh) exp (αa) h = exp (αa)lim h0 exp (αh) 1 h = exp (αa)lim h0 k=01 k!(αh)k 1 h = exp (αa)lim h0 k=11 k!αkhk1 = exp (αa)lim h0 =0 α+1 ( + 1)!h = exp (αa)α,

da die Abbildung h =0 α+1 (+1)!h nach Satz 7.56 stetig ist.

Wir besprechen weitere Beispiele von differenzierbaren Funktionen und ein Beispiel einer nicht-differenzierbaren Funktion in der folgenden Übung.

Wichtige Übung 8.4 (Weitere differenzierbare Funktionen).

(i)
Zeigen Sie lim h0 sin (h) h = 1,lim h0 cos (h) 1 h = 0.
(ii)
Verwenden Sie die Additionstheoreme aus Abschnitt 7.6.1 (oder Beispiel 8.3 (iii)), um zu zeigen, dass der Sinus und der Kosinus differenzierbare Funktionen sind und die Ableitungsregeln sin (x) = (sin (x)) = cos (x),cos (x) = (cos (x)) = sin (x)

für alle x gelten.

(iii)
Zeigen Sie, dass die Funktionen sinh und cosh differenzierbar sind und verifizieren Sie die Ableitungsregeln sinh (x) = (sinh (x)) = cosh (x),cosh (x) = (cosh (x)) = sinh (x).

für alle x .

(iv)
Zeigen Sie, dass die Betragsfunktion x |x| >0 nicht differenzierbar ist und bestimmen Sie bei jedem Punkt in die linksseitige und die rechtsseitige Ableitung.

Wie in (ii) und (iii) von Übung 8.4 schon verwendet, wollen wir für Funktionen wie zum Beispiel die Funktion x {1} x x1, die durch Formeln gegeben sind, nicht immer einen Namen einführen, um die Ableitung hinschreiben zu können. Stattdessen schreiben wir

( x x 1 ) = 1 (x 1)2

und meinen damit, dass die Funktion x x x1 auf ihrem maximalen Definitionsbereich differenzierbar ist und dass ihre Ableitung bei x durch 1 (x1)2 gegeben ist. Insbesondere ist x in obiger Gleichung nicht als Zahl, sondern vielmehr als Argument der Funktion und der Ableitung zu erachten.

Wie schon bei stetigen und Riemann-integrierbaren Funktionen möchten wir nicht immer von Hand zeigen müssen, dass eine gegebene Funktion differenzierbar ist. Stattdessen wollen wir allgemeine Regeln beweisen, auf die sich die Differenzierbarkeit verschiedener Funktionen zurückführen lässt.

Proposition 8.5 (Summen und Produkte differenzierbarer Funktionen).

Sei D eine Teilmenge und a D ein Häufungspunkt von D. Seien f, g : D bei a differenzierbar. Dann sind f + g und f g bei a differenzierbar und es gilt

(f + g)(a) = f(a) + g(a), (fg)(a) = f(a)g(a) + f(a)g(a).

Insbesondere ist jedes skalare Vielfache von f bei a differenzierbar und (αf) (a) = αf(a) für alle α . Dies gilt ebenso für komplexwertige Funktionen.

Somit bilden die bei a D differenzierbaren reellwertigen Funktionen einen Unterraum des Vektorraums (D) der reellwertigen Funktionen von D nach und die Ableitung bei a ist eine lineare Abbildung von diesem Unterraum nach . Die Ableitungsregel für das Produkt zweier Funktionen wird auch die Produktregel genannt.

Beweis.

Wir berechnen unter Verwendung der Eigenschaften des Grenzwerts in Abschnitt 6.4.1

lim xa(f + g)(x) (f + g)(a) x a = lim xaf(x) f(a) x a + g(x) g(a) x a = f (a) + g (a)

und

lim xa(f g)(x) (f g)(a) x a = lim xa(f(x) f(a))g(x) + f(a)(g(x) g(a)) x a = lim xaf(x) f(a) x a g (x) + f (a) g(x) g(a) x a = f(a)g(a) + f(a)g(a),

da g bei a stetig ist.   

Korollar 8.6 (Differenzierbarkeit von Polynomen).

Reelle Polynome sind auf ganz differenzierbar und es gilt

(1) = 0,(xn) = nxn1 (8.3)

für alle n .

Nach Proposition 8.5 und Korollar 8.6 ist insbesondere die Ableitung eines Polynoms wieder ein Polynom. Weiters ist f [x]f [x] eine lineare Abbildung.

Beweis von Korollar 8.6.

Die Fälle n = 0 und n = 1 wurden bereits in Beispiel 8.3 besprochen. Wir beweisen (8.3) per Induktion nach n. Angenommen für n gilt (xn ) = nxn1. Dann folgt aus Proposition 8.5, dass xn+1 = xxn differenzierbar ist und

(xn+1) = (xxn) = 1xn + x(nxn1) = (n + 1)xn

erfüllt, was den Induktionsbeweis abschliesst. Differenzierbarkeit eines beliebigen Polynoms folgt nun aus der Linearität der Ableitung in Proposition 8.5.   

Übung 8.7 (Potenzregel mittels Binomialsatz).

Zeigen Sie Korollar 8.6 direkt unter Verwendung des Binomialsatzes. Beweisen Sie des Weiteren, dass der Kern der Abbildung f [x] f [x] aus den konstanten Polynomen besteht. Später werden wir sehen, dass nicht nur Polynome mit Ableitung Null, sondern auch differenzierbare Funktionen auf mit Ableitung Null konstant sein müssen.

Wieder in Analogie zur Diskussion von stetigen Funktionen (genauer Proposition 3.52) wollen wir zeigen, dass die Verknüpfung zweier differenzierbaren Funktionen auch differenzierbar ist.

Satz 8.8 (Kettenregel).

Seien D,E Teilmengen und sei x0 D ein Häufungspunkt. Sei f : D E eine bei x0 differenzierbare Funktion, so dass y0 = f(x0) ein Häufungspunkt von E ist, und sei g : E eine bei y0 differenzierbare Funktion. Dann ist g f : D in x0 differenzierbar und

(g f)(x 0) = g(f(x 0))f(x 0).

Wir bemerken, dass man zwar versucht sein mag, für den Beweis der Kettenregel den Differenzenquotienten

(g f)(x) (g f)(x0) x x0

mit f(x) f(x0) zu erweitern. Dies ist im Allgemeinen aber nicht erlaubt, da wir nicht ausschliessen können, dass f(x) = f(x0) für gewisse Punkte x nahe bei x0 ist.

Beweis.

Wir verwenden stattdessen die Umformulierung

f(x) = f(x0) + f(x 0)(x x0) + o(x x0)

für x x0 , oder genauer formuliert

f(x) = f(x0) + f(x 0)(x x0) + 𝜀f(x)(x x0),

wobei die Funktion 𝜀f auf D durch

𝜀f (x) = { f(x)f(x0) xx0 f (x0)falls x D {x0} 0 falls x = x0

für alle x D gegeben ist und bei x0 stetig ist. Ebenso gilt

g(y) = g(y0) + g(y 0)(y y0) + 𝜀g(y)(y y0),

wobei die bei y0 stetige Funktion 𝜀g auf E durch

𝜀g (y) = { g(y)g(y0) yy0 g (y0)falls y E {y0} 0 falls y = y0

für alle y E gegeben ist. Zusammen ergibt sich durch Einsetzen von y = f(x)

g(f(x)) = g(f(x0)) + g(f(x 0))(f(x) f(x0)) + 𝜀g(f(x))(f(x) f(x0)) = g(f(x0)) + g(f(x 0))f(x 0)(x x0) +(g(f(x 0))𝜀f(x) + 𝜀g(f(x))(f(x 0) + 𝜀f(x))) (x x0) ,

für alle x D, womit

lim xx0 (g f)(x) (g f)(x0) x x0 = lim xx0(g(f(x 0))f(x 0) + g(f(x 0))𝜀f(x) + 𝜀g(f(x))(f(x 0) + 𝜀f(x))) = g(f(x 0))f(x 0)

wie gewünscht.   

Abgesehen von Summen, Produkten und Verknüpfungen von differenzierbaren Funktionen, möchten wir zeigen, dass Quotienten von differenzierbaren Funktionen differenzierbar sind. Wir beginnen dazu mit einem wichtigen Beispiel.

Beispiel 8.9 (Kehrwert).

Sei f : {0} ,x1 x. Dann ist f differenzierbar und es gilt f(x) = 1 x2 für alle x {0}. In der Tat ist

f (x) = lim h0 1 x+h 1 x h = lim h0x (x + h) (x + h)xh = lim h0 1 (x + h)x = 1 lim h0 (x + h)x = 1 x2

wegen der Stetigkeit von h(x + h)x bei 0.

Übung 8.10 (Negative Potenzen).

Berechnen Sie (xn) für alle n .

Unter Kombination der Kettenregel und Beispiel 8.9 erhält man nun folgendes Korollar.

Korollar 8.11 (Quotientenregel).

Sei D eine Teilmenge, a D ein Häufungspunkt und seien f,g : D bei a differenzierbar. Falls g(a) 0 ist, dann ist auch f g bei a differenzierbar und es gilt

(f g ) (a) = f(a)g(a) f(a)g(a) g(a)2 .

Man beachte, dass der (natürliche) Definitionsbereich der Funktion f g, der in obigem Korollar nicht erwähnt wurde, die Teilmenge E = {x Dg(x)0} ist. Da g beim Punkt a differenzierbar ist, ist g bei a stetig. Insbesondere ist, da g(a)0 ist, g(x) 0 für alle x nahe genug bei a und a ist ein Häufungspunkt von E. Damit macht es auch Sinn, von Differenzierbarkeit von f g bei a zu sprechen.

Eine direkte Konsequenz von Korollar 8.11 ist, dass rationale Funktionen differenzierbar sind, wo definiert. Wir erinnern daran, dass eine rationale Funktion eine Funktion der Form f(x) g(x) ist, wobei f(x) und g(x) reelle Polynome sind und g(x) nicht das Nullpolynom ist.

Beweis von Korollar 8.11.

Es bezeichne ψ die Funktion y {0}1 y , welche nach Beispiel 8.9 differenzierbar ist. Wir kombinieren dies mit der Kettenregel (Satz 8.8) und erhalten, dass die Funktion 1 g = ψ g bei a differenzierbar ist mit Ableitung

(1 g ) (a) = 1 g(a)2g (a).

Verwenden wir nun die Produktregel in Proposition 8.5, so ergibt sich, dass f g = f 1 g bei a differenzierbar ist und

(f g ) (a) = (f 1 g ) (a) = f (a) 1 g(a) f (a) g(a) g(a)2 = f(a)g(a) f(a)g(a) g(a)2

erfüllt, was zu zeigen war.   

Die Kettenregel erlaubt uns die Berechnung der Ableitung von beliebig kompliziert anmutenden konkreten Beispielen, wobei man stur von aussen nach innen vorgeht wie in folgendem Beispiel.

Beispiel 8.12 (Vierfach verschachtelte Funktionen).

Wir bestimmen die Ableitung der Funktion

f : x exp (sin (sin (x2)))

mittels mehrmaligem Anwenden der Kettenregel (Satz 8.8). Da exp = exp erhalten wir

f(x) = exp (g(x))g(x),

wobei g(x) = sin (sin (x2)). Ebenso ist wegen sin = cos

g(x) = cos (h(x))h(x),

wobei h(x) = sin (x2) und h (x) = cos (x2)2x. Dadurch erhalten wir

f(x) = exp (sin (sin (x2)))cos (sin (x2))cos (x2)2x

für alle x .

Übung 8.13 (Nochmals vierfach verschachtelt).

Bestimmen Sie die Ableitung von der Funktion x cos ((sin (exp (x)))3).

Unsere vorläufig letzte allgemeine Ableitungsregel betrifft die Ableitung der Umkehrabbildung (siehe dazu auch Satz 3.64 über die Existenz einer stetigen Umkehrabbildung).

Satz 8.14 (Differenzierbarkeit der inversen Funktion).

Seien D,E Teilmengen und sei f : D E eine stetige, bijektive Abbildung, deren inverse Abbildung f1 : E D ebenfalls stetig ist. Falls f in dem Häufungspunkt x0 D differenzierbar ist und f(x0)0 gilt, dann ist f1 in y0 = f(x0) differenzierbar und es gilt

(f1)(y 0) = 1 f(x0)
PIC

     Figur 8.2: Eine intuitive Darstellung von Satz 8.14. Spiegelt man den Graphen von f und die Tangente beim Punkt (x0,y0) um die Gerade x = y in 2, so erhält man den Graphen von f1 und, das ist die Behauptung, die Tangente bei (y0,x0). Eine kurze Rechnung zeigt, dass die Spiegelung einer Gerade mit Steigung m um x = y Steigung 1 m hat.     

Beweis.

Wir bemerken zuerst, dass y0 ein Häufungspunkt von E ist, womit man von Differenzierbarkeit bei y0 sprechen darf. Tatsächlich ist nach Annahme x0 ein Häufungspunkt und es existiert eine Folge (xn)n in D {x0 } mit xn x0 für n . Da f stetig ist, gilt f(xn) f(x0) = y0 für n und da f bijektiv ist, gilt f(xn)y0 für alle n .

Sei nun (yn)n eine Folge in E {y0}, die gegen y0 konvergiert. Dann strebt xn = f1(yn) in D {x0 } gegen x0 , da f1 per Annahme stetig ist, und es gilt

lim nf1(yn) f1(y0) yn y0 = lim nxn x0 yn y0 = lim n (f(xn) f(x0) xn x0 ) 1 = (f(x 0))1

nach der Charakterisierung der Konvergenz einer Funktion mittels Folgen in Lemma 6.40. Da dies aber für jede Folge (yn)n wie oben gilt, folgt der Satz wiederum aus Lemma 6.40.   

Beispiel 8.15 (Differenzierbarkeit des Logarithmus und der Potenzfunktionen).

(i)
Die Funktion g : y {0}log (|y|) ist differenzierbar mit Ableitung g gegeben durch g (y) = 1 y für alle y {0 }. Denn die Abbildung log : y >0log (y) = g(y) ist die Umkehrabbildung von exp : >0 und damit folgt aus Satz 8.14, dass g bei allen Punkten y > 0 differenzierbar ist mit g (y) = 1 f(x), wobei x = g(y) = log (y). Da exp = exp folgt nun g (y) = log (y) = 1 exp (x) = 1 exp (log (y)) = 1 y.

Für y < 0 ist g(y) = log (y). Also folgt Differenzierbarkeit von g bei y sowie die Formel g (y) = log (y) = 1 y = 1 y aus der Kettenregel (Satz 8.8).

(ii)
Für ein beliebiges s ist die Abbildung x >0xs differenzierbar und es gilt (xs) = sxs1.

In der Tat gilt xs = exp (slog (x)) für alle x > 0 per Definition beliebiger Potenzen in Abschnitt 7.5.2. Aus Beispiel 8.3 und der Ableitung der Logarithmusabbildung folgt somit

(xs) = exp (slog (x)) = exp (slog (x))s1 x = xssx1 = sxs1

für alle x > 0.

8.1.3 Extremwerte

Wie wir in diesem Abschnitt sehen werden, ist die Ableitung auch nützlich, um Punkte zu finden, bei denen eine Funktion f ihre Maxima und ihre Minima annimmt. Genauer kann man damit die in folgender Definition eingeführten Punkte finden.

Definition 8.16 (Lokale Extremwerte).

Sei D eine Teilmenge und x0 D. Wir sagen, dass eine Funktion f : D ein lokales Maximum in x0 annimmt, falls es eine Umgebung U von x0 in D gibt, auf der f durch f(x0 ) beschränkt ist. Genauer formuliert heisst dies, dass es ein δ > 0 gibt, so dass für alle x D (x0 δ,x0 + δ) gilt f(x) f(x0). Falls es sogar ein δ > 0 gibt, so dass f(x) < f(x0) für alle x D (x0 δ,x0 + δ) {x0} gilt, dann nimmt f in x0 ein isoliertes lokales Maximum an. Der Wert f(x0) wird auch ein lokales Maximum von f genannt. Ein lokales Minimum und ein isoliertes lokales Minimum wird analog definiert.

Des Weiteren sagen wir, dass f in x0 ein lokales Extremum annimmt und f(x0 ) ein lokaler Extremwert von f ist, falls f ein lokales Minimum oder ein lokales Maximum in x0 annimmt.

Proposition 8.17 (Notwendige Bedingung für Extremum).

Sei D eine Teilmenge und f eine reellwertige Funktion auf D. Angenommen f nimmt in x0 D ein lokales Extremum an, f ist bei x0 differenzierbar und x0 ist sowohl ein rechtsseitiger als auch ein linksseitiger Häufungspunkt von D. Dann gilt f (x0) = 0.

Die Annahme in Proposition 8.17, dass sich die Menge D dem Punkt x0 D sowohl von links als auch von rechts nähert, ist notwendig, da wir f (x0 ) von links und von rechts mit Differenzenquotienten approximieren wollen. In konkreten Rechenbeispielen ist sie jedoch meist erfüllt. Beispielsweise ist dies so in allen Punkten eines Intervalls abgesehen von den Endpunkten erfüllt.

Beweis.

Ohne Beschränkung der Allgemeinheit nehmen wir an, dass f ein lokales Maximum in x0 D annimmt (sonst ersetzt man f durch f). Da f bei x0 differenzierbar ist und x0 von links und rechts angenähert werden kann, existieren sowohl der linksseitige als auch der rechtsseitige Grenzwert der Differenzenquotienten bei x0 und beide sind gleich f(x0). Dann ist

f (x 0) = f+ (x 0) = lim xx0f(x) f(x0) x x0 0,

da f(x) f(x0) für alle x hinreichend nahe bei x0 gilt und x > x0 für die Bewegung x x0 erfüllt ist. Weiters ist aber auch

f (x 0) = f (x 0) = lim xx0f(x) f(x0) x x0 0,

da wiederum f(x) f(x0) für alle x hinreichend nahe bei x0 gilt und x < x0 für die Bewegung x x0 erfüllt ist. Unter dem Strich erhalten wir f(x0) = 0.   

Falls der Definitionsbereich D ein Intervall ist, so besagt Proposition 8.17 das Folgende.

Korollar 8.18 (Lokale Extremwerte).

Sei I ein Intervall und f : I . Angenommen f nimmt in x0 I ein lokales Extremum an. Dann bestehen genau folgende Möglichkeiten:

(i)
x0 ist ein in I enthaltener Endpunkt von I,
(ii)
f ist bei x0 nicht differenzierbar oder
(iii)
f ist bei x0 differenzierbar und f(x0) = 0.

Insbesondere sind alle Punkte, wo f ein lokales Extremum für eine differenzierbare Funktion auf einem offenen Intervall annimmt, Nullstellen der Ableitung.

Man beachte, dass alle Fälle in obigem Korollar eintreten können (wieso?). Des Weiteren ist die Umkehrung von Proposition 8.17 nicht richtig, wie wir in folgender Übung zeigen wollen.

Übung 8.19.

(a)
Finden Sie alle lokalen Extremwerte des Polynoms f(x) = x3 x auf .
(b)
Finden Sie alle lokalen Extremwerte der Funktion |f| auf [3, 3].

8.1.4 Stetige Differenzierbarkeit

Sei D eine Teilmenge, so dass jeder Punkt in D ein Häufungspunkt von D ist (wie zum Beispiel bei einem Intervall mit Endpunkten a < b in ¯). Falls f : D eine differenzierbare Funktion ist (also bei jedem Punkt in D differenzierbar ist), können wir die Ableitung

f : x D f(x)

als eine neue Funktion betrachten. Ist f stetig, so nennen wir f stetig differenzierbar.

Man beachte, dass eine differenzierbare Funktion nicht zwingend stetig differenzierbar sein muss. Wir illustrieren dies in einem Beispiel.

Beispiel 8.20 (Unstetige Ableitung).

Wir betrachten zu p > 0 die Abbildung f : definiert durch

fp (x) = { |x|p sin (1 x ) falls x0 0 falls  x = 0

für alle x . Da p > 0 ist, ist fp auch bei 0 stetig (siehe das Sandwich Lemma B.6). Die Ableitung von f bei x 0 existiert und ist durch

fp (x) = p |x|p1 sgn (x)sin ( 1 x ) |x|p2 cos ( 1 x )

gegeben. Hierbei verwendeten wir auch, dass die Ableitung von x × |x| durch x × sgn (x) gegeben ist. Für die Ableitung von f bei 0 können wir keine allgemeine Ableitungsregel verwenden und manipulieren deswegen den Grenzwert

lim x0fp(x) fp(0) x 0 = lim x0xp sin (1 x ) x = lim x0xp1 sin ( 1 x ) = lim tsin (t)t1p

wobei wir t = 1 x gesetzt haben. Falls p 1 ist, dann existiert wegen 1 p 0 der Grenzwert lim tsin (t)t1p nicht und somit ist fp nicht differenzierbar. Wir nehmen nun p > 1 an, womit f (ebenso auf Grund des Sandwich Lemmas) eine rechtsseitige Ableitung (fp )+ (0) = 0 besitzt. Analog können wir den Grenzwert mit (fp)(0) = 0 berechnen und erhalten drei Fälle.

Falls p < 2 ist, ist fp in jeder Umgebung von 0 unbeschränkt und insbesondere nicht stetig bei 0. Somit ist fp nicht stetig differenzierbar.
Falls p = 2 ist, ist fp beschränkt, aber nicht stetig bei 0, da der Grenzwert lim x0 cos (1 x ) nicht existiert.
Falls p > 2 ist, ist fp stetig und fp ist stetig differenzierbar. Man beachte aber, dass fp nicht differenzierbar sein muss, da für p 3 der Grenzwert lim x0fp(x) fp(0) x 0 = lim x0pxp1 sin (1 x ) xp2 cos (1 x ) x = lim t(pt2p sin (t) t3p cos (t))

nicht existiert.

Das Beispiel 8.20 lässt sich mit fraktalen Konstruktionen stark verschärfen. In der Tat kann man eine differenzierbare Funktion auf dem Intervall [0, 1] finden, deren Ableitung überabzählbar viele Unstetigkeitsstellen besitzt (beispielsweise auf der Cantor-Menge). Eine Konstruktion dieser Art finden Sie in Abschnitt 8.6.2.

8.1.5 Ableitungen höherer Ordnung

Sei D eine Teilmenge, so dass jeder Punkt in D ein Häufungspunkt ist, und sei f : D eine Funktion. Falls f existiert und differenzierbar ist, nennen wir f zweimal differenzierbar. Die Funktion (f) ist die zweite Ableitung von f und wird auch mit f,f(2) oder d 2f d x2 bezeichnet. Falls die unabhängige Variable t ist, schreiben wir f¨ = () = d 2f d t2 für die zweite Ableitung nach t. Insbesondere erhalten wir, dass eine zweimal differenzierbare Funktion f stetig differenzierbar ist.

Induktiv kann man nun höhere Differenzierbarkeit und höhere Ableitungen definieren. Formal definieren wir also die Ableitungen

f(0) = f,f(1) = d f d x = f,f(2) = d 2f d x2 = f, ,f(n+1) = d (n+1)f d xn+1 = (f(n))

für alle n . Falls f(n) für ein n (auf ganz D) existiert, heisst f n-mal differenzierbar. Falls die n-te Ableitung f(n) zusätzlich stetig ist, heisst f n-mal stetig differenzierbar. Die Menge der n-mal stetig differenzierbaren Funktionen auf D bezeichnen wir mit Cn(D).

Für jedes n kann man eine Funktion finden, die zwar n-mal differenzierbar, aber nicht (n + 1)-mal differenzierbar ist.

Übung 8.21.

Sei n . Zeigen Sie, dass die Funktion x xn|x| n-mal stetig differenzierbar, aber nicht (n + 1)-mal differenzierbar ist.

Wir sagen, dass f glatt oder beliebig oft differenzierbar ist, falls f für jedes n n-mal differenzierbar ist. Ist f glatt, so sind insbesondere alle Ableitungen von f stetig (f ist also beliebig oft stetig differenzierbar). Die Menge der glatten Funktionen auf D bezeichnen wir mit C (D).

Wir kennen bereits einige Beispiele glatter Funktionen. Dazu gehören die Polynome, da diese nach Korollar 8.6 differenzierbar sind und da deren Ableitung ein Polynom ist, womit die Aussage aus Induktion folgt. Ebenfalls glatt sind die Funktion exp , sin , cos ,sinh ,cosh nach Beispiel 8.3 und Übung 8.4. Etwas interessanter, aber nicht ganz unerwartet ist vermutlich folgendes Beispiel.

Beispiel 8.22 (Logarithmusfunktion).

Der Logarithmus f = log : (0,) ,x log (x) ist glatt. In der Tat gilt f (x) = 1 x, f (x ) = 1 x2, f(3) (x ) = 2 x3 oder allgemein f(n) (x) = (1)n1 (n 1)!xn, was sich mit vollständiger Induktion beweisen lässt.

Ein überraschenderes Beispiel einer glatten Funktion ist vielleicht das folgende.

Beispiel 8.23 (Glattes Abklingen).

Die Funktion ψ : definiert durch

ψ (x) = { 0 falls x 0 exp (1 x )falls x > 0

für alle x ist glatt und demnach auch beliebig oft stetig differenzierbar, siehe das folgende Bild.

PIC

Für x < 0 gibt es nichts zu zeigen, da die Ableitung der Nullfunktion die Nullfunktion ist. Für x > 0 ergibt sich dies mittels Induktion, der Kettenregel (Satz 8.8), Beispiel 8.9, der Produktregel in Proposition 8.5 und Korollar 8.6. In der Tat gilt für x > 0, dass

ψ (x) = exp (1 x ) 1 x2,ψ (x) = exp (1 x ) 1 x2 1 x2 + exp (1 x ) 2 x3

und (da die konkrete Formel für ψ(n) schnell kompliziert wird) allgemeiner

ψ(n) (x) = exp (1 x )fn (1 x ) (8.4)

für gewisse Polynome fn und jedes n . Für n = 1 und n = 2 haben wir diese Darstellung der Ableitung bereits bewiesen, wobei f1 (t) = t2 und f2 (t) = t4 2t3. Für den Induktionsschritt nehmen wir (8.4) für n an und erhalten

ψ(n+1)(x) = (exp (1 x )fn (1 x )) = exp (1 x ) 1 x2fn (1 x ) + exp (1 x )fn (1 x ) 1 x2 = exp (1 x )fn+1 ( 1 x ),

wobei das Polynom fn+1 als fn+1 (t) = t2(fn(t) fn(t)) gewählt wurde.

Es bleibt noch zu zeigen, dass ψ auch in x = 0 beliebig oft differenzierbar ist. Dabei können wir nicht auf unsere Ableitungsregeln zurückgreifen, sondern müssen dies direkt mit der Definition der Ableitung überprüfen. Wir behaupten, dass ψ(n) (0) = 0 für alle n .

Für den Beweis der Behauptung zeigen wir zuerst, dass für jedes Polynom f

lim x0ψ (x)f ( 1 x ) = 0 (8.5)

ist. Auf Grund der Linearität des Grenzwerts und da ψ(x) = 0 für x < 0 gilt, genügt es zu zeigen, dass lim x0ψ (x)xn = 0 für alle n gilt. Setzen wir y = 1 x, so erhalten wir, dass diese Behauptung wiederum zu

lim y yn exp (y) = 0

äquivalent ist. Dies folgt aber mit dem Sandwich-Lemma aus der Ungleichung (1 + y n+1)n+1 exp (y) für alle y 0 und n (siehe Abschnitt 6.3).

Wir zeigen nun ψ(n)(0) = 0 für alle n per Induktion. Verwenden wir (8.5), so erhalten wir

ψ (0) = lim x0ψ(x) 0 x = lim x0ψ (x) 1 x = 0.

Falls wir bereits ψ(n)(0) = 0 für ein n wissen, dann folgt ebenso

ψ(n+1) (0) = lim x0ψ(n)(x) ψ(n)(0) x 0 = lim x0ψ(x)fn (1 x ) 0 x = lim x0ψ (x)fn (1 x )1 x = 0.

Wir haben nun also gezeigt, dass alle Ableitungen von ψ auf ganz existieren und somit ist ψ glatt.

Übung 8.24 (Hutfunktion).

Finden Sie für beliebige reelle Zahlen a < b < c < d eine glatte Funktion φ auf , so dass φ gleich Null ist ausserhalb des Intervalls (a,d) und gleich 1 ist auf dem Intervall [b,c].

Hinweis.

Versuchen Sie zuerst geeignet verschobene und gespiegelte Versionen der Funktion ψ aus Beispiel 8.23 zu kombinieren. Zum Start könnte man beispielsweise die Abbildung x ψ(x) ψ(x)+ψ(1x) betrachten.

Wir wenden uns nun wieder allgemeinen Aussagen im Stile von Abschnitt 8.1.2 zu. Aus Proposition 8.5 lässt sich folgendes Korollar deduzieren.

Korollar 8.25 (Summen und Produkte bei höherer Differenzierbarkeit).

Sei D eine Teilmenge, so dass jeder Punkt in D ein Häufungspunkt von D ist. Seien f,g : D n-mal differenzierbar. Dann sind f + g und f g ebenso n-mal differenzierbar und es gilt f(n) + g(n) = (f + g)(n) sowie

(fg)(n) = k=0nn kf(k)g(nk).

Insbesondere ist jedes skalare Vielfache n-mal differenzierbar und (αf)(n) = αf(n) für alle α .

Die obige Produktregel für höhere Ableitungen nennt sich auch Leibniz-Regel.

Natürlich sind auch Verknüpfungen von n-mal differenzierbaren Funktionen n-mal differenzierbar. Allerdings ist es im Gegensatz zum Produkt deutlich schwerer, hier eine explizite Formel anzugeben. Wir beschränken uns deswegen darauf, nur die Differenzierbarkeit zu formulieren.

Korollar 8.26 (Verknüpfungen und höhere Differenzierbarkeit).

Seien D,E Teilmengen, so dass jeder Punkt in D respektive E ein Häufungspunkt von D respektive E ist. Sei des Weiteren f : D E eine n-mal differenzierbare Funktion und sei g : E eine n-mal differenzierbare Funktion. Dann ist g f : D n-mal differenzierbar.

Übung 8.27.

Beweisen Sie die Korollare 8.25 und 8.26.

Hinweis.

Die n-te Ableitung von g f ist eine Linearkombination von Funktionen der Form x Dg(k)(f(x))(f)k1(x)(f(n))kn(x) für n k, k1, ,kn 0.

License

Analysis I (Kap. 1-9) Copyright © by Manfred Einsiedler. All Rights Reserved.

}