8.1 Die Ableitung
8.1.1 Definition und geometrische Interpretation
Eine (nicht-vertikale) Gerade im ℝ2 ist eine Teilmenge der Form {(x,y)∣y=mx+q} für Parameter m,q∈ℝ oder alternativ ausgedrückt der Graph der (affinen) Abbildung x∈ℝ↦mx+q∈ℝ. Meist nennt man Funktionen dieser Form ebenfalls Geraden. Der Parameter m der Geraden y=mx+q wird auch die Steigung der Geraden genannt. Wir möchten uns nun mit Funktionen beschäftigen, die sich um einen Punkt im Definitionsbereich durch Geraden approximieren lassen.
Definition 8.1 (Differenzierbarkeit).
Sei D⊆ℝ eine Teilmenge, f:D→ℝ eine Funktion und a∈D ein Häufungspunkt von D. Wir sagen, dass f bei a differenzierbar ist, falls der Grenzwert
f′(a)=limx→af(x)−f(a)x−a=limh→0f(a+h)−f(a)h(8.1)existiert. In diesem Fall nennen wir f′(a) die Ableitung von f bei a. Falls f bei jedem Häufungspunkt von D in D differenzierbar ist, dann sagen wir auch, dass f (auf D) differenzierbar ist und nennen die Funktion a↦f′(a) definiert auf den Häufungspunkten von D in D die Ableitung von f.
Falls a∈D ein rechtseitiger Häufungspunkt von D ist, dann ist f bei a rechtsseitig differenzierbar, wenn die rechtsseitige Ableitung
f′+(a)=limx↘af(x)−f(a)x−a=limh↘0f(a+h)−f(a)hexistiert. Linksseitige Differenzierbarkeit und die linksseitige Ableitung f′−(a) werden analog über die Bewegung x↗a definiert.
Wir nennen △x=x−a=h im Zusammenhang mit der Definition in (8.1) auch das Inkrement des Arguments oder der unabhängigen Variablen x, △f=f(x)−f(a)=f(a+h)−f(a) das Inkrement der Funktion und △f△x den Differenzenquotienten. Die Ableitung von f bei a, welche in dieser Formulierung der Grenzwert des Differenzenquotienten △f△x für △x→0 ist, schreibt man auch als dfdx(a)=f′(a) und nennt dies den Differentialquotienten (in der Leibniz-Notation). Weiters nennt man f′=dfdx auch die Ableitung nach x, was vor allem dann nützlich ist, wenn f auch von weiteren Parametern abhängen darf.
Wir möchten aber betonen, dass dfdx(a) nicht als Quotient, sondern nur als Grenzwert von Quotienten definiert wurde. Falls die unabhängige Variable t (für Zeit) und nicht x ist, dann verwendet man manchmal auch die Notation ẋ,ẏ für die Ableitung von Funktionen x:D→ℝ, y:D→ℝ.
Eine weitere Schreibweise der Definition in (8.1) ist in der Landau-Notation (siehe Abschnitt 6.6)
f(x)−f(a)x−a=f′(a)+o(1)für x→a oder äquivalenterweise
f(x)=f(a)+f′(a)(x−a)+o(x−a)(8.2)für x→a. Hierbei wird die Funktion x↦f′(a)(x−a) das Differential von f bei a genannt und die Gerade x↦f(a)+f′(a)(x−a) die affine oder lineare Approximation von f bei a oder die Tangente von f bei a, siehe auch Figur 8.1. Wir erinnern daran, dass wir in (8.2) o(x−a) als Platzhalter einer Funktion (welcher?) interpretieren, die für x→a schneller abfällt als x−a. Insbesondere ist wegen (8.2)
limx→af(x)=f(a)+limx→a(f′(a)(x−a)+o(x−a))=f(a)und f ist bei a stetig, wenn f bei a differenzierbar ist.
Applet 8.2 (Bewegung der Sekante).
Wir sehen den Graphen einer Funktion und wie die Sekante zwischen x0 und x0+h sich bei den meisten Fusspunkten x0 der Tangente bei x0 nähert falls h→0.
Häufig wird in diesem Kapitel (und dem nächsten) der Definitionsbereich D der betrachteten Funktion f:D→ℝ ein Intervall D=I mit Endpunkten a<b sein. Dies hat den Vorteil, dass jeder Punkt in I ein Häufungspunkt ist (wieso?) und es somit für jeden Punkt in I Sinn macht, nach der Differenzierbarkeit von f bei diesem Punkt zu fragen. Wir wollen dies aber weder in der Definition noch in den zu besprechenden Ableitungsregeln voraussetzen, damit wir beispielsweise auch von der Ableitung der Funktion x∈ℝ∖{0}↦1x∈ℝ sprechen können.
Meist werden wir reellwertige Funktionen betrachten. Doch wird es teilweise nützlich sein, den Begriff der Ableitung und manche der Gesetze auch für komplexwertige Funktionen verwenden zu können. Wir bemerken also, dass Definition 8.1 analog auch für komplexwertige Funktionen verwendet werden kann. Wie in Abschnitt 5.3.4 läuft dies darauf hinaus, dass sowohl Real- als auch Imaginärteil differenzierbar sein sollten.
Schlussendlich wollen wir noch anmerken, dass die Ableitung eine rein lokale Operation darstellt. Genauer gesagt, angenommen a∈D ist ein Häufungspunkt von D und f,g:D→ℝ sind bei a differenzierbare Funktionen, so dass es ein δ>0 gibt mit f(x)=g(x) für alle x∈D∩(a−δ,a+δ). Dann gilt f′(a)=g′(a). Dies ergibt sich unmittelbar aus der Definition der Grenzwerte, die f′(a) und g′(a) definieren (wieso?). Wir werden dies im Folgenden teils implizit verwenden.
8.1.2 Beispiele und Ableitungsregeln
Wir wollen nun zeigen, dass viele der uns geläufigen Funktionen differenzierbar sind und dass wir die Ableitung (meistens) mittels einigen konkreten Gesetzen bestimmen können. Wir beginnen aber zuerst mit elementaren Beispielen.
Beispiel 8.3 (Erste Beispiele differenzierbarer Funktionen).
- (i)
- Konstante Funktionen sind überall differenzierbar und haben die Nullfunktion als Ableitung (wieso?).
- (ii)
- Die Identitätsfunktion f:x∈ℝ↦x∈ℝ ist differenzierbar und ihre Ableitung ist die konstante 1-Funktion, denn f′(a)=limx→ax−ax−a=1
für alle a∈ℝ.
- (iii)
- Die Exponentialfunktion exp:ℝ→ℝ>0 ist differenzierbar und ihre Ableitung ist die Exponentialfunktion. Allgemeiner behaupten wir, dass für ein festes α∈ℝ (oder α∈ℂ) die Ableitung von f:x∈ℝ↦exp(αx)∈ℝ durch f′(a)=αexp(αa) für alle a∈ℝ gegeben ist. In der Tat gilt für a∈ℝ, dass f′(a)=limh→0f(a+h)−f(a)h=limh→0exp(αa)exp(αh)−exp(αa)h=exp(αa)limh→0exp(αh)−1h=exp(αa)limh→0∑∞k=01k!(αh)k−1h=exp(αa)limh→0∑∞k=11k!αkhk−1=exp(αa)limh→0∑∞ℓ=0αℓ+1(ℓ+1)!hℓ=exp(αa)α,
da die Abbildung h∈ℝ↦∑∞ℓ=0αℓ+1(ℓ+1)!hℓ nach Satz 7.56 stetig ist.
Wir besprechen weitere Beispiele von differenzierbaren Funktionen und ein Beispiel einer nicht-differenzierbaren Funktion in der folgenden Übung.
Wichtige Übung 8.4 (Weitere differenzierbare Funktionen).
- (i)
- Zeigen Sie limh→0sin(h)h=1,limh→0cos(h)−1h=0.
- (ii)
- Verwenden Sie die Additionstheoreme aus Abschnitt 7.6.1 (oder Beispiel 8.3 (iii)), um zu zeigen, dass der Sinus und der Kosinus differenzierbare Funktionen sind und die Ableitungsregeln sin′(x)=(sin(x))′=cos(x),cos′(x)=(cos(x))′=−sin(x)
für alle x∈ℝ gelten.
- (iii)
- Zeigen Sie, dass die Funktionen sinh und cosh differenzierbar sind und verifizieren Sie die Ableitungsregeln sinh′(x)=(sinh(x))′=cosh(x),cosh′(x)=(cosh(x))′=sinh(x).
für alle x∈ℝ.
- (iv)
- Zeigen Sie, dass die Betragsfunktion x∈ℝ↦|x|∈ℝ>0 nicht differenzierbar ist und bestimmen Sie bei jedem Punkt in ℝ die linksseitige und die rechtsseitige Ableitung.
Wie in (ii) und (iii) von Übung 8.4 schon verwendet, wollen wir für Funktionen wie zum Beispiel die Funktion x∈ℝ∖{1}↦xx−1, die durch Formeln gegeben sind, nicht immer einen Namen einführen, um die Ableitung hinschreiben zu können. Stattdessen schreiben wir
(xx−1)′=−1(x−1)2und meinen damit, dass die Funktion x↦xx−1 auf ihrem maximalen Definitionsbereich differenzierbar ist und dass ihre Ableitung bei x durch −1(x−1)2 gegeben ist. Insbesondere ist x in obiger Gleichung nicht als Zahl, sondern vielmehr als Argument der Funktion und der Ableitung zu erachten.
Wie schon bei stetigen und Riemann-integrierbaren Funktionen möchten wir nicht immer von Hand zeigen müssen, dass eine gegebene Funktion differenzierbar ist. Stattdessen wollen wir allgemeine Regeln beweisen, auf die sich die Differenzierbarkeit verschiedener Funktionen zurückführen lässt.
Proposition 8.5 (Summen und Produkte differenzierbarer Funktionen).
Sei D⊆ℝ eine Teilmenge und a∈D ein Häufungspunkt von D. Seien f,g:D→ℝ bei a differenzierbar. Dann sind f+g und f⋅g bei a differenzierbar und es gilt
(f+g)′(a)=f′(a)+g′(a),(fg)′(a)=f′(a)g(a)+f(a)g′(a).Insbesondere ist jedes skalare Vielfache von f bei a differenzierbar und (αf)′(a)=αf′(a) für alle α∈ℝ. Dies gilt ebenso für komplexwertige Funktionen.
Somit bilden die bei a∈D differenzierbaren reellwertigen Funktionen einen Unterraum des Vektorraums ℱ(D) der reellwertigen Funktionen von D nach ℝ und die Ableitung bei a ist eine lineare Abbildung von diesem Unterraum nach ℝ. Die Ableitungsregel für das Produkt zweier Funktionen wird auch die Produktregel genannt.
Beweis.
Wir berechnen unter Verwendung der Eigenschaften des Grenzwerts in Abschnitt 6.4.1
limx→a(f+g)(x)−(f+g)(a)x−a=limx→af(x)−f(a)x−a+g(x)−g(a)x−a=f′(a)+g′(a)und
limx→a(f⋅g)(x)−(f⋅g)(a)x−a=limx→a(f(x)−f(a))g(x)+f(a)(g(x)−g(a))x−a=limx→af(x)−f(a)x−ag(x)+f(a)g(x)−g(a)x−a=f′(a)g(a)+f(a)g′(a),da g bei a stetig ist.
Korollar 8.6 (Differenzierbarkeit von Polynomen).
Reelle Polynome sind auf ganz ℝ differenzierbar und es gilt
(1)′=0,(xn)′=nxn−1(8.3)für alle n∈ℕ.
Nach Proposition 8.5 und Korollar 8.6 ist insbesondere die Ableitung eines Polynoms wieder ein Polynom. Weiters ist f∈ℝ[x]↦f′∈ℝ[x] eine lineare Abbildung.
Beweis von Korollar 8.6.
Die Fälle n=0 und n=1 wurden bereits in Beispiel 8.3 besprochen. Wir beweisen (8.3) per Induktion nach n. Angenommen für n∈ℕ gilt (xn)′=nxn−1. Dann folgt aus Proposition 8.5, dass xn+1=xxn differenzierbar ist und
(xn+1)′=(xxn)′=1xn+x(nxn−1)=(n+1)xnerfüllt, was den Induktionsbeweis abschliesst. Differenzierbarkeit eines beliebigen Polynoms folgt nun aus der Linearität der Ableitung in Proposition 8.5.
Übung 8.7 (Potenzregel mittels Binomialsatz).
Zeigen Sie Korollar 8.6 direkt unter Verwendung des Binomialsatzes. Beweisen Sie des Weiteren, dass der Kern der Abbildung f∈ℝ[x]↦f′∈ℝ[x] aus den konstanten Polynomen besteht. Später werden wir sehen, dass nicht nur Polynome mit Ableitung Null, sondern auch differenzierbare Funktionen auf ℝ mit Ableitung Null konstant sein müssen.
Wieder in Analogie zur Diskussion von stetigen Funktionen (genauer Proposition 3.52) wollen wir zeigen, dass die Verknüpfung zweier differenzierbaren Funktionen auch differenzierbar ist.
Satz 8.8 (Kettenregel).
Seien D,E⊆ℝ Teilmengen und sei x0∈D ein Häufungspunkt. Sei f:D→E eine bei x0 differenzierbare Funktion, so dass y0=f(x0) ein Häufungspunkt von E ist, und sei g:E→ℝ eine bei y0 differenzierbare Funktion. Dann ist g∘f:D→ℝ in x0 differenzierbar und
(g∘f)′(x0)=g′(f(x0))f′(x0).Wir bemerken, dass man zwar versucht sein mag, für den Beweis der Kettenregel den Differenzenquotienten
(g∘f)(x)−(g∘f)(x0)x−x0mit f(x)−f(x0) zu erweitern. Dies ist im Allgemeinen aber nicht erlaubt, da wir nicht ausschliessen können, dass f(x)=f(x0) für gewisse Punkte x nahe bei x0 ist.
Beweis.
Wir verwenden stattdessen die Umformulierung
f(x)=f(x0)+f′(x0)(x−x0)+o(x−x0)für x→x0, oder genauer formuliert
f(x)=f(x0)+f′(x0)(x−x0)+𝜀f(x)(x−x0),wobei die Funktion 𝜀f auf D durch
𝜀f(x)={f(x)−f(x0)x−x0−f′(x0)falls x∈D∖{x0}0falls x=x0für alle x∈D gegeben ist und bei x0 stetig ist. Ebenso gilt
g(y)=g(y0)+g′(y0)(y−y0)+𝜀g(y)(y−y0),wobei die bei y0 stetige Funktion 𝜀g auf E durch
𝜀g(y)={g(y)−g(y0)y−y0−g′(y0)falls y∈E∖{y0}0falls y=y0für alle y∈E gegeben ist. Zusammen ergibt sich durch Einsetzen von y=f(x)
g(f(x))=g(f(x0))+g′(f(x0))(f(x)−f(x0))+𝜀g(f(x))(f(x)−f(x0))=g(f(x0))+g′(f(x0))f′(x0)(x−x0)+(g′(f(x0))𝜀f(x)+𝜀g(f(x))(f′(x0)+𝜀f(x)))(x−x0),für alle x∈D, womit
limx→x0(g∘f)(x)−(g∘f)(x0)x−x0=limx→x0(g′(f(x0))f′(x0)+g′(f(x0))𝜀f(x)+𝜀g(f(x))(f′(x0)+𝜀f(x)))=g′(f(x0))f′(x0)wie gewünscht.
Abgesehen von Summen, Produkten und Verknüpfungen von differenzierbaren Funktionen, möchten wir zeigen, dass Quotienten von differenzierbaren Funktionen differenzierbar sind. Wir beginnen dazu mit einem wichtigen Beispiel.
Beispiel 8.9 (Kehrwert).
Sei f:ℝ∖{0}→ℝ,x↦1x. Dann ist f differenzierbar und es gilt f′(x)=−1x2 für alle x∈ℝ∖{0}. In der Tat ist
f′(x)=limh→01x+h−1xh=limh→0x−(x+h)(x+h)xh=−limh→01(x+h)x=−1limh→0(x+h)x=−1x2wegen der Stetigkeit von h↦(x+h)x bei 0.
Unter Kombination der Kettenregel und Beispiel 8.9 erhält man nun folgendes Korollar.
Korollar 8.11 (Quotientenregel).
Sei D⊆ℝ eine Teilmenge, a∈D ein Häufungspunkt und seien f,g:D→ℝ bei a differenzierbar. Falls g(a)≠0 ist, dann ist auch fg bei a differenzierbar und es gilt
(fg)′(a)=f′(a)g(a)−f(a)g′(a)g(a)2.Man beachte, dass der (natürliche) Definitionsbereich der Funktion fg, der in obigem Korollar nicht erwähnt wurde, die Teilmenge E={x∈D∣g(x)≠0} ist. Da g beim Punkt a differenzierbar ist, ist g bei a stetig. Insbesondere ist, da g(a)≠0 ist, g(x)≠0 für alle x nahe genug bei a und a ist ein Häufungspunkt von E. Damit macht es auch Sinn, von Differenzierbarkeit von fg bei a zu sprechen.
Eine direkte Konsequenz von Korollar 8.11 ist, dass rationale Funktionen differenzierbar sind, wo definiert. Wir erinnern daran, dass eine rationale Funktion eine Funktion der Form f(x)g(x) ist, wobei f(x) und g(x) reelle Polynome sind und g(x) nicht das Nullpolynom ist.
Beweis von Korollar 8.11.
Es bezeichne ψ die Funktion y∈ℝ∖{0}↦1y∈ℝ, welche nach Beispiel 8.9 differenzierbar ist. Wir kombinieren dies mit der Kettenregel (Satz 8.8) und erhalten, dass die Funktion 1g=ψ∘g bei a differenzierbar ist mit Ableitung
(1g)′(a)=−1g(a)2g′(a).Verwenden wir nun die Produktregel in Proposition 8.5, so ergibt sich, dass fg=f⋅1g bei a differenzierbar ist und
(fg)′(a)=(f⋅1g)′(a)=f′(a)1g(a)−f(a)g′(a)g(a)2=f′(a)g(a)−f(a)g′(a)g(a)2erfüllt, was zu zeigen war.
Die Kettenregel erlaubt uns die Berechnung der Ableitung von beliebig kompliziert anmutenden konkreten Beispielen, wobei man stur von aussen nach innen vorgeht wie in folgendem Beispiel.
Beispiel 8.12 (Vierfach verschachtelte Funktionen).
Wir bestimmen die Ableitung der Funktion
f:x∈ℝ↦exp(sin(sin(x2)))mittels mehrmaligem Anwenden der Kettenregel (Satz 8.8). Da exp′=exp erhalten wir
f′(x)=exp(g(x))g′(x),wobei g(x)=sin(sin(x2)). Ebenso ist wegen sin′=cos
g′(x)=cos(h(x))h′(x),wobei und . Dadurch erhalten wir
für alle .
Unsere vorläufig letzte allgemeine Ableitungsregel betrifft die Ableitung der Umkehrabbildung (siehe dazu auch Satz 3.64 über die Existenz einer stetigen Umkehrabbildung).
Satz 8.14 (Differenzierbarkeit der inversen Funktion).
Seien Teilmengen und sei eine stetige, bijektive Abbildung, deren inverse Abbildung ebenfalls stetig ist. Falls in dem Häufungspunkt differenzierbar ist und gilt, dann ist in differenzierbar und es gilt
Beweis.
Wir bemerken zuerst, dass ein Häufungspunkt von ist, womit man von Differenzierbarkeit bei sprechen darf. Tatsächlich ist nach Annahme ein Häufungspunkt und es existiert eine Folge in mit für . Da stetig ist, gilt für und da bijektiv ist, gilt für alle .
Sei nun eine Folge in , die gegen konvergiert. Dann strebt in gegen , da per Annahme stetig ist, und es gilt
nach der Charakterisierung der Konvergenz einer Funktion mittels Folgen in Lemma 6.40. Da dies aber für jede Folge wie oben gilt, folgt der Satz wiederum aus Lemma 6.40.
Beispiel 8.15 (Differenzierbarkeit des Logarithmus und der Potenzfunktionen).
- (i)
- Die Funktion ist differenzierbar mit Ableitung gegeben durch für alle . Denn die Abbildung ist die Umkehrabbildung von und damit folgt aus Satz 8.14, dass bei allen Punkten differenzierbar ist mit , wobei . Da folgt nun
Für ist . Also folgt Differenzierbarkeit von bei sowie die Formel aus der Kettenregel (Satz 8.8).
- (ii)
- Für ein beliebiges ist die Abbildung differenzierbar und es gilt
In der Tat gilt für alle per Definition beliebiger Potenzen in Abschnitt 7.5.2. Aus Beispiel 8.3 und der Ableitung der Logarithmusabbildung folgt somit
für alle .
8.1.3 Extremwerte
Wie wir in diesem Abschnitt sehen werden, ist die Ableitung auch nützlich, um Punkte zu finden, bei denen eine Funktion ihre Maxima und ihre Minima annimmt. Genauer kann man damit die in folgender Definition eingeführten Punkte finden.
Definition 8.16 (Lokale Extremwerte).
Sei eine Teilmenge und . Wir sagen, dass eine Funktion ein lokales Maximum in annimmt, falls es eine Umgebung von in gibt, auf der durch beschränkt ist. Genauer formuliert heisst dies, dass es ein gibt, so dass für alle gilt . Falls es sogar ein gibt, so dass für alle gilt, dann nimmt in ein isoliertes lokales Maximum an. Der Wert wird auch ein lokales Maximum von genannt. Ein lokales Minimum und ein isoliertes lokales Minimum wird analog definiert.
Des Weiteren sagen wir, dass in ein lokales Extremum annimmt und ein lokaler Extremwert von ist, falls ein lokales Minimum oder ein lokales Maximum in annimmt.
Proposition 8.17 (Notwendige Bedingung für Extremum).
Sei eine Teilmenge und eine reellwertige Funktion auf . Angenommen nimmt in ein lokales Extremum an, ist bei differenzierbar und ist sowohl ein rechtsseitiger als auch ein linksseitiger Häufungspunkt von . Dann gilt .
Die Annahme in Proposition 8.17, dass sich die Menge dem Punkt sowohl von links als auch von rechts nähert, ist notwendig, da wir von links und von rechts mit Differenzenquotienten approximieren wollen. In konkreten Rechenbeispielen ist sie jedoch meist erfüllt. Beispielsweise ist dies so in allen Punkten eines Intervalls abgesehen von den Endpunkten erfüllt.
Beweis.
Ohne Beschränkung der Allgemeinheit nehmen wir an, dass ein lokales Maximum in annimmt (sonst ersetzt man durch ). Da bei differenzierbar ist und von links und rechts angenähert werden kann, existieren sowohl der linksseitige als auch der rechtsseitige Grenzwert der Differenzenquotienten bei und beide sind gleich . Dann ist
da für alle hinreichend nahe bei gilt und für die Bewegung erfüllt ist. Weiters ist aber auch
da wiederum für alle hinreichend nahe bei gilt und für die Bewegung erfüllt ist. Unter dem Strich erhalten wir .
Falls der Definitionsbereich ein Intervall ist, so besagt Proposition 8.17 das Folgende.
Korollar 8.18 (Lokale Extremwerte).
Sei ein Intervall und . Angenommen nimmt in ein lokales Extremum an. Dann bestehen genau folgende Möglichkeiten:
- (i)
- ist ein in enthaltener Endpunkt von ,
- (ii)
- ist bei nicht differenzierbar oder
- (iii)
- ist bei differenzierbar und .
Insbesondere sind alle Punkte, wo ein lokales Extremum für eine differenzierbare Funktion auf einem offenen Intervall annimmt, Nullstellen der Ableitung.
Man beachte, dass alle Fälle in obigem Korollar eintreten können (wieso?). Des Weiteren ist die Umkehrung von Proposition 8.17 nicht richtig, wie wir in folgender Übung zeigen wollen.
Übung 8.19.
- (a)
- Finden Sie alle lokalen Extremwerte des Polynoms auf .
- (b)
- Finden Sie alle lokalen Extremwerte der Funktion auf .
8.1.4 Stetige Differenzierbarkeit
Sei eine Teilmenge, so dass jeder Punkt in ein Häufungspunkt von ist (wie zum Beispiel bei einem Intervall mit Endpunkten in ). Falls eine differenzierbare Funktion ist (also bei jedem Punkt in differenzierbar ist), können wir die Ableitung
als eine neue Funktion betrachten. Ist stetig, so nennen wir stetig differenzierbar.
Man beachte, dass eine differenzierbare Funktion nicht zwingend stetig differenzierbar sein muss. Wir illustrieren dies in einem Beispiel.
Beispiel 8.20 (Unstetige Ableitung).
Wir betrachten zu die Abbildung definiert durch
für alle . Da ist, ist auch bei stetig (siehe das Sandwich Lemma B.6). Die Ableitung von bei existiert und ist durch
gegeben. Hierbei verwendeten wir auch, dass die Ableitung von durch gegeben ist. Für die Ableitung von bei können wir keine allgemeine Ableitungsregel verwenden und manipulieren deswegen den Grenzwert
wobei wir gesetzt haben. Falls ist, dann existiert wegen der Grenzwert nicht und somit ist nicht differenzierbar. Wir nehmen nun an, womit (ebenso auf Grund des Sandwich Lemmas) eine rechtsseitige Ableitung besitzt. Analog können wir den Grenzwert mit berechnen und erhalten drei Fälle.
nicht existiert.
Das Beispiel 8.20 lässt sich mit fraktalen Konstruktionen stark verschärfen. In der Tat kann man eine differenzierbare Funktion auf dem Intervall finden, deren Ableitung überabzählbar viele Unstetigkeitsstellen besitzt (beispielsweise auf der Cantor-Menge). Eine Konstruktion dieser Art finden Sie in Abschnitt 8.6.2.
8.1.5 Ableitungen höherer Ordnung
Sei eine Teilmenge, so dass jeder Punkt in ein Häufungspunkt ist, und sei eine Funktion. Falls existiert und differenzierbar ist, nennen wir zweimal differenzierbar. Die Funktion ist die zweite Ableitung von und wird auch mit oder bezeichnet. Falls die unabhängige Variable ist, schreiben wir für die zweite Ableitung nach . Insbesondere erhalten wir, dass eine zweimal differenzierbare Funktion stetig differenzierbar ist.
Induktiv kann man nun höhere Differenzierbarkeit und höhere Ableitungen definieren. Formal definieren wir also die Ableitungen
für alle . Falls für ein (auf ganz ) existiert, heisst -mal differenzierbar. Falls die -te Ableitung zusätzlich stetig ist, heisst -mal stetig differenzierbar. Die Menge der -mal stetig differenzierbaren Funktionen auf bezeichnen wir mit .
Für jedes kann man eine Funktion finden, die zwar -mal differenzierbar, aber nicht -mal differenzierbar ist.
Übung 8.21.
Sei . Zeigen Sie, dass die Funktion -mal stetig differenzierbar, aber nicht -mal differenzierbar ist.
Wir sagen, dass glatt oder beliebig oft differenzierbar ist, falls für jedes -mal differenzierbar ist. Ist glatt, so sind insbesondere alle Ableitungen von stetig ( ist also beliebig oft stetig differenzierbar). Die Menge der glatten Funktionen auf bezeichnen wir mit .
Wir kennen bereits einige Beispiele glatter Funktionen. Dazu gehören die Polynome, da diese nach Korollar 8.6 differenzierbar sind und da deren Ableitung ein Polynom ist, womit die Aussage aus Induktion folgt. Ebenfalls glatt sind die Funktion nach Beispiel 8.3 und Übung 8.4. Etwas interessanter, aber nicht ganz unerwartet ist vermutlich folgendes Beispiel.
Beispiel 8.22 (Logarithmusfunktion).
Der Logarithmus ist glatt. In der Tat gilt , , oder allgemein , was sich mit vollständiger Induktion beweisen lässt.
Ein überraschenderes Beispiel einer glatten Funktion ist vielleicht das folgende.
Beispiel 8.23 (Glattes Abklingen).
Die Funktion definiert durch
für alle ist glatt und demnach auch beliebig oft stetig differenzierbar, siehe das folgende Bild.
Für gibt es nichts zu zeigen, da die Ableitung der Nullfunktion die Nullfunktion ist. Für ergibt sich dies mittels Induktion, der Kettenregel (Satz 8.8), Beispiel 8.9, der Produktregel in Proposition 8.5 und Korollar 8.6. In der Tat gilt für , dass
und (da die konkrete Formel für schnell kompliziert wird) allgemeiner
für gewisse Polynome und jedes . Für und haben wir diese Darstellung der Ableitung bereits bewiesen, wobei und . Für den Induktionsschritt nehmen wir (8.4) für an und erhalten
wobei das Polynom als gewählt wurde.
Es bleibt noch zu zeigen, dass auch in beliebig oft differenzierbar ist. Dabei können wir nicht auf unsere Ableitungsregeln zurückgreifen, sondern müssen dies direkt mit der Definition der Ableitung überprüfen. Wir behaupten, dass für alle .
Für den Beweis der Behauptung zeigen wir zuerst, dass für jedes Polynom
ist. Auf Grund der Linearität des Grenzwerts und da für gilt, genügt es zu zeigen, dass für alle gilt. Setzen wir , so erhalten wir, dass diese Behauptung wiederum zu
äquivalent ist. Dies folgt aber mit dem Sandwich-Lemma aus der Ungleichung für alle und (siehe Abschnitt 6.3).
Wir zeigen nun für alle per Induktion. Verwenden wir (8.5), so erhalten wir
Falls wir bereits für ein wissen, dann folgt ebenso
Wir haben nun also gezeigt, dass alle Ableitungen von auf ganz existieren und somit ist glatt.
Übung 8.24 (Hutfunktion).
Finden Sie für beliebige reelle Zahlen eine glatte Funktion auf , so dass gleich Null ist ausserhalb des Intervalls und gleich ist auf dem Intervall .
Hinweis.
Versuchen Sie zuerst geeignet verschobene und gespiegelte Versionen der Funktion aus Beispiel 8.23 zu kombinieren. Zum Start könnte man beispielsweise die Abbildung betrachten.
Wir wenden uns nun wieder allgemeinen Aussagen im Stile von Abschnitt 8.1.2 zu. Aus Proposition 8.5 lässt sich folgendes Korollar deduzieren.
Korollar 8.25 (Summen und Produkte bei höherer Differenzierbarkeit).
Sei eine Teilmenge, so dass jeder Punkt in ein Häufungspunkt von ist. Seien -mal differenzierbar. Dann sind und ebenso -mal differenzierbar und es gilt sowie
Insbesondere ist jedes skalare Vielfache -mal differenzierbar und für alle .
Die obige Produktregel für höhere Ableitungen nennt sich auch Leibniz-Regel.
Natürlich sind auch Verknüpfungen von -mal differenzierbaren Funktionen -mal differenzierbar. Allerdings ist es im Gegensatz zum Produkt deutlich schwerer, hier eine explizite Formel anzugeben. Wir beschränken uns deswegen darauf, nur die Differenzierbarkeit zu formulieren.
Korollar 8.26 (Verknüpfungen und höhere Differenzierbarkeit).
Seien Teilmengen, so dass jeder Punkt in respektive ein Häufungspunkt von respektive ist. Sei des Weiteren eine -mal differenzierbare Funktion und sei eine -mal differenzierbare Funktion. Dann ist -mal differenzierbar.
Übung 8.27.
Beweisen Sie die Korollare 8.25 und 8.26.
Hinweis.
Die -te Ableitung von ist eine Linearkombination von Funktionen der Form für .