="http://www.w3.org/2000/svg" viewBox="0 0 512 512">

7 Differentialrechnung

Wir beginnen nun mit der Differentialrechnung in einer Variablen. Wie wir sehen werden, ist diese für das Verständnis von Funktionen auf Intervallen in [latex]\mathbb {R}[/latex], aber auch für die Berechnung des Riemann-Integrals von fundamentaler Bedeutung.

7.1 – Die Ableitung

7.1.1 – Definition und geometrische Interpretation

Eine (nicht-vertikale) Gerade im [latex]\mathbb {R}^2[/latex] ist eine Teilmenge der Form [latex]\left \lbrace {(x,y)} \mid {y=mx+q}\right \rbrace[/latex] für Parameter [latex]m,q \in \mathbb {R}[/latex] oder alternativ ausgedrückt der Graph der (affinen) Abbildung [latex]x \in \mathbb {R} \mapsto mx +q \in \mathbb {R}[/latex]. Meist nennt man Funktionen dieser Form ebenfalls Geraden. Der Parameter [latex]m[/latex] der Geraden [latex]y = mx+q[/latex] wird auch die Steigung der Geraden genannt. Wir möchten uns nun mit Funktionen beschäftigen, die sich um einen Punkt im Definitionsbereich durch Geraden approximieren lassen.

Definition 7.1: Differenzierbarkeit

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge, [latex]f: D \to \mathbb {R}[/latex] eine Funktion und [latex]a \in D[/latex] ein Häufungspunkt von [latex]D[/latex]. Wir sagen, dass [latex]f[/latex] bei [latex]a[/latex] differenzierbar ist, falls der Grenzwert
[latex]
\begin{aligned}[]\label{eq:abl-ableitungdef} f'(a) = \lim _{x \to a} \frac {f(x)-f(a)}{x-a} = \lim _{h \to 0} \frac {f(a+h)-f(a)}{h}\end{aligned}
[/latex]
existiert. In diesem Fall nennen wir [latex]f'(a)[/latex] die Ableitung von [latex]f[/latex] bei [latex]a[/latex]. Falls [latex]f[/latex] bei jedem Häufungspunkt von [latex]D[/latex] in [latex]D[/latex] differenzierbar ist, dann sagen wir auch, dass [latex]f[/latex] (auf [latex]D[/latex]) differenzierbar ist und nennen die Funktion [latex]a \mapsto f'(a)[/latex] definiert auf den Häufungspunkten von [latex]D[/latex] in [latex]D[/latex] die Ableitung von [latex]f[/latex].

Falls [latex]a \in D[/latex] ein rechtseitiger Häufungspunkt von [latex]D[/latex] ist, dann ist [latex]f[/latex] bei [latex]a[/latex] rechtsseitig differenzierbar, wenn die rechtsseitige Ableitung

[latex]
\begin{aligned}[]f_+'(a) = \lim _{x \searrow a} \frac {f(x)-f(a)}{x-a} = \lim _{h \searrow 0} \frac {f(a+h)-f(a)}{h}\end{aligned}
[/latex]

existiert. Linksseitige Differenzierbarkeit und die linksseitige Ableitung [latex]f_-'(a)[/latex] werden analog über die Bewegung [latex]x \nearrow a[/latex] definiert.

Wir nennen [latex]\triangle x = x-a = h[/latex] im Zusammenhang mit der Definition in (7.1) auch das Inkrement des Arguments oder der unabhängigen Variablen [latex]x[/latex], [latex]\triangle f = f(x)-f(a) = f(a+h)-f(a)[/latex] das Inkrement der Funktion und [latex]\frac {\triangle f}{\triangle x}[/latex] den Differenzenquotienten. Die Ableitung von [latex]f[/latex] bei [latex]a[/latex], welche in dieser Formulierung der Grenzwert des Differenzenquotienten [latex]\frac {\triangle f}{\triangle x}[/latex] für [latex]\triangle x \to 0[/latex] ist, schreibt man auch als [latex]\frac {\thinspace {\rm {d}} f}{\thinspace {\rm {d}} x}(a) = f'(a)[/latex] und nennt dies den Differentialquotienten (in der Leibniz-Notation). Weiters nennt man [latex]f' = \frac {\thinspace {\rm {d}} f}{\thinspace {\rm {d}} x}[/latex] auch die Ableitung nach [latex]x[/latex], was vor allem dann nützlich ist, wenn [latex]f[/latex] auch von weiteren Parametern abhängen darf.

Wir möchten aber betonen, dass [latex]\frac {\thinspace {\rm {d}} f}{\thinspace {\rm {d}} x}(a)[/latex] nicht als Quotient, sondern nur als Grenzwert von Quotienten definiert wurde. Falls die unabhängige Variable [latex]t[/latex] (für Zeit) und nicht [latex]x[/latex] ist, dann verwendet man manchmal auch die Notation [latex]\dot {x},\dot {y}[/latex] für die Ableitung von Funktionen [latex]x: D\to \mathbb {R}[/latex], [latex]y: D \to \mathbb {R}[/latex].

Eine weitere Schreibweise der Definition in (7.1) ist in der Landau-Notation (siehe Abschnitt 5.6)

[latex]
\begin{aligned}[]\frac {f(x)-f(a)}{x-a} = f'(a) + o(1)\end{aligned}
[/latex]

für [latex]x \to a[/latex] oder äquivalenterweise
[latex]
\begin{aligned}[]\label{eq:abl-ableitungdef2} f(x) = f(a) + f'(a) (x-a) + o(x-a)\end{aligned}
[/latex]
für [latex]x \to a[/latex]. Hierbei wird die Funktion [latex]x \mapsto f'(a)(x-a)[/latex] das Differential von [latex]f[/latex] bei [latex]a[/latex] genannt und die Gerade [latex]x \mapsto f(a) + f'(a)(x-a)[/latex] die affine oder lineare Approximation von [latex]f[/latex] bei [latex]a[/latex] oder die Tangente von [latex]f[/latex] bei [latex]a[/latex], siehe auch Figur 7.1. Wir erinnern daran, dass wir in (7.2) [latex]o(x-a)[/latex] als Platzhalter einer Funktion (welcher?) interpretieren, die für [latex]x \to a[/latex] schneller abfällt als [latex]x-a[/latex]. Insbesondere ist wegen (7.2)

[latex]
\begin{aligned}[]\lim _{x \to a}f(x) = f(a) + \lim _{x \to a} \big (f'(a) (x-a) + o(x-a)\big ) = f(a)\end{aligned}
[/latex]

und [latex]f[/latex] ist bei [latex]a[/latex] stetig, wenn [latex]f[/latex] bei [latex]a[/latex] differenzierbar ist.

Applet 7.2: Bewegung der Sekante

Wir sehen den Graphen einer Funktion und wie die Sekante zwischen [latex]x_0[/latex] und [latex]x_0+h[/latex] sich bei den meisten Fusspunkten [latex]x_0[/latex] der Tangente bei [latex]x_0[/latex] nähert falls [latex]h\to 0[/latex].

image

Abbildung 7.1 – Die geometrische Interpretation der Ableitung einer reellwertigen Funktion [latex]f[/latex] bei [latex]a[/latex] ist die Steigung der Tangenten des Graphen bei [latex]a[/latex]. Denn wenn [latex]x[/latex] gegen [latex]a[/latex] strebt, wird die Sekante, die durch [latex](a,f(a))[/latex] und [latex](x,f(x))[/latex] geht und den Differenzenquotienten als Steigung besitzt, immer mehr zur Tangente des Graphen bei [latex]a[/latex].

Häufig wird in diesem Kapitel (und dem nächsten) der Definitionsbereich [latex]D[/latex] der betrachteten Funktion [latex]f:D~\to \mathbb {R}[/latex] ein Intervall [latex]D=I[/latex] mit Endpunkten [latex]a

Meist werden wir reellwertige Funktionen betrachten. Doch wird es teilweise nützlich sein, den Begriff der Ableitung und manche der Gesetze auch für komplexwertige Funktionen verwenden zu können. Wir bemerken also, dass Definition 7.1 analog auch für komplexwertige Funktionen verwendet werden kann. Wie in Abschnitt 5.7.4 läuft dies darauf hinaus, dass sowohl Real- als auch Imaginärteil differenzierbar sein sollten.

Schlussendlich wollen wir noch anmerken, dass die Ableitung eine rein lokale Operation darstellt. Genauer gesagt, angenommen [latex]a \in D[/latex] ist ein Häufungspunkt von [latex]D[/latex] und [latex]f,g: D \to \mathbb {R}[/latex] sind bei [latex]a[/latex] differenzierbare Funktionen, so dass es ein [latex]\delta > 0[/latex] gibt mit [latex]f(x) = g(x)[/latex] für alle [latex]x \in D \cap (a-\delta ,a + \delta )[/latex]. Dann gilt [latex]f'(a) = g'(a)[/latex]. Dies ergibt sich unmittelbar aus der Definition der Grenzwerte, die [latex]f'(a)[/latex] und [latex]g'(a)[/latex] definieren (wieso?). Wir werden dies im Folgenden teils implizit verwenden.

7.1.2 – Beispiele und Ableitungsregeln

Wir wollen nun zeigen, dass viele der uns geläufigen Funktionen differenzierbar sind und dass wir die Ableitung (meistens) mittels einigen konkreten Gesetzen bestimmen können. Wir beginnen aber zuerst mit elementaren Beispielen.

Beispiel 7.3: Erste Beispiele differenzierbarer Funktionen

  1. Konstante Funktionen sind überall differenzierbar und haben die Nullfunktion als Ableitung (wieso?).
  2. Die Identitätsfunktion [latex]f:x \in \mathbb {R} \mapsto x\in \mathbb {R}[/latex] ist differenzierbar und ihre Ableitung ist die konstante [latex]1[/latex]-Funktion, denn
    [latex]
    \begin{aligned}[]f'(a) = \lim _{x \to a} \frac {x-a}{x-a} = 1\end{aligned}
    [/latex]

    für alle [latex]a \in \mathbb {R}[/latex].

  3. Die Exponentialfunktion [latex]\exp : \mathbb {R} \to \mathbb {R}_{>0}[/latex] ist differenzierbar und ihre Ableitung ist die Exponentialfunktion. Allgemeiner behaupten wir, dass für ein festes [latex]\alpha \in \mathbb {R}[/latex] (oder [latex]\alpha \in \mathbb {C}[/latex]) die Ableitung von [latex]f:x\in \mathbb {R}\mapsto \exp (\alpha x)\in \mathbb {R}[/latex] durch [latex]f'(a)=\alpha \exp (\alpha a)[/latex] für alle [latex]a \in \mathbb {R}[/latex] gegeben ist. In der Tat gilt für [latex]a \in \mathbb {R}[/latex], dass
    [latex]
    \begin{aligned}[]f'(a) = \lim _{h \to 0} \frac {f(a+h)-f(a)}{h} &= \lim _{h \to 0} \frac { \exp (\alpha a)\exp (\alpha h)-\exp (\alpha a)}{h}\\ &= \exp (\alpha a)\lim _{h \to 0} \frac { \exp (\alpha h)-1}{h}\\ &= \exp (\alpha a)\lim _{h \to 0} \frac { \sum _{k=0}^\infty \frac {1}{k!}(\alpha h)^k -1 }{h}\\ &= \exp (\alpha a)\lim _{h \to 0} \sum _{k=1}^\infty \frac {1}{k!}\alpha ^kh^{k-1}\\ &= \exp (\alpha a)\lim _{h \to 0} \sum _{\ell =0}^\infty \frac {\alpha ^{\ell +1}}{(\ell +1)!}h^{\ell }\\ &= \exp (\alpha a)\alpha ,\end{aligned}
    [/latex]

    da die Abbildung [latex]h \in \mathbb {R} \mapsto \sum _{\ell =0}^\infty \frac {\alpha ^{\ell +1}}{(\ell +1)!}h^{\ell }[/latex] nach Satz 6.56 stetig ist.

Wir besprechen weitere Beispiele von differenzierbaren Funktionen und ein Beispiel einer nicht-differenzierbaren Funktion in der folgenden Übung.

Wichtige Übung 7.4: Weitere differenzierbare Funktionen

  1. Zeigen Sie
    [latex]
    \begin{aligned}[]\lim _{h \to 0} \frac {\sin (h)}{h} = 1,\quad \lim _{h \to 0} \frac {\cos (h)-1}{h} =0.\end{aligned}
    [/latex]
  2. Verwenden Sie die Additionstheoreme aus Abschnitt 6.6.1 (oder Beispiel 7.3 (iii)), um zu zeigen, dass der Sinus und der Kosinus differenzierbare Funktionen sind und die Ableitungsregeln
    [latex]
    \begin{aligned}[]\sin '(x) = (\sin (x))' = \cos (x), \quad \cos '(x) = (\cos (x))' = -\sin (x)\end{aligned}
    [/latex]

    für alle [latex]x \in \mathbb {R}[/latex] gelten.

  3. Zeigen Sie, dass die Funktionen [latex]\sinh[/latex] und [latex]\cosh[/latex] differenzierbar sind und verifizieren Sie die Ableitungsregeln
    [latex]
    \begin{aligned}[]\sinh '(x) = (\sinh (x))' = \cosh (x), \quad \cosh '(x) = (\cosh (x))' = \sinh (x).\end{aligned}
    [/latex]

    für alle [latex]x \in \mathbb {R}[/latex].

  4. Zeigen Sie, dass die Betragsfunktion [latex]x \in \mathbb {R} \mapsto |x| \in \mathbb {R}_{>0}[/latex] nicht differenzierbar ist und bestimmen Sie bei jedem Punkt in [latex]\mathbb {R}[/latex] die linksseitige und die rechtsseitige Ableitung.

Wie in (ii) und (iii) von Übung 7.4 schon verwendet, wollen wir für Funktionen wie zum Beispiel die Funktion [latex]x \in \mathbb {R}\setminus \left \lbrace {1} \right \rbrace \mapsto \frac {x}{x-1}[/latex], die durch Formeln gegeben sind, nicht immer einen Namen einführen, um die Ableitung hinschreiben zu können. Stattdessen schreiben wir

[latex]
\begin{aligned}[]\left (\frac {x}{x-1}\right )' = -\frac {1}{(x-1)^2}\end{aligned}
[/latex]

und meinen damit, dass die Funktion [latex]x \mapsto \frac {x}{x-1}[/latex] auf ihrem maximalen Definitionsbereich differenzierbar ist und dass ihre Ableitung bei [latex]x[/latex] durch [latex]-\frac {1}{(x-1)^2}[/latex] gegeben ist. Insbesondere ist [latex]x[/latex] in obiger Gleichung nicht als Zahl, sondern vielmehr als Argument der Funktion und der Ableitung zu erachten.

Wie schon bei stetigen und Riemann-integrierbaren Funktionen möchten wir nicht immer von Hand zeigen müssen, dass eine gegebene Funktion differenzierbar ist. Stattdessen wollen wir allgemeine Regeln beweisen, auf die sich die Differenzierbarkeit verschiedener Funktionen zurückführen lässt.

Proposition 7.5: Summen und Produkte differenzierbarer Funktionen

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge und [latex]a \in D[/latex] ein Häufungspunkt von [latex]D[/latex]. Seien [latex]f,g: D \to \mathbb {R}[/latex] bei [latex]a[/latex] differenzierbar. Dann sind [latex]f+g[/latex] und [latex]f\cdot g[/latex] bei [latex]a[/latex] differenzierbar und es gilt

[latex]
\begin{aligned}[](f+g)'(a) &= f'(a) + g'(a),\\ (fg)'(a) &= f'(a) g(a) + f(a) g'(a).\end{aligned}
[/latex]

Insbesondere ist jedes skalare Vielfache von [latex]f[/latex] bei [latex]a[/latex] differenzierbar und [latex](\alpha f)'(a) = \alpha f'(a)[/latex] für alle [latex]\alpha \in \mathbb {R}[/latex]. Dies gilt ebenso für komplexwertige Funktionen.

Somit bilden die bei [latex]a \in D[/latex] differenzierbaren reellwertigen Funktionen einen Unterraum des Vektorraums [latex]\mathcal {F}(D)[/latex] der reellwertigen Funktionen von [latex]D[/latex] nach [latex]\mathbb {R}[/latex] und die Ableitung bei [latex]a[/latex] ist eine lineare Abbildung von diesem Unterraum nach [latex]\mathbb {R}[/latex]. Die Ableitungsregel für das Produkt zweier Funktionen wird auch die Produktregel genannt.

Beweis

Wir berechnen unter Verwendung der Eigenschaften des Grenzwerts in Abschnitt 5.4.1

[latex]
\begin{aligned}[]\lim _{x \to a} \frac {(f+g)(x)-(f+g)(a)}{x-a} = \lim _{x \to a} \frac {f(x)-f(a)}{x-a}+ \frac {g(x)-g(a)}{x-a} = f'(a) + g'(a)\end{aligned}
[/latex]

und

[latex]
\begin{aligned}[]\lim _{x \to a} \frac {(f\cdot g)(x)-(f\cdot g)(a)}{x-a} &= \lim _{x \to a} \frac {(f(x)-f(a))g(x)+ f(a) (g(x)-g(a))}{x-a}\\ &= \lim _{x \to a} \frac {f(x)-f(a)}{x-a} g(x)+ f(a)\frac { g(x)-g(a)}{x-a}\\ &= f'(a)g(a) + f(a) g'(a),\end{aligned}
[/latex]

da [latex]g[/latex] bei [latex]a[/latex] stetig ist. ∎

Korollar 7.6: Differenzierbarkeit von Polynomen

Reelle Polynome sind auf ganz [latex]\mathbb {R}[/latex] differenzierbar und es gilt
[latex]
\begin{aligned}[]\label{eq:abl-monome} (1)'=0, \quad (x^n)' = n x^{n-1}\end{aligned}
[/latex]
für alle [latex]n \in \mathbb {N}[/latex].

Nach Proposition 7.5 und Korollar 7.6 ist insbesondere die Ableitung eines Polynoms wieder ein Polynom. Weiters ist [latex]f \in \mathbb {R}[x] \mapsto f' \in \mathbb {R}[x][/latex] eine lineare Abbildung.

Beweis von Korollar 7.6

Die Fälle [latex]n=0[/latex] und [latex]n=1[/latex] wurden bereits in Beispiel 7.3 besprochen. Wir beweisen (7.3) per Induktion nach [latex]n[/latex]. Angenommen für [latex]n \in \mathbb {N}[/latex] gilt [latex](x^n)' = n x^{n-1}[/latex]. Dann folgt aus Proposition 7.5, dass [latex]x^{n+1} = x x^n[/latex] differenzierbar ist und

[latex]
\begin{aligned}[](x^{n+1})' = (x x^n)' = 1 x^n + x (n x^{n-1}) = (n+1) x^{n}\end{aligned}
[/latex]

erfüllt, was den Induktionsbeweis abschliesst. Differenzierbarkeit eines beliebigen Polynoms folgt nun aus der Linearität der Ableitung in Proposition 7.5. ∎

Übung 7.7: Potenzregel mittels Binomialsatz

Zeigen Sie Korollar 7.6 direkt unter Verwendung des Binomialsatzes. Beweisen Sie des Weiteren, dass der Kern der Abbildung [latex]f \in \mathbb {R}[x] \mapsto f' \in \mathbb {R}[x][/latex] aus den konstanten Polynomen besteht. Später werden wir sehen, dass nicht nur Polynome mit Ableitung Null, sondern auch differenzierbare Funktionen auf [latex]\mathbb {R}[/latex] mit Ableitung Null konstant sein müssen.

Wieder in Analogie zur Diskussion von stetigen Funktionen (genauer Proposition 3.53) wollen wir zeigen, dass die Verknüpfung zweier differenzierbaren Funktionen auch differenzierbar ist.

Satz 7.8: Kettenregel

Seien [latex]D,E \subseteq \mathbb {R}[/latex] Teilmengen und sei [latex]x_0\in D[/latex] ein Häufungspunkt. Sei [latex]f: D \to E[/latex] eine bei [latex]x_0[/latex] differenzierbare Funktion, so dass [latex]y_0 = f(x_0)[/latex] ein Häufungspunkt von [latex]E[/latex] ist, und sei [latex]g: E \to \mathbb {R}[/latex] eine bei [latex]y_0[/latex] differenzierbare Funktion. Dann ist [latex]g \circ f: D \to \mathbb {R}[/latex] in [latex]x_0[/latex] differenzierbar und

[latex]
\begin{aligned}[](g \circ f)'(x_0) = g'(f(x_0)) f'(x_0).\end{aligned}
[/latex]

Wir bemerken, dass man zwar versucht sein mag, für den Beweis der Kettenregel den Differenzenquotienten

[latex]
\begin{aligned}[]\frac {(g \circ f)(x)-(g \circ f)(x_0)}{x-x_0}\end{aligned}
[/latex]

mit [latex]f(x)-f(x_0)[/latex] zu erweitern. Dies ist im Allgemeinen aber nicht erlaubt, da wir nicht ausschliessen können, dass [latex]f(x) = f(x_0)[/latex] für gewisse Punkte [latex]x[/latex] nahe bei [latex]x_0[/latex] ist.

Beweis

Wir verwenden stattdessen die Umformulierung

[latex]
\begin{aligned}[]f(x) = f(x_0) + f'(x_0) (x-x_0) + o(x-x_0)\end{aligned}
[/latex]

für [latex]x \to x_0[/latex], oder genauer formuliert

[latex]
\begin{aligned}[]f(x) = f(x_0) + f'(x_0) (x-x_0) + \varepsilon _f(x) (x-x_0),\end{aligned}
[/latex]

wobei die Funktion [latex]\varepsilon _f[/latex] auf [latex]D[/latex] durch

[latex]
\begin{aligned}[]\varepsilon _f(x) = \left \lbrace \begin{array}{ll} \frac {f(x)-f(x_0)}{x-x_0}-f'(x_0) & \text {falls } x \in D\setminus \left \lbrace {x_0} \right \rbrace \\ 0 & \text {falls } x=x_0\end{array} \right .\end{aligned}
[/latex]

für alle [latex]x \in D[/latex] gegeben ist und bei [latex]x_0[/latex] stetig ist. Ebenso gilt

[latex]
\begin{aligned}[]g(y) = g(y_0) + g'(y_0) (y-y_0) + \varepsilon _g(y) (y-y0),\end{aligned}
[/latex]

wobei die bei [latex]y_0[/latex] stetige Funktion [latex]\varepsilon _g[/latex] auf [latex]E[/latex] durch

[latex]
\begin{aligned}[]\varepsilon _g(y) = \left \lbrace \begin{array}{ll} \frac {g(y)-g(y_0)}{y-y_0}-g'(y_0) & \text {falls } y \in E\setminus \left \lbrace {y_0} \right \rbrace \\ 0 & \text {falls } y=y_0\end{array} \right .\end{aligned}
[/latex]

für alle [latex]y \in E[/latex] gegeben ist. Zusammen ergibt sich durch Einsetzen von [latex]y = f(x)[/latex]

[latex]
\begin{aligned}[]g(f(x)) &= g(f(x_0)) + g'(f(x_0)) (f(x)-f(x_0)) + \varepsilon _g(f(x)) (f(x)-f(x_0))\\ &= g(f(x_0)) + g'(f(x_0)) f'(x_0)(x-x_0) \\ &\quad \quad \quad \quad \quad + \bigl (g'(f(x_0))\varepsilon _f(x) + \varepsilon _g(f(x)) (f'(x_0)+\varepsilon _f(x))\bigr )(x-x_0),\end{aligned}
[/latex]

für alle [latex]x \in D[/latex], womit

[latex]
\begin{aligned}[]\lim _{x \to x_0} &\frac {(g \circ f)(x)-(g \circ f)(x_0)}{x-x_0}\\ &= \lim _{x \to x_0} \bigl (g'(f(x_0)) f'(x_0) + g'(f(x_0)) \varepsilon _f(x) + \varepsilon _g(f(x)) (f'(x_0)+\varepsilon _f(x))\bigr )\\ &= g'(f(x_0)) f'(x_0)\end{aligned}
[/latex]

wie gewünscht. ∎

Abgesehen von Summen, Produkten und Verknüpfungen von differenzierbaren Funktionen, möchten wir zeigen, dass Quotienten von differenzierbaren Funktionen differenzierbar sind. Wir beginnen dazu mit einem wichtigen Beispiel.

Beispiel 7.9: Kehrwert

Sei [latex]f: \mathbb {R}\setminus \left \lbrace {0} \right \rbrace \to \mathbb {R}, x \mapsto \frac {1}{x}[/latex]. Dann ist [latex]f[/latex] differenzierbar und es gilt [latex]f'(x) = -\frac {1}{x^2}[/latex] für alle [latex]x \in \mathbb {R}\setminus \left \lbrace {0} \right \rbrace[/latex]. In der Tat ist

[latex]
\begin{aligned}[]f'(x) = \lim _{h \to 0} \frac {\frac {1}{x+h}-\frac {1}{x}}{h} = \lim _{h \to 0} \frac {x-(x+h)}{(x+h)xh} = - \lim _{h \to 0} \frac {1}{(x+h)x} = - \frac {1}{\lim _{h \to 0}(x+h)x} = - \frac {1}{x^2}\end{aligned}
[/latex]

wegen der Stetigkeit von [latex]h \mapsto (x+h)x[/latex] bei [latex]0[/latex].

Übung 7.10: Negative Potenzen

Berechnen Sie [latex](x^{-n})'[/latex] für alle [latex]n \in \mathbb {N}[/latex].

Unter Kombination der Kettenregel und Beispiel 7.9 erhält man nun folgendes Korollar.

Korollar 7.11: Quotientenregel

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge, [latex]a \in D[/latex] ein Häufungspunkt und seien [latex]f,g:D \to \mathbb {R}[/latex] bei [latex]a[/latex] differenzierbar. Falls [latex]g(a) \neq 0[/latex] ist, dann ist auch [latex]\frac {f}{g}[/latex] bei [latex]a[/latex] differenzierbar und es gilt

[latex]
\begin{aligned}[]\left (\frac {f}{g}\right )'(a) = \frac {f'(a)g(a)-f(a)g'(a)}{g(a)^2}.\end{aligned}
[/latex]

Man beachte, dass der (natürliche) Definitionsbereich der Funktion [latex]\frac {f}{g}[/latex], der in obigem Korollar nicht erwähnt wurde, die Teilmenge [latex]E = \left \lbrace {x \in D} \mid {g(x) \neq 0}\right \rbrace[/latex] ist. Da [latex]g[/latex] beim Punkt [latex]a[/latex] differenzierbar ist, ist [latex]g[/latex] bei [latex]a[/latex] stetig. Insbesondere ist, da [latex]g(a) \neq 0[/latex] ist, [latex]g(x) \neq 0[/latex] für alle [latex]x[/latex] nahe genug bei [latex]a[/latex] und [latex]a[/latex] ist ein Häufungspunkt von [latex]E[/latex]. Damit macht es auch Sinn, von Differenzierbarkeit von [latex]\frac {f}{g}[/latex] bei [latex]a[/latex] zu sprechen.

Eine direkte Konsequenz von Korollar 7.11 ist, dass rationale Funktionen differenzierbar sind, wo definiert. Wir erinnern daran, dass eine rationale Funktion eine Funktion der Form [latex]\frac {f(x)}{g(x)}[/latex] ist, wobei [latex]f(x)[/latex] und [latex]g(x)[/latex] reelle Polynome sind und [latex]g(x)[/latex] nicht das Nullpolynom ist.

Beweis von Korollar 7.11

Es bezeichne [latex]\psi[/latex] die Funktion [latex]y \in \mathbb {R} \setminus \left \lbrace {0} \right \rbrace \mapsto \frac {1}{y} \in \mathbb {R}[/latex], welche nach Beispiel 7.9 differenzierbar ist. Wir kombinieren dies mit der Kettenregel (Satz 7.8) und erhalten, dass die Funktion [latex]\frac {1}{g} = \psi \circ g[/latex] bei [latex]a[/latex] differenzierbar ist mit Ableitung

[latex]
\begin{aligned}[]\left (\frac {1}{g}\right )'(a) = - \frac {1}{g(a)^2} g'(a).\end{aligned}
[/latex]

Verwenden wir nun die Produktregel in Proposition 7.5, so ergibt sich, dass [latex]\frac {f}{g} = f \cdot \frac {1}{g}[/latex] bei [latex]a[/latex] differenzierbar ist und

[latex]
\begin{aligned}[]\left (\frac {f}{g}\right )'(a) = \left (f \cdot \frac {1}{g}\right )'(a) = f'(a) \frac {1}{g(a)} - f(a) \frac {g'(a)}{g(a)^2} = \frac {f'(a)g(a)-f(a)g'(a)}{g(a)^2}\end{aligned}
[/latex]

erfüllt, was zu zeigen war. ∎

Die Kettenregel erlaubt uns die Berechnung der Ableitung von beliebig kompliziert anmutenden konkreten Beispielen, wobei man stur von aussen nach innen vorgeht wie in folgendem Beispiel.

Beispiel 7.12: Vierfach verschachtelte Funktionen

Wir bestimmen die Ableitung der Funktion

[latex]
\begin{aligned}[]f: x \in \mathbb {R} \mapsto \exp (\sin (\sin (x^2)))\end{aligned}
[/latex]

mittels mehrmaligem Anwenden der Kettenregel (Satz 7.8). Da [latex]\exp ' = \exp[/latex] erhalten wir

[latex]
\begin{aligned}[]f'(x) = \exp (g(x)) g'(x),\end{aligned}
[/latex]

wobei [latex]g(x) = \sin (\sin (x^2))[/latex]. Ebenso ist wegen [latex]\sin ' = \cos[/latex]

[latex]
\begin{aligned}[]g'(x) = \cos (h(x)) h'(x),\end{aligned}
[/latex]

wobei [latex]h(x) = \sin (x^2)[/latex] und [latex]h'(x) = \cos (x^2) 2x[/latex]. Dadurch erhalten wir

[latex]
\begin{aligned}[]f'(x) = \exp (\sin (\sin (x^2))) \cos (\sin (x^2)) \cos (x^2) 2x\end{aligned}
[/latex]

für alle [latex]x \in \mathbb {R}[/latex].

Übung 7.13: Nochmals vierfach verschachtelt

Bestimmen Sie die Ableitung von der Funktion [latex]x \in \mathbb {R} \mapsto \cos ((\sin (\exp (x)))^3)[/latex].

Unsere vorläufig letzte allgemeine Ableitungsregel betrifft die Ableitung der Umkehrabbildung (siehe dazu auch Satz 3.65 über die Existenz einer stetigen Umkehrabbildung).

Satz 7.14: Differenzierbarkeit der inversen Funktion

Seien [latex]D,E \subseteq \mathbb {R}[/latex] Teilmengen und sei [latex]f: D \to E[/latex] eine stetige, bijektive Abbildung, deren inverse Abbildung [latex]f^{-1}: E \to D[/latex] ebenfalls stetig ist. Falls [latex]f[/latex] in dem Häufungspunkt [latex]x_0\in D[/latex] differenzierbar ist und [latex]f'(x_0) \neq 0[/latex] gilt, dann ist [latex]f^{-1}[/latex] in [latex]y_0 = f(x_0)[/latex] differenzierbar und es gilt

[latex]
\begin{aligned}[](f^{-1})'(y_0) = \frac {1}{f'(x_0)}\end{aligned}
[/latex]
image

Abbildung 7.2 – Eine intuitive Darstellung von Satz 7.14. Spiegelt man den Graphen von [latex]f[/latex] und die Tangente beim Punkt [latex](x_0,y_0)[/latex] um die Gerade [latex]x=y[/latex] in [latex]\mathbb {R}^2[/latex], so erhält man den Graphen von [latex]f^{-1}[/latex] und, das ist die Behauptung, die Tangente bei [latex](y_0,x_0)[/latex]. Eine kurze Rechnung zeigt, dass die Spiegelung einer Gerade mit Steigung [latex]m[/latex] um [latex]x=y[/latex] Steigung [latex]\frac {1}{m}[/latex] hat.

Beweis

Wir bemerken zuerst, dass [latex]y_0[/latex] ein Häufungspunkt von [latex]E[/latex] ist, womit man von Differenzierbarkeit bei [latex]y_0[/latex] sprechen darf. Tatsächlich ist nach Annahme [latex]x_0[/latex] ein Häufungspunkt und es existiert eine Folge [latex](x_n)_n[/latex] in [latex]D \setminus \left \lbrace {x_0} \right \rbrace[/latex] mit [latex]x_n \to x_0[/latex] für [latex]n \to \infty[/latex]. Da [latex]f[/latex] stetig ist, gilt [latex]f(x_n) \to f(x_0)= y_0[/latex] für [latex]n \to \infty[/latex] und da [latex]f[/latex] bijektiv ist, gilt [latex]f(x_n) \neq y_0[/latex] für alle [latex]n\in \mathbb {N}[/latex].

Sei nun [latex](y_n)_n[/latex] eine Folge in [latex]D\setminus \left \lbrace {y_0} \right \rbrace[/latex], die gegen [latex]y_0[/latex] konvergiert. Dann strebt [latex]x_n = f^{-1}(y_n)[/latex] in [latex]D \setminus \left \lbrace {x_0} \right \rbrace[/latex] gegen [latex]x_0[/latex], da [latex]f^{-1}[/latex] per Annahme stetig ist, und es gilt

[latex]
\begin{aligned}[]\lim _{n \to \infty } \frac {f^{-1}(y_n) - f^{-1}(y_0)}{y_n - y_0} = \lim _{n \to \infty } \frac {x_n-x_0}{y_n-y_0} = \lim _{n \to \infty } \left (\frac {f(x_n)-f(x_0)}{x_n-x_0}\right )^{-1} = (f'(x_0))^{-1}\end{aligned}
[/latex]

nach der Charakterisierung der Konvergenz einer Funktion mittels Folgen in Lemma 5.65. Da dies aber für jede Folge [latex](y_n)_n[/latex] wie oben gilt, folgt der Satz wiederum aus Lemma 5.65. ∎

Beispiel 7.15: Differenzierbarkeit des Logarithmus und der Potenzfunktionen

  1. Die Funktion [latex]g: y \in \mathbb {R} \setminus \left \lbrace {0} \right \rbrace \mapsto \log (|y|) \in \mathbb {R}[/latex] ist differenzierbar mit Ableitung [latex]g'[/latex] gegeben durch [latex]g'(y) = \frac {1}{y}[/latex] für alle [latex]y \in \mathbb {R} \setminus \left \lbrace {0} \right \rbrace[/latex]. Denn die Abbildung [latex]\log :y \in \mathbb {R}_{>0} \mapsto \log (y) = g(y)[/latex] ist die Umkehrabbildung von [latex]\exp : \mathbb {R} \to \mathbb {R}_{>0}[/latex] und damit folgt aus Satz 7.14, dass [latex]g[/latex] bei allen Punkten [latex]y>0[/latex] differenzierbar ist mit [latex]g'(y) = \frac {1}{f'(x)}[/latex], wobei [latex]x = g(y) = \log (y)[/latex]. Da [latex]\exp ' = \exp[/latex] folgt nun
    [latex]
    \begin{aligned}[]g'(y) = \log '(y) = \frac {1}{\exp (x)} = \frac {1}{\exp (\log (y))} = \frac {1}{y}.\end{aligned}
    [/latex]

    Für [latex]y 7.8).

  2. Für ein beliebiges [latex]s \in \mathbb {C}[/latex] ist die Abbildung [latex]x \in \mathbb {R}_{>0} \mapsto x^s[/latex] differenzierbar und es gilt
    [latex]
    \begin{aligned}[](x^s)' = s x^{s-1}.\end{aligned}
    [/latex]

    In der Tat gilt [latex]x^s = \exp (s\log (x))[/latex] für alle [latex]x > 0[/latex] per Definition beliebiger Potenzen in Abschnitt 6.5.2. Aus Beispiel 7.3 und der Ableitung der Logarithmusabbildung folgt somit

    [latex]
    \begin{aligned}[](x^s)' = \exp (s\log (x))' = \exp (s\log (x)) s \frac {1}{x} = x^s s x^{-1} = s x^{s-1}\end{aligned}
    [/latex]

    für alle [latex]x > 0[/latex].

7.1.3 – Extremwerte

Wie wir in diesem Abschnitt sehen werden, ist die Ableitung auch nützlich, um Punkte zu finden, bei denen eine Funktion [latex]f[/latex] ihre Maxima und ihre Minima annimmt. Genauer kann man damit die in folgender Definition eingeführten Punkte finden.

Definition 7.16: Lokale Extremwerte

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge und [latex]x_0 \in D[/latex]. Wir sagen, dass eine Funktion [latex]f: D \to \mathbb {R}[/latex] in [latex]x_0[/latex] ein lokales Maximum hat, falls es eine Umgebung [latex]U[/latex] von [latex]x_0[/latex] in [latex]D[/latex] gibt, auf der [latex]f[/latex] durch [latex]f(x_0)[/latex] beschränkt ist. Genauer formuliert heisst dies, dass es ein [latex]\delta >0[/latex] gibt, so dass für alle [latex]x \in D \cap (x_0-\delta ,x_0 + \delta )[/latex] gilt [latex]f(x) \leq f(x_0)[/latex]. Falls es sogar ein [latex]\delta > 0[/latex] gibt, so dass [latex]f(x) isoliertes lokales Maximum. Der Wert [latex]f(x_0)[/latex] wird auch ein lokaler Maximalwert von [latex]f[/latex] genannt. Ein lokales Minimum, ein isoliertes lokales Minimum und ein lokaler Minimalwert von [latex]f[/latex] sind analog definiert.

Des Weiteren nennen wir [latex]x_0[/latex] ein lokales Extremum von [latex]f[/latex] und [latex]f(x_0)[/latex] einen lokalen Extremwert von [latex]f[/latex], falls [latex]f[/latex] ein lokales Minimum oder ein lokales Maximum in [latex]x_0[/latex] hat.

Proposition 7.17: Notwendige Bedingung für Extremum

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge und [latex]f[/latex] eine reellwertige Funktion auf [latex]D[/latex]. Angenommen [latex]f[/latex] ist in einem lokalen Extremum [latex]x_0 \in D[/latex] differenzierbar und [latex]x_0[/latex] ist sowohl ein rechtsseitiger als auch ein linksseitiger Häufungspunkt von [latex]D[/latex]. Dann gilt [latex]f'(x_0) = 0[/latex].

Die Annahme in Proposition 7.17, dass sich die Menge [latex]D[/latex] dem Extremum [latex]x_0\in D[/latex] sowohl von links als auch von rechts nähert, ist notwendig, da wir [latex]f'(x_0)[/latex] von links und von rechts mit Differenzenquotienten approximieren wollen. In konkreten Rechenbeispielen ist sie jedoch meist erfüllt. Beispielsweise ist dies in allen Punkten eines Intervalls abgesehen von den Endpunkten erfüllt.

Beweis

Ohne Beschränkung der Allgemeinheit nehmen wir an, dass [latex]f[/latex] ein lokales Maximum in [latex]x_0 \in D[/latex] hat (sonst ersetzt man [latex]f[/latex] durch [latex]-f[/latex]). Da [latex]f[/latex] bei [latex]x_0[/latex] differenzierbar ist und [latex]x_0[/latex] von links und rechts angenähert werden kann, existieren sowohl der linksseitige als auch der rechtsseitige Grenzwert der Differenzenquotienten bei [latex]x_0[/latex] und beide sind gleich [latex]f'(x_0)[/latex]. Dann ist

[latex]
\begin{aligned}[]f'(x_0) = f'_+(x_0) = \lim _{x \searrow x_0} \frac {f(x)-f(x_0)}{x-x_0} \leq 0,\end{aligned}
[/latex]

da [latex]f(x) \leq f(x_0)[/latex] für alle [latex]x[/latex] hinreichend nahe bei [latex]x_0[/latex] gilt und [latex]x > x_0[/latex] für die Bewegung [latex]x \searrow x_0[/latex] erfüllt ist. Weiters ist aber auch

[latex]
\begin{aligned}[]f'(x_0) = f_-'(x_0) = \lim _{x \nearrow x_0} \frac {f(x)-f(x_0)}{x-x_0} \geq 0,\end{aligned}
[/latex]

da wiederum [latex]f(x) \leq f(x_0)[/latex] für alle [latex]x[/latex] hinreichend nahe bei [latex]x_0[/latex] gilt und [latex]x

Falls der Definitionsbereich [latex]D[/latex] ein Intervall ist, so besagt Proposition 7.17 das Folgende.

Korollar 7.18: Lokale Extremwerte

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall und [latex]f: I \to \mathbb {R}[/latex]. Sei [latex]x_0 \in I[/latex] ein lokales Extremum von [latex]f[/latex]. Dann bestehen genau folgende Möglichkeiten:

  1. [latex]x_0[/latex] ist ein in [latex]I[/latex] enthaltener Endpunkt von [latex]I[/latex],
  2. [latex]f[/latex] ist bei [latex]x_0[/latex] nicht differenzierbar oder
  3. [latex]f[/latex] ist bei [latex]x_0[/latex] differenzierbar und [latex]f'(x_0) = 0[/latex].

Insbesondere sind alle lokalen Extrema einer differenzierbaren Funktion auf einem offenen Intervall Nullstellen der Ableitung.

Man beachte, dass alle Fälle in obigem Korollar eintreten können (wieso?). Des Weiteren ist die Umkehrung von Proposition 7.17 nicht richtig, wie wir in folgender Übung zeigen wollen.

Übung 7.19

  1. Finden Sie alle lokalen Extrema des Polynoms [latex]f(x) = x^3-x[/latex] auf [latex]\mathbb {R}[/latex].
  2. Finden Sie alle lokalen Extrema der Funktion [latex]|f|[/latex] auf [latex][-3,3][/latex].

7.1.4 – Stetige Differenzierbarkeit

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge, so dass jeder Punkt in [latex]D[/latex] ein Häufungspunkt von [latex]D[/latex] ist (wie zum Beispiel bei einem Intervall mit Endpunkten [latex]a

[latex]
\begin{aligned}[]f': x\in D \to f'(x)\end{aligned}
[/latex]

als eine neue Funktion betrachten. Ist [latex]f'[/latex] stetig, so nennen wir [latex]f[/latex] stetig differenzierbar.

Man beachte, dass eine differenzierbare Funktion nicht zwingend stetig differenzierbar sein muss. Wir illustrieren dies in einem Beispiel.

Beispiel 7.20: Unstetige Ableitung

Wir betrachten zu [latex]p > 0[/latex] die Abbildung [latex]f: \mathbb {R} \to \mathbb {R}[/latex] definiert durch

[latex]
\begin{aligned}[]f_p(x) = \left \lbrace \begin{array}{cc} |x|^p\sin \big (\frac {1}{x}\big ) & \text {falls } x \neq 0 \\ 0 & \text {falls } x = 0\end{array} \right .\end{aligned}
[/latex]

für alle [latex]x\in \mathbb {R}[/latex]. Da [latex]p > 0[/latex] ist, ist [latex]f_p[/latex] auch bei [latex]0[/latex] stetig (siehe das Sandwich Lemma 5.74). Die Ableitung von [latex]f[/latex] bei [latex]x\neq 0[/latex] existiert und ist durch

[latex]
\begin{aligned}[]f'_p(x) = p|x|^{p-1}\operatorname {sgn}(x)\sin \left (\tfrac {1}{x}\right ) - |x|^{p-2} \cos \left (\tfrac {1}{x}\right )\end{aligned}
[/latex]

gegeben. Hierbei verwendeten wir auch, dass die Ableitung von [latex]x\in \mathbb {R}^\times \mapsto |x|[/latex] durch [latex]x\in \mathbb {R}^\times \mapsto \operatorname {sgn}(x)[/latex] gegeben ist. Für die Ableitung von [latex]f[/latex] bei [latex]0[/latex] können wir keine allgemeine Ableitungsregel verwenden und manipulieren deswegen den Grenzwert

[latex]
\begin{aligned}[]\lim _{x\searrow 0} \frac {f_p(x)-f_p(0)}{x-0} = \lim _{x\searrow 0} \frac {x^p\sin \big (\frac {1}{x}\big ) }{x} = \lim _{x\searrow 0} x^{p-1}\sin \left (\tfrac {1}{x}\right ) = \lim _{t \to \infty }\sin (t) t^{1-p}\end{aligned}
[/latex]

wobei wir [latex]t = \frac {1}{x}[/latex] gesetzt haben. Falls [latex]p \leq 1[/latex] ist, dann existiert wegen [latex]1-p \geq 0[/latex] der Grenzwert [latex]\lim _{t \to \infty }\sin (t) t^{1-p}[/latex] nicht und somit ist [latex]f_p[/latex] nicht differenzierbar. Wir nehmen nun [latex]p >1[/latex] an, womit [latex]f[/latex] (ebenso auf Grund des Sandwich Lemmas) eine rechtsseitige Ableitung [latex](f_p)_+'(0)=0[/latex] besitzt. Analog können wir den Grenzwert mit [latex](f_p)_-'(0) = 0[/latex] berechnen und erhalten drei Fälle.

  • Falls [latex]p
  • Falls [latex]p=2[/latex] ist, ist [latex]f_p'[/latex] beschränkt, aber nicht stetig bei [latex]0[/latex], da der Grenzwert [latex]\lim _{x \to 0} \cos \left (\frac {1}{x}\right )[/latex] nicht existiert.
  • Falls [latex]p>2[/latex] ist, ist [latex]f_p'[/latex] stetig und [latex]f_p[/latex] ist stetig differenzierbar. Man beachte aber, dass [latex]f_p'[/latex] nicht differenzierbar sein muss, da für [latex]p\leq 3[/latex] der Grenzwert
    [latex]
    \begin{aligned}[]\lim _{x \searrow 0} \frac {f_p'(x)-f_p'(0)}{x-0} = \lim _{x\searrow 0} \frac {px^{p-1}\sin \left (\frac {1}{x}\right ) - x^{p-2} \cos \left (\frac {1}{x}\right )}{x} = \lim _{t \to \infty } \bigl (pt^{2-p}\sin \left (t\right ) - t^{3-p} \cos \left (t\right )\bigr )\end{aligned}
    [/latex]

    nicht existiert.

Das Beispiel 7.20 lässt sich mit fraktalen Konstruktionen stark verschärfen. In der Tat kann man eine differenzierbare Funktion auf dem Intervall [latex][0,1][/latex] finden, deren Ableitung überabzählbar viele Unstetigkeitsstellen besitzt (beispielsweise auf der Cantor-Menge). Eine Konstruktion dieser Art finden Sie in Abschnitt 7.6.2.

7.1.5 – Ableitungen höherer Ordnung

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge, so dass jeder Punkt in [latex]D[/latex] ein Häufungspunkt ist, und sei [latex]f: D \to \mathbb {R}[/latex] eine Funktion. Falls [latex]f'[/latex] existiert und differenzierbar ist, nennen wir [latex]f[/latex] zweimal differenzierbar. Die Funktion [latex](f')'[/latex] ist die zweite Ableitung von [latex]f[/latex] und wird auch mit [latex]f'',\ f^{(2)}[/latex] oder [latex]\frac {\thinspace {\rm {d}}^2 f}{\thinspace {\rm {d}} x^2}[/latex] bezeichnet. Falls die unabhängige Variable [latex]t[/latex] ist, schreiben wir [latex]\ddot {f} = (\dot {f})^\cdot = \frac {\thinspace {\rm {d}}^2 f}{\thinspace {\rm {d}} t^2}[/latex] für die zweite Ableitung nach [latex]t[/latex]. Insbesondere erhalten wir, dass eine zweimal differenzierbare Funktion [latex]f[/latex] stetig differenzierbar ist.

Induktiv kann man nun höhere Differenzierbarkeit und höhere Ableitungen definieren. Formal definieren wir also die Ableitungen

[latex]
\begin{aligned}[]f^{(0)} = f,\quad f^{(1)} = \frac {\thinspace {\rm {d}} f}{\thinspace {\rm {d}} x} = f',\quad f^{(2)} = \frac {\thinspace {\rm {d}}^2 f}{\thinspace {\rm {d}} x^2} = f'',\quad \ldots \quad ,\quad f^{(n+1)} = \frac {\thinspace {\rm {d}}^{(n+1)} f}{\thinspace {\rm {d}} x^{n+1}} = (f^{(n)})'\end{aligned}
[/latex]

für alle [latex]n\in \mathbb {N}[/latex]. Falls [latex]f^{(n)}[/latex] für ein [latex]n \in \mathbb {N}[/latex] (auf ganz [latex]D[/latex]) existiert, heisst [latex]f[/latex] [latex]n[/latex]-mal differenzierbar. Falls die [latex]n[/latex]-te Ableitung [latex]f^{(n)}[/latex] zusätzlich stetig ist, heisst [latex]f[/latex] [latex]n[/latex]-mal stetig differenzierbar. Die Menge der [latex]n[/latex]-mal stetig differenzierbaren Funktionen auf [latex]D[/latex] bezeichnen wir mit [latex]C^n(D)[/latex].

Für jedes [latex]n \in \mathbb {N}[/latex] kann man eine Funktion finden, die zwar [latex]n[/latex]-mal differenzierbar, aber nicht [latex](n+1)[/latex]-mal differenzierbar ist.

Übung 7.21

Sei [latex]n\in \mathbb {N}[/latex]. Zeigen Sie, dass die Funktion [latex]x \in \mathbb {R} \mapsto x^n |x|\in \mathbb {R}[/latex] [latex]n[/latex]-mal stetig differenzierbar, aber nicht [latex](n+1)[/latex]-mal differenzierbar ist.

Wir sagen, dass [latex]f[/latex] glatt oder beliebig oft differenzierbar ist, falls [latex]f[/latex] für jedes [latex]n\in \mathbb {N}[/latex] [latex]n[/latex]-mal differenzierbar ist. Ist [latex]f[/latex] glatt, so sind insbesondere alle Ableitungen von [latex]f[/latex] stetig ([latex]f[/latex] ist also beliebig oft stetig differenzierbar). Die Menge der glatten Funktionen auf [latex]D[/latex] bezeichnen wir mit [latex]C^\infty (D)[/latex].

Wir kennen bereits einige Beispiele glatter Funktionen. Dazu gehören die Polynome, da diese nach Korollar 7.6 differenzierbar sind und da deren Ableitung ein Polynom ist, womit die Aussage aus Induktion folgt. Ebenfalls glatt sind die Funktion [latex]\exp ,\sin ,\cos ,\sinh ,\cosh[/latex] nach Beispiel 7.3 und Übung 7.4. Etwas interessanter, aber nicht ganz unerwartet ist vermutlich folgendes Beispiel.

Beispiel 7.22: Logarithmusfunktion

Der Logarithmus [latex]f = \log : (0,\infty ) \to \mathbb {R},\ x \to \log (x)[/latex] ist glatt. In der Tat gilt [latex]f'(x) = \frac {1}{x}[/latex], [latex]f''(x) = -\frac {1}{x^2}[/latex], [latex]f^{(3)}(x) = \frac {2}{x^3}[/latex] oder allgemein [latex]f^{(n)}(x) = (-1)^{n-1}(n-1)! x^{-n}[/latex], was sich mit vollständiger Induktion beweisen lässt.

Ein überraschenderes Beispiel einer glatten Funktion ist vielleicht das folgende.

Beispiel 7.23: Glattes Abklingen

Die Funktion [latex]\psi : \mathbb {R} \to \mathbb {R}[/latex] definiert durch

[latex]
\begin{aligned}[]\psi (x) = \left \lbrace \begin{array}{cl} 0 & \text {falls } x \leq 0 \\ \exp \big (-\frac 1x \big ) & \text {falls } x > 0\end{array} \right .\end{aligned}
[/latex]

für alle [latex]x\in \mathbb {R}[/latex] ist glatt und demnach auch beliebig oft stetig differenzierbar, siehe das folgende Bild.

image

Für [latex]x0[/latex] ergibt sich dies mittels Induktion, der Kettenregel (Satz 7.8), Beispiel 7.9, der Produktregel in Proposition 7.5 und Korollar 7.6. In der Tat gilt für [latex]x>0[/latex], dass

[latex]
\begin{aligned}[]\psi '(x) = \exp \left (-\frac 1x\right ) \frac {1}{x^2},\quad \psi ''(x) = \exp \left (-\frac 1x\right ) \frac {1}{x^2}\frac {1}{x^2} + \exp \left (-\frac 1x\right ) \frac {-2}{x^3}\end{aligned}
[/latex]

und (da die konkrete Formel für [latex]\psi ^{(n)}[/latex] schnell kompliziert wird) allgemeiner
[latex]
\begin{aligned}[]\label{eq:abl-expm1overx 1} \psi ^{(n)}(x) = \exp \left (-\frac 1x\right ) f_n\left (\frac 1x\right )\end{aligned}
[/latex]
für gewisse Polynome [latex]f_n[/latex] und jedes [latex]n\in \mathbb {N}[/latex]. Für [latex]n=1[/latex] und [latex]n=2[/latex] haben wir diese Darstellung der Ableitung bereits bewiesen, wobei [latex]f_1(t) = t^2[/latex] und [latex]f_2(t) = t^4-2t^3[/latex]. Für den Induktionsschritt nehmen wir (7.4) für [latex]n\in \mathbb {N}[/latex] an und erhalten

[latex]
\begin{aligned}[]\psi ^{(n+1)}(x) &= \left (\exp \left (-\frac 1x\right ) f_n\left (\frac 1x\right )\right )' = \exp \left (-\frac 1x\right ) \frac {1}{x^2} f_n\left (\frac 1x\right ) + \exp \left (-\frac 1x\right ) f_n'\left (\frac 1x\right ) \frac {-1}{x^2}\\ &= \exp \left (-\frac 1x\right ) f_{n+1}\left (\frac 1x\right ),\end{aligned}
[/latex]

wobei das Polynom [latex]f_{n+1}[/latex] als [latex]f_{n+1}(t) = t^2(f_n(t)-f_n'(t))[/latex] gewählt wurde.

Es bleibt noch zu zeigen, dass [latex]\psi[/latex] auch in [latex]x=0[/latex] beliebig oft differenzierbar ist. Dabei können wir nicht auf unsere Ableitungsregeln zurückgreifen, sondern müssen dies direkt mit der Definition der Ableitung überprüfen. Wir behaupten, dass [latex]\psi ^{(n)}(0) = 0[/latex] für alle [latex]n\in \mathbb {N}[/latex].

Für den Beweis der Behauptung zeigen wir zuerst, dass für jedes Polynom [latex]f[/latex]
[latex]
\begin{aligned}[]\label{eq:abl-expm1overx 2} \lim _{x \to 0} \psi (x) f(\tfrac {1}{x}) =0\end{aligned}
[/latex]
ist. Auf Grund der Linearität des Grenzwerts und da [latex]\psi (x) = 0[/latex] für [latex]x

[latex]
\begin{aligned}[]\lim _{y \to \infty }\frac {y^n}{\exp (y)} =0\end{aligned}
[/latex]

äquivalent ist. Dies folgt aber mit dem Sandwich-Lemma aus der Ungleichung [latex](1+\frac {y}{n+1})^{n+1}\leq \exp (y)[/latex] für alle [latex]y\geq 0[/latex] und [latex]n\in \mathbb {N}[/latex] (siehe Abschnitt 5.3).

Wir zeigen nun [latex]\psi ^{(n)}(0) = 0[/latex] für alle [latex]n\in \mathbb {N}[/latex] per Induktion. Verwenden wir (7.5), so erhalten wir

[latex]
\begin{aligned}[]\psi '(0) = \lim _{x \to 0} \frac {\psi (x)-0}{x} = \lim _{x \to 0} \psi (x) \frac 1x =0.\end{aligned}
[/latex]

Falls wir bereits [latex]\psi ^{(n)}(0) = 0[/latex] für ein [latex]n \in \mathbb {N}[/latex] wissen, dann folgt ebenso

[latex]
\begin{aligned}[]\psi ^{(n+1)}(0) = \lim _{x \to 0} \frac {\psi ^{(n)}(x) - \psi ^{(n)}(0)}{x-0} = \lim _{x \to 0} \frac {\psi (x) f_n\big (\frac 1x \big ) - 0}{x} = \lim _{x \to 0}\psi (x) f_n\bigg (\frac 1x \bigg ) \frac 1x = 0.\end{aligned}
[/latex]

Wir haben nun also gezeigt, dass alle Ableitungen von [latex]\psi[/latex] auf ganz [latex]\mathbb {R}[/latex] existieren und somit ist [latex]\psi[/latex] glatt.

Übung 7.24: Hutfunktion

Finden Sie für beliebige reelle Zahlen [latex]a

Hinweis.

Versuchen Sie zuerst geeignet verschobene und gespiegelte Versionen der Funktion [latex]\psi[/latex] aus Beispiel 7.23 zu kombinieren. Zum Start könnte man beispielsweise die Abbildung [latex]x \mapsto ~\frac {\psi (x)}{\psi (x)+\psi (1-x)}[/latex] betrachten.

Wir wenden uns nun wieder allgemeinen Aussagen im Stile von Abschnitt 7.1.2 zu. Aus Proposition 7.5 lässt sich folgendes Korollar deduzieren.

Korollar 7.25: Summen und Produkte bei höherer Differenzierbarkeit

Sei [latex]D \subseteq \mathbb {R}[/latex] eine Teilmenge, so dass jeder Punkt in [latex]D[/latex] ein Häufungspunkt von [latex]D[/latex] ist. Seien [latex]f,g: D \to \mathbb {R}[/latex] [latex]n[/latex]-mal differenzierbar. Dann sind [latex]f+g[/latex] und [latex]f\cdot g[/latex] ebenso [latex]n[/latex]-mal differenzierbar und es gilt [latex]f^{(n)} + g^{(n)} = (f+g)^{(n)}[/latex] sowie

[latex]
\begin{aligned}[](fg)^{(n)} = \sum _{k=0}^n \binom {n}{k} f^{(k)} g^{(n-k)}.\end{aligned}
[/latex]

Insbesondere ist jedes skalare Vielfache [latex]n[/latex]-mal differenzierbar und [latex](\alpha f)^{(n)} = \alpha f^{(n)}[/latex] für alle [latex]\alpha \in \mathbb {R}[/latex].

Die obige Produktregel für höhere Ableitungen nennt sich auch Leibniz-Regel.

Natürlich sind auch Verknüpfungen von [latex]n[/latex]-mal differenzierbaren Funktionen [latex]n[/latex]-mal differenzierbar. Allerdings ist es im Gegensatz zum Produkt deutlich schwerer, hier eine explizite Formel anzugeben. Wir beschränken uns deswegen darauf, nur die Differenzierbarkeit zu formulieren.

Korollar 7.26: Verknüpfungen und höhere Differenzierbarkeit

Seien [latex]D,E \subseteq \mathbb {R}[/latex] Teilmengen, so dass jeder Punkt in [latex]D[/latex] respektive [latex]E[/latex] ein Häufungspunkt von [latex]D[/latex] respektive [latex]E[/latex] ist. Sei des Weiteren [latex]f: D \to E[/latex] eine [latex]n[/latex]-mal differenzierbare Funktion und sei [latex]g: E \to \mathbb {R}[/latex] eine [latex]n[/latex]-mal differenzierbare Funktion. Dann ist [latex]g \circ f: D \to \mathbb {R}[/latex] [latex]n[/latex]-mal differenzierbar.

Übung 7.27

Beweisen Sie die Korollare 7.25 und 7.26.

Hinweis.

Die [latex]n[/latex]-te Ableitung von [latex]g \circ f[/latex] ist eine Linearkombination von Funktionen der Form [latex]x\in D \mapsto g^{(k)}(f(x))\ (f')^{k_1}(x) \cdots (f^{(n)})^{k_n}(x)[/latex] für [latex]n \geq k,k_1,\ldots ,k_n\geq 0[/latex].

7.2 – Zentrale Sätze der Differentialrechnung

7.2.1 – Der Mittelwertsatz

Wir wenden uns nun allgemeinen Sätzen der Differentialrechnung und deren Konsequenzen zu. Unsere erste Frage wird sein, ob die Ableitung einer differenzierbaren Funktion die Steigung gewisser Sekanten annimmt, wobei folgender Satz unser Ausgangspunkt sein wird.

Satz 7.28: Rolle

Sei [latex][a,b][/latex] ein kompaktes Intervall mit [latex]a

In Worten besagt der Satz von Rolle also, dass wenn eine «schöne» Funktion auf einem Intervall an den Endpunkten den selben Wert annimmt, die Steigung irgendwo (strikt) zwischen den Endpunkten Null sein muss. Wir veranschaulichen dies in folgendem Bild, das bereits einen Hinweis enthält, wie wir im Beweis vorgehen wollen.

image
Beweis

Nach dem Extremwertsatz (Korollar 3.72) werden Minimum und Maximum von [latex]f[/latex] auf [latex][a,b][/latex] angenommen. Das heisst, es existieren [latex]x_{\min },x_{\max } \in [a,b][/latex] mit

[latex]
\begin{aligned}[]f(x_{\min }) = \min f([a,b]),\quad f(x_{\max } ) = \max f([a,b]).\end{aligned}
[/latex]

Nach Proposition 7.17 muss die Ableitung von [latex]f[/latex] bei allen Extrema in [latex](a,b)[/latex] Null sein. Falls also [latex]x_{\min } \in (a,b)[/latex] oder [latex]x_{\max } \in (a,b)[/latex] gilt, dann haben wir bereits ein [latex]\xi \in (a,b)[/latex] gefunden mit [latex]f'(\xi ) = 0[/latex] (wobei [latex]\xi = x_{\min }[/latex] oder [latex]\xi = x_{\max }[/latex] ist). Falls aber [latex]x_{\min }[/latex] und [latex]x_{\max }[/latex] Endpunkte des Intervalles sind, dann muss wegen [latex]f(a) = f(b)[/latex] auch [latex]f(x_{\min })=f(x_{\max })[/latex] gelten, womit die Funktion [latex]f[/latex] konstant und [latex]f'(x) =0[/latex] für alle [latex]x \in (a,b)[/latex] ist. ∎

Der Satz von Rolle führt unmittelbar zu folgendem fundamentalen Satz.

Theorem 7.29: Mittelwertsatz

Sei [latex][a,b][/latex] ein kompaktes Intervall mit [latex]a

[latex]
\begin{aligned}[]f'(\xi ) = \frac {f(b)-f(a)}{b-a}.\end{aligned}
[/latex]

Somit gibt es also mindestens einen Punkt [latex]\xi[/latex], an dem die Steigung [latex]f'(\xi )[/latex] der durchschnittlichen Steigung [latex]\frac {f(b)-f(a)}{b-a}[/latex], also der Steigung der Sekante durch [latex](a,f(a))[/latex] und [latex](b,f(b))[/latex] entspricht. Wir stellen dies in einem Bild dar.

image

Der Beweis des Mittelwertsatzes adaptiert die Werte von [latex]f[/latex] auf eine (affin) lineare Weise, um danach den Satz von Rolle (Satz 7.28) anwenden zu können. In der Tat behandelt der Satz von Rolle genau den Spezialfall [latex]f(a) = f(b)[/latex]. Wenn wir in obigem Bild die Funktion rechts «nach unten ziehen» , können wir genau diesen Spezialfall verwenden.

Beweis

Wir definieren eine Funktion [latex]F:[a,b] \to \mathbb {R}[/latex] durch

[latex]
\begin{aligned}[]F(x) = f(x) - \frac {f(b)-f(a)}{b-a} (x-a)\end{aligned}
[/latex]

für alle [latex]x \in [a,b][/latex]. Dann gilt [latex]F(a) = f(a)[/latex] und [latex]F(b) = f(b) - (f(b)-f(a)) = f(a)[/latex]. Des Weiteren ist [latex]F[/latex] stetig an den Endpunkten und differenzierbar auf [latex](a,b)[/latex] nach Proposition 7.5. Nach dem Satz von Rolle (Satz 7.28) existiert also ein [latex]\xi \in (a,b)[/latex] mit

[latex]
\begin{aligned}[]0 = F'(\xi ) = f'(\xi ) - \frac {f(b)-f(a)}{b-a}\end{aligned}
[/latex]

wie gewünscht. ∎

Übung 7.30: Intervall als Voraussetzung

Zeigen Sie anhand eines Beispiels die Notwendigkeit der Voraussetzung im Mittelwertsatz (Theorem 7.29), dass der Definitionsbereich [latex]D[/latex] der Funktion [latex]f:D \to \mathbb {R}[/latex] ein Intervall ist.

Übung 7.31: Lipschitz-Stetigkeit differenzierbarer Funktionen

Sei [latex][a,b][/latex] ein kompaktes Intervall mit Endpunkten [latex]a

Der Mittelwertsatz (Theorem 7.29) wird zu einem zentralen Tool für die folgenden Diskussionen werden. Da wir die Ableitung auch für komplexwertige Funktionen definiert haben und in Beispiel 7.3(iii) auch schon für eine spezielle Funktion berechnet haben, wollen wir in folgendem Beispiel zeigen, dass der Mittelwertsatz nur für reellwertige Funktionen und nicht für komplexwertige Funktionen zutrifft.

Beispiel 7.32: Kreisparametrisierung

Sei [latex]\gamma : [0,2\pi ] \to \mathbb {C}[/latex] die Abbildung (besser: die Kurve) gegeben durch

[latex]
\begin{aligned}[]\gamma :t\in [0,2\pi ]\mapsto e^{t \mathrm {i}} = \cos (t) + \mathrm {i} \sin (t)\end{aligned}
[/latex]

Nach Beispiel 7.3(iii) ist die Ableitung gegeben durch [latex]\gamma '(t) = \mathrm {i} e^{t \mathrm {i}}[/latex]. An den Endpunkten des Intervalles [latex][0,2\pi ][/latex] gilt [latex]\gamma (0) = \gamma (2\pi ) =1[/latex]. Die Ableitung von [latex]\gamma[/latex] nimmt jedoch nie den Wert Null an, denn es gilt [latex]|\gamma '(\xi )| = 1[/latex] für alle [latex]\xi \in [0,2\pi ][/latex]. Somit können die Aussagen des Satzes von Rolle (Satz 7.28) und des Mittelwertsatzes (Theorem 7.29) für komplexwertige Funktionen in dieser Allgemeinheit nicht zutreffen.

7.2.2 – Korollare des Mittelwertsatzes und Kurvendiskussion

Der Mittelwertsatzes erlaubt es uns nun, uns bekannte Eigenschaften von Funktionen mittels der Ableitung zu charakterisieren.

Korollar 7.33: Kriterium für Konstanz

Sei [latex]I\subseteq \mathbb {R}[/latex] ein Intervall mit Endpunkten [latex]a

Beweis

Wir wissen bereits, dass die Ableitung einer konstanten Funktion die Nullfunktion ist. Also angenommen es gilt [latex]f'(x) = 0[/latex] für alle [latex]x\in I[/latex]. Seien [latex]x_17.29) angewendet auf [latex]f|_{[x_1,x_2]}:[x_1,x_2] \to \mathbb {R}[/latex], dass es ein [latex]\xi \in (x_1,x_2) \subseteq I[/latex] gibt mit [latex]f(x_2)-f(x_1) = f'(\xi ) (x_2-x_1)[/latex]. Es gilt aber [latex]f'(\xi ) = 0[/latex] und damit [latex]f(x_1) = f(x_2)[/latex]. Die Punkte [latex]x_1,x_2 \in I[/latex] waren jedoch beliebig, also folgt die Aussage. ∎

Übung 7.34: Charakterisierung von Polynomen

Sei [latex]I\subseteq \mathbb {R}[/latex] ein Intervall mit Endpunkten [latex]a

Hinweis.

Verwenden Sie Korollar 7.33 und eine geeignete Induktion für die Rückrichtung.

Im Folgenden werden wir den Mittelwertsatz, wie schon im obigen Beweis von Korollar 7.33, oft auf zwei verschiedene Punkte [latex]x_1,x_2[/latex] in einem Intervall anwenden, was jeweils zu einem neuen Punkt [latex]\xi[/latex] strikt zwischen [latex]x_1[/latex] und [latex]x_2[/latex] mit [latex]f'(\xi )= \frac {f(x_2)-f(x_1)}{x_2-x_1}=\frac {f(x_1)-f(x_2)}{x_1-x_2}[/latex] führt.

Korollar 7.35: Kriterium für Monotonie

Sei [latex]I\subseteq \mathbb {R}[/latex] ein nicht-leeres Intervall und [latex]f:I \to \mathbb {R}[/latex] eine differenzierbare Funktion. Dann gilt

[latex]
\begin{aligned}[]\big (\forall x\in I: f'(x)\geq 0\big ) &\implies f \text { ist monoton wachsend} \\ \big (\forall x\in I: f'(x) > 0\big ) &\implies f \text { ist streng monoton wachsend} \\ \big (\forall x\in I: f'(x) \leq 0\big ) &\implies f \text { ist monoton fallend} \\ \big (\forall x\in I: f'(x) [/latex]
Beweis

Dies folgt unmittelbar aus dem Mittelwertsatz (Theorem 7.29), da für zwei Punkte [latex]x_1

Zwei (aber nur zwei) dieser Implikationen sind sogar Äquivalenzen, wie folgende Übung zeigt.

Wichtige Übung 7.36: Exakte Charakterisierung von Monotonie

Sei [latex]I \subseteq \mathbb {R}[/latex] ein nicht-leeres Intervall und [latex]f: I \to \mathbb {R}[/latex] eine differenzierbare Funktion. Zeigen Sie, dass

[latex]
\begin{aligned}[]\big (\forall x\in I: f'(x)\geq 0\big ) &\iff f \text { ist monoton wachsend} \\ \big (\forall x\in I: f'(x)\leq 0\big ) &\iff f \text { ist monoton fallend}\end{aligned}
[/latex]

Untersuchen Sie weiter das Beispiel [latex]f:x \in \mathbb {R} \mapsto x^3 \in \mathbb {R}[/latex].

Hinweis.

Wir haben die nötige Argumentation für die Umkehrung bereits in Proposition 7.17 verwendet.

Korollar 7.37: Hinreichende Kriterien für lokale Extrema

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall mit Endpunkten [latex]a

  • Angenommen der linke Endpunkt [latex]a[/latex] liegt in [latex]I[/latex].
    • Falls [latex]f'(a) > 0[/latex] erfüllt ist, dann hat [latex]f[/latex] in [latex]a[/latex] ein isoliertes lokales Minimum.
    • Falls [latex]f'(a)
  • Beim Punkt [latex]x_0 \in I[/latex] gelten folgende Kriterien.
    • Falls ein [latex]\delta >0[/latex] existiert, so dass [latex]f'(x) > 0[/latex] für alle [latex]x \in (x_0-\delta ,x_0+\delta )\setminus \left \lbrace {x_0} \right \rbrace[/latex] (oder [latex]f'(x)
    • Falls ein [latex]\delta >0[/latex] existiert, so dass [latex]f'(x) > 0[/latex] für alle [latex]x \in (x_0-\delta ,x_0)[/latex] und [latex]f'(x)
    • Falls ein [latex]\delta >0[/latex] existiert, so dass [latex]f'(x) 0[/latex] für alle [latex]x \in (x_0,x_0+\delta )[/latex], dann nimmt [latex]f[/latex] in [latex]x_0[/latex] ein isoliertes lokales Minimum an.
    • Falls [latex]f[/latex] auf ganz [latex]I[/latex] zweimal stetig differenzierbar ist und [latex]f'(x_0) = 0[/latex] sowie [latex]f''(x_0)
    • Falls [latex]f[/latex] auf ganz [latex]I[/latex] zweimal stetig differenzierbar ist und [latex]f'(x_0) = 0[/latex] sowie [latex]f''(x_0) > 0[/latex] gilt, dann nimmt [latex]f[/latex] in [latex]x_0[/latex] ein isoliertes lokales Minimum an.
  • Angenommen der rechte Endpunkt [latex]b[/latex] liegt in [latex]I[/latex].
    • Falls [latex]f'(b) > 0[/latex] erfüllt ist, dann hat [latex]f[/latex] in [latex]b[/latex] ein isoliertes lokales Maximum.
    • Falls [latex]f'(b)

Auf Grund der Vielzahl obiger Kriterien möchten wir hier erwähnen, dass man sich dieses Korollar viel eher merken kann, wenn man es (anhand eines Bildes und des Beweises) verstanden hat, als wenn man es auswendig lernen möchte.

Beweis

Die Beweise dieser Aussagen sind alle sehr ähnlich und beruhen in sämtlichen Fällen auf dem Mittelwertsatz. Sei [latex]a \in I[/latex] der linke Endpunkt und angenommen [latex]f'(a) > 0[/latex]. Dann existiert wegen der Stetigkeit von [latex]f'[/latex] ein [latex]\delta > 0[/latex], so dass für alle [latex]x \in [a,a+\delta )[/latex] ebenso [latex]f'(x) > 0[/latex] gilt. Für jedes [latex]x \in [a,a+\delta )[/latex] existiert nun nach dem Mittelwertsatz (Theorem 7.29) ein [latex]\xi \in (a,x)[/latex] mit

[latex]
\begin{aligned}[]f(x) -f(a) = f'(\xi ) (x-a) > 0.\end{aligned}
[/latex]

Dies zeigt, dass [latex]f[/latex] in [latex]a[/latex] ein lokales Minimum annimmt. Der Fall [latex]f'(a)

Für [latex]x_0[/latex] gilt auf Grund des gleichen Arguments für jedes [latex]\delta >0[/latex]

[latex]
\begin{aligned}[]\forall x \in (x_0-\delta ,x_0): f'(x) > 0 &\implies \forall x \in (x_0-\delta ,x_0): f(x) {\; 0 &\implies \forall x \in (x_0,x_0+\delta ): f(x) > f(x_0) \\ \forall x \in (x_0-\delta ,x_0): f'(x) {\; f(x_0) \\ \forall x \in (x_0,x_0+\delta ): f'(x) {\; [/latex]

Durch Kombination dieser Aussagen ergeben sich das erste, zweite und dritte Kriterium für [latex]x_0[/latex].

Angenommen [latex]f[/latex] ist auf ganz [latex]I[/latex] zweimal stetig differenzierbar und [latex]f'(x_0) = 0[/latex] sowie [latex]f''(x_0) 0[/latex] so dass [latex]f''(x)7.35 ist [latex]f'|_{(x_0-\delta ,x_0+\delta )}[/latex] streng monoton fallend und somit nimmt [latex]f[/latex] nach dem zweiten Kriterium für [latex]x_0[/latex] in [latex]x_0[/latex] ein isoliertes lokales Maximum an. Das fünfte Kriterium für [latex]x_0[/latex] folgt wiederum analog. ∎

7.2.3 – Konvexität

Definition 7.38: Konvexität und Konkavität

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall und [latex]f:I \to \mathbb {R}[/latex] eine Funktion. Dann heisst [latex]f[/latex] konvex, falls
[latex]
\begin{aligned}[]\label{eq:abl-defkonvex} f\big ((1-t)x_0+tx_1\big ) \leq (1-t) f(x_0) + tf(x_1)\end{aligned}
[/latex]
für alle [latex]x_0,x_1 \in I[/latex] und für alle [latex]t \in [0,1][/latex]. Wir sagen, dass [latex]f[/latex] streng konvex ist, falls in (7.6) eine strikte Ungleichung gilt, wenn immer [latex]x_0 \neq x_1[/latex] und [latex]t \in (0,1)[/latex] (in diesem Falls ist [latex](1-t)x_0+tx_1[/latex] echt zwischen [latex]x_0[/latex] und [latex]x_1[/latex]). Eine Funktion [latex]g:I \to \mathbb {R}[/latex] heisst (streng) konkav, wenn [latex]f = -g[/latex] (streng) konvex ist.

image

Abbildung 7.3 – Anschaulich formuliert ist eine Funktion konvex [latex]x_0[/latex] , wenn ihr Graph jeweils unterhalb der Strecke zwischen zwei Punkten auf dem Graphen bleibt. Wie wir in Kürze sehen werden, kann man die konvexen Funktionen als solche sehen, deren Graphen aufwärts gekrümmt sind, wie ebenfalls in diesem Bild ersichtlich ist.

Konvexe Funktionen sind unter anderem nützlich, weil sie bei verschiedenen Ungleichungen zum Vorschein treten. Wir bemerken, dass auf Grund der Definition von Konkavität die Resultate dieses Unterabschnitts für konvexe Funktionen auf ähnlichen Weise auf konkave Funktionen zutreffen. Nun beginnen wir damit Konvexität auf eine andere Art zu charakterisieren.

Lemma 7.39: Konvexität via Steigung von Sekanten

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall und [latex]f:I \to \mathbb {R}[/latex] eine Funktion. Die Funktion [latex]f[/latex] ist genau dann konvex, wenn für alle [latex]x,x_0,x_1 \in I[/latex] gilt

[latex]
\begin{aligned}[]x_0 [/latex]

Des Weiteren ist [latex]f[/latex] genau dann streng konvex, wenn

[latex]
\begin{aligned}[]x_0 [/latex]

gilt.

In Worten ausgedrückt besagt das Lemma insbesondere, dass für eine konvexe Funktion die Steigung der Sekanten zwischen Punkten [latex]x_07.3.

Beweis

Für Punkte [latex]x_07.6) für alle [latex]t \in (0,1)[/latex] genau dann, wenn

[latex]
\begin{aligned}[]f(x) \leq \frac {x_1-x}{x_1-x_0}f(x_0) + \frac {x-x_0}{x_1-x_0}f(x_1).\end{aligned}
[/latex]

für alle [latex]x \in (x_0,x_1)[/latex] gilt. Letzteres ist wiederum äquivalent zu

[latex]
\begin{aligned}[](x_1-x_0) f(x) \leq (x_1-x)f(x_0) + (x-x_0) f(x_1)\end{aligned}
[/latex]

für alle [latex]x \in (x_0,x_1)[/latex], was genau dann gilt, wenn

[latex]
\begin{aligned}[](x_1-x)(f(x)-f(x_0)) \leq (x-x_0)(f(x_1)-f(x)).\end{aligned}
[/latex]

für alle [latex]x \in (x_0,x_1)[/latex]. Dies ist aber zu [latex]\frac {f(x)-f(x_0)}{x-x_0} \leq \frac {f(x_1)-f(x)}{x_1-x}[/latex] äquivalent, wie gewünscht.

Im Falle der strengen Konvexität können wir alle «[latex]\leq[/latex]» in obigem Beweis durch «[latex]

Für differenzierbare Funktion existiert folgende, sehr direkte Charakterisierung der Konvexität, welche erklärt, warum (differenzierbare) konvexe Funktionen aufwärts gekrümmte Graphen besitzen.

Proposition 7.40: Kriterium für Konvexität

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall mit Endpunkten [latex]a

Beweis

Der Beweis beruht auf dem Mittelwertsatz (Theorem 7.29) und der Charakterisierung von konvexen Funktionen in Lemma 7.39. Denn für drei Punkte [latex]x_0

[latex]
\begin{aligned}[]f'(\xi _1) = \frac {f(x)-f(x_0)}{x-x_0},\quad f'(\xi _2) = \frac {f(x_1)-f(x)}{x_1-x}\end{aligned}
[/latex]

Falls nun [latex]f'[/latex] (streng) monoton wachsend ist, dann ist [latex]f'(\xi _1) \leq f'(\xi _2)[/latex] (respektive [latex]f'(\xi _1) 7.39.

Angenommen [latex]f[/latex] ist konvex und [latex]x_07.39, dass für alle [latex]h \in (0,\frac {1}{2}(x_1-x_0))[/latex] gilt

[latex]
\begin{aligned}[]\frac {f(x_0+h)-f(x_0)}{h} \leq \frac {f(x_1-h)-f(x_0+h)}{(x_1-h)-(x_0+h)} \leq \frac {f(x_1)-f(x_1-h)}{h},\end{aligned}
[/latex]

woraus mit [latex]h \searrow 0[/latex]

[latex]
\begin{aligned}[]f'(x_0) \leq \frac {f(x_1)-f(x_0)}{x_1-x_0} \leq f'(x_1)\end{aligned}
[/latex]

folgt. Wir verweisen auf Übung 7.41 für den letzten Beweisschritt (der weniger häufig für Anwendungen von Bedeutung ist). ∎

Übung 7.41: Strenge Konvexität

Seien [latex]f,I[/latex] wie in Proposition 7.40. Angenommen [latex]f[/latex] ist streng konvex. Zeigen Sie, dass [latex]f'[/latex] streng monoton wachsend ist.

Hinweis.

Betrachten Sie zusätzlich zu [latex]x_17.39.

Aus Proposition 7.40 und Korollar 7.35 ergibt sich folgendes Korollar.

Korollar 7.42: Konvexität und die zweite Ableitung

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall mit Endpunkten [latex]a 0[/latex] für alle [latex]x \in I[/latex], dann ist [latex]f[/latex] streng konvex.

Beispiel 7.43

Die Funktion [latex]f:x \in (0,\infty ) \mapsto x \log (x)[/latex] ist streng konvex. Dies ergibt sich aus Korollar 7.42, da [latex]f[/latex] glatt ist und

[latex]
\begin{aligned}[]f'(x) = \log (x) + x \frac {1}{x} = \log (x) + 1,\quad f''(x) = \frac {1}{x}> 0.\end{aligned}
[/latex]

für alle [latex]x > 0[/latex]. Des Weiteren wissen wir bereits aus Beispiel 5.76, dass [latex]\lim _{x \to 0} x \log (x) = 0[/latex]. Zuletzt bemerken wir, dass [latex]\lim _{x \to 0} f'(x) = - \infty[/latex], was alles im Graphen von [latex]f[/latex] ersichtlich ist.

image

Lemma 7.44: Jensensche Ungleichung

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall und [latex]f:I \to \mathbb {R}[/latex] eine konvexe Funktion. Seien [latex]n \in \mathbb {N}[/latex], [latex]x_1,x_2,\ldots ,x_n \in I[/latex] und [latex]t_1,t_2,\ldots ,t_n \in [0,1][/latex] mit [latex]\sum _{k=1}^n t_k = 1[/latex]. Dann gilt
[latex]
\begin{aligned}[]\label{eq:abl-jensen ineq} f \bigg ( \sum _{k=1}^n t_k x_k \bigg ) \leq \sum _{k=1}^n t_k f(x_k).\end{aligned}
[/latex]

Beweis

Wir verwenden Induktion über [latex]n \geq 2[/latex]. Für [latex]n=1[/latex] haben wir [latex]\sum _{k=1}^1 t_k x_k = x_1[/latex], [latex]\sum _{k=1}^1 t_k f(x_k) = f(x_1)[/latex] und (7.7) ist trivialerweise erfüllt. Für [latex]n=2[/latex] ist (7.7) gerade (7.6) (mit [latex]t_1=1-t[/latex] und [latex]t_2=t\in [0,1][/latex]). Angenommen die Aussage ist für [latex]n \geq 2[/latex] erfüllt. Seien [latex]x_1,\ldots ,x_{n+1} \in I[/latex] und [latex]t_1,\ldots ,t_{n+1} \in [0,1][/latex]. Falls [latex]t_{n+1} = 0[/latex] folgt (7.7) direkt aus der Annahme für [latex]n[/latex]. Also angenommen [latex]t_{n+1} > 0[/latex]. Dann gilt

[latex]
\begin{aligned}[]f \bigg (\sum _{k=1}^{n+1}t_kx_k\bigg ) &= f \bigg ( \sum _{k=1}^{n-1}t_kx_k+(t_{n}+t_{n+1})\left ( \frac {t_{n}}{t_{n}+t_{n+1}} x_{n} + \frac {t_{n+1}}{t_{n}+t_{n+1}}x_{n+1} \right ) \bigg )\\ &\leq \sum _{k=1}^{n-1}t_kf(x_k)+ (t_{n}+t_{n+1}) f\left ( \frac {t_{n}}{t_{n}+t_{n+1}} x_{n} + \frac {t_{n+1}}{t_{n}+t_{n+1}}x_{n+1} \right ) \\ &\leq \sum _{k=1}^{n-1}t_kf(x_k)+(t_{n}+t_{n+1}) \left ( \frac {t_{n}}{t_{n}+t_{n+1}} f(x_{n}) + \frac {t_{n+1}}{t_{n}+t_{n+1}}f(x_{n+1}) \right )\\ &= \sum _{k=1}^{n+1}t_kf(x_k)\end{aligned}
[/latex]

per Induktionsannahme angewendet auf [latex]x_1,\ldots ,x_{n-1},\frac {t_n}{t_n+t_{n+1}}x_n+\frac {t_{n+1}}{t_n+t_{n+1}}x_{n+1}[/latex] und Konvexität von [latex]f[/latex]. ∎

Die Jensenschen Ungleichung hat zahlreiche Anwendungen und kann abhängig von der konvexen Funktion [latex]f[/latex] verschiedene Formen annehmen. Ein Beispiel dafür ist in der nächsten Übung enthalten.

Übung 7.45: Harmonisches, geometrisches und arithmetisches Mittel

Zeigen Sie die Ungleichung

[latex]
\begin{aligned}[]\frac {n}{\frac {1}{x_1}+\ldots +\frac {1}{x_n}} \leq \sqrt [n]{x_1\cdots x_n} \leq \frac {x_1+\ldots +x_n}{n}\end{aligned}
[/latex]

für das harmonische, das arithmetische und das geometrische Mittel von [latex]x_1,\ldots ,x_n \in \mathbb {R}_{>0}[/latex].

Hinweis.

Verifizieren Sie zuerst, dass [latex]x \in \mathbb {R}_{>0}\mapsto -\log (x)[/latex] konvex ist.

Auch für das Riemann-Integral gilt eine Version der Jensenschen Ungleichung.

Übung 7.46: Integralform der Jensenschen Ungleichung

Sei [latex]\varphi :[0,1] \to I[/latex] stetig und sei [latex]f:I \to \mathbb {R}[/latex] eine stetige, konvexe Funktion. Dann gilt

[latex]
\begin{aligned}[]f \left ( \int _0^1 \varphi (t)\thinspace {\rm {d}} t \right ) \leq \int _0^1 f(\varphi (t)) \thinspace {\rm {d}} t.\end{aligned}
[/latex]

Hinweis.

Verwenden Sie Riemann-Summen.

Wir schliessen die Diskussion von Konvexität mit folgenden Übungen.

Übung 7.47: Minima von konvexen Funktionen

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall und [latex]f: I \to \mathbb {R}[/latex] eine konvexe Funktion. Zeigen Sie, dass jedes lokale Minimum von [latex]f[/latex] ein (globales) Minimum ist.

7.2.4 – Mittelwertsatz nach Cauchy

Wir möchten nun den Mittelwertsatz etwas verallgemeinern.

Satz 7.48: Erweiterter Mittelwertsatz

Seien [latex]f[/latex] und [latex]g[/latex] stetige Funktionen auf einem Intervall [latex][a,b][/latex] mit [latex]a [latex]
\begin{aligned}[]\label{eq:abl-cauchy meanvaluethm} g'(\xi ) (f(b)-f(a)) = f'(\xi ) (g(b)-g(a)).\end{aligned}
[/latex]
Falls zusätzlich [latex]g'(x) \neq 0[/latex] für alle [latex]x \in (a,b)[/latex] gilt, dann gilt [latex]g(a) \neq g(b)[/latex] und

[latex]
\begin{aligned}[]\frac {f'(\xi )}{g'(\xi )} = \frac {f(b)-f(a)}{g(b)-g(a)}.\end{aligned}
[/latex]

Man beachte, dass der Mittelwertsatz (Theorem 7.29) gerade der Spezialfall [latex]g: x \in [a,b] \mapsto x[/latex] des obigen Satzes ist und man somit in der Tat von einem erweiteren Mittelwertsatz sprechen darf.

Bemerkung

Genau wie der Mittelwertsatz hat der Mittelwertsatz von Cauchy eine geometrische Interpretation, nur muss man dieses Mal in der zweidimensionalen Ebene suchen. Dort besagt der Mittelwertsatz von Cauchy unter den getroffenen Annahmen, dass die Kurve [latex]t \mapsto (f(t),g(t))[/latex] eine Tangente besitzt, die parallel zur Gerade durch die Punkte [latex](f(a),g(a))[/latex], [latex](f(b),g(b))[/latex] ist.

Beweis von Satz 7.48

Wir definieren eine Funktion [latex]F:[a,b] \to \mathbb {R}[/latex] durch

[latex]
\begin{aligned}[]F(x) = g(x) \big (f(b)-f(a)\big ) - f(x)\big (g(b)-g(a)\big )\end{aligned}
[/latex]

für alle [latex]x \in \mathbb {R}[/latex]. Dann gilt

[latex]
\begin{aligned}[]F(a) &= g(a)\big (f(b)-f(a)\big ) - f(a) \big (g(b)-g(a)\big ) = g(a)f(b)-f(a)g(b)\\ F(b) &= g(b)\big (f(b)-f(a)\big ) - f(b)\big (g(b)-g(a)\big ) = F(a).\end{aligned}
[/latex]

Nach dem Satz von Rolle (Satz 7.28) existiert somit ein [latex]\xi \in (a,b)[/latex] mit

[latex]
\begin{aligned}[]F'(\xi ) = g'(\xi ) (f(b)-f(a)) - f'(\xi )(g(b)-g(a)) = 0.\end{aligned}
[/latex]

Dies beweist die erste Behauptung (7.8) des Satzes.

Falls zusätzlich [latex]g'(x) \neq 0[/latex] für alle [latex]x \in (a,b)[/latex], dann folgt aus dem Satz von Rolle (Satz 7.28), dass [latex]g(b) \neq g(a)[/latex] (wieso?). Nach Division von (7.8) mit [latex]g'(\xi ) (g(b)-g(a))[/latex] ergibt sich die zweite Behauptung des Satzes. ∎

7.2.5 – Regel von de l’Hôpital

Die folgende Regel stellt eine einfache Anwendung des obigen erweiterten Mittelwertsatzes dar und macht die Berechnung von vielen konkreten Grenzwerten deutlich einfacher.

Satz 7.49: Regel von de l’Hôpital

Seien [latex]a

  • («[latex]\, \frac 00[/latex]» ) [latex]\lim _{x \searrow a} f(x) = \lim _{x \searrow a} g(x) = 0[/latex]
  • («[latex]\, \frac {\infty }{\infty }[/latex]» ) [latex]\lim _{x \searrow a} g(x) = +\infty[/latex] (oder [latex]\lim _{x \searrow a} g(x) = -\infty[/latex]).

Dann existiert auch der Grenzwert [latex]\lim _{x \searrow a} \frac {f(x)}{g(x)}[/latex] und es gilt

[latex]
\begin{aligned}[]\lim _{x \searrow a} \frac {f(x)}{g(x)} = \lim _{x \searrow a} \frac {f'(x)}{g'(x)}.\end{aligned}
[/latex]

Analoge Aussagen gelten für die Bewegungen [latex]x \nearrow b[/latex] oder [latex]x \to x_0 \in (a,b)[/latex]. Im letzten Fall erlauben wir [latex]g(x_0) =0[/latex] oder auch [latex]g'(x_0) = 0[/latex], solange [latex]g(x) \neq 0[/latex] und [latex]g'(x) \neq 0[/latex] für alle [latex]x \in (a,b) \setminus \left \lbrace {x_0} \right \rbrace[/latex].

Wir nennen «[latex]\frac 00[/latex]» und «[latex]\frac {\infty }{\infty }[/latex]» unbestimmte Formen, da wir bisher keine allgemeinen Werkzeuge hatten, um den Grenzwert von [latex]\frac {f(x)}{g(x)}[/latex] zu berechnen für den Fall, dass sowohl [latex]f(x)[/latex] als auch [latex]g(x)[/latex] beide gegen [latex]0[/latex] oder beide gegen [latex]\infty[/latex] streben. Obige Regel ist in diesen Fällen sehr oft nützlich und viel einfacher anwendbar als unsere bisherigen Berechnungen (siehe unter anderem Beispiel 5.76). Wie bereits erwähnt ist die Regel ein Korollar des erweiterten Mittelwertsatzes.

Beweis

Wir betrachten zuerst die Bewegung [latex]x \searrow a[/latex] für ein [latex]a\in \mathbb {R}[/latex] und setzen

[latex]
\begin{aligned}[]L = \lim _{x \searrow a} \frac {f'(x)}{g'(x)}\in \overline {\mathbb {R}}.\end{aligned}
[/latex]

Die unbestimmte Form «[latex]\frac 00[/latex]» : Angenommen es gilt [latex]\lim _{x \searrow a} f(x) = \lim _{x \searrow a} g(x) = 0[/latex]. In diesem Fall können wir also [latex]f[/latex] und [latex]g[/latex] stetig auf [latex][a,b)[/latex] fortsetzen, in dem wir [latex]f(a) = g(a) = 0[/latex] setzen. Da [latex]L = \lim _{x \searrow a} \frac {f'(x)}{g'(x)}[/latex] ist, können wir für eine beliebige Umgebung [latex]U[/latex] von [latex]L[/latex] ein [latex]y \in (a,b)[/latex] wählen mit [latex]\frac {f'(\xi )}{g'(\xi )} \in U[/latex] für alle [latex]\xi \in (a,y)[/latex]. Für ein beliebiges [latex]x \in (a,y)[/latex] wenden wir nun den erweiterten Mittelwertsatz (Satz 7.48) auf [latex][a,x][/latex] an und erhalten

[latex]
\begin{aligned}[]\frac {f(x)}{g(x)} = \frac {f(x)-f(a)}{g(x)-g(a)} = \frac {f'(\xi _x)}{g'(\xi _x)} \in U\end{aligned}
[/latex]

für ein [latex]\xi _x \in (a,x) \subseteq (a,y)[/latex]. Da die Umgebung [latex]U[/latex] von [latex]L[/latex] beliebig war, existiert der Grenzwert [latex]\lim _{x \searrow a}\frac {f(x)}{g(x)}[/latex] und ist gleich [latex]L[/latex]. Dies beweist den ersten Fall.

Die unbestimmte Form «[latex]\frac \infty \infty[/latex]» mit reellem Grenzwert: Wir nehmen an, dass der Nenner die Aussage [latex]\lim _{x \searrow a} g(x) = +\infty[/latex] (oder [latex]\lim _{x \searrow a} g(x) = -\infty[/latex]) erfüllt sowie der Grenzwert [latex]L\in \mathbb {R}[/latex] reell ist.[1]

Sei nun [latex]\varepsilon > 0[/latex]. Nach Definition von [latex]L[/latex] und der Annahme dieses Falles gibt es ein [latex]y_{\varepsilon } \in (a,b)[/latex] mit [latex]\big | \frac {f'(\xi )}{g'(\xi )}-L \big | 7.48) jeweils ein [latex]\xi _x \in (x,y_{\varepsilon }) \subseteq (a,y_{\varepsilon })[/latex] mit
[latex]
\begin{aligned}[]\label{eq:abl-delhopital0} \frac {f(x)-f(y_{\varepsilon })}{g(x)-g(y_{\varepsilon })} &= \frac {f'(\xi _x)}{g'(\xi _x)}\in (L-\varepsilon ,L+\varepsilon ),\end{aligned}
[/latex]
wobei [latex]g(x) \neq g(y_{\varepsilon })[/latex] auf Grund der zweiten Aussage in Satz 7.48 und unserer Annahmen an [latex]g[/latex]. Anders ausgedrückt erhalten wir also
[latex]
\begin{aligned}[]\label{eq:abl-delhopital1} \frac {f(x)}{g(x)-g(y_{\varepsilon })} &= \frac {f'(\xi _x)}{g'(\xi _x)} + \frac {f(y_{\varepsilon })}{g(x)-g(y_{\varepsilon })}.\end{aligned}
[/latex]
Intuitiv ausgedrückt ist hier die linke Seite etwa [latex]\frac {f(x)}{g(x)}[/latex] für [latex]x[/latex] sehr nahe an [latex]a[/latex], denn [latex]g(y_{\varepsilon })[/latex] ist fest gewählt während [latex]|g(x)|[/latex] beliebig gross wird. Des Weiteren ist die rechte Seite nahe an [latex]L[/latex], da [latex]\frac {f(y_{\varepsilon })}{g(x)-g(y_{\varepsilon })}[/latex] gegen Null geht für [latex]x \searrow a[/latex].

Formaler geht man wie folgt vor. Wir bemerken zuerst, dass (7.10) zu
[latex]
\begin{aligned}[]\frac {f(x)}{g(x)} &= \frac {f'(\xi _x)}{g'(\xi _x)} \frac {g(x)-g(y_\varepsilon )}{g(x)} + \frac {f(y_{\varepsilon })}{g(x)}\nonumber \\ &= \frac {f'(\xi _x)}{g'(\xi _x)} - \frac {f'(\xi _x)}{g'(\xi _x)}\frac {g(y_\varepsilon )}{g(x)} + \frac {f(y_{\varepsilon })}{g(x)}\label{eq:abl-delhopital2}\end{aligned}
[/latex]
für alle [latex]x \in (a,y_\varepsilon )[/latex] umgeformt werden kann. Da [latex]\lim _{x \searrow a} |g(x)| = \infty[/latex] gilt, existiert weiter ein [latex]\tilde {y}_\varepsilon \in (a,y_\varepsilon )[/latex], so dass

[latex]
\begin{aligned}[]\big ( |L| + \varepsilon \big ) \frac {|g(y_\varepsilon )|}{|g(x)|} [/latex]

für alle [latex]x \in (a,\tilde {y}_\varepsilon )[/latex]. Zusammenfassend gilt für ein [latex]x \in (a,\tilde {y}_\varepsilon )[/latex] und eine Wahl [latex]\xi _x \in (a,y_\varepsilon )[/latex] wie in (7.9) die Abschätzung

[latex]
\begin{aligned}[]\left |\frac {f'(\xi _x)}{g'(\xi _x)}\right |\leq \left |\frac {f'(\xi _x)}{g'(\xi _x)}-L\right |+|L|\leq |L|+\varepsilon\end{aligned}
[/latex]

und damit die Ungleichung

[latex]
\begin{aligned}[]\left | \frac {f(x)}{g(x)} -L \right | &\leq \left | \frac {f'(\xi _x)}{g'(\xi _x)}-L \right | + \left |\frac {f'(\xi _x)}{g'(\xi _x)}\frac {g(y_\varepsilon )}{g(x)}\right | + \left | \frac {f(y_\varepsilon )}{g(x)} \right |\\ & [/latex]

was zu beweisen war.

Die unbestimmte Form «[latex]\frac \infty \infty[/latex]» mit uneigentlichem Grenzwert: Wir nehmen nun an, dass [latex]L = \infty[/latex]. Dann lässt sich die Aussage nach kleinen Anpassungen analog wie oben beweisen. In der Tat existiert nach Annahme zu jedem [latex]\varepsilon > 0[/latex] ein [latex]y_{\varepsilon } \in (a,b)[/latex], so dass [latex]\frac {f'(\xi )}{g'(\xi )} > \frac {1}{\varepsilon }[/latex] für alle [latex]\xi \in (a,y_{\varepsilon })[/latex]. Für dieses fest gewählte [latex]y_{\varepsilon }[/latex] wählen wir nun ein [latex]\tilde {y}_{\varepsilon } \in (a,y_{\varepsilon })[/latex] mit [latex]\big |\frac {f(y_{\varepsilon }))}{g(x)-g(y_{\varepsilon })}\big |\frac 12[/latex] für alle [latex]x \in (a,\tilde {y}_{\varepsilon })[/latex]. Dann ist nach (7.10)

[latex]
\begin{aligned}[]\frac {f(x)}{g(x)}=\frac {g(x)-g(y_{\varepsilon })}{g(x)}\frac {f(x)}{g(x)-g(y_{\varepsilon })} \geq \frac 12\frac {f(x)}{g(x)-g(y_{\varepsilon })} > \frac 12\left (-1 + \frac {1}{\varepsilon }\right )=-\frac 12+\frac 1{2\varepsilon }.\end{aligned}
[/latex]

Daraus folgt die Aussage, da [latex]\varepsilon >0[/latex] beliebig war. Der Fall [latex]L = -\infty[/latex] lässt sich analog beweisen oder durch Vorzeichenwechsel von [latex]f[/latex] auf obigen Fall zurückführen.

Restliche Fälle: Wir beschäftigen uns nun mit den übrig bleibenden Fällen im Satz, die wir jeweils auf einen der obigen Fälle reduzieren können, in dem wir die unabhängige Variable [latex]x[/latex] im Definitionsbereich geeignet ersetzen.

Betrachtet man die Bewegung [latex]x \to b[/latex] für [latex]b = \infty[/latex], so lässt sich dieser Fall auf die vorherigen Fälle zurückführen. In der Tat können wir durch Einschränkung der Funktionen ohne Beschränkung der Allgemeinheit [latex]a>0[/latex] annehmen und die Funktionen

[latex]
\begin{aligned}[]F: x \in (0,\tfrac {1}{a}) \mapsto f(\tfrac {1}{x}), \quad G: x \in (0,\tfrac {1}{a}) \mapsto g(\tfrac {1}{x})\end{aligned}
[/latex]

definieren und nun stattdessen den Grenzwert [latex]\lim _{x\searrow 0}\frac {F(x)}{G(x)}[/latex] betrachten. Die weiteren Schritte überlassen wir hierbei den Leserinnen und Lesern — siehe Übung 7.50. Die Bewegungen [latex]x \nearrow b[/latex], [latex]x \to x_0[/latex] und [latex]x\to -\infty[/latex] lassen sich ebenso auf die bereits betrachteten Fälle zurückführen. ∎

Wichtige Übung 7.50

Vervollständigen Sie den obigen Beweis, indem Sie die Reduktionen in allen verbleibenden Fällen komplett ausführen.

Übung 7.51: Rechnen mit der Regel von de l’Hôpital

Berechnen Sie die Grenzwerte

[latex]
\begin{aligned}[]\lim _{x \to 0} \frac {2\sin (x)-\sin (2x)}{x- \sin (x)},\quad \lim _{x \to \infty } x^{\frac {1}{x}},\quad \lim _{x \to 0} \frac {\sin (x^2)}{x \tan (x)}.\end{aligned}
[/latex]

Übung 7.52

Sei [latex][a,b][/latex] ein abgeschlossenes Intervall mit [latex]a

Hinweis.

Sie können entweder den Mittelwertsatz oder die Regel von de l’Hôpital verwenden.

Wir möchten kurz anmerken, dass sich höhere Ableitungen mitunter zwar als einen direkten Grenzwert ausdrücken lassen, doch die Existenz dieses Grenzwertes nicht zur mehrmaligen Differenzierbarkeit äquivalent sein muss.

Übung 7.53: Zweite Ableitung als Grenzwert

Sei [latex]I=(a,b) \subseteq \mathbb {R}[/latex] ein Intervall mit [latex]a

[latex]
\begin{aligned}[]f''(x) = \lim _{h \to 0} \frac {f(x+h)-2f(x)+f(x-h)}{h^2}\end{aligned}
[/latex]

für alle [latex]x \in I[/latex]. Verifizieren Sie anhand der Vorzeichenfunktion [latex]x\in \mathbb {R} \mapsto \operatorname {sgn}(x)[/latex], dass die Existenz des obigen Grenzwerts nicht zweimalige Differenzierbarkeit impliziert.

7.3 – Trigonometrische Funktionen

7.3.1 – Sinus und Arkussinus

Nach Übung 7.4 sind [latex]\sin[/latex] und [latex]\cos[/latex] glatt und es gelten die Formeln
[latex]
\begin{aligned}[]\label{eq:abl-sincos derivative} (\sin (x))' = \cos (x),\quad (\cos (x))' = -\sin (x).\end{aligned}
[/latex]
Nach Satz 6.74 (genauer Übung 6.76) sind die Nullstellen von [latex]\sin :\mathbb {R} \to \mathbb {R}[/latex] die Menge [latex]\mathbb {Z}\pi[/latex] der ganzzahligen Vielfachen von [latex]\pi[/latex], womit nach dem Zwischenwertsatz und [latex]\sin \left (\frac {\pi }{2}\right ) = 1[/latex] folgt, dass [latex]\sin (x) > 0[/latex] für alle [latex]x \in (0,\pi )[/latex]. In diesem Intervall hat des Weiteren der Kosinus eine Nullstelle in [latex]\frac {\pi }{2}[/latex], ist positiv auf dem Intervall [latex]\left [0,\frac {\pi }{2}\right )[/latex] und negativ auf dem Intervall [latex]\left [\frac {\pi }{2},\pi \right )[/latex]. Verbinden wir dies, Gleichung (7.12) und das Kriterium für Monotonie differenzierbarer Funktion aus Korollar 7.35, so ergibt sich, dass [latex]\sin[/latex] auf dem Intervall [latex]\left [0,\frac {\pi }{2}\right ][/latex] streng monoton wachsend ist, auf dem Intervall [latex]\left [\frac {\pi }{2},\pi \right ][/latex] streng monoton fallend ist und auf dem Intervall [latex]\left [0,\pi \right ][/latex] konkav (also nach unten gekrümmt) ist.

Da der Sinus eine ungerade Funktion ist, ergibt sich des Weiteren, dass der Sinus auf [latex]\left [-\frac {\pi }{2},\frac {\pi }{2}\right ][/latex] streng monoton wachsend ist. Wir erkennen diese Eigenschaften direkt wieder im Graphen des Sinus.

image

Abbildung 7.4 – Der Graph des Sinus mit dem (Teil-)Graphen der Einschränkung [latex]\sin |_{\left [-\frac {\pi }{2},\frac {\pi }{2}\right ]}[/latex] hervorgehoben.

Die Einschränkung

[latex]
\begin{aligned}[]\sin |_{\left [-\frac {\pi }{2},\frac {\pi }{2}\right ]}: \left [-\frac {\pi }{2},\frac {\pi }{2}\right ] \to [-1,1],\ x \mapsto \sin (x)\end{aligned}
[/latex]

ist also streng monoton wachsend und bijektiv (nach dem Zwischenwertsatz). Die Umkehrfunktion bezeichnen wir mit

[latex]
\begin{aligned}[]\arcsin :[-1,1] \to \left [-\frac {\pi }{2},\frac {\pi }{2}\right ]\end{aligned}
[/latex]

und nennen wir den Arkussinus. Nach dem Satz über die Differenzierbarkeit der inversen Funktion (Satz 7.14) ist der Arkussinus bei [latex]s[/latex] differenzierbar, falls die Ableitung des Sinus bei [latex]x = \arcsin (s)[/latex] nicht Null ist. In der Tat verschwindet die Ableitung des Sinus [latex]\sin ' = \cos[/latex] genau an den Randpunkten [latex]-\frac {\pi }{2},\frac {\pi }{2}[/latex] von [latex]\left [-\frac {\pi }{2},\frac {\pi }{2}\right ][/latex]. Für [latex]x \in \left (-\frac {\pi }{2},\frac {\pi }{2}\right )[/latex] und [latex]s = \sin (x)[/latex] ergibt sich nach Satz 7.14

[latex]
\begin{aligned}[]\arcsin '(s) = \frac {1}{\cos (x)} = \frac {1}{\sqrt {1-s^2}},\end{aligned}
[/latex]

da [latex]\cos (x)[/latex] positiv ist für [latex]x \in \left (-\frac {\pi }{2},\frac {\pi }{2}\right )[/latex] und somit [latex]\cos (x) = \sqrt {1-\sin (x)^2} = \sqrt {1-s^2}[/latex] unter Verwendung von [latex]\sin (x)^2 + \cos (x)^2 = 1[/latex].

image

7.3.2 – Kosinus und Arkuskosinus

Die obige Diskussion über Monotonie des Sinus kann analog durchgeführt werden für den Kosinus. Es ergibt sich, dass der Kosinus bei [latex]0[/latex] ein lokales Extremum annimmt, auf dem Intervall [latex]\left [0,\pi \right ][/latex] streng monoton fallend ist, auf dem Intervall [latex]\left [-\frac {\pi }{2},\frac {\pi }{2}\right ][/latex] konkav ist und auf dem Intervall [latex]\left [\frac {\pi }{2},\pi \right ][/latex] konvex (nach oben gekrümmt) ist. Insbesondere ist die Einschränkung

[latex]
\begin{aligned}[]\cos |_{[0,\pi ]}: [0,\pi ] \to [-1,1]\end{aligned}
[/latex]

bijektiv.

image

Abbildung 7.5 – Der Graph des Kosinus mit hervorgehobenem (Teil-)Graphen der Einschränkung [latex]\cos |_{\left [0,\pi \right ]}[/latex] hervorgehoben.

Die Umkehrabbildung heisst Arkuskosinus und wird als

[latex]
\begin{aligned}[]\arccos : [-1,1] \to [0,\pi ]\end{aligned}
[/latex]

geschrieben.

Ebenso können wir die Ableitungsregeln für die Umkehrabbildung anwenden und erhalten bei [latex]s = \cos (x)[/latex] für [latex]x \in (0,\pi )[/latex]

[latex]
\begin{aligned}[]\arccos '(s) = \frac {1}{-\sin (x)} = - \frac {1}{\sqrt {1-s^2}},\end{aligned}
[/latex]

da der Sinus auf [latex](0,\pi )[/latex] positiv ist.

image

Wir möchten an dieser Stelle daran erinnern, dass sich jede Linearkombination von Sinus und Kosinus als ein Vielfaches des Sinus (oder des Kosinus) schreiben lässt (siehe die entsprechende Übung in Abschnitt 6.9.2).

7.3.3 – Tangens und Arkustangens

Da [latex]\sin (x+\pi ) = -\sin (x)[/latex] und [latex]\cos (x+\pi ) = -\cos (x)[/latex] für alle [latex]x \in \mathbb {R}[/latex] gilt, ergibt sich, dass [latex]\tan (x+\pi ) = \tan (x)[/latex] für alle [latex]x \in \mathbb {R} \setminus \left (\mathbb {Z}\pi + \frac {\pi }{2}\right )[/latex]. Des Weiteren ist

[latex]
\begin{aligned}[]\tan '(x) = \left ( \frac {\sin (x)}{\cos (x)}\right )' = \frac {\cos (x)\cos (x) - \sin (x) (-\sin (x))}{\cos ^2(x)} = \frac {1}{\cos ^2(x)}\end{aligned}
[/latex]

für alle [latex]x \in \mathbb {R} \setminus \left (\mathbb {Z}\pi + \frac {\pi }{2}\right )[/latex] nach der Quotientenregel in Korollar 7.11, Gleichung (7.12) und der trigonometrischen Identität [latex]\sin ^2(x) + \cos ^2(x) = 1[/latex]. Insbesondere ist der Tangens auf jedem Intervall der Form [latex]\left (n\pi -\frac {\pi }{2},n\pi + \frac {\pi }{2}\right )[/latex] für [latex]n \in \mathbb {Z}[/latex] streng monoton wachsend.

Des Weiteren gilt

[latex]
\begin{aligned}[]\lim _{x \nearrow \frac {\pi }{2}} \tan (x) = \lim _{x \nearrow \frac {\pi }{2}} \frac {\sin (x)}{\cos (x)} = +\infty\end{aligned}
[/latex]

wegen [latex]\sin \left (\frac {\pi }{2}\right ) =1[/latex], [latex]\cos \left (\frac {\pi }{2}\right ) = 0[/latex] und [latex]\cos (x) > 0[/latex] für [latex]x \in \left (-\frac {\pi }{2},\frac {\pi }{2}\right )[/latex], und

[latex]
\begin{aligned}[]\lim _{x \searrow -\frac {\pi }{2}} \tan (x) = \lim _{x \searrow -\frac {\pi }{2}} \frac {\sin (x)}{\cos (x)} = -\infty\end{aligned}
[/latex]

wegen [latex]\sin \left (-\frac {\pi }{2}\right ) =-1[/latex]. Wie zuvor folgt nun aus dem Zwischenwertsatz, dass die Einschränkung

[latex]
\begin{aligned}[]\tan |_{\left (-\frac {\pi }{2},\frac {\pi }{2}\right )}: \left (-\frac {\pi }{2},\frac {\pi }{2}\right ) \to \mathbb {R}\end{aligned}
[/latex]

bijektiv ist.

image

Abbildung 7.6 – Der Graph des Tangens mit hervorgehobener Einschränkung [latex]\tan |_{\left (-\frac {\pi }{2},\frac {\pi }{2}\right )}[/latex].

Die Umkehrabbildung

[latex]
\begin{aligned}[]\arctan : \mathbb {R} \to \left (-\frac {\pi }{2},\frac {\pi }{2}\right )\end{aligned}
[/latex]

wird als der Arkustangens bezeichnet.

image

Abbildung 7.7 – Der Graph des Arkustangens.

Nach Satz 7.14 ist der Arkustangens differenzierbar und es gilt bei [latex]x \in \left (-\frac {\pi }{2},\frac {\pi }{2}\right )[/latex] und [latex]s = \tan (x)[/latex]

[latex]
\begin{aligned}[]\arctan '(s) = \frac {1}{\frac {1}{\cos ^2(x)}} = \cos ^2(x).\end{aligned}
[/latex]

Des Weiteren gilt

[latex]
\begin{aligned}[]1 + s^2 = 1 + \frac {\sin ^2(x)}{\cos ^2(x)} = \frac {\cos ^2(x) + \sin ^2(x)}{\cos ^2(x)} = \frac {1}{\cos ^2(x)}.\end{aligned}
[/latex]

Daraus folgt schlussendlich, dass für alle [latex]s \in \mathbb {R}[/latex]

[latex]
\begin{aligned}[]\arctan '(s) = \frac {1}{1+s^2}\end{aligned}
[/latex]

gilt.

7.3.4 – Kotangens und Arkuskotangens

Der Kotangens respektive seine Umkehrfunktion, der Arkuskotangens, zeigen sehr ähnliches Verhalten gegenüber des Tangens respektive gegenüber des Arkustangens. Die Einschränkung [latex]\cot |_{(0,\pi )}: (0,\pi ) \to ~\mathbb {R}[/latex] ist streng monoton fallend und bijektiv. Die Umkehrabbildung

[latex]
\begin{aligned}[]\operatorname {arccot}: \mathbb {R} \to (0,\pi )\end{aligned}
[/latex]

wird Arkuskotangens genannt und hat die Ableitung

[latex]
\begin{aligned}[]\operatorname {arccot}'(s) = - \frac {1}{1+s^2}\end{aligned}
[/latex]

für alle [latex]s \in \mathbb {R}[/latex].

7.3.5 – Ein physikalisches Beispiel*

Beispiel 7.54: Brechungsgesetz von Snellius

Wir werden hier das Brechungsgesetz der geometrischen Optik von Snellius (1580-1624) aus dem Fermat-Prinzip herleiten. Dabei besagt das Fermat-Prinzip, dass das Licht immer den Weg der kürzesten Reisezeit wählt. Gegeben sei eine geradlinige Grenze zwischen zwei Medien (zum Beispiel Luft und Glas oder Luft und Wasser) und die Lichtgeschwindigkeit [latex]c_1[/latex] und [latex]c_2[/latex] in diesen beiden Medien. (Die universelle Naturkonstante [latex]c[/latex] ist die Lichtgeschwindigkeit im Vakuum.) Wir wählen einen Punkt [latex]Q[/latex] im ersten Medium als Lichtquelle und wollen den Weg, den das Licht zu einem Punkt [latex]A[/latex] im zweiten Medium nimmt, bestimmen.

image

Wir wählen unser Koordinatensystem so, dass die Grenze zwischen den beiden Medien genau die [latex]x[/latex]-Achse ist, [latex]Q[/latex] auf der positiven Hälfte der [latex]y[/latex]-Achse liegt und die [latex]x[/latex]-Koordinate von [latex]A[/latex] gleich [latex]a > 0[/latex] ist. Die Reisezeit des Lichts, das zuerst geradlinig von [latex]Q[/latex] nach [latex](x,0)[/latex] (ein Ort des möglichen Grenzübertritts) und dann «nach Brechung» von [latex](x,0)[/latex] nach [latex]A[/latex] geht, ist durch

[latex]
\begin{aligned}[]t(x) = \frac {1}{c_1}\sqrt {h_Q^2+x^2} + \frac {1}{c_2} \sqrt {h_A^2 + (a-x)^2}\end{aligned}
[/latex]

beschrieben. Die Funktion [latex]t: \mathbb {R} \to \mathbb {R},\ x \mapsto t(x)[/latex] ist auf ganz [latex]\mathbb {R}[/latex] differenzierbar (wir nehmen [latex]h_Q > 0[/latex] und [latex]h_A > 0[/latex] an) und die Abbildung ist durch

[latex]
\begin{aligned}[]t'(x) = \frac {x}{c_1 \sqrt {h_Q^2+x^2}} - \frac {a-x}{c_2 \sqrt {h_A^2 + (a-x)^2}}\end{aligned}
[/latex]

für alle [latex]x \in \mathbb {R}[/latex] gegeben. Diese verschwindet bei [latex]x \in \mathbb {R}[/latex] genau dann, wenn

[latex]
\begin{aligned}[]\frac {x}{c_1 \sqrt {h_Q^2+x^2}} &= \frac {a-x}{c_2 \sqrt {h_A^2 + (a-x)^2}},\\ \frac {\sin (\alpha _Q)}{c_1} &= \frac {\sin (\alpha _A)}{c_2}\\ \frac {\sin (\alpha _A)}{\sin (\alpha _Q)} &= \frac {c_2}{c_1},\end{aligned}
[/latex]

wobei [latex]\alpha _A[/latex] und [latex]\alpha _Q[/latex] die beiden Winkel in obigem Bild bei dem Punkt [latex](x,0)[/latex] sind. Wir bemerken noch, dass obige Gleichung in [latex]x[/latex] für genau ein [latex]x \in \mathbb {R}[/latex] erfüllt ist und [latex]t: \mathbb {R} \to \mathbb {R}[/latex] für dieses [latex]x_0 \in (0,a)[/latex] tatsächlich ein globales Minimum annimmt. Die letzte Gleichung, welche die Winkel [latex]\alpha _A,\alpha _Q[/latex] und die Lichtgeschwindigkeiten [latex]c_1,c_2[/latex] in Verbindung bringt, wird das Brechungsgesetz von Snellius genannt.

Übung 7.55

Beweisen Sie die letzte Aussage in Beispiel 7.54.

Hinweis: Kann die Gleichung für [latex]x \leq 0[/latex] oder [latex]x \geq a[/latex] erfüllt sein? Verwenden Sie weiter, dass [latex]\alpha _Q = \arctan \left (\frac {x}{h_Q}\right ) \in \left (-\frac {\pi }{2},\frac {\pi }{2}\right )[/latex] streng monoton wachsend von [latex]x\in \mathbb {R}[/latex] abhängt und [latex]\alpha _A= \arctan \left (\frac {a-x}{h_A}\right ) \in \left (-\frac {\pi }{2},\frac {\pi }{2}\right )[/latex] streng monoton fallend von [latex]x\in \mathbb {R}[/latex] abhängt, wodurch [latex]\frac {\sin (\alpha _A)}{\sin (\alpha _Q)}[/latex] streng monoton fallend von [latex]x \in (0,a)[/latex] abhängt. Wir bemerken noch, dass [latex]\lim _{x \to \infty } t(x)= +\infty[/latex] und [latex]\lim _{x \to -\infty } t(x)= +\infty[/latex].

7.3.6 – Verwendung der trigonometrischen Funktionen

Ab jetzt werden wir die trigonometrischen Funktionen und all ihre Monotonieeigenschaften, ihre Ableitungen und auch die Ableitungen ihrer Umkehrabbildungen meist ohne Referenz auf diesen Abschnitt verwenden. Deswegen wollen wir die Ableitungsregeln hier nochmals zusammenfassen. Es gilt

[latex]
\begin{aligned}[]\sin '(x) = \cos (x), \quad &\cos '(x) = -\sin (x),\\ \tan '(x) = \frac {1}{\cos ^2(x)}, \quad &\cot '(x) = - \frac {1}{\sin ^2(x)},\\ \arcsin '(x) = \frac {1}{\sqrt {1-x^2}},\quad &\arccos '(x) = - \frac {1}{\sqrt {1-x^2}},\\ \arctan '(x) = \frac {1}{1+x^2}, \quad &\operatorname {arccot}'(x) = - \frac {1}{1+x^2}\end{aligned}
[/latex]

für [latex]x[/latex] im jeweiligen Definitionsbereich der betrachteten Funktion.

7.4 – Hyperbolische Funktionen

Wir möchten in diesem kurzen Abschnitt die zu Abschnitt 7.3 analoge Diskussion für die in Abschnitt 6.7.1 eingeführten hyperbolischen Funktionen durchführen. Wir erinnern daran, dass

[latex]
\begin{aligned}[]\sinh (x) = \frac {\mathrm {e}^x-\mathrm {e}^{-x}}{2},\quad \cosh (x) = \frac {\mathrm {e}^x+\mathrm {e}^{-x}}{2},\quad \tanh (x) = \frac {\sinh (x)}{\cosh (x)} = \frac {\mathrm {e}^{x}-\mathrm {e}^{-x}}{\mathrm {e}^{x}+\mathrm {e}^{-x}}\end{aligned}
[/latex]

für alle [latex]x \in \mathbb {R}[/latex].

7.4.1 – Der Areasinus Hyperbolicus

Nach Übung 7.4 gilt [latex]\sinh '(x) = \cosh (x) > 0[/latex] für alle [latex]x \in \mathbb {R}[/latex]. Somit ist also nach Korollar 7.35 der Sinus Hyperbolicus streng monoton wachsend. Da [latex]\lim _{x \to \infty } \sinh (x) = \infty[/latex] und [latex]\lim _{x \to -\infty } \sinh (x) = - \infty[/latex] gilt, erhalten wir nach dem Zwischenwertsatz 3.59, dass

[latex]
\begin{aligned}[]\sinh : \mathbb {R} \to \mathbb {R}\end{aligned}
[/latex]

streng monoton wachsend und bijektiv ist. Die Umkehrabbildung

[latex]
\begin{aligned}[]\operatorname {arsinh}: \mathbb {R} \to \mathbb {R}\end{aligned}
[/latex]

nennen wir den Areasinus Hyperbolicus. Nach dem Satz zur Differenzierbarkeit der inversen Funktion ist [latex]\operatorname {arsinh}[/latex] differenzierbar und es gilt für [latex]x \in \mathbb {R}[/latex] und [latex]s = \sinh (x)[/latex]

[latex]
\begin{aligned}[]\operatorname {arsinh}'(s) = \frac {1}{\cosh (x)} = \frac {1}{\sqrt {1+\sinh ^2(x)}} = \frac {1}{\sqrt {1+s^2}}.\end{aligned}
[/latex]

Der Areasinus Hyperbolicus besitzt im Gegensatz zu den Umkehrfunktionen [latex]\arcsin ,\arccos[/latex] und [latex]\arctan[/latex] eine geschlossene Form. In der Tat gilt

[latex]
\begin{aligned}[]\operatorname {arsinh}(s) = \log \left (s + \sqrt {1+s^2}\right )\end{aligned}
[/latex]

für alle [latex]s \in \mathbb {R}[/latex], wobei man beachten sollte, dass der Ausdruck rechts für alle [latex]s \in \mathbb {R}[/latex] Sinn ergibt. Kurzes Nachrechnen ergibt für [latex]s \in \mathbb {R}[/latex] und [latex]x = \log (s + \sqrt {1+s^2})[/latex]

[latex]
\begin{aligned}[]\frac {\mathrm {e}^x-\mathrm {e}^{-x}}{2} = \frac 12 \left (s + \sqrt {1+s^2} - \frac {1}{s + \sqrt {1+s^2}} \right ) = \frac 12 \bigg (s + \sqrt {1+s^2} - \frac {s - \sqrt {1+s^2}}{s^2 - 1-s^2} \bigg ) = s\end{aligned}
[/latex]

wie gewünscht.

7.4.2 – Der Areakosinus Hyperbolicus

Der Kosinus Hyperbolicus erfüllt [latex]\cosh '(x) = \sinh (x)[/latex] und [latex]\cosh ''(x) = \cosh (x) > 0[/latex] für alle [latex]x \in \mathbb {R}[/latex] nach Übung 7.4. Insbesondere ist der Kosinus Hyperbolicus streng konvex nach Korollar 7.42 und hat ein globales Minimum bei [latex]0[/latex] nach Korollar 7.37 (wieso?). Für [latex]x > 0[/latex] gilt [latex]\cosh '(x) > 0[/latex] und somit ist [latex]\cosh[/latex] auf [latex]\mathbb {R}_{\geq 0}[/latex] streng monoton wachsend. Da [latex]\cosh (0) =1[/latex] und [latex]\lim _{x \to \infty } \cosh (x) = + \infty[/latex], folgt, dass

[latex]
\begin{aligned}[]\cosh : \mathbb {R}_{\geq 0} \to \mathbb {R}_{\geq 1}\end{aligned}
[/latex]

streng monoton wachsend und bijektiv ist. Die Umkehrabbildung

[latex]
\begin{aligned}[]\operatorname {arcosh}: \mathbb {R}_{\geq 1} \to \mathbb {R}_{\geq 0}\end{aligned}
[/latex]

wird der Areakosinus Hyperbolicus genannt, ist auf [latex]\mathbb {R}_{>1}[/latex] differenzierbar und erfüllt

[latex]
\begin{aligned}[]\operatorname {arcosh}'(s) = \frac {1}{\sinh (x)}=\frac {1}{\sqrt {s^2-1}}\end{aligned}
[/latex]

für [latex]s > 1[/latex] und [latex]s= \cosh (x)[/latex] mit [latex]x>0[/latex]. Des Weiteren gilt

[latex]
\begin{aligned}[]\operatorname {arcosh}(s) = \log \left (s + \sqrt {s^2-1} \right )\end{aligned}
[/latex]

für alle [latex]s > 1[/latex]. Der Nachweis der obigen Eigenschaften des Areakosinus Hyperbolicus und der noch folgenden Eigenschaften überlassen wir Interessierten.

7.4.3 – Der Areatangens Hyperbolicus

Der Areatangens Hyperbolicus ist die Umkehrfunktion

[latex]
\begin{aligned}[]\operatorname {artanh}: (-1,1) \to \mathbb {R},\ x \mapsto \tfrac {1}{2}\log \left (\frac {1+x}{1-x}\right )\end{aligned}
[/latex]

der streng monoton wachsenden Bijektion

[latex]
\begin{aligned}[]\tanh : \mathbb {R} \to (-1,1).\end{aligned}
[/latex]

Des Weiteren ist nach dem Satz zur inversen Funktion (Satz 7.14) [latex]\operatorname {artanh}[/latex] differenzierbar und es gilt

[latex]
\begin{aligned}[]\operatorname {artanh}'(s) = \frac {1}{1-s^2}\end{aligned}
[/latex]

für alle [latex]s \in (-1,1)[/latex].

Übung 7.56

Verifizieren Sie die oben aufgestellten Behauptungen.

7.5 – Erste Differentialgleichungen

Eine Differentialgleichung ist eine Gleichung der Form [latex]F(y',y,x) =0[/latex], die eine reellwertige Funktion [latex]y = y(x)[/latex], ihre Ableitung [latex]y' = \frac {\thinspace {\rm {d}} y }{\thinspace {\rm {d}} x}[/latex] und die unabhängige Variable [latex]x[/latex] mittels einer reellwertigen Abbildung [latex]F[/latex] auf einer offenen Teilmenge von [latex]\mathbb {R}^3[/latex] verknüpft. Gesucht sind die Funktionen [latex]y:I\to \mathbb {R}[/latex], die die Gleichung [latex]F(y'(x),y(x),x)=0[/latex] für alle [latex]x\in I[/latex] erfüllen, wobei der Definitionsbereich [latex]I[/latex] der gesuchten Funktion [latex]y[/latex] ein Intervall [latex]I\subseteq \mathbb {R}[/latex] sein soll.

Da es normalerweise mehrere Lösungen gibt, verlangt man üblicherweise noch etwas mehr Information, nämlich den Wert der Funktion [latex]y(x_0) = y_0[/latex] bei einem fest gewählten Ausgangspunkt [latex]x_0 \in I[/latex]. Eine Differentialgleichung [latex]F(y',y,x) =0[/latex] gemeinsam mit der Bedingung [latex]y(x_0) = y_0[/latex] wird ein Anfangswertproblem genannt.

Um genau zu sein, nennt man eine Differentialgleichung [latex]F(y',y,x) =0[/latex] eine gewöhnliche Differentialgleichung erster Ordnung. Hier steht «gewöhnlich» dafür, dass wir nur eine unabhängige Variable verwenden. «Erster Ordnung» steht dafür, dass nur die erste (und keine höheren Ableitungen) der gesuchten Lösung in der durch [latex]F[/latex] gegebenen Gleichung erscheint. Wir werden häufig Differentialgleichungen der expliziten Form [latex]y' = f(y,x)[/latex] betrachten, wobei dann [latex]f[/latex] eine reellwertige Funktion darstellt, die auf einer offenen Teilmenge von [latex]\mathbb {R}^2[/latex] definiert sein soll.

Ein Beispiel einer solchen gewöhnlichen Differentialgleichung erster Ordnung ist die Gleichung [latex]y'=\frac {x}{y}[/latex]. Durch Anstarren der Gleichung lässt sich eine Lösung dieser Differentialgleichung erraten, nämlich [latex]y = x[/latex]. Wir stellen aber fest, dass es ausgehend von dieser Lösung nicht klar ist, ob es andere Lösungen gibt und wie solche aussehen könnten. Auch unklar ist, wie viele Lösungen vor und nach Angabe eines Anfangswert existieren (und ob überhaupt welche existieren). Wir begnügen uns in diesem Abschnitt mit der Betrachtung von einigen Spezialfällen und werden gegen Ende des zweiten Semesters nochmals ausführlicher auf das Thema der Differentialgleichungen eingehen.

Wir möchten kurz anmerken, dass gewöhnliche Differentialgleichungen (erster Ordnung und höherer Ordnungen) in vielen Gebieten der Mathematik und der Naturwissenschaften auftreten. Beispielsweise hat das Zerfallsgesetz der Physik, mit dem (unter anderem) die Anzahl [latex]N[/latex] Teilchen in einem radioaktiven Stoff beschrieben werden können, eine natürliche Beschreibung in der Differentialgleichung [latex]\dot {N}=\frac {\thinspace {\rm {d}} N}{\thinspace {\rm {d}} t}=-\lambda N[/latex] (für einen physikalischen Parameter [latex]\lambda >0[/latex]).[2]

Wir können uns die rechte Seite der Differentialgleichung [latex]y'=f(y,x)[/latex] auch als Richtungsfeld vorstellen, welches bei jedem Punkt [latex](x,y)[/latex] eine vorgegebene Steigung der gesuchten Lösung der Differentialgleichung angibt. Dieses Richtungsfeld können wir mit kleinen Strichen in der richtigen Steigung in einem Bild visualisieren; die gesuchte Lösung sollte dann einen Graphen besitzen, der bei jedem Punkt des Graphen den vorgegebenen Strich bei dem Punkt als Tangente besitzt. Noch umgangssprachlicher formuliert, gibt das Richtungsfeld unendlich viele bereits fertig verlegte Schienen in der Ebene an und die gesuchte Lösung eines Anfangswertproblems zeigt uns, wohin der Zug fährt, wenn er in einem bestimmten Punkt wegfährt und den vorgegebenen Schienen folgt. In dieser Formulierung können wir fragen, ob wir immer angeben können, wohin der Zug fährt oder ob es nicht vielleicht auch «Weichen im Richtungsfeld» geben könnte.

image

Abbildung 7.8 – Das Richtungsfeld zur Differentialgleichung [latex]y' = \frac {x}{y}[/latex].

Wir bemerken noch, dass das Lösen der Differentialgleichung, also das Auffinden der Lösung [latex]y=y(x)[/latex], mitunter schwierig ist, doch das Nachprüfen, ob eine Lösung vorliegt, auf Grund unserer Ableitungsregeln aus Abschnitt 7.1 meist sehr einfach ist.

Applet 7.57: Einige Richtungsfelder und Anfangswertprobleme

Wir betrachten einige Funktionen [latex]f[/latex], die verschiedene Richtungsfelder angeben, und die dazugehörigen Anfangswertprobleme für einen bewegbaren Startpunkt [latex](x_0,y_0)[/latex].

7.5.1 – Differenzengleichungen

Ein diskretes Analogon der Differentialgleichung [latex]y' = F(y,x)[/latex] ist die Differenzengleichung

[latex]
\begin{aligned}[]y(n+1) - y(n) = \triangle y(n) = F(y(n),n)\end{aligned}
[/latex]

für eine gesuchte Funktion [latex]y[/latex] auf [latex]\mathbb {N}_0[/latex] und eine gegebene Funktion [latex]F[/latex] auf [latex]\mathbb {R} \times \mathbb {N}_0[/latex]. Für diese Gleichung kann man rekursiv eine Lösung [latex]y[/latex] bestimmen, wenn man eine Anfangswertbedingung [latex]y(0) = y_0 \in \mathbb {R}[/latex] gegeben hat (siehe die Besprechung der Rekursion in Abschnitt 2.2). In der Tat können wir

[latex]
\begin{aligned}[]y(1) = y(0) + F(y(0),0), \quad y(2) = y(1)+F(y(1),1),\quad \ldots\end{aligned}
[/latex]

setzen und erhalten eine rekursiv bestimmte Lösung. Man beachte dabei, dass die Lösung eindeutig bestimmt ist (wieso?).

Die Differentialgleichung [latex]y' = F(y,x)[/latex] sollte als eine kontinuierliche Version der Differenzengleichung [latex]\triangle y(n) = F(y(n),n)[/latex] aufgefasst werden. Diese Analogie ist wohlgemerkt nicht ausschliesslich oberflächlich, sondern kann sowohl in der Praxis als auch in der Theorie zu wichtigen Ergebnissen führen.

Es kann zum Beispiel sein, dass man eigentlich an einem diskreten Problem interessiert ist, aber die einzelnen Schritte näherungsweise einer kleinen Zeitspanne [latex]\triangle x[/latex] in einem kontinuierlichen Problem entsprechen. In diesem Fall ist es manchmal einfacher, anstelle des diskreten Problems die entsprechende Differentialgleichung zu betrachten.

Umgekehrt kann es sein, dass ein Anfangswertproblem [latex]y' = F(y,x)[/latex], [latex]y(0) = y_0[/latex] auf dem Intervall [latex]I = [0,\infty )[/latex] gegeben ist, aber die Funktion [latex]F[/latex] zu kompliziert ist, um dieses mittels Standardfunktionen zu lösen. Stattdessen kann man in diesem Fall die Differentialgleichung in eine Differenzengleichung verwandeln. Sei also [latex]\triangle x = h > 0[/latex] eine kleine positive Zahl. Dann kann man eine Funktion [latex]\tilde {y}[/latex] auf [latex]\mathbb {N}_0 h[/latex] durch

[latex]
\begin{aligned}[]\tilde {y}(0) = y_0,\quad \tilde {y}(h) = \tilde {y}(0) + F(\tilde {y}(0),0)h,\quad \tilde {y}(2h) = \tilde {y}(h) + F(\tilde {y}(h),h)h,\quad \ldots\end{aligned}
[/latex]

definieren. Dabei hofft man, dass die gesuchte Lösung der Differentialgleichung [latex]y[/latex] und die Lösung obiger Differenzengleichung [latex]\tilde {y}[/latex] einander wegen

[latex]
\begin{aligned}[]y(0) &= y_0 = \tilde {y}(0),\\ \frac {y(h)-y(0)}{h} &\approx \frac {\thinspace {\rm {d}} y}{\thinspace {\rm {d}} x}(0) = F(y(0),0) = \frac {\tilde {y}(h)-\tilde {y}(0)}{h}\\ &\implies y(h) \approx \tilde {y}(h)\\ \frac {y(2h)-y(h)}{h} &\approx \frac {\thinspace {\rm {d}} y}{\thinspace {\rm {d}} x}(h) = F(y(h),h) \approx F(\tilde {y}(h),h) = \frac {\tilde {y}(2h)-\tilde {y}(h)}{h}\\ &\implies y(2h) \approx \tilde {y}(2h)\\ &\ldots\end{aligned}
[/latex]

ähnlich sind.

Diese Beschreibung ist natürlich bloss eine Heuristik (das Zeichen [latex]\approx[/latex] sollte dies ersichtlich machen). Sie kann jedoch in gewissen Fällen zu einer approximativen numerischen Lösung oder gar zu einem Beweis der Existenz einer Lösung führen.

Übung 7.58: Rekursive Näherung

Zeigen Sie, dass obige Heuristik für das Anfangswertproblem [latex]y'=y[/latex], [latex]y(0) =1[/latex] zu einer Lösung führt.

Hinweis.

Teilen Sie das Intervall [latex][0,x][/latex] in [latex]n[/latex] Teile und führen Sie obige Rekursion durch.

image

Abbildung 7.9 – Vergleich der rekursiv definierten approximativen Lösung [latex]\tilde {y}[/latex] (rote Punkte) mit linearer Interpolation (ebenfalls in Rot) zur Lösung [latex]y[/latex] in Blau. Das betrachtete Anfangswertproblem ist dabei [latex]y' = \frac {x}{y}[/latex], [latex]y(0) = 1[/latex], welches von [latex]y = \sqrt {x^{2}+1}[/latex] gelöst wird.

7.5.2 – Stammfunktionen

Eine der einfachsten Differentialgleichungen ist eine Gleichung der Form

[latex]
\begin{aligned}[]y' = f(x)\end{aligned}
[/latex]

für eine gegebene Funktion [latex]f:I \to \mathbb {R}[/latex] auf einem Intervall [latex]I\subseteq \mathbb {R}[/latex]. Eine Lösung [latex]F:I \to \mathbb {R}[/latex], das heisst, eine differenzierbare Funktion [latex]F:I \to \mathbb {R}[/latex] mit [latex]F'(x) = f(x)[/latex] für alle [latex]x \in I[/latex], wird eine Stammfunktion von [latex]f[/latex] genannt. Wir schreiben auch

[latex]
\begin{aligned}[]\int f(x) \thinspace {\rm {d}} x = F(x) + C,\end{aligned}
[/latex]

falls [latex]F' = f[/latex], wobei [latex]C\in \mathbb {R}[/latex] eine unbestimmte Konstante — die Integrationskonstante — ist. Wir bemerken, dass [latex]F(x)+C[/latex] auch [latex](F(x)+C)'=f(x)[/latex] erfüllt, falls [latex]F[/latex] eine Stammfunktion und [latex]C\in \mathbb {R}[/latex] eine Konstante ist. Wir bezeichnen [latex]\int f(x) \thinspace {\rm {d}} x[/latex] als das unbestimmte Integral. Dabei ist es noch nicht klar, inwiefern das unbestimmte Integral von der Wahl einer Stammfunktion von [latex]f[/latex] abhängt, und was die Integraldarstellung mit dem Riemann-Integral zu tun hat. Die Notation wird zum Teil in folgendem Lemma (und vollständig in Kapitel 8) erklärt.

Lemma 7.59: Integrationskonstante

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall, [latex]f:I \to \mathbb {R}[/latex] eine Funktion und [latex]F,F_1: I \to \mathbb {R}[/latex] Stammfunktionen von [latex]f[/latex]. Dann gibt es eine Konstante [latex]C \in \mathbb {R}[/latex] mit [latex]F_1 = F + C[/latex]. In anderen Worten, alle Lösungen von [latex]y'=f[/latex] sind gegeben durch die Formel [latex]y=F(x)+C[/latex], wenn wir die Konstante [latex]C\in \mathbb {R}[/latex] variieren.

Beweis

Sei [latex]G = F_1-F[/latex]. Dann ist [latex]G'(x) = F_1'(x)-F'(x) = f(x)-f(x) = 0[/latex] für alle [latex]x \in I[/latex]. Aber nach Korollar 7.33 des Mittelwertsatzes muss eine differenzierbare Funktion auf einem Intervall mit Ableitung Null konstant sein. Somit folgt [latex]G(x)=C[/latex] für ein [latex]C\in \mathbb {R}[/latex] und alle [latex]x\in I[/latex], und damit ebenso die Aussage. ∎

Das unbestimmte Integral bezeichnet per Definition die Umkehroperation zur Differentiation und die Integrationskonstante deutet an, dass wir jede weitere Stammfunktion erhalten können, indem wir zu einer bekannten Stammfunktion eine beliebige Konstante addieren.

Da wir bereits viele Ableitungsregeln (siehe Abschnitte 7.1 und 7.3) kennen, können wir diese rückwärts als Integrationsregeln (zur Bestimmung des unbestimmten Integrals) lesen. Wir werden dies systematisch im nächsten Kapitel besprechen und wollen hier nur einige erste Regeln ansprechen. Zum Beispiel gilt für [latex]s \in \mathbb {R}[/latex] (oder sogar für [latex]s\in \mathbb {C}[/latex])

[latex]
\begin{aligned}[]\int x^s \thinspace {\rm {d}} x = \left \lbrace \begin{array}{cl} \frac {1}{s+1}x^{s+1} + C & \text {falls } s \neq {-1} \\ \log |x|+ C & \text {falls } s=-1\end{array} \right .\end{aligned}
[/latex]

nach Beispiel 7.15,

[latex]
\begin{aligned}[]\int \exp (x) \thinspace {\rm {d}} x &= \exp (x) + C\\ \int \cos (x) \thinspace {\rm {d}} x &= \sin (x) + C\\ \int \sin (x) \thinspace {\rm {d}} x &= - \cos (x) + C\\ \int \sinh (x) \thinspace {\rm {d}} x &= \cosh (x) + C\\ \int \cosh (x) \thinspace {\rm {d}} x &= \sinh (x) + C\\ \int \frac {1}{\sqrt {1-x^2}} \thinspace {\rm {d}} x &= \arcsin (x) + C\\ \int \frac {1}{1+x^2} \thinspace {\rm {d}} x &= \arctan (x) + C\\ \int \frac {1}{\sqrt {1+x^2}}\thinspace {\rm {d}} x&=\operatorname {arsinh}(x)+C=\log \left (x + \sqrt {1+x^2}\right )+C\\ \int \frac {1}{\sqrt {x^2-1}}\thinspace {\rm {d}} x&=\operatorname {arcosh}(x)+C=\log \left (x + \sqrt {x^2-1} \right )+C\end{aligned}
[/latex]

nach Beispiel 7.3(iii), Übung 7.4(ii) und den Abschnitten 7.37.4.

Wir begnügen uns vorerst mit dieser Liste und besprechen im nächsten Kapitel weitere Methoden der Berechnung des unbestimmten Integrals, aber erst nachdem wir die Frage «Was hat das so definierte unbestimmte Integral mit dem Riemann-Integral zu tun?» beantwortet haben und dadurch noch mehr Motivation für die Betrachtung des unbestimmten Integral erhalten haben.

7.5.3 – Lineare Differentialgleichungen erster Ordnung

Der nächst einfache Typ einer Differentialgleichung besteht aus den linearen Differentialgleichungen erster Ordnung, welche von der Form
[latex]
\begin{aligned}[]\label{eq:abl-lin.diffglg 1.ord} y' +f(x) y = g(x)\end{aligned}
[/latex]
für zwei gegebene Funktionen [latex]f,g[/latex] besteht. In der Gleichung [latex]y' +f(x) y = g(x)[/latex] wird die Funktion [latex]g[/latex] auch die Störfunktion genannt. Falls die Störfunktion Null ist, nennen wir (7.13) homogen und sonst inhomogen.

Die Bezeichnung «linear» entstammt der Tatsache, dass sich Gleichung (7.13) in der Tat als ein lineares Gleichungssystem auf geeigneten Vektorräumen auffassen lässt. Informell sieht man schnell, dass die Abbildung [latex]y \mapsto y'+f(x)y[/latex] linear ist. Welche Vektorräume man dabei jedoch betrachten soll, hängt stark von den Eigenschaften der Funktionen [latex]f[/latex] und [latex]g[/latex] ab. Wir werden später etwas genauer auf diese Fragestellung eingehen, wenn wir allgemeiner Lösbarkeit von Differentialgleichungen diskutieren. Nun möchten wir aber eine Lösung von (7.13) finden, wobei wir zuerst den homogenen Fall thematisieren.

Lemma 7.60: Homogene lineare Differentialgleichungen erster Ordnung

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall, [latex]f:I \to \mathbb {R}[/latex] eine Funktion und [latex]F:I \to \mathbb {R}[/latex] eine Stammfunktion von [latex]f[/latex]. Die Lösungen [latex]y:I \to \mathbb {R}[/latex] der homogenen linearen Differentialgleichung erster Ordnung [latex]y' + f(x)y = 0[/latex] sind genau die Vielfachen der Funktion [latex]x \in I \mapsto \exp (-F(x))[/latex].

Beweis

Für die Funktion [latex]y:x \in I \mapsto A \exp (-F(x))[/latex] zu [latex]A \in \mathbb {R}[/latex] gilt

[latex]
\begin{aligned}[]y'(x) = A \exp (-F(x)) (-F'(x)) = -f(x) A \exp (-F(x)) = -f(x) y(x)\end{aligned}
[/latex]

für alle [latex]x \in I[/latex] und somit [latex]y'+f(x)y = 0[/latex].

Sei nun [latex]y[/latex] eine beliebige Lösung der homogenen Differentialgleichung [latex]y' + f(x)y = 0[/latex]. Wir definieren die Funktion [latex]\tilde {y}:x \in I \mapsto \exp (F(x))y(x)[/latex] und berechnen

[latex]
\begin{aligned}[]\tilde {y}'(x) = \exp (F(x)) f(x) y(x) + \exp (F(x)) y'(x) = \exp (F(x)) (f(x)y(x)-f(x)y(x)) = 0\end{aligned}
[/latex]

für alle [latex]x \in I[/latex]. Daher ist auf Grund von Korollar 7.33 [latex]\tilde {y} = A[/latex] für eine Konstante [latex]A \in \mathbb {R}[/latex] und somit

[latex]
\begin{aligned}[]y(x) = \exp (-F(x))\tilde {y}(x) = A \exp (-F(x))\end{aligned}
[/latex]

für alle [latex]x \in I[/latex] wie gewünscht. ∎

Lemma 7.61: Inhomogene lineare Differentialgleichungen erster Ordnung

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall und seien [latex]f,g:I \to \mathbb {R}[/latex] Funktionen. Falls es eine Lösung [latex]y_{\operatorname {part}}:I \to \mathbb {R}[/latex] der Differentialgleichung [latex]y' + fy =g[/latex] gibt (die auch die partikuläre Lösung genannt wird), dann ist die allgemeine Lösung [latex]y_{\operatorname {inhom}}[/latex] von der Form [latex]y_{\operatorname {inhom}} = y_{\operatorname {part}} + y_{\operatorname {hom}}[/latex], wobei [latex]y_{\operatorname {hom}}[/latex] die allgemeine Lösung der homogenen Gleichung [latex]y' + f(x)y = 0[/latex] ist.

Übung 7.62

Beweisen Sie Lemma 7.61. Vergleichen Sie Lemma 7.61 des Weiteren mit folgender Tatsache aus der linearen Algebra. Ist [latex]F: V \to W[/latex] eine lineare Abbildung zwischen Vektorräumen [latex]V,W[/latex] über einem Körper [latex]K[/latex] und [latex]v\in V[/latex] und [latex]w \in W[/latex] erfüllen [latex]F(v) = w[/latex], dann ist jedes [latex]\tilde {v} \in V[/latex] mit [latex]F(\tilde {v}) = w[/latex] von der Form [latex]\tilde {v} = v + v_0[/latex] für [latex]v_0[/latex] im Kern der Abbildung [latex]F[/latex].

Hinweis.

Zeigen Sie zuerst, dass jede Funktion der Form [latex]y_{\operatorname {part}} + y_{\operatorname {hom}}[/latex] eine Lösung ist und betrachten Sie dann [latex]y-y_{\operatorname {part}}[/latex] für eine weitere Lösung [latex]y[/latex] der inhomogenen Gleichung.

Lemma 7.61 ist natürlich nur dann interessant, wenn eine partikuläre Lösung bekannt ist. Ein nützlicher Trick, um eine solche zu finden, ist die Variation der Konstanten. Hierbei nimmt man an, dass in der Lösung [latex]y_{\operatorname {hom}}(x) = A \exp (-F(x))[/latex] der homogenen Gleichung [latex]A=A(x)[/latex] eine differenzierbare Funktion der Variable [latex]x[/latex] statt einer Konstante ist. Das heisst, wir setzen [latex]y(x) = A(x) \exp (-F(x))[/latex] für alle [latex]x\in I[/latex], berechnen

[latex]
\begin{aligned}[]y'(x) = A'(x) \exp (-F(x)) - A(x) f(x) \exp (-F(x))\\ y'(x) + f(x) y(x) = A'(x) \exp (-F(x))\end{aligned}
[/latex]

und wollen also [latex]A'(x)\exp (-F(x)) = g(x)[/latex] lösen. Dies führt zu [latex]A'(x) = g(x) \exp (F(x))[/latex] und

[latex]
\begin{aligned}[]A(x) = \int g(x) \exp (F(x)) \thinspace {\rm {d}} x.\end{aligned}
[/latex]

Zusammenfassend kann man also eine partikuläre Lösung der inhomogenen Differentialgleichung [latex]y' + f y = g[/latex] finden, indem man eine Stammfunktion [latex]A(x)[/latex] von [latex]g(x) \exp (F(x))[/latex] findet und dann

[latex]
\begin{aligned}[]y_{\operatorname {part}}: x \in I \mapsto A(x) \exp (-F(x))\end{aligned}
[/latex]

setzt.

Die allgemeine Lösung [latex]y_{\operatorname {inhom}}[/latex] der inhomogenen Differentialgleichung [latex]y' + f y = g[/latex] enthält nach Lemma 7.61 eine unbekannte Konstante (die in einer Lösung der homogenen Gleichung versteckt ist). Wenn nun zusätzlich ein Anfangswert [latex]y(x_0) = y_0[/latex] für [latex]x_0 \in I[/latex] gegeben ist, dann kann man diesen zur Bestimmung der Konstante verwenden und dadurch das Anfangswertproblem lösen.

Um sich obiges Verfahren für das Anfangswertproblem [latex]y' + f y = g[/latex], [latex]y(x_0) = y_0[/latex] zu merken, kann man auch folgendes «Kochrezept» durchlaufen, die zum Teil die Leibniz-Notation verwenden und wegen obiger Diskussion zum richtigen Resultat führen.

  • Trennung der Variablen in der homogenen Gleichung:
    [latex]
    \begin{aligned}[]y_{\operatorname {hom}}' + f(x) y_{\operatorname {hom}} &= 0\\ \frac {\thinspace {\rm {d}} y_{\operatorname {hom}}}{\thinspace {\rm {d}} x} &= -f(x) y_{\operatorname {hom}}\\ \frac {\thinspace {\rm {d}} y_{\operatorname {hom}}}{y_{\operatorname {hom}}} &= -f(x) \thinspace {\rm {d}} x\\ \int \frac {\thinspace {\rm {d}} y_{\operatorname {hom}}}{y_{\operatorname {hom}}} &= - \int f(x) \thinspace {\rm {d}} x\\ \ln |y_{\operatorname {hom}}| &= -F(x) + C\\ |y_{\operatorname {hom}}| &= \mathrm {e}^C \exp (-F(x))\\ y_{\operatorname {hom}}(x) &= A \exp (-F(x))\end{aligned}
    [/latex]
  • Variation der Konstanten: Mit dem Ansatz [latex]y_{\operatorname {part}} = A(x) \exp (-F(x))[/latex] und der Differentialgleichung [latex]y_{\operatorname {part}}' + f(x) y_{\operatorname {part}} = g(x)[/latex] erhält man eine Differentialgleichung für [latex]A(x)[/latex].
  • Bestimmung der Konstanten: Setze
    [latex]
    \begin{aligned}[]y = y_{\operatorname {part}} + y_{\operatorname {hom}} = A(x) \exp (-F(x)) + A \exp (-F(x))\end{aligned}
    [/latex]

    und [latex]y(x_0) = y_0 = A(x_0) \exp (-F(x_0)) + A \exp (-F(x_0))[/latex], um [latex]A\in \mathbb {R}[/latex] zu bestimmen.

Wir bemerken allerdings, dass der erste Schritt obiges Kochrezepts eigentlich nicht alle Lösungen lieferte. In der Tat haben wir zur Vereinfachung der Notation [latex]A=\pm \mathrm {e}^C\neq 0[/latex] gesetzt, dann aber einfach von der Konstante [latex]A\in \mathbb {R}[/latex] gesprochen, wodurch wir die triviale Lösung der homogenen Differentialgleichung [latex]y=0[/latex] wiedergewonnen haben. Dieses und auch ähnliche Kochrezepte sind später sehr nützlich um Lösungen zu finden. Einmal gefunden, ist es normalerweise auch ein leichtes zu überprüfen, ob eine Funktion eine Lösung darstellt (und dies wird üblicherweise auch der Fall sein). Doch sollten wir uns bewusst sein, dass das Kochrezept möglicherweise nicht alle Lösungen liefert.

Beispiel 7.63: Trennung der Variablen

Wir möchten das Anfangswertproblem

[latex]
\begin{aligned}[]y'-2xy &= \mathrm {e}^{x^2}\\ y(0) &= 1\end{aligned}
[/latex]

auf [latex]\mathbb {R}[/latex] lösen.

  • Nach Lemma 7.60 berechnen wir zu [latex]f(x) = -2x[/latex]
    [latex]
    \begin{aligned}[]\int (-2x) \thinspace {\rm {d}} x = -x^2 + C\end{aligned}
    [/latex]

    und wählen somit [latex]F(x) = -x^2[/latex] als Stammfunktion. Die allgemeine Lösung der homogenen Differentialgleichung [latex]y'-2xy = 0[/latex] ist somit von der Form [latex]y_{\operatorname {hom}}(x) = A \mathrm {e}^{x^2}[/latex] für [latex]A \in \mathbb {R}[/latex].

  • Um eine partikuläre Lösung zu finden, brauchen wir eine Stammfunktion der Funktion [latex]g(x)\exp (F(x)) = 1[/latex], wobei [latex]g(x) = \mathrm {e}^{x^2}[/latex]. Wir setzen somit [latex]y_{\operatorname {part}}(x) = x\mathrm {e}^{x^2}[/latex].
  • Die allgemeine Lösung der inhomogenen Gleichung ist nach Lemma 7.61 somit von der Form [latex]y(x) = A \mathrm {e}^{x^2} + x\mathrm {e}^{x^2}[/latex]. Unter Verwendung des Anfangswerts erhalten wir [latex]y(0) = A = 1[/latex] und somit ist die eindeutig bestimmte Lösung des obigen Anfangswertproblems durch
    [latex]
    \begin{aligned}[]y(x) = \mathrm {e}^{x^2} + x\mathrm {e}^{x^2} = (x+1)\mathrm {e}^{x^2}\end{aligned}
    [/latex]

    gegeben. An dieser Stelle empfiehlt es sich durch Einsetzen zu überprüfen, dass [latex]y[/latex] tatsäch­lich eine Lösung ist.

Übung 7.64

Finden Sie eine Lösung des Anfangswertproblems

[latex]
\begin{aligned}[]y'-\left (\frac {4}{x}+1\right )y &= x^4\\ y(1) &= 1\end{aligned}
[/latex]

auf dem Intervall [latex](0,\infty )[/latex].

7.5.4 – Zweite Ordnung

Wir wollen in diesem Unterabschnitt den einfachsten Typ einer gewöhnlichen Differentialgleichung zweiter Ordnung betrachten, nämlich lineare Differentialgleichungen mit konstanten Koeffizienten. Hierbei wird für vorgegebene [latex]a_0,a_1\in \mathbb {C}[/latex] die Gleichung
[latex]
\begin{aligned}[]\label{eq:difford2} y''+a_1y'+a_0y=0\end{aligned}
[/latex]
als homogene lineare gewöhnliche Differentialgleichungen zweiter Ordnung mit konstanten Koeffizienten bezeichnet. Für eine vorgegebene Funktion [latex]g[/latex] wird

[latex]
\begin{aligned}[]y''+a_1y'+a_0y=g\end{aligned}
[/latex]

als inhomogene lineare gewöhnliche Differentialgleichungen zweiter Ordnung mit konstanten Koeffizienten und Störfunktion [latex]g[/latex] bezeichnet.

Bevor wir das allgemeine Verfahren zur Berechnung der Lösungen dieser Differentialgleichungen vorstellen, wollen wir zuerst einige Spezialfälle betrachten, welche auch als Motivation für das allgemeine Verfahren betrachtet werden sollten.

Beispiel 7.65: Einige homogene Gleichungen

Die folgenden Behauptungen sind sehr leicht mit Differentiation überprüfbar. (Die Anmerkungen zu den betrachteten Polynomen soll gewisse Übereinstimmungen andeuten und sollte zumindest nach der Besprechung des allgemeinen Verfahrens für Sie Sinn machen.)

  1. Für die Differentialgleichung [latex]y''=0[/latex] sind die Funktionen
    [latex]
    \begin{aligned}[]x\in \mathbb {R}\mapsto y(x)=C_1+C_2x\end{aligned}
    [/latex]

    für beliebige Konstanten [latex]C_1,C_2\in \mathbb {C}[/latex] Lösungen. (Die [latex]0[/latex] ist die einzige Lösung der Gleichung [latex]T^2=0[/latex].)

  2. Für die Differentialgleichung [latex]y''-y'=0[/latex] sind die Funktionen
    [latex]
    \begin{aligned}[]x\in \mathbb {R}\mapsto y(x)=C_1+C_2\exp (x)\end{aligned}
    [/latex]

    für beliebige Konstanten [latex]C_1,C_2\in \mathbb {C}[/latex] Lösungen. (Die Lösungen der Gleichung [latex]T^2-T=0[/latex] sind gegeben durch [latex]0[/latex] und [latex]1[/latex].)

  3. Für die Differentialgleichung [latex]y''+y=0[/latex] sind die Funktionen
    [latex]
    \begin{aligned}[]x\in \mathbb {R}\mapsto y(x)=C_1\sin (x)+C_2\cos (x)\end{aligned}
    [/latex]

    für beliebige Konstanten [latex]C_1,C_2\in \mathbb {C}[/latex] Lösungen. Ebenso sind die Funktionen

    [latex]
    \begin{aligned}[]x\in \mathbb {R}\mapsto y(x)=D_1\exp (\mathrm {i} x)+D_2\exp (-\mathrm {i} x)\end{aligned}
    [/latex]

    für beliebige Konstanten [latex]D_1,D_2\in \mathbb {C}[/latex] Lösungen, und auf Grund des Zusammenhangs zwischen der komplexen Exponentialabbildung und den trigonometrischen Funktionen in Satz 6.72 werden dadurch die gleiche Menge an Lösungen beschrieben. (Die Lösungen der Gleichung [latex]T^2+1=0[/latex] sind gegeben durch [latex]\mathrm {i},-\mathrm {i}\in \mathbb {C}[/latex].)

Obige Beispiele legen den Ansatz [latex]y=\exp (\alpha x)[/latex] für die Lösungen der Differentialgleichung nahe, wobei man [latex]\alpha \in \mathbb {C}[/latex] noch bestimmen muss (und dies nicht unbedingt alle Lösungen liefert). In der Tat das allgemeine Kochrezept für die Lösung der homogenen Differentialgleichung in (7.14) besteht darin, dass wir die Koeffizienten der Differentialgleichung als Koeffizienten des sogenannten charakteristischen Polynoms

[latex]
\begin{aligned}[]p(T)=T^2+a_1T+a_0\end{aligned}
[/latex]

verwenden. Anschliessend müssen die Nullstellen der Gleichung [latex]p(T)=0[/latex] berechnet werden.

  • Falls es zwei verschiedene Nullstellen [latex]\alpha _1,\alpha _2\in \mathbb {C}[/latex] gibt, so sind die Funktionen
    [latex]
    \begin{aligned}[]\label{eq:loeshom2diff} y(x)=C_1\exp (\alpha _1 x)+C_2\exp (\alpha _2 x)\end{aligned}
    [/latex]
    für beliebige Konstanten [latex]C_1,C_2\in \mathbb {C}[/latex] Lösungen der homogenen Differentialgleichung (7.14).
  • Falls die Koeffizienten [latex]a_0,a_1[/latex] reell sind und die Nullstellen [latex]\alpha _1=\alpha[/latex] durch eine komplexe Zahl [latex]\alpha =\beta +\gamma \mathrm {i}[/latex] mit [latex]\beta \in \mathbb {R}[/latex] und [latex]\gamma >0[/latex] und die Konjugierte [latex]\alpha _2=\overline {\alpha }[/latex] beschrieben werden, so sind die Funktionen
    [latex]
    \begin{aligned}[]\label{eq:loeskompdiff} y(x)=C_1\exp (\beta x)\sin (\gamma x)+C_2\exp (\beta x)\cos (\gamma x)\end{aligned}
    [/latex]
    für beliebige Konstanten [latex]C_1,C_2\in \mathbb {C}[/latex] Lösungen der homogenen Differentialgleichung (7.14).
  • Falls es nur eine Nullstelle [latex]\alpha \in \mathbb {C}[/latex] des charakteristischen Polynoms [latex]p(T)=(T-\alpha )^2[/latex] gibt, so sind die Funktionen
    [latex]
    \begin{aligned}[]\label{eq:loesdouble} y(x)=C_1\exp (\alpha x)+C_2 x \exp (\alpha x)\end{aligned}
    [/latex]
    für beliebige Konstanten [latex]C_1,C_2\in \mathbb {C}[/latex] Lösungen der homogenen Differentialgleichung (7.14).

Mit Hilfe der Ableitungsregeln lässt sich nun überprüfen, dass dieses Verfahren in der Tat Lösungen liefert. Hierfür ist der wichtigste Schritt die folgende Rechnung. Angenommen [latex]a_0,a_1,\alpha \in \mathbb {C}[/latex] sind Konstanten, welche wir verwenden, um das Polynom [latex]p(T)=T^2+a_1T+a_0[/latex] und die Funktion [latex]y:x\in \mathbb {R}\mapsto y(x)=\exp (\alpha x)[/latex] zu definieren. Dann gilt [latex]y'=\alpha y[/latex], [latex]y''=\alpha ^2 y[/latex] und deshalb [latex]y''+a_1y'+a_0y=p(\alpha )y(x)[/latex], was den Zusammenhang zwischen den Nullstellen des charakteristischen Polynom und den Lösungen der homogenen Differentialgleichung erklärt.

Wichtige Übung 7.66: Homogene Gleichung

  1. Zeigen Sie, dass die Menge der Lösungen der homogenen Differentialgleichung (7.14) auf [latex]\mathbb {R}[/latex] einen Teilraum des Vektorraums aller zweimal differenzierbarer Funktionen auf [latex]\mathbb {R}[/latex] bildet.
  2. Zeigen Sie, dass die Funktionen in (7.15), (7.16) beziehungsweise (7.17) Lösungen von (7.14) sind.
  3. Zeigen Sie, dass wir in den Spezialfällen von Beispiel 7.65 tatsächlich alle Lösungen der jeweiligen Differentialgleichung gefunden haben.

Hinweis.

Für den Beweis von (7.16) beweisen Sie zuerst (7.15) und verwenden Sie anschliessend Satz 6.72. Für den Beweis von (7.17) berechnen Sie zuerst die erste und zweite Ableitung von [latex]x\in \mathbb {R}\mapsto x\exp (\alpha x)[/latex] für [latex]\alpha \in \mathbb {C}[/latex]. Für den Beweis, dass in Beispiel 7.65 (c) alle Lösungen gefunden wurden, finden Sie lineare Differentialgleichungen erster Ordnung für die Funktionen [latex]z_+=y+\mathrm {i} y'[/latex] und [latex]z_-=y-\mathrm {i} y'[/latex] und bestimmen Sie alle Lösungen dieser Gleichungen.

Wir behandeln nun ein wichtiges Beispiel aus der Physik.

Beispiel 7.67: Gedämpfte Schwingung

Wir bringen ein Gewicht an einer elastischen Feder an und wählen das Koordinatensystem, so dass [latex]y=0[/latex] dem Ruhezustand (wo sich das Gewicht nicht bewegt) entspricht.

image

Wir wollen die Position [latex]y(t)[/latex] des Gewichts als Funktion der Zeit [latex]t[/latex] betrachten. Nach den Newtonschen Grundgesetzen der Bewegung ist die zweite Ableitung [latex]\ddot {y}[/latex] (nach der Zeit) multipliziert mit der Masse [latex]m[/latex] des Gewichts gleich der Kraft, die auf das Gewicht wirkt. Eine Komponente dieser Kraft entsteht durch die Ausdehnung der Feder und orientiert sich in Richtung Ruhezustand. Nach dem Hookeschen Gesetz ist diese Kraft durch [latex]-ky[/latex] gegeben, wobei [latex]k >0[/latex] die Federkonstante genannt wird. Weiter wirken üblicherweise Reibungkräfte auf die Bewegung. Wir nehmen an, dass die entsprechende Krafteinwirkung durch [latex]-d\dot {y}[/latex] gegeben ist, wobei [latex]d \geq 0[/latex] die Dämpfungskonstante ist. Die Differentialgleichung, die die Bewegung [latex]y(t)[/latex] der Masse beschreibt, ist somit

[latex]
\begin{aligned}[]m \ddot {y} &= -d \dot {y} -k y\\ \ddot {y} + \frac {d}{m} \dot {y} + \frac {k}{m}y &= 0,\end{aligned}
[/latex]

was also eine gewöhnliche lineare homogene Differentialgleichung zweiter Ordnung ist. Wir setzen zur Vereinfachung der Notation [latex]m=1[/latex]. Das charakteristische Polynom obiger Differentialgleichung ist

[latex]
\begin{aligned}[]p(T) = T^2 + d T + k\end{aligned}
[/latex]

mit Nullstellen

[latex]
\begin{aligned}[]\alpha = - \frac {d}{2} \pm \sqrt {\frac {d^2}{4} -k}.\end{aligned}
[/latex]

Für [latex]\frac {d^2}{4} -k

[latex]
\begin{aligned}[]\mathrm {e}^{-\frac {d}{2}t} \big (A \sin (\gamma t) + B \cos (\gamma t) \big ),\end{aligned}
[/latex]

siehe auch folgendes Bild.

image

Abbildung 7.10 – Die ungedämpfte Schwingung links (mit [latex]d=0[/latex]) und die gedämpfte Schwingung (mit [latex]d>0[/latex]) rechts.

Falls die Reibung stark ist und [latex]\frac {d^2}{4}-k > 0[/latex] ist, dann wird die Schwingung zerstört — dies kann mit einem Türschliess-Mechanismus verglichen werden. Die Lösungen sind dann von der Form [latex]A\mathrm {e}^{\alpha _1t} + B \mathrm {e}^{\alpha _2 t}[/latex], wobei [latex]\alpha _1 = - \frac {d}{2} + \sqrt {\frac {d^2}{4} -k}

Der Grenzfall [latex]\frac {d^2}{4} -k = 0[/latex] ist nochmals anders, da wir in diesem Fall bis jetzt nur eine eindimensionale Lösungsmenge bestehend aus allen Vielfachen von [latex]y_1 = \mathrm {e}^{- \frac {d}{2}t}[/latex] gefunden haben. Mit obiger Anleitung erhält man eine weitere Lösung [latex]y_2(t) = t \mathrm {e}^{-\frac {d}{2}t}[/latex], die linear unabhängig zu [latex]y_1[/latex] ist (wieso?). In der Tat gilt

[latex]
\begin{aligned}[]\dot {y}_2(t) &= \mathrm {e}^{-\frac {d}{2}t} - \tfrac {d}{2}t\mathrm {e}^{-\frac {d}{2}t}\\ \ddot {y}_2(t) &= -d \mathrm {e}^{-\frac {d}{2}t} + t \left (\tfrac {d^2}{4}\right ) \mathrm {e}^{-\frac {d}{2}t}\end{aligned}
[/latex]

und somit

[latex]
\begin{aligned}[]\ddot {y}_2(t) + d \dot {y}_2(t) + \tfrac {d^2}{4}y_2(t) = -d \mathrm {e}^{-\frac {d}{2}t} + \tfrac {d^2}{4}t \mathrm {e}^{-\frac {d}{2}t} + d\mathrm {e}^{-\frac {d}{2}t} - \tfrac {d^2}{2}t \mathrm {e}^{-\frac {d}{2}t} + \tfrac {d^2}{4}t \mathrm {e}^{-\frac {d}{2}t} = 0.\end{aligned}
[/latex]

für alle [latex]t \in \mathbb {R}[/latex].

Wir wenden uns nun dem inhomogenen Problem zu, wobei wir annehmen wollen, dass die Störfunktion [latex]g[/latex] sich als Summe von Produkten von Polynomen und Exponentialabbildungen (oder auch dem Sinus und Kosinus) schreiben lässt. In diesen Fällen können wir spezifische Ansätze verwenden, um eine erste Lösung der inhomogenen Differentialgleichung
[latex]
\begin{aligned}[]\label{eq:inhomdiff2gl} y''+a_1y'+a_0y=g\end{aligned}
[/latex]
zu finden. Diese Lösung nennen wir auch die partikuläre Lösung [latex]y_{\operatorname {part}}[/latex]. Die allgemeine Lösung (mit zwei unbekannten Konstanten) der inhomogenen Differentialgleichung lässt sich dann auf Grund der Linearität als Summe der allgemeinen Lösung der homogenen Differentialgleichung (mit zwei unbekannten Konstanten) und der partikulären Lösung schreiben. Wir beschreiben das Rezept zur Berechnung der partikulären Lösung, wobei [latex]p(T)[/latex] wiederum das charakteristische Polynom der homogenen Differentialgleichung darstellt:

  • Falls [latex]g(x) = q(x) \mathrm {e}^{\alpha x}[/latex] für ein Polynom [latex]q(T)[/latex] vom Grad [latex]n[/latex] und [latex]\alpha \in \mathbb {C}[/latex] mit [latex]p(\alpha ) \neq 0[/latex], dann definiert man [latex]y_{\operatorname {part}} = Q(x) \mathrm {e}^{\alpha x}[/latex], wobei [latex]Q(T)[/latex] ein Polynom vom Grad [latex]n[/latex] mit noch zu bestimmenden [latex]n+1[/latex] Koeffizienten ist. Nun berechnet man die linke Seite von (7.18) setzt dies gleich [latex]g[/latex] und verwendet diese Gleichung, um die Koeffizienten von [latex]Q[/latex] zu bestimmen.
  • Falls [latex]g(x) = q(x) \mathrm {e}^{\alpha x}[/latex] für ein Polynom [latex]q(T)[/latex] vom Grad [latex]n[/latex] und [latex]\alpha \in \mathbb {C}[/latex] mit [latex]p(\alpha ) = 0[/latex], dann wiederholt man obiges Verfahren, allerdings mit dem Ansatz [latex]y_{\operatorname {part}} = Q(x)x^\ell \mathrm {e}^{\alpha x}[/latex], wobei [latex]\ell[/latex] die Vielfachheit der Nullstelle [latex]\alpha[/latex] von [latex]p(T)[/latex] angibt.
  • Falls [latex]g[/latex] als eine Linearkombination von Ausdrücken wie oben dargestellt werden kann, dann können wir obiges Verfahren getrennt anwenden und die jeweiligen partikulären Lösungen der vereinfachten Differentialgleichungen addieren.
  • Falls [latex]\alpha \in \mathbb {C} \setminus \mathbb {R}[/latex] ist und wir an reellwertigen Lösungen einer Differentialgleichung mit reellen Koeffizienten interessiert sind, dann kann man [latex]\mathrm {e}^{\alpha x},\mathrm {e}^{\overline { \alpha }x}[/latex] in obigen Diskussionen durch [latex]\mathrm {e}^{\beta x}\cos (\gamma x)[/latex], [latex]\mathrm {e}^{\beta x}\sin (\gamma x)[/latex] für [latex]\beta ,\gamma \in \mathbb {R}[/latex] mit [latex]\alpha = \beta + \gamma \mathrm {i}[/latex] ersetzen.

Beispiel 7.68: Partikuläre Lösungen

Wir betrachten einige Spezialfälle für die obigen Ansätze.

  1. Zum Beispiel könnten das charakteristische Polynom durch [latex]p(T)=(T+1)(T+2)[/latex] und das Störglied durch [latex]x\in \mathbb {R}\mapsto g(x)=x\exp (x)[/latex] gegeben sein. In diesem Fall ist der Skalar [latex]\alpha =1[/latex] in der Exponentialfunktion des Störglieds keine Nullstelle des charakteristischen Polynoms und wir können den Ansatz [latex]y_{\operatorname {part}}=(C_1x+C_2)\exp (x)[/latex] für noch zu bestimmende Konstanten [latex]C_1,C_2[/latex] verwenden.
  2. Für [latex]p(T)=(T+1)(T+2)[/latex] und Störglied [latex]x\in \mathbb {R}\mapsto g(x)=x\exp (-x)[/latex] muss man allerdings den Ansatz [latex]y_{\operatorname {part}}=(C_1x^2+C_2x)\exp (-x)[/latex] für noch zu bestimmende Konstanten [latex]C_1,C_2[/latex] verwenden, da [latex]-1[/latex] sehr wohl eine Nullstelle des charakteristischen Polynoms ist.
  3. Falls [latex]p(T)=(T+1)^2[/latex] und das Störglied durch [latex]x\in \mathbb {R}\mapsto g(x)=x\exp (-x)[/latex] gegeben ist, so muss man den Ansatz [latex]y_{\operatorname {part}}=(C_1x^3+C_2x^2)\exp (-x)[/latex] für noch zu bestimmende Konstanten [latex]C_1,C_2[/latex] verwenden, da [latex]-1[/latex] eine doppelte Nullstelle des charakteristischen Polynoms ist.
  4. Falls [latex]p(T)=T^2+1[/latex] und das Störglied durch [latex]x\in \mathbb {R}\mapsto g(x)=x\sin (x)[/latex] gegeben ist, so muss man den Ansatz [latex]y_{\operatorname {part}}=(C_1x^2+C_2x)\sin (x)+(C_3x^2+C_4x)\cos (x)[/latex] für noch zu bestimmende Konstanten [latex]C_1,C_2,C_3,C_4[/latex] verwenden. Dies ergibt sich ebenso aus obigen Fällen, denn [latex]\sin (x)=\frac 1{2\mathrm {i}}(\exp (\mathrm {i} x)-\exp (-\mathrm {i} x))[/latex] und beide Skalaren [latex]\mathrm {i},-\mathrm {i}[/latex] sind einfache Nullstellen des charakteristischen Polynoms. Deswegen müssen wir den Grad der Polynomfaktoren vor [latex]\exp (\mathrm {i} x)[/latex] und vor [latex]\exp (-\mathrm {i} x)[/latex] jeweils um [latex]1[/latex] erhöhen, was zu den getrennten Ansätzen [latex](D_1x^2+D_2x)\exp (\mathrm {i} x)[/latex] für die partikuläre Lösung für das Störglied [latex]\frac 1{2\mathrm {i}}x\exp (\mathrm {i} x)[/latex] beziehungsweise [latex](D_3x^2+D_4x)\exp (-\mathrm {i} x)[/latex] für das Störglied [latex]-\frac 1{2\mathrm {i}}x\exp (-\mathrm {i} x)[/latex] führt. Wollen wir die Rechnung über die reellen Zahlen ausführen, so betrachten wir stattdessen obigen Ansatz mit Sinus und Kosinus.

Wie bereits erwähnt ergibt sich die allgemeine Lösung einer inhomogenen Differentialgleichung dann als die Summe einer partikulären Lösung und der allgemeinen Lösung der zugehörigen homogenen Differentialgleichung. Falls zusätzlich Anfangsbedingungen in der Form [latex]y(x_0)=y_0[/latex] und [latex]y'(x_0)=y_1[/latex] bekannt sind, so lässt sich nun die Lösung des Anfangswertproblems mit Hilfe eines Gleichungssystems in den unbekannten Konstanten lösen. Wir erproben dieses Verfahren im folgenden Beispiel.

Beispiel 7.69: Gedämpfte Schwingung mit periodischer Krafteinwirkung

Wir verändern die homogene Differentialgleichung

[latex]
\begin{aligned}[]\ddot {y} + d \dot {y} + ky =0\end{aligned}
[/latex]

der gedämpften Schwingung aus Beispiel 7.67, indem wir eine periodische Krafteinwirkung der Form [latex]a \sin (t)[/latex] für ein [latex]a \in \mathbb {R}[/latex] dem System hinzufügen, wodurch wir die inhomogene Differentialgleichung [latex]\ddot {y} + d \dot {y} + ky = a\sin (t)[/latex] erhalten. Wir wollen nun eine Lösung des Anfangswertproblems

[latex]
\begin{aligned}[]\ddot {y} + d \dot {y} + ky &= a\sin (t)\\ y(0) =0,\ &y'(0) = 0\end{aligned}
[/latex]

finden, wobei die Anfangsbedingungen der unbewegten Ruhelage am Anfang entspricht.

Die allgemeine Lösung der homogenen Differentialgleichung haben wir bereits in Beispiel 7.67 diskutiert. Wir möchten hier jedoch nur der Fall [latex]\frac {d^2}{4}-k

[latex]
\begin{aligned}[]y_{\operatorname {hom}}(t) = \mathrm {e}^{-\frac {d}{2}t} \big (A \sin (\gamma t) + B \cos (\gamma t) \big ),\end{aligned}
[/latex]

wobei [latex]\gamma = \sqrt {\big |\frac {d^2}{4} -k\big |}[/latex].

Für die partikuläre Lösung machen wir den Ansatz [latex]y_{\operatorname {part}}(t) = -C \sin (t) + D\cos (t)[/latex] und erhalten

[latex]
\begin{aligned}[]\dot {y}_{\operatorname {part}} &= -C \cos (t) - D \sin (t)\\ \ddot {y}_{\operatorname {part}} &= C \sin (t) - D \cos (t).\end{aligned}
[/latex]

Wir möchten also [latex]C,D[/latex] so bestimmen, dass

[latex]
\begin{aligned}[]\ddot {y}_{\operatorname {part}} + d \dot {y}_{\operatorname {part}} + ky_{\operatorname {part}} = (C-Dd -Ck)\sin (t) + (-D-Cd +Dk)\cos (t) = a \sin (t),\end{aligned}
[/latex]

oder nach Vergleich der Koeffizienten (wieso geht das?), dass

[latex]
\begin{aligned}[]\begin{pmatrix}1-k & -d \\ d & 1-k\end{pmatrix} \begin{pmatrix}C \\ D\end{pmatrix} = \begin{pmatrix}a \\ 0\end{pmatrix}\end{aligned}
[/latex]

in Matrixschreibweise. Falls die Determinante [latex](1-k)^2+d^2[/latex] nicht Null ist, sehen wir nach Inversion, dass die Lösung des Gleichungssystems durch

[latex]
\begin{aligned}[]\begin{pmatrix}C \\ D\end{pmatrix} = \frac {1}{(1-k)^2 + d^2}\begin{pmatrix}1-k & d \\ -d & 1-k\end{pmatrix} \begin{pmatrix}a \\ 0\end{pmatrix} = \frac {a}{(1-k)^2+d^2} \begin{pmatrix}1-k \\ -d\end{pmatrix}\end{aligned}
[/latex]

gegeben ist, wodurch

[latex]
\begin{aligned}[]y_{\operatorname {part}}(t) = -\frac {a(1-k)}{(1-k)^2+ d^2} \sin (t) - \frac {ad}{(1-k)^2+d^2}\cos (t).\end{aligned}
[/latex]

Wir addieren zu [latex]y_{\operatorname {part}}[/latex] die allgemeine Lösung [latex]y_{\operatorname {hom}}[/latex] der homogenen Differentialgleichung, um eine Lösung [latex]y[/latex] zu erhalten. Nun setzen wir [latex]t=0[/latex] sowohl in der Lösung [latex]y[/latex] als auch ihrer Ableitung und erhalten gemeinsam mit den Anfangsbedingungen

[latex]
\begin{aligned}[]y(0) &= - \frac {ad}{(1-k)^2+d^2} \cdot 1 + 1 \cdot B \cdot 1 = 0\\ y'(0) &= -\frac {a(1-k)}{(1-k)^2+ d^2} \cdot 1 - \frac {d}{2} \cdot 1 \cdot B + 1 \cdot A \cdot \gamma = 0.\end{aligned}
[/latex]

Somit wählen wir die Konstanten [latex]A,B[/latex] als

[latex]
\begin{aligned}[]B &= \frac {ad}{(1-k)^2+d^2},\\ A &= \frac {Bd}{2\gamma } + \frac {a(1-k)}{\gamma ((1-k)^2+d^2)} = \frac {a}{\gamma ((1-k)^2+ d^2)} \left (\frac {d^2}{2}+(1-k)\right ).\end{aligned}
[/latex]

Die Lösung des Anfangswertproblems ist somit gegeben durch

[latex]
\begin{aligned}[]y(t) &= y_{\operatorname {part}}(t) + y_{\operatorname {hom}}(t)\\ &= -\frac {a(1-k)}{(1-k)^2+ d^2} \sin (t) - \frac {ad}{(1-k)^2+d^2}\cos (t)\\ &\quad + \mathrm {e}^{-\frac {d}{2}t} \left (\frac {a}{\gamma ((1-k)^2+ d^2)} \left (\frac {d^2}{2}+(1-k)\right )\sin (\gamma t) + \frac {ad}{(1-k)^2+d^2} \cos (\gamma t) \right ).\end{aligned}
[/latex]

Man kann in diesem einfachen Modell bereits einige physikalische Beobachtungen wiedererkennen.

  • Bei positiver Dämpfung [latex]d > 0[/latex] strebt die Lösung gegen eine Schwingung mit Frequenz der vorgegebenen Krafteinwirkung. Die Amplitude dieser Schwingung ist durch [latex]\frac {a}{\sqrt {(1-k)^2+d^2}}[/latex] gegeben (siehe die entsprechende Übung in Abschnitt 6.9.2) und hängt also linear von der vorgegeben Amplitude der Krafteinwirkung ab. Sie wird grösser, wenn [latex]k[/latex] nahe bei [latex]1[/latex] und [latex]d[/latex] nahe bei [latex]0[/latex] ist.
    image
  • Bei verschwindender Dämpfung [latex]d =0[/latex] ergibt sich eine Lösung, die eine Überlagerung der «Eigenschwingung» des Systems und der «vorgegebenen Schwingung» der Krafteinwirkung ist. Falls [latex]k \neq 1[/latex] nahe bei [latex]1[/latex] ist, dann können sich diese Schwingungen manchmal gleichzeitig verstärken und manchmal fast auslöschen, siehe folgendes Bild.
    image
  • Bei [latex]d=0[/latex] und [latex]k=1[/latex] gilt obige Diskussion nicht mehr. In diesem Fall ist eine partikuläre Lösung durch [latex]y_{\operatorname {part}}(t) = - \frac {a}{2} t \cos (t)[/latex] gegeben (wieso?) und eine Lösung des Anfangswertproblems durch [latex]y(t) = - \frac {a}2 t \cos (t) + \frac {a}{2} \sin (t)[/latex]. Diese Lösung ist also unbeschränkt (unabhängig davon wie klein [latex]a\neq 0[/latex] auch sein mag). Physikalisch begründet sich dies mit der Tatsache, dass die Krafteinwirkung mit dem System im gleichen Takt ist und die Schwingung (bei Abwesenheit von Reibung) aufschaukelt.
    image

Die Phänomene in diesem Beispiel werden als Resonanz bezeichnet und können in verschiedenen Situationen beobachtet werden. Zum Beispiel kann sich die Schwingung von einer Saite einer Gitarre auf die gleiche Saite einer anderen Gitarre übertragen, ohne dass diese sich berühren müssen. Denn durch Anzupfen der Saite auf der ersten Gitarre erzeugt man einen Ton, der als Schwingung der Luft in einer gewissen Frequenz definiert werden kann. Diese Schwingung breitet sich aus und übt auf die gleiche Saite der zweiten Gitarre in der richtigen Frequenz eine Kraft aus, die zwar sehr klein ist, aber in der Frequenz mit der Eigenschwingung der Saite der zweiten Gitarre übereinstimmt. Aus diesen Grund beginnt die Saite der zweiten Gitarre sichtbar zu schwingen. (Zur Not kann man dies auch nur mit einer Gitarre beobachten, aber hierzu muss man auf zwei Saiten die gleiche Note greifen.)

Applet 7.70: Harmonischer Oszillator

Sie können sowohl die Koeffizienten der Differentialgleichung [latex]\ddot y+d\dot y+ky=a\sin t[/latex] als auch die Anfangsbedingungen [latex]y(0)=y_0[/latex] und [latex]\dot y(0)=y_1[/latex] einstellen.

7.6 – Weitere Lernmaterialien

7.6.1 – Verwendung des Kapitels

Der Begriff der Ableitung und die Ableitungsregel sind fundamentales Grundwissen für alle weitere Untersuchungen in der Analysis I/II-Vorlesung und vielen Anwendungen in Physik und anderen Wissenschaften. Die Berechnung der Ableitung einer vorgegebenen Funktion ist meist ziemlich einfach, da die wenigen Regeln für alle üblichen algebraischen Verknüpfungen von bekannten Funktionen anwendbar sind. Bloss wenn eine Funktion durch eine Fallunterscheidung definiert wird, müssen wir mitunter auf die ursprüngliche Definition zurückgreifen und können damit vielleicht die Ableitung bei den Problempunkten berechnen. Wir empfehlen Ihnen dies zu üben bis Sie Ableitungen mit 100%-iger Sicherheit berechnen können.

Wie wir gesehen haben, ist der Mittelwertsatz der Differentialrechnung das Hilfsmittel für den Zusammenhang zwischen der Ableitung und dem Verhalten der ursprünglichen Funktion auf einem Intervall. Für den Beweis des Mittelwertsatzes benötigten wir (über den Umweg des Satzes von Rolle) den Satz über die Existenz des Maximums auf einem kompakten Intervall, wo wiederum das Supremum und damit die Vollständigkeit der reellen Zahlen notwendig waren. Insbesondere bildet der Mittelwertsatz die Grundlage von allen Kurvendiskussionen, welche Monotonieeigenschaften aber auch Krümmungseigenschaften in der Form von Konvexität und Konkavität einer vorgegebenen Funktion beschreiben. Obwohl viele Ableitungsregeln und auch viele weitere Eigenschaften, die eine Funktion mit ihrer Ableitung verknüpft, auch für komplex-wertige Funktionen gelten, gilt der Mittelwertsatz nicht für komplex-wertige Funktionen.

Die Kurvenbesprechung verwendeten wir zum Beispiel für den Sinus, den Kosinus und den Tangens, was zu der Definition der inversen Funktionen Arkussinus, Arkusconsinus und Arkustangens führte. Wir werden diese Funktionen, deren Eigenschaften, Definitionsbereiche und Ableitungen ab nun auch ohne Verweise auf Abschnitt 7.3 verwenden. Wir haben damit die üblichen Funktionen eingeführt und kennen auch die Ableitungen von all diesen Funktionen.[3] Wir werden aber auch noch weiteren Ihnen wahrscheinlich unbekannten, aber in gewissen Anwendungen wichtigen Funktionen begegnen.

Des Weiteren haben wir mit der Regel von de l’Hôpital das Hilfsmittel für die Berechnung von Grenzwerten gefunden. Dies ist hilfreich, da die Berechnung von Ableitungen im Vergleich sehr einfach ist. In gewissen Fällen wie zum Beispiel [latex]\lim _{x\searrow 0}x\log (x)[/latex] erfordert die Anwendung der Regel von de l’Hôpital ein wenig Geschick, da man zuerst den Ausdruck [latex]x\log (x)[/latex] als einen Bruch darstellen muss. Doch auch dies ist mit ein wenig Übung nicht schwierig, da man hier einfach der «schwierigeren Funktion [latex]\log (x)[/latex] den Vortritt gibt» um stattdessen [latex]\frac {\log (x)}{x^{-1}}[/latex] zu betrachten und dies nach einmaliger Anwendung der Regel von de l’Hôpital zum Erfolg führt. Dies ist auch hilfreich zur Berechnung von Grenzwerten von Folgen, falls diese durch eine konkrete Formel [latex]f(n)[/latex] definiert ist und für diese Formel der Grenzwert [latex]\lim _{x\to \infty }f(x)[/latex] berechnet werden kann.

Wir haben auch den Begriff der Differentialgleichung eingeführt und einige erste Anfangswertprobleme lösen können. Diese Begriffe sind ebenso von fundamentaler Bedeutung für die Physik und viele weitere Wissenschaften. Denn immer wenn eine Grösse [latex]y[/latex] von einem Zeitparamter [latex]t[/latex] abhängt und gewisse Gesetzmässigkeiten für das Änderungsverhalten [latex]\dot {y}(t)[/latex] in Abhängigkeit von [latex]y(t)[/latex] und dem Zeitparameter [latex]t[/latex] bekannt sind, ergibt sich daraus eine gewöhnliche Differentialgleichung. Wir werden im zweiten Semester nochmals zu diesem Thema zurückkehren, die Frage der eindeutigen Lösbarkeit von Anfangswertproblemen aufwerfen und in grosser Allgemeinheit positiv beantworten können.

7.6.2 – Übungen

Übung

Finden Sie eine differenzierbare Funktion auf einem offenen Intervall [latex]I[/latex], so dass ein Punkt [latex]x_0 \in I[/latex] mit [latex]f'(x_0) = 0[/latex] existiert, der kein lokales Extremum ist.

Übung: Vielfachheit von Nullstellen

Sei [latex]f\in \mathbb {R}[T][/latex] ein Polynom und sei [latex]k \in \mathbb {N}[/latex]. Wir erinnern daran, dass eine [latex]k[/latex]-fache Nullstelle von [latex]f[/latex] ein [latex]z\in \mathbb {C}[/latex] ist mit der Eigenschaft, dass [latex](T-z)^{k}[/latex] das Polynom [latex]f[/latex] teilt, aber [latex](T-z)^{k+1}[/latex] das Polynom [latex]f[/latex] nicht teilt. Zeigen Sie, dass folgende Eigenschaften für einen Punkt [latex]x_0 \in \mathbb {R}[/latex] äquivalent sind:

  1. [latex]x_0[/latex] ist eine [latex]k[/latex]-fache Nullstelle von [latex]f[/latex].
  2. [latex]f^{(\ell )}(x_0) = 0[/latex] für alle [latex]\ell \in \mathbb {N}_0[/latex] mit [latex]\ell \leq k-1[/latex] und [latex]f^{(k)}(x_0) \neq 0[/latex].

Daraus folgt beispielsweise, dass eine [latex]k[/latex]-fache Nullstelle von [latex]f[/latex] eine [latex]k-1[/latex]-fache Nullstelle von [latex]f'[/latex] ist (wieso?). Die zweite Eigenschaft (ii) lässt sich direkt auf beliebige, glatte Funktionen [latex]f: \mathbb {R} \to \mathbb {R}[/latex] erweitern. Mit etwas mehr stimmt dies auch für (i) und man erhält wiederum eine äquivalente Charakterisierung.

Allerdings muss nicht jede Nullstelle einer von Null verschiedenen, glatten Funktion [latex]f: \mathbb {R} \to \mathbb {R}[/latex] eine endliche Vielfachheit besitzen. Finden Sie ein nicht-triviales Beispiel einer solchen Funktion. Das heisst, finden Sie eine glatte Funktion [latex]f: \mathbb {R} \to \mathbb {R}[/latex] mit einer Nullstelle [latex]x_0 \in \mathbb {R}[/latex], so dass [latex]f^{(k)}(x_0) = 0[/latex] für alle [latex]k \in \mathbb {N}_0[/latex], aber [latex]f|_U \neq 0[/latex] für alle Umgebungen [latex]U[/latex] von [latex]x_0[/latex].

Übung: Satz von Darboux

Sei [latex][a,b][/latex] ein kompaktes Intervall mit Endpunkten [latex]a

Gehen Sie wie folgt vor, um einen Beweis zu erhalten.

  1. Sei [latex]c[/latex] zwischen [latex]f'(a)[/latex] und [latex]f'(b)[/latex]. Betrachten Sie die Funktion [latex]x \in [a,b] \mapsto f(x)-cx \in \mathbb {R}[/latex] um zu argumentieren, dass man ohne Beschränkung der Allgemeinheit [latex]f'(a) \leq 0[/latex], [latex]f'(b) \geq 0[/latex] sowie [latex]c=0[/latex] annehmen kann.
  2. Verwenden Sie nun den Extremwertsatz (Korollar 3.72) und Proposition 7.17 um zu zeigen, dass ein Punkt [latex]x \in [a,b][/latex] mit [latex]f'(x) = 0[/latex] existiert.

Übung

Zeigen Sie, dass die Funktion

[latex]
\begin{aligned}[]f: x \in \mathbb {R} \mapsto \left \lbrace \begin{array}{cc} \exp \big (-\frac {1}{1-x^2}\big ) & \text {falls } |x|[/latex]

glatt ist.

Übung

Sei [latex]f:D \to \mathbb {C}[/latex] eine Funktion auf einer Teilmenge [latex]D\subseteq \mathbb {R}[/latex] und sei [latex]a \in D[/latex] Häufungspunkt. Wir erinnern daran, dass [latex]f[/latex] bei [latex]a[/latex] differenzierbar ist, falls der Grenzwert [latex]\lim _{x \to a} \frac {f(x)-f(a)}{x-a}[/latex] existiert. Zeigen Sie, dass [latex]f[/latex] genau dann bei [latex]a[/latex] differenzierbar ist, wenn [latex]\operatorname {Re}(f)[/latex] und [latex]\operatorname {Im}(f)[/latex] bei [latex]a[/latex] differenzierbar sind.

Übung: Challenge

In dieser Übung möchten wir eine differenzierbare Funktion [latex]f[/latex] auf [latex][0,1][/latex] konstruieren, deren Ableitung an allen (und insbesondere überabzählbar vielen) Punkten in der Cantor-Menge nicht stetig ist. Als Ausgangspunkt betrachten wir dazu die Funktion

[latex]
\begin{aligned}[]\varphi : [0,1] \to \mathbb {R},\quad x \mapsto \left \lbrace \begin{array}{cl} x^2(1-x)^2 \sin \big (\frac {1}{x(1-x)}\big ) & \text {falls } x\in (0,1) \\ 0 & \text {falls } x \in \left \lbrace {0,1} \right \rbrace \end{array} \right . .\end{aligned}
[/latex]

Zeigen Sie, dass [latex]\varphi[/latex] differenzierbar ist, aber dass [latex]\varphi '[/latex] bei [latex]0[/latex] und [latex]1[/latex] nicht stetig ist.

Sei [latex]C[/latex] die Cantor-Menge. Wir verwenden die Notation [latex]x_+,x_-[/latex] zu [latex]x \in [0,1]\setminus C[/latex] aus Abschnitt 6.8.2 und definieren damit [latex]f:[0,1] \to \mathbb {R}[/latex] durch [latex]f(x) = 0[/latex] für [latex]x \in C[/latex] und

[latex]
\begin{aligned}[]f(x) = (x_+-x_-)^\frac {3}{2}\ \varphi \left ( \frac {x-x_-}{x_+-x_-} \right )\end{aligned}
[/latex]

für [latex]x \in [0,1] \setminus C[/latex]. Zeigen Sie, dass [latex]f[/latex] differenzierbar ist und dass [latex]f'[/latex] bei keinem Punkt in [latex]C[/latex] stetig ist.

Hinweis.

Es lohnt sich jeweils, zu unterscheiden, ob [latex]x[/latex] ein rechter (resp. linker) Endpunkt in [latex]C[/latex] ist oder nicht (vergleiche Abschnitt 6.8).

In der folgenden Übung möchten wir eine zahlentheoretische Anwendung des Mittelwertsatzes präsentieren. Wir erinnnern uns daran, dass in Abschnitt 3.2 der Begriff der algebraischen und transzendenten Zahlen eingeführt wurde. Dabei heisst eine komplexe Zahl algebraisch, wenn sie die Nullstelle eines von Null verschiedenen Polynoms mit rationalen Koeffizienten ist, und transzendent sonst. Wir möchten in folgender Übung zeigen, dass die Zahl

[latex]
\begin{aligned}[]\sum _{n=0}^\infty 10^{-n!}\end{aligned}
[/latex]

oder Zahlen mit ähnlichen Eigenschaften transzendent sind.

Übung

Eine irrationale reelle Zahl [latex]\alpha \in \mathbb {R}[/latex] ist eine Liouville-Zahl, falls für jedes [latex]n \in \mathbb {N}[/latex] eine rationale Zahl [latex]\frac {p}{q} \in \mathbb {Q}[/latex] existiert mit

[latex]
\begin{aligned}[]\left | \alpha - \frac {p}{q} \right | [/latex]

In einem gewissen Sinne ist eine Liouville-Zahl also eine irrationale Zahl, die sich sehr gut durch rationale Zahlen approximieren lässt.

  1. Zeigen Sie, dass [latex]\sum _{n=0}^\infty 10^{-n!}[/latex] eine Liouville-Zahl ist. Verwenden Sie die Ziffernentwicklung zur Basis [latex]10[/latex] und Übung 6.91.

Wir wollen nun zeigen, dass jede Liouville-Zahl (und damit auch [latex]\sum _{n=0}^\infty 10^{-n!}[/latex]) transzendent ist. Dazu behaupten wir, dass es für jede algebraische Zahl [latex]\beta[/latex] eine Konstante [latex]A > 0[/latex] und ein [latex]n\in \mathbb {N}[/latex] gibt, so dass
[latex]
\begin{aligned}[]\label{eq:abl-liouville thm} \left | \beta - \frac {p}{q} \right | \geq \frac {A}{q^n}\end{aligned}
[/latex]
für alle [latex]\frac {p}{q} \in \mathbb {Q}[/latex].

  1. Sei [latex]f \in \mathbb {Q}[x][/latex] mit [latex]f(\beta ) = 0[/latex] und Grad [latex]n\geq 1[/latex]. Sei weiters [latex]\frac {p}{q} \in \mathbb {Q}\cap [\beta -1,\beta +1][/latex] keine Nullstelle von [latex]f[/latex]. Zeigen Sie, dass [latex]\left |f\left (\frac {p}{q}\right )\right | \geq \frac {1}{q^n}[/latex].
  2. Argumentieren Sie mit dem Mittelwertsatz, dass [latex]\left |f\left (\frac {p}{q}\right )\right | = |f'(\xi )| \left | \beta - \frac {p}{q} \right |[/latex] für ein [latex]\xi[/latex] zwischen [latex]\beta[/latex] und [latex]\frac {p}{q}[/latex]. Schliessen Sie, dass es ein [latex]a>0[/latex] gibt mit [latex]|f'(x)|\leq a[/latex] für alle [latex]x\in [\beta -1,\beta +1][/latex] und folgern Sie (7.19).
  3. Zeigen Sie, dass jede Liouville-Zahl transzendent ist.

Übung: Konvexität und Mittelpunktseigenschaft

Sei [latex]I \subseteq \mathbb {R}[/latex] ein Intervall und [latex]f:I \to \mathbb {R}[/latex] eine stetige Funktion. Zeigen Sie, dass [latex]f[/latex] genau dann konvex ist, wenn für alle [latex]x,y\in I[/latex] die Ungleichung

[latex]
\begin{aligned}[]f\left (\frac {x+y}{2}\right )\leq \frac {f(x)+f(y)}{2}\end{aligned}
[/latex]

gilt. Begründen Sie auch intuitiv, wieso letztere Ungleichung implizit in (7.6) enthalten ist und somit (zumindest auf den ersten Blick) die schwächere Annahme ist. Sie können dazu mit einem Bild arbeiten. Zeigen Sie unter Verwendung obiger Charakterisierung, dass [latex]x\in \mathbb {R} \mapsto |x|[/latex] eine konvexe Funktion ist.

Übung

In dieser Übung möchten wir zeigen, dass konvexe Funktionen fast überall differenzierbar sind. Sei [latex]I \subseteq \mathbb {R}[/latex] ein nicht-leeres Intervall und sei [latex]f:I \to \mathbb {R}[/latex] konvex.

  1. Zeigen Sie, dass die links- und rechtsseitigen Ableitungen [latex]f_-'(x) \leq f_+'(x)[/latex] von [latex]f[/latex] bei jedem [latex]x \in I[/latex] ausser vielleicht bei den Endpunkten von [latex]I[/latex] existieren.
  2. Zeigen Sie, dass [latex]f[/latex], möglicherweise abgesehen von den Endpunkten von [latex]I[/latex], stetig ist.
  3. Zeigen Sie, dass es eine höchstens abzählbare Ausnahmemenge [latex]A \subseteq I[/latex] gibt, so dass [latex]f[/latex] bei jedem [latex]x \in I \setminus A[/latex] differenzierbar ist.

Hinweis: Für (i) können Sie Lemma 7.39 verwenden, um eine Monotonie der Differenzenquotienten zu zeigen. Für (ii) können Sie folgendes Bild als Hinweis verwenden.

image

Für (iii) verwenden Sie Übung 3.58 für [latex]f_-',f_+'[/latex].

Übung: Newton-Verfahren für konvexe Funktionen

Seien [latex]a0[/latex] und [latex]f(b)

  1. Zeigen Sie, dass [latex]f[/latex] eine eindeutig bestimmte Nullstelle [latex]z[/latex] in [latex][a,b][/latex] besitzt.

Wir betrachten nun das Newton-Verfahren zur numerischen Bestimmung von Nullstellen. Sei [latex]x_0 = a[/latex] und [latex]x_{n+1}=x_n-\frac {f(x_n)}{f’(x_n)}[/latex] für [latex]n\in \mathbb {N}_0[/latex]. Dabei ist [latex]x_{n+1}[/latex] die Nullstelle der Tangente an [latex]f[/latex] durch [latex]x_n[/latex] für jedes [latex]n\in \mathbb {N}[/latex]; siehe dazu folgendes Bild.

image

Nun wollen wir zeigen, dass die Folge [latex](x_n)_n[/latex] gegen [latex]z[/latex] konvergiert.

  1. Zeigen Sie, dass die Folge [latex](x_n)_n[/latex] Grenzwert [latex]z[/latex] hat, falls sie konvergiert.
  2. Zeigen Sie, dass die Folge [latex](x_n)_n[/latex] monoton wachsend ist und dass [latex]x_n \leq z[/latex] und somit auch [latex]x_n \in [a,b][/latex] für alle [latex]n \in \mathbb {N}[/latex] erfüllt ist. Schliessen Sie damit auf die Konvergenz des Newton-Verfahrens mit Startpunkt [latex]a[/latex].

Wir werden später mit Hilfe zusätzlicher Werkzeuge das Newton-Verfahren in einem allgemeineren Kontext besprechen können — siehe Beispiel 8.65.

Hinweis.

Verwenden Sie Lemma 7.39 für (i) und (iii).

7.6.3 – Lernkarten

Sie können wiederum die Lernkarten oder den Graphen für Ihre Wiederholung der Themen des Kapitels verwenden.

<!– post meta –>


  1. Man beachte, dass diese Annahme auch gemeinsam mit [latex]L = \lim _{x \searrow a} \frac {f'(x)}{g'(x)}[/latex] keinerlei Information über das asymptotische Verhalten von [latex]f[/latex] für [latex]x \searrow a[/latex] enthält.
  2. Das macht exakt gesehen kaum Sinn, denn die Anzahl sollte ja eigentlich eine natürliche Zahl sein und eine differenzierbare Funktion auf einem Intervall mit Werten in [latex]\mathbb {N}[/latex] ist konstant. Da aber die Anzahl sehr gross und die Änderung der Anzahl in einer kleinen Zeitspanne relativ gesehen klein ist, macht es aus praktischen Gründen doch Sinn, dies als Differentialgleichung aufzufassen.
  3. Wir meinen mit "üblichen Funktionen" solche, die sowohl auf den meisten Taschenrechnern vorhanden sind und auch im Gymnasium unterrichtet werden. Abgesehen davon unterscheiden sich diese Funktionen aber kaum von anderen Funktionen, die wir zum Teil noch kennenlernen werden und sich vielleicht nicht durch die üblichen Funktionen ausdrücken lassen.

License

Analysis-Skript CHAB MATH PHYS: 18/19 Copyright © by Manfred Einsiedler and Andreas Wieser. All Rights Reserved.

}