="http://www.w3.org/2000/svg" viewBox="0 0 512 512">

9.4 Taylor Approximation

Wir erinnern daran, dass die Ableitung f(x0) einer reellwertigen differenzierbaren Funktion f auf einem Intervall die Steigung der Tangente

y(x) = f(x0) + f(x 0)(x x0)

des Graphen von f bei x0 angibt, wobei die Tangente den Graphen gut approximiert (im Sinne von f(x) = y(x) + o(x x0) für x x0). Wir wollen hier die Güte der Approximation erhöhen indem wir statt linearen Approximationen auch noch höhere polynomiale Approximationen erlauben.

Sei also f : (a,b) eine n-mal differenzierbare Funktion auf einem offenen, nicht-leeren (möglicherweise unbeschränkten) Intervall (a, b) . Die n-te Taylor-Approximation von f um einen Punkt x0 (a,b) ist das Polynom

Px0,nf (x) = k=0nf(k)(x0) k! (x x0)k.

Die Koeffizienten wurden dabei so gewählt, dass Px0 ,n f (x0 ) = f (x0) und allgemeiner

(Px0,nf)(k) (x 0) = f(k) (x 0)

für k {0, ,n} gilt (wieso?). Die vielleicht naive Hoffnung ist hierbei, dass die Taylor-Approximation, wie der Name sagt, die Funktion f approximiert. Falls f glatt ist, dann ist die Taylorreihe von f um x0 (a,b) definiert als die Potenzreihe

Tx0f (x) = k=0f(k)(x0) k! (x x0)k.

Damit wir hier von einer Potenzreihe sprechen dürfen, erweitern wir die Definition 7.54 wie folgt. Eine Potenzreihe um einen Punkt z0 in der Variable z ist ein formaler Ausdruck der Form n=0an(z z0)n, wobei an für alle n die Koeffizienten der Potenzreihe sind. Der Konvergenzradius

R = (limsup n|an|n)1

ist wie in Abschnitt 7.4.1 definiert und die Potenzreihe n=0an(z z0)n konvergiert für alle z mit Abstand kleiner R von z0 und divergiert für alle z mit |z z0 | > R (was aus Satz 7.56 folgt, wie?).

Soweit ist nicht klar, was der Konvergenzradius der Taylor-Reihe einer glatten Funktion f um einen Punkt x0 im Definitionsbereich ist und ob er positiv ist. Die naive Hoffnung ist, dass die Taylor-Reihe, wo definiert, gleich der Funktion f ist, da die Taylorreihe bei x0 die gleichen Ableitungen wie f hat. Dies ist in der Tat für viele Funktionen der Fall, doch, wie folgendes Beispiel zeigt, nicht immer.

Beispiel 9.45 (Verschwindende Taylorreihe).

Wir betrachten die Funktion

ψ : x { exp (1 x )falls x > 0 0 falls  x 0 ,

die nach Beispiel 8.23 glatt ist und ψ(n)(0) = 0 für alle n 0 erfüllt. Wir zeigen, dass sich ψ nicht durch eine Potenzreihe um 0 darstellen lässt.

Wir nehmen also indirekt an, dass es eine Potenzreihe f(x) = n=0cnxn mit reellen Koeffizienten und Konvergenzradius R > 0 gibt, so dass f(x) = ψ(x) für alle x (R, R). Nach Korollar 9.11 (oder genauer Übung 9.12) ist f(n)(0) = cnn!. Aber da f(x) = ψ(x) für alle x (R,R) angenommen wurde und da Ableiten eine lokale Operation ist, schliessen wir, dass f(n) (0) = 0 und somit cn = 0 für alle n 0 . Dies widerspricht jedoch ψ(x) > 0 für alle x > 0. Also kann ψ in keiner Umgebung von 0 durch eine Potenzreihe dargestellt werden.

Folgender Satz liefert nun einen direkten Vergleich zwischen einer Funktion und ihrer Taylor-Approximationen. Er impliziert für viele Funktionen, dass sie mit ihrer Taylorreihe übereinstimmen.

Theorem 9.46 (Taylor-Approximation).

Sei (a, b) ein offenes, nicht-leeres Intervall und sei f : (a,b) eine (n + 1)-mal stetig differenzierbare Funktion. Sei x0 (a,b). Dann gilt für alle x (a,b)

f (x) = Px0,nf (x) + R x0,nf (x),

wobei Px0 ,n f die n-te Taylor-Approximation ist und wir den Fehlerterm Rx0,nf durch das sogenannte Integral-Restglied

x (a,b)Rx0,nf (x) =x0xf(n+1) (t) (x t)n n! d t

darstellen können. Dies gilt auch für Funktionen auf [x0 , b) und Punkte x [x0,b) (beziehungsweise (a,x0] und x (a, x0]).

Die Annahme im Theorem, dass f eine (n + 1)-mal stetig differenzierbare Funktion ist, ist essentiell für obige Formulierung. In der Tat ist damit f(n+1) eine stetige Funktion und das Integral der stetigen Funktion t f(n+1) (t)(xt)n n! im Integral-Restglied existiert.

Beweis von Satz 9.46.

Das Theorem ergibt sich mit Induktion über n und partieller Integration (die ebenso für komplexwertige Funktionen auf (a, b) gilt, wieso?). Ist n = 0 und f : (a, b) stetig differenzierbar, so gilt nach dem Fundamentalsatz der Differential- und Integralrechnung (genauer Korollar 9.5)

f (x) = f (x0) +x0xf (t)d t = P x0,0f (x) + R x0,0f (x).

Ist f nun zweimal stetig differenzierbar (also n = 1), so können wir auf obiges Integral partielle Integration mit u(t) = f (t) und v(t) = t x anwenden und erhalten

f(x) = f (x0) + [f(t)(t x)] t=x0t=x x0xf (t) (t x)d t = f (x0) + f (x 0) (x x0) +x0xf (t) (x t)1 1! d t = Px0,1f (x) + R x0,1f (x).

Wir sehen also wie sich ausgehend vom Fundamentalsatz mittels partieller Integration der nächste Fall des Satzes ergibt.

Angenommen die Aussage des Satzes stimmt für n 1 0 und sei f : (a, b) eine (n + 1)-mal stetig differenzierbare Funktion. Dann gilt auf Grund der Induktionsvorraussetzung

f (x) = k=0n1f(k)(x0) k! (x x0)k +x0xf(n) (t) (x t)n1 (n 1)! d t

für alle x (a,b).

Wir setzen u(t) = f(n)(t) und v (t ) = (xt)n n! , bemerken v (t) = (xt)n1 (n1)! und wenden partielle Integration an, um

f(x) = k=0n1f(k)(x0) k! (x x0)k [f(n)(t)(x t)n n! ]t=x0t=x +x0xf(n+1) (t) (x t)n n! d t = k=0nf(k)(x0) k! (x x0)k +x0xf(n+1) (t) (x t)n n! d t

zu erhalten. Dies beweist den Induktionsschritt und damit den Satz.   

Oft werden wir das Theorem von Taylor (Theorem 9.46) in folgender Form verwenden.

Korollar 9.47 (Taylor-Abschätzung).

Sei (a, b) ein offenes, nicht-leeres Intervall, sei f : (a,b) eine (n + 1)-mal stetig differenzierbare Funktion und seien x0,x (a,b) zwei Punkte. Wir setzen Mn+1 = max {|f(n+1)(t)|t zwischen x0 und x}. Dann gilt

|f (x) Px0,nf (x)| = |R x0,nf (x)| Mn+1|x x0|n+1 (n + 1)! .

Insbesondere ist f (x) = Px0,nf (x) + O((x x0)n+1) für x x0 .

Beweis.

Angenommen x x0. Dann gilt

|Rx0,nf (x)| x0x |f(n+1) (t)| (x t)n n! d t Mn+1 n! x0x(x t)n d t = Mn+1 n! [ 1 n + 1(x t)n+1] x0x = Mn+1(x x0)n+1 (n + 1)! .

Der Beweis für x < x0 ist analog ausgehend von

|Rx0,nf (x)| = |x0xf(n+1) (t) (x t)n n! d t| xx0 |f(n+1) (t)|(t x)n n! d t.   

Bemerkung.

Wir hätten andere Versionen des obigen Satz zu Taylor-Approximationen bereits in Abschnitt 8.2 für reellwertige Funktionen beweisen können. Dies sogar unter der etwas schwächeren Annahme an die (n + 1)-te Ableitung, dass diese bloss zwischen x0 und x existieren soll und nicht unbedingt stetig sein muss. Unter dieser Voraussetzung gibt es ein ξC zwischen x0 und x, so dass das sogenannte Restglied nach Cauchy durch

Rx0,nf (x) = 1 n!f(n+1) (ξ C) (x ξC)n (x x 0)

gegeben ist. Es gibt unter denselben Voraussetzungen auch ein ξL zwischen x0 und x, so dass das Restglied nach Lagrange durch

Rx0,nf (x) = 1 (n + 1)!f(n+1) (ξ L) (x x0)n+1

gegeben ist. Wir verweisen dafür auf folgende Übung.

Übung 9.48 (Andere Formeln für das Restglied).

Gegeben sei ein nicht-leeres Intervall (a,b) , Zahlen x, x0 (a,b) und eine (n + 1)-mal differenzierbare Funktion f : (a,b) .

(a)
Zeigen Sie, dass die Ableitung der Funktion F : t (a,b) k=0nf(k)(t) k! (x t)k,

durch t (a,b)f(n+1)(t) n! (x t)n gegeben ist.

(b)
Wenden Sie den Mittelwertsatz (Theorem 8.29) auf die obige Funktion F an, um die Formel Rx0,nf (x) = 1 n!f(n+1) (ξC) (x ξC) n (x x0) für das Restglied nach Cauchy zu beweisen.
(c)
Verwenden Sie den verallgemeinerten Mittelwertsatz (Satz 8.48) für obiges F und die Funktion g : t(x t)n+1, um die Formel Rx0,nf (x) = 1 (n+1)!f(n+1) (ξL) (x x0)n+1 für das Restglied nach Lagrange zu beweisen.

Beispiel 9.49 (Extremwerte).

Wir wollen die Taylor-Approximation verwenden um die Diskussion in Abschnitt 8.1.3 und Korollar 8.37 zu verfeinern. Sei (a, b) ein offenes, nicht-leeres Intervall und sei f : (a,b) eine n-mal stetig differenzierbare Funktion. Angenommen x0 (a,b) erfüllt

f(x 0) = = f(n1)(x 0) = 0.

Dann gelten folgende Implikationen.

Falls f(n) (x0) < 0 ist und n gerade ist, so nimmt f in x0 ein lokales Maximum an.
Falls f(n) (x0) > 0 ist und n gerade ist, so nimmt f in x0 ein lokales Minimum an.
Falls f(n) (x0)0 und n ungerade ist, so nimmt f in x0 kein lokales Extremum an.

Alle drei Aussagen folgen aus der Taylor-Approximation in Theorem 9.46, die in diesem Fall für x (a, b) die Form

f (x) = f (x0) +x0xf(n) (t) (x t)n1 (n 1)! d t

annimmt. Falls f(n)(x0) > 0 ist, existiert ein δ > 0 mit f(n) (t) > 0 für alle t (x0 δ, x0 + δ). Wir betrachten nun mehrere Fälle. Ist x (x0,x0 + δ), so ist obiges Integral positiv und damit f(x) > f(x0). Ist x (x0 δ,x0) und n 1 gerade, so ist obiges Integral (auf Grund der umgekehrten Reihenfolge der Integrationsgrenzen) negativ, womit f(x) < f(x0) gilt und f in x0 kein lokales Extremum annimmt. Ist hingegen x (x0 δ,x0) und n 1 ungerade, so ergibt sich auf dieselbe Weise f(x) > f(x0), womit f ein lokales Minimum in x0 annimmt. Für f(n) (x0) < 0 können wir obige Diskussion auf f anwenden.

9.4.1 Analytische Funktionen

Applet 9.50 (Taylor-Approximationen).

Wir stellen einige Taylor-Approximationen bei verschiebbaren Fusspunkten zu bekannten Funktionen dar.

Betrachtet man eine glatte Funktion f in Theorem 9.46, für die der Wert der Ableitung von f nicht zu wild wird für hohe Ableitungen, dann geht das Restglied zu einem fest gewählten x für n gegen Null und die Funktion f wird durch ihre Taylorreihe beschrieben. Wie bereits gesehen, muss dies jedoch nicht unbedingt der Fall sein. Eine mögliche Abschätzung, die ausreichen würde, ist

max t[x0,x] |f(n+1) (t)| cAn

für alle n und zwei Konstanten c,A 1. Eine Abschätzung dieser Art findet man beispielsweise für exp , sin , cos und Kombinationen dieser Funktionen.

Übung 9.51.

Sei [a, b] ein kompaktes Intervall mit Endpunkten a < b.

(a)
Sei f : [a, b] ein Polynom oder eine der Funktionen exp ,sin ,cos . Zeigen Sie, dass Konstanten c,A 1 mit max t[a,b] |f(n+1) (t)| cAn (9.9)

existieren.

(b)
Zeigen Sie, dass falls f,g : [a,b] Funktionen mit der Eigenschaft (9.9) auch f + g und f g diese Eigenschaften besitzen.

Eine Funktion, die sich um jeden Punkt im Definitionsbereich als Potenzreihe darstellen lässt, nennen wir analytisch. Genauer sei (a, b) ein offenes, nicht-leeres Intervall und f : (a, b) eine glatte Funktion. Die Funktion f heisst analytisch, falls die Taylorreihe von f um jeden Punkt in x0 (a,b) positiven Konvergenzradius R hat und auf (x0 R,x0 + R) (a,b) mit f übereinstimmt.

Wir wollen ein weiteres Beispiel, wo sich eine glatte Funktion mit ihrer Taylorreihe vergleichen lässt, Interessierten als Übung überlassen (vergleichen Sie dies mit Übung 9.14).

Übung 9.52.

Sei α . Zeigen Sie, dass

(1 + x)α = n=0α nxn

für alle x (1,1), wobei für n 0

α n = 1 n! k=0n1 (α k) = α(α 1)(α n + 1) n! .
Hinweis.

Sei f : x (1,1)(1 + x)α. Berechnen Sie zuerst f(n) für alle n und geben Sie die Taylorreihe von f um Null an. Zeigen Sie dann, dass das Restglied klein wird.

Bemerkung.

Analytische Funktionen haben im Zusammenhang mit „holomorphen Funktionen“ auf offenen Teilmengen von nach eine schöne, geschlossene Behandlung, die in der Vorlesung „Funktionentheorie“ im zweiten Studienjahr thematisiert wird. Der komplexe Blickwinkel erklärt zum Beispiel, warum die analytische Funktion x 1 1+x2 bei x0 = 0 eine Taylorreihe mit Konvergenzradius 1 besitzt, obwohl die Funktion auf ganz  definiert ist.

9.4.2 Konvergenzgeschwindigkeit des Newton-Verfahrens*

Als Anwendung des Satzes von Taylor (Theorem 9.46) möchten wir in diesem Teilabschnitt das Newton-Verfahren zur approximativen Berechnung einer Nullstelle einer gegebenen Funktion diskutieren. Weitere Anwendung werden in den nächsten Abschnitten dieses Kapitels folgen.

Beispiel 9.53.

Sei [a, b] ein kompaktes Intervall mit Endpunkten a < b und f : [a, b] eine stetig differenzierbare Funktion mit f(x) > 0 für alle x [a,b]. (Wir erinnern daran, dass dies im Allgemeinen nicht dasselbe wie strenge Monotonie von f ist, aber strenge Monotonie impliziert.) Angenommen es gilt f(a) < 0 und f(b) > 0. Dann gibt es auf Grund des Zwischenwertsatzes (Satz 3.58) ein z [a, b] mit f(z) = 0, das wegen der strengen Monotonie von f eindeutig bestimmt ist. Beginnend mit einem gewählten Punkt x0 [a, b] definieren wir rekursiv

xn+1 = xn f(xn) f(xn) (9.10)

für alle n 0 (falls xn [a,b]). Die Idee hinter diesem Verfahren möchten wir in folgendem Bild erklären.

PIC

     Figur 9.2: In einem ersten Schritt approximiert man f mit der Tangenten g0 : tf(x0) + f(x0)(t x0) bei x0. Von dieser berechnet man nun die eindeutige Nullstelle x1 = x0 f(x0) f(x0). In einem zweiten Schritt verwendet man nun diesen neuen Punkt x1 und berechnet die eindeutige Nullstelle x2 der Tangenten g1 bei x1. Dies führt man iterativ so fort.     

Falls die Folge (xn)n definiert ist (das heisst, xn [a,b] für alle n ) und konvergiert, dann ist ihr Grenzwert eine Nullstelle von f und somit unter unseren Annahmen gleich der Nullstelle z. In der Tat gilt für z = lim nxn

z = lim nxn = lim nxn+1 = lim n (xn f(xn) f(xn) ) = z f(z) f(z)

und somit f(z) = 0 und z = z.

Das Konvergenzverhalten der Folge (xn)n ist im Allgemeinen sehr chaotisch. Unter etwas stärkeren Annahmen möchten wir nun aber zeigen, dass die Folge (xn)n konvergiert und die Konvergenzgeschwindigkeit untersuchen.

Wir nehmen zusätzlich an, dass f zweimal stetig differenzierbar ist und definieren

M = max {|f (t)|t [a,b]} m = min {|f(t)|t [a,b]}.

Nun wenden wir Korollar 9.47 an, um den Fehlerterm Rx0 ,1 f bei der Approximation von f durch die Tangente um x0 abzuschätzen. Bei der Nullstelle z ergibt dies

|Rx0,1f (z)| M|z x0|2 2 (9.11)

Des Weiteren gilt per Definition

0 = f (z) = f (x0) + f (x 0) (z x0) + Rx0,1f (z). (9.12)

Wir dividieren Gleichung (9.12) durch f(x0) und erhalten

0 = z (x0 f(x0) f(x0) ) = x1 + Rx0,1f(z) f(x0) .

Mit der Abschätzung (9.11) ergibt dies

|x1 z| = |Rx0,1f(z) f(x0) | M 2m |x0|2 (9.13)

Falls nun 𝜀 (0, m M) klein genug ist, so dass B𝜀(z) [a,b] gilt, und falls x0 B𝜀(z) ist, dann folgt aus (9.13), dass

|x1 z| M 2m|x0 z|2 M 2m|x0 z|𝜀 1 2|x0 z| < 𝜀 2.

Daher liegt x1 auch in [a, b] und ist bereits näher an z als x0 . Komplett analog beweist man, dass für alle n 0

|xn+1 z| 1 2|xn z|

gilt, was mit vollständiger Induktion auch

|xn z| 2n|x 0 z|

für alle n 0 zeigt. Insbesondere konvergiert die Folge (xn)n und wir können das Newton-Verfahren (unter geeigneter Wahl eines Startpunktes x0 ) verwenden, um die Nullstelle mit hoher Genauigkeit zu approximieren. Die Konvergenz ist noch schneller als diese Abschätzung beweist; man spricht von quadratischer Konvergenz.

Übung 9.54 (Quadratische Konvergenz).

Wir möchten die Konvergenzgeschwindigkeit des Newton-Verfahrens hier genauer analysieren. In obigem Beispiel wurde gezeigt, dass sich der Fehler in jedem Schritt mindestens halbiert. Wir betrachten nun das Argument etwas genauer (und behalten dementsprechend die Notation). Sei β = M 2m. Zeigen Sie für den mit β gewichteten Abstand β|xn z| die Abschätzung

β|xn z| (β|x0 z|)2n

für jedes n gilt.

Übung 9.55.

Verwenden Sie das Newton-Verfahren, um 2 (oder alternativ eine andere irrationale, reelle algebraische Zahl) auf drei Dezimalstellen genau zu berechnen. Für die genaue, numerische Berechnung des Resultats dürfen Sie einen Rechner oder ein Computer-Programm benutzen.

License

Analysis I (Kap. 1-9) Copyright © by Manfred Einsiedler. All Rights Reserved.

}