Wie wir bereits am Anfang von Kapitel 10 erwähnt haben, kann eine Abbildung der Form f:U→Rmf:U→Rm auf einer offenen Menge U⊆RnU⊆Rn verschiedene Bedeutungen haben. In diesem Kapitel werden wir folgende Blickwinkel in den Vordergrund stellen:
- Für m=nm=n könnte ff einen glatten Koordinatenwechsel («Diffeomorphismus» ) darstellen. Polar-, Zylinder-, und Kugelkoordinaten werden drei einfache Beispiele dafür darstellen.
- Für [latex]m
- Für n[latex]f(θ,φ)=(sinθcosφ,sinθsinφ,cosθ)n[latex]f(θ,φ)=(sinθcosφ,sinθsinφ,cosθ)
für (θ,φ)∈U(θ,φ)∈U zu parametrisieren. Die Abbildung ff liefert also gewissermassen Koordinaten auf der Sphäre S2S2 (und stellt, wenn man will, einen Teil eines Atlas zu S2S2 dar).
Wir beginnen unsere Diskussion mit dem zweiten Blickwinkel, doch deuten obige Beispiele schon an, dass die drei Themen eng miteinander verwandt sind. Die Sätze und Begriffe dieses Kapitels stellen die Anfänge der Differentialgeometrie dar, welche nebst grosser mathematischer Relevanz auch in anderen Fachgebieten wie zum Beispiel der allgemeinen Relativitätstheorie der Physik eine zentrale Rolle einnimmt.
11.1 – Sätze zur impliziten Funktion und zur inversen Abbildung
Innerhalb der Mathematik oder auch in Anwendungen treten oft Gleichungen der Form F(x,y)=0F(x,y)=0 auf, die man dann gerne als Definition einer «implizit definierten Funktion» y=y(x)y=y(x) auffassen würde. Zum Beispiel könnte FF das sehr konkrete Polynom
sein, womit wir bereits ein sehr schwieriges Problem vor uns haben: Wie können wir für ein vorgegebenes x∈Rx∈R die Lösung y=y(x)y=y(x) von F(x,y)=0F(x,y)=0 durch eine Formel angeben? Definiert dies überhaupt eine Funktion?
Da im Allgemeinen ein Polynom fünften Grades (hier y∈R↦F(x,y)y∈R↦F(x,y) für ein fest gewähltes x∈Rx∈R) bis zu fünf reelle Nullstellen besitzen kann, definiert F(x,y)=0F(x,y)=0 keine eindeutig bestimmte Funktion x↦y(x)x↦y(x). Wir werden dieses Problem im Folgenden umgehen, indem wir von einem bekannten Lösungspaar (x0,y0)(x0,y0) mit F(x0,y0)=0F(x0,y0)=0 ausgehen und für xx in der Nähe von x0x0 eine Lösung y=y(x)y=y(x) für F(x,y)=0F(x,y)=0 ebenfalls nur in der Nähe von y0y0 suchen. Unter geeigneten Annahmen wird dies yy eindeutig als Funktion von xx bestimmen.
Die Antwort auf die erste Frage ist vielleicht etwas überraschender. Selbst für eine polynomielle Gleichung der Form F(x,y)=0F(x,y)=0 wie oben gibt es im Allgemeinen keine Formel, die die gesuchte Lösung mittels Wurzelausdrücken bestimmt. (Der Beweis dieser Aussage verwendet Galois-Theorie aus der Vorlesung Algebra II im zweiten Studienjahr des Mathematikstudiums.)
Für gewisse nicht-polynomielle Gleichungen wie zum Beispiel
F(x,y)=x−y−ey=0F(x,y)=x−y−ey=0
ist es etwas weniger überraschend, dass wir keine konkrete Lösungsformel angeben können, selbst wenn für die Gleichung (11.1) zu jedem x∈Rx∈R ein eindeutig bestimmtes y=y(x)∈Ry=y(x)∈R mit x=y+eyx=y+ey existiert (wieso?). Dennoch wollen wir die Funktion auch ohne Angabe einer konkreten Formel weiter untersuchen.
Wir geben uns also im Zusammenhang mit einer impliziten Gleichung F(x,y)=0F(x,y)=0 die Aufgabe, ausgehend von einer Lösung (x0,y0)(x0,y0) mit F(x0,y0)=0F(x0,y0)=0, zu zeigen, dass es für jedes xx nahe an x0x0 ein eindeutig bestimmtes yy nahe an y0y0 gibt mit F(x,y)=0F(x,y)=0. Genauer werden wir offene Mengen U⊆RnU⊆Rn, V⊆RmV⊆Rm, eine Funktion F:U×V→RmF:U×V→Rm, eine Lösung (x0,y0)∈U×V(x0,y0)∈U×V der Gleichung F(x0,y0)=0F(x0,y0)=0 betrachten und zeigen, dass unter geeigneten Annahmen an FF bei (x0,y0)(x0,y0) eine lokale Lösungsfunktion y=f(x)y=f(x) existiert, die (mehrmals) stetig differenzierbar ist.
Auf der Suche nach einer inversen Funktion einer injektiven Funktion ff von U⊆RnU⊆Rn nach RnRn können wir durch F:U×Rn→RnF:U×Rn→Rn mit F(x,y)=f(x)−yF(x,y)=f(x)−y eine Funktion definieren, so dass für gegebenes yy die Lösungen x=x(y)x=x(y) der impliziten Gleichung F(x,y)=0F(x,y)=0 gerade die inverse Funktion beschreiben.
11.1.1 – Satz zur impliziten Funktion
Satz 11.1: Stetige lokale Lösungsfunktion
Sei r>0r>0 ein Radius und seien x0∈Rnx0∈Rn, y0∈Rmy0∈Rm Punkte. Wir betrachten die offene Teilmenge
\begin{aligned}[]B_r^{\mathbb {R}^n}(x_0) \times B_r^{\mathbb {R}^m}(y_0) = \left \lbrace {(x,y) \in \mathbb {R}^n \times \mathbb {R}^m} \mid {\| {x-x_0}\| _2[/latex]
von Rn×RmRn×Rm. Sei F:BRnr(x0)×BRmr(y0)→RmF:BRnr(x0)×BRmr(y0)→Rm eine stetige Funktion, die die folgenden drei Bedingungen erfüllt:
- F(x0,y0)=0F(x0,y0)=0.
- Die partiellen Ableitungen
∂ykF:BRnr(x0)×BRmr(y0)→Rm∂ykF:BRnr(x0)×BRmr(y0)→Rm
existieren für alle k∈{1,…,m}k∈{1,…,m} und sind auf BRnr(x0)×BRmr(y0)BRnr(x0)×BRmr(y0) stetig.
- Die totale Ableitung AA bei y0y0 der Abbildung y∈Br(y0)↦F(x0,y)y∈Br(y0)↦F(x0,y) ist invertierbar, das heisst, die Matrix A=(∂ykFj(x0,y0))j,k∈Matm,m(R)A=(∂ykFj(x0,y0))j,k∈Matm,m(R) hat nicht-verschwindende Determinante.
Dann existiert ein offener Ball U0=Bα(x0)U0=Bα(x0) um x0x0 und ein offener Ball V0=Bβ(y0)V0=Bβ(y0) um y0y0 mit α,β∈(0,r)α,β∈(0,r) und eine stetige Funktion f:U0→V0f:U0→V0, so dass für alle (x,y)∈U0×V0(x,y)∈U0×V0 die Gleichung F(x,y)=0F(x,y)=0 genau dann gilt, wenn y=f(x)y=f(x) gilt. Insbesondere ist f(x0)=y0f(x0)=y0.
Wie wir sehen werden, besteht unserer Beweis des obigen Satzes aus einem (leicht veränderten und auf höhere Dimensionen übertragenen) Newton-Verfahren (siehe Beispiel 8.65) und dem Banachschen Fixpunktsatz, wobei wir α,β>0α,β>0 geeignet wählen werden, um eine Lipschitz-Kontraktion auf einem vollständigen metrischen Raum zu erhalten.
Beweis
Da wir zu einem jeweils fest gewählten xx ein yy mit F(x,y)=0F(x,y)=0 suchen wollen, wird die Notation Fx(y)=F(x,y)Fx(y)=F(x,y) für (x,y)∈Br(x0)×Br(y0)(x,y)∈Br(x0)×Br(y0) nützlich sein. Wir verwenden diese bereits, um für ein festes x∈Br(x0)x∈Br(x0) die Hilfsfunktion
zu definieren. Diese entspricht gerade der Iterationsvorschrift im Newton-Verfahren, wobei wir allerdings die Ableitung von FxFx bei yy schlicht durch A=Dy0Fx0A=Dy0Fx0 ersetzt haben. Trotz dieser Änderungen bemerken wir, dass für (x,y)∈Br(x0)×Br(y0)(x,y)∈Br(x0)×Br(y0) die Gleichung F(x,y)=0F(x,y)=0 zur Fixpunktgleichung Tx(y)=yTx(y)=y äquivalent ist (wieso?).
Die Abbildung TxTx als Lipschitz-Kontraktion: Sei x∈Br(x0)x∈Br(x0). Nach Annahme und Satz 10.10 ist FxFx auf Br(y0)Br(y0) eine stetig differenzierbare Funktion, womit nach der Kettenregel TxTx ebenso stetig differenzierbar ist mit Ableitung
für y∈Br(y0)y∈Br(y0), wobei Im∈Matm,m(R)Im∈Matm,m(R) die Identitätsmatrix bezeichnet. Für x=x0x=x0 und y=y0y=y0 ergibt sich damit
Auf Grund der angenommenen Stetigkeit von (x,y)∈Br(x0)×Br(y0)↦DyFx(x,y)∈Br(x0)×Br(y0)↦DyFx existiert also ein δ∈(0,r)δ∈(0,r), so dass für alle (x,y)∈Bδ(x0)×Bδ(y0)(x,y)∈Bδ(x0)×Bδ(y0) die Abschätzung ‖DyTx‖op≤12∥DyTx∥op≤12 gilt.
Wir zeigen, dass dies die Lipschitz-Kontraktionseigenschaft impliziert. In der Tat folgt für x∈Bδ(x0)x∈Bδ(x0) und y1,y2∈Bδ(y0)y1,y2∈Bδ(y0) mit Hilfe des geraden Weges γ:t∈[0,1]↦(1−t)y1+ty2γ:t∈[0,1]↦(1−t)y1+ty2 von y1y1 nach y2y2 (mit Ableitung y2−y1y2−y1)
Sei nun β=δ2β=δ2, V0=Bβ(y0)V0=Bβ(y0) und Y=¯Bβ(y0)Y=¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bβ(y0). Wir erhalten also, dass für jedes fest gewählte x∈Bδ(x0)x∈Bδ(x0) die eingeschränkte Abbildung (wieder mit TxTx bezeichnet)
die eine Lipschitz-Kontraktion mit Lipschitz-Konstante 1212 ist. Um den Banachschen Fixpunktsatz anwenden zu können, müssen wir noch Tx(Y)⊆YTx(Y)⊆Y zeigen.
Eine Selbstabbildung: Nach Stetigkeit von FF und wegen F(x0,y0)=0F(x0,y0)=0 existiert ein α∈(0,δ)α∈(0,δ), so dass für alle x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0) die Abschätzung
gilt. Falls nun x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0) und y∈Y=¯Bβ(y0)y∈Y=¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bβ(y0) sind, dann folgt
\begin{aligned}[]\| {T_x(y)-y_0}\| &= \| {T_x(y) - T_x(y_0) + T_x(y_0)-y_0}\| \nonumber \\ &\leq \| {T_x(y) - T_x(y_0)}\| + \| {T_x(y_0)-y_0}\| \nonumber \\ &\leq \tfrac {1}{2} \| {y-y_0}\| + \tfrac {\beta }{3} \leq \tfrac {5}{6} \beta\begin{aligned}[]\| {T_x(y)-y_0}\| &= \| {T_x(y) - T_x(y_0) + T_x(y_0)-y_0}\| \nonumber \\ &\leq \| {T_x(y) - T_x(y_0)}\| + \| {T_x(y_0)-y_0}\| \nonumber \\ &\leq \tfrac {1}{2} \| {y-y_0}\| + \tfrac {\beta }{3} \leq \tfrac {5}{6} \beta
Für x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0) und den oben definierten und nach Proposition 9.52 vollständigen metrischen Raum Y=¯Bβ(y0)Y=¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bβ(y0) gilt daher Tx(Y)⊆YTx(Y)⊆Y. Aus dem Banachschen Fixpunktsatz (Satz 9.54) folgt, dass es einen eindeutig bestimmten Punkt y∈Yy∈Y mit Tx(y)=yTx(y)=y gibt. Auf Grund von (11.2) gilt des Weiteren [latex]\| {y-y_0}\|
Definition der Lösungsfunktion
Zusammenfassend haben wir also gezeigt, dass es für jedes x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0) ein eindeutig bestimmtes y=y(x)∈¯Bβ(y0)y=y(x)∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bβ(y0) mit F(x,y)=0F(x,y)=0 gibt, welches zusätzlich auch y∈Bβ(y0)y∈Bβ(y0) erfüllt. Dies definiert somit eine Funktion f:¯Bα(x0)→Bβ(y0)f:¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0)→Bβ(y0) mit der Eigenschaft F(x,f(x))=0F(x,f(x))=0 für alle x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0).
Stetigkeit der Lösungsfunktion: Um die Stetigkeit von ff zu zeigen, wiederholen wir obiges Argument für alle x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0) «gleichzeitig» . Wir betrachten dazu die Teilmenge
Nach Satz 9.86 ist C(¯Bα(x0),Rm)C(¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0),Rm) ausgestattet mit der Supremumsnorm
ein vollständiger metrischer Raum. Da YY abgeschlossen ist, folgt des Weiteren, dass ˜Y~Y als abgeschlossene Teilmenge ebenso vollständig ist. (Wieso?)
Zu einer Funktion g∈˜Yg∈~Y definieren wir nun die Funktion
welche auf Grund der Stetigkeit von g∈˜Yg∈~Y und FF wiederum stetig ist. Für g∈˜Yg∈~Y gilt nach Definition ‖g(x)−y0‖≤β∥g(x)−y0∥≤β für alle x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0) und somit gilt auf Grund von (11.2) auch [latex]\| {\tilde {T}g(x)-y_0}\|
da TxTx Lipschitz-stetig ist mit Lipschitz-Konstante 1212.
Dies zeigt, dass ˜T:˜Y→˜Y~T:~Y→~Y eine Lipschitz-Kontraktion auf einem vollständigen metrischen Raum darstellt und damit nach dem Banachschen Fixpunktsatz einen eindeutig bestimmten Fixpunkt besitzt. Sei y=˜Tyy=~Ty dieser Fixpunkt. Dann ist yy stetig und für alle x∈¯Bα(x0)x∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bα(x0) gilt y(x)=˜Ty(x)=Tx(y(x))∈Bβ(y0)y(x)=~Ty(x)=Tx(y(x))∈Bβ(y0), wodurch y(x)=f(x)y(x)=f(x) die eindeutige Lösung der Gleichung F(x,y)=0F(x,y)=0 mit y∈¯Bβ(y0)y∈¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Bβ(y0) sein muss. ∎
Wie wir in obigem Satz gesehen haben, «erbt» die Lösungsfunktion ff die Stetigkeitseigenschaft von der Funktion FF, die die implizite Gleichung definiert. Wir möchten nun zeigen, dass dasselbe auch für Differenzierbarkeit zutrifft.
Satz 11.2: Differenzierbarkeit der lokalen Lösungsfunktion
Seien r>0r>0, x0∈Rnx0∈Rn, y0∈Rmy0∈Rm und F:Br(x0)×Br(y0)→RmF:Br(x0)×Br(y0)→Rm mit den Eigenschaften aus Satz 11.1 und sei f:U0→V0f:U0→V0 die stetige lokale Lösungsfunktion aus Satz 11.1. Angenommen FF ist dd-mal stetig differenzierbar für d≥1d≥1. Dann ist die stetige Lösungsfunktion ff ebenso dd-mal stetig differenzierbar und die Ableitung von ff bei x∈U0x∈U0 ist durch
Dxf=−((∂∂yF)(x,f(x)))−1(∂∂xF)(x,f(x))Dxf=−((∂∂yF)(x,f(x)))−1(∂∂xF)(x,f(x))
gegeben.
Dabei bezeichnet ∂∂xF(x,y)∂∂xF(x,y) die Matrix der partiellen Ableitungen von FF in den Koordinatenrichtungen der Variable x∈Br(x0)x∈Br(x0) ausgewertet an der Stelle (x,y)(x,y), das heisst,
Alternativ könnte man, konform mit unserer bisherigen Notation, auch schreiben
womit also ∂∂xF(x,y)∂∂xF(x,y) die Ableitung nach xx unter Festhalten von yy an der Stelle (x,y)(x,y) bezeichnet. Analog ist ∂∂yF(x,y)∂∂yF(x,y) die Ableitung nach yy unter Festhalten von xx an der Stelle (x,y)(x,y)
Wir bemerken noch, dass a priori die Existenz der Inversen dieser Matrix an der Stelle (x,f(x))(x,f(x)) nicht klar ist und im Beweis unten nachgewiesen wird.
Falls bereits bekannt wäre, dass ff in der Tat differenzierbar ist, so würde (11.3) auch aus der Kettenregel folgen. Um dies zu sehen, nehmen Sie zuerst m=n=1m=n=1 an und wenden die Kettenregel auf F(x,f(x))=0F(x,f(x))=0 an. Der allgemeine Fall ist bloss in der Notation schwieriger.
Beispiel 11.3: Zum Differential der impliziten Funktion
- Der Einheitskreis S1S1 in R2R2 ist definiert durch die Gleichung x2+y2=1x2+y2=1. Nahe jedem Punkt (x0,y0)∈S1(x0,y0)∈S1 mit x0≠0x0≠0 ist diese Gleichung nach der Variablen xx auflösbar und für die so definierte implizite Funktion x=x(y)x=x(y) erhalten wir durch Ableiten der definierenden Gleichung nach yy und Auswerten im Punkt (x0,y0)(x0,y0)
2x0x′(y0)+2y0=0,2x0x′(y0)+2y0=0,
also x′(y0)=−y0x0x′(y0)=−y0x0.
- Die Funktion F:R4→R2F:R4→R2 sei definiert durch
F(x,y,z,w)=(x2+y+z−2y−2z+w3)F(x,y,z,w)=(x2+y+z−2y−2z+w3)
für (x,y,z,w)t∈R4(x,y,z,w)t∈R4. Wir wollen die Auflösbarkeit der Gleichung F(x,y,z,w)=0F(x,y,z,w)=0 in einer Umgebung des Punktes (x0,y0,z0,w0)=(0,1,1,1)(x0,y0,z0,w0)=(0,1,1,1) untersuchen. Dazu betrachten wir das Differential
D(x0,y0,z0,w0)F=(011001−23).D(x0,y0,z0,w0)F=(011001−23).Der Satz über implizite Funktionen besagt nun, dass wir die Gleichung F(x,y,z,w)=0F(x,y,z,w)=0 nahe (x0,y0,z0,w0)(x0,y0,z0,w0) nach zwei der Variablen x,y,z,wx,y,z,w auflösen können, sofern die 2×22×2-Teilmatrix obigen Differentials bestehend aus den zu diesen Variablen gehörigen partiellen Ableitungen invertierbar ist. Zum Beispiel ist dies der Fall für das Variablenpaar yy und ww, da die Teilmatrix (1013)(1013) bestehend aus der 2. und 4. Spalte invertierbar ist. Die Ableitung der so definierten impliziten Funktionen y=y(x,z)y=y(x,z) und w=w(x,z)w=w(x,z) in (x0,z0)=(0,1)(x0,z0)=(0,1) ist gemäss der Formel in Satz 11.2 dann gegeben durch
D(x0,z0)(yw)=−(1013)−1(010−2)=(0−101).D(x0,z0)(yw)=−(1013)−1(010−2)=(0−101).
Beweis von Satz 11.2
Nach Annahme in Satz 11.1 ist A=Dy0Fx0A=Dy0Fx0 invertierbar, wobei wir wieder die Notation Fx0(y)=F(x0,y)Fx0(y)=F(x0,y) für y∈Br(y0)y∈Br(y0) aus dem Beweis von Satz 11.1 verwenden. Seien weiter TxTx, δ>0δ>0 mit ‖DyTx‖≤12∥DyTx∥≤12 für alle (x,y)∈Bδ(x0)×Bδ(y0)(x,y)∈Bδ(x0)×Bδ(y0) sowie αα und ββ ebenso wie im letzten Beweis. Dann gilt DyTx=Im−A−1(DyFx)DyTx=Im−A−1(DyFx) und dadurch auch
für alle (x,y)∈Bδ(x0)×Bδ(y0)(x,y)∈Bδ(x0)×Bδ(y0). Daraus folgt (siehe Übung 11.4), dass A−1(DyFx)A−1(DyFx) invertierbar ist und
Insbesondere ist ∂∂yF(x,y)=DyFx=A(A−1(DyFx))∂∂yF(x,y)=DyFx=A(A−1(DyFx)) für alle (x,y)∈Bδ(x0)×Bδ(y0)(x,y)∈Bδ(x0)×Bδ(y0) als Produkt invertierbarer Matrizen invertierbar. Da α,β∈(0,δ)α,β∈(0,δ) sind und f(Bα(x0))⊆Bβ(y0)f(Bα(x0))⊆Bβ(y0) ebenso in Bδ(y0)Bδ(y0) enthalten ist, folgt insbesondere, dass der Ausdruck
in (11.3) für alle x∈Bα(x0)x∈Bα(x0) definiert ist.
Um Differenzierbarkeit von ff und (11.3) zu beweisen, fixieren wir x∈Bα(x0)x∈Bα(x0) und definieren Ax=∂∂yF(x,f(x))Ax=∂∂yF(x,f(x)) sowie Lx=−A−1x∂∂xF(x,f(x))Lx=−A−1x∂∂xF(x,f(x)). Für genügend kleine h∈Rnh∈Rn mit x+hx+h in Bα(x0)Bα(x0) erhalten wir damit
wobei wir A−1xA−1x herausgehoben haben und die Definition der Matrixnorm verwendeten. Wir bemerken nun, dass der Ausdruck ∂∂xF(x,f(x))h+∂∂yF(x,f(x)(f(x+h)−f(x))∂∂xF(x,f(x))h+∂∂yF(x,f(x)(f(x+h)−f(x)) genau die totale Ableitung von FF in (x,f(x))(x,f(x)) angewendet auf den Vektor (\arraycolsep=0.3\arraycolsep\ensuremathhf(x+h)−f(x))(\arraycolsep=0.3\arraycolsep\ensuremathhf(x+h)−f(x)) ist. Als nächstes ändern wir das Vorzeichen dieses Terms innerhalb der Norm und fügen die Funktionswerte von FF bei (\arraycolsep=0.3\arraycolsep\ensuremathxf(x))(\arraycolsep=0.3\arraycolsep\ensuremathxf(x)) beziehungsweise (\arraycolsep=0.3\arraycolsep\ensuremathx+hf(x+h))(\arraycolsep=0.3\arraycolsep\ensuremathx+hf(x+h)) hinzu. Dies führt zu
‖f(x+h)−f(x)−Lx(h)‖≤‖A−1x‖op‖F((\arraycolsep=0.3\arraycolsep\ensuremathx+hf(x+h)))⏟=0−F((\arraycolsep=0.3\arraycolsep\ensuremathxf(x)))⏟=0−D(x,f(x))F(\arraycolsep=0.3\arraycolsep\ensuremathhf(x+h)−f(x))‖≤‖A−1x‖op α(h) ‖(\arraycolsep=0.3\arraycolsep\ensuremathhf(x+h)−f(x))‖≤‖A−1x‖op α(h) (‖h‖+‖f(x+h)−f(x)‖)∥f(x+h)−f(x)−Lx(h)∥≤∥A−1x∥op∥∥F((\arraycolsep=0.3\arraycolsep\ensuremathx+hf(x+h)))=0−F((\arraycolsep=0.3\arraycolsep\ensuremathxf(x)))=0−D(x,f(x))F(\arraycolsep=0.3\arraycolsep\ensuremathhf(x+h)−f(x))∥∥≤∥A−1x∥op α(h) ∥∥(\arraycolsep=0.3\arraycolsep\ensuremathhf(x+h)−f(x))∥∥≤∥A−1x∥op α(h) (∥h∥+∥f(x+h)−f(x)∥)
mit α(h)=o(1)α(h)=o(1) für h→0h→0, da FF bei (x,f(x))(x,f(x)) differenzierbar ist und ff stetig ist. Dies wäre die gewünschte Abschätzung für die Differenzierbarkeit von ff, wenn rechts nicht der Term ‖f(x+h)−f(x)‖∥f(x+h)−f(x)∥ auftauchen würde. Wir können diesen jedoch mit einer kleinen Rechnung loswerden, wozu wir a=‖A−1x‖opa=∥A−1x∥op und b=‖Lx‖opb=∥Lx∥op setzen, um den Fokus auf das Wesentliche zu lenken. Es gilt
und daher auch
Da α(h)=o(1)α(h)=o(1) für h→0h→0, gibt es nun ein ρ∈(0,1)ρ∈(0,1) klein genug, so dass aα(h)≤12aα(h)≤12 für alle h∈Bρ(0)h∈Bρ(0). Damit ergibt sich 1−aα(h)≥121−aα(h)≥12 und
für c=2(12+b)c=2(12+b). Wir setzen dies in (11.4) ein und erhalten
für h∈Bρ(0)h∈Bρ(0). Da α(h)=o(1)α(h)=o(1) für h→0h→0, ergibt dies die Differenzierbarkeit von ff sowie die Gleichung (11.3) für jedes x∈Bα(x0)x∈Bα(x0).
Sei nun FF zweimal stetig differenzierbar. Nach Gleichung (11.3) gilt, dass die partiellen Ableitungen von ff sich durch die Inversenbildung einer invertierbaren Matrix und den ersten partiellen Ableitungen von FF ausgewertet bei (x,f(x))(x,f(x)) ausdrücken lassen. Wir bemerken, dass die Einträge der Inverse einer Matrix sich wiederum durch ein Polynom in den Einträgen der Matrix und der Inversen der Determinante ausdrücken lassen (nach der Cramer’schen Regel). Das heisst, die partiellen Ableitungen lassen sich als Summen von Produkten darstellen, wobei jeder Faktor entweder der Kehrwert von h(x)=det(∂∂yF(x,f(x)))h(x)=det(∂∂yF(x,f(x))) ist oder eine erste partiellen Ableitung von FF ausgewertet bei (x,f(x))(x,f(x)) ist. Da wir bereits wissen, dass ff differenzierbar ist mit stetiger Ableitung, können wir nun diese partiellen Ableitungen nochmals ableiten: Summen von Produkten werden von einer partiellen Ableitung wieder auf Summen von Produkten abgebildet, wobei die Faktoren entweder unverändert bleiben oder diese partiell abgeleitet werden. Nach der Kettenregel hat aber jede partielle Ableitung von FF ausgewertet bei (x,f(x))(x,f(x)) wieder eine stetige partielle Ableitung (da ja ff stetig differenzierbar ist). Dieses Argument gilt ebenso für h(x)h(x) und es folgt, dass die partielle Ableitung von h(x)−1h(x)−1 gleich −h(x)−2−h(x)−2 mal der partiellen Ableitung von h(x)h(x) ist. Es folgt also, dass jede zweite partielle Ableitung existiert und als eine Summe von Produkten dargestellt werden kann, wobei die Faktoren entweder eine Potenz von h−1h−1, erste oder zweite partielle Ableitungen von FF ausgewertet bei (x,f(x))(x,f(x)) sind.
Mit Induktion nach dd ergibt sich dieselbe Aussage für alle partiellen Ableitungen bis zur Ordnung dd, da FF als dd-mal stetig differenzierbar vorausgesetzt wurde. ∎
Die obigen beiden Sätze zur impliziten Funktion (Satz 11.1 und Satz 11.2) hatten eher lange Beweise. Doch werden wir sehen, dass im restlichen Kapitel diese als wichtige Grundlage dienen und alle weitere Diskussionen dadurch viel einfacher werden.
Übung 11.4: Geometrische Reihe von Matrizen
Es bezeichne ‖⋅‖op∥⋅∥op die Matrixnorm (siehe Definition 9.75).
- Zeigen Sie, dass für B∈Matm,m(R)B∈Matm,m(R) mit ‖B‖op[latex](Im−B)−1=∞∑j=0Bj.∥B∥op[latex](Im−B)−1=∞∑j=0Bj.
Die Reihe ∑∞j=0Bj∑∞j=0Bj ist dabei als Grenzwert der Folge (∑nj=0Bj)n(∑nj=0Bj)n aufzufassen; ein Teil der Aussage ist also, dass diese Folge konvergiert (unter den getroffenen Annahmen).
11.1.2 – Satz zur inversen Abbildung
Wir möchten nun die Differenzierbarkeit der inversen Abbildung vom eindimensionalen Fall in Satz 7.14 auf Abbildungen f:U⊆Rn→f(U)⊆Rnf:U⊆Rn→f(U)⊆Rn verallgemeinern. Wie zu Beginn dieses Abschnitts erwähnt wurde, werden wir dazu den Satz der impliziten Funktion (Satz 11.2) verwenden.
Satz 11.5: Satz zur inversen Abbildung
Sei U⊆RnU⊆Rn offen und f:U→Rnf:U→Rn eine dd-mal stetig differenzierbare Funktion mit d≥1d≥1. Sei x0∈Ux0∈U mit invertierbarer totaler Ableitung Dx0f∈Matn,n(R)Dx0f∈Matn,n(R) (das heisst, x0x0 ist ein regulärer Punkt von ff). Dann gibt es eine offene Umgebung U0⊆UU0⊆U und eine offene Umgebung V0⊆f(U)V0⊆f(U) von y0=f(x0)y0=f(x0), so dass f|U0:U0→V0f|U0:U0→V0 bijektiv ist und die Umkehrabbildung ebenso dd-mal stetig differenzierbar ist. Des Weiteren gilt
für alle x∈U0x∈U0 und y=f(x)∈V0y=f(x)∈V0.
Die zentrale Bedingung in obigem Satz ist wohlgemerkt die Invertierbarkeit der totalen Ableitung bei x0x0. Diese verallgemeinert die zentrale Annahme in Satz 7.14, wo verlangt wurde, dass die Ableitung nicht verschwindet.
Satz 11.5 wird es uns in gewissen Fällen auch erlauben, eine globale Inverse zu finden.
Definition 11.6: Diffeomorphismus
Seien U,V⊆RnU,V⊆Rn offen. Eine bijektive, glatte Funktion f:U→Vf:U→V mit glatter Inversen f−1:V→Uf−1:V→U wird ein (glatter) Diffeomorphismus genannt. Sind ff und f−1f−1 jeweils bloss dd-mal stetig differenzierbar für d≥1d≥1, so nennen wir ff einen CdCd-Diffeomorphismus.
Satz 11.5 besagt also auch, dass eine glatte Funktion bei einem regulären Punkt lokal ein Diffeomorphismus auf eine offene Teilmenge im Bild ist.
Beweis von Satz 11.5
Sei r>0r>0 ein Radius mit Br(x0)⊆UBr(x0)⊆U. Wir definieren F:Br(x0)×Br(y0)→RnF:Br(x0)×Br(y0)→Rn durch
für (x,y)∈Br(x0)×Br(y0)(x,y)∈Br(x0)×Br(y0) und wir wollen die Gleichung F(x,y)=0F(x,y)=0 nach xx auflösen. Hierzu bemerken wir, dass FF dd-mal stetig differenzierbar ist, dass F(x0,y0)=0F(x0,y0)=0 ist und dass ∂∂xF(x0,y0)=Dx0f∂∂xF(x0,y0)=Dx0f per Annahme invertierbar ist. Daher erfüllt FF alle Voraussetzungen des Satzes über implizite Funktionen (Satz 11.1 und Satz 11.2, wobei xx und yy vertauschte Rollen einnehmen). Es folgt, dass es Radien α,β∈(0,r)α,β∈(0,r) und eine dd-mal stetig differenzierbare Funktion g:V0=Bβ(y0)→˜U=Bα(x0)g:V0=Bβ(y0)→~U=Bα(x0) gibt, sodass für alle (x,y)∈˜U×V0(x,y)∈~U×V0 die Äquivalenzen
y=f(x)⟺F(x,y)=0⟺x=g(y)y=f(x)⟺F(x,y)=0⟺x=g(y)
gelten. Wir definieren U0=˜U∩f−1(V0)U0=~U∩f−1(V0), welche als Durchschnitt zweier offener Mengen (siehe Proposition 9.37) wieder offen ist. Aus (11.5) folgt nun, dass f|U0:U0→V0f|U0:U0→V0 invertierbar ist (und insbesondere V0⊆f(U)V0⊆f(U) ist) und dass g=(f|U0)−1:V0→U0g=(f|U0)−1:V0→U0 die inverse Abbildung ist.
Aus Satz 11.2 folgt weiters, dass gg dd-mal stetig differenzierbar ist und dass für x∈U0x∈U0 und y=f(x)∈V0y=f(x)∈V0
(was auch aus der Kettenregel und g∘f|U0=IU0g∘f|U0=IU0 folgt). Dies beendet den Beweis des Satzes. ∎
Übung 11.7
Verwenden Sie den Satz zur inversen Abbildung (Satz 11.5), um den Satz zur impliziten Abbildung (Satz 11.1 und Satz 11.2) zu beweisen.
Hinweis.
Betrachten Sie für eine Gleichung F(x,y)=0F(x,y)=0 die Funktion f(x,y)=(x,F(x,y))f(x,y)=(x,F(x,y)) auf geeigneten Teilmengen.
Wir wollen hier noch betonen, dass obiger Existenzsatz für inverse Abbildungen wirklich nur eine lokale Aussage liefert. In mehr als einer Dimension gibt es kein lokales Kriterium für die Injektivität einer Abbildung f:U→Vf:U→V (im Gegensatz zur Kombination von Korollar 7.35 und Satz 3.65). Beispielsweise ist die komplexe Exponentialabbildung exp:C→Cexp:C→C lokal injektiv, aber nicht injektiv (selbiges gilt auch für die Polarkoordinatenabbildung (r,φ)∈(0,∞)×R↦(rcosφ,rsinφ)∈R2(r,φ)∈(0,∞)×R↦(rcosφ,rsinφ)∈R2). Können wir Injektivität aus anderen Überlegungen erhalten, so kann der Satz der inversen Abbildung (Satz 11.5) trotzdem global nützlich sein.
Korollar 11.8: Kriterium für Diffeomorphie
Sei U⊆RnU⊆Rn offen und sei f:U→Rnf:U→Rn eine dd-mal stetig differenzierbare, injektive Funktion mit d≥1d≥1. Angenommen jeder Punkt x∈Ux∈U hat die Eigenschaft, dass DxfDxf invertierbar ist (oder in anderen Worten: jeder Punkt in UU ist regulär). Dann ist V=f(U)⊆RnV=f(U)⊆Rn offen und f:U→Vf:U→V ist ein CdCd-Diffeomorphismus mit
für alle x∈Ux∈U und y=f(x)∈Vy=f(x)∈V.
Beweis
Wir zeigen zuerst, dass V=f(U)V=f(U) offen ist. Sei also y0=f(x0)y0=f(x0) für ein x0∈Ux0∈U. Da Dx0fDx0f invertierbar ist, können wir den Satz der inversen Abbildung (Satz 11.5) anwenden und erhalten offene Umgebungen U0U0 von x0x0 und V0V0 von y0y0, so dass f|U0:U0→V0f|U0:U0→V0 ein Diffeomorphismus ist. Insbesondere ist V0=f(U0)⊆f(U)=VV0=f(U0)⊆f(U)=V, womit VV offen ist, da y0∈Vy0∈V beliebig war (eine beliebige Vereinigung offener Mengen ist offen). Des Weiteren stimmt (f|U0)−1:V0→U0(f|U0)−1:V0→U0 mit f−1|V0:V0→U0f−1|V0:V0→U0 überein, wobei f−1:V→Uf−1:V→U auf Grund der vorausgesetzten Injektivität existiert.
Wir erhalten, dass f−1f−1 auf V0V0 also dd-mal stetig differenzierbar ist. Da y0∈Vy0∈V allerdings beliebig war und da stetige Differenzierbarkeit eine lokale Eigenschaft ist, zeigt dies, dass f−1f−1 dd-mal stetig differenzierbar ist. Somit ist f:U→Vf:U→V ein CdCd-Diffeomorphismus. ∎
Beispiel 11.9
Wir betrachten hier die Abbildung
und wollen geeignete offene Mengen U⊆R2U⊆R2, V⊆R2V⊆R2 finden, so dass f|U:U→Vf|U:U→V ein Diffeomorphismus ist. Die Jacobi-Matrix von ff bei (x,y)t∈R2(x,y)t∈R2 ist durch
gegeben und deren Determinante (auch Jacobi-Determinante genannt) ist durch 1−4xy1−4xy gegeben. Das heisst, für alle Punkte (x,y)t∈R2(x,y)t∈R2, die nicht auf der Hyperbel xy=14xy=14 liegen, existiert nach dem Satz über die inverse Abbildung (Satz 11.5) eine Umgebung, so dass ff eingeschränkt auf diese Umgebung ein Diffeomorphismus auf eine andere offene Menge ist. Wir wollen hier aber das Quadrat U=(−12,12)×(−12,12)U=(−12,12)×(−12,12) zwischen den beiden Punkten (−12,−12)(−12,−12) und (12,12)(12,12) auf der Hyperbel betrachten.
Wir behaupten, dass f|Uf|U injektiv ist. Aus dieser Behauptung und Korollar 11.8 folgt dann, dass f|U:U→f(U)f|U:U→f(U) ein Diffeomorphismus ist, da die Jacobi-Matrix auf UU nicht-verschwindende Determinante besitzt.
Seien also (x1,y1),(x2,y2)∈U(x1,y1),(x2,y2)∈U mit f(x1,y1)=f(x2,y2)f(x1,y1)=f(x2,y2). Dann gilt
Da aber [latex]|x_1+x_2|
Da die Jacobi-Matrix nur auf der Hyperbel xy=14xy=14 verschwindet, könnte man vermuten, dass obige Wahl von UU als Definitionsbereichs des Diffeomorphismus nicht optimal ist und man diesen deutlich vergrössern könnte. Doch ebenso wie bei den Polarkoordinaten gibt es keine natürliche maximale Wahl des Definitionsbereichs, da zum Beispiel f(1,0)=(1,1)t=f(0,1)f(1,0)=(1,1)t=f(0,1) und die Punkte (1,0)t(1,0)t, (0,1)t(0,1)t in derselben Zusammenhangskomponente des Komplements der Hyperbel liegen.
11.1.3 – Polar- und Zylinderkoordinaten
Die Polarkoordinatenabbildung ist durch
definiert und bildet einen Diffeomorphismus. In der Tat ist ff bijektiv (nach Abschnitt 6.6.4) und hat bei (r,φ)∈(0,∞)×(−π,π)(r,φ)∈(0,∞)×(−π,π) die Jacobi-Matrix
mit Determinante r≠0r≠0, womit nach Korollar 11.8 die Abbildung ff ein Diffeomorphismus ist.
Des Weiteren kann man natürlich ff auch auf den Punkten in {0}×R{0}×R durch (0,0)t(0,0)t definieren, doch wäre ff bei diesen nicht lokal invertierbar.
Eine dreidimensionale Verallgemeinerung der Polarkoordinaten stellen die Zylinderkoordinaten dar. Die entsprechende Abbildung ist der Diffeomorphismus
mit Jacobi-Matrix
und Jacobi-Determinante rr bei (r,φ,z)∈(0,∞)×(−π,π)×R(r,φ,z)∈(0,∞)×(−π,π)×R.
11.1.4 – Kugelkoordinaten
Eine weitere Verallgemeinerung der Polarkoordinaten für den dreidimensionalen Raum stellen die Kugelkoordinaten dar. Hier werden ein Radius r∈(0,∞)r∈(0,∞) und zwei Winkel θ∈(0,π)θ∈(0,π), φ∈(−π,π)φ∈(−π,π) verwendet, wobei θθ den Winkel eines Punktes relativ zum Nordpol der Sphäre S2S2 und φφ den Winkel der Projektion auf die xyxy-Ebene relativ zu (1,0,0)t(1,0,0)t angeben soll. Der entsprechende Diffeomorphismus ist also gegeben durch
Für (r,θ,φ)∈(0,∞)×(0,π)×(−π,π)(r,θ,φ)∈(0,∞)×(0,π)×(−π,π) ist die Jacobi-Matrix durch
gegeben und die Jacobi-Determinante (nach der Regel von Sarrus) durch
gegeben.
11.2 – Teilmannigfaltigkeiten des Euklidschen Raumes
Falls wir die Extremwerte einer stetig differenzierbaren, reellwertigen Funktion ff eingeschränkt auf die abgeschlossene Einheitskugel
finden wollen, dann existieren diese zwar wegen Kompaktheit von KK (nach Satz 9.66(5)), aber die Methoden von Kapitel 10 können nur die Extremwerte von ff im offenen Ball [latex]B_1(0) = \left \lbrace {v \in \mathbb {R}^n} \mid {\| {v}\|
Ähnliche und auch andere Probleme führen dazu, dass man Teilmannigfaltigkeiten von RnRn wie zum Beispiel S2S2 (analytisch) studieren möchte. Eine Teilmannigfaltigkeit des RnRn sollte man sich als Teilmenge vorstellen, die lokal jeweils wie eine offene Teilmenge eines Euklidischen Raumes (mit meist niegriger Dimension) aussieht und eine gewisse «Glattheit» erfüllt. Beispielsweise kann man sich intuitiv gut vorstellen, dass man um jeden Punkt auf der Sphäre eine Umgebung findet, die sich durch «Flachdrücken» zu einer offenen Kreisscheibe im R2R2 formen lässt.
Wir werden in unseren Diskussionen keine «Kanten» oder «Ecken» einer Teilmannigfaltigkeit erlauben, da sich diese nicht auf «glatte Weise» flach machen lassen. Zum Beispiel ist der Rand {(x,y,z)∈R3∣max{|x|,|y|,|z|}=1}{(x,y,z)∈R3∣max{|x|,|y|,|z|}=1} des Quaders [−1,1]3[−1,1]3 keine Teilmannigfaltigkeit des R3R3.
Allgemeinere Mannigfaltigkeiten sind von fundamentaler geometrischer Bedeutung und erscheinen deswegen zum einen in sehr vielen fortführenden Vorlesungen des Mathematikstudiums wie zum Beispiel der Differentialgeometrie im dritten oder vierten Studienjahr, aber auch in Physik-Vorlesungen wie zum Beispiel der allgemeinen Relativitätstheorie. Wir begnügen uns hier mit der Untersuchung von Teilmannigfaltigkeiten des Euklidischen Raumes.
11.2.1 – Definition und Beispiele
Definition 11.10
Sei 0≤k≤n0≤k≤n für n≥1n≥1. Eine Teilmenge M⊆RnM⊆Rn ist eine kk-dimensionale (glatte) Teilmannigfaltigkeit, falls für jeden Punkt p∈Mp∈M eine offene Umgebung UpUp in RnRn von pp und ein Diffeomorphismus φp:Up→Vp=φp(Up)φp:Up→Vp=φp(Up) auf eine weitere offene Teilmenge Vp⊆RnVp⊆Rn existiert, so dass
In anderen Worten sieht eine Teilmannigfaltigkeit MM — in der Nähe eines jeden Punktes in MM und bis auf einen Diffeomorphismus — wie ein Teil des Teilraumes Rk×{0}n−kRk×{0}n−k von RnRn aus. Wenn wir so wollen, können wir nach Anpassen des obigen Diffeomorphismus weitere Bedingungen an UpUp oder VpVp stellen. Zum Beispiel könnten wir verlangen, dass Up=Bε(p)Up=Bε(p) für ein geeignetes ε>0ε>0 (durch Einschränken von φpφp) oder dass Vp=(−ε,ε)nVp=(−ε,ε)n für ein geeignetes ε>0ε>0 (durch Verschieben von φpφp, um φp(p)=0φp(p)=0 zu erreichen, und durch Einschränken). Letzteres legt den Vergleich von φpφp zu einer Kartenabbildung nahe, wobei (−ε,ε)k(−ε,ε)k eine «quadratische Karte» und
die Kartenabbildung darstellt, deren Bild eine Umgebung von p∈Mp∈M ist.
Alternativ lässt sich φpφp als eine Abbildung auffassen, die, wie zu Beginn dieses Abschnitts erklärt wurde, die Umgebung UpUp von pp «verbiegt» , so dass Up∩MUp∩M «flach» wird. Hierbei ist eine offene Teilmenge des Teilraumes Rk×{0}n−kRk×{0}n−k sozusagen flach. Des Weiteren können wir uns die Umkehrabbildung ψ=φ−1ψ=φ−1 nach Einschränkung auf Vp∩(Rk×{0}n−k)Vp∩(Rk×{0}n−k) als eine Parametrisierung von M∩UpM∩Up vorstellen, und ohne Einschränkung als eine Parametrisierung der (im RnRn offenen) Umgebung UpUp der Punkte in M∩UpM∩Up.
Beispiel 11.11: Erste Beispiele von Teilmannigfaltigkeiten
- Jede offene Teilmenge UU in RnRn ist eine nn-dimensionale Teilmannigfaltigkeit. In der Tat lässt sich der Diffeomorphismus φpφp zu p∈Up∈U als die Identitätsabbildung auf UU wählen (wieso?). Weiter ist jede nn-dimensionale Teilmannigfaltigkeit von RnRn eine offene Teilmenge von RnRn (siehe Übung 11.15).
- Jede endliche (oder diskrete) Teilmenge M⊆RnM⊆Rn ist eine nulldimensionale Teilmannigfaltigkeit. Dabei lässt sich φpφp zu p∈Mp∈M als eine Verschiebung Bε(p)→Bε(0), x↦x−pBε(p)→Bε(0), x↦x−p für ε>0ε>0 klein genug wählen (wieso?). Hierbei heisst eine Menge diskret, falls es zu jedem p∈Mp∈M ein ε>0ε>0 gibt mit M∩Bε(p)={p}M∩Bε(p)={p}.
- Wir wollen nun zu ersten interessanten Beispiel einer Teilmannigfaltigkeit — Graphen von glatten Funktionen — kommen, welche in einem gewissen Sinn fast den allgemeinen Fall darstellen (siehe Proposition 11.12). Sei also k[latex]M=Graph(f)={(x,f(x))∣x∈U}⊆Rnk[latex]M=Graph(f)={(x,f(x))∣x∈U}⊆Rn
eine kk-dimensionale Teilmannigfaltigkeit. Denn für p=(x0,f(x0))∈Mp=(x0,f(x0))∈M zu x0∈Ux0∈U können wir Up=Vp=U×Rn−kUp=Vp=U×Rn−k setzen und die glatte Abbildung
betrachten. Diese definiert in der Tat einen Diffeomorphismus und erfüllt für alle (x,y)(x,y) in U×Rn−kU×Rn−k
ist eine (n−1)(n−1)-dimensionale Teilmannigfaltigkeit von RnRn.
Um die Idee des Beweises (auch graphisch) klarer darstellen zu können, beschränken wir uns hier auf den Fall n=3n=3 und verweisen auf Theorem 11.16 unten für den allgemeinen Fall. Sei p0=(x0,y0,z0)t∈S2p0=(x0,y0,z0)t∈S2.
- Falls z0>0z0>0 ist, verwenden wir die Abbildung
φp0=φ+:Up0=U+=BR21(0)×(0,∞)→φ+(U+)(x,y,z)t↦(x,y,z−√1−x2−y2)tφp0=φ+:Up0=U+=BR21(0)×(0,∞)→φ+(U+)(x,y,z)t↦(x,y,z−√1−x2−y2)t
wie oben im Teil (c) dieses Beispiels.
- Falls z0[latex]φ−:U−=BR21(0)×(−∞,0)→φ−(U−)(x,y,z)t↦(x,y,z+√1−x2−y2)t.z0[latex]φ−:U−=BR21(0)×(−∞,0)→φ−(U−)(x,y,z)t↦(x,y,z+√1−x2−y2)t.
- Falls z0=0z0=0 und y0>0y0>0 ist, verwenden wir die Menge
[latex]
\begin{aligned}[]\tilde {U}_+ = \left \lbrace {(x,y,z) \in \mathbb {R}^3} \mid {y > 0 \text { und } x^2+z^2 [/latex](was obigem U+U+ nach Vertauschung der Koordinaten yy und zz entspricht) gemeinsam mit
˜φ+:(x,y,z)t∈˜U+↦(x,z,y−√1−x2−z2)t.~φ+:(x,y,z)t∈~U+↦(x,z,y−√1−x2−z2)t. - Die verbleibenden Fälle (das wären z0=0z0=0, [latex]y_0
Die Diskussion in Teil (d) von Beispiel 11.11 ist gewissermassen typisch für Teilmannigfaltigkeiten. Obwohl wir uns die Teilmannigfaltigkeit S2S2 lokal als Graphen einer Funktion vorstellen (siehe Proposition 11.12 unten), benötigen wir oft mehrere Funktionen (oben wegen der Vorzeichenwechsel der Koordinaten) und müssen die Auswahl an Koordinaten, mit denen sich die restlichen Koordinaten darstellen lassen, entsprechend dem Punkt p∈Mp∈M wählen (damit Punkte am Äquator auch erlaubt sind). Dies ergibt zusammen eine Kollektion von Karten, das heisst, einen «Atlas» von MM: lokal sieht MM in jedem Punkt wie die einzelnen Karten (zum Beispiel (−η,η)k(−η,η)k für η>0η>0) aus, doch gibt es zwischen den Karten Überlappungen, die zusammen MM komplett beschreiben. Dieser Gesichtspunkt erlaubt es, Definition 11.10 zum Begriff von kk-dimensionalen Mannigfaltigkeiten zu erweitern, die dann als metrische Räume, aber nicht zwingend als Teilmenge von RnRn gegeben sind. Wie bereits erwähnt, begnügen wir uns hier aber mit dem Begriff einer Teilmannigfaltigkeit des Euklidschen Raumes.
Wir möchten nun zeigen, dass sich jede kk-dimensionale Teilmannigfaltigkeit lokal als Graph von Funktionen B⊆Rk→Rn−kB⊆Rk→Rn−k darstellen lässt. Dazu beachtet man aber, dass diese Darstellung nicht zwingend über den ersten kk Koordinaten möglich sein muss — siehe den Spezialfall z0=0z0=0 in Beispiel 11.11(d). Wir lassen also Koordinatenvertauschungen zu. Zu σ∈Snσ∈Sn sei
die induzierte Permutation der Koordinaten.
Proposition 11.12: Lokale Darstellbarkeit durch Graphen
Eine Teilmenge M⊆RnM⊆Rn ist genau dann eine kk-dimensionale Teilmannigfaltigkeit, wenn es zu jedem Punkt p∈Mp∈M eine offene Umgebung UpUp von pp in RnRn, eine glatte Funktion fp:˜Up→Rn−kfp:~Up→Rn−k auf einer offenen Teilmenge ˜Up⊆Rk~Up⊆Rk und ein σ∈Snσ∈Sn gibt, so dass
Beweis
Angenommen MM ist eine kk-dimensionale Teilmannigfaltigkeit. Sei p∈Mp∈M, UpUp eine offene Umgebung von p∈Rnp∈Rn und φp:Up→Vp⊆Rnφp:Up→Vp⊆Rn ein Diffeomorphismus wie in Definition 11.10 mit φp(p)=0φp(p)=0. Sei
für ein ε>0ε>0 klein genug. Dann hat das Differential D0ψD0ψ Rang kk, womit kk linear unabhängige Zeilen in D0ψD0ψ existieren. Nach Koordinatenvertauschung (von hier stammt σσ in der Aussage) können wir annehmen, dass diese Zeilen die ersten kk sind. Damit hat die Abbildung
ein invertierbares Differential bei 00. Also existiert nach dem Satz zur inversen Abbildung (Satz 11.5) eine (nicht-leere) offene Menge U⊆(−ε,ε)kU⊆(−ε,ε)k, so dass die Einschränkung von gg auf UU ein Diffeomorphismus ist. Wir betrachten nun die Abbildung f=ψ∘(g|U)−1:g(U)→Mf=ψ∘(g|U)−1:g(U)→M. Für i≤ki≤k und alle y∈g(U)y∈g(U) gilt fi(y)=ψi(g|−1U(y))=yifi(y)=ψi(g|−1U(y))=yi nach Konstruktion. Die Teilmannigfaltigkeit MM ist also lokal der Graph der Abbildung y∈g(U)↦(fk+1(y),…,fn(y))y∈g(U)↦(fk+1(y),…,fn(y)) (nach Permutation der Koordinaten), womit der erste Teil der Aussage bewiesen ist.
Für die Umkehrung kann man analog vorgehen wie in Beispiel 11.11(c). ∎
Applet 11.13: Illustration zur Darstellbarkeit durch Graphen
In diesem Applet illustrieren wir Proposition 11.12 anhand einer eindimensionalen Teilmannigfaltigkeit von R2R2, wobei Sie rechts auswählen können ob für den ausgewählten Punkt die Vertauschung der Koordinaten angewendet werden sollte.
Übung 11.14: Ein Überschneidungspunkt
Sei M={(x,y)∈R2∣x(y2−x)=0}M={(x,y)∈R2∣x(y2−x)=0}. Zeigen Sie unter Verwendung von Proposition 11.12, dass M∖{0}M∖{0} eine Teilmannigfaltigkeit ist, aber MM nicht.
Hinweis.
Es lohnt sich, die Aussage zuerst in einem Bild zu verifizieren.
Übung 11.15: Topologische Eigenschaften von Teilmannigfaltigkeiten
Zeigen Sie, dass jede nn-dimensionale Teilmannigfaltigkeit von RnRn eine offene Teilmenge von RnRn ist. Zeigen Sie ebenso, dass jede nulldimensionale Teilmannigfaltigkeit von RnRn eine diskrete Teilmenge von RnRn ist.
Bemerkung: CℓCℓ-Teilmannigfaltigkeiten
Der Begriff der glatten Teilmannigfaltigkeit in Definition 11.10 lässt sich zum Begriff von CℓCℓ-Teilmannigfaltigkeiten für ein beliebiges ℓ∈N∪{∞}ℓ∈N∪{∞} verallgemeinern. Dazu betrachtet man in Analogie zu Definition 11.10 lokale CℓCℓ-Diffeomorphismen φpφp. Da wir in Zukunft aber sowieso meist an glatten Teilmannigfaltigkeiten interessiert sein werden und die Notation einfach halten möchten, haben wir auf diese Verallgemeinerung verzichtet.
11.2.2 – Niveaumengen als Teilmannigfaltigkeiten
Wie schon die Sphäre, sind viele Teilmannigfaltigkeiten über Gleichungen definiert, und folgender Satz gibt ein allgemeines Resultat in diese Richtung.
Insbesondere zeigt der Satz, dass für jedes nn die Sphäre Sn−1⊆RnSn−1⊆Rn eine Teilmannigfaltigkeit von RnRn ist. In der Tat ist Sn−1={(x1,…,xn)t∈Rn∣F(x1,…,xn)=0}Sn−1={(x1,…,xn)t∈Rn∣F(x1,…,xn)=0} für F:(x1,…,xn)t∈Rn↦x21+…+x2n−1F:(x1,…,xn)t∈Rn↦x21+…+x2n−1 und der einzige kritische Punkt von FF ist der Ursprung 0∉Sn−10∉Sn−1 (wieso?).
Beweis
Sei p∈Mp∈M. Nach Voraussetzung ist der Rang der totalen Ableitung DpFDpF gleich min(m,n)=mmin(m,n)=m. Wie zuvor identifizieren wir DpFDpF mit der Jacobi-Matrix DpF∈Matm,n(R)DpF∈Matm,n(R) (mit mm Zeilen und nn Spalten). Nach Annahme existieren mm dieser Spalten, welche gemeinsam eine invertierbare Matrix bilden. Wenn nötig, vertauschen wir die Koordinaten im RnRn (diese Abbildung wird Teil des Diffeomorphismus) und bezeichnen die ersten k=n−mk=n−m Koordinaten mit xx und die letzten mm Koordinaten mit yy. Durch diese Vertauschung können wir annehmen, dass ∂∂yF(p)∂∂yF(p) invertierbar ist. In anderen Worten erfüllt die implizite Gleichung F(x,y)=0F(x,y)=0 bei dem Punkt p=(x0,y0)p=(x0,y0) und für ein geeignetes r>0r>0 mit Br(x0)×Br(y0)⊆UBr(x0)×Br(y0)⊆U die Voraussetzung des Satzes über implizite Funktionen (Satz 11.1 und Satz 11.2) und wir erhalten offene Umgebungen U0⊆Br(x0)U0⊆Br(x0) von x0x0 und V0⊆Br(y0)V0⊆Br(y0) von y0y0, so dass
für eine glatte Funktion f:U0→V0f:U0→V0. Wir können also Up=U0×V0Up=U0×V0 und den Diffeomorphismus (genau wie in Beispiel 11.11(1)) durch
definieren.
Da p∈Mp∈M beliebig war, beweist dies den Satz. ∎
Beispiel 11.17
Der einzige kritische Punkt der Funktion F:(x,y,z)t↦x2+y2−z2F:(x,y,z)t↦x2+y2−z2 auf R3R3 ist wiederum der Ursprung (wieso?). Aus diesem Grund und wegen Theorem 11.16 sind das sogenannte einschalige Hyperboloid
und das sogenannte zweischalige Hyperboloid
zweidimensionale Teilmannigfaltigkeiten von R3R3.
s Obiges Beispiel lässt sich mit derselben Methodik auf beliebige quadratische Formen erweitern (siehe Abschnitt 11.4.2).
Beispiel 11.18: 2-Torus
Seien [latex]0
Wir möchten hier zeigen, dass der 22-Torus eine zweidimensionale Teilmannigfaltigkeit des R3R3 ist. Passend zu der geometrischen Beschreibung können wir den 22-Torus auch durch eine Gleichung definieren, nämlich
Wir betrachten also die glatte Funktion
und zeigen, dass 00 ein regulärer Wert von FF ist. Zuerst bemerken wir, dass
für alle z∈Rz∈R. Für p=(x,y,z)t∈Mp=(x,y,z)t∈M gilt also p∈(R2∖{0})×Rp∈(R2∖{0})×R und
Wenn nun obiges pp ein kritischer Punkt (das heisst, DpF=0DpF=0) ist, so gilt z=0z=0 und R=√x2+y2R=√x2+y2 wegen (x,y)≠0(x,y)≠0. Keiner dieser Punkte liegt aber auf T2T2 und somit ist 00 ein regulärer Wert von FF. Nach Theorem 11.16 ist der 22-Torus eine zweidimensionale Teilmannigfaltigkeit des R3R3.
Übung 11.19: Parametrisierung des 22-Torus
Wir möchten hier eine Parametrisierung des 22-Torus mit Parametern R,rR,r besprechen.
Dazu betrachten wir als erstes zwei Winkel φ,ψφ,ψ. Dabei stellt der erste Winkel φφ den Winkel in der xyxy-Ebene dar und der zweite Winkel ψψ stellt den Winkel in der Ebene dar, die von der zz-Richtung und der von φφ fixierten Richtung in der xyxy-Ebene gegeben ist.
- Sei
ˉf:[0,2π]×[0,2π]→T2,(φ,ψ)↦((R+rsinψ)cosφ,(R+rsinψ)sinφ,rcosψ)t.¯f:[0,2π]×[0,2π]→T2,(φ,ψ)↦((R+rsinψ)cosφ,(R+rsinψ)sinφ,rcosψ)t.
Zeigen Sie, dass ˉf¯f tatsächlich eine stetige Abbildung ist, die auf T2T2 abbildet. Überzeugen Sie sich auch davon, dass ˉf¯f surjektiv, aber nicht injektiv ist.
- Die Abbildung ˉf¯f lässt sich auch nicht so einschränken, dass ˉf¯f eine stetige Bijektion mit stetiger Inverser wird (was wir wollen). Überzeugen Sie sich als Beispiel davon, dass ˉf|[0,2π)2¯f|[0,2π)2 bijektiv und stetig ist, aber keine stetige Inverse besitzt.
Nach (ii) ist ˉf¯f offenbar nicht die optimale Weise, den 22-Torus topologisch zu verstehen. Wir wechseln nun deswegen vom Intervall [0,2π][0,2π] auf den Einheitskreis, wo die Winkel 00 und 2π2π automatisch identifiziert werden.
- Zeigen Sie, dass die Abbildung
f:S1×S1→T2,((x,y)t,(v,w)t)↦((R+rw)x,(R+rw)y,rv)tf:S1×S1→T2,((x,y)t,(v,w)t)↦((R+rw)x,(R+rw)y,rv)t
eine stetige Bijektion mit stetiger Inversen definiert.
Tatsächlich ist, wenn man weiss, was differenzierbare Abbildung zwischen Teilmannigfaltigkeiten sind, die obige Abbildung ff glatt mit glatter Inversen und somit die richtige Art und Weise T2T2 zu verstehen.
11.2.3 – Tangentialraum und Tangentialbündel
Wir wollen hier zu einer gegebenen Teilmannigfaltigkeit M⊆RnM⊆Rn den zugehörigen «Phasenraum» definieren, der analog zum einfacheren Fall M=UM=U für eine offene Teilmenge UU von RnRn (siehe Abschnitt 10.2.2), aus allen Paaren der möglichen Orte p∈Mp∈M und den bei pp möglichen Geschwindigkeitsvektoren bestehen soll. Dies legt die folgende Definition nahe.
Definition 11.20: Tangentialraum
Sei M⊆RnM⊆Rn eine kk-dimensionale Teilmannigfaltigkeit. Der Tangentialraum (oder Phasenraum) von MM bei p∈Mp∈M ist durch
und das Tangentialbündel von MM durch
definiert.
In Worten ausgedrückt ist TpMTpM also die Menge der Geschwindigkeitsvektoren von kurzen Wegen durch pp in MM wie oben schon erklärt. Als erstes kann man sich nun ähnliche Fragen wie in Abschnitt 10.2.2 stellen. Beispielsweise: Ist TpMTpM ein Unterraum von TpRnTpRn?
Die Identität TRn=Rn×RnTRn=Rn×Rn drängt weiter die Frage auf, ob vielleicht TMTM in einem geeigneten Sinne isomorph zu M×RkM×Rk ist, wenn MM eine kk-dimensionale Teilmannigfaltigkeit ist. Diese, im Allgemeinen sehr schwierige Frage werden wir in dieser Vorlesung nur für sehr wenige Teilmannigfaltigkeiten vollständig (je nach Fall positiv oder negativ) beantworten können.
Stattdessen wollen wir hier vorerst diese Frage nur lokal (wie zuvor heisst das für eine kleine Umgebung eines vorgegebenen Punktes) beantworten. Zur Vereinfachung der Notation werden wir im Folgenden RkRk mit dem Teilraum Rk×{0}n−k⊆RnRk×{0}n−k⊆Rn identifizieren.
Satz 11.21: Lokale Beschreibung des Tangentialbündels
Sei M⊆RnM⊆Rn eine kk-dimensionale Teilmannigfaltigkeit.
- Sei U0⊆RnU0⊆Rn eine offene Umgebung und sei φ:U0→V0⊆Rnφ:U0→V0⊆Rn ein Diffeomorphismus mit
φ(U0∩M)={y∈V0∣yk+1=…=yn=0}=V0∩Rkφ(U0∩M)={y∈V0∣yk+1=…=yn=0}=V0∩Rk
wie in Definition 11.10. Wir definieren ψ=φ−1:V0→U0ψ=φ−1:V0→U0 und die Ableitung
Dψ:TV0→TU0(y,h)↦(ψ(y),Dyψ(h)).Dψ:TV0→TU0(y,h)↦(ψ(y),Dyψ(h)).Dann ist die Einschränkung von DψDψ eine Bijektion von T(V0∩Rk)=(V0∩Rk)×RkT(V0∩Rk)=(V0∩Rk)×Rk nach T(U0∩M)T(U0∩M). Insbesondere ist TpMTpM ein kk-dimensionaler Unterraum von TpRnTpRn für alle p∈Mp∈M.
- Angenommen M={x∈U∣F(x)=0}M={x∈U∣F(x)=0} ist gegeben als Niveaumenge einer glatten Funktion F:U→Rn−kF:U→Rn−k auf einer offenen Teilmenge U⊆RnU⊆Rn, so dass 00 ein regulärer Wert von FF ist (wie im Theorem 11.16 über den konstanten Rang). Dann ist
TM={(p,v)∈M×Rn∣DpF(v)=0}.TM={(p,v)∈M×Rn∣DpF(v)=0}.
Insbesondere zweitere Aussage erlaubt in spezifischen Fällen eine effiziente Berechnung des Tangentialraums an einem Punkt, welcher dann im Wesentlichen durch den Kern des Differentials der Funktion FF an diesem Punkt gegeben ist.
Beispiel 11.22
Wir betrachten die Sphäre Sn−1={(x1,…,xn)t∈Rn∣F(x1,…,xn)=0}Sn−1={(x1,…,xn)t∈Rn∣F(x1,…,xn)=0} wobei F:(x1,…,xn)t∈Rn↦x21+…+x2n−1F:(x1,…,xn)t∈Rn↦x21+…+x2n−1. Dann ist für x∈Sn−1x∈Sn−1
Somit ist der Tangentialraum bei x∈Sn−1x∈Sn−1 gegeben durch
was gerade die Menge der Vektoren ist, die senkrecht auf xx stehen (das orthogonale Komplement von xx), und der Anschauung entspricht.
Wir wenden uns nun dem Beweis von Satz 11.21 zu. Die wesentliche Idee für die erste Aussage ist dabei, dass sich ein Weg in der «flachen lokalen Kopie» V0∩RkV0∩Rk via des Diffeomorphismus ψψ auf MM schieben lässt und umgekehrt.
Beweis von Satz 11.21
Wir beweisen die erste Aussage zuerst. Da V0∩RkV0∩Rk offen ist in RkRk, gibt es zu jedem y∈V0∩Rky∈V0∩Rk und h∈Rkh∈Rk einen differenzierbaren Weg γ:(−ε,ε)→V0∩Rkγ:(−ε,ε)→V0∩Rk mit γ(0)=yγ(0)=y und γ′(0)=hγ′(0)=h (zum Beispiel den geraden Weg γ(t)=y+thγ(t)=y+th). Damit ist ψ∘γ:(−ε,ε)→U0∩Mψ∘γ:(−ε,ε)→U0∩M ein differenzierbarer Weg mit ψ∘γ(0)=ψ(y)ψ∘γ(0)=ψ(y) und (ψ∘γ)′(0)=Dyψ(h)(ψ∘γ)′(0)=Dyψ(h). Also gilt
Da (y,h)∈(V0∩Rk)×Rk(y,h)∈(V0∩Rk)×Rk beliebig war, ergibt sich daraus
Für die andere Inklusion nehmen wir an, dass γ:(−ε,ε)→Mγ:(−ε,ε)→M ein differenzierbarer Weg mit γ(0)=p=ψ(y)∈U0∩Mγ(0)=p=ψ(y)∈U0∩M ist. Da U0U0 offen ist, existiert ein δ∈(0,ε)δ∈(0,ε) mit γ((−δ,δ))⊆U0∩Mγ((−δ,δ))⊆U0∩M. Wir betrachten nun den Weg φ∘γ:(−δ,δ)→V0∩Rkφ∘γ:(−δ,δ)→V0∩Rk, welcher bei 00 die Ableitung h=Dpφ(γ′(0))∈Rkh=Dpφ(γ′(0))∈Rk hat. Gemeinsam mit ψ∘φ=idψ∘φ=id auf U0U0 und der Kettenregel in der Form Dyψ∘Dpφ=InDyψ∘Dpφ=In erhalten wir
Dies zeigt, dass Dψ((V0∩Rk)×Rk)=T(U0∩M)Dψ((V0∩Rk)×Rk)=T(U0∩M).
Da es nach Definition einer Teilmannigfaltigkeit für jeden Punkt p∈Mp∈M einen derartigen Diffeomorphismus mit p∈U0p∈U0 gibt, folgt für jeden Punkt p∈Mp∈M, dass TpM=Dψ({p}×Rk)TpM=Dψ({p}×Rk) ein kk-dimensionaler Unterraum von TpRn={p}×RnTpRn={p}×Rn ist.
Für die zweite Behauptung sei p∈Mp∈M beliebig. Da nach obigem TpMTpM kk-dimensional ist, aber auch der Kern von DpFDpF kk-dimensional ist (wieso?), reicht es, eine Inklusion zu zeigen. Sei γ:(−ε,ε)→Mγ:(−ε,ε)→M ein differenzierbarer Weg mit γ(0)=pγ(0)=p. Dann gilt F∘γ(t)=0F∘γ(t)=0 für alle t∈(−ε,ε)t∈(−ε,ε) nach Definition von MM und daher ist
Somit ist γ′(0)∈ker(DpF)γ′(0)∈ker(DpF), was den Beweis des Satzes abschliesst. ∎
Wir verwenden nun obigen Satz, um einen spezifischen Fall zu diskutieren, wo die Isomorphie TM≅M×RkTM≅M×Rk gilt. Mit Satz 11.21 sind wir nun auch in der Lage zu erklären, was wir hier mit Isomorphie meinen. Es soll eine Bijektion f:TM≅M×Rkf:TM≅M×Rk (stetig mit stetiger Inversen) existieren, so dass für alle p∈Mp∈M die Einschränkung f|TpM:TpM→{p}×Rkf|TpM:TpM→{p}×Rk wohldefiniert ist und ein Isomorphismus von Vektorräumen ist. Wir verlangen insbesondere von einem solchen Isomorphismus, dass er den Fusspunkt pp erhält.
Beispiel 11.23: Tangentialbündel des Einheitskreises und des 22-Torus*
- Wir behaupten als erstes, dass TS1≅S1×RTS1≅S1×R.
Sei ι:R2→R2ι:R2→R2 die Rotation um 9090 Grad im Gegenuhrzeigersinn, das heisst, ι(x1,x2)=(−x2,x1)tι(x1,x2)=(−x2,x1)t für alle (x1,x2)t∈R2(x1,x2)t∈R2. Wir betrachten nun die Abbildung
f:TS1→S1×R,(x,v)↦(x,⟨v,ι(x)⟩f:TS1→S1×R,(x,v)↦(x,⟨v,ι(x)⟩und behaupten, dass diese alle gewünschten Eigenschaft hat. Grund dafür ist im Wesentlichen, dass es bei einem fixierten Punkt x∈S1x∈S1 nur eine, zu diesem orthogonale Richtung gibt, welche gerade von ι(x)ι(x) aufgespannt wird. In der Tat definiert deswegen
g:S1×R→TS1,(x,α)↦(x,αι(x))g:S1×R→TS1,(x,α)↦(x,αι(x))eine beidseitige Inverse von ff. Weiter erhält ff per Definition den Fusspunkt und die Abbildung f|TxS1f|TxS1 ist linear und von Null verschieden, also ein Isomorphismus (da beide Räume eindimensional sind).
- Wir möchten nun auch TT2≅T2×R2TT2≅T2×R2 zeigen. Dazu verwenden wir, dass sich T2T2 mit S1×S1S1×S1 via f:S1×S1→T2,((x,y)t,(v,w)t)↦((R+rw)x,(R+rw)y,rv)tf:S1×S1→T2,((x,y)t,(v,w)t)↦((R+rw)x,(R+rw)y,rv)t eineindeutig parametrisieren lässt (siehe Übung 11.19). Wir erweitern diese Abbildung zu einer Abbildung
˜f:S1×S1×R2→TT2((xy),(vw)⏟=p,(s,t))↦(f(p),s(−(R+rw)y(R+rw)x0)+t(rvxrvy−rw)).~f:S1×S1×R2→TT2((xy),(vw)=p,(s,t))↦⎛⎜⎝f(p),s⎛⎜⎝−(R+rw)y(R+rw)x0⎞⎟⎠+t⎛⎜⎝rvxrvy−rw⎞⎟⎠⎞⎟⎠.
Man kann nun überprüfen, dass ˜f~f einen Isomorphismus zwischen S1×S1×R2S1×S1×R2 und TT2TT2 definiert.
Übung 11.24: Tangentialbündel von S1×S1S1×S1*
- Zeigen Sie, dass S1×S1S1×S1 eine zweidimensionale Teilmannigfaltigkeit von R4R4 ist und dass T(S1×S1)≅(S1×S1)×R2T(S1×S1)≅(S1×S1)×R2.
- Ergänzen Sie die unterlassenen Details in Beispiel 11.23(b) und konstruieren Sie einen Isomorphismus TT2≅T2×R2TT2≅T2×R2.
11.3 – Extremwertprobleme
Die letzten beiden Abschnitte enthielten, wenn man so will, sehr wenige konkrete Rechnungen und zeigten stattdessen bloss Existenz gewisser unbekannter Funktionen oder führten neue geometrische Begriffe ein. In diesem Sinne mag es überraschend sein, dass diese für praktische Rechnungen trotzdem relevant sind. Genau dies wollen wir hier nun demonstrieren, indem wir Extremwertaufgaben allgemeiner als zuvor besprechen.
11.3.1 – Extrema auf kompakten Teilmengen
Jede stetige, reellwertige Funktion ff auf einer kompakten Teilmenge K⊆RnK⊆Rn hat ein globales Maximum und ein globales Minimum (siehe Satz 9.66(5)), die beide in Anwendungen von Interesse sein könnten. Allerdings ist diese Aussage für die Berechnung dieser Extrema (siehe Definition 10.28) nicht sonderlich hilfreich. Wir wollen hier erläutern, wie wir mit Hilfe der bereits entwickelten Theorie und der sogenannten Methode der Lagrange-Multiplikatoren diese Extremwerte finden können.
Wir werden im Folgenden die topologischen Begriffe des Inneren, des Abschlusses und des Randes verwenden — siehe Definition 9.23.
Beispiel 11.25: Extrema im Inneren und auf dem Rand
Wir betrachten im Folgenden mehrere Situationen, in welchen jeweils eine Teilmenge B⊆RnB⊆Rn und eine stetig differenzierbare, reellwertige Funktion ff auf BB gegeben ist. (Wir wollen des Weiteren immer annehmen, dass ff auf einer grösseren offenen Menge U⊇BU⊇B definiert und dort stetig differenzierbar ist.)
- Falls B=I=[a,b]B=I=[a,b] ein kompaktes Intervall mit a7.1.3.Dasheisst,wirsuchendiekritischenPunktevon[latex]fa7.1.3.Dasheisst,wirsuchendiekritischenPunktevon[latex]f in (a,b)(a,b) und betrachten getrennt noch die Randpunkte ∂I={a,b}∂I={a,b}.
- Falls B=PB=P ein kompaktes Polygon im R2R2 wie zum Beispiel
P={(x,y)t∈R2∣x≥0, y≥0, x+y≤1}P={(x,y)t∈R2∣x≥0, y≥0, x+y≤1}
ist, so können wir die Extremwerte auf BB finden, indem wir zuerst nach kritischen Punkten von ff im Innern P∘P∘ suchen (mit den Methoden aus Abschnitt 10.4). Anschliessend schränken wir ff auf die einzelnen Kanten von PP (in obigem Beispiel [0,1]×{0}[0,1]×{0}, {0}×[0,1]{0}×[0,1] und {(x,1−x)t∣x∈[0,1]}{(x,1−x)t∣x∈[0,1]}) ein und verwenden dort die Methoden von (a). Insbesondere muss man die Werte von ff an den Ecken (0,0)t(0,0)t, (1,0)t(1,0)t und (0,1)t(0,1)t auch in Betracht ziehen.
- Falls B={v∈Rn∣‖v‖2≤1}B={v∈Rn∣∥v∥2≤1} der abgeschlossene Einheitsball im RnRn ist, so können wir die kritischen Punkte von ff im Inneren [latex]B^\circ = \left \lbrace {v \in \mathbb {R}^n} \mid {\| {v}\|
- Falls
B={(x,y,z)t∈R3∣x2+y2≤z≤1}B={(x,y,z)t∈R3∣x2+y2≤z≤1}
ist, so können wir die Funktion ff
- im Inneren B∘B∘ von BB,
- auf der Teilmannigfaltigkeit [latex]\left \lbrace {(x,y,z)^t \in \mathbb {R}^3} \mid {x^2+y^2= z
- auf der Kreisscheibe [latex]\left \lbrace {(x,y,z)^t \in \mathbb {R}^3} \mid {x^2+y^2
- auf dem Kreis {(x,y,z)t∈R3∣x2+y2=z=1}{(x,y,z)t∈R3∣x2+y2=z=1}
getrennt betrachten. Wir finden dann die Extremwerte, indem wir alle kritischen Punkte der Einschränkungen von ff auf diese Teilmengen finden.
In den obigen Beispielen ist es einfach eine Parametrisierung der Ränder zu finden, welche man verwenden könnte, um die Suche der Extremwerte auf die Diskussion von glatten Funktionen auf offenen Teilmengen (den Karten) zurückzuspielen. Allerdings ist es, wie bereits besprochen, oft sehr schwer oder sogar unmöglich die Parametrisierung der Ränder explizit durch Formeln und uns wohlbekannten Funktionen zu beschreiben. Aus diesem Grund wäre es von Vorteil eine Methode zur Verfügung zu haben, welche ohne Verwendung der Kartenabbildungen die lokalen Extremwerte berechnen könnte.
11.3.2 – Extrema mit Nebenbedingungen und Lagrange-Multiplikatoren
Wie im letzten Teilabschnitt angedeutet wurde, wollen wir nun Funktionen auf Teilmannigfaltigkeiten untersuchen und dort notwendige Bedingungen für lokale Extrema angeben.
Proposition 11.26: Notwendige Bedingungen für Extrema mit Nebenbedingungen
Sei U⊆RnU⊆Rn offen und M⊆UM⊆U eine Teilmannigfaltigkeit von RnRn. Weiter sei f:U→Rf:U→R eine differenzierbare Funktion. Angenommen f|Mf|M nimmt in p∈Mp∈M ein lokales Extremum an. Dann ist ∇f(p)∇f(p) ein Normalenvektor an MM bei pp, das heisst, es gilt ⟨∇f(p),v⟩=0⟨∇f(p),v⟩=0 für alle (p,v)∈TpM(p,v)∈TpM.
Die Menge der Normalenvektoren an MM bei pp werden wir mit
bezeichnen. Genauso wie TpMTpM bildet (TpM)⊥(TpM)⊥ einen Unterraum von TpRnTpRn. Wenn MM eine kk-dimensionale Teilmannigfaltigkeit ist, dann hat (TpM)⊥(TpM)⊥ die Dimension (n−k)(n−k) (wieso?).
Beweis
Wir betrachten einen differenzierbaren Weg γ:(−ε,ε)→Mγ:(−ε,ε)→M mit γ(0)=pγ(0)=p und ε>0ε>0. Da ff in pp ein lokales Extremum annimmt, nimmt f∘γ:(−ε,ε)→Rf∘γ:(−ε,ε)→R in 00 ein lokales Extremum an. Daher gilt nach Proposition 7.17 und der Kettenregel
Da ε>0ε>0 beliebig und γ:(−ε,ε)→Mγ:(−ε,ε)→M ein beliebiger differenzierbarer Weg mit γ(0)=pγ(0)=p war, folgt daraus mit der Definition des Tangentialraums TpMTpM die Proposition. ∎
Damit wir obiges Resultat in die Praxis umsetzen können, benötigen wir eine weitere Definition. Dazu nehmen wir im Folgenden an, dass U⊆RnU⊆Rn offen ist und die Teilmannigfaltigkeit MM durch M={x∈U∣F(x)=0}M={x∈U∣F(x)=0} für eine glatte Funktion F:U→Rn−kF:U→Rn−k mit konstantem Rang wie in Theorem 11.16 gegeben ist. Des Weiteren soll f:U→Rf:U→R differenzierbar sein.
Definition 11.27
Die Lagrange-Funktion L:U×Rn−k→RL:U×Rn−k→R für eine Funktion f:U→Rf:U→R ist durch
definiert. Die Komponenten von λλ werden auch Lagrange-Multiplikatoren genannt.
Wir wollen noch betonen, dass wir für den Beweis der im folgenden Korollar vorgestellten praktische Methode eigentlich alle Themen dieses Kapitel (direkt oder indirekt) verwendet werden.
Korollar 11.28: Notwendige Bedingungen mit Lagrange-Multiplikatoren
Sei U⊆RnU⊆Rn eine offene Teilmenge und M={x∈U∣F(x)=0}M={x∈U∣F(x)=0} eine kk-dimensionale Teilmannigfaltigkeit gegeben als Niveaumenge durch eine glatte Funktion F:U→Rn−kF:U→Rn−k mit regulärem Wert 00 (siehe Theorem 11.16).
Sei f:U→Rf:U→R eine differenzierbare Funktion, für die f|Mf|M in p∈Mp∈M ein lokales Extremum annimmt, und sei LL die zu MM und ff gehörige Lagrange-Funktion. Dann existieren Lagrange-Multiplikatoren λ∈Rn−kλ∈Rn−k, so dass die Gleichungen
für alle i∈{1,…,n}i∈{1,…,n} und j∈{1,…,n−k}j∈{1,…,n−k} erfüllt sind. Dabei ist zu (x,λ)∈U×Rn−k(x,λ)∈U×Rn−k
∂xiL(x,λ)=∂if(x)−n−k∑j=1λj∂iFj(x),∂λjL(x,λ)=−Fj(x)∂xiL(x,λ)=∂if(x)−n−k∑j=1λj∂iFj(x),∂λjL(x,λ)=−Fj(x)
für i∈{1,…,n}i∈{1,…,n} und j∈{1,…,n−k}j∈{1,…,n−k}.
Beweis
Die Gleichungen ∂λjL(x,λ)=−Fj(x)∂λjL(x,λ)=−Fj(x) für j=1,…,n−kj=1,…,n−k folgen direkt aus der Definition von LL, womit die Gleichungen ∂λjL(p,λ)=0∂λjL(p,λ)=0 für j=1,…,n−kj=1,…,n−k auf Grund der Definition von MM gelten.
Die Beschreibung von ∂xiL(x,λ)∂xiL(x,λ) für i=1,…,ni=1,…,n in (11.6) folgen ebenso direkt aus der Definition der Lagrange Funktion. Betrachten wir diese gemeinsam, so erhalten wir eine Umformulierung der zu beweisenden Behauptung: wir wollen zeigen, dass ∇f(p)∇f(p) eine Linearkombination der Vektoren ∇F1(p),…,∇Fn−k(p)∇F1(p),…,∇Fn−k(p) ist, wobei die Lagrange Multiplikatoren die Koeffizienten der Linearkombination darstellen.
Wir beobachten zuerst, dass DpF1=(∇F1(p))t,…,DpFn−k=(∇Fn−k(p))tDpF1=(∇F1(p))t,…,DpFn−k=(∇Fn−k(p))t die Zeilen der Matrix DpFDpF sind, welche nach Annahme an FF linear unabhängig sind. Nach Satz 11.21 gilt somit
Also sind die Vektoren ∇F1(p),…,∇Fn−k(p)∇F1(p),…,∇Fn−k(p) Normalenvektoren an MM bei pp. Wegen linearer Unabhängigkeit und dim((TpM)⊥)=n−kdim((TpM)⊥)=n−k lässt sich nun jeder Normalenvektor als Linearkombination dieser Vektoren schreiben. Nach Proposition 11.26 ist ∇f(p)∇f(p) ein Normalenvektor und das Korollar folgt. ∎
Applet 11.29: Lagrange-Multiplikatoren und Normalenvektoren
In diesem Applet illustrieren wir Proposition 11.26 und Korollar 11.28 anhand einer eindimensionalen Teilmannigfaltigkeit. Unter dieser Annahme liegt nur ein Gradientenvektor ∇F∇F vor, womit Proposition 11.26 besagt, dass ∇F∇F und ∇f∇f parallel sein sollen.
Für die Praxis ist es wichtig, dass wir zwar für den Beweis von Korollar 11.28 den Satz über implizite Funktionen (Satz 11.1 und Satz 11.2) indirekt (wie genau?) verwendet haben, aber die implizite Funktion (welche wir eher selten berechnen können oder wollen) in der Methode von Lagrange nicht vorkommt.
Wir wollen diese Methode an einem Beispiel erproben. Dieses wird auch zeigen, dass der Methode der Lagrange-Multiplikatoren (Korollar 11.28) Voraussetzungen zugrunde liegen, die, wenn sie ignoriert werden, zum falschen Ergebnis führen.
Beispiel 11.30
Wir betrachten die kompakte Menge
welche durch die Funktion F:(x,y)t∈R2↦y3−x2F:(x,y)t∈R2↦y3−x2 definiert wird. Wir beobachten zuerst, dass KK die Punkte (1,1)t(1,1)t und (−1,1)t(−1,1)t enthält, welche eine getrennte Behandlung erfordern (wieso?). Wir betrachten die Funktion f(x,y)=4y−3xf(x,y)=4y−3x. Die Punkte (1,1)t(1,1)t und (−1,1)t(−1,1)t erfüllen
Wir betrachten also M=K∖{(1,1)t,(−1,1)t}M=K∖{(1,1)t,(−1,1)t} und wollen alle möglichen lokalen Extremwerte von f|Mf|M auffinden. Dazu verwenden wir (vorerst ohne gross zu überlegen) die Methode der Lagrange-Multiplikatoren (Korollar 11.28) an. Anschliessend sollten wir das globale Minimum und das globale Maximum von f|Kf|K sehr leicht unter den gefundenen Funktionswerten bestimmen können. Die zu ff und MM gehörige Lagrange-Funktion ist gegeben durch
Man berechnet
Aus −3+2λx=0 folgt λ≠0 und x≠0 sowie λ=32x. Genauso folgt aus 4−3λy2=0, dass y≠0 und λ=43y2. Damit gilt 32x=43y2 oder äquivalent dazu x=98y2. Andererseits gilt des Weiteren ∂λL(x,y,λ)=−(y3−x2)=0. Setzen wir nun x=98y2 ein, so erhalten wir
Da y≠0 ist, ergibt dies y=8292 und x=98y2=8393. Wir erhalten also mit der Methode der Lagrange-Multiplikatoren einen einzigen weiteren Kandidaten nebst den Randpunkten für die Extremwerte, nämlich
Haben wir jetzt alle lokalen Extremwerte gefunden? Nein, denn f nimmt das globale Minimum auf K im Punkt (0,0) an. Wir haben diesen Punkt mit der Methode der Lagrange-Multiplikatoren nicht gefunden, da M keine Teilmannigfaltigkeit von R2 ist und (0,0) ein kritischer Punkt von F ist.
11.3.3 – Diagonalisierbarkeit symmetrischer Matrizen*
Obwohl wir hier ja eigentlich Analysis betreiben wollen, können wir mit der Methode der Lagrange-Multiplikatoren relativ einfach folgenden wichtigen Satz aus der Linearen Algebra beweisen (welcher für uns bereits von Relevanz war beim Beweis der Charakterisierung von Indefinitheit in Satz 10.33).
Satz 11.31
Jede symmetrische Matrix A∈Matn,n(R) ist über R diagonalisierbar. Des Weiteren existiert sogar eine Orthonormalbasis von Rn bestehend aus Eigenvektoren von A.
Der schwierigste Schritt für den Beweis des Satzes ist folgendes Lemma, welches wir mit der Methode von Lagrange beweisen wollen. Schön an diesem Argument ist insbesondere, dass der Fundamentalsatz der Algebra (Theorem 9.81) nicht verwendet wird (siehe auch Übung 11.33).
Lemma 11.32
Sei n≥1 und A∈Matn,n(R) eine symmetrische Matrix. Dann besitzt A einen reellen Eigenvektor.
Beweis
Wir betrachten die Sphäre Sn−1, die als Niveaumenge der Funktion F:x∈R3↦‖x‖2−1∈R gegeben ist, und die reellwertige Funktion (quadratische Form)
Da Sn−1 kompakt ist, nimmt f|Sn−1 ein Maximum und ein Minimum an. Also angenommen f nimmt in p∈Sn−1 ein Extremum an. Sei
die zu Sn−1 und f gehörige Lagrange-Funktion. Nach Korollar 11.28 existiert also ein λ∈R mit
∂xjL(p,λ)=∂jf(p)−λ∂jF(p)=0
für alle j=1,…,n sowie ∂λL(p,λ)=F(p)=0. Letzteres besagt bloss, dass ‖p‖=1 oder anders ausgedrückt p∈Sn−1, wie bereits bekannt ist.
Wir berechnen nun die partiellen Ableitungen von F und f. Es gilt für alle x∈Rn
nach der Produktregel und da ∂j(xk) genau dann Null ist, wenn k≠j ist. Da A per Annahme aber symmetrisch ist, erhalten wir
Somit gilt (Ap)j=λpj für alle j=1,…,n oder äquivalent dazu Ap=λp. ∎
Beweis von Satz 11.31
Wir benötigen zusätzlich zu Lemma 11.32 etwas mehr Lineare Algebra für den Beweis, den wir jetzt mit Induktion nach n durchführen werden. Für n=1 gibt es nichts zu beweisen. Sei also A∈Matn,n(R) eine symmetrische Matrix. Nach Lemma 11.32 existiert ein reeller Eigenvektor v1∈Sn−1 zu einem Eigenwert λ1∈R. Wir betrachten das orthogonale Komplement
von v1. Für w∈W gilt auf Grund der Symmetrie von A
und es folgt, dass A(W)⊆W. Sei w1,…,wn−1 eine Orthonormalbasis von W bezüglich ⟨⋅,⋅⟩ (welche wegen des Gram-Schmidt-Orthonormalisierungsverfahrens existiert). Für i,j∈{1,…,n−1} gilt nun
In anderen Worten ist die Basisdarstellung B von A|W:W→W bezüglich der Basis w1,…,wn−1 wieder symmetrisch. Nach Induktionsvoraussetzung existiert für B eine Orthonormalbasis bestehend aus Eigenvektoren von B. Da aber B (gemeinsam mit der Standardbasis von Rn−1) genau A|W (gemeinsam mit der Orthonormalbasis w1,…,wn−1) entspricht, existiert also auch für W eine Orthonormalbasis v2,…,vn aus Eigenvektoren von A.
Wir erhalten damit, dass v1,…,vn eine Orthonormalbasis von Rn bildet und aus Eigenvektoren von A besteht. ∎
Übung 11.33
Der Vollständigkeit halber möchten wir hier ein elementares Argument zum Beweis von Lemma 11.32 unter Verwendung des Fundamentalsatzes angeben. Sei n≥1 und A∈Matn,n(R) eine symmetrische Matrix.
- Zeigen Sie, dass alle komplexen Eigenwerte von A reell sind.
- Beweisen Sie Lemma 11.32, indem Sie zeigen, dass A genau dann einen komplexen Eigenvektor besitzt, wenn A einen reellen Eigenvektor besitzt.
Das in unserem Beweis gewonnene geometrische Verständnis der Eigenwerte von A kann aber auch anders genutzt werden. Als Beispiel davon kann man einen Spezialfall des Satzes von Courant-Fischer beweisen.
- Zeigen Sie, dass die Werte
minx∈Sn−1xtAx,maxx∈Sn−1xtAx
den kleinsten respektive den grössten Eigenwert von A darstellen.
11.3.4 – Eine hinreichende Bedingung für Lagrange-Multiplikatoren*
Beispiel 11.34
Wir betrachten für a>b>0 die Teilmannigfaltigkeit
welche eine Ellipse in Hauptachsenlage darstellt, siehe folgendes Bild.
Des Weiteren betrachten wir die Funktion
welche eingeschränkt auf E globale Minima bei (0,−b)t und (0,b)t und globale Maxima bei (−a,0)t und (a,0)t annimmt, was aus dem Bild folgt (wieso?).
Falls wir aber mit Hilfe unseren bisherigen Methoden entscheiden wollen, bei welchen der vier Punkte (0,−b)t, (0,b)t, (−a,0)t und (a,0)t lokale Minima oder lokale Maxima vorliegen, so ist es vorerst unklar, wie wir dies machen können. In der Tat greift die Diskussion des letzten Abschnitts diese Thematik überhaupt nicht auf und auch das Kriterium aus 10.32 greift nicht, denn die kritischen Punkte von f als Funktion auf R2 liegen nicht auf E. Versuchen wir diese beiden Methoden ohne gross darüber nachzudenken zu verbinden, so würden wir fälschlicherweise zu dem Schluss kommen, dass alle vier Punkte ein Minimum der Funktion darstellen da die Hesse-Matrix von f bei jedem Punkt positiv definit ist. Aber wo wäre dann das Maximum von f|E?
Korollar 11.35: Hesse-Matrix der Lagrange-Funktion
Sei U⊆Rn eine offene Teilmenge, sei M={x∈U∣F(x)=0} eine k-dimensionale Teilmannigfaltigkeit gegeben als Niveaumenge durch eine glatte Funktion F:U→Rn−k mit regulärem Wert 0 und sei f:U→R eine zweimal stetig differenzierbare Funktion. Sei des Weiteren p∈M ein kritischer Punkt für f|M mit Lagrange-Parameter λ∈Rn−k, das heisst, (p,λ) erfüllt die Lagrange-Gleichungen
für alle j∈{1,…,n}. Wir definieren eine quadratische Form Q:TpM→R durch
für (p,v)∈TpM (wobei v1,…,vn die Koordinaten von v bezüglich der Standardbasis in Rn darstellen). Dann gelten folgende Aussagen:
- Falls Q positiv definit ist, dann nimmt f|M bei p ein striktes lokales Minimum an.
- Falls Q negativ definit ist, dann nimmt f|M bei p ein striktes lokales Maximum an.
- Falls Q indefinit ist, dann nimmt f|M bei p kein lokales Extremum an.
Mit Korollar 11.35 lässt sich unter anderem auch die in Beispiel 11.34 festgestellte Problematik beheben.
Übung 11.36
- Überprüfen Sie, dass in Beispiel 11.34 die Methode der Lagrange-Multiplikatoren genau die vier Punkte (0,−b)t, (0,b)t, (−a,0)t und (a,0)t aufspürt. Berechnen Sie dabei jeweils die dazugehörigen Lagrange-Multiplikatoren.
- Verwenden Sie Korollar 11.35, um bei jedem der vier Punkte zu entscheiden, ob und, wenn ja, was für ein lokales Extremum angenommen wird.
Beweis von Korollar 11.35
Wir bemerken, dass es für die Einschränkung auf M keine Rolle spielt, ob wir f|M oder L|M betrachten. Dies liegt daran, dass die Funktion L durch L(x,λ)=f(x)−∑n−kj=1λjFj(x) für (x,λ)∈U×Rn−k gegeben ist und F auf M identisch verschwindet. Der entscheidende Vorteil von L ist, dass nach geeigneter Wahl von λ der Punkt (p,λ) sogar ein kritischer Punkt von L auf U ist und wir dann die uns bekannten Methoden (siehe Korollar 10.32) anwenden können. Die quadratische (Taylor-) Approximation von L hat nach Korollar 10.25 die Form
L(p+h)−L(p)=n∑i,j=1∂xi∂xjL(p,λ)hihj+o(‖h‖2)
für h→0 (was für f im Allgemeinen falsch wäre).
Sei nun ψ:BRkε(0)→M eine glatte Parametrisierung einer Umgebung von p∈M, welche die Eigenschaften
- ψ(0)=p,
- ‖ψ(y)−p‖≤C‖y‖ für alle y∈BRkε(0) und
- ‖ψ(y)−(p+D0ψ(y)‖=o(‖y‖) für y→0
erfüllt (wieso existiert eine solche Parametrisierung?). Setzen wir h=ψ(y)−p für y∈BRkε(0) in Gleichung (11.8) ein, so ergibt sich (wieso?)
Wir bemerken nun, dass nach Satz 11.21
gilt. Das heisst, dass unsere Annahmen an die quadratische Form Q sich direkt auf die quadratische Form
übertragen. Wir können das Korollar also aus demselben Argument wie im Beweis der analogen Aussage auf offenen Teilmengen (Korollar 10.32) erhalten. ∎
11.4 – Weitere Lernmaterialien
11.4.1 – Verwendung des Kapitels
Wie bereits erwähnt ist der Satz über die implizite Funktionen grundlegend für das Verständnis von Gleichungen der Form F(x,y)=0 und deren lokalen Lösungenfunktionen. Der Satz über implizite Funktionen hat auch zum Satz über die inverse Abbildung (einem Kriterium für Diffeomorphie) und einer Möglichkeit, um zu zeigen, dass eine gegebene Teilmenge von Rn eine Teilmannigfaltigkeit ist (das Theorem über den konstanten Rang), geführt.
Sie sollten sich einen Diffeomorphismus als einen glatten (statt linearen) Koordinatenwechsel vorstellen. Hierzu sind eben Polarkoordinaten, Zylinderkoordinaten und Kugelkoordinaten wichtige Beispiele. Wir werden Diffeomorphismen wieder im Zusammenhang der mehrdimensionalen Substitutionsregel im nächsten Kapitel begegnen.
Der Begriff der Teilmannigfaltigkeit ist in dieser Vorlesung vor allem für Flächen im R3 später von Bedeutung, auf welchen wir auch ein Integral definieren werden. Zum Beispiel werden die mehrdimensionalen Integralsätze ein dreidimensionales Integral über einen Bereich im R3 mit einem zweidimensionalen Integral über den Rand des Bereichs (oft eine Teilmannigfaltigkeit) in Verbindung bringen wird.
Schlussendlich erwähnen wir noch, dass die Methode der Lagrange-Multiplikatoren eine wichtige praktische Methode zur Bestimmung von Extremwerten darstellt. Mitunter muss aber diese Methode mit einer Untersuchung des Definitionsbereichs (zum Beispiel bestehend aus einer offenen Menge und einer glatten Teilmannigfaltigkeit als Rand) kombiniert werden.
11.4.2 – Übungen
Übung: Umkehrabbildung zu Kugelkoordinaten
Wir betrachten den Diffeomorphismus
wie in Abschnitt 11.1.4.
- Begründen Sie, warum die offene Menge f((0,∞)×(0,π)×(−π,π)) in der Tat Komplement ((−∞,0]×{0}×R) hat.
- Bestimmen Sie die Umkehrabbildung von f.
Übung: Elliptische Kurven
Sei a∈R und Ma={(x,y)∈R2∣y2=x3+a}. Für welche a ist Ma eine Teilmannigfaltigkeit?
Übung: Quadratische Hyperflächen
Sei A∈Matn,n(R) eine symmetrische Matrix, so dass die assoziierte quadratische Form QA:x↦xtAx nicht-degeneriert ist. Zeigen Sie, dass {x∈Rn∣Q(x)=1} eine (n−1)-dimensionale Teilmannigfaltigkeit von Rn definiert.
Übung: SL2(R)
In dieser Übung möchten wir zeigen, dass die Gruppe
eine Teilmannigfaltigkeit von Mat2,2(R)≅R4 darstellt.
- Zeigen Sie, dass I2∈SL2(R) ein regulärer Punkt von det ist und dass DI2det=Tr ist, wobei Tr:(aij)ij∈Mat2,2(R)↦a11+a22 die Spur bezeichnet.
- Sei g∈SL2(R) und v∈Mat2,2(R). Zeigen Sie, dass die Richtungableitung ∂vdet(g) existiert und durch Tr(g−1v) gegeben ist.
- Zeigen Sie, dass SL2(R) eine Teilmannigfaltigkeit ist.
Hinweis.
In (ii) können Sie die Multiplikativität der Determinante verwenden. Zu (iii): Finden Sie eine Kartenabbildung in einer Umgebung von I2 und verknüpfen Sie diese mit einer Gruppenmultiplikation um Kartenabbildungen in Umgebungen von anderen Punkten zu finden. Alternativ verwenden Sie (ii) und Theorem 11.16.
Übung: Tangentialbündel ist auch eine Teilmannigfaltigkeit
Sei M⊆Rn eine k-dimensionale Teilmannigfaltigkeit. Zeigen Sie, dass TM⊆TRn=Rn×Rn eine 2k-dimensionale Teilmannigfaltigkeit ist.
Übung: Tangentialbündel eines Graphen
Sei M eine k-dimensionale Teilmannigfaltigkeit gegeben durch den Graphen einer glatten Funktion wie in Beispiel 11.11(c) (oder Proposition 11.12). Charakterisieren Sie in dieser Situation des Tangentialbündel von M in Analogie zum zweiten Teil der Aussage von Satz 11.21.
Übung: Challenge — Parametrisierung eindimensionaler Teilmannigfaltigkeiten
Sei M eine zusammenhängende, 1-dimensionale, kompakte Teilmannigfaltigkeit von Rn. Zeigen Sie, dass ein regulärer, einfacher, glatter Weg γ:[0,1]→M existiert mit γ([0,1])=M.
Übung
Sei n≥2. Zeigen Sie, dass zwei Punkte x,y∈Sn−1 genau dann (maximalen) Abstand 2 haben, wenn x=−y ist. Betrachten Sie hierzu die Funktion (x,y)↦‖x−y‖2 auf Sn−1×Sn−1⊆R2n.
11.4.3 – Lernkarten
Sie können wiederum die Lernkarten oder den Graphen für Ihre Wiederholung der Themen des Kapitels verwenden.