="http://www.w3.org/2000/svg" viewBox="0 0 512 512">

1 Einführung*

*Dieses Kapitel ist für den Aufbau notwendig, da es die im Weiteren benötigte Sprache entwickelt, doch werden die entsprechenden Themen nicht in der Analysis-Jahresprüfung 08/18 und 02/19 abgefragt.

1.1 – Quadratur der Parabel

Als Beispiel, wie wir hier denken und vorgehen wollen, aber auch als Einleitung in die Integralrechnung, werden wir uns in diesem Abschnitt mit dem Bereich
[latex]
\begin{aligned}[]\label{eq:einf-gebiet} P = \left \lbrace {(x,y) \in \mathbb {R}^2} \mid {0 \leq x \leq 1, \ 0 \leq y \leq x^2}\right \rbrace\end{aligned}
[/latex]
unter der Parabel zwischen [latex]0[/latex] und [latex]1[/latex] beschäftigen und dessen Flächeninhalt berechnen. Dieser Flächeninhalt wurde als erster krummlinig begrenzter Bereich schon von Archimedes (ca. 287–ca. 212 v.Chr.) im 3. Jahrhundert v.Chr. bestimmt. (Historisch Interessierten empfehlen wir auch den Podcast der BBC über Archimedes, wobei man bei der zwanzigsten Minute einsteigen kann, wenn man wenig Zeit hat.) Wir wollen für die Flächenberechnung davon ausgehen, dass wir wissen, was die Symbole in der Definition in Gleichung (1.1) bedeuten und dass [latex]P[/latex] gerade den Bereich in folgender Figur (Figur 1.1) beschreibt.[1]

image

Abbildung 1.1 – Der Bereich [latex]P[/latex].

Natürlich ist die Berechnung des Flächeninhalts von [latex]P[/latex] keine Herausforderung und innerhalb von Sekunden möglich, wenn wir das bestimmte (Riemann-) Integral und die dazugehörigen Rechenregeln verwenden. Wir wollen dies jedoch nicht als bekannt voraussetzen, da wir das Integral erst in etwa einem Monat einführen und verstehen werden.

Genau genommen müssen wir uns vor der Berechnung folgende fundamentale Frage stellen:

Was ist eigentlich ein Flächeninhalt?

Wenn wir diese Frage nicht genau beantworten können, dann können wir eigentlich nicht wissen, was es bedeutet, den Flächeninhalt von [latex]P[/latex] zu berechnen. Deswegen relativieren wir unser Ziel in folgender Weise — eine Proposition ist ein mathematischer Satz, also eine mathematische Aussage, mittlerer Bedeutung:

Proposition 1.1: Flächeninhalt unter der Parabel

Angenommen es gibt einen Begriff eines Flächeninhalts für Bereiche in [latex]\mathbb {R}^2[/latex], der folgende Eigenschaften erfüllt:

  • Der Flächeninhalt des sogenannten abgeschlossenen Rechtecks
    [latex]
    \begin{aligned}[][a,b] \times [c,d] = \left \lbrace {(x,y) \in \mathbb {R}^2} \mid {a \leq x \leq b, \ c \leq y \leq d}\right \rbrace\end{aligned}
    [/latex]

    und des sogenannten offenen Rechtecks

    [latex]
    \begin{aligned}[](a,b) \times (c,d) = \left \lbrace {(x,y) \in \mathbb {R}^2} \mid {a[/latex]

    ist gleich [latex](b-a)(d-c)[/latex], wobei [latex]a,b,c,d[/latex] reelle Zahlen sind mit [latex]a \leq b, c \leq d[/latex].

  • Falls [latex]G[/latex] ein Bereich in [latex]\mathbb {R}^2[/latex] ist und [latex]F[/latex] ein in [latex]G[/latex] enthaltener Bereich ist, dann ist der Flächeninhalt von [latex]F[/latex] kleiner oder gleich dem Flächeninhalt von [latex]G[/latex].
  • Für Bereiche [latex]F,G[/latex] in [latex]\mathbb {R}^2[/latex] ohne gemeinsame Punkte ist der Flächeninhalt des vereinigten Bereiches [latex]F \cup G[/latex] die Summe der Flächeninhalte von [latex]F[/latex] und [latex]G[/latex].

Dann ist der Flächeninhalt von [latex]P[/latex] wie in Gleichung (1.1) (falls überhaupt definiert) gleich [latex]\frac {1}{3}[/latex].

In anderen Worten: wir haben die Frage, ob es einen Begriff des Flächeninhalts gibt und für welche Bereiche dieser definiert ist, offengelassen, wollen aber zeigen, dass [latex]\frac {1}{3}[/latex] der einzige «vernünftige» Wert für den Flächeninhalt von [latex]P[/latex] darstellt. Die Idee unseres Beweises wird auch im folgenden Applet dargestellt.

Applet 1.2: Abschätzung eines Flächeninhaltes

Wir verwenden jeweils bis zu 1000 Rechtecke um den Flächeninhalt von unten und von oben abzuschätzen. Im Beweis unten werden wir aber unbegrenzt viele Rechtecke verwenden und können damit den Flächeninhalt ohne jegliche Unschärfe genau bestimmen.

(*)

Wir verwenden die Farbe Orange in Applets für all jene Objekte, die Sie bewegen oder einstellen können. In den meisten unserer Apps erhalten Sie Erklärungen zu Objekten, wenn Sie auf diese klicken.

Für den Beweis von Proposition 1.1 benötigen wir ein Lemma (auch Hilfssatz genannt):

Lemma 1.3: Summenformel mittels Induktion

Sei [latex]n \geq 1[/latex] eine natürliche Zahl. Dann gilt
[latex]
\begin{aligned}[]\label{eq:einf-beispiel vollst. Induktion} 1^2 + 2^2 + \cdots + (n-1)^2 + n^2 = \frac {n^3}{3} + \frac {n^2}{2} + \frac {n}{6}.\end{aligned}
[/latex]

Beweis (mittels vollständiger Induktion)

Für [latex]n=1[/latex] ist die linke Seite von Gleichung (1.2) gleich [latex]1[/latex] und die rechte Seite gleich [latex]\frac {1}{3}+ \frac {1}{2} + \frac {1}{6} = 1[/latex]. Also stimmt Gleichung (1.2) für [latex]n=1[/latex]. Dieser Beweisschritt wird Induktionsanfang genannt.

Angenommen wir wissen bereits, dass Gleichung (1.2) für die natürliche Zahl [latex]n[/latex] gilt. Wir wollen nun zeigen, dass daraus folgt, dass Gleichung (1.2) auch für [latex]n+1[/latex] gilt. Die linke Seite von Gleichung (1.2) ist gegeben durch

[latex]
\begin{aligned}[]1^2 + 2^2 + \cdots + n^2 + (n+1)^2 &= (1^2 + 2^2 + \cdots + n^2) + (n+1)^2 \\ &= \frac {n^3}{3} + \frac {n^2}{2} + \frac {n}{6} + (n+1)^2 \\ &= \frac {n^3}{3} + \frac {n^2}{2} + \frac {n}{6} + n^2 + 2n + 1 \\ &= \frac {n^3}{3} + \frac {3n^2}{2} + \frac {13n}{6} + 1\end{aligned}
[/latex]

wobei wir Gleichung (1.2) für die Zahl [latex]n[/latex] verwendet haben. Die rechte Seite von Gleichung (1.2) ist gegeben durch

[latex]
\begin{aligned}[]\frac {(n+1)^3}{3} + \frac {(n+1)^2}{2} + \frac {n+1}{6} &= \frac {n^3+ 3n^2 + 3n + 1}{3} + \frac {n^2+ 2n +1}{2} + \frac {n+1}{6} \\ &= \frac {n^3}{3} + \frac {3n^2}{2} + \frac {13n}{6} + 1\end{aligned}
[/latex]

Damit ist gezeigt, dass die linke und die rechte Seite von Gleichung (1.2) auch für [latex]n+1[/latex] übereinstimmen. Dieser Beweisschritt wird Induktionsschritt genannt.

Es folgt, dass Gleichung (1.2) wegen dem Induktionsanfang für [latex]n=1[/latex] stimmt und daher auch für [latex]n=2[/latex] wegen dem Induktionsschritt und weiter für [latex]n=3[/latex] wieder wegen dem Induktionsschritt. Fährt man so weiter, erhält man (1.2) für jede natürliche Zahl. Wir sagen, dass Gleichung (1.2) mittels vollständiger Induktion für alle natürlichen Zahlen [latex]n \geq 1[/latex] folgt. Des Weiteren deuten wir das Ende des Beweises mit einem kleinen Quadrat an. ∎

Beweis von Proposition 1.1

Wir nehmen an, dass es einen Begriff des Flächeninhalts mit den Eigenschaften in der Proposition gibt und dieser für [latex]P[/latex] definiert ist. Angenommen [latex]I[/latex] ist der Flächeninhalt von [latex]P[/latex]. Wir überdecken [latex]P[/latex] für eine gegebene natürliche Zahl [latex]n \geq 1[/latex] mit Rechtecken wie in folgender Figur (Figur 1.2).

image

Abbildung 1.2 – Die Überdeckung von [latex]P[/latex] mit Rechtecken für [latex]n=10[/latex].

Wir erhalten aus den angenommenen Eigenschaften des Flächeninhalts und Lemma 1.3, dass

[latex]
\begin{aligned}[]I &\leq \frac {1}{n}\frac {1}{n^2}+ \frac {1}{n}\frac {2^2}{n^2} + \cdots + \frac {1}{n}\frac {n^2}{n^2} = \frac {1}{n^3}(1^2 + 2^2 + \cdots + n^2 )\\ &=\frac {1}{n^3}\left (\frac {n^3}{3} + \frac {n^2}{2} + \frac {n}{6}\right ) = \frac {1}{3} + \frac {1}{2n} + \frac {1}{6n^2} \leq \frac {1}{3} + \frac {1}{n}\end{aligned}
[/latex]

Wir bemerken, dass die Geradenstücke, bei denen sich die Rechtecke berühren, Flächeninhalt [latex]0[/latex] haben und wir sie also einfach ignorieren dürfen. (Wieso? — Hier die Details zu ergänzen ist eine gute Übung.

Betrachten Sie die offenen Rechtecke, interpretieren Sie die Seiten der Rechtecke als abgeschlossene Rechtecke mit Flächeninhalt Null, und verwenden Sie nun die angenommene Additionseigenschaft für Mengen ohne gemeinsame Punkte.

). Verwenden wir hingegen Rechtecke wie in Figur 1.3 erhalten wir ebenso

image

Abbildung 1.3 – Von [latex]P[/latex] überdeckte Kollektion von Rechtecken für [latex]n=10[/latex].

[latex]
\begin{aligned}[]I &\geq \frac {1}{n}\frac {0}{n^2}+ \frac {1}{n}\frac {1^2}{n^2} + \cdots + \frac {1}{n}\frac {(n-1)^2}{n^2} \\ & = \frac {1}{n^3}(1^2+\cdots +(n-1)^2) \\ &= \frac {1}{n^3}(1^2+\cdots +(n-1)^2+n^2-n^2) \\ & = \frac {1}{n^3}\left (\frac {n^3}{3} + \frac {n^2}{2} + \frac {n}{6} - n^2\right ) \\ &\geq \frac {1}{n^3}\left (\frac {n^3}{3}- n^2\right ) = \frac {1}{3} -\frac {1}{n}\end{aligned}
[/latex]

Zusammenfassend gilt also

[latex]
\begin{aligned}[]- \frac {1}{n} \leq I - \frac {1}{3} \leq \frac {1}{n}\end{aligned}
[/latex]

für alle natürlichen Zahlen [latex]n \geq 1[/latex]. Die einzige Zahl, die kleiner als [latex]\frac {1}{n}[/latex] und grösser als [latex]-\frac {1}{n}[/latex] ist für alle natürlichen Zahlen [latex]n \geq 1[/latex], ist die [latex]0[/latex]. Dies ist anschaulich relativ klar (siehe unten) und wird später aus dem Archimedischen Prinzip folgen, welches wir in zwei Wochen ausführlich besprechen werden. Daher gilt [latex]I = \frac {1}{3}[/latex] und die Proposition folgt. ∎

Wir haben in obigem Beweis folgenden Satz benötigt:

Satz: Eine Version des Archimedischen Prinzips

Wenn [latex]x\in \mathbb {R}[/latex] die Ungleichung [latex]-\frac {1}{n}\leq x \leq \frac {1}{n}[/latex] für alle natürlichen Zahlen [latex]n[/latex] erfüllt, dann ist [latex]x=0[/latex].

Warum ist dies «anschaulich klar» ? Stellen Sie sich [latex]x \geq 0[/latex] in der Dezimaldarstellung vor. Verwenden wir die Annahme für [latex]n = 11[/latex], so sehen wir, dass [latex]x[/latex] von der Form [latex]x = 0.0a_2 a_3 \ldots[/latex] sein muss für vorerst unbekannte Ziffern [latex]a_2, a_3, a_4,\ldots[/latex]. Verwenden wir nun [latex]n = 10^2+1[/latex], dann sehen wir, dass [latex]x[/latex] nach dem Komma mindestens [latex]2[/latex] Nullen haben muss (das heisst, [latex]a_2 = 0[/latex]). Da aber die Annahme ebenso für [latex]n = 10^k+1[/latex] für eine beliebige natürliche Zahl [latex]k[/latex] gilt, sehen wir, dass [latex]x[/latex] unendlich viele Nullen nach dem Komma haben muss. Also ist [latex]x[/latex] Null. Falls [latex]x \leq 0[/latex], so erfüllt [latex]-x[/latex] die Ungleichung [latex]0 \leq -x \leq \frac {1}{n}[/latex] und insbesondere ist [latex]-x[/latex] und damit [latex]x[/latex] gleich Null nach vorherigem Argument. Dies ist wohlgemerkt kein Beweis — wir werden später einen vollständigen Beweis des Archimedischen Prinzips erbringen.

Bemerkung

Wie schon erwähnt, haben wir die Frage, ob es einen Flächeninhalt für Bereiche im [latex]\mathbb {R}^2[/latex] gibt, nicht beantwortet. Wir haben auch nicht genau beschrieben, was denn eigentlich Bereiche im [latex]\mathbb {R}^2[/latex] sind; wir sind aber implizit davon ausgegangen, dass Bereiche jene Teilmengen des [latex]\mathbb {R}^2[/latex] sind, denen wir einen Flächeninhalt zuordnen können. Diese grundlegenden Fragen werden zum Teil in Analysis I und II mit den Begriffen des Riemann-Integrals und der Jordan-messbaren Mengen beantwortet. Des Weiteren werden diese Fragen in grösserer Allgemeinheit in der Vorlesung der Mass- und Integrationstheorie im vierten Semester und anderen weiterführenden Vorlesungen im dritten oder vierten Jahr des Mathematikstudiums besprochen.


  • Das Applet 1.2 wurde in GeoGebra unter Mithilfe von Anh Huy Truong erstellt.

1.2 – Einige Tipps

«Aller Anfang ist schwer.»

Wie schon erwähnt, werden Sie einen grossen Unterschied zwischen der Schulmathematik und der Mathematik an Universitäten bemerken. Letztere verwendet auch ihre eigene Sprache, die Sie erst erlernen müssen. Je schneller Sie diese Aufgabe auf sich nehmen, desto mehr werden Sie von den Vorlesungen mitnehmen. Wir besprechen in den nächsten Abschnitten die wichtigsten Grundbegriffe, dennoch empfehlen wir Ihnen auch das Buch [2]von Schichl und Steinbauer (vor allem Kapitel 1-4), das eine ausführliche Einführung in das mathematische Arbeiten darstellt. Dies bringt uns gleich zum nächsten Tipp.

«Es gibt keinen Königsweg zur Mathematik»
(überliefertes Zitat von Euklid zu dem ägyptischen König Ptolemäus I)

Man kann Mathematik nicht durch Zusehen erlernen; genauso wenig wie Sie Tennis oder Skifahren erlernen können, in dem Sie sich alle verfügbaren Turniere oder Weltmeisterschaften im Fernsehen anschauen. Vielmehr sollten Sie Mathematik wie eine Sprache erlernen und eine Sprache bringt man sich bei, in dem man sie benützt. Besprechen Sie mit Kollegen die Themen der Vorlesungen. Erklären Sie sich gegenseitig die Beweise aus der Vorlesung oder die Lösung der Übungsbeispiele. Vor allem aber sollten Sie so viele Übungen wie nur möglich lösen; nur so können Sie sich sicher sein, dass Sie die Themen gemeistert haben.

Es ist in Ordnung, wenn Sie in kleinen Gruppen an den Übungen arbeiten. Dies hat sogar den Vorteil, dass durch die Diskussionen in der Gruppe die Objekte der Vorlesungen lebendiger werden. Sie sollten jedoch sicherstellen, dass Sie die Lösungen komplett verstehen, erklären können, und ähnliche Probleme anschliessend selbstständig lösen können.

«Wer fragt, ist ein Narr für eine Minute.
Wer nicht fragt, ist ein Narr sein Leben lang.»
(Konfuzius)

Stellen Sie so viele Fragen, wie nur möglich und stellen Sie sie dann, wenn sie auftauchen. Wahrscheinlich haben viele Ihrer Kollegen die gleiche Frage oder haben das Problem noch gar nicht bemerkt. Dem Dozierenden oder dem Hilfsassistenten wird so ermöglicht, gleichzeitig bei vielen ein Problem zu beheben und Probleme bei den Studierenden zu erkennen, wo sie oder er dachte, dass keine vorhanden seien. Des Weiteren will das gute Formulieren von Fragen geübt sein; das erste Studienjahr ist der ideale Zeitpunkt dies zu tun.

Zuletzt möchten wir erwähnen, dass zahlreiche Foren und Blogs sehr hilfreiche Ratschläge liefern, wie man richtig ins Studium einzusteigen hat und wie man Mathematik zu lernen hat. Ein Beispiel eines Blogs mit guten Tipps ist der Blog von Terence Tao. (Terence Tao ist Fields-Medaillenträger und einer der bedeutendsten lebenden Mathematiker.) Eine Frage, die Terry Tao behandelt, ist

«Does one have to be a genius to do maths?»

Genauso wie in anderen Gebieten (zum Beispiel im Sport — siehe zum Beispiel das Buch «Was heisst schon Talent?» von M. Syed) ist die klare Antwort Nein. Im Zuge seiner Erklärung verweist Terry Tao auch auf diesen Artikel. Die Lektüre dieses Artikels möchten wir Ihnen sehr empfehlen — zumindest bis zum ersten Erscheinen des Wortes «muscle» .

1.3 – Logische Begriffe

Die logischen Begriffe und die dazugehörende Theorie der Logik haben sich seit der Antike stark geändert, doch seit der Begriffsschrift von Frege (1848-1925) im Jahre 1879 nicht mehr so stark. Da ein Verständnis dieser «logischen Sprache» für die Mathematik notwendig ist, wollen wir diese hier besprechen. Für historisch Interessierte verweisen wir auch auf den Podcast der BBC, den man sich anhören kann, wenn man schon zu müde ist, um Übungen zu lösen oder man Probleme hat einzuschlafen.

Mathematische Aussagen sind, wenn ein klar definierter Rahmen gegeben ist und der Wert für etwaige Variablen bekannt ist, entweder wahr oder falsch. Diese strenge Sichtweise ist notwendig, damit wir von Bekanntem ausgehend wahre Aussagen (Lemmata und Propositionen zum Beispiel) folgern können, auf die wiederum Verlass ist (das heisst, ohne dass man Spezialfälle ausschliessen muss). Sie haben vielleicht schon einmal Sudoku gespielt und wissen, wie schwerwiegend ein kleiner Denkfehler werden kann.

1.3.1 – Aussagenlogik und die Boolesche Algebra

Da eine mathematische Aussage nur zwei «Werte» annehmen kann, wahr (w) und falsch (f), können wir gewissermassen «Rechenoperationen» für solche Aussagen sehr einfach und schnell definieren. Dies wurde erstmals von George Boole im Jahre 1847 formal ausgeführt (siehe [3]) und stellt sowohl für die Grundlagen der Mathematik als auch für die Informatik und Elektrotechnik einen historisch bedeutsamen Schritt dar. Im Folgenden werden mathematische Aussagen mit Grossbuchstaben A, B, …dargestellt.

Die einfachste Operation ist die Negation einer Aussage: Sei A eine Aussage. Die Negation von A ist die Aussage «A gilt nicht» , die wir kurz mit «Nicht A» bezeichnen und als «[latex]\neg[/latex]A» schreiben. Die Aussage «[latex]\neg[/latex]A» hat den Wert f, falls A den Wert w hat und den Wert w, falls A den Wert f hat. Wir stellen dies in einer sogenannten Wahrheitstabelle wie folgt dar:

[latex]
\begin{aligned}[]\begin{array}{c|c} A & \neg A \\ \hline w & f \\ f & w\end{array}\end{aligned}
[/latex]

Wir verwenden das Symbol «[latex]=[/latex]» für die Gleichheit und können es gebrauchen, um Aussagen wie «[latex]x=y[/latex]» zu bilden. Des Weiteren schreiben wir «[latex]x\neq y[/latex]» für die Negation «[latex]\neg (x=y)[/latex]» der Gleichheit.

Sei nun B eine weitere Aussage. Die Und-Operation angewendet auf A und B ist die Aussage «sowohl A als auch B gelten» , kurz «A und B» und symbolisch geschrieben «A[latex]\wedge[/latex]B» . Die zugehörige Wahrheitstabelle ist

[latex]
\begin{aligned}[]\begin{array}{c|c|c} A & B & A\wedge B\\ \hline w & w & w \\ w & f & f\\ f & w & f\\ f & f & f\end{array}\end{aligned}
[/latex]

Die Oder-Operation angewendet auf die beiden Aussagen A,B ergibt die Aussage «A gilt oder B gilt» , kurz «A oder B» und symbolisch geschrieben «A[latex]\vee[/latex]B» . Die zugehörige Wahrheitstabelle ist:

[latex]
\begin{aligned}[]\begin{array}{c|c|c} A & B & A\vee B\\ \hline w & w & w \\ w & f & w\\ f & w & w\\ f & f & f\end{array}\end{aligned}
[/latex]

Man sollte an dieser Stelle bemerken, dass, wie oben ersichtlich ist, das logische «Oder» (und daher auch das mathematische «Oder» ) das einschliessende «Oder» ist, welches auch zutrifft, falls beide Aussagen zutreffen. Dies unterscheidet sich teilweise vom umgangssprachlichen Gebrauch des Wortes «oder» , das oft auch exklusiv gemeint ist (als «entweder … oder» ). Die Aussage «entweder A oder B» kann über die drei Grundoperationen Negation, Und und Oder definiert werden (siehe Übung 1.4).

Die Algebraisierung der Logik hat den entscheidenden Vorteil, dass wir mittels Klammern klar darstellen können, wie Verknüpfungen von logischen Aussagen zu verstehen sind. In der Umgangssprache gibt es keine Klammern und Aussagen der Form

«Sokrates hat einen Hund und
ein Hund ist das beste Haustier oder
eine Katze ist das beste Haustier.
»

sind zweideutig. (Inkludiert obiges die Behauptung «Sokrates hat einen Hund» oder kann es auch sein, dass die Aussage «Sokrates hat keinen Hund und eine Katze ist das beste Haustier» gilt?)

Wir können Verknüpfungen (wenn nötig mit Klammern) verwenden, um neue logische Operationen zu definieren. Beispielsweise ist die logische Implikation «A[latex]\implies[/latex]B» als die Aussage «([latex]\neg[/latex]A)[latex]\vee[/latex]B» definiert. «A[latex]\implies[/latex]B» wird als «A impliziert B» ausgesprochen und auch in diesem Sinne verwendet. Denn falls A wahr ist und «[latex]A \implies B[/latex]» wahr ist, dann muss auch B wahr sein. Auffallend sind folgende Eigenheiten:

  • Jegliche Kausalität oder auch der konkrete Zusammenhang zwischen den beiden Aussagen wird ignoriert.
  • Die Implikation ist immer richtig, falls die Annahme A falsch ist. Also ist zum Beispiel die Aussage
    [latex]
    \begin{aligned}[]\label{eq:einf-log.Beispiel Implikation} "{(0 = 1) \implies (\text {die Welt ist eckig})}"\end{aligned}
    [/latex]
    dadurch wahr.

Die logische Äquivalenz der Aussagen A und B wird als «A[latex]\iff[/latex]B» geschrieben, als «A genau dann wenn B» oder als «A ist äquivalent zu B» ausgesprochen und durch die Aussage «(A[latex]\implies[/latex]B)[latex]\wedge[/latex](B[latex]\implies[/latex]A)» definiert.

Es ist hilfreich, sich die logischen Operationen auch als elektrische Schaltungen vorzustellen (siehe zum Beispiel Sektion 3.1 in [4]). Mit dieser Analogie im Hinterkopf sind die Eigenheiten der obigen Diskussion bzgl. Kausalität oder das Beispiel (1.3) leichter verständlich, denn einer Schaltung ist egal, wer (Frau, Mann, Kind, Hund oder Maschine) den Schalter betätigt oder warum (absichtlich oder unabsichtlich) dieser betätigt wurde. Auch unsere Beweise werden manchmal keine echte Kausalität herstellen, sondern nur aufzeigen, dass es keine andere Möglichkeit gibt.

Sei A eine Aussage. Die Aussage «A[latex]\vee[/latex]([latex]\neg[/latex]A)» ist eine sogenannte Tautologie, denn sie trifft unabhängig vom Wahrheitswert von A stets zu. In der Tat, wenn A wahr ist, dann ist «A[latex]\vee[/latex]([latex]\neg[/latex]A)» wahr und wenn A falsch ist, dann ist «[latex]\neg[/latex]A» wahr und «A[latex]\vee[/latex]([latex]\neg[/latex]A)» auch wahr.

Übung 1.4: Logische Implikationen und Tautologien

Seien A,B zwei Aussagen.

  1. Bestimmen Sie die Wahrheitstabellen zu «A[latex]\implies[/latex]B» und zu «A[latex]\iff[/latex]B» .
  2. Definieren Sie die logische Operation des auschliessenden Oder «A XOR B» mittels der obigen Operationen. Die Aussage «A XOR B» soll zutreffen, wenn A oder B zutrifft, aber nicht beide zutreffen.
  3. Überprüfen Sie, dass die Aussagen «A[latex]\iff[/latex]([latex]\neg[/latex]([latex]\neg[/latex]A))» und «(A[latex]\wedge[/latex]B)[latex]\iff[/latex]([latex]\neg[/latex]([latex]\neg[/latex]A[latex]\vee \neg[/latex]B))» Tautologien sind.

Wir werden anstelle der Symbole «[latex]\neg ,\wedge ,\vee ,\implies ,\iff[/latex]» meist die Worte «nicht, und, oder, impliziert, ist äquivalent zu» verwenden, wobei «oder» immer einschliessend zu verstehen ist. Da wir keine Prioritätsregel (wie die bekannte Punkt- vor Strichrechnung) festgelegt haben, sollten wir stets Klammern verwenden um Zweideutigkeiten zu vermeiden. Eine übliche Prioritätsregel ist «[latex]\wedge[/latex]» vor «[latex]\vee[/latex]» , womit die Aussage «[latex]A \wedge B \vee C[/latex]» als «[latex](A \wedge B)\vee C[/latex]» zu verstehen wäre. Nichtsdestotrotz werden wir letztere Schreibweise bevorzugen und nur die Prioritätsregel verwenden, dass die Operation [latex]\neg[/latex] immer Vorrang hat. Also kann zum Beispiel «([latex]\neg[/latex]A)[latex]\vee[/latex]B» auch als «[latex]\neg[/latex]A[latex]\vee[/latex]B» geschrieben werden.

Seien A, B zwei Aussagen. Eine sehr nützliche Tautologie ist die Aussage
[latex]
\begin{aligned}[]\label{eq:einf-log.Beispiel Tautologie} "{(A \implies B) \iff (\neg B \implies \neg A)}"\end{aligned}
[/latex]
Um zu überprüfen, dass es sich bei (1.4) tatsächlich um eine Tautologie handelt, verwenden wir zuerst die Definition der logischen Implikation und sehen, dass die linke Seite «[latex]\neg[/latex]A[latex]\vee[/latex]B» ist. Die rechte Seite wiederum ist «[latex]\neg (\neg[/latex]B)[latex]\vee \neg[/latex]A» , was zu «B[latex]\vee \neg[/latex]A» und damit auch zu «[latex]\neg[/latex]A[latex]\vee[/latex]B» äquivalent ist.

Die Tautologie (1.4) wird oft in Beweisen verwendet: Angenommen wir wollen zeigen, dass die Aussage A die Aussage B impliziert. Dann ist es manchmal einfacher und wegen (1.4) stets ausreichend zu zeigen, dass falls B nicht zutrifft auch A nicht zutrifft (dies wird Kontraposition genannt, siehe auch Abschnitt 1.6.2).

An dieser Stelle sollte man davor warnen, die Aussagen «A[latex]\implies[/latex]B» und «[latex]\neg[/latex]A[latex]\implies \neg[/latex]B» zu verwechseln; sie sind grundverschieden (auch wenn der Unterschied in politischen Diskussionen manchmal gern ignoriert wird). Wir empfehlen Ihnen, Beispiele mathematischer und nicht-mathematischer Art zu finden, die den Unterschied zwischen «A[latex]\implies[/latex]B» und «[latex]\neg[/latex]A[latex]\implies \neg[/latex]B» gut belegen.

Übung 1.5: Ritter und Knappen

Auf der Insel der Ritter und Knappen ist jeder Einwohner entweder ein Ritter oder ein Knappe (und jeder weiss den Status von allen anderen Einwohnern). Es ist wichtig zu wissen, dass

  • Ritter immer die Wahrheit sagen.
  • Knappen immer lügen.

Sie werden auf Einwohner der Insel treffen und Ihre Aufgabe ist bei jedem zu entscheiden, ob er ein Ritter oder ein Knappe ist.

  1. Sie treffen Johannes und Willhelm auf der Insel. Johannes sagt «Willhelm und ich sind Ritter.» Willhelm sagt «Das ist eine Lüge, Johannes ist ein Knappe!» Was sind sie?
  2. Sie treffen Gildas, Ergard und Telones auf der Insel. Gildas sagt «Seien Sie vorsichtig, wir sind nicht alle drei Ritter.» Ergard sagt: «Wir sind auch nicht alle drei Knappen.» Telones sagt «Hören Sie nicht auf sie, ich bin der einzige Ritter.» Was sind sie?
  3. Sie treffen Heinrich und Arthur auf der Insel. Heinrich murmelt irgend etwas Unverständliches. Arthur sagt «Er sagte, er sei ein Knappe. Das ist er sicher – vertrauen Sie ihm nicht!» Was sind sie?

Dieses Beispiel entstammt aus [5], wo Sie noch viele andere Rätsel dieser Art finden können.

1.3.2 – Prädikatenlogik

Die logischen Begriffe, die wir oben vorgestellt haben, sind zwar grundlegend für alles weitere, aber nicht genügend komplex um interessante Aussagen zu bilden. Oft werden Aussagen formuliert, die für Elemente einer bestimmten Menge (an Zahlen, Vektoren, Äpfeln, …; mehr zu Mengen später) wahr oder falsch sein können. Zum Beispiel könnte [latex]x[/latex] für eine natürliche (oder rationale, reelle, …; mehr zu Zahlen später) Zahl stehen und «[latex]x = x^2[/latex]» ist dann eine Aussage über [latex]x[/latex], die wahr oder falsch sein kann. Für derartige Aussagen «[latex]A(x)[/latex]» über Elemente [latex]x[/latex] einer Menge [latex]X[/latex] gibt es nun zwei weitere fundamentale Operationen, sogenannte Quantoren, um weitere Aussagen zu bilden.

Der Allquantor, geschrieben [latex]\forall[/latex], wird verwendet um eine Aussage über alle Elemente von [latex]X[/latex] zu treffen. Genauer steht die Aussage «[latex]\forall x \in X: A(x)[/latex]» für die Aussage «Für alle [latex]x[/latex] in [latex]X[/latex] gilt die Aussage [latex]A(x)[/latex]» . Diese Aussage kann wahr oder falsch sein. Zum Beispiel ist die Aussage

[latex]
\begin{aligned}[]"{\forall n \in \mathbb {N}: n = n^2\, }"\end{aligned}
[/latex]

falsch, aber die Aussage

[latex]
\begin{aligned}[]"{\forall n \in \mathbb {N}:(n=n^2 \implies n=1)}"\end{aligned}
[/latex]

ist richtig (denn wir werden [latex]\mathbb {N}[/latex] als [latex]\left \lbrace {1,2,3,\ldots } \right \rbrace[/latex] definieren).

Der Existenzquantor, geschrieben [latex]\exists[/latex], wird verwendet um auszudrücken, dass es ein [latex]x\in X[/latex] mit einer gewissen Eigenschaft gibt. Genauer steht «[latex]\exists x \in X:A(x)[/latex]» für «Es gibt ein [latex]x\in X[/latex], für das die Aussage [latex]A(x)[/latex] gilt» . Zum Beispiel ist die Aussage

[latex]
\begin{aligned}[]"{\exists n \in \mathbb {N}: n = n^2\, }"\end{aligned}
[/latex]

richtig, da [latex]n=1[/latex] eine natürliche Zahl ist, die [latex]1^2 = 1[/latex] erfüllt. Weiters ist auch die Aussage

[latex]
\begin{aligned}[]"{\exists n \in \mathbb {N}:(n=n^2 \implies n=1)}"\end{aligned}
[/latex]

richtig, was man ähnlich wie zuvor sieht oder alternativ wie folgt: [latex]n=5[/latex] erfüllt dass [latex]5 \neq 25 =5^2[/latex], womit die Implikation «[latex]5 = 5^2 \implies 5=1[/latex]» wahr ist.

Bemerkung: Alternative Notation

Anstelle der Symbole [latex]\forall[/latex] respektive [latex]\exists[/latex] werden teilweise auch die weniger gebräuchlichen Symbole [latex]\bigwedge[/latex] respektive [latex]\bigvee[/latex] als Synonyme verwendet. Letztere haben den Vorteil, dass sie andeuten, dass [latex]\bigwedge[/latex] ein erwachsen gewordenes [latex]\wedge[/latex] und [latex]\bigvee[/latex] ein erwachsen gewordenes [latex]\vee[/latex] darstellt. Um diesen Kommentar besser zu verstehen, nehmen wir an, dass [latex]X= \left \lbrace {x_1,x_2,x_3,\ldots ,x_n} \right \rbrace[/latex] eine endliche Menge ist, die genau die Elemente [latex]x_1,\ldots ,x_n[/latex] enthält. Dann gilt

[latex]
\begin{aligned}[]"{\left (\bigwedge x \in X: A(x)\right ) \iff (A(x_1)\wedge A(x_2)\wedge \ldots \wedge A(x_n))}"\end{aligned}
[/latex]

und

[latex]
\begin{aligned}[]"{\left (\bigvee x \in X: A(x)\right ) \iff (A(x_1)\vee A(x_2)\vee \ldots \vee A(x_n))}"\end{aligned}
[/latex]

Später werden wir sehen, dass die Symbole [latex]\cap ,\bigcap[/latex] für den Durchschnitt von Mengen den Symbolen [latex]\wedge ,\forall[/latex] und die Symbole [latex]\cup ,\bigcup[/latex] für die Vereinigung von Mengen den Symbolen [latex]\vee , \exists[/latex] entsprechen.

Kombinieren wir [latex]\forall[/latex] und [latex]\exists[/latex] so treten sehr schnell für den allgemeinen Sprachgebrauch vielleicht subtile aber für die Logik und die Mathematik fundamentale Eigenheiten der Quantoren zu Tage: Seien [latex]X,Y[/latex] Mengen und für jedes [latex]x \in X[/latex] und [latex]y\in Y[/latex] sei [latex]A(x,y)[/latex] eine Aussage. Dann haben die Aussagen

[latex]
\begin{aligned}[]"{\forall x\in X\ \exists y \in Y: A(x,y)}"\end{aligned}
[/latex]

und

[latex]
\begin{aligned}[]"{\exists y \in Y\ \forall x\in X : A(x,y)}"\end{aligned}
[/latex]

sehr verschiedene Bedeutungen.

Beispiel 1.6: Nicht-vertauschbare Quantoren

Angenommen [latex]X[/latex] steht für die Menge der Studienanfänger an der ETH, [latex]Y[/latex] für die Menge der Vorlesungen für Studienanfänger. Zu [latex]x \in X[/latex] und [latex]y \in Y[/latex] sei [latex]A(x,y)[/latex] die Aussage «Student [latex]x[/latex] interessiert sich für die Vorlesung [latex]y[/latex]» . Dann ist » [latex]\forall x\in X\ \exists y \in Y: A(x,y)[/latex]» hoffentlich wahr (oder es gibt Studenten, die sich für das völlig falsche Studium entschieden haben). Die Aussage » [latex]\exists y \in Y\ \forall x\in X : A(x,y)[/latex]» ist jedoch falsch, denn es gibt sicher zwei Studienanfänger, die keine gemeinsame Vorlesung besuchen und auch komplett verschiedene Interessen haben.

Ein mathematisches Beispiel für das gleiche Phänomen:

Beispiel 1.7: Nicht-vertauschbare Quantoren

Sei [latex]Y=X[/latex] eine beliebige Menge. Die Aussage » [latex]\forall x\in X\ \exists y \in Y: x=y[/latex]» ist dann sicher richtig, da wir für jedes [latex]x \in X[/latex] einfach [latex]y=x[/latex] wählen können. Die Aussage » [latex]\exists y \in X\ \forall x\in X : x=y[/latex]» hingegen ist nur für sehr spezielle Mengen richtig, welche?

Diese Beispiele sind möglicherweise zu einfach; wir werden jedoch der Problematik, dass man einen Existenz- mit einem Allquantor nicht vertauschen darf, in komplizierten Situationen wieder begegnen. Für zwei Quantoren der gleichen Sorte ist die Situation einfacher:

Wichtige Übung 1.8: Vertauschbarkeit von Quantoren

Seien [latex]X,Y[/latex] zwei Mengen und für jedes [latex]x \in X[/latex] und [latex]y\in Y[/latex] sei «[latex]A(x,y)[/latex]» eine Aussage. Überzeugen Sie sich oder noch besser eine Mitstudentin/einen Mitstudenten davon, dass

[latex]
\begin{aligned}[]"{(\forall x\in X\ \forall y \in Y: A(x,y)) \iff (\forall y \in Y\ \forall x\in X : A(x,y))}" \\ "{(\exists x\in X\ \exists y \in Y: A(x,y)) \iff (\exists y \in Y\ \exists x\in X : A(x,y))}"\end{aligned}
[/latex]

wahre Aussagen sind.

Auf Grund der Aussage in Übung 1.8 werden wir, gegeben eine Aussage «[latex]A(x,y)[/latex]» über zwei Elemente einer Menge [latex]X[/latex], anstelle von der Aussage «[latex]\forall x\in X\ \forall y \in X: A(x,y)[/latex]» auch «[latex]\forall x,y\in X: A(x,y)[/latex]» und anstelle von «[latex]\exists x\in X\ \exists y \in X: A(x,y)[/latex]» auch «[latex]\exists x,y\in X: A(x,y)[/latex]» schreiben.

Wir bemerken noch eine sonderbare Eigenheit des Allquantors. Sei [latex]X[/latex] die Menge, die keine Elemente enthält (die sogenannte «leere Menge» – siehe nächsten Abschnitt). Dann ist «[latex]\forall x \in X: A(x)[/latex]» immer wahr, unabhängig davon, welche Aussage [latex]A(x)[/latex] ist.

Man kann die Quantoren und die logischen Operationen auf sehr viele Arten kombinieren und sehr schnell sehr komplizierte Aussagen bilden. Später werden wir viele Beispiele sehen. Als nächstes möchten wir hier aber noch die Negation von Quantoren besprechen. Intuitiv ist die Negation des Allquantors ein Existenzquantor und die Negation des Existenzquantors ein Allquantor. Besser und genauer ausgedrückt gelten für eine beliebige Aussage «[latex]A(x)[/latex]» über Elemente einer Menge [latex]X[/latex] die folgenden Aussagen:
[latex]
\begin{aligned}[]\label{eqdualityofquantoren} \begin{aligned}"{\neg (\forall x \in X: A(x)) \iff \exists x \in X: \neg A(x)}" \\ "{\neg (\exists x \in X: A(x)) \iff \forall x \in X: \neg A(x)}"\end{aligned}\end{aligned}
[/latex]

Beispielsweise ist die Negation von «Auf jedem Planeten herrscht Gravitation» die Aussage «Es gibt einen Planeten, auf dem keine Gravitation herrscht» . Bei mehreren Quantoren verhält sich die Negation ähnlich wie ein Minus-Symbol vor einem geklammerten Ausdruck und kann «nach Innen» geschoben werden. Wir empfehlen dies in folgender Übung zu überdenken.

Wichtige Übung 1.9: Negation und verknüpfte Quantoren

Sei [latex]X[/latex] eine Teilmenge der reellen Zahlen [latex]\mathbb {R}[/latex]. Bilden Sie die Negation folgender Aussagen und versuchen Sie die Negation so weit wie möglich nach «rechts» zu verschieben (obwohl die Aussagen geometrische Bedeutung haben, muss man diese weder kennen noch verstehen, um die Aufgabe zu lösen):

  • «[latex]\forall y \in \mathbb {R}\ \forall \varepsilon > 0\ \exists x \in X: |x-y|
  • «[latex]\forall y \in X\ \exists \varepsilon >0\ \forall x \in X: |x-y|
  • «[latex]\forall \varepsilon >0\ \forall x\in X\ \exists y\in X: (y \neq x) \wedge |x-y|

Hier ist «[latex]\forall \varepsilon > 0:A(\varepsilon )[/latex]» eine gebräuchliche Kurzform für «[latex]\forall \varepsilon \in \mathbb {R}: \varepsilon >0 \implies A(\varepsilon )[/latex]» oder anders ausgedrückt für «[latex]\forall \varepsilon \in \left \lbrace {x \in \mathbb {R}} \mid {x>0}\right \rbrace : A(\varepsilon )[/latex]» . Die Aussage «[latex]\exists \varepsilon > 0:A(\varepsilon )[/latex]» steht für «[latex]\exists \varepsilon \in \mathbb {R}: \varepsilon >0 \wedge A(\varepsilon )[/latex]» oder äquivalenterweise für «[latex]\exists \varepsilon \in \left \lbrace {x \in \mathbb {R}} \mid {x>0}\right \rbrace : A(\varepsilon )[/latex]» . Sie können für die Negation von «[latex]|x-y|

Eine Lösung zum ersten Teil

Wir demonstrieren die Vorgehensweise am ersten Teil der Übung. Auf Grund der direkt vor der Übung erwähnten «Rechenregeln» mit Quantoren erhalten wir

[latex]
\begin{aligned}[]``\neg \big ( \forall y \in \mathbb {R}\ &\forall \varepsilon > 0\ \exists x \in X: |x-y| {\; 0\ \exists x \in X: |x-y| {\; 0: \neg \big (\exists x \in X: |x-y| {\; 0\ \forall x \in X: \neg \big (|x-y| {\; 0\ \forall x \in X: |x-y| \geq \varepsilon ".\end{aligned}
[/latex]

Ein dritter Quantor, der häufig verwendet wird, ist der Quantor der eindeutigen Existenz, geschrieben [latex]\exists ![/latex] . Dieser lässt sich mit Hilfe der beiden Quantoren [latex]\forall[/latex] und [latex]\exists[/latex] wie folgt definieren: Die Aussage «[latex]\exists ! x \in X: A(x)[/latex]» wird durch

[latex]
\begin{aligned}[]"{(\exists x \in X: A(x)) \wedge (\forall x, y \in X: (A(x) \wedge A(y) \implies x=y))}"\end{aligned}
[/latex]

definiert. Sie bedeutet, dass es ein [latex]x[/latex] in [latex]X[/latex] gibt, das die Aussage [latex]A(x)[/latex] erfüllt und dass dieses [latex]x[/latex] durch die Aussage eindeutig bestimmt ist. Es gibt also kein weiteres Element [latex]y \in X[/latex], welches nicht gleich [latex]x[/latex] ist und [latex]A(y)[/latex] erfüllt.

Übung 1.10

Formulieren Sie ein konkretes Beispiel zu obigem. In anderen Worten: finden Sie eine Aussage über Elemente einer Menge, die von genau einem Element erfüllt wird.

Eine Warnung: Sei [latex]X[/latex] eine Menge und [latex]A(x)[/latex] eine Aussage über Elemente von [latex]X[/latex]. Nach dem Satz «Es gibt ein eindeutig bestimmtes [latex]x_0[/latex] in [latex]X[/latex], das [latex]A(x_0)[/latex] erfüllt.» wird oft dieses [latex]x_0[/latex] in weiteren Argumenten verwendet. Da [latex]x_0[/latex] eindeutig festgelegt ist, ist dies akzeptabel. Manchmal wird aber auch nach dem Satz «Es gibt ein [latex]x[/latex] in [latex]X[/latex], das [latex]A(x)[/latex] erfüllt.» so ein [latex]x[/latex] in der Argumentation benötigt. Hier sollte man erwähnen, dass so ein [latex]x[/latex] gewählt wird. Des Weiteren sollte man, wenn nötig, sicher stellen, dass das darauf Folgende nicht (oder nur auf unwesentliche Weise) von der Wahl von [latex]x[/latex] abhängt.

Übung 1.11

Zum Spass: Betrachten Sie den Satz «Everybody loves my babe, but my babe loves no one but me» (leicht adaptiert nach Louis Armstrong) vom streng logischen Standpunkt. Handelt er von einem Liebespaar?

1.4 – Mengenlehre und Abbildungen

1.4.1 – Naive Mengenlehre

Georg Cantor definierte 1895 in [6]den Begriff einer Menge wie folgt:

«Unter einer Menge verstehen wir jede Zusammenfassung [latex]M[/latex] von bestimmten wohlunterschiedenen Objekten unserer Anschauung oder unseres Denken (welche Elemente von [latex]M[/latex] genannt werden) zu einem Ganzen.»

Also sind die zentralen Annahmen der naiven Mengenlehre (oder Cantorschen Mengenlehre)

  1. Eine Menge besteht aus beliebigen unterscheidbaren Elementen.
  2. Eine Menge ist unverwechselbar durch ihre Elemente bestimmt.
  3. Jede Eigenschaft [latex]A(x)[/latex] definiert die Menge der Objekte [latex]\left \lbrace {x} \mid {A(x)}\right \rbrace[/latex], die diese Eigenschaft besitzen (das heisst, die Aussage [latex]A(x)[/latex] erfüllen).

Manchmal schreiben wir eine Menge durch eine konkrete Auflistung ihrer Elemente ([latex]M = \left \lbrace {x_1,x_2,\ldots ,x_n} \right \rbrace[/latex] zum Beispiel). Die leere Menge, geschrieben als [latex]\left \lbrace { } \right \rbrace[/latex] oder auch [latex]\emptyset[/latex], ist die Menge, die keine Elemente enthält. Mengen werden teilweise auch Familien (oder Kollektionen, Ansammlungen) genannt. Wir schreiben «[latex]x \in X[/latex]» , falls [latex]x[/latex] ein Element der Menge [latex]X[/latex] ist. Je nach Zusammenhang nennen wir die Elemente mitunter auch Punkte, Zahlen oder Vektoren. Falls [latex]x[/latex] kein Element der Menge [latex]X[/latex] ist (also [latex]\neg (x \in X)[/latex]), so schreiben wir auch [latex]x \not \in X[/latex].

Definition 1.12: Inklusionen

Wir sagen, dass eine Menge [latex]P[/latex] Teilmenge einer Menge [latex]Q[/latex] ist und schreiben [latex]P \subseteq Q[/latex], falls für alle [latex]x \in P[/latex] auch [latex]x \in Q[/latex] gilt (in Prädikatenlogik [latex]\forall x \in P: x\in Q[/latex]). Wir sagen, dass [latex]P[/latex] eine echte Teilmenge von [latex]Q[/latex] ist und schreiben [latex]P \subsetneq Q[/latex], falls [latex]P[/latex] eine Teilmenge von [latex]Q[/latex] ist, aber nicht gleich [latex]Q[/latex] ist. Wir schreiben [latex]P \not \subseteq Q[/latex], falls [latex]P[/latex] keine Teilmenge von [latex]Q[/latex] ist (also [latex]\neg (P \subseteq Q)[/latex] gilt).

Äquivalente Formulierungen für «[latex]P[/latex] ist eine Teilmenge von [latex]Q[/latex]» sind «[latex]P[/latex] ist in [latex]Q[/latex] enthalten» und «[latex]Q[/latex] ist eine Obermenge von [latex]P[/latex]» , was wir auch als «[latex]Q \supseteq P[/latex]» schreiben. Die Bedeutung der Aussage «[latex]Q[/latex] ist eine echte Obermenge von [latex]P[/latex]» , geschrieben [latex]Q \supsetneq P[/latex], ergibt sich nun implizit.

Übung 1.13

Seien [latex]P,Q[/latex] Mengen. Formuliere die Aussagen «[latex]P[/latex] ist eine echte Teilmenge von [latex]Q[/latex]» und «[latex]P[/latex] ist keine Teilmenge von [latex]Q[/latex]» in Prädikatenlogik.

Teillösung

«P ist eine echte Teilmenge» ist durch «[latex](\forall x\in P:x\in Q)\wedge (\exists x\in Q:x\notin P)[/latex]» definiert.

Wegen der zweiten Annahme der naiven Mengenlehre sind zwei Mengen [latex]P,Q[/latex] genau dann gleich, wenn [latex]P\subseteq Q[/latex] und [latex]Q \subseteq P[/latex] gelten. Insbesondere könnte [latex]\left \lbrace {x,y} \right \rbrace = \left \lbrace {z} \right \rbrace[/latex] gelten, falls [latex]x=y=z[/latex] ist (es gibt für Elemente einer Menge keine Vielfachheiten). Im Folgenden führen wir geläufige Konstruktionen von Mengen aus gegebenen Mengen ein.

Definition 1.14: Mengenoperationen

Seien [latex]P,Q[/latex] zwei Mengen. Der Durchschnitt [latex]P \cap Q[/latex], die Vereinigung [latex]P \cup Q[/latex], das relative Komplement [latex]P \setminus Q[/latex] und die symmetrische Differenz [latex]P {\scriptstyle \triangle } Q[/latex] sind durch

[latex]
\begin{aligned}[]P \cap Q &= \left \lbrace {x} \mid {x \in P \wedge x \in Q}\right \rbrace \\ P \cup Q &= \left \lbrace {x} \mid {x \in P \vee x \in Q}\right \rbrace \\ P \setminus Q &= \left \lbrace {x} \mid {x \in P \wedge x \notin Q}\right \rbrace \\ P {\scriptstyle \triangle } Q &= P \setminus Q \cup Q \setminus P = \left \lbrace {x} \mid {x \in P\ \text {XOR}\ x \in Q}\right \rbrace\end{aligned}
[/latex]

definiert. Wenn aus dem Zusammenhang klar ist, dass alle betrachteten Mengen Teilmengen einer gegebenen (Ober-) Menge [latex]X[/latex] sind, dann ist das Komplement [latex]P^c[/latex] von [latex]P[/latex] (in [latex]X[/latex]) definiert durch [latex]P^c = X \setminus P[/latex]. Dies ist alles in den Bildern 1.4 und 1.5 veranschaulicht.

image

Abbildung 1.4 – Schnitt, Vereinigung, Komplement beziehungsweise symmetrische Differenz von [latex]P,Q[/latex]. Skizzen dieser Art nennen sich auch Venndiagramme.

image

Abbildung 1.5 – Das Komplement [latex]P^c = X\setminus P[/latex] von [latex]P[/latex] in [latex]X[/latex].

Übung 1.15: Distributivgesetze

Zeigen Sie die folgenden Distributivgesetze:

  1. Seien [latex]A,B,C[/latex] Aussagen. Zeigen Sie
    [latex]
    \begin{aligned}[]&(A \vee B) \wedge C \iff (A \wedge C) \vee (B \wedge C)\\ &(A \wedge B) \vee C \iff (A \vee C) \wedge (B \vee C)\end{aligned}
    [/latex]
  2. Seien [latex]P,Q,R[/latex] Mengen. Zeigen Sie
    [latex]
    \begin{aligned}[]&(P \cup Q) \cap R = (P \cap R) \cup (Q \cap R)\\ &(P \cap Q) \cup R = (P \cup R) \cap (Q \cup R)\end{aligned}
    [/latex]

Können Sie auch Kommutativ- und Assoziativgesetze formulieren?

Eine Teillösung

Als Illustration davon, wie man hier vorgehen kann, wollen wir den ersten Teil von (i) lösen. Angenommen die Aussage [latex](A \vee B) \wedge C[/latex] ist wahr. Dann stimmt [latex]C[/latex] und es stimmt [latex]A[/latex] oder [latex]B[/latex]. Angenommen [latex]A[/latex] stimmt. Dann ist [latex]A \wedge C[/latex] wahr und somit auch die Aussage [latex](A \wedge C) \vee (B \wedge C)[/latex]. Genauso geht man vor, wenn [latex]B[/latex] stimmt.

Angenommen die Aussage [latex](A \wedge C) \vee (B \wedge C)[/latex] ist wahr. Dann gilt [latex]A \wedge C[/latex] oder [latex]B \wedge C[/latex]. In erstem Fall stimmen die Aussagen [latex]A[/latex] (und damit auch [latex]A \vee B[/latex]) und [latex]C[/latex] und also folgt [latex](A \vee B) \wedge C[/latex]. Der zweite Fall ist analog.

Die Kommutativgesetze der Aussagenlogik lauten

[latex]
\begin{aligned}[]A\wedge B&\iff B\wedge A, \\ A\vee B&\iff B\vee A.\end{aligned}
[/latex]

Die Assoziativgesetze lauten

[latex]
\begin{aligned}[](A\wedge B)\wedge C&\iff A\wedge (B\wedge C),\\ (A\vee B)\vee C&\iff A\vee (B\vee C).\end{aligned}
[/latex]

Übung 1.16: Gesetze von De Morgan

Seien [latex]P,Q[/latex] Teilmengen einer Menge [latex]X[/latex]. Zeigen Sie den folgenden Spezialfall der De Morganschen Gesetze:

[latex]
\begin{aligned}[](P \cup Q)^c = P^c \cap Q^c,\\ (P \cap Q)^c = P^c \cup Q^c.\end{aligned}
[/latex]

Erläutern Sie Ihr Vorgehen an einem Bild im Stile von Figuren 1.4 und 1.5.

Wir verallgemeinern nun zwei Begriffe aus Definition 1.14:

Definition 1.17: Beliebige Vereinigungen und Schnitte

Sei [latex]\mathcal {A}[/latex] eine Kollektion von Mengen. Dann definieren wir die Vereinigung resp. den Schnitt der Mengen in [latex]\mathcal {A}[/latex] als

[latex]
\begin{aligned}[]\bigcup _{A \in \mathcal {A}}A = \bigl \{ x\mid \exists A \in \mathcal {A}:x \in A\bigr \} \\ \bigcap _{A \in \mathcal {A}}A= \bigl \{ x\mid \forall A \in \mathcal {A}:x \in A\bigr \}\end{aligned}
[/latex]

Vergewissern Sie sich an dieser Stelle, dass diese beiden Begriffe zu Definition 1.14 kompatibel sind. Falls wir die Vereinigung nicht über alle Mengen in [latex]\mathcal {A}[/latex] nehmen wollen, sondern nur über solche, die eine gewisse Eigenschaft [latex]E(A)[/latex] erfüllen, dann schreiben wir auch

[latex]
\begin{aligned}[]\bigcup _{A \in \mathcal {A}: E(A)}A = \bigcup _{A \in \left \lbrace {B \in \mathcal {A}} \mid {E(B)}\right \rbrace }A\end{aligned}
[/latex]

und analog für den Durchschnitt. Falls [latex]\mathcal {A} = \left \lbrace {A_1,A_2,\ldots } \right \rbrace[/latex], dann schreiben wir auch

[latex]
\begin{aligned}[]\bigcup _{n \geq 1}A_n = \bigcup _{n=1}^\infty A_n = \bigcup _{A \in \mathcal {A}}A = \left \lbrace {x} \mid {\exists n \in \mathbb {N}:x\in A_n}\right \rbrace\end{aligned}
[/latex]

und

[latex]
\begin{aligned}[]\bigcap _{n \geq 1}A_n = \bigcap _{n=1}^\infty A_n = \bigcap _{A \in \mathcal {A}}A = \left \lbrace {x} \mid {\forall n \in \mathbb {N}:x\in A_n}\right \rbrace .\end{aligned}
[/latex]

Wichtige Übung 1.18: De Morgansche Gesetze

Sei [latex]\mathcal {A}[/latex] eine Kollektion von Mengen. Zeigen Sie die allgemeine Form der De Morganschen Gesetze:

[latex]
\begin{aligned}[]\bigg (\bigcup _{A \in \mathcal {A}}A\bigg )^c &= \bigcap _{A \in \mathcal {A}}A^c \\ \bigg (\bigcap _{A \in \mathcal {A}}A\bigg )^c &= \bigcup _{A \in \mathcal {A}}A^c.\end{aligned}
[/latex]

Hinweis.

Dieses Gesetz entspricht der Dualität der Quantoren [latex]\forall[/latex] und [latex]\exists[/latex] in (1.5).

Übung 1.19

Was ist die Menge

[latex]
\begin{aligned}[]\bigcap _{n = 1}^\infty \left \lbrace x \in \mathbb {R}\ \Big |\ -\frac {1}{n} \leq x \leq \frac {1}{n} \right \rbrace ,\end{aligned}
[/latex]

wobei [latex]n[/latex] wie in Definition 1.17 über alle natürlichen Zahlen läuft, und wie nennen wir dies?

Hinweis.

Wir haben dieses Prinzip bereits in Abschnitt 1.1 kurz besprochen.

Für unsere Zwecke wird folgende Definition ebenfalls nützlich sein:

Definition 1.20: Disjunktheit

Zwei Mengen [latex]A,B[/latex] heissen disjunkt, falls [latex]A \cap B = \left \lbrace { } \right \rbrace[/latex]. In diesem Fall wird ihre Vereinigung [latex]A \cup B[/latex] disjunkte Vereinigung genannt und auch als [latex]A \sqcup B[/latex] geschrieben. Für eine Kollektion [latex]\mathcal {A}[/latex] von Mengen, sagen wir, dass die Mengen in [latex]\mathcal {A}[/latex] paarweise disjunkt sind, falls für alle [latex]A_1,A_2 \in \mathcal {A}[/latex] mit [latex]A_1 \neq A_2[/latex] gilt [latex]A_1 \cap A_2 = \left \lbrace { } \right \rbrace[/latex]. Die Vereinigung der Mengen in [latex]\mathcal {A}[/latex] wird dann auch disjunkte Vereinigung genannt und als [latex]\bigsqcup _{A \in \mathcal {A}} A[/latex] geschrieben.

Wir wenden uns nun einer weiteren, intuitiv vielleicht bekannten, Mengenkonstruktion zu:

Definition 1.21: Kartesisches Produkt

Für zwei Mengen [latex]X[/latex] und [latex]Y[/latex] ist das kartesische Produkt [latex]X \times Y[/latex] die Menge aller geordneten Paare [latex](x,y)[/latex] wobei [latex]x \in X[/latex] und [latex]y \in Y[/latex]. In Symbolen,

[latex]
\begin{aligned}[]X \times Y = \left \lbrace {(x,y)} \mid {x \in X \ \text {und}\ y \in Y}\right \rbrace .\end{aligned}
[/latex]

Allgemeiner ist das kartesische Produkt von [latex]n[/latex]-Mengen [latex]X_1,X_2,\ldots ,X_n[/latex] definiert als

[latex]
\begin{aligned}[]X_1\times X_2 \times \cdots \times X_n = \left \lbrace {(x_1,x_2,\ldots ,x_n)} \mid {x_1 \in X_1, x_2 \in X_2,\ldots ,x_n \in X_n}\right \rbrace .\end{aligned}
[/latex]

Weiters definieren wir [latex]X^n[/latex], für eine natürliche Zahl [latex]n[/latex], als das [latex]n[/latex]-fache kartesische Produkt von [latex]X[/latex] mit sich selbst. Das heisst, [latex]X^2 = X \times X[/latex], [latex]X^3 = X\times X \times X[/latex] und so weiter.

Graphisch (meist schematisch) wird das kartesische Produkt [latex]X \times Y[/latex] zweier Mengen [latex]X[/latex], [latex]Y[/latex] wie in folgendem Bild dargestellt.

image

Abbildung 1.6 – Zwei Darstellungen von [latex]X \times Y[/latex].

Wir wollen kurz ein paar Beispiele dieser Konstruktion erwähnen.

Beispiel 1.22: Einige kartesische Produkte

Falls [latex]X = \left \lbrace {0,1} \right \rbrace[/latex] ist, dann ist

[latex]
\begin{aligned}[]X^2 = \left \lbrace {0,1} \right \rbrace ^2 = \left \lbrace {(0,1),(1,0),(0,0),(1,1)} \right \rbrace .\end{aligned}
[/latex]

Falls [latex]X = \left \lbrace {a,b,c,\ldots ,z} \right \rbrace[/latex] die Menge der Buchstaben im Alphabet ist, so kann man [latex]X^n[/latex] mit der Menge aller möglichen (potenziell sinnfreien) Wörter der Länge [latex]n[/latex] identifizieren. Die Menge der deutschen Wörter der Länge [latex]n[/latex] bildet eine echte Teilmenge von [latex]X^n[/latex] unter dieser Identifikation.

Übung 1.23: Digitale Uhr

Die Menge der von einer digitalen Uhr angezeigten Uhrzeiten lässt sich als kartesisches Produkt zweier Mengen auffassen. Wie?

Übung 1.24: Schnitte von Rechtecken

Seien [latex]X,Y[/latex] Mengen und [latex]A, A'[/latex] Teilmengen von [latex]X[/latex], [latex]B,B'[/latex] Teilmengen von [latex]Y[/latex]. Zeigen Sie die Formel

[latex]
\begin{aligned}[](A \times B) \cap (A' \times B') = (A \cap A') \times (B \cap B').\end{aligned}
[/latex]

Überzeugen Sie sich auch davon, dass es keine ähnliche Formel für die Vereinigung gibt.

Unsere vorerst letzte Konstruktion von Mengen ist in der nächsten Definition gegeben:

Definition 1.25: Potenzmenge

Für eine Menge [latex]X[/latex] ist die Potenzmenge [latex]\mathcal {P}(X)[/latex] durch die Menge all ihrer Teilmengen gegeben, das heisst

[latex]
\begin{aligned}[]\mathcal {P}(X) = \left \lbrace {Q} \mid {Q \text { ist eine Menge und } Q \subseteq X}\right \rbrace .\end{aligned}
[/latex]

Übung 1.26

Bestimmen Sie [latex]\mathcal {P}(\left \lbrace {} \right \rbrace )[/latex] und [latex]\mathcal {P}(\mathcal {P}(\left \lbrace {} \right \rbrace ))[/latex].

Eine Lösung zu ersterem

Ist [latex]Q[/latex] eine Teilmenge von [latex]\{ \}[/latex], so muss jedes Element, das in [latex]Q[/latex] liegt, auch in [latex]\{ \}[/latex] liegen. Also muss [latex]Q[/latex] die leere Menge sein. Umgekehrt ist die leere Menge natürlich in der leeren Menge enthalten. Also besteht die Potenzmenge [latex]\mathcal {P}(\{ \} )[/latex] der leeren Menge genau aus der Menge [latex]\left \lbrace {\left \lbrace {} \right \rbrace } \right \rbrace[/latex], die ein Element enthält.

Der Grund, warum obiges die naive Mengenlehre genannt wird, ist, dass sie Anfang des zwanzigsten Jahrhunderts durch die axiomatische Mengenlehre (ZF- oder ZFC-Mengen­lehre abhängig von einem weiteren Axiom – ZF steht für Zermelo-Fraenkel) ersetzt wurde. Denn die naive Mengenlehre kann sehr schnell zu Widersprüchen geführt werden:

Beispiel 1.27: Russell 1903

Sei [latex]R[/latex] die Menge aller Mengen, die sich nicht selbst enthalten, also

[latex]
\begin{aligned}[]R = \left \lbrace {X} \mid {X \text { ist eine Menge und } X \notin X}\right \rbrace .\end{aligned}
[/latex]

Stellt man nun die Frage, ob [latex]R[/latex] selbst zu [latex]R[/latex] gehören kann, so erhält man «[latex]R \in R \iff R \notin R[/latex]» . Dies kann aber nicht gelten und ist also ein Widerspruch der naiven Mengenlehre (siehe [7]).

Dieses Beispiel wird Russell-Paradox genannt (siehe auch diesen Link) und ist eine Version des sogenannten Lügner-Paradoxons («Dieser Satz ist falsch.» oder «Ich lüge immer.» ). Es entstand, da wir ohne vernünftige Einschränkungen das Bilden beliebiger neuer Mengen erlaubten. In der axiomatischen Mengenlehre werden nur gewisse Konstruktionen (wie zum Beispiel das kartesische Produkt oder die Potenzmenge) erlaubt, was dazu führt, dass die Menge [latex]R[/latex] aus dem Russell-Paradox keine Menge mehr ist. Dies löst den Widerspruch auf: [latex]R[/latex] kann sich somit nicht selbst enthalten, da [latex]R[/latex] ja nur Mengen enthält. [latex]R[/latex] wird in der axiomatischen Mengenlehre eine Klasse genannt. Weiters dürfen Klassen nicht als Elemente von Mengen oder Klassen auftreten.

Im folgenden bedienen wir uns der naiven Mengenlehre, da wir die Zeit nicht aufbringen können, die axiomatische Mengenlehre ausreichend zu besprechen und da wir auf jeden Fall nur «vernünftige» Mengenkonstruktionen verwenden werden. (Dies macht vom streng logischen Standpunkt wenig Sinn, ist aber ein notwendiger Kompromiss.)

Übung 1.28: Der Barber aus Sevilla

Bart, der Barber in dem Dorf Sevilla, rasiert alle Männer von Sevilla, die sich nicht selbst rasieren. Sonst rasiert Bart aber niemanden. Rasiert Bart sich selbst?

Hinweis.

Die Aussage ist nicht paradox und der zu findende Ausweg ist analog zur obigen Auflösung des Russell-Paradoxes.

1.4.2 – Abbildungen

Der Begriff der Funktion ist für die Analysis, die Lineare Algebra, die Mathematik allgemein und ihre Anwendungen unentbehrlich.

Definition 1.29: Funktionen und erste dazugehörige Begriffe

In Worten ausgedrückt ist eine Funktion [latex]f[/latex] von der Menge [latex]X[/latex] nach der Menge [latex]Y[/latex] eine Zuordnung, die jedem [latex]x \in X[/latex] ein eindeutig bestimmtes [latex]y = f(x) \in Y[/latex] zuweist. Wir schreiben [latex]f : X \to Y[/latex] für eine Funktion von [latex]X[/latex] nach [latex]Y[/latex] und sprechen manchmal auch von einer Abbildung oder einer Transformation. Zu einer Funktion [latex]f: X \to Y[/latex] wird [latex]X[/latex] der Definitionsbereich von [latex]f[/latex] und [latex]Y[/latex] der Wertebereich (oder Zielbereich) von [latex]f[/latex] genannt. Im Zusammenhang mit der Funktion [latex]f[/latex] wird ein Element [latex]x[/latex] des Definitionsbereichs auch Argument und ein von der Funktion angenommenes Element [latex]y = f(x) \in Y[/latex] für ein [latex]x \in X[/latex] auch Wert der Funktion genannt.

Zwei Funktionen [latex]f_1:~X_1~\to ~Y_1[/latex] und [latex]f_2:X_2 \to Y_2[/latex] gelten als gleich, falls [latex]X_1 = X_2[/latex], [latex]Y_1 = Y_2[/latex] und [latex]f_1(x) = f_2(x)[/latex] für alle [latex]x \in X_1[/latex] gilt. Das Bild einer Funktion [latex]f: X \to Y[/latex] ist die Menge

[latex]
\begin{aligned}[]f(X) = \left \lbrace {y \in Y} \mid {\exists x \in X: y = f(x)}\right \rbrace .\end{aligned}
[/latex]

Falls [latex]f:X \to Y[/latex] eine Funktion und [latex]A[/latex] eine Teilmenge von [latex]X[/latex] ist, dann definieren wir die Einschränkung [latex]f|_A:A \to Y[/latex] durch [latex]f|_A(x) = f(x)[/latex] für alle [latex]x \in A[/latex]. Umgekehrt wird die Abbildung [latex]f[/latex] auch als eine Fortsetzung der Funktion [latex]f|_A[/latex] bezeichnet. Des Weiteren definieren wir das Bild der Teilmenge [latex]A[/latex] unter [latex]f[/latex] als

[latex]
\begin{aligned}[]f(A) = f|_A(A) = \left \lbrace {y \in Y} \mid {\exists x \in A: y = f(x)}\right \rbrace .\end{aligned}
[/latex]

Beispiel 1.30: Erste Funktionen

  1. Sei [latex]X[/latex] eine Menge. Die Identitätsabbildung [latex]\operatorname {id}_X: X \to X[/latex] ist die Funktion definiert durch [latex]\operatorname {id}_X(x) = x[/latex] für alle [latex]x \in X[/latex].
  2. Seien [latex]X,Y[/latex] Mengen und sei [latex]y_0 \in Y[/latex]. Dann ist [latex]f:X \to Y[/latex] definiert durch [latex]f(x) = y_0[/latex] für alle [latex]x \in X[/latex] eine Funktion. Solche Funktionen werden konstante Funktionen genannt.
  3. Sei [latex]A \subseteq X[/latex] eine Teilmenge und [latex]Y[/latex] eine Menge, die [latex]\{ 0,1\}[/latex] enthält. Die Funktion
    [latex]
    \begin{aligned}[]\mathds {1}_A: X &\to Y\\ \mathds {1}_A(x) &= \left \lbrace \begin{array}{cc} 0 & \text {für } x \not \in A \\ 1 & \text {für } x \in A\end{array} \right .\end{aligned}
    [/latex]

    wird die charakteristische Funktion von [latex]A[/latex] genannt. Das Bild von [latex]\mathds {1}_A[/latex] ist genau dann ganz [latex]\left \lbrace {0,1} \right \rbrace[/latex], wenn die Menge [latex]A[/latex] weder leer noch ganz [latex]X[/latex] ist (wieso?).

  4. Für zwei Mengen [latex]X_1,X_2[/latex] definieren wir die Projektionen
    [latex]
    \begin{aligned}[]\pi _1: X_1 \times X_2 \to X_1\\ \pi _1\big ((x_1,x_2)\big ) = x_1\end{aligned}
    [/latex]

    und

    [latex]
    \begin{aligned}[]\pi _2: X_1 \times X_2 \to X_2\\ \pi _2\big ((x_1,x_2)\big ) = x_2.\end{aligned}
    [/latex]

    Das Bild von [latex]\pi _1[/latex] ist [latex]X_1[/latex], falls [latex]X_2[/latex] nicht leer ist, und ebenso ist [latex]\pi _2(X_1 \times X_2) = X_2[/latex], falls [latex]X_1 \neq \left \lbrace { } \right \rbrace[/latex]. Wir schreiben manchmal auch [latex]\pi _{X_1}[/latex] anstelle von [latex]\pi _1[/latex] und [latex]\pi _{X_2}[/latex] anstelle von [latex]\pi _2[/latex].

    image

Oft, aber bei weitem nicht immer, wird eine Funktion durch eine Formel wie zum Beispiel [latex]y = x^2[/latex] definiert, doch ohne Angabe des Definitionsbereichs und des Wertebereichs wäre die Definition der Funktion unvollständig (siehe auch Beispiel 1.33). Wir diskutieren hier kurz geläufige Art und Weisen, diesen Mangel zu beheben. Ist [latex]f:X \to Y[/latex] eine Funktion, so schreibt man auch

[latex]
\begin{aligned}[]f:X \to Y, \ x \mapsto f(x)\end{aligned}
[/latex]

oder

[latex]
\begin{aligned}[]f: X &\to Y\\ x &\mapsto f(x),\end{aligned}
[/latex]

wobei [latex]f(x)[/latex] eine konkrete Formel sein könnte. Beispielsweise wäre [latex]f: \mathbb {R} \to \mathbb {R},\ x \mapsto x^2[/latex] eine vollständig definierte Funktion in dieser Notation. Alternativ schreibt man auch

[latex]
\begin{aligned}[]x \in X \mapsto f(x) \in Y,\end{aligned}
[/latex]

also zum Beispiel [latex]x \in \mathbb {R} \mapsto x^2 \in \mathbb {R}[/latex], und hat auch hier Definitions- und Wertebereich angegeben. Wir sprechen «[latex]\mapsto[/latex]» unter anderem als «wird abgebildet auf» aus.

Definition 1.31: Drei Eigenschaften von Funktionen

Sei [latex]f: X\to Y[/latex] eine Funktion.

  • Die Funktion [latex]f[/latex] heisst injektiv oder eine Injektion falls für alle [latex]x_1,x_2 \in X[/latex] gilt, dass [latex]f(x_1) = f(x_2) \implies x_1 = x_2[/latex].
  • Die Funktion [latex]f[/latex] ist surjektiv, eine Surjektion oder eine Funktion von [latex]X[/latex] auf [latex]Y[/latex], falls [latex]f(X) = Y[/latex].
  • Die Funktion [latex]f[/latex] heisst bijektiv, eine Bijektion oder eine eineindeutige Abbildung, falls [latex]f[/latex] surjektiv und injektiv ist.

Eine Funktion [latex]f: X \to Y[/latex] ist also nicht injektiv, falls zwei verschiedene Elemente [latex]x_1,x_2 \in X[/latex] existieren mit [latex]f(x_1) = f(x_2)[/latex].

Applet 1.32: Funktionen auf Mengen mit höchstens drei Elementen

In diesem Applet kann man verschiedene Funktionen [latex]f[/latex] von einer Menge [latex]X[/latex] mit höchstens drei Elementen nach einer Menge [latex]Y[/latex] mit höchstens drei Elementen definieren. Hierbei kommt es zu verschiedenen Eigenschaften der Funktion.

(*)

Die vielleicht eigenartigste Frage ist, welche Eigenschaften die Funktion von der leeren Menge zur leeren Menge besitzt. Folgt man stur der Definition der Begriffe (was sonst sollte man machen) so erkennt man, dass diese Funktion injektiv, surjektiv, und daher auch bijektiv ist. Doch ist diese Funktion auch konstant? Dies hängt davon ab, welche der beiden Aussagen man als die Definition für eine konstante Funktion ansieht:

  • [latex]\forall x_1,x_2\in X: f(x_1)=f(x_2)[/latex]
  • [latex]\exists y\in Y:\forall x\in X: f(x)=y[/latex]

Diese beiden Aussagen über eine Funktion [latex]f:X\to Y[/latex] sind äquivalent, sobald [latex]Y[/latex] nicht die leere Menge ist, und könnten beide als Definition des Begriffs «konstant» angesehen werden. Doch für den eigenartigen Spezialfall der «leeren Funktion» , welche auf der leeren Menge definiert ist und Werte in der leeren Menge annimmt, sind diese beiden Aussagen unterschiedlich. Da wir ab nun diesen Spezialfall einfach ignorieren und nur Funktionen auf nicht-leeren Mengen betrachten wollen, müssen wir uns nicht für eine der beiden Definitionen entscheiden.

Beispiel 1.33: Ist Quadrieren bijektiv?

Ist [latex]x \mapsto x^2[/latex] injektiv, surjektiv oder bijektiv? Diese Frage macht wie oben erklärt (noch) keinen Sinn, da weder Definitionsbereich noch Wertebereich festgelegt wurden und wir diese zur Beantwortung der Frage kennen müssen. Folgende Beobachtungen bestätigen, dass die Antwort zur Frage in der Tat von der Wahl des Definitionsbereichs und des Wertebereichs abhängt:

  1. Die Funktion [latex]f: \mathbb {R}_{\geq 0} \to \mathbb {R},\ x \mapsto x^2[/latex] ist injektiv, denn falls [latex]x,y[/latex] zwei nicht-negative Zahlen mit [latex]x y[/latex], dass [latex]x^2> y^2[/latex] ist. Sie ist jedoch nicht surjektiv: [latex]-1[/latex] ist nicht Element des Bildes von [latex]f[/latex], da Quadrate von reellen Zahlen niemals negativ sind.
  2. Die Funktion [latex]f: \mathbb {R} \to \mathbb {R}_{\geq 0},\ x \mapsto x^2[/latex] ist surjektiv (es existiert eine Wurzel), sie ist aber nicht injektiv, denn [latex]f(1) = 1 = (-1)^2 = f(-1)[/latex].
  3. Die Funktion [latex]f: \mathbb {R}_{\geq 0} \to \mathbb {R}_{\geq 0},\ x \mapsto x^2[/latex] ist bijektiv.

Wir werden diese Aussagen später noch ausführlicher beweisen.

Sei [latex]f: X \to Y[/latex] eine bijektive Funktion. Dann existiert zu jedem [latex]y \in Y[/latex] ein eindeutig bestimmtes [latex]x \in X[/latex], so dass [latex]y = f(x)[/latex]: Da [latex]f[/latex] surjektiv ist, existiert ein solches [latex]x[/latex] und da [latex]f[/latex] injektiv ist, kann es höchstens ein solches [latex]x[/latex] geben. Daher rührt auch die Bezeichnung «eineindeutige Abbildung» für eine Bijektion. Insbesondere kann man wie folgt eine Abbildung definieren.

Definition 1.34: Umkehrabbildung

Sei [latex]f: X \to Y[/latex] eine Bijektion. Die Umkehrabbildung (Inverse Abbildung oder auch kurz [latex]\pmb {f}[/latex] invers) [latex]f^{-1}: Y \to X[/latex] von [latex]f[/latex] ist die Abbildung, welche jedem [latex]y\in Y[/latex] das eindeutig bestimmte Element [latex]x \in X[/latex] mit [latex]y = f(x)[/latex] zuweist.

An dieser Stelle sollte man noch erwähnen, dass [latex]f^{-1}[/latex] nicht durch eine Formel gegeben sein muss, selbst wenn [latex]f[/latex] durch eine Formel definiert war. Des Weiteren wollen wir anmerken, dass sich allgemeiner für eine injektive Funktion [latex]f:X \to Y[/latex] eine Umkehrabbildung mit eingeschränktem Definitionsbereich [latex]f^{-1}: f(X) \to X[/latex] definieren lässt. In der Tat ist die Funktion [latex]x\in X \mapsto f(x)\in f(X)[/latex] (also «[latex]f[/latex] mit eingeschränktem Wertebereich» ) bijektiv.

Definition 1.35: Verknüpfung

Angenommen [latex]f:X \to Y[/latex] und [latex]g: Y \to Z[/latex] sind Funktionen. Dann ist die Verknüpfung [latex]g \circ f: X \to Z[/latex] (gesprochen [latex]g[/latex] nach [latex]f[/latex] oder [latex]g[/latex] Ring [latex]f[/latex]) für alle [latex]x \in X[/latex] durch [latex]g\circ f(x) = g(f(x))[/latex] definiert.

Wir bemerken, dass für eine bijektive Abbildung [latex]f:X \to Y[/latex] und ihre Umkehrabbildung [latex]f^{-1}:Y \to X[/latex] die Identitäten

[latex]
\begin{aligned}[]f \circ f^{-1} = \operatorname {id}_Y, \quad f^{-1} \circ f = \operatorname {id}_X\end{aligned}
[/latex]

erfüllt sind — eben per Konstruktion von [latex]f^{-1}[/latex] (siehe auch Übung 1.44).

Beispiel 1.36: Assoziativgesetz für Verknüpfungen

Seien [latex]f:X_1\to X_2[/latex], [latex]g:X_2 \to X_3[/latex], [latex]h:X_3 \to X_4[/latex] Funktionen. Dann können wir sowohl die Funktion [latex]h \circ (g \circ f): X_1 \to X_4[/latex] als auch die Funktion [latex](h \circ g) \circ f: X_1 \to X_4[/latex] betrachten. Glücklicherweise sind die Klammern irrelevant, denn es gilt

[latex]
\begin{aligned}[]h \circ (g \circ f)(x) = h(g \circ f(x)) = h(g(f(x)) = h \circ g(f(x)) = (h \circ g)\circ f(x)\end{aligned}
[/latex]

für alle [latex]x \in X_1[/latex]. Deswegen schreiben wir einfach [latex]h\circ g \circ f: X_1 \to X_4[/latex].

Beispiel 1.37: Verknüpfung ist nicht kommutativ

Für zwei Funktionen [latex]f:X \to Y[/latex] und [latex]g:Y \to Z[/latex] macht zwischen [latex]g \circ f[/latex] und [latex]f \circ g[/latex] im Allgemeinen nur [latex]g \circ f[/latex] Sinn, da [latex]f[/latex] nicht auf [latex]Z[/latex] definiert sein muss. Dies kann man sich mit einer Analogie aus der Informatik illustrieren. Seien zwei Programme [latex]P_1,P_2[/latex] gegeben, so dass [latex]P_1[/latex] eine Zahl als Input und einen Zeichenkette als Output hat und [latex]P_2[/latex] eine Zeichenkette als Input und eine Zeichenkette als Output hat. In diesem Fall kann man [latex]P_2[/latex] den Output von [latex]P_1[/latex] als Input übergeben; umgekehrt jedoch kann man [latex]P_1[/latex] den Output von [latex]P_2[/latex] nicht übergeben, da [latex]P_1[/latex] nur mit einer Zahl etwas anzufangen weiss.

Nimmt man nun an, dass [latex]X=Y= Z[/latex], so dass sowohl [latex]g \circ f[/latex] als auch [latex]f \circ g[/latex] Sinn machen und beide Abbildungen auf [latex]X[/latex] definiert sind, dann gilt die Gleichheit [latex]g \circ f = f \circ g[/latex] im Allgemeinen trotzdem nicht. Wir nennen ein geometrisches Beispiel. Seien [latex]X=Y=Z= \mathbb {R}^2[/latex], [latex]f[/latex] die Spiegelung um die [latex]y[/latex]-Achse und [latex]g[/latex] die Verschiebung (Translation) um [latex]1[/latex] in positiver Richtung entlang der [latex]x[/latex]-Achse. Der Ursprung [latex](0,0)[/latex] wird unter [latex]g \circ f[/latex] auf [latex](1,0)[/latex] abgebildet und unter [latex]f \circ g[/latex] auf [latex](-1,0)[/latex] abgebildet, also gilt [latex]g \circ f \neq f \circ g[/latex].

Eine Funktion, für die Wertebereich gleich dem Definitionsbereich ist, lässt sich auch mit sich selbst verknüpfen.

Definition 1.38: Iterationen einer Funktion

Sei [latex]f: X \to X[/latex] eine Funktion von einer Menge [latex]X[/latex] auf sich selbst. Wir definieren die Iterationen der Funktion [latex]f[/latex] durch

[latex]
\begin{aligned}[]f^{\, \circ \, {1} }= f: X \to X, \quad f^{\, \circ \, {2} }= f \circ f: X \to X, \quad f^{\, \circ \, {3} } = f \circ f \circ f: X \to X\end{aligned}
[/latex]

und rekursiv auch

[latex]
\begin{aligned}[]f^{\, \circ \, {(n+1)} } = f \circ f^{\, \circ \, {n} }: X \to X\end{aligned}
[/latex]

für alle natürlichen Zahlen [latex]n \in \mathbb {N}[/latex]. Wir sprechen [latex]f^{\, \circ \, {n} }[/latex] auch als «[latex]f[/latex] hoch [latex]n[/latex]» aus und setzen des Weiteren [latex]f^{\, \circ \, {0} } = \operatorname {id}_X[/latex].

Wir bemerken, dass man die Iteration einer Funktion [latex]f:X\to X[/latex] oft einfach auch durch [latex]f^n=f^{\, \circ \, {n} }[/latex] bezeichnet.[8]

Übung 1.39: Beispiele und eine Eigenschaft von Iterationen

  1. Sei [latex]X= \left \lbrace {a,b,c} \right \rbrace[/latex] eine Menge mit [latex]3[/latex] verschiedenen Elementen und [latex]f: X \to X[/latex] die Funktion definiert durch [latex]f(a) = b,\ f(b) = c[/latex] und [latex]f(c) = a[/latex]. Zeigen Sie, dass [latex]f[/latex] bijektiv ist. Beschreiben Sie die Umkehrabbildung und alle Iterationen von [latex]f[/latex] explizit.
  2. Iterieren Sie die Funktion [latex]g:x \in \mathbb {R} \to 3x \in \mathbb {R}[/latex] und beschreiben Sie intuitiv, wie sich [latex]f^{\, \circ \, {n} }(x)[/latex] für ein [latex]x \in \mathbb {R}[/latex] und verschiedene [latex]n\in \mathbb {N}[/latex] verhält.
  3. Iterieren Sie die Funktion [latex]g:x \in \mathbb {R} \to x^2 \in \mathbb {R}[/latex] und beschreiben Sie intuitiv, wie sich [latex]f^{\, \circ \, {n} }(x)[/latex] für ein [latex]x \in \mathbb {R}[/latex] und verschiedene [latex]n\in \mathbb {N}[/latex] verhält.
  4. Sei [latex]X[/latex] eine Menge und [latex]f:X \to X[/latex] eine Transformation auf [latex]X[/latex]. Zeigen Sie, dass für alle [latex]m,n\in \mathbb {N}_0[/latex] gilt [latex]f^{\, \circ \, {m} } \circ f^{\, \circ \, {n} } = f^{\, \circ \, {(m+n)} }[/latex].

Eine Teillösung

Wir erklären hier die Lösung zum letzten Teil. Falls [latex]m = 0[/latex] oder [latex]n = 0[/latex] gilt, gibt es nichts zu zeigen, da [latex]f^{\, \circ \, {0} } = \operatorname {id}_X[/latex] definiert wurde. Wir verwenden zuerst das Assoziativgesetz in Beispiel 1.36 und die Definition der Iteration um
[latex]
\begin{aligned}[]\label{eqformeliteration} f^{\, \circ \, {(m+1)} }=f\circ f^{\, \circ \, {m} }=f^{\, \circ \, {m} }\circ f\end{aligned}
[/latex]
zu zeigen. Die erste Gleichung ist bloss unsere Definition der Iteration. Die zweite Gleichung wollen wir mittels vollständiger Induktion beweisen und gilt für [latex]m=1[/latex], was den Induktionsanfang darstellt. Falls nun () bereits für ein [latex]m\in \mathbb {N}[/latex] gilt, so erhalten wir gemeinsam mit der Definition

[latex]
\begin{aligned}[]f^{\, \circ \, {(m+2)} }=f\circ f^{\, \circ \, {(m+1)} }=f\circ f^{\, \circ \, {m} }\circ f=f^{\, \circ \, {(m+1)} }\circ f.\end{aligned}
[/latex]

Dies beweist () für alle [latex]m\in \mathbb {N}[/latex] mittels vollständiger Induktion.

Wir behaupten nun
[latex]
\begin{aligned}[]\label{eqformeliteration2} f^{\, \circ \, {(m+n)} }=f^{\, \circ \, {m} }\circ f^{\, \circ \, {n} }\end{aligned}
[/latex]
für alle [latex]m,n\in \mathbb {N}[/latex] und wollen wiederum vollständige Induktion verwenden. Genauer formuliert, wollen wir vollständige Induktion nach [latex]n[/latex] für die Aussage

[latex]
\begin{aligned}[]\forall m\in \mathbb {N}:f^{\, \circ \, {(m+n)} }=f^{\, \circ \, {m} }\circ f^{\, \circ \, {n} }.\end{aligned}
[/latex]

verwenden.

Nach () gilt () für alle [latex]m\in \mathbb {N}[/latex] und [latex]n=1[/latex], was den Induktionsanfang darstellt. Angenommen () gilt bereits für alle [latex]m\in \mathbb {N}[/latex] und ein [latex]n\in \mathbb {N}[/latex]. Dann erhalten wir

[latex]
\begin{aligned}[]f^{\, \circ \, {(m+n+1)} }=f^{\, \circ \, {(m+1)} }\circ f^{\, \circ \, {n} }=f^{\, \circ \, {m} }\circ f\circ f^{\, \circ \, {n} }=f^{\, \circ \, {m} }\circ f^{\, \circ \, {(n+1)} }\end{aligned}
[/latex]

für alle [latex]m\in \mathbb {N}[/latex], womit der Induktionsschritt und damit auch () für alle [latex]m,n\in \mathbb {N}[/latex] bewiesen ist.

Für eine Abbildung [latex]f:X \to X[/latex] auf einer endlichen Menge [latex]X[/latex] sind Injektivität und Surjektivität äquivalent (siehe auch Abschnitt 1.4.4). Für unendliche Mengen ergeben sich jedoch weitere Möglichkeiten, die auf den ersten Blick ungewöhnlich erscheinen könnten.

Beispiel 1.40: Hilbert–Hotel

Die Abbildung

[latex]
\begin{aligned}[]f: n \in \mathbb {N} \mapsto n+1 \in \mathbb {N}\end{aligned}
[/latex]

ist zwar injektiv aber nicht surjektiv, denn [latex]1 \not \in f(\mathbb {N})[/latex]. Dies kann man sich zur Veranschaulichung wie folgt vorstellen: Angenommen ein Hotel (das sogenannte Hilbert Hotel) ist voll belegt und hat für jede natürliche Zahl [latex]n[/latex] ein Hotelzimmer mit der Türnummer [latex]n[/latex] (entlang eines wirklich sehr langen Ganges der Reihe nach nummeriert). Dann kann man trotzdem noch einen Gast unterbringen. Dazu muss die Rezeption bloss dem Gast im ersten Zimmer einen Brief mit folgender Botschaft aushändigen:

«Wir bedauern, Ihnen mitzuteilen, dass wir Ihnen ein neues Zimmer zuweisen müssen. Bitte übergeben Sie diesen Brief dem Gast im nächsten Zimmer und übernehmen Sie dieses Zimmer, sobald es frei ist.»

Daraufhin wird das erste Zimmer frei sein, wo dann der neue Gast untergebracht werden kann. Ebenso bekommen alle alten Gäste jeweils ein neues Zimmer.

Genauso gibt es auch surjektive Abbildungen [latex]\mathbb {N} \to \mathbb {N}[/latex], die nicht injektiv sind, zum Beispiel

[latex]
\begin{aligned}[]g: \mathbb {N} \to \mathbb {N},\ n \mapsto \left \lbrace \begin{array}{ll} 1 & \text {falls } n =1 \\ n-1 & \text {falls } n \neq 1\end{array}\right . .\end{aligned}
[/latex]

Das Gedankenspiel von Hilberts Hotel lässt sich durchaus erweiteren. Wir verweisen dazu auf die nächste Übung und diesen Kurzfilm, der folgende Übung auflöst und erweitert.

Übung 1.41: Hilberts Bus

Wir setzen das Gedankenspiel von Hilberts Hotel fort: Stellen Sie sich vor, dass ein sehr langer, voll besetzter Bus mit Gästen vor Hilberts vollem Hotel auffährt, der für jede natürliche Zahl einen entsprechend nummerierten Sitzplatz aufweist. Wie können Sie die neuen Gäste alle im Hotel unterbringen? Welche Abbildung [latex]h:\mathbb {N} \to \mathbb {N}[/latex] können Sie verwenden, um im Hotel Platz zu beschaffen?

Sowohl die Eigenschaften in Definition 1.31 als auch die Verknüpfung in Definition 1.35 sind so grundlegend, dass wir nicht umhin kommen, einige fundamentale Tatsachen zu beweisen:

Lemma 1.42: Eigenschaften von Verknüpfungen

Seien [latex]f:X \to Y[/latex] und [latex]g: Y \to Z[/latex] Funktionen.

  1. Falls [latex]f[/latex] und [latex]g[/latex] injektiv sind, dann ist auch [latex]g \circ f[/latex] injektiv.
  2. Falls [latex]f[/latex] und [latex]g[/latex] surjektiv sind, dann ist auch [latex]g \circ f[/latex] surjektiv.
  3. Falls [latex]f[/latex] und [latex]g[/latex] bijektiv sind, dann ist auch [latex]g \circ f[/latex] bijektiv und es gilt [latex](g \circ f)^{-1} = f^{-1} \circ g^{-1}[/latex].
Beweis

(i): Angenommen [latex]f[/latex] und [latex]g[/latex] sind injektiv und [latex]g\circ f(x_1) = g \circ f(x_2)[/latex] für zwei Elemente [latex]x_1,x_2 \in X[/latex]. Wegen [latex]g\circ f(x_1) = g(f(x_1))[/latex] und [latex]g\circ f(x_2) = g(f(x_2))[/latex] muss [latex]f(x_1) = f(x_2)[/latex] gelten, da [latex]g[/latex] injektiv ist. Da [latex]f[/latex] injektiv ist, gilt [latex]x_1 = x_2[/latex]. Dies zeigt, dass [latex]g \circ f[/latex] injektiv ist.

(ii): Angenommen [latex]f[/latex] und [latex]g[/latex] sind surjektiv und [latex]z \in Z[/latex] ist ein beliebiges Element. Da [latex]g[/latex] surjektiv ist, können wir ein [latex]y \in Y[/latex] mit [latex]g(y) = z[/latex] wählen. Da auch [latex]f[/latex] surjektiv ist, gibt es ein [latex]x \in X[/latex] mit [latex]f(x) = y[/latex] und damit [latex]g\circ f(x) = g(f(x)) = g(y) = z[/latex]. Also existiert für jedes Element [latex]z \in Z[/latex] ein Element [latex]x \in X[/latex] mit [latex]g \circ f(x) = z[/latex] und daher ist [latex]g \circ f[/latex] surjektiv.

(iii): Angenommen [latex]f[/latex] und [latex]g[/latex] sind bijektiv. Der erste Teil von (iii) folgt direkt, denn nach (i) ist [latex]g \circ f[/latex] injektiv und nach (ii) surjektiv. Wir verifizieren nun die behauptete Formel. Sei [latex]z \in Z[/latex]. Wir müssen zeigen, dass [latex]f^{-1}(g^{-1}(z))[/latex] ein Punkt (und damit der Punkt) ist, der unter [latex]g \circ f[/latex] auf [latex]z[/latex] abgebildet wird. Tatsächlich gilt wegen [latex]f(f^{-1}(y))=y[/latex] für alle [latex]y \in Y[/latex] und [latex]g(g^{-1}(z)) = z[/latex] für alle [latex]z \in Z[/latex] auch

[latex]
\begin{aligned}[]g\circ f(f^{-1}(g^{-1}(z)) = g(f(f^{-1}(g^{-1}(z)))) = g(g^{-1}(z)) = z\end{aligned}
[/latex]

und (iii) ist bewiesen. ∎

In der folgenden Übung kombinieren wir die Begriffe aus den Definitionen 1.31 und 1.35 ein weiteres Mal:

Wichtige Übung 1.43: Weitere Eigenschaften von Verknüpfungen

Seien [latex]f: X \to Y[/latex] und [latex]g: Y \to Z[/latex] Funktionen.

  1. Zeigen Sie, dass [latex]g[/latex] surjektiv ist, falls [latex]g \circ f[/latex] surjektiv ist. Überzeugen Sie sich davon, dass in diesem Fall [latex]f[/latex] nicht unbedingt surjektiv sein muss.
  2. Zeigen Sie, dass [latex]f[/latex] surjektiv ist, falls [latex]g \circ f[/latex] surjektiv und [latex]g[/latex] injektiv ist.
  3. Zeigen Sie, dass [latex]f[/latex] injektiv ist, falls [latex]g \circ f[/latex] injektiv ist. Überzeugen Sie sich davon, dass in diesem Fall [latex]g[/latex] nicht unbedingt injektiv sein muss.
  4. Zeigen Sie, dass [latex]g[/latex] injektiv ist, falls [latex]g \circ f[/latex] injektiv ist und [latex]f[/latex] surjektiv ist.

Teillösung

Angenommen [latex]g\circ f[/latex] ist surjektiv. Dann existiert für jedes [latex]z\in Z[/latex] ein [latex]x\in X[/latex] mit [latex]g\circ f(x)=z[/latex], womit auch [latex]g(y)=z[/latex] für [latex]y=f(x)\in Y[/latex] gilt. Dies beweist die allgemeine Behauptung in (i). Falls nun zusätzlich [latex]g[/latex] injektiv ist wie in (ii), so ist [latex]g[/latex] bijektiv und Lemma 1.42 (ii) zeigt, dass [latex]f=g^{-1}\circ (g\circ f)[/latex] surjektiv ist. Dies ist auch ein Hinweis darauf, wie das gesuchte Beispiel in (i) aussehen sollte.

Wichtige Übung 1.44: Bijektivität und Existenz einer Umkehrabbildung

Sei [latex]f: X \to Y[/latex] eine Funktion. Wenn [latex]f[/latex] bijektiv ist, dann gelten [latex]f^{-1}\circ f = \operatorname {id}_X[/latex] und [latex]f \circ f^{-1}= \operatorname {id}_Y[/latex], wie schon bemerkt wurde. Wir zeigen hier die «Umkehrung» : Angenommen es existiert eine Funktion [latex]g: Y \to X[/latex], so dass [latex]g \circ f = \operatorname {id}_X[/latex] und [latex]f \circ g = \operatorname {id}_Y[/latex]. Zeigen Sie unter Verwendung der letzten Übung, dass [latex]f[/latex] bijektiv ist und dass [latex]g = f^{-1}[/latex] gilt. Des Weiteren, überprüfen Sie, dass [latex]f^{-1}: Y \to X[/latex] ebenfalls bijektiv ist. Was ist die Umkehrabbildung von [latex]f^{-1}[/latex]?

Lösung

Wir nehmen an, dass [latex]f:X\to Y[/latex] und [latex]g: Y \to X[/latex] sowohl [latex]g \circ f = \operatorname {id}_X[/latex] als auch [latex]f \circ g = \operatorname {id}_Y[/latex] erfüllen. Nach Übung 1.43 folgt, dass [latex]f[/latex] daher bijektiv ist. Des Weiteren gilt für [latex]y\in Y[/latex] und [latex]x=g(y)\in X[/latex], dass [latex]f(x)=f\circ g(y)=y[/latex] und daher auch [latex]x=f^{-1}(y)[/latex]. Da dies für alle [latex]y\in Y[/latex] gilt, erhalten wir [latex]g=f^{-1}[/latex]. Vertauschen wir die Rollen von [latex]f[/latex] und [latex]g[/latex], so erhalten wir, dass [latex]g[/latex] bijektiv ist und [latex]f=g^{-1}=\bigl (f^{-1}\bigr )^{-1}[/latex]

Folgende Definition ist auch für nicht bijektive Funktionen nützlich:

Definition 1.45: Urbilder einer Funktion

Für eine Funktion [latex]f: X \to Y[/latex] und eine Teilmenge [latex]B \subseteq Y[/latex] definieren wir das Urbild [latex]f^{-1}(B)[/latex] von [latex]B[/latex] unter [latex]f[/latex] als

[latex]
\begin{aligned}[]f^{-1}(B) = \left \lbrace {x \in X} \mid {f(x) \in B}\right \rbrace .\end{aligned}
[/latex]

Beispielsweise gilt für eine Funktion [latex]f:X \to Y[/latex], dass [latex]f^{-1}(\left \lbrace { } \right \rbrace ) = \left \lbrace { } \right \rbrace[/latex] und [latex]f^{-1}(Y) = X[/latex]. In der nächsten Übung prüfen wir einige Eigenschaften der Definition des Urbilds.

Wichtige Übung 1.46: Verhalten von Bildern und Urbildern unter Mengenoperationen

Gegeben sei eine Funktion [latex]f: X \to Y[/latex] und Teilmengen [latex]A,A' \subseteq X[/latex] und [latex]B,B' \subseteq Y[/latex].

  1. Zeigen Sie, dass [latex]f(f^{-1}(B)) \subseteq B[/latex] gilt. Unter welcher Bedingung an [latex]f[/latex] gilt auf jeden Fall Gleichheit?
  2. Zeigen Sie, dass [latex]f^{-1}(f(A)) \supseteq A[/latex] gilt. Unter welcher Bedingung an [latex]f[/latex] gilt auf jeden Fall Gleichheit?
  3. Zeigen Sie die Gleichungen
    [latex]
    \begin{aligned}[]f(A \cup A') = f(A) \cup f(A'), \quad f^{-1}(B \cup B') = f^{-1}(B) \cup f^{-1}(B').\end{aligned}
    [/latex]
  4. Zeigen Sie, dass [latex]f(A \cap A') \subseteq f(A) \cap f(A')[/latex] und dass Gleichheit gilt, wenn [latex]f[/latex] injektiv ist. Verifzieren Sie, dass in diesem Fall auch [latex]f(A \setminus A') = f(A) \setminus f(A')[/latex] gilt.
  5. Zeigen Sie, dass [latex]f^{-1}(B \cap B') = f^{-1}(B) \cap f^{-1}(B')[/latex] und [latex]f^{-1}(Y \setminus B) = X \setminus f^{-1}(B)[/latex] gelten.
  6. Verallgemeinern Sie die Regeln [latex]f^{-1}(B \cup B') = f^{-1}(B) \cup f^{-1}(B')[/latex] und [latex]f^{-1}(B \cap B') = f^{-1}(B) \cap f^{-1}(B')[/latex] für beliebige Vereinigungen resp. Schnitte.

Zusammenfassend sollten Sie sich merken, dass die Urbildoperation mit allen von uns besprochenen mengentheoretischen Operationen (unter anderem Vereinigung, Durchschnitt und Komplement) verträglich ist, während dies die Bildoperation nur für die Vereinigung oder unter gewissen Bedingungen erfüllt.

Teillösung

Wir beweisen Teil (iv). Sei [latex]f:X\to Y[/latex] eine Funktion, [latex]A,A'\subseteq X[/latex] Teilmengen des Definitionsbereichs und [latex]a\in A\cap A'[/latex], dann gilt [latex]f(a)\in f(A)\cap f(A')[/latex]. Dies beweist bereits [latex]f(A\cap A')\subseteq f(A)\cap f(A')[/latex]. Wir nehmen nun zusätzlich an, dass [latex]f[/latex] injektiv ist. Angenommen [latex]y=f(a)=f(a')\in f(A)\cap f(A')[/latex] für ein [latex]a\in A[/latex] und [latex]a'\in A'[/latex]. Da [latex]f[/latex] injektiv ist, impliziert dies [latex]a=a'\in A\cap A'[/latex] und damit [latex]y\in f(A\cap A')[/latex]. Wir erhalten daher [latex]f(A\cap A')=f(A)\cap f(A')[/latex].

Wir nehmen weiterhin an, dass [latex]f[/latex] injektiv ist. Für [latex]a\in A\setminus A'[/latex] gilt dann [latex]f(a)\in f(A)\setminus f(A')[/latex]. In der Tat, da [latex]f[/latex] injektiv ist, folgt aus [latex]f(a)=f(x)[/latex] für ein [latex]x\in X[/latex] die Gleichheit [latex]x=a[/latex]. Da [latex]a\notin A'[/latex] erhalten wir daraus [latex]f(a)\notin f(A')[/latex]. Falls umgekehrt [latex]y\in f(A)\setminus f(A')[/latex], dann existiert ein [latex]a\in A[/latex] mit [latex]y=f(a)[/latex] und es muss des Weiteren [latex]a\notin A'[/latex] gelten, was [latex]y\in f(A\setminus A')[/latex] impliziert.

Mit Hilfe des folgenden Begriffs lässt sich der Funktionsbegriff, der oben in Worten eingeführt wurde, formalisieren:

Definition 1.47: Graph einer Funktion

Sei [latex]f:X \to Y[/latex] eine Funktion. Der Graph von [latex]f[/latex] ist

[latex]
\begin{aligned}[]\operatorname {graph}(f) = \left \lbrace {(x,y) \in X \times Y} \mid {y = f(x)}\right \rbrace \subseteq X \times Y.\end{aligned}
[/latex]

Der Graph einer Funktion enthält viel Information über die Funktion selbst. Unter anderem lässt sich aus dem Graphen bereits erkennen, ob die Funktion wohldefiniert ist (das heisst in der Tat eine Funktion ist) oder nicht. Beispielsweise kann folgende Teilmenge von [latex]X \times Y[/latex] nicht der Graph einer Funktion von [latex]X[/latex] nach [latex]Y[/latex] sein:

image

Abbildung 1.7 – Die hier dargestellte Teilmenge von [latex]X \times Y[/latex] ist nicht der Graph einer Funktion von [latex]X[/latex] nach [latex]Y[/latex]. Denn man müsste dem grün markierten Punkt [latex]x_1[/latex] in [latex]X[/latex] vier verschiedene Punkte in [latex]Y[/latex] zuweisen, was der Definition einer Funktion widerspricht. Genauso problematisch ist der Punkt [latex]x_2 \in X[/latex], dem gar kein Punkt zugewiesen wird. Standardmässig nimmt man bei der Darstellung des Graphen einer Funktion den Definitionbereich als die Horizontale und den Wertebereich als die Vertikale.

Welche Teilmengen von [latex]X \times Y[/latex] Graphen einer Funktion sein können und welche nicht, wollen wir im Folgenden erklären. Wir beginnen damit, das in Figur 1.7 aufgetauchte Problem formal zu interpretieren:

Übung 1.48: Graphen und Projektion auf den Definitionsbereich

  1. Sei [latex]f: X \to Y[/latex] eine Funktion. Wie in Beispiel 1.30 bezeichnen wir mit [latex]\pi _1: X\times Y \to X[/latex] die Projektion auf [latex]X[/latex], die durch [latex](x,y) \mapsto x[/latex] definiert ist und mit [latex]\pi _2: X \times Y \to Y[/latex] die Projektion auf [latex]Y[/latex]. Zeigen Sie, dass [latex]\pi _1|_{\operatorname {graph}(f)}: \operatorname {graph}(f) \to X[/latex] bijektiv ist und finden Sie die Umkehrabbildung. Beweisen Sie des Weiteren die Identität
    [latex]
    \begin{aligned}[]\pi _2 \circ (\pi _1|_{\operatorname {graph}(f)})^{-1} = f,\end{aligned}
    [/latex]

    welche erklärt, wie man aus dem Graphen einer Funktion, die Funktion zurückerhalten kann.

  2. Zeigen Sie, dass eine Teilmenge [latex]\Gamma \subseteq X\times Y[/latex] genau dann ein Graph einer Funktion [latex]f:X\to Y[/latex] ist, wenn [latex]\pi _1|_\Gamma : \Gamma \to X[/latex] bijektiv ist. Verifizieren Sie auch, dass in diesem Fall [latex]f[/latex] eindeutig bestimmt ist.

Hinweis.

Die Aussagen sind im Wesentlichen eine Umformulierung der Definition einer Funktion.

Auch die Eigenschaften aus Definition 1.31 lassen sich im Graphen erkennen. Unter anderem ist ersichtlich, ob eine Funktion injektiv ist oder nicht:

image

Abbildung 1.8 – Dies ist der Graph einer nicht injektiven Funktion. Der grün markierte Punkt [latex]y[/latex] in [latex]Y[/latex] wird unter der Funktion von vier verschiedenen Elementen in [latex]X[/latex] angenommen.

image

Abbildung 1.9 – Dies ist der Graph einer injektiven Funktion. Der grün markierte Punkt [latex]y \in Y[/latex] ist das Bild von nur einem Punkt in [latex]X[/latex]. Dies ist immer noch der Fall, wenn [latex]y[/latex] verschoben wird (bis auf die Tatsache, dass [latex]y[/latex] dann vielleicht gar nicht mehr im Bild liegt). In anderen Worten: jede horizontale Linie schneidet den Graphen in höchstens einem Punkt.

Genauso lässt sich beurteilen, ob eine Funktion surjektiv ist oder nicht – siehe Figuren 1.10 und . Wir formalisieren dies in Übung 1.50.

image

Abbildung 1.10 – Dies ist der Graph einer nicht-surjektiven Funktion. Der grün markierte Punkt [latex]y[/latex] in [latex]Y[/latex] wird unter der Funktion von keinem Element in [latex]X[/latex] angenommen.

image

Applet 1.49: Einschränkungen einer Funktion

Wir betrachten eine Funktion [latex]f:I\to \mathbb {R}[/latex], die auf einem Intervall [latex]I[/latex] in [latex]\mathbb {R}[/latex] definiert ist. Durch Einschränken der Funktion auf Teilintervalle [latex][a,b]\subseteq I[/latex] des Definitionsbereichs oder durch Einschränken des Wertebereichs auf ein Intervall [latex][c,d]\subseteq \mathbb {R}[/latex] können wir mitunter Injektivität, Surjektivität, oder auch Bijektivität der neuen Funktion erreichen.

Wichtige Übung 1.50: Eigenschaften des Graphen unter Projektion auf den Wertebereich

Sei [latex]f: X \to Y[/latex] eine Funktion.

  • Zeigen Sie, dass [latex]f[/latex] injektiv ist genau dann, wenn [latex]\pi _2|_{\operatorname {graph}(f)}[/latex] injektiv ist.
  • Zeigen Sie, dass [latex]f[/latex] surjektiv ist genau dann, wenn [latex]\pi _2|_{\operatorname {graph}(f)}[/latex] surjektiv ist. Intuitiv bedeutet letzteres, dass die Projektion des Graphen [latex]\operatorname {graph}(f)[/latex] auf [latex]Y[/latex] jedes Element erreicht.
  • Angenommen [latex]f[/latex] ist bijektiv. Wie findet man den Graphen von [latex]f^{-1}[/latex]?

Hinweis.

Die Aufgabe lässt sich entweder direkt oder unter Verwendung von Übung 1.48(i) lösen.

Sei [latex]f: X \to Y[/latex] eine Funktion. Wir verwenden manchmal auch die Notation [latex]\left \lbrace {f(x)} \mid {x \in X}\right \rbrace[/latex] für die Bildmenge [latex]f(X)[/latex]. Allgemeiner schreiben wir auch

[latex]
\begin{aligned}[]\left \lbrace {f(x)} \mid {x\in X \wedge A(x)}\right \rbrace = \left \lbrace {y} \mid {y \in Y\wedge \exists x \in X: \bigl (f(x) = y \wedge A(x)\bigr )}\right \rbrace ,\end{aligned}
[/latex]

wobei [latex]A(x)[/latex] irgend eine Aussage über Elemente [latex]x[/latex] von [latex]X[/latex] ist. In dieser Gleichung haben wir rechts genau nach dem Schema in der dritten Annahme an die Mengenlehre (siehe Abschnitt 1.4.1) eine Menge definiert und verwenden dies, um den kürzeren Ausdruck links zu definieren.

Applet 1.51: Bilder und Urbilder

Wir betrachten eine Funktion [latex]f:I\to \mathbb {R}[/latex], die auf einem Intervall [latex]I[/latex] in [latex]\mathbb {R}[/latex] definiert ist. Je nach Einstellung des Applets wird entweder das Bild [latex]f(A)[/latex] eines Teilintervalls [latex]A=[x_1,x_2]\subseteq I[/latex] oder das Urbild [latex]f^{-1}([y_1,y_2])[/latex] eines Intervalls [latex][y_1,y_2]\subseteq \mathbb {R}[/latex] dargestellt.

Gewisse Objekte bezeichnet man als kanonisch oder natürlich, wenn sie unabhängig von jeglicher Wahl sind. Dieser Begriff drängt sich insbesondere in der Linearen Algebra auf. Wir möchten dies an einem Beispiel erläutern.

Beispiel 1.52: Kanonische Abbildungen

Sei [latex]X[/latex] eine Menge und [latex]A \subseteq X[/latex] eine Teilmenge. Wir betrachten injektive Abbildungen [latex]A \to X[/latex] und versuchen darunter eine kanonische auszumachen. Da [latex]A \subseteq X[/latex] eine Teilmenge ist, ist die injektive Abbildung [latex]A \to X[/latex], die man am schnellsten hinschreiben kann, die Inklusionsabbildung

[latex]
\begin{aligned}[]\iota : A\to X,\ x \mapsto x\end{aligned}
[/latex]

am natürlichsten. Denn wir mussten dazu weder spezifische Elemente von [latex]A[/latex] noch von [latex]X[/latex] wählen. Es gibt nun aber ganz viele andere injektive Abbildungen von [latex]A[/latex] nach [latex]X[/latex]. Diese involvieren jedoch alle eine (recht zufällige) Regel.

Wir untersuchen das konkrete Beispiel [latex]A = \left \lbrace {a} \right \rbrace[/latex] und [latex]X = \left \lbrace {a,b,c} \right \rbrace[/latex]. Dann gibt es [latex]3[/latex] verschiedene injektive Abbildungen [latex]A \to X[/latex]. Nebst der Inklusionsabbildung (die [latex]a[/latex] auf [latex]a[/latex] abbildet) sind dies

  • die Funktion [latex]A \to X[/latex] mit [latex]a \mapsto b[/latex] und
  • die Funktion [latex]A \to X[/latex] mit [latex]a \mapsto c[/latex].

Für diese beiden Abbildungen mussten wir jedoch die Menge [latex]X[/latex] kennen und spezifische Elemente von [latex]X[/latex] (das wären [latex]b,c[/latex]) auswählen, was bei der Inklusionsabbildung nicht der Fall war. In diesem Sinne ist die Inklusionsabbildung unter den injektiven Abbildungen [latex]A \to X[/latex] die natürliche, die kanonische.

Ein weiteres interessanteres Beispiel bilden die in Beispiel 1.30 definierten kanonischen Projektionen [latex]\pi _1: X_1\times X_2 \to X_1[/latex] und [latex]\pi _2: X_1 \times X_2 \to X_2[/latex] für zwei Mengen [latex]X_1,X_2[/latex].

Für zwei Mengen [latex]X,Y[/latex] wird die Menge aller Abbildungen von [latex]X[/latex] nach [latex]Y[/latex] als [latex]Y^X[/latex] geschrieben, formaler

[latex]
\begin{aligned}[]Y^X = \left \lbrace {f} \mid {f:X \to Y \text { ist eine Funktion}}\right \rbrace .\end{aligned}
[/latex]

Grund für die Notation ist unter anderem die folgende Behauptung, die man mittels Induktion beweisen kann: Falls [latex]X[/latex] und [latex]Y[/latex] endliche Mengen sind mit [latex]m[/latex] resp. [latex]n[/latex] Elementen für zwei natürliche Zahlen [latex]m,n\in \mathbb {N}[/latex], so hat [latex]Y^X[/latex] genau [latex]n^m[/latex] Elemente.

1.4.3 – Relationen

Definition 1.53: Relationen

Seien [latex]X[/latex] und [latex]Y[/latex] Mengen. Eine Relation auf [latex]X \times Y[/latex] ist eine Teilmenge [latex]\mathcal {R} \subseteq X \times Y[/latex]. Wir schreiben auch [latex]x \mathcal {R} y[/latex] falls [latex](x,y) \in \mathcal {R}[/latex] und verwenden oft Symbole wie [latex]

Übung 1.54: Eine bekannte Relation

In einem gewissen Sinne haben wir schon Relationen betrachtet. Seien [latex]X,Y[/latex] Mengen und sei [latex]\mathcal {G}[/latex] eine Relation auf [latex]X\times Y[/latex], die die folgende Eigenschaft erfüllt:

[latex]
\begin{aligned}[]\forall x\in X\ \exists ! y \in Y: x \mathcal {G} y\end{aligned}
[/latex]

Wie nennen wir eine solche Relation gemeinsam mit [latex]X[/latex] und [latex]Y[/latex]?

Wir werden noch weitere Beispiele von Relationen sehen, doch beschreibt die folgende Definition eine wichtige Klasse von Relationen:

Definition 1.55: Äquivalenzrelationen

Eine Relation [latex]\sim[/latex] auf [latex]X[/latex] ist eine Äquivalenzrelation, falls folgende drei Eigenschaften erfüllt sind:

  • Reflexivität: [latex]\forall x \in X: x \sim x[/latex].
  • Symmetrie: [latex]\forall x,y \in X: x \sim y \implies y \sim x[/latex].
  • Transitivität: [latex]\forall x,y,z \in X:((x \sim y) \wedge (y \sim z)) \implies x \sim z[/latex].

Äquivalenzrelationen sind oft durch eine Gleichheit in gewissen Aspekten definiert und sollten als eine Form von einer Gleichheit angesehen werden. In der Tat bezieht sich der Ausdruck «das Gleiche» in der deutschen Sprache auf eine Art «Äquivalenzrelation» (die je nach Zusammenhang verschieden sein kann), wohingegen der Ausdruck «dasselbe» nur für «ein und dasselbe» Objekt verwendet werden sollte.

Beispiel 1.56: Beispiele von Äquivalenzrelationen

  1. Das einfachste Beispiel einer Äquivalenzrelation auf einer beliebigen Menge [latex]X[/latex] ist die Gleichheit, also die Relation [latex]\mathcal {R} = \left \lbrace {(x,y) \in X^2} \mid {x=y}\right \rbrace[/latex].
  2. Ein weiteres allgemeines Beispiel ist die sogenannte triviale Relation [latex]\mathcal {R} = X^2[/latex], bezüglich der je zwei Elemente in [latex]X[/latex] äquivalent sind.
  3. Wir betrachten ein Beispiel in der ebenen (euklidschen) Geometrie. Sei [latex]X[/latex] die Menge der Geraden in der Ebene. Zu zwei Geraden [latex]G_1,G_2[/latex] schreiben wir
    [latex]
    \begin{aligned}[]G_1 \sim G_2 \iff G_1 \text { und } G_2 \text { sind parallel}.\end{aligned}
    [/latex]

    Dies definiert eine Äquivalenzrelation auf [latex]X[/latex] (wieso?).

  4. Äquivalenzrelationen werden in anderen Wissenschaften oder auch im Alltag häufig verwendet. Beispielsweise kann man auf der Menge aller Lebewesen eine Äquivalenzrelation definieren, in dem man zwei Lebewesen für äquivalent erklärt, wenn sie zur selben Art (oder Gattung oder Familie) gehören.

Übung 1.57: Zwei weitere Beispiele

In dieser Übungen möchten wir weitere, allgemeine Beispiele von Äquivalenzrelationen besprechen. Sei [latex]X[/latex] eine Menge.

  1. (Zerquetschen einer Teilmenge) Sei [latex]A \subseteq X[/latex] eine Teilmenge. Zeigen Sie, dass die Relation gegeben durch
    [latex]
    \begin{aligned}[]x \sim _A y :\iff (x,y \in A) \vee (x = y)\end{aligned}
    [/latex]

    für [latex]x,y \in X[/latex] eine Äquivalenzrelation auf [latex]X[/latex] definiert.

  2. (Äquivalenz über eine Abbildung) Sei [latex]f: X \to Y[/latex] eine Abbildung in eine weitere Menge [latex]Y[/latex]. Wir definieren eine Relation auf [latex]X[/latex] durch
    [latex]
    \begin{aligned}[]x_1 \sim _f x_2 :\iff f(x_1) = f(x_2)\end{aligned}
    [/latex]

    für alle [latex]x_1,x_2 \in X[/latex]. Zeigen Sie, dass [latex]\sim[/latex] eine Äquivalenzrelation auf [latex]X[/latex] definiert.

Übung 1.58: Ein falscher Beweis

In dieser Aufgabe behaupten wir fälschlicherweise, dass jede symmetrische und transitive Relation [latex]\sim[/latex] auf einer Menge [latex]X[/latex] auch reflexiv ist (d.h. eine Äquivalenzrelation ist). Finden Sie den Fehler in folgendem «Beweis» :

Sei [latex]x \in X[/latex] ein Element. Sei [latex]y \in X[/latex], so dass [latex]x \sim y[/latex]. Wegen Symmetrie der Relation gilt also auch [latex]y \sim x[/latex]. Folglich gilt unter Verwendung der Transitivität der Relation [latex](x \sim y) \wedge (y \sim x) \implies x \sim x[/latex], was zu zeigen war.

Finden Sie ein Beispiel einer Relation, die symmetrisch und transitiv, aber nicht reflexiv ist.

Hinweis.

Die Aussage ist auf jeden Fall falsch für die «leere Relation» , welche [latex]x_1\not \sim x_2[/latex] für alle [latex]x_1,x_2\in X[/latex] erfüllt.

Übung 1.59: Beispiele allgemeiner Relationen

Finden Sie eine Relation auf den natürlichen Zahlen [latex]\mathbb {N}[/latex], die von den Eigenschaften einer Äquivalenzrelation

  • nur die Symmetrie,
  • nur die Transitivität,
  • die Reflexivität und die Transitivität, aber nicht die Symmetrie

erfüllt.

Hinweis.

Bestimmen Sie die Eigenschaften der Relationen [latex]

Wie schon erwähnt ist eine Äquivalenzrelation gewissermassen eine Form von Gleichheit. Dies lässt sich auch formalisieren:

Definition 1.60: Äquivalenzklassen und die Quotientenmenge

Sei [latex]\sim[/latex] eine Äquivalenzrelation auf einer Menge [latex]X[/latex]. Dann wird für [latex]x \in X[/latex] die Menge

[latex]
\begin{aligned}[][x]_\sim = \left \lbrace {y \in X} \mid {y \sim x}\right \rbrace\end{aligned}
[/latex]

die Äquivalenzklasse von [latex]x[/latex] genannt. Weiters ist

[latex]
\begin{aligned}[]\mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } } = \left \lbrace {[x]_\sim } \mid {x \in X}\right \rbrace\end{aligned}
[/latex]

der Quotient (oder die Quotientenmenge) von [latex]X[/latex] modulo [latex]\sim[/latex]. Ein Element [latex]x \in X[/latex] wird auch Repräsentant seiner Äquivalenzklasse [latex][x]_\sim[/latex] genannt.

Anschaulich gesprochen geben wir äquivalente Elemente von [latex]X[/latex] in ein und denselben Topf und nicht äquivalente Elemente in verschiedene Töpfe. In diesem Bild besteht die Äquivalenzklasse eines Elements aus allen Elementen, die im gleichen Topf sind. Der Quotient modulo [latex]\sim[/latex] wiederum ist die Menge der Töpfe. Ein alternativer Begriff ist in folgender Definition enthalten.

Definition 1.61: Partition

Sei [latex]X[/latex] eine Menge und [latex]\mathcal {P}[/latex] eine Familie von nicht-leeren, paarweise disjunkten Teilmengen von [latex]X[/latex], so dass [latex]X = \bigsqcup _{P \in \mathcal {P}}P[/latex]. Dann wird [latex]\mathcal {P}[/latex] eine Partition von [latex]X[/latex] genannt.

Proposition 1.62: Korrespondenz zwischen Äquivalenzrelationen und Partitionen

Sei [latex]X[/latex] eine Menge. Dann entsprechen Äquivalenzrelationen auf [latex]X[/latex] und Partitionen von [latex]X[/latex] einander im folgenden Sinne: Für eine gegebene Äquivalenzrelation [latex]\sim[/latex] auf [latex]X[/latex] ist die Menge

[latex]
\begin{aligned}[]\mathcal {P}_\sim = \left \lbrace {[x]_\sim } \mid {x \in X}\right \rbrace\end{aligned}
[/latex]

eine Partition von [latex]X[/latex]. Umgekehrt definiert für eine Partition [latex]\mathcal {P}[/latex] von [latex]X[/latex]

[latex]
\begin{aligned}[]x \sim _\mathcal {P} y \iff \exists P \in \mathcal {P}: x \in P \wedge y \in P\end{aligned}
[/latex]

für [latex]x,y \in X[/latex] eine Äquivalenzrelation auf [latex]X[/latex]. Des Weiteren sind die Konstruktion der Partition aus der Äquivalenzrelation und die Konstruktion der Äquivalenzrelation aus der Partition zueinander invers: Für jede Partition [latex]\mathcal {P}[/latex] von [latex]X[/latex] gilt [latex]\mathcal {P}_{\sim _\mathcal {P}} = \mathcal {P}[/latex] und für jede Äquivalenzrelation [latex]\sim[/latex] auf [latex]X[/latex] gilt [latex]\sim _{\mathcal {P}_\sim } = \sim[/latex].

Sei [latex]X[/latex] eine Menge, [latex]\sim[/latex] eine Äquivalenzrelation auf [latex]X[/latex] und [latex]\mathcal {P}_\sim[/latex] wie in Proposition 1.62 definiert. Selbstverständlich gilt nach den Definitionen [latex]\mathcal {P}_\sim = \mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } }[/latex]. Wir möchten jedoch zwei verschiedene Symbole mitführen, da wir [latex]\mathcal {P}_\sim[/latex] und [latex]\mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } }[/latex] jeweils verschieden interpretieren möchten. [latex]\mathcal {P}_\sim[/latex] werden wir stets als eine Kollektion von Teilmengen von [latex]X[/latex] auffassen; [latex]\mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } }[/latex] hingegen werden wir als einen neuen Raum erachten, wo die Punkte durch Identifikation («Aneinanderkleben» ) von gewissen Punkten in [latex]X[/latex] entstanden sind. (Die Punkte in [latex]\mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } }[/latex] sind die Teilmengen von [latex]X[/latex], die in [latex]\mathcal {P}_\sim[/latex] enthalten sind).

Applet 1.63: Eine Äquivalenzrelation

Links wird eine Menge [latex]X[/latex] partitioniert, was einer Äquivalenzrelation [latex]\sim[/latex] auf [latex]X[/latex] entspricht. Rechts betrachten wir die Menge der Äquivalenzklassen, also den Quotienten von [latex]X[/latex] bzüglich [latex]\sim[/latex]. Die Menge links könnte eine abstrakte Menge darstellen oder den Einheitskreis. Im letzteren Fall muss klar definiert sein, zu welcher Menge die Punkte der Kanten, bei denen der Kreis unterteilt wird, gehören. Wir haben dies im Beispiel mit Farben angedeutet.

Übung 1.64: Zerquetschen einer Teilmenge

Charakterisieren Sie die Äquivalenzklassen der in Übung 1.57 (ii) definierten Äqui­valenzrelation [latex]\sim[/latex]. Zeigen Sie, dass [latex]\mathcal {P}_\sim[/latex] (wie in obiger Proposition definiert) eine Partition ist (ohne auf die noch nicht-bewiesene Proposition zurückzugreifen) und beschreiben Sie [latex]\mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } }[/latex] intuitiv.

Für den Beweis der Proposition 1.62 ziehen wir folgende Behauptung vor:

Behauptung

Sei [latex]\sim[/latex] eine Äquivalenzrelation auf [latex]X[/latex]. Dann sind folgende drei Aussagen für alle [latex]x, y\in X[/latex] (paarweise) äquivalent:

  1. [latex]x \sim y[/latex]
  2. [latex][x]_\sim = [y]_\sim[/latex]
  3. [latex][x]_\sim \cap [y]_\sim \neq \left \lbrace { } \right \rbrace[/latex]
Beweis der Behauptung

Wir beweisen die Implikationen [latex](i) \implies (ii) \implies (iii) \implies (i)[/latex], woraus folgt, dass alle drei Aussagen äquivalent sind. Seien [latex]x,y \in X[/latex].

Wir nehmen also zuerst an, dass [latex]x \sim y[/latex] gilt wie in [latex](i)[/latex]. Sei [latex]z \in [x]_\sim[/latex]. Dann ist [latex]z \sim x \sim y[/latex] und also [latex]z \sim y[/latex] und [latex]z \in [y]_\sim[/latex] wegen der Transitivität. Die andere Inklusion folgt analog (durch Vertauschen von [latex]x[/latex] und [latex]y[/latex]) und es gilt [latex][x]_\sim = [y]_\sim[/latex] wie in [latex](ii)[/latex].

Gilt [latex][x]_\sim = [y]_\sim[/latex] wie in [latex](ii)[/latex], so folgt [latex][x]_\sim \cap [y]_\sim \neq \left \lbrace { } \right \rbrace[/latex] wie in [latex](iii)[/latex] wegen Reflexivität.

Gilt [latex][x]_\sim \cap [y]_\sim \neq \left \lbrace { } \right \rbrace[/latex] wie in [latex](iii)[/latex], so existiert ein [latex]z \in X[/latex] mit [latex]z \sim x[/latex] und [latex]z \sim y[/latex]. Aus Symmetrie und Transitivität folgt daher [latex]x \sim y[/latex] wie in [latex](i)[/latex]. ∎

Beweis von Proposition 1.62

Sei [latex]\sim[/latex] eine Äquivalenzrelation auf [latex]X[/latex]. Dann gilt [latex]\bigcup _{P \in \mathcal {P}_\sim }P = \bigcup _{x \in X}[x]_\sim = X[/latex], da [latex]x \in [x]_\sim[/latex] für jedes [latex]x \in X[/latex]. Paarweise Disjunktheit der Elemente von [latex]\mathcal {P}_\sim[/latex] gilt dank der Behauptung und es folgt, dass [latex]\mathcal {P}_\sim[/latex] eine Partition ist.

Sei nun [latex]\mathcal {P}[/latex] eine Partition von [latex]X[/latex] und sei die Relation [latex]\sim _\mathcal {P}[/latex] wie in der Proposition definiert. Es ist für jedes [latex]x \in X[/latex] auch [latex]x \sim _\mathcal {P} x[/latex], da es wegen [latex]\bigcup _{P \in \mathcal {P}}P = X[/latex] ein [latex]P \in \mathcal {P}[/latex] gibt mit [latex]x \in P[/latex]; dies zeigt Reflexivität. Falls [latex]x \sim _\mathcal {P} y[/latex] für [latex]x,y \in X[/latex], dann folgt [latex]y \sim _\mathcal {P} x[/latex] direkt aus der Definition, das heisst [latex]\sim _\mathcal {P}[/latex] ist symmetrisch. Angenommen es gilt [latex]x \sim _\mathcal {P} y[/latex] und [latex]y \sim _\mathcal {P} z[/latex]. Dann gibt es ein Partitionselement [latex]P_1 \in \mathcal {P}[/latex] mit [latex]x,y \in P_1[/latex] und [latex]P_2\in \mathcal {P}[/latex] mit [latex]y,z \in P_2[/latex]. Insbesondere ist [latex]P_1 \cap P_2 \neq \left \lbrace { } \right \rbrace[/latex] und daher [latex]P_1 = P_2[/latex] nach den Eigenschaften der Partition. Es folgt [latex]x,z \in P_1[/latex], [latex]x \sim _\mathcal {P} z[/latex] und die Transitivität der Relation [latex]\sim _\mathcal {P}[/latex]. Daher ist [latex]\sim _\mathcal {P}[/latex] eine Äquivalenzrelation.

Für [latex]x \in X[/latex] ist die Äquivalenzklasse bezüglich [latex]\sim _\mathcal {P}[/latex] gegeben durch

[latex]
\begin{aligned}[][x]_{\sim _\mathcal {P}} = \left \lbrace {y \in X} \mid {y \sim _\mathcal {P} x}\right \rbrace = \bigcup _{P\in \mathcal {P} \wedge x\in P}P\end{aligned}
[/latex]

Da aber die Elemente von [latex]\mathcal {P}[/latex] paarweise disjunkt sind, kann [latex]x[/latex] nur in einem Element enthalten sein. Insbesondere folgt, dass [latex][x]_{\sim _\mathcal {P}} \in \mathcal {P}[/latex] das eindeutig bestimmte Element der Partition [latex]\mathcal {P}[/latex] ist, das [latex]x[/latex] enthält, und [latex]\mathcal {P}_{\sim _\mathcal {P}} \subseteq \mathcal {P}[/latex]. Ist [latex]P \in \mathcal {P}[/latex] und [latex]x \in P[/latex], so gilt [latex][x]_{\sim _\mathcal {P}} = P[/latex], also [latex]\mathcal {P}_{\sim _\mathcal {P}} = \mathcal {P}[/latex].

Ist umgekehrt [latex]\sim[/latex] eine Äquivalenzrelation auf [latex]X[/latex] und [latex]\mathcal {P}_\sim[/latex] die entsprechende Partition, dann gilt für alle [latex]x,y \in X[/latex]

[latex]
\begin{aligned}[]x \sim _\mathcal {P_{\sim }} y \iff [x]_\sim = [y]_\sim \iff x \sim y\end{aligned}
[/latex]

nach der Definition von [latex]\sim _{\mathcal {P}_\sim }[/latex] und der Behauptung. ∎

Man verwendet Quotienten modulo Äquivalenzrelationen in der Mathematik oft für die Konstruktion von gewissen Räumen und auch von neuen Zahlenmengen. Wir betrachten zu letzterem ein einfaches und grundlegendes Beispiel: Wir konstruieren die rationalen Zahlen aus den ganzen Zahlen.

Beispiel 1.65: Konstruktion der rationalen Zahlen

Wir nehmen an, dass wir bereits die ganzen Zahlen [latex]\mathbb {Z}[/latex] und die Addition und Multiplikation auf [latex]\mathbb {Z}[/latex] mit allen üblichen Eigenschaften kennen und wollen damit die rationalen Zahlen [latex]\mathbb {Q}[/latex] definieren. Zu diesem Zwecke betrachten wir die Relation [latex]\sim[/latex] auf [latex]\mathbb {Z} \times (\mathbb {Z}\setminus \left \lbrace {0} \right \rbrace )[/latex] definiert durch

[latex]
\begin{aligned}[](m_1,m_2) \sim (n_1,n_2) \iff m_1n_2 = n_1m_2\end{aligned}
[/latex]

für [latex](m_1,m_2), (n_1,n_2) \in \mathbb {Z} \times (\mathbb {Z}\setminus \left \lbrace {0} \right \rbrace )[/latex]. Diese Definition rührt daher, dass wir rationale Zahlen als Brüche von ganzen Zahlen auffassen möchten. Dabei müssen wir allerdings solche identifizieren, die «nach Kürzen» gleich sind; zum Beispiel sollte gelten [latex]\frac {10}{6} = \frac {5}{3}[/latex]. Allerdings wollen wir hier davon ausgehen, dass wir die rationalen Zahlen noch nicht kennen, weswegen wir anstatt Gleichungen der Form [latex]\frac {m_1}{m_2}=\frac {n_1}{n_2}[/latex] Gleichungen der Form [latex]m_1n_2 = n_1m_2[/latex] mit Ausdrücken innerhalb von [latex]\mathbb {Z}[/latex] betrachten (im Beispiel [latex]10 \cdot 3 = 5 \cdot 6[/latex]).

Nun verifzieren wir, dass obige Relation tatsächlich eine Äquivalenzrelation ist. Seien dazu [latex](m_1,m_2),(n_1,n_2),(q_1,q_2) \in \mathbb {Z} \times (\mathbb {Z}\setminus \left \lbrace {0} \right \rbrace )[/latex].

  • Reflexivität: [latex](m_1,m_2)\sim (m_1,m_2)[/latex], denn [latex]m_1m_2 = m_1m_2[/latex].
  • Symmetrie: Angenommen es gilt [latex](m_1,m_2) \sim (n_1,n_2)[/latex]. Dann ist per Definition also [latex]m_1 n_2 = n_1 m_2[/latex], was [latex]n_1 m_2 = m_1n_2[/latex] und daher auch [latex](n_1,n_2) \sim (m_1,m_2)[/latex] impliziert.
  • Transitivität: [latex](m_1,m_2) \sim (n_1,n_2)[/latex] und [latex](n_1,n_2) \sim (q_1,q_2)[/latex] ergibt [latex]m_1 n_2 = n_1 m_2[/latex] und [latex]n_1 q_2 = q_1 n_2[/latex]. Durch Multiplikation der ersten Gleichungen mit [latex]q_2[/latex] und der zweiten Gleichung mit [latex]m_2[/latex] erhalten wir
    [latex]
    \begin{aligned}[]m_1 n_2 q_2 = n_1 m_2 q_2 = q_1n_2m_2.\end{aligned}
    [/latex]

    Da [latex]n_2[/latex] nicht Null ist, können wir in obiger Gleichung [latex]n_2[/latex] Wegstreichen (was eine der Eigenschaften von [latex]\mathbb {Z}[/latex] ist und [latex]\mathbb {Q}[/latex] nicht verwendet), womit sich [latex]m_1q_2 = q_1 m_2[/latex] und damit [latex](m_1,m_2) \sim (q_1,q_2)[/latex] ergibt.

Der Quotient [latex]\mathchoice {\text {\raise 0.4ex\hbox {${(\mathbb {Z} \times (\mathbb {Z} \setminus \left \lbrace {0} \right \rbrace ))}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{(\mathbb {Z} \times (\mathbb {Z} \setminus \left \lbrace {0} \right \rbrace ))}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{(\mathbb {Z} \times (\mathbb {Z} \setminus \left \lbrace {0} \right \rbrace ))}\, /{\sim } } {{(\mathbb {Z} \times (\mathbb {Z} \setminus \left \lbrace {0} \right \rbrace ))}\, /{\sim } }[/latex] kann nun als Definition der rationalen Zahlen [latex]\mathbb {Q}[/latex] angesehen werden. Für eine Äquivalenzklasse [latex][(m_1,m_2)]_\sim \in \mathbb {Q}[/latex] schreibt man wie üblich [latex]\frac {m_1}{m_2}[/latex]. Damit gilt nun die Gleichung

[latex]
\begin{aligned}[]\frac {qm_1}{qm_2}=\frac {m_1}{m_2}\end{aligned}
[/latex]

für [latex]m_1\in \mathbb {Z}[/latex] und [latex]q,m_2\in \mathbb {Z}\setminus \{ 0\}[/latex]. In der Tat bezeichnen nach Definition beide Seiten Äquivalenzklassen und die Gleichung gilt genau wenn

[latex]
\begin{aligned}[](qm_1,qm_2)\sim (m_1,m_2)\end{aligned}
[/latex]

oder äquivalenterweise [latex]qm_1m_2=m_1qm_2[/latex] erfüllt ist. Da letzteres gilt, erfüllen damit die so definierten rationalen Zahlen die üblichen Erweiterungs- und Kürzungsregeln.

Des Weiteren lässt sich [latex]\mathbb {Z}[/latex] als Teilmenge von [latex]\mathbb {Q}[/latex] auffassen. In der Tat ist die Abbildung

[latex]
\begin{aligned}[]\mathbb {Z} \to \mathbb {Q},\ m \mapsto \frac {m}{1}\end{aligned}
[/latex]

injektiv, denn die Gleichung [latex]\frac {m}{1} = \frac {n}{1}[/latex] ist für [latex]m,n \in \mathbb {Z}[/latex] per Definition genau dann erfüllt, wenn [latex]m= n[/latex] ist. Wir identifizieren [latex]\mathbb {Z}[/latex] mit dem Bild obiger Abbildung und schreiben insbesondere [latex]\frac {m}{1} = m[/latex] für [latex]m \in \mathbb {Z}[/latex].

Wir wollen kurz zu allgemeinen Quotienten zurückkehren, also sei [latex]X[/latex] eine Menge und [latex]\sim[/latex] eine Äquivalenzrelation auf [latex]X[/latex]. Häufig will man eine Funktion auf [latex]\mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } }[/latex] unter Verwendung der Elemente von [latex]X[/latex] (also der Repräsentanten der Äquivalenzklassen) definieren. Zum Beispiel möchten wir in obigem Beispiel in der Lage sein, zusätzliche Abbildungen auf [latex]\mathbb {Q}[/latex] zu definieren (unter anderem die Addition und die Multiplikation).

Konkreter, wenn [latex]Y[/latex] eine weitere Menge ist und [latex]f:X \to Y[/latex] eine Funktion ist, wollen wir möglicherweise durch

[latex]
\begin{aligned}[]\bar {f}: \mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } } \to Y,\ [x]_\sim \mapsto f(x)\end{aligned}
[/latex]

eine Funktion definieren. Dies ist aber nur dann möglich, wenn [latex]x_1 \sim x_2[/latex] für [latex]x_1,x_2 \in X[/latex] (also [latex][x_1]_\sim = [x_2]_\sim[/latex]) auch [latex]f(x_1) = f(x_2)[/latex] impliziert. In diesem Fall ist [latex]\bar {f}([x]_\sim )[/latex] unabhängig von der Wahl des Repräsentanten [latex]x[/latex] der Äquivalenzklasse [latex][x]_\sim[/latex]. Also definiert dies in der Tat eine Funktion [latex]\bar {f}[/latex], die jedem Element [latex][x]_\sim[/latex] des Definitionsbereichs [latex]\mathchoice {\text {\raise 0.4ex\hbox {${X}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{X}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{X}\, /{\sim } } {{X}\, /{\sim } }[/latex] ein eindeutig bestimmtes Element [latex]\bar {f}([x]_\sim )[/latex] zuordnet. Zur Betonung dieser (für Funktionen notwendiger) Eigenschaft sagen wir in diesem Fall, dass [latex]\bar {f}[/latex] wohldefiniert ist.

Übung 1.66: Addition und Multiplikation auf den rationalen Zahlen

Wir definieren nun zusätzliche Strukturen auf [latex]\mathbb {Q}[/latex]. Zeigen Sie, dass die Abbildungen

[latex]
\begin{aligned}[]+: \mathbb {Q} \times \mathbb {Q} \to \mathbb {Q},\ \left (\frac {m}{n},\frac {p}{q}\right ) \mapsto \frac {m}{n}+\frac {p}{q} = \frac {mq+np}{nq}\end{aligned}
[/latex]

und

[latex]
\begin{aligned}[]\cdot : \mathbb {Q} \times \mathbb {Q} \to \mathbb {Q},\ \left (\frac {m}{n},\frac {p}{q}\right ) \mapsto \frac {m}{n}\cdot \frac {p}{q} = \frac {mp}{nq}\end{aligned}
[/latex]

wohldefiniert sind. Verifizieren Sie des Weiteren die Rechenregeln

[latex]
\begin{aligned}[]\frac {m}{n} \cdot \frac {n}{m} = 1, \quad \frac {a}{b} + \frac {-a}{b} = 0\end{aligned}
[/latex]

für [latex]m,n,b \in \mathbb {Z}\setminus \left \lbrace {0} \right \rbrace[/latex] und [latex]a \in \mathbb {Z}[/latex]. Sie dürfen in dieser Aufgabe zwar alle üblichen Rechenregeln und Eigenschaften von [latex]\mathbb {Z}[/latex] verwenden, aber nicht jene von [latex]\mathbb {Q}[/latex] (da wir letztere ja definieren wollen).

Teillösung

Wir zeigen am Beispiel der Addition, dass die Auflösung bekannte Rechengesetze verwendet. Angenommen [latex]m,m',p,p'\in \mathbb {Z}[/latex] und [latex]n,n',q,q'\in \mathbb {Z}\setminus \{ 0\}[/latex], erfüllen [latex](m,n)\sim (m',n')[/latex] und [latex](p,q)\sim (p',q')[/latex]. Dann gilt nach Definition [latex]mn'=m'n[/latex] und [latex]pq'=p'q[/latex]. Wir verwenden nun Erweitern (siehe Beispiel 1.65), Umformungen des Zählers (welcher in [latex]\mathbb {Z}[/latex] liegt und wo die üblichen Rechengesetze angenommen werden), Kürzen, und erhalten dadurch

[latex]
\begin{aligned}[]\frac {mq+np}{nq}&= \frac {(mq+np)n'q'}{nqn'q'}\\ &=\frac {mn'qq'+nn'pq'}{nqn'q'}\\ &=\frac {m'nqq'+nn'p'q}{nqn'q'}\\ &=\frac {(m'q'+n'p')nq}{nqn'q'}\\ &=\frac {m'q'+n'p'}{n'q'}.\end{aligned}
[/latex]

Dies zeigt, dass die definierte Abbildung [latex]+:\mathbb {Q}\times \mathbb {Q}\to \mathbb {Q}[/latex] in der Tat wohldefiniert ist.

Folgendes Lemma beschreibt, unter welchen Bedingungen man eine Funktion aus Funktionen auf Teilmengen «zusammensetzen» kann:

Lemma 1.67: Funktionen durch Fallunterscheidungen

Seien [latex]X[/latex] und [latex]Y[/latex] Mengen und sei [latex]\mathcal {P}[/latex] eine Partition von [latex]X[/latex]. Angenommen es ist für jedes [latex]P \in \mathcal {P}[/latex] eine Funktion [latex]f_P: P \to Y[/latex] gegeben. Dann existiert eine eindeutige Funktion [latex]f: X \to Y[/latex], so dass [latex]f|_P = f_P[/latex] für jedes [latex]P \in \mathcal {P}[/latex] gilt.

Beweis

Wir definieren die gewünschte Funktion [latex]f: X \to Y[/latex] wie folgt: Sei [latex]x \in X[/latex]. Dann existiert genau ein [latex]P \in \mathcal {P}[/latex] mit [latex]x \in P[/latex], da [latex]\mathcal {P}[/latex] eine Partition ist. Wir setzen nun [latex]f(x) = f_P(x)[/latex] und haben also eine Funktion [latex]f: X \to Y[/latex] definiert. Diese erfüllt [latex]f|_P = f_P[/latex] nach Konstruktion. Zur Eindeutigkeit von [latex]f[/latex]: Sei [latex]g: X \to Y[/latex] eine weitere Funktion mit [latex]g|_P = f_P[/latex]. Sei [latex]x \in X[/latex] ein beliebiges Element und [latex]P \in \mathcal {P}[/latex] das Partitionselement mit [latex]x \in P[/latex]. Dann gilt

[latex]
\begin{aligned}[]g(x) = g|_P(x) = f_P(x) = f(x).\end{aligned}
[/latex]

Übung 1.68: Funktionen durch Fallunterscheidungen

Zeigen Sie, dass die Bedingung in Lemma 1.67, dass [latex]\mathcal {P}[/latex] eine Partition ist, notwendig ist, durch Auffinden geeigneter Beispiele:

  • Finden Sie Mengen [latex]X,Y[/latex], eine Kollektion [latex]\mathcal {P}[/latex] nicht paarweise disjunkter Teilmengen mit [latex]X = \bigcup _{P \in \mathcal {P}}P[/latex] und Funktionen [latex]f_P: P \to Y[/latex] für jedes [latex]P \in \mathcal {P}[/latex], so dass keine Funktion [latex]f:X \to Y[/latex] mit [latex]f|_P = f_P[/latex] für jedes [latex]P \in \mathcal {P}[/latex] existiert.
  • Seien [latex]X[/latex] und [latex]Y[/latex] Mengen, [latex]\mathcal {P}[/latex] eine Kollektion paarweise disjunkter Teilmengen mit [latex]X \neq \bigcup _{P \in \mathcal {P}}P[/latex] und Funktionen [latex]f_P: P \to Y[/latex] für jedes [latex]P \in \mathcal {P}[/latex] gegeben. Zeigen Sie, dass mehrere Funktionen [latex]f: X \to Y[/latex] mit [latex]f|_P = f_P[/latex] für jedes [latex]P \in \mathcal {P}[/latex] existieren, falls [latex]Y[/latex] mehr als ein Element enthält.

1.4.4 – Mächtigkeit

Wir besprechen nun einen fundamentalen Begriff der Mengenlehre, den man sich intuitiv auch als Grössenvergleich vorstellen sollte:

Definition 1.69: Gleichmächtigkeit

Zwei Mengen [latex]X,Y[/latex] sind gleichmächtig, geschrieben [latex]X \sim Y[/latex], falls es eine Bijektion [latex]f:X \to Y[/latex] gibt.

Der Begriff (die Relation) der Gleichmächtigkeit erfüllt auf der Klasse aller Mengen

  • die Reflexivität, denn für jede Menge [latex]X[/latex] ist die Identitätsabbildung [latex]\operatorname {id}_X:X \to X,\ x \mapsto x[/latex] eine Bijektion,
  • die Symmetrie, da für eine Bijektion [latex]f:X \to Y[/latex] die Umkehrabbildung [latex]f^{-1}[/latex] ebenso eine Bijektion ist (siehe auch Übung 1.44) und
  • die Transitivität, da für zwei Bijektionen [latex]f:X \to Y[/latex] und [latex]g: Y \to Z[/latex] auch die Verknüpfung [latex]g \circ f: X \to Z[/latex] eine Bijektion ist (nach Lemma 1.42).

Also definiert die Gleichmächtigkeit eine Äquivalenzrelation auf der Klasse aller Mengen.

Diese entspricht eigentlich unserer alltäglichen Definition der Zahlen (genauer Kardinalzahlen im Gegensatz zu Ordinalzahlen). Beispielsweise gibt es in der Entwicklung eines Kindes einen Zeitpunkt, wo es erkennt, dass «zwei Brote» , «zwei Autos» und «zwei Bälle» etwas gemeinsam haben, was bei «drei Erwachsenen» anders ist. Für grössere Zahlen verwenden wir anstatt dem Abzählen oft auch eine andere Methode um festzustellen, ob gleich viele Objekte einer Sorte wie Objekte einer anderen Sorte vorhanden sind. Zum Beispiel ist es einfach herauszufinden, ob man die richtige Anzahl Stühle bei einer Party bereitgestellt hat, in dem man die Gäste bittet, sich kurz alle gleichzeitig hinzusetzen. Die Bijektion in Definition 1.69 entspricht dem gleichen Zweck wie diese Bitte.

Für endliche Mengen [latex]A = \left \lbrace {x_1,\ldots ,x_m} \right \rbrace[/latex] und [latex]B = \left \lbrace {y_1,\ldots ,y_n} \right \rbrace[/latex] bestehend aus [latex]m[/latex] beziehungsweise [latex]n[/latex] verschiedenen Elementen (also soll [latex]x_i \neq x_j[/latex] für alle [latex]1 \leq i

Definition 1.70: Endliche Mengen

Wir sagen, dass die Kardinalität der leeren Menge [latex]\emptyset[/latex] Null ist und schreiben [latex]|\emptyset | = \# \emptyset = 0[/latex]. Sei nun [latex]X[/latex] eine beliebige Menge und [latex]n \geq 1[/latex] eine natürliche Zahl. Die Menge [latex]X[/latex] hat Kardinalität [latex]n[/latex], falls [latex]X[/latex] gleichmächtig zu [latex]\left \lbrace {1,\ldots ,n} \right \rbrace[/latex] ist. In diesem Fall schreiben wir [latex]|X| = \# X = n[/latex]. Des Weiteren ist [latex]X[/latex] eine endliche Menge, falls [latex]|X| = n[/latex] für eine nicht-negative ganze Zahl [latex]n \in \mathbb {N}_0 = \left \lbrace {0,1,2,\ldots } \right \rbrace[/latex]. In diesem Fall sagen wir auch, dass [latex]X[/latex] endliche Kardinalität hat und wir schreiben [latex]|X|unendliche Menge (oder sagen, dass [latex]X[/latex] unendliche Kardinalität hat) und schreiben [latex]|X| = \infty[/latex].

Proposition 1.71: Schubfachprinzip

Seien [latex]m > n \geq 1[/latex] natürliche Zahlen. Dann gibt es keine injektive Abbildung von [latex]\left \lbrace {1,\ldots ,m} \right \rbrace[/latex] nach [latex]\left \lbrace {1,\ldots ,n} \right \rbrace[/latex]. Insbesondere sind zwei endliche Mengen [latex]X[/latex] und [latex]Y[/latex] genau dann gleichmächtig, wenn [latex]|X| = |Y|[/latex] ist.

Wir bemerken, dass die Aussage des Schubfachprinzips sehr anschaulich ist. Angenommen man hat [latex]n\geq 1[/latex] Körbe und [latex]m>n[/latex] Äpfel, welche man in die Körbe legen will. Dann besagt das Schubfachprinzip, dass es immer einen Korb geben wird, in dem sich mindestens 2 Äpfel befinden werden und dies unabhängig davon, mit welcher Methode man die Äpfel in die Körbe verteilt. Ein Beispiel, wo man das Schubfachprinzips als Beweismethode verwenden kann, werden wir in Abschnitt 1.6.4 behandeln. Auch wenn die Aussage von Proposition 1.71 intuitiv klar ist, werden wir für einen rigorosen Beweis auf das Induktionsprinzip zurückgreifen.

Beweis

Wir beweisen zuerst mittels Induktion nach [latex]n[/latex], dass es keine injektive Abbildung von [latex]\left \lbrace {1,\ldots ,n+1} \right \rbrace[/latex] nach [latex]\left \lbrace {1,\ldots ,n} \right \rbrace[/latex] geben kann. Für [latex]n=1[/latex] gibt es nur die (konstante) Abbildung [latex]f: \left \lbrace {1,2} \right \rbrace \to \left \lbrace {1} \right \rbrace[/latex] gegeben durch [latex]f(1) =1[/latex] und [latex]f(2) = 1[/latex], welche nicht injektiv ist. Dies beweist den Induktionsanfang.

Angenommen wir wissen bereits, dass es keine injektive Abbildung von [latex]\left \lbrace {1,\ldots ,n+1} \right \rbrace[/latex] nach [latex]\left \lbrace {1,\ldots ,n} \right \rbrace[/latex] gibt. Sei nun [latex]f: \left \lbrace {1,\ldots ,n+2} \right \rbrace \to \left \lbrace {1,\ldots ,n+1} \right \rbrace[/latex] eine beliebige Abbildung und sei [latex]k = f(n+2)[/latex]. Falls es ein [latex]j \in \left \lbrace {1,\ldots ,n+1} \right \rbrace[/latex] mit [latex]f(j) = k = f(n+2)[/latex] gibt, so ist [latex]f[/latex] nicht injektiv. Wir nehmen nun an, dass es ein derartiges [latex]j[/latex] nicht gibt.

Falls [latex]k=n+1[/latex] ist, so betrachten wir die eingeschränkte Funktion

[latex]
\begin{aligned}[]g: \left \lbrace {1,\ldots ,n+1} \right \rbrace \to \left \lbrace {1,\ldots ,n} \right \rbrace ,\ j \mapsto f(j).\end{aligned}
[/latex]

Nach obiger Annahme, dass es kein [latex]j\in \{ 1,\ldots ,n+1\}[/latex] mit [latex]f(j)=n+1[/latex] gibt, ist die Abbildung [latex]g[/latex] wohldefiniert. Nun zeigt aber die Induktionsvoraussetzung, dass [latex]g[/latex] nicht injektiv sein kann, also existieren [latex]i \neq j[/latex] in [latex]\left \lbrace {1,\ldots ,n+1} \right \rbrace[/latex] mit [latex]f(i) = g(i) = g(j) = f(j)[/latex], wodurch auch [latex]f[/latex] nicht injektiv ist.

Falls [latex]k

[latex]
\begin{aligned}[]\sigma : \left \lbrace {1,\ldots ,n+1} \right \rbrace \to \left \lbrace {1,\ldots ,n+1} \right \rbrace ,\ j \mapsto \left \lbrace \begin{array}{cl} n+1 & \text {falls } j=k, \\ k & \text {falls } j = n+1, \\ j & \text {falls } j\neq k \text { und } j \neq n+1.\end{array} \right .\end{aligned}
[/latex]

und erhalten eine neue Funktion [latex]F = \sigma \circ f[/latex], welche nun [latex]F(n+2) = \sigma (k) = n+1[/latex] erfüllt. Auf Grund des oben behandelten Falles ist [latex]F[/latex] nicht injektiv. Da aber [latex]\sigma[/latex] bijektiv und [latex]f = \sigma \circ F[/latex] ist, ist auch [latex]f[/latex] nicht injektiv.

Dies schliesst den Induktionsschritt und damit den Induktionsbeweis ab. Wir haben also für eine natürliche Zahl [latex]n \geq 1[/latex] bewiesen, dass es keine injektive Abbildung von [latex]\left \lbrace {1,\ldots ,n+1} \right \rbrace[/latex] nach [latex]\left \lbrace {1,\ldots ,n} \right \rbrace[/latex] geben kann. Für [latex]m > n \geq 1[/latex] erhalten wir daraus, dass es keine injektive Abbildung von [latex]\left \lbrace {1,\ldots ,m} \right \rbrace[/latex] nach [latex]\left \lbrace {1,\ldots ,n} \right \rbrace[/latex] geben kann. (Wieso?)

Seien nun [latex]X[/latex] und [latex]Y[/latex] zwei endliche Mengen. Falls es eine bijektive Abbildung von [latex]X[/latex] nach [latex]Y[/latex] gibt, so existiert per Definition der Kardinalität endlicher Mengen auch eine bijektive Abbildung [latex]f:\left \lbrace {1,\ldots ,|X|} \right \rbrace \to \left \lbrace {1,\ldots ,|Y|} \right \rbrace[/latex]. Auf Grund der Injektivität von [latex]f[/latex] gilt [latex]|X| \leq |Y|[/latex] und auf Grund der Injektivität von [latex]f^{-1}[/latex] gilt [latex]|Y| \leq |X|[/latex]. Also ist [latex]|X| = |Y|[/latex]. Nimmt man umgekehrt an, dass [latex]|X| = |Y|[/latex] gilt, so folgt Gleichmächtigkeit von [latex]X[/latex] und [latex]Y[/latex] aus der Transitivität und der Definition der Kardinalität. ∎

Übung 1.72: Schubfachprinzip mittels surjektiven Funktionen

Seien [latex]m > n \geq 1[/latex] natürliche Zahlen. Zeigen Sie, dass es keine surjektive Abbildung von [latex]\left \lbrace {1,\ldots ,n} \right \rbrace[/latex] nach [latex]\left \lbrace {1,\ldots ,m} \right \rbrace[/latex] geben kann.

Hinweis.

Sie können versuchen diese Aussage auf Proposition 1.71 zurückzuführen, oder der Beweismethode von Proposition 1.71 zu folgen.

Übung 1.73

Sei [latex]X[/latex] eine endliche Menge und [latex]f:X \to X[/latex] eine Abbildung.

  1. Beweisen Sie, dass Injektivität, Surjektivität und Bijektivität von [latex]f[/latex] äquivalent sind.
  2. Sei nun [latex]f[/latex] bijektiv. Zeigen Sie, dass es eine natürliche Zahl [latex]n \geq 1[/latex] gibt mit [latex]f^{\, \circ \, {n} } = \operatorname {id}_X[/latex].

Eine Teillösung

Sei [latex]X = \left \lbrace {1,\ldots ,n} \right \rbrace[/latex] für eine natürliche Zahl [latex]n\geq 1[/latex]. Angenommen [latex]f[/latex] ist injektiv. Falls [latex]f[/latex] nicht surjektiv wäre, so könnte man [latex]f[/latex] mit einer Vertauschung [latex]\sigma[/latex] wie im Beweis von Proposition 1.71 verknüpfen und erreichen, dass [latex]n \not \in \sigma \circ f(X)[/latex] ist. Dies definiert eine injektive Abbildung [latex]g:\left \lbrace {1,\ldots ,n} \right \rbrace \to \left \lbrace {1,\ldots ,n-1} \right \rbrace ,\ j \mapsto f(j)[/latex], was im Widerspruch zum Schubfachprinzip steht.

Der Begriff der Mächtigkeit ist aber vor allem für Mengen mit unendlich vielen Elementen interessant. Grund dafür ist, dass es «verschieden grosse» unendliche Mengen gibt, wie das folgende Theorem von Cantor bestätigt. Ein Theorem ist eine mathematische Aussage grosser Wichtigkeit.

Theorem 1.74: Cantors Diagonalargument

Sei [latex]X[/latex] eine Menge. Dann ist [latex]X[/latex] nicht zu seiner Potenzmenge [latex]\mathcal {P}(X)[/latex] gleichmächtig. Insbesondere ist die Menge [latex]\mathbb {N} = \left \lbrace {1,2,3,\ldots } \right \rbrace[/latex] der natürlichen Zahlen nicht gleichmächtig zu [latex]\mathcal {P}(\mathbb {N})[/latex].

Übung 1.75: Potenzmengen endlicher Mengen

Sei [latex]n[/latex] eine natürliche Zahl und sei [latex]X[/latex] eine Menge mit genau [latex]n[/latex] verschiedenen Elementen. Zeigen Sie, dass [latex]|\mathcal {P}(X)| = 2^n[/latex] gilt. Verwenden Sie dazu vollständige Induktion und schliessen Sie daraus Theorem 1.74 für den Fall, dass [latex]X[/latex] eine endliche Menge ist.

Übung 1.76

Sei [latex]X[/latex] eine Menge und sei [latex]Y[/latex] die Menge der Funktionen [latex]X \to \left \lbrace {0,1} \right \rbrace[/latex]. Zeigen Sie, dass [latex]Y[/latex] und [latex]\mathcal {P}(X)[/latex] gleichmächtig sind.

Hinweis.

Verwenden Sie Beispiel 1.30.

Beweis von Theorem 1.74 (per Widerspruch)

Wir nehmen an, dass es doch eine Bijektion [latex]f: X \to \mathcal {P}(X)[/latex] gibt und führen dies zu einem Widerspruch. Um diesen Widerspruch zu finden, definieren wir die Menge

[latex]
\begin{aligned}[]A = \left \lbrace {x \in X} \mid {x \not \in f(x)}\right \rbrace\end{aligned}
[/latex]

aller Elemente [latex]x[/latex] in [latex]X[/latex], für die [latex]x[/latex] kein Element der Teilmenge [latex]f(x) \subseteq X[/latex] ist. Da nach Annahme [latex]f:X \to \mathcal {P}(X)[/latex] eine Bijektion ist und per Definition [latex]A\in \mathcal {P}(X)[/latex] ist, muss es ein [latex]a \in X[/latex] geben, so dass [latex]A = f(a)[/latex]. Daraus folgt gemeinsam mit der Definition von [latex]A[/latex], dass

[latex]
\begin{aligned}[]a \in A \iff a \not \in f(a) \iff a \not \in A\end{aligned}
[/latex]

Dies ist aber absurd und daher existiert kein [latex]a\in X[/latex] mit [latex]f(a) = A[/latex]. Dies ist ein Widerspruch zur Surjektivität von [latex]f[/latex]; also kann es keine Bijektion [latex]f:X \to \mathcal {P}(X)[/latex] geben. ∎

Um zu sehen, inwiefern Theorem 1.74 ein Diagonalargument beinhaltet, laden wir Sie ein, folgende Übung zu lösen.

Übung 1.77: Die Diagonale in Cantors Diagonalargument

Betrachten Sie den Spezialfall [latex]X = \mathbb {N}[/latex] in Theorem 1.74 und nehmen Sie an, dass [latex]\mathcal {P}(\mathbb {N}) \sim \mathbb {N}[/latex], also [latex]\mathcal {P}(\mathbb {N}) = \left \lbrace {A_1,A_2,A_3,\ldots } \right \rbrace[/latex] für Teilmengen [latex]A_n \subseteq \mathbb {N}[/latex] für jede natürliche Zahl [latex]n[/latex]. Für jedes solche [latex]n[/latex] lässt sich die Menge [latex]A_n[/latex] als die Folge in [latex]0,1[/latex] auffassen, für welche die [latex]m[/latex]-te Zahl genau dann [latex]1[/latex] ist, wenn [latex]m \in A_n[/latex] (vergleiche auch Übung 1.76 und Beispiel 1.30). Wir schreiben nun die Folgen in eine Tabelle der Art

[latex]
\begin{aligned}[]\begin{array}{ccccccc} A_1 & \leftrightarrow & \color{red} 0 & 1 & 0 & 1 &\ldots \\ A_2 & \leftrightarrow & 1 &\color{red} 0 & 0 & 0 &\ldots \\ A_3 & \leftrightarrow & 0 & 1 & \color{red} 1 & 1 &\ldots \\ A_4 & \leftrightarrow & 1 & 0 & 1 & \color{red} 1 &\ldots \\ & & \vdots & \vdots & \vdots & \vdots &\end{array}\end{aligned}
[/latex]

wobei die [latex]n[/latex]-te Zeile der Menge [latex]A_n[/latex] entspricht. Dann lässt sich mit Hilfe der (in rot markierten) Diagonalen eine Folge konstruieren, deren zugehörige Menge nicht in der Liste [latex]A_1,A_2,A_3,\ldots[/latex] ist. Wie? Was hat das mit dem Beweis von Theorem 1.74 zu tun?

Übung 1.78: Verschärfung von Cantors Diagonalargument

Formulieren Sie den Beweis von Theorem 1.74 so um, dass keine indirekte Annahme notwendig ist und zeigen Sie, dass eine Abbildung [latex]f: X \to \mathcal {P}(X)[/latex] nicht surjektiv sein kann.

Da es aber für jede Menge [latex]X[/latex] eine injektive Abbildung [latex]f: X \to \mathcal {P}(X)[/latex] wie zum Beispiel [latex]f:X \to \mathcal {P}(X),\ x \mapsto \left \lbrace {x} \right \rbrace[/latex] gibt, drängt sich der Eindruck auf, dass [latex]X[/latex] gewissermassen «kleiner» als [latex]\mathcal {P}(X)[/latex] ist.

Definition 1.79: Schmächtiger

Seien [latex]X[/latex] und [latex]Y[/latex] zwei Mengen. Dann sagen wir, dass [latex]X[/latex] schmächtiger als (oder genau formuliert höchstens so mächtig wie) [latex]Y[/latex] ist und schreiben [latex]X \lesssim Y[/latex], falls es eine Injektion [latex]f:X \to Y[/latex] gibt. Wir sagen, dass [latex]X[/latex] echt schmächtiger (oder weniger mächtig) als [latex]Y[/latex] ist, falls [latex]X[/latex] schmächtiger als [latex]Y[/latex] ist und [latex]Y[/latex] nicht schmächtiger als [latex]X[/latex] ist ([latex]X \lesssim Y[/latex] und [latex]Y \not \lesssim X[/latex]).

Eine Menge [latex]X[/latex] ist schmächtiger als eine Menge [latex]Y[/latex] genau dann, wenn [latex]X[/latex] gleichmächtig zu einer Teilmenge von [latex]Y[/latex] ist. Dies begründet die Terminologie.

Übung 1.80: Schmächtiger als Relation

Untersuchen Sie die Relation [latex]\lesssim[/latex] auf der Klasse aller Mengen auf ihre Eigenschaften (siehe auch Definition 1.55).

Hinweis.

Zeigen Sie, dass [latex]\lesssim[/latex] reflexiv, transitiv aber nicht symmetrisch ist.

Der oben eingeführte Begriff hat einen interessanten Zusammenhang zur Gleich­mächtig­keit:

Theorem 1.81: Cantor, Schröder, Bernstein

Seien [latex]X[/latex] und [latex]Y[/latex] Mengen, so dass [latex]X \lesssim Y[/latex] und [latex]Y \lesssim X[/latex]. Dann gilt [latex]X \sim Y[/latex].

Das Theorem wurde 1887 von Cantor formuliert und von Dedekind unter Verwendung eines zusätzlichen Axioms im selben Jahr bewiesen. Dem 19-jährigen Studenten Bernstein gelang es schliesslich einen Beweis der Aussage zu liefern ohne jenes Axiom (das Auswahlaxiom) zu benutzen.

Beweis von Theorem 1.81

Seien [latex]X,Y[/latex] zwei Mengen mit [latex]X \lesssim Y[/latex] und [latex]Y \lesssim X[/latex] wie in Theorem 1.81. Dann gibt es injektive Funktionen [latex]f:X \to Y[/latex] und [latex]g: Y \to X[/latex]. Wir definieren

[latex]
\begin{aligned}[]X_1 =X, \quad Y_1 = g(Y), \quad X_2 = g\circ f(X).\end{aligned}
[/latex]

Dann gelten die Inklusionen [latex]X_1 \supseteq Y_1 \supseteq X_2[/latex] und die Funktion [latex]h: x \in X_1 \mapsto g \circ f(x) \in X_2[/latex] ist eine Bijektion (mit Definitionsbereich [latex]X_1[/latex] und Wertebereich [latex]X_2[/latex], was für [latex]g \circ f[/latex] nicht zutrifft). Wir behaupten nun, dass es eine Bijektion [latex]F:X_1 \to Y_1[/latex] gibt. Für unsere Mengen [latex]X,Y[/latex] impliziert dies das Theorem, denn es gilt dann [latex]X = X_1 \sim Y_1 = g(Y) \sim Y[/latex], wobei die zweite Gleichmächtigkeit wegen der Bijektivität der Funktion [latex]g(y) \in g(Y) \mapsto y \in Y[/latex] gilt.

Zum Beweis der Behauptung nehmen wir also an, dass [latex]X_1,Y_1,X_2[/latex] drei Mengen sind mit [latex]X_1 \supseteq Y_1 \supseteq X_2[/latex] und dass es eine Bijektion [latex]h: X_1 \to X_2[/latex] gibt. Wir wollen daraus schliessen, dass [latex]X_1 \simeq Y_1[/latex] gilt.

image

Abbildung 1.11 – Obwohl logisch gesehen unnötig, ist es hilfreich, sich den Beweis von Theorem 1.81 mit Hilfe dieses Bildes zu veranschaulichen und Parallelen zu Hilberts Hotel zu suchen.

Wir definieren [latex]Y_2 = h(Y_1)[/latex], [latex]X_3 = h(X_2) = h^{\, \circ \, {2} }(X_1)[/latex] und allgemeiner für eine natürliche Zahl [latex]n[/latex]

[latex]
\begin{aligned}[]Y_{n+1} = h^{\, \circ \, {n} }(Y_1), \quad X_{n+1} = h^{\, \circ \, {n} }(X_1).\end{aligned}
[/latex]

Wir zeigen nun mittels vollständiger Induktion, dass
[latex]
\begin{aligned}[]\label{eq:einf-csb-abfallende Folge von Teilmengen} X_1 \supseteq Y_1 \supseteq X_2 \supseteq Y_2 \supseteq \ldots\end{aligned}
[/latex]
gilt. Für [latex]X_1 \supseteq Y_1 \supseteq X_2[/latex] ist dies Voraussetzung; der Induktionsanfang ist also erledigt. Für den Induktionsschritt nehmen wir an, dass [latex]X_1 \supseteq Y_1 \supseteq \ldots \supseteq Y_{n-1} \supseteq X_n[/latex] für [latex]n \geq 2[/latex] schon bewiesen ist. Wenden wir auf [latex]X_{n-1} \supseteq Y_{n-1} \supseteq X_n[/latex] die Abbildung [latex]h[/latex] an, so erhalten wir

[latex]
\begin{aligned}[]h(X_{n-1}) = X_n \supseteq h(Y_{n-1}) = Y_{n} \supseteq h(X_n) = X_{n+1}\end{aligned}
[/latex]

womit Gleichung (1.8) mittels vollständiger Induktion gezeigt ist.

Wir definieren des Weiteren die Mengen

[latex]
\begin{aligned}[]B_n = X_n \setminus Y_n,\quad K_n = Y_n \setminus X_{n+1}\end{aligned}
[/latex]

für jede natürliche Zahl [latex]n[/latex], wobei «[latex]B[/latex]» für «bewegt» und «[latex]K[/latex]» für «konstant» steht. Für zwei natürliche Zahlen [latex]m,n[/latex] mit [latex]1\leq m 1.8), dass

[latex]
\begin{aligned}[]X_m \supseteq Y_{m} \supseteq X_{m+1}\supseteq X_n\supseteq Y_n.\end{aligned}
[/latex]

Daher ist [latex]B_m = X_m \setminus Y_m[/latex] disjunkt zu [latex]X_n[/latex] und insbesondere auch disjunkt zu [latex]B_n = X_n \setminus Y_n[/latex] und [latex]K_n=Y_n\setminus X_{n+1}[/latex]. Genauso zeigt man, dass [latex]K_m=Y_{m}\setminus X_{m+1}[/latex] disjunkt zu [latex]B_n[/latex] und [latex]K_n[/latex] ist.

Da [latex]h[/latex] injektiv ist, gilt
[latex]
\begin{aligned}[]\label{eq:einf-csb2-eq1} h(B_n) = h(X_n \setminus Y_n) = h(X_n) \setminus h(Y_n) = X_{n+1}\setminus Y_{n+1} = B_{n+1}\end{aligned}
[/latex]
für alle natürlichen Zahlen [latex]n[/latex] nach Übung 1.46. (Stellen Sie sicher, dass Sie verstehen, wo und wie die Injektivität von [latex]h[/latex] hier verwendet wurde.)

image

Abbildung 1.12 – Illustration der Abbildung [latex]F[/latex] und der Mengen [latex]B_k[/latex] für [latex]k \in \mathbb {N}[/latex].

Schlussendlich definieren wir

[latex]
\begin{aligned}[]K_\infty = X_1 \setminus \bigcup _{n=1}^\infty (B_n\cup K_n),\end{aligned}
[/latex]

womit [latex]B_1,B_2,\ldots[/latex] und [latex]K_1,K_2,\ldots[/latex] gemeinsam mit [latex]K_\infty[/latex] eine Partition [latex]\mathcal {P}[/latex] von [latex]X_1[/latex] definieren. Mittels Fallunterscheidung definieren wir nun eine Funktion

[latex]
\begin{aligned}[]F: X_1 = K_\infty \sqcup \bigsqcup _{n=1}^\infty K_n \sqcup \bigsqcup _{n=1}^\infty B_n \to Y_1 = K_\infty \sqcup \bigsqcup _{n=1}^\infty K_n \sqcup \bigsqcup _{n=2}^\infty B_n\end{aligned}
[/latex]

durch

[latex]
\begin{aligned}[]F(x) = \left \lbrace \begin{array}{cl} h(x) & \text {falls }x\in B_n\text { für ein }n\in \mathbb {N}, \\ x & \text {falls }x\in K_n\text { für ein }n\in \mathbb {N} \text { oder } x\in K_\infty \\ \end{array} \right .\end{aligned}
[/latex]

für alle [latex]x \in X_1[/latex]. Es bleibt noch zu zeigen, dass [latex]F[/latex] bijektiv ist.

Zur Surjektivität: Per Definition ist [latex]K_\infty = F(K_\infty ) \subseteq F(X_1)[/latex] und [latex]K_n = F(K_n) \subseteq F(X_1)[/latex] für alle [latex]n[/latex]. Weiter gilt nach Gleichung (1.9) auch [latex]B_{n+1} = h(B_n) = F(B_n) \subseteq F(X_1)[/latex] für alle [latex]n[/latex] und damit ist ebenso [latex]Y_1 = K_1\cup K_2\cup \ldots \cup K_\infty \cup B_2 \cup B_3 \cup B_4 \cup \ldots \subseteq F(X_1)[/latex]. Wir sehen also, dass [latex]F[/latex] surjektiv ist.

Zur Injektivität: Seien [latex]x,y \in X_1[/latex] mit [latex]F(x) = F(y)[/latex]. Da in der Liste [latex]F(K_1)[/latex], [latex]F(K_2)[/latex], …, [latex]F(K_\infty )[/latex], [latex]F(B_1)[/latex], [latex]F(B_2)[/latex], …die Mengen paarweise disjunkt sind, müssen [latex]x[/latex] und [latex]y[/latex] in der gleichen Menge der Partition [latex]\mathcal {P}[/latex] liegen. Falls jene Menge [latex]K_\infty[/latex] oder [latex]K_n[/latex] für ein [latex]n[/latex] ist, so gilt [latex]x = y[/latex]. Ansonsten ist [latex]h(x) = F(x) = F(y) = h(y)[/latex] und die Gleichheit [latex]x=y[/latex] folgt aus der Injektivität von [latex]h[/latex]. ∎

Übung 1.82: Verbindung zu Hilberts Hotel

Erklären Sie intuitiv, wo die Parallelen in obigem Beweis von Theorem 1.81 zu Hilberts Hotel sind. Fassen Sie dazu den Beweis in einigen wenigen Sätzen anhand des Bildes 1.12 oder dem folgenden Applet zusammen.

Applet 1.83: Beweis des Satzes von Cantor-Schröder-Bernstein

Im Beweis von Theorem 1.81 wird die Menge [latex]X[/latex] in zwei Typen von Teilmengen zerlegt. Die konstruierte Funktion wird angedeutet, indem Bild (und Urbilder) von einem bewegbaren Punkt [latex]x\in X[/latex] eingezeichnet werden.

Wie schon erwähnt wurde, ist der Begriff der Gleichmächtigkeit eine Äquivalenzrelation auf der Klasse der Mengen.

Definition 1.84: Kardinalität einer Menge

Die zu einer Menge [latex]X[/latex] gehörenden Äquivalenzklasse bezüglich Gleichmächtigkeit wird die Kardinalität der Menge [latex]X[/latex] genannt und als [latex]|X|[/latex] geschrieben. Falls [latex]X[/latex] endlich ist und genau [latex]n[/latex] verschiedene Elemente hat, dann schreiben wir [latex]|X| = n[/latex]. Eine Menge heisst abzählbar unendlich, falls sie die Kardinalität [latex]|\mathbb {N}|[/latex] hat oder in anderen Worten gleichmächtig zu [latex]\mathbb {N}[/latex] ist. Die Kardinalität von [latex]\mathbb {N}[/latex] wird auch [latex]\aleph _0[/latex], gesprochen Aleph-[latex]0[/latex], genannt.

Übung 1.85: Gitterpunkte in der Ebene

Zeigen Sie, dass [latex]\mathbb {N} \times \mathbb {N}[/latex] abzählbar unendlich ist. Sie können hierzu Theorem 1.81 verwenden: Eine Injektion [latex]\mathbb {N} \times \mathbb {N} \to \mathbb {N}[/latex] finden Sie unter Verwendung der Tatsache, dass unendlich viele Primzahlen existieren. Alternativ lässt sich mit Hilfe eines Bildes tatsächlich eine explizite Bijektion [latex]\mathbb {N} \to \mathbb {N} \times \mathbb {N}[/latex] finden, wie? Zeigen Sie auch, dass das Produkt [latex]\mathbb {Z} \times \mathbb {Z}[/latex] abzählbar unendlich ist.

Wie bereits erwähnt, kann man mit Hilfe des Begriffes der Schmächtigkeit Grössenver­gleiche zwischen Kardinalitäten anstellen. Für uns ist aber abgesehen vom endlichen und abzählbar unendlichen Fall nur folgender Spezialfall interessant:

Definition 1.86: Das Kontinuum

Eine Menge [latex]X[/latex] heisst überabzählbar, falls [latex]\mathbb {N}[/latex] schmächtiger ist als [latex]X[/latex], aber [latex]\mathbb {N}[/latex] nicht gleichmächtig zu [latex]X[/latex] ist. Nach Theorem 1.74 ist [latex]\mathcal {P}(\mathbb {N})[/latex] überabzählbar. Die Kardinalität von [latex]\mathcal {P}(\mathbb {N})[/latex] wird auch mit [latex]\mathfrak {c}[/latex] bezeichnet und das Kontinuum genannt.

Übung 1.87: Trichotomie der Kardinalitäten

  1. Zeigen Sie, dass jede Menge entweder endlich, abzählbar unendlich oder überabzählbar ist. Gehen Sie dazu davon aus, dass [latex]X[/latex] eine nicht-endliche Menge ist und finden Sie eine injektive Abbildung [latex]\mathbb {N} \to X[/latex].
  2. Zeigen Sie, dass es unendlich viele überabzählbare Kardinalitäten gibt.

Bemerkung

Im Beweis von Übung 1.87 werden Sie wahrscheinlich abzählbar oft eine Wahl treffen müssen. Formal verwendet dies das sogenannte Auswahlaxiom der Mengenlehre (Axiom of Choice), welches wir implizit erlauben werden.

1.5 – Zahlenmengen

«Die natürlichen Zahlen hat der liebe Gott gemacht,
alles andere ist Menschenwerk.»

leicht adaptiert nach Kronecker (1823-1891)

In diesem Abschnitt diskutieren wir wahrscheinlich schon bekannte Zahlenmengen. Wir gehen zuerst auf die natürlichen Zahlen ein. Formal sind die natürlichen Zahlen durch folgendes (wirklich minimales) Axiomensystem definiert.

Peano Axiome

Die natürlichen Zahlen [latex]\mathbb {N}[/latex] sind (in einem gewissen Sinne eindeutig) durch die folgenden Eigenschaften charakterisiert:

  1. Es existiert ein ausgezeichnetes Element [latex]1 \in \mathbb {N}[/latex] und eine injektive Abbildung [latex]\nu : \mathbb {N} \to \mathbb {N}[/latex], auch Nachfolgerfunktion genannt, so dass [latex]1 \not \in \nu (\mathbb {N})[/latex].
  2. [latex]\mathbb {N}[/latex] erfüllt das Induktionsaxiom: Ist [latex]A[/latex] eine Teilmenge von [latex]\mathbb {N}[/latex], die [latex]1[/latex] enthält und für alle [latex]n\in \mathbb {N}[/latex] die Eigenschaft » [latex]n \in A \implies \nu (n) \in A[/latex]» erfüllt, dann gilt [latex]A = \mathbb {N}[/latex].

Die Nachfolgerfunktion [latex]\nu[/latex] sollte man sich als die Abbildung [latex]n \in \mathbb {N} \mapsto n+1 \in \mathbb {N}[/latex] vorstellen, nur kennt man die Addition auf [latex]\mathbb {N}[/latex] noch nicht. Neben der Addition zweier natürlichen Zahlen kann man sich bei allen anderen Eigenschaften der natürlichen Zahlen, die man intuitiv kennt, fragen, wie sie zu definieren oder zu beweisen sind. Für eine detailliertere Diskussion dieser Frage verweisen wir auf [9]; wir möchten jedoch an einem elementaren Beispiel demonstrieren, wie man das Induktionsaxiom verwenden kann.

Behauptung: Nachfolgerzahlen

Sei [latex]n \in \mathbb {N}[/latex] eine natürliche Zahl verschieden von [latex]1[/latex]. Dann ist [latex]n \in \nu (\mathbb {N})[/latex].

Beweis

Wir betrachten die Menge [latex]A= \nu (\mathbb {N})\cup \left \lbrace {1} \right \rbrace[/latex]. Dann gilt [latex]1 \in A[/latex] per Definition und für [latex]n \in A \subseteq \mathbb {N}[/latex] gilt [latex]\nu (n) \in A[/latex] wieder per Definition von [latex]A[/latex]. Nach dem Induktionsaxiom ist also [latex]A = \mathbb {N}[/latex] und die Behauptung folgt. ∎

Man kann ausgehend von den Peano-Axiomen sowohl Addition und Multiplikation mittels vollständiger Induktion (oder äquivalenterweise mittels Rekursion) definieren. Wir werden im Folgenden wieder von diesem Abstraktionslevel Abstand nehmen und davon ausgehen, dass wir die üblichen Eigenschaften der natürlichen Zahlen inklusive Addition und Multiplikation kennen und dass [latex]\mathbb {N} = \left \lbrace {1,2,3,4,\ldots } \right \rbrace[/latex] (unter Verwendung der Axiome definiert man [latex]2[/latex] als [latex]\nu (1)[/latex], [latex]3[/latex] als [latex]\nu (2)[/latex] und so weiter). Dass die natürlichen Zahlen wirklich «natürlich» sind, kann man sicherlich auf viele Arten belegen. Wie bereits besprochen, repräsentieren sie genau die Kardinalitäten aller endlichen nicht-leeren Mengen, was für die Menschheit schon lange von Bedeutung war.

Manchmal wollen wir vielleicht Abzählungen bei Null beginnen lassen und definieren deswegen (vergleiche Beispiel 1.88) unter Verwendung eines zusätzlichen Elements [latex]0[/latex] die Menge der nicht-negativen ganzen Zahlen als

[latex]
\begin{aligned}[]\mathbb {N}_0 = \left \lbrace {0,1,2,3,\ldots } \right \rbrace = \left \lbrace {0} \right \rbrace \sqcup \mathbb {N} .\end{aligned}
[/latex]

Die Zahl [latex]0[/latex] soll natürlich die üblichen Eigenschaften bezüglich Addition und Multiplikation erfüllen.[10] Die ganzen Zahlen sind durch

[latex]
\begin{aligned}[]\mathbb {Z} = \left \lbrace {\ldots ,-3,-2,-1,0,1,2,3,\ldots } \right \rbrace = \mathbb {N} \sqcup \left \lbrace {0} \right \rbrace \sqcup \left \lbrace {-n} \mid {n\in \mathbb {N}}\right \rbrace\end{aligned}
[/latex]

definiert. Die rationalen Zahlen sind gegeben durch

[latex]
\begin{aligned}[]\mathbb {Q} = \left \lbrace {\frac {m}{n}} \mid {m \in \mathbb {Z},\ n \in \mathbb {N}}\right \rbrace\end{aligned}
[/latex]

und die reellen Zahlen werden mit [latex]\mathbb {R}[/latex] bezeichnet und enthalten [latex]\mathbb {Q}[/latex] und viele weitere Zahlen wie zum Beispiel [latex]\sqrt {2}[/latex], [latex]\pi[/latex], [latex]\mathrm {e}[/latex], ….[11] Häufig stellt man sich [latex]\mathbb {R}[/latex] als die Zahlengerade vor. Wir werden in Kapitel 2 die Menge der reellen Zahlen [latex]\mathbb {R}[/latex] axiomatisch einführen und dann die Zahlenmengen [latex]\mathbb {N},\mathbb {Z},\mathbb {Q}[/latex] als Teilmengen von [latex]\mathbb {R}[/latex] nochmals ausführlich definieren.

Bemerkung

Eigentlich lautet das Zitat (siehe Seite 15 in [12]) von Kronecker zu Beginn dieses Abschnitts

«Die ganzen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk.»

Es kann jedoch sein, dass Kronecker eigentlich die natürlichen Zahlen gemeint hat. Auf jeden Fall wollen wir hier den Mönch und Historiker William of Malmesbury (ca. 1095-1143), der die ganze Zahl [latex]0[/latex] als «dangerous Saracen magic» bezeichnet hat, als grössere Autorität in dieser Frage ansehen. Scherz beiseite, die Menschheit hat in der Tat sehr lange gebraucht, um mit der Null und den negativen Zahlen zurecht zu kommen. Für einen geschichtlichen Exkurs zur «Zahl [latex]0[/latex]» verweisen wir auf diesen Podcast der BBC, und zum Thema «Negative Zahlen» auf die ersten [latex]10[/latex]–[latex]20[/latex] Minuten eines weiteren Podcasts der BBC.

1.5.1 – Konstruktion der ganzen Zahlen aus den natürlichen Zahlen

In diesem Abschnitt möchten wir die ganzen Zahlen formaler mittels einer Äquivalenzrelation auf Paaren von natürlichen Zahlen konstruieren (in Analogie zu Beispiel 1.65).

Beispiel 1.88: Konstruktion der Menge der ganzen Zahlen

Wir nehmen an, dass wir bereits die Menge der nicht-negativen ganzen Zahlen [latex]\mathbb {N}_0 = \left \lbrace {0,1,2,3,4,\ldots } \right \rbrace[/latex] und die Addition auf [latex]\mathbb {N}_0[/latex] mit allen üblichen Eigenschaften kennen und wollen daraus die ganzen Zahlen definieren. Dazu betrachten wir eine Äquivalenzrelation auf [latex]\mathbb {N}_0^2[/latex]: für [latex](m_1,m_2),(n_1,n_2)\in \mathbb {N}_0^2[/latex] definieren wir
[latex]
\begin{aligned}[]\label{eq:einf-Z aus N 1} (m_1,m_2) \sim (n_1,n_2) \iff m_1+n_2 = n_1 + m_2\end{aligned}
[/latex]
Motiviert ist das ganze dadurch, dass man eine ganze Zahl als Differenz von zwei nicht-negativen ganzen Zahlen auffassen kann. Diese sind aber nicht eindeutig gegeben; deswegen führt man auf Tupeln von natürlichen Zahlen obige Äquivalenzrelation ein. In der Tat hat man bei Definition (1.10) eigentlich [latex](m_1,m_2) \sim (n_1,n_2) \iff m_1-m_2 = n_1 -n_2[/latex] im Hinterkopf, darf dies aber formal nicht verwenden, da die Subtraktion (noch) nicht erlaubt ist. Wenn wir über [latex][(m_1,m_2)]_\sim[/latex] sprechen, werden wir leicht schizophren an [latex]m_1-m_2[/latex] denken, dies aber nicht verwenden.

Informell können wir uns das Tupel [latex](m_1,m_2)[/latex] als einen Vektor mit Anfangspunkt [latex]m_1 \in \mathbb {N}_0[/latex] und Endpunkt [latex]m_2 \in \mathbb {N}_0[/latex] vorstellen, womit die Äquivalenzklassen allen Vektoren mit gleicher Länge und Richtung entspricht. Alternativ könnte [latex]m_1[/latex] der Kontostand vor und [latex]m_2[/latex] der Kontostand nach einer Transaktion darstellen und die Äquivalenzklasse entspricht dann dem Nettogewinn/-verlust.

Wir verifizieren nun, dass es sich bei [latex]\sim[/latex] effektiv um eine Äquivalenzrelation handelt. Es gilt für alle [latex](m_1,m_2),(n_1,n_2),(q_1,q_2) \in \mathbb {N}_0^2[/latex]

  • Reflexivität: [latex](m_1,m_2)\sim (m_1,m_2)[/latex], denn [latex]m_1+m_2 = m_1+m_2[/latex].
  • Symmetrie: [latex](m_1,m_2) \sim (n_1,n_2)[/latex] denn [latex]m_1+n_2 = n_1+m_2[/latex] impliziert [latex]n_1+m_2 = m_1+n_2[/latex] und daher auch [latex](n_1,n_2) \sim (m_1,m_2)[/latex].
  • Transitivität: [latex](m_1,m_2) \sim (n_1,n_2)[/latex] und [latex](n_1,n_2) \sim (q_1,q_2)[/latex] impliziert [latex]m_1+n_2 = n_1 + m_2[/latex] und [latex]n_1+q_2 = q_1 + n_2[/latex]. Durch Summieren dieser Gleichungen ergibt sich
    [latex]
    \begin{aligned}[]m_1+n_2 + n_1+q_2 = n_1 + m_2 + q_1 + n_2\end{aligned}
    [/latex]

    und durch Wegstreichen von [latex]n_1+n_2[/latex] (was eine der Eigenschaften von [latex]\mathbb {N}_0[/latex] ist und nicht die Subtraktion verwendet) erhalten wir [latex]m_1+q_2 = q_1+m_2[/latex], also [latex](m_1,m_2) \sim (q_1,q_2)[/latex]

Der Quotient [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {N}_0^2}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{\mathbb {N}_0^2}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{\mathbb {N}_0^2}\, /{\sim } } {{\mathbb {N}_0^2}\, /{\sim } }[/latex] kann als Definition von [latex]\mathbb {Z}[/latex] angesehen werden, wobei wir die Äquivalenz­kla­sse auch als [latex][(m_1,m_2)]_\sim = m_2-m_1[/latex] schreiben. Insbesondere identifizieren wir [latex]n \in \mathbb {N}_0[/latex] mit [latex][(n,0)]_\sim[/latex] und schreiben [latex][(0,n)]_\sim[/latex] auch als [latex]0-n = -n[/latex] für [latex]n \in \mathbb {N}[/latex]. Dies macht nach folgender Übung Sinn.

Genau wie in Beispiel 1.65 und der nachfolgenden Übung 1.66 lässt sich auf [latex]\mathbb {Z}[/latex] mit Hilfe der gegebenen Eigenschaften von [latex]\mathbb {N}_0[/latex] weitere Strukturen definieren.

Übung 1.89: Eine Partition der ganzen Zahlen

  1. Zeigen Sie, dass die Abbildungen
    [latex]
    \begin{aligned}[]\iota _+: n \in \mathbb {N}_0 &\mapsto [(n,0)]_\sim \in \mathbb {Z} \\ \iota _-: n \in \mathbb {N} &\mapsto -n = [(0,n)]_\sim \in \mathbb {Z}\end{aligned}
    [/latex]

    injektiv sind und disjunkte Bilder [latex]\iota _+(\mathbb {N}_0),\iota _-(\mathbb {N})[/latex] haben, welche wir mit [latex]\mathbb {N}_0=\iota _+(\mathbb {N}_0)[/latex] und [latex]-\mathbb {N}=\iota _-(\mathbb {N})[/latex] bezeichnen werden.

  2. Zeigen Sie, dass [latex]\mathbb {Z} = \mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {N}_0^2}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{\mathbb {N}_0^2}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{\mathbb {N}_0^2}\, /{\sim } } {{\mathbb {N}_0^2}\, /{\sim } } = \iota _+(\mathbb {N}_0) \sqcup \iota _-(\mathbb {N})[/latex] gilt.

Übung 1.90: Addition von ganzen Zahlen

  1. Zeigen Sie, dass die Funktion [latex]f_{\text {neg}}: \mathbb {Z} = \mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {N}_0^2}$}\big /\lower 0.4ex\hbox {${\sim }$}}} {{\mathbb {N}_0^2}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\sim }$} } {{\mathbb {N}_0^2}\, /{\sim } } {{\mathbb {N}_0^2}\, /{\sim } } \to \mathbb {Z}[/latex] definiert durch
    [latex]
    \begin{aligned}[]f_{\text {neg}}([(m_1,m_2)]_\sim ) = [(m_2,m_1)]_\sim\end{aligned}
    [/latex]

    für [latex](m_1,m_2) \in \mathbb {N}_0^2[/latex] wohldefiniert und bijektiv ist. Was ist das Bild von [latex]\iota _+(\mathbb {N}_0)[/latex] und von [latex]\iota _-(\mathbb {N})[/latex] unter dieser Abbildung?

  2. Zeigen Sie, dass die Funktion
    [latex]
    \begin{aligned}[]f_{\text {add}}: \mathbb {Z}^2 \to \mathbb {Z},\quad ( [(m_1,m_2)]_\sim , [(n_1,n_2)]_\sim ) \mapsto [(m_1+ n_1,m_2+ n_2)]_\sim\end{aligned}
    [/latex]

    wohldefiniert ist. Verifizieren Sie, dass für jedes [latex]z \in \mathbb {Z}[/latex] gilt [latex]f_{\text {add}}(z,f_{\text {neg}}(z)) = [(0,0)]_\sim[/latex].

  3. Finden und definieren Sie weitere natürliche Abbildungen [latex]\mathbb {Z} \to \mathbb {Z}[/latex] oder [latex]\mathbb {Z}^2 \to \mathbb {Z}[/latex].

Wir haben also die Menge der ganzen Zahlen [latex]\mathbb {Z}[/latex] aus den natürlichen Zahlen [latex]\mathbb {N}[/latex] und die Menge der rationalen Zahlen [latex]\mathbb {Q}[/latex] aus den ganzen Zahlen konstruiert, auf der wiederum die üblichen Rechenregeln gelten. Des Weiteren kann man aus [latex]\mathbb {Q}[/latex] die reellen Zahlen [latex]\mathbb {R}[/latex] konstruieren. Wir wollen dies jedoch erst im zweiten Semester durchführen und stattdessen die reellen Zahlen mittels ihren Axiomen im nächsten Kapitel einführen.

1.5.2 – Teilbarkeit und Kongruenzen

Nachdem wir oben die Zahlenmengen [latex]\mathbb {N},\mathbb {N}_0,\mathbb {Z},\mathbb {Q},\mathbb {R}[/latex] eingeführt haben, möchten wir in diesem Abschnitt die etwas verschiedene, «endlichen Zahlenmengen» [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q\mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q\mathbb {Z}}$} } {{\mathbb {Z}}\, /{q\mathbb {Z}} } {{\mathbb {Z}}\, /{q\mathbb {Z}} }[/latex] zu [latex]q \in \mathbb {N}[/latex] einführen.

Definition 1.91: Teilbarkeit und Kongruenz

Seien [latex]a,b\in \mathbb {Z}[/latex]. Wir sagen, dass [latex]b[/latex] durch [latex]a[/latex] teilbar ist, und schreiben [latex]a|b[/latex], falls ein [latex]k \in \mathbb {Z}[/latex] existiert mit [latex]ak = b[/latex]. Des Weiteren sind [latex]a[/latex] und [latex]b[/latex] kongruent modulo [latex]q\in \mathbb {N}[/latex], falls [latex]b-a[/latex] durch [latex]q[/latex] teilbar ist. In diesem Fall schreiben wir

[latex]
\begin{aligned}[]a \equiv b \mod q.\end{aligned}
[/latex]

Tatsächlich definiert Kongruenz modulo [latex]q[/latex] eine Äquivalenzrelation [latex]\equiv[/latex] (siehe Übung 1.93). Den Quotienten [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${\equiv }$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${\equiv }$} } {{\mathbb {Z}}\, /{\equiv } } {{\mathbb {Z}}\, /{\equiv } }[/latex] bezeichnet man meist als [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }[/latex] und die Äquivalenzklasse [latex][a]_\sim \in \mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }[/latex] ist für [latex]a\in \mathbb {Z}[/latex] durch [latex]a + q\mathbb {Z}[/latex] gegeben. Genau wie die Zahlenmengen, die wir bereits kennen, verfügt die Menge [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }[/latex] über zusätzliche Struktur wie Addition und Multiplikation.

Applet 1.92: Darstellung des Quotienten modulo Kongruenz

Wir stellen in diesem Applet den Quotienten [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }[/latex] (für verschiedene Werte von [latex]q[/latex]) dar. Es macht Sinn sich die Punkte [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }[/latex] entlang eines Kreises vorzustellen, doch hat dies formal (vorerst) keine Bedeutung.

Übung 1.93: Eigenschaften der Kongruenz

  1. Zeigen Sie, dass Kongruenz modulo [latex]q[/latex] eine Äquivalenzrelation [latex]\equiv[/latex] auf [latex]\mathbb {Z}[/latex] darstellt.
  2. Zeigen Sie, dass die Abbildungen
    [latex]
    \begin{aligned}[](a+ q \mathbb {Z}, b+ q \mathbb {Z}) \in \big ( \mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } \big )^2 &\mapsto (a+b)+ q \mathbb {Z} \in \mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } \\ (a+ q \mathbb {Z}, b+ q \mathbb {Z}) \in \big ( \mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } \big )^2 &\mapsto (a\cdot b)+ q \mathbb {Z} \in \mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }\end{aligned}
    [/latex]

    wohldefiniert sind (man vergleiche auch mit Übung 1.90).

Wie wir später sehen werden, ist [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }[/latex] tatsächlich eine endliche Menge (mit Kardinalität [latex]q[/latex]), auf der man ebenso gut rechnen kann, wie beispielsweise auf [latex]\mathbb {Z}[/latex]. Grund dafür ist die Division mit Rest, die wir in Kapitel 2 im Detail besprechen werden. Unter anderem wegen dieser Endlichkeit ist [latex]\mathchoice {\text {\raise 0.4ex\hbox {${\mathbb {Z}}$}\big /\lower 0.4ex\hbox {${q \mathbb {Z}}$}}} {{\mathbb {Z}}/\text {\hspace {-0.3ex}\vspace {-0.5ex}${q \mathbb {Z}}$} } {{\mathbb {Z}}\, /{q \mathbb {Z}} } {{\mathbb {Z}}\, /{q \mathbb {Z}} }[/latex] in vielen Gebieten der Mathematik, aber auch beispielsweise in der Informatik von grosser Nützlichkeit.

1.6 – Beweise

Die Mathematik hat als eine von wenigen Wissenschaften die Eigenschaft, dass alle Resultate der Vergangenheit (abgesehen von menschlichen Fehlern und gewissen Perioden, in denen wieder nach der korrekten Methode gesucht wurde) nach wie vor richtig sind (und nicht bloss in erster Näherung). Das Erfolgsrezept dafür liegt im Aufbau der Mathematik. Das Fundament bilden die Axiome (beispielsweise jene der Mengenlehre oder die Peano-Axiome), die als bekannt und richtig angenommen werden. Mittels Definitionen werden neue Begriffe eingeführt und mittels Lemmata und Propositionen untersucht und in Verbindung zueinander gebracht, bis aus diesen Sätze und Theoreme bewiesen werden können. Selbstverständlich kann man bezweifeln, ob die so entstandenen Theorien interessant oder relevant sind. Über Interessen lässt sich natürlich streiten. Dennoch ist die Relevanz der heutigen mathematischen Theorien in vielen anderen Bereichen schwer zu bestreiten und dies obwohl wir in der Mathematik beispielsweise die [latex]0[/latex] und die Zahl [latex]10^{-10^{80}}[/latex] (mit so vielen Nullen nach dem Komma wie nach derzeitigen Schätzungen Atome im Weltall) strikt unterscheiden. Zu diesem Thema möchten wir dieses Video, basierend auf dem lesenswerten Artikel «The unreasonable effectiveness of mathematics in the natural sciences» von Eugene Wigner, empfehlen. In eine ähnliche Richtung geht das für ein allgemeines Publikum gedachte Video, das die (teilweise überraschende) Nützlichkeit der Mathematik in anderen Naturwissenschaften besonders hervorhebt.

Wir möchten an dieser Stelle einige Bemerkungen zu Beweisen machen. Ein Beweis, wie der Name schon sagt, soll die behauptete Aussage unter Verwendung von einfachen logischen Schritten aus vorher Bekanntem (zum Beispiel Axiomen) ableiten. Es gibt dafür einige Methoden, die wir zum Teil schon angewendet haben und die unter anderem auch verknüpft werden können.

Manche von Ihnen werden sich fragen, warum wir in dieser Vorlesung immer «diese Beweise» besprechen müssen. Diese Frage lässt sich vielleicht mit der Frage an einen Physik-Professor vergleichen, wieso denn immer so viele Experimente durchgeführt werden müssen. Beweise sind im Aufbau der Mathematik unersetzlich. Selbst wenn Sie die hier entwickelte Theorie später möglicherweise nicht in der hier verwendeten Exaktheit und Genauigkeit benötigen, werden Sie bei aktiver Mitarbeit abstraktes Denken erlernen, welches für die Mathematik aber auch für andere Wissenschaften und in der Praxis äusserst nützlich sein wird.

1.6.1 – Widerspruchsbeweise

Angenommen wir wollen eine Aussage [latex]A[/latex] beweisen. Dann ist es manchmal einfacher zu zeigen, dass [latex]\neg A[/latex] nicht sein kann, also zu einem Widerspruch führt, als direkt [latex]A[/latex] zu zeigen. Wir haben dafür schon ein Beispiel im Beweis von Theorem 1.74 gesehen, wo wir die Nicht-Existenz eines gewissen Objekts (dort einer Abbildung) behauptet haben. Wir nennen [latex]\neg A[/latex] die indirekte Annahme und den Beweis einen Widerspruchsbeweis. Man spricht auch vom «Satz vom ausgeschlossenen Dritten» , da entweder [latex]A[/latex] oder [latex]\neg A[/latex] gelten muss und es keine dritte Möglichkeit gibt.[13]

1.6.2 – Kontraposition

Sind [latex]A,B[/latex] zwei Aussagen, dann sind die Aussagen [latex]A\implies B[/latex] und [latex]\neg B \implies \neg A[/latex] äquivalent. Die Aussage [latex]\neg B \implies \neg A[/latex] wird die Kontraposition der Aussage [latex]A \implies B[/latex] genannt. Wie man sich dies in einem Beweis zunutze machen kann, wollen wir in einem Beispiel illustrieren.

Beispiel 1.94: Überdeckungen mit Dreiecken

Folgendes Beispiel entstammt dem Buch von Blatter [14](Kapitel 1, Seite 6).

Sei [latex]D[/latex] das gleichseitige Dreieck mit Kantenlänge [latex]2[/latex] und sei [latex]a[/latex] eine Zahl kleiner als [latex]2[/latex]. Wir betrachten folgende Aussagen:

[latex]A(a)[/latex]: [latex]D[/latex] lässt sich mit [latex]4[/latex] gleichseitigen Dreiecken der Kantenlänge [latex]a[/latex] überdecken.

[latex]B(a)[/latex]: [latex]D[/latex] lässt sich mit [latex]5[/latex] gleichseitigen Dreiecken der Kantenlänge [latex]a[/latex] überdecken.

Bei einer Überdeckung durch Dreiecke sind auch Überlappungen erlaubt. Wir behaupten nun, dass

[latex]
\begin{aligned}[]\forall a>0: A(a) \iff B(a)\end{aligned}
[/latex]

gilt. Auf Grund deren Definitionen impliziert die Aussage [latex]A(a)[/latex] die Aussage [latex]B(a)[/latex]; in Symbolen [latex]A(a) \implies B(a)[/latex]. Wir fixieren [latex]a>0[/latex] und beweisen nun die Implikation [latex]B(a) \implies A(a)[/latex], in dem wir die Kontraposition [latex]\neg A(a) \implies \neg B(a)[/latex] beweisen. Wir nehmen [latex]\neg A(a)[/latex] an, also dass sich [latex]D[/latex] nicht mit [latex]4[/latex] gleichseitigen Dreiecken überdecken lässt. Dann muss [latex]a

image

Gegeben eine Überdeckung von [latex]D[/latex] durch Dreiecke der Seitenlänge [latex]a[/latex], dann müssen die in obiger Grafik erhaltenen [latex]6[/latex] Punkte (unten in rot markiert)

image

in jeweils verschiedenen gleichseitigen Dreiecken der Kantenlänge [latex]a[/latex] enthalten sein, da wir bereits erkannt haben, dass die Kantenlänge [latex]a[/latex] kleiner als [latex]1[/latex] ist. Insbesondere sind mindestens [latex]6[/latex] solche Dreiecke notwendig, um [latex]D[/latex] zu überdecken; also gilt [latex]\neg B(a)[/latex].

1.6.3 – Induktionsbeweise

Wir haben die Beweismethode der vollständigen Induktion schon im Beweis von Lemma 1.3 gesehen (und wissen jetzt, dass diese Methode genau einem definierenden Axiom von [latex]\mathbb {N}[/latex] entspricht). Diese wird verwendet, um eine Aussage [latex]A(n)[/latex] für alle natürlichen Zahlen [latex]n[/latex] zu zeigen. Der Induktionsbeweis hat zwei wichtige Teilschritte:

  • Induktionsanfang (oder Induktionsverankerung): Man zeigt die Aussage [latex]A(1)[/latex].
  • Induktionsschritt: Man zeigt, dass [latex]A(n) \implies A(n+1)[/latex] für alle natürlichen Zahlen [latex]n[/latex] gilt.

Man kann einen Beweis mit vollständiger Induktion mit einem rekursiven Algorithmus vergleichen, der die Aussage für alle natürlichen Zahlen beweist: Wenn man wissen will, warum die Aussage für [latex]n=10[/latex] stimmt, dann zeigt der Induktionsschritt, dass die Aussage stimmt, weil sie schon für [latex]n=9[/latex] richtig ist. Die Aussage für [latex]n=9[/latex] stimmt wiederum, weil sie für [latex]n=8[/latex] stimmt und so weiter bis man bei [latex]n=1[/latex] angelangt ist. Der Fall [latex]n=1[/latex] verankert (daher «Induktionsverankerung» ) die Rekursion und den Beweis, da wir diesen Fall direkt und ohne Annahme einer anderen, noch zu verifizierenden Aussage überprüfen. Im nächsten Kapitel werden wir weitere Varianten des Induktionsbeweises kennenlernen.

Übung 1.95: Gauss’sche Summationsformel

Zeigen Sie mittels vollständiger Induktion, dass für jede natürliche Zahl [latex]n \geq 1[/latex] gilt

[latex]
\begin{aligned}[]1+2+\cdots +(n-1) + n = \frac {n(n+1)}{2}\end{aligned}
[/latex]

Wir möchten auch etwas «geometrischere» Probleme behandeln.

Beispiel 1.96: Eine geometrische Induktion

Sei [latex]n[/latex] eine natürliche Zahl. Wir betrachten das Quadrat mit Kantenlänge [latex]2^n[/latex], aus dem ein kleines Quadrat der Kantenlänge [latex]1[/latex] entfernt wurde.

image

Bei diesen beiden Quadraten und auch bei allen noch zu erscheinenden Konstrukten möchten wir nur Ecken an ganzzahligen Stellen (d.h. in [latex]\mathbb {Z}^2[/latex]) zulassen. Wir behaupten nun, dass sich das obige «Quadrat mit Loch» durch Objekte der Art (rotieren ist erlaubt)

image

abdecken lässt und beweisen dies per Induktion über [latex]n[/latex]. Zum Induktionsanfang [latex]n=1[/latex]: Das grössere Quadrat hat Kantenlänge [latex]2[/latex], also ist das Bild

image

und die Aussage stimmt. Angenommen wir wissen, dass die Behauptung für [latex]n[/latex] korrekt ist. Wir zerlegen das Quadrat mit Kantenlänge [latex]2^{n+1}[/latex] in [latex]4[/latex] Quadrate der Kantenlänge [latex]2^n[/latex] und entfernen aus einem dieser Quadrate ein kleines Quadrat der Kantenlänge [latex]1[/latex]. Zusätzlich entfernen wir aus den anderen Quadraten je ein kleines Quadrat wie in folgendem Bild

image

Die [latex]4[/latex] so entstandenen Objekte (Quadrate mit Loch) lassen sich aber jeweils abdecken nach dem Induktionsschritt, also folgt die Behauptung.

Vollständige Induktion ist ein unentbehrliches Hilfsmittel für Beweise in der Mathematik, genauso wie die Rekursion als Programmiermethode in der Informatik. Manchmal hat man jedoch das Gefühl, dass Induktion zwar den Zweck erfüllt (also das Lemma, die Proposition oder den Satz beweist), aber trotzdem nicht erklärt, warum eine Aussage richtig sein soll. Ein Beispiel dazu liefert Lemma 1.3, da wir aus dem Beweis beispielsweise nicht erkennen können, wie wir das Lemma für [latex]1^4 + 2^4 + 3^4 +\cdots +n^4[/latex] verallgemeinern könnten. Vielleicht würden Sie vermuten, dass diese Summe gleich einem Ausdruck der Form [latex]\frac {n^5}{5}+an^4+bn^3+c^2+dn+e[/latex] für gewisse rationale Zahlen [latex]a,b,c,d,e[/latex] ist. Es fragt sich jedoch, wie wir diese Konstanten finden könnten. Die Induktionsmethode ist dabei nicht sehr hilfreich, da sie verwendet werden kann um die Wahrheit zu bestätigen, wenn man sie woanders bereits gefunden hat. Wir werden einen zweiten allgemeineren Beweis von Lemma 1.3 im Abschnitt 3.3 besprechen.

1.6.4 – Das Schubfachprinzip

Mancher Existenzbeweis kann auf das Schubfachprinzip (Proposition 1.71) zurückgeführt werden. Ein Beispiel aus dem Alltag haben wir gleich nach Proposition 1.71 erklärt. Hier möchten wir das Schubfachprinzip an einem mathematischen Beispiel illustrieren.

Beispiel 1.97

Wir betrachten die Abfolge von Zahlen

[latex]
\begin{aligned}[]1,\ 11,\ 111,\ 1111,\ 11111,\ \ldots\end{aligned}
[/latex]

und behaupten, dass es eine davon geben muss, welche durch [latex]17[/latex] teilbar ist. Dazu definieren wir die Menge [latex]R = \left \lbrace {0,\ldots ,16} \right \rbrace[/latex] (die Reste mod [latex]17[/latex]) und die Schubfächer

[latex]
\begin{aligned}[]S_r = \left \lbrace {n\in \mathbb {N}} \mid {n-r \text { ist durch } 17 \text { teilbar}}\right \rbrace\end{aligned}
[/latex]

für [latex]r \in R[/latex]. Nach Division mit Rest muss jede der Zahlen [latex]1,\ 11,\ 111,\ 1111,\ 11111,\ \ldots[/latex] in einem der Schubfächer [latex]S_r[/latex] enthalten sein und es gibt jeweils genau ein solches Schubfach. Da wir aber genau [latex]17[/latex] Schubfächer haben und unendlich viele Zahlen darin verstauen wollen, müssen sicherlich zwei dieser Zahlen im gleichen Schubfach liegen. Formaler betrachtet man die Abbildung

[latex]
\begin{aligned}[]\left \lbrace {1,\ 11,\ 111,\ 1111,\ 11111,\ \ldots } \right \rbrace \to R,\quad x \mapsto r_x\end{aligned}
[/latex]

wobei [latex]r_x \in R[/latex] die eindeutig bestimmte Zahl mit [latex]x \in S_{r_x}[/latex] ist. Wie erwähnt kann diese Abbildung aber nicht injektiv sein. Es gibt also einen Rest [latex]r\in R[/latex] und zwei Zahlen [latex]x,y \in \mathbb {N}[/latex] von der Form [latex]111\ldots 1[/latex] mit [latex]x,y \in S_r[/latex] und [latex]y>x[/latex]. Die Differenz von [latex]x[/latex] und [latex]y[/latex] ist von der Form

[latex]
\begin{aligned}[]y-x = \underbrace {11\ldots 1}_{=a}\underbrace {00\ldots 0}_{n \text { Nullen}} =a \cdot 10^n,\end{aligned}
[/latex]

wobei [latex]a[/latex] in unserer Liste vorkommt und [latex]n\in \mathbb {N}[/latex]. Des Weiteren ist [latex]y-x[/latex] wegen

[latex]
\begin{aligned}[]y-x = (y-r)-(x-r)\end{aligned}
[/latex]

durch [latex]17[/latex] teilbar. Da aber [latex]17[/latex] eine Primzahl ist und weder [latex]10[/latex] noch [latex]10^n[/latex] durch [latex]17[/latex] teilbar ist, ist [latex]a[/latex] durch [latex]17[/latex] teilbar.

Das Schubfachprinzip ist gemeinsam mit vielen Weiterentwicklungen eine sehr verbreitete Beweismethode in der Mathematik. Die allgemeine Einsetzbarkeit hat aber gewissermassen auch einen Preis, denn wenn das Schubfachprinzip für einen Existenzbeweis verwendet wird, so gibt der Beweis meist keinerlei Aufschlüsse wie man denn das Objekt (im Beispiel die konkrete, durch 17 teilbare Zahl) effektiv (also abgesehen von ausprobieren) finden könnte.

1.6.5 – Weitere Methoden

Wir werden noch vielen weiteren Methoden begegnen, die wir hier nicht auflisten möchten. Beispielsweise gibt es Aussagen, die in verschiedenen Fällen einfache (aber verschiedene) Beweise haben. Falls diese Fälle alle Möglichkeiten abdecken, haben wir den Beweis der Aussage mittels Fallunterscheidung erhalten.

Ein anderes Beispiel einer Beweismethode (vor allem aus der Kombinatorik) ist die folgende: Angenommen wir wollen die endliche Kardinalität einer Menge bestimmen. Mit Hilfe einer geschickt gewählten Bijektion von dieser Menge in eine andere kann man dieses Zählproblem an einen Ort transportieren, wo man die Antwort bereits kennt.

Wie oben bereits angedeutet, gibt es mehrere Wünsche, die man an einen Beweis stellen könnte. In erster Linie muss dieser natürlich einen Beweis darstellen, doch könnte man sich auch folgende Punkte wünschen: Der Beweis könnte eine gute Erklärung für die Aussage liefert, könnte Verallgemeinerungen zulassen oder könnte bereits als Anleitung gelesen werden, wie man aus dem Existenzbeweis einen Algorithmus zum Auffinden des gesuchten Objektes erstellen kann. Für all diese Aussagen werden wir viele Beispiele sehen. Das Auffinden eines zweiten Beweises einer Aussage ist zwar logisch gesehen unnötig (und für uns aus Zeitgründen oft nicht möglich), kann aber mitunter diese weiteren Wünsche besser abdecken und insgesamt das Verständnis der Theorie stärken.

1.6.6 – Beweise finden

Sie fragen sich vielleicht bereits, wie man Beweise (wie zum Beispiel für die Übungen) finden kann. Die Antwort ist mit Übung, Hartnäckigkeit und Glück. Des Weiteren empfehlen wir Ihnen, Beweise aus der Vorlesung, diesem Skript oder anderer Literatur aus dem Gedächtnis zu wiederholen. Dadurch bekommen Sie Übung und ein gewisses Gespür für die inneren Mechanismen von Beweisen. Zusätzlich erkennen Sie vielleicht, dass viele Beweise ähnliche Bauformen aufweisen und mancher Beweis, sozusagen durch die Definitionen der involvierten Objekte erzwungen werden. Letzteres können Sie aber nur bemerken, wenn Sie die bereits besprochenen Beweise und Definitionen im Gedächnis haben.

1.6.7 – Beweise aufschreiben

Nachdem Sie die Idee für den Beweis gefunden haben, wollen Sie diesen kommunizieren und aufschreiben. Auch dazu ist (viel) Übung nötig und Sie müssen den Beweis vielleicht umstellen oder komplett neu formulieren, bevor er für andere verständlich wird (was das Ziel sein sollte). Mitunter ist die Reihenfolge der Argumente, wie man sie gefunden hat, möglicherweise komplett anders als die Reihenfolge der Argumente, wie man sie präsentieren sollte. Weiters darf ein Beweis nicht nur aus Formeln bestehen, sondern muss dieser auch die Gedanken enthalten, die diesen Formeln Sinn und Zusammenhang geben. Wir verweisen auf [15]und das Buch «Das ist o.B.d.A. trivial» ([16]) von Beutelspacher für weitere Tipps in diese Richtung.

An dieser Stelle möchten wir noch die Wörter «o.B.d.A.» und «trivial» im obigen Buchtitel kommentieren. Die Abkürzung «o.B.d.A.» steht für «ohne Beschränkung der Allgemeinheit» . Wir verwenden diese, wenn wir den Beweis einer Aussage auf den Beweis eines Spezialfalls reduzieren. Folgendes Beispiel illustriert dies:

Beispiel 1.98: o.B.d.A

Sei [latex]A(n)[/latex] die Aussage [latex]2^{n^2} > n^2[/latex] über ganze Zahlen [latex]n[/latex], die die Eigenschaft [latex]A(n) \iff A(-n)[/latex] für jede ganze Zahl [latex]n[/latex] erfüllt. Wollen wir die Wahrheit der Aussage [latex]A(n)[/latex] nachweisen, so reicht es anzunehmen, dass [latex]n \geq 0[/latex] ist, denn ein mögliches Vorzeichen von [latex]n[/latex] wird von der Funktion [latex]n \in \mathbb {Z} \mapsto n^2 \in \mathbb {Z}[/latex] absorbiert. Wir schreiben zu Beginn des Beweises also «Sei o.B.d.A. [latex]n \geq 0[/latex]» .

Das Wort «trivial» (abgeleitet von lat. «trivium» ) bedeutet «bekannt» oder «allgemein bekannt» und sollte entgegen dem üblichen Gebrauch nicht mit dem Wort «offensichtlich» verwechselt werden. Wenn also «…ist trivial» geschrieben wird, so sollte man dies als Aufforderung verstehen, zu verifizieren, wieso genau die Aussage «bekannt» sein sollte. Dennoch werden wir und sollten Sie auf den Gebrauch dieses Wortes komplett verzichten. Selbiges betrifft Wörter wie

«offensichtlich» , «evident» , «einfach» und «leicht»

oder Phrasen wie

«…ist klar» und «Es ist leicht zu sehen, dass …» .

Grund dafür ist, dass diese Ausdrücke aus Sicht des Lesers als Affront aufgefasst werden können; es liegt nicht an der Verfasserin oder dem Verfasser, die Schwierigkeit einer Aussage zu beurteilen, die sie oder er selbst hingeschrieben hat. Des Weiteren kann man eine (vermeintlich) einfache Aussage oft auch in wenigen Worten erklären.

1.6.8 – Beweise lesen

Ein wichtiger erster Schritt ist die zu beweisende Aussage zu lesen, zu verstehen und zu erkennen, was überhaupt zu beweisen ist. Wenn Sie dann den Beweis lesen, dann sollten Sie jeden Schritt hinterfragen und dabei fast so stur wie ein Computer beim Abarbeiten eines Programms vorgehen. Man kann dazu auch das Motto der Royal Society zitieren:

«Nullus in verba» oder «Take nobody’s word for it» .

Sollten Sie einen Schritt nicht verstehen oder nicht einsehen, wieso dieser möglich sein soll, dann fragen Sie bei Mitstudenten, bei Assistenten oder beim Professor nach, bis Sie eine zufriedenstellende Antwort bekommen haben. Bemühen Sie sich jetzt, wo die Themen noch nicht so verflochten sind, ein vollständiges Verständnis der besprochenen Begriffe und Sätze zu entwickeln, und warten Sie nicht darauf bis die Themen «interessanter» werden. Denn dann werden diese auch schwieriger und es wird zunehmend schwieriger werden, den Einstieg zu finden.

Umgekehrt sollten Ihre Beweise auch so aufgeschrieben sein, dass auch ein sturer Leser nicht umhin kommt, die von Ihnen bewiesene Aussage zu akzeptieren. Es hilft, wenn Sie Ihren Beweis einen oder zwei Tage später nochmals lesen, da es für Sie dann wahrscheinlich leichter ist, bewusst zu vergessen, was Sie sich beim Niederschreiben gedacht haben und dann vielmehr lesen, was Sie tatsächlich niedergeschrieben haben.

1.6.9 – Prädikatenlogik vs Umgangssprache

Wir werden unsere Beweise in der Umgangssprache (also in Deutsch anstatt in formalen Symbolen) formulieren, doch empfehlen wir Ihnen, die Übersetzung zwischen Umgangssprache und Prädikatenlogik zu üben. Wenn wir die Analogie zur Informatik etwas weiter ziehen, dann sollten Sie die Prädikatenlogik als Maschinensprache der Beweise verstehen und die Umgangssprache als die höhere Programmiersprache, die es uns Menschen leichter machen wird, Zusammenhänge zu sehen, eine Intuition für die Theorie zu entwickeln und Konversationen über den Beweis zu führen. Der Autor eines Beweises muss also «als Programmierer» sicherstellen, dass die umgangssprachliche Formulierung ohne Zweideutigkeiten in die Prädikatenlogik übersetzt werden kann. Genauso sollte der Leser die Rolle des «sturen Computers» spielen und überprüfen, ob der Beweis «ohne Fehler abläuft» .

Wir werden anfangs unsere Diskussionen näher an der Prädikatenlogik halten und mitunter (entgegen üblichen mathematischen Konventionen) auch die Quantoren [latex]\forall ,\exists , \exists ![/latex] in Symbolen verwenden. Doch werden wir sehen, dass weder die Lineare Algebra noch die Analysis sinnlose Formelsammlungen in Buchstaben und den Symbolen [latex]\neg[/latex], [latex]\wedge[/latex], [latex]\vee[/latex], [latex]\implies[/latex], [latex]\iff[/latex], [latex]\forall[/latex], [latex]\exists[/latex], [latex]\exists ![/latex], [latex]=[/latex], [latex]\in[/latex], [latex]\subseteq[/latex], …bilden. Vielmehr stellen sie zwei sehr massive Gebäude mit vielen Stockwerken, interessanten Verzierungen und Erkern sowie mehreren Brücken zwischen einander und anderen Gebäuden dar. Wenn Sie das «Gebäude» der Linearen Algebra oder das «Gebäude» der Analysis verstehen wollen, dann müssen Sie zwar die einzelnen Bausteine (in Form von Definitionen, Lemmata und Sätzen), aber eben auch den Lageplan des Gebäudes (das wären die Zusammenhänge) kennen. Es sind diese Zusammenhänge, die in umgangsprachlich formulierten Beweisen klarer werden.

Wir wollen Ihnen am Ende des Hauptteiles dieses Kapitels noch einen Podcast der BBC empfehlen, der neben geschichtlichen Informationen auch noch eine Zusammenfassung vieler Themen dieses Kapitels bietet.

Bemerkung

Eigentlich beschäftigt sich obiger Podcast mit Gödel’s Unvollständigkeitssatz, welcher Teil der mathematischen Logik ist. Dieses Teilgebiet der Mathematik beschäftigt sich mit der Theorie des Beweisens und Fragen wie «ist die Aussage … aus den Axiomen … beweisbar?» . Interessanterweise gibt es in dieser Theorie nicht bloss einen Unvollständigkeitssatz, sondern auch einen Vollständigkeitssatz. Die Auflösung dieses scheinbaren Paradox würde uns jedoch zu weit vom Thema abbringen.

1.7 – Weitere Lernmaterialien

Wir wollen hier versuchen, Ihnen einen Überblick über dieses Kapitel zu geben und auch weitere Übungsaufgaben zu den Themen des Kapitels zu sammeln.

1.7.1 – Verwendung des Kapitels

Wir haben in diesem Kapitel viele Themen und unter anderem Tipps, Motivationen, einige Theorie und auch noch etwas Geschichte der Mathematik besprochen. Auf Grund dieser Vielfalt wollen wir kurz noch betonen, was Sie aus diesem Kapitel eigentlich für das Folgende mitnehmen müssen: Die Themen aus den Abschnitten 1.3 und 1.4 sind grundlegend und wir werden ohne Wiederholungen alle unsere weiteren Diskussionen auf diese Abschnitte aufbauen. Vor allem sollten Sie die folgenden Begriffe so lange üben, bis Sie diese ohne Zweifel im Gedächnis haben.

  • Logische Operationen, insbesondere sollten Sie alle Fälle für das Oder, die Implikation und ihre Negation ohne das Nachblättern der Wahrheitstabellen wissen.
  • Quantoren und deren Verhalten bei Kombination und Negation.
  • Mengenoperationen, de Morgan Gesetze.
  • Begriff der Funktion und elementare Eigenschaften wie Injektivität, Surjektivität und Bijektivität, aber auch die ungenaueren Begriffe «wohldefiniert» und «kanonisch» .
  • Verhalten dieser Eigenschaften unter Verknüpfungen.
  • Äquivalenzrelationen, Partitionen, Quotientenraum
  • Kardinalitäten, vorläufig nur mit der Unterscheidung endlich, abzählbar unendlich oder überabzählbar.

Bei logischen Aussagen werden wir, wie Sie vielleicht schon in Abschnitt 1.6 gemerkt haben, die Notation in Zukunft etwas leichter halten. Unter anderem werden wir die Anführungszeichen [latex]"{\ldots }"[/latex] bei logischen Ausdrücken weglassen und teilweise die Klammerung unterschlagen, wenn diese implizit klar ist. Zum Beispiel kann [latex]\exists n \in \mathbb {N}:n=n^2\! \implies \! n=1[/latex] nur für den Ausdruck [latex]\exists n \in \mathbb {N}:(n=n^2\! \implies \! n=1)[/latex] stehen, da ansonsten die Zahl [latex]n[/latex] auf der rechten Seite von [latex](\exists n \in \mathbb {N}:n=n^2)\! \implies \! n=1[/latex] nicht definiert ist.

Der Abschnitt 1.5 ist als Übersicht gedacht und Sie sollten eigentlich (vor allem für die ersten zwei Abschnitte des nächsten Kapitels) diese erste Einführung der Zahlenmengen wieder vergessen. Denn wir werden im nächsten Kapitel logischen Begriffe, Mengen und Funktionen verwenden um die reellen Zahlen axiomatisch einzuführen.

Abschnitt 1.6 und die Übungsaufgaben dieses Abschnitts sollen Ihnen helfen Ihren eigenen Zugang zu Beweisen zu finden. Schwierige Fragen, die immer wieder auftauchen, sind, «Was muss ich denn bei diesem Satz oder bei dieser Aufgabe eigentlich beweisen?» und «Welche Aussage kann ich als gegeben annehmen?» . Dies ist in diesem Kapitel mitunter wirklich schwer zu beantworten (und wir haben hierzu im Laufe des Kapitels auch mehrmals unsere Meinung geändert). Nach Einführung der Axiome im nächsten Kapitel wird deutlich klarer sein, was wir beweisen müssen: nämlich ausser den Axiomen alles Weitere, wobei wir aber auf bereits bewiesene Aussagen zurückgreifen dürfen. Insbesondere dürfen Sie in den wöchentlichen Übungsaufgaben die Aussagen der Vorlesung und ebenso die Aussagen des Skripts verwenden, aber keine Übungsaufgaben des Skripts und auch nur jene Seiten des Skripts, die bereits in der Vorlesung behandelt wurden. Obwohl die Axiome sehr einfach sein werden, werden wir im Laufe der Vorlesung viele komplizierte und auch überraschende Aussagen beweisen können.

1.7.2 – Flächeninhalt

Übung: Allgemeinere Bereiche unter der Parabel

Berechnen Sie in Analogie zu obigem die Fläche unter der Parabel

[latex]
\begin{aligned}[]P_{a,b} = \left \lbrace {(x,y) \in \mathbb {R}^2} \mid {a \leq x \leq b, 0 \leq y \leq x^2}\right \rbrace ,\end{aligned}
[/latex]

wobei [latex]a,b\in \mathbb {R}[/latex] zwei gegebene reelle Zahlen mit [latex]a

Hinweis.

Nehmen Sie zur Vereinfachung [latex]a=0[/latex] an, womit die Situation der Aussage in Proposition 1.1 sehr ähnlich wird. Der Fall [latex]0

Übung

In dieser Übung möchten wir eine Variante illustrieren, wie man auf Lemma 1.3 schliessen kann ohne zuerst im Besitz der richtigen Formel zu sein. Wir schreiben dazu für [latex]n \in \mathbb {N}[/latex]

[latex]
\begin{aligned}[](n+1)^3 &= (1^3+2^3+3^3 + \ldots + (n+1)^3) - (1^3+2^3+3^3 + \ldots + n^3)\\ &= 1^3 + (2^3-1^3) + (3^3-2^3) + \ldots + ((n+1)^3-n^3).\end{aligned}
[/latex]

Gehen Sie nun wie folgt vor.

  • Zeigen Sie für [latex]a,b \in \mathbb {R}[/latex]
    [latex]
    \begin{aligned}[](a+b)^3 = a^3 + 3a^2 b + 3ab^2 + b^3\end{aligned}
    [/latex]

    und erklären Sie, welche Rechenregeln Sie dabei verwenden.

  • Verifizieren Sie die Gleichung
    [latex]
    \begin{aligned}[](n+1)^3 = (n+1) + 3 (1^2 + 2^2 + \ldots + n^2) + 3 (1+2+\ldots +n).\end{aligned}
    [/latex]
  • Schliessen Sie auf Lemma 1.3.

1.7.3 – Logik

Übung: Draculas Bücher

In der Bibliothek des Grafen Dracula gibt es keine zwei Bücher, deren Inhalt aus gleich vielen Wörtern besteht. Die Anzahl der Bücher ist die Summe der Anzahl der Wörter jedes einzelnen Buches. Des Weiteren genügen diese Aussagen, um den Inhalt mindestens eines Buches aus Draculas Bibliothek genau zu beschreiben. Was steht in diesem Buch? Diese Übung enstammt dem Buch [17].

Übung: Vier Aussagen in Prädikatenlogik

Wir sagen [latex]m\in \mathbb {N}[/latex] teilt [latex]n\in \mathbb {N}[/latex] falls es ein [latex]d\in \mathbb {N}[/latex] gibt mit [latex]n=dm[/latex]. Beschreiben Sie die Bedeutung folgender Aussagen und bestimmen Sie, ob diese zutreffen.

  • [latex]\forall n\in \mathbb {N}\ \exists m\in \mathbb {N}:\ m[/latex] teilt [latex]n[/latex].
  • [latex]\exists m\in \mathbb {N}\ \forall n\in \mathbb {N}:\ m[/latex] teilt [latex]n[/latex].
  • [latex]\forall m\in \mathbb {N}\ \exists n\in \mathbb {N}:\ m[/latex] teilt [latex]n[/latex].
  • [latex]\exists n\in \mathbb {N}\ \forall m\in \mathbb {N}:\ m[/latex] teilt [latex]n[/latex].

Übung: Allgemeinere Existenzquantoren

Sei [latex]X[/latex] eine Menge. In dieser Übung wollen wir Quantoren für die Aussage, dass mehrere Elemente mit einer Eigenschaft [latex]A(x)[/latex] in [latex]X[/latex] existieren, definieren.

  1. Definieren Sie unter Verwendung des Existenzquantors einen neuen Quantor [latex]\exists ^{\geq 2}[/latex], so dass die Aussage «[latex]\exists ^{\geq 2} x\in X: A(x)[/latex]» bedeutet, dass es mindestens zwei Elemente [latex]x[/latex] in [latex]X[/latex] gibt, die die Eigenschaft [latex]A(x)[/latex] haben.
  2. Verallgemeinern Sie (i) zu dem Quantor [latex]\exists ^{\geq n}[/latex] für eine natürliche Zahl [latex]n[/latex], und verwenden Sie diese um auch den Quantor [latex]\exists ^{=n}[/latex] zu definieren, der besagen soll, dass es genau [latex]n[/latex] Elemente in [latex]X[/latex] gibt, die die Eigenschaft [latex]A(x)[/latex] besitzen. (Sie dürfen entweder informell Punkte verwenden, oder formal korrekter den Funktionsbegriff, Eigenschaften von Funktionen, und die Menge [latex]\left \lbrace {k\in \mathbb {N}} \mid { k\leq n}\right \rbrace[/latex], die genau [latex]n[/latex] Elemente hat.)
  3. Definieren Sie unter Verwendung des Existenzquantors, des Funktionsbegriffes, einer Eigenschaft von Funktionen und der natürlichen Zahlen [latex]\mathbb {N}[/latex] einen neuen Quantor [latex]\exists ^\infty[/latex], der besagt, dass es unendlich viele Elemente in [latex]X[/latex] gibt, die die Eigenschaft [latex]A(x)[/latex] besitzen.

Teillösung

[latex]"{\exists ^{\geq 2} x\in X: A(x)}"[/latex] kann durch [latex]"{\exists x_1,x_2\in X: (x_1\neq x_2\wedge A(x_1)\wedge A(x_2))}"[/latex] definiert werden.

1.7.4 – Funktionen und Relationen

Übung: Injektive Funktionen durch Fallunterscheidungen

Zeigen Sie folgende Behauptung: Seien [latex]X[/latex] und [latex]Y[/latex] Mengen und sei [latex]\mathcal {P}[/latex] eine Partition von [latex]X[/latex]. Angenommen es ist für jedes [latex]P \in \mathcal {P}[/latex] eine injektive Funktion [latex]f_P: P \to Y[/latex] gegeben und sei [latex]f: X \to Y[/latex] die eindeutige Funktion mit [latex]f|_P = f_P[/latex] für jedes [latex]P \in \mathcal {P}[/latex] nach Lemma 1.67. Zeigen Sie, dass [latex]f[/latex] genau dann injektiv ist, falls die Mengen [latex]f(P)[/latex] für [latex]P \in \mathcal {P}[/latex] paarweise disjunkt sind.

Übung: Eine Äquivalenzrelation auf dem kartesischen Produkt

Seien [latex]X, Y[/latex] zwei nicht-leere Mengen, sei [latex]\sim _X[/latex] eine Relation auf [latex]X[/latex] und sei [latex]\sim _Y[/latex] eine Relation auf [latex]Y[/latex]. Wir definieren damit eine Relation [latex]\sim[/latex] auf [latex]X \times Y[/latex] durch

[latex]
\begin{aligned}[]\big ( (x,y) \sim (x',y')\big ) \iff \big ( (x \sim _X x') \wedge (y \sim _Y y')\big )\end{aligned}
[/latex]

für [latex](x,y),(x',y') \in X \times Y[/latex]. Zeigen Sie, dass [latex]\sim[/latex] genau dann eine Äquivalenzrelation auf [latex]X \times Y[/latex] ist, wenn [latex]\sim _X[/latex] eine Äquivalenzrelation auf [latex]X[/latex] ist und [latex]\sim _Y[/latex] eine Äquivalenzrelation auf [latex]Y[/latex] ist. Gilt dies auch, wenn eine der beiden Mengen [latex]X,Y[/latex] leer ist? Diese Übung enstammt dem Buch [18].

Hinweis.

Überprüfen Sie die drei definierenden Eigenschaften einer Äquivalenzrelation für [latex]\sim[/latex] (beziehungsweise für [latex]\sim _X[/latex] und [latex]\sim _Y[/latex]).

Applet: Nichtvertauschbarkeit der Verknüpfung

Wir betrachten zwei Funktionen [latex]f,g:\mathbb {R}\to \mathbb {R}[/latex], wobei [latex]f[/latex] nur durch den Graphen beschrieben ist und [latex]g:x\in \mathbb {R}\mapsto g(x)=ax+b[/latex] eine affine Funktion ist, die durch zwei Konstanten [latex]a,b\in \mathbb {R}[/latex] definiert wird. Durch Bewegen zweier Punkte am Graph von [latex]g[/latex] lassen sich [latex]a[/latex] und [latex]b[/latex] definieren. Experimentieren Sie damit um sich an die geometrische Bedeutung von den Zahlen [latex]a[/latex] und [latex]b[/latex] zu errinnern, und beobachten Sie, wie sich die beiden Funktionen [latex]g\circ f[/latex] und [latex]f\circ g[/latex] im rechten Fenster unterschiedlich verändern. Es ist nützlich sich diese Phänomene vollständig zu erklären, denn wir werden ähnlichen Verknüpfungen in unseren weiteren Überlegungen begegnen.

1.7.5 – Beweismethoden

Übung

Sei [latex]n[/latex] eine natürliche Zahl. Zeigen Sie, dass die Implikation

[latex]
\begin{aligned}[]n^2+ 17n - 13 \text { ist gerade } \implies n \text { ist ungerade}\end{aligned}
[/latex]

gilt.

Übung: Türme von Hanoi

Es seien [latex]3[/latex] Ablageflächen gegeben. Angenommen auf der linken Ablagefläche seien [latex]n[/latex] Blöcke für eine natürliche Zahl [latex]n[/latex] aufgetürmt, wobei nie ein kleinerer Block unter einem grösseren Block liegt.

image

Zeigen Sie, dass Sie den Turm von links nach rechts umschichten können, ohne dass je ein kleinerer Block unter einem grösseren Block zu liegen kommt.

Übung

Zeigen Sie mittels vollständiger Induktion, dass für alle natürliche Zahlen [latex]n \geq 5[/latex] gilt [latex]4n

Hinweis.

Beginnen Sie die Induktion mit dem Induktionsanfang bei [latex]n=5[/latex] (denn für [latex]n=4[/latex] gilt die Aussage nicht).

Übung

Zeigen Sie mittels vollständiger Induktion, dass die Ungleichung [latex]n^2

Hinweis.

Der Beweis des Induktionsschrittes ist einfacher falls [latex]n\geq 2[/latex] angenommen werden kann. Aus diesem Grund ist es besser sowohl [latex]n=1[/latex] als auch [latex]n=2[/latex] direkt zu überprüfen um im Induktionsschritt [latex]A(n)\implies A(n+1)[/latex] dann ohne Beschränkung der Allgemeinheit [latex]n\geq 2[/latex] zu verwenden.

Übung

Wir färben jeden Punkt im Gitter [latex]\mathbb {Z}^2[/latex] mit einer von [latex]17[/latex] verschiedenen Farben ein. Zeigen Sie, dass es ein achsenparalleles Rechteck [latex]R[/latex] in diesem Gitter gibt, dessen Ecken alle dieselbe Farbe besitzen.

Lösung

Statt das ganze Gitter zu untersuchen, genügt es die Gitterpunkte in dem Rechteck [latex]R_0=[0,17]\times [0,17^{18}][/latex] zu betrachten. Es gibt dann auf einer horizontalen Gerade mit ganzzahliger [latex]y[/latex]-Koordinate in dem Rechteck [latex]R_0[/latex] jeweils eines von [latex]17^{18}[/latex] möglichen Farbmuster. Da es mehr horizontale Geraden (genau [latex]17^{18}+1[/latex]) als mögliche Farbmuster gibt, wiederholt sich eines der Farbmuster. Wir wählen diese beiden [latex]y[/latex]-Koordinaten für unser gesuchtes Rechteck [latex]R[/latex]. In diesem Farbmuster gibt es horizontal [latex]18[/latex] Positionen aber nur [latex]17[/latex] Farben, womit sich eine der Farben wiederholt. Verwendet man diese [latex]x[/latex]-Koordinaten, so erhalten wir das gewünschte Rechteck [latex]R[/latex], bei dem alle Eckpunkte dieselbe Farbe besitzen.

Übung

Sei [latex]n \in \mathbb {N}[/latex] und sei [latex]S[/latex] eine Teilmenge von [latex]\left \lbrace {1,\ldots ,2n} \right \rbrace[/latex] mit Kardinalität [latex]n+1[/latex]. Zeigen Sie, dass es Elemente [latex]a,b\in S[/latex] gibt mit [latex]a|b[/latex].

Hinweis.

Es empfiehlt sich [latex]\left \lbrace {1,\ldots ,2n} \right \rbrace[/latex] in Teilmengen zu partitionieren, die geometrische Progressionen darstellen.

Übung

Sei [latex]T[/latex] eine endliche Menge und seien [latex]S_1,\ldots ,S_n[/latex] Teilmengen von [latex]T[/latex] mit

[latex]
\begin{aligned}[]|S_1|+\cdots +|S_n| > k |T|.\end{aligned}
[/latex]

Zeigen Sie, dass es ein Element [latex]t \in T[/latex] gibt, welches in mindestens [latex]k+1[/latex] der Mengen [latex]S_1,\ldots ,S_n[/latex] liegt.

Hinweis.

Nehmen Sie indirekt an, dass jeder Punkt [latex]t\in T[/latex] in höchstens [latex]k[/latex] Teilmengen enthalten ist und zeigen Sie, dass [latex]|S_1|+\cdots +|S_n| \leq k |T|[/latex]. Es genügt dies in Worten oder geometrisch zu erklären, wir werden die Notation für einen formalen Beweis erst später einführen.

1.7.6 – Geometrische Probleme

Übung: Satz von Pythagoras

In dieser Übung möchten wir (auf Ihnen vielleicht bereits bekannte Weise den Satz von Pythagoras) beweisen. Wir betrachten ein rechtwinkliges Dreieck mit Katheten der Länge [latex]a[/latex] und [latex]b[/latex] und Hypotenuse der Länge [latex]c[/latex]. Zeigen Sie, dass

[latex]
\begin{aligned}[]c^2 = a^2 +b^2.\end{aligned}
[/latex]

Hinweis: Betrachten Sie folgende Bilder

und gehen Sie dabei davon aus, dass gewisse geometrische Begriffe wie Winkel, Länge und Fläche für elementare Bereiche und intuitiv anschauliche Eigenschaften wie Invarianz der Fläche unter Verschiebung und Drehung bekannt sind.

1.7.7 – Übungen zu Primzahlen

Eine natürliche Zahl [latex]p[/latex] grösser als [latex]1[/latex] ist irreduzibel, falls sie nicht als Produkt von zwei kleineren natürlichen Zahlen geschrieben werden kann. Eine natürliche Zahl [latex]p[/latex] grösser als [latex]1[/latex] heisst eine Primzahl, falls ein Produkt [latex]ab[/latex] zweier natürlicher Zahlen [latex]a,b\in \mathbb {N}[/latex] nur dann durch [latex]p[/latex] teilbar ist, falls eine der beiden Zahlen durch [latex]p[/latex] teilbar ist.

Übung: Primzahlen sind irreduzibel

Zeigen Sie, dass jede Primzahl in [latex]\mathbb {N}[/latex] auch irreduzibel ist.

Hinweis.

Lässt sich eine Primzahl [latex]p[/latex] als Produkt zweier natürlichen Zahlen [latex]a,b \in \mathbb {N}[/latex] schreiben (das heisst, [latex]p = ab[/latex]), so teilt [latex]p[/latex] das Produkt [latex]ab[/latex].

Diese beiden Begriffe sind in der Tat für die natürlichen Zahlen äquivalent (wir werden dies nochmals etwas genauer in Abschnitt 2.2.4 besprechen) und wir werden in diesem Abschnitt irreduzible Zahlen ebenso als Primzahlen bezeichnen. Es ist eine gute Übung im Folgenden genau zu erklären welche der beiden Begriffe eigentlich verwendet wird.

Übung: Primfaktorzerlegung

Zeigen Sie mittels vollständiger Induktion, dass jede natürliche Zahl grösser als [latex]1[/latex] als Produkt von Primzahlen geschrieben werden kann.

Hinweis.

Sie dürfen hier eine Variante der vollständigen Induktion verwenden und im Induktionsschritt annehmen, dass die Aussage für alle kleineren Zahlen bereits bewiesen wurde. Das einfachste Argument hierfür verwendet eigentlich den Begriff der irreduziblen Zahlen.

Übung: Unendlich viele Primzahlen

Zeigen Sie, dass es unendliche viele Primzahlen gibt.

Hinweis.

Das einfachste Argument hierfür ist das Argument von Euklid: Falls [latex]p_1,\ldots ,p_n[/latex] die einzigen Primzahlen wären, dann wäre [latex]N=p_1\cdots p_n+1[/latex] durch keine dieser Primzahlen teilbar und mittels der letzten Übung fände man weitere Primzahlen (genauer gesagt irreduzible Zahlen).

Übung: Summen von Quadraten

In dieser Übung möchten wir (mit einer detaillierten Anleitung) zeigen, dass für jede ungerade Primzahl [latex]p \in \mathbb {N}[/latex] mit [latex]p \equiv 1 \mod 4[/latex] Zahlen [latex]x,y \in \mathbb {N}[/latex] mit [latex]x^2+y^2 = p[/latex] existieren. Dabei folgen wir dem Artikel «A one-sentence proof that every prime [latex]p \equiv 1 \mod 4[/latex] is a sum of two squares.» von Don Zagier [19]. Wir zitieren:

«The involution on the finite set [latex]S = \left \lbrace {(x,y,z) \in \mathbb {N}^3} \mid {x^2+4yz = p}\right \rbrace[/latex] defined by
[latex]
\begin{aligned}[]\label{eq:einf-zagier1} (x,y,z) \mapsto \left \lbrace \begin{array}{cl} (x+2z,z,y-x-z) & \text {falls } x [/latex]
has exactly one fixed point, so [latex]|S|[/latex] is odd and the involution defined by [latex](x,y,z) \mapsto (x,z,y)[/latex] also has a fixed point.[latex]\ \square[/latex]»

Im Folgenden möchten wir die Details in obigem kryptischen aber auch eleganten Beweis ausarbeiten. Aber zuerst möchten wir einen Grund lieferen, wieso man obige Aussage überhaupt glauben sollte.

  1. Sei also [latex]p \in \mathbb {N}[/latex] eine ungerade Zahl, für die [latex]x,y \in \mathbb {N}[/latex] mit [latex]x^2+y^2 = p[/latex] existieren. Zeigen Sie, dass dann [latex]p \equiv 1 \mod 4[/latex] ist.
  2. Versuchen Sie [latex]5[/latex], [latex]9[/latex], [latex]13[/latex], [latex]17[/latex], [latex]21[/latex] als Summe [latex]x^2+y^2[/latex] von zwei Quadraten natürlicher Zahlen [latex]x,y\in \mathbb {N}[/latex] zu schreiben und bemerken sie, dass unter diesen Zahlen dies nur für die Primzahlen möglich ist.
  3. Zeigen Sie nun, dass die obige Menge [latex]S[/latex] endlich ist und dass die Abbildung
    [latex]
    \begin{aligned}[]\tau : S \to S,\ (x,y,z) \mapsto (x,z,y)\end{aligned}
    [/latex]

    wohldefiniert ist.

  4. Beweisen Sie, dass [latex]p[/latex] als Summe von zwei Quadraten geschrieben werden kann, wenn es für die Abbildung [latex]\tau[/latex] einen Punkt [latex]a= (x,y,z) \in S[/latex] mit [latex]\tau (a) = a[/latex] gibt. Ein solcher Punkt [latex]a \in S[/latex] nennt sich ein Fixpunkt von [latex]\tau[/latex].

Die Abbildung [latex]\tau[/latex] ist eine Involution, was bedeutet, dass [latex]\tau ^{\, \circ \, {2} } = \operatorname {id}_S[/latex] ist.

  1. Zeigen Sie, dass eine Involution auf [latex]S[/latex] einen Fixpunkt besitzt, wenn [latex]|S|[/latex] ungerade ist. Verifizieren Sie auch, dass [latex]|S|[/latex] ungerade ist, wenn es eine Involution [latex]S \to S[/latex] mit einem eindeutig bestimmten Fixpunkt gibt.
  2. Betrachten Sie die Abbildung [latex]\sigma[/latex] aus () und verifizieren Sie folgende Behauptungen:
    • Die Abbildung [latex]\sigma[/latex] ist wohldefiniert: Einerseits gilt für [latex](x,y,z) \in S[/latex], dass die Fälle [latex]x = y-z[/latex] und [latex]x = 2y[/latex] nicht eintreten können, womit [latex]\sigma[/latex] für jedes Element in [latex]S[/latex] definiert ist. Andererseits ist für jedes [latex](x,y,z) \in S[/latex] das Bild [latex]\sigma ((x,y,z))[/latex] (wie oben definiert) tatsächlich ein Element von [latex]S[/latex].
    • [latex]\sigma :S \to S[/latex] ist eine Involution.
  3. Zeigen Sie, dass der einzige Fixpunkt von [latex]\sigma[/latex] durch [latex](1,1,k)[/latex] gegeben ist, wobei [latex]k \in \mathbb {N}_0[/latex] die Gleichung [latex]p = 4k+1[/latex] erfüllt.
  4. Kombinieren Sie obige Argumente, um die gewünschte Aussage zu zeigen.

Wo haben Sie verwendet, dass [latex]p[/latex] eine Primzahl (oder irreduzibel) ist?

1.7.8 – Lernkarten

Mit folgendem Lernkartenapp können Sie die Themen des Kapitels wiederholen, siehe auch diesen Link (der zu deutlich weniger Datenbewegungen in ihrem Mobilen Datenplan führt als dieses eSkript).

<!– post meta –>


  1. Insbesondere nehmen wir vorläufig an, dass wir die Menge der reellen Zahlen [latex]\mathbb {R}[/latex] bereits kennen.
  2. H. Schichl and Steinbauer, R.: Einführung in das mathematische Arbeiten (Springer Spektrum, 2012)
  3. G. Boole: The mathematical analysis of logic (Philosophical library, 1847)
  4. H. Schichl and Steinbauer, R.: Einführung in das mathematische Arbeiten (Springer Spektrum, 2012)
  5. R. Smullyan: What is the name of this book? (Prentice-Hall, 1978)
  6. G. Cantor: Beiträge zur Begründung der transfiniten Mengenlehre (Mathematische Annalen, 1895)
  7. B. Russell: The principles of mathematics (WW Norton & Company, 1903)
  8. Wir wollen die Notation [latex]f^{\, \circ \, {n} }[/latex] verwenden, um Verwirrungen mit der [latex]n[/latex]-ten Potenz einer reellwertigen Funktion zu vermeiden.
  9. H. Amann and Escher, J.: Analysis I (Birkhäuser Basel, 2006)
  10. Dies stellt eine Definition dar und muss nicht bewiesen werden.
  11. Wir werden im Laufe des ersten Semesters all diese Zahlen definieren.
  12. H. Weber: Leopold Kronecker (Jahresbericht der Deutschen Mathematiker-Vereinigung, 1892)
  13. Man sollte dabei darauf achten, dass die Aussage [latex]A[/latex] nicht von einer freien Variablen [latex]x[/latex] abhängt, denn wenn die Aussage eigentlich [latex]\forall x\in X:A(x)[/latex] ist, dann ist die Negation [latex]\exists x\in X: \neg A(x)[/latex] und nicht [latex]\forall x\in X: \neg A(x)[/latex]. Führt man also einen Widerspruchsbeweis, so sollte klar sein, was genau die getroffenen Annahmen sind.
  14. C. Blatter: Analysis I (2003)
  15. H. Schichl and Steinbauer, R.: Einführung in das mathematische Arbeiten (Springer Spektrum, 2012)
  16. A. Beutelspacher: Das ist o.B.d.A trivial. (Vieweg+Teubner Verlag, 2009)
  17. H. Amann and Escher, J.: Analysis I (Birkhäuser Basel, 2006)
  18. H. Amann and Escher, J.: Analysis I (Birkhäuser Basel, 2006)
  19. D. Zagier: A one-sentence proof that every prime [latex]p \equiv 1 \mod 4[/latex] is a sum of two squares. (Amer. Math. Monthly, 1990)

License

Analysis-Skript CHAB MATH PHYS: 18/19 Copyright © by Manfred Einsiedler and Andreas Wieser. All Rights Reserved.

}