10.1 – Technische Entwicklungen

10.1.1 – Datenwachstum

Mengen von Daten wachsen typischerweise exponentiell. Berechnungen aus dem Jahr 2011 zufolge verdoppelt sich das weltweite erzeugte Datenvolumen alle 2 Jahre.^[15] Diese Entwicklung wird vor allem getrieben durch die zunehmende maschinelle Erzeugung von Daten z. B. über Protokolle von Telekommunikationsverbindungen (Call Detail Record, CDR) und Webzugriffen (Logdateien), automatische Erfassungen von RFID-Lesern, Kameras, Mikrofonen und sonstigen Sensoren. Big Data fallen auch in der Finanzindustrie an (Finanztransaktionen, Börsendaten) sowie im Energiesektor (Verbrauchsdaten) und im Gesundheitswesen (Abrechnungsdaten der Krankenkassen). In der Wissenschaft fallen ebenfalls große Datenmengen an, z. B. in der Geologie, Genetik, Klimaforschung und Kernphysik.

10.1.2 – Big Data

Der aus dem englischen Sprachraum stammende Begriff Big Data (von englisch big ‚groß‘ und data ‚Daten‘, deutsch auch Massendaten) steht in engem Zusammenhang mit dem umfassenden Prozess der Datafizierung und bezeichnet Datenmengen, welche beispielsweise zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit manuellen und herkömmlichen Methoden der Datenverarbeitung auszuwerten.^[1]

„Big Data“ wird häufig als Sammelbegriff für digitale Technologien verwendet, die in technischer Hinsicht für eine neue Ära digitaler Kommunikation und Verarbeitung und in sozialer Hinsicht für einen gesellschaftlichen Umbruch verantwortlich gemacht werden.^[2] Dabei unterliegt der Begriff als Schlagwort einem kontinuierlichen Wandel; so wird damit ergänzend auch oft der Komplex der Technologien beschrieben, die zum Sammeln und Auswerten dieser Datenmengen verwendet werden.

10.1.3 – Cloud Computing

(deutsch Rechnerwolke oder Datenwolke^[1]) beschreibt ein Modell, das bei Bedarf – meist über das Internet und geräteunabhängig – zeitnah und mit wenig Aufwand geteilte Computerressourcen als Dienstleistung, etwa in Form von Servern, Datenspeicher oder Applikationen, bereitstellt und nach Nutzung abrechnet. Angebot und Nutzung dieser Computerressourcen ist definiert und erfolgt in der Regel über eine Programmierschnittstelle (API) bzw. für Anwender über eine Website oder App.^[2]^[3]

Abbildung 10.1 – Diagramm, das einen Überblick über das Cloud Computing mit den typischen Anwendungstypen zeigt, die von diesem Computing-Modell unterstützt werden.

10.1.4 – Physische Präsenz von Daten

Ein Rechenzentrum oder Datenzentrum ist ein Gebäude, ein bestimmter Bereich innerhalb eines Gebäudes oder eine Gruppe von Gebäuden, die zur Unterbringung von Computersystemen verwendet werden. Da der IT-Betrieb für die Geschäftskontinuität entscheidend ist, umfasst er im Allgemeinen redundante oder Backup-Komponenten und Infrastruktur für Stromversorgung, Datenkommunikationsverbindungen, Umgebungskontrollen und verschiedene Sicherheitsvorrichtungen. Ein großes Rechenzentrum ist ein industrieller Betrieb, der so viel Strom verbraucht wie eine Kleinstadt. Der Energieverbrauch ist ein zentrales Thema für Rechenzentren. Die Leistungsaufnahme reicht von wenigen Kilowatt für ein Serverrack in einem Schrank bis zu vielen Megawatt für große Einrichtungen. Einige Einrichtungen haben eine Leistungsdichte, die mehr als das 100-fache der eines typischen Bürogebäudes beträgt. Bei Einrichtungen mit höherer Leistungsdichte sind die Stromkosten eine dominierende Betriebsausgabe und machen über 10 % der Gesamtbetriebskosten eines Rechenzentrums aus.

Energieverbrauch Rechenzentren

Im Jahr 2020 verbrauchten Rechenzentren (ohne Kryptowährungs-Mining) und Datenübertragung jeweils etwa 1 % des weltweiten Stroms. Obwohl ein Teil dieses Stroms kohlenstoffarm war, forderte die IEA (International Energy Agency)) mehr „Anstrengungen von Regierung und Industrie in Bezug auf Energieeffizienz, Beschaffung erneuerbarer Energien und RD&D (Research, Development and Demonstration)“, da einige Rechenzentren immer noch Strom aus fossilen Brennstoffen nutzen. Es wird geschätzt, dass Rechenzentren im Jahr 2018 für 0,5 % der Treibhausgasemissionen in den USA verantwortlich waren.

Abbildung 10.2 – Innenaufnahme eines Datenzentrums

10.2 – Theoretische Grundlagen

10.2.1 – Daten

Daten bezeichnet als Plural von Datum Fakten, Zeitpunkte oder kalendarische Zeitangaben und als Pluralwort gemeinsprachlich die durch Beobachtungen, Messungen u. ä. gewonnenen Zahlenwerte und darauf beruhenden Angaben oder formulierbaren Befunde.[1] Während Daten in der Umgangssprache Gegebenheiten, Tatsachen oder Ereignisse sind, sind Daten in der Fachsprache Zeichen, die eine Information darstellen.[2]

In verschiedenen Fachgebieten wie z. B. der Informatik, der Mathematik, der Wirtschaftstheorie, der Neurowissenschaft oder den Biowissenschaften sind unterschiedliche – meist ähnliche – Definitionen gebräuchlich. Eine einheitliche Definition gibt es bisher nicht.[3][4] Das liegt auch daran, dass die verschiedenen Fachgebiete dem Begriff Daten einen unterschiedlichen Begriffsinhalt zuordnen, der nur dieses Fachgebiet betrifft.

Daten sind nur Darstellungen/Angaben über Sachverhalte und Vorgänge, die in der Form bestimmter Zeichen/Symbole auf bestimmten Datenträgern existieren. Aus ihnen kann (bei Menschen durch kognitive Tätigkeiten des Empfängers) „Information“ werden, zweckbezogenes Wissen, das man beim Handeln im Hinblick auf gesetzte Ziele benötigt.

10.2.2 – Information

Information kann bewusst als Nachricht oder Botschaft von einem Sender an einen Empfänger übermittelt oder auch unbewusst transportiert werden und durch die Wahrnehmung von Form und Eigenschaft eines Objektes auffallen. Information erhält ihren Wert durch die Interpretation des Gesamtgeschehens auf verschiedenen Ebenen durch den Empfänger der Information. Sender oder Empfänger können nicht nur Personen/Menschen, sondern auch (höher-entwickelte) Tiere oder künstliche Systeme (wie Maschinen oder Computer/Computerprogramme) sein.

Information wird auch synonym für Nachricht, Auskunft, Belehrung, Aufklärung verwendet, die aber i. e. S. nur die „Träger von Informationen“, nicht die Information selbst sind. Kommunikation Die Kommunizierbarkeit gilt als eine wesentliche Eigenschaft von Information, und jegliche Kommunikation setzt Information voraus.

Abbildung 10.3 – Claude Elwood Shannon (1916 – 2001) war ein Amerikanischer Mathematiker, Elektroingenieur und Kryptograph, bekannt als ein “Vater der Informationstheorie”

10.2.3 – Wissen

Der Begriff der Information ist eng verknüpft mit Fragestellungen im Themenkomplex Wissen. Dazu gehört insbesondere das Problem der Definition von Komplexität. Weiterhin zählen hierzu Betrachtungen über den Unterschied zwischen Zufall und Ordnung sowie der Begriff der Unterscheidbarkeit und der Relevanz.

10.2.4 – Daten, Information, Wissen, Weisheit

Die Wissenshierarchie (Informationshierarchie, Informationspyramide) bezieht sich lose auf eine Klasse von Modellen zur Darstellung von Strukturen und/oder Funktionen bzw. Beziehungen zwischen Daten, Informationen, Wissen und Weisheit. „Typischerweise wird Information in Form von Daten definiert, Wissen in Form von Information und Weisheit in Form von Wissen“.

10.2.5 – Data Mining

Unter Data-Mining (von englisch data mining, aus englisch data ‚Daten‘ und englisch mine ‚graben‘, ‚abbauen‘, ‚fördern‘)[1] versteht man die systematische Anwendung statistischer Methoden auf große Datenbestände (insbesondere „Big Data“ bzw. Massendaten) mit dem Ziel, neue Querverbindungen und Trends zu erkennen. Solche Datenbestände werden aufgrund ihrer Größe mittels computergestützter Methoden verarbeitet. In der Praxis wurde der Unterbegriff Data-Mining auf den gesamten Prozess der sogenannten „Knowledge Discovery in Databases“ (englisch für Wissensentdeckung in Datenbanken; KDD) übertragen, der auch Schritte wie die Vorverarbeitung und Auswertung beinhaltet, während Data-Mining im engeren Sinne nur den eigentlichen Verarbeitungsschritt des Prozesses bezeichnet.[2]

10.2.6 – Ontologie

Die (im 16. Jahrhundert als griechisch ὀντολογία ontología gebildet aus altgriechisch ὄν ón ‚seiend‘ bzw. altgriechisch τὸ ὄν ‚das Sein‘ und λόγος lógos ‚Lehre‘, also ‚Lehre vom Seienden‘ bzw. ‚Lehre des Seins‘) ist eine Disziplin der (theoretischen) Philosophie, die sich mit der Einteilung des Seienden und den Grundstrukturen der Wirklichkeit befasst, z. B. mit Begriffen wie Existenz, Sein, Werden und Realität.

Ontologien in der Informatik sind meist sprachlich gefasste und formal geordnete Darstellungen einer Menge von Begriffen und der zwischen ihnen bestehenden Beziehungen in einem bestimmten Gegenstandsbereich (in Anlehnung an den klassischen Begriff der Ontologie). Sie werden dazu genutzt, „Wissen“ in digitalisierter und formaler Form zwischen Anwendungsprogrammen und Diensten auszutauschen. Wissen umfasst dabei sowohl Allgemeinwissen als auch Wissen über sehr spezielle Themengebiete und Vorgänge.

Im Bauwesen existieren bereits mehrere Ontologien verschiedener Domänen und Fachrichtungen, die unter anderem durch die Linked Building Data Community Group und durch buildingSMART erarbeitet werden.

10.2.7 – Semantik

(von altgriechisch σημαίνειν sēmaínein, deutsch ‚bezeichnen, ein Zeichen geben‘), auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen. Zeichen können hierbei beliebige Symbole sein, insbesondere aber auch Sätze, Satzteile, Wörter oder Wortteile. Soweit sich die Semantik mit Zeichen aller Art befasst, ist sie ein Teilbereich der Semiotik. Sofern sie sich allein mit sprachlichen Zeichen befasst, ist sie eine Teildisziplin der Linguistik. Allgemeinsprachlich wird unter Semantik auch einfach die Bedeutung eines bestimmten Wortes, Satzes oder Textes verstanden.[1]

Ein Semantisches Datenmodell (SDM, englisch auch conceptual schema) ist im Rahmen der Datenmodellierung eine abstrakte, formale Beschreibung und Darstellung eines Ausschnittes der in einem bestimmten Zusammenhang (z. B. eines Projekts) „wahrgenommenen Welt“. Für Gebäudedaten existiert zum Beispiel der IFC Standard als sematisches Datenmodell.

10.3 – Digitale Datenstrukturen

10.3.1 – Geographische Informations Systeme

Geoinformationssysteme, Geographische Informationssysteme (GIS) oder Räumliche Informationssysteme (RIS) sind Informationssysteme zur Erfassung, Bearbeitung, Organisation, Analyse und Präsentation räumlicher Daten. Geoinformationssysteme umfassen die dazu benötigte Hardware, Software, Daten und Anwendungen.

10.3.2 – Gebäude Informations Modelle

Der Begriff Building Information Modeling (kurz: BIM; deutsch: Bauwerksdatenmodellierung) beschreibt eine Arbeitsmethode für die vernetzte Planung, den Bau und die Bewirtschaftung von Gebäuden und anderen Bauwerken mithilfe von Software. Dabei werden alle relevanten Bauwerksdaten digital modelliert, kombiniert und erfasst. Das Bauwerk ist als virtuelles Modell auch geometrisch visualisiert (Computermodell). Building Information Modeling findet Anwendung sowohl im Bauwesen zur Bauplanung und Bauausführung (Architektur, Ingenieurwesen, Haustechnik, Tiefbau, Städtebau, Eisenbahnbau, Straßenbau, Wasserbau, Geotechnik) als auch im Facilitymanagement [1].

Die vielleicht grundlegendste und wichtigste Feststellung ist, dass BIM keine Software und kein Werkzeug oder gar eine Reihe von Werkzeugen ist. Building Information Modeling umfasst drei Hauptaspekte:

Ein semantisches Datenmodell, das durchaus aus mehreren Modellen bestehen kann, die über ein Referenzmodell miteinander verknüpft sind.
Der Modellierungsprozess, der sich über längere Zeiträume erstrecken kann und an dem Mitwirkende und Mitarbeiter aus vielen verschiedenen Bereichen beteiligt sind.
Management des Modells: die Planung und Koordination von Daten- und Informationsflüssen.

10.3.3 – Industry Foundation Classes

Die sind ein offener Standard im Bauwesen zur digitalen Beschreibung von Gebäudemodellen. Industry Foundation Classes (IFC). Sie haben Ihre Wurzeln im ISO 10303 standard, aber basieren auf mitte-1990er Jahre auf STEP, Standard for the Exchange of Product Model Data.

10.4 – Digitale Prozessketten

10 Daten und Modelle