Unfassbare 40 Zettabytes an Daten sollen 2020 durchs digitale Universum schießen – eine Zahl mit 22 Nullen und 57-mal so hoch wie die Menge aller Sandkörner dieser Welt zusammengezählt. Oder, um einen weiteren Superlativ zu bedienen: Um all diese Daten zu speichern, bräuchte man etwa 40 Billionen CDs. Tendenz steigend. Alle zwei Jahre verdoppelt sich das digitale Datenvolumen. Bei all den Vorteilen, die Big Data mit sich bringt, vielen Menschen treibt die großangelegte Datensammlerei tiefe Sorgenfalten in die Stirn. Die (sich häufenden) Facebook-Datenskandale sind nur das prominenteste Beispiel dafür, wie Namen, Adressen und andere digitale Auskünfte für monetäre Zwecke missbraucht werden können.
Weil diese „dunkle Macht von Big Data“, wie der Spiegel unlängst titelte, eben kein Hirngespinst, sondern völlig real ist, müssen Themen wie Sicherheit und Vertrauen in Big-Data-Analysen höchste Priorität genießen. Nur so kann das Wachstum der europäischen Datenwirtschaft sichergestellt werden. Diesen Ansatz der ökonomischen Entwicklung mit sicheren Daten verfolgt auch das Pionierprojekt Safe-DEED (kurz für Safe Data Enabled Economic Development). Wichtigstes Anliegen: Das Sammeln und Auswerten von Big Data soll mit dem Datenschutz zusammengebracht werden. Durch die Anonymisierung von Daten. Koordiniert wird das Projekt vom Know-Center (Leitung des Konsortiums), geforscht wird drei Jahre lang gemeinsam mit den Research Studios Austria, Fundacio Eurecat, Technische Universiteit Delft und Katholieke Universiteit Leuven. Und finanziert wird es aus den Fördermitteln des ‚Horizon 2020‘-Forschungsrahmenprogramms der EU.
Big Data wird oft mit Künstlicher Intelligenz in Verbindung gebracht. Wie gut funktioniert diese Symbiose bereits?
Das Problem ist nicht, dass wir zu wenig Technologie zum Thema KI hätten. Es gibt auch die großen Datenmengen, die Frage ist aber immer, wem diese Datenmengen zur Verfügung stehen. Wer die Daten besitzt, kann seine KI-Systeme entsprechend lernen lassen, wer sie nicht hat, eben nicht. Ein weiterer Punkt: Datenmengen werden mit Algorithmen verarbeitet, und oft wird die große Innovation in der KI in den Algorithmen gesehen, Stichwort Deep Learning. Allerdings existieren diese Algorithmen bereits seit 10, 20, 30 Jahren. Was neu ist, sind Daten in großen Mengen, um sie zu füttern, und die bezahlbare Rechenleistung, sie auszuführen.
Daten zu erheben, zu speichern und zu verarbeiten, kostet heute nicht mehr so viel. Eigentlich müssten Unternehmen überhaupt nicht überlegen, ob Sie auf Big Data setzen?
Im industriellen Umfeld kann man sich das Sammeln von Big Data mittlerweile leisten. Dort sind wir bestrebt, in allen Bereichen, in denen wir Daten aufzeichnen, sie so lange wie möglich aufzuheben. Mittlerweile gibt es die unglaublichsten Daten-Kombinationen, die zu Problemlösungen führen können. Künstliche Intelligenz ist beispielsweise in der Lage, nur auf Basis von Daten den kommenden Stillstand eines Motors oder einer Maschine vorhersagen, lange bevor Ingenieurslösungen warnen würden. Was wir aber noch nicht können, ist zu sagen, warum es zu diesen Stillständen kommen wird, die künstliche Intelligenz kann ihre Schlüsse nicht erklären.
Und gerade das ist das zentrale Problem. Bei uns verhält es sich so, dass wir unsere Ingenieure Jahre lang ausbilden. Sie können dann nach bestem Wissen, Gewissen und Lehrbuch Maschinen konstruieren, dabei kreativ sein, und großartige Dinge bauen. Und dann kommen wir mit Data Analytics und weisen im Nachhinein nach, dass es durch irgendeine wirre Kombination an Signalen möglich ist, einen Stillstand viel früher nachzuweisen. Unsere Ingenieurskunst mit datengetriebenem Wissen zu verbinden, wird ein interessanter Brückenschlag werden, der unbedingt notwendig ist. Das ist ein Thema, das uns momentan stark beschäftigt. Wir versuchen auch in Klein- und Mittelbetrieben, KI-Methoden so aufzubauen, dass sie auch erklären, warum sie aus bestimmten Daten gewisse Schlüsse ziehen.
Wie lautet Ihre Conclusio zum heutigen Thema?
Egal wo Sie im Wirtschafts- oder Privatleben stehen, wir leben gerade – was KI betrifft – in einer spannenden Zeit. Wir haben die kritische Masse erreicht, bei der genügende Daten und gut erforschte Algorithmen vorhanden sind, um Künstliche Intelligenz auf immer höhere Ebenen zu heben. Außerdem ist die Hardware spottbillig. Sie können auf ihrem Handy zum Beispiel ein tiefes neuronales Netz trainieren – wie man das macht lernen Sie im Internet, ohne dafür eine fundierte technische Ausbildung zu benötigen. KI wird zum Hilfsmittel, das in allen Lebensbereichen neue Möglichkeiten eröffnet.