Erweiterte Suche

Digitalisierung & KI

Standpunkt

Die Gegenmacht der Datenkollektive

Johannes Koch, Deutschlandchef bei Hewlett Packard Enterprise
Johannes Koch, Deutschlandchef bei Hewlett Packard Enterprise Foto: Hewlett Packard

Kooperative Verfahren wie das Lernen im Schwarm verbinden maximale Datenausbeute mit digitaler Souveränität. Aber am Ende hängt der Erfolg solcher Kollektive von den Fähigkeiten ihrer Mitglieder ab, schreibt der Deutschlandchef von Hewlett Packard Enterprise, Johannes Koch.

von Johannes Koch

veröffentlicht am 06.10.2022

Lernen Sie den Tagesspiegel Background kennen

Sie lesen einen kostenfreien Artikel vom Tagesspiegel Background. Testen Sie jetzt unser werktägliches Entscheider-Briefing und erhalten Sie exklusive und aktuelle Hintergrundinformationen für 30 Tage kostenfrei.

Jetzt kostenfrei testen
Sie sind bereits Background-Kunde? Hier einloggen

Die Wahrnehmung der Datenökonomie schillert zwischen Utopie und Dystopie – die einen trauen ihr zu, die größten Probleme unseres Planeten zu lösen, die anderen fürchten Überwachungskapitalismus und Überwachungsstaat. Das liegt in der Natur der Sache, denn Datenwissenschaft braucht Daten im Überfluss, um ihre Versprechen zu erfüllen. Es ist eine der wichtigsten Fragen für unsere Zukunft, wie sich dieser unersättliche Datenhunger mit Werten wie Privatheit, Freiheit und Souveränität vereinbaren lässt.

Zu den Vordenkern in dieser Frage gehört Alex Pentland, Informatiker und Professor am Massachusetts Institute of Technology. Der gegenwärtige Zustand der Datenökonomie ist für ihn die Wiederholung eines Musters vergangener industrieller Revolutionen: Die Produktionsmittel geraten zunächst in die Hände weniger Unternehmen – und als Reaktion darauf verbünden sich die Unmächtigen, um einen fairen Anteil am neuen Wohlstand zu erlangen.

Die heute adäquate Form eines solchen Kollektivs ist laut Pentland die Datengenossenschaft: Die Vielen legen ihre Daten zusammen und bilden damit eine Gegenmacht zum Oligopol – überwacht von Treuhändern, die ihre Rechte vertreten.

In der Tat werden solche Ansätze heute auf breiter Front vorangetrieben. Das Treuhändermodell nimmt beispielsweise im europäischen Data Governance Act eine zentrale Rolle ein. Und Organisationen wie die International Data Spaces Association oder Gaia-X entwickeln Standards für so genannte Datenräume, in denen Firmen ihre Daten gemeinsam nutzen können, ohne dafür eine zentrale Plattform einsetzen zu müssen.

Wie organisiere ich hierarchiefreie Datenkollektive?

Das Beispiel der Genossenschaftsbanken zeigt, dass solche Kooperativen sehr erfolgreich sein können. Allerdings ist es viel schwieriger, ein solches Modell für Daten zu etablieren. Denn während Geld ein vollständig generisches Medium ist, sind Daten konkret, komplex und heterogen.

Es braucht dafür nicht nur neue technische Standards, die eine gemeinsame Nutzung von Daten ermöglichen. Die Kooperative muss sich zudem auf einen komplexen Regelkatalog einigen, der festlegt, welche Daten mit wem für welche Zwecke bereitgestellt werden. Desto heterogener die Interessen der Mitglieder, desto komplexer und langwieriger ist dieser Prozess.

Umso interessanter ist daher eine alternative Kooperationsform, die auf den Austausch von Daten verzichtet, aber dennoch auf maximale Datenausbeute ausgerichtet ist. Sie beruht auf dem Modell des Schwarms und der Schwarmintelligenz.

Künstliche Intelligenzen lernen im Schwarm

Schwärme arbeiten ohne zentralen Koordinator und mit einfachen Verfahrensregeln, sind aber ebenso effektiv oder sogar noch effektiver als hierarchische Organisationen. Das Prinzip ist aus der Tierwelt bekannt, hat sich aber auch in menschlichen Anwendungsfeldern wie Software-Entwicklung oder Wikis bewährt.

Es liegt nahe, diesen Ansatz auch im Feld der Datenwissenschaft und Künstlichen Intelligenz (KI) nutzbar zu machen. Das funktioniert so: Eine Gruppe von Organisationen beschließt, gemeinsam ein KI-Modell für eine spezifische Aufgabe zu trainieren. Zunächst macht das jede einzelne Organisation mit den ihr zur Verfügung stehenden Daten. Danach werden die Trainingseffekte aller beteiligten Daten aggregiert, nicht aber die Daten selbst. Das verbesserte Modell steht allen Gruppenmitgliedern zur Verfügung.

In der Medizin kommt KI zum Beispiel regelmäßig zum Einsatz, um anhand von Röntgenbildern, Blutwerten oder Genomsequenzen Krankheiten zu diagnostizieren. Das Problem ist, dass die einzelnen Institute meist nicht genug Patientendaten für das KI-Training haben – andererseits ist es wegen des Datenschutzes sehr schwer oder unmöglich, solche Daten mit anderen Instituten auszutauschen. Mit Schwarmlernen lässt sich dieses Problem lösen, und inzwischen wurde nachgewiesen, dass dabei ebenso gute oder bessere Resultate erzielt werden als beim zentralisierten KI-Training.

Dabei erfolgt nicht nur das Lernen, sondern auch die Konsolidierung der Lerneffekte auf dezentrale Weise. Geregelt durch eine Blockchain und Smart Contracts wird pro Trainingsrunde ein neues Gruppenmitglied gewählt, das diese Aufgabe übernimmt. Dieses eminent demokratische Verfahren verhindert Machtakkumulation.

Es eignet sich damit nicht nur für Anwendungsfälle, in denen die Daten aufgrund von Regularien nicht weitergegeben werden dürfen – sondern auch dann, wenn Unternehmen etwa aufgrund von Konkurrenzverhältnissen keine Daten austauschen wollen. Sinnvoll ist das Verfahren außerdem, wenn die Datensätze so groß sind, dass ein regelmäßiger Transfer zu kostspielig oder langsam wäre.

Das Kollektiv ist nur so stark wie seine Mitglieder

Das Lernen im Schwarm liefert eine idealtypische Antwort auf die eingangs gestellte Frage, wie sich die Ziele der maximalen Datenausbeute und der digitalen Souveränität versöhnen lassen.

Allerdings sind nicht alle Datenanwendungen KI-Anwendungen. In vielen Fällen geht es nur darum, ein Datum zur richtigen Zeit an den richtigen Ort zu bringen, etwa eine Glatteiswarnung an die Fahrzeuge in der näheren Umgebung. Solche Anwendungsfälle erfordern oft einen Datenaustausch über Firmengrenzen hinweg. Das heißt: Der Aufbau von Datengenossenschaften und Datenräumen mag mühsam sein – wir können nicht darauf verzichten.

Und wir dürfen nicht vergessen, dass der Erfolg jeder Art von Daten- und KI-Kooperation letztlich von den Fähigkeiten ihrer Mitglieder abhängt. Sie müssen ihre eigenen Daten im Griff haben, um sie für andere nutzbar zu machen. Und Daten müssen die Triebfeder ihrer eigenen Wertschöpfung sein, um von den Daten der Kooperative zu profitieren.

Von diesem Niveau sind die meisten Firmen und Verwaltungen noch weit entfernt und der Weg dorthin ist schwer. Aber nur, wenn viele diesen Weg gehen und sich mit Gleichgesinnten zusammentun, können wir die Versprechen der Datenökonomie verwirklichen und gleichzeitig die Souveränität jedes einzelnen stärken.

Johannes Koch ist Vorsitzender der Geschäftsführung Deutschland und Senior Vice President DACH bei Hewlett Packard Enterprise; er ist Mitglied des Hauptvorstands des Digitalverbands Bitkom und des Board of Directors der amerikanischen Handelskammer in Deutschland (AmCham Germany).

Lernen Sie den Tagesspiegel Background kennen

Sie lesen einen kostenfreien Artikel vom Tagesspiegel Background. Testen Sie jetzt unser werktägliches Entscheider-Briefing und erhalten Sie exklusive und aktuelle Hintergrundinformationen für 30 Tage kostenfrei.

Jetzt kostenfrei testen
Sie sind bereits Background-Kunde? Hier einloggen