In den letzten anderthalb Jahren konnten wir beobachten, wie die Entwicklung großer KI-Modelle, vor allem in Hinblick auf Spracherkennung, fortgeschritten ist. Diese Entwicklung bietet nun die Chance, den gesamten Markt für Künstliche Intelligenzen zu verändern. Bislang dominieren US-amerikanische und chinesische Akteure das Geschehen. Umso motivierter sind wir, nun im Rahmen des dritten European AI Forums in Zusammenarbeit mit KI-Verbänden aus Deutschland, Frankreich, Österreich, Kroatien, Slowenien, Bulgarien, Niederlande und Polen, eine europäische Alternative zu initiieren und anzustoßen. Als europäisches Netzwerk wollen wir mit Large European AI Models (LEAM) vor allem die digitale Souveränität Europas sichern und als starker globaler Akteur mit der Verwirklichung europäischer Werte auftreten.
2020 ist dem US-amerikanischen KI-Unternehmen Open AI ein revolutionärer Durchbruch gelungen: Dem Unternehmen gelang es, den Generative Pre-trained Transformer 3 (GPT-3), ein neuronales Netz mit gewaltigen Datenmengen, zu trainieren. Dieses hochleistungsfähige KI-Modell ermöglicht neue Anwendungen im Bereich des Natural Language Processing (NLP) und kann vielfältig zum Beispiel bei semantischen Suchen, Übersetzungen, Textgenerierung oder der Zusammenfassung von Text eingesetzt werden.
Durch die enormen Rechenkapazitäten ist der von Elon Musk und Microsoft geförderte GPT-3 in der Lage, führende, hochleistungsfähige KI-Modelle zu entwickeln und industrieübergreifend und global von fundamentaler Bedeutung zu werden. Immer mehr Unternehmen interessieren sich für die neue Entwicklung: In kurzer Zeit sind mehr als 300 Anwendungen und Start-ups auf Basis der GPT-3 API entstanden.
Der Wettlauf um die Super KI hat erst begonnen
Der Wettlauf hat gerade erst begonnen – auch Google und die chinesische Beijing Academy of Artificial Intelligence arbeiten aktuell an großen KI-Modellen. Aus europäischer Sicht birgt das einige Probleme: Zum einen gibt es erhebliche datenschutzrechtliche Bedenken, da Open AIs GPT-3 nur per API verwendbar ist. Deutsche Firmen müssten derzeit also eigene Daten und Kundendaten über den Atlantik schicken, um das Modell verwenden zu können. Zum anderen hat sich Open AI in den letzten Jahren von einer non-Profit Organisation zu einer for-Profit Organisation entwickelt, was gerade im Hinblick auf europäische Werte und Datenschutz eine Herausforderung werden kann. Kleinere Sprachfamilien könnten bei solch einem Modell unter den Tisch fallen und unternehmerische Interessen langfristig stärker werden als das Interesse für den Datenschutz.
Umso wichtiger ist es nun, aus europäischer Sicht eine Alternative zu schaffen, um auf lange Zeit nicht von den Services aus den USA oder China abhängig zu werden und europäische Werte zu berücksichtigen und umzusetzen. Wir haben die Befürchtung, dass europäische Akteure ansonsten hinter die US-amerikanischen zurückfallen und mit den schnellen Innovationszyklen nicht mehr mithalten können. Wir haben diese Entwicklung bereits in anderen Digitalsektoren wie Suchmaschinen, mobilen Anwendungen oder Cloud Anwendungen erlebt. Die Gefahr besteht darin, dass AI Funktionalitäten zunehmend von zentralen Services genutzt werden und Mono- oder Oligopole entstehen werden.
Für eine europäische Lösung müssen demnach umfangreiche Trainingsdatensätze erschaffen und gesammelt werden. Dabei müssen diese Datensätze die Anforderungen des europäischen Datenschutzes erfüllen. Neben der Forschung im Bereich der Algorithmik muss zudem eine europäische Hyperscale-Infrastruktur geschaffen werden, die – auf Basis von Gaia-X – die Voraussetzung für die Entwicklung dieser Modelle besitzt. Erreicht werden kann dies durch die weiterführende exzellente europäische KI-Forschung als Grundvoraussetzung für ein innovatives KI-Ökosystem.
Open Source und Free Access als Erfolgsfaktoren
Um langfristig erfolgreich zu sein und die unter LEAM entwickelten Modelle kontinuierlich weiterentwickeln zu können, müssen Organisationsstrukturen und Prozessen entstehen, die diesen Workflow ermöglichen.
Im Vergleich zu vielen jetzigen KI-Modellen ist es zudem von enormer Wichtigkeit, dass diese Modelle ins europäische Innovations-Ökosystem integriert werden, und den Prinzipien Open Source und Free Access folgen.
Wir benötigen deshalb eine mutige paneuropäische Kooperation der Industrie, Politik und Forschung. Nur gemeinsam können wir die benötigte Infrastruktur schaffen und die erforderliche Finanzierung sicherstellen. Nur wenige Unternehmen können solche KI-Modelle trainieren, da das sehr teuer ist. Externe Beobachter schätzen die Kosten für einen Trainingsdurchlauf von GPT-3 auf fünf bis 20 Millionen US-Dollar. Ein Betrag, der für Einzelakteure kaum zu stemmen ist.
Diese europäische Initiative ist essenziell, um wettbewerbsfähig zu werden werden, dafür, dass viele europäische Sprachen integriert werden und sich unsere Werte und Qualitätsstandards in großen KI-Modellen widerspiegeln. Um dies zu erreichen, bedarf es einer zielgerichteten und vor allem Ökosystem-freundlichen Umsetzung.
LEAM stellt somit für uns eine nachhaltige und vielversprechende Alternative zu den chinesischen und US-amerikanischen Vorreitern dar und kann einen erheblichen Anteil zur europäischen digitalen Souveränität leisten.
Jörg Bienert ist Vorstandsvorsitzender und Gründungsmitglied des KI-Bundesverbandes. Seit Juli 2019 ist er Chief Product Manager bei der Alexander Thamm GmbH. Das Unternehmen beschäftigt sich mit Data Science und Künstlicher Intelligenz.