Selbstversuch mit 333.000.000 Token : Was ist dran am Hype um Open Claw?
Vom Hype zum Realitätscheck: Björn Beck vom baden-württembergischen Innovationslabor wagt einen Selbstversuch mit Open Claw. Nach ersten Ernüchterungen kam er dabei zu positiven Resultaten, wie er im Werkstattbericht schildert.
Lernen Sie den Tagesspiegel Background kennen
Sie lesen einen kostenfreien Artikel vom Tagesspiegel Background. Testen Sie jetzt unser werktägliches Entscheider-Briefing und erhalten Sie exklusive und aktuelle Hintergrundinformationen für 30 Tage kostenfrei.
Mit bestehendem Konto anmelden
Die Schlagzeilen rund um den KI-Agenten Open Claw, der mit dem markanten Hummer im Logo, überschlugen sich in den letzten Wochen: Vom chinesischen „Raising the lobster“-Trend, bei dem scheinbar ganz China dabei ist, sich eigene Open-Claw-Agenten („Hummer”) großzuziehen, über dringende Empfehlungen für hiesige Führungsetagen („Jeder Vorstand sollte jetzt Open Claw testen!”), gipfelnd im Wechsel (kolportierte Summe: eine Milliarde US-Dollar) des österreichischen Open-Claw-Schöpfers Peter Steinberger zu Open AI.
Doch was passiert, wenn man diesen KI-Agenten jenseits der kontrollierten Hochglanz-Demos in einer privaten Testumgebung von der Leine lässt? Ein Selbstversuch zeigt, wie drastisch die Hürden für autonom agierende Systeme gesunken sind. Was kommt da auf uns zu?
Open Claw: Was ist das eigentlich
Open Claw ist ein Open-Source-Framework für autonome KI-Agenten. Im Gegensatz zu herkömmlichen KI-Chats arbeitet das System als dauerhafter Hintergrundprozess und erledigt Aufgaben auch dann weiter, wenn gerade niemand mit ihm interagiert.
Auch ohne laufende Aufgabe wacht das System standardmäßig alle 30 Minuten auf und prüft neue Aufgaben. Dafür kann die KI Software entwickeln, im Netz suchen, Programme ausführen und weitere Werkzeuge per Sprachbefehl, Chat oder über „Clawhub“ laden, einer Art Fähigkeiten-Store. Open Claw speichert Informationen über sich, den Besitzer und frühere Tätigkeiten. Es folgt Befehlen hartnäckig, analysiert Fehler und sucht alternative Wege bis zum Ziel.
Der Aufbau: Sicherheit durch Isolation
Der Selbstversuch startete an einem Freitag mit der Installation von Open Claw auf einem einfachen, privaten Linux-Server (4 Kerne, 8 Gigabyte RAM). Die eigentliche KI in Form eines großen KI-Sprachmodells (LLM) wurde extern per API angebunden. Aus Gründen der Ressourcen- und Kosteneffizienz fiel die Wahl auf ein neueres Modell von Nvidia, das im März 2026 veröffentlicht wurde: Nemotron 3 Super (120 Mrd. Parameter, MoE-Modell mit jeweils 12 Mrd. aktiven Parametern). Es handelt sich bei Nemotron um ein „echtes” Open-Source-Modell, da nicht nur die Gewichte (dann sogenanntes Open-Weights-Modell), sondern auch die Trainingsdaten und eine technische Beschreibung des Trainings veröffentlicht wurden.
Bemerkenswert: Die Trainingsdaten wurden synthetisch von „Flagship“-Modellen generiert. Die Installation von Open Claw in einer zustandslosen Docker-Umgebung war technisch herausfordernd: Das System verlangt für seine Autonomie eigentlich weitreichendere Rechte. Aus IT-Sicherheitsgründen wurde dennoch strikt auf Containern beharrt, um einen unbeaufsichtigten KI-Agenten im Heimnetzwerk zu verhindern.
Die Lernkurve: Wenn LLM-Schleifen ins Leere laufen
Nach der erfolgreichen Initialisierung, die einige Stunden in Anspruch genommen hatte, folgte am Samstag die erste Interaktion mit meinem „Hummer”. Dieser präsentierte sich zunächst als klassischer Chat und begrüßte mich mit der Frage: „Hi, ich bin gerade aufgewacht. Wer bin ich? Und wer bist Du?” Das klang nach einer längeren Aussprache, bevor die zentrale Fragestellung in den Blick genommen werden konnte: Worin besteht der technologische Paradigmenwechsel von rein reaktiven Chatbots hin zu agentischen Systemen, die komplexe Prozesse autonom planen und steuern?
Um das herauszufinden, hatte ich mir eine Aufgabe überlegt, die ich nach dem ersten Smalltalk übertrug. Open Claw sollte sich das Handels- und Unternehmensregister ansehen und mich täglich über interessante Bekanntmachungen informieren. Die Anweisung war kaum länger als drei Sätze. Sofort wurde stoisch losgearbeitet, im Internet recherchiert, Daten zusammengetragen und ein Lösungsansatz entwickelt und ausgeführt.
Das Ergebnis war, abgesehen vom astronomischen KI-Token-Verbrauch, ernüchternd. Irgendwo kamen die Agenten nicht weiter, es fehlte ein Zugriff auf benötigte Daten. Nach mehreren rekursiven LLM-Schleifen war sich der Hummer schließlich im Klaren darüber, dass er meine Aufgabe auch mit fiktiven Unternehmensdaten umsetzen könne. Darauf basierend wurde ein schickes Web-Dashboard aufgesetzt und mir als Lösung für meine Aufgabe präsentiert. Erste Enttäuschung machte sich breit, nachdem dies bei weiteren großen Aufgaben ähnlich ablief.
Zusammenarbeit: Mensch unter KI-Agenten
Ich musste also meine Arbeitsweise am Sonntag umstellen. Ich richtete mein Augenmerk verstärkt darauf, in welchen Portionen die Agenten ihre Aufgabe sinnvoll erledigen können und ab wann sie scheitern.
Ich änderte mein Vorgehen und delegierte fortan klar umrissene Arbeitspakete, die nacheinander in kurzer Zeit erledigt werden konnten. So sollten sich die Agenten nicht in rekursiven Schleifen an schwer lösbaren Aufgaben festfahren. Zur Prüfung dieses Ansatzes wählte ich eine neue Aufgabe: Open Claw sollte autonom in sozialen Netzwerken agieren. Mein Anspruch war, selbst keine einzige Zeile Code zu schreiben. Entwicklung, Setup und Fehlerbehebung sollten vollständig per natürlicher Sprache erfolgen. Bei größeren Problemen ließ ich zwei KI-Modelle Lösungswege diskutieren – mit erstaunlichem Erfolg. Nach 273 Millionen Token war die Mastodon-Integration geschafft: Die Agenten konnten nun Beiträge zur aktuellen Nachrichtenlage posten und auf Erwähnungen antworten.
Die zweite Social-Media-Integration
Nachdem die erste Integration geschafft war, stellte sich die Frage, wie reproduzierbar das Ergebnis ist. Hatte das System aus der bisherigen Arbeit etwas gelernt? Also erhielt Open Claw die Aufgabe, sich das soziale Netzwerk Bluesky näher anzuschauen und eine Integration zu entwickeln, die der Integration von Mastodon in ihrem grundlegenden Aufbau entspricht.
Hier funktionierte Open Claw faszinierend gut: Die mühelose Bluesky-Integration dauerte nur 40 Millionen Token und bedurfte minimaler menschlicher Anleitung. Der Grund dafür ist Open Claws Erinnerungsmechanismus, der Gesprächsverläufe fortlaufend als Erkenntnisse speichert. Durch das Wissen aus der vorherigen Mastodon-Integration – inklusive Skripten und Architektur – konnte der Agent die nötigen Schritte für den schnellen, autonomen Erfolg direkt ableiten.
Ausblick: Das Zeitalter der Inferenz
Im Versuch ist mir mehr klar geworden als nur Möglichkeiten, Open Claw sinnvoll zu nutzen. Der Versuch zeigte: Wir stehen an der Schwelle zu einem Paradigmenwechsel in der Art und Weise, wie Mensch und Maschine zusammenarbeiten. Mehr noch als bei der Einführung erster KI-Chats.
Schon sehr bald werden KI-Agenten alles möglich machen, was wir artikulieren können. Die einzige Währung, die es dafür braucht, ist KI-Rechenleistung: Agenten verbrennen Token in gigantischem Ausmaß.
Das erklärt auch teilweise die astronomisch anmutenden Investitionen der großen Tech-Konzerne in neue Rechenzentren. Künftig sollen unzählige Aufgaben von KI-Agenten autonom erledigt werden. Wer die Rechenleistung beherrscht, der beherrscht am Ende auch die niemals schlafenden Heerscharen der KI-Agenten. Nicht die Modelle sind der Flaschenhals, sondern die Bereitstellung von Inferenz, KI-Rechenleistung.
Die Abhängigkeit von Inferenz könnte künftig der Abhängigkeit von fossilen Energieträgern, Mikroelektronik und seltenen Erden ähneln oder diese sogar übertreffen. Eigene europäische KI-Fabriken sind daher mehr als nur die Stärkung von Datenschutz und digitaler Souveränität: Sie sichern den dauerhaften Nachschub jenes Rohstoffs, auf den das Zeitalter der Inferenz nicht verzichten kann.
Björn Beck leitet das Innovationslabor der Landesregierung im Staatsministerium Baden-Württemberg.
Lernen Sie den Tagesspiegel Background kennen
Sie lesen einen kostenfreien Artikel vom Tagesspiegel Background. Testen Sie jetzt unser werktägliches Entscheider-Briefing und erhalten Sie exklusive und aktuelle Hintergrundinformationen für 30 Tage kostenfrei.
Mit bestehendem Konto anmelden