

Anthropic hat letzte Woche einen Beitrag zu rekursiver Selbstverbesserung veröffentlicht, also zu dem Punkt, an dem ein KI-System anfängt, an seinem eigenen Nachfolger mitzubauen. Bevor ich zum eigentlichen Argument komme, lohnt es sich, die Zahlen einen Moment sacken zu lassen.
Über 80% des Codes, der bei Anthropic in die Produktion wandert, stammt inzwischen von Claude selbst. Der typische Engineer merged seit Anfang dieses Jahres achtmal so viel Code wie 2024. Auf den offenen, schlecht definierten Aufgaben, an denen Modelle bisher reihenweise gescheitert sind, kletterte die Erfolgsrate innerhalb von sechs Monaten von 26 auf 76 Prozent. Und wenn eine Forschungs-Session vom Kurs abkommt, kennt Claude inzwischen in 64 Prozent der Fälle den besseren nächsten Schritt als der Mensch daneben, ein halbes Jahr zuvor lag dieser Wert noch bei gut der Hälfte.

Das ist die steilste Kurve, die ich in diesem Feld seit Langem gesehen habe. Vollständig autonom ist das alles noch nicht, aber die Richtung ist eindeutig, und das Tempo könnte uns früher einholen, als den meisten lieb ist.
Und gerade deshalb ist der für mich wichtigste Absatz des ganzen Artikels der, in dem Anthropic selbst auf die Bremse tritt.
Anthropic schreibt sinngemäß, dass rekursive Intelligenz für sich genommen noch nicht verändert, wie Produktion abläuft, wie Gesellschaften sich organisieren, wie Märkte funktionieren. Mehr Intelligenz kann nicht lernen, was ein Medikament über Jahrzehnte im Körper anrichtet. Sie kann keine Wahl früher abhalten, als eine Verfassung es erlaubt. Und sie macht aus einem Fremden über ein Wochenende keinen alten Freund.
Das klingt fast nebensächlich, ist aber die ehrlichste Aussage im ganzen Text. Ein Labor, das gerade vorrechnet, wie seine eigene Software sich selbst beschleunigt, sagt im selben Atemzug, dass diese Beschleunigung an den meisten Stellen der echten Welt verpufft. Intelligenz löst genau die Probleme, die rechenbar sind. Alles andere bleibt an Zeit, an Institutionen und an Beziehungen gebunden, und keine dieser drei Größen folgt einer GPU-Taktung.
Für die meisten Menschen bleibt das gefühlte Tempo deshalb an genau diesen Engpässen hängen, während das Labor davor mit Rechengeschwindigkeit läuft. Diese Schere ist das eigentliche Thema dieser Ausgabe.
Anthropic liefert das passende Werkzeug gleich selbst mit, ein Gesetz aus der Computerarchitektur. 1967 formulierte Gene Amdahl eine Beobachtung, die heute jeder kennt, der schon mal versucht hat, ein Programm durch mehr Prozessoren schneller zu machen. Der mögliche Geschwindigkeitsgewinn ist gedeckelt durch den Anteil, der sich nicht parallelisieren lässt. Wenn 95 Prozent eines Ablaufs beliebig beschleunigbar sind und 5 Prozent seriell bleiben müssen, kommst du am Ende nie über das Zwanzigfache hinaus, egal wie viele Prozessoren du draufwirfst. Diese kleinen 5 Prozent setzen die Obergrenze für das Ganze.
Genau dieses Gesetz beschreibt gerade jede KI-Einführung in jedem Unternehmen, das ich kenne. Die Modelle beschleunigen den rechenbaren Teil der Arbeit ins Absurde. Der serielle Rest läuft weiter im alten Tempo: die Freigabe durch die Rechtsabteilung, die Gremiensitzung, der Datenzugang, der erst durch drei Instanzen muss, die Entscheidung, die in fünf Köpfen liegt und in keinem Dokument steht. Und dieser serielle Rest deckelt den Gewinn aus allem anderen.
Anthropic hat das am eigenen Leib erlebt, und das ist der überzeugendste Teil des Artikels. Sobald Claude schneller Code produzierte, als ein Mensch ihn prüfen konnte, wurde das Code-Review zum Flaschenhals. Genau dieses Muster trifft jede Wissensarbeit, sobald ihr Agenten ernsthaft einsetzt: Wenn ein Agent zehn Angebote in der Stunde schreibt, wandert der Engpass vom Tippen zum Freigeben, und plötzlich ist der Mensch, der gegenzeichnet, das langsamste Glied der Kette. Ein Schritt wird beschleunigt, der Engpass taucht eine Tür weiter wieder auf. Das gilt im Frontier-Labor mit den weltbesten Leuten genauso wie im Mittelstand mit einer überlasteten IT.
Hier ist der Punkt, an dem ich seit dem Artikel hängenbleibe. Wir reden über KI fast immer so, als hinge der Fortschritt am nächsten Modell-Release. Tatsächlich laufen in jeder Organisation zwei völlig verschiedene Uhren.
Die eine Uhr ist die Intelligenz der Modelle. Sie skaliert mit Compute, und sie läuft atemberaubend schnell. Die Kurven aus dem Anthropic-Artikel sind genau diese Uhr.
Die andere Uhr ist die Organisation selbst, also der Zugang zu den Daten, der gepflegte Kontext und die Prozesse drumherum. Diese Uhr skaliert mit Freigaben, Gremien und Gewohnheiten, und sie läuft so schnell wie das langsamste beteiligte Gremium. Ein Betriebsrat, der über Monate über Meeting-Transkripte verhandelt, taktet diese Uhr. Eine IT, die Tool-Zugriffe nur quartalsweise freigibt, taktet sie. Daten, die über zwölf Systeme verstreut liegen und an die der Agent nicht heran darf, takten sie auch.
Diese beiden Uhren driften gerade mit jedem Monat weiter auseinander. Und der Abstand zwischen ihnen entscheidet in den nächsten Jahren mehr über Vorsprung und Rückstand als jeder einzelne Modell-Release. Mit der reinen Intelligenz der Modelle hat dieser Abstand am wenigsten zu tun.
Ich formuliere die Konsequenz bewusst zugespitzt, weil sie unbequem ist. Selbst wenn die Modelle morgen hundertmal intelligenter wären, und sie werden das wahrscheinlich schneller, als uns lieb ist, würden die meisten Organisationen mit fast denselben Problemen kämpfen wie heute. Ein hundertmal intelligenterer Agent mit gesperrtem Datenzugang ist hundertmal intelligenter und weiß trotzdem nichts über euer Geschäft. Die Intelligenz steckt im Modell, der Engpass steckt in der Organisation, und kein Modell-Release der Welt räumt ihn für euch weg.
In meinem Newsletter Artificial Teams habe ich über das Jevons-Paradox geschrieben: Effizienz senkt den Verbrauch einer Ressource nicht, sie erhöht ihn, weil der Engpass wandert. Amdahl ist die strengere Schwester dieser Beobachtung. Jevons sagt, der Engpass wandert. Amdahl sagt, wohin, nämlich genau auf den Schritt, den ihr nicht beschleunigt habt.
Bei uns bei DECAID lässt sich das fast laborhaft beobachten. Wir haben unseren Angebotsprozess so weit automatisiert, dass zehn Minuten nach einem Sales-Call ein fertiges Angebot beim Kunden liegt. Weniger Arbeit wurde es dadurch nicht. Es wurden mehr Angebote, mehr Zusagen und ein neuer Engpass: die Delivery. Die Stunde vor Ort, der Workshop, die menschliche Begleitung, das lässt sich nicht in zehn Minuten erledigen. Wir haben den schnellen Teil schneller gemacht und sind dadurch genau in den langsamen Teil hineingelaufen. Das ist Amdahl in Reinform, und es ist eine gute Nachricht, weil es zeigt, wo der Wert künftig sitzt.
Die schlechte Variante derselben Geschichte sieht man in Unternehmen, die teure Lizenzen kaufen und dann den Datenzugang sperren. Das schnelle Teil ist eingekauft, der langsame Teil ist nie angefasst worden, und am Ende wundert sich der Vorstand, warum die viel beschworene Produktivität ausbleibt. Anthropic ordnet die eigene Produktivität dabei ehrlich ein: Die Belegschaft schätzte den Faktor auf rund vier, real lag er spürbar darunter. Schon im Frontier-Labor klafft eine Lücke zwischen gefühltem und echtem Tempo. In einer durchschnittlichen Organisation ist sie ein Abgrund.
Die praktische Frage hat sich damit verschoben. Sie lautet inzwischen: Was sind bei euch die seriellen 5 Prozent, also der Schritt, der weiter im alten Tempo läuft? Aus der Arbeit mit über 170 Unternehmen sehe ich immer wieder dieselben vier Kandidaten.
Der erste ist der Datenzugang. Solange der Agent nicht an Mails, Transkripte, das CRM und die Wissensbasen heran darf, rät er. Über das Daten-Paradox und die Schatten-KI, die daraus entsteht, habe ich im Newsletter ausführlich geschrieben.
Der zweite ist der fehlende Kontext. Selbst bei offenem Zugang nützt es wenig, wenn die Begründungen hinter den großen Entscheidungen in fünf Köpfen leben und nirgends dokumentiert sind. Genau dafür braucht es Transkription auf Opt-Out und gepflegte Wissensbasen, sonst startet jeder Agent bei null.
Der dritte ist die Freigabe-Architektur. Wenn jeder schreibende Schritt eines Agenten erst durch ein Gremium muss, das alle zwei Wochen tagt, habt ihr die Intelligenz im Haus und den Engpass in der Sitzungsplanung. Hier hilft eine Governance, die granulare Schreibrechte mit Audit-Log und klaren Freigabeschwellen kombiniert, statt pauschal zu blockieren.
Der vierte ist die Zuständigkeit. In den meisten Unternehmen fühlt sich schlicht niemand dafür verantwortlich, dass die KI überhaupt mitbekommt, was läuft. Das ist die Rolle des Agent Deployer, und sie ist in fast jeder Organisation unbesetzt.
Wenn ihr aus diesem Artikel eine Sache mitnehmt, dann diese: Hört auf, auf das nächste Modell zu warten, und fangt an, euren langsamsten Schritt zu vermessen.
Erstens, identifiziert euren seriellen Engpass. Nehmt einen Prozess, den ihr gerade mit KI beschleunigen wollt, und fragt euch ehrlich, welcher Schritt darin weiterhin im alten Tempo läuft. Genau dieser Schritt deckelt euren gesamten Gewinn, und meistens ist es kein Modell-Thema, sondern eine Freigabe, ein fehlender Zugang oder eine offene Zuständigkeit.
Zweitens, investiert in die langsame Uhr, nicht in die schnelle. Die schnelle Uhr, also das Modell, könnt ihr einkaufen. Die langsame Uhr, also Datenzugang, gepflegter Kontext und Freigabe-Architektur, müsst ihr selbst bauen. Jeder Euro, der in die langsame Uhr fließt, hat heute den höheren Hebel, weil die schnelle ohnehin von alleine läuft.
Drittens, besetzt die Zuständigkeit. Eine Person, die den Auftrag und die Zeit hat, den Pfad vom Modell zum Prozess zu bauen, bewegt in einem Quartal mehr als drei weitere Lizenzen. Ohne diese Rolle bleibt die beste KI ein teurer Chat-Bot.
Dahinter steckt eine strategische Verschiebung, die viele unterschätzen. Das Modell selbst ist längst Commodity, dasselbe Frontier-Modell mietet euer Wettbewerber zum selben Preis, und ein Vorsprung über das Modell hält keine drei Monate. Der einzige verteidigbare Burggraben, der euch bleibt, ist das Tempo eurer eigenen Uhr, also wie schnell bei euch aus einer Idee ein angebundener, freigegebener Agent im Prozess wird.
Bei DECAID arbeiten wir genau an dieser langsamen Uhr, bei uns selbst und bei unseren Kunden. Die über 150 Skills, von denen rund 50 täglich automatisch laufen, sind nur die sichtbare Spitze. Darunter liegt die eigentliche Arbeit: Transkripte auf Opt-Out, ein Memory-Layer mit den Conventions des Teams, angebundene Datenquellen und klare Zuständigkeiten dafür, dass dieser Kontext aktuell bleibt. Das ist weniger spektakulär als ein neuer Modell-Release, aber es ist der Teil, der über euren Vorsprung entscheidet.
Das Labor rennt mit Rechengeschwindigkeit. Euer Unternehmen läuft im Tempo seines langsamsten Gremiums. Wer diesen Abstand verkleinert, gewinnt die nächsten Jahre. Wer auf das nächste Modell wartet, verwaltet ihn.
Wenn ihr gerade in einem Rollout steckt und nicht sicher seid, wo euer langsamster Schritt sitzt, schreibt mir gerne auf LinkedIn. Ich schaue mir den Prozess an und sage euch, welcher der vier Engpässe bei euch den größten Hebel hat.


0 Comments
Login or Register to Join the Conversation
Create an AccountLog in