Claude Mythos: Anthropics mächtigstes Modell — geleakt vor dem Launch

29. März 2026

Am 26. März 2026 legte ein Konfigurationsfehler im Content-Management-System von Anthropic versehentlich rund 3.000 unveröffentlichte Blog-Assets in einem öffentlich durchsuchbaren Datenspeicher offen. Darunter: ein Draft-Blogpost, der ein Modell ankündigt, das das Unternehmen intern Claude Mythos nennt — beschrieben als „by far the most powerful AI model we've ever developed."

Die Ironie ist schwer zu übersehen. Das geleakte Dokument warnt, das neue Modell "poses unprecedented cybersecurity risks." Gesichert war es mit keiner.

Was passiert ist

Die Exposition wurde von Roy Paz, einem Senior AI Security Researcher bei LayerX Security, und Alexandre Pauwels, einem Cybersecurity-Forscher an der University of Cambridge, entdeckt. Fortune überprüfte das Material und wandte sich vor der Veröffentlichung an Anthropic.

Anthropics Reaktion war eindeutig. Ein Unternehmenssprecher bestätigte die Existenz des Modells und bezeichnete es als „step change" in der KI-Performance — „das fähigste, das wir je gebaut haben." Das Unternehmen räumte einen „human error" im CMS als Ursache des Leaks ein und erklärte, das Modell werde derzeit von einer kleinen Gruppe von Early-Access-Kunden getestet.

Eine neue Tier über Opus

Der Draft-Blogpost führt sowohl einen Code-Namen als auch einen Produktnamen ein. Der interne Code-Name des Modells ist Mythos. Die neue Modell-Tier heißt Capybara — eine vierte Tier, die über Anthropics bisheriger Flagship-Linie Opus angesiedelt ist.

Die bestehende Hierarchie lautet: Haiku (schnellstes, günstigstes) → Sonnet (ausgewogen) → Opus (leistungsfähigstes). Capybara würde diese nach oben erweitern mit einem Modell, das das geleakte Dokument als „larger and more intelligent than our Opus models — which were, until now, our most powerful" beschreibt.

Die Namensgebung folgt Anthropics Tradition mit Tiernamen und trägt ihre eigene Symbolik: Capybaras sind die größten Nagetiere der Welt, bekannt für ihr ruhiges Temperament trotz ihrer Größe. Ob das die beabsichtigte Metapher war, ist unklar — aber sie passt.

Was das geleakte Dokument behauptet

Laut Draft erzielt Claude Mythos „dramatically higher scores" als Claude Opus 4.6 in drei Bereichen: Software Coding, akademisches Reasoning und Cybersecurity. Das Dokument erwähnt auch, das Modell sei teuer im Betrieb und noch nicht für die allgemeine Verfügbarkeit bereit.

Die Cybersecurity-Dimension ist es, die die vorsichtige Rollout-Strategie begründet. Das Dokument warnt, das Modell sei „currently far ahead of any other AI model in cyber capabilities" und kündige „an upcoming wave of models that can exploit vulnerabilities in ways that far outpace the efforts of defenders" an.

Das ist kein Marketing-Statement — es ist eine Risikooffenlegung. Anthropics erklärte Antwort darauf: Den Rollout zunächst ausschließlich mit Organisationen zu beginnen, die sich auf Cyber-Verteidigung fokussieren, und ihnen Zeit zu geben, ihre Systeme zu härten, bevor die Fähigkeiten des Modells breiter verfügbar werden.

Das Dual-Use-Dilemma

Die Spannung, die Anthropic mit Mythos navigiert, ist vertraut — aber die Einsätze sind höher. Claude Opus 4.6 wurde bereits als dual-use eingestuft für seine Fähigkeit, bislang unbekannte Schwachstellen in Produktions-Codebasen zu finden — eine Fähigkeit, die sowohl Verteidigern als auch Angreifern nützt. Zeitgleich mit dem Launch von Opus 4.6 machte Anthropic öffentlich, dass eine chinesische staatlich gesponserte Gruppe Claude Code genutzt hatte, um rund 30 Organisationen — darunter Technologieunternehmen, Finanzinstitutionen und Regierungsbehörden — zu infiltrieren, bevor das Unternehmen die Operation aufdeckte und die Konten sperrte.

Mythos scheint diese Fähigkeiten signifikant weiterzuführen. Die Formulierung „unprecedented" im Draft ist nicht beiläufig — sie deutet darauf hin, dass Anthropics eigene interne Sicherheitsevaluierungen Ergebnisse lieferten, die eine andere Art von Launch-Strategie erforderten als alles, was das Unternehmen bisher versucht hat.

Die Cybersecurity-Branche hat das offenbar registriert: Nach dem Fortune-Bericht fielen die Aktien von Palo Alto Networks, CrowdStrike und Fortinet am 27. März um 4–6%.

Was nicht bekannt ist

Das Leak zeigt, was Anthropic zu sagen vorbereitet hatte — nicht, was unabhängige Evaluatoren gefunden haben. Es gibt keine Drittanbieter-Benchmark-Daten für Mythos, und die im Draft zitierten Zahlen sind Anthropics eigene. Da das Modell teuer im Betrieb ist und sich in kontrolliertem Testing mit einer kleinen Gruppe befindet, ruhen die meisten Behauptungen auf internen Einschätzungen.

Es sei auch darauf hingewiesen: Die „step change"-Sprache hat schon vor überschätzten Releases bestanden. Anthropic hat mit Opus 4.6 und Sonnet 4.6 erhebliche Glaubwürdigkeit erworben — aber Behauptungen in dieser Größenordnung laden zur Skepsis ein. Die Frage, ob Mythos einen echten Fähigkeitssprung darstellt oder eine durchdachte Positionierungsstrategie vor einem gemeldeten Q4-IPO, wird sich erst beantworten lassen, wenn das Modell breiter getestet wird.

Was als nächstes kommt

Anthropic hat kein Veröffentlichungsdatum angekündigt. Der geleakte Draft hatte ein Veröffentlichungsdatum in seinen strukturierten Daten eingebettet — aber das Unternehmen hat sich nach der unfreiwilligen Bekanntmachung auf keinen öffentlichen Zeitplan festgelegt. Angesichts der genannten Cybersecurity-Risiken scheint ein gestaffelter Rollout auf geprüfte Organisationen über einen längeren Zeitraum wahrscheinlicher als ein allgemeines Release in naher Zukunft.

Für Entwickler: Die Claude API verwendet eine einheitliche Schnittstelle über alle Modell-Tiers, sodass die Integration von Mythos/Capybara bei Verfügbarkeit minimale Änderungen an bestehenden Codebases erfordern sollte. Die Preise werden voraussichtlich höher liegen als bei Opus — das Dokument erwähnt explizit, das Modell sei teuer im Betrieb — aber keine Zahlen wurden bekanntgegeben.

Was das Mythos-Leak vielleicht mehr als alles andere zeigt, ist das Tempo, mit dem Anthropic sich bewegt. Im Februar 2026 lag der METR-Zeithorizont für Claude Opus 4.6 bei 14,5 Stunden — eine Verzehnfachung gegenüber dem Vorjahr. Wenn Mythos seine behaupteten Verbesserungen in Coding und Reasoning einlöst, werden sich diese Zahlen erneut verschieben. Die Frage ist weniger, ob ein step change kommt — sondern wie die Welt aussieht, wenn er ankommt.