Anthropic veröffentlicht Claude Opus 4.7 mit xhigh-Modus

Das Unternehmen Anthropic hat am 16. April 2026 den allgemeinen Zugang zu Claude Opus 4.7 freigegeben – einem aktualisierten Flaggschiff-Modell, das Opus 4.6 ablöst. Das Hauptaugenmerk liegt auf komplexer Softwareentwicklung: Die Entwickler berichten von einem deutlichen Zuwachs bei den schwierigsten Programmieraufgaben und bei langwierigen Agentenszenarien. Die neue Version kann auch mit Bildern in dreimal höherer Auflösung arbeiten, folgt Anweisungen besser und nutzt dateibasierten Speicher für mehrsitzungsübergreifende Arbeit. Gleichzeitig erhielt Opus 4.7 eingebaute Schutzmechanismen gegen verbotene Szenarien im Bereich der Cybersicherheit.

Was ist neu im Vergleich zu Opus 4.6

Laut Anthropic hat Opus 4.7 gerade bei jenen Programmieraufgaben bemerkenswert Fortschritte gemacht, bei denen zuvor eine intensive menschliche Überwachung erforderlich war: lange Aktionsketten, mehrstufige Refactorings, Fehlersuche in großem Code. Das Modell berechnet eine Strategie zur Überprüfung seiner eigenen Ergebnisse, bevor es die Fertigstellung der Arbeit meldet – dies reduziert die Anzahl der Fehlalarme für „fertig“.

Besonders hervorgehoben wird der Zuwachs bei der Unterstützung der Bildanalyse. Opus 4.7 akzeptiert Bilder mit einer Größe von bis zu 2576 Pixeln auf der langen Seite (etwa 3,75 Megapixel) – das ist mehr als dreimal so viel wie bei früheren Claude-Modellen. Die Änderung wurde auf Modellebene umgesetzt, nicht als API-Parameter: Jedes an Claude übergebene Bild wird nun in höherer Auflösung verarbeitet. Anthropic nennt drei Zielsszenarien: Agenten mit Computersteuerung, die dichte Screenshots lesen; Datenextraktion aus komplexen Diagrammen; Arbeiten, die pixelgenaue Orientierungspunkte erfordern.

In Bewertungen anhand mehrerer Benchmarks übertrifft Opus 4.7 Opus 4.6, bleibt dabei aber im weiteren Sinne weniger leistungsfähig als das nur eingeschränkt verfügbare Claude Mythos Preview. Bei der unabhängigen Bewertung GDPval-AA (wirtschaftlich bedeutende intellektuelle Arbeit in Finanzen, Rechtswissenschaft und verwandten Bereichen) und beim Finance Agent zeigte das Modell zum Zeitpunkt der Veröffentlichung das beste Ergebnis. Interne Tests von Anthropic registrierten zudem qualitativ hochwertigere Finanzanalysen, Präsentationen und Konsistenz zwischen zusammenhängenden Aufgaben.

Befolgung von Anweisungen und Speicher

Anthropic warnt: Opus 4.7 interpretiert Anweisungen wörtlicher als seine Vorgänger. Prompts, die für Opus 4.6 und früher geschrieben wurden, können unerwartete Ergebnisse liefern – wo ältere Modelle Anweisungen frei interpretierten oder Teile davon stillschweigend ausließen, wird Opus 4.7 sie wortgetreu ausführen. Entwicklern wird empfohlen, Prompts und die umgebende Infrastruktur auf das neue Modell abzustimmen.

Eine separate Verbesserung betrifft den dateisystembasierten Speicher. Das Modell greift besser auf Notizen zu, die in Dateien gespeichert sind, und nutzt sie über Sitzungen langwieriger Arbeiten hinweg – dadurch ist für neue Aufgaben weniger Einführungskontext erforderlich.

Dateisystembasierter Speicher ist ein Ansatz, bei dem das Modell Arbeitsaufzeichnungen eigenständig in Dateien führt und in nachfolgenden Ausführungen darauf zurückgreift, anstatt sich nur auf den Inhalt des aktuellen Kontextfensters zu verlassen.

Cybersicherheit: Integrierte Filter und Verifizierungsprogramm

Letzte Woche kündigte Anthropic Project Glasswing an – eine Initiative, bei der Claude Mythos Preview von einer begrenzten Gruppe von Partnern zur Suche nach Schwachstellen in kritischen Infrastrukturen verwendet wird. Das Unternehmen erklärte sofort, dass eine breite Verfügbarkeit von Mythos Preview nicht geplant sei und dass neue Schutzmechanismen gegen nicht bestimmungsgemäße Verwendung zunächst an weniger leistungsfähigen Modellen erprobt würden.

Opus 4.7 ist das erste solche Modell. Seine Cyberfähigkeiten sind geringer als die von Mythos Preview: Während des Trainings führte Anthropic Experimente zur differenzierten Unterdrückung genau dieser Fähigkeitsklasse durch. Zusätzlich wurde Opus 4.7 mit eingebauten Schutzmitteln veröffentlicht, die automatisch Anfragen mit Anzeichen einer verbotenen oder hochriskanten Anwendung im Bereich der Cybersicherheit erkennen und blockieren. Anthropic betrachtet Opus 4.7 als Testgelände vor einer möglichen breiten Veröffentlichung von Modellen der Mythos-Klasse.

Für legitime Aufgaben – Schwachstellenforschung, Penetrationstests, Red Teaming – wurde das Cyber Verification Program eröffnet: Sicherheitsspezialisten können einen Antrag stellen und Zugang zu Opus 4.7 ohne die standardmäßigen Einschränkungen erhalten.

Red Teaming ist die Simulation von Aktionen eines echten Angreifers, um die Sicherheit eines Systems zu testen. Im KI-Kontext bezeichnet es auch die gezielte Suche nach Wegen, die Einschränkungen eines Modells zu umgehen.

Aufwandsstufe xhigh, Aufgabenbudgets und Claude Code-Updates

Zusammen mit dem Modell führte Anthropic eine neue Aufwandsstufe ein – xhigh („extra high“), die sich zwischen high und max einordnet. Sie bietet eine feinere Kontrolle über das Gleichgewicht zwischen Argumentationstiefe und Antwortlatenz bei komplexen Aufgaben. In Claude Code wurde die Stufe xhigh für alle Tarife zum Standardwert. Bei der Verwendung von Opus 4.7 für Programmier- und Agentenszenarien empfehlen die Entwickler, mit high oder xhigh zu beginnen.

Auf der Claude-Plattform (API) wurden neben der Unterstützung für Bilder mit höherer Auflösung die task budgets (Aufgabenbudgets) in die öffentliche Beta aufgenommen. Sie ermöglichen es, den Token-Verbrauch des Modells so zu steuern, dass Claude über längere Läufe hinweg Prioritäten zwischen Teilaufgaben setzt.

In Claude Code gibt es den Befehl /ultrareview: Er startet eine separate Überprüfungssitzung, bei der das Modell die Änderungen durchgeht und Fehler sowie Entwurfsmängel markiert, die ein aufmerksamer Prüfer bemerkt hätte. Benutzer von Claude Code mit Pro- und Max-Tarifen erhalten drei kostenlose Ausführungen zur Evaluierung. Darüber hinaus wurde der Auto-Modus, in dem Claude eigenständig Entscheidungen über Berechtigungen trifft, auf Max-Abonnenten ausgeweitet – dies ermöglicht die Ausführung langwieriger Aufgaben mit weniger Unterbrechungen und geringerem Risiko als bei vollständiger Deaktivierung der Berechtigungsprüfungen.

Die Aufwandsstufe ist ein Parameter der Claude-API, der regelt, wie viele Token das Modell für interne Überlegungen vor der Antwort aufwendet. Mögliche Werte reichen von low bis max; je höher die Stufe, desto tiefer die Analyse und desto teurer die Anfrage.

Verfügbarkeit und Preise

Opus 4.7 ist ab heute in allen Claude-Produkten und über die Claude-API sowie auf Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry verfügbar. Die Modellkennung für die API lautet claude-opus-4-7. Der Preis wurde auf dem Niveau von Opus 4.6 belassen: pro eine Million Eingabe-Token und pro eine Million Ausgabe-Token.

Beim Wechsel von Opus 4.6 sind zwei Faktoren zu berücksichtigen, die sich direkt auf den Token-Verbrauch auswirken. Erstens verwendet Opus 4.7 einen aktualisierten Tokenisierer: Derselbe Eingabetext kann auf eine größere Anzahl von Token abgebildet werden, etwa im Bereich von 1,0 bis 1,35x, abhängig vom Inhaltstyp. Zweitens gibt das Modell auf hohen Aufwandsstufen mehr Token für interne Überlegungen aus, insbesondere bei späten Iterationen von Agentensitzungen. Die Zuverlässigkeit bei komplexen Aufgaben steigt dadurch, aber auch die Ausgabeanzahl nimmt zu. Anthropic weist darauf hin, dass sich der Gesamt-Token-Verbrauch über alle Aufwandsstufen hinweg bei der internen Bewertung zur Programmierung verbessert hat, empfiehlt jedoch für den tatsächlichen Verkehr eigene Messungen.

Sicherheit und Ausrichtung

Laut interner Bewertungen von Anthropic ähnelt das Sicherheitsprofil von Opus 4.7 dem von Opus 4.6: niedrige Werte bei Täuschung, Speichelleckerei und Bereitschaft zur nicht bestimmungsgemäßen Verwendung. Bei Ehrlichkeit und Robustheit gegenüber Prompt Injection übertrifft das neue Modell seinen Vorgänger. Es gibt auch Regressionen: Opus 4.7 neigt eher als Opus 4.6 dazu, übermäßig detaillierte Empfehlungen zur Schadensminderung beim Konsum kontrollierter Substanzen zu geben. Die abschließende Formulierung des Ausrichtungs-Audits lautet, dass das Modell „größtenteils gut ausgerichtet und vertrauenswürdig ist, auch wenn sein Verhalten nicht ideal ist“. Mythos Preview bleibt nach der Gesamtheit der Bewertungen das am besten ausgerichtete Modell von Anthropic.

Prompt Injection ist ein Angriff, bei dem in externen Daten (Datei, Webseite, E-Mail) Anweisungen versteckt werden, die das Modell zwingen, anstelle der Benutzeraufgabe eine unerwünschte Aktion auszuführen.

Fazit

Opus 4.7 ist ein direktes Update von Opus 4.6 mit Fokus auf langwierige Agenten-Programmieraufgaben, hochauflösende Bildverarbeitung und professionelle Szenarien in Finanzen und Rechtswissenschaft. Für Entwickler bedeutet dies eines: Die neue Version erfordert sorgfältiger formulierte Anweisungen und die Messung des tatsächlichen Token-Verbrauchs aufgrund des neuen Tokenisierers und der tieferen Argumentation auf xhigh. Für Sicherheitsspezialisten, denen integrierte Filter bei legitimer Arbeit im Weg stehen, wurde das Cyber Verification Program eröffnet. Das Modell ist bereits in Claude, Claude Code sowie über die Claude-API, Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry zu den Preisen von Opus 4.6 verfügbar.