Anthropic、Claude Opus 4.7を「xhigh」モード付きでリリース

企業Anthropicは2026年4月16日、Claude Opus 4.7への一般アクセスを公開した。これはOpus 4.6に代わる、更新されたフラッグシップモデルである。主な焦点は複雑なソフトウェア開発に置かれており、開発元は最も困難なプログラミングタスクや長期にわたるエージェントシナリオにおいて顕著なパフォーマンス向上を報告している。新バージョンはまた、3倍高い解像度の画像を処理でき、指示への追従性が向上し、マルチセッション作業のためにファイルベースのメモリを使用する。同時にOpus 4.7には、サイバーセキュリティ分野における禁止シナリオに対する組み込みの保護メカニズムが搭載されている。

Opus 4.6との比較における新機能

Anthropicによれば、Opus 4.7は、以前は綿密な人間の監督が必要だったプログラミングタスク、すなわち長いアクションチェーン、多段階のリファクタリング、大規模コード内のデバッグにおいて、顕著に進歩している。このモデルは、作業終了を報告する前に自身の結果を検証する戦略を計算するため、「完了」の誤検知を減らす。

特に強調されているのは、画像分析のサポートにおける進歩である。Opus 4.7は、長辺で最大2576ピクセル(約375万ピクセル)の画像を受け入れる。これは以前のClaudeモデルの3倍以上である。この変更はAPIパラメータではなくモデルレベルで実装されており、Claudeに渡された任意の画像がより高解像度で処理される。Anthropicは3つのターゲットシナリオを挙げている:高密度のスクリーンショットを読み取るコンピュータ制御エージェント、複雑な図からのデータ抽出、ピクセル単位の位置情報を必要とする作業。

複数のベンチマーク評価において、Opus 4.7はOpus 4.6を上回っているが、限定的に利用可能なClaude Mythos Previewほど広い意味では依然として能力は劣る。独立評価のGDPval-AA(財務、法律、および関連分野における経済的に重要な知的作業)およびFinance Agentにおいて、このモデルはリリース時点で最高の結果を示した。Anthropicの内部テストでも、より高品質な財務分析、プレゼンテーション、および関連タスク間の一貫性が確認されている。

指示への追従性とメモリ

Anthropicは注意を促している:Opus 4.7は、先行モデルよりも指示を文字通りに解釈する。Opus 4.6以前向けに書かれたプロンプトは、予期しない結果をもたらす可能性がある。古いモデルが指示を自由に解釈したり、その一部を暗黙のうちに無視したりしたのに対し、Opus 4.7はそれらを逐語的に実行する。開発者は新しいモデルに合わせてプロンプトとラッパーを再調整することが推奨される。

別の改善点は、ファイルシステムベースのメモリに関するものである。このモデルは、ファイルに保存されたメモをより適切に参照し、長期作業のセッション間でそれらを使用するため、新しいタスクに必要な導入コンテキストが少なくなる。

ファイルシステムベースのメモリとは、モデルが作業記録をファイルに自律的に保持し、現在のコンテキストウィンドウの内容だけに頼るのではなく、後続の実行でそれらを参照するアプローチである。

サイバーセキュリティ:組み込みフィルターと検証プログラム

先週、AnthropicはProject Glasswingを発表した。これは、限られたパートナーグループが重要なインフラストラクチャの脆弱性を探すためにClaude Mythos Previewを使用するイニシアチブである。同社は、Mythos Previewの広範な利用可能性は計画されておらず、意図しない使用に対する新しい保護メカニズムはまず能力の低いモデルで試されると直ちに述べた。

Opus 4.7はそのような最初のモデルである。そのサイバー能力はMythos Previewよりも低い。Anthropicはトレーニング中に、まさにこのクラスの能力を差別的に抑制する実験を行った。さらにOpus 4.7は、サイバーセキュリティ分野における禁止されたまたは高リスクの適用の兆候を示すリクエストを自動的に識別してブロックする組み込みの保護手段とともにリリースされている。AnthropicはOpus 4.7を、Mythosクラスモデルの潜在的な広範なリリースの前の試験場と見なしている。

正当なタスク(脆弱性調査、ペネトレーションテスト、レッドチーミング)のために、Cyber Verification Programが開設されている。セキュリティ専門家は申請し、標準的な制限なしでOpus 4.7へのアクセスを得ることができる。

レッドチーミングとは、実際の攻撃者の行動をシミュレートしてシステムのセキュリティをテストすることである。AIの文脈では、モデルの制限を回避する方法を意図的に探すことも指す。

努力レベル「xhigh」、タスク予算、およびClaude Codeの更新

モデルとともに、Anthropicは新しい努力レベル「xhigh」(「extra high」)を導入した。これはhighとmaxの中間に位置する。これにより、複雑なタスクにおける推論の深さと応答遅延の間のバランスをより細かく制御できる。Claude Codeでは、xhighレベルがすべての料金プランでデフォルト値となった。プログラミングおよびエージェントシナリオにOpus 4.7を使用する場合、開発者はhighまたはxhighから始めることを推奨する。

Claudeプラットフォーム(API)では、高解像度画像のサポートに加えて、タスク予算(task budgets)がパブリックベータ版として開始された。これにより、長期間の実行にわたってClaudeがサブタスク間で優先順位を付けられるように、モデルによるトークン消費を指示することができる。

Claude Codeにコマンド /ultrareview が追加された。これは別個のレビューセッションを開始し、注意深いレビュアーなら気付くであろうエラーや設計上の欠陥をモデルが変更点をなぞって指摘する。ProおよびMaxプランのClaude Codeユーザーには、試用のために3回の無料実行が与えられる。これに加えて、Claudeが権限について自律的に決定するオートモードが、Max購読者に拡大された。これにより、権限チェックを完全に無効にするよりも少ない中断と低いリスクで長期的なタスクを実行できる。

努力レベルとは、応答前の内部推論にモデルが費やすトークン数を調整するClaude APIのパラメータである。可能な値はlowからmaxまでであり、レベルが高いほど分析が深くなり、リクエストのコストも高くなる。

可用性と価格

Opus 4.7は本日、すべてのClaude製品およびClaude API、ならびにAmazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryで利用可能である。APIのモデル識別子は claude-opus-4-7 である。価格はOpus 4.6のレベルに維持されている:入力トークン100万個あたり、出力トークン100万個あたり。

Opus 4.6からの移行に際しては、トークン消費に直接影響する2つの要因を考慮する必要がある。第一に、Opus 4.7は更新されたトークナイザーを使用する:同じ入力テキストでも、コンテンツタイプに応じておおよそ1.0~1.35倍の範囲で、より多くのトークンにマッピングされる可能性がある。第二に、高い努力レベルでは、特にエージェントセッションの後期のイテレーションにおいて、モデルは内部推論により多くのトークンを費やす。複雑なタスクにおける信頼性は向上するが、出力カウントも増加する。Anthropicは、プログラミングに関する内部評価では、すべての努力レベルでの総トークン消費は改善されたと指摘しているが、実際のトラフィックについては独自の測定を推奨する。

安全性と整合性

Anthropicの内部評価によれば、Opus 4.7の安全性プロファイルはOpus 4.6に近い:偽装、媚び諂い、悪用への用意の指標は低い。正直さとプロンプトインジェクションに対する堅牢性において、新しいモデルは先行モデルを上回っている。いくつかの退行もある:Opus 4.7はOpus 4.6よりも、規制物質の使用に関する害軽減のアドバイスを過度に詳細に提供する傾向がある。整合性監査の最終的な見解は、モデルは「概ねよく整合しており信頼に値するが、その動作は理想的ではない」というものである。Mythos Previewは総合評価において、Anthropicの最も整合したモデルのままである。

プロンプトインジェクションとは、外部データ(ファイル、Webページ、電子メール)に、ユーザーのタスクの代わりにモデルに望ましくないアクションを実行させる指示を隠す攻撃である。

結論

Opus 4.7は、長期的なエージェントプログラミングタスク、高解像度画像処理、および財務・法律分野のプロフェッショナルシナリオを狙った、Opus 4.6の直接的なアップデートである。開発者にとってこれはひとつのことを意味する:新しいバージョンは、より注意深く作成された指示と、新しいトークナイザーおよびxhighでのより深い推論による実際のトークン消費の測定を必要とする。組み込みフィルターが正当な作業の妨げとなるセキュリティ専門家のために、Cyber Verification Programが開設されている。モデルはすでにClaude、Claude Code、ならびにClaude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft FoundryでOpus 4.6の価格で利用可能である。