人工知能(AI)チャットボット「Claude」の運営企業であるAnthropicが、最上位モデル「Opus」に続き、中級主力モデル「Sonnet」の性能を引き上げた「Claude Sonnet 4.6」を17日(現地時間)に発売した。今月5日のOpus 4.6公開から12日ぶりの後続アップデートである。
Anthropicは、Sonnet 4.6がコーディング、コンピューター活用、長文脈推論、エージェント計画、知識労働課題まで全般的な能力を改善したモデルだと説明した。とりわけ100万トークン(1M)のコンテキストウィンドウをサポートし、大規模なコードベース、契約書、報告書など長文資料を一度に処理する企業の需要を狙った。
無料・プロ料金プランではSonnet 4.6が基本モデルとして適用され、API単価は前作と同じ100万トークン当たり3〜15ドルで維持された。会社は、Sonnet 4.6がClaude、CoWork、Code、APIおよび主要クラウドプラットフォームで即時に利用可能だと明らかにした。
性能指標でもOpus 4.6との差を縮めた。Sonnet 4.6はSWE-bench Verified 79.6%、OSWorld-Verified 72.5%を記録し、それぞれOpus 4.6(80.8%、72.7%)に近接した。GDPval-AAは1633点でOpus 4.6(1606点)を上回り、Finance Agentベンチマークでも63.3%を記録し、Opus 4.6(60.05%)より高かった。Anthropicは初期テストで、開発者がSonnet 4.6をSonnet 4.5より約70%選好し、Opus 4.5と比較しても59%選好したと明らかにした。
業界では、Opus級性能の下方拡散が本格化し、高価格モデル中心のコスト構造が再編される可能性に注目している。Anthropicが最近、企業向け自動化ツールを相次いで拡張するなか、中級モデルの性能引き上げがAIによる業務代替の速度をさらに高める可能性があるとの見方も出ている。