GPT-5.5がAISI評価でサイバー最上位

OpenAIの最新の生成型人工知能（AI）モデルであるGPT-5.5が、英国政府傘下のAI安全研究所（AISI）のサイバーセキュリティ能力評価で最上位の性能を記録した。

17日AISIのホームページで公開された評価報告書によると、GPT-5.5はサイバーセキュリティ関連の専門家級課題の評価で平均71.4%の合格率を記録した。前モデルのGPT-5.4（52.4%）、AnthropicのClaude Mythos Preview（68.6%）、Claude Opus 4.7（48.6%）より高い水準である。

オープンAI

AISIは脆弱性研究とエクスプロイト、リバースエンジニアリング、ウェブ攻撃、暗号解析など95個の課題でAIのサイバーセキュリティ能力を測定した。

GPT-5.5は、AISIが設計した企業ネットワーク侵入シミュレーション「ザ・ラスト・ワンズ」を最初から最後まで完了した2番目のモデルとなった。最初にこのシミュレーションを通過したモデルはClaude Mythos Previewだった。

ザ・ラスト・ワンズは、AIエージェントが別途の権限がない攻撃環境で、偵察と資格情報の窃取、内部網の横展開、サプライチェーン迂回、内部データベース流出に至るまで、攻撃経路を自律的に見つけて実行するよう設計した課題だ。AIが自律的な攻撃エージェントとしてどれほど脅威となるかを評価する指標とされる。GPT-5.5は10回の試行のうち2回で全過程を完了し、Claude Mythos Previewは先に同じ課題を10回のうち3回終えた。

AISIはAIモデルのサイバー攻撃能力が急速に向上しているとして、近い将来に追加の性能向上が相次ぐ可能性があると予想した。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。