오픈AI의 최신 생성형 인공지능(AI) 모델 GPT-5.5가 영국 정부 산하 AI 안전연구소(AISI)의 사이버 보안 역량 평가에서 최상위 성능을 기록했다.
17일 AISI 홈페이지에 공개된 평가 보고서에 따르면, GPT-5.5는 사이버 보안 관련 전문가급 과제 평가에서 평균 71.4%의 통과율을 기록했다. 이전 모델인 GPT-5.4(52.4%), 앤트로픽의 클로드 미토스 프리뷰(68.6%), 클로드 오퍼스 4.7(48.6%)보다 높은 수준이다.
AISI는 취약점 연구와 익스플로잇, 리버스 엔지니어링, 웹 공격, 암호 분석 등 95개 과제로 AI의 사이버 보안 역량을 측정했다.
GPT-5.5는 AISI가 설계한 기업 네트워크 침투 시뮬레이션 '더 라스트 원스'를 처음부터 끝까지 마친 두 번째 모델이 됐다. 처음으로 이 시뮬레이션을 통과한 모델은 클로드 미토스 프리뷰였다.
더 라스트 원스는 AI 에이전트가 별도 권한이 없는 공격 환경에서 정찰과 자격 증명 탈취, 내부망 이동, 공급망 우회, 내부 데이터베이스 유출까지 공격 경로를 자율적으로 찾아 수행하도록 설계한 과제다. AI가 자율적인 공격 에이전트로서 얼마나 위협적인지를 평가하는 지표로 꼽힌다. GPT-5.5는 10차례 시도 중 2차례 전체 과정을 완료했고, 클로드 미토스 프리뷰는 앞서 같은 과제를 10차례 중 3차례 마쳤다.
AISI는 AI 모델의 사이버 공격 역량이 빠르게 향상되고 있다며, 가까운 시일 내 추가적인 성능 향상이 잇따를 수 있다고 예상했다.