인공지능(AI) 챗봇 클로드 운영사 앤트로픽이 최상위 모델 오퍼스에 이어 중급 주력 모델 소네트의 성능을 끌어올린 '클로드 소네트 4.6'을 17일(현지시각) 출시했다. 이달 5일 오퍼스 4.6 공개 이후 12일 만의 후속 업데이트다.
앤트로픽은 소네트 4.6이 코딩, 컴퓨터 활용, 장문맥 추론, 에이전트 계획, 지식노동 과제까지 전반 역량을 개선한 모델이라고 설명했다. 특히 100만 토큰(1M) 컨텍스트 윈도를 지원해 대규모 코드베이스, 계약서, 보고서 등 장문 자료를 한 번에 처리하는 기업 수요를 겨냥했다.
무료·프로 요금제에서는 소네트 4.6이 기본 모델로 적용됐고, API 단가는 전작과 같은 100만 토큰당 3~15달러로 유지됐다. 회사는 소네트 4.6이 클로드, 코워크, 코드, API와 주요 클라우드 플랫폼에서 즉시 사용 가능하다고 밝혔다.
성능 지표에서도 오퍼스 4.6과의 격차를 좁혔다. 소네트 4.6은 SWE-bench Verified 79.6%, OSWorld-Verified 72.5%를 기록해 각각 오퍼스 4.6(80.8%, 72.7%)에 근접했다. GDPval-AA는 1633점으로 오퍼스 4.6(1606점)을 앞섰고, Finance Agent 벤치마크에서도 63.3%를 기록해 오퍼스 4.6(60.05%)보다 높게 나타났다. 앤트로픽은 초기 테스트에서 개발자들이 소네트 4.6을 소네트 4.5보다 약 70% 선호했고, 오퍼스 4.5와 비교해도 59% 선호했다고 밝혔다.
업계에서는 오퍼스급 성능의 하향 확산이 본격화되며 고가 모델 중심의 비용 구조가 재편될 가능성에 주목하고 있다. 앤트로픽이 최근 기업용 자동화 도구를 연이어 확장하는 가운데, 중급 모델의 성능 상향이 AI 기반 업무 대체 속도를 더 끌어올릴 수 있다는 전망도 나온다.