일론 머스크 테슬라 최고경영자(CEO)가 이끄는 인공지능(AI) 기업 xAI가 17일(현지 시각) 최신 인공지능 모델 ‘그록3’를 공개했다.
머스크 CEO는 이번 모델이 “그록2보다 한 차원 뛰어난 성능을 갖췄다”며 “오픈AI의 챗GPT-4o, 앤트로픽의 클로드 3.5 소네트, 구글의 제미니, 딥시크 V3 등 경쟁 모델을 넘어섰다”고 강조했다.
그록3은 xAI가 개발한 초거대 AI 모델로, 테네시주 멤피스에 위치한 20만 개 이상의 GPU(그래픽처리장치)를 보유한 데이터센터에서 학습됐다. 머스크 CEO에 따르면, 그록3는 그록2보다 10배 많은 연산량을 활용해 학습했으며, 법원 제출 서류 등 방대한 데이터를 포함한 확장된 학습 데이터셋을 사용했다.
xAI는 그록3이 수학 문제 해결 성능을 평가하는 AIME, 박사 수준의 물리·생물·화학 문제를 다루는 GPQA 등 주요 AI 벤치마크에서 챗GPT-4o를 능가했다고 주장했다. 예를 들어, 미국 수학경시대회(AIME) 2024 문제 평가에서 딥시크 V3는 39%, 클로드 3.5 소네트는 26% 정답률을 기록한 반면, 그록3은 52%로 가장 높은 성적을 보였다. 과학 관련 벤치마크 ‘GPQA’에서도 그록3이 75% 정답률을 기록하며, GPT-4o(50%), 클로드 3.5 소네트(65%), 딥시크 V3(59%)를 앞질렀다.
그록3은 단일 모델이 아니라 다양한 버전으로 구성된 AI 패밀리다. 특히 ‘그록3 추론 모델(Reasoning)’과 ‘그록3 미니 추론 모델’은 복잡한 문제를 분석하고 철저한 사실 검증을 거쳐 답변하는 구조로 개발됐다. 오픈AI의 ‘o3-mini’나 중국 AI 기업 딥시크(DeepSeek)의 ‘R1’과 유사한 개념으로, AI가 단계별 사고 과정을 거쳐 답을 도출하는 ‘사고 사슬(CoT, Chain of Thought)’ 기법을 적용했다는 점이 특징이다.
새롭게 추가된 ‘딥서치(DeepSearch)’ 기능도 주목받고 있다. 이는 인터넷과 X의 데이터를 분석해 질문에 대한 요약을 제공하는 AI 기반 심층 검색 기능으로, 오픈AI의 ‘딥 리서치’와 유사한 개념이다. 머스크는 “딥서치는 사용자가 30분에서 1시간 동안 검색해야 할 내용을 대신 조사해, 10분 만에 정리된 결과를 제공한다”고 강조했다.
그록3은 X의 ‘프리미엄+’(월 2만9000원, 연 30만원) 구독자들이 먼저 사용할 수 있으며, 추가 기능은 xAI가 새롭게 도입한 유료 서비스 ‘슈퍼그록(SuperGrok)’을 통해 제공된다. 슈퍼그록 요금제는 월 30달러(약 4만3000원), 연 300달러(약 43만원)로, 추가 추론 질의, 딥서치 기능 확장, 무제한 이미지 생성 등이 포함된다.
머스크 CEO는 “향후 1주일 내로 그록 앱에 음성 합성 기능인 ‘보이스 모드’를 추가할 계획이며, 몇 주 후에는 기업용 API에도 그록3과 딥서치 기능이 적용될 것”이라고 밝혔다. 이어 “몇 달 내로 이전 모델인 그록2를 오픈소스로 공개할 예정”이라고 덧붙였다.
한편 머스크 CEO는 AI 모델이 정치적 검열 없이 자유롭게 답변할 수 있어야 한다고 강조해왔으나, 기존 그록 모델들은 정치적 이슈에 대해 조심스러운 태도를 유지해왔다. 한 연구에서는 기존 그록 모델이 트랜스젠더 권리, 다양성 정책, 경제적 불평등 문제에서 다소 진보적인 성향을 보였다는 분석이 나왔다. 이에 대해 머스크 CEO는 “그록이 학습한 데이터의 영향”이라며 “향후 정치적으로 중립적인 모델로 조정할 것”이라고 밝혔다.
또 머스크 CEO는 “그록 AI는 지속적으로 발전할 것이며, 2년 내에 스페이스X 로켓 시스템에도 탑재될 것”이라고 전했다.