챗GPT 개발사 오픈AI가 '엔비디아 대항마'로 불리는 반도체 기업 세레브라스의 칩으로 구동되는 인공지능(AI) 모델을 선보였다.
오픈AI는 12일(현지시간) 코딩 특화 AI 모델 '코덱스(GPT-5.3-코덱스)'의 경량 버전인 'GPT-5.3-코덱스-스파크'를 공개했다. 이번에 출시한 신규 모델은 복잡한 연산보다는 빠른 작업 처리 속도에 중점을 뒀다.
오픈AI는 이 모델이 초당 1000개 이상의 토큰을 처리할 수 있어 사용자가 지연시간을 거의 느끼지 못하는 '초(超)저지연' 환경을 제공한다고 설명했다. 토큰은 AI 모델이 처리하는 데이터의 단위로, 영어 데이터를 기준으로 할 때 일반적으로 단어 하나가 1토큰에 해당한다.
오픈AI는 새 모델의 빠른 추론 속도를 구현하기 위해 엔비디아의 그래픽처리장치(GPU) 대신 세레브라스의 '웨이퍼규모엔진3'(WSE-3)을 사용했다. 세레브라스는 웨이퍼를 잘게 잘라서 칩을 만드는 다른 반도체 제조사들과 달리 웨이퍼 전체를 하나의 거대한 칩으로 만드는 '웨이퍼스케일엔진'(WSE) 기술을 보유하고 있다.
이를 통해 연산을 수행하는 칩과 메모리 칩을 연결할 필요 없이 칩 하나에서 연산과 메모리를 모두 이용할 수 있다. 회사는 이 방식으로 칩 간 데이터 이동에 소모되는 전력을 아끼고, 병목 현상을 막아 데이터 처리 속도도 높일 수 있다고 설명했다. 세레브라스는 자사 칩의 응답 속도가 기존 GPU 대비 최대 20배 빠르다고 주장한다.
오픈AI는 이번 협력에 대해 "세레브라스와의 파트너십에서 나온 첫 이정표"라며 "(세레브라스 칩은) 초저지연 환경을 요구하는 워크플로우에 특히 강점이 있다"고 밝혔다. 다만 "(엔비디아의) GPU는 여전히 우리의 훈련·추론 작업 전반에 걸쳐 핵심적인 기반"이라고 덧붙였다.
지난달 세레브라스는 올해부터 2028년까지 오픈AI에 총 750메가와트(㎿) 규모의 컴퓨팅 파워를 제공하는 계약을 체결했다. 양사는 이번 계약의 구체적 조건을 공개하지 않았으나, 외신은 계약 규모가 100억달러(약 14조원)에 달한다고 보도했다. 미국 언론은 이달 초 오픈AI가 엔비디아 칩을 이용한 챗GPT 답변에 만족하지 못해 대안을 모색하고 있다고 보도한 바 있다.
오픈AI의 이번 발표는 탈(脫)엔비디아 움직임과도 맞물려 있다는 분석이 나온다. 앞서 엔비디아가 오픈AI 투자 규모를 축소할 것이란 보도가 잇따르면서 양사간 불화설도 불거졌다. 오픈AI는 세레브라스 외에도 미국 반도체 제조사 브로드컴과 손잡고 자체 AI 칩을 개발하고 있다.