크래프톤이 인공지능(AI) 모델 브랜드 '라온(Raon)'을 출시했다. / 크래프톤 제공

크래프톤이 인공지능(AI) 모델 브랜드 '라온(Raon)'을 공개했다고 2일 밝혔다.

라온은 '즐거움'을 뜻하는 순우리말 '라온'에서 착안한 이름으로, AI 기술을 통해 게임의 게임의 본질적인 즐거움을 창출하겠다는 크래프톤의 철학을 반영했다고 회사 측은 설명했다.

이번에 공개된 모델은 음성 지원 대규모언어모델(LLM) '라온 스피치(Raon-Speech)', 실시간 음성 대화 모델 '라온 스피치챗(Raon-SpeechChat), 텍스트-음성 변환(TTS) 모델 '라온 오픈TTS(Raon-OpenTTS)'와 비전 인코더(이미지 특징 추출 모델) '라온 비전 인코더(Raon-VisionEncoder)다.

크래프톤은 음성과 시각 정보를 아우르는 4개 모델을 세계 최대 AI 모델 플랫폼 허깅페이스에 오픈소스로 공개했다. 회사 관계자는 "향후 라온 AI 모델 브랜드를 중심으로 글로벌 AI 기술 경쟁력을 강화하겠다"고 말했다.

'라온 스피치'는 음성 이해와 생성이 가능한 음성 언어 모델로, 90억(9B) 파라미터(매개변수) 규모다. 크래프톤에 따르면 '라온 스피치'는 음성 텍스트 변환, 텍스트 음성 변환, 음성 기반 질의응답 등 7개 핵심 태스크와 40대 벤치마크를 종합 평가한 결과, 10B 이하급 공개 음성 언어 모델 중 영어와 한국어 성능이 글로벌 1위를 기록했다.

'라온 스피치챗'은 사용자와 모델이 대화 중 자유롭게 끼어들 수 있는 실시간 양방향 통신 기술을 적용했다. 국내에서 발표된 첫 실시간 양방향 음성 모델이라고 회사 측은 설명했다.

'라온 오픈TTS'는 공개 음성 데이터만으로 학습된 텍스트-음성 변환 모델이다. '라온 비전 인코더'는 이미지를 AI가 이해 가능한 정보로 바꿔주는데, 공개 데이터만 활용해 사전 학습된 모델을 쓰지 않고 처음부터 자체 학습한 게 특징이다.

이강욱 크래프톤 최고인공지능책임자(CAIO)는 "대규모 학습 데이터와 핵심 모델을 오픈소스로 공유해 연구자와 개발자들이 자유롭게 활용할 수 있도록 하고 멀티모달 기술 발전과 국내 AI 생태계의 성장에 기여하기를 기대한다"고 말했다.