카카오 로고. /카카오 제공

카카오는 자사의 독자 기술을 활용해 개발한 경량화 추론 모델 'Kanana-1.5-v-3b'와 MoE 모델 'Kanana-1.5-15.7b-a3b'를 오픈소스로 공개한다고 24일 밝혔다. 이 모델은 이미지 및 텍스트를 동시에 처리하는 멀티모달 언어모델로, 이미지와 텍스트 기반의 질문을 정확히 이해하고 응답할 수 있는 뛰어난 성능을 자랑한다.

'Kanana-1.5-v-3b'는 텍스트뿐만 아니라 이미지 정보도 처리할 수 있는 경량 멀티모달 모델로, 기존 글로벌 멀티모달 언어모델들과 비교해 성능과 비용 효율성에서 우수성을 인정받았다. 이 모델은 140억개 파라미터 규모로, 한국어와 영어에 대한 뛰어난 이미지 이해 능력과 지시 이행 능력을 보유하고 있으며, 기존 모델보다 상대적으로 낮은 비용으로 뛰어난 성능을 발휘한다. 카카오는 이를 통해 AI 모델의 비용 절감과 성능 향상에 기여했다.

카카오는 MoE 모델인 'Kanana-1.5-15.7b-a3b'를 함께 공개했다. 이 모델은 15.7B 파라미터 중 3B만 활성화해 추론하는 구조로, 기존 모델보다 훨씬 효율적인 자원 활용을 가능하게 하며, 저비용으로 고효율 서비스를 구현할 수 있다. 특히, 이러한 MoE 아키텍처는 AI 인프라 구축에 큰 비용 절감을 제공할 수 있어, AI 연구 및 개발에 실용적이고 효과적인 지원이 될 것으로 예상된다.

카카오는 이 모델들을 통해 AI 기술을 연구자 및 개발자가 자유롭게 활용할 수 있도록 하고, 국내 AI 생태계의 자립성과 경쟁력을 강화하는 데 기여할 계획이다. 또한, AI 기술의 상업적 활용까지 가능한 아파치 2.0 라이센스를 적용해, 스타트업 및 연구자들이 이를 바탕으로 다양한 서비스를 실험할 수 있도록 돕고 있다.

카카오는 자체 기술을 바탕으로 계속해서 AI 모델을 고도화하고, 글로벌 수준의 초거대 모델 개발을 위한 도전에 나설 예정이다.