카카오·LG, 구글과 손잡은 이유… ‘초거대 AI’ 공들이지만 韓 슈퍼컴퓨팅 역량 부족

카카오의 인공지능(AI) 전문 자회사인 카카오브레인이 구글클라우드와 자사 AI 모델 고도화에 나선 배경에 관심이 쏠린다. 카카오브레인이 구글클라우드의 손을 잡은 이유는 다름 아닌 초거대 AI 개발에 필요한 슈퍼컴퓨팅 인프라가 국내에 없기 때문이다. 네이버, LG 등 초거대 AI를 미래 먹거리로 점찍은 국내 다른 기업도 해외 기업들과 협력하고 있다.

20일 구글클라우드에 따르면 카카오브레인은 현재 자사 아티스트 모델 ‘칼로’의 머신러닝 학습을 고도화하기 위해 구글클라우드의 여러 인프라를 활용 중이다. 칼로는 ‘민달리’ ‘RQ-트랜스포머’ 등 카카오브레인이 앞서 공개한 초거대 이미지 생성 모델을 발전시켜 만든 AI 아티스트다. 대상, 화풍, 장소, 시간, 색상 등 원하는 제시어나 문장을 입력하면 AI가 스스로 이해한 맥락을 바탕으로 이미지를 생성한다.

카카오브레인은 우선 구글클라우드의 GPU(그래픽처리장치)를 활용, GPU 자원을 노드당 16개까지 묶으면서 병목 현상을 줄였다. 구글클라우드의 ‘클라우드 GPU’는 관련 업계에서 유일하게 엔비디아의 ‘A100 GPU’ 16개를 단일 노드로 운영할 수 있다는 평가를 받는다. 칼로처럼 초거대 데이터셋으로 반복 학습이 필요한 머신러닝 모델의 경우 대규모의 컴퓨팅 자원과 빠른 학습이 요구되지만, 이를 위해 GPU 자원을 효과적으로 묶는 데에는 어려움을 겪는다. 연산 데이터를 관리하는 노드가 늘어날수록 상호 처리해야 하는 데이터 양이 많아져 병목 현상이 발생하기 때문이다.

카카오브레인은 칼로가 그린 그림의 맥락을 분석하고 사회적 기준에 부합하는지 실시간으로 파악하기 위해 구글클라우드의 ‘비전 API(응용프로그램인터페이스)’도 사용 중이다. 비전 API는 이미지에 이름표를 할당하고 사전 정의된 수백만개의 카테고리에 따라 이미지를 분류한다. 카카오브레인은 이와 함께 학습 데이터를 저장 및 관리할 수 있는 ‘클라우드 스토리지’와 딥러닝용 가상 서버인 ‘GPU 인스턴스’도 쓰고 있다.

'구글 클라우드 TPU v4'. /구글클라우드

카카오브레인은 지난해 자사 언어 모델 ‘KoGPT’에 ‘구글 클라우드 TPU v4′를 도입하며 구글클라우드와 인연을 맺었다. 당시 카카오브레인은 해당 인프라를 활용해 KoGPT의 연구 효율을 100배 이상 높일 수 있을 것으로 기대했다. 구글 클라우드 TPU는 구글 클라우드에서 사용할 수 있는 대용량 연산 인프라다. GPU를 여러 대 컴퓨터에 분할 설치해 사용하지 않고, GPU보다 빠르고 복잡한 연산을 갖춘 상위 시스템을 슈퍼컴퓨터 한 대에 구축해 활용한다. 김세훈 카카오브레인 AI디렉터는 “앞으로도 구글클라우드와 긴밀히 협력하며 카카오브레인이 그리는 초거대 AI 생태계 발전 여정을 함께 걸어 나갈 것”이라고 했다.

초거대 AI 개발에 해외 제품을 사용하는 국내 기업은 카카오브레인 말고도 또 있다. 네이버는 지난 2020년 10월 국내 기업 최초로 700페타플롭스(PF) 성능의 엔비디아 슈퍼컴퓨터를 도입했다. 우리나라가 보유한 슈퍼컴퓨터 8대 중 4대인 기상청의 ‘마루’ ‘구루’ ‘누리’ ‘미리’의 성능은 700페타플롭에 못 미치는 것으로 알려졌다. 네이버는 이를 기반으로 언어 모델 ‘하이퍼클로바’를 탄생시켰다.

국내 초거대 AI 시장에서 선두를 달리고 있는 LG도 구글 클라우드 TPU v4로 자사 멀티모달 ‘엑사원’을 학습시켰다. 멀티모달은 텍스트와 음성, 이미지, 영상을 동시에 이해하는 AI 모델이다. LG는 올해 초 구글과 AI 분야 협력을 공식화한 뒤, 엑사원의 활용성을 확대하기 위한 연합체도 꾸렸다. 연합체에는 LG AI 연구원을 비롯한 5개 LG 그룹 계열사를 포함해 각 분야의 대표회사 등 총 13곳이 창립 멤버로 참여했다.

국내 정보기술(IT) 업계는 이런 배경에 한국 슈퍼컴퓨터 역량 부족이 있다고 짚는다. 실제로 지난달 ‘슈퍼컴퓨팅 컨퍼런스(SC22)’에서 발표된 전 세계 상위 500대 슈퍼컴퓨터 순위에서 한국의 슈퍼컴퓨터 보유 대수(8위) 순위는 지난해보다 한 단계 높아졌으나 성능(8위) 순위는 두 단계 내렸다. 특히 성능은 1~7위와 격차가 컸다. 7위인 프랑스의 슈퍼컴퓨터는 총 174.9엑사플롭스(EF)의 성능을 내는 반면 한국의 슈퍼컴퓨터는 88.7EF 성능을 보유하는 데 그쳤다. 1위인 미국은 2122.8, 일본은 624.3, 중국은 514.5, 핀란드는 320.8, 이탈리아는 263.2, 독일은 219.3 EF 성능을 각각 보유 중이다.

지난달 '슈퍼컴퓨팅 컨퍼런스(SC22)'에서 발표된 전 세계 상위 500대 슈퍼컴퓨터 순위에 한국 슈퍼컴퓨터 8대가 오른 모습. /한국과학기술정보연구원(KISTI)

이에 정부가 발 벗고 나서는 모양새다. 과학기술정보통신부는 오는 2023년부터 총 2929억원을 들여 국가 슈퍼컴퓨터 6호기를 구축하기로 했다. 지난 5호기 구매 때 들인 총 908억원의 3배가 훨씬 넘는 가격이다. 그동안 업그레이드할 때마다 직전 대비 50%가량 더 들인 것을 고려하더라도 크게 늘었다. 과기정통부는 준엑사급(600PF)급으로 세계 5~10위권 성능인 6호기를 도입해 급증하는 AI 및 빅데이터 활용 연구 수요에 대응한다는 계획이다.

이종호 과기정통부 장관은 전날 송년 기자간담회에서 양자기술 개발을 통한 ‘퀀텀 점프’ 포부도 밝혔다. 과기정통부는 이 맥락에서 지난달 장관 직속 양자기술개발지원반(과)을 편성했다. 양자기술개발지원반은 앞으로 컴퓨팅, 통신, 센서 등 분야별로 부처에 흩어져 있던 양자 기술 진흥 업무를 모아 국가 차원의 양자 기술을 육성할 예정이다.

이 장관은 현재 추진을 준비 중인 양자기술 개발 사업에 대해서도 “예비타당성조사를 반드시 통과시키겠다”고 했다. 과기정통부는 해당 사업을 통해 양자컴퓨팅 분야 등에 2조원 규모의 예산을 투입할 방침이다. 2조원은 정부 기술개발(R&D) 사업 가운데 최대 규모다. 그는 “미국의 60% 수준인 예산을 투입하는 만큼 어려움은 있지만, 최대한 빠른 속도로 부족한 부분을 따라가겠다”고 했다.