“너 이름 있어? 뭐라고 불러야 해?” (테오도르)“음… 사만다.” (AI 사만다)“이름을 어떻게 갖게 됐어?” (테오도르)“나 혼자 지었어. 발음이 마음에 들어서” (AI 사만다)“언제 이름을 지은 거야?”(테오도르)“좀 전에 (네가) 이름을 물었을 때 0.02초간 ‘아기 이름 짓는 법’이라는 책에서 18만개의 이름을 읽고 골랐어.” (AI 사만다)
2014년 개봉한 영화 ‘그녀(HER)’에서 주인공 테오도르와 인공지능(AI) 비서 사만다가 나눈 대화의 일부다. 테오도르의 계속된 질문에도 사만다는 마치 사람처럼 끊김 없이 자연스럽게 대화를 이어갔다. 인간보다 말을 더 잘하고 전문 지식까지 갖춘 사만다의 능력은 ‘초거대 AI’에서 나온다. 초거대 AI는 대용량의 정보를 스스로 학습해 종합적인 추론을 할 수 있는 차세대 AI를 의미한다.
초거대 AI 기술 선점을 놓고 정보통신기술(ICT)업계 간 경쟁이 치열하다. 지난해 미국 오픈AI가 개발한 대화형 AI챗봇 ‘챗GPT(ChatGPT)’가 등장한 이후 구글, 마이크로소프트(MS) 등을 비롯해 국내 전자, 포털, 통신사 등 기업들은 잇따라 초거대 AI를 공개하고 있다.
◇ MS, 모든 서비스에 AI 탑재
20일 ICT업계에 따르면, 사티아 나델라 MS 최고경영자(CEO)는 지난 17일(현지 시각) 세계경제포럼(WEF·다보스포럼)에서 “모든 MS 제품에 AI 기능을 갖춰 제품을 완전히 변화시키겠다”고 밝혔다. 예를 들어, 클라우드 오피스 프로그램을 사용할 경우 주제어를 입력하면 자동으로 텍스트를 만들어 주는 식이다. MS의 검색서비스 ‘빙(BING)’에도 챗GPT 기능을 추가해 사용자가 대화를 주고받으면서 결괏값을 도출하는 식이다.
ICT업계가 개발하는 초거대 AI의 핵심은 ‘범용성’이다. 그간 일방적인 ‘명령’ 위주가 아닌 ‘교감하는 대화’가 가능한 AI 서비스의 상용화가 목표인 것이다. 또 ‘텍스트↔텍스트’, ‘텍스트↔이미지’, ‘텍스트↔영상’, ‘텍스트↔음성’ 등 다양한 콘텐츠로 입력과 출력을 할 수 있다. 사만다와 같이 대화를 주고받을 수 있는가 하면, 한 번의 텍스트 입력에 작문이나 작곡, 코딩, 그림 등의 결과를 찾아주거나 변환하는 식이다.
IT업계 관계자는 “1명의 학생이 영어나 수학, 과학, 미술 등 여러 분야를 학습하는데, 그간 AI는 영어 공부를 하기 위해서는 별도의 영어 학습 AI, 미술은 미술 학습 AI 등이 필요했다”라며 “하지만 초거대 AI는 인간의 두뇌와 같은 구조로 방대한 데이터를 학습하고 인간처럼 다양하게 추론을 할 수 있기 때문에 범용성이 핵심 경쟁력이 될 수 있다”라고 했다.
현재 국내에서 가장 많은 파라미터(매개변수)를 보유한 초거대 AI는 LG가 공개한 멀티모달 ‘엑사원’이다. 엑사원은 총 3000억개의 파라미터를 가지고 있다.
초거대 AI의 성능은 인간의 뇌에서 정보를 학습하고 기억하는 시냅스와 유사한 역할을 하는 인공 신경망의 파라미터 수에 좌우된다. 파라미터 수가 많을수록 AI의 지능이 높고, 더 정교한 학습이 가능하다는 의미다. 멀티모달은 텍스트와 음성, 이미지, 영상을 동시에 이해하는 범용 AI 모델이다.
엑사원은 텍스트를 입력하면 이에 맞는 이미지를 만들고, 해당 이미지를 텍스트로 설명해준다. 예를 들어 ‘흐르는 강물과 일몰 풍경’을 입력하면, 관련된 이미지를 검색해주고, 반대로 흐르는 강물과 일몰 풍경 이미지를 보여주면 관련한 텍스트를 생성해주는 식이다.
이를 위해 엑사원은 컴퓨터가 읽을 수 있는 형태로 만들어진 언어 자료인 ‘말뭉치’ 6000억개, 고해상도 이미지 2억5000만장 이상을 학습했다. LG는 의료, 교육, 교통, 법률 등 다양한 산업 분야와 협력해 ‘초거대 AI 생태계’ 조성하겠다는 목표를 세웠다.
시장조사업체 IDC에 따르면 초거대 AI를 포함한 전 세계 AI 시장 규모는 2024년 5543억달러(약 700조원)에 이를 전망이다.
현재 속도대로라면 조만간 AI의 성능이 인간의 뇌를 넘어설 것이란 관측이 나온다. 실제로 미국 오픈AI는 2030년까지 파라미터가 100조개 이상인 GPT-4를 만들겠다고 공언했다. 인간 뇌의 시냅스는 100조개 수준이다.
◇ 네이버는 AI·삼성은 반도체 동맹
삼성전자(005930)는 네이버와 손을 잡았다. 네이버는 매개변수 2040억대의 초거대 AI ‘하이퍼클로바’를 공개해다.
최근 네이버는 클로바 AI 스피커에 특정 주제에 대해 자유롭게 대화할 수 있는 ‘똑똑사전’ 기능을 출시했다. 똑똑사전은 초거대 AI를 적용해 자연스럽고 풍부한 대화와 ‘꼬리에 꼬리를 무는’ 연속적 대화도 할 수 있다. 특히 클로바는 한국어 데이터 학습량이 GPT-3의 6500배에 달해 한국어 기반 서비스에 정확성을 높인 게 특징이다.
여기서 삼성전자는 네이버와 함께, 초거대 AI를 위한 전용 ‘AI 반도체 및 솔루션’ 개발에 착수했다. 초거대 AI가 상용화 되기 위해서는 성능, 비용 등 효율이 관건인데, 현재의 메모리 반도체로는 처리 속도에 한계가 있다.
특히 고속의 중앙처리장치(CPU)와 메모리 간 속도 차이로 발생하는 병목현상도 해결해야 할 숙제다. 삼성전자는 저전력이면서 병목현상을 줄이는 고속의 AI반도체를 네이버와 개발하고 있다.
카카오는 기존 이미지 생성 AI 민달리의 상향 버전인 39억개 파라미터를 보유한 ‘RQ-트랜스포머’를 오픈소스 커뮤니티 깃허브에 공개했다. 1400만장의 텍스트와 이미지를 학습한 멀티모달 기능을 갖춰, 텍스트를 기반으로 질문을 하면 사용자가 찾는 답을 이미지 형태로 제시한다. 예를 들어 “바나나 껍질로 된 의자를 그려줘”라는 명령어를 입력하면 AI가 이를 이해하고 직접 이미지를 그리는 식이다. 다만, LG 엑사원처럼 이미지를 보여주고 텍스트로 전환되는 기능은 개발 중인 상태다.
◇ KT, 대화 가능한 ‘AI고객센터’ 상용화
통신사들도 초거대 AI 시장에 도전장을 내밀고 있다. KT는 한양대, 한국과학기술원(KAIST), 한국전자통신연구원(ETRI), 현대중공업그룹 등 산학연이 협력하는 ‘AI원팀’을 구축해 초거대 AI ‘믿음’을 개발 중이다.
KT는 올해 상반기 내 믿음을 상용화한다는 계획을 세웠다. ‘AI컨택센터(AICC) 서비스’가 상용화되면 어느 기업이든 간편하게 전문적인 분야에서 사람처럼 연속 대화가 가능한 AICC를 스스로 구축할 수 있다.
또 KT는 믿음을 KT클라우드에서 제공하는 서비스형 소프트웨어나 플랫폼(SaaS·PaaS)으로 만들어 누구나, 언제든 필요할 때 KT의 초거대 AI를 쓸 수 있고 쓴 만큼 비용을 내도록 하는 방안을 구상하고 있다. 예를 들어, 그간 IT 개발자가 새로운 서비스를 만들기 위해서는 시장 분석에 3개월의 시간이 필요했는데, 초거대 AI를 빌려서 활용하면 몇 시간 만에 시장 분석을 마치 수 있다는 의미다.
KT관계자는 “AICC 서비스를 시범적으로 금융, 보험, 카드, 커머스 등 업종에 적용한 결과 상담 품질 10% 향상, 운영비용 15%, 구축비용 30% 절감 효과가 있었다”고 했다.
SK텔레콤은 최근 AI를 시각화한 애플리케이션(앱) ‘에이닷’의 베타 서비스를 선보였다. 에이닷은 오픈AI가 개발하고 MS가 독점권을 소유한 언어 모델 GPT-3(1750억개 파라미터)를 바탕으로 개발한 서비스로, 사용자에게 먼저 말을 건네는 것이 특징이다. 특히 SK텔레콤은 GPT-2의 한국어 특화 버전을 자체 개발해왔고, 사용자가 좋아할 만한 영화, 드라마, 음악 등을 알아서 추천해주는 AI 플랫폼 ‘에이닷’을 출시 한 바 있다.