한국과학기술원(KAIST)과 구글 딥마인드, 미국 럿거스대 연구진이 공동으로 개발한 인공지능(AI) 작동 원리. 이들은 정보를 분해, 재조합해 세상에 없는 것을 상상할 수 있는 AI를 만들었다./한국과학기술원

한국과 미국 공동 연구진이 시각 정보를 분해, 재조합해 새로운 개념을 이해하는 인공지능(AI)을 개발했다. 인간의 전유물로 여겨지는 상상력으로 범용 인공지능(AGI)이 능력을 확대할 수 있는 계기가 될 것으로 보인다.

안성진 한국과학기술원(KAIST) 전산학부 교수가 이끄는 연구진은 30일 구글 딥마인드, 미국 럿거스대와 공동으로 인간의 시각 개념을 이해하는 AI모델과 이를 평가할 방법을 개발했다고 밝혔다.

인간의 지각 능력을 모사하는 AI는 최근 빠르게 발전하고 있다. 인간 고유의 영역이라고 여겨지던 창의력도 마찬가지다. 생성형 AI인 미드저니, 달리(DALL-E)는 이미지 생성에 특화돼 사용자가 입력한 문구에 맞는 그림을 높은 수준으로 만들어준다.

그러나 상상력은 아직 AI에게도 넘지 못한 벽으로 남아 있다. 가령 인간은 ‘보라색 포도’ ‘노란 바나나’처럼 실제로 있는 개념을 바탕으로 본 적 없는 ‘노란 포도’ ‘보라색 바나나’를 상상할 수 있다. 이런 능력은 기존 개념을 분리한 뒤 재조합하는 방식으로 ‘체계적 일반화’나 ‘조합적 일반화’라고 불린다. 궁극적인 AI로 여겨지는 범용 인공지능을 구현하려면 이 능력을 갖춰야 한다.

연구진은 시각 정보에 대한 체계적 일반화가 가능한 AI 모델과 데이터 세트를 개발했다. IQ 테스트와 비슷한 방식으로 원본 이미지와 이를 변형한 이미지를 제시한 후 어떤 점이 바뀐 것인지 AI가 스스로 판단하게 하는 과정을 거친다.

가령 주황색 원과 초록색 사각형을 원본 이미지로 제시하고 색을 바꾼 초록색 원과 주황색 사각형을 변형 이미지로 제시하면 AI는 어떤 점이 달라졌는지 찾아낸다. 이는 시각으로 얻은 정보에서 하위 개념인 색, 크기, 모양 같은 요소를 분해해 재조합하는 능력이 필요하다. 이미 언어를 기반으로 시각 정보를 만드는 AI는 여럿 출시돼 있으나 언어의 도움 없이 가능해진 것은 이번이 처음이다.

안 교수는 “시각 정보의 체계적 일반화가 범용 인공지능을 달성하기 위해 필수적인 능력”이라며 “이 연구를 통해 인공지능의 추론과 상상 능력의 발전을 가속할 것으로 기대한다”고 말했다.

연구 결과는 다음달 10일부터 16일까지 미국 뉴올리언스에서 열리는 ‘제37회 신경정보처리학회’에서 발표될 예정이다.