화학반응 결과를 예측하는 수준을 넘어, 이제는 원리까지 설명할 수 있는 인공지능(AI)이 등장했다. 학계는 물론 제약 산업에서도 주목할 만한 성과로 꼽혔다.
정준영 국민대 응용화학부 교수와 코너 콜리(Connor W. Coley) 미국 매사추세츠 공과대(MIT) 교수 공동 연구진은 "화학반응이 어떤 과정을 거쳐 일어나는지 예측하는 차세대 AI '플라워(FlowER)'를 개발했다"고 21일 국제 학술지 네이처에 발표했다.
약품에서 배터리, 태양전지까지 합성 소재는 모두 복잡한 화학 반응을 거쳐 만들어진다. 하지만 합성 과정에서 원하는 물질만 만들어지지 않고, 예상치 못한 부산물이나 불순물이 함께 만들어지기도 한다. 이런 변수로 신약이나 신소재 개발은 시간이 많이 걸리고 실패하기 쉽다. 이 때문에 반응 경로를 예측하는 AI 개발은 연구자들의 숙원이었다.
다만 기존 AI는 언어를 번역하듯 반응하는 물질을 입력하면 생성물을 맞히는 데 집중돼 있었다. 그러다 보니 존재하지 않는 원자가 갑자기 생기거나, 있어야 할 원자가 사라지는 오류가 발생했다. 반응 전후에 원자의 종류와 수가 변하지 않는다는 '질량 보존의 법칙'을 어기는 결과다.
정준영 교수는 "기존 AI 모델은 가끔 물리적으로 말이 안 되는 결과를 내 화학자들이 신뢰하기 어려웠다"며 "AI에 화학의 기본 법칙을 반영하면 문제를 풀 수 있을 거로 생각했다"고 말했다.
연구진은 화학자의 사고방식을 따라 AI를 개발했다. 화학자들이 전자가 어떻게 이동하는지 화살표로 표시하며 반응 과정을 이해하듯, AI도 전자 흐름을 중심으로 반응을 설명한다. 여기에 질량 보존 법칙을 반드시 지키도록 설계하고, 약 100만 건의 반응 사례 데이터를 학습시켜 예측 신뢰성을 크게 높였다.
플라워는 최종 생성물질뿐 아니라 실험에서 자주 나타나는 부산물이나 새로운 반응 조합까지 예측했다. 특히 기존 AI는 새로운 유형의 반응을 배우려면 수천~수만 건의 데이터가 필요했지만, 플라워는 단 32건만으로도 처음 보는 반응을 65% 이상 정확하게 예측했다. 정 교수는 "사람이 소수의 경험으로도 새로운 규칙을 빠르게 이해하는 것과 비슷하다"고 설명했다.
이번 연구 성과는 제약 산업에서 활용될 가능성이 크다. 불순물의 구조를 사전에 예측하고 제거 여부를 판단하는 것은 신약 개발의 안전성과 직결되기 때문이다. 연구진은 이번에 비만 치료제 위고비로 유명한 덴마크 노보 노디스크와 스위스 노바티스, 미국 화이자, 머크(MSD) 등 글로벌 대형 제약사들이 출연한 MLPDS 컨소시엄과 같이 연구했다.
정 교수는 "이번에 개발한 AI 모델은 불순물의 구조를 예측할 수 있고, 어떤 조건에서 생기는지도 알려준다"며 "반응 조건을 바꿔 불순물을 없앨 방법까지 제안할 수 있다"고 말했다.
이번 연구의 아이디어는 정 교수의 경험에서 자연스럽게 나왔다. 정 교수는 고려대에서 박사학위 과정을 밟을 때, 화학 실험을 하면서도 틈틈이 AI를 독학했다. 책과 유튜브로 공부한 지식은 화학 반응을 AI로 풀어내는 지금의 연구로 이어졌다.
정 교수는 "처음엔 코딩을 따라가는 게 쉽지 않았지만, MIT 박사후연구원 시절에 컴퓨터과학, 화학공학, 생명공학 등 다양한 전공자들과 어울리며 아이디어를 발전시켰다"며 "실제로 수다 떨 듯 이야기하다가 나온 아이디어들이 논문으로 이어진 경우가 많다"고 말했다.
정 교수는 이번 연구가 앞으로 더 많은 화학 반응을 다루는 기초가 될 것이라고 본다. 그는 "화학의 기본 법칙을 AI 설계에 반영한 것만으로도 성능이 크게 향상된 사례로, 기초과학과 AI가 만날 때 어떤 가능성이 열릴 수 있는지 잘 보여준다"며 "이미 연구 성과는 깃허브(GitHub)에 공개했으며, 앞으로 금속 촉매 반응까지 예측할 수 있도록 AI에 학습시킬 데이터를 늘릴 예정"이라고 했다.
정 교수는 "연구자인 어머니를 가까이서 보면서 자연스럽게 과학자의 길을 가게 됐다"며 "이번에 모자(母子)가 대를 이어 세계 최고 학술지인 네이처에 논문을 게재하는 가족 기록도 세워 기쁘다"고 했다. 정 교수의 어머니인 정혜선 한국과학기술연구원(KIST) 혁신기업협력센터 책임연구원도 31년 전 네이처에 논문을 발표한 바 있다.
참고 자료
Nature(2025), DOI: https://doi.org/10.1038/s41586-025-09426-9