AI 에이전트 전력 소모, 생성형 AI보다 최대 136배 많다

그래픽=챗GPT 달리

업무를 스스로 계획하고 도구까지 활용하는 'AI 에이전트'가 보편화될 경우 데이터센터 전력 부담이 급격히 커질 수 있다는 연구 결과가 나왔다. 단순히 질문에 답하는 생성형 AI와 달리, AI 에이전트는 여러 차례 판단을 반복하는 구조여서 응답 시간과 전력 소비가 크게 늘어난다는 분석이다.

한국과학기술원(KAIST)은 전기및전자공학부 유민수 석좌교수 연구팀이 실제 서비스 환경을 가정해 AI 에이전트의 계산 자원 사용량과 에너지 소비를 분석했다고 5일 밝혔다. 연구팀은 AI 에이전트를 하나의 프로그램이 아니라 데이터센터 서버와 GPU가 계속 처리해야 하는 새로운 형태의 작업으로 보고 성능 저하 요인과 전력 소모를 함께 살폈다.

분석 결과, AI 에이전트는 기존 생성형 AI처럼 한 차례 답변을 생성하는 데 그치지 않았다. 문제를 해결하기 위해 계획을 세우고, 필요한 정보를 다시 요청하며, 외부 도구의 결과를 반영하는 과정을 반복했다. 이 때문에 대형 언어 모델을 부르는 횟수가 늘었고, 전체 응답 시간은 기존 방식보다 최대 153.7배 길어졌다.

GPU 활용 효율도 떨어졌다. 검색이나 코드 실행 등 외부 도구가 작업을 진행하는 동안 GPU는 상당 시간 계산을 하지 못했다. 연구팀은 전체 실행 시간 중 GPU가 대기 상태로 머무는 비중이 최대 54.5%에 달했다고 설명했다. 값비싼 AI 반도체를 투입하더라도 실제 처리 과정에서는 쉬는 시간이 적지 않다는 의미다.

전력 사용량 차이는 더 두드러졌다. 현재 상용 AI 서비스에 쓰이는 수준인 700억 개 매개변수 대형 언어 모델을 기준으로 할 때, AI 에이전트는 요청 한 번에 평균 348.41와트시(Wh)를 소비했다. 이는 일반적인 생성형 AI 질의응답보다 최대 136.5배 많은 수준이다.

연구팀은 AI 에이전트 요청이 하루 137억 건까지 늘어나는 상황도 추산했다. 이 경우 필요한 데이터센터 전력은 약 198.9기가와트(GW)로 계산됐다. 이는 최근 각국이 짓고 있는 수 GW급 AI 데이터센터 규모를 크게 넘어서는 수준이다.

연구진은 이번 결과가 AI 산업의 초점이 모델 성능 경쟁에서 에너지 효율 경쟁으로 옮겨갈 수 있음을 보여준다고 봤다. 앞으로는 AI 모델, 반도체, 서버, 냉각 설비, 전력망을 따로 최적화하는 방식만으로는 한계가 있어 전체 인프라를 함께 설계하는 전략이 필요하다는 것이다.