미국과 중국의 인공지능(AI) 기술 격차가 사실상 사라졌다는 분석이 나왔다. 최상위 AI 모델의 성능이 비슷해지면서, 앞으로 AI 패권 경쟁의 무게 중심이 "얼마나 똑똑하냐"에서 "실전에서 얼마나 효율적으로 작동하고 비용을 절감하느냐"로 이동할 것으로 예상된다.
미 스탠퍼드대 인간중심AI연구소(HAI)는 13일(현지시각) 발표한 '2026 AI 인덱스 리포트'에서 지난 1년 사이 미국과 중국 주요 AI 기업의 AI 모델 성능은 우열을 가리기 어려워졌을 정도로 격차가 좁혀졌다고 밝혔다.
지난해 2월 이른바 '딥시크 쇼크'를 몰고 온 딥시크의 R1 모델의 성능이 미국 최상위 모델과 동등한 수준을 기록했다. 올해 3월 기준 앤트로픽의 최상위 모델 '클로드 오퍼스 4.6'이 틱톡 모회사 중국 바이트댄스의 최상위 모델 '돌라 시드 2.0 미리보기'를 단 39점(2.7%)의 격차로 앞서고 있다. 지난 1년 동안 격차는 한 자릿수 범위 내에서 등락을 거듭하며 순위도 엎치락 뒤치락하는 모습을 보였다.
HAI는 보고서에서 "미국은 여전히 최고 수준의 AI 모델과 영향력 있는 특허를 더 많이 생산하고 있고 세계에서 가장 많은 AI 데이터센터를 보유하고 있지만, 중국이 논문 발표량과 인용 횟수, 특허 출원 건수, 산업용 로봇 설치 수 등에서 앞서고 있다"고 설명했다.
오픈AI는 지난 2022년 챗GPT를 출시해 생성형 AI 시대의 포문을 열었지만, 모델 성능 측면에서는 이미 경쟁자에 따라잡힌 것으로 나타났다. AI 모델의 성능 평가 지표 '아레나 리더보드' 기준 2023년에는 오픈AI가 1322점으로 구글(1117점)을 크게 앞서고 있었지만, 지금은 상위 4개 모델의 점수 차이가 25점 미만으로 좁혀져 사실상 성능 차이가 없어졌다고 보고서는 평가했다.
기업별로 보면 AI 모델 '클로드'로 기업용 시장에서 영향력을 확대하고 있는 앤트로픽이 1503점으로 선두를 달리고 있고, 일론 머스크 테슬라 최고경영자(CEO)가 이끄는 xAI(1495점)와 구글(1494점), 오픈AI(1481)가 뒤를 이었다. 중국 알리바바(1449점)와 딥시크(1424점)도 미국 기업들을 바짝 추격 중이다.
보고서는 "AI 모델의 성능 자체는 더 이상 차별 요소가 아니다"라며 "앞으로 AI 모델이 전문적인 지식이 필요한 작업에서 얼마나 잘 작동하는지, 비용, 지연 시간(latency), 신뢰성 등이 AI 경쟁의 승패를 좌우하는 핵심 요인으로 부상할 것"이라고 진단했다. 법률·금융·의료·코딩·수학 등 전문 분야에 특화된 모델을 보유한 기업이 AI 경쟁에서 우위를 점할 가능성이 커졌다는 설명이다.
실제 AI 기업들도 이런 흐름에 발맞춰 기존 사업의 효율성을 끌어올리고 비용을 절감하는 데 도움을 줄 수 있는 특화 모델을 개발하는 방향으로 전략을 선회하고 있다. 앤트로픽은 AI 모델 '클로드' 기반 코딩 도구 '클로드 코드'를 내세워 기업 고객을 집중 공략하고 있고, 최근에는 보안 결함(버그) 탐지 성능이 뛰어난 '미토스'를 일부 빅테크 기업을 대상으로만 접근권을 제공했다. 기업용(B2B) 시장에서 성과를 내야 수익을 낼 수 있기 때문에 실제 업무에 적용할 수 있는 AI 기반 코딩·보안 도구를 강화하는 분위기다.
챗GPT로 소비자용 AI 시장에서 압도적인 점유율 1위를 기록하고 있는 오픈AI도 안정적인 수입원을 확보하기 위해 기업 고객 대상 코딩 도구 '코덱스' 판매에 집중하고 있다.
구글 딥마인드는 단백질 구조를 예측하는 '알파폴드', 범용 월드 모델 '프로젝트 지니', 기상 예보 모델 '웨더넥스트', 로보틱스 모델 '제미나이 로보틱스' 등 과학과 의료, 제조, 게임 분야에 적용할 수 있는 특화 모델 개발과 상용화에 가장 적극적이다.
메타는 최근 경량 모델인 '뮤즈 스파크'를 공개했는데, 자사 주력 소셜미디어(SNS) 플랫폼 페이스북·인스타그램·왓츠앱을 효율적으로 구동할 수 있도록 설계됐다고 밝혔다. 이미 수십억명의 이용자를 보유한 플랫폼에 AI 기능을 적용해 수익성과 성능을 극대화하고 이용자 참여도를 높이는 게 목표다.
최근 1년 사이 AI 성능이 좋아지면서 기업과 개인의 AI 도입률도 53% 수준까지 높아졌지만, 기업 현장이나 실생활 적용에 있어 여전히 허점이 많다고 HAI는 지적했다. 보고서는 "오늘날 AI 모델은 국제수학올림피아드를 석권할 수 있을 정도로 수학 문제를 잘 풀지만, 아날로그 시계를 정확히 읽는 비율은 50.1%에 그친다"라며 "이는 AI 전문가들이 '들쭉날쭉한 AI 역량(jagged frontier)'이라고 부르는 현상의 대표적인 사례"라고 했다.