전 세계 정보기술(IT) 인프라 업계가 인공지능(AI), 고성능컴퓨팅(HPC) 분야에서 주도권을 잡기 위해 동분서주하고 있다. 마이크로소프트(MS)는 최근 AI 컴퓨터 구축을 위해 엔비디아와 다년간에 걸친 협력을 발표했고, 아마존웹서비스(AWS)는 자체 개발한 ‘그래비톤3E’ 프로세서를 앞세워 HPC 시장 공략을 본격화했다. 이들 클라우드서비스제공사(CSP)가 미래 먹거리를 키우기 위해 보폭을 좁히는 동안 델테크놀로지스, 휴렛팩커드엔터프라이즈(HPE) 등 기존 서버 제조사는 AI·HPC 워크로드 지원용 서버 제품을 쏟아내면서 파이 챙기기에 나섰다.
AI와 HPC는 떼려야 뗄 수 없는 관계다. AI 기술이 보편화되면서 데이터 처리 능력이 높고 속도가 빠른 슈퍼컴퓨터 등 HPC의 수요가 늘고 있기 때문이다. 관련 시장 규모도 급속도로 커지고 있다. IDC는 초거대 AI를 포함한 전 세계 AI 시장 규모가 2024년 약 710조6000억원에 이를 것으로 전망했다. 베리파이드마켓리서치는 글로벌 HPC 시장이 지난해 기준 약 45조2000억원 규모에서 2030년 약 84조5000억원대로 연평균 7.2% 성장할 것으로 내다봤다.
24일 업계에 따르면 MS와 엔비디아는 지난달 MS의 클라우드 서비스 애저(Azure)에 수만개의 엔비디아 그래픽처리장치(GPU)를 추가, 클라우드에서 AI 슈퍼컴퓨터를 구축한다는 내용의 파트너십을 체결했다. 양사는 구축한 AI 슈퍼컴퓨터가 고객사의 생성형 AI 개발 및 연구를 도울 수 있을 것으로 기대했다. 텍스트, 이미지, 오디오 등 기존 콘텐츠를 활용해 유사한 콘텐츠를 새롭게 만들어 내는 생성형 AI는 현재 관련 업계의 주목을 한몸에 받고 있다. 일례로 LG는 자체 개발한 초거대 AI ‘엑사원’을 기반으로 디자인 및 예술 영역에서 활용할 수 있는 생성형 AI 기술 및 방법론을 연구하기 위해 지난 9월 세계 3대 디자인 스쿨 중 한 곳인 파슨스와 손을 잡았다.
MS는 이번 협업을 계기로 엔비디아의 GPU, 네트워킹, AI 소프트웨어 전체 스택을 통합하는 최초의 퍼블릭 클라우드 사업자가 됐다. MS와 엔비디아는 향후 엔비디아 H100 GPU, 엔비디아 퀀텀-2 400Gb/s 인피니밴드 네트워킹 및 엔비디아 AI 엔터프라이즈 소프트웨어 제품군을 통합할 계획이다. MS 애저는 현재 엔비디아 A100 GPU와 엔비디아 퀀텀 200Gb/s 인피니밴드 네트워킹으로 구성된 가상머신(VM) 인스턴스를 제공하고 있다. VM은 물리적 컴퓨터와 동일한 기능을 제공하는 ‘소프트웨어 컴퓨터’다. VM에서 만드는 가상의 컴퓨터 하나를 인스턴스라고 부른다. MS 관계자는 “엔비디아와의 협업을 통해 세계에서 가장 확장성이 뛰어난 슈퍼컴퓨터 플랫폼을 구축할 수 있게 된 것”이라며 “애저를 사용하는 기업들은 이 플랫폼에서 최첨단 AI 기술을 활용할 수 있을 것”이라고 전했다.
같은 달 AWS는 이전 세대(그래비톤2)보다 25% 빠른 그래비톤3를 HPC 기술 운영 환경에 최적화한 그래비톤3E 칩을 선보였다. 더 많은 부동소수점 벡터 연산을 소화해 슈퍼컴퓨터 성능 측정(벤치마크) 도구인 HPL 점수를 35% 높이고, 분자 역학 시뮬레이션 프로그램 그로맥스(GROMACS) 기준 성능을 12% 개선했다는 설명이다. 피터 데산티스 AWS 유틸리티컴퓨팅 수석부사장은 당시 그래비톤3E을 탑재한 ‘아마존 EC2 HPC7g’ 인스턴스를 발표하면서 “이 인스턴스는 최고의 에너지 효율에 더 나은 가격과 성능을 결합한 것으로 고효율 실시간 HPC 애플리케이션에 활용할 수 있다. 리스케일(HPC 플랫폼 전문기업) 등이 이걸 활용해 더 빠르고 효율적인 워크로드를 보급할 수 있을 것으로 기대한다”고 말했다.
AWS는 그래비톤3E 출시를 시작으로 유전체학 처리, 전산 유체 역학, 일기 예보 시뮬레이션 등 HPC를 필요로 하는 영역에서 고객사를 늘려갈 방침이다. 이미 보유하고 있는 고객사 중에는 아스트라제네카, 포뮬러원(F1), 맥사테크놀로지 등이 있다. 이와 관련, AWS 측은 “코로나19 팬데믹(감염병의 대유행) 기간에 아스트라제네카가 기존보다 빠른 속도로 백신을 개발할 수 있었던 건 HPC 기반의 시뮬레이션 성능 고도화 덕분이다”라고 강조했다. 블룸버그는 “AWS가 HPC 분야에서 엔비디아, 인텔, AMD 등과 경쟁하게 됐다”고 평가했다.
행보에 속도가 붙은 건 CSP들 뿐만이 아니다. 델테크놀로지스는 지난달 HPC 서버 ‘파워엣지’ 신규 포트폴리오를 공개했다. HPE는 같은 달 머신러닝, 가상데스크톱환경(VDI) 등 최신 워크로드를 지원하는 ‘프로라이언트 Gen11′ 서버 시리즈를 출시했다. AI 개발과 같이 데이터 집약적인 작업을 필요로 하는 기업 중에는 퍼블릭 클라우드 보다 비용이 적게 들어가는 온프레미스(구축형) 인프라 쪽으로 기우는 경우가 적지 않기 때문이란 설명이다. 한 업계 관계자는 “머신러닝이나 딥러닝 AI 모델은 개발하는 데 비용이 천문학적으로 들어간다”며 “클라우드로 이들을 다루기엔 아직까지 금액이 부담스러운 편이다”고 했다.