아마존웹서비스(AWS)는 3일 'AWS 리인벤트 2025' 행사에서 트레이니움3(Trainium3) 칩 기반의 '아마존 EC2 Trn3 울트라서버' 출시를 발표했다.
해당 서버는 AI 시스템의 급증하는 컴퓨팅 요구 사항을 충족시키고, 고객들이 AI 애플리케이션을 보다 효율적이고 경제적으로 운영할 수 있도록 돕는다고 회사 측은 설명했다. 특히 3나노미터(nm) 공정으로 제작된 트레이니움3 칩은 더 큰 AI 모델을 더 빠르게 훈련시키고, 더 많은 사용자에게 서비스를 낮은 비용으로 제공할 수 있다고 한다.
Trn3 울트라서버는 최대 144개의 트레이니움3 칩으로 확장이 가능하며, 최대 362 FP8 페타플롭스(PFLOPs)의 성능을 제공하고 지연 시간을 4배 줄이는 등 이전 세대 대비 성능 향상을 이뤘다. 이는 모델 훈련 시간을 수개월에서 수주로 단축하고, 동시에 더 많은 추론 요청을 처리해 출시 기간 및 운영 비용을 절감한다.
오픈AI의 GPT-OSS 모델을 활용한 테스트 결과, Trn2 울트라서버 대비 3배 향상된 칩당 처리량과 4배 빠른 응답 속도를 달성하며, 기업이 적은 인프라로도 AI 애플리케이션을 확장하고 사용자 경험을 개선할 수 있음을 보여줬다.
AWS는 트레이니움4 개발에 착수해 차세대 프런티어 훈련 및 추론을 지원할 예정이다. 트레이니움4는 최소 6배의 FP4 처리 성능, 3배의 FP8 성능, 4배의 메모리 대역폭 등의 성능 개선을 목표로 한다. 특히 트레이니움4는 엔비디아 NV링크 퓨전(NVIDIA NVLink Fusion) 고속 칩 연결 기술을 지원하도록 설계된다.
회사 측은 "지속적인 하드웨어 및 소프트웨어 최적화는 AI 모델을 더욱 빠르게 훈련시키고 더 많은 추론 요청을 처리할 수 있는 기반을 마련해 고부하 AI 모델 훈련과 추론 워크로드에 최적화된 유연하고 고성능의 플랫폼을 구현할 것으로 기대된다"고 했다.