아마존웹서비스(AWS)는 AI 및 고성능 컴퓨팅(HPC) 워크로드를 위한 새로운 그래픽처리장치(GPU) 기반 P6e-GB200 울트라서버를 출시했다고 15일 밝혔다.
엔비디아 그레이스 블랙웰 슈퍼칩으로 구동되는 P6e-GB200 울트라서버는 매우 크고 복잡한 AI 모델의 훈련과 배포를 지원하며, 최대 72개의 엔비디아 블랙웰 GPU와 360페타플롭스의 FP8 고밀도 컴퓨팅을 제공한다. 이 서버는 기존 P5en 인스턴스와 비교하여 20배 이상의 컴퓨팅 성능과 11배 이상의 메모리를 제공하며, 4세대 일래스틱 패브릭 어댑터(EFAv4)를 통해 최대 28.8Tbps의 대역폭을 지원한다.
P6-B200 인스턴스는 8개의 GPU와 1.4TB의 고대역폭 GPU 메모리를 제공하며, GPU 성능과 메모리 크기에서 P5en 인스턴스보다 2배 이상 향상됐다. P6e-GB200은 조 단위 매개변수 규모의 AI 모델 훈련과 추론에 최적화돼 있으며, 단일 NV링크 도메인 내에서 1조 개 파라미터 모델을 완벽히 처리할 수 있다.
AWS는 이 인스턴스들에 대해 보안과 안정성을 강조하며, AWS 니트로 시스템을 통해 인스턴스의 보안성과 시스템 관리 효율성을 개선했다. P6e-GB200과 P6-B200 인스턴스는 액체 냉각 시스템을 적용해 높은 성능과 효율성을 제공하며, AWS의 3세대 EC2 울트라클러스터 환경에서 최적화된 성능을 발휘한다.
AWS는 P6e-GB200을 통해 대규모 환경에서 일관된 성능과 안정성을 제공하며, EFAv4를 통해 분산 훈련에서 최대 18% 향상된 성능을 보인다. 이 인스턴스들은 다양한 AI 및 HPC 워크로드에 적합하며, AWS의 클라우드 인프라에서 안전하고 효율적인 컴퓨팅 환경을 제공한다.