레드햇은 아마존웹서비스(AWS) 클라우드 상에서 '레드햇 AI'와 'AWS AI' 실리콘을 결합해 기업용 생성형 인공지능(AI) 지원을 확대한다고 3일 밝혔다.
레드햇과 AWS의 협업은 레드햇 플랫폼 역량, AWS 클라우드 인프라, AI 칩셋을 결합해 생성형 AI 전략을 구현하도록 지원한다. 레드햇 AI 인퍼런스 서버는 vLLM 기반으로 AWS 인퍼런시아2와 트레이니움3에서 실행되며, 세대와 무관하게 다양한 생성형 AI 모델을 위한 공통 추론 레이어를 제공한다. 이를 통해 고객은 기존 GPU(그래픽처리장치) 기반 아마존 EC2보다 최대 30~40% 향상된 가격 대비 성능을 확보할 수 있다는 게 회사 측 설명이다.
양사는 AWS 레드햇 오픈시프트 서비스, 레드햇 오픈시프트, 레드햇 오픈시프트 AI에 적용되는 AWS 뉴런 오퍼레이터도 개발 중이다. AWS 뉴런 커뮤니티 오퍼레이터는 현재 레드햇 오픈시프트 및 AWS 레드햇 오픈시프트 서비스 사용자에게 제공된다. AWS AI 칩을 지원하는 레드햇 AI 인퍼런스 서버는 2026년 1월 개발자 프리뷰로 제공될 예정이다.
조 페르난데스 레드햇 AI 사업부 부사장은 "레드햇 AI 인퍼런스 서버를 AWS AI 칩과 함께 구현해 조직이 효율성과 유연성을 기반으로 AI 워크로드를 확장할 수 있도록 지원하고 있다"고 말했다.
콜린 브레이스 AWS 안나푸르나 랩 부사장은 "트레이니움과 인퍼런시아는 고성능 AI 추론과 학습을 비용 효율적으로 구현하도록 설계됐다"며 "이번 협업으로 고객이 생성형 AI를 프로덕션까지 빠르게 확장할 수 있는 기반이 마련됐다"고 말했다.