아마존웹서비스(AWS)는 아랍에미리트(UAE) 아부다비의 글로벌 과학연구센터인 테크놀로지 이노베이션 인스티튜트(Technology Innovation Institute, 이하 TII)가 오픈소스 팰컨 40B(Falcon 40B) 모델을 AWS에서 훈련했다고 9일 밝혔다.
아파치 2.0(Apache 2.0) 라이선스로 사용할 수 있는 팰컨 40B는 400억 개의 매개변수를 가진 대규모 언어 모델(LLM)이다. 여러 벤치마크에서 LLM을 추적, 순위 지정, 평가하여 최고 성능 모델을 식별하는 허깅페이스(Hugging Face)의 오픈 LLM 리더보드(Open LLM Leaderboard)에서 1위를 차지한 바 있다.
LLM은 텍스트 처리와 요약, 그리고 질의응답에 이르기까지 광범위한 생성형 AI 애플리케이션을 구동할 수 있는 언어에 초점을 맞춘 머신러닝(ML) 모델의 하위 집합이다.
LLM은 산업을 혁신할 수 있는 잠재력이 있지만 구축, 훈련, 배포하는 프로세스는 몇 주에서 몇 달이 걸릴 수 있으며 수천만 달러의 비용이 들기 때문에 많은 회사에서 접근하기 어렵다는 게 AWS의 설명이다.
그동안 스태빌리티(Stability AI), AI 21 랩스(AI 21 Labs), 허깅페이스, LG AI를 비롯한 수많은 고객이 AWS ML 서비스인 '아마존 세이지메이커'를 사용해 LLM을 구축·훈련했다.
엡테삼 알마즈루에이 TII AI크로스 센터 부문 총괄 겸 LLM 프로젝트의 프로젝트 리드는 "오픈소스 팰컨 LLM은 최첨단 기술에 대한 광범위한 액세스를 가능하게 하고 전 세계 연구원과 조직을 지원하고자 한다"고 말했다.