NC AI가 산업 현장에 생성형 인공지능(AI)을 확산시키기 위한 조건으로 도메인 전문성과 보안·통제권, 비용 효율성을 제시하고, 이를 충족하는 산업 특화 파운데이션 모델 '벡키(VAETKI)'와 현장 적용 체계를 공개했다. 파운데이션 모델은 다양한 업무에 공통으로 활용할 수 있는 '기본 뼈대 AI'를 말한다.
이현수 NC AI 최고경영자(CEO)는 30일 서울 삼성동 코엑스 오디토리엄에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 "무조건 큰 모델이 답이 아니라 특정 비즈니스에 최적화된 모델로 실시간 응답 속도를 확보해야 한다"고 밝혔다.
이어 산업 특화 AI가 현장에서 쓰이는 기술이 되려면, 기술 성능뿐 아니라 보안과 운영, 비용까지 함께 설계돼야 한다고 강조했다. 이 CEO가 제시한 첫 번째 요건은 도메인 전문성과 유연성이다. 제조·물류·국방처럼 산업마다 용어와 규정, 업무 흐름이 다르기 때문에 업계 데이터를 실시간으로 통합해 현장의 맥락을 이해해야 한다는 설명이다.
두 번째는 보안 및 통제권이다. 이 CEO는 "온프레미스 환경에서 기업 밖으로 기밀이 새어나가지 않게 해야 한다"고 말했다. 온프레미스는 AI를 외부 클라우드가 아니라 고객사 내부 서버에서 운영하는 방식이다. 이 CEO는 "산업에서 요구하는 품질과 속도를 현실적인 비용으로 맞추는 '비용 효율화'가 핵심"이라고 강조했다.
이를 기반으로 NC AI는 1단계 추진 결과로 목표를 100% 초과 달성했다고 밝혔다. 구체적으로 고품질 한국어 산업 특화 데이터를 확보했고, 100B(1000억)급 대규모언어모델(LLM) 개발을 성공적으로 완료했다는 설명이다.
모델 전략은 고성능만이 아니라 효율과 확산성에 초점을 맞췄다. NC AI는 산업 현장에 즉시 투입 가능한 구성을 목표로 고성능 LLM과 현장 배포에 유리한 확산형 LLM 등 라인업을 갖추고, 비용 최적화와 유연한 대응을 위한 강화 모델도 병행했다고 설명했다.
기술적으로는 전문가 혼합(MoE) 아키텍처를 적용했다고 밝혔다. MoE는 여러 전문가 모듈 가운데 필요한 부분을 선택해 쓰는 구조로, 이 방식을 통해 전문 지식을 모으고 확장 가능하도록 설계했다는 설명이다. 발표에 따르면 메모리 사용량을 약 83% 절감하고, AI가 문맥에서 중요한 단서를 찾는 연산인 '어텐션'의 계산 효율을 40% 개선했다고 밝혔다.
데이터 측면에서는 20조 토큰 규모의 하이퍼스케일 데이터를 구축했다고 밝혔다. 토큰은 AI가 텍스트를 처리하는 단위로, 토큰이 많다는 말은 그만큼 방대한 텍스트를 학습했다는 의미다. NC AI는 도메인 문서뿐 아니라 의료와 안전 데이터까지 포함한 14종 멀티모달 데이터를 확보해 모델의 깊이를 더했다고 밝혔다. 또 멀티모달 AI 세이프티 얼라인먼트 데이터로 안전과 윤리를 강화했다고 설명했다.
NC AI는 모델 개발에서 끝나는 것이 아니라, 실제 현장에 올려 잘 작동하게 만드는 체계로 '도메인옵스' 플랫폼을 제시했다. 도메인옵스는 산업별 환경에 맞춰 모델을 쉽게 개발·조정·배포하도록 돕는 운영 체계로, 자원 자동 할당 및 스케줄링, 미세 조정, 원클릭 배포, 온프레미스 모델 다운로드 기능 등을 포함한다. 회사는 해당 플랫폼이 국제 학술 워크숍 WITS 2025에서 인정받았다고도 밝혔다.
NC AI는 이 체계를 바탕으로 제조, 물류, 국방 등에서 28개 이상의 산업 현장 확산 프로젝트를 수행 중이라고 덧붙였다. 구체적 사례로는 스마트 팩토리 전환, 항공 및 건설 분야 적용, 문화 콘텐츠 프로젝트 등을 언급했다. 전방위 프로젝트를 통해 벡키의 성능과 적용성을 입증하고 있다는 설명이다.
이날 이 CEO는 실제 서비스 사례로 'VARCO 3D'를 소개했다. 벡키 LLM과 3D 생성 모델을 결합해 텍스트만으로도 3D를 생성할 수 있으며, 복잡한 형상과 질감까지 구현하는 서비스다. 특히 4주 이상 걸리던 3D 제작 과정을 10분 이내로 단축했고, 12월 기준 월간 활성 이용자(MAU) 2만을 달성했다고 밝혔다.
또 다른 사례로는 벡키 LLM과 사운드 생성을 제시했다. 특정 장면을 언어로 묘사하면 LLM이 필요한 소리를 추론해 고품질 효과음을 자동 생성하는 방식으로, 배경음악과 효과음, 캐릭터 사운드 등 다양한 사운드를 무한히 생성할 수 있다고 설명했다.
NC AI는 향후 단계별 전략도 공개했다. 2차에서는 200B급 고성능 LLM 달성을 목표로 하고, 3차에서는 산업 특화를 위한 확산형 LLM을 개발하겠다고 했다. 4차에서는 멀티스케일과 멀티모달 패키지를 통해 산업 확산을 본격 활성화한다는 계획이다.
중장기 일정으로는 2026년 국내 대표 산업에서 실증을 완성하고, 2027년 글로벌 AI 안전성과 신뢰성 표준 인증을 추진하는 동시에 중동과 동남아 신규 시장으로 소버린 AI 수출을 본격화하겠다는 계획도 제시했다.
한편 정부는 내년 1월 중 1차 단계 평가를 통해 독자 AI 파운데이션 개발 참여팀의 성과와 향후 계획을 종합 점검하고, 결과에 따라 정예팀을 4팀으로 압축할 예정이다. 이후 6개월마다 심사를 진행해 정예팀 수를 1팀씩 줄이고, 2027년 최종적으로 2팀을 선정한다는 방침이다.