애플이 스마트폰 화면을 분석해 사용자에게 답변을 제공하는 인공지능(AI)을 공개했다. 이용자가 입력하는 명령문에만 의존하는 것이 아니라, 사용자가 어떤 작업을 진행하고 있는지 감지하고 맥락에 맞는 답변을 스스로 제공하는 것이다. 애플은 자사 기술이 오픈AI의 ‘챗GPT-4′보다 나은 성능을 보였다고 주장했다. 삼성전자도 올해 사용자 인터페이스(UI) 업데이트를 통해 빅스비에 생성형 AI를 접목, 이용자와 자연스러운 대화를 할 수 있는 기능을 추가할 예정이다.
3일 업계에 따르면 애플은 지난달 29일 논문 사전출판 사이트 ‘아카이브(arXiv)’에 인터넷 연결 없이 기기만으로 구현하는 온디바이스 AI ‘렐름(ReALM)’의 성능을 공개했다. 렐름은 스마트폰 화면에서 이뤄지고 있는 작업의 맥락을 분석해 가장 적합한 결과물을 내놓는 것이 특징이다.
예컨대 특정 기업에 관한 정보를 인터넷으로 찾아보다가 시리에게 “업체에 전화해”라고 말하면, 추가 질문 없이 인터넷 창에 있는 업체의 전화번호로 전화를 거는 식이다. “이거 실행해 줘”라는 말로 지시해도 동영상이나 음악을 스스로 실행하는 기능도 갖췄다.
애플은 이 기술을 통해 음성 비서인 ‘시리’의 성능을 끌어올려 클릭 없이 음성 명령만으로 작업을 수행할 수 있는 핸즈 프리(Hands-Free) 스마트폰을 구현하고자 한다. 애플은 논문을 통해 “AI 비서에게는 사용자 지시의 맥락을 파악하는 것이 매우 중요하다”며 “특히 사용자가 화면에 표시되는 내용에 대해 이해하는 것은 핸즈프리 기능을 보장하는 데 있어 반드시 필요하다”라고 말했다. 업계는 올 가을 출시 예정인 아이폰16을 포함한 신제품에 렐름이 적용될 것으로 보고 있다.
애플은 자체 조사를 통해 렐름의 최고 모델인 ‘렐름-3B’가 대화 분석 능력에서 97.9점을 받아 챗GPT-4(97점)보다 성능이 뛰어나다고 분석했다. 화면의 내용을 분석하는 능력에서도 렐름-3B가 93점으로 챗GPT-4(90.1점)보다 뛰어났다.
이는 렐름이 챗GPT-4보다 저렴한 가격으로 더 나은 성능을 낼 수 있다는 의미이기도 하다. 렐름의 명칭에 붙어 있는 숫자는 매개변수의 수를 의미한다. 매개변수는 AI가 다양한 상황에서 적합한 대답을 내리게 돕는 요소를 말한다. 매개변수가 많을 수록 AI의 성능이 높아지지만 개발 비용도 비싸진다. 렐름은 80M, 250M, 1B, 3B 등 총 4가지 모델로 구성돼 있다. 각각 매개변수가 8000만개, 2억5000만개, 10억개, 30억개다. 챗GPT-4의 매개변수는 1조5000억개다.
애플은 오는 6월 열리는 세계개발자회의(WWDC)를 두고 AI 개발에 박차를 가하고 있는 것으로 보인다. 애플은 지난 1월 시리 기능 개선 업무를 맡은 조직을 해체하는 등 AI 사업에 있어 뚜렷한 성과를 거두지 못하고 있다. 주요 시장인 중국에서 아이폰 출하량은 크게 줄고 있다. 시장조사업체 카운터포인트리서치는 애플의 지난달 아이폰 중국 출하량이 전년 동기보다 24% 줄어든 것으로 추산했다.
삼성전자도 음성 비서 빅스비가 사용자의 지시를 더 잘 이해하도록 성능을 개선할 예정이다. 최원준 삼성전자 부사장은 경제매체 CNBC와의 인터뷰에서 “생성형 AI를 빅스비에 탑재해 사용자와 자연스러운 대화가 가능해지고 우리 생태계에서 삼성 제품을 지원하는 인터페이스가 마련될 것”이라고 했다. 현재 삼성전자는 빅스비를 통해 실시간 통화 통역 기능과 맞춤법 수정, 페이지 요약 기능 등 온디바이스 AI 기능을 제공하고 있다.
최병호 고려대 인공지능연구소 교수는 “전 세계 온디바이스 AI폰의 수요가 대폭 늘어날 것으로 예상되는 가운데 올해 애플과 삼성전자가 내놓는 AI 기능이 스마트폰 시장 점유율 판도에 적지 않은 영향을 미칠 것으로 보인다”고 전망했다.