“인간 수준 이해력” 클로드3 공개에 챗GPT·제미나이 긴장... 생성형 AI 판도 뒤흔드는 앤트로픽

"일반인이 이해하기 어려운 연구 논문을 3초 만에 요약하는 모습을 보면 생성형 인공지능(AI)이 거의 인간 수준의 이해력을 갖췄다는 것을 실감할 수 있다."

미국 경제매체 CNBC는 지난 4일 AI 스타트업 앤트로픽이 만든 거대언어모델(LLM) '클로드3′에 대해 "역대 가장 강력한 챗봇이 나왔다"라며 "클로드3의 지능지수(IQ)가 인간 평균치인 100을 넘어섰다는 테스트 결과가 나왔다"라고 했다.

12일 로이터, CNBC, 더버지 등 외신에 따르면 앤트로픽의 클로드3는 다양한 벤치마크 시험에서 오픈AI 'GPT-4′와 구글 '제미나이 울트라'를 넘어서는 성능을 보였다. 대학 학부 수준의 지식(MMLU), 대학원 수준의 추론(GPQA), 기본 수학(GSM8K) 등 모든 분야에서 클로드3가 현재까지 나온 생성형 AI 중 가장 강력한 성능을 나타낸 것이다.

앤트로픽은 구글의 모회사인 알파벳과 아마존이 투자해 2022년 만들어졌다. 오픈AI 창립 멤버였던 아모데이 남매가 설립하면서 엔비디아, LG테크놀로지벤처스, SK텔레콤으로부터 투자를 받았다. 지난해 유치한 투자금은 74억달러(약 9조570억원)에 달할 정도다.

그래픽=정서희

클로드3는 GPT-4, 제미나이와 기본적으로 구동하는 방식이 동일하다. 방대한 텍스트 기반 데이터를 분석해 채팅 형식으로 사용자가 원하는 결과물을 제공하는 식이다. 텍스트와 이미지를 모두 분석할 수 있는 다중 모드 적용 여부도 같다. 가령 논문을 업로드하면 요약문을 만들어 주거나 사진이나 그림을 분석해 사용자의 질문에 답하는 식이다. 다만 인터넷 검색으로 관련 데이터를 찾아 답하는 GPT-4, 제미나이와 달리 클로드3는 인터넷 검색을 하지 않는다. 기존에 학습한 데이터로만 대답을 찾아 답한다. 앤트로픽은 "2023년 8월 이전의 데이터로만 질문에 답할 수 있다"라며 "영어를 제외한 타 언어도 유창하지 않을 수 있다"라고 설명했다.

GPT-4, 제미나이와 가장 큰 차이는 클로드3는 이미지 생성 기능을 제공하지 않는다. 이에 대해 다리오 아모데이 앤트로픽 최고경영자(CEO)는 "기업 고객들에게는 이미지 생성 수요가 크지 않아 이 기능을 넣지 않았다"라고 했다. 하지만 업계는 아인슈타인을 유색 인종으로 묘사하고, 독일 나치군을 아시아인으로 생성한 GPT-4, 제미나이가 보인 오류와 편향성 문제를 피하기 위한 조치라고 본다.

클로드3는 텍스트 기반 서비스만 제공하는 만큼 긴 글을 처리하는 능력은 GPT-4, 제미나이를 넘어선다. 가령 책 1권에 해당하는 15만개 단어 분량을 몇초 만에 분석해 요약한다. IT매체 더버지는 "방대한 데이터를 분석해 정확하게 정보를 기억하고 요약하는 능력은 거의 완벽에 가깝다"라며 "데이터 속 오류를 찾아내는 '건초더미 속 바늘 찾기' 평가에서도 99%의 정확도를 보였다"라고 했다.

최고 성능을 강조하는 오픈AI, 구글과 달리 앤트로픽은 '안전한 AI 활용'에 초점을 맞추고 있다. 오류가 있을 수 있는 최신 데이터를 적용하는 대신 조금 늦더라도 6개월의 시차를 두고 데이터를 학습·적용한다. IT매체 톰스가이드는 "오픈AI, 구글과 앤트로픽 AI 모델의 가장 큰 차이는 성능 개선을 위한 개발 최전선에 가드레일(Guardrail·안전장치)이 쳐져 있느냐 하는 것"이라며 "확실한 건 앤트로픽의 AI 가드레일은 넓고 견고해 보인다"라고 했다.

"인간 수준 이해력" 클로드3 공개에 챗GPT·제미나이 긴장... 생성형 AI 판도 뒤흔드는 앤트로픽