국내 스타트업의 인공지능(AI) 거대언어모델(LLM)이 뛰어난 비용 대비 성능 경쟁력을 인정받았다. 일론 머스크(사진) 테슬라 최고경영자(CEO)가 해당 모델을 거론하며 자신의 회사인 xAI의 모델이 더 뛰어나다는 취지의 글을 올려 관심을 모으고 있다.
일론 머스크 CEO는 19일(현지시간) 자신의 X 계정에 글로벌 AI모델 벤치마크 업체 ‘아티피셜 애널리시스(Artificial Analysis)’ 최근 게시글을 공유한 뒤 “그렇지만 xAI의 그록이 여전히 1위다. 그리고 그록은 빠르게 개선하는 중이다”는 반박성 글을 올렸다. 아티피셜 애널리시스는 AI 업계 전문가들이 주요하게 참고하는 지표다.
머스크가 공유한 글은 아티피셜 애널리시스가 국내 스타트업 업스테이지의 신규 추론 AI모델 솔라 프로2를 전 세계 AI모델 중 성능 12위로 평가하면서 “크기와 비용 대비 뛰어난 성능을 보여줬다”고 한 내용이다. xAI의 최신 AI 모델 그록4는 같은 평가에서 전체 1위였지만, 함께 공개된 ‘가성비 지표(Intelligence vs. Cost to Run)’에선 평가가 좋지 못했다. 해당 지표에서 솔라 프로2는 ‘가장 매력적인 구간(Most Attractive quadrant)’ 내 위치해 비용 대비 성능 측면에서 가장 앞선 것으로 평가받은 반면, 그록 4는 해당 구간 바깥에 머물러, 성능은 좋지만 그만큼 비용이 많이 들어간 모델로 분류됐다.
AI업계에선 여러 혁신을 통해 효율적인 제품, 서비스를 만들어 온 머스크가, 자신의 AI모델이 가성비가 떨어진다는 평가에 발끈했다는 해석이 나온다. 머스크의 X 게시글엔 “(1위라는 게) 그록4를 말하는 건가 그록4의 무게(매개변수 수)를 말하는 건가?”하는 댓글이 달리기도 했다.
업스테이지가 지난 10일 출시한 솔라 프로2는 310억(31B) 매개변수 규모로 설계돼 최적의 성능을 내는 추론형 모델이다. 특히 사용자가 명령어를 입력한 뒤 빠른 응답에 최적화된 ‘챗 모드’와, 구조화된 답변을 생성하는 ‘추론 모드’ 중 하나를 선택해서 답변받을 수 있게 한 하이브리드 기능이 장점으로 꼽힌다. 생각 사슬(CoT) 기법을 적용한 추론 모드는 수학과 코딩처럼 복잡한 작업에서 최적 성능을 발휘한다. 업스테이지 관계자는 “국내 회사가 만든 AI모델이 이 지표에 등장한 건 처음”이라고 말했다.
아티피셜 애널리시스는 개발사 업스테이지를 ‘최상위 언어모델(Frontier Language Model)을 만드는 회사 톱10’에 포함시키기도 했다. 10위권 안에 들어간 회사들은 오픈AI·xAI·메타·구글·앤스로픽·미스트랄·딥시크·문샷AI·알리바바 등이다. 규모와 자금 면에서 압도적으로 우위에 있는 회사들과 어깨를 나란히 한 셈이다.
머스크가 자사 모델에 대해 공개 발언하자 김성훈 업스테이지 대표는 X 댓글을 통해 “xAI가 1등인 것을 축하한다. 하지만 오래가진 않을 거다. 아주 빠르게 개선해 따라잡겠다”고 도발했다. 이에 그록 공식 계정은 “우리는 발전의 원동력이 되는 경쟁을 반긴다. 솔라 LLM의 발전을 보게 돼 기쁘다. 최고의 AI가 승리하길 바란다”고 답하기도 했다. 업계는 정부가 ‘AI 3대 강국 도약’을 목표로 ‘독자 AI 파운데이션 모델 프로젝트’를 추진하는 가운데 이런 성과가 나왔다는 점에 주목한다. 아티피셜 애널리시스는 “업스테이지의 이번 출시는 소버린 AI 역량 개발을 위한 각국의 이해관계에 부합한다”고 밝혔다.