알리바바 "검색엔진 사용 않는 AI훈련 개발…비용 88% 절감"
"구글에 API 비용 안 내지만 검색엔진 기반 모델보다 성능 앞서"
"구글에 API 비용 안 내지만 검색엔진 기반 모델보다 성능 앞서"
(서울=연합뉴스) 김준억 기자 = 중국 빅테크(거대 정보기술기업) 알리바바가 외부 검색엔진을 사용하지 않는 새로운 인공지능(AI) 훈련 방법을 개발했다고 홍콩 사우스차이나모닝포스트(SCMP)가 12일 알리바바의 최신 논문을 인용해 보도했다.
논문 공개 사이트 아카이브(arXiv) 등에 발표된 이 논문에 따르면 구글 등에 고가의 API(응용 프로그램 인터페이스) 비용을 지불하지 않고도 정보검색 능력을 훈련할 수 있는 '제로서치'라는 새로운 강화학습 방식으로 훈련비용을 90% 정도 절감할 수 있는 것으로 나타났다.
알리바바 연구진은 논문에서 "효과적인 정보 검색은 대규모언어모델(LLM)의 추론과 생성 기능을 향상하는 데 필수적이지만, 검색엔진의 문서 품질을 예측할 수 없어 강화학습(RL) 과정에 불안정성을 초래하고 수십만 건의 검색 요청 등이 필요해 상당한 API 비용을 발생시킨다"고 지적했다.
연구진은 "이런 문제를 해결하기 위해 실제 검색엔진과 상호작용하지 않고도 LLM의 검색 능력을 훈련할 수 있는 '제로서치'를 도입했다"고 밝혔다.
'제로서치' 방식은 간단한 지도미세조정(supervised fine-tuning)을 통해 LLM을 검색 모듈로 변환해 쿼리(질의)에 대한 응답으로 관련성 있는 문서와 노이즈 문서를 모두 생성하도록 한다.
이후 강화학습 훈련 중에는 전략적으로 문서의 품질을 점진적으로 낮추고 더 까다로운 검색 시나리오에 노출시켜 추론 능력을 향상시켰다.
연구진은 '제로서치' 실험을 통해 70억 매개변수(파라미터) 검색 모듈은 실제 검색엔진 기반 모델과 비슷한 성능을 달성했고, 14억 매개변수 모듈은 성능이 더 뛰어났다고 주장했다.
특히 구글 검색 API를 활용해 6만4천건의 질의를 처리하려면 586.7달러(약 82만1천원)의 비용이 들지만, 엔비디아의 A100 그래픽처리장치(GPU) 4개로 구성된 14B 모델에서 훈련하는 비용은 70.8달러로 88%의 비용 절감 효과를 얻을 수 있다고 강조했다.
SCMP는 이런 연구 결과는 AI 검색을 발전시키려는 알리바바의 노력과 궤를 같이한다고 밝혔다.
알리바바는 지난 9일 중국에서 가장 많이 사용되는 AI 앱인 '쿼크'의 향상된 AI 검색 기능을 공개한 바 있다.
쿼크 팀은 "이 기능은 알리바바의 AI 모델 큐원의 추론 능력을 온라인 검색과 통합해 복잡한 질의에 정확한 응답을 제공한다"고 설명했다.
[email protected]
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
김준억
with the Korea JoongAng Daily
To write comments, please log in to one of the accounts.
Standards Board Policy (0/250자)