NIA, 'AI 데이터 품질관리 가이드라인 v3.5' 발간

NIA는 2021년 인공지능 학습용 데이터 품질관리 가이드라인 v1.0을 발간한 이후 매년 인공지능 기술 발전에 따라 고도화해 왔으며 2024년 공개된 가이드라인 v3.1은 6만건 이상의 다운로드를 기록하는 등 공공 및 민간에서 기준서로서 활발히 활용되고 있다.
가이드라인 v3.5는 2024년‘초거대AI 확산 생태계 조성사업’의 경험을 바탕으로 최신 인공지능 기술과 산업의 변화를 반영해 고도화하였다.
이는 총 3권으로 구성되어 있으며, ▲1권은 인공지능 데이터 품질관리 프레임워크 ▲2권은 데이터 구축 방법론 및 오류 대응 전략 실무사례 ▲3권은 생성형 인공지능 데이터에 특화된 품질관리 방법을 각각 제시하고 있다.
특히 이번 가이드라인은 언어모델(LLM) 뿐만 아니라 다중양식(멀티모달) 데이터, 합성데이터 등 생성형 인공지능을 위한 데이터 특성에 맞춘 신규 지표와 구축 방법론을 별도 제시함으로써 빠르게 변화하는 인공지능 기술 동향에 유연하게 대응할 수 있도록 확장성 확보를 도모하였다.
본 가이드라인은 AI허브 및 NIA 누리집을 통해 누구나 내려받아 활용할 수 있으며, 권별로도 별도 제공하여 현장 실무자가 업무 및 관리 범위에 따라 편리하게 참조할 수 있도록 구성하였다.
또한, 데이터 구성의 ‘잘된 사례 vs 부족한 사례’ 비교 분석과 체크리스트 제공 등을 통해 현장 중심의 데이터 품질관리에 실질적인 도움을 줄 것으로 기대된다.
NIA 황종성 원장은 "인공지능 기술의 핵심은 데이터로 인공지능의 생명은 데이터 품질관리에 있다고 할 수 있다”라며, "NIA는 빠르게 발전하는 인공지능 기술에 대응하기 위하여 고품질 데이터 생태계 기반이 조성될 수 있도록 지속적으로 인공지능 데이터 품질 가이드라인 및 기준을 고도화하고 제시하겠다”고 밝혔다.
with the Korea JoongAng Daily
To write comments, please log in to one of the accounts.
Standards Board Policy (0/250자)