KAIST, 상황변화에 따라 스스로 최적화하는 AI 구현

황의종 교수팀, 데이터 변화 환경서 고성능 유지 학습 데이터 선택 기법 개발
데이터 가변적인 제조·공정, 기상, 금융 등에 적용 가능
국제학술대회 '국제인공지능학회(AAAI 2024)'에서 발표

KAIST가 제안한 알고리즘이 드리프트 환경에서 적절한 학습 데이터를 선택하는 예시. 과거 데이터 중에서 현재 상황을 위한 모델 학습에 도움이 될 수 있는 데이터를 선택하고 피해를 주는 데이터는 제거해 최적의 학습 데이터를 구성한다.

김양수 기자 = KAIST는 전기및전자공학부 황의종 교수팀이 시간에 따라 데이터의 분포가 변화하는 환경에서도 인공지능(AI)이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다.

AI 모델을 훈련시키고 성능을 테스트할 때는 데이터의 분포가 변하지 않는 정적인 환경을 가정해 얻어지고 있으나 시간에 따른 장비의 노화와 주기적인 점검 등으로 센서 데이터의 관측값이 지속적으로 변화하는 드리프트 현상이 나온다.

시간이 지나면서 데이터와 정답 레이블 간의 결정경계패턴이 변경되면 과거에 학습됐던 AI 모델이 내린 판단이 현재 시점에서는 부정확하게 되면서 모델의 성능이 점차 악화될 수 있다.

문제해결을 위해 황 교수팀은 데이터 학습 때 AI 모델의 업데이트 정도와 방향을 나타내는 '그래디언트(gradient)' 개념을 도입하고 제시한 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데 도움을 줄 수 있음을 이론·실험적으로 분석했다.

이어 분석을 바탕으로 효과적인 학습 데이터 선택 기법을 제안, 데이터의 분포와 결정경계가 변화해도 모델을 강건하게 학습할 수 있는 지속 가능한 데이터 중심의 AI 학습 프레임워크를 확보했다.

이 학습 프레임워크은 기존의 변화하는 데이터에 맞춰 모델을 적응시키는 모델 중심의 AI 기법과 달리 드리프트의 주요 원인이되는 데이터 자체를 직접 전처리해 학습에 최적화된 데이터로 바꿔줘 AI 모델 종류에 상관없이 쉽게 확장될 수 있다는 장점이 있다.

실제로 해당 기법을 통해 시간에 따라 데이터의 분포가 변화됐을 때에도 AI 모델의 성능인 안정적 정확도가 유지되는게 확인됐다.

이번 연구에는 KAIST 전기및전자공학부의 김민수 박사과정이 제1저자, 황성현 박사과정이 제2저자, 황의종 교수(KAIST)가 교신 저자로 참여으며 연구 결과는 지난 2월 캐나다 밴쿠버에서 열린 인공지능 최고 권위 국제학술 대회인 '국제 인공지능 학회(AAAI)'에서 발표됐다.(논문명: Quilt: Robust Data Segment Selection against Concept Drifts)

김민수 박사과정 학생은 "이번 연구를 통해 인공지능을 한번 잘 학습하는 것도 중요하지만, 변화하는 환경에 따라 계속해서 관리하고 성능을 유지하는 것도 중요하다는 사실을 알릴 수 있게 됐다"고 말했고 황의종 교수는 "인공지능이 변화하는 데이터에 대해서도 성능이 저하되지 않고 유지하는 데에 도움이 되길 기대한다"고 밝혔다.

뉴시스 다른기사 보기