부산대학교

작성일: 2024.06.07

수정일: 2024.06.07

작성자: scsc연구센터

조회수: 66

UNIST 김성일교수님연구팀, 시계열 인공지능 모델의 성능저하 막는다!...데이터 드리프트에 강력한 시계열 학습 기술 개발

김성일·임동영 UNIST 교수팀(왼쪽부터 김성일 교수, 임동영 교수, 제 1저자 오용경 연구원)

시계열 데이터 변화로 인한 인공지능(AI) 모델의 학습 저하 현상을 예방할 수 있는 기술이 개발됐다.

UNIST(총장 이용훈)는 김성일·임동영 인공지능대학원 교수팀(이하 김 교수팀)이 '데이터 드리프트에 강건한 시계열 학습 기술'을 개발했다고 25일 밝혔다.

'시계열 데이터'는 시간 흐름에 따라 연속으로 수집한 데이터다. 경제, 교통, 농업, 제조, 헬스케어 등 각종 산업에서 수집해 사용하는 데이터는 대부분 시계열 데이터다. '데이터 드리프트'는 센서, 측정 기준 등 외부 환경 변화로 데이터가 달라지는 것을 말한다.

시계열 데이터 학습에서 발생하는 데이터 드리프트는 AI 모델 성능 저하의 주요 원인이다. 각종 산업에서 시계열 데이터 활용을 어렵게 만드는 고질적 문제이기도 하다.

김 교수팀은 데이터 드리프트에 효과적으로 대응할 수 있는 '뉴럴(Neural) SDEs(Stochastic Differential Equations) 기반 신경망 구조 설계 방법론'을 개발했다. 데이터 드리프트가 발생해도 강건함을 유지할 수 있는 시계열 뉴럴 SDEs 모델 설계 방법론이다.

뉴럴 SDEs는 스킵 연결로 잔차(Residual, 관측값 또는 측정값에서 얻어진 확실한 값과 계산값 또는 이론값의 차)를 학습하도록 만든 인공 신경망이다. 일반 딥러닝 신경망 모델보다 예측 정확도가 높다.

김 교수팀은 이 방법론으로 세 가지 뉴럴 SDEs 모델(Langevin-type SDE, Linear Noise SDE, Geometric SDE)을 제시했다. 제시한 모델들은 데이터 드리프트 현상이 일어난 데이터셋에서 보간, 예측, 분류 등 다양한 작업을 수행할 때 안정적이며 우수한 성능을 나타냈다.

김성일 교수는 “데이터 드리프트 발생을 빠르게 포착해 데이터를 재구성하고 재학습하는 일련의 과정은 큰 시간과 비용이 소요된다”며 “데이터 드리프트에 강한 AI 모델 설계를 이론적, 실험적으로 검증한 성과로 AI 학습 저하 예방은 물론 AI 성능 강화와 활용 가능성 제고에도 기여할 것”이라고 말했다.

연구 성과는 국제학회 ICLR(International Conference on Learning Representations) 스포트라이트 논문으로 선정돼 오는 5월 오스트리아 빈에서 발표될 예정이다.

이번 연구는 한국보건산업진흥 바이오메디컬 글로벌 인재양성사업, 정보통신기획평가원 인공지능대학원사업, 과학기술정보통신부 한국연구재단 기본 연구 및 인간중심-탄소 중립 글로벌 공급망 연구센터의 지원으로 이뤄졌다.

기사 출처: https://www.etnews.com/20240325000060

첨부파일: 첨부파일이(가) 없습니다.