GPU–스토리지 협업 기반 ‘GSP-Tucker’ 국제학회 발표
-
- ▲ ETRI·전북대학교 연구팀과 공동연구를 통해 초대규모 텐서(Tensor) 데이터를 효율적으로 처리할 수 있는 GPU–스토리지 협업 기반 터커(Tucker) 분해 기술을 개발한 한기대 전강욱 교수.ⓒ한기대
한국기술교육대학교 컴퓨터공학부 전강욱 교수 연구팀이 한국전자통신연구원(ETRI), 전북대학교 연구팀과 공동연구를 통해 초대규모 텐서 데이터를 효율적으로 처리할 수 있는 GPU–스토리지 협업 기반 터커(Tucker) 분해 기술을 개발했다.텐서는 데이터를 다차원 배열 형태로 구조화한 데이터 표현 방식이며, 터커 분해는 복잡한 다차원 데이터를 작은 구조로 나눠 효율적으로 분석하는 기술이다.최근 인공지능과 추천시스템, 데이터마이닝, 과학계산 등 다양한 분야에서 대규모 고차원 데이터 분석 수요가 증가하면서 텐서 분해 기술의 중요성도 커지고 있다.다만 기존 기술은 데이터 규모가 커질수록 메모리 사용량이 급격히 증가하고, 데이터 분포가 특정 구간에 집중되는 ‘데이터 쏠림 현상’으로 병렬 처리 효율이 떨어지는 한계가 있었다.연구팀은 이를 해결하기 위해 데이터 분포 특성을 고려한 다단계 분할 기법과 GPU–스토리지 협업 실행 구조를 결합한 새로운 프레임워크 ‘GSP-Tucker’를 제안했다.GSP-Tucker는 대규모 희소 텐서를 여러 단계로 나눠 처리하고, GPU 연산과 스토리지 기반 데이터 처리를 유기적으로 결합하는 방식이다.필요한 데이터만 순차적으로 불러와 처리하는 out-of-core 실행 방식을 적용해 제한된 메모리 환경에서도 안정적인 연산이 가능하도록 설계됐다.연구팀에 따르면 기존 Tucker 분해 기법들이 메모리 부족이나 실행 실패를 보인 초대규모 데이터셋에서도 GSP-Tucker는 안정적으로 동작했으며, 메모리 사용량과 실행 성능 측면에서도 개선 효과를 확인했다.이를 통해 단일 머신 환경에서도 초대규모 텐서 데이터를 처리할 가능성을 제시했다는 설명이다.이번 연구는 한국기술교육대학교와 ETRI, 전북대학교 연구진 협업으로 진행됐다.공동 주저자는 한국기술교육대학교 컴퓨터공학부 석박사통합과정 송승현 학생과 ETRI 이지혜 박사이며, 전강욱 교수와 김찬기 교수가 공동 교신저자로 참여했다.전강욱 교수는 “초대규모 비정형 텐서 데이터 분석의 주요 병목인 메모리 한계와 데이터 쏠림 문제를 동시에 완화할 수 있는 실행 기술을 제시했다는 점에서 의미가 있다”며 “향후 추천시스템과 지식그래프 분석, 과학계산, 대규모 인공지능 데이터 처리 등 다양한 분야로 확장될 수 있을 것으로 기대한다”고 말했다.이번 연구 논문은 데이터베이스 분야 세계 3대 학술대회 가운데 하나인 IEEE ICDE 2026에 채택됐다. 연구팀은 지난 5월 캐나다 몬트리올에서 열린 학회에서 ‘Toward Scalable Tucker Decomposition: Skew-Aware Multi-Level Partitioning with GPU–Storage Co-Processing’를 주제로 연구 결과를 발표했다.





