KAIST, 엔비디아 넘어선 AI 가속기 개발

7 hours ago 2

 Getty Images Bank

Getty Images Bank

국내 연구진이 엔비디아 고성능 GPU보다 그래프 신경망(GNN) 처리 속도가 높은 인공지능(AI) 가속기를 개발했다.

전자상거래, 물류처럼 관계 데이터가 복잡한 서비스에서 GNN은 핵심 분석 기술로 꼽히지만 추론에 앞서 전처리 단계에서 지연이 커 전체적으로 속도가 떨어지는 문제가 있다.

KAIST는 정명수 전기및전자공학부 교수 연구팀이 GNN 추론 속도를 크게 높일 수 있는 필드프로그래머블게이트어레이(FPGA) 기반 가속기 ‘오토GNN’을 개발했다고 최근 밝혔다. 이 연구는 삼성미래기술육성사업단의 지원을 받았고 KAIST 교원 창업기업인 파네시아가 참여했다.

연구팀에 따르면 오토GNN은 서버급 인텔 CPU 대비 최대 9배, 엔비디아 고성능 GPU인 RTX 3090 대비 2.1배 빠른 처리 속도를 달성했다. 에너지 소비량도 평균 대비 최대 3분의 1 수준으로 줄였다. FPGA는 필요에 따라 반도체 내부 회로 구성을 재프로그래밍할 수 있는 시스템반도체다.

객체 간 관계를 나타내는 그래프 데이터는 구조가 불규칙해 기존 GPU만으로는 해결에 한계가 있다. 정 교수는 “기존 GPU는 사전처럼 단서(색인)를 통해 값을 빠르게 찾는 데 최적화돼 있다”며 “반면 관계를 기반으로 만든 그래프는 필요한 정보를 얻기 위해 처음부터 관계를 따라가며 일일이 탐색해야 하는 구조여서 GPU에 불리하다”고 설명했다.

이에 머신러닝(ML) 알고리즘의 한 종류인 GNN이 주목받는다. 그래프의 특성을 학습해 예측하는 방식으로, 추천 시스템과 소셜 네트워크 분석 등에서 높은 정확도를 보인다. 그러나 전처리 지연율이 높아 시스템에 적용하기에는 어려움이 있다. 연구팀이 대규모 그래프 데이터셋에서 검증한 결과 전처리 과정이 전체 GNN 서비스 시간의 90.8%를 차지했다.

연구팀은 이 같은 문제를 해결하기 위해 하드웨어를 재설계했다. 전처리에서 반복적으로 등장하는 두 가지 핵심 연산을 모듈 형태로 구현한 것이다. 필요한 데이터만 골라내는 ‘통합처리요소(UPE)’와 추려낸 데이터를 즉시 정리·집계하는 ‘단일사이클리듀서(SCR)’ 모듈을 조합했다. 필요한 정보만 신속히 추출한 뒤 곧바로 정리하는 흐름으로 전처리 시간을 줄이겠다는 접근이다.

정 교수는 “해당 알고리즘은 원하는 데이터가 대략 어느 위치에 있는지를 미리 아는 특수한 접근법을 활용한다”고 말했다.

정 교수는 “초기 수준의 가속기지만 불규칙한 데이터 구조를 효과적으로 처리할 수 있는 유연한 하드웨어 시스템을 구현했다는 점에서 의미가 크다”며 “추천 시스템은 물론 금융·보안처럼 실시간 분석이 필요한 다양한 AI 분야로 활용이 확산하길 바란다”고 말했다.

최영총 기자 youngchoi@hankyung.com

Read Entire Article