"부족한 GPU는 SW로 극복"…최적화 승부수 던진 K스타트업

1 hour ago 1

생성형 인공지능(AI) 경쟁에 따른 비용이 커지면서 AI를 더 저렴하고 효율적으로 쓰게 해주는 소프트웨어(SW) 기술이 주목받고 있다. 비싼 그래픽처리장치(GPU)를 무조건 늘리는 것보다 기존 GPU를 얼마나 효율적으로 쓰는지, 데이터와 AI 모델을 얼마나 가볍게 만드는지가 핵심 경쟁력으로 떠올라서다.

GPU를 여러 명이 나눠 쓰도록 하는 방식으로 접근한 곳은 AI 인프라 스타트업 래블업이다. 래블업이 개발한 GPU 가상화 기술은 자사 플랫폼 ‘백엔드.AI(Backend.AI)’를 통해 하나의 GPU를 다수의 가상 GPU처럼 쪼개 여러 작업에 자동 배분한다. 이를 통해 GPU 활용률을 최대 95%까지 끌어올릴 수 있고, 같은 장비로 더 많은 AI 개발과 학습이 가능하다는 설명이다. 국민대는 이 기술을 활용해 16개의 GPU를 100개 이상의 가상 GPU로 분할해 약 80명의 학생이 동시에 머신러닝 실습을 할 수 있도록 했다.

래블업이 GPU를 분할하는 방식이라면 그리네타와 클리카는 GPU가 다루는 데이터와 모델을 줄이는 방식으로 문제를 풀고 있다. 그리네타는 3차원(3D) 데이터를 줄이는 기술을 개발했다. 3D 데이터란 공장, 건물 같은 현실 공간을 컴퓨터 안에 그대로 복사해 만든 일종의 ‘디지털 지도’다. 라이다(LiDAR)로 만든 데이터가 대표적인데, 고성능인 만큼 데이터 크기가 매우 커서 저장·처리에 많은 비용이 든다.

그리네타는 이 데이터의 품질은 원본과 거의 같은 수준으로 유지하면서 크기를 최대 37분의 1로 줄일 수 있다. 실제 산업 현장에서는 100기가바이트(GB)가 넘는 LiDAR 데이터를 95% 이상 압축하면서도 시각적 품질을 유지했다. 데이터가 가벼워지면 저장·전송 비용이 줄고 AI 처리 속도도 빨라진다.

클리카는 AI 모델 자체를 줄이는 기술을 개발하고 있다. AI 모델을 자동으로 압축·컴파일해 다양한 서버와 기기에서 바로 실행할 수 있도록 하는 최적화 소프트웨어다. 이를 통해 모델 크기를 최대 95% 줄이고 실행 속도는 최대 10배 높일 수 있으며, AI 인프라 운영 비용도 크게 낮출 수 있다는 설명이다.

GPU나 데이터 용량보다 데이터 ‘구조’에 집중하는 기업도 있다. 인포시즈는 기업 내부에 흩어진 데이터를 관계 중심으로 연결하는 ‘지식 그래프’ 기술을 보유하고 있다. 자체 온톨로지(데이터의 관계·의미를 AI가 이해할 수 있도록 정의하는 모델) 엔진을 활용해 AI가 단순 검색을 넘어 문맥까지 이해하도록 돕는다.

이들 기업은 모두 스타트업 지원기관 디캠프의 투자·육성 프로그램을 거쳤다는 공통점이 있다. 업계 관계자는 “AI산업이 모델 성능 경쟁에서 인프라 효율 경쟁으로 옮겨가고 있다”며 “GPU 활용도를 높이고 데이터를 효율적으로 처리하는 스타트업의 역할이 더 커질 것”이라고 말했다.

유지희 기자 keephee@hankyung.com

Read Entire Article