2026년은 국산 AI 반도체 활약 원년··· "공동성능지표 K-Perf, 9.9조 예산으로 세계 시장 공략"

1 hour ago 1

[IT동아 남시현 기자] 과학기술정보통신부가 주최하는 2025 인공지능 반도체 미래기술 컨퍼런스(AISFC 2025)가 지난 10일 롯데호텔 서울 크리스탈볼룸에서 개최됐다. AISFC 2025는 2020년부터 인공지능 반도체 기술 동향 및 생태계 활성화를 주제로 개최되며 국내 AI 반도체 기술 기업과 학계 전문가 등이 참여해 현안을 논의하고 네트워킹을 진행하는 자리다. 특히 올해 행사는 국내 AI 반도체의 성능을 변별력 있게 진단하는 공동성능지표(K-Perf) 협의체가 정식 출범하고, 2026년 AI 반도체 지원 로드맵을 발표하는 등 3대 AI 강국 진입을 위한 기반을 제시했다.

“대한민국, 3대 AI 강국 목표로 AI 지원 세 배 늘린다”

퓨리오사AI, 리벨리온, 하이퍼엑셀 등 국산 AI 반도체의 성능을 수요 기업의 요구에 맞게 판단하는 공동성능지표 K-Perf 협의체가 정식 출범했다 / 출처=IT동아

배경훈 과학기술정보통신부 장관은 “임기 중 독자 AI 파운데이션 모델, 그리고 AI 및 양자 기술, 신경망 처리 장치(NPU)를 세계적인 수준으로 만들기 위한 방안을 도출하겠다. 국산 AI 반도체의 성능은 이제 성숙 단계에 이르렀으며, K-Perf 선언식이 그 시작이 될 예정”이라면서, “대한민국이 AI 3대 강국이 되기 위해서는 우리나라 과학자들이 동료처럼 활용할 AI가 필요하며, 정부에서 전문 분야별 파운데이션 모델과 서비스를 구축하기 위한 작업을 해 나갈 것”이라고 말했다.

배경훈 부총리 겸 과학기술정보통신부 장관이 AISFC 2025에서 AI 지원 성과 및 내년 목표 등을 설명 중이다 / 출처=IT동아

이어서 “2025년이 AI 3대 강국이 되기 위한 기틀을 마련하는 해였다면, 2026년은 본격적으로 AI 강국, 아태지역 허브가 되기 위한 시점이라 생각한다. 정부는 2026년 35조 원 규모의 연구개발 예산을 편성했으며, 이중 AI 투자 규모는 기존 대비 세 배 높은 9조 9000억 원”이라면서, “구글의 TPU가 엔비디아 GPU에 못지않은 고효율성을 통해 가능성을 보여준 것처럼 우리 정부 역시 지속적인 투자를 통해 AI 생태계가 성장하도록 지원하겠다. 이번 행사를 계기로 기업과 연구자들이 최선의 성과를 거둘 수 있도록 지원하고, 국산 AI 반도체가 제2의 K-반도체 성공의 주축이 되도록 적극 지원하겠다”라는 뜻을 밝혔다.

공급처·수요처 공동 성능평가지표 K-Perf 공식 출범

오윤제 정보통신기획평가원 반도체·양자 PM이 K-Perf의 개요 및 평가 지표를 설명 중이다 / 출처=IT동아

올해 AISFC 2025의 핵심 화두 중 하나는 AI 반도체 성능을 변별력 있게 판단하는 ‘K-Perf’ 출범이다. 현재 업계에서 널리 쓰이는 반도체 평가 기준인 MLPerf는 표준화된 워크로드와 검증 과정을 갖췄지만 실제 사용 성능과는 괴리가 있다는 의견이 있다. 또한 추론(Inference)보다는 학습(Training) 용도에 더 집중되는 점도 한계다. 이에 우리 정부는 AI 반도체 공급 기업과 클라우드 및 AI 사용 기업이 협력하는 공동 평가 방안 구축을 시작한다.

K-Perf의 공급기업 측은 퓨리오사AI, 리벨리온, 하이퍼엑셀이 참여하며 수요기업으로는 네이버클라우드, KT클라우드, NHN클라우드, 삼성SDS, LG CNS, SK텔레콤, LG AI 연구원, 카카오엔터프라이즈, 모레가 참여한다.

현장에서는 K-Perf를 활용해 퓨리오사AI, 리벨리온, 하이퍼엑셀 반도체를 평가한 예시가 공개됐다 / 출처=IT동아

주요 테스트 항목은 메타 라마 3.1 8B 및 405B, 메타 라마 3.3 70B, 엑사원 4.0 32B를 활용하며 향후 업스테이지의 WBL도 추가될 수 있다. 테스트 항목은 ▲ 네 개의 언어모델을 활용해 입력 및 출력 길이, 동시 사용자 수, 정밀도 테스트를 포함한 입출력 변수 범위 테스트 ▲ 입력 처리 단계에서의 글자 출력 시간과 토큰 처리 수와 답변 생성 과정에서의 초당 토큰 생성 수, 전력 소모량에 대한 측정값으로 나뉘며, 결과값은 엑셀 기반의 측정표와 2차원 그래프로 생성된다.

오윤제 정보통신기획평가원 반도체·양자 PM은 "그간 수요기업과 공급기업 간 성능 확인에 대한 간극이 컸다. K-Perf는 국산 AI 반도체 평가 도구로 이를 해결하기 위한 시작이라 할 수 있다. 오는 1분기 중 인증 및 검증 절차를 구축할 예정이고, 향후 온디바이스 AI 쪽으로도 확장 예정”이라고 설명했다.

K-Perf 참여 AI 반도체 기업, 2026년 목표 소개해

김한준 퓨리오사AI CTO가 2세대 반도체 RNGD에 대해 소개 중이다 / 출처=IT동아

세션 3에서는 국내 AI 반도체 기업 및 지원기관의 발표가 이어졌다. 세션 3은 ‘차세대 AI 반도체 설계 고도화’를 주제로 ▲ 퓨리오사 AI의 김한준 CTO의 ‘칩에서 시장으로, RNGD로 실현하는 AI 추론 효율화’ ▲오진욱 리벨리온 CTO의 ‘효율적으로 구동되는 프런티어 LLM-AI인프라의 새로운 시대’ ▲ 이진원 하이퍼엑셀 CTO의 ‘지속가능한 AI 인프라와 LLM 서비스를 위한 LPU 반도체 ▲김정욱 딥엑스 부사장의 ‘온디바이스 AI 반도체 피지컬 AI 시대로의 도약’이 각각 진행됐다.

퓨리오사AI는 내년 1월 RNGD 상용화를 시작으로 내년 말까지 RNGD+맥스까지 공개하는 것을 목표로 한다 / 출처=IT동아

퓨리오사AI는 오는 1월부터 2세대 신경망 처리 장치(NPU) RNGD의 상용화를 시작하며, 9월에는 HBM3e 72GB로 업그레이드한 RNGD+도 출시한다. 내년 12월에는 2장의 RNGD 칩을 조합한 RNGD+맥스 HBM3e 144GB 모델도 출시한다. 8개의 RNGD 카드가 엮인 서버 모델의 경우 2026년 3월에 처음 시장에 공개하며, 2027년 중 2세대 RNGD 서버를 출시한다. RNGD 활용을 위한 소프트웨어 지원인 SDK는 이달 중 4.0 버전을 공개한다.

SDK 4.0 버전에는 서로 다른 형태의 AI 추론 요청을 효율적으로 함께 묶어 처리해 NPU 활용률과 처리량을 높이는 ‘하이브리드 배칭’, 모델 가중치를 메모리에 상시 풀 형태로 올려 두었다가 바로 재사용해 첫 요청 로딩 지연을 줄이는 풀드 모델링, NPU에서 직접 실행할 수 있는 NPU 오퍼레이터 지원 확대, RNGD 워크로드가 실행 중 추가 CPU·메모리가 필요할 때 쿠버네티스가 동적으로 필요한 자원을 할당해 주는 기능, 파이토치 모델을 자동으로 최적화·컴파일하는 데 사용되는 torch.compile()을 위한 NPU 백엔드 제공 등이 포함된다.

쉽게 풀어 말하면, SDK 4.0은 추론 성능 최적화와 AI 모델의 메모리 사용·관리 효율 개선, 그리고 NPU와 쿠버네티스를 중심으로 한 인프라 통합을 한층 강화한 버전이다.

배경훈 과기정통부 장관이 퓨리오사AI RNGD 반도체를 들여다보고 있다 / 출처=IT동아

AI 반도체 발표가 진행되는 가운데 행사장 외부에 배치된 전시장에도 관심이 몰렸다. 전시부스는 △ 설계 R&D △ 설계 △ 설계&시제품양산품 △ 시제품양산품 △ 검증 △ 실증 △ 제품화로 구성되며, 총 18개의 기업 및 대학, 기관이 참여했다. 배경훈 과학기술정보통신부 장관 역시 퓨리오사AI, 리벨리온, 하이퍼엑셀, 딥엑스, 모빌린트 등의 주요 AI 반도체 기업 부스를 방문해 제품에 대한 주요 사양 및 사업화 현황을 소개받았다.

배경훈 장관이 2대의 RNGD 카드로 오픈AI gpt-oss-120B를 구현하는 데모 시스템을 살펴보고 있다 / 출처=IT동아

퓨리오사AI는 오픈AI의 대형 오픈웨이트 언어 모델인 gpt-oss-120B 모델을 두 장의 RNGD 카드로 구동하는 시연을 보였다. gpt-oss-120b는 최소 60GB의 메모리가 필요하며, 1200억 개의 매개변수에 128명의 전문가 MoE 모델로 구성돼 있다. 이 모델을 10ms 수준의 초저지연 환경으로 구축하려면 엔비디아 H100을 멀티 GPU로 구성하거나, MoE 모델 효율을 크게 끌어올린 블랙웰 B100 등의 칩이 필요하다.

퓨리오사AI는 지연시간을 최소화하기 위해 전문가 라우팅으로 인해 활성화되는 일부 가중치만 선택적으로 계산하는 MoE 특성을 적극 활용했다. 또한 gpt-oss-120B가 지원하는 MXFP4(4비트 혼합 정밀도 양자화) 포맷을 TCP가 직접 연산할 수 있도록 최적화함으로써, 메모리 대역폭 사용을 줄이고 연산 효율을 크게 높였다. 이 두 가지 최적화 덕분에 질의 입력 후 약 5.8ms 수준의 초저지연 응답 속도를 구현할 수 있었다.

IITP·NIPA가 말하는 ‘2026년 국내 AI 반도체 지원 사업’ 향방은?

정보통신기획평가원의 2026년 반도체 지원 사업의 중점 추진 방향 개요 / 출처=IT동아

네 번째 세션은 정보통신기획평가원(IITP)이 ▲ 2026년 AI 반도체 R&D 사업 추진 계획 ▲ AI반도체 실증 등 사업화 지원 성과 및 계획을 주제로 발표를 진행했다. 정보통신기획평가원은 과학기술정보통신부 산하 ICT 분야 국가 연구개발 기획, 관리, 평가 전담 기관으로 기술사업화와 전문 인재 양성에 중추적인 역할을 담당하며, 한국정보통신기술협회(TTA), 정보통신산업진흥원(NIPA)과 함께 K-Perf 시험인증 및 연구개발, 실증 사업화를 지원하는 기관 중 하나다.

정보통신기획평가원은 프로세싱인메모리 반도체 개발과 현행 AI 반도체의 소프트웨어 지원 확대를 내년 주요 목표로 삼는다 / 출처=IT동아

강호석 IITP 팀장은 “2025년 지원사업은 K클라우드 등을 통해 NPU 기업의 스케일을 확대하는데 집중했다. 피지컬 AI 관련 예비타당성 사업으로 온디바이스 AI를 지원하는 사업도 있고, 프로세싱인메모리(PIM) 반도체는 2021년도부터 신규 사업으로 선정해 지원 중"이라면서, "2025년도 반도체 성능 기준은 온디바이스AI 상에서 20B 모델 구동, 뉴로모픽 반도체는 1POPS(1POPS당 1초에 1000조 회 연산 처리) 성능을 기준으로, 혼합 컴퓨팅은 DNN-SNN(딥 뉴럴 네트워크-스파이킹 뉴럴 네트워크) 혼합을 지원했다. 또 K-클라우드를 통한 초거대 AI 모델, 광 통신 기반의 인터페이스 지원도 진행 중이다"라고 설명했다.

내년에는 총 12개 과제가 운영되며, 2030년을 내다보고 사업의 기반을 잡는 한해이기도 하다 / 출처=IT동아

이어서 "2026년 과제는 총 12개로 구성되며 예비타당성 조사 단계의 과제들이 많다. 2026년도 주요 과제는 LPDDR6-PIM 기반 AI 가속기, 이를 활용하는 컨트롤러 개발 과제다. 하드웨어 개발 및 소프트웨어 프레임워크 개발도 포함한다. 아울러 반도체 공급 기업과 수요처와의 간극을 메우기 위해 시스템 소프트웨어 쪽에서 엔비디아 NV-링크처럼 AI 반도체 칩 간 통신 라이브러리를 최적화하는 방향도 구상 중"이라고 설명했다. PIM의 경우 INT8(8비트 정수)을 기준으로 연산 지원을 확인 중이고, 경량 AI 프레임워크는 BF16(16비트 부동소수점)을 기준으로 진행한다"라고 말했다.

아울러 NPU 기업들이 vLLM, 파이토치 등 오픈소스 프레임워크 지원에 나서고 있지만 수요처에서 실제 채택으로 이어지지 않는 상황을 고려해 호환성 지원을 높이는 경쟁형 R&D도 추진한다. 경쟁 과제는 메타 라마 8B가 단일 서버에서 잘 구동하는지로 평가하며, 각 NPU 하드웨어를 활용하는 저수준의 API도 요청할 예정이다. 저수준 API를 요청하겠다는 의미는 AI 추론 작업 시 하드웨어 가속기 성능을 끌어올릴 수 있는 시스템 기반과 완성도를 보겠다는 말이다.

정보통신산업진흥원은 국산 AI 반도체의 수요 확대와 실증 사례 확보에 열을 올린다 / 출처=IT동아

NIPA는 올해 1차 추경 사업을 통해 50TFLOPS(1초에 1000조 번 부동 소수점 연산 처리) 규모의 AI 실증 인프라 고도화, 국산 장치 내 NPU 적용 및 AI 실증 서비스 구축, 해외 현지 실증 지원 등을 진행했다. 이어서 2차 추경을 통해 최신 AI 모델과 국산 NPU 간 호환성 확보, 반도체 설계용 IP 지원 등을 실시했다. 이를 통해 16개 반도체 기업에서 총 27개의 신경망 처리 장치가 개발 및 고도화하는 성과를 올렸다.

조재홍 정보통신산업진흥원(NIPA) 팀장은 “NIPA는 연구개발과 설계 소프트웨어 지원, 시제품 검증과 양산에 이르는 AI 반도체 생산 과정 전반을 지원하고 있으며, 2025년은 1차, 2차 추경까지 진행해 반도체의 확산 체계를 구축했다. 덕분에 27개의 국산 AI 반도체가 시장에 등장했으며 16개의 팹리스 기업이 지원받고 있다. 올해 기준 500만 불이 넘는 수출을 달성했다, 또한 국산 AI 기업들과 AI 반도체 기업을 연계한 수출도 지원 중”이라고 말했다. 내년 사업은 올해 완성된 제품을 토대로 제품 수요를 발굴하고, 제도 개선 및 취업 연계, 해외진출까지 제공하는 것을 골자로 한다.

2025년 AI 반도체 사업 괄목할 성과, 2026년이 진짜 시작

이진원 하이퍼엑셀 CTO(좌측)과 김한준 퓨리오사AI CTO(중앙), 오진욱 리벨리온 CTO(우측)가 오픈AI gpt-oss-120b 모델을 2장의 RNGD로 구동하는 데모를 놓고 얘기를 나누고 있다 / 출처=IT동아

전 세계적으로 AI 반도체를 설계-생산까지 가능한 국가는 대한민국과 대만, 미국 뿐이다. 설계까지 포함하면 유럽연합과 일본, 중국, 인도가 포함되지만 생산 공정의 한계를 넘기 어렵다. 중국은 막대한 예산을 투입해 생산 역량을 확보하고 있지만 5nm 이하 공정 반도체를 생산할 수 없어 경쟁에서 밀리는 상황이다. 우리나라는 메모리 반도체와 파운드리를 앞세워 빠르게 경쟁력을 확보하고 있으며, 지금의 지원과 도전에 성공한다면 향후에 제2의 반도체 부흥기를 열 수 있다.

그런 점에서 올해 16개 반도체 기업에서 27개의 NPU가 등장했다는 점은 전 세계적으로도 괄목할만한 성과다. 아쉽게도 올해 국내 반도체 기업들은 매출 면에서 큰 성과를 거두지 못했으며 기업들 역시 이를 인지하고 전 세계 시장에서 계약을 따내기 위해 노력 중이다. 공동성능지표(K-Perf)가 등장한 점 역시 국내 수요기업의 요구사항을 반영해 성공적인 도입사례를 만들고, 이를 발판 삼아 해외 기업에 도입 사례를 기반으로 계약을 확보할 수 있는 방안을 만들기 위한 시도다. 공동성능지표(K-Perf)의 성공과 2026년 국산 반도체의 세계화를 기원한다.

IT동아 남시현 기자 (sh@itdonga.com)

Read Entire Article