리벨리온 AI 반도체 칩 '리벨100'이 탑재된 서버용 제품리벨리온이 최신 인공지능(AI) 반도체 '리벨 100'을 탑재한 서버 제품이 개방형 AI 모델 작동에서 업계 최고 수준을 입증했다. AI가 학습에서 추론으로 확대되는 수요를 겨냥, 성능과 효율성을 앞세워 데이터센터 시장 공략에 속도를 낼 방침이다.
리벨리온은 최근 'gpt-oss-120b', '미니맥스(MiniMax)' 등 최신 오픈소스 추론 모델에서 리벨 100 기반 서버용 카드가 엔비디아 H200 대비 3배 높은 전성비(전력 대비 성능)를 기록했다고 19일 밝혔다.
gpt-oss-120b는 오픈 AI가 지난해 공개한 고성능 오픈소스 AI 모델이다. 높은 추론 능력과 효율적 구동, 활용성 등으로 주목받고 있다. 미니맥스 역시 출시 당시 글로벌 AI 모델 토큰 사용량 1위를 차지한 후로 현재까지 꾸준히 글로벌 상위 5위를 유지할 정도로 높은 인기를 끌고 있다. 리벨 100이 미니맥스를 구현한 건 국내 AI 반도체 업계 최초 사례라고 리벨리온 측은 강조했다.
리벨 100 AI 반도체 기반 카드는 효율 모드(4TB/s)에서 gpt-oss-120b를 4.0ms 출력토큰당생성시간(TPOT)을 기록했다. 성능 모드(4.8 TB/s)에서는 최대 3.2ms까지 TPOT를 구현한다. TPOT는 사용자가 응답을 체감하는 속도를 나타내는 것으로, 실제 AI 서비스 품질을 좌우할 핵심 지표다.
이같은 성능은 리벨 100의 기획 초기부터 추론에 초점을 맞춘 성과다. 리벨리온은 AI 추론 모델을 효율적으로 지원하는 것을 핵심 전략으로 삼았다. AI 데이터센터 시장 공략을 위한 포석이다.
이를 위해 AI 반도체 스타트업 중 최초로 UCIe 기반 칩렛 아키텍처를 도입, 페타플롭스(PetaFlops)급 연산 성능을 구현했다. UCIe는 서로 다른 반도체를 통합 연결해 성능을 극대화하는 기술이다.
또 144GB HBM3E 메모리를 탑재하고 서버 단위는 물론 랙스케일까지 확장 가능한 시스템 아키텍처를 고려해 제품을 출시했다.
리벨리온은 이번 평가에 그치지 않고 지속적인 소프트웨어 최적화로 추가적인 성능 고도화를 이어갈 방침이다. 하드웨어에서도 지연시간과 처리효율을 실시간으로 개선하고 있다. AI 반도체 칩과 카드뿐 아니라 서버와 랙스케일용 제품도 준비, 올해 하반기 양산할 계획이다.
리벨리온 측은 “리벨 100은 엔비디아 데이터센터 고성능 서버용 제품 H200과 본격적인 경쟁에 돌입할 것”이라며 “SK텔레콤, LG AI 연구원, 업스테이지, 구글, 알리바바 등 국내외 기업들이 개발한 다양한 오픈소스 모델로 지원 범위를 점차 확대해 나가 범용적인 AI 추론 플랫폼으로 자리매김하겠다”고 밝혔다.
권동준 기자 djkwon@etnews.com

2 hours ago
1

![초강력 클로드 미토스에 놀란 백악관...'불편한 관계' 앤트로픽에 구애? [AI브리핑]](https://image.inews24.com/v1/12d4e477be4221.jpg)

![다시 켜진 마법 지팡이⋯'HBO 해리포터' 제작기 공개 [콘슐랭]](https://image.inews24.com/v1/434e2ed5d29132.jpg)






![[부음] 정병묵(이데일리 산업부 차장)씨 장모상](https://img.etnews.com/2017/img/facebookblank.png)






English (US) ·