OpenAI, Broadcom과 만든 첫 자체 추론 칩 Jalapeño 공개

2 hours ago 1

Jalapeño(할라페뇨) 는 LLM 추론(inference)에 특화된 가속기이자 Broadcom과 함께 만드는 다세대 컴퓨팅 플랫폼의 첫 결과물
설계 착수부터 제조 테이프아웃까지 단 9개월 소요, 고성능 첨단 반도체 분야 사상 가장 빠른 ASIC 개발 주기로 추정
초기 테스트에서 일반 AI GPU 대비 약 50% 비용 절감, 와트당 성능도 현 최첨단 대비 크게 우수
칩 아키텍처부터 커널, 메모리, 네트워킹까지 직접 설계하는 풀스택 전략의 일환으로, Nvidia GPU 의존도 축소와 소프트웨어 기업을 넘어 AI 인프라 사업자로의 확장을 겨냥
2026년 말부터 Microsoft 등 파트너와 기가와트 규모 데이터센터에 배치 예정, 1조 달러 규모 IPO를 앞둔 수익성 입증 압박 속 의미 부각

Jalapeño 칩 공개

수요일 OpenAI와 Broadcom(NASDAQ: AVGO)이 OpenAI 첫 인텔리전스 프로세서(Intelligence Processor) Jalapeño(할라페뇨) 공개
LLM 추론의 미래를 겨냥해 설계된 가속기로, 두 회사가 함께 만드는 다세대 컴퓨팅 플랫폼의 첫 AI 가속기
Broadcom 회장 겸 CEO Hock Tan과 사장 Charlie Kawwas가 OpenAI CEO Sam Altman과 사장 Greg Brockman에게 칩 샘플을 직접 전달
소비자 제품을 넘어 AI 인프라 사업자로 도약하려는 OpenAI 전략의 중요한 단계

Jalapeño는 기존 AI 워크로드용 가속기를 개조한 범용 칩이 아니라, 현대 LLM 추론을 위한 백지 상태(blank-slate) 설계
특정 AI 작업에 맞춰 설계 가능한 ASIC으로, Nvidia GPU보다 유연성은 낮지만 비용이 저렴
성능·효율
- 초기 테스트에서 일반 AI GPU 대비 약 50% 비용 절감 (Hock Tan 인터뷰)
- 최종 성능은 측정 중이나, 와트당 성능이 현 최첨단 대비 크게 향상된 수준
- 데이터 이동을 줄이고 연산·메모리·네트워킹 자원의 균형을 맞춰, 실제 활용률을 이론적 최대 성능에 근접하게 구현
- 공개된 칩 이미지에서 8개의 HBM 사이트와 중앙의 컴퓨트 다이 확인
작동 검증
- 엔지니어링 샘플이 양산 목표 주파수·전력에서 ML 워크로드 구동 중이며, 여기에는 GPT‑5.3‑Codex‑Spark 포함
- 상세 기술 보고서는 향후 몇 달 내 공개 예정
- Broadcom의 실리콘 구현과 Tomahawk 네트워킹 실리콘이 대규모 양산 지원

Jalapeño는 2026년 말 초기 배치를 목표로, 이후 수년간 확장될 다세대 컴퓨팅 플랫폼의 첫 단계
협력 구조
- OpenAI — 가속기 설계, LLM 기초에 대한 깊은 이해 기반
- Broadcom — 칩 구현, 네트워킹·연결 기술
- Celestica — 보드, 랙, 시스템 통합 전문성
작년 OpenAI와 Broadcom은 10기가와트 규모 컴퓨팅용 맞춤 칩 개발 계획을 발표, 이번에 그 첫 칩 공개
폭발적 수요
- Broadcom CEO Hock Tan은 2026년부터 Microsoft 등 파트너와 기가와트 규모 데이터센터 배치를 가능케 한다고 언급, 2026년 말 소규모 프로토타입 후 확장 계획
- Brockman은 "컴퓨팅을 충분히 빨리 확보할 수 없다", Tan은 6개 고객사의 수요가 "그야말로 채울 수 없는 수준"이며 2027~2028년에도 동일하거나 더 높을 것이라고 언급
- OpenAI 하드웨어 프로그램 책임자 Richard Ho는 프런티어 AI 모델에 가장 중요한 커널, 메모리 이동, 네트워킹, 서빙 패턴을 중심으로 아키텍처를 최적화했다고 설명

OpenAI는 프런티어 모델 개발과 제품 구축을 넘어, 그 아래 인프라까지 직접 설계 — 칩 아키텍처, 커널, 메모리 시스템, 네트워킹, 스케줄링, 배포 시스템, 제품 경험 포함
이로써 Google(TPU), Amazon(Trainium), Microsoft(Azure Maia 100)처럼 자체 실리콘을 갖춘 풀스택 AI 사업자 대열에 합류
Nvidia 의존도 축소
- "누구도 Nvidia에 종속되길 원치 않는다"(Quilter Cheviot 기술 리서치 총괄 Ben Barringer), 칩 공급선 다변화 흐름
- OpenAI는 Nvidia 최대 고객 중 하나이면서도 AMD(Instinct MI450 시리즈), Cerebras 등과도 공급 계약 체결
사업적 의미
- Nvidia가 AI 데이터센터의 핵심 부품 공급으로 세계 최고 가치 기업에 오른 가운데, AI 인프라 시장의 수익 잠재력 부각
- 1조 달러 가치가 거론되는 IPO를 앞둔 OpenAI로서, 추론 비용 절감은 막대한 학습 비용 회수와 수익성 입증의 열쇠
- Broadcom 주가는 2026년 들어 상승, 2022년 말 대비 약 7배 수준으로 협력의 수혜 반영

추론은 AI가 사람과 만나는 지점으로, 비용·속도·안정성 개선이 곧 더 빠른 ChatGPT 응답, 대기 없는 Codex 작업, 더 저렴한 API 제품, 수요 급증 시 더 안정적인 접근으로 이어짐
첨단 모델을 더 많은 사람이 매일 쓸 수 있을 만큼 이용 가능·안정적·저렴하게 만드는 것이 AI 대중화의 핵심
학생, 개발자, 소상공인, 연구자, 기업 등 배우고 만들고 어려운 문제를 풀려는 모두를 위해 인프라를 유용한 지능으로 전환하는 데 기여