OpenAI, Broadcom과 만든 첫 자체 추론 칩 Jalapeño 공개

2 hours ago 1
  • Jalapeño(할라페뇨) 는 LLM 추론(inference)에 특화된 가속기이자 Broadcom과 함께 만드는 다세대 컴퓨팅 플랫폼의 첫 결과물
  • 설계 착수부터 제조 테이프아웃까지 단 9개월 소요, 고성능 첨단 반도체 분야 사상 가장 빠른 ASIC 개발 주기로 추정
  • 초기 테스트에서 일반 AI GPU 대비 약 50% 비용 절감, 와트당 성능도 현 최첨단 대비 크게 우수
  • 칩 아키텍처부터 커널, 메모리, 네트워킹까지 직접 설계하는 풀스택 전략의 일환으로, Nvidia GPU 의존도 축소와 소프트웨어 기업을 넘어 AI 인프라 사업자로의 확장을 겨냥
  • 2026년 말부터 Microsoft 등 파트너와 기가와트 규모 데이터센터에 배치 예정, 1조 달러 규모 IPO를 앞둔 수익성 입증 압박 속 의미 부각

Jalapeño 칩 공개

  • 수요일 OpenAI와 Broadcom(NASDAQ: AVGO)이 OpenAI 첫 인텔리전스 프로세서(Intelligence Processor) Jalapeño(할라페뇨) 공개
  • LLM 추론의 미래를 겨냥해 설계된 가속기로, 두 회사가 함께 만드는 다세대 컴퓨팅 플랫폼의 첫 AI 가속기
  • Broadcom 회장 겸 CEO Hock Tan과 사장 Charlie Kawwas가 OpenAI CEO Sam Altman과 사장 Greg Brockman에게 칩 샘플을 직접 전달
  • 소비자 제품을 넘어 AI 인프라 사업자로 도약하려는 OpenAI 전략의 중요한 단계

칩 구조와 성능

  • Jalapeño는 기존 AI 워크로드용 가속기를 개조한 범용 칩이 아니라, 현대 LLM 추론을 위한 백지 상태(blank-slate) 설계
  • 특정 AI 작업에 맞춰 설계 가능한 ASIC으로, Nvidia GPU보다 유연성은 낮지만 비용이 저렴
  • 성능·효율

    • 초기 테스트에서 일반 AI GPU 대비 약 50% 비용 절감 (Hock Tan 인터뷰)
    • 최종 성능은 측정 중이나, 와트당 성능이 현 최첨단 대비 크게 향상된 수준
    • 데이터 이동을 줄이고 연산·메모리·네트워킹 자원의 균형을 맞춰, 실제 활용률을 이론적 최대 성능에 근접하게 구현
    • 공개된 칩 이미지에서 8개의 HBM 사이트와 중앙의 컴퓨트 다이 확인
  • 작동 검증

    • 엔지니어링 샘플이 양산 목표 주파수·전력에서 ML 워크로드 구동 중이며, 여기에는 GPT‑5.3‑Codex‑Spark 포함
    • 상세 기술 보고서는 향후 몇 달 내 공개 예정
    • Broadcom의 실리콘 구현과 Tomahawk 네트워킹 실리콘이 대규모 양산 지원

9개월 테이프아웃, OpenAI 모델이 가속

  • 초기 설계부터 제조 테이프아웃까지 단 9개월 만에 공동 개발, 고성능 첨단 반도체에서 사상 가장 빠른 ASIC 개발 주기로 추정
  • 설계·최적화 과정 일부에 OpenAI 자체 모델을 활용, Brockman은 모델이 개발을 가속한 정도가 "놀라울 정도"였다고 언급
  • 사용자에게 제공되는 동일한 모델이 향후 모델 구동용 인프라 개선에 기여
  • AI가 엔지니어의 더 빠른 칩 설계를 도우면, 업계 전반의 컴퓨팅 비용 절감과 첨단 AI 접근성 확대로 이어질 가능성

다세대 플랫폼과 파트너

  • Jalapeño는 2026년 말 초기 배치를 목표로, 이후 수년간 확장될 다세대 컴퓨팅 플랫폼의 첫 단계
  • 협력 구조

    • OpenAI — 가속기 설계, LLM 기초에 대한 깊은 이해 기반
    • Broadcom — 칩 구현, 네트워킹·연결 기술
    • Celestica — 보드, 랙, 시스템 통합 전문성
  • 작년 OpenAI와 Broadcom은 10기가와트 규모 컴퓨팅용 맞춤 칩 개발 계획을 발표, 이번에 그 첫 칩 공개
  • 폭발적 수요

    • Broadcom CEO Hock Tan은 2026년부터 Microsoft 등 파트너와 기가와트 규모 데이터센터 배치를 가능케 한다고 언급, 2026년 말 소규모 프로토타입 후 확장 계획
    • Brockman은 "컴퓨팅을 충분히 빨리 확보할 수 없다", Tan은 6개 고객사의 수요가 "그야말로 채울 수 없는 수준"이며 2027~2028년에도 동일하거나 더 높을 것이라고 언급
    • OpenAI 하드웨어 프로그램 책임자 Richard Ho는 프런티어 AI 모델에 가장 중요한 커널, 메모리 이동, 네트워킹, 서빙 패턴을 중심으로 아키텍처를 최적화했다고 설명

풀스택 전략과 경쟁 구도

  • OpenAI는 프런티어 모델 개발과 제품 구축을 넘어, 그 아래 인프라까지 직접 설계 — 칩 아키텍처, 커널, 메모리 시스템, 네트워킹, 스케줄링, 배포 시스템, 제품 경험 포함
  • 이로써 Google(TPU), Amazon(Trainium), Microsoft(Azure Maia 100)처럼 자체 실리콘을 갖춘 풀스택 AI 사업자 대열에 합류
  • Nvidia 의존도 축소

    • "누구도 Nvidia에 종속되길 원치 않는다"(Quilter Cheviot 기술 리서치 총괄 Ben Barringer), 칩 공급선 다변화 흐름
    • OpenAI는 Nvidia 최대 고객 중 하나이면서도 AMD(Instinct MI450 시리즈), Cerebras 등과도 공급 계약 체결
  • 사업적 의미

    • Nvidia가 AI 데이터센터의 핵심 부품 공급으로 세계 최고 가치 기업에 오른 가운데, AI 인프라 시장의 수익 잠재력 부각
    • 1조 달러 가치가 거론되는 IPO를 앞둔 OpenAI로서, 추론 비용 절감은 막대한 학습 비용 회수와 수익성 입증의 열쇠
    • Broadcom 주가는 2026년 들어 상승, 2022년 말 대비 약 7배 수준으로 협력의 수혜 반영

첨단 AI의 대중화

  • 추론은 AI가 사람과 만나는 지점으로, 비용·속도·안정성 개선이 곧 더 빠른 ChatGPT 응답, 대기 없는 Codex 작업, 더 저렴한 API 제품, 수요 급증 시 더 안정적인 접근으로 이어짐
  • 첨단 모델을 더 많은 사람이 매일 쓸 수 있을 만큼 이용 가능·안정적·저렴하게 만드는 것이 AI 대중화의 핵심
  • 학생, 개발자, 소상공인, 연구자, 기업 등 배우고 만들고 어려운 문제를 풀려는 모두를 위해 인프라를 유용한 지능으로 전환하는 데 기여
Read Entire Article