아마존, 새로운 AI 칩 Trainium3 공개 및 Nvidia와의 협력 로드맵 예고

1 week ago 1

  • AWS가 3나노미터 공정의 Trainium3 칩을 탑재한 Trainium3 UltraServer를 공개하며 AI 학습 및 추론 성능을 대폭 향상
  • 새 시스템은 이전 세대 대비 4배 빠른 속도와 4배 많은 메모리, 40% 높은 에너지 효율을 제공
  • 최대 100만 개의 Trainium3 칩을 연결할 수 있어 대규모 AI 애플리케이션 처리에 적합
  • Anthropic, Karakuri, SplashMusic, Decart 등 고객이 이미 사용 중이며 추론 비용 절감 효과 확인
  • AWS는 차세대 Trainium4 칩Nvidia NVLink Fusion을 지원해 Nvidia GPU와 상호운용 가능할 것이라 밝혀, AI 인프라 경쟁에서 중요한 전환점으로 평가됨

Trainium3 공개

  • AWS는 re:Invent 2025 행사에서 Trainium3 UltraServer를 공식 발표
    • 이 시스템은 3나노미터 Trainium3 칩AWS 자체 네트워킹 기술로 구동
    • AI 학습과 추론 모두에서 2세대 대비 성능이 크게 향상된 것으로 설명됨
  • AWS는 Trainium3 시스템이 4배 빠른 처리 속도4배 많은 메모리 용량을 제공한다고 밝힘
    • 각 UltraServer는 144개의 칩을 탑재
    • 수천 대의 서버를 연결해 최대 100만 개의 칩을 하나의 애플리케이션에 활용 가능
  • 새 칩은 에너지 효율이 40% 향상되어, 대규모 데이터센터의 전력 소비를 줄이는 데 기여
    • AWS는 이를 통해 AI 클라우드 고객의 비용 절감도 가능하다고 강조

주요 고객 및 활용 사례

  • Anthropic, 일본의 LLM Karakuri, SplashMusic, Decart 등이 이미 Trainium3을 사용 중
    • 이들 고객은 추론 비용을 크게 절감했다고 AWS는 설명
  • AWS는 이러한 성능 및 비용 효율 개선이 AI 애플리케이션의 확장성을 높이는 기반이 된다고 언급

차세대 칩 Trainium4 로드맵

  • AWS는 Trainium4가 이미 개발 중이며, Nvidia의 NVLink Fusion 고속 인터커넥트 기술을 지원할 예정이라고 발표
    • 이를 통해 Nvidia GPU와의 상호운용이 가능해지고, AWS의 저비용 서버 랙 기술과 결합 가능
  • Nvidia CUDA가 주요 AI 애플리케이션의 표준으로 자리 잡은 상황에서, Trainium4 시스템은 Nvidia GPU 기반 앱의 AWS 클라우드 이전을 용이하게 할 잠재력을 가짐
  • Trainium4의 출시 일정은 공개되지 않았으며, 다음 해 re:Invent 행사에서 추가 정보가 나올 가능성이 있음

에너지 효율과 비용 절감의 전략적 의미

  • AWS는 데이터센터의 전력 사용이 급증하는 상황에서 “더 적게 소비하는 시스템” 을 구축 중
  • 이러한 접근은 운영비 절감지속가능성 확보라는 두 가지 목표를 동시에 달성하려는 시도로 평가됨
  • AWS의 비용 절감 중심 전략은 AI 인프라 경쟁에서 클라우드 고객 유치력 강화로 이어질 가능성 있음

요약

  • Trainium3은 성능·메모리·효율성 모두에서 대폭 향상된 3세대 AI 칩
  • Trainium4는 Nvidia와의 호환성을 통해 AWS 생태계 확장을 목표로 함
  • AWS는 고성능·저비용·친환경 AI 인프라를 동시에 추구하며, AI 클라우드 시장 경쟁력 강화를 노림

Read Entire Article