Apple Silicon은 OpenRouter보다 비용이 더 든다

3 weeks ago 13
  • 로컬 추론 비용은 전기료보다 기기 가격의 영향이 크며, M5 Max MacBook Pro 64GB 모델은 $4,299로 계산됨
  • 부하 상태의 Apple Silicon 노트북은 50~100W를 쓰고, kWh당 $0.20 기준 전기료는 하루 약 $0.48에 그침
  • Gemma4:31b는 M5 Max에서 초당 10~40토큰으로 관측돼, 백만 토큰당 비용이 약 $0.40~$4.79까지 벌어짐
  • OpenRouter의 Gemma4 31b는 백만 토큰당 약 $0.38~$0.50이라, 매우 낙관적인 조건에서만 MacBook Pro Max와 비슷해짐
  • 로컬 추론은 대체로 OpenRouter보다 비싸고 느리며, 회계상 Pro Max 비용은 백만 토큰당 약 3배로 잡는 편이 적절함

로컬 추론 비용 계산

  • 전기요금은 Northern Virginia의 최근 청구서 기준 kWh당 $0.18이며, 계산에서는 kWh당 $0.20로 높여 잡음
  • EIA의 2025년 미국 주거용 평균 전기요금은 kWh당 $0.1730임
  • Apple Silicon 노트북이 부하 상태에서 50~100W를 쓰면 전기료는 시간당 $0.009~$0.018이고, 대략 시간당 $0.02로 계산 가능함
  • 100% 추론을 계속 돌려도 전기료는 하루 $0.48 수준임
  • 14인치 M5 Max MacBook Pro 64GB 모델은 Apple 웹사이트 기준 $4,299이며, 64GB는 Gemma 4 31b 같은 모델을 실행할 수 있는 수준으로 잡힘
  • 하드웨어 수명을 3년, 5년, 10년으로 나누면 연간 비용은 각각 $1,433, $860, $430임
  • 시간당 하드웨어 비용은 3년 기준 $0.16358, 5년 기준 $0.09815, 10년 기준 $0.04908로 계산됨
  • 일반 사용에서는 5년이 합리적인 수명 추정이고, 7년이나 10년도 가능하지만 최대 추론 부하에서는 3년도 합리적인 추정이 될 수 있음

토큰당 비용과 OpenRouter 비교

  • 로컬 모델 비용의 핵심 변수는 시간당 생성 가능한 토큰 수이며, M5 Max 테스트에서 Gemma4:31b 같은 모델은 초당 10~40토큰 범위였음
  • 초당 10토큰이면 시간당 36,000토큰이며, 3~10년 수명과 kWh당 $0.18 기준 백만 토큰당 비용은 $1.61~$4.79로 계산됨
  • 초당 40토큰이면 시간당 144,000토큰이며, 백만 토큰당 비용은 $0.40~$1.20까지 내려감
  • Apple Silicon에서는 전기료보다 하드웨어 비용이 전체 비용을 좌우함
  • OpenRouter의 Gemma4 31b 가격은 백만 토큰당 약 $0.38~$0.50
  • 50W, 초당 40토큰, 10년 사용이라는 낙관적 조건에서는 MacBook Pro Max가 OpenRouter와 비슷한 비용까지 내려감
  • 100W, 초당 10토큰, 3년 사용이라는 비관적 조건에서는 MacBook Pro Max가 OpenRouter보다 10배 비쌈
  • 회계 관점에서 Pro Max의 로컬 추론 비용은 OpenRouter 대비 백만 토큰당 약 3배로 보는 추정이 적절함
  • 대부분의 경우 비용보다 추론 속도가 더 큰 변수이며, 로컬 추론은 클라우드 추론보다 느림
  • OpenRouter의 일부 Gemma 4 제공자는 초당 60~70토큰까지 도달하며, Pro Max에서 관측된 초당 10~20토큰보다 3~7배 빠름
  • 업무용 노트북을 쓰는 직원의 급여 비용은 로컬에서 생성 가능한 토큰 비용보다 약 1000배 크기 때문에, 이 맥락에서는 Anthropic에 비용을 쓰는 편이 더 타당함
  • 소비자용 기기에서 Anthropic Sonnet에 가까운 성능의 모델을 실행할 수 있다는 점은 여전히 놀라운 결과로 남음
Read Entire Article