Apple Silicon은 OpenRouter보다 비용이 더 든다
3 weeks ago
13
- 로컬 추론 비용은 전기료보다 기기 가격의 영향이 크며, M5 Max MacBook Pro 64GB 모델은 $4,299로 계산됨
- 부하 상태의 Apple Silicon 노트북은 50~100W를 쓰고, kWh당 $0.20 기준 전기료는 하루 약 $0.48에 그침
- Gemma4:31b는 M5 Max에서 초당 10~40토큰으로 관측돼, 백만 토큰당 비용이 약 $0.40~$4.79까지 벌어짐
- OpenRouter의 Gemma4 31b는 백만 토큰당 약 $0.38~$0.50이라, 매우 낙관적인 조건에서만 MacBook Pro Max와 비슷해짐
- 로컬 추론은 대체로 OpenRouter보다 비싸고 느리며, 회계상 Pro Max 비용은 백만 토큰당 약 3배로 잡는 편이 적절함
로컬 추론 비용 계산
- 전기요금은 Northern Virginia의 최근 청구서 기준 kWh당 $0.18이며, 계산에서는 kWh당 $0.20로 높여 잡음
- EIA의 2025년 미국 주거용 평균 전기요금은 kWh당 $0.1730임
- Apple Silicon 노트북이 부하 상태에서 50~100W를 쓰면 전기료는 시간당 $0.009~$0.018이고, 대략 시간당 $0.02로 계산 가능함
- 100% 추론을 계속 돌려도 전기료는 하루 $0.48 수준임
- 14인치 M5 Max MacBook Pro 64GB 모델은 Apple 웹사이트 기준 $4,299이며, 64GB는 Gemma 4 31b 같은 모델을 실행할 수 있는 수준으로 잡힘
- 하드웨어 수명을 3년, 5년, 10년으로 나누면 연간 비용은 각각 $1,433, $860, $430임
- 시간당 하드웨어 비용은 3년 기준 $0.16358, 5년 기준 $0.09815, 10년 기준 $0.04908로 계산됨
- 일반 사용에서는 5년이 합리적인 수명 추정이고, 7년이나 10년도 가능하지만 최대 추론 부하에서는 3년도 합리적인 추정이 될 수 있음
토큰당 비용과 OpenRouter 비교
- 로컬 모델 비용의 핵심 변수는 시간당 생성 가능한 토큰 수이며, M5 Max 테스트에서 Gemma4:31b 같은 모델은 초당 10~40토큰 범위였음
- 초당 10토큰이면 시간당 36,000토큰이며, 3~10년 수명과 kWh당 $0.18 기준 백만 토큰당 비용은 $1.61~$4.79로 계산됨
- 초당 40토큰이면 시간당 144,000토큰이며, 백만 토큰당 비용은 $0.40~$1.20까지 내려감
- Apple Silicon에서는 전기료보다 하드웨어 비용이 전체 비용을 좌우함
- OpenRouter의 Gemma4 31b 가격은 백만 토큰당 약 $0.38~$0.50임
- 50W, 초당 40토큰, 10년 사용이라는 낙관적 조건에서는 MacBook Pro Max가 OpenRouter와 비슷한 비용까지 내려감
- 100W, 초당 10토큰, 3년 사용이라는 비관적 조건에서는 MacBook Pro Max가 OpenRouter보다 10배 비쌈
- 회계 관점에서 Pro Max의 로컬 추론 비용은 OpenRouter 대비 백만 토큰당 약 3배로 보는 추정이 적절함
- 대부분의 경우 비용보다 추론 속도가 더 큰 변수이며, 로컬 추론은 클라우드 추론보다 느림
- OpenRouter의 일부 Gemma 4 제공자는 초당 60~70토큰까지 도달하며, Pro Max에서 관측된 초당 10~20토큰보다 3~7배 빠름
- 업무용 노트북을 쓰는 직원의 급여 비용은 로컬에서 생성 가능한 토큰 비용보다 약 1000배 크기 때문에, 이 맥락에서는 Anthropic에 비용을 쓰는 편이 더 타당함
- 소비자용 기기에서 Anthropic Sonnet에 가까운 성능의 모델을 실행할 수 있다는 점은 여전히 놀라운 결과로 남음
-
Homepage
-
개발자
- Apple Silicon은 OpenRouter보다 비용이 더 든다