-
Opus 4.6 모델의 응답 지연을 줄이는 기능으로, 동일한 품질을 유지하면서 더 빠른 결과를 제공
-
/fast 명령으로 CLI나 VS Code 확장에서 손쉽게 켜고 끌 수 있으며, 세션 간에도 설정이 유지됨
-
토큰당 비용이 높지만 실시간 디버깅이나 빠른 반복 작업 등 지연이 중요한 상황에 적합
- Fast mode는 별도의 모델이 아니라 동일한 Opus 4.6의 API 구성 변경을 통해 속도를 우선함
- 현재 연구 미리보기(research preview) 단계로, 가격과 제공 조건이 추후 변경될 가능성 있음
Fast mode 개요
- Fast mode는 Opus 4.6 응답 속도를 높이는 옵션으로, 품질은 동일하지만 토큰당 비용이 더 높음
-
/fast 명령으로 활성화하며, CLI와 VS Code 확장에서 모두 사용 가능
-
연구 미리보기 상태로, 기능·가격·제공 범위가 피드백에 따라 변경될 수 있음
-
Opus 4.6 모델만 사용하며, 다른 모델에서 Fast mode를 켜면 자동으로 Opus 4.6으로 전환됨
- Fast mode는 세션 간 지속되며, 대화 중간에 전환하면 전체 컨텍스트에 대해 Fast mode 요금이 적용됨
Fast mode 전환 방법
-
/fast 입력 후 Tab을 눌러 켜거나 끄는 방식으로 전환 가능
- 사용자 설정 파일에서 "fastMode": true로 지정할 수도 있음
- 활성화 시 “Fast mode ON” 메시지와 함께 ↯ 아이콘이 표시됨
- 비활성화해도 모델은 Opus 4.6에 유지되며, 다른 모델로 바꾸려면 /model 명령을 사용해야 함
비용 구조
사용 시점
-
지연이 중요한 작업에 적합
- 코드 변경의 빠른 반복
- 실시간 디버깅
- 마감이 촉박한 작업
-
표준 모드는 장시간 자동화 작업, 배치 처리, 비용 민감한 워크로드에 적합
-
Effort level과의 차이
- Fast mode: 동일 품질, 낮은 지연, 높은 비용
- 낮은 Effort level: 짧은 사고 시간, 빠른 응답, 복잡한 작업에서는 품질 저하 가능
- 두 설정을 함께 사용해 단순 작업의 속도를 극대화 가능
요구 조건
-
타사 클라우드(Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry) 에서는 사용 불가
- Anthropic Console API 및 Claude 구독 플랜(Pro/Max/Team/Enterprise)에서만 사용 가능
-
Extra usage 활성화 필요
- 개인 계정은 Console의 결제 설정에서, 팀/엔터프라이즈는 관리자 설정 필요
- Fast mode 사용량은 구독 포함량과 별도로 추가 요금으로 청구됨
-
팀·엔터프라이즈 계정은 기본 비활성화되어 있으며, 관리자가 직접 활성화해야 함
- 비활성 상태에서는 /fast 명령 시 “조직에서 Fast mode가 비활성화됨” 메시지 표시
속도 제한 처리
- Fast mode에는 표준 모드와 별도의 속도 제한이 존재
- 제한에 도달하거나 추가 사용 크레딧이 소진되면 자동으로 표준 Opus 4.6으로 전환
-
↯ 아이콘이 회색으로 변하며, 표준 속도와 요금으로 계속 작업 가능
- 쿨다운이 끝나면 Fast mode가 자동 재활성화됨
- 수동으로 끄려면 /fast 명령을 다시 실행
연구 미리보기 상태
- Fast mode는 연구 미리보기 기능으로,
- 피드백에 따라 기능이 변경될 수 있음
- 가격과 제공 범위가 조정될 수 있음
- API 구성도 향후 수정될 가능성 있음
- 문제나 피드백은 Anthropic 지원 채널을 통해 제출 가능