응답 속도를 높이는 Fast Mode

10 hours ago 3

  • Opus 4.6 모델의 응답 지연을 줄이는 기능으로, 동일한 품질을 유지하면서 더 빠른 결과를 제공
  • /fast 명령으로 CLI나 VS Code 확장에서 손쉽게 켜고 끌 수 있으며, 세션 간에도 설정이 유지됨
  • 토큰당 비용이 높지만 실시간 디버깅이나 빠른 반복 작업 등 지연이 중요한 상황에 적합
  • Fast mode는 별도의 모델이 아니라 동일한 Opus 4.6의 API 구성 변경을 통해 속도를 우선함
  • 현재 연구 미리보기(research preview) 단계로, 가격과 제공 조건이 추후 변경될 가능성 있음

Fast mode 개요

  • Fast mode는 Opus 4.6 응답 속도를 높이는 옵션으로, 품질은 동일하지만 토큰당 비용이 더 높음
    • /fast 명령으로 활성화하며, CLI와 VS Code 확장에서 모두 사용 가능
    • 연구 미리보기 상태로, 기능·가격·제공 범위가 피드백에 따라 변경될 수 있음
  • Opus 4.6 모델만 사용하며, 다른 모델에서 Fast mode를 켜면 자동으로 Opus 4.6으로 전환됨
  • Fast mode는 세션 간 지속되며, 대화 중간에 전환하면 전체 컨텍스트에 대해 Fast mode 요금이 적용됨

Fast mode 전환 방법

  • /fast 입력 후 Tab을 눌러 켜거나 끄는 방식으로 전환 가능
    • 사용자 설정 파일에서 "fastMode": true로 지정할 수도 있음
  • 활성화 시 “Fast mode ON” 메시지와 함께 ↯ 아이콘이 표시됨
  • 비활성화해도 모델은 Opus 4.6에 유지되며, 다른 모델로 바꾸려면 /model 명령을 사용해야 함

비용 구조

  • Fast mode는 표준 Opus 4.6보다 높은 토큰 단가를 가짐

    모드 입력 (MTok) 출력 (MTok)
    Fast mode (<200K) $30 $150
    Fast mode (>200K) $60 $225
  • 1M 토큰 확장 컨텍스트 윈도우와 호환됨

  • 대화 도중 Fast mode로 전환하면 전체 대화 컨텍스트에 대해 Fast mode 요금이 부과됨

사용 시점

  • 지연이 중요한 작업에 적합
    • 코드 변경의 빠른 반복
    • 실시간 디버깅
    • 마감이 촉박한 작업
  • 표준 모드는 장시간 자동화 작업, 배치 처리, 비용 민감한 워크로드에 적합
  • Effort level과의 차이
    • Fast mode: 동일 품질, 낮은 지연, 높은 비용
    • 낮은 Effort level: 짧은 사고 시간, 빠른 응답, 복잡한 작업에서는 품질 저하 가능
    • 두 설정을 함께 사용해 단순 작업의 속도를 극대화 가능

요구 조건

  • 타사 클라우드(Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry) 에서는 사용 불가
    • Anthropic Console API 및 Claude 구독 플랜(Pro/Max/Team/Enterprise)에서만 사용 가능
  • Extra usage 활성화 필요
    • 개인 계정은 Console의 결제 설정에서, 팀/엔터프라이즈는 관리자 설정 필요
    • Fast mode 사용량은 구독 포함량과 별도로 추가 요금으로 청구
  • 팀·엔터프라이즈 계정은 기본 비활성화되어 있으며, 관리자가 직접 활성화해야 함
    • 비활성 상태에서는 /fast 명령 시 “조직에서 Fast mode가 비활성화됨” 메시지 표시

속도 제한 처리

  • Fast mode에는 표준 모드와 별도의 속도 제한이 존재
    • 제한에 도달하거나 추가 사용 크레딧이 소진되면 자동으로 표준 Opus 4.6으로 전환
    • ↯ 아이콘이 회색으로 변하며, 표준 속도와 요금으로 계속 작업 가능
    • 쿨다운이 끝나면 Fast mode가 자동 재활성화됨
    • 수동으로 끄려면 /fast 명령을 다시 실행

연구 미리보기 상태

  • Fast mode는 연구 미리보기 기능으로,
    • 피드백에 따라 기능이 변경될 수 있음
    • 가격과 제공 범위가 조정될 수 있음
    • API 구성도 향후 수정될 가능성 있음
  • 문제나 피드백은 Anthropic 지원 채널을 통해 제출 가능

Read Entire Article