Anthropic, 2026년 3월 6일 캐시 TTL을 1시간에서 5분으로 단축

17 hours ago 1
  • 2026년 3월 초 Claude Code의 캐시 TTL이 1시간에서 5분으로 변경되어 동일한 사용 패턴에서도 서버 측 설정 차이로 인한 변화가 확인됨
  • TTL 단축으로 캐시 재생성 비용이 20~32% 증가하고, 장시간 세션에서 쿼터 소모량이 급증
  • 분석 결과, 모델별로 약 17%의 추가 비용이 발생하며, 일부 사용자는 5시간 쿼터 제한에 도달하기 시작함
  • Anthropic은 3월 6일 변경이 의도된 조치이며, 요청별로 TTL을 다르게 적용해 전체 비용 절감을 목표로 했다고 설명함
  • 커뮤니티는 비용 상승·투명성 부족·사전 공지 부재를 비판하며, TTL 설정의 사용자 선택권 보장을 요구함

Cache TTL 변경으로 인한 비용 및 쿼터 문제 보고

  • 2026년 3월 초 Anthropic의 Claude Code 캐시 TTL 기본값이 1시간에서 5분으로 변경된 것으로 분석됨
    • 2026년 1월 11일부터 4월 11일까지의 119,866건의 API 호출 데이터를 기반으로 분석
    • 3월 6일~8일 사이 5분 TTL이 다시 등장하며 1시간 TTL이 점차 사라짐
    • 동일한 버전의 클라이언트와 동일한 사용 패턴에서 발생해 서버 측 설정 변경으로 확인됨
  • TTL 변경으로 캐시 생성 비용이 20~32% 증가, 구독 사용자들의 쿼터 소모량 급증이 관찰됨
    • 5분 TTL은 세션이 5분 이상 멈출 경우 캐시가 만료되어 전체 컨텍스트를 다시 업로드해야 함
    • 캐시 재생성은 읽기보다 최대 12.5배 비싸며, 장시간 코딩 세션일수록 비용이 누적됨
    • 1시간 TTL이 유지된 2월의 낭비율은 1.1%였으나, 3월 이후 15~53%로 급등
  • 비용 분석 결과

    • claude-sonnet-4-6 모델: 총비용 $5,561.17 → 1시간 TTL 기준 $4,612.09 (약 17.1% 초과 지출)
    • claude-opus-4-6 모델: 총비용 $9,268.97 → 1시간 TTL 기준 $7,687.17 (약 17.1% 초과 지출)
    • 모델 간 동일한 비율의 낭비가 일관되게 나타남
  • 쿼터 영향

    • 캐시 생성 토큰은 쿼터에 전량 반영되며, 캐시 읽기는 낮은 가중치로 계산됨
    • 3월 이후 구독 사용자들이 처음으로 5시간 쿼터 제한에 도달하기 시작함

Anthropic의 공식 답변

  • 변경 사실 인정: 3월 6일 변경은 의도된 조치이며, 캐시 최적화 작업의 일환으로 수행됨
    • 요청 유형별로 TTL을 다르게 적용하도록 설계되어 있으며, 단일 전역 기본값은 존재하지 않음
    • 1시간 TTL을 모든 요청에 적용할 경우 오히려 비용이 증가할 수 있음
    • 5분 TTL은 재사용되지 않는 요청에서 더 효율적이며, 전체 요청 조합 기준으로는 총비용 절감 효과가 있음
  • 버그 수정: v2.1.90에서 구독 쿼터를 모두 소진한 세션이 종료될 때까지 5분 TTL로 고정되는 클라이언트 버그 수정
  • 요청사항에 대한 답변
    1. 변경은 있었으며, 3월 6일에 의도적으로 시행됨
    2. TTL은 요청별로 동적으로 선택되며, 전역 기본값은 없음
    3. 1시간 TTL을 기본으로 복원하거나 설정 옵션을 제공할 계획 없음
    4. 캐시 읽기 토큰의 쿼터 반영 방식은 별도 이슈에서 후속 안내 예정

커뮤니티 반응

  • 다수의 사용자들이 비용 증가와 사용성 저하를 지적하며 불만을 제기함

    • “5분 TTL은 사실상 세션을 5분마다 재시작하게 만들어 생산성을 떨어뜨린다”는 의견 다수
    • “구독 사용자는 이미 요금을 선불로 지불했는데, TTL 변경으로 실질 사용 시간이 줄었다”는 지적
    • “이처럼 사용자 비용에 영향을 주는 변경은 사전 공지가 필수”라는 요구가 이어짐
  • 일부 사용자는 API 이용자에게는 긍정적 변화라고 언급했으나, 다른 사용자들은 “API는 원래 5분 TTL이 기본”이라며 반박

  • 투명성 부족에 대한 비판이 집중됨

    • “비용 관련 인프라 변경은 사후 해명보다 사전 공지가 필요하다”
    • “이런 식의 ‘조용한 변경’은 신뢰를 훼손하고, 사용자들이 문제 원인을 스스로 추적해야 하는 부담을 준다”
  • 문서 기록에 따르면 기본 캐시는 5분 TTL이며, 1시간 TTL은 추가 비용이 발생하는 옵션으로 제공됨

    • 2026년 1월 기준 공식 문서에서도 동일한 설명이 확인됨

결론

  • 2026년 3월 6일 Anthropic은 Claude Code의 캐시 TTL 정책을 1시간에서 5분으로 변경
  • 회사는 이를 비용 최적화를 위한 의도된 조정으로 설명했으나, 사용자들은 비용 상승·쿼터 소진·투명성 부족을 문제로 지적
  • 커뮤니티는 향후 TTL 설정의 사용자 선택권 보장정책 변경의 사전 공지를 요구하는 상황
Read Entire Article