- 2026년 3월 초 Claude Code의 캐시 TTL이 1시간에서 5분으로 변경되어 동일한 사용 패턴에서도 서버 측 설정 차이로 인한 변화가 확인됨
- TTL 단축으로 캐시 재생성 비용이 20~32% 증가하고, 장시간 세션에서 쿼터 소모량이 급증함
- 분석 결과, 모델별로 약 17%의 추가 비용이 발생하며, 일부 사용자는 5시간 쿼터 제한에 도달하기 시작함
- Anthropic은 3월 6일 변경이 의도된 조치이며, 요청별로 TTL을 다르게 적용해 전체 비용 절감을 목표로 했다고 설명함
- 커뮤니티는 비용 상승·투명성 부족·사전 공지 부재를 비판하며, TTL 설정의 사용자 선택권 보장을 요구함
Cache TTL 변경으로 인한 비용 및 쿼터 문제 보고
- 2026년 3월 초 Anthropic의 Claude Code 캐시 TTL 기본값이 1시간에서 5분으로 변경된 것으로 분석됨
- 2026년 1월 11일부터 4월 11일까지의 119,866건의 API 호출 데이터를 기반으로 분석
- 3월 6일~8일 사이 5분 TTL이 다시 등장하며 1시간 TTL이 점차 사라짐
- 동일한 버전의 클라이언트와 동일한 사용 패턴에서 발생해 서버 측 설정 변경으로 확인됨
- TTL 변경으로 캐시 생성 비용이 20~32% 증가, 구독 사용자들의 쿼터 소모량 급증이 관찰됨
- 5분 TTL은 세션이 5분 이상 멈출 경우 캐시가 만료되어 전체 컨텍스트를 다시 업로드해야 함
- 캐시 재생성은 읽기보다 최대 12.5배 비싸며, 장시간 코딩 세션일수록 비용이 누적됨
- 1시간 TTL이 유지된 2월의 낭비율은 1.1%였으나, 3월 이후 15~53%로 급등
-
비용 분석 결과
- claude-sonnet-4-6 모델: 총비용 $5,561.17 → 1시간 TTL 기준 $4,612.09 (약 17.1% 초과 지출)
- claude-opus-4-6 모델: 총비용 $9,268.97 → 1시간 TTL 기준 $7,687.17 (약 17.1% 초과 지출)
- 모델 간 동일한 비율의 낭비가 일관되게 나타남
-
쿼터 영향
- 캐시 생성 토큰은 쿼터에 전량 반영되며, 캐시 읽기는 낮은 가중치로 계산됨
- 3월 이후 구독 사용자들이 처음으로 5시간 쿼터 제한에 도달하기 시작함
Anthropic의 공식 답변
-
변경 사실 인정: 3월 6일 변경은 의도된 조치이며, 캐시 최적화 작업의 일환으로 수행됨
- 요청 유형별로 TTL을 다르게 적용하도록 설계되어 있으며, 단일 전역 기본값은 존재하지 않음
- 1시간 TTL을 모든 요청에 적용할 경우 오히려 비용이 증가할 수 있음
- 5분 TTL은 재사용되지 않는 요청에서 더 효율적이며, 전체 요청 조합 기준으로는 총비용 절감 효과가 있음
- 버그 수정: v2.1.90에서 구독 쿼터를 모두 소진한 세션이 종료될 때까지 5분 TTL로 고정되는 클라이언트 버그 수정
-
요청사항에 대한 답변
- 변경은 있었으며, 3월 6일에 의도적으로 시행됨
- TTL은 요청별로 동적으로 선택되며, 전역 기본값은 없음
- 1시간 TTL을 기본으로 복원하거나 설정 옵션을 제공할 계획 없음
- 캐시 읽기 토큰의 쿼터 반영 방식은 별도 이슈에서 후속 안내 예정
커뮤니티 반응
-
다수의 사용자들이 비용 증가와 사용성 저하를 지적하며 불만을 제기함
- “5분 TTL은 사실상 세션을 5분마다 재시작하게 만들어 생산성을 떨어뜨린다”는 의견 다수
- “구독 사용자는 이미 요금을 선불로 지불했는데, TTL 변경으로 실질 사용 시간이 줄었다”는 지적
- “이처럼 사용자 비용에 영향을 주는 변경은 사전 공지가 필수”라는 요구가 이어짐
-
일부 사용자는 API 이용자에게는 긍정적 변화라고 언급했으나, 다른 사용자들은 “API는 원래 5분 TTL이 기본”이라며 반박
-
투명성 부족에 대한 비판이 집중됨
- “비용 관련 인프라 변경은 사후 해명보다 사전 공지가 필요하다”
- “이런 식의 ‘조용한 변경’은 신뢰를 훼손하고, 사용자들이 문제 원인을 스스로 추적해야 하는 부담을 준다”
-
문서 기록에 따르면 기본 캐시는 5분 TTL이며, 1시간 TTL은 추가 비용이 발생하는 옵션으로 제공됨
- 2026년 1월 기준 공식 문서에서도 동일한 설명이 확인됨
결론
- 2026년 3월 6일 Anthropic은 Claude Code의 캐시 TTL 정책을 1시간에서 5분으로 변경
- 회사는 이를 비용 최적화를 위한 의도된 조정으로 설명했으나, 사용자들은 비용 상승·쿼터 소진·투명성 부족을 문제로 지적
- 커뮤니티는 향후 TTL 설정의 사용자 선택권 보장과 정책 변경의 사전 공지를 요구하는 상황

17 hours ago
1





![[부음] 정병묵(이데일리 산업부 차장)씨 장모상](https://img.etnews.com/2017/img/facebookblank.png)


English (US) ·