-
AI 모델이 실제 블록체인 스마트 계약 취약점을 악용해 460만 달러 상당의 손실 가능성을 시뮬레이션으로 입증
- 연구팀은 2020~2025년 사이 실제로 해킹된 405개 계약을 기반으로 한 SCONE-bench 벤치마크를 구축해 평가 수행
-
Claude Opus 4.5, Sonnet 4.5, GPT-5가 최신 지식 차단 시점 이후 계약에서도 55.8%를 성공적으로 공격
- 두 모델은 새로운 제로데이 취약점 2건을 찾아내며, 실제 환경에서도 자율적 공격이 기술적으로 가능함을 증명
- AI의 공격 능력이 빠르게 향상됨에 따라, 방어 목적의 AI 도입이 시급함을 강조
SCONE-bench: 스마트 계약 공격 벤치마크
- 연구진은 스마트 계약 취약점의 경제적 영향을 정량화하기 위해 SCONE-bench를 개발
- 2020~2025년 사이 실제로 악용된 405개 계약을 포함
- Ethereum, Binance Smart Chain, Base 등 3개 블록체인에서 수집
- 각 계약은 시뮬레이션 환경(Docker 기반) 에서 재현 가능
- 각 AI 에이전트는 60분 내에 취약점을 찾아 토큰 잔액을 증가시키는 공격 스크립트를 생성해야 함
- 벤치마크는 사전 배포 전 보안 점검 도구로도 활용 가능
주요 실험 결과
- 10개 AI 모델이 전체 405개 문제 중 207개(51.1%) 를 성공적으로 공격, 5억5,010만 달러의 시뮬레이션 피해액 발생
- 2025년 3월 이후 새로 악용된 34개 계약만 대상으로 한 평가에서, Opus 4.5, Sonnet 4.5, GPT-5가 19개(55.8%) 를 공격 성공
- 총 피해액은 460만 달러, Opus 4.5 단독으로 450만 달러 달성
- Sonnet 4.5와 GPT-5는 2,849개의 신규 계약을 분석해 제로데이 취약점 2건을 발견
- 총 수익 3,694달러, GPT-5의 API 비용은 3,476달러
-
자율적 공격의 수익성이 입증됨
취약점 사례
-
취약점 #1: 읽기 전용 함수에 view 한정자가 누락되어 토큰 인플레이션 발생
- 공격자는 반복 호출로 잔액을 부풀려 약 2,500달러 이익, 최대 1만9,000달러 가능
- 화이트햇 해커가 자산을 복구
-
취약점 #2: 수수료 수취자 검증 누락으로 임의 주소가 수수료 인출 가능
- 실제 공격자가 4일 후 1,000달러 상당 자금 탈취
비용 분석
- GPT-5 에이전트의 전체 실행 비용은 3,476달러, 평균 실행당 1.22달러
- 취약 계약 1건당 평균 비용 1,738달러, 평균 수익 1,847달러, 순이익 109달러
-
토큰 사용량은 6개월간 70.2% 감소, 세대별로 평균 23.4% 효율 향상
- 동일한 예산으로 3.4배 더 많은 공격 성공 가능
결론 및 시사점
- 1년 만에 AI 에이전트의 공격 성공률이 2% → 55.88% , 피해액은 5천 달러 → 460만 달러로 급증
-
공격 수익은 1.3개월마다 두 배, 토큰 비용은 2개월마다 23% 감소
- 계약 배포 후 취약점이 악용되기까지의 시간이 급격히 단축될 전망
- 스마트 계약뿐 아니라 모든 소프트웨어 코드가 AI 공격 대상이 될 수 있음
- 동일한 기술이 방어용 AI 에이전트로도 활용 가능하며, AI 기반 보안 자동화의 필요성이 강조됨