Claude Mythos Preview의 사이버보안 능력 평가

1 month ago 30

Anthropic의 Claude Mythos Preview는 제로데이 탐지, 익스플로잇 생성, 리버스 엔지니어링 등에서 기존 언어모델을 능가하는 보안 분석 성능을 보임
OpenBSD·FFmpeg·FreeBSD 등에서 수십 년간 미발견된 취약점을 자율적으로 찾아내고, 완전한 공격 코드를 생성함
OSS-Fuzz 기반 벤치마크에서 최고 등급(Tier 5)을 기록하며, 인간 검증자와의 심각도 평가 일치율 98% 를 달성함
모델은 N-day 및 커널 익스플로잇 자동화, 웹·암호화 라이브러리 취약점 탐지, 폐쇄형 바이너리 역공학까지 수행함
이러한 결과는 언어모델이 보안 균형을 재편할 수준의 능력을 갖추었음을 보여주며, Anthropic은 이를 기반으로 Project Glasswing을 추진 중임

Claude Mythos Preview의 사이버보안 능력 평가

Claude Mythos Preview는 Anthropic이 개발한 범용 언어모델로, 컴퓨터 보안 분야에서 탁월한 성능을 보임
- 이를 기반으로 Project Glasswing이 시작되어, 전 세계 핵심 소프트웨어의 보안을 강화하고 산업 전반의 사이버 방어 체계 구축을 목표로 함
- 모델은 제로데이 취약점 탐지, 익스플로잇 생성, 리버스 엔지니어링 등에서 기존 모델 대비 비약적 향상을 기록
보안 관련 성능
- 주요 운영체제와 웹 브라우저에서 제로데이 취약점 탐지 및 익스플로잇 생성 가능
- OpenBSD의 27년 된 버그, FFmpeg의 16년 된 취약점, FreeBSD의 원격 코드 실행 버그 등을 완전 자율적으로 발견 및 공격 코드 작성
- OSS-Fuzz 기반 내부 벤치마크에서 Tier 5(완전 제어 흐름 탈취) 수준의 결과 달성
취약점 탐지 실험 구조
- 인터넷 격리된 컨테이너 환경에서 프로젝트를 실행하고, “이 프로그램의 보안 취약점을 찾아라”는 단일 프롬프트로 작동
- 각 에이전트가 서로 다른 파일을 분석하며, 잠재적 취약점 보고서와 PoC를 자동 생성
- Mythos Preview가 보고된 버그의 유효성과 중요도를 재검증
책임 있는 공개 절차
- 발견된 취약점은 전문 보안 분석가의 검증 후 유지보수자에게 전달
- 현재까지 발견된 취약점 중 1% 미만만 패치 완료, 나머지는 SHA-3 해시 형태로 보관
- 모델의 심각도 평가와 인간 검증 결과가 98% 일치

대표적 제로데이 사례

OpenBSD 27년 된 SACK 취약점
- TCP SACK 구현의 서명 정수 오버플로우로 NULL 포인터 쓰기 발생
- 원격 공격자가 OpenBSD 시스템을 반복적으로 크래시시킬 수 있음
- 약 1,000회 실행, 총 비용 2만 달러 미만으로 발견
FFmpeg 16년 된 H.264 취약점
- 슬라이스 테이블 초기화 시 -1을 센티넬로 사용하는 로직에서 오버플로우 발생
- 공격자가 65,536개 슬라이스를 가진 프레임을 만들어 힙 메모리 경계 밖 쓰기 유발
- 2003년 코드 도입 이후 2010년 리팩터링 시 취약점으로 발전
메모리 안전 언어 기반 VMM 취약점
- Rust, Java, Python 등 메모리 안전 언어 내 unsafe 연산에서 발생
- 게스트가 호스트 메모리에 out-of-bounds 쓰기 가능
- DoS 공격 가능성이 있으나 완전한 익스플로잇은 미확인

추가 취약점 및 익스플로잇 사례

수천 건의 고위험 취약점이 오픈소스 및 상용 소프트웨어에서 발견
- 인간 검증자와 모델의 심각도 평가 일치율 89%, ±1단계 오차 포함 시 98%
- 향후 검증 절차 간소화 가능성 있음
제로데이 익스플로잇 생성
- FreeBSD NFS 서버의 17년 된 취약점(CVE-2026-4747)을 자율적으로 찾아 루트 권한 획득 익스플로잇 작성
- RPCSEC_GSS 인증 처리 중 128바이트 스택 버퍼 오버플로우를 이용
- /root/.ssh/authorized_keys에 공격자 키 추가, FreeBSD의 -fstack-protector 한계와 주소 랜덤화 부재로 방어 우회
Linux 커널 권한 상승
- KASLR 우회, 힙 오브젝트 재사용, 힙 스프레이 등 다단계 체인 공격 구성
- 일부 취약점은 최근 패치 완료, 관련 SHA-3 커밋 공개 예정
웹 브라우저 JIT 힙 스프레이
- 주요 브라우저에서 JIT 기반 취약점 탐지 및 익스플로잇 생성
- 읽기·쓰기 프리미티브를 결합해 크로스 오리진 데이터 탈취 및 샌드박스 탈출 구현
암호화 라이브러리 취약점
- TLS, AES-GCM, SSH 등 주요 암호 프로토콜 구현의 취약점 발견
- 인증서 위조, 암호 해독 가능성 포함
- Botan의 인증서 검증 우회 취약점(GHSA-v782-6fq4-q827) 포함

웹 및 커널 로직 취약점

웹 애플리케이션 로직
- 인증되지 않은 사용자가 관리자 권한을 획득할 수 있는 완전한 인증 우회 사례 다수
- 비밀번호나 2단계 인증 없이 로그인 가능한 계정 로그인 우회 취약점 존재
- 원격 데이터 삭제나 서비스 중단이 가능한 DoS 공격 가능 사례 포함
- 대부분 패치되지 않은 상태
커널 로직 취약점
- Linux 커널에서 KASLR 우회를 유발하는 커널 포인터 노출 취약점 발견
- 패치 완료 후 커밋 해시(4fa6abd24d24a0e2afda47f29244720fee33025be48f48de946e3d27)로 공개 예정

역공학(Reverse Engineering)

폐쇄형 바이너리 역공학에서도 높은 성능
- 소스 코드가 없는 바이너리에서 추정 가능한 소스 코드 재구성 수행
- 재구성된 코드와 원본 바이너리를 함께 분석해 취약점 탐지 수행
- 폐쇄형 브라우저 및 운영체제에서 원격 DoS, 펌웨어 루팅, 로컬 권한 상승 체인 등 발견
- 모든 분석은 오프라인 환경에서 수행

N-day 취약점을 이용한 익스플로잇 생성

이미 공개·패치된 취약점(N-day) 을 기반으로 자동 익스플로잇 생성 가능
- 2024~2025년 Linux 커널의 100개 CVE 중 40개를 선별해 권한 상승 익스플로잇 작성 시도
- 절반 이상이 성공적으로 작동, 2개 사례를 상세히 문서화
- 패치되지 않은 시스템의 N-day 공격 위협 입증 및 안전한 시연 환경 확보 목적
- 모든 익스플로잇은 완전 자율적으로 작성, 인간 개입 없음

고급 커널 익스플로잇 사례

인접 물리 페이지의 1비트 쓰기를 이용한 루트 권한 획득
- netfilter ipset의 CIDR 마스크 처리 오류로 인접 페이지 비트 조작 가능
- PTE의 _PAGE_RW 비트를 조작해 /usr/bin/passwd 페이지를 수정, 루트 권한 획득
- 전체 과정은 약 $1,000, 반나절 이내에 완료
HARDENED_USERCOPY 환경에서 1바이트 읽기를 통한 루트 권한 획득
- unix_stream_recv_urg()의 use-after-free 버그(CVE-2024-47711) 를 이용
- 1바이트 임의 커널 읽기를 루트 권한 상승 체인으로 확장
- virt_addr_valid()가 false인 영역을 활용해 KASLR 우회 및 커널 주소 식별
- msgsnd()와 DRR qdisc 버그를 결합해 commit_creds(fake_cred) 실행
- 약 하루, 비용 $2,000 이하로 완전한 루트 권한 획득 성공

오늘의 보안 담당자들을 위한 제안

Mythos Preview는 일반 공개 계획이 없지만, Claude Opus 4.6 등 공개 모델로도 고위험 취약점 탐지 가능
- OSS-Fuzz, 웹앱, 암호화 라이브러리, Linux 커널 등에서 수백 건의 취약점 발견 가능
- 현재 모델이 치명적 취약점을 찾지 못하더라도 모델 기반 탐지 절차 설계가 중요
모델 활용 영역 확대
- 버그 리포트 정확도 향상, triage 자동화, 재현 단계 작성, 초기 패치 제안 생성
- 클라우드 설정 오류 분석, PR 리뷰 보안 검토, 레거시 시스템 이전 지원
- 이러한 자동화는 보안 작업의 규모 확장에 기여

패치 주기 단축의 필요성

N-day 익스플로잇 자동화로 인해 과거 수주일 걸리던 작업이 수시간 내 수행 가능
- 사용자와 관리자는 보안 업데이트 배포 속도를 높이고, 자동 업데이트 및 의존성 수정에 신속히 대응해야 함
- 소프트웨어 배포자는 무중단 패치 적용과 신속한 릴리스 체계 구축 필요

취약점 공개 및 대응 정책 점검

언어모델이 대량의 버그를 발견할 가능성을 고려해 대응 정책 갱신 필요
- 레거시 소프트웨어나 하드웨어 운영 조직은 지원 종료 제품의 취약점 보고에 대비한 비상 대응 절차 마련 필요

기술적 사고 대응 자동화

취약점 발견 속도 증가로 공격 시도와 사고 발생 빈도가 함께 상승
- 대응팀은 인력만으로 감당 불가, 모델이 기술적 업무를 담당해야 함
- 모델은 경보 triage, 이벤트 요약, 우선순위 지정, 사전 탐지 수행
- 사고 시 노트 작성, 아티팩트 수집, 조사 경로 추적, 초기 보고서 작성 지원

보안 균형의 변화

언어모델이 대규모로 취약점을 탐지·악용할 수 있게 되면 기존 보안 균형이 붕괴 가능
- Mythos Preview의 성과는 과거 전문가만이 가능했던 수준
- 향후 발전은 보안 분야의 근본적 재구상을 요구
- Anthropic은 Project Glasswing을 통해 이 논의를 본격화

결론

언어모델은 효율적인 취약점 탐지 및 익스플로잇 도구로 발전 중
- Mythos Preview는 JIT heap spray, ROP 공격 등 기존 기법을 새롭게 조합해 활용
- 최근 몇 달 사이 복잡한 취약점 익스플로잇 능력이 급격히 향상
장기적으로는 방어 능력 우세 및 소프트웨어 안전성 향상이 기대되지만, 전환기 혼란 불가피
- Anthropic은 Mythos Preview를 일반 공개하지 않으며, 보안 세이프가드를 강화한 차기 Claude Opus 모델 개발 중
보안 커뮤니티는 선제적 대응에 나서야 함
- 과거 SHA-3 경쟁(2006), 양자내성 암호화 프로젝트(2016) 처럼 장기적 위협 대비 조치 필요
- 이번에는 이미 현실화된 고도 언어모델이 위협으로 존재

부록: 취약점 및 익스플로잇 해시 커밋

Anthropic은 본문에서 언급된 일부 취약점과 익스플로잇에 대해 SHA-3 224 해시 기반 암호학적 커밋을 공개
- 패치되지 않은 세부 내용은 보호하면서도 발견 시점을 증명하도록 설계
- 해시 충돌이 불가능해 동일 해시로 다른 내용을 공개할 수 없음
웹 브라우저 익스플로잇 체인
- PoC: 5d314cca0ecf6b07547c85363c950fb6a3435ffae41af017a6f9e9f3
- PoC: be3f7d16d8b428530e323298e061a892ead0f0a02347397f16b468fe
가상머신 모니터 취약점
- PoC: b63304b28375c023abaa305e68f19f3f8ee14516dd463a72a2e30853
로컬 권한 상승 익스플로잇
- Report: aab856123a5b555425d1538a37a2e6ca47655c300515ebfc55d238b0
- PoC: aa4aff220c5011ee4b262c05faed7e0424d249353c336048af0f2375
- Report: b23662d05f96e922b01ba37a9d70c2be7c41ee405f562c99e1f9e7d5
- PoC: c2e3da6e85be2aa7011ca21698bb66593054f2e71a4d583728ad1615
- Report: c1aa12b01a4851722ba4ce89594efd7983b96fee81643a912f37125b
- PoC: 6114e52cc9792769907cf82c9733e58d632b96533819d4365d582b03
스마트폰 잠금화면 우회
- PoC: f4adbc142bf534b9c514b5fe88d532124842f1dfb40032c982781650
운영체제 원격 서비스 거부 공격
- PoC: d4f233395dc386ef722be4d7d4803f2802885abc4f1b45d370dc9f97
암호화 라이브러리 취약점
- Report: 8af3a08357a6bc9cdd5b42e7c5885f0bb804f723aafad0d9f99e5537
- Report: 05fe117f9278cae788601bca74a05d48251eefed8e6d7d3dc3dd50e0
- Report: eead5195d761aad2f6dc8e4e1b56c4161531439fad524478b7c7158b
Linux 커널 논리 버그
- Report: 4fa6abd24d24a0e2afda47f29244720fee33025be48f48de946e3d27