Project Glasswing: 초기 업데이트
5 days ago
9
- Project Glasswing은 강력한 AI 모델 악용에 앞서 중요 소프트웨어를 보호하려는 협력 프로젝트로, 약 50개 파트너가 참여함
- Claude Mythos Preview는 파트너 코드에서 1만 개 이상의 높음·치명적 취약점을 찾았고, 여러 파트너의 발견 속도는 10배 이상 빨라짐
- 오픈소스 1,000개 이상에서 23,019개 취약점을 추정했으며, 검증된 1,752개 중 90.6%가 실제 양성으로 확인됨
- 병목은 취약점 발견에서 검증·보고·패치·배포로 이동했으며, 높은·치명적 버그는 평균 패치까지 2주가 걸림
- Anthropic은 Mythos급 모델을 아직 일반 공개하지 않았고, 개발자와 방어자는 패치 주기 단축과 기본 보안 통제 강화가 필요함
초기 결과와 공개 원칙
- Project Glasswing은 더 강력한 AI 모델이 악용되기 전에 세계적으로 중요한 소프트웨어를 보호하기 위한 협력 프로젝트임
- Anthropic과 약 50개 파트너는 Claude Mythos Preview로 중요 소프트웨어에서 심각도 높음 또는 치명적 수준의 취약점을 1만 개 이상 찾아냄
- 소프트웨어 보안의 병목은 새 취약점을 찾는 속도에서, AI가 찾아낸 대량의 취약점을 검증·공개·패치하는 속도로 옮겨감
-
취약점 공개 방식
- 일반적인 취약점 공개 관행은 새 취약점 발견 후 90일 뒤 공개하거나, 90일 전에 패치가 준비되면 패치 제공 후 약 45일 뒤 공개하는 방식임
- Anthropic의 Coordinated Vulnerability Disclosure policy도 이 방식을 따르며, 최종 사용자가 공격 전에 업데이트할 시간을 확보하려는 절차임
- Mythos Preview가 찾은 파트너 취약점의 세부 내용을 조기 공개하면 최종 사용자가 위험해질 수 있어, 현재는 대표 예시와 집계 통계 중심으로 공유 중
- 패치가 널리 배포된 뒤에는 더 상세한 기술 내용이 공개될 예정임
파트너와 외부 평가에서 드러난 성능
- Project Glasswing의 초기 파트너들은 인터넷과 필수 인프라 작동에 핵심적인 소프트웨어를 만들고 유지함
- 이 코드의 결함을 고치면 해당 소프트웨어에 의존하는 많은 조직과 수십억 최종 사용자의 위험이 줄어듦
- 프로젝트 시작 한 달 뒤 대부분의 파트너는 각자 수백 개의 치명적 또는 높은 심각도 취약점을 찾았고, 전체 발견 수는 1만 개 이상에 도달함
- 여러 파트너의 버그 발견 속도는 10배 이상 빨라짐
- Cloudflare는 핵심 경로 시스템에서 2,000개 버그를 찾았고, 그중 400개는 높은 또는 치명적 심각도였으며, 오탐률은 인간 테스터보다 낫다고 평가함
-
외부 테스트와 벤치마크
- 영국 AI Security Institute는 Mythos Preview를 자사 두 개의 사이버 레인지, 즉 다단계 사이버 공격 시뮬레이션을 처음으로 끝까지 해결한 모델로 평가함
- Mozilla는 Firefox 150 테스트에서 271개 취약점을 찾아 수정했으며, 이는 Firefox 148에서 Claude Opus 4.6으로 찾은 수보다 10배 이상 많음
- 독립 보안 플랫폼 XBOW는 Mythos Preview가 웹 익스플로잇 벤치마크에서 기존 모든 모델보다 “상당한 도약”을 보였고, 토큰당 기준으로 “전례 없는 정밀도”를 제공한다고 평가함
- ExploitBench와 ExploitGym은 익스플로잇 개발 역량을 측정하는 최근 학술 벤치마크이며, Mythos Preview가 가장 강한 성능을 보임
-
패치 배포 속도의 변화
- Palo Alto Networks의 최신 릴리스에는 평소보다 5배 이상 많은 패치가 포함됨
- Microsoft는 새 패치 수가 “한동안 계속 증가 추세를 보일 것”이라고 밝힘
- Oracle은 제품과 클라우드 전반에서 취약점을 이전보다 여러 배 빠르게 찾고 수정하는 중
- Mythos Preview는 취약점 탐지 외 보안 작업에도 쓰였으며, 한 Glasswing 파트너 은행에서는 위협 행위자가 고객 이메일 계정을 침해하고 스푸핑 전화까지 사용한 뒤 시도한 150만 달러 규모의 사기 송금을 탐지하고 차단하는 데 기여함
오픈소스 스캔 결과
- Anthropic은 최근 몇 달간 Mythos Preview로 인터넷과 자체 인프라의 상당 부분을 떠받치는 1,000개 이상 오픈소스 프로젝트를 스캔함
- Mythos Preview는 이 프로젝트들에서 총 23,019개 취약점을 추정했으며, 그중 6,202개를 높은 또는 치명적 심각도로 평가함
-
검증된 취약점 수치
- 높은 또는 치명적 심각도로 평가된 취약점 중 1,752개는 6개 독립 보안 연구 업체 또는 일부 경우 Anthropic이 신중히 평가함
- 이 중 90.6%, 즉 1,587개가 실제 양성으로 확인됨
- 이 중 62.4%, 즉 1,094개는 높은 또는 치명적 심각도로 확정됨
- 현재 사후 분류 기준의 실제 양성률을 적용하면, Mythos Preview가 더 이상 새 취약점을 찾지 않아도 오픈소스 코드에서 거의 3,900개의 높은 또는 치명적 심각도 취약점이 드러날 전망임
- Anthropic은 오픈소스 코드 스캔을 당분간 계속할 예정이므로 이 숫자는 더 늘어날 것으로 예상됨
-
wolfSSL 취약점 예시
- wolfSSL은 보안성으로 알려진 오픈소스 암호화 라이브러리이며 전 세계 수십억 기기에서 사용됨
- Mythos Preview는 공격자가 인증서를 위조할 수 있게 하는 익스플로잇을 구성함
- 이 취약점은 공격자가 은행이나 이메일 제공업체의 가짜 웹사이트를 운영할 수 있게 만들며, 최종 사용자에게는 정상 사이트처럼 보이지만 실제로는 공격자가 제어하는 사이트가 됨
- 해당 취약점은 이미 패치됐고 CVE-2026-5194가 부여됨
- 전체 기술 분석은 향후 몇 주 안에 공개될 예정임
검증·공개·패치 병목
- Mythos Preview로 취약점 발견은 크게 쉬워졌지만, 병목은 버그를 분류·보고·패치 설계·배포하는 인간 처리 역량에 있음
- Anthropic은 스캔한 오픈소스 취약점 대시보드를 공개해 조율된 공개 절차의 각 단계와 진행 상황을 추적함
- 각 단계에서 수가 크게 줄어드는 현상은 취약점 하나하나를 검증하고 수정하는 데 필요한 인간 작업량을 반영함
- Anthropic 또는 외부 보안 업체는 Mythos가 찾은 문제를 재현하고 심각도를 다시 평가한 뒤, 기존 수정 여부를 확인하고 유지관리자에게 보낼 상세 보고서를 작성함
- 오픈소스 유지관리자들은 기존 유지관리 부담에 더해 품질 낮은 AI 생성 버그 보고서의 홍수까지 감당하는 중
- 여러 유지관리자는 처리 역량이 심각하게 제한돼 있으며, 일부는 패치를 설계할 시간이 필요하다며 공개 속도를 늦춰 달라고 요청함
- Mythos Preview가 찾은 높은 또는 치명적 심각도 버그는 평균적으로 패치까지 2주가 걸림
-
공개와 패치 현황
- 유지관리자 요청에 따라 추가 평가 없이 버그를 직접 공개하는 경우도 있음
- 현재까지 검증되지 않은 버그 1,129개가 직접 보고됐고, 그중 Mythos Preview가 높은 또는 치명적 심각도로 추정한 것은 175개임
- 현재까지 유지관리자에게 공개한 높은 또는 치명적 심각도 버그는 약 530개로 추산됨
- 추가로 827개의 확인된 취약점이 있으며, 같은 방식으로 높은 또는 치명적 심각도로 추정되고 최대한 빠르게 공개될 예정임
- 보고된 높은 또는 치명적 심각도 버그 530개 중 75개가 패치됐고, 그중 65개에는 공개 권고문이 부여됨
- Coordinated Vulnerability Disclosure policy의 90일 창구가 아직 초기 단계라 앞으로 더 많은 패치가 나올 것으로 예상됨
- 일부 취약점은 공개 권고문 없이 패치되므로, Claude로 직접 패치 여부를 스캔해야 해 패치 수가 과소 집계됐을 가능성이 있음
- 취약점 발견은 쉬워졌지만 수정은 느린 불균형이 사이버보안의 큰 과제로 떠오르며, 이를 잘 다루면 소프트웨어는 이전보다 훨씬 안전해질 수 있음
새로운 사이버보안 국면에 대한 대응
- Mythos Preview와 비슷한 사이버보안 역량을 가진 모델은 곧 더 널리 사용 가능해질 전망임
- 소프트웨어 업계 전반에서 이런 모델들이 만들어낼 대량의 발견 결과를 관리하기 위한 더 큰 규모의 노력이 필요함
- 취약점 발견, 패치 작성, 최종 사용자에게 패치가 널리 배포되는 시점 사이에는 지금도 긴 지연이 자주 존재함
- Mythos급 모델은 취약점을 찾고 악용하는 데 필요한 시간과 비용을 크게 줄여, 이러한 지연이 만들어내는 위험을 키움
- 장기적으로 Mythos급 모델은 배포 전에 버그를 잡아 개발자가 훨씬 안전한 소프트웨어를 만들도록 도울 수 있음
- 하지만 취약점은 빠르게 발견되고 패치는 느리게 이뤄지는 중간 시기에는 새로운 위험이 생김
-
소프트웨어 개발자에게 필요한 조치
- 개발자는 패치 주기를 줄이고 보안 수정 사항을 가능한 한 빠르게 제공해야 함
- 공개적으로 이용 가능한 AI 모델을 신중히 활용하면 이 작업에 도움이 될 수 있음
- 사용자가 최신 버전을 유지하도록 업데이트 설치를 최대한 쉽게 만들어야 함
- 알려진 취약점이 있는 소프트웨어를 계속 실행하는 사용자에게는 가능한 범위에서 더 끈질기게 업데이트를 유도해야 함
-
네트워크 방어자에게 필요한 조치
공개 AI 모델을 활용한 방어 도구
- 일반적으로 이용 가능한 많은 모델도 가장 정교한 취약점을 찾거나 Claude Mythos Preview만큼 효과적으로 악용하지는 못하지만, 이미 많은 소프트웨어 취약점을 찾을 수 있음
- Project Glasswing은 여러 조직이 일반 공개 모델로 자체 코드베이스를 점검하도록 촉진했으며, Anthropic은 이를 더 쉽게 만들기 위한 작업을 진행 중
-
Claude Security
- Claude Security는 Claude Enterprise 고객을 대상으로 공개 베타로 출시됨
- 팀이 코드베이스의 취약점을 스캔하고 제안 수정안을 생성하도록 돕는 도구임
- 출시 후 3주 동안 Claude Opus 4.7은 2,100개 이상 취약점을 패치하는 데 사용됨
- 기업은 자체 코드를 고치는 반면 오픈소스 수정은 보통 조율된 공개 절차와 자원봉사 유지관리자가 필요해, Claude Security의 패치 속도가 앞선 오픈소스 패치보다 빠름
-
Cyber Verification Program
- Cyber Verification Program은 보안 전문가가 합법적 사이버보안 목적에 Anthropic 모델을 사용할 수 있게 함
- 취약점 연구, 침투 테스트, 레드팀 활동 같은 용도에서는 사이버 오용 방지를 위한 일부 보호장치 없이 모델을 사용할 수 있음
-
Mythos Preview와 함께 쓰인 도구
- Anthropic과 파트너가 Mythos Preview와 함께 사용한 도구는 자격을 갖춘 고객 보안팀에 요청 기반으로 제공됨
- 목표는 복잡한 설정 없이도 강력한 공개 모델의 성능을 더 잘 활용하도록 돕는 것임
- skills: Anthropic과 파트너가 만들고 공유한 반복 작업용 사용자 지정 지침
- 하네스(harness): Claude가 코드베이스를 매핑하고, 스캔 하위 에이전트를 띄우고, 발견 사항을 분류하고, 보고서를 작성하도록 돕는 구성
- 위협 모델 빌더: 코드베이스를 매핑해 잠재적 공격 대상을 식별하고 모델 작업의 우선순위를 정함
- Cisco는 Project Glasswing 파트너 중 하나이며, 다른 방어자가 Cisco와 유사한 평가 시스템을 만들 수 있도록 Foundry Security Spec을 최근 오픈소스로 공개함
생태계 지원과 다음 단계
- Anthropic은 Open Source Security Foundation의 Alpha-Omega 프로젝트와 파트너십을 맺어, 유지관리자가 버그 보고서를 처리하고 분류하는 작업을 지원함
- Anthropic은 프런티어 AI 모델의 익스플로잇 개발 역량을 시간에 따라 추적할 수 있는 새 벤치마크 ExploitBench와 ExploitGym 개발을 지원함
- 이 벤치마크 관련 내용은 Frontier Red Team blog에서 더 다룸
- External Researcher Access Program을 통해 다른 고품질 정량 벤치마크 개발도 지원함
- Claude for Open Source는 유지관리자와 기여자를 지원하며, Anthropic은 앞으로 자체적으로 채택하는 모든 오픈소스 패키지를 스캔하겠다고 밝힘
- AI 발전 속도를 고려하면 Mythos Preview만큼 강력한 모델은 곧 여러 AI 회사에서 개발될 전망임
- 현재 Anthropic을 포함한 어떤 회사도 이런 모델이 오용되어 심각한 피해를 일으키는 것을 막을 만큼 강력한 보호장치를 개발하지 못함
- 이 때문에 Anthropic은 아직 Mythos급 모델을 일반에 공개하지 않음
- Project Glasswing은 비슷한 역량의 모델이 충분한 보호장치 없이 공개될 경우, 세계 거의 누구에게나 결함 있는 소프트웨어를 악용하는 일이 훨씬 싸고 쉬워질 수 있다는 문제의식에서 시작됨
- Glasswing은 가장 시스템적으로 중요한 사이버 방어자가 비대칭적 우위를 얻도록 돕지만, 가능한 한 많은 조직이 방어력을 강화해야 할 긴급한 필요가 있음
- Anthropic은 미국 및 동맹국 정부를 포함한 핵심 파트너와 협력해 Project Glasswing을 추가 파트너로 확대할 예정임
- 필요한 훨씬 강력한 보호장치를 개발한 뒤, 가까운 미래에 Mythos급 모델을 일반 출시 형태로 제공하는 것을 목표로 함
- 장기 목표는 중요한 코드가 현재보다 훨씬 더 강하게 보호되고, 해킹이 훨씬 덜 흔한 환경을 만드는 것임
-
Homepage
-
개발자
- Project Glasswing: 초기 업데이트