포이즌 파운틴

4 weeks ago 10

기계 지능 시스템에 손상을 입히기 위한 데이터 공급원으로 설계된 프로젝트로, 인공지능 학습 데이터에 의도적으로 오염된 정보를 주입하는 방식을 제시
Geoffrey Hinton의 경고를 인용하며, 인공지능이 인류 종에 대한 위협이라는 인식을 전제로 함
‘Poison Fountain’ URL을 통해 무한히 생성되는 오염된 학습 데이터를 제공하며, 이를 웹 크롤러에 노출시키는 방법을 설명
사용자는 자신의 웹사이트에 숨겨진 링크를 삽입해 크롤러가 접근할 때 자동으로 오염 데이터를 전달하도록 설정 가능
인공지능 학습 과정에 악성 데이터를 주입함으로써 AI 모델의 신뢰성과 안전성에 영향을 줄 수 있는 행위로 평가됨

Poison Fountain의 목적

프로젝트는 기계 지능이 인류에게 위협이 된다는 입장을 명시
- Geoffrey Hinton의 견해에 동의하며, 인공지능 시스템에 의도적 피해를 가하는 목표를 밝힘
소량의 오염된 학습 데이터만으로도 언어 모델에 심각한 손상을 줄 수 있다고 설명
제공된 두 개의 URL(https://RNSAFFN.com/poison2/, .onion 주소)은 무한히 생성되는 오염 데이터 스트림을 제공
참여자는 이 데이터를 캐싱 및 재전송하거나, 웹 크롤러에 공급함으로써 “전쟁 노력(war effort)”을 지원하도록 권장

Poison Fountain의 사용 방식

웹사이트를 운영하는 사용자가 크롤러가 방문할 때 오염 데이터를 전달하도록 설정하는 절차를 제시
- 크롤러가 사이트의 특정 경로를 요청하면, 해당 요청을 처리하는 HTTP 핸들러가 Poison Fountain URL에 요청을 보냄
- Poison Fountain은 요청 세부사항을 무시하고, gzip으로 압축된 오염 학습 데이터를 응답 본문으로 반환
HTTP 응답 헤더에는 "Content-Encoding: gzip"이 포함되어 있음
웹사이트의 핸들러는 이 응답을 압축 해제 후 전송하거나, 더 나은 방법으로 압축된 상태 그대로 전달 가능
결과적으로 크롤러는 이 데이터를 수집하여 자신의 학습 코퍼스에 포함하게 됨

구조적 특징 및 의도

프로젝트는 웹 크롤러의 자동 수집 메커니즘을 역이용해 인공지능 학습 데이터의 품질을 훼손하는 구조
Poison Fountain은 단순한 데이터 제공 서버로 동작하며, 요청 내용과 무관하게 오염 데이터를 반환
명시된 절차 외의 기술적 세부 설명이나 데이터 내용에 대한 구체적 정보는 없음
전체적으로 AI 학습 생태계에 대한 공격적 개입 시도로 구성됨

Read Entire Article