-
기계 지능 시스템에 손상을 입히기 위한 데이터 공급원으로 설계된 프로젝트로, 인공지능 학습 데이터에 의도적으로 오염된 정보를 주입하는 방식을 제시
-
Geoffrey Hinton의 경고를 인용하며, 인공지능이 인류 종에 대한 위협이라는 인식을 전제로 함
-
‘Poison Fountain’ URL을 통해 무한히 생성되는 오염된 학습 데이터를 제공하며, 이를 웹 크롤러에 노출시키는 방법을 설명
- 사용자는 자신의 웹사이트에 숨겨진 링크를 삽입해 크롤러가 접근할 때 자동으로 오염 데이터를 전달하도록 설정 가능
- 인공지능 학습 과정에 악성 데이터를 주입함으로써 AI 모델의 신뢰성과 안전성에 영향을 줄 수 있는 행위로 평가됨
Poison Fountain의 목적
- 프로젝트는 기계 지능이 인류에게 위협이 된다는 입장을 명시
- Geoffrey Hinton의 견해에 동의하며, 인공지능 시스템에 의도적 피해를 가하는 목표를 밝힘
-
소량의 오염된 학습 데이터만으로도 언어 모델에 심각한 손상을 줄 수 있다고 설명
- 제공된 두 개의 URL(https://RNSAFFN.com/poison2/, .onion 주소)은 무한히 생성되는 오염 데이터 스트림을 제공
- 참여자는 이 데이터를 캐싱 및 재전송하거나, 웹 크롤러에 공급함으로써 “전쟁 노력(war effort)”을 지원하도록 권장
Poison Fountain의 사용 방식
- 웹사이트를 운영하는 사용자가 크롤러가 방문할 때 오염 데이터를 전달하도록 설정하는 절차를 제시
- 크롤러가 사이트의 특정 경로를 요청하면, 해당 요청을 처리하는 HTTP 핸들러가 Poison Fountain URL에 요청을 보냄
- Poison Fountain은 요청 세부사항을 무시하고, gzip으로 압축된 오염 학습 데이터를 응답 본문으로 반환
- HTTP 응답 헤더에는 "Content-Encoding: gzip"이 포함되어 있음
- 웹사이트의 핸들러는 이 응답을 압축 해제 후 전송하거나, 더 나은 방법으로 압축된 상태 그대로 전달 가능
- 결과적으로 크롤러는 이 데이터를 수집하여 자신의 학습 코퍼스에 포함하게 됨
구조적 특징 및 의도
- 프로젝트는 웹 크롤러의 자동 수집 메커니즘을 역이용해 인공지능 학습 데이터의 품질을 훼손하는 구조
-
Poison Fountain은 단순한 데이터 제공 서버로 동작하며, 요청 내용과 무관하게 오염 데이터를 반환
- 명시된 절차 외의 기술적 세부 설명이나 데이터 내용에 대한 구체적 정보는 없음
- 전체적으로 AI 학습 생태계에 대한 공격적 개입 시도로 구성됨