-
uBlock Origin에서 AI가 생성한 콘텐츠 농장 사이트를 차단하기 위한 공개 블랙리스트 프로젝트
- 생성형 AI가 작성한 웹사이트는 광고와 추천 링크로 채워져 있으며 신뢰할 수 없는 정보를 포함하는 경우가 많음
- 사용자는 list.txt 파일을 구독하거나 직접 URL을 추가해 차단 목록을 적용할 수 있음
- AI 생성 사이트의 특징과 식별 기준이 구체적으로 제시되어 있으며, 기여자들의 Pull Request를 통해 목록 확장이 가능함
- 검색 결과 상위에 노출되는 AI 콘텐츠 오염 문제를 줄이기 위한 실용적 도구로 활용 가능함
프로젝트 개요
-
AI uBlock Blacklist는 uBlock Origin 확장 프로그램에서 사용할 수 있는 AI 생성 콘텐츠 차단 리스트 제공
- 생성형 AI가 작성한 웹사이트를 탐색 중 발견할 때마다 수동으로 목록에 추가
- 자동화 도구는 사용하지 않으며, AI 생성 여부를 알고리듬으로 판별하기 어렵기 때문이라고 명시
프로젝트 목적
- 생성형 AI가 작성한 웹사이트는 유용한 정보가 부족하고 광고·추천 링크로 수익을 노리는 구조
- AI가 작성한 콘텐츠는 검수 없이 대량 게시되어 위험한 정보를 포함할 수 있음
- 예시로 회로 단락, rm -rf / 명령 실행, 표백제와 암모니아 혼합 등 위험한 조언을 제시할 가능성 언급
- 이러한 이유로 AI 생성 콘텐츠는 신뢰할 수 없으며 차단이 필요함
- 작성자는 이탈리아 국적이라 이탈리아어 사이트가 다수 포함되어 있으며, 다른 언어 사이트 추가를 위한 기여를 환영
웹사이트 추가 방법
- 기술 지식이 없는 사용자는 GitHub Issue를 통해 의심 사이트를 신고 가능
- Pull Request를 통해 직접 추가할 경우, 도메인 단위 또는 특정 블로그 경로 단위로 차단 가능
- 예: ||example.com/@slopUser^$doc 또는 ||example.com^$doc 형식
- SEO 및 디지털 마케팅 서비스를 판매하는 조직이 여러 콘텐츠 농장을 운영하는 경우, 관련 사이트를 함께 추가 권장
AI 콘텐츠 농장 식별 기준
-
불필요한 서론과 결론, ‘Comprehensive Guide’ 등 과장된 제목, 외부 링크·출처 부재, 추천 링크 다수
-
짧은 기간 내 수천 개 게시물, 잘못된 정보(환각), 2022년 11월 이후 게시물, AI 생성 이미지·로고
-
서식이 엉성한 텍스트, 렌더링되지 않은 Markdown 문법, 주제와 무관한 장문, 검색 상위 반복 노출
-
연락처 부재, 모호한 소개 페이지, AI 찬양적 콘텐츠 등도 주요 특징으로 제시
Google Dorks 활용
- AI가 생성한 문장을 그대로 복사해 게시하는 경우, 특정 문구 검색으로 AI 페이지 탐색 가능
- 예시: "Sure! Here's an article about" (영어), "Certo! Ecco un articolo" (이탈리아어)
- 이러한 문구를 포함한 페이지는 도메인 전체를 블랙리스트에 추가
유사 프로젝트