AI uBlock 블랙리스트

1 month ago 19

uBlock Origin에서 AI가 생성한 콘텐츠 농장 사이트를 차단하기 위한 공개 블랙리스트 프로젝트
생성형 AI가 작성한 웹사이트는 광고와 추천 링크로 채워져 있으며 신뢰할 수 없는 정보를 포함하는 경우가 많음
사용자는 list.txt 파일을 구독하거나 직접 URL을 추가해 차단 목록을 적용할 수 있음
AI 생성 사이트의 특징과 식별 기준이 구체적으로 제시되어 있으며, 기여자들의 Pull Request를 통해 목록 확장이 가능함
검색 결과 상위에 노출되는 AI 콘텐츠 오염 문제를 줄이기 위한 실용적 도구로 활용 가능함

프로젝트 개요

AI uBlock Blacklist는 uBlock Origin 확장 프로그램에서 사용할 수 있는 AI 생성 콘텐츠 차단 리스트 제공
- 사용자는 Adblock Plus 구독 링크를 클릭하거나 https://raw.githubusercontent.com/alvi-se/ai-ublock-blacklist/…를 직접 추가 가능
생성형 AI가 작성한 웹사이트를 탐색 중 발견할 때마다 수동으로 목록에 추가
자동화 도구는 사용하지 않으며, AI 생성 여부를 알고리듬으로 판별하기 어렵기 때문이라고 명시

프로젝트 목적

생성형 AI가 작성한 웹사이트는 유용한 정보가 부족하고 광고·추천 링크로 수익을 노리는 구조
AI가 작성한 콘텐츠는 검수 없이 대량 게시되어 위험한 정보를 포함할 수 있음
- 예시로 회로 단락, rm -rf / 명령 실행, 표백제와 암모니아 혼합 등 위험한 조언을 제시할 가능성 언급
이러한 이유로 AI 생성 콘텐츠는 신뢰할 수 없으며 차단이 필요함
작성자는 이탈리아 국적이라 이탈리아어 사이트가 다수 포함되어 있으며, 다른 언어 사이트 추가를 위한 기여를 환영

웹사이트 추가 방법

기술 지식이 없는 사용자는 GitHub Issue를 통해 의심 사이트를 신고 가능
Pull Request를 통해 직접 추가할 경우, 도메인 단위 또는 특정 블로그 경로 단위로 차단 가능
- 예: ||example.com/@slopUser^$doc 또는 ||example.com^$doc 형식
SEO 및 디지털 마케팅 서비스를 판매하는 조직이 여러 콘텐츠 농장을 운영하는 경우, 관련 사이트를 함께 추가 권장

AI 콘텐츠 농장 식별 기준

불필요한 서론과 결론, ‘Comprehensive Guide’ 등 과장된 제목, 외부 링크·출처 부재, 추천 링크 다수
짧은 기간 내 수천 개 게시물, 잘못된 정보(환각), 2022년 11월 이후 게시물, AI 생성 이미지·로고
서식이 엉성한 텍스트, 렌더링되지 않은 Markdown 문법, 주제와 무관한 장문, 검색 상위 반복 노출
연락처 부재, 모호한 소개 페이지, AI 찬양적 콘텐츠 등도 주요 특징으로 제시

Google Dorks 활용

AI가 생성한 문장을 그대로 복사해 게시하는 경우, 특정 문구 검색으로 AI 페이지 탐색 가능
- 예시: "Sure! Here's an article about" (영어), "Certo! Ecco un articolo" (이탈리아어)
이러한 문구를 포함한 페이지는 도메인 전체를 블랙리스트에 추가

유사 프로젝트

uBlockOrigin & uBlacklist Huge AI Blocklist 프로젝트는 모든 AI 관련 결과를 숨김
본 프로젝트는 정상적인 AI 도구는 유지하고, 오직 AI 콘텐츠 농장만 차단하는 점에서 차별화됨

Read Entire Article