AI uBlock 블랙리스트

5 days ago 4

  • uBlock Origin에서 AI가 생성한 콘텐츠 농장 사이트를 차단하기 위한 공개 블랙리스트 프로젝트
  • 생성형 AI가 작성한 웹사이트는 광고와 추천 링크로 채워져 있으며 신뢰할 수 없는 정보를 포함하는 경우가 많음
  • 사용자는 list.txt 파일을 구독하거나 직접 URL을 추가해 차단 목록을 적용할 수 있음
  • AI 생성 사이트의 특징과 식별 기준이 구체적으로 제시되어 있으며, 기여자들의 Pull Request를 통해 목록 확장이 가능함
  • 검색 결과 상위에 노출되는 AI 콘텐츠 오염 문제를 줄이기 위한 실용적 도구로 활용 가능함

프로젝트 개요

  • AI uBlock Blacklist는 uBlock Origin 확장 프로그램에서 사용할 수 있는 AI 생성 콘텐츠 차단 리스트 제공
  • 생성형 AI가 작성한 웹사이트를 탐색 중 발견할 때마다 수동으로 목록에 추가
  • 자동화 도구는 사용하지 않으며, AI 생성 여부를 알고리듬으로 판별하기 어렵기 때문이라고 명시

프로젝트 목적

  • 생성형 AI가 작성한 웹사이트는 유용한 정보가 부족하고 광고·추천 링크로 수익을 노리는 구조
  • AI가 작성한 콘텐츠는 검수 없이 대량 게시되어 위험한 정보를 포함할 수 있음
    • 예시로 회로 단락, rm -rf / 명령 실행, 표백제와 암모니아 혼합 등 위험한 조언을 제시할 가능성 언급
  • 이러한 이유로 AI 생성 콘텐츠는 신뢰할 수 없으며 차단이 필요함
  • 작성자는 이탈리아 국적이라 이탈리아어 사이트가 다수 포함되어 있으며, 다른 언어 사이트 추가를 위한 기여를 환영

웹사이트 추가 방법

  • 기술 지식이 없는 사용자는 GitHub Issue를 통해 의심 사이트를 신고 가능
  • Pull Request를 통해 직접 추가할 경우, 도메인 단위 또는 특정 블로그 경로 단위로 차단 가능
    • 예: ||example.com/@slopUser^$doc 또는 ||example.com^$doc 형식
  • SEO 및 디지털 마케팅 서비스를 판매하는 조직이 여러 콘텐츠 농장을 운영하는 경우, 관련 사이트를 함께 추가 권장

AI 콘텐츠 농장 식별 기준

  • 불필요한 서론과 결론, ‘Comprehensive Guide’ 등 과장된 제목, 외부 링크·출처 부재, 추천 링크 다수
  • 짧은 기간 내 수천 개 게시물, 잘못된 정보(환각), 2022년 11월 이후 게시물, AI 생성 이미지·로고
  • 서식이 엉성한 텍스트, 렌더링되지 않은 Markdown 문법, 주제와 무관한 장문, 검색 상위 반복 노출
  • 연락처 부재, 모호한 소개 페이지, AI 찬양적 콘텐츠 등도 주요 특징으로 제시

Google Dorks 활용

  • AI가 생성한 문장을 그대로 복사해 게시하는 경우, 특정 문구 검색으로 AI 페이지 탐색 가능
    • 예시: "Sure! Here's an article about" (영어), "Certo! Ecco un articolo" (이탈리아어)
  • 이러한 문구를 포함한 페이지는 도메인 전체를 블랙리스트에 추가

유사 프로젝트

  • uBlockOrigin & uBlacklist Huge AI Blocklist 프로젝트는 모든 AI 관련 결과를 숨김
  • 본 프로젝트는 정상적인 AI 도구는 유지하고, 오직 AI 콘텐츠 농장만 차단하는 점에서 차별화됨

Read Entire Article