Show HN 게시물 비율은 증가하지만 점수는 하락 중

2 weeks ago 9

  • 최근 Show HN 게시물 비율이 급격히 증가했으며, 특히 LLM(대형 언어 모델) 의 등장 이후 상승세가 두드러짐
  • 2012~2022년 동안 약 2~3% 수준이던 비율이 2025년 12월에는 12% 이상으로 확대됨
  • 반면 평균 점수는 하락세를 보이며, 2025년 12월 기준 Show HN의 평균 점수는 9.04점으로 전체 평균(19.53점) 보다 10점 낮음
  • 작성자는 LLM 생성 게시물의 품질 저하 여부에 대해 확신하지 못하며, 사용자의 피로감 가능성만 언급
  • Hacker News 공개 데이터(BigQuery) 를 활용해 분석했으며, Python 코드와 CSV 파일은 GitHub에 공개됨

Show HN 비율과 점수 변화 분석

  • 2012년부터 2022년까지 Show HN 게시물 비율은 2~3% 수준으로 안정적 유지

    • 이후 코드를 작성할 수 있는 LLM의 등장으로 비율이 상승
    • Claude CodeCursor 1.0이 이 추세를 가속화
    • 2025년 12월에는 전체 게시물 중 12% 이상이 Show HN으로 확인됨
    • 작성자는 Show HN 증가와 LLM 확산 간의 상관관계가 있다고 명시
  • Show HN 점수는 반대로 하락세를 보임

    • 2023~2024년까지는 전체 게시물과 유사한 15~18점 수준 유지
    • 2025년 12월에는 평균 9.04점, 전체 평균 19.53점보다 약 10점 낮음
    • 작성자는 “LLM 생성 Show HN의 품질이 낮은지 확신할 수 없다”고 언급
    • “Show HN이 너무 많아 사용자가 피로감을 느낄 수도 있다”고 덧붙임
    • 2022년 평균 점수 상승 원인은 “새로운 사용자 유입 때문일 수도 있다”고 추정

데이터 수집 및 분석 방법

  • BigQuery의 Hacker News 공개 데이터셋을 사용해 분석 수행

    • SQL 쿼리를 통해 time, title, type, score, id 필드를 추출
    • type 필드에는 show_hn 속성이 없어, 제목을 소문자로 변환 후 show_hn:으로 시작하는지 여부로 필터링
    • 데이터는 약 400MB 크기로, 원본 CSV는 GitHub에 포함되지 않음
    • 쿼리 실행 후 Google Drive로 내보내 다운로드
  • 분석 코드와 CSV 파일은 GitHub 저장소
    https://github.com/plastic041/hackernews
    에서 확인 가능

향후 계획 및 한계

  • LLM으로 생성된 Show HN 게시물의 비율을 추가로 분석하고자 했으나,
    게시물 본문에 LLM 사용 여부가 명시되지 않아 판별 불가능
  • 작성자는 몇 달마다 데이터를 갱신해 글을 업데이트할 계획
  • 2026년 데이터는 아직 13일치에 불과하고 점수가 안정되지 않아 분석에서 제외됨

Read Entire Article