ICLR 2026 제출 논문에서 50건 이상의 환각 사례 발견

3 days ago 2

  • GPTZero가 ICLR 2026 제출 논문에서 50건 이상의 인용 오류 및 허위 저자 정보를 검출
  • 각 논문은 OpenReview 링크와 함께 실제 존재 여부 및 인용 일치 여부가 검증됨
  • 다수의 사례에서 존재하지 않는 저자, 잘못된 연도, 다른 논문 제목이 포함된 것으로 확인
  • 일부 논문은 실제 논문과 부분적으로 일치하지만 세부 메타데이터가 왜곡되어 있음
  • 학계 제출물에서도 AI 생성 환각(hallucination) 문제가 확산되고 있음을 보여주는 사례

GPTZero의 ICLR 2026 환각 검출 결과

  • GPTZero는 ICLR 2026 제출 논문들을 대상으로 인용문과 저자 정보를 자동 검증
    • 각 논문은 OpenReview 링크, GPTZero 검증 링크, 그리고 인용 정보가 함께 제시됨
    • 검증 결과, 50건 이상에서 허위 인용 또는 존재하지 않는 저자가 발견됨

대표적 환각 사례

  • TamperTok 논문은 실제 존재하지만 모든 저자 정보가 잘못됨
  • MixtureVitae 논문은 첫 3명의 저자는 일치하나 나머지 7명은 존재하지 않음
  • OrtSAE, Principled Policy Optimization, IMPQ 등은 실제 논문과 제목 또는 저자가 불일치
  • PDMBench는 유사한 논문이 존재하나 연도와 제목이 다름
  • C3-OWD, GRF-LLM 등은 부분적 일치로 분류됨

완전 불일치 사례

  • Catch-Only-One, TopoMHC, ThinkGeo, Reflexion, LOSI 등은 인용된 논문이 존재하지 않음
  • SAFE-LLM, Typed Chain-of-Thought, MANTA 등은 유사 논문이 있으나 메타데이터 불일치
  • AI-Assisted Medical Triage Assistant, QUART, KARMA 등은 전혀 관련 없는 논문 인용

검증 방식과 결과 유형

  • GPTZero는 각 인용을 실제 데이터베이스(예: arXiv, NeurIPS, ICLR, ACL 등)와 비교
    • 결과는 “존재함”, “부분 일치”, “불일치”, “허위 저자” 등으로 분류
    • 일부 항목은 실제 논문이 존재하지만 저자·연도·제목이 모두 다름으로 표시됨

의미와 시사점

  • ICLR 2026 제출물 중 다수가 AI 생성 텍스트의 환각 문제를 그대로 포함
  • 학술 논문 작성 과정에서도 사실 검증 자동화 도구의 필요성이 부각
  • GPTZero의 검출 결과는 AI 생성 콘텐츠의 신뢰성 검증 체계 강화 필요성을 보여줌

Read Entire Article