-
GPTZero가 ICLR 2026 제출 논문에서 50건 이상의 인용 오류 및 허위 저자 정보를 검출
- 각 논문은 OpenReview 링크와 함께 실제 존재 여부 및 인용 일치 여부가 검증됨
- 다수의 사례에서 존재하지 않는 저자, 잘못된 연도, 다른 논문 제목이 포함된 것으로 확인
- 일부 논문은 실제 논문과 부분적으로 일치하지만 세부 메타데이터가 왜곡되어 있음
- 학계 제출물에서도 AI 생성 환각(hallucination) 문제가 확산되고 있음을 보여주는 사례
GPTZero의 ICLR 2026 환각 검출 결과
- GPTZero는 ICLR 2026 제출 논문들을 대상으로 인용문과 저자 정보를 자동 검증
- 각 논문은 OpenReview 링크, GPTZero 검증 링크, 그리고 인용 정보가 함께 제시됨
- 검증 결과, 50건 이상에서 허위 인용 또는 존재하지 않는 저자가 발견됨
대표적 환각 사례
-
TamperTok 논문은 실제 존재하지만 모든 저자 정보가 잘못됨
-
MixtureVitae 논문은 첫 3명의 저자는 일치하나 나머지 7명은 존재하지 않음
-
OrtSAE, Principled Policy Optimization, IMPQ 등은 실제 논문과 제목 또는 저자가 불일치
-
PDMBench는 유사한 논문이 존재하나 연도와 제목이 다름
-
C3-OWD, GRF-LLM 등은 부분적 일치로 분류됨
완전 불일치 사례
-
Catch-Only-One, TopoMHC, ThinkGeo, Reflexion, LOSI 등은 인용된 논문이 존재하지 않음
-
SAFE-LLM, Typed Chain-of-Thought, MANTA 등은 유사 논문이 있으나 메타데이터 불일치
-
AI-Assisted Medical Triage Assistant, QUART, KARMA 등은 전혀 관련 없는 논문 인용
검증 방식과 결과 유형
- GPTZero는 각 인용을 실제 데이터베이스(예: arXiv, NeurIPS, ICLR, ACL 등)와 비교
- 결과는 “존재함”, “부분 일치”, “불일치”, “허위 저자” 등으로 분류
- 일부 항목은 실제 논문이 존재하지만 저자·연도·제목이 모두 다름으로 표시됨
의미와 시사점
- ICLR 2026 제출물 중 다수가 AI 생성 텍스트의 환각 문제를 그대로 포함
- 학술 논문 작성 과정에서도 사실 검증 자동화 도구의 필요성이 부각
- GPTZero의 검출 결과는 AI 생성 콘텐츠의 신뢰성 검증 체계 강화 필요성을 보여줌