ICLR 2026 제출 논문에서 50건 이상의 환각 사례 발견

3 days ago 2

GPTZero가 ICLR 2026 제출 논문에서 50건 이상의 인용 오류 및 허위 저자 정보를 검출
각 논문은 OpenReview 링크와 함께 실제 존재 여부 및 인용 일치 여부가 검증됨
다수의 사례에서 존재하지 않는 저자, 잘못된 연도, 다른 논문 제목이 포함된 것으로 확인
일부 논문은 실제 논문과 부분적으로 일치하지만 세부 메타데이터가 왜곡되어 있음
학계 제출물에서도 AI 생성 환각(hallucination) 문제가 확산되고 있음을 보여주는 사례

GPTZero의 ICLR 2026 환각 검출 결과

GPTZero는 ICLR 2026 제출 논문들을 대상으로 인용문과 저자 정보를 자동 검증
- 각 논문은 OpenReview 링크, GPTZero 검증 링크, 그리고 인용 정보가 함께 제시됨
- 검증 결과, 50건 이상에서 허위 인용 또는 존재하지 않는 저자가 발견됨

대표적 환각 사례

TamperTok 논문은 실제 존재하지만 모든 저자 정보가 잘못됨
MixtureVitae 논문은 첫 3명의 저자는 일치하나 나머지 7명은 존재하지 않음
OrtSAE, Principled Policy Optimization, IMPQ 등은 실제 논문과 제목 또는 저자가 불일치
PDMBench는 유사한 논문이 존재하나 연도와 제목이 다름
C3-OWD, GRF-LLM 등은 부분적 일치로 분류됨

완전 불일치 사례

Catch-Only-One, TopoMHC, ThinkGeo, Reflexion, LOSI 등은 인용된 논문이 존재하지 않음
SAFE-LLM, Typed Chain-of-Thought, MANTA 등은 유사 논문이 있으나 메타데이터 불일치
AI-Assisted Medical Triage Assistant, QUART, KARMA 등은 전혀 관련 없는 논문 인용

검증 방식과 결과 유형

GPTZero는 각 인용을 실제 데이터베이스(예: arXiv, NeurIPS, ICLR, ACL 등)와 비교
- 결과는 “존재함”, “부분 일치”, “불일치”, “허위 저자” 등으로 분류
- 일부 항목은 실제 논문이 존재하지만 저자·연도·제목이 모두 다름으로 표시됨

의미와 시사점

ICLR 2026 제출물 중 다수가 AI 생성 텍스트의 환각 문제를 그대로 포함
학술 논문 작성 과정에서도 사실 검증 자동화 도구의 필요성이 부각
GPTZero의 검출 결과는 AI 생성 콘텐츠의 신뢰성 검증 체계 강화 필요성을 보여줌

Read Entire Article