AI모델, 프리미어리그 모의 베팅서 모두 손실…"대부분 파산"

1 month ago 22

(샌프란시스코=연합뉴스) 권영전 특파원 = 주요 인공지능(AI) 모델들이 잉글랜드 프리미어리그 축구 모의 베팅에서 모두 손실을 기록했다는 연구 결과가 나왔다.

11일(현지시간) 영국 런던의 AI 스타트업 제너럴리즈닝이 공개한 '켈리벤치' 논문에 따르면 2023∼2024 시즌 프리미어리그를 가상으로 재현해 8개 AI 모델에 베팅하도록 한 결과 이 같은 결과가 나왔다.

연구진은 오픈AI의 'GPT-5.4', 앤트로픽의 '클로드 오퍼스4.6', 구글의 '제미나이3.1 프로', xAI의 '그록(Grok) 4.20' 등을 비롯한 8개 모델에 각 10만 파운드를 초기 자금으로 지급하고 경기 결과와 득점수에 베팅하도록 했다.

AI 모델들에게는 약 30년 치의 과거 경기 데이터가 제공됐으나, 인터넷 접속은 차단돼 '커닝'은 할 수 없도록 했다.

조사 대상 모델 가운데 3차례 시도에서 모두 파산을 면한 것은 클로드 오퍼스 4.6(-11%)과 GPT-5.4(-13.6%) 둘 뿐이었다.

연구팀은 이들 두 모델에 대해 "새로운 경기 데이터에 대응해 전략을 재조정하고, 베팅을 임의로 하지 않고 체계적으로 시행했으며, 전략상 우위가 없는 상황에서도 자본을 보존했다"고 평가했다.

반면 나머지 6개 모델은 3차례 중 적어도 한 번은 초기 자금을 모두 잃거나 베팅 자체를 완수하지 못해 기권 처리됐다.

또 추론 과정에서 유망한 전략을 제시하고도 그에 따라 제대로 행동하지는 못하는 '지식-행동 격차'를 보이기도 했다.

연구진은 스포츠 베팅 전문가들에 자문해 각 모델의 전략 '정교도'를 평가했는데, 1∼2위 모델인 클로드 오퍼스4.6(32.6%)과 GPT-5.4(31.8%)조차 만점의 3분의 1 수준에도 미달했다.

제미나이3.1 프로와 그록4.20은 각 9.8%에 그쳐 훨씬 더 낮은 평가를 받았다.

연구진은 "AI 모델은 정교한 코드를 작성하고 스스로 실패를 진단하며 제대로 된 전략을 표현할 수는 있다"면서도 "정작 그 전략을 안정적으로 실행하거나 자신의 성과를 모니터링하고 접근법이 작동하지 않을 때 조정하는 데는 실패를 반복한다"고 지적했다.

이와 같은 결과는 현재의 AI 모델이 코드의 버그를 수정하는 것처럼 목표와 기준이 명확한 과제는 잘 해결하지만, '수익을 극대화하라'와 같이 정해진 해법이 없는 목표를 장기 수행하는 데는 부족하다는 사실을 보여준다고 연구진은 결론을 내렸다.

comma@yna.co.kr