- 2025년은 대규모 언어 모델(LLM) 발전이 두드러진 해로, 여러 패러다임 전환이 등장함
-
RLVR(Reinforcement Learning from Verifiable Rewards) 이 기존 RLHF 단계를 대체하며, 검증 가능한 보상 기반 학습으로 추론 능력 향상을 이끌었음
- LLM의 지능은 인간형이 아닌 ‘유령형(jagged intelligence)’ 으로, 특정 영역에서 급격히 뛰어나지만 불균형적인 성능을 보임
-
Cursor와 Claude Code는 각각 새로운 LLM 애플리케이션 계층과 로컬 실행형 AI 에이전트의 가능성을 보여줌
-
Vibe coding과 Nano banana는 프로그래밍과 인터페이스의 경계를 재정의하며, 일반 사용자 중심의 AI 활용 시대를 열었음
1. Reinforcement Learning from Verifiable Rewards (RLVR)
- 2025년 LLM 학습 파이프라인은 기존 사전학습(Pretraining) , 지도 미세조정(SFT) , 인간 피드백 강화학습(RLHF) 에서 RLVR 단계를 추가한 형태로 진화
- RLVR은 수학·코드 퍼즐 등 자동 검증 가능한 환경에서 보상 기반 학습을 수행
- 이 과정에서 LLM은 중간 계산 단계를 스스로 구성하며, 인간이 인식하는 ‘추론’ 형태의 전략을 습득
- RLVR은 객관적 보상 함수를 사용해 장시간 최적화가 가능하며, 비용 대비 성능(capability/$) 이 높음
- 이로 인해 사전학습보다 RLVR에 더 많은 연산 자원이 투입됨
- 2025년의 모델들은 크기는 비슷하지만 더 긴 RL 학습 과정을 거침
- RLVR은 테스트 시 연산량과 추론 시간을 조절하는 새로운 스케일링 법칙을 제공
- OpenAI의 o1(2024) 이 첫 시연, o3(2025) 에서 뚜렷한 전환점이 나타남
2. Ghosts vs. Animals / Jagged Intelligence
- LLM의 지능은 인간처럼 ‘성장하는 동물’이 아니라, ‘소환된 유령’ 에 가깝다는 인식이 확산
- 인간 신경망은 생존을 위해 진화했지만, LLM은 텍스트 모방과 퍼즐 보상 최적화를 목표로 학습
- RLVR이 가능한 영역에서는 능력이 급상승(spike) 하며, 전반적으로 불균형적(jagged) 성능을 보임
- 특정 분야에서는 천재적이지만, 동시에 단순한 오류나 데이터 유출(jailbreak) 에도 취약
- 2025년에는 벤치마크 신뢰도 하락이 두드러짐
- 벤치마크가 검증 가능한 환경이기에 RLVR 및 합성 데이터 학습으로 쉽게 최적화됨
-
‘테스트셋 학습’ 이 새로운 기술로 자리잡음
3. Cursor / 새로운 LLM 앱 계층
-
Cursor는 2025년 급부상하며, ‘LLM 앱’의 새로운 계층을 보여줌
- 여러 LLM 호출을 DAG 형태로 오케스트레이션하고, 비용·성능 균형을 조정
-
문맥 엔지니어링, 전용 GUI, 자율성 슬라이더를 포함
- 이 계층의 두께(‘얼마나 많은 기능을 앱이 담당할지’)가 주요 논의 대상
- LLM 연구소는 범용 모델을 제공하고, 앱 개발자들은 특정 산업에 특화된 팀형 AI를 구성
4. Claude Code / 로컬 실행형 AI 에이전트
-
Claude Code(CC) 는 도구 사용과 추론을 결합한 LLM 에이전트의 첫 실질적 사례
- 사용자의 로컬 환경과 데이터에서 직접 실행되어, 개인화된 맥락을 활용
- OpenAI의 클라우드 중심 접근과 달리, Anthropic은 CLI 기반 로컬 실행형 모델을 제공
- AI가 단순한 웹사이트가 아니라 ‘컴퓨터 속에 사는 작은 영혼’ 처럼 작동
- 이는 AI 상호작용의 새로운 패러다임으로, 개발자 환경 중심의 에이전트 모델을 제시
5. Vibe Coding
-
영어 지시만으로 프로그램을 생성할 수 있을 만큼 LLM의 능력이 향상
- ‘Vibe coding’은 비전문가도 프로그래밍 가능하게 하는 접근
- 일반 사용자뿐 아니라 전문가도 빠른 프로토타이핑과 임시 앱 제작에 활용
- 예: Rust 기반 BPE 토크나이저, menugen, llm-council, reader3, HN time capsule 등
- 코드가 일회용·가변적 자원으로 변하며, 소프트웨어 제작 방식과 직무 정의를 재편
6. Nano Banana / LLM GUI
-
Google Gemini Nano banana는 2025년 가장 혁신적인 모델 중 하나로, LLM GUI 개념을 제시
- LLM을 1970~80년대 컴퓨터 혁명에 비유하며, 새로운 컴퓨팅 패러다임으로 평가
- 텍스트 중심 인터페이스는 인간에게 비효율적이므로, 시각적·공간적 표현이 필요
- GUI처럼 이미지, 인포그래픽, 슬라이드, 웹앱 형태로 LLM이 소통해야 함
- Nano banana는 텍스트·이미지 생성·세계 지식이 결합된 통합 모델 능력을 보여줌
결론
- 2025년 LLM은 예상보다 훨씬 똑똑하면서도 동시에 어리석은 존재로 드러남
- 현재 능력의 10%도 활용되지 않은 상태이며, 아이디어 실험의 여지가 매우 큼
-
빠른 진전과 많은 과제가 공존하는 시기이며, LLM 분야는 여전히 개방적 탐구 단계에 있음