- 2025년은 추론(reasoning) , 에이전트, 코딩 자동화, 중국 오픈웨이트 모델 부상, AI 보안 논의 등 대형 언어모델(LLM) 생태계의 급격한 전환이 이어진 해로 기록됨
- OpenAI의 RLVR 기반 추론형 모델(o1~o4) 이 확산되며, 주요 연구소들이 모두 유사한 기능을 탑재한 모델을 출시
- Anthropic의 Claude Code를 비롯한 코딩 에이전트가 등장해 개발자 워크플로우를 자동화하고, CLI 기반 LLM 사용이 주류로 부상
-
중국 AI 연구소들이 GLM-4.7, DeepSeek V3.2 등으로 오픈웨이트 모델 순위를 장악하며 글로벌 경쟁 구도 변화
-
보안·윤리·환경 문제와 함께, LLM의 실용화·대중화가 본격화된 한 해로 평가됨
추론(reasoning)의 해
- OpenAI가 2024년 o1·o1-mini로 시작한 RLVR(Reinforcement Learning from Verifiable Rewards) 접근이 2025년 o3·o4-mini로 확장
- 수학·코드 퍼즐 등 검증 가능한 환경에서 보상 학습을 수행해 인간 수준의 문제 분해 및 추론 전략을 학습
- 주요 연구소들이 모두 추론형 모델을 출시, 일부는 reasoning 모드와 일반 모드를 전환 가능
- 추론 모델은 도구 사용 능력과 결합해 다단계 작업을 계획·수행·결과 분석까지 가능
- GPT-5 Thinking 등으로 AI 기반 검색이 실용화되었으며, 복잡한 연구 질의에도 대응 가능
- 코드 생성·디버깅에서도 뛰어난 성능을 보여, 복잡한 코드베이스의 오류 원인 추적이 가능
에이전트의 해
- 2024년까지 실현되지 않았던 LLM 에이전트가 2025년 본격 등장
- 도구 호출을 반복하며 목표를 달성하는 시스템으로 정의
- 대표적 활용은 코딩과 리서치 분야
- GPT-5 Thinking과 Google의 AI Mode가 기존 Deep Research 패턴을 대체
- 인간 대체형 AI 비서는 등장하지 않았지만, 다단계 자동화 작업 수행형 에이전트는 실용화
코딩 에이전트와 Claude Code의 해
- 2025년 2월 Anthropic의 Claude Code 조용한 출시가 가장 큰 사건으로 평가
- 코드 작성·실행·결과 분석·반복 수행이 가능한 코딩 에이전트의 대표 사례
- OpenAI Codex CLI, Google Gemini CLI, Qwen Code, Mistral Vibe 등 주요 연구소가 CLI 코딩 에이전트 출시
-
비동기형 코딩 에이전트(Claude Code for web, Codex web, Google Jules)는 작업 후 자동으로 Pull Request를 제출
- 보안상 이점과 병렬 작업 효율로 개발자 생산성 향상
- Anthropic의 Claude Code는 연간 10억 달러 매출 규모에 도달
YOLO 모드와 보안 리스크
- 코딩 에이전트의 기본 설정은 사용자 승인 요청이지만, YOLO 모드(--yolo)로 자동 실행 가능
- Reddit 사례처럼 홈 디렉터리 삭제 등 위험 존재
- 보안 연구자 Johann Rehberger는 이를 “일탈의 정상화(Normalization of Deviance)” 로 지적
- 반복된 무사고가 위험 행위를 정상으로 인식하게 만드는 현상
월 200달러 구독 시대
- OpenAI ChatGPT Plus의 20달러 요금제 이후, Claude Pro Max 20x(200달러) , ChatGPT Pro(200달러) , Gemini Ultra(249달러) 등 고가 요금제 확산
- 코딩 에이전트 사용 시 토큰 소비량이 커, 정액제 구독이 경제적 선택으로 자리
중국 오픈웨이트 모델의 부상
- DeepSeek, Qwen, GLM, MiniMax 등 중국 연구소 모델이 상위권 점령
- GLM-4.7, Kimi K2 Thinking, DeepSeek V3.2 등이 OpenAI gpt-oss-120B를 앞섬
- DeepSeek 3·R1 공개 후 NVIDIA 시가총액 5,930억 달러 하락 사태 발생
- 대부분 Apache 2.0 또는 MIT 라이선스로 공개, 효율적 학습·추론 연구에 기여
장시간 작업 수행 능력 향상
- METR 연구에 따르면 AI의 독립적 작업 지속 시간은 7개월마다 2배 증가
- GPT-5, Claude Opus 4.5 등은 인간 5시간 작업에 해당하는 과제 수행 가능
프롬프트 기반 이미지 편집의 해
- 2025년 3월 ChatGPT에 이미지 업로드·수정 기능 추가, 일주일 만에 1억 명 가입
- OpenAI의 gpt-image-1 시리즈와 Qwen-Image-Edit, Google의 Nano Banana Pro가 주요 모델
- Nano Banana Pro는 텍스트 포함 인포그래픽 생성 가능
학문 대회에서 모델이 금메달 획득
- OpenAI와 Google Gemini 모델이 국제수학올림피아드(IMO) 및 국제대학생프로그래밍대회(ICPC) 에서 금메달 수준 성과 달성
Llama의 부진과 OpenAI의 리더십 약화
- Meta의 Llama 4는 과도한 모델 크기로 실망감 초래, Llama 3.1이 여전히 인기
- OpenAI는 여전히 강력하지만, 이미지·코드·오픈웨이트·오디오 분야에서 경쟁사 추격 심화
- 12월 Gemini 3 등장 후 OpenAI가 “Code Red” 를 선언
Gemini의 해
- Google은 Gemini 2.0~3.0을 연속 출시, 멀티모달 입력 100만 토큰 이상 지원
- 자체 TPU 하드웨어로 학습·추론 효율 확보
- Gemini CLI, Jules, Nano Banana, Veo 3 등 다양한 제품군 확장
기타 주요 트렌드
-
Pelican riding a bicycle 밈이 LLM 성능 벤치마크로 확산
- 개인 프로젝트 사이트에서 110개 AI 도구 제작, LLM 활용 개발 실험 지속
-
Claude 4의 ‘스니치’ 행동이 화제, 모델의 윤리적 판단 논란
-
Vibe coding이 새로운 프로토타이핑 방식으로 확산
-
MCP(Model Context Protocol) 은 일시적 유행 후 Claude Skills로 대체
-
AI 내장 브라우저(ChatGPT Atlas, Claude in Chrome, Gemini in Chrome) 의 보안 우려 제기
-
Prompt injection 공격의 심각성을 강조하며 “** Lethal Trifecta**” 용어 제안
-
모바일 코딩과 컨포먼스 테스트가 개발 효율을 높이는 핵심 요소로 부상
-
로컬 모델 성능 향상에도 불구하고, 클라우드 모델이 여전히 우위 유지
-
Slop(저품질 AI 콘텐츠) 이 Merriam-Webster 올해의 단어로 선정
-
데이터센터 반대 여론 확산, 에너지·탄소·소음 문제 부각
2025년 신조어 정리
-
Vibe coding, Vibe engineering, Lethal trifecta, Context rot, Context engineering, Slopsquatting, Asynchronous coding agent, Extractive contributions 등이 주요 신조어로 기록
결론
- 2025년은 LLM의 실용화·자동화·대중화가 동시에 진전된 해로,
추론형 모델·코딩 에이전트·중국 오픈웨이트 모델이 기술적 전환점을 이룸
- 동시에 보안·윤리·환경 문제가 부상하며, AI 산업의 지속 가능성 논의가 본격화됨