Gemini 3.5 Flash

1 week ago 11

Gemini 3.5 Flash는 프런티어급 지능과 실행 능력을 결합한 첫 Gemini 3.5 모델로, 에이전트와 코딩의 장기 작업을 겨냥함
Flash 시리즈의 속도를 유지하면서 Terminal-Bench 2.1 76.2%, GDPval-AA 1656 Elo 등에서 Gemini 3.1 Pro를 앞섬
출력 토큰 기준 초당 처리 속도가 다른 프런티어 모델보다 4배 빠르고, 비용도 많은 경우 절반 미만이라 장기 에이전트 작업에 유리함
Antigravity와 AI Studio에서 앱 개발, 레거시 코드의 Next.js 전환, 논문 기반 게임 구현, UX 시안 생성 같은 다단계 작업을 수행함
Gemini 앱과 Search AI Mode의 기본 모델로 제공되며, Gemini Spark와 기업 파트너 워크플로에도 적용되고 3.5 Pro는 다음 달 출시 예정임

Gemini 3.5 공개와 제공 범위

Gemini 3.5는 프런티어급 지능과 실행 능력을 결합한 최신 모델 제품군으로, 더 유능한 에이전트를 만들기 위한 모델로 자리 잡음
첫 출시 모델은 3.5 Flash이며, 에이전트와 코딩에서 프런티어급 성능을 제공하고 실제 유용성이 있는 복잡한 장기 작업에 초점을 둠
3.5 Flash는 여러 Google 제품과 개발자 도구를 통해 제공됨
- Gemini 앱과 Google Search의 AI Mode를 통해 일반 사용자에게 제공됨
- Google Antigravity, Google AI Studio의 Gemini API, Android Studio를 통해 개발자가 사용할 수 있음
- Gemini Enterprise Agent Platform과 Gemini Enterprise를 통해 기업에 제공됨
3.5 Pro도 개발 중이며, 이미 내부에서 사용되고 있고 다음 달 출시 예정임

3.5 Flash의 성능

3.5 Flash는 Flash 시리즈의 속도를 유지하면서 여러 차원에서 대형 플래그십 모델과 경쟁하는 지능을 제공함
Google의 가장 강력한 에이전트형 코딩 모델로, 어려운 코딩 및 에이전트 벤치마크에서 Gemini 3.1 Pro를 앞섬
- Terminal-Bench 2.1: 76.2%
- GDPval-AA: 1656 Elo
- MCP Atlas: 83.6%
- CharXiv Reasoning 멀티모달 이해: 84.2%
출력 토큰 기준 초당 처리 속도는 다른 프런티어 모델보다 4배 빠름
Artificial Analysis 지표에서 상단 오른쪽 사분면에 위치해, 품질과 지연 시간 사이의 절충을 줄인 모델로 나타남

대규모 에이전트 작업

속도와 성능의 균형 덕분에 3.5 Flash는 장기 에이전트 작업에 적합함
개발자가 며칠, 감사자가 몇 주 걸리던 작업을 더 짧은 시간에 끝내도록 돕고, 다른 프런티어 모델 대비 절반 미만의 비용으로 가능한 경우가 많음
실제 문제 해결 과정에서 빠르게 계획하고, 만들고, 반복할 수 있음
- 새 애플리케이션 개발
- 코드베이스 유지보수
- 재무 문서 준비 지원
업데이트된 Antigravity 하네스(harness) 와 결합하면, 까다로운 사용 사례에서 협업형 하위 에이전트를 배포해 문제를 대규모로 처리하는 실행 엔진이 됨
감독하에 다단계 워크플로와 코딩 작업을 안정적으로 실행하면서 프런티어급 성능을 유지함

Antigravity와 AI Studio 활용 예시

3.5 Flash는 Antigravity에서 동적 기준에 따라 구조화되지 않은 자산을 자동으로 이름 변경하고 분류하는 다단계 워크플로를 실행함
Antigravity에서 두 개의 에이전트를 사용해 AlphaZero 논문을 종합하고, 6시간 안에 완전히 플레이 가능한 게임을 코딩함
Antigravity 하네스로 복잡한 레거시 코드베이스를 Next.js로 변환함
Antigravity에서 하위 에이전트를 사용해 새로운 도시 경관을 생성하고, 빌더와 플레이어 두 에이전트의 빠른 자기 개선 루프로 게임을 개발함
Gemini 3의 강한 멀티모달 기반 위에서 3.5 Flash는 더 풍부하고 상호작용적인 웹 UI와 그래픽을 생성함
- AI Studio에서 AI 연구 논문을 위한 상호작용형 애니메이션을 생성함
- AI Studio에서 일반 텍스트 설명을 상호작용형 하드웨어로 변환함
- AI Studio에서 학교 모금 행사를 위한 전체 브랜딩 콘셉트를 만들기 위해 여러 콘셉트를 병렬 실행함
- AI Studio에서 체크아웃 흐름을 위한 서로 다른 UX 접근 방식을 60초 만에 생성함

기업과 개발자 활용

3.5 Flash의 에이전트 능력은 개발자와 기업 워크플로에서 이미 활용되고 있음
Gemini 3.5 모델 제품군 개발 과정에서 산업 파트너와 함께 반복 업무와 복잡성이 발생하는 지점을 파악함
파트너들은 은행과 핀테크의 여러 주짜리 워크플로 자동화부터 복잡한 데이터 환경에서 데이터 과학 팀이 인사이트를 찾는 작업까지 효과를 확인하고 있음
Shopify
- 하위 에이전트를 병렬 실행해 장기적으로 복잡한 데이터를 분석하고, 전 세계 규모에서 더 정확한 상인 성장 예측을 수행함
Macquarie Bank
- 100페이지가 넘는 복잡한 문서를 추론하고, 관련 정보를 검색하며, 낮은 지연 시간으로 신뢰할 수 있는 추천을 만들어 고객 온보딩을 가속하는 방식을 파일럿 중임
Salesforce
- 3.5 Flash를 Agentforce에 통합해, 문맥을 유지하고 복잡한 다중 턴 도구 호출을 실행하는 여러 하위 에이전트로 복잡한 기업 작업을 자동화함
Ramp
- 복잡한 인보이스의 멀티모달 이해와 과거 패턴에 대한 추론을 결합해 더 똑똑하고 신뢰할 수 있는 OCR을 지원함
Xero
- 공급업체 식별과 1099 세금 양식용 정보 수집처럼 여러 주에 걸친 복잡한 워크플로를 에이전트가 자율적으로 관리하게 해, 소기업의 반복적인 관리 작업 자동화를 가능하게 함
Databricks
- 에이전트형 워크플로를 사용해 실시간 정보를 모니터링하고 검색하며, 대규모 데이터셋 전반에서 추론해 문제를 진단하고 수정 사항과 해결책을 제안함

개인 AI 에이전트와 Search 적용

3.5 Flash는 전 세계 Gemini 앱과 Search의 AI Mode에서 기본 모델이 됨
Google I/O에서 3.5 Flash의 에이전트 기능을 일상생활에 적용하는 새 기능들이 공개됨
Gemini Spark는 3.5 Flash를 사용하는 개인 AI 에이전트임
- 24시간 내내 실행됨
- 사용자의 지시에 따라 디지털 생활을 탐색하고 사용자를 대신해 행동함
- 신뢰할 수 있는 테스터에게 오늘부터 출시되기 시작함
- 미국의 Google AI Ultra 구독자에게 다음 주 베타로 제공될 예정임
3.5 Flash의 향상된 에이전트형 코딩 능력은 Search 전반에서 더 지능적인 경험을 제공함
- 사용자를 위해 24시간 작동하는 새로운 정보 에이전트를 도입함
- 더 동적인 생성형 UI 경험을 가능하게 함
- Search는 3.5 Flash를 활용해 Gyroid 패턴을 설명하는 상호작용형 시각 자료를 생성함