Gemini 3.5 Flash
1 week ago
11
- Gemini 3.5 Flash는 프런티어급 지능과 실행 능력을 결합한 첫 Gemini 3.5 모델로, 에이전트와 코딩의 장기 작업을 겨냥함
- Flash 시리즈의 속도를 유지하면서 Terminal-Bench 2.1 76.2%, GDPval-AA 1656 Elo 등에서 Gemini 3.1 Pro를 앞섬
- 출력 토큰 기준 초당 처리 속도가 다른 프런티어 모델보다 4배 빠르고, 비용도 많은 경우 절반 미만이라 장기 에이전트 작업에 유리함
- Antigravity와 AI Studio에서 앱 개발, 레거시 코드의 Next.js 전환, 논문 기반 게임 구현, UX 시안 생성 같은 다단계 작업을 수행함
- Gemini 앱과 Search AI Mode의 기본 모델로 제공되며, Gemini Spark와 기업 파트너 워크플로에도 적용되고 3.5 Pro는 다음 달 출시 예정임
Gemini 3.5 공개와 제공 범위
- Gemini 3.5는 프런티어급 지능과 실행 능력을 결합한 최신 모델 제품군으로, 더 유능한 에이전트를 만들기 위한 모델로 자리 잡음
- 첫 출시 모델은 3.5 Flash이며, 에이전트와 코딩에서 프런티어급 성능을 제공하고 실제 유용성이 있는 복잡한 장기 작업에 초점을 둠
- 3.5 Flash는 여러 Google 제품과 개발자 도구를 통해 제공됨
- Gemini 앱과 Google Search의 AI Mode를 통해 일반 사용자에게 제공됨
- Google Antigravity, Google AI Studio의 Gemini API, Android Studio를 통해 개발자가 사용할 수 있음
- Gemini Enterprise Agent Platform과 Gemini Enterprise를 통해 기업에 제공됨
- 3.5 Pro도 개발 중이며, 이미 내부에서 사용되고 있고 다음 달 출시 예정임
3.5 Flash의 성능
- 3.5 Flash는 Flash 시리즈의 속도를 유지하면서 여러 차원에서 대형 플래그십 모델과 경쟁하는 지능을 제공함
- Google의 가장 강력한 에이전트형 코딩 모델로, 어려운 코딩 및 에이전트 벤치마크에서 Gemini 3.1 Pro를 앞섬
- Terminal-Bench 2.1: 76.2%
- GDPval-AA: 1656 Elo
- MCP Atlas: 83.6%
- CharXiv Reasoning 멀티모달 이해: 84.2%
- 출력 토큰 기준 초당 처리 속도는 다른 프런티어 모델보다 4배 빠름
- Artificial Analysis 지표에서 상단 오른쪽 사분면에 위치해, 품질과 지연 시간 사이의 절충을 줄인 모델로 나타남
대규모 에이전트 작업
- 속도와 성능의 균형 덕분에 3.5 Flash는 장기 에이전트 작업에 적합함
- 개발자가 며칠, 감사자가 몇 주 걸리던 작업을 더 짧은 시간에 끝내도록 돕고, 다른 프런티어 모델 대비 절반 미만의 비용으로 가능한 경우가 많음
- 실제 문제 해결 과정에서 빠르게 계획하고, 만들고, 반복할 수 있음
- 새 애플리케이션 개발
- 코드베이스 유지보수
- 재무 문서 준비 지원
- 업데이트된 Antigravity 하네스(harness) 와 결합하면, 까다로운 사용 사례에서 협업형 하위 에이전트를 배포해 문제를 대규모로 처리하는 실행 엔진이 됨
- 감독하에 다단계 워크플로와 코딩 작업을 안정적으로 실행하면서 프런티어급 성능을 유지함
Antigravity와 AI Studio 활용 예시
- 3.5 Flash는 Antigravity에서 동적 기준에 따라 구조화되지 않은 자산을 자동으로 이름 변경하고 분류하는 다단계 워크플로를 실행함
- Antigravity에서 두 개의 에이전트를 사용해 AlphaZero 논문을 종합하고, 6시간 안에 완전히 플레이 가능한 게임을 코딩함
- Antigravity 하네스로 복잡한 레거시 코드베이스를 Next.js로 변환함
- Antigravity에서 하위 에이전트를 사용해 새로운 도시 경관을 생성하고, 빌더와 플레이어 두 에이전트의 빠른 자기 개선 루프로 게임을 개발함
- Gemini 3의 강한 멀티모달 기반 위에서 3.5 Flash는 더 풍부하고 상호작용적인 웹 UI와 그래픽을 생성함
- AI Studio에서 AI 연구 논문을 위한 상호작용형 애니메이션을 생성함
- AI Studio에서 일반 텍스트 설명을 상호작용형 하드웨어로 변환함
- AI Studio에서 학교 모금 행사를 위한 전체 브랜딩 콘셉트를 만들기 위해 여러 콘셉트를 병렬 실행함
- AI Studio에서 체크아웃 흐름을 위한 서로 다른 UX 접근 방식을 60초 만에 생성함
기업과 개발자 활용
- 3.5 Flash의 에이전트 능력은 개발자와 기업 워크플로에서 이미 활용되고 있음
- Gemini 3.5 모델 제품군 개발 과정에서 산업 파트너와 함께 반복 업무와 복잡성이 발생하는 지점을 파악함
- 파트너들은 은행과 핀테크의 여러 주짜리 워크플로 자동화부터 복잡한 데이터 환경에서 데이터 과학 팀이 인사이트를 찾는 작업까지 효과를 확인하고 있음
-
Shopify
- 하위 에이전트를 병렬 실행해 장기적으로 복잡한 데이터를 분석하고, 전 세계 규모에서 더 정확한 상인 성장 예측을 수행함
-
Macquarie Bank
- 100페이지가 넘는 복잡한 문서를 추론하고, 관련 정보를 검색하며, 낮은 지연 시간으로 신뢰할 수 있는 추천을 만들어 고객 온보딩을 가속하는 방식을 파일럿 중임
-
Salesforce
- 3.5 Flash를 Agentforce에 통합해, 문맥을 유지하고 복잡한 다중 턴 도구 호출을 실행하는 여러 하위 에이전트로 복잡한 기업 작업을 자동화함
-
Ramp
- 복잡한 인보이스의 멀티모달 이해와 과거 패턴에 대한 추론을 결합해 더 똑똑하고 신뢰할 수 있는 OCR을 지원함
-
Xero
- 공급업체 식별과 1099 세금 양식용 정보 수집처럼 여러 주에 걸친 복잡한 워크플로를 에이전트가 자율적으로 관리하게 해, 소기업의 반복적인 관리 작업 자동화를 가능하게 함
-
Databricks
- 에이전트형 워크플로를 사용해 실시간 정보를 모니터링하고 검색하며, 대규모 데이터셋 전반에서 추론해 문제를 진단하고 수정 사항과 해결책을 제안함
개인 AI 에이전트와 Search 적용
- 3.5 Flash는 전 세계 Gemini 앱과 Search의 AI Mode에서 기본 모델이 됨
- Google I/O에서 3.5 Flash의 에이전트 기능을 일상생활에 적용하는 새 기능들이 공개됨
- Gemini Spark는 3.5 Flash를 사용하는 개인 AI 에이전트임
- 24시간 내내 실행됨
- 사용자의 지시에 따라 디지털 생활을 탐색하고 사용자를 대신해 행동함
- 신뢰할 수 있는 테스터에게 오늘부터 출시되기 시작함
- 미국의 Google AI Ultra 구독자에게 다음 주 베타로 제공될 예정임
- 3.5 Flash의 향상된 에이전트형 코딩 능력은 Search 전반에서 더 지능적인 경험을 제공함
- 사용자를 위해 24시간 작동하는 새로운 정보 에이전트를 도입함
- 더 동적인 생성형 UI 경험을 가능하게 함
- Search는 3.5 Flash를 활용해 Gyroid 패턴을 설명하는 상호작용형 시각 자료를 생성함
안전장치
- Gemini 3.5는 Frontier Safety Framework에 따라 개발됨
- 사이버 및 CBRN 안전장치가 강화되어, 유해 콘텐츠를 생성할 가능성과 안전한 질의에 잘못 답변을 거부할 가능성이 낮아짐
- 새롭고 더 고도화된 안전 학습과 완화 기법이 적용됨
- 응답을 제공하기 전에 AI의 내부 추론을 점검하고 이해하는 데 도움이 되는 해석 가능성 도구가 포함됨
-
Homepage
-
개발자
- Gemini 3.5 Flash