-
Project Genie는 사용자가 텍스트와 이미지를 이용해 상호작용 가능한 가상 세계를 생성·탐험·리믹스할 수 있는 실험적 연구 프로토타입임
- 이 시스템은 Genie 3 모델을 기반으로 하며, 사용자의 움직임에 따라 실시간으로 경로와 환경을 생성함
- 웹앱 형태로 제공되며, Nano Banana Pro와 Gemini 모델이 통합되어 세계 스케치, 탐험, 리믹스 기능을 지원함
- 생성된 세계의 현실감 부족, 캐릭터 제어 지연, 60초 제한 등 초기 버전의 제약이 명시됨
- 현재 미국 내 Google AI Ultra 구독자(18세 이상) 에게 제공되며, 향후 더 많은 지역으로 확장 예정임
Project Genie 개요
-
Project Genie는 Google DeepMind가 개발한 Genie 3 기반의 실험적 연구 프로토타입으로, 사용자가 직접 가상 세계를 만들고 탐험하며 리믹스할 수 있는 환경 제공
- 미국 내 Google AI Ultra 구독자(18세 이상) 가 이용 가능
- 사용자는 텍스트 프롬프트와 이미지를 통해 세계를 생성하고, 실시간으로 탐험 가능
- 이 프로젝트는 몰입형 세계 생성 기술을 일반 사용자에게 공개하는 첫 단계로, 세계 모델(world model) 연구의 확장판임
세계 모델(World Model)의 발전
- 세계 모델은 환경의 동적 변화를 시뮬레이션하고, 행동이 미치는 영향을 예측하는 시스템임
- Google DeepMind는 체스나 바둑 같은 특정 환경용 에이전트 연구를 넘어, 현실 세계의 다양성을 탐색할 수 있는 AGI 시스템 개발을 목표로 함
-
Genie 3는 사용자의 이동에 따라 실시간으로 경로를 생성하며, 물리적 상호작용을 시뮬레이션함
- 정적 3D 스냅샷이 아닌 동적 세계 생성을 지원
- 로보틱스, 애니메이션, 픽션, 역사적 장소 탐험 등 다양한 시나리오에 활용 가능
Project Genie의 작동 방식
-
웹 기반 프로토타입으로, Genie 3 외에도 Nano Banana Pro와 Gemini 모델이 통합되어 있음
- 세 가지 핵심 기능으로 구성됨
1. World Sketching (세계 스케치)
- 텍스트와 이미지(생성 또는 업로드)를 이용해 살아 있는 환경을 설계
- 캐릭터와 탐험 방식을 정의할 수 있으며, 보행·비행·운전 등 다양한 이동 형태 지원
-
Nano Banana Pro 통합으로 세계의 미리보기와 세부 조정 가능
- 1인칭 또는 3인칭 시점 선택 가능
2. World Exploration (세계 탐험)
- 생성된 세계는 탐험 가능한 환경으로, 사용자의 행동에 따라 실시간으로 경로가 생성됨
- 탐험 중 카메라 시점 조정 가능
3. World Remixing (세계 리믹스)
- 기존 세계의 프롬프트를 기반으로 새로운 해석의 세계를 재구성 가능
-
갤러리나 랜덤 탐색 기능을 통해 다른 사용자의 세계를 탐험하거나 수정 가능
- 완성된 세계와 탐험 과정을 영상으로 다운로드 가능
책임 있는 AI 구축
- Project Genie는 Google Labs 내에서 진행되는 실험적 연구 프로토타입으로, 책임 있는 AI 개발 원칙에 따라 운영
- 현재 모델의 한계로 다음과 같은 제약이 명시됨
- 생성된 세계가 현실과 다르거나 프롬프트·물리 법칙과 불일치할 수 있음
-
캐릭터 제어 지연 또는 반응성 저하 발생 가능
-
생성 시간 60초 제한 존재
- 2025년 8월 발표된 프롬프트 기반 이벤트 변화 기능은 아직 포함되지 않음
- 향후 업데이트와 개선 사항은 DeepMind 공식 페이지에서 확인 가능
향후 계획과 접근성 확대
- Project Genie는 신뢰할 수 있는 테스터들과의 협업 연구를 기반으로 개발됨
- 이번 공개는 사용자들이 세계 모델을 실제로 어떻게 활용하는지 이해하기 위한 단계
- 현재는 미국 내 Google AI Ultra 구독자에게만 제공되며, 추후 더 많은 지역으로 확대 예정
- Google은 장기적으로 세계 생성 기술을 더 많은 사용자에게 개방할 계획임