알리바바, AI 비주얼 생성 모델 'Wan 2.6' 시리즈 공개

1 month ago 12

알리바바 클라우드가 인공지능(AI) 비주얼 생성 모델 최신 버전 'Wan 2.6' 시리즈를 17일 공개했다.

Wan 2.6은 크리에이터가 본인 모습과 목소리를 그대로 반영해 AI 생성 영상에 직접 등장하고, 다중 장면을 활용한 유연한 스토리텔링이 가능하도록 지원한다. 다중 인물 간 대화 표현을 고도화하고 영상 재생 시간을 확장, 완성도 있는 콘텐츠 제작 역량과 전문성 강화를 목표로 했다.

새로운 참조 기반 영상 생성 모델을 비롯해 기존 4개 모델 전반에 대한 종합 업그레이드가 적용됐다. 특히 Wan2.6-R2V(Reference to Video)는 사용자가 외모와 목소리가 포함된 캐릭터 참조 영상을 업로드하고 텍스트 프롬프트를 입력하면 동일한 캐릭터가 등장하는 새로운 장면을 생성할 수 있다.

단일 인물과 동물이나 사물 등 복수의 주체를 동시에 포함한 영상 제작도 가능하다. 원본 참조 영상의 고유한 시각적 특징과 음성을 일관되게 유지한다. 멀티모달 참조 생성 기술을 기반으로 개발된 중국 AI 최초 참조 기반 영상 생성 모델이다.

또 텍스트-영상 생성 모델(Wan2.6-T2V), 이미지-영상 생성 모델(Wan2.6-I2V), 이미지 생성 모델(Wan2.6-image·Wan2.6-T2I) 등 기존 4개 모델에 대한 전반적인 성능을 개선했다.

지능형 멀티샷 스토리텔링 기능으로 영상 전반에 걸쳐 시각적 일관성을 유지하면서도 보다 풍부하고 표현력 있는 서사 구현을 지원한다. 오디오·시각 동기화와 오디오 기반 영상 생성 역량도 강화했다.

Wan2.6 시리즈는 최대 15초 길이의 영상 출력을 지원, 크리에이터가 스토리를 보다 확장된 구조로 설계하고 전개할 수 있는 여지를 제공한다. 영화 스타일의 전문가 수준 영상 콘텐츠 제작이 가능하다는 게 알리바바 설명이다. 향후 알리바바 대표 AI 서비스 '큐원'에도 통합될 예정이다.

박종진 기자 truth@etnews.com

Read Entire Article