Wan2.7-Video объединяет четыре специализированные модели: Wan2.7-t2v для преобразования текста в видео, Wan2.7-i2v для работы с изображениями, Wan2.7-r2v для преобразования эталонных изображений и Wan2.7-videoedit для редактирования видео. Система поддерживает текстовые, графические, видео- и аудиовходы. Это обеспечивает согласованность сцен и логичность повествования.
Модель поддерживает видео продолжительностью от 2 до 15 секунд с выводом в 720p и 1080p, а корпоративные API позволяют автоматизировать пакетную обработку и интегрировать решение в существующие рабочие процессы. Одной из особенностей стала возможность управлять действиями персонажей, диалогами, стилем съемки, освещением и камерой через простые инструкции на естественном языке.
Wan2.7-Video автоматически синхронизирует движения губ с диалогами, сохраняет уникальные голосовые тембры и обеспечивает согласованность визуальных образов для пяти персонажей одновременно. Модель поддерживает более 50 эмоций и тысячи комбинаций стилей, что позволяет создавать реалистичные и драматичные сцены без необходимости ручного монтажа.
Интеллектуальный механизм построения сюжета преобразует простые входные данные в сложные многоплановые нарративы, включающие съемку с дронов, 360-градусные кадры и контекстно-зависимое освещение. Пользователи могут задавать конечные кадры, а система обеспечит плавное продолжение видео без резких переходов.
Ранее Alibaba выпустила Wan2.7-Image — инструмент для генерации изображений с высокой точностью цветопередачи, глубокой персонализацией персонажей и улучшенным рендерингом текста. Обе модели интегрированы в Model Studio от Alibaba Cloud, доступны на официальном сайте Wan и в приложении Qwen.

