Kandinsky 4.0 Video предназначена для профессионалов из творческих индустрий. Художники, дизайнеры и режиссёры смогут использовать эту нейросеть для разработки трейлеров, рекламных роликов и анимаций. Также модель может стать помощником для обычных пользователей, которым нужно быстро создать короткий видеоролик, например, для личного поздравления.
В дополнение к основной версии была представлена ускоренная Kandinsky 4.0 Video Flash. Этот вариант генерирует видео с разрешением 720×480 пикселей за 15 секунд, что в несколько раз быстрее стандартной модели. На этапе тестирования доступ к этой версии получат представители креативных профессий через портал fusionbrain.ai. Широкий доступ для всех пользователей планируется открыть в первом квартале следующего года.
Разработка Kandinsky 4.0 Video опирается на передовые технологии генеративного ИИ, включая латентную диффузию и трансформеры. Модель использует латентные представления данных, что повышает её производительность. По словам команды Sber AI Research, при разработке они отказались от устаревших архитектур, сосредоточившись на более эффективных методах обработки данных.
Разработчики подчеркнули улучшенное визуальное качество Kandinsky 4.0. Повысились контрастность, чёткость кадров и реалистичность движения объектов. Это стало возможным благодаря использованию крупных обучающих датасетов и усовершенствованных методов обработки данных, включая оптимизацию по ключевым метрикам, таким как цветопередача и композиция.
Kandinsky 4.0 Video уже получила положительные отзывы от экспертов. Представители креативной индустрии отметили, что эта технология открывает новые горизонты для мультимедийного контента. Подробности о коммерческом запуске модели и её стоимости ожидаются в начале следующего года, что совпадёт с расширением платформы fusionbrain.ai.