Александр Ведяхин, первый заместитель председателя правления Сбербанка, объявил об этом на международной промышленной выставке «ИННОПРОМ. Центральная Азия». Он отметил, что новая версия позволяет каждому человеку раскрыть свой творческий потенциал и является эффективным инструментом для профессионалов в креативной индустрии.
Kandinsky 3.1 удивляет своей реалистичностью, креативностью и яркостью изображений. Новая функция «бьютификации» значительно упрощает процесс создания изображений. Теперь для формирования запроса достаточно всего несколько слов — остальное выполнит встроенная языковая модель GigaChat Pro, которая расширяет и обогащает запрос деталями.
Дополнительно, благодаря использованию качественного набора данных и новым методам обучения, улучшилась функция Inpainting, которая позволяет редактировать отдельные части изображения. Время генерации картинок сократилось более чем в десять раз благодаря введению модели Kandinsky 3.1 Flash, доступной через основной Telegram-бот.
Платформа fusionbrain.ai и мобильное приложение Сбербанк Онлайн также поддерживают эту технологию, а в скором времени пользователи получат доступ к новым функциям. Среди них — создание изображений в 4K, смешивание картинок и текстов, генерация стикерпаков и возможность вносить локальные изменения без редактирования всей композиции сцены (ControlNet). Также будет доступна обновленная версия модели генерации видео по тексту Kandinsky Video 1.1.
Модель Kandinsky 3.1 разработана командой Sber AI при поддержке ученых из Института искусственного интеллекта AIRI, используя объединенные наборы данных Sber AI и SberDevices.