Hitech logo

Кейсы

«Сбер» представил дообученный генератор изображений Kandinsky 3.1

TODO:
Дарина Житова5 апреля, 09:04

Сбербанк представил генеративный ИИ Kandinsky 3.1, который создаёт картинки с разным соотношением сторон по текстовым подсказкам на русском и английском языках. Модель обучали на расширенном наборе данных и изображений, что повысило качество результата. Ключевая особенность версии — высокая скорость генерации, в 10 раз превосходящая прежнюю.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Разрешение изображений можно повысить до 4К, что облегчит жизнь создателям контента — Kandinsky подходит как минимум для иллюстрации блогов. Появилась возможность улучшать текстовой запрос благодаря языковой модели. Как и в предыдущих версиях, в этой пользователи смогут создавать вариации изображений, смешивать картинки и текстовые запросы, создавать стикерпаки и вносить локальные изменения в результат, не меняя всей композиции (с помощью ControlNet).

Любопытные пользователи соцсетей уже протестировали новинку и выяснили, что в ней появилась возможность генерировать контент 18+. Речь идёт не о порнографических сценах, а об изображении наготы. Сам Сбербанк скромно умолчал о новой функции в пресс-релизе.

Подробнее о том, как новую модель обучали, можно прочитать в статье на Хабре.

Сейчас обновление доступно ограниченному кругу людей: дизайнерам, художникам и блогерам. Но в ближайшее время она станет открытой для всех пользователей. При этом Kandinsky 3.1 абсолютно бесплатна.

Сбер также анонсировал новую модель Kandinsky Video 1.1, которая позволяет генерировать видео по текстовым запросам. Команда разработчиков говорит, что качество генерации удалось значительно повысить благодаря улучшению архитектуры и увеличенного объёма обучающих наборов данных в парах «текст-видео». По сравнению с Kandinsky Video 1 разрешение увеличили в 2 раза.

Модель разработала команда Sber AI і сотрудничестве с учёными из Института искусственного интеллекта AIRI.