Архитектура сервиса GigaChat основана на нейросетевом ансамбле модели NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающей различные нейросетевые модели и метод supervised fine-tuning, reinforcement learning with human feedback. За счет этого новая нейросеть Сбера решает много интеллектуальных задач: поддерживает беседу, пишет тексты, отвечает на вопросы. Включение в ансамбль модели Kandinsky 2.1 позволяет нейросети создавать изображения.
Входящую в состав NeONKA ru-GPT 3.5 с 13 миллиардами параметров планируется выложить в открытый доступ, чтобы развивать open-source-сообщества и технологии в области искусственного интеллекта. В будущем GigaChat также будет доступен для использования через облачное API. По словам главы Сбербанка Германа Грефа, GigaChat уникален открытостью архитектуры, в то время как мировые аналоги модели придерживаются курса Closed AI.
Модель уже активно внедряется в продукты и сервисы Сбера. Одним из первых возможности новой модели получит виртуальный ассистент Салют. Первая версия модели NeONKA была оптимизирована по размеру и скорости для применения в высоконагруженных сервисах. Новая нейросеть подойдёт для работы СМИ, редакторов, программистов, педагогов, студентов, маркетологов и представителей других профессий, утверждает Сбер.
Пока модель работает в режиме закрытой бета-версии. Чтобы протестировать нейросеть, нужно вступить в закрытое сообщество в телеграм-канале.
В разработке модели участвуют команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов, которые передают GigaChat различные предметные знания. Обучение нейросети происходило на суперкомпьютере Christofari Neo. В GigaChat применяются решения, призванные исключить использование генеративных моделей, противоречащее Кодексу этики в сфере искусственного интеллекта. Сообщается, что разработчики будут улучшать возможности нейросети, уделяя особое внимание этике и безопасности модели.