Разработчики сообщили, что тренировали GigaChat на увеличенных датасетах с акцентом на такие специальные темы, как медицина и юриспруденция. Модели также учились у реальных экспертов, в том числе у художников и редакторов, что помогло улучшить генеративный ИИ Kandinsky.
Контекст у моделей Pro и Lite вырос вдвое — с 4 до 8 тысяч токенов, которые можно использовать в одном запросе. Это примерно равно 12 страницам текста А4, заполненных 14 кеглем. Кроме того, для бизнеса стала доступна модель Lite+, у которой контекст увеличен до 32 тысяч токенов (48 страницы А4).
В Сбере говорят, что GigaChat Lite и Lite+ подойдут для выполнения простых задач, но с максимальной скоростью и без особых требований к ПК. Версия Pro может выполнить более трудные задания и понимает сложные инструкции.
Кроме того, теперь в GigaChat API можно создавать эмбеддинги. Это математические представления текстов, которые позволяют оценивать смысловую схожесть между ними. Они повышают точность ответов языковых моделей, так как они способны лучше понимать контекст и смысл. Кроме того, эмбеддинги облегчают поиск и классификацию информации, так как делают данные более удобными для обработки и анализа.
Ранее в этом месяце руководитель блока «Технологии» в Сбере Андрей Бельцов рассказал, что GigaChat превзошёл GPT-3,5 по точности ответов как на русском, так и на английском языках. Отечественная нейросеть успешно сдала специальный экзамен MMLU (Massive Multitask Language Understanding), которые включает 57 вопросов по истории, медицине, математике, логике, физике и другим дисциплинам.