Hitech logo

Искусственный интеллект

Сбер обновил GigaChat — у нейросети появилась масса новых возможностей

TODO:
Дарина Житова30 января, 16:33

Сбер представил обновление GigaChat: модели Pro и Lite стали точнее отвечать на вопросы благодаря расширенным наборам данных. Теперь нейросеть лучше разбирается в праве, медицине и экономике. Размер контекста увеличили в 2 раза — с 6 до 12 страниц А4. Кроме того, GigaChat уже обогнал GPT-3,5 по точности ответов не только на русском, но и на английском языке.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Разработчики сообщили, что тренировали GigaChat на увеличенных датасетах с акцентом на такие специальные темы, как медицина и юриспруденция. Модели также учились у реальных экспертов, в том числе у художников и редакторов, что помогло улучшить генеративный ИИ Kandinsky.

Контекст у моделей Pro и Lite вырос вдвое — с 4 до 8 тысяч токенов, которые можно использовать в одном запросе. Это примерно равно 12 страницам текста А4, заполненных 14 кеглем. Кроме того, для бизнеса стала доступна модель Lite+, у которой контекст увеличен до 32 тысяч токенов (48 страницы А4).

В Сбере говорят, что GigaChat Lite и Lite+ подойдут для выполнения простых задач, но с максимальной скоростью и без особых требований к ПК. Версия Pro может выполнить более трудные задания и понимает сложные инструкции.

Кроме того, теперь в GigaChat API можно создавать эмбеддинги. Это математические представления текстов, которые позволяют оценивать смысловую схожесть между ними. Они повышают точность ответов языковых моделей, так как они способны лучше понимать контекст и смысл. Кроме того, эмбеддинги облегчают поиск и классификацию информации, так как делают данные более удобными для обработки и анализа.

Ранее в этом месяце руководитель блока «Технологии» в Сбере Андрей Бельцов рассказал, что GigaChat превзошёл GPT-3,5 по точности ответов как на русском, так и на английском языках. Отечественная нейросеть успешно сдала специальный экзамен MMLU (Massive Multitask Language Understanding), которые включает 57 вопросов по истории, медицине, математике, логике, физике и другим дисциплинам.