Hitech logo

Кейсы

DeepSeek усилила «мышление» ИИ с помощью нового подхода

TODO:
Екатерина Шемякинская7 апреля, 09:53

Китайский стартап представил новый метод обучения больших языковых моделей, который улучшает их способности к рассуждению. Комбинируя генеративное моделирование вознаграждений (GRM) и самообучающуюся систему критической настройки, исследователи добились более точных и логичных ответов ИИ на общие и сложные запросы. На фоне слухов о скором релизе DeepSeek-R2 компания продолжает развивать собственные технологии и открывать исходный код.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

В сотрудничестве с исследователями из Университета Цинхуа компания DeepSeek разработала новую методику, сочетающую генеративное моделирование вознаграждений (Generative Reward Modeling, GRM) и самообучающуюся систему критической настройки (self-principled critique tuning). Этот двойной подход позволяет большим языковым моделям быстрее и точнее отвечать на общие запросы.

Полученные GRM-модели превзошли существующие методы. Исследователи отметили, что они «показали конкурентоспособные результаты» в сравнении с ведущими публичными моделями вознаграждения. Моделирование вознаграждений помогает языковым моделям лучше соответствовать человеческим предпочтениям. DeepSeek планирует сделать GRM-модели открытыми, но не называет конкретных сроков.

Научная работа была опубликована в период активного обсуждения дальнейших шагов DeepSeek. По данным Reuters, следующая версия, DeepSeek-R2, может быть выпущена уже в этом месяце. Ее предшественник, DeepSeek-R1, произвел сильное впечатление на технологическое сообщество, поскольку продемонстрировал производительность, сопоставимую с ведущими аналогами, при меньшей стоимости.

DeepSeek не комментирует слухи о скором выпуске модели R2. Хотя официальных заявлений по этому поводу не поступало, в прошлом месяце китайские СМИ сообщили, что служба поддержки компании опровергла данную информацию в чате с корпоративными клиентами.

DeepSeek базируется в Ханчжоу. Ее основал предприниматель Лян Вэньфэн в 2023 году. Хотя последние несколько месяцев компания находится в центре международного внимания, она редко выступает с публичными заявлениями. Основные силы команда сосредоточила на исследованиях и разработках. В прошлом месяце компания выпустила обновленную версию своей модели V3. В DeepSeek-V3-0324 улучшены логические способности системы, оптимизированы функции веб-разработки и расширены возможности обработки китайского языка. В феврале компания открыла исходный код пяти своих репозиториев.

Лян также основал High-Flyer Quant — материнскую компанию DeepSeek. Её большие финансовые ресурсы помогают стартапу развивать технологии. В конце февраля Лян участвовал в конференции с предпринимателями в Пекине, организованной председателем КНР Си Цзиньпином. Там DeepSeek называли примером устойчивости страны к попыткам США замедлить развитие китайского ИИ.