Hitech logo

Искусственный интеллект

Новый метод обучения создает агентов ИИ при помощи всего 78 примеров

TODO:
Георгий ГоловановСегодня, 09:53 AM

Новое исследование китайских ученых показывает, что обучение больших языковых моделей (БЯМ) выполнению сложных автономных задач не обязательно требует огромных наборов данных. На основе аналогичных работ в других областях изучения БЯМ они разработали фреймворк, показывающий, что «машинная автономность возникает не из-за обилия данных, а благодаря стратегическому отбору высококачественных примеров для агентов». Другими словами, важно качество, а не количество данных.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Современные системы обучения предполагают, что чем более высокий уровень интеллекта требуется для агента ИИ, тем больший объем данных нужен для его обучения. Исследователи утверждают, что такой подход приводит к все более сложным процессам обучения и значительным затратам ресурсов. Более того, во многих областях данные ограничены, их трудно получить, а их сбор очень дорог.

Однако исследования в других областях показывают, что это не обязательно так, пишет Venture Beat. Например, в статье 2023 года было показано, что модель может быть эффективной, даже если ее обучили всего на 1000 тщательно подобранных примерах. Фреймворк LIMI (Less Is More for Intelligent Agency, «больше значит меньше для интеллектуальных агентов»), разработанный командой, использует тот же принцип.

В ходе экспериментов исследователи установили, что, имея небольшой, но тщательно подобранный набор данных, состоящий всего из 78 примеров, они могут получить БЯМ, которые значительно превзойдут по ключевым отраслевым показателям модели, обученные на тысячах примеров.

Ключевым элементом фреймворка является конвейер для сбора высококачественных примеров агентных задач. Каждый пример состоит из двух частей: запроса и траектории. Запрос — это запрос пользователя на естественном языке, например, требование к разработке программного обеспечения или цель научного исследования. Траектория — это последовательность шагов ИИ для выполнения запроса, включая внутренние рассуждения, запросы на использование внешних инструментов и наблюдения за окружающей средой. Траектория может включать несколько итераций планирования, выполнения и рефлексии, пока не будет достигнута желаемая цель.

«Этот подход гарантирует, что наши модели учатся не только на успешных результатах, но и на всем процессе решения проблем, включая то, как адаптировать стратегии и восстанавливаться после сбоев в ходе совместного выполнения», — написали исследователи.

Изложенный в исследовании подход может пригодиться для создания приложений, в ситуации, когда данных мало или их сбор требует больших затрат.

Новая технология Memp, разработанная китайскими учеными, наделяет агентов Больших языковых моделей (БЯМ) динамической памятью, что делает их более результативными в решении сложных задач. Такая «процедурная память» постоянно обновляется по мере накопления опыта, подобно тому, как люди учатся на практике.