Агенты БЯМ способны взять на себя и автоматизировать сложные, многоэтапные бизнес-процессы. Однако на практике весь процесс могут сорвать непредсказуемые события, такие как сбои в сети, изменения пользовательского интерфейса или схем данных. Для агентов ИИ это обычно означает, что нужно начинать все заново, на что уходит много времени и ресурсов.
Между тем, многие сложные задачи, несмотря на поверхностные различия, имеют глубокие структурные сходства. Исследователи отмечают, что вместо того, чтобы каждый раз заново изучать эти закономерности, агент должен уметь извлекать и повторно использовать свой опыт прошлых успехов и неудач. Для этого требуется особая, долгосрочная «процедурная память», которая у людей отвечает за такие навыки, как набор текста или езда на велосипеде. Как известно, эти навыки, как только они стали автоматическими, сложно утратить.
Memp — это независимая от задач программная платформа, который рассматривает процедурную память как основной компонент, подлежащий оптимизации. Она состоит из трех ключевых этапов, работающих в непрерывном цикле: создание, извлечение и обновление памяти. Воспоминания формируются на основе прошлого опыта агента, или «траекторий». Разработчики изучили хранение этих воспоминаний в двух форматах: дословном описании пошаговых действий или преобразовании этих действий в более высокоуровневые абстракции, похожие на скрипты. Для извлечения данных агент ищет в своей памяти наиболее релевантный прошлый опыт.
Наиболее важный компонент платформы — механизм обновления. Memp предлагает несколько стратегий, обеспечивающих эволюцию памяти агента. По мере того, как агент выполняет больше задач, его память можно обновлять, просто добавляя новый опыт, фильтруя только успешные результаты или, что наиболее эффективно, анализируя неудачи, чтобы исправить и пересмотреть исходное воспоминание.
Результаты тестирования показали, пишет Venture Beat, что создание и извлечение процедурной памяти позволяет агенту повторно обращаться к своему предыдущему опыту. Оснащенные Memp агенты не только добились более высоких показателей, но и стали гораздо эффективнее. Они избавились от бесплодных поисков и метода проб и ошибок, что привело к значительному сокращению как количества шагов, так и расхода токенов, необходимых для выполнения задачи.
Одним из наиболее важных для применения на предприятиях открытий стала возможность переносить процедурную память. В одном из экспериментов процедурная память, сгенерированная мощной GPT-4o, была передана гораздо меньшей модели Qwen2.5-14B. В результате меньшая модель продемонстрировала значительное повышение производительности: увеличилась вероятность успешного выполнения задач, сократилось количество шагов, необходимых для их выполнения.
Это означает, что знания можно получить с помощью современной модели, а затем использовать в меньших и более экономичных моделях, не теряя преимуществ опыта.
Шведский стартап IntuiCell представил Luna — робота-собаку с цифровой нервной системой, которая обучается и принимает решения, имитируя поведение живых существ. В отличие от традиционного ИИ, Luna учится в реальном времени через взаимодействие с окружающим миром, без предварительного обучения и инструкций.