Разработка автономных систем для управления спутниками и навигации космических аппаратов давно интересует ученых. В будущем спутников станет слишком много, чтобы управлять ими вручную. К тому же, при исследовании дальнего космоса, из-за ограничений скорости света, невозможно управлять аппаратами в реальном времени. Если человечество планирует осваивать космос, придётся доверить принятие решений роботам.
Чтобы подстегнуть инновации, специалисты по аэронавтике запустили Kerbal Space Program Differential Game Challenge. Это полигон для тренировок, созданный на базе известной видеоигры Kerbal Space Program. Он позволяет специалистам проектировать, экспериментировать и тестировать автономные системы в реалистичной среде. Задачи в симуляторе включают различные сценарии, например, миссию по преследованию и перехвату спутника или задание по предотвращению обнаружения.
Международная группа ученых представила своего кандидата — LLM-агент, который использовал GPT-3.5 и LLaMA. Исследователи выбрали технологию больших языковых моделей, потому что разработка автономных систем традиционными методами требует долгих циклов обучения, обратной связи и доработок. А в Kerbal Challenge миссии длятся всего несколько часов, и это делает постоянную доработку модели непрактичной.
Мощь больших языковых моделей кроется в том, что они уже обучены на огромных объемах человеческих текстов. Благодаря этому в идеальном случае, им достаточно лишь небольшой, но точной настройки подсказок (промпт-инжиниринга) и нескольких попыток, чтобы уловить нужный контекст.
Чтобы такая модель могла управлять космическим аппаратом, исследователи создали систему, которая преобразует текущее состояние корабля и его цель в текстовый формат. Этот текст передается языковой модели, которая затем дает рекомендации по ориентации и маневрированию. Также ученые разработали специальный слой-переводчик, который превращает текстовые рекомендации LLM в код для управления симулятором. С помощью небольшой серии подсказок и доработок исследователи добились того, что их агент прошел испытания в этом конкурсе и занял второе место. Как указано в статье, первое место досталось модели, разработанной на основе других уравнений.
И это при том, что все эксперименты проводились еще до выхода GPT-4. Предстоит много работы, особенно над тем, чтобы избежать «галлюцинаций», которые в реальных условиях могут привести к катастрофе. Тем не менее, это показывает, какой потенциал таят в себе LLM: усвоив огромные объёмы человеческих знаний, они могут применяться самыми неожиданными способами.