Стандартная космологическая модель лямбда-CDM описывает множество наблюдательных данных, но не объясняет темную энергию, природу инфляции и существование массивных нейтрино. Чтобы проверить альтернативные теории — модифицированную гравитацию, эволюционирующую темная энергию — космологи запускают суперкомпьютерные симуляции эволюции Вселенной с разными параметрами. Каждая такая симуляция требует огромных вычислительных ресурсов.
Рассчитывая найти решение этой проблемы, специалисты из Института Флэтайрон и Принстонского университета обратились к трансферному обучению. Это один из методов машинного обучения, которое позволяет решать новые задачи при помощи систем ИИ, обученных для выполнения похожих задач. В частности, ученые обучили нейросеть на симуляциях модели лямбда-CDM. Первоначальный процесс обучения обеспечил ИИ базой, на которой затем были построены более сложные космологические модели.
«По сути, это упрощенный подход, — объяснил Адриан Байер, соавтор исследования. — Обычно ИИ обучают непосредственно на самых ресурсоемких симуляциях. Мы же сначала используем более простые и менее затратные симуляции лямбда-CDM, чтобы дать ИИ представление о происходящем, и только потом переходим к более сложным моделям».
Эта стратегия оказалась весьма эффективной. В некоторых случаях трансферное обучение позволило сократить количество необходимых дорогостоящих симуляций более чем в десять раз.
Попутно исследователи обнаружили серьезную проблему, пишет Scitech Daily. В экспериментах с массивными нейтрино нейросеть, предварительно обученная на модели лямбда-CDM, зафиксировала новый сигнал, который по привычке интерпретировала как знакомое явление.
«Отрицательный перенос не случаен. Он обусловлен лежащими в основе модели физическими ограничениями, — сказала Кришнарадж. Другими словами, различные физические параметры могут создавать практически идентичные наблюдаемые сигнатуры, и ИИ с трудом их различает. — Поэтому нам необходимо это учитывать и стараться минимизировать».
Авторы предлагают несколько решений: использовать в симуляциях больше разных признаков; обучать нейросеть не только на лямбда-CDM, но и на альтернативных моделях; применять методы байесовского моделирования, которые могут указывать на неопределенность.
Американские компании Flexcompute, Northrop Grumman и Nvidia представили «физический ИИ» для космоса, который сокращает время моделирования воздействия реактивной струи с 7 дней до 5 секунд. Технология позволяет инженерам быстрее разрабатывать космические программы и безопаснее выполнять стыковку на орбите.

