Hitech logo

искусственный интеллект

ИИ оказался дешевым, но глючным инструментом в изучении Вселенной

TODO:
Георгий ГоловановСегодня, 02:01 PM

Исследователи из США обнаружили, что использование трансферного обучения может сократить количество дорогостоящих астрофизических симуляций Вселенной в 10 раз. Однако при определенных условиях возникает непредвиденный «отрицательный перенос»: нейросеть настолько привыкает к известным ей шаблонам, что не замечает или неправильно интерпретирует действительно новое явление.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Стандартная космологическая модель лямбда-CDM описывает множество наблюдательных данных, но не объясняет темную энергию, природу инфляции и существование массивных нейтрино. Чтобы проверить альтернативные теории — модифицированную гравитацию, эволюционирующую темная энергию — космологи запускают суперкомпьютерные симуляции эволюции Вселенной с разными параметрами. Каждая такая симуляция требует огромных вычислительных ресурсов.

Рассчитывая найти решение этой проблемы, специалисты из Института Флэтайрон и Принстонского университета обратились к трансферному обучению. Это один из методов машинного обучения, которое позволяет решать новые задачи при помощи систем ИИ, обученных для выполнения похожих задач. В частности, ученые обучили нейросеть на симуляциях модели лямбда-CDM. Первоначальный процесс обучения обеспечил ИИ базой, на которой затем были построены более сложные космологические модели.

«По сути, это упрощенный подход, — объяснил Адриан Байер, соавтор исследования. — Обычно ИИ обучают непосредственно на самых ресурсоемких симуляциях. Мы же сначала используем более простые и менее затратные симуляции лямбда-CDM, чтобы дать ИИ представление о происходящем, и только потом переходим к более сложным моделям».

Эта стратегия оказалась весьма эффективной. В некоторых случаях трансферное обучение позволило сократить количество необходимых дорогостоящих симуляций более чем в десять раз.

Попутно исследователи обнаружили серьезную проблему, пишет Scitech Daily. В экспериментах с массивными нейтрино нейросеть, предварительно обученная на модели лямбда-CDM, зафиксировала новый сигнал, который по привычке интерпретировала как знакомое явление.

«Отрицательный перенос не случаен. Он обусловлен лежащими в основе модели физическими ограничениями, — сказала Кришнарадж. Другими словами, различные физические параметры могут создавать практически идентичные наблюдаемые сигнатуры, и ИИ с трудом их различает. — Поэтому нам необходимо это учитывать и стараться минимизировать».

Авторы предлагают несколько решений: использовать в симуляциях больше разных признаков; обучать нейросеть не только на лямбда-CDM, но и на альтернативных моделях; применять методы байесовского моделирования, которые могут указывать на неопределенность.

Американские компании Flexcompute, Northrop Grumman и Nvidia представили «физический ИИ» для космоса, который сокращает время моделирования воздействия реактивной струи с 7 дней до 5 секунд. Технология позволяет инженерам быстрее разрабатывать космические программы и безопаснее выполнять стыковку на орбите.