ИИ оказался дешевым, но глючным инструментом в изучении Вселенной

искусственный интеллект

Георгий Голованов18 июня, 14:01

Георгий Голованов18 июня, 14:01

Исследователи из США обнаружили, что использование трансферного обучения может сократить количество дорогостоящих астрофизических симуляций Вселенной в 10 раз. Однако при определенных условиях возникает непредвиденный «отрицательный перенос»: нейросеть настолько привыкает к известным ей шаблонам, что не замечает или неправильно интерпретирует действительно новое явление.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Стандартная космологическая модель лямбда-CDM описывает множество наблюдательных данных, но не объясняет темную энергию, природу инфляции и существование массивных нейтрино. Чтобы проверить альтернативные теории — модифицированную гравитацию, эволюционирующую темная энергию — космологи запускают суперкомпьютерные симуляции эволюции Вселенной с разными параметрами. Каждая такая симуляция требует огромных вычислительных ресурсов.

Ученые создали квантовую вселенную, в которой время возникло само по себе

Рассчитывая найти решение этой проблемы, специалисты из Института Флэтайрон и Принстонского университета обратились к трансферному обучению. Это один из методов машинного обучения, которое позволяет решать новые задачи при помощи систем ИИ, обученных для выполнения похожих задач. В частности, ученые обучили нейросеть на симуляциях модели лямбда-CDM. Первоначальный процесс обучения обеспечил ИИ базой, на которой затем были построены более сложные космологические модели.

«По сути, это упрощенный подход, — объяснил Адриан Байер, соавтор исследования. — Обычно ИИ обучают непосредственно на самых ресурсоемких симуляциях. Мы же сначала используем более простые и менее затратные симуляции лямбда-CDM, чтобы дать ИИ представление о происходящем, и только потом переходим к более сложным моделям».

Эта стратегия оказалась весьма эффективной. В некоторых случаях трансферное обучение позволило сократить количество необходимых дорогостоящих симуляций более чем в десять раз.

Попутно исследователи обнаружили серьезную проблему, пишет Scitech Daily. В экспериментах с массивными нейтрино нейросеть, предварительно обученная на модели лямбда-CDM, зафиксировала новый сигнал, который по привычке интерпретировала как знакомое явление.

«Отрицательный перенос не случаен. Он обусловлен лежащими в основе модели физическими ограничениями, — сказала Кришнарадж. Другими словами, различные физические параметры могут создавать практически идентичные наблюдаемые сигнатуры, и ИИ с трудом их различает. — Поэтому нам необходимо это учитывать и стараться минимизировать».

Авторы предлагают несколько решений: использовать в симуляциях больше разных признаков; обучать нейросеть не только на лямбда-CDM, но и на альтернативных моделях; применять методы байесовского моделирования, которые могут указывать на неопределенность.

Американские компании Flexcompute, Northrop Grumman и Nvidia представили «физический ИИ» для космоса, который сокращает время моделирования воздействия реактивной струи с 7 дней до 5 секунд. Технология позволяет инженерам быстрее разрабатывать космические программы и безопаснее выполнять стыковку на орбите.

Также по теме

Идеи

Новый метод обнаружения темной материи дал первый результат

Идеи

Девятая планета может оказаться вовсе не планетой

Идеи

Геологи поняли, где искать фонтаны алмазов

Идеи

Американский стартап планирует выращивать биотопливо в открытом океане

Новости СМИ2