На первом этапе настроенная версия языковой модели LLaMA-2 извлекает из текстов ключевые научные понятия. Затем эти понятия упорядочиваются в «граф концепций» — сеть знаний, где каждый термин образует узел, а связи между узлами отражают частоту совместного появления терминов в одном реферате. Вторая модель машинного обучения анализирует эволюцию этих связей во времени.
«Если наша языковая модель распознает, что термины вроде „перовскит“ и „солнечный элемент“ встречаются вместе все чаще, в графе концепций создается новая связь. Затем модель машинного обучения анализирует развитие этих связей, чтобы предсказать, какие комбинации научных понятий могут стать более важными в ближайшие два-три года, — пояснил Томас Марвиц из Технологического института Карлсруэ, первый автор исследования. — Затем модель машинного обучения анализирует развитие этих связей, чтобы предсказать, какие сочетания научных концепций могут стать более важными в ближайшие два-три года».
Добавление семантической информации улучшило способность системы предсказывать связи между отдаленными темами — именно такие сочетания часто оказываются наиболее новыми и потенциально ценными для исследований.
Для проверки практической полезности команда сгенерировала персонализированные отчеты для десяти ученых-материаловедов. Из 292 предложенных ИИ комбинаций 26% эксперты оценили как действительно новые или перспективные. При дополнительной фильтрации результатов второй языковой моделью точность идентификации интересных сочетаний выросла до 47%.
Среди наиболее убедительных прогнозов — комбинации «обычная керамика» с «оксидом графена» для аккумуляторных приложений и «плоскостная поляризация» с «органическим фотоэлементом». Эти направления ранее практически не привлекали внимания в литературе.
«Мы не хотим заменять исследователей, — подчеркнул Паскаль Фридерих, участник проекта, в пресс-релизе. — Наш результат — не машина для изобретений, а инструмент анализа, который может помочь более целенаправленно обнаруживать новые идеи и потенциальные коллаборации».
Генеральный директор Xiaomi Лэй Цзюнь заявил, что уже в ближайшие пять лет гуманоидные роботы и системы ИИ кардинально преобразуют промышленность. На собственном заводе компании рентгеновская проверка с ИИ уже работает в десять раз быстрее и в пять раз точнее ручного труда.

