Достижения искусственного интеллекта в синтетической и структурной биологии привели к появлению новых искусственных белков со специфическими функциями. Современные компьютеры позволяют точно прогнозировать трехмерные структуры любой заданной аминокислотной цепочки. Однако структуру почти 30% всех белков, которые синтезируются в геноме человека, сложно предсказать даже самым мощным инструментам ИИ, в том числе, удостоенной Нобелевской премии системе AlphaFold.
Эти неупорядоченные белки, никогда не принимающие фиксированную форму и постоянно меняющиеся, играют ключевую роль в функциях биологических систем, но присущая им нестабильность затрудняет их разработку с нуля, пишет EurekAlert.
Группа ученых из Гарвардского университета и Северо-Западного университета продемонстрировала новый метод машинного обучения, позволяющий создавать белки с внутренней неупорядоченностью и заданными свойствами. Они разработали вычислительный метод с применением алгоритмов, выполняющих «автоматическую дифференциацию» или автоматическое вычисление производных для рационального выбора белковых последовательностей с желаемым поведением или свойствами. Этот метод широко используется в глубоком обучении и тренировках нейронных сетей, но группа профессора Майкла Бреннера была одной из первых, кто разглядел другие потенциальные варианты его использования.
Благодаря автоматической дифференциации исследователи смогли обучить компьютер распознавать, как небольшие изменения в белковых последовательностях — даже изменения отдельных аминокислот — влияют на конечные желаемые свойства белков. Они сравнили свой метод с мощной поисковой системой, которая подбирает аминокислотные цепочки по заданным критериям.
Метод использует традиционную структуру обучения нейронных сетей — градиентную оптимизацию — для эффективного и точного определения новых белковых последовательностей. В результате разработанные исследователями белки являются «дифференцируемыми». Иначе говоря, они основаны не просто на предположениях ИИ, а на моделировании молекулярной динамики с использованием реальной физики, которая учитывает фактическое поведение белков в природе.
Ученые из США нашли способ «заглянуть» внутрь языковых моделей, предсказывающих структуру и функции белков, и понять, как они принимают решения. Для этого ученые применили специальный алгоритм, который «разворачивает» работу нейронной сети, позволяя увидеть, какие именно свойства белков учитывает каждый элемент модели.