Logo
Cover

Ранее в этом году алгоритм AlphaFold расшифровал структуру почти всех белков, известных науке на данный момент. Их база данных составила около 200 млн белков. Теперь Meta представила свой ИИ, который изучил темную материю белковой вселенной и предсказал форму более 600 млн белков бактерий, вирусов и других микробов. Причем справился с этой задачей ИИ всего за две недели. То есть примерная средняя скорость расчета белковых структур — 1,8 млн отдельных белков в час.

Нейросеть Meta ESMFold определила структуру более 617 млн белков, которые до сих пор не были охарактеризованы. Они представляют собой белки почвы, морской воды, а также организма человека, пишет Nature.

Понимание структуры белков очень важно для оценки и изучения их функций, которые, в свою очередь, помогают исследовать молекулярные причины различных заболеваний, а также разрабатывать и тестировать новые варианты лечения. Нейросеть ESMFold разрабатывалась с целью масштабирования результатов по предсказаниям структуры для гораздо больших баз данных.

ESMFold не так точна, как AlphaFold, но она примерно в 60 раз быстрее прогнозирует структуры белков, объясняют авторы. Благодаря такому алгоритму предсказания структуры 617 млн белков заняли всего две недели. Все полученные данные находятся в открытом доступе.

Важно отметить, что миллионы этих структуры оказались совершенно новыми и не были похожи ни на что в существующих сегодня базах данных.

Таким образом, ESMFold дает беспрецедентное представление об огромной широте и разнообразии структур некоторых из наименее изученных белков на Земле.

Полученные данные позволяют говорить, что в скором времени в биологии может произойти взрыв в анализе метагеномных структур, раскрывая для ученых новые направления для исследований.

Тем временем другие ученые создали ИИ, разрабатывающий молекулы любых белков за секунды. Их усилия также направлены на поиск новых возможностей в создании эффективных препаратов.