Человеческий организм использует десятки тысяч различных белков, каждый из которых состоит из аминокислот, которых, в свою очередь, от десятков до нескольких сотен. Их расположение определяет сложные формы белков, которые и задают их функции. Знание формы облегчает создание и повышает эффективность лекарств. А способность синтезировать белки с желаемой структурой ускоряет развитие ферментов для биотоплива или утилизации пластиковых отходов.
Десятками лет ученые расшифровывали 3D-структуры белков при помощи экспериментальных техник — рентгеновской кристаллографии или криоэлектронной микроскопии, пишет Science. Но такие методы занимают месяцы, если не годы, и не всегда работают. Пока биологи расшифровали структуры всего около 170 000 из более чем 200 млн белков.
В 1960-х исследователи поняли, что если удастся разобраться во взаимодействиях цепочек белка, можно предсказать его форму. Однако, в белках сотни аминокислот, у которых множество способов взаимодействия, так что число возможных форм получается астрономическим.
В 2018 за эту задачу впервые принялась команда DeepMind, которая, помимо вычислительного подхода, решила попробовать метод глубокого обучения, при котором алгоритм тренируется на большом объеме данных — в данном случае, на структуре уже расшифрованных белков. Уже тогда алгоритм DeepMind обошел соперников, но точность все еще была слишком низкой для того, чтобы можно было извлекать пользу из технологии.
Тогда разработчики объединили глубокое обучение с «алгоритмом натяжения», который имитирует метод сборки паззла. Это сработало — программа AlphaFold достигла показателя точности предсказания GDT 92,4. Среднее значение для самых сложных белков составило 87 пунктов, что на 25 пунктов выше, чем у ближайших конкурентных технологий расшифровки.
Программе даже удалось справится с белками, спрятанными в клеточных мембранах — играющих большую роль в человеческих заболеваниях, но сложных для изучения методом рентгеновской кристаллографии.
«Достижение DeepMind — это фантастика, оно изменит будущее структурной биологии и исследований белка», — заявила Джанет Торнтон, директор Европейского института биоинформатики.
Легкость и мастерство, с которыми алгоритмы DeepMind справляются со сложными задачами, пугают предпринимателя Илона Маска. По его мнению, компания выращивает опасную для человечества технологию, способную дестабилизировать ситуацию во всем мире. Это произойдет уже через пять лет, опасается Маск, но мы можем этого даже не заметить.