Машинное обучение — разновидность компьютерного моделирования, в которой алгоритмы учатся делать прогнозы на основе известных данных. Биологи начали применять этот инструмент для поиска компонентов для потенциальных лекарств. Однако одно из ограничений этого метода в том, что алгоритмы хорошо справляются с задачей только когда данные, которые они анализируют, похожи на данные, на которых их обучали. Это затрудняет анализ новых молекул.
Междисциплинарная группа специалистов из лаборатории информатики и искусственного интеллекта MIT первой обратилась к подвиду машинного обучения, который раньше не применялся для биологических исследований. Они применили метод гауссова процесса для оценки уровня неопределенности данных. В таком случае, когда модели анализируют их, они учитывают параметр надежности прогнозов. По словам ученых, это фундаментальный прорыв и новое слово в биологии, пишет Science Daily.
Другое преимущество такого подхода в том, что теперь алгоритму требуется гораздо меньше данных для обучения. В данном случае биологи обучили модель на базе данных из 72 малых молекул и их взаимодействиях с 400 протеинкиназами. Затем алгоритм смог проанализировать почти 11 000 молекул и идентифицировал те, у которых вероятность сходства с протеинкиназами наибольшая. В том числе, с киназой PknB, необходимой для выживания бактерии Mycobacterium tuberculosis, или палочки Коха.
Протестировав самые многообещающие из молекул, ученые обнаружили, что предсказания модели были точны. Среди наиболее вероятных молекул около 90% оказались настоящими хитами. Для сравнения: процент успешных кандидатов у нынешних моделей машинного обучения составляет только 30% — 40%.
На завершающем этапе исследователи взяли наиболее многообещающие ингибиторы PknB и испытали их в действии против палочек Коха, выращенных в лаборатории и в человеческих клетках, зараженных туберкулезом. В обоих случаях молекулы подавляли рост бактерий.
Вакцина от туберкулеза DAR-901 успешно прошла вторую фазу испытаний и показала безопасность и необходимый иммунный ответ у здоровых людей. Она должна стать одним из главных инструментов для профилактики инфекции, которая до сих пор убивает более 1,5 млн человек в год.