РНК-содержащие вирусы представлены на Земле в таком огромном множестве, что процесс их открытия выглядит почти бесконечным. Некоторые из них вызывают у людей опасные заболевания: гепатит, COVID-19, лихорадку Эбола, полиомиелит. В 2022 году команда Артема Бабаяна из Университета Торонто (Канада) уже идентифицировала почти 132 000 новых вирусов, но они настолько быстро развиваются, что существующие методы не могут за ними угнаться. Обычно для этого применяют поиск участка генома, в котором закодирован ключевой белок, участвующий в репликации РНК — RdRp. Но если цепочка, кодирующая этот белок в вирусе, сильно отличается от всех известных науке, распознать ее не получится.
Команда ученых из Университета им. Сунь Ятсена (КНР) занялась поисками ранее неизвестных РНК-содержащих вирусов, сообщает Nature. Для этого они разработали модель LucaProt на основе большой языковой модели ChatGPT и загрузили в нее данные предсказаний структуры белка, полученные программой ESMFold. Они обучили модель распознавать белок RdRp и использовали его для розыска цепочек, кодирующих эти ферменты — свидетельства того, что эти цепочки принадлежат вирусу.
Таким методом ученые идентифицировали примерно 160 000 содержащих РНК вирусов, в том числе, особенно длинные и обитающие в экстремальных условиях: горячих источниках, соленых озерах, в воздушной среде. Около половины этих вирусов не были прежде известны науке.
Описание этих вирусов поможет ученым понять происхождение микроорганизмов и их эволюцию в различных носителях. А увеличение списка известных вирусов упростит поиск других, похожих.
Весной американские ученые представили метод создания единой универсальной вакцины против всех вирусов. Она способна защитить от различных возбудителей и будет безопасна для младенцев и людей с ослабленным иммунитетом, заявляют авторы.