Hitech logo

Идеи

Большие языковые модели способны трансформировать геномику растений

TODO:
Георгий Голованов4 июня, 09:29

Большие языковые модели (БЯМ) с успехом применяются в различных областях науки, но только не в исследованиях генома растений. Дело в том, что адаптировать БЯМ для интерпретации уникального «языка» генов — крайне сложная задача, которую усугубляет нехватка аннотированных данных. Ученые из Китая решили ее, найдя структурные параллели между геномными последовательностями и естественным языком. Новую модель можно использовать для эффективного понимания и прогнозирования генетических функций растений.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Большие языковые модели уже заявили о себе как о ценном инструменте исследования генома животных. Актуальной остается проблема эффективного переноса этих БЯМ в область исследования растений, в основе которой лежат существенные различия между естественным языком и биологическим языком генов. Команда ученых из Хайнаньского университета взялась за изучение перспектив применения БЯМ в геномных исследованиях растений.

Изучив потенциал БЯМ и проанализировав существующие архитектуры БЯМ для анализа геномных последовательностей, исследователи предложили собственную методологию. Она состоит в предварительном обучении БЯМ на обширных наборах данных геномных последовательностей растений, за которым следует тонкая настройка с использованием определенных аннотированных данных.

Обрабатывая последовательности ДНК подобно лингвистическим предложениям, новые модели научились распознавать закономерности и корреляции в генетическом коде. Они хорошо зарекомендовали себя в таких задачах, как выявление промоторов, идентификация энхансеров и анализ экспрессии гена, сообщает EurekAlert.

В частности, модели AgroNT и FloraBERT показывают улучшенную производительность в аннотировании геномов растений и прогнозировании экспрессии тканеспецифичных генов.

Авторы исследования подчеркивают огромный потенциал интеграции искусственного интеллекта, особенно больших языковых моделей, в исследования геномики растений. Преодолевая разрыв между вычислительной лингвистикой и генетическим анализом, БЯМ могут изменить наше понимание биологии растений, открыть путь для инноваций в сельском хозяйстве, охране природы и биотехнологии.

Недавно ученые из США представили более безопасную и универсальную стратегию редактирования генома с сохранением целостности генетического ландшафта. Теперь ученые могут вставлять полноразмерные гены в целевые участки без необходимости разрезания ДНК.