Hitech logo

Идеи

Генеративный ИИ быстро и точно предсказывает форму хроматина в клетке

TODO:
Георгий Голованов3 февраля, 10:53

Каждая клетка тела содержит ту или иную последовательность нуклеотидов, но проявляет лишь часть этих генов. Закономерности экспрессии определяются отчасти трехмерной структурой генетического материала, контролирующего доступность каждого гена. Химики из США нашли новый способ предсказания этих трехмерных структур при помощи генеративной модели ИИ. Их метод справляется с задачей намного быстрее существующих аналогов.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Внутри клеточного ядра находится хроматин, состоящий из белков и ДНК и имеющий несколько уровней организации. Он упаковывает 2 метра ДНК в компактное ядро диаметром в одну сотую миллиметра.

На свертывание хроматина и доступность соседних генов влияют химические метки, меняющиеся в зависимости от типа клеток. Они помогают определить, какие гены экспрессируют в определенных типах клеток или в определенное время. За последние 20 лет ученые разработали экспериментальные методы определения структур хроматина. Одна из них, Hi-C, соединяет соседние цепочки ДНК в ядрах клеток. Он хорошо работает на больших популяциях клеток для расчета средней структуры участка хроматина. Однако он слишком трудоемкий. На получение результата от одной клетки может уйти неделя.

Специалисты Массачусетского технологического института разработали модель на базе генеративного ИИ, которая предсказывает структуры хроматина быстро и точно. Она анализирует последовательности ДНК и сообщает, какие структуры хроматина эти последовательности способны производить в клетке.

«Глубокое обучение хорошо распознает закономерности, — сказал Чжан Бинь, старший автор статьи об исследовании. — Оно позволяет нам анализировать очень длинные сегменты ДНК, тысячи пар оснований, и показывает, какая важная информация зашифрована в этих парах оснований».

Модель ChromoGen состоит из двух компонентов, рассказывает MIT News. Первый — модель глубокого обучения — читает геном и анализирует закодированную информацию. Второй — модель генеративного ИИ, которая предсказывает точную форму хроматина. Она обучена на 11 млн примеров, созданных в ходе экспериментов на 16-ти клетках человеческих лимфоцитов. Для каждой последовательности ДНК модель создает множество вероятных структур.

По словам разработчиков, ChromoGen генерирует тысячу структур за 20 минут, работая практически на любом графическом процессоре.

Вместо того чтобы использовать несколько разных инструментов для редактирования и управления экспрессией генов, американские ученые-генетики собрали единый мультитул, который может работать одновременно с несколькими генетическими заболеваниями внутри одной клетки.