Чтобы доказать работоспособность идеи, авторы исследования попросили искусственный интеллект создать искусственные фрагменты ДНК. Эти фрагменты должны были включать ген, кодирующий флуоресцентный белок в некоторых клетках, не меняя при этом работу других генов. ИИ создал эти фрагменты «с нуля», и когда их добавили к клеткам крови мыши, они встроились в ДНК именно так, как и ожидалось.
Эта работа — важный шаг вперед в области генеративной биологии. До сих пор главные успехи здесь были связаны с созданием белков. Учёные научились проектировать их быстрее, чем раньше. Но многие заболевания возникают не из-за самих белков, а из-за того, что гены работают неправильно — и это зависит от конкретного типа клеток. Экспрессия генов регулируется особыми участками ДНК — энхансерами. Это крошечные фрагменты, которые включают или выключают нужные гены. Чтобы исправить сбой, исследователи ищут в геноме уже существующие энхансеры, которые могли бы подойти. Но выбор ограничен только тем, что создала эволюция.
«Сгенерированные» ИИ энхансеры могут помочь разрабатывать точные «переключатели» генов, каких еще нет в природе. Их можно запрограммировать так, чтобы они включали и выключали гены именно в тех типах клеток, где это нужно. Такая тонкая настройка важна для создания лекарств, которые не будут вредить здоровым клеткам.
Однако для создания ИИ-моделей нужно много качественных данных. Чтобы обучить свою модель, ученые провели тысячи экспериментов с лабораторными образцами, имитирующими образование крови, и собрали большой объем биологической информации. Они изучали как сами энхансеры, так и факторы транскрипции — белки, которые тоже участвуют в управлении работой генов. Обычно для этого используются раковые клетки, потому что с ними удобнее работать, но в этом исследовании ученые задействовали здоровые.
За пять лет команда синтезировала более 64 000 искусственных энхансеров, каждый из которых проверял различные комбинации и силы связывания с 38 различными факторами транскрипции. Это самая большая библиотека синтетических энхансеров, созданная в клетках крови.
Исследователи ввели искусственные энхансеры в клетки и следили, как каждый из них влияет на активность генов на семи этапах развития клеток крови. Оказалось, что один и тот же энхансер может активировать гены в одних клетках и подавлять их в других.
В большинстве случаев энхансеры плавно усиливали или снижали активность гена. Но некоторые сочетания вели себя по-другому — как кнопка включения и выключения. Учёные назвали это «отрицательной синергией»: два фактора, которые по отдельности запускают ген, вместе могут полностью его заглушить.
Собранные данные заложили основу для создания модели машинного обучения. Когда ИИ получил достаточно информации о том, как синтетические энхансеры влияют на активность генов в реальных клетках, она научилась предсказывать новые варианты, которые могут включать или выключать гены, даже если таких последовательностей никогда ранее не существовало.