В ДНК человека и других живых существ соседствуют экспрессирующиеся и неэкспрессирующиеся участки. На основе первых клетка производит белки, а вторые служат для регуляции либо вообще не проявляют никакой активности.
Удивительно, но, несмотря на все достижения науки, у биологов до сих пор не было способа быстро отсканировать генетическую последовательность и понять, какие гены способны к экспрессии, а какие — нет. Чтобы выяснить это, ученым приходилось искать упоминания конкретных генов в литературе либо проводить эксперименты.
Исследователи из Калифорнийского университета в Сан-Диего, о работе которых рассказывает Science Daily, разработали первый способ оценивать способность генов к экспрессии. В его основе лежит специальный алгоритм машинного обучения, натренированный на данных о 30 000 генах кукурузы.
Точность работы системы составляет 99,4%. Алгоритм отличает экспрессирующиеся гены по особенностям белков-гистонов, которые служат для упаковки ДНК, а также по некоторым другим молекулярным характеристикам.
Результат работы системы — так называемый «экспрессом», то есть совокупность генов, способных к экспрессии. По словам ученых, в необработанном виде геном напоминает книгу, в которой помимо слов есть бессмысленные наборы букв. Если следовать этой аналогии, то экспрессом — это книга, где остались только слова.
Новый метод обеспечит значительный прогресс в биологии. Например, с его помощью можно будет понять, почему те или иные гены в процессе эволюции «замолкают». Подойдет он и для практических исследований в области селекции и медицины. В настоящее время создатели алгоритма анализируют экспрессом сорго — важной зерновой и кормовой культуры.
Исследователи из Стэнфорда изучили образцы микробиоты нескольких тысяч человек и обнаружили 4000 семейств неизвестных науке белков. Их функции пока неясны — возможно, они помогают симбиотическим организмам взаимодействовать между собой и с организмом хозяина.