Ученые впервые секвенировали геном человека в 2003 году, однако спустя семь лет они решили продолжить исследования и создать протеомную карту. Протеом представляет собой всю совокупность белков, которые кодируются геномом человека. Его состав для каждого индивидуален и способен меняться время от времени.
Международная группа генетиков проанализировала три крупнейших базы данных, в которых собраны данные о протеоме — GENCODE/Ensembl, RefSeq и UniProtKB. Ученых интересовал набор из 22 210 генов, которые, как считается, кодируют белок. Однако оказалось, что во всех трех базах содержится лишь 19 446 участков ДНК с такими функциями.
Исследователи изучили около 3 тысяч оставшихся генов и обнаружили, что большинство из них попадает под категорию псевдогенов, которые утратили способность кодировать белки. В базах также были найдены еще 1470 якобы кодирующих компонентов, которые на самом деле функционируют не так, как следует.
Таким образом, большинство из 4234 неработающих генов не обладают кодирующими функциями, заключили авторы научной работы.
Более 300 из них уже переквалифицировали в категорию некодирующих участков ДНК и внесли в базу данных GENCODE. Результаты исследования опубликовали в журнале Nucleic Acids Research.
Открытие ставит под сомнение результаты проекта «Геном человека», завершенного 15 лет назад. Изначально предполагалось, что у человека более 100 тысяч работающих генов, но постепенно этот показатель снижался. Теперь ученые утверждают, что в геноме содержится не более 19 тысяч активных участков ДНК.
Новые данные могут оказать значительное влияние на биомедицину, поскольку количество генов, кодирующих белок, играет важную роль при изучении различных болезней, в том числе рака и сердечно-сосудистых заболеваний.
Ученые до сих пор точно не знают, как именно ведет себя ДНК в активном режиме. Исследования не всегда помогают отследить, в какой части ядра в конкретный период времени находится тот или иной участок ДНК. Для решения проблемы американские генетики представили подобие «линейки», которая с точностью определяет положение нескольких генов одновременно. Технология позволит создавать трехмерные карты генома с высокой точностью.