Hitech logo

Идеи

Ученые удвоили емкость ДНК-памяти — до 400 петабайт на один грамм

TODO:
Степан Икаев9 марта 2022 г., 13:06

Американские ученые превратили молекулярный состав ДНК в надежную и устойчивую платформу для хранения данных. Команда инженеров и биологов расширила «алфавит» ДНК, после чего разработала новый метод секвенирования для сбора цифровой информации. По словам авторов проекта, в перспективе эта система позволит уместить всю информацию современного интернета в ящике размером с коробку из-под обуви.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

«Каждый день в интернете генерируются несколько петабайт данных. Для хранения этих данных достаточно всего одного грамма ДНК. Вот насколько плотна ДНК как носитель информации», — рассказала New Atlas соавтор исследования Касра Табатабаи.

Как объяснили ученые, природная система хранения данных в ДНК заметно превосходит любые технологии по части своего потенциала для обработки информации. Естественная ДНК состоит из комбинации четырех азотистых оснований: аденина, гуанина, цитозина и тимина. Последние обозначаются буквами «A», «G», «C» и «T». Когда эти буквы группируются в различных последовательностях, они образуют «чертежи» воспроизводства для живых организмов. При этом плотность хранения информации у ДНК рекордная — всего один грамм способен хранить до 215 петабайт данных.

Ученые из Иллинойского университета в Урбане-Шампейне удвоили емкость природной системы хранения данных и заодно разработали собственный подход к считыванию информации из ДНК. В дополнение к A, G, C и T разработчики прибавили к ДНК еще семь новых «букв». Они принимают форму химически модифицированных нуклеотидов, открывая более разнообразные комбинации, которые позволяют хранить больше информации в том же объеме физического пространства. Таким образом потенциальная вместимость ДНК выросла в два раза — до 400 петабайт на один грамм.

«Представьте себе английский алфавит. Если бы у вас было только четыре буквы, вы могли бы составить столько-то слов. Если бы у вас был полный алфавит, вы могли бы создавать неограниченное количество комбинаций слов. То же самое и с ДНК. Вместо того, чтобы преобразовывать нули и единицы в A, G, C и T, мы можем преобразовать нули и единицы в A, G, C, T и семь новых букв в алфавите хранения», — добавила Табатабаи.

В процессе создания дополнительных нуклеотидов ученым пришлось отказаться от существующих методов считывания данных о ДНК, основанных на ACGT-«алфавите». Поэтому команда создала новую систему, применив алгоритмы машинного обучения. В рамках новой платформы нити ДНК проходят через нанопоры в специально разработанном белке, который идентифицирует отдельные единицы данных независимо от того, являются ли они природными или синтетическими. Затем ИИ декодирует информацию, хранящуюся внутри, и выводит считываемый результат.

Серия экспериментов подтвердила жизнеспособность концепции. Ученые испробовали 77 различных комбинаций из 11 нуклеотидов, при работе с которыми платформа смогла идеально дифференцировать каждый состав. Авторы заявили, что продолжат работать над совершенствованием системы и планируют применить ее в прикладных испытаниях в ближайшее время.