Учёные из Гонконгского политехнического университета разработали способ хранения цифровых данных в белках, используя бактерию E. coli как микрофабрику для производства информационных молекул. Идея заключается в кодировании данных напрямую в последовательностях аминокислот, которые представляют собой двоичный код. Поскольку для белков существует 20 стандартных аминокислот, теоретически это позволяет достичь плотности хранения данных выше, чем у ДНК с её четырьмя основаниями. Однако при таком подходе белки нестабильны, и клетка быстро разрушает их как «чужеродные» молекулы.
Команда решила использовать коллаген — прочный белок, который сохраняется миллионы лет. Исследователи создали коллагеноподобный каркас и встроили в него закодированные данные. Такая структура дала белкам стабильность — они сохраняют данные даже при экстремальных температурах и высокой кислотности.
Для извлечения информации из белкового порошка применяется жидкостная хроматография и масс-спектрометрия — своего рода молекулярный сканер, восстанавливающий данные с точностью более 90%. Помимо плотности, белковое хранилище обладает уникальными функциями безопасности.
Ученые продемонстрировали «молекулярную криптографию»: доступ к скрытым файлам можно получить только с помощью специального «ключа» — антитела, которое распознает секретную метку на белке. Без этого ключа данные остаются невидимыми для обычного оборудования.
Параллельно Университет Миссури представил решение главной проблемы биологических носителей — отсутствия возможности перезаписи. Ученые разработали прототип «жесткого диска на основе ДНК». В отличие от предыдущих систем, где данные записывались один раз, новый метод «кодирования со сдвигом рамки» позволяет многократно удалять и записывать новую информацию на молекулярном уровне.
Система использует компактное электронное устройство с нанопоровым сенсором, который действует как «считывающая головка» молекулярного «жесткого диска». Молекула ДНК проходит через пору нанометрового размера, вызывая характерные электрические сигналы, которые преобразуются в двоичный код.
Стирание и перезапись информации выполняются за счёт разрыва водородных связей в участках ДНК с двойной спиралью, а сами переходы между одиночной цепочкой и двойной спиралью служат сигналами битов.
Запись данных происходит по тому же принципу: на подготовленных участках одиночной цепочки электрически восстанавливаются водородные связи, формируя вторую цепочку. Чередование одиночных и двойных цепочек кодирует информацию без применения традиционных ферментов для секвенирования и без сложного синтеза нуклеотидов.
В перспективе ученые планируют создать компактное устройство размером с USB‑флешку, способное надежно и энергоэффективно хранить огромные объемы данных. Масштабные инвестиции в отрасль могут ускорить коммерциализацию подобных биологических носителей: по прогнозам, производители памяти заработают на буме ИИ более $551 млрд в 2026 году.

