Hitech logo

Искусственный интеллект

ИИ расшифровал считавшийся потерянным для науки древнеримский свиток

TODO:
Дарина Житова6 февраля, 12:10

Трое студентов, вооружённых нейросетями, расшифровали первый манускрипт из библиотеки в Геркулануме. За это они получили главный приз Vesuvius Challenge — $700 тысяч. Текст принадлежит перу Филодема Гадарского, эпикурейца и поэта. Он оказался философским трактатом о чувствах и удовольствиях. Ученые даже не надеялись прочитать свиток и считали его потерянным для науки. Организаторы конкурса считают, что созданная студентами технология позволит в будущем за 1 день расшифровать все 800 свитков сгоревшей во время извержения Везувия библиотеки.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Студенты Люк Фарритор, Юсеф Надер и Джулиан Шиллигер объединились, чтобы прочитать текст, пострадавший от извержения Везувия в 79 году нашей эры. С помощью нейросетей они извлекли и прочли 15 столбцов из первой работы Филодема. Она оказалась рассуждением о музыке, чувствах, удовольствиях и способах их получения. В конце текста философ сделал язвительное замечание в сторону своих идеологических оппонентов-стоиков, которым «нечего сказать об удовольствии, ни в общем, ни в частности».

Изначально восстановлением и прочтением свитков из библиотеки Филодема в Геркулануме занимался ученый Брент Спирлз из Университета Кентукки. Его команда сочетала цифровое сканирование с неинвазивной микрокомпьютерной томографией, которая помогала уловить все текстуры. Потом они использовали ПО собственной разработки, которое позволяло виртуально развернуть свиток.

Однако для более старых манускриптов из Геркуланума этот метод не подошёл — они написаны углеродными чернилами (смесью воды и угля), которые не светятся на томографии. Спирлз всё равно отсканировал их и даже смог прочесть два неповрежденных свитка в лаборатории синхронного излучения в Оксфорде, параллельно обучая нейросеть обрабатывать их.

Здесь на помощь ученому пришёл краудсорсинг. О его работе услышали предприниматели Нэт Фридман и Дениел Гросс, которые запустили Vesuvius Challenge, призванный помочь прочесть древние тексты быстрее. Спирлз опубликовал сканы манускриптов и код своего ПО, а также выложил изображения повреждённых и сплющенных частей свитка. За задачу взялись 1500 команд, которые делятся удачным кодом друг с другом и быстро двигаются дальше.

В октябре 2023 года Фарритор, студент колледжа и стажер SpaceX, успешно прочитал первый текст, спрятанный в одном из свитков, используя модель машинного обучения. Это достижение принесло ему $40 000. Египтянин Надер, ученик кафедры биоробототехники в Берлине, получил премию First Ink в размере $10 000 за то, что, по сути, стал вторым человеком, расшифровавшим буквы в свитке. Швейцарец Шиллигер, который изучает робототехнику в ETH Zurich, выиграл три приза за инструменты для сегментации, которые позволили создать 3D-картографию папируса. Затем трио создало «суперкоманду», которая и смогла прочесть первый текст.

Кажется, будто 15 столбцов текста — это мало для такой награды. Однако ранее ученые даже не надеялись прочитать свиток и считали его потерянным для науки. В прошлом году исследователи смогли расшифровать только первое слово — «фиолетовый». Теперь организаторы Vesuvius Challenge объявили о награде на 2024 год: $100 000 первому, кто сможет прочитать 90% из 4 отсканированных на данный момент свитков.

Основная цель — усовершенствовать процесс автоматической сегментации, поскольку выполнение ее вручную требует много времени и средств (более $100 за квадратный сантиметр). Фридман, Гросс и Спирлз считают, что в будущем за один день можно было отсканировать и прочитать все 800 обнаруженных на данный момент свитков, а также другие произведения, которые будут извлекать из библиотеки по мере раскопок.