Hitech logo

Искусственный интеллект

Машинное обучение меняет подход к изучению литературы

TODO:
Георгий Голованов3 июня 2019 г., 12:31

Компьютерный анализ больших данных проник и в гуманитарные сферы знаний. При помощи новых технологий литературоведы получают возможность разрешить бесплодные прежде споры о границах жанров и разобраться в структуре повествования.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Определение жанра научной фантастики — как и любого другого — ускользает даже от литературоведов. Для одних он начинается с «Двадцати тысяч лье под водой» Жюля Верна, для других граница находится в области идей, а не авторов. Но что если большие данные смогут дать нам точный ответ? Новая область гуманитарных исследований использует именно такой подход к английской литературе, пишет Wired UK.

По мнению профессора Теда Андервуда из Университета штата Иллинойс, машинное обучение изменило понимание жанра и истории в английской литературе. Он рассматривает книги как «мешок со словами», которые можно сосчитать и понять частоту их использования в тексте. «Некоторым образом, это как выборочное исследование истории литературы, как социолог изучал бы население», — объяснил он.

Продолжая пример с научной фантастикой, выяснилось, что ее авторы склонны применять слова, указывающие на масштаб («обширный», «огромный», «далеко») при помощи больших чисел («миллионы») и часто применяют существительные вроде «человек», «существо», «Земля».  

Работа Андервуда показывает, что книги, которые читатели признают научной фантастикой, появились намного раньше, чем сам жанр.

«Некоторые ученые утверждают, что то, что мы называем „научной фантастикой“, не кристаллизировалось полностью до 1920-х, когда возник этот термин, — сказал он. — Теперь мы можем доказать, что „научные романы“ и „экстраординарные вояжи“ конца XIX века составляют последовательный жанр, продолжателем которого является современная научная фантастика».

Другие исследователи пытаются применить обработку естественного языка для того, чтобы предсказать продолжение рассказа. С помощью этой технологии Дэвид Бамман из Калифорнийского университета в Беркли раскрывает, как в повествование вплетена предсказуемость.

Языковая модель может прочитать первую половину научно-фантастического романа и угадать, о чем будет следующая глава.

По словам Баммана, сейчас он наблюдает рост интереса к этой области среди студентов — число тех, кто выбирает в качестве основных предметов датологию и английскую литературу, увеличивается.   

Сможет ли искусственный интеллект не только анализировать большие данные, но и понять смысл литературного произведения — неизвестно. Но американский писатель Роберт Слоун уже использует алгоритм собственного сочинения, когда ему требуется подсказка с поворотом сюжета или подбором слов.