Сторонники теорий заговора (так называемый Шекспировский вопрос) подозревают, что приписываемые великому британскому драматургу произведения писал кто-то другой, например, коллектив авторов во главе с философом Фрэнсисом Бэконом. О первых результатах исследования пьесы «Генрих VIII» с помощью машинного обучения рассказывает MIT Tech Revew.
«Генрих» — поздняя пьеса, официально написанная Шекспиром в соавторстве с Джоном Флетчером. Шекспир умер в 1616 году, Флетчер, в архиве которого она хранилась, — в 1625. И лишь десятилетие спустя драма была впервые опубликована, причем имя Флетчера шло на первом месте в списке авторов.
Среди исследователей творчества Шекспира шли долгие споры о том, насколько велик был вклад Флетчера в текст и сюжет.
Несомненно было, что он существенен — но только алгоритму машинного обучения удалось разобраться буквально с точностью до строчки в том, когда Уильям передавал перо Джону и наоборот.
Как отмечает MIT, для Флетчера были характерны определенные особенности письменной речи, которых избегал Шекспир: например, Флетчер часто употребляет «ye» вместо «you» и «’em» вместо «them». Он любит компенсировать недостающий строке слог с помощью слов «sir», «still» или «next». Литературовед Георг Брандес указывал также на необычные для Шекспира характеры и слабый сюжет драмы.
Разобраться, сколько в этой пьесе Шекспира, с помощью современных методов решил исследователь из Чехии Петр Плешак. Анализ текста и выявление его особенностей — одна из привычных задач для машинного обучения. В этом случае лишь область приложения усилий была очень необычной. Плешак скормил модели поздние пьесы Шекспира, а также произведения Флетчера. А затем строка за строкой проанализировал текст «Генриха VIII».
В интервью MIT он указывает, что анализ в целом оказался близок к разбиению, которое в классической работе 1850 года предложил литературовед Джеймс Спеддинг. Флетчер, подтверждает Плешак, написал сцены, составляющие почти половину пьесы. Однако был и ряд сюрпризов.
Алгоритм показал, что авторство иногда менялось прямо во время развития действия, а не только между сценами. Например во второй сцене третьего акта модель предложила смешанное авторство после строки 2081.
Помимо этого, Плешак проверил и еще одну версию об авторстве этой пьесы — иногда его приписывали также драматургу Филиппу Мессинджеру. «Маловероятно», чтобы он был вовлечен в работу над «Генрихом», счел алгоритм анализа.
В публикации не сказано, планирует ли чешский ученый исследовать аналогичным образом другие тексты Шекспира в поисках следов других авторов.
MIT считает, что следующим логичным шагом для подобных алгоритмов было бы преобразование текста в стилистику Шекспира или хотя бы Флетчера. Однако сделать это значительно сложнее, чем обработать фото в стиле известного художника.
Впрочем, в OpenAI уже научили ИИ писать подчас неотличимые от настоящих фейковые новости. Так что, возможно, проблему решит накопление и обработка большего массива данных.