Исследователи проанализировали использование больших языковых моделей в различных отраслях в период с января 2022 года по сентябрь 2024 года. Для этого они использовали набор данных, включающий жалобы потребителей, корпоративные пресс-релизы, объявления о вакансиях и пресс-релизы ООН — все на английском языке. Статистический анализ паттернов употребления слов выявил признаки использования ИИ в 18% жалоб потребителей, 24% корпоративных пресс-релизов, 15% объявлений о вакансиях и 14% пресс-релизов ООН. При этом авторы обращают внимание на то, что в действительности искусственный интеллект может применяться чаще.
В регионах с более низким уровнем образования использование ИИ-инструментов для написания текстов оказалось выше. В районах с долей выпускников колледжей ниже медианного уровня по штату внедрение достигло 19,9%, тогда как в более образованных — 17,4%. Этот тренд сохранялся и в городах: 21,4% против 17,8% соответственно. Такой результат противоречит традиционным моделям внедрения инноваций, согласно которым более образованные слои населения быстрее осваивают новые инструменты. В целом, в городах уровень использования ИИ-инструментов выше, чем в сельской местности (18,2% против 10,9%).
Во всех проанализированных секторах (жалобы потребителей, корпоративные коммуникации, объявления о вакансиях) наблюдались схожие модели внедрения: резкий рост через 3-4 месяца после запуска ChatGPT в ноябре 2022 года, за которым последовала стабилизация в конце 2023 года.
Возраст организации оказался ключевым фактором в использовании ИИ для написания текстов в объявлениях о вакансиях. Компании, основанные после 2015 года, использовали ИИ в три раза чаще, чем фирмы, созданные до 1980 года (10–15% против менее 5%). Малые компании внедряли искусственный интеллект активнее, чем крупные. В корпоративных пресс-релизах организации из сферы науки и технологий лидировали по внедрению ИИ (16,8% к концу 2023 года). В бизнесе и финансах (14–15,6%) и темах, связанных с людьми и культурой (13,6–14,3%), уровень внедрения был ниже, но оставался высоким.
Страны ООН из Латинской Америки и Карибского бассейна показали самый высокий показатель внедрения — около 20%. В то же время государства Африки, Азиатско-Тихоокеанского региона и Восточной Европы продемонстрировали более умеренный рост — 11-14% к 2024 году.
Важно отметить, что сервисы для обнаружения сгенерированных текстов ненадежны, особенно при проверке отдельных документов. Однако при анализе миллионов текстов можно выявить закономерности, указывающие на влияние языковых моделей. Ученые использовали статистические методы, отслеживая изменения в частотности слов и языковых конструкций до и после появления ChatGPT. Сравнивая большие массивы данных, они оценили долю текстов, созданных ИИ, на уровне популяции. Языковые модели предпочитают определенные слова и структуры предложений, которые немного отличаются от тех, что используют люди. Для проверки исследователи создали тестовые наборы с известным процентом контента, созданного ИИ (от 0% до 25%). Их метод предсказал эти значения с погрешностью менее 3,3%, что подтвердило точность на уровне популяции.