Hitech logo

искусственный интеллект

Издание NYT подало в суд на OpenAI и Microsoft за нарушение авторских прав

TODO:
Дарина Житова28 декабря 2023 г., 10:02

The New York Times подает в суд на OpenAI и Microsoft за нарушение авторских прав. Газета утверждает, что обе компании обучали своих чат-ботов на миллионах её статей. Это лишило издание заработка на подписках, рекламе и просмотрах. Кроме того, иногда модели галлюцинируют и неверно воспроизводят материалы статей, что подрывает доверие к NYT. А еще чат-боты без проблем обходят пейволл.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

The New York Times, третий самый цитируемый источник в интернете, присоединилась к волне судебных исков против разработчиков искусственного интеллекта. Газета требует не просто денежную компенсацию — она хочет, чтобы ChatGPT и Copilot удалили весь ее контент, потому что большие языковые модели в их основе обучались на её материалах. В иске указано, что чат-боты могут генерировать выходные данные, которые дословно воспроизводят контент NYT, точно резюмируют его и имитируют его выразительный стиль. По мнению издателя, это подрывает репутацию газеты, забирает у неё читателей и лишает законного заработка на своих материалах и рекламе.

Отдельно газета жалуется на способность чат-ботов обходить пейволл и получать доступ к эксклюзивным статьям. Её представители утверждают, что это угрожает всем профессиональным журналистам: при массовом использовании ИИ люди перестанут читать их материалы и платить за это.

Иногда чат-боты галлюцинируют, то есть придумывают несуществующие факты или искажают информацию. Это происходит и во время работы со статьями: нейросеть может неправильно воспроизвести содержание материала, который её просят резюмировать. В NYT считают, что это наносит ущерб их репутации: пользователи склонны думать, что ошиблись журналисты, а не нейросеть.

Известно, что ранее OpenAI и Microsoft действительно использовали статьи NYT для обучения своих моделей, по крайней мере, их ранних версий, таких как GPT-3,5. Они обучали их на наборе данных Common Crawl, в который входили материалы газеты. Представители издания 8 месяцев вели переговоры с разработчиками, чтобы получить достойную компенсацию за труд, однако не смогли прийти к соглашению.

Представитель OpenAI Линдси Хелд так прокомментировала ситуацию изданию the Verge: «Мы уважаем права создателей и владельцев контента и стремимся работать с ними, чтобы гарантировать, что они получат выгоду от технологий искусственного интеллекта и новых моделей дохода. Наши переговоры с New York Times были продуктивными и продвигались конструктивно, поэтому мы удивлены и разочарованы таким развитием событий. Мы надеемся, что найдем взаимовыгодный способ сотрудничества, как мы поступаем со многими другими издателями».