Гарвард открыл доступ к миллионам судебных дел для обучения ИИ-юристов
Logo
Cover

Школа права Гарвардского университета оцифровала судебные дела с 1600-х годов и до наших дней. Новые дела будут вносить в базу автоматически. Миллионы документов позволят разработчикам обучать ИИ быстро, а главное бесплатно.

Разработчики алгоритмов-юристов обычно создают собственные базы данных для обучения систем на базе машинного интеллекта. Сведения о судебных делах приходится собирать самостоятельно. Например, заключать сделки с частными юридическими компаниями или мониторить базы, за доступ к которым часто приходится платить.

Школа права при Гарвардском университете запустила проект Caselaw Access в 2013 году, чтобы оцифровать все судебные разбирательства в США с 1600 по 2018 годы. Как передает MIT Technology Review, сотрудники Лаборатории библиотечных инноваций включили в базу сведения обо всех делах как на уровне штата, так и на федеральном уровне.

Для этого им пришлось отсканировать более 40 млн страниц.

Создатели проекта не только выложили сами данные, но и дополнили их бесплатным API. С его помощью разработчики смогут создавать собственные продукты на базе судебных решений. Например, поисковые инструменты или чатботы.

«Мы даем возможность использовать юриспруденцию как источник данных и писать программы для изучения миллионов дел», — рассказал глава лаборатории Адам Циглер в комментарии Fortune.

Проект частично финансировал стартап Ravel Law, основанный выпускниками Стэнфордского университета.

«Закон — это операционная система Америки. И мы создаем для нее обновление», — говорится на сайте компании.

Первые опыты

Пока алгоритмы-юристы выполняют рутинные формальные задачи, например, помогают оформить иск или оспорить штраф. На этом специализируется чатбот DoNotPay, созданный студентом Стэнфордского университета Джошуа Броудером.

Изначально сервис помогал бороться с неправомерными штрафами за парковку, а теперь в приложении можно автоматически подать в суд на компанию, которая допустила утечку данных пользователей. В некоторых случаях клиенты сервиса выигрывали дела на $9000 без помощи адвоката. Всего DoNotPaY освоил более тысячи областей права, и список продолжает пополняться.

Однако пока профессии юриста автоматизация не угрожает. По оценкам McKinsey, только 22% задач специалиста в области права можно автоматизировать. Среди мелких судебных клерков этот показатель выше — 35%.

В первую очередь алгоритмы превосходят человека по внимательности и производительности. Так, программа Contract Intelligence тратит секунды на изучение документов, которые человеку пришлось бы читать годами. В сфере с почасовой оплатой работы такие системы будут пользоваться все большей популярностью.

Рынок на тренд уже отреагировал. С 2016 по 2017 год объем инвестиций в компании, которые занимаются правовыми технологиями, вырос на 43%. Один из примеров — стартап Atrium LTS — всего за год привлек более $10 млн на разработку алгоритма, который освободит юристов от бумажной работы.