В декабре 2018 в Токио представят новую нейросеть, которая может создавать отличные шаржи по фото. ИИ, а точнее пара генеративных состязательных сетей (GAN) под названием CariGANs, превращает повседневные снимки в забавные ироничные рисунки, пишет TheNextWeb.
CariGANs — совместная разработка стэнфордского аспиранта Кайди Цао, ИИ-специалиста из Городского университета Гонконга Цзин Ляо и Лу Юаня из Microsoft.
Первая нейросеть, CariGeoGAN, определяет геометрию лица на фотографии и делает цифровой эскиз карикатуры. Вторая, CariStyGAN, стилизует изображение, придавая художественность этой геометрической карте.
Чтобы научиться это делать, CariGANs обучали на тысячах нарисованных от руки карикатур.
Для определения эффективности ИИ, разработчики провели сразу два исследования. Для начала нужно было убедиться, что на карикатурах, созданных нейросетью, можно легко узнать человека со снимка. Ведь художник, рисуя такие портреты, должен поймать самые яркие черты и изобразить их в гипертрофированном виде.
По словам исследователей, респонденты указали, что карикатуры CariGANs выгодно смотрятся даже на фоне рисунков, сделанных профессиональными художниками.
Также требовалось выяснить, насколько такой способ «рисования» лучше, чем обычные карикатуры. Респонденты признавали работу ИИ более удачной в 22,95% случаев. Это пока далеко от идеала, но исследователи надеются, что со временем рисунки нейросети будут неотличимы от работ художников-карикатуристов.
Еще одна полезная функция CariGANs — возможность делать скриншоты с видео, разделяя видеоряд на отдельные кадры и создавая карикатуры с каждого из них. В этом случае все изображения будут выдержаны в едином стиле.
Такая нейросеть облегчит работу художников-мультипликаторов, особенно если у персонажа есть реальный прототип.
Есть и еще один вариант использования CariGANs: алгоритм восстанавливает изображения с карикатур, определяя, кого нарисовал художник. Так что со временем технология распознает лицо даже с карикатуры.
Несмотря на такие разработки, Microsoft призвала ограничить применение технологии распознавания лиц. По словам президента и главы юридического департамента корпорации Брэда Смита, сейчас, когда технология на взлете, необходимо очертить рамки «допустимых вариантов использования». Он уверен, что бизнес самостоятельно с этим не справится, и заняться этим должны политики.