Компания Nvidia, один из самых активных игроков на рынке систем искусственного интеллекта, научила алгоритм генерировать очень похожие на настоящие фотографии людей. Изображения отличает высокое разрешение, разнообразие лиц и внимание к деталям. Работа по итогам исследования опубликована на сайте Arxiv.
Для создания изображений использован механизм генеративной состязательной нейросети.
Такой подход означает, что одна часть алгоритма, обученная на реальных фото, пытается создавать изображения, пока другая часть не начнет путать их с настоящими.
Результаты такого состязания очень впечатляют: нейросеть создает изображения людей разных возрастов, рас, «снимает» лица с разных ракурсов, реалистично накладывает тени.
Но главное, как подчеркивают создатели, она разбирается в элементах изображений. Лицо для нее — это не просто набор определенным образом окрашенных пикселей. Алгоритм понимает, есть ли на фото очки, залысины, бородка, веснушки, насколько высок лоб и как очерчены скулы.
Чтобы продемонстрировать то, насколько разборчива и щепетильна нейросеть, в Nvidia выпустили видео. В первой части показано, как несколько реальных фото «смешивают» с еще одним контрольным изображением. От него прототипы перенимают мимику, цвет волос и особенности расы. Во второй — как несколько реальных лиц «усредняют» в одно изображение с максимумом общих черт.
Futurism отмечает, что для Nvidia это уже не первая попытка создать «генератор лиц». Одна из ранних разработок была представлена осенью 2017 года. Однако тот ИИ путался в пропорциях, а у фотографий было невысокое разрешение.
В статье также приведены фото кошек, генерированные новым алгоритмом. Они не столь безупречны — на многих изображения пропорции животных, мягко говоря, не идеальны.
В начале декабря Nvidia представила еще одну впечатляющую технологию обработки изображения с помощью ИИ: машину научили перерабатывать реальное окружение в объекты виртуального мира. Если в следующей версии специалисты поработают над детализацией, то делать трехмерные модели и тратить время на рендеринг больше будет не нужно.