«По сравнению с предшественником DALL-E 3 генерирует изображения, которые не только визуально более привлекательные, но и более четкие в деталях. DALL-E 3 может верно рисовать мелкие детали, включая текст, руки и лица. Вдобавок, он особенно хорошо обрабатывает подробные, длинные запросы и умеет поддерживать книжные и альбомные форматы», — написано в пресс-релизе OpenAI.
Вдобавок, DALL-E 3 дает пользователям возможность генерировать текст и типографию на основе изображений, что особенно полезно для маркетинга, брендинга и другого визуального контента для бизнеса. В этом аспекте он превосходит возможности конкурентов, в том числе, Adobe Firefly 2 и Midjourney.
Компания показала несколько примеров того, что можно нарисовать при помощи DALL-E 3 в ChatGPT Plus, в частности, корпоративные логотипы и иллюстрации для школьных проектов. Журналисты Venture Beat, тестировавшие модель несколько дней, особо выделили возможность вести с ИИ живой диалог: просить изменить картинку определенным образом, подвинуть один из элементов или поменять его, не создавая новое изображение.
Помимо доступа к DALL-E 3 компания опубликовала исследование, в котором описала процесс разработки этой генеративной модели и объявила, что занимается созданием классификатора изображений, который может с определенностью 95-99% установить, что изображение было сгенерировано DALL-E 3. Он должен стать ценным инструментом в борьбе против нарушения авторских прав и дезинформации.
Чатбот ChatGPT, выпущенный компанией OpenAI в ноябре прошлого года, без сомнения мощный инструмент, но с ограниченным объемом знаний, который простирается только до сентября 2021 года. В сентябре это изменилось — как сообщила компания в Х, ChatGPT может теперь свободно пользоваться интернетом при поиске информации для ответов за запросы собеседников.