OpenAI представила новую версию генератора изображений DALL-E 3 – он лучше понимает людей

13:03, 21 сентября 2023

Новая модель может точно изобразить сцену с конкретными объектами и взаимосвязями между ними.

OpenAI представила новую версию генератора изображений DALL-E 3 – он лучше понимает людей

Следите за актуальными новостями в соцсетях SUD.UA

Компания OpenAI представила Dall-E 3, последнюю версию своего инструмента преобразования текста в изображение, использующего чрезвычайно популярный чат-бот с искусственным интеллектом ChatGPT для заполнения подсказок. Об этом сообщает Reuters.

Dall-E 3 будет доступен клиентам ChatGPT Plus и Enterprise в октябре. Пользователи могут ввести запрос на изображение и настроить подсказки при разговоре с ChatGPT.

«DALL-E 3 может превращать детализированные запросы в чрезвычайно подробные и точные изображения», – говорится в заявлении компании.

Она с более высокой точностью соблюдает «сложные запросы» — например, если пользователь просит нарисовать «сюжет с конкретными объектами и задает отношение между ними».

OpenAI заявила, что последняя версия инструмента будет иметь больше гарантий, таких как ограничение возможности создания контента, содержащего насилие, контент для взрослых или разжигающий ненависть.

DALL-E 3 будет «отклонять» запросы, в которых ее просят нарисовать картину в нынешнем стиле художника (последние также могут оставить заявку OpenAI, чтобы та не использовала их работы для обучения своих будущих моделей). Среди других ограничений – запрет на изображение известных личностей.

В гонке по созданию точных инструментов искусственного интеллекта для преобразования текста в изображение в OpenAI есть несколько конкурентов, в том числе компании Alibaba Tongyi Wanxiang, Midjourney и Stability AI, продолжающие совершенствовать свои модели генерации изображений.

Генерировать изображение можно будет через чат-бот ChatGPT. В октябре 2023 года модель будет доступна через API подписчикам платных тарифов ChatGPT-Plus и Enterprise. Появится ли бесплатная версия – неизвестно.

Сгенерированные изображения можно монетизировать, не получая дополнительного разрешения OpenAI, как и в случае с DALL-E 2.

Разработчик отмечает, что разница как генерация особенно видна, если сравнивать результаты, которые DALL-E 2 и DALL-E 3 выдают по тому же запросу.

Также модель лучше справляется с такими сложными для искусственного интеллекта мельчайшими деталями, как человеческие руки. DALL-E 3 сможет точно показать сцену с конкретными объектами и учесть, как они связаны друг с другом, как показано на рисунке ниже.

OpenAI также показала другие примеры сгенерированных изображений.

Подписывайтесь на наш Тelegram-канал t.me/sudua, на Twitter, а также на нашу страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.

OpenAI представила новую версию генератора изображений DALL-E 3 – он лучше понимает людей

Читайте также