Компания OpenAI представила Dall-E 3, последнюю версию своего инструмента преобразования текста в изображение, использующего чрезвычайно популярный чат-бот с искусственным интеллектом ChatGPT для заполнения подсказок. Об этом сообщает Reuters.
Dall-E 3 будет доступен клиентам ChatGPT Plus и Enterprise в октябре. Пользователи могут ввести запрос на изображение и настроить подсказки при разговоре с ChatGPT.
«DALL-E 3 может превращать детализированные запросы в чрезвычайно подробные и точные изображения», – говорится в заявлении компании.
Она с более высокой точностью соблюдает «сложные запросы» — например, если пользователь просит нарисовать «сюжет с конкретными объектами и задает отношение между ними».
OpenAI заявила, что последняя версия инструмента будет иметь больше гарантий, таких как ограничение возможности создания контента, содержащего насилие, контент для взрослых или разжигающий ненависть.
DALL-E 3 будет «отклонять» запросы, в которых ее просят нарисовать картину в нынешнем стиле художника (последние также могут оставить заявку OpenAI, чтобы та не использовала их работы для обучения своих будущих моделей). Среди других ограничений – запрет на изображение известных личностей.
В гонке по созданию точных инструментов искусственного интеллекта для преобразования текста в изображение в OpenAI есть несколько конкурентов, в том числе компании Alibaba Tongyi Wanxiang, Midjourney и Stability AI, продолжающие совершенствовать свои модели генерации изображений.
Генерировать изображение можно будет через чат-бот ChatGPT. В октябре 2023 года модель будет доступна через API подписчикам платных тарифов ChatGPT-Plus и Enterprise. Появится ли бесплатная версия – неизвестно.
Сгенерированные изображения можно монетизировать, не получая дополнительного разрешения OpenAI, как и в случае с DALL-E 2.
Разработчик отмечает, что разница как генерация особенно видна, если сравнивать результаты, которые DALL-E 2 и DALL-E 3 выдают по тому же запросу.
Также модель лучше справляется с такими сложными для искусственного интеллекта мельчайшими деталями, как человеческие руки. DALL-E 3 сможет точно показать сцену с конкретными объектами и учесть, как они связаны друг с другом, как показано на рисунке ниже.
OpenAI также показала другие примеры сгенерированных изображений.
Подписывайтесь на наш Тelegram-канал t.me/sudua, на Twitter, а также на нашу страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.