Авторы изображений: Брайс Дурбин / TechCrunch
OpenAI сегодня представила обновленную версию своего инструмента преобразования текста в изображение DALL-E, который использует ChatGPT — вирусный чат-бот OpenAI — для облегчения подсказок.
Большинство современных сложных инструментов для создания изображений на базе искусственного интеллекта принимают подсказки — описания изображений — и превращают их в произведения искусства в различных стилях — от фотореалистичных до фэнтезийных. Но создание правильного вектора может оказаться настолько сложной задачей, что «гибкая инженерия» стала настоящей профессией.
Новый инструмент OpenAI, DALL-E 3, использует ChatGPT для заполнения претензий. Через ChatGPT подписчики премиальных планов OpenAI ChatGPT, ChatGPT Plus и ChatGPT Enterprise, могут написать запрос на изображение и уточнить его посредством разговоров с чат-ботом, получая результаты непосредственно в приложении чата.
ChatGPT возьмет короткую подсказку, состоящую не более чем из нескольких слов, и сделает ее более описательной, предоставляя больше информации о модели DALL-E 3.
Интеграция ChatGPT — не единственное нововведение в DALL-E 3. DALL-E 3 также создает изображения более высокого качества, которые более точно отражают подсказки, говорит OpenAI, особенно при работе с более длинными подсказками. Он лучше обрабатывает контент, который исторически мешал моделям генерации изображений, например текст и человеческие руки.
Кроме того, DALL-E 3 имеет новые механизмы для уменьшения алгоритмической предвзятости и повышения безопасности, по крайней мере, так утверждает OpenAI. Например, DALL-E 3 отклонит запросы на создание портретов в стиле ныне живущих художников или изображений общественных деятелей. Теперь художники могут отказаться от использования некоторых или всех своих произведений искусства для обучения будущих поколений моделей OpenAI преобразованию текста в изображение. (OpenAI вместе с некоторыми своими конкурентами сталкивается с судебным иском за предположительное использование работ художников, защищенных авторским правом, для обучения своих генеративных моделей изображений ИИ.)
Запуск DALL-E 3 происходит на фоне обострения гонки за генеративный искусственный интеллект, особенно в области синтеза изображений. Конкуренты, такие как Midjourney и Stability AI, продолжают совершенствовать свои модели генерации изображений, заставляя OpenAI оставаться на плаву.
OpenAI планирует представить DALL-E 3 премиум-пользователям ChatGPT в октябре, а затем исследовательским лабораториям и клиентам API. Компания не сообщила, когда (и планирует ли) она выпустить бесплатный веб-инструмент, как это было с DALL-E 2 и оригинальной моделью DALL-E.
More Stories
Nintendo запускает музыкальное приложение с темами из Марио и Зельды и, что более важно, канал Wii Shop.
Загрузки Call of Duty: Black Ops 6 позволяют максимально эффективно использовать Интернет
Интересные факты M4 Mac mini: изменения в дизайне, поддержка внешнего дисплея и многое другое