Присоединяйтесь к Leaders в Бостоне 27 марта, чтобы провести эксклюзивный вечер общения, идей и разговоров. Запросите приглашение здесь.
Знаменитый сервис генерации изображений искусственного интеллекта В середине полета Он реализовал одну из самых востребованных функций: возможность последовательно воссоздавать персонажей в новых изображениях.
По своей природе на сегодняшний день это является серьезным препятствием для генераторов изображений ИИ.
Это связано с тем, что большинство генераторов изображений ИИ полагаются на «Диффузионные модели«, инструменты, аналогичные или основанные на алгоритме генерации изображений Stability AI с открытым исходным кодом Stable Diffusion, который работает грубо, беря текст, введенный пользователем, и пытаясь собрать попиксельное изображение, соответствующее этому описанию, как мы узнал из аналогичных экспериментов с изображениями и текстовыми тегами в группе. Огромные (и противоречивые) тренировочные данные, включающие миллионы изображений, созданных человеком.
Почему последовательные личности так сильны – и неуловимы – для генеративного ИИ
Однако, как и в случае с большими текстовыми языковыми моделями (LLM), такими как ChatGPT от OpenAI или новый Command-R от Cohere, проблема всех генеративных приложений ИИ заключается в несогласованности ответов: ИИ генерирует что-то новое для каждого введенного в него отдельного приглашения. , даже если утверждение повторяется или используются одни и те же ключевые слова.
событие ВБ
Тур по искусственному интеллекту – Бостон
Попросите приглашение
Это отлично подходит для создания совершенно новых фрагментов контента — в случае Midjourney — изображений. Но что, если вы снимаете фильм, роман, графический роман, комикс или какой-либо другой визуальный материал, который вам нравится? Одинаковый Персонаж или персонажи, через которых нужно перемещаться и появляться в разных сценах и условиях, с разными выражениями лица и реквизитом?
Именно этого сценария, который обычно необходим для непрерывности повествования, до сих пор было очень сложно реализовать с помощью генеративного ИИ. Но Midjourney сейчас работает над этой проблемой, вводя новый тег «-cref» (сокращенно от «ссылка на персонажа»), который пользователи могут добавлять в конец своих текстовых подсказок в Midjourney Discord и пытаться сопоставить лицо персонажа. Характеристики, тип телосложения и даже одежда из URL-адреса, который пользователь вставляет в следующий упомянутый тег.
По мере развития и совершенствования этой функции Midjourney может превратиться из крутой игры или источника идей в более профессиональный инструмент.
Как использовать новую функцию согласования личности Midjourney
Тег лучше всего работает с ранее созданными изображениями Midjourney. Так, например, рабочий процесс пользователя будет заключаться в создании или получении URL-адреса ранее сгенерированного персонажа.
Давайте начнем с нуля и скажем, что мы создаем нового персонажа с такой подсказкой: «Лысый, мускулистый мужчина с бусой и повязкой на глазу».
Мы обновим изображение, которое нам нравится больше всего, затем, удерживая клавишу Control, щелкните его на сервере Midjourney Discord, чтобы найти опцию «Копировать ссылку».
Далее мы можем написать новую подсказку «Наденьте белый смокинг, стоя на вилле». [URL]» и вставьте URL-адрес только что созданного изображения, и Midjourney попытается создать тот же символ, что и раньше, в новых введенных настройках.
Как вы увидите, результаты далеки от первоначальной цифры (или даже от нашего первоначального утверждения), но они, безусловно, обнадеживают.
Кроме того, пользователь может в некоторой степени контролировать «вес» того, насколько близко новое изображение создается к исходному символу, применяя флаг «-cw», за которым следует число от 1 до 100 в конце нового приглашения ( после «-cref [URL]»строка, вот так:»-cref [URL] – CW 100». Чем меньше число «CW», тем выше контрастность результирующего изображения. Чем выше число «CW», тем точнее полученное новое изображение соответствует исходному эталону.
Как вы можете видеть в нашем примере, очень низкий ввод «cw 8» фактически вернул то, что мы хотели: белый смокинг. Хотя сейчас он снял фирменную повязку с глаза нашего персонажа.
Что ж, нет ничего, что «другая область» не могла бы исправить, верно?
Да, повязку надели не на тот глаз… но мы дошли!
Вы также можете объединить несколько символов в один, используя два тега «-cref» вместе с соответствующими URL-адресами.
Эта функция была запущена сегодня вечером, но художники и авторы сейчас ее тестируют. Попробуйте сами, если у вас есть Midjourney. И прочитайте полную заметку основателя Дэвида Хольца по этой теме ниже:
Привет всем, сегодня мы тестируем новую функцию «Ссылка на символ», она похожа на функцию «Ссылка на образец», за исключением того, что вместо сопоставления с эталонным шаблоном она пытается сопоставить символ с изображением ссылки на символ.
Как это работает
- Он написал
--cref URL
После того, как вам будет предложено ввести URL-адрес вашего изображения профиля - вы можете использовать
--cw
Чтобы отрегулировать «силу» ссылки со 100 на 0. - Сила 100 (
--cw 100
) По умолчанию и использует лицо, волосы и одежду. - (сильно 0)
--cw 0
) сосредоточится только на лице (подходит для переодевания/прически и т. д.)
Для чего это предназначено
- Эта функция лучше всего работает при использовании персонажей, созданных из изображений Midjourney. Он не предназначен для реальных людей/изображений (и, скорее всего, исказит их, как это делают обычные подсказки к изображениям).
- Cref работает аналогично обычным подсказкам изображений, за исключением того, что он «фокусируется» на чертах характера.
- Точность этого метода ограничена, он не сможет точно воспроизвести ямочки, веснушки или логотипы на рубашках.
- Cref работает с обычными моделями Niji и MJ, а также может комбинироваться с
--sref
Расширенные настройки
- Вы можете использовать более одного URL-адреса, чтобы смешивать информацию/символы из нескольких изображений, как показано ниже.
--cref URL1 URL2
(Это похоже на подсказки с несколькими изображениями или стилями)
Как это работает в альфа-сети?
- Перетащите или вставьте изображение на панель визуализации, где оно теперь содержит три значка. Укажите эти группы, являются ли они вектором изображения, ссылкой на стиль или ссылкой на символ. Shift+Выберите вариант использования изображения для нескольких категорий
Помните, что хотя MJ V6 находится на стадии альфа-версии, другие функции могут внезапно измениться, но скоро выйдет официальная бета-версия V6. Мы хотели бы поделиться мыслями об Идеи и функциях, и мы надеемся, что вам понравится этот ранний выпуск, и мы надеемся, что он поможет вам в создании историй и миров.
Миссия VentureBeat Он должен стать цифровой городской площадью, где лица, принимающие технические решения, смогут получить знания о трансформационных и транзакционных корпоративных технологиях. Откройте для себя наши сводки.
More Stories
Nintendo запускает музыкальное приложение с темами из Марио и Зельды и, что более важно, канал Wii Shop.
Загрузки Call of Duty: Black Ops 6 позволяют максимально эффективно использовать Интернет
Интересные факты M4 Mac mini: изменения в дизайне, поддержка внешнего дисплея и многое другое