Впервые Midjourney предоставляет единообразные личности для общедоступных изображений ИИ.

Присоединяйтесь к Leaders в Бостоне 27 марта, чтобы провести эксклюзивный вечер общения, идей и разговоров. Запросите приглашение здесь.

Знаменитый сервис генерации изображений искусственного интеллекта В середине полета Он реализовал одну из самых востребованных функций: возможность последовательно воссоздавать персонажей в новых изображениях.

По своей природе на сегодняшний день это является серьезным препятствием для генераторов изображений ИИ.

Это связано с тем, что большинство генераторов изображений ИИ полагаются на «Диффузионные модели«, инструменты, аналогичные или основанные на алгоритме генерации изображений Stability AI с открытым исходным кодом Stable Diffusion, который работает грубо, беря текст, введенный пользователем, и пытаясь собрать попиксельное изображение, соответствующее этому описанию, как мы узнал из аналогичных экспериментов с изображениями и текстовыми тегами в группе. Огромные (и противоречивые) тренировочные данные, включающие миллионы изображений, созданных человеком.

Почему последовательные личности так сильны – и неуловимы – для генеративного ИИ

Однако, как и в случае с большими текстовыми языковыми моделями (LLM), такими как ChatGPT от OpenAI или новый Command-R от Cohere, проблема всех генеративных приложений ИИ заключается в несогласованности ответов: ИИ генерирует что-то новое для каждого введенного в него отдельного приглашения. , даже если утверждение повторяется или используются одни и те же ключевые слова.

событие ВБ

Тур по искусственному интеллекту – Бостон

Мы с нетерпением ждем следующей остановки AI Impact Tour в Бостоне 27 марта. Это эксклюзивное спонсируемое мероприятие, проводимое в партнерстве с Microsoft, будет включать обсуждение лучших практик интеграции данных в 2024 году и в последующий период. Количество мест ограничено, поэтому запросите приглашение сегодня.

Попросите приглашение

Это отлично подходит для создания совершенно новых фрагментов контента — в случае Midjourney — изображений. Но что, если вы снимаете фильм, роман, графический роман, комикс или какой-либо другой визуальный материал, который вам нравится? Одинаковый Персонаж или персонажи, через которых нужно перемещаться и появляться в разных сценах и условиях, с разными выражениями лица и реквизитом?

READ Ученые в Китае, возможно, заново изобрели унитаз

Именно этого сценария, который обычно необходим для непрерывности повествования, до сих пор было очень сложно реализовать с помощью генеративного ИИ. Но Midjourney сейчас работает над этой проблемой, вводя новый тег «-cref» (сокращенно от «ссылка на персонажа»), который пользователи могут добавлять в конец своих текстовых подсказок в Midjourney Discord и пытаться сопоставить лицо персонажа. Характеристики, тип телосложения и даже одежда из URL-адреса, который пользователь вставляет в следующий упомянутый тег.

По мере развития и совершенствования этой функции Midjourney может превратиться из крутой игры или источника идей в более профессиональный инструмент.

Как использовать новую функцию согласования личности Midjourney

Тег лучше всего работает с ранее созданными изображениями Midjourney. Так, например, рабочий процесс пользователя будет заключаться в создании или получении URL-адреса ранее сгенерированного персонажа.

Давайте начнем с нуля и скажем, что мы создаем нового персонажа с такой подсказкой: «Лысый, мускулистый мужчина с бусой и повязкой на глазу».

Мы обновим изображение, которое нам нравится больше всего, затем, удерживая клавишу Control, щелкните его на сервере Midjourney Discord, чтобы найти опцию «Копировать ссылку».

Далее мы можем написать новую подсказку «Наденьте белый смокинг, стоя на вилле». [URL]» и вставьте URL-адрес только что созданного изображения, и Midjourney попытается создать тот же символ, что и раньше, в новых введенных настройках.

Как вы увидите, результаты далеки от первоначальной цифры (или даже от нашего первоначального утверждения), но они, безусловно, обнадеживают.

Кроме того, пользователь может в некоторой степени контролировать «вес» того, насколько близко новое изображение создается к исходному символу, применяя флаг «-cw», за которым следует число от 1 до 100 в конце нового приглашения ( после «-cref [URL]»строка, вот так:»-cref [URL] – CW 100». Чем меньше число «CW», тем выше контрастность результирующего изображения. Чем выше число «CW», тем точнее полученное новое изображение соответствует исходному эталону.

READ macOS 15 Sequoia: обзор Ars Technica

Как вы можете видеть в нашем примере, очень низкий ввод «cw 8» фактически вернул то, что мы хотели: белый смокинг. Хотя сейчас он снял фирменную повязку с глаза нашего персонажа.

Что ж, нет ничего, что «другая область» не могла бы исправить, верно?

Да, повязку надели не на тот глаз… но мы дошли!

Вы также можете объединить несколько символов в один, используя два тега «-cref» вместе с соответствующими URL-адресами.

Эта функция была запущена сегодня вечером, но художники и авторы сейчас ее тестируют. Попробуйте сами, если у вас есть Midjourney. И прочитайте полную заметку основателя Дэвида Хольца по этой теме ниже:

Привет всем, сегодня мы тестируем новую функцию «Ссылка на символ», она похожа на функцию «Ссылка на образец», за исключением того, что вместо сопоставления с эталонным шаблоном она пытается сопоставить символ с изображением ссылки на символ.

Как это работает

Он написал --cref URL После того, как вам будет предложено ввести URL-адрес вашего изображения профиля
вы можете использовать --cw Чтобы отрегулировать «силу» ссылки со 100 на 0.
Сила 100 (--cw 100) По умолчанию и использует лицо, волосы и одежду.
(сильно 0)--cw 0) сосредоточится только на лице (подходит для переодевания/прически и т. д.)

Для чего это предназначено

Эта функция лучше всего работает при использовании персонажей, созданных из изображений Midjourney. Он не предназначен для реальных людей/изображений (и, скорее всего, исказит их, как это делают обычные подсказки к изображениям).
Cref работает аналогично обычным подсказкам изображений, за исключением того, что он «фокусируется» на чертах характера.
Точность этого метода ограничена, он не сможет точно воспроизвести ямочки, веснушки или логотипы на рубашках.
Cref работает с обычными моделями Niji и MJ, а также может комбинироваться с --sref

Расширенные настройки

Вы можете использовать более одного URL-адреса, чтобы смешивать информацию/символы из нескольких изображений, как показано ниже. --cref URL1 URL2 (Это похоже на подсказки с несколькими изображениями или стилями)

Как это работает в альфа-сети?

Перетащите или вставьте изображение на панель визуализации, где оно теперь содержит три значка. Укажите эти группы, являются ли они вектором изображения, ссылкой на стиль или ссылкой на символ. Shift+Выберите вариант использования изображения для нескольких категорий

Помните, что хотя MJ V6 находится на стадии альфа-версии, другие функции могут внезапно измениться, но скоро выйдет официальная бета-версия V6. Мы хотели бы поделиться мыслями об ⁠Идеи и функциях, и мы надеемся, что вам понравится этот ранний выпуск, и мы надеемся, что он поможет вам в создании историй и миров.

Миссия VentureBeat Он должен стать цифровой городской площадью, где лица, принимающие технические решения, смогут получить знания о трансформационных и транзакционных корпоративных технологиях. Откройте для себя наши сводки.

READ Приготовьтесь, на экране блокировки вашего телефона произойдут большие изменения

Kolmogorov Stepanov

«Social media enthusiast. Beer nerd. Angry communicator. Pop culture enthusiast. Prone to bouts of apathy.»

Впервые Midjourney предоставляет единообразные личности для общедоступных изображений ИИ.

Почему последовательные личности так сильны – и неуловимы – для генеративного ИИ

событие ВБ

Как использовать новую функцию согласования личности Midjourney

Nintendo и Pokémon Company официально подали в суд на разработчика Palworld за «множественные» нарушения патентных прав

Ошибка «Сообщения» в iOS 18 приводит к сбою приложения и потере данных, как это исправить

Решение Apple об обновлении определенно является плохой новостью для миллионов пользователей iPhone.

Что снижение ставок ФРС означает для рынка жилья: NPR

Туристка погибла, потеряв ногу в результате нападения акулы во время плавания у Канарских островов.

В 33 сезоне «Танцев со звездами» увеличилось количество зрителей

WNBA предоставляет «Портленду» возможность расширения, которое начнется в 2026 году.

Почему последовательные личности так сильны – и неуловимы – для генеративного ИИ

событие ВБ

Как использовать новую функцию согласования личности Midjourney

Добавить комментарий Отменить ответ

More Stories

Nintendo и Pokémon Company официально подали в суд на разработчика Palworld за «множественные» нарушения патентных прав

Ошибка «Сообщения» в iOS 18 приводит к сбою приложения и потере данных, как это исправить

Решение Apple об обновлении определенно является плохой новостью для миллионов пользователей iPhone.

You may have missed

Что снижение ставок ФРС означает для рынка жилья: NPR

Туристка погибла, потеряв ногу в результате нападения акулы во время плавания у Канарских островов.

В 33 сезоне «Танцев со звездами» увеличилось количество зрителей

WNBA предоставляет «Портленду» возможность расширения, которое начнется в 2026 году.