Песни, созданные искусственным интеллектом, становятся длиннее, но не обязательно лучше

Stable Audio 2.0, модель генерации звука Stable AI, теперь позволяет пользователям загружать свои собственные аудиосэмплы, которые они затем могут преобразовывать с помощью подсказок и создавать песни, сгенерированные AI. Но песни пока не получат никаких премий Грэмми.

Первая версия Stable Audio была выпущена в сентябре 2023 года и предлагала некоторым платным пользователям только до 90 секунд, а это означает, что они могли создавать только короткие аудиоклипы для опробования. Stable Audio 2.0 предоставляет полный трехминутный трек, такой же длины, как и большинство песен для радио. Все загруженные аудиофайлы должны быть защищены авторскими правами.

В отличие от модели генерации голоса OpenAI, Voice Engine, которая доступна только избранной группе пользователей, Stability AI сделала статический голос бесплатным и общедоступным через свой веб-сайт, а вскоре и через свой API.

По словам Stability AI, одно большое различие между Stable Audio 2.0 и его предыдущей версией — это возможность создавать песни, которые звучат как песни, дополненные вступлением, развитием и завершением.

Компания позволила мне немного поиграть со Stable Audio, чтобы посмотреть, как он работает, и скажем так, мне еще предстоит пройти долгий путь, прежде чем я смогу направить свою внутреннюю Бейонсе. С «поп-песней с атмосферой Америки» (кстати, я имел в виду Америку) Stable Audio выпустила песню, которая по частям звучит так, как будто она принадлежит плейлисту Mountain Vibes Wednesday Morning Spotify. Но она также добавила, как мне кажется, вокал? последний край Репортер утверждает, что это похоже на шум китов. Меня больше беспокоит то, что я случайно пригласил Киану к себе домой.

Теоретически я мог бы настроить звук так, чтобы он больше соответствовал моему стилю прослушивания, поскольку новые функции Stable Audio 2.0 позволяют пользователям настраивать свой проект, регулируя силу подсказки (то есть, какую часть подсказки следует следовать) и объем загруженного аудио. будет модулировать. Пользователи также могут добавлять звуковые эффекты, такие как рев аудитории или щелчки клавиатуры.

READ Итоги: комментарии к серии Klonoa Phantasy Reverie

Помимо странных звуков Whale Gregory, неудивительно, что песни, сгенерированные искусственным интеллектом, по-прежнему звучат странно и бездушно. мой коллега Уэс Дэвис подумал об этом после прослушивания песни, созданной Соно. Другие компании, такие как Meta и Google, также пробовали создавать звук с помощью искусственного интеллекта, но не публиковали свои модели, поскольку собирают отзывы разработчиков, чтобы решить проблему бездушного звука.

Stable Audio обучалась на данных AudioSparx, библиотека которой насчитывает более 800 000 аудиофайлов, говорится в пресс-релизе Stable AI. Stability AI подтверждает, что артистам AudioSparx разрешено отказаться от использования своих материалов для обучения модели. Аудио-обучение, защищенное авторским правом, было одной из причин, по которой бывший вице-президент Stable AI по аудио Эд Ньютон-Рекс покинул компанию вскоре после запуска Stable Audio. В этом выпуске Stability AI заявляет, что заключила партнерское соглашение с Audible Magic, чтобы использовать свою технологию распознавания контента для отслеживания материалов, защищенных авторским правом, и блокировки их попадания на платформу.

Stable Audio 2.0 лучше предыдущей версии делает песни похожими на песни, но его еще нет. Если модель настаивает на добавлении вокала, возможно, в следующей версии язык будет более понятным.

Kolmogorov Stepanov

«Social media enthusiast. Beer nerd. Angry communicator. Pop culture enthusiast. Prone to bouts of apathy.»

Песни, созданные искусственным интеллектом, становятся длиннее, но не обязательно лучше

Nintendo и Pokémon Company официально подали в суд на разработчика Palworld за «множественные» нарушения патентных прав

Ошибка «Сообщения» в iOS 18 приводит к сбою приложения и потере данных, как это исправить

Решение Apple об обновлении определенно является плохой новостью для миллионов пользователей iPhone.

Что снижение ставок ФРС означает для рынка жилья: NPR

Туристка погибла, потеряв ногу в результате нападения акулы во время плавания у Канарских островов.

В 33 сезоне «Танцев со звездами» увеличилось количество зрителей

WNBA предоставляет «Портленду» возможность расширения, которое начнется в 2026 году.

Добавить комментарий Отменить ответ

More Stories