6 октября, 2024

Orsk.today

Будьте в курсе последних событий в России благодаря новостям Орска, эксклюзивным видеоматериалам, фотографиям и обновленным картам.

Песни, созданные искусственным интеллектом, становятся длиннее, но не обязательно лучше

Песни, созданные искусственным интеллектом, становятся длиннее, но не обязательно лучше

Stable Audio 2.0, модель генерации звука Stable AI, теперь позволяет пользователям загружать свои собственные аудиосэмплы, которые они затем могут преобразовывать с помощью подсказок и создавать песни, сгенерированные AI. Но песни пока не получат никаких премий Грэмми.

Первая версия Stable Audio была выпущена в сентябре 2023 года и предлагала некоторым платным пользователям только до 90 секунд, а это означает, что они могли создавать только короткие аудиоклипы для опробования. Stable Audio 2.0 предоставляет полный трехминутный трек, такой же длины, как и большинство песен для радио. Все загруженные аудиофайлы должны быть защищены авторскими правами.

В отличие от модели генерации голоса OpenAI, Voice Engine, которая доступна только избранной группе пользователей, Stability AI сделала статический голос бесплатным и общедоступным через свой веб-сайт, а вскоре и через свой API.

По словам Stability AI, одно большое различие между Stable Audio 2.0 и его предыдущей версией — это возможность создавать песни, которые звучат как песни, дополненные вступлением, развитием и завершением.

Компания позволила мне немного поиграть со Stable Audio, чтобы посмотреть, как он работает, и скажем так, мне еще предстоит пройти долгий путь, прежде чем я смогу направить свою внутреннюю Бейонсе. С «поп-песней с атмосферой Америки» (кстати, я имел в виду Америку) Stable Audio выпустила песню, которая по частям звучит так, как будто она принадлежит плейлисту Mountain Vibes Wednesday Morning Spotify. Но она также добавила, как мне кажется, вокал? последний край Репортер утверждает, что это похоже на шум китов. Меня больше беспокоит то, что я случайно пригласил Киану к себе домой.

Теоретически я мог бы настроить звук так, чтобы он больше соответствовал моему стилю прослушивания, поскольку новые функции Stable Audio 2.0 позволяют пользователям настраивать свой проект, регулируя силу подсказки (то есть, какую часть подсказки следует следовать) и объем загруженного аудио. будет модулировать. Пользователи также могут добавлять звуковые эффекты, такие как рев аудитории или щелчки клавиатуры.

READ  FromSoftware Boss не допустит увольнений в студии, отмечает Сатору Ивата

Помимо странных звуков Whale Gregory, неудивительно, что песни, сгенерированные искусственным интеллектом, по-прежнему звучат странно и бездушно. мой коллега Уэс Дэвис подумал об этом после прослушивания песни, созданной Соно. Другие компании, такие как Meta и Google, также пробовали создавать звук с помощью искусственного интеллекта, но не публиковали свои модели, поскольку собирают отзывы разработчиков, чтобы решить проблему бездушного звука.

Stable Audio обучалась на данных AudioSparx, библиотека которой насчитывает более 800 000 аудиофайлов, говорится в пресс-релизе Stable AI. Stability AI подтверждает, что артистам AudioSparx разрешено отказаться от использования своих материалов для обучения модели. Аудио-обучение, защищенное авторским правом, было одной из причин, по которой бывший вице-президент Stable AI по аудио Эд Ньютон-Рекс покинул компанию вскоре после запуска Stable Audio. В этом выпуске Stability AI заявляет, что заключила партнерское соглашение с Audible Magic, чтобы использовать свою технологию распознавания контента для отслеживания материалов, защищенных авторским правом, и блокировки их попадания на платформу.

Stable Audio 2.0 лучше предыдущей версии делает песни похожими на песни, но его еще нет. Если модель настаивает на добавлении вокала, возможно, в следующей версии язык будет более понятным.