Некоторым пользователям случайно попал в руки расширенный звук GPT-4o, и вот что произошло.

Ранее на этой неделе OpenAI объявила, что большинству пользователей придется подождать до осени, чтобы получить доступ к расширенным голосовым функциям GPT-4o, но похоже, что некоторые счастливчики смогли взглянуть на возможности голосового помощника следующего поколения.

Пользователь Reddit Рози Создательница Он был одним из немногих счастливчиков. Они поделились записью нового, никогда ранее не слышанного голоса GPT-4o, рассказывающего ужасную историю со звуковыми эффектами, такими как гром и шаги. Писатель по искусственному интеллекту Самбхав Гупта Клип впервые был выделен на Xчто привлекло к нему более широкое внимание.

Похоже, приезд Рози был ошибкой. В заявлении OpenAI мне сообщили, что некоторым пользователям был предоставлен доступ к модели случайно, но теперь это исправлено.

Что мы можем услышать в опубликованном видео?

Они меня преследовали 🥲 от г/ЧатGPT

До сих пор каждое видео, которое мы получали с улучшенным звуком GPT-4o, находилось под контролем OpenAI, и, хотя оно выглядело потрясающе, оно было ограничено индивидуальными сценариями использования.

Новое видео от RozziTheCreator, кажется, демонстрирует эту способность более естественным образом, включая функцию звуковых эффектов, о которой мы никогда раньше не слышали.

Представьте себе, вот такой маленький городок, все друг друга знают, а в конце улицы стоит домик.
ГПТ-4о

Я написал RozziTheCreator об этом опыте, и они сказали: «Он появился из ниоткуда, выглядел так же, единственная разница была в звуке». Открытие произошло поздно ночью, когда RozziTheCreator пытался задать чат-боту вопрос: «Я обнаружил изменение».

Это длилось всего несколько минут, и, по словам RozziTheCreator, оно было «полно ошибок», поэтому не было времени запечатлеть много, но им удалось записать фрагмент этой удивительной истории.

«Я начал сходить с ума, повторяя и отвечая на то, чего я не говорил», — по словам RozziTheCreator, прежде чем вернуться к нормальному основному голосу, который действительно могут использовать все остальные.

На видео вы можете услышать, как GPT-4o охотно и непринужденно рассказывает свою историю, сопровождаемую звуковыми эффектами. «Представьте себе, есть небольшой городок, все всех знают, и в конце улицы стоит маленький домик», — объясняет он.

История продолжается о двух подростках, которые проверяли дом во время урагана «только с фонариком и телефонами для освещения».

Так что же пошло не так во время развертывания?

(Изображение предоставлено: OpenAI)

OpenAI постепенно внедряет целый ряд новых функций. Пользователи Early Plus должны были получить расширенный звук GPT-4o в этом месяце, но из-за некоторых проблем с безопасностью и опасений по поводу того, готова ли у них аппаратная инфраструктура, это было отложено.

Я спросил OpenAI, что случилось, что привело к тому, что RozziTheCreator получил доступ, и представитель компании сказал мне: «Во время тестирования этой функции мы случайно отправили приглашения небольшому количеству пользователей ChatGPT. Это была ошибка, и мы ее исправили».

Они подтвердили, что первые несколько пользователей Plus получат доступ в следующем месяце, но для большинства людей это займет больше времени. Они объяснили, что первоначальное внедрение будет заключаться в «сборе отзывов и планировании расширения на основе того, что мы узнаем».

Итак, звука для GPT-4o пока нет, но это последний из серии примеров того, как GPT-4o хочет освободиться от своих ограничений и воспользоваться всеми преимуществами своих возможностей. Я лично видел примеры того, как аудиофайлы анализировались в реальном времени в одну минуту, а затем выполнялся код в следующую.

READ «Огня нет» и почему на Звездном поле должно было быть десять планет

Это заставило меня еще больше воодушевиться его полными возможностями и еще больше разозлиться задержкой, хотя это и понятно.

Еще из руководства Тома

Kolmogorov Stepanov

«Social media enthusiast. Beer nerd. Angry communicator. Pop culture enthusiast. Prone to bouts of apathy.»

Некоторым пользователям случайно попал в руки расширенный звук GPT-4o, и вот что произошло.

Nintendo и Pokémon Company официально подали в суд на разработчика Palworld за «множественные» нарушения патентных прав

Ошибка «Сообщения» в iOS 18 приводит к сбою приложения и потере данных, как это исправить

Решение Apple об обновлении определенно является плохой новостью для миллионов пользователей iPhone.

Что снижение ставок ФРС означает для рынка жилья: NPR

Туристка погибла, потеряв ногу в результате нападения акулы во время плавания у Канарских островов.

В 33 сезоне «Танцев со звездами» увеличилось количество зрителей

WNBA предоставляет «Портленду» возможность расширения, которое начнется в 2026 году.

Добавить комментарий Отменить ответ

More Stories