Ранее на этой неделе OpenAI объявила, что большинству пользователей придется подождать до осени, чтобы получить доступ к расширенным голосовым функциям GPT-4o, но похоже, что некоторые счастливчики смогли взглянуть на возможности голосового помощника следующего поколения.
Пользователь Reddit Рози Создательница Он был одним из немногих счастливчиков. Они поделились записью нового, никогда ранее не слышанного голоса GPT-4o, рассказывающего ужасную историю со звуковыми эффектами, такими как гром и шаги. Писатель по искусственному интеллекту Самбхав Гупта Клип впервые был выделен на Xчто привлекло к нему более широкое внимание.
Похоже, приезд Рози был ошибкой. В заявлении OpenAI мне сообщили, что некоторым пользователям был предоставлен доступ к модели случайно, но теперь это исправлено.
Что мы можем услышать в опубликованном видео?
До сих пор каждое видео, которое мы получали с улучшенным звуком GPT-4o, находилось под контролем OpenAI, и, хотя оно выглядело потрясающе, оно было ограничено индивидуальными сценариями использования.
Новое видео от RozziTheCreator, кажется, демонстрирует эту способность более естественным образом, включая функцию звуковых эффектов, о которой мы никогда раньше не слышали.
Я написал RozziTheCreator об этом опыте, и они сказали: «Он появился из ниоткуда, выглядел так же, единственная разница была в звуке». Открытие произошло поздно ночью, когда RozziTheCreator пытался задать чат-боту вопрос: «Я обнаружил изменение».
Это длилось всего несколько минут, и, по словам RozziTheCreator, оно было «полно ошибок», поэтому не было времени запечатлеть много, но им удалось записать фрагмент этой удивительной истории.
«Я начал сходить с ума, повторяя и отвечая на то, чего я не говорил», — по словам RozziTheCreator, прежде чем вернуться к нормальному основному голосу, который действительно могут использовать все остальные.
На видео вы можете услышать, как GPT-4o охотно и непринужденно рассказывает свою историю, сопровождаемую звуковыми эффектами. «Представьте себе, есть небольшой городок, все всех знают, и в конце улицы стоит маленький домик», — объясняет он.
История продолжается о двух подростках, которые проверяли дом во время урагана «только с фонариком и телефонами для освещения».
Так что же пошло не так во время развертывания?
OpenAI постепенно внедряет целый ряд новых функций. Пользователи Early Plus должны были получить расширенный звук GPT-4o в этом месяце, но из-за некоторых проблем с безопасностью и опасений по поводу того, готова ли у них аппаратная инфраструктура, это было отложено.
Я спросил OpenAI, что случилось, что привело к тому, что RozziTheCreator получил доступ, и представитель компании сказал мне: «Во время тестирования этой функции мы случайно отправили приглашения небольшому количеству пользователей ChatGPT. Это была ошибка, и мы ее исправили».
Они подтвердили, что первые несколько пользователей Plus получат доступ в следующем месяце, но для большинства людей это займет больше времени. Они объяснили, что первоначальное внедрение будет заключаться в «сборе отзывов и планировании расширения на основе того, что мы узнаем».
Итак, звука для GPT-4o пока нет, но это последний из серии примеров того, как GPT-4o хочет освободиться от своих ограничений и воспользоваться всеми преимуществами своих возможностей. Я лично видел примеры того, как аудиофайлы анализировались в реальном времени в одну минуту, а затем выполнялся код в следующую.
Это заставило меня еще больше воодушевиться его полными возможностями и еще больше разозлиться задержкой, хотя это и понятно.
More Stories
Nintendo запускает музыкальное приложение с темами из Марио и Зельды и, что более важно, канал Wii Shop.
Загрузки Call of Duty: Black Ops 6 позволяют максимально эффективно использовать Интернет
Интересные факты M4 Mac mini: изменения в дизайне, поддержка внешнего дисплея и многое другое