Нейросеть от OpenAI позволит пользователям заговорить на любом языке с их акцентом
Разработчик ChatGPT, компания OpenAI, показала нейросеть под названием VoiceEngine, которая с помощью текста и одного 15-секундного сэмпла (образца) можетсгенерировать естественную речь. ИИ-модель способна создавать эмоциональные иреалистичные голоса, сообщили вOpenAI.
Особенность нейросети в том, что ИИ-голос может по команде зачитыватьтекстовые подсказки на языке исходника или других языках. Также модельсохраняет родной акцент говорящего.
Нейросеть может помочь авторам контента обращаться к своей аудитории налюбом языке собственным голосом. Компания HeyGen, специализирующаяся насоздании пользовательских человекоподобных аватаров, одна из первых внедрила всвою работу Voice Engine для перевода видео.
Также доступ к технологии получили: платформа в сфере образовательныхтехнологий Age of Learning, производитель программного обеспечения дляздравоохранения Dimagi, разработчик коммуникационных приложений на базеискусственного интеллекта Livox и система здравоохранения Lifespan.
OpenAI рассказала, что ее партнеры согласились соблюдать политикуиспользования Voice Engine, которая запрещает выдавать себя за другоефизическое лицо или организацию без их согласия. Компания требует, чтобыпартнеры получали «явное и осознанное согласие» владельцев голоса, а неуведомляли их уже после записи. Также они должны сообщать своей аудитории, чтозвук, который они слышат, создан искусственным интеллектом. В том числе OpenAIбудет использовать водяные знаки для отслеживания происхождения аудио.
В соответствии с «подходом к безопасности использования ИИ» разработчикиприняли решение предварительно протестировать технологию и не распространять еена широкую аудиторию.
OpenAI предложила несколько шагов, которые снизят риски, связанные сиспользованием такой нейросети. Они включают в себя отказ от голосовойаутентификации для доступа к конфиденциальной информации, использованиеполитики защиты голосов людей в ИИ, информирование общественности о дипфейках ивнедрение методов отслеживания происхождения контента.
OpenAI разработала нейросеть Voice Engine в 2022 г. Технология началаподдерживать предустановленные голоса для APIпреобразования текста в речь и функции чтения вслух с помощью ChatGPT в прошломгоду.

Источник: ria novosti