Digital

01.04.2024 14:51:39
Digital

Нейросеть от OpenAI позволит пользователям заговорить на любом языке с их акцентом

Разработчик ChatGPT, компания OpenAI, показала нейросеть под названием VoiceEngine, которая с помощью текста и одного 15-секундного сэмпла (образца) можетсгенерировать естественную речь. ИИ-модель способна создавать эмоциональные иреалистичные голоса, сообщили вOpenAI.

Особенность нейросети в том, что ИИ-голос может по команде зачитыватьтекстовые подсказки на языке исходника или других языках. Также модельсохраняет родной акцент говорящего.

Нейросеть может помочь авторам контента обращаться к своей аудитории налюбом языке собственным голосом. Компания HeyGen, специализирующаяся насоздании пользовательских человекоподобных аватаров, одна из первых внедрила всвою работу Voice Engine для перевода видео.

Также доступ к технологии получили: платформа в сфере образовательныхтехнологий Age of Learning, производитель программного обеспечения дляздравоохранения Dimagi, разработчик коммуникационных приложений на базеискусственного интеллекта Livox и система здравоохранения Lifespan.

OpenAI рассказала, что ее партнеры согласились соблюдать политикуиспользования Voice Engine, которая запрещает выдавать себя за другоефизическое лицо или организацию без их согласия. Компания требует, чтобыпартнеры получали «явное и осознанное согласие» владельцев голоса, а неуведомляли их уже после записи. Также они должны сообщать своей аудитории, чтозвук, который они слышат, создан искусственным интеллектом. В том числе OpenAIбудет использовать водяные знаки для отслеживания происхождения аудио.

В соответствии с «подходом к безопасности использования ИИ» разработчикиприняли решение предварительно протестировать технологию и не распространять еена широкую аудиторию.

OpenAI предложила несколько шагов, которые снизят риски, связанные сиспользованием такой нейросети. Они включают в себя отказ от голосовойаутентификации для доступа к конфиденциальной информации, использованиеполитики защиты голосов людей в ИИ, информирование общественности о дипфейках ивнедрение методов отслеживания происхождения контента.

OpenAI разработала нейросеть Voice Engine в 2022 г. Технология началаподдерживать предустановленные голоса для APIпреобразования текста в речь и функции чтения вслух с помощью ChatGPT в прошломгоду.

Автор: Pupkin

Источник: ria novosti