AIGC宇宙 AIGC宇宙

15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型

作者:故渊
2024-03-30 11:50
感谢OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespa
感谢OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。

15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型

OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。

15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型

OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan 等公司开放访问。

在 OpenAI 发布的这些样本中,你可以听到 Age of Learning 利用该技术生成预制 voice-over 内容,以及向学生朗读由 GPT-4 撰写的“实时、个性化回复”。

IT之家附上参考地址

Navigating the Challenges and Opportunities of Synthetic Voices

相关标签:

相关资讯

OpenAI首次官宣语音项目,配音演员警报拉响

文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本输入以及一段 15 秒的音频示例,可以生成既自然又与原声极为接近的语音。值得注意的是,即使是小模型,只需一个 15 秒的样本,也能创造出富有情感且逼真的声音。OpenAI 将这个语音引擎命名为 Voice Engine,首次开发时间是 2022 年末,今天是 Voice Engine 预览版的首次亮相。下面为该语音引擎的一些早期示例,例如可以帮助用户翻译视频和播客等内容,输入一段原始
4/1/2024 11:18:00 AM
机器之心

已预览一年,OpenAI 语音克隆服务 Voice Engine 仍未正式推出

去年三月底,OpenAI 宣布了一项名为 Voice Engine(声音引擎)的人工智能服务的“小规模预览”,声称该技术能够在仅需 15 秒语音的情况下克隆一个人的声音。然而,近一年过去,这项工具仍未正式推出,OpenAI 也未透露其是否会全面上线,以及何时上线。
3/7/2025 5:00:17 PM
远洋

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o
9/22/2024 1:27:00 PM
机器之心
  • 1