AIGC宇宙 AIGC宇宙

语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具

作者:远洋
2024-06-10 09:57
OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份声明中表示,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育,以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑,即可

OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。

语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具

图源 Pexels

“无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份声明中表示,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育,以及我们如何围绕该技术实施安全措施的原因。”

据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑,即可“生成听起来自然的人声,并与原始说话人非常相似”。该工具可以创建以假乱真的多语言人物声音,当时该公司表示他们选择预览这项技术而非大规模发布,是为了“增强社会抵御能力”,以应对“越来越逼真的人工智能生成模型”带来的威胁。

作为这些努力的一部分,OpenAI 表示他们正在积极淘汰使用语音识别进行银行账户验证的方式,探索保护个人声音在人工智能中使用的政策,教育公众有关人工智能的风险,并加快开发跟踪视听内容的技术,以便用户识别他们是在与真人还是合成内容进行互动。

然而,尽管做出了上述努力,人们对这项技术的担忧仍然存在。美国总统拜登的人工智能负责人布鲁斯・里德 (Bruce Reed) 曾表示,声音克隆技术是他夜不能寐的原因之一。美国联邦贸易委员会 (Federal Trade Commission) 今年 3 月表示,诈骗分子正在利用人工智能技术来提高他们欺诈行为的可信度,他们使用声音克隆工具,使得人们更难区分人工智能生成的声音和人类的声音。

OpenAI 在周五更新的声明中试图缓解这些担忧,“我们继续与来自政府、媒体、娱乐、教育、民间社会等领域的美国和国际合作伙伴接触,以确保我们在构建过程中纳入他们的反馈。”该公司还指出,一旦“语音引擎”配备了其最新模型 GPT-4o,它也将带来新的威胁。该公司表示,他们内部正在积极地“对 GPT-4o 进行‘红队测试’,以识别和解决来自社会心理学、偏见和公平以及错误信息等领域的已知和未知风险。”

相关资讯

OpenAI ChatGPT 被曝将新增 8 种新语音:更自然表达狗叫等动物声音

科技媒体 testingcatalog 昨日(9 月 2 日)发布博文,报道称通过逆向工程 ChatGPT 应用,发现 OpenAI 即将扩充添加语音,让朗读的声音更加自然和富有表现力。有迹象表明 OpenAI 未来可能会额外推出 8 种新的语音,每种语音都有一个独特的代号,后续可能会逐步推出。这些新声音的另一个有趣特点是,它们能够更自然地表达声音,如动物叫声或其他非语言声音。此外,在朗读加粗或斜体的文字时,它们还能传达或强调特定的情绪。不过,重要的是要记住,这些仍然是 TTS(文本到语音)语音,很可能与目前处于
9/3/2024 7:17:40 AM
故渊

斯嘉丽・约翰逊控诉 ChatGPT 复制其声音,OpenAI 文件显示并非故意模仿

好莱坞明星斯嘉丽・约翰逊此前指控人工智能公司 OpenAI 的聊天机器人 ChatGPT 的 “Sky” 语音上复制了她的声音。据《华盛顿邮报》披露的 OpenAI 内部文件显示,该公司并没有刻意模仿斯嘉丽的声音。图源 Pexels文件显示,为“Sky”配音的实际上是另一位演员,而且该演员的聘用时间早于 OpenAI 邀请斯嘉丽为 ChatGPT 配音数月。参与“Sky”配音创作的多位人员也证实,OpenAI 在寻找配音演员时并没有要求声音接近斯嘉丽。文件显示,OpenAI 在招聘启事中对配音演员的描述包括:非工会
5/23/2024 4:50:34 PM
远洋

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供

感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道,OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G
5/14/2024 1:25:13 AM
远洋
  • 1