OpenAI 语音转写工具 Whisper 被曝存在重大缺陷：会凭空生成大段虚假内容

作者：清源 2024-10-28 08:47

当地时间 27 日，据美联社报道，超过十位软件工程师、开发人员和学术研究人员称，OpenAI 的语音转写工具 Whisper 存在一个重大缺陷：有时会凭空生成大段甚至整句虚假内容。这些专家指出，这些生成的文本（AI在线注：业内通常称为“AI 幻觉”）可能涉及种族言论、暴力措辞，甚至杜撰的医疗建议。专家们认为，这一问题尤其令人担忧，因为 Whisper 已被广泛应用于全球多个行业，包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。

当地时间 27 日，据美联社报道，超过十位软件工程师、开发人员和学术研究人员称，OpenAI 的语音转写工具 Whisper 存在一个重大缺陷：有时会凭空生成大段甚至整句虚假内容。

这些专家指出，这些生成的文本（AI在线注：业内通常称为“AI 幻觉”）可能涉及种族言论、暴力措辞，甚至杜撰的医疗建议。

专家们认为，这一问题尤其令人担忧，因为 Whisper 已被广泛应用于全球多个行业，包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。

更具风险的是，尽管 OpenAI 已提醒不应在“高风险领域”使用该工具，但一些医疗机构仍在匆忙采用基于 Whisper 的工具来记录医生与患者的咨询记录。

报道称，研究人员和工程师在工作中经常遇到 Whisper 的“幻觉”现象，问题的整体规模尚不清楚。例如，密歇根大学一位研究员在研究公共会议时发现，在尝试改进模型前，他所检查的十份音频转录中，八份含有虚构内容。

一位机器学习工程师透露，在最初分析的超过 100 小时 Whisper 转录中，他发现大约一半的内容存在“幻觉”现象。一位开发人员进一步指出，在他用 Whisper 生成的 26000 份转录中，几乎每一份都带有虚构内容。

即便是音质良好的简短音频样本，也未能幸免于这些问题。计算机科学家们的最新研究表明，他们审查的 13000 多段清晰音频片段中，有 187 段出现了“幻觉”现象。

研究人员认为，这一趋势意味着，在数百万条录音中将可能出现数以万计的错误转录。

OpenAI 的发言人表示，该公司持续研究如何减少幻觉，并且感谢研究者的发现，将会在模型更新中采纳反馈。

OpenAI CEO在社交平台征询用户意见，或暗示重返开源之路

OpenAI 的首席执行官 Sam Altman 近日在社交媒体平台 X 上发起了一项调查，询问用户对公司下一步开源开发方向的看法。这一举动发生在 OpenAI 正在经历重大转型的背景下，公司正将其营利部门转变为公益公司。自从获得微软投资以来，OpenAI 与开源的关系发生了显著变化。

2/19/2025 9:57:00 AM

AI在线

苹果新Speech API转录速度惊人，胜过OpenAI Whisper 55%

科技媒体 macstories 发布了一篇关于苹果新推出的 Speech API 的博文，引发了业界的广泛关注。通过对一段时长34分钟、大小达7GB 的4K 视频文件进行转录测试，结果显示，苹果的新 Speech API 仅耗时45秒，速度远超其他同类工具。相较之下，OpenAI 的 Whisper 转录时间为101秒，苹果的技术优势可见一斑，提升了约55% 的效率。

6/18/2025 12:01:54 PM

AI在线

OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首

AI 最臭名昭著的 Bug 是什么？不是代码崩溃，而是「幻觉」—— 模型自信地编造事实，让你真假难辨。这个根本性挑战，是阻碍我们完全信任 AI 的关键障碍。

9/6/2025 9:26:00 PM

机器之心

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷：会凭空生成大段虚假内容

相关资讯

​OpenAI CEO在社交平台征询用户意见，或暗示重返开源之路

苹果新Speech API转录速度惊人，胜过OpenAI Whisper 55%

OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首

OpenAI CEO在社交平台征询用户意见，或暗示重返开源之路