AIGC宇宙 AIGC宇宙

苹果新Speech API转录速度惊人,胜过OpenAI Whisper 55%

科技媒体 macstories 发布了一篇关于苹果新推出的 Speech API 的博文,引发了业界的广泛关注。 通过对一段时长34分钟、大小达7GB 的4K 视频文件进行转录测试,结果显示,苹果的新 Speech API 仅耗时45秒,速度远超其他同类工具。 相较之下,OpenAI 的 Whisper 转录时间为101秒,苹果的技术优势可见一斑,提升了约55% 的效率。

科技媒体 macstories 发布了一篇关于苹果新推出的 Speech API 的博文,引发了业界的广泛关注。通过对一段时长34分钟、大小达7GB 的4K 视频文件进行转录测试,结果显示,苹果的新 Speech API 仅耗时45秒,速度远超其他同类工具。相较之下,OpenAI 的 Whisper 转录时间为101秒,苹果的技术优势可见一斑,提升了约55% 的效率。

image.png

苹果在2025年全球开发者大会 WWDC 上首次宣布了这一 Speech 框架,框架中包含了 SpeechAnalyzer 和 SpeechTranscriber 两款模块。这一技术的推出,标志着苹果在语音处理领域的进一步突破,尤其是在速度和准确性方面的提升。

在具体的测试中,媒体使用了基于新模块开发的 Yap 应用进行转录。通过对比不同工具的表现,Yap 以45秒的快速转录时间,成为了市场上表现最优的选择。相对而言,MacWhisper(基于 OpenAI 的 Whisper 开源语音转录模型)需要1分41秒,而 VidCap 则需要1分55秒。更早版本的 MacWhisper(V2)甚至要耗时3分55秒。

虽然所有测试工具在识别专有名词时都出现了一定误差,比如 “AppStories” 的识别,但 Yap 在本地化运算上的优势,确保了其在处理多段视频时的效率更为显著。通过计算每周处理多段视频所节省的时间,用户可以显著提高工作效率。

image.png

这项技术的快速发展,不仅为视频内容创作者提供了便利,也为后续的应用场景拓展奠定了基础。未来,随着 AI 技术的不断演进,苹果在语音识别领域可能会推出更多创新的解决方案,进一步提升用户体验。

划重点:

🌟 苹果新 Speech API 转录34分钟4K 视频仅需45秒,速度超越竞争对手。  

⏱️ 与 OpenAI Whisper 相比,苹果技术提升了约55% 的效率,表现显著。  

📈 本地化运算优势使 Yap 在多段视频处理上效率更高,为用户节省大量时间。

相关资讯

​OpenAI CEO在社交平台征询用户意见,或暗示重返开源之路

OpenAI 的首席执行官 Sam Altman 近日在社交媒体平台 X 上发起了一项调查,询问用户对公司下一步开源开发方向的看法。 这一举动发生在 OpenAI 正在经历重大转型的背景下,公司正将其营利部门转变为公益公司。 自从获得微软投资以来,OpenAI 与开源的关系发生了显著变化。
2/19/2025 9:57:00 AM
AI在线

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷:会凭空生成大段虚假内容

当地时间 27 日,据美联社报道,超过十位软件工程师、开发人员和学术研究人员称,OpenAI 的语音转写工具 Whisper 存在一个重大缺陷:有时会凭空生成大段甚至整句虚假内容。 这些专家指出,这些生成的文本(AI在线注:业内通常称为“AI 幻觉”)可能涉及种族言论、暴力措辞,甚至杜撰的医疗建议。 专家们认为,这一问题尤其令人担忧,因为 Whisper 已被广泛应用于全球多个行业,包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。
10/28/2024 8:47:58 AM
清源

苹果将召开股东大会:多元化政策与AI合作面临挑战

苹果公司即将在美国当地时间本周二召开2025年度股东大会,届时将对公司未来的发展方向进行重要讨论。 自特朗普当选总统以来,苹果在抵制企业激进主义的同时,坚定维护其多元化、平等与包容性(DEI)政策。 然而,这些政策及其与 OpenAI 的合作关系将成为保守派组织关注的焦点。
2/24/2025 6:01:00 PM
AI在线
  • 1