AIGC宇宙 AIGC宇宙

谷歌翻译迎来革命性升级:耳机秒变实时翻译器,Gemini加持让对话“原声重现”

据TechCrunch报道,谷歌翻译应用近日上线一项测试版功能——用户只需佩戴任意耳机,即可实时听到精准翻译后的语音,且完整保留原始说话者的语气、重音与语调。 这项突破性能力,本质上把普通耳机变成了随身携带的单向同声传译设备。 谷歌搜索垂直领域产品管理副总裁Rose Yao在官方博客中解释,该功能旨在解决真实语言交流中的深层需求:“无论你是在国外听讲座、与当地人对话,还是观看外语影视内容,只需打开谷歌翻译,点击‘实时翻译’,就能在耳机中听到用你选定语言流畅转译的声音,同时感知说话节奏和情感色彩。

据TechCrunch报道,谷歌翻译应用近日上线一项测试版功能——用户只需佩戴任意耳机,即可实时听到精准翻译后的语音,且完整保留原始说话者的语气、重音与语调。这项突破性能力,本质上把普通耳机变成了随身携带的单向同声传译设备。

谷歌搜索垂直领域产品管理副总裁Rose Yao在官方博客中解释,该功能旨在解决真实语言交流中的深层需求:“无论你是在国外听讲座、与当地人对话,还是观看外语影视内容,只需打开谷歌翻译,点击‘实时翻译’,就能在耳机中听到用你选定语言流畅转译的声音,同时感知说话节奏和情感色彩。”这不仅提升理解准确性,更让用户能清晰区分多位发言者,还原真实对话情境。

目前,该功能已在美国、墨西哥和印度的安卓版谷歌翻译中开放测试,支持超过 70 种语言组合,并兼容市面上几乎所有蓝牙或有线耳机。谷歌计划于 2026 年将其扩展至iOS平台及全球更多地区,进一步打破语言沟通的物理边界。

与此同时,谷歌还将旗下最先进的Gemini高级模型深度集成至翻译应用。得益于该模型对语境、文化和语言细微差别的更强理解力,新版本在处理俚语、习语、双关语及地方性表达时显著提升译文的自然度与准确性。例如,一句充满文化隐喻的方言俚语,不再被机械直译,而是转化为目标语言中语义等效、风格匹配的地道表达。

这一系列升级标志着谷歌翻译正从“文字转换工具”进化为“沉浸式语言交互平台”。当AI不仅能说对,还能“说像”,跨语言沟通的隔阂便不再只是词汇的缺失,而真正迈向情感与节奏的共鸣。未来,一副耳机,或许就是通往世界任意角落对话的通行证。

相关资讯

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索(DeepSeek)大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口,并创新性接入自研大模型知识引擎,同步开放联网搜索能力。 凭借腾讯云在推理并发和生成速率等方面的优化,用户可以获得更加稳定、安全、低门槛的使用体验。 开发者只需在云上简单三步即可实现API接口调用,并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力,灵活构建专属的AI服务。
2/8/2025 2:09:00 PM
AI在线
testab