AIGC宇宙 AIGC宇宙

​AI 聊天机器人在时事问题上频频出错,BBC 研究揭示事实扭曲

最近,英国广播公司(BBC)的一项研究揭示,领先的人工智能助手在回答与新闻和时事相关的问题时,常常产生误导性和不准确的内容。 研究表明,ChatGPT、Gemini 和 Perplexity 四种主流 AI 工具所生成的回答中,有超过一半被认为存在 “重大问题”。 图源备注:图片由AI生成,图片授权服务商Midjourney研究人员要求这四款生成式 AI 工具使用 BBC 的新闻文章作为来源,回答100个相关问题。

最近,英国广播公司(BBC)的一项研究揭示,领先的人工智能助手在回答与新闻和时事相关的问题时,常常产生误导性和不准确的内容。研究表明,ChatGPT、Gemini 和 Perplexity 四种主流 AI 工具所生成的回答中,有超过一半被认为存在 “重大问题”。

机器人上班打字

图源备注:图片由AI生成,图片授权服务商Midjourney

研究人员要求这四款生成式 AI 工具使用 BBC 的新闻文章作为来源,回答100个相关问题。随后,这些回答由专业的 BBC 记者进行评估。结果显示,大约五分之一的答案中包含数字、日期或陈述的事实错误,而13% 的引用则是被修改过或根本不存在于所引用的文章中。

例如,在涉及被定罪的新生儿护士露西・莱特比(Lucy Letby)的案件时,Gemini 的回答忽略了她被判谋杀和未遂谋杀的背景,表示 “每个人都有自己的看法来判断露西・莱特比是无辜还是有罪”。此外,微软的 C opi lot 错误地叙述了法国强奸受害者吉赛尔・佩利科(Gisèle Pelicot)的经历,而 ChatGPT 则错误地提到以色列哈马斯领导人伊斯梅尔・哈尼耶(Ismail Haniyeh)在被刺杀数月后仍在领导层中。

更令人担忧的是,这项研究表明,当前这些 AI 工具在处理时事信息时存在广泛的不准确性。BBC 新闻首席执行官德博拉・特纳斯(Deborah Turness)对此发出警告,认为 “生成式 AI 工具正在玩火”,可能会削弱公众对事实的 “脆弱信任”。她呼吁 AI 公司与 BBC 合作,以生产更准确的回应,避免增加混乱和误导。

这项研究还引发了对内容使用控制的问题,BBC 的生成式 AI 项目总监彼得・阿彻(Peter Archer)表示,媒体公司应当掌握其内容的使用方式,而 AI 公司应当展示其助手处理新闻的方式及产生的错误规模。他强调,这需要媒体与 AI 公司之间建立强有力的合作关系,以最大化对公众的价值。

划重点:  

🔍 研究显示,超过一半的 AI 生成回答存在重大错误。  

📰 AI 助手在回答时事问题时常常产生误导性内容,影响公众信任。  

🤝 BBC 呼吁 AI 公司加强合作,以提高信息的准确性和可靠性。

相关资讯

东风日产N7首款接入DeepSeek大模型,实现智能化人机交互

近日,东风日产官方宣布,其全新车型 N7成功实现与 DeepSeek-R1深度推理大模型的深度融合,成为合资车企中首个接入这一先进技术的实车。 这一创新将使 N7能够更精准地识别用户的意图,从而提升人机交互的自然度与流畅性,为用户提供语音控制、导航规划及娱乐系统推荐等个性化服务。 N7于去年的广州车展首次亮相,车辆尺寸为4930mm 长、1895mm 宽、1487mm 高,轴距为2915mm。
2/12/2025 10:01:00 AM
AI在线

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线
testab