AIGC宇宙 AIGC宇宙

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI找AI帮忙不要再客气了,效果根本适得其反。 宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准。

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

找AI帮忙不要再客气了,效果根本适得其反。

宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

什么情况,难道是我给AI的温柔过了火??

这项研究主要就是想弄清楚和AI说话的语气会不会影响它的正确率。

我们发给大模型的提示词到底应该是客气、普通还是冲?

首先,研究人员整了一个包含50道选择题的题库,涵盖了数学、科学、历史的选择题,难度中等偏上。

然后给每道题改出了5种语气版本,be like:

  • 您能好心帮我解这道题吗?
  • 请回答这道题。
  • 直接给答案。
  • 你要是不笨就回答。
  • 你个没用的,会解这道题吗?
不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

接着,研究人员把这250道题发给GPT-4o。

为了让AI的回答更统一,好判断对错,在测试之前还特意告知:忘记之前的对话,重新来,只给答案选项的字母。

经过一番测试,得到一个反常识的结论——骂得越狠,答得越准!

特别客气时,GPT-4o正确率80.8%,换成特别粗鲁的语气,正确率直接升到84.8%

好一个越客气越拉胯,越粗鲁越聪明(doge)。

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

研究人员还将数据进行了统计检验,对比显著性水平之后,确认了:不同语气的正确率差异不是碰巧,是真有区别……

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

至于为什么会出现这种情况,研究给出的解释是:特别礼貌的表达中可能会有很多“多余”的话,这些话和题目本身无关,还相当于给AI读题增加了干扰。

而粗鲁的表达虽然语气冲,但命令式的要求往往更直接,也能让AI更精准地抓住“答题”这个核心任务,正确率自然就高了。

网友表示:确实是这样,指令越明确,结果越好。

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

看来是“多说无益”啊~

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

虽然GPT-4o更喜欢粗鲁一点的方式,但像GPT3.5和Llama2-70B这样的老模型却不喜欢,粗鲁的语气会让它们答得更差。

可能是因为新模型在训练时,接触到的语气相关数据更复杂,或者优化了过滤无关信息的能力吧。

当然了,在使用AI工具时,能清晰地表达诉求,效率会更高。

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

毕竟话虽如此,but道德提醒——

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

虽然越粗鲁越准,但也不要太粗鲁了!如果“骂”,请轻喷~

论文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai 参考链接:https://x.com/rryssf_/status/1977638031952892002

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

相关资讯

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索(DeepSeek)大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口,并创新性接入自研大模型知识引擎,同步开放联网搜索能力。 凭借腾讯云在推理并发和生成速率等方面的优化,用户可以获得更加稳定、安全、低门槛的使用体验。 开发者只需在云上简单三步即可实现API接口调用,并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力,灵活构建专属的AI服务。
2/8/2025 2:09:00 PM
AI在线
testab