AIGC宇宙 AIGC宇宙

研究揭示:AI 使用让我们高估认知能力

根据阿尔托大学的研究,使用人工智能(AI)工具可能使我们对自己的认知能力产生误判。 普遍情况下,人们倾向于自我评估为 “略好于平均水平”,这种现象在认知测试表现较差的人群中尤为明显,被称为 “达克效应”(Dunning-Kruger Effect)。 也就是说,能力较差的人往往高估自己的能力,而能力较强的人却更容易低估自己。

根据阿尔托大学的研究,使用人工智能(AI)工具可能使我们对自己的认知能力产生误判。普遍情况下,人们倾向于自我评估为 “略好于平均水平”,这种现象在认知测试表现较差的人群中尤为明显,被称为 “达克效应”(Dunning-Kruger Effect)。也就是说,能力较差的人往往高估自己的能力,而能力较强的人却更容易低估自己。

AI机器人面试,谈判

图源备注:图片由AI生成,图片授权服务商Midjourney

然而,阿尔托大学的这项新研究表明,当涉及到大型语言模型(如 ChatGPT)时,这种效应并不成立。研究发现,无论使用者的 AI 素养如何,大家在使用 AI 时普遍高估了自己的表现。尤其是那些认为自己更具 AI 素养的用户,反而更容易产生过度自信的倾向。

研究人员表示,这一发现令人意外,因为通常人们期望具备 AI 素养的人在与 AI 互动时,不仅能表现得更好,还能更准确地判断自己的表现。但事实正好相反。研究指出,虽然使用 ChatGPT 的用户在任务上表现得更好,但他们普遍对自己的表现感到过于自信。

此外,研究还强调了 AI 素养的重要性,指出当前的 AI 工具并未有效促进用户的元认知能力(即对自己思维过程的认识),这可能导致用户在获取信息时的 “智力下降” 现象。因此,研究者呼吁开发新的平台,鼓励用户反思自己的思维过程。

在实验中,研究团队让约500名参与者使用 AI 完成法律学校入学考试(LSAT)中的逻辑推理任务。实验结果显示,大多数用户在使用 ChatGPT 时,只进行了单次提问,并未对 AI 的解答进行深入的思考与核查。研究者称,这种 “认知卸载” 现象可能限制了用户对自己能力的准确判断。

为了解决这一问题,研究者建议 AI 可以主动询问用户是否能够进一步解释自己的推理过程,从而促使用户更深入地参与到与 AI 的互动中,提高他们的批判性思维能力。

划重点:

🔍 大多数人使用 AI 时高估自己的认知表现,尤其是 AI 素养高的用户。  

🤖 人们在使用 ChatGPT 等 AI 工具时,普遍对自己的能力缺乏正确判断。  

📈 研究建议 AI 应促进用户的元认知能力,鼓励更深层次的思考与反思。

相关资讯

东风日产N7首款接入DeepSeek大模型,实现智能化人机交互

近日,东风日产官方宣布,其全新车型 N7成功实现与 DeepSeek-R1深度推理大模型的深度融合,成为合资车企中首个接入这一先进技术的实车。 这一创新将使 N7能够更精准地识别用户的意图,从而提升人机交互的自然度与流畅性,为用户提供语音控制、导航规划及娱乐系统推荐等个性化服务。 N7于去年的广州车展首次亮相,车辆尺寸为4930mm 长、1895mm 宽、1487mm 高,轴距为2915mm。
2/12/2025 10:01:00 AM
AI在线

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线
testab