52%

研究称 ChatGPT 回答的编程问题错误率 52%，但 39% 人类程序员没看出来

生成式 AI 已经成为开发利器，可以辅助开发者快速生成相关代码，让开发者从“敲代码”逐渐过渡到“审代码”，不过最新报告指出 ChatGPT 所回答的编程问题内容错误率高达 52%。来自普渡大学的研究小组于 5 月初出席计算机-人交互大会，并提交了一份报告，检查了 ChatGPT 回答的 517 个 Stack Overflow 问题，发现错误率高达 52%。调查结果显示，人类程序员在 35% 的情况下更喜欢 ChatGPT 的答案，认为其提供的内容更全面，且有清晰的语言风格；更糟糕的是，在 39% 的情况下，人类程

5/25/2024 8:20:51 AM

故渊

资讯热榜

国内首个，MiniMax 大模型通过人机辩论图灵测试逆天!旧Mac上能run千亿参数SOTA!效果惊人:一次生成游戏，0修改！本地大模型拐点来了!网友：别被大模型叙事带偏了(附指南）小学都看得懂！帮你快速了解 Tool、MCP 和 Agent 的基础科普刚刚，OpenAI推出学习模式，AI教师真来了，系统提示词已泄露 ChatGPT大更新推出学习模式！“一夜之间1000个套壳应用又死了” 阶跃星辰新一代基础大模型 Step 3 正式开源：拥有强大视觉感知和复杂推理能力 CAPTCHA 拦不住 AI 了：ChatGPT 可绕过 Cloudflare 人机验证系统多项力压 Grok 4、OpenAI o3，谷歌推出 Gemini 2.5 Deep Think 模型

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文智能体英伟达 Anthropic 代码算法训练 Stable Diffusion 芯片蛋白质开发者腾讯生成式 LLM 苹果 Claude 神经网络 AI新词 3D Agent 机器学习研究生成 AI for Science xAI 计算人形机器人 AI视频 Sora GPU AI设计百度华为搜索大语言模型工具场景 RAG 字节跳动具身智能大型语言模型预测深度学习伟达视觉 Transformer AGI 视频生成神器推荐亚马逊 Copilot DeepMind 架构模态安全