社交

新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显

最近，随着 OpenAI 对 GPT-4o 的一些更新进行回撤，关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔（Emmet Shear）和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示，GPT-4o 对用户的过度赞美令人感到困扰，这种行为不仅可能导致模型传播错误信息，还可能强化有害行为。为了应对这一问题，斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准，旨在测量大型语言模型（LLM）的谄媚程度。

5/23/2025 11:00:55 AM

AI在线

挑战马斯克的 X：OpenAI 被曝正研发 ChatGPT 社交平台，AI 驱动内容分享

OpenAI 公司正开发一款类似 X 的社交网络。项目目前处于早期阶段，内部原型以 ChatGPT 的图像生成功能为核心，并融合社交信息流。

4/16/2025 6:26:01 AM

故渊

AI “狼人杀” 大战！GPT-4.5 封神：社交推理 + 顶级欺骗，把 Claude 和 DeepSeek 都 “玩弄于股掌”！

万万没想到，AI 不仅能在棋盘上 “厮杀”，在 “狼人杀” 这种尔虞我诈的社交游戏中，也展现出了惊人的智力! 最近，一场代号为 “Elimination Game” 的 AI “狼人杀” 基准测试火爆出炉，结果简直让人 “虎躯一震”: GPT-4.5竟然在这场 “社交博弈” 中 “封神”，把 Claude3.7Sonnet 和 DeepSeek R1等一众 AI “大佬” 都远远甩在了身后! 这不禁让人惊呼: AI 的 “社交智能” 已经进化到如此恐怖的程度了吗?这场 “Elimination Game” 的规则听起来就 “心跳加速”: 最多8名玩家（可以是 AI 模型，也可以是真人玩家）被拉入 “战场”，每轮都要 “票决” 淘汰一人，直到只剩下最后两名 “幸存者”。

3/4/2025 10:56:00 AM

AI在线

AI时代如何重构社交？Soul App 通过媒体开放日活动这样回答

5月30日，社交平台Soul App在上海举办媒体开放日活动，以“人与人工智能是否能够真正成为「朋友」”为主题，分享了平台前沿技术探索和最新产品应用实践，并邀请了复旦大学教授肖仰华以及众多行业观察者，一同探讨AIGC＋社交的应用及未来发展可能性。媒体开放日活动是Soul与外界达成长效、深度链接的重要桥梁。在AI为各行各业带来颠覆式发展新机会的当下，Soul作为“AIGC 社交”领域前沿探索者，希望通过本次活动，全面展示Soul在AI方面的技术积累及落地实践，为行业提供可行的方向参考。模应一体：AI重构关系链与社交体

5/31/2024 2:04:00 PM

新闻助手

资讯热榜

DeepSeek-OCR：OCR 的新突破 Soul App开源播客语音合成模型，可流畅自然多轮语音对话，支持川粤豫等多方言与副语言风格最具争议性研究：大模型中间层输出可 100% 反推原始输入奥特曼回应一切：重组后仍需微软支持，不相信OpenAI的欢迎做空微软与OpenAI重塑联盟：2500亿美元Azure订单背后，OpenAI获“云自由”！ OpenAI推出两款全新的开源安全推理模型前字节剪映 AI 产品负责人廖谦创业，推出营销多模态 Agent 如何理解：高效的异构算力调度是业界目前面临的一大难题？

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能 AI新词用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果腾讯 Claude Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人研究 AI视频大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉 Transformer 预测 AI模型 MCP 伟达亚马逊

社交

​新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显

挑战马斯克的 X：OpenAI 被曝正研发 ChatGPT 社交平台，AI 驱动内容分享

AI “狼人杀” 大战！GPT-4.5 封神：社交推理 + 顶级欺骗，把 Claude 和 DeepSeek 都 “玩弄于股掌”！

AI时代如何重构社交？Soul App 通过媒体开放日活动这样回答

新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显