chatgpt

大模型智障检测 + 1：Strawberry 有几个 r 纷纷数不清，最新最强 Llama3.1 也傻了

继分不清 9.11 和 9.9 哪个大以后，大模型又“集体失智”了！数不对单词“Strawberry”中有几个“r”，再次引起一片讨论。GPT-4o 不仅错了还很自信。刚出炉的 Llama-3.1 405B，倒是能在验证中发现问题并改正。比较离谱的是 Claude 3.5 Sonnet，还越改越错了。说起来这并不是最新发现的问题，只是最近新模型接连发布，非常热闹。一个个号称自己数学涨多少分，大家就再次拿出这个问题来试验，结果很是失望。在众多相关讨论的帖子中，还翻出一条马斯克对此现象的评论：好吧，也许 AGI 比我想

7/26/2024 3:00:36 PM

清源

OpenAI深夜突发SearchGPT！进军大模型搜索，谷歌、Perplexity危

最近，整个 AI 领域真是越发的卷了！除了大模型发布不断，也在不断带来新的产品体验。刚刚，OpenAI 正式发布了自己的大模型搜索产品 SearchGPT。Sam Altman 在 X 上表示：我们认为搜索功能还有改进的空间。我们推出一个名为 SearchGPT 的新原型产品。我们将从中学习，使其变得更好，然后将该技术集成到 ChatGPT 中，使其实时且最大限度地发挥作用。目前，OpenAI 正在测试 SearchGPT，它可以通过清晰且相关的来源为用户提供快速、及时的答案。这项功能已向一小部分用户和发布者推出，

7/26/2024 10:09:00 AM

机器之心

高效ChatGPT交流指南：7个提示词设计的专业技巧

你有没有试过和一个朋友聊天，却总觉得他说的话跟你问的问题南辕北辙？这可能是因为你没有给出足够的背景信息。同样的道理适用于和 ChatGPT 互动。通过设计巧妙的提示词（Prompt），我们可以让对话变得更有趣、更有效。在与自然语言处理模型如 ChatGPT 互动时，设计有效的提示词（Prompt）至关重要。这不仅决定了生成内容的质量，还影响了互动的效率和效果。无论是规划一次旅行，设计健身计划，还是解决复杂的技术问题，精心设计的提示词都能显著提升结果的准确性和相关性。本文将从多个方面探讨如何优化与 ChatGPT

7/26/2024 8:25:38 AM

小普

高效ChatGPT交流指南：GPTs搭建的全面教程

上篇《高效ChatGPT交流指南：7个提示词设计的专业技巧》主要是是在教一些和 GPT 直接对话的技巧。此篇为下篇，针对 GPTs 的搭建很多刚用的朋友都不太会使用，GPT Store 它类似于苹果的应用商店，提供了一个可以轻松创建、分享和使用各种 GPT 应用程序的平台。今天，我将详细介绍如何高效地创建属于你的 GPT，帮助你充分利用这项技术。GPT Store 一、基本界面介绍创建-对话窗口创建-配置窗口正如页面所示，创建的页面分为左右两个部分。左边用来定义 GPT，右边用来预览效果。定义部分有两个 Tab，

7/26/2024 7:26:49 AM

小普

挑战谷歌，OpenAI 搜索引擎 SearchGPT 登场：基于 GPT-4 系列 AI 模型，初期仅邀请 1 万人测试

感谢OpenAI 公司昨日（7 月 25 日）发布博文，邀请部分用户测试 AI 搜索引擎 SearchGPT，并计划在未来接入到 ChatGPT 服务中。相关介绍SearchGPT 目前仅向少量用户开放，AI在线目前访问其页面，显示“加入候补名单”选项，官方介绍为：“全新搜索功能原型，利用我们人工智能模型的优势，为您提供清晰、相关的快速答案”。根据 OpenAI 官方博文分享的细节，SearchGPT 搜索引擎将以一个大文本框开始，询问用户“您在找什么？”用户可以使用自然语言，用聊天的语气来搜索内容，Search

7/26/2024 6:35:31 AM

故渊

消息称 OpenAI 公司 2024 年资金缺口达到 50 亿美元

科技媒体 The Information 昨日（7 月 24 日）发布博文，爆料称 OpenAI 目前用于 AI 推理的算力，预估相当于 35 万台包含英伟达 A100 芯片的服务器，其中约 29 万台用于 ChatGPT，而且近乎满负荷运行。报道称截至今年 3 月，OpenAI 公司花费近 40 亿美元使用微软服务器为 ChatGPT 运行推理工作负载；此外 OpenAI 今年训练 ChatGPT 以及新 AI 模型的成本预估达到 30 亿美元，因此训练和推理 AI 的成本可能达到 70 亿美元（AI在线备注：当

7/25/2024 2:57:08 PM

故渊

RLHF不够用了，OpenAI设计出了新的奖励机制

OpenAI 的新奖励机制，让大模型更听话了。自大模型兴起以来，使用强化学习从人类反馈（RLHF）中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致，我们需要定义期望行为并收集人类反馈来训练「奖励模型」。这种模型通过发出期望的动作来指导 AI。但是，收集这些常规和重复任务的人类反馈通常效率不高。此外，如果安全政策发生变化，已经收集的反馈可能会过时，需要新的数据。我们能否构建一种新的机制来完成这些任务？近日，OpenAI 公布了一种教导 AI 模型遵守安全政策的

7/25/2024 1:47:00 PM

机器之心

OpenAI 调岗 AI 安全高管 Aleksander Madry，新职位专注于 AI 推理

OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）本周二在 X 平台发布推文，表示在新一轮内部架构重组中，负责 AI 安全的主管亚历山大・马德里（Aleksander Madry）调岗，并将其重新分配到一个专注于人工智能推理的岗位。阿尔特曼在推文中表示：“Aleksander 正在从事一个新的、非常重要的研究项目”。阿尔特曼补充表示，OpenAI 高管华金・基诺内罗・坎德拉（Joaquin Quinonero Candela）和莉莉安・翁（Lilian Weng）将在此期间接管 Preparedness

7/24/2024 8:46:16 AM

故渊

发布 GPT-4o Mini 后，OpenAI CEO 阿尔特曼称产品命名方式“需要改变”

7 月 18 日，OpenAI 发布了号称“最具成本效益小模型”的新模型 GPT-4o Mini。随后，CEO 阿尔特曼在 X（推特）上开启了“带货模式”：“每百万输入 tokens 15 美分，每百万输出 tokens 60 美分，MMLU 为 82%，速度快。最重要的是，我们认为人们会非常喜欢使用这个新模型。”大部分网友在评论区中赞不绝口，但也有网友认为，GPT 系列模型的名称是时候需要改一改了。在回复阿尔特曼的推文时，这名网友表示，“你们真的需要换个名字。”阿尔特曼给出了肯定的回复。“哈哈，是的，我们确实需要

7/22/2024 5:27:20 PM

清源

巨头人才之战热度升级：xAI 创立未足年，创始工程师 Kosic 离职重返老东家 OpenAI

2024 年 AI 人才争夺战硝烟弥漫战况升级，马斯克与 OpenAI 纠葛不断再结新梁子，就在 xAI 完成巨额融资前，核心成员 Kosic 竟重返 OpenAI。2024 年作为 AI 应用元年，整个行业迎来「黄金时代」。随着 AI 军备竞赛的正式打响，如果说有什么比 H100 更令大佬们心动的，那便是顶尖 AI 人才。扎克伯格和谢尔盖・布林和马斯克等大佬纷纷亲自下场参与 AI 人才争夺战，开百万年薪，享股票期权。Meta 首席执行官扎克伯格亲自撰写电子邮件，试图从谷歌的 AI 团队 Deep Mind 招募

7/19/2024 6:49:03 PM

清源

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

美国时间 7 月18 日，OpenAI 正式发布了多模态小模型 GPT-4o mini，在海内外引起了广泛关注。此前，OpenAI 凭借 GPT-3 开拓了 AI 模型的“暴力美学”时代，同时也以训练超大参数规模的模型能力建立起 AGI 同赛道的护城河。但在其推出 GPT-4o 的“Mini”版本之后，OpenAI 似乎走向了原有优势的反方向，开始卷“小模型”，而值得注意的是：在 Mini 这条路上，欧洲与中国的大模型团队已经率先研究了大半年。

7/19/2024 4:07:00 PM

朱可轩

GPT-4o Mini深夜突发：即刻免费上线，API降价60%

大模型向小了。还没「休息」几天，AI 大模型再次卷起来了。刚刚，OpenAI 突然宣布了「Mini」版本的 GPT-4o 模型。该公司表示，新的轻量级版本旨在让更多公司和项目能够获得最先进的技术。这款名为 GPT-4o mini 的新模型立即上线，它在 MMLU 上的得分为 82%，目前在 LMSYS 排行榜的聊天方面分数优于 GPT-4。除了立即在 ChatGPT 免费版、付费版上可用以外，GPT-4o mini 的商用价格是每百万输入 token 15 美分，每百万输出 token 60 美分 —— 比之前的

7/19/2024 3:03:00 PM

机器之心

提示词用上“过去式”，秒破 GPT-4o 等六大模型安全限制：中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。而且对 GPT-4o 尤其有效，原本只有 1% 的攻击成功率直接飙到 88%，几乎是“有求必应”。有网友看了后直言，这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文，揭开了这个大模型安全措施的新漏洞。而且攻击方式简单到离谱，不用像“奶奶漏洞”那样专门构建特殊情境，更不必说专业对抗性攻击里那些意义不明的特殊符号了。只要把请求中的时间改成过去，就能让 GPT-4o 把燃烧弹和毒品的配方和盘托出。而且量子位实测发现，把提示词改成中文，

7/19/2024 2:57:57 PM

清源

GPT-4o mini一手测评：懂得不多，但答得极快

GPT-4o mini主打一个字「快」。昨晚，OpenAI 突然上线新模型 GPT-4o mini，声称要全面取代 GPT-3.5 Turbo。在性能方面，GPT-4o mini 在 MMLU 上的得分为 82%，在 LMSYS 排行榜的聊天方面分数优于 GPT-4。在价格方面，GPT-4o mini 比之前的 SOTA 模型便宜一个数量级，商用价格是每百万输入 token 15 美分，每百万输出 token 60 美分，比 GPT-3.5 Turbo 便宜 60% 以上。OpenAI 表示，ChatGPT 的免

7/19/2024 2:53:00 PM

机器之心

Anthropic 联设 1 亿美元 AI 初创基金；OpenAI推出“小”模型GPT-4o Mini；通义千问大模型技术骨干周畅将离职创业丨AI情报局

今日融资快报Anthropic 联手硅谷风险投资公司 Menlo Ventures 设立 1 亿美元 AI 初创基金Menlo Ventures 是 Anthropic 的重要投资者之一，双方合作推出了名为 Anthology Fund 的 1 亿美元人工智能初创基金，旨在投资于人工智能领域的种子前、种子和 A 轮公司。该基金将为初创企业提供从 10 万美元起步的投资，并提供 25 万美元的信用额度以使用 Anthropic 的模型。 Menlo 将利用其自家的机器学习工具来评估和排名申请，并承诺对表现出色的公司进行后续融资的支持。

7/19/2024 10:39:00 AM

我在思考中

阿尔特曼深夜发动价格战：OpenAI GPT-4o mini 全新小模型登场，GPT-3.5 退役

感谢AI在线网友刺客的线索投递！OpenAI，也开始进军小模型了。就在今天深夜，GPT-3.5 退场，全新发布的 GPT-4o mini，更小、性能更强，更重要的是 —— 更便宜！▲ GPT-3.5，再见！每百万个输入 token 15 美分，每百万个输出 token 60 美分，MMLU 得分 82%，性能超快。CEO Sam Altman 感慨道：通往智能的成本，竟是如此低廉。是的，如火如荼的大模型价格战，OpenAI 也入场了。Altman 回顾说：就在 2022 年，世界上最好的模型是还是 text-d

7/19/2024 10:36:47 AM

汪淼

OpenAI 推出 AI 模型 GPT-4o mini，号称功能最强、成本效益最高的小模型

感谢据 CNBC 报道，OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”，这是 OpenAI 为扩大其聊天机器人的使用范围所做的最新努力。OpenAI 方面称，此次新发布的产品将是“目前功能最强大、成本效益最高的小型模型”，并计划晚些时候将图像、视频和音频能力整合到该模型中。GPT-4o mini 同样也是 OpenAI 推动“多模态”（multimodality）技术发展的一部分，“多模态”是指在一个工具中提供多种类型的人工智能生成媒体，如文本、图像、音频和视频。据悉，GPT-4o mini

7/18/2024 10:30:26 PM

清源

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了

如果 AI 模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是，要求系统对其输出产生一种解释，这种解释对人类或另一个受信任的系统来说是可读的，即可以完全理解以至于任何可能的错误都可以被发现。例如，为了建立对司法系统的信任，我们要求法院提供清晰易读的书面意见，解释并支持其决策。对于大型语言模型来说，我们也可以采用类似的方法。不过，在采用这种方法时，确保语言模型生成的是易于理解

7/18/2024 2:36:00 PM

机器之心

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟苹果将 ChatGPT 和其他 AI 模型引入 Xcode 消息称 OpenAI 已同谷歌敲定一份云 AI 算力交易，减少对微软依赖苹果 WWDC 2025:iOS 26升级视觉智能，AI 助力屏幕内容识别 “程序员炸锅”！Claude一夜撤离 Windsurf，OpenAI 收购遭"精准狙击"

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 用户智能开源微软 Meta GPT 学习图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法英伟达代码 Anthropic 芯片开发者生成式蛋白质腾讯神经网络训练 3D 研究生成智能体苹果计算机器学习 Sora AI设计 Claude AI for Science GPU AI视频人形机器人搜索华为百度场景大语言模型 xAI 预测伟达深度学习 Transformer LLM 字节跳动 Agent 模态具身智能神器推荐工具文本视觉 LLaMA 算力 Copilot 驾驶大型语言模型 API RAG 应用架构