Claude记忆系统逆向研究！与ChatGPT完全相反！网友：放弃广告了？Claude深夜祭出记忆选项，隐身聊天，按项目单独记忆

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）上一篇文章中，小编分享了一位狠人逆向研究了 OpenAI 的 ChatGPT 底层记忆机制。它的记忆系统主要分为四个板块：交互元数据、最近会话内容、模型设定上下文、用户知识记忆。正是基于这样的设计，才会让 ChatGPT 充满了十足的留人能力。

编辑 | 云昭

出品 | 51CTO技术栈（微信号：blog51cto）

上一篇文章中，小编分享了一位狠人逆向研究了 OpenAI 的 ChatGPT 底层记忆机制。它的记忆系统主要分为四个板块：交互元数据、最近会话内容、模型设定上下文、用户知识记忆。。

正是基于这样的设计，才会让 ChatGPT 充满了十足的留人能力。

那么，另一大头部的 AI 助手 Claude 又是怎样设计自身的记忆系统的呢？

昨天，Claude 的记忆系统也被逆向工程了一波，这位狠人的出的结论是：

Claude 与 ChatGPT 走的是两种截然不同的方向。

我又研究了 Claude，结果发现了一件很有意思的事情：这两大头部 AI 助手居然构建了完全相反的记忆系统。
ChatGPT 是“全都要”，Claude 是每次都“从0开始”。

图片

这说明了各自的用户群体和产品哲学是什么？以及 AI 记忆设计的潜力空间到底有多大。

这篇文章中，作者首先拆解 Claude 的记忆机制——它到底存储什么、怎么取。然后，再聊更有趣的部分：为什么这两种架构会走向如此不同的道路？

这篇文章描述的剧烈反差感，引起了网友对于 OpenAI、Anthropic 这两大 AI 超级独角兽的疯狂讨论，评论数已经多达 231 条。

图片

一些网友认为这是两家公司在为未来的商业模式做铺垫：

ChatGPT 的方向性很明确，未来他们会通过广告和联盟链接盈利。而其记忆功能旨在创建用户画像。
而 Claude 的记忆实现感觉更侧重于访问抽象概念和过去交互的长期目标。

但更有意思的是，这篇逆向文章刚发布不久后，昨天 Claude 似乎也看到了用户的热烈讨论，很快为 Claude 上线了新的记忆功能：专为工作团队设计！

A modal dialog box titled "Memory" overlaid on a background of conversation topics. The modal contains two toggle options: "Search and reference chats" and "Generate memory of chat history"

一、Claude 的工作方式：两个基本特征

Claude 的记忆系统有两个基本特征：

从零开始：每次对话都以一张白纸开场，不会自动加载用户画像或历史记录。只有当你明确调用记忆时，它才会启用。
原始记录检索：Claude 回忆时，只会基于你真实的对话记录，而不是依赖 AI 自动生成的摘要或压缩档案。它就像在做实时搜索，直接在你的历史聊天中查找。

当 Claude 通过类似 “我们之前聊过什么”、“从上次聊到的地方继续”、“还记得我说过……” 这样的提示检测到你在调用记忆时，它会调动两种检索工具。

这有点像你在用网页搜索或执行代码——Claude 会现场运行搜索，你能看到它“检索中”，等完成后再综合结果来回答或继续话题。

二、两种检索工具

| 1、会话检索 Conversation Search

conversation_search 工具用于关键词和主题搜索，覆盖你全部的对话历史。

比如我问它：“能回忆一下我们聊过的有关昌德尼朝克（德里的一处历史街区）的内容吗？”

Claude 找到了 9 段相关对话——从我研究贾汗娜拉·贝古姆公主在 1650 年建立该区的历史，到我问哪家烤肉串（galouti kebabs）和馅饼（parathas）最好吃。最后 Claude 把这些零散的记录整合成了一份连贯的总结。

Claude searching for Chandni Chowk conversations

如果你一次问多个主题，Claude 会依次进行多次搜索。比如我在做加密研究时，常用 Claude 做编辑。

有次我问它：“能告诉我我们聊过的关于米开朗基罗、Chainflip 或 Solana 的所有对话吗？”

ps：在区块链和加密领域，常见的项目名字经常会会借用艺术家、神话人物；后面的 Chainflip 或 Solana 是两个加密项目。

Claude 就分别跑了三次搜索：一次找我把米开朗基罗类比神经网络的内容，一次找 Chainflip 的跨链协议，一次找 Solana 的技术架构。最后一共找出 22 段对话，并生成了一个带跳转链接的统一回答。

Claude running multiple searches for different topics

| 2、短期对话检索 Temporal Chat Retrieval

recent_chats 工具提供按时间检索的能力。

我问它：“能告诉我最近 10 次对话聊了什么吗？” Claude 就按时间顺序把最近的聊天抓出来，并做了总结。

Claude retrieving last 10 conversations

它还可以指定时间段。比如我问：“能告诉我 2024 年 11 月最后一周我们聊过什么吗？” Claude 就找出了那段时间里的 16 个对话。

Claude retrieving conversations from November 2024

三、ChatGPT向左：用户无需思考的魔法，Claude向右：让用户自己控制调用时机

时间回到一年前，ChatGPT 和 Claude 的功能几乎是对齐的——多模型、文件上传、项目管理都有。但从那以后，两者的路线分化明显。

ChatGPT：已经演变为一个大众级消费产品。OpenAI 的 CPO Mike Krieger 也承认他们在用户增长上“抓住了闪电”。记忆上，ChatGPT 走的是全自动化：所有记忆组件都会自动加载，用户无需思考，就能得到个性化体验。这意味着它会逐渐构建详细的用户画像，学习偏好与模式，为未来功能或商业化打基础。这是典型的消费级科技思路：做得足够“魔法”，用户黏住，之后再想办法变现。
Claude：走的是另一条路，聚焦开发者工具、编程和专业工作流。Anthropic 的用户群体更技术化，他们理解 LLM 的运作方式，也习惯自己控制调用的时机。就像他们会手动选择是否触发网页搜索或“扩展思考”，他们也决定什么时候需要记忆。用户知道调用记忆会增加延迟，但他们愿意做这种权衡。他们要的不是持续画像，而是一个强大、可预测的专业工具。而且，这类用户往往对隐私更敏感。

四、记忆的设计空间，没有唯一解

令人震撼的是：ChatGPT 和 Claude 这两大头部AI助手，居然构建了完全相反的记忆系统。这说明 AI 记忆的设计空间极其巨大，没有所谓的“唯一正确答案”。

设计记忆系统时，你必须从用户出发，根据他们的需求倒推，然后从零开始构建。

更关键的是，我们还处于未开垦的领域。这些工具问世还不到三年，没人知道如果同一个人用 AI 助手十年会怎样。

它应该记多少？要怎么处理累积多年的上下文？

与此同时，市面上正爆发出“寒武纪式”的 AI 应用，每家都在实验自己的记忆方式，而底层模型还在快速迭代。

而在应用侧，同样没有固定的打法，也没有最佳实践——大家都在试、在看：究竟谁能跑出来。

所以，原本是想研究记忆系统，结果却慢慢地牵扯出产品层面的思考。

五、几小时后：Claude 放出了新的记忆功能

就在昨天晚上，作者发表了逆向文章后的几个小时后，Anthropic 就宣布，Claude 正式上线记忆（Memory）功能。不过，一个关键的信号是：团队和企业用户可以率先体验。

图片

这项功能可以在“设置”中启用。包含两个开关选项：“搜索并引用聊天记录”和“生成聊天历史记忆”。

来看一看，Claude 新发布的记忆功能的主要用途：

记住团队流程、客户需求、项目细节和优先级比如，销售团队能在不同交易中保持客户上下文，产品团队能在多轮迭代中延续产品规格，高管则能跟踪各项战略举措，而无需不断重建背景信息。
支持为每个项目单独建记忆，避免信息混杂这确保了产品发布规划与客户项目相互分离，机密讨论不会与日常运营混杂。这样的项目边界能帮助你和团队同时管理多个复杂任务，而不至于混淆不相关的信息，相当于一层保护栏，确保敏感对话得到隔离。

图片

通过记忆摘要，用户可随时查看和编辑 Claude 的记忆Claude 会通过“记忆摘要”来整合所有记忆，供你查看和编辑。在设置中，可以清楚看到 Claude 从你的对话中记住了哪些内容，并能随时通过与 Claude 对话更新摘要。根据你的指令，Claude 会调整所引用的记忆内容。

此外，在官方介绍中，Anthropic 特别强调了企业用户的控制权和隐私安全：

可选开启：用户可以自由决定 Claude 记住什么、不记住什么
隐身聊天：提供“一次性对话”，不会进入记忆或历史，非常适合敏感讨论有时候，用户需要 Claude 的帮助，但又不想使用或增加记忆。这时就可以用隐身聊天，它提供了一张干净的对话“白纸”。这种模式非常适合敏感的头脑风暴、机密的战略讨论，或是单纯想要一次不带上下文的新对话。你的常规记忆和历史对话不会受到影响。如果你在团队版或企业版中使用记忆，标准的数据保留策略依然适用。

图片

企业管理：管理员可随时关闭整个组织的记忆功能

总之，通过“Memory”功能，Claude 会专注于学习用户的职业背景和工作模式，从而最大化生产力。

这里需要注意，记忆功能也带来了新的安全考量，所以 Anthropic 在设计时，强调：确保它适用于工作场景，同时避免涉及敏感话题。

官方博客中表示：Claude 团队将采取循序渐进的方式，以负责任的方式部署这些强大功能，并持续评估和测试记忆在不同使用场景中的表现，再逐步扩大适用范围。

六、OpenAI和Anthropic为什么走了相反的路？

乍看之下，两者路线还是比较清晰的。

最基本的区别：ChatGPT 想记住你这个人，而 Claude 关心的是企业用户之前的交互。

所以，OpenAI 更像是打造一款AI时代的万能微信，而 Anthropic 则避其锋芒，专门瞄准企业服务领域，所以更像是“企业钉钉”。

一位网友认为，Anthropic 和 OpenAI 的区别可能更多体现在商业目标上，而不是技术本身。

ChatGPT 的方向很明确：最终会通过广告和返佣链接来变现。他们的记忆实现方式，核心就是在建立用户画像。

Claude 的记忆实现更像是面向长期目标，关注的是如何访问抽象概念和过往交互。这很接近人类回忆的方式，只是多了个搜索功能（据我所知他们还没真正实现）。

有网友认为，Claude 的路线很清晰：以后可以结合 RL 后训练，让 Claude “记住”你上次指出的错误。在未来的迭代里，它甚至能从对话中提炼出抽象，比如“用户上次让我在这个任务里改了某些地方，也许这次我可以主动做”或者“上次代理是这样完成这个任务的”。

不过，小编判断，Anthropic 或许不会放弃个性化广告这个已相对成熟的商业模式的。

评论区的大佬们，你们又是如何看待的呢？欢迎拍砖。

参考链接：

https://www.shloked.com/writing/claude-memory

https://www.anthropic.com/news/memory