什么是 AI 的「做梦」?核心定义
大多数使用 AI 工具的人都不知道,Claude 代理现在可以在两次工作会话之间,自动回顾过去的任务记录,提取跨会话的行为规律,并以此更新自身的记忆——在下一次启动时,以更好的状态开始工作。Anthropic 于 2026 年 5 月 6 日正式发布这项功能,并命名为「Dreaming(做梦)」。
「做梦」是一个排程式的会话间流程,内嵌于 Claude 托管代理(Managed Agents)架构中,在代理的每次活跃会话结束后自动执行。它会审阅过去的对话记录与记忆文件,识别跨会话的规律性模式,并将提炼出的洞见写入代理的持久记忆,从而提升其后续表现。模型本身不会改变——改变的是代理每次会话开始时所读取的工作记忆文件。
Claude「做梦」功能的运作机制是什么?
「做梦」在两次会话之间自动执行,分为三个阶段:
第一阶段——回顾:系统扫描代理近期的会话日志、任务结果与现有记忆文件,寻找任何单次会话都难以察觉的规律——在多次会话中重复出现的错误、在不同任务情境中独立浮现的高效捷径,以及随时间积累的用户偏好。
第二阶段——提取:系统判断哪些规律属于「信号」(一致、有意义、可操作),哪些属于「噪声」(偶发异常)。在同时运行多个 Claude 代理的平台上,「做梦」还能侦测不同代理独立发现的相似工作流程——这是一个强有力的信号,说明该方法确实可靠有效。
第三阶段——整理:系统更新代理的持久记忆文件:删除过时的笔记、合并重复条目、解决旧信息与新信息之间的矛盾,并加入新整合的洞见。这不是模型的重新训练,而是对代理每次会话开始时作为背景信息读取的文本文件进行结构性重写。
「做梦」解决了标准 AI 代理的哪些问题?
标准 AI 代理的核心问题是「会话隔离」。每次会话都从同一个基准知识出发——模型的训练数据加上你在系统提示中手动输入的内容。除非你在每次会话之间手动更新系统提示,否则代理会一再犯下相同的错误,每次都重新「发现」相同的捷径,且没有任何关于「什么有效、什么无效」的结构性记忆。
「做梦」直接针对三种失效模式:跨会话反复出现的提取错误(在任何单次会话内都无法自我修正);记忆文件随时间积累的冗余信息(导致代理记忆库越来越庞杂);以及散落在多个会话日志中、从未被整合的跨会话洞见(本可改善代理的表现,却因缺乏自动整理机制而白白流失)。
早期实际成果:数据说了什么?
Anthropic 在 5 月 6 日的 Code with Claude 开发者大会上分享了两个具体案例:
Harvey(法律 AI 平台):启用「做梦」功能后,合同分析代理的任务完成率提升了约 6 倍。原因在于:代理在多次会话中重复犯下相同的条款提取错误,而这个规律在任何单次会话内都不可见。「做梦」识别了这个模式,用修正后的指引更新了代理的记忆,重复性失误随即停止。
Wisedocs(医疗文档审阅):文档审阅时间缩短了 50%。Wisedocs 的代理处理复杂的医疗记录,不同案例之间的专业术语和文档结构差异显著。「做梦」让代理得以跨会话积累并整理领域专业知识,而不是每次都从空白状态重新开始。
这些结果不保证在所有场景下都能复制。两个案例的共同特征是:高频率、特定领域、重复性的任务工作流程。代理运行的会话越多,「做梦」能运作的素材就越丰富。
这对每天使用 Claude 的 AI 从业者有什么影响?
截至 2026 年 5 月,「做梦」功能仍处于研究预览阶段,是 Claude 托管代理的功能,不适用于标准 claude.ai 的对话界面。但对于 AI 从业者而言,影响可从三个维度理解:
基于 Claude 的工具会随时间自动改进:任何建立在 Claude 托管代理架构上的应用——企业内容平台、法律工具、编程助手、客服代理——都会通过「做梦」持续改善,无需用户额外设置。
Claude 代理的投资回报计算发生了改变:一个能从错误中学习的代理,其全生命周期的成本效益会持续改善。对于正在评估是否为团队部署 Claude 代理的从业者而言,「做梦」是一个值得纳入考量的重要因素,尤其在高会话量的工作流程中。
记忆管理成为一项工作流程设计技能:「做梦」引入了一个新的设计决策:你希望代理在多大程度上自主管理自己的记忆更新?Anthropic 提供自动模式和审阅模式两种选择——审阅模式类似于代理记忆的「拉取请求」工作流,由人工审核后才生效。理解哪种模式适合哪种场景,将成为区分高效 AI 从业者的实用技能。
「做梦」不是什么——重要的边界说明
「做梦」不是模型的重新训练:底层 Claude 模型不会改变。启用「做梦」后的 Claude Opus 4.7 仍然是 Claude Opus 4.7——其核心推理能力、语言能力和知识截止日期完全相同。改变的只是代理的记忆文件,即每次会话开始时作为背景信息提供的结构化文本文件。
「做梦」需要先启用持久记忆:这项功能建立在现有的持久记忆基础架构之上。如果你尚未为 Claude 托管代理启用持久记忆,「做梦」就没有可整理的素材。
「做梦」并不保证在所有情况下都有效:对于一次性、高度多变的任务,「做梦」的素材十分有限。规律提取需要重复性——相同类型的任务、错误和工作流程在多次会话中重复出现。对于任务类型高度多样、每类任务量较低的代理,「做梦」带来的性能提升会相对有限。
这揭示了 AI 代理的未来方向是什么?
「做梦」是迄今为止最清晰的信号,说明代理式 AI 时代正在超越「逐会话对话」模式,迈向一种更接近「员工随时间真正进步」的工作模式。代理不再只是记住之前的情境,而是主动整理记忆——舍弃不再相关的部分,强化真正有用的部分。
对于正在追踪 AI 技能投资方向的从业者而言:设计、配置和管理 AI 代理持久记忆的能力,正在成为一项有意义的核心竞争力。理解「做梦」的运作逻辑——哪些模式会触发记忆更新,哪些会被剪除——正是未来 12 到 18 个月内区分高效 AI 从业者与普通 AI 使用者的那种操作性知识。
大多数人用 AI 一次只进行一次会话。「做梦」让每一次会话都能累积成果。懂AI的冷,更懂你的难——UD 同行28年,让科技成为有温度的陪伴。如果你在用任何 Claude 赋能的工具处理重复性工作,「做梦」正是你现在就应该深入了解的功能。
🧠 你的 AI 知识水平在哪里?
了解「做梦」这类前沿功能,正是 AI 高效用户与普通用户之间的差距所在。UD 团队手把手带你完成每一步——测试你的现有水平,并帮助你建立真正能落地的 AI 技能。