大多数使用 Claude 的实战者都知道,Anthropic 于 2026 年 2 月推出的 Claude Sonnet 4.6 已经支持单次最高一百万个 Token 的上下文窗口。但几乎没有人在认真使用它。他们依然一次贴一份 PDF,问一个问题,然后关掉窗口。一百万 Token 的上下文不是更大的 PDF 阅读器。它是一种完全不同的工作方式。理解这一点的实战者,将会以另一个层级的水平运作。
本文要补上发布公告没有写的部分:三个只有在一百万 Token 规模才能跑得通的实战工作流程,加上三个会悄悄浪费上下文的常见错误。每个范例都可以直接复制粘贴使用。今天就挑一个试试。
一百万 Token 上下文窗口的实际意义
一个 Token 大约是四分之三个英文单词,或一个中文字。一百万 Token 大致相当于七十五万个英文字、或一百五十万个中文字。这个量等于七本完整小说、一份包含所有附录的年报、或者你与一个客户整整十八个月的电邮往来。Anthropic 在 2026 年 2 月的更新说明中确认 Claude Sonnet 4.6 支持这个窗口大小,可通过 API 与 Claude 企业版方案使用。
实际的意义是,你不再需要筛选要给 Claude 什么。你可以把与一个问题相关的全部内容一次给它,让模型自己过滤。这是一种不同的工作方式,也是大多数实战者尚未跟上的关键转变。
工作流程一:单次分析完整报告或书籍
长文档分析是一百万 Token 窗口最明显的用途,但大多数人仍然用错方法。他们贴进一份两百页的报告,输入「帮我总结」,然后得到一份失去所有有趣细节的笼统摘要。一百万 Token 浪费在笼统摘要上实在可惜。正确做法是在文件之前,先给 Claude 一个清晰定义的视角。
试试以下提示结构:
角色:你是一位策略分析师,正在为一位考虑做出竞争性动作的香港中小企客户审阅这份年报。
我关心的脉络:客户身处同一行业。他们想了解定价策略的转变、新产品的押注,以及任何利润压力的信号。
你要做的事:读完整份报告。把对应上述三件事的原文直接引用出来。每段引文要附上页码、原句、以及一句竞争意义的解读。
格式:四栏表格:信号类型、页码、引文、解读。
然后:在这行之下贴上完整 PDF 全文。在读完所有内容之前,不要做任何总结。
这个提示之所以有效,是因为你已经告诉 Claude 要找什么、要抽取什么、要忽略什么,以及答案应该长成什么样。一百万 Token 窗口本身不是价值。真正的价值在于问题的设计。
工作流程二:一次将整个客户项目脉络载入 Claude
第二个工作流程,是真正改变资深实战者运作方式的那一个。把一个完整的客户文件夹、一个完整的项目历史、一个完整的活动档案,全部载入到同一个对话中。然后在这个已经备齐脉络的环境里,与 Claude 真正对话。
具体做法是,把以下材料搜集起来:原始 brief、所有电邮往来、所有会议笔记、过往交付物、合同、品牌指南。在每个段落之间加上清晰的章节标题后串接成一份文件。先给一个设定指令,再把完整档案贴上去。
试试这个开场提示:
接下来你会收到我过去九个月经营的一个项目的完整脉络。内容包括原始 brief、所有电邮往来、内部笔记、目前的交付物,以及合同。读完所有资料后,不要做总结。只回应「Ready」,再加上一行确认你了解项目类型与目前阶段。我之后会问具体问题,你的答案要引用文件中的实际内容,在相关时提供原文与日期。
然后把完整档案贴在那段话之后。从这一刻起,你问的每一个问题都建立在完整项目历史之上。「帮我拟一封给客户的进度确认电邮」会变成针对这位客户、依照你既定语气、引用最近决议的具体内容。「我们二月就上线日期谈过什么?」会给出一个真实答案,把当时的对话原文重新呈现。这就是取代每次客户沟通前那段整段研究时间的工作流程。
工作流程三:重大策略决定前,通览所有笔记
第三个工作流程比较个人化。大多数知识工作者都累积了数百则会议笔记、半成形的想法、客户访谈逐字稿,以及散落在五个工具里的 Slack 导出档。每当有一个策略决定要做,你通常只能凭记忆判断,因为把所有内容拼凑起来感觉成本太高。
有了一百万 Token 窗口,这个成本崩盘。把过去六个月在 Notion、Obsidian 或任何写作工具的笔记导出。串接成一份文件。配上一个锋利的框架问题,送进 Claude。
试试这个提示:
以下是我过去六个月的笔记、会议摘要,以及客户访谈逐字稿。我正在考虑把服务范围延伸到为中小企提供 AI 工作流程顾问。读完所有内容后,回答三件事。第一,客户最常用自己的话表达的具体痛点是什么。第二,这些笔记中有什么证据支持往 AI 工作流程顾问方向延伸。第三,这些笔记中又有什么证据反对这个方向。在引用笔记时,请附上具体的日期。
输出不是摘要。它是一份你的大脑无法自行产出的综合分析,因为你的大脑无法同时把六个月的细节全部保留在工作记忆中。这才是真正的解锁。
三个会浪费长上下文窗口的常见错误
一百万 Token 窗口不会自动改善输出品质。三个错误会稳定地浪费它。避开这三点,结果会明显跳升。
错误一:输入内容没有结构标记。如果你贴进八十万 Token 的混合内容、完全没有任何标题,Claude 只能自行猜测哪些段落属于同一个单位。在每个段落之间插入清晰的章节分隔线,例如「=== 电邮串 2026 年 3 月 12 日 ===」或「=== 第一季规划会议笔记 ===」。模型会用这些分隔线作为后续引用的锚点。
错误二:问题出现在文件之前。Anthropic 的官方建议是,长输入的表现会更好,当问题或指令放在提示最末端、所有文件之后。把文件放前面,把框架问题放最后。如果你习惯写邮件从上而下,这个顺序会反直觉,但这正是模型在长上下文检索任务中表现最好的安排。
错误三:明明想要分析,却要求「总结」。一份摘要把一百万 Token 重新压缩回五百字,等于丢掉了你把所有内容贴进去的价值。改成请它做抽取、对比、综合,或决策支持。请它引用原文。请它做附引用的表格。请它告诉你跨时间的变化。这些答案之所以存在,正是因为完整脉络都在窗口里。
立即试试:测试你的长上下文窗口的诊断提示
这里有一个低风险的方法让你亲身体验差别。挑一份你熟悉的单一文件,最好是三十到八十页的报告。把它贴进 Claude Sonnet 4.6,跑一次以下提示:
我已在上方提供完整文件。不要做总结。请执行三件事。第一,找出这份文件中三个最仰赖未明说假设的主张。引用每个主张的原句,并说明它建立在什么未明说的假设之上。第二,找出文件中两处互相矛盾、或削弱先前论点的段落。把两段都引用出来。第三,找出一个如果整段删掉、整体论证也不会改变的章节。并说明为什么。
这个提示能完成摘要永远做不到的事。它用整个窗口找出论证的结构性弱点。对你自己写的报告跑一次,你会看到自己的盲点。对竞争对手的白皮书跑一次,你会看到他们的。
结语
一百万 Token 上下文窗口不是一个更大的文件上传器。它是一种与信息建立关系的新方式:你把全部内容一次交给 Claude,然后在完整图像就在眼前的情况下,展开一场真正的对话。学会把这套流程设定好的实战者,将会在三十分钟内产出过去要花三天的工作。一次只贴一份 PDF 的人,不会注意到天花板已经被抬高。
懂 AI,更懂你 UD 相伴,AI 不冷。如果你想把这些工作流程嵌进你自己团队的工具里,正是 UD 过去 28 年一直在做的事。
掌握了这些工作流程,下一步是把它们嵌进你团队真实的工具里,让它们每周都能稳定运行。UD 团队手把手带你完成每一步,从 Claude Projects 设定、文件管道,到品质检查。