大部分人並不知道 AI 一直都有「品質旋鈕」
大部分人以為每一個 AI 工具的思考力度都是固定的,像一輛單速單車。在 2026 年 5 月 28 日之前,這個假設大致正確。但就在當日,Anthropic 推出 Claude Opus 4.8,加入一項全新功能:力度調節 (Effort Control)。這是一個四檔滑桿,由使用者決定模型在回答前思考得有多深入。它是業界第一個對大眾開放的 AI 品質旋鈕。
對大多數老闆來說最令人意外的事實是:最低檔與最高檔的差距,不是 10% 或 20%。在複雜推理任務上,根據 Anthropic 公布的基準,差距超過 70%。同一個模型、同一個 prompt、五秒等待對比 45 秒等待,產生的是本質上不同的答案。
本文會逐步拆解力度調節是什麼、四檔分別有什麼作用、何時應該用哪一檔,以及香港老闆應如何決定每個任務配哪一檔。
力度調節是什麼?
力度調節是 Claude Opus 4.8 推出的四檔設定,讓使用者選擇模型在輸出答案前,要付出多少運算思考。四檔分別是:Low (低)、High (預設高)、Extra (特高)、Max (最高)。檔位愈高,Claude 投入愈多時間、生成愈多內部推理步驟、並在回答前更徹底地檢查自己的工作。
根據 Anthropic 於 2026 年 5 月 28 日發佈的文件,力度調節位於 Claude.ai 模型選擇器旁邊。它是一個可見滑桿,不是隱藏參數。每位使用者可以按對話切換檔位,而每一個回答都會顯示所選檔位。
此功能僅適用於 Claude Opus 4.8。早期模型,包括 Opus 4.6 和 4.7,並未開放此控制。Claude.ai、Claude API 和 Claude Code 三個介面都看到同樣四檔,但底層的算力預算與收費按介面而異。
力度調節實際上如何運作?
力度調節調整的是 Claude 內部的推理預算。在 Low 檔,Claude 產生較少隱藏推理 token,並回傳第一個合理答案。在 Max 檔,Claude 可以開啟多條平行推理路徑,逐一對照 prompt 驗證,只有當自我檢查通過才提交答案。
用一個實用的比喻:想像你問一位資深員工一條問題。在 Low,員工說出腦中第一個冒出的答案。在 High,員工思考 10 秒並檢查自己的假設。在 Extra,員工先草擬答案,自己檢視一次,修訂一次。在 Max,員工草擬、檢視、修訂、自問「有什麼可能會錯」,然後才回答你。
Anthropic 公布的 Opus 4.8 基準顯示,這不是市場語言。在 SWE-Bench Verified 編程基準上,Max 檔在解題率上比 Low 檔高超過 70%。在長篇分析任務上,差距較小,但仍然顯著。
每一檔的作用與適用時機
四檔對應不同任務類型。揀對檔位不是永遠揀最高,而是讓力度配合任務。
Low (低):用在快速查詢、簡單摘要、單段草稿、以及任何速度比深度更重要的任務。典型回應時間少於五秒。適合:改寫一句句子、摘要一封短電郵、生成一段即時 caption。
High (預設高):Anthropic 建議大部分商業工作的預設檔。回應時間 8 至 15 秒。適合:起草客戶回覆、準備一頁簡報、撰寫產品描述、配合一兩個資料來源的常規研究。
Extra (特高):當輸出品質真的重要時使用。回應時間約 25 至 45 秒。適合:起草董事會文件、分析合約、建立多步驟計劃、比較多個選項的取捨。
Max (最高):保留給最高重要性的工作。回應時間可超過一分鐘。適合:撰寫具法律敏感性的政策、調試複雜程式錯誤、推理一份多頁策略文件、準備審計回覆。
動態工作流是什麼?力度調節的配套功能
動態工作流 (Dynamic Workflows) 是與 Opus 4.8 一同推出的配套功能,讓 Claude Code 透過在一次會話中生成大量平行子代理,處理非常龐大的問題。根據 Anthropic 公布,模型可以規劃工作、同時運行數百個子代理、逐一驗證結果、然後才回報。
對香港企業來說,實際用途是處理以前要工程師才能做的自動化。使用者可以叫 Claude Code 審核 200 封客服電郵中的合規問題、為每一封生成個別回覆草稿、並標示需要人手介入的案例。代理同時處理 200 封,然後綜合結果。
動態工作流目前僅限 Claude Code,不適用於消費者版本 Claude.ai。它在較高力度檔位運行更久,這也是 Anthropic 把力度調節與動態工作流綁在同一公告的原因。
它要多少錢?為何 Fast Mode 變便宜?
Claude Opus 4.8 的 API 收費未有變動,仍然是 每 100 萬輸入 token 收 US$5、每 100 萬輸出 token 收 US$25。價格變動發生在 Fast Mode,即可以將模型運行速度提升至 2.5 倍的模式。
Opus 4.8 的 Fast Mode 現在比上一代便宜三倍,每 100 萬輸入 token 收 US$10、每 100 萬輸出 token 收 US$50。對照來看,這是一個有意義的降幅。在過往的 Opus 世代,Fast Mode 為了同樣的速度提升,需要支付明顯更高的溢價。
在 Claude.ai 內,力度調節不會直接改變訂閱費。較高檔位在背後消耗更多算力,Anthropic 在現有 Pro 和 Team 計劃額度內吸收這部分成本。重度使用 Max 檔的用戶可能更快碰到速率上限,但每次查詢的賬單不會改變。
Opus 4.8 有多誠實?大多數人忽略了這個基準
Anthropic 發佈公告中最被低估的數字埋在內文:Opus 4.8 未能向使用者警示重要事件的比例只有 3.7%,在「不加批判地回報有缺陷結果」這項上得 0 分(Claude 史上首次),對比 Opus 4.7 的過度自信則減少超過十倍。
用淺白語言講:如果 Claude 做了高風險動作或得出有缺陷的推理,現在它更可靠地會告訴使用者。早期世代有時候會用很有信心的語氣交出錯誤答案。Anthropic 的測量顯示,Opus 4.8 讓程式碼層面的缺陷在無人提醒下溜過的機率,比上一代少約四倍。
對於要把 AI 部署在面客或決策支援工作流的企業來說,這個誠實度提升比任何速度提升都重要。它減輕了監督負擔。
對力度調節的常見誤解
關於力度調節的三個誤解已經很常見。任何一個你信錯了,都會浪費效率。
誤解一:力度愈高愈好。並非如此。在簡單任務上,Max 與 High 給出相同的答案,只是 Max 更慢。代價是你的時間,不是賬單。揀適合任務的檔位。
誤解二:力度調節可以取代好的 Prompt。並非如此。寫得不好的 prompt 即使用 Max 也只會輸出平庸答案。力度調節提升答案的天花板,但 prompt 品質仍然決定地板。
誤解三:Low 代表低品質。並非如此。Low 代表較少內部推理。對於常規任務,答案完全足夠,速度顯著更快。Anthropic 把 Low 定位為高量、簡單工作的有效預設,不是退化模式。
香港企業應如何運用力度調節?
給中小企的實用手冊:把力度檔位對應到團隊現有的任務類型。
對於客服與前線工作,預設 Low 或 High。速度比深度重要,大部分回覆都依循範本。每小時數十條回覆是合理節奏。
對於市場營銷與內容寫作,預設 High,主打作品(例如首頁文案或年報段落)切換到 Extra。
對於數據分析與報告,預設 Extra。分析會受益於 Claude 更長的推理,特別是 prompt 要求多重比較或多個情境時。
對於策略性、法律或財務文件,用 Max。當錯誤代價高,較慢的回應是值得的。
大原則:用最低檔位,只要它給出的答案你不需要修改。再高就是浪費時間。
力度調節常見問題
免費版 Claude 有力度調節嗎?
沒有。截至 2026 年 6 月,力度調節僅開放給 Claude Pro、Team、Enterprise 和 Claude API 使用者。免費版只見到不同模型的預設 High 檔。
力度調節支援廣東話或繁體中文嗎?
支援。設定本身與語言無關。底層推理品質的差異在英文、繁體中文、簡體中文和廣東話的 prompt 上一致成立。
力度調節與舊版 Claude 的 Extended Thinking 有什麼分別?
Opus 4.5 和 4.6 的 Extended Thinking 是一個開關。Opus 4.8 的力度調節是四檔滑桿,分級更乾淨、成本品質校準更好。
力度愈高一定會得到愈好的答案嗎?
力度愈高的答案推理更徹底。但對於不會受益於更多推理的任務,High、Extra、Max 的輸出可能難以分辨。
給香港老闆的結論
力度調節是主流 AI 廠商首次把品質旋鈕交到使用者手中,而不是藏在產品分級背後。四檔滑桿只是一個小小的介面改變,但它令成本與品質的取捨,第一次變成清晰可控的選項。
對於已經在用 Claude 的香港企業,立即行動是重新訓練團隊,告訴他們什麼時候用哪一檔。錯誤的預設會在 Max 浪費時間,或在 Low 犧牲品質。對於仍在評估 AI 廠商的企業,配備力度調節的 Opus 4.8 是迄今為止最乾淨的例子:一個 AI 工具尊重使用者對「何時需要深度、何時速度為王」的判斷。
懂AI的冷,更懂你的難。UD 同行28年,讓科技成為有溫度的陪伴。
準備為團隊揀選合適的 AI 工具?
Claude、ChatGPT、Gemini、Microsoft Copilot,每個廠商都推出略有不同的控制介面。為你的業務揀選合適的組合,需要的不只是功能對比。UD 過去 28 年協助香港中小企用對的方式部署 AI 工具。我們手把手教你完成每一步,由比較廠商到訓練團隊。