什麼是少樣本提示(Few-Shot Prompting)?
少樣本提示是在你提出真正請求之前,先在提示語中放入 2 至 5 個工作範例的做法。每個範例都包含一組輸入,以及你希望得到的具體輸出。模型會從這些範例推斷出你的格式、語氣與判斷邏輯,再用相同模式處理你的真實請求。
零樣本提示只給模型指令。少樣本提示給模型指令再加上一份小型示範資料集,差異就藏在那份示範裡。
由 Vellum 整理的《提示工程指南》指出,加上 2 至 5 個範例通常能使結構化輸出的任務表現比零樣本提升 15 至 35 個百分點,且大多數任務在五個範例之後曲線就會趨平。
為什麼它的效果勝過寫更好的指令?
指令告訴模型你要什麼。範例則讓模型看到成功的樣貌。兩者衝突時,範例幾乎總是勝出。一條模糊但配上三個好範例的指令,在任何稍有結構複雜度的任務上,都會勝過一條 400 字、沒有範例的指令。
原因是模型會把範例同時當成三件事的主要訊號:輸出格式、細節層級,以及隱含的邊界判斷。一條 400 字的指令試圖描述這三項,反而會產生模糊地帶。三個範例則同時解決這三項,沒有任何模糊空間。
Microsoft 自家的 AI 文件說得很直接。當任務有清晰的輸入輸出形態、但難以用純文字描述時,少樣本提示就會發揮作用。分類、抽取、格式轉換、特定格式的摘要,所有這類任務從範例得到的提升都高於從調整指令得到的提升。
什麼時候該用少樣本?什麼時候該用零樣本?
決策的核心是:你能否比寫一條清楚的指令更快地寫出一個清楚的範例。多數情況下,範例更快。
使用少樣本的時機:
--- 輸出有需要保留的特定結構(JSON 鍵、Markdown 表格、指定數量的條列)。
--- 任務涉及邊界難以文字化、但容易示範的判斷(情感分類、嚴重程度評級、語氣比對)。
--- 你需要在多次輸出之間保持一致的語感。
--- 任務具重複性,相同提示語將會以不同輸入執行很多次。
使用零樣本的時機:
--- 任務開放式,你刻意希望模型帶來自己的結構。
--- 輸出偏向對話而非結構化資料。
--- 你只有單一輸入要處理,編輯結果比準備範例更快。
一個常見錯誤是把該用零樣本的任務硬套上少樣本。當你要模型發散思考或創造變化時,三個範例反而會讓模型模仿範例,而非生出真正新的內容。
如何挑選有效的範例?
三項規則能把有效的範例與會讓模型困惑的範例分開來。
規則一:覆蓋邊界案例,而非平均案例。若任務帶有模糊邊界,範例就應該坐落在那些邊界上。三個全部看起來簡單的範例,無法教會模型如何處理難的情況,真正的教學價值藏在臨界判斷裡。
規則二:範例長度要接近真實任務。如果真實輸入會是 200 字,範例就應該落在 150 至 250 字之間。三個兩句話的範例後面接一段五段落的真實輸入,會讓模型截短真實答案以配合範例長度。
規則三:每一個範例都必須嚴格遵守格式。若輸出應該是 JSON,每個範例都必須是有效 JSON;若應以「Summary:」開頭,每個範例也必須以「Summary:」開頭。模型把範例當成規則本身,範例之間的任何不一致都會造成輸出漂移。
Anthropic 為 Claude 發佈的提示工程指南再加上第四條實用規則。當範例彼此並非嚴格序列關係時,應明確標示。把每個範例放進獨立區塊,並冠上 Example 1、Example 2、Example 3 之類的標題。這能避免模型在輸入相似時把多個範例混為一談。
一條完整的少樣本提示語長什麼樣?
最快讓概念變具體的方法,就是看一條完整的可用提示語。下面這條對應一個常見的實務任務:把客戶支援電郵分類到意圖類別,並附上信心評分。它用三個範例分別覆蓋了簡單、棘手、模糊三種情境。
試試這條提示語:
你是客戶支援電郵分類器。針對每封電郵,輸出意圖類別與一個從 1 至 5 的信心分數。僅可使用以下類別:BILLING、TECHNICAL、ACCOUNT、FEEDBACK、OTHER。
Example 1
Email:「你好,我十月的發票被扣款兩次,訂單號 884321,可以退還重複扣款嗎?」
Output:BILLING, 5
Example 2
Email:「密碼重設電郵收不到,垃圾郵件夾也查過,試了三次。」
Output:ACCOUNT, 4
Example 3
Email:「想說新介面很好看,不過資料超過 1000 列時匯出功能偶爾會崩潰。」
Output:FEEDBACK, 3
現在請分類這封電郵:
Email:[在這裡貼上電郵]
Output:
讓這條提示語生效的有三件事。指令短。範例分別涵蓋了一個簡單意圖、一個中等、一個訊號混合且信心應降的情況。輸出格式在模型看到真實輸入前,已經被 Example 1 完整示範。
加入範例實際會多花多少成本?
少樣本提示語每次呼叫的成本確實會增加。問題只是這個額外成本是否值得換來準確度的提升。
一條包含三個 50 字範例的提示語,每次呼叫大約多 200 個 token。在 GPT-5.5 每百萬輸入 token 美金 5 元的價格下,每次呼叫多出大約美金 0.001。在 Claude Sonnet 4.6 每百萬輸入 token 美金 3 元的價格下,多出約美金 0.0006。差異真實,但數字很小。
結構化任務的準確度提升通常為 15 至 35 個百分點。Mem0 於 2026 年發佈的提示語基準報告測得:客戶支援分類任務從零樣本切換到四樣本後,格式錯誤下降 22%、分類錯誤下降 28%。
對於一次性提示語,這個成本分析不重要。但若這條提示語會在某個工作流程裡跑一萬次,輸出不一致的代價將遠高於額外 token 的成本。這正是生產級 AI 工作流程在結構化任務上幾乎都採用少樣本的原因。
今天就能升級你提示技巧的一個習慣是什麼?
建立一份個人範例庫。每次你寫出一條能產生滿意輸出的提示語,就把那組「輸入—輸出」存進一份筆記檔,並按任務類型分類。下次遇到類似任務時,從庫裡拉兩三組貼進提示語當範例,你就能跳過多數人每次都要重新嘗試的試錯回合。
這一個習慣,把中階 AI 使用者和那些每次第一次嘗試就能得到生產級輸出的人分了開來。範例本身才是真正的工作,指令只是包裝。
少樣本提示是提示技巧工具箱裡槓桿最高的技術之一。它幾乎不需要額外成本、不需要新工具、適用每個主流模型,並且穩定地改善真正重要的那類輸出,也就是結構化、會成為更大工作流程一部分的輸出。下次你的輸出感覺不穩定時,先問自己一個問題。我是否把成功的樣貌示範給模型看過?若沒有,那就是該動手的地方。
懂AI的冷,更懂你的難 — UD 同行28年,讓科技成為有溫度的陪伴。
想知道你的 AI 技巧實際處於哪一級嗎?
少樣本提示只是其中一項技術。其他二十項中階 AI 使用者常忽略的技巧,你是否也在運用?UD 的免費 AI IQ 測試,會把你的實際提示技巧和香港 AI 高階使用者所掌握的技術做比對。我們手把手帶你完成每一步,從測驗分數,到那些能讓你晉升下一級的具體習慣。