AI 輸出不穩定的原因,多數時候只是缺了一個結構步驟
如果你的提示有時表現驚艷、有時輸出平平甚至離題,這通常不是你寫得不好,只是你用寫電郵的方式寫提示:一整段指令塞進一個段落,讓模型自己猜哪句是指令、哪句是背景、哪句是範例。
解決方法是結構性的,不是創意性的。這個技巧叫做 XML 標籤提示(XML Tag Prompting)。2026 年針對各大語言模型的測試顯示,使用 XML 結構的提示比一般純文字提示,能產生穩定性高出 20 至 40% 的輸出。這個技巧已被 Anthropic 官方提示工程文件採納,並在 Claude、ChatGPT、Gemini 上都有效。
多數中階 AI 使用者聽過 XML 標籤,但從未真正使用。本文示範具體結構、最佳使用場景,以及一份可以在 20 分鐘內試用的範本。
什麼是 XML 標籤提示?
XML 標籤提示是一種寫法,將提示的不同部分用具名標籤包起來,例如 <context>、<task>、<instructions>、<output_format>。每個標籤明確告訴模型那段文字的角色,消除自由格式提示中導致輸出不一致的歧義。
這些標籤並非真正的 XML,模型不會把它當作程式碼解析。它們的作用是視覺與語意上的分隔記號,幫助模型把不同職能的內容分離開來。純文字提示把指令、範例和資料混在同一段文字內,而標籤化提示則讓結構顯而易見。
Anthropic 官方提示工程指南指出,XML 標籤是 Claude 模型最理想的結構方式,因為 Claude 在訓練時接觸過大量 XML 結構資料。ChatGPT 與 Gemini 對 XML 標籤的處理亦十分穩定,但對這兩款模型而言,Markdown 標題也有相近效果。
為什麼 XML 標籤能讓 AI 輸出更穩定?
語言模型的運作方式,是根據上下文預測下一個應該出現的字。如果你的提示是一整段文字,模型需要自行推論每句話的用途。標籤把這層推論移除:模型清楚知道 <context> 內的文字是背景、<task> 是你要完成的事、<example> 是好輸出長什麼樣。
這比表面看起來更關鍵。日常 AI 提示的失敗模式,大多源於同一個根本原因:模型把背景當成了指令,或把範例當成了任務描述。任何一種錯誤都會造成看起來自信、卻偏離原意的輸出。
標籤化提示能帶來三個具體的穩定性提升:語氣在多次執行間保持一致,因為語氣指令被獨立並持續存在;輸出格式維持穩定,因為格式規範毫無歧義;模型亦較少飄到不必要的補充說明,因為任務範圍被明確劃定。
最少需要哪幾個 XML 標籤才有效?
不需要十個標籤,三到五個已足夠應付多數工作。最低限度可用的標籤組合是 <context>、<task>、<output_format>,並視需要加上 <example> 與 <constraints>。請固定使用這幾個標籤,不要每次都發明新名稱,否則會破壞穩定性的根基。
以下是可以應付 80% 中階任務的最小可用結構:
試試這份提示範本:
<context>
--- 模型需要了解的背景資訊(目標受眾、處境、之前的決定)。
</context>
<task>
--- 你具體要完成的事,用一兩句說明。
</task>
<output_format>
--- 你希望收到的精確結構(標題、條列數量、字數範圍、章節)。
</output_format>
<constraints>
--- 應該避免什麼、必須包含什麼、語氣、視角。
</constraints>
把這個骨架貼入任何對話介面,填滿四個區塊後執行。只是這個結構本身,不改其他字句,就會比你原本的提示產生更穩定的輸出。
XML 標籤對比 Markdown 標題與純文字提示,差別在哪?
常見問題是:Markdown 標題(## Context、## Task)跟 XML 標籤效果一樣嗎?誠實的答案是看模型。對 Claude 而言,XML 標籤穩定勝出。對 ChatGPT 與 Gemini 而言,Markdown 標題與 XML 在多數測試中表現幾乎相同。
實際決策流程很短:
--- 如果你會在 Claude、ChatGPT、Gemini 三者之間切換,就統一使用 XML 標籤。同一份範本可以跨模型運作,省下重新整理的時間。
--- 如果你只使用 ChatGPT,Markdown 標題已經足夠,可讀性也較佳。
--- 如果你只使用 Claude,XML 標籤是官方文件建議的最佳做法,值得專一採用。
最不可取的做法,是完全沒有結構分隔的自由文字提示。在所有測試模型中,無結構提示產生最不穩定的輸出,以及最常見的離題回應。
實際的中階工作提示,用 XML 標籤寫起來是什麼樣子?
理論講完,看例子。以下是同一個提示從自由文字改寫成 XML 標籤版本的對比。
自由文字版(常見中階寫法):
「幫我寫一則 LinkedIn 貼文,介紹我們的新產品功能。受眾是香港中型公司的 HR 主管。限 200 字以內。要吸引人但保持專業。要提到節省時間和容易設定。不要有銷售感。結尾要有一個問題。」
XML 標籤版:
<context>
--- 受眾:香港中型公司 HR 主管,工作繁忙,對 AI 工具持保留態度。
--- 產品:一款 3 分鐘篩選履歷的 AI 工具。
</context>
<task>
--- 撰寫一則向上述受眾推廣此 AI 篩選工具的 LinkedIn 貼文。
</task>
<output_format>
--- 150 至 200 字。
--- 第一句必須是基於某個具體 HR 痛點的鉤子。
--- 最多三段。
--- 結尾要有一個開放式問題。
</output_format>
<constraints>
--- 不要有銷售感語氣,不要使用驚嘆號。
--- 必須提到節省時間(具體 3 分鐘)和容易設定。
--- 專業但帶溫度的語氣。
</constraints>
把標籤版執行五次,把自由文字版也執行五次,你會看見標籤版在語氣和格式上的穩定度明顯較高。
什麼情況下不該用 XML 標籤(誠實的限制)?
XML 標籤提示並非萬能升級。對非常簡短或對話式的任務而言,這個結構只會增加負擔。請 ChatGPT 摘要一段文字或翻譯一句話,根本不需要四個標籤。
三種情況不適合使用 XML 標籤:
--- 一次性簡短提問:「法國首都是什麼?」不需要任何標籤。
--- 腦力激盪:當你想讓模型給你意外驚喜時,結構會壓抑創意,請保持開放。
--- 多輪對話:在持續對話中,模型已累積大量上下文,每訊息都套標籤反而會打斷對話流暢度。
這個技巧最值得用於:可重複、結構化的任務,例如內容草擬、資料抽取、分類、程式碼生成,以及任何你計劃在多個輸入間重複使用的提示。
怎樣建立屬於你的 XML 提示範本庫?
真正的生產力效益,來自你停止從零開始寫提示。為你經常重複做的任務建立 5 到 10 份標籤化範本,例如電郵回覆、內容簡報、會議摘要、社交貼文、研究萃取等。
多數重度用戶用一套簡單系統就足夠:
--- 開設一個 Notion 頁面、Google 文件或單純的文字檔,命名為「Prompt Library」。
--- 為每一個重複任務,把你寫得最理想的標籤版本存成範本,並用方括號標記變數位置,例如 [受眾]、[產品名]、[字數]。
--- 需要使用時,複製範本,填入變數,執行。
--- 每次執行後,如果輸出仍有可預測的不足,回頭微調範本。
一個月內,你會停止浪費時間寫提示。同時也會停止收到隨機輸出,因為每次執行的範本都是經過你實際測試打磨過的版本。
初學者最常犯的 XML 標籤錯誤是什麼?
當中階使用者首次採用 XML 標籤時,有四個錯誤一再出現,事先了解可省下大量試錯時間。
--- 每次都發明新標籤名稱。請固定使用核心組合:<context>、<task>、<output_format>、<constraints>、<example>。一致性讓模型穩定識別結構。
--- 把任務塞進背景區塊。<task> 應該只有一兩句。如果膨脹到五句,代表你把背景混進來了。請把多出的內容移到 <context>,讓 <task> 保持聚焦。
--- 輸出格式說得太模糊。「寫得好一點」不是格式。「200 字、三段、結尾以問題收結」才是。緊湊的格式規範,是穩定性的累積點。
--- 忘記關閉標籤。即使忘了關閉,模型多數仍能理解,但封閉標籤產生更乾淨、可預測的行為。請當成寫合規 HTML 一樣處理。
在接下來 20 分鐘試試這個練習
挑一條你過去一週寫過、輸出不太滿意的提示。打開 ChatGPT、Claude 或 Gemini,用以下範本重寫:
<context> [受眾、處境、關鍵背景資訊] </context>
<task> [一兩句說明你要完成什麼] </task>
<output_format> [字數、結構、章節、順序] </output_format>
<constraints> [語氣、要避免的、必須包含的] </constraints>
執行標籤版,與原始版比較輸出。對多數重度用戶而言,第一次測試就能明顯看出差異。再執行三次以確認穩定性提升,這就是結構確實在發揮作用的證據。
2026 年的提示工程:結構勝過聰明
2026 年所有受廣泛採用的進階提示技巧,共同特徵都是結構性的,而非風格性的。思維鏈讓模型結構化它的推理;少樣本提示結構化範例;XML 標籤則結構化整段提示。共通主題很清楚:結構清晰,勝過用字聰明。
如果今年只升級一個提示技巧,就把可重複任務改用 XML 標籤範本。你花 20 分鐘把一條自由文字提示轉成標籤化範本,未來六個月每次執行都會收回這份投資。懂 AI 的冷,更懂你的難,UD 同行 28 年,讓科技成為有溫度的陪伴。
想知道你的提示技巧實際處於什麼水平?
讀完提示技巧文章是一回事,真正知道自己的技術水平是另一回事。UD 的 AI IQ Test 從提示寫作、模型選擇、工作流程設計到工具熟練度,全面評分你的 AI 實戰能力。UD 團隊手把手帶你完成每一步,從測驗本身到下三個級別的個人化升級路徑,全都梳理清楚。