为什么大多数企业AI供应商的决策,在签约前就已注定失败
有一份六维度的记分卡,能区分哪些AI供应商选择能在投产后存活下来,哪些则会在九个月内悄然成为闲置软件。本文将带你走完这个框架,并列出签约前必须提出的问题。
根据Gartner 2026年1月的企业AI采购调查,73%的企业AI采购决策,仍主要建立在供应商的展示效果、品牌印象与功能清单之上。同一份调查指出,在这类部署当中,有42%在18个月内未能交付承诺的价值。
这并非供应商的问题,而是采购流程的问题。大多数的RFP比较的是供应商「说了什么」,而不是真正应该决定结果的「证据」。
什么是AI供应商评估框架?
AI供应商评估框架,是一份在签约前使用的结构化记分卡,从六个可量化的维度为候选供应商评分:安全与数据治理、整合深度、运营模式适配度、商业透明度、实际表现证据,以及总拥有成本。最终产出的是一份你的财务总监与董事会都能接受的客观比较结果。
这个框架,能把以展示为主的RFP(最会做漂亮画面的团队胜出),转换为以证据为主的记分卡(控制最深、数据最具公信力的团队胜出)。
这在2026年特别重要。根据Deloitte的《2026企业AI现状报告》,合规与整合的失败,已超越模型品质,成为企业AI项目被勾销的主要原因。
维度一:安全与数据治理该如何评分?
就五个关键问题逐一为每家供应商评分:客户数据实际储存在哪里?传输中与静态储存时采用哪种加密?供应商内部谁可以存取你的数据,并在哪些审计控制下进行?你的数据是否会被用于训练共用模型?数据外泄通报的服务水平协议(SLA)为何?
对香港企业而言,这一维度是不可妥协的红线。个人资料私隐专员公署(PCPD)已于2025年更新《人工智能:个人资料保障模范框架》,要求采购AI系统的机构,必须在部署前核实数据所在地、加密、角色为本的存取控制与审计日志。
如果供应商无法就以上五项问题提供书面证据,便不具备进入企业环境的资格。请把这一维度视为「闸门」,而非「分数」。
维度二:整合深度:AI如何接驳你现有的系统?
整合的评分,要从三个具体的测试入手。供应商是否为你企业实际使用的系统,例如Salesforce、SAP、Oracle、Workday或你的ERP,提供有完整文档的API与Webhook?供应商是否支援Model Context Protocol(MCP)作为工具调用的标准?在你预期的负载之下,第95百分位数的延迟是多少?
MCP支援已是2026年的基本门槛。根据CIO杂志2026年3月的分析,所有主要AI平台都已支援MCP作为客户端。没有MCP兼容服务器或路线图的供应商,落后的是以「月」计算,而不是「星期」。
第三项测试,p95延迟,是买方最常忽略的一项。销售展示中的4秒回应,在实际并发负载下会变成12秒延迟。请向类似规模的客户索取真实基准,而非供应商内部精心调整过的数字。
维度三:运营模式:供应商会不会与你一起把系统跑起来?
就供应商在「卖完之后是否还在」这件事评分。具体要问清楚:你每天接触的技术联络人是谁?严重程度1的事故响应SLA为何?对你这个规模的机构,典型上线时程是多久?客户成功团队多久进行一次正式的业务回顾?
Forrester 2025年针对失败企业AI部署的研究发现,61%的个案将「售后支援不足、升级路径不清晰」列为主要成因之一。
对香港的中型市场企业,请额外问一个具体问题:供应商在香港本地是否有支援团队?还是每一次升级都要绕回美国或欧洲时区?生产阻断型问题上12小时的延误,并不只是理论,而可能就是一个寻常的星期二早上。
维度四:商业透明度:你能否准确估算真实成本?
商业条款的评分,只需要看三条问题。每席位、每查询或每token的公开定价是多少?是否存在隐性成本,例如超量收费、高阶支援等级、整合服务费?合约退出条款如何?你的数据与设定有多少可以携出?
隐性成本的陷阱,是2026年最常见的合约意外。根据IDC于2026年1月发表的企业AI支出调查,38%的资讯长表示,第一年实际的AI供应商成本,比合约预算超支25%以上,主要原因是token超量与高阶功能解锁。
供应商锁定是第二个陷阱。如果你的数据、微调后的模型与设定无法跟你一起搬走,那这份合约就不再是夥伴关系,而是人质关系。
维度五:表现证据:供应商实际交付过什么?
请以证据评分,而非客户见证。要求三项具体文件:至少两家在你所属行业、所在地区的参考客户,并附上技术主管(而非市场部)的联络方式;范围相近的部署在「之前、之后」的关键绩效指标数据;以及一个让你的团队用你自己的真实数据测试至少两星期的沙盒环境。
金融管理局的GenA.I.沙盒,是一个有用的本地验证指标。曾参与该计划的供应商,在监管机构观察下产出过具备文件记录的表现与风险证据,这个门槛比一般市场个案研究高得多。
如果供应商在你所处的行业找不到参考客户,那等于你正在付费成为他们的「第一个示范客户」。请相应地把这项风险列入定价。
维度六:总拥有成本:三年内这个方案到底要花多少?
总拥有成本(TCO)的评分,必须以三年为时间轴,而不是看第一年的合约金额。请纳入授权与使用量成本、内部变革管理与培训成本、整合工程的工时、持续性的治理开销,以及若供应商表现未达预期、第三年更换供应商的转移成本。
根据麦肯锡《从承诺到影响》报告,以三年为基础计算TCO的企业,实现其预估投资回报率的机率,是只用第一年成本评分的企业的2.4倍。
简化的算法是:授权费用通常只占三年TCO的40%至60%。其余是内部成本。如果你的供应商选择忽略了这一半,你只是在为不到一半的账单评分。
如何把这个框架应用到RFP中?
整个框架可转换成一份30分的记分卡,每个维度5分。把记分卡与RFP一同发给每个供应商,要求每项分数都附上书面证据,并依你机构的优先次序为各维度加权。
例如,一家受个人资料条例与金管局监管的香港金融服务公司,可把安全与数据治理加权至30%、整合20%、表现证据20%、TCO 15%、运营模式10%、商业透明度5%。
而对监管压力较低、但整合复杂度较高的物流或零售业者而言,可把整合加权至30%、运营模式25%、安全20%。请依你企业的实际情况调整权重,但每个维度都要评分。某一个维度满分,不能抵销另一个维度的零分。
让AI供应商选择失败的三个常见错误
第一个错误,是让技术团队独自评分。执行AI的团队,与承担采购、法律与合规后果的团队并不相同。由财务、法律、IT与业务负责人组成的跨部门评审小组,能避免第二年勾销时才浮现的失衡决策。
第二个错误,是把记分卡压缩成单一加权平均分。一家平均70%的供应商,仍可能在安全维度拿到零分。请逐项阅读每个维度,而不只是看总分。
第三个错误,是把记分卡视为一次性的采购文件。最强的企业,会在六个月、十二个月以及合约续约时,再次为供应商评分。一家签约前85分、六个月后跌至55分的供应商,正在发出合约本身无法修补的讯号。
结语:从「看展示」转向「看证据」
这个框架要求你做出的转变很小,但很关键:停止以供应商「展示了什么」评分,改为以他们「能证明什么」评分。工作会更繁重,讨论会更冗长,合约签署可能要多花两个星期。
但这个取舍是值得的。能够在预算与计划内顺利把AI推上生产的企业,不是挑选了最炫展示的那家,而是挑选了在六个维度上都拿得出最具说服力证据的那家。
懂AI的冷,更懂你的难 — UD 同行28年,让科技成为有温度的陪伴。
下一步:在评估供应商之前,先评估你自己的AI准备度
在评估供应商之前,先评估你自己的机构。大多数失败的AI采购,并非供应商选错,而是买方根本未准备好。UD的AI准备度体检,用15分钟为你的数据、流程、治理与团队准备度评分,并由我们手把手带你完成每一步,把结果转换为一份可以呈交董事会的采购计划。28年香港企业服务经验,每一项建议背后都有实证。