模型单一化风险：当所有 AI 都同意同一个错误答案

前几章讲的是多模型方案的正面理由。这一章讲反面理由：依赖单一 AI 家族很危险，而且危险点不是多数人以为的那个。

没人谈的风险

人们担心单一 AI 依赖时，通常担心宕机。OpenAI 掉线，工作流停摆，开发者到处找替代方案。2025 年 6 月确实发生过持续一天的部分中断，ChatGPT 和 API 服务错误率升高。2024 年 12 月也发生过一次事故，因云提供商电力故障导致，错误率超过 90%。CrowdStrike 2024 年 7 月更新也影响了约四分之一 Fortune 500 公司，按 Parametrix 估计。

这些事故都是真实的。但它们是可见风险。API 返回 500 时，所有人都会注意到。

更糟的是不可见风险：AI 给了错误答案，却没有任何机制能反驳它。

如果整个开发团队都用 GPT 做代码审查，同一类缺陷就会逃过每一次审查。不是随机缺陷，而是训练里内建的系统性缺陷。如果法律部门都用 Claude 做合同分析，同一种问题条款就会反复被漏掉。不是因为模型差，而是每个模型都有盲点；当你只用一个模型时，它的盲点就变成你的盲点。

宕机来得戏剧化，但终归是暂时的。系统性错误答案则悄无声息，也持久得多。

所有人得到同一个错误答案

2008 年金融危机不是由一家银行押错赌注造成的。原因有很多：杠杆、证券化结构、激励错配、监管缺口。但一个被低估的因素是，大多数银行使用相似的风险模型，带着相似假设，对抵押贷款支持证券得出相似结论。错误是高度关联的，因为方法论是共享的。模型彼此同意，反而让共同盲点更难被看见。

这就是 AI 单一化风险的核心。

当一个行业的大量分析流经同一个 AI 家族，错误从结构上就是相关的。无论哪个客户调用 API，模型训练数据相同、架构相同、系统性偏差相同。如果 GPT-4 系统性低估某类安全漏洞，而第 1 章已经引用过研究说明 45% 的 AI 生成代码含有安全缺陷，那么所有用 GPT-4 做安全审查的团队都会有同一个缺口。

第 2 章里的回音室研究显示，同系列智能体会“放大对错误答案的信心，而不是纠正它”。把这个机制放大到一个组织，再放大到一个行业。单一 AI 家族采用得越广，错误就越关联；因为没有反对声音，它们也越难被发现。

这和人类单一化不同。同一所学校训练出来的人，仍然有不同生活经历、不同直觉、处理问题时不同的随机噪声。同一家族模型共享训练数据、架构假设和优化目标。它们的一致并非独立确认，而是高度相关的训练带来的高度相关的输出。

认知锁定

Flexera 2025 State of the Cloud 报告显示，大约 86% 的组织现在跨多个云提供商运行负载。大多数人把这看成基础设施决策：韧性、故障切换、定价谈判力。

更深的教训是依赖式思维。完全押注单一云提供商的组织，面对的不只是宕机时的运营风险。它们还面对认知锁定。架构、工具链、工程文化都会围绕一个提供商的做事方式成形。切换不只是技术迁移，而是思维方式迁移。

AI 依赖是同样动态，但更深。云提供商影响你怎样部署代码。AI 提供商影响你怎样思考代码。它影响哪些问题会被标出，哪些模式会被建议，哪些权衡会被呈现。当一个模型家族负责所有思考，它的假设会变成你的假设。它的盲点会不可见，不是因为盲点小，而是因为工作流里没有任何东西挑战它。

Parallels 2026 调研显示，94% 的 IT 负责人担心 AI 提供商锁定（样本聚焦终端用户计算，范围较窄，但情绪吻合）。运营层面的锁定担忧是合理的。更应该担心的是认知锁定。

诚实的反方观点

多 AI 会引入真实复杂度。我不想假装没有。

合规复杂度。每增加一个 AI 提供商，就多一份数据处理协议、多一次安全审计、多一层监管表面。在受监管行业，三个 AI 提供商就意味着三次供应商风险评估、三份数据处理附录、三套合规监控。

数据治理。把专有数据发送给多个提供商，会增加攻击面，也会让数据驻留要求更复杂。不是每个提供商都支持每个司法辖区。

评估开销。你需要基准测试才知道哪个模型会抓到什么。要构建并维护评估基础设施，区分跨系列分歧什么时候是真修正、什么时候只是噪音，并不简单。

延迟。顺序式多模型流水线更慢。对实时应用，比如实时聊天、欺诈检测、交易系统，多模型路由的延迟成本可能超过准确率收益。

相关失败。如果多个模型家族都训练在大量重叠互联网数据上，它们的盲点可能比想象中更相关。跨系列多样性不保证像表面上那样正交，尤其是闭源模型，我们无法检查训练数据。

这些成本都是真的。但它们是可以工程化处理的问题。另一边的替代方案，是你整个组织的 AI 输出共享相关盲点。这是结构性漏洞，不会因为更多算力或更好的提示词自动消失。

监管者已经看到了这个模式

监管机构开始标记 AI 集中风险，路径和它们当年处理云与金融服务集中风险类似。

Financial Stability Board 2024 报告把 AI 服务提供商集中度认定为金融行业漏洞。FSB 监测全球金融稳定，它的评估会影响各国监管框架。它们担心的不只是宕机，而是当相关 AI 错误在整个行业里制造相关错误决策时，会发生什么。

EU AI Act 于 2024 年 8 月生效，覆盖通用 AI 模型的系统性风险，包括风险评估和事故报告要求。欧盟也在探索 Cloud and AI Development Act（公开咨询期为 2025 年 4 月到 7 月），处理对非欧盟云和 AI 服务提供商的依赖。

监管层面的关注，背后逻辑还是银行投资组合分散那套：不要把赌注集中在一个模型上。风险关乎正确性，而不只是可用性。

为什么这是结构性问题

AI 的集中风险和其他领域不同，因为失败模式不同。

当云提供商宕机时，失败是显性的。所有人都知道。响应团队启动，服务在几小时或几天内恢复。

当一个 AI 模型的盲点在成千上万用户那里生成系统性错误输出时，失败是隐形的。每个用户看到的都是语气肯定、格式漂亮的答案。没有错误信息，没有告警。只是一个看起来正确的错误答案，在每个使用同一模型的团队里复制。

问题不是“AI 掉线时会发生什么”，而是“AI 自信地错了、但没人知道时会发生什么”。

跨系列审查正是发现这类问题的手段。当另一个家族的模型输出与第一个不一致时，这个分歧本身就是信息。有时它只是噪音。有时它会抓到本来会在整个组织里静默传播的系统性错误。你只有先制造这种冲突，才有机会区分两者。

模型单一化风险：当所有 AI 都同意同一个错误答案

没人谈的风险

所有人得到同一个错误答案

认知锁定

诚实的反方观点

监管者已经看到了这个模式

为什么这是结构性问题

许可

我可能看错了 Agentool

别再从零开始教每一个 AI

我有点替 AI 委屈

订阅更新

评论

没人谈的风险

所有人得到同一个错误答案

认知锁定

诚实的反方观点

监管者已经看到了这个模式

为什么这是结构性问题

许可

相关文章

我可能看错了 Agentool

别再从零开始教每一个 AI

我有点替 AI 委屈

订阅更新

评论