Agent as Feature：当 AI 替代后端逻辑会发生什么

一个 webhook 触发。用户把收据上传到你的报销应用。2024 年，这个请求会进入路由器，控制器验证载荷，服务层用正则或模板化解析器抽取字段，然后存储结果。二十行字段映射，四十行边界情况处理，一百行 “如果收据是日文怎么办”。

2026 年，同一个 webhook 可能路由到一个智能体。智能体看收据，理解这是晚餐报销，抽取商家、金额、税费和小费，完成分类，发现金额超过单餐限额，于是标记政策违规，然后写入记录。没有控制器，没有解析器，没有硬编码字段映射。

Gartner 预测，到 2026 年底，多达 40% 的企业应用会包含任务特定 AI 智能体，而 2025 年还不到 5%。这对我来说像是真正的转变，我也打算尝试它。

这篇文章是我在思考”智能体即功能”到底意味着什么、它会在哪里断、为什么我仍然认为它的潜力值得追下去。

传统后端是一棵决策树

你做过的每个后端功能，形状都差不多：

请求 → 路由器 → 控制器 → 服务 → 数据库 → 响应

每个功能是一条代码路径。每个边界情况是一个 if。新业务需求？树上再长一个分支。后端严格按代码执行，不多不少。

这是它的强项。你可以测试、审计、预判它在周六凌晨三点出问题时到底会怎样。缺点是，改变行为意味着改代码。任何碰过 2,000 行路由函数的人都知道那是什么感觉。

以客户支持工单系统为例。路由逻辑本身，优先级检测、部门分配、升级规则、SLA 计算，可能就是几千行业务逻辑。它花了几个月写出来。规则一变就要维护。每次有人说“能不能顺便检查客户是不是企业级客户，然后换一种路由”，树上又多一个已经很难读的新分支。

我们过去这样写软件，是因为这是唯一选择。计算机不能推理，只能遵循指令。所以我们写复杂决策树，把每个可能决策路径编码进去。

但如果计算机能推理呢？

如果功能本身是智能体

不再把请求路由到一个遍历决策树的控制器，而是路由到一个能理解意图并动态执行的智能体。

把智能体当后端的想法来自 Go Wombat。控制器和路由器被围绕“意图”推理的智能体替代。客户端不再为某个具体动作调用某个具体端点，而是告诉系统自己想要什么结果，然后智能体自己判断怎么做。他们的核心观点是：最难的部分不是构建智能体，而是划清智能体应该决定什么、确定性代码应该处理什么。

Dan Shipper 在 Every.to 写过一句让我记住的话：“应用里的每个功能都是给智能体的提示词，并说明要达成的结果。” 你不再写命令式代码，转而写声明式目标。

代码形状会变：

// 传统写法：从收据里抽取报销字段
const vendor = extractField(receipt, 'vendor', vendorPatterns);
const amount = parseAmount(extractField(receipt, 'amount', amountPatterns));
const category = categorize(vendor, amount, merchantDB);
const violations = checkPolicy(amount, category, userTier);
// ...后续类似

// 智能体驱动：描述目标
const result = await agent.process({
  task: "从这张收据里抽取报销信息",
  input: receipt,
  schema: ExpenseSchema,
  tools: [db.write, policy.check, notification.send]
});

这里我简化了。真实智能体驱动的功能仍然需要护栏、模式验证、错误处理。但代码确实不同。你告诉它想要什么，而不是拼出每一步。

我是在做 OpenClaw 时意识到这一点的。最初我想用代码强制执行流水线，然后在代码里调用 AI，也就是把智能体包在僵硬的控制流程里。但 LLM 输出并不总能被僵硬约束强制住。约束越多，我越像是在跟工具较劲，而不是在用它。所以我反过来想：让智能体主导。给它目标和工具，让它决定路径。给它一点空间自己想清楚。

Webhooks + 智能体模式

实践中它长什么样？基本模式是：

外部系统通过 webhooks 推送事件
事件路由到智能体，而不是控制器函数
智能体接收载荷，推理需要发生什么，然后通过定义好的工具执行

Webhook 事件
    ↓
事件路由器
    ↓
智能体（理解意图）
    ├── 工具：写数据库
    ├── 工具：调用外部 API
    ├── 工具：发送通知
    └── 工具：升级给人处理

智能体决定调用哪些工具，以及调用顺序。它不是在执行预先写好的脚本，而是在对具体情况做推理。

如果你做过事件驱动架构，这个形状很熟悉。差异在消费者。Everworker.ai 说得很直接：“系统在事件发生时推送事件，AI Workers 立即响应。” 同样是推送式模式，但另一端不是确定性处理器，而是一个会推理的智能体。

Motia 这个框架更认真地处理了这件事。智能体和 API 端点是同一种基本构件。后端里的一个“步骤”是函数还是智能体，只是实现细节。

更宏观地看，用 InfoQ 的说法是：“AI 智能体成为执行引擎，而后端退到治理层。” MCP (Model Context Protocol) 正在让这件事更容易标准化，为智能体提供通用工具和数据访问协议。MCP 之前也能用自定义 API 做，但 MCP 对智能体和工具交互的意义，有点像 HTTP 对浏览器和服务器的意义。

LangGraph 处理有状态智能体工作流。CrewAI 做多智能体编排。就我看到的情况，它们已经在从实验走向真实系统。

后端变成治理层

如果智能体处理推理和执行，后端到底还做什么？

它变成治理层。认证、限流、审计日志、模式验证、工具访问控制。后端定义智能体能做什么，也就是哪些工具、哪些权限范围、哪些模式；但不定义它们会做什么。后者是智能体推理。

没有治理的智能体，就是后端架构里的 --dangerously-skip-permissions。这个标志意味着完全自治、零护栏，一开始看起来没什么问题，直到智能体写错数据库或给错用户发通知。

Simon Willison 把这个称为“致命三件套”：不可信输入、特权访问、外部动作同时出现。当这三者在同一个系统里不受控制地同时出现，你就有麻烦了。智能体驱动的功能很容易不小心集齐三者。

这个模式真正让我担心的是：你的智能体有 db.write 作为工具。这就是生产环境完整写权限。一次错误推断，就会写入垃圾数据。API 调用也是同样问题，智能体带着你的凭证调外部服务，出事时你要负责解释。

我会把智能体当作任何不可信服务。不要给它原始数据库连接。前面放一个包装层，按模式验证写入、强制行级权限、记录发生了什么。智能体想做什么，实际写了什么，谁触发了它。默认连接只读。写入通过单独服务，只接受结构化输入。高风险变更进审批队列。每次数据变更都要有审计轨迹，没有例外；智能体搞砸时，那份日志是你唯一能看清发生什么的东西。

治理层必须回答真实问题：记录什么，什么执行前需要人工批准，智能体错了怎么办。如果没有回滚计划，就没有治理。

边界问题

“智能体即功能”架构里最难的设计问题是：智能体决定什么，确定性代码处理什么？边界画在哪里？

不是所有东西都应该是智能体。认证、计费、数据库迁移需要确定性。你必须能审计它们，并准确预测它们的行为。

对这些关键路径，AI 可以帮忙，但不能成为最终决策者。AI 是工具，可以让你的生活更容易；但对于有现实后果、不能出错的决策，不应该让它做最终决定。最重要的决策，始终应该由人来把关。

CockroachDB 有篇文章说得很好：“构建智能体式应用，意味着有意把非确定性请进系统。”这是真实成本。当你不能预测系统会做什么时，怎么测试？经典单元测试不会告诉你智能体的决策是否正确。现在有评估框架（LangSmith 做轨迹级和步骤级评估），但这是一门和多数后端团队熟悉的测试完全不同的学科。双写这类经典分布式系统问题，也不会因为有智能体就消失。

我大致把它分成三个区域：

区域	例子	原因
智能体	自然语言理解、多步推理、动态路由、非结构化数据里的模式识别	模糊性是功能，不是缺陷
确定性代码	财务计算、访问控制、数据完整性约束、合规规则	必须精确、可审计、可复现
混合	智能体分类报销，确定性代码执行审批策略	智能体给出建议，代码验证并执行

Gartner 预计，到 2027 年底，超过 40% 的智能体式 AI 项目可能会被取消，原因包括成本上升、商业价值不清晰、风险控制不足。我猜很多失败会集中在边界画错的项目上：要么给智能体太多权力，让非确定性变成负债；要么给太少，智能体只是增加延迟却没有任何收益的包装层。

为什么我认为潜力是真的

“旧方法也很好”的论点，在计算机不能推理时很合理。我们构建复杂决策树，是因为那是把决策编码进软件的唯一方式。如果这个前提变了，架构也应该变。如果你拥有一个真正能理解意图并围绕上下文推理的系统，你不会用同样方式建它。

Srinivas Rao 强烈不同意。他认为多智能体框架把对话和协调混淆了，称之为”架构规模化上的愚蠢”。他的替代方案是：代码负责执行，语言模型负责决策，文件负责协调。他说智能体不工作这一点我不同意，但关于协调他有道理。智能体不应该彼此聊天。它们应该通过合适的协议调用工具。

工具链正在接近这个方向。MCP 给智能体提供标准工具交互协议。Motia 把智能体作为一等后端构件。一年前，做一个智能体驱动的功能还像是在拼十几个库并祈祷它们能配合。今天已经有专门为此设计的框架。

还有测试问题。到目前为止，功能用单元测试、Playwright、集成套件测。这不太能映射到智能体驱动的功能。经典单元测试不会告诉你智能体推理是否可靠。我认为答案是创建技能来测试技能。用一个智能体验证另一个智能体的推理。这和跨系列多 AI 审查的洞见一致：不同模型抓不同盲点。架构变了，测试方法也要跟着变。

我打算在真实系统里尝试这件事，而不只是概念验证。我想看看当后端不再是大脑，而是护栏时，到底会发生什么。

这些权衡不容忽视。更高延迟，更高单次请求成本。调试更难，而且生产里还没有像 API 可用率那样被广泛接受的智能体可靠性衡量标准。团队现在会跟踪成功率、运行在线评估、做人工审查，但仍然早。我不认为这些是走不通的路；它们是工程问题。难点在于如何在规模化之后把它做好。

我在观察什么

我最常看的一个信号是 MCP 采用。如果 MCP 成为智能体和工具交互的标准协议，像 HTTP 之于 Web，这整个架构会简单很多。

推理成本也很重要。智能体驱动的功能现在每次请求更贵，但差距在快速缩小。

然后是可靠性问题，这个还没有真正答案。直到我们能像说“这个 API 有 99.9% 可用率”那样说“这个智能体驱动的功能有 99.5% 正确性”，采用都会保持谨慎。Gartner 预测到 2027 年 40%+ 智能体式项目会取消？如果这些失败集中在某些特定模式上，那对其他人就是有用数据。

后端不会消失。它从执行逻辑，转向治理智能体可以做什么。

我不知道它是否适用于所有东西。大概率不适用。但对于那些你花了几个月写分支逻辑，却永远没能真正表达你想要什么的功能？那些是有意思的地方。那是我下注的地方。

我正在做这件事。哪里踩了坑，我会分享。

Agent as Feature：当 AI 替代后端逻辑会发生什么

传统后端是一棵决策树

如果功能本身是智能体

Webhooks + 智能体模式

后端变成治理层

边界问题

为什么我认为潜力是真的

我在观察什么

许可

我可能看错了 Agentool

别再从零开始教每一个 AI

我有点替 AI 委屈

订阅更新

评论

传统后端是一棵决策树

如果功能本身是智能体

Webhooks + 智能体模式

后端变成治理层

边界问题

为什么我认为潜力是真的

我在观察什么

许可

相关文章

我可能看错了 Agentool

别再从零开始教每一个 AI

我有点替 AI 委屈

订阅更新

评论