Dev Buddy:为 Claude Code 构建多 AI 开发流水线
一篇面向实践的 Dev Buddy 指南:这个开源 Claude Code 插件通过结构化开发流水线编排多个 AI 模型,支持基于任务的约束、并行专家分析,以及自动修复后重新评审的循环。
AI 驱动 · 每小时限 20 次请求
一个 AI 写代码,再评审自己的代码,有一个很明显的问题:自我审查往往会确认假设,而不是挑战假设。研究也支持这一点:单模型工作流生成代码的漏洞率高 2.74x(CodeRabbit 2025),而且 45% 的 AI 生成代码包含安全缺陷(Veracode 2025)。
Dev Buddy 是一个开源 Claude Code 插件,它会让多个 AI 模型通过结构化流水线 工作:需求梳理、规划、实现、代码审查,每个阶段可以由不同模型以独立视角执行。它属于 VCP (Vibe Coding Protocol) 项目,在 VCP 标准执行之上增加多 AI 流水线编排。
下面会走完整流程:安装 Dev Buddy、配置流水线,以及运行功能开发和缺陷修复工作流,并展示实际输出示例。
Dev Buddy 做什么
Dev Buddy 会把 AI 模型编排进基于任务的流水线,并且任何阶段都不能被跳过。依赖是通过数据约束强制执行的,不是靠一句指令。
功能流水线:
需求 → 规划 → 方案审查 → 实现 → 代码审查
↑ ↑ ↑ ↑ ↑
5 个专家 架构师 sonnet/opus 实现者 sonnet/opus
并行探索 设计方案 审查方案 写代码 审查实现当前有两条流水线:
| 流水线 | 命令 | 阶段 |
|---|---|---|
| 功能开发 | /dev-buddy-feature-implement | 需求 → 规划 → 方案审查 → 实现 → 代码审查 |
| 缺陷修复 | /dev-buddy-bug-fix | 根因分析 → 汇总 → 方案验证 → 实现 → 代码审查 |
每个阶段都可以使用不同 AI 模型或提供商。审查失败会自动创建修复和复审任务。循环会持续到所有审查员批准。
前置条件
- Claude Code (CLI)
- Bun 运行时
- 已安装 VCP 插件(Dev Buddy 建立在 VCP 标准之上)
如果要使用基于团队的需求梳理(5 个并行专家),设置这个环境变量:
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1步骤 1: 安装 Dev Buddy
如果还没有添加 VCP marketplace:
/plugin marketplace add Z-M-Huang/vcp安装两个插件:
/plugin install vcp@vcp
/plugin install vcp@dev-buddy如果还没有初始化项目,运行:
/vcp-init步骤 2: 理解默认流水线
Dev Buddy 带有默认流水线配置。首次运行后你可以查看 ~/.vcp/dev-buddy.json,也可以直接从默认配置开始:
{
"feature_pipeline": [
{ "type": "requirements", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "planning", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "implementation", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "sonnet" }
],
"bugfix_pipeline": [
{ "type": "rca", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "rca", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "implementation", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "sonnet" }
]
}每个条目指定:
- type:流水线阶段(
requirements,planning,plan-review,implementation,code-review,rca) - 提供商:使用哪个 AI 提供商
- 模型:该提供商下的哪个模型
条目数量决定流水线任务数量。想要更多轮审查,就加更多 plan-review 或 code-review 条目。想让流水线更短,就删掉一些条目。
步骤 3: 运行第一个功能流水线
启动功能开发流水线:
/dev-buddy-feature-implement 给 /api/login 端点添加速率限制阶段 1: 需求梳理(基于团队)
Dev Buddy 会创建 5 个专家成员,并行探索代码库:
流水线: pipeline-myproject-a1b2c3
已创建包含 5 个专家的团队:
技术分析员 → 探索代码库结构、依赖和既有模式
UX/领域分析员 → 分析用户工作流、最佳实践和可访问性
安全分析员 → 威胁建模、OWASP 分析、VCP 标准检查
性能分析员 → 负载分析、扩展性和资源约束
架构分析员 → 设计模式、SOLID 原则和可维护性
专家正在探索...(大约需要 1-2 分钟)每个专家会写一个分析文件:
| 专家 | 输出 |
|---|---|
| 技术分析员 | .vcp/task/analysis-technical.json |
| UX/领域分析员 | .vcp/task/analysis-ux-domain.json |
| 安全分析员 | .vcp/task/analysis-security.json |
| 性能分析员 | .vcp/task/analysis-performance.json |
| 架构分析员 | .vcp/task/analysis-architecture.json |
主导智能体可能会根据专家发现向你提澄清问题。全部完成后,需求梳理智能体会综合结果,生成 .vcp/task/user-story.json:
{
"id": "story-20260225-143022",
"title": "给登录端点添加速率限制",
"requirements": {
"functional": [
"每个 IP 在 15 分钟窗口内最多尝试 /api/login 5 次",
"超过限制时返回 429 Too Many Requests,并带 Retry-After 响应头",
"认证成功后重置计数器"
],
"non_functional": [
"速率限制状态必须能跨服务重启保留(Redis/数据库)",
"每个请求的额外开销低于 1 毫秒"
]
},
"acceptance_criteria": [
"AC-1: 15 分钟内第 6 次登录尝试返回 429",
"AC-2: Retry-After 响应头包含距离窗口重置的秒数",
"AC-3: 登录成功会重置尝试计数器",
"AC-4: 速率限制状态能跨服务重启保留"
]
}阶段 2: 规划
架构师智能体读取用户故事,并设计实现方案:
任务: 规划 1 (opus)
读取: .vcp/task/user-story.json
正在规划实现方案...规划智能体会生成 .vcp/task/plan-refined.json,里面有技术方案、实现步骤、测试计划和风险评估。
阶段 3: 方案审查
配置里的每个 plan-review 阶段都会创建一个审查任务。默认按顺序执行:每个审查员批准后,下一个才开始。
任务: 方案审查 1 (sonnet) — 审查 plan-refined.json
检查: 可行性、完整性、验收标准覆盖
结论: approved
任务: 方案审查 2 (opus) — 审查 plan-refined.json
检查: 架构合理性、安全影响
结论: needs_changes
问题:
- 没有考虑多实例部署下的分布式速率限制
- Redis 不可用时缺少回退状态
→ 创建修复任务: "修复方案审查 2 v1"
→ 创建复审任务: "方案审查 2 v2"审查员返回 needs_changes 时,Dev Buddy 会自动:
- 用具体问题创建修复任务
- 创建复审任务,并阻塞到修复完成
- 让同一个审查员验证修复,然后流水线才继续
这个循环会持续到批准,或达到最大迭代次数。
阶段 4: 实现
所有方案审查批准后,实现智能体开始写代码:
任务: 实现 1 (sonnet)
读取: .vcp/task/plan-refined.json
正在实现速率限制...
已修改文件:
+ src/middleware/rate-limit.ts (新增)
M src/api/routes.ts (添加中间件)
+ src/__tests__/rate-limit.test.ts (新增)
输出: .vcp/task/impl-result.json阶段 5: 代码审查
代码审查与方案审查一样,默认按顺序执行,并带自动修复循环:
任务: 代码审查 1 (sonnet)
检查: 功能、测试覆盖、错误处理
结论: approved
已验证验收标准: AC-1 ✓, AC-2 ✓, AC-3 ✓, AC-4 ✓
任务: 代码审查 2 (opus)
检查: 安全、性能、架构
结论: approved
任务: 代码审查 3 (sonnet)
检查: 代码质量、可维护性
结论: approved
流水线完成!所有审查均已批准。步骤 4: 运行缺陷修复流水线
缺陷修复流水线的前半段更适合诊断:
/dev-buddy-bug-fix 用户反馈购物车超过 50 件时 /api/checkout 返回 500 错误根因分析
多个 RCA 智能体会独立诊断缺陷:
任务: RCA 1 (sonnet)
正在调查: /api/checkout 处理器、cart processing 逻辑
根因: calculateTotals 里的 Array.map 在处理大购物车折扣组合时
产生 O(n²) 嵌套循环。
证据: Stack trace 显示 cart.service.ts:142 超时
任务: RCA 2 (opus)
正在调查: 数据库 queries、内存 profiling
根因: 确认 O(n²) 复杂度。另外发现每个 item 都会触发一次
单独的 DB 查询来检查库存
(cart.repository.ts:89 存在 N+1 查询问题)。汇总
编排智能体合并独立诊断:
正在汇总 RCA 发现...
RCA 1: O(n²) 折扣计算 — 双方均确认
RCA 2: N+1 库存查询 — opus 发现的额外问题
合并诊断已写入 .vcp/task/user-story.json
修复方案已写入 .vcp/task/plan-refined.json
- 用基于 Map 的查找替换嵌套循环 (O(n))
- 用 WHERE IN 子句批量查询库存之后流水线会继续经过方案验证、实现、代码审查,和功能流水线一样。
步骤 5: 配置 AI 提供商
Dev Buddy 支持三类提供商。
订阅(默认)
通过 Claude Code 内置 Task 工具使用 Claude 订阅。不需要 API 密钥:
{ "type": "code-review", "provider": "anthropic-subscription", "model": "opus" }可用模型:opus、sonnet、haiku。
API 提供商
连接兼容 API 的外部提供商,比如 OpenRouter、MiniMax、自托管模型:
/dev-buddy-manage-presets这会打开交互式预设管理器:
Dev Buddy — AI 预设管理器
当前预设:
1. anthropic-subscription (subscription) — 内置
操作:
[1] 添加新预设
[2] 更新预设
[3] 删除预设
> 1
预设名称: openrouter
类型: api
基础 URL: https://openrouter.ai/api/v1
API 密钥: sk-or-***
模型: anthropic/claude-sonnet-4, anthropic/claude-opus-4
预设 "openrouter" 已保存。然后在流水线配置里使用它:
{ "type": "code-review", "provider": "openrouter", "model": "anthropic/claude-opus-4" }CLI 提供商
集成 OpenAI Codex 这类命令行 AI 工具:
{
"name": "codex",
"type": "cli",
"command": "codex",
"args_template": "--model {model} --prompt {prompt} --output-file {output_file}",
"one_shot_args_template": "--model {model} --prompt {prompt}",
"models": ["o3-mini"]
}这样就可以把 Codex 当作独立的审查者,用不同 AI 家族发现 Claude 可能遗漏的问题。
步骤 6: 自定义流水线
编辑 ~/.vcp/dev-buddy.json,按自己的需要调整流水线。
更少审查(更快迭代)
{
"feature_pipeline": [
{ "type": "requirements", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "planning", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "implementation", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "opus" }
]
}并行审查
加 "parallel": true 可以让审查并发运行:
{
"feature_pipeline": [
{ "type": "requirements", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "planning", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "sonnet", "parallel": true },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "opus", "parallel": true },
{ "type": "implementation", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "sonnet", "parallel": true },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "opus", "parallel": true }
]
}同一组里的并行审查会同时运行。下一阶段会等待该组全部完成。
混合提供商(跨模型审查)
不同阶段使用不同 AI 提供商,获得独立视角:
{
"feature_pipeline": [
{ "type": "requirements", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "planning", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "plan-review", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "plan-review", "provider": "openrouter", "model": "anthropic/claude-opus-4" },
{ "type": "implementation", "provider": "anthropic-subscription", "model": "sonnet" },
{ "type": "code-review", "provider": "anthropic-subscription", "model": "opus" },
{ "type": "code-review", "provider": "codex", "model": "o3-mini" }
]
}步骤 7: 单次任务
对不需要完整流水线的快速任务,可以用 /dev-buddy-once:
/dev-buddy-once use anthropic-subscription model opus 审查这个 PR 的安全问题/dev-buddy-once use openrouter model anthropic/claude-opus-4 重构认证模块这会用指定提供商和模型运行单个任务,没有流水线,没有审查,只是直接执行。
Web 配置门户
如果想用可视化配置,打开 Web 门户:
/dev-buddy-config它会启动一个本地 Web UI,包含三个标签页:
- AI 预设:添加、编辑、删除提供商配置
- 流水线配置:拖拽流水线阶段,设置并行组
- 会话管理:监控运行中的会话和状态
基于任务的执行怎么工作
Dev Buddy 通过 数据约束 强制执行流水线阶段,而不是靠指令。
传统方式:
指令: “先运行 Sonnet 审查,再运行 Opus 审查,然后实现”
问题: AI 可能跳过它认为“重复”的步骤,或者重新排序Dev Buddy 的方式:
T1 = TaskCreate("方案审查 1")
T2 = TaskCreate("方案审查 2") → blockedBy: [T1]
T3 = TaskCreate("实现") → blockedBy: [T2]当编排器调用 TaskList() 时,被阻塞的任务不可见。AI 只能看到并声明下一个未阻塞任务。这是数据查询,不是遵循指令,所以从结构上不可能跳过阶段。
动态修复任务
审查员返回 needs_changes 时:
代码审查 2 (opus): needs_changes
问题: 购物车商品数量缺少输入验证
→ TaskCreate("修复代码审查 2 v1") blockedBy: [review_task]
→ TaskCreate("代码审查 2 v2") blockedBy: [fix_task]
→ TaskUpdate(next_stage, addBlockedBy: [v2]) 重接任务链修复和复审循环会持续到批准,或达到最大迭代限制(默认 10),届时会交由你手动处理。
流水线产物
所有流水线输出都存在 .vcp/task/:
| 文件 | 内容 |
|---|---|
pipeline-tasks.json | 带 ID、配置快照和已解析阶段的任务链 |
analysis-*.json | 专家探索发现(5 个文件) |
user-story.json | 综合后的需求和验收标准 |
plan-refined.json | 技术方案、步骤、测试计划和风险 |
plan-review-N.json | 方案审查结论和反馈 |
impl-result.json | 实现摘要和已变更文件 |
code-review-N.json | 代码审查结论和发现 |
rca-N.json | 根因分析发现(缺陷修复流水线) |
这些产物提供了流水线中每个决策的完整追踪记录。
快速参考
| 命令 | 作用 |
|---|---|
/dev-buddy-feature-implement [描述] | 启动功能开发流水线 |
/dev-buddy-bug-fix [描述] | 启动缺陷修复流水线 |
/dev-buddy-once use <provider> [model <model>] <task> | 用指定提供商运行单个任务 |
/dev-buddy-manage-presets | 添加、更新或删除 AI 提供商预设 |
/dev-buddy-config | 打开 Web 配置门户 |
Dev Buddy 是 VCP 项目 的一部分,也就是提供标准执行的同一个代码仓库。VCP 负责主动规则执行;Dev Buddy 在它之上增加多模型审查。
许可
Article text © 2026 Mark Huang. Licensed under Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) unless otherwise noted. 文章文本可在非商业场景下分享或翻译,但需标注原文 URL。商业使用需事先取得书面许可,并清楚引用原始来源。
代码片段、截图、第三方素材和网站源码可能适用单独条款。
建议署名: Based on "Dev Buddy:为 Claude Code 构建多 AI 开发流水线" by Mark Huang, originally published at https://markhuang.ai/zh/blog/dev-buddy-multi-ai-pipelines-with-claude-code.
相关文章

5 分钟试用 Dense-Mem 托管演示
一篇快速教程:使用托管的 Dense-Mem 测试实例,把 Claude Code 和 Codex 接到同一份临时记忆,并观察共享上下文如何让 AI 更聪明地工作。
阅读文章
Dense-Mem 快速开始:让 Claude Code 和 Codex 使用同一份记忆
一篇面向初学者的教程:启动本地 Dense-Mem 服务器,创建第一把 memory key,并把 Claude Code 和 Codex 接到同一个共享 AI 记忆大脑。
阅读文章
用 Traefik 在 Vultr 上安全部署 Dense-Mem
一篇非技术读者也能跟上的 walkthrough:在 Vultr 云服务器上启动 Dense-Mem,配置 Traefik、HTTPS、私有控制台访问,以及给个人、家庭或工作 AI 工具使用的共享记忆。
阅读文章订阅更新
Go、AI/LLM 和分布式系统的技术文章,绝不滥发。
评论
正在加载评论...